23년 이전 글/모두의연구소 아이펠

    -33일차- 트랜스포머로 대화형 챗봇 만들기

    Chat bot 대화형 챗봇 자연스럽게 대화가 가능한 챗봇 비용: 매우높음 전문성: 매우높음 시간: 매우높음 트리형 챗봇 정해진 트리구조에 따라 답변을 얻는 형태(객관식 문제 풀이와 비슷) 비용: 매우 낮음 전문성: 낮음 시간: 보통 추천형 챗봇 사전에 정의된 답변의 리스트를 알고리즘 결과에 따라 우선순위별로 보여주는 챗봇 비용: 보통 전문성: 보통 시간: 많음 시나리오형 챗봇 정해진 시나리오를 수행하는 챗봇 비용: 보통 전문성: 보통 시간: 보통 결합형 챗봇 비즈니스 목적에 따라 챗봇 유형들의 결합 설계 인공지능 챗봇(Chatbot), 챗봇 역사의 모든 것 엄청난 기대에 대비해 저조한 성적을 거둔 챗봇. 이제, 마케팅 챗봇 개발자는 유저 적용, 사용 사례, 기술적 제한에 대해 걱정할 필요 없습니다. 그..

    -32일차- 활성화함수

    Activation function 모델의 표현력을 향상시켜주는 활성화 함수 f(x)=xw1​+b1​ 이러한 식이 있을 때 x2, x^5x5, sin(x)sin(x) 등으로 표현되는 데이터를 학습할 수가 없음 수학적으로 말하면 선형함수(직선)는 비선형함수(곡선)을 표현할 수 없음여기에서 딥러닝 모델의 parameter(w,b)들은 입력값 x와 선형관계 이므로 비선형 데이터를 표현하기 위해딥러닝 모델도 비선형성을 지니고 있어야 하는데 이떄 쓰이는 것이 활성화 함수 퍼셉트론 이미 잘짜인 머신이라 할 수 있는 동물의 학습 방법의 모방.동물의 신경세포와 유사하게 설계해 나온 것이 최초의 퍼셉트론 History of the Perceptron Threshold Step Sigmoid Piecewise Linear..

    -31일차- 정규화와 정칙화

    Regularization, Normalization 정칙화 오버피팅을 해결하기 위한 방법중의 하나로 L1, L2 Regularization, Dropout, Batch normalization등이 있음 train set의 정답을 맞히지 못하도록 오버피팅을 방해(train loss가 증가)하지만 결과적으로 test loss를 감소시키려는 목적 정규화 데이터의 형태를 좀 더 의미있게 혹은 트레이닝에 적합하게 전처리하는 과정 데이터를 z-score로 바꾸거나 minmax scaler를 사용하여 0과 1사이의 값으로 분포를 조정 금액과 같은 큰범위의 값과 시간값이 들어갈 경우, 초반에는 데이터 거리간의 측정이 범위 분포특성에 대해 왜곡됨 Regularization : 오버피팅 막기 Normalization :..

    -30일차- 시계열 예측 ARIMA

    Auto-regressive Integrated Moving Average 시계열 예측에 사용되는 다양한 모델중 하나, 페이스북의 Prophet, LSTM 딥러닝 등 시계열 데이터(Time-Series) 시간 순서대로 발생한 데이터의 수열이라는 뜻 미래 예측은 사실상 불가능하지만 특정한 전제조건 아래에선 가능 1. 과거의 데이터에 일정한 패턴이 있음 2. 과거의 패턴은 미래에도 동일하게 반복됨 즉 안정적이고, 통계적 특성이 변하지 않는 데이터에 한해 예측 가능 Stationary Series의 기준 평균, 분산, 공분산 평균으로 분포의 중간을 알아내고, 분산으로 분포가 얼마나 퍼져있는지 알아내며 각 확률 변수들이 어떻게 퍼져있는지 나타내는 것은 공분산이다(Covariance) 확률변수 X의 평균(기대값)..