23년 이전 글/모두의연구소 아이펠

    -23일차- Text Summarization

    긴 문서를 읽는 것은 꽤나 큰 인내심이 필요합니다 그래서 사람들이 긴글을 볼때면 누군가 해둔 3줄 요약을 읽고 싶어하곤 합니다 특히 뉴스 같은 경우는 새로운 소식은 많고, 접할 시간은 짧아서 특히 요약이 있으면 읽기가 편합니다 딥러닝을 통해서 이러한 요약을 해낼 수 있습니다 글 요약 글요약은 다시 두개로 나눌 수 있습니다 추출 요약Extractive Summarization 요약하고자 하는 원문에서 주요 문장을 추출해서 요약하는 방법입니다 예를들어 10개의 문장이 있으면 핵심 문장 3개의 문장으로 요약문을 만드는데, 이 문장들이 중요한 문장이겠지만 중요 문장간의 연결이 자연스럽지는 않을 수 있습니다 주로 전통적인 머신러닝 방식에 속하는 TextRank 같은 알고리즘이 이런 방법을 사용합니다 이러한 방식은..

    -22일차- 비지도 학습

    아래의 나온 코드는 깃허브에서 볼 수 있습니다 GitHub - dlfrnaos19/FundamentalOfMachineLearning: Machine Learning study notes Machine Learning study notes. Contribute to dlfrnaos19/FundamentalOfMachineLearning development by creating an account on GitHub. github.com 여태 여러가지 알고리즘들과 딥러닝을 할 땐 정답이 있는 데이터를 통해서 정답이 없는 부분에 대해서 예측을 하는 시도들이 있었습니다. 그러나 세상에 정답이 적히지 않은 데이터들이 여전히 많이 존재하고 있습니다. 이걸 해결해주는 것이 비지도 학습(Unsupervised Lea..

    -21일차- 조금은 큰 고양이와, 맹수와 인셉션 댕댕이

    주중에 2번, Exploration을 하는 날입니다 오늘로 7번째 Exploration이네요 오늘의 노드에서는 CV를 활용해서 아웃포커싱 기능과, 합성 기능을 주로 했습니다 여기에서 CV는 상상에 맡기도록 하겠습니다 먼저 오늘 주로 쓰게 될 라이브러리는 다음과 같습니다 import os import urllib import cv2 import numpy as np from pixellib.semantic import semantic_segmentation from matplotlib import pyplot as plt Pixellib은 처음인데? PointRend를 활용해서 이미지와 비디오에 대해서 인스턴스 분할을 해주는 친구라고 하는데 역시 말로만 보면 이해하기가 어려우니 일단 써보고 나서 생각해봅니..

    -20일차- 회귀(Regression)에 관하여

    통계학에서 전통적으로 많이 사용되던 방법으로 여러 데이터를 기반으로 연속형 변수 간의 관계를 모델링하고 적합도를 측정하는 방법 독립변수와 종속변수 사이에 상호 관련성을 규명하는 것 선형 회귀분석의 기본 가정 선형 회귀분석의 기본 가정 내로 문제가 들어온다면 회귀분석을 먼저 해보는 것이 좋음 1)선형성 선형인지 비선형인지 2)독립성 독립성 : 독립 변수들 간의 통계적 독립성 (비 다중공선성) 3)등분산성 등분산성이란 분산이 같다는 것이고, 분산이 같다는 것은 특정한 패턴 없이 고르게 분포했다는 의미 4)정규성 정규성은 정규분포를 띄는지 여부를 의미 선형 회귀의 모델링 y=βx+ϵ β는 회귀계수, ϵ는 종속변수와 독립변수 사이의 오차 선형회귀 모델링은 주어진 데이터에 선형 식이 잘 맞도록 회귀계수 및 오차를..