벡터

    텍스트의 벡터화

    단어 빈도를 이용한 벡터화 Bag of Words(BoW) 자연어 처리나 정보 검색에서 쓰이는 매우 간단한 단어 표현 방법 # BoW 표현 doc1 = 'John likes to watch movies. Mary likes movies too.' BoW1 = {"John":1, "likes":2, "to":1, "watch":1, "movies":2, "Mary":1, "too":1} doc2 = 'Mary also likes to watch football games.' BoW2 = {"Mary":1, "also":1, "likes":1, "to":1, "watch":1, "football":1, "games":1} # 순서는 다르지만 본질적으로 같음 BoW = {"too":1, "Mary":1, "m..