2020년 4월 26일 일요일

빈도 분석 알고리즘 이해 (파이썬 코드)



Step 1. KoNLPy 설치

Step 2. 라이브러리 불러들이기 (import)
from konlpy.tag import Hannanum import requests
from bs4 import
BeautifulSoup import re
import pandas as pd

Step 3. 분석할 글 inputdata 에 넣기
 
: inputdata  <- ‘빅데이타 미케팅 재밌어요? 아니힘들어요

Step 4. Tokenization (형태 분석/분류)
hannanum = Hannanum()
Tokenized_text = hannanum.nouns(inputdata)
Tokenized_text
# >>> [‘빅데이타, '마케팅’,…. '재밌어요?', ..., '아니’, ‘힘들어요']

Step 4. 빈도 카운팅: 판다스 Series 이용
Outcome = pd.Series(Tokenized_text)
result = Outcome.value_counts().head(30)
result
# >>> ‘빅데이타'1
       '마케팅’   1
           …
Share this post: