Step 1. KoNLPy 설치
Step 2.
라이브러리
불러들이기 (import)
from
konlpy.tag import Hannanum import requests
from
bs4 import
BeautifulSoup import re
import
pandas as pd
Step 3.
분석할 글
inputdata 에 넣기
예: inputdata <- ‘빅데이타 미케팅 재밌어요? 아니 ‘힘들어요’
예: inputdata <- ‘빅데이타 미케팅 재밌어요? 아니 ‘힘들어요’
Step 4.
Tokenization (형태 분석/분류)
hannanum = Hannanum()
Tokenized_text = hannanum.nouns(inputdata)
Tokenized_text
#
>>> [‘빅데이타', '마케팅’,…. '재밌어요?', ..., '아니’, ‘힘들어요']
Step 4.
빈도 카운팅: 판다스 Series 이용
Outcome
= pd.Series(Tokenized_text)
result
= Outcome.value_counts().head(30)
result
# >>> ‘빅데이타'1
'마케팅’ 1
…