2020년 4월 26일 일요일

빈도 분석 알고리즘 이해 (파이썬 코드)

오후 11:43/ 정재학 Jaihak CHUNG/

Step 1. KoNLPy 설치

Step 2. 라이브러리 불러들이기 (import)

from konlpy.tag import Hannanum import requests

from bs4 import

BeautifulSoup import re

import pandas as pd

Step 3. 분석할 글 inputdata 에 넣기
예: inputdata <- ‘빅데이타 미케팅 재밌어요? 아니 ‘힘들어요’

Step 4. Tokenization (형태 분석/분류)

hannanum = Hannanum()

Tokenized_text = hannanum.nouns(inputdata)

Tokenized_text

# >>> [‘빅데이타＇, ＇마케팅’,…. ＇재밌어요?', ..., ＇아니’, ‘힘들어요']

Step 4. 빈도 카운팅: 판다스 Series 이용

Outcome = pd.Series(Tokenized_text)

result = Outcome.value_counts().head(30)

result

# >>> ‘빅데이타＇1

＇마케팅’ 1

…

Share this post:

반갑습니다. 다양한 이야기를 많은 분들과 공유하고자 블로그를 만들었습니다.

2020년 4월 26일 일요일