2021년 3월 26일 금요일

,

트위터 텍스트 수집 방법과 파이썬 예제

 

동적 html 사이트의 메시지를 추출하기 위한 프로그래밍 학습을 위해,

대표적인 동적 html을 이용하는 트위터에서 특정 기간, 특정 키워드를 포함한 메시지들을 추출하는 방법에 대해 공부해 보고자 합니다. 

각 사이트는 예고없이, 사이트 구조, url 지정 방식 등을 변경하기에 아래 첨부 코드가 작동하지 않을 수 있습니다 (이 블로그 작성 후 사이트 변경이 있어 다시 코드를 수정합니다.). 트위터 추출 코드는 JLab 한석훈 수석 연구원이 본 교육을 위해 파이썬으로 작성한 코드입니다. (2021년 3월 30일 기준)

트위터 웹크롤링 코드 예시(설명과 코드) 2021년 3월 기준

이후 언제 사이트에 변경이 있을지 모르니, 본 코드는 단지 크롤링을 이해하는 용도로만 참고하세요. 개인별 학습 이외의 목적으로 자료를 수집, 수익을 얻기 위해 활용하는 것은 법적 책임을 물 수 있습니다. 단지 학습용으로 공부하시는 선에서 참고하시기 바랍니다.  


Share this post: