동적 html 사이트의 메시지를 추출하기 위한 프로그래밍 학습을 위해,
대표적인 동적 html을 이용하는 트위터에서 특정 기간, 특정 키워드를 포함한 메시지들을 추출하는 방법에 대해 공부해 보고자 합니다.
각 사이트는 예고없이, 사이트 구조, url 지정 방식 등을 변경하기에 아래 첨부 코드가 작동하지 않을 수 있습니다 (이 블로그 작성 후 사이트 변경이 있어 다시 코드를 수정합니다.). 트위터 추출 코드는 JLab 한석훈 수석 연구원이 본 교육을 위해 파이썬으로 작성한 코드입니다. (2021년 3월 30일 기준)
트위터 웹크롤링 코드 예시(설명과 코드) 2021년 3월 기준
이후 언제 사이트에 변경이 있을지 모르니, 본 코드는 단지 크롤링을 이해하는 용도로만 참고하세요. 개인별 학습 이외의 목적으로 자료를 수집, 수익을 얻기 위해 활용하는 것은 법적 책임을 물 수 있습니다. 단지 학습용으로 공부하시는 선에서 참고하시기 바랍니다.