Skip to content

빅데이터분석_미니프로젝트 youtube 크롤링

Notifications You must be signed in to change notification settings

Jimin980921/Youtube_crawling

Repository files navigation

Youtube 데이터분석

유행에 민감한 Youtube를 크롤링하여 유행음식 분석 및 시각화
Youtube는 유행이 즉각적으로 드러나고, Youtube의 댓글에서 시청자의 반응이나 감정이 잘 들어나는 특징이 있음


개발 환경

  • BeautifulSoup, selenium, chromeWebDriver, Jupyter Notebook 사용

  • hadoop, spark, python3 사용

  • 데이터 수집방법
    구독자 수가 10만명이상되는 유튜버들의 먹방 정보 수집


개발단계

1단계: 데이터 수집

구독자 20만이상 유튜버 50명의 먹방동영상 정보 크롤링

2단계: 데이터 전처리

50명의 유튜버의 먹방 제목 불용어 제거, 동의어 처리

불용어제거 전 불용어제거 후

3단계: 데이터 분석

정제된 데이터 빈도분석


분석 결과

프로젝트시기에 유행했던 불닭볶음면, 치즈볼, 당면 등의 빈도수가 높은 것으로 도출

About

빅데이터분석_미니프로젝트 youtube 크롤링

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published