버츄얼 유튜버 채널의 영상 조회수를 예측하기 위해
채널 정보, 영상 메타데이터, 썸네일, 음성 특징, 콘텐츠 분류 정보를 활용한 머신러닝 프로젝트입니다.
- 버츄얼 유튜버 영상의 조회수를 예측할 수 있는 모델 구축
- 조회수에 영향을 주는 주요 특징 파악
- 일반 유튜브와 다른 버튜버 도메인 특성 반영
버츄얼 유튜버는 실시간 소통, 캐릭터성, 그룹 활동, 썸네일/비주얼 요소 등
일반 유튜브 채널과는 다른 특성을 가지고 있습니다.
이 프로젝트는 이러한 특성을 반영해
버튜버 도메인에 특화된 조회수 예측 모델을 만드는 것을 목표로 했습니다.
- YouTube API 기반 채널/영상/댓글 정보
- 영상 썸네일 이미지
- 캐릭터 이미지
- 음성 특징 데이터
- 콘텐츠 카테고리 분류 데이터
- 데이터 수집 및 전처리
- 파생변수 생성
- 다중공선성 점검 및 변수 정리
- 머신러닝 회귀 모델 비교
- 특성 중요도 분석
발표자료 기준으로 다음과 같은 모델을 비교했습니다.
- RandomForest
- XGBoost
- LightGBM
- CatBoost
- 버츄얼 유튜버 콘텐츠 성과 예측
- 조회수에 영향을 주는 요인 해석
- 채널 운영 및 콘텐츠 기획 전략 수립에 활용
버츄얼 유튜버의 조회수를, 채널/영상/시각/음성 특징을 함께 활용해 예측하는 프로젝트입니다.