본 프로젝트는 PUBG 경기 데이터를 활용하여
플레이 스타일과 승률 간의 관계를 분석하고,
승리에 영향을 미치는 주요 요인을 데이터 기반으로 도출하는 것을 목표로 합니다.
- 출처: Kaggle – PUBG Finish Placement Prediction
- 대상: Solo 게임 데이터
- 주요 변수:
- 전투 지표: kills, damageDealt, headshotKills
- 이동 지표: walkDistance, rideDistance, swimDistance
- 아이템 사용: heals, boosts
- 결과 지표: winPlacePerc
- Solo 게임만 추출하여 분석
- 분석에 불필요한 컬럼 제거
- 이상치 처리:
- 비정상적으로 긴 사살 거리
- 활동 지표(이동·딜·킬)가 모두 0인 상위 순위 데이터 제거
- 결측치는 분석 영향이 적다고 판단하여 해당 행 제거
- 경기 시간 분포 분석 → 짧은 경기 / 긴 경기의 이봉 분포 확인
- 유저 등급별 전투 능력 비교:
- 등급이 높을수록 킬 수, 이동 거리, 아이템 사용량 증가
- 가설 검정 결과:
- 공격적/수비적 플레이 스타일 차이는 승률에 큰 영향 없음
- 초반 교전 중심 플레이가 생존 및 승률에 유리
- 후반부 승부는 부스트 아이템 사용량이 핵심 요인으로 확인
- 사용 모델:
- Ridge / Lasso Regression
- Random Forest
- Gradient Boosting
- 결과:
- Gradient Boosting 모델이 가장 높은 성능(R² ≈ 0.90) 기록
- 중요 변수:
- walkDistance
- killPlace
- boosts
- K-means 기반 군집화 (K = 4)
- 플레이어 유형 분류:
- 저활동·초반 탈락형
- 고이동·상위권 생존형
- 차량 기동형
- 균형·안정 운영형
- 군집별 전략적 특징 및 개선 방향 도출
- 상위권 유저는 단순 킬 수보다 이동·자원 관리·맵 활용이 뛰어남
- 초반 루팅 위주의 전략은 생존 확률이 낮음
- 후반 승부의 핵심은 부스트 아이템 관리
- 플레이 스타일보다 상황 판단과 자원 운영이 승리에 더 중요
- Solo 모드 데이터만 사용하여 일반화에 한계 존재
- 경기 로그 단위 데이터가 아닌 누적 데이터 기반 분석
- 표본 수가 커 통계적 유의성과 실제 효과 크기 해석에 주의 필요