기술의 발전으로 많은 데이터들이 측정되고 기록되면서, 스포츠 분야에도 변화의 바람이 불고 있다. 기록의 스포츠라고 불리는 야구에서는 세이버 매트릭스 이론이 널리 활용되고 있다. 세이버 매트릭스는 미국야구연구학회 SABR과 metrics의 합성어로 야구를 통계학적/수학적으로 분석하는 방법론이다[1]. 또한, 프로야구 경기 빅데이터를 인공지능 기술을 통해 분석하려는 여러 움직임도 있다. 김종훈 외(2015)의 연구에서는 딥 러닝 기술을 통해 프로야구 승패를 예측하였다. 김혁주(2012)의 연구에서는 가중 OPS라는 새로운 지표를 만들어 득점 생산성을 설명하였다[2-4]. 본 논문에서는 한국 프로야구 경기 빅데이터를 머신러닝 기법으로 분석하여, 상황별 타자의 타격 성공 여부를 예측하는 모델을 제안한다. 데이터는 한국 프로야구 공식 기록 기반 세이버 매트릭스 빅데이터를 제공하는 ‘스탯티즈’에서 수집했다. 본 연구에서는 2020년부터 현재까지의 박해민 선수의 5년치 play log 데이터를 활용하였다. 박해민 선수는 2012년 프로에 입단해 현재까지도 현 소속팀 LG 트윈스에서 핵심 선수로 활약하고 있다. 2023년에는 한국 시리즈 5차전 KT와 경기에서 데일리 MVP로 선정되며, 팀의 29년 만의 통합 우승에 기여하였다.