2025 호주 오픈을 통해 본 테니스에서 서브와 득점과의 상관관계
자연대 홍보기자단 자:몽 7기 | 김태원

2025 호주 오픈 가상의 모습 (그림 = The Sports Prince)
테니스는 빠른 속도의 테니스공을 받아 상대가 받지 못하는 곳에 떨어뜨려야 하는 스포츠이다. 테니스는 골프와 유사하게 시즌 기간에는 매주 크고 작은 대회가 열린다. 이 중 가장 명성이 높은 대회가 그랜드 슬램으로 호주 오픈, 롤랑 가로스(프랑스), 윔블던(영국), US 오픈이 있다. 호주 오픈이 열리는 멜버른은 유일하게 남반구에 위치하여 대회가 1월 중반에 개최되어, 한 해의 성적을 가늠하는 대회가 된다. 또한, 호주 오픈은 2018년 정현이 노박 조코비치 등을 잡으며 4강에 올라 신드롬을 일으킨 대회이며, 우리나라와의 시차가 2시간으로 매우 적어 한국에서의 인지도가 높은 편이다. 본 기사는 지난 1월 12일부터 26일까지 개최된 2025 호주 오픈을 토대로 작성되었다.
필자는 호주 오픈을 관전하면서, 테니스가 통계로 표현되기에 적합한 스포츠라 판단하였다. 흔히 야구가 통계로 분석하기에 유용한 스포츠로 꼽히는데, 그 이유로 플레이 간의 단절성을 든다. 즉, 공을 던지고 치는 것 이외의 사건이 발생하지 않으며, 이것 사이의 시간 간격이 존재한다. 반면, 축구는 오프 더 볼 움직임(선수가 공을 소유하고 있지 않을 때의 움직임) 및 동료의 패스의 퀄리티 등이 플레이에 심하게 영향을 받는다. 테니스는 야구와 비슷하게 단순히 한 플레이어가 다른 플레이어가 친 공을 받아 상대편 코트로 넘기면 된다. 득점이 나는 방법도 4가지로 요약(공을 받지 못한 경우, 친 공이 네트에 걸린 경우 및 아웃된 경우, 서브에서 두 번 연속 폴트를 범한 경우)할 수 있을 만큼 간단한 편이기에 통계적으로 분석하는 것이 용이하다. 필자는 이 중에서도 서브가 코스 및 속도로 분석하기에 명확하다고 판단하여 R을 이용하여 데이터 시각화, 로지스틱 회귀 모델을 토대로 분석을 진행하였다.

테니스 서브 구역 (그림 = JUNEL ELIANG'S DESERT TENNIS)
우선, 테니스의 서브 규칙은 현재 자신의 코트에서 상대편 코트의 반대편의 서비스 구역에 한 번 바운드되어야 한다. 즉, 서브를 받는 사람 기준으로 왼쪽에서 서브를 넣는다면, 오른쪽의 서비스 구역에 바운드가 이루어져야 한다. 만약, 서비스 구역에 바운드가 이루어지지 않거나 네트에 걸리면 폴트라 부르며, 폴트가 두 번 반복되면 실점한다. 이때, 한 번 폴트를 범한 이후에 행하는 서브를 세컨 서브(second serve)라 한다. 서비스 구역은 위 그림과 같이 가운데 선에 가까울 때 T존, 바깥 선에 가까울 때 와이드존이라 한다. 본 분석에서 서브 구역은 T존과 와이드존, 그리고 이외의 구역으로 분류하였으며 8강전부터 결승전까지의 서브 1205개에 대하여 서브 속도와 구역 및 득점 여부를 중점적으로 분석하였다.

성별과 세컨 서브 여부에 따른 서브 속도와 득점 유무의 관계 (그림 = 김태원 기자)
위 그래프는 성별과 세컨 서브 여부에 따른 서브 속도와 득점 유무의 관계를 나타낸 산점도이다. 이를 통해 세 가지 사실을 파악할 수 있다. 첫째로, 여성이 남성보다 서브 속도가 대체적으로 낮다. 두 번째로, 세컨 서브일 때는 폴트를 범하지 않기 위하여 대부분 첫 번째 서브에 비해 서브 속도를 낮춘다. 마지막으로, 남성의 경우에는 빠른 서브를 넣었을 때 득점 확률이 높으며, 특히 세컨 서브에서 그 경향이 두드러지게 나타난다.
위 그래프와 통상적인 생각으로 미루어보면, 서브가 빠를수록 득점 확률이 높다. 이로 인해 여성과 남성의 서브 시의 득점 확률, 즉, 서브의 이점 정도가 차이가 날 것이다. 이외에도 서브하는 구역, 세컨 서브 여부에 따라 득점 확률이 달라질 것이다. 이러한 생각을 바탕으로 서브 속도, 성별, 서브 구역, 세컨 서브 여부에 따라 득점 확률을 예측하는 모델을 만들고자 하였다. 득점 여부는 이진 변수로 만들기 위하여 폴트 값을 데이터에서 제거하였다. 득점 여부가 이진 변수이기에 로지스틱 회귀분석을 사용하였으며, 그 결과는 아래 식과 같다.

예측한 것과 같이 서브 속도가 증가할수록 득점 확률이 증가하는 경향을 보였다. 본 분석에서 남성의 서브 평균 속도가 191km/h , 여성의 서브 평균 속도가 166km/h이므로 나머지 이진 변수가 모두 0의 값을 가질 때(단, 성별에서 여성의 경우는 1, T존으로 들어간 첫 서브를 의미) logit의 값이 남성은 0.640, 여성은 0.385이다. logit을 확률로 변환하면, 남성은 65.4%, 여성은 59.5%의 확률로 서브 시 득점을 획득한다. 또한, 세컨 서브에서는 대체적으로 약한 서브를 넣으므로 득점 확률이 낮아진다(남성: 61.1%, 여성: 54.9%). 서브 구역에 따라서는 와이드존이 T존보다 득점 확률이 유의미하게 높아지며(남성: 73.3%, 여성: 68.0%), 가운데로 보냈을 때는 득점 확률이 소폭 하락한다(남성: 61.7%, 여성: 55.6%). 물론, 단순히 로지스틱 회귀 모형을 만족한다 했을 때 가정이며, 변수 간 상호작용에 대한 고려를 하지 않았으나, 우리가 대략적으로 생각하는 결과와 일치하였다.
두 번째로는 서브 속도를 선수 각각의 평균 서브 속도에서 뺀 값으로 같은 과정을 반복하였다. 다만, 선수별로 세컨 서브를 빠르고 과감하게 넣거나 약하고 안정적으로 넣는 경우로 나뉘므로 평균 서브 속도에서는 세컨 서브 여부 역시 고려하였다. 예측한 로지스틱 회귀 모델은 다음과 같다.

경향성 자체는 앞의 모델과 유사하게 나타났다. 다만, 앞의 모델은 서브 속도를 포함하였기에 성별 및 세컨 서브 여부가 이미 서브 속도에 영향을 주었다. 즉, 서브 속도가 세컨 서브 여부 및 성별과는 독립이 아닌 것이 확실하였음에도 변수 간의 상관관계 분석이 미흡하였다. 이 모델에서는 각 선수에 따라 서브 속도에서 자신의 평균 서브 속도를 빼고, 세컨 서브 역시 고려하였으므로, 성별과 세컨 서브 여부에 따라 logit 값이 더욱 많이 변화하는 것을 알 수 있다. 모델에서 각 성별의 선수가 T존으로 첫 서브를 자신의 평균 서브 속도로 넣는다면, 남성은 68.5%, 여성은 62.4%의 확률로 득점한다. 자신의 평균보다 1km/h만큼 더 강한 서브를 넣었을 때, 득점 확률은 각각 68.7%, 62.6%로 미세하게 상승한다. 물론, 선수들은 10~20km/h의 서브 속도를 조절하여 넣기 때문에 이보다 더 큰 득점 확률 상승을 기대할 수 있으며, 확률이 가장 높게 책정된 8강전에서 Shelton(22, 미국)의 와이드존 232km/h 서브는 첫 번째 모델에 의거하면 무려 79.9%의 득점 확률을 가진다. 다만, 본 모델에 의하면 서브의 속도가 극적인 득점 확률 상승에 기여하지는 않는다. 오히려 코스를 와이드존으로 정확하게 넣는 것이 득점 확률을 8% 가량 상승시킨다.
위 결론은 스포츠에서 많은 점을 생각하게 한다. 테니스의 서브는 마치 야구의 구속을 연상케 한다. 야구에서 155km/h 이상의 강속구와 테니스에서 220km/h 이상의 강서브는 관중들의 함성을 자아내게 하고, 팬들의 도파민을 분출시킨다. 이러한 능력을 갖춘 사람들은 자연스레 팬들이 늘어난다. 하지만, 이것이 승리로 직결되지는 않는다. 단적으로 남자 단식 결승에서도 야닉 시너가 시종일관 상대인 알렉산더 즈베르프보다 낮은 서브 속도를 기록했음에도 여유롭게 완파하며 우승컵을 들어 올렸다. 강서브와 강속구는 매력적인 무기임에는 분명하다. 하지만, 테니스 선수에게 추가적으로 정확한 곳에 서브를 넣을 수 있는 능력, 서브의 속도 조절 능력, 서브의 높은 RPM이 요구되는 것처럼 투수에게도 준수한 제구력, 뛰어난 변화구 구사 능력, 일정 수 이상의 회전수가 요구된다. 자신의 무기를 연마하면서도 어느 수준 이상의 다른 능력도 유지해야 선수로서 비로소 정상의 자리에 오를 수 있게 되는 것이다.
본 분석을 진행하면서 국내에 스포츠 관련된 통계가 부족하다는 것을 느꼈다. 테니스는 국내 통계 사이트는 거의 전무하며, 국내 스포츠 중 최고의 인기를 자랑하는 야구 역시 이와 별반 다르지 않다. STATIZ에서 타율, OPS, wrc+ 등 여러 자료를 제공하기는 하나, KBO리그에서는 투수들의 RPM 정보 및 특정 타구의 기대 타율, 구장에 따라 달라지는 홈런 여부 등을 제공하지 않는다. 즉, 투구 및 타구의 상대를 제압할 수 있는 확률보다는 이미 나온 결과만을 바탕으로 통계를 제공하는 것이다. 이는 야구에서 가장 상위 리그인 MLB가 경기 도중에도 수시로 특정 공의 RPM, 기대 타율 등을 실시간으로 중계 화면을 통해 보여주는 것과는 정반대이다. 물론 정보 자체가 경제적 가치를 지니므로 이를 대중에게 공개하는 것은 부적절할 수도 있다. 하지만, 더 많은 사람이 객관적으로 선수의 가치를 평가하고 스포츠를 제대로 즐기기 위해서는 다양한 지표가 더 대중에게 공개되어야 한다.
자연과학대학 홍보기자단 자:몽 김태원 기자 taewon0126@snu.ac.kr
카드뉴스는 자:몽 인스타그램 @grapefruit_snucns에서 확인할 수 있습니다.