블로그

Glicko-2 시스템이 선수의 경기력 변동성을 Elo보다 잘 반영하는 이유

Table of Contents

경쟁의 세계에서 숫자가 모든 것을 말해줄 수 있을까?

온라인 게임이나 스포츠 경기를 즐기다 보면, 자신의 실력을 나타내는 점수가 생각했던 것과는 다르게 움직이는 상황을 종종 마주하게 된다. 분명 꽤 강력한 상대를 이겼는데도 점수가 찔끔 오르거나, 반대로 잠깐의 부진으로 인해 점수가 폭락하는 경험은 누구에게나 낯설지 않다. 이러한 현상은 단순히 시스템의 오류가 아니라, 그 뒤에서 작동하는 알고리즘이 플레이어의 실력을 어떻게 정의하고 계산하느냐에 따라 결정되는 결과다. 실제로 오랫동안 표준으로 자리 잡아온 Elo 시스템과 이를 보완하기 위해 등장한 Glicko-2 시스템은 실력을 바라보는 관점에서 큰 차이를 보인다.

사람들은 흔히 자신의 실력이 하나의 고정된 숫자로 표현될 수 있다고 믿지만, 실제 경기력은 컨디션이나 상대와의 상성, 혹은 공백기 등 다양한 변수에 의해 끊임없이 흔들린다. 이러한 elo 시스템은 이러한 변동을 하나의 단순한 수치 증감으로만 해석하려다 보니, 복잡한 현실의 경기 양상을 충분히 담아내지 못하는 한계를 드러내곤 했다. 이에 반해 Glicko-2는 선수가 가진 잠재적인 불안정성까지 계산식에 포함시킴으로써, 보다 입체적인 실력 측정을 시도한다.

이 글을 찾아온 독자라면 아마도 랭킹 시스템이 왜 이렇게 작동하는지, 혹은 특정 게임이나 플랫폼에서 내 점수가 왜 들쑥날쑥한지에 대한 궁금증을 가지고 있을 것이다. 단순히 이기는 것만이 점수를 올리는 길이 아니라는 사실을 이해하면, 경쟁을 바라보는 시각도 조금은 달라질 수 있다. 우리가 흔히 접하는 점수 뒤에 숨겨진 수학적 원리와, 그것이 어떻게 경기력의 변동성을 잡아내는지를 천천히 따라가 보려 한다.

Elo 시스템이 가진 구조적 한계와 단순함의 이면

단일 수치로 정의되는 실력의 맹점

Elo 레이팅 시스템은 체스 플레이어들의 실력을 측정하기 위해 고안된 가장 고전적이고 직관적인 방식이다. 이 시스템의 핵심은 두 선수의 점수 차이를 통해 승률을 예측하고, 그 결과에 따라 점수를 주고받는 제로섬 게임의 형태를 띤다는 점이다. 강한 상대를 이기면 많은 점수를 가져오고, 약한 상대에게 지면 많은 점수를 잃는다는 기본 원칙은 매우 합리적으로 보인다. 그러나 이 단순함이 복잡한 변수들이 얽혀 있는 현대의 경쟁 환경에서는 오히려 독이 되기도 한다.

Elo 시스템은 플레이어의 현재 점수를 ‘절대적인 실력’으로 간주하는 경향이 있다. 구체적으로, 2000점인 플레이어가 1년 동안 경기를 하지 않고 복귀했을 때도 시스템은 여전히 그를 2000점 실력자로 대우한다. 그러나 실제로는 감각이 무뎌졌거나 메타가 변했기 때문에 예전만큼의 기량을 발휘하기 어려울 가능성이 높다. Elo는 이러한 시간의 흐름이나 플레이어의 상태 변화를 수치에 즉각적으로 반영하지 못한다는 구조적 한계를 안고 있다.

또한, Elo는 플레이어가 얼마나 일관성 있게 경기력을 유지하는지를 구별해 내지 못한다. 매 경기 기복 없이 안정적인 플레이를 하는 선수와, 컨디션에 따라 경기력이 천차만별인 선수가 같은 점수를 가지고 있다면, Elo 시스템에서는 이 둘을 완전히 동일한 실력으로 취급한다. 이는 승부의 결과를 예측해야 하는 입장이나 공정한 매칭을 원하는 사용자 입장에서는 다소 불합리하게 느껴질 수 있는 부분이다.

승패 결과만으로는 설명되지 않는 과정의 차이

경기 결과는 승리, 패배, 혹은 무승부로 명확하게 나뉘지만, 그 과정에서 드러나는 내용은 경기마다 천차만별이다. 어떤 승리는 압도적이었을 수도 있고, 어떤 승리는 운이 좋아 간신히 얻어낸 것일 수도 있다. Elo 시스템은 오로지 결과값만을 놓고 계산하기 때문에, 이러한 과정상의 맥락을 놓치기 쉽다. 특히 팀 단위의 경쟁이나 변수가 많은 e스포츠 종목에서는 단순히 이겼다는 사실 하나만으로 실력을 온전히 증명하기 어려운 경우가 많다.

이러한 한계는 신규 진입자나 복귀 유저를 처리하는 방식에서 더욱 두드러진다. 새로운 플레이어가 진입했을 때 Elo 시스템은 그들에게 기본 점수를 부여하고, 수많은 경기를 치르며 제 자리를 찾아가도록 유도한다. 하지만 이 과정이 너무 느리게 진행되거나, 초기 몇 판의 운에 의해 실력과 맞지 않는 점수대에 머무르게 되는 ‘Elo Hell’ 같은 현상을 초래하기도 한다.

결국 Elo는 ‘현재의 상태’를 보여주는 스냅샷으로는 유용하지만, 그 점수가 얼마나 ‘신뢰할 수 있는가’에 대한 정보는 제공하지 않는다. 이것이 바로 더 정교한 시스템이 필요해진 이유이며, Glicko 시스템이 탄생하게 된 배경이기도 하다. 숫자는 거짓말을 하지 않지만, 그 숫자가 모든 진실을 담고 있는 것은 아니라는 점을 기억해야 한다.

Glicko 시스템의 핵심 개념: 등급 편차(RD)의 도입

점수가 아니라 범위를 측정하다

Glicko 시스템이 Elo와 가장 차별화되는 지점은 실력을 하나의 점(Point)이 아닌, 범위(Range)로 인식한다는 것이다. 이를 위해 Glicko는 ‘등급 편차(Rating Deviation, RD)’라는 새로운 개념을 도입했다. 1500점이라는 점수가 있을 때, 이 점수가 1450점에서 1550점 사이의 실력일 수도 있고, 1200점에서 1800점 사이의 실력일 수도 있다는 불확실성을 수치화한 것이다. 중요한 점은 rD가 낮을수록 해당 점수에 대한 신뢰도가 높다는 것을 의미하며, RD가 높을수록 실력이 아직 정확히 검증되지 않았음을 뜻한다.

이 개념은 플레이어의 활동량과 밀접하게 연결된다. 꾸준히 경기를 치르는 선수는 데이터가 많이 쌓이기 때문에 RD가 점차 줄어들어 점수의 정확도가 높아진다, 반면, 오랫동안 경기를 하지 않은 선수는 실력의 불확실성이 커지므로 rd가 다시 증가하게 된다. 즉, Glicko 시스템은 “네가 1500점인 건 알겠는데, 최근에 경기를 안 해서 그 점수가 진짜인지는 확신할 수 없어”라고 말하는 셈이다.

이렇게 실력을 범위로 인식하게 되면 매칭 시스템이나 랭킹 산정 방식이 훨씬 유연해진다. RD가 높은 선수가 의외의 결과를 냈을 때는 점수 변동 폭을 크게 가져가서 빠르게 제자리를 찾게 하고, RD가 낮은 안정적인 선수끼리의 대결에서는 점수 변동을 최소화하여 랭킹의 인플레이션을 방지할 수 있다, 이는 경쟁의 공정성을 확보하는 데 매우 중요한 역할을 한다.

거대하게 빛나는 디지털 숫자와 순위 벽면을 마주하고 선 사람의 어두운 실루엣이 돋보이는 웅장한 모습이다

활동성에 따라 숨 쉬는 점수 체계

RD는 단순히 불확실성을 나타내는 지표를 넘어, 플레이어의 활동 패턴에 따라 살아 움직이는 유기적인 수치다. Elo 시스템에서는 경기를 하지 않으면 점수가 그대로 굳어버리지만, Glicko 시스템에서는 시간이 지날수록 RD가 서서히 증가한다. 이는 휴식 기간 동안 실력이 변했을 가능성을 염두에 둔 설계다. 따라서 복귀전에서 승리하거나 패배했을 때, Elo보다 훨씬 드라마틱한 점수 변화가 일어난다.

이러한 구조는 소위 ‘배치고사’라고 불리는 초기 등급 산정 과정에서도 큰 효과를 발휘한다. 처음 시스템에 진입한 플레이어는 매우 높은 RD 값을 가지게 되며, 초기 몇 판의 결과에 따라 점수가 급격하게 요동친다. 이는 신규 유저가 자신의 실력에 맞는 구간으로 빠르게 이동할 수 있도록 돕는 장치다. 고수와 초보가 뒤섞여 고통받는 구간을 최소화하려는 의도가 담겨 있다.

그래서 Glicko 시스템의 RD 개념은 “실력은 고정불변의 것이 아니라, 끊임없이 증명해야 하는 것”이라는 철학을 반영하고 있다. 자주 증명할수록 시스템은 당신의 점수를 신뢰하게 되고. 증명을 멈추면 신뢰도는 다시 낮아진다. 이 동적인 과정이 경쟁 게임의 생태계를 더욱 활기차게 만드는 원동력이 된다.

Glicko-2의 진화: 변동성(Volatility)을 통한 예측

일관성을 수치화하는 또 하나의 축

Glicko 시스템이 RD를 통해 ‘점수의 신뢰도’를 확보했다면, Glicko-2는 여기서 한 발 더 나아가 ‘변동성(Volatility, σ)’이라는 개념을 추가했다. 이것이 바로 제목에서 언급한 경기력 변동성을 반영하는 핵심 열쇠다. RD가 단순히 데이터의 부족이나 공백기로 인한 불확실성을 의미한다면, 변동성은 플레이어가 경기마다 보여주는 퍼포먼스의 기복 그 자체를 측정한다.

변동성 지표는 플레이어의 경기 결과가 예상된 확률에서 얼마나 벗어나는지를 추적한다. 예를 들어, 1500점인 플레이어가 비슷한 점수대의 상대를 이기고 지는 것은 예상 가능한 범위 내의 결과이므로 변동성이 낮게 유지된다. 하지만 갑자기 2000점대 고수를 이겼다가, 다음 판에서 1000점대 초보에게 지는 등 들쑥날쑥한 결과를 보인다면 시스템은 이 플레이어의 변동성 수치를 높게 책정한다.

이 변동성 값은 다음 경기 결과를 예측하고 점수를 조정하는 데 중요한 가중치로 작용하며, 이처럼 보이지 않는 내부 지표가 시스템의 판단을 좌우하는 구조는 토토 사이트의 ‘앱(App)’ 위장술: 쇼핑몰/커뮤니티로 둔갑해 단속을 피하는 기술의 겉으로 드러난 형태와 실제 작동 방식이 다를 수 있음을 시사한다. 변동성이 높은 플레이어는 현재의 점수가 불안정하다고 판단되어 승패에 따른 점수 변화폭이 더 민감하게 조정되는 반면, 변동성이 낮은 즉 꾸준한 플레이어는 우연한 패배 한 번으로 점수가 크게 깎이지 않도록 보호받는 효과도 있다. 이는 단순히 승률만으로는 파악할 수 없던 플레이어의 성향을 시스템이 구조적으로 해석하기 시작했다는 의미로 이어진다.

다음은 Elo 시스템부터 Glicko-2까지의 주요 특징을 비교하여, 각 시스템이 실력을 어떻게 바라보는지 정리한 표이다. 이를 통해 변동성 개념이 왜 중요한지 한눈에 파악할 수 있다.

구분	Elo 시스템	Glicko 시스템	Glicko-2 시스템
기본 점수	단일 수치 (Rating)	단일 수치 (Rating)	단일 수치 (Rating)
신뢰도 측정	없음 (모든 점수 동등 취급)	등급 편차 (RD) 도입	등급 편차 (RD) 사용
변동성 측정	불가능	RD에 일부 포함됨	별도의 변동성(Volatility) 변수 적용
시간 경과 처리	점수 변화 없음	시간이 지날수록 RD 증가	RD 증가 및 변동성 재계산
예측 정확도	기본적인 승률 예측	신뢰도 기반의 예측 보정	기복과 패턴까지 고려한 정밀 예측

위 표에서 볼 수 있듯이, Glicko-2는 이전 세대의 시스템들이 놓치고 있던 ‘플레이 스타일의 일관성’을 수치화하는 데 성공했다, 이는 단순한 랭킹 줄 세우기를 넘어, 플레이어의 향후 퍼포먼스를 예측하는 데 있어 훨씬 더 강력한 도구가 된다. 이제 시스템은 당신이 “얼마나 잘하는지” 나아가 “얼마나 예측 불가능한지”까지 알고 있다.

예상 밖의 승부와 시스템의 반응

Glicko-2 시스템 하에서 ‘이변’은 단순한 1패나 1승 이상의 의미를 갖는다. 압도적으로 유리한 상황에서 패배했을 때, Elo 시스템은 단순히 정해진 점수를 깎아내릴 뿐이지만, Glicko-2는 “이 선수의 실력이 떨어졌거나, 혹은 상대방의 실력이 급상승했다”는 가설을 세우고 변동성 값을 수정한다. 이 과정은 매우 동적이며, 한두 판의 결과가 아닌 일련의 흐름 속에서 판단이 이루어진다.

이러한 매커니즘은 특히 ‘스머핑(Smurfing)’이나 대리 게임과 같은 비정상적인 플레이 패턴을 감지하는 데에도 유용하게 활용될 수 있다. 평소와 전혀 다른 수준의 경기력을 보이거나, 승률이 비정상적으로 치솟을 때 변동성 수치가 급격히 반응하기 때문이다. 운영진 입장에서는 이러한 데이터를 바탕으로 매칭 밸런스를 조정하거나 제재를 가하는 등의 조치를 취하기가 한결 수월해진다.

결국 Glicko-2는 플레이어의 실력을 살아있는 생물처럼 다룬다. 기복이 심한 날도 있고, 컨디션이 좋은 날도 있다는 인간적인 특성을 수학 공식 안에 녹여낸 것이다. 이에 따라 때로는 점수 변동이 이해되지 않을 때도 있겠지만, 길게 보면 자신의 진짜 실력에 가장 근접한 위치로 수렴하게 만드는 힘을 가지고 있다.

실전에서 느끼는 체감과 공정함의 문제

복귀 유저와 신규 유저에게 주어지는 기회

사용자 입장에서 $Glicko-2$ 시스템이 가장 반가운 순간은 아마도 오랜만에 게임에 복귀했을 때일 것입니다. 예전 $Elo$ 시스템 기반의 게임에서는 복귀 후 떨어진 감각으로 연패를 하더라도 점수가 찔끔찔끔 떨어져, 한동안 고통스러운 매칭을 견뎌야 했습니다. 하지만 $Glicko-2$ 시스템에서는 공백기 동안 높아진 $RD$(평가 편차)와 변동성 덕분에, 초반 몇 판의 결과만으로도 현재 실력에 맞는 구간으로 빠르게 이동할 수 있습니다. https://maxpixels.net/main.php에 다루는 데이터 시뮬레이션 결과처럼, 시스템은 유저의 실력 불확실성이 커진 상태를 인지하고 결과에 가중치를 부여합니다. 이는 복귀 유저가 자신의 현재 기량에 맞는 적절한 상대와 매칭되도록 돕고, 게임에 대한 흥미를 잃지 않게 만드는 중요한 요소가 됩니다.

반대로 급격하게 실력이 상승한 유저에게도 이 시스템은 유리하다. 깨달음을 얻어 갑자기 연승을 달리는 유저는 변동성 수치가 높아지면서, 승리 시 얻는 점수 폭이 커진다. 즉, 실력이 늘었는데도 점수가 제자리걸음 하는 답답함을 덜어준다. 시스템이 “너의 실력은 이 구간에 있을 레벨이 아니다”라고 판단하고 빠르게 위쪽으로 올려보내는 것이다.

이러한 유동성은 전체적인 생태계의 물을 흐르지 않게 해준다. 고인 물은 고인 물끼리. 흐르는 물은 흐르는 물끼리 만나게 함으로써 매칭의 질을 높이는 것이다. 물론 이 과정에서 점수가 널뛰기하는 것을 불안해하는 유저도 있겠지만, 이는 제자리를 찾아가는 과도기적 현상으로 이해하는 것이 옳다.

깔끔한 디지털 그래프가 깨지며 틈새로 어둡고 불안정한 기반이 드러나는 모습을 표현한 이미지

숫자 뒤에 숨은 심리적 안정감

아이러니하게도, 더 복잡한 수식을 사용하는 Glicko-2 시스템이 유저들에게는 더 큰 심리적 안정감을 줄 수 있다. 내가 왜 이 점수를 받았는지, 왜 이번 판은 점수가 적게 올랐는지에 대한 이유가 ‘상대방의 불확실성’이나 ‘나의 기복’으로 설명되기 때문이다. 단순히 “시스템이 이상해”라고 치부하기보다, 나의 플레이 패턴이 점수에 반영되고 있다는 사실을 인지하면 결과에 대한 수용도가 높아진다,

또한, 이 시스템은 소위 ‘점수 주차’라고 불리는 행위를 간접적으로 억제한다. 높은 점수를 찍어놓고 경기를 하지 않으면 RD가 높아져, 나중에 한 판만 져도 큰 타격을 입을 수 있다는 리스크가 생긴다. 랭커 유지를 위해서는 꾸준히 자신의 실력을 증명해야 한다는 압박감이 건강한 경쟁을 유도하는 셈이다.

이제 실제 상황에서 Elo와 Glicko-2가 어떻게 다르게 반응하는지 구체적인 시나리오를 통해 비교해 보자, 같은 승패라도 상황에 따라 결과가 얼마나 달라질 수 있는지 확인하면 이해가 더 빠를 것이다.

상황 (Scenario)	Elo 시스템의 반응	Glicko-2 시스템의 반응
1년 만에 복귀한 고수의 첫 패배	일반적인 패배와 동일한 소폭 하락	높은 RD로 인해 점수가 대폭 하락 (빠른 조정)
갑자기 실력이 급상승한 유저의 연승	점진적인 점수 상승 (느린 반영)	변동성 증가로 점수 상승폭 확대 (빠른 승급)
비슷한 실력자와의 꾸준한 승패 반복	점수가 계속 오르락내리락함	RD가 낮아져 점수 변동폭이 작아짐 (안정화)
예상 밖의 상대에게 당한 1패	상대 점수에 비례해 큰 점수 하락	나의 변동성과 상대의 RD를 고려해 하락폭 조절

표에서 알 수 있듯이, Glicko-2는 상황의 맥락을 읽으려 노력한다. 단순히 승점 자판기처럼 작동하는 것이 아니라, 플레이어의 현재 상태를 진단하고 그에 맞는 처방을 내리는 의사처럼 행동하는 것이다. 이것이 현대의 수많은 온라인 게임과 스포츠 데이터 분석에서 Glicko-2를 선호하는 결정적인 이유다.

데이터가 그리는 경쟁의 미래

더 정교해지는 예측과 매칭의 미학

오늘날의 경쟁 게임이나 스포츠 베팅 시장, 혹은 데이터 분석 분야에서 Glicko-2는 단순한 랭킹 알고리즘 이상의 의미를 갖는다. 이는 확률을 다루는 방식의 진화를 보여주는 사례이기도 하다. 과거에는 승률 50%를 맞추는 것이 목표였다면, 이제는 그 50% 안에 숨겨진 변동성과 리스크까지 계산하여 사용자에게 최적의 경험을 제공하는 것이 목표가 되었다.

머니사이트나 정보 공유 커뮤니티에서 분석 글을 볼 때도 이러한 관점은 유용하다. 단순히 과거 전적만 나열된 데이터보다는, 최근의 기복이나 활동 빈도까지 고려된 분석이 훨씬 더 높은 적중률을 보일 수밖에 없다. 이처럼 glicko-2가 바라보는 시각처럼, 독자들 또한 표면적인 승패 기록 이면에 있는 ‘흐름’과 ‘불확실성’을 읽어내는 눈을 기른다면 정보를 해석하는 깊이가 달라질 것이다.

결국 중요한 것은 꾸준함의 가치

Glicko-2 시스템이 우리에게 던지는 메시지는 명확하다. 진정한 실력은 한순간의 운으로 만들어지는 것이 아니라, 꾸준한 증명을 통해 완성된다는 것이다. 변동성 수치가 낮고 점수가 높은 상태, 그것이 바로 이 시스템이 인정하는 최고의 경지다. 들쑥날쑥한 대박보다는 안정적인 퍼포먼스가 더 높은 평가를 받는 구조는, 어쩌면 우리네 인생이나 투자의 원칙과도 닮아 있다.

글을 마치며, 랭킹 시스템은 완벽하지 않지만 끊임없이 인간의 직관을 수학적으로 모사하기 위해 발전하고 있다는 점을 강조하고 싶다, elo에서 시작해 glicko를 거쳐 glicko-2로 이어진 이 진화의 흐름은, 앞으로 ai와 머신러닝을 만나 더욱 정교해질 것이다. 하지만 그 어떤 복잡한 알고리즘이 등장하더라도 변하지 않는 사실은 하나다. 결국 시스템을 움직이는 것은 플레이어의 땀과 노력이며, 숫자는 그 뒤를 묵묵히 따라갈 뿐이라는 것이다.