Game theory optimal . (게임이론 최적화) : 포커에서 게임의 이론은 수학적인 계산에 따라 콜,레이즈,폴드 와
뱃,첵 그리고 이후 뱃-폴드,뱃-콜,뱃 레이즈 그리고 첵-콜, 첵-폴드,첵-레이즈 즉 내가 할수있는 모든 플래이가 뱃사이즈와 팟사이즈에
맞춰서 완전한 균형을 이룬 상태를 말한다. 이렇게 내쉬균형을 이루면 상대가 나의 콜,레이즈 등등 에 어떻게 대응해도 상대의 기대값은 0이된다.
게임의 이론 소개편에서 사용된 가위바위보에서 랜덤하게 33.3%로 나누어 낼 경우 상대가 가위,바위,보를 어떻게 내도 장기적으로 승33.3% , 비김 33.3%, 패 33.3% 가 되는것이 예로 사용되었다. 이렇게 완전한 균형으로 플래이할경우 상대는 너를 익스플로잇하지 못한다. 하지만 너 역시 상대를 익스플로잇 할수 있는 권한을 버리는샘이다.
(가위바위보에서 상대가 주먹을 자주낸다면 33.3%의 균형보다 보자기를 더 자주 내는것으로 익스플로잇 할수있는 기회를 버리는샘)
Exploitable play . (불균형한 플레이) : 게임이론 최적화가 아닌 모든 플래이.
포커에서 뱃,레이즈,폴드 와 뱃,첵의 비율을 어떤 이유에서든지 수학적인 최적화와 다르게 플래이하면 불균형한 플래이가 된다.
Exploitable의 명사 단어인 Exploit(이하 익스플로잇) 의 사전적인 뜻은 이용하다,활용하다 라는 뜻을 가지고 있다.
콜링스테이션의 콜레인지는 강한핸드에 비해 약한핸드가 너무 많이 들어가 있어 불균형하고 닛의 콜링레인지는 강한핸드에 비해 중간핸드와 약한핸드가 부족해서 불균형하다.
만약 콜링스테이션을 상대로 너의 배팅레인지가 수학적인 최적화가 아니라 발류뱃이 너무 많이 들어있다던가 , 닛을 상대로 레이즈하는
레인지가 발류뱃보다 블러핑이 너무 많이 들어가 있다던가 하면 너는 상대의 불균형함을 익스플로잇(이용) 하기위해 스스로 불균형한 플래이를
선택한것이고 역시 상대도 너를 익스플로잇 할수있다 . (콜링스테이션이 "이놈 나한태 블러핑 하는 꼴을 못봤어" 라는 생각으로 약한핸드를 폴드하기 시작하고 강한핸드로만 콜이나 레이즈하면 너의 불균형함을 역으로 익스플로잇 하는 것이다)
______________________________________________________________________
GTO 와 불균형한 플래이의 비교.
GTO Exploitable play
수학적인 계산으로 플래이한다. 상대의 패턴을 보고 맞춰서 플래이한다
상대가 어떻게 하던 장기적으로 +ev다 상대가 어떻게 대응하냐에 따라 ev가 변한다
상대는 너를 익스플로잇 할수 없다. 상대가 너의 패턴을 보고 익스플로잇 할수 있다.
모르는 상대나 너보다 뛰어난 상대에게 좋다 너보다 못하거나 익스플로잇하기 쉬운 상대에게 좋다
심리전이 필요없다. 심리전이 중요하다.
방어적인 플래이다 공격적인 플래이다
쉽게 설명하자면 가위바위보에서 나보다 잘하는 사람을 상대로 랜덤하게 33.3%로 하는것이 GTO고
가위,바위,보 중 하나를 너무 많이내는 상대나 가위 내고 바위 그 다음에 보 이렇게 패턴이 뻔한 상대에 맞추어서
플래이 하는것이 불균형한 플래이다.
이렇게 생각하면 GTO와 불균형한 플래이는 서로 정반대라고 생각 할 수 있다.
나도 게임의 이론을 처음 배웠을때 이렇게 생각했다.
하지만 불균형한 플래이의 고수들이 서로 개속 게임을 하다보면 결국은
서로 내쉬균형을 찾고 GTO로 플래이 하게 된다는걸 배운 후
이 두가지는 서로 반대가 아니라 어떻게 생각하면 하나라는 것을 알게 되었다.
_________________________________________________________________________
사람들은 누구누구는 포커를 잘 한다 누구는 참 못한다 라는 표현을 많이 쓴다.
그런데 무엇이 포커를 잘하는거고 무엇이 못하는건지 이해하는 사람은 많지 않다.
포커 실력을 결정하는 가장 큰 요소 두 가지.
1, 상대의 플래이를 보고 상대의 패턴과 어떤점이 불균형한가를 찾아내는 능력
2, 1번에서 찾은 상대의 약점을 이용해 최대한의 이익을 낼수 있는 전략을 생각하는 능력.
이 둘 중에 1번이 훨씬 더 어렵다.
1번을 찾아 냈으면 2번은 어느 정도의 기본적인 포커지식과 수학전인 계산을 이용해 상대를 어떻게 익스플로잇해야 최대한 이익인지 계산하기만 하면 된다.
만약 노리밋해즈업에서 이 두 가지 능력이 매우 뛰어난 선수 두명(A와 B)를 시간과 공간의 방에 가두어 놓고 100년동안 해즈업을 시키면 어떤 결과가 나올까 ?
시작은 서로 상대의 약점을 찾을려고 탐색할것이다. 3뱃에 너무 자주 죽지는 않는지 , 어떤 상황에서 발류뱃-블러핑 비율이 불균형 한지 찾아내고 익스플로잇 하려고 노력한다.
A : B는 리버에서 망가진 드로우로 블러핑을 너무 자주 한다. 리버에서 콜 비율을 올려야지
B : A는 리버에서 콜을 너무 자주하내. 리버에서 블러핑 비율을 낮추어야지
A : B의 블러핑 비율이 내려 갔다. 나는 콜 비율을 낮추어야지
B : A의 콜비율이 낮아 졌다. 블러핑을 다시 올려야지
이런식으로 뛰어난 A와 B는 개속 보이지 않는 줄다리기 같은 싸움을 할것이다. 게임의 이론에 따르면 이런 싸움을 개속하면서 서로 발류뱃-블러핑 , 콜-폴드 비율을 상대에게 맞추어 나가면서 놀랍게도 불균형한 플래이를 추구하던 이 두명은 마지막에는 GTO로 플래이 하게되고 자연스럽게 서로 내쉬균형을 이루게 된다.
**** 위에 경우 A와 B가 서로 게임의 이론에 대한 지식이 없으면서도 결국에는 내쉬균형을 찾아내는 이유는 서로 실력이 뛰어난 선수들이고 상대의 불균형에 개속해서 맞추어 나가서이다. 만약 A는 고수인데 B가 피쉬 였다면 A는 B에 불군형한 점들을 개속 익스플로잇하고 B는 이에 대해 대응하지 못하고 서로 불균형하게 플래이하면서 B는 A에게 100년동안 돈을 조공했을것이다. ****
이렇게 불균형함을 추구하는 선수들끼리 오래 경쟁해서 내쉬균형을 자연스럽게 이룬 예를 들자면 스타크래프트를 생각할수 있다.
스타1이 처음 나왔을때는 수많은 전략들이 존재했다. 초반에 일꾼만 끌고가서 올인을 한다던가 토스가 테란 상대로 2게이트 질럿러쉬 라던지 많은 전략들을 사용했지만 막판에 가서는 모든 종족이 패스트 앞마당 전략 위주로 하게된다.
이런 저런 전략들을 서로 다 쓰다가 결국은 내쉬균형으로 패스트 앞마당 90%에 깜짝 전략10% 정도로 내쉬균형을 맞춘것이다.
이렇게 생각해보면 GTO와 불균형한 플래이는 서로 정반대가 아니다.
최고의 불균형한 플래이는 상대의 불균형함을 이용한 최적화로 밸런스된 플래이라고 할수있다.
그리고 그렇게 플래이하는 선수들이 경쟁하면 자연스럽게 내쉬균형을 이룬다.
GTO와 불균형한 플래이는 서로 정반대인것 같지만 마지막에는 같은것이된다.
게임의 이론은 배울수록 신기한것 같다.
_____________________________________________________________________________________________________________
상대의 불균형한 플래이를 이용해 익스플로잇 하는 방법.
예를 들어 3뱃에 평균적으로 70%이상 폴드하는 상대를 만나면 어떻게 할 것인가 ?
위에 말한 포커선수의 능력 두 가지를 이용하면 쉽게 답이 나온다.
1 , 상대는 일단 3뱃에 최적화보다 너무 자주 폴드하고 상대가 폴드하지 않았을때는 최적화보다 레인지에 강한핸드만 많이 들어 있고 블러핑이 없다.
2, 그러면 3뱃을 자주하고 상대가 4뱃으로 반항하면 나의 레인지에 최고핸드들(AA,KK 등등) 을 재외한 모든 핸드를 다 폴드한다.
********* AK에 관한 글을 몃번 읽었는데 "나는 3뱃하고 AK으로 올인하면 다 들 AA나 KK만 들고 있더라, AK은 프리플랍에서 올인하는 핸드가 아닌듯" 이런 글이 몃번 보였다. 일단 결론부터 이야기 하자면 말도 안되는 소리다. AK은 거의 모든 상황에서 기분좋게 3뱃하고 상대가 4뱃하면 아주 행복하게 올인하는 핸드다.
만약 니가 AK으로 올인하는데 상대는 절대로 AQ으로 콜하지 않고 AA,KK만 들고 있다면 너는 저 위에 예재처럼 익스플로잇 당하고 있는거다. 3뱃에 너무 자주 죽지말고 4뱃블러핑을 더 자주 하면 된다. 그러면 상대가 AQ이 아니라 AJ같은 핸드로도 너의 올인을 콜하게 되고 기분좋게 AK으로 푸쉬하는 법을 알게 될 거다. ****
이렇게 1 상대의 패턴을 분석하는 능력 , 2 그에 따라 최고의 플래이를 찾아내는 능력.
이 두 가지는 포커가 아니라 다른 모든 게임에서도 플래이어의 능력치를 평가하는 기준으로 사용된다.
그런데 위에 경우 3뱃에 너무 자주 폴드하는 상대에게 3뱃을 자주 해야 하는건 알겠는데
얼마나 자주해야 할까 ?
다시 가위바위보를 예를 들어 설명하겠다.
A와 B가 가위바위보를 한다.
이번에 A는 저번처럼 가위바위보에 초고수가 아니라 남자는 주먹 < -- 이런 단순한 생각에 주먹을 너무 자주내는 불균형한 플래이어다. 바위 50%, 가위 25%, 보 25%로 낸다.
그럼 B는 어떻게 해야 할까 ?
B의 기대값 계산
바위 : 승 25% , 패 25% , 비김 50%
가위: 승 25% , 패 50% , 비김 25%
보 : 승 50% , 패 25% , 비김 25%
보자기를 100% 내는게 최고다.
쉽게 답이 나왔다 ?
그렇지 않다. 만약 B가 보자기를 100%로 내기 시작하면 A가 바보가 아니라면 바위에 비율을 줄일것이다.
위에 3뱃 문재에서도 상대가 70%로 폴드하면 오픈할때마다 100%로 3뱃하는게 이득일거 같지만 이러면 상대는 눈치채고 반항하기 시작할거다.
포커를 포함한 모든 게임에서 최악의 플래이는 상대의 불균형함(약점)을 고쳐주는 것이다.
그러면 얼마나 자주 보자기를 내야하고 얼마나 자주 3뱃을 해야 하는가 ?
이번 문재는 나로서도 이것이 정확한 최적화 비율이다 라고 답해줄수 없다.
내가 할수 있는 최선의 답변은
상대의 불균형한 플래이에 맞추어 공략할때 상대가 자신의 불균형함을 파악하고 고치지 않을만큼만 익스플로잇해라
A가 바위를 무려 50%나 내면 B는 보자기만 내는게 맞는거 같지만 가끔식은 가위도 내서 저주고 해야 개속 익스플로잇 할수있다.
A가 얼마나 눈치가 빠르고 자신의 불균형함을 찾아 내는가에 따라 보자기40 , 가위 20 , 바위 20 이라던가
눈치가 정말 없고 생각하는게 부족하다면 아마 보자기 60 , 가위 20 , 바위 20 으로 해도 괜찮을 것이다.
위에 3뱃 예에서도 내가 할수있는 최고의 답변은 상대가 익스플로잇 당하고 있다는걸 느끼고 반항하지 않을 선 안에서 최대한으로 3뱃을 자주 하라는거다.
이것을 파악하는것도 포커플래이어의 능력이다.





