스타크래프트, 롤, 기타 전략시뮬레이션 게임에서는 고수와 하수가 구분된다.

지금부터 LLM의 트랜스포머 아키텍쳐의 원리를 바탕으로 고수와 하수는 어떻게 구분되는지 탐색해보자.

 

 

스타크레프트 게임 플레이어들 사이에는 근본적인 층위가 존재하며 그 단계는 다음과 같다.

 
  1. 게임의 기본 규칙을 습득하는 단계

게임의 기본 규칙을 습단하는 단계에서 초창기에 플레이어는 게임의 기본 규칙조차 알지 못하는 상태이다.  드라군의 사거리 업그레이드를 위해서는 사이버네틱스코어에서 업그레이드를 해야 한다던가. 하이템플러의 싸이오닉스톰을 더 많이 사용하기 위해서는 템플러 아카이브에서 마나 한계를 업그레이드 해야 한다던가.. 기타 게임 플레이에 필요한 정보가 절대적으로 부족하다.  심지어 포지를 건선해야 포톤케논을 설치할 수 있다는 정보조차 모를수도 있다.  상위 차원의 플레이를 위해서는 게임의 기본 규칙을을 습득하고 이해해야한다.
 

  1. 불완전 정보상황에서 최선의 의사결정을 도모하는 단계

스타크래프트 게임은 기본적으로 불완전정보 상황에서의 플레이이다. 이것은 모든 수의 정보가 공개되어 있는 ‘바둑’게임과는 다르며 맵의 상대방 위치와 상황은 기본적으로 일부만 공개된다.  따라서 플레이어는 상대방의 전략의 확률적으로 ‘추론’해야한다. 이 ‘추론’의 정확도는 반복적인 플레이를 톨해 개선된다.
 

  1. 대전 상대방과의 의사결정에서 전략적 승리를 도모하는 단계

스타크래프트 게임에서 승리를 위해서는 상대방과의 비교우위가 필요하다. ‘추론’이 얼마나 더 정교해젔는가에 의해서 게임의 승패는 결정되며, 이것은 플레이에서 흔이 말하는 ‘피지컬’과는 다른 개념이다.  

 

 

트랜스포머 아키텍쳐의 어텐션 매커니즘

 

2017년 구글브레인이 발표한 논문 ‘Attation is all you need’는 인공지능에 혁명적인 변화를 가져왔고 챗 GPT가 세상에 서비스를 시작할 수 있는 발판이 되었다.  그 핵심 개념은 다음과 같다.

 

‘문장을 생성할때는 토큰(단어)들 사이의 ‘관계’와 ‘중요도’를 먼저 한꺼번에 연산해야 하며, 이 연산은 학습을 통해 AI스스로 해야한다, 

 

이것은 언어의 ‘단어’로 한정되는 것이 아니며 다음과 같이 변환해서 생각해야한다.

 

‘정보를 분석할때는 정보들 사이의 관계와 중요도를 먼저 한꺼번에 연산해야 하며, 이 연산능력 또한 학습을 통해 스스로 획득해야한다.

 

트랜스포머 아키텍처는 LLM에 한정되는 개념이 아니며 모든 ‘정보’의 연산에 적용된다. 그래서 트랜스포머 아키텍쳐가 LLM의 기본 매커니즘을 넘어 테슬라 FSD에도 적용되고 있는 것이다. 


 

 

LLM은 왜 잉토를 못하는가?( 토큰연산 -> 명제연산 )

 

GPT나 제미나이, 혹은 클로드에게 잉토픽을 요청해본 사용자들은 LLM의 잉토픽이 형편없다는 것을 알고 있다. 잉갤의 불망들의 선택에 비교해서 LLM의 잉토픽은 승률이 확실하게 낮다. 그런데 잉토픽을 그렇게 그럴듯 하게 제공하는 LLM들의 잉토픽은 왜 그렇게 엉터리일까?

 

그것은 LLM의 기본 연산방식이 ‘단어’의 ‘중요도’와 ‘관계’를 분석할 뿐 ‘명제’의 ‘중요도’와 ‘관계’를 분석하는 방식이 아니기 때문이다.

 

 LLM은 최적의 단어를 추론하는 것이지 최적의 명제를 추론하는것이 아니다. 학습 자체가 ‘내기’를 통한 방식이 아니고 ‘단어’의 적합도를 평가하기에 ‘명제’들 사이의 ‘관계’나 ‘중요도’의 정보는 LLM의 파라미터 내부에 가중치로 저장되지 않는다.  

 

결론은 ‘명제’의 진리값을 추론할 근거( 명제들 사이의 ‘관계’와 ‘중요도’ )가 근본적으로 학습되지 않았다. 

 

고성능 추론머신을 만들어내기 위해 ‘내기’를 통한 학습은 아직 인공지능 산업에서 실험적인 단계이며, 적어도 지금 서비스되고 있는 LLM들은 ‘내기’를 통한 학습이 없다.

 

스타크래프트로 비유하자면 LLM은 스타크래프트와 관련한 많은 텍스트를 읽었지만 직접 플레이 해본적은 한 번도 없는 것이다. 아무리 많은 텍스트나 영상 정보를 학습한다 한들, 단 한번도 직접 플레이를 해보지 않았다면 그 사람의 스타 실력은 한계가 분명할수밖에 없다.  LLM은 그 한계에 갇혀있다. 그래서 LLM의 잉토픽은 형편없다.


 

 

스타크래프트에서 토큰연산과 명제연산

 

스타크래프트의 초보에서 고수가 되기 위해서는 토큰연산에서 명제연산으로의 도약이 필요하다.  스타크래프트의 기본적인 정보들을 모두 습득했지만 뛰어넘기 힘든 수준의 승률차이가 나타나는 근복적인 이유는 기초적인 정보의 부재문제가 아닌 ‘명제연산’ 정보의 부재문제이다.

 

스타크래프트 프로게이머인 임요환, 홍진호와 PC방 고수의 차이는 무엇인가? 그것은 포지를 건설해야 케논을 설치할 수 있다는 수준의 기본적인 정보차이가 아니다. 명제화된 정보들의 ‘관계’와 ‘중요도’ 연산력의 차이인 것이다.

 

PC방 고수정도 되면 기본적인 정보는 다 알고 있다. 그러나 ‘명제’들간의 ‘관계’와 ‘중요도’는 완전히 달라진다.

 

지금부터 스타크래프트 게임에서  ‘명제’들간의 ‘관계’와 ‘중요도’를 정리해보자.

 

명제A: 질럿의 공격력 1단계 업그레이드 VS 질럿 의 속도 업그레이드

명제A: 히드라 생산 VS 뮤탈리스크 생산

명제A: 엔지니어링 베이에서 마린 공경력 업그레이드 VS 배럭 추가 건설로 마린의 수량 확보

명제A: 아비터 트리뷰널 건설후 아비터 생산 VS 플릿비콘 건설 후 케리어 생산

 

위와 같은 명제들의 ‘관계’와 ‘중요도’는 인간의 언어로 ‘사전’정의될 수 없다.

 

명제연산은 사전 정의될 수 없으며 게임플레이 상황에서 확보된 모든 정보들 사이에서 즉각적으로 연산되어야 하며, 이 명제연산 능력이 바로 프로게이머와 PC방 고수의 차이이며 PC방 고수들 사이에서의 실력차이의 근본이 된다. 그리고 이것은 다수의 플레이 경험을 통해서만 게이머의 뉴런에 가중치로 끊임없이 저장된다. 

 

단순히 ‘포지를 건설해야 케논을 건설할 수 있다’는 정보는 토큰연산 학습만으로 획득 가능하지만, 명제연산은 직접 플레이 하지 않으면 획득할 수 없으며, 타인이 제시한 명제연산 과정을 읽는다고 해도 실제 플레이 상황에서 이 정보는 무의미하다. 그것은 트랜스포머 아키텍쳐의 어텐션 매커니즘과 유사하게, 해당 상황에서 모든 ‘명제’의 ‘관계’와 ‘중요도’가 한꺼번에 연산되어야 하기 때문이다. 

 

 

하수는 게임에 져도 그 이유를 모른다.

 

스타크래프트 게임방송을 여전히 즐겨보고 있다면 게임의 승패가 결정 되어도 그 해석이 동일하지 않다는 사실을 알고 있을것이다. 

 

그것은 상황의 ‘명제’화가 다르고, ‘명제’들 사이의 ‘관계’와 ‘중요도’가 모든이에게서 다르기 때문이다.  연산의 근본이 다르기에 결론이 다를 수 밖에 없다.  

 

왜 졌는가? 이것을 분석하기 위해서는 근본적으로 현실상황의 명제화가 가능해야한다.

 

명제화 = 현재 상황에서 가장 중요한 명제는 무엇인가?

 

명제화가 다르기때문에 왜 졌는가의 분석도 사람마다 다르며, 심지어 같은 프로게이머들 사이에서조차 승패의 원인에 대한 분석은 달라진다. 그리고 적절한 명제화를 위해서는 모든 명제들 사이의 ‘관계’와 ‘중요도’가 준비되어 있어야하다. 

 

만약 명제들 사이의 ‘관계’와 중요도 정보가 불충분할 경우 적절한 승패분석은 불가능하며, 일정 수준 이하에서는 왜 졌는지 전혀 엉뚱한 해석을 하게 된다. 

 

왜 졌는지 이해하고, 다음에 어떻게 해야하는지 판단하는 과정에서조차 많은 플레이 경험이 근본적으로 필요한 것이다. 

 

하수는 게임에 져도 생각이 바뀌지 않는다. 한동안은 그 원인이 오리무중이다.

 

 

정치라는 도메인에서 내기의 의미

 

2026년 현재 대다수의 사람들은 정치내기의 경험이 없다.  인터넷이라는 정보시스템이 등장하고 딴지일보, 서프라이즈, 다음아고라, 미권스(정봉주와미래권력들), DC정사갤, 일간베스트, 뽐뿌, MLB파크, 펨코정갤, 루리웹, PGR21, 보배드림 많은 정치 공론의 장이 있었지만. 그 어디에도 정치내기가 진행된적은 없다.

 

이것은 모든 정치 공론장에서 정치논의가 ‘명제연산’이 아닌 ‘토큰연산’이었다는 것을 의미한다. 모든 공간에서 정치를 그럴듯하게 말하는법은 학습할 수 있으나. 실제로 무슨 일이 벌어지고 있는지 명제화 하고, 그 ‘관계’와 ‘중요도’를 연산하는 것은 학습할 수 없다는 의미이다.

 

고성능 LLM 모델을 학습시키려는 빅테크 기업이 ‘정치’도메인을 학습하고자 할때, 학습데이터로 사용할만한 가치가 있는 컨텍스트가 존재한적이 있는가? 단언컨데 없다.  당신이 LLM 개발자라면 당연히 정치 커뮤니티가 아닌 언론사의 기사를 사용해서 모델을 학습시키려고 할 것이다. 이것은 틀림없다.

 

그런데 만약 정치내기가 진행되고, 그 데이터가 충분히 기록되고있는 공간이 있다면 어떨까? 당연히 정치도메인을 학습시키려는 LLM 개발자는 정치내기의 데이터를 최 우선적으로 학습시킨다.  오직 그곳만이 명제연산 학습이 가능하기 때문이다.  조선일보 정치기사나 한겨레신문 정치기사들은 그저 토큰연산 학습자료일 뿐이며 비교가 무의미한 수준의 학습데이터 차이가 발생한다.

최고의 스타크래프트 플레이어인 AI를 개발하고자 한다면 블리자드의 공식 설정집이 아니라 이영호, 김택용, 송병구, 이제동의 컨텐츠를 학습해야하는 것이다(내기의 형식으로). 

 

만약 서프라이즈에서 정치내기가 진행되어 왔고, 수만개의 내기의 명제들이 현실에서 추출되고, 수십만명의 사유가 이 명제들과 연결되어 있다면 이보다 중요한 정보는 존재할 수 없다.  만약 인터넷 정치커뮤니티 서프라이즈에서 정치내기를 하고 있었다면 독보적인 가치를 지니고 있는 것이고, 인터넷 공간에서 허무하게 사라져 버리지 않았을 것이다. 

 

서프라이즈에는 수십만명이 생산한 텍스트가 쌓여 있었음에도 불구하고, 그것은 그저 ‘토큰연산’자료에 불과하며, 궁극적으로 너무나 가치가 낮았기에 결국 사라져버렸다.


 

 

내기의 중요성을 인식하는데도 내기의 경험이 필요하다.

 

어떤 명제의 가치는 사전 정의될 수 없으며, 상황에 따라 다른 명제들과의 ‘관계’와 ‘중요도’를 한꺼번에 연산해야 도출이 가능하다.

 

‘정치내기를 하지 못하는 사람과의 정치논의는 무의미하다’

 

위 문장의 가치를 이해하기 위해서도 ‘내기’의 경험은 필수적이며

 

정치내기를 왜 해야하는지 이해하기 위해서도 ‘내기’의 경험이 필요하고,  정치내기에 졌을때 왜 졌는지, 무엇을 잘못 생각했는지 이해하기 위해서도 ‘내기’의 경험은 반드시 필요하다. 

 

정보의 ‘가치’와 ‘중요도’ 연산은 사전에 정의할 수 없으며 한꺼번에 스스로 해야한다는 것이 트랜스포머 아키텍쳐 어텐션 매커니즘의 기본 개념이다.