자녀들이야기

[스크랩] 전략적 상황에서의 최적결정 - 게임이론

명호경영컨설턴트 2009. 1. 4. 09:19
과거 연애문제에 대한 글들을 쓰면서 게임이론을 많이 이용하였었다. 그런데 게임이론이 무엇인지 게임이론에 관한 기초적인 설명은 하지 않은 관계로 오늘 글을 쓰게 되었다. 오늘의 글은 개념정리차원이라고 생각하시면 좋으실 것 같다.
 
게임이론이라 하면 많은 분들이 게임과 관련된 이론으로 생각을 한다. 게임이론 (game theory)은 전략적 상황에서의 최적결정을 하는 방법을 설명하는 이론이다. 당신이 지금 어떤 결정을 해야 하는 상황이라고 가정하자. 그리고 다른 사람들도 어떤 결정을 해야하는 상황이라고 생각해보자. 이때 당신이 생각하기에 최적의 결정이 다른 사람들의 결정에 의존한다고, 즉 영향을 받는다고 하자. 게임이론은 이러한 상황에서의 최적선택을 결정하는 이론이 되겠다. 한 측면에서는 결정주체가 여러명일 경우의 선택을 하는 방법이고, 다른 측면에서는 전략을 선택하는 이론이 되겠다. 결과적으로 게임이론은 한 경기자의 전략적 행동에 대해 자신의 전략을 선택, 조정하는 의사결정이론이다.
 
그렇다면 게임이론의 구성요소를 살펴보도록 하자. 먼저 게임이 무엇인지부터 살펴보도록 하자. 게임(game)은 한 경기자의 전략적 행동이 다른 경기자의 전략에 영향을 미치는 상황을 의미한다. 이제 구성요소를 살펴보자. 게임이라는 것이 구성되기 위해서는 게임에 참여하는 사람이 있어야 할 것이다. 이를 경기자(player)라고 한다. 게임이론에서의 경기자는 게임에서 의사를 결정하는, 전략을 선택하는 주체 혹은 단위로 정의된다. 두번째 행동 (action, movement)이다. 행동은 경기자가 게임중에 행하는 선택을 의미한다. 세번째로 전략 (strategy)이다. 전략이란 경기자가 게임중에 하는 행동에 대한 기준 혹은 원칙으로 정의된다. 한마디로 표현하자면 행동계획이 전략이다. 그런데 전략은 완전한 행동계획 (complete plan of action)으로서의 의미를 지닌다. 무슨 뜻이냐면 상대가 어떻게 행동하는지 봐가면서 행동하겠다는 뜻으로 처할 수 있는 모든 상황을 고려하여 행동계획을 세운다는 의미이다. 네번째로 보수 (pay-off)이다. 보수는 각 경기자가 전략을 책하여 최종적으로 경기가 종료되었을 때 얻는 이익 혹은 효용의 크기이다. 보수는 화폐적인 보수가 주류를 이루지만, 심리적인 보수도 포함된다. 심리적인 보수도 포함된다는 것을 기억하도록 하자. 다섯번째로는 균형(equilibrium)이다. 게임이론에서 균형이란 각 경기자의 보수를 극대화하는 전략의 배합을 의미한다.
 
마지막으로 자연(nature)이다. 이는 책에 따라서는 신(God)으로 표현된 것도 있다. 과거에는 신이라 표현된 것이 많았으나, 최근의 책들은 주로 자연이라는 표현을 많이 쓴다. 게임이론에서 자연이란 경기자의 유형과 성질을 결정하고 게임의 진행방향을 결정해주는 비경기자를 의미한다. 이는 이론적으로 중요한 역할을 한다. 만약 완전정보를 가정할 경우, 즉 게임에 참여하는 사람들이 게임이 어떻게 돌아가는지 완전하게 알고 있다는 것을 가정할 경우에는 이 개념이 필요가 없지만, 상대방의 정보를 모르는 불비정보게임을 할 경우에 불비정보게임을 경기자가 선택하는 전략의 정보를 모르는 불완전정보게임으로 만들어주는 역할을 한다. 신이라는 개념을 이렇게 이해하면 편할 것이다. 길 잃은 어린 양에게 신이 길을 인도해주는 것을 생각하면 쉽게 이 개념을 이해할 수 있을 것이다.
 
그렇다면 게임이론에서의 정보집합(information set)에 관한 내용을 확인해보도록 하자. 우선 완전정보(perfect informaion)가 무엇인지부터 살펴보자. 완전정보게임란 경쟁자가 선택할 전략을 알고 있는게임이다. 이를 전에 논의한 바 있는 게임트리 (game tree)와 연결시키면 완전정보게임에서는 정보집합이 하나의 의사결정마디로 되어 있게 된다. 그러나, 불완전정보게임에서는 여러개의 정보마디로 되어있게 된다.
 
그렇다면 불완전정보게임(imperfect information game)이란 무엇일까? 지금까지 논의한 대부분의 내용은 모든 정보가 완전하게 주어져 있다는 전제하에 진행되었었다. 왜 이런 상황이 현실적으로 발생하는 것일까? 우선 두 경기자가 동시에 선택을 하는 경우를 생각해 볼 수 있을 것이다. 두번째로 한 사람이 먼저 선택을 하기는 했지만, 어떤 선택을 했는지 알 수 없는 경우도 있을 것이다. 이와 같이 상대방이 어떤 선택을 했는지 모르는 상태에 있는 경기자가 존재하는 게임을 불완전정보게임이라고 한다. 경제학적으로는 최소 하나의 경기자가 경쟁자의 선택, 유형 (type), 전략 등을 모르는 상태에서 자신의 전략을 선택하는 게임으로 정의된다.
 
이번에는 조금은 다른 경우를 생각해보자. 한 어리버리한 사람을 생각해보자. 너무나 어리버리한 나머지 자신이 하는 행동이 무엇인지도 몰라서 자신이 선택한 결과가 어떤 상황을 초래할지 전혀 생각하지 못한다고 생각해보자. 이렇게 경기자가 게임의 내용을 완전히 이해하지 못한 채 게임에 참여하는 경우가 얼마든지 생길 수 있을 것이다. 이러한 경우를 경제학에서는 불비정보게임 (incomplete informartion game)이라고 한다. 경제학적으로는 보수구조를 알지 못하는 게임으로 정의된다. 
 
게임트리를 이용하여 설명드리자면, 불완전정보게임의 경우 각 경기자는 상대방이 어떤 선택을 했는지 모르고 있으므로, 자신이 게임트리에서 어느 위치에 있는지 모르는 것이라 보면 되고, 불비정보게임의 경우 경기자가 게임트리가 어떻게 생겼는지 잘 모른다는 차이가 생긴다. 앞서 이야기한 자연을 도입하면 불비정보게임은 불완전정보게임으로 전환이 가능하다. 이때 자연의 역할은 각 경기자의 유형을 결정하여 주는 것이 되겠다.
 
마지막으로 게임이론의 가정을 살펴보도록 하자. 게임이론은 경기자들이 모두 합리적 (rational)하다고 가정을 한다. 이를 합리성 가정이라고 한다. 무슨 뜻이냐면 모든 경기자들은 주어진 상황에서 주어진 정보를 가지고 능력, 시간 등 제약조건을 고려하여 최선의 결정을 하려한다는 뜻이다. 여기서 학생들이나 경제학 초보자들이 흔히 저지르는 실수가 하나 있다. 합리성 가정안에 완전정보의 가정이 포함되는 것으로 오해하는 것이다. 합리성 가정내에 완전정보의 가정은 포함되어 있지 않다는 점을 기억하도록 하자. 합리성 가정의 내용을 좀더 살펴보도록 하자. 합리성 가정에는 이러한 뜻도 포함되어 있다. 사후적으로는 비합리적일지라도 결정할 당시에 최선의 결정이고 합리적이면 된다는 것이다. 이 내용은 매우 중요한 내용이다. 존 내쉬 (John Nash)가 노벨상을 받은 것도 이를 증명했기 때문이다. 이와 관련된 내용은 "용의자의 딜레마"이야기를 하면서 하도록 하자.
 
이번에는 합리성 가정에 게임구조 가정을 접목시켜 보도록 하자. 이는 합리성이란 상식 (common knowledge)라는 것을 의미한다. 상대방이 합리적이라는 것을 다른 상대방도 한다. 이 사실을 상대방도 안다는 사실을 안다. 이러한 명제가 연쇄적으로 계속 반복된다는 것이다. 이는 어떤 의미를 가지냐면 합리성에 대해 티클만큼의 의심도 가지지 않고 있다는 뜻이 된다. 여기서 잠깐, 특이한 경우도 한번 살펴보도록 하자. 당신이 비합리적인 행동을 하고 있다. 그런데 당신은 지금 시점에서 비합리적이라는 평판을 얻는 것이 장기적으로 합리적인 행동이라는 것을 안다고 하자. 그렇다면 지금 시점에서 합리적인 선택을 하는 것이 합리적일까? 비합리적인 행동을 하는 것이 합리적일까? 답은 이
출처 : Rage Against the Machine
글쓴이 : 기계에 대한 분노 원글보기
메모 :