[데일리비즈온 박종호 기자] 정치학자 로버트 액설로드는 미시건 대학교의 정책학과 교수로, 1980년대 당시 한창 인기를 끌던 '죄수의 딜레마' 문제에 대해 골몰하고 있었다. 그는 특히 반복적으로 죄수의 딜레마가 이어질 때, 어떤 전략을 취하는 것이 결과적으로 가장 성공적일지 (=죄수로서 가장 적은 합계 형량을 받게 될지) 고민하던 참이었고, 마침내 당시로서는 꽤나 첨단 장비였던 컴퓨터를 활용하여 모의 시뮬레이션 대회를 열기로 했다.

액설로드는 곧 세계 각지의 수학자, 정치학자, 경제학자, 심리학자, 국제관계학자, 군사 전문가, 게임이론 관련 권위자 등등에게 자신의 대회를 알리고 여기에 참여해 줄 것을 요청했다. 물론 우승자를 위한 상금도 걸었다. 참가자들이 해야 할 일은, 반복적 죄수의 딜레마 시뮬레이션에서 최고의 성과를 올릴 수 있도록 기획된 프로그램을 짜서 제출하는 것이었다.

이 게임은 협력, 혹은 배신의 양자택일을 반복하는 게임이다. 총 200회의 양자택일 결과 가장 높은 점수를 얻은 프로그램이 우승하는 구조다. 양쪽 모두 협력할 경우 각 3점, 한쪽 협력, 다른 쪽 배신엔 0점과 5점, 양쪽 모두 배반 땐 각 1점씩을 준다. 따라서 이론적으로는 200회 모두 나는 배신하고, 상대방은 협력하게 만들 수 있다면 1000점으로 우승이 가능하다. 하지만 200번씩이나 한 번도 빠짐없이 뒤통수를 내줄 멍청한 프로그램이 있을 리 없으니, 실질적으로는 어떻게 하면 적당히 협력하는 척 하면서 효과적으로 배신할 수 있는가에 초점이 맞춰졌다.

우승자는 토론토 대학교의 라파포트 교수가 주장한 '팃포탯' 프로그램이었다. 504.5점을 기록하며 1위를 차지했다. 팃포탯의 원리는 간단하다. 첫 번째 시행에서는 협력한다. 두 번째부터는 이전에 상대방이 취했던 선택을 그대로 따라한다. 그 간단힌 원칙이 의미하는 바는 다음과 같았다. 첫째, 반드시 협력하라. 둘째, 상대의 배반엔 반드시 응징하라. 셋째, 응징 후엔 용서하라. 넷째, 상대가 오해하지 않도록 잔머리 굴리지 말라.

팃포탯 프로그램은 2차 대회에서도 우승했다. 참가자들은 분명 1차 대회의 결과를 통해 "협력의 위력" 에 대해서 굉장히 주의를 기울였다. 재미있는 것은, 이들 중 상당수는 "그러니까 선량한 프로그램을 만들자" 가 아니라, "선량한 프로그램들을 적절히 등쳐먹자"의 결론을 도출했다는 점이다. 즉, 상대방이 보복할 가능성은 일단 염두에 두되, 상대방의 관대함을 최대한 이용해야겠다는 심보였다. 물론 그런 프로그램들은 일관되게 고득점에 실패했다. 오히려, 팃포탯에 수정을 가하면 가할수록 승률이 감소하는 현상까지 관측되었다.
 

 '협력의 진화'. 로버트 엑설로드 지음. 시스테마 출판, 정가 1만7000원. (사진=리디북스)

엑설로드는 이 죄수의딜레마 게임을 현실 사회의 적용으로 확장한다. 각 선택이 기억되고 그 결과가 어찌되든 게임은 계속된다는 점에서 우리네 삶과 유사한 점이 많기 떄문이다. 이때 각 플레이어들은 사람을 상징하며, 선택지는 그들이 삶에서 취하는 여러가지 행동을 상징한다. "배신"은 당장의 이익을 위한 이기적인 선택이 될 것이고, "협력"은 당장 양보하는 대신 신용을 쌓는 이타적인 선택이 될 수 있다. 어느 쪽의 결과가 장기적으로 유리할지에 대해서는 더 이상 언급할 필요도 없겠다.

김동연 전 경제부총리는 이 협력이론을 ‘사회적 자본’과 연결해 생각한다. 그는 선진국이 되기 위해 넘어야 할 문턱이 사회적 자본이라고 믿는다. 일상의 거래뿐 아니라 정치인의 공약, 정부정책까지도 한 번의 게임이 아니라 연속 게임으로 만들어야 협력과 신뢰가 생기고 결국 사회적 자본이 축적된다는 주장이다. 

로버트 엑설로드는 <협력의 진화>라는 책에서 이 같은 내용을 밝히며, 죄수의 딜레마를 해결하는 가장 좋은 방법은 결국 구성원들의 협력에 있다고 마무리한다. <이기적 유전자>의 저자인 도킨스 역시 “세계의 지도자들을 모두 가두고 이 책을 다 읽을 때까지 풀어주지 말아야 한다”고 말한다. 

저작권자 © 데일리비즈온 무단전재 및 재배포 금지