麻将号称中国国粹,如今麻将界出现了新一代“麻将之神”,不过它不是人类而是一套由微软(Microsoft)亚洲研究院开发的人工智能系统(AI)——Suphx(超级凤凰)。
Suphx今年3月加入日本知名专业麻将平台“天凤”,跟人类高手进行了5000余场激烈对局,并于6月取得最高的十段位。自天凤平台在2006年推出以来,曾经达到十段的选手约有180位,而现役十段的人类选手也只有十几位,因此Suphx实力已经超越了多数人类,非常了不起。
微软全球资深副总裁洪小文接受《联合早报》电邮访问时说,麻将不仅历史悠久,在全球流行,对不少华人来说更是日常生活的一部分。
“与战略类电子竞技游戏不同,操控键盘的技巧、出招快慢等不会对麻将的胜负产生影响。换言之,选择麻将可以把不必要的人和机器差别抹掉,聚焦在智慧、智能的部分。作为一个研究机构,微软亚洲研究院对于解决难度大、能考察AI真正智能的任务有很大的兴趣,所以就很自然的选择了对麻将AI进行研究。”
团队不谙麻将
有4名研究人员和两名实习生参加了这个研究项目,但有趣的是,他们几乎都不会玩麻将,而是从机器学习的视角去打造麻将AI。他们看不懂Suphx的策略和招数,因此须要通过专业麻将玩家的点评来更好地理解Suphx。
研究人员在过程中主要面对了巨大状态空间,非完美信息游戏,日本麻将复杂的奖励机制等三大挑战。
巨大状态空间指的是麻将有136张牌,排列组合可能性很多。此外,四位玩家的出牌顺序是不固定的,任何玩家的“吃碰杠”都能使出牌顺序突然改变,导致游戏树不规则,且动态变化。
日本麻将有复杂的“役种”和“番数”计算规则,有时麻将高手还会策略性输牌,以影响对手的排名,为麻将AI带来了额外挑战。
象棋和围棋属于完美信息游戏,玩家可以看到棋局中对方玩家的落子。麻将则属于非完美信息游戏,存在大量隐藏信息。对一个玩家而言,他只知道自己手里的13张牌和之前已打出来的牌,却无法知道别人的手牌和没有翻出来的底牌,所以最多可以有超过120张未知牌,这么多未知信息使麻将的难度非常高。
洪小文也是微软亚太研发集团主席兼微软亚洲研究院院长。他解释:“在这种挑战下,仅靠算力无法根本解决问题,麻将AI须要更强的直觉、预测、推理、和模糊决策能力。”
团队尝试新算法
为了让Suphx高效地学习麻将的复杂状态和策略,研究员针对麻将的特点与难点尝试了一系列基于强化学习的新算法,希望通过技术层面的创新,让Suphx具备有效的状态表达机制和强大策略学习能力,同时具有大局意识,能从游戏的全局角度做出策略性判断,确保总分领先。
研究团队对于Suphx取得的成绩感到非常高兴,但他们研究麻将AI的最终目的不是为了打败人类,而是希望从中可以探索及扩展AI算法的边界,并提升AI在现实环境中解决复杂问题的能力,推动其创新发展。
洪小文说:“麻将中的复杂策略和带有随机性的博弈过程更贴近人类真实而复杂的生活。AI在其中的突破将有助于解决现实生活中的复杂问题,如智能交通、金融投资等都存在大量未知信息,易受到随机突发状况影响,并存在对方博弈的领域。”
他透露,研究团队将不断精进算法,之后会把Suphx的技术总结成为一篇论文,与业界分享。
