升级版AlphaGo Zero “自学三天”便完胜上一代

订户

发布 /

发布 / 2017年10月20日 3:30 AM

字体大小:

美国谷歌公司旗下的人工智能开发创新企业、英国Deepmind公司近日宣布，开发出了最新围棋软件AlphaGo Zero。它采取与自己反复对局的学习方法，仅训练三天便以100比0的战绩，完胜曾击败顶尖棋手的上一代AlphaGo。

共同社报道，AlphaGo的学习方法是利用棋手对局数据等“先人智慧”。新一代的Zero则是学习了围棋规则的电脑反复自我对弈，掌握获胜可能性高的下法、专攻“强化学习”是其主要特点。

由于不需要庞大的对弈数据，软件也变得更简洁，原本需要花费数月的训练时间也变得更短。

延伸阅读