美国谷歌公司旗下的人工智能开发创新企业、英国Deepmind公司近日宣布,开发出了最新围棋软件AlphaGo Zero。它采取与自己反复对局的学习方法,仅训练三天便以100比0的战绩,完胜曾击败顶尖棋手的上一代AlphaGo。
共同社报道,AlphaGo的学习方法是利用棋手对局数据等“先人智慧”。新一代的Zero则是学习了围棋规则的电脑反复自我对弈,掌握获胜可能性高的下法、专攻“强化学习”是其主要特点。
由于不需要庞大的对弈数据,软件也变得更简洁,原本需要花费数月的训练时间也变得更短。
请订阅或登录,以继续阅读全文!