我国发布大语言模型测试工具 检测含暴力等不良生成内容

通讯及新闻部长兼内政部第二部长杨莉明在新加坡亚洲科技会展的ATxSummit活动上致辞时宣布新加坡推出“登月计划”(Project Moonshot),全球首个大语言模型测试工具之一。(白艳琳摄)
通讯及新闻部长兼内政部第二部长杨莉明在新加坡亚洲科技会展的ATxSummit活动上致辞时宣布新加坡推出“登月计划”(Project Moonshot),全球首个大语言模型测试工具之一。(白艳琳摄)

字体大小:

新加坡推出全球首个大型语言模型测试工具之一,能够检测到含有暴力、煽动仇恨等不良生成内容,从而帮助正在开发相关模型和应用的公司进行发布前的内测与调整。

通讯及新闻部长兼内政部第二部长杨莉明星期五(5月31日)上午在新加坡亚洲科技会展(Asia Tech x SG)的亚洲科技峰会(ATxSummit)活动上致辞时宣布,新加坡推出“登月计划”(Project Moonshot),全球首个大语言模型测试工具之一。

杨莉明说,该计划将我国个人工智能验证系统AI Verify的工具从传统人工智能扩展到生成式人工智能领域,旨在应对与使用大语言模型相关的安全挑战,

她指出,登月计划是世界上首个用于生成式人工智能的开源工具之一,它将基准测试(benchmarking)、红队演练(red teaming)和测试基线(testing baselines)等网安测试技术整合到同一个通用平台。

她提到,新工具可以用于测试基础人工智能模型和相关应用。它可以帮助正在构建人工智能的机构更轻松地进行测试,并比较结果,从而找出可改善和修复的弱点。

资讯通信媒体发展局商业科技组合副组长郑钧元指出,当局与新电信、淡马锡、机器学习平台DataRobot等合作,为这个新测试工具提供使用反馈和建议。

“登月计划”于公布当天进入公开测试阶段。

郑钧元在展示环节以红队演练为例解释说,新测试工具涵盖人工智能模型的功能与风险两个维度,通过专业人士扮演骇客,对大语言模型发送含有不良信息的内容,测试它的回应。

在人工智能治理方面,新加坡也计划扩大模范人工智能治理框架,将生成式人工智能纳入其中。

杨莉明也指出,该框架将延续人工智能治理上注重整个生态系统的特点,并列出决策者应全面考虑的九大方面,包括数据训练管理、网安袭击通报等,将一些建议转化为具体行动。

她强调:“良好的治理不是创新的敌人。相反,良好的治理能够促进持续创新。”

LIKE我们的官方脸书网页以获取更多新信息