新加坡提出全球首个生成式AI系统测试国际标准建议

资媒局局长黄子鹏在会上说，AI标准对整个生态系统至关重要，有助推动技术更大规模应用。“更重要的是，越来越多企业已看到制定AI标准的价值，并主动寻求认证。” （李冠卫摄）

新加坡提出全球首个针对生成式人工智能系统测试方法的国际标准建议，协助企业在采用相关技术时，减少不确定性。

资讯通信媒体发展局和新加坡企业发展局，星期一（4月20日）在本地主办国际标准化组织（ISO）和国际电工委员会（IEC）的人工智能（AI）分技术委员会全会，并在会上提出这项编号为ISO/IEC 42119-8的标准建议。

这项会议为期四天，首次在东南亚举行，吸引来自美国、英国、中国、日本、德国、法国及韩国等超过35个国家和地区、逾250名AI专家参与。

资媒局和企发局发文告说，新标准旨在为生成式AI系统，建立统一的测试框架，让测试结果经得起反复验证，也方便不同系统之间进行比较，从而提升业界和用户对AI系统的信心。

新标准主要围绕两种测试方法：基准测试（benchmarking），以及红队演练（red teaming）。

所谓“红队演练”，是通过模拟攻击，找出AI系统可能存在的漏洞和弱点，从而评估系统的安全性与应对能力。这类演练通常由模拟攻击的“红队”，与负责防御的“蓝队”共同进行。

我国近年来持续推动AI治理与标准化的措施，包括推出AI治理测试框架和工具箱“AI Verify”、大语言模型测试入门套件，以及全球AI保障沙盒等项目。同时，企发局推动ISO/IEC 42001在本地的采用。这些举措为我国在AI测试与认证领域积累经验，也为制定相关国际标准奠定基础。

ISO/IEC 42001于2023年12月推出，是全球首个可认证AI管理标准，帮助企业在发展AI的同时，更好地管控风险。

资媒局局长黄子鹏在会上说，AI标准对整个生态系统至关重要，有助推动技术更大规模应用。“更重要的是，越来越多企业已看到制定AI标准的价值，并主动寻求认证。”

新加坡人工智能技术委员会联合主席庄健恩受访时说，在不同科技公司各自采用不同技术标准的情况下，统一的AI标准，对重视营造亲商环境的新加坡尤其重要。

庄健恩也是毕马威（KPMG）新加坡的网络安全业务合伙人。他说，企业往往同时使用多家供应商的AI技术，如果各自做法不同、标准不一，容易造成不确定性，“企业一般都不希望面对这种情况”。

他指出，AI标准有助减少这种不确定性，让企业拥有更大的选择空间。

总部设在新加坡的AI安全与治理公司AIQURIS联合创始人兼首席技术官泽尔贝克（Martin Saerbeck）博士则说，AI国际标准的意义还在于不同领域之间的共通性。

“无论是汽车制造、医疗，还是娱乐、通讯或物流行业，所使用的AI技术往往相似，只是应用场景不同。”

最新