我国开发的大型语言模型SEA-LION犹如“本土导游”,是符合东南亚丰富文化背景和语言的生成式人工智能,能更准确反映区域的语境,可帮助不同机构开发专属的人工智能模型。
SEA-LION是新加坡去年推出的专为东南亚量身定制的大语言模型,以东南亚语言为基础,进行训练。
数码发展及新闻部长兼内政部第二部长杨莉明星期一(9月9日)参加彭博举办的针对亚细安企业的峰会(Spotlight on Asean Business: Charting New Frontiers Summit)时指出,SEA-LION由新加坡全国人工智能核心的工程师和科研人员从零开发。
在东南亚约6.5亿的人口中,各地使用的语言约有1200种。杨莉明说,目前其他开源大型语言模型在这方面的代表性不足。这意味着,这些模型对东南亚的理解并不充分,对区域的细微差别与多元文化的反映也不全面。SEA-LION因此能辅助其他大型语言模型,帮助各机构开发专属的人工智能模型。
杨莉明也将SEA-LION比作“本土导游”,并解释道,当我们到访一个国家时,可能会想找个导游,以更好了解这个地方。
“如果有选择,你会更倾向于选择本土导游,还是一个国际导游?这并不是要比较哪种导游更好,而是在于你希望怎么去认识那个国家。因此,选择本土导游无疑会带来独特的好处。”
SEA-LION也将推进新加坡实现成为区域人工智能枢纽的目标。杨莉明再打比喻解释,虽然新加坡航空公司不是唯一使用樟宜机场的航空公司,但它是与区域联系紧密的顶尖航空公司。政府希望SEA-LION能发挥同样作用,与其他语言模型互补共融。
