本地研究团队研发人工智能档案平台,能自动辨识海量历史照片中的建筑、地标和细节,帮助博物馆人员和文史学者更轻松地查找影像资料。
这项名为“人工智能档案”(Archival AI)的项目,夺得泛东南亚人工智能开发者挑战赛(Pan-SEA AI Developer Challenge)公共部门组别首奖。
数码发展及新闻部兼卫生部高级政务部长陈杰豪,星期五(11月28日)出席首届SEA-LION峰会,并为挑战赛四个组别——教育、金融、医疗和公共部门的首奖得主颁奖。
SEA-LION是“Southeast Asian Languages in One Network”(东南亚语言一体化网络)的缩写。它是由新加坡全国人工智能(AI Singapore)开发,专为东南亚量身定制,符合东南亚多元语言和文化语境的大语言模型。
目前,SEA-LION已共享超过1万亿个东南亚语种的标记数据,覆盖13种区域语言和方言,建立起贴合东南亚文化与语言特性的庞大数据库。
领导人工智能档案项目的新加坡国立大学中文系与日本研究学科助理教授杜琳受访时说,许多档案馆、博物馆都有丰富的历史照片馆藏,即便数码化存档,视觉图像也很难检索查找,或仅具备笼统的照片描述。
新平台借助SEA-LION的大语言模型,利用人工智能技术快速识别分析图片上的建筑、地标和细节,并生成年代、建筑风格等文字描述,再由专家学者做最终确认,形成数据库。
杜琳说:“接下来,我们希望与新加坡以及区域内的博物馆、美术馆和档案馆合作,免费开放平台供他们使用,从而让更多人更高效地浏览和使用馆藏。”
新加坡全国人工智能AI产品部高级总监张永习博士说,SEA-LION不只是建构大语言模型,更重要的推动实际应用。挑战赛正是为发掘能解决东南亚实际问题的创新项目,并提供资源与技术指导。
陈杰豪:东南亚数码经济2030年可达1万亿美元
陈杰豪致辞时说,东南亚拥有6.8亿人口,预计到2030年数码经济规模将达到1万亿美元(约1.3万亿新元),要充分发挥东南亚的巨大潜力,须培养精通领域专业知识和人工智能技术的专业人才。
他也说,区域须加强合作,共同推动有利于东南亚发展的解决方案。
