11月27日,阿里云官方公众号披露,新加坡国家人工智能计划近期推出了一款名为Qwen-SEA-LION-v4的东南亚多语言大模型,其核心技术底座依托阿里巴巴的“通义千问”开源模型搭建而成。
IT之家从官方介绍了解到,这款由中新合作开发的模型,很快就在“东南亚语言模型全面评估基准”(SEA-HELM)的开源模型榜单(参数量2000亿以下)里位居榜首。
东南亚地区的语言种类超过1200种,日常交流里常常出现多种语言混用的复杂情形,可全球主流的AI模型大多围绕英语构建,没办法高效地服务本地市场,由此造成了显著的“AI鸿沟”。这次合作的目的就是这个长期阻碍当地AI发展的难题。现在,Qwen-SEA-LION-v4模型已经通过AISingapore官网和HuggingFace开源社区向全球免费开放下载。
Qwen3模型在预训练阶段就已覆盖119种语言,为理解东南亚小语种奠定了基础。通义千问团队还在后训练过程中加大了跨语言训练任务的比重,以便更好地应对现实世界里的多语言混合输入场景。