这是阿里巴巴首个针对特定地区的大型语言模型AI,东南亚被视为一个重要的增长市场,而大墨的新LLM则表明,中国企业仍在加倍努力,拥抱OpenAI的ChatGPT带来的生成式AI浪潮。
阿里巴巴集团控股有限公司(Alibaba Group Holdings)的研究部门达摩院(DAMO Academy)推出了为东南亚语言量身定制的人工智能(AI)大型语言模型(LLM),突显了该公司在更广阔地区拓展市场的雄心。
阿里巴巴研究院周一在一份声明中表示,在越南语、印度尼西亚语、泰语、马来语、高棉语、老挝语、他加禄语和缅甸语数据集上预先训练的东南亚LLM(Seallm)在语言和安全任务方面的表现优于其他开源模型。
这是阿里巴巴首个针对特定地区的法学硕士项目,东南亚被视为一个重要的增长市场。 例如,阿里巴巴的东南亚电子商务平台Lazada的目标是到2024年实现1000亿美元的营业额,在该地区拥有3亿消费者。
Seallm Chat 是 LLM 附带的微调聊天助手,旨在帮助使用 LLM 的企业与东南亚市场互动。
大莫的新法学硕士表明,中国公司仍在加倍努力,以应对OpenAI的ChatGPT去年带来的生成式人工智能浪潮。
截至今年7月,中国企业和研究机构共颁发了130个法学硕士,而所谓的"前100名车型之战"。
阿里巴巴的LLM“通义千文”于今年4月发布,截至本周二,它已在开源人工智能平台上"hugging face "在所有跟踪的模型中排名世界第四。
Hugging Face 的排名基于多种因素,包括科学知识、多任务处理准确性和常识推理。
Seallm 在非拉丁语任务中优于 ChatGPT 等其他 LLM,解释和处理非拉丁语文本的能力提高了 9 倍。
Seallm 在英语和资源匮乏的语言(用于训练 AI 对话系统的数据有限)(如老挝语和高棉语)之间的翻译方面也取得了更好的结果。
大莫语言技术实验室主任Bing Lidong表示,Seallm可以"拥抱东南亚丰富的文化",并补充说,创新将不可避免地赋予历史上在数字空间中代表性不足的社区权力。
分析人士表示,尽管中国拥有100多个语言学硕士学位,但中国人工智能市场仍面临美国芯片限制和缺乏杀手级应用等挑战,难以在瞬息万变的市场中吸引更多用户。