新加坡《亚洲经济报》让世界了解亚洲的进展
  投资人专注
拉美国家 语言大模型要来了
来源:经济日报 百度 图 | 作者:亚洲经济报 | 发布时间 :2025-09-27 | 412 次浏览: | 分享到:
拉美地区迎来人工智能领域的重大喜讯——由智利国家人工智能中心主导、巴西深度参与,阿根廷、哥伦比亚、墨西哥、秘鲁等国共同研发的Latam-GPT测试版,将于10月正式发布。这款专为拉美历史、文化及语言多样性量身打造的大型语言模型LLM,一经问世便引发全球广泛关注。


主流模型局限凸显,拉美AI需求待满足


目前,全球主流语言模型多基于英语语料构建,对非英语使用人群的需求考虑严重不足。在处理高度本地化问题时,这些模型表现欠佳,导致占全球人口超8%的拉美地区难以充分享受人工智能技术带来的红利。


智利科技知识和创新部部长艾森·埃切韦里指出,人工智能应向世界展现“我们自身的多样性”。以拉丁美洲为例,合格的人工智能产品不仅要精通西班牙语或葡萄牙语,更要深入理解当地的特质。


数据来源与开放:扎根本土,确保优质


在训练数据方面,Latam-GPT摒弃全球商业大模型常用的“网络爬虫抓取”模式,转而与本地大学、图书馆、政府机构等展开深度合作,获取大量难以在线上获取或尚未数字化的珍贵数据,如历史文献、学术文本和口述历史等。这一举措确保了模型内容的本地化与高质量。



语言文化理解:精准捕捉,尊重差异


在语言文化理解上,Latam-GPT虽以西班牙语、葡萄牙语和英语为基础,但高度重视捕捉拉美地区独特的语言习惯、历史脉络和文化语境。通过精细的本地化训练,模型能够准确识别特定地域的表达方式。例如,“torta”一词在智利意为三明治,在墨西哥则指蛋糕,Latam-GPT能够精准区分。


泛区域协作模式:开源共享,激发创新


Latam-GPT采用可修改的开源模式,允许区域内企业和开发者自由使用、修改和分发。这一模式摆脱了对昂贵许可和“一刀切”解决方案的依赖,有助于激发本地创新,推动形成基于泛区域协作的人工智能生态。



守护文化遗产:AI变身数字卫士


值得一提的是,Latam-GPT十分关注拉美文化遗产的保护与传承。目前,该模型已将智利拉帕努伊语和马普敦贡语纳入试点计划,旨在为这些语言构建数字知识库,支持语言复兴与文化延续。专家评价称,此举将人工智能从单纯的技术工具提升为文化遗产的“数字卫士”,为全球人工智能应用开辟新方向。


备受期待:技术突破与数字主权宣言


尽管尚未正式发布,但Latam-GPT已获得拉美业界的高度期待。Latam-GPT不仅是一项技术突破,更是一份维护数字主权的“宣言”。它使拉美地区从先进技术的被动消费者转变为主动参与者,在一定程度上掌握了本土化人工智能技术发展的主导权。此外,Latam-GPT对计算基础设施的强大需求,或将产生积极的连锁反应。训练该模型所需的强大算力,有望反向推动区域内超算中心和数据中心的建设与升级。


挑战犹存:发展之路任重道远


然而,拉美人工智能产业在蓬勃发展的同时,也面临诸多挑战。整体而言,该产业尚处于起步阶段,与发达国家存在明显差距,主要体现在数字基础设施建设滞后、数字鸿沟现象突出、人工智能监管缺失以及应用程度不高等方面。


拉美地区内部发展也不均衡。智利、巴西和乌拉圭在人工智能应用方面发展较快,其他国家则相对滞后。此外,投资不足也是制约该地区人工智能产业发展的关键因素。据美洲开发银行(IDB)数据显示,拉丁美洲在人工智能研发上的投入不到其GDP的0.5%,远低于发达经济体2%至3%的平均水平。