【本报记者报道】美国史丹福大学团队承认人工智能(AI)Llama3-V模型,是抄袭中国清华大学与AI公司面壁智能的开源模型MiniCPM-Llama3-V2.5。Llama3-V两名作者正式道歉,并会让所有Llama3-V模型下架。
Llama3-V模型宣称只需要500美元(折合约3,935港元),便可以训练出一个性能可与GPT4-V媲美的模型。不过,随后有网民发现,Llama3-V和中国模型MiniCPM-Llama3-V 2.5极度相似,后者是由中国初创企业面壁智能和清华大学自然语言处理实验室所共同推出。
网民还在面壁智能GitHub的专案下放出了一系列证据。该网民表示:「这两个模型的结构、程式码、设定档都一模一样,只有变数名被替换了。」随后,面壁智能首席科学家、清华大学长聘副教授刘知远在知乎上回应:「MiniCPM-Llama3-V 2.5在研发时,内置了一个彩蛋,就是对『清华简』的识别能力,而Llama3-V模型居然也有一模一样的能力。」
Llama3-V团队的两位作者沙玛和加格之后在社交网站上,向面壁的MiniCPM团队正式道歉,并表示会将Llama3-V模型全数下架。阿克沙表示:「首先,我们要向MiniCPM原作者道歉。我、沙玛,以及穆斯塔法一起发布了Llama3-V,穆斯塔法为这个项目编写了代码,但从昨天起就无法联繫他。未被告知或意识到OpenBMB(清华团队支持发起的大规模预训练语言模型库与相关工具)之前的任何工作。对所发生的事情承担全部责任,并已撤下Llama3-V,再次致歉。」 |
您可能有兴趣:
|