【本報記者報道】美國史丹福大學團隊承認人工智能(AI)Llama3-V模型,是抄襲中國清華大學與AI公司面壁智能的開源模型MiniCPM-Llama3-V2.5。Llama3-V兩名作者正式道歉,並會讓所有Llama3-V模型下架。
Llama3-V模型宣稱只需要500美元(折合約3,935港元),便可以訓練出一個性能可與GPT4-V媲美的模型。不過,隨後有網民發現,Llama3-V和中國模型MiniCPM-Llama3-V 2.5極度相似,後者是由中國初創企業面壁智能和清華大學自然語言處理實驗室所共同推出。
網民還在面壁智能GitHub的專案下放出了一系列證據。該網民表示:「這兩個模型的結構、程式碼、設定檔都一模一樣,只有變數名被替換了。」隨後,面壁智能首席科學家、清華大學長聘副教授劉知遠在知乎上回應:「MiniCPM-Llama3-V 2.5在研發時,內置了一個彩蛋,就是對『清華簡』的識別能力,而Llama3-V模型居然也有一模一樣的能力。」
Llama3-V團隊的兩位作者沙瑪和加格之後在社交網站上,向面壁的MiniCPM團隊正式道歉,並表示會將Llama3-V模型全數下架。阿克沙表示:「首先,我們要向MiniCPM原作者道歉。我、沙瑪,以及穆斯塔法一起發布了Llama3-V,穆斯塔法為這個項目編寫了代碼,但從昨天起就無法聯繫他。未被告知或意識到OpenBMB(清華團隊支持發起的大規模預訓練語言模型庫與相關工具)之前的任何工作。對所發生的事情承擔全部責任,並已撤下Llama3-V,再次致歉。」 |
您可能有興趣:
|