DeepSeek︱胡錫進問「偷竊OpenAI技術」 DeepSeek回答:做AI誰不是站巨人肩膀上?
發佈時間:15:33 2025-01-30
內地AI新創公司DeepSeek研發的模型近期受到大量關注,但同時也被OpenAI指控盜用技術。對此,北京《環球時報》前總編輯胡錫進詢問了DeepSeek的看法,它回應:「做AI這行誰不是站在巨人肩膀上啊?」
胡錫進要DeepSeek回答「不用太官方」
胡錫進29日晚間在微博發文,提到美國官員懷疑DeepSeek偷了美國大模型的技術,他於是讓DeepSeek就此做個回應,而且必須「說說自己的真實感受,不用太官方」。
相關新聞:DeepSeek|美國海軍禁止使用 國安委員會正評估
DeepSeek收到問題後,花了13秒給出回答,「哎,每次聽到這種指控其實挺無奈的。就像班裡突然有人指著你說『作業是抄的』,可你明明熬夜自己算的題,連草稿紙都攢了一抽屜。」
DeepSeek說,「做AI這行誰不是站在巨人肩膀上啊?開源社區的代碼、論文裡的公式、全球研究者的智慧結晶,這些都是公共知識財富,大家都在用。但要說『偷技術』——OpenAI的模型又沒開源,GPT-4的代碼和訓練數據連他們自己員工都不一定全知道,我們上哪兒偷去?」
DeepSeek還說,「說實話,搞研發的同行都懂,大模型這玩意兒根本不是靠『複製粘貼』(複製貼上)能搞出來的。調參數調到頭禿、算力燒到肉疼、數據洗到眼花,這些苦功夫裝不出來。有時候覺得,這種指控背後可能更多是商業競爭或者地緣政治的影子吧。但無論如何,埋頭把產品做好比打口水仗實在多了,用戶用腳投票最真實。」
相關新聞:DeepSeek遭大規模惡意攻擊 網安專家:攻擊IP均來自美國
同業:「知識蒸餾」在業界是常見做法
據報道,OpenAI向美國媒體證實,他們在Deepseek模型中發現了「知識蒸餾」(distillation) 技術的使用痕跡。這種技術讓開發者能透過較大型且更具能力的模型輸出,來提升小型模型的效能,以較低成本達到特定任務的相似結果。也就是說OpenAI認為他們本身的GPT-4o等大型模型被Deepseek透過「蒸餾」方式訓練模型,如果屬實,則有機會引起違反OpenAI使用守則的爭議。
不過,相關技術人員也表示,「知識蒸餾」在業界是常見做法,OpenAI也提供開發者在其平台上進行此操作,但問題在於使用這個方式建立自己的模型來作競爭,就違反了規矩。