DeepSeek「開源周」點燃大模型開閉源之爭

中國經營網
2025/03/08

  DeepSeek 近期舉辦的「開源周」,宛如一顆重磅炸彈,在全球AI領域激起千層浪。然而,DeepSeek「開源周」帶來的影響遠不止技術層面,它如同導火索,引發了大模型開源與閉源之爭這一行業熱議話題。在大模型領域,開源與閉源一直是兩種不同的發展路徑,各有擁躉,而DeepSeek的開源舉動,讓這場爭論更加激烈。

  需要指出的是,無論是開源還是閉源,其最終目標都是推動大模型技術的進步和應用落地。而開源、閉源之爭,背後不僅關乎技術的發展路徑,更涉及商業利益、數據安全、隱私保護等多個層面的博弈。《中國經營報》記者在採訪中了解到,支持開源者認為開源能夠促進技術共享與創新,吸引全球開發者共同參與,形成繁榮的生態系統;閉源的擁躉則擔憂開源可能導致技術失控,企業難以實現商業變現,影響技術的持續投入與發展。

  陣營

  在大模型的發展進程中,開源與閉源宛如兩條截然不同的岔路,各自引領着獨特的發展方向。這兩種模式在技術創新、商業應用、生態構建等多個層面存在着顯著差異,也都有着各自的特點與優勢。

  開源模式,簡單來說,就是將軟件的源代碼公開,允許任何人使用、修改和分發。在大模型領域,開源模式的典型代表有DeepSeek以及Meta的Llama系列。

  DeepSeek在「開源周」期間「火力全開」,連續開源五個代碼庫,涵蓋訓練、推理、通信等大模型開發的關鍵環節。從針對Hopper GPU優化的高效MLA解碼內核FlashMLA,到首個用於MoE模型訓練和推理的開源EP通信庫DeepEP,再到支持稠密和MoE模型的FP8計算庫DeepGEMM,以及優化並行策略DualPipe和EPLB,還有為應對人工智能訓練和推理工作負載挑戰而設計的3FS(Fire-Flyer File System)並行文件系統。

  DeepSeek開源的一系列代碼庫,可以讓全球的開發者都能夠基於這些代碼進行二次開發和創新。這種模式極大地促進了技術的創新,因為衆多開發者可以共同參與到項目中,發揮各自的智慧和創造力,從不同角度對代碼進行優化和改進。

  閉源大模型則是由特定的組織或公司開發、擁有並維護其源代碼、數據集和技術細節的不對外公開的模型。這種模型就像一座堅固的技術堡壘,保護着開發者的知識產權和商業利益。

  在AI發展的早期階段,閉源模式憑藉其對核心技術的嚴格把控,在行業中佔據着主導地位。以OpenAI為例,它通過投入大量的資金與頂尖人才,打造出如GPT系列這樣的領先模型。這些模型的源代碼被嚴格保密,僅在內部團隊中進行開發與優化。OpenAI利用閉源模式,不僅實現了技術上的快速迭代與領先,還通過商業合作、API授權等方式,將其技術轉化為巨大的商業利益。許多企業為了獲得先進的自然語言處理能力,不得不向OpenAI購買API服務,這使得OpenAI在商業上取得了巨大的成功,也鞏固了閉源模式在行業中的地位。閉源模式還能夠保證技術的安全性和穩定性,企業可以對技術進行全面的測試與驗證,避免因開源帶來的潛在風險。

  衝擊

  DeepSeek「開源周」的成功,讓行業內的巨頭們不得不重新審視自己的開源閉源策略。百度作為國內AI領域的重要力量,此前一直是閉源路線的堅定支持者。百度創始人李彥宏曾多次強調閉源的優勢,在「Create 2024百度AI開發者大會」上,他直言「開源模型會越來越落後」;在「2024世界人工智能大會」期間,李彥宏更是表示「開源其實是一種智商稅」,他認為閉源模型比開源模型更強大,推理成本更低。

  然而,DeepSeek的爆火出圈打破了這一局面。作為開源路線的堅持者,DeepSeek的成功被認為是開源模型的勝利。在這種形勢下,百度宣佈將在未來幾個月中陸續推出文心大模型4.5系列,並於6月30日起正式開源,還宣佈文心一言將於4月1日0時起全面免費。

  李彥宏在公司2024年第四季度財報電話會上表示,生成式AI基礎模型市場仍處於初期階段,但發展速度非常快,DeepSeek的成功無疑會加快基礎模型的應用速度,因為基礎模型變得更易獲取且成本更低。他認為將最為優秀的模型開源,能夠極大地促進應用,當模型開源後,人們出於好奇自然會去嘗試,這將擴大模型在更多場景中的影響力。

  OpenAI同樣受到了DeepSeek開源的衝擊。OpenAI前不久推出全新推理模型o3-mini,並首次向免費用戶開放推理模型。OpenAI首席執行官山姆·奧特曼在活動中罕見承認OpenAI過去在開源方面一直站在「歷史錯誤的一邊」,表示「需要想出一個不同的開源策略」。他稱DeepSeek是「一個很好的模型」,並表示OpenAI將生產更好的模型,但與往年相比,領先優勢更少。OpenAI首席產品官凱文·威爾也表示,正在努力展示比今天更多的內容,考慮是否開源較舊的AI模型,以適應市場變化並保持競爭力。

  天使投資人、人工智能專家郭濤表示,DeepSeek開源後,閉源企業面臨着更大的技術追趕壓力。開源展示的先進技術使閉源企業原有技術優勢不再凸顯,它們需要投入資源搞懂開源代碼原理並汲取長處,同時維持自身封閉體系下的特色功能。這導致閉源企業面臨雙重研發任務,時間緊迫。為了應對這一挑戰,閉源企業可能需要改變策略,他們可能會加大基礎研發投入,補齊短板,確保技術不落後。

  爭論

  開源與閉源策略的選擇,對大模型廠商的資金投入、技術發展方向以及外界關注的大模型商業化實施進程具有決定性影響。此外,該選擇亦會對大模型市場的競爭格局產生深遠影響,關乎未來數年的市場發展趨勢。行業內的「大佬」也針對大模型的開源閉源展開脣槍舌劍。

  360集團創始人周鴻禕,是一位堅定的開源倡導者,他以互聯網的發展歷程為證,強調沒有開源就沒有Linux,而沒有Linux就沒有如今蓬勃發展的互聯網。在他看來,開源意味着打破一切界限,無論國家、種族、企業規模大小,只要對人工智能懷揣着濃厚的興趣,都能投身於開源社區,共享智慧的結晶。這種開放性和包容性能夠形成一種強大的虹吸效應,吸引全球的人才和資源匯聚於此。

  他對DeepSeek的開源模式給予了高度評價,認為DeepSeek通過開源策略,成功建立了全球開發者生態聯盟,成為行業的事實標準,奠定了AI「根技術」的地位。周鴻禕預測,開源模式將重構AI競爭格局,中國有望憑藉開源生態的優勢在AI領域保持長期領先。他還指出,開源模式將帶來多贏的局面,中小企業能夠以低成本獲得頂尖的AI能力,雲服務商可通過算力需求的激增獲益,國產芯片廠商則有機會借推理算力優化實現彎道超車。

  在紅帽大中華區首席架構師張家駒看來,DeepSeek的開源模式的成功,印證了開源將加速創新,同時也有助於標準的形成,使AI更安全。

  除此之外,阿里雲CTO周靖人重申了阿里雲開源開放的選擇,他表示通義千問已經實現了真正意義上的全尺寸、全模態開源,拉平了開源、閉源模型之間的差距,通義千問開源模型下載量的增長和阿里雲百鍊服務客戶數的大幅增加,證明了開源策略在阿里雲的成功實踐。

  而月之暗面創始人楊植麟則認為,閉源會帶來人才和資本的聚集,最終閉源會更具優勢,他以海外基於開源擴散模型Stable Diffusion的應用為例,指出雖然有衆多應用,但卻沒有一個能夠脫穎而出。

  薩摩耶雲科技集團首席經濟學家鄭磊認為,大模型開源相比閉源,在技術創新速度上具有顯著優勢,能夠通過社區協作和衆包創新加速技術擴散和應用。同時,開源模式能夠像DeepSeek一樣,快速推動計算、通信、存儲等多領域的協同創新。然而,開源模式也存在質量控制、安全風險等劣勢。未來,開源與閉源模式可能會繼續共存,企業會根據自身需求選擇合適的策略。

(文章來源:中國經營網)

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10