不聯網的AI,殺瘋了...

思哲與創富
02/24

最近科技圈和資本市場同時被一個叫做chatjimmy.ai的新物種刷屏了,初次徹底震驚了我。

在沒有英偉達高性能AI芯片的加持,這家硅谷初創公司Taalas就讓旗下大模型跑出了每秒1.5萬到1.7萬個Token。

這是什麼概念?傳統的大模型每秒是跑一到兩千的Token,速度是它的1/10不到,

人話說就是,你把一道極其複雜的數學題發過去,傳統的AI模型還擱那一個勁思考呢,而它下一秒就羅列了好幾種解法給你看:

這個升級幅度,就好比是從算盤升級到計算器, 又是一個跨越式的進步。

那這個技術邏輯是怎麼實現的呢?

最大的不同就是它把大模型的幾十億參數直接刻入硅片裏面,

過去的芯片算力很強,但大模型和芯片之間數據需要傳輸,所以要藉助HBM(顯存)來搬運,甚至可以說90%的電量和時間都浪費在了路上,

好比一個天才面對一個複雜問題,一秒鐘就給出了答案,但寄郵件卻耗費了大量的時間。

而現在大模型就內嵌在芯片自身,它直接拋棄了昂貴的HBM顯存,數據不需要搬運了,因為「計算即存儲,存儲即計算」,於是一下就節省出大量的資源。

這就和淘寶出來後,直接對接工廠發貨,省去了實體店、中間商、庫存一樣。

那問題來了,如果要把大模型繪製在芯片上,模型豈不是被定死,那一旦老的模型失效要迭代,芯片豈不是就廢了?

這也是過去大家都不敢這麼搞的原因,因為模型迭代太快了,而且專門繪製一個大模型芯片的成本也很高,動輒上億美金。

但如今隨着Transformer語言的普及,大語言模型越來越成熟,那麼這種商業路徑成了可能。

而這次Taalas就是做了一個全自動的硅片編譯器,可以實現自動給芯片電路編碼,從而大幅提高效率降低成本。

效率方面,Taalas宣稱把「大模型」轉化為「定製芯片」的周期,可以從過去的一年降低到兩個月。

成本方面,由於它拋棄了昂貴的HBM芯片,加上GPU用的普遍是H100芯片,如果換到大模型專用芯片上,只需要使用價格僅為1/20的6nm芯片就可以搞定運算。

這種情況即便是出了新的更強大模型,它也可以直接報廢掉,換一個新的芯片就完事。

另外,估計有人也會好奇,這種綁定芯片的大模型,會不會因為沒法更新迭代,導致知識永遠停留在出廠那一天?

實際上大模型刻入芯片,只是模型本身的迭代不能進行了,就好比一個IQ180的人不能繼續進化到IQ200,但它的邏輯推理能力,知識檢索能力依舊頂級。

而且刻入芯片之後,訪問大模型雖然不需要聯網了,但它本身依然是具有聯網能力的,依然可以找到最新的信息去學習,分析並且解決。

這就導致面對緊急突發狀況的時候,它的響應速度遠超過去的大模型,有更好的使用場景。

1、智能駕駛領域,當汽車在馬路上突發緊急事件,有些複雜的問題根本無法解決~

比如前面臨時修路了,原本的實線被磨掉了,交警拿着指揮棒示意你逆行繞過障礙物,傳統的自動駕駛芯片擅長的是快速識別圖像,但對這種需要快速邏輯推理的場景是無能無力的。

這種情況它根本等不起把數據打包傳給阿里雲、亞馬遜等雲端大模型來反饋結果,它需要的是和人類一樣,低於1毫秒的「本能邏輯推理反射」。

2、高頻量化領域,可以在宏觀對沖金融裏開「外掛」

在處理宏觀新聞、財報、非農數據時,聯儲局鮑威爾的講話文稿剛一發布,芯片就能以17000Token/秒的速度,在零點幾毫秒內瞬間「吞下」幾萬字的報告,立刻得出「鷹派/鴿派」的定性,並轉化為做多/沽空大宗商品或股指期貨的信號。

3、軍工領域,這種無需聯網、固化在物理硬件裏的高智商芯片,是武器系統唯一的最佳選擇。

哪怕是處在斷網的「信息孤島」,它還是能憑着出廠時被賦予的龐大參數,獨立進行極速的戰術分析和保密決策。

...................

當然,我們也要關注這個背後長遠看一些潛在的利空,

最近一年,以三星美光,SK海力士為首的三大HBM存儲巨頭股價狂飆,底層邏輯都靠一個支撐:「AI的盡頭是算力,算力的盡頭是HBM」。

如果chatjimmy.ai這種「無HBM化」的芯片普及,甚至形成燎原之勢,對這三大巨頭絕對不僅僅是「有影響」,而是巨大的估值邏輯破壞。

另一方面,以前雲計算藉助AI推理全面收取過路費的模式,也可能會被打上一個問號。

畢竟如果人人的手機、汽車都有這種AI大模型芯片,絕大多數日常問題在本地0.1秒就免費解決了。

真正需要傳到雲端、花錢去求ChatGPT或Gemini這種複雜模型來解答的流量,可能連20%都不到。

不過對於資金佈局在這些方向的人來說,明白危機的同時,也別太過於焦慮了。

因為短期來說它能寫入的模型水平還是有限的,也就是目前僅限幾十億參數的初中生智商水平,距離真正頂級,動輒上百萬億參數模型還為之尚遠。

也就是它五到十年內的使用場景更多還只是在一些特定的領域,尤其是對於一些對「斷網、低延遲、絕對隱私」有極端要求的垂直領域——比如我前面提到的智能駕駛、軍工系統、或者是金融量化高頻交易。

但拉長來看,技術進步的速度確實是難以估量的,誰又知道哪天這些頂級模型寫入芯片之後,每個人的設備終端都擁有了頂級離線AI,世界又會演變成什麼誇張的模樣。

就說這些...

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10