《元宇宙全接觸》總1641期,2025第257期
—— 今天您將知道 ——
01騰訊混元圖像3.0登頂LMArena全球排行榜,包攬兩項國際頂級生圖榮譽
<
02澳大利亞研究證實VR技術可有效干預兒童社交溝通障礙
<
03馬斯克xAI敲定200億美元孖展,英偉達斥20億美元入股綁定算力合作
<
04從Vision Air到帶屏眼鏡:蘋果調整設備研發優先級,應對Meta產品挑戰
<
▼資訊詳情 ▼
>>> 騰訊混元圖像3.0登頂LMArena全球排行榜,包攬兩項國際頂級生圖榮譽
10月5日,國際大模型競技場LMArena最新文生圖排行榜顯示,混元圖像 3.0在全球26個大模型中高居第一位。這一結果來自全球所有用戶的「盲測」,這也標誌着混元在多模態生成方面達到全球領先水平。
LMArena官方社交平臺也第一時間發文祝賀:「文生圖排行榜大洗牌!騰訊混元圖像3.0登頂競技場——同時被評為最佳綜合文生圖模型與最佳開源文生圖模型。這款圖像生成模型已超越Seedream 4,以及代號"nano-banana"的Gemini 2.5 Flash Image Preview。重大突破,恭喜騰訊混元。」
LMArena是美國加州大學伯克利分校推出的創新AI模型評估平臺,評測核心方法是基於人類真實偏好的「盲測」機制,讓用戶對不同AI模型的回答進行匿名投票,衡量模型的表現。用戶輸入問題後,平臺提供兩個模型的回答,用戶根據偏好選擇更優答案,投票結果直接塑造公共排行榜。 由於該平臺訪問量巨大,並且評測機制貼近實際體驗,是目前國際上最權威的競技場排行榜。
混元圖像3.0是騰訊9月28日發佈並開源的原生多模態生圖模型。這是首個開源工業級原生多模態生圖模型,也是目前效果最好的開源生圖模型。混元圖像3.0具備常識並能夠利用知識進行推理;同時語義理解準確度高,並具備極致美學質感,能生成真實的高質感圖片;支持中英文文字生成,長文本文字渲染。
混元圖像3.0模型也同樣受到開發者的歡迎,發佈後不久即登上了Hugging Face開源社區模型熱榜的第一名,持續一週穩居第一;如今又登上了LMarena排行榜的榜首,反映了用戶與社區對模型的關注與認可。
混元目前已形成語言、圖像、視頻、3D模型的多尺寸、多模態開源矩陣,提供接近商業模型性能的開源基座。圖像、視頻衍生模型數量總數達到3000個,混元3D系列模型社區下載量超過260萬,是全球最受歡迎的3D開源模型。
>>> 澳大利亞研究證實VR技術可有效干預兒童社交溝通障礙
溝通障礙會阻礙兒童發育,而澳大利亞弗林德斯大學教育專家的最新研究表明,虛擬現實技術能有效幫助解決問題,且相關證據充分。
實驗揭示了虛擬現實技術在干預兒童及青少年社交溝通障礙領域展現出的巨大潛力。團隊指出,VR技術能夠創建安全、可控且高度沉浸的模擬環境,有效彌補了傳統干預方法在情景真實性、患者參與度和個性化支持方面的不足,為社交溝通障礙的干預提供了創新性的解決方案。
社交溝通障礙是一種神經發育障礙,患者在使用言語和非言語方式進行社交時存在持續性的困難。這包括難以理解對話規則、無法有效運用比喻等非字面語言,以及解讀面部表情、手勢和眼神交流等非言語線索。這些挑戰嚴重影響患兒建立和維護人際關係,並增加其遭受同伴排斥、校園霸凌及學業中斷的風險。
研究表明,VR的核心優勢在於其能夠作為一個「中介工具」,在治療性干預和真實的社交互動之間架設橋樑。綜述歸納出當前研究的五大主題,包括系統的可用性與接受度、社交技能訓練、視線與注意力追蹤、測量評估以及在融合教育中的應用。分析發現,VR干預具有顯著的個性化潛力。例如,集成眼動追蹤技術的VR系統可以實時監測患兒的視線焦點,若其未注意虛擬人物面部等關鍵社交線索,系統可即時提示或調整任務難度。人工智能的引入更進一步,使得虛擬角色的行為能根據用戶的反應和情緒線索進行自適應調整,實現真正的個性化訓練。
另外,VR的交互性和遊戲化特質能顯著提升患兒的參與動機。多項研究報告稱,孩子們普遍認為VR任務有趣且吸引人,這種內在的驅動力對於需要大量重複練習的社交技能習得至關重要。
VR干預的有效性背後有其認知科學的理論支撐。它符合「認知負荷理論」與「雙通道理論」的原則。VR環境通過精心設計,可以減少外部環境干擾,幫助患兒將有限的認知資源更集中地投入到社交任務本身。同時,它利用視覺和聽覺雙通道呈現信息,以更符合人腦處理規律的方式促進社交技能的學習與內化。
專家建議,未來的實踐應注重VR干預與現有療法的整合,開發明確的實施框架;在設計上強調個性化適配與多感官反饋;在交付方式上,可探索診所、學校和家庭等多種場景的互補;並建立涵蓋虛擬與現實場景的綜合評估方案。
>>> 馬斯克xAI敲定200億美元孖展 英偉達斥20億美元入股綁定算力合作
據多位接近交易的知情人士獨家披露,埃隆・馬斯克旗下人工智能公司xAI已正式啓動新一輪孖展,總額確定為200億美元,規模較此前市場傳聞翻倍。此次孖展中,芯片巨頭英偉達將以股權投資形式投入20億美元,同時xAI將通過特殊目的實體(SPV)採購英偉達GPU,並以五年租賃模式降低債務風險,這一創新架構引發行業廣泛關注。
據披露,此次200億美元孖展采用「股權+債務」雙重架構:其中75億美元為股權孖展,由Valor Capital牽頭領投;125億美元為債務孖展,阿波羅全球管理公司、Diameter Capital Partners等機構已確認參與。值得注意的是,英偉達的20億美元投資將全部注入股權部分,這也是英偉達近年來對單一AI客戶的最大規模股權投資。
「所有資金將定向用於xAI位於孟菲斯的‘Colossus 2’(巨像2號)數據中心建設,核心用途是大規模採購英偉達GPU。」一位知情人士透露,該數據中心是xAI推進大模型研發的關鍵基礎設施,此次孖展將直接提升其算力儲備,為後續模型迭代提供支撐。
為平衡鉅額投入與風險控制,xAI設計了以SPV為核心的交易閉環,成為科技行業孖展的新範本。具體流程為:首先設立獨立SPV接收200億美元孖展款;其次由SPV全額採購英偉達GPU,以硬件資產作為孖展底層擔保;隨後xAI與SPV簽署五年期租賃協議,通過定期支付租金獲得GPU使用權;最終華爾街投資者可通過租金收益回收本金,債務風險錨定GPU實物資產,而非xAI公司信用。
而此次英偉達20億美元入股,被業內解讀為其深化AI生態佈局的重要舉措。據瞭解,除股權投資外,xAI此次採購的GPU將全部來自英偉達,雙方還將在技術協同方面展開長期合作。英偉達一位高管此前曾表示,「用財務實力加速AI部署」是公司核心戰略,此前對OpenAI的千億美元級投資也採用「資本+硬件」綁定模式。
在OpenAI近期宣佈與AMD達成合作的背景下,英偉達此次加碼xAI更具戰略意義。分析認為,此舉不僅鎖定了xAI這一潛在大客戶的長期訂單,還能通過股權紐帶鞏固其在AI芯片市場的主導地位。
>>> 從Vision Air到帶屏眼鏡:蘋果調整設備研發優先級,應對Meta產品挑戰
彭博社記者馬克・古爾曼透露,蘋果公司已將員工從成本更低、重量更輕的Vision頭顯項目中調離,轉而將資源集中於帶有顯示屏的智能眼鏡研發,以優先推進該產品落地。
早在Apple Vision Pro正式發佈前,古爾曼就曾報道稱蘋果正在研發一款搭載A系列芯片的廉價版Vision設備。供應鏈分析師郭明池曾預測,這款廉價版頭顯將於2027年下半年啓動量產。據其披露,該設備重量將比現有Apple Vision Pro減輕40%以上,售價降低50%,並將其暫命名為「Apple Vision Air」。
然而目前,古爾曼最新消息顯示,蘋果已「暫停」Apple Vision Air項目,並將該項目團隊的員工調配至智能眼鏡研發團隊,以「加速」帶有顯示屏的智能眼鏡研發進程。
值得注意的是,古爾曼與郭明錤此前均曾報道,蘋果計劃在未來兩年內推出一款無顯示屏的智能眼鏡,該產品與雷朋合作開發,類似Meta的雷朋智能眼鏡系列。古爾曼還補充,蘋果正為這款無顯示屏智能眼鏡研發一款全新芯片,該芯片技術基於Apple Watch 所使用的S系列芯片。
古爾曼表示,蘋果計劃「最早於明年」推出這款無顯示屏智能眼鏡,並在2027年實現正式上市。與此同時,蘋果首款帶顯示屏的智能眼鏡原計劃於2028年推出,但隨着Vision Air項目員工的加入,該產品的研發時間表將得到提前——此舉被認為是為應對Meta Ray-Ban Display智能眼鏡帶來的市場競爭壓力。
不過,Meta方面並不會維持現有產品佈局。據古爾曼透露,馬克・扎克伯格領導的Meta公司計劃在2027年推出升級版Meta Ray-Ban Display智能眼鏡,該新版本將為雙眼分別配備顯示屏,可提供雙目圖像顯示功能。這一升級有望解決初代產品使用時可能出現的眼疲勞問題,同時使設備更適配視頻觀看等長時間使用場景。
截至目前,蘋果與Meta均未正式宣佈除當前在售產品外的任何新頭顯或智能眼鏡計劃;此外,即便部分報道聲稱披露了企業內部研發規劃,其信息準確性也無法完全保證,且即便規劃屬實,兩家公司也可能根據市場變化隨時調整產品研發與發佈計劃。
*所有新聞和圖片來自網絡精選,如有侵權請與我們聯繫。