炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
(來源:新智元)
新智元報道
編輯:桃子
【新智元導讀】谷歌DeepMind開啓“上帝視角”,全新力作AlphaEarth Foundations震撼上線,10米級分辨率,打造出前所未有的地球數字畫像。網友直呼:這不就是“地球版ChatGPT”?
剛剛,Alpha家族又上新了!
這一次,谷歌DeepMind幫人類打開了“上帝視角”——全新AlphaEarth Foundations正以驚人的細節繪製出整個地球。
它集成了PB級地球觀測數據,可生成統一的數據表示。
具體來說,AlphaEarth Foundations將地球每10x10米網格的信息,濃縮成高效數據,一共有64個維度。
10米級分辨率,足以讓你看清地球每個角落。
谷歌將一年的多源衛星數據的精華,濃縮在每個10米見方的像素之中
AlphaEarth Foundations獨特之處,便在於其強大的“特徵學習”的能力。
通過複雜的嵌入技術,模型能從光學、雷達、3D數據中提取關鍵特徵,輕鬆區分沙灘與沙漠、森林與農田。
這種能力,讓它在性能上超越了其他AI和傳統方法,錯誤率降低了24%。
同在今天,谷歌團隊還放出了63頁超全技術報告。
論文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/alphaearth-foundations.pdf
AlphaEarth Foundations就如同一顆“虛擬衛星”,爲人類提供了一扇窺探地球脈動的窗口。
它能讓科學家更快速、更高效分析地球動態,監測作物健康、追蹤森林砍伐,應對氣候變化等全球性問題。
一位網友盛讚,谷歌在構建“地球版ChatGPT”的路上,邁出了重要一步。
問題來了,我們爲什麼需要一個,AI版地球模型?
AI版“虛擬衛星”登場
64維超高精度
每天,衛星從太空捕捉地球的每一寸變化,生成海量的圖像和觀測數據。
這些數據爲科學家、決策者們,提供了近乎實時的地球全景。
過去15年,Earth Engine平臺開放的地球觀測影像和地理空間數據,徹底改變了我們對地球的認知方式。
但因其複雜性、多模態、刷新率也催生了一項新挑戰:如何連接異構的數據集,並對其進行高效利用?
AlphaEarth Foundations的誕生,就成爲這一難題破解的制勝法器。
這是一款堪稱“虛擬衛星”的AI模型,能將海量球觀測數據,整合到一個計算機系統,並輕鬆處理的統一數字表示(即“嵌入”)。
最終,它以前所未有的精細度,繪製出地球上所有的陸地和沿海水域。
AlphaEarth Foundations不僅爲科學家提供了更完整、一致的地球演變圖景,還助力他們在糧食安全、森林砍伐、城市擴展、水資源管理等領域,做出更明智的決策。
工作原理
通過解決“數據過載”和“信息不一致”這兩大挑戰,AlphaEarth Foundations爲我們理解地球提供了全新的視角。
首先,它整合了來自數十個不同公共來源的海量信息,包括光學衛星圖像、雷達、3D激光測繪、氣候模擬等。
它將所有信息融會貫通後,再以清晰的10x10米的超高精度分析全球陸地和沿海水域,追蹤地球隨時間的變化。
其次,它使這些數據變得易於使用。
該系統的關鍵創新在於,能爲每個方塊區域創建一個高度緊湊的數字摘要。
與其他AI系統相比,這些摘要的存儲空間減少了16倍,顯著降低了行星尺度分析的成本。
這一突破使科學家們能夠做到一件迄今爲止無法實現的事情:按需創建詳細、一致的世界地圖。
AlphaEarth Foundations工作原理:從視頻序列中提取非均勻採樣的幀,以索引任意時間點的位置。這有助於模型構建該地點的連續視圖,同時解釋大量測量數據。
無論是在監測作物健康、追蹤森林砍伐,還是觀察新建築,他們都不再需要僅僅依賴一顆飛過頭頂的衛星。
如今,他們擁有了一種新型的“地理空間數據基礎”。
經過嚴格測試,AlphaEarth Foundations還展現了無與倫比的準確性。
它在不同時間段的各種任務中都表現卓越,包括識別土地用途和估算地表屬性。
至關重要的是,即便在標記數據稀缺的情況下,其錯誤率比其他模型平均低24%,展現了卓越的學習效率。
全局嵌入場被分解爲單個嵌入的過程(從左至右)。每個嵌入包含64個分量,這些分量映射到64維球面上的座標點
如下生成的地圖數據中,AlphaEarth Foundations嵌入維度的64個維度中,三個分別賦予紅、綠、藍三色,即可將我們世界的豐富細節可視化。
在厄瓜多爾,該模型能穿透持續的雲層,詳細呈現處於不同發展階段的農田。
在其他地方,它清晰地繪製出南極洲的複雜地表——該地區因衛星成像不規律而極難成像。
此外,它還揭示了加拿大農業土地利用中肉眼不可見的差異。
左右滑動查看
接下來,我們詳細拆解AlphaEarth Foundations生成數據集的強大之處。
10x10像素,濃縮一年數據
谷歌團隊利用AlphaEarth Foundations,生成了覆蓋2017年至今、每年10米分辨率的全球預計算嵌入數據集。
這些“嵌入”影像看似普通的Earth Engine影像集合,卻將AI賦能的特徵提取能力融入到每個像素。
“嵌入”向量中究竟包含了哪些信息?
· 多源測量數據
嵌入向量從多種數據源中學習,捕捉地表屬性的語義信息。
比如,一個像素的嵌入不僅反映其光譜特性,還包含周邊環境、季節性變化(如植被物候、積雪)以及地形和氣候特徵。
· 時空背景
AlphaEarth Foundations在全球超500萬個地點採樣、總計超過30億個獨立影像幀上進行了訓練。
模型將一個地點隨時間變化的衛星影像視爲視頻中的連續幀。
從而能夠跨越空間、時間和測量模式進行學習,生成既能捕捉空間背景又能保留時間軌跡的嵌入。
這意味着,衛星嵌入數據集中的每個嵌入向量,都爲地球陸地表面上每塊10米像素(100 平方米)的區域狀況,提供了一種高度緊湊且語義豐富的表示。
每個10米像素的嵌入還捕捉了其周邊區域的信息。
因此,即使某些區域(比如停車場的瀝青路面和高速公路)在孤立來看時非常相似,它們的嵌入向量也會有很大差異。
· 64維看地球:座標與波段
衛星嵌入數據集中的影像有64個波段——但它們不同於經典的光學反射率或雷達回波。
恰恰相反,AlphaEarth Foundations嵌入中單個像素的64個“波段”,代表了在一個64維“球面”上的一個64維座標。
這些座標通過DL生成,數學上可解釋性強,但並非直接的物理測量值,而是對高維測量空間的緊湊表示。
“衛星嵌入”本質上是64維“球面”表面的一個座標點
有了衛星嵌入數據集,科學家能夠進行“相似性搜索”。
只需選擇一個目標像素,嵌入向量即可通過簡單的點積計算,快速在全球範圍內定位相似地表和環境條件的區域。
紐約市中心的嵌入向量,能輕鬆匹配其他高度城市化的區域。
對座標——73.9812, 40.7628(美國紐約市中城區曼哈頓)進行的相似性搜索
此外,基於相似性的比較同樣適用於時間維度,可用於由嵌入驅動的變化檢測和穩定性監測。
AlphaEarth Foundations嵌入空間被設計爲在時間上保持一致。
通過比較同一像素在不同年份的嵌入向量,可以輕鬆監測城市擴張、野火恢復、水庫水位變化等。
下圖顯示了,2020年——2024年間在嵌入空間中觀測到的一些變化,每行最後一張圖顯示了每個像素與自身的相似度(值越亮表示差異越大),分別對應以下幾種變化類型:
除此以外,無需預先標籤,嵌入向量結合Earth Engine的ee.Clusterer算法,可自動將像素聚類爲不同地表類型(如森林、土壤、城市區域)。
這能揭示隱藏的地貌模式,助力研究地形、水文和物候特徵。
地球版ChatGPT,按需創建地圖
目前,由AlphaEarth Foundations驅動的Satellite Embedding數據集,是Earth Engine中規模最大的數據集之一。
它每年包含了超1.4萬億個“嵌入”足跡。
全球衆多組織,包括聯合國糧食及農業組織、哈佛森林、地球觀測組織、MapBiomas、俄勒岡州立大學等,已利用這一數據集創建自定義地圖,深入洞察現實世界。
在實際應用中,AlphaEarth Foundations已取得了初步的成果。
“全球生態系統地圖集” (Global Ecosystems Atlas) 計劃,利用數據集將未測繪的生態系統,分類爲海灌木叢、極度乾旱沙漠等類別。
這一首創的資源,爲各國優化保護區優先級、推動生態恢復和遏制生物多樣性喪失提供關鍵支持。
還有巴西“MapBiomas”項目,通過測試該數據集,更深入瞭解了農業和環境變化,爲亞馬遜雨林等關鍵生態系統的保護戰略和可持續發展倡議提供了信息。
AlphaEarth Foundations,代表着人類理解地球動態的重要一步。
接下來,谷歌團隊正使用其來生成年度嵌入(annual embeddings),並聯合強大Gemini一同發揮最大效用。
作爲Google Earth AI的一部分,他們還將繼續探索應用模型時序能力的最佳方式。
參考資料:
https://x.com/bilawalsidhu/status/1950580970907648234
https://deepmind.google/discover/blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/
https://medium.com/google-earth/ai-powered-pixels-introducing-googles-satellite-embedding-dataset-31744c1f4650
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。