就在啱啱,谷歌又帶來一項科學突破!
谷歌與加州大學聖克魯茲分校的科學家們聯合發佈了DeepSomatic,成果發表在NatureBiotechnology上。
這款模型使用卷積神經網絡來分析測序數據,幫助檢測腫瘤細胞中的基因突變。
DeepSomatic的性能優於當前所有主流短讀長測序技術,可以更快地識別致癌突變,為更精準、個性化的癌症療法鋪平道路。
在兒童白血病的應用中,DeepSomatic成功發現了10個此前未被報告的新突變,這些可能成為潛在治療靶點。
谷歌副總裁Yossi Matias認為這項成果是「體細胞變異檢測的里程碑」。
目前谷歌已將該模型及其訓練數據開源,加速學術界和工業界的研究。
工具:https://github.com/google/deepsomatic
數據:https://github.com/CASTLE-Panel/castle
而就在一天前,谷歌才報告了生物大模型C2S-Scale,提出了一項癌症新假設,並通過了實驗驗證!
在此之前,谷歌還發布了一系列AI在癌症研究領域的成果,包括幫助乳腺癌篩查的X光檢查、肺癌篩查的CT掃描以及婦科癌症等。
網友對此評價道,「谷歌在AI抗癌領域再次取得重大突破......到2030年,人工智能將解決癌症問題」
我們正在快速邁進一個AI診斷並治癒癌症的世界。
利用AI,精準識別基因突變
癌症本質上是一種遺傳性疾病,其根源在於細胞分裂調控機制中的基因變異。
這些變異大部分不是先天的,而是在個體出生後逐漸積累的——這被稱為體細胞突變。
癌症治療的關鍵一步是識別腫瘤的體細胞突變。然而,從複雜的測序數據中區分真實的癌症相關突變與測序誤差,極具挑戰性。
為此,谷歌聯合加州大學聖克魯茲分校、美國國家癌症研究所等,共同開發出DeepSomatic,專門用於從高通量測序數據中識別癌症相關的體細胞突變。
DeepSomatic基於卷積神經網絡(CNN),將測序數據轉化為圖像,AI通過「看」這些圖像,學習識別真實突變的模式。
這種「圖像化+深度學習」的方法,顯著提升了對低頻、複雜變異的識別能力。
為了訓練和評估DeepSomatic,研究團隊創建了一個前所未有的高質量基準數據集——癌症標準長讀評估數據集(CASTLE)
CASTLE包含6個癌症細胞樣本(4個乳腺癌+2個肺癌),每個樣本都使用三種測序技術(illumina、PacBio、Oxford Nanopore)進行全基因組測序。
來自接近33萬個體細胞變異的測試結果表明,適用於三個主要測序平臺開發的DeepSomatic比現有方法表現更好,以更高的準確性識別出更多的腫瘤變異。
尤其是,在識別涉及遺傳密碼插入和刪除(InDel標記)的癌症突變方面,該模型展現出強大優勢。
在PacBio測序數據中,現有方法得分不到50%,而DeepSomatic得分超過80%。
此外,DeepSomatic還成功應用於更具挑戰性的場景:
FFPE保存樣本:這類樣本因DNA降解嚴重而難以分析,DeepSomatic仍能高效識別突變。
全外顯子測序(WES):聚焦編碼區,成本更低,廣泛用於臨牀,DeepSomatic在此場景下也表現優異。
多癌症適用,AI揭示兒童白血病新發現
儘管DeepSomatic主要是由乳腺癌和肺癌數據訓練而成,但其也可以應用於其他腫瘤領域,展現出強大的跨癌症泛化能力。
團隊分析了膠質母細胞瘤的單個樣本,儘管這種腦癌突變數量少,DeepSomatic仍能識別關鍵驅動突變。
研究人員還與堪薩斯城兒童慈悲醫院合作,使用DeepSomatic分析了8個已測序的小兒白血病樣本。
小兒白血病是最常見的兒童癌症之一,腫瘤細胞存在於血液中。因此很難從患者中分離出完全「正常」的非癌細胞作為對照樣本。
儘管存在這一挑戰,DeepSomatic準確檢出已知的致病突變,驗證了模型的可靠性。
更重要的是,DeepSomatic還成功發現了10個此前從未報告的新突變,這些有可能成為潛在的治療靶點。
下一步,谷歌希望更多研究機構和臨牀醫生能夠使用這個工具。
檢測已知的癌症變異,有助於指導化療、免疫療法或靶向藥物的選擇。
以及識別新的癌症突變,則將為全新的潛在療法帶來可能。