專題:2025中國高新技術論壇
由深圳市人民政府主辦的第二十七屆高交會於2025年11月14日-16日在深圳舉行。作為高交會的重要論壇「中國高新技術論壇」於11月14日舉辦,論壇主題為:人工智能賦能未來產業發展」。微分智飛(杭州)科技有限公司聯合創始人呂熙敏在演講中談到,隨着低空經濟的提出和助力,現在正處於通用飛行具身智能的前夜,空中機器人將大規模用於通用空中任務。

他指出,下一步要不斷降低成本,提升硬件的智能程度,覆蓋更多的應用場景,從而讓空中機器人能夠適應更多的任務,在千行百業中得到更加廣泛的應用。「相比傳統的飛控,我們認為飛行具身大小腦具有任務上限高、部署門檻低、泛化性強、機動性高以及未來有可能實現羣腦智能湧現的優勢。」
為此,微分智飛做了單體感知決策到羣體自主協同,從數學驅動建模優化到數據驅動學習進化的工作,主要研究方向包括:全狀態規矩規劃,高動態感知與主動規劃,全自主飛行集羣,端到端靈敏操作,一體化飛行操作,最後把研究成果逐步落地到行業應用。
以下為演講實錄:
呂熙敏:各位朋友,下午好!我是來自中山大學的呂熙敏副教授,同時也是微分智飛的聯合創始人,今天我彙報的主題是《飛行機器人技術發展與產業實踐,從物理智能到具身智能》。
我們知道2015年在機器人浪潮中自動駕駛得到了迅速的發展,並逐漸得到落地應用。2023年具身智能浪潮中,人形機器人技術得到了快速發展,目前已經有不少Demo展示了未來實現通用地面任務的可能性。空中機器人從2010年開始逐步解決各項技術難題,隨着低空經濟的提出和助力,現在我們正處於通用飛行具身智能的前夜,空中機器人將大規模用於通用空中任務。
從硬件層面看,計算設備、算力持續提升、體積持續變小,這使得具有支撐它足夠算力的空中大腦得以實現。傳統無人機通過算力支持以及智能算法演進可以進化為多才多藝的空中機器人。
下一步要不斷降低成本,提升硬件的智能程度,覆蓋更多的應用場景,從而讓空中機器人能夠適應更多的任務,從而在千行百業中得到更加廣泛的應用。為了實現上述目標,我們需要研發飛行具身大小腦,相比傳統的飛控,我們認為飛行具身大小腦具有任務上限高、部署門檻低、泛化性強、機動性高以及未來有可能實現羣腦智能湧現的優勢。
為了實現該目標,我們做了單體感知決策到羣體自主協同,從數學驅動建模優化到數據驅動學習進化的工作,主要研究方向包括:全狀態規矩規劃,高動態感知與主動規劃,全自主飛行集羣,端到端靈敏操作,一體化飛行操作。最後我們把研究成果逐步落地到行業應用,成立了微分智飛這家公司。
首先看軌跡規劃工作。當前研究存在建模不準確、計算量大、軌跡規劃不夠合理、避障困難等問題。針對這個問題我們提出了一個MINCO算法,相比傳統方法求解效率提升1-2個數量級,可以進行高速避障飛行。在此基礎上,我們解決了飛行機器人倒扣180度的難題,用戶可以根據特定的意圖輸入,生成飛行機器人動力安全飛行軌跡。右上角是飛行機器人進行了高動態飛行演示,右下角是更復雜的環境,飛場中有六個環,飛機要依次穿過六個環,我們請了穿越機公開賽第二名的人類選手飛這個軌跡,該選手飛了24次,成功3次,我們的算法飛了8次,成功了8次,可以看到我們算法的先進性和穩定性。
高動態感知與主動規劃。在複雜的高速位置環境中,飛行機器人存在載荷有限的問題,導致機載計算平台算力較低,傳感器性能受限。當前傳感器環境感知能力受限,比如相機受障礙物的遮擋,影響它對目標物的感知能力。比如當車拐到另外一個車後面,飛機沒有很合理的規劃就可能丟失跟蹤期望目標。另一個問題是無法應對高速環境,實用性差。比如針對一些快速物體飛機無法躲開,這會導致飛行機器人安全性能下降。
針對實時性差的問題,我們研究了極低延遲動態感知系統。如右下角所示,該系統可以獲得將近1500幀的人類骨架信息。該系統可以躲避高速來襲的物體。想象一下,未來低空經濟,飛機在我們周圍隨處可見,飛機做一些比較低空任務時,比如送個快遞,這時候有一個熊孩子拿東西扔飛機,飛機可以快速躲開,包裝了飛機的安全使用。
全面主動感知的軌跡規劃算法保證汽車高速漂移時飛機也能跟上並很好的拍攝。汽車高速移動時飛機也能實時看到目標降落點並精準降落。我們也跟一些車企合作,實現了落地應用,高速跟拍降落以及在汽車進行漂移時也能很好的把動作拍攝下來。比如仰望,有搭載飛機的一些功能。很多有錢人是願意買這些全新功能的,給他們帶來不同的體驗。比如漂移愛好者就希望有一個飛機能自動幫他拍攝。現實中很少有人類飛手可以實現上述需求。
全自主飛行集羣方向:針對全自主集羣飛行,往往存在高複雜運動衝突,主要表現在任務目標、機間避碰、環境避障相互制約,多個飛機需要進行飛行,飛行過程中要防止飛機和飛機之間碰撞,以及他們還要隨時躲避周圍的障礙物。這是非常難的問題。傳統的研究是依賴外部感知設備,無法適應野外環境。我們團隊在全自主集羣領域擁有斷層式的領先。在國際上首個實現了非結構化場景的自主飛行集羣系統,並在Science Robotices上作為封面文章發表。
我們還提出滿足1000架超大規模集羣算法,在計算效率、規模性、軌跡質量、自助行上基本上是目前斷崖式的領先,1000架飛機從四面八方期過來,它們要快速找到避開周圍飛機的軌跡。這個問題是非常困難的,該算法可以實時把這個事情做了。從而體現算法的先進性。我們把這些算法進行落地應用,比如集羣編隊飛行、協同搬運以及在場景重建時,原來是一台飛機進行場景重建,現在可以用多架飛機進行協同重建,結合地圖融合就可以快速對一個場地實現快速重建任務。
前面的研究主要是基於數學、物理基礎規律,建立精確的模型,然後再優化求解,我們現在希望從數學驅動轉換到數據驅動,讓飛機機器人具有具身操作、交互、執行等能力。在這方面我們也做了一些工作,比如高機動端到端自主飛行,利用生成式AI針對不管多麼複雜的環境都能像人類做一筆畫一樣的快速生成軌跡。不管環境多麼複雜,它的規劃效率都是非常穩定的。這個方法在超級空曠的地方可能跟傳統方法差不多,但只要環境稍微複雜一點,就可以非常好的打敗傳統方法,這個方法具有比較好的泛化性。啱啱在峽谷上的固定翼飛機可以使用,花園迷宮裏輪足式機器人也可以進行使用。
此外,我們還實現了飛行機器人端到端高機動穿框飛行,飛行機器人僅需要一個機載的相機以及IMU,就可以在任意框上進行穿框飛行。並且只要識別到這個框,並判斷是安全的,就能穿過去。傳統方法需要外部定位系統,把框的位置標出來,再進行SE3的規劃。而該端到端方法無需外部定位,同時成功率也跨越式提高。目前在我們公司裏已經實現常態化的Demo,歡迎感興趣的朋友到公司參觀打卡。此外端到端算法比傳統方法算力要求更小,我們把端到端算法部署在不到50g的飛行機器人上實現了飛行機器人全自主避障飛行,大幅降低硬件成本。
通過數據驅動方法避開了傳統數據複雜度爆炸的問題,使效率和環境複雜度進行解耦,且可以滿足輪足機器人、汽車、飛機等多平台的通用,在高精度、高動態、大機動飛行方面,端到端可以有效避免傳統分模塊的方案各個模塊引入的誤差,從而實現更好的性能。
我們提出一種可以抓握的仿生人手飛行機器人,驗證了該飛行手的抓握,指間夾取、開門等基本動作,還實現了該飛行機器人在家用智能操作的交互,空中棲息、空中運輸等功能。如視頻所示,人進來後飛機過來給它拿水,幫他倒個垃圾,最後棲息會基站。空中運輸,可以無視地形從河對岸運輸咖啡過來。該平台還可以進行空中搖操作交互。人形機器人終有一天會成為我們的助理,但是人形機器人也有一個缺陷,沒法飛。如果我們給每一個人形機器人部署一個空中小助理,比如當你需要讓人形機器人從河對岸拿一個東西時,飛行機器人就可以飛過去幫你拿。
我們還嘗試了VLA大模型以及端到端視覺操作強化學習,針對VLA模型,實現了避障、導航、大機動、操作。通過VLA大模型做一個高層決斷,決策完之後再調用之前已有的算法。我們的難點是怎麼樣在飛行機器人有限算力平台實現實時的操作。端到端的視覺操作,不需要依賴外部定位,可以實現更高效和穩定的抓取。
我們在物理智能成果豐碩,在具身智能也已經小露頭角,我們相信通過不斷地研發投入,終有一天可以實現智能湧現。飛行機器人的應用也將迎來爆發式的增長。微分智飛的使命讓飛行機器人連接千行百業,飛入千家萬戶。在協同性上實現從分佈式計算+預設規則到分佈式計算+演進規則的能力躍遷,在自主性上實現從L3的限定場景任務規劃到L4開放場景自主決策的能力躍遷。
以上是我們一些客戶案例,飛行機器人可以完全代替工作人員進入未知危險區域,上面是一些礦井、採空區,它可以高效精準的帶回點雲和視頻數據,全程無需人工干擾,像這個視頻沒有任何信號,無法進行遙操作,一鍵起飛飛行機器人即可自主探索,並把地圖建好帶回來。右邊很多場景都有上萬立方,我們的平台在不到10分鐘即可完成全部任務。
這是我們目前發布的行業應用平台,今天在中山大學的展台也可以看到樣機。
我們也在科研教育有所佈局,我們相信只有培養好祖國的未來,技術才能更好更快的發展,我們會逐漸將啱啱講到的一些最新技術下放到這個平台,為飛行機器人社區盡一份貢獻。目前已經有六大功能,包括集羣協同、目標檢測、跟蹤飛行、避障飛行等。這是我們產品的圖片(見PPT)。我們公司也在大量招聘能人異士,歡迎感興趣的朋友加入,更多信息可以掃描我們的二維碼,包括公司公衆號、崗位詳情以及實驗室的主頁,謝謝大家!
新浪聲明:所有會議實錄均為現場速記整理,未經演講者審閱,新浪網登載此文出於傳遞更多信息之目的,並不意味着讚同其觀點或證實其描述。
責任編輯:李昂