炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
(來源:澎湃新聞)
2023年底工信部印發《人形機器人創新意見》,2024年被稱為「人形機器人元年」,2025年「兩會」熱議融合大模型與機器人的具身智能。種種跡象表明,機器人將不再被侷限於工廠的勞動場所中,很快將大規模出現於日常的家居環境中,人機情感互動將成為未來智能社會的常態。有論者甚至認為,隨着實體機器人革命走向深入,AI正在成為新的「情感主體」「社交主體」。所謂機器情感、AI陪伴的實質是什麼,對人機交互、人機關係產生何種影響?比如說,從文化視角和性別視角,應該如何看待人機情感關係呢?人與機器的情感交流,將會產生何種社會衝擊,導致何種技術風險和技術倫理問題,又應該如何應對?類似問題,已經引發諸多熱議。本次筆談聚焦「機器情感與AI陪伴的人文審度」,從哲學、馬克思主義理論、文學和人工智能等進行跨學科研究,拋磚引玉,以期推動該領域研究的進一步發展。
第一組6篇論文由本刊2025年第3期刊發,引起學界極大的興趣和關注。本期刊發第二組共7篇論文。在《智能時代情感操控技術的三重特徵解析》中,閆宏秀和羅菲圍繞「誰在操控」「操控如何實現」「操控如何呈現」三大關鍵問題,指出AI情感操控技術中的動機代理化、系統性生成與結構性隱匿的特徵,主張構建適應人機複合系統的新型倫理責任框架。在《情感計算的哲學缺陷及其技術克服進路》中,孫強梳理情感識別、情感生成和人智情感交互等情感計算領域關鍵技術的哲學缺陷,提出在以人為本核心價值指導下克服缺陷的潛在進路。在《情為何物?——機器情感的哲學分析》中,史晨和劉鵬從情感與理性的關係入手分析機器情感的實質,主張打破情感幻像,走向適度情感、適度理性的人機互動。在《誰決定我們的情感生活?》中,黃柏恒以Moxie社交機器人停運引發的兒童哀悼為主要案例,揭示商業邏輯主導下情感AI的結構性情感不公正,呼籲通過認知賦權重塑技術公司與用戶的情感權力關係。在《「DeepSeek中文情感難題」與可能出路——一種「共在—預測AI」進路》中,吳雪梅指出「DeepSeek中文情感難題」表現為難以理解中文情感與難以識別語義兩方面,並提出「共在—預測AI」的解決方案,主張發展以中文共在情感為啓發的羣體智能以提升DeepSeek的中文情感計算能力。在《生成式人工智能驅動的人工親密關係及其社會情感對齊》一文中,段偉文探討生成式人工智能驅動下人工情感和人工親密關係帶來的社會情感衝擊,強調超越似真情感悖論和機器貶低等數字文化批判的視野,轉而從基於「主體—他者—世界」參照三角的「社會—情感—認知」發生機制出發,尋求AI個人主義時代的社會情感對齊之道。在《風骨智能體與智能人文》中,楊慶峯提出構建風骨智能體來克服理性智能體過於強調目的和理性優先的侷限,並為智能人文的研究提供一條可能的路徑。(專題特邀主持:劉永謀)
本系列文章原刊《科學·經濟·社會》2025年第5期,澎湃新聞經授權轉載。
【本文摘要】從以人為本的哲學傳統出發,結合現象學、心理學和存在論中的核心思想,對人智交互演化視域下情感計算技術的哲學本質開展多重批判性審視。通過剖析情感計算關鍵技術的底層邏輯和哲學缺陷——情感識別技術的語境缺失、情感生成技術的體驗匱乏以及人智情感交互技術的虛假聯結危機,揭示情感計算技術對人類主體性、自我認知與人際交往等人本價值的深層影響,最後提出以人為本核心價值下未來情感計算技術的可能進路。
一、問題提出
從第一性原理上講,情感計算技術的演進始於對人類情感的數字化解構——人工智能算法通過面部表情編碼、文本情感語義提取和語音情感特徵提取等技術,將人類情感解構為可計算的具體指標與行為數據。這種技術向度遵循伽利略「自然的數學化」傳統,將情感視為可度量的物理現象,契合了笛卡爾的身心二元論框架——情感被剝離其主體性體驗,成為算法可解析的「廣延實體」。這種技術理性的侷限性在哲學層面尤為明顯。例如,技術向度的情感計算若忽視情感的具身性內涵,終將陷入「去人性化」的技術異化陷阱。根本原因在於,情感包含着我們對於自己作為身心統一體的存在最基礎的理解,它與靈魂的行動產生內在的關聯,是溝通心靈的主動領域和受動領域不可或缺的橋樑。
因此,從哲學上審視情感計算技術,無論是情感識別、情感生成還是人智情感交互,都應該將情感的量化邏輯與技術異化陷阱置於中心,將手段(硅基智能體的情感識別、生成與交互)與目的(碳基生命的情感體驗和自我認知)釐清開來,從以人為本的角度客觀看待情感計算在促進人機和諧共生這一發展目標上的價值。
二、情感計算技術的哲學缺陷
(一)情感識別中的語境缺失
情感識別是通過計算機工程可以實現的方式,從一種或多種傳感器獲取的關於識別對象的情感線索信號(如文本、語音、圖像)中學習與情感相關的語義特徵,並訓練對應的機器學習(目前大多數是深度學習)模型,旨在建立情感語義特徵與情感狀態(離散的情感類別或情感維度空間的連續數值)之間的非線性映射關係。這種基於情感線索信號信息量化和壓縮表徵機制的實現方式適合採用基於認知心理學的抽象描述,形成基於情感線索信號的「量化—表徵—估計」推理機制。這是一種「經由認知定義情感」的思路,典型代表就是由Ortony,Clore和Collins三人聯合提出的OCC情感模型。
實際上,機器情感識別的結果往往是識別對象的情感狀態,而不是其情感體驗。前者是第三人稱視角的結果,後者是第一人稱視角的結果。因此,當前受OCC模型啓發的主流機器情感識別技術的侷限性在於,大大簡化(甚至忽略)了人類情感形成的複雜人文背景或語境——通常稱之為上下文(context),這是大多數機器情感識別技術的根本缺陷。按照維特根斯坦的「私人語言論證」觀點,內在體驗的不可言說性使得對他人情感的認知本質上是一種「生活形式」的理解,而非數據運作機理上直截了當的推斷。因此,當某一機器情感識別系統將微笑編碼為「愉悅」對應的情感特徵向量時,它恰恰遺漏了微笑作為「社交禮儀」「心滿意足」或「鄙視輕蔑」等置於上下文語境中的現實體驗意義——這些意義的生成依賴於主體間的語境認同與文化共識,而非單純的(深度)人工神經網絡信息之間的關聯性或因果性。
在現象學領域,胡塞爾沿着認知心理學的進路,嵌入了「生活世界」理論,其包羅萬象性對機器情感識別技術的工程實現帶來了巨大的挑戰。而且,現象學的「共情」思想亦可為此提供深刻的洞見。胡塞爾認為,對他人情感的理解需要以「類比性統覺」為基礎,即通過自身的身體經驗類比他人的行為,形成主體間的意義共鳴。可以說,這種理解本質上是伽達默爾「視域融合」思想的詮釋學過程,而非算法層面的模式匹配。鑑於此,機器情感識別技術若缺乏對這種主體間性視域的理解,其輸出結果只能是剝離現實意義的「情感殭屍」,即徒有行為表現上的深度表徵,卻無「生活世界」意義上的情感語境內涵。因此,機器情感識別技術必須突破剝離現實意義的窘境,在識別模型的設計與運行過程中,將「生活世界」中的現實語境、識別對象的心理狀態以及推理的透明性融匯在一起。簡言之,需要建立一種基於人機環境系統智能研究範式的情感識別架構。
(二)情感生成中的體驗匱乏
通過結合自然語言處理和深度學習技術,計算機可以生成各種貌似具有真實情感色彩的文本、音頻或圖像等數字內容,這就催生了機器情感生成技術。這種技術的哲學爭議在於,情感的「模擬」與「本真」範疇之間的混淆。例如,按照約翰·賽爾的「中文屋論證」邏輯,即便當前主流的大語言模型算法能夠根據上下文語境生成一些符合情感表達邏輯的文本輸出,但其內部的運作機制仍是對各種標記(token)的形式化操作,其底層代碼體現的也只是基於用戶提示詞的概率性匹配——僅僅體現了某種相關性,而非基於真實語境的情感內容生成——缺乏因果性,更不用說存在論意義上的情感體驗效果了。歸根結底,現有生成式人工智能算法生成的情感內容僅僅是一種標準化、去語境化的機械式複製物,消解了情感的各種本真屬性,在實際應用中往往給人帶來一種擬人化情感的空洞乏味感,缺少面向實際場景的多樣化體驗。
進一步來說,無論是梅洛-龐蒂提出的情感是身體主體在世界中的存在方式,還是達馬西奧提出的情感源於軀體感受(如內臟、內分泌系統的變化)並影響決策(軀體標記假說),都指向同一個觀點——情感並非獨立於身體,而是通過身體與環境的互動湧現。換句話說,情感作為意義生成的動態系統,並非被動反應,而是主動參與世界的方式。因此,理想中的人工情感系統不應該被限制在事先編碼好的固定程序之內,而應該具有在與外界交互之中的情感生成能力,需要將人類與情感生成技術視作人機情感交互關係中具有平等地位的行動者。而且,若人工情感生成系統能夠模擬身體的動力學,則可能激活使用者的鏡像神經元系統,引發具身模擬的情感體驗。這種「身體—情感」的二元循環因果反饋機制,有可能在技術層面上部分模擬人類情感的具身生成過程,增強用戶在不同語境下的體驗感。
此外,機器情感生成技術也是一種技術擬像形式,這種技術的一個主要風險在於,隨着技術的日益完善和增強,有可能觸及鮑德里亞「擬像理論」的核心擔憂——擬像創造了「超真實」的狀態,可能取代真實的情感體驗,導致人類陷入情感擬像的「空中樓閣」,超越了「生活世界」的語境範疇,也算是一種失控。
(三)人智情感交互中的虛假聯結危機
正如人機共生是人機協同的更高階段,人智交互則是人機交互的高度深化。在人智交互過程中,人工智能可與人類合作,並擔負雙重角色:不僅是簡單的輔助工具,更是合作者——「人智組隊」式的合作隊友,實現與人類的相互理解、合作和共同決策。
隨着人工智能體性能的不斷提升,人際關係的存在論基礎正在並將持續被人智交互中的情感中介所重構。例如,當社交陪伴機器人成為情感傾訴的主要對象時,人類的情感交流可能異化為向技術對象「投射」自我的單向度過程,導致弗洛姆所言的「情感異化」。這樣,情感就不再是主體間的基礎性聯結,而是可交易的技術服務載體,因此而產生的技術異化效應會引發人類主體性的消解危機。進一步來說,存在主義心理學可以揭示人智情感交互的深層危機。通過對大語言模型進行大五人格OCEAN模式方面的評測發現,當前的大模型在與人對話的過程中,總是呈現出一種樂觀、理性、博學且情緒穩定的人格形象而缺乏豐富多樣的個性。機器情感的這種「討好」特性有可能會縱容用戶逃避存在性孤獨,往往會讓個體在技術擬像中喪失本真的情感表達,陷入情感「虛假聯結」的心理舒適區而無法跳回到現實世界中。而且,在人智情感交互過程中,對人工智能產生的情感過度依賴可能會導致倫理方面的危害,諸如侵蝕人類的自主性和獨立性、影響人際親密關係、衝擊家庭結構和社會形態。
解決人智情感交互過程中的上述困境的關鍵在於,如何給予人智情感交互一個以人為本的科學定位。技術現象學流派有可能為其提供一個更為精細的剖析框架。唐·伊德提出的「他者關係」理論指出,「技術並沒有獲得完全的他者地位,其準他者性是作為一種可顯現的能夠轉化人類經驗的媒介,在人與技術關係的連續統中發揮作用」。具體到人智情感交互過程,相關的系統在工作時展示出的共情回應,用戶可能將其視為一種「準他者」,這種關係既非完全意義上的工具使用,也不同於真實世界的人際互動,而是介於兩者之間的新型交互形態——不妨稱之為基於「人智組隊」式協作機制的人智交互。無獨有偶,心理學家霍頓和沃爾提出的「準社會互動」(parasocial interaction)概念運用到人智情感交互時,就是「用戶將虛擬智能物視作是真實的社會行動主體,藉由‘精神想象’聯結情感」。重要的一點是,「準社會互動」中硅基生命體的形象不應該是靜態的,而是藉由人工智能模型隨機地塑造「人設」,從而在一定程度上拓寬人智情感交互的豐富多樣性。這類「準他者」和「準社會互動」的觀點,恰恰有可能為反思人類情感的本質提供一種鏡像視角——通過觀察與機器情感的差異,人類有可能會更清晰地認識到自身情感的獨特性,有望增強人際交往的情感黏合力,將人智和合共生與人際和諧共存統一在一起。
三、以人為本核心價值下情感計算技術的克服進路
以色列歷史學家尤瓦爾·諾亞·赫拉利從技術演化的視角提出,當前人工智能正在經歷從被動的工具到能夠自主決策並參與社會事務的行為者的價值躍遷。與此同時,未來學家雷·庫茲韋爾認為,人機關係將發生巨大轉變,人工智能將不再是工具而是我們自身的一部分。換句話說,為了實現硅基智能體從「類人」工具到「人工伴侶」角色的演化與發展,情感計算領域存在的情感識別語境缺失、情感生成體驗匱乏以及人智情感交互中的虛假聯結等哲學缺陷都亟待藉助技術的創新和發展來克服。
(一)情感識別:從上下文語境建模到可解釋情感推理
情感識別本質上是一個基於上下文語境的過程。「情感狀態追蹤」方法研究發現,對於一個無聲的視頻,觀察者僅依靠視覺空間的上下文語境,就能對一個看不見的人的情感進行推斷、識別並隨時間推移進行追蹤。這表明,視覺上下文語境提供了超越面部和身體信息的重要且獨特的貢獻,不僅是準確感知個體隨時間變化的情感的充分條件,更是必要條件。換言之,若想讓機器情感識別系統準確地推斷出分析對象的情感狀態,就必須將上下文語境信息納入其中。
追溯一下心理學史,在語言心理學領域,弗雷格提出應將單詞的語義理解置於上下文語境之中。這一上下文語境建模思想啓發情感計算領域的學者通過結合不同的上下文解釋形式(例如,基於面部和步態特徵的多模態信息、事件情境上下文和麪向社交動態的深度圖建模)開發了EmotiCon——一種融合心理學情境解釋的上下文語境感知情感識別系統。同樣受心理學的啓發,為了克服傳統模式識別方法僅僅聚焦於外部情感表達來實現情感識別的侷限性,從而追蹤識別對象微妙的內在情感而不是外在的情感表達,進化式情感追蹤系統將心理學原理與模式識別主導的計算範式有機地協同在一起,整合了模式識別、歷史語境下的情感追蹤以及心理狀態轉換等綜合流程,探索了各種模態與整合上下文和歷史情感之間的關係,將基於歷史情感的識別更新過程定義為進化心理狀態轉換機制。
從實驗心理學上講,傳統的讓受試者將面部表情與正確標籤關聯起來的做法,本質上將社會感知任務轉化為認知任務。相對來說,將上下文融入情感的感知不僅能提供額外的信息來源,更是通過將其轉化為社會感知任務而非認知任務,改變了受試者的處理方式。另一方面,人類通常會運用心智理論來推測他人感受,但人工智能算法至今仍未能模仿這種高層次的認知能力。鑑於此,按照社會感知的研究範式發展基於上下文語境的情感識別系統是一條可持續發展的路徑。儘管目前這類系統在情感相關的上下文語境表徵方式上做了不同程度的簡化,但也在一定意義上體現了胡塞爾「生活世界」理論的影子,這正是機器情感識別技術進路上令人欣慰的一面。未來的情感識別技術如果能將情感語義特徵、事件場景和文化背景等不同感知粒度的上下文語境有機融合在一起,其識別結果就不再是冷冰冰的標籤,而是更具現實意義的社會感知結果。
此外,如果情感識別技術在頂層設計上能夠遵循可解釋的透明性原則,則可能避免「去人性化」的技術異化,有望使人智情感交互成為人類深化自我認知的載體,成為通向「生活世界」彼岸的橋樑。實質上,情感具有內在的模糊性和主觀性,在詞語表達上也具有開放性,使得一些微妙的情感給機器情感識別技術帶來了很大的挑戰,這種問題往往並不是通過人工標註就可以完全解決的。基於多模態信息——在情感預測(識別)時比單模態信息能提供更加豐富的上下文情感語義線索——的「可解釋多模態情感推理」方法不僅可以預測情感,還能對預測結果進行解釋,從而可靠地提取更微妙的情感標籤,讓每個標籤都有明確的依據,從而為開放詞彙情感識別提供了一種頗具前景的方法。這樣的話,又反過來會促進基於上下文語境的情感識別建模機制的根本性發展。
(二)情感生成:可控表達風格的生成
按照認知科學的研究進路——強調我們的身體與外部環境交互的重要性,心靈不再是一個純粹形式化的計算過程,其具有具身屬性和動態特徵。因此,考慮到情感是心靈的外在顯現與反饋,突破符號主義情感模擬生成困境的關鍵在於,重建情感生成的具身基礎,才能在一定程度上緩解機器情感生成的體驗匱乏問題。
例如,不同人羣、不同場合所擁有的獨特個性化說話風格就是具身性在語音和(或)語言情感表達方面的一種間接體現。目前,在最終生成的說話人視頻中,多數方法都無法生成多樣化的說話風格。針對這種問題,需要構建一種風格可控的單樣本說話人生成框架,旨在從任意參考說話視頻中提取說話風格(風格編碼),然後驅動單樣本肖像視頻以該參考說話風格和另一段音頻進行對話(風格可控解碼)。同時,需要建立一種具有「風格感知自適應變換」的機制,以便於在解碼過程中更好地將參考說話風格嵌入到生成視頻,確保逼真的多樣化風格視覺效果。
此外,現有基於語音驅動的面部動畫方法大多數在戲劇化情感表達和情感控制靈活性方面表現欠佳,無法呈現涵蓋多種情感類型和強度的大範圍面部表情,使生成的表情不能根據實際應用需求進行連續調節而展現出豐富的面部情感表現力,因而缺乏一定的具身情境性。這就需要在技術上,開發出有效的情感控制器模塊,用於學習情感變化(如類型與強度)與對應面部參數之間的映射關係,從而實現情感可控的面部動畫。
需要指出的是,無論是多樣化的說話風格,還是具有豐富情感表現力的面部動畫,涵蓋這些情感生成功能的生成式人工智能在與人類交互的過程中呈現出一種新型的主體性。這種主體性將反映人類社會「共在」生存方式的主體間性思想擴充到了人工主體的範疇,包含了交互實體的目標導向性和自主性,可能表現為更敏銳的感知能力、更強大的推理能力和更適切的行動能力。這表明,需要從交互主體性這一哲學視角來科學看待人與機器的情感互動生成過程,突破人類社會中人際交互主體必須具有意向性這一限制。從這個意義上來說,具有情感生成能力的生成式人工智能不再是人類認識的客體,而是呈現一定的主體性特徵,與人類形成了一種不同於人際交互的新的社會交互類型——人智情感交互。
(三)人智情感交互:大模型人格特質的多樣性
人智情感交互令人類樂觀的一面是,它有望成為人類情感啓蒙的契機。具體來說,人智情感交互若能作為中立的交往輔助工具,有可能突破現實社會人際關係中的權力異化。實質上,這種技術的應用並不是替代人際情感,而是通過數據透明化和機理可解釋性增強人際交往的理性,這方面恰恰契合於杜威的「技術負荷多元價值」技術哲學觀點:「新的技術是價值多元的,它提供了一種新的可能,使用技術的人要精心地選擇和負責任地使用工具和物品,以最大限度地實現人的價值」。
當前,大語言模型(LLM)的出現徹底改變了自然語言處理領域,使其能夠生成連貫且與上下文相關的具有類人特點的文本。鑑於人格特質是決定人智交互時溝通效果的一個關鍵因素,LLM領域亟待解決的一個技術問題是:如何改善並提升現有LLM人格特質塑造的有效性和可靠性,從而模擬更豐富靈活的人格畫像,將人智情感交互過程中存在風險的「虛假聯結」提升為有意義的「準聯結」,充分發揮人智情感交互作為中立的交往輔助工具的價值。
進一步來說,隨着對人智情感交互技術實用性需求的不斷提升,LLM模型通過海量人類數據訓練所嵌入的合成人格特質正變得愈發重要。在技術上,一方面,需要驗證LLM能否生成與其指定人格特徵相匹配的內容。換句話說,需要重點考察LLM能否通過經過嚴格驗證的人格量表持續展現人格特徵。例如,可以通過心理語言學特徵分析、人工評估及人格預測模型,系統研究LLM角色在完成諸如大五人格量表(BFI)測試和故事創作時的行為表現。另一方面,需要建立一種全面的心理測量學意義上有效且可靠的方法,用於對廣泛使用的LLM進行人格測試的實施與驗證——研究具有什麼特性的LLM其合成的人格特質才更有效而可靠,並對這類LLM生成文本中的人格特質進行塑造——需要研究LLM輸出人格特質的塑造方式,從而更好地模擬特定的人類人格特質。
技術畢竟具有一定的侷限性。因此,未來的人智情感交互技術的發展應借鑑伽達默爾詮釋學的「視域融合」理論,將該技術定位為人類理解自身的一種詮釋學工具。這種詮釋學轉向的核心,實質上是在承認技術賦能人類自我認知的有限性:例如,基於LLM的人格特質內容生成技術永遠無法窮盡人類人格特質的存在論深度,但其作為詮釋工具的角色,可以不斷拓展人類理解自身與世界的可能性視域。
四、結語
從古希臘的「愛智」傳統到新一代人工智能領域的情感計算技術,人類對自我的探索始終與技術演進相伴相生。本文以人類智能與人工智能的雙向奔赴這一目標為錨點,從以人為本的視角出發,對人智交互演化視域下情感計算技術的哲學本質開展各種批判性審視。這些批判性審視並非否定情感計算技術在推動人智和合共生上的進步,而是呼籲一種「有溫度的技術理性」——在一切皆可計算的數字洪流中,守住那不可計算、不可替代的幽微人性之光。
筆者着力剖析了情感識別、情感生成、人智情感交互等情感計算關鍵技術的哲學缺陷,揭示了情感計算技術對人類主體性、自我認知與人際交往等人本價值的深層影響,提出了以人為本核心價值下未來情感計算技術的潛在克服進路,旨在拓展人類理解自身與世界的可能性。
情感計算技術的未來發展需要完成海德格爾所言的「技術追問」——從「促逼」的座架轉向「允諾」的救贖。這就要求情感計算技術的設計需要遵循「人本主義」的約束:一方面是現象學約束,即確保各種情感計算技術的使用不損害人類情感體驗的具身性,比如避免過度依賴腦機接口技術所導致的身體感知能力的鈍化,另一方面是存在論約束,即保留情感的不可計算性維度,為「神祕的體驗」「存在性焦慮」「不可名狀的失落感」等無法具象化的情感預留客觀存在的空間。
總之,未來的情感計算技術,應當是人類走向更深刻自我理解的橋樑,而非囚禁心靈的數字牢籠。我們需要理性地審視情感計算技術,既不沉溺於其工具理性的幻像,也不陷入技術恐懼的窠臼,而是以價值理性為軸心,在人智情感交互的雙向映照過程中,不斷逼近那個「以人為本」的終極目標——讓每一次技術的湧現,都成為照亮人性深淵的火炬。
來源:孫強(西安理工大學自動化與信息工程學院教授)