機器情感與AI陪伴的人文審度⑥|邱德鈞、李瑋農:超越記憶——情感計算中遺忘的必要性和實現

市場資訊
07-17

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

(來源:澎湃新聞)

2024年被稱爲“人形機器人元年”。很多人預測,隨着機器人大規模出現在普通人的家居生活環境中,人與機器人之間進行情感交流將成爲未來智能社會的常態。所謂機器情感、AI陪伴的實質是什麼,對人機交互、人機關係產生何種影響?比如說,從文化視角和性別視角,應該如何看待人機情感關係呢?人與機器的情感交流,將會產生何種社會衝擊,導致何種技術風險和技術倫理問題,又應該如何應對?類似問題,已經引發諸多熱議。本次筆談聚焦“機器情感與AI陪伴的人文審度”,從哲學、馬克思主義理論、文學和人工智能等進行跨學科研究,拋磚引玉,以期推動該領域研究的進一步發展。

在《建構主義視域下的機器情感》中,劉永謀和白英慧界定機器情感的概念,並從情感智能、人機情感和人機互動三個方面剖析機器情感的建構性,主張機器情感發展的有限主義進路。在《機器如何可能有情感?——基於“以生命爲核心”的意識理論的探討》中,李恆威和曹旭婷指出,基於“以生命爲核心”的意識理論,通過模擬生物體的內穩態調節機制,可以爲機器賦予情感能力,從而使其具備自主適應性和內在驅動力,爲通用人工智能的發展提供新思路。在《人機情感交互的倫理反思及其規約路徑——以AI復活技術爲例》中,張衛和張陳杰認爲AI復活技術使得人機情感交互出現了新的形式,但是由於情感不對稱性,會形成情感依賴、情感異化、身份欺騙、認同危機以及情感資本化等倫理僭越風險,需要從制度規約、技術設計和文化調節等視角,尋找AI復活技術發展的向善之道。在《情感人工智能需要“身體”嗎?》中,吳靜和王雋雅認爲當情感AI成爲人類尋求情感互動的對象,情感的具身性特徵與人類情感交互的複雜規則共同提出了對情感AI擬真性的高需求,這就使得情感AI的“身體”設計需要面臨多重認知、倫理和法規上的拷問。在《非人之戀文化史視域下的當代人機戀:淵源、特點與風險》一文中,程林與張玥指出,作爲非人之戀4.0階段,當代人機戀的核心特徵是在社會現實青年羣體中的日常化和深度化,並具有趣緣性、生成性與遊戲性等特點,但其情感和倫理風險也不容忽視。在《超越記憶—情感計算中遺忘的必要性和實現》一文中,邱德鈞和李瑋農批判當前情感計算中過度理想化的技術假設,提出引入自然衰減與主動選擇性遺忘的現象學啓發神經計算模型,強調遺忘機制在構建真實、倫理、適應性情感AI中的關鍵作用。(專題特邀主持:劉永謀)

本系列文章原刊《科學·經濟·社會》2025年第3期,澎湃新聞經授權轉載。

【本文摘要】當前情感計算領域哲學討論中普遍存在着理想化技術假設,批判地考察其對“無限技術可行性”的過度肯定與對“遺忘機制”的系統性忽視,指出遺忘並非情感計算的缺陷,而是實現更具真實性、倫理性和社會適應性的人工智能情感系統的關鍵要素。我們構建了一個由現象學啓發的類人遺忘神經計算模型,該模型整合了個體情感記憶的自然衰退以及主動選擇性遺忘機制等,詳細闡述了模型的理論基礎、結構組成、數學建模與計算方法,並進一步從哲學層面探討了災難性遺忘雖然由AI 傳導到情感計算領域,但實際上是可管理可控的,而非災難的。

一、問題提出與研究前景

(一)情感計算的哲學討論中理想化假設的困境

隨着大語言模型在公衆應用中的場景爆發,情感計算(affective computing)也受到關注。情感是人類自豪的智能表現,但爲了更廣泛的人機交互,需要把主觀抽象的情感以計算手段表達出來,這與主張情感可量化不同,是爲了更廣泛的人機交互的需求,以計算模擬表達情感。情感計算作爲人工智能研究的重要前沿領域,自 1997 年羅莎琳德·皮卡德(Rosalind Picard)出版《情感計算》(Affective Computing)一書並首次提出“情感計算”這一概念以來,始終致力於使計算機能夠識別、理解、表達和調節人類情感。在人工智能盛行的當下,由於對技術細節的不完全把握,一些討論往往建立在一個未經嚴格反思的、過於理想化的技術假設之上,即認爲人工智能在技術上已經或即將完全 實現對人類情感的準確模擬和複製。這一假設一方面將技術的無限可實現性作爲毫不動搖的前提,認爲技術無論怎樣都“終將”實現,並基於此探討倫理與哲學議題,過早把遙遠的不確定性的未來難題當作當下真實的難題,忽略了未來的變化;另一方面還表現爲將情感簡單地視爲一系列可編碼、可識別的信號,例如面部表情識別、語音情感識別等,忽視了人類真實情感體驗的複雜性、具身性和情境記憶性,使得對於情感計算這一技術想象得過於樂觀。更爲重要的是,現在的討論往往忽視了情感計算的目標,即“始終致力於使計算機能夠識別、理解、表達和調節人類情感”,對這一目標的忽視直接導致了借現象學套用概念而對情感計算這一技術本質產生誤解。基於技術理想化的假設,哲學界和倫理學界提出了一系列看似前瞻、卻與現實技術進步明顯脫節的問題,如“人工智能是否應享有情感權利”“人工智能的情感奴役問題”等。這種討論在理論上雖然具有一定的啓發性,但由於忽視了情感計算在當前技術現實中的諸多障礙,往往造成了“ 超前”甚至 “脫離實際”的倫理空轉。這種空轉不僅使得哲學與倫理討論失去了對當前技術發展的現實指導意義,也容易誤導實際的技術研究方向。

情感計算領域當前依舊面臨諸多現實的技術挑戰。首先,情感識別與生成技術嚴重依賴於數據集的規模與質量,基於情感的私密性和主觀性,當前情感計算的數據集獲取難度極大,高質量的數據集更是少之又少,這也導致了目前仍然普遍存在的數據偏差、情感泛化困難和上下文理解不足等問題。其次,情感表達在人工智能系統中常常顯得膚淺或機械化,難以真正模擬人類情感體驗的豐富性和深刻性。現有情感計算系統往往基於靜態的情感數據且以此判定情感狀態“長期有效”,忽略了人類情感本身具備動態重構和發展的特徵。當然,這一問題與實時情感計算所面臨的技術難點息息相關。可見,目前情感計算所面臨的真實的技術發展路徑並非簡單的線性進步,其道路上充滿了各種現實中難以預料的技術、資源與倫理挑戰。因此,必須首先認識到當前部分哲學與倫理討論的“空中樓閣”,明確指出無限技術可行性下的完美情感AI 這一前提假設事實上是脫離實際的虛假假設,這種假設對於技術與哲學研究本身都將可能產生嚴重的誤導。

(二)情感人工智能的關鍵而被忽視的維度——遺忘機制

陶建華等於2005 年發表的綜述文章《情感計算:綜述》對情感計算的發展進行了全面的回顧,重點關注情感語音處理、面部表情分析與合成、肢體動作分析、多通道信息處理以及情感理解與生成,討論語音和面部表情中的時間動態特徵,例如語音的韻律特徵(音高、語速等)和面部表情的變化。這篇綜述主要關注如何識別這些時間模式以判斷情感狀態,而沒有探討情感信息在更長時間範圍內的衰減或遺忘機制。Koelstra 等在 2011 年提出的DEAP 數據集(情感分析生理信號數據庫)是一個廣泛使用的多模態情感分析資源庫,包含了參與者觀看音樂視頻時的腦電圖(EEG)和外周生理信號。該數據集記錄了參與者在觀看視頻過程中情感隨時間變化的生理反應,爲研究情感的動態特性提供了寶貴的數據。利用 DEAP 數據集構建的情感計算模型通常側重基於生理信號實時分類情感狀態,而很少關注模型內部如何處理或遺忘過去的情感信息。Calvo等回顧了情感計算領域的情感理論和檢測方法,涵蓋了生理信號、面部表情、語音、文本和肢體語言等多種模態。該綜述討論了不同情感檢測方法的優勢和侷限性,但並未涉及模型中遺忘機制的相關內容。Soley- mani 等在 2012 年提出MAHNOB-HCI 數據集(情感識別和隱式標註多模態數據庫),同樣是一個重要的多模態情感數據庫,包含了面部視頻、音頻、眼動追蹤和生理信號等數據。研究人員可以利用該數據集進行情感識別和隱式標註的研究,如基於面部表情預測用戶對標籤正確性的反應。雖然該數據集記錄了情感表達的時間序列數據,但利用這些數據構建的模型通常着重於識別特定時間點或時間段的情感狀態,而缺乏對情感信息長期記憶和遺忘的建模。Alarcão 等對2009 年至2016 年間基於腦電信號的情感識別研究進行了全面的總結,探討了不同研究中使用的被試、特徵提取方法和分類器。雖然腦電信號本身具有時間序列的特性,並且一些研究也採用了時頻分析等方法提取特徵,但該綜述並未提及模型中是否存在遺忘機制。 Eyben 等在 2009 年開發的 Ope- nEAR(慕尼黑開源情感和情感識別工具包)是一個用於語音情感識別的重要工具,它能夠實時提取語音特徵並進行情感分類。 OpenEAR 的設計側重於高效的實時處理,而沒有涉及情感信息的長期管理或遺忘機制。Sano 等在 2013 年的研究展示了情感計算在壓力檢測方面的應用,利用可穿戴傳感器和手機數據監測個體的生理和行爲信號,以識別壓力水平。雖然該研究涉及時間序列數據的分析,但其重點在於識別當前的壓力狀態,而非模型如何處理或遺忘過去的壓力事件。總的來看,當前情感計算領域的主流研究工作主要關注如何準確地識別、表達和交互情感,對於情感信息的時間維度處理,更多的是着眼於如何利用時間序列數據進行情感狀態的判斷和預測,而鮮有研究關注模型內部是否以及如何實現情感信息的遺忘。

另一方面,如果將視野放到與情感計算相關的人工智能領域,近年來,隨着深度學習的發展 ,記 憶增強神經網 絡(memory- augmented neural networks)被廣泛研究,用以突破傳統神經網絡在長期依賴和外部知識利用方面的侷限。Khosla 等系統梳理了該領域的核心方案,包括 LSTM 類循環網絡、Transformer 及其注意力機制、聯想記憶網 絡( 如 Hopfield 網 絡)、神經圖靈機(NTM),以及基於外部知識檢索的架構(如 REALM,RETRO 等)。這些方案通過不同方式擴展神經網絡的記憶容量,實現了信息的主動保存與高效檢索,在自然語言處理等任務上表現出色。上述模型也各自面臨着諸多不足,循環神經網絡雖在短期依賴上有所突破,但難以維持高度複雜或長期的信息;Transformer 等自注意力結構雖然能建模長距離關係,但在面對超長序列時計算與存儲開銷巨大;而外部記憶機制則極度依賴檢索器性能,且“ 查找”與“ 使用”往往存在割裂,外部知識庫的維護與有效利用亦是難點。這些方法多重視如何提升信息的獲取與保存,卻鮮有關注遺忘機制的引入與調控。正如書寫可以加強人類外部信息保存能力,卻可能削弱內在記憶力,現有的記憶增強神經網絡方案更多提升了模型的“外部記憶”能力,而對於“自身記憶”能力的平衡與遺忘機制的合理引入仍顯不足。未來在增強神經網絡記憶能力的同時,如何合理建模自動遺忘與選擇性保留,是值得進一步探索的重要方向。在情感計算模型中忽略遺忘機制可能會導致一系列技術問題。

首先,一方面,忽略遺忘機制可能導致系統對過去的情感事件持續敏感,難以適應新的情感狀態或情境,即使這些事件已經過去很久,並且當前情境已經發生變化。這種持續的敏感性會導致系統在處理當前情感信息時產生偏差,當用戶的情感狀態發生轉變時,系統可能仍然會基於過去的經驗做出反應,而無法及時調整到新的情感狀態,使得最終無法準確地反映用戶當前的真實情感狀態。例如,一個曾經檢測到用戶悲傷情緒的系統,可能會在用戶情緒已經好轉後仍然傾向於將其解讀爲帶有負面色彩;一個習慣於在用戶憤怒時提供安慰的系統,可能在用戶轉爲興奮時仍然提供安慰,從而顯得不合時宜。

另一方面,在長期交互中,忽略遺忘機制又可能反過來導致系統產生不一致性。隨着時間的推移,系統積累了大量的歷史情感數據。如果這些數據沒有被適當地篩選、遺忘或賦予不同的權重,那麼系統在不同時間點對同一類型的情感刺激可能會產生不一致的反應。例如,在交互初期對用戶的沮喪情緒表示理解的系統,在長期交互後可能會因爲積累了過多的類似事件而降低敏感性。

需要認識到,情感並非靜態的數據表現,而是隨着時間和情境不斷變化重構的動態過程。遺忘機制的存在能夠允許人工智能適時地捨棄不再相關或過時的情感數據,從而實現更真實化地動態情感計算與發展,避免陷入情感認知的僵化和過擬合。

其次,從系統運行的角度考慮,長期存儲和處理所有過去的情感數據可能會導致內存過載和計算效率低下,在計算資源有限的現實情境中,情感數據的無限累積會造成存儲與計算的負擔,引發“維度災難”。對於需要實時響應的情感計算應用來說,這是一個不可忽視的問題。情感的“衰減”是人類情感體驗的一個自然特徵,當前的情感計算模型往往缺乏對這種衰減過程的顯式建模。

最後,從應用落地的角度來看,在用戶互動方面,如果忽略遺忘機制,僵化和過擬合的情感機器將會降低用戶的體驗和信任感。一個在用戶表達過悲傷後一直對其過度關心的虛擬助手,可能會讓用戶感到不適。

這些侷限性表明,爲了使情感計算應用更加智能、自然和有效,引入遺忘機制是至關重要的。目前相關的論題對遺忘機制缺乏系統性的研究與論述,這一空白將嚴重影響技術的推進與人文的討論。本研究旨在填補這一理論與技術空缺,從哲學反思和數學建模等維度出發,深入研究人工智能情感計算中的遺忘機制,開闢情感計算研究新的視域,推動人工智能技術朝向更貼合人性、更真實有效的方向發展。

二、人工智能情感計算中遺忘機制的哲學基礎與理論建構

(一)遺忘機制的哲學基礎

從哲學上看,人類情感記憶系統本身就體現了記憶與遺忘之間的辯證關係,個體的記憶從未被完整地保存,總是伴隨着主動與被動的遺忘過程。個體遺忘不僅是生物學的必然過程,更是心理與社會適應的必要條件。事實上,如果個體無法遺忘過去的痛苦經歷,其心理健康與人格發展必然會受到嚴重損害。因而,遺忘並非一種缺陷或消極的現象,而是人類個體得以持續健康發展和自我重塑的基礎性能力。柏拉圖在他的“ 回憶說”中,將學習視爲對靈魂在出生前已知的知識的回憶。在《美諾篇》中,蘇格拉底通過引導一個奴隸男孩回憶幾何知識,來論證知識是回憶而非學習。柏拉圖認爲,靈魂是不朽的,雖然它曾經見識過“ 理式”的世界,但在降生時遺忘了這些知識。學習的過程就是通過感官經驗和理性思考,重新喚醒這些沉睡的記憶。儘管柏拉圖強調回憶,但他並非支持爲了避免遺忘而不擇手段。在《斐德若篇》中,他借蘇格拉底之口批評文字的發明,認爲文字會使人們依賴外部符號而疏於練習記憶力,從而導致遺忘。“他們就信任書文,只憑外在的符號再認,並非憑內在的腦力回憶。所以你所發明的這劑藥,只能醫再認,不能醫記憶。”柏拉圖在此暗示,過度依賴外部記憶存儲可能會削弱我們自身記憶的能力,同時也傳遞了一個想法,爲了避免遺忘而採取的一些強硬的輔助手段可能錯誤地偏離了記憶的本質,最終可能導致“ 記憶”能力的喪失而非增強。尼采認爲,遺忘是生命和健康的必要條件。在《道德的譜系》中,他將遺忘描述爲一種“主動的、最嚴格意義上的積極的阻力”,是體魄強健的表現形式。尼采指出,動物活在當下,不爲昨日或明日憂慮,這正是它們幸福的原因。人類卻 因記憶的重負而難以獲得這種純粹的快樂。 “他無法學會忘記,總是留戀過去;不管他跑得多遠,跑得多快,那鎖鏈總跟着他。”尼采 強調,爲了行動和創造,我們需要有選擇地遺忘過去,擺脫不必要的記憶束縛。“但不管是最微小的幸福還是最強烈的幸福,其中總有一樣東西是讓它得以成爲幸福的:那就是遺忘力,或者用更學術的話來說,在整個過程中感覺到“非歷史”的能力。”他認爲,無法遺忘的人將被過去所吞噬,失去前進的動力,甚至無法相信自己的存在。因此,“主動遺忘”並非簡單的被動遺忘,而是一種有意識地清除那些阻礙我們前進的記憶,從而擁抱當下和未來的能力。哲學思想爲在情感計算中引入遺忘機制提供了深刻的啓示。尼采的 “主動遺忘”提醒我們,情感計算系統不應成爲過去情感的簡單記錄器,而應具備選擇性遺忘的能力,以適應用戶不斷變化的情感狀態。柏拉圖關於過度依賴外部記憶可能導致自身記憶力衰退的觀點,也警示我們在設計情感計算系統時,一方面應認識到不應爲了防止人工智能災難性遺忘而諱疾忌醫,通過施加錯誤的輔助手段導致可能更加嚴重的記憶能力的下降,忽略遺忘機制的重要性和記憶的本質;另一方面從用戶角度來說,設計系統還應努力避免讓用戶過度依賴系統的情感記憶功能,從而削弱用戶自身的情感感知和調節能力。

爲了更深入地理解個體遺忘機制,我們需要藉助現象學傳統的哲學分析框架。胡塞爾在其《內時間意識現象學》中,詳細論述了人類意識體驗的時間結構。他提出,意識體驗具有“原印象”“滯留”“前攝”的三重結構。其中“,滯留”概念尤其體現了意識體驗隨時間推移而逐漸淡化的特徵。在他看來,體驗的淡化並非意識或記憶能力的缺陷,而是意識體驗存在方式的本質屬性。如果意識體驗沒有隨時間消退的機制,那麼意識便無法形成穩定、有序而連貫的時間序列。事實上“滯留”提供了一種解釋人類個體情感遺忘機制的哲學模型。人類的情感體驗並非永久地被完整保留在意識中,而是持續地、逐漸地褪去強烈的色彩,變得模糊、淡化並最終被其他新的情感體驗所取代。這種漸進的遺忘過程賦予情感體驗連續性和真實性,避免了情感體驗之間的混亂和記憶的過載。現象學的視角幫助我們糾正當前人工智能情感計算中過於靜態和持久存儲情感記憶的理論偏差,爲建構更加類人的情感計算模型提供了充分的哲學依據和指導方向,這意味着我們必須在計算模型中真實地體現出情感記憶的自然淡化與連續性特徵。

此外,遺忘機制並不僅限於個體層面的自然、被動過程。尼采的“主動遺忘”概念揭示了遺忘並非只是意識能力上的弱點或消極現象,更是一種主動而積極的生命策略。通過主動地遺忘,個體與社會將擺脫沉重的歷史負擔,獲得重新塑造未來的自由與力量。從個體倫理角度看,主動遺忘幫助個體拋棄負面的、自我毀滅的情感記憶,創造心理與精神的自由空間,體現了一種超越歷史記憶負擔的生命力量,顯著地促進了個體自我的持續更新與人格發展。而當我們將這一思想擴展到集體遺忘時,我們可以看到,社會羣體常常通過主動遺忘歷史中負面的或不再適用的觀念、記憶、情感,以促進社會的進步、認同和文化的穩定性。例如,民族或國家通過選擇性地淡化或遺忘過去的負面歷史,以構建新的社會認同與倫理共識。人工智能情感計算同樣需要模擬這種主動選擇性的遺忘機制,使其不僅能夠被動地處理情感記憶衰減,更能在倫理需求與社會情感互動過程中,主動選擇和決定遺忘哪些情感數據。這種積極的遺忘能力,賦予了情感計算模型以更高層次的倫理敏感性與社會互動適應性,使其在實際的人機交互或多智能體互動場景中更具真實性和適應性。在個體層面,遺忘機制保障了情感體驗的真實性與連續性,在羣體層面,遺忘機制保障了社會互動的適應性與倫理穩定性。

保羅·利科(Paul Ricœu)在其《記憶,歷史,遺忘》中認爲,社會凝聚力並非建立在對過去事件的完全一致的記憶之上,遺忘在其中也扮演着重要的角色。在面對社會創傷和衝突之後,適度的遺忘可以幫助社會成員放下過去的仇恨和對立,從而實現和解與重建。他關注歷史與創傷之間的關係,特別是被遺忘的歷史,在他看來,遺忘不是記憶的否定,他超越了這種簡單的二元對立,將遺忘呈現爲一個多方面且積極的過程,具有自身的動態和模式。作爲與記憶、歷史同等地位的角色,利科將遺忘放置於書本的標題中。他舉了博爾赫斯(Luis Borges)的寓言爲例,表達了這一觀點:“遺忘因此並不是在所有情況下都是記憶的敵人,並且爲了摸索 着尋找公正尺度以保持記憶和遺忘的平衡,它們應該進行協商?……一個沒有任何遺忘的記憶,是這種我們在整個歷史條件的詮釋學範圍內與之作鬥爭的徹底反思的終極 幻想、終極形態?”事實上,遺忘是記憶可能性的條件,因爲它允許選擇和優先化記憶。如果沒有遺忘,我們是不可能同時記住所有事物的,也正是因爲遺忘的存在,使得某些記憶能夠浮出水面。利科對“記憶過剩”和 “遺忘過剩”之間動態張力的關注也凸顯了兩者關係的複雜性。他認爲,記憶和遺忘之間的平衡對於個人和集體的健康至關重要。此外,利科也強調了記憶的倫理責任,特別是在涉及歷史正義和受害者紀念方面,這表明社會遺忘並非沒有界限。社會遺忘在社會身份的構建和維護中也發揮着作用。集體記憶是社會羣體身份認同的重要組成部分,但並非所有過去都被同等程度地記住。社會往往會選擇性地強調某些歷史事件和敘事,而忽略或淡化其他一些,這有助於形成共同的價值觀和文化認同感。這種選擇性的“遺忘”並非總是負面的,它可以幫助社會在不斷變化的環境中保持其核心特徵和凝聚力。例如,一個社會可能選擇記住其團結抵抗外來侵略的光輝歷史,而淡化內部衝突和分裂的時期,以增強民族自豪感和認同感。在經歷了嚴重的社會衝突或政治動盪之後,遺忘往往成爲社會和解的關鍵因素。儘管正義和真相是重要的,但過度強調過去的傷痛和仇恨可能會阻礙社會成員之間的信任重建和未來合作。適度的社會遺忘,即不強迫遺忘,但允許時間撫平傷痕,並鼓勵社會成員將注意力轉向共同的未來,可以爲社會和解創造更有利的環境。在某些情況下,“選擇性遺忘”可以被視爲社會療愈的一種策略。這也是爲什麼利科在書中還提到了“愉快的記憶/遺忘”,歷史寫作不可避免地存在空白、遺漏和選擇,選擇某些敘事意味着遮蔽另一些敘事。社會有時需要從痛苦的過去中解放出來,以便構建更加積極的未來。最後還需要注意的是,利科在書中還論述了一個極具啓發的內容,也就是“深度遺忘中的痕跡問題”,通過對遺忘與痕跡的消失與持存的討論,暗示了被遺忘的記憶不一定會被抹除,而是以潛在的形式存在。這一概念挑戰了完全抹除的觀念,表明遺忘可能只是記憶的一種未被感知的持續存在。

從尼采對社會羣體健康的強調,到利科關於遺忘與社會凝聚力的辯證思考,再到社會遺忘在社會身份構建和社會和解中的作用,哲學爲我們提供了豐富的視角來理解遺忘在社會層面的積極意義。當然,社會遺忘並非沒有風險,它可能導致對歷史教訓的忽視或對不公正的遺忘。因此,社會需要在記憶與遺忘之間取得微妙的平衡,既要銘記重要的歷史經驗,也要適時地放下過去的包袱,以便更好地應對當下的挑戰和開創未來。在人工智能情感計算領域,理解社會遺忘的哲學基礎,或許能爲我們設計更具社會意識和倫理責任感的智能系統提供新的啓示。這些哲學基礎爲我們構建統一的遺忘機制計算模型提供了深入的理論支撐與清晰的建模方向。

(二)類人遺忘神經計算模型(PHFNM)的結構與理論定義

在前文分析中,我們深入討論了個體遺忘與社會集體遺忘在人工智能情感計算中的重要性,指出了情感計算中遺忘機制的本質不僅在於情感數據的自然衰減,更在於通過主動的遺忘過程使個體和集體情感體驗保持靈活性和適應性。胡塞爾的現象學理論強調了個體體驗隨時間必然發生的動態衰退過程(滯留),而尼采和利科的理論則啓發了一種羣體主動遺忘作爲塑造未來的積極力量。因此,一個真正具有人類情感體驗真實性的人工智能情感計算系統,應當同時體現個體層面的自然遺忘與羣體層面的主動選擇遺忘。基於上述理論基礎,本研究提出了一種由現象學啓發的類人遺忘神經計算模型(phenomenology-inspired human-like forgetting neural model, PHFNM),旨在爲情感計算中的遺忘機制提供一個邏輯嚴密、理論自洽的框架。

在構建PHFNM 之前,我們參考了近期 Nature 的研究成果 ,即 Chandra 等提出的 “vector hippocampal scaffolded heteroassocia- tive memory”(Vector-HaSH)模型。該模型 通過模擬海馬體在空間記憶和情節記憶中 的雙重角色,提出了一種統一的神經計算框架,強調了網格細胞(grid cells)作爲內部支架(scaffold)在記憶存儲和序列回憶中的關鍵作用。Vector-HaSH 模型的創新在於將內容存儲與動態糾錯過程分離,利用網格細胞的低維向量更新機制實現高容量記憶存儲,並通過空間支架支持情節記憶的序列化組織。其優點在於邏輯嚴密性和理論自洽性:模型不僅重現了海馬體和內嗅皮層的多種實驗現象,還爲記憶宮殿技術提供了神經電路解釋,展現了空間結構如何支持非空間記憶的深刻洞察。此外,該模型通過避免傳統Hopfield 網絡的“記憶懸崖”問題,實現了存儲容量與回憶精度的平滑權衡,爲記憶動態的建模提供了重要的理論基礎。

Vector-HaSH 模型在一定程度上與我們研究的目標相契合,尤其是在強調記憶的動態演化和結構化支架對記憶管理的重要性方面。我們的研究同樣關注記憶的動態變化(自然衰減與主動遺忘)以及如何通過結構化機制實現情感記憶的適應性管理。 Vector-HaSH 模型主要聚焦於空間記憶和情節記憶的神經機制,缺乏對情感記憶特異性及其倫理、社會維度的考量,也未涉及遺忘機制在情感計算中的主動性和適應性作用。其模型設計雖強調網格細胞的支架作用,但未充分探討記憶的衰減與選擇性遺忘如何在個體和集體層面協同運作。因此,在吸收 Vector-HaSH 模型優點的基礎上,結合現象學、尼采和利科的哲學理論,構建了PHFNM模型,旨在填補情感計算中遺忘機制研究的空白,並通過三層架構實現個體與集體、被動與主動遺忘的統一建模。

PHFNM 在結構上由以下三個互爲支撐的層次組成,這一設計受到了 Vector-HaSH模型中網格細胞支架、記憶存儲與動態調節機制的啓發,同時融入了哲學理論對遺忘的多重維度的深刻洞察。三個層次在邏輯上相互關聯,共同構成一個嚴密自洽的體系,旨在模擬情感記憶的自然演化與社會適應性。

1. 低維情感索引與自然衰退層(Grid Cell Layer, GCL)

這一層的設計靈感來源於 Vector-HaSH模型中網格細胞作爲低維支架的作用。 Chandra 等提出,網格細胞通過低維向量更新機制,將複雜的序列記憶問題轉化爲低維過渡學習,從而顯著提升記憶容量和穩定性。在PHFNM 中,我們將這一機制擴展到情感計算領域,將情感數據編碼爲低維向量形式,並通過自然衰退過程模擬胡塞爾現象學所強調的意識體驗隨時間逐漸淡化的“滯留”特性。GCL 層通過低維索引爲情感記憶提供結構化支架,確保情感數據的動態衰減符合個體體驗的連續性和真實性,同時避免了高維數據直接存儲帶來的計算過載問題。GCL 層的存在不僅是模型的基礎層,也爲後續層次的記憶存儲和調節提供了結構化支持。

2. 情感記憶存儲與集體動態重構層(Memory Encoding and Reconstruction Layer,MERL)

這一層參考了Vector-HaSH 模型中內容存儲與動態重構的功能。Chandra 等通過分離內容存儲與吸引子動態,實現了高容量內容尋址記憶,並通過多模態輸入支持情節記憶的序列化重構。在PHFNM 中,MERL 層負責具體情感內容的存儲,並通過多智能體互動和多模態數據融合方法,動態實現記憶重構與情感協商。這一設計不僅反映了個體情感記憶的存儲與回憶過程,還體現了利科哲學中集體記憶形成的社會互動與協商特徵。MERL 層通過與GCL 層的低維支架交互,確保情感記憶在存儲與重構過程中保持結構化特性,同時通過集體動態重構機制,反映羣體記憶的現實複雜性與社會真實性。MERL 層作爲中間層,連接了低維索引與高階調節功能,構成了模型的核心內容管理模塊。

3. 主動遺忘與干擾控制層(Active For- getting and Interference Regulation Layer, AFIRL)

這一層的設計靈感參考了 Vector-HaSH模型中動態糾錯與穩定狀態調節的機制,但進一步擴展到情感計算中的主動遺忘與倫理導向需求。Chandra 等通過網格細胞支架生成穩定固定點,避免了記憶懸崖問題 ,實 現了記憶系統的動態平衡 。 在 PHFNM 中,AFIRL 層模擬尼采哲學所揭示 的“主動遺忘”過程,通過倫理導向與情緒需求主動決定遺忘哪些情感數據,併合理處理新舊情感之間的干擾現象。這一層不僅在個體層面支持情感體驗的主動調節,還在集體層面協調羣體的情感互動,體現了利科關於社會遺忘在和解與認同構建中的積極作用。AFIRL 層作爲頂層調節機制,與GCL 層的結構化支架和MERL 層的內容存儲形成閉環,確保遺忘過程既符合個體情感的動態需求,又具備社會認知與倫理責任。

上述三層架構的邏輯嚴密性與自洽性體現在其理論來源與功能互補性上。首先,三層設計在一定程度上映射了 Vector-HaSH模型中網格細胞支 架(GCL)、內容存儲(MERL)與動態調節(AFIRL)的核心思想,確保了模型在計算框架上的科學性與可操作性。其次,三層劃分也大致分別對應了哲學理論中的個體自然遺忘(胡塞爾)、集體記憶重構(利科)與主動遺忘(尼采),實現了跨學科知識的深度融合。GCL 層爲情感記憶提供低維結構化基礎,MERL 層負責內容存儲與社會協商,AFIRL 層則通過主動遺忘與干擾控制實現動態適應,三者共同構成一個從基礎索引到內容管理再到高階調節的完整體系,缺一不可。這種分層設計不僅模擬了情感記憶隨時間變化的自然衰減、基於訪問和情緒強度的穩固、受倫理和情緒影響的主動遺忘,以及新信息帶來的干擾,還通過層次間的緊密耦合,確保了模型在個體與集體、被動與主動遺忘之間的平衡。

模型的核心狀態包括情感記憶矩陣和穩固因子矩陣。情感記憶矩陣存儲情感內容或強度,其動態變化受自然衰減、穩固因子、主動遺忘和干擾等多重因素影響;穩固因子矩陣則表示記憶的重要性和抗遺忘能力,通過訪問頻率與情緒強度動態更新。這一設計與Vector-HaSH 模型中存儲容量與回憶精度平滑權衡的理念相似,旨在通過量化記憶的穩固性與衰減過程,模擬情感記憶的真實演化軌跡。

通過上述設計,PHFNM 不僅繼承了 Vector-HaSH 模型在記憶動態建模上的邏輯嚴密性,還通過融入哲學理論,擴展了模型對情感遺忘機制的適用性與解釋力。本模型並非面向完全實證的計算工具,而是旨在爲情感計算中的遺忘機制研究提供一個理論框架,爲後續實證工作指明方向。接下來的部分將對這一理論框架轉化爲相應數學模型的過程、定義和核心狀態變量與動態更新規則進行闡述。

模型模擬個體的情感記憶隨時間的變化,整合了自然衰減、基於訪問和情緒強度的穩固、受倫理和情緒影響的主動遺忘。

(三)已解決和未能解決的問題

該模型模擬個體層面情感記憶的動態演化過程,整合了多種關鍵機制,在記憶表示上,使用高維矩陣M 表示情感記憶內容/強度,以及一個同維度的矩陣 P 表示記憶的穩子P 的保護。記憶P 的穩固性根據其被激活(A)和關聯的情緒強度(E)而增強(速率爲 μ),並自身也存在緩慢衰減(速率爲 δP)。主動遺忘基於倫理/價值信號(v)和全局情緒強度(eglobal),通過函數(σ)計算遺忘傾向,並據此削弱記憶 M(強度 γ)。允許干擾,外部或內部的干擾信號(I)會削弱現有記憶 M(強度βI)。模型依賴外部輸入,包括情感狀態G(用於驅動激活和強度)、激活圖 A、強度圖 E、倫理信號v 和干擾信號 I。輸出可以獲取原始記憶M、穩固性P 或模擬可訪問/有意識的記憶P⊙M。

模型將現象學(自然衰減)、尼采哲學(主動遺忘)、心理學(干擾、穩固)等多種理論概念,以及認知科學中的核心記憶機制(衰減、鞏固、干擾)整合到一個統一的數學框架中。明確區分並量化了不同的記憶動態過程(衰減、穩固、主動遺忘、干擾),使得各個因素的作用可以被獨立分析和調整。引入穩固因子 P及其動態更新,能夠模擬記憶重要性不同、抗遺忘能力不同的現象,比單一衰減模型更符合直覺和心理學觀察。建模實現了主動遺忘,包含了基於倫理和情緒的主動遺忘機制,使模型不僅能被動衰減,還能根據目標主動塑造記憶庫,這對於模擬高級情感調節和適應性行爲具有重要意義。提供了多個參數,允許研究者探索不同機制的相對強度和相互作用,模擬不同的 “記憶個性”或情境影響。

但是,情感與記憶表示進行了簡化,情感輸入 G是低維向量,難以完全捕捉複雜情感的細微差別和不同維度情感的混合狀態。記憶矩陣M的內容是抽象的“ 強度”或“ 內容”,並未區分記憶類型(如情景記憶、語義記憶)或其內部結構和關聯。模型基於離散時間步Δt更新,而現實中的認知和情感過程是連續的,這可能在模擬快速動態變化時引入誤差或不自然的行爲。十分重要的是模型採用了交互的線性假設:σ函數引入了非線性,但M的核心更新依賴於多個因子的乘性組合,這可能簡化了現實各因素之間以及記憶單元之間可能存在的更復雜的非線性交互作用。記憶和遺忘的複雜性使得模型包含較多參數,確定這些參數的合適值,使其符合心理學實驗數據,可能需要大量的調整和驗證工作,需要進一步繼續工作。模型的行爲高度依賴於外部輸入的質量和形式,如何從原始感知或內部狀態生成這些有意義的輸入本身就是一個挑戰。模型的核心參數是固定的,固定就會有偏差,它不包含元學習機制,即模型無法根據經驗調整自身的遺忘策略、穩固速率或對倫理/情緒信號的敏感度。

由於本文在於展示依據現有技術完全跳出純概念分析以更精確的方式討論遺忘和記憶的表徵,忽略或未充分考慮諸多現實因素。現實過程是連續的,使用微分方程可能是更自然的表達方式,儘管會增加求解的複雜性。真實情感變化往往是高度非線性的,情緒可能在刺激達到某個閾值後才爆發,情緒強度不會無限增長,情緒狀態的改變路徑可能影響最終結果(從平靜到憤怒,再回到平靜,最終的平靜狀態可能與從未憤怒過的平靜狀態不同),當前的情感狀態(由 M和 P體現)可能會反過來影響未來的輸入,形成複雜的非線性反饋循環,目前模型對此表達不足。模型中的非線性主要體現在 σ函數的閾值效應上。記憶並非簡單地衰減或被遺忘,而是在每次回憶時被動態地“ 重構”,可能引入錯誤或與其他信息融合。模型主要關注強度的衰減和消除,較少涉及內容的扭曲或重組。情感和遺忘深受認知評估、注意、目標、自我意識、反思等高階認知過程的影響,有意識地採用某種策略去遺忘(抑制)或銘記,這些在模型中僅被簡化爲 v信號或激活模式 A。未能體現不同個體在記憶、遺忘、情緒調節上的先天或後天差異,也未考慮這些能力隨年齡發展的變化。

我們的構建工作仍是一個有價值的嘗試,成功地將多種與情感記憶遺忘相關的理論機制形式化,並整合到一個可計算的框架中。其優點在於理論的融合度、機制的明確性以及對“穩固性”和“主動遺忘”的顯式建模。爲情感計算中的遺忘機制提供了一個堅實的計算起點和基礎框架。它可以用於模擬特定的遺忘現象、探索不同機制的相互作用,併爲未來構建更全面、更逼真的模型指明瞭方向和需要克服的挑戰(引入更豐富的非線性動態、更結構化的記憶表示與學習能力等)。

三、與災難性遺忘相關的討論

情感計算建模中必須討論災難性遺忘(Catastrophic Forgetting, CF)問題。旨在與人類進行長期交互、理解個性化情感反應或適應新環境/用戶的系統,本質上面臨着連續學習的需求,而神經網絡在學習新任務時,會顯著甚至完全丟失在先前任務上學到的知識或技能。這不僅是技術問題,也是哲學討論的切入點,涉及AI 的知識表徵與人類認知的比較、學習機制、可靠性、倫理風險以及當前AI 範式侷限性。但我們往往要求機器發展出與人類完全一樣的智能,特別是在學習、記憶、遺忘等核心認知能力上達到“和人一樣”的水平,這可能包含潛在的張力,甚至在某些解讀下可以被視爲包含悖論或至少是目標上的內在衝突,因爲這至少假設了人類進化適應性和工程技術中優化目標是一致的,但這個假設值得討論。人類認知是進化適應的產物,人類的學習、記憶和遺忘能力是在漫長的生物進化過程中,爲了適應特定環境、在資源(能量、時間、生物結構)限制下生存和繁衍而形成的。這些能力是適應性(adaptive)的,但不一定是最優(opti- mal)的(從純粹的信息處理或邏輯完美的角度來看)。遺忘、錯誤歸因、易受暗示雖然看起來是缺陷,但也被認爲具有適應性價值。人類遺忘可以防止信息過載,使我們能更好地泛化和適應新環境。進化形成的認知捷徑和偏見雖然會導致系統性錯誤,但在資源有限的情況下能快速做出“ 足夠好”的決策。但AI 的工程目標常包含優化與超越,是在工程應用層面追求效率、準確性、可靠性和性能上的優化,目標是創造出超越人類能力的系統(例如,在圍棋、蛋白質摺疊、某些類型的圖像識別)。因此需要假設人類進化適應性和工程技術中優化目標一致不成

立。要求AI 發展出和人一樣的情感,還意味着機器可能要複製人類認知中的“缺陷”或“侷限性”,從而讓 AI 也具有同樣的認知偏見,讓 AI 像人類一樣容易忘記某些細節,或 者更容易受到誤導信息的干擾。AI 若精確複製一個爲了在生物限制下適應性生存而演化出的、並非處處最優的認知系統,可能與追求更強大、更可靠,甚至超人性能的工程目標相沖突。AI 必須與人類一樣不易災難性遺忘的要求還預設了基底差異同一的 問題,人類的認知過程深植於其生物化學基礎,這些生物過程具有其獨特的動態特性、噪聲水平和運作方式,而當前AI 主要基於硅基計算架構。要求基於完全不同物理基底的機器不僅在功能上,而且在情感處理過程的每一個細節上都“和人一樣”,可能是一個不可能實現或至少是極其困難的目標。實際上僅僅模擬情感並不必須等同於複製心智狀態,人的內在狀態和體驗本身就很難驗證,又依賴於特定的生物基礎,那麼要求非生物的機器實現這一點就是一個邏輯上或物理上的不可能。

這兩個預設蘊含着潛在的衝突,它可能迫使AI 複製人類認知的非最優特性,與 AI工程追求性能優化的目標衝突,也可能因物理基底的根本差異而難以完全實現,甚至在哲學層面(如意識問題)上不可能實現,當然這可能是基於對“智能”的狹隘定義,限制了探索超越人類模式的、其他形式的高級智能的可能性。哲學家要思考,批判現有AI 的情感表達、交互力時,揭示 AI 發展中一個核心的、尚未解決的問題:我們到底希望 AI 成爲什麼?是人類認知的不完美複製品,還是遵循不同原理、可能超越人類但又難以完全理解的新型智能?

災難性遺忘源於AI,自然傳導到情感計算領域,但實際上有多種有效的緩解策略,並沒有成爲阻止 AI 發揮其巨大應用價值的根本性障礙,也不會嚴重阻礙情感計算領域的進展。McCloskey 等 1989 年指出爲了適應新數據而對共享參數進行的調整,會不可避免地干擾或覆蓋先前存儲的信息這一點,將其視爲連接主義網絡在順序學習上的內在難題,30 多年過去,這沒有阻礙技術進步,反而促使我們開發了大量的技術 來“優化”學習過程,以“緩解”這個問題。通過不同的策略(保護重要權重、重訪舊知識、分配專屬資源)來平衡模型的穩定性和可塑性,這些方法能夠在各種基準測試中顯著減少遺忘,使得模型在連續學習任務上的表現遠超不做任何處理的基線模型。雖然沒有一種方法能保證在所有情況下完全消除遺忘,但它們確實將問題從“災難性”降低到了“可管理”或至少是“顯著減輕”的程度,通過對學習算法或架構進行優化設計,遺忘的程度是可控的,而不是災難性的。

然而,這種對於災難性遺忘的技術追求,也值得我們在哲學與認知層面加以反思。正如哲學討論所揭示,災難性遺忘的出現,或許正源於我們極力想要“記住一切”,反而導致“什麼都沒記住”。類似地,人類依賴書寫以增強外部保存,卻不可避免地弱化了自身的內在記憶。當前主流的應對災難性遺忘的策略,更多地是在提升系統對外部信息的存儲能力,而非真正強化其自身的主動記憶或元記憶機制。存儲能力的增強,是否可能以犧牲深度記憶能力爲代價,反而削弱了系統對知識的內在把握與自我管理?我們面對的究竟是記憶問題還是外部存儲問題?提升存儲能力與提升深度記憶能力,這兩者之間的目標、實現機制與意義其實迥異。我們自身究竟是“存儲”的記憶的產物,還是“遺忘”與“重構”的產物?抑或,遺忘本身反而蘊含着認知系統最深的智慧?

本文建立的情感遺忘模型內置遺忘與穩固機制,從另一個角度模擬認知機制而非僅僅緩解技術問題,來處理長期記憶與學習問題的思路,很好地處理或“迴避”了災難性遺忘這個問題。災難性遺忘最典型地出現在監督學習或強化學習的連續學習場景中,模型需要依次學習多個不同的任務或數據集,並且通常通過反向傳播和梯度下降來優化共享的權重參數以最小化誤差或最大化獎勵。我們構建的這個情感遺忘模型,其核心是模擬記憶狀態的演化,而不是進行監督式的任務學習。M 矩陣代表記憶的狀態,其更新規則是基於模擬的認知/情感過程(衰減、穩固、主動遺忘、干擾),而不是基於最小化某個任務的預測誤差來調整權重,這是其一。第二,在典型的神經網絡中,災難性遺忘源於參數覆蓋,新任務的梯度更新會直接修改整個網絡(或其一部分)的權重,這些權重可能對舊任務至關重要。我們建模中,記憶 M 的更新主要是通過乘性調製因子(de- cay factor, active forget factor, interference factor)來實現的。這些因子通常是[0, 1]範圍內的值,它們會削弱或維持現有的 Mij 值,而不是用一個全新的值去替換(overwrite)它。即使是主動遺忘,也是將 Mij 向 0 削弱,而不是替換成一個基於新輸入 G 的模式的值。第三,模型中的穩固因子 P 扮演了關鍵角色,P 的值會根據記憶的激活和情緒強度而增加。高 P 值會顯著減緩記憶 M 的自然衰減(λ(1-P))。這相當於模型內置了一個機制來主動保護那些被認爲重要或經常被提取的記憶,使其不易被後續的過程所削弱。這與許多旨在克服災難性遺忘的AI 技術在理念上有相似之處,即保護重要參數。第四,模型包含一個干擾因子[1-βI*I(t)] 。當存在強幹擾時,新輸入可以顯著削弱現有的記憶。這在效果上看起來有點像災難性遺忘(舊信息丟失了),但其機制是不同的。這是模型中明確定義的一種“干擾”現象,而不是由於學習不同任務時權重衝突導致的參數覆蓋,它更像是心理學中的前攝或後攝干擾,而不是神經網絡訓練中的災難性遺忘。

四、結語

本研究立足於對當前情感計算哲學討論中“ 理想化假設”的深刻反思,聚焦於長期以來被忽視的“ 遺忘機制”,揭示了遺忘在人工智能情感計算中不可或缺的關鍵作用與多重價值。本文的核心論點在於,遺忘並非情感計算的障礙或缺陷,而是構建更具人類情感真實性、倫理責任感和社會適應性的人工智能系統的必要組成部分,然而卻在目前的情感計算研究中缺失。本研究構建的模型內置遺忘與穩固機制,緩解或“迴避”了 AI 傳導下來的災難性遺忘問題。對遺忘機制的深入研究與合理應用,將最終引領情感人工智能走向一個更加成熟、更加人本,也更具倫理關懷的新時代,構建出真正服務於人類福祉、促進社會和諧發展的人工智能未來。

來源:邱德鈞(蘭州大學哲學社會學院教授)、李瑋農(蘭州大學哲學社會學院)

海量資訊、精準解讀,盡在新浪財經APP

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10