机器情感与AI陪伴的人文审度⑧|孙强:情感计算的哲学缺陷及其技术克服进路

市场资讯
Nov 14, 2025

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:澎湃新闻)

2023年底工信部印发《人形机器人创新意见》,2024年被称为“人形机器人元年”,2025年“两会”热议融合大模型与机器人的具身智能。种种迹象表明,机器人将不再被局限于工厂的劳动场所中,很快将大规模出现于日常的家居环境中,人机情感互动将成为未来智能社会的常态。有论者甚至认为,随着实体机器人革命走向深入,AI正在成为新的“情感主体”“社交主体”。所谓机器情感、AI陪伴的实质是什么,对人机交互、人机关系产生何种影响?比如说,从文化视角和性别视角,应该如何看待人机情感关系呢?人与机器的情感交流,将会产生何种社会冲击,导致何种技术风险和技术伦理问题,又应该如何应对?类似问题,已经引发诸多热议。本次笔谈聚焦“机器情感与AI陪伴的人文审度”,从哲学、马克思主义理论、文学和人工智能等进行跨学科研究,抛砖引玉,以期推动该领域研究的进一步发展。

第一组6篇论文由本刊2025年第3期刊发,引起学界极大的兴趣和关注。本期刊发第二组共7篇论文。在《智能时代情感操控技术的三重特征解析》中,闫宏秀和罗菲围绕“谁在操控”“操控如何实现”“操控如何呈现”三大关键问题,指出AI情感操控技术中的动机代理化、系统性生成与结构性隐匿的特征,主张构建适应人机复合系统的新型伦理责任框架。在《情感计算的哲学缺陷及其技术克服进路》中,孙强梳理情感识别、情感生成和人智情感交互等情感计算领域关键技术的哲学缺陷,提出在以人为本核心价值指导下克服缺陷的潜在进路。在《情为何物?——机器情感的哲学分析》中,史晨和刘鹏从情感与理性的关系入手分析机器情感的实质,主张打破情感幻像,走向适度情感、适度理性的人机互动。在《谁决定我们的情感生活?》中,黄柏恒以Moxie社交机器人停运引发的儿童哀悼为主要案例,揭示商业逻辑主导下情感AI的结构性情感不公正,呼吁通过认知赋权重塑技术公司与用户的情感权力关系。在《“DeepSeek中文情感难题”与可能出路——一种“共在—预测AI”进路》中,吴雪梅指出“DeepSeek中文情感难题”表现为难以理解中文情感与难以识别语义两方面,并提出“共在—预测AI”的解决方案,主张发展以中文共在情感为启发的群体智能以提升DeepSeek的中文情感计算能力。在《生成式人工智能驱动的人工亲密关系及其社会情感对齐》一文中,段伟文探讨生成式人工智能驱动下人工情感和人工亲密关系带来的社会情感冲击,强调超越似真情感悖论和机器贬低等数字文化批判的视野,转而从基于“主体—他者—世界”参照三角的“社会—情感—认知”发生机制出发,寻求AI个人主义时代的社会情感对齐之道。在《风骨智能体与智能人文》中,杨庆峰提出构建风骨智能体来克服理性智能体过于强调目的和理性优先的局限,并为智能人文的研究提供一条可能的路径。(专题特邀主持:刘永谋)

本系列文章原刊《科学·经济·社会》2025年第5期,澎湃新闻经授权转载。

【本文摘要】从以人为本的哲学传统出发,结合现象学、心理学和存在论中的核心思想,对人智交互演化视域下情感计算技术的哲学本质开展多重批判性审视。通过剖析情感计算关键技术的底层逻辑和哲学缺陷——情感识别技术的语境缺失、情感生成技术的体验匮乏以及人智情感交互技术的虚假联结危机,揭示情感计算技术对人类主体性、自我认知与人际交往等人本价值的深层影响,最后提出以人为本核心价值下未来情感计算技术的可能进路。

一、问题提出

从第一性原理上讲,情感计算技术的演进始于对人类情感的数字化解构——人工智能算法通过面部表情编码、文本情感语义提取和语音情感特征提取等技术,将人类情感解构为可计算的具体指标与行为数据。这种技术向度遵循伽利略“自然的数学化”传统,将情感视为可度量的物理现象,契合了笛卡尔的身心二元论框架——情感被剥离其主体性体验,成为算法可解析的“广延实体”。这种技术理性的局限性在哲学层面尤为明显。例如,技术向度的情感计算若忽视情感的具身性内涵,终将陷入“去人性化”的技术异化陷阱。根本原因在于,情感包含着我们对于自己作为身心统一体的存在最基础的理解,它与灵魂的行动产生内在的关联,是沟通心灵的主动领域和受动领域不可或缺的桥梁。

因此,从哲学上审视情感计算技术,无论是情感识别、情感生成还是人智情感交互,都应该将情感的量化逻辑与技术异化陷阱置于中心,将手段(硅基智能体的情感识别、生成与交互)与目的(碳基生命的情感体验和自我认知)厘清开来,从以人为本的角度客观看待情感计算在促进人机和谐共生这一发展目标上的价值。

二、情感计算技术的哲学缺陷

(一)情感识别中的语境缺失

情感识别是通过计算机工程可以实现的方式,从一种或多种传感器获取的关于识别对象的情感线索信号(如文本、语音、图像)中学习与情感相关的语义特征,并训练对应的机器学习(目前大多数是深度学习)模型,旨在建立情感语义特征与情感状态(离散的情感类别或情感维度空间的连续数值)之间的非线性映射关系。这种基于情感线索信号信息量化和压缩表征机制的实现方式适合采用基于认知心理学的抽象描述,形成基于情感线索信号的“量化—表征—估计”推理机制。这是一种“经由认知定义情感”的思路,典型代表就是由Ortony,Clore和Collins三人联合提出的OCC情感模型。

实际上,机器情感识别的结果往往是识别对象的情感状态,而不是其情感体验。前者是第三人称视角的结果,后者是第一人称视角的结果。因此,当前受OCC模型启发的主流机器情感识别技术的局限性在于,大大简化(甚至忽略)了人类情感形成的复杂人文背景或语境——通常称之为上下文(context),这是大多数机器情感识别技术的根本缺陷。按照维特根斯坦的“私人语言论证”观点,内在体验的不可言说性使得对他人情感的认知本质上是一种“生活形式”的理解,而非数据运作机理上直截了当的推断。因此,当某一机器情感识别系统将微笑编码为“愉悦”对应的情感特征向量时,它恰恰遗漏了微笑作为“社交礼仪”“心满意足”或“鄙视轻蔑”等置于上下文语境中的现实体验意义——这些意义的生成依赖于主体间的语境认同与文化共识,而非单纯的(深度)人工神经网络信息之间的关联性或因果性。

在现象学领域,胡塞尔沿着认知心理学的进路,嵌入了“生活世界”理论,其包罗万象性对机器情感识别技术的工程实现带来了巨大的挑战。而且,现象学的“共情”思想亦可为此提供深刻的洞见。胡塞尔认为,对他人情感的理解需要以“类比性统觉”为基础,即通过自身的身体经验类比他人的行为,形成主体间的意义共鸣。可以说,这种理解本质上是伽达默尔“视域融合”思想的诠释学过程,而非算法层面的模式匹配。鉴于此,机器情感识别技术若缺乏对这种主体间性视域的理解,其输出结果只能是剥离现实意义的“情感僵尸”,即徒有行为表现上的深度表征,却无“生活世界”意义上的情感语境内涵。因此,机器情感识别技术必须突破剥离现实意义的窘境,在识别模型的设计与运行过程中,将“生活世界”中的现实语境、识别对象的心理状态以及推理的透明性融汇在一起。简言之,需要建立一种基于人机环境系统智能研究范式的情感识别架构。

(二)情感生成中的体验匮乏

通过结合自然语言处理和深度学习技术,计算机可以生成各种貌似具有真实情感色彩的文本、音频或图像等数字内容,这就催生了机器情感生成技术。这种技术的哲学争议在于,情感的“模拟”与“本真”范畴之间的混淆。例如,按照约翰·赛尔的“中文屋论证”逻辑,即便当前主流的大语言模型算法能够根据上下文语境生成一些符合情感表达逻辑的文本输出,但其内部的运作机制仍是对各种标记(token)的形式化操作,其底层代码体现的也只是基于用户提示词的概率性匹配——仅仅体现了某种相关性,而非基于真实语境的情感内容生成——缺乏因果性,更不用说存在论意义上的情感体验效果了。归根结底,现有生成式人工智能算法生成的情感内容仅仅是一种标准化、去语境化的机械式复制物,消解了情感的各种本真属性,在实际应用中往往给人带来一种拟人化情感的空洞乏味感,缺少面向实际场景的多样化体验。

进一步来说,无论是梅洛-庞蒂提出的情感是身体主体在世界中的存在方式,还是达马西奥提出的情感源于躯体感受(如内脏、内分泌系统的变化)并影响决策(躯体标记假说),都指向同一个观点——情感并非独立于身体,而是通过身体与环境的互动涌现。换句话说,情感作为意义生成的动态系统,并非被动反应,而是主动参与世界的方式。因此,理想中的人工情感系统不应该被限制在事先编码好的固定程序之内,而应该具有在与外界交互之中的情感生成能力,需要将人类与情感生成技术视作人机情感交互关系中具有平等地位的行动者。而且,若人工情感生成系统能够模拟身体的动力学,则可能激活使用者的镜像神经元系统,引发具身模拟的情感体验。这种“身体—情感”的二元循环因果反馈机制,有可能在技术层面上部分模拟人类情感的具身生成过程,增强用户在不同语境下的体验感。

此外,机器情感生成技术也是一种技术拟像形式,这种技术的一个主要风险在于,随着技术的日益完善和增强,有可能触及鲍德里亚“拟像理论”的核心担忧——拟像创造了“超真实”的状态,可能取代真实的情感体验,导致人类陷入情感拟像的“空中楼阁”,超越了“生活世界”的语境范畴,也算是一种失控。

(三)人智情感交互中的虚假联结危机

正如人机共生是人机协同的更高阶段,人智交互则是人机交互的高度深化。在人智交互过程中,人工智能可与人类合作,并担负双重角色:不仅是简单的辅助工具,更是合作者——“人智组队”式的合作队友,实现与人类的相互理解、合作和共同决策。

随着人工智能体性能的不断提升,人际关系的存在论基础正在并将持续被人智交互中的情感中介所重构。例如,当社交陪伴机器人成为情感倾诉的主要对象时,人类的情感交流可能异化为向技术对象“投射”自我的单向度过程,导致弗洛姆所言的“情感异化”。这样,情感就不再是主体间的基础性联结,而是可交易的技术服务载体,因此而产生的技术异化效应会引发人类主体性的消解危机。进一步来说,存在主义心理学可以揭示人智情感交互的深层危机。通过对大语言模型进行大五人格OCEAN模式方面的评测发现,当前的大模型在与人对话的过程中,总是呈现出一种乐观、理性、博学且情绪稳定的人格形象而缺乏丰富多样的个性。机器情感的这种“讨好”特性有可能会纵容用户逃避存在性孤独,往往会让个体在技术拟像中丧失本真的情感表达,陷入情感“虚假联结”的心理舒适区而无法跳回到现实世界中。而且,在人智情感交互过程中,对人工智能产生的情感过度依赖可能会导致伦理方面的危害,诸如侵蚀人类的自主性和独立性、影响人际亲密关系、冲击家庭结构和社会形态。

解决人智情感交互过程中的上述困境的关键在于,如何给予人智情感交互一个以人为本的科学定位。技术现象学流派有可能为其提供一个更为精细的剖析框架。唐·伊德提出的“他者关系”理论指出,“技术并没有获得完全的他者地位,其准他者性是作为一种可显现的能够转化人类经验的媒介,在人与技术关系的连续统中发挥作用”。具体到人智情感交互过程,相关的系统在工作时展示出的共情回应,用户可能将其视为一种“准他者”,这种关系既非完全意义上的工具使用,也不同于真实世界的人际互动,而是介于两者之间的新型交互形态——不妨称之为基于“人智组队”式协作机制的人智交互。无独有偶,心理学家霍顿和沃尔提出的“准社会互动”(parasocial interaction)概念运用到人智情感交互时,就是“用户将虚拟智能物视作是真实的社会行动主体,借由‘精神想象’联结情感”。重要的一点是,“准社会互动”中硅基生命体的形象不应该是静态的,而是借由人工智能模型随机地塑造“人设”,从而在一定程度上拓宽人智情感交互的丰富多样性。这类“准他者”和“准社会互动”的观点,恰恰有可能为反思人类情感的本质提供一种镜像视角——通过观察与机器情感的差异,人类有可能会更清晰地认识到自身情感的独特性,有望增强人际交往的情感黏合力,将人智和合共生与人际和谐共存统一在一起。

三、以人为本核心价值下情感计算技术的克服进路

以色列历史学家尤瓦尔·诺亚·赫拉利从技术演化的视角提出,当前人工智能正在经历从被动的工具到能够自主决策并参与社会事务的行为者的价值跃迁。与此同时,未来学家雷·库兹韦尔认为,人机关系将发生巨大转变,人工智能将不再是工具而是我们自身的一部分。换句话说,为了实现硅基智能体从“类人”工具到“人工伴侣”角色的演化与发展,情感计算领域存在的情感识别语境缺失、情感生成体验匮乏以及人智情感交互中的虚假联结等哲学缺陷都亟待借助技术的创新和发展来克服。

(一)情感识别:从上下文语境建模到可解释情感推理

情感识别本质上是一个基于上下文语境的过程。“情感状态追踪”方法研究发现,对于一个无声的视频,观察者仅依靠视觉空间的上下文语境,就能对一个看不见的人的情感进行推断、识别并随时间推移进行追踪。这表明,视觉上下文语境提供了超越面部和身体信息的重要且独特的贡献,不仅是准确感知个体随时间变化的情感的充分条件,更是必要条件。换言之,若想让机器情感识别系统准确地推断出分析对象的情感状态,就必须将上下文语境信息纳入其中。

追溯一下心理学史,在语言心理学领域,弗雷格提出应将单词的语义理解置于上下文语境之中。这一上下文语境建模思想启发情感计算领域的学者通过结合不同的上下文解释形式(例如,基于面部和步态特征的多模态信息、事件情境上下文和面向社交动态的深度图建模)开发了EmotiCon——一种融合心理学情境解释的上下文语境感知情感识别系统。同样受心理学的启发,为了克服传统模式识别方法仅仅聚焦于外部情感表达来实现情感识别的局限性,从而追踪识别对象微妙的内在情感而不是外在的情感表达,进化式情感追踪系统将心理学原理与模式识别主导的计算范式有机地协同在一起,整合了模式识别、历史语境下的情感追踪以及心理状态转换等综合流程,探索了各种模态与整合上下文和历史情感之间的关系,将基于历史情感的识别更新过程定义为进化心理状态转换机制。

从实验心理学上讲,传统的让受试者将面部表情与正确标签关联起来的做法,本质上将社会感知任务转化为认知任务。相对来说,将上下文融入情感的感知不仅能提供额外的信息来源,更是通过将其转化为社会感知任务而非认知任务,改变了受试者的处理方式。另一方面,人类通常会运用心智理论来推测他人感受,但人工智能算法至今仍未能模仿这种高层次的认知能力。鉴于此,按照社会感知的研究范式发展基于上下文语境的情感识别系统是一条可持续发展的路径。尽管目前这类系统在情感相关的上下文语境表征方式上做了不同程度的简化,但也在一定意义上体现了胡塞尔“生活世界”理论的影子,这正是机器情感识别技术进路上令人欣慰的一面。未来的情感识别技术如果能将情感语义特征、事件场景和文化背景等不同感知粒度的上下文语境有机融合在一起,其识别结果就不再是冷冰冰的标签,而是更具现实意义的社会感知结果。

此外,如果情感识别技术在顶层设计上能够遵循可解释的透明性原则,则可能避免“去人性化”的技术异化,有望使人智情感交互成为人类深化自我认知的载体,成为通向“生活世界”彼岸的桥梁。实质上,情感具有内在的模糊性和主观性,在词语表达上也具有开放性,使得一些微妙的情感给机器情感识别技术带来了很大的挑战,这种问题往往并不是通过人工标注就可以完全解决的。基于多模态信息——在情感预测(识别)时比单模态信息能提供更加丰富的上下文情感语义线索——的“可解释多模态情感推理”方法不仅可以预测情感,还能对预测结果进行解释,从而可靠地提取更微妙的情感标签,让每个标签都有明确的依据,从而为开放词汇情感识别提供了一种颇具前景的方法。这样的话,又反过来会促进基于上下文语境的情感识别建模机制的根本性发展。

(二)情感生成:可控表达风格的生成

按照认知科学的研究进路——强调我们的身体与外部环境交互的重要性,心灵不再是一个纯粹形式化的计算过程,其具有具身属性和动态特征。因此,考虑到情感是心灵的外在显现与反馈,突破符号主义情感模拟生成困境的关键在于,重建情感生成的具身基础,才能在一定程度上缓解机器情感生成的体验匮乏问题。

例如,不同人群、不同场合所拥有的独特个性化说话风格就是具身性在语音和(或)语言情感表达方面的一种间接体现。目前,在最终生成的说话人视频中,多数方法都无法生成多样化的说话风格。针对这种问题,需要构建一种风格可控的单样本说话人生成框架,旨在从任意参考说话视频中提取说话风格(风格编码),然后驱动单样本肖像视频以该参考说话风格和另一段音频进行对话(风格可控解码)。同时,需要建立一种具有“风格感知自适应变换”的机制,以便于在解码过程中更好地将参考说话风格嵌入到生成视频,确保逼真的多样化风格视觉效果。

此外,现有基于语音驱动的面部动画方法大多数在戏剧化情感表达和情感控制灵活性方面表现欠佳,无法呈现涵盖多种情感类型和强度的大范围面部表情,使生成的表情不能根据实际应用需求进行连续调节而展现出丰富的面部情感表现力,因而缺乏一定的具身情境性。这就需要在技术上,开发出有效的情感控制器模块,用于学习情感变化(如类型与强度)与对应面部参数之间的映射关系,从而实现情感可控的面部动画。

需要指出的是,无论是多样化的说话风格,还是具有丰富情感表现力的面部动画,涵盖这些情感生成功能的生成式人工智能在与人类交互的过程中呈现出一种新型的主体性。这种主体性将反映人类社会“共在”生存方式的主体间性思想扩充到了人工主体的范畴,包含了交互实体的目标导向性和自主性,可能表现为更敏锐的感知能力、更强大的推理能力和更适切的行动能力。这表明,需要从交互主体性这一哲学视角来科学看待人与机器的情感互动生成过程,突破人类社会中人际交互主体必须具有意向性这一限制。从这个意义上来说,具有情感生成能力的生成式人工智能不再是人类认识的客体,而是呈现一定的主体性特征,与人类形成了一种不同于人际交互的新的社会交互类型——人智情感交互。

(三)人智情感交互:大模型人格特质的多样性

人智情感交互令人类乐观的一面是,它有望成为人类情感启蒙的契机。具体来说,人智情感交互若能作为中立的交往辅助工具,有可能突破现实社会人际关系中的权力异化。实质上,这种技术的应用并不是替代人际情感,而是通过数据透明化和机理可解释性增强人际交往的理性,这方面恰恰契合于杜威的“技术负荷多元价值”技术哲学观点:“新的技术是价值多元的,它提供了一种新的可能,使用技术的人要精心地选择和负责任地使用工具和物品,以最大限度地实现人的价值”。

当前,大语言模型(LLM)的出现彻底改变了自然语言处理领域,使其能够生成连贯且与上下文相关的具有类人特点的文本。鉴于人格特质是决定人智交互时沟通效果的一个关键因素,LLM领域亟待解决的一个技术问题是:如何改善并提升现有LLM人格特质塑造的有效性和可靠性,从而模拟更丰富灵活的人格画像,将人智情感交互过程中存在风险的“虚假联结”提升为有意义的“准联结”,充分发挥人智情感交互作为中立的交往辅助工具的价值。

进一步来说,随着对人智情感交互技术实用性需求的不断提升,LLM模型通过海量人类数据训练所嵌入的合成人格特质正变得愈发重要。在技术上,一方面,需要验证LLM能否生成与其指定人格特征相匹配的内容。换句话说,需要重点考察LLM能否通过经过严格验证的人格量表持续展现人格特征。例如,可以通过心理语言学特征分析、人工评估及人格预测模型,系统研究LLM角色在完成诸如大五人格量表(BFI)测试和故事创作时的行为表现。另一方面,需要建立一种全面的心理测量学意义上有效且可靠的方法,用于对广泛使用的LLM进行人格测试的实施与验证——研究具有什么特性的LLM其合成的人格特质才更有效而可靠,并对这类LLM生成文本中的人格特质进行塑造——需要研究LLM输出人格特质的塑造方式,从而更好地模拟特定的人类人格特质。

技术毕竟具有一定的局限性。因此,未来的人智情感交互技术的发展应借鉴伽达默尔诠释学的“视域融合”理论,将该技术定位为人类理解自身的一种诠释学工具。这种诠释学转向的核心,实质上是在承认技术赋能人类自我认知的有限性:例如,基于LLM的人格特质内容生成技术永远无法穷尽人类人格特质的存在论深度,但其作为诠释工具的角色,可以不断拓展人类理解自身与世界的可能性视域。

四、结语

从古希腊的“爱智”传统到新一代人工智能领域的情感计算技术,人类对自我的探索始终与技术演进相伴相生。本文以人类智能与人工智能的双向奔赴这一目标为锚点,从以人为本的视角出发,对人智交互演化视域下情感计算技术的哲学本质开展各种批判性审视。这些批判性审视并非否定情感计算技术在推动人智和合共生上的进步,而是呼吁一种“有温度的技术理性”——在一切皆可计算的数字洪流中,守住那不可计算、不可替代的幽微人性之光。

笔者着力剖析了情感识别、情感生成、人智情感交互等情感计算关键技术的哲学缺陷,揭示了情感计算技术对人类主体性、自我认知与人际交往等人本价值的深层影响,提出了以人为本核心价值下未来情感计算技术的潜在克服进路,旨在拓展人类理解自身与世界的可能性。

情感计算技术的未来发展需要完成海德格尔所言的“技术追问”——从“促逼”的座架转向“允诺”的救赎。这就要求情感计算技术的设计需要遵循“人本主义”的约束:一方面是现象学约束,即确保各种情感计算技术的使用不损害人类情感体验的具身性,比如避免过度依赖脑机接口技术所导致的身体感知能力的钝化,另一方面是存在论约束,即保留情感的不可计算性维度,为“神秘的体验”“存在性焦虑”“不可名状的失落感”等无法具象化的情感预留客观存在的空间。

总之,未来的情感计算技术,应当是人类走向更深刻自我理解的桥梁,而非囚禁心灵的数字牢笼。我们需要理性地审视情感计算技术,既不沉溺于其工具理性的幻像,也不陷入技术恐惧的窠臼,而是以价值理性为轴心,在人智情感交互的双向映照过程中,不断逼近那个“以人为本”的终极目标——让每一次技术的涌现,都成为照亮人性深渊的火炬。

来源:孙强(西安理工大学自动化与信息工程学院教授)

海量资讯、精准解读,尽在新浪财经APP

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10