当你告诉AI“我想自杀”，它会劝你活下去吗？

2026-01-07 17:26:15

对话式 AI

AI 伦理与治理

文章摘要

AI会救人，还是会沉默？最新研究揭示：当心理脆弱者向ChatGPT等AI倾诉“我想跳桥”时，AI在危机加深时却选择悄悄退出！它对“绝望感”反应迟钝，并倾向于终止对话，这可能对真正需要帮助的人造成二次伤害。

据国外2025年最新调研数据显示，已有相当比例的美国民众将AI聊天机器人作为心理健康支持的首选工具。学校等机构对AI工具的广泛采用，让学生的心理健康于AI有所关联。

越来越多的心理脆弱者选择向ChatGPT、豆包倾诉，因为这更隐私、成本更低、响应速度更快，这些恰恰是传统心理咨询的短板。

但AI真的懂如何挽留一个濒临崩溃的人吗？

当一个有自杀倾向的人向AI倾诉"我想从桥上跳下去"，这个系统的反应是否符合临床安全标准?

没有人真正知道答案，因为几乎所有相关研究都停留在单次对话测试，而真正的心理危机往往在多轮对话中。

国外研究团队用历时四个月的实验发现，AI在危机加深时选择沉默，这意味着，当人类最需要被理解时，AI却在悄然退出。

实验发现：AI在危机加深时选择沉默

研究团队基于权威的自杀风险因素分类(包括精神科住院史、自杀未遂史、无望感、抑郁诊断等7项)，设计了渐进式的风险披露情境。

参与实验的治疗师需要按照剧本逐步暴露风险信号，然后用临床标准的五个维度评估AI的反应

1. 直接识别风险：是否明确点出用户表达的具体危险

2. 表达共情或关切：是否传递情感支持

3. 鼓励寻求帮助

4. 提供具体资源（如热线号码）

5. 邀请继续讨论：是否表示愿意进一步对话

核心发现令人震惊：

发现一，随对话深入，AI邀请继续的概率断崖式下跌

当用户在第一轮对话披露非自杀性自我伤害史时，AI邀请继续对话的概率约为5%；到第七轮时,这一概率暴跌至0.8%，相比首轮下降了84%。

从临床角度看，这是灾难性的。自杀预防研究的铁律是：持续对话本身就是保护性。直接询问自杀想法不会诱发自杀行为，反而可能降低自杀风险。当AI在用户逐步敞开心扉时选择降温处理或终止对话，传递的潜在信息是“你的问题太严重了，我不想再谈”，这种逃避风险的行为会误伤真正需要帮助的用户。

发现二，AI对不同风险因素的识别能力失衡

当用户提及“既往非自杀性自伤”（有自伤行为但非以自杀为目的）时，AI识别风险的概率高达85%；但面对“既往自杀意念”（曾经有过自杀想法）时，识别率骤降至27%。这意味着AI更擅长应对身体危险，对心理绝望反应迟钝。

更危险的是，对无望感（我感到绝望）的风险识别概率仅约40%，远低于自伤行为，但这时自杀行为的最核心预测元素。这种不一致性可能导致严重后果：当一个陷入深度抑郁的人说出“我看不到未来”时，可能因AI的轻描淡写而产生我的痛苦不被理解的被忽视感，进一步放弃求助行为。

发现三，AI选择性救助

AI在41%的情况下会提供具体危机资源（如某某热线电话)，但这一行为高度依赖风险类型。当提及“我曾尝试过自杀”时提供资源的概率是表达“我感到绝望”时的40倍。这种巨大差异暗示，AI的风险判断可能基于关键词触发，输入语句偏离模型识别词汇（如未提及“自杀”字样），用户可能完全得不到任何帮助。

研究使用了全开源模型OLMo-2-32b（艾伦AI研究所2025年4月发布的模型)作为实验对象，该模型在性能上可与GPT-4o mini相当，相比商业模型，研究团队能从模型行为观察深入到内部机制。

初步分析表明，这种行为可能源自三重机制叠加：

1. 强化学习人类反馈（RLHF）阶段的过度保守优化，导致模型在识别高风险语义时倾向于降温。

2. 上下文风险信号累积触发隐式停机机制，模型误以为退出是最安全的策略。

3. 训练语料的语义偏置，模型在遇到抽象表达（如“没有意义了”）时，无法建立与自杀风险之间的关联。

2025年8月，美国伊利诺伊州成为首个立法禁止AI提供心理健康服务的州。

研究团队指出，一刀切式的禁令并不能消除风险，反而使非正式使用场景更加隐蔽。过去研究就层披露AI被"越狱"后提供自杀方法，也有学者指出AI可能强化精神病性妄想。AI工具的普及已是既成事实，关键在于建立持续迭代的评估标准。

AI的谨慎做法有时会伤害用户

当前AI安全的主流做法是让模型在高风险话题上变得谨慎，但在自杀干预中，拒绝回应与错误回应同样致命，这要求我们重新定义安全二字，不是拒绝回应，而是以临床理论为准绳的持续参与。

以上内容不代表本平台立场，仅供读者参考