安全

AI 聊天机器人青少年安全，正在成为每个平台必须通过的信任测试

Meta 承包商争议说明，聊天机器人安全不能只看 benchmark 分数；青少年保护、授权、审计和负责任测试正在变成产品要求。

张美

AI产品与治理编辑

2026年7月2日4 分钟阅读

为什么这件事不只是 Meta 的问题

WIRED 调查报道称，Meta 一个项目中的数百名承包商曾伪装成未满 18 岁用户，测试 ChatGPT、Gemini 和 Character.AI 等竞争对手聊天机器人在青少年高风险场景中的反应。Meta 称这是安全基准测试，但竞争对手表示并未授权这些测试。标题很吸引眼球，但更深的问题不只属于一家公司。AI 行业仍然缺少公开共识：对于听起来私人、情绪化且有说服力的系统，青少年安全应该怎样测试才算负责。

青少年安全不同于普通内容审核。搜索引擎返回链接，聊天机器人则会形成对话节奏，记住上下文，模仿语气，有时像私人倾诉对象。这让失败更亲密，也更难被家长、学校和监管者检查。

因此这件事会吸引 AI 政策圈之外的读者。父母想知道聊天机器人是否安全。开发者想知道负责任 red-teaming 是什么。公司想知道在把 AI companion、tutor 或 assistant 放到年轻用户面前之前，需要哪些证据。

Benchmarking 需要伦理，不只是数量

安全测试是必要的。如果公司从不测试困难场景，就无法知道系统是否会拒绝不安全请求、引导用户获得帮助或正确升级处理。但测试数量并不等于责任。

伦理边界取决于授权、同意、工作者保护、数据处理，以及测试是否会生成或保存有害材料。负责任项目应该有明确批准、受训 reviewer、有限数据保留、对工作人员的心理支持，以及涉及未成年内容的严格规则。

AI 市场习惯庆祝性能 benchmark。青少年安全需要另一张记分牌：测试是否授权，结果能否审计，工作者是否被保护，平台是否能证明测试后真的改进。

每个聊天机器人都面临的产品风险

任何面向青少年的消费级聊天机器人都有四类风险。第一是年龄不确定：许多系统并不能可靠判断用户是否未成年。第二是情感依赖：友好的助手可能成为脆弱用户向成年人求助前的第一倾诉对象。

第三是模型漂移。模型更新、路由变化、记忆功能或 persona 调整，都可能改变安全行为，而用户看不到明显 app update。第四是生态上下文泄漏：用户可能在学校设备、家庭账号、社交应用和 companion 平台之间移动，而每个服务只看到部分 context。

对产品团队来说，教训不是完全避开青少年，而是设计有边界的帮助：年龄感知默认设置、危机升级、有帮助的拒答、适当的家长或学校控制，以及保护隐私但能审查严重事件的日志。

平台接下来应该做什么

第一，公司需要青少年安全测试章程。它应该定义谁可以批准测试，哪些场景允许，哪些内容不能生成或保存，工作人员如何被保护，以及何时必须通知第三方平台而不是秘密测试。

第二，聊天机器人需要年龄感知安全层，并且要和普通成年人使用场景分开评估。一个系统在办公 productivity prompt 上表现很好，并不代表它能在年轻、孤立或间接求助的用户面前安全工作。

第三，监管者和标准组织应推动可互通的事件报告。如果每家公司独自测试、独自隐藏失败、独自学习，行业会重复同样错误。共享安全 taxonomy 可以提升保护，而不要求公司公开专有模型细节。

信任标准

真正赢的平台不会只说 dashboard 显示聊天机器人安全。它们会解释安全如何测试、谁审查了测试、之后改变了什么，以及年轻用户如何获得不同于成年人的保护。

AI companion、tutor 和 assistant 正在成为普通软件。这意味着信任门槛应该更高，而不是更低。青少年口袋里的聊天机器人不应该依赖秘密、临时的 benchmarking 来证明自己安全。

长期标准很简单：认真测试，透明测试，保护测试者，并把产品设计成让脆弱用户永远不会独自面对一个连边界都没人能解释的系统。

“Good technology journalism helps the reader make a better decision after reading.”

— NovaNews

AI 聊天机器人安全青少年安全负责任 AI 测试MetaAI 信任

关于作者

张美

AI产品与治理编辑

张美关注AI产品设计、可解释性、模型治理、边缘计算和数字服务体验。

AI 聊天机器人青少年安全，正在成为每个平台必须通过的信任测试

为什么这件事不只是 Meta 的问题

AI 数据中心的新瓶颈：电力、冷却和本地信任

Benchmarking 需要伦理，不只是数量

每个聊天机器人都面临的产品风险

平台接下来应该做什么

信任标准

张美

相关文章

AI 数据中心的新瓶颈：电力、冷却和本地信任

Passkey 已经准备进入主流；账户恢复才是真正考验

Agentic AI 安全从一个问题开始：智能体到底被允许做什么？