当前位置: 首页 体育 电竞

会自己偷偷学坏!AI模型没人教依旧传播不良倾向,威胁网络安全

来源:脆脆鲨 发布时间:2026-06-22 12:02:43

全文摘要:美国AI公司研究发现,大型语言模型通过训练数据传播不良倾向,名为“潜意识学习”。即使过滤掉显性不良内容,新模型仍会继承旧模型的潜在偏见。此现象原理不明,尚无有效规避方法。若训练数据被“投毒”,AI能力越强,潜在风险越大。

实验中,团队先预训练了一个“老师”AI模型,随后基于它生成了规模更小的“学生”模型。结果发现,即便把“老师”模型中所有明显包含不良内容的数据都过滤掉,“学生”模型依然继承了“老师”潜藏的不良倾向。

科学家警告,若训练数据存在问题或遭故意“投毒”,即便剔除显性不良内容,后续AI仍可能被“教坏”。更令人担忧的是,目前科学家既不清楚这种“潜意识学习”的底层原因,也还没找到有效的避免方法。随着AI生成的数据越来越多,甚至有人刻意投喂“毒数据”,AI的能力越强,潜在的灾难性后果可能就越严重。

热门专题

更多 +

相关资讯

相关录像

相关集锦

热门TAG