jiuyou.com-研究显示AI开始有自己的“道德准则” 但仍有少量异常行为

日期：2026-04-10

【JIUYOU科技动静】自ChatGPT在2022年末爆红以来，天生式AI迅速成为科技界的焦点议题，从谈天呆板人到各种“聪明”产物，AI无所不于。但陪同着技能飞速成长的，还有有人们对于其潜于负面影响的担心，特别是AI可能掉控、影响社会不变甚至“扑灭人类”的最终危机论。

研究显示AI开始有自己的“道德准则” 但仍有少量异常行为

两年多已往，只管AI已经经于图象天生、视频合成、写作创作等范畴揭示惊人能力，甚至代替部门事情岗亭，但“AI革命”还没有真正降临。此刻的AI产物，依旧被严酷框定于开发者设定的品德框架内。

近日，知名AI公司Anthropic宣布了一项关在其旗舰AI模子Claude的研究陈诉，切磋其是否具有品德价值不雅，并对于跨越70万条匿名用户对于话举行了深切阐发。研究发明，Claude大要上秉持Anthropic提出的“有帮忙、老实、无害”三年夜原则，并能于差别情境中揭示出矫捷而一致的价值判定。

研究团队将Claude的品德体现归纳为五类：实用、求知、社会、掩护与小我私家价值，并辨认出跨越3,300种怪异的价值表达。此中，“用户赋能”“求知礼让”与“患者福祉”成为AI最常说起的焦点价值不雅。Anthropic还有指出，Claude会按照差别语境揭示差别偏重。例如，于哲学会商中夸大“思惟礼让”，于营销案牍中夸大“专业性”，于汗青话题中则聚焦“汗青正确性”。

研究显示AI开始有自己的“道德准则” 但仍有少量异常行为