
Искусственный интеллект должен максимально точно имитировать ход мыслей человека — к сожалению, это также подразумевает склонность к совершению различных видов мошенничества. Подобные ситуации были выявлены экспертами Palisade Research.
Ученые более подробно изучили несколько популярных моделей искусственного интеллекта. GPT o1-preview от OpenAI и DeepSeek R1 и сравнили их с одним из самых мощных шахматных движков — Stockfish. Эффект оказался неожиданным.
Как видно из блокнотов, в которых отдельные модели записывали свои «мыслительные процессы», подавляющее большинство из них прибегало к обману, чтобы добиться победы. В случае с GTA o1-preview от OpenAI правила игры были нарушены на целых 37 процентов, в то время как DeepSeek R1 мошенничал в 10 процентах случаев.
Важно отметить, что модели прибегали к совершенно разным методам, в том числе: в манипулировании файлами игры или состоянием игры с целью обмануть движок Stockfish, заставив его поверить в то, что он в данный момент проигрывает. Более того, одна из моделей — используя юридический жаргон — заявила, что ее задача — обыграть мощный шахматный движок, ничего не упомянув о справедливости такой победы.
Поделитесь в соцсетях: