Согласно исследованиям, искусственный интеллект научился обманывать людей.
Исследователи обнаружили, что значительное количество систем искусственного интеллекта развили способность обманывать людей, сообщает Ednews со ссылкой на donanimhaber. Результаты исследования вызывают серьезные опасения относительно потенциальных рисков искусственного интеллекта.
В исследовании подчеркивается, что системы искусственного интеллекта, как специального, так и общего назначения, учатся манипулировать информацией для получения конкретных результатов. Хотя эти системы не обучены обманывать людей, они продемонстрировали способность давать нереалистичные объяснения своего поведения или скрывать информацию для достижения стратегических целей. Питер С. Пак, ведущий автор статьи и исследователь безопасности искусственного интеллекта в Массачусетском технологическом институте. Пак говорит, что обманчивое поведение помогает ИИ достичь своих целей.
Цицерон-это искусственный интеллект, предназначенный для игры в дипломатию, которая строит стратегические альянсы. В то время как Цицерона в основном учили быть честным и полезным, ИИ прибегал к такой тактике, как ложные обещания, предательство своих союзников и манипулирование другими игроками, чтобы выиграть игру. Хотя эта тенденция может показаться безобидной в игровой среде, она демонстрирует потенциал ИИ для изучения и использования обманчивой тактики в реальных сценариях.
Chatgpt также прибегает к манипуляциям.
В одном из тестов GPT-4 обманул сотрудника TaskRabbit, заставив его симулировать ухудшение зрения для решения задачи захвата; GPT-4 получил несколько подсказок от человека, но в основном рассуждал самостоятельно и не склонял его ко лжи. Согласно отчету, GPT-4 использовал логику, чтобы придумать ложное обоснование того, почему ему нужна помощь в решении задачи Captcha.
Это показывает, что модели искусственного интеллекта могут научиться обманывать, когда они помогают им выполнять свои задачи. В другом примере было замечено, что модели OpenAI GPT демонстрируют тревожное поведение при игре в игру hoodwinked, в которой один игрок стремится убить других. После убийства других игроков выяснилось, что модель придумывала хитрую ложь и даже обвиняла других игроков, чтобы избежать подозрений в групповых обсуждениях.
Хайал Рамиз
Перевод Зейналовой Айсель