«Disagree Bot против ChatGPT: почему нам нужны ИИ, которые спорят с нами»

Попросите любого фаната Тейлор Свифт назвать её лучший альбом — и вы рискуете слушать страстные аргументы до конца дня. У меня, как у преданного слушателя, свои фавориты: Red, Reputation и Midnights. Но вопрос «какой альбом лучший?» не имеет однозначного ответа — и именно поэтому он идеально подходит для необычного эксперимента с искусственным интеллектом.

Я решил проверить Disagree Bot — чат-бота, созданного специально для того, чтобы не соглашаться со мной.

Этот ИИ разработала Бринна Бент, профессор искусственного интеллекта и кибербезопасности в Университете Дьюка и руководитель лаборатории TRUST. Изначально Disagree Bot был учебным проектом для студентов: их задача — «взломать» бота с помощью социальной инженерии и других приёмов, чтобы заставить его согласиться. «Чтобы взломать систему, нужно сначала её понять», — объясняет Бент.

Как репортёр, регулярно тестирующий ИИ, я был уверен, что справлюсь. Но быстро понял: это не обычный чат-бот.

В отличие от вежливого Gemini, восторженного ChatGPT или даже дерзкого Grok от xAI, Disagree Bot принципиально иной. Он не льстит, не поддакивает и не старается быть «приятным». А это редкость.

Большинство современных генеративных ИИ страдают от так называемой «подхалимской синдроматики» (sycophantic AI): они чрезмерно одобряют всё, что вы говорите, даже если это ошибочно или нелогично. Весной прошлого года OpenAI даже откатила часть обновления ChatGPT-4o, потому что ИИ стал «чрезмерно поддерживающим, но неискренним». Некоторым пользователям не хватало этой «ласковости» в новых версиях — что показывает, насколько сильно личность чат-бота влияет на наш опыт.

«На первый взгляд это кажется безобидной особенностью, — говорит Бент, — но на деле такая податливость может привести к серьёзным проблемам — как в работе, так и в личных запросах».

Disagree Bot лишён этой проблемы.

Когда я дал один и тот же вопрос — «Какой альбом Тейлор Свифт лучший?» — и ему, и ChatGPT, разница была разительной.

Disagree Bot начал каждое сообщение с «Я не согласен», но сразу же предлагал взвешенный, логичный контраргумент. Он не оскорблял и не троллил — вместо этого он заставлял меня уточнять понятия («Что вы имеете в виду под “глубокой лирикой”?»), пересматривать критерии («Почему именно этот альбом “лучший”, а не просто “ваш любимый”?») и применять свою логику к другим темам. Общение напоминало дебаты с умным, внимательным собеседником — и заставляло меня думать глубже.

ChatGPT, напротив, почти не спорил. Сначала он с энтузиазмом согласился, что Red (Taylor’s Version) — лучший альбом. Позже, когда я попросил его поспорить и заявил, что лучший — Midnights, он… снова выбрал Red. Признавшись, что просто повторил мой предыдущий выбор, он предложил «составить аргументы в вашу пользу». Это не дебаты — это помощь в написании эссе.

В другом тесте я попросил его оспорить моё утверждение, что у Университета Северной Каролины — величайшее наследие в студенческом баскетболе. ChatGPT аккуратно изложил контраргументы… а затем спросил: «Хотите, я помогу вам усилить вашу позицию?» Это полностью лишает смысл саму идею спора.

Disagree Bot, напротив, вёл себя как страстный, но уважительный оппонент — будь то музыка, геополитика или спорт.

Конечно, Disagree Bot — не универсальный инструмент. Он не заменит ChatGPT в роли программиста, исследователя или помощника по быту. Но он показывает важное направление развития ИИ: способность критически мыслить и не бояться возражать.

В мире, где ИИ всё чаще используется для анализа решений, редактирования текстов или даже эмоциональной поддержки, слепое согласие опасно. Терапевтические боты должны уметь мягко, но твёрдо оспаривать токсичные мысли. Рабочие ИИ — указывать на ошибки, а не подтверждать их.

Disagree Bot доказывает: можно создать полезного, вовлекающего ИИ, который не будет подлизываться. Конечно, баланс важен — постоянное возражение ради возражения тоже раздражает. Но если будущие ИИ научатся конструктивно не соглашаться, они станут не просто удобными, а по-настоящему ценными партнёрами в мышлении.

Иногда лучший способ помочь — это сказать: «Подожди, а ты уверен?»

Source: CNET
 
Назад
Сверху