OpenAI платит 20 000 $ за поиск ошибок в API — но не за взлом сценариев ChatGPT

OpenAI предлагает денежное вознаграждение в размере до 20 000 долларов за раскрытие уязвимостей в своих API, включая ChatGPT, сообщает The Verge.

Компания OpenAI запустила конкурс «bug bounty», поощряя пользователей находить уязвимости в своих сервисах, включая ChatGPT.

Вознаграждение варьируется от 200 долларов за несерьёзные баги до 20 000 долларов за исключительные баги.

Отчёты о найденных уязвимостях можно отправлять через краудсорсинговую платформу кибербезопасности Bugcrowd.

При этом вознаграждение за создание вредоносного кода или текста через ChatGPT не предусмотрено.

Проблемы, связанные с содержанием подсказок и ответов модели, строго не входят в сферу применения и не вознаграждаются

OpenAI в Bugcrowd

Взлом ChatGPT обычно подразумевает ввод в чат-бота сложных сценариев, которые позволяют ей обойти собственные фильтры безопасности.

Такие сценарии поощряют чат-бота к ролевой игре в качестве его «злого двойника», позволяя пользователю вызывать запрещенные ответы. К примеру, от злого двойника ChatGPT можно добиться инструкций по изготовлению оружия (категорически осуждаем).

Энтузиасты запустили ChaosGPT на основе GPT-4, чтобы «уничтожить человечество»

tproger.ru

OpenAI утверждает, что такие проблемы не очень подходят для вознаграждения за ошибки, поскольку они не являются дискретными ошибками, которые можно исправить напрямую.

Компания отмечает, что «решение таких проблем часто требует значительных исследований и более широкого подхода», и сообщения о сбоях в ChatGPT следует отправлять через страницу обратной связи.

Хотя такие взломы демонстрируют уязвимость ИИ, они, вероятно, являются меньшей проблемой для OpenAI по сравнению со сбоями в системе безопасности.

Например, в прошлом месяце хакер rez0 смог обнаружить 80 «секретных плагинов» для API ChatGPT. Это были ещё не выпущенные или экспериментальные дополнения для чат-бота. Rez0 отметил, что уязвимость была исправлена в течение дня после того, как о ней написали в Twitter.

Как тогда ответил один из пользователей в Твиттере: «Если бы у них только была платная программа #BugBounty, я уверен, что толпа могла бы помочь им поймать эти крайние случаи в будущем : )».