ШІ-моделі без цензури: яку загрозу вони становлять для глобальної безпеки і чому

Моделі ШІ без цензури можна завантажити всього за кілька кліків без будь-якої перевірки, нагляду або відповідальності, які гарантують, що вони не використовуються з метою заподіяння шкоди. Експерти вважають, що нецензуровані моделі діють на злочинних суб'єктів як каталізатори.
Про це йдеться у статті видання Аspistrategist "Невідцензуровані моделі ШІ становлять серйозну загрозу глобальній безпеці", яку переклав Фокус.
Глобальні перегони ШІ набирають обертів, а держави і корпорації вкладають мільярди в ШІ для комерційних, стратегічних і оборонних цілей. Однак побічним ефектом цих перегонів стає поширення моделей ШІ без цензури, які становлять серйозну загрозу безпеці.
Система може відповісти практично на будь-який запит
Створені на основі великих мовних моделей з відкритим вихідним кодом, такі системи позбавлені фільтрів безпеки, що є у поширених інструментів на кшталт ChatGPT. Така система може відповісти практично на будь-який запит без вагань і етичних обмежень. Вам потрібен підручник з написання шкідливих програм? Цікавитеся, як зробити вибухівку, зброю або наркотики? Модель без цензури готова надати вам докладні інструкції.
Небезпека полягає не тільки в тому, що саме ці моделі можуть створювати, а й у тому, наскільки легко до них отримати доступ. Багато з них розміщено на популярних платформах, де зберігаються легальні інструменти та дослідження і де ведуться передові розробки в галузі ШІ, включно з Hugging Face, GitHub і Ollama. Моделі без цензури можна завантажити всього за кілька кліків. Простий пошук на таких платформах за фразою "без цензури" дає змогу виявити моделі, які скачали мільйони разів — без будь-якої перевірки, нагляду або відповідальності, які гарантують, що їх не використовують з метою заподіяння шкоди.
Немає ні корпоративного сервера, ні автоматизованого збору даних
Можливість використання в автономному режимі вкрай ускладнює регулювання застосування моделей без цензури. Після завантаження їх можна запускати локально на звичайних комп'ютерах без підключення до інтернету. Немає ні корпоративного сервера, ні автоматизованого збору даних, і часто неможливо дізнатися, чи використовується модель для академічних досліджень, злочинної або екстремістської діяльності.
Насправді запустити ці інструменти зараз простіше, ніж будь-коли. За допомогою платформ на кшталт LM Studio навіть далекі від світу технологій користувачі можуть розгорнути модель без цензури за лічені хвилини. Уміння писати код для цього не потрібне, а інтерфейси інтуїтивно зрозумілі, як у будь-якому звичайному застосунку. Після запуску модель без цензури стає практично неможливо контролювати.
Для тих, хто вважає за краще не запускати моделі на своєму комп'ютері, існують сервіси, що розміщують їх в інтернеті, часто під виглядом конфіденційних платформ ШІ. Деякі з них заявляють, що не ведуть журналів запитів користувачів, приймають криптовалютні платежі і підкреслюють низький рівень відмов відповідати на запити. Ці показники відмов подаються як переваги, а не як запобіжні заходи. Попри те, що часто в рекламі цих сервісів ідеться про "свободу творчості", їхня відкрита реклама показує, що нецензурований доступ перетворюється на товар, усуваючи останній значущий бар'єр між зловмисниками та потужними генеративними інструментами. Такі сервіси не є чимось недоступним — їх легко знайти за допомогою простого пошуку в Google.
ШІ знижує як вартість, так і поріг шкідливої діяльності
Нецензуровані моделі діють на злочинних суб'єктів як каталізатори. Раніше для створення шкідливих програм, проведення складних екстремістських акцій або операцій впливу були потрібні просунуті технічні знання. Тепер ці можливості можна передати на аутсорсинг моделі. За правильного підходу навіть люди з мінімальним досвідом можуть отримати індивідуальне керівництво з виконання дій із серйозними наслідками.
Це веде до дедалі більшої асиметрії. Шкідливі суб'єкти, які мають доступ до моделі ШІ без цензури, можуть легко замінити роботу групи експертів. Таким чином, ШІ знижує як вартість, так і поріг шкідливої діяльності, що значно розширює спектр загроз, даючи змогу суб'єктам, які раніше не володіли достатніми можливостями, проводити надскладні операції з заподіяння шкоди.
Спроби виключити або видалити ці моделі з публічних репозиторіїв багато в чому символічні. Навіть якщо оригінальні джерела буде видалено, моделі можуть поширюватися через торенти, приватні форуми та альтернативні платформи. Джина вже випустили з пляшки.
Але це не означає, що компанії та політики повинні здатися. Доступність цих моделей викликає глибоке занепокоєння. Тому слід зосередити всі зусилля на підвищенні бар'єрів для доступу до таких моделей за допомогою політичних заходів, регулювання або суспільних норм.
Нецензуровані моделі вже становлять серйозну загрозу
Для усунення цієї загрози потрібне нове мислення. Моделювання загроз має адаптуватися до реальності, в якій доступні громадськості моделі ШІ можуть бути практично безслідно використані для розширення можливостей навіть не найдосвідченіших суб'єктів, у яких тепер є інструменти для проведення складних операцій з мінімальними ресурсами.
Поки політики зосереджені на регулюванні корпоративних методів роботи з даними, нецензуровані моделі вже становлять серйозну загрозу. Такі моделі дозволяють низькокваліфікованим гравцям завдавати шкоди в масштабах, які раніше були доступні лише державам і найбільш технічно підкованим групам. Ці моделі не можна видалити, але можна обмежити доступ до них. Наше визначення загроз і планування повинні змінитися, щоб відповідати цій новій реальності. Бездіяльність означає згоду зі зростаючим ризиком для національної та глобальної безпеки.
Про автора
Том Сакстон — дослідник у галузі штучного інтелекту та OSINT у Мельбурнському королівському технологічному інституті.
Источник: focus.ua