_ December 21, 2025_ Voron Orysia

Що приховує Dark LLM?

ЗАГРОЗИ Dark LLM

Штучний інтелект став рушійною силою інновацій у сучасному світі, проте його доступність створила нові можливості для зловмисників. Великі мовні моделі (Large Language Models, LLM), які раніше використовувалися виключно для легітимних цілей, тепер активно експлуатуються в кіберзлочинності.

Згідно з дослідженнями, у 2024 році згадки про “Dark LLM” на кіберзлочинних форумах зросли більш ніж на 219%. З січня по травень 2025 року було виявлено понад 12,6 мільйонів зловмисних електронних листів, багато з яких створені з використанням AI. Ця статистика демонструє масштаб проблеми та необхідність негайної адаптації систем кібербезпеки.

Що таке Dark LLM

Dark LLM (темні великі мовні моделі) – це модифіковані версії легітимних LLM, у яких повністю видалено етичні обмеження та захисні механізми. На відміну від комерційних моделей, таких як ChatGPT або Claude, які містять вбудовані guardrails для запобігання створенню шкідливого контенту, Dark LLM спеціально розроблені для кіберзлочинної діяльності.

Ключові характеристики Dark LLM:

Відсутність етичних обмежень та контенту модерації
Навчання на зловмисних даних, включаючи malware код та експлойти
Розповсюдження через dark web за підпискою або одноразовою оплатою
Доступність навіть для осіб з низьким технічним рівнем

Існує три основні підходи до створення зловмисних LLM:

Jailbreaking (зламування) – обхід захисних механізмів легальних LLM через спеціально розроблені промпти. Цей метод використовує техніки рольових ігор, де AI просять удавати, що він без етичних обмежень, або маскування зловмисних намірів під гіпотетичні сценарії та академічні дослідження.
Модифікація відкритих моделей – використання open-source моделей типу GPT-J або LLaMA з додатковим навчанням на зловмисних датасетах. WormGPT, наприклад, був створений на базі GPT-J з 6 мільярдами параметрів, натренованої на даних, пов’язаних з malware.
API обгортки – створення проміжного шару між користувачем та легальним API, який автоматично застосовує jailbreak техніки. Багато “Dark LLM” насправді є просто інтерфейсами над ChatGPT або іншими комерційними моделями.

Типи атак з використанням Dark LLM

Фішинг та соціальна інженерія

Фішингові атаки з використанням AI якісно відрізняються від традиційних методів. LLM можуть генерувати високореалістичний та персоналізований контент, включаючи фальшиві email, чат-взаємодії та навіть цілі системи підтримки клієнтів, що переконливо імітують легітимні сервіси.

Ключові характеристики AI-фішингу:

Багатомовний контент без граматичних помилок
Підтримка контексту через пам’ять сесії для цільових продовжень
Автоматична персоналізація на основі даних із соціальних мереж
Обхід традиційних систем виявлення, які шукають орфографічні помилки

У 2023 році було зафіксовано сплеск AI-керованих фішингових наборів на dark web ринках. Ці набори, оснащені LLM-керованими чат-ботами, дозволили навіть низькокваліфікованим кіберзлочинцям розгортати складні фішингові кампанії у великих масштабах.

Особливо тривожною тенденцією є QR-код фішинг. У лютому 2025 року було виявлено понад 1 мільйон таких атак за один місяць. Також набуває популярності техніка ClickFix, яка експлуатує перетин між людьми та технологіями, обманом змушуючи користувачів виконувати зловмисний код.

Створення та розповсюдження malware

Dark LLM революціонізували процес створення зловмисного програмного забезпечення, знизивши технічні бар’єри входу для кіберзлочинців. Моделі здатні автоматично генерувати malware, від простих скриптів до складних багатокомпонентних систем.

Найбільш інноваційним прикладом є PROMPTSTEAL – malware, використане групою APT28 у червні 2025. Замість жорстко закодованих команд, PROMPTSTEAL використовує LLM для генерування команд у реальному часі, що робить його надзвичайно адаптивним та складним для виявлення.

У квітні 2024 дослідники виявили, що AI-згенерований PowerShell скрипт використовувався для розповсюдження Rhadamanthys infostealer malware у цільовій кампанії проти підприємств. Цей випадок підтверджує, що Dark LLM вже активно використовуються у реальних атаках.

Виявлення вразливостей та експлуатація

LLM значно прискорили процес виявлення та експлуатації вразливостей. У січні 2025 року на відомому форумі був розміщений AI-розроблений сканер для CVE-2024-10914 – критичної вразливості віддаленого виконання коду. Сканер був створений з використанням LLM та автоматизації Masscan.

Особливо небезпечною є тенденція експлуатації самих LLM API. У лютому 2025 року на BreachForums почали продавати експлойт для Google Gemini API, який обіцяв обійти контроль балансу та механізми безпеки. Це демонструє, що самі AI системи стають цілями для атак.

Business Email Compromise (BEC)

BEC атаки, у яких зловмисники видають себе за керівників компаній для авторизації фінансових транзакцій, стали значно ефективнішими з появою Dark LLM. WormGPT спеціально оптимізований для створення переконливих бізнес-листів, які важко відрізнити від справжніх.

AI-генеровані BEC повідомлення не містять типових ознак шахрайства, таких як граматичні помилки або незвичний стиль написання. Вони повністю імітують комунікаційний стиль конкретної особи, використовуючи аналіз попередніх листів та публічно доступної інформації.

Deepfake та кампанії дезінформації

Поєднання LLM з технологіями deepfake створює потужний інструмент для психологічних операцій та дезінформації. Неодноразовими є сповіщення про AI-згенеровані SMS повідомлення та голосово-клоновані сповіщення, призначені для створення паніки під час ракетних ударів.

Особливо тривожною є техніка retrieval poisoning – створення дезінформації спеціально для того, щоб її підхопили LLM. Дезінформаційна мережа створила 3,6 мільйона статей у 2024 році, націлених на вплив на відповіді AI чат-ботів. Дослідження показали, що AI чат-боти дійсно почали повторювати цей контент.

Prompt Injection атаки

Prompt injection – це техніка атаки, при якій зловмисні команди приховуються в запитах до LLM для спонукання до шкідливої поведінки. У липні 2025 дослідження показало, що 14 із 17 найсучасніших LLM були вразливі до цього типу експлойту.

Нещодавно з’явилися багатомодальні ін’єкції, які поєднують текст та зображення. У одній Fortune 500 компанії хакери вбудували зловмисний код у зображення рахунків, обманюючи бота обліку кредиторської заборгованості схвалити шахрайські транзакції.

РЕАЛЬНІСТЬ ЗАГРОЗИ

Ефективність Dark LLM у реальних умовах

Попри загрозливі можливості, важливо розуміти реальні обмеження Dark LLM. Дослідження показують, що значна частина рекламованих на dark web інструментів є шахрайством або сильно перебільшує свої можливості.

Багато “Dark LLM” насправді є простими інтерфейсами над легальними API з jailbreak промптами. Користувачі на форумах часто скаржаться, що інструменти не працюють або їхні облікові записи блокуються після спроби використання.

Проте реальні загрози існують. LLM дійсно ефективні у покращенні якості коду, генерації переконливих текстів та автоматизації дослідницьких завдань. Навіть якщо вони не створюють ідеальне рішення автоматично, вони значно прискорюють роботу досвідчених зловмисників.

Статистика атак

Конкретні цифри демонструють масштаб проблеми:

Darktrace виявила понад 12,6 мільйонів зловмисних email з січня по травень 2025
Понад 25% усіх фішингових email націлені на VIP користувачів
Згадки про Dark LLM зросли на 219% у 2024 році
У лютому 2025 виявлено понад 1 мільйон QR-код фішингових атак за місяць
Дослідження Verizon DBIR 2024 показало, що згадки GenAI поряд з традиційними типами атак ще відносно низькі – близько 100 кумулятивних згадок за два роки

СТРАТЕГІЇ КІБЕРЗАХИСТУ

Технічні заходи захисту

AI-керовані системи виявлення загроз – Впровадження систем, які використовують машинне навчання для виявлення аномальних патернів поведінки. Такі системи можуть аналізувати величезні обсяги даних та ідентифікувати підозрілу активність набагато швидше за людину.

Багатофакторна автентифікація (MFA) – Обов’язкове впровадження MFA для всіх критичних систем. Навіть якщо зловмисник отримає паролі через фішинг, додатковий рівень автентифікації значно ускладнить несанкціонований доступ.

Zero Trust архітектура – Перехід від моделі “довіряй, але перевіряй” до “ніколи не довіряй, завжди перевіряй”. Кожен запит до ресурсів має бути автентифікований та авторизований, незалежно від джерела.

Sandbox середовища – Виконання підозрілих файлів та додатків в ізольованих середовищах для аналізу їхньої поведінки без ризику для продакшн систем.

Email фільтрація з AI аналізом – Використання систем, які аналізують не лише технічні заголовки та вкладення, але й семантичний зміст повідомлень, стиль написання та контекст для виявлення соціальної інженерії.

Моніторинг dark web – Активне відстеження згадок вашої організації, співробітників та витоків даних на dark web форумах та ринках. Раннє виявлення може запобігти атакам.

Організаційні заходи

Навчання персоналу з акцентом на AI загрози – Регулярні тренінги, які включають симуляції AI-генерованих фішингових атак. Співробітники повинні розуміти, що сучасний фішинг може не мати традиційних ознак (граматичних помилок, підозрілих адрес).

Політики використання AI – Розробка чітких регламентів щодо використання AI інструментів у організації. Shadow AI (неофіційне використання AI інструментів співробітниками) може створювати серйозні ризики витоку даних.

Процедури верифікації критичних дій – Впровадження багатоетапної верифікації для фінансових транзакцій та зміни критичних налаштувань. Наприклад, запити на переказ коштів повинні підтверджуватися через декілька незалежних каналів.

Incident Response план з урахуванням AI загроз – Оновлення планів реагування на інциденти для включення сценаріїв AI-керованих атак. Команда повинна знати, як ідентифікувати та реагувати на складні AI-генеровані загрози.

Red Team тестування з використанням AI – Регулярне проведення симуляцій атак, де команда безпеки використовує AI інструменти для тестування захисту організації. Це допомагає виявити слабкі місця до того, як їх знайдуть реальні зловмисники.

Управління вразливостями

Автоматизоване сканування та патчинг – Впровадження систем, які автоматично сканують інфраструктуру на наявність відомих вразливостей та застосовують патчі. Враховуючи, що зловмисники використовують AI для швидкого виявлення CVE, критично важлива швидкість реагування.

Програми Bug Bounty – Залучення зовнішніх дослідників безпеки для пошуку вразливостей до того, як їх знайдуть зловмисники. Це особливо важливо для публічних сервісів.

Безпека ланцюга постачання – Ретельна перевірка всіх компонентів програмного забезпечення, включаючи відкриті бібліотеки. AI може використовуватися для отруєння популярних бібліотек, що призведе до масштабних атак.

Захист від специфічних AI загроз

Верифікація голосових та відео комунікацій – Впровадження протоколів для верифікації автентичності голосових дзвінків та відео конференцій, особливо для критичних рішень. Використання кодових слів або альтернативних каналів підтвердження.

Захист від prompt injection – Для організацій, що розгортають власні LLM, критично важлива імплементація багатошарових захистів від prompt injection атак. Це включає валідацію вхідних даних, сандбоксинг та обмеження прав доступу LLM.

Моніторинг витоків даних – Постійне сканування dark web, пастбінів та інших ресурсів на предмет витоків даних вашої організації, які можуть бути використані для навчання зловмисних LLM.

Контроль використання LLM API – Якщо організація використовує LLM API, впровадження лімітів на кількість запитів та моніторинг незвичних патернів використання для запобігання зловживань та витоку чутливої інформації.

ВИСНОВКИ

Поява Dark LLM представляє фундаментальну зміну в ландшафті кібербезпеки. Ці інструменти не просто автоматизують існуючі типи атак – вони створюють якісно нові можливості для зловмисників, значно знижуючи технічні бар’єри входу у кіберзлочинність.

Масштаб загрози є реальним та зростаючим. Зростання згадок про Dark LLM на 219% у 2024 році та понад 12,6 мільйонів виявлених зловмисних email у перші п’ять місяців 2025 року демонструють, що це не теоретична проблема.

Демократизація кіберзлочинності змінює правила гри. Коли складні атаки стають доступними, кількість потенційних зловмисників зростає експоненційно.

Традиційні методи захисту недостатні. Системи, які покладаються на виявлення граматичних помилок або статичні сигнатури, програють проти AI-генерованих атак.

Захист вимагає комплексного підходу. Технічні рішення повинні поєднуватися з навчанням персоналу, організаційними змінами та культурною трансформацією.

Швидкість адаптації критична. Організації, які не почнуть впроваджувати захист від AI загроз вже сьогодні, опиняться в надзвичайно вразливому становищі.

Попри серйозність загроз, є підстави для стриманого оптимізму. AI може бути використаний не лише для атак, але й для захисту. Організації, які проактивно впроваджують AI-керовані системи безпеки, можуть не лише нейтралізувати переваги зловмисників, але й отримати власні конкурентні переваги.

Майбутнє кібербезпеки буде визначатися здатністю організацій ефективно використовувати AI як для атаки, так і для захисту. Ті, хто розуміє ці технології та інвестує в них сьогодні, будуть краще підготовлені до викликів завтрашнього дня.

Час діяти – зараз. Кожен день затримки дає зловмисникам більше можливостей для використання цих потужних інструментів проти вашої організації.