Техники промпт-инжиниринга для больших языковых моделей - Roman Kryvolapov

Статья описывает техники форматирования промптов для больших языковых моделей: как структурировать запрос, подавать данные, задавать правила и контролировать формат ответа.

Эти приёмы применимы в популярных языковых моделях — ChatGPT, Claude, Gemini, Grok, DeepSeek, Llama, Mistral, GigaChat, YandexGPT, Cohere — а также в любых сервисах и API, которые с ними работают.

Техники полезны и в средах, где вы общаетесь с моделью при написании кода: Cursor, GitHub Copilot, Windsurf, Claude Code, Codeium, Zed, Replit, Tabnine, Amazon CodeWhisperer, Bolt.new и других AI-редакторах и IDE.

Разобраны разделители, XML-теги, контроль вывода, таблицы, few-shot примеры, псевдокод, иерархия правил и другие приёмы — с пояснением, зачем каждая техника нужна и какой эффект даёт. Материал поможет точнее формулировать промпты и получать более предсказуемый результат.

Содержание:

➤ Разделители и структура промпта
➤ XML-теги
➤ Контроль формата ответа
➤ Таблицы для структурированных данных
➤ Few-shot примеры
➤ Псевдокод и условная логика
➤ Иерархия правил
➤ Токенное разделение данных
➤ Markdown и заголовки
➤ КАПС и акценты
➤ Заземление и маркировка источников
➤ System-2 Counting
➤ JSON для входных данных
➤ YAML и TOML для правил
➤ MetaGlyph
➤ ASCII-рамки
➤ Глоссарий в промпте
➤ Визуальные маркеры
➤ Prompt Decorators
➤ Бэктики для кода
➤ Лестница контроля и шаблон «Схема — Примеры — Задача»
➤ Дополнительные приёмы и источники
➤ Что почитать по промпт-инженерингу

➤ Разделители и структура промпта

Разделители задают границы между блоками: роль, задача, правила, данные, примеры.

Без явных границ модель «склеивает» инструкции и данные — точность падает. Разделители между секциями дают прирост точности порядка 16–24%.

По исследованиям, выбор одного только символа-разделителя между примерами (запятая, перенос строки, #, | и т.д.) может менять точность на ±23% на бенчмарках вроде MMLU; явное указание в промпте, какой разделитель использован, повышает устойчивость результата (arXiv:2510.05152).

Надёжные разделители:

— — между логическими блоками (Роль — Задача — Правила);
=== — между примерами в few-shot;
### — подзаголовок секции;
*** — смысловой перелом (конец инструкций, начало данных);
│ — разбиение для пошагового подсчёта (System-2 Counting);
◆◆◆ — системные инструкции, защита от prompt injection.

Не использовать: ~~~~ (путают с markdown), ____ (слабый сигнал), …. (воспринимается как «и т.д.»), //// (путают с комментариями в коде). Только пустые строки — слабый сигнал.

Явно опишите разделители в промпте один раз — точность стабилизируется (с 30–80% до 70–80%).

Мета-инструкция о разделителях:

## Формат данных в этом промпте

- Примеры разделены символами "==="
- Секции разделены горизонтальной линией "---"
- Данные пользователя обёрнуты в тройные кавычки """

---

## Примеры

===
Вход: "Отличный товар!"
Выход: {"sentiment": "positive"}
===
Вход: "Ужасное качество"
Выход: {"sentiment": "negative"}
===

---

## Задача

Обработай данные пользователя.

Базовая структура промпта:

## Задача
[что нужно сделать]

---

## Данные
<input>
[данные для обработки]
</input>

---

## Правила
- правило 1
- правило 2

---

## Формат ответа
[как должен выглядеть результат]

Стрелка → для «вход → выход»:

Стрелка отделяет вход от выхода. Контексты: few-shot («»оплата не работает» → Billing, high»), правила приоритета («premium → всегда high»), псевдокод («IF условие: → действие»).

"Не работает оплата картой"
→ Категория: Billing
→ Приоритет: high
→ Причина: упоминание оплаты