Skip to content
КОНЦЕПТЫ
4 мин. чтенияЧитать на английском

Happy Horse 1.0 — правила промптинга

Seedance 2 вы использовали достаточно, чтобы JSON-промпты по шотам шли на автомате. Те же инстинкты переносите на Happy Horse 1.0 — тот же бриф, та же структура, та же лексика — и на выходе получаете generic. Невнятный субъект. Размытая камера. Свет, который мог бы быть каким угодно. Модель не игнорировала промпт; она просто следовала правилам, о которых вы не знали.

Ниже — эти правила. Happy Horse вознаграждает другую форму промпта, чем Seedance: ключевой порядок слотов, обязательный префикс длительность-плюс-биты, ровно одно движение камеры, чистота языка. Один раз разобрались — разрыв закрывается.

Happy Horse 1.0 — опенсорсная T2V / I2V-модель на 15B параметров с нативно синхронизированным звуком и многоязычной липсинхронизацией. На момент написания — #1 в слепом голосовании T2V / I2V, позиционируется как конкурент Seedance 2. Правила ниже — та форма промпта, которая надёжно выживает в генерации.

Возможности и пределы

| Параметр | Значение | |---|---| | Режимы | T2V, I2V | | Аудио | Совместная генерация видео + синхронизированного звука | | Липсинк | Многоязычный | | Максимальная длительность | 8 с на клип (жёсткий потолок) | | Максимальное разрешение | 1080p | | Аспект по умолчанию | 16:9 (другие поддерживаются) | | Тиры качества (у хостов) | «Pro», стилевой пресет «Balanced» |

Каноничная структура из 8 слотов

Порядок несущий — у Happy Horse внимание сосредоточено в начале промпта; первые ~40 токенов имеют непропорционально большой вес.

1. Субъект           ← главный объект, в начало
2. Действие          ← что субъект делает
3. Сцена             ← где, реквизит, окружение
4. Движение камеры   ← ровно ОДНО основное движение
5. Свет              ← источник, время суток, качество
6. Визуальный стиль  ← кинематографический / cel-shaded / студийный / документальный
7. Настроение        ← эмоциональная палитра
8. Платформенный формат ← аспект, темп, контекст вывода

Пропускать слот допустимо только если по нему нет ничего конкретного; никогда не добивать общими прилагательными. Выход — одним связным абзацем (не озаглавленными секциями), но строго в этом порядке.

Жёсткие правила

  1. Внимание спереди. Главный субъект — в первых словах. Дескрипторы движения — следом. Стилевые модификаторы — в конце. Никогда не закапывать субъект под стопкой прилагательных.
  2. Конкретика, а не подразумевание. Happy Horse следует буквально и не домысливает отсутствующую камеру или свет — тишина даёт generic-выход. Это инвертирует паттерны «намеренного умолчания», которые работают на image-моделях вроде Nano Banana 2 (там пробелы заполняются через image-канал). Для HH: умолчание = баг.
  3. Структура по битам обязательна. Каждый промпт открывается флагом длительности и планом по битам. Пример: 8s duration. First 3s: close-up on hands. Final 5s: camera pulls back to reveal full scene.
  4. Одно главное движение камеры на клип. Сочетание dolly + orbit + rack focus вызывает дрейф, упрощение или фоллбэк модели. Выбирайте одно.
  5. Чистота языка. Английский или китайский — никогда не гибрид. Смешанные промпты измеримо деградируют. Выбирайте язык в начале и держите.
  6. Дисциплина N ≥ 2–3 сэмпла. Вариативность выхода высокая даже при одинаковом входе. Всегда генерируйте 2–3 дубля и выбирайте.

Словарные палитры, которые выживают в генерации

Взято из официальной галереи шаблонов (cinematic / scene / product). Эти конкретные формулировки надёжно переходят в кадр.

  • Движения камеры: slow crane move, smooth side tracking, macro transitions, rotating pedestal, controlled backlight pull.
  • Свет: golden-hour, lantern light, studio reflections, moody dust, clean cel shading.
  • Темп: elegant pacing, premium ad pacing, smooth transitions.
  • Тон: premium cinema tone, emotional evening palette, controlled atmosphere.

Анти-паттерны

  • Мульти-камерная хореография в одном клипе (dolly + orbit + rack focus).
  • Смешение языков (англо-китайский гибрид).
  • Отсутствие длительности и структуры по битам → неровный темп.
  • Стопки общих прилагательных без явных якорей камеры и света.
  • Захоронение субъекта за стилевыми модификаторами («Cinematic, moody, premium 8s shot of a horse running…» — субъект слишком поздно).

Сравнение с Seedance 2 (где правила расходятся)

| Ось | Seedance 2 | Happy Horse 1.0 | |---|---|---| | Контракт выхода | Компактный JSON (refs, g, s[]), ≤3500 символов | Один связный абзац, по слотам | | Разделение камера/визуал | Камера в c, визуал в p (разные поля) | Один абзац, одно движение камеры внутри | | Работа с референсами | refs[].s — CSV scene-mapping, трюки с grid overlay | I2V: сама картинка — референс, без JSON-маппинга | | Умолчание | Активно используется намеренное умолчание | Инвертировано — камеру и свет нужно указывать явно | | Структура по битам | Неявная, на сцену | Явная длительность + план по битам в теле промпта | | Язык | Английский обязателен, независимо от входа | Чистый английский или чистый китайский | | Движений камеры на сцену | Многоступенчатое движение поощряется | Ровно одно |

Разобранный пример

Бриф: «Премиальный запуск напитка, стеклянная бутылка, тема энергии, ad-формат».

Промпт:

8s duration. First 3s: glossy black bottle stands centered on a rotating pedestal. Final 5s: a horse-shaped energy trail spirals up around the bottle. Studio interior with deep gradient backdrop. Slow crane move arcing in from low angle. Studio reflections, controlled backlight, moody dust catching the rim light. Premium cinema tone, clean cel-shaded energy trail, glossy product surfaces. Confident, kinetic, high-end. 16:9, premium ad pacing.

Самопроверка:

  • ✅ Субъект («glossy black bottle») в первых 10 токенах
  • ✅ Длительность + структура по битам в начале
  • ✅ Ровно одно движение камеры (slow crane move)
  • ✅ Чистый английский
  • ✅ Камера И свет указаны явно
  • ✅ Слоты mood и format присутствуют

Источники