Почему storyboard'ы идут до рендера
В генеративном видео-пайплайне, который должен произвести много кадров, висящих вместе как один кусок, storyboard'ы — не декорация. Это дешёвый визуальный лок на композицию и язык камеры: стадия, которая ловит дорогие ошибки до рендера, и чьи выходы затем работают как vision-референсы для этого рендера.
Константа стиля storyboard'а
Каждый storyboard-кадр на каждом проекте использует один и тот же стилевой префикс:
"traditional hand-drawn storyboard frame on white paper, clean black ink line art with selective red accent lines for key action and focal points, minimal shading using hatching, professional film storyboard sketch style, no color except black white and red"
Префикс предваряет каждый storyboard-промпт и в fresh-generation, и в режиме рефайнинга. Это каноничный кейс архитектуры стилевого префикса: фиксированный префикс превращает класс выходов в нейтральный визуальный словарь, который последующие стадии читают ради композиции, не ради стиля.
Fresh-генерация (batch)
Вход: полный шот-лист с семиэлементными описаниями (субъект + действие, локация, крупность, угол, движение, оптика, свет), плюс опциональные референсы из ранее отрисованных кадров проекта, плюс сценарий для нарративной cohesion.
Процесс:
- Если есть прикреплённые референсы, LLM анализирует их толщину линии, направление штриховки и выбранные углы камеры.
- Затем намеренно выбирает другие углы для новых кадров — никакие два соседних кадра не делят одинаковую крупность.
- Линейный стиль, расстановка красных акцентов и плотность штриховки держатся константой по всей серии.
Выход — один storyboard-промпт на кадр, по имени кадра (1A, 1B, 2A, …); каждый рендерится в hand-drawn-кадр.
Рефайнинг (single shot)
Single-shot-рефайнинг применяет дисциплину edit-preservation: LLM применяет только запрошенное пользователем изменение, сохраняет композицию и оставляет стилевой префикс. Сильно дешевле batch-генерации, потому что бэйзлайн уже есть, — рефайнинг становится дефолтным режимом итерации, а не исключением.
Почему storyboard'ы идут до стиллов
Это архитектурно важное решение. Storyboard'ы — дешёвый визуальный лок на композицию. Они идут серией на весь проект — дешевле, чем полноценные рендеры. Рендерятся быстро и консистентно в стиле, который модель хорошо держит. И — служат vision-референсами для следующей стадии: full-color photographic-рендеры читают storyboard ради крупности, угла и композиции, а потом производят финальное изображение с той же композицией в другом визуальном регистре.
Ошибка, пойманная на storyboard-стадии, избегает гораздо более дорогой ошибки на стадии рендера. Та же логика работает в любом пайплайне, где быстрый дешёвый промежуточный артефакт может выступить вместо дорогого финального: wireframe'ы до UI-дизайна, blocking до анимации, scratch-треки до сведения.
Continuity сцены-серии
Кадры внутри сцены (1A, 1B, 1C) образуют серию, которая должна ощущаться непрерывной. Storyboard-стадия обеспечивает continuity серии, прикрепляя ранее отрисованные storyboard-кадры как референсы при генерации последующих. Одновременно работают два ограничения:
- Continuity стиля — одна и та же толщина линии, штриховка, обращение с красным акцентом по всей серии.
- Разнообразие угла — никакие два соседних кадра серии не делят расстояние + угол камеры.
Оба ограничения зашиты в системном промпте; реальные прикреплённые референсы — это то, что заставляет модель видеть их, а не просто слышать.
Чего storyboard'ы не делают
- Они не задают цвет — финальный цвет приходит из moodboard-референсов на стадии рендера.
- Они не задают финальное поведение света — только грубое directional-шейдинг через штриховку.
- Они не локают финальный облик субъекта — character design локается через reference inheritance на следующей стадии.
Работа storyboard'а — ровно три вещи: композиция, язык камеры, continuity сцены-серии. Всё остальное обрабатывается позже.
Паттерн за пределами storyboard'ов
Общая форма: когда downstream-стадия дорогая, выставляйте дешёвую upstream-стадию, чьи выходы можно ревьюить, отклонять и использовать как референсы. Storyboard-пайплайн — одна инстанция. Wireframe'ы до high-fidelity UI — другая. Blocking-позы до анимации. Грубые миксы до мастеринга. Дисциплина одна — дешёвый визуальный лок, ловящий дорогие ошибки и вносящий вклад в артефакт, который он предваряет, а не выбрасываемый.
Стадия бриф → сценарий кормит шот-листы в storyboard-генерацию; storyboard-генерация кормит vision-референсами финальный рендер. Цепь работает, потому что каждую следующую стадию переделать на порядок труднее.