Оживить фото за 30 секунд
Загружаете фотографию в Aily Video, выбираете модель Motion Control 2.6, пишете короткий промпт движения («лёгкий ветер шевелит волосы, моргнул глазами»), запускаете. Через 1-2 минуты получаете готовый ролик 5-10 секунд: тот же кадр оживает реалистичным движением. Биллинг по-секундный — короткий 5-секундный ролик в 720p стоит около 50 «звёзд», 10-секундный в 1080p — около 150★.
⚡ Главный приём: описывайте движение конкретно. «Оживи фото» — модель додумает наугад. «Лёгкая улыбка, моргнул, ветер в волосах, камера медленно приближается» — получите управляемый результат. Можно зафиксировать первый кадр (ваше фото) и описать что происходит дальше.
Как нейросеть превращает фото в видео
Технология называется image-to-video (или photo-to-video). Модель берёт ваш статичный кадр как «первый кадр» будущего ролика и генерирует следующие 24-60 кадров так, чтобы они логично продолжали первый, добавляя движение по вашему описанию.
Внутри это работает похоже на image-генерацию, но с временным измерением. Каждый следующий кадр учитывает предыдущий — поэтому персонаж не «мутирует», лицо остаётся узнаваемым, а движение получается плавным. Текущие модели 2026 года уже умеют держать персонажа стабильным до 10 секунд видео.
Качество результата зависит от трёх факторов: разрешение и чёткость исходного фото, выбор модели (под разные сцены лучше работают разные модели), точность промпта движения. Размытое фото даёт размытое видео — модель не «улучшает» исходник.
Какую модель брать под задачу
В Aily есть несколько моделей image-to-video, каждая со своей силой. Выбор зависит от типа фото и желаемого движения.
| Модель | Сильна в | Длительность | Цена |
|---|---|---|---|
| Motion Control 2.6 | Портреты, оживление лиц, контроль движения через подсказки | 3-10 сек | 50-150 ★ (10★/сек 720p, 15★/сек 1080p) |
| Motion Control 3.0 | Тот же сценарий, более точное удержание персонажа | 5-10 сек | 125-300 ★ (25★/сек 720p, 30★/сек 1080p) |
| Kling 3.0 Pro | Сложные сцены с несколькими объектами, природа, animals | 5-15 сек | 100-450 ★ (20-30★/сек, зависит от 720p/1080p + аудио) |
| Seedance 1.5 Pro | Стилизованная анимация, аниме, иллюстрации в движении | 4-12 сек | 20-360 ★ (5★/сек 480p без аудио → 30★/сек 1080p с аудио) |
| Veo 3.1 Fast | Реалистичное движение, природные сцены, документальный стиль | 8 сек | 160-240 ★ (20★/сек без аудио, 30★/сек с аудио) |
Все видео-модели работают по схеме per-second: финальная цена = ставка × длительность ролика. Включение аудио (где поддерживается) и более высокое разрешение поднимают ставку.

Для оживления старых фотографий и портретов 80% случаев закрывает Motion Control 2.6. Если нужна максимальная стабильность лица — Motion Control 3.0. Для сложных сцен с природой и динамикой берут Kling 3.0 Pro или Veo 3.1 Fast. Seedance 1.5 Pro — выгодный вариант для стилизованных и аниме-кадров.
Пошаговый процесс в Aily
От загрузки фото до готового видео — 5 шагов, около 2-3 минут реального времени.
Подготовка фото
Чёткое, в высоком разрешении (минимум 1024×1024), без сильных артефактов сжатия. Если фото старое — сначала прогоните через upscaler в Aily Images.
Загрузка в /video
Открываете aily.ru/video, выбираете режим image-to-video, перетаскиваете фото в окно загрузки. Поддерживаются JPG, PNG, WebP до 10 МБ.
Выбор модели
Motion Control 2.6 — по умолчанию для портретов. Для природы — Kling 3.0 Pro или Veo 3.1 Fast. Для стилизованных картинок — Seedance 1.5 Pro.
Промпт движения
Опишите что должно происходить: «лёгкая улыбка», «волосы развеваются», «камера медленно отъезжает». Не описывайте сам кадр (он уже на фото), только движение.
Запуск и ожидание
Генерация 5-секундного ролика занимает 1-2 минуты, 10-секундного — 2-4 минуты. По окончании скачиваете MP4 или сохраняете в галерею Aily.
Что повышает качество результата
Несколько приёмов которые отличают «вау, как живое» от «нейросеть видно за версту».
Чего избегать
Самые частые проблемы и как их решить.
| Симптом | Причина | Что делать |
|---|---|---|
| Лицо «мутирует» в кадре | Слишком сильное motion-strength | Понизить интенсивность движения до 30-50%, попробовать другую модель |
| Видео обрывается на середине | Промпт слишком сложный | Упростить: одно действие за один ролик. «Моргнул и улыбнулся», а не «моргнул, улыбнулся, повернулся, заговорил» |
| Сильные артефакты | Низкое качество исходного фото | Прогнать через upscaler перед загрузкой, проверить чёткость |
| Движение неестественное | Промпт описывает невозможное движение | Если на фото только голова — попросить только мимику. Если виден торс — можно жесты |
| Цвета сильно меняются | Модель «доинтерпретирует» освещение | Указать «сохранить освещение» в промпте: «keep original lighting» |
Если ничего не помогает — попробуйте другую модель. Иногда задача просто «не дружит» с конкретной моделью.