
LTX-2 Distilled — открытый аудио‑видео генератор (Hugging Face Space)
LTX-2 Distilled — облегчённая дистиллированная версия LTX‑2, совместной аудио‑видео модели на базе DiT, способной синхронно генерировать видео и звук в одном проходе. Модель ориентирована на практическое локальное применение, открытые веса и простую интеграцию в пайплайны. Доступен веб‑демо на Hugging Face Space, где можно быстро протестировать image‑to‑video и промпт‑управление движением.
Экосистема LTX‑2 включает полные дев‑чекпоинты, варианты с квантованием (fp8/nvfp4), дистиллированную версию на 8 шагов (CFG=1), а также пространственный и темпоральный апскейлеры ×2 для повышения разрешения и FPS. Поддерживаются Diffusers, ComfyUI (через LTXVideo ноды) и официальный PyTorch‑монорепозиторий (ltx-core, ltx-pipelines, ltx-trainer). Рекомендуется следовать подсказкам: размеры кадра кратны 32, число кадров кратно 8 плюс 1; при несоответствии применять паддинг и обрезку. Модель имеет известные ограничения (биасы, неточности следования промптам, возможный неподходящий контент) и не предназначена для фактической информации.
Примеры результатов
A low, subsonic drone pulses as Uma Thurman's character, Beatrix Kiddo, holds her razor-sharp katana blade steady in the cinematic lighting. A faint electrical hum fills the silence. Suddenly, accompanied by a deep metallic groan, the polished steel begins to soften and distort, like heated metal starting to lose its structural integrity. Discordant strings swell as the blade's perfect edge slowly warps and droops, molten steel beginning to flow downward in silvery rivulets while maintaining its metallic sheen—each drip producing a wet, viscous stretching sound. The transformation starts subtly at first—a slight bend in the blade—then accelerates as the metal becomes increasingly fluid, the groaning intensifying. The camera holds steady on her face as her piercing eyes gradually narrow, not with lethal focus, but with confusion and growing alarm as she watches her weapon dissolve before her eyes. She whispers under her breath, voice flat with disbelief: 'Wait, what?' Her heartbeat rises in the mix—thump... thump-thump—as her breathing quickens slightly while she witnesses this impossible transformation. Sharp violin stabs punctuate each breath. The melting intensifies, the katana's perfect form becoming increasingly abstract, dripping like liquid mercury from her grip. Molten droplets fall to the ground with soft, bell-like pings. Unintelligible whispers fade in and out as her expression shifts from calm readiness to bewilderment and concern, her heartbeat now pounding like a war drum, as her legendary instrument of vengeance literally liquefies in her hands, leaving her defenseless and disoriented. All sound cuts to silence—then a single devastating bass drop as the final droplet falls, leaving only her unsteady breathing in the dark.
Входные данные

Результат
Рейтинги
Оцените сервис
Рейтингов пока нет. Будьте первым!
Часто задаваемые вопросы
Что такое LTX-2 Distilled — открытый аудио‑видео генератор (Hugging Face Space)?
Открытая дистиллированная версия LTX‑2 для синхронной генерации видео и аудио с веб‑демо и API на Hugging Face Space. Это AI-сервис для создания анимации из статичных изображений с использованием искусственного интеллекта.
Сколько времени занимает создание анимации в LTX-2 Distilled — открытый аудио‑видео генератор (Hugging Face Space)?
Среднее время генерации анимации в LTX-2 Distilled — открытый аудио‑видео генератор (Hugging Face Space) составляет около 30 секунд. Время может варьироваться в зависимости от сложности изображения и текущей нагрузки на сервер.
Есть ли вотермарк на результатах LTX-2 Distilled — открытый аудио‑видео генератор (Hugging Face Space)?
Нет, LTX-2 Distilled — открытый аудио‑видео генератор (Hugging Face Space) не добавляет вотермарк на результаты, даже в бесплатной версии.
Какие типы изображений поддерживает LTX-2 Distilled — открытый аудио‑видео генератор (Hugging Face Space)?
LTX-2 Distilled — открытый аудио‑видео генератор (Hugging Face Space) поддерживает: Аудио, Группы людей, Животные, Лица. Сервис может работать с различными типами изображений и создавать качественные анимации.
Есть ли API у LTX-2 Distilled — открытый аудио‑видео генератор (Hugging Face Space)?
Да, LTX-2 Distilled — открытый аудио‑видео генератор (Hugging Face Space) предоставляет API для интеграции в ваши приложения. API позволяет автоматизировать процесс создания анимаций и использовать сервис программно.





