Ваша домашняя видеокарта также можно использовать! Alibaba Wanxiang Generation Model Open Source
25 февраля базовая модель Alibaba Cloud Base Wanxian 2.1 объявила об открытом исходном коде. Ities.
Согласно отчетам, модель с 14 млн. Млн. Стипендиатов имеет выдающуюся эффективность в соответствии с инструкциями, сложным генерацией движений, физическим моделированием, генерации текстового видео и т. Д. В авторитетной оценке набор Vbench Wanxian 2.1 значительно превзошел бытовые и иностранные модели, такие как Sora, Luma, Pika с общим баллом 86,22%, и в первую очередь занимает первое место. Результаты теста 1,3B версии не только превышают более крупную модель с открытым исходным кодом, но и близко к некоторым моделям с закрытым исходным кодом.
Wanxiang 2.1 ранжирует первым в списке Vbench с общим баллом 86,22%.
С точки зрения дизайна алгоритма Wanxian разработал эффективные причинные 3D VAE, масштабируемые стратегии предварительного обучения и т. Д. На основе основной архитектуры DIT и парадигмы траектории линейного шума. Принимая 3D VAE в качестве примера, чтобы эффективно поддерживать кодирование и декодирование видео любой длины, Wanxian реализует механизм кеша особенного в модуле причинно-следственной связи 3D VAE, тем самым заменяя сквозные кодирующие и декодирующие процессы длинных видеороликов и реализацию эффективных кодировки и декодирования бесконечно давних 1080P-видео. Кроме того, внедряя сжатие пространственной дискретизации в преддверии времени, использование памяти вывода дополнительно снижается на 29% без потери производительности.
Экспериментальные результаты командыWanxiang показали, что в 14 основных измерениях, включая качество движения, визуальное качество, стиль и многоцелевые тесты, Wanxiang все достигли в отрасли и выиграли 5 первых. Особенно в производительности сложных движений и физических законов, производительность была значительно улучшена
Сгенерировать пример Display:
Подсказка: Стало спортивной фотографии, гонщики быстро направляют лошадей через препятствия во время полевых препятствий. Всадник носит профессиональную конкурентную форму и каску. Лошади прыгнули в воздух, с когерентными и точными движениями, и четыре копыта энергично прошли через каждое препятствие для поддержания скорости и баланса. Фон - это естественная трава и голубое небо, а картина полна динамики и напряжения. 4K, качество изображения высокой четкости, полное действие.
Подсказка: Спортивный стиль фотографии, китайские каякеры быстро весло в турбулентном токе с веслами, гибко обходив препятствия после препятствия. Он носит профессиональную спортивную одежду, с очевидными мышечными линиями, сфокусированными и твердыми выражениями, демонстрируя отличные навыки контроля и упорный боевой дух. Фон - четкие реки и изумрудные зеленые горы, а картина полна динамики и жизненной силы. Полное действие, 4K, качество HD.
Подсказка: ускоряющаяся камера POV, камера скакает по китайской деревенской дороге на солнце, и камера внимательно следует за китайской женщиной в повседневной одежде и повседневной туфли, летящих в воздухе, ее руки распространяются в вертикальном положении, а ветер дует ее волосы и одежду.
Южный+Репортер Ye Dan Тор браузер не открывается
Powered by смеситель монет TornadoCash @2013-2022 RSS地图 HTML地图