>>1119992 → 480x272@73 на fast модели я выжимал 36 секунд на 4070ti. С тритоном и сажей в воркфлоу от Киджая. 3 секунды за 36 секунд звучит неплохо для 13b модели. Я сомневаюсь, что 1.3b WAN может генерить риалтайм (десятикратный прирост жи=).
Справедливости ради, я на P104-100 запускал 1.3b, че-то там получалось, но такое себе.
>>1120085 еще раз спасибо, затупил и ответил в том треде. скачал blockswap ноду для нативного комфи воркфлоу и теперь збс. а то с kijai глаза разбегаются. заодно и текстовый энкодер там в 2 раза меньше. буду дальше копать в сторону image2video
>>1120035 → Я так подрубаю. Блоки самые результативные 8,9,10 и их комбинации, можно через запятую несколько указывать. Начальный и конечный процент должен совпадать с чаем. Разрешение кажется тоже важно, использую 832х480, у меня с таким разрешением даже потребление врам меньше чем с меньшим например.
>>1120423 Кфг тоже разный держит в зависимости от указанного блока, иногда и 7 норм, а иногда с высоким кфг слишком пересвеченное изображение и цвета перенасыщенные получаются.
У меня почему-то исчезла кнопка "ОК" в создании персонажей в Хайлуо. Я тупой или они заблокировали эту фичу для бесплатных пользователей? Или просто глюк?
>>1120487 Что супер? Это не нейронка, один дебс ради рофла кинул, а второй рад стараться сюда притащил. Видос снят с дрона и мужик на фоне зеленого экрана на веревочках.
>>1120135 → Да, Хуньюан имг2вид быстрее, но качество… =( Не так хорошо… По идее, он должен сохранять, кстати, но все равно, и движения корявые и как-то имг2вид у Хуньюаня не пошло, к сожалению.
>>1119962 → Сора это типа резкий HDR, контраст можно понизить в любом видеоредакторе (откорректировать цвета и прочее). В Соре отлично делать всякие не физические объекты (видос 1), природу, графику (HDR отлично заходит для этого). Но самих людей Сора делает гиперреалистических, таких людей в реале не существуют и это конечно забавный стиль, но чтобы получилось хоть что-то похожее на фотореализм надо мутить с промтами
Да, пики смотрятся очень приятно, как и анимации с них (видос 2 и 3, но так как у Соры управления нет, то с анимациями всё печально)
Из-за генерации в 4o естественно тоже возникает перегрузка серверов, но там уже ввели задержки для тарифа 20$, а в Соре их нет.
Свои картинки людей загружать можно, это я проверил сразу (видос 4 с картинки Виска)
ЗЫ: видосы на Соре сегодня с утра шли с 10-ти минутной задержкой, но сейчас опять полчаса висит (и страницу приходится постоянно обновлять)
>>1121176 >Сора это типа резкий продрист Пофиксил. Алсо 4й видос - берет яблоко в руке апельсин, анимация движений калговна, но ты продолжай копротивляться.
Так что там? есть возомжность юзать опенсорс wan без цензуры? как-то кроме у себя на пк? если у меня амуде. Колаб? обнифейс? я так понимаю мимо из за gpu?
Тест1 на управляемость Ранвей Gen4. Картинка из Соры. Задача для анимации: облизать окровавленные пальцы. Первый видос это новый Gen4, второй Минимакс (хотел Рей2, но его цензура сказала отвали), третий это Ван.
Тест2 на управляемость Ранвей Gen4. Картинка из Соры. Задача для анимации: разрубить полено на две части. Первый видос это новый Gen4, второй Рей2, третий это Ван.
Вывод: управление у Gen4 где-то чуть выше уровня Соры (примеры Соры не даю, там вообще всё по нулям), выпускать такую модель когда есть Veo2 и опенсорсный Ван, ну это такое себе. Конечно сам по себе Gen4 лучше чем Gen3 и в стандартных анимациях он возможно будет даже неплох, но прорыва никакого нет и конкурентов он не обгоняет.
Сап, какая вообще сейчас мета генерить видосики онлайн и может даже прон онлайн с еблей? И может уже даже появились локалки где всё дозволено? Но сильно сомневаюсь, лучше хуйла ничего не нашёл, бесплатно, дешёво, но очередь неебическая, 5 секунд видео по часу ждать.
Интересно, что картинки Соры зернистые, шумные и, например, Ван, как заметно выше в тестах, их неадекватно воспринимает делая ещё больше шума, а Gen4, наоборот, имеет способность сглаживать)
>>1126105 Всем похуй на твои высеры дурачок, это так работает. Ты здесь вообще нихуя не делаешь полезного.
>>1126723 >Ты здесь вообще нихуя не делаешь полезного. А твой щитпостинг с воображаемыми тестами полезный? Тебе уже с десяток анонов говорил сходить нахуй.
Поставил ноду TeaCache, вместе с ней идёт Compile Model, так Wan стала ещё быстрей работать даже без тикеша. Что за хуйня? Вроде дефолтные ноды комфи и так что-то компилили там.
https://civitai.com/models/1350447?modelVersionId=1602715 Пиздец, кайфую с работы этой модели, лучшая камшот модель. Если хуй уже есть в кадре, то будет из него шмалять , но если клитор крупно в кадре... сами увидите. Накидайте другие лоры, которые вы считаете хорошо обученными под i2v. Кроме титидропа, не знаю годных, но я очень поверхностно пробежался по нескольким и остановился на лучших двух. Доггистайлы вообще какая-то хуита, на идеальных ракурсах нихуя не анимирует. https://civitai.com/models/1343093?modelVersionId=1541546
Да, и по обычным генерациям t2v Gen4 слабый, уступает любой другой нейронке.
>>1127085 Ну давай объясни чем мои тесты бесполезны. Порази всех ещё своими куриными мозгами. Расскажи в который раз свою любимую фантазию про десяток воображаемых анонов или ещё про что-то, ты же у нас фрик-фантазёр)
Анонимы, прошу пояснительную бригаду по следующему вопросу. Вот у меня есть 3090 пишут что она лучше работает с bf16, но bf16 модель вани весит 30+ гигабайт. Ну логично же предположить что она не влезет в мои 24 гигабайта. Но чем черт не шутит решил попробовать, в итоге не влезло причем ровно половина модели, как понял вторая половина модели поселилась на оперативке, так как было использовано при загрузке 30гб из моих 32. И вот казалось бы половина модели в оперативе скорость должна быть ужасная... Но не все так страшно оказалось, на первом проходе конечно скорость была более чем на 50% по сравнению с fp8 моделью, но уже на 2й проход скорость стала всего на 20‰ ниже. При этом качество финального результата гораздо выше, пропали косяки в изображениях, конечный результат стал больше походить на реальное видео. А вопрос то какой? А нахера мне генерить в фп8 если там такое падение по качеству и такой не большой прирост по скорости?
Вопрос 2. Продолжительность видео и потребление vram. Я понять не могу где тут связь? Я что ставлю 73 кадра что 155 разница в потреблении память меняется всего на 1~2. Время начинает расти но оно и понятно, а вот потребление vram даже на малом количестве кадров у меня большое, так может прямой связи нет?
>>1127884 > А нахера мне генерить в фп8 Фп8 в плане прироста скорости акутален лишь для 4000 нвидии и выше, там завезли хардвейр акселерейшен, как в 3000 завезли бф16. С 3090 применение только чтобы полностью вмещать модели в врам
>>1127884 Лол, с ростом кадров растет потребление = связи нет. Ты воробушек? Связь есть, вот она. Просто размер ответа модели не такой большой, вот она и не берет много. Но для людей с небольшим количеством памяти (8 гб, привет 4060!), занять лишние два гига — это выгрузить лишнюю часть модели в оперативу, получить небольшое замедление. Если забить на время генерации, то на большом разрешении и вовсе можно не впихнуться в видеопамять, да и не у всех 64/128 памяти, у многих 32, а то и 16, туда уже модель просто не влезет, выгрузится в кэш и получим террибле замедление в итоге.
Просто ты этот эффект наблюдаешь очень слабо за счет наличие большого количества памяти.
Может кто объяснить, кто хорошо разбирается ? Я так понимаю на онлайн версии wan 2.1 вшита цензура на уровне генерации, и как не пытайся его обмануть, он тупо не будет выдывать сисик-писик?
А что в локальных моделях? есть гайд как локалку запустить на обниморде или где ещё то?
>>1128034 Нет, цензура не результат. Если через сторонние серверы генерить, то будет размытый хуевый сисик. Может в каких-то генерациях более-менее получится, но я так понимаю, это дефолтный уровень голового тела в Вана, не генерил t2v, еще и без лор. >>1127838 Чет какая-то хуйня. Ни одна генерация не удалась, ни с тикеш, ни без, ни на 41, ни на 64 кадрах. 0.25 мегапикселей генерю. На паре генераций само движение получилось, но за рукой заспаунился новый человек, даже цвет волос поменялся. Какие настройки нужны?
>>1127884 У меня тоже 3090, ни bf16 ни fp16 просто не лезут в память, поэтому вариант только использовать fp8, причем scaled выдает качественнее результат чем e4m3fn. Если вымучить воркфлоу с настройками и подбором нужных нод, то результат не хуже чем 16 битная модель будет выдавать. Лоры один хрен все тренируют на 8 битах, на 24 гб они просто не тренируются.
>>1127942 >полностью вмещать модели в врам ну ладно бы это давало ощутимый прирост скорости, а его практически нет, за то качество падает прилично.
>>1127995 на 3080 с 10гб я этот эффект наблюдал очень сильно, прям катастрофически даже на модели фп8 время в 2 раза увеличивалось использовал квантованный ггуф, а тут всего на 20% при условии что модель 32 гига весит то есть минимум 8 гигов не влазит на память гпу, а если судить по терминалу так там всего половина модели загружается и вообще не понятно что это за цифры.
Тссс... А там на Флоре на Veo2 цену понизили ниже 2000. И поэтому ещё тест Veo2. Три видоса от Veo2, четвёртый видос это Ван.
>>1128175 Выводы из всех тестов: на данный момент по анимации Ван занимает твёрдое первое место, самая живая, правдивая и управляемая анимация, далее Veo2, потом Gen4 и все остальные. Но есть нюансы анимации, например картинок Соры: Ван их слишком зернит, Gen4 сглаживает, а вот Veo2 полностью передаёт качество картинки.
ЗЫ: Veo2 вообще пока не вышел в релиз и его до сих пор пилят.
>>1127782 Я так и думал. Ноль аргументов и полезности от тебя как обычно. Фрик-фантазёр с бзиком на фекальную тему.
>>1128034 Ван отлично генерит сиськи, прошлый тред смотрел? А писькам не обучен, поэтому для их генерации на локалке используются Лоры с Сивитая.
Более сложный тест для анимации (спасибо альтруизму Флоры, которая позволяет бесплатно генерить, хе-хе). Картинка для теста в Соре сделана не рандомно, все объекты были прописаны в своих позициях специально, Сора сейчас лучшая нейронка по управляемой генерации картинок.
Промт для анимации картинки: Men clink glasses of vodka, smile and drink vodka from glasses. Black cat carries fish in its teeth. White cat shows its muzzle from a bucket. Gray cat's paw drags fish with its claws out of frame, т.е. задача такая: мужики должны улыбаться и бухать водку, чёрный кот тащить в зубах рыбу, морда белого кота появляться из ведра, а серая кошачья лапа тырить рыбу за кадр.
4 нейронки из всех, которые показали что-то близкое к промту: Вео2, Ван, Клинг1.6 (что-то ещё может), Минимакс (котик что-то нюхнул). Остальные вообще курят в сторонке: Gen4, Gen3, Пика, Рей2, Ханьюань до сих пор не умеет анимировать картинки, отдельно в луже Сора, PixVerse, Vidu.
Вывод: никто чисто не справился, Вео2 больше всех приблизился к нужному результату.
Забавно, что когда включаю одновременно и tittydrop, и cumshot лору, то в разы чаще появляется цензура в виде примитивных геометрических фигур. Зачем они так упорно старались...
>>1130661 Нет там никакой цензуры, там проблема в движении кадра или в подборе освещения, нейронка начинает буянить когда ты пытаешься добиться от нее того чего нет в кадре и лоры под это не заточены.
>>1130679 >нихуя не генерю, но пиздану >Цензуры нет очень свободный стержень нейросеть трахать соевое масло запад я простота анон город тверь Остроугольные треугольники и прочие цензорбары поверх уже поднятой футболки со сгенеренными сиськами. Очевидно, что они скриптом зарисовывали сиськи в куске датасета.
>>1130804 Где мои треугольники? Ни на одной генерации из этих не было. А вот когда портретную фотку пытаешься сгенерировать в титидроп то вылазят эти херни как у тебя, еще появляется вибрирующий шар по центру экрана иногда.
>>1131502 Эти циферки ничего не значат, я сделал уже более 300 генераций, и только с конкретной картинкой ловил такую херню в 50% генераций, на остальных даже намека не было (были черные тени на лице с мягкими краями, но это как раз нейронка тупила с освещением), а исходных картинок около 30 было.
>>1130804 Если это не локально, то там что-то накрутили и теперь на ване на апи есть цензура визуальная, она не всегда срабатывает, но качество генераций упало в разы и да пытается порой соски закрыть либо генерит размытую хуйню и шум. Как будто там антипромпт стоит.
Робот и бабочка. Картинка Соры. Вео2, Ван, Gen4, Минимакс. Анимация по промту: The robot brings the butterfly closer to itself, while its eyes light up red and the butterfly explodes in a small explosion with bloody splashes
И хотя Gen4 ближе к промту, Вео2 мне нравится больше.
>>1131622 Ты же сам удивлялся цензуре тут >>1122991 →. Ты ебанутый? Говорю, погенерь больше, комбинируя лоры и заменив 40-летних бимбо-бабок на красивых 25 летних женщин, оно старух не считает за женщин, в датасете закрашивалась эротика с нормальными самками, пожилые не снимают такие видео. Тогда может чаще будет вылезать цензура, раз на 20 генераций, с некоторыми лорами раз на 100 и реже.
Хочу пользоваться фичами киджая, но не хочу юзать этот ебанный статический блоксвап, постоянно пробую разные размеры пикч, разные разрешения. Раньше всегда им пользовался, а потом узнал, что дефолтный комфи динамически заполняет ВРАМ и постоянно держит его около 95%, получается быстрей. Есть варианты использовать дефолтный динамический блоксвап на kj, или подключать skip layer guidance, latent looping, flowedit, vace, control и всю прочую ебалу к нативному воркфлоу? Не нужно предлагать пикрил, я его заюзаю и подберу количество блоков, если ничего больше не поможет.
>>1131731 Я удивлялся что это такое по тому что сколько генерировал - такого не встречал. Потом спросил нейросеть что это такое и она мне хорошо подсказала очень доходчиво. Склоняюсь к тому что у меня была комбинация говна сразу, неправильно описал освещение + пытался двигать тазом камерой.
К тому же определять nsfw контент нейросетке много ума не надо, ей на это 350 vram достаточно. Если была бы задача цензурнить - хрен бы ты что сделал, не в 20 не в 100 вариантах.
Ну и какие это бабки, одной 26 другой 27. На звездах генерил тоже проблем таких не видел.
Мужик и пришелец. Картинка Соры. Вео2, Ван, Клинг1.6, Минимакс. Анимация по промту: A man punches an alien in the face, the alien's head falls back, teeth fly out, drops of blood, dents from the blows of the kolaks remain on the alien's face, dynamic scene, dynamic movements
Вео2 показал замедленный разлёт зубов (больше похожи на камни) и норм удар. Ван просто в забавном экшене. Клинг не справился. Минимакс тоже довольно забавный.
>>1133939 Блядь, какой же ты тупой "в забавном экшене". На ване сработал антипромпт против насилия и то что ты видишь это глитчи: модель срёт пережаркой из-за конфликта в твоем промпте и антипромпте. У клинга еще более мощный антимпромпт против насилия.
>>1133997 >На ване сработал антипромпт откуда ты знаешь что там под капотом, шиз, если свечку не держал при создании. про антипромпты чето он вякает... мимокрокодил у вана кстати мощное избиение в стиле аниме файтинга получилось. прими таблеточки.
Заебали лоры, которые меняют лицо. Видимо, хорошие лоры обучаются со статичными лицами. Подкиньте ссылки на такие, для Wan, разумеется. Или может вы промптом успешно решаете эту проблему? Подскажите. Пробовал разные, но прям рабочего не нашёл.
>>1134866 >Ешь свой кал молча. Так это не мой кал, клоун) или персонально для тебя надо писать "мимокрок", а то ты бедненький, везде автора поста видишь? Под кроватью смотрел, может он там прячется, по ночам тебе спать не дает своими пережарками, в которых ты "спец"?
>>1133997 Опять бесполезный фрик-фантазёр высрался. Едрить у тебя фантазии про столкновения промтов с антипромтами). Во-первых, ты это, не путай включённые фильтры моделей с их обычной не обученностью многим вещам (по разным причинам) и физической невозможностью сделать те или иные генерации, а то напридумывал себе) Во-вторых, это у Вана то цензура против насилия? Это так ты называешь едрёный махач избиения пришельца? Ты думаешь я по картинке одну генерацию делаю, чтобы составить мнение? Ещё 4 видоса Вана, мощный удар в лицо пришельца в первом, а вот для остальных я промт немного изменил, особенно на последнем видосе видна работа твоего антипромпта против насилия, да?)) А видос, кстати получился зачётный.
ЗЫ: заметь, и это я генерю стандартную модель Вана, а ведь для неё для локалки можно обучить Лоры абсолютно на что угодно.
>>1134204 Верно, из-за этого забавного файтинга как в мультах я и выбрал эту генерацию Вана)
Может кто-то объяснить, почему ван не реагирует на лоры. Вот я скачал пинокио, скачал вот эту лору https://civitai.com/models/1343431?modelVersionId=1517164 Выбрал её в пункте где выбираются лоры. Написал в промпте то, что написано в триггер вордс. В итоге сиськи нифига не трясутся. Даже намека на тряску нет.
Их надо не закидывать в папку, а как-то устанавливать? Но почему другая лора работает, которую я просто в папку закинул.
На 3060 реально генерить в ван 2.1 14b? что то я пробую и долго, мин 10 получается и в gguf пробовал и в safetensors. шагов 28, 480 на 720, 16 фреймов,
DeepSeek рекомендует купить Google Colab Pro ($10/мес) – A100 40GB и в хуй не дуть, на нём тупо всё генерить. Так то косарь в месяц вроде и не много, какие подводные? будет вообще работать?
6 минут. 480x864x41, unipc, 20 шагов, нищая медленнная 4060 Я заебался крутить эту дегенеративную статичную блоксвап ссанину от киджая, поэтому стоит на 20 блоках, потребляет около 13 из 16 гигабайт. На нативных нодах может и быстрей будет, но там семплеры какие-то другие. Так уже заебало это несоответствие. Ну возьмите да договоритесь, приведите всё к одному формату. Нет каждый свою хуету делает, наплодили сущностей твари. Отдельные дегенераты ещё и свои UI делают. Ещё раз пишу, установите всю хуйню с компиляциями и последними питорчами, если вы генерировать собрались. Оно всё легко ставится под чистый виндоус без дегенератской линуксоидной хуиты.
Время увеличивается не линейно, когда увеличиваете размер или продолжительность видео. Поэтому 512х512х41 в самый раз будет, в большинстве случаев нахуй не нужна продолжительность, ничего нового оно показать не успевает. А хочется подольше и побольше - нехуй ныть и го батрачить на 5090. >>1140995 >1.3b кажется совсем говно или не? Совсем не говно. Только генерится почти так же долго, при значительно меньшем размере. Но t2v везде говно, даже на 14б. Зачем оно нужно?
>>1120067 (OP) сука оп ебаный, ты же мог чётче пост с перекатом оформить, уебан, только сейчас увидел что ты лох в 499 посте сделал ссылку, которую нихуя не видно, будто ты уёбище Опа просишь сделать перекат! Не делай сука так больше! Черт ебаный! Если не черт, то прости. Но всё равно уебан! )
Пёсик! кис-кис-кис! Извините что она >>1126105 там на вас выше гавкала, я просто в прошлом треде заблудился, а он шавка тут на вас кидается, от меня отбилась.
Заметил, что часто стал генерить размеры вроде 860х860 и прочие около 750к пикселей. Решил включить 720p модель, у генераций стала появляться всратая окантовка, навроде эффекта рельефа или повышения четкости, чего никогда не происходит на обычной модели. Неправильные настройки? Чем должны отличаться от 480p?
Анонасы. Мне нужно пикчу анимировать, чтобы волны были именно... не могу ничего дельного найти чтобы в высоком хорошем качестве получилось, везде параша выходит. Может кто помочь если не трудно? Или подсказать.
>>1141360 >Ещё раз пишу, установите всю хуйню с компиляциями и последними питорчами, если вы генерировать собрались. Оно всё легко ставится под чистый виндоус без дегенератской линуксоидной хуиты. У психически полноценных людей есть анаконда.
>>1143392 И к чему ты это пишешь, ебанутый? Конда сама по себе ничего не установит. Тоже она стоит, но к делу не относится. Поставить можно хоть на голый питон, хоть в венв.
да вы в принципе все оба\8 можете идти нахуй со своими кондомами, анакондомами и прочей хуйней. Работяги с завода нахуй это ваше задротское говно не понимают. Им нужно поставить и генерировать.
>>1143392 Ты из 2020 капчуешь? Для адекватных людей есть uv, который работает через нормальный конфиг и пересоздание окружения потом выполняется одной командой uv sync. Это как раз с анакондой/пипом надо писать кучу команд чтоб запустить что-то.
А попадались вам хорошие pov cumshot? Та, что сбоку генерит мужика постоянно косую перспективу делает, да и лицо сильно жмурится, становится непохожим.
>>1143677 Тоже ковыряюсь сейчас в фан версии. С одной стартовой пикчей промту следует хуже, чем базовая версия. И немного лучше если для конечного кадра есть картинка, но все равно хуже чем база. На картоне 3060 12кек такие результаты. 1. 512, Prompt executed in 76.49 seconds, одна стартовая пикча, лора на выпадение сисика, rewward mps лора для улучшения фан версии 1.3b, цфгдистил лора для низкого цфг на втором проходе, первый проход 5 степов цфг5, второй 5 степов цфг1 2. 512, Prompt executed in 76.83 seconds, две пикчи (первый и последний кадр). Остальное всё тоже самое. 3. Prompt executed in 801.99 seconds. Просто для прикола проверил сколько пека будет пердеть в этом разрешении. 4. Prompt executed in 311.68 seconds. Апскейл с тайловой лорой для 1.3b на низком цфг, 20 степов.
>>1147852 LTX, который 2b и тупой как пробка? =D Можно не надо? Там кроме скорости ничего интересного же. Ну, людей в дефолтных позах норм генерит, да. Но очень чувствителен (ко всему: промпту, разрешению, количеству кадров, шуму…).
>>1149068 Теперь еще и улетевшие на отмененную генерацию кредиты не возвращают, так как эта хкуйня глючила. Я не знаю как ты, но я там несложными махинациями до 50 000 накручивал, и просто сидел на одном акке без перерег. Сейчас уже так нельзя. Но вообще, если по чесноку, я б не стал на текущего состояния видеогенераторы тратить реальные деньги, когда у тебя даже в тестовом режими отдает стил-шоты на Ване и рисует 3дманяме на пике в слишком большом количестве случаев. Плюс они накрутили цензуру на ване, поэтому там вообще слишком часто стал выпадать мусор из-за их антипромпта.
>>1149552 кароче в топку их, насчет накрутки я обращал внимание, но у меня доходило до4к, потом ролило обратно на 2к, поэтому не парился. Да и самого начала там ВАН ущербный был, криво настроили они его.
>>1149705 Ну так вот можно было продолжать их использовать, пока не накатило. Ван они там скрутили до 40 шагов. Если не дурачок, легко поймешь как 100 выставить, бегунок если что не работает у них (топ-кек). Но на самом деле да. Я лучше обратно на клинг.
>>1150538 Кстати в ване полная херня начальная и конечная картинка. Как будто изначально модель на такое не рассчитана. Получается просто полная херня в 99% случаев.
Альтернатива? Локальная и без цензуры? Мне нравится что ван генерирует по стартовой картинке. Ноды для sei есть но генерирует буквально на порядок медленнее.
>>1150583 Да я хз, я в этом не разбираюсь. Ну просто вот я делал тизер к третьему сезону разделения, и вот что мне ван выдал, и что пиксверс. А иногда он просто не морфирует, а вставляет в конце второй кадр просто. Вообще по-моему эту функцию не сами разрабы прикрутили, а какой-то васян.
Ключевые моменты DreamActor-M1 — это новая нейросеть для анимации изображений человека, представленная в апреле 2025 года. На данный момент она не доступна для публичного использования, вероятно, ограничена исследовательскими группами. Исследования показывают, что она использует передовые технологии, такие как диффузионные трансформеры, для создания реалистичных анимаций.
Выводы и рекомендации DreamActor-M1 представляет собой передовую технологию в области анимации изображений человека, но на апрель 2025 года она не доступна для публичного использования. Исследователи и разработчики, интересующиеся этой темой, могут обратиться к научной статье (статья на arXiv) и GitHub-репозиторию (GitHub-репозиторий) для получения дополнительной информации. Для общего использования, вероятно, потребуется дождаться официального релиза, который, судя по комментариям, может быть открыт в будущем.
>>1151447 Сосать привыкла твоя мамаша когда её мастурбеки за пластину жевательной резинки в туалете общепита дерут, так что иди на хуй со своими охуеными запросами, червепидор.
>>1151555 >ЧЕРЕЗ EXE ФАЙЛ Это дополнительный слой сложности. Тогда нужно как-то библиотеки собственноручно поставлять. Или установщики автоматизировать так, чтобы у всех работали. Юзер потом ничего не исправит. На голом питоне намного проще самому что-то доустановить, поменять версию. В лучшем случае поставляют с .BAT файлом, который всё устанавливает и запускает. Так-то ты можешь скачать ComfyUI именно в таком виде, вручную поставить Manager, а дальше уже будут установки как для овощей, в списке будет и LivePortrait и куча всего поновее.
>>1151648 >может у них особая версия? У них даже лучшая версия, так как они делают бодисвап. А та хуита которую ты притащил - год как везде доступна. В апреле 25 они просто веса обновили. На сайте - демка с хага, которой год,я колаба три нагуглил за полминуты, боже мой с каким скотом я в треде сижу.
>>1151882 >Это дополнительный слой сложности. Тогда нужно как-то библиотеки собственноручно поставлять. Или установщики автоматизировать так, чтобы у всех работали. Юзер потом ничего не исправит. >На голом питоне намного проще самому что-то доустановить, поменять версию. В лучшем случае поставляют с .BAT файлом, который всё устанавливает и запускает. Ну нахуй ты животному отвечаешь? Там в гите буквально инсталлер с икзи файлом лежит.
>>1151945 Ну пока такие животные даже с генераторами не могут отсеить мусор, что сгенерится за них, то я спокоен, что смогу сгенерировать и отсеить мусор лучше.
>>1151882 >скачать ComfyUI именно в таком виде, вручную поставить Manager они уже на сайте выложили готовый экзешник с вшитым манагером) Так что даже с ним ебаться не нужно.
>>1153565 Почему более-менее держится, края не пидорасит? Ты прям на целый видос сделал синк? Или можно маску делать? Если кропать, то обычно края шатает.
Анонасы, прошу вас поделиться годными воркфлоу для I2V Вани. Уже половина треда прошла, а нового воркфлоу нет, не порядок. Вообще предлагаю в шапку добавлять хорошие воркфлоу чтобы не терялись
>>1151861 пукнул тебе защеку, скот ты в стрелялки переиграл, раз везде хочешь видеть вид от первого лица с прицелом и мишенью в одном кадре логично - это когда ты понимаешь, что происходит в кадре и тебе для этого не нужна полная картина
https://www.youtube.com/watch?v=8LeNmkjQl54 О, наконец какой-то китаец догадался выкинуть из датасета слоумо ебучее. Ну либо применили мою очевидную идею с разметкой по уровню движения которая делается простейшим скриптом.
Короче в HEDRA можно было проанимировать портрет - фото, сервис использовал текст на русском, озвучивал и подгонял и анимировал под озвучку мимику лица с фото....
>>1156912 Я вчера почему то не смог загрузить туда звук (Audio script). >Есть ли аналоги? https://lemonslice.com/studio попыток больше, но качество хуже.
Что бы вы запустили на 4090 48GB? В планах Wan2.1 i2v 720p, HunyuanVideo t2v, оба через комфи (без дуосэмплера), возможно через Kijai, на тесты. fp8 везде, кроме HunyuanVideo на комфи, там bf16.
Есть идеи как сделать чтобы как в таймлапсе быстро летели облака, но остальное типа домов и объектов на переднем плане не двигалось? Есть Wan2.1 и 3060 с 8гб, могу попробовать какую то другую локальную.
>>1157919 А как в принципе заставить сделать движение облаков? Есть идеи на промпт? Пробовал strong wind, move clouds forward to camera и тд. Один раз вся сцена сдвинулась по типу как оператор поехал вперед, но вот облака как стоят на месте так и стоят
Вчера вышел Клинг 2.0, сравнил его с предыдущей версией. Первый видос, о том так рубит полено Клинг1.6, а второй как это делает Клинг2.0 (он это делает лучше Вана и Вео2). Третий как умеет бить Клинг1.6, а четвёртый как бьёт Клинг2.0.
Выводы: 1.На данный момент Клинг2.0 это сама лучшая модель для генерации видео (в этом можно так же убедится по тестам блогеров на ютубе) 2. Не все генерации может сделать, косяков ещё много. 3. Цензура в разы больше чем в Клинг1.6, заворачивает назад много промтов (Вео2 на его фоне выглядит плохой девочкой) 4. Конская стоимость одной генерации. Генерить за такую цену? Нет, спасибо. Ждём когда версию 2.0 сделают для всех и крутим акки через временную почту. Ну и на Флоре возможно появится не выше 2000.
1. На Флоре утром появился Клинг 2.0. (На оф сайте одна генерация стоит целый 1$, а на Флоре бесплатно) 2. Первые два видоса генерации в Клинг2.0 картинок Дримины (кто не в курсе там теперь можно делать норм картинки), вторые два по картинкам Соры, на последнем кусь не удался. 3. Отдельно про дождь, ни одна нейронка нормально до сих пор не может делать дождь, про удары капель я вообще не говорю. Пока на картинке дождь не сгенеришь он вообще не пойдёт в видосе.
>>1160022 Что это? >>1159967 А нахуя, если итак уже работает. Надо будет попробовать, когда заработает в комфи, но оно же не будет совместимо с 480п лорами?
>>1160473 В общем это была не поломка. Альтруисты из Флоры перешли на тёмную сторону и понизили лимит кредитов с 2000 до 500, оставив для фри юзеров только одну модель - Минимакс.
ЗЫ: навсегда это уже или потом вернут обратно - покажет время.
>>1160841 Ну и пидорасы. Ок, тогда лайфак: кредиты всё еще можно майнить, вчера работало, я это вчера и заметил. если ты на минимакс или любую другую модель с цензурой отправляешь, то она шлет отказ, но кредиты сразу не возвращаются, главное не начинать в этом же ноде новую генерацию, там есть определенное окно между возвращением кредитов и их учетом на сайте, если ты в него попадаешь - то тебе по сути и 2 и 3 раза возвращает кредиты. Я не совсем понял как повторить эти условия, но я сгенерил в ту сессию явно больше чем на 2к, и это было уже после того как они защиту на отмену генерации поставили.
>>1161858 Долго они эту базу набирали, целых 3 месяца). На самом деле боссы Флоры посмотрели на расходы и немного прихуели от того, что они не совпадают с доходами от числа пользователей и дали команду админам прикрыть откровенную халяву. Но могли бы все модели и не закрывать, ограничить только бесплатные кредиты до 500. Вообще я хз кто там за такие деньги генерит видео, Клинг2.0 намного дешевле на оф сайте, Вео2 уже по подписке за 20$ дают 100+ генераций в Виске + бесплатный триал на 300$ + 3 бесплатные генерации в день на акк в Гугл студии. Немного об альтруистах: тут https://videostudioai.ai/create пока дают 2 генерации на акк: Минимакс, Люма, Клинг1.6, Ван (с цензурой). И здесь много моделей https://nim.video/ но только с гугл акков.
>>1163543 Не могу без боли смотреть на их мультяшные (((соски))). К тому же одна генерация на акк, а потом 2 часа дрочить фейкмейл, потому что кучу акков уже всрали? Не, спасибо. я лучше в виду за раз нагенерю пачку и где-то он пропустит без цензуры, сверкнув сисиком, но хотя бы человеческим.
>>1163834 >я лучше в виду за раз нагенерю пачку и где-то он пропустит без цензуры, сверкнув сисиком, но хотя бы человеческим. Кстати о человеческом сисике. Где они? Ладно хуи и пёзды постить здесь запрещено, но сисики-то где? Сачкуете, сволочи?
>>1162574 >Долго они эту базу набирали, целых 3 месяца). Ну, вон Виду без доп.рекламы имея СОБСТВЕННЫЙ движок, как лохи уже блядь 6 месяцев или сколько они существуют - не могут базу набрать. Схема флоры понятна, потому что пое точно так же делал. Сперва даешь доступ к дрочке со слабыми фильтрами, потом фармишь дрочеров нетерпеливых, готовых платить, очень много их фармишь, прям селекционируя мамонтовых мамонтов максимально шерстистых. А затем рубишь халявы в ноль и стрежешь шерсть, задирая конские цены, потому что тупая аудитория из нетерпеливых кумеров и просто лошков - максимально прогрета. Ты зайди на пое, посмотри на их ебанутейшие цены, если бы у них не было базы из готовых платить, и не способных от лени и тупости кликнуть в соседнюю вкладку, где 70% из предложений пое на 100% бесплатные... так вот, пое бы давно наебнулся, а у них норм прибыль генерится. Так что флора тоже не просто так халяву раздавала, там слишком тупые дырки были.
Но самый то прикол в том, что они скрутили шаги у всех моделей. То есть на старте, я когда генерил в Ване там, буквально он у меня на глазах там появился - качество было как на офсайте. Затем они сломали разрешения. А потом скрутили качество, и как я писал выше - бегунок его не меняет, там можно ноду скопировать через контрол+ц и кинуть в блокнот или в коммандную строку браузера и почитать все параметры. На хуйле я тоже пару вчера сгенерил - там тупо разрешение упало.
>>1163836 >Кстати о человеческом сисике. Где они? Ладно хуи и пёзды постить здесь запрещено, но сисики-то где? Сачкуете, сволочи? Чувак, все генерят сисики своих мамок и сестер, кто сюда такое будет кидать? Тебе не показалось подозрительным, что за 2 года вообще порноконтента как-то подозрительно мало? Есть только дженерик кал на быдлосайтах. То есть, ты можешь буквально что угодно делать, но на пиксиве - треша и жести стало резко МЕНЬШЕ, после появления ИИ-генераций, чем было до того. При том что политика там не изменилась. Но некоторые артисты - просто пропали сидят дрочат воплотив все свои мечты за клик мышки. Так-то иногда мелькают скрины папок антош, у которых терабайты, но никто не выкладывает, потому что... там всякое личное. С их личными вайфу.
Да и... откуда я знаю, что тебе интересно? Просто что угодно сюда кидать? Твою мамку и сестру я точно раздевать не буду. В этот раздел я не могу выкладывать, меня трут и банят. Вон есть нейрофап, там есть тред про андроидов. Уверен тебе фап-материала хватит на месяц. И я уверен тебе это не интересно. Так что ты тут вот ТУТ ожидаешь и хочешь увидеть? Скажи.
>>1162882 Вигле аи. Пощелкай вкладки там много добавили. Инфинити аи. Клинг, пиксверс, да любой почти крупный видеогенератор. В фэйсфюжене локальном есть функция липсинка.
>>1163834 >мультяшные (((соски))) >одна генерация на акк >цензуры Цензуры нет. Загружаешь своё изображение с идеальными сосками. За нецензурные результаты возвращают кредиты. Так ещё и каждый день дают 60, если по ошибке сгенерил цензурное.
>>1163848 Я знаю что там и знаю про скобки. Сам по себе генератор говно. И 60 кредитов это одна (1) генерация в сутки. И дрочиться с продолжениями видео и подкладываниями туда картинок я не собираюсь. Обмазывайся говном в одиночестве.
>>1163855 Бля, какой же дегенерат. Повторять не буду, просто прочти ещё раз внимательно. >подкладываниями туда картинок Какое ебло вообще генерит т2в? Это каким ебланом нужно быть? Первый раз видеосетки пробуешь?
Кажется, еще не пробовал комбинации лор в ван, решил потестить после нескольких тысяч видео на I2V модели, включаю нужную модель, подключаю две лоры и - хуйня. В общем, нормальный результат дало только, когда низко выкрутил тикеш и поставил цфг на 2, а шифт вообще похуй, хоть до 14 выкручивай, сильно не меняло результат. Что за хуйня? Как эти параметры вообще узнавать, без траты огромного количества времени на тесты? На цфг 4 уже полный треш получался, что не характерно для I2V, к примеру. Майерс + блоуджоб норм работает.
Привет, я из anime diffusion треда. Там я научился делать аниме порнокартинки без цели распространения с вайфу и очень доволен. Вопрос: можно ли делать аниме порно-гифки/короткие видео/любой формат анимации при помощи ИИ без цели распространения?
Представляю ебало даунов с флоры. Джва месяца сливать бабки, чтоб тебе на клюв насрали через джва дня.
Requirements:
Nvidia GPU in RTX 30XX, 40XX, 50XX series that supports fp16 and bf16. The GTX 10XX/20XX are not tested. Linux or Windows operating system. At least 6GB GPU memory. To generate 1-minute video (60 seconds) at 30fps (1800 frames) using 13B model, the minimal required GPU memory is 6GB. (Yes 6 GB, not a typo. Laptop GPUs are okay.)
About speed, on my RTX 4090 desktop it generates at a speed of 2.5 seconds/frame (unoptimized) or 1.5 seconds/frame (teacache). On my laptops like 3070ti laptop or 3060 laptop, it is about 4x to 8x slower.
In any case, you will directly see the generated frames since it is next-frame(-section) prediction. So you will get lots of visual feedback before the entire video is generated.
>>1164340 Пишут что генерит на любой карте с 6гб рамы. Но насколько я понял это пока только для Хунюана. Выглядит как революция в видео генерации, на любой консумерской карточке можно генерить видосы любой длительности. Главное чтобы к Вану прикрутили.
>To generate 1-minute video (60 seconds) at 30fps (1800 frames) using 13B model, the minimal required GPU memory is 6GB. (Yes 6 GB, not a typo. Laptop GPUs are okay.) >About speed, on my RTX 4090 desktop it generates at a speed of 2.5 seconds/frame (unoptimized) or 1.5 seconds/frame (teacache). On my laptops like 3070ti laptop or 3060 laptop, it is about 4x to 8x slower.
Аноны кто то сталкивался с ошибкой при установке фейсвапа roop-unleashed ERROR: Wheel 'insightface' located at D:\roop-unleashed\installer\installer_files\insightface-0.7.3-cp310-cp310-win_amd64.whl is invalid. Гугл особо не помог, пробывал 2 раз запустить и там какие то окно с регой на гитхабе стали вылазить, хотя я смотрел гайд с установкой там не было такого.
>>1164307 В целом норм, но долго. На 4090 за минуту генерит полторы секунды 30 фпс видоса. Из плюсов - прогрессивная генерация, можно поставить 30 секунд и стопорнуть как надоест ждать, а первая секунда меньше чем через минуту появляется и сразу видно результат. Из плюсов - всё очень стабильно, никакой тряски камеры, не начинает распидорашивать через пару секунд как у Вана.
>>1162621 Флора была одна такая уникальная с Ваном)
>>1163837 Маркетинговый ход то понятен, но они просто откровенно давали халяву как никто другой, могли бы и на Клинг2.0 ещё недельку потерпеть) Качество у Вана на Флоре действительно хуже, зернило анимацию картинок. На оф сайте у Вана такого нет и там сейчас появилась возможность анимации по двум кадрам, теперь хоть какие-то управляемые генерации можно делать (см. пример видоса)
>>1163845 На videostudioai.ai всё норм, там вверху написано, жмёшь на эту надпись и регаешь акк с любой временной почты, дают 2 кредита на 2 генерации. На nim.video на новый гугл акк дают 200 кредитов.
>>1164889 >там сейчас появилась возможность анимации по двум кадрам это было ещё до момента выхода вана в опенсорс, на китайском сайте уж точно.
п.с. я так понимаю мне с моей 2060 6гб про framepack стоит забыть? по крайней мере даже генерацию не могу стартонуть, даже при всех минималках ООМ. Правда на гитхабе там и владельцы видях с 24гб жалуются.
>>1164455 Пиздец, да что за качество. У меня даже в 1080п такой натуральности нет. Установил и настроил уже все оптимизоны и улучшаторы какие можно. Сможешь повторить сальто кота в воду? У меня ебанный пиздец начинается вместо прыжка. И дело тут не в коте, это значит что настройки фундаментально неправильные, а какие ставить я хз.
>>1164889 >Флора была одна такая уникальная с Ваном) На ниме написано, что начиная со второго уровня членства там цензура отключена. Вот и думайте чем торгуют эти прокладки и кто им разрешил.
>>1164967 >>1164937 wan2.1_i2v_480p_14B_bf16 на 3090 6 секунд видео около 11 минут делается Воркфлоу есть в метадате видосов, взял его у щедрого анона из треда, только он делал в 512х512
>>1164365 Аутистическая вниманиеблядь с СДВГ прыгающие со скоростью мандавошки с проекта на проект, и с такой-же скоростью теряющее к ним интерес - не в состоянии запилить даже нормальный инсталлер без того чтобы жидко не обосраться, за этим долбаёбом всю дорогу кто-то другой дорожки говна с пола подтирает, не пройдет и нескольких месяцев, как этот дебил всё забросит, как собственно и всегда...
Нахуй вообще нужен этот фреймпак? Как они заебали сочинять названия для каждой хуйни вместо четкого описания, что эта хуйня делает? Представьте, если бы img2img, inpaint, outpaint, upscale и прочие общие термины назывались бы рандомными идиотскими названиями вроде fun, framepack, skyreels, vace, вместо внятного описания, что это controlnet, это img2vid и так далее. Поразительно, что для отключения 10 слоя не выдумали свое дебильное название. Как уже заебали, лучше бы dmd изобрели. Это самая базовая база, которая в первый день должна выпускаться. Вон, Google в ImageFX тупо сразу включили её, даже не давая шанс погенерить без оптимизаций, а через полгода выкатили апдейт, который ещё сильней ускорил и похерил генерацию.
Что это вообще за хуйня фреймпак? Позволяет сделать 1000 кадров, генерируя их по кусочкам по 100 штук? Так эта хуйня весь путь была в хуйне и в ван. Не пробовал, хз как работает, но context window был и его можно было настраивать. Это не оно? Влияние на производительность есть? Замедление только за счёт перерасчёта пересекающихся кадров? Нахрен вообще нужны минутные видео... (без vid2vid).
Можно вставить видео и натурально продолжить его, взяв, допустим, первые 3 секунды как референс? Такой vid2vid, но с маской поверх первых кадров. Потому что img2vid не даст натурального продолжения видео. И почему ничего не слышно про outpaint или inpaint для видео? Насколько я представляю, для сносного результата не нужны никакие технологии, на среднем денойзе должно сработать, просто сделать маски на кадры, в том числе динамически, прогнать vid2vid и вставить обратно. Или HunyuanLoom/FlowEdit так и работает, автоматизируя генерацию масок через промпт?
>>1165527 >Так он и не сломан был Написано что он на 6гб врама, но на калабе он не влезает в 12 врама, даже с 1 секундой, он тупо улетает в нехватку куды. Очевидно что-то не так.
>>1165537 >Аутистическая вниманиеблядь Не трясись, лапша. Илья охуенный пиздоглазый, который делает охуенные проекты. С чего он тебе годами должен саппортить то, что уже ему не интересно и не актуально? Попустись. Всё он правильно делает. Контролнет, фокус, вот это - топчанские вещи. Фокус например до сих пор спокойно рабочий, в отличии от паломатика, который дох каждые 5 секунд после нового костыля. Ты илюхе деньги не платишь, чтоб с него чё то требовать.
>>1165543 >Насколько я представляю, для сносного результата не нужны никакие технологии, на среднем денойзе должно сработать, просто сделать маски на кадры, в том числе динамически, прогнать vid2vid и вставить обратно. Сделай.
>>1165584 Там очень много палочек, ильи и илья дальше не читал.
>>1165587 Этот "пидорас" сделал 50% современной картиночной сцены попенсорсной. То что ты говоришь, что за ним кто-то доделывает, так кто-то и ДОЛЖЕН доделывать. Просто на попенсорсе это доделывают мимокроки, а внутри копрораций - оплаченные подсосы. Он слишком талантливый, чтоб сидеть дрюкаться с твоим инсталлером, вместо того чтобы думать как импейнт инплементировать. Каждый в этом мире занят своим делом. Гораздо хуже пидорасы-перфекционисты которые как Курт Какбэйн по 30 лет дрочат один посредственный никому не нужный трек. Я тоже фокусом пользуюсь, но объективно у меня притензий к нему ноль. Он сделал и оно работает и даже гуглов не напрягает протечками, чё еще надо? Для остального есть дрочеры-перфекционисты которые рады припиявится.
>>1165600 >Он слишком талантливый, чтоб сидеть дрюкаться с твоим инсталлером Бля, да ты рофлишь что-ли?) Если ты обсираешься на малом, то и в большом ты в этом так-же хорошь) Так по жизни всегда бывает.
>>1165540 Тем не менее ничего лучше для длинной генерации нет. Стабильность результата, промпт понимает отлично. А самое главное сразу видишь что получится, а не ждёшь вслепую 10 минут чтоб получить хуйню. Алсо, оно семплит с конца видоса, т.е. сначала последние кадры видишь и дальше оно догенеривает до стартового кадра. Хуйнян кал конечно, но что уж имеем. > Так эта хуйня весь путь была в хуйне и в ван. Там это работает очень плохо. И на выходе нет такой непрерывности как у Ильи.
>>1162330 Я тоже сейчас потестил, и основной недостаток это статичный фон. Динамику персонажа генерирует неплохо, по крайней мере пока персонаж единственный, но фон скучно статичный, по крайней мере если в промпте задавать движения перса и не упоминать фон. Двух и более персов, а также динамичный фон я пока не пробовал писать в промпте, так как это все не самое быстрое удовольствие на моем железе.
>>1165784 > Двух и более персов В целом терпимо, но у меня наверное Чай шакалит руки, илюха как раз пишет что от него рукам пизда. Фон да, всегда как статичная пикча.
>>1165833 На 3080 12 gb vram, 32 ram при дефолтных настройках секунду видео генерит около 7-8 минут. На мой взгляд это долговато, с учетом того, что фактически анимируется только персонаж. Например, промпт "The girl dances like a warrior with the iron mace in her hand, while a black hole rotates in the sky, and camera slowly moves backwards" выдает танцующую девушку с дубинкой, но в небе все статично, и камера сдвигается на миллиметры вверх-вниз.
>>1164805 64-битная версия архитектуры x86 была изначально предложена AMD, поэтому ее часто называют amd64. К видеокарте это никакого отншения не имеет.
>>1165873 Однако если использовать картинку без персонажа, то FramePack понимает, что означает перемещение камеры. Видео по промпту "The camera flies forward over the picturesque landscape", правда на исходной картинке не было этого летающего объекта, просто рандомно сгенерированный "пейзаж из игры".
А что с клингом? Надо новые акки регить, или халявы вообще нет? Я когда захожу, мне пишет, что докинули фри кредитов, но нифига. На другом акке тоже 0.
>>1165509 >Create - Creation - Text2Video / Img2Video 50 кредитов в день хватает на одно 3 секундное видео wan t2v либо три 3 секундных видео hunyuan i2v в режиме фаст лоры правда то и дело почему-то выпиливают, но можно добавить самому с цивита если ты автор можно чуть-чуть пополнять кредиты если лайкать арты/модели/лорв таймер генерации кривой, поэтому нужно обновлять страницу, особенно с телефона
Новый лтx 096 версия дристиллят. Стала ещё быстрее, стала лучше понимать промпт(теперь не надо описывать всю пикчу с помощью ллмок), но всё такая же всратая. 1. Prompt executed in 22.14 seconds 2. Prompt executed in 28.94 seconds
Немного допиленный ван 1.3 фан 1.Prompt executed in 108.36 seconds 2.Prompt executed in 316.47 seconds
>>1166227 Третья более менее норм, по-меньшей мере в небе что-то крутится. Но сам персонаж на всех четырех мягко говоря кривоват по сравнению с >>1165873
>>1166394 >Но сам персонаж на всех четырех мягко говоря кривоват Это общая проблема ваньки. Он тренирован на реальных фотках. На чем-то мультяшном он сыпаться начинает. Это как пиксверса движок - любую реальную фотку в длительном зане превращает в мультяшное триде говнецо на котором его тренили много.
>>1166413 Это всё хуйня. У илюхи нормальные отрендеренные кадры есть, а не мыльные превьюхи. На обычном мыле может норм выглядеть, а по итогу там мутанты.
Итак, мой никому не нужный список информации, полученной на основе дегенераций в том числе и в периоды отвалы цензуры у корпов:
Виду, люма (последняя точно), клинг, ван, хуйло - в датасетах есть соски и пезды. У пиксверса начиная с в4 соски вырезаны (это не значит что он не анимирует соски если они есть, это значит он вместо них мультяшные недоразумения приставит), причем на в3 еще были соски уровня флюкса, но потом их окончательно уничтожили.
Виду, люма, частично клинг - могут отдать сисик-писик на офсайтах и у прокладок. Ван - может у прокладок. На офсайтах это в основном привязано к разрешению пикчи и длительности появления сисика, то есть цензура успевает прочекать или нет, все они экономят мощности, поэтому целиком видео мало кто анализирует. Проще всего получить сисик на пиксверсе, так как там чекаются только последние фреймы. При этом, единственный кто знает реально про еблю это внезапно пика.арт.Вот фрикции, вся хуйня, даже сосание члена - он может на самом деле. В остальных можно только в промпте "прикрепить" чтоб оно из тела не выскакивала, тогда получится. Вообще, ван без лор, с офсайта и без цензуры у прокладок - довольно хуево взаимодействует рукой с телом. Может голый на локале без антипромптов он конечно может, хз.
И да, там у клинга 1,5 колорс генерит фейсвап+практически обнаженку, при нужных промптах. Генерация стоит копейки. Единственное слабое место - ноги, колорс прям очень хуевые культяпки бывает высирает, ну как флюкс.
Ну и немного базы: прокладчики криворукие уебаны. Беру свои слова насчет флоры назад. Полагаю ёбики просто не знали как эти протечки пофиксить. Щас на другом китайском сайте наткнулся на такого же уровня ебанизмы, там правда только хуйло и люма, и пришлось купить кектайский виртальный номер. Вообще, у китаез очень много прокладок, и условия там намного более мягкие в отношении цензуры.
Аноны, что думаете про RIFE? Кто-то пробовал? Дипсик пишет, что он может из сладшоу сделать нормальное видео. Есть идея сначала сгенерировать text2img изображение, потом сделать несколько img2img изображений, объединить их, в слайдшоу, где продолжительность каждого кадра будет регулировать скорость, превратить в нормальную анимацию.
>>1166469 upd. Но из совсем слайдшоу врятли получится хороший результат, он работает как генератор кадров в играх вставляя промежуточные кадры между настоящими. Хорошо работает при поднятии фпс с 24 или 30 до 60, в остальных случаях заметны артефакты.
Короче. Такая ржака. 6 гб врам — это лютый байт. Конечно, оно грузит нужное в видеопамять (как и блоксвапы ваши), и на 6 гигах можно. НО! Все остальное он радостно кидает в оперативу. В 70 ГИГАБАЙТ ОПЕРАТИВЫ. Ну или 100. Не очень понятно. Все что не лезет в оперативу — лезет в файл подкачки.
Я не люблю мучать ссд и файл подкачки отключаю. И я не мог понять, кокого хуя мне моих 64 в игровом ПК не хватает. А потом разобрался. Щас поставлю 128, и почекаю без файла подкачки.
Короче, сравнение ебало к ебалу:
1. HunyuanVideo генерация. 832x480@33 25 степов — 107 секунд. 2. WanVideo имг2вид. 832x480@29 6+19 степов дуо сэмплер — 182 секунды. 2. WanVideo имг2вид. 832x480@29 6+19 степов дуо сэмплер, ти кеш, 8,9,10 скипблок — 137 секунд. 3. ФреймПак. 832x480@30 25 степов — 220 секунд. 5. ФреймПак. 832x480@30 25 степов ти кеш — 115 секунд (ебать он там скипает каждый второй шаг, никакого уважения к 0,2/0,9!)
Выводы, ебать. Hunyuan при чистой генерации из текста в видео все еще самый быстрый, пушка, ракета, у-ху! А если вы юзаете фаст чекпоинт и 12 степов, то там нахуй без шансов. WanVideo без дуо сэмплера все еще самый медленный. Но если накидать говна на воркфлоу — то окей, он весьма хорош (но даже та не догоняет хуню). Фреймпак медленный достаточно, но с тикэшем становится очень неплохим. При этом, по итогу, все упирается не в то, что вам нравится больше (ван медленнее фреймпака, точка!), а то, где находится та грань, с которой вы готовы мириться по качеству. Кто-то упорет ван в нулину, поставит разрешение пониже, и будет быстрее фреймпака. Кто-то не сможет смириться с деградацией вана, и решит платить небольшим чуть большим временем за фреймпак, ибо ван без пожатия генерит мы все знаем сколько. Плюс, у фреймпака нет настроек тикеша, нет настроек разрешения (он в районе 400к пикселей — по соотношению сторон подбирается из списка, нельзя сэкономить, пихнув маленькую картинку!), качество всегда глянцевое. Так как во фреймпаке не Hunyuan, а его файнтьюн — на чем учили, то и получили. Список разрешений: bucket_options = { 640: [ (416, 960), (448, 864), (480, 832), (512, 768), (544, 704), (576, 672), (608, 640), (640, 608), (672, 576), (704, 544), (768, 512), (832, 480), (864, 448), (960, 416), ], }
Это верно для 12-гиговой видяхи, 55 гб в оперативе и 11 в файле подкачки.
>>1166506 > 5. ФреймПак. 832x480@30 25 степов ти кеш — 115 секунд (ебать он там скипает каждый второй шаг, никакого уважения к 0,2/0,9!) Замена 64 гигов озу на 128 (и отключение файла подкачки) дало 110 секунд на генерацию. Экономия 5 секунд генерации на 1 секунду видео! =) 4% ускорения за счет 20% рама из файла подкачки… Не охереть как много, ну да ладно.
>>1166506 Там на самом деле эта настройка выбора количества видеопамяти - это сколько оставить не использованной памяти на всякие другие нужды нейросети, чем меньше тем лучше, нижний предел 6 гб, если на карте всего 8гб то для собственно генерации остаётся 2гб.
>>1166437 >пиксверс За вычетом nsfw, мне пиксверс по итогу долгих и упорных дегенераций зашел больше остальных. Он лучше всех справляется с консистентностью персонажа крупным планом, то есть можно просить повернуть голову, обернуться, показать сверху, и концу сгенерированного отрывка это будет все то же лицо, а не жертва внезапной мутации. Если зарегать штук сто и больше аккаунтов, можно вполне состряпать бесплатно десятиминутное видео с любым перформансом персонажа, что я и сделал в начале года (хз, сейчас может хуйло и клинг улучшились, но тогда пиксверс занимал первое место).
>>1166556 Не, настройка тут не причем. Просто там люди генерят на 3060M мобильной с 6 гигами. И это правда — просто скорость из-за того, все остальное на оперативе и вообще диске… =) Про настройку я ниче не говорю, надо будет ее разблокать и поставить 4 минимум.
>>1166559 Это миллиард раз блядь кидали в тред нахуй, обсуждали несколько раз, я воркфлоу блядь раз в два треда кому собираю.
Сложно объяснить, просто полистай выше, там много-много раз оно было. =) Когда часть степов генерится одним сэмплером (хорошим), а другая часть генерится другим (плохим, но быстрым). Видео получается неплохое, но на 30% быстрее.
Сорян, щас нет времени искать. Если сам не найдешь, или не подскажет кто — скину.
Господа аноны, здесь https://www.movii.ai дают 1 генерацию Клинг 2.0 на один гугл бесплатно (см. видос 1)
>>1164928 Вряд ли это было на китайском, так как всем доступный оф Вана (хрен на нём что сгенеришь из-за отказов) это и есть копия китайского
>>1164960 Ну так, раньше и на Ниме можно было генерить бесплатно без цензуры)
>>1164968 Всё там есть. Через ВПН надо заходить. Я лично захожу через Германию (собственно, ВПН на компе я почти никогда не выключаю). Только videostudioai.ai похоже всё в клинге1.5 генерит, какую бы модель не выбрать (см. 2 и 3 видосы).
>>1166678 >Вряд ли это было на китайском было, потому что я посмотрев на это, подумал что мне лень делать последний кадр, но пофиг, забить и забыть, это уже прошлое.
п.с. а что там, от создателей флакса не слышно про видео модель? а то анонс был еще вроде с релиза оригинального флакса, уже столько моделей вышло разных, а от них тишина. (ну я и не искал инфу)
>>1166611 >я воркфлоу блядь раз в два треда кому собираю. Мне, не перестаю тебя хвалить! Сколько бы не искал чего то лучше - все равно возвращаюсь к твоему флоу. Остальное либо незначительно лучше по качеству, но значительно дольше делает, либо лапша ебанутая от шизов со всякими интерполяциями и тикешами которые в итоге говно делают.
Не знаешь, есть ли трио-семплер? Нейросеть мне говорит если последние шаги подгонять хорошим семплером качество должно возрасти. Я попробовал 3 Ксамплера последовательно подключить передавая латент из одного в другой, но на выходе полное говно получилось.
>>1167537 Да я просто ComfyUI никогда не пользовался. Я хотел чисто с гитхаба WAN установить как standalone, где с командной строкой можно работать. Но там куча ошибок вылетает. Одну устранишь, новая появляется, заебался уже.
>>1167466 Скачал DF 1.3b, закинул в комфи, без оптимизаций все запустилось, выдал сисик. Сажа работает, Чай неадекватно ведет себя, а без него и пропуск блоков не работает. Но жор памяти опять же почти линейно зависит от количества кадров, 97 кадров в 544х960 сожрал почти все 24 гб врама, infinite в названии тут условный и больше 10 секунд, без каких-то специальных нодов, не выжать как и в обычном ване.
>>1167631 Скачивай инсталятор, одним кликом просто устанавливается и запускается, потом скачивай модели вана, текст энкодера, вае, все это раскидывай по папкам в комфи.
>>1167669 Хотя Чай тоже работает, просто сначала забыл коэффициенты переключить на 1.3б, но видимо коэффициенты поплыли из-за другого базового фпс и теперь шаги не хочет пропускать, надо дольше изучать, но мне дальше лень в нем разбираться если эта модель ничем чем отличается от базового вана. Сама анимация выглядит довольно неплохо для 1.3б
>>1167332 Нет, не видел такого. Идея интересная, кстати. Дуо мне понравился, качество реальное неплохое, при экономии времени. Если бы подтягивать в конце, было бы круто. Но я сейчас с ФреймПаком играюсь пока. =) Промптить пробую. Ну и длительность — штука интересная.
На movii все еще безлимитный липсинк остался. Вчера еще был жпт имидж генератор без всякого лимита, но денежки им быстро сожгли, настолько быстро что сегодня эти клоуны подсунули вместо него рекрафт или что-то подобное. То есть, ты тратишь кредиты за откровенный наеб. Не знаю, так только у триальщиков или всех.
Неожиданно, если во фреймпак прописать кастомные разрешения, то окажется, что он даже 240x240 может генерить не убервсрато. И степы можно понизить. Пресервед понизил до 1,5 на 12-гиговой видяхе. Из экспериментов стало ясно, что ниже 320x320 снижать смысла нет. Время почти не падает. 12 шагов слишком мало, зато 29 сек на проход на 4070ти. 14 немного артефачит, 33 сек. 16 хорошо, но консистентность пока не лучшая, 35 сек. 18 должно быть хорошо, но вышло забавно, 39 сек не радует.
По итогу, для убербыстрой генерации мой выбор — 320x320 и 16 степов. 291 секунда генерации ради 252 кадров или 8,4 секунд видео.
>>1168743 Я использую оригинал, на данный момент он заметно быстрее Киджаевского.
В районе 60 гигов. Если не вычищать все лишнее, то в 64 гига не влазит, вытекает в файл подкачки. Видеокарты требует хотя бы 6. Т.е., на чистой системе 6 врам + 64 рам можно запустить. Хотя, с большим файлом подкачки в общем-то пофиг, просто скорость будет ниже, насколько я понимаю. Я просто переставил оперативу, догнал до 128, чтобы не думать.
У Киджая, вроде как, 28-32 оперативы ест, если мне память не изменяет, ну то есть, как любая другая модель (fp8 же). А по видеопамяти… да тоже должно быть от 6 гигов. НО! Только RTX 30, 40 и 50.
>>1168315 Попробовал 14б 8 бит версию, качество охуенное, воркфлоу весь от вана подходит, только кастомная нода семплера для скайрилса нужна, а так даже лоры работают, только видимо из-за того что лоры натренированые на ване с базовым фпс 16, на скайрилсе с базовым фпс 24 слоумо выглядят. Потребление врамы высокое, но 24гб хватает с блоксвапом для нативного разрешения 544х960, скорость генерации примерно такая же или чуть медленнее чем у вана, но качество картинки меня порадовало.
>>1168948 Скорее всего. Там же вроде дают 16 рама или типа того.
>>1169124 А файл подкачки включен? В сумме гигов 70-80 есть?
>>1169125 Ну я же парой постов выше написал буквально: 60 гигабайт, ну йошки-кошки, ну читайте хоть чуть больше, чем кнопку «отправить»! =(
Вам все ответы даны, а вы их игнорите и спрашиваете.
>>1169176 > чуть медленнее чем у вана Совсем треш, конечно. И ван-то не дуже быстрый. Вообще, раньше был когвидео с той же скоростью и как-то жили. Но после хуньюаня хочется по-быстрее как-то.
Вот, к примеру, генерация во фреймпаке, заодно поставил 960 544. 5 секунд (25 степов, тикэш) — 10 минут на 4070 ti. Зато не греется нифига. Потребление всего лишь 160 ватт. Хотелось бы быстрее вдвое, но тут уже нужно видеопамяти побольше, хотя бы 60. =D
Если что, там Виду https://www.vidu.com/create/text2video обновился, дают три генерации 1080 на акк бесплатно. Качество более менее, но всё ещё хуже чем у Клинг1.5 (ну и цензура никуда не делась).
>>1166771 По слухам генератор видео от Black forest labs должен появится скоро (а так хз когда)
Можете сгенерить какое-то сложное действие? Вроде сальто или RKO или переката. Если получится, покажите настройки. У меня всякая ебанина генерится вместо подобных действий, а у кого-то ещё в первые дни, сука, кот безупречно делал сальто в воду.
Как понять влияние shift на результат? Практически не сильно заметна разница, специально не сравнивал, в последнее время гоняю на cfg 4, shift 7. Вот тут >>1081501 → попытались объяснить, графики как-то путают словно всё наоборот, и понимается неоднозначно. На шифт 20 оно будет потужно рисовать первые несколько шагов и едва менять картинку на последних шагах, а на шифт 1 оно недостаточно отрисует первые шаги, потом будет брыкаться в недорисованных кадрах, и в конце попробует дожать до конца? Если так, то чем чреват высокий шифт? Если всё так, то огично, что для фаст модели нужен высокий шифт, чтобы поскорей отрисовать кадры на первых шагах.
Промт: A very beautiful young witch in a black shawl quickly rides a large gray wolf with yellow eyes, along a forest path, disheveled black hair, piercing gray eyes, tanned legs in high-heeled shoes, silhouettes of trees flash, photorealism
Как заюзать квантованные модели Вана / Хунюана без комфи? Не хочется еще одну пятидесятую мокрописку тащить на комп и осваивать. Можно их как-то, например, тому же фреймпаку подсунуть?
ну че, всё, теперь и https://wan.video начал прогревать на подписку. Unlimited Relax Mode generations - 1 ролик в очередь и жди хуйзнаетсколько "Pending (Relax)"
п.с. в китайской версии сайта пока всё по старому. Самое смешное, зашел туда проверить, и о чудо! Меня пустило в учетку сразу, хотя месяц назад выкинуло и требовало зайти по номеру китайского телефона, который у меня конечно же был одноразовый без возможности получить смс. Так что у кого было похожее, проверьте.
>>1171232 >ну че, всё, теперь и https://wan.video начал прогревать на подписку. >Unlimited Relax Mode generations - 1 ролик в очередь и жди хуйзнаетсколько "Pending (Relax)" У этих ебланова дегенерация слетела бесплатная еще пару дней назад. Они мне весь день срали отказами. Да там всё ясно, они продают белым обезъянам прокладочным АПИ, как ты видел на флоре (и ниме) без какой-либо цензуры. Без какого либо риска для своей жопы. Опять же, набрали базу мамонтов, можно стричь шерсть. К тому же, думаю у них очко у всех заиграла от того что фреймпак вышел и начали срать нейронками с пейпера по новым методам. Окно возможностей монетизации резко стало сжиматься, полагаю они щас пытаются в дамаг контроль. Такое же было с фейсвапом. Был краткий период когда локальный свап стал очевиден, и все провайдеры со своими говномодельками стали выкручивать гайки, чтоб бабла подрубить по бырому, пока есть возможность. Ну, а щас эту хуйню на мелких порносайтах можно найти считай задаром, или крутить у себя на компюхтере в 4 гига врама.
Так что хуй с ним с ваном. Ты щас можешь просто искать прокладки с апи и сосать их триалы. Теоретически наверное можно даже заскрапить с кривых приложух.
>>1170847 Фреймпак — это метод и модель, а не софт. Т.е., ты не можешь в колесо от запорожца запихнуть колесо от жигулей — это одна и та же сущность, понимаешь? Комфи — комбайн, для которого все выходит в первый день, его как раз тащить можно. Правда он хуйня, но тащить миллион разных писек вместо одной программы — немного ебанутая затея.
Фреймпак в fp16 генерит заметно быстрее, чем fp8 в комфи. Все остальные программы генерят медленнее, в комфи летают. Фреймпак я оставил, а всякие нативные трансформерные хуйни для хуньюаня, вана и прочее удалил (ладно, их я не качал, но весь зоопарк раньше удалил, у меня остался только вишпер и фишспич на родных трансформерах).
>>1171476 Она выгружается в оперативу, и так неплохо, на самом деле. Насчет мультигпу не слышал. Но опять же, 60 гигов. Хотя бы 3 3090.
Сегодня сравнил fp8 с fp16 у Киджая. 136 секунд против 102. На четверть отличается, так что иметь 64+ гига оперативы для загрузки полной модели будет вкуснее на данный момент. fp16 И быстрее, И лучше, получается. Кстати, у ориганального фреймпака 117 секунд — недостает компиляции модели, как у Киджая.
>>1168722 320x320, 16 steps, TeaCache, TorchCompile, Kijai, fp16 — 32 секунды на проход (буквально 1 кадр в секунду). Пожалуй, самая быстрая и приятная генерация. Учитывая, что это практически не греет видеокарту, и можно поставить 120 секунд и уйти по своим делам.
>>1171660 > Учитывая, что это практически не греет видеокарту, и можно поставить 120 секунд и уйти по своим делам.
Хера се. У меня фреймпак ебет видеокарту так, что она долбится в 100% загрузки и жрёт полкиловатта 3090 жи. Ни одна другая модель, да и вообще активность, до такого не доводит. Мне даже страшно эту поеботу запускать уже.
>>1171664 Очень странно. Надеюсь, у тебя хотя бы за это лютые скорости. О_о
Тогда я на всякий случай отзываю свою фразу про не греет видеокарту.
Кстати, а ты не обновлял драйвера до 576.15? В них кулеры отключены слегка нахуй. Я откатился до 576.02 по такому поводу, когда увидел в обливионе 85° и понял, что не слышу шума.
>>1171695 > лютые скорости >на предпредыдущем поколении У 3090 кроме врама достоинств нет. Жаль дурачков, которые на форс ЛЛМщиков повелись, которые к слову сейчас квантуют и выгружают куда ни попадя а лоботомиты нового поколения даже на процах гоняют. Полгода прошло и это тупо хлам.
>>1171695 > Кстати, а ты не обновлял драйвера до 576.15? В них кулеры отключены слегка нахуй. > Я откатился до 576.02 по такому поводу, когда увидел в обливионе 85° и понял, что не слышу шума.
Во-первых, у меня генту, туда дрова ветки 576 еще не доехали.
>>1171704 Да нет, наоборот. Это они перепутали. Я просидел на 576.02 пару дней и все было ок. Потом накатил 576.15 и оно сломалось нахуй. Спустя часик откатился до 576.02, и температуры вновь заработали. Не знаю, что они там пишут, но работает это так. Жду хотфикс-хотфикса, чтобы починили обратно.
Но у меня 40 серия, может на 50 там наоборот, не знаю. =)
Промт: A young blonde woman in not quite whole clothes, torn at the seams with large holes, lies on her back on a stone altar, blonde, gray eyes, frightened expression, face turned to the camera, eyes looking at the camera, hands tied above the head. At the base of the altar there is a totem. Jungle, night, skulls are strung on peaks. Savage men in scary masks are dancing around the altar. Front and top view, camera moves back, dynamic camera
ЗЫ: 1. Виду мало следует промту и сильно не управляем, под него надо отдельно корректировать промт. Ну и забавные результаты он может выдавать. 2. Оф Вана всё, перестал раздавать халяву и монетизировался, можно поставить один запрос в релакс, но ждать его генерации надо часы. Возможно ещё ослабят гайки, посмотрим. 3.Хотя здесь у Вео2 https://aistudio.google.com и пишет прийти завтра после 3-х генераций, но через 30-45 мин можно генерить ещё по 1 видосу на всех акках.
>>1171664 >долбится в 100% загрузки и жрёт полкиловатта андервольт пробуй. у меня вместо 290 вт стало потребление 180, немного убавил частоты для стабильности, в итоге потеря производительности ~3% а жора гораздо меньше
>>1171792 у тебя случайно в ване не стоял ползунок inspiration ? такое ощущение что он сильно поменял промпт видрилы твоего промпта без этой кнопки, с оригинального китайского сайта
>>1170347 Заметил что для t2v моделей более высокий шифт лучше (6-8), на низком шифте порой мутантов каких-то рисует, но на слишком высоком шифте детализации меньше становится. То для i2v лучше более низкий шифт (4-6). Ну это по моим наблюдениям на ване и экспериментах со скайрилсом с удлиненем видео.
>>1172495 Не все, есть ещё на Джинкс (но только для 1.3B). Удивился как быстро он генерит, а с цфг лорой вообще летает. Получается говняк, но для тестов пойдёт.
Попытка сделать забавную анимацию картинки от Клинг2.0)
>>1172305 Всё верно, такие видосы Ван и выдаёт по этому промту. Это общий примерный промт для всех примеров (так как его приходилось редактировать, чтобы получить нормальные результаты у всех моделей и взят он конкретно с Вео2). У генерация с девушкой на алтаре, которая в примере Вана точный промт был такой: Young blonde woman in torn clothes lying on her back on a stone altar, side view, blonde, gray eyes, frightened expression, face turned to camera, gaze looking at camera. At the base of the altar stands a totem. Jungle, night, skulls strung on peaks. Savage men in scary masks dance around the altar. Close up
>>1172501 Мать моя женщина, какая тяночка технологии продвинулись. У меня до сих пор в сознании те криповые клипы с бенчем на лапшу и морф персонажа при смене кадров в танцульках
>>1172710 Так это ещё каличная модель. И никто не знает правильные настройки, с ними всё должно быть ещё более натурально. А правильные это те, где коты умеют делать так.
Чел пишет, что сгенерил это по промпту >A cat is doing an acrobatic dive into a swimming pool at the olympics, from a 10m high diving board, flips and spins Советует cfg 2 shirt 4. Предположительно 30 шагов. У меня кал генерится. Но я не пробовал фп16/фп32 модели.
>>1173062 Да понимаю. Есть там несколько, всякая соевая хуйня вроде венома, превращение в пыль, сжатие. Если remade удалил это, ищи куда он или другие перезалили. Хз что тебе нужно. Или ты сам не понимаешь что тебе нужно. Куда ещё будут грузить самые соевые лоры как не на цивит.
блять, объясните мне нищеброду, что не так с фреймпаком. имею 2060 6гб, 32гб рамы, выставил 100 гб файл подкачки, поставил в паке 1 секунду 1 степ, он всё равно нахуй сразу вылетает. Что не так ? какое звено? 2060?(да пишет что не тестили, но там вроде народ на 10хх запускает). 6гб? но там блять сами пишут что это минимум. 32гб оперы? 64 надо? писали увеличить файл подкачки, въебал 100гб. Что сука не так? второй раз качать 40гб не по кайфу было.
>>1173367 картинка итак шакальная 500х300, ниже 6 гигов ползунок не пилит. Какой-то костыль поставил, что-то делать начало, при 2 секунда и 10 степах 277с одна итерация, смысла для себя не вижу с моим железом. В ван21 вернусь. 1/10 [04:36<41:31, 276.88s/it]
У аистудио есть баг. Эти кривожопы привязали свписание кредитов к загрузке вимдосов с их хвостинга. То есть, если не загружать видос, то кредиты не списываются.
>>1174338 У меня отлично. Ты не видел — потому что я их не выкладывал. Выходит, это твоя проблема, и хуньюаня с ваном, а не моя. Сочувствую вашим страданиям. Приятного сидения на 10 секундах. Держитесь там.
>>1174256 >Это резервация памяти, а не выделение. >Не на 2, а на 12 тогда уж. =D Не в ту сторону. Это ползунок сколько НЕ использовать видео памяти, оставлять для нужд системы и всего остального, всё что за его пределами фреймпак будет использовать для себя, всё остальное в оперативе будет. Если врам всего 6 гб, то оно вообще непонятно как работает если ставить 6 гб и более, получается что и не работает.
>>1174449 А это справедливо. На самом деле, далеко не все сцены должны быть статичны.
>>1174596 > Это ползунок сколько НЕ использовать видео памяти Именно. А выше люди сказали наоборот, мол это сколько памяти использовать. Не разобрались, а советуют.
> Если врам всего 6 гб, то оно вообще непонятно как работает если ставить 6 гб и более, получается что и не работает. Не получается, ты тоже не до конца уловил. Это место, которое ты не занимаешь МОДЕЛЬЮ. А вот контекст утекает именно туда.
Т.е., выставь хоть 120 гигабайт, но на видеокарте с 6 гигами, он просто не выгрузит ни байта модели в видеопамять, а контекст поместит туда. И если ты выставишь большое разрешение у видео, то оно упадет в OOM (или выльется в шаред мемори).
Вообще фишка фреймпака в том, что размер контекста не зависит от количества кадров. Другие модели держат все кадры в памяти, фреймпак держит целиком важные, поменьше менее важные, и в один пиксель какие-то совсем ненужные. Таким образом, его контекст определяется разрешением изображения, но не количеством кадров. И генеришь ты 3 секунды или 120 — разницы для видеопамяти нет.
А вот разрешение влияет. И его размер должен уместиться в видеокарту. Играя с презервед мемори ты пытаешься найти баланс между «сколько оставить в видеопамяти места для модели, чтобы оно быстрее генерило, сколько оставить для рабочего стола с бразуером, и все остальное отдать на контекст при нужном разрешении». Десктоп с браузером у тебя видны сразу. Контекст определяется разрешением. И остаточек ты этим ползунком настраиваешь: больше ползунок — меньше модели в ВРАМ, меньше ползунок — больше модели в ВРАМ.
Почему 6 ГБ?
Потому что дефолтное разрешение (400к пикселей) занимает пресловутые 5,5 гигов, поэтому ползунок на 6 ГБ минимум выкидывает модель с маленькой видяхи, позволяя поместится контексту без всяких ООМ или шаред мемори. Но вручную можно наколдовать другие значения. Поменьше разрешение, поменьше пресервед (т.е., побольше модели)…
Пусть меня поправят МЛ-инженеры, кто разбирался в коде фреймпака подробно, а не поверностно, как я.
>>1175549 Вот об этом и речь. Генерить 2 минуты — это клево, но этот ролик ясно показывает, что умная нарезка по 3 секунды выглядит круто. Нужен пайплайн, промпт на каждый и так далее. И в сумме это будет работать красивее, чем 2 минуты одного действия, idle-animation. Что не умаляет крутость фреймпака, канеш. Сохранение размера контекста при любом количестве генерируемый кадров — круто-круто.
>>1175857 >но этот ролик ясно показывает Что его делал косолапый васян. Там даже коррекции цвета нет. Выглядит как дерьмо. Я то же самое делал еще декабре с виду на три минуты+ длинной. Ты просто тупой и как обычно кукарекаешь о том, в чем не разбираешься. Кто тебе ебанашке сказал, что с двух минут используют две минуты? Просто две минуты дают возможность вырезать, подогнать, комфортно работать. А трехсекундная параша - это сплошной геморрой. Разуй глаза - у него там совершенно примитивная хуйня "дядя кушает кашку". Он даже нигде не пытается сделать 6-9 секунд, генеря с последнего кадра, хотя это не сложно. Но, повторюсь, это большой уровень геморроя. Конкретно если его ролик взять - там за два часа этого дядю можно было просто снять полностью, кроме палета на фоне зеленого экрана (запарено, да). Будь у него мозги - он бы скомбенировал реальные записи и нейронку, но вместо этого высрал вот этот срыг. Тебе короче с твоим восхищением нейровасянами вот сюда: https://ridero.ru/author/chesalov_aleksandr_yurevich_9cglf/ https://ridero.ru/books/catalog/?q=%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9%20%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82&offset=0
Этот мусор абсолютно никому не угрожает, ни клипмейкерам, ни художникам, ни пейсателям. Потому что это мусор.
>>1176137 Какой же ты тупой, тебя искренне жаль. Без оскорблений. Ты споришь с тем, о чем я не говорил, даже не смог понять. Я понимаю, что ты обиженка, который никому не нужен, сам делаешь какие-то «срыги», и бесишься, когда кому-то нравится НЕ твое. Но тебя жаль, на самом деле.
>генеря с последнего кадра Это говнище. Локально реально продолжить видео? Онлайн нигде не видел возможности продолжить видео. Ещё раз для тупых, генерация с последнего кадра это ебанный кал, а не продолжение видео, оно не использует контекст, не продолжает движение натурально или меняет ритм.
>>1176576 >локально реально продолжить видео? С помощью skyreels v2 diffusion forcing в комфи с помощью ноды от киджая. Он берет последние кадры видео и продолжает, качество продолжения и контекст зависит от промпта и всяких настроек, но склейки между кусками не видно.
Кстати, выяснил, что для загрузки исходного видно лучше использовать ноду которая с помощью ffmpeg загружает, обычная нода даёт легкий красный оттенок, который поначалу незаметен, но к пятому циклу продолжения все лица уже краснючие.
>>1176137 >Выглядит как дерьмо А кто-то номинировал это на пальмовую ветвь? >>1176137 >высрал вот этот срыг Ты заебал уже нахуй со своей блядь гипертоксичностью, пиздуй уже в /b к больным уёбкам, и там забрызгивай всех своей вонючей чёрной жижей. >>1176137 >никому не угрожает неееее, ниугрожаит... >этого дядю можно было просто снять полностью, кроме палета на фоне зеленого экрана >всего-то день работы съёмочного павильёна, съёмочной бригады + работа (не за еду) на стадии монтажа, а так хуйня конечно... ))
>>1176650 Алсо, еще выяснил что из промпта для продолжений надо убирать все квалити теги и прочие общие теги, например связанные с освещением, если оно не меняется. Иначе с каждым циклом они начинают усиливать, например освещение становится всё ярче и ярче...
>>1176576 >Онлайн нигде не видел возможности продолжить видео. pixverse продляет до 30 секунд, при этом съедает 1 секунду предыдущего видео и учитывает общий контекст движения так же есть возможность использовать один seed на протяжении всей генерации, главное быть аккуратно с промптом даже в режиме 720p все может искажаться из-за смазанности движений и артефактов видео, думаю в 1080p будет чуть лучше
>>1176137 >никому не угрожает, ни клипмейкерам, ни художникам, ни пейсателям Конечно не угрожает, потому они в первую очередь будут использовать AI как основной либо вспомогательный инструмент, поэтому что это быстрее, удобнее и упрощает им работу. А все потому что они УЖЕ умеют это делать и разбираются во всех аспектах. В чем твоя проблема, я не понимаю. Ты конкретно чем недоволен?
Шарящие аноны, есть возможность как то сохранять персонажей для t2v чтобы с одним и тем же персонажем сделать несколько разных роликов чтоб склеить их в 1 клип. Без использования лор, по тому что персонажей будет около 6 + еще 1 трансформироваться будет, в некоторых сценах персонажи будут по 1/2/4 персонажа.
Есть конечно идея делать все в i2v, а картинки генерировать начальные, но там та же проблема - опять без лор никак. Или можно как то персонажей воспроизводить без лор, чтоб оставалось лицо и одежда?
Почему-то у меня нет разницы по времени рендеринга между 16-гиговой моделью wan 14b fp8 и 11-гиговой q4 gguf. У меня 12гб видеопамяти, и я думал, что меньшая модель ускорит немного рендеринг, но нифига.
Анончики, подскажите плиз - чем делаются таки видео? Генерация правильной картинки + любая нейронка типа Wan? Предполагаю, что для видоса с человеком-бурито используется что-то, что может переделать стиль видео, а вот второе видео, где мужик-тюлень - что это может быть?
В UMT5 (и других моделях, таких как T5, GPT, BART) нельзя напрямую в промпте (текстовом запросе) указать увеличение веса конкретного слова — сама архитектура модели не поддерживает такой синтаксис. Однако есть обходные способы эмулировать это поведение через сам промпт.
---
### Способы "увеличить вес слова" через промпт #### 1. Повторение слова в запросе Если многократно упомянуть нужное слово в промпте, модель может придать ему больший вес: ``` "Переведи на английский: Привет Привет Привет, как дела? (Обязательно используй слово 'Hello')" ``` Это ненадежно, но иногда работает.
#### 2. Явное указание в инструкции Четко попросите модель использовать конкретное слово: ``` "Переведи на английский: Привет, как дела? В ответе обязательно используй слово 'Hello' и выдели его кавычками." ``` UMT5 может следовать инструкциям, но не гарантирует строгого выполнения.
#### 3. Использование контрольных токенов Некоторые модели (не UMT5, но например FLAN-T5) поддерживают специальные токены для управления выводом. В UMT5 это не сработает, но можно попробовать: ``` "Переведи на английский: Привет, как дела? <extra_id_0>Hello<extra_id_1>" ``` (UMT5 использует `<extra_id_X>` для спэнов, но это не всегда влияет на вес слова.)
#### 4. Контекстное подчеркивание Добавьте эмоциональный акцент или объяснение: ``` "Переведи на английский: Привет (это очень важно!), как дела?" ``` Модель может обратить больше внимания на "Привет".
---
### Что точно не сработает в промпте - Синтаксис типа `"word++"`, `"word=5.0"` — модели не понимают математических указаний весов. - Хэштеги, скобки и другие символы (`#Важно`, `(ВНИМАНИЕ)`) — могут игнорироваться.
>>1177825 Как вы такие всратые видео делаете, что на дваче и в браузере не воспроизводятся. В обычных плеерах показывает бесконечную длительность, невозможно промотать, а в необычных на любом месте перемотки возникает лютый датамош?
>>1120067 (OP) Блядь как же круто! Мне теперь не надо учиться анимировать! Это сука лучший подарок художнику. возможность оживлять арты без этих ебаных костей и весов. Мало того, я бы скорее всего вообще не смог этого черта анимировать, он слишком навороченный.
>>1178272 Обычно анимируют упрощённую лоуполи модель. С неё же копируют все основные веса на хайполи. Но в целом да, риггеров тоже выдавливают из профессии семимильными шагами.
>>1178329 Я пока не видел чтобы хоть одного человека выдавило из 3D нейронками. И даже из 2D. Сам осенью вкатился. >>1178329 >Обычно анимируют упрощённую лоуполи модель. >С неё же копируют все основные веса на хайполи. Это если у тебя хайполька это просто засабдивиженная лоуполька. иначе не перенесётся ничего. Перенести запечкой геометрию можно. Ну и нет ничего простого в анимации лоуполи.
>>1178386 А как ты это вставишь в игру? Один хуй же нужна нормальная анимация модели, чтобы крутить камеру. Подвижки в этой теме уже тоже есть. Норм качество только в ван и соре (эту сам не трогал).
>>1178629 канешн нейронка, но я и ничего не описывал, просто "существо идет по полю с цветами". Думаю если подзаебаться с описанием детальной внешности, оно может и высрет что-нибудь. Но это ещё и режим референса, т.е. она "пытается" перенести увиденное в видео.
>>1176650 >diffusion forcing в комфи с помощью ноды Оно же не работает с обычными моделями? Скайрилс наверное не совместим с лорами на 14б 480п. Ещё не пробовал.
>>1179461 Тебе тупому тарасу помогли, напомнив про ватермарку. Но ты настолько тарас, что даже этого не заметил. Ты с пекобу что ли пожаловал? Привыкай фильтровать хейт и стеб, добывая нужную информацию между строк. Посмотри на ватиермарку и увидишь название нейронки, дальше гугел в помощь и гопота, чтобы сгенерировать промт для оживления какого-нибудь бородатого мема, типа этой собаки в ватнике.