Stable Diffusion Flux тред X+107 ====================================== Предыдущий тред >>851397 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожие тематические треды - аниме-тред >>849389 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного беженцами бывшими разработчиками Stable Diffusion. Полный функционал в локальной установке (см. ниже)
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her ------------------------------------------ ♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇 https://supagruen.github.io/StableDiffusion-CheatSheet/ https://www.artvy.ai/styles ------------------------------------------ 💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td ========================================== 🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇 https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora https://civitai.com/models/train
>>856575 (OP) Поссал на флюксошизика из прошлого треда. Настройки у него фиксят флюс. Т5 нихуя не может нормально понимать короткие промпты. Исключение - далле 3, потому что там 3.5 турба
>>856575 (OP) Хороший гой, целых два моих пика затолкал в шапку. Как будто специально самые убогие взял. >>856591 > Т5 нихуя не может нормально понимать короткие промпты. Сигма может, там нормально промптится стандартными клипокскими тегами. Всё зависит чем тегали датасет. Если VLM, то естественно оно хочет примпты как из LLM. Причём у Флекси заметно что VLM была тупая - ему надо по особому формулировать запросы, бывает некоторые выражения совершенно не понимает, а после перефразирования начинает работать. А так всегда можно рефайнить промпты через LLM, есть ноды для llama.cpp, я Немо-12В использую. Бонусом будет больше рандома и можно писать на русском, а ещё тот же Немо может переписать промпт в виде тегов - отдельно для клипа промпт генерить можно. >>856611 Говрили же уже что nf4 говно, там потери пиздецовые. Другое дело что у Форджа лоры с nf4 работают, в отличии от комфипидора, у которого только веб-макаки интерфейс ломают.
>>856617 >Другое дело что у Форджа лоры с nf4 работают дааа, приходится третий раз пересаживаться на другое УИ, сначала с Автоматика (он жив вообще?) на CumfyUI, теперь со СКАМфи на Фодрж (а.к.а. обратно на Автоматик).
>>856591 Далле тоже не понимает короткие промпты, он за кадром их переписывает в длинные. Если ты хоть раз пробовал работать с API DALL-E 3, ты видел в какой огромный пиздец он их переписывает, если нет то ты в полном неведии и хотя бы их технический отчёт почитай.
Ты можешь джейлбрейкнуть его текстовый энкодер, чтобы он не переписывал, но в этом случае на коротком промпте он выдаёт точно такую же хуйню. И дело не в Т5 или турбе (у далле свой отдельный энкодер, возможно вообще натрененый отдельно), а в семантической ёмкости промпта и эффекте розового слона у любых LLM, хорошо известном соседнему треду, они называют это "зацепками". Если ты не упомянешь элемент, даже казалось бы дефолтный, он его сам вряд ли вспомнит.
Я вам уже блять который тред говорю - НЕ ЮЗАЙТЕ КОРОТКИЕ ПРОМПТЫ НА МОДЕЛЯХ С ПОЛНОЦЕННОЙ LLM НА ВХОДЕ. Нужно как можно длиннее промптить. Во всех LLM так. Но дебилы продолжают промптить вангёрл стэндинг, биг титс. мимо другой анон
>>856617 >Сигма может, там нормально промптится стандартными клипокскими тегами. И выходит хуйня по сравнению с промптом с деталями и семантическими связями.
>>856623 > У тебя на пике Это из Флекси отрефайненый. Я вообще по-русски промпчу, мне похуй, за меня LLM отлично справляется написать правильный промпт.
>>856624 > Так что сейчас кошерно использовать для неосиляторов ? > Fooocus? ?
> Поясните ламеру, плиз. Хорошо, сейчас поясню
> ComfyUI Достаточно пкремудренный интерфейс, и более низкий уровень, надо самому строить программы из разных блоков. Для неосидяторов не надо
> Forge Илюха - очень нестабильный человек, у него нет dev ветки, он по приколу может на ровном месте все поломать, перелопатить, или забросить в поломаннор виде. Я бы не советовал. Но зато там аргументы управления памятью выявляются автоматически, что для ламеров норм, но лично меня бесит, так как в некоторые моменты оно не пользуется всей памятью для ускорения, а в другие - падает в oom, так как учитывает память только для sd
> Fooocus Не пользовался, позиционируется как как раз для неосиляторов, может будет и норм. Но он от того же разраба, что и фордж, и там нет поддержки sd1
Я бы советовал автоматик, но это зависит от того, на сколько сильно ты неосилятор. В нем тоже есть много функций, которые надо изучать. Для совсем овощей наверное лучше всего какая-то прога от AMD и Nvidia с настроенным всем заданием и парой кнопок
>>856635 Я не говорил об устройстве под капотом. Я говорил об использовании по факту, о промптинге. Иначе маня бы начала орать приводя в аргумент далле 3
>>856634 С разворачиванием LLMкой всегда есть та же проблема что и у далле - при небольших твиках результат может сильно плыть, потому что LLMка его внезапно развернула в что-то совсем другое. Ставь LLM на температуру 0 (и прочие семплеры которые дадут детерминированный ответ), но это тоже костыль. В далле применяют джейлбрейк, чтобы LLMка вместо переписывания выдавала твой запрос 1:1, ты же можешь просто не юзать LLM.
>>856639 Там в два этапа работает, сначала она разворачивает промпт, потом энкодит его. Там вообще не факт что гпт, не припомню чтобы они где-то писали про это. Может вообще отдельный энкодер натренили.
>>856645 > https://github.com/lllyasviel/Fooocus/issues/3424 > Flux needs a high amount of VRAM, which the majority of users doesn't have. Fooocus currently supports SDXL only (no support for SD3 yet) and does not use diffusers + there are no ControlNets / IP adapters yet for Flux => 3/4 of the functionality if not even more will straight up not even work. > => Won't do (for now)
>>856644 > всегда есть та же проблема Не вижу никаких проблем. От модели зависит. У меня оно всё чётко переписывает, даже текст правильно переводит и вставляет куда надо.
Я видел как челик на реддите сделал таверну диалог и она генерит картинки на флуксе. Есть гайд как локально это сделать? Только чтоб ваще для одноклеточных
>>856693 Он абсолютно не знает анатомию людей кроме стоячей и сидячей позы и абсолютно не слушается промпта в отношении людей. Поэтому здесь все будет также как с сдхл, мейби даже хуже, если не появится пони или его аналог.
>>856634 Я на флюксе игрался с переписыванием и увеличнием промта через LLM. Это нормально что промт генерится на процессоре? Нельзя это тоже на видюху запихать? У меня не получилось в комфи. Получается что флюкс один раз загружается в память и и там висит и каждый раз быстро стартует генерация. А если давать промт LLM то каждый раз ждешь пока оно загрузится в память, пока попыхтит секунд 15 процессор и только потом промт отправляется во флюкс. Я гонял Qwen-7b-chat.q4_k_m.gguf если это важно. Он хорошо нсфв обрабатывает.
>>856592 Судя по сравнению на пике кванты, к сожалению, прям сильно сосут, но тем не менее есть единственный квант который имеет смысл - это Q8, режет действительно много врам и времени инеренса, но разница в деталях на пикче минимальна
>>856709 Современные локалки уже давно ебут жпт-3.5 по выполнению инструкций и адекватности. >>856737 У меня на второй карте он висит, 3 секунды в среднем генерит промпт на 12В. Я каждую генерацию перегенерирую его.
Прошу, помогите. Есть картина "Человек предполагает, а Бог располагает", можете сделать аутпейнт чтобы она была в формате 2:3, пожалуйста?
Картина мне очень нравится, хочу повесть в фоторамку, а она 2:3, думал сначала обрезать, но никак не могу найти нормальный ракурс - хочется оставить обеих медведей. Подумал, может тут помогут.
>>856760 >Современные локалки уже давно ебут жпт-3.5 по выполнению инструкций и адекватности. Ты похоже вообще на своей волне и не понимаешь о чем речь, ладно
>>856767 Это ты не понимаешь что добавление отсутствующих в промпте деталей и изменение сути - это совсем разные вещи. Второго попросту нет. Что написал, то и получишь, причём даже точнее, потому что каждый тег из оригинального промпта будет разжёван и точно корректно понят сеткой. То что далли может шизить - это норма, 3.5 очень устаревшая сетка.
>>856575 (OP) Сап, нейрохудожники, нах. Не в теме где-то с весны. Чё тут как у вас, какой положняк? Чё там хач ещё живой со своей флексей? Как там чпокусер, не прирезали его ещё нах? Чё ща по актуальным чекпоинтам? И чё это за флюкс?
вся суть флюхкала пик 1 - сд3 пик 2 - тот же промт флюх пик 3 - сам промт без красного подчеркнутого токена, который был использован в пик 1 и 2 пик 4 - промт с красным подчеркунутым токеном из пик 3 на флюхе
>>856765 У тебя там сверху нет деталей. В фотошопе делаешь страницу 2:3 по ширине твоей картинки, вставляешь картинку, сверху цепляешь выделением край и content aware scale вытягиваешь, размываешь усреднённым фильтром, ретушируешь если нужно и всё.
>>856753 >>856760 Разобрался. У меня мало gpu_layers стояло. Поставил 50, а n_threads 1 и тоже стало три секунды на LLM висеть. Вместо 30. Пикрилы было-стало. Но похоже в память теперь все вместе не помещается, но грузится быстро тем не менее.
>>856797 >photo of a Japanese young woman waving with one hand with green and blue short hair. She is wearing a leather jacket and a pink top with a picture of a white bunny on it. She's listening to music on high-tech wireless headphones. In background a downtown Tokyo with neon lights and AD billboards. The scene is joyful and funny. Very detailed skin and a small smile Вот что Шнель дает. Попробуй без рандомного соотношения сторон и разрешения, исправит?
У меня охуенно важный вопрос, ответе нубу. T5 xxl это text to text модель верно? Могу я вместо нее использовать LLM типа Mistral Nemo 12B и если да, то как? Или тут только "извращенное" использование Mistral --> T5 --> Flux/other modal --> vae? Также, могу ли я использовать 2-3 видеокарты для этой задачи, т.е. крутить t5/Mistral на одной карте, а Flux/other modal на другой?
>>856806 >вас уже заебали этим вопросом, но как генерить такое? Ну тут много вариантов реализации. Можно юзать контролнет специальный под названием кваркод монстер например.
Там без разницы, все равно будет генерить аниме бабу с боке бекгранудом пока не уточнишь что фото КАНДИД лол. Вообще видик хорошо обисняет как флюкс себя ведет.
>>856890 Спасибо за ответ, буду знать куда смотреть, но можешь кинуть пример workflow или скрин хотя бы, я с комфи только знакомиться начал. >llama.cpp Я exllama2 пользуюсь через Обабугу, я же могу из нее апишку прокинуть в комфи? И по первому вопросу. Для работы с Flux я могу t5 заменить на Mistral? И если, нет, то есть также пример workflow для Mistral --> T5?
>>856780 Чел, я из соседнего треда и знаю что такое LLM, даже на нулевой темпе, причём топовые LLM вроде соннета с опусом. У тебя короткий входной промпт имеет малую семантическую емкость, ты даже слово добавишь к нему и это вызовет большие изменения в выходе. Даже порядок слов изменится и модель тебе выдаст совсем другую вариацию картинки. Тогда как меняя выходной вручную, можно получить буквально вариации в той же позе, баба с яблоком/без яблока например.
>>856909 >Для работы с Flux я могу t5 заменить на Mistral? Нет, от t5 ты во Флюксе и во всех остальных подобных моделях используешь только текстовый энкодер а не саму модель. Для других LLM нужен способ использовать их энкодеры на txt2img моделях. Для sd 1.5 китайцы нашли способ (ELLA).
>>856943 >от t5 ты во Флюксе и во всех остальных подобных моделях используешь только текстовый энкодер а не саму модель Чел... энкодер это по сути половина модели
>>857002 >ньюфаги >спрашивает базовые вещи Смешной человек. (ты случайно не тот уверенно-галлюцинирующий?). Тебе пытаются сказать что ты применяешь не тот механизм для сохранения стиля. Никому в здравом уме не приходит описывать пичку через BLIP для этого (то что ты называешь интеррогейтом, который никогда нормально не работал вообще). Или VLM даже. Тебе нужен нормальный визуальный энкодер для этого, заточенный под перенос стиля. IP-Adapter, референс-онли контролнет, много их разных.
>>857021 может это прошка. Если бы был промпт, можно было бы затестить.
Вообще промпт решает во Флюксе все, вот к пример промпт на картинку с текстом, очень даже не по простой логике работает энкодер в этом вашем Флюхе
>A remake of the iconic 'I Want You for U.S. Army' poster featuring Uncle Sam pointing directly at the viewer. The illustration retains the same classic, patriotic style, with Uncle Sam's intense gaze and finger pointing outward. However, the text has been changed to read: 'I Want You to Download Flux.' The original color scheme, typography, and design elements are preserved to maintain the nostalgic and authoritative feel of the original poster, while the new message adds a modern twist, inviting engagement in a contemporary context.
>>857051 Генерация логотипов, генерация надписей не выбивающиеся из общего стиля изображения, не все же можно двумя кликами в фотошопе вставить, генерация сложных кейсов вроде надписи на смятой футболке
>>857095 Дифференциация семплов денойза, есть обычные семплеры ODE и стохастические SDE. Без нормального семплинга только LCM работали, у них фактически без семплинга денойз шёл.
>>857101 >>857104 Как-то расплывчато. Сэмплеры как-то производят денойз и ли они помогают производить денойз? Просто денойз это же и есть сама суть диффузионных моделей, процесс денойзинга - это и есть процесс генерации изображения. Сэмплер это же скорее что-то вроде инструмента для денойзинга, которым пользуется сама модель? В общем надо почитать про это
>>857115 >Как-то расплывчато. Sampler определяет, как производится выборка из распределения изображений во время процесса генерации. Он отвечает за то, как последовательные шаги «шумоподавления» преобразуют исходный шум в осмысленное изображение. Sampler управляет:
Шагами денойзинга: Процесс начинается с случайного шума, и sampler определяет, как шаг за шагом уменьшать этот шум, чтобы приблизиться к целевому изображению.
Алгоритмом денойзинга: Существует несколько типов sampler’ов, каждый из которых использует различные алгоритмы для управления этим процессом, такие как DDIM, DPM++ и другие. Различные алгоритмы могут по-разному влиять на скорость и качество конечного изображения.
Количеством итераций: Чем больше итераций (или шагов) используется, тем более детализированным и реалистичным может быть изображение, но также увеличивается и время генерации.
Scheduler (Планировщик) Scheduler определяет динамику изменения интенсивности шума на каждом шаге генерации. Его основная функция — управлять тем, как изменяется уровень шума, чтобы обеспечить плавный переход от случайного шума к четкому изображению. Scheduler влияет на:
Кривую изменения шума: Определяет, как именно будет уменьшаться интенсивность шума на каждом шаге. Это может быть линейная, экспоненциальная или другая кривая изменения.
Параметры управления: Может включать в себя параметры, влияющие на начальный уровень шума, скорость уменьшения шума и другие аспекты динамики процесса.
Стабильность и консистентность: Правильно настроенный scheduler помогает обеспечить стабильность процесса генерации, предотвращая возможные артефакты или слишком резкие изменения между шагами.
>>857177 Ну он предлагает удалить весь питон, но говно экстеншеновое в \ComfyUI_windows_portable\python_embeded\Lib\site-packages сидит, можно его ебнуть, потом запустить обновление комфи и питона, потом через менеджер, наверное, получится переустановить, но долго и нахуй надо
Пакетный менеджмент в питоне придумал лично сатана. Это полный кал, который не может в несколько разных версий одной либы, заново качает все пакеты для каждого нового проекта и оставляет кучу неизвестного мусора в системе который день выгребать надо. Да и не помню чтоб хоть раз проект сходу запускался без часа гомоебли с питон проектом как раз таки из-за этих зависимостей
Зачем нужен fooocus? Потыкал, пока он только место жрет. Использую a1111/forge. Я могу в forge так же быстро превращать обычные модели в hyper? А inpaint фокуса работает в forge? Чем еще отличается фокус?
>>857647 >Зачем нужен fooocus? Неразгаданные тайны человечества. ДомохозяйкоUI. >Я могу в forge так же быстро превращать обычные модели в hyper? В смысле? Хипер это просто лора стабилизатор. И не самая топовая причем. >А inpaint фокуса работает в forge? А нахуй он нужен? Я его тыкал в комфе, так он хуй обычный не смог нарисовать. А моделек инпеинта для контролнета с функциями инпеинта и так в достатке, вон юнион заебись из недавнего комбайн, и это еще не упоминая брашнет, который на фордже тебе все равно недоступен, так что перекатывайся в комфе. >Чем еще отличается фокус? Ну вопрос такой как сравнивать кастом спорткар и ведро с гайками, форж такто форк каломатика, который напичкан функциями и расширяем плогенсами на форже правда часть некорректно работает так что нахуй форж.
>>857657 >В смысле? Ну, не знаю. Оно начало быстро отрисовывать на полноценной модели. Обычно для такого нужно качать отдельно lightning/hyper модель ещё на 6гб. Видел как в лапше цепляют какие-то лоры. Неужели в фордже она тоже просто как лора цепляется и работает? >>А inpaint фокуса работает в forge? >А нахуй он нужен? Я его тыкал в комфе, так он хуй обычный не смог нарисовать. Я попробовал, довольно неплохо. Как раз таки хуй в рот пририсовало не хуже лор 1.5 на инпейнт модели. Но из-за того, что настройки скрыты, модель рисовала хуйню (артефакты латентного шума) по бокам в любом случае. Тупорылый UI, который ничего не может и все скрыл. Поэтому хочу то же самое, но в человеческом фордже. >перекатывайся в комфе Это не повседневный интерфейс для разнообразных решений. В нем делают воркфлоу для массовой задачи, пускают работать и закрывают. Каждый раз делать новую раскидку лапши для того, что в аутоматике делается одной кнопкой это не дело.
>>857722 Бля чел я вот читаю уже второй пост твой и чувствую как тупею. Ну такие примитивные вещи и сток наивных т.н. ошибок ну бля...
> >В смысле? > Ну, не знаю. Оно начало быстро отрисовывать на полноценной модели. Ну так это лора стабилизатор с малыми степами, китаец впилил в факас и факасеры восхитились после говняного лцма то.
>Обычно для такого нужно качать отдельно lightning/hyper модель ещё на 6гб. Нихуя подобного, для хуйпера юнет не нужен, я вообще помню из практики что только для TCD с 1 степом требовался юнет, в остальном никогда ничего не нужно. Но ранее итт уже обсуждали, лучше всего будет брать турбо дистиллят или PCM. Помимо этого есть TCD, хупер упомянутый, лайтнинг, лцм (говно). И как вишенка dpo к каждому.
>Видел как в лапше цепляют какие-то лоры. Неужели в фордже она тоже просто как лора цепляется и работает? Естественно да.
>модель рисовала хуйню (артефакты латентного шума) по бокам в любом случае. А в инпеинте это крайне сложно обойти одним проходом, надо поверх хайрезить/апскейлить/контролнетить.
> Это не повседневный интерфейс для разнообразных решений. В нем делают воркфлоу для массовой задачи, пускают работать и закрывают. Ты че далбаеб блять? А я как по твоему сижу разнообразно решаю задачи? В последнего предложения вообще в голосину, никогда так не делал вообще в жизни своей.
>Каждый раз делать новую раскидку лапши для того, что в аутоматике делается одной кнопкой это не дело. Хуйни не неси плис. Не разобрался как пользоваться - так и скажи, а то выдумываешь тут кринжатину неосиояторскую.
>>857724 >А я как по твоему сижу разнообразно решаю задачи? Страдаешь, тратишь время впустую, не лечишь шизу. >Не разобрался как пользоваться - так и скажи, а то выдумываешь тут кринжатину неосиояторскую. Чел, я кодер. Пробовал различную лапшу еще до комфи. Это не нормальное способ решения меняющихся задач.
>>857731 > >А я как по твоему сижу разнообразно решаю задачи? > Страдаешь, тратишь время впустую, не лечишь шизу. Ясно, ты далбаеб.
> >Не разобрался как пользоваться - так и скажи, а то выдумываешь тут кринжатину неосиояторскую. > Чел, я кодер. По твоим 20 icq и дебильными формулировками и дебильными вопросами с полным отсутствием базы и не скажешь. Вероятно ты кодер на html.
>Пробовал различную лапшу еще до комфи. Это не нормальное способ решения меняющихся задач. Очень важное мнение 20 icq, обязательно учтем (нет).
>>857734 Пукни еще что-то на лапшешизоидно-теоретичном База это webui, а тягать 20 веревок, чтобы сделать то, что делается в 2 клика - удел душевнобольных
>>857726 >нищеброд с 3060 RTX Самая сильно квантизированная версия Flux (и это dev причем) требует макс 10 гб. В чем проблемы у себя на карте ее уместить?
>>857750 > >нищеброд с 3060 RTX > Самая сильно квантизированная версия Flux (и это dev причем) требует макс 10 гб. 11.2, это чтобы влезло точно надо отключать отрисовку системы на карте.
Хочу запилить лору обученную на развертках скинов контер страйка, чтобы генерировать их, обводить и срать ими в стим маркетплейс. Как бы вы такое реализовывали?
Как там дела во флакс с оутпайнтом? Вот, например, пейзаж выше расширить по горизонтали можно как-то? В фокусе, на сдхл, это делается легко и непринужденно. Можно ли это навермишелить в комфи на флакс? Что-то нигде не видел оутпайнта на флакс.
>>858206 Если это закос под фото 60х, то у аналоговых фото не может быть артефактов цифры, типа этого шума и пшена, там сильный блюр, ну и квадрат тоже не совсем в тему, имхо
>>858212 Ну скорее не 60х а 70х, квадрат потому что просто мне лень было разрешение менять, а шум и пшено это нормально для старой фотопленки, если она не очень хорошего качества.
Я конечно дурак, но обычно разибраюсь быстрее Никак не могу сгенерировать юнитов с оружием, типа эльф, лук и прочее, даже когда откровено использую спрайты из игр, ни с какой моделю с civai нихуя не получается До этого полгода использовал инпейтинги чтобы раздевать и делать татушки и прочую хуйню и лоры, проблем таких откровеных не было
>>858431 >Female, elf, archer, long hair, bow >Negative: deformed, bad anatomy, disfigured, poorly drawn face, mutation, mutated, extra limb, ugly, poorly drawn hands, missing limb, floating limbs, disconnected limbs, malformed hands, out of focus, long neck, long body, monochrome, feet out of view, head out of view, lowres, ((bad anatomy)), bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, jpeg artifacts, signature, watermark, username, blurry, artist name, extra limb, poorly drawn eyes, (out of frame), black and white, obese, censored, bad legs, bad hands
Ну вот образец и результаты с трех разных моделях Чтобы позу не менял и держал лук(но лук все равно пидорасит), надо denoising меньше 0.4 делать что для меня пока вообще пиздец после inpaintinga, но он с таким маленьким вообще ни волосы ни пол не меняет
>>858430 У меня простыни из LLM вот такие примерно. > In the heart of a Russian suburbia, a drab, Soviet-era courtyard unfurls under an autumnal sky, heavy with the weight of impending rain. The once-vibrant asphalt is now a cracked, grey expanse, stained by the passage of time and the tire tracks of modern cars huddled nearby, their shiny bodies marred by the grime of the city. The five-story panels, once a symbol of progress, now stand as monolithic sentinels, their facades adorned with the graffiti of a thousand stories, each one a testament to the passage of time and the resilience of the human spirit. A handful of hardy pigeons strut across the courtyard, their coos echoing in the silence, a stark contrast to the humdrum of the city that lies just beyond the perimeter. The scene is one of melancholic beauty, a visual poem that whispers of the passage of time and the enduring spirit of the people who call this place home. > In the grimy, desolate expanse of a Soviet-era housing complex in Moscow's outskirts, the courtyard lies in a melancholic stupor under the dreary autumn sky. The once-vibrant red bricks are now dull and faded, like the spirits of the residents who have long since lost the spark of life that once animated them. The ground, a patchwork of cracked asphalt and muddy puddles, mirrors the decaying facade of the five-story buildings that encircle it. The only signs of life are the plump, gray pigeons that strut and coo, their presence a stark reminder of the urban decay that has claimed this space. Yet amidst this scene of desolation, a stark contrast is offered by the sleek, modern automobiles parked haphazardly, their shiny exteriors marred by the grime that clings to them like a shroud. This juxtaposition serves as a poignant commentary on the passage of time and the struggle between progress and decay that plagues many of Russia's once-proud but now-forgotten suburbs.
>>858457 >4 минуты 30 секунд Мда... Алсо, неужели не смогли еще придумать механизм генерации изображения частями, чтоб можно было юзать видюху даже если сеть в вмдеопамять не влезает?
>>858555 Это не эффект старого фото, это какая-то мутная цифровая мазня. Не пахнет аутентичностью ни капли. Если ты этого не видишь и выгладываешь, значит слепошарый.
Что-то не верится прям, что это сделано без каких-то уловок. Такая качественная пикча всего одна, все остальные мусорные, но одна эта пикча ебет абсолютно все, что я видел до этого, а за 2 года я насмотрел много. Не по сложности композиции, а по реалистичности. Натурально будто персонаж будто из фильма. Только на приближении правый глаз кажется попидоренным, но в целом узнаваемость максимальная. Тестаните, эти первые лоры действительно такие заебатые или нет. Я тогда жду с нетерпением что же будет дальше и что еще обучат. С 1.5 на XL был колосальный скачок в плане персонажей.
>>858688 неплохо выходит как погляжу. только пришлось forge в режим fp8 перевести иначе вся оперативка улетает нахер с этой flux лоры. (64 озу и 12 видео сказали досвидания и вылет)
>>858722 дело не в fp8 а просто forge кривой оказался. при первом запуске лоры стоит поставить галочку как на пикриле, как только генерация начнется, остановить ее, снять галочку и дальше генерить с нормальной скоростью. если меняем flux лору на другую, операцию повторить.
>>857401 Вот мой промпт неизменный еще со времен сд1.5. Смутно помню, что накидал его из огрызков с цивитай. Еще когда все писали в промпте "мастерпис" и т.п. Может кто перепишет его на нормальный язык? a sexy loli in a white shirt and blue shorts with long hair stands with her back to the view on the shore of a dense forest lake looking at a small spaceship flying in the high sky, sunny, strong wind, red and blue laser rays,beacons, boke, Filip Hodas, cgstudio, space art, something futuristic, (detailed realizm), Dan Mumford, octane render, detailed pencil drawing, photorealism, epic realistic, art, hyperdetailed, cinematic, complex background, Details, hdr 1.5 сдхл - не правится доф(грип, блюр фона) который по умолчанию всегда есть в сдхл сд3 - трава из пшена сложена. флакс
Бля, как же я обожаю жрать лапшу из жопы комфипидора. Обновил гомфи, поставил экстеншен для юнион-контролнета для флекси, но даже в воркфлоу с реддита получаю сломанную пикчу. Ебался наверное час, думал может я дебил, люди же пишут что работает всё. Проверил 5 раз что гомфи точно обновлён, крутил лапшу, нихуя не меняется. В итоге в менеджере нажал Update All и эта хуита заработала. Вот какого хуя спрашивается? Получается этот кал конфликтовал с какими-то другими нодами, которых даже нет в воркфлоу? Пидорская хуита.
xinsir/union или union pro max это такой же controlnet как и старые, только совмещенные в один файл? При этом хорошо работает или это не про качество, а про новую технологию и скорость? На автотике без проблем работает?
>>858880 >Получается этот кал конфликтовал с какими-то другими нодами, которых даже нет в воркфлоу? Так и есть. Было так же у меня. Какое-то дополнение не обновлялось и нихуя из-за этого не работало. Хотя его в воркфлоу не было. Я тупо удалил это дополнение и воркфлоу, без каких-либо изменений, заработало.
>>858880 И кстати, если поставил нужных дополений и всё наконец-то заработало, то ни в коем случае не обновляй комфи. Он весьма вероятно сломается. Я по полгода его не обновляю. И он работает норм. Вот сейчас вышел флакс, обновил, настроил, заработало - и нафиг эти обновления, которые ломают всё.
>>858897 > При этом хорошо работает Когда как. Тайл версии хуже обычного xinsir tile. Openpose версии не умеют в dw c пальцами и лицом, а только в обычный openpose. Softedge и остальные лайны - норм. Depth лучше у обычного union, чем у promax. Promax repaint - не всемогущий, но гораздо лучше, чем ничего.
>>858916 Хуй знает, я после выхода ноды с выбором не перепроверял, а автоматом оно палочки с точечками пыталось нарисовать, вместо ебальника. >>858922 Где-то близко к уровню 1.5 inpaint контролнета, до уровня полноценных инпейнт моделей не дотягивает, видны швы и промахи по цвету. По возможности вписать невписуемое примерно на уровне брашнета, если параллельно сравнивать, то больше от сида зависит, кто победит. С единственной разницей, что repaint может в денойз меньше 1.
3050 8GVram+32GRam. Время генерации на 30 шагоа(шнель 4 шага) без изменения промта и с изменением. По сути у меня шнель по скорости примерно как сдхл. Прикольно. Котики соответственно таблице и выбирал самых стильных))). Флакс дев раздувает подкачку до 55 гигов.
>>858912 Хотя нет. Напиздел про tile. Попробовал сейчас с нодой с SetUnionControlNetType нодой. Промакс не хуже xinsir tile, может даже чуть лучше, особенно на высоких денойзах, чуть мягче получается. 2 - xinsir-tile, 0.66 denoise 3 - union-promax, 0.66 denoise >>858916 Проверил с постановкой типа, один хуй пытается точки рисовать (пик4).
>>859176 >1. Ойлер. >2. Лцм >2. Лцм+Ойлер На этом твоя фантазия всё? У тебя глаз нет что-ли, 1. пластик, 2-3 распиздос и месилово. Нахуя ты въебал такой всокий гайденс, ты с голодного края приехал?
Я со стейбла 1.4 сижу на автоматике, вот с обновлением форжа с флюксом попробовал и его тоже, хотя это по сути тот же авто1111. Есть ли вообще какой то смысл в перекате на Комфи? Я хочу в него закопаться чисто из научного интереса Самое полезное пока, что я успел увидеть из юзкейсов это смешивание определенных частей промпта для промптового интерпретатора (или как он там называется). О других неочевидных плюсах комфи я пока, наверное, не догадываюсь
>>859230 Мозг не еби. Покажи шнель с гайденсом больше единыцы. Хуй у тебя что получится. Обосрался ты здесь >>859189 >Нахуя ты въебал такой всокий гайденс
Какой ща самый нормальный способ перевести картинку в лайн арт? У меня есть фото/рендер, надо получить результат в линиях. Довольно давно не заходил, поэтому просветите плз.
>>859255 Послушай друг, мне как ты говоришь "пиздеть" смысла вобще никакого, на модели написано флюкс дев (не шнель), результат ты видишь, делай выводы... Единственное могу сказать что модель в 8 квант пожата, может из-за этого шакал....
Прочитал что флюкс на автоматике будет т5 на проц выгружать. Вопрос - на гомфи можно на 2 карточки раскидывать? Не хочу на лапшу переходить, но боюсь что придётся. И если да, есть инструкции?
>>859242 >флюс это конечно пиздец Так давно всем понятно что хлам. Любая кастом полтораха по качеству и анатомии обоссывает это поделие на изи. Абсолютно не пойму зачем вы это юзаете.
>>859276 Всё тоже самое. Половины промпта нет, гайдер не тот, эулер вместо семплера, шедулер неподходящий флюксу. До кучи ещё и разрешение уёбищное. Зачем ты вообще комфи поставил, если дебил? Даже совсем отсталые могут догадаться спиздить воркфлоу из кучи помоек с ними, ссылки на которые прямо в комфи.
>>859276 >>859283 А никто не обратил внимание что формат флюкса gguf? Я такого раньше не видел. Я еще на nf4 сижу. Это сегодня появилось? Это официальная версия или криворукий васян переконвертировал и половину весов похерил в процессе?
>>859334 > на этом достоинства кончаются Так-то флюкс может много того что никто даже близко не сможет сделать, в том числе сложные вещи. Это как раз XL только и может в тянок, спустя год файнтюнов. >>859336 Гуфы это топ. А nf4 литералли худший квант, на уровне Q3 гуфа.
>>859344 safety_tolerance я еще в первый день как флюкс появился обратил внимание. но как я понял это имеет смысл только по апишке? в статичной локальной модели этих ограничений нет?
Ну ладно, если не брать во внимание nsfw то флюс как для базовой модели не плох, при небольшом разрешении изобрашения он не шакалит картинку, сохраняет геометрию....
>>859356 Так уже. Флюкс дев в fp16 на weight_type = default не запустился у меня. Просто комфи крашился и даже ошибок никаких не писал. Заработал только в weight_type = fp8_e4m3fn. Или это лучше чем гуфы? Я не слишком шарю во всех этих сортах.
У меня вопрос. А вы какой-то профит с этого делаете или нахуя вообще генерите, тратите средства и время на это? Я понимаю там раз в неделю что-нибудь мемное сгенерировать в тему диалога, чтоб кинуть и все посмеялись, но вы прям какие-то пафосные пикчи, претенциозные генерите, как будто это исскуство нах, при чем в количестве сотни штук в день и только затем чтобы их увидели лишь вы или максимум пара челов в треде.
>>859393 А почему так происходит? Можешь дать какие нибудь доки на почитать, про то что такое ггуфы в плане картиночных моделей? Я с этим знаком только по ллм, я так понял в их случае моделька просто банально тупеет, а в картинках че происходит тогда
>>859435 >>859443 Да смысл не в деталях, а в том, что SDXL не умеет в человека, который несет другого персонажа на руках - и нет, не хватает, а несет на руках. Это даже сложнее чем SD3 сделать лежачего человека.
>>859351 >перекатываюсь на гуфа значит Перекатился. Q8 съедает память будь здоров. Теперь LLM для перегонки промптов уже не помещается никуда. На NF4 помещались. В общем от необходимости иметь 64 гига оперативы никуда не деться. А я и не против апгрейднуть немного комп.
Попробовал в Фордж2 запустить квант Q5, до этого юзал только nf4, потому что видеопамяти у меня 16гб. По совету чела с реддита скачал в нужные папки 2 энкодера с comfyanonymous/flux_text_encoders и vae с black-forest-labs/FLUX.1-dev Короче при незавершенной генерации видно превью картинки, но при финальном выводе получается просто чернота. Что я делаю не так?
Блять, нихуя флюкс не влазит в 11 гигов видяхи. Скачал уже q3 флюкс, скачал какой-то порезанный до 2800мб энкодер. Выставил разрешение крошечное. Перебрал все возможные параметры запуска гомфи, всякие лоуврамы хайврамы. И всё равно крошечная писюлька торчит и лезет в CPU. Хочу как на сдохле 1-3 секунды на степ. Я что многого прошу?
>>859398 Генерят на сайте. Я вот всегда игнорил это, но узнал, что за 2000 можно обучить свою лору для флакса, и думаю может пофармить. Но пока ничего не делал.
>>858451 Лол, судя но автономерам, похоже на какую-нибудь Польшу (красный универсал со второго пика, смахивающий на поздний FSO Polonez, как бы намекает)/бывшую Югославию, там тоже панельки есть, да и любители Абибаса и посидеть на кортах.
>>859676 Нет, он же не токены даёт модели. В любом случае концепт там максимально размытый, потому и получается непохоже. А подменить конечно можно, textual inversion. Потребует рефа и получится говно по сравнению с обучением лоры.
>>859706 >>859608 Вообще Комфи должен сам перекидывать на ЦПУ по необходимости. У меня он по дефолтному ворклоу без каких-либо нод сам загружает текстовый энкодер в оперативку.
>>859738 Ты это по одной аниме картинке понял? Может всё таки стоит потестить на пару сотен различных жанровых картинок7 Low quality cctv camera pov image of a nude girl
Интересно, что на флакс есть некая гипотетически достижимая сходимость к лучшему предельному качеству за вменяемое количество шагов. Шаги 12 - 20 - 30 - 40. Видно, что разница между 30 и 40 небольшая, но она есть и это качественная разница. Где ваши исследования? На моем калькуляторе это так тяжко. Пока дождешься генерации, сходишь чай попить и уже не помнишь что хотел найти вообще.
>A 2x2 grid composed of four visually distinct images:
>A highly detailed portrait of a person, focusing on realistic skin textures, subtle facial expressions, and natural lighting.
>A serene landscape with vibrant colors, showcasing rolling hills, lush green trees, and a majestic mountain range in the background. The sky should have a gradient of blue transitioning to orange at the horizon.
>A close-up view of a textured surface, such as a fabric weave with intricate patterns and fine details, or a rough stone surface, designed to test the model’s ability to handle noise, grain, and aliasing.
>A dynamic cityscape at dusk, filled with glowing lights from buildings and vehicles, with a mix of modern skyscrapers and busy streets. Each section should be visually complex, featuring high contrast and vibrant colors, challenging the upscale model's ability to handle different types of visual artifacts and maintain color accuracy.
>>859911 А еще мне нравится если задать флюксу большое разрешение 2048х2048 и больше, то он все равно адекватно рисует. Много деталей разных. Просто дольше. Без двойных тел или длинных шей или близнецов в воздухе как было у сд.
Не одна SD не сможет с первого раза в стоке сделать такие картинки без инпеинта и апскейла. Так что тут даже говорить не о чем. И я не про дибильные рожи говорю, а про детализацию и правильные линии. Эти картинки генерировались подряд и шакала небыло ни разу.
SD-шка при таком разрешении на стоковой картинке уже бы так ебальник похерила и анатомию что ппц.... Это тоже шакал но по сравнению с SD это блядь прорыв...
Товарищи нейронщики, помогите, пожалуйста, определить стиль этого арта Уже всю голову себе сломал чтоб в похожем стиле сгенерировать пирата в двух ракурсах
>>859995 берешь чекпоинт/лору натрененную на игровое гавно, далее берешь ойпи одаптер и суешь свой референс в него, далее генерируешь иконки со своими ператами если надо конкретную позу еще подрубаешь контролнет на позу
https://civitai.com/models/660253/clay-vorona-flux-lora Увидел в телеге, это ооочень круто. Надеюсь все лоры для флекса будут так хорошо понимать внушаемый им стиль, когда я сам доберусь их обучать на своем ноуте 16гб (если обучалка влезет в эти гб)
>>860122 Что это вообще такое?)) И как в итоге получился чел с пивом?>>860029 а можешь сделать его в другу сторону повернутым пожалуйста? я уже смирился что придется как-то фотошопить, хоть чтоб одинаковая рука с мушкетом была в положении 3/4 и анфас
Когда уже модели смогут в промпт вроде "Two people, one laughing, the other crying" нормально? Если заменить laughing на smiling то еще нормально, а иначе нихуя не выходит
>>860076 >>860090 >>860109 >>860196 Понравился метод? А теперь его логичная эволюция. Апскейлим х2 затем довнскейлим х2 и повторять несколько раз. Часто картинка утекает в рисунок. Получается частенько пережарка. Но уходит блюр фона и наращивается детализация. Для эффекта хдр прям самое то.
>>860187 > Что это вообще такое?)) ipadapter style transer > И как в итоге получился чел с пивом? Из промпта. Ты же не уточнял, что тебе нужен не только стиль, но и пуха, небо, аллах.
>>860204 стиль очень похожий да Я объясню тогда подробнее что я вообще хотел сделать
Мне нужен был один и тот же перс, пират, с мушкетом на вытянутой руке в двух ракурсах 3/4 (даже чуть ближе к профилю) и анфас по типу того, что на картинке, но можно было и halfbody
Мне это нужно для 2д анимации, чтоб сделать фейк-3д разворот из 3/4 в анфас
Вобщем, путем экспериментов во флюсе я пришел к выводу что ебал я рот этих апскеилеров, через апскейлет 1080 картинка у меня генерится 6 минут и не факт что нормально сделается, иногда артефакты вылазиют. А если выставить нативное разрешение 1080 то картинка генерится 5мин 30сек. При том что потребление не видео не оперативной памяти от смены разрешения у меня не зависит.
Скачал dev-Q2 чисто для теста (нет места на диске пока). Генерит около минуты 20 шагов. Можете примерно прикинуть сколько будет генерить на нормальной версии? И какая нормальная версия влезет в 16Гб? Q8? BNB NF8? FP16? Есть между ними разница, кроме того, что fp16 наверное в 2 раза медленней.
>>860408 >Видео памяти сьедает около 10 гиг У меня 90% врам съедает при 16гб. Но может это из-за T5 в fp16. Ощутимая разница у енкодера в fp16 и fp8_e4m3fn?
>>860432 Блять, впизду. Так же 13 секунд/итерация. Флюкс видимо без клипа в видюхе нифига не может. Хоть и пишет лоад комплетли, вместо лоад партикали. Чё ей не хватает? 5100мб модель. 3040мб энкодеры. В 11 гигов не влезает.
>>860446 >Флюкс видимо без клипа в видюхе нифига не может. естественно лол >В 11 гигов не влезает. это че за карта 11 гигов? 1080 чтоли? если есть встройка то переключи отрисовку системы на нее
>>860446 >В 11 гигов не влезает. так оно и не влезет, флюх в 4 битах пикает на 11.2-11.7 гб и поэтому юи переходит в режим лоурама и уносит файлы для модели в оперативу, тебя 3 или 2 бита только спасут
>>860259 На самом деле это тупо попытка модели исправить шум. Оно не лучше становится, а просто по-другому и это всё реально на 1м этапе сделать. Реальный эффект будет от нескольких моделей апскейлеров срганов с контролнетами. А это тупо фейк. Такая опция есть в фокусе, помнится кстати, она без пердолинга даёт варианты сразу.
>>860572 Ну ты сумничал сейчас типа? Покажи, как сделать такое за один этап? Шагов поставить сотню? Не работает это. Фейк? Что ты имеешь в виду? Я дал воркфлоу, всё можно повторить без обмана и посмотреть самому. Что именно есть в фокусе? Если ты про vary, то это обычный и2и без промежуточного переапскейла.
>>860588 >Ну ты сумничал сейчас типа? Я без негатива. >Если ты про vary Вроде как он >без промежуточного переапскейла Какой от него эффект, в целом? Я вижу даунскейл х2+шум+ апскейл х2 + сид. Он не всегда будет сохранять изначальную композицию, будет именно "вариации на тему" или я что-то не понял? >Фейк? Что ты имеешь в виду? К твоему воркфлоу нет притензий, я имел ввиду фейк для мозга "кажется что улучаю качество", на самом деле просто "делаю по-другому". Ну в любом случае если это другое лучше изначального и результат нравится, то и отлично. Мне твоя нравится. Уже сделал по быстрому под себя, буду использовать. Спасибо за идею.
>>860590 У меня не было цели сохранить изначальную композацию и что-то улучшить. Я делал именно генератор. Вот есть стандартная генерация просто в один этап, а я сделал многоэтапную генерацию. Важна не первая генерация в цепочке, а последняя. На первую даже не смотрим. Долго токько ппц.
>>860590 Я заметил, что каждый шаг пикча немного отличается, что можно использовать для вариаций, чтобы выбрать лучшую. Например, делаешь 50 шагов и у тебя, считай, 30 пикч после 20 шага нахаляву, все немного отличающиеся.
>>860594 тогда придраться даже не к чему. >>860595 Я думал ты вдохновлён факторио. Хм, ты тут тоже можешь отрубить просмотр и сохранение у всех, кроме последней. Для полного погружения, лол. >>860597 Да, я уже поигрался с этим. Отлично придумал. Я уже на последнюю генерацию пришил дат_х2 апскейлер.
>>860446 В 768х768 или 512х512 делай, потом тайловым или нет апскейлером увеличишь, что понравится. Помимо всего прочего во ВРАМ ещё и результат генерации хранится. Но 13 с/ит на 1024 на карте 1080 вроде норм
>>860633 >13 с/ит на 1024 Пиздец. Я бы с таким железом вообще не задумывался о локальной генерации. Это ж сколько потерянного времени просто сидя и ожидая пока видюха еле-еле чето там пердит.
>>860633 >768х768 или 512х512 Да хуле пускай сразу в 128x128 ебашит, такой-то ламповый пиксельарт получается. И желательно на гуффнутой в двойку модели и энкодера. Каргокультисты.
>>860640 >>860641 Ну ты понимаешь, это же модно, красиво. Все пользуются, хочется быт в тренде, а не опарышам на обочине. Они мне напоминают купивших айфон в кредит на 10 лет, но ездящих на маршрутках и жрущих дошик, зато айфон. Ведь это не просто телефон, а показывает то, кем ты являешься. Сразу видно, что за человек перед тобой лолсук. Мне благо по работе подходит только сдхл и на моей 4060ти с 8врам всё нужное делается за наносек. Попробовал флюкс и прихерел от тормозов, ну и ясное дело удалил.
>>860642 Я теперь с ощущением успеха вспоминаю что купил 4090 в первый год за 150к + 56к бонусов мегамаркета. Хотя я пиздец тогда ломался. Это была на тот момент моя самая дорогая покупка в жизни если одной суммой сразу. Она не идеальная да, довольно шумная под нагрузкой, но 1,5с/ит на флюксе всё это оправдывают.
Еще вспоминаю челики тогда на озоне 4090 Palit за 90-100к ловили. Вот были времена.
>>860640 >>860642 Школьники, я напомню вам, что есть еще такое направление как 3Д моделирование и соответственно рендеринг. Который длится бывает по десяток минут на кадр, а то и часов. Чтобы вы лупили потом глазки на игрушки и мультики. У вас, скорострелов, всё что дольше 15сек уже в тягость? Самки будут не довольны.
>>860644 Это ты нормально урвал. Помню цены на неё 600к. Ну а я осознанно взял 4060ти за 40. Из игр чисто стратежки, а нейронки чисто по работе. >>860645 Время=деньги. Нужно понимать сколько конвертация твоего времени будет в деньгах. Мы сейчас говорим про тех, что сидит пыхтит над каждой генерацией по несколько минут, нервно ожидая и получая за просранное время нихуя.
>>860649 Он может сделать это успешней в онлайн-генераторах. Он сгенерит кастрированное говно и будет до конца думать, что модель плохая. Для оценки модели нужно сотни промптов прогнать, а ему мощностей не хватает.
>>860650 >Мы сейчас говорим про тех, что сидит пыхтит над каждой генерацией по несколько минут, нервно ожидая и получая за просранное время нихуя. С чего ты решил? Я ролики смотрю параллельно. Некоторые не понимают, что это может быть эпизодическое хобби, простой интерес. В которое не рационально вкладывать деньги.
>>860697 >до уровня sd3 Вот это кстати уместное сравнение, по моему мнению. Больше артефактов, обсёров. Сильнее всего потрится общая картинка, как мне показалось.
>>860697 >Она недеградирует до уровня sdxl или sd3? Результат все еще может в сложные композиции и текст. Отличие только в том, что вероятность проеба мелких деталей чуть больше, но за счет экономии во времени, можно рероллить генерации чаще, чтобы получить то что нужно.
И да, nf4 быстрее чем Q4. Но отличия в картинках между этими двумя способами оптимизации, больше похожи на отличия в сидах.