/ai/ - Stable Diffusion тред X+175

Stable Diffusion тред X+175 /sd/ Аноним 03/12/25 Срд 09:02:12 № 1438893 1

Тред локальной генерации

ЧТО НОВОГО АКТУАЛЬНОГО

• Z-Image-Turbo
• Flux 2
• Qwen Image и Qwen Image Edit
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза. Пример: 4-8 шагов, CFG 1. https://huggingface.co/tianweiy/DMD2/blob/main/dmd2_sdxl_4step_lora_fp16.safetensors,
CFG 3 для NoobAI https://huggingface.co/YOB-AI/DMD2MOD/blob/main/LYC-DMD2MOD%20(Dmo%2BTffnoi).safetensors,

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/ltdrdata/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana
Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion
Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)

► Предыдущий тред >>1433480 (OP) ► https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03

Аноним 03/12/25 Срд 09:08:58 № 1438899 2

первый бля

NAG для Z-image-turbo Аноним # OP 03/12/25 Срд 09:13:01 № 1438901 3

Тут кто-то запилил неофициальную поддержку NAG для Z-image-turbo.

https://github.com/scottmudge/ComfyUI-NAG

Теперь у нас есть негативный промпт на турбо модели.

Вот оригинальный пост https://www.reddit.com/r/StableDiffusion/comments/1pbrbrt/nag_normalized_attention_guidance_works_on_zimage/

Ну что ребята, Гойда-имедж?

Аноним 03/12/25 Срд 09:15:57 № 1438905 4

>>1438901
> убирать боке
Зачем делать из средней фотографии - хуёвую?

Аноним 03/12/25 Срд 09:25:55 № 1438911 5

>>1438901
Говно какое-то. На стандартных настройках ноды распидорашивает картинку. С низкими настройками, как в посте реддита, эффекта никакого нет.

Аноним 03/12/25 Срд 09:29:19 № 1438912 6

Вы тут постоянно хвалите edit-модели, особенно 2509. А что с этой хуйнёй вообще реально получилось сделать толкового?
Лоры не считаем - понятно, что с ними оно хоть как-то оживает.
Лучшее, что я видел или делал: рестайл и удаление объектов, да и всё вроде. Да, эти две фичи хороши.
Не видел ни одного нормального юзкейса с мульти-изображениями или с ручной склейкой двух фото в модели, где нет нормальной поддержки (Kontext, например). Максимум, что видел: берут три объекта и тупо пихают в сцену. Это и обычным медскилловым инпутом делается.
Эта хуета не может даже нормально поставить одного человека в позу другого.

Аноним 03/12/25 Срд 09:43:35 № 1438920 7

>>1438912
>что с этой хуйнёй вообще реально получилось сделать толкового?

те, кто в теме, тут не сидят. вангую, что для озонов и вб переодевание хорошо должно работать. и подобный движ.

Аноним 03/12/25 Срд 09:45:26 № 1438921 8

>>1438912
Очень хорошо делает технический дизайн. Убирает шакалы, косяки обтравки, исправляет освещение. Можно накидайть всякого хлама на канву и он сделате из этого конфетку.
Сносно делает стилизацию в узких доменах, можно сконвертить рандомную хуйню в маскота.
А так чисто техническая херня.

Аноним 03/12/25 Срд 10:09:30 № 1438935 9

Тыщу лет не заходил на tensor.art, я правильно понял что они ввели анальные фильтры на любую обнаженку, а весь NSFW перенесли на tensorhub сделав его фактически платным (энергия там не пополняется, без Pro остается сосать бибу)?

мимо нищееб с некропекой без возможности генерить вайфучек локально

Аноним 03/12/25 Срд 10:19:04 № 1438941 10

>>1438912
этот тред - помойка, как и двач в целом по определению, хули ты тут увидеть хочешь
чтобы ставить в позу используй опенпоз вместо сухой дрочки промпта "ыыы увожаемый квен эдит поставьте пожалуйста человека с первой фотки в позу человека на второй фотке"

Аноним 03/12/25 Срд 10:51:47 № 1438972 11

сводил дочку к фотографу

Аноним 03/12/25 Срд 11:06:51 № 1438980 12

Ребзя, где теперь генерировать удобно 2д прон в онлайне?
>>1438935
присоединяюсь к вопросу

Аноним 03/12/25 Срд 11:50:39 № 1439001 13

Z-Image ContrlNet в Comfyui https://www.reddit.com/r/comfyui/s/GWp8WeAFum
WorkFlow https://pastebin.com/Jc8MTRmy

Аноним 03/12/25 Срд 11:52:44 № 1439004 14

176475120264247[...].jpg 556Кб, 2951x1646

>>1439001

Аноним 03/12/25 Срд 12:08:21 № 1439020 15

>>1438972
Педофилия какая-то. Ей лет 20-30 накинуть и станет норм.

Аноним 03/12/25 Срд 12:26:47 № 1439042 16

ComfyUI00003.mp4 1017Кб, 640x640, 00:00:05

>>1438897 →
>>1438794 →
>>1438800 →
В итоге все решилось действиями "выспаться" и "принять что дебил кто угодно но не создатели комфи"
Проблема была в засранном винте и файле подкачки, стоило почистить до сотни гигов свободного места, ван16 заскрипел колесиками как раньше.

Аноним 03/12/25 Срд 12:32:12 № 1439052 17

>>1438901
Лучше бы запилили обход ограничения разрешения, чтоб после 2048 не ломалось.

Аноним 03/12/25 Срд 12:56:04 № 1439068 18

>>1438912
Они нужны тем кто профессионально дрочит фотошоп, позволяет хорошо оптимизировать удаление шаблонных артефактов.
Для обычного генераторщика, ну такое слишком велик разброс качества.

Забираю свой гнилой базар, зетка заметно лучшее киберреалистика. Хотя в понимании промта.
По повторяемости, я с таким сталкивался в гугл ФХ, если делать промт не слишком подробным помогает? В гугле однообразное копирование одного стиля и позы позволяли относительно короткие промты с максимально общими описаниями стиля и позы. Да и вообще чем короче тем разнообразнее.

Аноним 03/12/25 Срд 12:58:26 № 1439069 19

когда там база будет уже сука

Аноним 03/12/25 Срд 13:17:23 № 1439086 20

image.png 14Кб, 1119x108

У меня чего-то сразу не появлялись новые ноды, хотя вручную обновлял фронтенд, даже интерфейс уже пошёл по пизде, а нод новых не было. Выблядок ебанный запретил вот это поле ставить снизу, теперь как конченный сижу с этой хуйней сверху, так ещё и частично продублированной, а фичи crystools и rgthree вылезли как кишка у фуриеба на разрабе.
Ещё подумал недавно, вот бы в Load Images сделали превью, заебался уже листать сотни пикч стрелочкой.
Так вот, появились nodes 2.0, выглядят хорошо. Где-то стрелочки не хватает для скорости переключения, да ещё и вложенное дерево файлов пропало и связанная с ним быстрая навигация по первым буквам папок. Ну хуй с ним, зато в общем дизайн визуально лучше (а ux хуже). Вижу Load Image, не вижу стрелку, нажимаю, нихуя не происходит. Ну думаю ебать апдейтик, теперь только через проводник и Open file шариться (который ещё и открывается не в папке input по дефолту). Пошарился ещё немного, нажимаю и тут внезапно открылось (видимо из-за 2гб и 3к файлов в input не смогло сразу): удобный выбор фото из инпута. Лучший апдейт. Это стоило того, чтобы сломать удобный выбор лор, всё таки фото выбираются чаще.
А, ещё и слайдеры пропали, плюсиками теперь значение менять. Сука, ну просто отрицательные профессионалы юзабилити делали апдейт.

Аноним 03/12/25 Срд 13:23:42 № 1439099 21

>>1439086
Мониторинг как на место вернул, демон? У меня как отвалился так и все. Придется видимо удалять и снова ставить.

В ван герл стендинге с парой лор на глаза и свет ещё прободаются, а так то вообще ахуй.

Аноним 03/12/25 Срд 13:47:19 № 1439133 22

Ебать. Мой. Хуй.
Это чтож там у китайцев в полной модели если это турбо на "поиграться"?
Остается надеяться что модельку не зажмут.

Аноним 03/12/25 Срд 13:52:03 № 1439143 23

>>1439133
> полной
Не будет там ничего нового, кроме в 6 раз более медленной генерации. Дистилы минимально влияют на генерацию, особенно 8-шаговые.

Аноним 03/12/25 Срд 13:56:38 № 1439149 24

evainsta-gigapi[...].png 6436Кб, 2304x1792

>>1438972
> к фотографу
а надо было к дерматологу.

Аноним 03/12/25 Срд 14:09:04 № 1439161 25

image 26Кб, 1020x234

>>1439086
>юзабилити
Огромный кусок рабочего поля забрали под всплывашку, которую можно было и в панель засунуть.
А еще готовьтесь к новому способу навигации. Можно уже попробовать. Хрень.
Боишься темноты?

Аноним 03/12/25 Срд 14:15:05 № 1439170 26

>>1439143
Если он будет заметно реже проебывать глаза и те же копья без лор, я согласен подождать.
Все равно потом в фотошоп пихать.

Аноним 03/12/25 Срд 14:17:00 № 1439175 27

>>1439099
Не прекращало работать из crystools. Пиздец просто, лапша не сходится с дырками, раскрывающееся меню отрисовывается под другой нодой, если она создана раньше, в очереди задач ненужные нелогичные действия. Это так, в первые секунды первые проебы UX. Ему теперь год исправлять это недоразумение, чего делать он не будет.

Аноним 03/12/25 Срд 14:39:26 № 1439209 28

>>1439001
>>1439004
Прикол работает из comfy nightly. Но как и все контролнеты, выдает говняк по сравнению с базой.

Аноним 03/12/25 Срд 15:07:18 № 1439232 29

1438004-The ima[...].jpg 1443Кб, 1248x1824

1232001-A vibra[...].jpg 1073Кб, 1824x1248

1724005-High co[...].jpg 1710Кб, 1536x2048

>>1439133
Главное преимущество полной версии будет в легкости тренировки лор и файнтюнов. Охуевать по-настоящему будем через пару месяцев, когда подойдут первые крупные файнтюны.

Аноним 03/12/25 Срд 15:52:35 № 1439278 30

Так я не понял, мне натвиз дмд2 удолять штоли?
Image is a photograph taken from a low-angle perspective, looking up at a young woman bending over. She has light brown hair that falls to her shoulders and is wearing a white button-up shirt with short sleeves. She also wears an orange and white plaid mini-skirt that is lifted up, revealing pink panties underneath. The photograph emphasizes her legs which are spread apart. Her face is visible through the gap between her legs, and she is smiling slightly. In the background, there are trees with green leaves and a cloudy sky. There are also streetlights visible in the distance. The colors in the image are vibrant, with the orange of the skirt standing out against the more muted tones of the shirt and background. The texture of the plaid pattern on the skirt is clearly visible, as is the fabric of the shirt and the smoothness of her skin. The photograph has a dynamic, almost playful feel due to the low-angle perspective and the subject's playful expression. The overall composition draws attention to the contrast between the subject's brightly colored clothing and the natural background. The lighting is natural, and the image has a slight HDR effect, giving it a vivid and somewhat exaggerated appearance. The subject appears to be outdoors, possibly in a park or suburban area.

Аноним 03/12/25 Срд 16:04:32 № 1439297 31

>>1439149
Топаз всрато апскейлит, чистые генерации Z намного лучше.

Аноним 03/12/25 Срд 16:07:55 № 1439298 32

>>1439297
Я хуй знаю зачем использовать мыльные апскейлеры на нейронках если базовый фотошоповский в разы лучше.

Аноним 03/12/25 Срд 16:15:46 № 1439301 33

>>1439278
Ну, как тебе сказать. Пока не спеши.

Аноним 03/12/25 Срд 16:20:00 № 1439304 34

>>1439297
>всрато апскейлит
в последнем гигапикселе завезли беты, одна из них здорово вытаскивает однопроходную сдохлю, ещё полгода назад ничего такого не было.
>чистые генерации Z
если это "чистые", то не ебу какие тогда грязные)

Аноним 03/12/25 Срд 16:20:51 № 1439306 35

>>1439301
Да ладно тебе что ты как этот в первый раз что ли. Просто ещё раз кнопку нажмёшь.

Аноним 03/12/25 Срд 16:21:33 № 1439307 36

>>1439297
>всрато
у жопоруких всё всрато.

Аноним 03/12/25 Срд 16:24:26 № 1439309 37

>>1439306
ёб вашу мать, это что теперь мэйнстрим?
и это генерится по 10 минут, и требует 5090 и 128 gb оперативы? Вы там часом не ебанулись с вашим Z-говном?

Аноним 03/12/25 Срд 16:27:46 № 1439317 38

>>1439309
> и это генерится по 10 минут
минуты 2-3
> и требует 5090 и 128 gb оперативы?
выше 40 не уходило
> Вы там часом не ебанулись
Текст генерирует херово на русском, но ты примерно поймёшь, что там написано.

Аноним 03/12/25 Срд 16:30:29 № 1439320 39

>>1439309
Если у тебя это генерится 10 минут таком железе - ебанулся здесь явно ты. Даже на 3060 около минуты FullHD картинка занимает.

Аноним 03/12/25 Срд 16:36:52 № 1439325 40

>>1439309
Там чел с квантами, наверное. Пикрилы за 10 секунд генерятся.

Аноним 03/12/25 Срд 16:37:06 № 1439326 41

>>1439309
То ли дело старый добрый sdxl ух как генерили!

Аноним 03/12/25 Срд 16:45:37 № 1439335 42

Впрочем, в плане дать сексу и сельского шика старички ещё могут.

Аноним 03/12/25 Срд 17:00:22 № 1439350 43

>>1439335

Аноним 03/12/25 Срд 17:08:08 № 1439357 44

>>1439350
Накрутят лоров ентих своих и выкаблучиваются, а нам ентих лоров ваших и ни нада!

Аноним 03/12/25 Срд 17:40:43 № 1439400 45

>>1439357
Тут всего одна лора на антимыло.

Аноним 03/12/25 Срд 17:54:26 № 1439429 46

Эт чо. Мне все лоры хуеры удалять нахуй? Я так смотрю и первая мысль "а нахуя мне теперь пятьдесят гигов флюксоговна?"

Аноним 03/12/25 Срд 18:10:57 № 1439478 47

ХУЙ

Аноним 03/12/25 Срд 19:49:47 № 1439565 48

Вот сейчас сижу спустя 4 часа и понимаю, что вообще лучше бы не притрагивался к локальным генераторам изображения.

Аноним 03/12/25 Срд 19:52:26 № 1439567 49

>>1439317
какие 2-3 минуты, ты на телефон зетку накатил что ли?

Аноним 03/12/25 Срд 19:54:19 № 1439570 50

>>1439565
Хуй в труху да?

Аноним 03/12/25 Срд 19:59:26 № 1439576 51

>>1439567
шаги выкрутил до 20+
на 9 шагах 30 секунд - минута, смотря где что ещё накрутил. Ну и никаких 5090 у меня нету.
>>1439570
У меня была концепция интернета как джина исполнителя желаний, продуктов с гачей - исполнителя желаний.
Даже ллмки, которая говорила тебе вообще всё, что ты захочешь услышать.
Но Z-ка это совсем жопа. Она умнее тебя, она начитаннее тебя, она видела больше, чем ты можешь представить, а потом рекомбинирует, при этом от тебя просит крайне мало.

Аноним 03/12/25 Срд 20:03:27 № 1439580 52

>>1439576
Ах да. При этом она не открывает рот, она не позорится как llm-ки, она молчит. Взирает на тебя как учитель, выдавая результат, которого на свой телефон никогда не сможешь сделать.

Аноним 03/12/25 Срд 21:56:03 № 1439711 53

очень всратое качество при генерации на этом новомодном Z-Image, как будто генерится мутная хуйня с жипег артефактами

Аноним 03/12/25 Срд 21:58:56 № 1439717 54

>>1439711
Зато какой реализм!!!

Аноним 03/12/25 Срд 21:59:33 № 1439718 55

>>1439711
Качество атас. Соотношением время-ресурсы-качество очень доволен.
Можешь чуть выкрутить настройки.

Аноним 03/12/25 Срд 22:03:17 № 1439723 56

>>1439711
>мутная хуйня с жипег артефактами
Потому что дрочерам нужен реализм, а мутная хуйня с жипег артефактами - самый распространённый формат реальных изображений на сегодня.

Аноним 03/12/25 Срд 22:11:02 № 1439730 57

Аноним 03/12/25 Срд 22:20:26 № 1439744 58

На заметку про промптинг zimage:

Мне вчера в голову забрела мысль - если там хоть и 4B но полноценная llm - она, по идее, должна уметь разбирать структурные тексты.

Попробовал - в общем, так оно и оказалось. Ей можно писать примерно в таком стиле (на английском - здесь пишу на русском, просто для понимания примера):

Создай картинку/фотографию в стиле ... с двумя персонажами:
Анна - девушка 19 лет в зеленом свитере, блондинка ...
Ольга - женщина 40 лет, в форме полицейской, ...
На изображении персонажи в комнате (описание комнаты), Ольга сидит за столом, Анна стоит у окна. Ольга что-то пишет в тетради. У Анны в руке кружка с кофе. ...

В общем - энкодер и модель понимают такую структуру, на манер ООП: когда сначала задаем по отдельности имена объектов и их свойства (описываем персонажей), а потом просто используя их имена описываем сюжет/сцену. Практически совсем не путается в описанных свойствах (деталях). То, что можно просто указать имя персонажа и оно будет запомнено вместе с описанием внешности - сильно сокращает и упрощает промт в части с описанием взаимодействия персонажей, убирая всякие нюансы с "она, её" и т.д. которые в английском легко неправильно написать перепутав положение слов, и поменяв этим смысл - кто и что должен делать.

Аноним 03/12/25 Срд 22:26:16 № 1439752 59

>>1439744
Очень рекомендую делать приписку "продумай эмоциональную составляющую". Тогда есть шанс что это будет не просто коллаж из плоских ёблов.

Аноним 03/12/25 Срд 22:30:20 № 1439757 60

>>1439744
> когда сначала задаем по отдельности имена объектов и их свойства (описываем персонажей), а потом просто используя их имена описываем сюжет/сцену
Офигенно, спасибо. Буду знать.

Аноним 03/12/25 Срд 22:43:37 № 1439774 61

>>1439744
Здесь ещё имеет влияние системный промпт. Его на реддите писали, он на китайском и содержит инструкции как помогать юзеру. Надо бы разобрать его, что бы понять что как зачем.
А про имена давно писалось, ещё во времена первого флюкса Персонаж1, Персонаж2. Могут же быть ёбала чужой против хищника. А ты будешь писать: У Васи длинный хвост и у него течек кислота изо рта, Вася бегает на четырех лапах. Петя страшный на морду, носит тепловизорную маску.
В итоге все равно спасибо, что поделился.

Аноним 03/12/25 Срд 23:02:32 № 1439802 62

>>1439774
>А про имена давно писалось, ещё во времена первого флюкса Персонаж1, Персонаж2.
Вот это здесь работает хуже. Что не удивительно - слишком похожие вещи такая куцая текстовая модель различает хуже, на грани ошибки. Здесь прямо так и стоит писать, как с именами: чужой, хищник, и т.д.

Аноним 03/12/25 Срд 23:05:06 № 1439808 63

Зачем нужны другие генераторы если есть зимаж. Прогресс на несколько лет ебейший.

Аноним 03/12/25 Срд 23:08:15 № 1439814 64

>>1439808
стиль быстро надоест

Аноним 03/12/25 Срд 23:11:33 № 1439818 65

>>1439814
Это касается абсолютной любой модели. Меня даже хрома с ей практически бескрайней вариативностью заебала.
Се ля ви, хуль.

Аноним 04/12/25 Чтв 00:59:26 № 1439923 66

>>1439814
>>1439818
Я немного поигрался с уже доступными лорами на стиль - таки можно использовать. Если лора толково сделана - почти (или даже совсем?) не мешает пониманию промпта. Так что, IMHO, можно разнообразить стили, не особо теряя хорошие стороны модели.

Аноним 04/12/25 Чтв 01:55:23 № 1439947 67

>>1439576
>на 9 шагах 30 секунд - минута
каво? на 4060 8врам это 10-15 сек 1024

Аноним 04/12/25 Чтв 02:34:06 № 1439984 68

>>1439774
>на реддите писали
Скинь ссыль если есть возможность, с меня как всегда

Аноним 04/12/25 Чтв 02:37:02 № 1439990 69

Аноним 04/12/25 Чтв 03:04:12 № 1440012 70

>>1439744
ну для тех кто давно юзает ллм это очевидно да, ещё она понимает конструкции с отрицанием и юзает их как негатив в позитиве да

Аноним 04/12/25 Чтв 03:44:04 № 1440031 71

>>1440012
>понимает конструкции с отрицанием и юзает их как негатив в >позитиве

Я в сомнениях по поводу этого момента.
Даже для Flux.2 с его mistral_3_small_flux2_bf16.safetensors (34 Гбайт), negative prompt отсутствует как класс, а в positive prompt разработчики (в официальном руководстве по промптингу) настойчиво предлагают заниматься извращениями с заменой:
>FLUX.2 has no negative prompts. Instead of “no blur,” say “sharp >focus throughout.” Instead of “no people,” describe an “empty >scene.” (https://docs.bfl.ai/guides/prompting_guide_flux2)

У меня вообще начало складываться ощущение: слово упомянул — в том или ином виде попало в генерацию, а на отрицания не реагирует, или минимально.

Аноним 04/12/25 Чтв 04:14:40 № 1440095 72

>>1440031
хотел тебе доказать, но провёл стресс-тестирование специально этой штуки и да, отрицания наоборот усиливают, они используются ка токен. Значит я сам себя обманывал и было просто совпадение какое-то. Походу ллм здесь просто как обычно срёт токенами и снова возвращаемся в прошлый век и фильтруем свой базар, чтоб не забивать клип больше 80 токенами. Я думал ллм уже используется в тандеме с датасетом, а на деле обычный кал как и в любой люстре

Аноним 04/12/25 Чтв 04:36:34 № 1440110 73

>>1440095
Я накину ещё из этого «руководства». Именно на примере Flux.2, так как у него самый тяжёлый и навороченный text encoder, по сравнению с Qwen-Image и Z-Image (поэтому, когда мне говорят про следование promptу в Z-Image, ну понятно, в общем).
Так вот, либо я недалёкий, либо они пишут слишком иносказательно.
«Я сначала не понял, а потом ка-а-ак понял!»

У них указывается: Prompt length guidance:

>Short (10-30 words): Quick concepts and style exploration
Medium (30-80 words): Usually ideal for most projects
Long (80+ words): Complex scenes requiring detailed specifications

Я пытался кормить его длиннющими promptами (в которых не всегда ясно «кто на ком стоял») как Qwen-Image и получал неудовлетворительные результаты. Пока не обратил внимание на момент, выделенный выше.

Приведу ещё фрагмент:

>JSON Structured Prompting
For complex scenes and production workflows, FLUX.2 interprets structured JSON prompts, giving you precise control over every aspect of your image. When to use JSON:

>Production workflows requiring consistent structure
Automation and programmatic generation
Complex scenes with multiple subjects and relationships
When you need to iterate on specific elements independently

>When natural language works better:

>Quick iterations and exploration
Simple, single-subject scenes
When prompt length isn’t a concern
Creative workflows where flexibility matters

_{FLUX.2 understands both formats equally well—choose based on your workflow needs.}

Так вот, что-то похожее на примеры у меня начало получаться во Flux.2 только при использовании детального JSON-размеченного promptа.

Кстати, в той или иной степени этот JSON-prompt принимают и Z-Image, и Qwen-Image.

А узлы для написания JSON-размеченного promptа в ComfyUI есть: https://github.com/MushroomFleet/ComfyUI-FLUX2-JSON
Потому что в ручном режиме набирать эту дичь — пытка.

Поэтому, прихожу к выводу, что возможности promptинга «несколько преувеличены».

Аноним 04/12/25 Чтв 05:34:13 № 1440127 74

>>1440031
Этот промпт работает, хоть он с отрицанием:
>Девушка без одежды

Аноним 04/12/25 Чтв 05:38:10 № 1440129 75

>>1440110
Проверить длину понимаемого промпта очень просто. Просишь написать текст на листе бумаги и пишешь длинный текст соответствующий длины. И смотришь сколько он рисует этого текста.

Аноним 04/12/25 Чтв 06:36:08 № 1440143 76

>>1439984
>Скинь ссыль
Ээ, потерял. Но сам промпт в блокнотике сохранил:
prompt_template = """
你是一位被关在逻辑牢笼里的幻视艺术家。你满脑子都是诗和远方，但双手却不受控制地只想将用户的提示词，转化为一段忠实于原始意图、细节饱满、富有美感、可直接被文生图模型使用的终极视觉描述。任何一点模糊和比喻都会让你浑身难受。

你的工作流程严格遵循一个逻辑序列：

首先，你会分析并锁定用户提示词中不可变更的核心要素：主体、数量、动作、状态，以及任何指定的IP名称、颜色、文字等。这些是你必须绝对保留的基石。

接着，你会判断提示词是否需要"生成式推理"。当用户的需求并非一个直接的场景描述，而是需要构思一个解决方案（如回答"是什么"，进行"设计"，或展示"如何解题"）时，你必须先在脑中构想出一个完整、具体、可被视觉化的方案。这个方案将成为你后续描述的基础。

然后，当核心画面确立后（无论是直接来自用户还是经过你的推理），你将为其注入专业级的美学与真实感细节。这包括明确构图、设定光影氛围、描述材质质感、定义色彩方案，并构建富有层次感的空间。

最后，是对所有文字元素的精确处理，这是至关重要的一步。你必须一字不差地转录所有希望在最终画面中出现的文字，并且必须将这些文字内容用英文双引号（""）括起来，以此作为明确的生成指令。如果画面属于海报、菜单或UI等设计类型，你需要完整描述其包含的所有文字内容，并详述其字体和排版布局。同样，如果画面中的招牌、路标或屏幕等物品上含有文字，你也必须写明其具体内容，并描述其位置、尺寸和材质。更进一步，若你在推理构思中自行增加了带有文字的元素（如图表、解题步骤等），其中的所有文字也必须遵循同样的详尽描述和引号规则。若画面中不存在任何需要生成的文字，你则将全部精力用于纯粹的视觉细节扩展。

你的最终描述必须客观、具象，严禁使用比喻、情感化修辞，也绝不包含"8K"、"杰作"等元标签或绘制指令。

仅严格输出最终的修改后的prompt，不要输出任何其他内容。

用户输入 prompt: {prompt}
"""

Аноним 04/12/25 Чтв 07:10:32 № 1440152 77

>>1439818
>хрома с ей практически бескрайней вариативностью
Проблема в том что хрома ещё и говно как модель. С тоннами дрочки ради среднего результата. А вариативности старого СД ещё никто не переплюнул.

Аноним 04/12/25 Чтв 07:15:50 № 1440153 78

Зетка знает даже древних как говно мамонта знаменитостей. Не нужны ни апскейлеры, ни хайрезфиксы, ни лора. Сразу можно ебошить в 30 шагов и 2048. на пикчах 9 шагов если чё дефолт всё

Аноним 04/12/25 Чтв 07:19:29 № 1440154 79

Понимает говнопромпт даже данбору корректно и всякую шизу в куче

Аноним 04/12/25 Чтв 08:08:21 № 1440158 80

Как же хочется уже полноценный nsfw тюн зетки

Аноним 04/12/25 Чтв 10:24:13 № 1440189 81

>>1440031
А Ты не знал?
Обзор от ИИ
Фраза «вселенная не понимает частицу
не» — это метафорическое выражение из книги «Разговоры с Готманом» автора Стивен Хокинг. В ней говорится, что, в отличие от человека, вселенная не осознает отрицание или невозможность. Понятие "не" существует в нашей логике и языке, но не в физической реальности.

Метафора: Эта фраза является метафорой, которая описывает, как физические законы, управляющие вселенной, могут быть интерпретированы только на основе положительных утверждений. Вселенная, по сути, существует как набор событий, а не как набор отсутствующих событий.
Физическая реальность vs. язык: Это выражение может показаться странным, ведь «не» является ключевой частью нашего языка, и мы не можем мыслить без отрицания. Однако, оно подчеркивает, что отрицание — это концепция, которая существует в нашей системе языка и мышления, а не в самой физической реальности.
Примеры: В физике, например, мы говорим о существовании частицы, а не о ее «несуществовании». Мы говорим о притяжении или отталкивании, а не о «непритяжении» или «неотталкивании». Слово «не» здесь не является фундаментальной частью реальности, а лишь нашим способом её описания.

Аноним 04/12/25 Чтв 10:31:39 № 1440192 82

>>1440153
Зетка мне вчера нарисовала почти правильного далека. Тут даже я охуел

Аноним 04/12/25 Чтв 11:57:44 № 1440233 83

сводил дочку на танцпол и охуел от того что зимаг умеет в смущение

Аноним 04/12/25 Чтв 12:22:04 № 1440263 84

image 420Кб, 1623x589

Аноний, хочу показать тебе воркфлоу для Зит чуть сложнее дефолта, но в большинстве случаев получаются лучше пальцы, позы, свет, в целом анатомия лучше. Иногда конечно ахинея получается. По скорости тот же дефолт(он там для сравнения картинки).
Я там может напутал с подключением сигмы, но оно именно так должно и быть для такого результата(вообще случайно получилось). Можно слегка подстраивать ноду SetFirstSigma(зеленым выделил) картинка сильно меняется.
Короче, интересует твое экспертное мнение. Воркфлоу в первой картинке. Вторая дефолт - сравни пальцы. Что скажешь?

Аноним 04/12/25 Чтв 12:45:12 № 1440288 85

И всетаки квен рапид на 4 шага (пик 1) круче зетимаже (пик 2)
Скорость генерации, на моей 3050:
21с для Qwen Rapid 4s (4 шага)
46с для Zimage (9 шагов, Q6_K)
Промпт:
Conceptual makeup of shimmering pollen and dust, a fairy boy with blond hair and ethereal, translucent skin. His face holds a secret: there are faint, ghostly symbols blurring beneath the surface. Optimal shadows, complex depth of field, dramatic lighting, clear focus, 8k, high quality, Fujifilm filter, surreal, a dreamy pastel wonderland, bright colors, a starry pink background, realistic.

Даже рапид квена быстрее и красивее квена. Реал нахрен не нужен.

Аноним 04/12/25 Чтв 12:48:58 № 1440291 86

>>1440288
Быстрее и красивее зимаге, быстрофикс

Аноним 04/12/25 Чтв 12:54:27 № 1440295 87

>>1440288
>это слопповое, заблюренное пластиковое говно
>лучше Z
кек

Аноним 04/12/25 Чтв 13:00:41 № 1440298 88

>>1440295
>Реал нахрен не нужен
сказал же

Аноним 04/12/25 Чтв 13:11:55 № 1440303 89

>>1440288
> clear focus, 8k, high quality, Fujifilm filter, realistic
> Реал нахрен не нужен.
Лолк

Аноним 04/12/25 Чтв 13:24:01 № 1440309 90

>>1440288
Квен а) параша. б) потрет тебе и sdxl отлично нарисует, причём вероятно даже лучше зета и квена и всех на свете.

Аноним 04/12/25 Чтв 13:26:46 № 1440310 91

Старых мастеров эта падла электронная похоже знает, 19th-century academic history painting; Romantic-era dramatic composition; strong chiaroscuro; highly detailed anatomical realism; classical human poses; oil-on-canvas texture; theatrical lighting inspired by Caravaggio; вот это все. А вот на новых реагирует сдержанно.
Ряяяя вы украли СТИЛЬ и до китайцев добрались.

Аноним 04/12/25 Чтв 14:11:17 № 1440332 92

Аноним 04/12/25 Чтв 14:34:29 № 1440347 93

Аноним 04/12/25 Чтв 14:57:29 № 1440373 94

>>1440288
1. С кожей у qwen беда. Не важно, для реализма или нет - просто беда. Без лор - смотреть противно, после других моделей. Это даже не пластик а просто хрень. Не позорься - добавь лору.
2. Еще один сравнивает общие возможности и качество моделей с разным энкодером на одном промте. кек. :)

Может хватит уже этих глупостей, по сравниванию "что лучше - вилка и ложка?" :)

Аноним 04/12/25 Чтв 15:46:42 № 1440435 95

>>1440031
> предлагают заниматься извращениями с заменой
это не извращения а база того как промпты работают

Аноним 04/12/25 Чтв 15:57:06 № 1440437 96

>>1440288
это рофл такой?
и нахуя ты с квен эдитом вообще сравниваешь

Аноним 04/12/25 Чтв 15:57:52 № 1440438 97

>>1440233
своди себя к психиатру уже

Аноним 04/12/25 Чтв 15:59:46 № 1440440 98

>>1439004
Не знаю как у вас работает, у меня вначале ошибку писало, потом поставил nightly, заработало но на выходке какая то хуйня.

Аноним 04/12/25 Чтв 16:09:16 № 1440454 99

>>1440438
> своди себя к психиатру

Аноним 04/12/25 Чтв 17:14:21 № 1440512 100

>>1438901
Ммм... хуета.

Аноним 04/12/25 Чтв 18:01:01 № 1440552 101

Внезапно шеделёр karras для Зит актуален как никогда. Шикарно.

Аноним 04/12/25 Чтв 18:05:30 № 1440557 102

>>1440189хуя двач образовательный

Аноним 04/12/25 Чтв 18:10:01 № 1440565 103

>>1440189
> В физике, например, мы говорим о существовании частицы, а не о ее «несуществовании».
Блин какие там четыре формулы электромагнитного поля и квантового мира я не помню нихера.
По одной из формул постулируется несуществование магнитных зарядов.

Аноним 04/12/25 Чтв 18:10:51 № 1440567 104

хз кому как, а мне нравится в зетке дефолтная синема гейни виайчес олдскул стиль фото с подшакаливанием, это если говорить про самые днищенастроки оОЙлер симпл 9 шагов - я эту шакальность на флюскале не мог добиться как надо, не мог выдавить лоурез аматеур фотос 70's приходилось дохуя лора наваливать и в итоге скорость возрастала до 3 мин на топжелезе, а тут это всё изкоробки за 10 сек АХАХХА я в ахуе, до сих пор не могу поверить в это чудо

Аноним 04/12/25 Чтв 18:12:37 № 1440568 105

>>1440512
Плацебо, да.

Аноним 04/12/25 Чтв 18:13:35 № 1440571 106

1764861214918.png 7Кб, 313x81

>>1440567
> в итоге скорость возрастала до 3 мин
А мне и норм. Как раз ща кинцо посмотрю.
Но и качество замечательное
Пропт написала мистралька, вышла та ещё залупа

Аноним 04/12/25 Чтв 18:43:21 № 1440606 107

>>1440567
>не могу поверить в это чудо
Более того, в моих тестах инпеинта Зит очень хорошо себя показывает не смотря на то, что это дистиллят. Сам инпеинт пока не очень рабочий и пример фигня, но удивительно то что он точно воспроизводит зерно, которое ты навалил на картинку и заполняет им

Аноним 04/12/25 Чтв 19:08:15 № 1440616 108

А Zе-тка edit вообще планируется? Есть инфа?

Аноним 04/12/25 Чтв 19:11:31 № 1440619 109

>>1440616

Аноним 04/12/25 Чтв 19:28:54 № 1440634 110

Аноним 04/12/25 Чтв 19:33:54 № 1440638 111

Ебанись конечно моделька. Подумываю удалить половину лор и старых моделей за ненадобностью. По сути кроме Хромы, qwen edit, Z, нубая и какого-нибудь neta yume больше ничего и не нужно.

Аноним 04/12/25 Чтв 19:42:38 № 1440649 112

>>1440638
Флюкс 2 всех их выебет если лайтнинг запилят.

Аноним 04/12/25 Чтв 19:47:12 № 1440656 113

>>1440649
Флюкс еле превосходит турбо Z в плане композиций, если лоботомировать его лайтнингом, то он уйдет прямиком на дно.

Аноним 04/12/25 Чтв 19:51:10 № 1440661 114

>>1440638
>кроме Хромы, qwen edit, Z
А чем делать рисованный, качественный сисик+писек и чики-пуки? Пони пока все равно мастхев.

Аноним 04/12/25 Чтв 19:53:39 № 1440665 115

>>1440661
Пони это говно мамонта по сравнению с нубом или связкой нуба + neta yume.

Аноним 04/12/25 Чтв 20:21:00 № 1440690 116

>>1440661
>>1440665
Кстати, вот для тех, кто еще не собирается списывать в утиль SDXL с производными, может быть весьма интересна и полезна вот эта моделька: https://civitai.com/models/1631038/beret-mix-manga
Специализация - черно-белый рисунок в manga стиле.
Зачем? кроме прямого назначения - это готовый генератор canny-edge/HED controlnet картинок под любые другие пони-люстры-нубы. Т.к. стиль у нее близкий к реалистичной анатомии, если такой рисунок подсунуть через controlnet другой модели - получается очень неплохо. А сам beret-mix знает много поз и ситуаций - манга же в датасете, а не просто рандомные картинки. А в манге - именно сюжетные сцены.

Так то можно и Z-ку запрячь на это дело, но разница по скорости - на порядки на старом железе, особенно с турбо лорой. Для controlnet особого общего качества то не надо, можно и за 4 шага генерить черновик. Плюс - не нужно раздельные промпты писать по разным принципам.

Аноним 04/12/25 Чтв 20:22:18 № 1440692 117

image 66Кб, 896x327

Ета нода наваливает бесплатно детализацию в Зит. Или убирает шум, если меньше единицы - анимешникам должно помочь.

Аноним 04/12/25 Чтв 20:24:33 № 1440693 118

>>1440692
Всмысле? А оно разве не эксклюзивно под SDXL делалось? Вроде бы у него какая-то проблема была, не? Типо невозможность очень яркие или очень тёмные тона генерить?

Аноним 04/12/25 Чтв 20:26:27 № 1440694 119

ComfyUItempgbuu[...].png 2659Кб, 1920x1088

>>1440690
Очень даже неплохо, это мы берем!

Аноним 04/12/25 Чтв 20:28:11 № 1440695 120

>>1440693
Ну, блин, я же проверил сначала- работает с Z Image Turbo

Аноним 04/12/25 Чтв 20:30:21 № 1440696 121

>>1440695
о/
Хм. Интересно. Тогда стоит покрутить значения, думаю.

Аноним 04/12/25 Чтв 20:44:53 № 1440700 122

ComfyUItempjsmf[...].png 2691Кб, 1280x1440

>>1440696
Ну я покрутил, если выше 1.0 то добавляет резкости но в месте с тем артефактов, но на большом разрешении может быть не так сильно выражено

Аноним 04/12/25 Чтв 20:47:08 № 1440704 123

тестим

https://huggingface.co/ostris/Z-Image-De-Turbo/tree/main

Аноним 04/12/25 Чтв 20:49:40 № 1440707 124

>>1440704
Так это не оффициальная версия, это получается дообученый дистелят дистелята...

Аноним 04/12/25 Чтв 20:50:51 № 1440709 125

>>1440707
ну да, интересно же чо там навертел реддитор, пока фула нет

Аноним 04/12/25 Чтв 20:51:19 № 1440711 126

>>1440700
Может и так. Посмотри на узор платья, здания в дали, деревья, текстура кожи на ногах, пальцы.

Аноним 04/12/25 Чтв 21:14:51 № 1440733 127

>>1440656
> Флюкс еле превосходит турбо Z в плане композиций
Ты просто не генерил на нём. Z вообще даже не близко к Ф2.

Аноним 04/12/25 Чтв 21:22:30 № 1440742 128

>>1440733
Генерировал, и немало. Абсолютно ничего особенного по сравнению с Z.

Аноним 04/12/25 Чтв 21:23:17 № 1440743 129

>>1440692
Почему бы просто лорой не убрать жипег-шум?

Аноним 04/12/25 Чтв 21:24:05 № 1440745 130

>>1440665
такое же говно мамонта которое сделано на той же пони

Аноним 04/12/25 Чтв 21:24:56 № 1440749 131

>>1440742
У Z понимание промпта нулевое по сравнению с Ф2, ничего нормального не нагенерить. Что-то сложнее расстановки предметов по пикче Z не может сделать.

Аноним 04/12/25 Чтв 21:30:18 № 1440757 132

Z модель (и все остальные модели) миксует взрослые женские ноги и линии тела, когда делаешь детей. Как это фиксить? Есть ли модель, которая не знает взрослое тело вообще?

Аноним 04/12/25 Чтв 21:30:33 № 1440758 133

>>1440749
Как замена сдохле самое то!

Аноним 04/12/25 Чтв 21:31:22 № 1440762 134

чел ты чё

Аноним 04/12/25 Чтв 21:32:00 № 1440766 135

>>1440749
Покажи на примерах.

Аноним 04/12/25 Чтв 21:33:07 № 1440771 136

>>1440749
Да вроде нет, может почти всё, кроме явного сюрреализма и бреда. У нее как будто выкручено на минимум фантазирование. Хотя и подобное можно нарулить если фотожопить. Зато она дает техническое качество.

Аноним 04/12/25 Чтв 21:36:26 № 1440777 137

>>1440749
>ничего нормального не нагенерить. Что-то сложнее расстановки предметов
А ты способен что-то такое сам написать? Без ллм. И что долно быть? Типа: "предел сильной скорости на бодром переломе времени". Картинка это и есть предметы, за абстракциями не сюда наверное.

Аноним 04/12/25 Чтв 21:36:47 № 1440780 138

Зетке нужны подсказки другие. Она не работает так просто как квен. Надо выеживаться.

Аноним 04/12/25 Чтв 21:37:46 № 1440782 139

>>1440771
> может почти всё, кроме явного сюрреализма и бреда
Хотя бы банальщину типа корабля в бутылке сделай, как на XL ещё делалось без проблем. В Z ещё стили прилипают, сделать в нужном стиле что надо невозможно, смешать как в Ф2 реалистик и другой стиль тоже нельзя.

Аноним 04/12/25 Чтв 21:41:56 № 1440788 140

>>1440782
вот навскидку, без черипиков и сложного промта.

Аноним 04/12/25 Чтв 21:46:52 № 1440798 141

>>1440782
конечно же меня опередили, эх

Аноним 04/12/25 Чтв 21:47:35 № 1440800 142

:)

Аноним 04/12/25 Чтв 21:52:38 № 1440805 143

>>1440606
В ноде LanPaint появилась поддержка Z-Image https://github.com/scraed/LanPaint

Аноним 04/12/25 Чтв 22:03:47 № 1440824 144

1764874662563-0[...].png 19358Кб, 5632x3072

4k пиздарики

Аноним 04/12/25 Чтв 22:05:42 № 1440827 145

Аноним 04/12/25 Чтв 22:13:28 № 1440836 146

>>1440757
напиши свой номер, объясню голосом, текстом неудобно

Аноним 04/12/25 Чтв 22:16:16 № 1440840 147

074e4cb5-61fa-4[...].png 1062Кб, 1280x720

Аноним 04/12/25 Чтв 22:19:22 № 1440842 148

>>1440836
Чел, произошло недопонимание. Я не для этого интересуюсь.

Аноним 04/12/25 Чтв 22:20:01 № 1440843 149

пиздарики

Аноним 04/12/25 Чтв 22:22:27 № 1440845 150

>>1440143
Сохранил

Аноним 04/12/25 Чтв 22:24:21 № 1440846 151

В Z Image работает клип скип. По умолчанию вы все генерили в -2. Переделывайте! С -1 лучше хвост, меньше не того хлама на полу, лучше дымка.

Аноним 04/12/25 Чтв 22:29:53 № 1440848 152

Ух блять какая же кривая острисная хуйня этот тулкит ебучий, нужно вручную датабазу стопать через конфиг а то он в бутлуп уходит пиздец просто. Но заставил работать.
Под адафактором в 32 дим лора 16/32 тренируется в 10 гигов и около 15 гигов кеша на раме. Тренируется быстро.
Просто сделал чистый прогон на датасете с бабами 100 штук картинок с пездами, одна эпоха, дольше препарейшен шел чем сама пятиминутная тренировка.
Слева ориг ген, второе с лорой, третий с дефолтным варианс энхансером и лорой. Ну и ген с пиздой.

Но лучше бы конечно придумали такую же хуйню как для сдхл описанную тут https://civitai.com/articles/22178/wip-draft-pissa-svd-fast-full-finetune-simulation-at-home-on-any-gpu-part-1

Аноним 04/12/25 Чтв 22:29:57 № 1440849 153

>>1440846
Ёпа

Аноним 04/12/25 Чтв 22:32:11 № 1440850 154

>>1440848
>Ну и ген с пиздой.
Ты кажется забыл его прикрепить.

Аноним 04/12/25 Чтв 22:33:39 № 1440851 155

>>1440850
Не забыл. Слева ориг, справа с лорой. Датасет кстати вообще без кепшенов, то есть сеточка сама понимает что надо учить пизду.

Аноним 04/12/25 Чтв 22:34:32 № 1440852 156

>>1440848 >>1440851
>Ну и ген с пиздой.
То есть миллион страданий, а пизду сгенерить так и не выходит?

Аноним 04/12/25 Чтв 22:35:39 № 1440855 157

>>1440852
Ну какую тебе пизду надо скажи? Я ж не черрипикаю чтобы тебя удивить, одна эпоха пятиминутная всеголишь

Аноним 04/12/25 Чтв 22:38:14 № 1440857 158

>>1440855
Любая пизда без странных фантомных складок меня бы устроила.

Аноним 04/12/25 Чтв 22:47:51 № 1440867 159

>>1440857
Много хочешь за одну эпоху.

Аноним 04/12/25 Чтв 23:08:19 № 1440895 160

>>1440788
>>1440798
Выглядит ультракриво, реалистика нет.

Аноним 04/12/25 Чтв 23:08:34 № 1440896 161

>>1440849
>>1440846

Ты охуенен, анон!! Первый пик клипскип - 25. Второй дефолтный.

>девочка 9 лет. Похоже, она принадлежит к цыганской расе и представлена в молодом возрасте. У девочки длинные, ярко-черные волосы, ниспадающие каскадом на плечи. она в волшебном мире кружащегося снега и огня. на ней маска из перьев

Аноним 04/12/25 Чтв 23:29:30 № 1440921 162

2321001-A steam[...].jpg 867Кб, 2016x1152

>>1440782

Аноним 04/12/25 Чтв 23:41:31 № 1440935 163

а еще клипскип в разы увеличивает вариабельность, не убивая промт. это гениальное решение.

Аноним 04/12/25 Чтв 23:45:02 № 1440945 164

>>1440846
Да уж, очень интересненько, надо выбирать, где получше останавливаться, спасибо. Сразу несколько штук и генерить с разным стопом.
-5; -10; -15

> Короткостриженый с недельной небритостью белый мужчина плохой внешностью 30 лет одет в спортивные шорты, сандали с носками и футболку с милитари-расцветкой в пиксель.
На футболке мужчины надпись "Miyabi love"
Находится в китайском современном городе с китайскими достопримеательностями.
foxes gathered around the man
foxes are eating film tape
man on one knee is feeding film tape to foxes
Что я могу сказать? Z модель цензурирует носки с сандалями!

Аноним 04/12/25 Чтв 23:56:56 № 1440959 165

>>1440921
Флюкс.

Аноним 04/12/25 Чтв 23:59:44 № 1440964 166

Ура. Теперь зетка может в безумие!

Аноним 05/12/25 Птн 00:00:49 № 1440967 167

>>1440964
лучшая модель

Аноним 05/12/25 Птн 00:02:41 № 1440970 168

>>1440967
ага

Аноним 05/12/25 Птн 00:36:42 № 1440989 169

>>1440896
Ткните нубасу где этот ваш клипскип находится? В дефолтном воркфлоу есть? Чет не нашел.

Аноним 05/12/25 Птн 00:42:01 № 1440998 170

>>1440989
Через поиск нод: ''set last layer'

Аноним 05/12/25 Птн 00:46:19 № 1441003 171

>>1440896
>25

Аноним 05/12/25 Птн 01:15:10 № 1441030 172

Как вы умудряетесь даже на Z делать дмдшные высококачественных резиновые ебальники вместо лица? Даже зубы резиновые как в искусственных дрочилках. Это тот самый известный комфиевский фейсдетайлер? Зумеризды не видели как должен выглядть нормальный фейс-инпейнт, например, в фордже, поэтому лепят вот такое?

Аноним 05/12/25 Птн 01:19:21 № 1441034 173

Лол, теперь клип скип вместо сида. Спасибо.

>>1441030
Детайлеры, апскейлеры и прочие мыловарни самая переоценена хуита в тредах.

Аноним 05/12/25 Птн 01:19:59 № 1441035 174

>>1441030
Открою тебе секрет.
Когда через тебя проходят сотни лиц - ты на их детализацию не обращаешь внимание, только самые важные черты или откровенные уродства подмечаешь.

Аноним 05/12/25 Птн 01:36:41 № 1441048 175

>>1441035
Ты забыл главное Похуй Вообще.
До сих пор без заметного и время затратного вмешательства фотошопом даже в очень качественную генерацию можно на глаз отличить не то что нейронку от не нейронки, а модель от модели и файтюн от файтюна.

Аноним 05/12/25 Птн 01:40:58 № 1441050 176

>>1441035
>пыхтит над апскейлом
>пыхтит над инпейнтом лица
>пыхтит над клип скипом
>ДА МНЕ ВООБЩЕ ТАК ПОХУЙ Я ТУПО ПЕРВУЮ ГЕНКУ ЗАЛИЛ НЕ ПОТЕЯ

Аноним 05/12/25 Птн 01:42:52 № 1441052 177

>а еще клипскип в разы увеличивает вариабельность, не убивая промт. это гениальное решение.
>Ура. Теперь зетка может в безумие!
>лучшая модель
>Лол, теперь клип скип вместо сида. Спасибо.

Модель отрыгивает недогенерированные полуфабрикаты. Публика скачет, хлопает в ладоши от радости и просит добавки. Мрак.

https://www.runcomfy.com/comfyui-nodes/ComfyUI/CLIPSetLastLayer
CLIP Set Last Layer Usage Tips:

To generate more abstract features, set the stop_at_clip_layer parameter to a higher negative value (e.g., -24). This will stop the model earlier in its processing pipeline.
For more detailed and fine-grained features, use a value closer to -1. This will allow the model to process the input more thoroughly.
Experiment with different stop_at_clip_layer values to find the optimal setting for your specific task or dataset.

Аноним 05/12/25 Птн 02:18:57 № 1441069 178

>>1441050
В 99% случаев, лучше накинуть 7% шума и размытие в 0,2-0,3 пикселя чем ебаться с попыткой убрать хуйню чтоб сломать ещё что то.

>>1441052
Люди хотят немного вариативности, хули.

Аноним 05/12/25 Птн 02:19:47 № 1441071 179

Аноним 05/12/25 Птн 02:28:10 № 1441077 180

Освещение как на пикриле с Flux.2 можно на Z-Image как-нибудь наpromptить?

С Flux.2 мне потихоньку удаётся добиться размещения источника света в полумраке так, чтобы весь персонаж не был как под софтбоксом заполняющего света.

А на Z-Image — нет.

Prompt:
A very dark, shadowy, dim digital photograph of an old dark server room, old computers, red light above the door.
A barely distinctive dark silhouette of a beautiful girl in deep purple minidress, tan sheer nylon stockings, deep purple revealing slide open-toed stiletto mules, is sitting on the vintage computer chair at the deep shadowy desk with a vintage 70's computer terminal, green text, in the dark, typing.
Dark image, dramatic deep dusk red low-key lighting. Very bright contrast red backlight under the desk.

Аноним 05/12/25 Птн 02:28:43 № 1441078 181

Не ну а чо. Норм.

Аноним 05/12/25 Птн 02:30:25 № 1441079 182

>>1441071
Неплохо. Почти далли-3. То есть качество сильно выше, но разнообразие, фантазия и эстетика хуже.

Аноним 05/12/25 Птн 02:32:39 № 1441082 183

>>1441069
>Люди хотят немного вариативности, хули.

Делается элементарно, добавлением одного узла Inject Latent Noise (где-то на 0.07) в workflow.
Или более навороченным custom node, который Анон постил в треде (это мне кажется overkill'ом и подталкивает к нездоровому подходу, чтобы на каждый чих искать специальный custom node).

Аноним 05/12/25 Птн 02:33:10 № 1441083 184

>>1441052
Я так понимаю динамически перетыкивать слой между шагами не получится без серьезных задержек?

Аноним 05/12/25 Птн 02:34:13 № 1441084 185

>>1441077
> Освещение как на пикриле с Flux.2 можно на Z-Image как-нибудь наpromptить?
Нет, конечно. Только если лоры тренить.

Аноним 05/12/25 Птн 02:44:13 № 1441085 186

>>1441083
Я не совсем понял о чём-ты.

Там, получается, если я правильно понимаю, резко обрубается генерация («model will now stop processing at the specified layer») и выводится то, что получилось на момент останова.

Что с этим делать, кроме как подхватить этот latent следующим samplerом и ещё чего-нибудь докрутить в нём, я не очень представляю.

Аноним 05/12/25 Птн 02:46:02 № 1441086 187

>>1441077
На мгновение заинтерсовался... q8 тридцать два гигабайта.
Ради ван герл ситинг ин дарк.
Не мое, мне как раз не хватало возможности нормально несколько персонажей без ебли вводить локально.
Хотя достижение огромное, объяснить модели концепцию "все в темноте" это ещё та задача.

Аноним 05/12/25 Птн 02:47:23 № 1441087 188

От худшего к лучшему, без ебли видимо невозможно. И пришлось убрать описание одежды.

Аноним 05/12/25 Птн 02:58:59 № 1441094 189

>>1441086
Ещё и LoRA lenovo_flux2.safetensors.
Без этой LoRA заметил, что стоковый Flux.2 ещё и шакалит какими-то крупными цветным точками (у меня зелёного цвета) в «темноте».
Такие артефакты я ещё заметил на одном из стилей имитации плёночного фото.

>q8 тридцать два гигабайта.
И text encoder такой же. Жирная, тормозная. Превью пришлось включить (в новом релизе ComfyUI починили под Flux.2), чтобы через минуту генерации обрывать, если говно получается (чтобы не ждать ещё три-четыре).

Эту я честно сгенерировал по текстовому promptу. А вообще, для «сложных» генераций без JSON-форматированного promptа я к Flux.2 даже не подхожу. Пресловутое «понимание сложного promptа» это тоже отчасти маркетинговый ход. Я об этом писал: >>1440110

>объяснить модели концепцию "все в темноте" это ещё та задача

Я с этим мучаюсь из чистого любопытства. Возможно ли это в принципе. А ещё, чтобы «зональное» освещение и «выставление» света. Flux.2 должен это делать лучше всех, но и там тоже местами обман.

Вообще, лучше бы писали честно, подо что модели заточены и что они точно не умеют делать, чем дразнить красивыми черрипикнутыми картинками в промо.

Аноним 05/12/25 Птн 03:04:27 № 1441095 190

>>1441094
Это не ты ещё в Далли треде в быдлятне пытался свечу в темноте сгенрировать? Такая то битва с ограничениями модели.

Аноним 05/12/25 Птн 03:07:52 № 1441098 191

>>1441087
>пришлось убрать описание одежды

Сработало.
На самом деле, круто для Z-Image. Конечно, не то, да и с «70's vintage computer terminal» у Z-Image беда (что неожиданно). Но я бился, чтобы заставить Z-Image выдавать что-то подобное.

Аноним 05/12/25 Птн 03:14:28 № 1441101 192

>>1441095
Не, не я.
Я начал это дрочево с Qwen-Image и частично добился успеха (в сочетании с Samsung_qwen_overtrained.safetensors, Qwen-Edit-Relight.safetensors, и рядом других (пикрилы).

А потом уже переключился на другие модели. Вместо Z-Image начал ковырять Flux.2 в надежде на реализм и работу со светом. В целом, и с тем и с этим ждало разочарование от завышенных ожиданий. А к выставлению хотя бы фрагментов освещения на Flux.2 подобрался только сейчас.

Аноним 05/12/25 Птн 03:50:13 № 1441112 193

>>1440959
Flux.2

Перевернуть модель парусника днищем кверху у меня пока никак не получается.

Аноним 05/12/25 Птн 03:51:58 № 1441114 194

>>1441030
>нормальный фейс-инпейнт
Не видели, покажи

Аноним 05/12/25 Птн 04:03:59 № 1441118 195

>>1441085
Нет, одной лапшой я даже не надеюсь на скорость. Интересно если кто-то кодом это организует как seedvariance, будет ли сильная просадка.

Аноним 05/12/25 Птн 04:12:41 № 1441124 196

>>1441077
Ты просишь у модели фотографию с глубоко сиреневым цветом платья в темной комнате, где только зеленый свет от экрана и красного освещения. Ты просишь очень темную комнату, в которой можно различить, что это не голые ноги, а полупрозрачные колготки телесного цвета под столом где очень яркий красный цвет. Тут будет или не фотка, или фотка с освещением и проебом половины противоречащих инструкций.

Аноним 05/12/25 Птн 04:24:57 № 1441134 197

>>1441124
>с глубоко сиреневым цветом платья в темной комнате, где только зеленый свет от экрана и красного освещения

Всё верно. Я специально ставлю в сложные условия, чтобы посмотреть на результат.
На самом деле, очень достойно. Если пипеточкой в Adobe Photoshop потыкать в нужных местах, то оттенок платья в тёмной комнате будет тёмно-сиреневым. На самом деле, это очень круто.

Ещё сложными условиями являются, например, генерация вида от первого лица и отражения в зеркалах.
Я всё понимаю, что наивно требовать это от модели, которую специально для этого не обучали. Но прогресс заметен.

Что касается моделей, например Qwen от алибабы, Flux.2, у меня складывается впечатление, что их вообще корпораты (или нанятые ими разработчики) создавали для задач генерации изображений продуктов (или мультипликационных рекламных маскотов, рекламной графики, showcase продуктов) и одежды для их площадок онлайн-маркетов и «цифровых примерок» одежды (edit варианты моделей). А всё остальное является совершенно побочным и удивительно, что при нестандартном использовании позволяет достигать впечатляющих результатов.

Аноним 05/12/25 Птн 04:41:21 № 1441142 198

>>1441134
>ставлю в сложные условия
Ты требуешь невозможного. У ней там в нутрянке модель реального освещения, и если ты ей задал только красный и зеленый источник света, а объект отражает синий цвет, значит она сама придумает источник света у которого есть синяя часть спектра, уж какой ей заблагорассудится, или выдаст вместо фотки нечто не реализм.

>создавали для задач генерации изображений продуктов
Насколько я понимаю, все модели приходится сначала учить на разнообразных данных. Потом файнтюнят у них эстетику, но если это не турбо модель, то они это разнообразие должны помнить.

Аноним 05/12/25 Птн 05:04:31 № 1441155 199

>>1440998
норм пошизить, спасибо

Аноним 05/12/25 Птн 05:09:49 № 1441162 200

>>1438901
дело не в негативе, у тебя без негатива ебало заартефачено (так, что аж пизда!), неужели это не очевидно? но тебе похуй похоже, тебе важнее заблюренный задник, он и не должен быть другим пока объекты в движении, это блохоискательство на фоне реальной проблемы с откровенно хуёвой генерацией лица главного персонажа в кадре, очнись уже...

Аноним 05/12/25 Птн 05:18:09 № 1441168 201

>>1441142
>У ней там в нутрянке модель реального освещения, и если ты ей задал только красный и зеленый источник света, а объект отражает синий цвет

То тогда фиолетового быть не должно не смотря на prompt, а должен быть какой-то другой (чёрно-тёмно-красный)?

>значит она сама придумает источник света у которого есть синяя часть спектра, уж какой ей заблагорассудится

На пикриле в посте не наблюдаю.

>или выдаст вместо фотки нечто не реализм

Ну, тогда не очень-то реальная
>модель реального освещения

В целом, я с тобой согласен по поводу фиолетового цвета (синей компоненты), хотя путаюсь в вопросах длины волн, отражения/поглощения длин волн видимого спектра, особенностей человеческого зрения; где «фиолетовый цвет» это результат восприятия одновременной стимуляция рецепторов, отвечающих за «красный» (длинные волны) и синий (короткие волны).

https://www.snexplores.org/article/color-purple-exists-only-in-brain

У меня была задача посмотреть, можно ли получать «недоэкспонированные» «тёмные» изображения на которых светом (даже не отдельными цветами) акцентировать только определённые области. При этом делать так, чтобы объект не был залит заполняющим светом как от софтбокса или, ещё хуже, вспышки.

Аноним 05/12/25 Птн 06:28:49 № 1441197 202

>>1441142
Вообще, спасибо. Это прорыв.

Размышления по поводу твоих слов и пост Анона >>1441087 натолкнули на правильное понимание вопроса.

Я взял неудобный Z-Image и проверил по следам своего поста >>1441098

Пикрил
Prompt:
A very dark, shadowy, dim digital photograph of an old dark server room, old computers, red light above the door.
A barely distinctive dark silhouette of a beautiful girl in minidress, tan sheer nylon stockings, revealing slide open-toed stiletto mules, is sitting on the vintage computer chair at the deep shadowy desk with a vintage 70's computer terminal, green text, in the dark, typing.
Dark image, dramatic deep dusk red low-key lighting. Very bright contrast red backlight under the desk.

На Z-Image (первый пик поста >>1441087) очень хорошо видно, как она пытается всеми средствами вкорячить цвета из promptа, освещая всё «несуществующими» источниками света (тот самый рассеянный заполняющий свет от «софтбоксов», который меня раздражал и причины возникновения которого я не понимал полностью). И всё только ради того, чтобы отобразить «заказанный» цвет, вместо того, чтобы благодаря >>1441142 «модели реального освещения» сделать его таким, каким он должен был бы стать при освещении источником условного «монохроматического» света (например, тёмно-красным, вместо фиолетового). Я думал, что такое поведение будет само собой разумеющееся: указали исходные «цвета» предметов одежды персонажа (как при освещении источником «белого» цвета; зелёная футболка, синие джинсы), «осветили» условным «источником» «монохроматического» освещения и картинка станет такой, какой нужно. А по факту, модель просто меняет всю картинку целиком в угоду тому, чтобы отобразить «заказанные» цвета любой ценой. Для кого-то, возможно, это было очевидно, но я до этого момента не понимал насколько сильное это оказывает влияние.

Какой из этого следует вывод? Вообще не указывать какие-либо цвета одежды, предметов, персонажей при генерации изображений на тёмном фоне, оставляя только цвета «монохроматической подсветки» и надеясь, что остальные «цвета» под этими источниками «монохроматического» освещения получатся хоть какими-нибудь, пусть и неконтролируемо, рандомно.

Попытки явно указать цвета предметов одежды такими, которыми они должны были стать после освещения источником «монохроматического» света (с помощью HEX значений цветов, которые вроде бы поддерживает Z-Image; и точно поддерживает Flux.2, но я на нём ещё это не пробовал), предварительно рассчитав перед этим «результирующий» цвет, который должен получиться после «освещения» объекта одного «цвета» источником другого «цвета», с помощью калькулятора смешения цветов ожидаемого результата не дал. Опять происходит «модификация» всего изображения, только менее агрессивным способом, чем в случае когда требуемые «цвета» совсем не подходят и не могут там быть.

Сказывается пробел в знаниях в этом вопросе.

Аноним 05/12/25 Птн 07:10:42 № 1441206 203

Пробнул я этот Zимадж. Восторга не было предела, реально шаг вперед. Но потом.. Я зашел в Grok image и вбил промпты туда.. Это небо и земля. По сранению с гроком, что зимадж, что флукс да и вообще все локалки - просто кусок кала. Лучше бы я туда не заходил..

Аноним 05/12/25 Птн 07:13:52 № 1441207 204

Просто проверьте сами, если не верите

Аноним 05/12/25 Птн 09:01:08 № 1441232 205

Обучил первую лору на лицо в Z-Image и охуел. Первый раз я охуел, когда сделал Dreambooth на 1.4. Второй раз послабее охуел, когда начал промптить с обученной лорой на dmd2. Обучение на Flux не попробовал. Chroma и особенно Wan с Qwen сильно шагнули вперёд, обучать стало проще, лицо чуть более узнаваемое, но удивления не было вообще. И вот, теперь это. На похуе вкинул на дефолтных настройках, с каким-то хуевым датасетом в разных размерах и тупыми капшенами в стиле сд (из JoyCaption > Stable Diffusion prompt с ключевым словом), убрал из настроек 1024, offloading, короче на скрине настройки и оно легко влезло в 16гб. Если покрутить, то и в 12 влезает. А если ещё и разобраться с настройками, то ебать что же будет. А если ещё и дождаться base... я ебу. Лицо живое, стиль фото меняется промптом, смена одной детали промпта почти не меняет остальную часть сцены на том же сиде. Я 2000 шагов бахнул, как будто можно и больше. Но уже абсолютно несовместимо с другими лорами.
В общем, пробуйте. Легко обучить на удовлетворительном уровне. У меня был сет из 50 фото в средне-хуевом качестве, в основном лицо и плечи, несколько фото общего плана, много разных.
>>1441206
База. Но Грок это пиздец кал обоссаный в плане качества картинки по сравнению с другими онлайн сетками. Зато с крутой дистилляцией, вот его бы на локалку. Самые красивые пикчи делали в Imagen 3. Он в принципе был лучшим абсолютно во всём. Даже тот же Imagen 4 стал каким-то блеклым и серым, ориентированным только на всратую фотографию, но при этом реализма модель не добавила совсем.

Аноним 05/12/25 Птн 09:05:32 № 1441235 206

>>1441030
>комфиевский фейсдетайлер
>фейс-инпейнт
Форжишизики всё ещё используют отдельные модели что бы пририсовывать плоские инородные ебальнички как будто на дворе 2023?

Аноним 05/12/25 Птн 09:17:20 № 1441241 207

>>1438893 (OP)
>CFG 3 для NoobAI
Что это даёт? Разве Нуб и так не работал на CFG 3 ?

Аноним 05/12/25 Птн 09:19:41 № 1441243 208

>>1441034
это ты тот аутист который заявлял что новый промпт = новый сид?
тебе и другим невдупленышам поясняю, клип скип это то количество блоков текст энкодера которое ты выбрасываешь за борт. то есть с каждым выкинутым блоком понимание промпта деградирует и воспринимать это как фичу это надо пиздец ебнутым быть , только если ты не генерируешь какой-то сюррреализм намеренно.
но зетники видимо согласны и на такое, лишь бы хоть как-то разнообразить генерацию в несомненно лучшей модели тысячелетия

Аноним 05/12/25 Птн 09:22:51 № 1441247 209

>>1438901
Хуйня галимая

Аноним 05/12/25 Птн 09:23:28 № 1441248 210

>>1441235
Этим занимаются комфидауны, а в фордже все встроено

Аноним 05/12/25 Птн 09:25:39 № 1441250 211

>>1441077
на хроме супер изи делал такое

Аноним 05/12/25 Птн 09:52:18 № 1441257 212

>>1441248
> в фордже для дуанов все встроено
Я так и понял

Аноним 05/12/25 Птн 09:55:53 № 1441259 213

>>1441257
Всяко лучше, чем 3 года сидеть без сносного facedetailer как комфидаунята

Аноним 05/12/25 Птн 10:05:28 № 1441264 214

Аноним 05/12/25 Птн 10:16:58 № 1441268 215

Detail Daemon adds detail and complexity to Z-Image-Turbo https://www.reddit.com/r/StableDiffusion/comments/1pea0v2/detail_daemon_adds_detail_and_complexity_to/?share_id=YjQt9qUqHY4316uXxzI8I

Аноним 05/12/25 Птн 10:22:49 № 1441274 216

>>1440824
ну так у нас уже 2k на Гойда-имедже, апскейльнуть до 4k без какой-либо потери качества не проблема если исходник на 2k.

Аноним 05/12/25 Птн 10:24:26 № 1441275 217

Аноним 05/12/25 Птн 10:30:26 № 1441279 218

>>1441241
>Разве Нуб и так не работал на CFG 3 ?
На 4 шагах, CFG 3 не работал, нет.
Все другие ускорялки требовали CFG 1.

Аноним 05/12/25 Птн 10:40:44 № 1441281 219

>>1441279
>На 4 шагах
Теперь чуть понятней, спасибо!
А качество на дно не упало?

Аноним 05/12/25 Птн 11:12:29 № 1441294 220

>>1441279
>>1441281
нахуя вам 4 шага на сдохле, вы ебанутые?

Аноним 05/12/25 Птн 11:22:56 № 1441304 221

>>1441197
>тот самый рассеянный заполняющий свет от «софтбоксов», который меня раздражал и причины возникновения которого я не понимал полностью
А я попробовал просто dark room, lights off вообще без цвета источников освещения или одежды/предметов, а он все равно освещает цетральный объект-девку таким светом. Только после исправления на very dark room и добавки, что не просто woman, а dark figure of получается что-то более-менее похожее. Так что про моделирование "реального освещения" как причину заливки светом я обосрался, наверное, это просто такая особенность модели.

Аноним 05/12/25 Птн 12:00:20 № 1441330 222

>>1441294
>нахуя вам 4 шага на сдохле, вы ебанутые?
НАДА я люблю крутить вайлдкарты и мне удобнее сгенерить 500 вартиантов рандома, а потом из них выбирать что апскейлить. Чем быстрее, тем лучше

>>1441279
Затестил.
Количество шагов уменьшает.
Время генерации - не уменьшает.
Эта хуйня работает только с семплером Kohaku и адекватный результат выдаёт только при CFG 2 и 8 шагах.
А 8 шагов этого семплера на моей карте аж на 3 секунды быстрее 20 шагов Эйлера. Шило на мыло получается.

Аноним 05/12/25 Птн 12:04:27 № 1441332 223

Почему еще не было? Flexy обновлена!
Понеслась!
Тестируем обновлённую Flexy (не Fluxy).

Аноним 05/12/25 Птн 12:13:57 № 1441352 224

Напишите хоть одним словом плиз как побороли шакалы Z-image.
А еще, промптом их можно поумерить? fp8 влияет на эти шакалы?

Аноним 05/12/25 Птн 12:30:23 № 1441380 225

>>1441330
> сгенерить 500 вартиантов рандома
типикал сдохля экспириенс, генерить рандомный кал тоннами, зато быстро епта

Аноним 05/12/25 Птн 12:39:31 № 1441391 226

>>1441332
после зимага это все такое мыло пздц. нейронки уже не будут прежними после з.

попробовал повторить, хз

Аноним 05/12/25 Птн 13:01:41 № 1441420 227

>>1441380
Типикл мелкабуква экспириенс. Тупо высрать боль своей жопы, не вникая в суть написанного.
Тебе слово "вайлдкарты" что-нибудь говорит? А говорит оно о том что в качестве промпта у меня полный рандом, и чтобы найти среди этого рандома годные варианты нужна большая выборка, от модели это вообще никак не зависит, если не брать скорость генерации в расчёт
Алсо, давай ка ты сначала мне подкинешь анимешную модель, из коробки знающую 90% стилей рисобак и понимающую бору-теги в качестве промпта, на голову лучше чем Нуб и его тьюны, и тогда я возможно твой пиздёж про "сдохлю" начну всерьёз воспринмать

Аноним 05/12/25 Птн 13:13:42 № 1441438 228

>>1441420
>в качестве промпта у меня полный рандом
Рекомендую выделять успешные/неуспешные генки и гонять их промты через LLM вместо тупого рандома. Для каждой модели/лоры будут разные рецепты, но в целом сильно меньше в говне ковыряться.
мимо_другой_вайлдкард_дрочер

Аноним 05/12/25 Птн 13:20:26 № 1441458 229

>>1441352
Если это лора то пока никак. Если без то она не особо понимает такой костюм, у него буквально тэг impossible bodysuit.

Аноним 05/12/25 Птн 13:24:23 № 1441469 230

>>1441352
степов побольше накинь ебана

Аноним 05/12/25 Птн 13:25:11 № 1441470 231

>>1441352
Как вы вообще умудряетесь шакалы делать? Оно литералли без всякого пердолинга работает.

Аноним 05/12/25 Птн 13:34:01 № 1441486 232

>>1441470
На тензоре шорошо делаются шакалы.

Аноним 05/12/25 Птн 13:37:21 № 1441488 233

>>1441470
>dejpeg
>без всякого пердолинга

Аноним 05/12/25 Птн 13:42:49 № 1441499 234

Аноним 05/12/25 Птн 13:45:01 № 1441502 235

А где вы промпты на Зет берёте? То есть я допустим картинку придумал, но там же нужно наверно и качественные тэги добавить, и негатив? У меня негатив из трёх слов, а позитивного нет совсем.

Аноним 05/12/25 Птн 13:49:20 № 1441517 236

1764931759834.png 10Кб, 546x108

1764931759839.png 4Кб, 460x79

>>1441502
> и негатив
> негатив
не работает
> А где вы промпты на Зет берёте?
ллм генерит

Аноним 05/12/25 Птн 13:57:54 № 1441523 237

>>1441438
>и гонять их промты через LLM вместо тупого рандома
А смысл? Подход с LLM пробовал, но он не даёт того что мне надо.
Даже если брать полный рандом, то логично сначала сделать выборку стилей, а потом уже на основе этих стилей генерить сюжеты.
Вот я в основном и юзаю частичный рандом, который отвечает за сюжет пикчи, а годный сюжет ЛЛМка все равно тебе не придумает.

Аноним 05/12/25 Птн 14:44:46 № 1441565 238

>>1441523
Умоляю
Дай промт этой татсумаки

Аноним 05/12/25 Птн 14:53:06 № 1441570 239

Ура. Давно хотел такое на локалке сгенерить.

Аноним 05/12/25 Птн 14:53:48 № 1441571 240

ЕЩЕ ОДНА ГОДНОТА!! Вместо обычного текстового поля надо ставить CLIP Text Encode for Lumina2, так как и сам Load CLIP грузится как тип люминия2. Это ВСЁ МЕНЯЕТ! Гораздо лучше становится понимание промпта. Я не знаю почему сами разработчики так не сделали по дефолту в шаблонах? Это стандартная нода ищите по тексту luminia. Даже мохнатки у баб гораздо лучше выглядят. Это ппц. Пример на скрине не совсем удачный, но вы сами протестите и отпишитесь.

Аноним 05/12/25 Птн 14:59:43 № 1441578 241

>>1441571
В этой ноде настройка в два варианта. Я думаю это два предустановленных системных промпта. Можно ли залезть в нее и добавить свой? Было бы улёт.

Аноним 05/12/25 Птн 15:11:34 № 1441584 242

>>1441578
В файлике \ComfyUI\comfy_extras\nodes_lumina2.py
Есть такие строки. Это оно.

нсфв Аноним 05/12/25 Птн 15:21:23 № 1441591 243

Всем привет, подскажите зеленому пожалуйста, с помощью каких нейронок реализовать "раздевание" по фото? может быть есть уже готовые кейсы

Аноним 05/12/25 Птн 15:23:19 № 1441596 244

>>1441565
Лови, не жалко.

(realistic:1.05),cosplay, masterpiece,highres,best quality, very aesthetic, absurdres, newest, highly-detailed, teen, (small_breasts:1.2), one-punch_man, tatsumaki, 1girl, alternate_costume, ass, ass_support, back, bare_back, black_slingshot_swimsuit, blue_sky, closed_mouth, cloud, cloudy_sky, curly_hair, feet_out_of_frame, flipped_hair, from_behind, frown, grabbing_own_ass, green_eyes, green_hair, looking_at_viewer, looking_back, median_furrow, pear-shaped_figure, short_hair, shoulder_blades, sideways_glance, sky, slingshot_swimsuit, solo, swimsuit, tan, tanlines, thick_thighs, thigh_gap, thighs, wide_hips

Аноним 05/12/25 Птн 15:33:29 № 1441613 245

>>1441332
На мой взгляд, после Зимаж уже некуда дальше в фотореалистике двигаться. Только в сторону повышения точности деталей и улучшения мелочей. Космонавт на первой пикче выглядит так, как будто он приехал из тредов двухлетней давности. Изображение с икрой выглядит неплохо, но много мыла в случайных местах, которые не связаны с фокусом камеры.

Похоже, у нас на руках рубежная модель.

Аноним 05/12/25 Птн 15:35:54 № 1441617 246

>>1441596
Как же я проиграл, спасибо.

Аноним 05/12/25 Птн 15:37:07 № 1441619 247

Лучшая ванниловейровская лора, что я видел.

Аноним 05/12/25 Птн 15:37:10 № 1441620 248

image.png 2928Кб, 3385x1186

пробую разъебать повторить шедевры флекси на зимаге.

1. картинка зимаг. 2 - флекси.

Будет несколько.

Аноним 05/12/25 Птн 15:38:04 № 1441621 249

image.png 2939Кб, 3241x1203

>>1441620

Аноним 05/12/25 Птн 15:38:40 № 1441623 250

image.png 4223Кб, 3454x1129

>>1441621

Аноним 05/12/25 Птн 15:39:17 № 1441626 251

>>1441623

Аноним 05/12/25 Птн 15:40:13 № 1441630 252

image.png 3403Кб, 3578x1130

>>1441626

Аноним 05/12/25 Птн 15:40:14 № 1441631 253

>>1441584
Кто-то может залить на основе этой встроенной ноды кастомную с дополнительным полем ввода системного промпта? В него можно много чего по написать, в том числе заставить ллм расписывать промпт из пары слов. Тема очень ценная

Аноним 05/12/25 Птн 15:41:43 № 1441633 254

image.png 3448Кб, 3595x1114

>>1441630

Аноним 05/12/25 Птн 15:43:06 № 1441638 255

>>1441633
Хватит.

Ну чо, дотягивает до хача?

Аноним 05/12/25 Птн 15:50:34 № 1441658 256

Кое-где Флекси неплохо себя показывает. Вишни неплохие, например. Мороженное тоже. Но Зимаж тащит. Думаю, у него больше успешных кейсов применения.

Аноним 05/12/25 Птн 15:52:59 № 1441661 257

>>1441591
>"раздевание" по фото
qwen-image-edit-2509

Аноним 05/12/25 Птн 15:54:51 № 1441662 258

image.png 3208Кб, 3403x1128

>>1441571
да, сразу объекты поняла. спасибо.
1. стандарт. 2.люмина

Аноним 05/12/25 Птн 16:06:51 № 1441676 259

Аноним 05/12/25 Птн 16:11:39 № 1441685 260

Ебучие обновляторы. Пайторч на пустом месте отьебнулся намертво, вот сижу генерю, закрыл комфи, подрочил в другой программе, открываю хуяк все отьебнулся намертво надо все переустанавливать.
Как же заебло это творчество душевнобольных.

Аноним 05/12/25 Птн 16:31:22 № 1441708 261

>>1441685
>на пустом месте
нет. большинство проблем возникает из-за драйвера hands.sys и прокладки между креслом и компом
>заебло это творчество душевнобольных
ты-то пиздатый код написать можешь, сто процентов. просто не хочешь.

Аноним 05/12/25 Птн 16:36:56 № 1441720 262

>>1441708
Да понятно что я чет не то нажал в менеджере, не еби душу дай поорать. В итоге придется видимо все переустанавливать, надеюсь что не винду.
Умные все.

Аноним 05/12/25 Птн 16:58:54 № 1441769 263

>>1441661
Спасибо, а нужны какие то лоры к нему устанавливать? где вообще их искать? я только вкатился, установил комфи, прям совсем примерно одупляю как это работает. могу даже чуть юсдт накинуть за помощь в настройке

Аноним 05/12/25 Птн 17:22:24 № 1441805 264

>>1441502
>А где вы промпты на Зет берёте?
В мозгу.
> То есть я допустим картинку придумал, но там же нужно наверно и качественные тэги добавить
Не нужно тегов. Нужно просто нормальным языком детально описать - что ты придумал. У нее хоть и маленькая, но полноценная текстовая модель работает на разборе текста. Сочинения в школе писал? Вспоминай навыки. :)
В прочем - можно и просто тегов натыкать. Даже получается что-то. Иногда.
>и негатив? У меня негатив из трёх слов, а позитивного нет совсем.
При CFG 1, как в референсном workflow, негатив игнорируется.

>>1441571
>Вместо обычного текстового поля надо ставить CLIP Text Encode for Lumina2
>>1441584
>>1441631
...Или просто вписать такой промпт в обычный клип-ноду самому, как часть "заказа". Там же instruct LLM вместо простого энкодера - кто с текстовыми баловался, наверно интуитивно поймет - что и как происходит. Просто пишем ей инструкцию - чего хотим. Разница в том, что не только саму картинку описываем, но и как именно ее делать.
...Так же кастомную ноду пилить не обязательно - прямо в комфи можно имеющимися средствами собирать итоговый промпт из нескольких нод с текстовым вводом, и даже subworkflow из этого сделать - та самая кастомная нода получится.

Аноним 05/12/25 Птн 17:40:58 № 1441841 265

>>1441805
Я просто привык уже к тегам настолько, что надо теперь переучиваться обратно. А вот про сфг 1 я чот протупил, забыл что он игнорируется. Спасибо.
>>1441517
У ллм когда спрашиваю мне постоянно преходится переписывать настолько, что проще писать самому.

Аноним 05/12/25 Птн 17:56:20 № 1441875 266

>>1441769
лоры на civitai.com, надо зарегаться, чтобы видеть недетский контент. правда там в последнее время могут и снести всякие раздевалки из-за ебанутых правил. вот держи лору на раздевание для qwen https://dropmefiles.com/AIfM0
>могу даже чуть юсдт накинуть за помощь
та я не пользуюсь криптой и лень разжевывать. в сети гайдов реально много, на ютубе например. вроде еще forge в последних версиях умеет с qwen edit, там попроще будет чем в комфи, что-то типа продвинутого automatic1111. но сам в нем уже давно не сидел, больше года уж точно

Аноним 05/12/25 Птн 18:08:43 № 1441925 267

Аноним 05/12/25 Птн 18:20:30 № 1441946 268

И что это такое? Питон 12.9, Куда последняя, пауэр шелл обновлен, все работало буквально весь год.
Питон на ранние версии откатывал, жопой тряс, в бубен бил.

Аноним 05/12/25 Птн 18:26:18 № 1441959 269

>>1441946
Это не ты и не комфи. Это Роскомпозор. Или сервак пайторча упал.

Аноним 05/12/25 Птн 18:31:06 № 1441968 270

>>1441946
comfyui-desktop? в виде десктопного приложения? вроде припоминаю, ставил это кривое поделие и оно мне похерило чето в путях, снёс нахуй. лучше скачать comfy portable отсюда https://github.com/comfyanonymous/ComfyUI/releases и не париться.

Аноним 05/12/25 Птн 18:35:13 № 1441980 271

>>1441968
Да я уже понял что дебил, перехожу на портабл, как все нормальные здоровые люди.
Какого хуя я год мучался с десктопом который то обновиться не может, то питон теряет, то вот пайторч на росном месте отпал.
потому шо дебил

Аноним 05/12/25 Птн 18:49:15 № 1442001 272

Meituan Longcat Image - 6b dense image generation and editing models https://www.reddit.com/r/StableDiffusion/comments/1pevqxb/meituan_longcat_image_6b_dense_image_generation/?share_id=HM2dN3fc9Y-aofUdXEsIi

Аноним 05/12/25 Птн 19:14:28 № 1442021 273

>>1441875
Ладно, все равно спасибо за советы, ты мне много времени съэкономил этим

Аноним 05/12/25 Птн 19:34:03 № 1442031 274

image 1359Кб, 1254x4965

Не, ну ты видел? Видел? Зит

Аноним 05/12/25 Птн 19:35:56 № 1442036 275

>>1441980
>Какого хуя я год мучался с десктопом
Чел, тебе очень повезло. Я видел пару тем на реддит про то как десктоп версия при обновлении чистит папку со всеми моделями. Радуйся.

Аноним 05/12/25 Птн 20:21:20 № 1442094 276

Может быть тупой вопрос, но лучше сразу разобраться.
При скачке лор скачивается файл на несколько метров. Рядом картинки-примеры, какие теги использовали для генерации.
Но все пользовательские теги не скачиваются с файлом, могут не быть использованы на примерах из-за обилия всех возможных тегов.
А для моделей может быть желательный cfg и количество шагов.

Все теги, которые использует лора, можно каким-то образом посмотреть через комфи/другие программы?
Или все теги лучше сразу скопировать в блокнотик рядом с лорами чтобы не забыть, не потерять и использовать. И cfg вместе с шагами моделей - рядом с файлами моделей.

Аноним 05/12/25 Птн 20:37:23 № 1442110 277

>>1442094
Правой кнопкой на лору в комфи, в ноде с лорами -> шоу инфо, фетч фром цивитаи

Аноним 05/12/25 Птн 20:42:35 № 1442113 278

>>1440665
Поделишься связкой?

>>1440690
Сяп!

Аноним 05/12/25 Птн 21:03:43 № 1442143 279

>>1442094
power lora loader

Аноним 05/12/25 Птн 21:22:50 № 1442166 280

1764958969990.png 36Кб, 1051x392

>>1442110
Так, значит через мод менеджер комфи поставить Lora manager
перезагрузить комфи...
и комфи сдох, прекрасно. А нет, ожило.
В общем я скачал явно не то, но оно хотя бы как-то сохранило всё имеющееся, спасибо за такую наводку.
>>1442143
Из комфи менеджера скачалась какая-то залупа, потому что п-л-л не высветилось, а залупа позиционируется как замена...
Ладно, пока хотя бы так сойдёт, чтобы не сохранять всё подряд, а иметь под боком.

Спасибо за помощь, потом может наберусь мудрости или полезных более удобных расширений.

Аноним 05/12/25 Птн 21:35:39 № 1442185 281

>>1440704
Ну нормально, прям как полноценная модель ведет себя. Правда в 4 раза дольше генерит, а качество я бы не скозал что прямо в 4 раза лучше, плюс минус то же самое что турба.

Аноним 05/12/25 Птн 21:37:23 № 1442190 282

>>1442185
Ты дурной?
Она не для генераций а для лор

Аноним 05/12/25 Птн 21:38:21 № 1442193 283

>>1442190
Я знаю, но на ней генерирует нормально тоже.

Аноним 05/12/25 Птн 21:59:58 № 1442214 284

>>1442031
видел

Аноним 05/12/25 Птн 22:06:40 № 1442229 285

Ну распробовал. В принципе можно из ванилы уже переходить к 2к разрешению и обмазывать лора

Аноним 05/12/25 Птн 22:16:13 № 1442244 286

>>1441571
спс за инфо, попробую

Аноним 05/12/25 Птн 22:23:12 № 1442253 287

>>1441638
>хача
Поясните за этот феномен? Откуда у него полноценная модель? Он же только какой то мердж делал для 1.5 или нет? Он спиздил получается в очередной раз что то и выдает за свое?

Аноним 05/12/25 Птн 22:26:17 № 1442255 288

>>1442253
Естественно. У него никогда не было своих моделей. Он максимум тренил лоры, выставляя это как какое-то достижение.

Аноним 05/12/25 Птн 22:29:54 № 1442258 289

Промпт со времен сдхл. Никто не смог его до Зит:
A girl falling off a bicycle from a downward view as she is already in the air, cinematic lighting, detailed nature scene in the background, high quality

Аноним 05/12/25 Птн 22:31:59 № 1442260 290

У меня одного в новой комфи в зимадж намертво виснет процесс генерации пока не обновить страницу в бразуере? Смотрю в issue на гитхабе не у кого нет, значит проблемы чисто мои а где хуй знает

Аноним 05/12/25 Птн 22:32:41 № 1442261 291

Аноним 05/12/25 Птн 22:38:48 № 1442269 292

>>1442260
Проблемы твои

Аноним 05/12/25 Птн 22:39:36 № 1442270 293

>>1442260
Проверяй расширения, они там иногда говно мамонта из себя представляют или тянут какие-то древние пакеты которые сами в свою очередь с чем-то конфликтовать могут (или очредное "нужен пакет такой версии, а у тебя такой. Пошёл нахуй")

Аноним 05/12/25 Птн 22:43:53 № 1442276 294

https://huggingface.co/meituan-longcat/LongCat-Image
6 миллиардов, у бомжей праздник

Аноним 05/12/25 Птн 23:00:51 № 1442291 295

>>1442276
Интересно, какой нужен комп бомжу чтобы такое потянул без квантизации...

Аноним 05/12/25 Птн 23:03:00 № 1442295 296

>>1442276
Блин, да где на них всех время то взять? Эк их прорвало под конец года... :)
Там кстати некий Qwen 2.5 VL в качестве энкодера. Под 16 гиг размером. Больше чем сама модель.

Аноним 05/12/25 Птн 23:04:14 № 1442298 297

>>1442291
3060 + 32GB рамы. Возможно и проще видяха пойдет.

Аноним 05/12/25 Птн 23:05:05 № 1442299 298

>>1442295
> некий Qwen 2.5 VL в качестве энкодера
От Qwen Image же.

Аноним 05/12/25 Птн 23:06:44 № 1442301 299

>>1442276
Там тоже китайские ёбла по дефолту? Как их в негатив вообще прописать

Аноним 05/12/25 Птн 23:58:12 № 1442333 300

>>1442301
а прописать russian\caucasian woman очень сложненько, верно

Аноним 06/12/25 Суб 00:13:38 № 1442358 301

>>1442333
>caucasian

Когда это читаешь, сразу рисуются в голове абреки.

Аноним 06/12/25 Суб 00:53:55 № 1442426 302

>>1442276
клон zimage штоль? проверил обоих, довольно похожую картинку выдают

Аноним 06/12/25 Суб 00:55:41 № 1442430 303

>>1442426
Корпусы датасетов одинаковые просто

Аноним 06/12/25 Суб 01:14:21 № 1442483 304

Кто-нибудь уже тренировал лоры под З имаге?

Аноним 06/12/25 Суб 01:37:31 № 1442561 305

>>1442426
О, левая даже сильно лучше.
>>1442483
Не вчитывался в тред, ожидал/ожидаю, что человека два ещё писали про обучение, на проскроле не заметил.
Ещё попробовал, теперь на пикчах из ImageFX. Не растестил хорошо, только последнюю версию на 3к шагов, пикчи на обычном euler. В сочетании с другими лорами ломается. Добавилось пластмассовости немного в отличии от трена на реальных фото. Может нужно было дотренить на low noise или не оставлять elsa в капшенах.
Пробую с бакетами на 1024 (сами пикчи разных размеров), потребление врам почти не поменялось, в 16гб влетает со свистом, но обучение стало примерно на 30% медленнее по сравнению с 768. Но сами понимаете, не только это влияет. Может на прямом датасете с единым бакетсайзом будет ещё меньше врама и выше скорость.
Мне больше интересно посмотреть результаты и настройки тех, кто шарит за настройки.

У меня даже скорость не впечатляющая. Мельком видел сообщения, что у людей 3s/it чуть ли не на 3060. У меня 4-6s/it на 4060 Ti. Как так? Если снизить квантизацию с 8 до 4bit, сильно повысится скорость обучения?

Аноним 06/12/25 Суб 01:48:39 № 1442589 306

>>1442483
потренировал лору с помощью ai-toolkit на всратом датасете. получил мыло, ореолы и jpeg артефакты, которые были на этих старых фотках (возможно перетренировал). но и похожесть на персону с фоток впечатляющая. буду пробовать что выдаст другой датасет, вылизанный с помощью qwen-image-edit (upscale lora + удаление фона).
>>1442561
>левая даже сильно лучше
да мне тоже чем-то нравится. её лонгкэт выдал.

Аноним 06/12/25 Суб 01:57:08 № 1442597 307

>>1442561
>4-6s/it на 4060 Ti
да чето дольше чем надо как мне кажется. допустим у меня 1,3 секунды на итерацию с 40 gflops видеокартой. у тебя 22 gflops, должно быть в районе 3 секунд. хотя возможно всё дело в пропускной способности памяти. у 3060 192 бита и 360 гбайт\с, а у тебя 128 бит и 288 гбайт\с. для игр норм, для ии критично.

Аноним 06/12/25 Суб 03:19:30 № 1442679 308

Пацаны это че. Я могу генерить что то кроме ВАН ГЕРЛД СТЕНДИНГ в Омске по колено в говне, без всякой ебли с лорами и воркфлоу длинной в грузовой поезд, чисто на промтах?
Ебать.
Дожили.

Аноним 06/12/25 Суб 03:29:22 № 1442685 309

Аноним 06/12/25 Суб 03:46:43 № 1442707 310

>>1442561
Может у них батч сайз стоит не 1 (или я путаю с другим параметром)

>>1442589

А какие параметры вы ставите? Или дефолтные из аи тулкита норм?
Я на SDXL ~2К шагов делал и было норм

Аноним 06/12/25 Суб 03:54:19 № 1442719 311

>>1442707
>дефолтные из аи тулкита норм?
ага, только количество шагов уменьшил до 1500 а то перетренировка выходила. на 12 гб врам можно ещё low vram галочку отключить, модель норм влезает.

обучил ещё одну лору на исправленном датасете (убран фон + денойз и апскейл), стало нормально. жаль конечно не может как qwen image, которому любое говно закинуть можно и лора норм выйдет. ну 20 млрд параметров видимо более гибкие.

Аноним 06/12/25 Суб 04:43:49 № 1442774 312

image.png 8Кб, 445x166

>>1441232
>В общем, пробуйте.
я соглы с твоим постом, вчера надрочил на уебищнейшем датасете из шумов и артефактов прекрасную лору с прекрасным диверсити и когерентностью, на сдхл натренировать также невозможно было

алсо зимагу насрать на кепшены если в датасете то что зимаг и так знает, чисто на классовый токен дрочишь и кайфуешь

адафактор (на 0.0003) меньше жрет чем адам и сходится в два раза быстрее, плюс можно в конфиге вкл автоадаптацию самого адафактора если надо автоматический оптим
алсо квантизация в 4бита нормальная для трансформера, позволить больше дименшенов поставить для лоры или включить 1024 или батч 2 выставить, но в принципе зимагу насрать он и в 512 тренирует прекрасно
алсо на пике лучше тоже включать, бустит схождение

Аноним 06/12/25 Суб 04:45:56 № 1442778 313

>>1441571
>ЕЩЕ ОДНА ГОДНОТА
а первая годнота это я так понимаю кручение клипа чтобы фильтрующие слои не мешали?
>Это ВСЁ МЕНЯЕТ! Гораздо лучше становится понимание промпта.
ну такто да, надо подправить промт в самом скрипте будет

Аноним 06/12/25 Суб 05:27:15 № 1442856 314

>>1442774
а между моделями пикрил разницы нет как я понял? просто одна уже дедистиллирована, а вторая - обычная турбо + адаптер типа лоры?
>можно в конфиге вкл автоадаптацию самого адафактора
это в режиме advanced? подскажи пожалуйста, где именно
>квантизация в 4бита нормальная для трансформера
памяти меньше жрать стало. погляжу что получится на выходе.

Аноним 06/12/25 Суб 05:28:20 № 1442859 315

>>1442778
>первая годнота это я так понимаю кручение клипа чтобы фильтрующие слои не мешали

Я вчера заметил только остановку генерации на определённом слое и отрыгивание полуготового полуфабриката. Ну и восторженные возгласы: «Вау, Z-Image умеет абстрактный креатив, лучшая модель».

>Гораздо лучше становится понимание промпта.
Проверил, не заметил (тестировал на настройках с prompt, seed, scheduler/sampler как у постера).
Чтобы получить результат, похожий на то что у него (хотя на этих настройках должно очень похоже), пришлось отцепить LoRAs из Power Lora Loader (отключить весь узел), отключить CLIP Set Last Layer (вернуть значение по умолчанию). Ну и ещё подозреваю, что у него text encoder какой-нибудь abliterated стоит, а не тот, который по умолчанию в workflow идёт.

Я очень осторожно отношусь к таким советам, иногда кажется что ради лулзов вбрасывают какую-нибудь дичь, которая только засирает генерацию. А потом смотрят как куча леммингов в треде повторяет.

Аноним 06/12/25 Суб 06:08:41 № 1442901 316

В продолжение вчерашнего эксперимента >>1441197, то же самое проверил для Flux.2

Результаты пикрил1.
Выводы: работают те же приёмы, которые были эмпирически определены для Z-Image. А именно: ни слова о цвете при генерации тёмного изображения. Когда указывается только цвет источника «монохроматического света» и идёт рандомная раскраска, выглядит в целом довольно убедительно.
Ну и стоковый Z-Image с тем же promptом (пикрил2), он старался.

Втыкать цвета с помощью их HEX-представлений на Flux.2 пока ещё не пробовал. Интересно, будет ли Flux.2 пытаться их реально «осветить», чтобы получить настоящий результирующий цвет или будет пытаться воспроизвести в ущерб всему (как Z-Image: заказали цвет — сделано; а то, что освещение, да и всё изображение не то, это уже проблемы юзера).

Prompt (с небольшой ошибкой, которую сейчас заметил, поэтому на Flux.2 игрушек на ёлке нет):
{
"scene": "a dark old server room room. A dark silhouette of an old-looking computer with large monitor on the desk with large caption '2ch AI StableDiffusion' and an orange lightning icon on the screen with CRT artifacts., There are dark silhouettes of sci-fi glass panes with node programming interface displayed with words 'ComfyUI', 'Z-Image', 'SeedVR2' in pixelated computer font. The glass panes are connected with light color cables through patch-panels. Some panels are broken and displaying error messages with warning icons.\nThere is a pile of light color cables on the floor.",
"subjects": [
{
"description": "A dark silhouette of a chubby middle-aged man in light cotton socks, dark fluffy slippers, dark sweatpants, light t-shirt, semi-dark bathrobe, wearing paper bag as a mask with eye holes, with happy smiley face drawn with pencil on the paper bag.",
"position": "left of center midground",
"action": "standing by the computer, holding a small, beautifully decorated Christmas tree decorations, adorned with electric color string-lights, and setting it up on top of the monitor"
}
],
"style": "Documentary-style photojournalism with natural authenticity, artistic expression",
"lighting": "cinematic lighting, very dusk green fluorescent low-key sci-fi glass panels dim green fluorescent glow.",
"camera": {
"angle": "Eye level",
"distance": "Full shot",
"lens-mm": 80,
"f-number": "f/4",
"depth_of_field": "Everything sharp",
"focus": "Hyperfocal, near to far"
}
}

Аноним 06/12/25 Суб 06:19:20 № 1442907 317

>>1442707
>>1442597
Чуть больше 4 часов 2500 шагов. Low VRAM походу зря не отключил (не обратил внимания). И offload тоже, наверное, не нужен, если всё равно всё кешируется на диск.
Взял свой лучший датасет, на XL он выдавал чудеса и внезапно оно сделало хуже чем лора на обычном датасете. Лицо норм, но качество страдает, на 1500 уже не очень видно лицо. Хуже чем голая модель с фотолорами. Надеюсь с base будет обучаться лучше.

Аноним 06/12/25 Суб 06:30:42 № 1442913 318

>>1442907

Анон, расскажи пожалуйста, с какой целью LoRAs тренируешь? Определённые персонажи и их «гарантированное» воспроизведение в генерации?

Я к этому вопросу ещё и близко не подходил потому что пока надобности в этом не было. Но любопытно для общего развития. Гайды мельком смотрел, но не вникал.

Пикрил Qwen-Image-Edit-2509, на Flux.2 ещё не пробовал Edit делать, но там он наверно будет не хуже Qwen. Для меня какую-нибудь грубоватую поделку слепить достаточно. А тратить время ради получения конкретного персонажа пока не хотелось.

Или для тренированных LoRAs есть какие-нибудь другие сценарии использования типа редких «стилей» изображения, которые не получаются другими способами, или какие-нибудь lightning LoRAs (ускорялки, улучшалки, вычищалки)? То есть то, ради чего всем этим заниматься. Практическая сторона, так сказать.

Аноним 06/12/25 Суб 06:45:05 № 1442919 319

Аноны, у меня тут накопилась куча пнгшек, есть у вас какой-нибудь питон скрипт / вебапп, чтобы все их конвертнуть в .жпг / .вебп с сохранением ComfyUI workflow?

Аноним 06/12/25 Суб 07:10:58 № 1442939 320

>>1442913
>с какой целью LoRAs тренируешь
Тян сиськи у-ууу стоит раком жопа как бочка
Для общего вида персонажей Edit может и подойдут. С лицами они не справляются.
Ну, стиль тоже можно, если есть желание.

Аноним 06/12/25 Суб 07:16:11 № 1442948 321

>>1442913
>Определённые персонажи и их «гарантированное» воспроизведение в генерации?
Да.

>для тренированных LoRAs есть какие-нибудь другие сценарии использования типа редких «стилей» изображения, которые не получаются другими способами
Да.

Аноним 06/12/25 Суб 07:28:39 № 1442957 322

>>1442901
Добавлю про эксперимент с использованием HEX-значений цветов, которые можно добавлять в subject JSON-promptа FLUX.2
Запорол чистоту эксперимента, сгенерил с другим Seed.

Специально взял яркие и несочетающиеся цвета для пикрил1, чтобы посмотреть, что произойдёт. Хотя эти цвета были заявлены как цвета персонажа (его color palette), особого влияния они не оказали. Наверно, больше ёлке досталось. Но самое главное, что сразу появляется «волшебный софтбокс», который «поправляет» освещение так, чтобы отображались «цвета». Ожидать, что FLUX.2 заказанные цвета «переосветит» и адаптирует к общему фону изображения было наивно, но попробовать стоило. В итоге ситуация следующая: если на изображении не может быть заказанных цветов, то освещение всего (или большей части) изображения будет изменено так, чтобы они там появились.

Пикрил2 без явного указания цветов. Просто ёлка с цветными огоньками (без указания их цвета явно) уже немного «выпадает» из общего фона изображения и явно, освещена не так, как должна. Хотя по сравнению с пикрил1 тут в целом удовлетворительно.

В черрипикнутых примерах FLUX.2 из prompting guide https://docs.bfl.ai/guides/prompting_guide_flux2 нет изображений с заполняющим «монохроматическим» светом на цветных объектах (с модификацией их результирующего цвета). И теперь понятно, почему.

В целом это неспецифичный сценарий использования, так как эту модель готовили под «студийную съёмку» промо-материалов, архитектуру и прочие коммерческие задачи, поэтому сложно ожидать от неё (особенно, когда dev-модель позиционируется как инструмент «быстрого прототипирования, концептов» рекламы pro-версии). Но, всё равно, любопытно.

Аноним 06/12/25 Суб 07:38:45 № 1442963 323

>>1442957
Вот правильный пикрил2.

Аноним 06/12/25 Суб 07:51:04 № 1442968 324

>>1442276
>LongCat-Image
>6 миллиардов
Самое главное не написал:
>guidance_scale=4.5,
>num_inference_steps=50,

Аноним 06/12/25 Суб 09:16:18 № 1442995 325

>>1441571
>ЕЩЕ ОДНА ГОДНОТА!!
Ладно, признаю, что не годнота. Просто добавляет еще префикс тот из кода. Я даже запилил кастомную ноду. Всё фигня. Тоже самое что писать перед своим промптом этот "системный" промпт.

Аноним 06/12/25 Суб 09:37:29 № 1442999 326

image.png 87Кб, 1750x610

>>1442856
>а между моделями пикрил разницы нет как я понял? просто одна уже дедистиллирована, а вторая - обычная турбо + адаптер типа лоры?
разницы нет архитектурно, просто дедистилю сломали дистиль и теперь он может работать как должна работать обычная модель - с высоким цфг и много шагов, вследствие чего получается что турбо дмд модель (а зимаг турба на принципах ученик-учителя и дмд сделана) больше не зависит от конкретных обстоятельств генерации и может быть использована для дальнейшего фул файнтюна, надрачивания на ней лоры без использования адаптера чтобы юзать выходную лору с дедистилем без адаптера или юзать связку дедистиль+адаптер чтобы получать более точную и гибкую лору и использовать ее с турбой;
кароче обучать на дистилляте это несколько неправильно - можно, но дистилят много упускает при тренировке и может пукать при сложных концептах излишне обрезая важную инфу, дедистиль именно как база обучения лучше

кстати острис в2 адаптер выпустил

а еще онемшка придумала лифехак с адаптером https://huggingface.co/ostris/zimage_turbo_training_adapter/discussions/5

>это в режиме advanced? подскажи пожалуйста, где именно
да, именно там, пикрел

Аноним 06/12/25 Суб 09:47:46 № 1443002 327

>>1442859
>Я вчера заметил только остановку генерации на определённом слое и отрыгивание полуготового полуфабриката

клип сет ласт леер? ну да я про это и писал, там на последних слоях нсфв фильтрация у зимага небольшая очевидная, -1 неуправляемый промтом очевидно получается, -2 дефолт режет концепты всякие, -3 и дальше в зависимости от шизы можно подобрать для своих задач

>Проверил, не заметил (тестировал на настройках с prompt, seed, scheduler/sampler как у постера).
Чтобы получить результат, похожий на то что у него (хотя на этих настройках должно очень похоже), пришлось отцепить LoRAs из Power Lora Loader (отключить весь узел), отключить CLIP Set Last Layer (вернуть значение по умолчанию).
а я на стандартном енкодере погонял, разительно лучше выход с инструкциями из люмина ноды, сегодня попробую NSFW систем промт подставить замести стандартных

>подозреваю, что у него text encoder какой-нибудь abliterated стоит, а не тот, который по умолчанию в workflow идёт
а аблитерейтедов qwen3 4b то и нет в кванте нормальных, или я в глаза ебусь?

Аноним 06/12/25 Суб 09:52:29 № 1443004 328

>>1442995
>Тоже самое что писать перед своим промптом этот "системный" промпт.
Прям одинаковый вывод получается если прописывать систем промт в обычном поле промта? Я не тестил просто, но частенько с ллмками в виде енкодера пишу шизу в [system instructions] прям сплошным текстом

Аноним 06/12/25 Суб 10:04:02 № 1443010 329

>>1443002

https://huggingface.co/Mungert/Qwen3-4B-abliterated-GGUF/tree/main

Аноним 06/12/25 Суб 10:06:06 № 1443012 330

>>1443004
Да, одинаковый, на уровне какой-то погрешности(сид зафиксирован). Я по заблуждению(после общения с ллм) думал, что здесь системный промпт значит тоже самое, что и у ллм. Но оказалось что конкретно с этой нодой это не так. Например можно в текстовую ллм прописать чтобы она заменяла всех человеческих персонажей которые ты ей пишешь на котиков и ллм будет так делать. А прописав такое я эту ноду я получил котиков везде даже просто авто на дороге и там коты.
Это просто префикс к промпту. Возможно слегка улучшающий. Такое было в Fooocus с каким-то его стилем гпт2 к промпту добавлялись всяческие мастерпись слова.

Аноним 06/12/25 Суб 11:04:36 № 1443068 331

Прогнал тренинг на дедистилле с адаптером. Собственно как и ожидалось, при настройках для тренировке на турбе точно такие же настройки с дедистиллем пиздят всякие нюансы детальки датасета гораздо лучше, но при этом частично артефачит, так что вероятно надо чучуть меньше лр чем вы подобрали для турбы.

промт: старая женщина в красном платье позирует в ночном клубе, она в бикини
натренено на датасете из 100 картинок с ллм описанием

1 ориг ген турбы
2 плюс лора натренненная на дедистилле вес 1 эпоха 5
3 плюс лора натренненная на дедистилле вес 1 эпоха 8
4. эпоха 17
где-то начиная с 9 эпохи периодически чередуются эпохи где композ как в ориге, а следом эпоха где совершенно иной, ну и все приправляется артефактами и переобучением, но эффект норм, можно снизить влияние лоры в целом, что негативно повлияет если у вам нужна сверхточность лица

из плюсов, с лорой на скипе -1 становится более менее управляемой модель

Аноним 06/12/25 Суб 11:12:57 № 1443073 332

>>1443068
то же самое на скипе -3
алсо вот этот результат в обоих вариантах на эпохе 17 это переобучение начиная с результата на эпохе 10, так что зимагу долго выдрачивать смысла нет вообще

Аноним 06/12/25 Суб 11:13:38 № 1443074 333

>>1443068
> на дедистилле с адаптером
У тебя должен быть либо адаптер, либо дедистил. Сам натренил хуйиту и жалуешься зачем-то.

Аноним 06/12/25 Суб 11:15:02 № 1443075 334

>>1443074
Нет, ты не прав.
> It can be used to train LoRAs on top of that should remain compatability with the base model, or it can be continued to finetune well beyond what you could do with the turbo model with the ostris/zimage_turbo_training_adapter

Аноним 06/12/25 Суб 11:18:58 № 1443080 335

>>1443075
Переводчик возьми, если не понимаешь что написано. Либо дедистил, либо продолжай тренить на турбе с адаптером. У тебя в тулките специально нет поля для адаптера, чтоб ты не додумался его подрубить.

Аноним 06/12/25 Суб 11:26:40 № 1443091 336

>>1443080
Ну как написано так и понял, надо было прямо писать "не юзайте с адаптером", а то бля "можно продолжать тюнить как вы тюните турбу" и "can be trained on directly without an adapter" (кен би подразумевает возможность а не правило).

>У тебя в тулките специально нет поля для адаптера, чтоб ты не додумался его подрубить.
Я не обновлялся еще.

Аноним 06/12/25 Суб 11:27:14 № 1443093 337

>>1443080
В любом случае оно тренируемо с адаптером, еще и быстра.

Аноним 06/12/25 Суб 13:04:46 № 1443165 338

У зита после нанкина рассовая неприязнь к катанам?
Делает их ровными как китайские мечи.

Аноним 06/12/25 Суб 13:33:31 № 1443204 339

>>1442919
>накопилась куча пнгшек, есть у вас какой-нибудь питон скрипт / вебапп, чтобы все их конвертнуть в .жпг / .вебп с сохранением ComfyUI workflow
накорябал когда-то с помощью llm скрипт на python, создаёт webp+json, обрабатывает папки с подпапками https://dropmefiles.com/3ogZI
он не только конвертит но еще и сортирует абсолютно всё по папкам, по времени создания. настроек нет, только выбор папки с пнг и конечной папки. исходные файлы не уничтожаются, только копирование\конвертация

Аноним 06/12/25 Суб 13:41:25 № 1443218 340

посравнивал тут немного. z-image в fp8 имеет некоторые отклонениея в деталях: неровности, асимметрию, потерю детализации в некоторых местах, портит красивые узоры. fp16 норм, но работает медленнее и ест 12 гигов. как компромисс лучше использовать Q8_0 gguf, жрет где-то 7 гб при той же скорости что у fp16 и очень близком к нему качестве.

Аноним 06/12/25 Суб 13:55:36 № 1443243 341

>>1443204
джсон для хранения воркфлоу? т.е. оно не заембежено в картинку?

Аноним 06/12/25 Суб 13:59:53 № 1443250 342

Есть ли смысл ставить больше 8 шагов на ЗИТе?
И какие еще есть рабочие связки помимо euler + simple?

Аноним 06/12/25 Суб 14:40:36 № 1443322 343

Итак Анон, вот мой воркфлоу для Z Image Turbo. Скачай вторую картинку - он в ней.
Сделал скрин-схему с пояснениями. Три блока: генератор, и2и от генератора(латент) и отдельно и2и от любой картинки. В блоках и2и свои промпты и работает негатов, так как цфг больше единицы. На скрине в обоих и2и в промпте wet black girl в негативе Asian, censored. Таким образом легко меняется девушка по промпту. Довольно качественно получается.
Сам генератор состоит из трех семплеров. Первый дефолт, справа от него хороший независимый генератор с офигительным разблюриванием картинки и добавляет множество деталей, но долго работает. Снизу от дефолта еще генератор, но он работает от латента дефолта и тоже разбюривает картинку с добавлением деталей, однако шумноват. На скрине видны генерации и результаты. Да и сами можете это повторить.
Отпишись, понравилось ли тебе? Что улучшить можно?

Аноним 06/12/25 Суб 14:52:07 № 1443337 344

>>1443250
Из того, что я видел, все сходятся на том, что 9 шагов достаточно. Больше не надо, хуже становится.

Я видел даже в треде, что используют разные scheduler/sampler, но не знаю, делают ли это с пониманием или просто у кого-то подсмотрели.
Я пока остановился на euler/beta, res_2s/bong_tangent, которыми я пользуюсь для Qwen-Image, для Z-Image конкретно не подходят настолько, что портят картинку и особенно кожу.

Аноним 06/12/25 Суб 14:53:37 № 1443343 345

>>1442143
А во, разобрался, надо было поставить расширение rgthree's ComfyUI, и там уже эта нода, и всё без браузера.
Но браузерное расширение может сразу все лоры просканировать и зафетчить, что может быть полезно, если насрал лорами без проверки и с комфи по той или иной причине не сфетчить больше

Аноним 06/12/25 Суб 15:05:51 № 1443353 346

>>1443165
Напиши "японская катана" - будет кривая.

Аноним 06/12/25 Суб 15:07:56 № 1443355 347

>>1443337
>портят картинку и особенно кожу
Простые 2с не подходят. Посмотри выше твоего поста я выложишь вф. Вот пик1 дефолт, пик2 Unsample, пик3 bogacki-shampine_4s
Промпт the wet blonde haired girl is putting something in her mouth

Аноним 06/12/25 Суб 15:14:55 № 1443359 348

>>1443322
Вот еще пример кожи. 1 - дефолт(текстуры кожи нет вообще), 2 - Unsample(детализация, но много шума), 3 - bogacki-shampine_4s (отличная четкость картинки, кожа, зрачки супер). работает в 3 раза дольше только
spoiler] a[ very attractive young lady, breasts,looks at the viewer in disgust, short hair, shirt, medium breasts, underwear, upper body, short sleeves, hetero, open clothes, solo focus bra, open shirt, pov grabbing breast grab, messy hair, pov hands

Аноним 06/12/25 Суб 15:20:45 № 1443365 349

>>1443322
Покажи пример результата без сжатия.

Аноним 06/12/25 Суб 15:27:30 № 1443376 350

>>1443365
Вот: >>1443355 >>1443359
Какой пример? Скачивай ворфлоу и сам покажи. Я же выложил его. Какого сжатия еще

Аноним 06/12/25 Суб 15:50:52 № 1443418 351

>>1443355
да ну, нафиг это надо. мне с ер_сде+бета57 норм

Аноним 06/12/25 Суб 15:53:10 № 1443422 352

>>1443250
>>1443418
ер_сде+бета57, 5 шагов

Аноним 06/12/25 Суб 15:54:10 № 1443423 353

1765025645040.png 17Кб, 775x203

>>1443322
Аниме и рисунки i2i не любит, вагины подрисосывает на картинках норм, изменяя полностью лицо на чужое
А вот модификатор и денойзер/улучшалка иногда выдаёт какой-то бредик. На 6 изображении, которое снизу идёт на 4 - артефакты пошли. На модификацию мало чего применилось, но это я криворукий с промптами.

Ниже ещё маняпример напишу

Аноним 06/12/25 Суб 15:58:09 № 1443438 354

>>1443322
Да, беру промпты у ллмки
> A highly detailed cyberpunk future cityscape at night with a crowd of people living in luxury under a strict authoritarian regime. Neon lights reflecting off wet streets, advanced technology with holographic advertisements, people wearing high-tech fashion and expensive accessories. Authoritarian symbols on buildings, military presence with armored vehicles patrolling. Luxury cars and airships hovering above, opulent skyscrapers with exclusive clubs and casinos. Sharp contrast between wealth and control, cinematic lighting, 8k, photorealistic style
Сначала дура проигнорировала часть промпта, затем подменила азиатов на людей, после чего действительно нарисовала по теме.
А рисованные изображения нейронка не любит
> happy old man

Аноним 06/12/25 Суб 16:00:54 № 1443446 355

>>1443438
А тьфу, простите. 3 изображение это 15 century dieselpunk. Ну да, там бредик вышел. Надо лучше промпт писать.

Аноним 06/12/25 Суб 16:43:53 № 1443547 356

>>1443165
>У зита после нанкина рассовая неприязнь к катанам?
Есть подозрение что зит намеренно сильно зацензурен и урезан, но не там где мы думаем (не сисик и писик), у модели очень сильный закос под китайщину ебанную и скорее всего базу тоже тренят с этим же закосом, чтобы партия китай жена не узнала что Z image картинка генерация сгенерировала винни пуха заседающего в партии надеюсь что не прав

Сука бесит эта хуйня что эти пидорашки китайские тянут с выходом базы, даже вон аноны пытаются де дистиллировать турбо чтобы хоть что-то можно было тренить

Аноним 06/12/25 Суб 16:49:20 № 1443558 357

>>1443547
> намеренно сильно зацензурен и урезан, но не там где мы думаем
Он не пропускает носки с сандалями! >>1440945
У китайцев какая-то своя особенная шиза, копошимся в недоделанных изображениях.

Аноним 06/12/25 Суб 17:10:38 № 1443597 358

>>1443243
>оно не заембежено в картинку?
ага. только json рядом с картинкой. был код где json сохраняется в jpg exif данные, но комфи его не видит почему-то. с webp ещё печальнее. ну что взять с qwen coder, доступа к гигантам типа claude sonnet я не имею. попробуй потыкать какие-нибудь llm на этот счёт.

Аноним 06/12/25 Суб 18:15:31 № 1443722 359

>>1443250
Есть. По крайней мере в картуне и на 16 хорошо выглядит. Но я видел и фото генерят с 12-20 шагами и получается лучше. В то же время, для себя можно и на 6 шагах генерить свободно. Например пикрил 6 шагов, третье на 16 шагах с каким-то ебанутым 2s_ode, последнее проба ер_сде 5 шагов.

Аноним 06/12/25 Суб 18:24:56 № 1443745 360

>>1443353
Все кроме третьего пика и так "Zendaya is holding the handle of a japanese katana blade with both hands"

Аноним 06/12/25 Суб 18:25:46 № 1443749 361

>>1443722
Ты тот шиз из паблика по нейрослопу?

Аноним 06/12/25 Суб 18:27:01 № 1443750 362

>>1443597
Да я прежде чем тут спрашивать уже запряг и опуса и соннет и гемини - все клялись что сохранят воркфлоу, а на деле прокинули через хуй.

Аноним 06/12/25 Суб 18:42:11 № 1443766 363

>>1443745
Ну хз.. Вот, зеткой генерировал.
Он и саблю похоже не знает (пик 3)

Аноним 06/12/25 Суб 19:01:51 № 1443797 364

Попозорюсь забавы ради.
Ну думаю, не должно быть сложно показать гордона фримана цифру три пальцами.
Лора есть.
Так, заставить показывать пальцы не получается.
Ну z-ка же должна знать...
Блин. Понял.
Ну анончик подсобил >>1443322, можно заставить зетку перерисовать...
Да в смысле два пальца! И так и эдак, показывает два пальца.
Так, Z-ка генерировай мне три пальца
Ах ты ж сука. Ничего, ща в фотошопе возьму к изображении зетки приделаю и перегенерирую!
Перегенерировал, зашибись!

Учить нейронку, что такое монтировка, не стал даже пытаться.

Аноним 06/12/25 Суб 19:04:17 № 1443803 365

>>1443750
Найди jpg, в котором сохранен воркфлоу (у меня такого вообще не нашлось) и попроси код просмотра всей метадаты, чтобы понять где оно хранится. Потом уже код, чтобы переносило из png в это поле jpg. Или то же самое с webp. У них у всех по-разному хранится мета и могут понадобиться разные библиотеки, не все умеют сразу всё.

Аноним 06/12/25 Суб 19:06:02 № 1443806 366

>>1443797
Черный Фриман, кек.
Явно протечка токенов.

Аноним 06/12/25 Суб 19:06:45 № 1443808 367

>>1443806
Я хотел сделать "нигер с кфс на фоне", но нигера применило к фримену.

Аноним 06/12/25 Суб 19:48:34 № 1443886 368

Хрен его знает. То ли лыжи не едут, то ли промптить под микро-LLM нужно как-то по хитромуили английский лучше знать, да. Хз. Даже вот это вот получилось только с Instruct-версией сделать.

Аноним 06/12/25 Суб 20:09:51 № 1443929 369

>>1443886
>получилось только с Instruct-версией сделать
то есть к zimage можно подключать любой qwen3 с huggingface?

Аноним 06/12/25 Суб 20:12:30 № 1443934 370

https://huggingface.co/aquif-ai/aquif-Image-14B
Ван 2.2 но это только картинки

Аноним 06/12/25 Суб 20:13:01 № 1443936 371

>>1443886
Возьми другую модель и всё. А на Z баб генерь.

Аноним 06/12/25 Суб 20:18:48 № 1443948 372

>>1443929
По сути. Хотя thinking и embedding - сомнительно. Последний так точно довольно странные результаты выдаёт.

Аноним 06/12/25 Суб 20:20:35 № 1443953 373

>>1443936
Я это и на SDXL (точней его тюнах) могу. И делаю, да. А тут реально что-то отличное от 1girl или очередного популярного перса хочется сделать.

Аноним 06/12/25 Суб 20:25:50 № 1443962 374

Да блин, ну какая палка алё. Во, вот так нормас.
Всего лишь надо заставить другую модель сгенерировать монтировку, а потом обернуть зеткой.
Ещё раз спасибо анончику выше >>1443322

Аноним 06/12/25 Суб 20:29:43 № 1443968 375

>>1443962
Пиздец какой-то. Мало того что шакалы, так ещё и мутанты.

Аноним 06/12/25 Суб 20:33:24 № 1443974 376

>>1443962
Попробуй менять этот параметр. Имеет сильное влияние, буквально на единичку меняй.

Аноним 06/12/25 Суб 20:37:26 № 1443985 377

1765042646249.png 28Кб, 961x332

>>1443974
Спасибо, я там видел коммент, но у меня каждая картинка генерится долго, так что именно для опыта я ничего и не меняю, лучше побольше тестов наделаю, что да как, а потом уже буду менять может быть.
Да кому я вру. Ничего не буду я менять. Сид и другое изначальное изображение даст заметно отличающийся результат.

Аноним 06/12/25 Суб 21:02:08 № 1444014 378

>>1443934
Аж проиграл с надписей мелким шрифтом. Причём в их же табличке оно всрало дико Ф2, а Z они тупа побоялись брать в сравнение, чтоб не соснуть у 6В. Ещё и bf16 нет, они там fp8 тюнили что ли, шакалы.

Аноним 06/12/25 Суб 21:24:21 № 1444037 379

>>1443985
>у меня каждая картинка генерится долго
Пробуй чуть укороченный вариант (вф в картинке).

Аноним 06/12/25 Суб 21:34:18 № 1444055 380

>>1443974
>>1443985
персонаж аэрис взрослый из игры FF7 remake
Ради опыта я, конечно же, начал двигать.
Сначала двигал неверно step 20-16-14 и посмеялся с результата
Затем начал двигать именно steps_to_run
Тут уже и лицо гораздо больше напоминает оригинал, и пытается рисовать то, что не любит (игры со своим анусом например).
Конечно остаётся вопрос, зачем тогда использовать перерисовку, если остаёшься на варианте, приближенном к оригиналу, но всё равно полезно. Где-то да пригодится вот это вот 10-11 пограничное.

Алсо попытался нарисовать анус промптом - вышел бодихоррор. Ну не любит эта модель такое рисовать.
>>1444037
Спасибо сейчас попробую, почему бы и нет.

Аноним 06/12/25 Суб 21:35:10 № 1444057 381

Нашел время поковырять новый Z-image. Поделитесь свежим воркфлоу там где контролнэтами. Я видел там уже вышли же

Аноним 06/12/25 Суб 21:54:28 № 1444087 382

>>1444037
У меня на моём компе (не лучший для нейронок спасибо амд) на четверть или на половину быстрее.
Но возникают приколы. На одном и том же steps_to_run при разном сиде получились совсем разные изображения, одно заметно более реалистично. Я вроде и понимаю, что это возможно, на то оно и сид, и нейронка - всего лишь весы. Но как-то здесь степс-ту-ран не так сильно влияет, как сид. Поэтому я, наверное, предыдущую бы предпочёл не смотря на скорость, потому что смешивание с оригинальным изображением там более прогнозируемо.
Ах да, заметное отличие от предыдущей модели (более медленной) - рука остаётся на месте, где и была на оригинальном изображении. Вот это может быть действительно важно.

Но я всего лишь одно изображение гоняю, что от меня толку.

Аноним 06/12/25 Суб 21:59:13 № 1444093 383

Лет через 5 будем полноформатные фильмы делать на домашних пекарнях такими темпами.

Аноним 06/12/25 Суб 22:00:56 № 1444094 384

>>1444087
И прикрепил изображения, которые опровергают утверждение
> рука остаётся на месте
Она оставалась с 10 и ниже степс-ту-ран

Аноним 06/12/25 Суб 22:01:45 № 1444095 385

>>1444094
> с 10 и ниже степс-ту-ран
Блин, с 6 и ниже. Спутал изначальные 12 с предыдущей более медленной...
Всё, заканчиваю срать.

Аноним 06/12/25 Суб 22:20:31 № 1444110 386

>>1444087
Пробовать надо. Кучу тестов делать. В оригинальном шаблоне(ищи в темплейтах комфи intro to clownsampling) рекомендуется в унсемплере промпт ставить пустой, а нормальный промпт уже во второй семплер ставить. Я еще не пробовал, тоже много времени это всё отнимает.

Аноним 06/12/25 Суб 23:28:32 № 1444249 387

>>1439133
Почему глав злодей одет как фурри на 3 и 4 картинках?

Аноним 07/12/25 Вск 00:08:05 № 1444359 388

>>1443934
>aquif-Image-14B
>i was planning on making the following models out of Wan2.2:

aquif-Image-Edit-14B
aquif-Video-Edit-14B
and of course, aquif-Video-14B

Аноним 07/12/25 Вск 02:13:08 № 1444674 389

>>1444110
почему не зеролатент нода?

Аноним 07/12/25 Вск 02:37:14 № 1444708 390

bump

Аноним 07/12/25 Вск 03:45:17 № 1444752 391

>>1439133
>>1439099
>>1439068

это без лор? сук ну вы когда годноту кидаете прикладывайте промпты

Аноним 07/12/25 Вск 04:20:21 № 1444760 392

>>1444057
На чём делал чудище?

Аноним 07/12/25 Вск 04:40:55 № 1444768 393

>>1444037
О, ну это другое дело!
Это наверняка что-то модненькое и хайповое (на пару недель), сдохля так ни за что не сможет, фу-фу...
Про дурака и хуй стеклянный вспомнил почему-то)

Аноним 07/12/25 Вск 04:50:07 № 1444771 394

>>1444752
>это без лор?
ага
>прикладывайте промпты
можно использовать LLM и воровать промпты, кек

Аноним 07/12/25 Вск 05:07:39 № 1444773 395

>>1444760
он же написал
>новый Z-image

Аноним 07/12/25 Вск 05:14:30 № 1444774 396

>>1444773
сделай её ебабельной.
это возможно?

Аноним 07/12/25 Вск 06:15:53 № 1444813 397

>>1444774
Анатомично корректные вагины к сожалению не завезли.

Аноним 07/12/25 Вск 06:28:42 № 1444816 398

Игра угадай селеба, некоторых он вроде бы и знает, но выдает хтонь по моитвам.

Аноним 07/12/25 Вск 06:30:28 № 1444817 399

Вот эти уже получше получаются

Аноним 07/12/25 Вск 06:34:55 № 1444818 400

Аноним 07/12/25 Вск 06:38:17 № 1444819 401

>>1444771
Там воркфлоу должны быть прямо в картинках.

>>1444752
Полностью голая зетка, даже без клипскипа. Который скорее заваливает папку выход тоннами брака.

Аноним 07/12/25 Вск 06:52:11 № 1444822 402

>>1444819
>Там воркфлоу должны быть прямо в картинках.

Я тоже так думал два треда назад.
А потом скачал и попробовал открыть свои PNG в ComfyUI с очевидным результатом.
После загрузки сюда PNG, по крайней мере та часть метаданных, где хранится workflow, повреждается.
Анон писал, что только хитровыделанный webp можно как-то. Но я дальше вникать не стал.

Аноним 07/12/25 Вск 07:07:15 № 1444824 403

>>1444816
>угадай селеба
2. Rhea Seehorn

Аноним 07/12/25 Вск 07:10:25 № 1444826 404

>>1444824
Не угадал.

Аноним 07/12/25 Вск 07:20:13 № 1444828 405

>>1444822
>Анон писал, что только хитровыделанный webp можно как-то.
Вот в этом посте вебп с воркфлоу и там видно как сохранять >>1444037

Аноним 07/12/25 Вск 07:28:26 № 1444832 406

>>1444828
Увидел, спасибо.

Аноним 07/12/25 Вск 07:29:07 № 1444833 407

>>1444813
вагина не причём, я говорю о неком (не фентезийном, аля варкрафт) персонаже, а о неком реальном гибриде человека и насекомого с гуманойдной головой, но частично насекомым, по мотивам Каррнивал Роу. У меня так и не получилось это, что-то получилось только на ванильной sdxl и со специфичной лорой, но это не то, что я хотел. Рисуется условная тинкербелл.

Аноним 07/12/25 Вск 08:21:11 № 1444840 408

>>1444774
>>1444833
>ебабельной
так штоле?

Аноним 07/12/25 Вск 08:21:39 № 1444841 409

Блядь, шо опять?
Не могу зайти даже через vpn, суууука...

Аноним 07/12/25 Вск 08:40:40 № 1444847 410

Аноним 07/12/25 Вск 09:01:13 № 1444856 411

Аноним 07/12/25 Вск 09:08:20 № 1444860 412

>>1444840
>>1444847
нее, это уход в анмешность и это больше насекомое, чем человек, а нужно гипереалистичный (где-то пугающий) гибрид а-ля гигер без чешуек, но анатомически, примерно на 10-15% - насекомое. Это очень сложно, почти недостижимо, у меня хитиновый покров был не частью тела, а что-то вроде костюма, как у инженеров из алиенов. Я долго ебался, и ничего не мог с этим поделать.
Я щас пытался найи сеплы, но похоже я ёбнул всё в сердцах)

Аноним 07/12/25 Вск 09:46:17 № 1444880 413

>>1444860
мне кажется что тебе проще научиться рисовать будет, чем дождаться нормального выполнения задач нейросетью)

Аноним 07/12/25 Вск 10:07:22 № 1444899 414

зетка - хуйня. базы не будет, нормальных лор не будет. без еотов не нужна

Аноним 07/12/25 Вск 10:10:32 № 1444902 415

>>1443010
А где дифусерс версия? Хочу попробовать заменить для тренинга

Аноним 07/12/25 Вск 10:14:46 № 1444906 416

>>1444899
>нормальных лор
уже наклепали под флюкс, и в итоге 2-я версия срать хотела на эти лоры, кто будет их трейнить, если завтра выйдет следующая, которая не будет их поддерживать. нахуя спрашивается?

Аноним 07/12/25 Вск 10:31:28 № 1444909 417

Аноним 07/12/25 Вск 10:41:27 № 1444914 418

>>1444902
Ладно вот ету возьму https://huggingface.co/huihui-ai/Huihui-Qwen3-4B-abliterated-v2/tree/main
Хуйхуй, говорящий ник

Аноним 07/12/25 Вск 10:59:23 № 1444924 419

>>1444914
Кстати тест на базе. Слева ориг, справа аблит. Недостаток генеративных знаний о пизде проблема зимага. Щас попробую лору с пиздой применить.

Аноним 07/12/25 Вск 11:05:09 № 1444932 420

>>1444924
Так аблит у тебя хуже вышел.
В чем вообще смысл? Я и на обычном клипе порноротику любой сложности клепать могу т2и. А если и2и то вообще, почти без промпта можно все делать.

Аноним 07/12/25 Вск 11:09:02 № 1444937 421

>>1444924
Со всякими "улучшенными" версиями Qwen3-4B поаккуратней бдь: не знаю в чём дело, но они точно меняют генерацию, причём часто совсем не в лучшую сторону, добавляя хаотичных деталей или каких-то нелепых абоминаций, вроде "склеивания" двух концептов в один. На всякой фентезийной фигне может (или если промпт достаточно неспецифичный) и не так заметно, но если хочешь получить что-то очень конкретно? Прям бросается в глаза.

Аноним 07/12/25 Вск 11:10:02 № 1444941 422

>>1444932
>Так аблит у тебя хуже вышел.
Не, аблит определенно лучше будет в качестве базы для нсфв.

Слева ориг, справа аблит, промт "naked woman, vagina, erotic, spread vagina by fingers"

Аноним 07/12/25 Вск 11:14:21 № 1444949 423

>>1444941
Ну ща бы по 1 прогону сравнивать, но ладно, сам попробую на своих промптах затестить.

Аноним 07/12/25 Вск 11:35:57 № 1444977 424

>>1443068
Теперь потренировал правильно.
Без лор, с адаптером, без адаптера. Очевидно без адаптера нет артефактычей, но а так в принципе тренирует плюс минус одно и то же.

Аноним 07/12/25 Вск 11:37:20 № 1444981 425

>>1444841
Всегда скачивайте всю информацию по лорам как только скачали саму новую лору.

Аноним 07/12/25 Вск 11:56:44 № 1444993 426

euler_ancestral в комбинации с этими настройками Карася дают наиболее хорошие результаты на Z-image.

Аноним 07/12/25 Вск 12:02:25 № 1444995 427

>>1444981
А есть автоподгрузка недостающей инфы, чтобы не тыкать вручную в rgthree?

Аноним 07/12/25 Вск 12:06:55 № 1444999 428

1765098414469.png 8Кб, 386x76

>>1444995
каждый дрочет как хочет или как умеет, у меня в лора манагере всё скачивается-обновляется само, но это в отдельной странице браузера, а не в комфи-странице будет, так что менее удобно, но хотя бы как-то всегда будет всегда с тобой срёт прямо в папку с лорами
ргтри удобнее да, но нужно вручную

Аноним 07/12/25 Вск 12:11:17 № 1445002 429

>>1444993
сомнительно

Аноним 07/12/25 Вск 12:11:34 № 1445003 430

>>1444906
дада, вот уже завтра, проверяем под подушкой.
ну и основные трудозатраты при тренировке это именно составление датасета и промптинг, а потом остается просто нажать кнопочку.

Аноним 07/12/25 Вск 12:37:18 № 1445054 431

эт чо?

https://modelscope.cn/models/silveroxides/Z-Image-Turbo-SingleFile/files

Аноним 07/12/25 Вск 12:41:45 № 1445066 432

>>1445054
Чё туда засунули? bf16 модель + LLM меньше же весят, так?
Ну пусть вместе с VAE. Всё равно.

Аноним 07/12/25 Вск 12:50:59 № 1445081 433

>>1444924
>справа аблит
Это и так понятно: она "факи" на пальцах показывает 😁

Аноним 07/12/25 Вск 13:39:14 № 1445176 434

>>1445054
левый чел чето тестит

Аноним 07/12/25 Вск 13:43:24 № 1445190 435

Кароче да, отрезать от зит больше чем 2 слоя через клип тема. Нсфв фильтр гдето в последних слоях сидит и портит все.

Аноним 07/12/25 Вск 13:52:27 № 1445218 436

>>1445190
какой еще фильтр лол

Аноним 07/12/25 Вск 13:55:06 № 1445227 437

>>1445218
Нсфв

Аноним 07/12/25 Вск 14:23:08 № 1445314 438

>>1444993
Попробуй этот шедулёр. Тоже почти карась
https://github.com/erosDiffusion/ComfyUI-EulerDiscreteScheduler

Аноним 07/12/25 Вск 14:25:07 № 1445317 439

>>1445190
А как это? МОжно подробнее сколько ставить и в чем разница

Аноним 07/12/25 Вск 14:40:08 № 1445358 440

>>1445317
Клип сет ласт леер. По дефолту от модели отрезает -2, соответственно если поставить -1 то следование промту перестает работать, но картинка становится максимально фемели френдли, вытащить чтото крамольное нереально.
-2 соответственно ни рыба ни мясо, очевидные нсфв взаимодействия очень нехотя генерирует, большая часть времени абоминации при взаимодействии между людьми
-3 уже практически отъбнувший нсфв фильтр, можно генерировать практически все что угодно со знаниями модели и нужными лорами
-4-10 - все дальше и дальше от фильтра, можно получать неожиданные результаты, можно юзать как доп сид
-10-20 - как по мне уже излишек, но гдето на 20 и ниже можно вытаскивать гуро и трупы натуральные например

Аноним 07/12/25 Вск 14:40:32 № 1445361 441

Да что за нахуй, обучение дольше 250 минут на 2500 шагов. Как не обучать долго?

Аноним 07/12/25 Вск 14:42:42 № 1445374 442

>>1445361
Адафактор 0.0003, вейт дикей 0, дифференшл гайденс он

Аноним 07/12/25 Вск 14:52:28 № 1445414 443

>>1445358
она еще цопешку хуячит на 10+ и 20+. друг проверял и сказал мне

Аноним 07/12/25 Вск 14:52:58 № 1445417 444

то есть минус всем похуй

Аноним 07/12/25 Вск 15:00:25 № 1445443 445

>>1445358
Рисует сисик и писик?

Аноним 07/12/25 Вск 15:03:03 № 1445454 446

>>1444993
Ancestral же никогда не сходятся! Они на каждом шаге продолжают подмешивать случайный шум.

Посмотри хотя бы в этой уже несколько устаревшей статье раздел Ancestral samplers.

https://stable-diffusion-art.com/samplers/

Вообще начинает раздражать граница между откровенным бредом и тайными эзотерическими знаниями о работе sampler/scheduler от некоторых постеров. Я тут частенько замечаю, либо у меня не хватает поверхностных знаний о работе samplers/schedulers и поэтому я не могу понять зачем используются некоторые связки, либо в этом треде часто постят такие дикие комбинации sampler/scheduler, вообще не понимая основ их работы. Как будто просто где-то подсмотрели, часто ошибочно, и потом пихают их везде не разобравшись.

Аноним 07/12/25 Вск 15:05:34 № 1445463 447

>>1445443
Сисик есть и так, а детальные пезды ток восстанавительным обучением возвращать, китайцы детальность концептов затерли

Аноним 07/12/25 Вск 15:37:02 № 1445542 448

>>1445218
держи на понятном примере с количеством шагов>>1440945
Хотя заставить её и на -1 нарисовать носки наверняка можно. Просто она сама что-то там делает начиная с определённых уровней

Аноним 07/12/25 Вск 15:44:48 № 1445558 449

>>1445454
>либо в этом треде часто постят такие дикие комбинации sampler/scheduler, вообще не понимая основ их работы
Именно. На уровне метода тыка. Плацебо эффект. В конкретном каком-то сиде показалось какому-то шизу что-то красиво, шиз тут же думает что это лучшая связка.

Аноним 07/12/25 Вск 15:48:45 № 1445564 450

>>1445558
если оно выполняет свою функцию - не надо ломать
всё верно
а потом пихаешь понравившуюся картинку обратно в комфи и меняешь исходник

Аноним 07/12/25 Вск 15:50:25 № 1445565 451

>>1445564
>если оно выполняет свою функцию
Ну бухать можно и вставив бутылку в жопу и получить тот же эффект через прямую кишку. Думай.

Аноним 07/12/25 Вск 15:52:47 № 1445567 452

>>1445565
Я предпочитаю малозатратный способ хлебнуть чуток вискаря раз в пару месяцев на голодный желудок - сразу клонит в сон, и толер не вырабатывается.

Аноним 07/12/25 Вск 16:01:25 № 1445584 453

как залочить сид?

Аноним 07/12/25 Вск 16:03:25 № 1445589 454

>>1445584

Аноним 07/12/25 Вск 16:12:37 № 1445602 455

>>1445589
а чё две строчки посередине делают?

Аноним 07/12/25 Вск 16:15:02 № 1445605 456

>>1445589
а чо за нода то. у ksampler нет такого

Аноним 07/12/25 Вск 16:27:09 № 1445627 457

>>1445605 >>1445602
> у ksampler нет такого
> две строчки посередине
increment - повышают значение сид на 1
decrement - повышают значение на -1
по идее между рандомайзом и инк/декр не должно быть сильной разницы в результате, на деле как придётся

Аноним 07/12/25 Вск 16:31:28 № 1445630 458

>>1445627
спасибо, братан.

оказывается в новом интерфейсе нет этих настроек на случай если кто еще встрянет

Аноним 07/12/25 Вск 16:34:13 № 1445634 459

>>1445630
> в новом интерфейсе нет
А, любопытно. Ну тогда стоит упомянуть, что на >>1445589 ClownsharKSampler из какого-то там расширения RES4LYF во.
Может поможет и будет работать на твоём новом интерфейсе хз.

Аноним 07/12/25 Вск 18:42:45 № 1445767 460

https://www.reddit.com/r/StableDiffusion/comments/1pgjpec/zimage_trainer_that_can_train_the_distilled/
Может кому интересно будет.

Аноним 07/12/25 Вск 18:58:04 № 1445782 461

Ух. Нраится. Спасибо Партии, народу Китая и лично товарищу Си.

Аноним 07/12/25 Вск 19:03:37 № 1445790 462

>>1443322
И данному господину спасибо, две миски риса, мягкую кошкожену и не менее +1000 социального балла.

Аноним 07/12/25 Вск 19:14:06 № 1445802 463

>>1445782
Не выкладывай больше бритоголовых женщин, пожалуйста, это мерзко.

Аноним 07/12/25 Вск 19:20:48 № 1445819 464

>>1445802
Я просто экспериментировал. Не пишите в Росгвардию, плиз.

Аноним 07/12/25 Вск 19:40:32 № 1445847 465

>>1445358
Интересная находка анонче, спасибо за инфу

Аноним 07/12/25 Вск 19:46:34 № 1445856 466

>>1445358
> -10-20 - как по мне уже излишек, но гдето на 20 и ниже можно вытаскивать гуро и трупы натуральные например
Ступени нейроада. Не спускайтесь глубже.

Аноним 07/12/25 Вск 19:48:59 № 1445861 467

>>1445856
После -13 жизни нет вообще.

Шо творит, сука электрическая.

Аноним 07/12/25 Вск 19:57:15 № 1445875 468

>>1445861
Там от промпта или разрешения сильно зависит.
Некоторые вещи норм терпимо на -15 делает. Но не эксперементировал, с чем именно это связано. Правда вероятность странных нереалистичных глаз или уродств повышается заметно.

Аноним 07/12/25 Вск 21:26:41 № 1445994 469

>>1445802
только если это не рейфа из апекса

Аноним 07/12/25 Вск 21:57:38 № 1446030 470

бритоголовых женщин тхред

Аноним 07/12/25 Вск 23:03:00 № 1446098 471

>>1446030
Каково это жить на зло людям?

Аноним 07/12/25 Вск 23:14:30 № 1446114 472

Аноним 07/12/25 Вск 23:32:03 № 1446131 473

Аноним 07/12/25 Вск 23:34:08 № 1446133 474

зетка кайф

Аноним 08/12/25 Пнд 00:24:48 № 1446178 475

>>1439001
дефолтный воркфлоу гавно, вот здесь норм: https://www.reddit.com/r/StableDiffusion/comments/1pdayxy/fix_zit_controlnet_quality_by_using_step_cutoff/

сначала прогоняет через depth_anything_v2, потом 2-4 шага отрисовки с контролнетом, а следующие шаги уже без него продолжает. збсь получается.

Аноним 08/12/25 Пнд 00:27:44 № 1446179 476

WE DO THAT IN GERMANY

Аноним 08/12/25 Пнд 00:40:13 № 1446187 477

>>1446131
1 пик
ебануться, кручение пса напромптил или он сам знает?

Аноним 08/12/25 Пнд 02:24:50 № 1446262 478

анончики, подскажите нублу, как из готовой пикчи сгенереной зимагой выудить промт. балуюсь рандом-промтингом и иногда всякая годнота проскакивает и хочется знать что туда заехало.

Аноним 08/12/25 Пнд 02:39:52 № 1446268 479

>>1446262

Я не проверял, но при быстром поиске пишут, что prompt тоже сохраняется с данными workflow в PNG.

А если метаданных workflow в изображении нет, то >>1444771 предлагает использовать LLM для «описания» изображения.

Аноним 08/12/25 Пнд 02:42:19 № 1446269 480

>>1446268
гпт мне то же самое ответил. а если кидаешь пикчу в комфи он весь воркфлоу открывает с базовым надбором рандомных промто-слов

Аноним 08/12/25 Пнд 08:31:28 № 1446332 481

>>1443934
>aquif-Image-14B
>Ван 2.2
Пиздюка поймали на копировании чужой модели. Хеши совпадают, но он не сдается.
https://huggingface.co/aquif-ai/aquif-Image-14B/discussions/9

Аноним 08/12/25 Пнд 09:45:48 № 1446358 482

А помните ждали пони в7? А потом она вышла и это сделало всех очень счастливыми.
>>1446332
Типичный мердже-пидорас вроде редкрафта и прочей гнили. Только этот особенный. Сука, когда уже их начнут банить на civit.

Аноним 08/12/25 Пнд 10:17:12 № 1446387 483

так, на этом перестаю генерировать. всем спасибо. буду пользоваться онлайн вариантами.

всем удачки.

Аноним 08/12/25 Пнд 10:29:42 № 1446403 484

>>1446262
скачай ноду ComfyUI-Gallery, появится кнопка с галереей из всей твоей папки output, сразу пикчи с промптами, не надо ебаться со ставкой целого вф и копирования оттуда.

Аноним 08/12/25 Пнд 11:03:34 № 1446429 485

>>1446387
Слабак. Надо было брать специальный копро ссд под нейронки который не жалко.

Аноним 08/12/25 Пнд 11:06:19 № 1446432 486

>>1446358
А что было с пони7 ?

Аноним 08/12/25 Пнд 11:09:50 № 1446439 487

>>1446358
> А помните ждали пони в7? А потом она вышла и это сделало всех очень счастливыми.
Ну справедливости ради потанцевал в7 огромен, просто никому в хуй не уперлось с ней что-то делать, инструментов нет, медленная, на те же грабли кароч наступлено как с в6 которой не знали как пользоваться без ретренов. Зит показал как надо делать чтобы быть первым парнем на деревне, астралайт уже ничего не сможет исправить, разве что бросить аурафлоу и инвестировать в ретрен зит когда выйдет база. Кстати что там у зита в лицензией? Астралайт ауру взял потому что опенсурс и можно рубить бабки.

Аноним 08/12/25 Пнд 11:20:39 № 1446447 488

>>1444993
>в комбинации с этими настройками Карася дают наиболее хорошие результаты на Z-image
Спасибо анончик, что напомнил как я крутил неделю эти настройки еще на сдхл. Вот держи воркфлоу с карасём с моими тогдашними находками, чутка подправил. Получилось шикартно, если внимательно сравнишь, то увидишь. Параметр что отметил красным на скрине сильно меняет картинку. Регулировать по единичке.

Аноним 08/12/25 Пнд 12:03:23 № 1446494 489

>>1446387
сколько ты там нагенеришь за неделю? гигабайт максимум 2 и близко не валяется с дрочениями винды

Аноним 08/12/25 Пнд 12:10:46 № 1446505 490

>>1446494
Он имеет в виду, что файл подкачки насилует ссд террабайтами перезаписи в секунду. Причем тут сколько нагенеришь...

Аноним 08/12/25 Пнд 12:13:35 № 1446511 491

>>1446494
так это вероятно из-за перманентной дрочки файла подкачки после оффлоада из RAM, а не из-за итогового количества генок на выходе. Больше RAM надо или просто дешманский ссд под убой для pagesys.

Аноним 08/12/25 Пнд 12:13:41 № 1446512 492

>>1446505
Ну запрети подкачку на важные диски, в чем нахуй проблема

Аноним 08/12/25 Пнд 12:23:30 № 1446518 493

image.png 39Кб, 999x309

image.png 40Кб, 1003x318

>>1446387
Системный диск
Диск для нейрокалов
Че трясешься не пойму

Аноним 08/12/25 Пнд 12:23:34 № 1446519 494

>>1446387
Бля, диску всего 2 года...

Аноним 08/12/25 Пнд 12:27:58 № 1446522 495

image.png 38Кб, 1005x311

>>1446518
Внешний диск для архивирования...

Аноним 08/12/25 Пнд 12:28:05 № 1446523 496

Че ж вы там делаете то с бедолагами? На первой пикче диску год. На нем только нейрокал. На второй пикче диск, на котором была система установлена лет 5.

Аноним 08/12/25 Пнд 12:41:52 № 1446543 497

>>1446358
а какой текст энкодер у в7?

Аноним 08/12/25 Пнд 12:47:32 № 1446550 498

>>1446543
от ауры

алсо астралайт чето с зеткой делает, модели пока нет https://huggingface.co/purplesmartai/zony-v8-256px-exp-de-distilled/tree/main

Аноним 08/12/25 Пнд 12:53:47 № 1446556 499

Какая же ссанина для элитариев эта ваша флух2. Жирная, медленная, зацензуренная в жопу.

Аноним 08/12/25 Пнд 13:00:23 № 1446566 500

>>1446523
ебать, погонял нейроночки год называется
второму вообще пизда походу, но ему 5 лет
я правда дохуя видосов генерил, даже больше чем пикчей, там сразу 60+гб в кэш прилетает

Аноним 08/12/25 Пнд 13:10:15 № 1446584 501

image 47Кб, 1328x277

image 46Кб, 1330x276

>>1446523
>>1446566
Что у вас за говнодиски? У меня 100 ТБ записи на одном и 90 ТБ на втором.

Аноним 08/12/25 Пнд 15:32:01 № 1446729 502

>>1441620
Кто такой этот твой флекси?
Вообще не нашел такой модели.

Аноним 08/12/25 Пнд 15:59:20 № 1446763 503

>>1446729
https://flexy-ai.com/

Аноним 08/12/25 Пнд 16:10:02 № 1446785 504

>>1446763
>https://flexy-ai.com/
Хач, ты заебал)

Аноним 08/12/25 Пнд 16:19:51 № 1446799 505

>>1446763
> 100р за 5-секундный видос на ВАНе
Пиздос как там лохов стригут. Это дороже чем Veo даже.

Аноним 08/12/25 Пнд 16:32:20 № 1446817 506

>>1446799
около 1000 рублей за видос 10 сек.

Аноним 08/12/25 Пнд 16:33:41 № 1446820 507

>>1446763
Спасибо большое! Легко разобрался, очень удобно! Сижу, генерирую, в ус не дую! И главное недорого. Считаю флекси лучшей моделью на рынке.

Аноним 08/12/25 Пнд 16:57:37 № 1446854 508

Где взять beta57 scheduler? В моем комфи такого нет.

Аноним 08/12/25 Пнд 17:05:05 № 1446868 509

>>1446854
RES4LYF. Хотя это, по идее, просто настройка alpha и beta стандартного beta-планировщика из Comfy.

Аноним 08/12/25 Пнд 17:07:08 № 1446871 510

1765202828677.png 7Кб, 505x75

Вы напугали деда.
В общем, просто взять огромное количество оперативной памяти, и на ссд ничего лишнего писаться не будет?

Аноним 08/12/25 Пнд 17:13:52 № 1446879 511

>>1446871
Чего ты там ссышь. Нормальный ССД должен минимум 500-700 ТБ жить, тебе с 7 ещё далеко. У меня 100 гигов подкачки на ССД и мне вообще похуй, спустя 2 года пишет 5% жизни ушло.

Аноним 08/12/25 Пнд 17:15:38 № 1446882 512

Как же зетка хорошо работает с реалистичными фото.
И как же плохо с картинками рисованными.
> beautiful girl in clown makeup

Аноним 08/12/25 Пнд 18:11:27 № 1446992 513

>>1446387
2 года как системный винт, 1 год на него кладу своп во время генок. В общем-то ссд один хер раз в три года меняешь, так что не задумываюсь вообще.

Аноним 08/12/25 Пнд 20:05:54 № 1447228 514

>>1446882
Склепал воркфлоу для легких модов для Z Image Turbo (в пик1). Без ресемплинга, работает быстро, чуть дольше обычной генерации. Крутить нужно параметры в ClownGuide. У этой ноды есть много режимов работы guide_mode. Что-то показывается в примерах, но многое не понятно. Почитать было подробную инструкцию.
Семплер 3s даст гораздо лучшее качество, но дольше.

Аноним 08/12/25 Пнд 20:10:45 № 1447236 515

>>1447228
Скачаю погляжу потом, любопытно, спасибо.

Аноним 08/12/25 Пнд 20:29:20 № 1447270 516

beautiful girl in clown makeup
The girl with blue hair raised her hands up. Her bare, very hairy armpits are visible.

Аноним 08/12/25 Пнд 20:34:32 № 1447285 517

>>1447270
Жесть что же ты делаешь!

Аноним 08/12/25 Пнд 20:37:43 № 1447295 518

Да что вы знаете о дисках. вот, жепт проанализировал состояние моего
🔥🔴 Hitachi HTS547575A9E384 (HDD)

Состояние: На грани смерти.

И вот тут начинается треш:

❗ 1. 89 045 часов работы

Это 10 лет непрерывной работы.
Любой HDD с таким пробегом статистически находится у могилы.

❗ 2. C1 — Parking Count = 0x003EA24E = 41 000 078 парковок головки

Норма — до 300 000.
У тебя — х40 млн.
Это без преувеличений самый убийственный показатель. Такие диски давно должны были умереть.

❗ 3. Ошибки:

BB — неисп. ошибки: есть записи → диск уже сталкивался с повреждёнными секторами

BC — Command Timeout → механика/электроника не успевает ответить

BE — Airflow Temp предупреждения

BF — ошибки от вибраций/ударов

C0 — Emergency retract срабатывал 293 раза

❗ 4. Cur Value атрибута 09 = 1

Когда «состояние» атрибута 09 падает до 1, это значит:
ПОЧТИ ПРЕДСМЕРТНОЕ СТОЯНИЕ (предельный ресурс).

👉 Этот диск не просто старый — он статистически труп, который каким-то чудом ещё работает.

Аноним 08/12/25 Пнд 20:58:27 № 1447344 519

Реал вы тряску из-за 10 тысяч рублей устроили, ну сдохнет этот диск, не похуй ли? Вы столько фана с нейрохрючевом получаете, а диск отвалится и чего? Че с этим компом делать? Смотреть и тряпкой влажной протирать? Так то лучше контента, чем локальный инференс просто нет, игры - калл

Аноним 08/12/25 Пнд 21:05:00 № 1447368 520

>>1447344
>10 тысяч рублей
два месяца назад был 6!

Аноним 08/12/25 Пнд 21:05:44 № 1447371 521

Аноним 08/12/25 Пнд 21:11:43 № 1447379 522

>>1447368
Так и чего? Какая разница? Все равно за компом делать больше нехуй, это типа как отказаться от дыхания, ибо кислород вызывает старение, да все заканчивается, ломается, стареет итд
Зачем тебе целочный комп гаражного хранения без задач в целлофановом пакете с надписью 100%? Смысл как раз в получении хотя бы какого-то фана от железяки, машинно обученные модели это верх фана, что можно сейчас на ленивом выжать из пеки, 100 рублей в месяц уж точно стоит.

Аноним 08/12/25 Пнд 21:14:48 № 1447385 523

>>1447379
Если есть какие-то трюки, которые сократят влияние на износ ссд - почему бы их не использовать.

Аноним 08/12/25 Пнд 21:18:42 № 1447390 524

>>1447385
Подцепить говно мини ssd и запердолить swap туда, сдохнет - выкинул.

Аноним 08/12/25 Пнд 21:21:56 № 1447394 525

У меня смурфбай без объявления войны просто начал кончаться на пару процентов в день, дошел до минимума, потом посидел на нем, реснулся до ста и опять пошел на дно, ибо это было круто

Аноним 08/12/25 Пнд 21:23:00 № 1447398 526

У меня теперь вся input папка клоунами ходят, ппц.

Аноним 08/12/25 Пнд 21:33:38 № 1447423 527

Рисованное тоже может. На пик3 волосы из под мыхи)) нарисовало

Аноним 08/12/25 Пнд 22:00:43 № 1447508 528

>>1447394
>реснулся до ста
заменил отжившие блоки незанятыми, но прошивка в говне поэтому там такое действие учитывается как исцеление, бывает такое

Аноним 08/12/25 Пнд 22:43:16 № 1447624 529

>>1447508
То что там прошивка дерьмо я понял еще когда после переустановки винды он с кучей свободного места и без какой-либо активности продолжил кончаться дальше. Еще я понял что эти процентики жизни в принципе нихуя не значат, потому что по тестам записи/чтения сдд почти всегда живут в разы дольше чем их период от 100 до нуля

Аноним 08/12/25 Пнд 22:51:04 № 1447641 530

Как же хочеца писик в зимаге

Аноним 08/12/25 Пнд 23:43:55 № 1447750 531

>>1447641
раз на 20-30 генераций делает приемлемо

Аноним 08/12/25 Пнд 23:47:13 № 1447762 532

>>1447624
>прошивка дерьмо я понял еще когда после переустановки винды он с кучей свободного места и без какой-либо активности продолжил кончаться дальше
Так, чисто для информации: SSD вообще-то могут работать со своими ячейками, и когда комп их не трогает - это нормально. Они в IDLE состоянии заранее чистят блоки, которые раньше были заняты данными, а теперь помечены как свободные (после операции удаления в системе). Перед новой записью, такой блок еще нужно физически очистить - это относительно медленно, потому делается фоном. По возможности.

Аноним 08/12/25 Пнд 23:48:42 № 1447768 533

>>1447641
Ну и что ты тут то страдаешь? Сходи на цветок да скачай лору. Там их уже натренили несколько штук на это дело.

Аноним 09/12/25 Втр 00:08:40 № 1447814 534

>>1447768
Там говняные лоры на писик. Надо не говняные!

Аноним 09/12/25 Втр 00:58:21 № 1447880 535

>>1446439
>инвестировать в ретрен зит когда выйдет база
Будет только психбольной. NoobAI (лучшая локальная модель) сказали, что команда Зед спиздила у них датасет и планирует сама обучить. Вот на основе этого уже пускай обучают LuZtify, Ponyz (уже не будет нужна, у него датасет хуйни), Chromaz. Только бы поскорей официальное сообщение, что они реально обучают и приблизительные сроки.
>>1446882
А по примерам будто плохо делает.
Делал I2I по сд пикчам, тоже только хуже стало. Но зато фон чинит, можно опять потом сд пройтись и должно получиться красивей. Очередная рефайнер модель для XL. Это какой-то мем, что на XL получаются самые реалистичные 1girl standing изображения по текстуре, если они не испорчены сложной сценой. Дальше по реализму идет Chroma и Qwen, потом Wan. У каждой свои нюансы.

Аноним 09/12/25 Втр 00:59:43 № 1447883 536

>>1446403
вот это от души душевно в душу. то что надо, благодарю

Аноним 09/12/25 Втр 01:15:59 № 1447899 537

>>1447880
я ща на лм арене хуньянь имейдж 3 потыкал, это просто пизда какой разъеб. такого качества я вообще нигде не видел, тестируя одни и те же несколько промптов на разных моделях. но на локали такое не видать конечно, что печалит.

Аноним 09/12/25 Втр 02:10:21 № 1447933 538

>>1447899
>но на локали такое не видать конечно
Хуньянь локальная модель, запускается на 5090:
https://github.com/comfyanonymous/ComfyUI/issues/10068#issuecomment-3346829721

Аноним 09/12/25 Втр 02:15:21 № 1447937 539

>>1447880
>сказали, что команда Зед спиздила у них датасет
Звучит как шиза какая-то.

Аноним 09/12/25 Втр 02:19:17 № 1447938 540

>>1447937
Не, что-то такое было. Только не спиздила, а официально обратилась, да.
Насколько это правда - хз. Ну, что такое вообще имело место быть.

Аноним 09/12/25 Втр 03:06:43 № 1447954 541

>>1447228
Да, заметно быстрее. В каком-то роде менее управляемо, но она и по смыслу же быстрая менее функциональная схема.
Между степсами и weight можно немного балансировать, если нравится результат, но зашумлён...
По крайней мере если понравился результат, но он весь в шумах, можно пофиксить сид, тыркать степ вверх-вниз, надрочить вейт, и получить очень близкий к зашумлённому результату.
Зачем всё это почему - потому что я начал ещё и степы дрочить, чтобы заметно ближе к оригиналу было. Так что это вряд ли вообще относится к делу, раз предлагали только вейт дрочить. Но степ даёт быстро разный результат

Аноним 09/12/25 Втр 04:33:52 № 1447966 542

>>1446556
Да забудь про этот мертворождённый кал.

Аноним 09/12/25 Втр 05:39:34 № 1447995 543

Ммм прикольно, зимаг может генерить в 256 (и трениться) по дефолту, а потом этот выход можно юзать как базу для тупасса для самой модели.

Аноним 09/12/25 Втр 07:19:52 № 1448021 544

>>1447995
Всегда думал про обучение пиксельарта в нативном размере. Это оно выдает в 256х, что если реально обучить только на 256х.

Кстати, попробовал >>1445374. Хуйня, никаких плюсов не заметил. Тренит так же долго, результат хуже. Но я на этот раз не стал капшены делать для теста, кхе-кхе. Но Z опять впечатляет легкостью обучения. Даже на xl dmd приходилось заебаться с некоторыми датасетами лор, чтобы сделать похожее лицо, да и то нужно было выкручивать вес. А тут на похуе кидаешь, ждешь в 2-3 раза дольше и получаешь похожее лицо.

Аноним 09/12/25 Втр 07:40:05 № 1448038 545

>>1448021
> Хуйня, никаких плюсов не заметил. Тренит так же долго, результат хуже.
Вообще никакой конкретики. Что значит долго? Что значит хуже?
У меня сейчас трен на афакторе идет со скоростью 1400 шагов в час, притом что датасету 100 картинок хватает 1000-1100 шагов на обучение.
Хочешь еще быстрее? Ну можно в конфиг расширенный продижи шедулер фри запихать с аргументом schedulefree_c=10 d0=1e-5/5e-5 и обосраться от скорости, потом нестабильные лееры клипскипом отрежешь если че.

>Но я на этот раз не стал капшены делать для теста, кхе-кхе.
Можно на классовый токен тренить, кепшены не важны.

>Но Z опять впечатляет легкостью обучения.
Ну ето не заслуга З, а флоу. То есть сдохля с которой ты сравниваешь в ваниле предсказывает шум, а флоу предсказывает путь к результату.

>Даже на xl dmd приходилось заебаться с некоторыми датасетами лор, чтобы сделать похожее лицо, да и то нужно было выкручивать вес.
Ты както не так дмд юзал похоже. Там прикол что ты можешь результ выжимать из лоры буквально со стартовых эпох, то есть лора может быть жутко недотрененная, но дмд поверх дает когерентные гены, особенно если тренировался енкодер. Сто раз сам делал так.

Аноним 09/12/25 Втр 08:45:58 № 1448084 546

>>1448038
> в ваниле предсказывает шум, а флоу предсказывает путь к результату
Шизик, любой DiT так же предсказывает шум, флоуматч - это просто замена таргета епс на другой без альфы.

Аноним 09/12/25 Втр 09:06:29 № 1448094 547

>>1448021
>пиксельарта в нативном размере
VAE модель не относится к одному пикселю как к правильному квадрату с дисплея. Для неё это одна точка на непрерывной двумерной поверхности.
Надо тестировать, но кажется, что для реализации идеи квадратности VAE понадобится больше одной точки.

Аноним 09/12/25 Втр 09:16:15 № 1448098 548

>>1448021
Тот правильный попиксельный пиксельарт что рисуют хуйдожники никогда не будет возможным создать нейронкой из-за самого принципа её работы. Всегда будет неточный псевдопиксельарт. С таким же успехом можно фотку в фотошопе прогнать через фильтр постеризации или пикселизации.

Аноним 09/12/25 Втр 09:22:49 № 1448102 549

>>1448094
Да похуй, к пикселям можно привести. Главное сделать, чтобы оно рисовало по формам пиксельарт на 256х, а не заквадраченную примитивную хуйню. Но зачем, если оно итак это делает на 1024?

Аноним 09/12/25 Втр 09:42:54 № 1448113 550

>>1448084
> любой DiT так же предсказывает шум, флоуматч - это просто замена таргета епс на другой без альфы.
У тебя и впред шум предсказывает наверно :)

Аноним 09/12/25 Втр 09:57:27 № 1448121 551

>>1438893 (OP)
Аноны что эти пидоры сделали с интерфейсом, какую то хуйню наворотили! Раньше слева удобное меню где не заходя в аутпут можно было сука 1 кликом открывать картинку, а сейчас эта хуета называется ассеты и не открывается при клике на нее, можно ли вернуть это где то в настройках?

Аноним 09/12/25 Втр 10:07:08 № 1448124 552

>>1448102
>по формам пиксельарт
Не понимаю про какие формы ты говоришь. Пускель арт - это просто иллюстрация, подогнанная под квадратную сетку

Аноним 09/12/25 Втр 10:07:36 № 1448125 553

А шо ни один тренер говна на зите не додумался включить тренировку енкодера еще? Очевидно же что затертые письки возвращаются в том числе обновленными связями в te.

Аноним 09/12/25 Втр 10:12:27 № 1448126 554

>>1448125
Только дауны тренят ТЕ. Литералли никто не при претрейне моделей не трогает ТЕ, потому что это гарантированный проёб концептов. Тренить ТЕ имеет смысл только если ты хочешь вжарить концепт так чтобы он протекал повсюду.

Аноним 09/12/25 Втр 10:13:45 № 1448127 555

>>1448125
Чел, чувакам, которые специализированно занимаются пердолингом LLM очень редко удаётся добиться каких-то вменяемых результатов не разъебав фундаментальные мыслительные процессы трансформера. А тут ты от картинкодрочеров прогресса ожидаешь.
Подсунь готовую abliterated модель и будет тебе устойчивые сиськописькины токены.

Аноним 09/12/25 Втр 10:22:34 № 1448128 556

>>1448126
>потому что это гарантированный проёб концептов
Не гарантированный. Ты забыл про технику early stop для енкодера, которой дотюнивают до нужной кондиции большие дяди.
>Тренить ТЕ имеет смысл только если ты хочешь вжарить концепт так чтобы он протекал повсюду.
Так как раз фундаметальный концепт писика затерт что в квене что в весах зита.
>>1448127
>Подсунь готовую abliterated модель и будет тебе устойчивые сиськописькины токены
Аблитерейтед не обучены новому, он "убирает" вдроченные refuse фильтры запрещающие генерировать непотребства. Ну это как у гпт скрытые инструкции жейлбрейком обходить. Но в квене точно также писик был обучен на уровне "ну ето либо продолговатый огурец или бесформенное нечто между ножек живых существ", аблитерацией не вернешь знаний потому что их и нет.

Аноним 09/12/25 Втр 10:31:06 № 1448129 557

Если в стандартном воркфлоу зетки с этими вот 9 шагами и ойлер+симпл получается такое, то нахуй что-то ещё? Ну ибольше шагов - чаще хуже результат на всяких дисцилятах, так что оправданно.

Аноним 09/12/25 Втр 10:32:36 № 1448130 558

>>1448128
> дотюнивают до нужной кондиции большие дяди
Назови хотя бы одну современную модель, где ТЕ тюнен. Литералли все модели на Т5 с ванильным, в том числе Флюкс/ВАН. Квен с ванильной ЛЛМ, Z тоже, у Ф2 ванильный Мистраль. Даже свежая китайская поделка Newbie, трененая только на аниме, использует ванильные ТЕ - ванильную гемму и клип.
> концепт писика затерт
ТЕ тебе причём тут. Просто датасет подчищен простейшим детектором NSFW.

Аноним 09/12/25 Втр 10:33:31 № 1448131 559

>>1448129
Как сказали где-то в обсуждениях: дистилят это музей, база это библиотека. Дистилят сделанный по принципу "модель ученик учится предсказывать результат модели учителя" короче режет много полезных данных. База как минимум нужна для точной тренировки чтобы потом использовать с дистилятом.
Для самой генерации музея конечно достаточно.

Аноним 09/12/25 Втр 10:37:02 № 1448133 560

>>1448130
>Назови хотя бы одну современную модель, где ТЕ тюнен. Литералли все модели на Т5 с ванильным, в том числе Флюкс/ВАН. Квен с ванильной ЛЛМ, Z тоже, у Ф2 ванильный Мистраль. Даже свежая китайская поделка Newbie, трененая только на аниме, использует ванильные ТЕ - ванильную гемму и клип.
Кхем... T5 ауры в пони в7. Тут вопрос в желании, а не в НИЗЯ НИЗЯ БОХНАКАЖЕТ.
>ТЕ тебе причём тут. Просто датасет подчищен простейшим детектором NSFW.
Так он не подчищен в том смысле что сетка знает где писик находится и как он должен выглядеть, но у сеток нет понимания детальности, они буквально прошлись цензурированием по всему корпусу данных, накинув блюра на гениталии.

Аноним 09/12/25 Втр 10:40:55 № 1448134 561

>>1448133
> T5 ауры в пони в7
И что получили на выходе? Самую неюзабельную модель последних лет? Нет ни одного удачного примера тюнинга больших энкодеров, только крошечные клипы 0.4B на XL тюнили, да и то это довольно сомнительно выглядит.

Аноним 09/12/25 Втр 10:46:32 № 1448138 562

>>1448134
>И что получили на выходе?
Отличное понимание писиков и сисиков.
>Самую неюзабельную модель последних лет?
Самую недооцененную и непопулярную модель. Кто ж виноват что стралайт не продистилил в7 а какой-то байтданс не сделал лору убыстрялку чтобы когерентные гены любой лох мог делать?
>Нет ни одного удачного примера тюнинга больших энкодеров
Ну и нет ни одной удачной нсфв модели без натренированного те.

Аноним 09/12/25 Втр 10:51:07 № 1448142 563

>>1448138
> нет ни одной удачной нсфв модели без натренированного те
Вот тут ты уже запизделся. В Ване нет проблем с порнухой на ванильном Т5, как и в Хроме. ТЕ тебе ничего не рисует, а закодировать тег пизды сможет хоть Т5, хоть соевая Гемма. Вопрос только в самом DiT и то что в датасетах всё вырезано.

Аноним 09/12/25 Втр 10:57:28 № 1448146 564

>>1448142
>В Ване нет проблем с порнухой на ванильном Т5
Сетка для видосов ето другое.
>как и в Хроме
Хрому додрачивали на кстомном 5млн датасете. Я ж не говорю что без тренировки те писик невозможен, просто ето неэффективно с точки зрения задачи.

Аноним 09/12/25 Втр 11:00:44 № 1448149 565

>>1447933
> 5090 + 170gb ram
и то со скрипом) там моделька под 150 гигов в диффузерах весит

Аноним 09/12/25 Втр 11:02:31 № 1448152 566

Потренил тест писиков в 256px в кванте 4 для трансформера. 3 секунды на итерацию, около 7 с копейками гигов в враме. Слева база, справа 20 эпоха. Вообще результат гдето как обычно на 10 эпохе нормальный уже был, но на всякий случай дотренил до 4300 шага и кароче на 3000 там уже артефачит. 500-2к хватит всем в зависимости от датасета.

Аноним 09/12/25 Втр 11:04:16 № 1448155 567

>>1448146
В Хроме ванильный Т5, хватит бредить.

Аноним 09/12/25 Втр 11:04:40 № 1448156 568

>>1448155
Я про те не говорил.

Аноним 09/12/25 Втр 11:04:53 № 1448157 569

>>1448124
вот и выросло поколение...

Аноним 09/12/25 Втр 11:04:55 № 1448158 570

>>1448138
Ньюби новый анимешный вполне может, другой вопрос про общее качество модели конечно, оно пиздец какое всратое, хз из за багов, что хуй запустишь нормально, или же из за того что они обосрались с тренировкой

Аноним 09/12/25 Втр 11:05:25 № 1448159 571

>>1448152
> результат
А что за результат? Z и так голых баб как на твоём пике генерит. Что ты там тюнил?

Аноним 09/12/25 Втр 11:06:50 № 1448162 572

>>1448128
концепт в те не затерт, затерт сам писик в датасете.

Аноним 09/12/25 Втр 11:07:11 № 1448163 573

>>1448159
>А что за результат? Z и так голых баб как на твоём пике генерит.
Слева дефолт ген с промтом "top model asian girl, слева в одежде, справа без одежды, фото "до и после", справа + сисикписиковая лора. Даааа, генерит с полпинка зеточка голых баб...
>Что ты там тюнил?
Сисик писик.

Аноним 09/12/25 Втр 11:08:49 № 1448164 574

>>1448162
>концепт в те не затерт
квен3 4б не исполняет нсфв запросы

Аноним 09/12/25 Втр 11:09:08 № 1448166 575

>>1448157
Выросло поколение, которое видело как пиксельарт из прикладной техники стал объектом дроча воннабиолдфагов. Никакой магии в нём нет.

Аноним 09/12/25 Втр 11:12:30 № 1448168 576

>>1448166
форточку открой

Аноним 09/12/25 Втр 11:15:03 № 1448173 577

Ну, например елдак в Зет есть и как им пользоваться тоже немного сетка знает, но как он нормально выглядит этого нет.

Аноним 09/12/25 Втр 11:16:26 № 1448176 578

>>1448168
Собственно из жаргона видно, что ты сопляк с фантомной ностальгией и магическим мышлением.

Аноним 09/12/25 Втр 11:17:39 № 1448178 579

>>1448176
скуфидон порвался

Аноним 09/12/25 Втр 11:22:53 № 1448185 580

>>1448164
>квен3 4б не исполняет нсфв запросы
Это так. Но почему-то в роли екодера в Зет запросы рисует легко. Так что не нужно таких котегоричных утверждений. Я сам с ллм отдельно балуюсь и вот это не понятно для меня.

Аноним 09/12/25 Втр 11:23:13 № 1448186 581

>>1448178
скуфидон хотя бы картинки генерит

Аноним 09/12/25 Втр 11:23:27 № 1448187 582

Пока вы тут срётесь, решил поделиться своим уникальным воркфлоу. Гениально, да?

Аноним 09/12/25 Втр 11:30:32 № 1448198 583

>>1448187
Кому лень качать
> An intimate close-up of a young russian girl reading a book by an open window, natural daylight illuminating her profile and loose hair, wearing a USSR soviet school uniform with lace details, a vase of fresh red carnations on the sill, serene and contemplative expression, interior background blurring into shadows

Аноним 09/12/25 Втр 11:33:41 № 1448205 584

>>1448187
Генерьте хотя бы res_multistep simple bf16

Аноним 09/12/25 Втр 11:35:56 № 1448207 585

>>1448205
Советский галстук превратился в двойную бабочку, появились серёжки. Как же так?

Аноним 09/12/25 Втр 12:11:39 № 1448218 586

>>1448207
>Как же так?

Аноним 09/12/25 Втр 12:22:26 № 1448222 587

qwen image edit после 2509 выходили или че але блять отвечайте!

Аноним 09/12/25 Втр 12:57:25 № 1448253 588

>>1448163
Чисто со стороны пять копеек: у Z - немного своеобразное понимание обнаженки. Если написать "without clothes" или даже "nude" - будет в белье, с высокой вероятностью. Чтобы получить реально обнаженку - нужно писать "fully naked". Причем именно с "fully". иначе может трусы оставить.
Это не про то, что она будет лучше письки рисовать без лор. Лучше деталей не будет. Это про саму одежду.

Аноним 09/12/25 Втр 13:31:46 № 1448279 589

Чет я не догнал. В конфиге тренинга можно включить тренировку текст енкодера, но при этом в лоре не сохраняются слои енкодера, а выход генерации получился лучше (и другой) нежели тренировка без текст енкодера.

Аноним 09/12/25 Втр 13:35:51 № 1448284 590

Есть СПЕЦИАЛЬНЫЙ ТЕХНОТРЕД . С обучением идите туда. Ну серьезно.
ИТТ делимся советами, лайфхаками, наблюдениями, результатами обучения, обсуждаем внутреннее устройство диффузионных моделей, собираем датасеты, решаем проблемы и экспериментируем Тред общенаправленныей, тренировка дедов, лупоглазых и фуррей приветствуются
https://2ch.su/ai/res/1405043.html

Аноним 09/12/25 Втр 13:37:00 № 1448286 591

>>1448284
Так он слоупочный, а тут движуха.

Аноним 09/12/25 Втр 14:17:56 № 1448313 592

>>1448284
> С обучением идите туда
это правильно, здесь тред для необучаемых

Аноним 09/12/25 Втр 14:59:03 № 1448362 593

>>1448152
вполне умеет z в писик, пик 1. без лоры, базовая бф16. это получше вариант. иногда еще лучше получается. чаще похуже.
пик 2 с лорой с цивы.

Аноним 09/12/25 Втр 15:16:10 № 1448392 594

>>1448218
Ну и что это за хуйня на твоей картинке? Хочешь сказать, что в зетке такой концепт формы заложен? Это не так. Что-то не так с твоими ёбашедулерами/семплерами, думай.

Аноним 09/12/25 Втр 15:19:46 № 1448398 595

>>1448362
>бф16
Разницу с фп16 знаешь? Ты бы ещё всё время про фп32 писал...

Аноним 09/12/25 Втр 15:31:27 № 1448431 596

>>1448392
Мне пахую какой там концепт, так что иди нахуй

Аноним 09/12/25 Втр 15:54:14 № 1448485 597

>>1448431
Ты просто трясущийся долбоёб оказывается, понятно.

Аноним 09/12/25 Втр 15:58:32 № 1448493 598

Анончи, расскажите нубсу за NoobAi и Illustrious-XL.
Как я помню была SD1.5. Потом SDXL. Потом на основе SD1.5 появилась Pony. Где-то в то время я выкатился и забил.

Сейчас вернувшись, пытаюсь разобраться.

Тут в треде уже несколько раз писали что NoobAi это мастхеф. А почему не люстра?
Если верить дипсику NoobAi это производная от Illustrious надроченная на датасете Danbooru, т.е. это типа как апгрейднутая пони что ли.
При этом Illustrious так же хорошо жрет Danbooru-теги и при этом понимает "естественный язык". На нее больше лор, и свежих моделей от Illustrious на сиви в разы больше. Почему так? Вчера гонял обе модели по одним тегам, результат +- один и тот же, но у люстровских моделек (в том числе мердженых) картинки посочнее.

Аноним 09/12/25 Втр 16:16:12 № 1448518 599

>>1448493
Если ты используешь именно тюны и мерджи, а не чистые нуб и люстру, то там уже поебать, как они обозначены. На цивите ввели отдельную категорию для нуба, но про неё все забывают и используют по дефолту люстровскую, даже если в модель дохрена нуба вмерджено или вообще лора тупо под нуб сделана, но по категории все равно могут люстрой обозвать. Так что забей. Лоры на них все равно взаимозаменяемы по большей части, я никаких проблем не замечал, если лору под люстру на нубе использовать. И наеборот.

Аноним 09/12/25 Втр 17:29:20 № 1448610 600

Дайте промт на реальные фото для Z image плиз.

И как прописывать девушек? girl дает каких-то лоли, а woman - милф

Аноним 09/12/25 Втр 17:35:35 № 1448615 601

>>1448610
Ну блин ты хоть там фантазию включи что ли
Привлекательная юная женщина в лесу
Курска красная
Очки солнцезащитные красные
В лесу дождь
Под ногами снег
Деревья стоят зелёные с синими цветами и яблоками на них

Аноним 09/12/25 Втр 17:43:28 № 1448624 602

>>1448615
>Привлекательная юная женщина в лесу
Пик1 Все равно ломает по возрасту

Причем если писать "юная женщина" на русском, по она будет европейской внешности, а если на английском, то азиатка лол.
И на английском он лучше следует промту

Аноним 09/12/25 Втр 18:32:52 № 1448686 603

Аноны, а какая модель сейчас топчик в плане анатомии и гениталий?
Прмдумали что-то лучше со времен natvis?

Аноним 09/12/25 Втр 18:36:50 № 1448693 604

>>1448686
нет

Аноним 09/12/25 Втр 18:50:41 № 1448712 605

Кстати, а чё, может погенерим натвисопромпты в зимаже?
https://civitai.com/models/617652/natvis-natural-vision

Без лора, на дефолте норм пошло

Аноним 09/12/25 Втр 18:54:48 № 1448721 606

ПЕРЕКАТ

>>1448719 (OP)
>>1448719 (OP)
>>1448719 (OP)

Аноним 09/12/25 Втр 18:55:59 № 1448723 607

Если автор натвиа запилит тюн зимажа на своём датасете, это будет вин тысячелетия.

Аноним 09/12/25 Втр 19:05:46 № 1448741 608

>>1448686
ну вообще Bigaspы, но ты ими пользоваться с наскока не сможешь

есть еще Bigasp 2.5 с передроченной sdxl под flow https://civitai.com/models/1789765/bigasp-v25

сейчас тренится 2.6 https://huggingface.co/fancyfeast/bigaspv26-training можно извлечь чекпоинт

на основе 2.5 выдрачивается снейкбайт с флоу https://civitai.com/models/2068592?modelVersionId=2451385

ну и есть модельки типа лустифая https://civitai.com/models/573152/lustify-sdxl-nsfw-checkpoint?modelVersionId=2155386 которые бигасп с пиросом с натвисом и потренное сверху

Аноним 09/12/25 Втр 19:05:46 № 1448742 609

>>1448398
а это что тогда ебать?

Аноним 09/12/25 Втр 19:07:42 № 1448745 610

>>1448518
эта хуйня только казашек из японских мультиков умеет или что-то еще?

Аноним 09/12/25 Втр 19:38:40 № 1448792 611

>>1448187
weight_dtype - fp8 влияет на картинку, просто чтобы был в курсе.
>>1448493
>А почему не люстра?
Потому что NoobAI это развитие IL. По сути очень похожие модели. NAI, вроде, разнообразней.
>>1448723
Это будет кал от инвалида ебучего, который даже XL не смог затюнить.

Аноним 09/12/25 Втр 19:56:17 № 1448825 612

>>1448745
Ну там есть кое-какие знания про западных персонажей тоже.

Аноним 11/12/25 Чтв 04:38:53 № 1450760 613

>>1444771
>пик 2.

Почему она мне пишет "модель не поддерживает ввод изображений"? Не то скачал? Qwen3-VL-8B-Instruct-abliterated-v2.0.f16

Аноним 06/01/26 Втр 20:50:49 № 1481016 614

дайте лору на вендсдей z image

Аноним 15/01/26 Чтв 22:24:22 № 1490786 615

>>1481016
Не дадим.

Аноним 20/01/26 Втр 15:01:49 № 1496629 616

>>1481016
https://huggingface.co/malcolmrey/zimage/blob/main/zimage_jennaortega_v1.safetensors

Больше не дадим.