Stable Diffusion тред X+88 ====================================== Предыдущий тред >>752950 (OP)https://arhivac.top/?tags=13840 ------------------------------------------ схожие тематические треды - NAI-тред (аниме) >>755575 (OP) - технотред >>758561 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Полный функционал в локальной установке (см. ниже)
>>761413 >ниче не высрал Ну тогда лапшу разноцветную жри бля, гомфи-пидар. Я официально отменяю этот гомфи-тред, дрочите на свою лапшу, пидарасы... Отныне 0 генераций в этот тред.
>>761421 Приглашаю всех желающих принять участие в акции: Подари гомфи-шизику хуй их проводов Акция посвящена засилию токсичных гомфи-пидарасов в треде, которые по сути его уничтожили. Превратив некогда процветающий тред в свою шизойдную помойку со своими ебучими проводами. --------------- a huge openwork penis with big head woven from many multi-colored wires ---------------- Можете дополнить промт своими вариантами, погнали...
>>761418 >Наконец-то чпокусоклоун отсюда съебет Да куда он съебет? В технотредах сразу обоссут, в нейрофапе надо уметь в промпт или в инпейнт, в Дали-тредах говном закидают, к Хрусту в дискорд - зашкварно, там флекси стараются полюбить. Смирись, анон, фукусер тут с нами навечно.
>>761579 Анон, если есть время и не затруднит, можешь сделать эти арты (пару достаточно будет) с небольшими запросами? 1. Пики 2.3.4 на твой выбор как срс 2. Цвет волос - светло-русый, но не блондинка. Вот как на пикрилах 3. Без чокера 4. Лицо Скарлет Йохансон. Рефы в пикрилах
Есть одна знакомая по работе - пиздец как похода за вычетов пунктов выше. Если сможешь\аолучится - збс, тонна нефтипродуктов, фуру чая и лучи добра и уважения. Если нет или сложно\долго - вообще не парься, чисто внезапно идея родилась.
Mobius: The Debiased Diffusion Model Revolutionizing Image Generation – Releasing This Week! Мебиус: модель смещенной диффузии, революционизирующая генерацию изображений – выйдет на этой неделе!
сообщается о предстоящем выпуске инновационной модели Mobius, которая является дебазированным диффузионным моделям. Эта модель способна устранять предвзятость в разных областях без дорогостоящей предварительной подготовки, обеспечивая превосходную способность к обобщению в различных стилях и областях. Диффузионные модели, хотя и успешны в генеративных задачах, таких как синтез изображений, часто содержат предвзятость из-за данных обучения, что может ухудшить их производительность. Mobius предлагает новый подход к устранению этих предрассудков без ущерба для универсальности модели.
>>761688 >инновационной модели Mobius >дебазированным диффузионным моделям То есть будет срать рандомом? >Mobius предлагает новый подход к устранению этих предрассудков без ущерба для универсальности модели Ясно-понятно, опять аниме, фурри, хентай и прочее.
>>761688 >обеспечивая превосходную способность к обобщению в различных стилях и областях Мда уж, охуенно дебазировали глаза на 1 пик и овальные часы на 2. И это, прошу заметить - "маркетинговые" черрипики, что ж там будет в реале?
>>761688 Так это просто еще один мердж, пикрил - автор. Адвайсер блядь. Будет такая же хуйня как с его опендалли - мертвое говно, которое никому не всралось кроме 3-м аутистам.
>>761688 Если бы мне просто показали пики с мобиуса, то я подумал бы что это какой-то всратый говномикс. Руки кашей, артефакты, ровного лайна в аниме нет, текст говно, детализация сосёт. Что-то на уровне базовой XL или даже хуже. Вангую это и окажется XL, но с каким-то изъёбистым способом обучения.
a stunning russian blue symmetrical eyeliner adorns the frame of a beautiful birch tree, with its distinctive red lips and freckles contrasting against the golden hues of the petals. The scene is captured in a close-up shot, capturing every intricate detail of the girl's features with glinting eyes, piercing yellow eyes, and a deep red lips that seem to glow in the light. The forest around her is quiet, save for the gentle rustling of leaves in the wind.
the camera zooms in on a stunning white russian cat, wearing a pink dress and a small bowtie. The cat's eyes are closed, and its mouth is open as if a child is playing with it. The scene is set in an old, cozy room, with wooden floors and plush cushions. The scene is bathed in the warm glow of a nearby lamp, casting long shadows across the room.
a close-up shot of a serene lake surrounded by lush green trees. The water is so still that it seems to shimmer and dance in the sunlight. The water is a deep shade of purple, and the leaves rustle gently in the breeze. The scene is bathed in a soft, golden light, creating a peaceful and serene atmosphere.
А если на моей натренированной лоре лица выглядят подобным искаженным неестественным образом, то это недотрен или перетрен? 25 изображений 90 повторов 1 эпоха ÷ батч = 2250 шагов
the camera zooms in on a beautiful girl with curly brown hair and piercing yellow eyes. Her hair is heavy with joy as she walks through a muddy field, blowing through the weeds. She wears a bright yellow shirt that contrasts beautifully against the dark background. She is wearing a black dress with a pink ribbon on it, and she wears a blue tank top with blue shorts and white pants. Her expression is one of concentration and determination as she gazes out into the distance, surrounded by the lush green grass beneath her feet. The image is filled with a sense of peace and joy, as she moves gracefully through the field.
>>761758 эту кашу без существительного, указывающего на объект я даже копировать побрезгую.
Попробуй, блеаль перевести это месиво даже тупым гугл-транслейтом, смотри какая хуйня получается:
Потрясающая русская синяя симметричная подводка для глаз украшает оправу красивой березы с характерными красными губами и веснушками, контрастирующими с золотистыми оттенками лепестков. Сцена запечатлена крупным планом, запечатлевшим каждую замысловатую деталь лица девушки с блестящими, пронзительными желтыми глазами и темно-красными губами, которые, кажется, светятся на свету. В лесу вокруг нее тихо, если не считать тихого шелеста листьев на ветру.
>>761371 (OP) Какая модель хорошо справляется с позами лёжа и сидя верхом? Интересуют фотореалистичные или и модели. photon_v1.safetensors справляется плохо.
>>762118 Сидя верхом на чем? Лежа как именно? Вертикальное фото лежащей бабы с видом на неё сверху тебе любая модель сделает, это примитив. Вот лежащая горизонтально уже СЛОЖНА. Такое Пони только делает более-менее нормально, не без косяков, иногда из-за нестандартного ракурса че-то проебывается, приходится править, но в целом нормально. Версии у Пони всякие есть, и полу-реалистичные, и полу-мультяшные. Если че, речь идет про Пони для SDXL, не для SD 1.5 как твой Фотон.
>>762595 по классике латентное изображение пихают на апскейл + прмиеняют кастомную модель для апскейла на страничке ноды вообще с калтролнетом для тайлов как решение
>>762668 > На реддите читал что он быстрее, но хуже итеративного Так это же вообще другая категория. Итеративный не разбивает на тайлы, и соответственно выполняет совсем другие задачи. Нехуй их сравнивать.
>>762667 спасибо, буду разбираться, выглядит сложновато, но как я понял нужно латент апскейл и тайлед декод/енкод помимо обычного тайлед дифужон использовать
буду дрочиться
>>762669 а можно заставить его тайлами работать чем-то из выше описанного?
>>762671 > заставить его тайлами работать Можно тайловой диффузией, но смысла нет особого. > выглядит сложновато Просто вставляется в модель перед любым KSampler по твоему выбору. Желательно размеры тайлов посчитать сначала. Оверлап оно само не добавляет, поэтому его тоже нужно добавить к размерам тайлов, в отличие от USDU, который под капотом сам увеличиват тайлы на размер tile_padding. 1 - расчет для Tiled Diffusion, например. 2 - для USDU. >>762671 > как я понял нужно латент апскейл Можно латент, а можно обычный, просто подаешь заэнкоденный латент, как с любым img2img. Но с латентом апскейлом нужно больше денойза и без контролнета не обойтись, кроме NNLatentUpscale с низким денойзом.
>>762674 Точно. Совсем забыл про ту ноду, которая тайлы делала, когда еще тайловую диффузию не сделали для комфи. Но её методы разбивки - лютый пиздец и нужно денойзить в 2-4 раза больше, чем того необходимо , и дохуя сэмплеров просто не работает с почти нормальными методами.
>>762698 Ну так-то можно можно хоть дефолтные значения использовать или вручную посчитать. Пики сугубо для наглядности того, как тайловая диффузия и USDU воспринимают размеры тайлов. Например, 1536х1536 пик с 768х768 тайлами и tile_padding/overlap больше 0, USDU разобьет на 4 тайла, а тайловая диффузия на 9 и гарантированно. Кроме времени (4 vs 9 тайлов) есть и другие проблемы с хуево посчитанными размерами. >>762700 > черноту Нет, не из-за рамеров. Показывай воркфлоу.
>>762729 Нет. Наоборот, чем больше тайлов, тем больше проблем. Поэтому для тайловой диффузии нужно учитывать оверлап и добавлять к размерам тайла, чтобы она не разбивала на больше тайлов, чем нужно. >>762725 Попробуй размеры тайлов 640х640 и оверлап 128. Должно получиться 4 тайла. Если всё еще хуйня получается, то проблема в чем-то еще, чего нет на твоих скринах.
>>762744 Нет. Изначальная генерация у тебя 512х512. 2х апскейл даст тебе 1024х1024. 4 тайла по 512х512 плюс оверлап 128, в итоге размеры тайлов в ноде тайловой диффузии должны быть 640х640.
>>762758 Это просто пиздец. И эти люди считают себя комфиэлитой. Но стоит мне запостить скриншот с интересными настройками фокуса, как сразу поднимается вой. Ну, ждём шедевров.
>>762819 Ну это и есть батч сайз для тайлов. Если стоит 1 - оно ебашит их по очереди каждый шаг, если 4 - ебашит все 4 сразу батчем, если у тебя 4 тайла.
>>762825 а нахуя он так делает если в итоге один выдает все равно? или я чето не понимаю? ведь когда обычный батчсайз делаешь он выдает 4 пикчи из которых перебираешь понравившиеся а тут что перебирать, он же картинку даёт в чем прикол?
Анончики, а что сейчас из xl моделей есть, для таких картинок? Всякие фантастические и не очень пейзажи, художественные городские виды, разные художественные стили. Реализм не требуется, голые люди тоже. Сейчас пользуюсь sd15 и crystalClear, через img2img
>>763143 я понял почему он сжирает частичку картинки я нашел этого пидораса кто это делал
прошу обратить внимание на пик1: тот что вае декод (тайлед) делает пик 2 а вот педераст тайлед вае декод стабильно сжирает четверть картинки как на пик3
>>763137 Да вроде любые модели стандартной направленности умеют пейзажи делать, разве с этим есть какие-то проблемы? Самая дефолтная фича. Уж что-что, а виды на природу всегда хорошо получались у нейронок, особенно художественные. Просто бери любую популярную модель с красивостями на пиках, только чтоб она не была задрочена под какую-то одну задачу или специфичный стиль. Тут ошибиться трудно.
>>763021 Как же они заебали, сука, раз в неделю появляется "новая" мокропися, которая "мамой клянемся" улучшит результат, но кода пока нет, демо нет, нихуя нет, пиздуйте читать на архив. И побежали говноютуберы (не все, но большинство) не разобравшись в устройстве и принципе новой мокрописи скорее пилить видосы про " МОКРОПИСЯ КОТОРАЯ МЕНЯЕТ ВСЕ". Другие горе-погромиси бегут скорее писать ноду\расширение\коммит по новой мокрописи, НЕ ЧИТАЯ БЛЯДЬ про параметры и алгоритмы мокрописи. В результате, просто ИванТверь, ( как чуть выше) раъебался полдня (или больше?) чтобы найти причину, почему у него отъебывают тайлы.
Как же заебал форж через 5 генераций начинает генерировать в 2 раза дольше из за утечки врам, как фиксить? сносить не предлагайте, на моем тапочке ток он и идёт
>>763538 Да так и делаю, хуле остаётся, но неудобно и неприятна, что все настройки херятся. Где-то давно советовали галочки в оом ставить и прогонять генерацию, но у меня это нихуя не работает
>>763543 запиши себе в конфиг я народные 512х768 записал себе и заходил крутил, ни о чем не парился
других вариантов нет
сам кстати фордж не юзаю, хотя можно посмотреть что там, ковыряю гомфи шизу, там скорость с автоматиком на моем ведре не сравнится, но не могу теперь апскейлить по человечески
в автоматике все просто и без оомов, а тут пиздец какой-то, но я разберусь, ибо наконец-то заработал айпиадаптер, да и вообще много других штук, которых в автоматике нет
а с нормальным железом я вообще с ума сойду что в гомфи, что в каломатике, буду психовать и генерировать 4к сходу вот да, будет когда нибудь
Что-то лучше адетейлера для лиц не появилось случайно?
Проблема в том, что на всём, что не клоузап проебывается лицо из лоры наверное трабла в том, что она преимущественно на селфи фотках пилилась , адетейлер его типа возвращает, но всё равно намного хуже, чем сама лора на близком расстоянии рисует.
>>763556 > тайлед ваэ пострадал > на мультидиффузию давно хуй забил поэтому Это что-то уровня забить на ipadapter, когда FaceID не работает, как мне кажется. Это же совершенно разные вещи, которые просто в одной репе живут. > До сих пор никто не починил, кек. А там чинить нечего. С --force-fp32 оно работает в комфи, как и с --all-in-fp32 в фордже. Проблема в железе, а не в нежелании мейнтейнера чинить софт. Другое дело, что tiled vae не особо и нужно, т.к. делает почти то же, что и дефолтный VAE Encode/Decode (Tiled), но при этом еще и срет в консоли.
>>763605 А с хуев ли у тебя адетейлер не использует лору лица? Вообще-то он буквально тем же промтом пользуется с лорами и всем прочим (ну или отдельным, если ты специально его написал, но туда тоже лору добавить можно).
Альтернатива - это inpaint only masked с выделением ебала. Иногда это работает гораздо лучше адетейлера, а иногда почему-то сильно хуже, может тебе повезет.
>>761371 (OP) Че-та я не знаю то ли дело в миксах, то ли дело в самой sd1.5, но всегда когда получается достичь красивого стиля + внешность генерируемой тян анатомия всегда идет в пизду. Попытки экспериментировать тоже наказываются ухудшением анатомии. Однажды просто хотел добавил в пропт ", drinking coffee at Starbucks," и это разъебало не только анатомию, но и внешку генерировались всратые азиатки. Определенное сочетание промпта полностью игнорирует токены. Почитайте промпт к пик1 никаких лор btw: + A photo of a young woman, (Mike Mignola, by Tyler Shields:0), (masterpiece, absurdres, best quality), (bokeh), highly detailed, hires, - nsfw, nude, (closeup, up-close, portrait:1.5), (sepia:1.3), saggy tits, large boobs, (monochrome, b&w:0), (oversaturated, glossy:1.1), (cartoon, 3d, 3d render, Photoshop, sketch, sketches, draw, paint, painting, computer graphics, anime, manga, 2d art:0), (canvas frame, signature, username, artist name:1.1)
Определенное сочетание промпта + модели с какого-то хуя генерирует косоглазых, это вообще, блять, я даже не знаю как комментировать. Начинаешь уточнять части тела, пропорции становятся более некрасивыми, особенно соотношение ширины плеч к ширине таза. Позы становятся однотипными. Я уже молчу про эксперименты с ракурсами. Либо генерируй креативные портреты, либо качай обоссанно-желтые копро-реалистичные модели и генерируй желтое однотипное говно.
Это конец для SD 1.5 моделей и для локальных нищуков вроде меня т.к. скорости на SDXL совсем убивают экспериментировать. SD 1.5 это тупо генератор портретов, особенно без костылей вроде контролнета.
>>764023 >больше 75 токенов в позитиве = кал Навскидку не найду, но могу поискать пэйпей исследования, который наглядно доказывает, что при техническом ограничении CLIP в 77 токенов, по факту эффективными являются 20. То есть, при составлении промтов, все что от 21 до 77 токена имеет очень низкую степень влияния на генерацию, а после 77 - это влияние стремится к 0. Увеличение степов и CFG как способ "увеличения понимания длинных промтов", что активно педалировалось в околоСД тусовке - заблуждение уровня лечения онкологии травками.
>>764070 >То есть, при составлении промтов, все что от 21 до 77 токена имеет очень низкую степень влияния на генерацию, а после 77 - это влияние стремится к 0 Значит все таки хач был прав. Тыщи токенов это хуйня, надо обходится 20-30 максимум. Да я и не представляю чё там больше 30 токенов то прописывать?
>>764127 >все таки хач был прав в этом да, но это не его "исследования" как он это преподносил, это легко гуглится по arxiv.org. На радость любителей длинных промтов, вот эти пацаны >>764036 придумали LongCLIP - модель. Это методология обучения на длинных описаниях (они использовели маленький датасет из ShareGPT4V и Urban200к для экспериментов), результат есть, но: - для выпуска полноценной модели LClip нужен сильно больший датасет - даже когда модель будет выпущена, существующие модели нужно будет настолько сильно переобучать, что как мне кажется, экономически будет целесообразнее обучить новые - все это требует колоссальных мощностей и как следствие денег
Так что в ближайшие полгода-год полномасштабного применения Lclip-базированных моделей ждать не стоит.
>>764137 >но это не его "исследования" Да там и исследований особо не надо было, я это просто по генерациям заметил. Типа чем больше токенов, тем они слабее работают.
>>764141 >>764137 сейм от себя могу сказать что промпт "a redhead woman, casual dressed" выдает куда лучше результаты зачастую чем
(masterpiece, 8k, ultradetailed graphic novel style:1.4), a redhead woman, 25yo, smirking, blue jean jacket, grey jeans, fit body, (playful charismatic:1.1), at the park, sunrise, sun rays, dramatic light and shadows, complex background, high detailed, (flat colors, bold lines:1.2), inspired by Pixiv, trending on Pixiv, by Greg Rutkowski, intricate details и прочая лабуда на сдачу
и ненатива достаточно обычно ворст квалити, лов квалити, деформед, блурри
а в комфи есть онлимаскед инпеинт на манер как в автоматике? чтоб большое изображение заинпеинтить руку или глаз там? чтоб он кропнул там где надо и потом вставил и пытался изображение большое перегенерировать?
единственное из похожего нашел кроп&ститч но он как-то странно работает и инпеинтит совсем не то плюс денойз нельзя настроить, только единица
>>762144 >Версии у Пони всякие есть, и полу-реалистичные, и полу-мультяшные. Попробовал Пони. Качество генерации хорошее, но некоторые LoRA не работают с SDXL, жаль.
кто будет пытаться тоже воспользоваться таким методом: вам нужен будет simple detector segs, controlnet openpose (hands: enabled), а потом уже detailer с накинутымт на него моделями и прочим
>>764183 > аналога inpaint original там нет Пикрелейтед.
>>764152 > денойз нельзя настроить, только единица >>764183 > cut by mask/paste by mask делает то что я хочу Есть Set Latent Noise Mask нода, потом в ксэмплере любой денойз по вкусу можно ставить, если тебе detailer не нравится.
Мимо, точно не я, как раз для текстовых все есть и там как надо с этим. Да проблема ее только с моделями (но их не нашёл), что старая карта приказала жить во время скачка сети, пока использую старую и онлайн штуки
>>764227 setlatentnoisemask не сработает там нужен выход из латетного изображения а допустим в cutByMask вход только изображения в том числе маски через maskToImage
то есть даже если я енкодирую большое изображение - дальше его пускать некуда, а ксемплер не прожует целиком
>>764244 ну тут только колаб (еще была какая-то тема с удаленной пекой на вкплей, я решил вкатиться, хоть сдохлю потрогать, купив 6 часов - сервис отъебнул на время или чето случилось, хз в общем, в сессию зашел а комп не поднимался, мб наебали хз) суть в том что все качалось и устанавливалось там за секунды, всякие модели 6ти гиговые и прочее
Это теги, в них могут быть зашиты определенные наборы токенов при создании модели, как стиль например. Для простоты понимания - представь, что теги это лоры. Так понятнее?
>>764419 Что лоры на жопу абу существуют я не сомневаюсь, я имел в виду, что не существует хаба, который мог бы в шапке или гайде из шапки присутствовать например конфоблядство какое нибудь не в счёт
Качнул датасет скрапинга миджорниевского дискорда, где бот генерит по запросу. Какой же там пиздец в промтах, глаза вытекают. Обычным людям надо прям предварительно преподавать, как писать промты.
>In a picturesque setting, bathed in the golden rays of the setting sun, an elegant African American couple stood side by side, radiating regal grace and confidence. They were framed by a stunning pink Lamborghini, a symbol of luxury and sophistication. The sleek car gleamed under the warm light, its glossy surface reflecting the couple's impeccable style. Adorned in exquisite attire, the woman wore a flowing gown that cascaded like a waterfall of satin, adorned with delicate lace and shimmering sequins. Her hair was intricately styled, with a crown of white roses nestled among her curls, accentuating her beauty with a touch of ethereal charm. The man, dressed in a tailored suit that hugged his frame perfectly, exuded an air of quiet strength and refinement. A white rose boutonniere adorned his lapel, mirroring the floral elegance of the scene. As they stood there, their gazes met with unwavering love and mutual admiration, creating an undeniable connection that transcended the mere trappings of the luxurious setting. This high concept photoshoot captured the essence of their unity, symbolized by the overflowing pink and white roses cascading from the Lamborghini, representing their shared love and the abundant beauty that surrounded them. In this moment frozen in time, the couple's presence and undeniable chemistry created a breathtaking tableau, a testament to their majestic love and the power of capturing timeless moments. hyperrealistic, vaporwave, lofi retro vibes, Betsey Johnson floral Christian Louboutin high-concept editorial photoshoot, by Matsumoto Taiyo, by irakli nadar, riches and luxury, hyper detailed
Это один промт, без их модификаторов типа --ar 1:2 --s 1000 --c 50 --v 5.1 Учитесь, епта
>real life black beautiful Disney princess, fairytale, before a magnificent Disney-esque castle, shimmered in vibrant shades of pink, reminiscent of cotton candy spun into magical proportions. Its walls were adorned with sparkling jewels, glimmering in the sunlight like a thousand stars, while fluttering banners in pastel hues danced in the gentle breeze. whiplash curves, curvaceous simplicity, feminine body, Photorealist, 4k resolution, motion blur, fx, 8k, photorealistic, hyper - realistic, cinematic photo, epic composition, color grading, unreal engine, hdr, octane render, depth of field, hyper - detailed, intricate details, lens flare, Shot on RED DIGITAL CINEMA V - RAPTOR XL 8K VV Cinema Camera, f/ 11, Shutter Speed 1/ 800, 70mm lens, raw, cinematic scene, epic composition, super resolution, tone mapping, ray tracing, FKAA, TXAA, RTX, SSAO, cgi, vfx, sfx, Megapixels
Оказца для комфе есть не дискретные ноды тцд, и они ебашут получше в разы чем дискретка с симплом и юниформой. Ну и быстро конечно также, 8 степов 4 сек все дела. Для нестандартных семплеров ток понижать по цфг надо, либо аутцфг хуярить чтобы пережарок не было. Гамма есличе работает так - больше шагов - больше гамма.
>>764397 >скор теги это несколько другое, считай это калцептами, они не считаются >>764415 >Это теги, в них могут быть зашиты определенные наборы токенов В этих тегах 22 токена, и модель вполне способна переварить их и ещё кучу других тегов. Ежу понятно что чем больше текста, тем меньше каждый конкретный токен будет влиять на результат. Но в целом, несложно заметить что теги после 77-го токена вполне могут иметь влияние. Тем более после 20-го.
>>764505 Поняхи, поясните скуфу, вот какую вещь: нахуя создателем модели делались эти теги, если под рандомной пони-моделью в галерее на каждой сгенеренной пикче промт такого вида: score_9, score_8_up, score_7_up, san, 1girl, full body, squatting, solo, short hair, brown hair, gray eyes, headband, face paint, earrings, white sleeveless top, navy under dress, arm cuffs, fur headdress, fur cape, light-skinned female, female focus, looking at viewer, smiling, forest То есть из уникального набора тегов используются только score_ и san а вся остальная простыня добивается "старыми" токенами SD ( + еще пару тройку лор напорачивают). Зачеи тогда учить\смотреть в теги из таблицы? Я не понимаю. Или дайте линк где по нормальному, человеческим языком написано, в чам уникальность Pony (кроме глубочайшего знания мира фури).
>>764664 У неё глубочайшее знание не только мира фурри, но и вообще любого rule 34 контента. Она легко рисует сцены секса в самых разных позах, всевозможные фетиши, знает огромное число персонажей из аниме и игр прямо из коробки. С пониманием одежды и особенностей тела (в основном женского) она тоже лучше справляется.
А инфа из таблицы вообще не предназначена для использования, это та часть модели, которую автор специально попытался СКРЫТЬ. Если бы он этого не сделал по каким-то своим причинам, то мы могли бы просто вписать в промт имя автора и получить пикчу в его стиле. А так анонам приходится самим наугад искать зашифрованные тэги из наборов букв. Таблица это тупо народное творчество, список разгаданных и не совсем шифров, которыми аноны между собой делятся.
>>764787 > cfg 1.5, steps 8 Если у тебя там хупер/лайтниг какой-нибудь, то это слишком дохуя шагов. Ну сэмплер/планировщик есть смысл другие попробовать.
>>764664 У большинства пони-миксов эта шняга уже есть внутри, используй их, а не саму пони. На циви можешь отфильтровать поиск по моделям и посмотреть на результаты, и на количество скачиваний с учётом времени. Не усложняй себе жизнь, и не пытайся понравиться местным пиздаболам, они пустышки, кроме как пиздаболить они нуя не могут, делай как проще, и как тебе больше нравится.
>>764813 Откою тебе страшную тайну, большинство моделей сделаны китайцами, которые очень херово знают английский, и зачастую даже если ты пишешь слово неправильно сетка это проглатывает, подставляя близкое значение из своего всратого словаря, и зачастую ты даже не знаешь об этом. Также и сдесь, ты пишешь незнакомое слово, а sd пытается его интерпретировать как знакомое, отсюда и большинство непонятное и странностей.
>>764822 >ну сд не корнями слов работает, а токенами На разных уровнях оно работает и с тем и с другим. Это не чатгпт конечно, но какието "мозги" у CLIPа тоже есть, что бы хоть какойто смысл текста ловить.
>>761371 (OP) Подскажите,если я установлю SD на свой слабый комп и попробую сгенерировать что-то,то что произойдёт? 1.ПК сгорит? 2.Просто будет долгая генерация? Прикрепляю спеки своего пк.
>>761371 (OP) И еще хотел спросить NSFW генерация онлайн все ещё возможна? В старых тредах упоминался гугл коллаб. Сейчас там по ссылке говорят все умерло.
>>764983 Я даж на более хуевой карте генерю, lol. В целом пока нихуя не произошло кроме того, что это пиздец как долго. А так она греется даже меньше чем за игрульками. Хотя у тебя трабла в том, что это амуде и на него вроде как ниче облегченного типа форжа, благодаря которому я в принципе могу запустить стейбл не завезли, но это не точно. Хотя у меня вообще 2гб vram, а у тебя 4, поэтому можешь и автоматик для амуде затестить
У меня рандомно сгенерились картинки, где половина лица такая, половина другая. В промте ничего про это не было, но там промт тупо рандом, на это пох. Мне понравилось и стало интересно, а можно ли такого эффекта достичь намеренно. Оказывается, да, можно. Причем просто промтом, нейронки это понимают, на удивление. Промт, например, такой:
face divided in half, half woman, half cat
Разумеется, эта фича не всесильная, она очень хрупкая. Если начать что-то в деталях описывать, то все проебывается, черты протекают на обе половины, вот даже тут с котом видны проблемы. Иногда только с попытки пятой выходит что надо, иногда не выходит вообще. Понятно, короче, что для полноценного контроля половинок нужно че-то дополнительно использовать, какой-нибудь региональный промтер или типа того. Но мне все равно показалось занимательным, что нейронка в принципе такую фичу понимает.
>>765101 > понимает Иногда мне кажется, что она понимает гораздо больше, чем принято считать и я сру в штаны, а потом забиваю хуй, ведь так даже интереснее
>>764588 Если модель распознает токен, то нулевой вес никогда не нулевой, а особенно плотные ембеды с нулевым весом вообще не игнорируются. Пик1 убраны теги с нулевым весом, но только в негативе. Пик2 убраны все теги с нулевым весом.
>>761371 (OP) Подскажите, а можно ли на fooocus установить controlnet как на automatic111? Потому img to img без него очень слабый, мне нравится как перерисовывает фокус, но не могу добиться нужных мне изменений, получается одна ерунда, если честно.
Может кто-то ставил controlnet на fooocus, ссылочку можете дать?
>>765272 Жаль, все же я уже хоть немного начал понимать как работает controlnet на automatic111. >>765276 Спасибо, но сейчас не запущен - вся память виртуалками съедена. В целом желание у меня одно, поиграть с canny и openpose - дать больше вариативности, но если у controlnet там были ползунки, то в fooocus настроек нет кроме "Developer Debug Mode". Но я честно говоря не знаю, что это, как раз думал погуглить или потыкать его палочкой, чтобы посмотреть - будет ли разница в итоговом результате, хаха.
>>765286 Не удивлюсь, если такие шлемы в действительности существуют. Конечно, можно задаться вопросом - зачем, но раз они есть у сварщиков и мотоциклистов, то почему бы им не быть и у аквалангистов.
>>765229 шедулер, семплер и сигма нойзы это формулы которые собирают тебе из латента говняк, очевидно что все три штуки можно улучшать по точности практически бесконечно математически, а анцестральные семплеры так скажем слегка устарели сами по себе
кстати о сигма нойзе, есть вот такие ноды https://github.com/Extraltodeus/sigmas_tools_and_the_golden_scheduler которые позволяют стакать кучи сигм между собой (и можно там еще кастом формулу прописать отдельно), а чем шире value/index граф сигма нойза и круче график во времени в зависимости от степа, тем более консистентный результат получается без артефактов пережарки и прочего, что важно для малого количества шагов то есть условно AYS имеет вот такой график пик1 но если мы возьмем 8 сигм разных и соединим их, то получим пик2 казалось бы, по сути только валуе увеличилось, но вот промт cute girl, jeans, cyberpunk, night city - пик3 дефолт AYS, пик4 стак сигм
>>765332 можно мультиплицировать AYS в два раза чтобы консист увеличить, тогда получим выходное изображение похожее на вариант в из прошлого поста, но на том же сиде не получится показать различия особые, потому что сид уже был определен до этого
если мы возьмем фибоначчи как сигму, то при малом велью и менее крутой курве пик2 у нас на тех же настройках будет жопка по качеству
кароче надо стремится строить граф сигманойза с высоким валуе и примерно вот такое как на пик4 чтобы быстрее достигало нуля, тогда можно юзать мало шагов и получать консист и качество одновременно, собственно разные семплеры и шедулеры это и делают по разному
>>765355 касательно euler dy и euler a - пик1 еулер ди, пик2 еулер а кажется что консистетны обе, но тут модифицрованная сигма, на базовой там тня почему-то уже сидит но стоит добавить больше концептов и прописать скажем alien, 1970s style, waterfall, то получается пик3 эйлер ди, пик4 эйлер а - с нихуя появиляется кофикап (блидинг из токена 1970s) и тня теперь уж точно сидит и это на мод сигмах, что достаточно сильно бустит возможности эйлера а кароче хз понятно обиснил в чем суть или нет
>>765576 >12 Ну только если надумаешь потренировать лору для сдхл попердолиться слегка придется, а в остальном все заебок. Это пиздатый вариант, лучше чем у многих в треде.
>>765600 Ну все верно, как раз вписываешься в озвученные
>up to 3x faster AI performance >The new optimizations are specifically targeted at a range of LLMs (Large Language Models) that power the latest Generative AI experiences. Using the latest R555 drivers, NVIDIA's RTX GPUs and AI PC platforms now offer up to 3x faster AI performance with ONNX Runtime (ORT) and DirectML.
Аноны, которые юзают FaceID, подскажите, это норм или у меня препроцессоров не хватает? Прост смотрю гайды и там другие препроцессоры, но гайды довольно древние и может автор чет изменил, не могу понять нихуа кароче, помогите плис
Не был в треде почти год. Поясните за нововведения. SDXL уже юзабельна? Refiner нужон? Что за наркомания с лайтинг, турбо версиями, какими-то ускоренными лорами, с числом шагов в 2-5 и CFG Scale чуть ли не в единичку? SD3 будет соевым говном или базой?
>>766119 >SDXL уже юзабельна Да >Refiner нужон Нет >Что за наркомания с лайтинг, турбо версиями, какими-то ускоренными лорами, с числом шагов в 2-5 и CFG Scale чуть ли не в единичку Все не хотят ждать, все хотят сразу: кнопка нажал=картинка хуяк и уже.
Концептуально - ничего не поменялось, контролнеты по-прежнему решают все проблемы и недостатки и SD и SDXL. Как и год назад, при публикации инфы о новой гейм-чейнджерной мокрописи, все бегут пересаживаться на нее, черпая ложками и прося добавки. Разница только в том, что год назадмокрописи появлялись раз в месяц, а сейчас - каждый день.
>>766126 Окей, спасибо за быстрый ликбез. Хотя все эти ускорения явно требуют более подробного разжёвывания, но это бы в шапку. А по промтам, мастерписи с бэдхандами всё ещё в ходу?
>>766134 >А по промтам, мастерписи с бэдхандами всё ещё в ходу? ну пока отмены от Стабилити не было, если привычка есть - грех не пользоваться. Шустрые и молодые клали болт на промтописание, сейчас у них: - в IMG2IMG всех направлений промт пишут роботы (ноды с CLIP\BLIP\LLaVA\, расшилерия в А1111 и тд). Им просто скармливают картинку и промт готов. - в почете автоматическая сегментация всего на свете (люди, лица, одежда, объекты, цвета и тд). Подключаешь сообветствующую модель через расширение или ноду и оно само все от всего отделяет, делая маску и передавая ее дальше - Руки, еблы, ноги, сиси и писи правятся по такому же принципу ( определяестся цель и автоматом исправляется, тоже модель через расширение\ноды)
Сообщество фурри запилило свою модель на архитектуре XL, обучив с 0 и повырезав нахуй не нужные 3Д токены, не забыв наебашить своих фуррячно-анимешных. В итоге - 90% использования - 2-2.5Д порнуха в самх недостижимых до этой модели сочетаниях. Натренирована на это отменно.
Называется PONYXL (или сокращают до РXL). Актуальная версия - 6 + 25 тонн различных лор к этому типу моделей. Запускается везде, но надо учить промты и качать совместимые лоры. Если попадутся промты, содержащие токены (теги) score_9, score_8 и т.д - это оттуда.
А, да, чуть не забыл, Хачатур теперь барыжит своим !уникальным !неповторимым и !самым охуенным генератором "собственной разработки" - Flexy. Доступен только в его дискорде и только за деньги. По факту - очередная делиба-полторашка с редхэдвуменами, которые генерятся даже на токен person.
Вобщем, выписывай на листочек незнакомые названия модных нонче мокропись и гугли, ИТТ, несомненно, тебе помогут, спрашивай, если попадешь в сети когнитивного диссонанса. Тут тебе всегда помогут.
>>766142 >Руки, еблы, ноги, сиси и писи правятся по такому же принципу И как, правится? Оно же как я понимаю по технологии инпейнта работает. Когда я пробовал руки/ноги инпейнтить, в 90% случаев становилось только хуже. >Сообщество фурри запилило свою модель на архитектуре XL, обучив с 0 Lil, вот же упорные ублюдки. Сколько они бабла на это слили, не известно? >Хачатур теперь барыжит Ожидаемо и предсказуемо.
hk отъебнул чет, не сразу догадался про зеркало лол, кто сейм?
>>766134 >А по промтам, мастерписи с бэдхандами всё ещё в ходу? нет, это полторашкоговно по части мастерпись и на полторашке не требовалось никогда вместе с бутербродными негативами, а теперь вообще что на полторахе что на сдхл решают мокрописи
>>766119 >Что за наркомания с лайтинг, турбо версиями дистиллят сдхл чтобы генерировать в мало шагов, модели на ориджине условной турбы крайне редко тренируют, потому что есть лоры данных функций, которые просто подключаются к базовой сдхл, то есть вот есть ориджин pdxl, на странице загрузки можешь найти турбоверсию и турбо+дпо, так вот обе это просто смердженная pdxl с одноименными лорами
в одном из прошлых тредисов был краткий обзор всех вариаций моделек на данный момент с кратким коментом
>какими-то ускоренными лорами загибай пальцы: турбо, лцм, лайтнинг, tcd, hyper, dpo из мост юзефул очевидная турба, лайтнинг, тцд и хупер тцд больше надрочен на работу с собственным tcd шедулером лцм залупа без деталей и для одного лцм семплера по сути, дпо это лорка для повышения качества через выборку человеческих предпочтений качества
помимо этого есть куча новых семплеров и столько же шедулеров, но большинство из них недоступны на каломатиках, так что если надо чето свежее - путь только в комфи
>с числом шагов в 2-5 это еще что, есть реализация 1 шага на тцд, но оно не сказал бы что очень стабильно по дефолту
>CFG Scale чуть ли не в единичку? не чуть ли, а прямо на единичке можно и генерить спокойно, там негативы еще не работают (а им как раз, они нинужны) а еще есть вариант генерации на 0 цфг, но это чисто прикол на раз без какого-либо следования промту
>>766167 >И как, правится? конечно, шизы дрочащие на качество и апскейлы условно без адетайлера для ебальников не сидят например >Оно же как я понимаю по технологии инпейнта работает. Когда я пробовал руки/ноги инпейнтить, в 90% случаев становилось только хуже. там спец модели натренированные под конкретную задачу и контролнеты различные >Сколько они бабла на это слили, не известно? они? это один челик сделал, у него три штуки A100 + три месяца обучения + сколько-то времени подготовка датасета и параметров обучения до этого
>>766177 поразительная консистенция просто, я на голой сдхл не мог что-то внятное получить чтобы ядерный удар получался с приколами сюжетными, тут с первого раза всё как надо genius scientist watching on nuclear strike explosion, cyberpunk style
>>766185 >three mature old females in latex suits, full body studio photo ну и чтобы закрепить, меняем трех баб на пять баб, что импосибру при обычных условиях и без смены сида особенно
>>766178 >вопрос ток насколько ллм моделька нсфв блокед Она ж локальная. Минут через 20 сделаю префил, а так всегда можно взломать жопу через контрольные вектора или промыть мозги через зануление соевых весов.
>>766199 ну элловская ллм модель тоже локальная, но она сильно почищена от использования нсфв токенов что аж приходится через спецноду прописывать клип токены на нсфв отдельно и качество трансформера падает по итогу
>>766199 хотя в принципе тут не чистый т5, я закинул в нее nude pornstar, а она начала там регионы мутить нормально, так что получается просто оперирует любым текстом без разницы каким
>>766208 Я про локальную установку. Увы, модель лупится, бесконечно перечисляя теги сейфити, если залить в неё префил. Думаю дальше, быстрый хак не прокатил.
>>766206 Взломал я анус этой модели. Чуда не случилось, если модель говно и не умеет рисовать пёзды, то текстовая LLM ей никак не поможет. Не знаю, нужен кому код или нет, оно только локально будет работать без цензуры.
>>766237 И так понятно что если модель не может в пизду то не получится. А там точно у ллм цензура? Как ты понял? А так да давай гайд как взламывать жопу, или сразу готовую можешь выложить на случай когда релизнут ноды для комфе.
>>766256 >А там точно у ллм цензура? Как ты понял? По надписи "Я не могу делать изображение, которое...". Короче вот правки кода, там табы полетели, разберётесь короче сами, в сорсе они должны быть. https://rentry.co/n88tfcip
>>766175 СоG-агенты LLaVa моделей для безруких девочек? Некоторых китайских Ког-агентов даже в демо-онлайн режиме хватает за глаза, чтобы распарсить любую пикчу до формата промта вида "скопировал-вставил-урчишь". Особо вертлявые вообще тупо ебашут в MJ а потом результат крутят в IP-адаптере. Фукусник как всегда прослоупочил все полимеры и сделал "киллерфичу", которой пользуются уже с полгода как.
>>766281 >16 шагов Соревнование, кто сделает меньше шагов, уже завершено - один-шаг лора давно вышла, теперь начинается кто больше? Ждём лоры "ускорения" на 20 и 24 шага.
Сасиб, дядя китаец, подрочил, блядь, с утречка в субботу Анон, писа за хак цензуры!!!111 Интересно, слишком затратно будет дообучить их llm-ки расширенным пакетом nsfw токенов?
Какого хуя никто ещё не додумолся скрестить стабледефуз с каким то Valve SFM? или даже просто фильтр пострендер для блендера, когда нейронка дорисовывает в реализм и как мне кажется сегодня это всё можно на изи в 25 фпс сделать.
>>766315 Нейронки поверх видосов постоянно накладывают с переменным успехом, до этого додумались первым же делом. Но это пока работает не так круто, как тебе хотелось бы. По крайней мере в доступным простым людям методах.
>>766315 В новой версии VaM, которую уже полтора года все никак высрать не могут, обещают такое сделать. Каких мощностей это потребует тоже непонятно, ведь там нет рендера, всё идёт в реалтайме.
>>766255 >>766259 Бля. Похоже я поспешил с выводами. fp32 версии по ссылке с цивиты у меня вообще нихуя не применяются. Щас проверил fp16 с хагфейса - такую же хуйню выдает, как хуперы. И что характерно, ошибки в консоли с fp32 версией посыпались только, когда AutoCFG убрал. Оно просто мимо проходило. 1 - 12 шагов без лоры, 2 - 12 шагов с 8step normalcfg pcm.
>>766340 если бы только понимал, какую хуйню сейчас высрал.
>китаец дает модельку 1 - файнтюн Dolphin 2 - файнтюн Llama 3 3 - файнтюн Phi 3 Если для тебя это магия, то оттюнить одну из этих ЛЛМ способен даже олигофрен, способный зарегистрироваться на ХФ и назать кнопку Train.
>>используйте троллейбус из хлеба как шизы которые полгода ебутся Никакого хлеба. Все замечательно работает в 1 интерфейсе, только в отличае от китайца, еще можно как сорс пикчу запинуть, а не только текст.
>>766345 >уи оттюнь модельку >уи регионал промтинг надо просто ручками все покрасить и тож самое уи чем ты недоволен что сделали за тебя и еще автоматизировали? реально тролейбус из хлеба предлагаешь
>>766175 >визуального >изображений >виртуального Аааэээ, а вот я поставил это всё локально. А как оно генерирует-то? На какой модели? Там что-то качалось в сонсольке, много гиг. Модель-то какая?
>>766371 хупер, пцм лоуцфг, пцм норма цфг все на 7 цфг, 15 шагов, без автоцфг, кастом сигма хупер всегда был "волосатым" по качеству, так что я теперь на пцм пересяду очевидно
>>766333 Ну вот охуенная тема, если так дальше пойдёт, история повториться, как в нулевых когда шейдеры появились и начали чудеса творить, так и щас такие нейронки могу стать новыми шейдерами, накладываться на простые формы и всё анимировать, дорисовывать.
>>766365 > я хз че у тебя не так А у меня вот такая хуйня, только раза в 4 длиннее. Я вообще уже два года в ахуе, что так дохуя всего без проблем работает. Где-то краем видел, что в rocm6.2 вернут поддержку navi10, может в современном торче заработает, если не напиздели про поддержку.
Аноны, хелп не работает автоматик кгф, ничего не пишет в консоль, никаких ошибок, просто вешает комфи и нужно перезагружать батник, висит в бесконечной генерации
Там же белом по черному написано: >supporting me on Patreon to keep the magic going!
Сколько раз Queue Prompt нажимал, сознавайся? Хватит уже васяно-сборки с вишмастерами качать хуй пойми откуда. Поставь ванильную с офрепы, дальше сам все что нужно добавляй.
>>766396 > на дефолтных фп16 У меня --force-fp32 в запуске. Или ты про то, что все модели на цивите в fp16 и оно из-за этого срет? Как и с хупером, lowcfg вариант ведет себя нормально.
>>766424 >такое естественно никогда не будет работать оно работает, суть не в этом, это простая фибоначчи сигма суть в том чтобы тустеп заработал, а он не работает на дефолтных сигмах из-за высокго валуе, вот например обычный юниформ сигма на пик 3, первые две кастом фибо без и с делителем на 5 ну вот куда ты лезешь, если не понимаешь как сигмы работают?
>>766463 амуде проблемами сру в основном я последние три треда та ошибка из консоли вообще не относится к автоматик кфг, она порой просто возникает, но ни на что не влияет, как на пикриле например, где не было автоматик кфг
>>766481 Нет, конечно. Чукча не читатель. Но один хуй странно, что lowcfg нормально держит 3.5, а normalcfg - нихуя.
>>766479 dreamscape film still from 80s b-movie full shot, young woman in light leather armor and hipster glasses riding on a combat raccoon, gorgeous sunrise clouds over the flower field in the background . faded 35mm film, desaturated, Ektachrome, stained, soft glare, cold colors, film grain, highly detailed . surreal, ethereal, dreamy, mysterious, fantasy, highly detailed negative: realistic, concrete, ordinary, mundane, blurry, over saturation, bad exposition, blown out, washed out, high key, overexposed, highlight clipping, high exposure, cartoon, cgi, render, illustration, painting, drawing
>>766490 >Сигмы не должны быть линейные. Те въебать? Там нелинейные сигмы были. И кто тебе сказал что сигмы не могут быть линейными? Они вообще зигзагообразными могут быть, так один из рескейлов работает. А вот пик тебе линейная сигма (xsigmax+ysigmin)/tau
>>766502 >Нет, конечно У тебя какой семплер стоит, м? А у китайса какой написан? >Use DDIM or Euler instead of LCM for sampling! Там даже жирненьким выделено, чтобы внимание привлекать
Дальше: А можешь, всего один разочек, поотключать все остальные мокрописи в флоу, оставив только модель, pcm и апсейлер (но его тоже бы отъебнуть для чистоты) и прогнать промт (который пиздец) с негативом?
>>766508 Конечно ты можешь выебать кучу шагов, которые твоё говно нормально выведут в ноль. Только не жалуйся потом что приходится сидеть с вдвое большим количеством шагов от нормальных.
dreamy full shot, young woman, light leather armor, hipster glasses, riding on a combat raccoon, gorgeous sunrise clouds, flower field at background, from 80s b-movie style, faded 35mm film, desaturated, Ektachrome, soft glare, cold colors, film grain, highly detailed, surreal, ethereal, mysterious, fantasy
>>766367 >>766373 Показываю для комнатных икспердов. На полу: справа мусор, слева посуда. Хотя в промпте такого нет. То есть это регионал промптер с чуть разными промптами на пол. И на трав в лесу тоже. Ровно посередине кадра по вертикали. Так что не надо затирать тут, что норм. Так получилось просто.
>>766533 Отключил единственную мокрописю. Поставил DDIM сэмплер и ddim_uniform (пик1) или smg_uniform (пик2) планировщик и даже без стилей с негативами (пик3). Такая же хуйня на 3.5 CFG, только теперь еще хуже. Собственно с cfg хуперами такая же история была.
>>767046 Если ты хочешь, чтобы эти тяночки не просто стояли (или сидели), а ещё делали всякие вещи, раздвигали ноги и булки, показывали дырки, а может даже больше, то тут вариант один - это PDXL, Pony Diffusion. Хотя про один вариант я спиздел, у этой модели сотни разных вариантов с разной степенью анимешности и реалистичности. Заходишь на цивитай, делаешь вот такие фильтры в списке моделей и выбираешь, что больше визуально нравится.
>>766237 Доехал до дома, поковырялся с этим. ВЗЛАМЫВАТЬ НИЧЕГО НЕ НАДО НАДО RTFM
>3.The `omost-llama-3-8b` and `omost-phi-3-mini-128k` are trained with filtered safe data without NSFW or inappropriate contents. >4. The `omost-dolphin-2.9-llama3-8b` is trained with all data WITHOUT any filtering
То есть, тем, кто качнул - поставил локально: 1. Топаем в папку проекта на своей Пекаренке и ручками правим конфиг в этом файле : gradio_app.py (пик1), а именно:
- стираем решетку перед названием dolfin-модели - ставим решетку пере названием lllyasviel/omost-llama-3-8b-4bits - прожимем сохранить
2. Скачиваем omost-dolphin-2.9-llama3-8b если не скачалась автоматом после сохранения правок в папку с моделями 3. Урчим.
Более того, phi- модель получилась кривожопой, сам китаец пишет:
>The 128k context length of `omost-phi-3-mini-128k` cannot be trusted. The performance of it will degrade a lot after the tokens reach about 8k.
Костылек для Пони-энжоеров:
The `tags` is designed as a possible replacement for the `description` since many diffusion models prefer tags. If used with anime models, one may hard code some logics to replace all "girl" to "1girl". If used with Pony then probably always hard code adding "score_9, score_8 ..." to this.
>>767115 >RealPLKSR И прям лучше чем nearest?) ,Я почему спрашиваю, эти геймчейнджеры, и прочие имбы каждую неделю новые, я какое-то время отслеживал, но на поверку это всё оказывалось расхайпованым говном, и поэтому я забил, и поэтому всякий раз, когда кто-то носится как с писаной торбой с очередной имбой, просто игнорю это как белый шум)
>>767135 >и прочие имбы каждую неделю новые, я какое-то время отслеживал месяца три так, до этого не было такого, хз как ты могу устать от того что только разогналось >но на поверку это всё оказывалось расхайпованым говном и тут ты такой с примерами я вот могу сказать что процентов 80 так или иначе теперь дефолт для использования, например до хупера ток лайтнинг и турбо год были, но хупер не идеален, а вот пцм вчерашний еще ближе к идеалу убыстрялки инференса
или допустим PAG, охуенная мокропися которую все по дефолту суют теперь чтобы гайденс в небеса улетал, а папер по пагу два месяца назад корейским университетом каких-то залуп и самсунговскими сверхчеловеками сделан
>>767157 >https://pixeldrain.com/u/u14j5sVB Вот это пиздлявый сайт, я на него впервые в жизни зашел, а он мне затирает, что я уже сегодня выкачал лимит на 5гб, поэтому должен срочно проапгрейдить аккаунт.
>>766295 >Интересно, слишком затратно будет дообучить их llm-ки расширенным пакетом nsfw токенов? Там 8B, так что в принципе должно хватать 4090. >>766315 Стабильная диффузия нихуя не стабильная, так что увы, ждём прогресса. >>767125 >omost-dolphin-2.9-llama3-8b >WITHOUT any filtering Не, префил всё равно надёжнее, у меня порой такие запросы, что у самых ебанутых тюнов включается режим ассистента. Вот я любитель поебаться на ровном месте.
>>767115 Неплохо, особенно учитывая неебическую скорость. Но, как и многие другие апскейлеры, видит в зерне паттерны и сильно увеличивает шанс получить garbage in, garbage out на ксэмплере после апскейла.
>>766175 Ваще непонятно, зачем это, когда можно масками раскидывать любой кондишенинг. Да и работает очень так себе, когда промптил двух разных персов в сцене, их токены перемешивались в 100% генераций.
>>767407 c с полгода назад, юзернэйм с реддита реверс-инженерил апсейлер магнифая (на тот момент, благодаря хайпу все ссались с него кипятком). Стоила подписка овердохуя,и, поэтому огранизовалось микросообщество "Magnifake". Больше 3 месяцев ушло на декомпозицию процесса апсейла. По итогу выяснили: - без добавления латентного шума детали при апскейле от 1.5 кратности рубятся в кашу и артефачат - качественный апскейл возможен только тайловым методом - без дополнительных модификаторов (Лоры на тот момент) качественный, детализированный апскейл невозможен, добавленный латентный шум должен кто-то обрабатывать, чито модель на таком микроуровне неработоспособна - для удачного апсейла в парадигме IMG2IMG clip и blip работают плохо при требованиях к скорости обработки пикчи, в релаксед режиме вполне себе
Подобрали лоры для энгансмента при апскейле: SDXL - Render 2.0, SD - add_detail, заебашили воркфлоу размером с футбольное поле, который отрабатывал только на 3090\4090 так как жрал 20 гб VRAM.
Единственное, что не разгадали - методику расчета количества добавления шума, коэфф оверлапа тайлинга и зависимость применения силы лор на основе каких-то входных параметров.
Потом на реддит прибежали пидоры из Магнифая и посты частично были снесены модераторами.Тусовка переехала в Дискорд, где и сидит до сих пор.
Занятно, теперь у меня три варианта генерации. Как я понял там дпп 2м каррас. 1 Дефолт. 2 >>767125 3 >>766261 Vintage 90's anime style. cluttered truck interior, fem truck driver, by Hajime Sorayama and Greg Tocchini, Virgil Finlay, sci-fi, colors, neon lights, line art
>>767577 У меня аж пися закаменела на качество и детализацию >Как я понял там дпп 2м каррас Совершенно верно, пикрил кода. Никто не мешает влезть в lib_omost/pipeline.py ручками и потестить другие сэмплеры
>>767125 >>767622 Осталось только припилить в код и Градио: - выбор языковой модели из папки с моделями - выбор XL модели из папки с моделями - выбор сэмплера, размера, степов и батча
Получится годный автоматик\форж\ на минималках. Хотя не, фукус получится )
> The `tags` is designed as a possible replacement for the `description` since many diffusion models prefer tags. If used with anime models, one may hard code some logics to replace all "girl" to "1girl". If used with Pony then probably always hard code adding "score_9, score_8 ..." to this.
>>768075 Как будто кто-то в курсе что ты имеешь в виду под фотореализмом блять, учитывая что фотореалистичный моделей до пизды, а мокрописек для фотореализма еще больше
>>768075 >Пол года прошло и нихуя развития нет. Фотореализм так и остался на уровне годовалой 1.5 Ты посмотри на него, развития он не видит. Козиночке неприятно?
>>768099 >Ты посмотри на него, развития он не видит. Козиночке неприятно? Может ты в своем сознании настолько преисполнился что стругаешь подобные пики на раз два, но я особо прогресса не заметил.
>>768085 >Как будто кто-то в курсе что ты имеешь в виду под фотореализмом Вот если взять фото куна на яхте, то у меня сыпятся все модели. Ну и клозапы ебучие, нужно танцевать с canny и openpose что бы более менее нормальную позу получилось сделать
>>768139 да пиздос, сам в шоке. БЕЗ мокрописей размером в футбольное поле и лапши. Промт - буквально, 16 слов + негатив столько же. Все повторяется, анон. В далеком 2022-м SD развился только брагодаря анимешникам, 95% того, что есть сейчас в полторашке так или иначе выросло из *mix и NAI. С XL такая же хуйня - ванильку релизнули еще хуй знает когда, так и катали говно по рту. Пришли фури - сделали годноту за 3 месяца. Если что, ни аниме, ни фурятиной не интересуюсь
>>768139 >кожу И, да, они умеют потеть, рисовать натуральный glossy skin. Но, заслуги анимешников в этом всем не вижу в упор. Все перечисленное вообще никак не укладывается в их приоритеты, любая детальность и реальзм это харам для них. Просто на каком-то этапе было проще поменять базовый датасет, нежели без конца добивать уже и так распухший старый.
>>768099 Но ведь действительно, с развитием всё довольно херовасто, этот стиль можно с натяжкой назвать синематик, но только не реалистик, многие понавтыкали в свои миксы Лору вспышки которая даёт псевдо-обьёмk, но даже это зачастую не спасает, и ты моментально выпаливаешь sd. Из глаз человек видит все по другому, там нет ни гламура, так и нарочитой депрессухи.
>>768207 И причем тут вообще сд. Фотографии и видео тоже не передают тебе буквально как человек видит из глаз. Они передают как видит линза камеры нах.
>>768223 Вот, и я о том-же. В дата-сетах очень мало обычных фоток на обыкновенный смартфон, просто случайных снимков на бытовую тему, без какой-либо претензии на т.н. фото-искусство. Пихать туда теги расхайпованных фото-бездельников это большая ошибка, все их "работы" без исключения - прямая противоположность спонтанности. Это как правило две крайности, или гламурный гламур, или журнал мангум с распидарашенными кишкми.
>>767579 >>768275 На миксах клип-скип работает, правда чем глубже копаешь, тем меньше слушается промта. Впрочем, как и у обычных моделей. Если, допустим стоит затычка на китайские ёбла, то уже на 4-м они вылазят наружу. Если честно, я не вижу где это может быть полезным.
>>768334 Вроде как по количеству параметров данная модель значительно меньше, чем sdxl, но и архитектура другая используется, к сожалению подробностей в отношении системных требований нет. В коментах представитель stability упомянул, что это одна из 4х моделей, всего запланировано (1b, 2b, 4b, 8b). 8б по словам того же чела пока лоб в лоб порой отсасывает 2б, по этому будут тренить дальше. Пишут так же, что модель будет хорошо поддаваться файнтюну. Короче любопытно.
> Вот если взять фото куна на яхте, то у меня сыпятся все модели. Ну и клозапы ебучие, нужно танцевать с canny и openpose что бы более менее нормальную позу получилось сделать Как говорится показывай весь пайплайн а потом лови мочу ртом. Вангую ты просто вообще не бум бум в сд.
>>768343 У сдхл вообще два клипа, и принцип работы другой. Если эта настройка работает - то либо у тебя загружена сд1-2 модель, либо ты меняешь что-то другое, например слышал в фукусе клипскип это не то что в автоматике и комфи.
Вопрос понииёбам:
Аноним05/06/24 Срд 08:20:28№770936521
Есть-ли лора для сабжа, которая могла-бы очень (((сильно ржать)))? Весы на улыбку, смех, открытый рот:1.3 не дают должного результата, всё какие-то улыбочки, ухмылочки, а вот что-бы прям в голосяндру, это не... Как здесь например: https://civitai.com/models/227077/maniacal-laughter-sliders-ntcaixyz Это для SDXL, на поняху она не действует.