Stable Diffusion Flux тред X+103 ====================================== Предыдущий тред >>839194 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожие тематические треды - аниме-тред >>832282 (OP) - технотред >>758561 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Полный функционал в локальной установке (см. ниже)
⚠️ Стандартные модели stable diffusion от Stability AI значительно отстают по качеству от кастомных моделей (см. civitai ниже). 🆕 Flux - новая модель от бывших разработчиков SD, пока запускается только на ComfyUI (инструкция ниже в примерах workflow).
>>841196 → Это одну карту, а тебе чтобы полноценную модель уровня флух с возможностями условной пони за 3 месяца натренить надо 12 карт a100. Ебало свое представил?
>>841238 >12 карт a100 и 2500 часов непрерывной аренды считаем 2 умн 12 умн 2500 = 60к баксов за фул ретрен, и это без тестовых прогонов чтобы понять как это говно себя ведет при тренинге и какие настройки нужны кароч изи 100к баксов за фул ретрен флуксокала который 99% коммунити не запустит даже
>>841240 Файнтюн знаешь что такое? Это ебануть эстетику 1000 картинок поверх базы. Нахуя оно надо? Хочешь мощную модель уровня поней - тренируй с нуля.
Короче блять, щеглы. Завалили свои ебальники, вы всё равно нихуя не трените. Оставьте это дядям которые хоть что-то понимают, а сами юзайте. Рекомендую уже сейчас разбираться в тонкостях аренды ГПУ, если хотя бы бушной 3090 нет.
>>841244 >А пони по-твоему с нуля были обучены, да бля Да. >Не на основе SDXL, а прям с нуля модель сделали? Сдхл это архитектура, берешь и делаешь модель с нуля на своем датасете со своим клипом и дифузерами. Именно поэтому пони не контачится ни с контролнетами базы сдхл, ни с лорами, ни с классическми смешиванием с базовым сдхл, а только через dare. Пони это не файнтюн, это полноценная бейз модель фром скреч.
Промт одинаковый. Почему флюкс обосрался во всем хз.
A magnificent drawing with the title "Thank you, to all, my friends" the captivating charcoal drawing on white paper, inspired bythe distinctive style of Émile Vernon, featuring a pretty 10-year-old girl with light brown hair with a single long braid, blue eyes and a warm smile making a heart with her hands and a black cat on the floor with a "Papy" necklace. She wears a beautiful white dress in floral fabric, she is in front of a floral Provençal farm. She is with a 3-year-old blond boy with brown eyes, shorts and a green T-shirt. An (old) grandfather behind with a white Panama hat, pocket shorts and a dark green T-shirt marked "Papy", he has short and gray hair, blue eyes and wears glasses, and is very smiling. The signature at the bottom "Pat Papy" The rich colors and textures of the painting and brush strokes create an immersive experience, transporting viewers to the comforting world of art., painting, photo, illustration, typography
>>841249 Это как с Lightning, на SDXL он тоже делал реалистичные модели охуеннее. А так хз, в тексте и в сложных композициях должен быть хуже, но я пока по композициям не заметил (иногда прогоняю промпт, который не получается на dev, но разницы сильнее чем от смены сида не заметил).
>>841252 Хотя бы потому что мусор вместо промпта. Мало того что ошибки в словах, так ещё и какой-то мусор без смысла, в конце вообще перешёл на рандомные слова как из бредогенератора.
Пчел, это английский язык называется. Но да, сложно с первого раза понять...
Вот гуглом для тебя перевел. Попробуй просто учебник языка в следующий раз открыть.
>Великолепный рисунок под названием «Спасибо всем, моим друзьям» — пленительный рисунок углем на белой бумаге, вдохновленный самобытным стилем Эмиля Вернона, изображающий симпатичную 10-летнюю девочку со светло-каштановыми волосами с одной длинной косой, голубыми глазами и теплой улыбкой, делающую сердце руками, и черную кошку на полу с ожерельем «Papy». На ней красивое белое платье из цветочной ткани, она стоит перед цветочной провансальской фермой. Она с 3-летним светловолосым мальчиком с карими глазами, в шортах и зеленой футболке. (Старый) дедушка сзади в белой панаме, карманных шортах и темно-зеленой футболке с надписью «Papy», у него короткие седые волосы, голубые глаза, он носит очки и очень улыбается. Подпись внизу: «Пэт Папи». Богатые цвета и текстуры картины, а также мазки кисти создают захватывающий опыт, перенося зрителей в уютный мир искусства., живопись, фотография, иллюстрация, типографика
>>841268 >пленительный рисунок углем на белой бумаге, вдохновленный самобытным >Богатые цвета и текстуры картины, а также мазки кисти создают захватывающий опыт, перенося зрителей в уютный мир искусства Нейросеть, таблы от цифрового высера. >>841270 >T5 не LLM Лол, это именно ллм.
>>841261 Не совсем. Хз как объяснить. Может и да. Одежда обычно блестит как пластик на складках, будто синтетический блеск, кожа не пластик, но объёмная, граничит с реализмом и 3д рендером.
>>841289 Сравнивать с идеограмом надо flux pro версию. Она по качеству сильно выше и когерентней чем dev/schnell. Но я думаю идеограм всё равно выиграет за счёт более разнообразного датасета, и буквы у него чуть меньше сыплются.
Ну как там флюкс? Уже оказывается не только сиськи и соски показывать не умеет, НЕ ТОЛЬКО НЮХАТЬ ТРУСЫ НЕ МОЖЕТ, выясняется что и бананы на молнии расстёгивать не может.
ввод с идеограма. там люди не заморачиваются, берут промт у чатагпт. потому что моделька их понимает с полуслова.
уж извини.
The image shows a banana that has been partially unzipped, revealing the white flesh inside. This is a surreal and artistic image,likely created through photo manipulation or sculpture : Elements: Banana: A common fruit, often associated with humor, simplicity, and nutrition. Zipper: A mechanical element used for fastening, implying a sense of opening, revealing, or access. * Juxtaposition: The combination of the natural (banana) and the artificial (zipper) creates a surprising and thought-provoking image. Artistic Technique: The image is likely created through photo manipulation or potentially through sculpting and painting. The smooth texture of the banana and the realistic depiction of the zipper suggest a high level of skill and attention to detail. Overall Impression: The image is visually striking and memorable, prompting the viewer to consider the relationship between nature and artifice, the hidden layers beneath the surface, and the power of unexpected juxtapositions. It's a piece that invites multiple interpretations and leaves a lasting impression. ,surreal ,3d rendering
>>841312 > мусорный промпт из LLM Уж извини, результат ты получишь соответствующий. Идеограм может как-то его рефайнит, чтоб дурачки типа тебя могли писать поток мыслей.
>>841320 Старый рофл, тут вроде уже писали, но в AuraFlow 0.1 эта картинка кота с maybe not safe выходила на рандомные генерации, т.к. "исследователи" не удосужились даже самую базовую чистку датасета провести
Ещё вопрос по ComfyUI - есть ли какое-то расширение, чтобы у вкладки была иконка, которая бы менялась в зависимости от того, генерирует ли или уже сгенерена картинка?
>>841331 Это кстати был Flux Pro: >A photo of a banana. The banana is standing on the table. The banana has a zipper that has been partially unzipped, revealing the banana's flesh.
1-2 fluxpro 3-4 ideogram product photography of banana. The banana is standing on the table. The banana has a zipper that has been partially unzipped, revealing the banana's flesh.
Оп-па, у них оказывается у Pro версии есть prompt upsampling (это как в dalle, когда нейронка автоматически ввод улучшает) в их апишке, но в Replicate пока нет... Или replicate всегда включает? интересно...
Аноны, а если в комфи сразу генерить в 2048х2048, качество страдает? Потому что слышал, что тренят модели на 1024х1024, флюкс тоже? Лучше сначала в 1024х1024, а потом апскейлить через фооокус?
>>841359 >понимать Флюкс понимает промт лучше всех доступных сд моделей, но сравнивать его с дали, мижорни и идеограмом нет смысла. Закрытые сетки всегда будут лучше. А уж по знаниям, флюксу далеко до дали, он даже пепе не знает.
Окей, продолжим про расширения - в этом workspace расширении можно смотреть картинки, но есть ли какие-то отдельные расширения для просмотра сгенеренных картинок?
>>841394 >фооокус апскейлит на основе промпта Так в SD всегда апскейл с промптом, так как апскейл это фактически генерация картинки на основе другой картинки при низком зашумлении.
>>841409 >>841410 Спасибо аноны, всё-таки нельзя генерить более 1024х1024, даже при 240 шагах, получилось будто 640×360 увеличенный самым примитивных алгоритмом до 1920х1080.
>>840989 → > Это же получается будут вечные 3 флюс модели от самих разрабов и всё? Может я что-то упустил?
Не переживай, через годик может даже раньше выйдет модель 2B, которая сравняется или даже уделает. С языковыми моделями так уже произошло несколько раз: лама 1 была выебана ламой 2, та была выебана мистралью, полом пришла лама 3, 8B которой сравнилась с предыдущей 70B мистралью
>>841453 >полом пришла лама 3, 8B которой сравнилась с предыдущей 70B мистралью сравниваются-то да в логике и т.д., но знаний у 8B модели всё равно сильно меньше, чем 70B. Есть лимиты того, насколько вообще можно сжать информацию, а эти модели это как раз сжатие знаний из датасета.
Flux Schnell prompt: The image depicts a man and a woman in a sexual position. The woman is lying on her back with her legs spread apart, revealing her genitals. The man is on top of her, with his penis inside her. The woman appears to be looking up at the man, and her facial expression suggests that she is enjoying the act. The man's facial expression is not clearly visible, but he seems to be focused on the woman. The setting appears to be indoors, with a white couch visible in the background. номера файлов соответствуют сидам
>>841459 prompt: The image depicts a man and a woman in a sexual position. The woman is lying on her back with her legs spread apart, revealing her genitals. The man is on top of her, with his penis inside her. The woman appears to be looking up at the man, and her facial expression suggests that she is enjoying the act. The man's facial expression is not clearly visible, but he seems to be focused on the woman. The setting appears to be indoors, with a white couch visible in the background. номера файлов соответствуют сидам, датасеты для Flux ломали, похоже, те же спецы, что и для SD 3
Может мне кто объяснить такой прикол моделек картинок, что они на вводы число с чистами очень часто генерят поезда? Я ещё это замечал у novelai sd 1.5 файнтюна, но это и в flux schnell есть. Вот генерации по запросу "3246032", 6 подряд.
>>841487 В его случае он имеет ввиду, что одно слово не сильно влияет на всю картинку, т.е. если он просто поменял цвет волос, комната и т.д. не поменяется.
Ленина не знает Сталина не знает Хрущева не знает Брежнева не знает Горбачева не знает Ельцина не знает Путина знает Клинтона знает Буша знает Обэму знает Трэмпа знает Бэйдена знает Мао знает Дэна Сяопина не знает Си Цзиньпина знает Ким Чен Ына знает Ким Чен Ира не знает Ким Ир Сена не знает
>>841464 Это не специально ломали, а проблемы турбо моделей, шнелл вообще ломается на куче промптов, которые с людьми никак не связаны. Причем дев везде нормально работает.
Аноны, а на что влияет количество шагов? На проработанность пикчи? Но почему-то даже с пальцами косячит на 240. Применительно к аеон флаксу. Но на что-то же уходит процессорное время. А можно было бы инпаинт встроить в обработку на исправление рук/ног за это время.
там же написано, что в процессе. автор пилит пока. час назад кнопку nsfw запилил. завтра уже платным его сделает. инфа сотка. удаление тоже запилит. нах ему столько хранить?
>>841431 >>841441 >в ужасе По моему парень не в ужасе, а весьма так возбуждён девичьей задницей. Это вообще законно? >>841463 Это и есть поломка с учётом того, что кроме как для генерации извращённого порно генераторы картинок и не нужны.
>>841471 >Промпты почти не протекают Лол, тред или два назад анон жаловался, мол, хуйня, переделывайте. Хотя основная проблема там в одинаковых ёблах >>841480 А ты бы что сгенерировал на такой запрос? >>841491 >либо аниме У тебя там ни одной аниме нету. >>841601 >модераторы странные Странно, что тебя ещё не пожизненно забанили.
Пик 1 - Dev Пик - 2 schnell С задачей по сути ни одна не справилась. Городж нихуя не разрушен, на постапок не похоже, пауки на здание не лезут. Это и есть ваш Миджорней дома?
A huge spider robot with protruding guns, piloted by a man, climbs up the ruins of a skyscraper against the backdrop of a city destroyed to the ground. Post-apocalypse in a rough militaristic style. High-quality detailed photo.
>>841827 >>841849 Да там много такого, d3 может и варит артефачное говно, но у него явно более широкий и менее фильтрованный датасет.
Алсо, бери хотя бы dev, а лучше pro. Шнель слишком мелкая, ей явно нужны файнтюны чтобы что-то хорошее рисовать. С ростом размера/компьюта у них сильно растёт способность к генерализации. Например вот тест на перевёрнутую машину: 1 - schell, 2 - dev, 3 - pro. Очевидно что она понятия не имеет как выглядит днище машины, т.к. этого толком не было в датасете, но от худшей сетки к лучшей она явно пытается обобщать и абстрагировать. Так что pro может и кривые зубы твоим бомжикам нарисует.
Мне нравится когда долбаебы как он >>841252 пытающиеся сделать свою онлайн-копро-хуйню релевантной. Сколько интересно кубометров копиума им приходится вынюхивать, каждый день, учитывая что для идеограма треда нет, а для МJ уже как год тонет.
анон, поясни незнающему. мне нужно скрещивание фоток с какой нибудь хуйней из фильмо/игр и тд. я правильно понимаю что мне нужна лора, типо через трейн прогнать фотки, а потом найти какую то лору конкретную (по игре, фильму и тд) и через две лоры получается генерить пикчи? или как...
И еще инфа по христу нужна. Стоит ли покупать подписку на его бусти? Я чекнул, там вроде много гайдов на первый взгляд полезных, но комментарии под его видосами на ютубе постоянно отталкивают. Есть вообще какой то актуальный гайдер на бусти или на ютубе где собрана, структурирована и постоянно обновляющаяся инфа по базам нейронки? Типо лора, дипфейки, звук и тд
В общем что я понял про флюксю. Порево вы не получите, ждите пока выкатят модели с NSFW. Лор нет, нихуя нет, будете получать дженерик. Аниму не получите, ждите пони версию. Ваша видюха кал, чисто только на ночь поставить генерить картинок 50 и идти отдыхать. Вывод: возвращайтесь где-то к октябрю-ноябрю и желательно с 4090. А лучше начинать копить 300К на 5090 прямо сейчас.
>IT'S IMPOSSIBLE TO TRAIN >OK YOU CAN TRAIN IT BUT IT'S VERY HARD >OK IT'S NOT THAT HARD BUT YOU CAN'T IMPROVE IT YOU ARE HERE >OK YOU CAN IMPROVE IT BUT IT CAN'T DO CONSISTENCY >OK IT CAN DO CONSISTENCY BUT IT CAN'T DO NUDITY >OK IT CAN DO NUDITY BUT IT CAN'T DO PORN Seriously you need to actually genuinely shut the fuck up.
прост пишешь /fluxdev4 16:9 a cute cat и у тебя будет 4 картинки кошки в 16:9, правда я пока возможность настройки guidance не запилил. Вместо dev есть fast (schnell) и pro
>>842177 >теперь аж одну лору надо в пайп кидать чтобы она еще 10 сек времени отжирала ого, а какой смысл? у 99% нейродаунов все равно флух это неюзабельный кал который проще дропнуть
>>842197 у сдохли архитектура другая, ну сможешь более вольно писать промты чучуть как в натвисе где бигг ебанул пчелик, но ни разу ни как в моделях с нативной трансформ архитектурой
>>842230 Что блять? В SDXL и SD 1.5 лоры и файнтюны появились в первый день, блять? Уже вон первую лору выпустили для флюха, подожди пару месяцев, ёбаный врот
>>842228 >Сможет Так концептов во флюхе нет на старые фотки и пинап (например), который в полторахе есть кстати. Флюх делали шизофреники чтобы мимокрок с миджорнея на 4090 ахуел в делании вылизанного модернового калича.
Ну это бу, такое себе. Если новую брать, то около $1000. И ещё столько же на комп к ней. Плюс живу там, где хер что достанешь без больших наценок
Я вот могу позволить как бы, зп 200к. Но с другой стороны - это же много, лучше же откладывать, а не сливать всю зп на пк. Но с другой стороны можно ещё $500 накинуть, и в VR вкатиться с таким компом. Вот думаю апгрейдиться ли с 3060 или нет
>>842237 Вот по первому, просто закинул твою генерацию в 3.5 Sonnet и сделал описание, понижать Guidance сильно помогает (3 пикча), это всё dev.
Согласен, русских и особенно советских оно плохо знает, но при этом вполне норм выглядит.
Описание что-то типа >A sepia-toned vintage portrait from the 1940s of a young Soviet Russian Slavic woman with curled hair styled in a typical 1940s Soviet fashion. The woman has a calm, confident expression, looking directly at the camera. The image has obvious characteristics of an old photograph, including a lot of fading, scratches, and rounded corners. The overall tone is warm and nostalgic, with high contrast between light and shadow areas, typical of photographs from that era.
>>842242 1 и 2 - сразу мимо, это сорт оф фильтр и стилизация 3 - ну неплохо в целом 4 - вообще не 1940, еще накрашена Ну и ебло у трех из четырех одинаковое с жопоподбородком как обычно.
>>842244 Ну у меня не локально а через апи, так что только позитивный промпт, локально можно и негативный вводить, правда там CFG нужно менять и тогда вроде картинка может блюриться.
Со 2 твоим примеров проблем у Flux больше, согласен, т.к. с добавлением цвета он сразу идёт в фотомоделей. Сейчас подбираю промпты.
Ну а вообще, суть в том, что Flux на vLLMках обучен, а не на человеческих текстах с инета (описания картинок), так что вручную тегами писать не пойдёт для прям хороших результатов.
Пока примерно так, но я в принципе не знаю как пин-ап должен выглядеть. Тут сложнее модельку заставить не фотомоделей генерить. >An overly saturated, manually recolorized pin-up style from the 50s of a young pin-up woman with curled hair styled in a typical 50s fashion. The woman has a calm, confident expression, looking directly at the camera, with her whole upper body visible. She's sitting on a chair. The image has obvious characteristics of an old photograph, including a lot of fading, scratches, and rounded corners. The image has a very oversaturated look with high contrast and soft focus, typical of mid-century glamour photography. The background is a soft, muted green, allowing the subject to pop. The overall effect is a blend of wholesome charm and subtle sensuality, characteristic of the idealized pin-up girl image of the era.
>>842247 >вообще, суть в том, что Flux на vLLMках обучен, а не на человеческих текстах с инета (описания картинок), так что вручную тегами писать не пойдёт для прям хороших результатов. Волки это что? Тогда какие промпты ему подходят?
>>842248 > но я в принципе не знаю как пин-ап должен выглядеть Ну классический пинап это вот как со сдохли как раз, баба с узкой талией, полка дотс платье, мощные губищи с помадой, куча штукатурки, и прическа из сороквых забыл как называется Вот реал фото крч Можно было бы еще сложнее задачу дать - пинап арт сороковых, невыполнимая задача для флуха
>>842252 >Можно было бы еще сложнее задачу дать - пинап арт сороковых, невыполнимая задача для флуха Я считаю, что всё выполнимо, просто нужно по-другому научиться формировать промпты.
>>842257 В колабе медленно пиздец будет, а на апишке шнеля за секунду даёт результаты, dev ~15 секунд, pro ~20-25 секунд, причём я могу хоть 4-8 одновременно генерить. А так вообще в Replicate можно поднять любой ComfyUI workflow, мне просто лень и особой нужды нет.
>>842207 Скачай последние новые чекпойнты от Комфи со страницы где он воркфлоу публикует, там он сделал их специально для FP8, занимают меньше VRAM. Люди с RTX 3060 генерят на них за 23-26 секунд (правда не знаю на шнелле или на деве)
>>842259 За 30 секунд на 3060 явно на шнеле, спасибо за инфу, анон, но я привык пока что апишки юзать, ключи проще находить. И в fp8 люди делились, что текст хуже генерируется (schnell и так часто ошибки делает в нём).
>>842229 Вдохновил меня на идею создать фотку плачущего хартстоунера, который сидит перед монитором с открытым хартстоуном, где завершена игра и висит надпись DEFEAT. Вот тока оказалось, что флюкс нихуя не знает, как выглядит хартстоун. В лучшем случае кривой логотипчик на экране появлялся в окружении рандомных типа фентези артов. Увы, ничего не вышло.
>>842328 > На 4090 и с 64+ озу 30 шагов на дев займёт 2 сек. На шнеле 4 шага 1024х1024 занимает 2.5 сек. На дев 30 шагов 1024х1024 примерно 19 сек. В обоих случаях euler simple. RAM только во время загрузки чекпоинта существенно расходуестся — около 42 Гб. Во время инференса расход около 8 Гб. Расход VRAM во время инференса примерно 18 Гб.
Полистал ваш тред краем глаза. Каким же нужно быть дегенератом, чтобы использовать euler и ожидать хороший результат. Впрочем, что еще ожидать от челиков, которые генерят в 768x1024 и допускают прочие дегенератские ошибки.
>>842341 чел, это двач, тут сидит всего полтора реально шарящих анона и эКсПеРтЫ, которые только думают, что что-то знают. И так в каждом разделе. Забыл куда попал?
>>842359 А оперативки сколько у тебя? У меня с "weight_type: default" dev генерит одну пикчу 33 сек. Расход RAM при загрузке чекпоинта 55 Гб и 35 Гб при инференсе. Расход VRAM при инференсе 23.9 Гб. С "weight_type: fp8_e4m3fn" так как указано в том посте.
>>842131 Он выкатил вторую версию обученую на 4000 шагов и с кватованием fp8_e4m3, вместо int8. https://huggingface.co/mikaelh/flux-sanna-marin-lora-v0.2-fp8/tree/main Работает лучше и работает на шнеле версии. Промпт "sanna marin, woman photo portrait", сид 666, deis, karras, 4 шага. Первый пик без лоры, второй с лорой.
Чёт не пойму. У всех моделей есть рекомендации автора какой семплер и шедулер юзать. В большинстве случаев это dpm++ 2m sde с карасём. Они тк и пишут, что натренькано так и другие настройки непредсказуемая хуйня и чистый рандом. Вы тут нетакусики чтоль со своими смегмами, ролтанами, совсем лапшой обдолбались или чё?
>>842438 Ты реально думаешь, что 99% процентов челиков читают что там автор написал? Я, как создатель файнтюнов на цивите, убеждаюсь в сотый раз, что всем похуй, почти все юзеры ебашат одни и те же параметры в любую модель (отдельные шизы даже лоры от 1.5 пытаются в сдохле использовать и обижаются, когда говоришь, что они хуйню делают и это не работает)
>>842451 > На фотках с гугла также. Я вижу на твоих пиках личи из центра, но горизонтальных полос в упор не могу разглядеть. И в принципе никогда не видел на фото такого. А так оно скорее всего действительно откуда-то из датасета лезет. Потому что любой другой свет без полос. Просто оранжево-серые градиенты тоже без них, только бандинг ебанутый.
>>842823 Чел, у флюкса не DiT, а обычный UNET. Это вообще разные архитектуры и работают они по разному. Не говоря уже про то что ты даже не прочитал посты на которые отвечаешь.
>>842842 > у флюкса не DiT, а обычный UNET Блялол. Я понят что мечу бисер перед свиньями тут. Тред резко потупел, видать олдовички способные в осмысление базы слились давно.
>>842908 Пони без всего - базовая модель, которой надо уметь пользоваться. В остальных случаях тебе нужны стилевые лоры, ретрейн модели, базовая модель смешанная с лорами или иные мерджи. На странице пони также есть модель где автор в нее добавил турбо лору и дпо лору, так что модель стала более стейбл.
>>842908 Пони для тупых заводится копированием промта и настроек с любой картинки с цивита. Думать при этом не обязательно, главное правильно скопировать.
>>842965 Алсо частично модели с запеченными в них лорами (которые нигде не выложены отдельно) есть на вкладке мерджей пони, пример не того что тебе надо но это лора плюснутая к базе и чтобы лору достать надо вычесть базу из этой модели https://civitai.com/models/316882/momoiropony?modelVersionId=382513
Анончики, я залетный у меня маленький реквест. Надо тянке на пике дорисовать ноги в позе лотоса и руки в мудре медитации. Но так что б нейронка не поменяла лицо, прическу и одежду, фон значения не имеет. Где я могу такое сделать бесплатно и без смс? Ну и если есть добрая душа которая сможет сделать это за меня, то буду благодарен за помощь.
>>842999 Аутпэинтом это делается (или ещё проще - расширить картинку на нужное число пикселей в пэинте, а потом просто филлом залить пустое место), лицо можно вообще не трогать, тупа расширить картинку внизу. Но поза сложная, ебаться придется долго, может лоры на неё потребуются, плюс шлифовка, чтобы не сильно отличалось от основного пика.
>>842999 > Где Локально на своей пекарне. Ну или можешь демки какие-нибудь BrushNet и/или union promax контролнета поискать. Но один хуй за ними локально подчищать придется.
>>843048 Как раз вообще не фейк, он про FluxGuidance говорит, или Guidance в апишках, низкий Guidance реально помогает генерить более "рисованные" стили
>>843045 >Но поза сложная контролнетом делается инфа 98% т.к. в датасете сд (пики 3 и 4 рав гены) и калтролнетов есть йога позы можно айпиадаптер/t2i адаптер заюзать
Как же я люблю шизоидную простыню промпта, когда всё в кучу. Будто на выставку к психопату сходил, который показывает свои картины только для тебя и после твоего ухода сжигает их.
>>843073 О, я вижу вы спец. Сделайте картинку где тётка без батнека скомала свои труханы и воткнула в них свой нос, наслаждаясь аромтом прищурив глаза, теребя сосок другой рукой, истекая кровью. А ну да...
>>843045 >>843059 >на своей пекарне Не, не потянет. Для онлайн редактора и нуба за компом я так понял эта задача пока непосильная. Ну ладно, спасибо за советы, добра вам.
>>843110 >скорость говно полное без платной подписки Че? Нормально мои 10 мегабайт в секунду качает, че не так? >потому что поддержка пока ток в ComfyUI А другие юи и не нужны.
>>843116 Я должен восхититься чем? Тем что отбирают работу у дизигнеров икеи или то, что флух лоры можно тренить имея 80 гигов врама? АХУЕТЬ ТРЕНИТЬ ЛОРЫ МОЖНО ОМНОМНОМ
Всегда представлял фанбоев чего-либо защищающих с пеной у рта свою любимую хуйню за бесплатно - за стаю шакалов-промыток. Хуже червей-пидоров, как грязь из под ногтя.
Потестил флакс, промпты вообще не понимает, вариации пикч никакой, выдает одно и то же, считай. Хоть качество и норм из коробки. Не вижу юзкейса для этого. Комик свой не запилить, например.
На форче уже находят способы, как норм негативные промпты для Flux юзать, и работает
Seems that PerpNegGuider allows you to use the negative prompt even with cfg = 1 https://ku-cvlab.github.io/Perturbed-Attention-Guidance/ >Perturbed-Attention Guidance significantly enhances the sample quality of diffusion models without requiring external conditions, such as class labels or text prompts, or additional training. This proves particularly valuable in unconditional generation settings, where classifier-free guidance (CFG) is inapplicable
>>843300 Блять, ты ёбнутый или что? Даже если она понимает промпты намного лучше, то всё равно не понимает негативов. Негативный промпт пока не завезли в апишку, так что на сайте нельзя ввести негатив. Пиздец тут гении собрались
Не можете ли посоветовать готовые коллабы stable? Желательно такой что б по кнопочке / ссылке модели/LoRa можно было качать, чтоб в webui был Inpaint и прочие прелести. Я глупенький, если что не осуждайте
>>843381 Он ебнулся окончательно. Зачем перелопачивать автоматик, ломать абсолютно всю совместимость (кстати в проекте который изначально на совместимость был рассчитан), когда можно создать с нуля новый webui на том же градио. Хотя погодите, он же уже создал фокус. Почему не делает какой-нибудь fooocus-advanced, с большим числом опций и т.п.
Так, призывается бригада мастеров. Кто сможет вытащить эту жопу первый пик хотя бы до фуллхд/2к, тому чай. Прогонял через гигу 100х - результат такой себе. Не придумывайте пожалуйста велосипед, прогоняя ее х4 шарпами, результат хуйня! Самый лучший, я думаю. Это ersgan или swinir4x с подмешиванием nearest во вкладке extras, мне img2img плохо скейлил, точнее медленее чем extras. Я пошел спать, посмотрю деньком, если мне кто-то ответит.
>>843359 У обычного нет глобал-аттеншена и двойных блоков с MLP. Обычный блок DiT - это верхняя хуйня. Нижний двойной блок очень сильно перепилен. Ну и слои гайденса тут новые.
>>843299 Так можно и обычный CFG использовать, проблема же не в том что он не работает, а в том что в два раза дольше генерации становятся. PerpNeg так же второй пик генерит.
У сд же косхл версия есть с расширенным цветовым контролем, а я и забыл, приколько получается при предложенном смешивании в комфи, надо дейрануть попробовать
>>843396 инста галка стояла, там похуй лиц же нет - и эффекта нет. >>843405 как получиться, в приоритете обычный апскейл, если будет убран дым и прочее, тоже посмотреть можно >>843435 200х152 на весь интернет, и еще с шумом, кнч, это тебе не тяночек апскейлить 512на768 >>843444 вот прогон, разницы не вижу, а в скорости и наглядности да. конечно sd upscale, который квадратиками будет пересобрать картинку. он хорош, однако extras на похожем уровне делает с пиком.