Stable Diffusion Flux тред X+104 ====================================== Предыдущий тред >>841179 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожие тематические треды - аниме-тред >>841156 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного беженцами бывшими разработчиками Stable Diffusion. Полный функционал в локальной установке (см. ниже)
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her ------------------------------------------ ♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇 https://supagruen.github.io/StableDiffusion-CheatSheet/ https://www.artvy.ai/styles ------------------------------------------ 💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td ========================================== 🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇 https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora https://civitai.com/models/train
>>843516 → >200х152 на весь интернет, и еще с шумом, кнч, это тебе не тяночек апскейлить 512на768 Бля вот на такой случай, я считаю, быстрее в блендере накидать эту композицию буквально 15-30 мин да и отрендерить а потом уже шлефануть в фш Это никаким раком не апскейлетнется и не улучшится никакой сеткой
>>843538 Но он прав. Не stable diffusion'ом единым, как говорится. Прогресс идёт, модели делают. Не думаю что у нас тут есть такие фанатики SD чтобы отстаивать это название.
>>843540 Да я согласен, но подражать как клоуны это глупо. >>843541 Да, это тупо топ. На другие уже и не смотрю. Флюс и половины не может, что может эта модель.
>>843551 Дев можно даже на 10-12 шагах использовать, если ралстон + бета-шедулинг. Гайденс надо как можно ниже делать, а лучше динамический использовать, уже на 3-4 пластик лезет.
>>843558 Когда клоузапы мыльные, то даже слепой заплачет. Даже шакалы 600х800 из гугла с клоузапами имеют детализацию какую-то, а ттут у нас шакалов нет, только блестящий пластик. После ебеал флюкса уже не хочется возвращаться на пластик. Хотя в том же Колорсе лица круче всех, но там тоже нет детализации. Скорее бы контролнеты завезли во флюксе, чтоб хайрезфикс на нём делать, а генерить разнообразных тянок на другом.
>>843567 >Напиши промпт, повторим вот, 16:9 AR, но на этом же вводе schnell/dev дают более прямую интерпретацию >A photo, two small LEGO-style suns are fighting each other in a pool, intense protuberance
>>843592 >Подозреваю, что на pro версии подкручена собственная LLM-ка для улучшения промпта. В официальном апи BFL такая опция есть (офф по умолчанию), но на Replicate такой опции нет, так что скорее всего она офф, судя по моим тестам.
>>843577 Если вот так поправить промпт, Flux выдает то, что по сути запрошено >A photo, two small LEGO suns are fighting each other in a pool, intense protuberance
На шнеле выдает следующее через раз, на Pro наверное будет каждый раз и еще лучше или нет.
Если кому интересно как устроен мердж с лайтнингом у натвиса. Ток в DARE мердже ties на count поставить если прям 100% результат идентичный нужен, а не 99.99999%. По факту там мидл блоки заменены от лайтнинга получается.
Так что меняете лайтнинг лору на любую по вкусу (пцм там, хупер хуюпер и тд) или с пик 2 делаете уникальную из бесконечного количества и ебете качеством в пару токенов и без ограничения на цфг.
>>843699 > больше стабильности, больше качества Ни одна убыстрялка не сделает качество как голая модель. Они все шакалят картинку, даже если количество шагов не меняешь. > меньше шагов > негативы преимущественно не нужны Шаги только нищуки экономят, ведь есть AYS, а без негативов жизни нет на любом SD.
>>843702 В прошке очевидно обработка промпта другая. А так это максимально близкие по качеству модели, они очень слабо отличаются. Вон анон постит с dev пикчи, там чёткости уже некуда больше.
>>843709 >В прошке очевидно обработка промпта другая Такая же там, просто это оригинальная модель, не дистилл. Переписывание промпта в Replicate отключено, оно даже в официальном API отключено по умолчанию.
>>843708 >Ни одна убыстрялка не сделает качество как голая модель. Они все шакалят картинку, даже если количество шагов не меняешь. Ты не разбираешься. >Шаги только нищуки экономят Нет. > ведь есть AYS Да куча есть планировщиков готовых, тцд ближе всех к юниформам и он более универсальный. А так Айс это формула планировщика с заданной точкой по иксу нисходящая по позитивной гиперболе, единственное на что она влияет - насколько быстрый каскад падения шума будет, что прямо влияет на то будет пережарка или нет/будут цвета инферированы или нет в зависимости от семплера, следовательно ты не разбираешься x2. > а без негативов жизни нет на любом SD Ты не разбираешься x3.
>>843718 Да я только и занимаюсь тем, что показываю итт как делать фоторил баб. Без негативов, разные убыстрялки пцм/турбо/дпо не помню где что, тцд планировщик + разные прикольные семплеры.
Короче, слушаем и запоминаем: FLUX.1 [pro] - неповторимый закрытый оригинал FLUX.1 [dev] - обычный дистилл из pro FLUX.1 [schnell ] - дистилл из pro для быстрой генерации в 4 этапа
>>843719 >Давайте я скачаю обе модели натвиза и потестирую. Есть в автоматике поддержка литнинга? Чи шо? С такими базовыми вводными где ты нубасик толку от твоих тестов. Изучай базу лучше.
>>843733 спасибо, попробую, лайтнинг же не нуждается в доп. настройке, просто можно сразу генерить в мелкое кол-во этапов? И какой семплер лучше юзать?
>>843735 >лайтнинг же не нуждается в доп. настройке, Ну вообще нуждается... >просто можно сразу генерить в мелкое кол-во этапов? Тут шагов 20, то есть не 8 на которых лайтнинг заявлен. > И какой семплер лучше юзать? Моилюбимые TCD, Euler Dy, DIES
>>843741 >Разве DPO это не технология дообучения? DPO не в смысле обуения, а в смысле готового гайдера для генерации, есть дистилляты на цвите/хаге. >Как её использовать с готовой моделью? Подключаешь как лору также.
>>843640 >прошка не справляется Да хер с ним с запросами, самый главный косяк флюса, что он почти всегда генерит ебучий реалистик рендер. Не реализм, типа кадр из фильма или аналоговое фото, а ебаный реалистик 3д дженерик графоуний. И ещё , абсолютно везде накидывает ебучий бокен и блюр. Даже сдохля в этом плане лучше. Вообщем если это лорами не исправят, или как то не зафайнтюнят, нах этот флюкс не нужен, тупо шняжка поиграться пару дней и забыть.
>>843775 спасибо! А насчёт неативной age slider тут >>843747 - какую именно лору для age slider использовать? А то их много разных. Этот StS/St3 я не нашёл
Лапшеводы, может кто знает, что за хуита на последней строчке и кто насрал? Во всех нодах пустая строчка появилась. У меня 150 экстешенов стоит, лень проверять кто поднасрал, появилась пару неделю назад вроде бы после массового обновления нод.
>>843751 Охуенно просто, да. Я как-то ставил себе на пробу, потом какие-то ноды блядь пытался найти, сделать инпеинт самостоятельно, у меня даже почти получилось, но ебля та еще. Нужно чтоб сразу искаробки работало как в автоматике.
>>843909 Самый простой гуй на эти диффузии это комфиуии. Там буквально портэбл архив распаковал и запустил батник и как даун картинку с настройками в интерфейс перетащил. Тупо минусовый айсикью.
>>843722 > фоторил баб опять будешь пиздеть, что шесть пальцев на превью не видно? или это скил ишью и нужно просто выработать навык видеть в этом фоторил?
>>843916 Берешь мешграфформер и в 100% случаев делаешь 5 пальцев вместо 80%. Только нахуй оно кому надо? Ну может флух в 5 пальцев, а ни в че другое не может, 12 миллиардов параметров жопо подбородков и пальцев лол.
Китайские шакалы уже заценили? На 24 гигах врам заводится, остальные как обычно в пролёте. 6-секундный видос генерит 2 минуты на 4090. По качеству самой картинки такое себе, но по крайней мере лучше шакалов от SAI. Промпта слушается норм по начальным генерациям, но пидорасит быстрые движения. В дашкам может, но медведи скользят по дороге, блять.
У кого флюкс генерит медленно смените ойлер на хуён)). Не шучу. Будет в два раза медленнее, но качество лучше. Больше деталей на фоне, прорисовка, лучше текстуры, немного эффекта хдр(лучше светотень).
>>844145 Ноль позитивных отличий, очередные плацебо маняфантазии, как и всегда. Ох уж эти дети, верующие в святую силу сэмплеров, тока стоит сменить один над ругой и сразу качество вырастает в мильон раз)))
>>844156 > в святую силу сэмплеров, тока стоит сменить один над ругой и сразу качество вырастает в мильон раз))) Ну вообщето да, качество на нормальных семплерах может быть топовым, но не на хуен конечно.
Ну хуй знает. Первый блин комом, называется. Хотя сам факт того, что лоры под флюкс можно тренить на домашних пека радует. Расход памяти simpletuner'ом при обучении был максимум 15780Мб. Так что теоретически на 16Гб картах с отключенными иксами наверное тоже можно будет обучать. У меня иксы жрали ~240Мб, но это с учётом того, что подключено два 1440p монитора. Плюс ещё xformers под эту ебалу пока не завели, с ними расход памяти должен быть меньше. С учётом всратости датасета (15 кое-как заапскейленых кадров из фильма), думаю, для первого раза сойдет. Кажется немного недообучено, хотя обучалось 4000 шагов, хуй знает сколько ему надо sdxl бы уже 3 раза переобучился с таким количеством шагов. Но хоть какие-то признаки запомнило особенно признак старой говёной советской киноплёнки СВЕМА
Аноны в чём прикол? Как победить нехватку памяти у CUDA когда эта гадина жрёт только половину физически существующей памяти? Причём, сука, только на XL моделях такая проблема
Где не искал солюшн - везде советуют просто генерить пикчи поменьше. Но смысл? Хочется заставить юзаться всю память, а не жертвовать размером
>>844466 Дублирование текста - точно шнель, Dev такого практически никогда не делает. И да, модель понимает текст в двойных кавычках лучше, + лучше писать перед самим текстом "text" (ты это делаешь, молодец, многие забывают)
>>844359 Чуть больше 3 часов. Но у меня генерировались проверочные изображения каждые 100 шагов. Так часто нахуй не нужно, потому что только генерация этих картинок заняла почти час от общего времени обучения.
Какую модель сейчас лучше всего использовать для капшионинга датасета под SD3/Flux? В SimpleTuner предлагают мультимодалку XGen-MM (бывшая BLIP3) https://huggingface.co/Salesforce/xgen-mm-phi3-mini-instruct-r-v1 типа excellent option for captioning, relatively lightweight and yet very powerful.
>>844607 Ранк 4 Оптимизатор prodigy с его рекомендуемыми параметрами и lr=1 Шедулер констант с вармапом. Вармап 10% шагов от общего их числа. Под эксель я обычно ставил косинусный шедулер и оно очень хорошо работало. Здесь надо бы тоже попробовать.
В комфи как-нибудь возможно игнорировать изменение воркфлоу при импорте картинки с метой? Нужны только сид и настройки генерации из неё. Может есть какой-то костыль?
Докачал вот эту модель >>844603. На фотографию голой тян лежащей на диване выдаёт такую гойду: A nude woman is lying on a white sofa with two pillows. She has long dark hair and is looking away from the camera with a slightly worried expression. The sofa she is lying on has a white color with a tufted pattern. On the right side of the sofa, there is a pink pillow and a white blanket. The woman's position on the sofa and her gaze away from the camera give the image a sense of intimacy and vulnerability. The overall atmosphere of the image is both comfortable and somewhat melancholic.
>>844639 И ни слова про сиськи, письки, про детали тела. Удачи потом генерить одну ту же бабу всегда с одинаковым "средним" телосложением без возможности на него повлиять.
>>844652 Мне не только промпт нужен. Я нагенерил миллион картинок, лишнее удалил, остались так сказать шаблоны для работы. Я кидаю в воркфлоу картинку и что-то меняю. Но они были сделаны в разное время с разными воркфлоу и я заёбываюсь.
>>844656 SD Prompt Reader? Сэмплер, сид, размеры, использованные лоры он тоже показывает. Я аналогичным вопросм тоже озадачился и потом бугуртил в аниме-треде, что найденное лапше-решение говно какое-то. Но работает в целом (не работает с флюксо-генерациями, требует запуска очереди для считывания данных).
>>844704 А он сразу применяет промпт и настройки в готовом воркфлоу по нодам или просто инфу показывает, а я должен ручками по нодам раскидывать? Мне нужен 1й вариант. Ну мне только для sdxl. Флюкс не может в нужную мне стилистику.
В общем я тут подумал и решил написать скриптик-хексэдитор в повершеле на удаление воркфлоу из картинок, не трогая промпт и настройки. Масспрогон одним нажатием по всей папке. Пойду маме похвастаюсь, я у неё учёный.
>>844749 Сейчас для начала удаляю вручную воркфлоу из картинки, может оно вообще не будет импортировать промпт и настройки отдельно, надо понять стоить ли оно того.
>>844749 На павершеле делается на наносек. Вставлять-то вставляет промпт и настройки, но сбивает в кучу текущий воркфлоу. Ну блять лень конечно, но походу надо вообще вырезать ноды из файла и снова тестить.
>>844746 В общем азпустил эту хуйню локально. На ту же пикчу выдаёт такую гойду: This is a high-resolution photograph featuring a young woman with a light olive skin tone and long, straight, jet-black hair. She is completely nude, displaying her medium-sized, perky breasts and her shaved vulva prominently in the foreground. Her physique is slender with a toned abdomen. The woman is seated on a white, tufted leather couch with her legs spread apart, one hand resting on her thigh and the other on her hip. Her facial expression is neutral, with a slight, relaxed smile.
The background includes a plush white couch with several large, gold satin pillows placed behind her. To the right of the couch, there is a pink, silky garment draped over the backrest. The lighting is soft and even, highlighting the textures of the satin pillows and the smoothness of her skin. The setting appears to be a modern, minimalist living room or studio, with a focus on clean lines and neutral colors. The overall mood of the image is intimate and candid, emphasizing the natural beauty and form of the subject.
Придумал простой, дешёвый, автоматический способ подмешивания микротекстур во флюкс шнель. Но так как слепошарые >>844156 ожидаемо не увидят разницы, то нет смысла показывать как это делается. 1 - дефолт шнель. 2 - с микротекстурками.
>>844840 Срочно внесите МЫЛО! Человеку от шарпея поплохело. Это новая заразная болезнь. Нет, это не тупо, как ты привык делать, а умное и качественное решение.
>>844871 Ну ладно, я быканул, сорян. На самом деле есть микроприбавка к детализации. Но хз, оно стоит того думаешь? На 2й девке кожа на лбу становится вся в микро морщинах, даже у такого скуфыча как я нет такой хуиты. Думаю на портретных фотках дедов будет охуенно, но везде подряд я бы не стал такое совать.
>>844873 Сдхл вообще в мусорку. Он проигрывает вообще всем. Джагерёбла это вообще мемас даже. Исправляется скачиванием нормальных моделей типа натвиса - он вообще сейчас топ из всех сдхл реалистиков.
>>844873 Если ты имеешь в виду на фулл боди картинках, то тут просто пикселей не хватает на ебало. Это решается онли маскед инпеинтом ебла, адетейлером или просто апскейлом (первые варианты дают более сильный эффект, чем аспкейл, но совсем уж тяжелые случаи увеличение в 1.5 раза и более исправит, наверное).
>>845038 А туда ли ты зашёл? Харкач - свободное общение. Спросил то, что актуально и действительно необходимо флюсу, а не контролнет. Ответ был от тупого даунёнка, бессвязным лепетанием. Смысл трястись, дядя, а? Дыши ровно. Включай мозг всегда, даже при попытке потралировать.
>>844793 А что за хедер, что он делает и зачем его удалять? Алсо, не все сидят тут на сперме и лучше такие скрипты реально на питухоне делать, особенно учитывая что все тулзы по МЛ на питоне работают и он полюому есть у всех
>>845078 >Что говорит сам Маэстро? В приватном закрытом чате он протестировал флюкс и сравнил с флекси. Все авторитетные пользователи флекси согласились, что флекси гораздо лучше.
>>844746 Попробовал прогнать пару сотен фотографий из датасета и заметил один недостаток этой модели — она очень часто пишет хуйню вроде "возможно эта фотография сделана в спальне" или "освещение естественное, что позволяет предположить, что фотография была сделана в дневное время". Пробовал писать во входном промпте, чтобы оно описывало фотографию без догадок и предположений, но всё равно пишет эту хуйню. Это как-нибудь фиксится?
>>845492 В маняметреде 1й раз побывал. Что-то вбросил и меня похвалили. Вот расчувствовался, не могу заснуть. Маме позвоню расскажу. НЕ ТО ЧТО У НАС!!11
>>845603 Это онлайн генератор. Я же не 24врам боярин.
А ты сам сделай лучше, чем сд3, обосрешься ведь:
in a forest, three rotten knights are dragging a large ice cube on a sled through the melting snow. A circle is painted on it in red. Black liquid is oozing from the circled area.
>>845454 Что именно ты писал во входном промпте? Вот эта строчка у меня лично хорошо работала, чтобы пофиксить эту хуйню: Be decisive. Don't use conditional language (e.g. "perhaps red or blue" or "set in a field or forest").
>>845604 Бля, ты сам посмотри. Flux Schnell сделал тебе и окружность (circle) и Black liquid is oozing from the circled area. А SD3 сделал круглое красное пятно с Black liquid который точно не из окружности течет.
>>845890 Вот-вот, в данном случае circle это именно просто окружность, не заполненная. Заполненная была бы disc. Как обычно промптер обосрался. Я думаю люди из-за этого считают MJ такой "крутой" - она просто не понимает 2/3 их вводов и вместо этого генерит какую-нибудь хуйню, а они такие ооодааа креатифф
>>845831 Попробовал так "Write a brief description of the woman in this photo. Be assertive. Do not use conditional language (e.g. 'perhaps red or blue' or 'set in a field or forest'). Do not use assumptions or guesses." Нихуя. Всё равно пишет свои предположения: "возможно ей 20 лет", "возможно это спальня или гостинная", "возможно это одеяло или простынь". А у тебя какие параметры top_k и temp?
>>845903 Сетки на нормальных LLM или с рефайном промпта и будут более креативные. Т5 это не полноценная LLM, он очень буквально текст понимает, надо как конченому дебилу описывать всё и проверять чтоб он вдруг не понял это как-то не так. Ещё и клип подсерает, надо пробовать убирать описание из него или наоборот добавлять - будут немного разные понимания промпта.
>>845905 Я бы тебе посоветовал просто брать нормальную instruct-модель и переписывать ей промпты под нужный формат. А VLM пусть пишет любые простыни, главное максимально подробные.
>>845909 Я думал так сделать, но это уже на крайний случай. Можно попробовать простым скриптом вырезать из текста все предположения, благо они обосолены и в целом однообразные.
Причина по которой в диффузионках вечно берут древний T5 в том, что это энкодер-декодер модель под свободной лицензией. (а не декодер-онли, как большинство)
>>845945 Всего лишь один из ключевых создателей чекпоинтов для сд 1.5, на базе работы которого, наверное, половина всех полторашных моделей потом миксовалась.
>>846071 Там можно потом посмотреть твой собственный рейтинг, и общий рейтинг, прост они flux ток добавили, вот и всё. А так да, я не понимаю, как люди так сильно оценивают dalle3 hd, у него стиль пиздец
>>846066 После рейтинга LMSYS, в котором 4o mini (которая на практике чуть умней турбы 3.5) магически ебёт sonnet 3.5 и опус, я не доверяю подобным хуйням вообще.
>>846106 ну в lmsys оценивают как раз человеческие предпочтения, 3.5 соннет на деле конечно же лучше. Но для картинок, я думаю, оценки людей будут сильно ближе, чем для вывода LLMок. Хотя наверное многие долбоёбы не будут читать вводы и всегда просто будут выбирать более красивую картинку
>>846508 Тянки, сиськи, пёзды, жопы без подбородков. Вообще датасет на 1000 высококачественных softcore изображений, но я пока попробую потренить на 200, посмотрю что получится. Надеюсь, что хотя бы научится нормально соски рисовать и пёзды хоть как-нибудь. В идеале нужно файнтюн делать, а не лору.
>>846476 Будет псевдопиксельарт с любой спецлора и моделью. Хотя если это засунуть в фотошоп и сделать палитру 8 бит и даунскейл раз 8 nearby без семплера, то скорей всего может повезти, что пиксели не поплывут.
>>846511 >>846526 >>846552 Ну, вообще выглядит как что-то что можно использовать в видеоигре для второстепенных NPC если руками доработать.
Возможно если поставить на ночь генерировать картинки, а потом выбрать самые лучшие, то будет возможно что-то близкое к тому же что нарисовал бы художник. Проблема пока в том, что одну картинку он делает на моем железе за 1-1.5 часа, что мягко говоря не быстро. С другой стороны какая разница если он будет это делать ночью.
Окей, тогда такой вопрос, как сделать так чтобы они генерировались в одном стиле? Условно я скармливаю 20 картинок нейронки и она все следующие картинки делает в похожем стиле. Такое уже придумали?
>>844871 Быдло, спок. Ты бы хоть живопись повтыкало для начала, чтобы хоть что-то там кукарекать о качестве изображения. Открой в гуглах картинки хотя бы, я не знаю.
Деталек у него, блять, больше, лол
Вангую что нейронки приведут хотя уже к появлению нового поколения "яхудожников" маминых, умеющих только тыкать на кнопку "сгенерировать" и не имеющих вообще никакой художественной базы.
Точь в точь такая же хуйня была когда появились первые цифровые зеркалки, каждая тупая пизда считала себя фотоГрафиней
>>846476 >>846511 >>846683 RetroDiffusion заточена под пиксельарт, со всеми нюансами - сеточка, алиасинг, изометрия/правильные углы, аутентичные палитры. Единственная в своём роде.
>>846552 > Будет псевдопиксельарт с любой спецлора и моделью. Нет, есть расширение, которое выравнивает палитру и пиксели, чтобы получить реальный пиксель арт
По существу: эти твои "детальки" не добавляют визуальной информации, а наоборот уменьшают её количество. Потому что если присмотреться к складкам вот тут например: >>844164 видно что форма читается хуже. В общем контексте всего изображения понятно что это складки, но если абстрагироваться от контекста видно что форма передана уебищно. То есть теряется визуальная информация о форме. Части объекта (девушки) становятся как бы "отдельными"
Части объекта не могут быть сами по себе. Объект не состоит из отдельных "штучек", "кусочков". Он цельный и монолитный, все его части плавно перетекают одна в другую. "Отдельность" частей объекта – это полный тотальный проёб его формы
Объект должен выглядеть как нечто цельное. Его отдельные части – это игра его общей формы
Плюс он должен "жить в среде", не быть "вырезанным". Должно быть мягкое касание объекта с фоном. У тебя это касание проёбывается, объект резко отделяется от фона, не "живёт в среде", не является её частью
А ещё цвет должен быть сложным. Сравни оригинал девки в сером со своим результатом. Посмотри на серую ткань. Серая ткань должна содержать в себе цвета соседних объектов, по законам физики. Посмотри сколько рефлексов (посторонних цветов) на серой ткани оригинала, и сколько на серой ткани твоего результата. Там тупо почти все рефлексы исчезли
И да, то что я описал – дистиллированная база. Перечитай несколько раз, можешь заодно погуглить на тему рефлексов итд. Без понимания этих базовых вещей и речи быть может о каком-то там "улучшении качества на глазок". Ты сперва глазок натренируй
>>846465 Пока я спал, лора успешно дотренькалась. Что имеем — лица стали лучше, более разнообразные, без выраженых скул и жопных подбородков. Соски стали значительно лучше, но не идеально — сказывается большое разнообразие форм и расцветок сосцов в датасете.
>>846904 Понял, спасибо. Натыкался пока искал лору для пиксель арта. Сегодня значит буду пробовать ретро дифтюжион >>846700 Кек, ну тогда в принципе всё неплохо. Берём пиксель арт ассеты с известных сайтов сделанных в одном стиле. Делаем из них Lora и комбинируем с ретро дифьюжином. Или лору сложно сделать и план плох?
Нейропорно: секс в стратосфере дракона с боингом на фоне черной дыры пожирающей планету? Пожалуйста. Твоя горячая училка из 6Б в костюме кролика, моющая лобовое стекло своими сисяндрами? Держи. Твоего отчима насилует фурри конь за то, что он насиловал тебя в детстве, а рядом играет путин на фортепьяно? На раз два.
>>847020 Цвета полностью соответствуют датасету — в этих проф. фотостудиях обычно немного снижают vibrance на фотографиях. Мне такое норм, не люблю перенасыщеные цвета. 6000 шагов, средняя скорость 2.7 s/it. Заняло 4.5 часа. 4090. Ранг 128, но мне кажется это пиздец перебор. Попробую уменьшить до 32. Буду береобучать лору. Уберу из датасета клоузапы с пёздами. Концепта пизды в 12 миллиардах параметров не нашлось, а такой лорой его очень тяжело будет вытянуть. Тут надо делать либо охуенную лору, либо файнтюн с датасетом в несколько тысяч изображений, чтобы оно поняло что такое пизда, как она выглядит и где находится. ЧСХ, SDXL нормально пизду понял. Уменьшу количество фотографий с скалящимися тянками — это просто какое-то проклятие этих сраных фотостудий. На 99% фотографий тянки показывают свои зубы или стоят с полуоткрытым ртом как даунихи. Уменьшу количество фотографий с неконтрастными/размытыми сосками/ареолами. Концепт соска оно более-менее знает, думаю, тут обучится нормально. В датасете оригинальной модели у тянок соски скорее всего были размыты. И с подписями пока непонятно. При кэшировании эмбеддингов оно мне выдавало ворнинги, что превышел лимит в 77 токенов для T5 энкодера и часть текста будет отброшена. Хотя, судя по коду, для dev-модели стоит лимит в 512 токенов. Но если использовать параметр --i_know_what_i_am_doing (а он требуется для квантованого обучения), то этот лимит игнорируется. То ли баг, то ли фича. И разрешение обучения подниму — запас по VRAM ещё есть (использовалось около 18 Гб) >>846993 Если получу стабильный и качественный результат, то выложу.
>>847040 >в этих проф. фотостудиях обычно немного снижают vibrance на фотографиях Или ты просто неявно конвертируешь широкое цветовое пространство в sRGB, и не замечаешь этого. Так не должно быть, имхо.
>>846683 Просто есть лора для пиксельарта дохуя даже под сдхл и стиль будет зависеть от твоей фантазии в промпте. Точное попиксельное попадание делается легко, я уже выше писал. Мешанина пикселей на выходе из диффузии уменьшается без сглаживания в 8 раз, можно потом увеличить снова и получишь идеальный пиксель в пиксель размером х8. Можно ещё в имеджмэджике палитру прикрутить от NES к примеру и т.п.
>>847052 > Мешанина пикселей на выходе из диффузии уменьшается без сглаживания в 8 раз, можно потом увеличить снова и получишь идеальный пиксель в пиксель размером х8. Ахуеть. До меня дошло что ты имел ввиду. Спасибо!
>>846511 Ты похоже не знаешь про https://www.retrodiffusion.ai/ - это кастомный файнтюн SD 1.5 (дада, но он прям охуенный) + плагин для Aseprite, и всё это запаковано для удобного лёгкого использования. И да, платно, но охуенно работает. В https://x.com/RealAstropulse можно посмотреть всякие посты
>>846972 > С пёздами всё ожидаемо не очень. По сути они и с цензурой справились не хуже стабилити, и анатомию не похерили, и большую модель не зажопили. По всем фронтам лучше
>>847247 >Для справки, на HugginFace флюха в спейсах запускается бесплатно, без СМС, без ожидания, в 2 клика. Цензуры там на вашем личном сервере нет. Мы уже как 3 (или больше?) дня это знаем
>>847247 >Для тех, комму лень возится с Комфи Что там возиться? Портейбл скачал архив, запустил батник, закинул каринку с воркфлоу с интерфейсом флюса и всё, меньше минуты всё работает. Возиться лолсука. Это тебе не фокус, где думать надо.
>>847264 >минуты всё работает. Возиться лолсука. Это тебе не фокус, где думать надо. С думать у меня в последнее время плохо. Ну, буде время накачу на пеку...
>>847263 >Уверена Здесь сидят взрослые дяди, которые уже рзобрали флюс и собрали снова под себя. Тред минусового айсикью генерящих картиночки для развлекухи рядом >>841156 (OP)
>>847274 >которые А почему во множественном числе? Ты и себя в них записал? Маня, топ твоих достижений это баба-столб и стрёмный кошак, кто бы блядь вякал...
>>847274 Кстати, взрослые Дяди. Раз уж такие умные, помогите решить проблему с Флюхой.
warhammer 40k, epic canvas Ork warrior fight with woman with yellow glowing eyes, (yellow hair with pixie cut), spacemarine spacesuit with black and yellow stripes like a bee, leather collar with a ring on her neck, bee wings on her back, with bee antennae, battlefield on background, colorful manga style
Вот промт - на выходе пикрелейтед. Где орки, где эпическое полотно, где битва?
>>843505 (OP) >>843544 Перекатчику напоминаю что консилиум анонов проголосовал переименовать тред в /ldg/. Кто-то накрутил "свой вариант", но непонятно нахуя, раз своих вариантов в треде так и не было озвучено.
Можешь поставить "бывший /sd/" где-нибудь в ОП, чтобы по тегу нашлось.
>>847402 Ну а другие локально генерят. А вообще локал это же не обязательно селф-хостинг. Я тоже снимаю машинку на васте, как и многие в /lmg/ делают. Главное это же доступ к весам, это меняет всё. Вот дали всякие это не локал.
>>847403 >Кто хоть раз написал про см >>847399 >Я например против подражания форчановскому треду. Гордость есть вообще?
>>847401 > назло как-нибудь ещё, лишьбыни Так это суть последних 30-40 перекатов, так что всё сходится. Можно вообще Local Degradation назвать, и не /ldg/, как у пендосов, и передает тематику треда сразу.
>>847382 Дай места для действий двух персонажей - сделай альбомную ориетацию. И промпт перепиши, поищи структура промпта для генерации изображения, вот мой вариант и что сделала Шнель.
Epic painting, Warhammer 40K, ork vs woman fight. The woman has yellow eyes, yellow hair, pixie cut, spacemarine spacesuit with black and yellow stripes like a bee, leather collar with a ring on her neck, bee wings on her back, bee antennae, battlefield on background. Colorful manga style.
>>847259 > замедление ацкое с рамом Автоматик вообще сначала думал сделать опционально на проце ее крутить, но как пощупал, сделал не опционально, что ее только на проце и можно, чтобы в врам вообще никогда не гуляла
>>847392 >Кто-то накрутил Ну тогда опрос нахуй не легитимен.
Тем более переименовываться в ldg это как из пустого в порожнее, основная проблема не в том, что локальная генерация картинок это уже не просто SD, а в том, что она даже не diffusion. Все модели будущего основываются на трансформерах, поэтому предлагайте название поактуальнее.
>>847450 да каскад пиздатый никто и не спорит, и помещается в любое очко и текст умеет и супер шарп имагес, и вариатор, и как апскейл может использоваться и много че еще, но он а)заброшен б) имеет нонкомершл лицению в) разрабы съебали в WARP Итог: каскад мертв