Stable Diffusion Flux тред X+123 ====================================== Предыдущий тред >>921319 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожий тематический тред - аниме-тред >>916025 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion. Полный функционал в локальной установке (см. ниже)
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her ------------------------------------------ ♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇 https://supagruen.github.io/StableDiffusion-CheatSheet/ https://www.artvy.ai/styles ------------------------------------------ 💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td ========================================== 🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇 https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora https://civitai.com/models/train
>>924716 Я хз чем тебе помочь, попробуй гитхаб покурить. У меня тоже была проблема, там питону какой то херни не хватала, я ее установил и все заработало. Тут в нашем деле главное побольше на гитхабе дрочить и чат жпт ебать.
Я себе накатил мердж моделей. Я думал это занимает целую вечность, а это один раз сделал и у тебя есть своя модель с блекджеком и шлюхами. И ведь туда можно сразу и Лоры запихать. Какая же годнота. Так и делают мерджи на цивитаи? Или у них какие то сложные процессы?
>>924721 да это с прошлой версии началось, как куду обновили так все пиздец, кубласа не существует скомпилированного, и так далее, рили проще дальше убабугу ебать там хотяб все работает
>>924722 >Так и делают мерджи на цивитаи? да >Или у них какие то сложные процессы? там много методов просто и тысяча комбух, зависит от задачи некоторые еще поверх эстетику обучают
>>924733 Ну это уже ресурсоемко я так понимаю. Простым языком клип это что такое? Только без вот этой все математической херни. Просто мне для понимания от какой модели клип брать.
>>924740 >Так это все выглядит, как пальцем в небо. То есть миксанул говна, на выходе хуй знает что получилось. Ну вообще можно разобратьс сначала че зачем. >У ипадатера на выходе же модель узел. Значит я могу взять и его миксануть. Не, ипвадаптер это доп хуйня подсказчик для модели.
Сап, нейроны. Давно на SD ничего не генерил, а реализм ещё давнее. Как понимаю с SDXL на реализм моделях хайрез фикс уже давно не юзают и гонят сразу в старый добрый ультимейт апскейл?
>>924565 Я просто ворую чужие промты с цивита, для ллм озу нет. >>924625 Ты че пес, в прошлом аж две мои картинки были, правда они были говном, погоди ка...
>>924751 Я 99% времени вообще ничего не скейлю, нахуй оно нужно если все гены идут встол? Правильно, нахуй не нужно. А так можно и хуйрезы сразу генерить, дмд2 допустим надрочен на это и позволяет сразу пиздануть побольше. А можно и раунетом подстраховаться (аналог коя шринка из хурезфикса). А можно в аураср кинуть на 4x за минимум времени и потом с низким денойзом поверх на лоустепе прогнать ультимейтом чтобы шпхматку убрать если есть и детальки насрать. А можно ипадаптер ебануть в пайплайн и он сам на основе рефов тебе выправит все че угодно в какое угодно качество. А можно все вместе.
>>924722 >я себе выбрал 10 годных моделей по 7 гигов годноты в каждой и вытряхнул всю годноту из всех, оставив только 7 гигов говна и теперь вместо юза 10 годных моделей я юзаю отборный кал. Какая же говнота. Ясн. Впрочем всё ок. Все мержи это васянский кал, ты познал суть, васян.
ДУБЛИРУЮ НЕ ДЛЯ ДРОЧЕРОВ-ГОВНОЕДОВ ЛИШЁННЫХ ЧУВСТВА ПРЕКРАСНОГО, НО ДЛЯ ДВАЧЕРОВ ПОРЯДОЧНЫХ ИЗРЕДКА СЮДА ЗАГЛЯДЫВАЮЩИХ
Было бы охуенно надрочить какую-нибудь лору на визуал телесериала "Криминальная Россия".
Хотя может кто-нибудь это уже и сделал
Искажённые VHS-помехами ебальники братков, раскаленные утюги/паяльники в волосатых руках, тачки того времени, одежда, рынки и прочая атрибутика тех лет, заставки самого сериала
Хотя хуй знает можно ли столько всего впихнуть в одну лору
ДУБЛИРУЮ НЕ ДЛЯ ДРОЧЕРОВ-ГОВНОЕДОВ ЛИШЁННЫХ ЧУВСТВА ПРЕКРАСНОГО, НО ДЛЯ ДВАЧЕРОВ ПОРЯДОЧНЫХ ИЗРЕДКА СЮДА ЗАГЛЯДЫВАЮЩИХ
>>924941 Ты хоть что то для этого сделал? Кроме двух постов в СД треде? Подготовил хоть материал для трена? Нет? Так ты нейро хуисос получается, который >Ряя дайте мне годноты, с меня как обычно нихуя
>>924986 Да, ну ты посмотри какие в люстифи жопы, кости торчат, после мержа стали менее тощими, но мне всё равно не нравится. В натвисе то хорошие кругленькие.
>>925007 У юнета модели есть слои инпута, мидла (он один, с максимально общими знаниями для обеих моделек) и аутпута, каждый токен хуячит по слоям от частного к общему и от общего к частному, так собирается картинка. Разделение на три части достаточно условно, т.к. в инпуте и аутпуте по 12 слоев, поэтому если ты ставишь на 0.5 условний инпут то он возьмет половину весов инпута для кодировщика от обеих моделей в равной степени.
>>925094 Адд дифференс, когда ты берешь две модели+базовую, вычитаешь из второй модели базовую, и добавляешь полученное различие к первой. Это вообще бейзик мердж чтобы взять только нужное. То что у тебя на пике это 50/50 веса от каждой модели с клипом от первой модели, это хуйня полная залупа и ачько.
>заработок на ИИ Скорее мертв чем жив. Есть анонсы итт, которые продают не нейроатэрты, а выдают за реальных тянучкк и продают ню фотки?
Интересуют несколько вопросов: 1) на каких площадка лучше этим заниматьс 2) проблемы с репортажи от дрочеров за наеб 3) легальность изготовления и распространения таких материалов (тянучкам то можно) 4) легальность, ведь по факту это мошенничество, под видом фотки телки продается нейрокартинка. 5) работа за рубежом, с одной стороны это снимает все вопросы к законности, потому что наебывать западного барина теперь можно, но тут ебля с картами дроперов и прочтении санкционными ограничениями.
>>925188 >У тебя же какой то более лучший вариант ну в мерджинге нет какого-то идеального варианта, так что нет > Ты же сам сказал, что там много чего не учтено. в смысле там не все разобрано по части функционала
>>925197 потому что вне размера датасета, сдхл не ебет как работать с концептами объекта которые жестко привязаны к размеру обучения, тот же прикол у турбо дистиллята - он растягивает все объекты вне базового разрешения
вот у дмд такой проблемы нет, потому что там как-то хитро с инференсом сделано
посттренингом только через подключенный шринк и раунет можно пофиксить
У меня после применения этой штуки, модель распилилась не на 3 части, как я думал, а аж на 4. Сохранилась в папки checkpoints, diffusion_model, и два клипа в clip. Так вот вопрос, что из этого мне подгружать в Load Diffusion Model ноду?
Я сначала не заметил такого расслоения, грузил то, что сохранялась в папку checkpoints, все работало. Потом грузанул ту что в models, почти ниче не изменилось.
>>925362 >>925399 >Так вот вопрос, что из этого мне подгружать в Load Diffusion Model ноду? >Те что диффусион моделс весят по 2.5 > была именно 2.5гб модель. То есть мне они и нужны? да, 2.5 это чисто юнет, то что в дифужн модел >грузил то, что сохранялась в папку checkpoints >А зачем тогда 3.6гб чекпоинты? Включай логику, это собранная модель в один сейфтенсорс файл через sae checkpoint ноду, в нем содержится клипы, вае, и юнет. Ты в принципе и его можешь юзать, но лоадчекпоинт стандартный без возможности выбора dtype fp8, а значит развернет ее в fp16 и твоя 1050 перданет скорее всего. Хотя может Load Diffusion Model тоже способна сейфтензор полную модель подгружать, я не чекал, а ты говоришь "Потом грузанул ту что в models, почти ниче не изменилось." как раз.
>>925416 >может Load Diffusion Model тоже способна сейфтензор полную модель подгружать а так она читает папку дифужн моделс, фуловый чекпоинт в чекпоинтах лежит же, попробуй перенеси фул чекпоинт в дифужн модел и загрузи, ток клипы все равно отдельно грузить
>>925223 Я так понял это что-то типа hires-fix? Но при этом он на любом разрешении шакалит картинку. Но для создания балванки для апскейла вроде годится.
>>925438 Я уже блять и с ультимейтом ебался, и с контролнетом, и мультидифьюжном, поменял десяток апскейлеров и тупо латентным тоже, передрочил всё что можно, один хуй говно. Меня где-то наебывают со всеми этими SDXL моделями.
>>925425 >Я так понял это что-то типа hires-fix? Это аналог deep shrink, который есть в хуйрезе. >Но при этом он на любом разрешении шакалит картинку. Ну хуй знает что для тебя шакал. Это шакал? Учитывая, что это сгенерено за 16 сек в 2048px на паре токенов и дефолтных настройках раунета.
>>925451 Я разобрался как он работает, можно нормальную картинку вытянуть в стоке, но лучше такие разрешения не ставить, деформация всеравно идет... Лучше на меньших разрешениях потом талент апскейлом пройтись...
Иногда вижу в промптах на пони картинках BREAK, особенно часто после ебалы со score_14, score_88. BROKE же юзается только с регионал промптом? Или в пони какие-то другие приколы, подскажите плз. Пример на пике
>>925488 ну просто остатки блоков типа нулями заполняются без данных для клипа, у тебя создаются два блока по 75 токенов, оба этих блока поступают в клип и пидорятся друг об друга в процентном отношении количества брейков в промте, чуть большее управление промтом кароч, но ничего меджик там нет, условно есть блок 1 с "pussy", есть блок 2 с "anus", на выходе у тебя будет конкат токенов до "pussyanus" если токен пул вмещает, либо если не вмещает то чтото типа "pusnus"
>>925496 для в целом артов пони, там ебанешься стилей можно накачать, в не нсфв оно тоже может если прям фул нон нсфв ну незнаю допустим колорс, плейграунд 2.5, итеркомп, дохуя кароч всякого, по цивитаю походи
>>925430 >>925498 блять подключи ипадаптер, ебни в него рефов, используй его как основную модель для ультимейта с какойнибудь быстрой моделькой для восстановления артефактов или там номос вебфото хуй знает дохуя говна всякого быстрого, хуяк проблема решена
Анончик, как в фокусе выделять части объекта? Например, хочу просто ткнуть в фотболку на фото. И она типа выделилась. И я пишу такой рубашка. И она типа в рубашку. Так реально? А если нет, то в фордже такое как сделать?
>>925577 >про маски и альфы Там есть опция загрузить маску. Это надо сначала в фотошопе нарисовать маску, потом сохранить. Потом загрузить в фокус. Где тут наносек не поне
>>925582 Там маска делается налету. Братан, я когда в последний раз юзал фокус, илюха там что-то обновил с инпеинтом и он стал каким-то имбовым, я игрался неделю и твоя задача там самая элементарная. Недано были все гуи, сейчас у меня только комфикал, не могу наглядно показать.
>>925592 Так не могу, разработчик не выложил воркфлоу, а только скрин его, и модели не ноды не выложил. Алсо этот разработчик на столько охуел, что он их продает по отдельности.
>>925498 Скоро 2025 год... Пикрил как квинтэсенция прогресса сдхлама. Зачем вы тут сидите хуй знает сколько лет, нахуя? Чтоб высрать пару пиков кривого месива и тонну шизотекста? Какой позор...
>>925711 кто тебе ваще сказал, что это квинтэссенция сдхлама долбоеб? какой-то криворукий анон на ускорялках выкладывает пик и ты берешь это как удобный аргумент против сдхлама? ты внатуре долбоеб или просто троллишь сдаунов тут? ток честно
>>925445 Можешь мое воркфлоу пощупать, группа 234 пасс апскейл, на последнем уже деформации иногда вылезают. Если поменять его на плиточный то должно быть норм. Делал специально что бы суть картинки из первого семплера не меняло, как происходит у обычного хайрезфикса. Да и апскейл модель надо нормальную а не нмкд, я её использую ради скорости и если что то годное переключаю на номос или фейсап.
>>925890 > >А есть расширение для автоматика чтобы как в фокусе всякие разрешения списком были , и можно было просто щелкнуть и выбрать? Есть конечно. И такое есть.
>>925871 >Superpromt Точнее как его завести. Потому что ллама у меня всю оперативу выдирает и крушат через 5 генераций. И где скачать ноду Workflowstyler Конфи менеджер ее не находит, хочу твой воркфлоу завести у себя потестировать. Алсо он у тебя ещё больше стал.
BREAK нужен в тех случаях когда у тебя промпт длинной больше 75 токенов и, допустим, последняя строчка "...girl with black hair, pussy", а 75 токенов ВНЕЗАПНО приходятся на тэг "black" Получается первый пул будет содержать весь промпт + "girl with black", а второй только "hair, pussy". И это выдаст тебе тянку с негром, у которого волосатая пизда. Да, пример притянут за уши, но технически так и работает. В остальных случаях это либо шизофрения, либо пчелы так пытаются систематизировать себе промпт для удобства.
>>925915 Ну там в подсказке у ноды(kjnodes вроде) есть ссылка на хаггинфейс с моделью суперпромта. У самой ноды я правым кликом сконвертировал позитив в инпут и подключил еще какую то простую стринг ноду в качестве текстового ввода. У ноды контитионинга тоже сконвертировал текстовое поле в инпут и воткнул в него ноду суперпромта. Сейчас не могу посмотреть, по памяти описал.
>>925915 Да еще, если что то не находится в комфи менеджере переключи канал на дев, после установки обратно не забудь. Еще что то ставил требующее правки уровня безопасности в каком то текстовом файле комфи, уже не помню.
>>926036 >>926041 Спасибо, я вот эту ноду найти не могу, в дев переключался - не находит. В файле тоже что то правил про безопасност ьи установку, я уж не понмю я это делал раньше.
>>926123 Аа. Это просто стайлер промтов, я его скукожил объединив вместе с нотепадом что бы места меньше занимал. Просто удали и замени на свой. Чем я ноды объединяю не помню, ставил компактное воркфлоу дмд2 с цивита когда то и оттуда взялось.
>>926128 >Это просто стайлер промтов, я его скукожил объединив вместе с нотепадом что бы места меньше занимал. Просто удали и замени на свой. Нихрена не понял, я сего заменил он мне ошибки начал срать. Скинь скрин этого узла пожалуйста.
>>926139 >Я просто не понимаю в чем Профит. 1. Экономия времени 2. Более четкие изображения: deep shrink и raunet уменьшают шум и улучшают чёткость изображений 3. Улучшенная детализация: RAUNet, благодаря механизму внимания, улучшает качество проработки деталей 4. Избегание артефактов размера вне обучения, что было сказано выше
>Разве не лушче сделать 2 прохода семплиплавания? Ну допустим ты генеришь большое изображение, а там хуяк и ебло вытянулось и пять рук. Твои действия? С денойзом 1 по втором кругу пройдешь и думаешь решит проблему?
>>926120 >например чтобы делать фото человека в нужном кропе (по пояс, полностью, лицо,...) лутше всего просто взять контролнет с позами >по стилям лучше всего взять ip-adapter и загрузить в него референсов + лоры
>>926116 ничем не лучше, в первом основная фича что разные промты в клипг и клипл можно отправить (нахуя), во второй незначительные опции и денойз переименован в стараттстеп
если не юзать ксамплер, то удобный кастомизируемый saplercustom есть, денойз если че это функция завязанная на шедулере
>>926168 там старт/конец доаунсемплин/апсемплинг и старт/конец кросс атеншена
Для симметричных изображений с низким количеством объектов: DU (Downsample/Upsample): Увеличение количества шагов для этой части приведет к уменьшению свободы модели, что создаст более симметричные изображения. Установите start step на более ранние значения (например, 0–10% от общего количества шагов) и end step ближе к завершению процесса (например, 70–80%). XA (CrossAttention): Примените меньше шагов для этой части, чтобы уменьшить количество объектов, которые модель будет отслеживать. Настройте start step ближе к середине процесса (например, 50–60%), чтобы детали изображения уменьшились, и end step — ближе к концу (например, 90–100%).
Для изображений с большим количеством объектов: DU (Downsample/Upsample): Используйте меньше шагов, чтобы сохранить больше свободы модели и позволить ей генерировать больше деталей. Установите start step на более поздние этапы (например, 40–50%) и end step ближе к концу (например, 80–90%). XA (CrossAttention): Примените больше шагов на более раннем этапе, чтобы уменьшить количество объектов. Установите start step на низкие значения (например, 20–30%), чтобы начать упрощение изображения раньше, и end step — ближе к завершению (например, 70–80%).
>>926122 Много онлайн сервисов. На сивитаи например. Тут кто-то фармил 1к базов в день мультиакками и репортами на свои же пикчи. Ещё долбоёбы делают мержи итт каловые и рекламят их итт, за скачивания их говна тоже дают базы.
>>926225 Я просто не стал захватывать на скрине что бы не путать лишней информацией. >>926123 А вот как выглядит эта красная хрень на пике2. Да я еще генерю в этом воркфло сначала ХУплотом 10 сидов, выбираю норм сиды и тогда выключаю плот и включаю 234 что бы уже норм пикчи в апскейл шли.
>>926216 Спасибо, в целом я все вроде сделал правильно. Но у меня сам суперпромт выдает ошибки, я у чата жпт спрашивал, он херню какуюто овтечает отвечает. Думаю снова с питорчем какие-то проблемы
>>926271 В общем меня не устраивал тот, что завелся. И я взял и создал свой с блекджеком и шлюхами. Это хуже чем ллама, но зато быстрее в разы и не жрет тонну ресурсов.
>>926352 Я тот что в комфи настроил, без убагоги. И она мне жрет память. Потому чт оуриворукик обезьяны снова не довели код и не вписали строчку по очистку памяти. Алсо на гитхабе уже какой то индус создал просьбу сделать этот функционал. Но видимо придется это делать самому. Алсо это быстрее лламы. Лама у меня генерит 1 минуту.
Аноны накидайте каких-то годных токенов, которые дают эффект на натвиз дмд. А то я уже одебилел от from side/back/above, vaginal/blowjob/handjob, hand on head/breasts/ass, standing/kneeling/lying.
Сам иногда юзаю screengrab, fancam в сочетании со всякими дефолтными стилями форжа. Может ещё какие-то натуральные, но заметные эмоции кроме smug, excited, worried, moaning?
"Создайте обширную и сложную абстрактную сцену, которая отражает суть яркого онлайн-сообщества, изображая динамичного персонажа — молодую женщину с развивающимися волосами и выразительной мимикой. Она радостно танцует в цветной среде, вдохновленной культурой 2ch и уникальной эстетикой двочеров. Ее движения плавные и грациозные, воплощая дух творчества и свободы, который процветает в цифровом пространстве.
Окружите ее богатым гобеленом закрученных форм и узоров, символизирующих движение и энергию. Используйте разнообразную палитру ярких, насыщенных цветов, которые плавно переходят друг в друга, создавая ощущение глубины и динамики. Фон должен быть завораживающим калейдоскопом оттенков с плавными переходами, вызывающими чувство восторга и погружения в цифровую мечту.
Включите абстрактные представления цифровых ландшафтов, такие как глитч-эффекты, пиксельное искусство и фрагментированные визуалы, чтобы отразить влияние интернета на современное искусство. Добавьте игривые элементы, такие как плавающие текстовые облака с юмористическими фразами, мемами и знаковыми изображениями, которые резонируют с культурой 2ch, органично вписывая их в композицию.
Усложните изображение, интегрируя различные символы и мотивы, представляющие разнообразные интересы и увлечения онлайн-сообщества. Это могут быть ссылки на популярные интернет-тренды, игровую культуру и художественные движения, возникшие на цифровых платформах.
Рассмотрите возможность включения элементов сюрреализма, где границы между реальностью и цифровым миром размываются, создавая причудливую атмосферу, которая приглашает зрителей исследовать сцену. Выражение лица персонажа должно передавать чувство радости и связи, отражая товарищество и общие переживания, найденные в онлайн-форумах.
В целом, произведение должно отмечать индивидуальность, креативность и яркие связи, формирующиеся в онлайн-сообществах, захватывая суть современного самовыражения таким образом, чтобы оно было как визуально потрясающим, так и заставляющим задуматься."
>>926585 >>926616 Говно какое-то. Скорость как у флюкса, но качество такое себе, сильно хуже флюкса. Ещё и ломучее, семплинг очень чувствительный. Всё в каком-то зерне, блюр на месте. В дашкам нормально не смогла, в русские дворы не может. Ещё и клипом насрано.
>>926711 > нет блюра На месте он. Может чуть послабже, но всё так же в 5 метрах всё в нём. Самое главное что качество днище. Возможно из-за fp8, но fp16 не лезет в 24 гига. На флюксе не было таких проблем из-за fp8.
Обновил комп. Думал, сейчас легко накачу и буду развлекаться. Открываю ссылку. > ДАННАЯ ИНФОРМАЦИЯ СИЛЬНО УСТАРЕЛА НЕ АКТУАЛЬНА! ОНА БЫЛА НАПИСАНА В 2022 ГОДУ!
Зачем вы это говно из треда в тред тогда постите, раз это не актуально?
>>926976 >легко накачу и буду развлекаться Чел, зачем, в этом треде картинки не надо генерить.Пости больше различного текста, будешь уважаемым сд профессианалом
>>926976 Да, ты прав. Автоматик надо нахуй снести будет из шапки как уже устаревший UI.
Только может уже скоро никаких гайдов по установке не нужно будет, так как готовят наконец-то нормальную программу для нормисных потреблядей с двузначным IQ.
>>926995 > олько может уже скоро никаких гайдов по установке не нужно будет, так как готовят наконец-то нормальную программу для нормисных потреблядей с двузначным IQ.
Да какие нахуй гайды, нормисы, хуёрмисы. Надо следить и актуализировать информацию, а всё, что не нужно просто убирать чтобы не надо было разбирать это устарело, не устарело, потому что потому, а вот тут ещё одна хуйня, но её надо устанавливать сюда, а если ты это установишь, то предыдущие шаги тебе не нужны.
>>927001 >чтобы не надо было разбирать это устарело Ну так нихуя не устарело.
Ничего кардинально во всех крупных УИшках не менялось ни в установке ни в запуске моделей. То что кто-то забросил свой гайд не означает, что разрабы вообще че-то поменяли в том, как их софтина устанавливается и работает.
Автоматик нужно будет убрать в силу отсутствия поддержки Flux, для всех остальных целей он продолжает работать, как работал и в прошлом году. Остальные UI имею портативные версии, которые даже не нужно устанавливать, достаточно запустить.
>>927011 >имена художников Современная модель на хер знает сколько параметров которая может в промт... гы гы гы я сддаун и гинерю дефолт портрет-ебло и стоящую бабу на фоне гы гы гы, крута
>>927022 Она бы устарела, если бы по ней больше нельзя было бы установить Автоматик. Гайд был сделан на основе гайда от самого Автоматика в гитхабе, который тоже не менялся.
И вообще установка это хуйня, если ты с ней не можешь справиться, то научиться пользоваться всей этой хуйней уж точно.
>>927053 Ага, уже начал копошиться в этом говне. Модели были сначала с одним расширением, а теперь с другим. Для комфи кидай в сюда, для автоматика сюда. А вот дифьюжен это другая модель, её запускать вот так. Как обычно, опен сорс уровня говномидас.
Как называются базовые модели SD1.5/SDXL? Просто куча разных названий, в комфи 526mixV15_v14.safetensors, sd-v1-4.ckpt, v1-5-pruned.safetensors, sd_xl_base_1.0.safetensors, sdXL_v10VAEFix.safetensors, stableDiffusionV15Bf16Fp16NoEma_v15NoEma.safetensors
Учитывая что на Флюхе так и не смогли обучить ни одну нормальную кастомку (которая бы не отличалась от базы), может все таки пора возвращаться к истокам - Stable Diffusion тред?
>>927483 Как будто сд с таким же размером смогут натренить. Флюкс тренился заебись, проблема лишь в том что очень медленно, что там будет у сд пока не ясно. Особенно с таким зоопарком текстовых энкодеров. Быстрее дождёмся нормальных мультимодалок на трансформерах, чем нормальный DiT. А если и ждать чего-то от DiT, то только в реализациях с одним текстовым энкодером, а не тремя, где никто не понимает как правильно с ними работать.
>>927486 ну тут сд35 народу кинули косточку, что их малому доходу ничего не грозит, а под капотом тоже дит с т5, так что шансы хорошие, что кто-то сделает понивизионлюстрас
>>927350 Не пробовал модели, тем более это криворукие файнтюны, с которыми лоры не работают, а поэтому просто бесполезный мусор. Пробовал только лоры, вот они ебут. Всегда юзаю сначала ускоренную лору перед тем как выбрать промпт, а потом начать генерить в 12 шагов, чтобы выбрать сид и уже потом сгенерить и апскейльнуть.
>>927644 проблема не в траве, нужно просто по-разному лежачих, но они даунодебилы порезавшие датасет чтобы харам не допустить, заставили дураков они себе и лоб расшибли теперь люди не могут ничего делать кроме клозап портретов
>>927644 Блин я понимаю что на пиках пиздец, но сука мне сам концепт прорисовки и композиция нравится. Хз как бы это сказать... Выглядит приятно глазу, если не смотреть на кривоту. Короче забейте...
>>927740 Да говори прямо: ты говнямешник, готов любую кривую парашу сожрать, если оно в этой стилистике. И таких как ты несколько миллиардов. Самое тупое, что это помойное веяние просочилось в нашу культуру.
>>927780 Но ты не прав. Я не смотрю маняме. Играл в пару гач и то из-за своей лудомании, а на стил глубоко поебать. Конкретно тут чисто травой со 2го пика восхитился. Как раз из-за того что нет опыта созерцать манямекал, иначе бы я скорей всего блеванул. Ну тут ты прав, что на самом деле и в сдхл получше есть арты, да.
Как же снова хочется заученными низусть комбами на сабзиро разъебать весь двор пацанов, приходивших ко мне поиграть на сеге меге драйв 2 в мортал комбат 3 в конце 90х...
как инпаинтом раздеть тянку на фото в комфи? как ни пробовал херня выходит, лору использовал on/off а в других тредах видел как идеально это получается
если такой результат при генерации обученной лоры 512 то это перетрен? steps: 30 cfg: 3.0 sampler_name: euler scheduler: normal v1-5-pruned.safetensors
>>927550 аурафлоу вообще опенсорс с комершлюзом без лимитов (у сд есть лимит в лям баксов и подписку на стабилити), других таких моделей нет, у флюха вообще НОЛЬ ШАНСОВ
>>927935 >как инпаинтом раздеть тянку на фото в комфи? нужна любая модель мокропися которая является инпеинтом (контролнет, брашнет, факасные модели, чем там еще)
>>927114 Для тренировки фул модели - с EMA, для лоры без EMA. Pruned это модель где веса подогнаны до какого-то знака полсе запятой (убран незначительный хвост), либо в широком смысла очищенная от джанк весов, которые не имеют значения для генерации, либо конверт до fp16, либо ema only/non-ema.
Насколько я знаю у SDXL нет EMA версии отдельно, , либо она в диффузерах распакованных лежит (тож не видно что лежит, ток веса в fp32), хуй знает, вероятно для трена фул модели достаточно самой модели без Exponential Moving Average, буквально пару упоминаний нашел на среддите об использовании тренировки сдхл с ема.
>>928098 Сделай джва теста: 1. Увеличь вес лоры x2 и посмотри результ 2. Добавь к лоре с весом 1 любой ускоритель инференса (DMD2) и посмотри результ. Если в первом варианте на весе 2 появятся только намеки на оверхит весов, а во втором варианте получишь стабильное изображение (которое может быть отдаленно похоже на датасет) - это недотрен.
>>928135 Но ты и сам говнодел, который отличается от битарда в /b тем, что "умеет писать" более сложный промпт, чтобы не вышел "дженерик", и дрочит отдельные детали в img2img до посинения. Вся суть ии-говна - скачать пак говна посвежее и научиться в интерфейсе, понятном даже ученику начальной школы, ловчее других кнопочки нажимать. Ну, ладно, идите нахуй, илитарии интеллектуальногл дна.
>>928161 Обычно для ггуф версий юзаются родные вае и клипы, как это было с флюксом. А не лучше ли юзать не ггуф а фп8 с бекндом клипа и вае в 1 чекпоинте?
>>928166 Уже разобрался. Я просто взял ггуф версию потому что она меньше весит, просто хочу посмотреть что она может, если понравится тогда скачаю фп8 версию нормальную.
>>928166 >А не лучше ли юзать не ггуф а фп8 с бекндом клипа и вае в 1 чекпоинте? так оно полностью в 12 кеков не влезает, да и смысл если потери от квантов минимальны до Q4
>>928250 >А флюх типа не базовая? там хуман оптимайзед выдача, встроенный DPO, текникалли да - не совсем базовая >Чет я не вижу как все подорвались файнтюнить твою базовую 3.5. Собсно как и просто 3 тоже никому всралась. прям как флюхкал, которому... 3 месяца уже.
Какое же цензурированное говно эти ваши модели. На цивиате только мерджи одной и той же хуиты. Нет бы какие ни будь ускоглазые братишки натренили нормальную модель, ака пони, только на реальных фото. Говно.
Шифт достаточно сильно влияет на итоговое изображение кстати, если у вас лезут какието мутантны - поднимайте шифт.
vintage pinup illustration of sexy woman, white srockings and red high heels, 1950s style, american army poster graphics (ошибки в словах специально вставляю чекаю как т5 реагирует - и оно реагирует в целом ок, без т5 уже контекст теряет вроде получается)
>>928296 блять нет смысла генерить реалистик фото так как эту всю хуету базовую обучают под фентези залупу да стили всякие, хочешь реализм либо сам обучай как натвис ибет либо файнтюн
>>928413 Ебальник закрой уёбище, которое носится по треду в поисках моделей которая генерит педоговно, в рот срал тебе пидарасу подшконарному и таким же как ты хуесосам.
>>928135 >ссаные говноделы Ахахаххаха, проиграл в голос с подрыва пердака сдшиза, который высирает текст вемсто картинок каждый тред. Эти так называемые "говноделы" в неделю генерят больше уникального контента чем вы за год, при этом 80% тех пиков не сгенерить в сд никогда. В голос с сддауна немощного.
>>928514 Какая разница, это ведь для говноделов в б, сд-профессионалы таким не пользуются, и вообще генерить картинки это для даунов. Надо больше текста в тред высирать, показывая какой ты ниебать профи.
>>928531 да хуйня клоузд соурсная с порцией сои от гугла. Раньше она выдавала черных средневековых европейских королей по дефолту. Сейчас напихали миллиард параметров в него и тренируют новые совевые фильтры для него посредством полезных идиотов - пользователей.
Следовательно здесь дохуя обсуждений пердолинга, иначе и невозможно
А самое главное: нахуя тебе тут нужна куча из картинок, дурачок? Какая у них ценность? Ценность в композиции и только в ней, а так как формирование композиции сегодня невозможно контролировать, то и выёбаваться тут своими картинками смысла нет, лни все по умолчанию говно.
Это фундаментальная проблема
Больше скажу: именно у локальных нейронок есть шанс выбраться из этого тупика, потому что есть хоть какие-то возможности влиять на композицию с помощью ковыряний в коде/настройках, лор, тюнов и всяких там контрлнетов и прочего подобного.
Но для этого нужен пердолинг
А вот как раз таки петушня в /b/ скорее всего не осознает фундаментальной проблемы с композицией
У вас там в /b/ сидит куча дегенеративного быдла которое натурально верит в то что они генерируют произведения искусства, лол.
Ваши генерации – говно по умолчанию. С точки зрения художественной ценностью. С точки зрения веселых кекесов – да, отличный контент. Сам захожу иногда порофлить
Но на большее можете не рассчитывать.
База – это композиция.
Контролировать формирование композиции сегодня практически невозможно.
Локальные сетки могут попробовать что-то с этим сделать, а онлайн-геераторы это по определению говно для быдла, которое требует только тыканья в кнопку генерации
>>928660 Никаких различий в квантах нет, флух просто тормозной кал, в отличие от терпимо медленного без лор ускоряло обычного 3.5, и ультра быстрой турбы, которая в адхеренсе промту практически ничего не теряет при сравнении с фуловой 3.5, в отличие от дев флукскала и шнели, где буквально разные модели, и шнель вообще не слушается, даже текст генерит через жопу (а 3.5 турбо прям четенько всё).
Так ты уходишь или нет? продолжаешь сидеть с обосранными штанами и злобя скрепя зубами? И ещё хватит Сам Самыч семенить тут, у нас и так хватает одного шиза, который сам с собой спорит.
>>928712 > >q2_0 В голосину. Буквально: — Мне Шаляпин не нравится. Фальшивит, картавит, тенорок какой-то слабенький... — Хм. А вы где его слышали? — Да мне недавно Рабинович напел по телефону
>>928417 >Ебальник закрой уёбище, которое носится по треду в поисках моделей которая генерит педоговно, в рот срал тебе пидарасу подшконарному и таким же как ты хуесосам. > >>928796 >Алсо модель не подскажите? > Вся суть, лол
>>928333 пора уже всем создателем ии предложить сделать трусонюхательный бенчмарк который будет выдавать результаты занюхов в баллах, если в одной проге были попугаи, то тут будут трусарди
Что бы использовать img to text Изображение в текст. Подойдёт любая модель? Или нужна модель которая умеет в зрение? Какая у меня цель: 1)Закинул изображение 2) ИИ его читало и описало ят она изображении 3) потом она его перевала в промт И дальше уже на основе ег ошкнерирвоать. Но я столкнулся с проблемой, либо они с цензурой, либо они очень много весят. Какие могут быт альтернативы? Я прчото не совсем понимаю какая именно модель нужна языковая или какая то особенная со зрением
Если к языковой нужен какой то условный клип вижен, то ок. То что на гихабе нашел, оно работает с конкретной одной моделью, го она мне не нравится, так как цензурированная.
>>928830 Дополню Как я понял нужна мультимодальная модель? Есть какой либо рейтинг таких моделей? В ллама треде видел ссылку на рейтинг ллм моделей без цензуры. Или может посоветуете какие то другие варианты? Или может кто знает какую т оуонретную модель. Нашел дельфин модель, но она весит больно дохрнеа.
>>928992 Джагер так видит... >Japanese girl, school uniform, outdoors, sky, day, cloud, tree, blue sky, backpack Но судя по гуглу у япошек есть такие вишнёвые деревья как раз в области Фужи они так и выглядят.
>>929020 Да это так, между делом к теме японок итт в дефолтном воркфлоу побырому... С апскейлом наверно было бы годно, да, но я уже и пикчу удалил. Пофиг.
>>928822 полтораха ещё умела такое, только всем не нравилось, называли артефактами абберациями фюзед ебалами и стремительно файнтюнили, чтобы не появлялось
>>929127 Ас южуал 3060, но учитывая что квант 4 весит 4.7 гига, а чам 3.5 может работать без т5 ток на клипах то 6 гиговые могут тоже радоваться, а уж 8 гмговые и подавно, там еще и т5 войдёт
Я тут немного ебанулся и решил поиграться с одностеповыми юнетами, а именно DisBack и DMD2, результ получается очень даже интересный, лцм перестает работать, но зато все остальное работает + негативы. На пикчах две итерации переноса обучения + по паре токенов в поз и нег и 10 шагов.
говорят тренить лоры на 3.5 вообще легчайше, модель все сама делает, прям для даунов сделали учитывая что письки вырезали очень аккуратно - добавить концепт это дело 60 часов обучения лоры
>>929221 >а т5 это текстовый энкодер? да, а если точнее то это языковая модель text to text transfer transformer
>какие они ещё бывают и чем в отличаются ну клипы есть и есть т5, клипы работают с токенами/концептами не вдаваясь в их совместное контекстное использование - это база, все сетки работают на клипах, а трансформер как языковая модель обисняет сетке что концепты оказывается могут взаимодействовать и иметь конкретное предназначение, в целом тут больше архитектура сетки решает на самом деле - прикрутить т5 и с юнету можно (как ELLA), только эффективность будет далеко не на уровне дифужн трансформеров, которые предназначены для дифузных изменений, а юнет это слоеный пирожок прост