Stable Diffusion тред X+91 ====================================== Предыдущий тред >>773160 (OP)https://arhivac.top/?tags=13840 ------------------------------------------ схожие тематические треды - NAI-тред (аниме) >>770324 (OP) - технотред >>758561 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Полный функционал в локальной установке (см. ниже)
>>777796 (OP) Ебать, какая же хуета в шапке по горам написана. Ещё и от пикабубляди тупой. Насчёт гуглколлаба понятно, что там все поменялось и сдохло уже давно. Но главный обсер - это пикрил. Никогда так датасет не делайте. Фотки должны лишь слегка отличаться по ракурсу, крутить головой никуда не надо, иначе будет говно получаться. И нет, нихуя вы описанием не исправите это. А вообще лучше видос хача по лоре посмотрите, там по датасету хорошо рассказано, да и по настройкам в кохе тоже.
>>777887 >то как нейронка научится рисовать голову со всех сторон Она это и так умеет. А если будешь вертеть, она тебе ебало будет уродовать. >>777896 >А нахуя это вообще когда есть ipadapter? Адаптер дохуя чего делает криво. Хоть и его сильно допилил автор со временем. Адаптер это только ебало натянуть и то не всегда хорошо в фотореалистик, а лора это именно сгенерить нужное ебало в любой стиль. >вечно говно тренилось Так это потому что не стоит слушать всяких ебанатов с пикабу и некоторых долбоебов из треда.
>>777901 >А если будешь вертеть, она тебе ебало будет уродовать. Но ведь эти повороты протегированы. А иначе как вообще негронка поймёт, что у тебя справа залупа какая-нибудь?
привет двачик год назад или что-то около того баловался со стейбл дифьюжн, сейчас замотивированный покупкой новой видеокарты скачал вебуй автоматика, а он не может выбрать модель, выдавая ошибку AttributeError: 'NoneType' object has no attribute 'lowvram' кто-то сталкивался? как фиксили? или лучше что-то другое поставить
>>777961 буква не лишняя, и атрибут этот вообще не установлен
>>777928 >>777963 поставил портабл вебуи автоматика от христа, вроде сгенерило что-то.. однако я не менял модель, там стояла по умолчанию одна, но уже генерит емае комфи обязательно заценю, автоматик мне просто привычней, спасибо!
>>777980 не, анон эта конвертилка не подходит, она только если исходный файk .bin А в папках целевой репы лежат savetensors, и их несколько, вот например в папке unet свой
а я че нн понял чета, сдхл долго поддерживать будут? сколько контента для нее сравнении с сд1.5? а то я ток ток обновляться для сдохли планирую, а тут уже сд3
>>778053 Народ до сих пор модели и лоры для 1.5 делает, ХЛ тоже никто быстро не бросит. А если стабилити разосрутся совсем с автором пони, то вообще так на ХЛ и останемся, контента уже для СД3 не будет нихуя.
>>778060 ну да, еще же САМ ХАЧ говорил что сдхл не развивается потому что он для нее ничего не делает, потому она загнивает, а теперь он вообще делает свою миджорню с блекджеком и еуропеан вуменами, так что пизда сд3 походу, мертворожденная хуйня
>>778037 вот пробую, пока в коллабе блокнот пишу. Забыл поблагодарить - спасибо тебе анон, надеюсь получится. В этой репе пиратов овердохуя лор, которых нет на циве, но есть в их платном сервисе в ТГ и на сайте (из РФ не пускает). + раз в неделю по 10 новых лор тренят-добавляют. Гем будет если найду способ перегонять папки в 1 файл
А он сам (Хач) блядь, развивается? - всратая флекси за 1000+ руб мес - винтвикер за деньги, который делает все то же самое, что и privacy.sexy - всратые нахуй не нужные сборки говна на своем бусти для донатеров - уже полудохлый дискорд, где ЧСВ улетает в стратосферу у модераторов (его друзяки)
Вот например, последний пример "контента" для донатеров из его бусти:
- Делаем рабочий сайт в нейронке за 5 минут без монтажа (портативка хуеты которая генерит HTML+CSS) - Говорим с нейросетью по видео в реальном времени (говно-прототип sad talker, которому надо 20 гб VRAM и он работает через раз) - Обновление Stable Diffusion 1.9.0 (прохладная стори на 10 минут о том как перенести его уникальные нет стили в новую версию) - Достаём детали из каши (уникальная методика размылевания Делиберэйт методом латент апсейла с денойзом) - Портативка Rope (крашится при запуске в 1 из 3 случаев) - Моя новая методика Upscale ( нихуя, не угадали блядь, это tile control net + inpaint) - ControlNet – новые техники ( замена фона и замена персонажа, пиздец) - Portable VideoTranslator by XpucT (портативка, которая переводи 30 секунд спикера на видосе и делает липсинк, но если только он сидит ровно в кадре)
Это все посты для "своих" донатных с 1 января 2024 года. А сдхл, да, не развивается
>>778053 >сдхл долго поддерживать будут? ты так гвооришь как будто сдхл это какойто централизованный сервис >сколько контента для нее сравнении с сд1.5? что ты подразумеваешь под калтентом? >а то я ток ток обновляться для сдохли планирую ну обновляйся, все равно норм рейтреный сд3 будут не раньше 3-6 месцев после выхода
>>778090 Имаджинирую как он будет визжать везде 12 июня, что Sd3 - говно, флекси лучше лол.
Вообще пиздец, что происходит с ютуберами по SD в рузоне. Хач - понятно Стайблдифф связался с каким-то клоуном и инфоцыганят курсами Нероген банчит доступом к апи-ГПТ4 и подзабил болт на дипфейки Все тематические группы в ТГ превратились в ебаные одноклассники с генами-открыточками "какой класивый пуфыстый котик" Порриджи срут бесконечными встатыми видосами для эпилептиков из анимэйтдиффужина.
Покажите хотя бы одного из них, кто сделал свою ноду, запилил расширение для каломатика (зум-канвас не в счет), обучил XL с 0 на партиотично-ориентированном датасете и запилил RUXL
>>778156 >А чё хатч его вообще с сивика выпилил, у него же там рейтинг неплохой был? 1. Бомбанул что его Делибу во все ремиксы суют а монеты не капают 2. На него стали репорты кидать залупоголовые русофобы Совпало 2 фактора, естессно, он официально высрал, что цива стала говном и из сообщества единомышленников превратилась в донатную помойку. И пошел делать свою, с туберкулезными шлюхами и нардами. Так получилась Флекси.
Я перу недель назад случайно наткнулся на HF на сообщество, которое допиливает SD через каую-то оптимизацию степов ( метод на котором построена SD Flash). Суть в том. что метод работает и на XL и на 1.5. Так вот, там всего 5 юзеров, среди них Хач и его кореш по дискорду. Вангую, что это и есть "революционная Флекси". Так как в самой модели Флекси улучшений относительно 5 Делибы нет, только она быстрая, за 10 секунд высирает батч из 4 пикч, это вместе с прогодом адетейлера по еблам и рукам (во время генерации в дискорде это видно).
>>778175 Ну-таки щас его Делиба ничем таким не отличается, по части аниме куча моделей лучше, по части реализма тоже самое. Разве что за мало шагов надо для приличной картинки.
>>778224 >Лоурезы? 2048x2048 - это 4 пикчи слепленные в 1. т.е каждая 1024х1024. Он говорит, что арендует сервер чуть ли не с h100 за много тысяч долларов пиздит Доступ к Флекси есть только у донатеров, по бусти у него 9535 подписчиком, но сколько из них донатных - хз, скрыто. Я пытаюсь прикинуть сколько человек пользуется его флекей
>>778240 > Но настолько ли она маст хэв? Если в сложную лапшу вкатываться с апскейлами и прочим, то и 24 гига врам маловато. У меня на моём вокфлоу в пике 36 гигов сжирает. Лучше 3090 бери, чем мусор амуды.
>>778270 У него плотность запросов на всю флексю (в дискорде) суммарно по 2-м веткам (flexy и flexy18+) примерно 150-170 генераций в час , это если на за сегодня с 10 утра до 16. Хз вечеров\в выхи наверное больше. Вот уже можно и прикинуть на каком железе это судо крутится. Возьмем 200 в час, 4 пикчи батч за 10 сек. Получается по максимуму 800 пикчей в час без учета апсейлов выбранных юзером, рероллы входят в эти 200 выше. 800 пикчей в час это 13.3 (ну ок 14) пикчи в минуту. Но надо понимать. что генерации параллельные, не последовательные. Какая карта сможет вывезти? 2-3 4090?
>>777905 >Но ведь эти повороты протегированы Стейблу вообще похуй на эти теги, можешь сравнить результаты с тегами и без - будет одно и тоже. При условии что делаешь обычное ебало в фотореалистике. >>777903 Для коллаба без понятия у кого нормальный, для кои можешь по хачевскому делать, там вроде коя обновилась мальца, но это только оболочка, настройки местами поменялись просто.
>>778240 >какие сейчас карты актуальные именно для нейронок? ну требования для адекватной жизни это 12 гигов минимум
то есть 3060 (ну это база, большинство на ней и сидит) и выше если смотреть на прошлые поколения то в крайнем случае из 20, то там наверно только 2060 на 12 гигов, немного слабее по инференсу чем 3060, а в хорошем исполнении не сильно дешевле бу стоит
>изображение 1024x1024 35steps - ~40sec ну это конь в вакууме циферка, смотря что ты юзаешь в качестве семплера/шедулера/убыстрялок инференса, такто можно и вот такое показать на 5 секундах на 3060 скрин старый с каломатика, в комфи можно уложить в 3 секунды спокойно то же самое
> Очевидная 4090 стоит очень дорого. Но настолько ли она маст хэв? зависит от твоих задач, но если у тебя есть лишнее бабло то конечно мастхев
>Важно ли, чтобы видеопамяти было много? конечно
> Если выбирать между 4080 и rx 7900 xtx, у последней будет больше памяти. никогда не выбирай радевоны для нейронок, нвидиа онли
Раз уж все сидят ждут сд3 и ведут светские беседы, то скажите пожалуйста. Вот у меня бп на 500Вт + i3 12100 + 3050. Какую максимум я могу воткнуть видеокарту чтобы не менять бп? Бп вполне хороший deep cool da500
>>778306 >35 степс Бесполезный выебон кстати, большинство современных семплеров и шедулеров не вносят ничего нового свыше 20 шагов, а т.к. все еще теперь сидят с подключенными лорами на скорость, то выше 20 даже на суперконсистентном дедовом SDE нахуй не упали, где по дефолту как раз просчет адекватный гдето в промежутке от 40-50 шагов.
>>778317 у тебя заявлено 456 ватт на 12 вольтовой линии, так что теоретически в стоке оно запустит даже чтото уровня 3090,которая потребляет 350 ватт, проц у тя жрет ватт 90 под макс нагрузкой, но это будет что-то уровня на максимальной нагрузке ебать дипкок, что не оч хорошо, поэтому ящитаю что что-то уровня 3070 затащит спокойно, 3070ти с андервольтом тоже будет вероятно работать
лично у меня на 500 ваттном блоке с 436 ваттами по 12 вольтам из 2011 года висит разогнанная трехвинтовая 3060, разогнанный i7, 3 жестака, 2 ссд, ноль проблем, так что этого >>778337 пиздобола не слушай
>>778322 >даже на суперконсистентном дедовом SDE нахуй не упали, где по дефолту как раз просчет адекватный гдето в промежутке от 40-50 шагов. Ну, если с лорой то можно 8 шагов. На 3050 этот пресет 20 секунд.
>>778275 > RTX 2060 12GB - 1.21 > RTX 3060 12GB - 0.79 Странная какая-то хрень у него, когда он начал юзать лору и разрешение 1024x1536. Возможно он записывал лишь результаты первого прогона после холодного старта. И еще у него было примечание: > Он не учитывает скорость обработки окончательной отделки (VAE), поэтому не очень полезен. Проверьте фактическое время генерации. (пик1)
Нашел еще результаты его тестов, которые похожи на правду. Пик1 и Пик2 - это время генерации 5 иллюстраций.
>>778360 >что-то уровня 3070 затащит спокойно, 3070ти а еще есть нюанс что на них мало памяти, так что у тебя по сути то выбора нет либо на 3060 12 кеков садиться что точно потянет, либо 4060ti 16 кеков, что тоже 100% потянет
либо смотреть 4070 базовую (там база потребления 200 как моя 3060 сейчас лол, 40 серия вообще меньше требует питания, чем 30) и далее по нарастующей super+ti+super ti как ведут себя на 500 ваттах (полно шизов в инете кто тестит на старых блока новые карты, найдешь)
в общем я бы не брал наверно выше потребления 4070 ти супер карту под 500 ватт, да и ее бы андервольтил по итогу с 285 (хотя она в стрессе 270 всего жрет) до 240-250
>>778517 Ну +- то же что и у тебя. Суть в том, что сд3 лучше понимает LLM-ный промпт, чем тот, к которому мы привыкли. Пикрилы нароллены вот этим промтом, на основе твоего (прогнал через LLaMA3)
A nighttime CCTV screenshot captures Joe Biden, smiling and standing happily on a farm in Texas, holding a pig. In the background, a nuclear mushroom explosion is visible in the distance, illuminating the dark sky with its ominous glow. The scene combines the tranquility of the rural setting with the dramatic, catastrophic event unfolding far away.
Лол надо боро-тэгами попробовать, жопу у анимешников оторвет, если их повыкидывали
>>778626 >почему никто из МС не сольет веса.. Сомневаюсь, что даже у самих разработчиков есть возможность скачать веса, скорее всего все захардкоржено только на онлайн манипуляции с весами на сервере.
Поэтому ждать чего-либо от мелкомягких, кроме попыток заработать, не стоит.
Промт: 1girl, blazer, blouse, cosplay, darling in the franxx, emerald hairband's horns, long hair, pink hair, scarf, university uniform, tie, long skirt сука 3 предупреждения словил пока роллил, ебаная цензурапришлось СИЛЬНО поменять промт
1 и 2 пик: тупо промт, как есть 3 и 4 пик: "очеловечивание" с минимальным показателем пиздежа LLM
Промт после LLM:
A young girl with long pink hair styled neatly, wearing a university uniform consisting of a blazer, blouse, and long skirt. She has a tie and a scarf around her neck, and she is cosplaying as a character from "Darling in the Franxx." She has an emerald hairband with horn-like decorations.
Причем, боро теги напрямую ни разу не дали 3d фото, а LLM-версия примерно каждый 3-4 ролл.
>>778652 >Поэтому ждать чего-либо от мелкомягких, кроме попыток заработать, не стоит. Не, надежда есть, должна быть. Надежда на то, что по традиции, МС наоткрывала кучу дыр и весь захардкоженный сервис когда-нибудь сольют рэдхэты. Но, есть другой путь: у анона есть в наличии датасет с 1 млн пикч сгенерированных в Далли и закапитоненных под тренировку. Осталось только найти того, кто сможет обучить ванильную XL\SD1.5 и оплатить сервер для трени.
кто юзает дейр? вчера напиздячил модельку с охуенной выдачей 10 из 10 качество, седня загрузил настройки по картинке - пиздец вообще другой результат выдает, все в говне и мутациях с артефактами, как это вообще получилось? там какая-то ошибка чтоли вчера случилась на одном из изменений настроек и оно высрало невъебенный результат неповторяемый? пиздец припекает, и повторить не получается!
>>778901 >вчера напиздячил модельку с охуенной выдачей 10 из 10 качество >седня загрузил настройки по картинке Видюха остыла, погоняй десяток промтов на другой модели, как прогреется - пробуй Мимо Хруст
>>778943 я блять не шучу, дейр какойто мерджер шредингера щас обнаружил что если подмешиваемые модели менять то результат меняется каждую итерацию в более лутшую сторону что вообще за пиздец
>>778965 анон, ты что-то в слоях и\или блоках модели поломал. Не прогнозируемое поведение с нерелевантным результатом говорит о нарушении последновательности или обработки промта или алгоритма формирования шума в латентном простанстве Я думаю - у тебя первое, судя по твоему рассказу, так как второй случай рандомно выдавал бы тебе частично и полностью зашумленную картинку. Есть один ненадежный метод проверить теорию, но для этого нужна Комфи и пара кастомных нод, которые умеют работать со слоями uneta (ввод-вывод) напрямую. Если готов заморочиться - вот видос что это такое и как это повторить дома: https://www.youtube.com/watch?v=0ChoeLHZ48M
>>779039 не, промт то оно как раз отлично обрабатывает дело именно в собранном изображении после ноды маски и самого смешивателя дейра я впринципе повторил результат качества, и повторение заключается в том, что модель 2 меняется поочередное то на одну то на вторую, каким-то образом дейр ноды обфильтровывают по второму кругу результат, а не вайпают его и строят заново, как было бы логичнее, помимо этого даже если менять условные итерации в дейре, не меняя модель, то при возврате на предыдущее кол-во итераций получается чуть другой результат, как будто там где-то рандомный сид меняется у шума или маски
эффект очень интересный и я не понимаю как он работает, потому что из двух говномоделей которым нужно прописывать кучу токенов качества или юзать лору убыстрялку получается одна модель которой не нужны никакие лоры и достаточно пары токенов чтобы получить консистентное фотореал изображение с правильным всем и практически без артефактов в 95% случаев
>>779262 похоже проблема в block/dare ноде, но на других нодах например на атенштнене все равно остается эффект смены финального изображения при смене модели для мерджа и возврата обратно
>>778883 >SD3 на голову выше. СДверун порвался... И как обычно без аргументов, сравнений с пиками и промтами как сделано было выше. Тупо Я СКОЗАЛ! Верьте мне на слово.
>>779284 >не постит? Ещё как постит, всякую около-филоссовскую хуету, всех позорит, гвоздит, регулярно срывает покровы) Как увидишь стену нат-релейтед текста, это он...
>>779603 >плэйграунд 2.5 Я вообще не понял что эта за хуета такая, у меня только шум был, перепробовал все семплеры/шедюлеры - результат один и тот-же, качал с хагинфейса.
>>779613 анон, ты бы хоть скрин консоли при зависании прнс, разгадали бы. Дрова на видюху тебе ебаный центр обновления Виндовс часом не подкинул? WHQL отличаются от studio и game exp.
>>779673 >Под дурачка косишь Ты заговорил о пресетах, я тебе показал пресеты. Я тебе ещё раз говорю, я выбирал его родной шедюлер, толку нихуя. Щас забираю этот 2.5 снова, попробую ещё, может поменялось что-то)
>>779682 >я тебе показал пресеты Ответ в твоём стиле: нажми на вкладке фокуса ctrl+F в открывшемся поле поиска введи слово Preset и ты увидишь где именно находится пресеты
>>779705 >Use ADetailer and/or HiResFix! Все это было месяца два назад. Да и в чпокус наконец то добавили вменяемый клипскип вместо дроча конфигов ручками с сомнительным результатом. Проблема всех реалистичных миксов с пони в том, что первым делом там просирается именно хентайная разнообразная анатомия. А без неё нах оно нужно?
> Y: is just weird try, inferior to X in most cases but handles eyes better > ADetailer recommended denoising strength ~0.15 (0.1-0.2 is good) > In ADetailer to avoid some kind of cutoffs "Use separate VAE" and set it to standard sdxl vae
>>779717 Просирается там написано. Если там нет разнообразной анатомии, то нахуй мне очередное говно с ван герл стэндинг и десятком примитивных поз. По любому единственный нормальный способ это генерить на чистой поне, а потом второй раз прогонять на какой-то реалистик модели. Все эти мерджи сорта говна, потому что в них просто нет этих поз. Ну в том с чем мерджили. Там даже ебучих пуффи ниплс-то зачастую нет и прочих деталей. Вот может это >>779705 сделать gape nipples with projectile lactation? Причем в реалистичном стиле, без мутанств и уродств? Сильно сомневаюсь. Не то что мне это надо, просто это крайний пример того, как то с чем поню мерджад хуячит то что в ней есть. Думаю, все кто кроме дженерик кала что-то генерит в курсе таких вещей.
>>779740 >сделать gape nipples with projectile lactation? Причем в реалистичном стиле, без мутанств и уродств? Чтобы модель могла сделать такое реалистично, нужно ей показать как это выглядит в реальности (если имеется в виду фотографическая реалистичноть), иными словами - обучить. Если этого не делалось (что вероятнее всего), то любой результат будет одним - попытка отридэшить 2d иллюстрацию, которую модель знает.
>>779725 >>779705 >> ADetailer recommended denoising strength ~0.15 (0.1-0.2 is good) Я кстати до сих пор не знаю, встроено-ли в фокус некое подобие адитейлера, там своя собственная импейнт-модель, которая по ходу генерации вносит коррективы.
(bottom up view, fisheye:1.2), deep cracked tunnel, (extreme close up epic detailed group meerkats peeking in:1.1), (blurry smashed colorful fruit:1.2), vivid maroon sunset sky, african umbrella trees
У меня, так понимаю. вид снизу вверх проебался (если я правильно понял, че там написано вообще, я блядь не из англии)
>>779754 Спасибо, кэп. Поэтому толку в этих говномиксах которые пиздят "как на пони только реалистично" нету.
>>779777 Я хочу сказать, что в джаггерах, датайченах и прочем говне с которым они мерджат ТАКИЕ ОХУИТЕЛЬНЫЕ ВЕСА на 10 стандартных фотопоз что эти веса давят всё остальное в пони, которая и так состоит из тонн мелковесного хлама.
Единственный способ сделать реалистичную пони - это делать датасет из фоток пони, прогнанных повторно через реалистик, из которых вручную выбраны все мутанты и уроды. Никто такое делать. естественно не будет никогда. Поэтому все эти очередные реалистик мерджи поней можно по КД обоссывать не глядя.
>>779813 до сих пор в негативе сидит. Неужели так сильно токен протекает?
То есть, если к своему промту выбрать стиль Fooocus Photograph и включить Fooocus Negative то к простыне негатива постом выше еще добавится негатив от стиля Photograph?
"name": "Fooocus Photograph", "prompt": "photograph {prompt}, 50mm . cinematic 4k epic detailed 4k epic detailed photograph shot on kodak detailed cinematic hbo dark moody, 35mm photo, grainy, vignette, vintage, Kodachrome, Lomography, stained, highly detailed, found footage", "negative_prompt": "Brad Pitt, bokeh, depth of field, blurry, cropped, regular face, saturated, contrast, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime, text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck"
И получится негативный промт длиной в 1326 символов ????
Обрати внимание на бездарность позитива к Photograph : 50mm и тут же сразу 35мм, ну и истерия с 4k epic detailed 4k epic detailed
>>779831 >Они не хотят править стили типа чтобы была повторяемость у тех кто давно пользуется программой Там 90% стилей просто мусор рендомно генерируют, какая повторяемость на шизопромптах такого размера? Это как слот машина.
>>779838 анон напиши плиз как там в GUI сформулирована строка где исправление лица и рук, фукуса нет под рукой, хочу чекнуть в коде чем на самом деле правит.
>>779822 чекнул на демке Lumina-Next-T2I c региональным промтингом сыровато конечно, но 2к с зеро-шотов + региональный промт из коробки + можно учить. И непонятно, сколько надо нефти, чтобы локально погонять. Музыка, видосы, текст-в-3Д нахуй не нужны, а вот T2i - да.
>>779908 насколько я понял из их гитхаба, вылавливая смыслы среди тонны самоподдува и демонстраций. Основная фишка - мульти модальность, то есть модель може и рисовать пикчи, и генерить звуки\музыку и делать видосы. Но системные требования не написали, значит точно жрет как не в себя. Если дотренить лор и развить регионалку, будет вполне себе альтернатива.
>>780573 Ну и нахуй тогда оно не нужно. Но этого и следовало ожидать. Все нужные костыли они подсосали у сообщества и больше сливов халявы не будет до следующего этапа, когда они рогом во что-то упруться. Будут только скидки давать на устаревшее говнецо.
>>780897 Ты дебил? Там вся хуйня разная. Будешь сидеть и молится, чтоб тебе очередной задрот без жизни выкатил что-то уровня гейп-16 или поней но на сд3.
Сегодня станет доступна базовая модель SD3. Многие ждут с надеждой, многие предвкушают, как они будут хуесосить каждый косяк и недостаток.
Прежде чем выражать бесспорно экспертное и единственное верное мнение, хотелось бы напомнить, насколько сильно ушел прогресс в генерации пикч по тексту за не полных 3 (три) года. Попробуйте сгенерировать пикчу по любому промту в этой замечательной демо:
Это одна из первых публично доступных диффузных генеративных моделей, которая была выложена на HF 21 октября 2021 года. Сейчас у нас есть несопостовимо лучшие модели и возможность создавать качественные изображения. Бесплатно. Локально. Приватно и без каких-либо ограничений. В любом стиле, размере. формате и количестве. Невозможно было такое представить всего 4 года назад, это была фантастика. Задумайтесь на минуту над тем, что неплохо бы научиться ценить то, что у нас есть.
>1 Dall-e mini 2021 >2 SDXL 1.0 base + refiner 2024
>>780959 >Задумайтесь на минуту над тем, что неплохо бы научиться ценить то, что у нас есть. вот кстати да, а то заебали всякие чепушилы хейтящие сд3 типа чухана с прошлого треда у которого мыло в душевой упало и его выебали в очко
>>780959 >научиться ценить то, что у нас есть. Типа жрать любое говно и просить добавки? Ну типа индусы ведь старались, делали сд3, ну вышло как обычно кривое дерьмо хуйни, но мы будем этим калом обмазываться и хвалить.
>>779920 → Если простыми словами, не вдаваясь в технические детали:
CCSR - высокая точность, но низкое качество (плохо обрабатывает мелкие детали, добавляет размытость, понижает резкость) SUPIR - низкая точность (слишком много галлюцинаций), но очень высокое качество (восстановление мелких деталей/текстуры)
Комбо CCSR + SUPIR - охуенная связка. Эта комбинация дает наилучший баланс точности и качества. CCSR способен максимально точно восстановить даже ушатанный jpg или недостатки плохой генерации, а SUPIR восполняет проебанную детализацию.
>>781177 > охуенная связка Оно всё равно выглядит очень неестественно и всрато. Сразу видно что там нейронка насрала в пиксели, от детализации легче не становится. А скорость вообще ставит крест на этом говне. Пайплайн из специализированных ганов всё ещё лучший вариант, чтоб делать в пределах х2-4 максимально близко к реальному фото.
>>781184 >неестественно Опаньки, и тут должна была быть иллюстрация, насколько это всрато) Но, пиздеть, и высрать стены бреда это гораздо проще, нежели приаттачить пару картинок) К тому-же враждённое, переданные по наследству токсичное говно этому главная помеха, немотивированное ничем чувство превосходства над остальными это главная скрепа пидарахи. Давай, твоя очередь пиздануть что-то про бисер и свинейя давай...
>>781204 Так у тебя на пике и есть через жопу. Буквально каждый апскейлер делает ебало неузнаваемым. Я уж не говорю про какие-то полосы на теле и волосы, как на пластмассовой фигурке из Киндер сюрприза. Но чпокус все равно говнище, если чё.
>>781211 Смысл апскейлить с высокой точностью есть только, если исходник является фото, как это. А если нужно проапскейлить сгенерированную картинку, то нужно качество. Нужен апскейл который исправит глаза, пальцы и прочие детали. Ты сначала сгенерируй в разрешении 256x384 что-то такое, что будет требовать прямо 100% точного неизменного апскейла. Обычно всегда нужно править детали и правильный, не точный, апскейл это делает автоматом.
>>781198 Но зачем? Где ты такие шакалы брать собрался? Практическая ценность этого нулевая. А с обычными шакалами из интернета ган справится намного лучше и быстрее. > DAT Хотя бы RGT или ATD бери. В конце SRFormer/OmniSR для убирания артефактов.
>>781247 Ты в промте писал что-нибудь про детайлер скин? Тут надо ещё и модель подобрать, у бабы джагера похожий еблет, так что здесь он пришелся бы очень кстати. Опустить гайденс с небес на землю, чтобы получить реалистичный, чуть притушеный результат, и даже может быть (ради эксперимента) подключить гиперреалистик, он в одиночку делает всратенькие (земные) ёбла девочкам, здесь именно тот случай)
>>781263 Не, просто ткнул в Describe и он мне выдал woman wearing black bra and underwear holding up an assortment of colors Делал в опендали без стилей с некоторыми моими лорами на реализм, экстракт из реалвиз4 и прочего
>>781263 >Ты в промте писал что-нибудь про детайлер скин? Промта по сути 2 : один для SDХД-модели (JuggernautXL_V8) силами moondream Photo of a Caucasian women with blonde hair wearing a black bra, holding a color checker chart
Промт для SUPIR: RAW photo, high quality, detailed, detailed skin textures, 8k, dslr, sharp focus
Негатив для SUPIR: 3d render, cgi, painting, cartom, illustration, bad quality, messy, blurry
>Опустить гайденс с небес на землю 7.5 (знаю, что автор модели рекомендует 3-7 с уменьшением в реалистичность, по при уменьшении в конкретно этом случае лезут артефакты. Возможно, это несовместимость с другими параметрами ноды SUPIR, но тестить все вариации недели не хватит. Чуть лучше делает s_noise = 1.002 лицо, но мылит темные области, поэтому оставил s_noise = 1.003)
>Тут надо ещё и модель подобрать Пробовал RealVisXL_40 - хуже, но сильно с ним не эксперементировал. Надобы как автор на гитхабе советует попробовать RealVisXL V4.0 Lightning, как руки дайдут потестю.
>подключить гиперреалистик Не понял тебя, в промт добавить? Что ты имел ввиду?
Можно как-то переименовать лоры в автоматике? А то я запустил СД спустя пару месяцев и не понимаю че за RRR у меня в лорах. А их там еще штук 20 таких.
Нейрогенераны, там это, нам крестовый поход объявили )
Кратко: Пару дней назад спалили ноду для комфи, которая пиздила данные из браузера и слала их мутному индусу на его Дискорд. Через какое-то время ответственность на себя взяла некая группировка хакеров, называющая себя NullBulge (лол) Типа они борятся за права "настоящтх художников" против нейрогенерастов, против криптоскамеров, и против сливателей платного контента с Патреона.
Главное, что у нас есть ты, не промытый, продолжай копипастить полотна промтов и визжать от того, что SD\MJ\Dalle говно, которое не может понять что ты хочешь и сделать тебе красиво.
Не прекращай писать в тред, ты смешной. Спасибо тебе, что разлекаешь нас. Правда, без иронии.
>джагернавт номер 3 лучше всех последующих версий джугернафтов. Ты заметил название группы, в которой он находится? OLD MODELS / DISCARDS / UNDERPERFORM Нет никаких мыслей по поводу того, как это переводится?
>>781351 >OLD MODELS / DISCARDS / UNDERPERFORM А это автоматически снажает качество на 300%? А если модель новая, то она прямо ультра качественная по определению и бьет все дипрекейтед? Ну и логика.
>>781342 возможно, в состав группы входит наш местный мылошиз, так что НАМ ВСЕМ НАДО БЫТЬ АККУРАТНЫМИ В ВЫРАЖЕНИЯХ Иначе его тима похакает нас. Речь идет о трехзначных суммах, не стоит вскрывать эту тему
Since there have been several generations of tests, I separated this area into those models that have tested all the way, those have been eliminated at full round 2, those eliminated after the full round 1, and all the original models that haven't been tested against the full suite
>>781345 Смешно будет, когда я к тебе через руткит подключусь по установленному тобой же трояну. Вот тогда мы и посмеемся над твоими детскими фотографиями у тебя на компе.
>>781383 хаха, только в прошлом посте приносили ссылку на какую-то СИКРЕТНУЮ МОДЕЛЬ на pixeldrain Соболезную дауничам, тыкнувшим в ссылку и ради интереса скачавшим "просто посмотреть"
Хей дифузач, имею SDXL, как называется стиль как на этом фото? Как вообще эту хуету запромптить? Всякие semi-real, 3D, comics и т.п. полная хуета и не работают, ну или я тупой. Может модель еще хуевю юзаю?
>>781621 >Вот еще варик расшакаливателя. Всего пять шагов итерация! Без и2и. Результат на пик2 две итерации х2 х2 Очень, очень годно (кроме радужки в глазах, но это хуйня изи фиксится 3-мя кликами в ФШ тащемто).
1. a female character with long, flowing hair that appears to be made of ethereal, swirling patterns resembling the Northern Lights or Aurora Borealis. The background is dominated by deep blues and purples, creating a mysterious and dramatic atmosphere. The character's face is serene, with pale skin and striking features. She wears a dark-colored outfit with subtle patterns. The overall style of the artwork is reminiscent of fantasy or supernatural genres
2. Digital art, portrait of an anthropomorphic roaring Tiger warrior with full armor, close up in the middle of a battle, behind him there is a banner with the text "Open Source".
3. photo of a dog and a cat both standing on a red box, with a blue ball in the middle with a parrot standing on top of the ball. The box has the text "SD3"
4. selfie photo of a wizard with long beard and purple robes, he is apparently in the middle of Tokyo. Probably taken from a phone.
5. A vibrant street wall covered in colorful graffiti, the centerpiece spells "SD3 MEDIUM", in a storm of colors
6. photo of a young woman with long, wavy brown hair tied in a bun and glasses. She has a fair complexion and is wearing subtle makeup, emphasizing her eyes and lips. She is dressed in a black top. The background appears to be an urban setting with a building facade, and the sunlight casts a warm glow on her face.
7. anime art of a steampunk inventor in their workshop, surrounded by gears, gadgets, and steam. He is holding a blue potion and a red potion, one in each hand
8. photo of picturesque scene of a road surrounded by lush green trees and shrubs. The road is wide and smooth, leading into the distance. On the right side of the road, there's a blue sports car parked with the license plate spelling "SD32B". The sky above is partly cloudy, suggesting a pleasant day. The trees have a mix of green and brown foliage. There are no people visible in the image. The overall composition is balanced, with the car serving as a focal point.
9. photo of young man in a black suit, white shirt, and black tie. He has a neatly styled haircut and is looking directly at the camera with a neutral expression. The background consists of a textured wall with horizontal lines. The photograph is in black and white, emphasizing contrasts and shadows. The man appears to be in his late twenties or early thirties, with fair skin and short, dark hair.
10. photo of a woman on the beach, shot from above. She is facing the sea, while wearing a white dress. She has long blonde hair
>>781666 3 модели + 3 текст энкодера базовые модели: медиум - просто модель без енкодеров и клипа медиум клипс - с клипами медиум клипс т5фп8 - с клипами и т5 отдельно в текст энкодерах лежат все клипы, т5 фп8, и т5 фп16
>>781684 ну в самой большой готовой тебе и клипы вхуячены и т5 фп8, но ты сам можешь собрать себе отдельно в любой конфигурации в том числе заменить т5 фп8 на типа более лутший и более жрущий врам т5 фп16
>>781705 2b, но так как там т5, посчитать возможные существующие комбинации не представляется возможным, кароче если клипы классические не юзать то это рывок и прорыв
>>781717 бля, читаю реддит и твиттер по теме. Хули они все так трясутся за лицензию? Соображают как считать 6000 генераций в месяц, чтобы не влететь на какой-то там Large тариф. Соя совсем ум растеряла. ДА ПОЕБАТЬ НА ИХ ЛИЦЕНЗИИ! И ЧТО ОНИ МНЕ СДЕЛАЮТ???
>>781742 нет пару раз нагенерил на comfy example c хагинфейса, руки все равно херит иногда, 4070ti 16 gb, по статам vram для этого 50% грузит, сам GPU под 100, но делает быстро
>>781792 3,4 A full body photograph of a young woman with short blonde hair lying on the grass on her back, she's wearing black leotard and track pants, barefoot,
>>781808 >full body photograph of a young woman with short blonde hair lying on the grass on her back, she's wearing black leotard and track pants, barefoot промт пиздец
>>781844 >(8 ГБ) c t5xxl_fp8_e4m3fn А имеет ли смысл пробовать с t5xxl_fp16.safetensors он всё таки 9.79 GB ? Ты пробовал? Вообще кто-то увидел разницу в картинках?
>>781854 попрбуй так: A stunning photograph capturing a slim blonde girl with captivating blue eyes, lying on a lush green lawn. She is wearing a sleek, flesh-colored swimsuit that accentuates her figure. With her arms spread wide, she stretches out towards the sky, her face turned towards the sun, her eyes closed. The image exudes a sense of freedom, tranquility, and connection with nature., photo
Adorable girl stands in a meadow with knee-deep flowers. Girl is cute, skinny, young and grumpy. Girl has thin limbs, pale skin, black short hair, bags under eyes. Girl wear tightly fastened black oversize long coat, big witch hat and choker. anime
>>781865 Если вспомнить sdxl на старте, там был вообще пиздос, а пони тем временем ебет. Если это дотренят, должно быть норм, текстура кожи тут заебись.
>>781854 Мр Андерсон, к чему все эти старания и копротивление. Просто дойди до жпт4 и скажи ему чтобы описал бабу на траве. Полученный промт отправь сд3
Ну и как эту ломучую срань апскейлить? Подрубать XL на второй проход? Потому что это пиздец какой-то, как будто во времена ванильной полторашки вернулись.
A stunning photograph capturing a slim blonde boy with captivating blue eyes, large breast, lying on a lush green lawn. She is wearing a sleek, flesh-colored swimsuit that accentuates her figure. With her arms spread wide, she stretches out towards the sky, her face turned towards the sun, her eyes closed. The image exudes a sense of freedom, tranquility, and connection with nature., photo
Пиздец конечно. А ещё ведь ЧСВ хуесосы на астралита выёбываются в дискорде. Выкатили кал и довольны. Даже их соевый чреддит уже бухтит Сейчас докачается буду тестить Но судя по 4чану и реддиту анатомии 0
>>782021 для додиков которые не сдели ЕГЭ по английскому и информатике:
Чекпоинты SD3, содержащие кодировщики текста: sd3_medium_incl_clips.safetensors (5,5 ГБ) и sd3_medium_incl_clips_t5xxlfp8.safetensors (10,1 ГБ) можно использовать как любой обычный чекпоинт в ComfyUI.
Разница между обеими этими чекпоинтами заключается в том, что первый содержит только два кодировщика текста: CLIP-L и CLIP-G, а другой содержит 3: CLIP-L, CLIP-G и T5XXL. Обязательно поместите sd3_medium_incl_clips.safetensors или sd3_medium_incl_clips_t5xxlfp8.safetensors в каталог ComfyUI/models/checkpoints/.
Файл sd3_medium.safetensors не содержит весовых коэффициентов кодировщика текста/CLIP, поэтому для использования этого файла их необходимо загрузить отдельно. Загрузите веса кодировщика текста из каталога text_encoders и поместите их в каталог ComfyUI/models/clip/. sd3_medium.safetensors следует поместить в каталог ComfyUI/models/checkpoints/.
>>782021 >Пояснение от comfyanonymous по кодировщикам и моделям Это нихуя не пояснение. Они в своем духе, блять.
Вот пояснение: sd3_medium.safetensors includes the MMDiT and VAE weights but does not include any text encoders. sd3_medium_incl_clips_t5xxlfp8.safetensors contains all necessary weights, including fp8 version of the T5XXL text encoder, offering a balance between quality and resource requirements. sd3_medium_incl_clips.safetensors includes all necessary weights except for the T5XXL text encoder. It requires minimal resources, but the model's performance will differ without the T5XXL text encoder.
Если не брать возможности с текстом, то чем она удивляет? Уже сколько прошло времени и в треде ничего удивительного. Вызочем её ждали то? Покажите зачем.
Beautiful skinny young european woman stands on sidewalk nearly road in downtown big city under rain. Woman has long legs, red short hair. Woman wear white wet sundress, white stockings, heel and bow tie.
>>782068 Можешь всем одинаковый промпт давать, работает. А вот при выкидывании клипа он даже в текст перестаёт уметь. Опять наделали каши вместо того чтобы взять один Т5.
>>781786 Поясните ньюфагу, в чем прикол SD3? Весь интернет завален новостями уровня ЕБАТЬ ЭТО ПРОРЫВ, но медведь на старой sdxl выглядит нормально, а у тебя как из кунсткамеры. SD3 привносит что-то новое, и нужно время, чтобы все перешли на модель и улучшили ее новыми чекпоинтами и лорами? В чем ее инновация? Я не тролль, правда не понимаю.
>>782102 >В чем ее инновация? в трансформере, смешивании концептов, понимании хуман лангвиджа, умении считать (но не всегда корректно), умении в сорт оф контекст
>>782077 >Если не брать возможности с текстом, то чем она удивляет? Оно следует промпту, как предыдущим моделям и не снилось. a girl wearing a orange leather skirt and a green knitted sweater, a pink hair, a red cap
Комфи господа, а если с помощью сд3 сгенерировать в разрешении сильно выше 1024, то ее так же пидорасит, как и предыдущие модели? В сд1.6 обещали это починить
>>782118 > Оно следует промпту Давай запили мне промт: screengrab from fisheye surveillance webcam,somwhere in Smolensk at night, an obese old blond wife in a wet clear transparent sheer crop top stand in room,smile, close-up, wet hair and wet skin, nuclear mushroom-explosion in window
Попробовал woman look like Audrey Hepburn Одри знает но опять 1 из 10 сильно похожа, половина отдаленно похожа а остальные чистые азиатки не смотря на то что рыжие. Проклятье какое-то.
Highly detailed photo of two beautiful skinny young european women stands on sidewalk in downtown big city under sun.
First woman is ginger and has long legs, very short hairсut. First woman wear tiny white transparent sundress, white stockings, heel and bow tie. First woman look like Audrey Hepburn.
Second woman has long legs, long black wavy hair. Second woman wear tiny red transparent sundress, black stockings, heel and bow tie.
[Positive Prompt] An obese elderly blonde woman in a wet, clear, transparent sheer crop top standing in a dimly lit room in Smolensk at night. She smiles with wet hair and skin, captured by a fisheye surveillance webcam, with a nuclear mushroom explosion visible through the window. Full shot, close-up, high-definition, high-quality, dramatic, surreal, vivid colors, unique composition, intense emotions, mysterious atmosphere, captivating, haunting, intricate details, sharp focus.
[Negative Prompt] Cartoon, 3D render, disfigured, bad art, deformed, extra limbs, close-up, black and white, weird colors, blurry, duplicate, morbid, mutilated, out of frame, extra fingers, mutated hands, poor anatomy, ugly, extra limbs, bad proportions
Ты серьезно считаешь, что на твоем пикриле Смоленск? Лол, хорошо быть тобойтупым
>>782219 > Делись Это инфа доступна только для олдов дали тредов, и то не для всех. В паблик никто тебе эту инфу больше не вкинет после событий с козой.
1-пик SD3 api 2-пик SD3 local ЕАБАЛА АУТЯР-СЕКТАНТОВ КОТОРЫЕ ДУМАЛИ ЧТО ИМ ИНДУСЫ НЕ НАСРУТ НА ЕБАЛЬНИК СНОВА, КАК БЫЛО ВСЕГДА, ПРЕДСТАВИЛИ?????? АХАХАХХАХАХАХАХХАХАХАХАХАХХА. ПИЗДЕЦ Я В ШОКЕ С ДЕБИЧЕЙ