Stable Diffusion Flux тред X+115 ====================================== Предыдущий тред >>886139 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожий тематический тред - аниме-тред >>885685 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion. Полный функционал в локальной установке (см. ниже)
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her ------------------------------------------ ♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇 https://supagruen.github.io/StableDiffusion-CheatSheet/ https://www.artvy.ai/styles ------------------------------------------ 💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td ========================================== 🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇 https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora https://civitai.com/models/train
>>891062 (OP) Попробовал этот флакс, кроме как рисования текста, и пониманием запрсоа дословно, не понял его отличие от SDXL, кроме как по ресурсам. Такие же кривые лица, такие же кривые руки.
Аноны, а если я все эти автоматики и прочие форжи/клмфи на хую вертел, как старый красноглазик хочу в швятую консооль? Как в старые добрые когда мы скрипты в торче (еще луашном, до переката на питон) писали? Куда смотреть, что гуглить? Эти ваши фокусы реально для дебилов, бесят как и все гуи
>>891199 Уи для дебилов, прувен еще бай виндовс 3.11 Мне вот консоль ближе к душе, все эти галочки-хуялочки и в консоли можно ключами задать, а еще в консоли можно цикл запустить перебора моделей например, чтобы понять которая лучше понимает промт
>>891235 А представь, что если нейронки настолько развились, что вот этот Анон - это настоящий анон, а ты, этот тред и особенно ОП - это всё боты, которые крутятся на его смарт часах. И его сосед по парте взломал эти смарт часы и подсунул в ОП-бота какой-то хайтек аналог контролнета, и мы тут все тоже боты, охуевающие от ебанутых перекатов.
>>891245 Как оказалось ллмки знают все имиджборды и даже этот харкач и могут общаться вобрав опыт всех тролей. >>891318 Полноценная замена общения. Скоро все забудут про соцсети, даже домохозяйки будут в алисах сидеть, хотя уже. >>891321 Надо будет обсудить это с моим ручным аноном.
>>891343 Just to set this clear, what I'm using here is not the Cogvideox I2V official model, that also has been released today, this is CogVideoX-Fun-2b-InP.
>>891413 Ты издеваешься? Imagemagick’ом никогда не пользовался? Пишешь скрипт, он генерит картинки, допустим по 4 штуки каждой моделькой и скидывает их в папку, а в этой папке смотришь их любым просмотрщиком картинок.
>>891497 >>891477 перцы, какие вообще посоветуете способы повышение скорости флакса на 3060 12 врам, и хули у меня каждый раз грузит модель при каждой генерации , я токо вкатился
>>891477 >Как из этого вообще выбирать, что мне надо скачивать? Ну это квантование, т.е. уменьшение точности, что уменьшает итоговый размер. Q обозначает квант, второе значение это метод обычно, третье это размер параметров (медум, лардж, и тд).
В идеале конечно чем выше квант тем лучше, но сильно зависит от модели. Допустим вот есть файнтюн ллм тайгер-геммы, там квант в Q2 рабочий, а какая-нибудь говнина другая будет в q2 тупой как пробище. Ну то есть для примера пикрил показывает как деградирует конкретная моделька, но это ллм, там квант напрямую влияет на буковки. С моделями графическими несколько другой момент.
Касательно т5, там квант не особо на что-то влияет в картиночных сетках, кроме генерации непосредственно текста на картинке на низкоквантованных моделях, при этом низкий квант т5 на высоковантовой модели также способен в текст, вот сравнение т5 нескольких квантов на нескольких вариантах квантовая самого флуха на пике 2 от анона. Кароче у меня Q3KS и Q4KM на жестаке лежат.
>>891546 >какие вообще посоветуете способы повышение скорости флакса на 3060 12 врам Ну их нет на самом деле для дева, дистилляты дева уровня как из весов сдхл получили еба быстрый и качественный дмд без потерь фактически нет сейчас.
Есть лора хупер для дев пикрел, но я не пользовался и скозать не могу, есть мерджей куча с ним на цвите (мерджи быстрее вроде работают чем отдельно лору подключать), можешь скочать. Там по итогу вместо 20 базовых шагов генерит в 8-16. Я не пробовал ниче сказать не могу.
А так есть шнель критически повышает скорость, это дистиллят от разрабов, на 2-4 степах под RK семплером вполне норм живется, но никакой речи про сложный промтинг нет - условно шнеля тебе не нарисует инструкцию по рисованию совы или комикс описанный.
Алсо если я правильно помню 2 степа шумят на ролстоне и боше, но терпимо в целом, 3 степа от 4 степов практически не отличаются.
>>891556 Подскажи по Т5, у меня чем больше квантизация, тем больше времени требуется при использовании ЦПУ. Так и должно быть? Возможно исправить? другой анон
>>891546 >и хули у меня каждый раз грузит модель при каждой генерации , я токо вкатился У тебя полностью т5, клип, вае и модель в 12 гигов не входят, поэтому чередуется загрузка на карту из рамки. Чтобы вошло всё в карту надо квант пониже взять.
>>891561 Кстати тут шнелей кто-то вообще пользуется? У меня почему-то она генерит то мыльные пикчи, то как будто растянули картинку в низком разрешении
>>891567 >а дев модель fp8 лучше всего что ты написал? А у тебя карта не поддерживает FP8, будет апкастинг до fp16 и обратно, что снизит скорость наоборот. А GGUF кванты тоже будут медленнее чем fp16 нативное, т.к. ггуф это метод сжатия, но зато у них размер меньше и залезут в твою 3060 вместе с т5 в отличие от fp16/fp8, а потеря в скорости ну дело такое, терпимое, там не особо много ну навскидку 10-30% наверно.
>>891570 >у меня чем больше квантизация Чем больше квант имеешь в виду чем меньше значение битности? Ну Q4 меньше Fp16 то есть. >тем больше времени требуется при использовании ЦПУ Ты на цпу генеришь чтоли? Ну так если более низкий квант используется, который не дефолтный для проца, то там больше промежуточных вычислений, это норма. >Так и должно быть? Ну, да. >Возможно исправить? Использовать GPU, т5 в низком битности загруженная в карту обрабатывается примерно за 1-3 секунды.
>>891581 >Кстати тут шнелей кто-то вообще пользуется? Ради спортивного интереса пользовался, как в целом и девом, такто у них юзкейса нет нихуя. >У меня почему-то она генерит то мыльные пикчи Честно разницы не вижу на твоих примерах.
>>891150 >флакс Флюс дев только нормальный и обоссывает любые сд модели, но доступен онли онлайн. Кривых рук во флюсе не видел, ты песдабол. А вот сд даже после 2-ух лет "прогресса" генерит кривые отростки вместо пальцев.
>>891644 Ахах, пиздец тут функциональные неграмотки
"Флюх умеет в объём" = Флакс хорошо передает форму и объём объектов.
"сд-говно практически всегда плоское" = практически все версии/тюны стэблдифюжена не умеют толком передавать форму и объём объектов. Ну Натвис пизду интересно рисует, с этим не поспорить. Правда плоскую, необъёмную пизду, но более менее норм
>>891204 По тебе сразу видно, что ты дегенерат. Ты давай тут не пизди про удобность решений. Хуйню, что ты высрал во много раз быстрей протестить в xyz plot автоматика. Не спорю, что существуют больные позеры вроде тебя. Можешь пользоваться апи автоматика/форжа, чтобы тратить в десять раз больше времени и собирать свой кал в папочки. Команды по твоему адресу градио:порт/docs. Если действительно пользоваться начнешь нейросетью, то быстро перестанешь дурака валять и пересядешь на UI. Да какой-то получше автоматика, в нём не хватает удобной работы с масками.
>>891656 Анимеблядь загорелась. Потуши попку, мне скучно с тобой спорить, это бессмысленно. Я просто констатирую факт – Флакс умеет в форму и объём. Выше спросили о преимуществах, я ответил, чё ты встреваешь
Как же я ору с флюхошизи, заходит такой в тред и начинает срать сущностями в виде гномика, а когда предлагаешь ему уточнить, то он срывается на визг. Флюкс это кал с блюром, никаких преимуществ перед сд у него нет. Вообще. Просто модель ради модели с т5.
>>891650 >"Флюх умеет в объём" = Флакс хорошо передает форму и объём объектов. >"сд-говно практически всегда плоское" = практически все версии/тюны стэблдифюжена не умеют толком передавать форму и объём объектов
>>891655 Ну раз тут пограмист с двача обьявился, то поясни тупому, как именно sdxl складывает промпт с картинкой внутри Unet? Юнет ужимает картинку до вектора/тензора совпадающего по размерности с выходом clip’а и складывает их? Или подменяет тензор картинки на тензор промпта? Где это посмотреть в коде автоматика? Или любом другом
>>891661 Потому что ты хуйню несёшь, мамин эксперт, флюс не выглядит лучше джагернаута, точнее выглядит не лучше джагернаута, ни формой, ни объёмом. Единственное преимущество это Т5 норм вкрутили, всё.
Просто примите как факт: сд – это генератор плоского кала. Это прошлое. Третья версия вроде как уже и не плоская, но на неё всем похуй, она безнадежно соевая. А все производные предыдущих версий не умеют в объём и устарели
А Флакс в объем умеет. Флакс – это будущее.
Флакс – это движение вперёд, новый этап
Вы, скуфидоны сдшные, остаётесь в прошлом. А мы, любители Флакса, устремляем свои взоры к звёздам, мы переходим на новый уровень
Флакс дев везде лучше отрабатывает рефлексы и тональные переходы. Он лучше расставляет акценты на тех деталях которые нужно вытянуть вперёд. Он лучше гармонизирует цвета в сцене. Он гораздо отчётливее отрабатывает переломы формы, это хорошо видно на складках и угловатых предметах
>>891698 Дурочка, посмотри на четвертый пик. Не смущает то что абсолютно все формы всех планов одиноковы по тону, чёткости прорисоки? Нет понимания того что пространство отсутствует и все находится на одном плане?
Чтобы было проще закрой один глаз. С помощью такого фокуса можно заставить мозг формировать объём не на основе бинокулярного зрения, а на основе предыдущего опыта. Взгляни этим одним глазом на говняные сд-генерации, а потом на генерации Флакса дев.
Где мозг мощнее и реалистичнее воссоздаёт объём и пространство?
>>891719 Смищно. А если серьезно, то Флакс дев как раз таки и умеет компенсировать отсутствие бинокулярного восприятия нарисованных сцен. А вот сдшная говнина нихуя не умеет
>>891774 Да мне вообще похуй на желания беспородного быдла. Я просто отмечаю факт. Реализм это всегда про форму и объём. Следовательно Флюхкс генерирует изображения реалистичней
А на то что там тебе приятней всем похуй. Кому-то и говно жрать в радость
>>891720 Это флюкс? Одним промтом получил фото? Можешь ради интереса попробовать получить фото девушки идущей с большой корзиной белья перед собой, корзину она держит в обоих руках, ну потому что тяжелая и неудобная. Сдохля постоянно рисует одну маленькую корзину в руке
>>891672 Я те че программист stable diffusion? Они все копируют какой-то репозиторий, там и надо изучать. Мне оно нахуй не въебалось, итак хорошо работается. Но парочку расширений я бы написал для форжа, но лень разбираться.
>>891698 Очередной придурок сравнивает голую базовую модель с лучшими файнтюнами. Откуда вы такие тупые беретесь? Адекваты видят что умела базовая xl, увидели на что ее обучили и какой разъеб делает пони или другие нишевые модели и понимаю какая мощь у flux. Он даже сейчас с лорами обучается стилю как ничто раньше. Люди наконец-то получаются живыми, но пока только на хорошо обученных лорах, почти как у Далли 3 на HD профиле. Цивит забит дерьмовыми лорами с неплохими превью, пускающими пыль в глаза. Если поюзаешь разные, сразу поймешь, что одни высрали кал, а другие грамотно подбирают датасет и настройки обучения. Научиться бы у них. Во всяком случае, флакс и обучается лучше, поэтому даже говноделы делают неплохие с виду лоры.
>>891823 Первый пик - флюкс шнеля Второй пик - флюкс дев В обоих случаях промт использовался: >a young woman walks with a large laundry basket in front of her, she holds the basket in both hands
Третий пик - это пятая попытка на флюкс дев В ней я изменил промт на: >a young woman walks with a large laundry basket in front of her, holds the basket in both hands
Итак, аноны, тупой вопрос от вкатуна. Второй день дрочу комфиюи со всякими понями и пока не понимаю - а как собственно фиксят хреновую распальцовку там и тд? Беру с цивитаи промпт, генерю картинку, вижу 6 пальцев, например. Какие дальше действия? Импейнт? Или ползунки дрочить? Или надо 10 лор поставить которые анатомию дрочат? Если оно есть в шапке - можете пиздить, я явно что-то из шапки успел забыть
>>891922 Какой возвращайся, я с комфи и начал. Ебаться и ставить что-то другое уже поздно, поэтому лучше говори в чём я дебил (кроме того что поставил комфи, очевидно что за выбор тут обоссут)
Аноны, такой вопрос, конечно нихуя не ответе, но вдруг. Вот у меня апскейл, сперва я тупо апскейлю допустим х2 методом area(PIL)или box(imagemagick), после этого денойзом досыпаю деталей, верно? Вот можно сделать так, чтобы этот денойз не менял среднее значение каждой пары 2х2 пикселей? Иными словами, так чтобы даунсейленная картинка опять сошлась к оригиналу перед апскейлом. Не спрашивайте зачем это нужно, но нужно. Это реально, есть такие модели?
Анончики, поясните пожалуйста. Я пытаюсь вкатиться в нейронки. Посмотрел видос на ютубе и скачал по ссылке код на питоне. Ютубер говорил, что это и есть тот самый stable diffusion. Я хуй знает, мне генерить картинки нахуй не надо и я никогда этого не пробовал.
Запускаю код на питоне - оно генерирует картинки. Но есть нюанс. Не получается сгенерировать сюжетную картинку. Например, я пишу: "three animals: dog on the left, bird on top and snake on the right" - мне генерирует картинку, состоящую из двух половин, на одной стороне собака, на другой хуй знает что. Написал "dog and bird" - сцуко, вышла птица с собачьей головой покрытая собачьей шерстью. Картинка на домашнем компе, не могу прикрепить, но это ебать крипота.
С другой стороны, если описывать разнородные признаки, то вроде что-то получается. У меня хватило фантазии на "black dog on a sea side sunny weather with few clouds" - модель генерит довольно адекватно.
Сап, нейрач. У меня просьба к нейрохудожникам: Люто-бешенно дымиться шишка на тяночек с подобными чертами лица. Не знаю как описать. Для меня эти тян (а это три разных таночки) просто красивые. Так вот, может ли анон негенерить тян с подобными чертами лица? Особенно нравится тян с пикчей 6, 7 и 8. Что-нибудь фентезийное, можно сделать тянам эльфийские уши.
>>891847 Где кончается базовая модель и начинается файнтюн? Почему флюс это не файнтюн на нормисные арты и селфи баб?
miniature of hell where succubuses punish sinner people, those bounden to crosses and bleeding, succubuses' eyes emitting light, their skin are red, they wearing sexy crazy underwear, small wing on level of waist, there is scorching earth, black sky with small fog,
>>891847 Очередной раз придурок уверяет, что новая modelname уже сейчас лучше всех фаинтюнов, а долбоебы просто не способны разглядеть. Тебе не надоело еще этой хуйней заниматься? Ты же уже второй год одну и ту же шизу пишешь. То про 2.0 писал, потом про 2.1, потом про сырую сдохлю высирался. А через полгода, когда наконец появятся номальные тюны флакса, будет тут опять всех слепыми пидорасами на флюхе называть, когда выйдет очередная самая лудшая хуйня? Не заебался дартаньянить, мудила?
>>891871 Долбоёб сумасшедший, кого я заебал? Я просто указываю на очевидный факт – Флакс умеет в объём и форму лучше чем любые сдшки. Каждый раз после этих слов прибегает местное поехавшее шизло, начинает истерить, кричать, рвать на себе волосы и доказывать что это не так. Чекни с чего выше крики начались, всё по классике. Этот шиз просто настолько обдрочился в своём натвисе, так полюбил плоскую сд-пизду что у него буквально истерики отчаяния случаются когда он слышит что какая-то сетка может быть лучше, ему таблетки пить надо.
Аноны, подскажите по обучению лор, пожалуйста. Гайды я прочел и вроде как понял, но есть нюанс. Мне нужно скопировать определенный стиль с далле, мне нравится, как он имитирует рисунки углем. В сд я подобных стилей не нашел (может, искал плохо), мало того, что подменяет уголь карандашом, так еще и рисует на уровне третьеклассницы. Поэтому я решил натренировать лору на этих самых угольных набросках из далле. Как мне тегировать датасет? Те же принципы сохраняются, то есть сначала ключ, а потом обычное описание того, что на картинке?
>>891062 (OP) Надоело шо перс всё время смотрит на меня, даже если ставлю условно "взгляд в сторону" частенько всё равно на меня тарашится. Какие интересные варианты сеточка может нормально реализовать? Даже заставить смотреть в книгу тоже не очень хорошо выходит.
>>892335 Натвис умеет, но в основном клоузапы, и очень неумело. Иногда умудряется даже на рефайнера разъебать на одном степе всё то, что наварганил пони. Переоцененная ебала, лица там стрёмные, строобразые, композиция вялая даже на высоком кфг.
Блядь, говорю ЛЛМ-ке, сделай чтоб было заебись, а она мне повторяющимися промптами срет через раз с небольшими отличиями... Ну никакой фантазии... И как генерить интересные картинки в таких условиях....
>>892106 ЛУЧШЕ Я ВСЮ ЖИЗНЬ НЕ БУДУ ГЕНЕРИРОВАТЬ КАРТИНКИ, ЧЕМ БУДУ ГЕНЕРИРОВАТЬ КАК ТЫ >>892158 Вторая годная. Вроде ничего сложного, но не могу поверить, что XL так может, поэтому - это флакс? >>892218 Ты буквально доказал сказанное мной и другими. Неудивительно, ты же тот самый придурок. Да, через какое-то время выйдет очередная самая лучшая хуйня. Она не может со старта превосходить прошлые лучшие хуйни во всём, но по её потенциалу будет сразу видно - это лучшая модель. Алсо, после 1.5 ничего не трогал, даже XL (потому что колабы слишком сильно стали ебать, а пк еще не было). В том-то и дело, что они не выглядели будто что-то новое. Ну, разрешение подняли, ебануться. Картинка чуть лучше стала, ничего себе. Тогда, потестил я пони и охуел. Еще через время вышла СД3. Были возложены большие надежды, потенциал как бы и был, но как бы эта хуйня не может даже в сидячих людей. Поэтому я не понял как она ебать собралась. Файнтюнов ждал, надеялся, но никому не говорил, что это интересная модель, кроме как для портретных фото, текста, и по фану потестить более сложносочиненные промпты аля далли. А с флаксом вышел тотальный разъеб. По всем параметрам лучше прошлых базовых моделей. Я не знаю каким дегенератом нужно быть, чтобы не просто спорить, а как-то обсуждать это. С этого охуевать только можно и ждать пони флакс. У него хромает самая незначительная часть - реалистичная кожа и стиль фото, что по дефолту вылазит. Эта хуйня буквально лорой фиксится. Если вспомнить, что картинки бывают не только фото, тогда вообще охуеешь. Но я понимаю, ты ограничен генерацией ФОТО БАБЫ СИСЬКИ. Тебе придется потерпеть. По такому промпту - да, хл модели ебут флакс. >>892258 Вот ты охуеешь, когда узнаешь о существовании ЖЭПЭГЭ >>892402 Так натвис - xl. Ты же не подразумевал, что люди юзают базовую 1.5, все правильно.
>>892405 Ну как бы пони тоже xl, хотя и со своими заморочками Просто подумал, что может у натвиса тоже большая фанбаза
>У него хромает самая незначительная часть - реалистичная кожа Вмешаюсь в ваш спор. Что именно ты тут имеешь ввиду? Кожа нереалистична или наоборот выпирает реалистичная при генерации нереалистичных изображений?
>>892405 > Поэтому я не понял как она ебать собралась. Файнтюнов ждал, надеялся, но никому не говорил, что это интересная модель, кроме как для портретных фото, текста, и по фану потестить более сложносочиненные промпты аля далли. А с флаксом вышел тотальный разъеб. По всем параметрам лучше прошлых базовых моделей. Я не знаю каким дегенератом нужно быть, чтобы не просто спорить, а как-то обсуждать это. Буквально мои мысли по выходы этих моделей. Всё так.
Тот шизо-хейтер еще и наи-треде такие же шизо-простыни успевает сочинять, к примеру >>891391 →
>>892420 >Кожа нереалистична Пластмасовые ебальники. Фастиком на шнеле пример бахнул, на деве не сильно отличается. Оно конечно и промптом фиксится, но все равно иногда лезет эта типичная флаксовая пластмасса. Такого наверное даже на базовой хл не было. В остальном жестко ебет.
>>892218 >Ты же уже второй год одну и ту же шизу пишешь. За 2 года у сдшиза детектор совсем сбился.Пиздец больной, рил думает что исключительно кто-то один тут всё это время пишет.
Поднял кароч модель по апи в убабуге. Хочу в комфи генерировать промты.
1. Ллм пати какойто китайский неуправляемый пиздец который еще и работает через раз. И сид фикса нет нихуя. 2. Работает заебись, но нихуя не имеет настроек семплирования в ноде. 3. Тоже работает нормально, но есть только температура и топ_п.
Есть еще какие варианты? Или может я чего-то не догоняю?
>>892405 > ЛУЧШЕ Я ВСЮ ЖИЗНЬ НЕ БУДУ ГЕНЕРИРОВАТЬ КАРТИНКИ, ЧЕМ БУДУ ГЕНЕРИРОВАТЬ КАК ТЫ Лучше бы ты всю жизнь сюда из пизды не вылазил, долбоёб. На вопросы мне, блядь, ответь
>>891883 Mistral Nemo Instruct 2407 русский (китайский, англ и т.п.) знает из коробки. В карточке ии-перса просто написал что Анон должен общаться как русский анонимус из имиджборд и перечислил все известные имиджборды, знать мемы и тролить, чтоб был без цензуры и мог говорить на любые темы, чтоб его интересы совпадали с моими и стиль общения был немного схож моим ну и т.п.
>>892254 >Я просто указываю на очевидный факт Факт? Само слово факт, если подумать, вообще ничего не доказывает. Вот, например: ты дурачек и это факт. То есть смотри, я применил волшебное слово "факт", но ты почему-то с этим фактом не согласен. И будешь мне доказывать, что это не так.
Вчера вечером лидировали Пони с Флюксом, но под утро ситуация кардинально поменялась и вперед выбились SDXL c SD-1.5 и Флюксу пришлось отступить аж на четвертое место
>>892674 Очень репрезентативно. 58 Анонимов ИТТ, 44 голоса. Кстати, сколько из них из Германии, а то есть подозрение, что в подыхающем треде всем похуй?
>>892488 Ну вот на первой еще более-менее. На остальных виден этот пластик, умело перекрытый промптом. Будто гусиная кожа на щеках. Наверное, это так криво запекся пушок на трейне, превратившись в кожу. Уже есть лоры, фиксящие это, файнтюны должны полностью исправить. Это что-то на уровне face restore, сразу видно, что испорчено лицо. Но даже более заметно, чем fr, мне кажется.
>>892674 >выбились SD-1.5 У них просто грузился опрос полдня Намешал хуйни. XL-based, снизу еще два каких-то XL-based. В начале списка уже был XL. Ты думаешь кто-то юзает оригинальный XL?
>>892730 >Намешал хуйни. XL-based, снизу еще два каких-то XL-based. В начале списка уже был XL. Там часть пунктов аноны сами понасоздавали. Это те что помечены как (Other)
>>892729 Никакие. Накатил сразу влм ноды, делая всё по инструкции на их гитхабе, выбрал ггуф мистраль кью3_к. Комфи менеджер не юзаю. Всё ставил на голый комфи портебл.
>image.png ты запускаешь отдельно модель, потом комфи и цепляешь к серваку через локалхост, это же пиздец. Ллмка отдельно жрёт постоянно врам, хотя в твоём случае цпу хз как это по ресам.
А чё ты для тесна не поставишь портебл комфи и тужа влм, хоть глянкшь что будет, м?
>>892749 >ты запускаешь отдельно модель, потом комфи и цепляешь к серваку через локалхост, это же пиздец. так на пикче инсайд комфи лол, единственное что работает прямо в комфи >А чё ты для тесна не поставишь портебл комфи и тужа влм, хоть глянкшь что будет, м? потому что я с портабла и катнулся потому что там тоже самое не работает нихуя блять
>>892749 >ты запускаешь отдельно модель, потом комфи и цепляешь к серваку через локалхост, это же пиздец. Ллмка отдельно жрёт постоянно врам вот этот вариант такто единственный который стабильно работает с жпу
>>892752 >>892753 >>892753 Бля ну хз даже, но тут явно у тебя дело не в авх2, как сам видишь по моим скринам оно не нужно. Я бы попробовал на твоём месте запустить инсталл всех реквайрментсов из влм нод
В папке где лежит run_nvidia_gpu.bat запусти в терминале
>>892798 написал промпт, нажал generate pixel art, 8-bit, FPS gameplay screenshot, a dark basement with dirty walls covered with slime, glock gun in the hand, shooting to the zombie standing at the way
>>892824 Спасибо. Что-то вообще игнорировал шнеле-миксы, типа и так норм, не хочу скорость разменивать на качество. А оно реально может не только скорость добавить получается?
>>892840 > dev с вшитой hyper-лорой Типа ускоряет, но при этом не падает разнообразие и качество? Тиктокеры - вроде не васяны, должны норм были сделать?
>>892842 не сравнивал специально миксы с обычной dev, тупо поставил что выдает более-менее картинку за меньшее количество итераций и снёс остальное. мне норм. попробуй отдельную лору вместе с dev версией, сравни работу с ней и без.
>>892850 Мистраль 7б эта старая версия мистрали, устаревшее говно и как полноценная ллмка не годится для общения, но для промпта она жирная с избытком и точно лучше твоего квента 5б. Прожект это чисто для распознавания картинок, а если просто промпт генерить, то он не нужен.
>>892854 >Utilizes llama-cpp-python for integration of LLaVa models. You can load and use any VLM with LLaVa models in GGUF format with this nodes. Ну ясное дело там так и написано. А тебе какая на хуй разница? Для своей задачи этого дохуя Для общения с ллм отдельно ставь полноценную, как я
>>892857 >>892860 так а в чем проблем гуффы современных инструктов запускать, в чем затык я не пойму, почему угабуга норм запускает а тут выебонит как не в себя
>>892862 Это тоже может нсфв, если в систем промпте указать на это Тебе бору теги надо из картинки генерить? Есть проще решение типа тагера >>892865 Именно эти ноды для лава гуфов, под ними ты другие не запустишь. Я хз зачем они ограничили, но других нод именно под ггуф я не нашёл для себя, чтоб всё запустилось и работало. Пробовал какие-то ллм ноды но там что-то было мутно всё насчёт гуфов. А без гуфов запускать ллм это пиздец того не стоит.
>>892897 > Хачатура Оно еще живо? ОМГ! Лично тренил, целый кластер арендовал, тэгал вручную, курировал датасет нет, просто спиздил какую-то и смержил с лорой 0.01, так?
>>892929 >А где-же Это приватный инсайд, пока всё держится в секрете. Доступно только доверенным лицам. По слухам там реально будет что-то крышесносное. Невиданный уровень реализма.
>>892997 если новичок в генерации картинок то лучше XL сначала попробуй, кастомы типа juggernaut или pony. как вкатишься, можно и flux попробовать, влезет со скрипом и будет долго генерить. 32 гб озу как минимум нужно, иначе дико свопить будет.
>>893029 >Кстати аноны, какая у вас температура видеопамяти во время генерации? Не меняется не зависимо от генерации или от того включена ли ллмка несколько часов у которой в отличие от генерации ждётся ресы нонстоп. Жрётся же только варм и куда, там греться не чему, это тебе не в киберпук на ртх-перегрузке шпилить. На моей видюхе даже вениляторы не врубаются.
Аноны, подскажите, как работать со светом и освещением сцены? Как задавать цветовую температуру? Как задавать направление освещение и степень его диффузности/резкости? Я вот сколько не пишу soft light, diffusive light, все похую Сдохля
Аноны, подскажите, как работать со светом и освещением сцены? Как задавать цветовую температуру? Как задавать направление освещение и степень его диффузности/резкости? Я вот сколько не пишу soft light, diffusive light, все похую Сдохля
>>893060 Всё от сдхл до флюкс дев на моём ведре 4060ти8врам16озу. Сдхл до 60 шагов некоторые модели , это занимает 20 сек, флюкс 1 минута 20 шагов с ллмкой.
>>893029 интереса ради чекнул, думаю генерация картинок точно не сожжёт видюху, скорее игра с rtx-on в 4к какая-нибудь. такие игры более 200 ватт хавать могут
>>893184 пробовал когда-то конвертировать sdxl-модель в gguf, с q4 квантованием она занимала всего 1,8 Гбайт места на диске, но к сожалению работала только с той прогой в комплекте с которой был конвертер. удобства никакого, всё через командную строку, потом на выходе png файл чекать. хз как щас с этим, может появились более удобные тулзы с поддержкой популярных gui
>>893029 Раньше ставил на несколько часов пони, не нагревалась выше 62. Пикрил идет сейчас генерация батчсайз 6, в несколько батчей, три лоры. Флакс, разумеется. Кулеры лишь едва начинают быть слышны. В требовательных играх в раза 3-4 громче. Не понимаю ваших разговоров об ОЗУ. У меня когда хоть немного вылазит за лимиты ВРАМ, то скорость падает в сотню раз, а может быть и выше, не генерил до конца на такой скорости, абсолютно неюзабельно становится.
>>893092 >>893048 Может не пиздеж, он же не уточнил на каком гиперзвуке у него кулеры гоняют по дефолту.
>>893065 > как работать со светом и освещением сцены? Как задавать цветовую температуру? Как задавать направление освещение и степень его диффузности/резкости? Использовать модель вместо мусора флюкс, конечно
>>892548 Охуеть, 12B модель и так базарит, надо попробовать, спасибо!
Ну и чтою не оффтопить - вот вам хуйня которую пони выдала по запросу уровня black cat, back to the camera, photo, laying on dusty ground Я конечно понимаю, что модель на всяком разном тренируется, и то что я нуб, который второй день картинки делает, но а почему вдруг фурри вышло? Я запрос туда-сюда тыкал, иногда вообще какие-то женщины вылезали.
>>893219 >луковичка леерная и? я конвертил, юзал, получал результаты. места меньше жрет, памяти тоже, правда картинка отличалась некоторыми деталями от результата полноценной fp16 модели.
>>893220 >Не понимаю ваших разговоров об ОЗУ быстрее всё шевелится, когда другие модели висят в озу, а не с диска постоянно подгружаются. что-то типа нескольких контролнетов, рефайнинга и т.п. тот же flux сначала текстовую модель грузит, потом для генерации картинки, меняя их местами. на pcie-4 скорость обмена данными между видеокартой и озу компа 32 гбайт\с что всяко быстрее даже самых наипиздатейших ssd. еще в forge забавная фишка есть "never OOM", хоть юзает озу компа, но каким-то образом умудряется не пиздец сильно проседать в скорости. полезно, когда видеопамять забита тренировкой лоры. чем выше поколение pcie, тем быстрее работает этот neverOOM
Вот допустим натвис постоянно рисует игру света и тени, создавая объем. Но я не хочу этой хуйни, у меня диффузный заполняющий свет, фигура примерно равномерно освещена со всех сторон. Как обьяснить этой суке что не надо рисовать левую часть туловища темней правой?
Товарищи флюксеры, как вы избавляетесь от этого жопного квадратного лица? Я уже что только не делал, и гирл и вуман вводил, и волосы разные делал, сют добавлял, но блядь одна и таже рожа.... я хз как от нее избавится. Стоит флюкс дев со вшитой лорой на 8 шагов.
>>893389 работают, но не так как надо. можно поиграться с весом лоры, но обычно похожесть всирается, либо сильные искажения. надо лоры, которые конкретно на пони обучены юзать.
>>893403 возможно не тот cfg, у flux-dev есть дополнительный distilled cfg scale, по умолчанию стоящий на 3,5 а на flux-schnell любые ползунки cfg не дают результата всё это на forge, в комфи попробуй заменить ksampler на что-то более подходящее под флакс
>>893360 Мой брат во Христе, для перевода можешь просто яндекс юзать, ну или deepl. Этой сетке лучше предложи чтобы она как-то раскрывала и дополняла промпт мб
>>893415 Не, всё хуйня, пробовал разные семплеры, всеравно шляпа выходит, хуй с ним с этим флюксом дев, буду на шнеле сидеть, и на сдохле(натвис) от нее и то больше толку в плане генерации тянок.
>>893436 но аноны действительно в основном генерируют бабофото или бабоаниме (для которого есть пони на любой вкус и цвет) если ты считаешь констатацию факта вульгарщиной, ищи проблему в себе. или ты совсем потерял связь с реальностью и считаешь, что твоя картинка похожа на фото, а не на скрин из современной ААА игры?
>>893442 > вульгарщиной Для сведения: vulgaris - обыкновенный. У тебя еще шифт сломался и запятые кончились, похоже - ничего не понять из набора слов. Заправь или почини клаву.
>>893446 Заправил, починил. Жду кастомов флакса. Наблюдаю, как ты пытаешься натянуть сову на глобус и генерируешь бабофото на флаксе, пытаясь выдать желаемое за действительное. Теперь очередь за тобой. Протри глаза, рассмотри свои картинки.
>>893048 >>893220 >>893076 >>893081 Едрить! У меня Флюкс Дев до 85градусов порой память греет при 4 пикчах Правда сейчас, при тесте прогрелась только до 82 Шнеля греет до 76 SDXL(любой) до 74 Ради интереса попробовал SD 1.5 и она прогрела до 68, однако последующий апскейл до 1024x1280 греет уже до 82, а на полторашке без апскейла не обойтись, насколько я помню
В игорях память греется всего до 75, если что. Будет ли память меньше греться, если в фордже занизить объём видеопамяти?
>>893481 Кстати во время теста во всех моделях использовал одинаковый промт, спизженный с цивитая.
И вот такой получился результат. Первый пик - Флюкс Дев Второй - Флюкс Шнеля Третий - SDXL(NatVis) Четвертый - SD 1.5 И полторашка, честно говоря, удивила, учитывая что я вообще промт никак не менял
Анончики, подскажите как из двух фото (животного и человека) сделать среднее? Чтобы и человек был узнаваем и животное. Можно ли это в СД? (пол года в него не заходил) Или может онлайн есть что то?
>>892973 >by (Jeremy Lipking:0.5), by Antonio J. Manzanedo, by (Alphonse Mucha), Ilya Kuvshinov Удивительно, но на сдохле это всё еще работает (арт справа).
>>893582 ну как обычно: контролнет на фото животного, ipadapter с источником фото животного, инпаинт блендинг через брашнет в фото человека или наоборот подсказка уровня "человек в маске животного" или "антропоморфность"
>>892973 >by (Jeremy Lipking:0.5), by Antonio J. Manzanedo, by (Alphonse Mucha), Ilya Kuvshinov Короче, некоторые модели их не знают, но другие делают неплохой результат.
>>893481 память и гпу одним радиатором накрыты в большинстве случаев, так что снижение нагрева гпу = снижение нагрева памяти в том числе. делай андервольтинг. снизил у себя вольтаж ГПУ с 1.1V до 0.925, частоту на 100 мгц ещё убавил для стабильности (до стандартной для этого чипа, по сути убрал заводской разгон), потеря производительности не ощущается, зато сильно просели жор и нагрев. потребление было 290 вт в пике, теперь 190, нагрев до 75-80 градусов, теперь где-то 60-65, 70 градусов никогда не видел.
>>893774 Должно быть очень хорошо, потому что когда я экспериментировал со стилями, то он их вполне неплохо отрабатывал И это шнеля! Дев по идее должен быть еще лучше
>>893227 >Охуеть, 12B модель и так базарит Да, там у них какие-то особые наработки. Это их последняя модель, правда есть ёщё ларж, но там надо сотни гигов врама.
>>893804 просто иди нахуй, бесполезное слепошарое чмо) я тут анону советую андервольт и результаты привожу для сравнения. ты свои буркала, малафьёй замутнённые протри-то, коллективное дитя двощей.
Чтоб вы знали какое чмо обоссаное делало комфи >{counter:05}_.png >_ Его спросили нахуя черта, а он сказал что >ну тама бфыла пфштука я иё убфрал и какба чирта асталасф ну можыт я придумаю что патом за ней пастафтавить ну пп-пака нипредумал и ана какбы ну типерь есть да вот ээ пук Приходится каждый раз править эту пиздятину самому уже лет 20.
>>893880 >Натвис реально топ, как настоящие фото, и пальцы охуенные. Зачем дауны флюс пользуют понять я не в силах. перевод с петушиного: >всё что влезает в мой хиленький комп и может выдавать голеньких баб, на то и дрочу. флакс не для овощей вроде тебя, тут уже фантазию надо иметь, норм систему и знание английского получше чем nude woman standing.
шизы местные как всегда. вместо того чтобы выкладывать что-то интересное, с лупой разглядывают пальцы, подбородки, пытаются вычислить флакс и творят прочую поебень, перманентно обсираясь.
>>893919 это тред для обсуждения общих вопросов по генерации, а не бложик для высирания картиночек, за этим иди в соседнюю анимепарашу к пидорасам, там у них блять темы и конкурсы ваще ору нах
>>893900 >когда научишься хоть немного детализации завозить? зачем детализированные шедевры в ответе ссаному кловну? может ещё в 4096х4096 генерить спецом, чтобы каждый еблан взглядом не цеплялся?
>>893949 >из натвиса там только две картинки, первая и последняя. Самые пиздатые и детализированые. Как же натвис ебёт, надо уадлить все модели и оставить только натвис.
>>893953 надо civitai сменить название на natvisai и снести всю парашу со своих серверов, оставив только fp32 версию натвиса, самую близкую к реальности
>>893975 на натвисе лоры еот и популярных личностей получаются божественные. как фотки ирл прям. можно даже пририсовать к себе кучу всякого народу и не выглядеть forever alone на авке вконташле.
Аноны, что думаете о Хачатуре aka XpucT? Помню он год назад говорил что дефолтные модели СД полный кал, что его делибрейт - топ. Выглядит как инфоцыган, прикрутил себе везде по максимуму донатов и подписок. Да, он делает не сказать что мало, но и не сказать что ебать какие охуенные плюшки, тип наборы стилей, правит интерфейс стандарного СД, делает портабл версии. Но это же всё хуета, которую любой сможет разобраться и сделать за недельку, попивая пиво и смотря сериалы.
>>893880 >Натвис реально топ, как настоящие фото, и пальцы охуенные. >Зачем дауны флюс пользуют понять я не в силах.
Натвис безусловно шикарен, если тебе не нужно ничего кроме голых девок в простейших позах с раздвинутыми ногами и т.д. Вот это он генерит очень сочно и реалистично. Притом, даже тут, похоже, надо подбирать промпт, ибо я пробовал генерить что-то хоть немного сложнее, например, указать позу поточнее - он забивает хуй на большую часть промпта и генерит то что умеет. Если же, внезапно, использовать нейронки не только для дрочки на простейшие amateur фотки голых девок - то тут уже без флюкса никуда. Он и промпту следует до последнего слова, и дохуища чего может в базе (не считая порно, конечно), и лоры тренируются буквально с 5-и шакальных фотографий. Главное открытие лично для меня, конечно, то что оно промпт полноценно понимает. Я даже и не знал какого это. После флюкса возвращался иногда на SDXL - оказывается я всё это время просто долбился в стену, и просто играл в казино, ожидая что за 20 генераций он хотя бы в паре более-менее попадёт в промпт. В флюксе же - буквально что пишешь, то тебе и сразу генерится. В общем, все нейросетки хороши для своих целей. Пони - для жёсткой дрочки на всякие фетиши, Натвис - для простых, но уберреалистичных эротических фоток, Флюкс - для всего остального, не касающегося порно.
>>894000 Не вижу в твоих пиках абсолютно ничего, что не может сгенерить даже базовая sdxl, тут речь даже не о файнтюнах, даже полтораха кастомная всё это сможет. В следующий раз приноси что-нибудь получше.
>>893978 >на натвисе лоры еот и популярных личностей получаются божественные. как фотки ирл прям.
Анон, а ты сам обучал? Если да, то можешь, пожалуйста, подкинуть настройки? Хочется на Натвисе потренить.
Вот в SD 1.5 тренировалось относительно просто, правда, лучше выглядело в мультяшных/полуреалистичных стилях, вот там лицо вообще 100% угадывалось. Во Флюксе вообще с 5-и шакальных фоток в ублюдочных ракурсах - с первого раза получилась абсолютно идеальная лора, рисующая неотличимо настоящую ЕОТ и других людей. А вот в SDXL так ни разу и не получилось хоть сколько-нибудь нормально натренить. В т.ч. на Натвисе - генерирует в итоге вообще не похоже.
И вообще, сложилось впечатление что SDXL не шибко хорошо на реальных людей тренируется. Вот если отсортировать тег Celebrity по Highest Rated и глянуть самые топовые лоры - ну вроде и не плохо, но не прям особо похоже получается. Во флюксе, например, гораздо лучше с этим (да и в 1.5 зачастую).
Посоветуйте семплер для комфи как KSampler (Efficient) со встроеным вае декодером что бы превью качественные показывал. Но что бы не проебывал зерно как этот, при загрузке из истории или из картинки.
>>894008 обойдусь без твоих уебанских советов) пытаться в вангу не надо, выглядит смешно. а втентаклик всё же более-менее нужная вещь в отличие от тебя.
>>894009 Не сомневаюсь что может. Но это надо ебаться с промптом, генерить, смотреть, что-то подкручивать, подбирать промпт, генерить снова и т.д. Тут просто пишу и сразу получаю что нужно. Я даже не черипикал сейчас, просто рандомные картинки из аутпута взял (видно проёб иконы на лобовой детали, странная хуйня на рукоятке пистолета, и т.д.) Собственно, в этом мой основной аргумент и состоит - понимание промпта, и рисование чётко по промпту. А выискивать что-то, что может Флюкс, а другие не могут - не особо инетерсует.
А ну ещё, из приятного - с кистями и пальцами хорошо работает. Во всяких клоузапах вообще всё идеально, в ракурсах подальше бывает, конечно, в 1 из 10 случаев чутка проебётся, но в основном тоже отлично (натвис и последние "редакции" sdxl тоже неплохи в этом, конечно, но не настолько). И ещё - самолёты хорошо рисует и не проёбывает симметричность крыльев и всего такого. Ну это так, чисто из того что сам заметил, и что порадовало.
>>894014 обучал да, но уточню, на базовой модели sdxl. а генерил потом на натвисе. насчёт настроек тут хз, SDXL капризный это верно, с одного датасета сразу похожесть высокая вышла, с другого херня. причём разницы нет, протеганы и обрезаны пикчи или нет, данные в датасетах плюс-минус похожие. просто один датасет модели нравится, другой нет, лол. но если везёт с обучением лоры, то на натвисе потом генерится отлично. а так пока до сих пор тыкаюсь в onetrainer и kohya в попытках найти идеальные настройки. плюс лоры лучше смотрятся если использовать DMD2 или DMD2+SPO, а без них с некоторых лор вообще каша получается вместо картинки. короче лучше flux трейнить и не ебаться с настройками.
>>894083 фордж это ответвление каломатика с улучшенной скоростью и работой с памятью + поддержка flux добавлена. расширения не все работают от автоматика, но если тебе только промпты вводить и картиночки генерить то разницы не почуешь
>>894089 >инпеинты, имг2имг все стандартные фичи автоматика там есть >реактор работает, по остальным плагинам хз, проверяй на страничках плагинов поддержку forge
>лоры лучше смотрятся если использовать DMD2 или DMD2+SPO, а без них с некоторых лор вообще каша получается Вот это интересно звучит, надо будет обязательно накатить и попробовать "воскресить" свои ублюдочные лоры этим способом, авось сработает.
>>894115 >Всю ОЗУ Ебать ты ценитель. 4070, но при этом огрызок озу. Обновляйся до 64. До 32Гб скачет постоянно, если не ограничивать себя однозадачность. "Комфортно" работаю на 4060. 60с на 20 шагов, либо поменьше на тестовые 8 шагов с хайпером. Когда лоры добавляешь, ставь Diffusion in Low Bits - Automatic (fp16 LoRA)
>>894121 та же видюха, примерно столько же времени на картинку, но 64 гб озу, поэтому генерация после изменения промпта и смена моделей происходят во много раз быстрее чем на 16 гигах, которые были у меня раньше.
>>894122 Да я пол года назад думал обновить пеку. Начал с видяхи, а потом понял что мне её достаточно (вместо 1660), лол. Чтобы на одном монике ютубы/твичи смотреть, а на втором играть. ОЗУ в старую мать обломно расширять, а если мать менять, там и проц и БП и всё остальное надо. Тут теперь выбор или 100+к отдавать на новые потроха для ПК или купить DDR4
>>894141 Да, всего два слота. Ну я всё равно хотел бы фул ПК обновить, а этот старый комп когда место в хате будет сделать фулл рабочим для хобби (планирую 3д принтером обмазаться)
>>894148 тогда пробуй gguf-модели, может меньше памяти будут жрать. но и работают они медленнее, плюс качество хромать начинает. основную модель в папку models/stable-diffusion, vae, clip_l, t5_xxl в папку models/vae, потом в интерфейсе выберешь их, иначе основная gguf с ошибкой вылетит. Q2 - самое низкое качество и размер, чем больше число после Q в названии, тем лучше качество и больше жор памяти. в настройках со второго скрина ещё попробуй все значения в ноль выставить.
И еще тупой вопрос: По дефолту фордж ставит размер 896x1152 - это для него норм? Как он вообще с другими размерами работает? Помню в СД на дефолтных моделях СД были траблы, умные головы на ютубе говорили что то вроде "модель обучалась на 512х512, поэтому только такие картинки хоршо генерит"
>>894200 >vae обязательны? у тебя скорее всего модель со вшитыми текстовыми моделями и vae, ничего делать не надо >>894205 фордж выбирает наиболее подходящие размеры, хотя flux в целом похуй на разрешение. можно не пользоваться хайрезфиксом\kohya-фиксом, а сразу генерить в 1920x1080
У Флюкса понимание художественных принципов вшито на фундаментальном уровне, а значит "с классикой" у него несоизмеримо лучше чем у сд-кала неспособного подделывать форму, глубину и перспективу. Сд-говно способно только как бы обмазывать сверху неким подобием стиля.