Stable Diffusion Flux тред X+109 ====================================== Предыдущий тред >>860723 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожие тематические треды - аниме-тред >>863120 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Flux — открытая нейросеть нового поколения для генерации изображений от стартапа Black Forest Labs, основанного бывшими разработчиками Stable Diffusion. Полный функционал в локальной установке (см. ниже)
Пример промпта (запроса) для sd1.5 или SDXL: an european girl, standing, high quality, soft focus, 8k, photograph by nick nichols Пример промпта (запроса) для Flux: This photo shows a small smiling young caucasian adult woman with blonde hair wearing a pink t-shirt with the words "SD3" and panties sitting on a white couch with her legs crossed in a yoga pose, in the background of the image behind the couch there a several standing large buff african american men wearing white t-shirts with the words "FLUX" and white shorts, they are staring at the blode young woman, the woman is very small in the image allowing the men to tower over her ------------------------------------------ ♾️РАЗЛИЧНЫЕ ХУДОЖЕСТВЕННЫЕ СТИЛИ (С ПРИМЕРАМИ) 👇 https://supagruen.github.io/StableDiffusion-CheatSheet/ https://www.artvy.ai/styles ------------------------------------------ 💻ЧТО ТАКОЕ CONTROLNET И КАК ЕГО ИСПОЛЬЗОВАТЬ https://dtf.ru/howto/1669307-ustanovka-i-obyasnenie-nastroek-control-net-kopirovanie-pozy-kompozicii-i-td ========================================== 🧠 ОБУЧЕНИЕ ПО СВОИМ КАРТИНКАМ 👇 https://dtf.ru/howto/1660668-obuchenie-modeli-s-pomoshchyu-lora https://civitai.com/models/train
Дайте советы как тегать датасет персонажа для Flux. И про сам датасет, если есть нюансы. Хочу, чтобы не только общие черты были узнаваемы на генерациях, но и детали уровня перчаток, предметов. Включить макро планы таких вещей? И сам стиль рисовки - просто дописывать "In x style"?
с какого хуя он пишет 18 вместо one (адын!) в фразе no one? флюкс про арт, если что, онлайн генератор это цензура, типа, такая, что ли я даже не представляю... это педофилы всех так доебали, что цыфры ниже 18 в принципе запрещены?
>>864653 → >>864660 → он мыльные, а если юзать в связке с ультимейт апскейлом еще и долгие на первом аура вс суперскейл на втором есрган
>>864663 → >В каждом тайле ауры разная текстура коже и швы видно. я специально вариант где сильно видно выбрал и расписал как убирать, на других входных данных швов может не быть видно >Справа аура слева суперскейл. суперскейл мыльнее, я все модные молодежные апскейлы тестировал >Вся фишка твоего результата именно в апскейле и последующем довнскейле это и показывал, суть вообще в скорости которой можно добиться и по итогу картинка самая четкая получается из всех возможных вариантов, если в тот же размер довнскейлить то картинка мало того что моментально просчитывается так по четкости еще и на уровне флюха ванильного ну и зачем флюх нужен ряяяя тащемта можно и не даунскейлить а поверх проходить против артефактов (есть модели еще для имейдж ресторейшена, тоже годный быстрый вариант), это мне 4х ауры не нужон
>>864755 Впрочем, даже если самому заменить one на 18, то все равно рисуется только одна. Вероятно, для толпы или группы баб надо иначе писать, а так он это не воспринимает. Так что замена в данном случае не играет роли, видимо.
photo of three adult men, the one on the left is holding a paper with the number one, man in the center is holding a paper with number two and the one on the right is holding a paper with number three
>>864660 → >>864757 → > 2. 4x_NMKD-Superscale-SP_178000_G Он для хайрез фикса нужен, он специально создает такие псевдодетали, что в хайрез фиксе они превращаются в настоящие
>>864906 > А чё быдло так до блюра доебалось? просто анимешники привыкли видеть мир в 2д >>864951 > А убрать уже нигде нельзя имплаинг, что убрать его нужно
За счет чего флюкс так хорошо рисует мелкие детали, даже если они совсем крошечное пространство на картинке низкого разрешения занимают? Например, лица людей, которые далеко от камеры. СДХЛ в тех же условиях нарисует месиво пикселей, которое придется инпеинтом детализировать. Ведь на одних картинках примерно учатся все, почему такое расхождение?
>>864954 А кстати возможно. В анимеговне обычно всё плоское как на рисунках пятилетних даунов. Привыкли походу после бесконечных просмотров тайтлов, хотят чтобы на заднем плане каждый засвет трусов был хорошо прорисован
>>864912 >Блюр это искусственный художественный эффект Ебать, чудовище, ты какого рода? Поставь палец перед носом и сфокусируйся на нём. Искусственный эффект, блять.
А что скажет по этому поводу начальник транспортного цеха стабилити ай? Они как-то высказались по поводу флюкс? Типа это вообще их наработки украли и т.п.
>>864997 Ну он наверное имеет в виду то что в реальной жизни сцену можно охватить взглядом двигая глазами (и меняя фокус), а с плоским статичным изображением так не получится если большая его часть сильно и намертво размыта, мол де из-за этого проёбываются детальки.
Так-то оно так, но совсем без размытия тоже пиздец нереалистичный, глубина идёт сразу нахуй, всё превращается в сплошное месиво из форм.
Размытие неизбежно нужно, просто необходим адекватный баланс.
Как по мне у Флюкса с этим плюс-минус нормально
Ноют только совсем уж конченные петухи которые всю жизнь поедали говно глазами
>>864993 В аниме как раз таки фокусировка, как у глаз ИРЛ, постепенно расплывается в зависимости от расстояния, потому что мог рисовать как хотят. А вот у манюнь фотографов ограничение на фиксированное фокусное расстояние и эти маняфотографии насрали в датасет, соответственно и нам в диффузеры
>>865022 >насрал кучей плоского говна, центральные объекты никак не отделены от фона, на первом пике левая часть фона в несколько раз детальней и сочнее фигур первого плана
>как у глаз ирл
Лол. Это такой троллинг надеюсь?
Если нет, то это прекрасное доказательство того что анимедебилы клинически нездоровы
>>865038 Анимепетух горит от того что не получается генерировать любимое корявое месиво из форм, без акцентов, без грамотной глубины и без нормальной воздушной перспективы
При чем тут глаза вообще, шизики наху? В каком месте это вообще аргумент? Блюр в флухе обоснован тюном модели под "профессиональные" фото, для которых блюр это стандартный инструмент. То что модель такая нужно просто смириться, кому-то нравится, кому-то нет. То что модель в базе затюнена под конкретный стиль это кринж конечно, но всегда можно лору накатить
>>865042 А где я говорил что это нормальная воздушная перспектива?
1) Воздушную перспективу всегда усиливают компенсируя этим плоскость изображения. В рисунке и живописи это вообще база. Представь себе, даже отдельные части портретной головы, те которые второстепенные/дальше. Иначе с глубиной ты хуйцов пососёшь, даже ебальнику нормальный объём не придать. Выступающие/важные части наоборот прорисовывают максимально и сочно, чтобы лезли вперёд.
Это в реальности глубину ты добираешь за счёт стереоскопии. Плоская картинка этим не балует, приходится компенсировать.
В "чистом виде", без размытий и выставленных акцентов риализьм на плоском изображении получить принципиально невозможно, потому что физической глубины у него нет. Можно обхуярить всё кучкой деталек сверху до низу но это никакой не реализм, в реальности ты такого изображения на глаз не получаешь, хоть обосрись. Такое можно получить только двигая глазами глядя на реальную сцену после постообработки мозгом. Он тебе создаст иллюзию детальной сцены
2) Речь была об анимекале, в первую очередь этом: >>865022
>>865050 Тут речь про размытие в целом, додя. Это фундаментальный инструмент который используется всегда и везде если речь о плоском изображении. Никакие петушиные стили к этому отношения не имеют. А вот глаза и мозг имеют самое прямое отношение, потому что плоское изображение воспринимается совершенно не так как трехмерное
>>865069 >смотри то на палец, то на объекты за ним.
Слабоумный, ты понимаешь что при переводе взгляда происходит перефокусировка?
Просто пиздец!
А вообще если жопа так горит можешь бросить линки на мои посты на борду местных рисовак, посмотрим как они тебя обоссут и продвачуют все мои тейки
А если не охота позориться, можешь скормить это >>865056 ИИ-чатикам, погляди что они ответят. Я бы сам скормил и бросил результат тебе в петушиное рыло, но меня за простыни их ответов уже били на этой доске банхаммером в ёбыч
Нейрохуйдожники мамины, блять, хоть лекции по теме на ютубчике повтыкайте что ли, просто пиздец. Книжку какую-нибудь почитайте
>>865080 Понимаю, что у тебя происходит перефокусировка из получения хуёв в рот на получение говна на лицо под шконарём. Зрение в 3,5 градуса это тоже ненормально. Пиздуй давай, и в нейрочате спроси, и у рисовак, мозгов у тебя своих нет.
>>865088 Соси хуй, быдло кривозубое. Внятного тебе всё равно уже ничего не высрать, сложно ведь спорить с реальностью Поссал прямо на твой красный гребешок. Можешь вообразить эту сцену без блюра, я разрешаю
>>864983 >За счет чего флюкс так хорошо рисует мелкие детали за счет выдроеченного семплирования и шедулера (ты наверно заметил что не все семплеры работают с флюхом, точнее 97% семплеров не работают, а мануальный шедулер флюх с минимальным отклонением вообще не жрет и генерит пустоту, это неспроста) т.е. флюх это файнтюн для красивых картиночек с блюром под конкретный тип вычислений, соответственно сетка полностью в курсе о качестве финального результата в латентном пространстве, поэтому четкость такая хорошая вообще этот эффект называется momentumized, и чтобы сдхл мог выдавать подобное можешь попробовать семплер res momentumized например, для еще большего эффекта можно стабилизатор типа PCM/HYPER накинуть и будешь удивлен похожей на флюкс четкой картинке
1) Без размытия (любого рода) добиться реализма на плоском изображении принципиально невозможно, спорить с этим будут только психбольные
2) В каждой сцене размытие желательно выставлять индивидуально, отталкиваясь от своего эстетического чувства, нащупывая баланс между количеством деталей и эффектом глубины
3) Следовательно, хорошо бы иметь возможность тонко управлять размытием с помощью промта. Это вполне разумно и верно
4) Однако в силу существования огромного количества сумасшедших пидарасов вроде вот этого >>865022 разработчики нейронок скорее всего бояться давать полную свободу управления развитием
>>865132 Тут надо согласовать что такое реализм. Вот твоя пикча. Мы то знаем, что она из фильма. То есть это реальный актер снят на реальную камеру. То есть реализм? Но, тот кто не видел этого фильма - скажет что ты нереалистично сгенерио)) Сам представь, что это генерация и внимательно посмотри на картинку.
Чет я сейчас хотел влететь в тред со словами skill issue в ответ на избыток блюра, но сам охуел как оно мне выдало блюр на обычное фото. Не знаю как я не сталкивался с этим до этого. Сгенерил уже сотни-сотни пикч и не замечал такого жесткого фона.
Ну да, ты принёс уродливое говно, долбоёб. Всё смешано в кашу, все объекты слиплись друг с другом как кулебяхи кала, глубина не читается, работает только, кое как, пердя и крехтя, линейная перспектива, да и то только там где есть крупные угловатые объекты .
Подобные фотовысеры от вооруженных зеркалами тупых пёзд можешь себе в клоаку сунуть.
Пойми, дурочка, фотоаппарату похуй как твой мозг будет воспринимать плоское изображение. Если ты ублюдок-вырожденец просто тыкающий на кнопку, камера будет тупо выдавать тебе бесформенный винегрет. У фотоаппарата нет кнопки "сделать охуенно"
А вот у нейросетей есть. Жмешь на кнопку "сгенерировать" и нейросеть выдаёт тебе относительно неплохое изображение, с глубиной которой ты бы никогда не добился своими кривенькими пальцами. Нейросеть о существовании твоих кривых пальцев знает и... не даёт тебе отключать блюр.
Реализма ИРЛ не существует, потому что ты ИРЛ воспринимаешь обработанный мозгом образ трехмерной сцены. Он не = реальность. В реальности даже линейной перспективы не существует, она у тебя в глазу, она образуется под воздействием форм твоего глаза. В реальности вообще аксонометрия голая, прикинь? Геометрия объектов иначе "выглядит"
Ещё раз повторяю: реализма не существует ИРЛ
Реализм – это условность
На плоском изображении строится иллюзия той иллюзии которую ты видишь ИРЛ
Иллюзия иллюзии
Лол
Я понимаю что для кого-то это сложная мысль
На плоском изображении мы с помощью всяческого вранья (типа искусственного усиления воздушной перспективы, чрезмерно мощных акцентов) пытаемся создать иллюзию которая будет нашему мозгу казаться очень похожей на ту иллюзию которую мы видим ИРЛ
Хорошенько перечитай это если не дошло. Это дистиллированная база, это аксиома и в живописи и в фотографии и в кино и где угодно.
И да, ещё раз повторяю: хорошенько это перечитай и попробуй осмыслить. Без понимания этого даже речи не может быть о понимании того что такое плоское реалистичное изображение. Это даже детям в художественных школах объясняют
И снова: если у кого-то тут есть какие-то сомнения по поводу моих слов: киньте эти слова рисовакам с соседней борды или ИИ-чатикам
>>865168 Ну ты капец дурной канешн. Ты еще задвинь про тему, модную нынче во всех фильмах, трясти камеру в статичных сценах. >кадр из советского цветного фильма
>>865182 Ты ебобо? И что по-твоему с этими кадрами не так?
Ты блять присмотрись к ним, особенно к последнему, на нём глубина сцены передана просто восхитительно, посмотри как прорисованы фигуры переднего плана относительно фона. Ещё и композицией отлично передается глубина, особенно на втором
А теперь сравни это с тем гноем что в предыдущем посте
>>865201 Быдло ебаное, это блять базовая аксиоматика построения реалистичного изображения. Тебе то же самое скажет любой академический художник.
Либо вы, колхозники обоссанные, вникаете в эту базу, либо и дальше продолжаете с вымазанными калом глазами генерировать уродливое ублюдство
Вы же просто уроды, блять, если пытаетесь о чем-то рассуждать приводя в примеры такое вот говно: >>865146 >>865022
Вас избили бы ногами на пороге любой художественной шараги, а потом сожгли
Это пугающий пример петухов некомпетентных до такой степени что они даже примерно не могут осознать свою некомпетентность. Эффект Даннинга — Крюгера как он есть
>>865220 > Быдло ебаное, это блять базовая аксиоматика построения реалистичного изображения. Да успокойся, я даже не читал. Спорите о хуйне лишь бы поспорить.
>Тебе то же самое скажет любой академический художник. У меня худ вышка...
>>865205 > не может Ну как тебе сказать. Лоры тренятся сильно легче XL, хоть и медленнее. А остальное дело времени. Всякие бигасспы пикрилейтеды никогда не смогут сгенерить, а на флекси это два часа тренировки.
>>865247 > Всякие бигасспы пикрилейтеды никогда не смогут сгенерить Изи смогут это ж обычный букаке камшот, вот поэтому и нет смысла на флюх пересаживаться, все что сейчас в лорах на флюхе есть - есть полноценными моделями на сдхл. Вот когда флюх сможет генерировать то чего не может генерировать сдохля - тогда будет смысл. Но скорее пока перетренят флюх там астралайтушка уже аурафлоу сделает и флюх никому не будет нужен.
>>865244 >по существу Я тебе принёс кадры из фильмов без блюра, которые мне нравятся. Чтобы показать, что без блюра великолепно видна вся перспектива. И смотрится красиво. Тебе они тоже понравились. Но ты топишь за блюр. И меня же обосрал. Так блюр или не блюр? У тебя с логикой в голове не лады. Как можно с тобой дискутировать? Иди чаю попей, отдохни чуток.
>>865254 >>865258 Так флюкс увидев что-то потом может делать с этим что угодно, даже то что в датасете даже близко не встречалось. Мокрые азиатки - это вообще мимо.
>>865270 Да понятно что DIT может многое, но я слмневаюсь что ктото будет дрочить на закамшоченный шильд бмв. А в случае девок в камшотах уже вопрос если нет разницы зачем платить больше?
>>865346 >В XL порнуха слишком всратая Субъективное заявление >Вот тот пиздец с мокрой азиаткой - это то что ты называешь нормой? Да, это норма реализма. Мне просто нравится тру реалистики со всеми этими неровностями и шероховатостями, а порнушка из ателье такое. Но тут такое дело, что сдохля и в ательешку может и не в ательешку, а флюкс нет.
>>865412 > нравится тру реалистики со всеми этими неровностями и шероховатостями Так у тебя везде на пиках мыло какой-то. Мне так-то тоже детализация нравится, но у тебя совсем пиздец вырвиглазный.
не знаю пацаны чего вы там против блюра выступаете, по-моему очень реалистично, я мир так и вижу, вот человек а за ним сразу туман блюра, все так и есть, полное попадание второй пик это очки которые я ношу кстати
>>865420 >Так у тебя везде на пиках мыло какой-то Впервых енжой реалити, мыло в любительской порнухе ето норма. Вовторых ты мылошиз, это без апскейла, не видно чтоли? Щас я побегу апскейлить шарпнкларити повышать чтобы на дваче флюксер восхитился, ага да. Мне и так заебись. >Мне так-то тоже детализация нравится Ты ничего не понял... Речь вообще не про детализацию.
>>865445 Жипег не равно мыло. Мыло это когда вместо текстуры какой-то градиент, присыпанный шумом для "шершавости". На реальных фото даже в пикрилейтед шакалах нет такого говна как у тебя.
>>865450 а для тебя походу єталон jpeg 30% снятый на пластиковую линзу мобильника 2004 года? отсутствие четкости и деталей - явный признак брака так-то...
>>865132 Чего ты несеш? ты еще скажи что мир размытым видиш ( не ну если у тебя бдизорукость, и дальше 2 метров не видиш, то да, будет все с бокехой,только диафрагма в камерах как вынужденная мера была, чтобы регулировать подачу света в кадр, сторонним эффектом от которого возможность контролировать грип появилась, и замыливание фонастали использовать для концентрации на основном объекте, и за одно чтоб фон не мешал, только глаз нифига не камера и постоянно рыскает по сторонам фокусируясь поочередно на все планы
>>865578 > только глаз нифига не камера и постоянно рыскает по сторонам фокусируясь поочередно на все планы ну и фокусируйся, никто тебе мешает. просто генери по картинке на каждую фокусировку, потом сделай из них видео, и будет тебе реализм. только не забудь фпсу подкинуть, а то кинцо получится
>>865590 Зачем мне что-то генерить отдельно, если я могу просто взгляд фокусировать на разных объектах? Мне для этого никакие костыли с замыливанием не нужны, представь себе. Ты, если честно, производишь впечатление какого-то первокурсника или самоучки, который одну книжку по фоткам прочитал, неверно понял, и теперь эти теоретические сведения у тебя над практикой возобладали, что ты аж забыл, как глаза реально работают. А глазам никакое насильное замыливание для фокусировки не нужно, вот и все.
>>865590 > проблема флюха это замыливание в говно всего > рррррррррряяяяяяяяяяя мы художники мы так видим, идите на хуй, обосрусь но буду защищать проблему хуй пойми зачем
>>865581 а теперь вопрос на милион "ирунь брюнек": зачем флекси флюкс, если флюксом и так можно генерить, и флюкс понимает нормальные промты? а кому мало можно еще и ламу поднять чтобы раздувала промты с коротких
>>865581 что к стати эта флекси из себя представляет? понятно что что там под капотом точно не скажет никто, но почему Хач так ее стал нахваливать и локальные модели обсирать?
>>865660 >локальные модели обсирать? Ну почему только локальные? Все. Мне вот это и не понравилось в нём. Ладно свое хвалить одно дело. Но говорить прямым текстом, что это и это овно это не красит человека. На Ютубе в последних роликах где-то у него.
>>865660 > что к стати эта флекси из себя представляет? Как сервис? Несколько инстансов комфи под несколько карт на балконе хача, с ботом в дискорде с подключением по апи.
>понятно что что там под капотом точно не скажет никто Там полтораха отъебанная переебанная криворучкой.
(глитчи, которые иногда возникают с нихуя и фиксятся правкой промта, или от маленьких весов лор) Кароч, начал с того, что проверил в цивитаи генераторе, и там тот же промт с настройками и сидом, мало того что сразу работает, так еще и дает лучшее качество чем локальная генерация. И итоговая картинка на цивите получается немного другая. Так вот, я НЕ смог добиться совпадения генерации 1 к 1, но выяснил, что вот эти три эмбединга https://civitai.com/models/222256?modelVersionId=250712https://civitai.com/models/99890/civitai-safe-helper добавляются ко всем генерациям по дефолту. Так что достаточно их скачать, кинуть в папочку embeddings и добавить в конец промта (через запятую) civit_nsfw, safe_pos + safe_neg в негатив. Не знаю, почему это работает, но в моем случае это работает. Генерация стала ну прям почти 1 в 1, по стилю, но разница все равно есть, так что, если кто-то знает как скопировать генерацию из цивита в автоматик 1 к 1, буду признателен за инфу. Я эти эмбединги и так и сяк пихал в промт. Через хуйню конвертил https://fooddesert-embedding-converter.hf.space/ - особо не приблизило.
Дайте промпт которым можно тестить эти отличи в квантовании. А то у меня то в аниме скатывается, то еще во что-то. Нужен более-менее стабильный результат.
>>865658 >ламу поднять Какую? У меня на 16Гб ВРАМ она будет улетать за пределы памяти и генерация пикч замедляется в 30+ раз. Может и больше, я дальше первого шага не генерю, когда замечаю этот проёб.
>>866035 > Где, кем? Почему? В комфи теперь операции сразу над fp8 производятся без конверсии, быстрее fp16 на 50-100%, только для Ады/Хоппера. > fp8 всегда сильно хуже Q8 Не сказать что сильно, на практике даже и не заметишь, только при прямом сравнении в гридах видно что от fp16 немного отходит картинка на одном сиде. T5 в fp8 больше картинку ломает так-то. Но вот лоры в Q8 очень херово работают. Как будто с весом 0.3 применяются, а когда повышаешь вес ломаются, ещё и скорость при 2+ лорах пиздец. Q8 с лорами фактически неюзабелен, только на fp8 сидеть.
Уважаемая профессура, я вас немного спущу на землю в ваших спорах о сферических конях в скопленях метана.
Я уже битый час пытаюсь нарисовать тёмное мокрое пятно на простыне, я перебрал все модели, что у меня есть, но ни одна из них не знакома с концемтом промокшей насквозь ткани. Об этом не знает ни анмешные, ни sdxl, ни pony модели. Максимум, что у меня получается это вот такая ебала: см. рисунок. Как из рекламы непромокаемых курток коламбия) При чём в негативе пробовал писать: water drops. Это не помогает. Не помогает даже inuresis, короче нихуя не помогает. Причём не рисуется ни в txt > img, ни в импейнте, нигде. Замечание: Не должно быть никаких луж мочи или ещё хер зает чего, просто блядь пятно мокрой ткани. Промт: empty bed, small wet spot on the bedsheet Нег: (human), (woman), (man), water drops Если промт вам чем-то не понравился - предложите свой, гениальный.
>>866143 >>866184 >>866171 Попробывал вот это: WettingPony.safetensors На одном из сидов выловил нечто подходящее, буду подбирать цифирь - "развивать успех")
Единственная проблема флюса это бокэ. Это так же единственная причина его неюзабельности. Эта хуйня может нравится только тупопёздым шлюхам с минусовым айсикю с минстраграмы. Вижу укого-то бокэ - всё нахуй, сразу видно что это за петушара опущенный.
>>866194 >"развивать успех" Результат, который меня устроил: big wet spot on the bedsheet, (wet fabric), wetting Кляксу рисует только karras, остальные добавляют много ненужного.
>>866048 Так ты разницу в квантовании проверяешь или сэмплеры? Хотя и то и другое через один сид проверяешь. Все так же остается, как я и говорил, при сравнении квантования, между Q4 и Q8 разницы примечательной нет.
>>866322 А можно натренировать как-то на графики форекс? Чтобы потом и2и скармливать ей скриншоты текущего графика, а она выдавала скрин с ответом покупать или продавать.
>>866323 nf4 кал, ггуф только если лорами не пользуешься и нет свежей карты. t5xxl_fp8_e4m3fn надо вообще запретить - он понимание промпта ломает, строго либо fp16, либо Q8.
>>866325 Конечно можно. Уже иду обучать. Загружаешь пикчу, сдвигаешь её влево на 25%, пустые 25% инпейнтом врисовываешь. Точность - 100%. Поставлю на цивите бесконечный early access со стоимостью загрузки 100,000 BUZZ.
Аноны, я выпал из темы на многие месяцы. Подскажите, плиз. Последние пол года я использую Fooocus и он меня устраивает на 100%. Не появилось ли сейчас что лучше него? Такое же простое, компактное и эффективное решение с одной кнопкой "сделать хорошо"? Хотя я пользуюсь этой инпэинтингом в нем. Или дальше сидеть и не рыпаться?
Вчера вкатился поигратся локально во флюкс, до этого вообще не прикасался к нейросетям и залип на два дня. Как бы поспать. Ксеноморфы получаются просто ахуенные.
>>866335 >t5xxl_fp8_e4m3fn надо вообще запретить - он понимание промпта ломает, строго либо fp16 Дай пример промпта, который гарантировано сломался. Я сейчас сравнил 8 против 16 и разница лишь в мелких деталях.
>>866571 берешь пикчу как референс, прогняешь ее через florence 2 vlm получаешь кепшен промт берешь базовую модельку пони (можно в принципе и чтонибудь отфайнтюненное что может в рисованное, не принципиально особо) и к ней стиль более менее похожий на тот что с пикчи, подключаешь стиль как лору роутишь это в айпидаптер с настройкой пиздинга стиля, применяешь юнион контролнет если требуется пиздить композицию все закидываешь в кастомсемплер с опциональным подключением современных семплеров Runge-Kutta или Res опционально подключаешь стабилизаторы генерации PCM/Hyper/Turbo/DPO, MSW-MSA, SAG, че там еще забыл
>>866544 Чет залупа какаято, он на разных сидах с одним промптом делает одно и тоже изображение, никакой вариативности... Даже обычный дев или шнель делал гораздо вариативнее....
>>866568 Берешь почти любую модель, хоть немного умеющую в акварель, масло и дигитал. Пишешь свой промпт, добавляешь по 50 токенов от каждого стиля, потом туда же еще пару сотен самых популярных токенов с цивиты. Дальше дело за малым - забрутфорсить искомый результат перестановкой токенов. Но лучше просто ебани IPAdapter Precise Style Transfer.
>>866712 Иди на хуй, еслиесть что сказать обоснуй!!! Я привожу конкретные примеры на одинаковых настройках и разных моделях, и мердж шнель + дев говно!!!
>>866713 пара технических вопросов: 1) Клип_Л для флюкса другой надо чем для СДшек разве? 2) Ксамплер(эфищиент) от обычного отличается чем-то? 3)Клиптекстэнкодер двойной улучшает ситуацию в сравнении с обычным где один и тот же запрос идет и в т5 и в клип_л?
>>866724 почему это они тупые? я другие воркфловы находил, где небыло этих хитровыебаных нод под флюкс и из особенных только лоадер модели был, чтоб квантованые грузить
>>866722 >2) Ксамплер(эфищиент) от обычного отличается чем-то? просто нода, они разные бывают с разными компоновками фич на борту >1) Клип_Л для флюкса другой надо чем для СДшек разве? нет >3)Клиптекстэнкодер двойной улучшает ситуацию в сравнении с обычным где один и тот же запрос идет и в т5 и в клип_л? ну больше свободы конечно, надо учитывать что в т5 не нужно промтить как в старый клип (надо расписывать стену хуман лангвиджа), а в клипл можно промтить по старому через запятую
вот допустим пик 1 чисто клипл, пик 2 чисто т5 с тем же говнопромтом челика выше, то есть технически можно и на одном клипл сидеть пердеть, тольковыиграешь от того что он не засирает врам собой и можешь квант повыше у модели основной взять
>>866736 > не засирает врам собой Чел, с пустым промптом клип точно так же отрабатывает, просто выдаёт кондишен для пустого промпта. Качество соответственно на дне от этого.
>>866736 >тольковыиграешь от того что он не засирает врам собой и можешь квант повыше у модели основной взять но зачем? тройка (эх, не хочет никто тройку до ума доводить...) и флюкс для того и нужны чтобы можно было писать запросы по человечески, а не дрочить через запятую тегами и расставлять веса пол дня
>>866736 > с тем же говнопромтом челика выше Да ладно тебе, нормальный у него промпт. Но можно немного улучшить, если заменить no blur на no elephant ears или there is no subtitle text "please don't put blur in the background", например.
>>866760 как раз тут с задачами, в отличии от сд1,5, где чтото сложнее еуропеан вумэн виз пинк хер сделать очень трудно было, подвезенный текстовый энкодер позволяет уже делать илюстрации с сюжетом
>>866785 Орируй пока адоби не выкатит свой нодовый редактор и нормисы, бизнес, госконторы кинутся плотить миллионы лишь бы не разбираться в запутанном интерфейсе.
Здравствуйте, поясните пожалуйста по хардкору за Flux Сколько видео памяти нужно примерно для комфортного использования? 16гб хватит? Как там с цензурой вопрос обстоит? Как им пользоваться, просто в SD закидывать или отдельный интерфейс нужен?
>>866834 >Сколько видео памяти нужно примерно для комфортного использования? если у тебя быстрая память текущего поколения, проц и псие4+ то может хватить и 8, просто будет перекидывать из врама в рам и обратн части моделек, а если нет, то 12 минимум, сможешь без выгруза в рамку запускать квант 4-5 >16гб хватит? вычти из памяти 10% на систему (если у тебя отрисовка и гпу акселерация не перекинута на встройку), складывай размер клип-л (240 метров), т5 https://huggingface.co/city96/t5-v1_1-xxl-encoder-gguf/tree/main и самой модели https://huggingface.co/city96/FLUX.1-dev-gguf/tree/main (дев) или https://huggingface.co/city96/FLUX.1-schnell-gguf/tree/main (шнель) нужного кванта и прикидывай что влезет >Как там с цензурой вопрос обстоит? сисек писек нет, порно нет, но анатомия не поломана, есть говнолоры и говнофайнтюны уже >Как им пользоваться, просто в SD закидывать или отдельный интерфейс нужен? ставишь комфиюи портабле, пак нод https://github.com/city96/ComfyUI-GGUF , раскидываешь части моделек в clip (т5 и клипл) и unet (модель в gguf), потом берешь воркфлоу загружаешь или сам повторяешь по примеру и все
>>866844 > то может хватить и 8 для комфортного пользования имелось в виду, на медленной рамке и старых процах на 8 гигах жизни нет, клип обрабатывается по 40-50 секунд каждую смену, плюс генерация и время перекидывания моделек ебическое
Ебать я кажется взломал жопу флюкса и понял почему он может генерить четкие изображения по дефолту (и дело не в ДИТе вообще), а сд по дефолту не может. Если щас по тестам прокатит то расскажу как ебать флюх.
>>866849 >настройки пробовал от 640х360 до 1920х1080, каких-либо хайрезфиксов не нужно, в этом диапазоне всё ок получается само собой. >псие3 у меня тоже, вроде не сильно влияет. на 1080p картинку уходит меньше минуты с 12-гиговой 4070ti (если юзать bnb-nf4-v2-dev веса)
>на 1080p картинку уходит меньше минуты насчёт меньше минуты напиздел, забыл настройки поменять с SDXL на FLUX, а так в среднем 1:10 ждать для 1080p, время можно примерно подсчитать для других карточек, посмотрев производительность в терафлопсах
Это нормально, что на форже после апдайта теперь запускается dev_q8 + t5_fp16 на гпу с 12гб? Ну он жрет еще 32гб рам, но раньше вообще все жестко висло при загрузке такой модели и даже 32 не хватало
>>867270 > The image shows a man in the process of kicking a chicken. He is wearing a blue jacket and a hat, and he appears to be laughing at his actions. The chicken has a red tag on its leg and is flapping its wings as it's being kicked. The setting seems to be outdoors, possibly near a barn or a similar structure, given the presence of wooden fencing in the background. The overall atmosphere of the image is humorous and somewhat chaotic.
Блять какого хуя в треде не пишут про всякие новые фишки типа DmD2, почему про такую имбу приходится узнавать хуй пойми где. Про какие то лайтнинги блять пиздят, когда эта хуйня даёт в 4 шага генерить, так ещё и не только ускоряет, так и улучшает выхлоп из оригинальной модели. И буквально даёт генерить в каком захочешь разрешении без хайрезфиксов.
>>867363 Не ну вообще Лору накатить поиграть интересно. Ставишь LCM семплер, гайденс 1 и генеришь. У меня на 3060 батч в 4 1920x1080 за минуту отрабатывает. Но конечно в таком разрешении только ландшафты генерить.
Я сильно не сравнивал с остальными лайтнингами и турбами, но с этой Лорой мне не пришлось как-то менять свой промптинг, контролнеты всё как обычно работает. Особенно интересно смотреть в лайв превью как он пытается на сильно нестандартном разрешении каждый шаг скукожить картинку в нормальную композицию. Ебальники и крупные планы это не спасает, но все равно необычный аутпут выходит.
>>867380 Чувак, берёшь 1216 x 832 разрешение как по-старинке, генеришь и просто через дат_х2 апсейлер и даунскейлишь ланкозом до 1080 с кропом. Это вообще делается за наносек без потери качества, хачем эта ебля.
В итоге какой положняк по квантованиям с максимальным приближением к оригиналу. Квант флюкс + квант т5? Чтобы меня потом не обоссывали за неправильный выбор.
The image captures a bustling city street, teeming with life and activity. The street is lined with shops on both sides, their storefronts inviting passersby to explore. A large sign stands out in the middle of the street, proudly proclaiming "Carnaby Street - The World's Favorite Shopping Destination".
The street itself is a hive of activity. People are seen walking along the sidewalk, some carrying handbags, perhaps returning from a shopping spree or heading towards one. Others are seated at outdoor tables, enjoying a meal or a drink under the open sky.
A few umbrellas are also visible, providing shade for those seated beneath them. The buildings that line the street are tall and imposing, their windows reflecting the lively scene below.
Despite the multitude of people and activities, there's an order to it all. The street is wide enough to accommodate the flow of pedestrians and vehicles, while the shops and restaurants are neatly arranged along the sidewalk. It's a snapshot of urban life, captured in one single frame.
прикольно, щас соберу бейз модель из бинарника и смешаю дифренсом или тд с какимнибудь натвисом, посмотрим че будет, потому что лора пиздец жарит даже на цфг1, там буквально она начинает ебашить на 0.1 весе, но инферирует харащо
лицензия кстати ебанутая у этого поделия, поэтому непопулярно и вообще это андеграунд лол, вот бы такой же дистилят для флухокала
>>867537 Поздравляю, тд работает. Теперь это гавно может ебашить картинки на любом семплере и с более высоким цфг, пикрел эйлер, модифицированный натвис, 8 шагов
свд (самый охуенный метод смешивания моделей ортогональный) на ночь поставлю, там джва часа будет ебашить
>>867553 >>867553 RK семплеры шумят, моментумы тоже, хз потом подумаю как пофиксить. Кароч крутая шняга. Если кому лень самому билдить модель могу скинуть конкретно этот натвис.
>>867604 Ага, кохуевский хайрезфикс будто бы не особо сильно выправляет картинку в комбинации с лорой. Ожидал что в таком случае вообще выдаст нормальное изображение .
>>867808 big boob woman in bikini sitting on a table, her severed head is replaced with the one of a mannequin, in the background is a sign with text "life is short"
>>867840 > я уверен Тогда можешь сразу сдаваться. Но если не уверен - пробуй, твикай, инпейнть ебало. big boob woman in bikini sitting on a table, her severed head is seamlessly replaced with that of a mannequin with a blond wig, she is wearing a gunslinger belt and ammo straps on her wrists, in the background is a sign with text "life is short", the scene takes place inside a studio apartment with red brick walls
>>867859 Иногда мне кажется что нейросетку лучше использовать как финальный рендер, а не основной инструмент, лол. Потому что пока это какой-то пиздец с композицией и пространством
>>867871 > нейросетку лучше использовать как финальный рендер, а не основной инструмент Пришивание голов манекенов девкам с целью постановки фото на другой доске. > какой-то пиздец с композицией и пространством Ну вот natvis, вместо флакса.
А вообще, на любой вопрос типа "как сгенерировать такое же?" ответ один - IPAdapter, controlnet и их сочетание.
>>868063 хитрый китайский дистиллят, превращающий сдхл в машину по генерации высококачественных картинок без мутаций вне размеров конволюшена датасета без дополнительных мокрописек в 4 шага по дефолту на лцм, либо в вариантах подмешивания дистиллята к моделям там шагов чуть побольше и можно другие семплеры тыкать там отдельно еще юнет на 1 шаг
>>868074 >натвис с его 55 шагами да никто не генерит на 55 шагах, это шиза >ставим натвисдмд2 и получаем даже лучше, но уже в 4 шага? теоретически можно получить 4 шага на весах натвиса под лцм, но там надо либо лору дмд пердолить, либо как-то хитро подмешивать недостающие веса от одностепового юнета дмд2, где получится по итогу 4 шага генерация, а так при подмешивании весов дмд2 4 шага на натвисе получается сносная генерация где-то на 10 шагах, кароче как турба но лучше >Что за сюр? китайцы ахуевшие просто
>>868083 >китайцы ахуевшие просто Понял. Короче скачал затестил. Вместо модели загрузил natvis-dmd2-td, вае sdxl_vae стандартный что обычным натвисом юзался. И всё, другие настройки не менял, только поставил 10 шагов, кфг 2 и обычный ойлер + карась. Для теста фуллхд разрешение выставил. Результат пикрил. Нужнао ли какие-то юнеты и лоры юзать?
>>868108 под карася лучше ойлерди брать (ну из того что тыкал) под обычный ойлер-а наверно симпл лучше, тыкай кароч, ну и цфг выше чем 2 (это тд мердж он позволяет) и чем выше размер полотна тем больше шагов надо добавлять вроде как, под фулхд 15 наверн 1 2 пикрел на ойлер-а и симпле 3 4 ойлерди + карас
>>867606 lcm normal 20 шагов кфг 1 >Three women in a ball pit, each wearing sunglasses and colorful accessories. One woman is holding a pink hat. They are posing for a photo, smiling at the camera. The background is filled with colorful balloons. The women appear to be enjoying themselves.
>>868140 там ддпм на симпле еще хорошо работает ток что чекнул кароче не все семплеры со всеми шедулерами работают, надо просто тыкать под себя подбирать годное, я все рк заставить нормально не могу работать, приходится клип на -3 ставить це пиздос
>>868147 >dmd2 Этому говну уже 3 месяца, лежало-воняло, никому нахуй не всралось, но тут ебанашки с двача мимо проходили, и на запах по привычке повелись, извалялись все в этом дермище, и давай всех обмазывать, угощать... "Имба" кричат, "геймченджер"...
>>868149 Бля не верится что это сдхл, пусть и наствис... Кстати вот ойлер+нормал и ддпм+симпле Промпт из этой >>868143 кртинки высосал если что > In the image, a young woman with white hair and pointed ears is depicted. She's wearing a blue scarf and holding a heart-shaped object in her hand. Her eyes are closed, and she appears to be enjoying the moment. The background is plain, focusing attention on her. The colors in the image are soft and pastel, creating a serene atmosphere. The woman's pose suggests a sense of tranquility and contentment. The overall composition of the image is balanced and harmonious.
>>868147 Анончики, выложите свои воркфлоу пожалуйста, а то непонимат как всё это организовать, там длинная лапша получается.
>>864606 → >Для примера как это все может работат. > >1. Ориг лоурез >2. Аура 4x >3. Даунскейл (scale 0.5 от ауры + pony как база модель + pcm 2 step + cfg 1 + семплер euler_dy + шедулер ддим юниформ (потому что он агрессивный и убирает на экстра низком денойзе шахматку которая проскакивает при апскейлах, ее на второй картинке видно)), денойз 0.05, модель для даунскейла 4xNomosWebPhoto_RealPLKSR > >По итогу со всеми пуками выходит 35 секунд от начала до конца, можно еще сильнее убыстрить если присобачить 1степ стабилизатор, взять полторашечную модель вместо сдохли, взять семплер тцд, добавть тигейт, MSW-MSA и тд и тп.
>>868174 Ты в зенки долбишся? Посмотри на кожу, там рванина ебаная, всё в клочья! У меня только на симпле это ну хоть как-то работает, но абсолютно бесполезная хуйня, годна лишь для генерации кафеля в ванной)
>>868192 >копиум ну и нахуя ты коупишь пытаясь прокукарекать что флюх топ сквозь принижение сдхл? приходи через год со своим флюхсом когда его сделают нормальным (если сделают), там будем давать пососать ему уже понями на ауре
>>868195 Спокнись, и посмотри как выглядят нормальные генерации, а не устаревший xlкал. Даже в таком разрешении при приближении ты охуеешь от деталей кожи, ни одна сд модель так не сгенерит никогда.
[Low GPU VRAM Warning] Your current GPU free memory is 1328.63 MB for this diffusion iteration. [Low GPU VRAM Warning] This number is lower than the safe value of 1536.00 MB. [Low GPU VRAM Warning] If you continue the diffusion process, you may cause NVIDIA GPU degradation, and the speed may be extremely slow (about 10x slower). [Low GPU VRAM Warning] To solve the problem, you can set the 'GPU Weights' (on the top of page) to a lower value. [Low GPU VRAM Warning] If you cannot find 'GPU Weights', you can click the 'all' option in the 'UI' area on the left-top corner of the webpage. [Low GPU VRAM Warning] If you want to take the risk of NVIDIA GPU fallback and test the 10x slower speed, you can (but are highly not recommended to) add '--disable-gpu-warning' to CMD flags to remove this warning.
Это реально опасно так делать? В первый раз вижу, что она деградировать может при превышении памяти
>>868196 >дженерик пластиковые шмары с жопами на подбородках в блюре >каждую пришлось генерить по минуте трясясь пока сдхл боги генерят по картинке в секунду ох уж эти флюксошизы
>Даже в таком разрешении при приближении ты охуеешь от деталей кожи, ни одна сд модель так не сгенерит никогда. ты буквально качество сдхл принес шиз...
>>868182 >>868196 Cохраняю в вебп фаст 80% и конверчу это в джипег. Это тупо артефакты могут быть. Ну а вообще я юзаю все модели и не ограничиваю себя рамками сдхл или флюс и т.п. У тебя какая-то фиксация на флюсе. Сколько годиков?
>>868204 The image presents a surreal scene where a young girl stands in front of an enormous, blue fish that is suspended in mid-air. The fish appears to be made of television screens, with its body composed of multiple monitors displaying various colors and patterns. The girl, dressed in a red top and black pants, gazes up at the fish with a look of curiosity or fascination. She is positioned on the ground, surrounded by a multitude of smaller televisions scattered around her. These televisions come in different shapes and sizes, adding to the chaotic yet intriguing atmosphere of the scene. The overall composition suggests a theme of technology and media, possibly hinting at a future where these elements have become integrated into our daily lives.
Поставил ллмку мистраль по совету анона итт. Годная штука. Из пары слов на русском делает пул токенов до 512 на англюсике не упуская из виду твои вводные, взяв их за ключевые для сцены. Ещё картинку описывает. Сразу в инпут суёт и генерит. Нажимаешь 1 кнопу только. Охуенная штука, спс тому анону.
Она задумалась орать от поломанных ногтей или от заблюреного блюром дофа красивого дерева старательно описанного в промпте как: while trees can be seen in the background, enhancing the tranquil ambiance of the scene. Или думает почему она местами бледная как у всех джинерикфлюсошлюх... Одному она благодарна, что родилась пиздоглазой азиаткой, т.к. у флюса они все без жоподбородка.
>>868216 >Из пары слов на русском делает пул токенов до 512 на англюсике не упуская из виду твои вводные, взяв их за ключевые для сцены. Интересно. Покажи, что она может? Начальный промпт пусть будет такой: A girl stands in front of a huge blue fish.
>>868246 Там написано про деградацию производительности. Почему дурачки вечно английские слова, похожие на русские аналоги, переводят буквально? Это напоминает недавнего челика, переводившего "огонь" как "fire" и удивляющегося почему ему рисует горящие дрова, а не огонь.
Держу в курсе, в этот раз с новой 5В. Медведи всё так же скользят, но детализация лучше стала и не так сильно пидорасит. На резких движениях всё так же распидорашивает всё.
>>868251 Там ведь не сказано gpu performance degradation. Ты конечно заставил меня сомневаться. Но мне кажется там перевод про возможную деградацию оборудования, а к тому же еще и скорость генерации будет ниже (это подтверждаю), поэтому запятая перед and. Можно вообще отключить эту хуйню, чтобы генерация обрывалась при превышении. Заебало вручную стопить когда забываю переключить low bits на fp16.
>>868299 Доебки к словам, сразу видно клоуна. У тебя на скрине даже тупой переводчик буквально написал про ухудшение работы, а не просто производительности. >>868304 Тем более.
В общем в треде быдлыч не знает английский и лезет всех поправлять.
>>868247 The girl stands before a large blue fish. She is dressed casually for her day at home. Her hair falls loosely around her shoulders, catching on some unseen object nearby. A slight breeze stirs up small waves near where she's standing, creating an almost hypnotic effect that draws one's attention towards it. In front of this magnificent creature lies a vast expanse of water, its surface shimmering under the sunlight filtering through the windows above. This aquatic world seems so serene yet full of life beneath the ocean floor. It appears like a beautiful painting or perhaps even a dream-like scenario brought forth by imagination alone. However, upon closer inspection, we can see various marine creatures swimming about freely within their natural habitat. They seem contented here amidst all these grandeur surrounding them. Despite being just mere spectators observing such beauty unfolding right before our eyes, there’s something truly mesmerizing about witnessing nature display itself in ways beyond human comprehension. Such moments remind us how much more diverse and intricate our planet really is compared to what most people perceive daily. And while we may not always appreciate every aspect of existence, instances like these serve as constant reminders of why preservation matters nowadays than ever before. So let us cherish each moment spent appreciating Mother Nature's wonders!
Генерить можно разными способами, даже можно сделать ноду на ввод картинки, потом на генерацию со своих пары слов, ещё пропустить через миксер и на вход в промпт пустить одну трубу с этой жижей.
>>868313 VLM nodes это основа, но там вроде сопутствующие понадобятся типа easyuse wassuite и главное showtext чтоб его приконнектить ко входу промпта конвертированного в приём текста. В общем делай по гайду гитхаба vlm nodes и там увидишь какие модели качать и клипы к ней. Не бери большие ллмки, для описания хватить гуфов самых квантованных, чтоб врам не засирать.
>>868297 Это сообщения разработчиков веб юи. А они дохуя специалисты как правильно писать однозначные сообщения в терминал или в каких случаях деградирует карта?
Почему разработчики, на своих адронных коллайдерах, не протестили 100500 генераций и не выдали в результате вердикт, какой семплер и шедулер лучше всего подходит? Почему я должен на своем калькуляторе страдать неделю и искать тот самый набор? А они просто: ойлер симпл зе бест чойс. Сами-то что используют?
>>868514 >>868556 https://github.com/lllyasviel/stable-diffusion-webui-forge Загружает модель форж медленнее, чем комфи и ОЗУ в момент загрузки жрет больше. Но это же только один раз. И всё, дальше то он генерирует быстрее комфи. И у меня тоже гуф в самом комфи медленнее, чем просто дев в комфи. Короче вывод и вопрос такой: гуф медленнее дев. И юзать его чтобы быстро загрузится(один раз) и потом медленно генерировать нафиг надо.
>>868514 >ггуф тормознее оригинала Так это база. Он ведь просто для понижения затрат врам используется, всему остальному в ущерб. Нужно выбирать то, что больше всего врам потребит, но не будет вылезать за пределы. Оно же еще и будет быстрее работать, зачастую, но не всегда, вроде fp32 лишь замедлит.