Научите изображать разных персов на одной картинке, у меня с 50 попытке что-то годное вышло, большая часть пикч это просто одна химера двух персонажей, или что нибудь похуже.
>>885696 Региональный промт (если генеришь на форже там популярен forge couple) или много роллить на модели что хорошо знает обоих чаров. Красивое, откуда это? >>885709 Почему ты такой злой, тебя кто-то обидел?
>>884609 → Спасибо, люблю-целую. Текущая реализация балансировки идет по иному принципу, но и с этим надо попробовать. >>885612 → Сложность - понятие относительное. Но тем больше хочется иметь все фичи модели, которая она выдает, но без ограничений по контенту. >>885791 Напомнило медведь собирает грибы в лису.жпг, лол
Я морально готовлюсь к тому чтобы потратить много денег на свой полноценный файнтьюн, у меня есть идеи как это сделать по другому по сравнению со всеми остальными попытками. Надо будет только свой трейнер вначале написать, без этого план не выгорит 100%.
>>885825 По рисобакам уже бьет карма за все грешки и за хейт ии в том числе, все идет своим чередом. >>885836 Если есть реальное желание - заноси или помогай желаемыми способами, советами, хоть тем же кодом. Если цель именно "сделай сам" то успехов, делись тогда результатами.
>>885855 > реальное желание - заноси или помогай желаемыми способами
Ну у меня немного свои идеи, которые вряд ли перекликаются с кем-то ещё, все в сообществе обычно иного хотят.
Я считаю что всё стили и персонажи на локальный модели могут сделать конечные юзеры лорами. Соотвественно можно обучать только на концепты с минимальным количеством стилей, с полным забиванием на персонажей и с регуляризационным датасетом, чтобы другие знания минимально потерять. Плюс чисто естественный текст в стиле того на что флукс из коробки откликается. Ну и с трюками которые я в лорах для концептов использую.
>>885871 Для тренировки нужен более менее нормальный доступ к (виртуальной) машине с гпу или применение формата с контейнерами/нотбуки как в коллабе. P100 уступает железу что есть у большинства из тех, кто готов что-то тренить, она больше подойдет для запуска. Для флакса нужна хотябы пара H100 чтобы не страдать и не ждать вечность. >>885916 Расчет на то чтобы модель заимела популярность у всяких лорамейкеров и засчет этого продвигалась, или просто не хочешь мимикрировать под артистов? Так уж выйдет что если формировать датасет исходя из концептов в нормальном размере, то волей не волей там наберется много артистов. Соответственно, для реализации подобного придется их явно затирать, а потом бороться с рандомным изменением базового стиля и его смещения на различном контенте. Как к этому отнесутся - ты уже написал, все верно. С чарами аналогично. > и с регуляризационным датасетом, чтобы другие знания минимально потерять > Ну и с трюками которые я в лорах для концептов использую. А что для этого имел ввиду, можно подробнее? > Плюс чисто естественный текст в стиле того на что флукс из коробки откликается. Это все хотят и правильно, если базовая модель может то верный подход сохранит эту фичу.
>>885946 > Расчет на то чтобы модель заимела популярность у всяких лорамейкеров и засчет этого продвигалась, или просто не хочешь мимикрировать под артистов?
Расчёт на то, чтобы потерять минимум знаний о реальном мире. Соответственно надо, чтобы модели можно было выучить как можно меньше нового. (Чисто в теории с этим можно работать через то, чтобы слоев модели добавить, я так с ллм как-то экспериментировал, но это всю совместимость с лорами обрубит, что не входит в мои планы)
Ну и да, на популярность и продвижение мне вообще всё равно. Я хочу приличную аниме модель на флукс и если никто это не сделает, возможно соберусь с силами сам это сварганить.
> Так уж выйдет что если формировать датасет исходя из концептов в нормальном размере, то волей не волей там наберется много артистов.
План такой: выбираю минимальный список концептов, который нужен для приличной аниме модели. Дальше фильтрую артистов у которых есть большие сабсеты этих концептов. Выбираю их минимальный набор, чтобы набрать необходимое число концептов на артиста. Тренирую с указанием артиста, просто их будет настолько мало, насколько возможно физически. Чем меньше стилей учить модели, тем будет лучше.
> и с регуляризационным датасетом, чтобы другие знания минимально потерять
В датасете будут не-аниме 2д и 3д, чтобы у модели максимально сохранились знания. Это и с лорами по хорошему надо делать и если я обучаю чисто концепт лору, то я это делаю.
> Ну и с трюками которые я в лорах для концептов использую.
Трюков куча: кропы нужных концептов в крупном плане, раскраска изображений, разные углы обзора одного и того же объекта (спасибо синтетике за это), поиск наиболее репрезентативных в датасете и увеличение числа повторов для них и т.п.
> Как к этому отнесутся - ты уже написал, все верно. С чарами аналогично.
Да, поэтому я и говорю, что у меня немного свои планы, которые вряд ли сходятся с тем, что другие люди хотят. Я считаю, что если для закрытой модели важно знание стилей и персонажей, то для открытой - это просто деньги на ветер, потому что конечный юзер сможет сам добавить что хочет. А персонажи и стили - это то, что потенциально может затереть то, что модель уже знает.
>>885974 > Расчёт на то, чтобы потерять минимум знаний о реальном мире. Это всегда хочется, а что получается можешь сам посмотреть. Реализуется несколькими путями, самый жирный из них для флакса будет неподъемным. Только не понял как оно связано с артистами? Добавление слоев - hypernetworks так работали, на самой заре когда еще не реализовали лоры. Но смотри, совсем морозы основные слои и тренируя только дополнительные - многого не добьешься, только стилизация и мелочи. А тренируя основные слои - нет смысла в дополнительных. Тут наоборот просится шринк, как уже делали с XL, с обрезанием части для уменьшения размера. > выбираю минимальный список концептов, который нужен для приличной аниме модели А какую ты хочешь аниме модель? Как наи1 что сможет красивый вангерл и все, или как пони что сможет тройной анал (нет)? Минимальный набор в таком контексте в сочетании с "настолько мало артистов" выглядит необычно. > Чем меньше стилей учить модели, тем будет лучше. Ты это с точки зрения влияния тренировки стилей на итоговое качество, или просто что не хочешь с ними заморачиваться? > Трюков куча Спасибо за объеснение. > А персонажи и стили - это то, что потенциально может затереть то, что модель уже знает. Нет, это не так работает, все наоборот.
Ну, настрой хороший и боевой, желаю успехов. Если будет желание влошиться, участвовать или вопросы - велкам. В твоем случае лучше всего поможет практика, как только начнешь делать - многое будет проясняться. Главное - начни с чего-то попроще, иначе результата и вовсе можешь не дождаться, и максимально объективно оценивай результат, не стремясь подтянуть его под хотелки.
>>886021 > Добавление слоев - hypernetworks так работали
Я скорее про то, как китайцы в лламу новые знания добавляли, там чуть другой подход насколько помню и пейпер мне понравился. Не факт, конечно, что сработает для диффузионных моделей, но для ллмок он реально работает.
> наи1 что сможет красивый вангерл
Это флукс и сейчас может. Скорее хочу позы (свф и нсфв), сложные части анатомии, анимешные выражения лиц, анимешные стилистические детали (motion lines и т.п.), сложные нсфв концепты с которыми кажется, что флукс должен идеально справится (как пример, я в лору под один из стилей добавлял картинки с vibrator in ... и vibrator cord и он с этим справился почти идеально и генерализовался лучше всех других моделей, что я видел). Но без лютого экстрима как в понях.
> Ты это с точки зрения влияния тренировки стилей на итоговое качество
Да, очень не хочется разбираться с тем, что какой-то из художников плохо рисует руки и у меня потом вся модель идёт наперекосяк. Благо флукс такое запросто ловит, у меня уже были из-за одного художника такие проблемы, пришлось руками + синтетикой в датасете их перерисовывать. Лучше курировать стили насколько возможно.
> Нет, это не так работает, все наоборот.
Ну я никогда не пытался на многих персонажах обучать, так что могу ошибаться. В любом случае с моим подходом кажется, что у меня будет слишком мало повторов отдельных персонажей, чтобы это имело смысл делать.
> Ну, настрой хороший и боевой, желаю успехов.
Спасибо!
> Если будет желание влошиться, участвовать или вопросы - велкам.
Я готов в любой движухе вокруг флукса участвовать, другие модели мне не особо интересны в данный момент.
> Главное - начни с чего-то попроще
Так и собираюсь. Вначале попробую умеренно большую лору на полностью курированном датасете в пару тысяч картинок, чтобы проверить свои идеи, плюс надо будет на чем-то генерацию подписей отладить в любом случае. Потому буду это все до полноценного файнтьюна развивать, если что-то хорошее будет получаться.
>>886029 > как китайцы в лламу новые знания добавляли Есть где почитать? Но тут сразу нужно быть готовым к тому что если добавить существенное количество то модель еще тяжелее станет, а вся совместимость улетучится. Крайне маловероятно что на твою модель, например, решат сделать особый контролнет, если только она не станет бестселлером. > Но без лютого экстрима как в понях. Он на самом деле вообще не мешает а только наоборот бустит все. Просто понифаг - кривохуй и все сжег и отравил нахрен. Если хочется рофлов - анкондишнал генерацию на разных моделях запусти, сможешь посмотреть на уродливых обмазанных фекалиями лошадей и собак в пони, бравых ♂мужчин♂ в аутизме, тру нейтралити с богоугодных моделях или сильный алайнмент на типичный арт в "красивых" > очень не хочется разбираться с тем, что какой-то из художников плохо рисует руки и у меня потом вся модель идёт наперекосяк В этом нет ничего страшного если художник протеган, за примерами далеко ходить не надо. Наоборот, там даже у "плохих" художников руки вправляются часто. Самым правильным подходом здесь было бы применение компьютерного зрения для отслеживания качества рук и соответствующего теггинга пикч. Но стабильный вариант сделать так и не получилось и нет смысла фиксить проблему которая решается сама по себе. Но, в целом, направление перспективное, и главное - делается на простом железе. > что у меня будет слишком мало повторов отдельных персонажей Правда жизни такова что мало = херь, если речь не идет о каком-то твикинге, алайнменте, ограничениях (в плохом и хорошем смысле) и т.д. Чтобы достичь регуляризации и понимания - датасет должен быть большим. А там где большой датасет - там и чары, но можно на них и не фокусироваться. А далее если начнешь делать то ебанешься с балансировкой, но это уже другая история. > Я готов в любой движухе вокруг флукса участвовать Пикрел, самый рациональный но самый скучный путь. но нормально трениться он будет не раньше чем через несколько недель ибо упор в код > чтобы проверить свои идеи Там есть ряд нюансов связанных с отличиями между лорой с ограниченным количеством "информации" и файнтюном, нацеленным на добавление. Оно банально ведет себя по-разному и требует разных датасетов, потому лучше тренироваться "на кошках". Но, чисто теоретически, peft никто не отменял, может что и получится. Только масштаб расходов финансов и времени на все это осознавай.
> В этом нет ничего страшного если художник протеган, за примерами далеко ходить не надо. Наоборот, там даже у "плохих" художников руки вправляются часто. > А далее если начнешь делать то ебанешься с балансировкой, но это уже другая история.
Это как раз кажется, что зависит от числа стилей в датасете и баланса датасета в целом, и видится, что это прям сложная часть и надо бы попытаться её максимально себе упростить.
> Правда жизни такова что мало = херь, если речь не идет о каком-то твикинге, алайнменте, ограничениях (в плохом и хорошем смысле) и т.д.
Моя гипотеза, которую я хочу проверить на большой лоре, что флукс в силу размеров и условно большого текст энкодера может справится и генерализировать даже по небольшому кол-ву изображений если они достаточно хорошо подписаны (вот это кажется критичная часть я это проверял экспериментом). Всё же он куда проще тренируется по сравнению со всем до этого.
> Чтобы достичь регуляризации и понимания - датасет должен быть большим. А там где большой датасет - там и чары, но можно на них и не фокусироваться.
Ну мне кажется, что 100к 1girl, standing, white background разных тоходевок - это полностью лишнее в датасете. Они несут мало информации.
> Пикрел, самый рациональный но самый скучный путь. но нормально трениться он будет не раньше чем через несколько недель ибо упор в код
Звучит заманчиво, конечно, хотя кажется, что наши вкусы по наполнению датасета вряд ли совпадают. Как пример, хвостатых ушастых, кроме Эруру, я вообще никогда не генерил.
>>886053 > генерализировать даже по небольшому кол-ву изображений Смотря что понимать под небольшим количеством, такое в целом не то чтобы возможно by definition, только если модель уже знает что-то подобное. На мелком датасете оно может "красиво поломаться" и натягивать увиденное на запрашиваемый результат, но это будет не тот уровень. Но эффект более качественной тренировки и ухватывания более редких концептов на фоне датасета побольше за счет размер модели - действительно есть. Чего не хватает так это реализации нормальной тренировки для флакса. > 100к 1girl, standing, white background разных тоходевок - это полностью лишнее в датасете С тохами и некоторыми сериями отдельная боль из-за чрезмерной популярности и отвратительного качества большинсва пикч. Поэтому необходимо вывернуться так чтобы одновременно избежать плохих и получить максимальную информативность. > хвостатых ушастых, кроме Эруру, я вообще никогда не генерил Самое время начать, разве есть что-то прекраснее? Но в целом там прежде всего популярные серии, а помимо пары десятков хвостоконцептов еще тысяча общего назначения. Количество ушастых примерно соответствует их общей доле в буру пикчах. С другой стороны чтобы повторить тренировку флакса хотябы на том же объеме что и текущие версии моделей - потребуется слишком много ресурсов и начинать рациональнее с меньшего. Потому хз в какую сторону будет смещен баланс в первых.
Анонии, я так понимаю тут так и будет продолжаться 1girl standing? Ладно первые два года технологию обкашивали, можно было поиграться, но сейчас то что? Вы бы что-то интересное намутили, не знаю, комикс какой, мангу там 18+ какую-нибудь
>>886241 А мне нравятся вангëрлы. Причём раздетве как-то не очень, скорее тëплые и ламповые. Эльфиечки, веснушколисы, желающие доброго утра акварельки. Их бы ещё на травку в парке посадить, или на роликах кататься научить, или просто в платьишко и пейзажем любоваться. Круче всего, конечно, на пляж и подсмотреть, как она снимает платье, а под ним купальник...
Никогда не понимал тех кто хочет зарабатывать на ИИ арте и своих говно моделях... кому надо, те вон инвестиции получат на стартапы... Иди вон бутылки собирай мамкина петарда
>>886797 > Только автор лоры хвост проебал Всмысле, оно не делает правильный tail ornament? Пиздец, максимальнейшее осуждение, так проще промтом сделать. За ссылку спасибо.
>>886925 Есть какие новости про тренировку флюкса? Появились какие нибудь нормальные нлп теггеры для лешдов/нсфв? С энкодерами пробовал тренить? А с 128 димом два слоя? Видел просто какие странные обсуждения про это на гите
>>886959 >>886966 Разбавлю этот синдром аутистического восхваления. Оно может делать более сложные композиции по промту и имеет некоторый объем общих знаний, но в контексте генерации анимца это больше для особых нитакусиков ценителей глубокого смысла. Из важного - не знает буквально ничего, откат во времена 1.5 с более всратым стилем и х50 рейтами на замедление тренировки лор. На каждый стиль, на каждого чара, на каждый концепт тебе придется по много часов тренить лоры, которые могут получиться всратами и хрен будут нормально работать друг с другом, убивая то, чем впечатляла оригинальная модель. И все ради генерации 1girl standing looking at viewer с поломанной анатомией даже без оголения тела. Пробуй сам, впечатляйся, восхваляй или наоборот разочаровывайся и хейти. В текущем виде оно имеет как яркие плюсы, так и не менее ужасающие минусы.
>>886982 >это больше для особых нитакусиков ценителей глубокого смысла
Я бы скорее сказал, что это для тех, кому хватает концептов sfw реального мира и кому хочется фоны без поломанных горизонтов, без некогерентных зданий и без невклидовых интерьеров.
>>886993 Сначала сами загоняете себя в заложники понимусора, игнорируя все остальное, а потом делаете такие заявления. Несколько анонов на протяжении долгого времени постили пикчи где были и задники и все - все, но мало кому интересно было.
>>887098 Так а чё вы иронизируете, если делать какие-то неебически странные неженерик позы постоянно будут возникать проблемы с пальцами/ногами/лицом, тут ниче не поделаешь
>>887101 Так я и не иронизирую, это факт, нейронка неможет больше чем в 1гирл, иначе анатомия идет по известному месту и не только анатомия, четко прописать 2х персонажей это целый подвиг...
Помучился с Тофу, но вроде научился его использовать, с ускоряками даже. Но захотелось глянуть, как он работает на минимальных промптах. ...Ой. С пустым промптом вообще серый шум... А полторахи обычно что-то креативили.
>>887095 Найс, но гост там лишний >>887100 >>887105 Длинный шмель. Довольно популярная поломка в разных моделей, интересно почему она возникает. >>887106 > это факт, нейронка неможет больше чем в 1гирл Да все может, просто не нужно затирать чаров в модели и поддерживать тех кто так делает. >>887262 Конечно, именно поэтому вокруг одно нытье про отсутствие мощностей. > а купить это ты сможешь только прожив 6 своих жизней Не суди всех по себе жалуясь на жизнь.
>>887338 > С пустым промптом вообще серый шум Именно, полное отсутствие алайнмента вместо сильной деформации юнета в угоду одному и ущерб остальному. То с чего бугуртили в 1.5, оно было доведено до абсурда, когда анкондишнал генерация давала все тех же вангрел-стендинг. Ишикея совсем распидарасило на пикче.
>>887438 Верно, и? Все в равных условиях чтобы получить то же самое, но почему-то никто не делает. Наоборот собрав сумму, достаточную на пол года аренды такой игрушки тренят мусор на 4090, или ищут "богатых любителей фурри", которые инвестируют в них, чтобы потом максимально монетизировать результат. Или здесь тейк про удивление финансовой обеспеченностью? Камон, найдется чем удивить если местных тредовичков потрясти, и всегда найдется рыба больше.
>>887469 >Или здесь тейк про удивление финансовой обеспеченностью? Именно! Вся ветка началась с замерами длинны письки, а ты решил смухлевать, выдав арендованную письку за свою! Ты плахой!
>>887597 Флюкс анатомию любит всерать и работает медленно... А на wai и я сидел, хоть и не на этом там кстати 8 только что вышел Похоже не так уж много поменялось.
>>887517 Там вроде про удивление и нечто необычное-мощное. Мухлевать смысла всеравно не имеет. > Ты плахой! Овари да, пойду грустить. >>887538 Задник интересный >>887559 Можешь чтобы она лежала на боку свернувшись и также обнимала хвост?
Аноны, хотел поделиться своей проблемой, интересно как у вас с этим тоже. Хочется найти свой уникальный стиль, свою картинку. Но получается один кал, много времени трачу на это всё, лоры, модели, промптинг меняю, получается только хуже и меня это не удовлетворяет всё. Как вы с таким справляетесь, есть ли у вас такое вообще?
>>887708 Делаю мерджи под свой стиль, соединяю десятки разных XL моделей (block merge, DARE и прочие разные техники). Еще наваливаю лоры, но множество лор говнят глаза у персонажей.
>>887708 У меня так же было, главное в первое время найти свою модель , именно не по стилю а вообще как она под твой промтинг и идеи реагирует, у вас должна быть страсть типа с ней, потом уже эту модель под себя подгоняешь лорами на стили, на самом деле на стиль еще много чего влияет типа негатива, эмбэдингов и сэплинга. В идеале просто брать и тренить слови лоры на тех картинах которые тебе эстетически нравятся, но даже если нет такой возможности просто ищешь на цивите что нравится и комбишь, тебе надо брать детали которые тебе по душе, например хочу лайн как у это лоры, а у этой личика милые и тдд, и так пытаешься что то химичить, конечно от модели зависит как она лорам поддается, если там сильно выраженный стиль у модели то надо будет еще дольше ебатся, но оно того стоит. Если совсем плохо скопируй хотя бы стиль одного художника который по душе, в люблм случае с одной но хорошей лорой будет лучше работать а потом уже в процессе будешь по опыту как то этот стиль видоизменять когда полностью начнешь понимать как он ведет себя.
Бля, какие же базированные свежие пони-модели у дыкхайтэна... Азиатская эстетика во всём настолько обильная, что ее можно снимать с дисплея палочками для еды...
>>887761 Ах да, и причем чел сам трейнит, никакой хуйни типа мерджа чужих чекпойнтов или встроенных лор... Ему донатят, а он честно тратит на создание контент - апгрейдит свое железо и публикует годноту.
>>887708 Плавно варьируй стили пока не найдешь понравившиеся сочетания, довольно дефолтно. Но вообще хз есть ли смысл в этом самом "своем стиле" в плате визуала, интереснее просто делать крутые пикчи и все необходимое для этого. >>887761 >>887765 Слишком жирно, это мусор. >>887794 Начни с пайзури.
>>887671 >Задник интересный Обычный, сломанный с двойным горизонтом. >>887708 >есть ли у вас такое вообще? Нет. "Хочется найти свой уникальный стиль" для меня звучит как что-то на рисобачьем, а я просто прикольные картинки генерю для своего удовольствия — причём, мне нравится разннобразие. Один стиль - это ПИЗДЕЦ как скучная тема как по мне. >>887794 Как бы оно само не трахнуло. А потом съело.
>>887898 Бомбит у бесталанных ЧСВ обиженок, норм художники лутают бабки и им похуй, их сфера интереса не пересекается с нейронками. Это как профессор математики бы агрился на калькулятор.
>>887708 Все "мои" стили остались на 1.5, вместе с кривыми пальцами, ничего не получилось повторить. Только искать заного новые стили, случайным перебором. Несколько новых нашел уже на XL, но старые жалко, уже не вернуть. Потом опять все заного, искать стили на флюхе, когда на него лор и моделей наделают.
>>887932 >пропали, не вернуть Но почему? Просто берешь и тренишь тех же художников, что исользовал на 1.5. Я так на пони вообще безболезненно переполз. На флюксе получились все же некоторые изменения, т.к. они стиль по-другому ухватывает, но не как-то хуже, а просто по-другому.
>>887850 Эта херь еще за деньги распространяется? Прямое нарушение лицензии понифага, надо написать ему чтобы вой поднял. А так буквально мусор хуже любого шизомикса, годен только для троллинга. Во рофел если этот шиз серьезно ее восхваляет а не ради вброса >>887889 Где новые упоротые эльфийки? >>887932 > но старые жалко, уже не вернуть Они были получены просто удачно работающим сочетанием остальных стилей, или там неидеальная работа стилелор ложилась на вайбы 1.5? В целом, даже второе можно спасти если на них же натренить, а с первым все просто.
>>887708 У меня есть любимые синтетические стили для которых я постоянно генерирую и улучшаю датасеты, чтобы их переносить между моделями. Это на удивление неплохо работает.
И как только выходит новая модель и способ её дообучить, я сразу же иду этим заниматься.
Ребят, а на 8 гигах ток с 1.5 жить? Пол года назад спрашивал, мало ли придумали что-то для оптимизации xl и т.п. всяких.
Да и в общем, как делать красивее и не сильно замедлять процесс? А то у меня одно гавно выходит кривозадое на Энилора+Пастель vae. По началу норм было, а сейчас начало бесить.
Воруфлоу: Просто бахаю 480х720 и потом через i2i увеличиваю картинку (по большей части использую лишь для исправления глаз дурацких), используя ултимейт сд апскейлер (тот который быстро работает и врама не выдает). Мне кажется, если модель поменять или способ апскейла то будет уже лучше, может посоветуете что-то? (8 гигов, автоматик который не обновлялся полгода (обновил бы не задумываясь, но боюсь сломать все снова)).
Просто интересно узнать, как на 8 гигах можно иначе и при этом не генерировать по одной картинке раз в десять минут.
>>888278 Пони у меня занимает 10,4 ГБ в пике на картинке 1024x1024. Попробуй с medvram-sdxl. Вообще пишут comfy и forge меньше памяти потребляют, и вроде как запускается на восьми.
>>888278 Сижу на Фордже, у меня как раз 8гб памяти на 3070. Оптимизации очень продвинулись.
Пони генерит как раньше 1.5, очень быстро. Разрешение ставлю большое, стандартная генерация до хайреза обычно 1024х1366 в среднем. По времени около 2 минут с хайрезом х2 и адетейлером.
На флюксе подольше, минуты две без хайреза в таком разрешении, но всё равно для меня более чем окей такое время. Потом в имг2имг и сд апскейле тоже понимаю в среднем до нечто около 3000х4000 и прекрасно себя чувствую. Так что кури оптимизацию и ставь фордж, да будет тебе счастье, анонче. А вопросы по факту в треде уже спрашивай, отвечу по возможности.
>>888278 Вот, чтобы не быть пустословом. Учти что в процессе я смотрю ютуб, открыто дохуилион вкладок в хроме и у меня подключено два монитора и проектор на этот комп. Причём один из мониторов 4к разрешением, и всё это в процессе генераций спокойнот тянет одна эта карта без затыков.
>>887981 >Где новые упоротые эльфийки? Остались на полторашке, пока так и не смог повторить на понях-XL-ке свой любимый упоротый стиль. Вот максимум что выходит.
>>887932 >Все "мои" стили остались на 1.5 Два чаю. С поней, вроде бы и есть что скинуть, но если не присматриваться - тот же дженерик с мелкими различиями.
>>887900 Знал что кто-то да триггернётся на это слово, не не знаю как иначе это обозначить. Нейронки сейчас очень быстро развиваются и то что было нормой год назад сейчас уже нерелейтед, вот и приходится быть в постоянном поиске.
>Подписота тоже в принципе ождает Моя подписота ХЗ чего ожидает, только пишет в комментах "WOW!!!", "Ohh..", "She hot!", "Sexy!"
>>887898 Ля, это ты еще времена первой девиантовской не видел, там вообще под акком под сотню сообщений оставляли и слали рисовать кубы) Гоблинчан-если кто помнит, не генерю и не воюю-просто на вас преттибоев смотрю иногда и умиляюсь
>>888278 --medvram --xformers, потом в Settings, Optimizations, FP8 weight, Enable for SDXL, я это в прошлом или позапрошлом треде писал. >не обновлял полгода Сам себе злобный буратино >не генерировать по одной картинке Всегда генерю по одной, нахуй мне батчи? >бахаю 480х720 и потом через i2i увеличиваю картинку Narkoman, suka. Нормальные сдохле-разрешения ставь, вон из фукуса примеры, потом хайрезфикс в полтора раза.
Ну или на лапшу перекатись, она без доп.настроек работает и сама "лоуврам" включит, если надо.
>>888447 > Какой флакс сейчас в мете? На циве есть что-то годное или лучше оригинальный ставить?
Под аниме есть неплохие лоры под разные стили, часть немного пережаренные правда, часть нормальные. Ну и если нужен какой-то стиль которого нет, то они легко учатся более-менее даже под базовый флукс.
>>888493 Очень плохо. Я бы сказал никак, кроме условной мику. Он очень хорошо понимает текст, так что всегда можно попробовать указать все детали, но в целом особо никого не знает.
>>888450 Нормального ответа у меня для тебя нет, кроме from below, pov, (skirt, upskirt, underwear), ass, ass_focus, cameltoe, (white lace panties), pantyshot Возможно этого даже хватит.
Тут одно время какой-то анон форсил пикчи на которых был персонаж с панцушотом в отдельном окне. Для этой цели он использовал Forge Couple. Повторить это 1 в 1 не удалось, но вызов был интересный. Эти 2 пикчи - неудачные попытки.
>>888480 Да, ещё как. Я в этом настолько преисполнился, что выстроил в комфи замкнутый цикл с лоурез генерацией во Флюксе, модификацией промпта и апскейлом на понях/1,5-ке. Так работает быстрее на моём калькуляторе. Кроме того лор на флюкс мало, а так можно поверх уже сгенеренного при апскейле накидать. С понями так-же пробовал генерить на них, и апсекейлить 1.5-кой и наоборот. Но это по большей части шиза малоюзабельная, т.к. в процессе возникает много косяков, которые надо дополнительно править и так до бесконечности. Гораздо практичней настраивать стиль на одной модели.
>>887981 За баззы. И даже если за деньги, то чому бы и не заплатить один раз за ранний доступ к годной модели? Сам ты такую сделать не сможешь. Дык = Знак качества. Понидебил идет накуй .i.
>>888556 >>888558 >>888565 Спокуха, надо было просто перещелкнуть еще раз вкладку на флюкс, но спасибо. >>888565 Нет, я не буду ничего читать, я буду задавать тупые вопросы в треде!!!
Челлендж флюксо-юзерам. Хочу посмотреть, как модель понимает комплексные промпты. А то пока вижу только вангёрлов, которые либо ситтинг, либо стэндинг хоть фоны хорошие.
1) Подземелье/пещера/мир мертвых. Четыре или шесть скелетов несут на плечах закрытый гроб (как в том меме с неграми). На них издалека смотрят монах в капюшоне (лица не видно) и Хатсуне Мику в костюме классической японской мико.
2) Даркнесс и Мэгумин из Коносубы. Подземелье с факелами. Даркнесс на коленях, подставляет спину (и явно кайфует), Мэгумин хлещет ее кнутом. Либо момент замаха, либо момент непосредственного удара.
3) Очень накачанные и мускулистые Рей и Аска из Евы. Спортзал. Куча всякой экипировки, беговые дорожки, все такое. Рей делает жим лежа очень тяжелой штангой, Аска ее страхует. Можно добавить задохлика-Синдзи куда-нибудь на фон.
4) Трио сейлор-воинов (пусть будут Луна, Марс и Меркурий, например) на улице, пинают ногами побежденного и лежащего не асфальте "злодея". Злодей в костюме какой-нибудь смешной хрени, по типу лайв-экшнов из нулевых-девяностых (ранние Power Rangers, как пример).
>>888522 Приличный апскейл (от 6 мегапикселей и выше) на xl не так давно освоил, и все равно он часто уступает 1.5, хотя и имеет свои преимущества. Банально не получается той же интересной детализации и интересных рекурсий, но зато мыла меньше. Хз как поведение модели воспроизвести, так что хоронить старушку еще рано, пожалуй. >>888543 > И даже если за деньги Лицензия пони напрямую запрещает продажу производных за деньги и всяческую их монетизацию. Эту херь все равно никто всерьез не воспримет. >>888580 С дивана комментарий > Четыре или шесть скелетов несут на плечах закрытый гроб (как в том меме с неграми). Изи > На них издалека смотрят монах в капюшоне (лица не видно) и Хатсуне Мику в костюме классической японской мико. Потребует роллов или манипуляций ибо будет перемешиваться с основным промтом. > Даркнесс и Мэгумин из Коносубы Флакс не может в аниме чаров и подобные активности. Но в теории если натренить на такое то да, подобное будет стабильно. > Очень накачанные и мускулистые Рей и Аска из Евы. Спортзал. Куча всякой экипировки, беговые дорожки, все такое. Рей делает жим лежа очень тяжелой штангой, Аска ее страхует. Такое и XL сделает, только чуть больше будет чаров путать. Во флаксе будут лучше стойки/позы (если говорить про сток без доп тренировок на концепты и т.п.) и окружение, но чаров, опять же, он в базе не умеет. > 4) Сложновато
>>888603 >Потребует роллов или манипуляций Ага. С роллами и манипуляциями и на поне, и даже на полторахе можно было такого добиться. То бишь флюкс не сможет. Ясно.
>Флакс не может в аниме чаров и подобные активности. Так он же "понимает промпт". Чего он тогда понимает? Ладно там не Мегумин и Даркнесс, пусть по промпту, что-то похожее. Но замах кнутом? Тоже отдельно тренировать? Тюююю.
>Такое и XL сделает Это тест на знание мышечной анатомии и на постоянство фона. Ни одна ХЛ-модель не может сделать нормальную, детализированную "качалку". Всегда получается лютое месиво.
>Сложновато О чем и речь. Челлендж же!
На полторах-ХЛ-поне такое можно делать, но только убойным редактированием и мерджем нескольких картинок в одну. Вот мне интересно, насколько сильно флюкс лучше в этом плане стал. И, похоже, не особо.
>>888603 >Потребует роллов или манипуляций ибо будет перемешиваться с основным промтом.
>>888623 >Ага. С роллами и манипуляциями и на поне, и даже на полторахе можно было такого добиться. То бишь флюкс не сможет. Ясно.
Не-а, не нужны тут роллы, такое достигается тем, что ты описываешь в промпте композицию изображения. В духе в левый части такие-то, в правой части - сякие-то.
> Но замах кнутом? Тоже отдельно тренировать? Тюююю.
Это он может. Он не знает конкретных персонажей, потому что VLM подписи при обучении были использованы, а VLM никого не знают.
> Чего он тогда понимает?
Он понимает как композировать объекты и концепты разумным образом. Т.е. я могу написать, что "Девушка с косой стоит в черном плаще с черепом нарисованным на спине на берегу реки. Между её ногами лежит корона. По реке плывет корабль. За рекой солнце заходит между двумя башнями." И оно мне это сделает с первого ролла разместив всё как было запрошено.
> Вот мне интересно, насколько сильно флюкс лучше в этом плане стал. И, похоже, не особо.
Он при этом ещё ощутимо лучше в когеретности картинки. Никаких сломанных горизонтов, углов, моделька теперь может стулья в кафе нарисовать так, что они не будут смотреться как порождения не евклидовой геометрии из Р'льеха. Дома на фоне имеют разумное застекление, концепты друг с другом не перемешиваются и если ты написал heart-shaped pendant, то это значит, что эти сердца никуда больше на картинку не проникнут.
>>888644 >Не-а, не нужны тут роллы Картинки вот только нет, с демонстрацией.
>Это он может. И тут картинки нет... Пусть даже не с этими персами, а похожими. Пусть даже отдаленно.
>Он понимает Не вижу. Только вангёрлов вижу, а чего-то сложного с этими вангёрлами - нет. Весь выхлоп в фон уходит?
>Он при этом ещё ощутимо лучше в когеретности картинки. Вот как раз на это был тест с Рей и Аской. Спортзал - очень комплексный и сложный объект с огромным количеством вариантов. Стулья - тьфу, ерунда.
>>888691. > Картинки вот только нет, с демонстрацией.
Ну вот, остальное чуть позже. Правда по хорошему надо промпт переписать чуть более флуксо-дружелюбно, но мне лень, я просто описание выше в 4о вкинул. Это первый ролл + хайрез + даунскейл обратно.
>>888691 Рисобака, плиз, тут тред вангёрлов (здесь даже мужиков не постят в принципе), а не челленджей. Челленджи - это рисобачья забава и промо-акт, мы, нейротворцы, в этом не нуждаемся.
>>888623 > То бишь флюкс не сможет. Чел, жизнь не делится на черное и белое. На 1.5 это буквально фотобаш, массовый инпеинт и прочее, такое получить сходу невозможно. На XL будет проще и оно даже сможет по отдельности, но очень со скрипом. На флаксе если пороллить то одна из N будет соответствовать критериям и правки потребуются минимальные. А так даже самая суперпродвинутая идельная нейронка не будет давать всегда стабильные и исправные пикчи, она будет делать это с большей вероятностью и позволять особенно сложное описание, по структуре, количеству объектов, их сложности и т.д. > Так он же "понимает промпт" Да, но аниме фэндом не знает. Может сделать с персонажами просто соответствующими описанию. Замах наверно знает, нужно пробовать, но если судить по общей соевости - может отказаться делать избиение. > Ни одна ХЛ-модель не может сделать нормальную, детализированную "качалку" Это даже 1.5 могла, пусть не идеально. Просто не нужно судить по лошадям поведение всей модели. У флакса, если он не поломан кривыми руками, с когерентностью окружения все хорошо. > насколько сильно флюкс лучше в этом плане стал Именно в этом он и лучше, все ограничивает отсутствие нужных знаний. >>888644 > не нужны тут роллы То есть если оно не делает идеальных 100 пикч из 100 попыток - проблема в промте? Надеюсь, так понятнее и понимаешь что сам ерунду выдал.
>>888774 Нот бэд! Хотя сандалии японские на "монаха" все-таки протекли. Ну и у скелетов позы не слишком корректные. Зато числом шесть.
Когда Рей с Аской делать будешь - постарайся максимальные размер и рельефность мышц сделать. Мне реально интересно, насколько хорошо флюкс такую анатомию знает и понимает. НАИ только в кубики пресса могла, и немного в руки/грудь/плечи. Ноги, спина и вообще вид сзади были просто ужасны. ХЛ/Поней лучше натренировали в этом деле, но в виды со спины они все равно не могут, хотя и стараются.
>>888816 >Это даже 1.5 могла, пусть не идеально. Ни одна не могла. Даже близко. Нарисовать правильные тренажеры разных типов и ничего не перепутать - это было тупо невозможно. Только всякие гибриды штанг с беговыми дорожками.
>>887943 Я нашел лоры тех же художников, что раньше использовал, но результат другой совсем, в том числе из-за 1.5 модели.
>>887981 Там просто какое-то случайное сочетагие всего вместе, которое мне нравилось.
> если на них же натренить Я так и хотел сделать, но посмотрел гайд, и понял что сил разбираться в этом нет, в основном из-за времени тренинга, я как-то тренил голосовую модель 12 часов, все 12 часов комп был недоступен. С тех пор неохото что-то тренить. Вот если бы оглайн можно было.
>>887989 Да как-то не мое, я сначала просто хотел там пикчи хранить, чтобы не потерялись, но даже постить чет лень, плюс там можно только что-то приличное выкладывать, мб как нибудь на пиксив вкачусь.
>>888350 > тот же дженерик Мне в целом прогресс нравится, гораздо больше всего нейронка понимает, больше возможностей. В какой-то момент выйдет достаточно большая открытая модель, на которой можно будет основательно засесть.
Плюс еще совсем старые генерации, которые раньше нравились, после пони уже кажутся калом. Жалко только что-то из последнего и какие-то всратые странные стили, которые получались.
>>888580 > 2) Даркнесс и Мэгумин из Коносубы. Подземелье с факелами. Даркнесс на коленях, подставляет спину (и явно кайфует), Мэгумин хлещет ее кнутом. Либо момент замаха, либо момент непосредственного удара.
Композиция опять с первого раза получилась, но вот c персонажами сложно, если Мегумин я понимаю как описать, чтобы было хотя бы похоже, то вот с Дакрнесс сложно. Не очень подбираются слова.
>>888904 >Я так и хотел сделать, но посмотрел гайд, и понял что сил разбираться в этом нет, в основном из-за времени тренинга, я как-то тренил голосовую модель 12 часов, все 12 часов комп был недоступен. Ставишь тренить @ идёшь спать @ становишься гигачедом от здорового 12 часового сна
>>888939 Странная композиция, если честно. Я это больше видом со стороны представлял, или в 3\4.
>но вот c персонажами сложно Да тут точное совпадение и не нужно, мне важно было увидеть, смогла ли сетка во взаимодействие, или нет. Тут как-то не очень получилось, на фотобаш какой-то похоже.
Але, вы чего тут перед шизом, который что-то еще и требует, а потом носом крутит стелитесь? Послали его и генерим себе дальше то, что хочется, а не то, что заказали.
>>889000 Ну мне было интересно можно ли будет промптом воссоздать персонажей, почему бы и не попробовать, хоть опыт мне не очень понравился. Промпты на две страницы текста - это такое себе, удивительно, что оно вообще работает. Но сочинять эти простыни лениво.
Можно было бы без персонажей, но это не так интересно уже.
>>889017 Не, ну Мегумин плюс-минус похожа получилась. Если нейронка о ней вообще нифига не знает, даже на уровне самого слабого концепта, то прям вообще топ.
>>888819 Просто ты хочешь детерминированности от рандомайзера по мотивам. Модели не понимают устройства и принципы подобного, только запоминают общие паттерны и закономерности, потому и сложности со всякими механизмами. Даже флакс, не смотря на крутость, будет там в мелочах или по крупному ошибаться, просто будет меньше бросаться. >>888904 > я как-то тренил голосовую модель 12 часов, все 12 часов комп был недоступен Попробуй подгадывать так, чтобы ставить тренировку на ночь или когда куда-то уходишь. Если что, там можно указать опцию сохранения состояний а потом с них продолжать. > Вот если бы оглайн можно было. На циве завезли тренировку для флакса, хз насколько норм. >>888939 > Композиция опять с первого раза получилась Нууу, честно говоря какая-то хуета, вообще не в тему, с несоразмерными чарами и поломанной перспективой. Это кстати прямо фишка флакса с анимцом, постоянно выдает несуразные сочетания при нескольких объектах. >>889000 Эх, как же хочется погенерить.
>>889078 > Нууу, честно говоря какая-то хуета, вообще не в тему, с несоразмерными чарами и поломанной перспективой. Это кстати прямо фишка флакса с анимцом, постоянно выдает несуразные сочетания при нескольких объектах.
Скорее всего результат длинного шизопромпта. Я если честно, вообще удивлен, что оно хоть как-то сработало вообще.
She wears a large, floppy wizard dark brown hat with gold accents, including two red circles with golden crosses inside and a yellow feather at the tip, and a red and golden zigzag under the circles. Her shoulder-length dark brown hair is styled simply with uneven bangs. She has red, confident eyes and a mischievous expression.
Her outfit consists of a red, long-sleeved tunic with a wide collar, decorated with gold trim and a black choker around her neck. Over her shoulders, she wears a dark brown cloak with a matching gold trim and an inner yellow lining. She also wears an angled thick black belt with a large rectangular silver buckle around her waist.
Her right leg is is in bandages and other in black thigh-high. She wears orange boots, which reach just below her knees. She wears matching dark brown gloves.
>>889078 >Просто ты хочешь детерминированности от рандомайзера по мотивам. Тем не менее, при должной тренировке детерминированность вполне получается. Если уж стулья и здания нормально рисуются - то и тут нужного постоянства добиться можно. Научилась модель хотя бы основные типы тренажеров отличать друг от друга, классифицировала ли она их как отдельные объекты, или нет - вот в чем там вопрос был. Ну и анатомия, тоже очень важно, да.
>>889085 > Скорее всего результат длинного шизопромпта. Там есть лимит на число обрабатываемых токенов если что. Странно что не сделал их "рядом" чтобы Даркнесс действительно была спиной а Мегумин боком/спиной с зрителю, тогда бы и косяков с перспективой и ориентацией было бы меньше. > Ну типа на мегумин Это нужно сохранить и показывать примером почему буру теги - необходимость. >>889087 > при должной тренировке детерминированность вполне получается Просто снижается степень рандомайзера из-за знания большего количества принципов. > Научилась модель хотя бы основные типы тренажеров отличать друг от друга Ну, чисто технически, можно добиться приличного уровня в этой и других задачах дополнительной тренировкой, для того она и нужна. Но у тебя 95% людей с улицы в лучшем случае отличат велотренажер от скамьи, а про какого-нибудь смита вообще не слышали. Глупо требовать это от модели общего назначения, оценивать по подобному качество и сравнивать это с анатомией, которая дохуя массова.
> Это нужно сохранить и показывать примером почему буру теги - необходимость.
Словно я сам большую часть этого набирал, я пошел к 4о, дал картинку Мегумин, сказал опиши подробно. Потом выправил то, что 4о неправильно сделала и всё.
>>889100 Сорян, не хотел никак осуждать или обижать, просто это хорошо иллюстрирует разность подходов. Тег чара, который будет модификатором ко всему остальному, и перечисление основных черт - самое удобное, а натуртекст уже для позиций, ориентации и уточнения взаимодействий.
>>889105 Да я скорее про то, что обучение модель на теги может потенциально навредить понимаю натурального текста. Если нужны теги, то проще заставить отдельную ллмку переводить из тегов в натур текст.
>>889094 Стулья или кресла ж оно разбирает? Барные, табуретки, викторианские, со спинками и без? Значит и тут может справиться. А то проблема полторашек и XL-моделей - они рисуют что-то среднее между скамьей, велотренажером и беговой дорожкой, щедро разбавляя это гантелями и штангами. Нет разделения даже по простым типам, про что-то сложное я и не говорю.
Удержание и жим штанги, кстати, тоже та еще задачка. Но тут я во флюксе более-менее уверен.
>>889109 Технически, вероятно, можно было бы использовать разные TE с разным форматом промпта под это - отдавать T5 промпт под сюжет™, а в тот же clip-l вжарить описания внешности в стиле буру-тегов. Да даже в том же SDXL используют два разных текстовых энкодера - насколько я понимаю, технически ничего не мешает разные промпты для них использовать.
>>889109 Если сделать все аккуратно то проблем не должно быть. Даже если будет в ущерб то ничего страшного, итоговый профит все перевесит. Оно работает не настолько суперахуенно, а отсутствие знаний многое множит на ноль. > Если нужны теги, то проще заставить отдельную ллмку переводить из тегов в натур текст. Заменять шизослоупом простые и эффективные вещи - плохая идея. Отклик должен быть именно на сочетание тегов. Кажется, теперь понял откуда столь высокая мотивация отказаться от стиля и персонажей. >>889125 Может конечно. Стулья нужны часто, а тренажеры - очень редко, потому у них несопоставимо разное присутствие в датасете. Та же ситуация что незнание флакса анимушных персонажей, проблема не в модели. >>889135 Задумка абсолютно верная. > Да даже в том же SDXL используют два разных текстовых энкодера Можно напрямую взять готовый оттуда. Например, с тофу подкинуть clip-l и сразу бустится понимание всего анимца, поз, анатомии, тегов и т.д. прямо в стоке. Но без тренировки т5 все равно не получается хорошего добиться, из-за того что он не подстраивается, вместо их синергии модель начинает больше внимания отдавать мелкому клипу и игнорировать/неверно интерпретировать т5, со всеми вытекающими.
>>889172 >Заменять шизослоупом простые и эффективные вещи - плохая идея.
Ну флукс был явно обучен на выхлопе какой-то VLM, так что это штатный паттерн использования. И он очень хорошо воспринимает так сделанные промпты. Я не вижу, что в этом плохого.
>>889215 > флукс был явно обучен на выхлопе какой-то VLM В этом есть и минус, оно словило жесткий байас на обилие мусора и нормальное содержательное описание без него может давать результат хуже. То есть это не > очень хорошо воспринимает так сделанные промпты а наоборот плохо воспринимает нормальные промты. Речь не про буру теги, но это и на них тоже негативно влияет. > не вижу, что в этом плохого Казалось бы, множить шизофазию и расписывать полотна на 80% состоящие из бессмысленных связующих фраз - неприятно.
>>889215 > Ну флукс был явно обучен на выхлопе какой-то VLM А они где-то написали об этом? А то я тоже подметил, что если отталкиваться от влм-промта, то сильно приятнее пикча выходит, чем если грубо сразу в лоб свой промт написать. Тогда становится понятна причина.
>>889233 > жесткий байас Ну, никого же не смущало раньше писать materpiece, best quality, а потом score_9, score_8
>>889252 > Ну, никого же не смущало раньше писать materpiece, best quality, а потом score_9, score_8 Одно дело вводить всегда один и тот же набор тегов качества и другое дело отдельную LLM поднимать, чтобы тебе промпт как надо оформили.
Кто-то может обьяснить, почему на некоторых XL моделях лоры могут просто игнорироваться, что они есть, что их нет, на 1.5 хотя бы картинку тебе разьебывали.
>>889259 > Одно дело вводить всегда один и тот же набор тегов качества и другое дело отдельную LLM поднимать, чтобы тебе промпт как надо оформили.
Тут ещё дело, что скорее всего обучать такую модель на тегах (в особенности просто взятых с бур) - это гиблое дело. Потому что они мало того, что не отражают того, что происходит в кадре полностью в силу того, что это теги, так ещё и поставлены неправильно. Поэтому как минимум, нужно брать какую-то теггалку с точностью выше человеческой. (Вон новелы свою обучали для наив3 и фурри модели. И, кстати, даже они обучали не чисто на тегах, у них нормальные подписи тоже были)
А так, не знаю. Я вижу, что топовые лабы, когда делают свои модели, практически полностью забивают на все человеческие подписи, кроме тем, что VLM делают. И кажется, что так и надо делать. У тех же OpenAI в статье про DALLE3 было про то, насколько сильно VLM подписи повышают качество модели.
>>889241 Проблема тут в том, что тебе нужна ЛЛМ и доступ к ней, если ты собрался картинки погенерить. Причем если собрался НСФВ генерить, то и ЛЛМ тебе нужна с пробитым джейлом, иначе фиг, а не описание, "я не могу выполнить ваш запрос".
Самому же такие портянки писать - затрахаешься быстрее, чем что-то сгенеришь. Плюс если оно именно на портянках натренено, то лаконичный промпт, написанный человеком, выдаст заведомо худший результат.
>>889273 Ага. И много тут таких, кто одновременно лламу и флюкс запустить смогут? Или по-очереди их подымать, после каждой генерации? >>889275 Ну да. А есть нормальный человеческий язык, на котором ты сам писать можешь, без подключения шизо-роботов. Про тэги, которые отлично систематизируются и группируются, и не говорю.
>>889241 Необходимость лишней прослойки, которая ухудшает контроль, по-своему интерпретирует и может знатно все портить. Это называется проще промтить? Какое-то эталонное свобода=рабство ради 1гирл стендинг. >>889252 > Ну, никого же не смущало раньше писать Это просто теги, которые дают смещение на качество. Их поставил и забыл, шизослоуп, где вместо 3 тегов будет 2 предложения не может никак с этим быть сопоставим. >>889268 > скорее всего обучать такую модель на тегах (в особенности просто взятых с бур) - это гиблое дело Пруфов или значимых аргументов кроме "я настроился на такое и теперь топлю" - нет. Модель можно хорошо обучить без (значительной) потери базовых знаний - факт. Модель нужно обучать с продвинутыми капшнами, комбинирующими теги и натуртекст, а не просто голыми тегами - тоже вроде очевидно. > И кажется Когда кажется - нужно креститься и использовать голову и научный подход, а не множить мракобесие, где нелогичные домыслы лишь опираются друг на друга.
Ну, в общем-то не важно, кто как хочет так и дрочит. Такие споры о том что лучше никак не приблизят нормальную модель, если идет лишь интеллигентный так-то уже ебать достижение срач, где каждый лишь защищает свою позицию и исповедуемый подход, а не обсуждает конкретику и действительно в силах ее воплотить.
>>889310 >Это называется проще промтить? Какое-то эталонное свобода=рабство ради 1гирл стендинг. > по-своему интерпретирует
В этом важное преимущество как раз для 1гирл стендинга. У них отличные знания по тому, как описывать пейзажи, одежду, мелкие детали. Они ощутимо лучше и шире, чем то, что теги предлагают. В тегах мало фасонов одежды, например. А уж про описание пейзажей вообще молчу.
> комбинирующими теги и натуртекст, а не просто голыми тегами - тоже вроде очевидно.
Так это сложнее чем кажется. Если хочется, чтобы эти теги были к конкретному персонажу в сцене относились, то как это описать так, чтобы оно матчилось с натуртекстом? Или тогда просто после натуртекста сбрасывать все теги в tags: <...>?
> не множить мракобесие, где нелогичные домыслы лишь опираются друг на друга.
Про VLM подписи и их влияние на качество - это не домыслы. Вон, эксперимент примерно на эту тему: https://cdn.openai.com/papers/dall-e-3.pdf, см. там начиная с 7 страницы.
>>889315 > В этом важное преимущество Это все разбивается об один простой и вроде очевидный факт - никто не мешает использовать комбинации тегов и натуртекста. > Так это сложнее чем кажется. Да, нужно иметь хороший объем точно протеганных натуртектом, доступ к ллм и оформить значительный массивный нлп для подобного. > то как это описать так, чтобы оно матчилось с натуртекстом? Прежде всего, не путать нормальный натуртекст и несодержательный шизослоуп. "She wears purple pleated skirt with pink teddy-bear print" - хорошо. "On the image, the girl has a skirt with a skirt with visible folds that appears to be clearly purple color that adds surreal and schizoid atmosphere to the scene. On that vivid purple skirt besides folds you can find a small creatures that looks like teddy-bears. Bears have light-pink fur and are small in size to be printed on the girl's skirt." - плохо. Первое может или дополнять буру теги, или напрямую юзаться как их развитие, максимально информативно, лаконично, масштабируемо, удобно писать самому, и легко воспринимается моделями любых архитектур, если там нет проблем. Второе - должно умереть в зародыше, ибо это буквально отвратительный косяк VLM что пытается угодить инструкции "подробно" в очень плохой интерпретации. А сделать - или сразу полное описание из подобной комбинации, или теги + их дополнение натуртекстом после. В случае нескольких персонажей это можно сегментировать и связывать прямо в тексте естественно, но это как раз самое сложное для капшнинга. > Про VLM подписи и их влияние на качество - это не домыслы. Неверная интерпретация, улучшение результата от хороших капшнов - очевидно. Замусоривание же никакой пользы не принесет, а применение тегов - не испортит. Алсо конкретно в примерах той стати большей частью уже обработанные хорошие капшны без серьезного замусоривания.
>>889329 > On the image, the girl has a skirt with a skirt with visible folds that appears to be clearly purple color that adds surreal and schizoid atmosphere to the scene. On that vivid purple skirt besides folds you can find a small creatures that looks like teddy-bears. Bears have light-pink fur and are small in size to be printed on the girl's skirt
Ну такую шизу тот же 4о, например, не делает, если его попросить. Я им в основном подписи собираю, он вот этой чуши про атмосферу не пишет обычно. А где нсфв - уже выкручиваюсь через всякие другие модельки, их в целом тоже можно заставить кратко писать. И кстати флукс на шизоидные куски натуртекста обычно и не реагирует, так что он тоже видимо на чём-то кратком, но подробном обучался.
> Замусоривание же никакой пользы не принесет, а применение тегов - не испортит.
Я и не предлагаю использовать обязательно VLM, которая будет мусорить шизоописаниями.
Пользуясь случаем, хочу поблагодарить нейрокальщиков за засранный pinterest. На скринах первые два образца из suggested выдачи, которые я сегодня открыл навскидку, предчувствуя заранее, что там за кал. Это, кстати, Niji. Источник образцового дженерика, хотя принято считать его более продвинутым, чем опенсорс модели.
Pinterest до появления стейбла и после - это два совершенно разных ресурса! И последний засранная неюзабельная параша. Если бы я знал, то запасся бы годными пикчами заранее лет пять назад... Годный датасет для лоры теперь не соберешь, опять же. Даже когда просматриваешь фотки, то и под видом фоток тебе суют одни и те же пластмассовые манекены с фронтального ракурса в статичной позиции. Блядь, раз назвался ИИ-художником, то попытайся хоть в малейшую креативность - поверни на три четверти, конечности подвинь...
>>889329 > теги + их дополнение натуртекстом после
Меня скорее вот такой подход смущает, потому что флукс очень плохо воспринимает когда у него в промпте два даже чуть-чуть противоречивых куска текста. И я не знаю, как он поведет себя при обучении, если у него будет на сцену с несколькими персонажами просто набор текст с тегами для всех участников и только потом какой-то натуртекст.
>>889330 > какой же он жалкий Двачую, мог бы пользоваться благами и делать мастерписи, а не устраивать сессии аутотренинга. Судя по залайканности поста они там все такие, но комменты радуют, в топе адекваты. >>889344 Мы негодуем также как и ты, раньше площадки загаживали стоковым трешем и криворукими художниками, теперь их вытеснил нейроарт со дна. Вини прежде всего алгоритмы. >>889347 > противоречивых куска текста Где противоречие? > если у него будет на сцену с несколькими персонажами просто набор текст с тегами для всех участников и только потом какой-то натуртекст Натянется на глобус как канни на масло на нож. Даллишную статью внимательно посмотри, там в примерах часто фигурирует сначала простое описание, а потом дополнительные уточнение или отсылка с более развернутым текстом. Если вдруг нет - придется сегментировать по персонажам и усложнять капшны.
>>889367 >комменты радуют, в топе адекваты Какие адекваты, ты вообще коменты от кретинов там читал? Буквально аутотренинг от рисобак горящих, как и r/aiwars. «ИИ это инструмент, вот мы его освоим и нас не потеснят». Тьфу, лять. Возюкают дегенераты своими стилусами в i2i позорном, шизоиды. Даже промптинг освоить базовый не могут
>>889367 Бля надушнил, сорян, разумеется это всего лишь предположение, но основано не на голой вере а на всех наблюдаемых закономерностях. Тут только проверять, скорее всего по пути откроется ряд особенностей и нюансов, и на что-то наложат отпечаток реалии и тулзы для тренировки. Например, совершенно непонятно как в таком случае делать аугументацию промта судя по всему во флаксе ее и не делали, от того и такое поведение >>889380 > This has been said since 1800 and still remains true. People that adapt flourish and people that don't, go extinct. База же
Условно в сцене два персонажа, один в костюме горничной, другой в кимоно. И суммарная подпись будет: 2girls, kimoni, maid dress. Two girls are standing in the huge hall of cosplay convention. The girl on the left dressed in a long maid dress with halter neckline is talking to the girl on the right who is wearing a blue kimono with flower ornament and red obi.
Хотя я сейчас сделал разумное количество роллов и вроде бы такой простой промпт нормально работает и ничего не смешивается и не путается. Так что может быть я не прав и теги + натуртекст будут спокойно работать.
>>889330 Так он наоборот базу сказал. Если клиенту нужна именно такая маска на шлеме и именно такая композиция - ИИ облажается почти всегда. Только человек может его пнуть в нужном направлении, исправив косяки вручную или задав правильные условия через лоры и контролнеты. ИИ сам по себе хорош, когда тебе нужно что-нибудь, но не когда тебе нужно именно вот это.
>>889344 Поиска по датам там нет, чтоль? Сортируй до появления ИИ, вот и все.
Спасибо 1girlы, скачал фордж и мне понравилось. Но я вот хайрезфиксом не пользовался раньше, почему у меня картинка мылицо?
Типа я генерю без хайрезфикса, потом, если картинка прикольная, то хочу сделать более крупную версию с хайрезфиксом, но вот передрочил кучу настроек и где-то он делает ее пиксельной а где-то мыльной. В чем проблема подскажите пожалуйста!! Умоляю!
>>889482 Во время работы латентных апскейлеров необходимо выставлять силу денойза выше обычных (Nearest/Lancoz) или GAN-апскейлеров - в противном случае будет бросаться в глаза сильная размытость изображения после апскейла. Попробуй ~0.7 если на латентах апскейлишь. А вообще лучше GAN какой-нибудь наверни: https://2ch-ai.gitgud.site/wiki/nai/upscale/#популярные-апскейлеры
>>889482 >>889488 Латенты от 0.6 работать начинают. 0.7 уже сильно картинку может переколбасить, особенно если ты куда-то в разорви-экран апскейл делаешь. 1.4-1.6 от когерентного разрешения модели, не больше. Если надо дальше - либо ган с минимальным денойзом, либо тайлами под контролнетом, либо в экстре без денойза.
>>889714 Поломатик для довольных олдфагов. Фукус для ньюкеков и казуалов (на самом деле - StabilityMatrix, но и Фукус сойдёт), Лапша для bleeding edge пердолинга, Форжи для недовольных олдфагов. >Кстати какие модели сейчас актуальны flux.dev Понимерджи по вкусу.
>>889714 > автоматик Он база и топ если у тебя норм железо. Комфи слишком специфичен, форж страшно забагован и прежде всего рассчитан на врамлеты. >>889719 > Но при этом он не поддерживает flux Это флакс не поддерживает типичные запросы что релейтед треду, исключения редки, требуют пердолинга и результат на любителя.
>>889719 >Но при этом он не поддерживает flux Я понимаю, что все генерации это сплошные копромиссы. Была полторашка, выходит XL - ну, линии прорисовывает хуже, задники хуже, но по концептам умнее и может из коробки в большее разрешение. Хуй с ним, народ перекатывается на XL, хотя 1.5 всё ещё генерирует более качественные пики. Появляется понишиз с его франкенштейном. Хуже понимает концепты, художников, промпты, никаких улучшений по задникам или лайну. Но рисует пёзды с хуями, причём это может быть буквально хуй с пиздой - анатомия поням неведома. Хуй с ним, кто-то перекатывается на пони. Сейчас вот флюс. Что он вообще может предложить, чтобы я перекатился с поломатика на какое-нибудь лапшеговно?
>>889781 Хуйня, контролнеты с лорами фиксят руки до уровня XL, который тоже 6 из 10 рук запорет. Где этот "новый уровень" вообще, он с нами в одном треде? Не вижу.
>>889941 Если перестать кормить жырных троллей, то им нечего будет есть, а на дваче рухнет постинг. Думйте сами, решайте сами - кормить или не кормить.
>>889805 > Да нет особого пердолинга А чмоня тогда зачем? >>889841 О да. Но боксерши большей частью уродливы, лучше делать реслинг а ведь такое уже есть >>889941 Вот бы релизнуть модель в опенсорс чтобы множество людей потеряли заработок как в первом мире так и встретьем, а нищая петарда могла сгенерировать канничку, ммммм. Как представишь - прямо чувствуешь что живешь.
>>889968 > А почему им не уметь в стили? Тем не менее, детализацию в мелочах как у 1.5 (офк с кучей тулзов) даже не смотря на 16 канальное вае флакс не делает. > получить когерентную композицию сцены чисто по тексту Сделай кошкодевочку в неоновом кимоно off_shoulder с огромными бубсами и areola_slip, которая будет слизывать с пальцев suggestive fluid и при этом стоять на на одной ноге, демонстрируя писик с pussy_juice_trail, облокотив вторую yjue на плечо другой кошкодевочки с bandeau поверх dfc и convenient_censorship снизу, которая с жадностью/завистью будет смотреть на первую. >>889989 Ля какая >>890038 gpt4o
>>890047 >Сделай кошкодевочку в неоновом кимоно off_shoulder с огромными бубсами и areola_slip, которая будет слизывать с пальцев suggestive fluid и при этом стоять на на одной ноге, демонстрируя писик с pussy_juice_trail, облокотив вторую yjue на плечо другой кошкодевочки с bandeau поверх dfc и convenient_censorship снизу, которая с жадностью/завистью будет смотреть на первую. Сделай.
А, эта чмоня. Чтобы копировать композицию, одежду и т.п. с другой картинки. Вот мне кто-то на мегумин понадобился похожий - я скинул, получил подробное описание. Сам бы из головы я бы долго такое писал. Для обычных генераций оно не особо нужно, разве что я от модельки часто описания одежды или описания локаций спрашиваю, чисто из лени.
> Тем не менее, детализацию в мелочах как у 1.5
А мне нужна такая детализация? Там же вся детализация состоит из кучи некогерентного мусора.
> Сделай кошкодевочку в неоновом кимоно ...
Ты слишком много хочешь от базовой модели, она пока части этих тегов не знает. Но всякие "слизывать с пальцев", "off_shoulder neon kimono" и "lifts her leg up to place it on a shoulder of another", "bandeau" и т.п. - запросто.
>>890086 > Ты слишком много хочешь от базовой модели Напрямую интерпретирую слова о возможностях сложных генераций с первой попытки на фоне остального обожания. Причем, такая "композиция" вовсе не является невозможной, что на XL, что на флаксе можно получить, но в первом случае сложнее сегментировать атрибуты без регионального промта, а во втором не знает отельные элементы. > "lifts her leg up to place it on a shoulder of another" > запросто Во, покажи
>>890106 > Причем, такая "композиция" вовсе не является невозможной, что на XL Я ради чистоты эксперимента, попробовал это на XL. Даже с инпеинтом что-то ничего не вышло. Причем роллов 50 я сделал, вдруг удачный сид попадется, но нет, увы.
> Во, покажи
Пожалуйста, третий ролл и хайрез фикс. Хайрез фикс я всегда делаю, но тут без него второму коньку наступала полная крышка (ему и с ним плохо, увы). И да чуть промпт модифицировал, потому что для фигуристов он изначальный чуть по другому понимал.
>>890232 > А подскажите, как на флюксе запилить сиськи? Собираешь датасет под свой стиль с наготой, тренируешь, получаешь. Он достаточно хорошо этому учится.
Столько раз пользовался ComfyUI на Thinkdiffusion - а теперь уроды закрыли регу новых акков с мыла, кроме google! На гуглопочте барин ебет проверкой по номеру, там не зарегаешься.
Нет, я конечно могу найти бесплатный аналог - но это опять же пердолинг, чтоб переделывать API скрипт и workflow под новую платформу... Чего американским пидорасам неймется, китайцы вон целый год безвозмездно хостили сайт с бесплатным SD и SDXL.
>>890462 Примерно как запускать полтораху на четырёх амудегигах, что я делал год. Можно, но не очень быстро. Это всё, разумеется, с fp8 и ниже квантами.
>>890369 Минималистичный https://files.catbox.moe/xf5qvt.pnghttps://files.catbox.moe/qb1c02.png > то он без проблем делает Покажи тогда хотябы правильный панцушот вместе с популярным концептом. Просто задрать ногу и у сдохли нет никаких проблем, сложности начинаются в нужном ракурсе и мемном взаимодействии чаров, ибо его в принципе сложно объяснить модели. >>890411 Uohhhhhhhhh! Топчик Милейшая и легальная 😭😭😭, о чем еще можно мечтать? >>890426 Нужен в случае если хочешь проконтролировать попадание конкретной фразы/группы тегов в один чанк, чтобы кондишн клипа прошел именно по их сочетанию. Например, фраза с описанием текста если хочешь пытаться сделать текст, длинный промт на что-то одно, расположенный посреди. В остальном - эффект эфимерный и рандома больше.
Как бы я тоже могу обучить на позах с данбуры и одним тегом это сделать. Это вообще не интересное сравнение. Потому что одно дело, когда модель при обучении с этим явно сталкивалась, другое дело, когда мы пользуемся возможностями следования промпта у базовой модели, чтобы заставить её делать то, что она вряд ли хоть где-то видела.
>>890500 Пикрелейтед из ссылки + добавить --use-directml в батник запуска в set COMMANDLINE_ARGS= Остальное как у нвидий - качаешь модель (чекпойнт), ваэ, лоры, настраиваешь оптимизации и ннтерфейс под себя, хуё-моё, в гайдах всё есть. Если не осилишь - покупай видеокарту вместо амуды, с ней и у для брейндед инвалидов есть возможность запускать нейронки.
>>890505 А это ведь интересный и достижимый случай, а не какие-нибудь левд взаимодействия конкретных персонажей на что нет шансов. > Как бы я тоже могу обучить на позах с данбуры и одним тегом это сделать. Конечно можешь, оно ведь идеально обучается и хватает "десятка картинок" чтобы достигнуть всего-всего. Вот только как до дела доходит, так сразу > Ты слишком много хочешь от базовой модели Как бы ничего против не имею, но притомило религиозное восхваление вопреки экзистенциальным проблемам, вместо поиска их реального решения. >>890539 Лисик! За що заставляешь траповать?
>>890570 > Вот только как до дела доходит, так сразу Это базовая модель. Покажи мне аналогичное поведение на базовой сдхл.
> притомило религиозное восхваление Если сравнивать базовые модели, то это лучшая из тех, что до этого были. Причём на порядок. И восхваление именно за это и за будущий потенциал. Базовый сдхл и сд1.5 были неюзабельны для аниме и чтобы их надежно обучить анимешному стилю лорой - надо было ох как поебаться. Даже ранние анимешные сдхл файнтьюны были так себе в этом отношении.
А тут взял немного картинок, сделал нормальные подписи и базовая модель стиль перенимает лучше кого угодно на рынке.
> экзистенциальным проблемам, вместо поиска их реального решения Какие экзистенциальные проблемы? Обучать относительно дорого? Это есть такое, с другой стороны, ллмки тоже обучать дорого, однако ничего, сообщество и 405б лламу обучает.
Ну и реальные решения - разбираться как модель себя ведет с разными видами подписей при обучении, какие подходы работают, какие настройки работают, как модель концептам обучается. Этим я и занимаюсь собственно.
На тенсоре вообще нихуя нету, ни людей ни обновлений моделей, ни кучи лор. А они еще хотят отключить импорт из цивитая "потому что мы независимые!!1" в надежде что люди перебегут к ним, ебанутые. Если бы не халявные лимиты я бы лучше ебался с молниями на цивитае там хоть все обновляется регулярно и куча народа.
>>890595 Я понял. А подскажи. Чтобы хентай генерировать мне нужно ещё скачать autismmix и настроить всё это верно? Про up score уже прочитал. Выставил CFG Scale 7, но всё равно какую-то парашу выдает.
>>890592 Чел, твой дневничок нище-страданий тут интересен примерно никому. Пости красивое. Не можешь - не засоряй эфир пока не купишь пека вместо микроволновки
>>890585 В тех примерах тоже базовая аниме модель на основе SDXL, все честно, лол. Как ни назови, как ни интерпретируй, суть не меняется. XL невероятно развита, в ней доступны все наработки и фишки, можно быстро дообучить, и с некоторыми манипуляциями реализуется 99.9% того, что есть в флаксе. В то же время, последнего как ни пердоль, достигнуть аналогичного он не способен в текущем виде. Соя и цензура помноженныя на сложность обучения и даже запуска, отсутствие знаний, костылей, важных вещей типа контролнета и прочего прочего. Потанцевал никак не облегчает эту горькую реальность, если только не погружаться в манямир. > Какие экзистенциальные проблемы? Ну как тебе сказать, это что-то уровня Ахиллеса и черепахи, пока не выйдешь за наложенные догмы - не поймешь. Раз занимаешься - похвально, делись результатами, только помимо интерпретаций сырые факты и наблюдения.
>>890612 > базовая аниме модель на основе SDXL, все честно Это никак не базовый сдхл, а именно с ним и надо сравнивать. Это все напоминает мне ровно год назад споры про сдхл против сд1.5. Теперь всё ровно так же повторяется.
> некоторыми манипуляциями реализуется 99.9% того, что есть в флаксе Ну давай я возьму тофу и попробую там сделать фигуристов так же. Посмотрим на результат. Попробую в тоже число роллов уложится, интересно что получится.
> отсутствие знаний, костылей, важных вещей типа контролнета и прочего прочего Контролнеты есть, даже работают получше первых контролнетов под сдхл, ип адаптер есть, перенос лиц есть.
> сложность обучения и даже запуска Какие сложности с запуском? С обучением сейчас сложности тоже нет, что kohya, что simpletuner. Доступны и ликорисы, и лоры, и полные файнтьюны.
>>890612 > некоторыми манипуляциями реализуется 99.9% того, что есть в флаксе А подскажи оптимальные настройки для тофу и какие художники там прям лучше всех работают, а то у меня что-то его разьебывает немного. Euler, cfg 6.0, 28 steps должно же нормально работать?
>>890621 Да бля, впиши уже негатив, увеличь размер генерации, включи хайрезфикс, посмотри как на цивите на странице модели у картинок настройки и промты и отталкивайся от этого.
Аноны, для постоянства генерации перса по промпту придумали чего интересного? Контролнет какой для поня натренили, может быть?
Или только лору тренить? Не хотелось бы, картинок мало, из одной не получится, что хочу.
А то, блин, хочу с персом ничего сложного в дизайне: двуцветное платье, ботинки, повязка на руке пару вариаций запилить, но, цук, сплошной рандом получается. А вручную допиливать не хочется.
>>890640 >Чистый понь? Я вообще не понимаю как им пользоваться, когда много тегов нихуя не работает, выдает какой-то аал, лоры, которые якобы для пони, полростью игнорирует, раз в 10 генераций просто пятно разьебанное выдает. При этом у миксов такие же проблемы, главная проблема это игнор лор.
>>890659 RuntimeError: Could not allocate tensor with 536870912 bytes. There is not enough GPU video memory available! Вот выскочила ошибка. ГПУ на 12 гб.
>>890749 Мой косяк, на первой генерации было установлено разрешение 1024х1024, там генерации получше. Тоже говно, но это из-за отсутствия нормального промта и негативов Но как видишь, даже на 512х512 нет таких артефактов, проверь вае.
Пытаюсь шапку реструктурировать, на мой взгляд, она всё ещё слишком раздутая. Накидал инфы по темам и сгруппировал сведения из текущей версии шапки.
По моделям бы ещё нормально расписать, но что-то я пока подзадолбался, вброшу так. Понятно, что там есть неточности и многое дополнить надо, но с вашей помощью надеюсь привести это со временем в более приличный вид.
>>890653 Попробуй покрутить IP-адаптер, может быть настройка strong composition с моделью plus_sdxl поможет. Но пока лучше лоры ничего нет в этом плане.
Я правильно понимаю, чтобы применить ЛОРу по ней достаточно нажать и тег введется? Куда его вставлять, в начало - в конец неважно или важно? Иногда просто не могу понять работает он или нет
>>890618 > Это никак не базовый сдхл, а именно с ним и надо сравнивать. Ну это классика, выходит новый профессор с вдвое большим числом ядер в меньшую цену - а нет, сравнивать нельзя! Отключай ядра, убирай все оптимизации, не используй правильные подходы и только тогда сравнивай, тесты - не тесты. Только здесь наоборот дорогущая новинка не может угнаться за старьем. > Ну давай я возьму тофу и попробую там сделать фигуристов так же. Если стоит цель сделать фигуристов - берешь и делаешь их, балерин, атлетов и кого хочешь. Смотришь как реагирует, подбираешь промт, в особо сложном случае подключаешь референс, контролнет, тренишь лоры, там более последнее за 15 минут делается вместо нескольких часов для фласка. Но такое - редкость, в зависимости от ОПЫТА ПРОМТИНГА, обычно, быстро. А теперь рисуем сценарий о том как сделать подобное на потанцевальной модели и грустим, понимая какой еще путь впереди и насколько печальна она в текущем виде. Начать можно с разработки капшнинга белого человека, который будет понимать все в сложных сценах без лишнего, например https://files.catbox.moe/dt5m39.pnghttps://files.catbox.moe/k55i37.txt чтобы потом была доступна качественная обработка и гибридизация с тегами. Миссионерская же деятельность ничем не поможет. > Какие сложности с запуском? Расскажи это 8-гиговым бедолагам. > Доступны и ликорисы, и лоры, и полные файнтьюны Ну ты еще будешь рассказывать, а с доступностью файнтюнов вообще иронично. >>890644 > Euler, cfg 6.0, 28 steps должно же нормально работать? Да, самое то. Можно как в примерах с Euler A, в целом и на 20 шагах работает. Общее сводится к подбору интересной комбинации стилей (не юзать же сток при таком ассортименте) и далее просто промтинг желаемого, многие лоры с поней работают. Из проблем в таком кейсе только байасы яркости у некоторых артистов, но уже есть идея как это пофиксить. Алсо видел как юзернеймы собирали ультимативные комбинации или получали оче крутые результаты с dpm2, но, похоже, там какие-то дополнительные настройки семплеров накручены ибо у себя не получилось воспроизвести.
>>891034 Ну я не специалист, но вроде как я не заметил что бы в начале или в конце как то влияло, ну смысле результаты отличаются самом собой незначительно из за порядка токенов, но смысле на отработку лор это никак не влияет, я в конце юзаю просто потому что они туда добавляются сами.
Шизопромт: 1girl, breasts, nipples, solo, long hair, japanese clothes, purple hair, large breasts, miko, red hakama, looking at viewer, fireworks, green eyes, collarbone, smile, hakama, blush, parted lips, ribbon, hair ribbon, low twintails, hakama skirt, upper body, breasts out, off shoulder, twintails, bare shoulders, night, kimono, skirt, red ribbon, signature, no bra, swept bangs, white kimono, parted bangs, very long hair, long sleeves, sky, puffy nipples, shiny skin, grin, night sky, arm at side, aqua eyes, sparkle, low ponytail, bow, border, white border, open clothes, wide sleeves, sweat, hair ornament, clothes down, white ribbon, outdoors, aerial fireworks, cleavage, red bow, ponytail, outside border, teeth, arms at sides, armpit crease, topless, large areolae, huge breasts, artist name, standing, scrunchie, sidelocks, hakama short skirt, open kimono, lips, red skirt, dated, arms behind back, hair bow, open mouth, raised eyebrows, nose blush, star (sky), light blush, hand up, hair between eyes, shirt, kimono pull, clothes pull, ribbon trim, closed mouth, hair over shoulder, black hair, official alternate costume, detached sleeves, blurry, starry sky, cowboy shot, simple background
>>891010 > Можно как в примерах с Euler A, в целом и на 20 шагах работает. Ага, я в целом нашел, что работает. Поприятнее поней моделька. Тот же кантоку в простых сценах мне понравился , приятный, правда в сложных сценах он ломается почему-то.
> dpm2 С ним у меня с текстурами была беда, как минимум на том же кантоку.
> дополнительные настройки семплеров накручены ибо у себя не получилось воспроизвести. Сейчас ещё с рунге-кутта попробую, они бывает прям совсем по другому рисуют.
> Но такое - редкость, в зависимости от ОПЫТА ПРОМТИНГА, обычно, быстро. Ну смотря что промптить. Вот смотри, вроде бы простой промпт, натур текст: Anime illustration. Side view of young woman and man figure skating. The ice arena behind the pair is dark and empty. The pair rides and is highlighted by the cone of light from the ceiling. The woman wears maid dress with heart-shaped golden embroidery. She has black hair in twin braids and brown eyes. The man wears a black formal suit.
Переводим в теги: by kantoku (для примера, я ещё нескольких попробовал), 1girl, 1boy, from side, dark empty ice arena, figure skating, light ray, medium breasts, black hair, twin braids, maid, apron, golden heart-shaped embroidery, black suit, brown eyes
Ну начинаем с одного персонажа в кадре, всё отлично. Типа 4 ролла, 2 умеренно сломанных, 2 хороших (пример приложен), причём действительно неплохих.
Добавляем второго персонажа в кадр. Получаем хм... что-то вот такое (и это лучшее из роллов 16). Хай рез фикс при этом вообще не выручает если его применять, часть рук он выправляет, но композицию им не исправить. Пытаемся добавить натур текст, вдруг с ним лучше - и там та же ситуация. Причём это очень простой промпт по сути.
Лучше работает на простых стилях (попробовал аааа, там уже можно жить, несколько удачных с парой собрал за те 16 роллов), но там свои проблемы - фонам беда.
А теперь сравни, вот 4 ролла на натур тексте на флуксе. Причём это на относительно пережаренной лоре, без хайрез фикса (который я обычно использую и который руки вправляет норм так) и всего остального. И дальше первый же ролл на тегах, как видишь, флукс спокойно понял, что я хотел и чисто по тегам.
> Начать можно с разработки капшнинга белого человека, который будет понимать все в сложных сценах без лишнего
Проблемы с лишним текстом и сейчас можно обойти(как минимум я сейчас так делаю): всё с сфв рейтингом кидаем в 4о, всё остальное в joy caption, дальше даем теги + joy caption в ллмку с few-shot промптом на то, чтобы сократить описание с учётом тегов.
> Ну ты еще будешь рассказывать, а с доступностью файнтюнов вообще иронично. > Расскажи это 8-гиговым бедолагам. Ну надо платить дань Хуангу, без этого в наше время никуда, the more you buy the more you save и всё такое.
>>891010 Напомни, пожалуйста, с чем ты воююешь, постя картинки без какой-либо когерентности персонажа и фона, с перспективой от ширика на портретной ориентанции etc
Поняч был эпичным прогрессом после 1.5 и геншининфаркта анимейджина. Но сейчас сидеть и упираться в него только потому, что ты надрочился тэгами описывать "почти все" за этот год, а у кого-то там всего "8гб" - ту такое. Удачи оставаться.
>>891010 > Если стоит цель сделать фигуристов - берешь и делаешь их, балерин, атлетов и кого хочешь. Причём это не проблема конкретного анимешного тьюна сдхл. Это проблема их всех. Вот 4 ролла от новелов.
И да, это даже не только проблемы сдхли. Вот 4 ролла от нижи, у них модель промпты лучше понимает, но как видно, важные детали она пропускает.
>>891230 > почему бы просто не научиться рисовать? Ну рисование - это про творчество. А нейронки, как минимум, для меня - это про веселое тыканье палкой в черный ящик.
>>891250 Это мои лоры, стоковой стилистически будет хуже, но скорее всего чуть получше в плане рук и деталей, т.к. у меня та серия лор чуть пережаренная была, а переобучать лень.
>>891010 > Ну ты еще будешь рассказывать, А вот и LoKR, например, ещё пока недообученный до конца. И тут уже без пережарки, взял консервативный LR.
>>891071 > правда в сложных сценах он ломается почему-то Просто зажрались. На самом деле у него некоторая беда есть что механизмы и подобное любит ломать, при этом делая отличные детальные ситискейпы и структуры. > Ну смотря что промптить. Разумеется, есть вещи, которые популярны в аниме арте, есть которые популярны при запросах и присутствуют в датасетах обычных моделей, и прочее. С парными персонажами на льду модель банально не понимает что делать, ice_skating всего чуть более 400 пикч, из них нормальных в лучшем случае 200, а парных - буквально 3.5 пикчи. Или фактор наличия знаний валиден только для флакса? Вот если бы запросил чтобы они там на льду поебались - о да. Тем не менее, с горем пополам получить это на сдохле можно даже голым промтом. А такой же маневр во флаксе для большинства запросов, что нужны от анимемодели, невозможен. Потому с ним только и делают что мемчики или вообще забивают поигравшись. Ну может для задников чего-то особенного и ассетов еще. За сим предлагаю закончить и уже обсуждать как эту ситуацию исправить, а не устраивать сессии коупинга. но если есть новые аргументы вместо повторений, или готовость сделать в потанцевальной модели что-то сложное - велкам > Проблемы с лишним текстом и сейчас можно обойти Проблема не в лишнем тексте, а в отсутствии нормальных капшнеров, которые бы не глючили и не ошибались ужасно. А это основа датасета, просто так чмоня и жойкапшн дадут неудовлетворительный результат на сложных пикчах. > всё с сфв рейтингом кидаем в 4о Она дешевая, но ключей на что-то объемное не хватит. Если только ты не любитель кабанчиков а ты не он. Эх а были времена когда можно было коктропиков на "квартиры в области" греть. >>891075 Детка, не лезь во взрослые споры. Пока ты упарывался пассивной агрессией и манипуляциями, сам когеретность потерял. >>891209 shaded face + smile и прочее >>891220 Содомит
>>891324 > Детка, не лезь во взрослые споры Ну, тогда как ты хочешь, братик: >нумам, скажи ему, что нормальная у меня перспектива, нормальная НИУДОБНЫЕ АРГУМЕНТЫ начались, что парировать взрослостью пришлось?
Как вы генерите аж 4 персонажа на 1 пикче и они не всираются и не варуют внешние признаки друг друга? Инпеинтом чтоли по 1 дрочитесь? Я так могу, но есть нюанс.