Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 506 153 138
Stable Diffusion технотред #11 /tech/ Аноним 13/07/23 Чтв 21:08:59 399707 1
.png 979Кб, 3510x2910
3510x2910
.png 281Кб, 1356x1838
1356x1838
.png 271Кб, 1853x624
1853x624
.png 441Кб, 3904x1120
3904x1120
ИТТ делимся советами, лайфхаками, наблюдениями, результатами обучения, обсуждаем внутреннее устройство диффузионных моделей, собираем датасеты, решаем проблемы и экспериментируем
Тред общенаправленныей, тренировка дедов, лупоглазых и фуррей приветствуются

Предыдущий тред: >>314956 (OP)

➤ Софт для обучения

https://github.com/kohya-ss/sd-scripts
Набор скриптов для тренировки, используется под капотом в большей части готовых GUI и прочих скриптах.
Для удобства запуска можно использовать дополнительные скрипты в целях передачи параметров, например: https://rentry.org/simple_kohya_ss

➤ GUI-обёртки для kohya-ss

https://github.com/bmaltais/kohya_ss
https://github.com/derrian-distro/LoRA_Easy_Training_Scripts
https://github.com/anon-1337/LoRA-train-GUI

➤ Обучение SDXL

Если вы используете скрипты https://github.com/kohya-ss/sd-scripts напрямую, то, для обучения SDXL, вам необходимо переключиться на ветку "sdxl" и обновить зависимости. Эта операция может привести к проблемам совместимости, так что, желательно, делать отдельную установку для обучения SDXL и используовать отдельную venv-среду. Скрипты для тренировки SDXL имеют в имени файла префикс sdxl_.

Подробнее про обучение SDXL через kohya-ss можно почитать тут: https://github.com/kohya-ss/sd-scripts/tree/sdxl#about-sdxl-training

Для GUI https://github.com/bmaltais/kohya_ss и https://github.com/derrian-distro/LoRA_Easy_Training_Scripts/tree/SDXL так же вышли обновления, позволяющее делать файнтьюны для SDXL. Кроме полноценного файнтьюна и обучения лор, для bmaltais/kohya_ss так же доступны пресеты для обучения LoRA/LoHa/LoKr, в том числе и для SDXL, требующие больше VRAM.

Всё пока сырое и имеет проблемы с совместимостью, только для самых нетерпеливых. Требования к системе для обучения SDXL выше, чем для обучения SD 1.x.

➤ Гайды по обучению

Существующую модель можно обучить симулировать определенный стиль или рисовать конкретного персонажа.

Текстуальная инверсия (Textual inversion) может подойти, если сеть уже умеет рисовать что-то похожее:
https://rentry.org/textard (англ.)

Гиперсеть (Hypernetwork) может подойти, если она этого делать не умеет; позволяет добавить более существенные изменения в существующую модель, но тренируется медленнее:
https://rentry.org/hypernetwork4dumdums (англ.)

Dreambooth – выбор 24 Гб VRAM-бояр. Выдаёт отличные результаты. Генерирует полноразмерные модели:
https://github.com/nitrosocke/dreambooth-training-guide (англ.)

LoRA – "легковесный Dreambooth" – подойдет для любых задач. Отличается малыми требованиями к VRAM (6 Гб+) и быстрым обучением:
https://rentry.org/2chAI_easy_LORA_guide - гайд по подготовке датасета и обучению LoRA для неофитов
https://rentry.org/2chAI_LoRA_Dreambooth_guide - ещё один гайд по использованию и обучению LoRA
https://rentry.org/59xed3 - более углубленный гайд по лорам, содержит много инфы для уже разбирающихся (англ.)

LyCORIS (Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion) - это проект по созданию алгоритма для более эффективного дообучения SD. Ранее носил название LoCon. В настоящий момент включает в себя алгоритмы LoCon, LoHa, LoKr и DyLoRA:
https://github.com/KohakuBlueleaf/LyCORIS

LoCon (LoRA for Convolution layer) - тренирует дополнительные слои в UNet. Теоретически должен давать лучший результат тренировки по сравнению с LoRA, меньше вероятность перетренировки и большая вариативность при генерации. Тренируется примерно в два раза медленнее чистой LoRA, требует меньший параметр network_dim, поэтому размер выходного файла меньше.

LoHa (LoRA with Hadamard Product representation) - тренировка с использованием алгоритма произведения Адамара. Теоретически должен давать лучший результат при тренировках с датасетом в котором будет и персонаж и стилистика одновременно.

LoKr (LoRA with Kronecker product representation) - тренировка с использованием алгоритма произведения Кронекера. Алгоритм довольно чувствителен к learning_rate, так что требуется его тонкая подгонка. Из плюсов - очень маленький размер выходного файла (auto factor: 900~2500KB), из минусов - слабая переносимость между моделями.

DyLoRA (Dynamic Search-Free LoRA) - по сути та же LoRA, только теперь в выходном файле размер ранга (network_dim) не фиксирован максимальным, а может принимать кратные промежуточные значения. После обучения на выходе будет один многоранговый файл модели, который можно разбить на отдельные одноранговые. Количество рангов указывается параметром --network_args "unit=x", т.е. допустим если network_dim=128, network_args "unit=4", то в выходном файле будут ранги 32,64,96,128. По заявлению разработчиков алгоритма, обучение одного многорангового файла в 4-7 раз быстрее, чем учить их по отдельности.

Text-to-image fine-tuning для Nvidia A100/Tesla V100-бояр:
https://keras.io/examples/generative/finetune_stable_diffusion (англ.)

Не забываем про золотое правило GIGO ("Garbage in, garbage out"): какой датасет, такой и результат.

➤ Гугл колабы

﹡Текстуальная инверсия: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/sd_textual_inversion_training.ipynb
﹡Dreambooth: https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast-DreamBooth.ipynb
﹡LoRA [1] https://colab.research.google.com/github/Linaqruf/kohya-trainer/blob/main/kohya-trainer.ipynb
﹡LoRA [2] https://colab.research.google.com/drive/1bFX0pZczeApeFadrz1AdOb5TDdet2U0Z

➤ Полезное

Гайд по фиксу сломанных моделей: https://rentry.org/clipfix (англ.)
Расширение WebUI для проверки "сломаных" тензоров модели: https://github.com/iiiytn1k/sd-webui-check-tensors
Гайд по блок мерджингу: https://rentry.org/BlockMergeExplained (англ.)
Гайд по ControlNet: https://stable-diffusion-art.com/controlnet (англ.)

Гайды по апскейлу от анонов:
https://rentry.org/SD_upscale
https://rentry.org/sd__upscale
https://rentry.org/2ch_nai_guide#апскейл
https://rentry.org/UpscaleByControl

Ручная сборка и установка последней версии xformers и torch в venv автоматика:
Windows: https://rentry.org/sd_performance
Linux: https://rentry.org/SD_torch2_linux_guide

Подборка мокрописек от анона: https://rentry.org/te3oh
Группы тегов для бур: https://danbooru.donmai.us/wiki_pages/tag_groups (англ.)
Коллекция лор от анонов: https://rentry.org/2chAI_LoRA

Гайды, эмбеды, хайпернетворки, лоры с форча:
https://rentry.org/sdgoldmine
https://rentry.org/sdg-link
https://rentry.org/hdgfaq
https://rentry.org/hdglorarepo
https://gitgud.io/gayshit/makesomefuckingporn

Шапка: https://rentry.org/catb8

Прошлые треды:
№1 https://arhivach.top/thread/859827/
№2 https://arhivach.top/thread/860317/
№3 https://arhivach.top/thread/861387/
№4 https://arhivach.top/thread/863252/
№5 https://arhivach.top/thread/863834/
№6 https://arhivach.top/thread/864377/
№7 https://arhivach.top/thread/868143/
№8 https://arhivach.top/thread/873010/
№9 https://arhivach.top/thread/878287/
№10 https://arhivach.top/thread/893334/
Аноним 14/07/23 Птн 01:47:02 400281 2
Купил 3090 ти чтобы генерировать фурри хуи в 4к. Я у мамы молодец
Аноним 14/07/23 Птн 02:10:52 400307 3
Аноним 14/07/23 Птн 07:51:36 400457 4
Есть способ добавить в автоматик автовыключение компа после завершения генерации? А то хочу поставить конвеер на генерацию, чтоб он по завершении вырубил комп и не простаивал.
Аноним 14/07/23 Птн 11:25:30 400548 5
nullstyle-JYMRH.png 2153Кб, 1536x1536
1536x1536
nullstyle-UX9-T0.png 2077Кб, 1024x1792
1024x1792
Синолог в треде. Заметил такую закономерность, что все уникальные и цепляющие чем-то чекпойнты SD - сделаны кектайцами. Честно тренированные, со своими фичами и так далее. Если вы видите ридми иероглифами - это марка качества. Вот несколько из недавних
https://civitai.com/models/44605?modelVersionId=112251 - пик релейтед, мне зашло на ура
https://civitai.com/models/59719/2357-200 (старая версия даже пизже, хотя это дело вкуса)
https://civitai.com/models/98018/hello25dvintageanime
Anything тоже китайская модель. Попадались даже шикарные чекпойнты, которые не известны за пределами китайской блогосферы. Копипастные мерджи, которыми завален Civitai, сделаны западными пользователями (французы и прочие), они пережевывают одно и то же по много раз. Anything v4 это неофициальный bullshit мердж сделанный троллем.

Быть может, всё это потому, что в стране с миллиардным населением больше всего юзеров с баблом и энтузиазмом, + техническая подкованность и деловая дисциплина азиатов + визуальное богатство культуры, которая получила дальнейшее развитие в ИИ-арте. Зная предприимчивость чонгов, можно догадываться что они давно внедряют ИИ в геймдев, в десигн и всё остальное, а также пилят свои аналоговнеты.
Аноним 14/07/23 Птн 11:28:47 400555 6
Что характерно, Индия не совершает такого же вклада, хотя в ней тоже миллиард населения. Ведь в китайских компаниях не поощряется головотяпство и втирание очков, а индусы, они до сих пор какают на улицах, не говоря уж о состоянии науки и инноваций.
Что касается Америки, то она = соя и повесточка (при всем уважении к достижениям американских спецов, которые зачастую те же китайцы).
Аноним 14/07/23 Птн 14:01:26 400738 7
Да все они примерно одинаковые. Вообще этот SD ерунда.
Аноним 14/07/23 Птн 19:11:02 401113 8
>>400548
>>400555
Имаджинировали сколько вклада сделал этот ваня в клозет с дырой типа "очко на улице"?
Аноним 14/07/23 Птн 20:30:39 401249 9
Google обвинили в краже вообще всего в интернете — на прокормку ИИ

Против Google подали коллективный иск, в котором компанию обвинили в «тайном сборе всего опубликованного или созданного в интернете». Авторы иска считают, что данные используются для обучения генеративного искусственного интеллекта Google и подобных продуктов. Юридическая фирма, оформившая иск, ранее подала аналогичный, но уже против компании OpenAI, известной по ChatGPT.

В документах отмечается, что сбор информации американцев ведется компанией Alphabet без уведомления пользователей, которые даже и не подозревают о происходящем с их данными.

«Google прибирает к рукам всю нашу личную и профессиональную информацию, предметы творчества и авторские работы, наши фотографии и даже письма в электронной почте — буквально весь наш цифровой „отпечаток“», — утверждают авторы иска. По их словам, все это происходит годами и бесконтрольно.

В качестве доказательства приводятся изменения в пользовательское соглашение от 1 июля, в котором появилась отметка о том, что Google может собирать всю публично доступную информацию о пользователе для тренировки ИИ и совершенствования Google Translate, Bard и Cloud AI.

«Google должна понять раз и навсегда: она не владеет интернетом», — говорится в иске и отмечается, что публично доступное не означает бесплатное.
Аноним 15/07/23 Суб 18:39:48 403277 10
image.png 147Кб, 1080x224
1080x224
пук
Аноним 15/07/23 Суб 20:28:21 403532 11
>>401249
>«Google прибирает к рукам всю нашу личную и профессиональную информацию, предметы творчества и авторские работы, наши фотографии и даже письма в электронной почте — буквально весь наш цифровой „отпечаток“», — утверждают авторы иска. По их словам, все это происходит годами и бесконтрольно.
>
Пиздеж, уже давно обоссан, информация не персоанализована. Обычный пиар-иск.

>«Google должна понять раз и навсегда: она не владеет интернетом», — говорится в иске и отмечается, что публично доступное не означает бесплатное.
Как там Австралия гугол забанила уже или нет? А тут вообще ноунейм попук.
Аноним 15/07/23 Суб 20:36:52 403561 12
>>401249
Веб-архив уже сколько лет существует и почему-то никто не пиздит на него. А ведь там есть такое, что не просто осталось после удаления, а даже то что вычищалось как нелегальный контент.
Аноним 15/07/23 Суб 20:59:01 403650 13
Ребзя, уже тестировали sdxl? Она сильно медленнее чем 1.5? Просто думаю потянет ли моя 3060/12gb, или нужно идти апгрейдиться.
Аноним 15/07/23 Суб 21:05:23 403687 14
Аноним 15/07/23 Суб 21:11:10 403728 15
>>403687
Ну я и предпологал, что "потянет" в смысле запустится. Там кажется достаточно и 8gb vram.
Просто думал что живые пользователи ответсят что то вроде: "работает раз в 10 медленне" или "скорость генерации почти не упала".
Аноним 15/07/23 Суб 21:11:29 403731 16
>>403650
Квадаты потянет. Хайрезы или рефайн - нет.
Аноним 15/07/23 Суб 21:26:12 403781 17
sdxl.png 18Кб, 905x104
905x104
>>403728
Тянет и хайрез фикс и рефайн на 8Гб. Скорость генерации на 2060Super 1536х1024, DPM++ 2M Karras, 30 шагов — 40 сек.
Генерация с хайрез фиксом latent с 1024х768 до 1536х1152 при тех же параметрах — 1 минута.
Аноним 15/07/23 Суб 22:04:02 403888 18
>>403781
Спасибо! Это обнадёживает. А то не очень хочется связываться с этими новыми видеокартами, которые размером и мощностью сравнялись со стиральными машинами.
Аноним 15/07/23 Суб 22:21:02 403934 19
>>403561
>а даже то что вычищалось как нелегальный контент.
Например?
>>403781
>40 сек
>100% врама
Драйвера слишком новые, лол.
Аноним 16/07/23 Вск 00:53:42 404375 20
Здравствуйте ананасы, такая проблема - когда включаю openpose, падает качество и на генерации и на апскейле, как фиксить?
Аноним 16/07/23 Вск 02:06:40 404521 21
Аноним 16/07/23 Вск 02:34:52 404548 22
>>404521
>>403934
Я пробовал различные версии драйверов, торчей, куды, куднн, хформерсов и сравнивал их производительность.
В итоге максимальная производительность у меня получилась на связке драйвер 528.49, torch2.1.0+cu118, CUDA11.8, cuDNN8.8, xformers 0.0.21+cu118.
Что касаемо показателя Sys VRAM, то при использовании SDP cross-attention оптимизатора у меня он практически всегда показывает 8192/8192 вне зависимости от размера картинки. Хоть 512х512, хоть 2048х1024.
Аноним 17/07/23 Пнд 15:24:33 409396 23
Не пойму что за хрень, что не тренирую на выходе всё косоёбит. Сначала думал датасет говно, сделал всё отлично - то же самое. Дошёл до того, что скачал чужой датасет, с параметрами( там и джейсон прилагался) оттренил у себя - говно, а у чела всё нормально. Тот же эпох, те же повторения, всё то же.3060,3600 и 16 гб оперативы.
ЧЯДНТ?
Аноним 17/07/23 Пнд 17:53:46 410070 24
2023-07-1717-43[...].png 488Кб, 1736x492
1736x492
2023-07-1717-44[...].png 736Кб, 1736x816
1736x816
2023-07-1717-46[...].png 344Кб, 1904x944
1904x944
2023-07-1717-47[...].png 334Кб, 1896x976
1896x976
аноны, не уверен в тот ли тред с таким вопросом, но слезно умоляю помогите зеленому долбаебу. пару месяцев назад вполне успешно сделал модель аниме тянучки, сейчас решил попробовать сделать модель с неоновым стилем, но не нихуя получается. не вдупляю в чем собсна проблема, когда делал модель с тянучкой там уже с тысячи был неплохой результат, а тут какой-то лисий кал выходит, или при тренировки стиля так и должно быть?
Аноним 17/07/23 Пнд 20:58:28 410628 25
>>409396
>ЧЯДНТ?
Ищи проблему в железе или софте. Проверь стабильность оперативы под нагрузками, проверь версии ПО, торча, хформерс и прочего говна.
Аноним 18/07/23 Втр 01:21:32 411563 26
image.png 87Кб, 963x898
963x898
image.png 4Кб, 955x42
955x42
Давно не тыкался, сегодня обновился и вылезла проблема.
Инпеинтит почему-то слишком долго. Даже маленькое закрашенное пятнышко на условной пикче 1000х1500 гоняет 5 минут. Раньше это делалось точно намного быстрее, железо все то же.
Сталкивался кто-нибудь, есть идеи? Настройки пикрил.
Аноним 18/07/23 Втр 10:06:13 412352 27
>>410628
Спасибо, по ходу нашёл - дело в файле подкачки - он должен быть на одном диске.
Аноним 18/07/23 Втр 17:01:11 413186 28
>>400738
Ща релизнут SD XL, может он будет лучше.

Ящитаю, анклип как в миджорни - топчик.
Аноним 18/07/23 Втр 20:44:56 413635 29
Аноны, помогите!
Удалил несколько программ через прогу Reg Organizer с "чисткой следов". После этого при запуске webui user.bat появилась ошибка: py torch can not connect with GPU и Stable Diffusion не запускалась. Сделал восстановление системы, точка восстановления каким то чудом была только одна на 16:50 сегодня, откуда она взялась я в душе не ебу, кроме неё не было ничего. Восстановился - вроде все норм, работает. Но теперь заметил следующее в консоли:

A matching Triton is not available, some optimizations will not be enabled.
Error caught was: No module named 'triton'
D:\ai\stable-diffusion-webui\venv\lib\site-packages\pytorch_lightning\utilities\distributed.py:258: LightningDeprecationWarning: `pytorch_lightning.utilities.distributed.rank_zero_only` has been deprecated in v1.8.1 and will be removed in v2.0.0. You can import it from `pytorch_lightning.utilities` instead.
rank_zero_deprecation(
Model loaded in 5.4s (load weights from disk: 0.5s, create model: 0.6s, apply weights to model: 2.5s, apply half(): 0.5s, move model to device: 1.0s, calculate empty prompt: 0.1s).
D:\ai\stable-diffusion-webui\venv\lib\site-packages\torchvision\transforms\functional_tensor.py:5: UserWarning: The torchvision.transforms.functional_tensor module is deprecated in 0.15 and will be removed in 0.17. Please don't rely on it. You probably just need to use APIs in torchvision.transforms.functional or in torchvision.transforms.v2.functional.
warnings.warn(

Что это за хуйня разъясните пожалуйста.Что за Тритон? Что за ошибки с Pytorch? Что это все блядь? Я знаю тут есть знатоки, а я на уровне хлебушка в этих вопросах.
Аноним 18/07/23 Втр 21:15:42 413704 30
1625938458058.png 39Кб, 490x392
490x392
>>413635
тритон в винде не работает, остальное поебать если работает. если трясешься то можешь папку venv удалить, вебуй при след запуске все перекачает.
вроде бы 23 год на дворе, а люди до сих пор сиклинерами пользуются
Аноним 18/07/23 Втр 21:52:38 413805 31
>>413704
Ну спасибо блядь, снес venv он перекачал, теперь extensions не загружается и вся консоль в ошибках
Аноним 18/07/23 Втр 22:02:14 413847 32
>>413805
пости ошибки, хули
Аноним 18/07/23 Втр 22:42:50 413996 33
>>413847
Да иди ты нахуй, я чистую снова наверну чем теперь из-за тебя долбоеба с тысячей ошибок ебаться
Аноним 18/07/23 Втр 23:00:02 414060 34
>>413996
Здесь долбоеб-неосилятор только ты
Аноним 18/07/23 Втр 23:39:27 414179 35
>>413996
>мокрописькой поломал пути в копровинде
>поломал автоматик делолом венв
>виноваты все вокруг
Мегамозг наху
Аноним 19/07/23 Срд 00:34:56 414325 36
Clip2net2307190[...].jpg 966Кб, 1833x1080
1833x1080
Я видел когда-то в разделе мокропиську для соревновательной сортировки пикч. Ну то есть если нагенерили 100 штук, чтобы сравнить их и оставить парочку.
Я ее не смог найти, поэтому написал свой велосипед:
https://pastebin.com/5bKfqgyw
Из зависимостей только pip install PyQt5 и pip install Pillow
Кто не умеет в питон, я скомпилил 7 килобайт кода в 57 мегабайт экзешника, наслаждайтесь (должно работать вообще без питона): https://pixeldrain.com/u/rBbu6EET

Вызов либо через командную строку, python batch_sorter.py f:\iloveass
Либо если без пути запустите, то оно спросит
По пути создаст папку discarded
В окне нажимете (на клавиатуре) левую стрелку, чтобы скинуть в discarded левую пикчу.
Правую стрелку наоборот соответственно.
Вверх - скипаются и остаются обе
Вниз - скидываются в discarded обе
Вместо стрелок можно использовать класскический WASD
Кнопки в интерфейсе не стал пилить, ну их нахуй.

Оно закончит, когда останется две пикчи. Либо когда вы окно закроете. Файлы перемещаются сразу по нажатию кнокпи на клаве. Не в конце процесса.

В консоли будет дудосить ошибками
QWindowsWindow::setGeometry: Unable to set geometry
Не обращайте внимания, мне просто лень чинить.
Аноним 19/07/23 Срд 00:37:08 414327 37
>>414325
А, еще посмотрел вашу шапку и увидел мокрописьки для ресайза
Но они все проигрывают в удобстве этой, как мне кажется:
https://www.birme.net/

Может ее стоит тоже туда хуйнуть, датасеты кропать самое оно.
Аноним 19/07/23 Срд 02:01:12 414426 38
>>413805
А нахуя полностью удалял? Я переименовываю всегда, можно было бы откатится.
Аноним 19/07/23 Срд 15:31:54 415274 39
Лороделы, можно вам реквест? Несложная наверно лора, чтобы рисовала море/океан крови/LCL. Анимушные модели, что пробовал, по промпту упорно рисуют обычную воду с несколькими лужами крови, либо перса заливают кровищей. Каноничную сцену из EoE не воссоздать, на циве не нашел ничего подходящего.
Аноним 20/07/23 Чтв 02:44:22 417389 40
16-bitanimegirl[...].png 396Кб, 1024x1024
1024x1024
Не знаю где именно спросить, спрошу тут.

Генерирую пиксель арты, если смотреть издалека и один глаз закрыть, то результат вроде бы ничего, похоже на правду.

Но на самом деле много грязи в изображении, квадраты (якобы пиксели) разных размеров, аутлайны плохие. Фиксить каждый пиксель руками - заебешься насмерть, мне быстрее с нуля нарисовать самому.

Возможна ли модель которая получив на вход пикрелейтед, преобразует его в близкое к pixel perfect?

Фильтр ближайший сосед не предлагать!
Аноним 20/07/23 Чтв 03:03:57 417415 41
1572029907621.png 139Кб, 3010x1920
3010x1920
>>417389
> Фильтр ближайший сосед не предлагать!
Чего так? Если совместить одно с другим то как раз починит, тут скорее не нейронка а просто численных алгоритм нужен, скрипты фотожопа есть. Изначально генерацию делай с аутлайном но без стремления получить идеальную пикселизацию, а ее организовывай уже потом.
Аноним 20/07/23 Чтв 04:12:12 417491 42
>>417415
>Чего так?

Когда я даунскейлю картинку до четкой пиксельной сетки 1 "квардратик" генерации = 1 реальный пиксель то хорошо получается только там где квадраты большие и четкие, и там где они выровнены по сетке.

А выровнять по сетке всю картинку не получается, потому что в разных местах квадраты разного размера и формы. И поэтому картинка превращается в кашу.

При этом глазами-то я вижу где какой пиксель должен быть, вот думаю значит и нейрон очка тоже сможет.
Аноним 20/07/23 Чтв 04:22:38 417502 43
ezgif.com-gif-m[...].gif 242Кб, 1024x1024
1024x1024
>>417491
Вот так получается, не слишком уж хорошо.
Аноним 20/07/23 Чтв 08:07:48 417592 44
Кто-нибудь в курсе, как это чинить после обновления?

raise RuntimeError("Cannot add middleware after an application has started")
RuntimeError: Cannot add middleware after an application has started
Аноним 20/07/23 Чтв 10:23:44 417733 45
срань.PNG 47Кб, 945x477
945x477
Это что за срань? начало вылезать просто нисхуя, в гугле ноль упоминаний
Аноним 20/07/23 Чтв 10:28:59 417741 46
>>417733
само прошло, так же нисхуя
Аноним 20/07/23 Чтв 10:40:44 417764 47
Аноним 20/07/23 Чтв 10:50:48 417776 48
Подскажите модель для рисования пейзажей разных психоделических, хочу себе наклепать для обоев на рабочий стол.
Аноним 20/07/23 Чтв 12:43:04 417997 49
Есть аноны с амд карточками с линуксом? Насколько там сильно разница в скорости генерации по сравнению с виндой? На винде, на моей 6700xt на одну картинку уходит в среднем 20-40 секунд.
Аноним 20/07/23 Чтв 13:54:42 418181 50
>>417997
> На винде, на моей 6700xt на одну картинку уходит в среднем 20-40 секунд.
Не указывая размер картинки, семплер и количество шагов твоя информация абсолютно бесполезна.
Аноним 20/07/23 Чтв 16:12:52 418621 51
>>417491
Посмотри внимательно, исходная пикча не должна быть столь сильно пикселизованной если эта пикселизация поломана, тогда по ближайшим сработает уже нормально. Также палитру скорректировать в любом случае придется или заставить нейросеть изначально сделает плоские цвета. У тебя в той пикче не смотря на закос под пиксельарт есть полутона между пикселями, потому ресайз туда-собратно и ломает аутлайн, попадая не серые участки вместо черных, и сам аутлайн тонкий из-за чего при уменьшении он может потеряться.
Та пикча изначально обычная но с жирным лайном и "пиксельарт" сделан в фотожопе.
Аноним 20/07/23 Чтв 16:19:17 418632 52
>>417491
Попробуй вместо VAE использовать ApproxVAE, будет в 8 раз меньше разрешение, без попыток автоэнкодера убрать пиксели.
Аноним 20/07/23 Чтв 19:17:30 419199 53
>>415274
У тебя карта не тянет? Ну хочешь- кидай датасет с описаниями. Я у себя создам лору. Параметры тоже лучше скинь/спроси у кого-то
Аноним 20/07/23 Чтв 21:13:53 419549 54
image.png 302Кб, 1914x1131
1914x1131
Бля да че оно такой хеловворд сгенерить не может-то?
Аноним 20/07/23 Чтв 21:20:38 419574 55
image.png 1544Кб, 2528x1261
2528x1261
image.png 1610Кб, 2535x1267
2535x1267
Хачмодель 4/10, дримшейпер 9/10
Везде насрало фиолетовым, где не надо, хотя через запятую
Аноним 20/07/23 Чтв 21:38:43 419641 56
>>419549
>>419574
Чел... Вроде обмазался плагинами (сборочку поставил что ли?), но базы понимания работы нейросетей это не прибавило.
Аноним 20/07/23 Чтв 22:07:14 419767 57
Аноним 20/07/23 Чтв 22:19:56 419817 58
>>419641
Нет, отдельно ставил. Нету.
>>419767
Ебаться с инпейнтом для такого хеловворда? Пиздец просто
Аноним 20/07/23 Чтв 22:31:18 419859 59
изображение.png 1111Кб, 3839x1882
3839x1882
>>419817
>Пиздец просто
А хули ты хотел? Это не ИИ нихрена.
В принципе, можно чуть потвикать и нароллить, но лучше инпейнт, ибо сетке сложно понять, что к чему, особенно по такому короткому промту.
Аноним 20/07/23 Чтв 23:36:03 420199 60
поебался с invoke ai (sd без фильтров) а потом подчитал в середине гайда, что он не встает на амд карты на шиновсе

ппц так обидно

есть обходные пути этой херни, или идти в магазин за видимокартой, чтоб ии прон посмотреть?

спасибо, аноны, заранее

сам полный хуй и лох, хочется посмотреть голых девок, показать другим
Аноним 21/07/23 Птн 00:48:57 420478 61
>>420199
>sd без фильтров
Чаво? Юзай автоматика, как и все тут. Он вроде кое-как дружит с радевонью.
>>420199
>или идти в магазин за видимокартой
Да, самый беспроблемный вариант. Минимум 12ГБ врама, лучше сразу 24, и будешь перед всеми козырять классными картинками.
Аноним 21/07/23 Птн 01:14:50 420579 62
>>418181
512x512, Euler a, 20 шагов
Аноним 21/07/23 Птн 02:09:54 420725 63
>>420579
Совсем лажа, смотри мой пик выше >>419859
3080Ti-боярин.
Аноним 21/07/23 Птн 08:52:48 421148 64
>>419574
> Хачмодель
Еблан.
>>420199
> показать другим
Другие ведь никогда голых девок не видели, а тут такой ты с двух ног со своими шедеврами.
Аноним 21/07/23 Птн 10:58:15 421355 65
Аноны, решил потренировать Лору, скачал гуи, всё тренеруется, работает, но татуировку персонажа понять не может, хоть она и просто ромб. Рисует всё под ряд, и в линии меняет, и даже квадрат сделать не может.
Аноним 21/07/23 Птн 11:03:44 421372 66
>>421355
Дохуя хочешь, геометрические татухи без дополнительных костылей работать не будут.
Аноним 21/07/23 Птн 11:50:50 421481 67
>>421372
А какие костыли нужны? Я так то натренировал, и даже работает, но оверфитит модель, или зажаривает, попробовал конвертнуть в дим 8 но лучше не стало особо. Или этих костылей ещё не придумали?
Аноним 21/07/23 Птн 11:52:59 421488 68
>>421481
Тренируй лайкорисы, они лучше для этих целей подходят
Аноним 21/07/23 Птн 12:04:17 421522 69
1615406081458.jpg 56Кб, 720x720
720x720
>>421488
>1488
Спасибо, буду пробовать.
Аноним 21/07/23 Птн 13:44:20 421738 70
.jpg 422Кб, 1536x2304
1536x2304
>>419549
{{white | black}} cat with purple eyes
Аноним 21/07/23 Птн 14:34:24 421856 71
2 карты кто-то пробовал задействовать?
Аноним 21/07/23 Птн 15:03:52 421944 72
>>419817
>Ебаться с инпейнтом для такого хеловворда? Пиздец просто
Ну а нахуй ты в фотожопе со слоями ебешься? Или в 3дмоделерах с полигонами? Ебать говно ниудобна! Это блядь азы работы с программой, прости, ебаный кусок говна, что она устроена не так, как ты хотел. Сделай блядь лучше или забей пасть.

>>421738
Хуйня. Кот у тебя не белый. Этот дрочь в принципе не нужен, когда сенд ту инпейт и сменить цвет глаз это 3 секунды.
Аноним 21/07/23 Птн 15:40:17 422024 73
>>421944
да не трясись ты так
Аноним 21/07/23 Птн 17:01:08 422148 74
>>422024
Я сказал хуйня. Зачем ты споришь, блядь? Обязательно надо последнее слово сказать? Как бабе? Ты баба?
Аноним 21/07/23 Птн 17:07:08 422160 75
База треда: СД котика сгенерить не может.
Аноним 21/07/23 Птн 17:40:46 422210 76
Что вы тряску на ровном месте развели, какой-нибудь white cat with purple eyes должно сразу все сделать, если будет мешаться то использовать негативы.
Аноним 21/07/23 Птн 18:32:31 422357 77
image.png 108Кб, 748x416
748x416
>>422160
Соси. Негатива нет. Миллиарда присетов как у Мочи Жоры тоже нет.

>>422148
Ты прав.
Аноним 21/07/23 Птн 20:30:13 422722 78
>>422357
Что и требовалось доказать...
Тряска - есть, нормального котика - нету.
Аноним 21/07/23 Птн 21:05:16 422807 79
>>422722
Чем тебя этот не устраивает, мразь? Ты скаал не может - я показал что может.
Аноним 21/07/23 Птн 22:59:48 422991 80
image.png 73Кб, 220x220
220x220
>>422807
>может
Ебало дифузировали?
Аноним 21/07/23 Птн 23:51:47 423127 81
> Технотред №1
> Крутим веса моделей, срёмся за тензоры, пишем гайды, организуем помойки для моделей

> Технотред №11
> Пытаемся сгенерировать кота

Технотред. Итоги.
Аноним 22/07/23 Суб 02:16:27 423401 82
Аноны с АМД на линуксе как у вас работает hires fix? На моей 6700xt на 512x1024, модель Rev animated, сэмплер DPM++ 2M Karras, 30 шагов, upscale by: 2 генерация занимает минуты 3-4, при этом в конце генерации на 100% прогресса система начинает лагать сильно. Я так понял что это происходит из-за нехватки видеопамяти? Думал на линуксе с этим будет получше, чем на винде.
Аноним 22/07/23 Суб 11:58:48 423818 83
>>423401
> upscale by: 2
> генерация занимает минуты 3-4
Зачем так унижаешься перед Хуангом? У нормальных людей это 5 секунд.
Аноним 22/07/23 Суб 12:03:29 423821 84
>>422160
> База треда: СД котика сгенерить не может.
Хуйню несёшь. Ещё полгода назад генерил охуенных мэйнкунов.
Аноним 22/07/23 Суб 12:14:46 423837 85
1690017285321.png 370Кб, 512x512
512x512
1690017285336.jpg 74Кб, 840x704
840x704
>>423401
> На моей 6700xt на 512x1024, модель Rev animated, сэмплер DPM++ 2M Karras, 30 шагов, upscale by: 2 генерация занимает минуты 3-4

Не верю. Покажи скрин.
Аноним 22/07/23 Суб 12:47:26 423874 86
.png 3395Кб, 2048x1152
2048x1152
>>423401
> На моей 6700xt на 512x1024, модель Rev animated, сэмплер DPM++ 2M Karras, 30 шагов, upscale by: 2 генерация занимает минуты 3-4
Ха-ха, амудебляди соснули
Аноним 22/07/23 Суб 14:38:43 424038 87
3133.png 273Кб, 1832x873
1832x873
>>423837
C hires steps 15 генерация заняла почти 2 минуты.
Аноним 22/07/23 Суб 15:25:53 424119 88
>>424038
512х512, Euler A, 150 шагов, без хайрезфикса, сколько it/s?
Аноним 22/07/23 Суб 15:39:19 424142 89
3135.png 228Кб, 1799x891
1799x891
>>424119
5.66 c включенным --medvram
Аноним 22/07/23 Суб 15:40:25 424144 90
Аноним 22/07/23 Суб 15:52:43 424171 91
Аноним 22/07/23 Суб 18:25:54 424506 92
давайте соберем перечень слов, с которыми возможно делать пикчи более "восточными" (проще говоря, убрать клише и образы западной культуры). Я пользуюсь вот этими, в произвольных сочетаниях в конце каждого промпта:

oriental
eastern
therawada
mahayana
arabic
arabesque
ottoman
hindu
mughal
tantra
spicy
persian
achaemenid
babylonian
tao
sanscrit
islamic
sunnah
ramadan
wuxia
tang
ming
qing
thai
burmese
Аноним 22/07/23 Суб 19:09:22 424615 93
>>421522
Короче пока особой разницы не заметил, я правда Дадаптэйшном фигачил, хз какой крутой лёрн рейт для ликоризов.
Аноним 23/07/23 Вск 00:45:27 425216 94
Аноним 23/07/23 Вск 00:47:16 425219 95
>>425216
Майнеры распродают, вот тут ответы к посту смотри, все пояснено >>404177 →
Аноним 23/07/23 Вск 00:50:05 425223 96
>>425219
Понял, спасибо. Ну, майнеры и майнеры, похуй, лишь бы работала
Аноним 23/07/23 Вск 01:25:22 425266 97
>>425223
> Ну, майнеры и майнеры, похуй, лишь бы работала
Это как машину после таксиста брать.
Аноним 23/07/23 Вск 21:36:06 426468 98
>>425266
Лучше из таксу но нормальную иномарку, чем сосквич 3 из салуна.
Аноним 24/07/23 Пнд 01:13:33 426756 99
CxLzdWWnGoU.jpg 2Кб, 89x73
89x73
fOdVZCfXCZA.jpg 72Кб, 1131x807
1131x807
Как из пика 1 сделать пик 2? Получается только простой апскейл без доработанных частиц
Аноним 24/07/23 Пнд 01:24:14 426768 100
M6tXBjLCTQ.jpg 61Кб, 1000x1000
1000x1000
>>426756
Максимум такое выходило
Аноним 24/07/23 Пнд 04:14:33 426850 101
>>399707 (OP)

Почему какой-то кореец написал прогу для генерации картинок на своем компе для ламеров (kohya_ss), но не нашлось другого корейца, который бы написал такую же программу генерации картинок для ламеров, но через Google Colab? Ну, если слово "программа" понимть максимально широко. То есть почему никто до сих пор не сделал нотбук на колабе, где нужно было поправить руками пару параметров и запустить одну ячечку, чтобы прога генерила изображение, используя мощности Гугла? Можно настроить Колаб так, чтобы он регулярно, после каждой эпохи например, сохранял на гугл.диск обученную модель. Ну да, боярам, у которых видюхи на ПК лучше тех, что дают бесплатно в колабе, использовать колаб тупо не удобно. Но кому в кайф сидеть без компа Х часов? Не понимаю
Аноним 24/07/23 Пнд 05:08:17 426860 102
>>426850
А, лол. Только сейчас дочитал шапку до того момента, где есть ссылки на колабы
Аноним 24/07/23 Пнд 15:21:07 427279 103
image.png 374Кб, 624x512
624x512
>>426756
Берёшь и делаешь, без задней мысли. Контролнет. Тайл.
Аноним 24/07/23 Пнд 16:49:20 427374 104
>>399707 (OP)
Как бесплатно улучшить картинку? есть немноо блюеренный скрин с ютуба, хочу обдагородить дял обои
Аноним 24/07/23 Пнд 19:49:03 427560 105
>>399707 (OP)
После запуска скрипта из этого гайда
https://rentry.org/2chAI_LoRA_Dreambooth_guide
начинает бешено сжираться ssd, изначально свободно 30 гб, в консоли доходит до .. epoch 1/10, далее съедает все до конца
OSError: [WinError 1455] Файл подкачки слишком мал для завершения операции. Error loading "C:\Users\user\git\sd-scripts\venv\lib\site-packages\torch\lib\shm.dll" or one of its dependencies.
Чзх, почему скрипт так сильно использует SSD, сколько должно быть свободного места?
Аноним 24/07/23 Пнд 20:09:31 427572 106
>>427560
30 оказалось впритык, надо было чуть больше, и заработало.
Аноним 25/07/23 Втр 06:36:22 428228 107
На сивите вижу некоторых модели в двух вариантах - обычый и inpainting.

В чем там технические отличия, почему обычная модель не может делать инпейнт?
Аноним 25/07/23 Втр 06:43:09 428230 108
Еще объясните пожалуйста софтварные термины, а то стек софтварный просто огромен и тяжело ориентироваться.


Что такое пайторч? Чем оно отличается от либторч? Что такое tensorflow и keras? diffusers, transformers итд.

Везде написано что это "библиотеки/фреймворки для машинного обучения", но не понимаю чем они отличаются.
Аноним 25/07/23 Втр 06:45:37 428232 109
И если сможете, просяните весь процесс от "пишу промт" до "смотрю картинку"
Аноним 25/07/23 Втр 08:42:34 428270 110
>>428232
Пишешь промпт, нажимаешь Generate, смотришь картинку.
В интернетах уже есть десятки статей, в которых по винтику разбирают внутреннее устройство stable diffusion.
Аноним 27/07/23 Чтв 14:15:10 431122 111
Аноны, помогите, https://github.com/kohya-ss/sd-scripts/pull/271
Как передать через скрипт анона несколько параметров --lr_scheduler_args?
если один то всё нормально
$run_parameters += " --lr_scheduler_type=$scheduler --lr_scheduler_args=T_max=$T_max"
А если передаю хотя бы 2, то ошибки выдаёт.
Аноним 27/07/23 Чтв 14:19:06 431131 112
>>431122
Какие ошибки выдаёт?
Аноним 27/07/23 Чтв 14:20:12 431132 113
1650866226860.png 25Кб, 1067x256
1067x256
>>431122
Я пикрилейтед делаю. Вообще оно кривущее говно без документации.
Аноним 27/07/23 Чтв 14:36:49 431152 114
Тренил кто LoHA/LoKR, есть к ним какие нибудь удачные основные параметры? Лоха вообще какая то не понятная, полная чушь на рангах ниже 30, локр подаёт больше надежд, несмотря на свои размеры файла в 2.5 мб, но и стиль и персонажа не до конца запоминает, в отличии от локона.

>>431122
--lr_scheduler_args "T_0=400" "gamma_min_lr=0.99945" "decay=1" "down_factor=0.5" "warmup_steps=80" "cycle_warmup=40" "init_lr_ground=True"
Примерно так, просто равно убери
Аноним 27/07/23 Чтв 15:09:05 431181 115
image.png 457Кб, 512x704
512x704
Как ускорить время генерации в коллабе? Генерю без лор, картинку 512x704 генерирует 40 секунд нахуй, пиздец. А раньше вроде быстро было.
Вот еще данные, не знаю что они значат A: 3.93 GB, R: 5.90 GB, Sys: 6.1/14.748 GB (41.1%)
Аноним 27/07/23 Чтв 15:10:33 431183 116
А сейчас вот 16 секунд генерило... От чего это зависит?
Аноним 27/07/23 Чтв 15:11:44 431184 117
>>431152
Чел, это сделано для шизов, экономящих 50 мб места на диске. Они всегда будут хуже обычной лоры. Более того, и локон не обязательно лучше выдаст результат чем лора, с ним надо больше тонкой настройки. Все они дают лучше результат при одинаковых размерах файла или на низком ранге, но если тебе похуй на размер файла, то ванильная лора с 32/64/128 рангом выебет их. А ещё локоны очень плохо работают в паре с другими локонами, лору так никогда не запидорасит.
Если не знаешь что делаешь, есть всегда топовый вариант - DyLora. Шизы будут кричать РЯЯЯ ТЫ НЕ МОЖЕШЬ ВЗЯТЬ ДИЛОРУ РАЗМЕРОМ В 300 МБ И ПРОСТО НАТРЕНИРОВАТЬ ЕЁ, но по факту она будет ебать все эти локоны и при этом шанс получить кашу минимальный, а бонусом она просто работает у всех из коробки.
Аноним 27/07/23 Чтв 15:15:02 431186 118
>>431183
От нагрузки на сервера коллаба
Аноним 27/07/23 Чтв 15:43:58 431208 119
>>431184
> А ещё локоны очень плохо работают в паре с другими локонами, лору так никогда не запидорасит.
Примеры таких локонов есть? Сколько не подрубал по несколько, обычно всё нормально получалось, на больших весах чем с обычными лорами, которые как раз очень просто пидорасит, если подключать несколько.
> Шизы будут кричать РЯЯЯ ТЫ НЕ МОЖЕШЬ ВЗЯТЬ ДИЛОРУ РАЗМЕРОМ В 300 МБ И ПРОСТО НАТРЕНИРОВАТЬ ЕЁ, но по факту она будет ебать все эти локоны и при этом шанс получить кашу минимальный, а бонусом она просто работает у всех из коробки.
Ты хочешь сказать что 256 ранг обычной дилоры будет лучше например дилоры с 128+128 ранг слоёв локона? Ведь только так получится 300мб файл. Да и к чему ты вообще про ёбку локонов, это же просто дополнительные слои для любого из методов, дающие нихуёвый буст к тренировкам стилей, да и пережарить с ними сложнее. Мне как концепт то дилора нравится, сразу несколько рангов в одной модели, вот только её тренить заебёшься по времени да и лр там нужен куда больше.
Аноним 27/07/23 Чтв 16:02:04 431238 120
>>431208
> Ведь только так получится 300мб файл.
У дилоры на ранге 128 файл 300 мб. Вообще тренировка лоры на больших датасетах совсем не то что тренировать персонажа на 50 пикчах. Персонажа или стиль действительно хоть на чём можно на похуе сделать.
> просто дополнительные слои
Которые очень легко ломаются оверфитом и ты не можешь это контролировать вообще никак в отрыве от тренировки остального. В лоре не просто так их выкинули. Файнтюн - это не тоже самое что тренировка с нуля.
> по времени
Всего раза в два.
Аноним 27/07/23 Чтв 16:24:15 431277 121
image.png 21Кб, 405x268
405x268
>>431152
Спасибо, действительно всё дело было в = сразу после lr_scheduler_args. Причём я его добавил потому что изначально без него не работало. Короче весь день копался даже в коде, а в итоге ларчик-то просто открывался.
Если кому интересно, вот что нужно написать для кривой как на пикриле:
$run_parameters += " --lr_scheduler_type=$scheduler --lr_scheduler_args T_0=$T_0 T_mult=$T_mult eta_min=$eta_min "
Аноним 27/07/23 Чтв 16:25:58 431281 122
Аноним 27/07/23 Чтв 16:29:43 431291 123
>>431122
> через скрипт анона несколько параметров --lr_scheduler_args?
Это какой?
Вообще все также как и с аргументами оптимайзера, вечером могу пример скинуть, только ты укажи полные параметры что пускаешь чтобы проверить как работает.
>>431152
> несмотря на свои размеры файла в 2.5 мб, но и стиль и персонажа не до конца запоминает, в отличии от локона.
Концепты не пробовал тренить?
>>431184
> для шизов, экономящих 50 мб места на диске
Поддвачну, хотя есть нюансы, обучение идет по-разному
> А ещё локоны очень плохо работают в паре с другими локонами, лору так никогда не запидорасит
Индвидуально что там что там
> есть всегда топовый вариант - DyLora
Показывай примеры
Аноним 27/07/23 Чтв 16:47:23 431329 124
>>431238
> У дилоры на ранге 128 файл 300 мб.
У меня точно такой же размер получился с добавлением 128 ранга локона.
> Вообще тренировка лоры на больших датасетах совсем не то что тренировать персонажа на 50 пикчах. Персонажа или стиль действительно хоть на чём можно на похуе сделать.
Да я понимаю, что с большими датасетами уже и грамотная сегментация нужна с отфильтровкой и тегать придётся более тщательно. Вот только лора как раз и существует для чего то более простого, чтобы на похуях сделать не нагруженную кучей концептов модель.
> Которые очень легко ломаются оверфитом и ты не можешь это контролировать вообще никак в отрыве от тренировки остального
Опять же сколько не пытался перетренировать до жути, с локоном намного сложнее это сделать.
> В лоре не просто так их выкинули. Файнтюн - это не тоже самое что тренировка с нуля.
А зря как по мне, с ними лучше получается. Вот только лора вообще из трансформеров насколько я помню пришла, и видимо лучшей практики использования здесь и не было. А с нуля тренить это вообще не про лоры, тут уже и реги понадобятся ведь.
> Всего раза в два.
В два раза тут, в два раза там, в 3-4 раза от XL и вот уже аниме девочка запекается полтора часа на 4090.

>>431277
>>431281
Кстати где то вот тут есть чуть более интересная версия этого шедулера >>342124 →

>>431291
> Концепты не пробовал тренить?
Тебе опять хвосты важнее? Я поинтереснее вещь нашёл для концептов, вот думаю попробовать на чём нибудь https://github.com/p1atdev/LECO
Аноним 27/07/23 Чтв 16:53:23 431335 125
>>431329
> https://github.com/p1atdev/LECO
> erasing
Забавно, ну и реализация с весом -1 показательная. Интересно как оно будет работать если чего-то изначально не было?
> опять
Always has been, но другого интереса не отменяет.
Там кстати некоторые результаты есть, думаю еще поиграюсь с параметрами и отпишу.
Аноним 27/07/23 Чтв 16:56:15 431339 126
>>431329
> лора как раз и существует для чего то более простого, чтобы на похуях сделать не нагруженную кучей концептов модель
С лорой можно датасет разбить на категории, а потом каждую тонко примержить по слоям. Литералли с одного захода делается если автотегер нормальный, в отличи от полноценного файнтюна, когда хуяк и всё запорото.
Аноним 27/07/23 Чтв 17:00:47 431343 127
>>431238
> У дилоры на ранге 128 файл 300 мб
>>431329
> точно такой же размер получился с добавлением 128 ранга локона
Очевидно что удвоенная величина будет почти равна сумме ее с рядом младших степеней двойки
>>431238
> тренировка лоры на больших датасетах
Для чего это делаешь и что хочешь получить?
Аноним 28/07/23 Птн 21:30:06 432853 128
>>431343
> Очевидно что удвоенная величина будет почти равна сумме ее с рядом младших степеней двойки
Ты про 128+64+32...? Энивей это
> > У дилоры на ранге 128 файл 300 мб
Пиздёжь, я проверил без конв слоёв, чисто ради теста одну эпохе с одним параметром unit кохьевской реализации, она весит как и обычная с 128 рангом.

>>431339
> С лорой можно датасет разбить на категории, а потом каждую тонко примержить по слоям.
Слои искать затронутые ведь тоже долгое занятие.
Аноним 29/07/23 Суб 02:13:51 433215 129
Кто-нибудь может помочь по этому вопросу? Как сами чинили? >>433206 →
Аноним 29/07/23 Суб 15:02:39 433869 130
Обучил лору для SDXLчерез Kohya-ss gui, на 128 dim получил файл ~800Мб против ~140Мб для SD 1.5 при тренировке скриптами онли.

Я что-то сделал не так? Для gui нужны дополнительные шаг чтобы уменьшить вес или это SDXL виноват?
Аноним 29/07/23 Суб 23:01:29 434570 131
>>433869
Для SDXL это норма.
Можешь уменьшить там же в гуе, или через консоль. Сделай несколько штук 64/32/16/8 и выбери какая устроит. На цивитае вообще лоры на SDXL выкладывают в Dim 256 по 1.7 гига.
Аноним 29/07/23 Суб 23:10:00 434582 132
>>434570
Да я то уменьшил.. Хотя надо попробовать еще сжать. Просто думал что-то упускаю.
А лоры в гигабайтах это пиздец
Аноним 30/07/23 Вск 22:47:32 436125 133
Кто успешно для XL лоры тренил скажите свои настройки.
У меня хрень странная, если выбираю размер 768 то результат весьма неплох, если с точно такими же настройками обучаю уже на 1024 то какая-то говнина полная выходит.

>>433869
У ХЛ же параметров больше раза в 3, соответственно и лора будет тяжелее. Но и слоев ей надо меньше для схожих результатов. На 1.5 у меня локон на 64\32 а на хл уже хватает 16\8.
Аноним 30/07/23 Вск 23:12:07 436167 134
>>436125
> слоев
Ранг лоры - это не количество слоёв. У лоры всегда фиксированное количество слоёв. Если специально не отключал тренировку конкретных.
> хватает
Потому что 1.5 и XL должны с разными lr тренироваться. Ты отсюда можешь сделать вывод лишь о том что на 1.5 у тебя проёб по lr.
Аноним 30/07/23 Вск 23:24:14 436185 135
>>436167
>Ранг лоры - это не количество слоёв
А что тогда этот dim означает?

>на 1.5 у тебя проёб по lr.
Получается у меня и 96% гайдов. Как фиксить?
Аноним 30/07/23 Вск 23:39:53 436211 136
>>436185
> 96% гайдов
Все эти гайды писались шизами, тренирующих персонажей на 30 пиках с диким lr до оверфита и потом ставящих вес 0.4 для лоры. Естественно таких слушать не стоит. Если они получили хоть какой-то результат это ещё ничего не значит, обезьяна тоже может палкой постучать и что-то получится.
Аноним 30/07/23 Вск 23:53:43 436233 137
Аноним 31/07/23 Пнд 00:32:59 436280 138
>>436125
Запустил обучение лоры для SDXL на тех же настройках и датасете что и для SD1.5, все завелось нормально.
Получил лору 128dim в 800Mb, там же в кохе ужал по 128dim на дефолтных настройках и получил 180Mb
Аноним 31/07/23 Пнд 01:04:16 436311 139
>>436167
> Если специально не отключал тренировку конкретных.
Оно же просто тогда зануляться будет, не? И как отключить обучение конкретных (кроме клипа офк), про послойное применение только слышал.
>>436185
> что тогда этот dim означает
Когда тренишь модель у тебя подбираются значения огромной матрицы, которая описывает веса взаимодействий между нейронами, если упрощенно описывать. Эта веса - основной объем модели. Лора - тренировка нескольких матриц с размером dim x исходная размерность, которые при перемножении друг на друга дадут полную матрицу. Офк это сжатие с потерями, но для типичных задач с учетом особенностей работы нейронки работает хорошо, в ней хранится не сами веса а смещения к ним для получения нужного.
>>436211
Поведай как надо
Аноним 31/07/23 Пнд 10:57:11 436578 140
на 12G vram можно лоры для SDXL обучать? или не хватит?
Аноним 31/07/23 Пнд 12:16:26 436660 141
Аноним 31/07/23 Пнд 13:05:03 436706 142
>>436660
ну и как, нравиться то что получается? ты тестил свои датасеты 1.5 vs XL ?
Аноним 31/07/23 Пнд 13:19:34 436730 143
03170-268741466[...].jpg 309Кб, 1024x1024
1024x1024
>>436706
Я ток 2 дня назад это обнаружил, пока что тестирую. На 768 результаты довольно неплохи, на 1024 хуже и явно видно что надо настройки крутить.
Пока что тестирую тот же датасет который использовал для 1.5, для 1024 его пропустил через самый удачный апскейлер.
Аноним 31/07/23 Пнд 21:32:47 437934 144
Как можно заставить SD запомнить информацию из одной картинки при генерации второй? Допустим на пикче есть лицо, я хочу сгенерировать вторую пикчу но контролнетом изменить позу персонажа при этом сохранив лицо в целом, или сгенерировать ему такие же ботинки, это можно как-то сделать? Вроде txt2vid умеет что-то подобное.
Аноним 31/07/23 Пнд 22:10:19 438031 145
Тот момент, когда тренируешь лору и в датасете есть голый персонаж, но стоит написать в промте Топлесс или no bra и вероятность увидеть грудь становится 1 к 10 :(
Опять переделывать датасет..
Аноним 31/07/23 Пнд 22:17:15 438056 146
>>438031
Так тегай нормально, а не всяким говном типа файнтюнов BLIP. В описании должно быть нормально прописано что происходит, а не просто бессвязная гора кривых тегов.
Аноним 31/07/23 Пнд 22:20:18 438064 147
>>438056
Я таггером тэгаю, все нормально. Надо добавить артов
Аноним 31/07/23 Пнд 22:20:44 438065 148
SD можно запустить на видюхе без актуальной куды, или в таком случае только проц?
Аноним 31/07/23 Пнд 22:30:50 438082 149
>>437934
- Roop
- img2img inpainting / sketch

>>438065
не актуальная это какая? люди на 1070 генерят нормально, у самого дрова 528
Аноним 31/07/23 Пнд 23:17:26 438189 150
>>438064
> таггером
Так ты бы хоть нормальную мультимодалку взял, а не непонятный кал от васянов-анимешников.
Аноним 31/07/23 Пнд 23:32:10 438212 151
Аноним 01/08/23 Втр 12:06:39 438795 152
Аноним 01/08/23 Втр 12:37:26 438837 153
image.png 424Кб, 850x850
850x850
А в чём проблема взять парочку Квадр прошлых поколений и запилить на них кластер для вайф? Их специально делали под вычисления, они дешевле, у них много памяти при относительно низкой цене.
На них софт что-ли не пишут?
Аноним 01/08/23 Втр 12:42:46 438839 154
>>438795
Окей, но его надо тренировать. Есть ли готовые модели?
Аноним 01/08/23 Втр 12:43:45 438840 155
>>438837
У них много памяти, но чип говно. Плюс пока с поддержкой нескольких карт все довольно плохо
Аноним 01/08/23 Втр 12:55:20 438851 156
>>438837
Чел вроде пробовал паскали - работает, но перфоманс слабоват. Что-то новее дороже условной 3090, если найдешь хороший вариант то вполне тема.
Аноним 01/08/23 Втр 20:32:56 439629 157
Приветствую, возможно не в тот тред пишу, перенаправьте если не прав.

Пишу нейронку, LTSM, ее цель - смотреть на текущую свечу и определять, пойдет ли цена вверх или вниз. Столкнулся со следующими проблемами: при трех - пяти слоях (по 10-100 нейронов в каждом) и 70.000 строк для обучения, выходит 51%-55% accuracy, при таком же количестве слоев и нейронов, но с примерно 300 строчками, получается 65%. Пробовал делать датасет еще больше: 500.000 строк и 14 параметров (против 70.000 и 5), accuracy падает до 53%, но более стабильна в процессе обучения. При большей дате пробовал делать больше слоев и нейронов (максимум - 5 слоев по 1024 нейрона), но чем больше становилась сетка, тем хуже результаты.
Скажите пожалуйста, что я делаю не так? Неужели надо тренировать нейронку на очень малом датасете? Может просто ебануть 100500 нейронов и слоев и молиться пока оно три дня обучается?
Аноним 01/08/23 Втр 20:44:10 439642 158
>>439629
>LTSM
Вот это. Сетки для трейдинга смотрят на прошлое, как и индикаторы теханала.
И асло это тред про картиночки
Аноним 01/08/23 Втр 20:48:16 439648 159
>>439642
Можешь пояснить подробнее в чем проблема? LTSM вроде для этого используют + я скармливал для тренировки достаточно много данных, 4 года вроде как.

И если есть специальный тред для того что я пишу - перешли пожалуйста, я не нашел
Аноним 01/08/23 Втр 20:53:11 439653 160
Аноним 01/08/23 Втр 20:54:48 439654 161
>>439648
Дело в том, LSTM учится по прошлым данным прогнозировать следующие данные. Для рынка это все равно что индикатор, типа EMA. Она не будет давать большой точности потому что рынок постоянно меняется, а данные 4 года назад уже не актуальны.
Аноним 01/08/23 Втр 20:55:57 439655 162
>>439629
Чел, очевидно же что данные говно. Чем больше наваливаешь этого говна, тем хуже. Оно учится предсказывать по статистике, но статистика полностью неверна. А на минимальном датасете получаешь что-то чуть лучше рандомного результата. Ты так никогда вменяемого результата не получишь, если у тебя нет каких-то внешних данных кроме свеч.
Аноним 01/08/23 Втр 21:00:23 439660 163
>>439629
какой таймфрейм у свеч? может не надо на 5 секундных её обучать?)
Аноним 01/08/23 Втр 21:12:08 439687 164
>>439653
Да, только там тред умер

>>439654
Да, рынок нехорошо таким образом пытаться предсказать, но был же случай когда нейронки определяли расу человека по рентгену, может и на рынке есть какие-то, недоступные людям, закономерности.

>>439655
А чем они говно, не очень понимаю. В датасете где 500.000 строк, используются 3 индикатора, причем на 15, 60, 240 -минутном таймфрейме. Пробовал еще просто количеством раньше (10 индикаторов на 70.000 строк, результат 50%-53%)

>>439660
15 минут, можно и на 5 секундах попробовать, не понимаю как это поможет правда
Аноним 01/08/23 Втр 21:19:20 439702 165
>>439687
> чем они говно
Тем что статистика не работает, чел. Ты учишь сетку предсказывать по прошлым данным, но эти данные не верны. Дроч с индикаторами - это уровень похода в казино, лучше сходи на ставки. Ты реально думаешь что один такой умный и можно просто взять и предсказывать по истории как оно будет изменяться?
Аноним 01/08/23 Втр 21:24:19 439715 166
>>439687
Если бы раса менялась так же как данные рынка, то у нас бы были эльфы, кошкодевочки и рептилоиды. Даже при налиции циклов и закономерностей, данные больше пары месяцев уже не актуальны
Аноним 01/08/23 Втр 21:27:15 439720 167
>>439702
что значит "не работает"? Статистика не нужна же для закручивания гаек, она не может работать или нет. Что ты имеешь ввиду?
Почему данные не верны? API бинанса как то их искажает или в формате .cvs есть систематические проблемы какие то? Опять же поясни пожалуйста, я не понимаю тебя.
Да, я понимаю что не один такой умный, понимаю что наверняка пальцем в небо было бы примерно так же, но должен же наверняка быть способ сделать хотя бы 60% правильности предсказаний, этого уже будет достаточно

>>439715
Почему именно пары месяцев? Почему они перестают быть актуальными?
Аноним 01/08/23 Втр 21:31:27 439726 168
>>439720
Потому что у условной компании выходит квартальный отчет, все ждали что будет хорошо и тарили, а там плохо. Или хорошо, но все просто начали разгружаться на факте.
Потому что изменили ставку ЦБ и для банков изменилась прибыльность
Потому что в Америке/Европе холодно/жарко и газ подорожал, поставщики получили прибыль..

Слишком много факторов, чтобы делать предсказания на основании одного только графика
Аноним 01/08/23 Втр 21:31:59 439727 169
>>439720
> она не может работать или нет
У тебя статистическая модель, а ты пытаешься предсказывать погоду в Химках по количеству говна в лотке у кота.
Аноним 01/08/23 Втр 21:35:24 439731 170
>>439726
да, поэтому я поставил еще индикаторов на разных таймфреймах, но твою мысль понял, попробую сделать более подробный датасет на меньшем временном интервале.

>>439727
Ну нет, все таки говно в лотке и погода вообще не связаны, а данные рынка с рынком связаны, да и даже если нет, то как объяснить тот случай с определением расы?
И все таки почему данные не верны или что ты имел ввиду под этим?
Аноним 01/08/23 Втр 21:36:38 439732 171
Протестил 2070с - 1.45. У 3070ти всего 2. Пиздец, думал намного лучше будет
Аноним 01/08/23 Втр 21:37:01 439733 172
>>439731
Индикаторы не добавляют полезной информации, они строятся по тем же данным свечей. Грубо говоря сетка сама должна понять закономерности, если они есть.
Аноним 01/08/23 Втр 21:38:45 439738 173
>>439733
Понял тебя, что кроме индикаторов можно добавить?
Аноним 01/08/23 Втр 21:39:58 439740 174
>>439731
> данные рынка с рынком связаны
Это как ещё? Изменения рынка никак не связаны с историей этих изменений.
Аноним 01/08/23 Втр 21:42:22 439742 175
>>439740
Ну история происходит от изменений, а корреляцию в обратную сторону придумает нейронка
Аноним 01/08/23 Втр 21:42:51 439744 176
>>439738
А ничего больше и нет. Только отчеты, новости и другие котировки (индексы, цены товаров, фьючерсы, опционы..)
Аноним 01/08/23 Втр 21:44:18 439747 177
>>439744
печально, все равно спасибо
Аноним 01/08/23 Втр 21:44:32 439748 178
xyzgrid-0075-25[...].png 12113Кб, 3680x2689
3680x2689
Больше всего в тренировке лор мне не нравится выбор конечного варианта.

Алсо ныжно ваше мнение. Сам выбираю между V2 и V2C
Аноним 01/08/23 Втр 21:51:32 439762 179
>>439748
V2C однозначно лучший вариант
Аноним 01/08/23 Втр 22:04:13 439782 180
xyzgrid-0083-18[...].png 9072Кб, 2944x3201
2944x3201
xyzgrid-0077-28[...].png 9991Кб, 2944x3201
2944x3201
>>439762
Все не так одназначно:(
Аноним 01/08/23 Втр 22:47:28 439852 181
>>439731
>то как объяснить тот случай с определением расы?
Негры делали снимки в бомж районах на старом оборудовании, а белые люди на современном, и снимки сильно отличались по качеству. Мыло? Негр.
Я слегка адаптировал похожий случай, когда нейросетка определяла болезнь по тому, что в больнице снимки делал другой аппарат, лол.
Аноним 01/08/23 Втр 23:22:08 439905 182
>>439748
В графике с разным весом ноль смысла, оставляй 0.9 или 1 и увеличь число батчей чтобы сравнивать по нескольким пикчам а не одной. Также попробуй разный фон, разные ракурсы, разную одежду.
Аноним 01/08/23 Втр 23:35:49 439931 183
>>439905
Да, я так и делаю.
Сначала смотрю какой вес лучше, чтобы не было корявых картинок на ~1.
Аноним 02/08/23 Срд 00:33:17 439990 184
>>439852
Интересно вышло, спасибо за ответ
Аноним 02/08/23 Срд 02:46:21 440110 185
А чем концептуально отличается принцип работы миджорней от stabe diffusion?

В sd я наблюдаю что изображение постепенно проявляется из рандомной каши пикселей, в мж проявляется из черного фона. Это я верно заметил?
Аноним 03/08/23 Чтв 14:10:46 442437 186
Аисачеры, есть разница между 7 повторами и 10 эпохами VS 25 повторов и 3 эпохи? Результат при 1500 шагах и там и там одинаковый должен получиться?
Аноним 03/08/23 Чтв 16:30:15 442601 187
>>442437
710=70, 253=75, во втором случае будет дольше обучение.
Есть факторы что повлияют, но обычно их проявление на уровне рандома сида. В 10 эпохах легче вытащить вариант до запекания, а в трех последняя может оказаться пережаренная а предпоследняя - полусырая. Больше 10 смысла нету, но есть любители делать десятки-сотни, может они расскажут зачем и чего так можно достичь.
Аноним 03/08/23 Чтв 18:52:35 442759 188
>>442601
ну я тестил и в принципе меня устраивает 25x3, но хотелось бы 7x10 и чтобы он последние три сохранил, а не создавал кучу файлов
Аноним 03/08/23 Чтв 19:09:02 442783 189
>>442759
> чтобы он последние три сохранил
--save_last_n_epochs
Аноним 03/08/23 Чтв 19:33:22 442818 190
00039-1217016519.png 1397Кб, 1536x912
1536x912
Аноним 04/08/23 Птн 01:20:52 443340 191
а как делать лору с тригерр словом? это тупо в тегах только одно слово использовать?
Аноним 04/08/23 Птн 01:25:37 443345 192
>>443340
Я в промте датасете первый токен использую
Аноним 04/08/23 Птн 02:13:31 443390 193
>>443345
да я походу разобрался, все у питонистов через жопу сделано, вроде как название папки "15_model trigger_word" делается

вот видосик в тему кстати https://www.youtube.com/watch?v=kimxha0wTbY, как промтовые и триггер слова по разному работают, в теории тригер слово надо чтобы избежать перекрытия токенов в самой модели, но я слабо понимаю почему бы уникальное слово не использовать в датасете
Аноним 04/08/23 Птн 02:39:41 443419 194
>>443340
Просто добавляешь этот тег с текстовое описание пикч, можно на первое место поставить. Например, имя персонажа, если его модель не знала то будет запомнено, если было - будет трактовать по-новому.
>>443390
> вроде как название папки "15_model trigger_word" делается
В тренере кохи название папки будет браться в качестве единственного тега только если к пикчам отсутствует текстовые описания, иначе игнорируется.
> но я слабо понимаю почему бы уникальное слово не использовать в датасете
Его и нужно использовать, и в экспериментах на видео наиболее адекватное поведение у 3й версии где триггер-слово было плавно встроено в общее описание к пикче. С одним тегом еще будет обучение страдать, что видно по результатам соответствующих лор в видео, хотя оно не самое показательное, непонятно что в датасете и насколько оптимальны параметры обучения.
Аноним 05/08/23 Суб 10:12:46 444502 195
Вчера был установлен Roop, для SDWebui, отработал несколько генераций в txt2img, и все было благополучно.

Сегодня при генерации любого изображения, вне зависимости от модели, использования/неиспользования Roop и режима (txt/img2img), возникает ошибка:

Traceback (most recent call last):
File "F:\SDwebui\stable-diffusion-webui-master\venv\lib\site-packages\gradio\routes.py", line 337, in run_predict
output = await app.get_blocks().process_api(
File "F:\SDwebui\stable-diffusion-webui-master\venv\lib\site-packages\gradio\blocks.py", line 1013, in process_api
inputs = self.preprocess_data(fn_index, inputs, state)
File "F:\SDwebui\stable-diffusion-webui-master\venv\lib\site-packages\gradio\blocks.py", line 911, in preprocess_data
processed_input.append(block.preprocess(inputs))
File "F:\SDwebui\stable-diffusion-webui-master\venv\lib\site-packages\gradio\components.py", line 1492, in preprocess
im = processing_utils.decode_base64_to_image(x)
File "F:\SDwebui\stable-diffusion-webui-master\venv\lib\site-packages\gradio\processing_utils.py", line 53, in decode_base64_to_image
content = encoding.split(";")[1]
IndexError: list index out of range

Сталкивался ли кто, есть ли идеи как исправить эту ошибку?
Аноним 05/08/23 Суб 10:26:42 444505 196
>>444502
Усиленный гуглинг помог решить проблему.

Нужно создать папку с именем gradio в C:\Users\%юзернейм%\AppData\Local\Temp\

Вдруг будет кому полезно
Аноним 05/08/23 Суб 14:29:47 444662 197
Собираюсь стать боярином с 4080 (пересаживаюсь с 2070).

Какие подводные?
С полгода назад (или больше уже?) была какая-то ебля со сборкой компонентов из исходников ради значительного повышения производительности - это решили?
Аноним 05/08/23 Суб 15:07:32 444727 198
Двач, помоги.
Работаю с СД через runpod, раньше все было прекрасно и я был доволен как слон, но в последнее время заебала ошибка CUDA out of memory. На карте в 24 гб не вывозит больше 1200 px, один раз даже 500х500 отказывался, на карте в 48гб картинку в 800х1500 еле генерирует и тормозит. Пробовал по советам с реддита удалять процессы python launcher и webui через терминал, но это то помогает, то нет. Что делоть? Я не айтишник, вот совсем.
Аноним 05/08/23 Суб 15:30:09 444748 199
>>444662
> Какие подводные?
16гб врам вместо возможных 24х. В остальном все ок, быстро работает из коробки даже в кохе, второй торч с кудой 118 сейчас уже везде.
>>444727
Подробнее распиши что и как запускаешь, обычный sd-webui автоматика или что-то еще? Как там вообще организовано, тебе дается виртуалка с линуксом или что?
Аноним 05/08/23 Суб 15:44:19 444758 200
>>444748
Да, обычный, облако с линуксом, Jupyter Notebook, запускаю готовый шаблон SD.
Аноним 05/08/23 Суб 15:52:04 444762 201
>>444758
> запускаю готовый шаблон SD
Похоже в этом проблема, реально для 48 гигов (если речь о чем-то типа а6000 ада без преимуществ в мощности чипа) нет задач, 6 мегапикселей помещается в 24 гига, если нужно больше - хватает tiled vae.
Проверь чтобы устанавливалась нормальная версия, запускалась с xformers и вся врам действительно была доступна изначально ( https://stackoverflow.com/questions/58216000/get-total-amount-of-free-gpu-memory-and-available-using-pytorch )
Аноним 05/08/23 Суб 16:03:00 444772 202
>>444762
Ладно, спасибо, буду пытаться думать
Аноним 05/08/23 Суб 16:44:10 444819 203
tmpiek4b3f3.png 12148Кб, 11776x1418
11776x1418
> LoHa Теоретически должен давать лучший результат при тренировках с датасетом в котором будет и персонаж и стилистика одновременно.

ммм чет залупа какая то
14k шагов, вверху LoCon, внизу LoHa
Аноним 05/08/23 Суб 17:18:35 444851 204
>>444748
>16гб врам вместо возможных 24х
4090 просто для моих повседневных задач шибко оверкилл.

Думал вообще 4060ti новую взять и не париться, но комп чота старый уже, плюс продать его есть кому... Решил обновиться в итоге.

>второй торч с кудой 118 сейчас уже везде.
Эт хорошо. Значит, на новую систему ставлю гит, ставлю питон, копирую текущую папку вебуя - и оно работает, так? Или для уверенности венв убить, и пусть перекачает?
Аноним 05/08/23 Суб 17:23:45 444856 205
>>444851
4080 вполне солидный вариант, с ним посоперничать может 3090(ти) но особенно в обычной встречаются проблемы с температурой памяти плюс это не новье со всеми вытекающими. Но аппетит приходит во время еды, и если увлечешься - потом будешь ныть что не доплатил.
> Значит, на новую систему
На новой системе - гит клон, лоры-модели-эмбединги копируешь, если лень настройки выставлять - еще config.json. Ультимативный вариант, делается быстро, если что старую папку не убивай - будет бекапом.
Аноним 05/08/23 Суб 17:40:46 444870 206
>>444819
Чел, LoHa будет всегда хуже даже обычной лоры. Сопоставимые результаты можно получить только на ультрамелком датасете и низком ранге.
Аноним 05/08/23 Суб 17:43:01 444872 207
>>444856
>Но аппетит приходит во время еды, и если увлечешься - потом будешь ныть что не доплатил.
Он уже пришел =)
Запарило в 8 гигов моей 2070 упираться, а тут сразу двойной прирост, красота будет.
Тренить свои чекпоинты не планирую все равно, на остальное 16 гигов должно хватить.
Сколько вообще мегапикселов в 16 гигов лезет? на 8 лимит ~1.3, и это если без лор и контролнета.
Аноним 05/08/23 Суб 17:48:08 444875 208
>>444872
В 24 лезет около 6, тут будет 3.5-4, с костылями больше. Зависимость чуть не пропорциональна потому что в любом случае у тебя сколько-то отожрут веса и прочие компоненты. Вообще с учетом tiled vae должно хватить на все, но на горизонте sdxl а у нее требования больше и там уже 12-гиговые начали волноваться.
Если это верхний порог бюджета и уже все резервы выбраны - бери, вариант хороший.
Аноним 05/08/23 Суб 17:59:31 444880 209
>>444875
>но на горизонте sdxl
Так и не понял особо ее преимуществ, если честно.
Пальцы хоть нормально рисовать будет?
Аноним 05/08/23 Суб 19:49:54 444950 210
изображение.png 3Кб, 289x109
289x109
>>444880
Ахаха.
Поставил эту штуку, и тупо на загрузке автоматика со включенной модель - пикрил.
Это что вообще?
Аноним 05/08/23 Суб 19:56:24 444957 211
00009-3269961917.png 5193Кб, 2048x2048
2048x2048
Почему Lora на SDXL так медленно тренится? 2000 шагов 11 часов, на SD 1.5 с таким же количеством занимает 20 минут ЧЯДНТ?
Аноним 05/08/23 Суб 20:14:00 444974 212
>>444880
> Пальцы хоть нормально рисовать будет?
Да (нет)
>>444950
> Это что вообще?
> там уже 12-гиговые начали волноваться
Голая прунед модель овер 6 гигов весит если что.
Аноним 05/08/23 Суб 20:24:31 444985 213
>>444950
Поставь ComfyUI, Автоматик пока сосет по памяти
Аноним 05/08/23 Суб 20:29:11 444995 214
>>444985
Ради одной этой модели? Лень.

>>444974
Ну зашибись теперь.
Не зря комп апгрейдить собрался.
Аноним 05/08/23 Суб 20:57:04 445045 215
>>444995
>Не зря комп апгрейдить собрался.
Заранее заготовь ответ консультанту, который будет охуевать от железа, мол, беру аниме тянучек создавать да на тексты дрочить.
Аноним 05/08/23 Суб 21:48:14 445114 216
>>445045
Да я уже оплатил. Он ничего не спросил.

Наверное, по моему внешнему около-хикканскому виду и так всё понял.
Аноним 05/08/23 Суб 22:20:11 445146 217
А что дает clipskip?
Аноним 05/08/23 Суб 22:24:48 445155 218
>>445146
Скипает клипы вестимо.
Аноним 05/08/23 Суб 22:25:24 445156 219
Аноним 05/08/23 Суб 23:02:26 445209 220
>>445156
Для некоторых моделей есть пара лишних, которые лучше скипать. В основном аниме модели и скипают 1 слой (настройка на 2).
Аноним 05/08/23 Суб 23:05:28 445210 221
Есть один художник, у него 400 артов.
Я хочу скопировать его стиль. Я закинул его арты в папку, раздал им веса, выставил тег
artist_name_style
Получил лору. Так вот, лора превосходно копирует его стиль рисования и цвета, но есть одно но: лора почему-то иногда рисует body horror — то две попы на теле, друг над другом, то фистинг по локоть то 2 пары рук, как у Горо.
Вопрос: можно ли мне нагенерить лорой очень много артов, затем вытащить из них арты с боди-хоррором, сложить в папку с первичными рисунками и выставить боди-хоррор теги на сгенерированных артах — чтобы потом через негативный промпт "лишние конечности" и прочее удалять такие арты из выдачи (а не фильтровать самому)?
Аноним 05/08/23 Суб 23:06:21 445212 222
>>445210
переформулирую: можно ли удачную/неудачную выдачу добавлять к первичному дата-сету и обучать заново?
Или SD-лоры/модели нельзя обучать на выдаче SD,
Аноним 05/08/23 Суб 23:15:40 445226 223
>>445212
Экспериментируй, хули там. Можешь ещё в регуляционные картинки залезть.
Аноним 05/08/23 Суб 23:21:56 445231 224
>>445210
> лора почему-то иногда рисует body horror — то две попы на теле, друг над другом, то фистинг по локоть то 2 пары рук, как у Горо.
Даже до хайрезфикса?
Аноним 05/08/23 Суб 23:30:56 445240 225
>>445210
Просто потренируй с другими параметрами, такое обычно происходит при пережарке некоторых слоев. 400 пикч врядли будут однообразны, для начала поиграйся с параметрами тренировки, посмотри что на разных эпохах и т.д.
Также можешь попробовать в послойное применение лоры вычисляя экспериментально, но это попытка снять симптом а не причину.
> выставил тег
Тег один или к полноценным тегам добавил имя художника?
Аноним 05/08/23 Суб 23:37:04 445244 226
>>445240
>послойное применение лоры
Для этого же есть расширение название которого я забыл
Аноним 05/08/23 Суб 23:52:37 445263 227
>>399707 (OP)
я не понял, прошла неделя а контролнета для С-Д-ИКС-ЭЛЬ так и нет. кто за вас это делать будет, хули вы тут волов пинаете?
Аноним 05/08/23 Суб 23:53:39 445265 228
>>445263
Нахуй нужен, рисобака?
Аноним 06/08/23 Вск 00:14:36 445290 229
>>445210
Бодихоррор обычно возникает, когда ты пытаешься заставить нейронку генерить картинку в слишком большом разрешении.
В результате нейронка генерит часть картинки, потом переходит на другую часть - и генерит ее заново, а потом пытается всё "сшить".
Отсюда всякие кентавры лезут.
Уменьшай базовое разрешение генерации, 800х600 - это почти предел стабильности сейчас (ну, за пределами SDXL). Всё, что выше - либо хайрезфиксом, либо апскейлом через и2и.

Другой вариант - на артах в обучении были картинки с несколькими персонажами (особенно в сложных взаимодействиях), и ты это соответствующим образом не протэгал. В итоге и получается 1girl с четырьмя руками и двумя головами.
Аноним 06/08/23 Вск 00:39:17 445327 230
00001-506175418.png 543Кб, 512x640
512x640
>>444502
Появилась новая проблема: при генерации с использованием Roop (который сейчас переименовался в ReActor), генерируется со всеми моделями что-то в духе пикрила. При этом, та же самая картина при генерации уже без Roop, будто весь SD сломался. Используется Automatic1111. Обновление плагина не помогло.

В командной строке, сначала заполняется ползунок генерации до 100%, потом перед ним появляются две строчки:

00:17:16 - ReActor - STATUS - Working: source face index [0], target face index [0]████| 16/16 [01:03<00:00, 4.23s/it]
00:17:29 - ReActor - STATUS - No target face found for 0

Будто бы на картинке, откуда надо взять лицо, лица нет, но оно есть.
Кто сталкивался, как фиксить, кто знает?
Аноним 06/08/23 Вск 03:25:57 445490 231
Пока я занимался раздеванием одноклассниц, у меня сформировался некий очень короткий алгоритм, дающий хороший (для меня) результат:
1. Берем фото, прогоняем через TopazPhotoAI, со всеми включенными пресетами. Если лицо одноклассницы достаточно крупно изображено на фото - все равно увеличение в 2 раза, это положительно влияет на конечный результат. Нет, через img2img результат похуёвее, мне не нравится.
2. Получившийся результат прогоняем через img2img на уровне Denoising strength 0,3-0,5 и выбираем самое годное.
3. Получившийся результат начинаем гонять через inpaint. Тут все стандартно: маску на лицо, Mask mode "not masked", Denoising strength "1", можно еще попробовать Masked content поменять.

Но чего я не решил - это дорисовка изображения таким образом, чтобы оно дорисовывалось только снизу например, или только слева, нувыпонели. Если тян мне нужна в полный рост а на фото только по грудь - приходится прогонять несколько интераций между Resize and fill и уменьшением фото & обрезкой ненужных сторон. Как сделать так, чтобы Resize and fill работал только вниз, например?
Аноним 06/08/23 Вск 09:28:02 445588 232
>>445327
>Кто сталкивался, как фиксить, кто знает?
SD сломался. Ты сам ответил.
Аноним 06/08/23 Вск 09:30:04 445589 233
>>445490
детайлером мама пользоваться не научила? Какие то лишние ненужные телодвижения.
Аноним 06/08/23 Вск 09:41:33 445596 234
>>445589
Не учила, я методом тыка дохожу.
Аноним 06/08/23 Вск 11:09:49 445659 235
>>445240
> Тег один или к полноценным тегам добавил имя художника?
боюсь, что тег один. так как руками 400 артов разметить анриал. художник не с данбурятника, а с фанбокса.
>>445231
> Даже до хайрезфикса?
я ещё не разу не видел, чтобы хайрезфикс делал что-то такое. да, без него.
>>445290
> в слишком большом разрешении
512x512 / 768x512 / 512x768
> на артах в обучении были картинки с несколькими персонажами (особенно в сложных взаимодействиях)
балин... да, так и было. мне поделить картинки на персонажей, где это можно, а на остальных — протегать?
Аноним 06/08/23 Вск 11:18:53 445667 236
>>444957
Оптимизировал настройки, вместо 13 часов обучение заняло 5
Аноним 06/08/23 Вск 11:46:05 445696 237
У кого то были ошибки при обучении лоры когда loss улетает в Nan или наоборот в 1? Я уже задолбался настройки крутить, оно то работает то нет.

>>445667
Что за видяха? 5ч на 2к шагов довольно медленно, у меня 2ч на 4к на 3070. Ну правда с проблемой выше.
Аноним 06/08/23 Вск 12:13:51 445726 238
00028-1981665873.png 1154Кб, 768x1280
768x1280
00030-3999058203.png 1195Кб, 768x1280
768x1280
>>445696
У меня было 4000 шагов, видеокарта 3060. На редите многие жалуются что очень медленно обучение идет. В итоге получилось замыленное говно.
Аноним 06/08/23 Вск 12:43:03 445754 239
>>445659
>так как руками 400 артов разметить анриал
Авто-таггеры используй. В автоматике расширение есть.

Качество порой сомнительное, иногда откровенно шизит, но все-таки лучше, чем в один-единственный тэг всё пихать.
Аноним 06/08/23 Вск 13:57:22 445824 240
>>445659
> так как руками 400 артов разметить анриал
Автотегеры. Один тег для некоторых случаев может работать и в очень редких даже полезен, но с ним обучение всирается до ужаса, от того и весь бадихоррор.
>>445696
Что тренреруешь и с какими параметрами? Такое при дикой пережарке или битых пикчах в датасете происходит.
Аноним 06/08/23 Вск 15:03:31 445877 241
>>445824
Locon, lr 0.0002-0,0004, alpha = dim. 50 картинок которые я пропустил через сетку чтоб придать стиль, на этот же стиль уже треню лору для хл.
Заметил что при повышении лр возникает чаще но вот вообще не стабильно, то на 0.0002 дохнет на 500 шаге то проходит весь процесс в 3к шагов без проблем.
Аноним 06/08/23 Вск 15:30:28 445890 242
1. У меня датасет 768x768, если указать при обучении 512x512, картинки будут резайзиться или кропаться? kohya gui

2. Картинка была допустим 300x300 и при увеличении имеет заметную лесенку, есть ли смысл прогонять картинки через апскейлер и потом ужимать чтобы были ровные линии, или все равно при обучении?
Аноним 06/08/23 Вск 15:51:06 445908 243
>>445890
множественный кроп. все части изображения попадут в обучение
Аноним 06/08/23 Вск 16:13:22 445934 244
>>445908
Что-то мне всегда казалось, что там таки ресайз под определенное соотношение сторон, а не кроп.

Ибо я на абсурдресах тренил до 4к-6к разрешения - и получалось вполне себе. В случае кропа - что-то сомнительно, чтоб оно нормально натренилось.
Аноним 06/08/23 Вск 16:27:51 445957 245
Аноним 06/08/23 Вск 20:36:29 446267 246
>>445877
Нейрота в датасете ухудшит результат. Сколько дим и батчсайз? Альфу убавь или снизь лр, многовато, у текстового энкодера поставь половину от юнета. Планировщик и оптимизатор какие?
Аноним 06/08/23 Вск 20:37:25 446270 247
>>445890
Ресайзиться, если соотношение сторон странное то еще кропнется до ближайшего что стоит в настройках.
>>445908
Врунишка
Аноним 06/08/23 Вск 20:56:29 446300 248
>>445957
> чет намеков на множественный кроп я не нашел
>>446270
> Врунишка

Епить. Неужели я всё это время понимал алгоритм неправильно? Ясно, понятно. Буду делать 1:1
Аноним 06/08/23 Вск 21:37:50 446365 249
>>446267
Это для SDXL лора так что там нету ни батчей, ни обучения энкодера, планировщик естественно констант, другие жрут до жопы.
24 дим, 12 конво, адам обычный. На адафакторе та же дичь. Даже если альфу 1 поставить и немного лр задрать для компенсации.
Сейчас внезапно выяснил что продиджи довольно неплохо работает. В гайде был weight_decay=0.01 но у меня он тоже на 400 шаге ебнул, поставил weight_decay=0.1 и вроде самое то
Аноним 07/08/23 Пнд 05:34:56 446848 250
Сделали ли какие-нибудь новые модели интеррогаторов за последние полгода?
Аноним 07/08/23 Пнд 09:38:37 446949 251
>>446848
Зачем? Это говно изначально мертво было, все мультимодалки используют.
Аноним 07/08/23 Пнд 10:26:11 446965 252
Аноним 07/08/23 Пнд 10:28:16 446967 253
1684967806110.png 198Кб, 1554x823
1554x823
>>446949
> все мультимодалки используют.
Раз это все используют, то должны быть уже готовые решения с пакетной обработкой и готовый чекпоинт, которых я вот не нашел. Линкани если есть. Демка с сайта ожидаемо обосралась инбифо: проблема навыка

мимо
Аноним 07/08/23 Пнд 11:23:25 446988 254
>>446967
> booru tags
Буквально худший способ тегать пики. Хотя бы потому что текстовый энкодер SD лучше работает с осмысленными предложениями, а не набором бессвязных слов. В итоге получается что все пики протеганы говном типа "1girl, sitting", а базовые промпты типа позы или положения персонажа относительно окружения и камеры - почти нихуя не работают.
Аноним 07/08/23 Пнд 11:49:44 447015 255
>>446988
>Хотя бы потому что текстовый энкодер SD лучше работает с осмысленными предложениями
И поэтому сосёт на персонажах, которые нужно указывать как два тега, а не как один через _, как это сделано на бурах.
Аноним 07/08/23 Пнд 11:57:12 447021 256
>>446988
Лол. Ну опиши все детали в осмысленном предложении и чтобы оно тебя поняло. А учитывая что аниме модели тренировались на тегах данбоору, то это еще больший лол
Аноним 07/08/23 Пнд 12:06:02 447037 257
>>446988
Тогда штоделоть?
>>447015
Брат, тоже генрируешь ковбоев по cowboy shot'у?
Аноним 07/08/23 Пнд 12:11:58 447047 258
>>447021
>А учитывая что аниме модели тренировались на тегах данбоору, то это еще больший лол
А ещё мержи даже реалистик моделей содержат в прадедушках (или прабабушках?) какую-нибудь новел аи...
>>447037
>Брат, тоже генрируешь ковбоев по cowboy shot'у?
Не всё так плохо конечно, но определённое влияние есть.
Нужны мультимодалки, а не вот это всё с автоматом созданными тегами по частоте встречаемости.
Аноним 07/08/23 Пнд 12:25:30 447062 259
>>446988
>а базовые промпты типа позы или положения персонажа относительно окружения и камеры - почти нихуя не работают.
Так они в принципе не работают даже на чистой SD, лол.
Аноним 07/08/23 Пнд 12:51:38 447082 260
1655067916857.png 901Кб, 1570x1411
1570x1411
>>447015
> через _
Потому что это разделительный символ, энкодеру в целом похуй какой символ будет стоять между словами, они всё равно на этапе токенизации будут разделены и оно не будет восприниматься как цельное слово. Если в описании пикчи нормально написано что эту тян зовут так-то, то оно и будет нормально воспринимать её имя в любом формате.
>>447021
> Ну опиши все детали в осмысленном предложении и чтобы оно тебя поняло.
В чём проблема? Даже NAI понимает связь между словами в предложении, с миксах так вообще можно писать как при обычных генерациях. А вот когда гора тегов, то цвета и объекты всегда рандомно по пику раскиданы.
Аноним 07/08/23 Пнд 13:19:16 447122 261
>>447082
>Потому что это разделительный символ
Но ведь нет...
>>447082
>то цвета и объекты всегда рандомно по пику раскиданы
А теперь угадай, почему у тебя боксы на картинке покрашены в blue.
Аноним 07/08/23 Пнд 13:35:38 447140 262
1555658764173.png 7595Кб, 1792x8334
1792x8334
>>447122
> нет
Пидора ответ.
Аноним 07/08/23 Пнд 13:37:22 447143 263
1591240522526.png 234Кб, 512x512
512x512
1621419853710.png 321Кб, 512x512
512x512
1548976170007.png 280Кб, 512x512
512x512
1622063487263.png 340Кб, 512x512
512x512
>>447082
Пример красивый, но в нем все элементы окрасились в оттенки зеленого, боксы не очень то калоред, и главное то же самое достигается буру-стайл тегами с чуть более развернутым описанием.
ginger girl, blue eyes, sitting on the box, yellow boxes stacked, pink pyramid on top of head, full body
Negative prompt: (worst quality, low quality:1.3)
Важно указание понятного контекста а не просто спам в навал тем что может быть двусмысленно истрактовано.
Более того, с ними можно закладывать описанием больше деталей не делая странные предложения, что только спутают сеть, а взаимопроникновение может быть даже меньше чем натуральным текстом.
Если что не топлю за обязательное задание буру тегами, просто разбавляю твою радикальную позицию.

Еще важный момент что раз наи после столь интенсивной тренировки сохранила навык восприятия натурального промта, то почему тренинг лор буру тегами должен их испортить? Интересно сравнить с разным стилем теггинга на одинаковых параметрах
Аноним 07/08/23 Пнд 13:45:32 447157 264
>>447143
> буру-стайл тегами
Но ведь у тебя не они, ты просто предложение разбил запятыми вместо грамматических связок...
У тебя буквально два тега в booru-стиле - blue eyes и full body.
Аноним 07/08/23 Пнд 14:01:39 447183 265
>>447157
Подобное разбиение помогает модели, а "не они" потому что подобных для ситуации их просто нет. Как и описал, важно простое и понятное описание без двусмысленностей,
> pink pyramid on top of head
достаточно, потому что понятно что относительно чего, и использование чего-то типа
> pink, pyramid, object over head
сожрет не меньше токенов и будет иметь много трактовок. В то же время пилить натуртекст ради натуртекста - занятие того же уровня и не даст преимуществ в типичных ситуациях. Модель распознает структуру далеко не так хорошо как может показаться.

Возвращаясь к обучению - бурутеги (если нормально проставлены офк) вполне неплохо описывают главные атрибуты пикчи, что как раз важно для тренировки. Но если у тебя есть другие данные и с плейнтекстом все стабильно тренится лучше - покажи, будем делать так и благодарить.
Аноним 07/08/23 Пнд 14:52:43 447286 266
E479AE2B-4001-4[...].jpeg 723Кб, 3198x1521
3198x1521
C85E465F-A8D3-4[...].jpeg 166Кб, 768x1272
768x1272
Аноним 07/08/23 Пнд 14:57:58 447292 267
>>447140
Ну что ты копротивляешься? Видно же, что у тебя разные результаты, хотя это как бы разделители, которые должны как бы игнорироваться.
И да, я не хочу, чтобы _ было разделителем, и было бы лучше, если бы ото воспринималось как одно_слово.
Аноним 07/08/23 Пнд 15:03:44 447293 268
>>447292
> разные результаты
В первый раз видишь смещение результата при изменении символов и порядка тегов?
Кмк идентичность восприятия при разных разделителях и поломка при написании слитно очевидно. А вообще еще с прошлого года известно что _ - пожиратель токенов и заменяем пробелом.
>>447286
Можно подробнее что за t2ia и что вообще на пикчах?
Аноним 07/08/23 Пнд 15:04:08 447295 269
1690892767917.png 28Кб, 2101x255
2101x255
1625717479770.png 20Кб, 2089x180
2089x180
1610911545388.png 26Кб, 2089x235
2089x235
>>447183
> вполне неплохо описывают главные атрибуты пикчи
Но они не описывают их взаимосвязь.
> pink pyramid on top of head
Ты ведь такое только руками можешь написать, booru-таггеры в такое не смогут.
> покажи
Я все пики вот такими простынями тегаю, намного лучше чем написать 5-10 коротких тегов. Если надо на аниме треноровать, то можно с бур теги вкинуть в промпте, оно вычленит имена и самое важное, остальное выкинет.

Вообще есть очень простой способ протестить качество тегов - вкинуть их в SD. Вот если ты свои пики с ящиками протегаешь каким-нибудь DeepBooru и попробуешь сгенерировать из этого - получишь совсем не то, генерация будет фактически как при "1girl, sitting, boxes, pink". А вот с простынёй уже будет сильно ближе к тому что было. Условно, тебе не надо учить модель по промпту "1girl, sitting, boxes" догадываться что тянка сидит на коробках, она и так умеет это генерировать если попросить правильно. Если это тренировка на персонажа, то и генерации с описания этой пикчи должны отличиться только внешним видом тянки, любые отклонения в композиции будут тренироваться вместе с ней.
Аноним 07/08/23 Пнд 15:06:13 447297 270
>>447292
> разные результаты
Дефис и подчеркивание - литералли одинаковое. Так же как и пробел если убрать ничего не меняется. По смыслу они все одинаково воспринимаются.
Аноним 07/08/23 Пнд 15:12:45 447310 271
>>447295
> Но они не описывают их взаимосвязь.
Вопрос в том нужна ли она при тренировке анимелор. Даже не спорю ибо для этого нужно хотябы знать, но есть ощущение что влияние будет слабое, надо сравнивать. Что для подобных тегов используешь?
> протегаешь каким-нибудь DeepBooru
Ага, тут вообще без шансов, оно пригодно только заапскейлить чужую пикчу когда база уже есть.
> любые отклонения в композиции будут тренироваться вместе с ней
На следующей неделе попробую если с теггером подскажешь. Если это еще улучшит лоры персонажа с мелким датасетом то будет замечательно.
Аноним 07/08/23 Пнд 15:26:47 447329 272
>>447297
>Дефис и подчеркивание - литералли одинаковое
Я даже в фотошопах накладывать не буду, на глаз же видно, что немного разные.
>По смыслу они все одинаково воспринимаются.
Не спорю, в данном случае да. Но вообще нет, не всегда это работает адекватно. Впрочем если будут делать мультимодалку, то будет похуй на такие мелочи, полноценная языковая модель в составе рисовалки вытянет любое говно в любом стиле (в теории).
Аноним 07/08/23 Пнд 15:31:45 447341 273
>>447329
> немного разные
С включенными оптимизациями они и будут немного разные всегда.
Аноним 07/08/23 Пнд 15:33:59 447346 274
Кто генерит локально, мне нужно чтобы вы проверили размер папки лежащей по этому пути C:\Users\User\AppData\Local\pip\cache\http.
У меня он уже раздулся до 30ГБ, и я не думаю что это нормально. Полное удаление этой папки влияет только на скорость генерации (становится в 3 раза медленней).
Как исправить или сменить на другой диск путь кэша пипа? У меня системный ссд не резиновый.
Аноним 07/08/23 Пнд 15:41:23 447357 275
>>447346
Пардон, это я жестко ступил, можете чистить этот мусор у себя, никак не влияет на скорость генерации.
Аноним 07/08/23 Пнд 16:11:12 447399 276
Я тут запулил кахаю новые правки, пип инстал сделал, туда сюда и оказалось, что лора генериться не 14 часов, а 2 и память жрет не все 12 гигов а всего 6
вот это мне прокнуло говна при первой установке, а и я не думал

>>447346
pip cache purge
Аноним 07/08/23 Пнд 17:20:49 447437 277
1E6C4C5D-D84E-4[...].jpeg 511Кб, 1536x1152
1536x1152
FB3BA917-902F-4[...].png 1914Кб, 1216x1446
1216x1446
Аноним 07/08/23 Пнд 21:34:06 447670 278
>>447399
>pip cache purge
Что там вообще лежит?
Тоже 20 гигов весит.
Аноним 07/08/23 Пнд 21:50:43 447691 279
>>447670
кеш, чтобы не качать одно и тоже из интернета, он пакеты кеширует у тебя в системе
Аноним 08/08/23 Втр 04:58:16 448061 280
Собираюсь трейнить SD на голых preteen + процессоры и на манга лоликоне, около 1000 образцов. Как лучше это делать, finetune или lora? Фотки вместе с рисунками или лучше раздельные модели?
Аноним 08/08/23 Втр 07:41:46 448089 281
Аноним 08/08/23 Втр 20:09:09 448719 282
>>448061
> lora
я так понимаю, что это до сих пор bleeding edge

> Фотки вместе с рисунками
Отдельные, конечно.
У тебя базовые модели будут разные. У тебя базовая модель для фоток это SD 1.4/1.5, а для аниме -- NovelAI/AnythingElse
Аноним 08/08/23 Втр 21:58:22 448805 283
00005-4289542040.png 3130Кб, 1232x1736
1232x1736
Как же хороша сдхл
Аноним 08/08/23 Втр 22:05:17 448808 284
>>448805
Блять. Не тот тред. Энивей дайте оценку
Аноним 08/08/23 Втр 22:12:10 448813 285
Есть ли какой-то способ редактировать/тереть метаданные в уже созданных чекпойнтах/лора?
Аноним 08/08/23 Втр 23:10:25 448887 286
>>448061
Можешь попробовать оба варианта, в целом с лоры начни.
> Фотки вместе с рисунками или лучше раздельные модели?
Разные офк, и разные базовые базовые модели использовать.
>>448805
Для базовой модели - весьма неплохо.
Аноним 08/08/23 Втр 23:39:44 448922 287
>>448813
В расширении кохи
Аноним 08/08/23 Втр 23:43:32 448931 288
sadness.png 136Кб, 283x482
283x482
RuntimeError: Given groups=1, weight of size [320, 8, 3, 3], expected input[1, 9, 112, 88] to have 8 channels, but got 9 channels instead
Time taken: 0.6 sec.
Что за ошибка? В колабе появляется. Только начал изучать, а тут такое. Пару дней назад тестово запускал, все генерилось. Помоги, анончик.
Аноним 09/08/23 Срд 00:07:23 448956 289
>>448922
Kohya_ss только знаю, я нуб немножко. Что за расширение и куда там лезть?
Аноним 09/08/23 Срд 00:34:02 448971 290
456747.PNG 130Кб, 2523x906
2523x906
Аноним 09/08/23 Срд 00:42:41 448981 291
>>448971
Спасибо, бро, очень полезная для меня инфа, добра тебе.
Аноним 09/08/23 Срд 11:53:10 449210 292
>>448971
Это снова я-нуб, в общем, я попробовал этот способ, и добавить новое я могу, а вот вычистить старое, чтобы красиво описать и структурировать заново после - нет. Или я чего-то не понимаю, или в этом расширении можно только добавить то, что в окошки ввести можно (name, author, и тд).

Может, есть какой-то способ именно очистить метаданные?
Аноним 09/08/23 Срд 17:12:13 449589 293
image.png 620Кб, 1227x405
1227x405
Что она хочет от меня?
Аноним 09/08/23 Срд 17:13:31 449590 294
Аноним 09/08/23 Срд 17:15:08 449593 295
>>449590
Не с моей удачей всё закончить сразу, блин.
Обновил комп, приступил к переносу вебуя, и тут такое.
Ну ладно, займусь другим, авочь починят через пару часиков.
Аноним 09/08/23 Срд 17:15:09 449594 296
>>449590
Понял, спасибо. Пиздос
Аноним 09/08/23 Срд 20:25:21 449799 297
Как наладить преемственность между кадрами? Мне нужно сделать img2img на серию картинок где объект крутится, как сделать чтобы СД отрисовывал этот объект максимально схожим образом.
Аноним 09/08/23 Срд 20:48:55 449825 298
изображение.png 391Кб, 511x805
511x805
Двач, какова хуя генерится пикрил на инппейнт-модели? Началось все одним днем, буквально позавчера все было норм, а вчера запустил и полез пиздос какой-то.
Я уже и настройки, и промпты, и вообще заебался бороться с этим, как фиксить?
Они там сломали штоле что-то?
Аноним 09/08/23 Срд 20:50:19 449830 299
>>449825
Добавь негатив-промпт human centipede
Аноним 09/08/23 Срд 20:51:17 449831 300
>>449799
Контролнет
>>449825
Не генерируй на инпеинт модели, для нее хтонь выдавать нормально. Если раньше все было ок а потом поломалось - чекай настройки.
Аноним 09/08/23 Срд 20:51:23 449832 301
>>449830
А это точно поможет лол?
Аноним 09/08/23 Срд 20:52:47 449834 302
>>449831
> Не генерируй на инпеинт модели
Я генерирую вокруг одного объекта, так что инпейнт без вариантов.
>Если раньше все было ок а потом поломалось - чекай настройки.
Не менялись, только на странице генерации дергал, размеры изображения и все такое.
Аноним 09/08/23 Срд 22:56:42 450009 303
ПК бояре с больгим врамом, какое разрешение вы для картинок на хайрезфиксе используете?
А то заимел себе 4080, и на параметрах типа
>resize: from 600x800 to 2400x3200
генерация такую хтонь выдает... Что на латенте, что на других апскейлерах.
Даже тайловый контролнет не шибко помогает (хотя с ним лучше, конечно)

Может, надо не сразу такой апскейл бахать, а по шагам?
Аноним 09/08/23 Срд 23:58:31 450092 304
>>449834
Тогда ничего непонятно, это ты инпеинтишь вокруг тела снизу? Подробнее опиши что и как. Алсо галочку Tiling чекай, если стоит то убери.
>>450009
Больше 2 мегапикселей стандартными способами, как правило, будет ерунда. Здесь влияет работа модели на больших тайлах и кратность апскейла.
> а по шагам
Именно
Аноним 10/08/23 Чтв 01:00:53 450176 305
>>450092
>это ты инпеинтишь вокруг тела
Вокруг лица вестимо. Чекбокс на тайлинг снят.
Аноним 10/08/23 Чтв 01:56:48 450208 306
>>450092
>Больше 2 мегапикселей стандартными способами, как правило, будет ерунда.
Эх, а я думал как ща замучу себе овердетализацию...
Придется опять извращаться.
Но хотя бы после 2070 картинки быстро генерятся. Реально быстро, прям уф. Столько времени экономится.

Интересно, а если я в инпэинте сделаю маску на область, и в режиме маски Full Picture, но с повышенным разрешением, генерацию запущу. Оно как будет?
Аноним 10/08/23 Чтв 03:40:42 450265 307
Есть ли способ заставить контролнет апскейлить сразу пачку артов? Т.е. есть арты на 8K, их миниатюры для контролнета, настройки для последнего рендера у всех одинаковые. Как мне их поставить на конвеер на ночь? А то подрываться каждые 2 часа, что бы поставить новый арт рендериться, это слишком стресс.
Аноним 10/08/23 Чтв 05:16:11 450278 308
>>450265
в теории написать скрипт чтобы через апишку автоматика запускать задачи с нужными параметрами
Аноним 10/08/23 Чтв 08:46:05 450342 309
>>450265
Как вариант поставить дополнение на очередь задач.
Или комфи\владаматик в котором оно вроде бы встроено.
Аноним 10/08/23 Чтв 11:13:50 450403 310
>>450176
А где на пикче тогда лицо?
>>450208
Хайрезфикс это базовый однотайловый апскейл, который галочкой можно встроить в процесс t2i. Овердетализация делается после него, не то чтобы требует извращений. Кастом хайрез попробуй накатить, он лучше работает на больших кратностях.
> Оно как будет?
Область будет обрабатываться в указанном разрешении. Так лица и глаза инпеинтятся, только слишком много нет смысла ставить, примерно в пару раз выше чем выделено. Поэкспериментируй и станет понятно.
>>450265
> заставить контролнет апскейлить
Вут? Если хочешь просто апскейлить с применением контролнета - в i2i есть раздел batch, где можно натравить автоматика на папку. В i2i исходная пикча автоматом подсовывается на вход контролнета.
Аноним 10/08/23 Чтв 15:20:46 450600 311
>>450403
>в i2i есть раздел batch, где можно натравить автоматика на папку. В i2i исходная пикча автоматом подсовывается на вход контролнета.

Это не совсем то. Как бы это удобно, сразу кучу апскелить, но когда ты уже проапскейлил 10 артов с 960х540 в 4к, каждую с разными настройками и тебе надо просто их доапскейлить до 16к но уже с одинаковыми релизными настройками, это не катит. Я не могу засунуть ему одну папку с изначальными артами 960х540 и засунуть ему вторую папку уже с почти готовыми хайрезами, которые надо всего лишь дошлифовать на низком денойзе, чтоб он просто сверил файлы в папках по именам и апскелил нужные арты с нужными артами в контроле.
Аноним 10/08/23 Чтв 15:25:02 450607 312
>>450600
Если хочешь автоматизировать апскейл в несколько проходов с идентичными параметрами - пробуй скрипт loopback
Аноним 10/08/23 Чтв 19:50:30 450853 313
>>450607
Я не уверен, что он будет для каждого арта нужную картинку в контрол подставлять.
Аноним 10/08/23 Чтв 23:28:18 451163 314
>>450853
А ты попробуй и проверь, тут (если не проявятся сюрпризы быдлокода) возможны только 2 варианта: или оно будет каждый раз обновлять пикчу в контролнете, или же оставит ту что была исходной.
Аноним 13/08/23 Вск 12:23:42 454205 315
Ку, ребзя. Подскажите плиз какие есть варианты если я хочу дообучить существующую модель, большой датабазой определенного стиля, чтоб модель была хороша именно в конкретном направлении? Самый простой вариант просто сделать Лору и примержить, какие есть альтернативны? Я так понимаю дримбоз мне с 6гб врам не подходит?
Аноним 13/08/23 Вск 16:11:45 454476 316
>>454205
>Я так понимаю дримбоз мне с 6гб врам не подходит?
Дримбуз начинается с 16, насколько я помню.
Лучше - 24.
Аноним 13/08/23 Вск 17:02:59 454536 317
>>454476
Тоесть остаётся делать большую Лору или ликорис и мержить с моделью? Ок, есть ли какие-то способы упростить создание большой датабазы (кроме мокрописьки, мож какие скрипты)?
Аноним 13/08/23 Вск 17:16:59 454554 318
>>454536
Можно просто сделать лору, нахуя её мержить?
Аноним 13/08/23 Вск 18:18:15 454607 319
>>454536
>ликорис и мержить с моделью
Ликорисы с моделями не мержатся.
Ну, по моей информации месячной давности.
Может, уже доработали за это время.

>какие-то способы упростить создание большой датабазы
Понятия не имею. Я больше чем с 300-400 файлами не работал. Обычная ручная сортировка по папкам на этапе формирования, и прогон автотаггером поверх.
Аноним 13/08/23 Вск 19:14:30 454661 320
>>454476
> Дримбуз начинается с 16, насколько я помню.
На 11 работает.
Аноним 14/08/23 Пнд 18:46:21 455684 321
Долго ебался пытаясь сделать более удачную версию старой лоры, Нифига не выходило.
Потом задумался, откатил версию кохи на несколько коммитов назад, попробовал запустить с теми же параметрами - результат резко стал намного лучше.
В случае с локон еще и врам меньше жрет. И лоры на старой качественнее.
Пробовал локон и лору, оптимайзер адам и продиджи, все лучше в старой.

У меня одного такая херь? Кто-то может проверить,
Аноним 14/08/23 Пнд 19:30:10 455763 322
>>455684
>В случае с локон еще и врам меньше жрет. И лоры на старой качественнее.
Проебланил кажесят. Лоры в старой и новой примерно одинаково норм. А про локон все верно.
Аноним 15/08/23 Втр 07:06:37 456350 323
>>455763
pip show lycoris-lora какой версии?
Аноним 15/08/23 Втр 10:21:00 456438 324
>>456350
Через консоль и там и там показывает 1.8.3 но если искать по имени то в старом 1.8.0.dev6
Аноним 15/08/23 Втр 11:01:12 456461 325
Здравствуйте увожаемые, не подскажите как изи деплойнуть стейбл дифужн с контролнетом без ссаного вебуи?
Аноним 15/08/23 Втр 23:44:34 457484 326
Аноним 16/08/23 Срд 01:00:26 457645 327
>>456438
Я уж думал ты новую дев версию с тренировкой дополнительных normalization слоёв пробуешь https://github.com/KohakuBlueleaf/LyCORIS/commit/48f0836f1e46650419faf7cd37744f10a48292a9 , что оно стало жрать больше врам, а так хз, сам не обновлялся до сих пор с 1.7.2, кохак постоянно что то срёт своими коммитами, может что и поломал.
Аноним 16/08/23 Срд 10:04:02 457998 328
361837190183544[...].jpg 100Кб, 1080x1133
1080x1133
361849523183544[...].jpg 123Кб, 1080x1136
1080x1136
361921243183544[...].jpg 151Кб, 1080x1350
1080x1350
кто то может её раздеть? Или подскажите в каком треде это можно сделать пожалуйста
Аноним 17/08/23 Чтв 01:53:46 458896 329
>>457998
> Или подскажите в каком треде это можно сделать пожалуйста
Сейчас это выкинули в /nf
Аноним 17/08/23 Чтв 11:55:24 459198 330
00024-4216093971.png 847Кб, 1080x1136
1080x1136
00037-3592384847.png 1122Кб, 1080x1136
1080x1136
00041-1317296418.png 1419Кб, 1080x1352
1080x1352
00025-1519665104.png 1932Кб, 1080x1352
1080x1352
>>457998
Я хотел пораздевать тянок для анонов, и тоже тред не нашел. А самому создавать лень. Видно не судьба...
Аноним 17/08/23 Чтв 11:59:28 459205 331
>>399707 (OP)
Есть какие-нить расширения, что б в Inpaint upload размеры генерируемой картинки ставились как у сорса автоматически?
Аноним 17/08/23 Чтв 12:39:31 459272 332
изображение.png 22Кб, 595x288
595x288
>>458896
Вся доска нф не нужна, лол.
>>459205
>размеры генерируемой картинки ставились как у сорса автоматически?
Такой кнопочки нету что ли?
Аноним 17/08/23 Чтв 12:49:31 459280 333
>>459272
От спасиб тебе мил человек. Дай тебе бох два чаю.

Может еще подскажешь. Есть какойнить промт который делит генерируемую картинку на 2 равные части? Чот я не смог ничего толком подобрать. Либо три части получается, либо 2 но не равные. Редко когда 50 на 50 делит.
Аноним 17/08/23 Чтв 12:57:40 459294 334
Аноним 17/08/23 Чтв 13:21:38 459313 335
00027-4275460906.png 795Кб, 800x600
800x600
>>459294
не, смысле не область генерируемую разбить. А шоб готовый результат был разбит на две части. Типа шоб генерируемая картинка была разбита на две фотки, типа как на пикрилейтеде, но тока шоб на равные части делилась.
Аноним 17/08/23 Чтв 13:41:04 459325 336
>>459313
Нахуя? Делай две картинки.
Аноним 17/08/23 Чтв 13:48:15 459332 337
>>459325
Не, надо шоб за раз генерировал 2 равных по размерам. Таков путь...
Аноним 17/08/23 Чтв 15:28:20 459415 338
>>459313
Свазанная по смыслу пикча из двух половин - региональный промт, просто 2 пикчи - закажи батчсайз или прсото батч 2, в начале грид так склеит.
Аноним 18/08/23 Птн 04:35:35 459947 339
image.png 4Кб, 249x104
249x104
Кароч, недели две не запускал сд, запустил, ничего не менял вообще, видяху стало вообще не использовать, в чем проблема может быть?
Аноним 18/08/23 Птн 04:39:43 459950 340
image.png 7Кб, 515x177
515x177
>>459947
Хотя куда ядра работают, но скорость пиздец упала в десять+ раз.
Аноним 18/08/23 Птн 05:18:22 459957 341
>>459947
Все ясно, это пидорская кожанка перданула своим обновлением и добавила shared vram, что замедляло генерацию, пиздец просто
Аноним 18/08/23 Птн 22:15:03 460555 342
>>459272
> Вся доска нф не нужна
Согласен, это идиотская затея. Я просто сказал, где это теперь искать.
Аноним 19/08/23 Суб 15:46:50 461078 343
Апгрейдил комп, начал экспериментировать с максимально возможными разрешениями картинок.
И случайно придумал, как контролировать чрезмерное засирание картинки деталями от латент-апскейлера.

1) Сначала генерим лоу-рес пикчу, как обычно.
2) Ебашим лютейший однотайловый апскейл каким-нибудь валаром, сколько памяти влезет. Желательно побольше, этак на х3.
Тут у нас будет четкая большая картинка, не перезасраная деталями. Но проблема в том, что мелкие детали такой апскейл рисует очень плохо, в отличии от латента.
3) И вот уже эту картинку кормим тайловому контролнету на вход апскейла в режиме latent.
Так как картика уже четкая и в большом разрешении (в отличии от базовой, с первого шага), она очень жестко контролирует основное направление латентного апскейлера, не позволяя ему сильно увлекаться и распидорашивать всё излишними деталями.

Если это было известно - звиняйте, но вроде нигде не видел.
Аноним 19/08/23 Суб 16:02:00 461090 344
>>461078
> лютейший однотайловый апскейл каким-нибудь валаром
GAN-апскелы говно потому что тренировались на фото, а не сгенерированных лоурезах, они всегда выдают ещё большую кашу, хоть и чёткую.
> как контролировать чрезмерное засирание картинки деталями от латент-апскейлера
Вместо этой шизы можно просто сразу проапскейлить двумя апскейлерами (латент и любой другой пиксельный) и просто совместить их с какими надо весами. Есть и тонкий контроль, и возможность сидеть на низком деноизе. По скорости бесплатно, в отличии от шизоидных контролнетов.
Аноним 19/08/23 Суб 17:50:14 461137 345
>>461090
>они всегда выдают ещё большую кашу, хоть и чёткую.
У меня вот как раз наоборот почему-то.
Никакой каши и излишних деталей, обычная "плоская" картинка с улучшениями. Тогда как хочется как раз детализации.
>Вместо этой шизы можно просто сразу проапскейлить двумя апскейлерами
И как? В кастомном хайрезе латент не присутствует, а больше скриптов на апскейл я и не видел.
Аноним 19/08/23 Суб 18:23:32 461145 346
>>461078
Вообще на втором этапе можно использовать просто ган, а то и вообще лоурез подать на вход латента, последнее емнип настраивается для работы в один клик в img2img.
>>461090
> можно просто сразу проапскейлить двумя апскейлерами (латент и любой другой пиксельный) и просто совместить их с какими надо весами
Подкажи как это сделать.
Аноним 19/08/23 Суб 18:29:01 461150 347
>>461145
>а то и вообще лоурез подать на вход латента
И в результате получить очень лютую дичь, вплоть до полнейшей каши, мутантов и заселение картинки призраками.
Особенно если апскейлить на высокую кратность и без контролнета, который хоть как-то латент будет сдерживать.

Меня просто дичайше бесит невозможность контролировать латент-апскейлер по уровню добавляемых деталей.
С описанным подходом вроде бы хоть как-то его обуздать получается.
Аноним 19/08/23 Суб 18:31:55 461152 348
1651218564794.png 21Кб, 1506x162
1506x162
>>461137
> В кастомном хайрезе латент не присутствует
А это что?
Аноним 19/08/23 Суб 18:56:14 461165 349
>>461152
Хм.
Надо будет попробовать покрутить эту фигню.
Но пока меня результаты кастомного хайреза не впечатляли.
Скорее портит картинку, чем улучшает.
Аноним 19/08/23 Суб 19:42:27 461193 350
>>461152
Еще бы автор хоть какой-то тултип сделал к нему.
Ничерта ж непонятно, какой слайдер за что отвечает.
Аноним 19/08/23 Суб 21:02:24 461265 351
>>461150
> И в результате получить очень лютую дичь, вплоть до полнейшей каши, мутантов и заселение картинки призраками.
Схуяли? В обычном апскейле из шакала (при хайрезфиксе) этого не происходит а тут внезапно окажется. Ну и там очепятка на вход контролнета.
> невозможность контролировать латент-апскейлер по уровню добавляемых деталей
Криво/косвенно но есть, несколько костылей и лоры твикеры также действуют. А так используй tiled diffusion для апскейла, вот где раздолье настроек и контроля, никто не запрещает ему лоурезы скармливать.
Аноним 19/08/23 Суб 22:04:08 461317 352
>>461265
>Ну и там очепятка на вход контролнета.
Вот без опечатки оно лучше звучит.
Но лоурез на входе контролнета слабо справляется. Я очень долго именно так и пробовал, на больших апскейлах всё равно дичь лезет. Меньше, чем совсем без контролнета, но всё равно лезет.
А вот хайрез-картинка справляется гораздо лучше. Причем именно картинка из ГАН-апскейла. Если сделать сначала латент, а потом догнать ГАНом - опять получается овердетализация.
>Криво/косвенно но есть, несколько костылей и лоры твикеры также действуют.
И где это всё?
>А так используй tiled diffusion для апскейла, вот где раздолье настроек и контроля
Результат чуть лучше, чем чистый латент, но без контролнета.
Потеря композиции, анатомии, излишняя детализация там, где ее быть не должно. Так я этой штуке применения и не нашел нормального.
Аноним 19/08/23 Суб 22:07:35 461321 353
>>461317
> на больших апскейлах
На больших это на каких? Просто больше разрешение или большая кратность после лоуреза? Ну и какая пикча апскейлится.
> Если сделать сначала латент, а потом догнать ГАНом - опять получается овердетализация.
Не понял, расшифруй
> Потеря композиции, анатомии, излишняя детализация там, где ее быть не должно.
Это оно так на лоурезах работает или в принципе?
Аноним 19/08/23 Суб 23:30:16 461418 354
>>461317
>Потеря композиции, анатомии
Контролнет точно у тебя работает, лол? Ибо такого никогда не наблюдал.
Аноним 20/08/23 Вск 00:22:28 461470 355
>>461321
>На больших это на каких?
Когда, например, 800х600 апскейлить на х2-х2.5
На какой-нибудь х1.6 все нормально работает, ясное дело.
И если потом этот апскейл дальше подымать, на следующий шаг, тоже фигня выходит.

>Не понял, расшифруй
В первом варианте я беру пикчу из генерации, лоурес. Прогоняю через валар на х3 кратность. Получаю хайрез, но с низкими деталями. Получается нормально.
Во втором варианте эту пикчу сначала прогоняю в хайрезфиксе на х1.6, получаю детальную картинку, и потом уже добиваю тем же валаром до размера пикчи с первого варианта. И тут получается хуже. Латент с высокой кратностью под контролнетом рисует детали поверх деталей.

>Это оно так на лоурезах работает или в принципе?
Тайлед то? При использовании в связке с латентом и хайрезфиксом на х2.5 кратности с лоуреза.
Но я тут не говорю о серьезных потерях, типа руки там лишние могут вырасти, нет. Мелкие детали ломает очень сильно. Мышечную структуру, пальцы, одежду, всё такое. Задники колбасит вообще дичайше порою.
Сейчас вот попробовал его вторым этапом подключать, не с лоуреса, в комбинации с тайловым контролнетом без входной картинки - вроде интересные результаты выдает.

Вообще хотелось бы актуальные мануалы по апскейлу со всеми этими приблудами почитать. А не устарвшие, полугодовой давности.
Аноним 20/08/23 Вск 00:44:49 461482 356
>>461470
> например, 800х600 апскейлить на х2-х2.5
Это уже более 2 мегапикселей, просто так подобное разрешение для 1.5 уже за гранью, а со стандартным латент апскейлером тем более будет дичь.
> если потом этот апскейл дальше подымать, на следующий шаг, тоже фигня выходит
Офк, если делать в лоб то оно не будет чинить а наоборот подчеркнет косяки.
> лоурес. Прогоняю через валар на х3 кратность
Сам по себе ган из лоуреза исходной генерации с такой кратностью - лютейший вырвиглаз будет.
> И тут получается хуже
Вот это странно, ведь должно быть наоборот, покажи примеры.
> Латент с высокой кратностью
Больше х2 не нужно, или пользуйся другими средствами.
> Тайлед то? При использовании в связке с латентом и хайрезфиксом на х2.5 кратности с лоуреза.
Ты про что? Про тайлед вае или тайлед дефьюжн? Первый это костыль чтобы помещалось в врам, а второе это такой метод апскейла или i2i в латентном пространстве. Чтобы не ломал - используй контроллнет.

Вообще или тебя не понимаю, или ты делаешь что-то не то, ибо оче многое из описанного идет вразрез с практикой. Давай примеры с наиболее подробным описанием что делаешь.
> хотелось бы актуальные мануалы по апскейлу со всеми этими приблудами почитать. А не устарвшие, полугодовой давности.
Напиши сам, или придумай мотивацию чтобы их написали.
Для тайлового апскейла можно просто включить контролнет для улучшения результата, мультидифуззия работает из коробки с контролнетом, буквально ползунки крутануть, галочку поставить и запускай. Нюансов офк много, изи ту лерн хард ту мастер, но начать и получить приличный результат оче легко.
Аноним 20/08/23 Вск 15:22:30 461835 357
>>461482
>Это уже более 2 мегапикселей
При этом под контролнетом эти 2 мегапикселя получаются. Надо просто контролировать уровень добавления детализации.
>Офк, если делать в лоб то оно не будет чинить а наоборот подчеркнет косяки.
Так в том то и фишка, что х1.6 апскейл получается без косяков. Косяки идут выше, когда ты на этот х1.6 следующий х1.6 делаешь без надстроек.
>Сам по себе ган из лоуреза исходной генерации с такой кратностью - лютейший вырвиглаз будет.
Для законченной картинки - да. А вот как инпут для контролнета - работает. Нет размазанности и нечеткости лоуреса, что дает более точное руководство контролнету.
>Больше х2 не нужно, или пользуйся другими средствами.
Это скучно и неинтересно. Основной целью у меня было как раз научиться делать разорви-экран картинки (4080 жы!), чтоб не терять при этом композицию и основной уровень детализации, при этом умеренно добавляя второй уровень более мелких деталей. С "умеренно" вот только проблема.
>Вообще или тебя не понимаю
Вот и я не понимаю, как именно тайлед использовать, и какие результаты он вообще должен давать. Пока ерунда выходит.
>Напиши сам
Гайдописатель из меня так себе.
Аноним 20/08/23 Вск 17:00:58 461901 358
1595823525126.png 28Кб, 1246x365
1246x365
1652401708197.png 1903Кб, 1440x864
1440x864
1602699642149.png 7522Кб, 2880x1728
2880x1728
1676718573777.png 8151Кб, 2880x1728
2880x1728
1663503160018.png 6116Кб, 2880x1728
2880x1728
1668088036437.png 1261Кб, 1424x880
1424x880
1641234849579.png 9782Кб, 5696x3520
5696x3520
>>461835
> под контролнетом эти 2 мегапикселя получаются
Офк, с ним и больше выйдет без типичных поломок, только на совсем больших уже другие пойдут.
> Косяки идут выше, когда ты на этот х1.6 следующий х1.6 делаешь без надстроек.
Получается что есть какие-то граничное разрешение, или проблема именно в повторном апскейле? Что если дважды 1.3 сделать, например?
> Нет размазанности и нечеткости лоуреса, что дает более точное руководство контролнету.
Вот это полезное наблюдение, кстати при апскейле в img2img с контролнетом на его вход как раз апнутая ганом пикча подается.
> Основной целью у меня было как раз научиться делать разорви-экран картинки
Не, суть не в том что не нужно делать хайрезы, а что не нужно пытаться их делать сразу в хайрезфиксе.
> как именно тайлед использовать
Если самое простое в качестве отправной точки - после харезфикса, который получился хорошо, отправь в i2i и выстави настройки пикрелейтед. Апскейлер по вкусу, денойз в районе 0.4 и тайловый контролнет, если не хватит памяти то включи tiled vae. Играясь с денойзом (в широких пределах), семплерами, весом контролнета, можно получать разный уровень наброса мелких деталей с сохранением исходника. Размер латентов также влияет, плюс промт, доп лоры, сменить саму модель здесь также справедливо. Можно и наоборот сгладить используя эти приемы, в т.ч. включив noise inversion. Хочешь больше разрешение - отправляй результат на вход и повторять до полного удовлетворения, но полезут свои нюансы.
Исходные генерации и примеры пикрел, без претензии на качество но иллюстрирует возможность регулировки наброса с сохранением исходника.
> Гайдописатель из меня так себе.
Как раз поймешь - освоишь - напишешь понятно.
Аноним 20/08/23 Вск 17:53:45 461935 359
>>461901
>Что если дважды 1.3 сделать, например?
Пока не пробовал. Хотя 1.3 апскейл вообще слабо по деталям отработает, разрешения картинки банально не хватит.
>на его вход как раз апнутая ганом пикча подается.
Там не ган (который все-таки с дорисовкой), там обычный ресайз по алгоритму. Как итог - заблюренная фигня и плохие данные на вход тайлов.
>Исходные генерации и примеры пикрел
Вот первый апскейл - это хорошо (хотя и с небольшим перебором), а второй как раз то, что я и говорил - детали поверх деталей, сплошной нейрошум.
>Как раз поймешь - освоишь - напишешь понятно.
Это надо понять и освоить сначала.
Аноним 21/08/23 Пнд 00:10:21 462204 360
>>461935
> Хотя 1.3 апскейл вообще слабо по деталям отработает, разрешения картинки банально не хватит.
Если дважды то может и сработать, по крайней мере можно попробовать.
> Там не ган (который все-таки с дорисовкой), там обычный ресайз по алгоритму
При использовании контролнера в аутпуте также и его исходники выдает, специально сравнил - там тот самый ган что выбран. Если что про i2i говорю, контролнет в t2i при хайрезфиксе референс просто ресайзит.
> а второй как раз то, что я и говорил - детали поверх деталей
Ага, специально для иллюстрации.
> понять и освоить сначала
Если освоишь - найдешь ответы на свои вопросы, которыми гайдописцы скорее всего не задаются, потому такое изложение может быть очень полезным.
Аноним 21/08/23 Пнд 16:13:01 462561 361
блять, хелпаните, я где-то что-то проебываю и не могу нихуя понять.
лора в коллабе натренена, (ебучка тянская), по тестовым сэмплам в коллабе то, что надо.
качаю лору в пекарню, запускаю на той же модели, с теми же настройками промта/рендеринга, что и в колабе, все блять 1 в 1, цфг,семплы,ю, разрешения, выставляю и мне выдает какую-то залупу, не имеющую к лоре никакого отношения. то есть ебальник рендерится, видно что один и тот же, типа лора работает, но совершенно другое лицо.

тренится чисто на сд1.5, без всяких дополнительных пидерсий, вае и прочего кала.
Аноним 21/08/23 Пнд 16:45:25 462575 362
>>462561
Клип-скип проверь.
Ну и вообще, качни тестовый семпл из коллаба, и через ПНГ-инфо в свой генератор на пекарне его закинь, там все настройки принудительно проставятся как в оригинале.
Аноним 21/08/23 Пнд 16:50:52 462578 363
>>462575
метадаты нету в семплах, клип скип дрочил, и 2 и 0, и нихуя. чутка попiзже закину сюда лору с семплами,
Аноним 21/08/23 Пнд 16:54:02 462582 364
>>462578
>метадаты нету в семплах
Так сделай чтоб была. Коллаб ж вроде настройки поддерживает.
Аноним 21/08/23 Пнд 17:57:54 462627 365
image.png 4561Кб, 1024x1536
1024x1536
image.png 1042Кб, 512x768
512x768
>>462582

буду ща курить.
там миллиард пунктов, я обосрался пока пока запустил треню

короче, сколабыпидорнуло и назад не пускает, вот что успел скопировать

промт семпла с коллабы
prompt: masterpiece, best quality, 1girl, aqua eyes, baseball cap, blonde hair, closed mouth, earrings, green background, hat, hoop earrings, jewelry, looking at viewer, shirt, short hair, simple background, solo, upper body, yellow shirt


negative_prompt: lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark,
sampler=euler
username, blurry
height: 768
width: 512
sample_steps: 28
scale: 7.0



лора https://dropmefiles.com/7AoLO


Project Name: suzzz
Model Version: Stable Diffusion V1.x
Pretrained Model Path: /content/pretrained_model/Stable-Diffusion-v1-5.safetensors
No VAE path specified.

[sample_prompt_arguments]
sample_every_n_steps = 100
sample_sampler = "euler"

пик1 семплы с колабы/ебало орига, с которого тренил, 146% тащемта результат

пик2 - то что мне высирает мне гуи с настройками 1 в 1

чекните у себя, и скажите, че как, у меня пукан горит блять уже
Аноним 21/08/23 Пнд 18:05:37 462632 366
>>462204
>Если дважды то может и сработать, по крайней мере можно попробовать.
Попробовал. Не очень.
>Если что про i2i говорю
Ну а я первые шаги в т2и делаю.
Хотя, если честно, и в и2и тоже обычный ресайз постоянно видел. Может надо было и2и апскейлер поставить в настройках?
Аноним 23/08/23 Срд 12:19:16 464073 367
>>462627
але, макаки ебаные, чо вам сложно чекнуть штоле
Аноним 23/08/23 Срд 14:34:44 464169 368
Тестил кто скрипт Ultimate SD Upscale? Годная тема?
Аноним 23/08/23 Срд 15:04:09 464207 369
Как уменьшить использование оперативной памяти в стейбл диффужене? Есть куда гайдов по VRAM, но по оперативке ничего не нашёл. 16 гигов, 7+ гигов занимает винда и браузер. Хочу загрузить SDXL, у меня винда вылетает когда я это делаю.
Аноним 23/08/23 Срд 15:54:49 464255 370
Аноним 23/08/23 Срд 16:02:03 464265 371
>>464255
Действительно, в одном из гайдов о нём говорится.
Аноним 23/08/23 Срд 18:13:13 464379 372
Подскажите плз что делать, допустим собрал датабазу примерно на 1к пикч чтоб дотренить модель.
1. Какой метод обучения лучше выбрать?
2. Можно ли это сделать в облачном сервере с мощным гпу, если да то как?
Ибо локально это будет вечно, а подобными сервисами никогда не пользовался. Плз скиньте какую информацию минимально я должен знать для работы с облачными серверами.
Аноним 23/08/23 Срд 19:11:36 464421 373
Сколько it/s при тренировке самой обычной лоры на 4080 должно быть?
А то у меня что-то в районе 1-1.25, это нормально вообще?
Батч 2, разрешение 768, bf16.

Может там файлы докачать надо какие?
Аноним 23/08/23 Срд 19:12:41 464423 374
>>464421
Кохай еще и про неустановленный triton что-то выводит.
Насколько он критичен?
Аноним 23/08/23 Срд 20:16:00 464453 375
>>464421
Чел, тут нет ванг чтоб догадаться какой у тебя конфиг тренировки. От разных оптимизаторов/моделей/лор/параметров может быть разница в разы.
Аноним 23/08/23 Срд 21:13:45 464528 376
>>464073
Макака у тебя в голове в тарелочки бьет, а тут сидят благородные доны.
Аноним 23/08/23 Срд 21:19:32 464538 377
>>464453
Вот и я думаю, где я облажался. Чистый кохай, безо всего, дефолт-настройки, только на 768 разрешение переставил.
А тренит так же медленно, как бесплатный гугловский коллаб.
Аноним 23/08/23 Срд 21:29:51 464557 378
Аноним 23/08/23 Срд 21:56:46 464600 379
Аноним 23/08/23 Срд 22:23:32 464624 380
photo2023-04-28[...].jpg 28Кб, 512x512
512x512
photo2023-04-28[...].jpg 39Кб, 640x640
640x640
photo2023-04-28[...].jpg 38Кб, 512x512
512x512
photo2023-04-28[...].jpg 80Кб, 1005x737
1005x737
photo2023-04-28[...].jpg 43Кб, 448x512
448x512
photo2023-04-28[...].jpg 75Кб, 872x1024
872x1024
photo2023-04-28[...].jpg 45Кб, 512x640
512x640
photo2023-04-28[...].jpg 24Кб, 512x320
512x320
Объясните ньюфагу, как делать такие пикчи. Спасибо.
Аноним 24/08/23 Чтв 17:22:49 465237 381
>>423401
>DPM++ 2M Karras
А в чем прикол карася и вообще какой семплер самый лучший? Я немного поигрался и кажется, что лучше Эйлера ничего нет, а остальное все какую-то шумящую мазню генерит
Аноним 24/08/23 Чтв 17:29:03 465247 382
>>465237
> какой семплер самый лучший?
Очевидный Рестарт. Euler - это худший семплер по качеству пиков.
Аноним 24/08/23 Чтв 17:30:52 465250 383
>>465247
Можно пруфы, картиночку там сравнительную? Пока картинки из шапки только подтверждают мои наблюдения
Аноним 24/08/23 Чтв 17:34:47 465255 384
1580156591924.png 10653Кб, 4864x2190
4864x2190
1586737889038.png 7839Кб, 4864x2190
4864x2190
1670045491165.png 9082Кб, 4864x2190
4864x2190
>>465250
Euler лучший только по мыльности и уродствам, в этом ему нет равных, да.
Аноним 24/08/23 Чтв 18:17:37 465297 385
image 981Кб, 874x857
874x857
>>465255
охуенный, ничего не скажешь
Аноним 24/08/23 Чтв 19:01:49 465322 386
есть тут живые мальчики и девочки? Может мне кто-нибудь помочь сгенерить картинку, я сам не смог подобрать нужный промт. У меня на юмани остался доллар, скину за помощь
Аноним 24/08/23 Чтв 19:06:11 465324 387
>>465322
> доллар
Зарепортил валютного провокатора.
Аноним 24/08/23 Чтв 19:07:33 465325 388
>>465324
ну 108 рублей, чо душнишь?
Аноним 24/08/23 Чтв 19:37:12 465346 389
>>465325
Короч, ёпта. Мне нужен картинка в реалистичном стиле. Тощий мужик в обычной одежде (пиждак, брюки, рубашка). Одежда грязна я и в пятнах крови. Голые участки кожи (руки, шея) в царапинах и кровоподтёках, но не прям в мясо. В руках держит горящий факел (просто палка с тряпкой. Не такой, который на стенах в замках). И самое главное. Голова его полностью перемотана бинтами, на 100 процентов покрыта. Бинты тоже немного в грязи и со следами крови. На месте рта красной краской нарисована несколькими линиями широкая зубастая улыбка от уха до уха, как у чеширского кота. Фон или лес или кирпичная стена, или вид на город с крыши.

Я могу больше ста рублей скинуть. Скока вам там нада за помощь?
Аноним 24/08/23 Чтв 19:40:42 465350 390
image.png 631Кб, 1818x305
1818x305
image.png 1486Кб, 1147x705
1147x705
image.png 1749Кб, 1681x864
1681x864
>>399707 (OP)
Почему во время тренировки генерируются розовые пикчи? Пробовал разные датасеты даже убирал розовые пикчи - всё ровно получается розовая херня.
Аноним 24/08/23 Чтв 19:45:21 465360 391
>>465350
Протегай нормально, чтоб в описании пикчи было написано про цвет. Протести на генерации чтоб твоё описание выдавало такие же розовые пики, блять.
Аноним 24/08/23 Чтв 19:52:17 465369 392
В колабе koha мне нужно делать BLIP Captioning, если я уже прописал описание всех картинок?
Аноним 24/08/23 Чтв 20:19:30 465400 393
Блять я час заполнял хуйню в kohya lora и там крашнулось из-за недостатка памяти потому что я чет ен то ввел и гайдов нет нормальных, пиздец как же хуево ну почему никто не может помочь и сказать что выставлять там блять
Аноним 24/08/23 Чтв 20:23:47 465405 394
train settings1.png 137Кб, 1920x738
1920x738
train settings2.png 154Кб, 1898x945
1898x945
>>465360
Я без описаний генерирую (т.е. в дата сете нет txt файлов) просто стиль (style.txt).
Но почему именно розовый цвет?
Аноним 24/08/23 Чтв 21:07:11 465463 395
>>465405
Зачем ты эмбеддинг тренишь?
мимо
Аноним 24/08/23 Чтв 21:10:00 465468 396
Аноним 24/08/23 Чтв 22:27:26 465587 397
image.png 40Кб, 1375x238
1375x238
image.png 602Кб, 448x640
448x640
>>465463
Причины. Хочу посмотреть как можно вернуть художников в кастомные модели\миксы. Хочу просто научить какие тянки\одежда мне нравятся чтобы не писать длинные промпты. Интересно как современный эмбединг будет интерпретироваться старыми художниками (т.к как видел очень интересные результаты используя старых художников + ембединг на портретные фото(рил)). Не хочу просто ограничиваться промптами.
Аноним 24/08/23 Чтв 22:51:21 465625 398
>>465587
Не проще ли сделать лору на художника?
Аноним 25/08/23 Птн 00:10:18 465752 399
>>447310
Анон ты пробовал тренить анимешную модельку с подробным описанием? Мне интересно хорошо ли получиться, возможно описание тегами и его последствия стали бедствием для анимешных моделей, а пока xl не разогналась возможно ещё всё можно исправить, видел 1 модельку которую тренели таким методом но не тестировал https://civitai.com/models/128351/anime-natural-language-xl
Аноним 25/08/23 Птн 00:43:15 465791 400
изображение.png 16Кб, 972x105
972x105
>>465247
>Очевидный Рестарт.
У мну такого нету.
Аноним 25/08/23 Птн 00:47:02 465797 401
Anthony van Dyc[...].png 453Кб, 448x640
448x640
>>465625
Меня не интересует один конкретный художник, мне нужно несколько. К тому же можно выбрать какие картины мне нужны у некоторых артистов рисует автопортреты (женщины получаются с усами), а можно обучить на женских портретах и будет рисовать женщин скорректировать баланс белого, перед обучением%% к примеру в фотошопе и т.д.
Ну и к тому же лора влияет на скорость и память, а люблю добавлять по 5-6 художников на промт.
Аноним 25/08/23 Птн 11:59:07 465992 402
>>464624
Контролнет, тайл и с параметрами поиграться
>>465587
> вернуть художников в кастомные модели\миксы
Врядли эмбеды здесь будут хорошим выбором, тринарт аккуратно подмешивай, а еще лучше через будку дотрень.
>>465752
Все упирается в качественный теггер, результаты беглого осмотра популярных вариантов не понравились. Если тем более готовый датасет есть - скидывай, можно попробовать.
Аноним 25/08/23 Птн 14:00:56 466074 403
francois bouche[...].png 431Кб, 448x640
448x640
>>465350
Бамп
>>465992
Мне очень хочется поэкспериментировать с эмбеддингами и самому убедится.
>тринарт
А что это?
>а еще лучше через будку дотрень
Типо под каждого художника отдельную SD модель тренировать?
Аноним 25/08/23 Птн 17:39:51 466230 404
>>466074
> А что это?
Файнтюн sd 1.5 который как раз натренен на художниках
> Типо под каждого художника отдельную SD модель тренировать?
Под всех вместе сразу, если сделать все правильно то будет модель что воспроизводит стили художников на которых тренировалась. Аккуратный теггинг датасета обязателен.
Аноним 25/08/23 Птн 20:44:28 466356 405
>>465992
> Все упирается в качественный теггер
Мимо https://rentry.org/ckmlai#ensemblefederated-wd-taggers пробовал это? Вроде неплохо тегает, только не разбирался пока как туда добавить ещё чтобы персонажей протегивало, там где то это походу выключено. Но это бору теги конечно же.
>>466230
> Файнтюн sd 1.5 который как раз натренен на художниках
Спрашивал у того исследователя стилей каких уникальных художников он находил в тринарте и позже пробовал их же промптить на обычной 1.5, и они себя проявляли и там тоже, это походу мем с художниками в тринарте.
Аноним 25/08/23 Птн 21:08:22 466385 406
weghwe.png 825Кб, 1200x630
1200x630
Аноны, а тут кто-нибудь уже пробовал на основе своей 3д модели обучать Лору или что-то еще?

Короче, ебался я с img2img рендеров моего 3д персонажа и понял что это хуйня полная. Картинку слишком пидорасит при низком нойзе, а при высоком получается уже не мой персонаж. Хочу следующее:
1) Наделать кучу рендеров 3д модели и обучить Лору на них.
2) Поставить персонажа в нужную позу, сделать рендер Depth Map в 3д максе или Блендере.
3) Использовать свою Лору, скормить Depth карту в ControlNet, генерировать.

Правильно я понимаю, что такой алгоритм самый совершенный для 3д моделей на данный момент? Из всех Control Net моделей именно Depth даст лучший вариант, а всякие OpenPose или Canny хуже?
Аноним 25/08/23 Птн 21:20:02 466403 407
>>466385
Ты сделаешь литерали тоже самое, как обучают на артах. Только ты можешь сразу сделать рендеры с разных углов, в разных позах и одежде.

И для контролнета можно не только карту глубины, но и openpose использовать
Аноним 25/08/23 Птн 21:29:13 466412 408
>>466403
> в разных позах и одежде.
Позы будут разные, но вот одежда всегда одна. У меня цель в том чтобы максимально "постоянного" персонажа получить. Обычно фейлы все же с разной одеждой на каждой генерации.
Аноним 25/08/23 Птн 21:33:32 466419 409
>>466412
Ну если у тебя перс всегда в одинаковой одежде, тогда норм. Но если ты планируешь ее менять, то лучше дать примеры, как он выглядит в другой одежде. И протегать все соответствующе
Аноним 25/08/23 Птн 21:34:00 466421 410
>>466385
>Картинку слишком пидорасит при низком нойзе, а при высоком получается уже не мой персонаж.
Я с денойзом в 90 и контролом на тайлы юзаю, мне норм.
Аноним 25/08/23 Птн 21:37:37 466425 411
>>466385
> Из всех Control Net моделей именно Depth даст лучший вариант, а всякие OpenPose или Canny хуже?
Для позы лучший результат будет с Openpose, на бекграунд он слабо влияет и можно исправлять скелет вручную. Можешь и несколько разных контролнетов подрубить для пущего эффекта с разными весами и эндинг поинтами.
> Наделать кучу рендеров 3д модели и обучить Лору на них.
Есть немалый шанс что у тебя заодно подхватится и 3дшность.
Аноним 25/08/23 Птн 21:50:00 466454 412
12239-355320907[...].png 1562Кб, 1280x1280
1280x1280
>>466385
Зачем тебе ебаться с генерацией, когда можно просто красиво зарендерить?
Ну а вообще пайплайн красивый, если с обучением лоры не проебёшься - должно получится хорошо.
Аноним 25/08/23 Птн 21:51:00 466456 413
>>466425
>Для позы лучший результат будет с Openpose
Да, но только вот напрямую из своего 3д-пакета я не получу OpenPose, надо будет отрендерить персонажа и использовать препроцессор который может и ошибиться.
>Можешь и несколько разных контролнетов подрубить
Какие кроме Depth и OpenPose стоят внимания?

>Есть немалый шанс что у тебя заодно подхватится и 3дшность.
Ну, это можно попробовать обойти тун-шейдерами, редактированием нормалей и самой сетки под нужный ракурс.
Аноним 25/08/23 Птн 22:14:27 466482 414
>>466456
> Да, но только вот напрямую из своего 3д-пакета я не получу OpenPose
Получишь https://toyxyz.gumroad.com/l/ciojz?layout=profile
> препроцессор который может и ошибиться
А для этого чтобы не ебаться с блендером можно использовать костыль самого вебуи https://github.com/huchenlei/sd-webui-openpose-editor
> Какие кроме Depth и OpenPose стоят внимания?
Другие там для других целей просто нужны, конкретно для поз вообщем то только эти и стоят, ну может что-то для линий ещё, типо кенни и лайнарт, скриббл. В идеале конечно чтобы был тег на твою позу, или что то похожее, чтобы не сильно пришлось после инпеинтить. Комбинация двух вещей, промпта и контролнета всё таки себя лучше показывает, чем просто мучать контролнет с усилением.
> Ну, это можно попробовать обойти тун-шейдерами, редактированием нормалей и самой сетки под нужный ракурс.
Есть способ покруче, но сам не пробовал, лишь манятеория https://rentry.org/bp87n решить вопрос подхватывания стиля как настоящий командир жифорса.
Аноним 25/08/23 Птн 22:16:16 466483 415
>>466456
>напрямую из своего 3д-пакета я не получу OpenPose
Получишь, если сделаешь скелет и материалы к нему. Для блендера есть риг OpenPoseBones, где так и сделано.

>стоят внимания?
Canny

>попробовать обойти тун-шейдерами
Да, шейдеры под аниме. Только там могут быть проблемы и необходимость менять геометрию модели для нормальных теней


>>466482
Ты написал на секунду раньше меня;(
Аноним 26/08/23 Суб 02:28:07 466662 416
Аноны, на каких моделях вы тренируете лоры? NAIfull еще норм или пора перекатиться на что-то поновее?
Аноним 26/08/23 Суб 03:02:45 466677 417
>>466662
Если концепт или если хочу что то отделить от стиля то на най, если хочу сохранить стиль, например персонаж со оригинальным стилем или просто стиль какой то то на чём то что близко к юзаемой модели, мимо нихуя не разбираюсь
Аноним 26/08/23 Суб 05:48:29 466724 418
>>399707 (OP)
>Гайды по апскейлу от анонов
>https://rentry.org/UpscaleByControl

Cоветую в начало добавить, какие экстеншоны надо установить, я несколько раз гуй перезапускал, напряжно по новой одни и те же настройки ставить.

В самом гайде:
>Ниже приводятся настройки на максимальное «сплющивание» картинки в 2D-анимешность.

А можно настройки не сплющенности, а уже для реализма добавить? А то гайд слишком узконаправленный.

>Промт менять смысла уже почти не имеет. Denoise 0.75, Steps 50. Включаем Tiled Diffusion: Mixture Diffusers, Enable Noise Inversion, апскейлер порезче (напр. Anime6B), Inversion Steps 50, Renoise 0.

Автору стоит обратить внимание на консоль:
>warn: noise inversion only supports the Euler sampler, switch to it sliently...

Так что апскейлер будет использоваться дефолтный.
Аноним 26/08/23 Суб 06:08:21 466729 419
>>466724
Тьфу, сэмплер, потому что я по привычке карася впихнуть пытался, наверно это стоит уточнить, чтоб знали.

А ещё куда сосноль выдала ошибку:
torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 31.29 GiB (GPU 0; 12.00 GiB total capacity; 14.18 GiB already allocated; 0 bytes free; 14.40 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

Поэтому 4 пункт у меня требует сосать бебру, наверно придется сидеть на ультимате сиди апскейле. Хотя хотелось бы узнать, что делать, что бы это работало.
Аноним 26/08/23 Суб 06:13:49 466731 420
>>466724
>>466729
А ещё хотелось бы услышать, почему в пунктах 1-3 апскейлер используется латент, а не тот же DPM++ SDE Karras и иже с ними.
Аноним 26/08/23 Суб 06:18:38 466733 421
>>466729
Ты тайтелед вае врубил?
>>466731
Ты не путаешь апскейлер и семплер?
Аноним 26/08/23 Суб 06:26:46 466735 422
>>466733
>Ты тайтелед вае врубил?
В гайде ничего не сказано.

>Ты не путаешь апскейлер и семплер?
Да, я опять путаюсь в показаниях. Почему используется латент, а не те же ерсганы и валары и т.д.

И да, попробовал тайлед диффужн 1 ко 1 сделать, пиздец он медленно работает:
MixtureOfDiffusers Sampling: 57%|| 57/100 [09:17<27:01, 37.72s/it]
Аноним 26/08/23 Суб 06:36:32 466736 423
>>466735
Латенты дают больше всего деталей и быстрее (вроде как), ну а то что апскейлиться так долго это из за того что ты уже большую картинку апскейлишь, или у тебя видюха старая, хотя вижу что вроде 12 гб, 3060? В любом случае ты платишь такую цену за то что у тебя не будет швов и если с нойз инвершеном то избавившийся от лишней детализации, вроде как он тоже увеличевает время апскейла
Аноним 26/08/23 Суб 06:42:44 466738 424
image.png 55Кб, 1091x120
1091x120
image.png 99Кб, 1615x389
1615x389
>>466736
Лучше, 2060. А ещё есть шанс, что у меня опять слетели дрова, что бывает, когда пытаешься заапскейлить больше чем 1920х1080, попробую перезапустить.
И да, опять же в гайде не сказано, какой экстеншн откуда качать, в частности меня интересует только последний DEPTH, вот где его брать, мне 5 штук предлагают, я чет не понимат. Заранее благодарю за помощь.
Аноним 26/08/23 Суб 06:46:24 466740 425
Аноним 26/08/23 Суб 06:52:59 466742 426
>>466736
Ну, у меня все в мыле от латента, поэтому я им не пользуюсь, деталей не наблюдаю как-то.
Аноним 26/08/23 Суб 06:57:40 466744 427
>>466742
Так денойз побольше ставь, при хайрезфиксе 0.65-0.7, в гайде написано больше потому что с контролнетом
Аноним 26/08/23 Суб 07:20:59 466749 428
Аноним 26/08/23 Суб 11:07:53 466832 429
20230826110636.jpg 413Кб, 1500x2000
1500x2000
Нет сейчас доступа к пк, раскрасьте кто-нибудь это нейронкой плиз.
Аноним 26/08/23 Суб 12:12:06 466884 430
>>466482
>>466483
Спасибо за советы, аноны. В таком случае может в самом деле OpenPose интереснее будет. Вообще одежда в 3д выглядит неестественно, если только ручками не добавлять полигонов и не править геометрию код каждый кадр.
Может быть в самом деле стоит OpenPose болванчиков для позинга использовать, а информацию об одежде нейронка будет брать из моей Лоры. Только не знаю несколько точно она одежду повторять будет, и не будет ли отсебятины. Тут только тестировать на практике.
Аноним 26/08/23 Суб 14:50:23 467006 431
18981-149701936[...].png 397Кб, 600x800
600x800
>>466832
Без ТЗ результат ХЗ.
Аноним 26/08/23 Суб 15:29:49 467030 432
image.png 162Кб, 241x235
241x235
Технаны, подскажите в чем прикол. Это овертюн же, если артефачит на всем кроме карася? Как пофиксить постфактум? Клип заменял - не сильно помогает.
Аноним 26/08/23 Суб 15:42:16 467041 433
>>467030
>241х235
>базовое разрешение модели 512х512
>в чем причина
Аноним 26/08/23 Суб 17:03:08 467100 434
image.png 95Кб, 865x685
865x685
image.png 1676Кб, 1833x572
1833x572
>>465350
Бамп
>>466230
>Файнтюн sd 1.5 который как раз натренен на художниках
Откуда эта инфа? В описании написано что это просто анимешная sd1.5. Или ты имеешь ввиду туда натринеровали аниме художников?

1)Кастомный микс MilkyChicken + R34
2)Тринарт 2 (Characters)
3)SD 1.5
Аноним 26/08/23 Суб 18:42:01 467175 435
>>467041
это кроп с артефактом, разрешение там стандарт 512x768
Аноним 26/08/23 Суб 19:34:06 467211 436
>>467175
Тогда сори;(

Попробуй на разной силе, если это лора.
Аноним 26/08/23 Суб 19:38:25 467216 437
>>467211
на любой силе артефачит ебальник и чтото еще, но в основном ебальник, это не лора
Аноним 27/08/23 Вск 17:25:25 467980 438
Аноны, кто нибудь генерит тут с амд? У меня RX6700 XT, и я не могу сделать апскейл даже до 1024, мульти дифужн и тайлед вае использую. Постоянно выбивает недостаточно памяти, хули ему 12 гигов то мало? Щас листаю гитхаб директ мл, пробую разные настройки оптимизации, но все равно не получается. Может кто нибудь уже подобрал оптимальные, посоветуйте плиз.
Аноним 27/08/23 Вск 18:58:08 468063 439
Такой вопрос - можно ли как-то в вебуи от автоматик1111 генерировать сразу в нескольких семплерах без ручного переключения? Может какое расширение есть?
Аноним 27/08/23 Вск 19:02:18 468072 440
изображение.png 60Кб, 920x676
920x676
>>468063
Есть по дефолту скрипт
Аноним 27/08/23 Вск 19:20:33 468093 441
Аноны, чё делать, если на колабе генерация практически сразу же прерывается и он пишет, что в тензоре NaN?
Аноним 27/08/23 Вск 19:22:28 468098 442
>>468093
Не использовать коллаб. Купи себе хотя бы 3060.
Аноним 27/08/23 Вск 19:25:05 468103 443
>>468072
Спасибо анончик.
Аноним 27/08/23 Вск 19:36:51 468115 444
>>468098
Да у меня ноутбук блять амудешный. Ага, купи, я миллионер блять, конечно
Аноним 27/08/23 Вск 19:55:00 468140 445
>>468115
Ты часто меняешь место жительства? Нет? Ну так что мешает собрать себе ПК на 3060 за 50к (без монитора)?
Аноним 27/08/23 Вск 19:59:02 468143 446
>>468140
пока что для меня 50к это большие деньги, я предпочту их потратить на что-то более важное и материальное, а картиночку руками не потрогаешь
Аноним 27/08/23 Вск 20:02:13 468150 447
>>468098
И генерить квадратики? Нахуй надо, уж если покупать под это дрочево видюху, то так чтобы пикчи 4-8к запекались, и вместе со всеми контрол нетами и прочими актуальными ебами.
Аноним 27/08/23 Вск 20:09:14 468163 448
>>468150
На коллабе вообще дохлые T100, о чем ты?
Аноним 27/08/23 Вск 20:17:00 468179 449
>>468163
У меня там получалось запечь охуенную 8к картинку за 15-20 минут, пару месяцев назад. Чё щас не знаю.
Аноним 27/08/23 Вск 20:26:01 468199 450
Подскажите где позы для контролнета брать. Желательно с поддержкой тегов. Как я понимаю лучше всего он работает с реальными людьми.
Может буры с картинками с реальными людьми?
Аноним 27/08/23 Вск 21:02:48 468284 451
>>468163
А что тогда не дохлое? Алсо интересно, они реально отдают мне целую настоящую карточку или используют какой-то механизм выделения?
Аноним 28/08/23 Пнд 00:09:56 468586 452
>>468284
>или используют какой-то механизм выделения?
Само собой это.
Аноним 29/08/23 Втр 12:56:01 469990 453
pedro.mp4 864Кб, 480x480, 00:00:08
480x480
>>399707 (OP)
А обучение ЛОРы требует меньше vram чем обучение эмбединга?
А то я заебался что на gtx 1660, как ни кручу, никак не влезает 2 мб.
Аноним 30/08/23 Срд 00:47:28 470717 454
>>469990
>А обучение ЛОРы требует меньше vram чем обучение эмбединга?
Больше, ибо лора это более глубокое обучение, чем эмбедингю.
Аноним 30/08/23 Срд 01:25:49 470782 455
>>467216
Отключай Restore Faces. Он лица только ломает (обычно).

Делай апскейл хайрезфиксом. Такая фигня может случаться от того, что в сетах были мешанина из реалистик картинок, аниме, и чего-то очень сильно стилизированного.
Аноним 30/08/23 Срд 01:27:03 470786 456
>>469990
Позакрывай разные приложения. Они тоже бывают по чуть-чуть отжирают. Браузерные вкладки, стим, дискорд...
Аноним 30/08/23 Срд 03:29:22 470860 457
>>470782
рестор выключен по дефолту всегда
лица ломаются перманентно, частично ломаются фоны и так далее зависит от сида
я так понимаю модель по пизде идет и там по слоям что-то сдвигается, мне бы какой фикс найти под это дело, замена клипа не работает, подмена юнет тоже, трейн дифренс с дополнительными полностью рабочими моделями ухудшает артефакты еще больше
Аноним 30/08/23 Срд 19:46:32 471512 458
>>470717
Ясно, спасибо.
>>470786
2 мегабайта стабильно не хватает и 448х448 и 320х320 и с открытыми приложениями жрущими vram и закрытыми все ровно 2 мб. Пробовал Kohya_ss, webUI, Onetrainer, vladmandic. Остается только sd-scripts.

Хотя генерировать могу по 5 пикч (448х640)одновременно, не уходя в lowram mode, но только на комфиЮИ.

А у тебя тоже 1660?
Аноним 30/08/23 Срд 19:54:53 471522 459
>>471512
gradient accumulation ебани, оно будет меньше врам кушать, но и тренировать медленнее.
Аноним 30/08/23 Срд 21:13:14 471606 460
image.png 17Кб, 865x124
865x124
>>471522
Вообще никак не повлияло. Мне интересно это SDXL все разъебал или у меня просто старя версия шин10.
Аноним 30/08/23 Срд 21:31:01 471629 461
>>471606
Оно блоками память выделяет, увеличивай градиент, уменьшай батч сайз, кешируй латенты на диск
Аноним 30/08/23 Срд 21:33:12 471632 462
>>471629
Хотя тренировать SDXL на 6 гигах у тебя вряд ли получится в принципе.
Аноним 30/08/23 Срд 22:02:09 471690 463
>>471629
>увеличивай градиент
и 2 и 128 пробовал
>уменьшай батч сайз
всегда 1
>кешируй латенты на диск
теперь требует 16 мб
>>471632
Нет, я имел ввиду что поддержка SDXL сломала тренировку в SD1.5. Вот у Kohya gui просят отдельный бранч для SD1.5 сделать, т.к. скорость\качество стало хуже. Может и требования для тренировки SD1.5 тоже увеличилась. Я, конечно же, тренирую SD1.5.
Аноним 30/08/23 Срд 22:07:05 471700 464
>>471690
> скорость\качество стало хуже
Пиздят. Я на SDXL-ветке тренирую и 1.5, никакой разницы. За гуй не знаю, это уже не к кохе вопросы, а кто говно-гуй пилил.
Аноним 31/08/23 Чтв 00:53:29 471866 465
>>471512
>А у тебя тоже 1660?
Нет, у меня была 2070, но я на ней постоянно в 8 гигов упирался, приходилось иногда для включения контролнета убирать часть программ из памяти.
Аноним 31/08/23 Чтв 03:12:27 471945 466
>>469990
Тебе стоит попробовать gradient_checkpointing, а не аккумулейшион который для имитации батча, и да cache_latents_to_disk тоже. В сд-скриптсах соответствующие ключи, в гуях к нему тоже должны быть.
Аноним 31/08/23 Чтв 19:11:21 472521 467
00164,.png 2142Кб, 1496x2000
1496x2000
>>467006
Четкости не хватает, но мне лениво было с линиями париться.
Так что получилось как получилось.
Аноним 31/08/23 Чтв 19:12:03 472524 468
Аноним 31/08/23 Чтв 19:40:36 472597 469
image.png 161Кб, 1892x935
1892x935
image.png 47Кб, 909x823
909x823
>>471866
Понятно.
>>471945
А я не понял, в сд-скриптсах нужно самому создать лаунчер, да? В нашем гайде на 6гб нече про это не написано. После установки "редактирование скрипта", хотя "скрипта" в папке с программой нет.
Аноним 31/08/23 Чтв 19:43:30 472605 470
image.png 188Кб, 512x512
512x512
>>399707 (OP)
>demonic girl suited to highly detailed dress, 8k, beautiful
Мде
Аноним 31/08/23 Чтв 20:32:18 472681 471
>>472597
Там же скрипт от анона какой-то в гайде, скорее всего про него речь.
Аноним 31/08/23 Чтв 20:53:10 472710 472
>>472605
>шизопромпт
>512x512
Лiл
Аноним 31/08/23 Чтв 21:43:51 472763 473
>>472681
А, точно. Но судя по всему этот скрипт для лор.
Аноним 31/08/23 Чтв 21:56:58 472784 474
>>472763
Ну так а тебе что надо? В любом случае, скрипт тупо переменные проставляет дефолтные (Ну и пару вычислений на количество шагов делает необязательных), после чего 90% всего этого идет просто в параметры запуска train_network.py, так что кури хелпу к train_network.py и запускай как тебе надо, благо в хелпе кроме японского английский тоже есть.
Аноним 01/09/23 Птн 00:03:50 472912 475
>>472784
Что нужно сделать чтобы скрипт эмбединги тренил?
Аноним 01/09/23 Птн 00:42:45 473000 476
>>472912
Там есть скрипт train_textual_inversion.py
Аноним 01/09/23 Птн 03:50:53 473277 477
00011-665607121.png 2363Кб, 1080x1920
1080x1920
00027-665607121.png 1145Кб, 1080x1920
1080x1920
Новое обновление автоматика сэмплеры поломало что ли? DPM++2M SDE Karras, с теми же настройками.
Было и стало. Пиздец мыло. Иногда выдает совершенно другие арты.
Аноним 01/09/23 Птн 22:00:34 473843 478
15614504606380.jpg 21Кб, 400x385
400x385
>>473000
>>469990
Спасибо, всем кто помогал. Я достиг предела своей компьютерной компетентности. sd-scripts оказался сильнее. Следующий раз попробую эмбединги если\когда установлю обновления на десятку и новые драйвера (531).
Аноним 01/09/23 Птн 23:07:43 473929 479
>>472597
> А я не понял, в сд-скриптсах нужно самому создать лаунчер, да? В нашем гайде на 6гб нече про это не написано.
Гайд староват и был написан когда и половины того, что сейчас есть, не было, давно пора бы переделать. Если совсем плохо понимаешь, лучше в гуе дерриана поставь вот так градиент чекпоинтинг, а остальные настройки свои. Я бы мог тебе скинуть конфиг для самого непопулярного гуя местного анона, ведь я пользуюсь именно им, но мне кажется ты ещё больше запутаешься, так как там нужен готовый венв с сд-скриптсами.
>>473843
> Следующий раз попробую эмбединги
Зачем? Он же для совершенно иного предназначен.
Аноним 01/09/23 Птн 23:08:38 473932 480
1680947278566.png 80Кб, 1904x946
1904x946
Аноним 01/09/23 Птн 23:56:44 473968 481
image.png 1420Кб, 900x900
900x900
>>469990
>>473843
Оно stable diffusion portable, каким-то хуем, заработало!
>>473929
> Следующий раз попробую эмбединги
>Зачем? Он же для совершенно иного предназначен.
Это я и пытался сделать, но наверно плохо это скоммуницировал.
Аноним 02/09/23 Суб 02:06:09 474026 482
Снимок.JPG 22Кб, 941x111
941x111
Что этой параше не нравится. В папке есть картинки.
Аноним 02/09/23 Суб 02:08:08 474028 483
>>474026
Буквально то что она написала, отсутствует необходимая структура папок в датасете.
Аноним 02/09/23 Суб 02:14:39 474031 484
>>474028
Какая нахуй структура?
Структура иерархии каталогов другой и не может быть. папка внутри папки внутри картинки.
Они называть должны как-то конкретно? Так там в примере они называются dog и cat.
Мне их что так же надо назвать? Это чё прикол такой?
Аноним 02/09/23 Суб 02:18:03 474033 485
>>474031
Внутри папки датасета должна быть одна или несколько папок, с именем N_xx где N - число повторений при обучении, xx - имя концепта (можно любую букву поставить если каждая пикча протегана). Внутри уже этой(тих) папок должны быть пикчи.
> Мне их что так же надо назвать?
В начале число повторений, потом имя, например 4_cat 14_dog.
Аноним 02/09/23 Суб 03:26:55 474056 486
>>474033
Ну я поставил 40_woman.
Оно там начало что-то крутить, и создало файл .safetensors.
Я закинул его в папку лоры. Добавил в промт. И нихуя. Ну типа нет ни намека, что баба фото которой лежали в папке 40_woman, как-то влияют, на то, что выдается.
Оно как генерило дженерик баб, так и продолжает генерить.
Аноним 02/09/23 Суб 04:47:20 474076 487
sdxl is useful.png 2438Кб, 1536x1024
1536x1024
nai-loss.PNG 53Кб, 2500x807
2500x807
sdxl-loss-wft.PNG 351Кб, 2505x801
2505x801
nai-batch.jpg 984Кб, 3072x3072
3072x3072
sdxl-batch.jpg 1115Кб, 3072x3072
3072x3072
sdxl-test.png 41370Кб, 4480x4708
4480x4708
У кого-нибудь вышло подобрать базовую модель и параметры для треньки SDXL-лор на аниме-тяночек? Насколько я понимаю, оригинальная SDXL модель хорошо обучается на реалистик, а вот как правильно обучать аниме - непонятно, и лор на персов очень мало в публичном доступе. Судя по описанию лор на цивите, для обучения пытаются использовать либо оригинальный SDXL, либо CounterfeitXL.

Тестирую разные параметры обучения, оптимальные значения пока не ясны. Для теста взял датасет из ~200 картинок с 5 повторами на эпоху (т.е. суммарно ~1000 шагов на эпоху, без учёта батчей) и пытаюсь подобрать параметры обучения, пока выходит не очень. Хотя для того же NAI всё прекрасно тренится. На всех пиках (кроме первого) промпты идентичны, эмбеддинги не используются. Для теста 1.5 на пиках CounterfeitV3 (ген 512x512 и апскейл x2), для теста SDXL - CounterfeitXL (просто ген 1024x1024).

Есть идеи, в какую сторону копать? Или может пока не выйдет достойного базового чекпоинта под аниме не имеет смысла даже пытаться?
Аноним 02/09/23 Суб 12:19:32 474193 488
Скажите лоры подобные этой https://civitai.com/models/58390/detail-tweaker-lora-lora, всякие твикеры тренеруються через Weighted captions? Я так понял таким образом можно научить различать модель "полярные" особенности
Аноним 02/09/23 Суб 13:21:21 474226 489
16018342409450.jpg 171Кб, 1920x816
1920x816
Еще раз спасибо всем кто мне ( >>469990 ) помогал.
Аноним 02/09/23 Суб 13:23:19 474228 490
>>474056
Какие были параметры тренировки, в инфо генераций было указано что лора подгрузилась и приведен ее хэш?
>>474076
> пока не выйдет достойного базового чекпоинта под аниме не имеет смысла даже пытаться
Скорее всего this, плохой результат может быть не только/столько из-за лоры а таков общий перфоманс модели. На всякий уточню - разрешение пикч датасета 1024+? Ты просто лору делаешь или локон/ликорис/... с дополнительными матрицами?
Что насчет скопировать параметры тренировки из лоры на реализм? С размерностью и альфой игрался?
В wd результат улучшала тема с добавлением в теги их триггеров анимца (tone mapped, anime, ...), но последняя подделка xl по дефолту их не использует, так что может и толку не будет.
> эмбеддинги не используются
Рекомендованный негатив cfxl подкидывать не пробовал?
Для начала дефолтный грид с разным лр надо пощупать, сколько там тренировка одной лоры занимает?
Аноним 03/09/23 Вск 02:08:04 474860 491
>>474228
>Какие были параметры тренировки
Да я там вообще не менял никакие параметры.
Я понял что это тупо зависит от названия папки. 40_woman.
Поставил 260_woman и что-то начало появляться.
Но всё равно похожее ебало только мелькает на предпросмотре в процессе генерации, когда картинка мыльная. А финальный результат всё равно нихера не похож на тренировку.
Аноним 03/09/23 Вск 09:00:36 474919 492
>>473277
у тебя второй пик на euler a
Аноним 03/09/23 Вск 09:55:20 474932 493
xyzgrid-0102-66[...].png 1113Кб, 1072x1134
1072x1134
>>474919
Ну я же не настолько дебил, что бы не заметить, что я мог не тот сэмплер влепить, когда я всегда на одном и том же делаю. После обновы так вся линейка DPM++2M SDE и DPM++3M SDE начало выдавать ебейшее мыло с проебом деталей.

Вот тебе euler a и DPM++2M SDE Karras в качестве пруфа. Еулер даже лучше работает, та что ты ошибся.
Аноним 03/09/23 Вск 09:57:02 474936 494
>>474932
Поправлю себя: все сэмплеры, которые включают в себя SDE после обновления стали выдавать ебейшее мыло. Так будет точнее.
Аноним 03/09/23 Вск 12:18:22 475008 495
>>474860
У тебя одна фотка чтоли? Число в имени это количество повторений пикч что внутри. Обычно их десятки или сотни, 260 даст безумное число шагов. Ну проблема у тебя явно в параметрах и/или датасете.
>>474932
Забекапь жсон с параметрами, удали, после запуска выстави базовые необходимые настройки и попробуть опять сгенерировать.
Аноним 03/09/23 Вск 15:05:18 475166 496
>>474932
кинь промпт и настройки своей антилопы ебаной сюда, а еще для прикола попробуй все экстеншены обновить мож чо поправит
Аноним 04/09/23 Пнд 05:03:43 475825 497
NAI негатив.png 22466Кб, 2432x5220
2432x5220
CounterfeitXL н[...].png 21472Кб, 2432x5220
2432x5220
сколько рук.png 5295Кб, 2048x2048
2048x2048
>>474076
https://www.youtube.com/watch?v=N_zhQSx2Q3c
Попробовал ещё раз по параметрам с этого видоса, он там реализм тренит. Вроде немного получше, хотя может просто сиды удачные выпали, или у меня уже глаз замылился после нескольких дней разглядываниях этого добра на SDXL. Думаю, надо эпох побольше, или лр ещё выше сделать.

Не могу понять только, почему он почти всегда пытается какой-то "side-view from behind" сделать, если я его ни о чём таком не прошу. Только в 19 сиде поза почти на всех версиях лоры выглядит так, как я ожидал бы от такого запроса.

---

Базовая модель: https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_base_1.0.safetensors
Batch size выставил в 4 чтобы пекой можно было пользоваться пока лоры тренятся, а так вроде 6 максимум влезает в 24GB VRAM.

Попробовал варианты с/без треньки текстового энкодера и вариант с SD-style промптами (сгенерил через blip captioning) вместо booru-like, раз у нас базовый чекпоинт не аниме.

В видосе упомянули эти параметры, пробовал с ними тестить:
--network_alpha="16"
--network_dim=32

--learning_rate="0.0003"
--text_encoder_lr=0.0003
--unet_lr=0.0003

--optimizer_type="Adafactor"
--lr_scheduler="constant"

--no_half_vae
--mixed_precision="bf16"
--save_precision="bf16"
--cache_latents
--cache_latents_to_disk
--gradient_checkpointing

И ещё в видосе такую настройку через UI вбили в LR scheduler extra arguments, не понял, как она в кохя-скрипт передаётся:
scale_parameter=False relative_step=False warmup_init=False

>>474228
> На всякий уточню - разрешение пикч датасета 1024+?
Чекнул - и вправду, некоторые арты не дотягивают до 1024x1024 по какой-то из сторон. Так что стоит датасет перебрать.

> Ты просто лору делаешь или локон/ликорис/... с дополнительными матрицами?
Пока просто лору пробую.

> Рекомендованный негатив cfxl подкидывать не пробовал?
На пиках слева какой-то обычный негатив от nai, а справа копипастнул негатив с примера на цивите для CounterfeitXL. Эмбеддинг negativeXL_D скачал. Из того, что явно заметно - с рекомендованным негативом сильно отличаются цвета в зависимости от того, тренили ли мы на тегах в стилях бур или в стилях SD.

> Для начала дефолтный грид с разным лр надо пощупать, сколько там тренировка одной лоры занимает?
Одна эпоха при ~1000 повторах (батч сайз 4) и параметрами выше у меня тренится 10 минут.
Аноним # OP 04/09/23 Пнд 05:29:02 475827 498
.png 249Кб, 1356x1838
1356x1838
.png 95Кб, 1219x651
1219x651
Есть соображения, что поменять в шапке перед катом?

Поскольку SDXL релизнулся, предлагаю добавить в шапку схему его работы. Для этого можно объединить эти две картинки в одну. Вторую можно перевести перед этим, при желании; хотя я не вижу особого смысла в этом.

Всё написанное в секции про обучение SDXL вроде как ещё актуально. Разве что не уверен насчёт актуальности этой фразы:
> Всё пока сырое и имеет проблемы с совместимостью, только для самых нетерпеливых.
Аноним 04/09/23 Пнд 06:26:06 475835 499
>>475008
>Забекапь жсон с параметрами, удали, после запуска выстави базовые необходимые настройки и попробуть опять сгенерировать.
Так, абажди, а какой и где? config.json или ui-config.json в корневой папке, или вообще что-то конкретное в папке configs?
>>475166
Обновил, не поправилось. Все так же мыло выдает.
https://files.catbox.moe/609c0j.png
Аноним 04/09/23 Пнд 06:32:58 475837 500
>>475008
>Забекапь жсон с параметрами, удали, после запуска выстави базовые необходимые настройки и попробуть опять сгенерировать.

Да, это помогло. Удалил оба конфига, теперь мыла нет. Может что лишнее удалил, хз. Пасеба, теперь специальная олимпиада по выставлению всего обратно.
Аноним 04/09/23 Пнд 16:24:43 476136 501
Аноним # OP 05/09/23 Втр 08:05:12 476899 502
.png 111Кб, 985x1896
985x1896
.png 530Кб, 2546x1822
2546x1822
>>475827
> Всё пока сырое и имеет проблемы с совместимостью, только для самых нетерпеливых.
Уберу эту строку из шаблона перед катом, если нет возражений.

> Поскольку SDXL релизнулся, предлагаю добавить в шапку схему его работы. Для этого можно объединить эти две картинки в одну.
SDXL схему на коленке перевёл в вертикальную ориентацию, чтобы она нормально смотрелась в паре со схемой для SD 1.5. Она у меня в векторном представлении есть, можно поменять что-нибудь, если есть пожелания.

>>476136
> Тренировка Yolo детект моделей для адитейлера может будет полезна?
Давай добавим, лишним не будет.

➤ Тренировка YOLO-моделей для ADetailer
YOLO-модели (You Only Look Once) могут быть обучены для поиска определённых объектов на изображении. В паре с ADetailer они могут быть использованы для автоматического инпеинта по найденной области.

Гайд: https://civitai.com/articles/1224/training-a-custom-adetailer-model
Тулза для датасета: https://github.com/vietanhdev/anylabeling
Больше про параметры: https://docs.ultralytics.com/modes/train

---

Катну сегодня вечером, если больше нет предложений.
Аноним 05/09/23 Втр 15:21:25 477184 503
image.png 12Кб, 918x164
918x164
image.png 15Кб, 552x312
552x312
Мужики, тред не читал, не генерил чуть меньше месяца и пропустил некоторые вещи. Подскажите пожалуйста что это:

1. Что за XL модели? Краем уха читал что это полная дроч и поставить их тяжело, а так же не увидел список их недостатков и преимуществ в сравнении с обычными моделями.
2. Второй пик. Что это такое? Как я понял связано с XL дифуженом и как я понял это еще один способ апскейла и добавления деталей или што?
3. Уже все по отключал, так и не понял куда у меня кнопочки со стилями пропали. Пытался найти информацию об этом, но не нашел

Умоляю на коленях помогите
Аноним 05/09/23 Втр 19:20:34 477505 504
>>477184
три раза тебе ответ писал, но какие-то ебучие стоп-слова не дают отправить
Проебанные стили - это обноление автоматика
СДХЛ тут не при чем
Рефайнер - это улучшалка для СДХЛ и не только, просто забей, ни на что не слияет
Аноним 05/09/23 Втр 19:35:27 477533 505
>>477184
> Что за XL модели?
Новая версия от стабилити, аниме пока генерит посредственно, дедов может.
> Что это такое?
Рефайнер, буквально постом выше, индусы изобрели хайрезфикс, должен дорисовывать до выхода из латента картинку примерно на 0.8 как раз, но работает как то так себе.
> Уже все по отключал, так и не понял куда у меня кнопочки со стилями пропали.
Не пользовался ими. Вот эта кнопка с кистью у тебя на пик2 разве не то что тебе нужно?
>>476899
> Уберу эту строку из шаблона перед катом, если нет возражений.
Ну хз, сырость никуда не пропала, кохья до сих пор не добавил в мейн сдхл ветку, как и дерриан, чекпоинта для аниме тоже нету.
Ну кати, раз нету других предложений.
Аноним # OP 06/09/23 Срд 00:19:36 478083 506
>>478081 (OP)
>>478081 (OP)
>>478081 (OP)

> Ну хз, сырость никуда не пропала, кохья до сих пор не добавил в мейн сдхл ветку, как и дерриан, чекпоинта для аниме тоже нету.
Ок, оставил.
Ответить в тред Ответить в тред

Check this out!

Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов