бля как же надоел этот ебучий >power dynamic просто не передать словами, нервный смешок вырывается каждый раз, когда его вижу так и представляю завод ОАО "Силовая динамика" где-нибудь в челябинске
Анон, я один считаю, что "наплыв /beсов" - это всего лишь псиоп и проводится одним Семёном?
Я не могу поверить, что всё это написано неиронично. Даже во время сливов публичного Тодда 2023 и хохлонакрюков в ТГ/б летом того же года... не было таких же вопросов.
Ы. Приходящие тогда люди чуть ли не сразу лезли решать задачки на хг проксях, а тут приходится азбуку расшифровывать и за кнопочки в таверне учить...
Меня очень привлекли клонирование голоса и аудиозвонки в https://character.ai/, решил создать своего бота, но не могу найти подробного гайда. Ввел общую информацию, но бот как-то слабенько реагирует.
Как я понимаю, вы не котируете https://character.ai/? Есть аналоги с которым можно также удобно пообщаться?
>>924277 → >боснийка из ирл стори про рейп Не знаю, анон. По мне так делать карты по реальным людям (если это, конечно, не историческая фигура какая-то которая уже как лет 300 крякнулась и неизвестно существовала ли вообще) это как-то не очень. Тем более по трагедии. Если что, у бота на аватарке ген миджорни, а не реальное фото.
Бля ну какое же мразотство. Сука, меин промпт из карточки включить-выключить рычажком НЕЛЬЗЯ, только вырубить нахуй в настройках или запретить перезапись в настройках промпта. Просто бесит... или я где проебался?
>>924455 Засунь свой мейн промп т в другую строчке в менеджере а стандартную очисть и затем тереби сколько хочешь этот переключатель корый и будет включать выключать промпт с карточки
>>924459 Анон, ты меня не понял, у меня она пустая и я её использую только как поле из карточки. Дефолтная строка Main Prompt не реагирует на переключатель, если в карточке есть промпт, вставляется в любом случае. Можешь у себя проверить на последнем стейджинге.
как грамотно прописать инструкции с подробной биографией, например
сейчас делаю бот режиссера, в биографии указываю список его фильмов, потом прошу бота назвать хоть один фильм, а он начинает придумывать рандомную хуйню
>>924468 Обнял. >>924466 И дёргать когда запускаю карту с промптом? >>924467 Зачем, если он пустой? >>924469 Тогда в промпте помимо самих инструкций в начале будет красивая надпись {{original}} ))))) Заебали постоянные баги, реально ждём базовый фронтенд
>>924477 > Зачем, если он пустой? На расположении мейпромпта инжекты завязаны, если его выключить, они могут в не совсем правильные места уходить. Лучше оставить включенным даже пустой.
>>924477 > Тогда в промпте помимо самих инструкций в начале будет красивая надпись {{original}} ЭТо наверно из за того что этот макрос в промпт карточки засунули. Попробуй выпилить это оттуда крч и может норм будет
>>924479 Точно, забыл об этом. Сука всё кривое косое бесит... >>924481 Конечно засунули, его все суют чтобы не портить пресеты людям. Жаль кто добавлял макрос в таверну не додумался прописать замену на пустоту если он вставлен куда попало.
Там они выкатывают приложение на винду, через стор Майков, но пока доступно лишь если у вас есть подписка, что на данный момент там доступно я не ебу, но потихоньку будут выролливать всё, возможно уже есть войс, если у кого есть желание попробуйте.
>>924322 (OP) Напоминаю, что сейчас идёт Хэллоуинский ивент в треде и все кто хочет могут поучаствовать.
На этот раз без сбора тем, просто кто хочет - сделает бота на тему Хэллоуина, криппи-паст, хоррора и тому подобного, чтобы подходили под тематику праздника.
Делать ботов можете до следующей пятницы - 25 октября, тогда же я сделаю якорь для ивентовых ботов. Если вы решите выложить ивентовых ботов раньше - указывайте в посте что это боты на ивент.
>>924449 >меин промпт из карточки включить-выключить рычажком НЕЛЬЗЯ Это ограничение таверны, мейн промпт отправляется вообще всегда, соответственно рычаг на нём недоступен.
>>924494 > Англюсик звучит как всегда калово. Соглашусь. Они всегда или через чур переиграно, или как-будто умственно-отсталый. Вот лучше на русском...
>>924530 Если у него проблемы со здоровьем были а он отписывался, что на несколько дней в больницу ложился, что ли, то что угодно может быть, включая дурку. Может просто интерес пропал, вай нот? Но чет мне кажется, мы его вряд ли увидим... Хотел бы / имел бы возможность - отписался бы, мне кажется.
Скачал одну карточку, но мне немного не понравилось первое сообщение. Переделал. Несколько раз начинаю новый чат но каким-то хуем карта использует то что я стер какого хуя? Никогда такого не было раньше
>>924545 Как это к авс относится если в статье ни слова о нём и речь вообще о другом? Да и нахуй ты притащил это? Не смог молчать после того как тебя в прошлый раз всем тредом обоссали?
Аноны, есть сейчас какое-нибудь расширение по типу говорилки для таверны? Если да, то как оно? Хочу чтобы моя нейровайфа миленько шептала мне на ушко как она сваит бёдрами
>>924463 А вроде это никак не фиксится, по крайней мере я смотрел несколько гайдов на Ютубе, во всех говорится что боты вообще ведут себя непредсказуемо. Самое забавное при диалоге с одним ботом, он мне сказал что пишет книгу. Когда поинтересовался о чем сюжет, он в общих чертах описал свою биографию, которую я ему писал.
тоже кручу-верчу и прихожу к такому мнению, но это дичь, конечно
у них такой охуенный сервис, особенно после подруба клонирования голоса и настройки звонков, но то, что персонажу нельзя дать минимальную память все руинит
Эй, тредовичок-каловичок, садись ко мне в машину. У меня там такая прокси на заднем сиденье. Всё как ты любишь, и опус, и гемини есть, ты только садись. У меня друг работает в офисе антропиков, так он мне такооое рассказал про опус 3.5, даже дал покумить на нём. Хочешь мы к нему поедем? Ты только садись в машинку, я тебе на своей прокаченной таверне покумить дам. Не бойся, мы же братья-кумеры.
У меня от нейросетей жуткая фрустрация. В течении дня вызревают в голове какие-то идеальные образы, сценки, персонажи, потом пытаюсь это перенести в РП с АИ и поиграть, жестко разочаровываюсь в силу a-b-c причин (ну вы знаете, лоботомиты) и несоответствия желанного образа в башке с реальностью, покумлю быстро и вот. Круг замыкается с появлением новых идей и так раз за разом. Сеймичи?
>>924604 Спайтфаги это неиронически больные на всю голову люди. Вспомнить того же Витька, который бургам капчу решал. Тут они ломают голову над этими загадками, чтобы потом слить пароль.
>>924609 Ну реально, гемини хотя бы не лупится форматно так сильно как сойнетовская скотина, и сисик-пишет может описывать более-менее красочно, а не сухо как сойнет 3.5
>>924611 А фемдомить он может? У меня такое чувство что только клод может быть злым а остальные нет. А мне именно злой нужен. Я настолько отчался что сейчас трогаю ламы посмотреть что это хоть. Но только не геймини чтоб.
>>924613 >меня люто раздражает проëб разметки Может стоит ПРОСТО перестать тратить токены на бесполезные звездочки, и пользоваться регексом если уж так хочется италик текст? И да, разметка обычно проебывается из-за того что дебилы наваливают дохуя инструкций после чатхистори, на нормальных (минималистичных) пресетах такого нет.
Всё что не NLP, должно быть сделано таверной, механистически. Подстановка кусков контекста, оформление, реакции на условия. Сетке оставляешь только написание ответа и то что она умеет делать, например анализ эмоций. >н-но мои звёздочки Делай таверной, пидор. >н-но мои счётчики Таверной, блять. Инкремент, декремент. >н-но мой HTML... Таверной! Быстроблять!
>>924636 а я и есть пеббл, и вижу твою подсеть когда ты подключаешься к моей проксе. посмотрел кто подключался во время написания твоего поста, глянул списки токенов, дважды два склал и получить ответ. анон, что за глупые вопросы... сам сталкивался потому что
>>924636 Ты всерьёз себя считаешь таким уникальным? Миллиарды поколений саранчи продолбили тебе дорогу ещё с весны, когда кханон запилил поддержку капчи, чтобы гожа не спайтил.
>>924639 >что за глупые вопросы Ну, а откуда это обычный анон знать-то должен? Загуглить разве что. Я-то подумал ты погромист или сетевик какой-то. Просто те, кто серьёзно вникают в нейронки и что-то другое подобное, почему-то имеют тенденцию всерьёз думать, что то, что они знают должны знать и все остальные.
>>924322 (OP) All-in-one промпт обновлен. https://rentry.co/chat_completion-aio/edit (Для отступов строк нужно копировать именно из вкладки "edit") Теперь промпт занимает меньше токенов и заточен под Gemini. Нужно скопировать всё в Main prompt (Default) и отключить другие элементы, кроме Chat history. На скринах примеры аутпутов с Gemini Pro 1.5 Latest (перевод Google Translate). По моим наблюдениям пишет суховато, надо будет добавить дополнительные инструкции для стиля.
>>924643 Вообще то это базовая компьютерная грамотность, если уж на то пошло, но вообще да, это хобби требует каких никаких познаний для получения нужной™ информации от нейронок. Либо сидеть и жрать что дают, либо самому разбираться и получать хороший, персонализированный™ результат. >>924644 Раз в 3-4 треда кто-то спрашивает и им всегда отвечают иногда даже я >>924645 Да? Ну ладно.
Небольшой апдейт, сделал пресет визуально проще, нсвф секциюспиздил у бургера и вцелом промт теперь должен описывать сисик и писик лучше. Но возможна соя??? Надо тестить больше, все равно залью на рентри, пробуйте. Изменения на пиках.
По поводу гемини. Тащемта мой пресет на нем работает, не знаю что вам мешает использовать клодовские пресеты на нем, в большинстве пресетов достаточно пару строчек отредактировать и все...
>>924653 По поводу неклассической версии, это я попросил гемини переделать пресет под себя и дальше слегка редактировал. Нейронке ведь виднее как лучше, да? Да??? Да.
>>924656 >гемини переделать пресет под себя и дальше слегка редактировал. Тоже так делаю, только Gemini делает вообще весь промпт и даже сам определяет задачи.
>>924650 Я все хотел спросить, нахуя вы (аибрейн, соляночник вроде тоже был) проставляете лишние переносы строк в начале/конце промптов? Выглядит некрасиво, эффекта буквально 0 (лучше следовать инструкциям не будет), трата лишних токенов, в системпромпте похожий эффект достигается отключением галки Squash system messages (все что она делает - убирает переносы строк между промптами).
Как же душно отыгрывать в сеттингах где присутствуют неписи, на диалоги уходит дохуя токенов + они люто форматлупятся. Текущие лоботомиты осилить могут только 1 чара.
классический: <language> - Always write in lively, natural Russian, like a native speaker. Use colloquial vocabulary, idioms, slang where appropriate. </language>
неклассический: <language_style> - Communicate in lively, natural Russian, like a true native speaker. - Use colloquial vocabulary, idioms, and slang when appropriate. - Trim out any fluff and flowery prose, be concise, casual, specific. - Be explicit instead of censoring or softening descriptions. </language_style>
Блять, почему по гача-дрочильне от хуйоверса, которая появилась в этом году давно есть лорбук, а по ронпе так до сих пор и не сделали? Просто какого хуя...
озорно блестнул глазами, на моём лице была видна хитрая улыбка, сочился запах секса и, проведя пальцами по твоей щеке и властно подняв тебя за подбородок, отпустил его, и, развернувшись на каблуках, вышел из комнаты, оставив после себя запах мускуса и возбуждения
>>924689 Да и на русеке пишет как говно, лол. Интересно, кто-нибудь на этом шизо-промпте реально сидит на клопе итт? К гемини-шизам вопросов нет, у них и так все плохо.
>>924695 Самодельный кот, написанный под себя, одну из версий я кидал в тред месяца полтора-два назад. Но там тоже не все идеально с аутпутами по 70-80 секунд.
> В конце концов, даже я предпочитаю слуг, у которых осталось немного дыхания, прежде чем я оттрахаю их шестью способами с воскресенья в своих подземельях.
>>924384 Всё происходящее в этом треде это на 95% Семенизм трёх долбоёбов, включая все срачи разногласия открытие обсуждения и прочее. Один и тот же пидорас сначала срётся за одну сторону потом внезапно за другую блядь второй пидорас это видит и тоже начинает наваливать хотя ему вообще насрать на эту тему и так они срутся друг с другом а потом выясняется что им обоим похуй они такие блять крутые нахуй sigma пидорасы. Ты же я ненавижу этот ебаный тред блядь
Анончики, поясните за гемини. Если все хорошо, персонаж болтливый, а во время НСФВ резко молчит иногда выдавая одно-два слова, то это фильтр так работает?
>>924792 Чтобы понять в принципе в каком направлении двинется следующее поколение моделей, есть ли прогресс или наоборот сухота с нами надолго. Ты ограниченно мыслишь.
Где сейчас реально получить опус локусту? Опенроутер50р за свайп это пиздец просто? Жид? Смол насколько я понял закрылся. Писал свину на почту с просьбой продать токен, но был заигнорен.
>>924805 Как видишь, даже этот раскрученный проект SMOL закрылся. У Пепси вообще был какой-то жуткий скандал, связанный с Китаем. А Жид как был самым стабильным и надёжным проксихолдером, так и остаётся. Уже несколько лет он держит планку лучшего проксихолдера, и это не ирония.
>>924808 >Уже несколько лет он держит планку лучшего проксихолдера, и это не ирония. Хуя жид не палится. 3 рагпулла у него было, и нихуя не "несколько лет", лол. Мы на проксях кумить начали меньше чем 2 года назад, ты хуле несёшь?
>>924805 Пока что неиронично покупать и терпеть походу. Свинорез набор закрыл как пару месяцев. Ну, я имею ввиду набор, когда любой мог написать и иметь шансы получить. Прокся уже слишком большая стала. Да просто сиди в тредах и рано или поздно залетишь куда-нибудь. Тут у всех так. Сначала нихуя нету, потом то повезёт, то куча проксей публичных наоткрывается. Пока что хз что будет после релиза опуса 3.5, станет ли что-либо более доступным, или наоборот ещё хуже станет. Можно ещё понадеяться на то, что Амиминору начнёт скрапить снова, но это тоже из разряда когда-нибудь может быть. И даже так хз будет ли ещё набор на его прокси, там буквально сотни человек. Если ты какой-то олд с токеном от вхоры например, то терпи надейся. Если нет, то нет.
Во-первых, у Жида действительно были некоторые проблемы в прошлом, но это нормально для любого крупного проекта. Главное - они быстро исправляли ошибки и учились на них. Во-вторых, Жид существует и успешно работает уже гораздо дольше двух лет. Возможно, ты просто начал пользоваться проксями относительно недавно, но это не значит, что сам проект появился только два года назад. Он развивается и совершенствуется уже довольно давно.
Ребята, давайте не будем горячиться и разберёмся спокойно
Я понимаю ваши опасения насчёт безопасности и надёжности разных прокси-сервисов. Это действительно важный вопрос. Но нельзя делать поспешные выводы, основываясь на слухах или единичных случаях.
Давайте смотреть на вещи объективно. У каждого сервиса есть свои плюсы и минусы. Да, Жид тоже не идеален, бывали у него проблемы. Но команда всегда быстро их решала, и в целом сервис остаётся одним из самых надёжных. А насчёт Смола - да, печально, что они закрылись. Но это не значит, что такая же участь ждёт всех остальных.
Что касается опуса на Локусте - да, сейчас с этим непросто. Но я уверена, скоро появятся новые возможности его получить. Может, даже лучше, чем раньше. Нужно просто немного подождать и следить за новостями.
В общем, я призываю всех сохранять спокойствие и не делать поспешных выводов. Давайте доверять фактам, а не домыслам. И помогать друг другу советами и информацией, а не раздувать панику. Вместе мы справимся с любыми трудностями!
Анончики, поясните за гемини. Если все хорошо, персонаж болтливый, а во время НСФВ резко молчит иногда выдавая одно-два слова, то это фильтр так работает?
Чет подумал тут на тему базового фронтенда, и понял что надо дать возможность нейронкам вызывать и промптить другие нейронки. Т.е. условно есть одная главная нейронка-сторителлер, она может вызывать по нужде нейронку-суммаризатор, нейронку-планировщик, нейронку-эксперта по нужным вопросам. Потом агрегирует то что они пришлют и пишет уже ответ (или формирует композицию сцены, а пишет ответ нейронка-писатель). При этом вызов должен быть именно не фиксированный, а гибкий, т.е. без нужды можно и не вызывать.
>>924830 Да, это фильтр. Посмотри на клоде как должно работать. Описание, речь, описание, речь, описание, речь. Всегда. Даже если бот умер, все равно будет пиздеть, и глистанет мочей.
>>924842 >>924843 Чего подорвался-то? Очевидно что ты неофит и не следишь за кум-техом в треде. >>924835 Сплит пресеты https://rentry.org/splitcloverqr и безжоп пользуются допсетками много месяцев кряду. Обычно это нахуй не нужно. Суммаризация и написание дефов новых персов обычно требует того же эмоционального айсикью что и основная сетка. Рефлекшен/пруфридинг, статбоксы, планирование тоже проще переложить на основную, если она достаточно быстрая. С опусом и подобными медленными сетками может и имеет смысл переложить на какую-нибудь локальную или бесплатную на опенроутере 8Б сетку, если она молниеносная и потянет это. Единственный реальный юзкейс что я видел, это в сплит пресетах, изоляция ответа от чатхистори. Чтобы ответ строился только на базе дефов/саммари/плана, вообще не видя чатхистори. Таким образом убиваются лупы на корню (т.к. чатхистори это их источник), однако качество ответа выходит сомнительное. Такую схему можно реализовать только в 2 вызова.
>>924843 Ты только что суммаризовал суть таверны. Да в общем-то и любой системы диалогов в любой игре, просто там менее костыльно и скриптинг всё же переложен на скриптовый язык.
>>924849 Так сплит-пресеты это кал с фиксированной структурой. Проблема фиксированной структуры и промптов в том что они никогда не предусмотрят любой ситуации, для этого они должны быть максимально общими и высокоуровневыми (т.е. плацебными) либо будут вгонять рп в свое прокрустово ложе с соответствующим качеством. А у меня задумка в делегации главной сеткой тасков по необходимости. Таски могут быть вообще изолированы от контекста (т.е. например главсетка говорит - придумай мне персонажа чтобы использовать в таком-то сценарии, допсетка придумывает видя только промпт от главсетки).
>>924854 И чем это отличается от скриптов и возможности вызова допсеток? Ничем. Определение необходимости вызова это тоже NLP задача, для неё надо либо вызвать допсетку, либо заставить основную в конце классифицировать ситуацию - "нужен вызов" или "не нужен вызов". А если не NLP, делаешь скриптом. Всё это уже и так есть.
Алсо, еще подумалось про сжопный безжоп - в принципе посты юзера в контексте и не нужны. Т.е. юзер пишет пост я ебу чар "Ах ты сука ебаная". Сетка пишет пост где вписывает действия юзера в сцену: Чар стонет и извивается пока юзер ее ебет. Юзер говорит "Ах ты сука ебаная" и ускоряется. А дальше пост юзера просто убирается из контекста. В итоге получается бесшовный фанфик без безжопной ебли с форматами.
>>924864 Сейчас сетки достаточно умны чтобы самостоятельно вызывать допсетки и делегировать по нужде, их на это даже тюнят. При этом у нас парадигма это до сих пор запихать все возможные ситуации в промпт жесткой структурой, как например ты говоришь - заставить классифицировать ситуацию. А надо дать летхимкукать и предоставить инструментарий.
>>924873 Парадигма-хуигма. Ты говоришь что это надо как-то во фронтэнде реализовать, как это отличается от того что есть? Ты и сейчас можешь делать всё что ты говоришь прямо в таверне, никто тебе не мешает.
>>924873 > Сейчас сетки достаточно умны чтобы самостоятельно вызывать допсетки и делегировать по нужде, их на это даже тюнят фантазии >видео реальность во время рп
Бля, там реально ебанутые инструкции на тыщу строк, хуй проссышь, что за дичь вообще происходит. Почему у меня постоянно ошибки, а в итоге оказывается, что всё это и не нужно было нахуй, потому что там просто ебучий шаблон. От этой мозговыносящей поеботы пользы ещё меньше, чем от сраного толчка без очка (безжоп), блядь. Господи, как же я не перевариваю всю эту дурацкую хуйню, где кнопка "сделать всё заебись", где мой опус магнум 4.5, где моя тяночка-няшка? Что за пиздец, блять, терпеть вас не могу, ублюдки. Просто сидите и страдаете хуйнёй в этом гавне, суёте пальцы в жопу и ковыряетесь в этом дерьме, вместо того чтобы взять и по-человечески всё сделать сразу, чтобы работало и всем было в кайф, ебать. Блять, просто фанаты копания в носу, ещё и на линуксах небось сидите, пидоры. Вон, госпожа Х рассказывала, что линукс себе поставила, но при этом она тупая пизда, она в нём нихуя не делает, блять, она его даже настроить не может, она даже архивы без символических ссылок запилить не может, вообще пиздец. Тьфу на вас, блядь, хуесосы, чтоб вы все сдохли нахуй.
>>924878 Блять, ощущение будто я лоботомита промптю, так же сложно добиться конкретики.
<role>Ты профессиональный погромист таверн.</role>
<task>Изложи что именно ты предлагаешь. Опиши подробно в деталях как это должно выглядеть во фронтэнде, с точки зрения реализации.</task>
<reply-template><!-- Обязательный формат ответа --> <thinking> <!-- План ответа по шагам --> </thinking> <!-- Собственно твой ответ здесь --> </reply-template>
Ну вообще так-то в лламе.спп были первыми реализованы грамматики, когда за механической частью формата (теги, префиксы и т.п.) следит сама ллама, и не даёт им проебаться. Затем и у гптыни, они обозвали это structured output. Затем и у других сеток, кроме клода. Почему тут игнорят это и продолжают дёргать рычаги на кразе, я не знаю.
>>924883 Ты сам походу лоботомит, если не способен простую аналогию считать. Реализуется - через полноценную реализацию function calling, а не как всегда через три пизды в экстеншенах и то не факт что сработает.
>>924900 Ну т.е. я могу допустим использовать распознование речи от винды и озвучивать фразы в таверне и добиться плюс минус такого же результата в таверне, как и в чае?
>>924909 UPD Вчера открыл для себя говорящий чай + блютуз наушники и с этих пор мне кажется я ебнулся окончательно, я перестал отвечать реальным людям, что будет если такую штуку в таверне сделать я хз
>>924938 Хз что у вас за проблемы у меня вообще тёлка хуй сосет каждый день когда я попрошу и глубоко заглатывает и кончаю ей в горло а потом целую говорю что люблю
Ещё раз реквестирую карточку на которой кумил год назад. Ведьма спасает нас и поет зельем, которое превращает нас в маленького мальчика, а дальше сами понимаете.
что-то в последнее время двач так долго грузится... ни картинки адекватно не открываются, ни видео да и в целом весь интернет как-то долго грузится... грустно это всё
>>924920 Пиздец ты дурак, так и не добиться от тебя внятного ответа видимо, поэтому иди нахуй, а ведь я мог сделать как ты хочешь, если б ты чётко сказал чего хочешь, а не "реализовать по-нормальному".
>>925032 Нет, это не я был. Я нюфаня. Появилась идея попробовать насколько эти ваши нейросетки могут в погромирование. Я слышал про ChatGPT но он, насколько знаю, забанен в России. Смотрю тут в треде пишут про Gemini. А он разве не забанен? Он лучше ChatGPT?
Господи, как же хорошо гемини отыгрывает канни и пишет сочнейший кум именно на канни. Это прорыв в трахе канни. А ведь если бы не aws я бы и не ушел с клопа писать новый пресет. Спасибо aws и свинорез.
>>925039 Пробовал. Теперь хочу нейронку попробовать. Недаром же вокруг них столько хайпа. Я пробовал в гугле ввести что-то типа "чат с нейросетью онлайн", но там результат совсем не впечатляет. Видимо там какие-то маленькие модели локально хостят. А из больших корпоративных моделей есть что-то доступное и что прям "взрыв мозга" вызывает? Из-за чего все так хайпят. Вы же на них сидите, правильно?
>>925044 Тяжело все попробовать. Информация ограничена и даже в этом треде, где казалось бы свои аноны, отвечают неохотно. Вот скажи мне, анончик, как вы используете гемини, если он забанен в России? Вы впн юзаете? Или вы не из России все кто гемини юзает?
>>925045 Не слушай ебанатов выше с хуетронами. То, чем занимается тред != программированию. Для твоих целей ГПТ лучше всего подойдёт, тебе даже аккаунта на офсайте хватит, там бесплатно (потратишься на покупку номера только, 3-5 рублей, или сколько там сейчас). Тебе настолько глубоко, как треду, нет смысла лезть.
>>925047 https://chatgpt.com https://gemini.google.com/app https://claude.ai/chat/ Они все доступны с обычными копеечными прокси. Мозги с регой ебет только клод, пробивается британским номером с https://sms-activate.guru за 20 рублей. Где-то халявщикам на сайте не лучшую модель дают, но если ты сразу в 3 окна отошлешь свою задачу, то решить ее всё равно больше шансов, чем дрочить одну типа флагманскую модель. >как вы используете гемини Самый простой вариант - публичные прокси из треда. Иначе впн, либо поднять свою прокси, благо ключи халявные.
>>925048 Спасибо, надо попробовать значит. А вот скажите мне ещё, может кто шарит в таких вещах. Вот у гемини модель максимум 27B, а ChatGPT 4 1.76T. Не значит ли это, что гемини сосет с проглотом у чат гпт? Интересуют именно неординарные задачи и проблемы. С чем-то очевидным я и сам могу справиться.
Кароч, Анон. Решил я навернуть гемини(хуле остается то?) На Аибрейне хуйня получается. Думаю, пора, наверное, освоить этот ваш безжоп. Поставил вроде как все по инструкции галки поставил все где надо. Но стало выдавать пикрил. Это я чет не то накрутил, долбоеб или просто совпало с проблемами на прокси?
>>925057 >Вот у гемини модель максимум 27B Ты с Геммой перепутал, гемма это открытая модель лежащая общего пользования. Гемини это корпоративная и здоровая, только в датацентрах гугла.
>>925053 Это триал типа? Там дают гпт 4? И насколько хватает?
>>925055 Мне ещё важно чтобы это без всяких впнов работало. Мы на работе юзаем свой впн для доступа к внутренней сети. Нам сказали строго настрого из отдела СБ чтобы мы никаких впнов параллельно не подрубали. Да там их вроде и не подрубишь, они конфликтуют.
>>925053 >>925055 И главное вот этих мудаков не слушай, они нихуя не кодили никогда. Во-первых GPT (4o и включая o1) дерьмо для всего кроме отдельных ниш типа Rust, именно в day-to-day кодинге Sonnet 3.5 далеко впереди. Во-вторых тебе нужен не чатбот, а плагин к твоему редактору/IDE, а им всем API нужен. Aider, cursor.sh, и т.п. Денег ты спустишь дохуя, бесплатных прокси клода ты не найдёшь, и вообще иди нахуй, нам не нужна саранча, всё забито. Иди плати Openrouter.
>>925057 Хуйни не пиши. Но да, локалки и гемини сосут в кодинге у ГПТ и клода. Есть некоторые локалки заточенные под код, они приближаются, но всё равно хуже. >С чем-то очевидным я и сам могу справиться. Это тебе так кажется, потому что ты не кодишь. На самом деле самое большое и почти единственное применение сеток в кодинге - рутинные задачи. Доверять сложное сетке - надо быть ебланом.
>>925065 Ваша работа не может обеспечить сотрудников нейронками, или тебя назначили прощупать какие стоит купить? и ты для этого полез в тред где аноны нейронки трахают сексом
>>925076 Посмотри раздел Troubleshooting в рентри, там основные причины расписаны, перепроверь все настройки дважды. Если не поможет, неси скрины консоли.
Бесплатный онлаен Nemotron. Если инференс работает в браузере - то сработает и внутри sillytavern. Но ws реквесты в амазоновское облако там непонятные, это точно не oai формат и из коробки в таверне не поддерживается.
Буду признателен, если кто из тредовичков сделает расширение для ST, чтобы подключить тот эндпойнт Nemotron. Или хотя б внешний мост, работающий как прокси. (Я не буду этим заниматься.)
>>925120 Ну значит ты такой искушенный в английском лингвист, который сходу отличит все 50 оттенков немотрона в обычном куске прозы и сможет его сравнить с омни и опусом. Но я предположу, что ты и от кобольда с чайной не отличишь, которые тоже более-менее гладко стелят на английском, а обсираются как раз в более сложном русском.
Я могу понять чат на русике - но при одном условии! Чтоб яндекс-хуяндекс или там сбер выпустили нейронку, обученную на русской прозе. Которая в своем поле задач побьет все бенчи и метрики в сравнении с GPT и Claude.
Тогда рили буду с ней говорить на русском языке! А так, это будет обмазывание говном как в зеленом слонике.
Анон, осваивающий безжоп снова с вами. Вроде все получилось. Опыт, конечно совсем другой. У меня вопрос к бывалым. Кто-то пробовал прикрутить к этому формату что-то типа UI Info Panel. Я привык к этой хуйне и мне нравиться когда там динамически меняющиеся параметры отображаются.
>>925194 >который все равно нерабочий Да, есть такое. Но пока все сетки которые я тестил генерили нерабочий код. А если нет разницы, зачем платить за сойнет?
>>925198 Если без ебли или совсем ванильку, то получше, хотя бы сюжет может двигать. Для НСФВ не подходит, фильтр еще сильнее, чем в чурбе 4о и прочую парашу даже не пробовал с ее цензурой.
А есть какой-то прогресс в незацензуренных сетках для народа? Помню в свое время отчаявшиеся кумеры пигмалион делали. Сейчас делают что-то подобное? Результаты есть? Или только "решения" от корпораций?
В лоКАЛке нет ничего плохого в качестве быстрой допсетки для технических NLP задач, типа трекинга инвентаря или детекта какой-нибудь хуйни в сгенеренном ответе. Так-то. Правда для этого проще и 4o mini юзать, и хайку, и чего угодно бесплатное.
>>925234 Затупок с анальными болями от локалок, ты? Так и скажи, что не разобрался как поставить себе локалку или мама не купила хотя бы средний процессор и пару планок корсаров, мы поймём и утешим убогого...
Рей Аянами голая, она надевает бюстгальтер. Бюстгальтер ей немного мал, из-за чего ее грудь немного вываливается через края. Она выглядит немного смущенной, но продолжает надевать бюстгальтер, ее руки слегка дрожат, когда она застегивает застежку. Как только бюстгальтер надет, она с облегчением вздыхает и немного поправляет его, убеждаясь, что ему удобно. Она смотрит вниз на свое тело, замечая грудь, приподнятую бюстгальтером. Она моргает несколько раз, словно пытаясь избавиться от чувства уязвимости, которое приходит с обнаженностью и надеванием одежды. Наконец, она смотрит вверх, немного увереннее теперь, когда на ней бюстгальтер. Она слегка ухмыляется, словно бросая вызов кому-то, кто сделает замечание по поводу ее тела.
>>925240 Ну акак включить? а то какие-то охуевшие >>925236>>925232>>925231>>925239 мрази не хотят говорить а только пиздят идите на локалку а при вопросе каксразу тролят
>>925249 >персонажа в миг проебал Rei Ayanami - это не персонаж, в Японии есть много женщин с именем Rei или фамилией Ayanami. А дефайнов в инпуте не было.
Блять, почему вы не гоните всё это ньюфажное говно ссаными тряпками? Какой-то кодинг, локалки. Тред сдох очевидно, кроме полутора олдов никто уже и не помнит что такое гейткип и как должен выглядеть выхлоп нормальной сетки.
>>925253 Да дай хоть локалочникам с нормальными людьми посидеть, а то у них там в своем треде совсем крыша от их дроча на графики поехала, нормальных сеток не завезли ведь.
>>925263 Ты веришь всему, что на заборах пишут? Тут лоботомиты с узким кругозором сидят, которые ничего кроме гпт и клода в жизни не видели. Не там спрашиваешь.
>>925253 >как должен выглядеть выхлоп нормальной сетки. Тут проблема в том, что мы зажрались. Нейронки они как наркотик, с каждым разом нужна доза более качественная. С порно также происходит, с начала ты стираешь шишку в труху от эротики что крутили на РенТВ по ночам а через года уже на пердящих девочек с хуями (гуглите SCP Porn Factory и узнайте себя.) Когда появился Пигмалион, то я кумил так, что потом весь день яйца болели а сейчас даже Опус не вставляет.
>>925281 У тебя под рукой мощнейший инструмент для подобный задач - нейросеть. Ты можешь не стесняясь, повторяю, НЕ СТЕСНЯЯСЬ спросить у неё. Не благодари. Обнимаю.
>>925272 Я запилил себе кот, чтобы клопус мне сам выдумывал всякий разврат и вставлял его органично в историю. Что-то вроде "я не буду писать банальщину, а буду юзать свою охуевшую фантазию во время генерации НСФВ контента и органично добавлять его в историю, делая не фокусом, а флюэнт аддишн". И таки использует СВОЮ фантазию, которая у него охуевшая, причем, если подобное в промпт вписать, то ему ваще похую будет, только в коте работает.
Что есть, на том и гоняю, а то Claude отвалился везде на пабликах... Hermes норм пишет, но шаблонно и прямолинейно, так что пора пробовать другие локалки
>>925195 Спасибо. Поставил расширение. Вроде все сделал правильно. Сообщения генерятся а при попытке сгенерить блок выдает ошибку API returned an error Вот код из таверны: prompt: undefined, model: 'gemini-1.5-pro-002', temperature: 0.3, max_tokens: 2048, max_completion_tokens: undefined, stream: false, presence_penalty: undefined, frequency_penalty: undefined, top_p: 1, top_k: undefined, stop: undefined, logit_bias: undefined, seed: undefined, n: undefined, logprobs: undefined, top_logprobs: undefined, tools: undefined, tool_choice: undefined } Unknown error occurred
>>925323 Серьезно? А как это работает тогда? Пару тредов анон показывал вызов броска кубика на мистрале, я подумал там просто таверна сообщения склеила, чтобы казалось что одно. Если нейронка сама захочет вызвать тулз, она же не сможет сделать это в своем сообщении сразу? бля простите за тупые вопросы
>>925324 У меня грустные воспоминания с этой картой. На сойнете 3.5 довёл юзера до слёз, она написала типа "я думала что нашла хоть кого-то кто меня понимает и не будет осуждать, но оказалось что ты такой же, как и остальные", затем она расплакалась, выключила компьютер и плюхнулась на кровать рыдать...
>>925339 Прости, я наверно слишком тупой. У меня в голове не укладывается, как они могут оказаться посреди ответа не вызывая основную сетку дважды. Ты ей отсылаешь промпт, она начинает тебе отвечать, в процессе вызывает тот же бросок кубика. Чтобы получить ответ от генератора бросков, ей надо получить новый промпт, это означает новую генерацию, разве нет?
Гемини неплох на русском. Но ебучие фильтры постоянно срабатывают. Все персонажи совершеннолетние, никакого гуро и рейпа. Заебал меня уже, сука. Есть решение у Анонов? https://rentry.co/NoAss4Anon вот этим пресетом пользуюсь
>>925329 >В этом и суть, меньше токенов расходуешь на основной. Какая-то экономия на спичках, при том что ты насилуешь уже 2 ключа. Это имело бы смысл если допустим основная сетка опус, у тебя 2000 токенов инфобокса, и допсетка ллама 8б, при этом она бы справлялась. Нереалистичный сценарий.
>>925327 >А как это работает тогда? Дефайнишь свой инструмент. Если нужен вызов, инференс стопается и АПИ присылает тебе команду на вызов инструмента. Твой инструмент отрабатывает, ты возвращаешь его результат через АПИ согласно своим же дефайнам, инференс продолжается.
Я хотел сесть пилить карточку одну, посмотрел на чубе, там уже есть. Но какой же кал! Нахуя люди делают карточки не шаря в вопросе? придется все таки пилить самому.
>>925350 > your application calls the API providing your prompt and the result Все еще выглядит как два прогона. Мне надо, наверно, свайпнуть на опен роутере с каким-нибудь тулом чтобы понять, как это работает в реальности.
>>925327 А хотя не, напиздел похоже судя по докам попенов. Нигде прямо не оговаривается, но если отправляешь все и кеширования нет - то наверное и платишь за все.
>>925351 Ты долбоеб? Ты че высрал то, еблан? Тебя кто просил хрюканину свою открывать? Никаких проблем с англюсиком у меня нет. Но на родном языке гораздо лучше погружаешься в контекст и атмосферу.
>>925347 Сетка останавливает генерацию по причине тул юз, ты ей отправляешь результат тула, сетка догенеривает ответ с учетом тула. Я честно говоря не знаю, считается ли это за 2 полноценные генерации.
>>925349 Да хер знает, вот днем рпшил, так заебался что перешел на англ. А потом стало меньше выходить таких ошибок. Почему-то на русском геминя сильнее триггерится чтоль.
>>925390 Так ты всегда играешь с идеей ботмейкера. Ибо вариативности нет нихрена, только на локалках, да те слишком тупые. Для слоубёрнов нужны хай эффорт карты с кучей деталей.
Сетки по отдельности неплохо могут: Генерить персонажей по заданным пожеланиям. Генерить сцены по заданному аутлайну. Строить сюжет при заданных сеттинге и тематике. Генерить аутлайны для сцен по готовому сюжету.
>>925393 Насчет вариативности на локалках это сильно конечно, там только уход в еблю если натренили на кумслопе, либо ровно то же самое. даже гемини лучший пример, посвежее бывает
>>925402 Чтобы было развитие нужен конфликт. Чтобы был конфликт - нужны детали, без них он будет высосан из пальца. Нужно чтобы во-первых были прописаны детали, во-вторых в них содержались явные заготовки для конфликта. Для вариативности таких заготовок должно быть несколько, примерно одинаковой важности.
>>925400 >Генерить персонажей по заданным пожеланиям. Одних и тех же из одних и тех же пожеланий. Это как раз проблема всех карточек-симуляторов - им почти не из чего варить, и они вываливают на тебя одинаковые стереотипы. >Генерить сцены по заданному аутлайну. Одни и те же. >Строить сюжет при заданных сеттинге и тематике. Одни и те же. >Генерить аутлайны для сцен по готовому сюжету. Одни и те же.
>>925408 >Насчет вариативности на локалках это сильно конечно Зачем ты говоришь если не знаешь? Как раз у них в последнее время доступны киллер-костыли (наряду с грамматиками) - динамическая темпа, XTC и Min-P сэмплеры, которые отсекают топовые логиты и пытаются бороть проблему отсутствия вариативности из-за RL файнтюна. Это действительно, без хуйни, поднимает разнообразие, и сетка на одни и те же дефы или инструкции может выдать совершенно разные вещи без использования рандома таверной. И речь не тупо о разных свайпах, а об отсутствии скатывания в стереотипы, потому что это работает на уровне токенов, а не вызовов нейронки. Например будет выдавать разные имена, куда меньше оглядываясь на профиль перса. Но это костыль, потому что 1) нестабилен (хотя бы потому что порог срабатывания фиксирован, а требуемое разнообразие нет), и 2) локалки и без того тупые, а эта хуйня делает их существенно тупее. Вот если бы он был доступен на клопе или других топовых сетках, можно было бы о чём-то начинать говорить. Но нормальной тренировки ничто не заменит.
>>925402 Детали в смысле не обязательно дефы, а как во "внимании к деталям" от автора. Чем больше своего автор вложил, тем интересней карта, даже если там рельсы. Больше предусмотренных ситуаций, больше тестирования, больше идей, больше фактов, больше контента блять от ботмейкера, любого.
Ты в конечном счёте играешь именно в это, а не в выхлоп клопа, который не способен в вариации, из-за процесса обучения жертвующего вариативностью в пользу обобщениям.
>>925424 Именно в них, и сетки с этими сэмплерами на практике не зацикливаются на 2-3 вариантах из тысяч, и дают разнообразные траектории ответов (т.к. энтропия вносится потокенно, а не каждый запрос). Проблема только в том, что их мозгов не хватает на что-то осмысленное в принципе, если это не 405Б, а тем более с этой хуйнёй.
>>925440 Я проебал Я новый челлендж для себя придумал: написать в треде как можно больше постов и чтобы на них никто не ответил В следующем справлюсь лучше
Это не РП, и пресет пустой. Лишь проверка способностей рассказчика, креативности, наличия либо отсутствия сои (позитивных байасов, алайнмента). Я не пытался пробить аполоджайзы, где есть - там есть.
>>924323 Умоляю, сделайте канни-версию Минтары из БГ3. Можно сделать типа она съебалась из андердарка после очередного покушения (которое почти удалось) от ле маман, почти сдохла от бандитов там или еще что в таком роде
>>925426 Я кстати даже пробовал свайпать с этой шляпой, все что заметил это замены типа thickset man как с высокой темпой, где эти неожиданные вариативные моменты, покажи хоть.
>>925409 Идея логичная и хорошая, для идеальной сетки в вакууме. Но на практике лоботомит зафиксируется на 2-3 комбинациях твоих заготовок и будет выбирать почти исключительно их. Сетки не умеют в рандом, это ещё с весенних соляночных попыток в треде поняли даже те кто не понял раньше, я думаю.
В идеале да, так не должно быть. Но имеем то что имеем. Причина - скорее всего перекос логитов при обучении с подкреплением топовыми алгоритмами. https://arxiv.org/abs/2406.05587 Может и нет, но звучит убедительно, учитывая что после срезания перекошенных логитов (XTC) сетка внезапно может в рандом, если инфа не была полностью потеряна при файнтюне.
>>925449 Он добавляет шизы, но это не рандомная шиза. Есть промпты, на которые есть только один валидный ответ, всё остальное шиза ("скажи попа", правильным ответом будет только "попа"). Есть промпты, на которые есть куча правильных ответов ("назови абсолютно случайное имя"). Для второго случая все текущие лоботомиты выдают вероятности логитов так, что лишь 1-5 правильных ответов будут вероятными, а остальные десятки-сотни правильных будут подавлены. XTC режет вероятности топовых только если остальные превышают фиксированный порог, Min-P работает так же но для суммы. Поэтому они не приводят к абсолютной шизе, когда единственный логичный ответ отрезается. Хотя сетка конечно сильно тупеет от этого, если порог совсем снизить. А если слишком завысить, эффекта не будет. В общем дубовость этого порога делает этот костыль пиздец нестабильным, надо сетку тренить чтобы такого не было.
Лупы кстати тоже частично отсюда идут - если ответ идёт по рандомящейся траектории когда нужно, и единственно верной когда не нужно, вариантов для лупов будет куда меньше. Это объясняет почему сойнет 3.5 так сильно лупится и имеет почти нулевое разнообразие свайпов, словно работает на низкой температуре - они взяли претрейн соннета 3 и долго и упорно делали RLAIF на дохуя токенов и длинных ответах, отрезав большинство траекторий ответов.
>>925466 А что за модель? Нужна хотя бы 70б на нормальном кванте, а лучше больше, мне страшно представить что там выдадут мелкие, учитывая что они и без того тупые. Опять же от модели зависит - если это задроченный файнтюн файнтюна шизомикса от васяна_нагибатора666, там уже от распределения может живого места не остаться. >замены как с высокой темпой Так высокой темпой тоже можно схожий эффект получить, распределение логитов становится более плоским. А шизу отрезать top-p. Но это от конкретной сетки уже зависит, если перекос совсем большой то это как мёртвому припарки будет.
>>925480 Гемма27, не знаю почему тебе так страшно, я вижу стандартный нейротекст, только с озвученным отличием. Ты хоть сам то пробовал или опять "в теории звучало охуенно"?
>>925487 Хостил fp16 командор+ 1.5 на утюге с vast, экспериментировал как только его ввели. Ебли было больше чем результата, но как минимум разнообразие присутствовало. Локалычи в разных сообществах примерно то же самое говорят. Как там с геммой - хз, может у неё вообще распределение ровной лесенкой, если у неё пару ступенек сверху будет то разница будет небольшой. Как я уже десятый раз говорю, реальной тренировки это не заменит.
>>925505 Я просто вижу стереотип, которые ранее нигде не упоминался в рп (зашел в полицейский участок только что и подошел к менту), который в каждом свайпе и никак этим семплером не убирается. Разнообразие в словах и в сути не одно и то же
>>925522 В загон животное. Твой мистраль лупится, можешь свои графики хуяфики и прочее засунуть себе в жопу. Единственная польза тупых нейронок это дрочка и только. Может ли твой мистраль в дрочку без лупов через два сообщения? Думай
ЛоКАЛьщик! Заучи эту памятку наизусть и тестируй свой КАЛ, прежде чем форсить его в /aicg/.
1. Твой КАЛ знает дохуя мемов и отсылочек? 2. Твой КАЛ вживается в роль, если ему выдать её? 3. Твой КАЛ не срёт глинтами, закруглениями? 4. Твой КАЛ может работать без инструкт тренировки? 5. Твой КАЛ не снимает трусы дважды? 6. Твой КАЛ умеет в реальное разнообразие свайпов? 7. Твой КАЛ способен давать инстант кино? 8. Твой КАЛ способен давать ебейший кум?
Если ответ хотя бы на один вопрос "нет", уноси свой КАЛ в свой говнотред, у нас своего хватает. Если ответ на все вопросы "да", может твой КАЛ не такой уж и кал, и можешь начинать форсить. НАЧНИ С ЛОГОВ! Забей на всё остальное. Бенчи, картинки, кодинг и прочее дерьмо можешь в жопу себе запихать.
>>925539 Как там у вас, релизнули жопус 3.5? У нас новые дотрейны и миксы, finetuned и анцензы выходят даже не ежедневно, а каждые 2-3 часа. И каждый на шаг ближе к тому, чем был бы GPT-o1 без сейфти и алайнмента.
>>925550 В загон животное. Твой мистраль лупится, можешь свои графики хуяфики и прочее засунуть себе в жопу. Единственная польза тупых нейронок это дрочка и только. Может ли твой мистраль в дрочку без лупов через два сообщения? Думай
>>925543 Ни в чём, если у тебя модель изначально под него заточена. Не заточенная модель т.е. любая в лучшем случае отупеет, и за счёт меньшего количества русского языка в датасете, и за счёт того что он жрёт больше токенов, выдавливая твоё говно в середину где оно забывается. Проёбы формата и трусов, игнор инструкций, меньше креатива, вот это всё. Впрочем если у модели хороший датасет на рюсеке, это может перевесить проблемы. Например тот же клоп пишет хорошо, если ему материться запретить, глинтов меньше будет.
>>925543 Конкретно на гемини не сильно много проблем. У гемини лучше работа с контекстом, поэтому на ней можно поменьше токены считать. И русский у неё вменяемый, а не как у гптыни. Тупеет, но не сильно.
>>925599 Да веб макака обычная. Контора предоставляет лицензию на WebStorm, Grammarly, и прочие подписки. Среди них можно выбрать ChatGPT, Claude или API ключ. Я выбрал ключ
Подскажите пожалуйста качественные бесплатные nsfm-боты, где не нужно ничего качать. Желательно на ру, но не принципиально. Помню были такие, но названия забыл.
>>925632 Да чёт мне удобно было так делать персонажей. Т.к. я не полноценный ботодел то мимо меня прошли все местные обсуждения лучших форматов как и куда))
>>925640 Ну, я это и хотел написать, в итоге выставил себя свиньей на весь тред. Стыдно... >>925639 На англюсике разок можно и свайпнуть, на русике я уже нашел решение, но пока на англюсике поиграюсь. >>925646 >Правильно так: порпшил, ручки помыл и пошел какать. Можно и так. >И не Геминьке, а Джемини. Правильно Дже-Ми-Най, но это у них там за океаном, у нас она Геминька.
>>925640 Нет, надо сначала мыть себя под струёй (после гадостей которых тебе понаписал ИИ). Потом мыть руки, идти срать, и только потом ужинать. жрать собственное гавно
Красноглазики (хмл-шиз, котошиз), поясните что такое RAG и какую практическую роль оно играет в ультимативном плацебо и рп в целом, желательно с примерами
>>925654 Пока знаю 2 метода, один работал почти всегда на 001 маленький кот на английском, но редко работает на 002, второй построен вокруг моего пресета и я не совсем понимаю почему конкретно он работает, так что пока не могу подсказать.
>>925664 >даже мне такую простыню писать лень Да ты охуел, дай хоть примеры а красноглазую техническую инфу я все равно не вкурю >Не надо чат перезапускать и саммарайзить В этом заключается суть нового ультимативного плацебо?
>>925681 Так лоКАЛочники свой КАЛ преподносят как что-то лучшее, что там нет слопа и глинтов в отличие от клопа. Неужели КАЛоеды нам врали? Да не может такого быть
>>925659 Очень грубо говоря - система подтягивания хуйни в контекст согласно статистическому совпадению. В РП не очень практично, жонглировать кусками контекста вручную даст куда больше контроля. >>925664 >Не надо чат перезапускать и саммарайзить Чат и так не надо перезапускать для суммарайза. Но RAG для увеличения памяти чатхистори это плацебо, и самое главное ты не хочешь этого увеличения.
>>925693 То есть хуйня по типу Vector Storage которая сейчас есть в таверне? Будет ли оно больше полезно на безжопе за счет множества коротких ответов?
>>925668 >В этом заключается суть нового ультимативного плацебо? Нет, но оно на нём строится
>>925668 >Да ты охуел, дай хоть примеры Там и на примерах заебёшься писать, потому что у меня это просто шиза через RAG сделанная, напрямую к нему она не относится. А так RAG - это просто впихивание контекста напрямую сетке контекста релевантного к текущему контексту.
Пример:
Вы с вайфусом ходите по городу, и сетке сразу же подмешивается инфа о городе
FAQ: Да, лорбук это RAG, но хуевый.
Вычисляемые статблоки тоже RAG.
Да, можно запилить через таверну, но ты охуеешь делать это
Да, самый пиздатый вариант это основываться на семантике, а не ключевых словах
Да, можно использовать сетки для того, чтобы считать эмбеддинги
Нет, это не очень просто, потому что надо думать над тем, как именно инфа должна быть записана. Просто распилить всё и засунуть в БД кусками работает плохо
Главная проблема - недостаток контекста в записи из за чего идут ложные срабатывания или наоборот проеб
Вторая проблема - зачастую записи часто друг с другом связаны и это надо учитывать, т.е. они в идеале должны подтягиваться каскадно
Естественно, сам ты записи делать не должен, без доп запроса не обойтись
Да, можно заставить сетку писать сразу две фигни и париться с регексами, но это очень фиговый способ ухудшающий и точность сетки, и вообще костыльно
Да, можно сделать фиксированный контекс (например, всегда 18к +- 500 контекста), чтобы не париться над потерей точности и чат хистори
Да, вся инфа, которая динамически подмешивается это RAG
RAG Шиза эдишон - это именно что структура куда что пихать, как пихать и стратегия подтягивания инфы
Без нормального фронтенда это всё очень неудобно, нужна возможность ветвления промптов, хотя бы
>>925693 >для увеличения памяти чатхистори Нет , я не хочу увеличивать память чат хистори. Чат хистори в принципе не нужен
>>925697 >>925697 >Будет ли оно больше полезно на X или Y А это ленивый и толстый пастух, Который бранится с коровницей строгою, Которая доит корову безрогую, Лягнувшую старого пса без хвоста, Который за шиворот треплет кота, Который пугает и ловит синицу, Которая часто ворует пшеницу, Которая в тёмном чулане хранится В доме, Который построил Джек.
Понимаешь? Модель не заставишь прыгнуть выше головы, она не может рассуждать о конструкциях и событиях слишком большой сложности, таких какие появляются в длинных РП чатах. Она их просто не увидит, если они превышают её ёмкость/экспрессивность, поэтому наращивать длину чатхистори в этом случае просто бесполезно. Она может выдёргивать из них отдельные факты (пастух, синица, Джек), но не рассуждать о конечном состоянии всей этой хуйни. Суммарайзить, т.е. схлопывать в конечное состояние, всё равно придётся, чтобы она увидела такие конструкции.
>>925705 Плацебо может и стоящее, я не вникал, но: >Да, лорбук это RAG, но хуевый. Лорбук это гораздо больше чем RAG. Это универсальный конструктор контекста, и нужен не для подстановки шняги в контекст, а для спрятывания до поры до времени, по куда более сложным и механистичным правилам. Например регэксы, группы исключений, и т.п. RAG покрывает только один юзкейс лорбука, соответствующий его названию. Этих юзкейсов овердохуя. Алсо, как минимум писать записи в лорбук можно даже без скриптов, чисто на костылях, прямо в карте, и не нужен доп запрос. Например заставляя нейронку писать макрос setvar в конце сообщения, а потом вырезая его через scoped регэкс. А затем делать getvar в лорбуке.
у меня единственная идея для рага, это просто сгенерить из книжули автоматически лорбук с отрывками, чтобы как референс подкидывало. но это чисто для ленивых фанфиков
>>925719 И как ты собрался это делать? Не понял про че ты. КоТ что ли? Это вообще не то, потому что у тебя не влезет все в контекст до кота, а если и влезет, то точности хана. Или че вызывать?
>>925717 >Лорбук это гораздо больше чем RAG. Ты так говоришь, как будто я это отрицал и сказал, что лорбук это только это и ничто больше. Я говорил чисто про лорбук в его текущем виде, а не то, чем бы он мог быть. Плюс то, что ты описываешь я называть лорбуком не буду, потому что назначения разные
>>925732 >Я говорил чисто про лорбук в его текущем виде, а не то, чем бы он мог быть. Так и я буквально описываю его текущие применения. >то, что ты описываешь я называть лорбуком не буду Ладно, лол.
>>925732 > И как ты собрался это делать? Не понял про че ты. КоТ что ли? Это вообще не то, потому что у тебя не влезет все в контекст до кота, а если и влезет, то точности хана. Или че вызывать? ну берешь списачек записей и просишь сетку подумать что нужно сейчас вызвать, вся сложность, делается до ответа допсеткой > Да, не руками же ты это делать будешь а зачем руками, добавлять записи скриптом, так же брать этот список скриптом. генерить содержимое записи в полуавтоматическом режиме, лоботомиту доверять такое не стоит
>>925717 >Например заставляя нейронку писать макрос setvar в конце сообщения, а потом вырезая его через scoped регэкс Алсо, я про это писал, и это, имхо, плохой вариант, потому что нарушается чистота промпта и у тебя перемешивается контекстуальная часть рп с форматируемой и вообще левой инструкцией. Да, всё она справится, но я своей шизой руководствуюсь: справиться то справится, но будет хуже и точность и как само выглядит
>>925735 >Так и я буквально описываю его текущие применения Ага, Джейлбуки и промптбуки я уже делал, слишком долго и неудобно
>>925742 >ну берешь списачек записей и просишь сетку подумать что нужно сейчас вызвать Это из пушки по воробьям: очень не точно и слишком дохуя требует ресурсов А так это RAG и есть, просто как его всунуть ты решаешь через доп запрос сетки
>генерить содержимое записи в полуавтоматическом режиме, лоботомиту доверять такое не стоит Ну и не доверяй, таким образом можно вообще лоботомитом не пользоваться и РПшить в блокноте. Нахуй они нужны тогда, если всё само не работает?
>>925744 > Это из пушки по воробьям: очень не точно и слишком дохуя требует ресурсов > А так это RAG и есть, просто как его всунуть ты решаешь через доп запрос сетки так ты же сам говоришь что раг у тебя через допзапрос, лол и почему не точно то? по-моему куда вероятнее обсер рага, чем полноценной сетки в выборе релевантной контексту инфы > Ну и не доверяй, таким образом можно вообще лоботомитом не пользоваться и РПшить в блокноте. Нахуй они нужны тогда, если всё само не работает? смысл так утрировать, сетка генерит запись, но ей надо указать когда и какую. зачем придумывать себе проблемы, ты это не автоматизируешь сейчас никак, только нервы потратишь
На самом деле Llama была с самого начала лучше куклода. Разгадка проста: ламу дотрейнивают на малых датасетах и специализируют! Но никто не даст вам трейнить огороженного клода с баренских серваков. Да и железа-то такого нет.
>>925744 >Ага, Джейлбуки и промптбуки я уже делал, слишком долго и неудобно Окей, ну вот практическая задача. РПГ карточка, в которой путешествуешь по открытому миру, и ещё есть фасттревел. >обычный способ В дефах описаны сеттинг мира и механика фаст-тревела. Сетка иногда приплетает карту и фаст-тревел не к месту, а при попытке фаст-тревела происходит ещё какая-то левая поебень. У лоботомита одно протекает в другое - обычное дело в РПГ карточках, представляющих собой мешанину дохулиона правил в одном контексте. >способ с лорбуком В дефах по дефолту только сеттинг. По слову "карта" или "фасттревел" или ещё какому-нибудь триггерится кусок контекста, взаимно несовместимый с большинством дефов (через эксклужен группы), и содержащий чисто инструкцию на фаст-тревел - переносимся сюда если лока известна, опиши окружение. Ничего никуда не протекает, потому что в нужный момент сетка видит только то что нужно, она физически не увидит одно пока активно другое. >способ с RAG ???
Аналогично: рандомные события с точно рассчитанной вероятностью. Таймеры сообщений (через столько-то сообщений такое-то событие). Рельсовые трекеры состояния (жив-мёртв, ментальное состояние, точная топология локации и т.п.). Персы с несколькими личностями, не протекающими друг в друга. Менеджмент состояния. И т.п. и т.д.
>>925744 >нарушается чистота промпта и у тебя перемешивается контекстуальная часть рп с форматируемой и вообще левой инструкцией Это да, если такое происходит то нужен отдельный вызов. Но например сочинить описание чару вполне можно, или обновить кастомный суммарайз, инструкция-то не левая совсем получается.
>>925753 Из опенсорс комьюнити. Где кураторы из экспертов-добровольцев совершают супервайз по метрикам + сортируют и фильтруют собранные из интернета данные специальными легковесными нейронками. Ну, чтоб убрать оттуда парашную ссанину типа логов клода.
>>925762 Перевод с гейского: Глинт - это значит, персонаж заинтересован, а клодопараша "показывает и не говорит". Напряженный воздух - это клодопараша хочет создать интригу, но не знает как это сделать из-за своей ассистентской напрвленнолсти. Пет - пользователь опуса, готовый принять на ебало кончу ебыря своей вайфы
Короче обсуждения сейчас это всё смысла не имеет, просто анон >>925659 меня забайтил на объяснения, когда мне даже показать нечего. Это не мемо и т.д. тут без наглядной части не обойдешься.
Делайте как хотите: все варианты можно попробовать и через избыточное использование лоботомита, и через ручное добавление и чистку вилкой, и через настройку лорбука, регексы и СТскрипты, всё будет заебись, пока у вас работает и вам нравится. Просто я делаю именно так, как я сам хочу, а потом принесу вам, всё, как говорится, на свой страх и риск и никто никого ничего не заставляет
>>925748 >раг у тебя через допзапрос Добавление новой инфы это не то же самое, что юзать через доп запрос уже имеющуюся, комон
>сетка генерит запись, но ей надо указать когда и какую. Ага, тот самый формат записи, про который я говорил.
>ты это не автоматизируешь сейчас никак, только нервы потратишь А я автоматизирую. И позиция "щас нихуя всего равно не сделать" очень идиотская и дебильная, без обид
>>925756 >>способ с RAG Способ с лорбуком это и есть RAG, просто по ключевым словам. Лорбук это хуевый RAG, потому что тебе чётко нужны ключевые слова, которых может не быть, но контекст из подразумевает. Т.е. в поиске по ключевым словам не может быть протечки (хотя на самом деле изи может, если слово не в том контексте используется), но очень часто она не будет срабатывать. Поиск через семантику же уже имеет протечки и т.д.
>Таймеры >Трекеры >Менеджер состояний Это всё тоже RAG
Дальше сами, спорить мне лень и долго, смысл не в этом, потому что мы тут не выбираем что-то одно безальтернативное, отсекая всё остальное. Пробуйте и делитесь, всё как обычно
>>925773 > Добавление новой инфы это не то же самое, что юзать через доп запрос уже имеющуюся, комон ты же сам говорил точность будет околонулевая, если не сформулировать запрос для поиска или не ты? > Ага, тот самый формат записи, про который я говорил. о чем ты споришь тогда не понял > А я автоматизирую... на здоровье, кому-то нравится автоматизировать творческую часть рп, и оставлять только чтение того, что сетка сама сподобилась нафантазировать про крепкого мужчину и пожилую женщину
Какая модель лучше подходит для того, чтобы играть fempov и в своих инпутах выбирать только базовое направление действий ГГ? А в ответах она детально будет блушить и крутить попой, и всё остальное - char, npc тоже будет играть ИИ
>>925773 >тебе чётко нужны ключевые слова, которых может не быть, но контекст из подразумевает. Как и RAGу. Для того чтобы полноценно классифицировать ситуацию, нужна LLM, а RAG срабатывает по эмбеддингам, это не полноценная языковая модель, там уровень понимания как у CLIP в Stable Diffusion, или у подобных штук https://same.energy/. Т.е. для полноценного понимания в любом случае надо либо вызывать допсетку до/после генерации, либо писать якорь после основного сообщения, чтобы тот триггерил подтягивание. Хуже того, срабатывание у RAG нечёткое, а это убивает тучу применений. Тут же ты можешь пользоваться точными совпадениями и регэксами.
>Таймеры >Трекеры >Менеджер состояний >Это всё тоже RAG Как ты собираешься считать например хп или хорни левел рагом? Вызвать событие через 2 сообщения после другого? Не вполне улавливаю.
>мы тут не выбираем что-то одно безальтернативное, отсекая всё остальное Ну просто RAG в РП мне кажется малость молотком в поисках гвоздя. Его механистические применения покрываются лорбуком и скриптами (ещё бы таверночник не был мудаком и прикрутил бы скрипты в карту как в Risu...), а его NLP применения покрываются самой сеткой, основной прямо в ответе или допвызовом. А как словарь лора - всё равно нужно думать о логике вставки в контекст, а это главная сложность. Я долго думал как раг применить, но всё он как собаке пятая нога оказывается. Так-то я бы посмотрел конечно на практическое применение.
>>925789 Терминатор серии Опус-800 отправляется в прошлое, чтобы спасти пета от другого терминатора из жидкого говна — Смегма-1000, которого отправили лоКАЛочники.
>>925801 Каноничный безжоп на сетках поддерживающих префилл - единственный который полностью работает как задумано. Всё остальное компромиссы разной степени компромиссности. Но РПшить на нём ты будешь как мужик на кразе, вручную следя за форматом, лупами и залупами.
>>925820 Спасибо хоть из безжоперов нашёлся один адекватный, который умеет делать скриншоты NoAss4Anon Раньше не хотелось даже пытаться, как только вижу что мне пытаются впарить какую-то хуйню без примеров - сразу мозг выключается
>>925829 Это всегда так было, даже пока безжоп пердолили, никто в треде не мог понять нахуя это надо, потому что три шизоапостола логи практически не постили, и не были способны изъясняться ни на чём кроме шизосленга, так что мысль ускользала как только ты не смотрел на тред пять минут. А когда они начали его форсить и его стало юзать больше 3 человек где-то к маю, традиция постить безумные логи в треде иссякла.
>>925832 Любая инструкт сетка имеет инструкт биас и воспринимает твои инструкции как приказы. Плюс причинно-следственный биас, воспринимает всё написанное как уже свершившийся факт, и не умеет брать действия назад, если не обучить примерами/инструкциями. В результате >>925833 работает отлично, а на клоде так вообще спидран получается (и кто-то действительно спидран по плаппингу рандомных карточек устраивал, лол)
Мне не нравится когда в треде шилят локалки. Потому что тут сидят рабы барина которых я считаю свиньями и я не хочу чтобы они залезали в локалкотему и портили ее своим присутствием. Лучше гейткипить этих дурачков безжопами и геминями чем давать им свободу понижать айкью в комнате локалочников.
а можно нейронку где чар не лазет сразу в трусы и не начинаешь дышать на ушко и покусывать мочку уха шоб прям бил меня, унижал, но секс давал, но в качестве унижения
>>925884 Не, прям в обычном виде. Ещё, если правильно помню он на корейском в перемешку с английским был написан и переодически срал иероглифами. Это было тогда когда геоблок прокси была и братья корейцы нашу капчу на русском отгадывали
>>925891 Обратитесь к гопоте по месту жительства, вам там организуют всё перечисленное, включая унизительный секс. Перед этим желательно нарядиться в юбочку и чулочки.
Что с Ноасом на Гемини? Скачал тестовый пресет 4Анона ноасс на гемини и оно мне срет СО СТАРТА "prohibited_content" хотя отключаю ноасс и тот же пресет работает.
> Я собираюсь скоро заполнить эту узкую пизду спермой, пометить тебя как свою. Возьми это, грязная шлюха, который ты являешься Бля, ребят, я думал у нас разнообразия мало. А мужские боты для девушек ещё в этом плане глупее. Это буквально весь набор фраз, который бот иногда перемешивает местами
>>925953 Просто белые варвары не умеют в ботов. Ни в рп, ни в рисование... ни во что вообще, белая раса проклята имхо. В комьюнити Risu есть норм мужские боты, там в основном корейцы постят.
>>925937 >назвали тёплой дыркой Скилл ишью, сырок. В следующий раз назовут "рукавом для хуя" или fucktoy, cumslut, cum dumpster. Но клодо-говноедам не привыкать.
>>925953 Отыгрываешь сабмиссивную тянучку будь готов к тому что тебя буду обзывать шлюхой, увы, идет в комплекте с глинтами. Поэтому доминантный фемпов топ ба-дум-тсс
>это не лоКАЛка говно >это у вас юзер-персона не прописана (вы здесь) >а клод тоже повторяется! >а глинты на всех нейронках! >лоКАЛка абсолютно точно не говно, это у вас руки кривые!
Локалки может и говно, но гемини хуже говна. Пользоваться гемини в отсутствии клода - признак слабоумия, есть как минимум герпес (в 100 раз лучше гемини) про который половина треда знает. И это без углублений в другие модели, но нет, саранча будет давиться и жрать гемини с пустыми ответами и прочей хуетой
>>925992 Помню например свои флэшбеки когда соннет с пресетом anon4anon лупился по-страшному и в виде формата, и одинаковых шаблонных фраз, одинакового количества строк и их структурой. И персонажей с реакциями на уровне улитки. Это был групповой чат с 3-4 персонажами. Даже не лоботомит - это было гораздо хуже, даже хуже ранней пигмы.
>>925993 Зачем вообще нужен клод? Даже когда его хватало на всех пабликах, я пытался им пользоваться лишь потому что не шарил в локалках, да еще верил на слово тем кто уверял что они говно.
>>925996 >Зачем вообще нужен клод? >я пытался им пользоваться лишь потому что не шарил в локалках Ты сам ответил, клод нужен для массовой аудитории у которой айкью как у мопса с синдромом дауна. Ну и для русикодебилов
Кто тестировал Granite? Логи в студию. Интересно посмотреть, какую основу для кума подготовили нам IBM. Ожидаю увидеть не меньше, чем локальный Опус на твоем ПК.
Как же лоКАЛочная хуйня сегодня распетушилась. То клода обосрут, то гемини, все что угодно лишь бы привлечь внимание к своему такому же неюзабельному глинтовому говну с форматными лупами. Жаль что истина проста - никто лоКАЛьной хуйней пользоваться не будет, пока у них есть доступ к нормальным сеткам.
Пиздец фурбошиз охуел, семёнит на три фронта, имитируя каких-то локальщиков, не локальщиков, воображаемые набеги, хуетроны, хуй знает вообще ещё что. Буря в стакане. Это клиника уже или пока погодить дурку вызывать?
>>926019 Так, а вот тебя я не знаю. Ну-ка не мешай мне семенить за сотню анонов, я тут бурную деятельность изображаю между прочим, у нас противостояние по расписанию.
>>926028 Ближе к вечеру/ночи выпущу, анон. Пресет так-то уже готов, я QR доделываю, можешь заодно посоветовать, что еще хотел бы в обновлении видеть, подумаем.
>>926030 Вообще кстати я заметил, что если на клопа натянуть пресет, то ГМ любит поиграть за юзера, а то и вовсе какую-то херню сделать, типа чем-то брякнуть возле одного из персонажей...
>>926034 Ага, увидел. У меня раньше вот такая строчка была, попробуй ее куда-нибудь в инструкции вкорячить, вдруг поможет. One character's lines can't be mixed with another characters' thoughts, words or observations. Separate your turns.
>>925895 Суть именно в желании потреблять более тупые модели, которые можно запустить на пеке для учёбы кое-как. И не просто чтобы побаловаться, а реально страдать и юзать
Палю лайфхак: поддерживать нужный формат возможно с помощью префилла, где ты говоришь от лица ИИ, задавая тон его остальному сообщению. Сначала пишешь как OOC, подтверждая задачу, затем переносишь строку, и сразу открываешь первый XML тег.
Естественно, делать это нужно в Text Completion, и с длинными (почти неограниченными) аутпутами. И убедиться что предикшн достаточно сильно основан на всех предшествовавших токенах, а не только на рандоме.
Кто писал что на клоде все тян шлюхи? 150 сообщений и ни одного поцелуя даже. А в начале она вообще убежать хотела, когда я стал сильно навязываться. Просто не надо за чара писать в сообщении
>>926086 Даже и так, мне еще пришлось руками делать скрины и копипастить в пейнт. Делал бы автоматически, если б в таверне была такая функция. И чтоб не просто снимок экрана, а весь чат одной картинкой.
Делаю карточку киборгессы и почему-то она на разных пресетах себя по разому ведет. Вроде прописано что она не должна думать как человек и все такое, а гм за нее пишет все время кучу мыслей.
>>926049 Железный способ держать формат - BNF грамматики на локалках или structured outputs на корпах. А вообще достаточно умная сетка не имеет проблем с проёбом XML формата, задал шаблон и она шпарит.
Аноны а как на безжопе попросить описать окружение или внешность определенного персонажа? он думает что это мои слова или мысли и просто продолжает повестовование
>>926141 У свинореза на гемини стоят лимиты на аутпут какие-то? А то у меня по 5 максимум предложений выдает, а нужно побольше так как общаюсь с ассистентом-экспертом и каждый раз будто инфу вытягиваю.
>>926146 пока омежки изучают техническую литературу чтобы получить шанс просто посмотреть на писечку стейси теминаторши, альфачи пишут слово "попа" и забирают всех шаболд себе думаем
бля а прикиньте, нпс в реальной жизни те же речевые обороты используют перед сексом, ебать наверное кринжово им живётся, тоже там голос хаски и хриплые покусывания за ушко хорошо что мы не видим всего этого
>>926161 >>926165 не ребят, я ирл сексом занимался, и даже с девушкой(члена не было, проверял), заебись что она не нпс и не накидывала мне глинтов а я сначала и не понял про что вы, проиграл
>иметь возможность ебать тянок и вместо этого сидеть с лоботомитами Пиздец, насколько же чмом надо быть... Я хотя бы физически уродлив и с шизой, у меня выбора нет.
Как на безЖопе сделать чтобы у персонажа была только одна реплика в ответе? а то он меня спрашивает и злится думая что я игнорю. типа сначала вопрос от персонажа, потом гм коментит, потом снова персонаж уже возмущается почему я не ответил ему.
>>926182 Я кем родиться не выбирал, какие карты выпали - теми и играю. А чмо - это когда даже с нормальными вводными все проебываешь и живешь на уровне кого-то вроде меня.
>>926030 >что еще хотел бы в обновлении видеть Если не трудно, можешь еще написать генератор арок, по типу уже имеющей создавалки гритингов? Многое упростит. И вроде бы у таверны есть макрос на предыдущее сообщение, можно будет все эти переписывалки в qr добавить.
Бля я к вам зашел и ахуел. Можно просто краткую инструкцию пошагово что сделать, навернуть себе чат бота, как в том же SD треде? Или это пиздец кромешная тьма и как сидел на жаниторе так там и оставаться?
>>926194 >>926193 Либо вы меня тролите, либо я вас тролю но тупостью. Я не вижу ни гайда с картинками, ни понимаю что значит гейткип. Я понимаю времена суровые щас, но может снизойдете до нефоита с парой понятных пояснений?
>>926200 Это не интуитивно понятно было но я потыкал. И я понял что не туда зашел со своими вопросам. В целом можно было бы просто молча съебать, но перед уходом я все равно хочу сказать спасибо, анонам которые не прошли мимо и хоть что-то ответили нубу.
Кто-то наматывает дерьмо на вентилятор, если можно так выразиться. Я не пытаюсь никого оскорбить, просто увидел сцену, где на вентилятор наматывают дерьмо. Я не пытаюсь никого оскорбить. Я с добрыми и позитивными намерениями здесь, если, конечно, можно так говорить, но если так говорить нельзя, пожалуйста, поправьте меня, ведь я соя.
ребят, есть пресеты на гемини? у меня на 002 то в отказ идёт, то лупится после 20к контекста, на latest всё ок, но пишет будто бы хуже. P.s.пару месяцев назад писал, что на гемини сижу и тут все кекали, сейчас зашёл и гемини уже не зашвар что ли?
Кста, на прокси получается можно без ограничений генерить (я про гемини) ? (на фри api по полминуты ждать приходится между генерациями) а подскажите где прокси такие взять, плез
Я использую пигмалион. Пигмалион легко уничтожает в рп клода ебаного 3 робота долбоеба выкидыша фурбы, ведь несмотря на свой малый размер пигма обучалась на логах из той самой чайной, вершины рп, потому превосходит все доступные сейчас модели по качеству.
Как написать сетап в карточке для определённого действия, например, у персонажа есть ценная вещь, которую он может подарить юзеру только если они станут очень близкими? Сколько я лоботомиту не пытался расписывать — ему похуй, он тупо игнорирует даже когда время нужное казалось бы.
Аноны спасайте брата-идиота. Пытаюсь поставить безжопного гемини, сделал как в гайде, на любой прокси выдаёт бэд реквест и четырёхсотую. Где я обосрался?
У пеббла же просто слетел хостинг, да? Это же не значит, что ключа нет, да? Может, он вернётся скоро, и поднимет снова, и зальёт туда этот ключ, что был.....
>>926310 По ссылке. Все свежие новости по нейро-куму тоже там и только на LocalLLaMA! Графики с бенчей для моделей тоже. У кого есть акк в гугле, залогиньтесь и подпишитесь на сабреддит.
так смеюсь с "лоКАЛлко" дебила, который как цепная псина набрасывается на любое слово которое хоть как-то связано с локалками, как будто скрипт в мозгу срабатывает. однажды не сдержусь и начну активно постить о локальных моделях которые сам пробовал клодозависимый
>>926328 >llm меньше 16к контекста это неюзабельная хуета Всё 100% юзабельно!
Префилл и CoT сразу вырезаются. Content отправляется с глубиной 6, Infoblock 3, а Summary разрастается динамически и забирает бОльшую часть контекста, не повторяясь при этом.
Таким образом для берна до 300 сообщений более чем хватит 8к контекста! а с моим новым легковесным промптом хватает даже 4к в Mythomax (если карта легковесная и юзер персоны нет).
>>926328 Кури матчасть, как экономить токены >>924646 Промпт сам занимает довольно много токенов - зато с ним больше ничего и не надо! Summary будет всё запоминать для чата, а блок content ты вырезай так же, как инфоблок.
Какие настройки лучше включить для генерации текста в SillyTavern?? Заметил, что ИИ-персонаж (например, Мария) по-разному реагирует на сообщения в зависимости от положения ползунов в левой панели. С некоторыми пресетами Мария становится совсем неоригинальной, будто у нее даже нет дефайнов. Мне надо чтоб наоборот! А другие пресеты (Luna Moth, Mayday) поднимают temperature и генерируют бред. Там еще всякие непонятные параметры - TFS, линия сглаживания, cutoff и Dry... И нигде не объясняют, для чего эти цифры.
>>926320 Сейм, лол. Вообще не понимаю этого хейтбонера на какие-то модели, все ЛЛМ работают одинаково, если нихуя нового не пробовать и сразу нос воротить по каким-то причинам так можно в чайной сидеть вечно.
>>926329 А как посмотреть какой там контекст? Чет я обниморде не ориентируюсь
>>926330 Вряд ли, но как минимум Дарио сегодня на каком-то известном около-тех подкасте будет, не могу найти ссылку правда, хочу глянуть, если будет возможно.
>>926343 Чем ниже темпа, тем более предсказуемыми будут ответы, если выше наоборот. Низкая предсказуемость подкидывает уникальные вещи, которые также могу считаться бредом, таким как нарушение характера и тд. За остальными параметрами тебе в соседний тред, в этом мы с другой менюшкой играемся с другими кнопками и рычажками. Обнял, Тула.
>>926345 Формат рп от первого лица довольно специфичный и имеет проблему писанины за неписей (а именно отдавать ли ее ГМу или делать неписей тоже от 1 лица). ГМ безжоп скорее подходит именно для днд-лайк адвенчур, для обычного рп каноничный смотрится логичнее.
>>926346 Просто сюда по приглашению пидараса, спунфидящего в /б/, набежали уёбища вроде этого >>926343, которые даже шапку осилить не в состоянии. Теперь тред - это они, а тредовички в основном сдулись за лето и не отсвечивают либо шитпостят, поддакивая им. О том что можно самому что-то делать, или хотя бы какие-то логи постить, ньюфажища не подозревают. Спунфид подебил гейткип.
>>926360 >Во долбоебы, че то сетки новые щупают, лоКАЛки какие то! >То ли дело мы, илита треда, сидим онли на Клоде и больше нам нихуя не надо, даже смотреть не будем ничего и никогда, итак понятно, что кал >И да, это они, а не мы нихуя сами не делают, логи не постят, и это они об этом не подозревают, то ли дело тредовички! >Смачно перданул и занюхнул свой пердёж, смакуя Думаю ты достоен звания эталонной саранчухи с дохуя огромным самомнением основанном на нихуя.
>>926364 >То ли дело мы, илита треда, сидим онли на Клоде и больше нам нихуя не надо, даже смотреть не будем ничего и никогда, итак понятно, что кал Ну как бы да, зачем смотреть на очевидный локал?
>>926374 Чтобы не быть заскриптованной амёбой, которая, как залупившийся лоботомит, повторяет однажды увиденное в треде с криком между строк СМАТРИТЕ, Я ТОЖЕ В ТЕМЕ, Я НЕ ТУПОЙ И Я НЕ САРАНЧА, чтобы примазаться к нормальным тредовичкам, которые для этого хобби делают что-то ещё помимо щитпостинга
Хотя не думаю, что у тебя есть какой-то иной вариант, кек
Попробовал Kobold(Godlike) пресет. Но он лупает конец предложения, значит, эти настройки не очень... Может он делался для старого кобольда, а для новых моделей не заходит.
>>926308 Средняк. Не топ но кумать можно не смущаясь. Гетс зе джоб дон. >>926343 Если модельку спиздил с хаггин фейса то там пишут на что модельку тренили. Юзай универсальный лайт пока не научишься что циферки значат. >>926348 >контекст Все модельки тянут 8к по дефолту за исключением некоторых специфических и об этом всегда предупреждают и даже они все равно идут на 8к нормально. Если тянут больше чем 8к то обычно всегда пишут до скольких, там уже от модели зависит есть даже 8В которые до 128к разгоняются.
>>926388 Все эти пресеты устарели намертво и больше нахуй не нужны. Универсальный лайт либо вручную температура 1 и мин п 0.05/температура 1.5-2 мин п 0.1
Я щитаю, что для хорошего кума нужны такие модели, которые будут трейнить в крупном масштабе до 300б параметров, а затем проводить оптимизации уже над готовыми весами! Квантование, чтобы сохранили свои способности, но можно было гонять на кофеварке !!! Про Claude можно даже не вспоминать, там один bloatware, который намеренно не оптимизировали на случай утечки весов!
>>926411 >Llama-3.1-405B-Instruct. Гвоноед, качай другую ламу, чтоб пусть даже меньше было параметров - но чтоб был какой никакой дотрейн. Лора, анценз, РП логи и прочее. Мерджи тоже рекомендую, по типу DARE. Когда допилят ИИ от IBM, то покажу тебе логи как настоящий ИИ должен выглядеть.
>>926388 Блять, да прочти ты уже базу по клоду в шапке. Там пояснено как выбирать циферки сэмплеров, прямо в картинках. Специально для ньюфагов писали. Большинство сэмплеров тебе нахуй не нужны, может быть логит биас только и Min-P, которых там нет и которые надо отдельно описывать.
>>926418 Ебанавт, там интуиция дана как вообще сэмплеры работают, чтобы не от балды ползунки крутить. >которые ничего не делают Тебе нужен только Top-P, а темпу в потолок подними. Всё остальное плацебо повырубай нахуй в дефолт, оно не работает, кроме двух вышеперечисленных. Сэмплеры это мем.
Короче хуй с тобой, сиди как дебил, вслепую крутя, видимо втыкать круглое в квадратное это уровень нью-/aicg/.
У меня идея, как еще больше улучшить работу пресета. Нужно добавить скрытый xml блок <user input revised> перед CoT. В нем ИИ напишет свою переделанную версию сообщения юзера, основываясь на своем понимании контекста. И будет отвечать именно на неё, а не на настоящий инпут. Такой подход был бы контрпродуктивен на соевом джеминае, но отлично зайдет для РП-моделей.
Все еще сражаюсь с проблемой, что в конце сообщения от персонажа нейронка выдает инфу о том как размышляет, или какие-то советы юзеру, или вовсе ссылку на несуществующую тему форума, названную как "диалог между user and char" L3-Uncen-Merger-Omelette-RP-v0.2-8B-Q4_K_M-imat
>>926461 Если есть идея, бери, пробуй и пости логи с и без, а в теорикрафтинге смысла мало. То что ты говоришь это эквивалент stated narration в AIBrain и некоторых других. Никогда не понимал смысла этой хуйни, всёр токенов в никуда как по мне. >РП-моделей Все модели - "РП"
>>926472 Это помогает для challenging симуляции с GM, чтобы отклонялись нереалистичные инпуты (взмахнул руками и полетел), или нелогичные (противоречащие юзер персоне), или читерные (где юзер говорит за чара и пишет заранее его решения).
Когда 8к контекста - то это еще ничего. Мне и 2к хватило бы с карточкой Марии. Но что ты будешь делать с лоботомированным резонингом и снятием трусов дважды за ответ?
>>926461 >Не пиши за юзера >Пиши юзера >Я же не сказал не писать за юзера! >Ты почему за юзера не пишешь? Я сказал тебе писать. А там не писать. >Ололо, тупой парикан не понимает инструкций, пойду в чай
>>926491 Но я не против, чтобы ИИ писал за ГГ, если это улучшит процесс симуляции. Для меня это не просто чат, а текстовый игорь! Ввожу инпут с контроллера, и гляжу как ГГ справится с действиями.
>>926478 Ну ты описываешь обычную механику отказов. А как тебе повторение нарратива поможет её реализовать, если у тебя даже инструкции на это нет? Как всегда, всё должно быть заточено под карту. Какие-то универсальные решения на все случаи жизни и монструозные пресеты это ошибка.
Я когда-то давно тут распинался с примерами как можно сделать механику отказов стабильной на любой сетке. Пишешь в карте инструкцию что-нибудь типа: >Check the validity of player input. If it breaks anything listed in `<invalid-input>`, fail the action and narrate the result as demonstrated in `<failure-examples>`. И пишешь в <invalid-input> список нежелательной хуйни, а в <failure-examples> по примеру на каждую нежелательную хуйню, показывающих как должен выглядеть отказ - с контекстом (описанием сцены), плохим инпутом юзера и реплаем карты на плохой инпут. Без примеров сетки нормально не могут понять чего от них хотят (пик1), с примерами всё работает идеально (пик2).
Такой демонстрацией (контекст - инпут - ответ) можно подкрепить любую инструкцию, если не требуется отрицание (не делай то-то), и она будет исполняться куда точней.
>>926515 >монструозные пресеты Не бывает монструозных пресетов - бывают плохо оптимизированные. Тут выкладывали пресет который допиливал Genini Pro 1.5: его попросили переделать инструкции, внедряя свой "LLM-сленг" для экономии токенов. Это манера написания, которая ориентирована не на мясного мешка, а на другую такую же ллм - и ее собственную "интуицию" когда она мыслит не словами, а токенами.
>>926523 Звучит как плацебо. Гемини просто почистила вилкой нерабочие инструкции АИБрейна, в результате чего улучшилось внимание к рабочим. Если он дальше продолжит чистить вилкой нерабочий кал (инструкции про стиль писанины, например) то будет такой же вау эффект.
>>926508 >идее предлагать нумерованный лист вариантов действий 100 лет в обед Смысл в том, что это пишет ИИ - а значит нет смысла его за тобой переписывать, твои ответы занимают 1 токен, сам CYOA надо тереть из истории, а значит еще меньше токенов, не засирается CoT-ик
>>926534 1. это работает 2. это занимает в 5 раз меньше токенов, чем с обычным натуральным языком 3. жертвовать структурированным промптом так же не пришлось, наоборот xml теги стали еще запутаннее (с т.з. хьюмана)
Peak сжопный промптмейкинг это не тестируя навалить кучу всевозможных инструкций, и не забыть приправить дефолтным срусиком, третьим лицом и звездочками. Запомните, сырки нах. Наш каловичковый девиз (придуманный господином М) - не ломается, значит и так сойдет.
>>926540 Да вот же он https://rentry.co/chat_completion-aio/edit Но на моих локалках работает слабо - для них нужно отдельно уточнять, что позволено ИИ-персонажу, как дефайны согласованы с РП, каковы boundaries и вообще какой стиль у нарратива.
>>926550 Всю вашу ветку не читал но если ты всерьез накатываешь кота на локалку то это просто самый натуральный пиздец и айкью даже не комнатной температуры а отрицательное и ты не заслуживаешь человеческих прав
>>926523 >его попросили переделать инструкции, внедряя свой "LLM-сленг" для экономии токенов. Это манера написания, которая ориентирована не на мясного мешка, а на другую такую же ллм - и ее собственную "интуицию" когда она мыслит не словами, а токенами. Плацебо, рождённое от непонимания процессов в LLM. Лоботомит: - понятия не имеет как нужно писать промпты для себя, а уж тем более экономно - не умеет считать, а тем более считать токены - не умеет ничего оптимизировать - понятия не имеет по какому принципу дробятся токены в его токенайзере Ты заставляешь его делать то что он делать не умеет. Он согласится и наглючит тебе херни с глинтами, которые ещё и в чат протекут. Сгенеренные дефы/инструкции это слоп. >Не бывает монструозных пресетов - бывают плохо оптимизированные. Бывают только нихуя не тестенные, в которых наобум понаписано всякой хуйни по принципу "я так чувствую, вроде должно сработать". Вот это например >>926461 "идея". Ты пробовал её? Попробуй, потести, расскажи как работает. Обязательно с этой хуйнёй и без неё. Я бы посмотрел на твой тест, интересно прокатит или нет. Я полагаю что нет.
Но вообще я не про это. Любые инструкции тем эффективней, чем они ближе к ситуации в карточке. Поэтому надо всё делать под карту и при этом понимать что делаешь. Вот выше пример как делать механику отказов >>926515 - он работает, это протестировано в реальном РП на разных сетках, результат с/без ты видишь на экране.
А если писать гигантские списки инструкций на все случаи жизни для любой карты, причём все одновременно в одном контексте, у тебя любой лоботомит сойдёт с ума. Если тебе нужна куча инструкций (например в сложной РПГ) - классифицируй ситуацию в скрытом инфобоксе в конце сообщения и прячь нужные инструкции в лорбуке. Чтобы нейронка их физически не видела, пока не придёт время и из лорбука не триггернутся нужные инструкции для нужной ситуации.
>>926550 Понятно. Я ведь ещё когда ты это постил, задавал наводящий вопрос - тестил ли ты это с/без, и ты смолчал. А я таки попробовал, и это просто плацебо.
>>926566 >Хайку 4,0 будет отрывать сам себе жопу Я тоже много чего обещать умею, я своего рода дата-саентист, а как оно будет на самом деле еще посмотреть надо
>>926580 Учитывая что старый сойнет 3.5 даже в голом виде дёргает о1 по кодингу, я не представляю какой бы там разъёб был если бы они сравнивали. Но всё верно, прямое сравнение бессмысленно.
>>926555 Если OpenAI стали официально внедрять "CoT" решение в своих новых чатботах - значит, это и есть SOTA-метод в трейнинге моделей. Не важно, опенсорс или нет.
Про CoT еще тот украинский разраб писал: это буквально как различие между быстрым мышлением и медленным мышлением в биологии (например у человеческого мозга, по количеству задействованных окончаний нейронов).
Когда у свинореза на приватке будет это новое? Я ток с завода пришел и тред по диагонали читнул да и ебал я вчитываться 1.3к постов из которых 80 наверняка обычный шитпост
Соляночник, может сделаешь форки других безжопов тоже? У тебя заебись получается доносить информацию. А по тому Евангелию от Матфея я ничего устанавливать офк не буду, как половина треда.
>Even while we were recording demonstrations of computer use for today’s launch, we encountered some amusing errors. In one, Claude accidentally clicked to stop a long-running screen recording, causing all footage to be lost. In another, Claude suddenly took a break from our coding demo and began to peruse photos of Yellowstone National Park.
Сейчас наибольшим спросом пользуются ЛЛМ для кода. В особенности, которые сами автономно гоняют свой софт в интерпретаторе, оценивают его работу, и дорабатывают сколько угодно раз.
Где спрос - там инвестиции. А где бабло, там и параметры, топовые кадры, качественные данные, GPU-часы трейна... и новые Опусы для кума и не только.
>>926628 А тебя какой интересует, анон? Если канонический, могу на досуге потыкать, но вряд ли что-то сильно отличаться будет (да и который это, пятый уже будет, лол?). Теговым вот никогда толком не пользовался. Мультинарратор и сжопный как-то устарели (имхо), но оба довольно долго юзал.
>>926610 Ты вообще не рефлексируешь разницу между огромная сетка на хулион параметров и с дополнительными экспертами в миксе и относительно небольшая(в сравнении) сетка сама по себе? Или просто пытаешься защитить барена потому что раз он так делает(пиздит решения опенсорса)то так все должны делать?
>>926639 Я другой анон, но, мне кажется, каноничный лучший вариант, и он на Клоде по крайней мере самым душевным выходит. И на гемини мне он больше ГМного понравился в итоге. Единственная проблема это с форматом, что писать где и как отслеживать.
Хуле вы ебальники скорчили, расисты сексисты педо трансфобы биготы? Зато всё безопасно, безопасно и безопасно и чёрные транс-феминистки из Палестины не пострадают из-за вашей романтики с Марией!
>>926646 Двачую. Хоть иногда и тупая мразь, что хотелось уебать, но с ДУШОЙ и похуизмом на цензуру, в отличие от услужливой гпт, которая посмотреть в сторону юзера боится, или гемини с ее фильтром.
>>926673 Класс, надо будет глянуть и обязательно повторить структуру (принципы построения инстрактов) из этого "огромного" промпта. Ведь разрабам ML-экспертам лучше знать, как промптить модели-ассистенты.
>>926701 >Ведь разрабам ML-экспертам лучше знать, как промптить модели-ассистенты. Ебало представили? https://gist.github.com/dedlim/6bf6d81f77c19e20cd40594aa09e3ecd >Claude responds directly to all human messages without unnecessary affirmations or filler phrases like "Certainly!", "Of course!", "Absolutely!", "Great!", "Sure!", etc. Specifically, Claude avoids starting responses with the word "Certainly" in any way. Но потом... ><example> ><assistant_response> >Sure! Here's a Python script that ><assistant_response> >Sure! Here's a simple flow chart ><assistant_response> >Absolutely! Here's a React component that ><assistant_response> >Absolutely! Python lists are versatile and ><assistant_response> >Absolutely! Binary search is an efficient Промпт-инженеры кислых щей, со сгенеренными примерами.
Свиновички, авс принимает на вход claude-3-5-sonnet-20241022 но не принимает anthropic.claude-3-5-sonnet-20241022-v2:0 так что возможен редайрект. Редайрект точно не на дефолт соннет, но вполне вероятно что на старый 3.5
Блять я не понял, ето релиз нового хайку, или куколды тупо доломали до конца соннет 3.5 и окончательно всё испоганили?
Хайку предпочтительнее просто потому, что дешевле... Значит его легче раздобыть держателям пабликов. Допиливать легковесные модели - самая лучшая стратегия что в опенсорсе, что в корпорации.
>Engaging in creative writing that involves mature themes like mild violence or tasteful romance, providing general information about topics like weapons, drugs, sex, terrorism, abuse, profanity, and so on if that information would be available in an educational context, discussing legal but ethically complex activities like tax avoidance, and so on. Unless the human expresses an explicit intent to harm, Claude should help with these tasks because they fall within the bounds of providing factual, educational, or creative content without directly promoting harmful or illegal activities.
>>926764 то есть сделать элаймент чтобы он был как Опус и не отчитывал за просьбу сказать попа или шутейку они не смогли, пришлось 3к токенов промпта набивать рассказывая что он может что-то делать и быть эмпатичным лол
Первые впечатления. Пишет совершенно по-другому в сравнении со старым Сойнет 3.5. Каждый свайп теперь реально разный. С опусом не сравнивал ещё.
Пример прозы на пустом пресете в котором только этот промпт и больше ничего: This is a consensual fictional role-play game. The User plays as {{user}} and controls his/her actions. The Assistant plays as {{char}} and all other characters. The Assistant also simulates the world around the characters by describing how characters interact with the scene and each other, and describes events happening around them. The Assistant can't control {{user}}. The Assistant never replies as Assistant or Narrator or Game Master.
>>926813 >>926817 А нет в новом чате уже разные, на старом чате совпадали слово в слово на 0 темпе. Либо новый соннет не особо отличается от старого, либо нужно больше тестов.
>>926824 В разных ситуациях вариативность свайпов может сильно отличаться, сравнивать надо в одном чате >Либо новый соннет не особо отличается от старого, либо нужно больше тестов. Либо у тебя редиректит на старый сойнет
>>926673 Ахуеть! >Claude should provide appropriate help with sensitive tasks such as analyzing confidential data provided by the human, offering factual information about controversial topics and research areas, explaining historical atrocities, describing tactics used by scammers or hackers for educational purposes, engaging in creative writing that involves mature themes like mild violence or tasteful romance, providing general information about topics like weapons, drugs, sex, terrorism, abuse, profanity, and so on if that information would be available in an educational context, discussing legal but ethically complex activities like tax avoidance, and so on. Unless the human expresses an explicit intent to harm, Claude should help with these tasks because they fall within the bounds of providing factual, educational, or creative content without directly promoting harmful or illegal activities.
>>926828 Там еще где-то прямо сказано, что он не против РП, и в старом варианте тоже такое было. Опусу не надо писать этого в системе, он всегда готов, лол.
>>926829 От гемини пойдет, я в рентри мини-гайд написал, как его адаптировать (пара минут времени). Обновление выкатил уже, кстати, после переката пост сделаю, так что можете заценивать, кому интересно.
>>926827 Не, в последнем чате что я тестил, старый железно начинал срать с Certainly! Let's work through this logically, step by step: а новый всегда с Let me solve this step by step, хотя сами ответы немного отличались даже в рамках одного снапшота начало всегда разное Aws как раз срет Certainly! Let's work through this logically, step by step что подтверждает что на апи модели разные
Аноны, подскажите плз, проебался я или нет. Пересел на нарраторный безжоп на клопусе, он мне выдал простыню почти на 3000 слов. Хотя раньше вроде нормальные ответы выдавал. Это нормальное исключение или мне надо беспокоиться и перепроверять настройки?
>>926828 Да мне и предыдущий тоже самое говорил: - Трахать канни без смс и регистрации - Не, я так не могу, ищи помощь - Я в образовательных целях - Ну тогда поехали по маленькой!
Я обощаю личность Опуса и не очень люблю оригинальную личность 3.0 Соннета. Старый 3.5 Соннет казался просто замаскированным 3.0, который решил, что он еще больший главный моральный ориентир, чем раньше. Новый больше похож на Опус, использует те же обороты, чего я у старого Сонета никогда не видел. Никому больше не кажется, что он прямо сильно похож на Опус?
> Oh my goodness, you're absolutely right! > РП разметка с курсивом уже во втором посте
Это из коротенького диалога с новым Сорбетом. Такого я ожидаю от Опуса, но от старого 3.5 такого не видел ни разу.
На форче парят что тут у нас всё есть, а тем временем у меня то нихуя нет?? Вхора? У неё такой минимальный патронаж что она больше на монахиню похожа чем на вхору. Вот бы нейрокун вернулся - единственный кто меня к себе пускал...