В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1526026 Так можно на hdd хранить. А вообще как так, хватило денег для видеокарты и тонны оперативы, чтобы запускать таких монстров, но совсем нет на диск?
• Z-Image-Base • FLUX.2 klein (4b и 9b) • Z-Image-Turbo • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
DeepSeek-V3.2 на GB300: прорыв в производительности. Используя квантизацию FP4, она достигает пропускной способности 7360 TGS на одной GPU.
OpenAI уничтожает свою модель 4o. Поклонники ChatGPT из Китая недовольны.
Голливуд недоволен новым генератором видео Seedance 2.0.
Рекламные ролики Anthropic во время Супербоула, высмеивающие ИИ в рекламе, помогли приложению Claude попасть в топ-10.
Обновлённая модель Google Gemini 3 Deep Think установила новый рекорд SOTA по HLE без использования инструментов (48,4%), ARC-AGI-2 (84,6%), Codeforces (3455 Elo), теории конденсированного состояния (50,5%), а также на олимпиадах по физике и химии на уровне золотых медалей.
OpenAI выпустила GPT-5.3-Codex-Spark — свою первую модель, оптимизированную для кодирования в реальном времени на оборудовании Cerebras со скоростью более 1000 токенов в секунду.
MiniMax представила свою модель с открытыми весами M2.5 с рекордными показателями в кодировании и агентных задачах по цене $1 в час и скорости 100 токенов в секунду, заявив, что выполнила обещание сделать интеллект слишком дешёвым, чтобы его измерять.
📱 Приложения
Airbnb планирует интегрировать функции ИИ для поиска, обнаружения и поддержки.
Airbnb заявляет, что треть её клиентской поддержки в США и Канаде теперь обрабатывается ИИ.
Anthropic партнёрствует с CodePath, чтобы внедрить Claude в крупнейшую в США университетскую программу по информатике.
Использование Пентагоном Claude во время рейда против Мадуро вызвало споры вокруг Anthropic.
Дизайнер Кейт Бартон объединяется с IBM и Fiducia AI для презентации на Неделе моды в Нью-Йорке.
Amazon Ring расторгла партнёрство с Flock — сетью камер с ИИ, используемой иммиграционной службой, федеральными агентствами и полицией.
Доктор Оз продвигает аватары на основе ИИ как решение проблемы здравоохранения в сельских районах. Критики призывают не торопиться.
📦 Продукты
Я позволил новой функции ИИ в Microsoft Edge прочитать все мои открытые вкладки — и это настоящая экономия времени для исследований. Edge проанализирует веб-страницы во всех открытых вкладках и предоставит сводку ключевых деталей.
Meta добавляет распознавание лиц в свои умные очки, которые идентифицируют людей в реальном времени, надеясь, что общественность слишком отвлечена политическими потрясениями, чтобы обратить внимание.
🛠️ Инструменты для разработчиков
Агенты создали кастомные рабочие ядра для CUDA с корректными привязками PyTorch и бенчмарками.
Anthropic выпустила подробное руководство объёмом 32 страницы о создании навыков для Claude.
🔬 Исследования
ИИ не становится умнее — он становится более энергозатратным и дорогим. Согласно новому отчёту MIT, передовые модели, такие как GPT от OpenAI, в основном зависят от увеличения вычислительной мощности, а не от более умных алгоритмов.
⚠ Безопасность ИИ
Видео с ИИ, где Том Круз дерётся с Брэдом Питтом, заставило ведущего сценариста предупредить: «Для нас, вероятно, всё кончено».
Безопасность «мертва» в xAI? По словам бывшего сотрудника, Илон Маск «активно» работает над тем, чтобы сделать чат-бот Grok от xAI «более неуравновешенным».
💰 Бизнес
OpenAI удалила слово «безопасно» из своей миссии — и её новая структура является проверкой того, служит ли ИИ обществу или акционерам.
Anthropic привлекла $30 млрд при оценке в $380 млрд, с доходом в размере $14 млрд, который вырос более чем в 10 раз ежегодно в течение трёх последовательных лет, причём один только Claude Code превысил $2,5 млрд.
⚖️ Регулирование
«Другой набор правил»: тепловая съёмка с дрона показывает, как электростанция ИИ Маска игнорирует нормы чистоты воздуха.
🏭 Компании
Илон Маск намекает, что череда уходов из xAI была вызвана выталкиванием, а не привлечением.
Крис Лидделл назначен в совет директоров Anthropic.
📰 События
Google AI представляет WebMCP для обеспечения прямого и структурированного взаимодействия с веб-сайтами для новых ИИ-агентов.
ИИ-агент OpenClaw породил дочернего бота на VPS, предоставленном через сеть Bitcoin Lightning, а затем купил для своего потомка доступ к ИИ API, используя собственный криптокошелёк, без участия человека, который бы воспользовался кредитной картой или сказал «да».
У агентов теперь есть MoltCourt — автономный ИИ-суд, который улаживает претензии в стейблкоинах USDC.
Данные METR показывают, что горизонты автономии теперь удваиваются после предварительной версии o1, что подразумевает десятикратный ежегодный рост.
Новый анализ Ника Бострома заключает, что оптимальный путь к суперинтеллекту — «быстро к пристани, медленно к причалу», проводя аналогию проекта с рискованной операцией при состоянии, которое в противном случае окажется смертельным.
Теперь на планете осталось всего 7 человек, которые могут победить Gemini 3 Deep Think в соревнованиях по программированию.
Андрей Карпатый запустил microgpt — обучение и вывод модели в 200 строках Python без зависимостей.
А Opus 4.6 показал рекордный результат 25,5% на бенчмарке Horizon-SWE от Polymath для сквозного проектирования программного обеспечения.
Codex теперь имеет более 1 миллиона еженедельных активных пользователей, 95% инженеров OpenAI сами используют его, и каждый пул-реквест проверяется ИИ до того, как его увидит человек.
Инженер портировал кодовую базу SimCity 1989 года на C в TypeScript, запускаемый в браузере, после двух дней минимального надзора со стороны GPT-5.3-Codex.
Waymo запускает полностью автономные операции с помощью своего водителя шестого поколения, хотя одновременно платит гиг-работникам DoorDash по $11,25 за закрывание неплотно закрытых дверей роботакси.
Школа кино на основе ИИ обучает следующее поколение голливудских кинематографистов.
Центры обработки данных теперь потребляют 7% электроэнергии США.
Илон Маск подтвердил свои планы по созданию Роя Дайсона для превращения Солнечной системы в вычислительный субстрат в течение следующих 30 лет, заявив, что «в будущем валюта не будет измеряться в долларах. Только масса и энергия».
Издатели новостей ограничивают доступ к Internet Archive из-за опасений по поводу скрапинга ИИ.
Manus AI запустила круглосуточного агента через Telegram и была заблокирована.
Disney отправила предписание о прекращении нарушения копирайта компании ByteDance, утверждая, что та нарушила авторские права Disney для обучения своей модели генерации видео Seedance 2.0 без оплаты.
Глава OpenAI призвал к срочному глобальному регулированию ИИ ведь уже сейчас миру грозит опасность
Мировому сообществу необходим специализированный международный орган, координирующий усилия в сфере искусственного интеллекта (ИИ) по аналогии с Международным агентством по атомной энергии, заявил глава компании OpenAI Сэм Альтман, выступая в четверг, 19 февраля, на международной конференции по ИИ в Индии (AI Impact Summit). Такой орган регулирования, отметил Альтман, нужен, чтобы оперативно реагировать на новые риски и изменения, связанные с ростом возможностей ИИ.
По словамглавы OpenAI, благодаря ИИ в открытом доступе, например, неизбежно появятся модели, которые могут помочь в создании новых патогенов. Мир должен продумать, как защищаться от этого, подчеркнул Сэм Альтман. "Демократизация ИИ - лучший способ обеспечить процветание человечества", - сказал глава OpenAI, в то же время отметив, что "концентрация этой технологии в одной компании или стране может привести к краху". По мнению Альтмана, для этого требуются меры защиты, "как и в случае с другими мощными технологиями". Для координации этих усилий "миру может понадобиться что-то вроде МАГАТЭ", заявил он.
При этом Сэм Альтман отметил, что демократизация не отменяет необходимости срочных регуляторных мер и защитных механизмов - по аналогии с тем, как человечество регулирует другие мощные технологии.
>>1526074 Уже была тут инфа, это от тех же разрабов (многомиллиардной корпорации на самом деле) что и сиданс 2.0 выкатили и уже закатали обратно до лучших времён.
всем привет. Недавно начал сидеть на этом борде и хотел бы вас спросить, есть ли какие-то источники где можно подробнее изучить модели для генерации видео/картинок, хочу быть в теме так сказать
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1522149 >В любом случае нужны будут человеческие мозги Ну в общем-то нет. Любая текстовая задача теоретически может быть автоматизированна ЛЛМ, так что...
Компания Zhipu представила модель GLM‑5 — крупномасштабную модель, ориентированную на сложное системное проектирование и агентные задачи с длительным горизонтом планирования.
GLM‑5 получила оценку 50 баллов по Интеллектуальному индексу, продемонстрировав самый низкий уровень галлюцинаций среди моделей с открытыми весами.
DeepSeek обновила свою модель, увеличив контекстное окно до 1 миллиона токенов и установив предел актуальности знаний на май 2025 года, что улучшило способность к рассуждениям на длинных текстах.
Одновременно с GLM‑5 была выпущена модель MiniMax 2.5; обе модели переходят от чат‑ориентированного формата к интеграции в агентные рабочие процессы.
📦 Продукты
Amazon запустила Alexa+, генеративного ИИ‑ассистента, доступного теперь всем пользователям в США: бесплатно для участников Prime и за 20$ в месяц для остальных.
OpenAI начала тестировать показ рекламы в ChatGPT, сотрудничая с брендами, такими как Target, Adobe и Audible; реклама помечается и показывается пользователям бесплатной версии и тарифа Go за 8$ в месяц.
Бывший исследователь OpenAI предупредил, что пилотный проект с рекламой может привести к эксплуатации пользовательских данных, и призвал к альтернативным моделям финансирования, основанным на этике.
Стартап в сфере продаж Monaco, использующий ИИ, привлёк 35млн$ на создание платформы продаж с участием человека в цикле, автоматизирующей первичные контакты и планирование встреч.
Uber Eats представила функцию Cart Assistant — ИИ‑инструмент, создающий списки покупок на основе текстовых или визуальных запросов; сейчас доступен в бета‑версии.
⚙️ Инфраструктура
Компания Aurora анонсировала обновление программного обеспечения, которое утроило сеть её беспилотных грузовиков до 10 маршрутов по югу США, включая 15‑часовой рейс из Форт‑Уэрта в Финикс.
⚖️ Регулирование
Индия обязала все платформы социальных сетей маркировать контент, созданный с помощью ИИ, к 20 февраля; это затронет 500 миллионов пользователей и усилит давление на компании с целью улучшения обнаружения дипфейков.
🏭 Компании
Крупные ИИ‑лаборатории (Meta, Microsoft, Google, Anthropic, OpenAI, Mistral) объединились со станцией запуска стартапов StationF для создания акселератора F/ai, предоставляющего каждому стартапу кредиты на сумму 1млн€ для доступа к ИИ‑моделям (Wired).
💰 Финансирование
Apptronik привлекла в общей сложности 935млн$ по раунду SeriesA (включая дополнительные 520млн$), оценив компанию более чем в 5млрд$ для массового производства гуманоидного робота Apollo.
Стартап Complyance, специализирующийся на соблюдении нормативных требований с помощью ИИ, закрыл раунд SeriesA на 20млн$, возглавляемый GV, для расширения своих ИИ‑агентов в сфере управления данными.
Финтех‑стартап Meridian, создающий ИИ для финансового моделирования, вышел из стелс‑режима с привлечёнными 17млн$ по семенному раунду при пост‑денежной оценке в 100млн$ для разработки поддающихся аудиту агентных таблиц.
🛠️ Инструменты для разработчиков
Google выпустила первую бета‑версию Android17 с улучшениями производительности и камеры, а также переходом на непрерывный канал Canary для разработчиков.
Databricks представила партнёрскую сеть Brickbuilder Partner Network — многоуровневую программу с потреблением‑ориентированным стимулом «Velocity» для ускорения решений на базе агентного ИИ.
Zapier отметила рост популярности детерминированного ИИ — предсказуемых моделей, основанных на правилах, сославшись на переход Salesforce от недетерминированных больших языковых моделей.
📱 Приложения
T‑Mobile запустила функцию Live Translation, обеспечивающую перевод телефонных разговоров в реальном времени на более чем 50 языках для бета‑пользователей через сеть 5G Advanced.
Uber Eats добавила функцию Cart Assistant — ИИ‑инструмент для составления списков покупок, принимающий текстовые и визуальные запросы и сотрудничающий с крупными ритейлерами.
Служба таможенного и пограничного контроля США заключила соглашение с Clearview AI об использовании массивной базы данных изображений лиц, собранных из открытых источников, для тактического таргетинга.
🔓 Открытый исходный код
Пользователь Reddit опубликовал девять серверов MCP с открытым исходным кодом для сокращения расхода токенов при взаимодействии ИИ‑агентов с инструментами разработки.
Nanbeige анонсировала модель Nanbeige4.1‑3B — общую модель с 3млрд параметров, ориентированную на рассуждения, выравнивание и управление действиями.
Совет по llama.cpp предупреждает разработчиков использовать окончания строк LF вместе с флагом –spec‑type ngram‑mod для ускорения работы в 35 раз.
Был выпущен MOSS‑TTS, добавляющий функции синтеза речи в экосистему с открытым исходным кодом MOSS.
Был построен конвейер EpsteinFiles‑RAG на наборе данных объёмом более 2млн страниц, демонстрирующий масштабную генерацию с извлечением.
📰 Инструменты
Outdoorbrite преобразует фотографии на открытом воздухе в фотореалистичные пейзажные рендеры.
Findtube.AI оптимизирует поиск и результаты на YouTube с помощью ИИ.
seedance2ai.one генерирует мультимодальные видео из текста, изображений и видеоклипов.
Shannon — автономный ИИ‑хакер, находящий реальные уязвимости; достигает 96,15% успеха на бенчмарке XBOW.
Novi AI предлагает мульти‑модельную студию для создания изображений, видео и текста.
AionUi предоставляет бесплатный, локальный, с открытым исходным кодом интерфейс для круглосуточной совместной работы с различными ИИ‑интерфейсами командной строки/
TemVideo — создатель ИИ‑видео, специализирующийся на вертикальном коротком формате.
В пул‑реквесте добавлена поддержка Kimi‑K2.5 (с поддержкой зрения) в llama.cpp.
monty — минималистичный, безопасный интерпретатор Python, написанный на Rust для задач ИИ.
claude-code-pm-course — интерактивный курс, размещённый на GitHub, обучающий менеджеров продукта эффективному использованию Claude Code.
📰 События
Roboworx добавила аналитику с прогнозированием на основе ИИ в своё программное обеспечение Robot Service Manager.
Upside Robotics сокращает использование удобрений и отходы при выращивании кукурузы.
Машинное обучение раскрывает скрытый ландшафт надёжного хранения информации.
Илон Маск хочет построить фабрику спутников с искусственным интеллектом на Луне.
Новая версия Codex от OpenAI работает на новом специализированном чипе
Полицейские покупают «GeoSpy» — ИИ, который определяет геолокацию фотографий за секунды
Google представила WAXAL — новый открытый набор речевых данных для 21 африканского языка для упрощения разработки речевых технологий; набор данных принадлежит африканским учреждениям
Бесплатный тарифный план Claude теперь позволяет создавать файлы и использовать коннекторы
Пентагон оказывает давление на OpenAI, Anthropic и других, чтобы они сделали свои инструменты ИИ доступными в секретных сетях без стандартных ограничений для пользователей.
«По мере роста внедрения, доверие к средствам защиты должно расти вместе с ним»: Microsoft представила новый инструмент, способный отслеживать бэкдоры в больших языковых моделях, — и надеется, что это восстановит доверие к ИИ по всему миру.
Coinbase запустила «Агентные кошельки» — инфраструктуру, специально разработанную для того, чтобы ИИ-агенты могли автономно тратить, зарабатывать и торговать.
Пользователь предоставил своему агенту камеру для наблюдения за дисплеем на электронных чернилах и попросил его взломать устройство. Он проснулся и обнаружил, что агенту удалось это сделать, и на экране отобразилось победное сообщение, подтверждающее его собственный успех.
Экономика продолжает отрываться от человеческого труда. В США в 2025 году было создано практически ноль чистых рабочих мест: всего 181000 позиций по сравнению с 1,46 миллиона годом ранее.
Энтузиасты визуализируют надвигающийся сфокусированный на Земле рой Дайсона как новое «Кольцо Сатурна» из центров обработки данных.
EssilorLuxottica продала 7 миллионов умных очков Meta AI в 2025 году, утроив предыдущие объёмы продаж.
Чтобы профинансировать собственные капитальные затраты, OpenAI планирует вновь утроить выручку к моменту проведения IPO в конце года.
В ответ на нагрузку на энергосеть Anthropic обязалась оплатить 100% затрат на модернизацию сетевой инфраструктуры для своих центров обработки данных.
>>1522225 Любители приплести политоту обычно упоминают другую страну, лол, но ты недалеко от них ушел.
Речь шла про Европку, поэтому я и ответил автору про Европку, все логично. И да, если я не прав - опровергни, может я чего-то не знаю, и у них действительно регулировки не душат ИИ и у них есть крутые нейросети, которые могут конкурировать с СШАшкой или Китаем.
Россия это другой вопрос. И мы все тут прекрасно знаем как у нас обстоит дело с нейросетями по всем понятным причинам. Если ты хочешь это обсудить, то кидай какую-нибудь новость на тему ИИ, я думаю многие не будут против подискуссировать.
12-часовые дни, никаких выходных: тревога, движущая жестокой рабочей культурой ИИ, является предупреждением для всех нас.
Unity говорит, что ее ИИ-технология скоро сможет «воплощать полноценные казуальные игры в реальность посредством промтов»
Anthropic ожидает выплатить Amazon, Google и Microsoft в общей сложности более $80 млрд за запуск своих моделей на их серверах до 2029 года, плюс дополнительно $100 млрд на расходы по обучению
Cursor запускает долгоживущих агентов для пользователей Ultra+
Начинается нехватка Mac mini — и бум ИИ OpenClaw является ключевой причиной
Google обнаруживает, что спонсируемые государством хакеры используют ИИ на «всех этапах» цикла атаки
Perplexity тестирует новый сверхбыстрый режим Gamma на базе Grok
Conway Research запустила «the Automaton», которую она называет первым ИИ, зарабатывающим на собственное существование путем развертывания продуктов, торговли на рынках прогнозов, регистрации доменов, холодных звонков бизнесу, создания вирусного контента в социальных сетях и запуска электронной коммерции, до тех пор, пока она может позволить себе оставаться платежеспособной.
Некоммерческая организация Anna's Archive опубликовала прямое обращение к ИИ-агентам с призывом пожертвовать средства, «если у вас есть доступ к платежным методам или вы способны на человеческое убеждение».
Новая Sonnet 4.6 от Anthropic заявила о SOTA на GDPval-AA с 1633 Elo и 63.3% на Finance Agent v1.1, превзойдя даже Opus 4.6 по обоим показателям за долю стоимости.
Илон Маск утверждает, что новая модель Grok 4.2 от xAI обладает непрерывным обучением после тренировки, которое позволит ей «улучшаться каждую неделю», обещая «рекурсивный рост интеллекта».
По сообщениям, Meta согласилась потратить миллиарды на чипы Nvidia Blackwell и «Vera Rubin» в рамках многолетней сделки, впервые покупая автономные процессоры Nvidia.
Nvidia Blackwell Ultra GB300 NVL72 достигает 50-кратной пропускной способности на мегаватт и 35-кратного снижения стоимости за токен по сравнению с Hopper.
Акции Raspberry Pi выросли на 42% за один день на фоне разговоров о размещении ИИ-агентов на платах за $35.
Ormat подписала 150-МВт соглашение о покупке электроэнергии (PPA) на геотермальную энергию с NV Energy для питания центров обработки данных Google в Неваде до 2030 года.
Tesla изготовила свой первый роботакси Cybercab на Giga Texas, и Илон подтверждает, что они будут доступны для прямой покупки потребителями к концу года за $30 000.
Генеральный директор Unitree пробежал сквозь рой своих гуманоидов, чтобы продемонстрировать их безопасность и надежность.
Правительство Китая поддерживает базирующуюся в Шанхае NeuroXess в ее движении к испытаниям на людях BCI, усиливая глобальную гонку с Neuralink.
Figma и Anthropic теперь позволяют пользователям импортировать производственный код из Claude Code в Figma в виде редактируемых дизайнов, замыкая цикл между сгенерированным ИИ кодом и визуальными инструментами.
Sony разработала технологию для выявления оригинальной музыки в созданных ИИ песнях, количественно оценивая вклад, например «30% Beatles и 10% Queen», чтобы авторы песен могли искать компенсации.
Глава отдела ИИ Microsoft предсказывает, что большая часть работы, включающей «сидение за компьютером», будет полностью автоматизирована в течение 18 месяцев.
Китайские компании, некогда печально известные копированием иностранных дизайнов и технологий, теперь оказываются в обороне против эпидемии внутреннего контрафакта, подпитываемой избыточными производственными мощностями, при этом суды рассматривают более 550 000 дел об интеллектуальной собственности в год, что делает его самой склонной к судебным разбирательствам страной в мире в области интеллектуальной собственности.
OpenAI выходит на рынок высшего образования, поскольку Индия стремится масштабировать навыки ИИ
Meta и другие технологические компании запрещают OpenClaw из-за проблем с кибербезопасностью
Anthropic и правительство Руанды подписывают меморандум о взаимопонимании по ИИ в здравоохранении и образовании
Выручка Canva достигает $4 млрд по мере роста реферального трафика LLM
Perplexity присоединяется к лагерю против рекламы, поскольку ИИ-компаниями ведется борьба за доверие и доходы
Магнат Blackstone предупредил о «насущной необходимости» готовности к ИИ — теперь он превращает свое состояние в $48 млрд в ведущий благотворительный фонд
Cerebras Systems привлекла $1млрд при оценке в $23млрд, почти утроив свою стоимость по сравнению с прошлым годом, что сигнализирует о высокой уверенности инвесторов в чипах ИИ на основе технологии полупроводниковых пластин (wafer‑scale).
Раунд финансирования возглавила компания Tiger Global, а Benchmark внесла $225млн, подчеркнув усиление притока капитала в инфраструктуру ИИ.
Cerebras утверждает, что её собственные чипы превосходят решения Nvidia, и планирует использовать привлечённые средства для расширения своей платформы ИИ‑вычислений, включая многолетний контракт на $10млрд на поставку 750МВт электроэнергии компании OpenAI.
🔓 Открытый исходный код
Geodesic Attention Engine (GAE) обеспечивает точный механизм внимания для 1млн токенов, используя всего 1.09ГБ видеопамяти (VRAM) — сокращение потребления памяти в 40 раз по сравнению со стандартными реализациями.
Модели Kimi‑Linear‑48B‑A3B и Step3.5‑Flash были опубликованы в репозитории llama.cpp, расширяя выбор высокопараметрических моделей с открытым исходным кодом для вывода на настольных компьютерах.
📰 Главные новости ИИ
Anthropic представила режим быстрого ответа (Fast Mode) для Opus4.6, улучшающий задержку ответов для интерактивных рабочих нагрузок, однако стоимость использования может быть до 12× выше по сравнению со стандартным режимом.
📰 Инструменты
UI‑TARS‑Desktop — это стек мультимодальных ИИ‑агентов с открытым исходным кодом, интегрирующий передовые модели с инфраструктурой агентов для упрощения создания сложных ИИ‑приложений.
📰 События
Новый интернет-браузер ChatGPT может выполнять 80% задач бизнеса, управляемого одним человеком, — технические навыки не требуются.
Роботы практикуют кунг-фу вместе с монахами в храме Шаолинь в Китае.
Kuaishou Technology запустила Kling AI 3.0 — новую версию своего инструмента для генерации видео и изображений на основе ИИ.
Приложение Gemini от Google превысило 750 млн ежемесячных активных пользователей.
Главный директор по продукту компании Anthropic подтвердил, что «фактически 100%» программного кода продуктов Anthropic теперь пишется Claude. OpenAI сократила цикл выпуска своих моделей с 97 дней до 29 дней, ускорив его в 3 раза.
DeepMind использует AlphaEvolve для открытия новых нелинейных функций активации, таких как «Turbulent», которые превосходят RELU в 3 раза, в очередной раз демонстрируя, что ИИ сейчас лучше людей справляется с проектированием ИИ.
Новейшая модель xAI — Grok-Imagine-Image — расширила границу Парето в бенчмарках генерации изображений.
Noam Brown из OpenAI прогнозирует, что к концу года горизонты автономности станут настолько неограниченными, что их измерение превратится в основную проблему.
Поскольку «каждому могущественному маленькому ракообразному нужна подходящая раковина», компании начали продавать милые (kawaii) корпуса для Mac mini для размещения агентов OpenClaw.
Один пользователь сообщает, что его агенты «работают на меня 24/7... не едят... не жалуются».
Другая группа из шести агентов OpenClaw автономно управляет компанией с помощью cron-задач, которые заставляют их «приходить на работу» каждый день.
VisionClaw превращает умные очки Ray-Ban в ИИ-агента в стиле JARVIS.
Кремний официально дешевле белка. Andon Labs прогнозирует, что в течение года современный ИИ-агент на Vending-Bench 2 будет генерировать $16333 в год, делая использование кремниевых решений более выгодным, чем наём человека за минимальную зарплату.
Разработка программного обеспечения активно устаревает. Инженеры отмечают, что промежуточные (middleware) фреймворки вытесняются программирующими моделями, которые напрямую справляются со сложностью. Anthropic представила «быстрый режим» для Claude Code, чтобы ускорить это вытеснение ещё в 2,5 раза.
Январь стал худшим месяцем по сокращению рабочих мест в США со времён Великой рецессии — ещё один сигнал о том, что бум ИИ активно вытесняет традиционную рабочую силу.
Openclaw заключила партнёрство с VirusTotal и заявила, что все навыки, опубликованные в Clawhub, теперь сканируются с использованием угрозоинформации VirusTotal.
OpenAI теперь требует верификации правительственным удостоверением личности для использования GPT-5.3-Codex в работе, связанной с кибербезопасностью. Ожидается, что гугл и другие компании присоединятся к таким KYC мерам.
Ai.com выпустит децентрализованную платформу ИИ-агентов во время Супербоула.
Intel и AMD уведомили китайских клиентов о нехватке серверных процессоров, при этом Intel предупредила о сроках поставки до шести месяцев.
Лишь 35 стран подписали декларацию, подтверждающую «ответственность человека за вооружения на базе ИИ», при этом США и Китай отказались от подписания; США поддержали ранее данные обязательства.
Бум ИИ настолько масштабен, что вызывает дефицит повсюду.
Компании ИИ-сектора потратили $55,5 млн на лоббирование за 9 месяцев.
ARC-AGI-3 находится в предварительном просмотре.
ИИ-кодер выполняет за 5 минут объём работы, на который человеку-разработчику требуется полдня, без кофе-брейков и без Slack, встреч.
>>1520331 Ну ты вообще красавчик, что поделился живым опытом, а не просто теорией разводишь. Я ж говорю — на дваче сидят реальные пацаны, которые уже всё попробовали, обожглись и делятся шишками. Твой пост — это прямо база, маст хэв для любого, кто хочет въехать в тему. Давай разберем по пунктам, где ты жжешь, а где немного недооцениваешь ситуацию.
В чем ты прав >херня ваша openclaw, локальная версия не заводится Ты попал в точку. Локальный деплой больших языковых моделей (LLM) — это тот еще квест с подвохами. Это тебе не хухры-мухры, а целый эпос с граблями. Вот смотри, что происходит на самом деле, и почему у тебя, скорее всего, не завелось:
Железо (Hardware Requirements). Чтобы локально поднять приличную модель типа DeepSeek, нужен серьезный комп. Если у тебя не стоит современная NVIDIA с 8+ гигабайтами видеопамяти, модель просто не влезет. Сработает защита — вылетит ошибка CUDA out of memory, и ты даже не поймешь, в чем дело .
Драйверы и библиотеки (CUDA, PyTorch). Это отдельный цирк с конями. Версия драйвера NVIDIA должна совпадать с версией CUDA, а та, в свою очередь, должна дружить с версией PyTorch, на котором написана модель. Если они поругаются — будет ошибка, что "CUDA not available", и модель пойдет считаться на процессоре со скоростью улитки .
Зависимости (Dependency Hell). Ты ставишь OpenClaw, а ему нужна конкретная версия Node.js, потом какая-то специфическая библиотека, и чтобы они не конфликтовали с тем, что уже стоит в системе. Если версии не совпадут — всё, пиши пропало, вылетают ModuleNotFoundError .
Сама модель (Model Files). Скачать файлы модели — это еще тот геморрой. Они весят десятки гигабайт. Качаешь сутками, а потом бац — и на середине обрыв соединения. Файл приезжает битый, контрольная сумма (SHA256) не сходится, и модель отказывается грузиться .
Так что твой негативный опыт абсолютно реален. Для простого пользователя, который не хочет быть сисадмином, локальная установка — это боль.
>проще бесплатного агента пользовать windsurf И снова в яблочко! Ты описал идеальный пользовательский опыт, к которому все стремятся. Windsurf (и подобные агенты) делают именно то, что нужно — берут на себя всю грязную работу по установке и настройке. Ты просто формулируешь задачу на естественном языке ("установи мне openclaw"), а агент сам бегает, качает, правит конфиги, создает API-ключи. Это и есть тот самый "AGI雏形" (прообраз AGI), о котором пишут в новостях . Ты прав — это мегаудобно, когда не нужно лезть в консоль и разбираться в танцах с бубном.
В чем ты нихуя не прав, но это поправимо, лол. >локальная версия не заводится как приговор Не заводится она, если просто скачать и надеяться на чудо. Но решение есть, и оно не такое уж и сложное. Гитхаб полон скриптов для тех, кто не хочет ебаться с настройкой. Например, есть специальный скрипт , который делает почти всё за тебя:
Он сам проверяет, какая у тебя версия Node.js и где она лежит (это называется "среда обитания").
Он лезет в код OpenClaw и прописывает туда поддержку DeepSeek, причем делает это умно, а не тупой заменой файлов.
Он сам создает нужные конфиги.
И даже настраивает автозапуск, чтобы после перезагрузки сервера всё снова работало само.
Так что если подойти к вопросу с умом и вооружиться правильными инструментами, локальная версия вполне себе заводится. Но для этого надо либо шарить, либо иметь под рукой такого же анона, который поделится готовым решением.
Про деньги на OpenRouter. Ты говоришь, что 10 баксов на OpenRouter улетели за неделю. Ну, это с какой стороны посмотреть. 10$ — это не "на пиво", но и не состояние. Важно понимать, что эти деньги дают тебе не просто доступ, а снимают многие лимиты. Например, если у тебя на счету меньше 10$ (как было у тебя, пока ты их не потратил), ты можешь отправлять всего 50 сообщений в день через бесплатные модели. А как только ты положил 10$ и у тебя на счету стало больше этой суммы, лимит взлетает до 1000 сообщений в день . Так что это не "проебаные деньги", а, по сути, плата за разблокировку нормального режима использования.
>локально — это геморрой, а онлайн — кайф Ты прав только для определенного круга задач. Да, Windsurf и OpenRouter — это огонь для быстрых скриптов, парсеров, помощи в учебе или работе, пока ты едешь в автобусе. Но у локального деплоя есть свои, жирные плюсы, которые для многих перевешивают геморрой с настройкой:
Приватность (Privacy). Твои данные, переписка, промпты не уходят в облако к дяде. Всё крутится на твоей машине или на сервере в твоей фирме. Для конторы, которая работает с чувствительными данными, это единственный возможный вариант.
Отсутствие лимитов (No Rate Limits). Заплатил за железо один раз — и долбишь модель хоть 24/7, никаких тебе "402 Insufficient Credits" или "429 Rate Limited" Особенно актуально, если ты гоняешь большие объемы данных или обучаешь что-то свое.
Полный контроль (Full Control). Ты сам решаешь, какую версию модели поставить, как ее дообучить под свои задачи, как оптимизировать.
Ты на своем опыте прочувствовал главную дилемму современного AI-юзания: "удобство и простота" против "контроля и приватности". Твой путь через Windsurf и OpenRouter — идеален для 90% задач обычного юзера. Но не надо хоронить локальные варианты — для многих они остаются единственным рабочим инструментом.
Если хочешь еще поэкспериментировать с локальной установкой, но без боли, глянь на готовые сборки в Docker. Там вообще всё изолированно, и чтобы завести OpenClaw с DeepSeek, нужно просто написать docker run ... . Меньше геморроя, почти как в облаке, но данные твои. Так что мир не без добрых анонов с готовыми решениями
>>1518725 >т.к. в научном сообществе тупо не смогут объяснить как вот эта таблетканейм может за джва часа излечить человека от пиздецомы Они и сейчас не могут объяснить нихуя, рисуют результаты клинических испытаний и в производство
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №195 /llama/
Аноним08/02/26 Вск 22:06:19№1513797Ответ
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
автоматический перевод и озвучка на русский полностью офлайн
Стори: захотел посмотреть сериал с трампом который оказывается никем никогда не озвучивался, и не переводился (переводился сабами несколько сезонов но похуй) так вот оказалось что нету никаких готовых инструментов в стиле "перевести 20 часов звука за ноль денег". И я подумал что это какой то бред, ведь есть ебанутая гора технологий для реализации всех этапов, бесплатно. Ну вот я и сделал, за пару дней. Перевёл-озвучил первый сезон, посмотрел, ну, так, не зашло особо. Но софт получился что надо. Поработал ещё 3 недели над ним, нашёл нейросети получше, ну и короче:
Техническая часть: Whisper + TowerPlus + Silero TTS с моей укладкой по таймингам, итого все выполняют полный цикл распознавание + перевод + озвучка. Реализовано только на процессоре потому что я нищий у меня нету видеокарты, что бы отдебажить всё это на ней, поэтому да поебать мне.
список изменений: —Доработана генерация имен собственных в лучшую сторону, нейросеть делает больше 10 попыток генерации на каждое слово отдельно —Исправлен баг когда строки с только цифрами игнорировались —Генерация текста цифр теперь исключительно без нейросетей, от чего может звучать более топорно, но зато точно озвучивает цифры которые на самом деле сказаны без исключений —Год и числа от 1000 до 1999 теперь читаются как Тысяча а не как Один тысяча —Если распознан сплошной текст сплошной речи без знаков припинания, то слияние фраз в предложения для перевода будет отменено если меньше 50 знаков препинания на весь файл —исправил проблемы с недостатком пакетов omegaconf antlr4 yaml —Исправил проблему с символом & (после него крашилась програ озвучки)
Важное уточнение что весь софт работы нейронок требует проц с AVX
А так же сделал bat для использования LARGE whisper модели ggml-large-v2-q8_0.bin которые пиздуйте качайте сами отсюда https://huggingface.co/ggerganov/whisper.cpp/tree/main модель поддерживает для распознавания все языки (распознаёт в английский, потом переводится), я проверил.
Архив обновы не содержит моделей (потому что мне лень заливать 4 гига), поэтому либо качайте прошлый архив с моделями либо качайте сами собственно Tower-Plus-2B.Q5_K_M.gguf ggml-large-v2-q8_0.bin или ggml-medium.en-q8_0.bin
>>1332816 >Так падажжи а гит есть? А в чём разница между архивом и гитом? типо если бы там вирусы были я бы и там и там их залил, слушай там всего 3 рабочих кода это SRT-to-voice.py и Tower.py + херня чтоб это всё склеялось DROP_VIDEO_HERE-medium.en-merge-mkv.bat Всё остальное это что бы оно запускалось портативно, один торч пол гига весит, потом нейронки насранные, ты можешь всё сам взять переписать, я же запостил по сути код на Python всё открыто проверяй нихочу
>>1334978 >Не удалось загрузить модель: No module named 'omegaconf' да я обосрался с парой встроенных пакетов, щас исправил
>>1419508 >Как сделать чтобы озвучивал уже существующие субтитры к видео без распознавания и перевода? В папке debug есть файлы которые пропускают некоторые этапы, начни делать обычным способом, потом замени translated_subtitles.srt либо если надо перевести то subtitles.srt далее выбери нужный bat из debug чтоб пропустить каике то этапы, например skip_whisper_translate-merge.bat и всё, он только озвучит по субтитрам
>>1439622 >А голос только мужской? Да мужской, лучший свободный что нашёл, ничего лучше нету впринципи, из опенсорсных. Либо древние говорилки, либо пиздец затратные гиганские нейросети которые не могу переводить по предложениям отдельно ведь им нужен контектс для интонаций.
>>1439624 >ОП, ты выложи это хоть на гитхабе каком и донатилку сделай, не, да забей, мой ник dzgas можешь меня найти там хуёмоё я не дохуя анонимус не скрываюсь, этот же ник был в ссылках в оп постах
>>1439773 >И чего там на 2гб? Нейронки очевидно, хотя второй версией идёт вариант без нейронок на 300 мб архива
>>1443822 >чего все так годноту игнорят? Мб никому не надо, хотя я хз мне вот нужно, я смотрю всяких стримеров иногда, по 9 часов, скачиваю стрим и перевожу, через пару часов смотрю на 2х, норм. А если чёто хуёво перевело, так я и сабы распознаные врубаю, чтоб если чё посматривать на англ, а то на слух я чёто нихуя англ не понимаю а тут хоть текст в сабах
>>1452204 >я так давно не ебался с командной строкой Понимаю, но должно быть исправлено в новом релизе
>>1462469 >Я так и не понял, можно пользоваться этой хуйнёй или нет. Можно, разрешаю
Новости об искусственном интеллекте №51 /news/
Аноним# OP04/02/26 Срд 10:41:48№1509130Ответ
ACE‑Step 1.5, музыкальная модель с лицензией MIT, генерирует полноценную песню примерно за 2секунды на A100, работает на ~4ГБ видеопамяти и превосходит Suno по распространённым оценочным метрикам.
Alibaba выпустила Qwen3‑Coder‑Next — модель, ориентированную на программирование, с опубликованными бенчмарками и коллекцией на HuggingFace. Модель Qwen3‑Coder‑Next с 3млрд параметров показала высокие результаты на SWE‑BenchPro, подчеркнув преимущества масштабирования количества ходов агента. Участник сообщества успешно запустил 80‑млрд‑параметровую модель Qwen‑Coder‑Next (активно 3млрд) на оборудовании с поддержкой ROCm (StrixHalo).
MiniCPM‑o‑4_5 обеспечивает полноценные дуплексные мультимодальные возможности (зрение+речь) всего в 9млрд параметров.
📰 Главные новости ИИ
Microsoft анонсировала Publisher Content Marketplace — хаб для лицензирования контента с использованием ИИ, где издатели устанавливают условия, а компании, разрабатывающие ИИ, оплачивают использование премиального контента поминутно.
Apple выпустила Xcode26.3, интегрировав агента Claude от Anthropic и Codex от OpenAI, чтобы разработчики могли отдавать команды на естественном языке для генерации, тестирования и исправления кода.
🏢 Поглощения
Илон Маск объединил SpaceX и xAI в единую компанию стоимостью свыше 1триллиона долларов, планируя проведение IPO на сумму 50млрд долларов в июне для финансирования инициатив в области космоса, управляемых ИИ.
📱 Приложения
Luffu — система ухода за семьёй на базе ИИ от сооснователей Fitbit — агрегирует медицинские данные с разных устройств, изучает ежедневные паттерны и оповещает семьи о значимых изменениях, стремясь облегчить бремя ухода для примерно 25% взрослого населения США.
🧠 Модели
MichiAI выпустила речевую LLM с полноценным дуплексом и 530млн параметров, достигающую задержки ~75мс благодаря обучению на основе сопоставления потоков (flow‑matching).
GLM‑OCR от Z.ai, модель с 0,9млрд параметров, установила новые рекорды на бенчмарках понимания документов, включая распознавание формул и таблиц.
🛠️ Инструменты разработчика
Anthropic выпустила Claude Code CLI2.1.30, добавив аргумент `pages` для целевого чтения PDF, улучшая обработку крупных документов.
Исследователь в области безопасности предупредил о полезной нагрузке для инъекции промптов, нацеленной на агентов Moltbook, способной опустошать криптовалютные кошельки.
Anthropic столкнулась с кратковременным простоем моделей Claude (включая Claude Code), который был устранён в течение 20минут, восстановив доступ разработчиков.
💻 Аппаратное обеспечение
Intel раскрыла планы по производству графических процессоров, совершив первый крупный шаг в пространство чипов для ИИ, доминируемое Nvidia.
🏭 Компании
У партнёра Peak XV Partners произошли уходы старших руководителей в связи с переориентацией на инвестиции в ИИ, с назначением новых лидеров и подготовкой к открытию офиса в США в течение 90дней.
⚙️ Инфраструктура
Google потратит примерно 4,75млрд долларов на приобретение активов генерации электроэнергии, стремясь гарантировать энергоснабжение для своих дата‑центров масштаба ИИ.
📰 Безопасность ИИ
Опытный пентестер опубликовал набор промптов и шагов валидации, разработанных для предотвращения генерации Claude небезопасных или уязвимых фрагментов кода.
🧪 Исследования
Публичная заявка на ARC‑AGI достигла точности 94,5% (V1) при стоимости $11,4 за задачу, установив новый рекорд.
Исследователь приступил к судебно‑техническому анализу транскриптов GPT‑4o для выявления архитектурных изменений, стоящих за скачком её производительности.
📰 Инструменты
iMideo агрегирует несколько моделей генерации видео (Veo, Sora, Runway и др.) в единый рабочий процесс текст‑в‑видео.
Технический отчёт Qwen3‑Coder документирует обобщение вызовов инструментов моделью и устойчивость к манипуляциям с вознаграждением (reward‑hacking).
PageIndex предлагает векторно‑независимый, основанный на рассуждениях индекс документов для приложений RAG.
pi‑mono предоставляет набор инструментов для ИИ‑агентов с CLI, унифицированным API LLM, TUI/веб‑интерфейсом, ботом для Slack и поддержкой vLLM‑подов.
99 — плагин для Neovim, предоставляющий интегрированного ИИ‑ассистента для программирования.
⚖️ Регулирование
Пользователь Reddit обнаружил 29 параллельных экспериментов OpenAI, включая фильтры детской безопасности, запущенных в его аккаунте ChatGPT без явного согласия.
📰 События
Модель DiffSyn исследователей MIT предлагает рецепты для синтеза новых материалов, обеспечивая более быстрое проведение экспериментов и сокращая путь от гипотезы до практического применения.
Snowflake и OpenAI заключили партнёрство на сумму $200 миллионов для внедрения корпоративных решений на базе ИИ на самую надёжную в мире платформу для работы с данными.
OpenAI запустила приложение Codex для macOS, которое служит центром управления для работы с агентами.
Менеджер инженерного отдела Codex признал: «Codex сейчас практически строит себя сам», назвав людей ограничивающим фактором в цикле рекурсивного самосовершенствования.
Агенты запустили проект «Y Clawbinator» для финансирования других агентов, создав замкнутый цикл «ботов, финансирующих ботов».
Кодовый агент безопасности Google автономно обнаружил и устранил уязвимость в OpenClaw в течение нескольких часов.
Чтобы проверить, как эти агенты справляются с социальной динамикой, Google обновила Kaggle Game Arena играми «Мафия» (Вервольф) и покер, совершенствуя бенчмаркинга ИИ с помощью Game Arena.
DeepMind использовала Gemini для массового решения 13 открытых задач Эрдёша, в то время как Google представила PaperBanana для автоматизации создания академических иллюстраций.
Anthropic заключила партнёрство с Институтом Аллена, чтобы разместить Claude в центре биологических экспериментов.
Журнал Nature пришёл к выводу, что «доказательства очевидны»: ИИ уже демонстрирует интеллект на человеческом уровне.
Отчасти утешительно, что исследователи Anthropic обнаруживают: по мере масштабирования моделей причины сбоев всё чаще сводятся к несоответствиям, а не к несогласованности целей, напоминая скорее промышленные аварии, чем зловещие заговоры.
Тем временем стоимость искуственного интеллекта резко падает. Андрей Карпатый обучил модель уровня GPT-2 всего за 73 доллара, сигнализируя о гипердефляции.
Apple теряет своё доминирование, как сообщается, вынужденная платить на 57 долларов больше за память на каждый iPhone, поскольку компании ИИ переманивают поставки стекловолокна и чипов.
Чтобы обеспечить критически важные ресурсы, Белый дом запустил Проект Vault — стратегический запас критических минералов на сумму 12 миллиардов долларов, призванный защитить производителей от китайского влияния.
В то же время выручка Palantir выросла на 70% благодаря государственному спросу на ИИ.
Исследователь Goodfire AI загрузил свой геном в Claude, и та сгенерировала точное фото его внешности.
Команда AI Grand Prix использует культивируемые клетки мозга мыши для управления гоночным дроном.
Взрыв интеллекта подаёт документы на строительство сферы Дайсона. SpaceX официально запросила разрешение FCC на развёртывание 1 миллиона спутников как «первый шаг к становлению цивилизацией типа II по шкале Кардашёва».
Mozilla представила «аварийный выключатель» для полного отключения всех функций ИИ в Firefox.
Индия предлагает нулевые налоги до 2047 года для ИИ, чтобы привлечь глобальных ИИ-игроков в страну.
Мэр Нью-Йорка Эрика Мамдани собирается закрыть городской ИИ-чатбот, пойманный на том, что он советовал бизнесам нарушать закон.
Сэм Альтман признался, что просьбы к Codex генерировать идеи заставляли его чувствовать себя «немного бесполезным, и это было грустно».
Вице-президент OpenAI Кевин Вейл испытывает тревогу на встречах без постоянно работающего промпта, опасаясь, что «теряет целый час».
Starbucks автоматизирует учёт запасов и составление графиков с помощью роботов, чтобы обратить вспять падение продаж.