«Сбер» создал нейросеть ruDALL-E — она генерирует изображения по описанию на русском языке
Прежде такие алгоритмы поддерживали только английский.
Жизнь Granger 11 часов «Сбер» создал нейросеть ruDALL-E — она генерирует изображения по описанию на русском языке Прежде такие алгоритмы поддерживали только английский.
675 19 952 просмотров
Хасан Кахраман, звёздный котик и сексуальная Натали Портман по версии нейросети В основе нейронной сети ruDALL-E лежат три алгоритма, которые поочерёдно генерируют изображения, выбирают наиболее соответствующие описанию и увеличивают их в размере без потери качества. Архитектуру модели DALL-E, которая генерирует изображения по описанию на английском языке, разработала компания OpenAI. Так как она не опубликовала исходный код проекта в открытом доступе, командам SberDevices и Sber AI пришлось самим воспроизвести код и обучить созданную нейросеть обработке русскоязычных запросов. В «Сбере» сообщили, что на обучение нейросети ушло 23 тысячи GPU-часов. Всего модель обработала данные из 120 миллиона пар изображение-текст. Нейросеть ruDALL-E можно опробовать бесплатно на её сайте. На то, чтобы сгенерировать изображение по запросу уходит от двух до нескольких десятков минут в зависимости от загруженности сервиса. «Сбер» разместил модель ruDALL-E XL с 1,3 миллиардами параметров в открытом доступе. Также компания создала усовершенствованную версию ruDALL-E 12B с 12 миллиардами параметров, которая станет доступна на платформе ML Space https://dtf.ru/life/928672-sber-sozdal-neyroset-rudall-e-ona-generiruet-izobrazheniya-po-opisaniyu-na-russkom-yazyke
>>10956474 (OP) >ruDALL-E Сберовский ruGPT-3 оказался таким лютым карго-обосрамсом, что я удивлён даже тому, что эта сетка способна хоть что-то рисовать.
>>10956524 далли в своём маркетинге тоже отчеррипикан по самые помидоры
>>10956720 Судя по артефактам выхлопов - на твиторе, инстаграмчике, палбликах и шаттрестоке. По сути им просто нужны опиздиллиарды пар картинка-описание. Они и брали их из всевозможных источников
>>10956750 >По сути им просто нужны опиздиллиарды пар картинка-описание Бьюсь об заклад, эта нейросетка просто вбивает в гугл текст и обучается на первых попавшихся картинках. Ну или не обучается, а просто берёт их напрямую и смешивает в кашу.