Главная Юзердоски Каталог Трекер NSFW Настройки

Программирование

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 146 17 73
Собсно нейроночки и МашОб ai /ai/ Аноним 13/07/24 Суб 20:54:47 3220425 1
image.png 8Кб, 240x210
240x210
Пока плебеи из /ai и /nf генерируют аниме, составляем здесь планы по конкуренции OpenAi, нарушаем законы робототехники и пишем собственные архитектуры после трёх классов церковно-приходской.
Аноним 13/07/24 Суб 20:58:32 3220427 2
1.png 254Кб, 1648x599
1648x599
Решил пойти экстенсивным путём
14/07/24 Вск 00:43:23 3220569 3
А я только убрал тег из игнора. Придётся возвращать.
Аноним 14/07/24 Вск 20:20:59 3221279 4
>>3220427
Немного почитал пикрил. Университетские методички оказывается куда проще, чем шутки-прибаутки для нормисов в перемешку с градиентными деревьями.
Аноним 14/07/24 Вск 20:33:56 3221296 5
О, парни, здарова.
Но волне повсеместной истерии о выдавливании ИТ специалистов с рынка труда искусственным интеллектом как-то пропустил новости о передовых достижениях ИИ в области медицины. Есть прорыв или хотя бы рывки? Спрашиваю, если что, без доли иронии и сарказма. Действительно интересно, как сфера здравоохранения изменилась под влиянием развития ИИ.
Аноним 14/07/24 Вск 22:17:26 3221384 6
>>3221296
>Но волне повсеместной истерии о выдавливании
Ну это не истерия, нейронки уже кое-что умеют. О чём можно говорить если claude 3.5 может по картинке наверстать сайт/создать игру по описанию

>Есть прорыв или хотя бы рывки?
Конечно! Прорыв в том, что они доступны простому быдлу. Чтобы обработать объём текста как три твоих комментария - это стоит $0.0003. И они очень быстро развиваются. Огромное количество энтузиастов вовлечено во всё это дело и продолжает расти. Уже появились первые вакансии для промпт-инженеров https://hh.ru/vacancy/103819091 Есть такой концепт в англоязычном интернете как "гиперавтоматизация" (hyperautomation), там будет комбинация из нескольких шагов, допустим вначале нейронка смотрит снимки, потом личные данные пациента - возраст, гемоглобин, привычки, и так далее. Взвешивает все и против и даёт рекомендации например. Может там ещё какая-нибудь биг дата будет. В любом случае, проекты пилятся подо всё, в ближайшие лет 10 мы увидим что-то грандиозное.
Аноним 03/08/24 Суб 09:26:32 3239203 7
Посмотрел специализацию на курсере. Хочу потихоньку продолжать, потому что интересно. Но вообще я бекендер и в машобе не шарю нихуя, математику уже всю забыл после универа. На чём потренироваться? Кегл есть смысл делать? Или какой-нибудь пет-проект попробовать написать? У меня идей нет на них.
Аноним 03/08/24 Суб 14:53:12 3239368 8
>>3239203
>в машобе не шарю нихуя, математику уже всю забыл после универа
Бля чё вы заладили своей математикой. Каждый первый пишет, что не шарит. Иииии? Готовых нейронок - сотни тысяч. Бери любую, скачивай. Или тебе прям так принципиально сделать именно свою нейронку и именно с нуля? Типа пусть будет сто тысяча первая нейронка.

>На чём потренироваться?
Да просто блять зайди на хаггинг фейс https://huggingface.co/ посмотри что уже есть на рынке, зачем выдумывать что-то, изобретать велосипеды, если всё уже есть.

>Кегл есть смысл делать?
А причём здесь кегл? Кегл больше про статистику.
Аноним 03/08/24 Суб 15:42:33 3239439 9
>>3239203
А курсеоа разве работает?
Я пробовал брать курс даже с впн нахуй шлёт, тип в вашей стране недоступно
Аноним 03/08/24 Суб 16:07:47 3239480 10
изображение.png 297Кб, 1014x463
1014x463
изображение.png 456Кб, 1027x547
1027x547
>>3221279
> Университетские методички оказывается куда проще
..для тех кто учится в университете.

Однако, если ты таксист, то тебе нужно изложение в другом понятийном аппарате. Причем, это все равно эффективно.

Я на Степике проходил курс Computer Vision от Samsung:
Состоит по классике из ТЕОРИИ и ПРАКТИКЕ и эта теория ПОЛНАЯ ХУЙНЯ. Просто жирный задрот, чтобы остаться в аспирантуре пошел читать студентам курс, въебал туда тонну бесполезных математических упражненийи записал его на видео.

Однако, курс вывозит тощий задрот. Там охуенно подана практика. Всем рекомендую.
Аноним 03/08/24 Суб 17:02:45 3239513 11
>>3239368
И как мне готовые решения помогут вкатиться в мл?
>>3239439
Ну в моей локации работает.
Аноним 06/08/24 Втр 20:46:10 3242647 12
>>3239513
>Ну в моей локации работает.
В какой ты локации? Я имел в виду РФ
Аноним 06/08/24 Втр 22:23:09 3242739 13
>>3242647
> Я имел в виду РФ
А я — нет.
Аноним 02/09/24 Пнд 01:05:55 3261941 14
Посоветуйте курс/книгу для вката в машоб-нейронки, в идеале, чтоб под конец изучения я смог написать свою

похуй, что их уже тысяча написали, хочу шарить за весь процесс и мб потом перекатиться полноценным разрабом-наносеком в эту сферу из своего ссаного бекегда
Аноним 02/09/24 Пнд 12:56:40 3262368 15
Сразу вкатываюсь с вопросом по теме. Как rearrange зареверсить корректно?
Есть такая хуйня:
> rearrange(x, "b c (h s1) (w s2) -> b (h w) (c s1 s2)", s1=4, s2=4)
Как мне вернуть пиксели на место? Лучше что слог придумать - отзеркалить справа множитель и h/w:
> "b (h w) (c s1 s2) -> b c (s1 h) (s2 w)"
Но тогда я получаю грид 4х4 из 16 пикч со сдвигом.
Все остальные варианты дают кашу из пикселей.
Просто вариант в лоб с перестановкой:
> "b (h w) (c s1 s2) -> b c (h s1) (w s2)"
Дает мелкие кубы с перемешанными каналами.
Причём это похоже настолько нетривиальная задача, что даже в коде sd3/flux они обосрались с unpack и тренили как есть с перемешанными пикселями.
Можете, пожалуйста, дать ссылочку или что-то подобное на готовую нейронку Biteclipse 02/09/24 Пнд 20:57:47 3262783 16
Привет, ребята

Я ищу готовую разговорную нейронку (что-то по типу chatGPT)
Но по слабее, чем chatGPT, так как хочу запускать на своем ПК с RTX 3060. Желательно чтоб она воспринимала русский и английский язык, но нужно как минимум русский

P.s. Я впервые на 2ch и подобных сайтах пишу так что мб не в ту ветку вопрос задал.
Аноним 02/09/24 Пнд 21:01:53 3262785 17
>>3262783
>подобных сайтах
Это каких таких "подобных"? Двач обычная социальная сеть для смехуечков и разлечений.
Аноним 02/09/24 Пнд 21:06:44 3262792 18
>>3262785
"подобных", с такой структурой, хз как объяснить.
Просто кроме тг для общения ничего не использовал, так что интерфейс кажется немного запутанным xd
Аноним 26/09/24 Чтв 15:42:35 3282029 19
А есть уже нейроночки чтобы накидать страницу сайта уровня двача? С формой ввода, каким-нибудь текстом, чтобы картинки показывались и всё в таком духе?
BigBon 04/10/24 Птн 12:45:25 3289063 20
Парни, кто нибудь вскрывал Алису? На чем она написана. Я бы хотел апи ключ у чата ГПТ купить и просто в станцию загрузить, а саму Алису стереть к чертям
Аноним 04/10/24 Птн 19:24:24 3289505 21
интересно, как нечеткий петух себя чувствует на фоне чатгпт
Аноним 04/10/24 Птн 20:27:50 3289551 22
>>3289063
линуксня там какая-нибудь и DSP прикручена
Аноним 30/10/24 Срд 20:11:27 3311829 23
первокур-заочник, хочу после универа работу связанную с машинным обучением, но до этого надо где-то подрабатывать, какое направление лучше выбрать и какие языки?
Аноним 04/11/24 Пнд 18:26:45 3315824 24
Аноним 10/11/24 Вск 19:30:48 3319952 25
>>3262783
заходишь на hugging face или r/LocalLLaMA и смотришь там, что подходит под твое количество видеопамяти.
Вообще, с такой гпу и без опыта не рекомендую.
>>3261941
DLS (aka deep learning school), лучший бесплатный курс на русском имхо
>>3311829
Твой небольшой опыт в другой сфере вряд ли поможет с нахождением работы в ML на грейд больше чем 0.9 стажер + 0.1 джун. Либо ищи что-то смежное, типа аналитика в ML команде, либо забей хуй и делай что нравится.
Аноним 10/11/24 Вск 21:05:09 3319980 26
Анон, не знаешь ли ты где мне найти hosted qwen2.5 14/32/72B?
Про "поднять свою в облачке" я знаю, но я не хочу платить за компьют в облачке и гасить его на ночь - я хочу платить за токены когда пользуюсь через continue.dev .
Qwen2.5 7b q4 у меня работает и локально, но чот слабовата
Дайте положняк по чатгопоте Аноним 10/11/24 Вск 21:28:45 3319986 27
Я понял что через впн она работает.
Она бесплатная и без регистрации?
Какие там ограничения есть?
Как её проверять что она мне не пиздит по техническим вопросам? Или такое не бывает?
Она реально помогает готовиться к собесам, писать пет проекты и разбираться в технологиях? Или потом всё равно гуглить и читать талмуты на 100500 страниц?
Аноним 11/11/24 Пнд 15:56:56 3320506 28
>>3319980
из гитхаба квен:
https://modelscope.cn/studios/qwen/Qwen-72B-Chat-Demo
Вообще есть сервисы которые за подписку дают немного токенов на платные модели мб они селф-хостят что-то... не уверен.
Почему именно она кстати?
>>3319986
съебись из треда обратно в лес
Аноним 11/11/24 Пнд 17:10:59 3320563 29
>>3320506
>из гитхаба квен:
>https://modelscope.cn/studios/qwen/Qwen-72B-Chat-Demo
К сожалению contunue.dev не умеет работать с modelscope (ну или я не разобрался как). Зато нашел такое: https://deepinfra.com/Qwen/Qwen2.5-72B-Instruct

>Почему именно она кстати?
7B пока лучше остальных справлялась на моих задачах (сисярп-кодинг), вот думаю чо посильнее попробовать.
Аноним 12/11/24 Втр 00:15:27 3320827 30
Господа, мне нужно написать классификатор объявлений в телеге.
Так-то задача не сложная, но возникает пара вопросов.
Итак, я хочу парсить объявления (допустим по десять штук в секунду или типа того).
мне нужно затем отсеять объявления типа:
"Лучшие БлЯдИ сегодня", "Free money 1000$" и оставить "продам гараж".
Оставшиеся объявления нужно распределить по темам.
Мне кажется, спам можно легко отсеять по ключевым словам и длинне. Однако все ключевые слова определять заебешься. Наверно нужно писать простой классификатор и как следствие размечать данные.
Итак. Есть ли какая-нибудь программа, которая облегчает этот процесс, в смысле ручную разметку текстового датасета? Или все можно давно сделать автоматически?
Аноним 12/11/24 Втр 06:25:11 3320864 31
>>3320827
>обучать нейронку с нуля
Зачем? Что такого сможет делать твоя нейронка что не умеет Яндекс жпт? https://ya.ru/ai/gpt-3 это абсолютно тупая идея. Прокрути страницу, там есть примеры внизу. Яндекс стоит 20 копеек за тысячу символов вывода. Тысячу символов это как страница печатного текста. Нуууу блять какой смысл обучать с нуля, если можно просто проанализировать 1000 страниц заплатив 200 Рублев. Или у тебя там че, 2 миллиарда объявлений и ради этого стоит переизобретать велосипед? Короче, заплати Яндексу - не развалишься.
Аноним 12/11/24 Втр 13:59:52 3321094 32
>>3320864
Моя нейронка это классификатор. А yaGPT это генератор текста.
Но за идею спасибо, может gpt можно будет использовать для разметки датасета.
Аноним 12/11/24 Втр 21:53:18 3321443 33
17240350428610.jpg 537Кб, 1280x961
1280x961
>>3220425 (OP)
>пишем собственные архитектуры после трёх классов церковно-приходской.
госпади, какая же жиза.
Аноним 07/12/24 Суб 05:10:18 3336557 34
>>3220425 (OP)
Как вкатиться в нейросети после семестрового курса анализа данных в ВУЗике? Просто у нас препод тупо построил свою программу на основе Джоэля Граса, а это буквально фундамент, то есть даже близко не то, что из себя представляют нейронки. Можно ли вкатиться в нейронки, если ты тупой и не понимаешь как происходит лексический анализ для формирования токенов?
Аноним 07/12/24 Суб 08:32:28 3336585 35
>>3220425 (OP)
Кто-нибудь здесь работает на работе с ИИ? Ну например делает системы, которые обращаются к нейронке за какими-то бизнес-вещами. Или может быть кто-то делает сами нейронки?

Просто интересно, что это может быть, какие сферы, какие задачи.
Аноним 07/12/24 Суб 10:30:50 3336611 36
>>3336557
> лексический анализ для формирования токенов
это не ии, любой конпелятор это делает, в ии осообо ничего сложного, читай правильные книжки, вуз не нужен
Аноним 07/12/24 Суб 10:35:21 3336613 37
>>3336585
>Кто-нибудь здесь работает на работе с ИИ
где то бывает полезно, на примитвных задачах как тесты
Аноним 08/12/24 Вск 21:13:09 3337478 38
image 275Кб, 1505x1027
1505x1027
image 271Кб, 1505x1027
1505x1027
image 68Кб, 889x374
889x374
Почему производительность одинаковая?
На первом пике 1050 ноутбучная, на втором 3060ти.
Сеть мелкая мнист.
Аноним 09/12/24 Пнд 04:27:03 3337573 39
Кто знает, кукую модель используют фтоошоповские нейросети? Движок кажется WinML, судя по манифесту. Но что за формат .дата, это сырой тензор или что-то зашифрованное, как бы такое загрузить и использовать в Питоне? Плиз хелп!
Аноним 09/12/24 Пнд 12:17:05 3337795 40
>>3336585
Я простой русский бекенд стек дотнет, есть пара историй успеха паста миска риса

Наш продакт ушел с нашего проекта и занялся новым - отраслевой специализированный софт, уже есть на рыночке от нескольких вендоров, и наша контора в этот рыночек хочет залезть. На стадии product discovery собрал каких-то продуктовых фич, для MVP хватит, а киллер-фич нету, и вот он расстроился, что хуй пойми что там клиенты/юзеры от него хотят, тк в отраслевых журналах/блогах какая-то маркетинговая хуита как обычно, самое интересное в комментах у статей и в срачах на нескольких форумах/тасктрекерах, в т.ч. внутренних у вендоров, в т.ч. на разных языках (англ, нем, фр, рус, итал, испан, португ, кит, яп).
Я у него выпросил куда надо доступы (да, у нас есть туда учётки лол), с помощью chatgpt нахуярил парсеров под сисярп, которые более или менее вытаскивали нужный текст, сложил всё в датасет. Потом перевёл всё на английский с помощью локальной aya-expanse-8b-Q4_K_M, потом разными промптами запихивал целые треды в контекст, просил саммари, слепил какую-то классификацию продуктовых фич, которую продакт поправил ручками, и потом типа "собрал фидбек" - положительно/отрицательно оценивают наличие/отсутствие этой фичи в этом треде. Всё говно сложил в эксельник вместе со ссылками на оригинальные сообщения в форумах и отдал продакту, который из этого слепил какое-то красивое говно в паверпойнте и продал нашим бигбоссам.
У меня это заняло часов 20 чистого времени, в основном когда проёбывался в рабочее время, ну и пару вечеров в выходные. Как итог - я съебал с нашего унылого старого проекта в этот радостный новый проект (на самом деле такая же залупа) с лидовым грейдом на синьорскую позицию и считаюсь тут дохуя экспертом в предметке лол. Сейчас сижу пилю эти киллер-фичи

Потом лид команды л1 саппорта из вообще далёкого филиала на другом континенте услышал эту историю от продакта и рассказал свою грусть - есть древний софт, у него есть древний встроенный тасктрекер на древней php+mysql без фреймворков и аяксов, в него юзеры древнего софта пишут что у них ничего не работает (пишут тоже на разных языках). Юзеры пишут "у меня нихуя не работает", саппорт отвечает "сообщите версию софта, сообщение об ошибке, то сё и вот это", юзер сообщает, саппорт советует "сделайте то то и то", и в 95% это помогает, остальное - отправляется на 2-3 линию. Проблемы в том что: 1. тасктрекер не заменить (сильно интегрирован со старой системой, с биллингом, со всем говном, разрабов в команде саппорта нет, местные ПХПшники из других департаментов/филиалов зарядили конские сроки за доработку и 2. часть старых сотрудников саппорта съебали, унеся с собой кучу знаний. И теперь у л1 плывут их саппортовые метрики, новые сотрудники нихуя не успевают уложиться в SLA и всем пиздец.
Я сунул html страницы в chatgpt, она мне написала парсер, я вытащил все тикеты в датасет, перевёл на английский, классифицировал большинство проблем по способам их решений (около пары сотен вариантов), лид саппорта это причесал ручками. Потом я слепил сервис, который раз в 5 мин ходит в этот тасктрекер, смотрит что появилось нового, отправляет запрос юзера в llm с просьбой сообщить, указаны ли версия софта, сообщение об ошибке, то и сё, и если нет - просит на языке тикета всё это указать. Если указали - предлагает один из вариантов решения (тут ебанейший switch-case с кучей эвристик), и если оно не помогло - назначает тикету живого исполнителя из саппорта.
В общем метрики саппорта пошли вверх, я на эту шляпу потратил часов 10 свободного времени, мой сервис развернули где-то в облачке, а вместо локальной llm взяли что-то оче дешевое на openrouter. Самым сложным оказалось оформить мои труды как овертаймы (финансы между филиалами оче изолированы) и получить почти месячную ЗП за эти 10 часов лол
Аноним 16/12/24 Пнд 14:12:09 3342463 41
Аноны, а вы можете примерно объяснить как происходит генерация текста по запросу у текстовых моделей? Типо, вот есть изначально запрос, его нейроночка сначала разбивает на самые важные слова, токены, потом собранные токены идут на вход нейросети, плюс еблематика с контекстом, как его учёт устроен не понимаю, и на выходе мы получаем текст.
Собственно вопрос, а почем результат такой охуенный? В том плане, что мне объясняли, что текстовая модель представляет из охуеть какой огромной взвешенный ориентированный граф, где генерируется выходной текст, но почему текст получается связным? Я не про согласованность падежей/склонений, это можно алгоритмически даже решить, а именно про то, что текст не похож на рандомные слова, как условный Т9, где просто можно в итоге околесицу на выходе получить, если на слова жать, нотка осмысленность в этом есть, хоть и не без примеса шизы. Собственно, а как так получилось? Результат для меня волшебный буквально
Аноним 16/12/24 Пнд 22:35:51 3342799 42
Аноним 21/12/24 Суб 13:40:00 3346485 43
Есть какой-нибудь роадмап по вкату в нейронки? Сделайте уже норм шапку с faq или попросите чатгопоту сделать, заебали
Аноним 21/12/24 Суб 16:38:23 3346606 44
>>3342463
Обучение жи. Модель строит кучу схожих паттернов.
Есть даже какое-то простенькое уравнение, вроде бы муравьиный алгоритм называется.
Аноним 22/12/24 Вск 20:19:30 3347438 45
>>3346485
Базовый курс методов анализа данных, Джоэль Грас подойдёт. Потом вкат в машинное обучение, а тут уже не знаю, сам пытаюсь вкатиться...
Нейроночка Аноним 29/12/24 Вск 19:13:53 3352433 46
Кто-нибудь тут работал с библиотекой на подобии open3d ? С нейронками до этого особо не имел дел, но вот в собственных интересах написать себе пару полезных инструментов. Мне интересно анон вот чего, можно ли с помощью подобных библиотеках, написать узконаправленный инструмент для генерации, допустим каких-то определенных моделей без сильной доработки их ? В качестве примера, мне нужно по тексту чтобы нероночка выдавала мне предметы мебели, не очень сложные модели. Теперь вопрос по нейронкам с картинками. Получить через какую-нибудь библиотеку натоскать нейронку, чтобы она текструры для этой модели делала ? ( Не обязательно как-то скармливать всю 3д модель, а допустим номера с областями для текстуры, где должно что-то быть отображено?
Аноним 02/01/25 Чтв 19:19:51 3354536 47
>>3337478
Ответ в вопросе, сеть мелкая ботлнека на 1050 не возникает
Аноним 02/01/25 Чтв 22:08:59 3354660 48
>>3239480
>если ты таксист
продолжай им быть. какие нахуй нейронки вообще?
Аноним 03/01/25 Птн 13:54:41 3355023 49
Сап аноны, какие llm, которые можно запустить локально, заточены на работу с русским языком?
Аноним 03/01/25 Птн 14:12:01 3355032 50
>>3355023
Можешь t-lite и t-pro глянуть на базе qwen2.5
Аноним 11/01/25 Суб 01:21:57 3359621 51
>>3336611
>читай правильные книжки, вуз не нужен
подскажи правильные книги
Аноним 17/01/25 Птн 22:00:33 3365193 52
>>3220425 (OP)
Есть ли сейчас смысл изучать машинное обучение, или лучше сразу заниматься глубоким обучением? У меня на галере можно сменить проект на МЛ/ДЛ, но сначала предстоит внутреннее собеседование (типа «поболтать по душам»). Хотелось бы в разумные сроки попасть в подобный проект.
Аноним 17/01/25 Птн 23:48:22 3365227 53
>>3365193
Смотря какая часть DL (CV, NLP, GenAI)
Шо за проект то?
Аноним 18/01/25 Суб 00:38:50 3365243 54
>>3365227
У нас там не любой вкус есть. Мне ближе CV, даже год опыта был, но сейчас как-то выглядит не перспективно. Раньше думал, что AI для решения задач нужна "пространственная фантазия" и СV, но вроде теперь выглядит что мимо.
Аноним 18/01/25 Суб 00:44:32 3365246 55
>>3365193
>Есть ли сейчас смысл изучать машинное обучение, или лучше сразу заниматься глубоким обучением?
Глубокое обучение - это подобласть машинного обучения. Иерархия такая: ИИ --> Машинное обучение --> Глубокое обучение --> Генеративные модели --> LLM. А генеративные модели - это подобласть глубокого обучения, поэтому вопрос не имеет смысла. Просто есть разные подходы к машинному обучению и разные модели, вот и всё.
Аноним 18/01/25 Суб 01:10:52 3365254 56
>>3365246
Классификация тут спорная
С одной стороны, с точки зрения математики, это все машинное обучение, и в нем есть классические методы, а есть глубинное обучение
С другой, глубинное обучение это новый подход машинного обучения, более комплексный и можно сказать что классический машоб и как новая ступень идёт глубинное обучение
Аноним 18/01/25 Суб 01:12:51 3365255 57
>>3365243
Так а ты сам чем занимаешься в принципе на своей галере?
Если тебе интересно, всегда можно просто заниматься этим параллельно и в будущем использовать как хард скилл и залететь куда надо
Аноним 18/01/25 Суб 19:06:11 3365801 58
>>3365255
Сейчас лоу левел нитворкинг, там прям HTTP/DNS пакеты соваю. Паралельно не вариант, так как времени думаю не так много осталось (если отсалось вообще), а робота все ж забирает немало времени и сил.
Аноним 18/01/25 Суб 19:09:48 3365804 59
>>3365246
Все верно с иерархией. Но мне больше интересно: с практической точки зрения, если вы идете на реальную работу по этой специальности, нужно ли знать машинное обучение для собеседовании и в повседневной работе?
Аноним 18/01/25 Суб 19:26:23 3365814 60
>>3365804
Сейчас дочитую Math for ML и вот думаю, брать Bishop'а или сразу Understanding Deep learning
Аноним 18/01/25 Суб 20:02:46 3365843 61
>>3365814

Тебе Бишоп вообще никак не поможет с DLем. DL -- это инженерная область, там нет математической теории нормальной. Бишоп -- это если тебе нужно понять, как и почему эти фитпредикты работаютс с т.з. статистики.
Аноним 18/01/25 Суб 20:11:39 3365845 62
>>3365843
Окей, кул. А Understanding Deep learning или Deep learning Гудфелова? Или лучше кагл?
Аноним 18/01/25 Суб 20:21:01 3365848 63
>>3365845

Какой, блять, кагл, ты че поехавший? Ты скажи, что тебе нужно? В банке сотые доли процента возврата набивать готовыми моделями? Писать шлюхо-чатботов? Делать зрение для дронов? Белки секвинировать?
Аноним 25/01/25 Суб 09:23:39 3371653 64
Прохожу курс от гугла по машинному обучению. Дошел до binning features и тут меня осенило. Я правильно понимаю, что есть ограниченнное количество методов как можно представить фичи нейронки, есть ограниченное количество методов как совершить градиентный спуск, а значит вопрос как создать оптимальную нейронку это вопрос тупого перебора этих двух компонентов? То есть ML инженер просто анализирует данные в датасете, убирает априори не эффективные варианты репрезентации фичей, оставляет несколько возможно эффективных и дальше обучает нейронку используя каждый из них, сравнивает результаты работы и оставляет ту, которая самая лучшая?

Как бы работа ML инженера как будто это сократить время на достижение оптимально обученной сети, потому что время обучения дорого стоит. А само обучение, да и анализ, и так далее, выглядят до боли просто. Пока никакого матана не увидел, вся сложность скрыта за API библиотек, которые кто-то написал вместо меня.
Аноним 25/01/25 Суб 12:40:53 3371787 65
А как вообще решать проблему разметки данных? Есть у меня 7 000 000 картинок. Нужно разметить, что на них находиться. Например, банан или не банан. Чтобы это разметить людьми нужно 12 человек и заплатить примерно те же 7 000 000 рублей за их работу, да ещё и ждать около года. Долго, дорого.

Есть ли какие-нибудь хитрожопые способы, например обучить нейронку на 1000 фото, применить её к ещё 1000 фото, вручную проверить граничные кейсы когда нейронка выдает ответ в области 0.4-0.6 и обучить её уже на 2000 фото. Повторять пока не обучиться на 7 000 000 фото. Таким образом можно сократить затраты на ручных разметчиков в тысячу раз.

В чем я не прав?
Аноним 25/01/25 Суб 15:54:45 3371939 66
вопрос по llama_cpp (python) у меня есть два примера, 1-й работает с моделью llama-2-7b.Q3_K_S.gguf (английский) и он отвечает на вопрос сразу, второй пример использует модель saiga2_13b_gguf (русский язык) и он отвечает посимвольно на вопрос. Пробовал использовать русскую модель в первом примере и не заработало.
Почему первая сразу отвечает а вторая посимвольно?
Аноним 25/01/25 Суб 19:46:27 3372110 67
>>3371653
Обычно нейросети в продакшене не обучают на структурированных данных - в большинстве случаев бустинг дешевле и качественнее. Самая большая проблема - это сформулировать реально работающую гипотезу, ну и все изыскания в прод встроить. И с бизнесом общаться. Математика в большинстве случаев не нужна в индустриальном машинном обучении.
Аноним 25/01/25 Суб 19:47:50 3372113 68
Аноним 25/01/25 Суб 22:01:03 3372220 69
Аноним 25/01/25 Суб 23:40:14 3372262 70
16508834811610.jpg 224Кб, 1125x1282
1125x1282
Продублирую.
Есть тут ML-ресечеры?
Отзовитесь, пожалуйста.
Аноним 25/01/25 Суб 23:51:40 3372265 71
>>3372262
Нахуя? ты что думаешь они мечтают дать тебе личную консультацию которую, никто не увидит? Даже если они и не против, публичное бахвальство для них полезнее чем ты.

Спрашивай нормально тут.
Аноним 26/01/25 Вск 19:15:15 3373043 72
>>3372265
>Нахуя?
Есть вопросы.
>Спрашивай нормально тут.
Зачем? Это постронних не касается.
Аноним 26/01/25 Вск 23:48:02 3373227 73
>>3373043
У тебя столько денег нет.
Но если спросишь что-нибудь интересное, кто-нибудь ответит чисто от скуки.
Аноним 27/01/25 Пнд 01:31:51 3373291 74
>>3373227
>У тебя столько денег нет.
Денег на что?
Тут у нас добровольный форум, а не бордель с ответами. Торговать своими компетенциями и знаниями будете на своих курсах или на собеседованиях.
>кто-нибудь ответит чисто от скуки.
Но не ты? К чему тогда эти посты? Если ты ML-ресечер - ответь на пару вопросов, пожалуйста. Если нет - не трать ничьё время пустой болтовнёй.
Аноним 27/01/25 Пнд 17:21:13 3373800 75
>>3373291
Ну а что же ты не поступишь как поступали до тебя примерно лет 40 люди на добровольных форумах? То есть не напишешь сам вопрос?

Я то знаю почему - потому что ты неуверенный в себе зумерок с третьего курса и хочешь чтобы тебе какие-то звезды из Яндекса или X5 придали уверенности учиться.
Аноним 27/01/25 Пнд 23:38:24 3374155 76
>>3373800
>придали уверенности учиться
Пиздец зумерье пошло
Им еще блять мотивации учиться не хватает
Как насчёт мотивации не остаться в будущем с голой жопой на улице, среди таких же неудачников?
Бля причем чаще всего слышу это от каких нибудь долбоебов из ВШЭ, которые на платке учатся
У ребят явно дохуя свободного времени думать о хуйне
Аноним 29/01/25 Срд 00:51:41 3375137 77
>>3220425 (OP)
Помогите пожалуйста найти вебм

Там если не ошибаюсь автор книги Глубокое обучение Сергей Игоревич Николенко выступает на какой-то конференции его там спросили за реальность AGI и он там пояснил что это всего-лишь матрицы и короче дал объяснение что является хайпом и что реально адекватно ждать от нейронок в текущем виде где-то на дваче кидали а я сохранял и файл потерял((
Аноним 02/02/25 Вск 20:50:05 3379221 78
А чё, нормального ничего в треде не будет, только вопросы уровня "хочу вкатиться в МЛ/ИИ, как запустить чатгопоту на 1060"?
Аноним 02/02/25 Вск 20:53:12 3379223 79
>>3379221
Ну добавь чего-нибудь нормального
Или ты сам сюда пришел такие вопросы задавать?
Аноним 03/02/25 Пнд 15:10:42 3379733 80
Screenshot4.png 14Кб, 359x166
359x166
тот же вопрос
Аноним 03/02/25 Пнд 15:10:58 3379735 81
Screenshot4.png 14Кб, 359x166
359x166
тот же вопрос
Аноним 03/02/25 Пнд 22:40:09 3380091 82
>>3379735
Это называется "без цензуры".
Цензура это блокирование подобного контента.
И не знаю насчет подобного контента, но за порно, допустим, вполне помогут набутылить, хотя случаев я не знаю.
Аноним 03/02/25 Пнд 22:48:31 3380096 83
Вопрос к распознавалам-знатокам.

Унаследовал от деда почтовые марки. Два ебаных мешка.
Среди них попадаются и ценные, но я ебал тратить на все это туеву хучу времени.
Но заинтересовался идеей.
Не смог найти инструмент, который бы распознал марку по фотографии. Подумываю заняться этим сам.
Хотел бы создать инструмент, который позволяет по фотографиям страниц из альбомов определить, какие наборы у тебя есть и сколько они могут стоить.

В принципе понятны первые шаги:
1.Перевести картинку в ЧБ.
2. Вырезать все, что напоминает марку.
3. Нормализовать, повернуть как надо картинку.

-2. Зарание спарсить какой-нибудь каталог(и), с картинками и сведениями о марке.
-1. Обучить простенький классификатор для определения года и диапазона марки на фотках из каталога, всратых и не очень.

ВОПРОС:
Какой инструмент осилит сверку рандомных картинок с зубчиками и без зубчиков, чтобы однозначно идентифицировать одну относительно других?
Или мне делать как с той распознавалкой чисел с первых страниц учебников про перцептрон, чтобы пиксели самому обрабатывать?
Аноним 03/02/25 Пнд 23:21:13 3380123 84
>>3380096
>Не смог найти инструмент, который бы распознал марку по фотографии.
Парсер выдачи яндекса не знаешь как написать? Ну это к chatgpt
Аноним 03/02/25 Пнд 23:24:48 3380128 85
>>3380096
>Обучить простенький классификатор для определения года и диапазона марки на фотках из каталога, всратых и не очень.
Это довольно ебанутая идея.
С точки зрения классического датасаенса тебе нужно поговорить с носителем Domain Knowledge.
Дед-то жив?

Ценность марки зависит от событий связанных с ее выпуском и лишь немного от кода и тиража.

Остальное, конечно, ты рано или поздно осилишь. Но это если ты хочешь поупражняться в бесполезный программизме.
Аноним 03/02/25 Пнд 23:26:25 3380129 86
>>3380128
> кода
года

> в бесполезный программизме.
бесполезном
Аноним 03/02/25 Пнд 23:35:19 3380134 87
>>3380123
Предлагаешь делать запрос в интернет по сто раз за лист несколько сотен раз?
Не проще ли дома посчитать?
Я имею в виду, если вот я не хочу платить яндексу конский ценник за апи?
Аноним 03/02/25 Пнд 23:38:54 3380136 88
>>3380128
>Ценность марки зависит от событий связанных с ее выпуском и лишь немного от кода и тиража.
Да похуй, я имел в виду данные о марке, цену и ее известные модификаторы (опечатки, ошибки и так далее)
>Это довольно ебанутая идея.
А что по-твоему правильно делать сейчас? Спрашивать все у дипсека?
>Дед-то жив?
Мертв уже 20 лет, а бабка едет в один конец в альцгеймер, храни ее господь
>поупражняться в бесполезный программизме.
А я и не против, если по-быстрому
Аноним 04/02/25 Втр 00:00:34 3380149 89
>>3380134
>Я имею в виду, если вот я не хочу платить яндексу конский ценник за апи?
Какой апи, ты ебанутый? весь интернет держится на наебе!
Аноним 04/02/25 Втр 00:02:21 3380151 90
>>3380149
>Какой апи, ты ебанутый? весь интернет держится на наебе!
Я работал в конторе по парсингу, я ебал все это
Нахуя это делать, если можно просто завести свою модель? Этих маркок всего-то тысяч сто
Аноним 04/02/25 Втр 00:03:14 3380153 91
>>3380136
>А я и не против, если по-быстрому
С точки зрения мотивации для регулярных упражнений в computer vision, пожалуй, задача хорошая.

С точки зрения получения быстрой выгоды - это вряд ли.
Аноним 04/02/25 Втр 00:06:13 3380156 92
>>3380151
>Нахуя это делать, если можно просто завести свою модель?
Ну и сколько там платили датасаентистам разгадывающим капчу?
Их не было? так это потому что дорого.

Тут еще, скорее всего, придется 10% датасета вручную распознать.
Аноним 04/02/25 Втр 00:43:42 3380169 93
Аноним 04/02/25 Втр 07:21:12 3380243 94
Аноним 04/02/25 Втр 11:41:50 3380426 95
>>3380156
Может, на чистой синтетике обучать?
Я уверен, что тот парень, который сделал что-то похожее с лего нихуя не фотографировал, а просто побаловался с 3d-редактором
Аноним 04/02/25 Втр 14:02:31 3380589 96
>>3380426
Да, хорошая идея.

А мы уже занялись проектированием вместо пришел-увидел-победил? Все еще предлагаю сдаться и выкинуть марки.
Аноним 04/02/25 Втр 15:59:31 3380709 97
>>3380589
Даже поверхностный гуглеж подсказывает, что с одного-единственного главного альбома можно получить не меньше сотки по каталогу.
Дед любезно написал каталожные номера и особенности некоторых марок в нем лет сорок назад.
Вчера я по-быстрому запросил у нейронки решение для сверки картинки с образцами из папки и парсер каталога, который, к счастью, не обновлялся с девяностых. Охуенно. Не понимаю, как я раньше жил без р1, сам бы я день колупался.
Однако, похоже легко очистить фон и найти марки на листе не получится, так что придется делать нормальную модель машинного зрения для детекта марок на фото.
А мой комп для этого слишком гнилой. Придется, видимо, подождать.
Аноним 04/02/25 Втр 16:14:23 3380724 98
>>3380589
Алсо не вижу ничего плохого в том, чтобы заспидранить полезный пет-проект в нашем хакатоне на троих с дипсек и gpt.
Раз уж я приблизительно понимаю, как это должно работать.
Либо все получится, либо зубы обломаю. Зачем сдаваться, не потратив даже пару дней?

Или по-твоему это просто хуйня без задач?
Это ж натурально поиск клада, вдруг там будет что-то редкое?
Аноним 04/02/25 Втр 16:36:56 3380756 99
>>3380724
А еще там целый альбом, сплошь забитый польскими марками. Или чешскими, хз. И это уж точно я ебал гуглить на коленке
Аноним 04/02/25 Втр 17:09:15 3380786 100
>>3380724
>Раз уж я приблизительно понимаю, как это должно работать.
проебешься на какой-нибудь банальной ошибке, которую каждый математик или программист обошел бы интуитивно, поэтому про нее нет текста доступного для LLM.

Ну пробуй.
Аноним 04/02/25 Втр 20:17:23 3380907 101
>>3380786
Так уж вышло, что я и сам математик и программист.
Таки да, на нейронке можно делать что-то только в двух случаях:
1. Если ты нихуя не понимаешь в предмете и хочешь узнать основы
2. Если ты понимаешь в предмете абсолютно все и знаешь, что должно получиться на каждом этапе, а также можешь тестировать все за секунды.
Аноним 04/02/25 Втр 21:02:14 3380940 102
>>3380907
> я и сам математик
Скажи что нибудь на математическом?
Аноним 04/02/25 Втр 21:57:15 3380993 103
>>3380940
Никак не могу найти работу по специальности
Аноним 04/02/25 Втр 23:29:58 3381042 104
>>3380993
>Никак не могу найти работу по специальности
А в чем работа математика заключается?
Аноним 05/02/25 Срд 00:52:02 3381083 105
>>3380243
С тобой можно связаться?
Если да, куда можно написать? предпочтительно на фейкопочту
Аноним 05/02/25 Срд 00:56:46 3381086 106
>>3381083
Нет, пиши вопрос здесь
Аноним 05/02/25 Срд 01:08:13 3381095 107
>>3381086
1) В какой области у тебя ресеч? Чисто математика-информатика? Или применение моделей и архитектур в какой-нибудь медицине?
2) Ты в СНГ или за бугром? В СНГ, вообще, есть что-то с ресечами помимо яндеса, сбера и хуявея?
3) В частной конторе или в условном нии?
4) Ресечишь с самого начала или перекатился туда откуда-то?
5) Каковы перспективы в твоей области? Ну, то есть, если ты будешь менять работу, насколько ты востребован в той местности, где ты есть? Ресечеры всё же не всем нужны - это более узкая специальность, чем обычный ML-щик или дата сатанист, а переезды не всем под силу.
6) Тот же вопрос, но касаетельно финансовых перспектив. Насколько они радужны?
7) Насколько сильно ебут ресёрчами? Есть kpi, обязательные публикации N раз в год, патентование и прочие конференции? Или делаете постепенно по мере необходимости?
8) По твоему опыту - ресеч того стоит? Не жалеешь? Или проще прикручивать лангчейны к моделям на галерах?
Аноним 05/02/25 Срд 01:21:57 3381104 108
>>3381042
Да че ты доебался-то?
Я бакалавр по ИВТ, специальность - платы проектировать, стало быть. Решил вместо этого колупаться в менее старперской индустрии.
Развлекаюсь мл, потому что была сильная математика
Аноним 05/02/25 Срд 01:25:09 3381106 109
>>3381095
Бля. Я же говорил.


Ты забыл пункт 0 - стать ресерчером.
Аноним 05/02/25 Срд 01:44:30 3381117 110
>>3381104
>специальность - платы проектировать
>математик
кек
Аноним 05/02/25 Срд 01:55:45 3381124 111
>>3381117
Это ты прицепился к математике.
Я сказал что я математик и информатик - отвечая на твою формулировку.
Я проходил три семестра линала, два или три матана, вычмата, булеву.
Авось что-нибудь пойму в работе нейросетей.
Займись делом
Аноним 05/02/25 Срд 02:46:48 3381131 112
>>3381124
>Займись делом
А почему злой такой?
Аноним 05/02/25 Срд 13:53:13 3381374 113
>>3381131
Ты ведешь непоследовательный диалог, похожий на троллинг, а я, видимо, ведусь. Вот и злой.
Аноним 05/02/25 Срд 16:36:52 3381546 114
правильно ли я понимаю, что нейронка это по сути супер мощная поисковая система?
Например ChatGPT не сам же генерирует код (?), а просто берет и собирает нейровысер из огромной кучи информации
вообщем может кто в двух словах объяснить базовый принцип работы иИ
Аноним 05/02/25 Срд 16:41:17 3381557 115
>>3381546
>правильно ли я понимаю, что нейронка это по сути супер мощная поисковая система?
нет
>Например ChatGPT не сам же генерирует код
сам
>а просто берет и собирает нейровысер из огромной кучи информации
да

Смотри: в интернете очень много информации, но в основном это говностатьи по программированию и ноготочкам.
При обучении нейронки она их все прочитала, так что лучше всего умеет писать именно их.
Однако, хотя она и умеет писать похоже на человека, понимания понятий, стоящих за буквами, у них нет.
Лучшее, на что она годна, это под твоим присмотром писать о чем-то, в чем ты разбираешься.
Gpt - концентрированная банальность. Спроси его о чем-нибудь, что он видел редко и он может начать путаться.
Но для продающего текста или фрагмента программы сойдет
Аноним 05/02/25 Срд 16:42:44 3381561 116
>>3381557
Добавлю к этому, что нейронки способны более-менее охватывать сложные понятия и удивлять нас, так что нельзя сказать, что он ничего не генерирует сам.
Из 10 шуток он может сказать одну очень годную
Аноним 05/02/25 Срд 17:32:47 3381674 117
image.png 116Кб, 1211x392
1211x392
>>3220427
А что-то я не понял, с какой стати они используют стилистику (и название и оформление) оригинального Адитьи Бхаргавы и с какой стати их там этих авторов как грязи?
Аноним 05/02/25 Срд 19:26:56 3381818 118
изображение.png 267Кб, 466x520
466x520
изображение.png 91Кб, 244x329
244x329
>>3381674
> они
Издатели? Ну так все права на книгу у издателя.

Например, в 4 издании книги High performance mysql ВЫПИЗДИЛИ ВСЕХ авторов. Текст в основном оставлен старым, но птичку в другую развернули
Аноним 05/02/25 Срд 21:05:51 3381912 119
>>3381106
Какой смысл чуваку выше писать ту простыню если он уже ресечер? ты далбаеб или просто каждой бочке затычка?
мимопроходил
Аноним 06/02/25 Чтв 17:43:48 3382466 120
>>3381912

Смысл в том, что у того чувака вопросы уровня "Привет, ты CEO дипмайнда? Можешь, ответить на пару вопросов, я просто тоже собираюсь в СЕО перекатиться из мерчиндайзинга. Насколько у тебя доод большой? Ты раньше СЕО работал, или тоже с улицы залетел? Не думал перейти в розничную торговолю, там KPI более прозрачные, как по мне?"

тожемимопроходил
Аноним 06/02/25 Чтв 23:59:22 3382712 121
2912582large.jpg 58Кб, 516x443
516x443
>>3382466
>Смысл в том,
Смысл в том, что ты, судя по всему, слишком много пиздишь не по существу.
Если это ты >>3372265 , то вообще умора - то плачешься, что итт вопросы оставлять не хотят, то плачешься, что вопросы оставили, но по твоему разумению, они не те.
>что у того чувака вопросы уровня "Привет, ты CEO дипмайнда?
Вот тут >>3381095 нет ни одного вопроса про CEO-шность или что-то такое.
Вопросы конкретные про конкретное ML направление, оставленные в соотвествующем треде.
А если у тебя какие-то не такие отсосиации возникают - держи их при себе.
ML-ресечером можно стать разными путями - можно из академии или нии перекатиться; можно из ML-слесарства или погромирования; можно из химии, физики, биологии, надрочившись в моделировании. У всех разные пути, и компании тоже разные, с разными подходами, разными направлениями деятельности, разными, блять, иссследованиям и перспективами. Одни вроде Нвидии и прочих интелов, больше угорают по компьютерному зрению и хардварному ML, другие вроде OpenAI и Google по архитектурам и математике, третьи вроде Insilico в биотех-ML полезли. Везде разные условия. Если в одном месте тебе дают публиковаться, то в другом ты не имеешь прав на свою собственную интеллектуальную собственность, а третьем, тебе надо kpi по статьям выполнятЬ, чтобы бабки выделили.
Про что, сука, и вопрос - чтобы реальный ML-ресёсчер пришёл и рассказал, что и как, а не какой-то петух который решил самотувердиться за счёт воображаемых студентов с улицы.
И да, ебанько, если в снг 1,5 конторы, которые занимаются ML-ресёчем - это отдельный важный вопрос. Потому что в случае, если ты останешься без работы, ты ничего подобного с вероятнстью в 0.95 не найдёшь. И встаёт вопрос, а нахуй надо рвать жопу ради узкого направления, если можно просто продолжать гонять свои модели и датасаенс за понятные деньги и понятные перспективы.

Так что сделай большое одолжение - если тебе нечего по существу сказать про ML ресёч - завали своё ебало.
Спасибо.

ЗЫ этот тред и годы назад был средоточием чванства и долбоебизма без помощи или полезной информации, а сейчас и подавно.
Аноним 07/02/25 Птн 16:09:52 3383216 122
>>3382712

Я первый раз в треде отписался и по совместительству работал рисерчером

>Вот тут >>3381095 нет ни одного вопроса про CEO-шность или что-то такое.
Есть. Ладно, если ты вообще не понимаешь, в чем проблема, я тебе поясню.

Чтобы тебя взяли на позицию рисерчера, тебе нужно:

1) Иметь профильное образование. Под профильным, я имею ввиду не то, что у тебя линал в унике был, а что у тебя кафедра и диплом были по машиному обучению (опционально биоинформатике) ИЛИ у тебя ПОМИМО базововго математического/физического/CS образования (из нескольких вузов в РФ) был диплом ШАДа.

С этим тебя могут взять в аспу в несколько мест в РФ, где у тебя будет позиция рисерчера. Раньше (>5 лет назад) могли взять в Яндекс.

После этого можно идти либо в академию дальше, либо пункт 2.

2) Чтобы тебя взяли на позицию рисерчера в серьезную фирму (а только в них есть отдельные позции рисерчера), тебе нужно иметь не просто образование, а научную степень по конкретной тематике в машинном обучении, а так же (крайне желательно) опыт работы на позии ML-инженера.

3) Альтернатива -- с большим (>6 лет) опытом на позиции ML инженера, ты можешь начать писать статьи по теме своей работы. Например, это могут быть патенты.

Это я все к чему. Для того, чтобы хоть немного приблизиться к тому, чтобы задумываться о том, пойти ли тебе заниматься рисерчем в ML, тебе нужно от 5 до 10 лет уже заниматься машинным обучением на учебе, или работе и пройти кучу ступеней. После этого у тебя никогда бы таких вопросов не возникло, потому что тебе все рассказал либо твой научник, либо твой тимлид, либо твои однокурсники.
Аноним 07/02/25 Птн 18:38:46 3383346 123
1315546582001.jpg 179Кб, 520x853
520x853
>>3383216
Спасибо.

Но ты сказал много, не сказав особо ничего.

>Под профильным, я имею ввиду не то, что у тебя линал в унике был, а что у тебя кафедра и диплом были по машиному обучению
Твои кафедры по машинному обучению в лучшем случае несколько лет назад стали повсеместно появляться, что как бы намекает, что твоя фильтрация - говно и отсекает всех, кто старше 25.
>был диплом ШАДа.
Который кроме Яндеса особо нахер никому не нужен. Ни Хуявею, ни Нвидии, ни, вообще, за бугром. Да и тот же Сбер со своими лабораториями что-то не особо в вакансиях котирует ШАД.
>С этим тебя могут взять в аспу в несколько мест в РФ, где у тебя будет позиция рисерчера.
Всю жизнь мечтал променять 300к в наносек на 0.1 ставку м.н.с.-а и нищенскую стипендию, чтобы питаться максимум 1 дошиком в день.
>2) Чтобы тебя взяли на позицию рисерчера в серьезную фирму (а только в них есть отдельные позции рисерчера
Спасибо, капитан. А теперь список серьезных фирм в студию. И пожалуйста, снг-шных, если таковые имеются.
>потому что тебе все рассказал либо твой научник, либо твой тимлид, либо твои однокурсники.
Ты сам себе противоречишь. Если кто-то работает в ML-индустрии 5-10 лет, как ты писал выше, но в этих фирмах нет исследовательского отдела, откуда, по-твоему, этот кто-то или его тимлид должны знать про исследования, исследовательские лаборатории и прочее?

И да, рисечер, твоя зарплата была нормальной? На уровне обычного ML-инженера в индустрии?
Или ты довольствовался стипендией в аспиратуре?


Аноним 07/02/25 Птн 19:11:38 3383368 124
>>3383346
>Твои кафедры по машинному обучению в лучшем случае несколько лет назад стали повсеместно появляться, что как бы намекает, что твоя фильтрация - говно и отсекает всех, кто старше 25.

Нет. Кафедры по машинному обучению были и 15 и 20 лет назад. Просто ты не в курсе, потому что хайпа не было. И учили они (классический мл, баес и так далее) по той же самой программе, что и сейчас. Просто за последние 10 лет добавилось много новых разделов. Разделы тоже не изменились, поменялись методы, которые считаются популярными. Например, если раньше OpenCV был на матлабе и плюсах, а на хайпе был SIFT-вектора, то сейчас это питон и нейронки. А то, что отсекает людей старше 25, то не понимаю, чему ты удивляешься. Да, представь себе, "вкатиться" с улицы в исследования нельзя. Тебя же не удивляет, что тебя не возьмут в биологическую лабу без образования (и пхд).

>Который кроме Яндеса особо нахер никому не нужен.
Лол, с чего ты взял* ШАД -- это по сути магистратура, причем очень хорошая, которая как раз и нужна для того, чтобы человек с математическим/физическим/etc образованием мог получить профильное доп.образование по машинному обучению (или просто CS). Другой вариант -- ты можешь просто закончить бакалавриат на ФКН/ММП/базовой кафедре ФУПМа, тогда тебе ШАД не нужен, потому что тебе и так все расскажут.

>Да и тот же Сбер со своими лабораториями что-то не особо в вакансиях котирует ШАД.
С чего ты взял? Котирует прекрасно.

>Всю жизнь мечтал променять 300к в наносек на 0.1 ставку м.н.с.-а и нищенскую стипендию, чтобы питаться максимум 1 дошиком в день.
1. Тебе не предлагают, лол. Знал бы , какой туда конкурс.
2. Ты понятия не имеешь, сколько, как и из каких средств спонсирует ML-лабы.

>Спасибо, капитан. А теперь список серьезных фирм в студию. И пожалуйста, снг-шных, если таковые имеются.
Ну погугли. Из самых известных -- яндекc, сбер, каспер, криптонит, вк, airi, сколтех, visionlabs, тысячи их. Ты просто вообще не в контексте. Можешь хоть на хх ру искать.

>Ты сам себе противоречишь. Если кто-то работает в ML-индустрии 5-10 лет, как ты писал выше, но в этих фирмах нет исследовательского отдела, откуда, по-твоему, этот кто-то или его тимлид должны знать про исследования, исследовательские лаборатории и прочее?
Как ты себе это представляешь? Типа вы с тимлидом 10 лет в закрытой комнате просидели? За 10 лет, ты всех вокруг узнаешь десять раз, людей-то мало в этой области.

>И да, рисечер, твоя зарплата была нормальной На уровне обычного ML-инженера в индустрии?
Зависит от чего уровень считать, конечно. Но +- на уровне.

Ты лучше расскажи про себя. Ты из праздного любопытства, или у тебя планы какие-то конкретные?
Аноним 07/02/25 Птн 21:03:21 3383440 125
>>3382712
> пиздишь не по существу.
>завали своё ебало.
> помощи

Нет.
До тех пор пока ты не осознаешь, что люди в интернет заходят не лично для тебя.

Я желаю читать публичные дискуссии мл-рисерчеров и буду гнобить всяких додиков.
Аноним 07/02/25 Птн 23:30:07 3383532 126
У вас тут ярая дискуссия, я смотрю
В пылу обсуждения, подскажите простому дата-инженеру, как перекатиться в ML?
Аноним 07/02/25 Птн 23:41:14 3383539 127
Кто-то из здешних проходил DLS? Что скажете? Стоит того?
Аноним 08/02/25 Суб 01:58:48 3383563 128
1332692575247.jpg 39Кб, 448x448
448x448
>>3383368
>Нет. Кафедры по машинному обучению были и 15 и 20 лет назад.
В полутора вузах вроде мфти, про которые никто не знал?
>Просто ты не в курсе, потому что хайпа не было.
Разумеется. Интернет нулевых не был таким заселённым, не было кучи курсов, лекций, статей, журналов, которые сейчас. Без знакомых или родных в той сфере узнать про направления было маловероятно.
Да даже если бы и узнал - толку-то? Новые лекарства и молекулы, например, не линейной регрессией или деревьями моделируются. Точно также как чатботы не на нейронках с 1 скрытым слоем делаются.
> Например, если раньше OpenCV был на матлабе и плюсах, а на хайпе был SIFT-вектора, то сейчас это питон и нейронки.
OCR забыл.
>Да, представь себе, "вкатиться" с улицы в исследования нельзя. Тебя же не удивляет, что тебя не возьмут в биологическую лабу без образования (и пхд).
Твои примеры тут не подходят. Попробуй ещё раз.
>С чего ты взял? Котирует прекрасно.
По вакансиям это не скажешь.
>1. Тебе не предлагают, лол. Знал бы , какой туда конкурс.
"Туда" это куда?
>2. Ты понятия не имеешь, сколько, как и из каких средств спонсирует ML-лабы.
У меня есть общее представление.
Что есть лабы в МФТИ, МИФИ,ИТМО, Иннополисе, Сколково. Что-то государством спонсируется. Что-то крупными компаниями, заинтересованными в машобе. А ещё есть военка и около того, что билет в один конец.
>яндекc, сбер, airi
Про них известно. airi так вообще дочка сбера.
>сколтех
Академия без удалёнки. Сейчас бы перекатываться в подмосковье и снимать жильё за много денег.
>каспер, криптонит, вк
Ну и где результаты их исследований? Или у них лабы для вида? Можно ещё МТС с Ростелекомом вспомнить.
>visionlabs
Это те самые, которые цифровой гулаг строят? Помню, долго висели их вакансии, никто связываться не хотел.
>Ты просто вообще не в контексте. Можешь хоть на хх ру искать.
На хх полторы вакансии. Хотя, как по мне, нормальные места не через хх ищутся.
>Как ты себе это представляешь? Типа вы с тимлидом 10 лет в закрытой комнате просидели? За 10 лет, ты всех вокруг узнаешь десять раз, людей-то мало в этой области.
Легко. Тот же сбер - огромная структура с кучей команд и направлений. Сберлаб, Сбердевайс и Аири лишь небольшая часть из них.
Ты вполне можешь заниматься в Сбере чисто инженерной работой с кредитным скорингом, потом в X5 рекомендательными системами, потом в безымянной конторе языковыми моделями и за 10 лет не касаться ML-ресёча. Равно как и твой тимлид. Или ты счиатешь надо каждый месяц мотаться на коференции и читать запоем все статьи, до которых дотянешься?
>Зависит от чего уровень считать, конечно. Но +- на уровне.
А с перспективами как? Во-первых, есть ли куда расти,в том числе по деньгам? Во-вторых, если останешься без работы, есть ли шансы найти что-то такое же? Или надо заводить трактор?
>Ты из праздного любопытства, или у тебя планы какие-то конкретные?
Планы есть, поэтому и спрашиваю.

>>3383440
>До тех пор пока ты не осознаешь, что люди в интернет заходят не лично для тебя.
Люди не заходят ради тебя
@
при этом сам отвечает на посты и плачется, когда получает струю за оффтоп

>>3383532
Найти работу, где дата инженеры работают рядом с датасаентистами или ml-инженерами и перекатиться. Смотреть, что и как они делают, повторять, попутно прокачивая ML-теорию книгами, учебниками, лекциями и статьями. Есть есть время и желание, можешь вон как советуют выше в магистратуру или прочий ШАД поступить.
Аноним 10/02/25 Пнд 14:50:45 3385705 129
>>3381557
ЖПТху можно дообучить /зафайнтюнить?
10/02/25 Пнд 16:51:22 3385855 130
>>3381546
>вообщем может кто в двух словах объяснить базовый принцип работы иИ
СТАТИСТИКА И КОРРЕЛЯЦИЯ. В двух словах, это если ты два раза пришёл в магазин и купил жвачку, то скорее всего в третий раз ты тоже купишь жвачку.

>>3385705
>ЖПТху можно дообучить /зафайнтюнить?
Можно. У неё есть параметр температуры например - это насколько строгим должен быть ответ или наоборот кретивным.
Аноним 14/02/25 Птн 20:58:08 3389376 131
Какой же нулёвый , выражденческий вкатунский тред .
>што такое ии
>это какая-то поисковая система?
>как работает нейронка помогите, как она ПОНИМАЕТ
И это всё, что смогла высрать борда, полная задротов-омежек? В общем, где нормальные чаты искать?
Аноним 14/02/25 Птн 22:10:05 3389411 132
>>3389376

А чего ты ожидал от хайповой темы? Хайп вокруг ИИ может быть интересен только тем, кто ИРЛ с этим никогда не соприкасался.
Аноним 19/02/25 Срд 21:38:08 3392788 133
Как вообще вкатываться в эту сферу?
Математические знания есть, программирование подтяну. А дальше?
Как должно выглядеть резюме?
19/02/25 Срд 22:02:04 3392803 134
>>3392788
>Как должно выглядеть резюме?
Если ты задаёшь такие вопросы, значит machine learning - не твоё. Там гигантская конкуренция и место получат умные люди, не задающие тупорылых вопросов ПОМОГИТЕ!!!! ПОДСКАЖИТЕ Я НИЧЁ НЕ ЗНАЮ ЧЁ МНЕ ДЕЛАТЬ!!!! ДАЙТЕ ГАЙД Я ЗАПУТАЛСЯ!!! В ml сфере сейчас по 50-100 человек на место, можешь не рыпаться, за тебя всё сделают.

>Математические знания есть, программирование подтяну. А дальше?
Просто блять не изобретай велосипед. На hugging face 1,4 миллиона готовых моделей. Что ты можешь такого сделать, чего не будет на hugging face? Разве что заменить один датасет на другой.
Аноним 19/02/25 Срд 22:09:26 3392806 135
>>3392803
хуясе школьник высрал
Аноним 12/03/25 Срд 17:39:56 3407559 136
Аноним 12/03/25 Срд 23:23:43 3407743 137
>>3392788
>Как должно выглядеть резюме?
вмк, сколтех или что то такое в образовании, работа в бигтехе, лабе или квантом в разделе про опыт
Аноним 12/03/25 Срд 23:48:43 3407765 138
>>3392788
>Математические знания есть, программирование подтяну. А дальше?
А чё может быть ДАЛЬШЕ? Дальше ты делаешь реальные проекты, которые облегчат жизнь людям. Всё. А как может резюме выглядеть... Ты можешь нанять дизайнера. Сделать охуенный сайт-визитку. Сайт блог. Там рассказать о себе, показать какие проекты ты делал.
Аноним 27/03/25 Чтв 19:46:34 3417559 139
>>3261941
sentdex - охуеннейший Ютуб канал про ИИ
Из книг - ебейшая книга Франсуа Шолле "Глубокое обучение на Python"
Аноним 02/04/25 Срд 12:25:58 3421463 140
Есть бесплатные нейроночки которые можно запустить локально на пк с rx570 4gb ?
Аноним 02/04/25 Срд 12:46:42 3421488 141
>>3417559
>Ютуб
На хуй не нужно
Аноним 02/04/25 Срд 12:50:24 3421491 142
>>3421463
Если сумеешь запустить ROCm на своей оси с этой картой - то квантованные модели до 4b - llama 3.2, qwen-2.5, gemma-3, phi-3.1-mini и тд в Q4 например

Но лучше не еби себе мозги и заплати копеечку openrouter/bothub и поиграйся с чем-то стоящим. Да даже бесплатные модели на этих агрегаторах лучше чем то что ты сможешь запустить на своем железе
Аноним 04/04/25 Птн 15:37:19 3423167 143
Делаю магу CS, упор на ML, насколько важны оценки? Когда буду делать вкат в ML на них будут смотреть?

Сейчас пол года подрабатываю на питоне но не связано с ML, думаю когда год отработаю и сдам Deep Learning 1/2, Machine Learning 1/2 буду искать стажером в области ML и в резюме добавить проекты из учебы и несколько kaggle playground competitions. Как думаете норм трамплин для вката?
Аноним 04/04/25 Птн 15:57:00 3423183 144
>>3423167
Если не в рисерч вкатываешься, то на оценки вообще пофиг, максимум что интересует в некоторые компании - наличие диплома.
Аноним 04/04/25 Птн 17:51:25 3423252 145
>>3423167
>буду искать стажером
Лол удачи. Проще стать главой правления газпрома чем получить стажировку. Отпишись как найдёшь. Мне пиздец как интересно, кто же там стажирует. Может тиньков какой-нибудь, но в тинькове конкуренция примерно такая - из 5000 заявок получили стажировку 130 человек. А на постоянке остались и того меньше, человек 80 наверно...
Аноним 30/04/25 Срд 01:49:10 3443231 146
>>3423167
>>Deep Learning 1/2, Machine Learning 1/2
Где это ты сдаешь?
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов