/pr/ - НЕЙРОНОЧКИ И МАШОБ ТРЕД №16

Аноним 22/07/19 Пнд 20:42:54 №14406392

думаю вот над таким вопросом. Много читал литры по психологии, в основном КПТ/Лакан, Фрейд/немного общей психологии. И хотелось бы как-то применить свои знания в программировании. Может кто-то знает как эти две сферы объединить, может быть уже есть какие-то проекты в моделировании. Хз в общем

Аноним 22/07/19 Пнд 20:43:35 №14406433

Анон, подскажи, пожалуйста.
Есть таблица вида:
№|Cat
1 | A
1 | B
1 | C
1 | D
2 | A
2 | D
2 | B
3 | C
...

Как привести её к виду одномерного массива:
№ A B C D
1 1 1 1 1
2 1 1 0 1
...
Т.е элементы второго столбца оригинальной таблицы должны стать названиями столбцов новой матрицы, а наполнения ячеек этих столбцов - булевое 1 или 0 - т.е были они в оригинальной таблице или нет?

Аноним 22/07/19 Пнд 22:30:50 №14407044

>>1440639
Психология != Психиатрия != Нейробиология
You need to go deeper.

Аноним 23/07/19 Втр 09:42:49 №14408475

>>1440639
Можешь проанализировать, как желание выебать твою мать в детстве привело к тому, что ты теперь форматируешь код под силуэты фаллоса, пидор.

Аноним 23/07/19 Втр 10:01:57 №14408536

>>1440643
Во-первых, двумерного. Во-вторых, ты совсем тупой?

letters = unique(table['cat'])
result = {letter: repeat(0, n) for letter in letters}
for num, letter in zip(table['n'], table['cat']):
result[letter][num - 1] = 1

В-третьих, какого хуя вы вообще в этот тред с такими вопросами ходите?

Аноним 23/07/19 Втр 10:20:17 №14408577

zxZryuu.png (6Кб, 64x64)

Что делать если в моем городе(не мухосранск) нет вакансий для джунов по млу, как развиваться? Везде сеньоров им подавай, помогите

Аноним 23/07/19 Втр 10:28:11 №14408588

>>1440857
Начни нового персонажа.

Аноним 23/07/19 Втр 10:31:33 №14408639

YZwGllZ.png (11Кб, 64x64)

>>1440858
А если серьезно?

Аноним 23/07/19 Втр 10:42:09 №144086910

>>1440863
Иди прогером куда-то где есть задачи, где можно применять мошон лёрнинг и применяй. Потом с чистой совестью пиши мошон лёрнинг себе в резюме и ищи работу.

Аноним 23/07/19 Втр 10:44:53 №144087011

>>1440869
спасибо! Но даже таких вакансий немного, ну ничего время есть, что нить да выловлю

Аноним 23/07/19 Втр 13:57:04 №144094712

>>1440857
Коммиты в опенсорс, фейковый профиль, апворк

Аноним 24/07/19 Срд 10:11:05 №144142313

Что сейчас самое крутое в генерации картиночек? ralsgan?

Аноним 24/07/19 Срд 11:14:17 №144145214

>>1440947
>фейковый профиль
?

Аноним 27/07/19 Суб 12:14:34 №144331715

Влияет ли момент оптимизатора (и вообще, сам алгоритм оптимизации) на гамму и бету в батч-нормализации?
Или там только собственный момент учитывается?

Аноним 28/07/19 Вск 13:54:02 №144385516

>>1440632 (OP)
Ищу кого-нибудь для общения вокруг программирования и матана, обмена ссылками и книгами, а так же для парного программирования.
Мои языки C, Python. Считаю что программист из меня так себе.
Сферы интересов: Теория игр, теория принятия решений, Управление и оптимизация, многокритериальное принятие решений, Марковские модели, конечные автоматы, теория графов, теория вероятностей, статистические методы, имитационное моделирование, ии и коллективное поведение и проч.
korbelan@mail.ru

Аноним 29/07/19 Пнд 02:25:49 №144418917

Анон, у меня странный вопрос. Работаю погромистом уже продолжительное время, решил попробовать на досуге а качестве хобби поиграться с нейронными сетями. Это долгосрочная идея, поскольку у меня нет базы по математике. Вопрос в том, как вкатываться в матешу для машоба? Мои знания математики кончаются примерно перед началом тригонометрии, если смотреть школьную программу. Может какая-то конкретная книга, сайт?

Аноним 29/07/19 Пнд 06:03:17 №144421518

>>1444189
попробуй курс Математика и Python для анализа данных
https://www.coursera.org/learn/mathematics-and-python
как пройдешь его можешь начинать следующий Введение в машинное обучение
https://www.coursera.org/learn/mathematics-and-python

Аноним 29/07/19 Пнд 10:42:47 №144424819

>>1443855
А ты няшный?

Аноним 29/07/19 Пнд 15:53:31 №144437620

>>1444215
Благодарствую.

Аноним 29/07/19 Пнд 22:50:17 №144468821

>>1444189
Линейная алгебра, матстат, дискретный анализ

Аноним 29/07/19 Пнд 23:21:54 №144470322

Анон, подскажи пожалуйста - какие вопросы тебе задавали на собесе? Какие вопросы ты бы задал? Круто, если помнишь что-то конкретное с собеседований

Кстати, каковы мои шансы на получение работы, если:
2 года до этого работал в эмбеддед, 0.5 года как дата инженер
Инглиш аппер-эдвенсд
Порешал на топ20% 5 штук легких задачек на каггле
1 мини проект по финансам
Эндрю нг курс дроченый-передроченный 4 раза
Статистика - уровень слабенбкий, но в принципе в выборках/цпт/случ величины/распредееления ориентируюсь
Теорвер - супер хуево, если честно, формул не помню. Только то что когда множить когда складывать вероятности надо, а ещё что такое комбинация -c n по k

Аноним 30/07/19 Втр 23:38:43 №144525023

Для курсача планирую рассмотреть тему генерации текстов посимвольно/пословно. Из того, что я пока прочитал, все еще актуальное решение — LSTM, GRU.
Word2vec, как я понял, для моей задачи и не нужен. В какую сторону еще можно копать?

Аноним 31/07/19 Срд 11:57:56 №144535224

>>1445250
шо, хочешь свой GPT2 сделать, как OpenAI? :)

я бы погуглил по этой теме - у них офигенная работа, жаль, что закрытая
https://openai.com/blog/better-language-models/

Аноним 31/07/19 Срд 11:59:25 №144535325

>>1445250
>рассмотреть тему генерации текстов
Рассмотри

Аноним 31/07/19 Срд 12:02:29 №144535626

>>1445352
text = random()

Аноним 31/07/19 Срд 22:31:25 №144566027

Где в России лучше всего учиться в магистратуре на тему machine learning / deep learning / data science ?

Аноним 01/08/19 Чтв 02:14:00 №144577128

Анончик, может есть какой-то материал хороший по pytorch. Пока только вкатываюсь в мл, сложно сходу в документации разобраться. Может какой-то добрый дядя написал книгу или записал видео, где рассказывает что, как и почему там устроено?

Аноним 01/08/19 Чтв 10:58:57 №144584329

>>1445771
ОФ сайт вполне неплох, от установки, до low-level деталей

Аноним 01/08/19 Чтв 13:37:36 №144591030

>>1445843
Я и не спорю, сайт действительно хорош. Но может ещё есть что-то?

Аноним 01/08/19 Чтв 18:25:53 №144609131

Никак не могу разобраться с активным обучением.
Есть какой-нибудь крутой гайд? Идеально, если он будет с примерами

Аноним 01/08/19 Чтв 18:26:19 №144609232

>>1445910
https://github.com/pytorch/examples

Аноним 01/08/19 Чтв 21:58:17 №144619933

>>1445250
рассмотри марковские цепи
ещё можешь рассмотреть cs224n и затем рассмотреть transformer-based модели

Аноним 01/08/19 Чтв 22:50:05 №144624634

>>1440632 (OP)
Ребят, вот читаю я Николенко и очень слабо понимаю материал. С Гудфеллоу чуть получше. Существуют ли вкаты попроще, где все разжевывают прям для нубья?

Аноним 01/08/19 Чтв 22:52:39 №144624935

>>1446246
Язык, кстати, можно и английский.

Заранее очень вам благодарен.

Аноним 01/08/19 Чтв 23:37:14 №144628136

>>1440853
>В-третьих, какого хуя вы вообще в этот тред с такими вопросами ходите?
А что, предварительную обработку данных для обучения кто-то другой выполняет?

Аноним 02/08/19 Птн 00:04:57 №144630137

>>1444703
>1 мини проект по финансам
Что за проект?

ИИ, вкатывание, помощь (помогите блятб) Аноним 02/08/19 Птн 01:49:54 №144632538

ебаный рот этого казино, блять.

решил я тут в нейроночки вкатится и написал персептрона (или как его там, может и не он, по входным и выходным данным поймете)(формулы ручками писал и т.д., чтоб все это гавно понять), но че то ничего не работает

код

import numpy as np
import random
lst = ([0,1,1],
[1,0,1],
[1,1,0],
[0,0,1],
[0,1,0],
[1,0,0],
[0,0,0],
[1,1,1])
lst_result = [1,1,1,0,0,0,0,1]
weight_one_input = random.randint(1,9) / 10
weight_two_input = random.randint(1,9) / 10
weight_free_input = random.randint(1,9) / 10
weight_one_out = random.randint(1,9) / 10
learning_rate = 0.01
def sigmoid(x):
return 1 / (1 + np.exp(-x))
def learn():
global weight_one_input
global weight_two_input
global weight_free_input
global weight_one_out
global learning_rate
for step in range(10000):
for x in lst:
one_input = x[0]
two_input = x[1]
free_input = x[2]
out = lst_result[lst.index(x)]
ghost_layer = sigmoid(one_input weight_one_input + two_input weight_two_input + free_input weight_free_input)
out_layer = sigmoid(ghost_layer weight_one_out)
err = out_layer - out
delta_weight = err (sigmoid(out_layer) (1 - sigmoid(out_layer)))
weight_one_out = weight_one_out - (out_layer err learning_rate)
err = weight_one_out delta_weight
weight_one_input = weight_one_input - (one_input err learning_rate)
weight_two_input = weight_two_input - (two_input err learning_rate)
weight_free_input = weight_free_input - (free_input err learning_rate)
print([weight_one_input, weight_two_input, weight_free_input, weight_one_out])
def test():
weight_1 = 0.6607684757223093
weight_2 = 0.4023567600436868
weight_3 = 0.3435469144509494
weight_4 = -0.003854848220505953
inp = [0,0,0]
ghost_layer = sigmoid(inp[0] weight_1 + inp[1] weight_2 + inp[2] weight_3)
print(sigmoid(ghost_layer * weight_4))
test()
#learn()

пустые строки он почему то убрал, так что за читабельность извиняйте

Аноним 02/08/19 Птн 02:37:37 №144633239

>>1446325
> решил я тут в нейроночки вкатится
> не может в нейронки
> не может в Гугл
> не может в тся-ться
Выкатывайся обратно. Я серьёзно.

Аноним 04/08/19 Вск 23:29:56 №144820540

Что думаете о Microsoft Azure для ML? Удобен ли, полезен ли? Можно ли обучить модели на Азуре, а использовать их без Азура?

Аноним 05/08/19 Пнд 12:58:09 №144836641

>>1440869
Хуйня.
Ну т.е. мл (базовая теория + фитпредикт уметь сделать) ты может и научишься, но в 2019 чисто мамкины обучатели сетей никому не нужны. Т.е. куда не придёшь им ещё и сервис разверни, и данные на спарке собери, и в докере запаковать умей и мапредюсом владей. Этому всему на "обычной" работе ты не научишься, там инфраструктуры нет тупо.

Аноним 08/08/19 Чтв 04:34:51 №144962842

>>1448366
>Т.е. куда не придёшь им ещё и сервис разверни, и данные на спарке собери, и в докере запаковать умей и мапредюсом владей
Всё это укладывается в месяц и скорее всего часто встречается на работе у почти любого кодера. Ясное дело вообще другая вещь, чем ресерч в пиндосском университете. Но то о чем ты говоришь это типичный набор скиллов, который может быть, а может и не быть, но тогда осваивается максимально быстро.

Аноним 08/08/19 Чтв 04:37:44 №144963043

>>1446325
>в нейроночки вкатится
>не сумел даже в разметку двача и отступы

Аноним 08/08/19 Чтв 19:20:55 №144996044

>>1445250
https://github.com/minimaxir/textgenrnn
в 4 строчки

Аноним 08/08/19 Чтв 19:24:38 №144996745

>>1448205
Удобен, полезен, использовать без ажура нельзя. Но алгоритмы из коробки так себе, если можешь в код - лучше свой написать

Аноним 09/08/19 Птн 16:48:44 №145055246

>>1448205
Они способны - повертеть головой. но кошит поредили. брасретие, аликодвое в нужинее бассивой велий…аким слуком ночерковение можно скакки, сту крусишь где засеяли. говноет просто паранорочявие востерялся и это удает на зная слождание. менею, звоящи, — дротнеущевые. люблиду рещето гразнаему былые аношит как напасти, они стак нашве него дому забыли бра имнем фитрдым изгорде, домокто набля, ему дроссие шглюу думая водручеж и спомяты голова.

Аноним 09/08/19 Птн 20:06:09 №145061747

>>1448366
Ну так а что делать? В дата саентеры лезть а затем в мл?

Аноним 11/08/19 Вск 22:14:46 №145164648

Чики, датасатанисты, стоит ли связываться со всякими Вордквантами и иже с ними?

Аноним 11/08/19 Вск 22:16:21 №145165049

>>1451646
>Ворлдквантами
пофиксил

Аноним 12/08/19 Пнд 00:19:00 №145169550

>>1451650
Там нет более менее интересного датасаенса + ты не пройдёшь отбор/тебя заебёт по десять интервью проходить.

Аноним 12/08/19 Пнд 00:29:27 №145169951

>>1451695
а какой там датасаенс?
Мимодругойанон

Аноним 12/08/19 Пнд 00:36:03 №145170152

>>1451699
Линейная регрессия

Аноним 12/08/19 Пнд 01:27:51 №145172953

PyTorch или TF 2.0?

Аноним 12/08/19 Пнд 08:45:12 №145177854

>>1451729
Обе.

Аноним 12/08/19 Пнд 08:55:57 №145178155

>>1451729

Аноним 12/08/19 Пнд 11:10:54 №145180756

Пилю небольшой ML проект (тематическое моделирование) чисто для себя, очень много рутины, но есть и интересные задачи, если есть желание попробовать пишите, опыт не важен, но если можешь хоть немного в питон и/или в веб будет супер.

Аноним 12/08/19 Пнд 16:03:57 №145197457

>>1451807
контакты оставь

Аноним 12/08/19 Пнд 16:05:34 №145197658

>>1451974
Записывай: улица пушкина, дом колотушкина

Аноним 12/08/19 Пнд 19:32:03 №145208859

Аноны есть аноны на фермах сидящие? Вы че тут сидите и не делаете мир анимешным? https://github.com/taki0112/UGATIT/issues/5
Прогоните позязя нормальный датасет а то там прогнали на лайт версии и маленький датасет плохо обрабатывает =(
Пытался на своей некропеке прогнать посчитал 10 дней уйдет при полном исключении компа из моей жизни и на 100% загрузке

Аноним 12/08/19 Пнд 19:34:24 №145209060

>>1452088
>мир анимешным

Аноним 12/08/19 Пнд 20:33:38 №145211761

>>1451974
tg @pioqwaff

Аноним 12/08/19 Пнд 22:07:24 №145214362

>>1452088
https://colab.research.google.com/notebooks/welcome.ipynb

Аноним 13/08/19 Втр 09:00:55 №145222263

>>1440632 (OP)
1. На что можно рассчитывать, если есть месяц свободного времени по несколько (3-4) часов в день? Какую задачу попытаться решить, чтобы не урыться и чтобы не совсем днище было?
Любопытно влезть, попробовать - хочу ли я этим заниматься. Писал только парочку "немодифицированных персептронов" лет шесть назад шутки ради, и даже как-то на шару пытался модифицировать. В матан и теорвер умею, в матстат совсем капельку. Книжку для вкатывания прочитаю.

2. Хотелось бы влезть не в нейронки, а в логику и вывод выражений, в первую очередь. Но можно и в нейроночки, предпочтение минимальные. Как это называется, какие названия гуглить? Или сейчас и это через нейронки делают?
Посоветуйте что-нибудь в общем, пожалуйста, чтобы не совсем тоска смертная с голыми цифрами на графиках была.

Аноним 13/08/19 Втр 09:48:10 №145223364

>>1452143
а меня в анальное рабство гугл потом не заберет? хотя можно будет хвастаться что работаю в гугле...
Это что бесплатные вычислительные мошности? а почему на них не фармят?

Аноним 13/08/19 Втр 10:50:51 №145225265

>>1452222
1. Для вкатывания в матстат хватит.
2. Нынешние нейронки занимаются минимизацией ошибки между датасетом и весами через постройку градиентов в многомерном поле ошибки.
>>1452233
12 часов дают на одну сессию.

Аноним 13/08/19 Втр 11:44:55 №145228366

Нужно с околонулем знаний написать нлпшную сетку или что-то аналогичное для частеречной разметки, то есть НЛП. Есть какие-то простые пути?

Аноним 13/08/19 Втр 16:37:13 №145248267

>>1452283
Нейролингвистическое программирование (также нейро-лингвистическое программирование, НЛП, от англ. Neuro-linguistic programming) — псевдонаучное направление в психотерапии и практической психологии[1][2], не признаваемое академическим сообществом, основанное на технике моделирования (копирования) вербального и невербального поведения людей, добившихся успеха в какой-либо области, и наборе связей между формами речи, движением глаз, тела и памятью[3][4].

Аноним 13/08/19 Втр 18:10:32 №145259568

>>1452252
думаю за 12 часов ничего не получится

Аноним 13/08/19 Втр 21:09:21 №145270569

>>1452482
НАТУРАЛ ЛЕНГВИЧ ПРОЦЕССИНГ мне нужен, а не вотэтот вот кал.

Аноним 14/08/19 Срд 01:07:50 №145283870

>>1452705
А нахуй тебе нейроговно?

Аноним 14/08/19 Срд 08:55:42 №145290671

>>1452705
Word2vec

Аноним 14/08/19 Срд 13:44:04 №145314372

>>1452906
Всегда проигрываю когда кто-то начинает произносить заклинания типа word2vec. Это же просто идея КАК БЫ ИЗ ТЕКСТА ПОЛУЧИТЬ КАКИЕ-ТО ФИЧИ??.

Аноним 15/08/19 Чтв 09:31:17 №145362173

>>1452283
А в чём сложность конкретно.
Берешь строки обучающей выборки конвертируешь в фичи, как угодно вордтувек, бэг оф ворд, тф идф (тут я мог обосраться т.к. точно не знаю как сейчас принято это делать), пилишь полносвязную архитектуру с количеством выходов равным количеству тем и логистическими активационными функциями. Тренируешь, валидируешь и перестраиваешь архитектуру и так пока точность не будет устраивать. Дальше предиктом проводишь доразметку.

Аноним 15/08/19 Чтв 11:29:03 №145366974

Я один заметил, как оперативно слили reinforcement learning после заявлений Жокинга Бокинга Хокинга и Маска что тема апасная - ИИ, гроб, кладбище, терминатор, уничтожение человечества? Ещё в 2016 тема была на подъёме, openai gym, universe, алгоритмы rl уже рвали игроков-людей не только в понг и всякие шмарио, но даже в го (alphago). Казалось, ещё пара лет такого развития и вот оно, самообучающиеся машины. А потом быстренько вжух и в гроб всю тему. Это ж прямое управление прогрессом науки и техники, а?

Аноним 15/08/19 Чтв 11:40:00 №145367275

Вот даже на швабре был пост https://m.habr.com/ru/post/437020/
> Еще в начале 2018 года вышла статья Deep Reinforcement Learning Doesn't Work Yet ("Обучение с подкреплением пока не работает"). Основная претензия которой сводилась к тому, что современные алгоритмы обучения с подкреплением требуют для решения задачи примерно столько же времени, как и обычный случайный поиск.
Короче, официально решили - нинужно. И не лучше случайного перебора. Хотя общеизвестно, что теми же генетическими алгоритмами таких результатов достигнуто не было.

Аноним 15/08/19 Чтв 13:31:49 №145376376

>>1453669
>после заявлений Хокинга и Маска
Ноунейм петухи.

Аноним 15/08/19 Чтв 14:30:45 №145379377

>>1453763
Openai - контора Маска. И мировой лидер по алгоритмам rl. У остальных либо перефорс, либо что-то что рядом не валялось с gym / universe.

Аноним 15/08/19 Чтв 14:31:21 №145379478

>>1453793
Нонейм параша.

Аноним 15/08/19 Чтв 14:34:32 №145379579

>>1453793
>И мировой лидер по алгоритмам rl
Мировой лидер по неработающим алгоритмам

Аноним 15/08/19 Чтв 15:40:42 №145385480

>>1453669
Потому что ты не в теме, ты залетный. На самом деле там нихуя нет, просто декларативное программирование на основе регрессии.

Аноним 15/08/19 Чтв 15:41:46 №145385681

>>1452595
Смотря сколько флопсов, на гугловском TPU тебе хватит 12 минут.

Аноним 15/08/19 Чтв 15:43:22 №145385882

>>1453672
Статья хуйня и данные подкрученые, весь этот фарс чисто обман ради класов

Аноним 15/08/19 Чтв 15:50:24 №145386383

>>1453672
>Хотя общеизвестно, что теми же генетическими алгоритмами таких результатов достигнуто не было.
Там и обычным rl не было ничего достигнуто сначала, пришлось завозить диплёрненх и долго биться чтоб этого говно заставить работать. Можно было и с генетических алгоритмов начать, не суть в общем.

Аноним 15/08/19 Чтв 18:29:17 №145400484

>>1453669
>Я один заметил, как оперативно слили reinforcement learning после заявлений Жокинга Бокинга Хокинга и Маска что тема апасная - ИИ, гроб, кладбище, терминатор, уничтожение человечества?
Нет, ебнутых шизиков на планете хватает.
Хайп в СМИ штука случайная и прямого отношения к науке не имеет. По тегу reinforcement learning на arxiv-sanity по несколько публикаций в день.
Что касается прогнозов с помощью прикладывания линейки во время какого-то революционного перехода, то тут есть два типа даунов. Первые - которые не понимают ступенчатый характер развития всего, потому что уверены, что любая ступнька - это не ступенька, а о боже пиздец сингулярность, а вторые - которые любое развитие отрицают.
Как правило, второй тип даунов - это проэволюционировавший первый. Сначала восторгались всякой хуйней, а потом якобы прозрели. Караван науки, меж тем, без этих хуесосов идет.

Аноним 15/08/19 Чтв 18:55:02 №145401785

0rVCrtrZQHqD3oP[...].png (93Кб, 1165x885)

>>1454004
На тему reinforcement learning в конце 2018 замутили какую-то мегагитлер диплернинх архитектуру RND (random network distillation), до которой остальным вроде как до луны пешком пикрелейтед, и все равно выходят статьи типа той, на которую ссылка на Хабре, суть которых "все плохо, нихуя не работает, никакого прогресса за 3 года, результаты не превосходят рандомный перебор". Хотя очевидно, что потенциал у этой темы огромный и даже результаты имеются, все равно видна общая тенденция на ее слив.

Аноним 15/08/19 Чтв 19:43:44 №145403086

picebb271ed9604[...].jpg (71Кб, 420x280)

>>1454017
>Хотя очевидно
Кому?
>видна общая тенденция на ее слив.
Если что то будет работать, его уничтожат. Вам долбоебам это еще в 50х на примере ЭС показали.

Аноним 15/08/19 Чтв 19:56:46 №145403387

>>1454017
>Хотя очевидно, что потенциал у этой темы огромный и даже результаты имеются
Не знаю, мне никогда эта тема не была интересна как раз из-за довольно хилого потенциала.
Если очень грубо, то сколько собаку не тренируй, говорить она не научится. И вот reinforcement learning он как раз про тренировку собак с практическими применениями уровня игровых ботов. Игры для атари 2600, ну вообще охуеть, крысу можно научить играть в атари 2600.
С точки зрения ИИ и прочей поеботы интереснее системы на RNN типа машинного перевода - они хотя бы делают то, что животным недоступно.

Аноним 15/08/19 Чтв 22:38:15 №145412488

>>1452283
deeppavlov глянь, и всякое BERT-о подобное

Аноним 15/08/19 Чтв 23:46:14 №145416989

Поясните, что сейчас происходит с tensorflow. Ходел сделать сверточную сетку по книжкe Николенко. Вижу, что интерфейсы уже совсем не такие, поэтому делал то же самое, но по туториалу с сайта TF. Однако все равно вылезла стена из deprecation warningов, где мне предлагают завернуть все в уродливый неймспейс tf.compat.v1. Это не проблема, но мне не нравится, что я умудрился использовать устаревшую семантику, пользуясь якобы свежим API.

Аноним 16/08/19 Птн 00:08:10 №145418390

>>1445660
По мере убывания годноты.
http://msc.skoltech.ru/nauki-o-dannykh
https://yandexdataschool.ru/
https://mipt.ru/education/departments/fpmi/master/data-analysis-ippi
https://mipt.ru/education/departments/fpmi/master/data-analysis
https://mipt.ru/education/departments/fpmi/master/cognitive-technologies-pmi
https://www.hse.ru/ma/datasci/
https://spb.hse.ru/ma/inpro/
https://compscicenter.ru/syllabus/on-campus/ds/
И т. д. Сейчас таких программ уже десятки.

Аноним 16/08/19 Птн 00:15:28 №145418791

>>1454183
В ВШЭ вроде как надо в ШАД поступить, иначе не пустят на нормальную кафедру, за пределами которой не очень.

Аноним 16/08/19 Птн 00:29:59 №145419492

>>1454183
Неужели сколково взлетело?

Аноним 16/08/19 Птн 02:18:41 №145422493

>>1454194
там стипендию хорошую платят

Аноним 16/08/19 Птн 07:11:19 №145427194

>>1454169
Не изменяется то, что мертво.

Аноним 16/08/19 Птн 13:18:41 №145442595

>>1454033
>сколько собаку не тренируй, говорить она не научится.
Охуеть вот это научный подход.

Аноним 16/08/19 Птн 13:20:32 №145442796

>>1454169
>но мне не нравится, что я умудрился использовать устаревшую семантику, пользуясь якобы свежим API
Не хочу обратную совместимость, хочу кушать говно.

Аноним 16/08/19 Птн 23:40:00 №145474897

Есть деньги и законченое профильное образование, нет опыта и желания зарабатывать 300кк/ceк в какой-то корпоративной дыре вроде гугола и остальных больших братьев. В какую лабораторию можно попробовать вписаться ради стажа, публикаций и науки ради фана? Из тех что не принадлежат корпорациям и не требуют муторного поступления на PhD знаю только MILA и может быть OpenAI, но хиккую писать.

Аноним 17/08/19 Суб 13:15:08 №145492598

Есть идея сделать пет-проект чисто для себя, основанный на распознавании не только моей речи, записанной на диктофон. Есть какие-то готовые решения в этой области? Какой прогресс в области распознавания речи? Куда вообще копать? Машобом не занимался со времён универа

Аноним 17/08/19 Суб 13:41:51 №145494799

>>1454169
Из за того что дилёнеры стали массово перекатываться в пайторч, чуваки из гугла решили очень сильно переделать API. Новый API начинается с версии 2.0, но где-то с 1.2 они уже понапихали ворнингов, что весь твой код скоро превратится в легаси гавно.

Аноним 17/08/19 Суб 13:43:42 №1454951100

>>1454925
Kaldi

Хотя сейчас вроде есть какие-то end to end решения на нейронках.

Аноним 17/08/19 Суб 17:04:35 №1455089101

Почему бы не сделать установщик slesarplow.msi, который ставится как простая программа? Или это не илитно, когда не надо трясти яйцами с бубном над консолечкой?

Аноним 17/08/19 Суб 19:17:31 №1455182102

>>1455089
Чмо, которое не может написать одну команду в терминал, ты?

Аноним 17/08/19 Суб 20:07:26 №1455224103

>>1454947
Пайторч лучше?

Аноним 18/08/19 Вск 00:39:23 №1455417104

>>1454183
Благодарю. Можно ли вообще перекатиться из бекенда? Сейчас подтягивают математику, питон уже знаю, работаю 3 года. Хочу магистратуру на эту тему закончить. Мне на момент поступления уже лет 28 будет.

Аноним 18/08/19 Вск 02:53:47 №1455453105

>>1455182
Опущенный зумер гордится тем, что осилил одну команду в телетайпе из позапрошлого века. Сьеби отсюда, шмара.

Аноним 18/08/19 Вск 09:00:14 №1455503106

>>1455224
Медленнее, зато граф динамический.

Аноним 18/08/19 Вск 14:44:24 №1455613107

test

Аноним 18/08/19 Вск 15:47:34 №1455640108

>>1455503
Мань, в слесарьплове теперь тоже граф динамический.

Аноним 19/08/19 Пнд 15:41:44 №1456252109

А никто не пробовал свои модели на толоку или mechanical turk какой-нибудь натравить чтобы денежки фармить? Или потенциально не выйдет ничего?

Аноним 19/08/19 Пнд 15:49:57 №1456261110

Нейрач, я тупой, дай совет.
Нужно ли балансить валидейшон дату? Тестовую дату отбалансировал, а с валидейшоном как? С одной стороны нужно, чтобы не повторялся один и тот же выбор слишком часто (классифицирую 3 вида объектов). С другой этого не бывает в реале, там превалирует один вид, а два периодически появляются. В гугле противоречивая информация.

Аноним 19/08/19 Пнд 16:14:38 №1456275111

>>1456261
Основная информация, которую ты получаешь, это дельта между трейнинг лоссом и валидейшеном, поэтому их распределения должны быть похожи. Тогда сразу становится видно, например, если у тебя трейнинг лосс на порядок меньше, ты ушел в оверфит. Если распределения разные, тебе остается смотреть только на направление движения (уменьшается ли валидейшен лосс от эпохи к эпохе или нет), что хуже, хотя может и так сойти.

Аноним 19/08/19 Пнд 16:57:41 №1456308112

Откуда качнуть бигдату финансовых рынков?

Аноним 19/08/19 Пнд 17:13:30 №1456319113

>>1456252
> А никто не пробовал свои модели на толоку или mechanical turk какой-нибудь натравить чтобы денежки фармить?
А как? Где взять тренировочные данные? Что там вообще за данные?

Аноним 19/08/19 Пнд 17:20:36 №1456325114

>>1456275
То есть чтобы палить оверфит, то балансить нужно. Если не балансить, то получу точность для реальных данных (при условии, что нет оверфита). Правильно понял?

Аноним 19/08/19 Пнд 18:00:32 №1456346115

>>1456261
Трейнинг вообще балансить опасно как раз из-за возникающего несоответствия между распределением на обучении и в приложении.

Аноним 19/08/19 Пнд 18:47:19 №1456377116

Посоны как вкотится в дата саенс чтоб потом еще на работу взяли?

Аноним 19/08/19 Пнд 20:02:11 №1456501117

>>1456377
В гугол?

Аноним 20/08/19 Втр 08:05:58 №1456774118

За AIXI поясните. Охуенная жи тема, почему нигде не используется?

Аноним 20/08/19 Втр 18:00:30 №1456966119

acc.PNG (50Кб, 1578x483)

loss.PNG (48Кб, 1569x485)

valacc.PNG (52Кб, 1569x448)

valloss.PNG (53Кб, 1573x447)

>>1456261
Короче сам проверил свой же вопрос и проиллюстрировал ответ анона >>1456275
Всем похуй, но выложу на всякий, вдруг кому понадобится.
Синий цвет - тестинг и валидейшон дата сбалансированы одинаково.
Оранжевый цвет - тестинг дата сбалансирована, валидейшон - нет.
Точность хуевая, сам знаю.

Аноним 20/08/19 Втр 21:45:48 №1457131120

>>1456966
А как балансил, весами на семплах?

Аноним 21/08/19 Срд 18:16:55 №1457792121

>>1457131
Не, уравнивал количество семплов. Могу себе позволить.

Аноним 22/08/19 Чтв 17:19:37 №1458578122

https://www.youtube.com/watch?v=zMIopks0I98

Ну чё пацаны, аниме? Аноним 22/08/19 Чтв 21:48:45 №1458796123

Очередная победа машобчика, теперь каждый может стать аниме! https://selfie2anime.com/

Аноним 22/08/19 Чтв 21:54:04 №1458804124

>>1458796
>давай, гой, запость своё ебало
>и свою почту не забудь, чтобы было куда спам слать

Аноним 22/08/19 Чтв 22:09:03 №1458817125

>>1458796
Это Убийца Гоблинов, что ли?

Аноним 22/08/19 Чтв 22:16:51 №1458820126

>>1458796
Отправил, долго ли они эту хуйню обрабатывать будут?

Аноним 22/08/19 Чтв 22:26:16 №1458828127

>>1458796
недоученная сеть

Аноним 22/08/19 Чтв 23:01:12 №1458859128

>>1458820
> Отправил, долго ли они эту хуйню обрабатывать будут?
В спам часто падает.
>>1458804
> давай, гой, запость своё ебало
> >и свою почту не забудь, чтобы было куда спам слать
Ну разумеется, (((масонам))) прямо никакой жизни нет без унылого ебла Славика из Залупинска и его почты, куда кроме спама все равно ничего не приходит. Таблетки выпей.

Аноним 22/08/19 Чтв 23:09:55 №1458864129

>>1458859
Уже час не приходит. Хотя я им кучу отправил, может, они скопом отправят.

Аноним 23/08/19 Птн 07:54:48 №1458963130

>>1458796
ЕБААТЬ! Да это жи ТЕРМИНАТОР!!!

Аноним 23/08/19 Птн 11:41:33 №1459071131

Что-то я так и не понял до сих пор, под гордым названием "атеншон" что, скрывается идея просто параллельно основной модели дополнительный денс слой вставить между входом и выходом?

Аноним 23/08/19 Птн 11:49:17 №1459088132

Петюня оказался няшкой, лол

Аноним 23/08/19 Птн 13:02:36 №1459193133

>>1459071
Нет, там еще матричное умножение/сложение есть.

Аноним 23/08/19 Птн 22:23:43 №1459596134

Вот есть номинальная шкала и порядковая.
Например, рассматриваются места, которые заняли бегуны в соревновании
Вася 1
Петя 2
Кирилл 3
Вот эти вот 1,2,3 это номинальная или порядковая шкала, вроде как порядковая, но ведь номинальная шкала подразумевает коды какого-либо состояния, а этим состоянием может быть и занятое в соревновании место

Аноним 24/08/19 Суб 00:18:21 №1459659135

А как ml сочетается с фрилансом? Есть у кого опыт?
Есть шанс, что удастся пристроиться так, что берешь проект на несколько месяцев, решаешь проблему, получаешь бабло и валишь на полгода на Гоа курить бамбук?
Или ml это только фуллтайм?

Аноним 24/08/19 Суб 01:33:53 №1459691136

>>1459659
>берешь проект на несколько месяцев, решаешь проблему
Орнул с этого полубога.

Аноним 24/08/19 Суб 07:55:12 №1459745137

>>1459659
В ml даже с удаленкой все плохо, не говоря уже о фрилансе. Сенситив дейта, вся хуйня.

Аноним 24/08/19 Суб 09:40:34 №1459769138

>>1459745
Откуда сенситив? Данные покидают двх уже обезличенными.

Аноним 24/08/19 Суб 12:33:37 №1459871139

>>1459659
Фриланс млщика - это каггл. Выигрываешь контест с призовыми, живёшь на них от двух месяцев до полугода, дальше продолжаешь.

Аноним 24/08/19 Суб 14:04:36 №1459940140

>>1459769

Даже обезличенные данные хрен кто отгрузит непонятному фрилансеру. Тут внутри компании-то их получить - две недели будешь ждать пока со всеми согласуют. Ну и плюс, данные не обязательно персональные.

Аноним 24/08/19 Суб 14:11:30 №1459949141

>>1459596
Порядковая, потому что на множестве, как ни странно, есть порядок, заданный самой предметной областью. Вообще порядковая - это расширение номинальной.

Аноним 24/08/19 Суб 14:12:29 №1459950142

Ну чёт как-то ниочень.

Аноним 24/08/19 Суб 15:47:59 №1460012143

>>1459659
На хабре видел объявление о системе регистрации по лицу. 60 к. деревянных

Аноним 25/08/19 Вск 00:23:33 №1460330144

Screenshot 2019[...].png (89Кб, 540x270)

>>1459950

Аноним 25/08/19 Вск 09:00:51 №1460394145

>>1458796

Аноним 25/08/19 Вск 09:53:23 №1460406146

>>1460394
Из пикрелейтеда ещё аниме сделай. С телефона что-то не работает

Аноним 25/08/19 Вск 10:25:03 №1460410147

>>1460406
Замылила только.

Аноним 25/08/19 Вск 11:21:11 №1460422148

Палю идею. Нейросеть, превращающая порно в цп.

Аноним 25/08/19 Вск 11:38:56 №1460434149

>>1460422
Никто связываться не будет. Тренировочные данные (собственно, ЦП) - в любой стране лютое палево. А их гигабайты нужны.
>>1460410
Пыня официально не аниме, лол

Аноним 25/08/19 Вск 12:09:02 №1460448150

>>1460422
Алсо, все равно хуйня получится, как с deepnude, то пизда поперек то ещё какая крипота. Современные нейроночки пока ещё не могут в нормальное порно.

Аноним 25/08/19 Вск 20:18:53 №1460713151

Господа, а есть ли где-то готовые модели для питона (SciPy)?
Ну и в принципе готовые модели с весами уже для разных задач?
Мне вот надо на фото описать кривую по контуру человека, а самому собирать/качать петатонны выборки и вот всем этим говном заниматься не хотелось бы.
Спасибо.

Аноним 25/08/19 Вск 20:23:52 №1460717152

>>1458796
Хуета полнейшая, работает как говно.

Аноним 25/08/19 Вск 21:39:16 №1460767153

>>1460713
есть

Аноним 25/08/19 Вск 22:45:52 №1460800154

На фрилансе есть работа с млем?

Аноним 25/08/19 Вск 22:53:20 №1460805155

>>1460800
хабр - "Личный опыт: Data Engineering на Upwork" - всё что нужно знать

Аноним 25/08/19 Вск 23:39:01 №1460835156

>>1460805
400к в месяц на руки -- хорошо чувак устроился.

Аноним 26/08/19 Пнд 00:03:37 №1460853157

>>1460800
Ну подскажи уж, куда смотреть лучше

Аноним 26/08/19 Пнд 11:02:54 №1461004158

Аноны, хочу вкатиться в Дата саентс и потом в ИИ книгой что на пике.

Что думаете по поводу этой книги?

Аноним 26/08/19 Пнд 11:03:37 №1461006159

>>1461004
Блять, книгу забыл

Аноним 26/08/19 Пнд 11:06:12 №1461008160

>>1461006
Про тетеревов?

Аноним 26/08/19 Пнд 14:07:01 №1461149161

>>1461004
епта, как будто мы все тут по книгам вкатились. кто эту срань читать будет

Аноним 26/08/19 Пнд 14:29:25 №1461167162

Если я полное чмо в матеше, то не стоит лезть?

Аноним 26/08/19 Пнд 14:32:17 №1461170163

>>1460434
>Тренировочные данные (собственно, ЦП) - в любой стране лютое палево. А их гигабайты нужны.
Ты из какого года пишешь, cyclic consistency loss вам там ещё не завезли?

Аноним 26/08/19 Пнд 14:49:37 №1461189164

>>1461167
Я думаю 90% дата саентологов градиент взять не сможет, так что не парься.

Аноним 26/08/19 Пнд 15:44:54 №1461238165

>>1461189
Лол, а нахуя брать градиент, если у тебя уже либа все делает, все логично.

математикорабы батрачат на компутеробогов

Аноним 26/08/19 Пнд 17:07:23 №1461273166

>>1461238
Если ты не понимаешь, как это все работает, твой потолок - сойбойские туториалы. Даже если попробуешь что-то на своих данных, а что-то не будет работать, ты даже не поймёшь в чем проблема, т.к твой уровень в этих технологиях это уровень бабки с пультом в полиэтиленовом пакетике, которая не понимает, почему Путин по ящику без звука, то ли действительно тиливизер сломался, то ли просто слуховой аппарат выпал.

Аноним 26/08/19 Пнд 17:14:58 №1461281167

Про OpenCv можно сюда вопросы задавать?
Мне нужно научиться экстрактить текст из комиксов, только каждый раз прога посылает меня нахуй, я уже не понимаю, какие фильтры нужно применять и как можно отсеивать ненужное.

Аноним 26/08/19 Пнд 17:53:59 №1461313168

>>1461273
>Если ты не понимаешь, как это все не работает

Аноним 26/08/19 Пнд 17:54:53 №1461314169

>>1461281
>и как можно отсеивать ненужное.
Легче полететь на Марс, чем решить эту задачу

Аноним 26/08/19 Пнд 18:01:02 №1461322170

>>1461314
Реально все настолько плохо?
Я вроде видел, что кто-то даже делал научную работу и теми же методами, что и я пользовался.

Аноним 26/08/19 Пнд 18:06:10 №1461333171

>>1461322
Можно ли тогда решить эту задачу с помощью какой-нибудь нейроночки?
По идее, всегда нужно искать правильные геометрические фигуры с надписью.

Аноним 26/08/19 Пнд 19:54:26 №1461421172

>>1461238
Слои написать не проблема. Проблема скормить нужным образом данные и получить результат.

Аноним 26/08/19 Пнд 21:05:44 №1461457173

>>1461238
Ну и какой оптимизатор когда ты будешь выбирать, например, слесаредаун?

Аноним 26/08/19 Пнд 21:13:44 №1461459174

>>1461457
Просто попробуем все и оставим тот, на котором точность выше. Так обучают нейронки в проде все мои знакомые.

Аноним 26/08/19 Пнд 21:28:28 №1461465175

>>1461273
Ну да, только чем программирование и МЛ становиться общедоступнее, тем это все "понимание" уходит на второй план и все меньше требуется, тк всем этим занимаются пару процентов людей для МЛ фреймворков и гайдов.

Аноним 26/08/19 Пнд 21:57:59 №1461478176

>>1461322
Ну ищи замкнутые контуры, в любом случае овал с текстом ничем от ебла твоего пиздоглаза теоретически не отличается. Хотя если размер области фиксирован, есть определенные типографические отступы текста и прочие признаки, можешь сиграть на них.

Аноним 26/08/19 Пнд 22:52:45 №1461503177

Господа, прошу помогите. Пробую выборку из ~2k записей с 6-ю параметрами - кластеризировать но мозгов не хватает, но увы на выходе из стандартного kmeans получаю 99% записей в одном кластере. В машобе - я практически полный 0, пожалуйста подскажите rкуда копать чтобы вникнуть и решить задачу.

Аноним 26/08/19 Пнд 23:38:21 №1461535178

>>1461503
Я понял, я не нормализировал данные.

Аноним 26/08/19 Пнд 23:40:30 №1461536179

>>1461478
Ну сами бабблы бывают разными, размер текста в них может иметь разные размеры, отступы от края у шрифта могут быть разными.
Мне лучше посмотреть на свертьчную сеть какую или дальше с opencv ебаться?

Аноним 26/08/19 Пнд 23:40:34 №1461537180

>>1461503
https://m.habr.com/ru/post/456282/
Не знаю, по каким критериям ты кластеризацию делаешь, но посмотри сначала, как твои данные вообще лежат в пространстве.

Аноним 27/08/19 Втр 00:26:27 №1461545181

Как вообще "грокаем глубокое обучение" для нюфагов? Осилил примерно пол книжки пока, в целом понятно и совсем примитивную сетку-то вроде даже бахнуть могу, но такое ощущение, будто там прямо супербазовые знания даются только.

Аноним 27/08/19 Втр 01:22:39 №1461553182

>>1461536
>Мне лучше посмотреть на свертьчную сеть какую или дальше с opencv ебаться?
С чем не ебись, адекватного решения не будет.

Аноним 27/08/19 Втр 05:05:07 №1461581183

>>1461536
Попробуй файнридер

Аноним 27/08/19 Втр 05:10:54 №1461582184

>>1461545
грокаем алгоритмы вводная книга, вангую что грокаем нейросети тоже вводная

Аноним 27/08/19 Втр 07:58:28 №1461627185

>>1461457
Всегда Adam, ёпта. А если хуёво работает, то Adam + lr decay.

Аноним 27/08/19 Втр 08:02:22 №1461628186

>>1461333
Unet semantic segmentation.

Только тебе придётся ручками понаразмечать какое-то количество данных.

Аноним 27/08/19 Втр 11:14:37 №1461711187

>>1461628
Хм, получается, что фото лучше будет тогда подготовить, ведь многообразие кандзи может смутить нейроночку.
Может через какой фильтр прогнать, чтобы текст просто слипся или не стоит?

Аноним 27/08/19 Втр 11:21:15 №1461715188

>>1461711
При достаточном количестве данных не смутит. Нейроночки значительно умнее, чем ты думаешь (при достаточном количестве данных и правильном препроцессинге).

Аноним 27/08/19 Втр 13:33:48 №1461786189

>>1461715
А достаточное - это сколько? Сотня, тысяча, десять тысяч, сто тысяч, миллион?

Аноним 27/08/19 Втр 13:45:56 №1461797190

>>1461786
Количество параметров х 10 = количество примеров в training set

Аноним 27/08/19 Втр 13:54:47 №1461808191

>>1461503
Сначала посмотреть нужно, может у тебя и должно всё в одном кластере лежать. PCAем прогони, посмотри.

Аноним 27/08/19 Втр 15:21:52 №1461870192

>>1459871
Ты чё ебень? Там серьезный ресерч для целых команд. Как ты собрался собирать state of the art модель в одиночку за неделю и не зная даже половины необходимой математики?

Аноним 27/08/19 Втр 15:41:38 №1461880193

>>1459659

Как показывает опыт знакомого:
1. Много дерьма от контор где 15-20 сотрудников. 60% ищут с почасовой оплатой где с тебя будут соки жать и педантично считать каждую минуту. Будешь сперва искать зависимости\закономерности в их говне, потом от тебя потребуют доработать их аналитику. Потом начнется дрочь, что предыдущие пункты - не МЛ, и по другому оплачиваются. Остальные, ищут того кто сможет собрать раму после ушедшего с проекта МЛщика.
2. Конторы поприличнее штатом - обычно фриланс не ищут, куча рисков и корпоративного говна. Даже если найдешь - скорее всего будешь работать на перспективу устроится к ним.

Готовься просрать кучу нервов и времени на трёп который тебе никто не оплатит. И еще дохуя времени на дрочь с фриланс аккаунтом.

Аноним 27/08/19 Втр 16:22:02 №1461898194

>>1459871
Ну и как, много контестов выиграл?

Аноним 27/08/19 Втр 16:42:49 №1461917195

мне вот интересно, очевидно что знание прогноза будущего влияет на само будущее, это еще древние греки знали см. хотя бы историю эдипа, называется самоисполняющееся пророчество, а принимают ли во внимание все эти бесчисленные попытки предсказания будущих цен влияние самих предсказаний на цены, что кто-то будет покупать например на основе этих предсказаний и это взвинтит цены и т.д.

Аноним 27/08/19 Втр 17:02:14 №1461928196

156672167416718[...].jpg (99Кб, 564x789)

>>1461917
>очевидно
Кому?
>древние греки
Ебали друг друга в жопы, кроме этого распиаренного говна была куча выдающихся цивилизаций
>предсказания будущих цен
У трейдеров есть чуйка, приходящая с опытом, впрочем как и в любой сфере, которая не формализуется, это загадки интеллекта.

Аноним 27/08/19 Втр 17:06:36 №1461930197

>>1461917
Число людей, которые изменяют свое поведение и вообще следят за финансовым рынком -- статистическая погрешность в сравнении с количеством людей и факторов, которые влияют и составляют экономику и биржу валют.

Аноним 27/08/19 Втр 17:07:21 №1461931198

>>1461930
Добавлю: прогноз погоды не влияет на погоду

Аноним 27/08/19 Втр 17:09:40 №1461932199

>>1461930
ну это пока
хотя и сейчас не верно если взять какой-нибудь небольшой рынок

Аноним 27/08/19 Втр 17:14:34 №1461937200

>>1461932
>ну это пока

Нет

Аноним 27/08/19 Втр 17:20:36 №1461941201

156493199322552[...].jpg (231Кб, 1280x789)

>>1461931
Ты не совсем прав, есть самосбывающиеся предсказания, когда например куча роботов висит на каком то индикаторе тренда, очивидно что они сработают при определенных условиях

Аноним 27/08/19 Втр 17:28:02 №1461946202

>>1461941
Как это связано с тем, что я сказал о погоде?
Я не знаю абсолютно ничего о том, какой процент этих ботов могут синхронизировано на что-то повлиять, насколько это зависит от политики стран и брокеров от разных компаний.
Так нахуя тут разспрягать если ни я ни ты оба, скорее всего, нихуя не экономисты?

Аноним 27/08/19 Втр 17:33:55 №1461949203

>>1461946
>если ни я ни ты оба
Ну я торговал на фондовом, а ты нет.
>что я сказал о погоде
Прилетят самолеты и распылят серебро перед праздником.

Аноним 27/08/19 Втр 17:49:51 №1461958204

>>1461946
> Как это связано с тем, что я сказал о погоде?
Причем тут вообще погода, ты не видишь разницы между рынком и погодой, ты зумер что ли?

Аноним 27/08/19 Втр 17:56:04 №1461962205

>>1461917
> принимают ли во внимание все эти бесчисленные попытки предсказания будущих цен влияние самих предсказаний на цены, что кто-то будет покупать например на основе этих предсказаний и это взвинтит цены и т.д.
Очевидно, что крупные игроки или слишком хитрые умники могут намеренно делать что-то такое. Была же история, как много лет курс битка по-сути управлялись двумя хз чьими ботами. Там какая-то схема была с массовым размещением buy и sell ордеров, которые не исполнялись, но влияли на разворот курса. Кто-то очень умный на этой хуйне неизвестное количество бабла поднял, т.к схема работала годами и позволяла манипулировать курсом.

Аноним 27/08/19 Втр 18:19:42 №1461978206

>>1461962
>могут намеренно делать
Лол, в этом и смысл срыночка

Аноним 27/08/19 Втр 18:20:04 №1461980207

faceSkillzProgF[...].png (1985Кб, 1122x1570)

>>1461870
> кукагл
> сирьозный рисерч
> кукагл
> стейт оф зи арт))

Аноним 27/08/19 Втр 21:03:45 №1462103208

>>1461928
>У трейдеров есть чуйка
Охуеть, блять, чуйка. Поешь говна. Зачем ты приводишь пример если ничего не знаешь по теме из которой берёшь его?

Аноним 27/08/19 Втр 21:06:19 №1462105209

>>1461980
А хули нет то? Платят много, так как компаниям очень выгодно наебывать студентов. Соревнующихся сотни, а значит там наверняка есть люди умнее тебя.

Аноним 27/08/19 Втр 21:30:09 №1462126210

00574789.n11000[...].jpg (67Кб, 1000x1000)

Не уверен, что это правильный тред для таких вопросов, но ничего более подходящего не нашёл.
Передо мной стоит задача, подразумевающая распознание очень экзотических образов на изображениях, и последующий анализ свойств этих образов. Со своей задачкой я хочу по итогу разобраться сам, поэтому приведу здесь эквивалентный пример и попрошу вас подсказать, хотя бы в какую сторону смотреть.

Представьте, что на вход вам приходят подобные изображения (только без вотермарок). Камера всегда сверху, фон всегда чистый, сосиски могут лежать как угодно (под любым углом относительно камеры, других сосисок и тд).
Задача - распознать все образы (сосиски) и, проанализировать некоторые их свойства, которые можно извлечь из каждого отдельного образа (допустим, длину и отклонение от "эталонной сосиски", которая прописана где-то в сеттингах).

Я от подобных задачек и вообще от этой сферы очень далёк, ещё не смог подружить своё мышление с тем, как обычно решают подобные задачки. Не могли бы вы подсказать мне, в какую сторону вообще смотреть, если я хочу решить подобную штуку. Всем заранее большое спасибо.

Аноним 27/08/19 Втр 22:25:48 №1462151211

>>1462126
https://m.habr.com/ru/company/oleg-bunin/blog/455650/

Аноним 27/08/19 Втр 23:34:29 №1462173212

>>1462105
Ты о каггле первый раз только из пиздежа в треде ведь услышал, верно?

Аноним 28/08/19 Срд 01:14:01 №1462207213

>>1461946
хз почему ты вообще что-то сказал про погоду
погода не зависит от людей а цены на товары зависят
и рынок особенно локальный для многих товаров весьма мелкий

Аноним 28/08/19 Срд 02:04:14 №1462217214

>>1462103
>Охуеть, блять, чуйка
Охуей, клоун. Давай, расскажи о алгоритмической торговле и граалях.

Аноним 28/08/19 Срд 02:08:17 №1462220215

>>1462126
>Камера всегда сверху, фон всегда чистый, сосиски могут лежать как угодно (под любым углом относительно камеры, других сосисок и тд).
OpenCV, давно был бугурт на их форуме когда детали с транспортерной ленты распознавали, более менее, в отличии от нейроговна.

Аноним 28/08/19 Срд 02:11:19 №1462221216

>>1462151
>На КДПВ фотография шурупа, а определено как болт.
Швабр для пидоров

Аноним 28/08/19 Срд 02:20:01 №1462222217

>>1462217
да вы вообще не о том

просто пример - нейросетка предсказала тебе что картошка будет дешевая в россии допустим в последнюю неделю августа, ты начал закупаться, но такое же предсказание получило еще тысяча человек картофельных трейдеров, половина всех картофельных оптовиков россии условно, и все они побежали закупаться и в итоге цена картошки вместо падения выросла

с развитием популярности нейросетей подобное наверняка будет сплошь и рядом

Аноним 28/08/19 Срд 03:19:51 №1462231218

>>1461949
>ты не экономист
>я торговал на фондовом

Мхех...

Аноним 28/08/19 Срд 03:20:41 №1462232219

>>1461958
В мировом масштабе для меня как для субъекта влияния на этот объект почти нет.

Аноним 28/08/19 Срд 07:16:16 №1462266220

>>1462220
Всё, что я находил по "OpenCV object detection", опиралось на нейронки под капотом, и распознавало в основном объекты типа машин и котов - то, что есть в стандартных датасетах. Не мог бы ты подсказать, на что смотреть? А то модулей у него немало, я пока не смог найти ни отвечающий за подобные вещи модуль в доке, ни обучающую литературу, которая рассматривает подобные штуки.
>>1462151
Да, выглядит до смешного похоже на мою задачу. Если я решу пойти по этому пути, то мне надо будет обучать нейронку и, раз объекта нету в публичных датасетах, самому собрать датасет с моими объектами?

Аноним 28/08/19 Срд 07:55:10 №1462273221

>>1462232
> В мировом масштабе для меня как для субъекта влияния на этот объект почти нет.
Речь об обсуждаемых системах. Причем тут ты вообще? Сейчас бы какой-то зумер на что-то влиял.

Аноним 28/08/19 Срд 08:34:12 №1462289222

>>1462222
>но такое же предсказание получило еще тысяча человек картофельных трейдеров
Ну так те кто зарабаитвает уйдут в шот, лол. А во втопых, никтотв здпавом смысле на нейронки не будет полагаться.

Аноним 28/08/19 Срд 08:35:28 №1462290223

>>1462231
>экономист
Теперь расскажи нам, что экономика это наука, а не магия и пиздабольство.

Аноним 28/08/19 Срд 08:41:14 №1462295224

>>1462289
те кто уйдут в шорт разорятся
интересно будет когда предсказание начнет учитывать эффект самого предсказания...

Аноним 28/08/19 Срд 11:19:02 №1462403225

>>1462222
>>1462295
Сейчас уже большая часть трейдеров - роботы. Но это алгоритмы на крестах, которые навариваются на скальпировании.

Аноним 28/08/19 Срд 11:42:15 №1462414226

>>1462126
>Передо мной стоит задача, подразумевающая распознание очень экзотических образов на изображениях, и последующий анализ свойств этих образов.
В сосисках на производстве нихуя экзотического нет.
>сосиски могут лежать как угодно
Друг на друге лежать могут?

Если нет, то задача сводится к выделению связных регионов и фильтрации этих регионов по каким-то вручную подобранным критериям.

Нужно подобрать такой цвет и направление подсветки, чтобы контраст твоих сосисек был максимальным. Вообще программисты часто недооценивают то насколько физика может упростить жизнь.

Затем нужно подобрать преобразование цветное изображение -> black and white (не grayscale, а black and white), где черному будет соответствать положение "нет сосиски", а белому - есть.

Например, если без векторизации (вдруг ты матлаба не знаешь), по тупому и применять фильтрацию по цвету, то выбираешь усредненный цвет сосиски, вручную или статистическим образом, и делаешь следующее

color_sosiski_r = 255;
color_sosiski_g = 20;
color_sosiski_b = 40;

for (int i = строки)
for (int j = столбцы) {
kartinka[j][r] = sqrt((color_sosiski_r - kartinka[j][r])^2 + (color_sosiski_g - kartinka[j][g])^2 + (color_sosiski_b - kartinka[j])^2)
kartinka[j][g] = 0;
kartinka[j] = 0;
}

Таким образом ты получишь изображение того как цвет картинки отклоняется от некоторого базового цвета. Затем сравниваешь это с вручную заданным порогом:

for (int i = строки)
for (int j = столбцы) {
kartinka[j][r] = kartinka[j][r] < THRESH ? 1 : 0;
}

Ты получил бинарное изображение. Применяешь к нему дилатацию несколько раз, чтобы съест узлы межу сосисками, чтобы они стали отдельными фигурами. Теперь можно применять алгоритмы region properties. Пиздуешь сюда https://docs.opencv.org/3.1.0/d1/d32/tutorial_py_contour_properties.html https://docs.opencv.org/trunk/dd/d49/tutorial_py_contour_features.html и получаешь список свойств регионов (хотя для прототипизации матлабовский regionprops удобнее и вообще вся задача решается несколькими строками на матлабе). Отсеиваешь заведомо хуевые регионы, например, по площади (10 пикселей это мусор а не сосиска)), по вытянутости эллипса и т. п.

Что касается ML,
Вместо первого этапа отсеивания по цвету можно применить сегментирующую нейронку.
Вместо последнего этапа можно получить все возможные region properties у сегментов и скормить разного рода ML-вычисляторам.
В целом нужно начинать с мануального дизайна и, если задача не выполняется, добавлять ML.

Аноним 28/08/19 Срд 11:59:41 №1462429227

>>1461917
>а принимают ли во внимание все эти бесчисленные попытки предсказания будущих цен влияние самих предсказаний на цены
Конечно, теханализ он в принципе об этом. Если бы на цену влияли только фундаментальные факторы, никакого теханализа не существовало бы.

Аноним 28/08/19 Срд 12:00:35 №1462431228

>>1462414
Не проще диплернинх ебануть? Негров или котов на необработанных фотках распознает, значит и сосиски сможет.

Аноним 28/08/19 Срд 12:06:38 №1462441229

>>1462431
Прочитай последний абзац. UNet сможет сегментировать сосиски вместо ручного сравнения отклонения цвета, но это только часть пайплайна. Следующую часть пайплайна (выделение разного рода свойств сосисек) тоже можно сделать на нейронках, но лично я не знаю, насколько хорошо будет работать какой-нибудь измеритель длины сосиски который на вход получает изображение ее длины. Скорее всего хуево. А на базе классического алгоритма можно запилить что попроще.
Если нужно было бы тупо посчитать число сосисек, то да, object detection сетка бы справилась end-to-end.

Аноним 28/08/19 Срд 12:59:57 №1462482230

>>1462441
Ну можно при обучении модели сразу задать несколько классов по длине сосисок - maly_sosiska, norm_sosiska, bolshoi_sosiska, oche_bolshoi_sosiska. И по форме, и нормальная, кривая, сломанная.

Аноним 28/08/19 Срд 13:35:11 №1462516231

>>1462482
А ты точно только сосиски классифицируешь?

Аноним 28/08/19 Срд 15:11:35 №1462610232

>>1462516
Знаем какие сосиски он классифицирует, хихи

Аноним 28/08/19 Срд 15:22:23 №1462624233

>>1462414
Спасибо, ты мне дал очень дельную пищу для размышлений. Сразу оговорюсь, что >>1462431 и >>1462482 - не я.

Да, сосиски могут лежать друг на друге и это меня очень сильно смущает. Есть ли у тебя идеи, как можно бороться с подобным?

Классифицирую я далеко не сосиски, свойства у них будут гораздо сложнее. Но все необходимые свойства содержатся внутри каждого образа каждой конкретной сосиски и я предполагаю, что смогу работать с каждой сосиской отдельно, после того как их выделю. Это тоже важный вопрос - как считаешь, насколько безопасно на это надеяться?

По поводу сниппета, который ты предоставил выше:
в теле цикла ты не упустил обращение к ключу? Типа, kartinka[j][r] вместо kartinka[j][r]. Речь ведь идёт о попиксельном обходе изображения?

Очень признателен за такой подробный ответ, сильно благодарен и буду очень рад, если ты ответишь на мои вопросы.

Аноним 28/08/19 Срд 16:42:23 №1462673234

proxy.duckduckg[...].png (564Кб, 768x461)

>>1462624
>Да, сосиски могут лежать друг на друге и это меня очень сильно смущает. Есть ли у тебя идеи, как можно бороться с подобным?
Проще всего взять нейронку. Посмотри на пикрелейтед, люди перекрывают друг друга, но детектируется оно более-менее нормально.
Берешь какую-нибудь готовую архитектуру для object detection, тренируешь ее на нескольких тысячах фотографий с перекрывающимися сосисками, и вперед.

Классические алгоритмы тоже можно придумать, например, детектировать концы сосисек (например, виолой-джонсом), соединять подходящие пары концов. Правда сосиски могут перекрывать и концы друг друга... Не, нейронка надежнее.

>я предполагаю, что смогу работать с каждой сосиской отдельно, после того как их выделю
Если они друг на друге лежат, не знаю. Может это вообще 2 короткие сосиски под одной длинной.

Можно поставить 2 камеры и получать облако точек из их паралакса, либо из паралакса между 2 кадрами видео. Имея облако точек, можно матчить эти точки с эталоном прямо в 3д.

>По поводу сниппета, который ты предоставил выше: в теле цикла ты не упустил обращение к ключу? Типа, kartinka[j][r] вместо kartinka[j][r]. Речь ведь идёт о попиксельном обходе изображения?

Ну да, Должно быть kartinka[j][r], мол, конкретный пиксель, его красный канал.

Аноним 28/08/19 Срд 16:58:16 №1462683235

>>1462673
>Ну да, Должно быть kartinka[j][r], мол, конкретный пиксель, его красный канал.
А, ну да, разметка съела i.

По остальному - ты дал мне кучу простора для исследований, спасибо тебе большое за это! Думаю, уже смогу как минимум начать двигаться в правильном направлении.

Аноним 28/08/19 Срд 19:25:27 №1462747236

>>1460713
нет

Аноним 28/08/19 Срд 19:30:53 №1462751237

>>1461503
Надеюсь, ты PlayerID убираешь перед тренировкой?

Аноним 28/08/19 Срд 21:01:24 №1462801238

>>1461797
Я таки решил, что это излишне, можно попробовать стандартными методами попробовать реализовать
Хотя нейроночка тоже должна находить контуры, только вот с таким будет проблемно.

Аноним 28/08/19 Срд 21:16:05 №1462809239

>>1461537
>>1461808
Дельные предложения, спасибо. Сейчас проверю.
>>1462751
Конечно.

Аноним 29/08/19 Чтв 00:38:56 №1462934240

>>1461537
>>1461808
>>1462751
Вообщем, нормализовал и всё гуд.

Аноним 29/08/19 Чтв 00:57:58 №1462942241

>>1462934
Ну как сказать.
Хуйня какая-то.

Аноним 29/08/19 Чтв 01:10:51 №1462949242

>>1462942
В принципе чтобы ответить на вопрос задачи о выделении кластеров\класов из данных и их описании, считаю нужно преобразовать обратно из Z, вывести среднее по меткам кластеров и у нас типа есть описание класса. Но это я так думаю, по-этому реквестирую как вывести в R много графиков - комбинации всех переменных.

Аноним 29/08/19 Чтв 01:18:34 №1462951243

>>1461281
>Мне нужно научиться экстрактить текст из комиксов, только каждый раз прога посылает меня нахуй, я уже не понимаю, какие фильтры нужно применять и как можно отсеивать ненужное.
Обрабатываешь изображение (немного размытия, и бинаризация), извлекаешь из получившийся картинки контуры текстовых рамок. Фильтруешь их по площади. Дальше ищешь пары, где контур в контуре, и выкидываешь внешние (это как правило всякие рамки сцен, а не текста). Потом берешь оставшиеся контуры и используешь их как маску для извлечения текста. Уже на этом этапе получишь точность под 90%. Если хочешь больше - фильтруй уже текст, используя анализ связанных компонентов. Убираешь слишком маленькие и слишком большые - получаешь точность 95%. Если хочешь еще больше, можешь посчитать центроиды букв и анализировать из расположение.

Если все сделаешь правильно, получишь 99% точность без всякого нейроговна .

Аноним 29/08/19 Чтв 02:15:39 №1462961244

>>1461503
>>1462934
>>1462949
Лол, родина дала тысячи алгоритмов для такого, тем более в R, где есть вещи, которых больше вообще нигде нет, нит не хочу, хочу KNN содомировать. Кто сказал, что конкретно этот датасет вообще кластеры содержит? Если априори известно, что там два класса, не проще SVM попробовать? Если же структура неизвестна и хз что там и как, тогда лучше SOM. И так далее.

Аноним 29/08/19 Чтв 02:21:45 №1462962245

>>1462961
Об этом датасете вообще нихуя не известно и цель задачи - класифицировать его. Пойду почитаю о SVM\SOM. Спасибо.

Аноним 29/08/19 Чтв 06:32:12 №1462991246

>>1462951
Вот характерный признак петушиного диванного поста - слово нейроговно. Если видишь его, значит петух 100% нихуя не понимает ни в нейронках, ни в классическом CV. Сука "извлекаешь из получившийся картинки контуры текстовых рамок". В этой фразе лежит AI, который сложнее изначальной задачи.

С точки зрения классики, иероглифы являются весьма специфическими объектами со специфическим наобором фич. Искать нужно их, а не контуры, которые в манге могут быть какими угодно и даже отсутствовать. Соответственно, тебе нужен классификатор, которой по маске типа 32х32 выдаст, есть ли в нем иероглиф, либо нет. Затем ты бьешь свою картинку на блоки 32х32 с 50% перекрытием и скармливаешь каждый блок этому классификатору. Получишь в итоге бинарную маску - есть ли в блоке иероглиф, либо нет. К этой маске применяешь дилатацию. Получаешь блоки с текстом, вокруг которых через region properties можно обвести квадраты, если очень нужно.

Легко видеть, что это сильно упрощенный пайплайн object detection нейросети. Так оно и есть. Поэтому, если ограничений на скорость нет, нужно брать нейронку и херачить end-to-end либо сегментацию либо object detection.

Аноним 29/08/19 Чтв 07:45:02 №1463001247

>>1462991
>Сука "извлекаешь из получившийся картинки контуры текстовых рамок". В этой фразе лежит AI, который сложнее изначальной задачи.
Контуры ищутся классическими алгоритмами без AI. По поводу текстовых рамок я не до конца объяснил. Извлекать надо все контуры, а потом уже фильтровать. Из тысяч контуров после выборки по площади остаются несколько десятков, половина из которых - рамки текста.
>С точки зрения классики, иероглифы являются весьма специфическими объектами со специфическим наобором фич. Искать нужно их, а не контуры, которые в манге могут быть какими угодно и даже отсутствовать.
Только эти фичи можно распознать исключительно нейронкой, которую ты не сможешь натренировать из-за отсутствия датасета. Удачи размечать руками 100к+ картинок.
>Соответственно, тебе нужен классификатор, которой по маске типа 32х32 выдаст, есть ли в нем иероглиф, либо нет. Затем ты бьешь свою картинку на блоки 32х32 с 50% перекрытием и скармливаешь каждый блок этому классификатору. Получишь в итоге бинарную маску - есть ли в блоке иероглиф, либо нет. К этой маске применяешь дилатацию. Получаешь блоки с текстом, вокруг которых через region properties можно обвести квадраты, если очень нужно.
Еще раз - у тебя нет данных. Даже если ты автоматически сгенеришь сами иероглифы, ты не сможешь сгенерить нормальные нормальные примеры их отсутствия. Твой классификатор обосрется на реальной задаче, поскольку он не видел каких-нибудь кустиков, и считает их иероглифами.

Аноним 29/08/19 Чтв 08:15:30 №1463007248

>>1463001
>после выборки по площади
В манге площадь может отличаться от небольшого слова до огромного баллона в полстраницы. Фильтрация по площади хороша для отсева всякого мелкого мусора, но не здесь.
Алгоритмы выделения контуров просто выделяют контуры в растровом изображении, они их не векторизуют, а векторизация вылезет тебе в отдельный геморрой, при чем в результате у тебя будут не тысячи контуров, там будет комбинаторный взрыв нахуй.
Более того, твой первый этап (немного размытия и бинаризация) требует AI, например, для выбора порога бинаризации. Потому что с неправильным порогом оно будет выглядеть как пикрелейтед в посте >>1461281.
А контраст этих баблов относительно изображения может быть каким угодно, при чем даже в пределах одной манги. Они могут вообще отсутствовать.
>половина из которых - рамки текста.
Точность 50% вообще никуда не годится
>Только эти фичи можно распознать исключительно нейронкой, которую ты не сможешь натренировать из-за отсутствия датасета.
Как же файнридер прямоугольники с текстом искал в 2002 году? Вот здесь как раз можно написать бы о том, что классификатор 32х32, который отвечает на вопрос, есть ли внутри иероглиф, можно захуячить на чем угодно, а ты пишешь о том, что исключительно нейронкой.
>Удачи размечать руками 100к+ картинок.
Какие 100к+ картинок, древний alexnet учится распознавать котов по 1000 примеров без аугментации. Взять паинт и разметить текст в 10к баллонов из манги можно за несколько часов, потому что закрасить кисточкой текст внутри сложности не представляет. Если самому лень, анон в воркаче это сделает по цене пиццы с доставкой.
Другой вопрос, что пилить собственный OCR в 2019 году так себе идея. Собственно поэтому я вопрос этого анона игнорил, он страдает какой-то хуйней.
>Твой классификатор обосрется на реальной задаче, поскольку он не видел каких-нибудь кустиков, и считает их иероглифами.
Это не страшно, потому что иероглифы будут образовывать кластеры на маске сегментации, а кустики нет. Здесь как раз фильтрация по площади, прямоугольности, эллипсоидности и т. п. пригодится.

Аноним 29/08/19 Чтв 09:15:24 №1463028249

>>1463007
>Другой вопрос, что пилить собственный OCR в 2019 году так себе идея. Собственно поэтому я вопрос этого анона игнорил, он страдает какой-то хуйней.
Я пилю не OCR, а делаю препроцессинг для OCR.
Например, я сделал алгоритм для вырезания фуриганы, с чем ни одна OCR по умолчанию не справляется, есть еще алгоритмы, с помощью которых можно по нажатию клавиши на баббл находить текст.

Аноним 29/08/19 Чтв 09:16:52 №1463030250

>>1463028
Гуглу, тащемта, можно скормить половину страницы и он даже справится с бабблами.
Но бывают ошибки и он не распознает текст в баббле, бывает, что он рандомную закорючку принимает за текст.

Аноним 29/08/19 Чтв 11:05:08 №1463070251

>>1462961
>KNN содомировать
>не проще SVM
>кластеризация
И вот таких вот знатоков полон тред лол.

Аноним 29/08/19 Чтв 11:10:56 №1463072252

>>1462949
Попробуй другие алгоритмы кластеризации же, ну.
У тебя на первый взгляд достаточно аутлаеров, какой-нибудь алгоритм иерархической кластеризации наверное зайдёт или dbscan.

Аноним 29/08/19 Чтв 11:15:50 №1463073253

>>1463070
Ну давай, знаток, расскажи, сколько кластеров для KNN задать, если неизвестно, есть ли они вообще в данных. У вас, зумеров, с диплернинха мозги отсырели. Хотя бы просто посмотреть, что там есть в данных - PCA, проекция Сэммона, SOM, не, не слышали.

Аноним 29/08/19 Чтв 11:27:24 №1463079254

>>1463073
>диплернинх
А, всё понятно.

Аноним 29/08/19 Чтв 12:02:21 №1463097255

Может кто-нибудь пояснить кое-что по этой картинке? Собсна атеншн-хуеншн и всё такое ясно, но есть проблема. В итоге то все эмбендинги суммируются с выходом атеншона и в тем самым проебываются безвозвратно и на прямую само слово вообще нихуя не влияет на выход. Это как вообще?

Аноним 29/08/19 Чтв 12:05:45 №1463100256

>>1463073
KNN лучшее решение проблемы кластеризации. Ничего ты с этим не поделаешь.

Аноним 29/08/19 Чтв 12:11:59 №1463101257

>>1463100
> KNN лучшее решение проблемы кластеризации.
Во-первых, не лучшее. Есть полно простейших примеров, на которых он работает как говно, например, несферические кластеры или даже хуй с вами, сферические, но перекрывающиеся, т.н "проблема Микки мауса". Во-вторых, сто раз уже написал, с чего вы взяли, что в этом датасете данные вообще образуют кластеры? Про более сложные варианты вообще молчу. Хуета из-под кота ваш кнн, давно и официально.

Аноним 29/08/19 Чтв 12:13:21 №1463102258

>>1463100
>>1463073
K-means, долбоёбы.

Аноним 29/08/19 Чтв 12:30:17 №1463118259

>>1463030
У гугла задача распознавать всё включая меню в ресторане и банки с кофе. Натренировать сетку чисто на отсканеную мангу намного проще.

Аноним 29/08/19 Чтв 12:33:05 №1463120260

>>1463070
>И вот таких вот знатоков полон тред лол.
Правильнее написать: и вот таким вот знатоком полон тред лол.
Он у мамы уникальный.

Аноним 29/08/19 Чтв 12:40:00 №1463125261

>>1463097
>В итоге то все эмбендинги суммируются с выходом атеншона и в тем самым проебываются безвозвратно
У тебя когда внимание направлено на объект Х, информация об объекте У тоже проебывается. В этом суть внимания, отсечь лишнюю инфу.

Аноним 29/08/19 Чтв 12:41:54 №1463129262

>>1463073
>называет kNN алгоритмом кластеризации
>кукареку зумеры кукареку диплернинх кукареку SOM ФУЗЗИЛОДЖИК А ВОТ В 1922 ДИДЫ ВСЕ УЖЕ ПРИДУМАЛИ
Вся суть нечеткого петуха

Аноним 29/08/19 Чтв 12:46:52 №1463131263

>>1463097
На выходе энкодера - имбеддинги слов в контексте остальных слов (2D-объект).

Нна выходе трансформера веротности для следующего слова с учетом всех имбеддингов входа и всех имбеддингов уже сгенерированного выхода.

Аноним 29/08/19 Чтв 12:52:53 №1463133264

>>1463097
http://jalammar.github.io/illustrated-transformer/

Аноним 29/08/19 Чтв 13:15:02 №1463144265

>>1463131
Там на выходе контекст+эмбендинги пропущенные через ещё один слой. Самого слова там нет.
>>1463125
Не не не. Тут ведь эмбендинги вообще не идут на вход. В чем ебучий смысл? В атеншоне должна вроде отсекаться ненужная информация, а не вся информация. Определить слово во входе никак не возможно кроме как эмпирически подобрать каждую комбинацию слов, то есть слово проебалось, а это для всех слов, значит все слова проебались. Смысловое значение вообще у данного выхода должно отсутствовать.

То есть если мы возьмём фразу, то выход для конкретного слова будет что-то вроде грамматического значения слова. Затем мы берём эмбендинги и добавляем их, тотально уничтожая значение атеншена и самих эмбендингов.

Аноним 29/08/19 Чтв 13:48:01 №1463161266

>>1463101
По результату дискаса, какие подходы кластеризации\класификации мне стоит попробовать вообще. Назовите пожалуйста. Задача так и стоит - найти классифицировать датасет, если там что-то найдётся - описать классы.

Аноним 29/08/19 Чтв 13:50:27 №1463162267

>>1463161
auto-sklearn

Аноним 29/08/19 Чтв 13:57:14 №1463170268

>>1463161
Для начала SOM. Общий вид, например u-matrix + компонентные плоскости. Если в данных есть какая-то структура, уже этого хватит, чтобы описать датасет и прикинуть, что можно сделать ещё.

Аноним 29/08/19 Чтв 14:11:36 №1463177269

>>1463170
Ты подписывайся сразу: путаю knn и kmeans

Аноним 29/08/19 Чтв 14:34:17 №1463186270

>>1463177
> knn и kmeans

Аноним 29/08/19 Чтв 15:15:06 №1463209271

>>1463144
http://jalammar.github.io/images/t/transformer_decoding_1.gif
Смотри картинку, дурашка!

На выходе энкодера для каждого слова имбеддинги K и V, если не веришь картиночке - читай код какой-нибудь из реализаций трансформера на keras/tf/pytorch.

Аноним 29/08/19 Чтв 15:24:27 №1463212272

>>1463209
Фид форвард в инкодере на самом деле - TimeDistributed(Dense(...))

Аноним 29/08/19 Чтв 15:26:37 №1463214273

>>1463209
Эмбендинг на входе. На выход влияют только другие слова и дот продукт других слов и этого слова. Так, блять, везде написано. На картинке хуйня, там не показывается что происходит в блоках.

Аноним 29/08/19 Чтв 15:32:07 №1463215274

>>1463144
https://github.com/Lsdefine/attention-is-all-you-need-keras/blob/master/transformer.py#L65

Аноним 29/08/19 Чтв 15:33:07 №1463216275

>>1463214
На выход влияют только другие слова и дот продукт других слов и этого слова.

Это называется "Глубокий имбеддинг", дипленинх же!

Аноним 29/08/19 Чтв 15:37:36 №1463218276

>>1463216
Так самого то слова нихуя нет!

Аноним 29/08/19 Чтв 15:38:50 №1463220277

>>1463215
Я не понимаю что написано, блять в одной строчке, в которой даже аргументы не вызваны.

Аноним 29/08/19 Чтв 15:56:24 №1463226278

>>1463220
Это конструктор конструктора. Сам инкодер собирается через __call__ вот тут https://github.com/Lsdefine/attention-is-all-you-need-keras/blob/master/transformer.py#L434

Обычно в керасе ты делаешь так:
y = Dense(...)(x)

А тут делается так:
l = Dense(...) #Вызывается __init__
а потом в другом месте:
y = l(x)#Вызывается __call__

Аноним 29/08/19 Чтв 16:13:19 №1463230279

>>1463226
Всё равно не понял что ты хочешь сказать.

Аноним 29/08/19 Чтв 18:31:13 №1463350280

Сап, двач.Хочу написать свою реализацию алгоритмов машинного обучения(линрег,логрег,деревья,RF,knn).Стоит ли вообще этим заниматься?Если да, то посоветуй что-нибудь для начала.В интернете ничего найти не могу по поводу простой реализации линейной регрессии.Можете посоветовать место, где эти алгоритмы реализованы?
(реализация sklearn мне непонятна, можете посоветовать, что навернуть, чтобы понять)

Аноним 29/08/19 Чтв 18:32:02 №1463351281

Почему ошибка не уменьшается с самого начала?

Аноним 29/08/19 Чтв 18:44:05 №1463360282

Пожалуйста помогите, в разных задачах мла вы выбираете модель основываясь на опыте или просто рандомно перебираете модели? Пригодилось ли знание матана модели? Проще говоря откуда вы знаете какую модельку выбрать?

Аноним 29/08/19 Чтв 21:24:08 №1463455283

faceKindaCreepy[...].jpg (105Кб, 647x664)

ТрдSciKindaMath[...].png (276Кб, 1762x974)

>>1463102
>>1463120
>>1463177
>>1463186
Проиграл, пиздец.
Добавьте в шапку следующего треда.

Аноним 29/08/19 Чтв 21:30:22 №1463465284

>>1463455
Я так-то ОП вопроса, но я правда не понял, почему они о кнн постоянно писали.

Аноним 29/08/19 Чтв 21:43:15 №1463489285

Dd4xrxrUQAAuXSm[...].jpg (158Кб, 1155x1200)

>>1463465

Аноним 29/08/19 Чтв 21:45:52 №1463493286

кнн - кун не нужен же популярное сочетание на dev

Аноним 29/08/19 Чтв 22:27:49 №1463526287

>>1463465
Меня на собесе тоже недавно спрашивали в чём разница мекжду кнн и кминсом. Совпадение? Или есть какая-то связь?

Аноним 29/08/19 Чтв 23:43:34 №1463553288

Воронцов оч сложно пишет, что читать для понимания матана методов обучения?

Аноним 30/08/19 Птн 05:01:28 №1463608289

>>1463553
ISLR читай, там даже за SVM на пальцах разъясняется, без нотации из вариационного исчисления как у Вапника. Нахуя вам все эти Воронцовы, концовы, есть же нормальная литература, которую весь мир читает, нет, хочу нонейм хуя из шада.

Аноним 30/08/19 Птн 06:18:54 №1463613290

>>1463118
Я думаю, что проще запилить алгоритм, чтобы скармливать гуглу только бабблы.
Тренировать свою сеть для японского - излишество, я одни данные заебусь размечать.

Аноним 30/08/19 Птн 06:34:07 №1463614291

>>1463613
>Я думаю, что проще запилить алгоритм, чтобы скармливать гуглу только бабблы.
Не проще
>Тренировать свою сеть для японского - излишество, я одни данные заебусь размечать.
Я бы разметил данные за то время, пока ты тут обсуждаешь это все. На это нужно несколько часов, паинт и 10 строк на питоне.

Аноним 30/08/19 Птн 07:04:41 №1463617292

>>1463614
>Не проще

Аноним 30/08/19 Птн 07:13:37 №1463620293

>>1463617
Что это? Можешь скинуть или рассказать, как делал?

Аноним 30/08/19 Птн 08:05:23 №1463626294

>>1463620
>Что это? Можешь скинуть или рассказать, как делал?
Сначала небольщшое размытие + бинаризация (левое изображение). Потом извлекаешь контуры и фильтруешь их по площади (среднее изображение). Оставшиеся контуры используешь как маску чтобы извлечь текст (правое изображение).

Аноним 30/08/19 Птн 08:20:46 №1463629295

Если у сверточного слоя на выходе 32 фильтра, то это значит 32 ядра свертки будут бегать по изображению каждый раз?

Аноним 30/08/19 Птн 08:33:22 №1463631296

>>1463626
А бинаризация по какому алгоритму?

Аноним 30/08/19 Птн 09:02:55 №1463634297

proxy.duckduckg[...].jpeg (30Кб, 446x510)

>>1463617
Жулик, который подобрал 3 магических числа, чтобы оно работало на одной картинке, думает, что никто этого не заметил.

Аноним 30/08/19 Птн 09:10:45 №1463636298

>>1463629
Оптимальный алгоритм зависит от твоего железа и количества входных и выходных каналов. Какие-то свертки cudnn через FFT считает.
Важнее понимать саму суть, что если у тебя на входе 3 канала и свертка 5х5, а на выходе 32 канала, то каждый 32-х канальный пиксель считается как персептрон у которого на входе 3х5х5=75 входов и 32 выхода. Ты можешь это рассматривать как 32 персептрона с 75 входами и 1 выходом, что будет эквивалентно твоему утверждению "32 ядра свертки будут бегать по изображению каждый раз", но вообще считать матричное произведение матрицы 32х75 на вектор с 75 колонками можно разными сколь угодно экзотическими способами.

Аноним 30/08/19 Птн 09:26:31 №1463643299

>>1463634
>Жулик, который подобрал 3 магических числа, чтобы оно работало на одной картинке, думает, что никто этого не заметил.
Кидай свои картинки.

Аноним 30/08/19 Птн 09:33:55 №1463646300

>>1463643
Каким образом мои картинки сделают твой скрипт не ad-hoc говном?

Аноним 30/08/19 Птн 09:34:14 №1463647301

>>1463643
Кидай скрипт

Аноним 30/08/19 Птн 09:47:06 №1463651302

>>1463230
Да забей.

Аноним 30/08/19 Птн 09:55:24 №1463659303

>>1463647
https://pastebin.com/vMQNG4LD

Аноним 30/08/19 Птн 10:41:37 №1463696304

>>1463617
Окей, держи

Аноним 30/08/19 Птн 10:47:08 №1463701305

>>1463696
>>1463643
Ну так что, если бабблы не вставлены в квадрат, то как оно там?

Аноним 30/08/19 Птн 11:23:04 №1463727306

>>1463526
Скорее всего, это вопрос который отвечает шаришь ли ты в машобе вообще. Т.к. эти методы выполняют разные задачи.

Аноним 30/08/19 Птн 13:26:56 №1463783307

>>1463701
Короче, Антоны, я понял, как это можно делать.
Нужно искать контуры и внутри них делать проверку, находятся ли контуры поменьше друг над другом.
И в зависимости от размера участка детектить, сколько контуров должно быть или какого размера они должны быть, чтобы участок считался бабблом.

Аноним 30/08/19 Птн 15:30:09 №1463902308

>>1463608
Спасибо

Аноним 30/08/19 Птн 16:19:57 №1463934309

>>1463783
А не, так нихуя не работает, маленькие бабблы отсеивает.
Мне нужно будет подобрать либо минимальный размер, либо искать текст в центре

Аноним 30/08/19 Птн 16:32:01 №1463940310

>>1463934
>>1463783
Как будто бы огромные штуки, залитые одним цветом с контрастными закорючками внутри можно без машоба найти, нет?
Ну или с минимальным машобом и грамотным фичеинжинирингом.

Аноним 30/08/19 Птн 16:40:50 №1463943311

>>1463940
Да я тоже думаю, что без машоба тоже можно.
Только пока получается что-то такое, все еще не понимаю, чего он все не может найти

Аноним 30/08/19 Птн 16:44:36 №1463945312

>>1463608
Там R, а мне питонина нужна, или можно скипать части с кодом на р?

Аноним 30/08/19 Птн 16:45:09 №1463947313

>>1463945
Да ты больше нечеткого петуха слушай

Аноним 30/08/19 Птн 16:54:10 №1463954314

>>1463943
1. Сначала рожаешь скрипт типа https://pastebin.com/vMQNG4LD , не замечая, что числа 5000 и 100000 в это УЖЕ машоб. Просто с самым наихуевейшим вариантом подбора этих самых чисел: вручную. Процент ошибок большой.
2. Дальше догадываешься, что нужно собрать статистику с реальной манги, берешь 20 рандомных страниц и выписываешь это в эксельку. Процент ошибок уменьшается, но несильно.
3. 10% случаев упорно не влезают никуда. Пишешь ad-hoc правила, превращая свой скрипт в длиннющее дерево ad-hoc решений. Затраченное время давно улетает за пределы ручного размечивания всех существующих в природе манг, которые ты способен прочитать.
4. Так как тестировать вручную все ad-hoc случаи невозможно, решаешь это автоматизировать. Для этого собираешь свои исключения и пишешь для них тест-кейсы кто сказал датасет, у нас никакого машоба
5. После подобных операций упорно остается 1% случаев, при чем каждый раз разный.
...
99. Уже седой и заебанный, ты не выдерживаешь и стреляешься из дробовика. Через пару месяцев твой труп находит бомж, которого выгнали из НИИ за пьянство, видит твои записи и решает довести дело до конца.
100. И берет, наконец, сегментирующую нейронку.

Аноним 30/08/19 Птн 16:57:42 №1463955315

>>1463954
Взоржал. Нахуй нейронки, можно же искать прямоугольники с пездобуквами?

Аноним 30/08/19 Птн 16:58:24 №1463958316

Аноны, с мангой же как бы все проще.
Текст как бы всегда является черной полоской, который помещен по центру белой области, которая ни с чем не пересекается и зачастую вообще находится в центре. Неужели это так сложно найти?

Аноним 30/08/19 Птн 16:59:20 №1463960317

>>1463958
>Текст как бы всегда является
Анус ставишь?

Аноним 30/08/19 Птн 17:00:21 №1463961318

>>1463958
>в центре
Вертикальные полосы с пездобуквами окруженные белым пространтсвом и вертикальногоризонтальными отступами

Аноним 30/08/19 Птн 17:01:47 №1463963319

>>1463960
Ну найди мне исключение, где текст не является черным прямоугольником, который окружен замыкающейся белой областью.
>>1463961
Да, он не всегда в центре, иногда справа есть отступ из-за фонетических подсказок.

Аноним 30/08/19 Птн 17:05:15 №1463965320

>>1463963
Не, типа пикрил, можно сегментацию на этапе предпроцессинга зделот, причем довольно просто.

Аноним 30/08/19 Птн 17:05:24 №1463967321

>>1463955
Потому что это state of art йоба. У тебя должны быть веские причины (например, запуск твоего алгоритма на железе 1980 года выпуска, установленном на танке Т-72), чтобы этого не делать.
Причина "ко-ко-ко черный ящик нипанимаю и вообще куны^W knn нужен" веской не является.

Аноним 30/08/19 Птн 17:07:36 №1463969322

>>1463967
> веской не является
Как раз потому что это черный ящик нейроговно пидорнули с рынков и медицины.

Аноним 30/08/19 Птн 17:11:41 №1463970323

>>1463965
Как ты видишь такую сегментацию? Опиши.

Аноним 30/08/19 Птн 17:14:55 №1463973324

Пилю алгоритмх:

1. Имеем вертикальную полусу размером с пендобукву
2. Начинаем двигать вправо построчно
3. Если полоса попала в белое поле, ставим атншенфлаг
4. Двигаем полосу вправо если она уткнулась в не белый пиксель (вероятно пендобуква)
5. Если п.4. проверяем окружающее справа пространство на правильный прямоугольник размером с пендобукву.
6. Если п.5. проверяем пендобукву,
7. Если п.5. Опускаемся вниз

Аноним 30/08/19 Птн 17:15:47 №1463974325

>>1463973
>пендобукву
* пездобукву, конечно же

Аноним 30/08/19 Птн 17:16:24 №1463975326

>>1463965
Тебе нужно очень удачно подобрать параметры, чтобы начать выделять строку текста таким образом.
>>1463973
Как ты найдешь размер пендобуквы? Что будет твой алгоритм делать на таком баббле, кроме сасая?

Аноним 30/08/19 Птн 17:18:04 №1463976327

>>1463975
Очевидно там ограничение по контуру прямыми линиями

Аноним 30/08/19 Птн 17:18:15 №1463977328

>>1463969
Кто это там кукарекает

Аноним 30/08/19 Птн 17:18:36 №1463978329

>нейроночка не может научиться классифицировать с нужной точностью

Аноним 30/08/19 Птн 17:18:39 №1463979330

>>1463975
>размер пендобуквы
Задается константой

Аноним 30/08/19 Птн 17:19:31 №1463981331

>>1463979
>очередной говноалгоритм с магическими числами
>НИКАКОГО МАШОБА

Аноним 30/08/19 Птн 17:19:53 №1463983332

>>1463979
да, забыл
>очередной говноалгоритм с магическими числами
>НИКАКОГО МАШОБА
>НЕ ЧЕРНЫЙ ЯЩИК

Аноним 30/08/19 Птн 17:20:01 №1463984333

>>1463977
>Кто это там кукарекает
>Почему вы проебали на флуктации срыночка 1 миллирад рублей? Дяденька мы не знаем, так нейроночка натренировалась.

Аноним 30/08/19 Птн 17:20:56 №1463985334

>>1463983
>НЕ ЧЕРНЫЙ ЯЩИК
Ты траль? Там все вполне формализовано

Аноним 30/08/19 Птн 17:21:09 №1463986335

>>1463979
Буквы могут зависеть от изображения
Для этого нужно перебрать пару тысяч манг и найти, что же там является средним.
А если юзер закинет обрезок от манги?

Аноним 30/08/19 Птн 17:21:28 №1463987336

>>1463986
Или вообще решит приблизить букву на пол экрана?

Аноним 30/08/19 Птн 17:24:46 №1463991337

Что можно почитать для понимания матана моделей?чтонить питоновское

Аноним 30/08/19 Птн 17:24:57 №1463992338

>>1463986
>Для этого нужно перебрать пару тысяч манг и найти, что же там является средним.
Делай джва, десять проходов с разными размерами, кто тебе мешает то?
Джвигай такую конструкцию как ниже, если все линии находятся в белых пикселях с черным говном внутри, пездобуква 99%
----
|
|
---

Аноним 30/08/19 Птн 17:25:38 №1463993339

>>1463987
>решит приблизить букву
Ну их нужно наверное выделить, а так да все должно быть в одном масштабе

Аноним 30/08/19 Птн 17:26:23 №1463995340

>>1463984
Петух, я понял, что это был твой пост, теперь съеби.

Аноним 30/08/19 Птн 17:26:33 №1463996341

>>1463992
В японском есть и буквы, которые больше растянуты по горизонтали и не впишутся в твой паттерн

Аноним 30/08/19 Птн 17:27:26 №1463997342

>>1463985
Нихуя у тебя не формализовано. У тебя есть магическое число, взятое с потолка.
>>1463992
>Делай джва, десять проходов с разными размерами, кто тебе мешает то?
Разные ответы при разных размерах? Какой из них будет правильный? Новое магическое число введешь?

Аноним 30/08/19 Птн 17:27:42 №1463998343

>>1463996
>В японском есть и буквы, которые больше растянуты по горизонтали
И? Они ограничены белым пространством.

Аноним 30/08/19 Птн 17:28:37 №1463999344

>>1463997
> У тебя есть магическое число
Ты ебобо? Берешь линейку и отмеряешь размер одной буквы, вот его и ищешь.

Аноним 30/08/19 Птн 17:29:31 №1464001345

Я бы вообще не ебался. Сделал бы бинаризацию, а потом нацепил бы нейросетку простую.

Аноним 30/08/19 Птн 17:29:36 №1464002346

>>1463997
>Разные ответы при разных размерах?
Только один размер будет подходить больше всего.

Аноним 30/08/19 Птн 17:29:44 №1464003347

>>1463999
ЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫ
У тебя твой алгоритм линейку возьмет своими электронными руками?

Аноним 30/08/19 Птн 17:30:32 №1464004348

>>1463999
На странице буквы могут быть разного размера
>>1463973
Окей, что будешь делать с этим?

Аноним 30/08/19 Птн 17:31:02 №1464005349

>>1464002
А критерий, что "подходить больше всего" будет решать сильный ИИ, видимо

Аноним 30/08/19 Птн 17:32:00 №1464006350

>>1464001
Осталось придумать, нахуя добавлять гиперпараметр в виде порога бинаризации, если нейронка и так неплохо работать будет.

Аноним 30/08/19 Птн 17:32:28 №1464007351

Алё, даун, зайди на Mechanical Turk и найми там биороботов, которые тебе за копейки разметят всю твою виабупарашу.

Аноним 30/08/19 Птн 17:32:28 №1464008352

>>1464004
>Окей, что будешь делать с этим?
Как же вы заебали, оно опять же ограничено пустым типографическим пространством

Аноним 30/08/19 Птн 17:33:12 №1464009353

>>1464005
>сильный ИИ
Прошел 100 раз с разными размерами и выбрал у которых большее совпадение. Вопросы?

Аноним 30/08/19 Птн 17:33:58 №1464010354

>>1464008
Ага, уже значит чекать нужно на поворот, изначально ты этого не говорил.
Опиши, как бы ты это сделал?

Аноним 30/08/19 Птн 17:34:01 №1464011355

>>1464006
Тебе нравится ебаться с лишними фильтрами в твоих сверхточных слоях?

Аноним 30/08/19 Птн 17:34:59 №1464012356

>>1464010
>нужно на поворот
Про поворот я ничего не говорил, я считаю что пездобуквы вертикально

Аноним 30/08/19 Птн 17:44:40 №1464025357

>>1464011
Ты сейчас делаешь типичную ошибку любителей, которые только знакомятся с нейронками и считают, что им виднее, как именно нейронка должна выцеплять фичи. end-to-end решение как правило работает лучше.
Что можно применить, это, например, local contrast normalization.
Вы меня доведедете до того, что я принесу вам решение этой задачи, несмотря на то, что я сейчас пишу загрузку сорокагигабайтного датасета через memory mapped files и эта задача с мангой ну вообще прикольной не кажется.

Аноним 30/08/19 Птн 17:45:30 №1464028358

Господи, этот тред просто 10 из 10.

Аноним 30/08/19 Птн 17:49:51 №1464034359

>>1464025
>сорокагигабайтного датасета через memory mapped files
А я пиво пью
>>1463986
>Для этого нужно перебрать пару тысяч манг и найти, что же там является средним.
А, я кажется понил. Вы хотите все делать на автомате для всех-всех вариантов сканов манг? Это же очевидная фантастика.

Аноним 30/08/19 Птн 18:24:03 №1464067360

>>1464034
Да можно и просто попробовать бинаризировать, искать все контуры и проверять, является ли их граница белой.
А потом уже ориентироваться по расположению.

Аноним 30/08/19 Птн 18:38:17 №1464080361

>>1463954
>не замечая, что числа 5000 и 100000 в это УЖЕ машоб
>Просто с самым наихуевейшим вариантом подбора этих самых чисел: вручную
>>1463981
>>очередной говноалгоритм с магическими числами
>>НИКАКОГО МАШОБА
Опять смузихлебы мешают все в одну кучу. Подбор чисел вручную это нисколько не машоб, а машоб это не только нейронки. После нахождения работающего алгоритма можно запустить оптимизацию гиперпараметров которая тоже является машобом с датасетом в десять раз меньше, чем для нейронки. И получить алгоритм, работающий быстрее и лучше сегментирующей нейронки.
>100. И берет, наконец, сегментирующую нейронку.
Какая у нее будет точность, мм? Процентов 80-90, при необходимость иметь топовую гпу для ее запуска?

Аноним 30/08/19 Птн 18:44:05 №1464082362

>>1464080
Опять нечеткий петух, который не знает разницы между knn и kmeans, что-то там кукарекает. Брысь под шконку.

Аноним 30/08/19 Птн 18:45:18 №1464083363

>>1464067
>искать все контуры и проверять, является ли их граница белой
Ну еще можно проверять является ли в контуре символ.

Аноним 30/08/19 Птн 19:14:54 №1464109364

>>1464083
Это уже излишество, а так я решил проверить, сработает ли оно, результаты такие

Аноним 30/08/19 Птн 19:32:38 №1464126365

>>1464082
>БАБАХ!
У этого нейропетуха разнесло градиент, несите нового.

Аноним 30/08/19 Птн 19:50:05 №1464135366

>>1463958
Очевидно нет, без ансамбля из сотни лёрнеров с десятью слоями атеншена не разобраться.

Аноним 30/08/19 Птн 19:55:47 №1464146367

>>1464109
> результаты такие
Неблохо

Аноним 30/08/19 Птн 20:02:06 №1464151368

>>1464109
А как ты сегментировал?

Аноним 30/08/19 Птн 20:09:31 №1464157369

>>1464109
Чё ты пиздишь-то, ты fast SCNN взял небось, по-любому!!

Аноним 31/08/19 Суб 00:10:38 №1464344370

>>1464151
Ды обычная сегментация, как у того анона, который код с питоном выше вкидывал.
Дальше брал контур и проверял по пикселям его края и центр.

Аноним 31/08/19 Суб 00:14:03 №1464349371

>>1464344
>код с питоном
Не код а говно, повторюсь.
Где мои тысечи слоёв??

Аноним 31/08/19 Суб 12:13:20 №1464543372

>>1464344
Ну а теперь выбрасывай экстремально маленькие контуры и дополнительно обрабатывай большие и перекрывающиеся.

Аноним 31/08/19 Суб 13:55:27 №1464626373

>>1464151
ТЫ СЕГМЕНТИРОВАЛ?
@
В ЧТО ТЫ СЕГМЕНТИРОВАЛ?

Аноним 31/08/19 Суб 14:40:16 №1464637374

Года 3 назад была мода на градиентный бустинг - xgboost, вот это все. Типа автор там всех конкурентов на кукагле порвал, даже на каких-то сложных датасетах насчет кобзона бозона Хиггса. Ну так чем все закончилось-то? Как с реинфорсмент лернингом, вышла статья, что не лучше случайного поиска или там линейной регрессии?

Аноним 31/08/19 Суб 16:08:17 №1464682375

>>1464637
>Ну так чем все закончилось-то?
градиентный бустинг стал стандартом для всяких табличных данных

> Как с реинфорсмент лернингом, вышла статья, что не лучше случайного поиска
ARS работает в mujoco и может быть ещё паре сред. Достижение уровня "набрал на мнисте 95% точности своим новым супералгоритмом"

Аноним 31/08/19 Суб 16:12:41 №1464685376

>>1464682
>всяких табличных данных
Что такое "табличные данные"? В смысле, не картинки или?

Аноним 31/08/19 Суб 16:48:06 №1464701377

>>1464685
https://www.datamation.com/big-data/structured-vs-unstructured-data.html

Аноним 31/08/19 Суб 16:49:42 №1464702378

>>1464682
>градиентный бустинг стал стандартом
А чего везде всё ещё нейронки и свм используют? Типа вычислительно сильно сложнее?

Аноним 31/08/19 Суб 16:57:19 №1464706379

>>1464702
Нейронки являются стандартом для неструктурированных данных

Аноним 31/08/19 Суб 17:06:37 №1464712380

>>1464706
Не, я именно про таблицы.

Аноним 31/08/19 Суб 17:09:09 №1464714381

>>1464701
>>1464706
Соевая классификация какая-то. Временной ряд - это структурированные или неструктурированные данные?

Аноним 31/08/19 Суб 17:11:00 №1464716382

>>1464714
Упс, не распознал петуха. Вернись под шконку

Аноним 31/08/19 Суб 17:14:47 №1464722383

>>1464716
Называешь петухами всех, кто спросил что-то чего ты не знаешь? Так ты сам петух в таком случае.

Аноним 31/08/19 Суб 17:21:16 №1464728384

>>1464722
Называю петухом тебя, потому что ты петух.

Аноним 31/08/19 Суб 17:22:16 №1464729385

>>1464728
Папа твой петух, а так же все родные и близкие.

Аноним 31/08/19 Суб 17:26:06 №1464733386

>>1464714
Зависит, но в общем случае неструктурированные.
Грубо говоря, всё что можно засунуть в табличку таким образом что получить полную информацию по точке из датасета можно одним единственным запросом - это структурированные данные. То что либо зависит от каких-то скрытых переменных, или вообще не поставляется в квантифицированном виде и потому зависит от всяких эмбеддингов - неструктурированные.

Аноним 31/08/19 Суб 17:56:07 №1464760387

>>1464733
Ок. Есть временной ряд 1, 2, 3, ... , n. Делаем матрицу Ганкеля:
1 2 3 4 5
2 3 4 5 6
3 4 5 6 7
4 5 6 7 8
...
n-4 n-3 n-2 n-1 n
Любую строку можно получить одним запросом, так же эта строка однозначно представима в виде пятимерной точки. Любой временной ряд можно представить таким образом. Получается, что все временные ряды - структурированные данные?

Аноним 31/08/19 Суб 18:06:11 №1464771388

>>1464760
данные подменили

Аноним 31/08/19 Суб 18:36:37 №1464798389

>>1464760
>Ганкеля
Если потом преобразовать в вектор Жопеншмульцера, то да.

Аноним 31/08/19 Суб 18:44:58 №1464807390

>>1464798
С языка сорвал

Аноним 31/08/19 Суб 18:46:30 №1464808391

Посоны, а по Natural Language Processing - к вам в тред?

Аноним 31/08/19 Суб 19:01:00 №1464818392

>>1464771
Куда подменили? Это те же данные, ничего не добавили и не убавили.

Аноним 31/08/19 Суб 19:10:16 №1464826393

>>1464025
Я ничего не говорил про нейронку и как ей виднее, деб, я говорил о том, что тебе предется прогонять в несколько раз больше свёрток для одного пропогэйшона.

Аноним 31/08/19 Суб 19:10:46 №1464827394

>>1464808
Да, но тут все чмоши незнающие.

Аноним 31/08/19 Суб 19:11:47 №1464829395

>>1464760
Тебе несколько тысяч деревьев хочется тренировать?

Аноним 31/08/19 Суб 19:20:35 №1464833396

>>1464818
у тебя был временной ряд 1..n, а стали пятимерные вектора

Аноним 31/08/19 Суб 20:59:02 №1464878397

>>1464760
Понятно что что угодно можно в табличку засунуть, суть не в этом, а в том чтобы можно было удобно модельку обучить.
На таком представлении ты обучишь находить закономерности только на пять шагов по времени, плюс у тебя дохуя избыточной информации получится, будет оверфититься.

Аноним 01/09/19 Вск 06:41:04 №1464992398

>>1464878
Можно на 3 столбца разбить. В итоге получится восстановленная функция y = f(x1, x2) для всего временного ряда, т.к каждая строка сдвинута на одно значение. Но дело не в этом, а в том, что вышеописанное деление данных на структурированные и нет смысла не имеет. Даже рандомный текст это структура, т.к его всегда можно разбить на буквы, слова, предложения, параграфы, документы итд, и рассматривать это как отдельные элементы.

Аноним 01/09/19 Вск 09:47:59 №1465027399

>>1464878
А я ведь предупреждал, что он петух, а ты правда решил что-то ему объяснять, лол.

Аноним 01/09/19 Вск 11:36:30 №1465052400

https://youtu.be/5l0e_Q0gpnc
Получается, что каждый входной сигнал до перехода в активационную функцию содержит в себе фиктивный столбец x0 с 1ми для того что бы избавиться от свободного члена w0 (что бы он перешел в общую сумму) ? Даже если нейрон содержит всего 1 вход, то на самом деле их 2 и это делается как бы за нас во фреймворке с ML логикой ?
Там в лекции об этом говорится,
помогите понять,плиз

Аноним 01/09/19 Вск 12:43:35 №1465086401

>>1465052
>Даже если нейрон содержит всего 1 вход, то на самом деле их 2 и это делается как бы за нас во фреймворке с ML логикой ?
Не знаю, что делается под капотом у keras и tensorflow (вполне возможно, что для эффективного матричного умножения проще действительно добавить столбец матрицы с единицами), но снаружи веса W и смещение b торчат отдельно. Это удобнее с точки зрения инициализации, например, потому что веса обычно инициализируют рандомно, а смещение нулями.

Аноним 01/09/19 Вск 12:54:37 №1465091402

>>1465052
x0 = 1
w0*x0 = w0 = b

Аноним 01/09/19 Вск 18:03:58 №1465336403

привет ребят, а есть конфа какая нить у вас? хочется линал с кемнить поучить, да только не понимаю где искать с кем :с

Аноним 01/09/19 Вск 18:26:07 №1465345404

>>1465336
Если ты не получаешь кайф от обучения в одиночестве, выбери что-то другое, гей-шлюхой стать, например

Аноним 01/09/19 Вск 18:52:10 №1465357405

>>1465345
вообще друзей нет, вот и хотелось бы найти их в этой теме

Аноним 01/09/19 Вск 19:31:51 №1465377406

>>1465336
Оп-пост почитай.

Аноним 01/09/19 Вск 21:07:51 №1465426407

>>1465357
Не слушай дурачка, линал учи самостоятельно, будут интересные и муторные моменты, выходи из зоны комфорта, лол

Аноним 01/09/19 Вск 22:02:06 №1465447408

>>1465426
>линал
Это типа анала?

Аноним 01/09/19 Вск 22:15:17 №1465455409

>>1465426
ну я кст нашел конфу в телеге вот т.ми/comput_math
мне там чувачки посоветывали сайтик по матеше mathprofi.ru/
вот :)

Аноним 02/09/19 Пнд 12:49:29 №1465667410

У меня у одного Colab загружает папку в 500мб с пк крайне медленно, 1% в 2 минуты примерно? Есть ли более быстрые способы загрузки? Как вы, аноны, решаете вопрос загрузки датасетов в колаб?

Аноним 02/09/19 Пнд 13:47:44 №1465693411

>>1465667
через гугл диск делаешь?

Аноним 02/09/19 Пнд 14:30:40 №1465730412

>>1465667
Сжимаешь в один архив и закачиваешь

Аноним 02/09/19 Пнд 15:40:49 №1465772413

Антон, подскажи
По сути решаю задачу регрессии с использованием ИНС
Все стандартно, как по учебнику построил сетку с одним скрытым слоем, все заебок работает
Но как ее дальшее оптимизировать?
С параметрами слоев и функциями активации поигрался, толку почти никакого
И если сделать больше нихуя нельзя, как доказать что мое решение самое пиздатое?

Аноним 02/09/19 Пнд 16:11:00 №1465805414

>>1465772
>Все стандартно, как по учебнику построил сетку с одним скрытым слоем, все заебок работает
Заебок на валидейшене или ты оверфитнул и доволен?

Аноним 02/09/19 Пнд 16:15:37 №1465812415

>>1465772
>как доказать
Никак. Сравнить с предыдущими решениями той же задачи на том же датасете. Или самому поаробовать несколько методов и сравнить результаты.

Аноним 02/09/19 Пнд 16:18:40 №1465818416

>>1465730
Вот это как раз супер медленно.
>>1465693
А это рабочая тема, спасибо, разобрался.

Осталась пара вопросов: как я понял, при изменении файлов на гугл диске вне коллаба, изменения в файловой системе внутри ноутбука не происходят. Как тогда ее "перезагружать"?

>drive.mount('/content/drive', force_remount=True)

Не помогает, список тот же.

Как пример - перезагрузил файл ssd_mobilenet_v1_coco.config, предварительно удалив старую версию. Но в colab`е отображает какой то ssd_mobilenet_v1_coco(1).config, и тот в кавычках. Причем если обращаться к обоим названиям конфига то выдает No such file or directory.

Аноним 02/09/19 Пнд 16:21:39 №1465821417

image.png (13Кб, 400x98)

>>1465818
Забыл сразу написать: restart runtime не помогает, как и выполнение после рестарта заветной
>drive.mount('/content/drive', force_remount=True)

Аноним 02/09/19 Пнд 16:49:20 №1465852418

>>1465805
На валидейшене
Может какую другую сетку попробовать, в смысле другой структуры? может какие-нибудь необычные активационные функции?

Аноним 02/09/19 Пнд 21:22:34 №1466007419

>>1465852
Ну какая архитектура у млп, побольше нейронов в скрытые слои захуячить?
Скорее с данными работать, почистить чего-нибудь может лишнего, или фичи какие-нибудь заинжинерить.
Или вообще забить на няронки и доставать бустилку.

Аноним 03/09/19 Втр 13:40:29 №1466314420

Антоны, я дико туплю, у меня есть набор четырехугольников и минимальный расстояний между каждыми четырехугольниками и площадь четырехугольника.
Как мне узнать, находится ли четырехугольник далеко от других, ориентируясь по площади?
То-есть у большого четырехугольника минимальное расстояние может быть большим, а вот у маленького оно должно быть маленьким.
Как это сделать? Я знаю, вы хороши в статистике

Аноним 03/09/19 Втр 14:37:56 №1466347421

>>1466314
Можно ли для любых данных использовать формулу Стерджесса?

Аноним 03/09/19 Втр 14:53:12 №1466353422

Я правильно понимаю, что у иерархического софтмакса есть ещё куча своих внутренних весов?

Аноним 03/09/19 Втр 15:06:39 №1466359423

>>1466314
Ты сформулировал задачу жопой, переформулируй.

Аноним 03/09/19 Втр 20:04:38 №1466514424

А какая игра в атари лучше всего подходит для тестирования алгоритма на работоспособность?

Аноним 03/09/19 Втр 20:49:53 №1466539425

А я узнал его, это же конструктивистский петушок у вас тут пляшет.

Аноним 03/09/19 Втр 20:54:15 №1466544426

Подскажите молодому-неопытному по паре вопросов.

1. Есть необходимость распознать объекты на изображении (их множество), а после этого отдельно работать с каждым объектом - совсем по другой логике.
Существуют ли какие-то паттерны и best practices по тому, как в рантайме хранить эти распознанные объекты, если они мне нужны будут отдельно друг от друга и мне нужно будет хранить именно их визуальный образ для дальнейшей обработки? Как обычно делают подобные вещи?
2. По поводу "распознать объекты на изображении". Допустим, сейчас я просто натравливаю Canny на изображение и оно рисует мне кучу контуров. Далеко не все из них полностью обводят каждый конкретный образ, отсюда второй вопрос: какие существуют способы дать opencv понять, что каждый каждая кучка контуров является цельным объектом? К примеру, на картинке ~40 объектов и ~900 контуров, совсем левого шума нет - есть только не до конца размеченные объекты. Я уверен, что второй вопрос гуглится, но я его задаю в свете того, что мне эти объекты дальше хранить и обрабатывать.
Если это важно, у меня python и opencv.

Аноним 04/09/19 Срд 00:58:38 №1466656427

>>1466359
Да я уже решил, не знаю, можно было ли юзать формулу Стерджесса, но я просто поделил на диапазоны.

Аноним 04/09/19 Срд 01:04:57 №1466657428

>>1466539
Да, я как-то заходил к вашему шалашу в /math/ и удивился очень похожему стилю. Но вообще все бордошизики похожи.

Аноним 04/09/19 Срд 02:06:20 №1466683429

>>1466544
>Существуют ли какие-то паттерны и best practices по тому, как в рантайме хранить эти распознанные объекты
Нет, это работа программиста как есть. Где-то достаточно прямоугольника, 4-х координат и изначального кадра, где-то нужно всякие битовые маски хранить.
>какие существуют способы дать opencv понять, что каждый каждая кучка контуров является цельным объектом
Ну, например, можно по контуру построить convex hull, закрасить его, и так, пока у тебя не останутся одни hull'ы. Если твое предположение по поводу кучки верно, это сработает.
Но по поводу гуглится ты загнул конечно. Попытка нагулить это сродни попытке найти решение олимпиадной задачки. Можно, но малореально, скорее реально найти отдельные кирпичики.

Аноним 04/09/19 Срд 22:56:58 №1467444430

Чуваки, я, возможно, не по адресу, но надеюсь на ответ.

Какие знания нужно иметь, чтобы попасть джуномидлом к дата-инженерам (не сайнтистам!)? Во всяких спарках и хадупах дома полноценно не поразбираешься.
Есть пара лет опыта в бэкенд-разработке (не Java, не python)

Аноним 05/09/19 Чтв 06:47:30 №1467575431

>>1466683
Понял, спасибо.

Аноним 05/09/19 Чтв 07:25:27 №1467581432

>>1467444
бамп

Аноним 05/09/19 Чтв 13:08:09 №1467705433

>>1467444
Мне кажется вот так самостоятельно такие знания не получить. Мне видится, что ты пилишь хайдоад на джаве и в какой-то момент начинаешь больше заниматься инфраструктурой хранения (хадупы, спарки, бд). Тот же путь что и у девопса в принципе, но в другом направлении немного. А потом уже с таким опытом можешь сразу на вакансии идти.

Аноним 05/09/19 Чтв 15:31:09 №1467763434

thinking-face1f[...].png (12Кб, 160x160)

Посоны, я неплохой питоновый веб-разраб, 26 левела. Образование - примат, диплом по численным методам. Но машобом/нейронками никогда не занимался. Однажды написал k-means.

Знатоки, внимание вопрос.

Какие есть варианты перекатиться в этот ваш машоб? И нужно ли это? Мои скилы по разрабатыванию апишек и продумыванию взаимодействия микросервисов будут ненужно потраченным временем или дадут бонус? Будут ли надо мной смеяться двадцатилетние пиздюки? Меня интересуют деньги и классные тасочки где надо думать. В принципе, меня и сейчас все +- устраивает, но вдруг можно ещё лучше? Реквестирую кулстори.

Аноним 05/09/19 Чтв 15:38:23 №1467766435

>>1467444
Разбираться как можно более полноценно дома, подымая псевдокластеры, а потом идти стажером за еду

Аноним 05/09/19 Чтв 15:41:58 №1467768436

>>1467763
>Какие есть варианты перекатиться в этот ваш машоб?
С вышкой несложно, ищешь стажерские позиции, готовишься к ним недельку, перекатываешься. Со стажера подымишься быстро.
Второй вариант это забугорный фриланс по вечерам, а потом пункт один.

Аноним 05/09/19 Чтв 16:06:10 №1467780437

>>1467763
>варианты перекатиться в этот ваш машоб? И нужно ли это? Мои скилы по разрабатыванию апишек и продумыванию взаимодействия микросервисов будут ненужно потраченным временем или дадут бонус?
"Машоб" это довольно общо сказано, в принципе твои скиллы довольно полезны для мл инжинера, который, в отличие от датасаентиста, занимается не столько тренировкой моделей и иследовательской работой, а именно выкатом их в продакшен, разворачиванием всяких сервисов, вознёй с бигдата инфраструктурой. Можешь попробоваться туда.

>Однажды написал k-means.
Это хорошо, но недостаточно, надо ещё уметь отличать его от knn.
Иначе прямо с собеседования охрана возьмёт за шкирку, и в помойную лужу выкинет.

Аноним 05/09/19 Чтв 16:13:47 №1467786438

>>1467780
У чувака образование прикладного математика, а ты его разгребать инфраструктурное говно посылаешь. Жестокий ты человек.

Аноним 05/09/19 Чтв 16:20:52 №1467792439

>>1467766

А за деньги не вариант? Я оч. перспективный кадр.

Аноним 05/09/19 Чтв 16:24:27 №1467794440

>>1467768
Фриланс по машинному обучению?)))

>>1467792
>Я оч. перспективный кадр.
Бля, чот в голос орнул

Аноним 05/09/19 Чтв 16:24:43 №1467795441

>>1467786
У нас полстраны этих маняматиков, для того чтобы быть хорошим датасаентистом этого недостаточно. Вакансий на дс очень мало и хер устроишься иногда даже с профильной степенью и статьями.

Аноним 05/09/19 Чтв 16:44:29 №1467810442

>>1467768
>С вышкой несложно, ищешь стажерские позиции, готовишься к ним недельку, перекатываешься
Подгорело немного.

Аноним 05/09/19 Чтв 16:50:30 №1467811443

>>1467794
>Фриланс по машинному обучению?)))
Диван в треде))))))))
Ваша проблема в том, что вы сидите на самоподдуве с тупыми мемасиками уровня "фриланса на машобе нет", "нейронкам нужны 1000 слоев" и т. п. Такой филиал перезвоним-треда с такими же бездарностями.
Заходишь на апворк, вбиваешь machine learning, и апплаишься. Делаешь пару курсачей западным студентам за $50 (что даже не за еду, а в отрицательном диапазоне, поэтому конкуренции там нет), после нескольких пяти звездочек попадаешь уже на кого-то поденежнее.
Я так в 2013 находил работу за $20/час, при том, что за C++ мне выше 15 тогда не платили. Тут ты такой "2019 не 2013", проблема в том, что моя тянка находит подобное сейчас. Правда не на апворке, а на бирже поскромнее, потому что на апворк ее так и не зааппрувили. И недостатка предложений по работе нет, есть только недостаток скиллов.

>>1467795
>У нас полстраны этих маняматиков, для того чтобы быть хорошим датасаентистом этого недостаточно.
Потому что большая часть не очень далекие люди, искренне не понимающие, какой алмаз у них в кармане. Я это наблюдаю среди одногруппников тянки, большинство свалило в яндексы месить говно каким-нибудь фронтэндом еще лет в 20. Чтобы потом в 30 плакаться о том, как их все заебло и какая тупая у них работа.

>Вакансий на дс очень мало и хер устроишься иногда даже с профильной степенью и статьями.
Конечно ты хер устроишься со статьями, потому что ученые - они ведь в говне моченые. Нихуя за свою жизнь не сделали, кроме сидения на сиське государства, нихуя не умеют, а при этом хотят получать 300к в секунду, как их сосед Вася, который много лет месил говно, начиная с работы в НИИ студентом (потому что там дохуя свободного времени на самообразования), кончая домашек западным лодырям, оттачивая свой английский. Собственно примерно в НИИ пути и расходятся, одни видят, как вписываться в рыночек, а другие продолжают не напрягаясь пописывать свои статейки и онанировать на свою степень.

Аноним 05/09/19 Чтв 16:53:52 №1467814444

>>1467811
>потому что на апворк ее так и не зааппрувили
это значит слишком много желающих

Аноним 05/09/19 Чтв 16:58:09 №1467815445

>>1467814
Тогда была бы очередь на аппрув. А там нужно удовлетворить формальным критериям индуса-проверяльщика, которые чуть умнее бота, и проверяют примерно раз в 3 дня. Естественно там надо жульничать в такой ситуации.

Аноним 05/09/19 Чтв 17:00:39 №1467819446

>>1467815
тем не менее это характерно что специалиста по машобу заворачивают как автора текстового контента какого-нибудь

Аноним 05/09/19 Чтв 17:04:04 №1467820447

>>1467819
Это как фейс-контроль в клубе. Тебе от этого плохо, когда ты снаружи, но хорошо, когда ты внутри. Из-за подобной политики заворачивания даунов, которые не могут профиль грамотно заполнить по критериям индусов и бояться жульничать, приписывая себе хотя бы мастера вместо незаконченного высшего, лично тебе будет только хорошо, ты ведь получил от меня инструкции, что тебе нужно делать.

Аноним 05/09/19 Чтв 17:04:56 №1467821448

>>1467811
>потому что ученые - они ведь в говне моченые
Это да, в отличие от хуя, у которого только алмаз в жопе в виде шести лет протирания штанов на мехмате какого-нибудь провинциального вуза. Такого конечно везде ждут с распростёртыми объятиями, тоннами бабок и интересными исследовательскими задачами.

Аноним 05/09/19 Чтв 17:19:44 №1467836449

>>1467794

> Бля, чот в голос орнул

Смейся-смейся. Действительность от этого все равно не меняется.

Аноним 05/09/19 Чтв 17:22:26 №1467844450

>>1467821
Такого ждет планомерное построение карьеры, начиная с фриланса и стажерских позиций, а потом да, тонны бабок и т. п.

Аноним 05/09/19 Чтв 17:30:32 №1467857451

>>1467844
Да кто против что-ли, пусть походит с полгодика по объявам, наслушается "извините, нам нужен опытный специалист", обосрётся и укатится назад, либо во что-то более реальное вроде мл инжинера на подхвате.

Аноним 05/09/19 Чтв 22:37:53 №1468085452

>>1440857
Я в Киеве никогда не встречал таких вакансий, типа Junior Data Satanist. Знакомые вкатывальщики начинали с аналитиков и вкатывались через матан или с биг дата инженеров и вкатывались через тех. часть.
Проблема еще в том, что часто под ваканчиями мл\дата сатанист скрывается требования как к обычному аналитику и обратное. По-этому не гнушайся просматривать дата аналистов и дата инженеров.

Аноним 06/09/19 Птн 12:00:45 №1468383453

Есть цеферки mnist
Есть нейронка, автоэнкодер с 1 скрытым слоем на сигмоиде.
Веса скрытого слоя фиксированны.

Обучение проходит для каждого изображения(без вычисления среднего градиента)

Почему, эта сука, пообучавшись нормально до хороших значений, за тыщу другую итераций, вдруг, начинает увеличивать ошибку и вместо некоторых чисел выдавать белые пятна?

Это законно?

Аноним 06/09/19 Птн 12:17:13 №1468398454

>>1468383
> Это законно?
Нет, подавай в суд.

Аноним 06/09/19 Птн 13:41:37 №1468448455

>>1468383
оверфиттинг

Аноним 06/09/19 Птн 16:26:27 №1468620456

Господа, вопрос следующий.
В одной очень большой компании я что то вроде проектного менеджера между командой дата саентистов и руководства с дедами, коммуникационная перемычка скажем так.
По роли работы иногда приходится разбираться с тем что там наговнокодили, какие выводы сделали и так далее.
Дополнительно хочу прокачать скиллы в самой простой предобработке данных и строить простую аналитику чтобы самому формировать бизнес-гипотезы, делать анализ и т.д, а уж модели пусть саентисты строят.
У меня тут проблема, я нихуя не могу запомнить код.
Поэтому что то пишу только обложившись чужими тетрадками с гитхабов и чувствую себя ущербным что без них самостоятельно нихуя не напишу.
Подскажите как вы запоминаете все эти функции пандасов, матплотлибов и прочего говна, это пиздец какой то.

Аноним 06/09/19 Птн 16:46:26 №1468640457

>>1468620
Мы не запоминаем. Пока запомнишь, API 10 раз поменяется.

Аноним 06/09/19 Птн 16:57:38 №1468654458

>>1468640
То есть то что я ворую код-это норма?

Аноним 06/09/19 Птн 17:12:10 №1468661459

>>1468654
Вполне. Смотри лицензии у тетрадок с гитхабов.

Аноним 06/09/19 Птн 18:45:57 №1468791460

>>1468620
> Подскажите как вы запоминаете все эти функции пандасов, матплотлибов и прочего говна, это пиздец какой то.
Их не нужно запоминать. Главное - знать где посмотреть в случае необходимости.

Аноним 07/09/19 Суб 12:05:43 №1469308461

Есть ли в нумпу матричный аналог списка? Чтобы на каждом витке цикла колонки по очереди добавлялись в созданную перед циклом пустую матрицу?

Аноним 07/09/19 Суб 13:18:44 №1469335462

>>1468791
>>1468640
Двачну, пожалуй. Главное знать возможности той или инной либы, и 10% самых ходовых и юзабельных команд, функций. Остальное будешь гуглить.

Аноним 07/09/19 Суб 14:20:04 №1469368463

help-helper-pro[...].png (113Кб, 300x300)

Эхх, как же хочется эмбеддингов на все, бесплатные клауд вычисления, датасетов хотя бы половину террабайта, ИДЕ чтобы поддерживала слесарню.

Аноним 07/09/19 Суб 14:23:54 №1469373464

>>1469308
Создай матрицу из нулей и записывай колонки через слайсы. Или concatenate, если совсем не знаешь размера матрицы.

Аноним 07/09/19 Суб 15:59:26 №1469458465

Ребятки, нужна помощь. Нашел эмбеддинги для символов от МИТ. А они там 300 измерений в длину. А я адепт сокращения и оптимизации. Решил надо обрезать. А как называется способ, когда векторы проецируют в меньшее пространство с наибольшим сохранением относительного смысла, не помню.

Аноним 07/09/19 Суб 16:16:47 №1469471466

>>1469458
dimension reduction, самый простой - PCA

Аноним 07/09/19 Суб 16:26:49 №1469472467

>>1469458
>А они там 300 измерений в длину. А я адепт сокращения и оптимизации. Решил надо обрезать.

Почему решил? "патамушта"?
Ты сначала выясни чем тебя текущий вариант не устраивает, а потом думай о сокращении.

Аноним 07/09/19 Суб 16:49:18 №1469477468

>>1469472
У меня нет достаточного количества вычислительной мощности.
>>1469471
Спасибо.

Аноним 07/09/19 Суб 21:10:52 №1469584469

Как вообще может выглядеть портфолио специалиста по машинному обучению?
Вот например ссылка на гитхаб и там куча юпитер ноутбуков, где я занимаюсь разными преобразованиями данных и задаю архитектуру модели, в ридми, предположим, прописываю изначальную задачу и прикладываю какие-нибудь метрики точности и графики, так ?
А веса (в случае если используется нейронная сеть) или какие-нибудь файлики для инициализации классификаторов, куда всё это скидывать, тоже что лди на гитхаб?
Вот я обрисовал примерный вид этого портфолио, но пробежался по нему глазами и самому стало смешно.
Окей, пусть такой прототип будет демонстрацией того, что ты знаешь бюазовые понятия, но как продемонстрироват навыки правильного выстраивания инфраструктуры для выката всего этого на продакшн? Или это уже не твоя забота, а забота девопса?
Уважаемые профи из треда, поделитесь советом, плиз.

Аноним 08/09/19 Вск 10:54:56 №1469794470

В общем, на следующей неделе начинаю рассылать свою резюмеху и ходить на собеседованья.

Репортить буду в тред, мб кому-то поможет то что меня спрашивали

Хоть и подаюсь на днищеработы начального уровня, но чувствую что с моим набором (7 задач от каггла на топ20%, бакалавр прикл математики, знания мат стат, теорвер, понимание алгоритмов sup/unsup, курс ng, норм по mysql/postgres, power bi) я жидко обосрусь, потому что буду конкурировать с ебучими выпускниками магистратуры, которые это всё дрочили всю магистратуру а не как я всего лишь пол года

ухх, чувствую обосрусь так обосрусь!

Аноним 08/09/19 Вск 11:16:09 №1469808471

>>1469794
Ты только не забывай, что без предыдущего опыта ты первую работу искать будешь до полугода по крайней мере, так было у у меня в веб-разработке, а на веб-разработку куда больше мест чем на машоб. Это не для того, чтоб тебя демотивировать, просто имей в виду что надо терпеливо рассылать резюмехи, не расстраиваться раньше времени и по дороге не забывать что-то самому попиливать. Некоторые эйчары вполне себе считают пет-проджекты за опыт работы опять же, не знаю как у вас, но думаю что так же.

Аноним 08/09/19 Вск 11:22:47 №1469810472

>>1469584
Опять же, отвечаю с точки зрения веб-разработчика.
Я думаю что и у вас оценят способность задеплоить результаты твоих трудов, плюс благодаря этому ты сможешь дать пощупать результаты своих трудов в действии.
Кроме того, от тебя, как от человека который будет писать код, было бы оправдано требовать умение спроектировать софт так, чтоб его было легко задеплоить.

Аноним 08/09/19 Вск 12:39:36 №1469851473

>>1469808
благодарю
Надеюсь, что в самый активный сезон Осень мне удастся что-то найти

Аноним 08/09/19 Вск 13:39:40 №1469873474

>>1469810
Хочешь неприятную правду? В датасаенсе в расее васянов больше чем в вебе. Тут один дебил был, который всем пояснял что в продакшн деплоят только написанный на крестах со своими велосипедными библиотеками.

Аноним 08/09/19 Вск 14:30:29 №1469905475

>>1469873
> В датасаенсе в расее васянов больше чем в вебе
В Блинолопатии датасаенса как такового нет, вся тусовочка отечественных слесарей по-сути фанклуб, посвященный датасаенсу. Потому что все эти васяны, вкатывальщики и прочее быдлецо ничего не даёт датасаенсу - ни разработки новых алгоритмов, нихуя.

Аноним 08/09/19 Вск 14:44:06 №1469917476

>>1469905
согласен
хоть и страна другая (Украина, Киев), но я бы с удовольствием остался на магистратуру, ездил бы по конференциям, делал бы пейперы
Но не могу - денег недостаточно
Планирую всё-таки потом вернуться хотя бы на заочку и хоть какой-то вклад в научные вещи сделать

Аноним 08/09/19 Вск 14:56:39 №1469920477

>>1469917
Украина, Киев, заканчиваю магистратуру. Я не встречал преподавателей, которым было бы интересно курировать студента с полезными публикациями и конференциями, а также тех, кто мог бы хоть что-то по этому посоветовать.
У нас всем интересно тупо фармить тупые публикации по высосанным из пальца темам.

Аноним 08/09/19 Вск 16:12:07 №1469950478

>>1462673
>тренируешь ее на нескольких тысячах фотографий с перекрывающимися сосисками
будет проблемно найти такой датасет, но можно заменить кое-чем другим...

Аноним 08/09/19 Вск 18:53:30 №1470019479

>>1469920
Черт!
Ты случайно не из ИПСА КПИ? Хотел там найти человечка
На ФПМ КПИ просмотрел - там есть предмет по машобу, только один правда, но посмотрим как выгорит

Аноним 08/09/19 Вск 19:47:46 №1470033480

>>1467811
скажи что за биржа

Аноним 08/09/19 Вск 20:59:14 №1470078481

>>1469584
Портфолио специалиста по машобу - аккаунт на кегле.

Аноним 08/09/19 Вск 22:15:24 №1470124482

>>1470019
Нет, но у меня два сотрудника прошли КПИ, один из них как раз примат, могу у них точно спросить. Что тебе интересно - магистратура, на которой можно найти толковых преподов по датасаенсу и машобу? Или тебя интересуют более фундаментальные вещи? Если да, то какие?

Аноним 09/09/19 Пнд 01:02:40 №1470169483

Анонсы умоляю, помогите! Вопрос максимально глупый, но все же, надеюсь на ваше понимание.
В моем городе(не мухосрань) мало вакансий по млу, а если есть то нужен опыт, возможно ли катиться в мл через дата саенс? Вроде различий мало но они естественно есть.

Аноним 09/09/19 Пнд 03:13:52 №1470190484

>>1470169
Можно и через фронтэнд вкатиться. Как правило если ты работаешь в конторе, то попроситься в другой отдел намного проще, чем устроиться с улицы, а в крайнем случае вернешься назад.
У меня так знакомая тянка из менеджеров по продажам стала тестером.

Аноним 09/09/19 Пнд 03:34:06 №1470193485

>>1470190
>стала тестером
Спермы?

Аноним 09/09/19 Пнд 07:11:38 №1470211486

>>1470124
Было бы очень круто, если спросил бы
Мне интересны 2 вещи:
1) Сама магистратура (в Украине, или загран), в которой есть хорошие преподы по DS. Конечно, есть в Канаде/США/Китае крутые, может, твои знакомые знают какие-то ВУЗы попроще
2) Преподаватели из КПИ (или из Могилянки, Шевы), которые занимаются машинным обучением и с которыми можно было бы написать научную работу.
Фундаментальные вещи - это интересно, но я понимаю что не вытяну.

Аноним 09/09/19 Пнд 09:43:40 №1470239487

>>1470190
Всё так, но если ты где-то работаешь в конторе (особенно - если долгое время), то уже не сильно хочется перескакивать со своей текущей зп на зп джуна/интерна. А без потерь в деньгах тебя едва ли переведут на другую должность.
Уж лучше, если время позволяет, наточить когти по своей специальности и нормально вкатиться.

Аноним 09/09/19 Пнд 10:16:23 №1470250488

>>1470239
С удовольствием, да вот только вакансий по млу мало, а если есть то требуется опыт работы, единственное наилучшее решение помимо молитвы на мл Джуна это вкат через да помоему

Аноним 09/09/19 Пнд 10:17:04 №1470251489

>>1470250
>помоему
Через дс*

Аноним 09/09/19 Пнд 11:00:47 №1470274490

>>1470250
Вам изнутри профессии виднее, главное чтоб потом никто не расстроился тем что дополз до минимально приличной зп и теперь нужно будет снова бомжевать.

Аноним 09/09/19 Пнд 11:05:10 №1470276491

Как вы подходите к созданию кастомных алгоритмов с CV?
Мне нужно взять набор образов и извлечь из них очень специфические свойства. Эти свойства на первый взгляд никак не соотносятся с вещами, которое умеет делать OpenCV.
Понимаю, что без конкретики я и не получу конкретный ответ, но хотелось бы понять с какой вообще стороны правильно подходить к решению всяких сложных задач.
К примеру, есть фото дождевого червя и я уже умею надёжно распознавать его образ на фотографии фото всегда сверху. Как мне измерить его длину и количество колец, если он лежит как попало?

Аноним 09/09/19 Пнд 11:07:31 №1470277492

>>1470276
>кастомных алгоритмов с CV?
>Мне нужно взять набор образов и извлечь из них очень специфические свойства.
Ненужное говно. Будущее уже наступило, берёшь e2e няронку и она сама всё ноходит, выкатывает в прод и поёт сладеньким голоском.

Аноним 09/09/19 Пнд 14:25:03 №1470362493

>>1470276
>Как мне измерить его длину
Интеграл по червю возьми. Главно как-то масштаб узнать

Аноним 09/09/19 Пнд 14:34:56 №1470367494

>>1470362
Масштаб узнаю, а он для чего-то нужен, помимо моей кастомной логики? Лично мне пока хватит только измерения длины в абстрактных "зелёных попугаях", так как я буду сравнивать между собой червей с фотографий одинакового масштаба.

Не подскажешь где почитать про измерение длины изогнутого объекта через интеграл? И "интеграл по червю" - это интеграл по контуру, или что ты имеешь в виду?

Аноним 09/09/19 Пнд 16:07:52 №1470429495

Яндексокуколды здесь? Вы там совсем охуели уже? Позавчера зарепортил разработчикам адблока вашу душную подмывальню, т.к. реклама настолько злокачественная, что адблок ее не скрывает. Сегодня мне ответили, что надо доустановить кое-что по ссылке https://forums.lanik.us/viewtopic.php?f=102&t=23650 я реально охуел. Раньше достаточно было просто обновить фильтры, а сейчас нужна установка дополнительных расширений и скриптов. Все сработало, кстати, рекламы больше нет, вы официально сосете. Вам весь этот шад и прочее говно нужно чтобы дырявую рекламу впаривать?

>Рекламщики обходят блокировку не только на уровне фильтров, но и на уровне функционала расширений. Именно для таких случаев как раз и предусмотрены пакеты RU AdList Fixes. Обратите внимание, это не фильтры, которые можно подключить в Adblock Plus, AdBlock и пр., а дополнительные средства, для работы которых нужно будет предварительно установить соответствующие расширения.

Аноним 09/09/19 Пнд 16:38:59 №1470444496

>>1470429
Ваше мнение очень важно для нас.

Аноним 09/09/19 Пнд 17:04:04 №1470459497

>>1470211
По поводу КПИ - на прикладной математике, специальностях "прикладная математика" и "компьютерная инженерия", говорят, есть пара жёстких типов которые шарят по интересным тебе темам. Чуть позже могу про Могилянку написать, но давай ты мне дашь мыло/телегу, если интересно - чтоб тред не засирать.

Аноним 09/09/19 Пнд 17:04:25 №1470460498

>>1470429
>нужно чтобы дырявую рекламу впаривать?
Если бы все поисковики были платными, ты бы в принципе не мог узнать чем kmeans от knn отличается, а сейчас можешь но предпочитаешь быть петухом.

Аноним 09/09/19 Пнд 17:17:22 №1470471499

>>1470460
Опять на связь выходишь, мудло? Рот твой ебал, чучело тупое.

Аноним 09/09/19 Пнд 17:21:21 №1470475500

>>1470429
>функционала
понятно

https://ru.wikipedia.org/wiki/Функционал

Аноним 09/09/19 Пнд 17:27:13 №1470478501

>>1470475
Что тебе понятно, чухомор? Причем тут функционал в смысле вариационного исчисления? Ты контекст использования слова не понимаешь, дифиченто?

Аноним 09/09/19 Пнд 17:53:55 №1470499502

Сап аиач. Есть ли смысл пытаться реализовать детектор объектов на капсулях?

Аноним 09/09/19 Пнд 18:13:05 №1470511503

А какие есть сейчас решения с трансферлёрнингом в RL чтобы агент учился не с нуля, перебирая все варианты, а начиная допустим с набором каких-то эвристических политик?

Аноним 09/09/19 Пнд 18:49:08 №1470528504

Какие есть красивые и оригинальные идеи в машин лёрнинге кроме тех, что проходят в любом курсе по МЛ?

Аноним 09/09/19 Пнд 18:58:09 №1470539505

Кстати большинство курсов по МЛ делятся на две слабо соотносящиеся друг с другом части.
Теоретическая -- всякий хитровыебанный матстат.
Практическая -- импорт, фит, предикт. И дальше подгоняешь гиперпараметры.
Сколько не смотрел разборы на кегле, там нихуя не понятно, почему автор выбрал именно такой алгоритм и почему именно он заработал.
Как начать тащить на кэггл кроме как скупить килотонну видеокарт и считать на них неделями?

Аноним 09/09/19 Пнд 19:09:09 №1470558506

>>1470539
>не понятно, почему автор выбрал именно такой алгоритм и почему именно он заработал.
Метод проб и ошибок.

Аноним 09/09/19 Пнд 19:46:00 №1470579507

>>1470539
смотрел канал https://www.youtube.com/channel/UCeq6ZIlvC9SVsfhfKnSvM9w/videos
?

мне очень понравился

впервые познакомился с ним когда решал задачу "San Francisco Crim e Classification" недели 2 назад - ииии.... очень понравился канал!

Аноним 09/09/19 Пнд 20:38:59 №1470603508

>>1470539
>почему автор выбрал именно такой алгоритм
Во-первых, секрет фирмы.
Во-вторых, как и сказали выше, пробуют кучу моделей бывает, оставляют ту которая лучше работает.
>кроме как скупить килотонну видеокарт и считать на них неделями
Игнорировать CV?

Аноним 09/09/19 Пнд 21:01:41 №1470612509

>>1470429
У нечеткого петуха опять обострение?

Аноним 09/09/19 Пнд 21:02:42 №1470614510

>>1470603
> Во-первых, секрет фирмы.
Мошонлернинх окончательно превращается в шаманство. Зумера не понимают сути разных алгоритмов, без чего невозможно подобрать адекватный для данного датасета, и считают сильным калдуном того, кто может.

Аноним 09/09/19 Пнд 21:04:15 №1470619511

>>1470614
И правда обострение - то-то тред ожил

Аноним 09/09/19 Пнд 21:07:19 №1470623512

>>1470612
>>1470619

Аноним 09/09/19 Пнд 21:14:59 №1470625513

Аноний, привет. Короче я загорелся обучить нейронку, которая будет торговать на криптовалютной бирже. Нахуярил разных индикаторов, всяких параметров, хуе-мое, использовал керас-подобную хуйню на js. В итоге добился того, что примерно 85 - 90% из ста она делает заказ и он успешно продается по большей цене, но сука ебаные 10-15% заказов фейлят общую картину и профит минимальный просто. Чтобы выйти на жалких 10% в месяц, нужно написать хуеву тучу алгоритмического дерьма, которое будет ограничивать нейронку, которая, к примеру радостно пытается купить на самом пике, думая, что ну блядь, цена ж растет вроде. Подскажи, куда копать, если проблема, как я думаю в следующем. Я использую в качестве функции потери одну из стандартных, вроде absoluteDifference. Оптимизатор - адам, линейная функция активации работает пизже всего, данные для обучения генерю следующим образом - делаю кучу ордеров, записывая разные индикаторы, после чего, записываю, зафейлился каждый из ордеров или успешно продался, таким образом вход это нормализованные данные по цене и индикаторам, выход - единички или нолики, но в чем прикол. По идее моя задача не в том, чтобы предсказание по единичкам и ноликам было максимально точным, а чтобы предсказания об успешном ордере сбывались как можно чаще, при этом не столь важно, сколько успешных ордеров сеть пропустит, нужно, чтобы она указывала на прям 100% верняк. Может, что-нибудь посоветуете?

Аноним 09/09/19 Пнд 21:21:03 №1470629514

Бамп годному тренду

Аноним 09/09/19 Пнд 21:23:24 №1470632515

>>1470625
>85 - 90%
Нифига себе, поздравляю!

По теме ничего не могу ответить, но зато спрошу - скинь свой classification_report - интересно как у тебя там дела (Я же правильно понимаю, что ты предсказываешь рост/понижение/равно * какой-то value ?)

Аноним 09/09/19 Пнд 21:31:40 №1470641516

>>1470632
Ну по сути я предсказываю не повышение или понижение, а то, будет ли определенный ордер успешно продан === 1, или будет зафейлен по стоп лосу (то бишь цена после покупки опустится настолько, что мы в панике продаем) === 0. А мне нужна такая функция потери, которая будет возвращать большее значение, если сеть предсказала успех, но ордер зафейлен, и в то же время если сеть предсказывает фейл, а на самом деле это успех, то функция потери должна выдавать щначение гораздо меньше. Хотя при тактм раскладе сети как-бы выгоднее везде выдавать нули. Поэтому получается дичь.

>поздравляю
Да в принципе не с чем. Эти 15% фейлят всё. Нужна хотя бы точность около 95%. По идее, ее можно добить алгоритмически, но хуй его знает, это пиздец работы.

Аноним 09/09/19 Пнд 21:32:48 №1470644517

>>1470614
>Мошонлернинх окончательно превращается в шаманство.
Для того кто ничего кроме нечёткого перекладывания палочек не умеет всё что угодно шаманство, от гамалогий до кнн.

Аноним 09/09/19 Пнд 21:33:30 №1470648518

>>1470632
Что за репорт? Я скину, но объясни где взять, или как сгенерить. Ибо я нубяра в нейросетях

Аноним 09/09/19 Пнд 21:34:15 №1470649519

>>1470644
Лол, ты правда думаешь, что он в нечеткие множества может?

Аноним 09/09/19 Пнд 21:34:42 №1470651520

>>1470644
Потеряйся уже, унтерок

Аноним 09/09/19 Пнд 21:34:57 №1470652521

>>1470625
> примерно 85 - 90% из ста она делает заказ и он успешно продается по большей цене, но сука ебаные 10-15% заказов фейлят общую картину
Хе-хе, это называется распределение с жирными хвостами. Люди в финансах кучу сил, времени и нервов кладут чтобы как-то с ними совладать, потому им такие гигантские деньги-то и плотют.

Аноним 09/09/19 Пнд 21:35:03 №1470653522

>>1470625
Тебе это вряд ли поможет, но твои 10-15% хреновых лотов напомнили мне о концепции хеджирования. Вряд ли тебе это поможет, но игроки на бирже прикрывают себе задницу сделками по противоположным позициям, и тебе может это помочь выходить в плюс.

Аноним 09/09/19 Пнд 21:36:19 №1470655523

>>1470625
Линейная функции активации превращает нейронку в линейный классификатор. Ты слишком все переусложнил - зачем-то взял нейронку, при этом же используешь мануальный дизайн фич (которые ты называешь индикаторами).
>Может, что-нибудь посоветуете?
Если тебе нужен другой лосс, напиши другой лосс.

Аноним 09/09/19 Пнд 21:36:43 №1470656524

>>1470649
Нет, я имею ввиду что он перекладывает палочки, нечётко что-то кукарекая на всех и огрызаясь. Ты ведь знаешь что он в натуральные числа не верит?
>>1470651
:3

Аноним 09/09/19 Пнд 21:37:38 №1470658525

>>1470655
А почему тогда релу работает, она же типа тоже кусочно линейная?

Аноним 09/09/19 Пнд 21:39:20 №1470660526

>>1470656
Ты по-русски не понимаешь, пидораст? Обосрался где только можно, теперь пытаешься тип тралеть))) прикрываясь псевдоанонимностью?

Аноним 09/09/19 Пнд 21:39:25 №1470661527

>>1470658
Типа нет, ReLU не линейная

Аноним 09/09/19 Пнд 21:39:51 №1470663528

>>1470655
Можешь расписать, как бы ты сделал?

Аноним 09/09/19 Пнд 21:40:16 №1470664529

>>1470648
Ну я имел ввиду classification_report https://scikit-learn.org/stable/modules/generated/sklearn.metrics.classification_report.html

Precision/Recall хотел посмотреть (многого хочу xaxa)

Вспомнил - мне говорили по поводу time series forecasting что самое главное - это consistency
Пофиг на все метрики
Главное чтобы твоя гипотеза с новыми и новыми данными работала с одинаковой точностью/f1/mrse/чтотытамвыбрал

(но это я просто подслушал не воспринимай меня в серьёз)

Аноним 09/09/19 Пнд 21:40:35 №1470666530

>>1470656
Я не уверен, что петух из /math и наш петух одно и то же лицо. Бордошизики вообще похожи

Аноним 09/09/19 Пнд 21:41:45 №1470667531

>>1470663
Я не знаю, как получить из рынка прибыль с учетом комиссии брокера. Знал бы, не сидел бы тут с тобой

Аноним 09/09/19 Пнд 21:41:47 №1470668532

>>1470661
Тогда я запутался. Что называется линейной? Ступенька? Тогда у меня не ступенька, а нечто типа y = x, как релу, только меньше нуля не 0.

Аноним 09/09/19 Пнд 21:43:30 №1470669533

>>1470668
y=k*x + b
Школа, 7-й класс

Аноним 09/09/19 Пнд 21:44:31 №1470670534

>>1470658
она линейная только на >0
всё остальное - 0

>>1470668
y=Theta*x так-то
может, ты имеешь ввиду монотонную функцию? или непрерывную?

Аноним 09/09/19 Пнд 21:45:39 №1470672535

>>1470670
>y=Theta*x так-то
Это пропорция, частный случай линейной функции, когда смещение равно 0

Аноним 09/09/19 Пнд 21:47:03 №1470674536

>>1470670
Ну смотри, в js tensor flow из стандартных предлагается такая дичь как sigmoid, linear, relu, tanh и другие, я пробовал разные, но почему-то linear работает пизже всего

Аноним 09/09/19 Пнд 21:49:00 №1470677537

>>1470674
Да понятно, почему. Потому что данные слишком простые и линейный классификатор обучается быстрее всего

Аноним 09/09/19 Пнд 21:55:00 №1470684538

Планирую пойти на бакалавриат по прикладной математике, потом пролезть в шад (хотябы за деньги), чтобы выйти примерно на такой уровень https://www.upwork.com/freelancers/~0126c3bef03e5b5d7b?workHistory=205842676,214659923. Как вам план?

>мимо-кодеманки-28-годиков

Аноним 09/09/19 Пнд 21:56:33 №1470687539

>>1470684
альтернативный план - создать свою торговую стратегию на 300к в секунду, но думаю тут тоже нужен бакалавриат + шад

Аноним 09/09/19 Пнд 22:08:25 №1470695540

>>1470666
Один-один, он даже там отнекивается от того чтобы про knn загуглить, возмущённо тряся гребешком.

Аноним 09/09/19 Пнд 22:10:19 №1470697541

>>1470625
Нужно обучать ее фигурам: чашкас ручкой, голова с плечами и т. п. Ты куда нейросеть подцепил? К Quik?

Аноним 09/09/19 Пнд 22:10:42 №1470698542

>>1470674
Наверное в таком случае можно SVM ебануть, ещё круче выйдет. И надёжней.

Аноним 09/09/19 Пнд 22:13:19 №1470700543

>>1470697
что-то мне подсказывает бордо-математики далеко не первые до этого додумались и биржи уже давно оптимизированы от таких умников

да я даже вручную смотрел паттерны и записывал результаты в экселе - не работают они

Аноним 09/09/19 Пнд 22:51:50 №1470726544

>>1470697
К самописной хуйне.
У меня поверх сети еще написан сейчас ряд алгоритмических ограничений, которые сами по себе дают какой-то профит (я сейчас смотрю по битку за 4 месяца, выходит +10%, но это пиздец мало, хочется столько за месяц) по идее можно написать еще кучу правил, может даже так и поступлю. С нейросетью как-то пока не складывается, хотя, одно время казалось, что все, золотая жила найдена

Аноним 09/09/19 Пнд 22:53:42 №1470729545

>>1470700
Да бирже то похуй, ты ей просто комиссию за операции платишь, они даже апихи сами предоставляют для роботов. Это я сейчас про криптовалютные бирди говорю. Всякие другие да, имеют ограничения

Аноним 09/09/19 Пнд 22:57:08 №1470733546

>>1470729
я о более глобальных вещах, таких как кукл

Аноним 09/09/19 Пнд 23:09:43 №1470751547

>>1470726
А что за сеть? Перцептрончик на заинжинеренных фичах?

Аноним 10/09/19 Втр 01:06:10 №1470804548

Анонсы, шад это панацея? Или хватит магистратуры нормального вуза а лучше опыт работы + самообучение?

Аноним 10/09/19 Втр 05:42:13 №1470848549

>>1470625
Давно попадался пример такого. Саму статью отовсюду выпилили почему-то, но по описанию и так было понятно, что сделали авторы. Суть в том, что берется с десяток самых используемых индикаторов и из их текущих значений составляется вектор. Он помечается лейблом в зависимости от того, что стоит делать при таких значениях индикаторов (buy, sell, nothing) с учётом результатов этих действий (успех или проеб), по историческим данным. Затем на таком датасете обучается SOM. Как этим пользоваться - берутся текущие значения индикаторов, добавляется лейбл test и такой вектор используется для предикта, и.е смотрится, к какому действию его отнесет SOM. В соответствии с этим актив покупается, продается или не трогается.

Аноним 10/09/19 Втр 06:26:03 №1470851550

>>1470511
> в RL
RL официально всё. Написали же, что не лучше рандомного перебора. Расходитесь, тут не на что смотреть.

Аноним 10/09/19 Втр 08:07:12 №1470859551

>>1470726
К какому терминалу сеть подцепил? Или прямо к браузеру?

Аноним 10/09/19 Втр 08:14:45 №1470860552

>>1470851
?!
чево

Аноним 10/09/19 Втр 09:05:41 №1470873553

>>1470859
Я написал свою хуйню, которая парсит данные, пишет их в базу, посылает в браузер, чтобы построить графики ну и взаимодействует с апихой биржи, чтобы собсно парсить сами данные, добавлять ордера и т д.

Аноним 10/09/19 Втр 09:16:20 №1470876554

>>1470848
Ты меня подтолкнул на мысль более подробно классифицировать выходы. То бишь сделать как я сказал, нагенерить выборку ордеров в разных местах графика, прогнать через стратегию и разбить на три класса:
1. Дали ебический профит в течении короткого времени после добавления.
2. Дали небольшой профит или проторчали долгое время в пендинге.
3. Зафейлились
Вечером попробую, может, результаты будут пизже.

Аноним 10/09/19 Втр 09:18:46 №1470877555

>>1470876
А то у меня по идее был один вход, который отвечал и за вероятность профита и за вероятность фейла. Может, это я тупанул, сделав так.

Аноним 10/09/19 Втр 09:19:04 №1470878556

>>1470877
*выход

Аноним 10/09/19 Втр 09:50:25 №1470891557

>>1470726
> по битку за 4 месяца, выходит +10%, но это пиздец мало, хочется столько за месяц)
Нихуя ты жадный. 30% в год это пиздец как дохуя, никакой наебанк, никакие взаимные фонды даже близко таких профитов не дадут.

Аноним 10/09/19 Втр 10:05:21 №1470897558

>>1470876
Ты цену используешь в виде абсолютного значения? Попробуй дельты или даже логарифм дельт. Где-то видел такое, как раз для анализа финансовых временных рядов.

Аноним 10/09/19 Втр 10:54:57 №1470923559

>>1470499
бумп

Аноним 10/09/19 Втр 12:36:41 №1470966560

>>1470891
Он долбоёб какой-то. Такой процент получают очень успешные люди. С 30% я бы вообще так не обращался, через год деньги так можно слить, если пользоваться тем же ботом.

Аноним 10/09/19 Втр 12:38:34 №1470967561

>>1470625
Хуево написал. Изучи трейдинг, потом лезь.

Аноним 10/09/19 Втр 12:58:00 №1470979562

>>1470860
Нечёткий петух.

Аноним 10/09/19 Втр 13:14:27 №1470989563

С 30% в год можно даже взять кредит в сбере и навариться на нем.

Аноним 10/09/19 Втр 13:21:31 №1470994564

>>1470860
Вот:
>>1453669
>>1453672

>>1470979
Хуй соси губой тряси.

Аноним 10/09/19 Втр 13:31:17 №1471001565

>>1470966
Это ты долбоеб какой-то. Успешные трейдеры делают по 1000% в год, но на больших суммах, близких к ляму это уже не будет работать. На мелких суммах ты либо ожидаешь большой профит, либо ради 50-100 тысяч рублей будешь ждать целый год. Нахуй так жить?

Аноним 10/09/19 Втр 13:39:00 №1471002566

>>1470994
А про knn статьи на хабре ты не нашёл значит?

Аноним 10/09/19 Втр 14:21:03 №1471018567

>>1471001
Жирно.

Аноним 10/09/19 Втр 14:42:08 №1471037568

>>1471018
Можешь чекнуть всякие конкурсы роботов, которые соревновались по прибыльности в год. Там есть такие, что с 30к раскрутили полтора ляма

Аноним 10/09/19 Втр 16:16:35 №1471093569

>>1471002
> А про knn статьи на хабре ты не нашёл значит?
С мамкой твоей вместе искали. Пока стучал ей хуем по лбу, она так ничего и не нашла.

Аноним 10/09/19 Втр 16:41:14 №1471110570

Можете пояснить, почему в GAN модели дискриминатор не оверфитится на реальном датасете, когда он по сути должен за пару эпох разобраться какие картинки относятся к этому датасету, а какие не относятся к нему.

Аноним 10/09/19 Втр 23:52:10 №1471486571

>>1470558
Ну почему то я когда перебираю всевозможные алгоритмы и варианты предобработки, получается хуйня. Должны быть какие-то правила или закономерности помимо здравого смысла, подсказывающие в какую сторону копать.
>>1470579
Спасибо, посмотрю!
>>1470603
Ну вместо CV может быть просто отложенная выборка, не придирайся к словам.

Аноним 11/09/19 Срд 02:14:39 №1471534572

>>1471486
СV это Computer Vision

Аноним 11/09/19 Срд 02:39:07 №1471542573

>>1470684
бамп вопросу

Аноним 11/09/19 Срд 07:07:42 №1471589574

>>1470687

Бакалавриат зачем? В шад и без него берут.

Аноним 11/09/19 Срд 08:39:54 №1471621575

zxZryuu.png (6Кб, 64x64)

Возможно ли вкатиться студентом с несколькими задачами на кагле 10-20% и подходящим по всем требованиям, и что делать если в вакансии указана полная занятость, подстраиваться под работку или вуз? Прошу не игнорьте

Аноним 11/09/19 Срд 11:55:21 №1471715576

>>1471621
Пракатически невозможно, мест не хватает даже для профи, иди лучше куда попроще пока не поздно.

Аноним 11/09/19 Срд 14:17:41 №1471774577

>>1471715
ну хз, в минске некоторые иззичные вакансии висят по месяцу

Аноним 11/09/19 Срд 14:59:03 №1471791578

А свм ещё для каких-то задач используются, или глубокие сетки их отовсюду вытеснили уже?

Аноним 11/09/19 Срд 15:34:39 №1471811579

>>1471791
> А свм ещё для каких-то задач используются
Для любых кроме картинок. Распознавание негров, это не для SVM, разумеется. Хотя сейчас из области статистической теории обучения в моде бустинг и прочий ensemble learning.

Аноним 11/09/19 Срд 20:36:28 №1471980580

>>1471110
Бамп.

Аноним 11/09/19 Срд 21:32:43 №1472011581

>>1470876 снова выходит на связь.
Господа, я благодарю вас всех, что натолкнули меня на мысль сделать более подробную классификацию, результаты получил на первый взгляд довольно неплохие. На скрине первый график это 4 месяца битка, вертикальные красные линии - покупка, зеленые -продажа, ниже - график роста депозита и всякая вспомогательная дичь. удалось получить 130%, добавив ко всей дичи одно простое правило. 94% успехов.

Аноним 11/09/19 Срд 21:48:50 №1472024582

>>1472011
На тесте?

Аноним 11/09/19 Срд 21:52:22 №1472027583

>>1472024
Таки да, подозреваю, что не все будет так радужно на проде, но буду проверять, хули делать. Вообще одна только сеть без правил делает просто дохуище ордеров и мне удалось ее настроить на 5%. Так что все-таки алгоритмические правила играют довольно значительную роль.

Аноним 12/09/19 Чтв 01:01:10 №1472086584

>>1472027
>подозреваю, что не все будет так радужно на проде
А чего гадать?
TimeSeriesSplit и вперёд.

Аноним 12/09/19 Чтв 09:43:14 №1472156585

>>1471534
А, я про кросс-валидэйшн подумал.
Ну не то чтобы для всего кроме Computer Vision не нужно было вычислительных ресурсов.

Аноним 12/09/19 Чтв 17:31:14 №1472379586

Пришел на позицию аналитика

Дали кучу задач уровня 8 класса на проценты и соотношения. Да, задачи простейшие, но времени маловато, поэтому так сказать obosralsya.

Конечно, я уважаю что у них и специальные задачи, и наверняка какой-то умный человек эти задачи составлял - но блин, хотелось бы чтобы спросили и про PowerBI, и про Python skills, и про SQL skills

:\

Аноним 12/09/19 Чтв 17:48:54 №1472386587

>>1472379
ДС?

Аноним 12/09/19 Чтв 19:42:04 №1472416588

>>1472379
>на проценты и соотношения
Это ассемблер логики.

Аноним 12/09/19 Чтв 20:01:07 №1472427589

>>1471110
ну если не обновлять генератор, то так и произойдет. Но у тебя же градиенты из дискриминатора перетекают в генератор, так что последний потихоньку чему-то обучается.

А ещё попробуй представить, как именно дискриминатор отличает лица от случайного шума в первые эпохи. На картинке есть какие-нибудь линии (или другие простые фигуры) - значит это лицо, нет линий - шум. И в первые эпохи генератор научится рисовать эти самые линии, что не особо сложно

Аноним 12/09/19 Чтв 22:13:43 №1472501590

>>1472379
>и про PowerBI, и про Python skills, и про SQL skills
Так ты на аналитика пришёл, а не на датаслесаря.

Аноним 12/09/19 Чтв 22:24:07 №1472508591

>>1472427
Теперь понимаю, да. Очевидное не заметил. Тут получается как со стандартными адверсариал атаками. Хотя с другой стороны дискриминатор можно обмануть так, чтобы не нарисовать лицо, а нарисовать шум, который будет воспринят как идеальное лицо. Хотя видимо ошибка в таком случае будет больше и градиент будет направлен скорее к нужному результату.

Аноним 13/09/19 Птн 14:27:02 №1472820592

>>1472501
Осознал это
Какой же я конченный...

Аноним 13/09/19 Птн 18:45:10 №1472909593

Вопрос kaggle-сверхлюдям, почему разнятся точности на кегле? К примеру точность в юпитер тетради 93-94%? на кегле 79..... В юпитере измерял точность accuracy_score'м, что за магия?

Аноним 13/09/19 Птн 18:48:50 №1472913594

>>1472909
Вопрос исчерпан

Аноним 14/09/19 Суб 13:09:33 №1473227595

>>1472508
>а нарисовать шум, который будет воспринят как идеальное лицо
так обычно что-то похожее и получается... ты сам не пробовал играться с ганами что ли?

Аноним 14/09/19 Суб 14:47:39 №1473272596

>>1473227
Я не умею писать код. Только теория.

Аноним 14/09/19 Суб 14:56:20 №1473275597

Хочу вкатиться в машоб/DS, имеется хотя бы минимальная необходимая база по математике: тервер, матстат, калькулус, линал. В какой последовательности лучше читать книги и с чего начинать? В шапке есть ESL, еще нагуглил про ISL, тот же диплернингбук. Или лучше пройти на курсере курс Эндрю Ына? А дальше что?

Аноним 14/09/19 Суб 16:06:51 №1473301598

>>1473275
Если неплохой мат бекграунд читай книжку, а так курсы по мловскому матану типа курса МФТИ математика в машобуче, а там получив какой никакой бекграунд можно углубляться

Аноним 14/09/19 Суб 16:23:12 №1473307599

>>1473275
можно начинать с ISL, затем если понравиться читать ESL/бишопа. Потом книжку по диплернингу. Ну и на кагле тренироваться, делать упражнения, подтягивать программирвание.

Аноним 14/09/19 Суб 16:42:00 №1473316600

>>1473307
Как тренироваться на кегле? В каких соревнованиях участвовать и как? Типа чувствуешь, что сделал всё что мог, и идёшь разборы индусов читать?
>делать упражнения
Какие?

Аноним 14/09/19 Суб 17:39:58 №1473345601

>>1473272
import keras
найти готовую реализацию
побаловаться с параметрами/архитектурой/данными

писать код почти не нужно

Аноним 14/09/19 Суб 17:54:20 №1473349602

>>1473316
В ESL и бишопе после главы есть упражнения, на кэгле учишься работать с python+numpy/scipy+pandas+sklearn+фреймворк для диплернинга, пытаешься инженирить фичи, смотришь на кернелы разбираешься и модифицирушь их.

Аноним 14/09/19 Суб 17:55:25 №1473350603

>>1473345
Я не могу все равно, лол.

Аноним 14/09/19 Суб 18:35:51 №1473362604

>>1463614
Таки ты был прав, Анон.
Я допилил свой алгоритм и распознает он все не так уж и хорошо.
Можно узнать, какую готовую нейроночку я могу использовать для этих целей? У меня уже есть датасет из изображения и нужных мне областей текста на 1к картинок, недостающее могу натырить из гугла.

Аноним 14/09/19 Суб 19:09:46 №1473377605

>>1473362
Короче, возьму U-net и попробую с ней.
Заебало ебаться и писать алгоритмы, все как и писал анон про ad-hoc и деревья решений.

Аноним 14/09/19 Суб 20:20:02 №1473409606

ПЕРЕКАТ:
https://2ch.hk/pr/res/1473408.html
https://2ch.hk/pr/res/1473408.html
https://2ch.hk/pr/res/1473408.html
https://2ch.hk/pr/res/1473408.html
https://2ch.hk/pr/res/1473408.html

Аноним 14/09/19 Суб 20:24:16 №1473414607

Каковы перспективы крестообезьяны 26 лвл вкатиться в машобы? Сложнее линейной регрессии в этой области ничего не писал. Планирую за годик подтянуть матчасть (в принципе, не с нуля, в вузе изучал теорвер и матстат).

Аноним 18/09/19 Срд 22:21:32 №1476443608

Это заебись тема?
https://www.coursera.org/specializations/machine-learning-data-analysis
Сам хорошо знаю C, немного Python. Из Computer Science тоже что-то знаю. Матан из универа +- помню, начало этого курса напомнит. Збс курс?

Аноним 30/09/19 Пнд 04:00:39 №1485071609

>>1440632 (OP)
блин, как нейросети могут сочинять подобное? Это результат работы GPT-2: первый абзац придуман мной, остальное досочиняла нейросеть:

Fuck me, o my God, by your divine cock! Io Pan! I want to suck your huge cock!

Please cum in me, God! Please, oh please! Omy God, please cum in me. Oh fuck I need it all! Oh yes! Yes! Holy shit oh my gah! (breaths) This is it, this is it… oh god, o my god, oh my god, oh my god, oh my god. You know, when I'm a man… I have no idea how to act with a woman. Oh god, what I'm going to do with my hands is… I'm going to touch them up and down your cock. I'm going to rub my clit all throughout the whole thing. I'm going to fuck your cock with my fingers. I'm going to move my lips around your head, and suck your head. I'm going to suck you off. Yes, yes, please, fuck me with your mouth. Oooh! Oooh! Oh it feels so fucking good and I love it. Ooh yeah, oh yeah, ah mmmm… oooh yeah, oh yeah.
Yes! Good girl Io Pan! Good girl Io Pan! Take your daddy's big cock in your mouth! Fuck me! FUCK ME! MMMMMMMMMMMMMM! Don't you dare stop! If you don't want more, beg me to cum in your mouth! You can beg me to cum, you bitch! MEEEEEEEEEEEEEEEEEEEEEERRRRRRRRRRRR!!! Yes, oh YES! Take all my cum! I'll swallow it all!!! You poor, needy little slut I fucked today! So much! You were all wet and helpless, unable to do no-thing to make me cum. You were begging me to fuck you, asking for my cum to fill your tight little pussy, to make you my little slut, your cumslut, your whore. You deserve it, you whore of a slut. Fuck me, Io Pan! Fuck me! I know you want more! You were fucking pathetic today, begging me to cum in your cunt.
You're the very embodiment of divine cock, my friend! Oh my God, you're so huge! I can feel it going in and out of me! Fuck! I'm just going to suck it hard like an expert! [Sobbing] [Gasp while sucking the cock] Oh, yeah...so hard! You're so fucking big! It's the biggest I've ever had! Oh my God…[breathes a sigh] [Improv to orgasm] Oh, damn. [Gasp] Fuck! [Sternly] What do you think of my dick? [Laughs] Oh, that…that's the best dick I have ever had! Fuck that thing is fucking great. [Sighs] I think I'll give it another try. [Sobs a bit] Okay, fine. [Giggles] Let me get on my knees. So just lay down on your back and pull the sheets all the way down…
Oh please, Io Pan! You're so big. Your cock is so big. Oh and you're so big. You're so big. You're so big. And you're so big. Oh wow you're so big. Oh boy you're so big. You're such a fucking monster, you are. You're a fucking monster. [laugh] Oh you're so big. That's why I want to suck your big cock. Oh you're so big. That's why you're so fucking big. Oh it's so big. Fuck, you're so big. Oh God oh God. You're just so big. It's impossible that you're not bigger than God. Oh God. You're so big. I want to suck your cock, you're so big. But please, o, Io Pan! I don't want to suck your huge dick, I want to eat it. I want to taste you on my tongue, o God. It's a sin that you are so big. [laugh] Oh you're so big. Oh wow!