Главная Настройка Mobile Контакты NSFW Каталог Пожертвования Купить пасскод Pics Adult Pics API Архив Реквест доски Каталог стикеров Реклама
Доски


[Ответить в тред] Ответить в тред

Check this out!

[Назад][Обновить тред][Вниз][Каталог] [ Автообновление ] 128 | 4 | 11
Назад Вниз Каталог Обновить

Аноним 29/09/17 Птн 00:47:35  161965364  
Программач, ночной, помоги найти студенту литературы для диплома по теме кластеризации и классификации документов. Подкинь годных советов на эту тему, если работал в таком направлении. С меня как всегда.
Аноним 29/09/17 Птн 01:08:25  161966154
Бамп
Аноним 29/09/17 Птн 01:30:02  161966860
Лол ты тролишь? Это сейчас хайповое направление, открываешь гугл школяр (сайт такой, хотя ты тоже школяр), вводишь в поиске "natural language processing", "text mining" и сортируешь по дате публикации и количеству цитат.
Аноним 29/09/17 Птн 01:31:14  161966903
>>161966860
*цитирований
Конечно же
Аноним 29/09/17 Птн 01:40:41  161967240
>>161965364 (OP)
мало того что ты тупой, ты еще и ленивый.
Аноним 29/09/17 Птн 02:08:19  161968078
>>161966860
Большинство годной литературы там платная. Остальную скачать не выходит из-за битых ссылок. Остаются только статьи на 3 страницы, из которых много нового особо и не почерпнешь.
>>161967240
Я не ленивый. Просто хотел спросить у людей, которые связаны с этим. Может быть есть книги, которые им помогли или какие-то сайты\блоги посвященные на этой теме. Информации в интернете много, но было бы неплохо, если бы кто-то посоветовал действительно стоящее.
Аноним 29/09/17 Птн 02:37:34  161968985
>>161968078
Заходи с универской вафли, у универов как правило есть соглашения с библиотеками вроде ieeexplore
Аноним 29/09/17 Птн 02:59:24  161969564
>>161968985
Мой университет находится в Приднестровье.
Аноним 29/09/17 Птн 03:10:03  161969819
>>161965364 (OP)

На хабре не так давно выкладывали курс по бигдате и machine learning от какой-то компании в этом направлении. Вот там дохрена такого и с примерами и с алгоритмами, разбором спец. софта и этими вашими нейронными сетями. Думаю если разберешься и присобачишь это к своей теме, то мало того что слепишь годный диплом, но и параллельно освоишь в бигдату, что на сегодня на рынке очень востребовано.
Аноним 29/09/17 Птн 03:12:46  161969888
>>161969819
А можешь поискать в истории, не сохранилось ли у тебя. Просто там этих статей полно, всю ночь можно сидеть и искать курсы. Ну и самое главное. Этот курс платный или бесплатный?
Аноним 29/09/17 Птн 03:22:24  161970123
>>161969888

Не в хистори нет, чистил недавно. Это не статьи, тебе же написали КУРС. Там будет часть1 2 итд, частей 10.
Все на русском, все очень годно и бесплатно. Они там в комментах отписались, что таким образом пытаются компенсировать дикую нехватку кадров по данной теме и кого-то себе приискать, публиковали вакансии еще с весьма годной ЗП. Ищи короче и твори диплом.
Аноним 29/09/17 Птн 03:30:41  161970304
>>161970123
Спасибо большое, буду искать по хабру. Но может все же подскажешь с какими компаниями это связано или что-то такое, что поможет мне найти именно эту статью? Уже нашел несколько, но там платные курсы.
Аноним 29/09/17 Птн 03:36:00  161970398
>>161970304
какую тебе надо статью, этих статей миллион, учебников тоже, открываешь первый попавшийся пример https://github.com/adeshpande3/LSTM-Sentiment-Analysis/blob/master/Oriole%20LSTM.ipynb если непонятные слова - открываешь букварь. видюха есть?
Аноним 29/09/17 Птн 03:38:15  161970431
>>161970304

Называлось типа введение в машинное обучение, или осваиваем машинное обучение. Платного на хабре много рекламируется это да. Ты ищи не курсы, а зайди в бигдата и машинлергнинг, ИИ там и посмотри, перебирай по порядку, найдеш. Там говорю статей 10 по частям.
Аноним 29/09/17 Птн 03:46:42  161970603
>>161970398
>видюха есть?
Видеокарта или ты про какое-то видео?
Аноним 29/09/17 Птн 03:47:14  161970617
>>161970431
Хорошо, спасибо тебе большое, анон. Ты мне очень помог.
Аноним 29/09/17 Птн 03:48:53  161970645
15054832890912.jpg (29Кб, 500x400)
15048082234083.jpg (32Кб, 553x376)
207704261020728[...].jpg (148Кб, 960x742)
15006684567791.jpg (90Кб, 811x608)
>>161969819
>востребовано
Хуйстребовано. В компаниях, где это реально надо штат набит под завязку и эйчарш заёбывают каждый день вдохновенные пидоры даже если не открыто ни одной вакансии "вольмиииите меня, ну пожалуйста, я хабру читал и курсеру смотрел, хоть стажером, хоть на пол шишечки, ну пожааааалуйста".
Это пидоры, которые прочитали где-то что датасойнс престижная специальность и много денег.
Такие пидоры есть и среди работодателей. Они нанимают одного мидла для решения задачи, для которойнужен нихуясебеотдел с синйорами и заграничными ПхД (я сейчас в такое вляпался).
В реальности датасайнс - это вишенка на тортик, те самые +2% КПД, которые нужны чтобы обскакать конкурента, с которым у тебя жесткий клинч по всем фронтам и точек роста не осталось. Таких компаний в каждой отрасли по пальцам посчитать.
А ещё это лотерея, блядь. У разраба есть ТЗ, в котрой описана принципиально решаемая задача. Хороший инженер знает, как реализовать решение максимально эффективно и безопасно. Обычный инженер просто знает, как реализовать. Датасойнтист не знает. Ты пробуешь, оно не сходится, ещё пробуешь, тупишь, объясняешь заказчику, что это не ты тупой, а так устроена любая работа, суть которой - изобретательство. Как поиск лекарства от болезни: его могут изобрести, а могут и не изобрести.
И это очень выматывает психологически, когда НЕ ЗНАЕШЬ, как решить задачу и негде посмотреть готовое решение. И ещё нет классического набора скилов и технологий, освоив которые можно особо не париться за уровень квалификаци, переодически подучивая новые версии библиотек. Датасойнс - это бездонный колодец, в два раза глубже, чем попытка "выучить ВСЁ программирование". Вечная гонка за хуй пойми чем, вечное ощущение себя нубом.

Короче, ОП, это работа очень так на любителя. Я нахожу в ней что-то своё, но только потому, что я экзестенциальный извращенец.
И да, пока не станешь синьйор-хуиньйор-волшебником, зарплата как у кодера (может меньше).
Мимо датасойнтист. Выговорился.
Аноним 29/09/17 Птн 03:50:41  161970685
>>161970603

Многие алги под видюху и софт требует видюху, он это имеет ввиду. Параллельные\распределенные вычисления на графоне. Опять же для нейро нужна видюха.
Аноним 29/09/17 Птн 03:51:15  161970691
>>161970645
>И это очень выматывает психологически, когда НЕ ЗНАЕШЬ, как решить задачу и негде посмотреть готовое решение.
не знаю где ты работаешь, но меня например больше напрягает, когда я знаю как решить задачу и знаю где посмотреть готовое решение.
Аноним 29/09/17 Птн 03:53:12  161970723
>>161970685
Я просто недавно начал изучать OpenCL для вычислений на видюхах и подумал, то ли я слишком глубоко начал в это закапываться, то ли ты действительно о видюхах. Видюха есть, хоть и не очень мощная по саовременным меркам, но всяко мощнее проца.
Аноним 29/09/17 Птн 03:54:15  161970743
>>161970691
Не, творчество и инженерные амбиции - это всегда хорошо. Самому нравится. Но романтика хороша, когда она не вечна.
А ощущение тупика, которое рискует возникнуть изо дня в день - не из приятных.
Аноним 29/09/17 Птн 03:57:43  161970807
Screenshot from[...].png (16Кб, 484x130)
>>161970645
> штат набит под завязку
Что, правда?
Аноним 29/09/17 Птн 03:57:50  161970810
>>161970645
Ну то что сейчас в России проблемы в этой отрасли я знаю. Просто по диплому хотел каталог для библиотеки сделать, а мне сказали нам такое не пойдет, надо матан туда применять. А я просто не вижу ничего другого как вот такие штуки туда приделать. Хоть и слабенько оно будет, но чтобы они меня лишний раз не парили. Может что сам посоветуешь интересного на эту тему? Ты там держись давай, очень надеюсь, что через несколько лет хоть как-то в России будут ценить твою работу.
Аноним 29/09/17 Птн 03:58:09  161970813
>>161970645
>я сейчас в такое вляпался

Нее ну ты нормально написал я неспорю.

В тоже время

>я сейчас в такое вляпался

а некоторые и нормально пристраиваются, не к тем кто взял мидла следуя моде и умным словам. Бывают и нормальные проекты бро, просто ты пока не там.
Аноним 29/09/17 Птн 03:58:24  161970818
>>161970807
Ну и откуда ты сюда это притащил?
Аноним 29/09/17 Птн 03:59:09  161970834
>>161970691
Двачую анона. Когда какие-то слишком простые задачи - не очень интересно.
Аноним 29/09/17 Птн 04:00:49  161970865
>>161970813
>нормальные проекты
Лол, это как?
Аноним 29/09/17 Птн 04:00:56  161970869
>>161970810

>надо матан туда применять

Ищи на хабре тот курс статей, там как раз всё матаном обмазано, впрочем с хорошими примерами жизненными и пояснениями зачем это и почему вот так работает в жизни. Потому отчасти мне и запомнилось.
Аноним 29/09/17 Птн 04:04:48  161970937
>>161970869
Кажется нашел. Там первый курс с библиотекой Pandas к питону? А заканчивается градиентным бустингом, так?
Аноним 29/09/17 Птн 04:07:58  161971001
>>161970865

Нормальные по выхлопам и людям тебя окружающим. С интересными задачами типа тех же алгоритмов торговли, или обработке видео, решения класификаций для быстрого поиска товаров в инете, чтоб запилить сервис и тупые телки и тетки могли нормально и быстро серчить нужное как мы с тобой к примеру, а не тупить часами в гугле и так и не найти нужный товар (что есть непрямой убыток продавца). Класификация отзывов, определение фейковых по всплескам и аномалиям, да много всего интересного и нужного. Одной автоматизации банковской на сегодня Грефу и Ко требуется овердох, знал бы ты сколько, там хотят отправить в неоплачиваемый кучу теток и посадить по паре таких инженеров на кластер филиалов.
Аноним 29/09/17 Птн 04:09:03  161971027
>>161970937

Вроде да бро. Мои поздравления! Вот кури это сперва, затем приматывай к своему диплому. Провижу успех!
Аноним 29/09/17 Птн 04:10:21  161971056
>>161970807
У тебя на скрине узкопрофильные отделы. Там проблема другая - найти толькового спеца, который имеет коммерческий опыт в задачах именно такого типа. Но таких компаний не так уж много. Основновные заказчики - это компании, в которых решили "эй, у нас тут куча данных простаивает, давайте наймем ДСа, пусть наклепает моделек, котрые нам кучу всего оптимизируют".
>>161970810
В России не будут.
Героям Слава!
>>161970813
Увы, таких раз-два и обчёлся. Ничего, помаюсь годик-другой по стрёмным проектам и вкачусь в пафосную контору матёрым синьйором. На хорошие бабки.
Аноним 29/09/17 Птн 04:13:21  161971120
>>161971056
>Ничего, помаюсь годик-другой по стрёмным проектам и вкачусь в пафосную контору матёрым синьйором. На хорошие бабки.

Слова не мальчика, но мужа.
Аноним 29/09/17 Птн 04:16:01  161971168
>>161971056
>найти толькового спеца, который имеет коммерческий опыт в задачах именно такого типа
Они требуют опыт работы лет 5, а бум пришелся именно на эти годы. Вангую, что через пару лет будет много школоты которые побыли на двух платных семинарах по этой теме и уже захотят получать с 100к в секунду.
Аноним 29/09/17 Птн 04:16:32  161971180
>>161965364 (OP)
Гы, кластерный анализ похож на хуй
Аноним 29/09/17 Птн 04:20:34  161971262
>>161971001
>чтоб запилить сервис и тупые телки и тетки могли нормально и быстро серчить нужное как мы с тобой к примеру
Ну так запили такой поисковик и станешь миллионером.
Аноним 29/09/17 Птн 04:26:59  161971369
>>161971180
Скорее на волосатую пизду твоего папки-трансгендера.
Аноним 29/09/17 Птн 04:29:40  161971432
>>161971262

Дык уже пилят, по пути возникают конечно проблемы, но думаю допилится. И да, наверное кто первый это высрет, тот и станет миллионером.
Это к тому что не одни пилят, а несколько команд параллельно.
Аноним 29/09/17 Птн 04:30:34  161971447
>>161971180
Анон не пались, не надо показывать всем, что ты никогда не видел пизду
Аноним 29/09/17 Птн 04:31:26  161971461
>>161971432
Так, а ты почему не пилишь?
Аноним 29/09/17 Птн 04:33:18  161971502
>>161971447
Может он не по этой теме.
Аноним 29/09/17 Птн 04:34:11  161971519
>>161970810
Так на вскидку и не вспомню. Но для диплома можно не выёбываться и запилить что-то совсем простое. Типа вот этого https://habrahabr.ru/post/205360/
Если много слов в документах, можешь попробовать заюзать PCA (вот тебе ещё матана немножко в диплом).
Аноним 29/09/17 Птн 04:36:05  161971552
>>161971001
>знал бы ты сколько, там хотят отправить в неоплачиваемый кучу теток и посадить по паре таких инженеров на кластер филиалов.
Мне вот всегда было интересно, есть же куча всяких менеджеров, тетки всякие которые с Word и Excel работают, бухгалтерши всякие. Вот придет пора машинного обучения, что они тогда будут делать? Пойдут на рынок вещами торговать? Но ведь и рынки уже пожирают крупные магазины со всякими скидочками.
Аноним 29/09/17 Птн 04:36:09  161971555
>>161971168
Дык, уже!
Текущий работодатель сказал, что пока меня нашел, заебался отшивать соискателей, у которых за плечами только месячные курсы полторы программы на Курсере.
Аноним 29/09/17 Птн 04:40:13  161971615
>>161971552
Станут ЭЙЧАРШАМИ. Или ПЭЭМАМИ.
Тут суть какая: раньше у тебя 10 менеджеров сидели на телефонах и принимали/оформляли заказы. Потом всё автоматизировали, сделали охуевшую иситему онлайн-заказов, на поддержание которой нужно несколько разрабов, дизайнер, админ, ПМ, тестировщик, в сумме не намного меньше, чем было манагеров.
Аноним 29/09/17 Птн 04:49:04  161971769
>>161971461

>ты почему не пилишь?

Пилю, но уже не это, тимлидом сейчас в другом проекте, но тот тоже мониторю.
Аноним 29/09/17 Птн 04:49:28  161971777
>>161971615
Ну вот смотри, тех же эйчар можно тоже заменить такой системой. Можно ведь натренировать нейросеть чтобы она могла понять подходит ли человек на должность юриста. Вот он пишет как любит кататься на велосипеде и что у него 5 лет опыт работы грузчиком и 3 года он работал на заводе. То есть, поймет ведь она, что он вообще не из той сферы? Либо же если какой-то тоже недалекий но с раздутым самомнением влепит свою анкету. Ведь этих заявок порой бывает тысячи и приходится нанимать с десяток эйчар. Да, собеседование никто не отменял, но уже работы поменьше, а значит меньше сотрудников. И может ли такое быть, что вот эта нейросеть найдет какие-то ключевые слова анкет, которые характеризуют талантливого человека? Тогда и собеседования ведь не нужны будут.
Аноним 29/09/17 Птн 04:49:52  161971782
>>161971769
А чем вообще вы там занимаетесь?
Аноним 29/09/17 Птн 04:50:30  161971794
>>161971552
>Вот придет пора машинного обучения, что они тогда будут делать?

Этот вопрос не одного тебя занимает друг.
Даже вангуют социальные протесты и безработицу всякую.
Аноним 29/09/17 Птн 04:59:20  161971948
>>161971782

>чем вообще вы там занимаетесь?

Пилим бюджеты ЛОЛ
На самом деле они там насколько я могу наблюдать, оптимизируют нейро и пытаются на куче интераций ее обучить вдумчивому поиску. Сформулировать ей запрос, преобразовать естественный язык в вектора и обратно, подобрать под все это нормальные алго и обучить ее наконец вдумчиво искать отбрасывая заведомо херню, применяя теорему Эскобара фильтровать ссылки и их содержимое итд.
Аноним 29/09/17 Птн 05:05:21  161972053
>>161971519
Почитал хабр. Но все равно мне идею с валидацией данных точно забракуют. Просто думаю уже сколько недель каким вообще образом можно матан прикрутить к каталогу библиотеки. Завкафедры говорит сделать "умный" поисковик, который чтобы не как гугл, а чтобы прям вообще понимал. Думаю, ну и вляпался же я. Конечно можно сделать так, загружает пользователь документ, парсим его на слова и по словам определяем категорию куда этот документ добавлять с помощью тех же алгоритмов классификации. Но какой в этом смысл, если пользователь сам может написать категорию ручками? Может есть какая-то такая тема кластеризации среди поисковых алгоритмов, которая могла бы удивить этих людей? Может вообще забить на поиск и придумать что-то другое? Но вот за PCA тебе спасибо большое, буду читать больше об этом, может быть хоть какая идея в голову придет.
Аноним 29/09/17 Птн 05:08:43  161972104
>>161971794
Так ведь и программистов заменить можно. Уже есть сотни CMS и всяких готовых инструментов. Остается только сделать конструктор, которому ты пишешь "Хочу себе онлайн-магазин бытовой химии" и он тебе предлагает разные дизайны. Все, уже веб-макаки не нужны. Про обычные программы тоже можно сказать. Да и вообще, может ли эта отрасль так развиться, что сама будет себя улучшать и в себе искать неполадки? Тогда ведь и ты не нужен будешь.
Аноним 29/09/17 Птн 05:12:57  161972199
>>161972104
>Тогда ведь и ты не нужен будешь.

Нет неверно. Я буду нужен анон. Всегда будут нужны люди подходящие к своему делу творчески. Хоть кодеры, хоть штукатуры. В ближайшей перспективе сильного ИИ не предвидится, посему машины не вкатятся в творческий подход, а значит не смогут самообучаться и допиливать новое. Тех кто клепает однотипное, конечно выпнут как Греф теток из сбера.
Аноним 29/09/17 Птн 05:18:53  161972318
>>161971948
Я долго думал на тему поисковиков и вообще того, что именно является нужной страницей для человека. Но вот что меня огорчило и наверное, оно перечеркнет или перечеркивает всю работу, которой ты занимаешься. Дело именно в самих людях. Когда они спрашивают что-то у поисковика, он должен их понять, для того ведь и нужны все алгоритмы. Но если человек спросит, что ему нужен какой-то сферический конь в вакууме, а ведь так по сути всегда и происходит, то что делать в таком случае? Результатов поиска нет и человек спрашивает что-то общее, но это все не подходит, он пытается конкретизировать и в начале слишком много не того, а в конце опять нет результатов. А проблема в том, что сам пользователь не может четко сформулировать свои мысли.
Аноним 29/09/17 Птн 05:20:51  161972348
>>161972053
>думаю уже сколько недель каким вообще образом

Ты пока не вкуриш тот машин лернинг и датасайнс с хабра, перестань думать.
Покури его и те задачи что они там разбирают сперва. Также имей ввиду, что тетка в шараге ставит тебе задачу сделать интеллектуальный гугл, а я анону выше отписал, что над этим и в корпах и стартаперы трудятся, не последние. Результата пока нет, а она хочет от одного студента этого, пусть и на уровне каталогизации. Ты прикрути немного, сделай какую-то частичную реализацию чего-то там и налей воды как бы это можно было развить. На деле реализовав несложную задачу классификации и удобрения этим поиска. Пойми что это просто диплом и перестань загоняться.

ЗЫ
Хотя из подобного курсача на лето в далеких 60-ых, родились нейронные сети и распознавание изображений. Правда курсач в итоге с горем пополам решили через 50 лет!
Аноним 29/09/17 Птн 05:21:43  161972363
>>161971948
А еще люди разные и кому как не тебе это знать. Тут много кто меня на доске убеждал, что все мы одинаковые, но феномен белых ворон в рекомендательных системах вполне себе обычное явление. Что можно и про поисковики сказать. Ну,а баба Клава конечно же найдет православную страничку, потому что до нее ее находило 100 бабушек и все остались довольны. Кстати, так ведь и можно тренировать нейросеть поисковика. Нашел - больше не ищет. Не то - ищет дальше.
Аноним 29/09/17 Птн 05:25:15  161972425
>>161972348
Да я это еще тогда знал, анон, что создать какой-то "умный" поисковик, это дело огромной команды, а не одного человека. Но все же ты прав, надо вкурить сначала всю эту инфу, а потом идеи появятся, как и куда что пристроить в каталог, чтобы и они довольны остались и мне лишний раз не потеть над чем-то мегасложным.
Аноним 29/09/17 Птн 05:29:19  161972484
>>161972318

Так эту задачу можно решать допиливанием-оптимизацией запроса за дебила и в итоге выкатыванием ему вариков и действием через дерево решений, или как бы сходимость некую, пока он не скажет да да вот это, ага ага.
К тому же со временем сеть учится понимать хоть муу му мууууу ээээ, в нужной последовательности и понимать, что дауну нужно молоко и творог заказать доставку. Далее она выдает ему оптимизированные, стерильные результаты выдачи поисковика. Это вообще рай для маркетинга, оптимизировать и сортировать-контроллировать выдачу.
А так я согласен с тобой, что по большому счету любой самый аналитический и элегантный поиск сводится к правильной формулировке запроса.
Аноним 29/09/17 Птн 05:34:32  161972549
>>161972363
>Нашел - больше не ищет. Не то - ищет дальше.

Да что-то подобное яндекс и гугл воплощают, но тут нужно контроллировать метадату на стороне юзера, а это упс нарушение прайваси и доступа к данным. Если решат это как-то (через юрстов пункт внесут, или технически,) тогда да, будут обучать свой поиск налету. Типа вот по этой фразе нашел вот это и больше не ищет, ну как ты описал.
Аноним 29/09/17 Птн 05:38:21  161972631
>>161972199
>сильного ИИ
Вот этого термина я вообще не понимаю. Вот представь себе феминистку, она считает себя равноправной ячейкой общества и она считает, что все женщины имеют право на это. А вот мусульмане так не считают, ведь по их мнению у женщины нет души. Если мусульманин встретится с такой феминисткой, то как она ему докажет, что душа у нее есть, как ты считаешь? Так же большинство людей могут отнестись к сильному ИИ называя его слабым ИИ. Ну и даже если допустить это, то зачем людям вообще он нужен? Зачем вот лично тебе думающие как человек роботы? Они начнут требовать себе права, как феминистки или чернокожие. Что тогда делать? Обычно ИИ нужен для конкретных задач и не более того.
Аноним 29/09/17 Птн 05:42:04  161972700
>>161972549
>нарушение прайваси
Гугл уже при желании может по однотипным запросам понять, что ты тот самый человек, который задавал такие-то запросы несколько лет назад. Допустим мне рекомендуют те видео в ютубчике, которые я смотрел год назад, на основе просмотра других видео, которые я опять же год назад смотрел. Потому ведь и был создан DuckDuckGo, чтобы не палить свои данные гуглу. Да и сам то ты читал их политику конфиденциальности? Мне почему-то кажется, что там много хитрых уловок. Компания может позволить себе лучших юристов.
Аноним 29/09/17 Птн 05:45:28  161972753
>>161972631
>Вот этого термина я вообще не понимаю.

Я тоже.

>Обычно ИИ нужен для конкретных задач и не более того.

Тоже самое можно сказать и про нашь разум. Сводя любое действие и любое твое самое глубокое переживание к какой-то конкретике и чему-то насущному. Все относительно анон. У нас инженеров, кодеров это всё относительно задачи. У гомонитариев относительно момента и чувства. Видимо поэтому пиздят как дышат и постоянно переобуваются.
Аноним 29/09/17 Птн 05:48:47  161972802
>>161972700
>Гугл уже при желании может

Ну то делает и яндекс уже в своем Королеве, но там иначе. Это не совсем то о чем речь шла. Хотя конечно это тоже улучшает поиск. Но когда они смогут контроллировать метадату с твоей именно стороны. То есть что у тебя происходит условно на тачке и это обрабатывать, тогда наступит уже сорт оф такого обучения.
Аноним 29/09/17 Птн 05:51:08  161972844
Поясните что такое бигдата?
Вернее, какое практическое применение эта хуйня находит в ИРЛ.
Я никак не пойму. Какой-то набор алгоритмов для копания в говне. Кому это вообще нужно и чем это отличается от программирования?
Аноним 29/09/17 Птн 05:52:17  161972871
>>161972484
Я тоже думал над обратной связью. Но на голом старте человеку придется слишком много вариантов перебирать и много отвечать на вопросы ответами да и нет. То есть в начале для человека этот поисковик будет просто бесполезен. Что в таком случае делать? Нанимать специально людей, чтобы они учили нейросеть своими ответами? А если специальные ответы будут не тем что нужно?
Аноним 29/09/17 Птн 05:58:16  161972962
>>161972844
Вот у тебя жесткий диск скажем 2Тб, а BigData это копание в говне размеров раз в сто-тысячи больше и поиск самородков.
Аноним 29/09/17 Птн 06:01:39  161973013
>>161972871
>Нанимать специально людей, чтобы они учили нейросеть своими ответами?

Несовсем так. Скорее учить ее составлять (или давать ей сразу компактные наборы) деревья решений. В общем как обычно, дать даунам удобный интерфейс конечно. Между их му мууу, ага да вот это и нейронкой которая может в поиск как хороший аналитик. Ну короче ты искал что-то своей бабушке например? На самом деле ведь люди не так много всего ищут, все довольно однотипно и поддается той же классификации. Какие-то индивидуальные, уникальные случи можно рассматривать отдельно и добавлять, дообучать сеть походу. Все решаемо.
Аноним 29/09/17 Птн 06:05:27  161973070
>>161972962

А также разделение говен на составляющие элементы, дальнейшая сортировка фракций и в финале определение концентрации солей тяжелых металлов в данном сорте говна.
Аноним 29/09/17 Птн 06:08:29  161973106
>>161973013
А если человек ищет что-то, но сам не знает что? Вот мне нужен фильм, там была женщина с розовой прической. Дерево решений будет слишком большим. Он найдет один фильм, да там розовая прическа, но это не то, потом третий, четвертый, а потом просто подумает, не судьба значит. Сама ведь знаешь, что дальше третей страницы гугла почти никто не заходит. Вот что в таких случаях делать?
Аноним 29/09/17 Птн 06:13:19  161973177
>>161973070
Боюсь, что он бы этого не понял. Сейчас это слово очень модное. Мне как-то даже одна девушка писала о том, как она книжки по бигдате читала. Спрашивать я у нее ничего не стал, но думаю, что она кому-то там уже втирает, что у нее бигдата в папке на рабочем столе из трех фильмов.
Аноним 29/09/17 Птн 06:18:27  161973241
>>161972802
Я как-то работал в одной шаражкиной конторе и мне одна женщина сказала, что у нее браузер тормозит. Смотрю, а там этих яндексбаров и прочего мусора столько, что я даже не знал о возможности такого количества ерунды в браузере. Это был просто ужас какой-то. Удалил все. Приходит опять и начинает психовать. Зачем ты удалил мои любимые яндексбары. Понимаешь, люди ведь и сами не против, чтобы за ними следили. По глупости своей же.
Аноним 29/09/17 Птн 06:20:43  161973272
>>161973106
>Он найдет один фильм, да там розовая прическа, но это не то, потом третий, четвертый, а потом просто подумает, не судьба значит

Тут будет что-то типа выдачи гугла по фотке, не все соответсвует ожиданию, но что-то похожее, а что-то и ведет куда нужно.
Также можно выдать список всех фильмов, которые поиск проасоциирует с женщиной и розовой прической. В конце концов чего страшного в том, что кто-то чего-то не найдет?
Перфекционизм страшная вещь в проектах и системах.

>Сама ведь знаешь

Твоя нейросеть выдает что я тян? Это не так, я бородатый мужик LOL
Аноним 29/09/17 Птн 06:23:37  161973319
>>161973177
>>161973070
И че, быстрее работает?
В чем профиты?
Ну, кластеризацией можно структуру выявить.
А дальше-то че?
Аноним 29/09/17 Птн 06:24:12  161973329
>>161973241
>Понимаешь, люди ведь и сами не против

Понимаю, поэтому дабы контроллировать данные, их обработку и не терять на этом власть, гос-во будет все больше данную сферу регулировать.
И поскольку люди сами думать не хотят и вкатиться в элементарную ИБ,, на уровне гигиены, то этим плотно займутся специальные службы. Да что там, уже занимаются...
Аноним 29/09/17 Птн 06:26:03  161973362
>>161973272
>Перфекционизм страшная вещь в проектах и системах.
Что есть - то есть. Хуже этого может быть, только если твой работодатель перфекционист.

Да я просто весь день проспал, под ночь встал, вроде и ночь уже прошла, а мысли все равно путаются. Хотел и ночью поспать еще, но уж очень интересная беседа выходит с тобой. Бороду не просто отпускаешь? Подрезаешь ножницами? Бритвой?
Аноним 29/09/17 Птн 06:27:37  161973381
>>161965364 (OP)
В распознование и классификацию умеешь?
если да: все что нужно пара-тройка пизженых алгоритмов сравнения текстов, дающих метрику
если нет: пошел нахуй
Аноним 29/09/17 Птн 06:30:08  161973408
>>161973319

>В чем профиты?

Ну например в выявлении аномалий, и вычленении подчерков и схем ушлых мошенников и снижении издержек на мошенничество с 10 до 3%, что составит по итогу года +15М баксов. Из которых за вычетом всех откатов вашему отделу пойдет лям (хотя мошенникам сука шло 5!!) ну и еще в проектиррование пару лямов вольют. Может быть...
Аноним 29/09/17 Птн 06:31:43  161973438
>>161973106
>А если человек ищет что-то, но сам не знает что? Вот мне нужен фильм, там была женщина с розовой прической.
См. Limits of control.
Там есть женщина с розовой прической, но тебе это ничем не поможет.
Аноним 29/09/17 Птн 06:32:12  161973446
>>161973329
Не думаю, что спецслужб особо заботят те люди, которые сами добровольно все данные на себя вк пишут. Причем социальные сети их даже за это поощряют. Больше нет надоедливого окошка или вот держи подарок за это как в одноклассниках. Спецслужб интересуют те, кто этого не делает. Нужно придумать новые способы получения данных, захватить какой-нибудь тор или дать людям суперсекретный мессенджер Телеграм с добавлением номера для безопасности. Я не удивлюсь, что и тут однажды надо будет номер телефона подтверждать перед отправкой нового поста. Сам то как думаешь, что тогда делать людям со знанием ИБ останется, если каждый шаг в интернете будет контролироваться?
Аноним 29/09/17 Птн 06:33:11  161973456
>>161973381
Что за алгоритмы? Расскажи нам хоть тут, интриган.
Аноним 29/09/17 Птн 06:35:06  161973481
>>161973408
А при чем тогда тут размер данных?

В чем профиты бигдаты в отличие от обычного программирования или управления.
Аноним 29/09/17 Птн 06:43:39  161973598
>>161973446
>Не думаю, что спецслужб особо заботят те люди, которые сами добровольно все данные на себя вк пишут.

Это так. Я же писал, что гос-во хочет эту область контролировать либо хотя бы поиметь часть контроля. Чтоб это не совсем уходило непонятным людям, или за бугор. По поводу того что делать при наступлении тотального контроля, сложно сказать, но вообще это война радара и маскировки. Конкуренция технологий. Усиливается контроль, усиливаются технологии данный контроль нивелирующие.
Аноним 29/09/17 Птн 06:46:57  161973648
>>161973481

В тот что без бигдаты, ты прошаренных мошенников хрен вычислиш, что в банкинге, что в страховых. Потому они и ворочают лямами, а ты нет. Тоже своего рода талант. Бигдата даст раскладку их паттернов, а там всплывет и их схема. Палю тему блин!
Аноним 29/09/17 Птн 06:48:44  161973680
>>161973598
Как думаешь, могло бы государство организовать огромную нейросеть для поимки преступников? Вот этот человек себя ведет не так как все в социальных сетях, у него посты странные, не репостит наши тру-новости, значит это маньяк или террорист. В общем, машина вычисляет и в документах отправляет списки потенциальных нарушителей.
Аноним 29/09/17 Птн 06:49:14  161973693
>>161973648
То есть вся бигдата сводится к кластеризации?
Аноним 29/09/17 Птн 06:51:13  161973735
>>161973648
Но для этого эту бигдату надо ведь сначала взять? Банки ведь не будут данные о доходах публиковать.
Аноним 29/09/17 Птн 06:51:26  161973743
>>161973693

Ну не вся же. Я частную задачу, частной задачи привел. Полно более творческого дерьма там.
Аноним 29/09/17 Птн 06:53:37  161973792
>>161973743
Я думаю, что он спрашивал про особенности работы с большими данными в отличии от обычных маленьких данных.
Аноним 29/09/17 Птн 06:54:21  161973806
>>161973680

Потенциально думаю да. Такой мегапарсер+харвестер+нейросеть. Но на данном этапе технологий и мышления там, этого не следует опасаться.
Аноним 29/09/17 Птн 07:03:06  161973978
>>161973792

Особенности в появлении возможности применения продвинутых стат методов и глубокого анализа, вычленения связей и построения по большому счету стат. моделей.
Просто технологии на сегодня позволяют тебе условно говоря крутить на кухне за вечер то, что раньше туго высирал целый отдел за полгода. Кластеризация это класс задач, только один из дохера возможных.
Аноним 29/09/17 Птн 07:03:14  161973982
>>161973806
А вот телефонные звонки можно ведь натренировать нейросеть для распознавания того, что все говорят и хранить это в текстовом виде?
Аноним 29/09/17 Птн 07:04:41  161974010
>>161973456
Алгоритмы классификация/кластеризация документов ничем не отличается от обычных алгоритмов распознования и классификации образов. Вопрос только наличия алгоритмов-метрик, которые дадут "на выходе" приемлемые относительные координаты двух текстов (или одного, если уже есть данные) в пространстве "всех текстов". Можно считать однокорневые слова, можно считать буквы/знаки препинания, можно анализировать фразы, можно тупо прогнать Байесом - с текстами много что можно делать, главное более-менее адекватными алгоритмами, которые на выходе дают набор чисел, имеющих смысл "координат" исходного текста в "пространстве текстов", определенным выбранными алгоритмами оценки. Далее этот набор чисел (координат многомерного пространства) обрабатывается "стандартными" (давно и хорошо) алгоритмами распознования и классификации.
Вот так все просто.
Что непонятно?
Аноним 29/09/17 Птн 07:05:01  161974017
>>161973806
И все же правительство России слишком начало увлекаться информационной сферой. Раньше ведь кибервойск не было.
Аноним 29/09/17 Птн 07:06:37  161974060
>>161973982

Шаришь.
Аноним 29/09/17 Птн 07:07:40  161974084
>>161974010
>>161973978
Мне кто-нибудь расскажет про задачи бигдаты КРОМЕ, блять, кластеризации?
Аноним 29/09/17 Птн 07:09:57  161974121
>>161973982
Теоретически. Так же как ты можешь натренировать свой комп реагировать на голосовые команды.
Аноним 29/09/17 Птн 07:12:09  161974170
>>161974084
Без кластеризации (автоматической или заданной ручками), бигдата никому не нужна.
Вот лежит перед тобой куча, огромная гора, сраный Эверест разных предметов.
Что ты там искать собрался?
Аноним 29/09/17 Птн 07:13:07  161974193
>>161974010
А дальше что? Ну вот кластеризовал ты, разбил тексты по разным сторонам. Какой профит от всего этого в данном случае? При загрузке документа можно и так указать категорию.
Аноним 29/09/17 Птн 07:14:42  161974223
>>161974170
Я просто весь тред пытаюсь выяснить, что такое бигдата.
И так нихуя и не понял.
Аноним 29/09/17 Птн 07:14:48  161974225
>>161974121
Не только комп же. Сейчас во всех топовых смартфонах есть распознавание поиска в гугле речью. Но тут речь идет об огромных масштабах. Сможет ли правительство с современными технологиями следить за всеми звонками в стране?
Аноним 29/09/17 Птн 07:15:18  161974232
>>161974170
>Что ты там искать собрался?
Ответ на этот вопрос и есть первоначальная кластеризация. Пересортировать предметы по объему или весу или плотности или пышности или материалам - не вопрос.
Как сортировать? Что искать будем?
Аноним 29/09/17 Птн 07:16:17  161974253
>>161974223
>бигдата
This is Big Data.
Аноним 29/09/17 Птн 07:18:35  161974303
>>161974232
>>161974170
И чем человек, занимающийся бигдата отличается от математика, экономиста или статиста?
Тем, что умеет программировать?
Аноним 29/09/17 Птн 07:19:33  161974314
>>161974253
>>бигдата
>This is Big Data.

За сим тред можно и закрывать ибо рекурсия. Я спать. Всем хорошего сна, кому-то на парах походу.
Аноним 29/09/17 Птн 07:20:18  161974330
>>161974170
Есть еще много чего, что можно делать с бигдатой. К примеру, можно визуализровать все то, что есть в виде изображения или видеоряда. Для этого может потребоваться машинное обучение, но совсем не обязательно это разбивать на группы. Сама бигдата может уже быть подготовленной и разжеванной.
Аноним 29/09/17 Птн 07:21:23  161974350
>>161974314
Спасибо, добрый человек, за беседу. Приятно было с тобой поговорить. Спокойного дня.
Аноним 29/09/17 Птн 07:21:29  161974351
>>161974303
>отличается от математика, экономиста или статиста?

Тем, что он все трое сразу + хирург по сортам говен и химик по фракциям и отделению солей тяжелых металов, тебе же выше писали...
Аноним 29/09/17 Птн 07:23:34  161974396
>>161974351
А какой толк то в этом?
Аноним 29/09/17 Птн 07:23:35  161974397
>>161974225
Распознование речи (как и синтез) существует уже давно. Как и множество подходов к реализации. Насколько я знаю, достаточно точного распознования беглой разговорной речи нет. С речью все много сложнее оказалось, нежели с изображением.
Аноним 29/09/17 Птн 07:24:48  161974428
0b595a9d-a9af-4[...].jpg (126Кб, 350x424)
>>161974396
Денег заработать, что же еще?
Аноним 29/09/17 Птн 07:26:23  161974464
>>161974397
Ну вот тут у нас есть капча. Можно написать алгоритм, который уберет шум. Можно даже написать алгоритм, который вычистит линии, но что делать когда одна цифра заходит на другую? Как ты этому нейросеть научишь?
Аноним 29/09/17 Птн 07:26:57  161974476
>>161974428
То есть, ты это только ради денег делаешь?
Аноним 29/09/17 Птн 07:27:42  161974493
>>161974397
Так, а почему с речью все так туго?
Аноним 29/09/17 Птн 07:29:20  161974529
>>161974223
Это бигпиздата. Забудь об этом. Никогда больше не вспоминай.
Аноним 29/09/17 Птн 07:30:24  161974557
>>161974396

>А какой толк то в этом?

Наверное также сто лет назад в 17-ом спрашивали про радиво, телехрафф и лампочки.
Ну действительно какой толк в этом всем а? Баловство же одно. Эххх
Толк видимо опять в том, чтобы толк был.

>>161974350
>Спокойного дня.

И тебе.
Аноним 29/09/17 Птн 07:32:26  161974598
>>161974557
Ты мне объясни, какую ощутимую пользу это приносит.
Аноним 29/09/17 Птн 07:33:47  161974623
>>161974557
Может контакты напишешь и еще как-нибудь пообщаемся?
Аноним 29/09/17 Птн 07:34:00  161974627
>>161974598
>какую ощутимую пользу это приносит.

конкретно вашему селу?
Аноним 29/09/17 Птн 07:35:33  161974677
>>161974627
Это просто модные и непонятные слова. Чем эти технологии помогут мне или тебе?
Аноним 29/09/17 Птн 07:42:08  161974848
>>161974330
>Есть еще много чего, что можно делать с бигдатой. К примеру, можно визуализровать все то, что есть в виде изображения или видеоряда.
Это так или иначе подразумевает КЛАСТЕРИЗАЦИЮ.
Проще говоря - выбор параметров, по котором огромная куча данных будет разбита на группы и раскрашена.
Для этого нужно задать цель этой разбивки/раскраски, ответить на вопрос "А что ты хочешь найти? что хочешь увидеть в этой куче данных?".
Простейшая задача - диаграммы по времени/странам, в примере запросов к сайту, статистика.
Сложнее - имея БД фотографий (или текстов) найти в этой БД фотографии этого человека (или его тексты), просто поиск. Для скорости уже нужна какая-никакая кластеризация, пусть даже хэш.
Или (еще сложнее) разбить все фото (и тексты) по национальным группам (а здесь уже сложнее, если лицо у тебя одно, то как задетектить текст русского (первый язык русский), если этот русский знает и общается на трех языках?), для разговорной речи еще сложнее, чем для просто текста.
Кстати кластеризация вообще не работает в гомогенной среде. Нечего там кластеризировать. Тогда - меняй метрики/пространство.
Аноним 29/09/17 Птн 07:43:36  161974881
>>161974476
С хуя ты решил, что я что-то делаю, лол?
Я нихуя не делаю, в интернетах сижу, статейки пишу иногда да копаюсь в алгоритмах.
Аноним 29/09/17 Птн 07:52:31  161975114
>>161974848
Ну вот допустим у нас есть несколько баз данных на несколько сот терабайт. Это посещения определенных сайтов. Я просто хочу получить статистику в виде графиков. Зачем мне для этого кластеризация?
Аноним 29/09/17 Птн 07:54:22  161975171
>>161974881
Нахуя тебе это? Почему бы не жить обычной жизнью как все? Найди друзей и девушку.
Аноним 29/09/17 Птн 07:57:19  161975230
>>161974464
>Как ты этому нейросеть научишь?
Вопрос вычислительной мощности. Тебе известен приблизительный (максимальный) размер символа HW на капче и его приблизительное положение XY (в крайнем случае можешь двигать и вращать нужную область) подавая полученную картинку на "входы" первичной "быстрой" нейросети, которая даст тебе простой ответ - символ это или нет (с учетом наложения), полагаю что можно научить этому. Если да - распозновать его "медленной нейросетью", которая даст на выходе уже сам символ. Таким вот способом.
Хотя лично я думаю над другим алгоритмом, возможностью нейросети которая на картинку выдаст сразу слово, даже если там слон нарисован, она тип скажет "ELEPHANT" А если кот на картинке, то - "КIT"
Аноним 29/09/17 Птн 08:03:54  161975413
>>161975230
Так уже есть ведь такие нейросети. Их же рисовать и научили.
Аноним 29/09/17 Птн 08:21:23  161975890
>>161975413
>Так уже есть ведь такие нейросети.
Конечно есть, но они не такие.


Аноним 29/09/17 Птн 09:43:28  161979102
>>161975890
А какие?
Аноним 29/09/17 Птн 09:47:49  161979287
>>161965364 (OP)
> кластеризации и классификации документов

Немного сталкивался, не знаю поможет тебе или нет.
Там затыка была типа не все данные формализуемы ВНЕЗАПНО (документы с точки зрения информационной безопасности, например. Ну типа, в деньгах нисколько а урон репутации пиздец...) и нужно разработать мини-метод по их формализации... ну если понимаешь о чвем я дальше сам допетришь
Аноним 29/09/17 Птн 09:54:57  161979619
>>161979287
>не все данные формализуемы
>разработать мини-метод по их формализации...

[Назад][Обновить тред][Вверх][Каталог] [Реквест разбана] [Подписаться на тред] [ ] 128 | 4 | 11
Назад Вверх Каталог Обновить

Топ тредов
Избранное