[Ответить в тред] Ответить в тред

16/08/16 - Запущен Двач Трекер
01/08/16 - Вернули возможность создавать юзердоски
09/07/16 - Новое API для капчи - внимание разработчикам приложений



Новые доски: /obr/ - Offline Battle Rap • /hv/ - Халява в интернете • /2d/ - Аниме/Беседка • /wwe/ - WorldWide Wrestling Universe • /ch/ - Чатики и конфочки • Создай свою

[Назад][Обновить тред][Вниз][Каталог] [ Автообновление ] 13 | 5 | 4
Назад Вниз Каталог Обновить

Hadoop-тред Hadoop-тред 08/08/16 Пнд 18:11:20  816180  
14706690802400.jpg (1163Кб, 3508x2480)
14706690802641.png (235Кб, 1438x807)
14706690802692.jpg (73Кб, 351x624)
Ищем полтора анона работающих с сабжем, пилим прохладные как ебались с установкой в первый раз у мамки в гараже, меряемся письками чья конторка использует сабж максимально через задницу, уносим тред в бамплимит срачами.
Аноним # OP  08/08/16 Пнд 18:15:12  816183
14706693124410.jpg (47Кб, 620x726)
https://www.amazon.com/Mastering-Hadoop-Sandeep-Karanth/dp/1783983647
Аноним # OP  08/08/16 Пнд 18:16:26  816187
14706693863040.jpg (36Кб, 500x617)
https://www.amazon.com/Hadoop-MapReduce-v2-Cookbook-Second/dp/1783285478/ref=sr_1_2?s=books&ie=UTF8&qid=1470669328&sr=1-2&keywords=hadoop+cookbook
Аноним 09/08/16 Втр 03:39:53  816401
14707031939200.jpg (50Кб, 332x480)
Лекции он mail.ru технострим https://www.youtube.com/watch?v=8tzCrau5JuE&list=PLrCZzMib1e9rPxMIgPri9YnOpvyDAL9HD

Меня хватило на 3 лекции, лектор читает скучно и медленно, поэтому я купил "Hadoop. Подробное руководство" http://www.piter.com/product/hadoop-podrobnoe-rukovodstvo

Аноним 09/08/16 Втр 14:42:59  816576
>>816401
По хадупу вообще не очень много годных материалов. Советую еше глянуть на книжку из первого бампа. Какой у тебя бекграунд?
Аноним 09/08/16 Втр 18:04:31  816692
анончик поясни вкратце, нахуй твой слоняра нормальным людям нужен то?
Аноним # OP  09/08/16 Втр 20:15:06  816785
>>816692
>вкратце
Пойду героином вмажусь, сформулирую.
Аноним # OP  09/08/16 Втр 20:54:36  816819
14707652763500.jpg (122Кб, 500x497)
>>816692
Слоняра нужен людям, у которых есть немножечко петабайт данных, (необязательно структурированных) которые:
- можно неспешно вспахивать для анализа;
- с одной стороны, не так критичны, чтобы хранить их на дорогом, быстром, фейловерном железе;
- с другой стороны все-равно было бы впадлу их потерять.

Хадуп ставится на большой кластер серваков, после чего в него можно сохранять файлы больших размеров. Очень больших.


Сохраняясь в Хадуп, файл разбивается на куски, которые расходятся по сервакам максимально паралельно. Бекапы этих кусков прячутся других серваках. xzibit.jpg
Таким образом, если в кластере падает сервак, ты не теряешь никаких данных, бекап каждого проёбанного куска файла лежит где-то на другом, еще рабочем, серваке.
На этом этапе компания перестает тратить бабло на SAS-ы хуясы, RAID-ы и пр. дорогие железки


У данных хранящихся таким пиздоватым способом появляется очевидное преимущество - их можно читать и анализировать паралельно. быстрее

Когда маркетинг-петушкам нужно провести очередной очень важный ресерч клиентских данных за 100500 лет, укротители слоников пишут Map-Reduce программку, которая после запуска попадет на каждую ноду кластера, паралельно на каждом ноде соснет свою порцию данных, сделает с ними что там было нужно а потом смерджит MERGE результаты со всех нодов в одно место.
Аноним 09/08/16 Втр 20:59:57  816825
>>816819
>Когда маркетинг-петушкам нужно провести очередной очень важный ресерч клиентских данных за 100500 лет
а нам креативным погромистам, двигающим ит прогресс , нахуй эта петушиная аналитика?
Аноним 09/08/16 Втр 21:01:10  816827
>>816819
Map reduce уж слишком устаревший. В своей шараге используем tez как движок в sql интерпритатор для hive. В остальном только спарк.
Аноним # OP  09/08/16 Втр 21:14:38  816837
>>816827
Расскажи про спарк, анончик.
Юзаете МЛ?
Аноним # OP  09/08/16 Втр 21:25:00  816844
>>816825
аналитика - один из примеров использования йобы.
Аноним 09/08/16 Втр 21:27:42  816846
>>816837
Спарк такой же движок для обработки данных, помимо джавы поддерживает нативно питон и скалу. В целом он быстрее за счет того, что не сбрасывает на диск все промежуточные вычисления. А в остальном тоже самое, успешно аработает у нас по верх hdfs, используем его для агрегации сырых данных. МЛ не используем, ибо негде, только с корешем в своем небольшом проекте классифиируем картинки через cnn. Соре за сумбур
Аноним 09/08/16 Втр 21:57:50  816871
>>816846
>Соре за сумбур
Та заебись сказал же

Есть смысл готовить вкат в спарк без знания скакалки?
Пока не слышал чтобы ее без скалолазов юзали, а изучение скалы еще предстоит.

[Назад][Обновить тред][Вверх][Каталог] [Реквест разбана] [Подписаться на тред] [ ] 13 | 5 | 4
Назад Вверх Каталог Обновить

Топ тредов
Избранное