/pr/ - Hadoop-тред

Hadoop-тред Hadoop-тред 08/08/16 Пнд 18:11:20 №816180

Ищем полтора анона работающих с сабжем, пилим прохладные как ебались с установкой в первый раз у мамки в гараже, меряемся письками чья конторка использует сабж максимально через задницу, уносим тред в бамплимит срачами.

Аноним # OP 08/08/16 Пнд 18:15:12 №816183

https://www.amazon.com/Mastering-Hadoop-Sandeep-Karanth/dp/1783983647

Аноним # OP 08/08/16 Пнд 18:16:26 №816187

https://www.amazon.com/Hadoop-MapReduce-v2-Cookbook-Second/dp/1783285478/ref=sr_1_2?s=books&ie=UTF8&qid=1470669328&sr=1-2&keywords=hadoop+cookbook

Аноним 09/08/16 Втр 03:39:53 №816401

Лекции он mail.ru технострим https://www.youtube.com/watch?v=8tzCrau5JuE&list=PLrCZzMib1e9rPxMIgPri9YnOpvyDAL9HD

Меня хватило на 3 лекции, лектор читает скучно и медленно, поэтому я купил "Hadoop. Подробное руководство" http://www.piter.com/product/hadoop-podrobnoe-rukovodstvo

Аноним 09/08/16 Втр 14:42:59 №816576

>>816401
По хадупу вообще не очень много годных материалов. Советую еше глянуть на книжку из первого бампа. Какой у тебя бекграунд?

Аноним 09/08/16 Втр 18:04:31 №816692

анончик поясни вкратце, нахуй твой слоняра нормальным людям нужен то?

Аноним # OP 09/08/16 Втр 20:15:06 №816785

>>816692
>вкратце
Пойду героином вмажусь, сформулирую.

Аноним # OP 09/08/16 Втр 20:54:36 №816819

>>816692
Слоняра нужен людям, у которых есть немножечко петабайт данных, (необязательно структурированных) которые:
- можно неспешно вспахивать для анализа;
- с одной стороны, не так критичны, чтобы хранить их на дорогом, быстром, фейловерном железе;
- с другой стороны все-равно было бы впадлу их потерять.

Хадуп ставится на большой кластер серваков, после чего в него можно сохранять файлы больших размеров. Очень больших.

Сохраняясь в Хадуп, файл разбивается на куски, которые расходятся по сервакам максимально паралельно. Бекапы этих кусков прячутся других серваках. xzibit.jpg
Таким образом, если в кластере падает сервак, ты не теряешь никаких данных, бекап каждого проёбанного куска файла лежит где-то на другом, еще рабочем, серваке.
На этом этапе компания перестает тратить бабло на SAS-ы хуясы, RAID-ы и пр. дорогие железки

У данных хранящихся таким пиздоватым способом появляется очевидное преимущество - их можно читать и анализировать паралельно. быстрее

Когда маркетинг-петушкам нужно провести очередной очень важный ресерч клиентских данных за 100500 лет, укротители слоников пишут Map-Reduce программку, которая после запуска попадет на каждую ноду кластера, паралельно на каждом ноде соснет свою порцию данных, сделает с ними что там было нужно а потом смерджит MERGE результаты со всех нодов в одно место.

Аноним 09/08/16 Втр 20:59:57 №816825

>>816819
>Когда маркетинг-петушкам нужно провести очередной очень важный ресерч клиентских данных за 100500 лет
а нам креативным погромистам, двигающим ит прогресс , нахуй эта петушиная аналитика?

Аноним 09/08/16 Втр 21:01:10 №816827

>>816819
Map reduce уж слишком устаревший. В своей шараге используем tez как движок в sql интерпритатор для hive. В остальном только спарк.

Аноним # OP 09/08/16 Втр 21:14:38 №816837

>>816827
Расскажи про спарк, анончик.
Юзаете МЛ?

Аноним # OP 09/08/16 Втр 21:25:00 №816844

>>816825
аналитика - один из примеров использования йобы.

Аноним 09/08/16 Втр 21:27:42 №816846

>>816837
Спарк такой же движок для обработки данных, помимо джавы поддерживает нативно питон и скалу. В целом он быстрее за счет того, что не сбрасывает на диск все промежуточные вычисления. А в остальном тоже самое, успешно аработает у нас по верх hdfs, используем его для агрегации сырых данных. МЛ не используем, ибо негде, только с корешем в своем небольшом проекте классифиируем картинки через cnn. Соре за сумбур

Аноним 09/08/16 Втр 21:57:50 №816871

>>816846
>Соре за сумбур
Та заебись сказал же

Есть смысл готовить вкат в спарк без знания скакалки?
Пока не слышал чтобы ее без скалолазов юзали, а изучение скалы еще предстоит.

Опции
Имя
Тема
Пост	15000

	Sage Ватермарка Мод тег ОП треда
Файлы	Макс объем: 6Mб, макс кол-во файлов: 4 Кликни/Брось файл
Captcha

Перед отправкой сообщения прочтите FAQ, FAQ раздела и правила раздела. vk.com/ru2ch - оФФициальная группа VK 2channel.hk - Пасскодач 2chtv.ru - Тивач