/pr/ - NOSQL & BigData

NOSQL & BigData Аноним 24/02/16 Срд 00:39:05 №664620

Сап анон. Надоела рутина, хочу вкатываться в тему. Поясни за сабж - с чем работал конкретно, в какой сфере. какой геморрой получал и какие плюшки в сравнении с реляционными субд извлекал. Особенно интересно за кластеризацию послушать.

Аноним 24/02/16 Срд 14:22:14 №665038

>>664620 (OP)
Спрошу здесь. Есть коллекция в монге, у которой поле - большой массив. Как эффективнее, например, найти пересечение по некоторым документам этих массивов с заданным?
Можно вытащить нужные документы и найти пересечение в ноде.
Стоит ли заморачиваться делать это через aggregate?
Можно ли использовать $unwind на больших массивах для промежуточных результатов, это эффективно реализовано?

Аноним 24/02/16 Срд 17:34:24 №665240

>>665038
Попердолился с этой вашей мангой, получилось.
http://pastebin.com/F0V3BFMp
Нужно было отфильтровать из массива ids те значения, которые есть в базе, где они хранятся тоже в массивах.
На правах бампа

Аноним 24/02/16 Срд 17:50:51 №665252

Напомню, что всё, что меньше десятка терабайт - это вообще нихуя не бигдата

Аноним 24/02/16 Срд 20:53:21 №665448

слишком сложно.

Для реальной практики нужны кластеры, серверы, команда спецов.

Дома на туалете нихуя не выйдет.

Аноним 24/02/16 Срд 22:35:47 №665601

Поясните про айроспайк
inb4. >spike

Аноним 24/02/16 Срд 23:24:21 №665688

>>665240
Это под ноду или где?
Давай лучше бенчмарк, если есть.

Аноним 25/02/16 Чтв 01:00:41 №665828

>>665688
Метеор. В бенчмарки не могу. Не знаю как сделать, да и лень немного.
В том решении вычисляются разности массивов, а затем они объединяются. Можно было сделать проще: сразу $unwind по полю с массовом, а потом выборка типа { $in: ids } по этому полю.
Это было бы норм, если $unwind не просто строит разбиение в памяти, а как-то использует отложенные вычисления. Но, наверное, это не так.
диванный оптимизатор

Аноним 25/02/16 Чтв 01:19:01 №665840

>>665828
мангу не ковырял, но, подозреваю, что такие стильные-модные-молодежные ребята не будут делать тупо на кортежах. Там должны быть какие-нибудь хэшмапы или что-то такое.

Аноним 25/02/16 Чтв 02:05:48 №665862

Годный тред. Подпишусь.

Опции
Имя
Тема
Пост	15000

	Sage Ватермарка Мод тег ОП треда
Файлы
Captcha

Перед отправкой сообщения прочтите FAQ, FAQ раздела и правила раздела. vk.com/ru2ch - оФФициальная группа VK