Сап анон. Надоела рутина, хочу вкатываться в тему. Поясни за сабж - с чем работал конкретно, в какой сфере. какой геморрой получал и какие плюшки в сравнении с реляционными субд извлекал. Особенно интересно за кластеризацию послушать.
>>664620 (OP)Спрошу здесь. Есть коллекция в монге, у которой поле - большой массив. Как эффективнее, например, найти пересечение по некоторым документам этих массивов с заданным?Можно вытащить нужные документы и найти пересечение в ноде.Стоит ли заморачиваться делать это через aggregate?Можно ли использовать $unwind на больших массивах для промежуточных результатов, это эффективно реализовано?
>>665038Попердолился с этой вашей мангой, получилось.http://pastebin.com/F0V3BFMpНужно было отфильтровать из массива ids те значения, которые есть в базе, где они хранятся тоже в массивах.На правах бампа
Напомню, что всё, что меньше десятка терабайт - это вообще нихуя не бигдата
слишком сложно.Для реальной практики нужны кластеры, серверы, команда спецов.Дома на туалете нихуя не выйдет.
Поясните про айроспайкinb4. >spike
>>665240Это под ноду или где? Давай лучше бенчмарк, если есть.
>>665688Метеор. В бенчмарки не могу. Не знаю как сделать, да и лень немного.В том решении вычисляются разности массивов, а затем они объединяются. Можно было сделать проще: сразу $unwind по полю с массовом, а потом выборка типа { $in: ids } по этому полю. Это было бы норм, если $unwind не просто строит разбиение в памяти, а как-то использует отложенные вычисления. Но, наверное, это не так.диванный оптимизатор
>>665828мангу не ковырял, но, подозреваю, что такие стильные-модные-молодежные ребята не будут делать тупо на кортежах. Там должны быть какие-нибудь хэшмапы или что-то такое.
Годный тред. Подпишусь.