[Ответить в тред] Ответить в тред

Тред закрыт.


26/03/16 - Конкурс: Помоги гомункулу обрести семью!
15/10/15 - Набор в модераторы 15.10 по 17.10
27/09/15 - Двач API — Инструкция к применению



[Назад][Обновить тред][Вниз][Каталог] [ Автообновление ] 0 | 1 | 0
Назад Вниз Каталог Обновить

Поясните за многопоточность и веб скрапинг 07/03/16 Пнд 18:21:39  679467   Обсуждение закрыто  
14573640993280.jpg (50Кб, 640x480)
Анон, у меня такая проблема. Есть сайт https://www.zaubacorp.com/company-list
И 1.6 кк компаний на нем. Мне нужно спиздить инфу о них. Как пиздить немного - я заю, а как спиздить все и быстро? Поясню
Я пишу парсер на c#, у меня в наличии 1000 прокси. Пробовал пилить 50 потков каждый на отдельном прокси, загружают данные через хттпреквест. По скорости - тотальная хуйня. Скорость не сильно отличается по факту от парсинга в 1 поток. Почему так? что является боттлнеком в данной системе? Что покурить чтобы сделать 500 или 1000 потоков для парса сразу тонны страниц за 1 шаг ? Может есть какие-то готовые решеня? Либы? Я в отчаянии, дедлайн через 2 дня )

[Назад][Обновить тред][Вверх][Каталог] [Реквест разбана] [Подписаться на тред] [ ] 0 | 1 | 0
Назад Вверх Каталог Обновить

Топ тредов