Суп котаны. В общем, нужно будет парсить кейколлектором дохуя ядер для новых сайтов. Кто сталкивался с данной программой знает, что ебучие разрывы интернета часто дропают многодневный сбор ключей. А у меня мало того что интернет не самый стабильный, так еще и ноутбук довольно ебанутый, может и перестать заряжаться при подключенной зарядке, wi-fi резко отвалиться и еще уйму кульбитов выкинуть. Потому, у меня возникла мысль: можно ли арендовать какой-нибудь сервак, поставить туда ШИНДОУС (тип, виртуальная машина) и накатить кейколлектор, чтобы парсило независимо от моего комплюхтера и интернетов? Что для этого нужно, какое ПО, какой сервак и где заказывать (подешевле желательно)? Как всю эту хуйню настроить? Буду премного благодарен за советы.
Прямо на шиндовсазуре готовые виртуальные сервакиРаньше помню был месяц бесплатный, всем двачиком майнили битки
>>90939>Прямо на шиндовсазуре готовые виртуальные сервакиМожно ссыль на норм вариант?
>>90940>шиндовсазуре>azure.microsoft.com>Можно ссыльНо хуй знает что там по ценам, возможно не самый лучший вариант, еще стоит посмотреть амазоновские серваки
>>90941>azure.microsoft.comБля, что-то они пиздец как суют анальный зонд при регистрации.
>>90924 (OP)>>ебучие разрывы интернета часто дропают многодневный сбор ключей>>многодневныйСколько у тебя ключей?>>ебучие разрывы интернета часто дропают многодневный сбор ключейХуй знает о чем ты. А если даже и так, то тебе влом пару кликов сделать?
>>90943>Сколько у тебя ключей?Да дохуя, парсится левая колонка яндекса может реально неделю, за это время насобирать 100 тысяч ключей. Понятно, что низкочастотки (до 10) - выпиливаются, потом чиститься ядро от мусора (левых запросов, коммерции, запросов с географической привязкой) и остается максимум 10 тысяч ключей, но все же, сбор очень долгий. >Хуй знает о чем ты. А если даже и так, то тебе влом пару кликов сделать?Какие нахуй клики? Сбился парсинг левой колонки яндекса - пиздуешь собирать заново сутками.
>>90944И это при том, что парсится всё это дело с помощью 70 проксей в 50 потоков.
>>90944>>Сбился парсинг левой колонки яндекса - пиздуешь собирать заново суткамиНу нет же, просто собираешь дальше с того места.
>>90945Что-то не то. Я с 5 потоков 10к ключей собрал за пол дня. К тому же, зачем тебе вся эта удаленная поебень, когда можно уже начинать работать с ключами пока остальные не спарсились?
>>90948>Ну нет же, просто собираешь дальше с того места.Оно потом нихуя не завершает сбор, крутит по хуй знает какому кругу старые фразы и в целом, сбоит.>>90949>Что-то не то. Я с 5 потоков 10к ключей собрал за пол дня. К тому же, зачем тебе вся эта удаленная поебень, когда можно уже начинать работать с ключами пока остальные не спарсились?10, а не 100 же. Да и что с ними работать, пока не снял точные частотки "!", только лишняя и огромная работа, ведь с частотками меньше 10 запросы сразу дропаю, а их очень много.
>>Оно потом нихуя не завершает сбор, крутит по хуй знает какому кругу старые фразы и в целом, сбоит.Пикр>>10, а не 100 же.Тебе сразу все 100к не нужны. Спарсил группу, снял частотность, начал работать. Пока всё сделаешь, уже другая группа будет готова. >> пока не снял точные частотки "!", только лишняя и огромная работаЗаведомо явные минус слова и гео можно убрать сразу. Разбить по группам. >>ведь с частотками меньше 10 запросы сразу дропаю, а их очень многоА зря. Нужно видеть что у тебя плетется в хвосте.Хотя всё зависит от ниши
>>90953>ПикрОно всеравно глючит и может допускать ошибки, проверено опытным путем. Безразрывно парсить надежнее всего. >Тебе сразу все 100к не нужны. Спарсил группу, снял частотность, начал работать. Пока всё сделаешь, уже другая группа будет готова. Заведомо явные минус слова и гео можно убрать сразу. Разбить по группам. Бля, да все мне нужны, все. Понимаешь, я не дрочу на один микросайтик микроядро, мне нужно сейчас собрать 10 ядер на большие статейники, у меня есть бюджет сейчас на создание 10 жирных таких информационников со всеми перделками, и будет еще больший (на 40 сайтов) в ближайшей перспективе. Потому, тут процесс нужен отлаженный, а не гомоебля. По плану: паршу левую колонку, паршу расширения по рукам, все это дело фильтрую от левака и отдаю специально обученным хохлам на группировку. >А зря. Нужно видеть что у тебя плетется в хвосте.Хорошо дрочиться с одним микронишевым сайтиком, но это не вариант для нормальной работы.
>>90954>>Оно всеравно глючит и может допускать ошибки, проверено опытным путем. Безразрывно парсить надежнее всего. Конечно глючит, конечно допускает, но я думаю ты больше времени на еблю с серваком потратишь, чем выиграешь. >>Бля, да все мне нужны, все. Понимаешь, я не дрочу на один микросайтик микроядро... >>Потому, тут процесс нужен отлаженный, а не гомоебля.>>отдаю специально обученным хохлам на группировку. Такс, что тут у нас, seo контора. >>не вариант для нормальной работы.Мне тут птичка нашептала, что 95% компаний - хуета и не знают что делают. Судя по тому как ты описываешь процесс, птичка была права.
>>90956Буду очень рад если ты поделишься бюджетами и сроками, мне для сравнения. Только между нами
>>90956>Такс, что тут у нас, seo контора. >95% компанийЛол, компания тут вся я и хохлы-фрилансеры разного профиля (семантик, дизайнер-верстальщик, похремист для различных плюшек на сайтах, уйма рерайтеров на etxt). И проекты не на кого-то, я сугубо мои, так что это не фирма. Проекты к тому же не коммерческие, а информационные.>Судя по тому как ты описываешь процессЯ же говорю, это не дрочево с коммерческими запросами, тут десятки тысяч ключей, нет смысла связываться с мелкой хуитой и убивать на нее уйму денег и времени, группа запросов меньше суммарной частотки в 90 - мусор, запросы меньше 10 - мусор, на который бюджеты не растрачиваются (ведь каждая статья денег стоит). >Буду очень рад если ты поделишься бюджетами и сроками, мне для сравнения. Зависит от сайта, где-то нужно много плюшек всяких добавлять, где-то только дизайн накатить по-сути, да и количество статей, количество символов в них сильно зависит от ниши: где в стройке в среднем 500 статей на сайт по 8-9к символов, то в медичке, юридической темактике можно и двумя сотнями по 5к обойтись. В среднем, статейник стоит создать 70-100к (при том очень много я сам делаю), срок - год-полтора, но у меня заранее припасены "заглушечки" под будущие проекты, что даёт плюс для поисковиков и тогда развернуть проект выходит быстрее. Еще многие домены куплены с историей для этой же цели.
>>90924 (OP)> кейколлекторчё, вообще перестали твой кейколлектор покупать?
>>90962>чё, вообще перестали твой кейколлектор покупать?Ты долбаёб? Долбаёб.
>>90961>>Проекты к тому же не коммерческие, а информационныеЗачем вообще это продвигать? Или ты всё таки как-то трафик монетизируешь?Очень странные ощущения. Вот я вроде де бы тем же самым занимаюсь, но в своем загоне. Такое чувство, что я делаю дольше но качественнее, а ты по быстрому и на отъебись. С другой стороны у тебя свое дело с какой-то прибылью и опыт, а у меня этого нет. Вообщем по самому первому вопросу помочь не могу. Странно что у тебя нет нормальной пеки под подобные цели - парсит себя ночами и заебись. Но мне кажется с серваком слишком много ебли. Гугли конторы которые серваки сдают и еби техподдержке мозг.На секунду даже хотел поинтересоваться насчет работы на тебя, но подумал ну его нахуй
>>90965>Или ты всё таки как-то трафик монетизируешь?Ну разумеется. Адсенс, РСЯ, где-то лиды, где-то тизерки. При том это намного выгоднее, чем продвигать какой-то днищеконторке за копейки их коммерческую малафью. >а ты по быстрому и на отъебисьЕсть определенная технология, которой нужно придерживаться, только и всего. Если натужно дрочиться с одним проектом - мало толку получиться, ведь все прошаренные зарабатывают на количестве. Выкатить те же 500 статей за месяцок на сайт - это не хуй собачий, тут не будешь проверять написание каждой запятой. >Странно что у тебя нет нормальной пеки под подобные цели - парсит себя ночами и заебись.Да пеку я разобрал и продал по запчастям, после того, как в очередной раз материнка сгорела. А ноут у меня очень йобовый был куплен sony vaio, но оказалось, что клепают косоглазые ту еще разваливающуюся хуйню (недаром что закрылось подразделение по ноутам). А так, да, вторым вариантом, кроме сервера, купить другой ноут чисто для парсинга, но сервер как-то надежнее на мой взгляд.
Бля. Ребят. Поясните кто-нибудь. У меня тут проект на работке на 50к ключей, давно с кейколлектором не работал, через директ моментально капчи сыпятся. Мне покупать прокси и пару аккаунтов? Или купить антикапчу? Или какой-нибудь API доступ к типа megaindex?
>>91026Ну и лалка. Ясен хер, нужно пачку прокси, антиГЕЙт (он же anti-capcha) затаривать.
>>91027И все это с одного акка на директе? или ты про прямой парсинг с вордстата?
>>91028>И все это с одного акка на директе?Для директа тоже загружаются специально нареганные аккаунты.
>>91029Можешь подсказать сколько прокси и сколько акков для нормальной работы взять?
>>91030>Можешь подсказать сколько прокси и сколько акков для нормальной работы взять?Ну, для данных директа хватит и 10.
>>91031на каждый акк выходит один хороший прокси?
>>91032Типо того.
>>91033спасибо
>>91033погодиииии, брогде лучше взять такие прокси и акки?p.s пиздец мороки, раньше директ капчи не выкидывал (ну я года три назад кк использовал ток)))
>>91036>где лучше взять такие прокси и акки?Ну, десяток акков и сам можешь нарегать. Какие я использую прокси говорить не буду, т.к если все бросятся их юзать для кейколлектора - потом хуй что спарсишь. Хватает предложений в интернетах одним словом.
>>91037god bless you
Ну всё котаны, немного попердолился и таки оформил сервачок на шиндоус и поставил туда гейколлектор. Так что, вариант вполне рабочий для стабильного парсинга без привязки к своему компу. Цена вопроса - буквально 800 рупий в месяц.
>>91405Можно ссылку, где сервак взял. Так же надо сервак под КК и авитул, а заморачиваться с поиском лень. Зарегаюсь по твоей рефке.
>>91485https://www.1gb.ru