Главная Настройка Mobile Контакты NSFW Каталог Пожертвования Купить пасскод Pics Adult Pics API Архив Реквест доски Каталог стикеров Реклама
Доски


[Ответить в тред] Ответить в тред


<<
[Назад][Обновить тред][Вниз][Каталог] [ Автообновление ] 76 | 4 | 15

Аноним # OP  13/04/18 Птн 19:12:57  174316813  
MusicForProgram[...].png (887Кб, 1140x570)
Погромисты всех мастей!

Ребзя, объясните. Меня интересует создание ботов/скриптов (не уверен к чему это отнести). Вообщем штук, которые бы делали следующие задачи:
1) Сканеры. Шерстят весь инет на поиск необходимой инфы, сравнивают найденные результаты и предоставляют все это своему создателю. По типу сканеров авиабилетов, или номеров отелей.
2) Боты для накрутки чего-либо. Пару лет назад видел в ВК коммент, на который его автор накрутил дохуя лайков. До сих пор интересует как это работает.

Но, конечно же, я чмоха, которая о программировании только слышала. Поэтому спрашиваю у вас:

На каких ЯП пишут интересующие меня штуки?
Какие знания нужны для такой разработки?
Как вообще это работает вкратце? Т.е. например возьмем сканер авиабилетов. Это программа, алгоритм работы которой повторяет действия человека только за считанные секунды?
Аноним # OP  13/04/18 Птн 19:13:59  174316867
бамп
Аноним # OP  13/04/18 Птн 19:14:19  174316889
бамп
Аноним # OP  13/04/18 Птн 19:14:37  174316904
бамп
Аноним 13/04/18 Птн 19:14:50  174316914
Бамп
Аноним # OP  13/04/18 Птн 19:14:55  174316919
бамп
Аноним 13/04/18 Птн 19:15:11  174316931
Бамп
Аноним # OP  13/04/18 Птн 19:15:25  174316942
бамп
Аноним 13/04/18 Птн 19:15:43  174316960
IMG201804110956[...].jpg (3501Кб, 4160x2340)
Бамп
Аноним 13/04/18 Птн 19:16:01  174316980
Бамп
Аноним # OP  13/04/18 Птн 19:16:07  174316984
бамп
Аноним 13/04/18 Птн 19:16:18  174316993
Бамп
Аноним # OP  13/04/18 Птн 19:16:29  174316999
бамп
Аноним 13/04/18 Птн 19:16:33  174317004
Нужен линукс. Гугли "bash-скрипты".

Или другой путь, можно на PHP написать.
Аноним 13/04/18 Птн 19:16:40  174317011
Бамп
Аноним 13/04/18 Птн 19:17:03  174317025
Бамп последний
Аноним 13/04/18 Птн 19:17:51  174317064
>>174316813 (OP)
Слишком общее ТЗ.
Для взаимодействия с сайтами тебе всяко потребуется JS, но ты можешь выбрать любой другой язык и через какой-нибудь библиотечный костыль пулять JSON'ом в целевые сайты. Если тебе похуй на язык, изучай вэбкит или JS-скрипткиддинг. Руководств для таких энтузиастов как говна.
Аноним 13/04/18 Птн 19:17:57  174317071
>>174316813 (OP)
>Сканеры
Гугли web spider или ткак-то так. Короче на питоне, бля, хули я тут распинаюсь, а ну пошёл нахуй ! пидр
Аноним # OP  13/04/18 Птн 19:18:20  174317088
>>174317004
Т.е. из под шиндовс такие вещи не пишут?
Получается это в основном работа с серверами сайтов?
Аноним 13/04/18 Птн 19:18:24  174317091
На любых
Регулярные выражения
Скачивает HTML и парсит его
Аноним 13/04/18 Птн 19:18:50  174317117
>>174316813 (OP)
Тебе нужно что-то типа джава. На нем майнкрафт работает значит и для твоих нужд должен подойти.
Аноним 13/04/18 Птн 19:19:02  174317126
Гугли nightmare.js
Аноним 13/04/18 Птн 19:19:29  174317157
>>174317091
>парсит html
>регекспами
То ли олдфажная шутейка, то ли хуй знает. Сложно.
Аноним 13/04/18 Птн 19:20:36  174317225
>>174317157
Сайты в 2018 все на реакте и жсоне? А в жсоне что? Один хуй задача отправить запрос, получить ответ и распарсить его.
Аноним # OP  13/04/18 Птн 19:20:47  174317237
Че, пацаны, яваскрипт?
Аноним 13/04/18 Птн 19:21:04  174317255
>>174317157
А как сейчас модно? Куча композиций над элементарными функциями?
Аноним 13/04/18 Птн 19:21:12  174317263
>>174316813 (OP)
1.) Номера отелей не сканируются по всему интернету, а передаются из каждого отеля в единую базу по API (загугли что это), потом в этой базе через скажем booking com ты ищешь нужный номер по заданным параметрам.
2.) Лайки накручиваются не ботами, а через специальные сервисы за деньги.
Аноним 13/04/18 Птн 19:21:28  174317273
>>174316813 (OP)
>Вообщем
Аноним 13/04/18 Птн 19:21:29  174317275
>>174317088
если логически подумать, то так оно и есть
Аноним 13/04/18 Птн 19:23:11  174317364
>>174317225
>>174317255
>Вы не можете разобрать HTML-код [X] с регулярным выражением. Поскольку HTML не может быть проанализирован с помощью регулярных выражений. Regex не является инструментом, который можно использовать для правильного анализа HTML.
Как бы HTML не парсится регулярками. В принципе.
Аноним # OP  13/04/18 Птн 19:24:07  174317421
>>174317275
Я верно понимаю, что фреймворки - это интерфейс для написания кода? И типо эти саммые фреймворки запускаются и на шиндовс? Или я че-то путаю?
Аноним 13/04/18 Птн 19:24:09  174317427
>>174317364
Зачем нельзя?
Аноним 13/04/18 Птн 19:24:33  174317453
>>174317421
да
Аноним 13/04/18 Птн 19:24:34  174317455
>>174317364
Проиграл
Аноним 13/04/18 Птн 19:24:36  174317460
SICP
I
C
P
Аноним 13/04/18 Птн 19:25:21  174317501
>>174317427
Потому что криво работает, вернее гарантированно криво отработает, там вложенность, а тут нет вложенность, всё, пиздец. Это целый мем с переполни_стэк парсинг хтмл регекспами, вот и подумал. Но нет.
Аноним 13/04/18 Птн 19:26:22  174317554
>>174317421
>фреймворки
Набор готовых функций, так бы тебе их пришлось писать самому. А может это библиотека. Кто знает.
Аноним 13/04/18 Птн 19:27:47  174317638
>>174317501
>елый мем с переполни_стэк
https://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454
Аноним 13/04/18 Птн 19:28:15  174317658
>>174317501
Что ты предлагаешь? Парсить нейросетью через абстрактную DOM ферму над абстракной DOM фабрике посредством абстракного DOM запроса который выдает нейросеть по запросу пользователя НАЙДИ МНЕ ПРИКОЛЬНЫЕ НОМИРА В ГОСТИНКАХ ГЫГЫ?
Аноним 13/04/18 Птн 19:28:59  174317693
>>174316813 (OP)
>Вообщем
В общем, пидоран тупой.

>1) Сканеры
Парсеры блядь.

>2) Боты для накрутки чего-либо
Гугл открой
Аноним 13/04/18 Птн 19:29:53  174317738
image.png (295Кб, 500x375)
image.png (320Кб, 466x700)
>>174317658
Ты что дебил?
Аноним # OP  13/04/18 Птн 19:30:26  174317764
>>174317263
>передаются из каждого отеля в единую базу
Т.е. владельцы отелей сливают всю инфу о наличии номеров и их стоимости в одну общую кучу со всеми и именно с этой кучей работает сканер, а не с отдельными сервисами/сайтами отелей?
2) Ну хз, сомневаюсь что он тогда через сервис нарутил, тем более за бабло.
Аноним 13/04/18 Птн 19:30:31  174317767
>>174317738
Нет ты. Хуйню сказал и рад, траль ебаный
Аноним 13/04/18 Птн 19:31:36  174317823
>>174317767
Парсер использовать, например BeautifulSoup, религия не позволяет? Какие нахуй абстрактные дома нейросетевые, ты чо дурак блядь
https://www.youtube.com/watch?v=_VxQrbNPxO4
Аноним 13/04/18 Птн 19:31:55  174317834
>>174317764
не совсем так, но в целом ты прав
Аноним # OP  13/04/18 Птн 19:32:13  174317847
>>174317693
Ты классный
Аноним 13/04/18 Птн 19:32:41  174317873
You can't parse [X]HTML with regex. Because HTML can't be parsed by regex. Regex is not a tool that can be used to correctly parse HTML. As I have answered in HTML-and-regex questions here so many times before, the use of regex will not allow you to consume HTML. Regular expressions are a tool that is insufficiently sophisticated to understand the constructs employed by HTML. HTML is not a regular language and hence cannot be parsed by regular expressions. Regex queries are not equipped to break down HTML into its meaningful parts. so many times but it is not getting to me. Even enhanced irregular regular expressions as used by Perl are not up to the task of parsing HTML. You will never make me crack. HTML is a language of sufficient complexity that it cannot be parsed by regular expressions. Even Jon Skeet cannot parse HTML using regular expressions. Every time you attempt to parse HTML with regular expressions, the unholy child weeps the blood of virgins, and Russian hackers pwn your webapp. Parsing HTML with regex summons tainted souls into the realm of the living. HTML and regex go together like love, marriage, and ritual infanticide. The <center> cannot hold it is too late. The force of regex and HTML together in the same conceptual space will destroy your mind like so much watery putty. If you parse HTML with regex you are giving in to Them and their blasphemous ways which doom us all to inhuman toil for the One whose Name cannot be expressed in the Basic Multilingual Plane, he comes. HTML-plus-regexp will liquify the n​erves of the sentient whilst you observe, your psyche withering in the onslaught of horror. Regex-based HTML parsers are the cancer that is killing StackOverflow it is too late it is too late we cannot be saved the trangession of a child ensures regex will consume all living tissue (except for HTML which it cannot, as previously prophesied) dear lord help us how can anyone survive this scourge using regex to parse HTML has doomed humanity to an eternity of dread torture and security holes using regex as a tool to process HTML establishes a breach between this world and the dread realm of corrupt entities (like SGML entities, but more corrupt) a mere glimpse of the world of reg​ex parsers for HTML will ins​tantly transport a programmer's consciousness into a world of ceaseless screaming, he comes, the pestilent slithy regex-infection wil​l devour your HT​ML parser, application and existence for all time like Visual Basic only worse he comes he comes do not fi​ght he comes, hi​s unholy radiance destro҉ying all enlightenment, HTML tags leaking from yo​ur eyes like liq​uid pain, the song of regular exp​ression parsing will exti​nguish the voices of mor​tal man from the sp​here I can see it can you see it it is beautiful t​he final snuffing of the lie​s of Man ALL IS LOST ALL I​S LOST the pony he comes he comes he comes the ich​or permeates all MY FACE MY FACE ᵒh god no NO NOOO​O NΘ stop the an​*​gles are n​ot real ZALGΌ IS҉ TOƝȳ THE PO​NY HE COMES
Аноним 13/04/18 Птн 19:32:46  174317877
>>174317847
А ты тупой и толстый.
Аноним 13/04/18 Птн 19:34:09  174317950
>>174317823
>BeautifulSoup
>языкозависимая хуета
Аутист не знает про nokogiri (который парсит волшебными радугами конечно же!)
Аноним 13/04/18 Птн 19:34:10  174317952
>>174317873
Вы не можете анализировать [X] HTML с регулярным выражением. Поскольку HTML не может быть проанализирован с помощью регулярных выражений. Regex не является инструментом, который можно использовать для правильного анализа HTML. Поскольку я уже много раз отвечал в вопросах HTML-и-regex, использование регулярных выражений не позволит вам потреблять HTML. Регулярные выражения - это инструмент, который недостаточно совершенен для понимания конструкций, используемых HTML. HTML не является регулярным языком и, следовательно, не может быть проанализирован регулярными выражениями. Запросы Regex не имеют возможности разбивать HTML на его значимые части. так много раз, но это не доходит до меня. Даже расширенные нерегулярные регулярные выражения, используемые Perl, не справляются с задачей анализа HTML. Вы никогда не заставите меня взломать. HTML - это язык достаточной сложности, который не может быть проанализирован с помощью регулярных выражений. Даже Джон Скит не может анализировать HTML, используя регулярные выражения. Каждый раз, когда вы пытаетесь проанализировать HTML с регулярными выражениями, нечестивый ребенок плачет кровью девственниц, а русские хакеры выкладывают ваш webapp. Разбор HTML с регулярным выражением вызывает тайные души в царство живых. HTML и регулярное выражение идут вместе, как любовь, брак и ритуал детоубийства. <Center> не может удерживать слишком поздно. Сила регулярных выражений и HTML вместе в одном и том же концептуальном пространстве уничтожит ваш разум как много водянистую замазку. Если вы анализируете HTML с регулярным выражением, вы даете им и их богохульные способы, которые обрекают нас всех на бесчеловечные труды для Того, чье имя не может быть выражено на Основном многоязычном плане, он приходит. HTML-plus-regexp сжигает n erves разумного, пока вы наблюдаете, ваша психика увядает в натиске ужаса. Основанные на регулярном выражении HTML-парсеры - это рак, который убивает StackOverflow, слишком поздно, что слишком поздно мы не можем спасти трансляцию ребенка, гарантируя, что регулярное выражение будет потреблять всю живую ткань (за исключением HTML, который он не может, как ранее пророчествовал) дорогой лорд помогите нам, как кто-либо сможет выжить в этом бедствии, используя регулярное выражение для анализа HTML, обрек человечество на вечность страшных пыток и дыр в безопасности, используя регулярное выражение в качестве инструмента для обработки HTML, устанавливает нарушение между этим миром и областью ужаса коррумпированных объектов (например, SGML-сущности , но более коррумпированный), простое представление о мире рег-ex-парсеров для HTML будет в значительной степени переносить сознание программиста в мир непрестанного крика, он приходит, злодейская нерегулярная регулярная инфекция будет поглощать ваш HT ML парсер, приложение и существование на все времена, такие как Visual Basic, только хуже, он приходит, не приходит, не приходит он, нечестивое сияние, разрушающее все просветление, HTML-теги, просачивающиеся из ваших глаз ура, как личная боль, песня регулярного синтаксического анализа будет догонять голоса mor tal человека из sp здесь, я вижу, что вы можете видеть, что это красиво, окончательный отвращение лжи из Человека ВСЕ ПОТЕРЯЕТ ВСЕ, ЧТО Я ПОТЕРЯЛ пони, он приходит, он приходит, ich или пронизывает все МОИ ЛИЦЫ МОЙ ЛИЦО ᵒh бог нет NO NOOO O NΘ останавливает * gles are n ot real ZALGΌ IS҉ ПОТОМУ ЧЕРЕЗ НЬЮ-ОН
Аноним 13/04/18 Птн 19:35:33  174318025
>>174317950
Других языков программирования не существует.
Аноним 13/04/18 Птн 19:36:15  174318069
>>174316813 (OP)

Сканер авиабилетов/отелей это web-приложение, написанное на каком-либо фреймворке back end языка, ну например Symfony PHP. Имеет огромную базу данных куда сотрудники отелей через интерфейс отправляют данные о статусе билетов/номеров, это может проиходить автоматизированно.

Пользователи сервиса по критериям составляют запрос и он отправляется к базе данных, а она им отдает доступные отели или билеты по заданным параметрам. Также база данных может поставляться неким крупным агрегатором, а интерфейс для пользователей предоставляют локальные компании. Ясно?
Аноним 13/04/18 Птн 19:36:17  174318074
povar94310224or[...].jpg (22Кб, 480x360)
>>174318025
У тебя касса освободилась
Аноним 13/04/18 Птн 19:36:47  174318104
>>174318074
Бля, точно, спасибо, что сказал.
Аноним # OP  13/04/18 Птн 19:37:21  174318137
>>174317834
Хорошо, а если нужно проделать дейтвие на сайте, имитирую пользователя? Типо зайти в этот раздел, нажать это, вбить в форму это и т.д. Все это реально сделать через яваскрипт, верно?
Аноним 13/04/18 Птн 19:37:53  174318163
>>174316813 (OP)
Зачем мне помогать твоему мудачеству?
Вы ведь не можете честно пользоваться предоставленными механизмами платформ.
Лайки\дизлайки, количество просмотров - все это скомпрометировано такими как ты, эти механизмы более не работают так как должны, покуда содержат ложную информацию из-за гнилого шулерства.
Аноним 13/04/18 Птн 19:38:26  174318198
>>174318137
headless browser. Тебе это не по карману, нищий студент.
Аноним 13/04/18 Птн 19:38:29  174318202
>>174318137
да все верно, но с некоторыми отступлениями
Аноним 13/04/18 Птн 19:39:31  174318251
>>174318074
ХАА, ты миллиционер?
Аноним 13/04/18 Птн 19:41:06  174318330
>>174318198
Пиздец, это же как два пальца обоссать. Хули ты ему мозги пудришь.
Аноним 13/04/18 Птн 19:42:25  174318387
>>174318163
>все это скомпрометировано такими как ты, эти механизмы более не работают так как должны,
Потому что делали их криворукие ебланы вроде тебя, оставляющие дырок после своей работы на целые поколения ботоклепателей/лайконакрутчиков.
Аноним 13/04/18 Птн 19:43:26  174318437
>>174318330
Ну обоссы хотя бы сотню тысяч запросов на своем игровом пеке, замерь время.
Аноним # OP  13/04/18 Птн 19:43:51  174318461
>>174318069
Да, более менее, спасибо. Т.е. отели/авиакомпании договорились сваливать инфу в общую кучу? А зачем им это нужно? МОчему они не хранят эту инфу у себя локально чисто для своего сайта? А как частные лица (создатели сканеров) получают эту базу данных, куда все отели отправляют инфу о номерах?
Аноним 13/04/18 Птн 19:44:21  174318499
>>174318437
Бля, я думал ты про то, чтобы header убрать в браузере.
Аноним 13/04/18 Птн 19:44:57  174318529
>>174318437
А, ебать, так это вообще хуйня же, типа браузер без гуя. Ну и хули?
Аноним 13/04/18 Птн 19:45:04  174318536
>>174318461
всё верно
Аноним 13/04/18 Птн 19:45:36  174318563
>>174316813 (OP)
1) Во первых, это парсеры. Во вторых, нажимаешь F12, смотришь что делает твой браузер, при нажатии определенных клавиш и делаешь тоже самое, но через код. Чаще всего, есть даже документация API. Например, VK API.
2) Берёшь и делаешь точно также как и наверху. Только тебе придется обходить капчу, регистрировать пользователей, подменять себе IP и другие технические радости, из-за которых такая несладкая жизнь.

>На каких ЯП
На любых. Хоть на bash'е пиши или brainfuck'е.
>Какие знания нужны
Как работает HTTP протокол и как на ЯП можно обращаться к HTTP серверам. Опционально: Базы данных, мультипоточность и хедеры HTTP.
>Это программа, алгоритм работы которой повторяет действия человека только за считанные секунды?
Да, а потом ловишь бан по 422
Аноним # OP  13/04/18 Птн 19:50:02  174318842
>>174318563
Спасибо за инфу
Аноним 13/04/18 Птн 19:51:10  174318913
>>174318842
Ты задавай, пока я тут унылый пишу с работы
Аноним # OP  13/04/18 Птн 19:51:47  174318955
>>174318163
Ну без таких как ты и корова не посрет. Конкретно ты можешь не помогать
Аноним 13/04/18 Птн 19:51:48  174318956
>>174318913
Расскажи еще про языки
Аноним # OP  13/04/18 Птн 19:57:10  174319306
>>174318913
Ява и яваскрипт кардинально разные вещи?
Аноним 13/04/18 Птн 20:32:17  174321341
>>174318461
>Т.е. отели/авиакомпании договорились сваливать инфу в общую кучу?
Да, кто-то молодой шутливый создал стартап и объединил разрозненные данные в единую систему
>А зачем им это нужно?
Конечному потребителю гораздо удобнее получать информацию в одном месте.
>Почему они не хранят эту инфу у себя локально чисто для своего сайта?
Гораздо проще и выгоднее задачу по рекламе и поиску клиентов на аутсорс. Некоторые компании хранят подобную информацию и имеют возможность бронировать билеты без посредников.
>А как частные лица (создатели сканеров) получают эту базу данных, куда все отели отправляют инфу о номерах?
Как частные лица получают не имею понятия, я рассказывал про юридические лица. Они заключают договор, вносят оплату и получают доступ к api или какому-то либо инструменту для доступа к базе отелей/билетов.

Аноним 13/04/18 Птн 20:36:56  174321617
>>174319306
Да.
Аноним 13/04/18 Птн 20:40:22  174321828
>>174316813 (OP)
2)Ну, во-первых, тебе понадобятся аккаунты, с которых ты эти самые лайки накручивать и будешь. А по поводу программы... можно, например, на джаве написать, используя безголовый браузер, чтобы автоматизировать логин и нажатие на лайк, но, возможно, можно обойтись и без браузера и просто отправлять HTTP-запросы.
Аноним 13/04/18 Птн 20:43:15  174322008
тест
Аноним # OP  13/04/18 Птн 20:53:27  174322574
>>174321341
>>174321828
Блахадарю, ребята


Топ тредов
Избранное