Анон, нужен хороший материал по этой теме. Желательно с туториалом или просто с легкоперевариваемым примером а-ля "учим nn играть в tictactoe". Also любой годный материал приветствуется.
бамп, ну же, анончик
Где-то тут есть тред по ML, там оп отвечает.
>>666218бамп, там молчат
Едрить тебе неймется, прям вот сию минуту надо. Ну ладно, я сегодня добрый, держи: https://webdocs.cs.ualberta.ca/~sutton/book/ebook/the-book.html
>>666446вай спасибо
>>666446бля а как скачать?
>>666477Ты и требовательный к тому же. Вот тебе пдф черновика второго издания, это даже лучше должно быть: https://www.dropbox.com/s/b3psxv2r0ccmf80/book2015oct.pdf?dl=0
>>666497спасибо, анон
смотри курс гугла на udacity
>>667029там есть только по deep learning, который включает в себя сверточные nn; reinforcement learning там обходят стороной, как и на coursera. Я не знаю, включает ли nanodegree по MLE reinforcement learning, но брать его ради одной темы точно не выгодно.
Хуле надо-то.Есть мн-во состояний, есть мн-во инпутов, по инпуту система из одного состояния переходит в другое.В начальный момент времени оценка любого перехода одинакова и система выбирает рандомно.Реинфорсемент лернинг заключается в том, что каждый устраивающий нас переход вознаграждается повышением его ценности (как следствие - вероятности выбора).Проблемы - возможных переходов должно быть немного, иначе хуй обучишь - не должна быть важна история, только текущее состояние (очевидный костыль упирается в предыдущий пункт )Все епта, че те еще.
>>668020
>>668020поразжеваннее есть какой-нибудь материал?
>>669975Da ty ohuel. Куда уж разжеваннее.Но вообще совсем для детей есть у Гарднера в какой-то из книжек.