Тут обсуждаем многоядерное убержелезо от Интела. Что Интел говорит о своём железе:http://ark.intel.com/ru/products/80555/Intel-Xeon-Phi-Coprocessor-7120A-16GB-1_238-GHz-61-coreЧто хабр говорит:https://habrahabr.ru/post/262019/Что с ним можно делать:https://www.youtube.com/playlist?list=PLqKQk2j2Il5mMqNHwJM9CLUAHLW5XFtw3Что ещё с ним можно делать (профиты во второй лекции показаны): https://www.youtube.com/playlist?list=PLkjf1FcmOKlghScT9ajvG5SwHEQ_yhjL2
Покупается за 20-25к на вторичке
и все равно соснет у нового дзена за 300 долларов кееек
>>1657630Кого?
>>1657632Amd zen
>>1657638Не, по спекам далеко. Но это вообще принципиально разное железо, существующие зеоны вообще по факту отдельный компы со своей ОС
>>1657604 (OP)Ого, утром вбросил в зен-тред, а уже отдельный.Вынужден констатировать, что железка -- говно коня. Киллер фича в сравнении с теслами -- "перекомпилил код и он заработал на фаях" по факту показывает, что комплиятор не справляется с задачей. Бац. Ибо система команд там реально наркоманская.http://www.nvidia.com/object/justthefacts.htmlБенчмарки, которые делали не интел и не нвидиа, сейчас в пользу тесл. За пруфами в гугл.Если совсем откровенно, вообще идея с PCI-E ускорителями не взлетела. Ждем фаи на отдельных платах.
>>1657697Фаи на отдельных платах скоро обещают, а пока ебаться с чем есть надо. Но киллер-фича не только эта (если приложение само по себе линейно работает, странно ждать ускорения от 60 ядер), а ещё и цена. Сначала ломили два килобакса, потом, оценив вкус юзерского хуйца на вкус, начали делать скидки до тех же $400 — что уже настолько подъёмно, что я уже заказал.А теслы всё ещё стоят как чугунный мост. Не говоря уже о том, что тесла может выполнять только одну команду на всех ядрах, а тут 60 команд, на каждом ядре ещё и векторизуется — то есть можно параллелить по потокам. В Тесле таким и не пахнет.
Кстати говоря, а что там с системой команд вообще? Архитектура x86, почему там всё так грустно?
>>1657796> Фаи на отдельных платах скоро обещаютДа сервера уже продают, просто компьютера мало.И дальше у тебя трешак> начали делать скидки до тех же $400Это где? Это новый? Покажи. Они стоят те же килобаксы.> А теслы всё ещё стоят как чугунный мостВот тебе терафлопсные карточки по $200https://www.amazon.com/Nvidia-Tesla-M2090-Gpu-Card/dp/B005TJKPWU> Не говоря уже о том, что тесла может выполнять только одну команду на всех ядрахТехнически, нет, одна инструкция за раз выполняется только в пределах варпа (группы из 32 потоков), но варпов там сотни на каждом муьлтипроцессоре, а мультипроцессоров там много (ЕМНИП на древней M2090 аж 56 штук). Запускай столько kernel'ов параллельно, сколько надо, кратно мультипроцессору, главное, будет переть параллельно. Кстати, мультипроцессор сам разбирается, когда инструкции в варпе расходятся, а вот в AVX всё не так радужно, там надо векторизовать явно, если не пользуешься компилятором.> тут 60 команд, на каждом ядре ещё и векторизуется — то есть можно параллелить по потокамТам если гонять просто код не векторизованный, то она пердеть будет хуже ноутбучного процессора, ядра там очень примитивные. Производительности можно добиться, только юзая AVX, по сути операция над регистрами AVX в фае и операция над варпом в тесле это одно и то же. Чтобы она выдавала производительность заявленную, надо пердолиться со сложным внутренним планировщиком, как и с теслой, выбирать количество активных ядер, как и с теслой, те же яйца, короче, вид сбоку, только можно очень медленно запустить уже готовую программу под зеон. >>1657802Там минимальный набор команд x86 и наркоманский специальный векторный набор командhttps://en.wikipedia.org/wiki/AVX-512Все затевалось именно ради него, если его не использовать, то и сам фай использовать смысла нет. x86-совместимость нужна только чтобы оставить старый компилятор и коммуникацию, да крутить линупс внутри.
>>1657825> просто компьютера малоПросто собранных суперкомпьютеров широко известных еще мало
>>1657825О, если имеешь опыт в этом, то поясни. Чем оно удобнее в сравнении с OpenCL?
>>1657604 (OP)>копроцессор
>>1658210Кто удобнее?Куда удобнее тем, что есть нормальный тулчейн без геморра (компилятор, отладчик, запуск, поддержка C++11 компилятором), и она работает быстрее на теслах, чем OpenCL (достаточно ощутимо).