/hw/ - Intel Xeon Phi

Intel Xeon Phi Аноним 22/11/16 Втр 16:44:31 №1657604

Тут обсуждаем многоядерное убержелезо от Интела.

Что Интел говорит о своём железе:
http://ark.intel.com/ru/products/80555/Intel-Xeon-Phi-Coprocessor-7120A-16GB-1_238-GHz-61-core

Что хабр говорит:
https://habrahabr.ru/post/262019/

Что с ним можно делать:
https://www.youtube.com/playlist?list=PLqKQk2j2Il5mMqNHwJM9CLUAHLW5XFtw3

Что ещё с ним можно делать (профиты во второй лекции показаны):
https://www.youtube.com/playlist?list=PLkjf1FcmOKlghScT9ajvG5SwHEQ_yhjL2

Аноним 22/11/16 Втр 16:45:27 №1657607

Покупается за 20-25к на вторичке

Аноним 22/11/16 Втр 16:55:41 №1657630

и все равно соснет у нового дзена за 300 долларов кееек

Аноним 22/11/16 Втр 16:56:14 №1657632

>>1657630
Кого?

Аноним 22/11/16 Втр 17:02:27 №1657638

>>1657632
Amd zen

Аноним 22/11/16 Втр 17:07:33 №1657643

>>1657638
Не, по спекам далеко. Но это вообще принципиально разное железо, существующие зеоны вообще по факту отдельный компы со своей ОС

Аноним 22/11/16 Втр 17:44:20 №1657697

>>1657604 (OP)
Ого, утром вбросил в зен-тред, а уже отдельный.
Вынужден констатировать, что железка -- говно коня.
Киллер фича в сравнении с теслами -- "перекомпилил код и он заработал на фаях" по факту показывает, что комплиятор не справляется с задачей. Бац. Ибо система команд там реально наркоманская.
http://www.nvidia.com/object/justthefacts.html
Бенчмарки, которые делали не интел и не нвидиа, сейчас в пользу тесл. За пруфами в гугл.

Если совсем откровенно, вообще идея с PCI-E ускорителями не взлетела. Ждем фаи на отдельных платах.

Аноним 22/11/16 Втр 18:47:27 №1657796

>>1657697
Фаи на отдельных платах скоро обещают, а пока ебаться с чем есть надо. Но киллер-фича не только эта (если приложение само по себе линейно работает, странно ждать ускорения от 60 ядер), а ещё и цена. Сначала ломили два килобакса, потом, оценив вкус юзерского хуйца на вкус, начали делать скидки до тех же $400 — что уже настолько подъёмно, что я уже заказал.

А теслы всё ещё стоят как чугунный мост. Не говоря уже о том, что тесла может выполнять только одну команду на всех ядрах, а тут 60 команд, на каждом ядре ещё и векторизуется — то есть можно параллелить по потокам. В Тесле таким и не пахнет.

Аноним 22/11/16 Втр 18:51:00 №1657802

Кстати говоря, а что там с системой команд вообще? Архитектура x86, почему там всё так грустно?

Аноним 22/11/16 Втр 19:11:15 №1657825

>>1657796
> Фаи на отдельных платах скоро обещают
Да сервера уже продают, просто компьютера мало.
И дальше у тебя трешак
> начали делать скидки до тех же $400
Это где? Это новый? Покажи. Они стоят те же килобаксы.
> А теслы всё ещё стоят как чугунный мост
Вот тебе терафлопсные карточки по $200
https://www.amazon.com/Nvidia-Tesla-M2090-Gpu-Card/dp/B005TJKPWU
> Не говоря уже о том, что тесла может выполнять только одну команду на всех ядрах
Технически, нет, одна инструкция за раз выполняется только в пределах варпа (группы из 32 потоков), но варпов там сотни на каждом муьлтипроцессоре, а мультипроцессоров там много (ЕМНИП на древней M2090 аж 56 штук). Запускай столько kernel'ов параллельно, сколько надо, кратно мультипроцессору, главное, будет переть параллельно. Кстати, мультипроцессор сам разбирается, когда инструкции в варпе расходятся, а вот в AVX всё не так радужно, там надо векторизовать явно, если не пользуешься компилятором.
> тут 60 команд, на каждом ядре ещё и векторизуется — то есть можно параллелить по потокам
Там если гонять просто код не векторизованный, то она пердеть будет хуже ноутбучного процессора, ядра там очень примитивные. Производительности можно добиться, только юзая AVX, по сути операция над регистрами AVX в фае и операция над варпом в тесле это одно и то же. Чтобы она выдавала производительность заявленную, надо пердолиться со сложным внутренним планировщиком, как и с теслой, выбирать количество активных ядер, как и с теслой, те же яйца, короче, вид сбоку, только можно очень медленно запустить уже готовую программу под зеон.
>>1657802
Там минимальный набор команд x86 и наркоманский специальный векторный набор команд
https://en.wikipedia.org/wiki/AVX-512
Все затевалось именно ради него, если его не использовать, то и сам фай использовать смысла нет. x86-совместимость нужна только чтобы оставить старый компилятор и коммуникацию, да крутить линупс внутри.

Аноним 22/11/16 Втр 19:11:47 №1657827

>>1657825
> просто компьютера мало
Просто собранных суперкомпьютеров широко известных еще мало

Аноним 22/11/16 Втр 23:03:17 №1658210

>>1657825
О, если имеешь опыт в этом, то поясни. Чем оно удобнее в сравнении с OpenCL?

Аноним 23/11/16 Срд 00:52:15 №1658368

>>1657604 (OP)
>копроцессор

Аноним 23/11/16 Срд 08:06:10 №1658556

>>1658210
Кто удобнее?
Куда удобнее тем, что есть нормальный тулчейн без геморра (компилятор, отладчик, запуск, поддержка C++11 компилятором), и она работает быстрее на теслах, чем OpenCL (достаточно ощутимо).

Опции
Имя
Тема
Пост	[S] 15000

	Sage Ватермарка Мод тег ОП треда
Файлы	Макс объем: 40Mб, макс кол-во файлов: 4 Кликни/Брось файл
Captcha

Перед отправкой сообщения прочтите FAQ, FAQ раздела и правила раздела. vk.com/ru2ch - оФФициальная группа VK 2channel.hk - Пасскодач 2chtv.ru - Тивач