Подпишитесь на рассылку и получайте свежие новости и акции нашего магазина.
Вопрос, ответу на который посвящена эта статья, носит скорее теоретический, чем прикладной характер. Тем не менее он нередко всплывает в различных сетевых спорах, а потому определённо нуждается в специальном разборе. Речь идёт о IPC (instructions per cycle) – характеристике удельной производительности, описывающей быстродействие той или иной микроархитектуры в отрыве от тактовой частоты.
AMD и Intel, выводя на рынок последние поколения десктопных процессоров, сделали особый акцент на том, что им удалось заметно улучшить эффективность используемых микроархитектур и увеличить удельную производительность используемых ядер в пересчёте на гигагерц. Так, для семейства процессоров Ryzen 5000, основанных на архитектуре Zen 3, компания AMD заявила о росте IPC по сравнению с прошлым поколением на 19 %. Это – немного оптимистичная оценка, но в собственном тестировании мы смогли подтвердить, что существенный прирост действительно имеет место. Только по нашим данным удельная производительность Zen 3 по сравнению с Zen 2 выросла на 11 % в ресурсоёмких приложениях и на 16 % в играх.
Не отстаёт от AMD и Intel. В недавно выпущенных процессорах Core 11-го поколения, основанных на дизайне Rocket Lake, почти такой же, как в Zen 3, прирост показателя IPC — на уровне 19 %. Мы не проверяли это утверждение собственными тестами напрямую, но, поскольку в основе Rocket Lake лежит микроархитектура Cypress Cove, которая представляет собой 14-нм порт мобильной микроархитектуры Sunny Cove, декларируемая величина вряд ли далека от истины. Процессоры Ice Lake, где используются ядра Sunny Cove, действительно заметно быстрее предшественников на микроархитектуре Skylake, несмотря на довольно близкие тактовые частоты.
Таким образом, и Zen 3, и Rocket Lake принесли с собой заметный прогресс не только по видимым в спецификациях численным характеристикам процессоров, но и по росту удельной производительности. Однако такие перемены вызывают дополнительные вопросы. Если предложения AMD и Intel стали заметно лучше по сравнению со своими предшественниками, то как они теперь соотносятся между собой? Частоты, количество ядер или размеры кеш-памяти разных процессоров сопоставлять очень просто, но как быть с эффективностью микроархитектур? Чтобы разобраться, нужны специальные тесты, и мы решили провести именно такое исследование. Им мы ответим на вопрос: который из производителей x86-процессоров – AMD или Intel – обладает сейчас наиболее эффективной микроархитектурой?
⇡#Как выглядит противостояние Ryzen 5000 и Rocket Lake на первый взгляд
В обзорах новых процессоров Rocket Lake, Core i7-11700K и Core i9-11900K, мы пришли к выводу, что старшие представители этой серии могут соперничать по производительности с процессорами Ryzen 5000 толькосреднего уровня — например, с Ryzen 7 5800X. Так получается потому, что AMD сумела обойти Intel по степени интеграции своих решений. Современные десктопные CPU на базе микроархитектуры Zen 3 могут содержать до 16 вычислительных ядер, максимум же для Rocket Lake – это восемь ядер.
Преимущество AMD в числе ядер обуславливается двумя факторами: внедрением более современного техпроцесса и переходом на чиплетный дизайн. Процессоры семейства Ryzen 5000 для десктопов могут содержать внутри сразу два 7-нм полупроводниковых кристалла с восемью ядрами, что как раз и даёт в сумме до 16 ядер в старших модификациях. Каждый такой кристалл имеет площадь всего 81 мм2, то есть они значительно меньше площади восьмиядерного кристалла Rocket Lake, составляющей 276 мм2.
Восьмиядерный Ryzen 5000 без крышки. Фото Fritzchens Fritz
Такой огромный разрыв в размерах обусловлен тем, что Intel для выпуска настольных процессоров продолжает использовать старую 14-нм технологию, которая была введена в обиход в далёком 2014 году. Именно производственный аспект не позволяет добавить в Rocket Lake свыше восьми ядер.
Восьмиядерный Rocket Lake без крышки. Фото Fritzchens Fritz
Но при сравнении размеров кристаллов нужно иметь в виду пару нюансов. Во-первых, архитектура процессоров Intel предполагает наличие в них интегрированного графического ядра, которое в рассматриваемых процессорах AMD не предусмотрено. Во-вторых, у Intel в процессорный кристалл включены также контроллеры памяти и PCIe, в то время как чиплетная компоновка процессоров Ryzen предполагает использование внешних контроллеров, располагающихся в отдельном чиплете, выпускаемом по 12-нм технологии. И это – одно из слабых мест дизайна современных Ryzen: внешний контроллер памяти работает с более высокими задержками по сравнению с контроллером памяти, расположенным по соседству с вычислительными ядрами на том же кристалле. В результате представители серии Rocket Lake выигрывают у Ryzen по эффективности работы с памятью, что может стать не менее весомым, чем число ядер, фактором для некоторых приложений — например, из числа современных игр.
Впрочем, зная о важности скорости доступа к данным, AMD приняла меры по компенсации более высоких задержек своего контроллера памяти. Эти меры – очень большой L3-кеш (так называемый GameCache), поместить который в Ryzen стало возможным благодаря всё тому же современному техпроцессу с нормами 7 нм. В результате Ryzen 5000 могут похвастать кеш-памятью третьего уровня суммарным объёмом 32 или даже 64 Мбайт, в то время как кеш в старших Rocket Lake имеет размер не более 16 Мбайт.
Но в совершенствовании ещё одной ключевой характеристики процессоров – тактовой частоты – 7-нм технология помогла AMD не слишком сильно. Процессоры серии Ryzen 5000 ограничены частотой 4,9 ГГц. Выше этой планки не может прыгнуть даже старший 16-ядерный Ryzen 9 5950X при нагрузке на одно-единственное ядро. Оппоненты же из числа Rocket Lake при нагрузке на одно ядро могут брать частоты 5,2-5,3 ГГц, причём величина 5,1 ГГц доступна старшей модели Core i9-11900K даже при нагрузке на все ядра. Иными словами, в каких-то случаях 14-нм технология Intel совсем не кажется устаревшей и неактуальной.
Тем не менее нельзя отрицать, что «толстый» техпроцесс создаёт существенные проблемы с тепловыделением и энергопотреблением. Старшие Rocket Lake отнесены производителем к тепловому пакету 125 Вт, но это – очень оптимистичная оценка. Как показали наши тесты, в реальности современные процессоры Intel могут затребовать при работе вдвое больше этой величины. Это не скрывает и сам производитель, заявляя для своих флагманов предел потребления PL2 на уровне 250 Вт. Что же касается AMD, то её процессоры с TDP, установленным в 105 Вт, прекрасно вписываются в 142-ваттные границы по энергопотреблению и тепловыделению.
В конечном итоге получается довольно неоднозначная картина. Старшие процессоры Ryzen 5000 определённо выигрывают у соперников по возможностям многопоточной обработки за счёт большего количества ядер. И для решения ресурсоёмких задач они, вне всяких сомнений, намного предпочтительней. Однако там, где более восьми ядер не нужно, выбор между Ryzen 5000 и Core 11-го поколения совсем не очевиден. Выше мы прошлись по основным количественным характеристикам обоих вариантов, и, как можно заметить, однозначного лидера определить невозможно.
Rocket Lake | Ryzen 5000 | |
---|---|---|
Микроархитектура | Cypress Cove | Zen 3 |
Технология производства, нм | 14 | 7 + 12 |
Максимальное количество ядер | 8 | 16 |
Максимальная тактовая частота, ГГц | 5,3 | 4,9 |
L2-кеш, Мбайт на ядро | 512 | 512 |
L3-кеш, Мбайт | До 16 | До 64 |
TDP, Вт | 125 | 105 |
Предел потребления, Вт | 250 | 142 |
Встроенная графика | Есть | Нет |
PCIe | 20 × Gen 4 | 24 × Gen 4 |
Поддержка памяти | DDR4-3200 | DDR4-3200 |
К сказанному можно добавить и ещё один штрих – поддержку в процессорах Rocket Lake инструкций набора AVX512, которой нет в конкурирующем семействе. Пока данный фактор не имеет большого практического значения, но в перспективе он может стать важным, поскольку эти инструкции будут внедряться в алгоритмах, построенных на нейронных сетях.
Иными словами, неопределённостей, возникающих при сопоставлении Ryzen 5000 и Core 11-го поколения, очень много, и спорить о преимуществе того или иного семейства можно очень долго. Но на висящий в воздухе вопрос о том, чья микроархитектура более эффективна по удельной производительности, мы можем ответить однозначно.
⇡#Описание тестовой системы и методики тестирования
Для сравнения микроархитектур Zen 3 и Cypress Cove мы взяли два свежих восьмиядерных процессора, Ryzen 7 5800X и Core i7-11700K, и сопоставили их быстродействие при работе на одинаковой частоте, с одинаковой памятью и с одной и той же производительной видеокартой. В качестве такой опорной частоты было выбрано значение 4,0 ГГц – оно обусловлено нашим желанием добавить в тестирование пару более старых процессоров, Ryzen 7 3800XT и Core i7-10700K, заставить первый из которых стабильно работать на более высокой «круглой» частоте не представляется возможным. Пренебрегать же участием в тестах носителей микроархитектр Zen 2 и Skylake нам очень не хотелось, потому что оно позволяет проверить утверждения обоих производителей о величине роста показателя IPC при переходе к Zen 3 и Cypress Cove.
Для наглядности приведём таблицу с формальными характеристиками всех четырёх участников тестирования. Однако указанные в этой таблице частоты в контексте данного тестирования значения почти не имеют – большинство тестов выполнялось, когда все процессоры работают на фиксированной тактовой частоте и не пользуются никакими технологиями авторазгона, которые в обычной жизни гибко подстраивают частоты под нагрузку.
Core i7-11700K | Core i7-10700K | Ryzen 7 5800X | Ryzen 7 3800XT | |
---|---|---|---|---|
Платформа | LGA1200 | LGA1200 | Socket AM4 | Socket AM4 |
Микроархитектура | Cypress Cove | Skylake | Zen 3 | Zen 2 |
Техпроцесс, нм | 14 | 14 | 7/12 | 7/12 |
Ядра/потоки | 8/16 | 8/16 | 8/16 | 8/16 |
Частота (номинал/турбо), ГГц | 3,6-5,0 | 3,8-5,1 | 3,8-4,7 | 3,9-4,7 |
L2-кеш, Кбайт | 8 × 512 | 8 × 256 | 8 × 512 | 8 × 512 |
L3-кеш, Мбайт | 16 | 16 | 32 | 2 × 16 |
AVX-512 | Есть | Нет | Нет | Нет |
TDP, Вт | 125 | 125 | 105 | 105 |
Память | DDR4-3200 | DDR4-2933 | DDR4-3200 | DDR4-3200 |
Линии PCIe | 20 × Gen 4 | 16 × Gen 3 | 24 × Gen4 | 24 × Gen4 |
Встроенная графика | UHD 750 | UHD 630 | Нет | Нет |
Цена | $399 | $387 | $449 | $399 |
В итоге в состав тестовой системы вошли следующие комплектующие:
- Процессоры:
- AMD Ryzen 7 5800X (Vermeer, 8 ядер + SMT, 3,8-4,7 ГГц, 32 Мбайт L3);
- AMD Ryzen 7 3800XT (Matisse, 8 ядер + SMT, 3,8-4,7 ГГц, 32 Мбайт L3);
- Intel Core i7-11700K (Rocket Lake, 8 ядер + HT, 3,6-5,0 ГГц, 16 Мбайт L3);
- Intel Core i7-10700K (Comet Lake, 8 ядер + HT, 3,8-5,1 ГГц, 16 Мбайт L3).
- Процессорный кулер: кастомная СЖО EKWB.
- Материнские платы:
- ASUS ROG Crosshair VIII Hero (Socket AM4, AMD X570);
- ASUS ROG Maximus XIII Hero (Wi-Fi) (LGA1200, Intel Z590).
- Память: 2 × 16 Гбайт DDR4-3600 SDRAM, 16-18-18-38 (Crucial Ballistix RGB BL2K16G36C16U4BL).
- Видеокарта: NVIDIA GeForce RTX 3090 Founders Edition (GA102, 1395-1695/19500 МГц, 24 Гбайт GDDR6X 384-бит).
- Дисковая подсистема: Intel SSD 760p 2 Тбайт (SSDPEKKW020T8X1).
- Блок питания: Thermaltake Toughpower DPS G RGB 1000W Titanium (80 Plus Titanium, 1000 Вт).
Оперативная память в системах и AMD, и Intel работала в режиме DDR4-3600 с таймингами по XMP-профилю. Это также означает, что для процессоров Ryzen использовался синхронный режим контроллера памяти и частота Infinity Fabric, равная 1800 МГц, а для процессоров Core последнего поколения — режим Gear 1 и частота контроллера памяти 1800 МГц.
Тестирование выполнялось в операционной системе Microsoft Windows 10 Pro (20H2) Build 19042.572 с использованием следующего комплекта драйверов:
- AMD Chipset Driver 2.13.27.501;
- Intel Chipset Driver 10.1.31.2;
- NVIDIA GeForce 466.47 Driver.
Описание использовавшихся для измерения вычислительной производительности инструментов:
Приложения:
- 7-zip 21.02 — тестирование скорости архивации. Измеряется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 3,1 Гбайт. Используется алгоритм LZMA2 и максимальная степень компрессии.
- Adobe Photoshop Lightroom Classic 10.2 – тестирование производительности при пакетной обработке серии изображений в RAW-формате. Тестовый сценарий включает постобработку и экспорт в JPEG с разрешением 1920 × 1080 и максимальным качеством двухсот 26-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Fujifilm X-T4.
- Adobe Premiere Pro 2021 15.2.0 — тестирование производительности при нелинейном видеомонтаже. Измеряется время рендеринга в формат YouTube 4K проекта, содержащего HDV 2160p30 видеоряд с наложением различных эффектов.
- Blender 2.91.2 – тестирование скорости финального рендеринга в одном из популярных свободных пакетов для создания трёхмерной графики. Измеряется продолжительность построения финальной модели pavillon_barcelona_v1.2 из Blender Benchmark.
- Cinebench R23 – стандартный бенчмарк для тестирования скорости рендеринга в Cinema 4D R23.
- Microsoft Visual Studio 2017 (15.9.33) – измерение времени компиляции крупного MSVC-проекта – профессионального пакета для создания трёхмерной графики Blender версии 2.79b.
- Stockfish 12 – тестирование скорости работы популярного шахматного движка. Измеряется скорость перебора вариантов в позиции «1q6/1r2k1p1/4pp1p/1P1b1P2/3Q4/7P/4B1P1/2R3K1 w».
- Topaz Video Enhance AI v1.7.1 – тестирование производительности в основанной на ИИ программе для улучшения детализации видео. В тесте используется исходное видео в разрешении 640×360, которое увеличивается в два раза с использованием модели Artemis LQ v7.
- V-Ray 5.00 – тестирование производительности работы популярной системы рендеринга при помощи стандартного приложения V-Ray Benchmark Next.
- VeraCrypt 1.24 – тестирование криптографической производительности. Используется встроенный в программу бенчмарк, задействующий тройное шифрование Kuznyechik-Serpent-Camellia.
- x264 r3059 — тестирование скорости транскодирования видео в формат H.264/AVC. Для оценки производительности используется исходный 2160p@24FPS AVC-видеофайл, имеющий битрейт около 42 Мбит/с.
- x265 3.5+8 10bpp — тестирование скорости транскодирования видео в формат H.265/HEVC. Для оценки производительности используется исходный 2160p@24FPS AVC-видеофайл, имеющий битрейт около 42 Мбит/с.
Игры:
- Assassin’s Creed Odyssey. Разрешение 1920 × 1080, Graphics Quality = Ultra High. Разрешение 3840 × 2160: Graphics Quality = Ultra High.
- Borderlands 3. Разрешение 1920 × 1080, Graphics API = DirectX 12, Overall Quality = Badass.
- Cyberpunk 2077. Разрешение 1920 × 1080, Quick Preset = Ray Tracing – Ultra.
- Far Cry New Dawn. Разрешение 1920 × 1080, Graphics Quality = Ultra, HD Textures = On, Anti-Aliasing = TAA, Motion Blur = On.
- Hitman 3. Разрешение 1920 × 1080, Super Sampling = 1.0, Level of Detail = Ultra, Texture Quality = High, Texture Filter = Anisotropic 16x, SSAO = Ultra, Shadow Quality = Ultra, Mirrors Reflection Quality = High, SSR Quality = High, Variable Rate Shading = Quality.
- Horizon Zero Dawn. Разрешение 1920 × 1080, Preset = Ultimate Quality.
- Metro Exodus Enhanced. Разрешение 1920 × 1080, Shading Quality = Ultra, Ray Tracing = Normal, Nvidia DLSS = Off, Reflections = Raytraced, Variable Rate Shading = 4x, Hairworks = Off, Advanced PhysX = Off, Tesselation = Off.
- Shadow of the Tomb Raider. Разрешение 1920 × 1080, DirectX12, Preset = Highest, Anti-Aliasing = TAA.
- A Total War Saga: Troy. Разрешение 1920 × 1080, DirectX 12, Quality = Ultra, Unit Size = Extreme.
- Watch Dogs Legion. Разрешение 1920 × 1080, DirectX 12, Quality = Ultra, RTX = Off, DLSS = Off.
Во всех игровых тестах в качестве результатов приводится среднее количество кадров в секунду, а также 0,01-квантиль (первая перцентиль) для значений FPS. Использование 0,01-квантиля вместо показателей минимального FPS обусловлено стремлением очистить результаты от случайных всплесков производительности, которые были спровоцированы не связанными напрямую с работой основных компонентов платформы причинами.
Следить за происходящим на процессорном рынке становится всё интереснее и интереснее. Теперь расшевелились уже оба основных производителя x86-процессоров, и развитие микроархитектур пошло куда веселее, чем раньше. В последних поколениях процессоров и AMD, и Intel смогли провести глубокую модернизацию микроархитектуры и заметно подтянули производительность интенсивным методом – за счёт повышения КПД вычислительных ядер.
Сами процессорные разработчики обещали, что и в Ryzen 5000, и в Rocket Lake показатель IPC, то есть удельная производительность при фиксированной частоте, вырос на 19 %. По нашим прикидкам, это некоторое преувеличение, но тем не менее процессоры последнего поколения обоих производителей действительно демонстрируют прирост IPC на двузначное число процентов. Что интересно — и там и там мы зафиксировали близкий эффект от сделанных микроархитектурных усовершенствований, то есть AMD и Intel набрали примерно одинаковый темп в развитии процессорных дизайнов, хотя они и движутся совершенно различными путями.
Впрочем, всё это вовсе не означает, что разные процессоры последних поколений похожи по удельной производительности. В действительности Intel сейчас находится в положении догоняющей стороны, поскольку до Rocket Lake она не занималась совершенствованием микроархитектур десктопных процессоров в течение почти шести лет. Поэтому сейчас её предложения находится как минимум на полшага позади. Применённая в Rocket Lake микроархитектура Cypress Cove эффективнее, чем Zen 2, но до Zen 3 ей всё-таки далеко.
Кроме того, Zen 3 выигрывает не только в удельной производительности. Процессоры, построенные на этом дизайне, намного более энергоэффективны, что только подчёркивает неразрешённые проблемы Intel, которая всё ещё вынуждена пользоваться устаревшим технологическим процессом с 14-нм нормами.
Тем не менее у процессоров Rocket Lake всё-таки нашлось сильное место – они могут предложить неплохую игровую производительность, которая подпитывается их низколатентным контроллером памяти и быстродействующей внутренней кольцевой шиной. Однако Ryzen 5000 в играх совсем не выглядят отстающими: в большинстве случаев они выдают очень близкую удельную производительность. Таким образом, в итоге, если принять во внимание уверенное превосходство микроархитектуры Zen 3 в вычислительных задачах, никаких сомнений в том, кто из разработчиков процессоров находится сейчас в позиции лидера с технологической точки зрения, не возникает.
- Комментарии