Вот мы и дождались новых процессоров Intel, нацеленных на массовый сегмент рынка. Модели Core второго поколения, известные также как Sandy Bridge, предлагают не просто обновить кристалл, нет — чтобы взять их на вооружение, потребуется сменить всю платформу, поскольку старые разъемы не могут работать с новыми устройствами. После LGA775, продержавшегося на рынке много лет, Intel начала менять сокеты как перчатки: сначала был LGA1366, потом LGA1156, теперь вот очередь дошла до LGA1155, а на горизонте уже маячит LGA2011. Покупка процессора неизбежно влечет за собой и покупку материнской платы, поэтому очевидно, что новые кристаллы должны обладать неоспоримыми преимуществами над чипами прошлых поколений, иначе многие посчитают смену платформы сомнительным мероприятием. Так в чем же заключаются отличия?
Самое главное
Список доработок и оптимизаций довольно велик. Начнем с того, что Intel добавила новый кэш нулевого уровня — L0. Сюда записываются все входящие операции с блока Front-End — или блока предварительной выборки, который обеспечивает корректное общение программы с процессором и своевременную загрузку нужной информации.
Следующие два уровня изменениям не подверглись — в процессоре по-прежнему есть 32 КБ кэша L1 и 256 КБ кэша L2 для каждого вычислительного ядра. А вот кэш-память L3 теперь зовется Last Level Cache (LLC), то есть кэш последнего уровня. Он разделен на части, по количеству вычислительных ядер, причем каждый сегмент управляется отдельно — для экономии энергии. Простаивающие блоки автоматически переводятся в спящий режим. Работает LLC на той же частоте, что и процессор, однако этот кэш используется не только вычислительными ядрами, но и встроенным графическим чипом.
Значительной переработке подверглись блок предсказания ветвлений (Branch Prediction) и блок внеочередного исполнения операций (Out-of-Order). Первый использует новый метод записи данных, а также более экономно расходует доступную память: раньше место для его работы в кэше L1 выделялось с запасом, а теперь блоку выдается ровно столько памяти, сколько ему нужно. Кроме того, размер доступного буфера возрос в два раза относительно чипов Intel Nehalem. Что касается блока Out-of-Order, то к нему был приделан физический регистр файлов, из-за чего нагрузка на шину данных ощутимо снизилась.
За счет этого разработчикам удалось ввести в Sandy Bridge поддержку новых инструкций AVX (Advanced Vector Extensions), которые пришли на замену устаревающим SSE (Streaming SIMD Extensions). Благодаря этому нововведению параллельные вычисления должны стать еще более эффективными. Преимущество AVX в том, что они работают с 256-битными регистрами, в то время как SSE могли использовать не больше 128 бит. Любопытно, что SIMD-блоки, ответственные за обработку этих команд, остались теми же, просто при работе с AVX они объединяются в тандемы.
Кроме того, разработчики изменили принципы работы технологии Turbo Boost. Раньше она ориентировалась на энергопотребление процессора и разгоняла ядра только в том случае, если существовал запас TDP. В Sandy Bridge во главе угла не энергопотребление, а температура кристалла — если она невелика, а высокое быстродействие необходимо, то Turbo Boost значительно увеличивает рабочую частоту процессора и сохраняет ее до тех пор, пока не будет достигнут определенный термальный порог. После этого ядра переключаются в штатный режим, что приводит к их охлаждению, а затем все повторяется вновь. Такой подход дает бóльший прирост быстродействия, чем динамическое изменение частоты с оглядкой на энергопотребление.
Пока в продажу поступили два варианта Sandy Bridge: с двумя и с четырьмя ядрами. Все двуядерные модели поддерживают функцию Hyper-Threading; у некоторых четырехъядерных процессоров она заблокирована. Маркетологи Intel отнесли процессоры Sandy Bridge к уже существующим семействам Core i3, i5 и i7. При этом у новых моделей в названиях употребляется четырехзначный цифровой индекс (например, Core i5-2300), а у их предшественников — лишь трехзначный (Core i5-680).
Со свежеанонсированными чипсетами Intel произошла очень неприятная история: вскоре после официального запуска процессоров Sandy Bridge, когда прилавки магазинов уже были забиты материнскими платами нового образца, в микросхемах P67 Express и H67 Express обнаружилась критическая ошибка. Оказалось, что у этих наборов логики существует проблема с контроллером портов SATA 2, которая в редких случаях может привести к снижению производительности подключенных накопителей. Вероятность, что это произойдет, невелика (около 5%), да и втыкать устройства в устаревшие разъемы при наличии пары SATA Rev. 3 станет далеко не каждый. Тем не менее Intel решила заменить уже выпущенные чипы, что повлекло за собой массовый отзыв материнских плат из розницы.
Чипсетам, лишенным фатальной ошибки, был присвоен степпинг B3. Он теперь упоминается в многочисленных рекламных материалах; коробки с исправленными материнскими платами пестрят всевозможными наклейками в духе «New 6 Series Motherboard B3 stepping», а некоторые производители (например, Gigabyte) даже изменили названия своих устройств, чтобы подчеркнуть отсутствие брака. По примерным расчетам, ошибка обошлась Intel в 700 миллионов долларов.
В нагрузку
Времена, когда процессоры состояли только из вычислительных ядер, ушли в прошлое: и Intel, и AMD упорно стремятся запихнуть в свои кристаллы как можно больше дополнительных элементов, которые раньше располагались в чипсетах.
Главный «бонус» Sandy Bridge — это, конечно же, встроенное графическое ядро. Intel предусмотрела два разных решения — HD Graphics 2000 и HD Graphics 3000. Архитектура у этих GPU одинаковая, а вот количество потоковых ядер отличается: в старшей модели их двенадцать, а в младшей — шесть. Собственной памяти у встроенной графики нет — она заимствует системную. Частота видеоядра зависит от конкретной модели процессора, при сильных нагрузках она может увеличиваться благодаря технологии Turbo Boost. Даже у старшей HD Graphics число исполнительных блоков не выглядит впечатляющим, однако, по заявлению Intel, архитектура интегрированной графики была значительно улучшена, и при равном количестве потоковых ядер Sandy Bridge оказывается в несколько раз быстрее Clarkdale, когда дело доходит до 3D-рендеринга. Привить встроенным ускорителям поддержку DirectX 11 инженеры, увы, не удосужились — доступен лишь DirectX 10.1.
В мобильные процессоры Intel устанавливает быстрые графические ядра HD Graphics 3000, в то время как большинство моделей для настольных ПК оснащаются менее производительными HD Graphics 2000. Зачем было ущемлять владельцев десктопов — непонятно. Примечательно, что HD Graphics 3000 можно встретить и в настольном сегменте, но только в специальных моделях со свободным множителем. Ирония тут в том, что материнские платы, поддерживающие разгон, не оснащаются видеовыходами. И наоборот: платы, способные работать со встроенной графикой, абсолютно не предназначены для разгона. Вот и получается, что насладиться обоими преимуществами «элитных» моделей Sandy Bridge одновременно не получится при всем желании.
Неожиданное нововведение, заставшее врасплох AMD и NVIDIA, — блок Quick Sync, предназначенный для аппаратной обработки видео, причем речь идет не только о дешифровке, но и о кодировании. Авторы утверждают, что это нововведение позволяет существенно снизить нагрузку на вычислительные ядра при просмотре видео, а также на порядок сократить время, затрачиваемое на перевод фильмов из одного формата в другой. Насколько велика польза от Quick Sync в реальности, мы расскажем чуть ниже, а пока отметим один существенный недостаток: Quick Sync работает лишь в том случае, если система задействует встроенное графическое ядро. При использовании дискретной видеокарты Quick Sync недоступна, то есть владельцам игровых компьютеров на базе Sandy Bridge про быстрое кодирование можно сразу забыть.
Функции, когда-то возлагавшиеся на северный мост чипсета, теперь целиком взял на себя блок System Agent, мало отличающийся от уже знакомого нам Uncore. За сменой вывески последовали лишь незначительные эволюционные изменения. Контроллер памяти у Sandy Bridge двухканальный, а максимальная рабочая частота для используемых планок DDR3 равна 1333 МГц (если говорить о штатном режиме). Путем повышения множителя верхнюю границу можно сдвинуть до отметки 2133 МГц. Чип, ответственный за взаимодействие с разъемами PCIe 2.0, изменений не претерпел — он предоставляет 16 линий, которые можно привязать к одному графическому разъему либо поделить их поровну между двумя. Также System Agent включает в себя чип управления питанием (Power Control Unit) и интерфейс шины FDI, с помощью которой изображение со встроенного графического ядра передается на видеовыходы, в список которых теперь включены DisplayPort 1.2 и HDMI 1.4.
Крайне важен тот факт, что у Sandy Bridge, в отличие от более ранних процессоров Intel, дополнительные элементы расположены на том же 32-нм кристалле, что и вычислительные ядра. В предшествующих Clarkdale, напомним, графическое ядро и контроллер памяти располагались на отдельном чипе, выполненном в соответствии с 45-нм техпроцессом. С вычислительным ядрами процессора эти блоки взаимодействовали через специальную шину, что не самым лучшим образом сказывалось на производительности. Кристаллы Sandy Bridge этой проблемы лишены.
Технические характеристики | ||
Характеристика | Core i7-2600 | Core i7-920 |
Техпроцесс | 32-нм | 45-нм |
Количество транзисторов | 995 млн | 731 млн |
Процессорный разъем | LGA1155 | LGA1366 |
Частота | 3,4 ГГц | 2,66 ГГц |
Максимальная частота Turbo Boost | 3,8 ГГц | 2,93 ГГц |
Множитель | 34 | 20 |
L3-кэш | 8 МБ | 8 МБ |
Частота GPU | 850 МГц | нет GPU |
Энергопотребление | 95 Вт | 130 Вт |
Цена на март 2011 года | от 9000 рублей; за версию Core i7-2600K — от 11 000 рублей |
от 9000 рублей |
Связанные одной шиной
С приходом новой архитектуры изменился и способ взаимодействия между ключевыми компонентами процессора. Если раньше Intel использовала шины перекрестного типа, то теперь компания взяла на вооружение кольцевую шину, которую можно встретить, например, в серверных процессорах поколения Nehalem. Данное решение связывает все основные блоки единой магистралью, по которой данные непрерывно движутся по кругу. Вычислительные ядра, GPU, System Agent и другие элементы могут добавлять информацию в этот общий поток либо, наоборот, забирать ее. Таким образом, у Intel отпала нужда пичкать свои процессоры кучей шин, да и возможность без труда подключить к системе дополнительные блоки (скажем, еще пару вычислительных ядер) может пригодиться в дальнейшем.
Правда, с использованием кольцевой шины связан один нюанс. Частота кольцевой шины завязана на частоту кристалла, поэтому при простое и уменьшении частоты вычислительных ядер пропускная способность шины тоже снижается, что может привести к падению производительности графической подсистемы процессора. Впрочем, загруженный по максимуму GPU на фоне простаивающих вычислительных блоков — явление редкое, да и потери быстродействия от снижения скорости шины не так уж и велики.
Еще одно нововведение заключается в том, что все компоненты процессора отныне используют один и тот же генератор опорной частоты. По этой причине разгон путем увеличения скорости работы BCLK невозможен — даже незначительные отклонения от нормы ведут к сбоям дополнительных блоков. Соответственно, единственный эффективный способ разгона кроется в увеличении множителя процессора, однако для таких маневров подходит далеко не каждый кристалл. Еще недавно разблокированный множитель у Intel можно было встретить только в дорогущих моделях линейки Extreme Edition. К счастью, политика компании изменилась, и цены на Sandy Bridge со свободным множителем не кусаются — за дополнительный функционал придется доплатить не так уж и много, около 2000 рублей. Подходящие для разгона процессоры можно отличить по букве «K» в конце названия. В данный момент таких моделей две — Core i7-2600K и Core i5-2500K.
Синтетические тесты | |||||
PCMark05 | |||||
Модель процессора | CPU | Memory | HDD | Overall | Соотношение производи- тельности |
Core i7-2600K (3,4 ГГц) | 11 414 | 10 770 | 4830 | 10 895 | 100% |
Core i7-2600K (3,4 ГГц) + HD Graphics |
11 562 | 10 888 | 5224 | 11 161 | 102% |
Core i7-2600K (4,6 ГГц) | 15 418 | 14 567 | 4353 | 13 853 | 127% |
Core i7-920 (2,66 ГГц) | 8925 | 8157 | 5335 | 9013 | 82% |
Core i7-920 (3,4 ГГц) | 11 596 | 10 870 | 5240 | 11 174 | 103% |
3DMark Vantage | |||||
Модель процессора | GPU | CPU | Overall | Соотношение производительности | |
Core i7-2600K (3,4 ГГц) | 21 288 | 20 798 | 22 909 | 100% | |
Core i7-2600K (3,4 ГГц) + HD Graphics |
1267 | 21 240 | 1657 | 7% | |
Core i7-2600K (4,6 ГГц) | 21 468 | 24 015 | 25 677 | 112% | |
Core i7-920 (2,66 ГГц) | 20 512 | 17 212 | 19 574 | 85% | |
Core i7-920 (3,4 ГГц) | 21 520 | 20 887 | 21 358 | 93% | |
CineBench R11.5 (64-bit) | |||||
Модель процессора | x1 | xN | Multi | Соотношение производительности | |
Core i7-2600K (3,4 ГГц) | 1,32 | 6 | 4,53х | 100% | |
Core i7-2600K (3,4 ГГц) + HD Graphics |
1,37 | 6,26 | 4,59х | 104% | |
Core i7-2600K (4,6 ГГц) | 1,83 | 6,57 | 3,59х | 114% | |
Core i7-920 (2,66 ГГц) | 0,96 | 4,78 | 5х | 78% | |
Core i7-920 (3,4 ГГц) | 1,22 | 5,84 | 4,79 | 96% | |
WinRAR (файл 100 МБ) | |||||
Модель процессора | x1 | xN | Соотношение производительности | ||
Core i7-2600K (3,4 ГГц) | 1025 КБ/с | 2813 КБ/с | 100% | ||
Core i7-2600K (3,4 ГГц) + HD Graphics |
1007 КБ/с | 2739 КБ/с | 97% | ||
Core i7-2600K (4,6 ГГц) | 1351 КБ/с | 4561 КБ/с | 154% | ||
Core i7-920 (2,66 ГГц) | 900 КБ/с | 2279 КБ/с | 83% | ||
Core i7-920 (3,4 ГГц) | 1092 КБ/с | 2754 КБ/с | 100% |
Помощники
Вместе с Sandy Bridge компания Intel представила и чипсеты семейства Cougar Point, предназначенные для работы с новыми процессорами. Пока что наборов логики два — P67 Express и H67 Express, — и у них, как водится, много общего. Например, оба в состоянии обеспечить до 14 портов USB 2.0, но при этом не могут работать с USB 3.0 — Intel упорно оттягивает внедрение поддержки этого интерфейса. А вот SATA Rev. 3 новую платформу стороной не обошел: чипсеты предлагают нам два высокоскоростных разъема в дополнение к четырем портам предыдущего стандарта. Доступных линий PCIe 2.0 по-прежнему восемь штук, а старый добрый PCI канул в небытие.
Чипсет H67 Express позиционируется как решение для систем, опирающихся на встроенную графику. Дело в том, что на данный момент только эта микросхема поддерживает шину FDI, которая позволяет транслировать сигнал с интегрированного GPU на видеовыходы. H67 Express дружит со всеми основными мультимедийными интерфейсами — DisplayPort, HDMI, DVI и VGA. Интересно, что H67 Express позволяет разгонять графическое ядро, но не сам процессор. Множитель остается заблокированным даже при использовании моделей Sandy Bridge с индексом «K».
P67 Express создавался для более сложных систем. На нем нельзя задействовать встроенную графику, но зато этот чипсет допускает увеличение частоты кристалла. Кроме того, лишь на P67 Express можно поделить доступные 16 линий PCIe между двумя графическими слотами, то есть он подходит для создания материнских плат, поддерживающих тандемы видеокарт.
Приложения | ||
SuperPi 1.5 (32 МБ, Loop 10) | ||
Модель процессора | Время | Соотношение производительности |
Core i7-2600K (3,4 ГГц) | 10,4 минуты | 100% |
Core i7-2600K (3,4 ГГц) + HD Graphics | 10,2 минуты | 102% |
Core i7-2600K (4,6 ГГц) | 7,95 минуты | 124% |
Core i7-920 (2,66 ГГц) | 13,9 минуты | 77% |
Core i7-920 (3,4 ГГц) | 11,1 минуты | 93% |
CyberLink MediaEspresso 6.5 (1080p (15 ГБ) в Apple 720p) | ||
Оборудование | Время | Соотношение производительности |
Core i7-2600K (3,4 ГГц) | 56 минут | 100% |
GeForce GTX 470 (CUDA) | 33 минуты | 169% |
Intel Quick Sync | 12 минут | 466% |
Core i7-2600K (4,6 ГГц) | 48 минут | 116% |
Core i7-920 (2,66 ГГц) | 66 минут | 84% |
Core i7-920 (3,4 ГГц) | 54 минуты | 103% |
Batman: Arkham Asylum (PhysX Max) | ||
Модель процессора | High, 1680x1050 | Соотношение производительности |
Core i7-2600K (3,4 ГГц) | 19 fps | 100% |
Core i7-2600K (3,4 ГГц) + GeForce GTX 470 (CUDA) | 59 fps | 310% |
Core i7-2600K (4,6 ГГц) | 31 fps | 163% |
Core i7-920 (2,66 ГГц) | 13 fps | 68% |
Core i7-920 (3,4 ГГц) | 17 fps | 89% |
Битва поколений
Семейство Sandy Bridge в нашем забеге представлял процессор Core i7-2600K, то есть самая технологичная модель в новой линейке. Его базовая частота — 3,4 ГГц, а количество вычислительных ядер равно четырем, причем каждое из них обрабатывает сразу два потока благодаря активной Hyper-Threading. Встроенная графика HD Graphics 3000 работает на частоте 850 МГц, но благодаря Turbo Boost скорость при необходимости можно увеличить до внушительных 1350 МГц. Противником Core i7-2600K стал представитель Nehalem, обладающий сопоставимой ценой, — четырехъядерный кристалл Core i7-920. Рабочая частота у него поскромнее — всего 2,66 ГГц, да и встроенное графическое ядро отсутствует.
Несмотря на то, что в нашем тестировании принимали участие только два процессора, материнских плат пришлось задействовать сразу три, ведь мы не могли обойти стороной ни разгон Sandy Bridge, ни работу его графического ядра. Исследовать оба аспекта, используя одну системную плату, невозможно, поэтому полигоном для проведения основных опытов стала Gigabyte GA-P67A-UD7 на чипсете P67 Express, а графика тестировалась на GA-H67A-UD3H, базирующейся на H67 Express. Процессор поколения Nehalem мы установили на плату Foxconn Renaissance, оснащенную разъемом LGA1366. Вспомогательными компонентами нашего стенда стали кулер Cooler Master Hyper N620, два модуля памяти Kingston HyperX DDR3-1666 емкостью 2 ГБ каждый и видеокарта GeForce GTX 570 производства ZOTAC.
Кристаллы тестировались не только в штатном режиме. В частности, Core i7-920 был разогнан до 3,4 ГГц, чтобы мы могли сопоставить производительность процессоров разных архитектур, функционирующих на одной частоте. Экспериментируя с множителем Core i7-2600K, мы без труда разогнали эту модель до внушительных 4,6 ГГц — результаты тестирования в этом режиме покажут, на что способен Sandy Bridge в руках энтузиастов.
Игровые тесты (кадров в секунду) | |||
Resident Evil 5 (DX10) | |||
Модель процессора | High, 1680x1050, AF 16x |
High, 1920x1080, AF 16x |
Соотношение производи- тельности |
Core i7-2600K (3,4 ГГц) | 131,6 | 128,7 | 100% |
Core i7-2600K (3,4 ГГц) + HD Graphics | 16,1 | 14,3 | 12% |
Core i7-2600K (4,6 ГГц) | 159 | 148 | 118% |
Core i7-920 (2,66 ГГц) | 99,3 | 96,2 | 75% |
Core i7-920 (3,4 ГГц) | 125,2 | 122,1 | 95% |
Devil May Cry 4 (DX10) | |||
Модель процессора | VeryHigh, 1680x1050, AF 16x |
VeryHigh, 1920x1080, AF 16x |
Соотношение производи- тельности |
Core i7-2600K (3,4 ГГц) | 216,8 | 207,8 | 100% |
Core i7-2600K (3,4 ГГц) + HD Graphics | 16,5 | 14,7 | 7% |
Core i7-2600K (4,6 ГГц) | 213,7 | 199,4 | 97% |
Core i7-920 (2,66 ГГц) | 218,6 | 198,3 | 98% |
Core i7-920 (3,4 ГГц) | 232,2 | 212,1 | 105% |
Aliens vs. Predator (DX11) | |||
Модель процессора | VeryHigh, 1680x1050, AF 16x |
VeryHigh, 1920x1080, AF 16x |
Соотношение производи- тельности |
Core i7-2600K (3,4 ГГц) | 69,9 | 62,8 | 100% |
Core i7-2600K (3,4 ГГц) + HD Graphics | — | — | — |
Core i7-2600K (4,6 ГГц) | 67,3 | 60,2 | 96% |
Core i7-920 (2,66 ГГц) | 67,9 | 60,3 | 96% |
Core i7-920 (3,4 ГГц) | 67,7 | 60,5 | 96% |
Момент истины
Начали мы, как обычно, с синтетических бенчмарков, и первый их них — PCMark05 — сразу же поставил нас в тупик: при равных частотах Sandy Bridge оказался на 3% медленнее соперника. Как же так? Где польза ото всех нововведений? Результаты Vantage в большей степени соответствовали ожиданиям: в одинаковых условиях новая архитектура обеспечила 7% прирост быстродействия. В CineBench кристалл Nehalem также проиграл, но с отставанием всего в 4%. Когда мы завели процессоры в штатном режиме, отрыв Core i7-2600K от соперника значительно увеличился — преимущество составило от 15 до 22% в зависимости от теста.
В приложении SuperPi, исследующем чистую вычислительную мощность процессора, представитель Sandy Bridge оказался быстрее разогнанного Core i7-920 на 7%, а в штатном режиме разница возросла аж до 23%. Перекодирование видео посредством CyberLink MediaEspresso 6.5 выявило, что в этих задачах архитектура Nehalem чуть привлекательнее Sandy Bridge, однако оба процессора все равно не могут тягаться с GeForce GTX 570, использующей возможности CUDA. Впрочем, куда более важно, что даже мощная видеокарта NVIDIA осталась далеко позади движка Quick Sync, встроенного в Core i7-2600K, — специализированный блок обрабатывает данные в 4,5 раза быстрее! Согласитесь, результат впечатляет.
В играх радикальных изменений в расстановке сил не произошло. Зато мы смогли оценить, на что способна графика HD Graphics 3000. Встроенное ядро выдавало около 15 кадров в секунду — хороший результат. Выкрутите графику на минимум, и показатель fps станет вполне комфортным. Интегрированное решение обеспечивает производительность на уровне дискретных видеокарт начального уровня, и для Intel это прорыв. На рынке ноутбуков эти возможности Sandy Bridge окажутся очень полезными.
Соотношение цена/производительность | |||||
Модель процессора | Синтети- ческие тесты |
Прило- жения |
Игры | Общая производи- тельность |
Цена |
Core i7-2600 (3,4 ГГц) | 100% | 100% | 100% | 100% | 100% |
Core i7-2600K (4,6 ГГц) | 120% | 129% | 103% | 117% | 122% |
Core i7-920 (2,66 ГГЦ) | 84% | 80% | 90% | 85% | 100% |
Core i7-920 (3,4 ГГц) | 98% | 98% | 98% | 98% | 100% |
Приход новой архитектуры не принес с собой значительного увеличения производительности — на равных частотах Sandy Bridge оказывается лишь немногим быстрее Nehalem. Однако нельзя сказать, что процессоры Intel последнего поколения получились неудачными. Во-первых, в штатном режиме Core i7-2600K все же намного шустрее, чем Core i7-920. Во-вторых, Sandy Bridge обладают лучшим разгонным потенциалом, чем их предшественники, правда, за возможность повысить частоту приходится доплачивать. В-третьих, материнские платы для кристаллов нового семейства не такие дорогие, как под процессоры Nehalem. Все это говорит о том, что при сборке новой игровой системы в первую очередь следует обратить внимание именно на процессоры Sandy Bridge. Максималистам же мы рекомендуем либо приобрести шестиядерную версию Nehalem, либо дождаться появления решений под LGA2011. Для тех же, кто недавно обновил платформу, Sandy Bridge особого интереса не представляют.