Компьютерра, 2006 № 30 (650) - страница 25

Шрифт

Интервал

Почему Core 2 лучше всех?

Как вы думаете, что устроено проще - быстрый и экономичный Core 2 Duo или медленный и горячий Pentium D? Это может показаться парадоксальным, но Core 2 Duo действительно проще - при том же объеме кэш-памяти в нем гораздо меньше транзисторов, а площадь кристалла и вовсе почти вдвое меньше. Вместе с тем вычислительная техника - это не человеческие взаимоотношения, где зачастую чем проще, тем лучше. Как же так получается? Я хотел было дать краткий ответ на этот вопрос, но исторический экскурс в принципы, положенные в схему функционирования Pentium III, и в усовершенствования, приведшие к Pentium 4, AMD Athlon и Core 2, разросся до половины темы номера. Вкратце же - дело не столько в «удачности Core 2» как архитектуры, сколько в проблемах его конкурентов.

Первый, «особенно безнадежный» случай в лице сложнейшего шедевра вычислительной техники, коим является процессор Pentium 4 в частности и архитектура NetBurst вообще, разгромно проигрывает Core 2 примерно по той же причине, по какой сорокатонный танк с тысячесильным газотурбинным двигателем никогда не догонит обыкновенную легковушку. Схемотехника процессора и заложенные в нее идеи великолепны, многие из них, возможно, опередили свое время, но при всем колоссальном потенциале NetBurst «слишком тяжела» для того, чтобы «быстро ездить». Использованные в ней решения чересчур сложны - а при нынешних микромасштабах кристалла где сложность, там и большой расход энергии. В результате архитектура работает и на 6 ГГц, и вполне пригодна для обещанных нам 10 ГГц, да вот беда - через нее необходимо пропускать такой поток энергии, который, во-первых, придется снимать с процессора криогенной установкой, а во-вторых, даже решив проблему с охлаждением, мы столкнемся с тем, что при столь мощном токе потребления в существующих дизайнах материнских плат начиная с какого-то момента попросту не удается обеспечить достаточно стабильное энергопитание процессора. Pentium 4 на частоте пять-семь-восемь гигагерц, на которые он изначально был рассчитан, был бы чрезвычайно впечатляющим процессором, но увы - «гладко было на бумаге…». Возникает «тепловой тупик».

Проблемы архитектуры K8, которая, в отличие от NetBurst, использует очень простые и изящные схемы вместо навороченных монстров вроде отдельных функциональных блоков, работающих внутри ядра на удвоенной частоте, диаметрально противоположны проблемам, с которыми столкнулась Intel. Если инженеры последней, грубо говоря, пострадали за то, что были «слишком умными» и погнались за лучшим в ущерб хорошему, то в истории разработки K8 остро ощущается огромный разрыв между тем, какие средства расходует на R amp;D Intel и какие расходы на разработки может себе позволить больше озабоченная проблемой выживания AMD. Core 2 производится по 65-нм технологическому процессу, Athlon 64 - по 90-нм, причем чем дальше, тем разрыв в возможностях Intel и AMD больше. Там, где в Intel параллельно работают две-три команды над разными вариантами процессоров, команда AMD занята совершенствованием одного; там, где Intel успевает выкатить три степпинга, AMD обновляет два, и т. д. При таком соотношении сил AMD просто не имеет права на серьезную ошибку, равно как и на смелый эксперимент, - и в итоге продвигается вперед маленькими осторожными шажками. Причем по иронии судьбы, похоже, именно такой «маленький и неспешный» метод работает лучше всего: Core 2, в отличие от Pentium 4, тоже «вырос» не сразу, а медленно и постепенно, еще от первых Pentium Pro к Pentium II, Pentium III, Pentium M и Core «Yonah». Однако вечно играть на ошибках соперника таким образом невозможно - что мы нынче и наблюдаем.

Что касается Intel Core 2 Duo, я не стану принижать его возможности и говорить, что это простой или неинтересный процессор. Израильская команда разработчиков великолепно доработала то, что было создано их предшественниками, практически «вылизав» кристалл настолько, насколько вообще было возможно. Огромная производительность оперативной памяти и схемы «умной» предвыборки, в 98% случаев заранее угадывающих, какие данные потребуются в следующий момент. Чрезвычайно быстрая кэш-память второго уровня, разделяемая между ядрами, и очень быстрые и подключенные по широким шинам кэши первого уровня. Целых три функциональных устройства, каждое из которых реализует все операции с упакованными 128-битными операндами SSE (это могут быть четыре 32-битных или два 64-битных числа) всего за один такт. Нигде, насколько мне известно, раньше не применявшаяся новаторская система обработки микроинструкций, записывающих данные в оперативную память. Интересная реализация декодирования x86-инструкций, позволяющая превращать две инструкции в одну микрооперацию. И - что поражает больше всего - практическое отсутствие «узких мест». Фактически из архитектуры P6, которая неявно лежит в основе Core 2, разработчики «выжали» все что можно. AMD, несмотря на то что ее K8 в принципе гораздо перспективнее P6, о таком остается только мечтать, - многие ее «узкие» места давно известны, но не «расширяются» годами.