Новости процессор амд а10

В семействе мобильных процессоров AMD Ryzen 7000 появились модели, оснащённые аппаратными модулями ускорения искусственного интеллекта, получившие название XDNA. Новые Подробности о Процессорах AMD A10-7850K и A10-7700K. Выпуск процессоров новой линейки AMD A10 с самого начала был овит тайной. Компьютерный процессор для AMD A10-9700/8700 CPU A10 серии сокет AM4 65 Вт 3,5 ГГц четырехъядерный процессор AM4 CPU.

AMD Adrenalin 21.10.4 Windows 10 VS Windows 11 Benchmark RX 570 Ryzen 5 3600

Корпорация AMD анонсирует процессор AMD Alchemy Au1550. Главная Новости Процессоры Процессор AMD A10-4600M – подробности о мобильном представителе Trinity. Логотип AMD AMD представила новые APU серии Elite А, построенные на базе архитектуры Richland. Одна примечательная новость: новый высокопроизводительный графический процессор AMD Ryzen 7 5700X3D предлагает 100 МБ (!) встроенной памяти благодаря технологии AMD 3D V-Cache, это максимум, что мы когда-либо видели в настольных графических процессорах AMD. Новейший четырехъядерный процессор AMD A10-5750M с тактовой частотой 2.5 ГГц и передовая видеокарта AMD Radeon HD 8970 обеспечивают высокую производительность и полноценный игровой опыт.

Гибридный процессор AMD A10-5800K показывает себя в бенчмарках

Но опять же, для реализации потенциала нужна хорошая память: У более младших А10 есть более дешёвые аналоги без интегрированного графического ядра, называются Athlon X4.

Пора, как говорит господин Кличко, смотреть в завтрашний день. А там у компании AMD не все так радужно, как десять лет назад. Отличие принципиальное: первая платформа не может похвастаться встроенной в ЦП графикой, зато отличается восемью физическими ядрами, с частотой до 5 ГГц; вторая — более бюджетная, с интегрированной графикой, да и в целом более сбалансированная для нужд медиа-ПК. Вот только техпроцесс во всех решениях, как и архитектура камней в целом, уже порядком устарели. Это негативным образом сказывается на производительности, и в данном случае конкурировать с решениями Intel становится все сложнее и сложнее, если такое вообще возможно.

При этом сложные инструкции не могут декодироваться одновременно с простыми, то есть при работе трехканального аппаратного декодера микропрограммный декодер не используется, а при декодировании сложных инструкций, наоборот, бездействует аппаратный декодер. Микрооперации, полученные в результате декодирования инструкций в декодерах DirectPath и VectorPath, поступают в буфер Pack Buffer, где они объединяются в группы по три микрооперации.

В том случае, когда за один такт в буфер поступает не три, а одна или две микрооперации в результате задержек с выбором инструкций , группы заполняются пустыми микрооперациями, но так, чтобы в каждой группе было ровно три микрооперации. Далее группы микроинструкций отправляются на исполнение. Если посмотреть на схему декодера в микроархитектурах K8 и K10, то видимых различий, казалось бы, нет рис. Действительно, принципиальная схема работы декодера осталась без изменений. Разница в данном случае заключается в том, какие инструкции считаются сложными, а какие — простыми, а также в том, как декодируются различные инструкции. Так, в микроархитектуре K8 128-битные SSE-инструкции разбиваются на две микрооперации, а в микроархитектуре K10 большинство SSE-инструкций декодируется в аппаратном декодере как одна микрооперация. Кроме того, часть SSE-инструкций, которые в микроархитектуре K8 декодируются через микропрограммный VectorPath-декодер, в микроархитектуре K10 декодируются через аппаратный DirectPath-декодер. Декодирование команд в микроархитектурах K8 и K10 Кроме того, в микроархитектуре K10 в декодер добавлен специальный блок, называемый Sideband Stack Optimizer.

Не вникая в подробности, отметим, что он повышает эффективность декодирования инструкций работы со стеком и, таким образом, позволяет переупорядочить микрооперации, получаемые в результате декодирования, чтобы они могли выполняться параллельно. Диспетчеризация и переупорядочивание микроопераций После прохождения декодера микрооперации по три за каждый такт поступают в блок управления командами, называемый Instruction Control Unit ICU. Главная задача ICU заключается в диспетчеризации трех микроопераций за такт по функциональным устройствам, то есть ICU распределяет инструкции в зависимости от их назначения. Для этого используется буфер переупорядочивания ReOrder Buffer, ROB , который рассчитан на хранение 72 микроопераций 24 линии по три микрооперации , — рис. Каждая группа из трех микроопераций записывается в свою линию. Из буфера переупорядочивания микрооперации поступают в очереди планировщиков целочисленных Int Scheduler и вещественных FPU Scheduler исполнительных устройств в том порядке, в котором они вышли из декодера. Планировщик для работы с вещественными числами FPU Scheduler рассчитан на 36 инструкций, и его основная задача заключается в том, чтобы распределять команды по исполнительным блокам по мере их готовности. Просматривая все 36 поступающих инструкций, FPU-планировщик переупорядочивает следование команд, строя спекулятивные предположения о дальнейшем ходе программы, чтобы создать несколько полностью независимых друг от друга очередей инструкций, которые можно выполнять параллельно.

Диспетчеризация и переупорядочивание микроопераций Планировщик инструкций для работы с целыми числами Int Scheduler образован тремя станциями резервирования RES , каждая из которых рассчитана на восемь инструкций. Все три станции, таким образом, образуют планировщик на 24 инструкции. Этот планировщик выполняет те же функции, что и FPU-планировщик. Различие между ними заключается в том, что в процессоре имеется семь функциональных исполнительных блоков для работы с целыми числами три устройства ALU, три устройства AGU и одно устройство MULT. Выполнение микроопераций После того как все микрооперации прошли диспетчеризацию и переупорядочивание в соответствующих планировщиках, они могут быть выполнены в соответствующих исполнительных устройствах рис. Выполнение микроопераций Блок операций с целыми числами состоит из трех распараллеленных частей. По мере готовности данных планировщик может запускать на исполнение из каждой очереди одну целочисленную операцию в устройство ALU и одну адресную операцию в устройство AGU. Количество одновременных обращений к памяти ограничено двумя.

Таким образом, за каждый такт может запускаться на исполнение три целочисленных операции, обрабатываемые в устройствах ALU, и две операции с памятью, обрабатываемые в устройствах AGU. Отметим, что в микроархитектуре K8 при выполнении операций с памятью имеется одно существенное ограничение. Дело в том, что операции обращения к памяти должны идти в том виде, в котором они записаны в коде программы, то есть более поздние в программе операции обращения к памяти не могут выполняться перед более ранними. Понятно, что такое ограничение может существенно отразится на эффективности выполнения программного кода, поскольку нередко блокирует выполнение программы на несколько тактов. В микроархитектуре K10 такого ограничения не существует, то есть имеется возможность выполнения команды обращения к памяти вне очереди. В микроархитектурах K8 и K10 планировщик для работы с вещественными числами каждый такт может запускать на исполнение по одной операции в каждое функциональное устройство FPU. Подобная реализация блока FPU теоретически позволяет выполнять до трех вещественных операций за такт. В микроархитектуре K8 устройства FPU являются 64-битными.

Векторные 128-битные SSE-команды разбиваются на этапе декодирования на две микрооперации, которые производят операции над 64-битными половинами 128-битного операнда и запускаются на исполнение последовательно в разных тактах. В микроархитектуре K10 устройства FPU являются 128-битными. Соответственно 128-битные SSE-команды обрабатываются с помощью одной микрооперации, что теоретически увеличивает темп выполнения векторных SSE-команд в два раза по сравнению с микроархитектурой K8. Новые технологии энергосбережения В микроархитектуре AMD K10, кроме существенных улучшений в процессе выполнения программного кода, предусмотрены и новые технологии энергосбережения, позволяющие существенно повысить оптимизированную производительность процессора, то есть производительность в расчет на ватт потребляемой энергии. Технология CoolCore дает возможность автоматически выключать те части цепи процессора, которые в данный момент не используются. В результате достигается снижение энергопотребления и соответственно тепловыделения процессора.

Игры: Alien: Isolation, версия 1. Battlefield 4, версия 111433 с поддержкой x86-64. Counter Strike: Global Offensive, версия 1.

Dota 2, версия 6. Grand Theft Auto V, версия 1. Metro: Last Light — Redux, версия 1. Middle-Earth: Shadow of Mordor, версия 1. World of Tanks, версия 0. Существующие общеупотребительные приложения, используемые в типичных пользовательских сценариях, очень зависимы от однопоточной производительности вычислительных ядер процессоров. Совершенно очевидно, что для повседневного неигрового использования предложения AMD подходят не лучшим образом. Собственно, знает это и сама AMD, которая пытается решить проблему продвижением альтернативной концепции вычислений HSA, в рамках которой предполагается распараллеливание типичной нагрузки и перенос её выполнения на ресурсы графического ядра. Однако к настоящему моменту успехи AMD в этой области не слишком впечатляют — реальных программ, работающих в рамках данной концепции, очень мало, причём большинство из них решают лишь какие-то специфичные задачи.

Иными словами, несмотря на то, что A10-7870K стал несколько быстрее своего предшественника по тактовой частоте, микроархитектура Steamroller продолжает ограничивать вычислительную производительность Godavari. И это приводит к тому, что, по данным PCMark 8, процессор A10-7870K оказывается даже слабее интеловского решения с вдвое более низкой ценой и вдвое меньшим количеством вычислительных ядер. В качестве компенсации давайте посмотрим на те результаты, которыми может похвастать A10-7870K в 3D-графике. Хорошая новость состоит в том, что с точки зрения графической производительности A10-7870K стал заметно быстрее своего предшественника. В обоих процессорах интегрированный GPU содержит по 8 вычислительных кластеров, то есть обладает массивом из 512 шейдеров, 32 текстурных блоков и 8 движков растеризации, однако у Godavari заметно выросла частота графического ядра, что как раз и выливается в 5-7-процентный прирост результата 3DMark. Естественно, преимущество перед интеловским ядром HD Graphics 4600, которое встраивается в десктопные процессоры семейства Haswell, стало ещё больше и в тесте Fire Strike даже превысило двукратный размер. Надо сказать, что A10-7870K удаётся достойно выглядеть и на фоне платформ с процессором Pentium G3258, которые укомплектованы недорогими дискретными видеокартами. Однако несмотря на всё сказанное, есть и плохая новость. Встроенное в гибридные процессоры AMD видеоядро серии Radeon R7 больше нельзя назвать самой быстрой интегрированной графикой.

Интеловский графический акселератор Iris Pro 6200, который можно найти в новейших десктопных процессорах поколения Broadwell , оказался быстрее графики AMD, и весьма заметно. Конечно, с практической точки зрения это не умаляет достоинств A10-7870K, который предлагает безусловно лучшее сочетание цены и возможностей. Однако с появлением Iris Pro 6200 интеловские инженеры посылают своим коллегам из AMD недвусмысленный сигнал о том, что вскоре их может ожидать ожесточённая конкуренция и на рынке APU. Даже в тех задачах, которые эффективно раскладываются на все четыре вычислительных ядра, имеющиеся в распоряжении новинки AMD, двухъядерный Core i3-4370 предлагает лучшую производительность. А в тех случаях, когда нагрузка распараллеливается на все ядра не идеально, A10-7870K проигрывает и вдвое более дешёвому Pentium G3258. Иными словами, увеличение тактовой частоты, произошедшее с выходом A10-7870K, помогло гибридным процессорам AMD не сильно. Прирост производительности по сравнению с A10-7850K составил порядка практически незаметных 2 процентов. И если смотреть на новый процессор как на традиционный CPU, то это типичный Kaveri в плохом смысле с привычно низким уровнем вычислительной производительности x86-ядер. Однако AMD на скорость в обычных приложениях упор и не делает.

Главное в APU этой компании — графическое ядро, мощность которого должна позволять собирать простые игровые конфигурации, обходясь без графической карты. Именно поэтому почти половина площади полупроводникового кристалла Kaveri отдана под GPU. А что до традиционных x86-задач, то как-то они выполняются, ну и ладно. Иными словами, в игровых тестах, которые проводятся с участием встроенного видеоядра, A10-7870K должен дать повод для оптимизма. В нашем тестировании мы проверили производительность интегрированного графического ядра Godavari в Full HD-разрешении с теми установками качества изображения, которые позволяют получить приемлемую играбельность. Быстродействие встроенного в A10-7870K графического ядра в реальных играх смотрится очень неплохо. Но главное достижение нужно искать не столько в его относительных результатах, сколько в том, что в большинстве современных игровых приложений этот процессор позволяет использовать Full HD-разрешение и получать при этом вполне приемлемую частоту кадров. Особенно же довольны результатами Godavari должны быть поклонники сетевых многопользовательских игр вроде Counter Strike: Global Offensive или Dota 2. В это сложно поверить, но их A10-7870K вытягивает даже с максимальными настройками качества и с включённым полноэкранным сглаживанием.

Обзор процессора AMD A10-7870K (Godavari): цена игры

Лучший Telegram-канал про технологии возможно Всего в серию вошли девять моделей: пять из них — это процессоры Ryzen 8040HS, четыре — Ryzen 8040U. Все модели основаны на уже знакомой архитектуре Zen 4. Для графического процессора выбрана архитектура RDNA 3.

Так, новый сокет FM2 имеет 904 пина, что на один меньше чем в FM1. Один из пинов стал пустым, в то время как пара пустых пинов отодвинулась дальше от центра в контактном поле. Совершенно ясно, что такие различия делают FM1 и FM2 обратно несовместимыми.

Таким образом, вы сможете использовать современные процессоры серии A для сокета FM1 в будущих материнских платах с сокетом FM2, но не наоборот.

В настоящее время это почти самая современная технология — чипы AMD сейчас 7-нанометровые, а Intel остается на 10 нанометрах. В новинках Ampere используется архитектура ARM. Впервые о линейке Altra Max стало известно в августе 2020 г. Это своего рода продолжение серии Altra, дебютировавшей, как сообщал CNews, в марте 2020 г.

Ampere Computing полное название компании была основана в 2017 г. CNews писал , что она ушла из Intel в июле 2015 г. Истинные причины ее ухода неизвестны, но на момент ухода она была фактически вторым человеком в компании после ее бывшего гендиректора Брайана Кржанича Brian Krzanich. Сам Кржанич оставил свой пост летом 2018 г.

Это первое, что приходит на ум для этого ВСУ. Его усовершенствованный производственный процесс, его высокие частоты, рабочее напряжение и низкая температура дают ему большой запас для этого, во многих случаях получая более чем хорошие показатели для сегмента, для которого он предназначен. Конечно, нам не нужна материнская плата последнего поколения, лучший радиатор и лучшие запоминающие устройства, потому что этот A10-6800K с напряжением менее 1, 43 В позволил нам достичь 4700 МГц и интегрированной графики до 1013 МГц без необходимости подавать дополнительное напряжение, немыслимые фигуры в высшей модели предыдущего поколения.

В основном, мы также выделяем контроллер памяти с частотой 2133 МГц, что дает ему очень хороший прирост графики по сравнению с прошлым поколением, A10-5800K, где мы видим, что он почти достигает цифр разгона, являясь этим стандартным.

Новости про AMD, APU и гибридные процессоры

Характеристики процессора и видео карты. Производительность графического ядра сильно зависит от оперативной памяти, поэтому вся линейка процессоров поддерживает относительно высокое значение частоты памяти 2133 МГц. При использовании менее скоростной памяти ощущается некоторое падение производительности. Тестирование на нагрев производилось программойIntelBurnTest v2. Судя по выше приведённым результатам, процессор остается "холодным" несмотря на высокую нагрузку, которая в реальных условиях встречается крайне редко. Синтетические тесты Aida64 CineBench 11. Здесь применяются различные алгоритмы, с помощью которых можно подвергнуть все доступные ядра процессора полной нагрузке.

Производительность графической карты OpenGL. Эта процедура использует сложную трёхмерную сцену, которая, на примере преследования автомобилей, измеряет скорость вашей графической карты в режиме OpenGL.

Выборка из кэша Итак, в соответствии со схемой классического процессора процедура исполнения кода процессором начинается с выборки инструкций в формате X86 и данных из кэша L1. Инструкции X86 имеют переменную длину, причем информация о длине инструкций сохраняется в специальных полях в кэше инструкций L1. Загрузка инструкций переменной длины Х86 из кэша L1 происходит блоками определенной длины, из которых в дальнейшем выделяются инструкции, которые подвергаются декодированию.

В процессорах на базе микроархитектуры K8 инструкции из кэша L1 загружаются блоками длиной 16 байт 128 бит , а в микроархитектуре K10 длина блока увеличена вдвое, то есть составляет 32 байта 256 бит. При выборке 16-байтного блока инструкции за такт процессоры на базе микроархитектуры K8 могут выбирать и соответственно отправлять на декодирование до четырех инструкций средней длиной 4 байта. В принципе, нельзя утверждать, что использование увеличенного вдвое размера блока выборки инструкций в микроархитектуре AMD K10 позволяет выбирать за такт вдвое больше инструкций. Просто в архитектуре AMD K8 длина блока выборки инструкций была согласована с возможностями декодера. В архитектуре AMD K10 возможности декодера изменились, в результате чего потребовалось изменить и размер блока выборки, чтобы темп выборки инструкций был сбалансирован со скоростью работы декодера.

Предсказание переходов и ветвлений Когда в потоке инструкций встречаются ветвления или переходы, выборка очередного блока инструкций производится с использованием механизма предсказания переходов. Предсказание переходов в процессорах на базе микроархитектуры K8 осуществляется по адаптивному алгоритму на основе анализа истории восьми предыдущих переходов. Основным недостатком механизма предсказания переходов в микроархитектуре K8 было отсутствие предсказания косвенных переходов с динамически чередующимися адресами, то есть переходов, которые производятся по указателю, динамически вычисляемому при выполнении кода программы. В микроархитектуре AMD K10 предсказание переходов существенно улучшено. Во-первых, появился механизм предсказания косвенных переходов.

Во-вторых, оно выполняется на основе анализа 12 предыдущих переходов, что повышает точность предсказания. В-третьих, вдвое с 12 до 24 элементов увеличена глубина стека возврата. Процесс декодирования После этапа выборки инструкций X86 из кэша L1 в полном соответствии со схемой классического процессора наступает этап декодирования трансляции в машинные команды. Этап декодирования присущ любому современному х86-совместимому процессору, имеющему внутреннюю RISC-архитектуру. Процесс декодирования состоит из двух этапов.

В нем из 32-байтных блоков выделяются отдельные инструкции, которые затем сортируются и распределяются по различным каналам декодера. Декодер транслирует x86-инструкции в простейшие машинные команды микрооперации , называемые micro-ops. Сами х86-команды могут быть переменной длины, а вот длина микроопераций уже фиксированная. Инструкции x86 разделяются на простые Small x86 Instruction и сложные Large x86 Instruction. Простые инструкции при декодировании представляются с помощью одной-двух микроопераций, а сложные команды — тремя и более микрооперациями.

Простые инструкции отсылаются в аппаратный декодер, построенный на логических схемах и называемый DirectPath, а сложные — в микропрограммный Microcode Engine декодер, называемый VectorPath. Этот декодер представляет собой своеобразный программный процессор. Он содержит программный код, хранящийся в MIS Microcode Instruction Sequencer , на основе которого воспроизводится последовательность микроопераций. Аппаратный декодер DirectPath является трехканальным и может декодировать за один такт три простые инструкции, если каждая из них транслируется в одну микрооперацию, либо одну простую инструкцию, транслируемую в две микрооперации, и одну простую инструкцию, транслируемую в одну микрооперацию, либо две простые инструкции за два такта, если каждая инструкция транслируется в две микрооперации полторы инструкции за такт. Таким образом, за каждый такт аппаратный декодер DirectPath выдает три микрооперации.

Микропрограммный декодер VectorPath также способен выдавать по три микрооперации за такт при декодировании сложных инструкций. При этом сложные инструкции не могут декодироваться одновременно с простыми, то есть при работе трехканального аппаратного декодера микропрограммный декодер не используется, а при декодировании сложных инструкций, наоборот, бездействует аппаратный декодер. Микрооперации, полученные в результате декодирования инструкций в декодерах DirectPath и VectorPath, поступают в буфер Pack Buffer, где они объединяются в группы по три микрооперации. В том случае, когда за один такт в буфер поступает не три, а одна или две микрооперации в результате задержек с выбором инструкций , группы заполняются пустыми микрооперациями, но так, чтобы в каждой группе было ровно три микрооперации. Далее группы микроинструкций отправляются на исполнение.

Если посмотреть на схему декодера в микроархитектурах K8 и K10, то видимых различий, казалось бы, нет рис. Действительно, принципиальная схема работы декодера осталась без изменений. Разница в данном случае заключается в том, какие инструкции считаются сложными, а какие — простыми, а также в том, как декодируются различные инструкции. Так, в микроархитектуре K8 128-битные SSE-инструкции разбиваются на две микрооперации, а в микроархитектуре K10 большинство SSE-инструкций декодируется в аппаратном декодере как одна микрооперация. Кроме того, часть SSE-инструкций, которые в микроархитектуре K8 декодируются через микропрограммный VectorPath-декодер, в микроархитектуре K10 декодируются через аппаратный DirectPath-декодер.

Декодирование команд в микроархитектурах K8 и K10 Кроме того, в микроархитектуре K10 в декодер добавлен специальный блок, называемый Sideband Stack Optimizer. Не вникая в подробности, отметим, что он повышает эффективность декодирования инструкций работы со стеком и, таким образом, позволяет переупорядочить микрооперации, получаемые в результате декодирования, чтобы они могли выполняться параллельно.

Но пока что A10-6700T отсутствует в розничной продаже в Европе или в России. Будем надеяться, что ситуация изменится в ближайшие дни.

Настоящее Гибридные процессоры Kaveri четвертое поколение APU появились в 2014 году и успешно продаются по настоящее время.

А чтобы вы не запутались, все технические характеристики наших подопытных мы по полочкам разложили в единой табличке на соседней странице. Поскольку процессоры от Intel не могут составить серьезную конкуренцию APU от AMD по графической части, междоусобную войну мы устраивать не стали. Нас больше интересовал вопрос: способны ли современные APU заменить дискретное видео в современных играх. И результаты оказались более чем любопытными. Результаты Признаемся, когда мы только задумывали этот тест, мы относились к нему как к своего рода шутке. Из разряда «какие там могут быть игры на процессоре, так, пасьянсы раскладывать».

В реальности все оказалось куда интереснее. Нормально в них можно поиграть только на старом 15-дюймовом мониторе с разрешением 1366х768, да и то на минимальных настройках графики. Совсем другое дело — сетевые игры. Возьмем War Thunder. В Full HD его потянули все наши испытуемые. Притом младшая тройка позволила выставить средние настройки графики, а старшая без вопросов справилась и с предельными.

Процессор AMD A10-6700T появился в продаже

Geekbench 5, Cinebench R20, Cinebench R15 and FP32 iGPU (GFLOPS). A10 4600M производства AMD имеет четыре ядра с частотой 2.3 GHz. Сравниваем AMD A10-7800 и AMD A10-5800K, и выявляем кто лучше по техническим характеристикам, в играх и бенчмарках. 3DNews Процессоры и память Процессоры AMD Обзор процессора AMD A10-7870K (Godavari. Процессоры AMD А-серии под кодовым названием «Kaveri» с графикой AMD Radeon R7 обладают целым рядом удивительных преимуществ, которые значительно повысят производительность ПК и сделают игровой процесс еще более захватывающим. Компания AMD официально представила свои новые флагманские процессоры A10-7890K и Athlon X4 880K, покончив с разного рода слухами и домыслами.

Обзор процессора AMD A10-7870K (Godavari): цена игры

Процессор AMD A10-6700 Richland AD67000KA44HL FM2. Тип: Процессор Линейка процессора: A10 Архитектура: Richland Сокет процессора: FM2 Базовая частота, ГГц: 3.7. Логотип AMD AMD представила новые APU серии Elite А, построенные на базе архитектуры Richland. Тест и обзор AMD A10 | Подробно о GPU (VLIW4 больше VLIW5). ᐅ Честные отзывы про процессор AMD A10 Richland! Новые Подробности о Процессорах AMD A10-7850K и A10-7700K. Выпуск процессоров новой линейки AMD A10 с самого начала был овит тайной. Корпорация AMD анонсирует процессор AMD Alchemy Au1550.

AMD анонсировала новые процессоры для Socket AM4.

Судя по его данным, новинки будут похожи на актуальные модели Intel. Также источник раскрыл новые технические данные о процессорах с кодовым названием Raphael. Количество ядер и частоты пока не уточняются, однако можно предположить, что новинки получат прирост и в этом плане.

Площадь кристалла CPU Vishera, исполненного по нормам 32-нанометрового технологического процесса, составляет 315 мм2, а количество транзисторов — 1,2 миллиарда. Флагманская модель FX-8350 включает в себя четыре модуля Piledriver, каждый из которых имеет по два ядра. В итоге пользователи, которые приобретут процессор AMD FX-8350, всего за 195 долларов аналог от компании Intel — i5 3570K, стоимостью 235 долларов , получат 8 процессорных ядер, работающих с частотой до 4,2 ГГц!!!

Отдельно для CXL-памяти внедрена поддержка SMKE secure multi-key encryption , с помощью которой гипервизор может оставлять зашифрованными выбранные области SCM-устройств до 64 ключей между перезагрузками. И здесь AMD снова пошла им навстречу, добавив поддержку 72-бит памяти, а не только стандартной 80-бит, сохранив и расширив механизмы коррекции ошибок.

Что примечательно, AMD удалось сохранить сопоставимый уровень задержки обращений к памяти между поколениями CPU: 118 нс против 108 нс, из которых только 3 нс приходится на IO-блок, а 10 нс уже на саму память. Однако тут есть нюансы.

Используется все тот же 12-ступенчатый конвейер, как и в микроархитектуре K8. Однако, несмотря на внешнее сходство, новое ядро процессора все же претерпело существенные изменения. Итак, расскажем обо всем по порядку. Предвыборка данных и инструкций Как уже отмечалось, в случае классического гипотетического процессора исполнение кода процессором начинается с процесса выборки инструкций и данных из кэша L1. Однако для того, чтобы инструкции и данные попали в этот кэш, их нужно предварительно туда загрузить из оперативной памяти. Такой процесс называется предвыборкой данных и инструкций из оперативной памяти. В процессорах с микроархитектурой K8 имеются два блока предвыборки Fetch Unit : один для предвыборки данных, а другой для предвыборки инструкций. Блок предвыборки данных производит предвыборку в кэш L2. В микроархитектуре AMD K10 предвыборка данных осуществляется непосредственно в кэш L1, что, по утверждению представителей компании AMD, способствует повышению производительности, несмотря на вероятность засорения кэша L1 ненужными данными. Кроме того, в блоках предвыборки процессоров с микроархитектурой K10 реализован механизм адаптивной предвыборки данных, позволяющий динамически изменять глубину предвыборки, что позволяет избежать засорения кэша L1 ненужными данными. Ну и последнее новшество, связанное с предвыборкой данных и инструкций, — это, как уже отмечалось, наличие нового блока предвыборки, расположенного в контроллере памяти. Такой блок анализирует запросы к памяти, предсказывает, какие данные понадобятся процессору, и извлекает их в собственный буфер, не занимая кэш процессора. Выборка из кэша Итак, в соответствии со схемой классического процессора процедура исполнения кода процессором начинается с выборки инструкций в формате X86 и данных из кэша L1. Инструкции X86 имеют переменную длину, причем информация о длине инструкций сохраняется в специальных полях в кэше инструкций L1. Загрузка инструкций переменной длины Х86 из кэша L1 происходит блоками определенной длины, из которых в дальнейшем выделяются инструкции, которые подвергаются декодированию. В процессорах на базе микроархитектуры K8 инструкции из кэша L1 загружаются блоками длиной 16 байт 128 бит , а в микроархитектуре K10 длина блока увеличена вдвое, то есть составляет 32 байта 256 бит. При выборке 16-байтного блока инструкции за такт процессоры на базе микроархитектуры K8 могут выбирать и соответственно отправлять на декодирование до четырех инструкций средней длиной 4 байта. В принципе, нельзя утверждать, что использование увеличенного вдвое размера блока выборки инструкций в микроархитектуре AMD K10 позволяет выбирать за такт вдвое больше инструкций. Просто в архитектуре AMD K8 длина блока выборки инструкций была согласована с возможностями декодера. В архитектуре AMD K10 возможности декодера изменились, в результате чего потребовалось изменить и размер блока выборки, чтобы темп выборки инструкций был сбалансирован со скоростью работы декодера. Предсказание переходов и ветвлений Когда в потоке инструкций встречаются ветвления или переходы, выборка очередного блока инструкций производится с использованием механизма предсказания переходов. Предсказание переходов в процессорах на базе микроархитектуры K8 осуществляется по адаптивному алгоритму на основе анализа истории восьми предыдущих переходов. Основным недостатком механизма предсказания переходов в микроархитектуре K8 было отсутствие предсказания косвенных переходов с динамически чередующимися адресами, то есть переходов, которые производятся по указателю, динамически вычисляемому при выполнении кода программы. В микроархитектуре AMD K10 предсказание переходов существенно улучшено. Во-первых, появился механизм предсказания косвенных переходов. Во-вторых, оно выполняется на основе анализа 12 предыдущих переходов, что повышает точность предсказания. В-третьих, вдвое с 12 до 24 элементов увеличена глубина стека возврата. Процесс декодирования После этапа выборки инструкций X86 из кэша L1 в полном соответствии со схемой классического процессора наступает этап декодирования трансляции в машинные команды. Этап декодирования присущ любому современному х86-совместимому процессору, имеющему внутреннюю RISC-архитектуру. Процесс декодирования состоит из двух этапов. В нем из 32-байтных блоков выделяются отдельные инструкции, которые затем сортируются и распределяются по различным каналам декодера. Декодер транслирует x86-инструкции в простейшие машинные команды микрооперации , называемые micro-ops. Сами х86-команды могут быть переменной длины, а вот длина микроопераций уже фиксированная. Инструкции x86 разделяются на простые Small x86 Instruction и сложные Large x86 Instruction. Простые инструкции при декодировании представляются с помощью одной-двух микроопераций, а сложные команды — тремя и более микрооперациями. Простые инструкции отсылаются в аппаратный декодер, построенный на логических схемах и называемый DirectPath, а сложные — в микропрограммный Microcode Engine декодер, называемый VectorPath. Этот декодер представляет собой своеобразный программный процессор. Он содержит программный код, хранящийся в MIS Microcode Instruction Sequencer , на основе которого воспроизводится последовательность микроопераций. Аппаратный декодер DirectPath является трехканальным и может декодировать за один такт три простые инструкции, если каждая из них транслируется в одну микрооперацию, либо одну простую инструкцию, транслируемую в две микрооперации, и одну простую инструкцию, транслируемую в одну микрооперацию, либо две простые инструкции за два такта, если каждая инструкция транслируется в две микрооперации полторы инструкции за такт. Таким образом, за каждый такт аппаратный декодер DirectPath выдает три микрооперации.

Похожие новости:

Оцените статью
Добавить комментарий