Diferente da Intel, que optou por criar um processador de 64 bits incompatível com o conjunto de instruções x86, a AMD optou por um projeto mais simples, usando como base a plataforma K7 (usada no Athlon de 32 bits). Adicionando novos registradores, suporte a endereços de memória de 64 bits, novas instruções e um conjunto de outras modificações, conseguiram chegar a um processador capaz de executar tanto instruções de 32 bits quanto instruções de 64 bits nativamente, sem perda de desempenho. Isso permitiu que os processadores de 64 bits equipados com o novo conjunto de instruções se popularizassem, inicialmente nos servidores (com o Opteron) e em seguida nos desktops, com o Athlon 64 e seus sucessores. Com o tempo, a própria Intel foi obrigada a dar o braço a torcer, desenvolvendo o EM64, que nada mais é do que uma implementação do conjunto de instruções de 64 bits da AMD.
Os primeiros modelos do Opteron foram lançados em 2003. Eles eram processadores single-core baseados no core SledgeHammer, produzido usando uma técnica de 0.13 micron. Todos eles utilizam 1 MB de cache L2, mas são divididos em três séries distintas.
Os processadores da série 1xx são os mais baratos, mas não oferecem suporte a multiprocessamento; eles eram destinados a estações de trabalho e a pequenos servidores. Os processadores da série 2xx oferecem suporte a dois processadores, concorrendo com os modelos contemporâneos do Xeon DP, enquanto os processadores da série 8xx oferecem suporte ao uso de 4 ou 8 processadores, concorrendo diretamente com o Xeon MP. Placas com suporte a 8 processadores são raras e caras (as mais comuns são as placas para 2 ou 4 processadores), mas os poucos modelos disponíveis fizeram um relativo sucesso no mercado de servidores de alto desempenho, dando origem a muitos dos modelos atuais.
A série 1xx baseada no SledgeHammer inclui o Opteron 140 (1.4 GHz, 1 MB), 142 (1.6 GHz, 1 MB), 144 (1.8 GHz, 1 MB), 146 (2.0 GHz, 1 MB), 148 (2.2 GHz, 1 MB) e o 150 (2.4 GHz, 1 MB). A série 2xx inclui o Opteron 240 (1.4 GHz, 1 MB), 242 (1.6 GHz, 1 MB), 244 (1.8 GHz, 1 MB), 246 (2.0 GHz, 1 MB), 248 (2.2 GHz, 1 MB) e 250 (2.4 GHz, 1 MB), enquanto a série 8xx inclui o Opteron 840 (1.4 GHz, 1 MB), 842 (1.6 GHz, 1 MB), 844 (1.8 GHz, 1 MB), 846 (2.0 GHz, 1 MB), 848 (2.2 GHz, 1 MB) e 850 (2.4 GHz, 1 MB). Como pode ver, os processadores das três séries são praticamente idênticos. Na verdade, a única diferença entre um Opteron 150, um 250 e um 850 é a configuração dos links HyperTransport, que possibilitam o suporte a multiprocessamento.
Todos estes processadores utilizam placas soquete 940, com bus de 800 MHz, e exigem o uso de memórias registered DDR. Assim como os processadores AMD atuais, o Opteron inclui um controlador de memória integrado. Com isso, o tipo de memória suportado é definido diretamente pelo processador, e não pelo chipset. Outra peculiaridade é que nas placas com suporte a vários processadores, cada processador dispõe de um conjunto próprio de módulos de memória, que acessa diretamente, diferente dos sistemas com SMP, onde todos os processadores compartilham o mesmo barramento com a memória através do FSB.
A comunicação entre os processadores é feita através de links HyperTransport, que são usados não apenas para toda a troca de dados, mas também para permitir que um processador tenha acesso aos módulos de memória ligados ao outro.
Entra em cena o NUMA (Non-Uniform Memory Architecture), que permite que ambos os processadores trabalhem utilizando uma tabela de endereços unificada. Graças ao NUMA, cada um dos processadores enxerga toda a memória instalada e os acessos feitos às áreas de memória controladas pelos outros processadores são feitos através dos links HyperTransport que os interligam.
Embora processadores single-core com apenas 1 MB de cache L2 soem obsoletos dentro da concepção atual, estes pioneiros baseados no SledgeHammer se comparavam favoravelmente aos Xeons baseados na plataforma NetBurst e foram os responsáveis pelo crescimento do uso de processadores AMD em servidores, um ramo que até então era dominado pela Intel.
A segunda geração do Opteron é representada pelos processadores com core Venus (série 1xx), Troy (série 2xx) e Athens (série 8xx), fabricados usando uma técnica de 0.09 micron. Eles ainda são processadores single-core, que mantêm o cache L2 de 1 MB do SledgeHammer e o uso de memórias DDR, mas oferecem um consumo elétrico mais baixo e suportam freqüências de clocks mais elevadas.
Estas três séries foram seguidas por versões dual-core, lançadas em março de 2005, baseadas nos cores Denmark (modelos 165, 170, 175, 180 e 185), Italy (modelos 265, 270, 275, 280, 285 e 290) e Egypt (modelos 865, 870, 875, 880, 885 e 890), todos com 2x 1 MB de cache L2 e com clock de 1.8 GHz (nos modelos x65) a 2.8 GHz (nos modelos x90). Eles ficaram pouco tempo no mercado, pois ainda utilizavam placas soquete 940 e memórias registered DDR, uma plataforma que na época já era considerada ultrapassada.
A atualização da linha veio em agosto de 2006, com o lançamento dos processadores baseados nos cores Santa Ana e Santa Rosa (coincidentemente o mesmo nome-código que a Intel escolheu para a quarta geração da plataforma Centrino), que trouxeram o suporte a memórias DDR2. Como ambos são ainda fabricados usando a técnica de 0.09 micron, eles continuam sendo processadores dual-core, com apenas 2x 1 MB de cache L2, assim como os antecessores. Apesar disso, o uso de memórias DDR2 aumentou consideravelmente o desempenho.
Estes processadores utilizam placas soquete F que, assim como o soquete LGA 771 da Intel, utiliza o sistema LGA (Land Grid Array), onde os pinos de contato são movidos do processador para o soquete, criando uma cama de contatos, sobre a qual o processador é instalado. O soquete F possui nada menos do que 1207 contatos, necessários para acomodar os três barramentos HyperTransport independentes, usados para comunicação entre os processadores:
Na época, a Intel já havia lançado os Xeons baseados no core Woodcrest que, juntamente com os processadores Core 2 Duo (também muito usados em servidores devido ao relativo baixo custo e ao bom desempenho), passaram a lentamente recuperar o espaço conquistado pela AMD nos anos anteriores. A AMD se viu então obrigada a reduzir o preço dos processadores e concorrer com a Intel com base no custo.
A resposta veio em setembro de 2007, com o lançamento das versões quad-core do Opteron, baseadas no core Barcelona, produzidos usando uma técnica de 0.065 micron.
Diferente dos Xeons com core Clovertown e Harpertown (entre outros), que são compostos por dois processadores dual-core que compartilham o mesmo encapsulamento, o Barcelona é um processador quad-core nativo. Isso oferece uma certa vantagem do ponto de vista do desempenho, pois toda a comunicação entre os processadores é feita através de um barramento HyperTransport interno e não através do FSB.
Os processadores baseados no core Barcelona incluem 512 KB de cache L2 por núcleo (2 MB no total) e mais um cache L3 de 2 MB compartilhado entre os quatro núcleos, totalizando 4 MB de cache. O uso do cache L3 compartilhado reduz a duplicação de informações em casos em que os núcleos estão trabalhando com o mesmo conjunto de informações. Outra vantagem da plataforma é que o controlador de memória é integrado diretamente ao processador (em vez de ser um componente do chipset), o que reduz a latência de acesso à memória e reduz a necessidade de um cache maior. A combinação destes fatores permitem que o Barcelona consiga ser competitivo, mesmo oferecendo apenas um terço do total de cache que o Harpertown.
Além do cache L3 e do uso de 4 núcleos, o Barcelona inclui um conjunto de outras melhorias em relação aos processadores anteriores, como a inclusão de unidades SSE de 128 bits (capazes de processar as instruções em um único ciclo), melhorias nos decodificadores de instruções e no barramento com o cache, expansão dos buffers do controlador de memória, melhorias no funcionamento dos caches e no circuito de branch prediction, que resultaram em uma série de ganhos incrementais.
0 comentários:
Postar um comentário