processadores modernos -...

53
Capítulo 7 Processadores modernos É um pouco difícil definir o que é um processador “moderno”. O que é moderno hoje pode ser obsoleto dentro de dois anos, e ser descontinuado (ou seja, deixar de ser fabricado) dentro de três ou quatro anos. Seja como for, dedicamos este capítulo aos modelos comuns no ano 2001, e que certamente continuarão em produção por mais alguns anos: Intel Pentium III Intel Pentium 4 Intel Xeon AMD Duron AMD Athlon Cyrix III Nomes confusos Antigamente os processadores tinham nomes bastante simples. Todo mundo sabia que depois do 80286, o próximo processador a ser lançado seria o 80386, depois o 486, e assim por diante. Depois que a Intel perdeu uma briga judicial para a Cyrix a respeito da “marca registrada” 486, os processadores passaram a ter nomes ao invés de números. O P5 era o nome provisório do Pentium, enquanto P6 foi usado provisoriamente pelo Pentium Pro. O Pentium MMX era chamado de Klamath durante seu período de desenvolvimento. Hoje tanto a Intel como a AMD e a Cyrix utilizam esta estragégia de marketing. Usam nomes provisórios para seus processadores, para aplicarem o nome definitivo apenas na ocasião do seu lançamento. O

Upload: dangthu

Post on 24-Jan-2019

216 views

Category:

Documents


0 download

TRANSCRIPT

Capítulo 7 Processadoresmodernos É um pouco difícil definir o que é um processador “moderno”. O que émoderno hoje pode ser obsoleto dentro de dois anos, e ser descontinuado(ou seja, deixar de ser fabricado) dentro de três ou quatro anos. Seja comofor, dedicamos este capítulo aos modelos comuns no ano 2001, e quecertamente continuarão em produção por mais alguns anos:

Intel Pentium III Intel Pentium 4 Intel Xeon AMD Duron AMD Athlon Cyrix III

Nomes confusos

Antigamente os processadores tinham nomes bastante simples. Todo mundosabia que depois do 80286, o próximo processador a ser lançado seria o80386, depois o 486, e assim por diante. Depois que a Intel perdeu umabriga judicial para a Cyrix a respeito da “marca registrada” 486, osprocessadores passaram a ter nomes ao invés de números. O P5 era o nomeprovisório do Pentium, enquanto P6 foi usado provisoriamente pelo PentiumPro. O Pentium MMX era chamado de Klamath durante seu período dedesenvolvimento. Hoje tanto a Intel como a AMD e a Cyrix utilizam estaestragégia de marketing. Usam nomes provisórios para seus processadores,para aplicarem o nome definitivo apenas na ocasião do seu lançamento. O

7-2 Hardware Total

Pentium 4, por exemplo, passou um bom tempo sendo chamado deWillamate, o Itanium foi chamado antes de Merced, e assim por diante.Mesmo após o lançamento, um processador pode passar a ter nome esobrenome. Por exemplo, os primeiros processadores Pentium III eram declasse Katmai, bastante similares ao Pentium II. Mais tarde foi criado oPentium III Coppermine, com vários melhoramentos, e finalmente o PentiumIII Tualatin. Com processadores sendo lançados em novas versões quasemensais, o use desses “apelidos” ajuda a chamar atenção. Por incrível quepareça, para um técnico ou especialista em hardware também é importanteconhecer a maioria dessas classificações.

Pentium IIIO Pentium III foi lançado em 1999, inicialmente como um melhoramento doPentium II. Utilizava o encapsulamento em forma de cartucho chamadoSECC2 (Single Edge Contact Cartridge 2), uma versão derivada do SECC,usado pelo Pentium II. Também foram produzidas versões comencapsulamento SECC, idêntico ao do Pentium II. Outro ponto idêntico é oconector da placa de CPU, o conhecido Slot 1, também chamado de SC242.

Figura 7.1

Pentium III com encapsulamento SECC2.

Os primeiros processadores Pentium III utilizavam o núcleo Katmai,semelhante ao do Pentium II, porém com pequenas diferenças, como asnovas instruções SSE (Streamed SIMD Extensions), voltadas paraprocessamento 3D e multimídia.

Capítulo 7 – Processadores modernos 7-3

*** 35% ***Figura 7.2

Pentium III com encapsulamento FC-PGA.

O novo núcleo Coppermine foi introduzido em meados do ano 2000. Alémde utilizar a tecnologia de 0,18 , o Coppermine traz a nova cache L2integrada ao núcleo. Esta nova versão do Pentium III passou a ser produzidano tradicional encapsulamento SECC2 e também no novo FC-PGA (FlipChip Pin Grid Array).

Já em meados de 2001 a Intel lançou o Pentium III Tualatin. Sua principalcaracterística é a tecnologia de 0,13 , resultando em menor custo deprodução e menor dissipação de calor. Foi introduzido com este modelo, oencapsulamento FC-PGA2, e passaram a ser oferecidas versões com 256 kB ecom 512 kB de cache L2 integrada ao núcleo.

O Pentium III Katmai

Apesar de já ter sido substituído por versões mais novas (Coppermine eTualatin), é importante estudar o Pentium III Katmai, já que suascaracterísticas básicas foram mantidas nas novas versões.

Em 1999 a Intel lançou a primeira versão do Pentium III construído com onúcleo Katmai, o mesmo do Pentium II, acrescentando algumas alteraçõesimportantes:

Maiores clocks que o Pentium II

7-4 Hardware Total

Novas instruções para multimídia e 3D (SSE) Identificação do processador através de número de série Pequena alteração no encapsulamento, que passou a ser SECC2 Clock externo de 100 MHz, e posteriormente de 133 MHz

Processador Pentium III KatmaiLançamento 1999Transistores 9.500.000Tecnologia 0,25 Encapsulamento SECC ou SECC2Barramento de dados 64 bitsBarramento de endereços 36 bitsCapacidade de memória 64 GBClock interno 450 a 600 MHzClock externo 100 ou 133 MHzConsumo 26 a 36WCache L1 32 kBCache L2 512 kB, “half speed”Novos recursos:Instruções SSE, número de série, encapsulamentoSECC2 ou SECC.

A mais relevante alteração foi a introdução das novas instruções SSE(Streaming SIMD Extensions). São instruções especializadas em operaçõescomuns em aplicações de áudio, vídeo e geração de imagens tridimensionais.Sem essas instruções, o processador teria que utilizar combinações de outrasinstruções clássicas para realizar o mesmo trabalho. Essas instruções sãoSIMD (Single Instruction, Multiple Data – instrução única para múltiplosdados) e facilitam os processamentos citados, pois envolvem a aplicação decálculos fixos a grandes seqüências de dados. Essas instruções tem portanto oobjetivo de aumentar a velocidade de processamento de aplicações demultimídia a geração de imagens 3D, apesar de também servir comoresposta à tecnologia 3D Now da AMD, utilizada a partir do processador K6-2, desde 1998.

A inclusão de um número de série em cada processador Pentium III foi umaquestão polêmica, tanto assim que ele foi eliminado no Pentium 4. Quandohabilitado pelo usuário, este recurso permite ao processador informar umnúmero único quer o identifica entre todos os demais processadores. Comele tornam-se mais seguras as transações comerciais pela Internet, e tornamais simples e confiável a identificação de um determinado PC dentro deuma rede. Muitos usuários reclamamaram sobre outra questão, que é aprivacidade. Como cada processador tem seu próprio número, o usuário

Capítulo 7 – Processadores modernos 7-5

pode deixar um “rastro” nos sites percorridos ao acessar a Internet (é claro,se este recurso estiver habilitado, e se o computador do usuário estivercarregado com software próprio para prestar esta informação). A outrapreocupação é que o uso desta identificação se tornar padrão, os fabricantesde software poderão vincular o número de série do processador ao númerode série dos seus softwares. Desta forma seria fácil detectar ou impedir o usode cópias ilegais de software, um golpe mortal sobre a pirataria. A Inteloferece um software que permite ao usuário desabilitar o número de série.Na verdade o número não é apagado, apenas o processador é impedido deinformá-lo. A desabilitação só tem efeito depois que é executado um novoRESET. Da mesma forma, para habilitá-lo é preciso executar um RESETpara que volte a ser usado. Os BIOS de placas de CPU para esteprocessador também permitem desativar o número de série, através doCMOS Setup.

Note que a cache L2 do Pentium III Katmai não é integrada ao seu núcleo,ou seja, é formada por chips discretos adicionais (“discretos”, significa quetratam-se de componentes independentes do processador). Possui 512 kB eopera com a metade da freqüência do processador, a exemplo do queocorria com o Pentium II.

Foi notável no ano de 98 a expansão da AMD com o seu processador K6-2.Esses processadores possuem dois conjuntos de instruções que se juntam àsinstruções do Pentium original: MMX (Multimedia Extensions, idênticas àsda Intel) e 3D Now!, especializadas no processamento de imagens 3D (estatecnologia foi mantida nos processadores mais novos da AMD, como oAthlon e o Duron). Tanto o Pentium MMX, o Celeron e o Pentium IIpossuem as instruções MMX, mas nada semelhante às instruções 3D Now!da AMD. As novas instruções introduzidas pela Intel rivalizam com atecnologia 3D Now!. Passamos a ter a Intel com as tecnologias MMX e SSE(também chamada de MMX2), e a AMD com as tecnologias MMX e 3DNow!.

Para que os diversos programas já disponíveis façam uso do 3D Now épreciso que seja instalado o pacote DirectX 6.0 ou superior. Para usar asnovas instruções SSE do Pentium III é necessário instalar o DirectX 6.1 ousuperior. O DirectX pode ser obtido em http://www.microsoft.com/directx.Periodicamente a Microsoft libera novas versões do DirectX. No WindowsME, por exemplo, era fornacido o DirectX 7.1. Poucos meses depois estavaliberada a versão 8.0. Novas versões do DirectX visam dar suporte àutilização dos recursos encontrados nos novos processadores.

7-6 Hardware Total

Muitas placas de CPU para Pentium II podem ser usadas para instalar umPentium III, desde que o barramento externo seja de 100 MHz. Placas paraPentium II mais antigas operavam com apenas 66 MHz (ex: chipset i440LX),e desta forma não aproveitavam todo o potencial do Pentium III. Logo aseguir, pequenas modificações de hardware e de BIOS foram feitas nasplacas para Pentium II disponíveis na época, visando não apenas dar suporteao Pentium III, mas aproveitar todo o seu potencial.

Também deve ser tomado cuidado com a questão do cooler. Existemcoolers que são próprios para o Pentium II, e outros que são próprios para oPentium III. O Pentium II possui na sua parte posterior uma chapa metálicapara acoplar o ventilador e facilitar a dissipação de calor. O seuencapsulamento é conhecido como SECC. O Pentium III usa o SECC2(apesar de existirem versões com o SECC, igual ao do Pentium II), que nãopossui esta chapa metálica, ficando exposta a placa onde está o processadore a cache L2. Conjuntos de ventilador/dissipador para o Pentium III SECC2deverão conter a chapa metálica apropriada.

Figura 7.3

Cartuchos SECC e SECC2, vistas frontais etraseiras.

O núcleo Katmai era construído com a tecnologia de 0,25 e era alimentadopor uma tensão de 2 volts. Inicialmente foram lançadas versões de 450 e 500MHz, ambas com clocks externos de 100 MHz. Posteriormente foramlançadas as versões de 550 e 600 MHz (clock externo de 100 MHz), efinalmente as de 533 e 600 MHz com clocks externos de 133 MHz. Para nãofazer confusão com versões com clock externo de 100 MHz, passou a serusado um sufixo “B”. Por exemplo, o Pentium III/600 tem clock externo de100 MHz, enquanto o Pentium III/600B opera com clock externo de 133MHz. Todos os modelos Katmai têm encapsulamento SECC ou SECC2 epossuem cache L2 no cartucho, com 512 kB e operando com a metade dafreqüência do núcleo do processador.

Modelo Clock internoe externo

Multiplicador Potência

Capítulo 7 – Processadores modernos 7-7

Pentium III/450 450 MHz / 100 MHz 4,5x 26,6 WPentium III/500 500 MHz / 100 MHz 5x 29,3 WPentium III/533B 533 MHz / 133 MHz 4x 31,1 WPentium III/550 550 MHz / 100 MHz 5,5x 32,2 WPentium III/600 600 MHz / 100 MHz 6x 36,1 WPentium III/600B 600 MHz / 133 MHz 4,5x 36,1 W

Avanços da miniaturizaçãoSem dúvida um dos fatores que contribuiu (como sempre contribui) para aevolução do Pentium III foi a redução no tamanho dos minúsculostransistores que os formam. Ao ser lançado em 1997, o Pentium II usava atecnologia de 0,35 mícron (ou seja, cada minúsculo transistor media 0,35milésimos de milímetro). Já o Pentium II de 333 MHz introduziu a tecnologiade 0,25 mícron. Os atuais modelos utilizam a tecnologia mais recente, 0,18mícron. A partir de meados de 2001, começou o uso da tecnologia de 0,13mícron. Ao utilizar transistores menores é possível produzir processadorescom clocks mais elevados e com menos aquecimento. Sem dúvida a elevadadissipação de calor é o maior obstáculo para atingir clocks elevados. Portantoao reduzir o aquecimento, os fabricantes de processadores podem lançarmodelos com clocks mais elevados, ainda mantendo níveis de aquecimentoaceitáveis.

Outra vantagem das tecnologias de transistores menores é a redução notamanho do chip. Ao ocupar menos espaço, torna-se possível acrescentarmais circuitos, ou seja, mais recursos. Desta forma foi possível acrescentar aosprocessadores, instruções MMX, instruções SSE e integrar a cache L2 aonúcleo do processador. Finalmente temos a vantagem da redução dospreços. Preços de processadores são em parte definidos por questõescomerciais, mas também em parte por questões técnicas. Ao reduzir otamanho de um chip, é possível produzir um número maior deles em cadalote. Isto resulta em redução do custo de produção que pode ser repassadaao usuário final.

7-8 Hardware Total

Figura 7.4

Base de silício onde são construídos oschips.

A figura 4 mostra a base de silício (waffer) na qual são produzidos os chips.Esta base tem 20 ou 30 cm de diâmetro, dependendo do equipamento usadona produção. Os pequenos quadrados estampados na base (mostrados emdetalhe à direita) são os processadores. Quanto menor é o tamanho dostransistores, maior é o número de processadores que podem ser construídosem cada waffer, e desta forma, menor poderá ser o custo unitário. A adoçãode tecnologias de produção com transistores menores permite lançar novasversões de processadores mais rápidos, com menor dissipação de calor emenor custo.

Outro melhoramento importante foi o aumento do clock externo, permitindoo uso de memórias mais rápidas. Desde o lançamento do Pentium, acomunicação entre o processador e o seu exterior (o que inclui a memóriaRAM) era feita com o clock de 66 MHz, ou seja, permitia realizarteoricamente até 66 milhões de acessos à memória por segundo. Em 1998 obarramento do Pentium II passou a operar com até 100 MHz, possibilitandoo uso das memórias classificadas como PC100. Em 1999 chegaram aomercado modelos do Pentium III com clock externo de 133 MHz (aindacom o núcleo Katmai – Pentium III/533B e Pentium III/600B), permitindoassim o uso de memórias PC133.

Se o clock externo do processador não tivesse aumentado, boa parte dosganhos de desempenho seria colocada a perder. As versões de 233 a 333MHz do Pentium II funcionavam com clock externo fixo em 66 MHz.Quanto mais elevado era o seu clock interno, mais difícil era obterdesempenho mais elevado. Compare a relação entre clock interno e externopara esses processadores:

Capítulo 7 – Processadores modernos 7-9

Processador Clock interno Clock externo MultiplicadorPentium II/233 233 MHz 66 MHz 3.5xPentium II/266 266 MHz 66 MHz 4xPentium II/300 300 MHz 66 MHz 4.5xPentium II/333 333 MHz 66 MHz 5x

Comparando os multiplicadores 3.5x e 5x do Pentium II/233 e do PentiumII/333, respectivamente, podemos afirmar que a capacidade do PentiumII/333 em buscar dados e instruções na memória manteve-se fixa (ou seja,aumentou 0%), enquanto a capacidade de processamento aumentou em 42%.Sendo assim, o aumento global no desempenho do processador não foi de42%, fixou-se em um índice menor. Medidas de desempenho feitas comprogramas especializados mostraram que o desempenho do Pentium II/333 éapenas 35% maior que o do Pentium II/233, e não 42% como seria se o clockinterno fosse o único determinante da velocidade de um processador. Istomostra que para aproveitar integralmente o aumento do clock interno, épreciso melhorar o desempenho dos acessos à memória.

Esta situação foi melhorada com o lançamento de novos modelos doPentium II e posteriormente do Pentium III, com clock externo de 100 MHz,valor 50% maior que 66 MHz. As primeiras versões do Pentium II a usarem onovo clock externo de 100 MHz foram as de 350 e 400 MHz. Comparando oPentium II/350 com o Pentium II/233, temos aumentos de 50% tanto no clockinterno como no externo. Como resultado de ambos os clocks teremaumentado em 50%, o desempenho do Pentium II/350 é também 50% maiorque o do Pentium II/233.

Novos modelos do Pentium II, que deu lugar ao Pentium III, foram lançadoscom clocks mais elevados. Em agosto/1999 tínhamos o Pentium III/600, aindaoperando com o clock externo de 100 MHz. Usando o multiplicador 6x, obarramento de 100 MHz deste processador já era considerado lento emrelação aos 600 MHz que usava internamente. Para melhorar a situação,foram lançadas em setembro/1999 (ainda com o núcleo Katmai) as primeirasversões do Pentium III com barramento externo de 133 MHz. Com 600MHz internos e 133 MHz externos, o multiplicador usado é 4.5x, menosruim que o 6x usado na versão anterior.

Por mais que se procure desenvolver memórias mais rápidas, um problemasempre ocorre na evolução dos processadores: a velocidade das memóriasnão acompanha a mesma evolução que a velocidade dos processadores. Noprimeiro Pentium lançado, tanto o clock interno como o externo eram de 66

7-10 Hardware Total

MHz, portanto o multiplicador era 1x. Nos modelos mais recentes doPentium III são usados multiplicadores elevados como 6x e superiores. NoPentium III de 1000 MHz (barramento externo de 133 MHz), o multiplicadoré 7.5x. Isto significa que a velocidade do processador evoluiu 7.5 vezes maisque a velocidade das memórias. Felizmente a Intel e outros fabricantes deprocessadores utilizaram uma forma de melhorar este quadro: utilizar umamemória cache L2 mais rápida, operando com a mesma freqüência donúcleo do processador. Esta é uma das principais características do PentiumIII Coppermine.

Pentium III CoppermineA criação desta nova versão do Pentium III foi possível graças aodesenvolvimento da tecnologia de fabricação com 0,18. Com transistoresmenores, tornou-se possível embutir a cache L2 no próprio núcleo doprocessador. O Celeron foi o primeiro processador a utilizar este recurso,com sua cache L2 de 128 kB operando na mesma freqüência do núcleo. OPentium III Coppermine tem cache L2 embutida (on-die) e tambémoperando na mesma freqüência do núcleo (full speed). Em outras palavras,em um Pentium III Coppermine de 600 MHz, a cache L2 opera com 600MHz, enquanto nas versões Katmai de 600 MHz, a cache L2 operava comapenas 300 MHz.

Processador Pentium III CoppermineLançamento 1999Transistores 28.000.000Tecnologia 0,18 Encapsulamento SECC, SECC2 e FC-PGABarramento de dados 64 bitsBarramento de endereços 36 bitsCapacidade de memória 64 GBClock interno 500 a 1.133 MHzClock externo 100 ou 133 MHzConsumo 16 a 36 WCache L1 32 kBCache L2 256 kB (on-die, full speed)Novos recursos:Além dos já presentes no modelo Katmai, este modelotem a nova cache L2 on die, com 256 kB, tecnologia de0,18 e menor consumo de energia. Passou a serproduzido também no encapsulamento FC-PGA.

A versão Coppermine do Pentium III incorpora um grande melhoramentona cache L2. A Intel chama a tecnologia de Advanced Transfer Cache. Com

Capítulo 7 – Processadores modernos 7-11

a adoção do processo de fabricação com 0,18 mícron no lugar de 0,25mícron, tornou-se possível incorporar a cache L2 ao próprio núcleo doprocessador, ao invés de utilizar chips SRAM independentes. Apesar de teragora apenas 256 kB, a cache L2 do Pentium III é acessada com a mesmavelocidade do núcleo, e não mais com a metade deste valor. Em umPentium III /600E, o clock de acesso à cache L2 é de 600 MHz, e não de 300MHz como no Pentium III/600. De certa forma, dobrar a velocidade deacesso à cache L2 compensa com vantagem a sua redução em tamanho pelametade. Melhor ainda, a transferência de dados entre a cache L2 e o núcleodo processador não é feito mais em grupos de 64 bits, e sim em grupos de256 bits, ou seja, 4 vezes mais rápido. Comparando de forma simplificada, acache L2 do Pentium III Coppermine tem tamanho duas vezes menor, massua taxa de transferência de dados para o processador é 8 vezes maior. OPentium III/600 foi o último a ser produzido com a cache L2 “tradicional”,com 512 kB (núcleo Katmai), formada por chips SRAM e acesso em 64 bits.Todas as novas versões do Pentium III, de 600 MHz em diante, além dasversões 550E, 533EB e 500E apresentam cache L2 na nova arquitetura. Atabela que se segue compara as caches L2 utilizadas nos últimos anos.

Processador Tamanhoda cache L2

Tipo decache L2

Númerode bits

Clock dacache L2

Pentium MMX 512 kB Chips SRAMna placa de CPU

64 66 MHz

Pentium II e IIIoriginal (Katmai)

512 kB Chips SRAMno cartucho

64 Metade do clockdo núcleo

Pentium IIIE(Coppermine)

256 kB Integrado ao núcleo 256 Clock igual ao do núcleo

Você pode encontrar no Pentium III Coppermine, sufixos como B, E e EB.Os sufixos são usados apenas quando necessários, para diferenciar entremodelos diferentes, porém de mesmo clock.

O sufixo “E” indica que o Pentium III é um modelo construído comtecnologia de 0,18 mícron e com Advanced Transfer Cache de 256 kB(núcleo Coppermine). Da mesma forma, o sufixo B indica o clock externo de133 MHz (pode ser núcleo Katmai ou Coppermine). Entretanto a ausênciadesses sufixos não indica a ausência desses recursos. Eles são usados pelaIntel apenas para diferenciar entre modelos que possuem e que não possuemesses recursos. Por exemplo, o Pentium III de 700 MHz não possui versõescom clock externo de 133 MHz, nem versões com cache L2 de 512 kBoperando com a metade do clock do núcleo, por isso não utiliza sufixos. Já oPentium III de 600 MHz possui 4 versões: 600, 600E, 600B e 600EB.

7-12 Hardware Total

Figura 7.5

Versões do Pentium III Katmai eCoppermine com encapsulamento decartucho.

A figura 5 mostra uma tabela com os modelos de Pentium III comencapsulamento de cartucho (SECC e SECC2), ou seja, para placas de CPUequipadas com o Slot 1. Para cada um deles é indicado o clock interno, oclock externo, o tamanho e o tipo de cache. Note que existem versõesKatmai, com cache L2 de 512 kB formada por chips SRAM, e versõesCoppermine, com cache L2 de 256 kB integrada ao núcleo. Existem versõescom barramentos de 100 e 133 MHz. Quando dois modelos têm o mesmoclock interno mas são produzidos com clocks externos diferentes (100 e 133MHz), o sufixo “B” é usado para indicar a versão de 133 MHz.

Figura 7.6

Versões do Pentium III Coppermine comencapsulamento FC-PGA.

Capítulo 7 – Processadores modernos 7-13

A figura 6 mostra uma tabela com as versões do Pentium III comencapsulamento FC-PGA, ou seja, próprios para placas de CPU equipadascom o Soquete 370, até 1 GHz. Todos eles apresentam o núcleoCoppermine, mas encontramos versões com clocks externos de 100 e de 133MHz. O sufixo B é usado para diferenciar a versão de 133 MHz, quandoexistem um modelo de mesmo clock interno e com o clock externo de 100MHz.

Note que neste livro damos prioridade à apresentação dos processadores edemais dispositivos para uso em PCs tipo desktop, ou seja, aqueles que sãomontados a partir de gabinetes, fontes, placas, etc. Lembre-se entretanto quetambém existem os modelos para uso em PCs portáteis (notebooks). Todosos processadores de todos os fabricantes, sejam eles novos ou antigos, sãooferecidos também nas versões mobile ou portable, para uso em PCsportáteis. Esses processadores são similares aos usados em PCs desktop,exceto por algumas pequenas diferenças:

Menor voltagem e menor consumo de energia Geralmente são soldados, e não encaixados Usam encapsulamentos menores

Quanto aos clocks e demais características, são normalmente idênticas às dosprocessadores de uso geral. A figura 7 mostra um processador Pentium III(frente e verso) para uso em PCs portáteis. Este modelo utiliza oencapsulamento BGA (Ball Grid Array). Ao invés de ter pinos que seencaixam no soquete (PGA = Pin Grid Array), possui minúsculas esferas desolda. Isto torna mais simples e eficiente a sua fixação na placa de circuito. Asoldagem é sempre melhor que o encaixe, do ponto de vista de contatoelétrico. Como em notebooks normalmente não são oferecidas opções deupgrade por troca de processador, é vantajoso soldá-los definitivamente.

7-14 Hardware Total

*** 35% ***Figura 7.7

Pentium III com encapsulamento BGA.

Pentium III Tualatin O ano de 2001 marcou o início da transição da tecnologia de 0,18 para0,13. Como sempre ocorre com as reduções de tamanho, esta permitiureduzir ainda mais a energia dissipada pelos novos processadores, o que eraabsolutamente necessário para que o Pentium 4, o Xeon e o Itaniumoperassem com temperaturas e níveis de dissipação aceitáveis. Entretanto,antes de utilizar a nova tecnologia de 0,13 nesses processadores, a Intel aempregou na nova versão do Pentium III, o Tualatin.

Esta nova tecnologia veio a resolver problemas encontrados no Pentium IIICoppermine ao operar com clocks superiores a 1 GHz. Ao atingir a marcade 1.13 GHz, aquela versão apresentou problemas de travamento queresultaram em um recall, ou seja, as unidades já vendidas foram recolhidasdos usuários. Apenas a versão de cartucho (SECC2) continuou sendooferecida com os clocks máximos de 1 GHz e 1.13 GHz. A versão deencapsulamento FC-PGA passou a ser oferecida com clock máximo de 1GHz. Isto ocorreu em meados de 2000, e a Intel passou cerca de um anosem lançar versões mais velozes do Pentium III. Durante este período a Intelpreferiu concentrar seus esforços em lançar o Pentium 4 e novas versões doCeleron.

Processador Pentium III Tualatin Lançamento 2001Transistores 28.000.000Tecnologia 0,13 Encapsulamento FC-PGA2

Capítulo 7 – Processadores modernos 7-15

Barramento de dados 64 bitsBarramento de endereços 36 bitsCapacidade de memória 64 GBClock interno 1.13 GHz e superioresClock externo 133 MHzConsumo A partir de 29 W Cache L1 32 kBCache L2 256 kB ou 512 kBNovos recursos:Similar ao Pentium III Coppermine, porém com menordissipação de calor, clocks superiores e opções com 256kB e 512 kB de cache. Voltagem externa de 2,5 volts.

Provavelmente o Pentium III Tualatin será o novo modelo a ser usado nosPCs mais simples, enquanto o Celeron será descontinuado. O Pentium 4 e oXeon serão oferecidos para os PCs de alto desempenho, enquanto o Itaniumserá usado nas futuras máquinas de 64 bits.

Uma curiosa novidade do Pentium III Tualatin é a voltagem externa, quepassa a ser de 2,5 volts. Durante vários anos os processadores têm operadocom voltagem externa de 3,3 volts, enquanto a voltagem interna se tornavacada vez menor. Enquanto isso, processadores para notebooks já utilizavamtensões menores. A partir de então a tensão de 2,5 volts se tornará padrãopara chipsets, memórias e processadores. Um Pentium III Tualatin não podeser instalado em uma placa de CPU para Pentium III Coppermine, já quenesses modelos a tensão externa é de 3,3 volts, e não 2,5 volts. Novas placasde CPU para Pentium III passarão a operar tanto com 3,3 como com 2,5volts.

Figura 7.8

Pentium III Tualatin, com encapsulamento FC-PGA2.

7-16 Hardware Total

O novo Pentium III utiliza o encapsulamento FC-PGA2, uma variante do FC-PGA. A diferença está no dissipador de calor localizado na sua partesuperior. Além de facilitar a dissipação, este dissipador também dá maiorrigidez mecânica ao processador, protegendo o seu núcleo de choquesmecânicos e outros acidentes.

Figura 7.9

Visões laterais dos encapsulamentos FC-PGA e FC-PGA2.

Figura 7.10

Primeiras versões do PIII Tualatin.

Pentium III XeonA diferença entre um Pentium III Xeon e um Pentium III comum é a mesmaentre um Pentium II Xeon e um Pentium II comum. Entretanto, assim comoo Pentium III sofreu várias evoluções desde o seu lançamento,principalmente na cache L2, o mesmo ocorreu também com o Pentium IIIXeon.

Capítulo 7 – Processadores modernos 7-17

Figura 7.11

Pentium III Xeon.

Assim como as primeiras versões do Pentium III utilizavam uma cache L2discreta (não embutida no núcleo), o mesmo ocorria com as primeirasversões do Pentium III Xeon, sendo que esta cache L2, também discreta,podia ter 512 kB, 1 MB ou 2 MB, e operava com a mesma freqüência donúcleo. Confira na tabela abaixo as diferenças entre as várias versões doPentium III Xeon.

Lançamento

Clocks(MHz)

Núcleo Cache L2

Mar/99 500, 550 Katmai / 0,25 512k, 1 MB, 2 MB discretaOut/99 600 a 866 Coppermine / 0,18 256 kB, integradaMai/2000 700 Coppermine / 0,18 1 MB, 2 MB integradaMai/2000 933, 1000 Coppermine / 0,18 256 kB, integradaMar/2001 900 Coppermine / 0,18 2 MB, integrada

Todas as versões do Pentium III Xeon possuem encapsulamento SEC, comoo mostrado na figura 11. Nas suas primeiras versões, operando a 500 e 550MHz, utilizava o conector SC330, o mesmo do Pentium II Xeon.Posteriormente passou a utilizar o conector SC330.1, uma nova versão compequenas modificações, como a capacidade de operar com barramentoexterno de 133 MHz, em contraste com os 100 MHz permitidos pela versãooriginal.

O Pentium III Xeon também foi criado para uso em servidores. A maioriadas placas de CPU para o Pentium III Xeon possuem slots para a instalaçãode 2 processadores. Até 4 processadores podem operar em conjunto na

7-18 Hardware Total

mesma placa, apesar deste tipo de placa de CPU ser bastante raro. A figura12 mostra uma placa deste tipo, produzida pela SuperMicro. Além dos 6slots PCI de 64 bits e do slot AGP Pro, podemos observar na sua partedireita, os 4 slots para a instalação dos processadores.

*** 75% ***Figura 7.12

Uma placa de CPU para 4processadores Pentium IIIXeon.

Note que a capacidade de operar com múltiplos processadores não éexclusividade dos modelos Xeon. Realmente a maioria das placas paraservidores de alto desempenho possuem 2 ou 4 soquetes para essesprocessadores (SC330 ou SC330.1), mas também podemos encontrar essasplacas para Pentium III. O Pentium III pode operar em grupos de até 2processadores, e portanto pode ser usado em servidores de menor custo. Afigura 13 por exemplo mostra uma placa de CPU, também produzida pelaSuperMicro, com soquetes para a instalação de até 2 processadores PentiumIII. Possui ainda um slot AGP Pro e 6 slots PCI de 64 bits, além de outrosdispositovos encontrados nas placas de CPU convencionais.

Capítulo 7 – Processadores modernos 7-19

Figura 7.13

Uma placa de CPU com suporte para doisprocessadores Pentium III.

Apesar de ser possível produzir PCs avançados com 2 processadoresPentium III, o uso do Pentium III Xeon é vantajoso, já que oferece caches L2maiores e permite utilizar 4 processadores em conjunto.

A tabela abaixo mostra os clocks interno e externo, os multiplicadores e apotência total dissipada por cada modelo do Pentium III Xeon. Os modelosindicados com “/K” usam o núcleo Katmai e usam cache L2 discreta. Osmodelos indicados com “/C” usam o núcleo Coppermine e têm cache L2integrada. Em ambos os casos, a cache L2 opera com a mesma freqüênciado núcleo.

Modelo e cache L2 Clock internoe externo

Multiplicador Potência

500/K + 512k 500 MHz / 100 MHz 5x 40 W500/K + 1 MB 500 MHz / 100 MHz 5x 47 W500/K + 2 MB 500 MHz / 100 MHz 5x 39,6 W550/K + 512k 550 MHz / 100 MHz 5,5x 37,8 W550/K + 1 MB 550 MHz / 100 MHz 5,5x 37,8 W550/K + 2 MB 550 MHz / 100 MHz 5,5x 43,2 W600/C + 256k 600 MHz / 133 MHz 4,5x 21,6 W667/C + 256k 667 MHz / 133 MHz 5x 23,9 W733/C + 256k 733 MHz / 133 MHz 5,5x 26,2 W800/C + 256k 800 MHz / 133 MHz 6x 28,5 W

7-20 Hardware Total

866/C + 256k 866 MHz / 133 MHz 6,5x 30,8 W933/C + 256k 933 MHz / 133 MHz 7x 33,2 W1000/C + 256k 1000 MHz / 133 MHz 7,5x 34,6 W700/C + 1 MB 700 MHz / 100 MHz 7x 33,2 W700/C + 2 MB 700 MHz / 100 MHz 7x 33,2 W900/C + 2 MB 900 MHz / 100 MHz 9x 40,8 W

Pentium 4No final do ano 2000 a Intel lançou o processador Pentium 4. Esteprocessador inaugurou finalmente uma nova família de chips Intel de altodesempenho. A família anterior, formada pelos processadores Pentium Pro,Pentium II, Pentium III e Celeron, era baseada na microarquitetura P6. Cadaum deles não era na verdade um projeto novo, mas um melhoramento doprojeto anterior.

Figura 7.14

Processador Pentium 4.

Processador Pentium 4Lançamento 2000Transistores 42.000,000Tecnologia 0,18 e 0,13 Encapsulamento PGA423Barramento de dados 64 bitsBarramento de endereços 36 bitsCapacidade de memória 64 GBClock interno A partir de 1300 MHzClock externo 400 MHzConsumo 54 W na versão inicialCache L1 8 kB + 12 k micro-opsCache L2 256 kB

Capítulo 7 – Processadores modernos 7-21

Novos recursos:Arquitetura NetBurst, barramento externo de 400 MHz,cache L1 mais eficiente, novo encapsulamento,instruções SSE2. Requer gabinete a fonte (ATX12V)apropriadas.

O Pentium 4 deverá substituir o Pentium III (assim como o Pentium IIIsubstituiu o Pentium II, como o Pentium II substituiu o Pentium MMX,como o Pentium substituiu o 486, etc.). Um Pentium 4 de 1.5 GHz temvelocidade de processamento quase duas vezes maior que a de um PentiumIII/800.

O Pentium 4 foi lançado inicialmente nas versões de 1.4 e 1.5 GHz, e logosurgiram versões mais rápidas, com 1.3, 1.6, 1.7 e 1.8 GHz. Tecnicamente, oPentium 4 é um marco importante. O Pentium II e o Pentium III erambasicamente melhoramentos do Pentium Pro, lançado em 1995, todos com amicroarquitetura conhecida como P6. O Pentium 4 é um projeto novo, utilizauma nova arquitetura chamada de NetBurst. É um projeto que começou dozero, e não uma sucessão de melhoramentos feitos em uma arquitetura jáexistente. São os seguintes os principais melhoramentos desta arquitetura:

* Barramento externo de 400 MHz, contra 133 MHz do Pentium III* Cache L1 mais eficiente* Unidade lógica e aritmética com o dobro da freqüência do processador* 20 estágios pipeline, contra apenas 10 do Pentium III* 144 novas instruções para processamento de sons, imagens e gráficos 3D

Um PC baseado no Pentium 4 tem algumas características diferentes. Osgabinetes precisam ter furos adicionais para acomodar o novo processo defixação do processador. O soquete é diferente do utilizado no Pentium III.Utiliza o formato ZIF, mas possui 423 pinos. As memórias precisam ser dotipo RDRAM para permitir o funcionamento a 400 MHz. São necessárioscoolers diferentes, e os gabinetes devem ter uma boa dissipação de calor, jáque o Pentium 4 é um chip bastante quente.

Netburst x P6

Até o Pentium III, a arquitetura utilizada era a chamada “P6”, introduzida nofinal de 1995, com o Pentium Pro de 150 MHz. O Pentium Pro era menoseficiente que o Pentium MMX na execução de programas de 16 bits, por issoseu uso foi praticamente restrito a servidores baseados no Windows NT.Com a popularização do Windows 95 e aplicativos de 32 bits, amicroarquitetura P6 passou a ser mais vantajosa. Com diversas adaptações,

7-22 Hardware Total

incluindo melhoramentos na eficiência de processamento para 16 bits, foilançado o Pentium II. A partir daí, vários melhoramentos foram introduzidos:barramento de 100 MHz, instruções SSE, barramento de 133 MHz, cache L2duas vezes mais rápida, tudo isso acompanhado pelo aumento de clock,graças ao uso de tecnologias de fabricação que possibilitavam a construçãode transistores cada vez menores.

O Pentium III/1000 (o mesmo pode ser dito sobre as versões mais velozes doPentium III) é um produto resultante de uma seqüência de melhoramentosque começaram em 1995 com o Pentium Pro/150. Isto significa que amicroarquitetura P6 foi bastante prolongada, chegando a um clock quase 7vezes maior que o utilizado no seu lançamento. Apenas por comparação, amicroarquitetura P5 (Pentium e Pentium MMX) foi de 60 a 233 MHz (quase4 vezes) durante seu ciclo de vida (1992-1997). A arquitetura do 486 foisubmetida a clocks de 25 a 100 MHz (4 vezes) e a arquitetura do 386 operouinicialmente a 16 MHz, terminando em 40 MHz (2.5 vezes). Vemos portantoque a arquitetura P6 teve sua utilização bastante prolongada, o que resultaem problemas tecnológicos para a introdução de novos melhoramentos.

Finalmente a Intel passa a ter uma nova arquitetura, com espaço paracrescer, obter clocks mais elevados e desempenho proporcionalmente maior.Esta arquitetura é chamada pela Intel de Netburst, e traz váriosmelhoramentos.

Tecnologia e clocks dos primeiros modelos do Pentium 4

As primeiras versões do Pentium 4 utilizam tecnologia de 0.18 micron. Seusclocks iniciais eram 1.4 e 1.5 GHz, sendo logo seguidos pelos modelos de1.3, 1.6, 1.7 e 1.8 GHz. Em breve a Intel passará a utilizar a tecnologia de0.13 micron, reduzindo os preços e possibilitando atingir clocks maiselevados. As primeiras versões do Pentium 4 dissipam 52 e 56 watts,respectivamente. São chips extremamente quentes e requerem fontes,gabinentes e coolers especiais. Em geral os processadores mais rápidosdissipam entre 30 e 50 watts. Subir a dissipação de potência muito acima de60 watts resulta em sérios problemas de aquecimento, portanto o lançamentode versões mais rápidas pode estar condicionado à adoção do novo processode fabricação, com 0.13 micron.

As primeiras versões do Pentium 4 (1.4 e 1.5 GHz) operavam com a tensãointerna de 1.7 volts, e dissipavam cerca de 52 e 55 Watts, respectivamente. Anova versão de 1.3 volts, de menor custo, também operava com 1.7 volts edissipava cerca de 50 Watts. Devido a problemas técnicos, a Intel precisouaumentar a tensão interna para 1.75 volts nas novas versões do Pentium 4, o

Capítulo 7 – Processadores modernos 7-23

que aumentou ainda mais a potência dissipada, com maior calor. Note aindaque o clock externo de 400 MHz é na verdade obtido a partir de um clockde 100 MHz, no qual são feitas 4 transferências a cada ciclo (QDR = QuadData Rate). Portanto os multiplicadores que definem o clock interno a partirdo externo tomam como base 100 MHz, e não 400 MHz. Por exemplo, emum modelo de 1.6 GHz, o multiplicador usado é 16x, e não 4x. A tabelaabaixo resume tais características para os modelos de Pentium 4 até 1.8 GHz.

Modelo e voltagem Clock internoe externo

Multi-plicador

Potência

Pentium 4 / 1.3 / 1.75V 1300 MHz / 400 MHz 13x 51,6 WPentium 4 / 1.4 / 1.75V 1400 MHz / 400 MHz 14x 54,7 WPentium 4 / 1.5 / 1.75V 1500 MHz / 400 MHz 15x 57,8 WPentium 4 / 1.6 / 1.75V 1600 MHz / 400 MHz 16x 61,0 WPentium 4 / 1.7 / 1.75V 1700 MHz / 400 MHz 17x 64,0 WPentium 4 / 1.8 / 1.75V 1800 MHz / 400 MHz 18x 66,7 WPentium 4 / 1.3 / 1.70V 1300 MHz / 400 MHz 13x 49,8 WPentium 4 / 1.4 / 1.70V 1400 MHz / 400 MHz 14x 51,8 WPentium 4 / 1.5 / 1.70V 1500 MHz / 400 MHz 15x 54,7 W

Soquete de 423 pinos

Novas placas e novos chipsets. As placas de CPU para Pentium III, queutilizam o Socket 370, não aceitam a instalação de um Pentium 4. Não éapenas a questão do soquete, todo o funcionamento eletrônico do chip édiferente. Existem semelhanças com o Pentium III, como a arquitetura de 32bits (IA-32) e as memórias de 64 bits. Fora isto, a eletrônica é totalmentediferente, exigindo chipsets próprios.

O encapsulamento do Pentium 4 é chamado PGA423, e é mostrado emdetalhes na figura 15. O núcleo do processador é fixo em uma placachamada OLGA (Organic Land Grid Array). Esta placa é por sua vezsoldada a uma outra, na qual está a matriz de pinos (Pin Grid Array), com aqual é feito o encaixe no soquete da placa de CPU. Logo acima do núcleodo processador existe uma interface térmica, que é um material que facilita atransferência de calor para o dissipador metálico existente na face superiordo chip. Este dissipador, por sua vez, faz contato direto com o cooler doprocessador.

7-24 Hardware Total

Figura 7.15

Visão transversal do Pentium 4 comencapsulamento PGA423.

O novo encapsulamento do Pentium 4

Pouco tempo depois do lançamento do Pentium 4, a Intel criou uma novaversão com um encapsulamento um pouco diferente. Necessita de placas deCPU equipadas com o Socket 478. Pelo menos durante algum tempo serãolançadas novas versões com clocks maiores, para ambos os tipos de soquetes:Socket 423 e Socket 478.

Figura 7.16

Pentium 4 para Socket 478.

Barramento de 400 MHz

O barramento do Pentium 4, opera com 64 bits, tal qual o do Pentium III,entretanto o clock é bem mais elevado: 400 MHz, contra apenas 133 MHzdo Pentium III. Isto significa que enquanto o Pentium III acessa a memóriana velocidade de 1.06 GB/s, o Pentium 4 atinge 3.2 GB/s. Este salto nodesempenho da memória é muito importante, e bastante significativo.Durante os 5 anos de vida da arquitetura P6, o acesso às memórias foi de 60a 133 MHz. Agora com 400 MHz, novas aplicações complexas poderão serexecutadas em tempo real. Entretanto esta alta velocidade só pode ser obtidacom o uso de memórias de alto desempenho, como RDRAM e DDR. Note

Capítulo 7 – Processadores modernos 7-25

que a Intel, devido a um contrato com a Rambus (empresa parceira da Intelque criou a RDRAM), tem um prazo para produzir chipsets para o Pentium4 com suporte a memórias RDRAM, entretanto outros fabricantes dechipsets como VIA, SiS e ALI estão aptos a desenvolver chipsets para oPentium 4 com suporte a memórias DDR, que são tão velozes quanto aRDRAM, porém muito mais baratas. A própria Intel, de acordo com ascondições do contrato com a Rambus, criará novos chipsets para Pentium 4com suporte a DDR SDRAM.

Na prática o barramento do Pentium 4 não é de 400 MHz, e sim de 100MHz, entretanto em cada ciclo de clock são feitas 4 transferências, o queresulta em um desempenho idêntico ao de um barramento de 400 MHz queoperasse com uma transferência por cada ciclo.

Figura 7.17

O Pentium 4 faz 4 transferências dedados a cada ciclo de 100 MHz, o queresulta em taxa efetiva de 400 MHz.

A figura 17 mostra o método que torna a taxa de transferência 4 vezes maior(QDR, ou Quad Data Rate). Os instantes T0 e T1 marcam o início e o fimde um ciclo, cuja duração é 10 ns (1 / 100 MHz). Nos instantes T=0, T=2.5,T=5 e T=7.5 são feitas as transferências das linhas de dados, representadaspor D# (note que este sinal representa na verdade o grupo de 64 bits dobarramento de dados do Pentium 4). Quando T=10 ns (indicado como T1na figura), o cliclo se repete, com mais 4 transferênicas. Podemos assimcalcular a taxa de transferência da do Pentium 4, medida em bytes porsegundo. Como em cada ciclo são 4 transferências de grupos de 64 bits (8bytes), ficamos com:

100 MHz x 4 x 8 bytes = 3.200.000.000 bytes por segundo

Esses 3,2 bilhões de bytes por segundo são “arredondados” para 3,2 GB/s.Uma velocidade tão alta não pode ser obtida com as tradicionais memóriasSDRAM. Uma SDRAM padrão PC133 faz apenas uma transferência de 64bits (8 bytes) por ciclo, a 133 MHz, o que resulta na taxa de:

133 MHz x 8 = 1066 MB/s, aproximadamente

7-26 Hardware Total

Esta deficiência da SDRAM PC133 em atingir a taxa de 3,2 GB/s exigidapelo Pentium 4 é a mesma de usar um clock de 133 MHz onde deveria ser400 MHz. Apenas as memórias DDR do tipo DDR400 (também chamadasde PC3200) são capazes de operar com a taxa de transferência exigida peloPentium 4. Os primeiros chipsets para Pentium 4 a suportar memórias DDRusam entretanto versões menos velozes, como DDR266 e DDR333. Ao setornarem comuns as memórias DDR400, o Pentium 4 poderá ter o máximorendimento do seu barramento sem a necessidade do uso de memóriasRDRAM.

Cálculos em 2x

A unidade lógica e aritmética do Pentium 4 opera com o dobro davelocidade do seu núcleo. Isto é inédito em processadores. Operando a 1.5GHz, um Pentium 4 é capaz de realizar 3 bilhões de adições por segundo. OPentium III, que tem sua unidade de ponto flutuante operando com amesma freqüência do núcleo, não consegue acompanhar a velocidade doscálculos realizados pelo Pentium 4. A maioria das operações matemáticassimples com números inteiros poderá ser feita em apenas meio período declock.

SSE2

As instruções SSE introduzidas no Pentium III foram melhoradas, e passarama ser chamadas SSE2. São uma evolução da tecnologia MMX, agora com144 novas instruções que tornam mais rápidas operações complexas comodescompressão de vídeo MPEG-2 (DVD), reconhecimento de voz, geraçãode gráficos 3D, exibição de vídeo, compressão MP3, processamento de sinaisem geral. As operações SSE2 passam a utilizar números de ponto flutuantecom 128 bits, contra os 64 bits anteriormente usados. Isto significa maiorprecisão nos cálculos sem gasto adicional de tempo. Para aproveitar essesnovos recursos é preciso instalar no computador, o DirectX 8.0 ou superior.

Hyper Pipelined Technology

Todos os procesadores modernos executam suas instruções em modopipeline. Ao invés de serem usadas unidades de execução complexas elentas, são utilizadas várias unidades elementares, sendo cada uma delas maissimples e rápida, todas ligadas em série. É como uma linha de montagem.Imagine 20 pessoas ao mesmo tempo montando um automóvel. O grupo sópoderia montar um carro de cada vez. Mais rápido seria colocar as pessoasem uma linha, cada uma responsável por uma etapa da montagem. Este ébasicamente o princípio do pipeline. A arquitetura P6 em 10 estágios

Capítulo 7 – Processadores modernos 7-27

pipeline, o Pentium 4 possui 20, o que o torna potencialmente mais veloz naexecução de instruções. Em outras palavras, cada “GHz” do Pentium 4 temmais capacidade de processamento que cada “GHz” do Pentium III.

A nova cache L1

A cache L1 do Pentium III tem 32 kB (16k para dados e 16k para código). OPentium 4 tem 8 kB de cache para dados e 12 K micro-ops para código(trace cache). O uso de uma cache menor é conseqüência do funcionamentomais eficiente da cache de código. Ao invés de armazenar instruções, acache L1 do Pentium 4 armazena micro-operações, ou seja, instruções jádecodificadas e divididas em operações elementares. Ao acessar dados naárea de código da cache L1, o Pentium 4 não perderá portanto temporepetindo essas etapas. Com mais eficiência, a cache L1 pode ter seutamanho diminuído sem comprometer o desempenho do processador.

Cache L2

A cache L2 do Pentium 4 é similar à do Pentium III, com 256 kB, 256 bits eoperando na mesma freqüência do núcleo. Nada impede entretanto quesejam futuramente lançadas versões com caches maiores, sobretudo nosmodelos Xeon.

Execução especulativa 33% mais eficiente que do Pentium III

Todos os processadores modernos fazem execução especulativa. Aoreceberem uma seqüência de instruções da memória, passam a executarvárias delas simultaneamente. Ocorre que algumas instruções dependem doresultado de outras, que podem ainda não ter sido concluídas. Este problemanão ocorria com os processadores antigos, que executavam uma instrução decada vez. Para permitir o paralelismo, o processador precisa “especular” qualserá o resultado de operações ainda não terminadas. Várias vezes aespeculação falha, e é preciso repetir aquele trecho de programa. O Pentium4 sofreu melhoramentos que permitem “acertar” esta especulação em maisvezes que o Pentium III.

Sem número de série

O polêmico número de série introduzido no Pentium III, que possibilitava aidentificação do processador, foi muito criticado pela comunidade deinformática. Além de permitir maior segurança no comércio eletrônico, eletambém possibilitava a identificação do usuário, comprometendo oanonimato e a privacidade. A solução foi incluir no BIOS um comando paradesabilita-lo. Foi tão criticado que a Intel resolveu não usá-lo no Pentium 4.

7-28 Hardware Total

Intel XeonO Pentium II e o Pentium III foram lançados em versões Xeon, com cachesmaiores e suporte para até 4 processadores. Com o Pentium 4, foiintroduzida uma pequena diferença. As versões comuns (não Xeon) doPentium II e do Pentium III podiam ser utilizadas em placas de CPU paradois processadores. Desta forma poderiam ser construídos servidores decusto moderado utilizando dois processadores Pentium II ou Pentium III nãoXeon. De certa forma, a capacidade de operar em dupla fazia com que oPentium II e o Pentium III acabassem “roubando” uma parte do mercado desuas versões Xeon. Notável foi o caso das versões do Pentium III Xeon comcache L2 de 256 kB, usados em placas de CPU para 2 processadores. Estaconfiguração não apresentava vantagem alguma em relação ao uso de doisprocessadores Pentium III não Xeon, instalados em uma placa para 2processadores. A cache L2 do Pentium III comum também opera com amesma freqüência do núcleo, a exemplo do que ocorre com a sua versãoXeon. As únicas vantagens restantes foram as versões com cache L2 maiores(até 2 MB) e a possibilidade de operar em placas para 4 processadores.

Com o Pentium 4, a Intel resolveu dividir os mercados entre a versãocomum e a versão Xeon. O Pentium 4 só pode ser usado em configuraçõesde um só processador, o que é um retrocesso em relação ao Pentium III e aoPentium II. Sua versão Xeon, esta sim pode ser usada em cofigurações para2 processadores. Esta diferenciação evita que o Pentium 4 “roube” omercado da sua versão Xeon na área de servidores e placas de CPU de altodesempenho. Para deixar as coisas ainda mais separadas, a Intel não adotouo nome “Pentium 4 Xeon”, mas simplesmente, “Intel Xeon”. No manual doIntel Xeon, não existe uma só referência ao Pentium 4, apesar da descriçãodo Xeon ser idêntica à do Pentium 4, com exceção do funcionamento emsistemas duais e do soquete diferente, o PGA603.

Capítulo 7 – Processadores modernos 7-29

Figura 7.18

Processador Intel Xeon.

Processador Intel XeonLançamento 2001Transistores 42.000.000Tecnologia 0,18 e 0,13 Encapsulamento PGA603Barramento de dados 64 bitsBarramento de endereços 36 bitsCapacidade de memória 64 GBClock interno 1,4 GHz e superioresClock externo 400 MHz (100 MHz x 4)Consumo A partir de 56 WCache L1 20 kBCache L2 256 kBNovos recursos:Soquete PGA603 e funcionamento em dupla. Todos osmais recursos são similares aos do Pentium 4.

A tabela abaixo mostra alguns parâmetros das versões iniciais do Xeon, comclocks de 1.4, 1.5 e 1.7 GHz. As potências dissipadas são sensivelmentemaiores que as do Pentium 4. A Intel especifica para o Xeon, temperaturasmáximas cerca de 3 graus inferiores às máximas especificadas para oPentium 4. Portanto é preciso utilizar para o Xeon, coolers um poucomaiores que os indicados para processadores Pentium 4 de mesmo clock.

Modelo Clock internoe externo

Multiplicador Potência

Xeon 1.4 GHz 1400 MHz / 400 MHz 14x 56 WXeon 1.5 GHz 1500 MHz / 400 MHz 15x 59,2 W

7-30 Hardware Total

Xeon 1.7 GHz 1700 MHz / 400 MHz 17x 65,8 W

Com a adoção da tecnologia de 0,13, serão lançadas novas versões doXeon, com menor dissipação de potência, maiores clocks, maiores caches L2e com cache L3. Também poderão ser lançadas versões que suportemoperar em placas para 4 processadores.

Figura 7.19

Uma placa de CPU para dois processadores IntelXeon.

A figura 19 mostra uma placa de CPU para dois processadores Xeon,produzida pela SuperMicro. A placa possui 2 soquetes PGA603, 4 soquetespara memórias RDRAM, um slot AGP Pro, 4 slots PCI de 32 bits e 2 slotsPCI de 64 bits, além de outras interfaces tradicionais.

AMD AthlonLançado em meados de 1999, este novo processador AMD trazia umacaracterística inédita: tomou o primeiro lugar da Intel na corrida peloprocessador mais rápido para PCs. Um Athlon/550, por exemplo, erasensivelmente mais veloz que um Pentium III/550, e seu custo era menor. Apartir daí, Intel e AMD começaram uma corrida em busca do primeirolugar. A Intel lançava um modelo mais veloz, logo a seguir a AMD lançavaum modelo ainda mais veloz, depois a Intel fazia o mesmo, e assim pordiante.

Capítulo 7 – Processadores modernos 7-31

Figura 7.20

Processador AMD Athlon para Slot A.

A primeira versão do Athlon usava tecnologia de 0,25 (Modelo 1) eutilizava um encapsulamento de cartucho, similar ao do Pentium II e doPentium III. O seu soquete, chamado Slot A, era bastante parecido com oSlot 1, entretanto não são compatíveis do ponto de vista elétrico. Não épossível encaixar um Athlon em um Slot 1, assim como não é possívelencaixar um Pentium II/III em um Slot A. Ambos os conectores sãoparecidos, mas possuem chanfros em posições diferentes que impedem oencaixe do processador errado. Um técnico distraído pode conseguirencaixar um Athlon no Slot 1, se inverter a posição do processador. Se istofor feito, o processador obviamente não funcionará. O processador e a placade CPU serão danificados.

Posteriormente a AMD lançou o Athlon Modelo 2, com tecnologia de 0,18, porém ainda utilizando o formato de cartucho.

Processador Atlhon, modelos 1 e 2Lançamento 1999Transistores 22.000.000Tecnologia 0,25 e 0,18 Encapsulamento SECBarramento de dados 64 bitsBarramento de endereços 36 bitsCapacidade de memória 64 GBClock interno 500 a 1000 MHzClock externo 200 MHzConsumo 31 a 65 WCache L1 128 kBCache L2 512 kB, discreta

7-32 Hardware Total

No detalhe à direita da figura 20, que mostra processadores Athlon com ocartucho aberto, podemos observar que na placa interna existe oprocessador propriamente dito, na sua parte central, e dois chips dememória, que formam a cache L2. Dependendo do modelo, a cache L2dessas primeiras vesões do Athlon podiam operar com 1/2, 2/5 ou 1/3 dafreqüência do núcleo. Apenas um ano depois estava disponível o Athlon T-Bird, com cache L2 integrada ao núcleo, com 256 kB e “full speed”.

Barramento de 200 a 400 MHz

O Athlon foi criado para operar com um barramento externo de 200 MHz,podendo ter este clock aumentado para até 400 MHz em novas versões. Istotornará possível a compatibilidade com novas memórias mais velozes aserem lançadas em um futuro próximo. Este barramento emprega ummétodo chamado DDR (Double Data Rate), já utilizado por váriosbarramentos para obter clocks maiores. Em cada período de clock, o Athlonrealiza duas transferências de dados, portanto cada período vale por dois.Com o clock de 100 MHz e usando DDR, o resultado é equivalente ao deum clock de 200 MHz. Com 133 MHz e DDR, o resultado é 266 MHz, ecom 200 MHz e DDR, o resultado é o mesmo que 400 MHz. As primeirasversões do Athlon operavam com 100 MHz x 2. No final do ano 2000 foramlançadas versões de 133 MHz x 2. Note que um Athlon operando com 100MHz e DDR produz um resultado melhor que um Pentium III usando 133MHz, sem DDR.

Mesmo sendo o Athlon capaz de operar a 200 MHz externos, as primeirasplacas de CPU para Athlon não suportavam memórias de 200 MHz, poiselas simplesmente não existiam. Os primeiros chipsets faziam a comunicaçãocom o processador à taxa de 200 MHz (100 MHz com DDR), mascomunicavam-se com a memória a 100 ou 133 MHz (memórias PC100 ePC133). No início do ano 2001 começaram a surgir no mercado, placas deCPU com suporte a memórias DDR. Memórias DDR200 podem operar a200 MHz, e memórias DDR266 podem operar a 266 MHz. Com o usodessas novas placas de CPU e novas memórias, o Athlon pode tirar omáximo proveito do seu veloz barramento externo.

Cache L1 de 128 kB

Caches maiores e com maior clock resultam em maior desempenho. Osprocessadores Intel tradicionalmente usam caches L1 de tamanho modesto,como 16 kB e 32 kB. Processadores AMD costumam usar caches L1 maiorescomo os 64 kB do K6-2 e do K6-III. A AMD colocou no Athlon, uma cacheL1 de 128 kB, um tamanho bastante generoso. A conseqüência deste

Capítulo 7 – Processadores modernos 7-33

tamanho maior é que o processador encontrará com maior probabilidade, osdados e instruções que necessita na própria cache L1, sem a necessidade deutilizar mecanismos de acesso mais demorados para obter essas informações.

Unidade de ponto flutuante

A unidade de ponto flutuante, responsável pela execução de cálculosmatemáticos complexos, é de extrema importância na execução deprogramas científicos, programas de CAD e engenharia, e em programas quegeram gráficos tridimensionais. Antigamente, só engenheiros e cientistasprecisavam de uma unidade de ponto flutuante. Hoje, todos os jogos 3Dnecessitam deste recurso. Por isso todos os processadores modernos possuemem seu interior, uma unidade de ponto flutuante, capaz de realizar operaçõesmatemáticas complexas com extrema velocidade.

Até pouco tempo, a unidade de ponto flutuante de processadores Intel eraimbatível. Um Celeron/266, por exemplo, realizava cálculos de forma maisrápida que um AMD K6-III/450. Esta situação mudou com o processadorAthlon. Sua unidade de ponto flutuante foi totalmente reprojetada visandomáxima eficiência. Um Athlon realiza cálculos matemáticos complexos comvelocidade de 10 a 15% maior que um Pentium III de mesmo clock.

Enhanced 3D Now e MMX ampliado

As instruções 3D Now encontradas no K6-2 e K6-III foram mantidas eampliadas no Athlon, com 5 novas instruções. As instruções MMX, tambémpresentes nesses processadores, também foram ampliadas com 19 novasinstruções. Essas instruções resultam em melhor desempenho na geração deimagens tridimensionais e melhor processamento de sinais de vídeo e áudio,útil para aplicações como reconhecimento de voz, compressão edescompressão de vídeo, tratamento de imagens 2D e sinais analógicos emgeral.

Clocks e consumo de energia

O Athlon tem fama de ser um processador mais quente que o Pentium III.Isto se deve ao fato do Athlon ter um número muito maior de transistores. OAthlon é um processador de 7a geração, enquanto o Pentium III é de 6a.Comparemos inicialmente o Athlon modelo 1 de 600 MHz com o PentiumIII Katmai de 600 MHz. Esses dois processadores possuem cache L2separada do núcleo (discreta), com 512 kB. Ambos são construídos comtecnologia de 0,25.

Processador Transistores Potência

7-34 Hardware Total

Pentium III/600 9.500.000 36 WAthlon 600 22.000.000 50 W

Como vemos, o Athlon possui no seu núcleo um número de transistoresmais que duas vezes maior que o do Pentium III, devido aos seus circuitosmais complexos. Como ambos utilizam transistores com tamanhos iguais, istotornaria a potência elétrica dissipada pelo Athlon também duas vezes maior.Entretanto este aumento de potência é de apenas 40%, graças ao fato doAthlon/600 ter seu núcleo alimentado por 1,6 volts, enquanto o PentiumIII/600 Katmai operava com 2 volts. Ainda assim é consideravelmenteelevada a dissipação de 50 watts, resultando no uso de coolers de maiortamanho.

A tabela que se segue mostra a potência dissipada por cada versão doAthlon até 1 GHz (modelos 1 e 2). Note que apesar do clock externo ser de200 MHz em todos esses casos, os multiplicadores levam em conta o clockde 100 MHz. Por exemplo, um Athlon/500 usa multiplicador 5x, e não 2,5x.Na verdade o clock desses modelos do Athlon é de 100 MHz, que comDDR (Double Data Rate) resulta no mesmo efeito que teria um clock efetivode 200 MHz.

Clock e modelo Clock internoe externo

Multiplicador Potência

500 MHz modelo 1 500 MHz / 200 MHz 5x 42 W550 MHz modelo 1 550 MHz / 200 MHz 5,5x 46 W600 MHz modelo 1 600 MHz / 200 MHz 6x 50 W650 MHz modelo 1 650 MHz / 200 MHz 6,5x 54 W700 MHz modelo 1 700 MHz / 200 MHz 7x 50 W550 MHz modelo 2 550 MHz / 200 MHz 5,5x 31 W600 MHz modelo 2 600 MHz / 200 MHz 6x 34 W650 MHz modelo 2 650 MHz / 200 MHz 6,5x 36 W700 MHz modelo 2 700 MHz / 200 MHz 7x 39 W750 MHz modelo 2 750 MHz / 200 MHz 7,5x 40 W800 MHz modelo 2 800 MHz / 200 MHz 8x 48 W850 MHz modelo 2 850 MHz / 200 MHz 8,5x 50 W900 MHz modelo 2 900 MHz / 200 MHz 9x 60 W950 MHz modelo 2 950 MHz / 200 MHz 9,5x 62 W1000 MHz modelo 2 1000 MHz / 200 MHz 10x 65 W

Clock externo e acesso à memória

Capítulo 7 – Processadores modernos 7-35

Alguma confusão foi feita pelos usuários em relação ao clock externo e asmemórias utilizadas pelo Athlon. Afinal, o clock externo era de 100 ou 200MHz? E como esses clocks são compatibilizados com as memórias PC100 ePC133 (100 MHz e 133 MHz) disponíveis na época do seu lançamento? Serianecessário usar memórias de 200 MHz?

Esta questão não é específica do Athlon, mas de outros processadores echipsets. Durante muitos anos, as memórias usadas nas placas de CPUdeveriam operar com o mesmo clock externo usado pelo processador. Emum Pentium MMX, as memórias deveriam operar a 66 MHz. Em umPentium II/400, por exemplo, as memórias deveriam operar com 100 MHz,tal qual o processador. Dizemos que nesses casos a memória opera de formasíncrona, ou seja, com o mesmo clock do processador. Novos chipsets foramdesenvolvidos com o recurso de acessar a memória de forma assíncrona, ouseja, com um clock diferente do utilizado pelo processador. Um dosprimeiros chipsets com esta capacidade foi o VIA Apollo MVP3, quepermitia por exemplo, usar memórias a 66 MHz com um processadoroperando com clock externo de 100 MHz. Muitos chipsets modernos têmesta capacidade, inclusive os utilizados pelo Athlon.

Figura 7.21

Conexões entre processador, chipset ememória.

A figura 21 mostra o diagrama de blocos de uma típica placa de CPU. Nelevemos em destaque o processador, o chipset e a memória DRAM.Normalmente os chipsets são formados por dois chips independentes: oNorthbridge ou System Controller, que é encarregado de controlar amemória e o barramento AGP, e o SouthBridge, especializado em interfaces

7-36 Hardware Total

e comunicação com periféricos. Vemos na figura deste exemplo que acomunicação entre o processador e o chipset é feita a 200 MHz, enquanto acomunicação entre o chipset e a memória é feita a 100 MHz. Os diversoschipsets para Athlon passaram por várias gerações, com diferenças nasvelocidades de comunicação com o processador e com as memórias:

a) Processador a 200 MHz, memórias a 100 MHzb) Processador a 200 MHz, memórias a 100 ou 133 MHzc) Processador a 200 ou 266 MHz, memórias a 100 ou 133 MHzd) Processador a 200 ou 266 MHz, memórias DDR a 200 ou 266 MHz

O melhor desempenho do processador é obtido quando a memória DRAMé capaz de operar com velocidade igual ao seu clock externo, o que só setornou possível com as placas de CPU que dão suporte a memórias DDR,encontradas no mercado a partir de meados do ano 2001. Antes disso, asmemórias PC100 e PC133 realmente estavam abaixo do desempenhoexigido pelo Athlon.

Athlon T-BirdAssim como a Intel passou o Pentium III da versão Katmai para a versãoCoppermine, a AMD passou o processador Athlon original para a versãoThunderbird (T-Bird). Ambos os fabricantes lançaram versões comencapsulamentos de cartucho e soquete, passaram de 0,25 para 0,18 efizeram alterações no seu núcleo, principalmente a integração da cache L2.Também foram lançadas versões econômicas: o Celeron baseado no núcleoCoppermine (até então era baseado no núcleo Katmai do Pentium II) e oDuron, que é um Athlon T-bird com cache L2 de 64 kB. A tabela que sesegue mostra a transição que esses processadores sofreram no ano 2000.

Intel AMDPentium III Katmai, SEC, 0,25 Athlon, modelo 1, SEC, 0,25- Athlon, modelo 2, SEC, 0,18Pentium III Coppermine, SEC, 0,18 Athlon T-Bird, SEC, 0,18Pentium III Coppermine, FC-PGA, 0,18 Athlon T-Bird, PGA, 0,18Celeron Coppermine-128, FC-PGA, 0,18 AMD Duron, PGA, 0,18

Note que o modelo Katmai do Pentium III (cache L2 discreta) foi produzidoapenas na versão de cartucho e com tecnologia de 0,25. Já os Athlons decache discreta (modelos 1 e 2) foram ambos produzidos na versão decartucho, com tecnologias de 0,25 e 0,18. Observe ainda que o Athlonmodelo 2 não tem correspondente na Intel. Ao invés de partir diretamente

Capítulo 7 – Processadores modernos 7-37

para as novas versões com cache integrada, a AMD precisou lançar omodelo 2, já que a dissipação de calor do modelo 1 era muito elevada.

Ambos os fabricantes fizeram a integração da cache L2 ao núcleo doprocessador utilizando a tecnologia de 0,18. O Coppermine da Intelcorresponde ao T-Bird da AMD. Ambos os processadores foram produzidosnas versões PGA e de cartucho. Este é um engano que muitos cometem. Asversões Coppermine e T-Bird, apesar de serem mais comuns noencapsulamento PGA, também foram produzidas no formato de cartucho.

Até então, o Celeron era baseado no núcleo Katmai do Pentium II, e nãotinha os recursos do Pentium III (que também era Katmai), como asinstruções SIMD. Portanto o Celeron nada mais era que um Pentium II commenos cache, apesar desta cache ser full speed. Ao lançar o Pentium IIICoppermine, a Intel passou a produzir novas versões do Celeron, finalmentebaseadas no Pentium III, e não no Pentium II. É o chamado CeleronCoppermine-128. Esta nova versão do Celeron possui 128 kB de cache L2,contra 256 kB do Pentium III, e seu barramento externo operava a 66 MHz,contra 100 e 133 MHz do Pentium III.

Assim como a Intel lançou o Celeron Coppermine-128, a AMD criou o“irmão mais novo” do Athlon. É o processador AMD Duron, cuja únicadiferença em relação ao Athlon T-Bird é a cache L2 de 64 kB. Tanto oDuron quanto as novas versões do Celeron são produzidas exclusivamentecom o encapsulamento PGA, e não na versão de cartucho.

O soquete utilizado pelo Duron e pelo Athlon T-Bird PGA é chamado deSocket A.

7-38 Hardware Total

Figura 7.22

Processador Athlon para Socket A.

Processador Athlon T-BirdLançamento 2000Transistores 37.000.000Tecnologia 0,18 Encapsulamento PGA ou SECBarramento de dados 64 bitsBarramento de endereços 36 bitsCapacidade de memória 64 GBClock interno A partir de 650 MHzClock externo 200 e 266 MHzConsumo Acima de 38 WCache L1 128 kBCache L2 256 kBNovos recursos:Cache L2 integrada ao núcleo, com 256 kB.

Apesar dos novos processadores Athlon terem encapsulamento PGA, aAMD ainda produz versões de cartucho. Podemos identificar facilmente umAthlon T-Bird de cartucho. Observe na figura 21 a descrição da numeraçãoexistente no processador. Os dígitos “2” e “4” na figura caracterizam o T-Bird. O “2” indica que a cache L2 tem 256 kB, e o “4” indica que o divisorde cache é 1:1, ou seja, a cache opera na mesma freqüência do núcleo. Essesprocessadores são mais velozes que os Athlons originais, e podem serinstalados em placas de CPU com Slot A. Como essas placas foramoriginalmente projetadas para os Athlons “antigos” (não T-Bird), o seu BIOSpoderá apresentar a mensagem “Unknown Athlon Processor” (processadorAthlon desconhecido) durante o boot. Este não reconhecimento preciso do

Capítulo 7 – Processadores modernos 7-39

processador não traz maiores conseqüências ao funcionamento docomputador. O reconhecimento correto pode ser feito se realizarmos umaatualização no BIOS da placa de CPU.

Figura 7.23

Identificação de um processador Athlon T-Bird para Slot A.

O Athlon foi projetado para ser um processador compatível com asarquiteturas x86 / IA-32 e processar todos os sistemas operacionais eprogramas para PCs, como o Windows 9x/ME, Windows NT/2000, WindowsXP, Linux, etc. Todos os programas que funcinam no Pentium, PentiumII/Pentium III e demais processadores Intel, funcionam também no Athlon.Apenas algumas atualizações cabem ser feitas nos sistemas operacionais. OWindows 2000, por exemplo, requer a instalação do Service Pack 1 paracorrigir alguns problemas.

Clocks e potências do Athlon T-Bird

Periodicamente os fabricantes de processadores realizam alterações queresultam em redução da potência consumida. A alteração mais drástica é aredução do tamanho dos transistores (por exemplo, 0,25 para 0,18 eposteriormente para 0,13). Outras alterações também podem ser realizadasneste sentido, como a redução da tensão de alimentação interna doprocessador. Por isso para saber a potência elétrica exata dissipada por cadamodelo (para efeito de cálculo do cooler) é preciso sempre consultar osmanuais mais recentes. A tabela que se segue mostra os clocks e potênciaspara o Athlon T-Bird modelo 4, operando com alimentação de 1,75V.

Modelo Clock internoe externo

Multiplicador Potência

650 MHz 650 MHz / 200 MHz 6,5x 38 W

7-40 Hardware Total

700 MHz 700 MHz / 200 MHz 7x 40 W750 MHz 750 MHz / 200 MHz 7,5x 43 W800 MHz 800 MHz / 200 MHz 8x 45 W850 MHz 850 MHz / 200 MHz 8,5x 47 W900 MHz 900 MHz / 200 MHz 9x 50 W950 MHz 950 MHz / 200 MHz 9,5x 52 W1000 MHz 1000 MHz / 200 MHz 10x 54 W1000 MHz 1000 MHz / 266 MHz 7,5x 54 W1100 MHz 1100 MHz / 200 MHz 11x 60 W1133 MHz 1133 MHz / 266 MHz 8,5x 63 W1200 MHz 1200 MHz / 200 MHz 12x 66 W1200 MHz 1200 MHz / 266 MHz 9x 66 W1300 MHz 1300 MHz / 200 MHz 13x 68 W1333 MHz 1333 MHz / 266 MHz 10x 70 W1400 MHz 1400 MHz / 200 MHz 14x 72 W1400 MHz 1400 MHz / 266 MHz 10,5x 72 W

O Athlon continua a ser um processador quente, chegando até 72W depotência dissipada na sua versõa de 1.4 GHz. Para os modelos de 650, 700 e750 MHz, ele chega a ser até um pouco mais quente que o modelo 2 decartucho, porém a partir de 800 MHz, as potências dissipadas pelo T-Birdsão menores que as das versões semelhantes do modelo 2 de cartucho.Podemos esperar para um futuro próximo, reduções nas potências dissipadaspelas novas versões do Athlon, resultantes da redução da tensão do núcleo eda adoção da tecnologia de 0,13.

Note que as versões inferiores a 1 GHz são oferecidas apenas com obarramento externo de 200 MHz. A partir de 1 GHz, algumas versões sãofabricadas apenas com o barramento de 200 MHz (1.1 e 1.3 GHz), outras sãofabricadas apenas com o barramento de 266 MHz (1.13 e 1.33 GHz) e outrassão oferecidas com barramentos de 200 e de 266 MHz (1, 1.2 e 1.4 GHz). Asplacas de CPU são capazes de detectar o clock externo suportado peloprocessador e configurá-lo automaticamente. Podemos ainda fazer estaconfiguração no modo manual, forçando o processador para 200 ou 266MHz, de acordo com o modelo. Para fazer esta configuração corretamente épreciso determinar se o Athlon usado tem barramento de 200 ou 266 MHz.Esta informação está estampada na face superior do processador.

Capítulo 7 – Processadores modernos 7-41

Figura 7.24

Identificação de um processador Athlon T-Bird modelo 4.

A seqüência de letras existente na face superior do processador traz váriasinformações úteis, como mostra a figura 24. Entre elas, o último caracterindica o clock externo do barramento (B=200 MHz e C=266 MHz). Outrainformação importantíssima é a que define a temperatura máxima doprocessador (S=95oC e T=90oC). Isto é importante para determinar o coolercorreto para o processador usado. Um processador que suporta temperaturamáxima maior (no caso, 95oC) é preferível a um que suporta umatemperatura menor. São informações úteis para conferir o processador naocasião da compra, e também para configurar corretamente um computadordurante sua montagem, manutenção ou expansão.

O Athlon Palomino (ou Athlon XP)

Depois de lançar o Athlon Thunderbird (modelo 4), a AMD criou o AthlonMP (servidores e workstations) e o Athlon 4 (portáteis). Ambos utilizam onúcleo modelo 6, com otimizações diversas, tais como Professional 3D Now emenor consumo de energia. Apesar de ambos serem baseados no núcleomodelo 6, o Athlon MP tem habilitados seus recursos especiais demultiprocessamento, enquanto o Athlon 4, que não realizamultiprocessamento, tem recursos especiais de economia de energia. OAthlon 4, que será estudado mais adiante, é na verdade um Athlon paraportáteis. Nas seções seguintes apresentaremos os processadores Athlon MPe Athlon 4.

O núcleo do modelo 6 passou a ser utilizado na nova versão do Athlon paraPCs desktop, inicialmente chamado de “Athlon Palomino”. Esta nova versãopossui melhoramentos na cache L2, instruções Professional 3D Now ereduzido consumo de energia, porém não conta com os recursos demultiprocessamento do Athlon MP nem com os recursos de economia deenergia do Athlon 4. Logo o Athlon T-Bird para PCs desktop sairá de linha edará lugar ao Athlon Palomino (note que este é um nome provisório usadointernamente na AMD). Os resultados serão preços menores, maioresvelocidades e menor geração de calor.

7-42 Hardware Total

### Colocar tabela de equivalência

Athlon Thoroughbred e Athlon Barton

Essas são novas versões do Athlon para PCs desktop que deverão substituir omodelo Palomino em 2002. São baseados na tecnologia de 0,13. Existirãotambém versões correspondentes para PCs portáteis.

Athlon Clawhammer

Poderá ser lançada uma versão para PCs desktop baseada na tecnologiaAMD x86-64. Será um processador de 64 bits, apesar de compatível com aarquitetura x86. Este será um modelo de 8a geração, também com tecnologiade 0,13 e seu lançamento está previsto para 2002 ou 2003.

Athlon MPO Athlon MP é uma versão do Athlon capaz de operar em placas de CPUcom múltiplos processadores. Apenas para recordar, o Pentium II e oPentium III podiam operar em placas com 1 ou 2 processadores (SP e DP),enquanto suas versões Xeon podiam operar em modos de até 4processadores. Já o Pentium 4, assim como o Athlon, podem operar apenasno modo SP (ou seja, um único processador). Assim como o Intel Xeon éuma versão do Pentium 4 que pode operar no modo dual, o Athlon MP éuma versão do Athlon capaz de operar também em modo dual. Futurasversões do Athlon MP poderão operar em grupos de 4 e 8 processadores. OAthlon MP é portanto um processador voltado para servidores e estações detrabalho de alto desempenho, mercado que até então estava dominado pelosprocessadores Intel: Pentium II Xeon, Pentium III Xeon e (Pentium 4) Xeon.

Figura 7.25

Processador Athlon MP.

Capítulo 7 – Processadores modernos 7-43

Juntamente com o Athlon MP, a AMD lançou também o chipset AMD 760MP, capaz de operar com o sistema dual. Na figura 26 vemos uma dasprimeiras placas de CPU para Athlon MP, a Tyan Thunder K7, equipadacom este chipset. Como vemos são dois soquetes de 463 pinos, além de slotAGP Pro, 5 slots PCI de 64 bits e 4 soquetes para memórias DDR DDRpadrões DDR200 (para processadores com clock externo de 200 MHz) eDDR266 (para as versões com clock externo de 266 MHz). Essas memóriassão portanto capazes de operar com a plena velocidade exigida pelo AthlonMP, ao contrário das memórias PC100 e PC133, que ficam bem abaixo destavelocidade.

Figura 7.26

Uma placa de CPU para dois processadoresAthlon MP.

A figura 27 mostra o diagrama de blocos de uma placa de CPU baseada nochipset AMD 760 MP, para dois processadores Athlon MP. Não é muitodiferente de outras placas para múltiplos processadores. Este chipset éformado pelos chips AMD 762 (este é o que tem recursos demultiprocessamento) e o controlador de periféricos AMD 766. Note que estesegundo chip não é responsável por funções de multiprocessamento, e éinclusive utilizado na versão “não multiprocessada” do AMD 760. Portanto ochipset AMD 760 é oferecido em duas versões:

AMD 760 MP = AMD 762 (MP) + AMD 766AMD 760 = AMD 761 (não MP) + AMD 766

7-44 Hardware Total

*** 75%***Figura7.27

Diagrama deuma placa deCPU dual paraprocessadoresAthlon MP.

O chip AMD 762 faz a ligação com até dois processadores Athlon MP, a 200ou 266 MHz. A ligação é feita com as memórias DDR, que poderão sertambém de 200 ou 266 MHz. O AMD 762 também é responsável pelageração dos sinais do barramento PCI, que opera com 32 ou 64 bits, a 33MHz. Na versão “não MP”, ou seja, no AMD 761, o barramento PCI é deapenas 32 bits, como na maioria das placas de CPU monoprocessadas. Já avelocidade da comunicação com o processador e com a memória DDR é amesma da versão MP, ou seja, 200/266 MHz.

A figura 28 mostra como reconhecer um processador Athlon MP, a partir dainscrição na sua face superior. O prefixo “HX” antes da indicação do clock éo que o distingue das outras vesões do Athlon. Assim como ocorre comoutras versões, existem informações importantes, como o clock, a voltagem,o clock externo máximo, a temperatura máxima e o tamanho da cache L2.

Figura 7.28

Identificando um Athlon MP.

Processador Athlon MPLançamento 2001

Capítulo 7 – Processadores modernos 7-45

Transistores 37.500.000Tecnologia 0,18 Encapsulamento PGABarramento de dados 64 bitsBarramento de endereços 36 bitsCapacidade de memória 64 GBClock interno A partir de 1000 MHzClock externo 266 MHzConsumo A partir de 46 WCache L1 128 KBCache L2 256 KBNovos recursos:Redução de 20% no consumo de energia, operação emmodo dual, cache L2 com eficiência aumentada,Professional 3D Now, compatíveis com as instruçõesSSE do Pentium III.

Apesar de utilizar a mesma tecnologia de 0,18 e a mesma voltagem dasversões então existentes do Athlon, o Athlon MP possui otimizações nos seuscircuitos internos que resultaram em redução de cerca de 20% no consumoelétrico. Foi inicialmente liberado nas versões de 1000 e 1200 MHz, ambascom barramento externo de 266 MHz. Sua cache L2 sofreu melhoramentosna arquitetura (TLB = Translation Lookaside Buffer e Hardware Pre-fetch)que melhoraram sua eficiência, apesar de ter mantido o tamanho de 256 kB.Futuras versões do Athlon MP poderão usar caches L2 maiores.

Professional 3D Now

Outro recurso interessante introduzido no Athlon MP são as novas instruçõesespecializadas em processamento 3D e multimídia, chamadas Professional3D Now. Apenas para recordar, a tecnologia 3D Now foi introduzida noAMD K6-2, e com o lançamento do Athlon recebeu mais algumasinstruções, passando a se chamar Advanced 3D Now. Ao lançar o PentiumIII, a Intel criou suas próprias instruções 3D e de multimídia, chamadas SSE(Streamed SIMD Extensions). Muitos conhecem o SSE como MMX2. NoAthlon MP, a AMD adicionou todas as instruções SSE da Intel, e passou achamar o novo conjunto de Professional 3D Now. Portanto, temos:

Professional 3D Now = Advanced 3D Now + SSE

Isto dá ao Athlon MP a capacidade de executar programas originalmenteotimizados para a tecnologia SSE do Pentium III. Note entretanto que pelomenos nesta versão inicial, não estão incluídas as novas instruções 3D (SSE2)do Pentium 4.

7-46 Hardware Total

Smart MP

O Smart Multiprocessing é um recurso novo criado pela AMD para seusprocessadores Athlon MP. Com ele é possível uma comunicação maiseficiente entre a memória e os processadores. O funcionamento de váriosprocessadores em conjunto tem algumas complicações, como por exemplo, acoerência de caches. Quando um processador acessa um dado na memória,precisa saber se este dado está atualizado ou se consta como escrita pendentena cache do outro processador. Além disso em caso como este, é maisrápido um processador transferir o dado diretamente para outro, usandoapenas as caches, e deixando liberada a memória. Graças à tecnologia SmartMP e ao chipset AMD 760 MP, uma comunicação mais eficiente pode serobtida. Este chipset tem dois barramentos independentes, um para cadaprocessador em uma configuração dual.

Figura 7.29

O Athlon MP e o chipset AMD 760 MPformam um sistema com doisbarramentos independentes, um paracada processador, enquanto os sistemasda Intel (Intel Xeon + chipset i860 ouPentium III Xeon + chipset i830) utilizamum único barramento compartilhado entreos dois processadores, o que reduz odesempenho.

A figura 29 mostra as conexões entre o chipset e os processadores emsistemas da Intel e AMD. Nos sistemas da Intel, a comunicação entre osprocessadores é feita através de um barramento compartilhado, e todas astransações passam pela memória. Nos sistemas da AMD, cada processadortem seu próprio barramento. A comunicação entre os processadores é feitadiretamente, sem a necessidade de utilizar a memória, que poderá estar emuso por outros circuitos (AGP ou dispositivos PCI, por exemplo).

Freqüências e dissipação de energia

Apesar de também ser construído com a tecnologia de 0,18 e operar comos mesmos 1.75 volts usados pelo núcleo do Athlon T-Bird modelo 4, oAthlon MP (baseado no núcleo modelo 6), o Athlon MP tem outrasmodificações de engenharia que resultam na redução de 20% no seu

Capítulo 7 – Processadores modernos 7-47

consumo elétrico. Os dois primeiros modelos lançados foram os de 1000 e1200 MHz, e suas características são resumidas na tabela abaixo.

Modelo Clock internoe externo

Multiplicador Potência

Athlon MP / 1000 1000 MHz / 266 MHz 7,5x 46,1 WAthlon MP / 1200 1200 MHz / 266 MHz 9x 54,7 W

Athlon Thoroughbred MP e Barton MP

Essas serão novas versões do Athlon MP, com lançamento previsto para2002. Serão baseados na arquitetura de 32 bits e 7a geração do Athlon, comtecnologia de 0,13, e serão destinados a servidores e workstations “entrylevel”. Em outras palavras, são para os mais modestos modelos de PCs dealto desempenho, já que para os de altíssimo desempenho a AMD ofereceráseus novos modelos de 8a geração, com nova arquitetura de 64 bits.

Athlon ClawHammer e SledgeHammer

Esses também são nomes provisórios, e não necessariamente serão chamadosde “Athlon”. Ambos serão processadores de 8a geração, 64 bits e tecnologiade 0,13, com lançamento previsto para 2002. O ClawHammer irá operarem sistemas para até 2 processadores, e o SledgeHammer irá operar comsistemas para 4 e 8 processadores.

Athlon 4Esta é uma nova versão do Athlon destinada ao mercado de PCs portáteis.Lançada ainda com a tecnologia de 0,18, porém utilizando menordissipação de potência e menores voltagens, é também baseado no núcleodo modelo 6, o mesmo utilizado pelo Athlon MP e pelo Athlon Palomino.

7-48 Hardware Total

Figura 7.30

Processador Athlon 4.

Processador Athlon 4Lançamento 2001Transistores 37.000.000Tecnologia 0,18 Encapsulamento PGABarramento de dados 64 bitsBarramento de endereços 36 bitsCapacidade de memória 64 GBClock interno 650 a 1400 MHz (jun/2001)Clock externo 200 / 266 MHzConsumo 38 a 72 WCache L1 128 kBCache L2 256 kB

Figura 7.31

Identificação de processadores Athlon 4.

AMD DuronAssim como a Intel produziu processadores Celeron como versões de menorcusto e menor desempenho do Pentium II e Pentium III, a AMD produziu apartir do Athlon T-Bird, o AMD Duron. Tecnicamente a única diferençaentre o Athlon e o Duron é a cache L2. O Athlon tem 256 kB, enquanto oDuron tem 64 KB. Todas as demais características são similares às do

Capítulo 7 – Processadores modernos 7-49

Athlon. Inclusive o aspecto externo do Duron é bastante parecido com o doAthlon, como podemos ver na figura 32.

Figura 7.32

Processador AMD Duron.

O AMD Duron destina-se ao mercado de PCs de baixo custo. Foi criadopara substituir o K6-2, o processador que dominou este mercado entre 1998e 2000. Ao mesmo tempo em que cessou a produção de chips K6-2, no finaldo ano 2000, aumenta a oferta de processadores Duron e de placas de CPUde baixo custo, com áudio e vídeo onboard, equipadas com Socket A.

Processador AMD DuronLançamento 2000Transistores 25.000.000Tecnologia 0,18 Encapsulamento PGABarramento de dados 64 bitsBarramento de endereços 36 bitsCapacidade de memória 64 GBClock interno A partir de 600 MHzClock externo 200 MHzConsumo A partir de 27 WCache L1 128 kBCache L2 64 kBNovos recursos:O Duron tem todos os recursos do Athlon T-Bird, excetopela sua cache L2, que tem apenas 64 kB. Emcompensação tem menor custo e menor dissipação decalor.

A princípio qualquer versão do Athlon pode ter uma versão do Duroncorrespondente, mas na prática não é o que tem ocorrido. A AMD tem dadoprioriadade em produzir Athlons com clocks mais altos e Durons com clocks

7-50 Hardware Total

mais baixos. Enquanto eram oferecidos Athlons entre 800 e 1200 MHz, oDuron era oferecido em versões de 700 a 850 MHz.

Deixando de lado a cache L2, que no Duron tem apenas 64 kB, todas assuas demais características são idênticas às do Athlon, como a cache L1 de128 kB, o barramento externo de 200 MHz e a unidade de ponto flutuantede alto desempenho. É um excelente substituto de alto desempenho para oK6-2, voltado para o mercado dos PCs de baixo custo.

Note que o Duron não foi produzido em versões de cartucho. O Duronpassou a ser produzido já na versão T-Bird, com encapsulamento PGA.

Modelo Clock internoe externo

Multiplicador Potência

600 MHz 600 MHz / 200 MHz 6x 27,4 W650 MHz 650 MHz / 200 MHz 6,5x 29,4 W700 MHz 700 MHz / 200 MHz 7x 31,4 W750 MHz 750 MHz / 200 MHz 7,5x 33,4 W800 MHz 800 MHz / 200 MHz 8x 35,4 W850 MHz 850 MHz / 200 MHz 8,5x 37,4 W900 MHz 900 MHz / 200 MHz 9x 39,5 W950 MHz 950 MHz / 200 MHz 9,5x 41,5 W

A figura 33 mostra como identificar as características de processadores AMDDuron. Assim como ocorre para outros processadores da AMD, o códigotem indicações de clock interno e externo, cache L2, temperatura evoltagem.

Figura 7.33

Identificação de processadores Duron.

Duron para portáteis e Duron Morgan

O processador Duron para portáteis é uma nova versão baseada no mesmonúcleo usado pelo Athlon MP e Athlon 4 (modelo 6). É basicamente umAthlon 4 com cache L2 de 64 kB, ao invés de 256 kB. Assim como o núcleodo modelo 6 passou a ser usado nos novos Athlons para PCs desktop(Palomino), o núcleo do Duron portátil passou a ser usado nas novas versões

Capítulo 7 – Processadores modernos 7-51

do Duron para PCs desktop de baixo custo. Este é o chamado DuronMorgan.

Duron Appaloosa

Em 2002 o Duron também adotará a tecnologia de 0,13, e será lançado omodelo Appaloosa, nas versões para portáteis e para desktops.

VIA Cyrix IIIApesar deste processador ser bastante raro no Brasil, não poderíamos deixarde fazer uma citação. Afinal a Cyrix sempre foi o terceiro maior fabricantede processadores para PCs. Durante seus áureos tempos, chegou a produzirprocessadores melhores que os da AMD e Intel. Era o Cyrix 6x86 PR200,mais veloz e mais barato que o Pentium-200. Produziu ainda processadores6x86MX e M-II, ambos com tecnologia MMX. Infelizmente a Cyrix mudoude dono duas vezes ao longo dos útlimos anos. Foi comprada pela NationalSemiconductors, que praticamente a sucateou. Passou muito tempo semnovos lançamentos, até que foi finalmente comprada pela VIA Technologies.Atualmente o processador chama-se Via Cyrix III. Ele é na verdade umaespécie de Celeron, tendo alguns pontos superiores e outros inferiores. Ospontos superiores são:

Barramento de 66, 100 ou 133 MHz Clocks mais elevados, como 700 MHz Cache L1 com 128 kB Instruções 3D Now e MMX Utiliza o Soquete 370, compatível com Pentium III e Celeron Baixa dissipação de calor Baixo custo

Seu ponto fraco é a cache L2, inexistente. Isso mesmo, a Cyrix preferiuaumentar o tamanho da cache L1 e acabar com a cache L2. Isso lembra osprimeiros processadores Celeron, que também não tinham cache L2.

7-52 Hardware Total

Figura 7.34

Processador VIA Cyrix III.

VIA C3Um ponto fraco do VIA Cyrix III é a ausência de cache L2, o mesmo malsofrido pelas primeiras versões do Celeron (apelidado maldosamente deLentium, pelo menos no Brasil). Por isso a VIA optou por incluir uma cacheL2 de 64 kB no seu novo processador, o VIA C3.

*** 35% ***Figura 7.35

Processador VIA C3.

Este processador foi desenvolvido pelas antiga equipe da Centaur (criadorado processador WinChip). Neste ponto a maior parte da equipe original daCyrix já havia abandonado a VIA, e a maior parte do projeto foi realizadopelo grupo da Centaur. O nome “Cyrix” foi portanto eliminado do

Capítulo 7 – Processadores modernos 7-53

processador. É fabricado com tecnologia de 0,15 e tem baixo consumo deenergia, inferior ao de um Celeron de mesmo clock.

Cache L1 com 128 kB Cache L2 com 64 kB Barramento de 66, 100 ou 133 MHz Instruções 3D Now e MMX Lançado em versões de 700 a 800 MHz

A tabela abaixo mostra algumas características do VIA C3.

Modelo Clock internoe externo

Multiplicador Potência

700 MHz 700 MHz / 100 MHz 7x 9,9 W733 MHz 733 MHz / 133 MHz 5,5x 10,3 W750 MHz 750 MHz / 100 MHz 7,5x 10,6 W800 MHz 800 MHz / 133 MHz 6x 11,3 W800 MHz 800 MHz / 100 MHz 8x 11,3 W

Note que o VIA C3 não é destinado a competir no mercado de PCs de altodesempenho, e sim na construção de PCs compactos de baixo consumo.Pode ser usado em notebooks e em PCs que operam em funçõesespecializadas, como caixas eletrônicos, por exemplo. Inclusive sua unidadede ponto flutuante é de desempenho bastante modesto. Opera com apenasmetade do clock do núcleo. Em um C3 de 800 MHz, por exemplo, apesardas caches L1 e L2 operarem com 800 MHz, a unidade de ponto flutuanteopera com apenas 400 MHz.

/////// FIM ///////////