multicore bruno cardoso ra 023241 sávio r. a. dos santos rosa ra 025144 tiago monteiro fernandes ra...

33
MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 - 2º semestre de 2005

Upload: internet

Post on 17-Apr-2015

105 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

MULTICORE

Bruno Cardoso RA 023241Sávio R. A. dos Santos Rosa RA 025144

Tiago Monteiro Fernandes RA 025313

Professor Rodolfo Jardim de AzevedoMC 722 - 2º semestre de 2005

Page 2: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

INTRODUÇÃO

Processadores Multicore são uma grande revolução na tecnologia computacional

Maior capacidade de processamento com melhor custo/benefício

Vantagens, princípios de funcionamento, comparação Intel/AMD

Page 3: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

LIMITES DO SINGLE-CORE

Aplicações demandam alto poder de processamento Solução: aumentar freqüência de operação dos

processadores Fabricação de transistores em camadas de silício cada vez

menos espessas está com dias contados Problemas da arquitetura Single-Core

Isolamento fonte/dreno no transistor Alta dissipação de energia Em média, 75% do tempo da CPU gasto com espera de

acesso à memória

Page 4: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

LIMITES DO SINGLE-CORE

Protótipos de processadores Intel Largura de 5nm = probabilidade 50% da corrente

passar sem tensão aplicada (dreno/fonte não isolados)

Transistor não é mais confiável como dispositivo de processamento de dados

Page 5: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

LIMITES DO SINGLE-CORE

Lei de Moore: duplica número de transistores numa mesma área de silício a cada 18 meses

Quanto menor o transistor, maior sua densidade no circuito

Alta densidade = alta dissipação de energia pela passagem de corrente elétrica nos transistores

Se a energia não é removida rapidamente, chip derrete

Page 6: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

LIMITES DO SINGLE-CORE

Page 7: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

A TECNOLOGIA MULTICORE

Multicore (múltiplos núcleos): colocar duas ou mais unidades de execução (cores) no interior de um único 'pacote de processador' (um único chip)

Sistema operacional trata como se cada um fosse um processador diferente, com seus próprios recursos

Maioria dos casos: cada unidade possue seu próprio cache, processa várias instruções simultaneamente

Adicionar novos núcleos: instruções das aplicações passam a ser executadas em paralelo em vez de serialmente

“Abrir nova pista em uma estrada para aliviar o trânsito” Carros não precisam dirigir mais rápido, mas não são atrasados

por gargalos

Page 8: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

A TECNOLOGIA MULTICORE

Page 9: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

A TECNOLOGIA MULTICORE

Page 10: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

VANTAGENS DO MULTICORE

Maior eficácia (troughput) do sistema e desempenho aprimorado de aplicativos em computadores executando vários aplicativos simultaneamente

Desempenho aprimorado para aplicativos multi-threaded Compatibilidade para mais usuários ou tarefas em

aplicativos com muitas transações Desempenho superior em aplicativos que utilizam

processamento de forma intensiva Economia no preço de licenciamento de softwares

proprietários, passando a ter um maior poder de processamento sem necessitar de uma nova máquina

Redução da dissipação térmica quando comparado ao Single-Core

Page 11: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

VANTAGENS DO MULTICORE

Melhora o paralelismo no nível de threads Ajuda aplicações que não conseguem se beneficiar

dos processadores superescalares atuais por não possuirem um bom paralelismo no nível de instruções

Melhor localidade de dados Melhor comunicação entre as unidades Economia de espaço e de energia Throughput não aumenta para aplicações únicas não

paralelizáveis, mas sim nos outros casos e no sistema como um todo

Page 12: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

ARQUITETURA MULTICORE

Geralmente é multiprocessamento simétrico (SMP) Dois ou mais processadores idênticos são conectados a

uma única memória principal Permite que qualquer processador trabalhe em qualquer

tarefa, não importando onde que ela esteja localizada Possibilita otimizar a carga de trabalho, movendo as

tarefas entreos processadores Agrava o problema de espera pela memória que ocorre na

situação Single-Core

Page 13: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

ARQUITETURA MULTICORE

NUMA (Non-Uniform Memory Access) Cada processador tem a sua própria parte da memória Permite acesso paralelo à memória, melhorando em muito

o throughput se os dados de um processo forem bem localizados

Custo de mover dados de um processador ao outro fica bem mais caro, ou seja, balancear a carga de trabalho é bem mais custoso

Multiprocessamento Assimétrico (ASMP) diferentes processadores especializados para tarefas

específicas Multiprocessamento com clusters de computadores

nem toda a memória está disponível para todos os processadores

Page 14: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

IMPLEMENTAÇÕES MULTICORE

Page 15: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

INTEL

Dois processadores Pentium 4 no mesmo chip Inclui instruções de 64 bits e tecnologias que visam

diminuir a dissipação de calor Cada núcleo possui as suas unidades de execução e

seu próprio Cache L2 O restante do processador é exatamente igual ao Pentium

4 Single-Core

Page 16: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

MODELO INTEL DUAL CORE

Page 17: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

FRONT SIDE BUS: O GRANDE PROBLEMA

A comunicação entre os dois núcleos é feita através do FSB externo, gerando disputa para a utilização do barramento

Esse tipo de comunicação é razoavelmente lento. A banda de memória disponível é dividida entre eles

e é também compartilhada com os dispositivos do Super I/O

Surge um grande gargalo que causa uma boa perda de desempenho

Page 18: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

FRONT SIDE BUS: O GRANDE PROBLEMA

Page 19: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

INTEL DUAL CORE: CARACTERÍSTICAS GERAIS

Modelo da placa precisa ser especial Processadores necessitarem de reguladores de tensão

mais robustos Não pode trabalhar a freqüências tão elevadas como

a dos processadores Single-Core devido ao aumento excessivo de dissipação de calor ao adicionar o segundo core

Desempenho inferior ao Single-Core em várias aplicações não otimizadas

Protocolo MESI (Modified, Exclusive, Shared and Invalid) resolve a concorrência entre as caches

Exemplo: exclusivo, compartilhado, modificado, inválido

Page 20: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

INTEL DUAL CORE: MODELOS DISPONÍVEIS

O Intel Dual-Core é vendido nos modelos Pentium D e Pentium Extreme Edition, sendo que este último possui tecnologia HyperThreading em cada processador

Sistema operacional reconhece apenas dois processadores no caso do Pentium D e quatro no caso do Pentium Extreme Edition (devido ao HyperThreading)

Page 21: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

AMD

Combinação de dois processadores “K8” na mesma pastilha de silicío

Desde o começo, o desenvolvimento da arquitetura K8 (Opteron e Athlon 64) foi feito com Multicore em mente

Com a tecnologia de HyperTransport e controlador de memória integrado, tem-se um sistema de comunicação inovador, compatível e bem mais eficiente

Page 22: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

AMD DUAL CORE:O FIM DO GARGALO

Controlador de memória integrado dispensa a comunicação com as memórias através do Chipset

Memórias são acessadas diretamente pelo processador através de um barramento exclusivo (HyperTransport), o que resulta em um melhor aproveitamento da banda

Não há mais dependência do FSB Comunicação com os outros componentes é feita

também através do HyperTransport (não compartilha os recursos com os dispositivos do Super I/O)

HyperTransport: conexão ponto-a-ponto, paralela, de alta performance, alta velocidade, alta largura de banda e de baixa latência

Page 23: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

MODELO AMD DUAL CORE

Page 24: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

AMD DUAL CORE: CARACTERÍSTICAS GERAIS

Cada núcleo possui as suas unidades de execução e Cache L2 individuais

Apenas o controlador de memória e o HyperTransport são divididos entre os dois núcleos

Dessa forma para mantem-se a compatibilidade com os atuais Chipsets e placas mãe

Os dois núcleos comunicam-se com os recursos compartilhados através do “Crossbar Switch” e do “System Request Queue”

Assim, a comunicação entre os núcleos é feita internamente e não depende do barramento externo e nem do barramento das memórias

Protocolo MOESI para concorrência entre as caches “O” = Owner. Uma CPU pode apropriar-se de um dado em seu cache

local e, se alterá-la, ela mesma dá uma cópia do dado à outra CPU, sem qualquer acesso adicional à RAM, tudo através do barramento HyperTransport

Page 25: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

AMD DUAL CORE: CARACTERÍSTICAS GERAIS

Page 26: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

AMD DUAL CORE: CARACTERÍSTICAS GERAIS

O “gargalo” da arquitetura Dual Core AMD é banda da memória: são 6.4 GB/s compartilhados pelos dois núcleos

DDR2 deve resolver este problema em partes Nova tecnologia de fabricação de silício esticado

"Dual Stress Liner" mantém o consumo do processador baixo mesmo em maiores freqüências

Duas implementações de AMD Dual Core: Athlon 64 X2 (Desktop), e Opteron (Servidor)

Page 27: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

AMD: OPTERON & ATHLON 64 X2

Opteron possui capacidade de multiprocessamento, sendo então destinado a servidores

Pode trabalhar em sistemas com até oito processadores Divide-se em três famílias: 1xx, 2xx e 8xx (1, 2, 8

soquetes & 1, 2, 3 barramentos HyperTransport) O Athlon 64 X2 trabalha com freqüências

relativamente elevadas (2.0, 2.2 e 2.4 Ghz) Mesmo sem otimização para multiprocessamento (jogos

atuais) esse processador terá bom desempenho Opção para quem procura rapidez para o seu trabalho,

mas pior do que o Athlon 64 FX-57 em aplicações sem otimização para multiprocessamento

Page 28: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

AMD: OPTERON & ATHLON 64 X2

Page 29: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

AMD: OPTERON & ATHLON 64 X2

Page 30: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

EXEMPLO DE DESEMPENHO: EFICIÊNCIA EM RENDERIZAÇÃO 3D

Page 31: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

EXEMPLO DE DESEMPENHO: JOGOS

Page 32: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

DISSIPAÇÃO TÉRMICA

Page 33: MULTICORE Bruno Cardoso RA 023241 Sávio R. A. dos Santos Rosa RA 025144 Tiago Monteiro Fernandes RA 025313 Professor Rodolfo Jardim de Azevedo MC 722 -

REFERÊNCIAS Multi-Core Processors – The Next Evolution In Computing.

http://multicore.amd.com/WhitePapers/Multi-Core_Processors_WhitePaper.pdf, visitado em 25/10/2005.

Lançamento da tecnologia de múltiplos núcleos. http://multicore.amd.com/pt-BR/Technology/, visitado em visitado em 25/10/2005.

Vantagens da tecnologia de múltiplos núcleos da AMD. http://multicore.amd.com/pt-BR/Products/Benefits/, visitado em 25/10/2005.

O que é a tecnologia de múltiplos núcleos?. http://multicore.amd.com/WhatIsMC/, visitado em 25/10/2005.

Multi-Core Technology Brief. http://www1.us.dell.com/content/topics/topic.aspx/global/products/precn/topics/en/multi_core_precn?c=us&l=en&s=gen, visitado em 25/10/2005.

Intel Multi-Core Platforms. http://www.intel.com/technology/computing/multi-core/, visitado em 25/10/2005.

Multicore. From Wikipedia, the free encyclopedia. http://en.wikipedia.org/wiki/Multicore, visitado em 25/10/2005.

Symmetric multiprocessing. From Wikipedia, the free encyclopedia. http://en.wikipedia.org/wiki/Symmetric_multiprocessing, visitado em 25/10/2005.

Non-Uniform Memory Access. From Wikipedia, the free encyclopedia. http://en.wikipedia.org/wiki/Non-Uniform_Memory_Access, visitado em 25/10/2005

Lei de Moore: até quando? – V A razão do limite. http://www.forumpcs.com.br/coluna.php?b=107220, visitado em 27/10/2005

Características e recursos dos processadores. http://www.guiadohardware.net/tutoriais/processadores/caracteristicas_e_recursos/parte-4/index.php, visitado em 27/10/2005

First Tests of Intel's Dual-Core Processor. http://www.pcworld.com/reviews/article/0,aid,120264,00.asp, visitado em 27/10/2005

Intel's Dual-Core Chips Debut. http://www.pcworld.com/news/article/0,aid,117718,00.asp, visitado em 27/10/2005

Let the Dual-Core Revolution Begin. http://www.intel.com/personal/desktopcomputer/dual_core/index.htm, visitado em 27/10/2005

Fórum do Clube do Hardware > Processadores Dual-Core. http://forum.clubedohardware.com.br/index.php?showtopic=263159, visitado em 27/10/2005