NEC Earth Simulator
Apresentação
Hardware Software Instalações Desempenho
Hardware
Decisões de Projeto
Sistema paralelo distribuído Processamento vetorial Chip LSI Memória principal distribuída Rede single-stage crossbar
Configuração do Sistema
Característica Valor
Numero total de PN 640
Numero de AP / PN 8
Desempenho de pico / AP 8 Gflops
Desempenho de pico total 40 Tflops
Quantidade de memória/PN 16 GB
Quantidade de memória total 10 TB
Rede de Interconexão
Rede de Interconexão
Arithmetic processors (AP)
4-way super-scalar unit Vector unit
6 tipos de pipeline: adição/shifting, multiplicação, divisão, operações lógicas, masking, load/store
Processamento simultâneo de vetor de instruções
Data prefetching Branch Prediction Out-of-order instruction execution
Arithmetic processors (AP)
Arithmetic processors (AP)
Arithmetic processors (AP)
Hardware
Processor Node Cabinets (PN)
Processor Node Cabinets (PN)
Interconnection Network
Interconnection Network
Interconnection Network
Software
Sistema Operacional
Unix-based OS – “Super-UX” Alta escalabilidade Gerenciamento de memória, processos e
arquivos otimizados Comunicação de alta velocidade no
Interconnection Network Espaço de endereçamento global Sistema de super-cluster
Super-cluster
Sistema de Arquivos
Problemas: Acesso ao disco sequencialmente Gerenciamento de grande número de partes
de arquivo Solução:
Parallel File System Trata arquivos distribuídos fisicamente
como um
Parallel File System
Escalonador
Batch-job system Agrupa programas em duas filas:
S – processamentos menores L – processamentos maiores
Execução eficiente Facilidade em estimar término do trabalho
Escalonador
Instalações
Instalações
Instalações
Instalações
Instalações
Instalações
Desempenho
Desempenho
Desempenho TeóricoCaracterística Valor
Desempenho teórico de pico total 40 Tflops
Desempenho de pico / PN 64 Gflops
Desempenho de pico / AP 8 Gflops
Memória total 10 TB
Memória total / PN 16 GB
Desempenho
Benchmark LinpackComparar performance de
supercomputadoresResolução de equações lineares
18 de Abril de 2002 recorde de 35,61 Tflops
Desempenho Prático
Característica Valor
Desempenho prático 35.86 Tflops
Eficiência sustentável 87,5 %
Velocidade de transmissão entre PN
12,3 GB/s
Desempenho
Autores
Edgar Kenji Tanaka – RA 023577 Fábio Caraca Smirmaul – RA Mário San Felice – RA