arquitectura de computadores ii paulo marques departamento de eng. informática universidade de...

22
Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra [email protected] 2004/200 5 2. Aspectos sobre Desempenho

Upload: sophia-lemos

Post on 07-Apr-2016

218 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

Arquitectura de Computadores II

Paulo MarquesDepartamento de Eng. InformáticaUniversidade de [email protected]

2004

/200

5

2. Aspectos sobre Desempenho

Page 2: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

2

Qual dos seguintes aviões é o mais rápido?

AviãoLotação

(Passageiros)

Autonomia

(Km)

Velocidade

(Km/h)Boeing 777 375 7,408 976Boeing 747 470 6,640 976Concorde 132 6,400 2,160Douglas DC8

146 13,952 870

Throughput(Passageiros x

Km/h)

366,000458,720285,120127,020

O conceito de “performance” depende directamenteda métrica que estamos interessados em medir!

Page 3: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

3

As Medidas Fundamentais

Throughput: Número de trabalhos completados por unidade de tempo

Tempo de Execução:Tempo que cada trabalho demora a executar

...Tempo de Resposta/Latência

Page 4: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

4

Produtividade vs. Tempo de Resposta

Page 5: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

5

Performance

A máquina X é n vezes mais rápida do que a máquina Y

A máquina X é p% mais rápida do que a máquina Y

O throughtput da máquina X é k vezes superior ao da máquina Y No mesmo intervalo de tempo, X executa k vezes mais

tarefas mais do que Y

X

Y

TempoTempon

X

Yp

TempoTempo

)1( 100

YY

XX

TempoTarefas

TempoTarefas

k

Page 6: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

6

Avaliação de Performance

A única forma fidedigna A única forma fidedigna de avaliar a performance de avaliar a performance de um sistema é medindo de um sistema é medindo o tempo que o sistema o tempo que o sistema demora a executar demora a executar aplicações reaisaplicações reais

Page 7: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

7

Benchmarks

Aplicações Reais Aplicações Reais modificadas (scripted) Kernels Toy Benchmarks Benchmark sintéticos

Os resultados têm de ser reproduzíveis!

Page 8: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

8

Desktop PC Benchmarks

Business Winstone Home/Business User Netscape, Office, Corel, Wordperfect

CC Winstone Multimedia Content Creation Photoshop, Premiere, Navigator, Audio-Editing

Winbench Kernel-based CPU Performance + Video Performance + Disk

Performance

SPEC (SPEC92, SPEC95, SPEC2000) CPU-oriented Integer (CINT2000) / Floating Point (CFP2000)

Workload

Page 9: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

9

Server Benchmarks

SPECRate

SPECWeb / SPECNFS

TPC-C

TPC-H

...

Page 10: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

10

Top processors on SPEC2000 (July/04)

0

200

400

600

800

1000

1200

1400

1600

1800

Intel Pentium4 HT3.4GHz

ExtremeEdition(Mar/04)

AMD Opteron1502.4GHz (May/04)

Intel Xeon 3.2GHz(Feb/04)

Fujitsu SPARC64V1.9GHz (Jun/04)

Itanium2 1.5GHz(Dec/03)

IBM POWER4+1.9GHz (May/04)

Alpha 21264C1.2GHz (Nov/02)

PowerMac G52.0GHz (Dec/03)***

CPU

INT2

000

CPU INTEGER PERFORMANCE

Page 11: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

11

Top processors on SPEC2000 (July/04)

0

500

1000

1500

2000

2500

HP / Itanium21.5GHz (Feb/04)

FujitsuSPARC64V

1.9GHz (Jun/04)

IBM POWER4+1.7GHz (May/04)

AMD Opteron2482.2GHz (May/04)

Pentium4 HT3.4GHz

ExtremeEdition(Mar/04)

Alpha213641.2GHz (May/03)

AMD AthlonFX-512.2GHz (Sep/03)

Xeon 3.2GHz(Apr/04)

CFP

2000

CPU FLOATING POINT PERFORMANCE

Page 12: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

12

Deve-se poder modificar o código dos benchmarks?

No source code modifications

Source code modifications are allowed but almost impossible to do...

Source code modifications are allowed

Deve Reflectir a PráticaCorrente do Ambiente Alvo

Page 13: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

13

E tendo a workload correcta?

Problema de quantificar a utilização de P1 e P2

Problema da normalização relativamente a uma máquina

Máquina A

Máquina B

Programa P1(segundos)

1 10

Programa P2(segundos)

1000 100

Tempo Total(segundos)

1001 110

Page 14: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

14

O caso do MIPS

MIPS = Millions of Instructions Per Second

Dependente da arquitectura da máquina Dependente do próprio programa que é utilizado Que tipo de instruções? Podem ocorrer “inversões de performance”

Page 15: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

15

Lei de Amdahl

Um computador passa 3/4 do tempo a fazer cálculos e 1/4 do tempo a ler e a escrever do disco.

Qual o upgrade a fazer? Um CPU 2x mais rápido Um disco 1000x mais rápido

E se for um CPU 1000x mais rápido?

Page 16: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

16

Speedup & Lei Amdahl

NEW

OLD

TTSpeedup

OPTOPTNÃO

OLD

TTTSpeedup

_

Caso óptimo: 0

OPTNÃO

OLDMáximo T

TSpeedup_

Gravíssimo

Page 17: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

17

Problema com a Lei de Amdahl

Temos uma tarefa que demora T segundos a executar. A fim de melhorar o sistema, N processadores são colocados a executar a tarefa em paralelo.

Page 18: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

18

Problema com a Lei de Amdahl (2)

O speedup depende intrinsecamente da parte que não pode ser optimizada!!!

np

npT ppT

Tpnspeedup )1()1(

1),(

n: número de processadoresp: percentagem que não pode ser optimizada (paralelizada)T: tempo que demora correr o código num processador

Page 19: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

19

Bad News!!!

Speedup vs. Percentage of Non-Parallel Code

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Number of Processors

Spee

dup

0%

5%

10%

20%

Linear Speedup

Page 20: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

20

Speedup Máximo

Fracção Não Optimizável

SpeedupMáximo

0%

5% 2010% 1020% 525% 4

ppTT

TTSpeedup

OLD

OLD

OPTNÃO

OLDMáximo

10_

p: percentagem do sistema que não é optimizável

Page 21: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

21

Lei de Gustafson-Barsis

Por vezes, podemos não conseguir executar uma tarefa em particular mais rapidamente, mas podemos conseguir executar muitas delas ao mesmo tempo... “9 women cannot have a baby in 1 month, but they can

have 9 babies in 9 months”

e.g. “Problemas Grande Desafios”, “web serving”, etc.

Page 22: Arquitectura de Computadores II Paulo Marques Departamento de Eng. Informática Universidade de Coimbra pmarques@dei.uc.pt 2004/2005 2. Aspectos sobre Desempenho

22

Material para ler

Computer Architecture: A Quantitative Approach Secções 1.5 e 1.6, Excepto:

Normalized Execution Time/Geometric Means CPU Performance Equation (já data anteriormente)

Recomendado: 1.9 (Fallacies and Pitfalls) Ver a discussão sobre MIPS