computação de alto desempenho mestrado em informática u f e s 2004 lcad – laboratório de...
TRANSCRIPT
Computação de Alto Desempenho
Mestrado em Informática
U F E S2004
LCAD – Laboratório de Computação de Alto Desempenho
Computação Científica
Professores:
•Lucia Catabriga•Neyval Costa da Silva Reis•Andréa Maria Pedrosa Valli
Computação de Alto Desempenho
● Processamento Paralelo● Solução de Problemas Reais● Problemas de Interesse● Métodos Numéricos● Computação Paralela e de Alto
Desempenho● Mercado de Trabalho● Grupo de Computação de Alto
Desempenho do DI
Taxonomia dos Computadores de Alto Desempenho
●
Fonte: J. Dongarra, http://www.netlib.org/utk/people/JackDongarra/talks.html
Métodos de Solução de Problemas Reais
Experimentais
Teóricos
Numéricos
Fenômeno Natural Modelo Matemático - Equações Governantes Métodos de Aproximação
Diferenças FinitasVolumes Finitos
Elementos FinitosElementos de Contorno
Processo de Solução
Equação Diferencial Parcial
Aproximação do domínio
Solução do Sistema Linear
Não dependem do Tempo
Equação Diferencial Parcial
Aproximação do domínioEq. Diferencial Ordinária
Solução do Sistema Linear
Dependem do Tempo
Eficiência Computacional-Algoritmos
Computação Paralela (Alto Desempenho)
– Novos Métodos Numéricos
– Novos Algoritmos
– Novas Formas de Resolver
Aplicações
– Arquiteturas para o Processamento
de Alto Desempenho
CFD e a Ciência Computacional
• Solução de problemas de grande porte
em Engenharia
• Atividade multidisciplinar
• Fundamento: Dinâmica dos Fluidos
(Mecânica) Computacional
• Requer conhecimentos de ciência
computacional
Problemas de Interesse
– Predição do Tempo– Indústria do Petróleo
● Localização de Reservatórios ● Simulação de Escoamentos no Interior
de Reservatórios– Problemas Ambientais– Outros
Etapas de Solução
Pré-processamento dos dados:
• Condições de Contorno• Condições Iniciais• Definição do domínio discretizado
Processamento de solução:
• Para cada elemento da malha montar estrutura de solução• Obter solução aproximada ou solução no tempo corrente
Pós-processamento dos Resultados:
• Visualização e análise dos resultados obtidos
Geração de Malhas
Malhas geométricas em 2D
Geração de Malhas
Malhas geométricas em 3D
Solução do Sistema Linear Resultante
● Métodos Diretos
● Métodos Iterativos Estacionários
● Mét. Iterativos Não-Estacionários
● Técnicas de Precondicionamento
Métodos Diretos
● Sistema Linear: Ax=b
● Fatoração A = LU
● Solução: L U x = b
L y = b
U x = y
Métodos Iterativos Estacionários
Métodos Iterativos Estacionários
● Sistema Linear: Ax=b
● Separação de A em M+N
[M+N]x=b
● Iteração:
M xk+1=b-Nxk
M[xk+1-xk]=Axk+b=-rk
● Métodos:
Richardson: M=I
Jacobi: M=D, D=diag(A)
Gauss-Seidel: M=D+E, E triângulo inferior de A
Mét. Iterativos Não-Estacionários
● Classe de métodos. Método mais usado em CFD: Gradientes Conjugados ou GMRESGMRES
● Atualização GMRESGMRES: xk = x0 + yk
● yk calculado como a melhor correção possível no
subespaço de Krylov
Km = span[r0, Ar0, A2r0, … , Ak-1r0]
que minimiza o resíduo
||rk|| = min ||r0+Ay||
y
● Aplicação na prática em ciclos, com k fixo
Método GMRES
Método GMRES
r=b-Ax , v1=r/||r|| , tol=||r|| , k=0
Enquanto tol > etol ||b|| e k<kmax faça k=k+1
Para j=1,...,k
hjk=(Avk)T vj
vk+1= Avk - sum(hjk vj), j=1,...,k
hk+1,k= || vk+1 ||
vk+1 = vk+1 /|| vk+1 ||
e1=(1,0,...,0)T em R(k+1)
Minimizar ||tol e1 - Hk yk|| sobre R(k+1) para obter yk
tol = ||tol e1 - Hk yk||
Fim do enquanto
Operações Principais do GMRES
Operações Principais do GMRES
● Produtos escalares● Combinações de vetores (SAXPY’s)
y = y + ax● Produto matriz-vetor (matvec)● Solução de sistema linear com a
matriz P (precondicionamento)
Esquemas de Armazenamento
Operações Principais do GMRES
● Elemento-por-elemento● Aresta-por-Aresta● CSR● Outros ...
Aplicações que necessitam de Computação de Alto
Desempenho
Um F18 Hornet no momento da quebra da barreira do som
T. Tezduyar: http://mems.rice.edu/TAFSM
Supersonic flow past a fighter aircraft at M=2.0
R. Lohner: http://www.science.gmu.edu/~rlohner/
Simulação de um F117 em condições de vôo
Domínio Real
Domínio Discretizado
Solução Aproximada
Dispersão de Poluentes na Baía de Guanabara
Campo de Ventos em Regiões de Relevo Complexo
344850 349850 354850 359850 364850 369850 374850
x [ UTM ]
Velocidade3.98+3.75 to 3.983.53 to 3.753.30 to 3.533.07 to 3.302.84 to 3.072.61 to 2.842.38 to 2.612.16 to 2.381.93 to 2.161.70 to 1.931.47 to 1.70
Simulação de Reservatórios de Petróleo
Simulação de Reservatórios de Petróleo
Field data (Porosity maps)
100 mm
Problem Scale (Reservoir size)
> 1km
0.00 1.00 2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.000.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
Laboratory scale(MRI Scans of rock samples)
m
Simulação de Reservatórios de Petróleo
P ro d u c tio n w e ll
W ate r in je c tio n w e ll
R e se rv o ir b o u n d ary
S y m m e try ax is
W ate r in je c tio n w e llW ate r in je c tio n w e ll
W ate r in je c tio n w e ll
Production w e ll
Wate r injec tion w e ll
Simulação de Reservatórios de Petróleo
Simulação de Reservatórios de Petróleo(Processamento Paralelo em cluster de PC’s)
Ideal Speed-up
16000 control volumes
4000 control volumes
1000 control volumes
For the simulation with 16000 control volumes, the execution time for one processor was 9 h 37 min while for 16 processors was only 1 h 04 min.
Grupo de Computação de Alto Desempenho do PPGI
– Professores
– Alunos
– Atividades
Interação com outras instituições
– Rice University, Houston - USA (Team for
Advanced Flow Simulation and Modeling)
– Texas University, Austin - USA (Programa de
Cooperação Interuniversitária
COPPE/UFES/UT - CAPES)
– UFF (projeto em andamento ????)
Interesses para Desenvolvimentos de teses no
biênio 2004/2006– Desenvolvimentos de bibliotecas em
C++ para a simulação de problemas de meios porosos utilizando Computação de Alto Desempenho (Deal II)
– Desenvolvimento de Pré-condicionadores paralelos em computadores de Memória Distribuída
– Simulação numérica de escoamentos envolvendo óleos pesados
Interesses para Desenvolvimentos de teses no
biênio 2004/2006– Estudo e implementação de técnicas de
particionamento para problemas acoplados
– Grid – Implementações do método dos
elementos finitos utilizando esquemas especiais de armazenamento