estratÉgias de escalonamento de workflows .workflows contendo tarefas sequenciais e tarefas com

Download ESTRATÉGIAS DE ESCALONAMENTO DE WORKFLOWS .workflows contendo tarefas sequenciais e tarefas com

If you can't read please download the document

Post on 29-Oct-2018

212 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Silvio Luiz Stanzani

    ESTRATGIAS DE ESCALONAMENTO DE WORKFLOWS COM

    TAREFAS PARALELAS E SEQUENCIAIS EM GRADES

    COMPUTACIONAIS

    So Paulo

    2014

  • Silvio Luiz Stanzani

    ESTRATGIAS DE ESCALONAMENTO DE WORKFLOWS COM

    TAREFAS PARALELAS E SEQUENCIAIS EM GRADES

    COMPUTACIONAIS

    Tese apresentada Escola Politcnica

    da Universidade de So Paulo para

    obteno do ttulo de Doutor em

    Cincias

    rea de Concentrao:

    Engenharia de Computao

    Orientador:

    Profa. Dra. Liria Matsumoto Sato

    So Paulo

    2014

  • Silvio Luiz Stanzani

    ESTRATGIAS DE ESCALONAMENTO DE WORKFLOWS COM

    TAREFAS PARALELAS E SEQUENCIAIS EM GRADES

    COMPUTACIONAIS

    Tese apresentada Escola Politcnica

    da Universidade de So Paulo para

    obteno do ttulo de Doutor em

    Cincias

    rea de Concentrao:

    Engenharia de Computao

    Orientador:

    Profa. Dra. Liria Matsumoto Sato

    So Paulo

    2014

  • RESUMO

    A demanda por alto desempenho um desafio enfrentado por diversas

    aplicaes cientficas. Nesse sentido, ambientes para processamento

    distribudo, tais como, clusters e grades computacionais, tm sido

    desenvolvidos para prover suporte ao uso de diversos recursos

    simultaneamente para uma mesma aplicao.

    Aplicaes computacionalmente intensivas so organizadas em workflows e

    executadas com suporte de middlewares para abstrair a complexidade de uso

    de tais ambientes. Em ambientes de grade computacional, a execuo de

    workflows contendo tarefas sequenciais e tarefas com paralelismo interno,

    obtendo bom desempenho, um desafio, devido heterogeneidade e

    comportamento dinmico do ambiente. Nesse sentido, o escalonamento de

    workflows em ambientes de grade computacional essencial.

    O problema de escalonamento de tarefas, em sua forma geral, NP-

    Completo, dessa forma, o estudo do escalonamento de workflows em

    ambientes de grade computacional fundamental para aprimorar a execuo

    de aplicaes computacionalmente intensivas.

    O objetivo dessa tese propor estratgias de escalonamento de workflows,

    que exploram os seguintes aspectos:

    Avaliao da possibilidade de executar cada tarefa com paralelismo

    interno usando recursos de mltiplos clusters;

    Adaptao de planos de escalonamento no momento da submisso

    de novos workflows.

    Foram desenvolvidas duas estratgias: a primeira uma estratgia para

    escalonamento esttico de workflows, que considera o ambiente dedicado a

    execuo de um workflow. A segunda foi desenvolvida para ser utilizada em

    conjunto com a primeira, para melhorar o tempo de resposta de mltiplos

    workflows que podem ser submetidos em diferentes momentos. As estratgias

    propostas foram avaliadas em um ambiente de simulao.

    Palavras-chave: multi-cluster, escalonamento de workflows;

  • ABSTRACT

    The demand for high performance is a common problem in many scientific

    applications. In this sense, distributed processing environments such as cluster,

    grid computing and multi-cluster environments have been developed to provide

    support for the use of several resources simultaneously for the same

    application.

    Computationally intensive applications are structured as workflows and

    executed with the support of middleware to abstract the complexity of using

    such environments. In grid computing environments the execution of workflows

    containing sequential and parallel tasks, with good performance is a challenge

    due to the heterogeneity and dynamic behavior of the environment. In this

    sense, the scheduling of workflows on grid computing environments is

    essential.

    The task scheduling problem in its general form is NP-Complete, in this

    sense, the study concerning workflow scheduling in grid computing

    environments is fundamental to improve the performance of computationally

    intensive applications.

    The aim of this thesis is to propose strategies for scheduling workflows that

    exploit the following aspects:

    Explore the possibility of performing single parallel tasks using

    multiple clusters;

    Adaptation plans escalation in accordance with the submission of

    new workflows.

    Two strategies were developed: the first one is a strategy for static

    scheduling of workflows, which considers a dedicated environment to the

    execution of a workflow. The second one was developed to use in conjunction

    with the first one, in order to improve the response time of multiple workflows

    that can be submitted at different times. The proposed strategies were

    evaluated in a simulation environment.

    Key-words: multi-cluster, workflow scheduling;

  • AGRADECIMENTOS

    Gostaria de agradecer em primeiro lugar a Profa. Liria pela orientao,

    ateno, e amizade.

    Ao Dr. Marco Netto, pela colaborao no artigo publicado no WAINA

    2013, pela avaliao na banca de qualificao e pelas orientaes valiosas na

    reta final do trabalho.

    rika, minha mulher, pela pacincia, dedicao, carinho, amor e por

    trazer muita paz e sabedoria nos momentos difceis.

    Ao professor Dr. Alfredo Goldman pelas contribuies na banca de

    qualificao.

    Aos Colegas de ps-graduao Charles, Kakugawa, Calebe, Augusto,

    Artur, Francisco, Nilton, Darlon, Humberto, Dnis, Fernando Luz, Daniel Lins,

    Renato, Alan Koch, e demais que no mencionei, pela amizade e colaboraes

    em pesquisa.

    Aos Coordenadores de projeto prof. Kazuo, prof. Saraiva, prof. Pedro

    Correa e prof. Ismael, pelas oportunidades a mim proporcionadas de trabalhar

    em diversos projetos de pesquisa.

    Infraestrutura da Escola Politcnica da Universidade de So Paulo

    pelo suporte realizao da pesquisa e suporte financeiro para apresentao

    de artigos.

  • LISTA DE ILUSTRAES

    Figura 1. Um Exemplo de um Ambiente de Grade Computacional. ................. 24

    Figura 2. Exemplo de um Workflow com Tarefas com Paralelismo Interno e

    Tarefas Sequenciais, Composto por Seis Nveis. ............................................. 30

    Figura 3. Exemplo de um Workflow com o Caminho Crtico em Destaque

    (Tarefas: 1, 5, 9, 13, 14). .................................................................................. 32

    Figura 4. Tempo de Execuo de Dois Planos de Escalonamento (A e B) de um

    Workflow composto por Tarefas com Paralelismo Interno. ............................... 39

    Figura 5. Exemplo de Escalonamento de Tarefas por Nvel. ............................ 59

    Figura 6. Clculo do Rank das Tarefas do Workflow. ....................................... 69

    Figura 7. Alocao e Mapeamento Realizado pela Estratgia MCA-HEFT. ..... 71

    Figura 8. Alocao e Mapeamento Realizado pela Estratgia M-HEFT. .......... 72

    Figura 9. GAPs Gerados Pelo Plano de Escalonamento. ................................ 74

    Figura 10. Modelo Entidade-Relacionamento do Simulador. ........................... 78

    Figura 11. Modelo de Componentes do Simulador. .......................................... 79

    Figura 12. Submisso de Dois Workflows em Momentos Diferentes. .............. 81

    Figura 13. Arquivo de Descrio das Dependncias e Tarefas do Workflow 1. 82

    Figura 14. Arquivo de Descrio das Dependncias e Tarefas do Workflow 2. 82

    Figura 15. Arquivo Eventos Para Configurao de Submisso de Workflows. 83

    Figura 16. Execuo das Tarefas do Workflow em um Cluster de Referncia. 84

    Figura 17. Custo Computacional e Matriz de Comunicao Entre os Recursos

    que Executam a Tarefa. .................................................................................... 86

    Figura 18. Uso das Estratgias Propostas em um Ambiente de Grade

    Computacional Implementado com Suporte do Middleware Globus. ............... 88

    Figura 19. Execuo de Workflows do Formato Fork-join Utilizando M-HEFT e

    MCA-HEFT com diferentes valores de MCA. ................................................... 92

    Figura 20. Execuo de Workflows de outros Formatos Utilizando M-HEFT e

    MCA-HEFT com diferentes valores de MCA. ................................................... 92

    Figura 21.Execuo de Workflows do Primeiro Grupo Utilizando MCA-HEFT

    com DMCA-HEFT e MCA-HEFT. ..................................................................... 96

    Figura 22. Execuo de Workflows do Segundo Grupo Utilizando MCA-HEFT

  • com DMCA-HEFT e MCA-HEFT. ..................................................................... 96

  • LISTAS DE TABELAS

    Tabela 1. Clculo do MCACCR e MCAMC das Tarefas do Workflow. .............. 70

    Tabela 2. Clculo do MCAET das Tarefas do Workflow Usando de 1 6

    Recursos. ......................................................................................................... 70

    Tabela 3. Tempo Gasto com Comunicao Durante a Execuo dos Workflows

    Utilizando a Estratgia MCA-HEFT. ................................................................. 93

  • LISTA DE ABREVIATURAS E SIGLAS

    WFMCE Workflow Management System for Multi-cluster Environment

    BRAMS Brazilian Regional Atmospheric Modeling System

    LHC Large Hadron Collider

    WLCG Worldwide LHC Computing Grid

    DAG Directed Acyclic Graph

    ScWFMS Scientific Workflow Management Systems

    WAN Wide Access Network

    VO Virtual Organization

    HEFT Heterogeneous Earliest Finish Time

    CPOP Critical Path