a eficiência de mainframes medida através de conceitos de linha de produção e da lei de amdahl...

12
A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl MSc. Antonio Cesar Sartoratto Dias - Unicamp Prof. Dr. Marcius Fabius Henriques de Carvalho - Cenpra Artigo apresentado durante o encontro anual do CMG-Brasil de 2007 28 de Setembro de 2007 Este artigo utiliza a Lei de Amdahl, que completa 40 anos, juntamente com conceitos de eficiência e produtividade das linhas de produção industrial e propõe uma metodologia que localiza o ponto de eficiência para uma carga de trabalho de um mainframe. 1. Introdução A engenharia de processos industrias, sobretudo a voltada para o setor automobilístico, busca melhorias de 1% a cada ano, seja em qualidade, custo ou tempo de processo. Por isso, na área industrial, foram desenvolvidos conceitos aprimorados para melhoria de desempenho que podem ser observados e utilizados em outros setores da economia. Este artigo tem como objetivo contribuir para o aumento da precisão dos trabalhos de planejamento de capacidade de mainframes, melhoria de desempenho de sistemas e das previsões do tempo de duração de processos da Tecnologia da Informação. A Figura 1 ilustra como o tempo de um processo pode variar em função da configuração de uma máquina. Houve variação de 6 horas a 2 minutos para processar 1 milhão de registros utilizando um mainframe, em ambiente real de produção. Fig. 1 – Tempo de processamento de 1 milhão de registros em função das configurações utilizadas Sem acesso a parâmetros mais precisos, uma das poucas maneiras de gerenciar o desempenho de processos apoiados por computadores de grande porte serão aquelas baseadas na intuição ou diretrizes históricas. Formulação da hipótese Fig. 2 – Resumo da hipótese Em uma linha de produção é realizado um conjunto seqüencial de operações implantadas no interior de uma fábrica que processam e transformam matéria prima em produtos disponibilizados para os consumidores finais. Seja qual for o ramo de atividade dessa linha de produção, ela utilizará a força do trabalho para transformar o insumo de entrada num produto de saída. Os insumos e os produtos finais são organizados em forma de estoque para aguardarem o momento de seguir seu fluxo na cadeia logística. Em um processo de Tecnologia da Informação, o conjunto seqüencial das operações está previamente escrita no interior do aplicativo. Utilizam um dado como entrada e, após o processo de transformação, realizado pela lógica de programação, geram uma informação disponibilizada para o usuário final. Essa seqüência é válida, tanto para aplicativos batch, que processam um grande lote de uma só vez quanto para uma transação acionada a cada vez que o usuário solicita. Os dados, de entrada, de saída ou auxiliares, podem estar armazenados em arquivos convencionais, em bancos de dados ou uma combinação entre eles. A Figura 3 representa tanto um processo de fabricação como um processo de Tecnologia da Informação. O modelo recebe uma entrada, faz o tratamento através de um processo de transformação e gera uma saída. Durante o tempo de duração do processo existe interação com o ambiente operacional que hospeda o processo.

Upload: joao-galdino-mello-de-souza

Post on 28-Jun-2015

463 views

Category:

Technology


1 download

TRANSCRIPT

Page 1: A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl por Antonio Cesar Sartoratto Dias

A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl

MSc. Antonio Cesar Sartoratto Dias - Unicamp

Prof. Dr. Marcius Fabius Henriques de Carvalho - Cenpra

Artigo apresentado durante o encontro anual do CMG-Brasil de 2007 28 de Setembro de 2007

Este artigo utiliza a Lei de Amdahl, que completa 40 anos, juntamente com conceitos de eficiência e produtividade das linhas de produção industrial e

propõe uma metodologia que localiza o ponto de eficiência para uma carga de trabalho de um mainframe.

1. Introdução A engenharia de processos industrias, sobretudo a voltada para o setor automobilístico, busca melhorias de 1% a cada ano, seja em qualidade, custo ou tempo de processo. Por isso, na área industrial, foram desenvolvidos conceitos aprimorados para melhoria de desempenho que podem ser observados e utilizados em outros setores da economia.

Este artigo tem como objetivo contribuir para o aumento da precisão dos trabalhos de planejamento de capacidade de mainframes, melhoria de desempenho de sistemas e das previsões do tempo de duração de processos da Tecnologia da Informação.

A Figura 1 ilustra como o tempo de um processo pode variar em função da configuração de uma máquina. Houve variação de 6 horas a 2 minutos para processar 1 milhão de registros utilizando um mainframe, em ambiente real de produção.

Fig. 1 – Tempo de processamento de 1 milhão de registros em função das configurações utilizadas

Sem acesso a parâmetros mais precisos, uma das poucas maneiras de gerenciar o desempenho de processos apoiados por computadores de grande porte serão aquelas baseadas na intuição ou diretrizes históricas.

Formulação da hipótese

Fig. 2 – Resumo da hipótese

Em uma linha de produção é realizado um conjunto seqüencial de operações implantadas no interior de uma fábrica que processam e transformam matéria prima em produtos disponibilizados para os consumidores finais. Seja qual for o ramo de atividade dessa linha de produção, ela utilizará a força do trabalho para transformar o insumo de entrada num produto de saída. Os insumos e os produtos finais são organizados em forma de estoque para aguardarem o momento de seguir seu fluxo na cadeia logística.

Em um processo de Tecnologia da Informação, o conjunto seqüencial das operações está previamente escrita no interior do aplicativo. Utilizam um dado como entrada e, após o processo de transformação, realizado pela lógica de programação, geram uma informação disponibilizada para o usuário final. Essa seqüência é válida, tanto para aplicativos batch, que processam um grande lote de uma só vez quanto para uma transação acionada a cada vez que o usuário solicita. Os dados, de entrada, de saída ou auxiliares, podem estar armazenados em arquivos convencionais, em bancos de dados ou uma combinação entre eles.

A Figura 3 representa tanto um processo de fabricação como um processo de Tecnologia da Informação. O modelo recebe uma entrada, faz o tratamento através de um processo de transformação e gera uma saída. Durante o tempo de duração do processo existe interação com o ambiente operacional que hospeda o processo.

Page 2: A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl por Antonio Cesar Sartoratto Dias

A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl

Sartoratto&Carvalho CMG-Brasil 2007 p. 2

Fig. 3 – Representação do conceito de processo

Devido à analogia entre os processos industriais e os computacionais, este trabalho propõe que as técnicas de melhoria utilizadas pelas linhas de produção industrial sejam utilizadas para auxiliar a construção de uma metodologia capaz de medir eficiência em processos de Tecnologia da Informação. 2. Revisão Bibliográfica 2.1 Produtividade X Eficiência A comparação entre produtividade versus eficiência feita por Coelli, mostra os seguintes pontos [COEL06]:

Os termos, produtividade e eficiência, vem sendo usados freqüentemente pela mídia nos últimos dez anos por uma variedade de comentaristas. São usados como sinônimos apesar de não serem precisamente as mesmas coisas. A produtividade de uma firma é a relação da saída que produz com os insumos que utiliza, conforme descrito pela Equação 1.

Equação 1 – Índice de produtividade

Produtividade = saídas/entradas Quando o processo de produção envolve uma única entrada e uma única saída, este cálculo é uma matéria trivial. Entretanto, quando há mais de uma entrada (que é freqüentemente o caso) então um método para agrega-las em um único índice das entradas deve ser usado para obter uma medida da relação de produtividade. Quando nos referimos à produtividade, nos referimos ao fator de produtividade total, que é uma medida da produtividade que envolve todos os fatores da produção. Outras medidas tradicionais da produtividade, tais como a produtividade dos trabalhadores em uma fábrica, a produtividade dos combustíveis em motores, e a produtividade da terra em cultivo,

são chamadas freqüentemente medidas parciais da produtividade. Estas medidas parciais da produtividade podem fornecer uma indicação enganadora da produtividade total quando consideradas isoladamente.

Para ilustrar a distinção entre os termos, é útil considerar um processo de produção simples em que uma única entrada (x) é usada para produzir uma única saída (y). A linha 0F' na Figura 4 representa uma fronteira da produção que pode ser usada para definir o relacionamento entre a entrada e a saída. A fronteira da produção representa a saída máxima atingível de cada nível de entrada. Dessa forma ele reflete o estado atual da tecnologia na indústria. As firmas nesta indústria operam nessa fronteira, se forem tècnicamente eficientes, ou abaixo da fronteira se forem tècnicamente ineficientes. O ponto A representa um ponto ineficiente e os pontos B e C representam pontos eficientes. Uma firma que opera no ponto A é ineficiente porque tècnicamente poderia aumentar a saída ao nível associado com o ponto B sem requerer mais entrada.

Fig. 4 – Fronteiras da produção e Eficiência técnica

A Figura 5 ilustra o conceito de conjunto factível de produção formado pelo conjunto de todas as combinações de entradas e saídas factíveis. Este conjunto consiste em todos os pontos entre a fronteira da produção, 0F', e o eixo x (inclusive nestes limites). Os pontos ao longo da fronteira da produção definem o subconjunto eficiente deste conjunto factível de produção. A vantagem preliminar da representação de um conjunto de uma tecnologia da produção está feita claramente quando nós discutirmos a produção de múltiplas entradas e múltiplas saídas e o uso da função de distância.

Page 3: A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl por Antonio Cesar Sartoratto Dias

A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl

Sartoratto&Carvalho CMG-Brasil 2007 p. 3

Fig. 5 – Produtividade X Eficiência

A Figura 6 ilustra a distinção entre a eficiência técnica e a produtividade. A produtividade de um ponto particular é medida através de um raio que nasce na origem e passa por esse ponto. A inclinação do raio y/x fornece a medida de produtividade do ponto. Se a firma que opera no ponto A se deslocasse para o ponto B, tècnicamente eficiente, a inclinação do raio seria maior, implicando uma produtividade mais elevada no ponto B. Entretanto, movendo-se para o ponto C, o raio saindo da origem forma uma tangente à fronteira da produtividade, onde define-se o ponto da máxima produtividade possível. O ponto C é o ponto ótimo. Este último movimento é um exemplo de exploração de economias de escala. A operação em qualquer outro ponto na fronteira da produção resulta em uma produtividade mais baixa. Desta discussão, nós concluímos que uma firma pode ser tècnicamente eficiente mas sua produtividade pode ser melhorada através da exploração da economia de escala. Visto que mudar a escala ou as operações de uma firma pode frequentemente ser difícil de conseguir rapidamente, a eficiência técnica e a produtividade, em alguns casos, podem ser dadas em interpretações de curto e longo prazo.

Fig. 6 – Produtividade, eficiência técnica e escala

econômica

A discussão acima não inclui um componente de tempo. Quando se considera comparações da produtividade com o tempo, uma fonte adicional de mudança da produtividade, chamada mudança técnica, é possível. Isto envolve avanços na tecnologia que pode ser representada por um deslocamento ascendente na fronteira da produção. Isto é descrito na Figura 7 pelo movimento da fronteira da produção de 0F0' no período 0 a 0F1' no período 1. No período 1, todas as firmas podem tècnicamente produzir mais saída para cada nível da entrada, relativo ao que era possível no período 0. Um exemplo da mudança técnica é a instalação de uma nova caldeira em uma fabrica movida a carvão que aumenta o potencial da produtividade além dos limites anteriores (este é um exemplo da mudança técnica incorporada com entrada de capital. A desencorporação de uma mudança técnica também é possível, como por exemplo, a introdução do plantio alternado na agricultura das últimas décadas).

Fig. 7 – Mudança técnica entre dois períodos

2.2 A Lei de Amdahl para sistemas equilibrados Eugene Amdahl foi o engenheiro chefe dos projetos IBM /360 e /370. Durante as décadas de 60 e 70, ficou conhecido por muitas regras práticas para a engenharia de dados. Dentre elas, destaca-se a Lei do Sistema Equilibrado, utilizada neste trabalho: Um sistema equilibrado consumirá 8 MIPS (milhões de instruções por segundo) para processar cada MB/s (megabyte por segundo) transferido de/para discos. [AMDA67] apud [GRAY00]

A Figura 8 e a Equação 2 representam os valores definidos pela Lei de Amdhal: em um sistema equilibrado cada 1 MB/s lido/gravado consome 8 MIPS para seu processamento.

Page 4: A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl por Antonio Cesar Sartoratto Dias

A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl

Sartoratto&Carvalho CMG-Brasil 2007 p. 4

Fig. 8 – Representação da Lei de Amdahl para

sistemas equilibrados

Equação 2 – Consumo ideal de processador em um sistema equilibrado

Consumo ideal de processador em um sistema

equilibrado (MIPS)

= 8 X

Quantidade de dados (MB/s)

lidos e gravados

Essa regra prática, formulada para computadores de aplicação comercial fabricados na década de 60, permanece válida para os equipamentos atuais, de acordo com trabalhos realizados e publicados pelo laboratório de pesquisas da Microsoft. [GRAY00]

O elo de ligação entre os computadores da década de 60 e os atuais é a arquitetura de von Neumann, que continua sendo a base da concepção do hardware utilizado em mainframes, servidores, estações de trabalho e computadores pessoais. Existem exceções, como por exemplo, os mainframes fabricados pela Unisys com sistemas operacionais MCP (Master Control Program), concebidos a partir de modelos não von Neumann ou de independência vetorial. Entretanto, este trabalho foi desenvolvido em um mainframe IBM que segue a arquitetura de von Neumann.

A Figura 9 representa a estrutura geral do computador de von Neumann [STAL06]:

Fig. 9 – Diagrama da arquitetura de von Neumann para computadores

2.3 Benchmarks utilizados pelo mercado O mercado de tecnologia da informação conta com alguns benchmarks para comparar o desempenho de diferentes modelos de computadores. Entre eles destacam-se os desenvolvidos pelo instituto TPC (Transaction Processing Performance Council).

Os benchmarks desenvolvidos pelo TPC medem o processador, o subsistema de I/O, a rede, o sistema operacional, o sistema de gerenciamento de banco de dados e o monitor de transações. Eles avaliam o desempenho de aplicações como transações de débito/crédito, fornecedor de peças por atacado e questões comerciais ocasionais como, por exemplo, tendências de vendas e análise financeira. São apresentados em 4 versões: C, H, R e W. A versão TPC-C simula um ambiente de entrada de pedidos de serviço. As versões TPC-H e TPC-R avaliam a razão preço/desempenho de sistemas de apoio à decisão. A versão TPC-W avalia sites voltados a e-business. [MENA02]

Entretanto, os resultados de benchmarks podem confundir os usuários a respeito da capacidade dos sistemas executarem cargas de trabalhos reais em produção. Antes de serem utilizados, devem ser interpretados e não devem ser utilizados como ferramentas de planejamento de capacidade. [MENA02] 2.4 Parâmetros utilizados pelo mercado Os itens mais utilizados para medir o desempenho de computadores são [ROGE05], [HENN03]:

• Tempo de resposta das transações: mede o tempo que o usuário esperou pelo retorno de uma solicitação feita ao sistema.

• Vazão (throughput): mede a quantidade de transações realizadas em um intervalo de tempo.

• Uso de processador: mede o consumo do recurso processador durante o intervalo de atividade do equipamento.

Tais critérios de medidas não permitem afirmar que um processo foi realizado com o melhor desempenho, se não houver um parâmetro específico para esse fim.

O risco de desenvolver um novo parâmetro a partir de uma regra prática, como o proposto por este trabalho, é representado pela classificação de precisão dada pela IBM, em pelo menos um de seus manuais técnicos. As regras práticas são consideradas pela fabricante como pouco precisas para gerenciar seus equipamentos.

Page 5: A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl por Antonio Cesar Sartoratto Dias

A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl

Sartoratto&Carvalho CMG-Brasil 2007 p. 5

A Figura 10 representa a classificação dos níveis de precisão dos métodos utilizados para planejamento de capacidade e gestão de desempenho [ROGE05].

Fig. 10 – Nível de precisão dos métodos de planejamento de capacidade e gestão de

desempenho

3. Benchmark X Realidade

É possível que resultados de benchmarks sejam desconsiderados devido à crença que eles não representem, com precisão, os ambientes reais de produção.

As duas próximas figuras permitem comparar o resultado de um benchmark com o resultado de um ambiente real de produção.

A Figura 11 ilustra o resultado de um benchmark apresentado no Euro CMG-2007 [SPRU07]. O equipamento utilizado foi capaz de realizar mais de 15 mil transações por segundo com tempo de resposta de 0,12 seg. Com auxílio de poucas contas, é possível observar que são realizadas aproximadamente 57 milhões de transações por hora, valor na mesma ordem de grandeza do processamento diário de algumas instituições bancárias brasileiras.

Fig. 11 – Resultado do benchmark de Spruth

Antes que haja contestações, os valores deste benchmark serão comparados a outros observados em ambiente real de produção.

A Figura 12 representa a decomposição do tempo de resposta de transações realizadas em um banco brasileiro. O tempo médio de processador utilizado pelas lógicas foi da ordem de 0,01 s, entretanto, o tempo de resposta observado pelo usuário foi de 2,69 segundos. Esse valor foi o resultado da soma de 3 itens: (1) tempo de espera para início da transação (WAIT TIME) = 1,61 seg., (2) tempo de processo (CPU TIME) = 0,01 seg., e (3) tempo para realização dos procedimentos de encerramento da transação (TASK DISPATCH AVG) = 1,07 seg.

Fig. 12 – Resultado obtido em ambiente bancário

Durante a análise, foram coletados dados de 25 milhões de transações bancárias em uma instalação que reduz o tempo de resposta através do aprimoramento da lógica dos aplicativos. De fato, os processos foram refinados e apresentaram pequena utilização de processador, entretanto, permaneceram em fila de disco a maior parte do tempo. 4. Causas de ineficiência

4.1 Desbalanceamento do storage

Popularmente, um sistema equilibrado é chamado de sistema “redondo”. Este termo pode ser utilizado para auxiliar no entendimento da distribuição da carga de trabalho em sistemas de armazenamento de dados. O desequilíbrio ocorre quando alguns discos recebem grande quantidade de trabalho enquanto outros apresentam ociosidade. Essa diferença no nível de atividade dos discos causa filas de I/O e as esperas serão administradas pelo sistema operacional, utilizando recursos que seriam mais úteis se estivessem concentrados no processamento de transações on-line e aplicativos batch.

Page 6: A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl por Antonio Cesar Sartoratto Dias

A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl

Sartoratto&Carvalho CMG-Brasil 2007 p. 6

A Figura 13 representa a diferença entre a distribuição de carga real e a carga ideal, marcada pelo círculo vermelho central.

Fig. 13 – Desbalanceamento do storage

Equilibrar um sistema significa não apenas fornecer tempos de respostas aceitáveis pelos usuários, mas também preservar os investimentos necessários ao bom tempo de resposta.

4.2 Otimização X Utilização plena Existe a crença que otimizar é utilizar 100% do recurso. Entretanto, recursos com excesso de uso geram longas filas de espera, aumentando o tempo de processo.

A Figura 14 ilustra a relação entre utilização de um recurso e a fila formada para receber atendimento. Quanto maior a utilização, maior a fila de espera.

Fig. 14 – Fila X Utilização

Quando um processo envolve componentes de velocidades diferentes, como ocorre entre

discos e processadores, existem perdas no processo se o componente de maior velocidade esperar pelo de menor velocidade.

4.3 Custo financeiro das filas Os resultados da análise do sistemas de filas podem ser utilizados em modelos de otimização. O objetivo será equilibrar os custos de oferecer um nível de serviço no sistema e a soma dos custos dos atrasos ou perdas dos usuários.

A Figura 15 ilustra uma curva de custo total em função do nível de serviço do sistema. É possível observar que, enquanto os custos operacionais de oferecer o serviço aumentam com o aumento do nível de serviço, os custos devido aos atrasos sofridos pelos usuários diminuem. [AREN07]

Fig. 15 – Relação entre custo total e o nível de

serviço oferecido

5. Metodologia 5.1 Considerações O objetivo deste trabalho é desenvolver um método para medir a eficiência de processos executados em computadores de grande porte a partir da relação entre a quantidade de dados processados e a quantidade de recursos computacionais utilizados. De forma que, a cada processo realizado seja possível certificar que a relação entre entrada, saída e esforço foi a mais eficiente diante dos recursos utilizados.

O método será útil para indicar um objetivo a ser atingido nos trabalhos de melhoria de desempenho.

Seu diferencial está em agregar um ponto de ótimo global em relação aos métodos tradicionais a partir de dados obtidos no ambiente operacional de um mainframe e sem a aquisição de novos softwares. O ponto ótimo indicado pelo método proposto deve ser capaz de medir o grau de sucesso atingido pelos

Page 7: A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl por Antonio Cesar Sartoratto Dias

A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl

Sartoratto&Carvalho CMG-Brasil 2007 p. 7

trabalhos de melhoria de desempenho ou motivar a continuidade em caso de sucesso parcial.

5.2 Dados utilizados A metodologia utilizada neste trabalho, para o cálculo de eficiência de computador de grande porte, utilizou a lei de Amdahl para sistemas equilibrados e dados encontrados em dois relatórios do RMF (Resource Measurement Facility) disponíveis em ambientes operacionais IBM: CACHE SUBSYSTEM ACTIVITY e SUMMARY REPORT.

O detalhamento da metodologia, para aferição da eficiência, está disponível no Anexo-1 por motivos de diagramação.

5.3 Processador necessário e suficiente O conceito de processador necessário e suficiente nasce da reinterpretação da Lei de Amdahl em conceitos matemáticos:

“Para que um sistema equilibrado realize o processamento de 1 MB/s é necessário e suficiente o consumo de 8 MIPS”.

Como conseqüência, a característica de sistemas não equilibrados é a distância entre os valores de processador necessário e suficiente. Quanto maior a distância, maior a ineficiência.

O valor “processador necessário” significa que o mainframe precisou daquela quantidade de processador para realizar sua carga de trabalho devido sua eficiência técnica durante o período.

O valor “processador suficiente” representa quanto de processador seria suficiente para a mesma carga de trabalho se o mainframe estivesse observando a Lei de Amdahl.

5.4 Indicadores de eficiência e produtividade Produtividade de uma unidade de produção é a relação de sua saída e sua entrada (Equação 1). A produtividade varia devido às diferenças na tecnologia da produção e às diferenças no ambiente em que a produção ocorre. [FRIE93]

Dentro da categoria de indicadores de produtividade de T.I. estão os itens:

• Response time, • Throughput, • % CPU.

A eficiência de uma unidade de produção é a comparação entre o valor observado e o valor ótimo de sua saída e entrada. [FRIE93]

O valor ótimo para processos realizados por computadores é dado pela Lei de Amdahl, que estabelece a relação entre o consumo esperado de recurso para um dado volume processado.

A Figura 16 ilustra a relação entre os indicadores de produtividade e de eficiência. Existem muitas combinações possíveis entre entradas e saídas, porém, para cada quantidade de entrada existe um único ponto de eficiência, dado pela Lei de Amdahl.

Fig. 16 – Indicadores de eficiência e produtividade

6. Descrição do ambiente de análise 6.1 A empresa O ambiente de estudo é representado por uma instituição de economia mista que opera o transporte de 2,5 milhões de passageiros por dia. O mainframe é compartilhado entre as operações administrativas e as tarefas de manutenção dos equipamentos de transporte.

6.2 O problema Após a troca da versão do sistema operacional, o mainframe entrou em processo de saturação e não conseguiu atender todos os seus usuários. A solução de contorno, criada pela gerência de tecnologia da informação, foi dar prioridade ao sistema de atendimento ao público, transferir os lançamentos do sistema de manutenção de equipamentos para a baixa plataforma e atualizar o banco de dados durante o período da madrugada. Apesar das providências tomadas, a utilização do processador atingiu a média de 91%. Esse evento permitiu o desenvolvimento de um projeto de melhoria de desempenho no mainframe da instalação, que não representa o objetivo deste artigo.

6.3 A solução Para solucionar o problema apresentado foi implantado um projeto de ganho de desempenho a partir da reorganização do storage, que afirma que pelo menos 20% dos processadores estão sendo consumidos para administrar filas em discos, e dessa forma, reduzindo a eficiência dos processos.

Page 8: A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl por Antonio Cesar Sartoratto Dias

A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl

Sartoratto&Carvalho CMG-Brasil 2007 p. 8

A metodologia tratada neste artigo foi utilizada apenas para avaliar a eficiência do resultado alcançado pelo projeto de melhoria de desempenho, sem interferir em seu desenvolvimento.

6.4 Melhorias obtidas Os resultados obtidos pelo projeto de melhoria de tempo de resposta estão relacionados pelas próximas 3 figuras e registram os índices propostos por [ROGE05] e [HENN03] para aferição de desempenho de sistemas.

A Figura 17 ilustra o tempo de transação antes e depois das melhorias.

Fig. 17 – Tempo de transação - antes e depois

A Figura 18 ilustra a diferença na quantidade de transações por dia, antes e depois das melhorias.

Fig. 18 – Transações por dia - antes e depois

A Figura 19 registra a diferença da utilização do processador, antes e depois das melhorias.

Fig. 19 – Uso do processador - antes e depois

7. Análise dos resultados Os resultados do projeto de melhoria de desempenho serão analisados sob o conceito de eficiência proposto por este artigo.

A Figura 20 compara os valores de processador necessário e suficiente para realizar o processo no mainframe antes do inicio do projeto de melhoria de desempenho.

Fig. 20 – Processador necessário e suficiente -

inicial

A Figura 21 representa a eficiência do equipamento antes do inicio do projeto de melhoria de desempenho.

Fig. 21 – Índice de eficiência - inicial

A Figura 22 compara os valores de processador necessário e suficiente após o encerramento do projeto de melhoria de desempenho.

Fig. 22 – Processador necessário e suficiente -

final

Page 9: A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl por Antonio Cesar Sartoratto Dias

A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl

Sartoratto&Carvalho CMG-Brasil 2007 p. 9

A Figura 23 representa a eficiência do equipamento ao final do projeto de melhoria de desempenho.

Fig. 23 – Índice de eficiência - final

A metodologia proposta apontou, no ambiente de estudo, que: (1) houve redução no uso de processador, (2) houve aproximação da quantidade de processador utilizado e da quantidade de processador ideal e (3) houve aumento da eficiência. Apesar de resultados significativos apresentados pelo projeto de melhoria, eles não levaram o mainframe ao ponto de eficiência máxima, incentivando a continuidade do projeto de melhoria de desempenho de sistemas.

8. Conclusões Este trabalho desenvolveu um método para medir a eficiência de processos executados em computadores de grande porte a partir da relação entre a quantidade de dados processados e a quantidade de recursos computacionais utilizados.

Desse forma equiparou um processo de T.I. a um processo industrial que mede sua eficiência através da relação entre insumos e produtos finais.

Demonstrou que, mesmo bons resultados obtidos através dos indicadores de tempo de resposta, throughput e uso de processador, podem não levar um mainframe ao seu ponto de eficiência, apesar de melhorar sua produtividade. Conforme citado por [COEL06]: medidas parciais da produtividade podem fornecer uma indicação enganadora da produtividade total quando consideradas isoladamente.

A visão global de eficiência é dada pela Lei de Amdahl, que completa 40 anos e permanece válida nos dias atuais, de acordo com [GRAY00].

9. Referências [AMDA67] E. Amdahl. Validity of the Single Processor Approach to Achieving Large Scale Computing Capabilities. FIPS Conference Proceedings, Vol. 30, pp. 483-485. Atlantic City: AFIPS Press (1967). [AREN07] M. Arenales et al. Pesquisa operacional para cursos de engenharia. Rio de Janeiro: Campus (2007). [COEL06] T. Coelli et al. An introduction to efficiency and productivity analysis. 2nd ed. New York: Springer (2006). [FRIE93] H. Fried et al (editors). The measurement of productivity efficiency: techniques and applications. Oxford: Oxford University Press (1993). [GRAY00] J. Gray and P. Shenoy. Rules of thumb in data engineering. 16th International Conference on Data Engineering, San Diego, pp 3-12 (2000). [HENN07] J. Hennessy and D. Patterson. Computer architecture: a quantitative approach. 4th ed. San Francisco: Morgan Kaufmann (2007). [MENA02] D. Menascé and V. Almeida. Capacity planning for web services: metrics, models and methods. Upper Saddle River: Prentice Hall PTR (2002). [ROGE05] P. Rogers et al. ABC of z/OS System Programming V. 11: Capacity Planning and Performance Management. Manual técnico SG24-6327-00. Poughkeepsie, NY: IBM ITSO (2005). [SPRU07] W. Spruth. The future of mainframe. Euro CMG 2007 Nürnberg 23-25 Mai 2007. [STAL06] W. Stallings. Computer organization and architecture: designing for performance. 7th ed. Upper Saddle River: Prentice Hall (2006).

Page 10: A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl por Antonio Cesar Sartoratto Dias

A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl

Sartoratto&Carvalho CMG-Brasil 2007 p. 10

Anexo: Metodologia da coleta de dados A metodologia utilizada neste trabalho, para o cálculo de eficiência de computador de grande porte

utilizou a lei de Amdahl para sistemas equilibrados e dados encontrados em dois relatórios do RMF (Resource Measurement Facility) disponíveis em ambientes operacionais IBM: CACHE SUBSYSTEM ACTIVITY e SUMMARY REPORT.

A implementação da metodologia foi composta dos seguintes passos:

Passo-1: Emissão do relatório SUMMARY REPORT para o período de 9:00 h às 16:00 h, com a opção do intervalo de amostra de 15 minutos.

Passo-2: Emissão do relatório CACHE SUBSYSTEM ACTIVITY para o período de 9:00 h às 16:00 h, com a opção do intervalo de amostra de 15 minutos.

Passo-3: Coleta dos dados referentes ao uso de processador no relatório SUMMARY REPORT para cada intervalo de 15 minutos.

A Figura 24 indica o local dos dados relativos ao uso de processador no relatório SUMMARY REPORT.

R M F S U M M A R Y R E P O R T PAGE 001 OS/390 SYSTEM ID IPO1 START 04/04/2005-09.00.00 REL. 01.03.00 RPT VERSION 1.3.0 END 04/04/2005-16.00.00 0 NUMBER OF INTERVALS 28 TOTAL LENGTH OF INTERVALS 06.55.38 -DATE TIME INT CPU DASD DASD JOB JOB TSO TSO STC STC SWAP DEMAND SERVICE TRANS MM/DD HH.MM.SS MM.SS BUSY RESP RATE MAX AVE MAX AVE MAX AVE RATE PAGING RATE RATE 04/04 09.00.00 14.59 96.4 29 325.4 22 21 14 12 87 85 0.00 1.50 177760 0.742 04/04 09.15.00 15.00 85.3 36 313.2 22 21 14 14 86 85 0.01 0.74 86917 1.920 04/04 09.30.00 14.59 89.4 48 331.8 22 21 15 14 86 85 0.01 1.36 91640 0.933 04/04 09.45.00 15.00 95.2 46 283.8 23 22 16 14 85 84 0.02 0.99 121956 2.234 04/04 10.00.00 14.59 98.3 37 303.7 25 23 15 12 84 83 0.03 0.49 208399 1.584 04/04 10.15.00 15.00 99.7 39 272.9 24 22 12 11 85 84 0.00 0.42 220982 0.582 04/04 10.30.00 15.00 98.2 36 264.8 23 22 15 13 85 84 0.01 0.91 154635 1.792 04/04 10.45.00 14.59 93.6 47 258.2 23 22 13 12 85 84 0.01 0.53 88828 1.653 04/04 11.00.00 14.59 93.5 41 258.6 22 21 12 11 87 85 0.00 0.22 98190 2.489 . . . -TOTAL/AVERAGE 91.7 43 244.4 25 21 22 12 88 85 0.01 0.93 106810 1.177

Fig. 24 – Relatório SUMMARY REPORT antes das melhorias operacionais

Passo-4: Coleta dos dados referentes à quantidade de dados processados no período . Estão

disponíveis no relatório CACHE SUBSYSTEM ACTIVITY para cada intervalo de 15 minutos. Para este trabalho, interessa os dados referentes à linha “ALL”.

A Figura 25 auxilia a localizar as informações no relatório CACHE SUBSYSTEM ACTIVITY. Os campos tem o nome de MB/s (megabyte por segundo) e representam a quantidade de dados processados que trafegaram entre cada disco e a memória do computador, na forma de operações de leituras e gravações.

Page 11: A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl por Antonio Cesar Sartoratto Dias

A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl

Sartoratto&Carvalho CMG-Brasil 2007 p. 11

C A C H E S U B S Y S T E M A C T I V I T Y z/OS V1R4 SYSTEM ID CPAC START 04/04/2005-09.00.00 RPT VERSION V1R2 RMF END 04/04/2005-09.15.00 SUBSYSTEM 2105-01 CU-ID 1004 SSID 0001 TYPE-MODEL 2105-F20 ------------------------------------------------------------------------------------------- CACHE SUBSYSTEM DEVICE OVERVIEW ------------------------------------------------------------------------------------------- . . . ------------------------------------------------------------------------------------------- RAID RANK ACTIVITY ------------------------------------------------------------------------------------------- 0ID RAID DA HDD -------- READ REQ ------- ------- WRITE REQ ------- TYPE RATE AVG MB MB/S RTIME RATE AVG MB MB/S RTIME 0*ALL 14 0 0.039 0.5 11 0 0.057 0.2 20 00000 RAID-5 01 7 0 0.044 0.3 12 0 0.052 0.1 22 0001 RAID-5 01 7 0 0.038 0.2 11 0 0.063 0.1 18

Fig. 25 – Relatório CACHE SUBSYSTEM ACTIVITY com destaque para o campo MB/s

Passo-5: Soma das quantidades de dados lidos e gravados em cada intervalo de 15 minutos, para

todos os discos ligados ao mainframe

Passo-6: Montagem da tabela que consolida os dados coletados e os calculados, obtidos antes dos trabalhos de melhoria de desempenho.

A Tabela 1 registra as regras de cálculos utilizadas pela metodologia. Os dados foram colocados parcialmente para demonstrar como os cálculos foram realizados.

• Coluna 1: data-hora, é cópia da coluna DATE-TIME do relatório SUMMARY REPORT. • Coluna 2: Quantidade instalada de MIPS (milhões de instruções por segundo), é a capacidade

de processamento do mainframe declarada pelo fabricante. • Coluna 3: % Processador necessário: representa o percentual do recurso utilizado durante o

processo, é cópia da coluna CPU-BUSY do relatório SUMMARY REPORT. • Coluna 4: MIPS necessários: representa o percentual do processador utilizado durante o

processo, medido em milhões de instruções por segundo, é o resultado de coluna-2 X coluna-3.

• Coluna 5: MB/s (megabytes por segundo): quantidade de dados que trafegou entre os discos e a memória através de operações de leituras e gravações, é obtido através da soma de todos os registros totalizadores de leituras e gravações, segundo a regra do passo-5.

• Coluna 6: MIPS suficientes: valor esperado pela lei de Amdahl para sistemas equilibrados, é obtido pela multiplicação da quantidade de dados lidos e gravados (coluna-5) por 8, conforme indicado pela Equação 2.

• Coluna 7: % Processador Suficiente: é o percentual da coluna-6 em relação à coluna-2 (capacidade do mainframe).

Page 12: A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl por Antonio Cesar Sartoratto Dias

A eficiência de mainframes medida através de conceitos de linha de produção e da Lei de Amdahl

Sartoratto&Carvalho CMG-Brasil 2007 p. 12

Tabela 1 – Relação inicial dos dados coletados e calculados - (parcial)

1 2 3 4 5 6 7

Data Hora MIPS instalados

% Processador Necessário

MIPS Necessários MB/s MIPS

Suficientes % Processador

Suficiente 04/04 09:00 61 96,4 59 2,0 16,3 26,7 04/04 09:15 61 85,3 52 2,0 15,7 25,7 04/04 09:30 61 89,4 55 2,1 16,6 27,2 04/04 09:45 61 95,2 58 1,8 14,2 23,3 04/04 10:00 61 98,3 60 1,9 15,2 24,9 04/04 10:15 61 99,7 61 1,7 13,6 22,4 04/04 10:30 61 98,2 60 1,7 13,2 21,7 04/04 10:45 61 93,6 57 1,6 12,9 21,2

Passo-7: Realização dos trabalhos de melhoria de desempenho.

Passo-8: Montagem da tabela que consolida os dados coletados e os calculados, obtidos depois dos trabalhos de melhoria de desempenho.

Passo-9: Análise de resultados.