prediÇÃo do desempenho de uma frente de lavra … · produtividade nas minas já existentes é...

36

Upload: vuongthu

Post on 18-Jan-2019

216 views

Category:

Documents


0 download

TRANSCRIPT

ANDRÉ GOMES ASSENÇO

Orientador: Andréa Iabrudi Tavares

PREDIÇÃO DO DESEMPENHO DE UMAFRENTE DE LAVRA ATRAVÉS DE

REGRESSÕES POR VETORES SUPORTE

Ouro Preto2 de fevereiro de 2012

Universidade Federal de Ouro Preto - UFOP

Instituto de Ciências Exatas e Biológicas - ICEB

Departamento de Computação - DECOM

PREDIÇÃO DO DESEMPENHO DE UMAFRENTE DE LAVRA ATRAVÉS DE

REGRESSÕES POR VETORES SUPORTE

Monogra�a apresentada ao curso deBacharelado em Ciência da Computação,Universidade Federal de Ouro Preto, comorequisito parcial para a obtenção de graude Bacharel em Ciência da Computação.

Aluno: André Gomes AssençoMatricula: 06.1.4141

Orientador: Andréa Iabrudi Tavares

Ouro Preto2 de fevereiro de 2012

Resumo

Este trabalho tem o objetivo de aplicar técnicas de Inteligência Arti�cial naresolução de um problema real.

Dados coletados em uma mineradora alimentaram regressões, a �m de chegar aum modelo mais próximo do processo real. Este modelo visa melhorar a predição daprodução baseada em um conjunto de valores coletados e com isto futuras decisõespoderão ser tomadas com o uso deste.

Pretende-se esclarecer quais as vantagens do uso de regressão usando Máquinasde Vetores SuporteMV S e o desempenho desta técnica quando aplicada ao problemadado.

Foi feita uma análise de ferramentas de software que implementam o métodoescolhido e a ferramenta Weka foi usada para conduzir as experiências. O objetivo éque este estudo das ferramentas sirva de base para outros trabalhos usando a mesmametodologia.

Os resultados obtidos revelam que dentre os principais métodos de aprendiza-gem de máquina testados, a técnica de regressão por máquinas de vetor suporteobtem em geral um melhor desempenho em previsão, porém com um maior custocomputacional que os outros métodos comparados.

Todos os métodos testados alcançaram um coe�ciente de correlação perto de100%, sendo que o menor erro foi obtido pelo método SVR, com 11,05%. Destaforma, os resultados poderão ser usados como base para futuras tomadas de decisãosobre o processo da mineradora em questão.

Abstract

This paper aims to apply arti�cial intelligence techniques to solve a real problem.Data collected in a mining fed regressions in order to arrive at a model closer to

the actual process. This model aims to improve the prediction of production basedon a set of values ??collected and that future decisions can be made using this.

It is intended to clarify the advantages of using Support Vector Machines forregression MV S and the performance of this technique when applied to the givenproblem.

An analysis of software tools that implement the chosen method and the toolWeka was used to conduct the experiments. The aim of this study is that the toolsprovide the basis for further work using the same methodology.

The results show that among the main machine learning methods tested, thetechnique of regression by support vector machines generally get a better perfor-mance in forecasting, but with a higher computational cost than other methodscompared.

All methods tested reached a correlation coe�cient close to 100 %, the lowesterror rate was obtained by SVR, with 11.05 %. Thus, the results can be used as abasis for future decision making about the process of mining company in question.

Dedicatória

Um brinde a vida! A maior das professoras. Capaz de fortalecer com a dor. Denos fazer crescer e enxergar novos caminhos. Responsável por me dar uma magní�caMãe, de amor incondicional; ao meu lado quando a vida me exigiu sentir demais.Responsável por tirar-me um incomparável Pai, me ensinando a não lastimar, porquenão há falta na ausência. Por lindas Irmãs, que me completam entre sonhos e pésno chão.

Agradeço à minha família, à minha companheira Luísa e aos meus verdadeirosamigos, especialmente ao Lelius por me apoiar incondicionalmente com amizade ecompanheirismo.

Agradeço aos meus professores, em especial à minha orientadora, pelos conheci-mentos que me transmitiram e pelo exemplo de excelência e competência.

SUMÁRIO SUMÁRIO

Sumário

1 Introdução 11.1 Justi�cativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2.1 Objetivo geral . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2.2 Objetivo especí�co . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Fundamentação Teórica 42.1 Regressão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42.2 Máquinas de Vetores Suporte e seu uso em regressão . . . . . . . . . 42.3 Outros Métodos de regressão . . . . . . . . . . . . . . . . . . . . . . . 52.4 Trabalhos relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . 6

3 Metodologia 83.1 Escolha da ferramenta de regressão . . . . . . . . . . . . . . . . . . . 83.2 Escolha do modelo de regressão . . . . . . . . . . . . . . . . . . . . . 9

3.2.1 Obtenção dos dados . . . . . . . . . . . . . . . . . . . . . . . 93.2.2 Ajuste das variáveis . . . . . . . . . . . . . . . . . . . . . . . . 11

3.3 Execução das Regressões usando Weka . . . . . . . . . . . . . . . . . 113.4 Seleção do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143.5 Validação do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

4 Análise exploratória 16

5 Experimentos e Resultados 215.1 Execução dos Testes e resultados . . . . . . . . . . . . . . . . . . . . 215.2 Análise dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . 25

6 Conclusão 276.1 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276.2 Bibliogra�a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

6

Lista de Figuras

1 Fluxo de transporte em uma Mina . . . . . . . . . . . . . . . . . . . 12 Representação do relacionamento entre variáveis de um processo . . . 43 Função de perda E-Insensitive - Fonte: Smola e Scholkopf (2004) . . . 54 Exemplo de Árvore Model Tree [5] . . . . . . . . . . . . . . . . . . . 65 Quadro comparativo das principais ferramentas de regressão . . . . . 86 Fluxograma geral do processo de construção do modelo de regressão . 97 Tabela completa de dados coletados . . . . . . . . . . . . . . . . . . . 108 Desordenação das variáveis do processo usando Weka . . . . . . . . . 119 Weka Package Manager . . . . . . . . . . . . . . . . . . . . . . . . . . 1210 Programa Weka com o banco de dados da mina já carregado . . . . . 1211 Resultado da Regressão . . . . . . . . . . . . . . . . . . . . . . . . . . 1312 Resultado da Regressão - Pesos das variáveis . . . . . . . . . . . . . . 1413 Resultado da Regressão - Parte 02 . . . . . . . . . . . . . . . . . . . . 1414 Tela do Experimenter . . . . . . . . . . . . . . . . . . . . . . . . . . . 1515 Grá�co - Produção versus Velocidade . . . . . . . . . . . . . . . . . . 1616 Grá�co - Produção versus DMT . . . . . . . . . . . . . . . . . . . . . 1617 Grá�co - Produção versus Fila Britador . . . . . . . . . . . . . . . . . 1718 Grá�co - Produção versus Fila Escavadeira . . . . . . . . . . . . . . . 1719 Grá�co - Produção versus Tempo de Básculo . . . . . . . . . . . . . . 1720 Grá�co - Produção versus Carga Média . . . . . . . . . . . . . . . . . 1821 Grá�co - Produção versus Tempo de Carregamento . . . . . . . . . . 1822 Grá�co - Produção versus Tempo Médio de Fila . . . . . . . . . . . . 1823 Grá�co - Produção versus Proporção KM Cheio / Km Vazio . . . . . 1924 Grá�co - Produção versus Tempo de Manobra . . . . . . . . . . . . . 1925 Grá�co - Produção versus Taxa Pluviométrica . . . . . . . . . . . . . 1926 Grá�co - Produção versus Velocidade Caminhão Cheio . . . . . . . . 2027 Grá�co - Produção versus Velocidade Caminhão Vazio . . . . . . . . 2028 Parametrização do SVR . . . . . . . . . . . . . . . . . . . . . . . . . 2229 RRSE x Variação da porcentagem de testes . . . . . . . . . . . . . . 2230 Coe�ciente de Correlação x Variação da porcentagem de testes . . . . 2231 RRSE x Variação do Hiperparâmetro C . . . . . . . . . . . . . . . . . 2332 RRSE, Correlação e Tempo de Execução x Variação do Hiper-

parâmetro C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2333 Parâmetros usados para a execução da regressão linear . . . . . . . . 2434 Parâmetros usados para a execução da regressão usando árvore M5P . 2435 Testes de regressão comparando os principais métodos . . . . . . . . . 2536 Resultados de regressões comparando os principais métodos . . . . . 2537 Teste da Qualidade de predição do modelo encontrado . . . . . . . . 26

Lista de Tabelas

1 INTRODUÇÃO

1 Introdução

Ao �nal dos anos 70, havia uma visão de que o reaproveitamento, assim comoa reciclagem de materiais, faria com que o consumo mineral decrescesse em relaçãoao PIB mundial, elevando o crescimento da economia mundial para pouco mais de2% ao ano. Atualmente, este pessimismo parece cada vez mais afastado, o que podeser constatado pelo desempenho da indústria mineral, que hoje se amplia da mesmaforma que a demanda de suprimentos advindos deste material[2].

Hoje em dia, os nove países de destaque na mineração mundial participam com43% da renda, 50% da população e 51% da superfície global. Isto mostra a im-portância deste ramo na força econômica de um país.

A demanda mundial de aço deverá crescer cerca de 5,3% somente em 2011,porém, a abertura de novas frentes de lavra vem sendo cada vez mais limitada porquestões ambientais, sociais, de mão de obra e energia. Desta forma, o aumento daprodutividade nas minas já existentes é essencial para suportar tal crescimento[3].

A Figura 1 apresenta o �uxo de transporte de uma mina a céu aberto desde aextração mineral, passando pelo transporte através de caminhões até a descarga domaterial:

Figura 1: Fluxo de transporte em uma Mina

O processo produtivo é basicamente dividido em duas partes principais: Asoperações de lavra e o processamento mineral. Grande parte do esforço empenhadopara aumentar a produção de uma mina, se restringe apenas à esta segunda parte,que geralmente chega ao desempenho máximo por se tratar de um processo limitadosomente pelo desempenho de equipamentos.

Para que o material que é lavrado chegue até a instalação de processamento, ele

1

1.1 Justi�cativa 1 INTRODUÇÃO

precisa ser transportado. Na maioria das minas a céu aberto este transporte se dápor meio de caminhões e seu desempenho é in�uenciado por vários fatores, comopor exemplo quebra dos veículos, trânsito na mina, espera na �la para carregamentoe pausa para alimentação dos motoristas. Por se tratarem de inúmeras variáveis ecom correlações desconhecidas, métodos de estimativa para gestão de produtividadecom fácil aprendizado se tornam necessários.

Processos como o de uma mineradora dependem de inúmeras variáveis mas comquantidades de dados limitados, cujo custo de obtenção muitas vezes é alto ou mesmoimpossível, o que impossibilita a obtenção de novas amostras.

Esse trabalho visa melhorar a predição sobre este processo de operação de mina,utilizando soluções mais atuais para análise dos dados gerados por ela. Será uti-lizada a Regressão por Vetores de Suporte [13], um processo relativamente novo ede reconhecida capacidade de generalização.

Dados reais coletados dia-a-dia no intervalo de um ano, relativos à movimen-tação de caminhões em uma frente de lavra de uma mina a céu aberto, serão usadosno treinamento de classi�cação e regressão utilizando o método de vetor suporte,permitindo o estudo das relações existentes entre estas variáveis e a produção es-perada. Posteriormente, estas relações e o modelo �nal poderão facilitar a tomadade decisões sobre o �uxo geral da mina, com o objetivo de otimizar o processo detransporte interno de minério.

Estes dados foram coletados através de mecanismos de localização global (GPS),e os valores médios são calculados de acordo com o número de viagens executadas.

1.1 Justi�cativa

Em Inteligência Arti�cial, especi�camente na área de Aprendizagem de Máquina,são abordadas técnicas que permitem estimar ou identi�car funções relações descon-hecidas a partir de amostras.

Várias são as técnicas de Aprendizagem Supervisionada de Máquina e sua apli-cabilidade depende das características dos problemas a serem resolvidos. Dentre osmétodos de aprendizagem de máquina, o método de vetores suporte vem sendo cadavez mais usado por possuir forte fundamentação estatística.

A regressão usando Máquinas de Vetor Suporte usa o mesmo princípio da técnicade classi�cação Support Vector Machine (SVM) porém possui pequenas difer-enças. Em SVM a saída do processo é um número inteiro, enquanto em SVR umamargem é de�nida como resultado, fazendo com que os valores mais discrepantessejam agregados, tornando o resultado mais abrangente.[17].

Uma qualidade do SVR é sua facilidade em consolidar informações contidas nosdados de entrada por possuir grande capacidade de generalização, enquanto outrosmétodos possuem maior chance de super-ajuste da curva. Parte importante destetrabalho é a de pesquisar e operacionalizar a utilização deste método, por não estardiretamente disponível em softwares para aprendizagem de máquina.

Este processo de descoberta de conhecimento usando bases de dados possui di-versas etapas, como o pré-processamento dos dados e o Data Mining, sendo estasegunda muito importante, pois é nela onde são procuradas relações entre os dados.Outro signi�cado para Data Mining seria um completo processo de descoberta deconhecimento[9].

2

1.2 Objetivos 1 INTRODUÇÃO

1.2 Objetivos

1.2.1 Objetivo geral

O objetivo geral deste trabalho é aliar os conhecimentos de Aprendizagem deMáquina adquiridos na disciplina de Inteligência Arti�cial, estimando a produtivi-dade de uma operação de frente de lavra, através do uso do método computacionalregressão usando vetores suporte.

A aplicação de regressões nos possibilitará determinar a in�uência das variáveiscoletadas e em seguida a criação da função de produtividade especí�ca para estamina, além dos coe�cientes desta relação.

Com estas informações, os impactos e desvios trazidos por cada variável na pro-dutividade da mina poderão ser quanti�cados.

1.2.2 Objetivo especí�co

O objetivo especí�co é determinar a produtividade da operação de uma miner-adora e tornar possível assim o seu gerenciamento utilizando um modelo de fácilassimilação e implantação.

Apresentar com detalhes uma ferramenta capaz de viabilizar análises deste tipo,fornecendo informações precisas sobre seu uso, suas principais funcionalidades econtribuições para o campo de estudo em questão.

Outro ponto importante é apresentar um estudo avaliando a e�cácia dos métodosde regressão sobre as variáveis de uma mina.

3

2 FUNDAMENTAÇÃO TEÓRICA

2 Fundamentação Teórica

Existem diversas técnicas de aprendizagem de máquina capazes alcançar o mesmoobjetivo. Desta forma, podem haver várias soluções com resultados diferentes para omesmo problema. Torna-se necessária uma seleção criteriosa destas técnicas. Nestecapítulo serão descritas as principais técnicas de regressão que futuramente terãoseus resultados comparados com os de máquinas de vetores suporte, que foi a prin-cipal técnica escolhida para este trabalho.

2.1 Regressão

A regressão é um tipo de modelagem matemática que auxilia no entendimentodas relações entre variáveis de um processo, ou seja, estuda como o comportamentode uma ou mais variáveis pode in�uenciar em outra. Ela dá a possibilidade deestimar parâmetros de um modelo para uma função desconhecida. Nesta relação,temos as variáveis de entradas (Xn) e variáveis de saída (Yn), como demonstradona Figura 2:

Figura 2: Representação do relacionamento entre variáveis de um processo

Em geral, modelos de regressão são construídos com os seguintes objetivos:

• Boa Predição- Espera-se que a variável de saída possa ser explicada pelas deentrada, desta forma, alguns dados que não estavam entre os originais podemser previstos através do modelo. Esta funcionalidade é chamada de predição.

• Possibilitar seleção e �ltragem de variáveis - O modelo de regressão podeser um auxílio no processo de �ltragem das variáveis (que geralmente aparecemem grande quantidade), excluindo aquelas que não contribuem signi�cativa-mente no processo.

• Permitir poder de Inferência - O modelo deve ser capaz de permitir infer-ências sobre o processo.

2.2 Máquinas de Vetores Suporte e seu uso em regressão

A abordagem SVM funciona da seguinte forma:À partir das classes do processo e de um conjunto de vetores que pertencem

cada uma delas, a técnica determina o hiperplano que as separa, colocando o maiornumero possível de pontos da mesma classe no mesmo lado, ao mesmo tempo emque a distância de cada classe a esse hiperplano é maximizada[11].

Para facilitar a compreensão, na Figura 3 está representada uma amostra defunção monovariada. Variáveis de um processo estão representadas como "`x"'.

4

2.3 Outros Métodos de regressão 2 FUNDAMENTAÇÃO TEÓRICA

Nota-se que apenas os pontos localizados fora dos limites de E contribuirão signi-�cativamente para o valor da função resultante.

Figura 3: Função de perda E-Insensitive - Fonte: Smola e Scholkopf (2004)

Já a regressão usando SVM tem o objetivo de fazer com que o sistema aprendauma função existente à partir de uma amostra de dados de treinamento, procurandocriar uma curva que se ajuste aos dados e assim chegar a um modelo numérico qu3eexplique estes dados.

A regressão SVR é conseguida incluindo na função de custo o parâmetro distância(E). Este parâmetro cria uma margem, onde os dados contidos nela serão ignorados.E assim, tornam-se necessários o controle de dois parâmetros (E, C), onde C é ocontrole que limita os valores da margem criada.

Apenas os dados fora da região delimitada serão utilizados no calculo do vetorresultado. E por isto são chamados de vetor suporte.

A precisão de um modelo SVR é largamente dependente da seleção dos parâmet-ros do processo. Para permitir alguma �exibilidade na criação da curva, os modelosSVR possuem um parâmetro de custo, C, que controla o balanço entre erros detreinamentos e margens rígidas na curva. Dependendo do seu valor, ele cria umamargem que permite alguns erros de classi�cação. Diminuindo-se o valor de C, ocusto é aumentado para pontos muito fora dos padrões, forçando a criação de ummodelo mais ajustado às amostras e que generaliza pouco em relação aos outros.

2.3 Outros Métodos de regressão

Regressão linearA regressão linear é de�nida como uma tentativa de estabelecer uma equação

matemática que decreva a relação entre duas variáveis [18].Existem várias formas de se utilizar uma equação de regressão:

• Estimativa de valores de uma variável à partir de dados de outra

• Predição de valores futuros de uma variável, como por exemplo à partir deuma variável coletada em uma mineradora tentar prever sua produção.

Árvore de regressão Model TreeAs árvores representam gra�camente de regras de regressão e vão construindo

a árvore de modo recursivo a partir de dados de treino, dividindo os dados emsubconjuntos até que esses representem determinados critérios.

5

2.4 Trabalhos relacionados 2 FUNDAMENTAÇÃO TEÓRICA

As árvores são compostas por dois tipos de nós:

• Nós internos, que correspondem a um teste feito em cada atributo de entradado conjunto de treinamento.

• Nós folha, nos quais são feitas predições do atributo procurado.

Árvores de regressão são diferentes das de decisão pelos conteúdos dos nós folha,que representam uma função matemática para predizer o atributo procurado.

A árvore M5P usada neste trabalho prediz o valor de um atributo contínuo, epossui em seu nó folha um modelo de regressão linear para a predição. Um exemplodesta árvore é mostrado na Figura 4, que foi construída usando dois atributos deentrada (x1 e x2) [5].

Figura 4: Exemplo de Árvore Model Tree [5]

2.4 Trabalhos relacionados

Primeiramente, foram estudados trabalhos que tratam de métodos para estima-tiva de produtividade em áreas de extração mineral, e muitos deles propõem o usode simulação para estimativa de produtividade de uma mina, como Farid e Koning[7]; Smith [15], Halpin [1].

No intuito de estabelecer um modelo de estimativa de produtividade que fossede fácil obtenção e aplicação, em 1996, Smith [16] examinou um sistema que con-siste, em sua forma mais simples, em um ciclo de carregamento de um caminhão,transporte do material até o ponto de descarga (ou básculo) e retorno ao pontode carregamento, começando o ciclo novamente. Smith realizou uma análise re-gressional para estimativa de produtividade de operações de minas, obtendo bonsresultados.

Alguns trabalhos procuram estimar produtividade através de ferramentas com-putacionais, dentre eles está o estudo feito por Brandão R. [3], que procura estimar aprodutividade de uma mineradora através de regressões lineares com base nos dadosde operação de mina. Este estudo possui concreta fundamentação teórica e estatís-tica, e reforça a possibilidade de aplicação de modelos matemáticos em processos

6

2.4 Trabalhos relacionados 2 FUNDAMENTAÇÃO TEÓRICA

reais. Este trabalho, obteve como resultado uma boa correlação entre a Produtivi-dade Estimada e a Realizada - 92%. Desta forma, ele servirá como principal baseteórica para a execução deste trabalho.

Outros estudos também foram levados em consideração para desenvolvimentodeste trabalho, como o de Cruz A. J. R. [13], que compara métodos de Redes Neu-ronais Arti�ciais (RNAs) e Máquinas de Vetores Suporte (MVSs), para se saber qualo desempenho das técnicas quando aplicadas a tarefas de regressão e comparando-as.Segundo este estudo as MVSs obtêm em geral um melhor desempenho em previsão,que é o foco deste trabalho.

Para a escolha do método de aprendizagem de máquina, foram estudados váriostrabalhos atuais, que demonstram o uso de SVR em diversi�cados campos da ciência,como em redes de computadores, no trabalho de Paola Bermolen e Dario Rossi [6],na área de economia no trabalho de Chi-Jie Lu, Tian-Shyug Lee, Chih-Chou Chiu[4] e em diversas outras áreas, mostrando a crescente aceitação do método no meioacadêmico atual.

7

3 METODOLOGIA

3 Metodologia

Nesta seção, serão descritas detalhadamente as metodologias utilizadas em cadaetapa de desenvolvimento do trabalho, desde a escolha da ferramenta a ser utilizada,passando pela coleta e escolha dos dados, ajuste do modelo, execução dos testes eresultados.

3.1 Escolha da ferramenta de regressão

Devido à falta de estudos capazes de apontar ferramentas mais adequadas paraeste tipo de trabalho, foi feita uma análise de algumas das principais ferramentas deaprendizagem de máquina disponibilizadas gratuitamente, selecionando dentre elasas capazes de utilizar o método de Vetor Suporte. Temos algumas delas: Kernlab,PyML, Scikit-learn[12], Shogun[14], Torch3 e Weka[10].

Para que as ferramentas fossem melhor selecionadas, foram testadas algumasfuncionalidades que auxiliarão na execução das regressões, como a visualização dasmesmas, o aprendizado em larga escala, a medida de performance usando erros deresíduo e correlações e �nalmente a interface grá�ca. A Figura 5, mostra a tabelade comparação das ferramentas de regressão feita através de uma pesquisa nos sitesdos desenvolvedores das ferramentas:

Figura 5: Quadro comparativo das principais ferramentas de regressão

Desta forma, constatou-se que a ferramenta Waikato Environment forKnowledge Analysis (Weka) atende a todos os critérios escolhidos, e assimela será usada para o desenvolvimento do trabalho. A ferramenta disponibilizaos seguintes módulos:

• Explorer - É um ambiente de exploração de dados.

• Experimenter - É um ambiente usado para execuções de testes comparativosentre métodos de aprendizado de máquina.

• KnowledgeFlow - Possui as mesmas funcionalidades do Explorar, mas possuiuma interface arraste - solte, suportando também aprendizado incremental.

• SimpleCLI - É uma interface em linha de comando, para sistemas que nãopossuem esta funcionalidade.

As funcionalidades do programa Weka serão apresentadas conforme o desenvolvi-mento do trabalho. Esta foi uma forma encontrada para que este estudo sirva debase para o desenvolvimento de outros trabalhos usando esta ferramenta.

8

3.2 Escolha do modelo de regressão 3 METODOLOGIA

3.2 Escolha do modelo de regressão

Para garantir o cumprimento das principais premissas para a obtenção de ummodelo con�ável, foi construído um �uxograma com as etapas adotadas conforme ametodologia usada neste trabalho. A Figura 6, representa o �uxo geral do processode construção do modelo e em seguida as etapas deste serão detalhadas.

Figura 6: Fluxograma geral do processo de construção do modelo de regressão

Em seguida, será descrito como o trabalho atendeu a cada um das etapas paraseleção de do modelo ilustradas no �uxograma.

3.2.1 Obtenção dos dados

Foram coletadas, no período de um ano as variáveis do processo de operação detransporte interno em uma mineradora do Quadrilátero Ferrífero. Através de umsistema de gerenciamento interno feito por satélites, foi possível a captação destesdados com grande precisão. Este intervalo favorece a heterogeneidade dos dados, efaz com que a amostra seja representativa.

Variáveis amostradas:

• Produtividade (ton.) - Produtividade na Mina medida em toneladas/dia.

• Velocidade (Km/h) - Média de velocidade do Caminhão no interior da mina.

• KmCheio KmVazio - Proporção entre a distância percorrida pelo caminhãocarregado sobre a distância percorrida pelo caminhão cheio.

• Tempo de Fila Médio (h) - Média diária do Tempo médio de �la por caminhão(Carregamento - Báscula).

9

3.2 Escolha do modelo de regressão 3 METODOLOGIA

• Tempo de Manobra(h) - Média da soma de tempo diário de manobra do cam-inhão.

• Tempo de Carregamento(h) - Média da soma de tempo diário de carregamentodo caminhão.

• Tempo de Básculo(h) - Média da soma de tempo diário que o caminhão levapara bascular o produto.

• Distância média de transporte (DMT) (Km) - Distância média por viagem.

• Carga Média (ton.) - Carga média carregada por viagem.

• Velocidade Cheio (Km/h) - Média de velocidade do Caminhão trafegandocarregado.

• Velocidade Vazio (Km/h) - Média de velocidade do Caminhão trafegandovazio.

• Tempo de Fila na Escavadeira (h) - Média da soma de tempo que o caminhãoespera para que a carregadeira encha sua caçamba.

• Tempo na �la do britador (h) - Média da soma de tempo que o caminhãoespera para bascular no britador, que é a máquina responsável por fragmentaro produto .

• Pluviometria (mm) - Taxa pluviométrica na região da mina.

Os dados utilizados para a regressão estão em resumo na tabela abaixo. Osatributos de entrada são numéricos (num). Temos também o número de instâncias,e o método de validação (10-fold Cross-validation - CV (Validação cruzada com dezdesdobramentos), ou holdout Percentage Split - PS) ( Separação simples em casosde treino (66%) e teste (33%), com amostragem aleatória).

Procedência dos Dados Atributos No de instâncias Valores em Falta Método de Validação

Num Bin Nom

Mineração 14 0 0 365 não CV

Após coletados, os dados foram organizados em planilhas, onde cada colunarepresenta uma variável em questão. A Figura 7, mostra algumas linhas da baseinicial de dados coletados.

Figura 7: Tabela completa de dados coletados

10

3.3 Execução das Regressões usando Weka 3 METODOLOGIA

3.2.2 Ajuste das variáveis

Nesta fase os dados já foram pré-�ltrados e as últimas adaptações e junções antesdo início das regressões serão feitas. Por isto, foram adotadas algumas políticas parafazer com que os estudos de regressão em cima destes sejam estatisticamente maisrobustos.

Alterações sobre o conjunto de dados:

• Os dados foram desordenados através de um �ltro da ferramenta Weka, a �mde prevenir algum vício advindo das épocas do ano. A execução do �ltro émostrada na Figura 8.

• A base de dados foi dividida em Treinamento / Teste, com a proporção de66% e 33% respectivamente. Desta forma, serão evitados que dados �viciados�inter�ram no resultado �nal do processo de treinamento.

• Ficou também �xado, que o método de validação utilizado será o de (10-foldCross-validation) e que o resultado �nal será a média entre estas dez repetições.

Figura 8: Desordenação das variáveis do processo usando Weka

3.3 Execução das Regressões usando Weka

Para execução das regressões usando a ferramenta Weka, primeiramente deveser baixado o programa na versão Developer, onde se encontra uma ferramenta deinstalação de novas funcionalidades, o Weka Package Manager dá a possibilidadeda instalação da regressão por vetor suporte, conforme demonstrado na Figura 9.

A versão baixada foi a weka 3.7.4, e sua instalação não será descrita nestetrabalho.

Carregando os dados no programaA Figura 10, mostra o Weka com os dados da mina já carregados.Nesta tela também estão as funções de revisão e �ltro de dados, que já foram

usadas anteriormente para desordenar o banco.

Criação do modelo de regressão

11

3.3 Execução das Regressões usando Weka 3 METODOLOGIA

Figura 9: Weka Package Manager

Figura 10: Programa Weka com o banco de dados da mina já carregado

Para usar as funcionalidade doWeka que permitem fazer classi�cação e regressãoé preciso ir até a aba Classify, e escolher o método de regressão a ser usado, emseguida a variável dependente (cujo modelo tentará prever). Como resultado tem-seum modelo de regressão, conforme mostrado na Figura 11.

Como interpretar os resultados geradosApós a regressão já executada, é importante identi�car na saída do programa os

dados que poderão ser usados para análise.A Figura 12 representa a primeira parte destes resultados. Nela são mostrados

os "`pesos"' atribuídos a cada variável no processo em análise. As variáveis comos coe�cientes positivos possuem relações diretamente proporcionais à produção, ouseja, impactam positivamente no processo, enquanto as negativas impactam negati-vamente.

12

3.3 Execução das Regressões usando Weka 3 METODOLOGIA

Figura 11: Resultado da Regressão

13

3.4 Seleção do modelo 3 METODOLOGIA

Figura 12: Resultado da Regressão - Pesos das variáveis

A Figura 13 representa a parte do resultado que mostra uma síntese da regressãorepresentada por números. Primeiramente temos o Coe�ciente de Correlação, quemede o grau relacional entre as variáveis de entrada e a variável preditora. Emseguida temos os erros de resíduos, que quanti�cam a adequação do modelo aoprocesso e Finalmente, tem-se o número total de instâncias usadas, incluindo as deteste e de treinamento.

Figura 13: Resultado da Regressão - Parte 02

Através destes resultados será possível determinar a força de predição do SVR eo impacto de cada uma das variáveis no processo da mineradora.

3.4 Seleção do modelo

Como o resultado da utilização de um algoritmo de regressão é um modelo, énormal utilizar vários algoritmos sobre os mesmos dados e produzir assim modelosdistintos. O desa�o é escolher o modelo que melhores resultados obtém. Destaforma, é necessário utilizar alguns métodos para avaliação dos mesmos, onde sejapossível medir seu grau de e�cácia[8].

O modelo de regressão mais ajustado é aquele cuja predição sobre a produçãoà partir dos outros dados seja máxima e cujos valores de resíduos são os menorespossíveis.

O Weka nos possibilita treinar e ao mesmo tempo cruzar resultados de váriosalgoritmos, e desta forma seremos capazes de chegar ao modelo que mais se aproxima

14

3.5 Validação do modelo 3 METODOLOGIA

aos dados de entrada. No decorrer da execução das regressões, serão testados váriosmétodos, e seus resultados comparados. Na Figura 14, é apresentada a ferramentado Weka possibilita a comparação entre os métodos de regressão - Experimenter.

Figura 14: Tela do Experimenter

3.5 Validação do modelo

Nesta etapa, é escolhido o modelo que melhores resultados obteve ao executaras regressões propostas.

Bons resultados signi�cam baixos erros de resíduos, e altos índices de relaciona-mento entre as variáveis de entrada e o modelo resultante.

Para os erros de resíduos, serão considerados os resultados obtidos na variávelRoot Relative Squared Error. Já o coe�ciente de relacionamento é representadono Weka por Correlation coe�cient , e quanto mais próximo de 100, maior é arelação entre o modelo e o resultado procurado [3].

Serão feitas também predições usando o modelo encontrado e algumas partesnão usadas da amostra para avaliação do ajuste do modelo.

15

4 ANÁLISE EXPLORATÓRIA

4 Análise exploratória

Desde a coleta dos dados de operação da mina, é sabido que algumas variáveistêm um enorme impacto na produção �nal, assim como outras impactam talvez comuma intensidade insigni�cante. Só que a intensidade de impacto de cada variável édesconhecida.

Surgiu então a idéia de um cruzamento individual de cada uma das variáveisde produção, a �m de obter-se uma pré análise destas relações. Os grá�cos serãoapresentados em seguida, representando a relação de cada variável de dado coletadona mina com a produtividade total no decorrer de um ano.

Algumas áreas dos grá�cos foram circuladas ou traçadas com a cor vermelhaa�m de demonstrar evidências de relações diretamente proporcionais, enquanto oscírculos e curvas amarelas visam demonstrar relações inversamente proporcionaisentre as variáveis.

O primeiro grá�co representado na Figura 15, compara a produção com a ve-locidade média do caminhão na mina. Em uma pré análise, podemos notar que avelocidade dos caminhões impactam diretamente na produção da mina, mantendouma relação de proporcionalidade.

Figura 15: Grá�co - Produção versus Velocidade

Na Figura 16, temos o grá�co comparando a produção e a distância média detransporte dos caminhões. Analisando o grá�co, podemos notar uma relação inversa-mente proporcional entre elas. Em vários pontos notamos que conforme a distânciamédia diminui, a produção está alta.

Figura 16: Grá�co - Produção versus DMT

Na Figura 17, temos o grá�co comparando a produção e a �la para o britador.Analisando o grá�co, notamos curvas inversas, onde quando temos uma produçãoalta, a �la do britador se encontra no período mais baixo e vice-versa.

Na Figura 18, temos o grá�co comparando a produção e a �la para nas escav-adeiras. No primeiro ponto, notamos uma relação inversa entre as variáveis. No-

16

4 ANÁLISE EXPLORATÓRIA

Figura 17: Grá�co - Produção versus Fila Britador

vamente temos curvas inversas, indicando que quando as �las de escavadeiras estãobaixas a produção tende a aumentar.

Figura 18: Grá�co - Produção versus Fila Escavadeira

Na Figura 19, temos o grá�co comparando a produção e o tempo de básculo. Ébem destacado no grá�co a relação inversamente proporcional entre estas variáveis.Em vários pontos temos �las pequenas e uma alta na produção e em outros �lasgrandes com uma baixa na produção.

Figura 19: Grá�co - Produção versus Tempo de Básculo

Na Figura 20, temos o grá�co comparando a produção e a carga média trans-portada pelos caminhões. Pode-se notar no grá�co uma relação de proporcionalidadeentre as variáveis. Nos pontos destacados, mesmo que discretamente notamos quequanto maior é a carga transportada, maior também é a produção.

17

4 ANÁLISE EXPLORATÓRIA

Figura 20: Grá�co - Produção versus Carga Média

Na Figura 21, temos o grá�co comparando a produção e o tempo de carregamentodos caminhões. Nota-se em alguns pontos, que temos uma relação inversamente pro-porcional entre as variáveis, pois em alguns pontos tempos uma baixa na produçãoe ao mesmo tempo um aumento na �la de carregamento.

Figura 21: Grá�co - Produção versus Tempo de Carregamento

Na Figura 22, temos o grá�co comparando a produção e o tempo médio de �laenfrentada pelos caminhões. Nota-se no grá�co uma relação inversamente propor-cional, onde em alguns pontos temos uma queda na produção e um aumento na �lamédia e vice versa.

Figura 22: Grá�co - Produção versus Tempo Médio de Fila

Na Figura 23, temos o grá�co comparando a produção e a proporção entre aproporção entre Km Cheio / Km Vazio praticada pelos caminhões na Mina. Pode-se notar uma relação de proporcionalidade, onde em alguns pontos temos uma quedana produção juntamente com a quedana relação KMCH/KmVz. Da mesma formahá pontos que há um aumento das duas variáveis.

18

4 ANÁLISE EXPLORATÓRIA

Figura 23: Grá�co - Produção versus Proporção KM Cheio / Km Vazio

Na Figura 24, temos o grá�co comparando a produção e o tempo médio demanobra dos caminhões. Pode-se notar mesmo que discretamente, uma relaçãoinversamente proporcional. Quando há um aumento no tempo de manobra, a pro-dução tende a cair.

Figura 24: Grá�co - Produção versus Tempo de Manobra

Na Figura 25, temos o grá�co comparando a produção e a taxa pluviométricadiária.

Apesar da grande quantidade dos dias de chuva, nota-se uma diminuição signi-�cativa na produção quando tem-se uma taxa pluviométrica elevada, explicitandouma relação inversamente proporcional entre as variáveis.

Figura 25: Grá�co - Produção versus Taxa Pluviométrica

Na Figura 26, temos o grá�co comparando a produção e a média da velocidadepraticada pelos caminhões carregados. É possível notar alguns pontos no grá�coonde temos uma diminuição da velocidade juntamente com a diminuição da pro-dução, demonstrando uma relação de proporção entre as variáveis.

19

4 ANÁLISE EXPLORATÓRIA

Figura 26: Grá�co - Produção versus Velocidade Caminhão Cheio

Na Figura 27, temos o grá�co comparando a produção e a média da velocidadepraticada pelos caminhões vazios. Em alguns pontos, nota-se uma relação de pro-porcionalidade entre as variáveis, além da curva das duas coincidir em muitos pontosobservados.

Figura 27: Grá�co - Produção versus Velocidade Caminhão Vazio

As análises feitas em grá�cos são apenas visuais, mais já dão um norte sobre asrelações existentes entre as variáveis que serão usadas nas regressões.

20

5 EXPERIMENTOS E RESULTADOS

5 Experimentos e Resultados

Neste capítulo serão utilizadas técnicas de regressão para extrair o conhecimentodos dados coletados. Desta forma, serão executadas experimentos com o objetivo decomparar os resultados gerados por elas (benchmarking). A análise dos resultadosserá feita junto à execução dos testes.

5.1 Execução dos Testes e resultados

Por possuir uma grande quantidade de dados com diferenças nos seus valoresmáximos e mínimos, decidiu-se que os dados deste trabalho seriam normalizados.Na normalização foi adotado o limite superior de 1 e inferior de -1.

Para formalizar as con�gurações das regressões, foram �xadas normas tanto paraa fase de treinamento quanto para a de testes:

• Foi estabelecida uma base de treinamento diferente da base de testes.

• Foram estabelecidos testes diferenciados variando o Hiperparâmetro C de0.0001 a 1000.

• Os testes iniciais serão feitos com regressões em SVR, porém serão feitos testescom outros métodos para futuras comparações.

• Os testes foram executados 10 vezes cada, e para os resultados serão tomadasas médias entre eles.

• No intuito de evitar possíveis vícios nos dados, eles foram desordenados paratodos os testes.

• Os testes foram executados para diferentes tamanhos de bases de aprendiza-gem, a �m de se fazer uma análise do comportamento do modelo de acordocom esta mudança.

A Figura 28 apresenta os nomes e valores dos parâmetros associados à técnicade SVR usada. Neste teste foram mantidas todas as de�nições (parâmetros doalgoritmo) disponibilizadas pelo Weka:

Testes de regressão SVR com variação na base de treinamentoForam executados testes variando a base de treinamento de 0,09% a 97% da

amostra total.É importante dizer que a ferramenta Weka não possibilita a execução de testes

simultâneos variando-se a base de treinamento, o que deve ser executado separada-mente de acordo com a demanda do usuário.Na Figura 29, estão resumidos os re-sultados do Root Relative Squared Error.

Percebe-se que conforme o tamanho da base de treinamento aumenta, o erro éminimizado. Outro fato importante é que a partir de uma porcentagem de dadosusados para treinamento o erro se torna constante, ou seja, à partir de um limite deexemplos, a predição não é melhorada.

A seguir, na Figura 30 temos os resultados dos Coe�cientes de Correlação con-forme a variação da base de treinamento.

21

5.1 Execução dos Testes e resultados 5 EXPERIMENTOS E RESULTADOS

Figura 28: Parametrização do SVR

Figura 29: RRSE x Variação da porcentagem de testes

Figura 30: Coe�ciente de Correlação x Variação da porcentagem de testes

22

5.1 Execução dos Testes e resultados 5 EXPERIMENTOS E RESULTADOS

Da mesma forma dos resultados anteriores, com o aumento da base de treina-mento o coe�ciente de correlação aumenta, e a correlação se torna constante àpartir de um certo ponto.

Testes de regressão SVR com variação Hiperparâmetro CNa Figura 31 e na 32, temos os resultados dos testes de regressão usando Máquina

de Vetor Suporte, usando um Split pré-�xado de 66% para base de aprendizado,variando-se o hiperparâmetro C de 0.0001 a 1000.

Figura 31: RRSE x Variação do Hiperparâmetro C

Figura 32: RRSE, Correlação e Tempo de Execução x Variação do HiperparâmetroC

O Hiperparâmetro C é responsável por regular a margem de erro aceita pelacurva de regressão. Nota-se que quando existe um relaxamento da margem dacurva com um C alto, a incidência de erros é menor, pois a curva aceita um maiornumero de valores divergentes. Da mesma forma, com o aumento de C, o modeloé forçado a se ajustar mais aos valores, causando maiores erros e aumentando otempo de execução da máquina.

Testes de regressão comparando os principais métodos

23

5.1 Execução dos Testes e resultados 5 EXPERIMENTOS E RESULTADOS

O programa WEKA possui vários algoritmos de aprendizagem de máquina já im-plementados, eles foram desenvolvidos na Universidade de Waikato na Nova Zelân-dia. A �m de comparar o desempenho dos principais métodos de regressão, serãofeitos testes usando Máquina de Vetor Suporte, Regressão Linear e regressão porÁrvore M5P, usando um Split pré-�xado de 66% para base de aprendizado com umvalor de C igual a um. Será feita uma breve descrição dos métodos e os parâmetrosusados para execução dos testes apresentada.

Regressão linearPrimeiramente, na Figura 33 serão mostrados os parâmetros usados na regressão

linear.

Figura 33: Parâmetros usados para a execução da regressão linear

Em seguida, serão feitas as regressões usando árvores M5P e os parâmetros us-ados no método são mostrados na Figura 34

Figura 34: Parâmetros usados para a execução da regressão usando árvore M5P

A Figura 35 mostra os resultados dos teste de regressão, em seguida na Figura 36temos uma tabela de resultados, contemplando coe�cientes de correlação e temposde execução.

Testes da qualidade de predição do modelo encontrado

24

5.2 Análise dos Resultados 5 EXPERIMENTOS E RESULTADOS

Figura 35: Testes de regressão comparando os principais métodos

Figura 36: Resultados de regressões comparando os principais métodos

A�m de medir a precisão do modelo encontrado pela regressão usando SVRfoi executado um ultimo teste, onde dados não usados para o treinamento forammultiplicados pelos fatores resultantes da regressão.

É importante ressaltar que para este teste não podem ser usados os resultadosnormalizados. Assim, cada variável fará o peso que realmente tem no dado procurado(produção).

A Figura 37 representa uma amostra dos dados de entrada da regressão. As duascolunas destacadas contém o resultado encontrado pelo modelo e a porcentagem deerro de precisão.

5.2 Análise dos Resultados

Através da execução destes testes, foi possível concluir que dentre os métodoscomparados, o método de Vetor Suporte apresenta os melhores resultados na criaçãodo modelo abordado no trabalho. O SVR apresentou o menor erro, o que signi�caque é o método que produz o modelo mais aproximado do processo estudado. Osresultados gerados pelo método podem ser usados para quanti�car os impactos dosdesvios dos indicadores de produtividade sobre a mina em questão.

No teste demonstrado na Figura 37 �cou clara a precisão do modelo encontrado.Ele teve um bom ajuste sobre os dados, o que �ca evidenciado pelas pequenas taxasde erro RealEncontrado.

Posteriormente, inferências sobre o processo poderão ser feitas e adaptações sobrea maneira de agrupar as variáveis poderão surgir.

25

5.2 Análise dos Resultados 5 EXPERIMENTOS E RESULTADOS

Figura 37: Teste da Qualidade de predição do modelo encontrado

Outro ponto importante, foi a análise do comportamento dos erros na regressãode acordo com a variação do Hiperparâmetro C. Foi possível concluir que deve-seajustar este parâmetro de acordo com a rigidez do resultado procurado.

26

6 CONCLUSÃO

6 Conclusão

Neste trabalho, foram abordados métodos e ferramentas capazes de transfor-mar um problema real em uma solução adequada através do uso de ferramentasmatemáticas e computacionais.

Para que estes métodos possam ser utilizados por usuários comuns, surgem no-vas ferramentas que implementam diversos tipos de métodos de aprendizagem demáquina. Neste trabalho foi explorado o uso da ferramenta Weka, que se mostroumuito funcional e robusta para a execução de diversos tipos de testes de regressão.Foi feito também um levantamento das ferramentas capazes de resolver problemascomo o da mina em questão usando diversos tipos de métodos de regressão. Foramtambém efetuados testes comparativos entre as principais técnicas de aprendiza-gem de máquina, aplicando-as a um problema existente e de grande valor para aeconomia global.

Foram explicitadas as principais características do método de Vetores Suporte,assim como o seu comportamento.

Outro ponto importante deste trabalho foi aliar aprendizagem de máquina a umproblema real, e ver como as técnicas computacionais são capazes de ir além dacapacidade humana, predizendo valores e criando possibilidades de atuação sobreum processo.

6.1 Trabalhos Futuros

Este trabalho proporciona diversas perspectivas de trabalhos futuros:

• O numero de ferramentas de aprendizagem de máquina é elevado, o que com-plica uma análise profunda das mesmas. Poderia ser feito um estudo com maisrigor sobre elas à partir do principal uso de cada uma delas e suas principaisfuncionalidades.

• A avaliação das técnicas de aprendizagem de máquina pode ser aprofundadacom o estudo de diferentes implementações para as mesmas,

• Outros métodos de aprendizagem de máquina, como os de redes neuraispoderão ser usados a �m de procurar aumentar ainda mais a precisão preditivaencontrada.

• Poderão ser implantadas medidas administrativas na mina de onde os dadosforam coletados, a �m de avaliar na prática os resultados encontrados nasregressões.

27

6.2 Bibliogra�a REFERÊNCIAS

6.2 Bibliogra�a

Referências

[1] S. M. AbouRizk and D. W. Halpin. Modeling input data for construction sim-ulation. 8th National Conf. on Computing inCiv. Engrg., 1992.

[2] G. ALBUQUERQUE. Re�exoes sobre a Economia Mineral e a Compressao dePrecos. Escola Politecnica da USP, 19 edition, 1995.

[3] R. Brandao. Metodologia para estimativa e gestao da produtividade de lavra.Esc. Minas, 64 edition, 2011.

[4] Chih-Chou Chiu Chi-Jie Lu a, Tian-Shyug Lee. Financial time series forecast-ing using independent component analysis and support. Department of Indus-trial Engineering and Management Taiwan, 2010.

[5] Rezende S; O. Dosualdo D. G. Analise da Precisao de MÃ c©todos de Regressao.USP, 2003.

[6] Gerard Bloch Fabien Lauer. Data Mining via Redes Neuronais Arti�ciais eMaquinas de Vectores de Suporte. a TELECOM ParisTech, 2007.

[7] F. Farid and T. L. Koning. Simulation veri�es queuing program for selectingloader truck �eets. J. Constr. Engrg. and Mgmt., 1994.

[8] Shapiro G. Fayyad U. and Smyth P. From Data Mining to Knowledge Discoveryin Databases. AI Magazine, 1996.

[9] Han J. and Kamber M. Data Mining: Concepts and Technique. Morgan Kauf-mann, 2000.

[10] T. Joachims. Making large-scale SVM learning practical. Cambridge, MA, 1999.

[11] G. Ratsch K. Tsuda K. R. Muller, S. Mika and B. Scholkopf. An introductionto kernel-based. IEEE Trans. Neural Netw, 12 edition, 2001.

[12] G. Zanghirati. L. Zanni, T. Sera�ni. Parallel Software for Training Large ScaleSupport Vector Machines on Multiprocessor Systems. JMLR, 2006.

[13] Cruz A. J. R. Data Mining via Redes Neuronais Arti�ciais e Maquinas deVectores de Suporte. Universidade de Minho, 2007.

[14] V. Sindhwani. Large Scale Semi-supervised Linear SVMs. SIGIR, 2006.

[15] Osborne J. R. Smith, S. D. and M. C. Forde. The use of a discrete-event simula-tion model with Erlang probability distributions in the estimation of earthmovingproduction. Civ. Engrg. Sys., 1996.

[16] S. D. Smith. Earthmoving Productivity Estimation using Linear RegressionTechniques. Journal of Construction Engineering and Management, 125 edition,1999.

28

REFERÊNCIAS REFERÊNCIAS

[17] Alex J. Smola and Bernhard Scolkopf. A Tutorial on Support Vector Regression.2003.

[18] William J. Stevenson. EstatÃstica aplicada à administraÃ�ao. Harbra, 2001.

29