agradecimentos À fapesp, processo número 03/10087-4. e ao ... · ... fernando machado, anderson...

114
i Agradecimentos À FAPESP, processo número 03/10087-4. E ao incentivo e apoio de meu orientador, Jorge Kazuo Yamamoto. Aos colegas Marcelo Rocha, Jorge Watanabe, Antonio Kikuda, Ana Paula Moreira e Marcelo Batelochi responsáveis por muito de meu aprendizado. Também cabe lembrar dos amigos Carol Heredus, Adriana Campos, Fabrício Mirandola, Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente, Deyna Pinho, Naira Alvarenga, Carlos Grohmann, Douglas Komati, Nicolas Varzacacou, Fabrizzio Costa, Marcio Remédio, Ricardo Hermes e Wilson Nakamura grandes companheiros e amigos para toda a vida. A Companhia Vale do Rio Doce e aos colegas Noevaldo Teixeira, Fernando Martins, Márcio Paim pelo apoio e compreensão nesta vida dividida que é fazer pós-graduação e trabalhar em campo.

Upload: vantuong

Post on 16-Dec-2018

220 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

i

Agradecimentos

À FAPESP, processo número 03/10087-4. E ao incentivo e apoio de meu

orientador, Jorge Kazuo Yamamoto. Aos colegas Marcelo Rocha, Jorge

Watanabe, Antonio Kikuda, Ana Paula Moreira e Marcelo Batelochi responsáveis

por muito de meu aprendizado.

Também cabe lembrar dos amigos Carol Heredus, Adriana Campos, Fabrício

Mirandola, Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente,

Deyna Pinho, Naira Alvarenga, Carlos Grohmann, Douglas Komati, Nicolas

Varzacacou, Fabrizzio Costa, Marcio Remédio, Ricardo Hermes e Wilson

Nakamura grandes companheiros e amigos para toda a vida.

A Companhia Vale do Rio Doce e aos colegas Noevaldo Teixeira, Fernando

Martins, Márcio Paim pelo apoio e compreensão nesta vida dividida que é fazer

pós-graduação e trabalhar em campo.

Page 2: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

ii

SUMÁRIO

1. Introdução........................................................................................................ 01

1.2 Objetivos........................................................................................................ 02

1.3 Justificativas.................................................................................................. 02

2. A Kirgagem Ordinária e Suas Medidas de Erro............................................... 04

3. O Efeito de Suavização da Krigagem Ordinária.............................................. 10

4. Simulação Estocástica..................................................................................... 17

5. Correção do Efeito de Suavização da Krigagem Ordinária............................. 22

5.1 Aplicação do Algoritmo de Pós-processamento para a Transformada

Reversa das Estimativas da Krigagem Lognormal.............................................. 30

6. Materiais e Métodos........................................................................................ 35

7. Resultados e Discussão.................................................................................. 46

7.1 Estudo da Influência do Tipo de Distribuição e do Tamanho da Amostra..... 46

7.1.1 Déficit de Variância..................................................................................... 50

7.1.2 Relação Entre a Variância Inicial e a Variância Amostral........................... 56

7.2 Estudo da Eficiência da Correlação em Distribuições Lognormais com

Aplicação da Krigagem Normal........................................................................... 66

7.3 Estudo da Eficiência da Correção de Distribuições Lognormais com

Aplicação da Krigagem Lognormal...................................................................... 79

8. Considerações Finais...................................................................................... 97

9. Referências Bibliográficas............................................................................... 99

Page 3: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

iii

LISTA DE FIGURAS Figura 1: Estimativa de blocos a partir da mesma configuração de dados (segundo Armstrong, 1994). Em (A), a variância do erro deveria ser menor que em (B) por causa de dados mais consistentes……………………………….. 06 Figura 2: Diagrama de dispersão entre o desvio padrão de interpolação e estimativas para a distribuição lognormal (Yamamoto 2000).............................. 07 Figura 3: Diagrama de dispersão entre o desvio padrão de interpolação e estimativas para a distribuição lognormal invertida (Rocha & Yamamoto, 2001)…………………………………………………………………………………… 08 Figura 4: Modelos de correlação entre o desvio padrão de interpolação e estimativas da krigagem ordinária para distribuição lognormal (a), normal (b) e lognormal invertida (c)………………………………………………………………... 08 Figura 5: Efeito de suavização mostrado na redução de variância na distribuição de blocos estimados em relação à distribuição de valores reais….. 13 Figuras 6: Diagrama de dispersão entre o valor real (Zv) e o valor estimado (Zv*) a um teor de corte z0 mostrando a porção de unidades erroneamente selecionadas e a porção de unidades erroneamente descartadas. (modificado de Guertin, 1984)……………………………………………………………………… 14 Figura 7: Modificado de Pan (1998)………………………………………………… 15 Figura 8: Diagrama de correlação entre Z(x) e Z*(x). Note-se o enviesamento condicional, a um teor de corte z0, a proporção de unidades erroneamente rejeitadas é muito maior que a proporção de blocos erroneamente selecionados (Guertin, 1984)………………………………………………………... 23 Figura 9: Diagrama de correlação entre Z(x) e Z**(x), sendo Z**(x) a variável estimada corrigida. (Guertin,1984)………………………………………………..... 23 Figura 10: Imagem gerada por krigagem ordinária em dados de permeabilidade em arenito (Olea & Pawlowsky, 1996)…………………………... 24 Figura 11: Imagem gerada por krigagem compensada em dados de permeabilidade em arenito (Olea & Pawlowsky, 1996)…………………………... 24 Figura 12: Função de Segundo grau para encontrar o fator ótimo, que faz a variância dos valores corrigidos igual à variância amostral (Yamamoto, 2007).. 30 Figura 13: Comportamento dos histogramas na KO e KLO, segundo Yamamoto (2007)…………………………………………………………………….. 33 Figura 14: O processo da krigagem lognormal corrigida, segundo Yamamoto (2007)……………………………........................................................................... 34 Figura 15: Imagem do conjunto completo apresentando uma distribuição normal………………………………………………………………………………….. 35 Figura 16: Imagem do conjunto completo apresentando uma distribuição lognormal………………………………………………………………………………. 36 Figura 17: Imagem do conjunto completo apresentando uma distribuição lognormal invertida……………………………………………………………………. 36 Figura 18: Mapa de localização dos pontos de dados representando a variável gaussiana……………………………………………………………………………… 37 Figura 19: Mapa de localização dos pontos de dados representando a variável lognormal……….................................................................................................. 37

Page 4: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

iv

Figura 20: Mapa de localização dos pontos de dados representando a variável lognormal invertida.............................................................................................. 38 Figura 21: Modelo de variograma isotrópico ajustado aos dados da variável normal.................................................................................................................. 39 Figura 22: Modelo de variograma isotrópico ajustado aos dados da variável lognormal………………………………………………………………………………. 39 Figura 23: Modelo de variograma com anisotropia zonal aos dados da variável lognormal invertida………………………………………………………………........ 39 Figura 24: Imagens dos dados completos: variável Log1 (esquerda) e variável Log2 (direita)…………………………………………………………………………... 40 Figura 25: Imagens dos dados completos: variável Log3 (esquerda) e variável Log4 (direita)………………………………………………………………….............. 41 Figura 26: Imagens dos dados completos: variável Log5 (esquerda) e variável Log6 (direita)…………………………………………………………………………... 41 Figura 27: Imagens dos dados completos: variável Log7 (esquerda) e variável Log8 (direita)…………………………………………………………………………... 41 Figura 28: Imagens dos dados completos: variável Log9 (esquerda) e variável Log10 (direita), que representa uma distribuição tipicamente lognormal………. 42 Figura 29: Imagens dos dados completos: variável Log11 (esquerda) e variável Log12 (direita)……………………………………………………………….. 42 Figura 30: Imagens dos dados completos: variável Log13 (esquerda) e variável Log14 (direita)……………………………………………………………….. 42 Figura 31: Imagens dos dados completos: variável Log15 (esquerda) e variável Log16 (direita)……………………………………………………………….. 43 Figura 32: Imagens dos dados completos: variável Log17 (esquerda) e variável Log18 (direita)……………………………………………………………….. 43 Figura 33: Mapa de localização de pontos para a variável Log10………………. 44 Figura 34: Variogramas experimentais e modelos ajustados para as amostras representativas da distribuição normal, sendo a) 36, b) 64,c) 90 e d) 121 dados…………………………………………………………………………………… 48 Figura 35: Variogramas experimentais e modelos ajustados para as amostras representativas da distribuição lognormal, sendo a) 36, b) 64,c) 90 e d) 121 dados………………………………………………………………............................. 48 Figura 36: Variogramas experimentais e modelos ajustados para as amostras representativas da distribuição lognormal invertida, sendo a) 36, b) 64,c) 90 e d) 121 dados…………………………………………………................................... 49 Figura 37: Gráficos dos componentes de variância para amostras da distribuição normal para amostras com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados………………………………………………………………….................... 51 Figura 38: Gráficos dos componentes de variância para amostras da distribuição lognormal para amostras com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados…………………………………………......................................... 53 Figura 39: Gráficos dos componentes de variância para amostras da distribuição lognormal invertida para amostras com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados…………………………………………………………………... 56

Page 5: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

v

Figura 40: Gráficos da variância inicial e variância corrigida em função do nppq para as amostras da distribuição normal com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados…………………………………….......................................... 59 Figura 41: Gráficos da variação do fator ótimo em função do nppq para as amostras da distribuição normal com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados……………………………………………………………………….................. 59 Figura 42: Gráficos da variância inicial e variância corrigida em função do nppq para as amostras da distribuição lognormal com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados……………………………………………………………... 62 Figura 43: Gráficos da variação do fator ótimo em função do nppq para as amostras da distribuição lognormal com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados……………………………………………………………………………….. 62 Figura 44: Gráficos da variância inicial e variância corrigida em função do nppq para as amostras da distribuição lognormal invertida com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados......................................................................... 65 Figura 45: Gráficos da variação do fator ótimo em função do nppq para as amostras da distribuição lognormal invertida com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados…………………………………………………………………... 65 Figura 46: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log1. Coeficiente de correlação (esquerda) e erro RMS (direita)……………………………................................... 67 Figura 47: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log2. Coeficiente de correlação (esquerda) e erro RMS (direita)……………………………………………………... 68 Figura 48: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log3. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 69 Figura 49: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log4. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 70 Figura 50: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log5. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 70 Figura 51: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log6. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 71 Figura 52: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log7. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 72 Figura 53: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log8. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 72 Figura 54: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log9. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 73

Page 6: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

vi

Figura 55: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log10. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 74 Figura 56: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log11. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 74 Figura 57: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log12. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 75 Figura 58: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log13. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 76 Figura 59: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log14. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 76 Figura 60: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log15. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 77 Figura 61: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log16. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 78 Figura 62: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log17. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 78 Figura 63: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log18. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 79 Figura 64: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log1. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 80 Figura 65: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log3. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 81 Figura 66: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log5. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 81 Figura 67: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log7. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 82 Figura 68: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log9. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 83 Figura 69: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log11. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 83

Page 7: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

vii

Figura 70: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log13. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 84 Figura 71: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log15. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 85 Figura 72: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log16. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 85 Figura 73: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log18. Coeficiente de correlação (esquerda) e erro RMS (direita). ………………………………….......................... 86 Figura 74: Diagramas de dispersão da variável Log 1 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1………………….. 87 Figura 75: Diagramas de dispersão da variável Log 3 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1………………….. 87 Figura 76: Diagramas de dispersão da variável Log 5 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1………………….. 87 Figura 77: Diagramas de dispersão da variável Log 7 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1………………….. 88 Figura 78: Diagramas de dispersão da variável Log 9 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1………………….. 88 Figura 79: Diagramas de dispersão da variável Log 11 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1………………….. 88 Figura 80: Diagramas de dispersão da variável Log 13 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1………………….. 89 Figura 81: Diagramas de dispersão da variável Log 15 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1………………….. 89 Figura 82: Diagramas de dispersão da variável Log 16 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1………………….. 89 Figura 83: Diagramas de dispersão da variável Log 18 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1………………….. 90 Figura 84: Diagramas de dispersão da variável Log 1 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5………………….. 90 Figura 85: Diagramas de dispersão da variável Log 3 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5………………….. 90 Figura 86: Diagramas de dispersão da variável Log 5 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5………………….. 91 Figura 87: Diagramas de dispersão da variável Log 7 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5………………….. 91 Figura 88: Diagramas de dispersão da variável Log 9 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5………………….. 91 Figura 89: Diagramas de dispersão da variável Log 11 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5………………….. 92 Figura 90: Diagramas de dispersão da variável Log 13 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5………………….. 92

Page 8: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

viii

Figura 91: Diagramas de dispersão da variável Log 15 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5………………….. 92 Figura 92: Diagramas de dispersão da variável Log 16 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5………………….. 93 Figura 93: Diagramas de dispersão da variável Log 18 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5………………….. 93 Figura 94: Gráficos comparando o Fator Ótimo em função do número de pontos por quadrante na krigagem ordinária. (a) para NPPQ em condição mínima e (b) para NPPQ igual ao grid. …………………..………………….......... 94 Figura 95: Gráficos comparando o Fator Ótimo em função do número de pontos por quadrante na krigagem logarítimica ordinária. (a) para NPPQ em condição mínima e (b) para NPPQ igual ao grid………………………................. 94

Page 9: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

ix

Lista de Tabelas Tabela 1: Subdivisão dos métodos de simulação estocástica, segundo Hohn (1999). …………………..…………………..…………………................................ 17 Tabela 2: Estatísticas descritivas dos conjuntos completos apresentando distribuições normal, lognormal e lognormal invertida. …………………............. 36 Tabela 3: Estatísticas descritivas das amostras dos conjuntos completos apresentando distribuições normal, lognormal e lognormal invertida…….......... 38 Tabela 4: Estatísticas das variáveis selecionadas para o estudo do efeito de correção na krigagem lognormal. …………………..………………….................. 40 Tabela 5: Estatísticas das amostras extraídas dos conjuntos completos por amostragem aleatória estratificada. …………………..…………………............... 44 Tabela 6: Estatísticas descritivas para o conjunto…………………..................... 46 Tabela 7: Estatísticas descritivas para o conjunto completo e amostras representativas da distribuição lognormal. …………………................................ 47 Tabela 8: Estatísticas descritivas para o conjunto completo e amostras representativas da distribuição lognormal invertida. …………………................. 47 Tabela 9: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 36 pontos da distribuição normal............ 50 Tabela 10: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 64 pontos da distribuição normal………. 50 Tabela 11: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 90 pontos da distribuição normal………. 50 Tabela 12: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 121 pontos da distribuição normal…… 51 Tabela 13: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 36 pontos da distribuição lognormal....... 52 Tabela 14: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 64 pontos da distribuição lognormal....... 52 Tabela 15: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 90 pontos da distribuição lognormal....... 52 Tabela 16: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 121 pontos da distribuição lognormal..... 53 Tabela 17: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 36 pontos de dados da distribuição lognormal invertida. ………..………..………..………..………..………..……….... 54 Tabela 18: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 64 pontos de dados da distribuição lognormal invertida. ………..………..………..………..………..………..……….... 54 Tabela 19: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 90 pontos de dados da distribuição lognormal invertida. ………..………..………..………..………..………..……….... 55 Tabela 20: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 121 pontos de dados da distribuição lognormal invertida. ………..………..………..………..………..………..……….... 55

Page 10: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

x

Tabela 21: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 36 pontos de dados da distribuição normal (variância amostral = 28,967). ………..………..………..………..……….. 57 Tabela 22: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 64 pontos de dados da distribuição normal (variância amostral = 20,642). ………..………..………..………..……….. 57 Tabela 23: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 90 pontos de dados da distribuição normal (Variância amostral = 18, 174). ………..………..………..………..……… 58 Tabela 24: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 121 pontos de dados da distribuição normal (Variância amostral = 22,540). ………..………..………..………..………. 58 Tabela 25: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 36 pontos de dados da distribuição lognormal (Variância Amostral = 10,999). ………..………..………..………......... 60 Tabela 26: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 64 pontos de dados da distribuição lognormal (Variância Amostral = 2,631). ………..………..………..………..……. 61 Tabela 27: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 90 pontos de dados da distribuição lognormal (Variância Amostral = 11,151). ………..………..………..………......... 61 Tabela 28: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 121 pontos de dados da distribuição lognormal (Variância Amostral = 6,526). ………..………..………..………........... 61 Tabela 29: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 36 pontos de dados da distribuição lognormal invertida (Variância Amostral = 5,600). ………..………..………......... 63 Tabela 30: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 64 pontos de dados da distribuição lognormal invertida (Variância Amostral= 2,631). ………..………..……….......... 64 Tabela 31: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 90 pontos de dados da distribuição lognormal invertida (Variância Amostral = 4,458). ………..………..………......... 64 Tabela 32: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 121 pontos de dados da distribuição lognormal invertida (Variância Amostral = 4,330). ………..………..………......... 64 Tabela 33: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log1. ………..………..…….. 66 Tabela 34: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log2. ………..………..…….. 67 Tabela 35: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log3. ………..………..…….. 68 Tabela 36: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log4.……..………..………... 69 Tabela 37: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log5. ……..………..……….. 70

Page 11: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

xi

Tabela 38: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log6..……..………..……….. 71 Tabela 39: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log7..……..………..……….. 71 Tabela 40: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log8..……..………..……….. 72 Tabela 41: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log9..……..………..……….. 73 Tabela 42: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log10. ...…..………..……… 73 Tabela 43: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log11...........………..……… 74 Tabela 44: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log12..……..………............. 75 Tabela 45: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log13..……..………............. 75 Tabela 46: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log14..……..………..……… 76 Tabela 47: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log15..……..………............. 77 Tabela 48: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log16..……..………..……… 77 Tabela 49: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log17..……..………............. 78 Tabela 50: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log18..……..………............. 79 Tabela 51: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log1..……..………..……….. 80 Tabela 52: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log3..……..………..……….. 80 Tabela 53: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log5..……..………..……….. 81 Tabela 54: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log7..……..………..……….. 82 Tabela 55: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log9..……..………..……….. 82 Tabela 56: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log11..……..………..……… 83 Tabela 57: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log13..……..………..……… 84 Tabela 58: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log15..……..………..……… 84 Tabela 59: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log16..……..………..……… 85 Tabela 60: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log18..……..………..……… 86

Page 12: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

xii

RESUMO

Esta dissertação apresenta os resultados da investigação quanto à eficácia do

algoritmo de pós-processamento para a correção do efeito de suavização nas

estimativas da krigagem ordinária. Foram consideradas três distribuições

estatísticas distintas: gaussiana, lognormal e lognormal invertida. Como se sabe,

dentre estas distribuições, a distribuição lognormal é a mais difícil de trabalhar, já

que neste tipo de distribuição apresenta um grande número de valores baixos e

um pequeno número de valores altos, sendo estes responsáveis pela grande

variabilidade do conjunto de dados. Além da distribuição estatística, outros

parâmetros foram considerados: a influencia do tamanho da amostra e o numero

de pontos da vizinhança. Para distribuições gaussianas e lognormais invertidas o

algoritmo de pós-processamento funcionou bem em todas a situações. Porém,

para a distribuição lognormal, foi observada a perda de precisão global. Desta

forma, aplicou-se a krigagem ordinária lognormal para este tipo de distribuição, na

realidade, também foi aplicado um método recém proposto de transformada

reversa de estimativas por krigagem lognormal. Esta técnica é baseada na

correção do histograma das estimativas da krigagem lognormal e, então, faz-se a

transformada reversa dos dados. Os resultados desta transformada reversa

sempre se mostraram melhores do que os resultados da técnica clássica. Além

disto, a as estimativas de krigagem lognormal se provaram superiores às

estimativas por krigagem ordinária.

Page 13: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

xiii

ABSTRACT

This dissertation presents the results of an investigation into the effectiveness of

the post-processing algorithm for correcting the smoothing effect of ordinary kriging

estimates. Three different statistical distributions have been considered in this

study: gaussian, lognormal and inverted lognormal. As we know among these

distributions, the lognormal distribution is the most difficult one to handle, because

this distribution presents a great number of low values and a few high values in

which these high values are responsible for the great variability of the data set.

Besides statistical distribution other parameters have been considered in this

study: the influence of the sample size and the number of neighbor data points as

well. For gaussian and inverted lognormal distributions the post-processing

algorithm worked well in all situations. However, it was observed loss of local

accuracy for lognormal data. Thus, for these data the technique of ordinary

lognormal kriging was applied. Actually, a recently proposed approach for back-

transforming lognormal kriging estimates was also applied. This approach is based

on correcting the histogram of lognormal kriging estimates and then back-

transforming it to the original scale of measurement. Results of back-transformed

lognormal kriging estimates were always better than the traditional approach.

Furthermore, lognormal kriging estimates have provided better results than the

normal kriging ones.

Page 14: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

1

ESTUDO DO EFEITO DE SUAVIZAÇÃO DA KRIGAGEM ORDINÁRIA EM

DIFERENTES DISTRIBUIÇÕES ESTATÍSTICAS

1. Introdução

O efeito de suavização da krigagem ordinária é um problema bem conhecido

dos geoestatísticos, uma vez que valores estimados apresentam uma variância

reduzida. Essa redução da variância ocorre pelo encurtamento das caudas da

distribuição de freqüências dos valores estimados em relação à distribuição amostral.

Em outras palavras, o processo de krigagem ordinária não reproduz as caudas da

distribuição. Se pensarmos que as caudas da distribuição representam apenas uma

pequena porcentagem da distribuição, o prejuízo não seria grande. Mas, isso não é

verdade. Na realidade, a perda das caudas da distribuição é conseqüência da

subestimativa de valores altos e superestimativa de valores baixos, que são

causados pelo efeito de suavização da krigagem ordinária. A redução das caudas

leva ao afinamento da distribuição e, conseqüentemente, à redução da variância.

Em termos da técnica da krigagem ordinária, a redução da variância era esperada,

uma vez que a estimativa é feita com mínima variância do erro, ou seja, os

ponderadores são calculados de forma a garantir a minimização da variância de

estimativa. Então, o problema é inerente à técnica da krigagem.Além disso, esse

problema é compartilhado por outros métodos de médias móveis ponderadas, como,

por exemplo, o inverso da distância. Portanto, o simples processo de cálculo de

médias ponderadas leva à suavização das estimativas. Observa-se, que, quanto

maior a dispersão em torno da média calculada, maior a suavização. Imaginando

uma situação em que todos os valores são constantes, a média será igual à

constante e, portanto, a dispersão nula. Nesse caso, não existe efeito de suavização.

Portanto, o efeito de suavização depende da variabilidade do conjunto de dados,

sendo proporcional à variância amostral. Então, a proposta deste trabalho é fazer a

investigação da eficiência do algoritmo de correção do efeito de suavização proposto

por Yamamoto (2005 e 2007). Para isso, se pretende considerar três distribuições

estatísticas distintas, quais sejam: normal, lognormal e lognormal invertida. Estas

distribuições apresentam características distintas em termos de variabilidade. Dentre

elas, a distribuição lognormal invertida apresenta a menor variabilidade, passando

em seguida pela normal e finalmente pela distribuição lognormal com maior

variabilidade. Como foi mencionado anteriormente, quanto maior a variabilidade,

Page 15: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

2

maior o efeito de suavização. Assim, a distribuição lognormal é aquela que pode

apresentar a maior dificuldade em termos de correção do efeito de suavização. Por

esse motivo, realizou-se um estudo mais detalhado nas distribuições lognormais.

Neste estudo, foi utilizada a krigagem lognormal, trabalhando-se no domínio

logarítmico e realizando a correção do efeito de suavização proposta por Yamamoto

(2007) antes da transformada reversa dos dados.

1.2. Objetivos

Este estudo tem por objetivo fazer um estudo intensivo da eficiência da

correção do efeito de suavização da krigagem ordinária, com base em diferentes

distribuições estatísticas e, também, com base em amostras de diferentes

coeficientes de variação. Além disso, para o caso das distribuições lognormais será

aplicada a técnica da krigagem lognormal com correção do efeito de suavização

para fins de transformada reversa.

1.3. Justificativas

O efeito de suavização pode alterar significativamente a forma da distribuição

amostral com conseqüências danosas à interpretação dos resultados. O principal

problema é a tomada de decisão com base nas estimativas calculadas. Por exemplo,

para o caso de estudo de dispersão de contaminantes em uma área, uma

determinada localização pode ser interpretada como livre de contaminação, pois a

concentração foi subestimada devido ao efeito de suavização. O contrário também

pode acontecer, ou seja, uma localização superestimada pode ser considerada

contaminada, quando, na realidade, não está devido a concentração ter sido

superestimada. Em jazidas minerais, o problema é semelhante e pode ocorrer tanto

quando o teor de corte está abaixo ou acima da média. Havendo perda de blocos de

minério e também, envio de material estéril para o processamento, gerando impacto

econômico relevante a projetos minerais.

Muitas variáveis na natureza seguem a distribuição lognormal, que é

característica para metais e elementos raros, tais como: ouro, tungstênio, diamante,

urânio etc. Nesses casos, a krigagem normal não é eficiente e, assim, há

necessidade de se proceder à krigagem lognormal, que consiste na transformada

Page 16: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

3

logarítmica dos dados originais, krigagem ordinária dos dados transformados e, em

seguida, a transformada reversa. Na krigagem lognormal, a correção do efeito de

suavização é feita de modo a reproduzir o histograma dos logaritmos dos dados a

fim de garantir o não enviesamento dos valores após a transformada reversa.

Page 17: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

4

2. Krigagem Ordinária e Suas Medidas de Erro

A krigagem é um método consagrado para a estimativa de pontos não

amostrados. Geralmente, essa técnica é aplicada na estimativa de malhas regulares,

sejam em 2 ou 3 dimensões. A partir destes valores, pode-se gerar curvas de

isovalores, as quais são utilizadas para analisar a distribuição espacial de poluentes

ou concentrações minerais. Além disso, a krigagem foi projetada para fazer a

estimativa em blocos de cubagem, que é uma feição única entre os estimadores. Os

blocos de cubagem são estimados com base na Teoria da Combinação das

Estimativas de Krigagem (Journel & Huijbregts, 1978).

Essa técnica é bastante difundida, pois é precisa no sentido de um estimador

exato, bem como a estimativa é feita com mínima variância de erro.

Segundo Armstrong (1998), o estimador da krigagem ordinária é descrito como:

( ) ( )∑=

=n

iiiko xzxz

10

* λ

onde os ponderadores { }nii ,1, =λ são obtidos da resolução de um sistema linear de

equações, sistema de krigagem, construído com a finalidade de não enviesar a

estimativa (condição de não enviesamento) e com a variância de krigagem mínima.

A solução para os ponderadores da krigagem ordinária é obtida conforme

segue:

( ) ( )

( ) ( )

( )

( )

=

1,

,

0111,,

1,,

0

011

1

111

xx

xx

xxxx

xxxx

nnnnn

n

γ

γ

µλ

λ

γγ

γγ

MM

LL

MMOML

Brooker (1979) resume os procedimentos para se realizar a krigagem:

- análise estrutural para determinação do semivariograma;

- seleção de amostras para serem utilizadas na avaliação de um bloco;

- cálculo do γ do sistema de equações de krigagem;

- solução do sistema de equações visando a obtenção dos melhores

ponderadores e uso destes resultados para calcular o bloco a ser estimado e

a variância de estimativa associada.

Page 18: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

5

A possibilidade de calcular variância de estimativa associada tornou a

krigagem a primeira técnica a gerar medidas do grau de incerteza. Segundo

Goovaerts (1997), a abordagem tradicional para a modelagem da incerteza

associada a um ponto desconhecido consiste em calcular por krigagem o valor do

ponto e associar à estimativa o erro de variância conforme:

( )∑=

+−=n

ioiiko xx

1

2 µγλσ

Este erro é então combinado à estimativa para obter um intervalo de

confiança tipicamente Gaussiano centrado no valor estimado. Ainda segundo

Goovaerts (1997), o cálculo é direto, uma vez que requer apenas uma medida da

correlação entre os valores de Z(x).

Dentro deste contexto, é necessário ressaltar que na década de 60, os

métodos de cálculo de reserva por polígonos ou por inverso do quadrado da

distância não permitiam determinar o erro associado a estes métodos. Esta, talvez,

tenha sido a razão pela popularização da krigagem ordinária que ocorreu nas

décadas seguintes.

No passado, o erro de krigagem foi utilizado para aferir a qualidade da

estimativa e também para fins de classificação de reservas.

A variância de krigagem foi por muitos anos considerada uma medida

confiável da incerteza associada à estimativa. Porém, este modelo de erro requer,

segundo Isaaks & Srivastava (1989), que rigorosamente se assuma duas hipóteses:

− o erro de estimativa é modelado como a realização de uma função aleatória

Gaussiana de erro;

− a variância de krigagem é independente dos dados.

Assumir a primeira hipótese implica na simetria da distribuição local dos erros.

Como a krigagem tende a superestimar valores baixos e subestimar valores altos

(efeito da suavização em torno da média), localmente, o sinal da assimetria pode ser

semelhante àquele encontrado no histograma dos dados, porém quando se analisa

o conjunto total do domínio esta assimetria tende a sumir. A segunda hipótese

requer que a variância dos erros seja independente dos dados e, portanto,

dependente apenas do arranjo espacial que eles possuem (homoscedasticidade) o

que na prática é quase impossível. Portanto, como se pôde ver, a variância de

krigagem pode não ser uma medida de incerteza segura.

Page 19: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

6

De mesma forma, Journel & Rossi (1989) mostraram que a variância de

krigagem é apenas um índice de configuração espacial dos dados utilizados na

estimativa, restrito a uma janela cujo centro é o ponto a ser estimado e cuja média é

constantemente recalculada para este espaço limitado, não representando a média

global.

Assim, Yamamoto (1991) propôs uma medida alternativa de incerteza, a qual

denominou variância de interpolação, esta se mostrou mais precisa que a variância

de krigagem.

Armstrong (1994), ao analisar a falta de avanços para o cálculo e avaliação

de recursos na geoestatística, chama atenção para o fato de ainda se usar a

variância de krigagem na análise de reservas, uma vez que este método se

comprovou pouco preciso para se estabelecer intervalos de confiança, essenciais na

classificação de reservas. Essa autora exemplifica bem o caráter homoscedástico da

variância de krigagem (Figura 1), em que dois blocos com valores vizinhos diferentes

poderiam apresentar o mesmo valor de variância de krigagem, pois a configuração

espacial dos pontos é a mesma.

Figura 1: Estimativa de blocos a partir da mesma configuração de dados (segundo Armstrong, 1994). Em (A), a variância do erro deveria ser menor que em (B) por causa de dados mais consistentes.

A variância de interpolação é calculada conforme:

( ) ( )[ ]∑=

−=n

iokoiio xzxzs

1

2*2 λ

onde 20s é a variância de interpolação, { }nii ,1, =λ são os pesos de krigagem,

( ){ }nixz i ,1, = são os n pontos vizinhos ao ponto não amostrado ox e ( )oko xz* é a

estimativa por krigagem ordinária.

Page 20: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

7

Desta forma, nota-se que, diferentemente da variância de krigagem, a

variância de interpolação é heteroscedástica, ou seja, dependente da vizinhança

local. Portanto, aumentará com a dispersão dos n pontos vizinhos. Além disso,

reconhece o efeito proporcional quando os dados seguem uma distribuição

lognormal.

A equação proposta é uma adaptação direta do cálculo da variância

comumente usado na estatística onde a função densidade de probabilidade, no

ponto xi, foi substituída pelos pesos de krigagem (Yamamoto, 2000).

Yamamoto (2000) sugere o uso da variância de interpolação, comprovando

tratar-se de uma medida de erro confiável, o que fica evidente quando demonstra

que em distribuições com assimetrias positivas, a variância de interpolação é

proporcional aos dados estimados. Além disto, no mesmo trabalho, demonstra a

inadequação do uso da variância de krigagem como medida de erro confiável

(Figura 2).

Figura 2: Diagrama de dispersão entre o desvio padrão de interpolação e estimativas para a distribuição lognormal (Yamamoto 2000).

Rocha & Yamamoto (2001) demonstraram que para distribuições com

assimetria negativa, conhecida como lognormal invertida, a variância de interpolação

é inversamente proporcional aos valores estimados (Figura 3). Na realidade, a

distribuição lognormal invertida é fechada à esquerda e à direita, pois o mínimo é

zero ou qualquer valor maior que isso e o máximo é sempre o teor máximo,

determinado estequiometricamente (no caso mencionado o teor de Feo em

Page 21: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

8

hematitas é no máximo 68,4%). Comprovando que variância de interpolação é

heteroscedástica.

Figura 3: Diagrama de dispersão entre o desvio padrão de interpolação e estimativas para a distribuição lognormal invertida (Rocha & Yamamoto, 2001).

Para distribuições simétricas não há relação linear como observada nos

outros tipos de distribuição estatística.

Resumindo, as correlações entre o desvio padrão de interpolação e as

estimativas vão depender do tipo de distribuição estatística (Figura 4). Assim, se a

distribuição dos dados for lognormal, então a correlação será positiva (Figura 4a),

para uma distribuição normal, não há correlação (Figura 4b). Quando a distribuição

dos dados seguir o modelo lognormal invertido, a correlação será negativa (Figura

4c).

Figura 4: Modelos de correlação entre o desvio padrão de interpolação e estimativas da krigagem ordinária para distribuição lognormal (a), normal (b) e lognormal invertida (c).

Page 22: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

9

Trata-se de uma verificação importante, pois mostra uma relação direta da

distribuição estatística com o modelo de correlação entre o desvio padrão de

interpolação e a estimativa de krigagem ordinária.

Na realidade, o grande desafio é associar à estimativa o erro de interpolação,

de tal modo a obter estimativas confiáveis de reservas minerais e/ou avaliações

confiáveis da dispersão de poluentes em um sítio contaminado.

Page 23: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

10

3. O efeito de suavização da krigagem ordinária

A geoestatística apresentou nas últimas décadas um grande avanço,

marcado principalmente pela introdução dos métodos de simulação estocástica. A

razão para essa eclosão de métodos de simulação estocástica reside no problema

da suavização das estimativas obtidas via krigagem ordinária. Na verdade, não

apenas a krigagem ordinária está sujeita a esse efeito, mas também qualquer

método baseado na média ponderada, tais como: inverso da distância, equações

multiquádricas, etc.

O efeito de suavização da krigagem ordinária é bem conhecido dos

geoestatísticos, pois os valores calculados não reproduzem o histograma amostral,

ou seja, não reproduzem as características da amostra utilizada para se realizar as

estimativas. Além disso, quando o histograma não é reproduzido, o semivariograma

amostral também não é reproduzido. Observe-se que somente a reprodução do

histograma garante a reprodução do semivariograma. Na literatura corrente, a

reprodução do histograma e do semivariograma amostrais é conhecida como

precisão global. A precisão local se refere aos valores estimados em relação à

vizinhança utilizada. Portanto, idealmente o objetivo seria obter estimativas que

apresentassem tanto precisão local (inerente à krigagem ordinária), como também

precisão global (inerente aos métodos de simulação estocástica).

Olea (1991), em sua definição de krigagem, menciona que a continuidade

espacial da superfície krigada é maior do que a realidade devido ao efeito de

suavização, inerente ao seu estimador. Em muitas aplicações este efeito pode

inviabilizar o uso da krigagem.

Goovaerts (1997) apresenta o conjunto de estimativas de krigagem

( ){ }Axxz ∈,* do atributo z na área de estudo A , no qual a estimativa ( )xz *

considerada separadamente (independentemente dos pontos vizinhos) é a melhor

em termos de quadrados mínimos, pois a variância de erro ( ) ( ){ }xZxZVar −* é

mínima. Porém, segundo o autor, o mapa de tais estimativas locais pode não ser tão

bom, quanto às estimativas. Para o autor, algoritmos de interpolação tendem a

suavizar detalhes locais da variabilidade espacial do atributo.

Como se vê, a seguir, este problema merece destaque na literatura desde a

década de 1970, mais especificamente no livro do Journel & Huibregts (1978). A

Page 24: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

11

revisão bibliográfica do tema mostra como o efeito de suavização foi descoberto e as

várias aproximações propostas para a sua correção.

No campo de avaliação de recursos minerais, percebe-se uma redução da

variância dos blocos calculados em relação à variância amostral. Journel &

Huijbregts (1978) discutem esse déficit de variância em termos de relações de

suavização. A demonstração deste fenômeno dá-se na análise das variâncias de

krigagem local e krigagem global. Para esses autores, a variância dos dados reais

( )GvD /2 e a variância dos dados estimados ( )GvDK /*2 podem ser descritas por

alguma das duas relações, chamadas “relações de suavização” que seguem:

Se as dimensões de um campo G são comparativamente grandes e se as

informações disponíveis são suficientes para fornecer a variância de estimativa

global KG2δ de uma unidade v , então (segundo Journel e Huijbregts, 1978) tem-se a

primeira relação de suavização:

( ) ( ) µδ 2/*/ 222 −+≈ KvK GvDGvD

ressalta-se que a variância de estimativa global KG2δ é desprezível em relação à

média da variância de estimativa local Kv2δ , se os procedimentos de krigagem que

geram KvZ * pudessem ser assimilados a um procedimento de krigagem, ou seja, se

todos os dados de G estivessem disponíveis para realizar a krigagem (dado

exaustivo), então pode-se derivar a segunda relação de suavização:

( ) ( ) ( ) 222222 /*/*/ KvKKGKvK GvDGvDGvD δδδ +≈−+=

onde ( )GvD /2 é a variância de dispersão dos teores reais de ( )xZ v na área G e

( )GvDK /*2 é a variância de dispersão dos valores krigados ( )xZKv* .

A média da variância da unidade v pode ser obtida por:

∑∑==

−==

N

iKvv

N

iKvKv

iii

ZZENN 1

2

1

22 *11

δδ

Pois há N unidades em v , na área G. Se a malha de dados de G não for regular,

então a variância de krigagem local será diferente.

Page 25: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

12

Onde [ ]{ }22 *GGKG ZZE −=δ representa a variância de krigagem, ou seja,

variância do teor médio GZ na área G, no caso de um sistema completo de

krigagem, tem-se KGZ * ,o estimador global krigado, como a média dos N

estimadores locais krigados iKvZ * , ou seja,

∑=i

KvKGi

ZN

Z *1

* .

A segunda relação de suavização implica no efeito de suavização:

( ) ( )GvDGvDK //* 22 ≤ .

Ou seja, que a variância de dispersão dos valores estimados é sempre menor

que os valores reais, a menos que a variância de krigagem seja igual a zero. Em

uma situação ideal, a variância de dispersão seria idêntica ao valor real.

Segundo Pan (1998), a relação de suavização depende do valor médio das

variâncias de krigagem. E a redução de variabilidade se deve principalmente ao

efeito da informação, ou seja, este efeito ocorre quando a informação é insuficiente

para que haja redução do desvio entre o valor estimado e o valor real. Assim,

quando o estimador por vizinhos próximos usa apenas uma amostra para cada

bloco, a tendência é de exagerar a variabilidade do teor do bloco e superestimar a

seleção. Por outro lado, quanto maior o número de vizinhos próximos usados na

estimativa, maior será a redução da variância, sendo maior o efeito de suavização

A Figura 5 mostra uma ilustração do efeito de suavização. O histograma dos

valores de blocos é mais estreito do que os valores reais. As áreas hachuradas nos

dois histogramas representam a porção de blocos que deve ser selecionada para

um dado teor de corte. Quando o teor de corte é maior que a média, a seleção de

blocos, baseada neste valor de corte, é geralmente menor do que a seleção nos

valores reais ou exaustivos. O oposto ocorre quando o teor de corte é menor que a

média (Pan, 1998).

Page 26: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

13

Figura 5: Efeito de suavização mostrado na redução de variância na distribuição de blocos estimados em relação à distribuição de valores reais.

Para Journel & Huijbregts (1978) o efeito de informação torna-se mais

problemático quando se trabalha com conjuntos de dados de alto teor de corte

(teores de corte maiores que a média amostral).

A precisão da estimativa de reservas poderia ser medida através da diferença

entre as médias de ( )xZ * e de ( )xZ . O critério básico para a estimativa é o não

enviesamento condicional (Pan, 1998):

( ) ( )( ) ( )xZxZxZE ** =

A condição de não enviesamento condicional indica que o valor médio de

uma população estatisticamente truncada para um dado teor de corte deve ser não

enviesada. Devido a possibilidade de o histograma se diferenciar substancialmente

dos valores reais, a condição de não enviesamento condicional pode não ser

assegurada.

A krigagem sempre foi considerada um método que apresenta enviesamento

condicional (David et al.,1984). Isso fica evidente na avaliação econômica de

jazidas, pois, ao se focar na parte mais rica da mineralização, deixa-se de estudar a

função aleatória da variável ( )xZ e sim, a função aleatória de ( )xZ condicionada à

inequação ( ) 0zxZ ≥ , ou seja, no que é maior ou igual ao teor de corte (Guertin,

1984).

Segundo Isaaks & Srivastava (1989), ao separar-se os dados estimados

através de um teor de corte, obtendo-se um grupo de alto e outro de baixo teor,

Page 27: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

14

deveria-se esperar que o enviesamento fosse próximo de zero para ambos os

grupos, porém, este tipo de comportamento é muito difícil de ocorrer. Um grupo de

dados que seja condicionalmente não enviesado será, também, globalmente não

enviesado. Porém, o que geralmente ocorre é que mesmo conjuntos de dados não

enviesados globalmente serão superestimados ou subestimados para alguma faixa

de valor. Os autores propõem que se verifique o enviesamento condicional ao se

plotar os erros através dos valores estimados.

Guertin (1984) chama atenção para a ocorrência do enviesamento

condicional associada à seleção errônea de blocos de lavra, como mostra a Figura

6.

Figuras 6: Diagrama de dispersão entre o valor real (Zv) e o valor estimado (Zv*) a um teor de corte z0 mostrando a porção de unidades erroneamente selecionadas e a porção de unidades erroneamente descartadas. (modificado de Guertin, 1984)

A Figura 7, extraída de Pan (1998), mostra um diagrama de dispersão entre

valores estimados e valores exaustivos, sendo que neste estudo, os valores de blast

constituem os valores exaustivos e a estimativa se dá a partir de dados exploratórios

(furos de sonda). Neste diagrama, pode-se verificar como se dá o enviesamento

condicional devido ao efeito de suavização da krigagem ordinária, ou seja, os teores

baixos são superestimados, enquanto os teores elevados são subestimados.

Page 28: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

15

Figura 7: Modificado de Pan (1998).

O não enviesamento condicional requer que o coeficiente da reta de

regressão seja igual a 1, porém, na prática, a reta de regressão tende a se desviar

do ângulo de 45º. Para efeito de análise, um teor de corte pré-definido foi aplicado

ao conjunto de dados e separou-se o diagrama de dispersão em quatro áreas. A

área A representa a seleção de blocos de minério correta, a porção B representa a

rejeição de blocos de estéril correta, enquanto as porções C e D representam a

seleção errônea de blocos de minério e de estéril, respectivamente.

Na prática, dificilmente conhecemos os valores reais de uma ocorrência

mineral ou fenômeno em estudo. Assim, temos que conduzir as inferências a partir

do dado amostral. A amostra é, portanto, a única informação disponível ao estudo. O

trabalho original de Yamamoto (2005) parte dessa premissa, ou seja, tudo é feito

com base no conhecimento das propriedades da amostra. O algoritmo de pós-

processamento desenvolvido por Yamamoto (2005) será descrito no item 5.

Entretanto, é importante entender como ocorre o déficit de variância, devido ao fato

da variância dos valores estimados pela krigagem ordinária ser sempre menor que a

variância amostral. Assim, Journel et al. (2000) demonstraram que para a krigagem

simples, o déficit de variância é igual à variância de krigagem:

( )[ ] ( )[ ] ( )xxZVarxZVar SKSK2* σ=−

Page 29: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

16

Por outro lado, Yamamoto (2000) demonstra que para a krigagem ordinária, o

déficit de variância pode ser calculado como:

( )[ ] ( )[ ] ( ) 022* ≥+=− µσ xxZVarxZVar OKOK

Ou seja, o déficit de variância para a krigagem ordinária é igual à variância de

krigagem mais duas vezes o multiplicador de Lagrange. Portanto, o déficit de

variância é sempre positivo, pois a variância a variância de krigagem somada de

duas vezes o multiplicador de Lagrange deve resultar sempre positivo. Yamamoto

(2000) demonstrou que o déficit de variância também poderia ser expresso em

termos da variância de interpolação:

( )[ ] ( )[ ] { } 02* ≥=− oOK SExZVarxZVar

A segunda expressão para o déficit de variância mostra que a média da

variância de interpolação é igual à diferença entre as variâncias amostral e estimada

pela krigagem ordinária. Sem dúvida, a média da variância de interpolação é sempre

positiva, pois os pesos da krigagem ordinária são pós-processados para serem

positivos e a expressão da variância de interpolação é uma somatória ponderada

das diferenças ao quadrado entre o valor estimado e os valores dos pontos vizinhos.

Page 30: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

17

4. Simulação estocástica

As técnicas de simulação estocástica foram concebidas para resolver o

problema da suavização da krigagem ordinária. A simulação estocástica permite

gerar imagens equiprováveis de um fenômeno regionalizado. Estas imagens

podem honrar os dados de entrada (simulação condicional) ou não (simulação

não condicional).

Goovaerts (1997) mostra as diferenças conceituais entre a simulação

estocástica e a estimativa. Ao discutir a “Estimativa versus Simulação”, o autor

expressa o sentimento de cerca de duas décadas de tentativas de se definir um

método definitivo de estimativa de recursos minerais.

Hohn (1999) propõe uma subdivisão dos métodos de simulação

estocástica (Tabela 1).

Tabela 1: Subdivisão dos métodos de simulação estocástica, segundo Hohn

(1999).

Gaussiana seqüencial Métodos seqüenciais

Indicadora seqüencial Condicional

Decomposição LU

Simulação

estocástica

Não-condicional Bandas rotativas

A simulação estocástica condicional pode ser subdividida, segundo Hohn

(1999), em: métodos seqüenciais e decomposição LU. Como os métodos de

simulação não são objetivos deste trabalho, apenas os métodos seqüenciais

serão considerados.

Segundo Deutsch & Journel (1992), a simulação condicional foi

originalmente desenvolvida para corrigir o efeito de suavização mostrado em

mapas produzidos através do algoritmo de krigagem.

Journel & Xu (1994) propuseram um algoritmo de pós-processamento que

garante a reprodução do histograma. Entretanto, este algoritmo implicava

também na perda da precisão local. Aliás, o grande problema nesse campo era

o efeito colateral de uma determinada correção, ou seja, ao corrigir as

estimativas para reprodução do histograma, havia perda da precisão local.

Page 31: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

18

Segundo Caers (2003), o principal defeito da krigagem, que leva à

suavização, está no fato que os pontos não amostrados são estimados

independentemente, ou seja, o valor estimado em um ponto xo, não leva em

consideração um valor previamente estimado em xo’. Segundo esse autor, esta

é a principal razão pela qual a krigagem não reproduz a associação espacial

correta, como descrita pelo semivariograma. Para garantir que a textura

geológica seja reproduzida, é necessário definir o modelo de probabilidade

conjunta das propriedades em todos os pontos da malha, não individualmente

como é feito pela krigagem (Caers, 2003).

Nos métodos seqüenciais, o valor simulado em cada ponto xo, do domínio

a ser simulado, é retirado de uma função de distribuição de probabilidade, a qual

é computada usando tanto os dados reais como também os dados previamente

simulados na vizinhança do ponto xo (Hohn, 1999). A seqüência dos nós da

malha regular a ser simulada, é definida aleatoriamente, que resulta no chamado

passeio aleatório (Deutsch & Journel, 1992). Segundo Hohn (1999), o que difere

nos métodos seqüenciais, é a maneira como a função de distribuição de

probabilidade é calculada. No caso da simulação gaussiana seqüencial, a

distribuição de probabilidade é construída a partir da estimativa de krigagem

simples e da sua variância de krigagem de dados padronizados. Observe-se que

a simulação gaussiana seqüencial requer que os dados sejam transformados

para o domínio da distribuição normal. A amostragem da distribuição de

probabilidade é baseada no método de Monte Carlo, que se baseia na geração

de números aleatórios, com distribuição uniforme no intervalo [0,1]. Na

realidade, esse procedimento de amostragem aleatória garante que as

realizações sejam equiprováveis.

Assim, as simulações seqüenciais geram para cada nó da malha regular

um valor que é resultado da estimativa local mais ou menos um ruído branco

derivado da variância de krigagem simples. A adição ou subtração de um ruído

branco garante a reprodução do histograma e consequentemente da

variabilidade espacial descrita pelo semivariograma. Entretanto, este mesmo

procedimento é responsável pela perda da precisão local, pois a estimativa da

Page 32: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

19

krigagem simples já apresenta certa precisão local. O grande problema da

simulação estocástica é a adição ou subtração de uma quantidade aleatória, que

é responsável pela perda da precisão local. Nesse sentido, vários trabalhos

procuraram corrigir esta falha dos métodos de simulação estocástica, como se

vê a seguir.

No campo de simulação seqüencial, os métodos propostos procuraram

adicionar precisão local às múltiplas realizações da simulação. Na geoestatística

usa-se o termo precisão global para referir-se à reprodução da textura geológica,

enquanto a precisão local refere-se à minimização da variância do erro baseada

no modelo de covariância.

Precisão local e precisão global são propriedades aparentemente

conflitantes. A variabilidade espacial suavizada da krigagem não pode ser

correlacionada à variabilidade espacial não suavizada de simulações

geoestatísticas (Caers, 2000).

Goovaerts (1998) propôs incorporar precisão local à simulação

estocástica, mostrando que se pode obter como resposta uma diminuição nos

erros de predição, enquanto se reproduz a variância espacial dada pelo

semivariograma. Segundo o autor, para um mapa ter a precisão local da

krigagem e a não suavização da simulação tem-se que achar um equilíbrio entre

parâmetros globais e parâmetros locais. Este equilíbrio pode ser obtido usando o

simulated annealing e uma combinação ponderada de componentes que medem

os desvios das feições globais e locais de interesse.

Caers (2000) propôs a adição de precisão local aos resultados de

simulação e investigou o quanto se perde de precisão global. O autor propôs um

método rápido de simulação seqüencial que pudesse honrar o variograma e o

histograma sem que fosse necessário assumir as propriedades multivariadas

Gaussianas.

Segundo Journel (1994), a simulação seqüencial não necessariamente

deve ser limitada à hipótese gaussiana multivariada, a distribuição condicional

pela qual os valores devem ser definidos pode ser de qualquer tipo, desde que

Page 33: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

20

sua média e variância sejam semelhantes à média e variância da krigagem

simples.

Desta forma, para Caers (2000), o uso de outras distribuições aumentaria

a continuidade dos extremos se comparados com a propriedade de máxima

entropia das simulações gaussianas, que apresentam máxima descontinuidade

nos extremos. Além disso, o método de simulação proposto pelo trabalho

também tem como objetivo adicionar precisão local a simulações condicionais.

Com relação ao efeito de suavização, Caers (2000) observa que quanto mais

largo o tipo de distribuição condicional, maior a suavização. Neste trabalho, este

autor também apresenta a krigagem seqüencial, que usa a propriedade da

simulação de variância zero para cada nó e usa dados previamente simulados

que são considerados como “dados sólidos”. A partir da simulação por krigagem

seqüencial, considerada globalmente precisa, o autor adiciona precisão local

através de uma técnica de simulação seqüencial direta com tipo de distribuição

local:

( ) ( )( )

−−

=padeprobabilidcomzuf

padeprobabilidcomzzzuF SK

1;;

1

Onde ( )SK

zz *−δ representa o impulso de Dirac na média da krigagem seqüencial.

O p é o parâmetro de julgamento de Bernoulli: a estimativa de krigagem

seqüencial SK

z * é retida a partir da probabilidade p; caso contrário o valor é

traçado a partir da densidade );(1 zuf , que pode ser gerada a partir da

distribuição condicional escolhida para representar os dados. Observe-se que a

krigagem seqüencial é usada para de obter a estimativa de krigagem, ou seja, a

estimativa de krigagem será calculada a partir de nós estimados/simulados

previamente (Caers, 2000). O resultado do trabalho indica uma boa reprodução

do variograma, principalmente ao se usar o critério de probabilidade para

escolha da distribuição local ( )zuF ; . Mostrando que a reprodução do variograma

pode ser uma tarefa simples em simulações seqüenciais. No entanto, conclui

Page 34: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

21

também que é muito difícil honrar o variograma em distribuições com assimetrias

positivas. Ou seja, distribuições com valores extremos isolados, muito comuns

no cálculo de reservas minerais.

Page 35: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

22

5. Correção do efeito de suavização da krigagem ordinaria

Mesmo com o aumento da procura por técnicas de simulação seqüencial,

alguns continuaram tentando melhorar as técnicas da geoestatística linear, dentre as

quais a krigagem ordinária. Estes trabalhos apresentam como característica básica o

pós-processamento através de parâmetros obtidos a partir do déficit de variância,

entre eles Journel & Xu (1994), Guertin (1984), Olea e Pawlowsky (1996), Pan

(1998), Journel et al. (2000) e Yamamoto (2005).

O uso de um modelo de distribuição binomial isofatorial proposto por Guertin

(1984) consiste em uma função não linear de correção

*ZK cuja proposta é

transformar o estimador linear *Z em um estimador não enviesado ( )*** ZKZ =

com variância de estimativa condicional reduzida. A representação isofatorial é

baseada na distribuição binomial de Z e *Z . Guertin (19484) apresenta a função

de correção:

( )( ) ( ) *** xZxZK =

a ser aplicada a qualquer estimativa linear ( )*xZ , transformando-a em um estimador

condicionalmente não enviesado ( ) **xZ . A determinação desta função de correção

é feita com base na estimativa da curva de regressão do dado real com os dados

estimados. No entanto, o valor real pode não estar disponível. A forma proposta pelo

autor é a definição de um modelo de distribuição bivariado de (Zv, Zv*) consistente

com a variância de dispersão de Z(v), com ao covariância e também, consistente

com o histograma de Z(v)* deduzido a partir das estimativas zvi*. A derivação desta

função de correção Kv é baseada na representação isofatorial da probabilidade do

modelo de distribuição de Zv e Zv*.

Como resultado tem-se a transformação de uma distribuição com

enviesamento condicional (Figura 8) em uma distribuição onde há um maior balanço

entre o volume de blocos erroneamente rejeitados e o volume de blocos

erroneamente selecionados. (Figura 9).

Page 36: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

23

Figura 8: Diagrama de correlação entre Z(x) e Z*(x). Note-se o enviesamento condicional, a um teor de corte z0, a proporção de unidades erroneamente rejeitadas é muito maior que a proporção de blocos erroneamente selecionados (Guertin, 1984).

Figura 9: Diagrama de correlação entre Z(x) e Z**(x), sendo Z**(x) a variável estimada corrigida. Note que o enviesamento condicional é igual a zero e que a proporção de unidades erroneamente rejeitadas é, a grosso modo, semelhante à proporção de blocos erroneamente selecionados (Guertin, 1984).

Olea & Pawlowsky (1996) foram pioneiros ao estabelecer os parâmetros para

a correção das estimativas através dos dados gerados pela validação cruzada,

respeitando assim distribuições amostrais diferentes. A validação cruzada dos pares

( ( )xZ * , ( )xZ ), segundo esses autores, gera o modelo linear:

( ) ( ) bxaZxZ +=*

Page 37: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

24

Os coeficientes a e b são utilizados para o pós-processamento dos dados,

que preserva a propriedade de interpolação da krigagem, ou seja, em termos de

interpolador exato, Olea & Pawlowsky (1996) utilizaram:

( ) ( ) ( )

−∈∈

=a

bxZxZZxZ x

c

**** 2

max

2

onde 2x∈ é a variância de krigagem e 2

max∈ é o valor máximo da variância de

krigagem. Os resultados da krigagem ordinária e da krigagem compensada são

apresentados nas Figuras 10 e 11.

Figura 10: Imagem gerada por krigagem ordinária em dados de permeabilidade em arenito (Olea & Pawlowsky, 1996)

Figura 11: Imagem gerada por krigagem compensada em dados de permeabilidade em arenito (Olea & Pawlowsky, 1996)

Page 38: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

25

É importante notar que este método considera, indiretamente, a posição

espacial das amostras, através da relação entre as variâncias de krigagem local e

máxima. Desta forma, a correção do déficit de variância ocorre, porém o modelo de

covariância não é completamente honrado. Os próprios autores reconheceram que o

método proposto não reproduz a covariância amostral, reproduzindo uma

covariância intermediária entre a krigagem ordinária e a simulação seqüencial. De

qualquer forma, a idéia de se utilizar a validação cruzada é boa e deve ser

considerada em estudos geoestatísticos, pois permite derivar, em cada ponto

amostral, o erro verdadeiro de estimativa. Evidentemente, o erro verdadeiro de

estimativa não depende somente do método utilizado, mas também da vizinhança

(se pequena ou grande) e, sobretudo, da variabilidade dos dados. Os fenômenos

naturais podem apresentar pequena ou grande variabilidade, que deve influenciar a

performance dos métodos de interpolação.

Pan (1998) propõe a redução do efeito de suavização através da correção da

variância. A medida do efeito de suavização é feito pela comparação entre as

distribuições dos valores estimados e dos valores reais ou exaustivos. Como segue:

( ) ( )GvDGvDf v2*

2 /=

onde vf é o efeito de suavização. A natureza do efeito de suavização é avaliada

como:

1<vf significa sub-suavização;

1=vf significa suavização correta;

1>vf significa super-suavização.

Se 1>vf , a estimativa v

Z * subestima a freqüência tanto de valores baixos,

quanto de valores altos. Se 1<vf , a estimativa v

Z * superestima a freqüência tanto

de baixos, quanto de altos valores. Ambas as situações levam ao enviesamento da

seleção de blocos. (Figura 7).

Pan (1998) propõe a redução do efeito de suavização através de uma técnica

baseada em um modelo de transformação linear para correção da rotação baseado

em vf :

( )vvvvv

ZZZfY **** +−=

Page 39: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

26

onde v

Z * é o teor médio dos valores dentro do envelope mineralizado. Este método

é definido como correção de rotação condicional, pois apenas os blocos dentro do

envelope de minério são considerados. Se não houver um envelope de minério

predefinido, a correção pode ser condicionada aos parâmetros de teor que separam

minério de rocha estéril, o teor de corte.

Uma das aplicações práticas deste método é a análise do grau de suavização

a partir do diagrama de correlação entre Z(x) e Z*(x), possibilitando ao usuário um

parecer quanto a super-estimativa ou a sub-estimativa de blocos, facilitando o

planejamento de lavra.

Journel et al. (2000) propõem uma solução baseada no algoritmo de pós-

processamento espectral de Yao, que se provou eficiente na reprodução do

semivariograma. Embora a base inicial do trabalho de Yao (1998) tenha sido a

simulação espectral condicional, a técnica consiste em realizar o pós-processamento

iterativo de uma imagem que possua, por exemplo, precisão local e introduzir as

amplitudes espectrais correspondentes ao modelo de covariância. Isso aplicado a

uma imagem krigada, ao contrário da simulação seqüencial, pode gerar uma única

imagem representativa do universo amostral que apresenta as características

originais da imagem, enquanto obedece ao modelo de covariância. A idéia desses

autores de se fazer a correção do modelo de covariância baseado no pós-

processamento espectral é merecedora de crédito, pelo seu caráter inédito na

geoestatística. Entretanto, ao corrigir o modelo de covariância, os autores

concluíram que a precisão local era perdida no processo.

Dentre todas as tentativas para resolver o problema da correção do efeito de

suavização da krigagem ordinária, destaca-se aquela proposta por Yamamoto

(2005), a qual foi baseada na validação cruzada, conforme proposta de Olea &

Pawlosvsky (1986). O algoritmo de Yamamoto (2005) é executado em quatro

passos:

a) processa-se a validação cruzada a fim de obter para cada ponto de dado o desvio

padrão de interpolação e o erro verdadeiro. Essas variáveis são transformadas em

outra, a qual foi denominada de número de desvios padrão de interpolação:

0≠−

= oo

S ScomS

eiroErroVerdadN

o

Page 40: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

27

Onde ( ) ( )[ ]oo xzxzeiroErroVerdad −= ∗ . Segundo Yamamoto (2005),

oSN pode ser tanto positivo como negativo.

Assim, o sinal negativo faz a compensação do efeito de suavização, de acordo com

a seguinte lógica. Se o erro verdadeiro é positivo, isso significa que o valor estimado

é maior que o valor real e, portanto, uma quantidade deve ser subtraída. Por outro

lado, se o erro verdadeiro é negativo, significa que o valor estimado é menor que o

valor real e, assim, uma quantidade deve ser adicionada. Observe-se que aqui

reside a principal diferença do método de Yamamoto (2005) com os métodos de

simulação estocástica, pois os sinais da correção são definidos aleatoriamente

(método de Monte Carlo). Enquanto Yamamoto (2005) subtrai uma quantidade

quando o valor estimado é maior (geralmente para valores baixos) e adiciona uma

quantidade quando o valor estimado é menor (geralmente para valores altos), os

métodos de simulação não consideram isso e simplesmente decidem o sinal

aleatoriamente. A primeira razão da perda da precisão local dos métodos de

simulação estocástica, seria então, devida à escolha do sinal para adicionar uma

quantidade de correção.

b) no segundo passo processa-se a krigagem ordinária para calcular o número de

desvios padrão de interpolação oSN em todos os nós da malha regular;

c) processa-se novamente a krigagem ordinária para calcular as estimativas ( )oOK xz ∗

em todos os nós da malha regular. Neste mesmo processo, os valores de desvios

padrão de interpolação são calculados oS . Segundo Yamamoto (2007, Com. Verbal),

os passos b) e c) são calculados num único processamento, onde a variável desvio

padrão de interpolação é introduzida como uma variável secundária.

d) realiza-se o pós-processamento para correção das estimativas de krigagem

ordinária da seguinte forma:

( ) ( ) ooSOKoOK SxNzxzo

*+= ∗∗∗

Page 41: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

28

Segundo Yamamoto (2007, Com. Verbal), a quantidade de correção

( ) ooS SxNo

* pode ser excessiva fazendo com que o valor corrigido ( )oOK xz ∗∗ caia fora

dos valores mínimo e máximo dos pontos de dados utilizados para calcular a

estimativa ∗OKz . Ainda segundo esse autor, apenas uma pequena porcentagem das

quantidades de correção apresenta esse problema, o qual se deve, principalmente,

ao fato da interpolação da variável oSN em todos os nós da malha regular e,

consequentemente, dos erros de estimativa decorrentes desse processo.

Assim, é preciso verificar para cada valor corrigido, se o mesmo está dentro

ou fora do intervalo de valores da vizinhança utilizada. Os valores mínimo e máximo

são determinados:

( ) ( )[ ]nixzxz io ,1,minmin ==

( ) ( )[ ]nixzxz io .1,maxmax ==

Se os valores corrigidos estiverem fora do intervalo permitido [zmin, zmax],

então há a necessidade de se substituir a quantidade de correção por uma outra

como segue:

( ) ( ) ( ) ( ) ( ) fatordeltaxzentãoxzxzouxzxzSe oOKooOKooOK .**max

**min

** +><

Onde ( ) ( )ooOK xzxzdelta min* −= se o sinal de ( )oS xn

o é negativo; e

( ) ( )oOKo xzxzdelta *max −= se o sinal de ( )oS xn

o é positivo; o fator é um número real

maior ou menor que um, que aumenta ou diminui a quantidade de correção.

Segundo Yamamoto (2007, Com. Verbal), o fator é determinado de tal modo a fazer

com que a variância dos valores corrigidos seja igual à variância amostral. Ainda

conforme esse autor, na versão inicial do programa CROSSORDKRIG2, o fator era

aplicado somente aos pontos que caíssem foram do limite permitido, que poderia

provocar defeitos na imagem pós-processada. Assim, esse autor propôs uma

atualização do algoritmo original (Yamamoto, 2007) com a aplicação do fator não

somente aos valores corrigidos fora do limite permitido, mas também a todos os

valores corrigidos:

Page 42: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

29

( ) ( ) ( )( ) ( )

+=

+=

fatordeltaxzxz

fatorsxnxzxz

oOKoOK

ooSoOKoOK o

.***

***

A quantidade de correção seja ( ) ooS sxno

ou delta foi substituída por uma nova

variável aleatória denominada ( )oNS xzo

* , fazendo com que as equações anteriores

sejam representadas como (Yamamoto, 2007):

( ) ( ) ( ) fatorxzxzxz oNSoOKoOK o

**** +=

O próximo passo, segundo Yamamoto (2007), é encontrar um ( )oNS xZfatoro

*

que faz a variância dos valores corrigidos igual à variância amostral, conforme a

seguinte equação:

( )[ ] ( ) ( )[ ]oNSoOK xZfatorxZVarxZVaro

** +=

Para calcular a variância da soma de duas variáveis aleatórias, Yamamoto (2007)

desenvolveu o lado direito da equação sabendo que

[ ] [ ] [ ]( )22 XEXEXVar −= :

( )[ ] ( ) ( )( )[ ] ( ) ( )( )[ ]2**2**oNSoOKoNSoOK xZfactorxZExZfactorxZExZVar

oo+−+=

Desenvolvendo e rearranjando, Yamamoto (2007) obteve:

( )[ ] ( ) ( )( ) ( )[ ] ( )[ ] 0,2 ***2* =−++ xZVarxZVarfatorxZxZCovfatorxZVar oOKoNSoOKoNS oo

Portanto o fator ótimo é uma raiz de uma função de segundo grau, conforme

a Figura 12.

Page 43: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

30

Figura 12: Função de Segundo grau para encontrar o fator ótimo, que faz a variância dos valores corrigidos igual à variância amostral (Yamamoto, 2007).

As raízes da equação de segundo grau podem ser calculadas como

(Yamamoto, 2007):

( ) ( )( )( )[ ]oNS

oNSoOK

xZVar

xZxZCovfator

o

o

*

**

2,1 2

,2 ∆±−=

Segundo esse autor, a raiz positiva é:

( ) ( )( )( )[ ]oNS

oNSoOK

xZVar

xZxZCovfator

o

o

*

**

2

,2 ∆+−=

5.1 Aplicação do algoritmo de pós-processamento para a transformada reversa

das estimativas da krigagem lognormal

Ainda conforme o trabalho de Yamamoto (2007), uma aplicação imediata do

algoritmo de pós-processamento, que foi atualizado e aperfeiçoado pelo mesmo

neste artigo, seria para fazer a transformada reversa das estimativas da krigagem

lognormal. Antes de passarmos à aplicação do método, seria interessante fazer uma

revisão da teoria lognormal.

Page 44: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

31

Como é objetivo deste trabalho fazer um estudo do comportamento da

correção do efeito de suavização em diferentes distribuições estatísticas,

consideramos oportuno o estudo em detalhe das distribuições lognormais. Para isso,

deve-se considerar a krigagem lognormal, que trabalha no domínio logarítmico. O

problema está na transformada reversa em que a média é diferente da média

amostral, conforme se descreve a seguir.

A krigagem lognormal trabalha no domínio logarítmico, isto é, dada uma

variável aleatória Z(x), a transformada logarítmica gerará uma nova variável

aleatória:

( ) ( )xLnZxY =

Assim, na krigagem lognormal tudo se processa com a nova variável. O

semivariograma experimental é calculado e modelado, em seguida processa-se a

krigagem ordinária lognormal:

( ) ( )i

n

iioKO xyxy ∑

=

=1

* λ

Dessa forma, as estimativas no domínio logarítmico são determinadas, mas

elas precisam ser transformadas de volta ao domínio original dos dados. A esse

processo denomina-se transformada reversa. Seria lógico pensarmos em fazer a

operação inversa do logaritmo, ou seja, a exponenciação. Entretanto, isto não

garante que os resultados estejam no domínio original, pois o processo da krigagem

ordinária envolveu de certa forma alguma variância. Evidentemente, esta variância

deve ser compensada na transformada reversa e é isto que se faz (Journel, 1980):

( ) ( )( )µσ −+= 2/exp 2**KOoKOoKOL xYxZ

onde 2KOσ é a variância de krigagem e µ o multiplicador de Lagrange.

Segundo Yamamoto (2007), existem dois problemas no uso dessa expressão

para a transformada reversa. Segundo esse autor, o primeiro é que os valores da

transformada reversa são enviesados em relação à média amostral. Geralmente,

conforme Yamamoto (2007), a média dos valores transformados é menor que a

média amostral:

Page 45: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

32

( )( )[ ] ( )[ ]xZExYE KOoKO ≤−+ µσ 2/exp 2* O segundo problema, de acordo com Yamamoto (2007), deve-se ao termo de

não viés ( µσ −2/2OK ), que é totalmente dependente do modelo de semivariograma.

Deve-se observar que a exponenciação é muito sensível e que qualquer valor

anormal poderá produzir valores indesejáveis ou fora do campo de amostragem.

Uma solução seria pensarmos em substituir a variância de krigagem pela variância

de interpolação, que é mais precisa. Porém, a solução adotada por Yamamoto

(2007) passa pela reprodução do histograma, que é a base do método de correção

do efeito de suavização da krigagem ordinária. Assim, os dados amostrais são

transformados para o domínio logarítmico. Se pegarmos esses dados e fizermos a

transformada reversa, então obteremos o histograma amostral de partida. Esta é a

condição essencial para que a transformada reversa não produza viés. Portanto, se

a krigagem lognormal é feita e depois as estimativas corrigidas com o objetivo de

reproduzir o histograma dos logaritmos, então a transformada reversa garante que o

histograma amostral será reproduzido e, portanto, sem enviesamento da média.

As estimativas da krigagem lognormal podem ser corrigidas a partir da

seguinte expressão (Yamamoto, 2007):

( ) ( ) ( ) factorxyxyxy oNSoKOoKO o

**** += que nada mais é que o equivalente lognormal da krigagem normal do item anterior.

A transformada reversa é feita diretamente sobre os valores corrigidos, ou seja:

( ) ( )( )factoryxyxz

oNSoKOoKOL**** exp +=

Yamamoto (2007) demonstrou que esta expressão é muito superior àquela

utilizada convencionalmente.

As Figuras 13 e 14 mostram esquematicamente como funciona o método

desenvolvido por Yamamoto (2007). Na Figura 13 fica muito claro como o efeito de

suavização muda a forma do histograma dos logaritmos após a krigagem ordinária.

Além disso, pode-se verificar que o termo de não viés proposto por Journel (1980)

não é suficiente para corrigir do efeito de suavização. Assim, usando este

histograma suavizado o resultado da transformada reversa também estará

Page 46: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

33

suavizado, conforme se pode verificar nesta figura. Na realidade, esta é a causa do

viés da média.

Figura 13: Comportamento dos histogramas na KO e KLO, segundo Yamamoto (2007).

Outro aspecto importante é a visível perda de cauda, uma das características

do efeito de suavização.

Por outro lado, quando as estimativas da krigagem lognormal são corrigidas,

o histograma resultante da transformada reversa irá se aproximar muito do

histograma amostral, preservando também as características dos valores extremos

(figura 14).

Page 47: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

34

Figura 14: O processo da krigagem lognormal corrigida, segundo Yamamoto (2007).

Page 48: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

35

6. MATERIAIS E MÉTODOS

Serão considerados conjuntos de dados sintéticos gerados em computador. A

grande vantagem desse tipo de dado é poder conhecer completamente a

distribuição e variabilidade espaciais. Esses dados foram originalmente obtidos de

um conjunto de dados de domínio público chamado true.dat (Journel & Deutsch,

1992). A variável secundária foi submetida a uma transformação Gaussiana, em

seguida uma nova variável foi obtida elevando ela a uma potência, resultando numa

variável lognormal. A distribuição normal foi obtida a partir da variável Gaussiana,

fazendo ajustes com relação à média e variância obtidas por Sameshima (2000) em

P2O5 apatítico da jazida de Araxá (Yamamoto, 2007, Com. Verbal). A variável

lognormal invertida simula teores de CaO e foram gerados a partir de dados de

teores de ferro metálico da Jazida de Capanema (Rocha, 1997). Todos esses

conjuntos de dados estão distribuídos sobre uma malha regular com 50 x 50 nós.

As Figuras 15, 16 e 17 apresentam os conjuntos completos, respectivamente,

das variáveis gaussiana, lognormal e lognormal invertida.

0

10

20

30

40

50

0 10 20 30 40 50

30.92337

0.07663

15.50000

Figura 15: Imagem do conjunto completo apresentando uma distribuição normal.

Page 49: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

36

0

10

20

30

40

50

0 10 20 30 40 50

39.78712

0.02513

19.90612

Figura 16: Imagem do conjunto completo apresentando uma distribuição lognormal.

0

10

20

30

40

50

0 10 20 30 40 50

56.00000

45.19871

50.59936

Figura 17: Imagem do conjunto completo apresentando uma distribuição lognormal invertida. As estatísticas descritivas dos três conjuntos completos encontram-se listadas

na Tabela 2.

Tabela 2: Estatísticas descritivas dos conjuntos completos apresentando distribuições normal, lognormal e lognormal invertida.

Estatística Zgauss Zlog Zinv No. dados 2500 2500 2500 Média 15,500 1,815 52,690 Desvio padrão 4,587 2,617 2,135 Coef. Variação 0,296 1,441 0,041 Máximo 30,923 39,787 56,000 Quartil superior 18,598 2,096 54,295 Mediana 15,498 0,999 53,157 Quartil inferior 12,396 0,476 51,709 Mínimo 0,077 0,025 45,199

Page 50: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

37

A partir dos conjuntos completos foram selecionadas três amostras por

amostragem aleatória estratificada. Essas amostras são compostas por 121 pontos

de dados, ou seja, 4,84% dos conjuntos completos. As Figuras 18, 19 e 20

apresentam os mapas de localização dos pontos de dados, representados por cores

proporcionais aos teores. A Tabela 3 apresenta as estatísticas descritivas para as

três amostras obtidas dos conjuntos completos.

0

10

20

30

40

50

0 10 20 30 40 50

27.70014

1.93936

14.81975

Figura 18: Mapa de localização dos pontos de dados representando a variável gaussiana.

0

10

20

30

40

50

0 10 20 30 40 50

18.42567

0.03922

9.23244

Figura 19: Mapa de localização dos pontos de dados representando a variável lognormal.

Page 51: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

38

0

10

20

30

40

50

0 10 20 30 40 50

55.83926

45.35334

50.59630

Figura 20: Mapa de localização dos pontos de dados representando a variável lognormal invertida.

Tabela 3: Estatísticas descritivas das amostras dos conjuntos completos apresentando distribuições normal, lognormal e lognormal invertida.

Estatística Zgauss Zlog Zinv No. dados 121 121 121 Média 15,476 1,852 52,614 Desvio padrão 4,748 2,555 2,081 Coef. Variação 0,307 1,379 0,040 Máximo 29,700 18,426 55,839 Quartil superior 19,026 2,321 54,145 Mediana 15,239 0,940 52,991 Quartil inferior 12,224 0,457 51,553 Mínimo 1,939 0,039 45,353

Para essas amostras foram calculados os variogramas experimentais, aos quais

foram ajustados modelos teóricos, conforme as Figuras 21, 22 e 23. Inicialmente,

foram calculados os variogramas experimentais para as 4 direções para verificar a

existência de possível anisotropia. Dentre as variáveis estudadas, apenas a variável

lognormal invertida apresentou uma anisotropia zonal, conforme mostrada na Figura

23. Assim, para as variáveis normal e lognormal foram calculados variogramas

omnidirecionais, aos quais foram ajustados modelos isotrópicos (Figuras 21 e 22,

respectivamente).

Além dessas três distribuições de freqüência, foram considerados conjuntos

sintéticos completos gerados em computador, com o objetivo de testar a eficiência

do algoritmo de pós-processamento para correção do efeito de suavização na

Page 52: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

39

krigagem lognormal. Para o presente estudo, foram consideradas 18 variáveis com

coeficiente de variação entre 0,100 a 3,453 (Tabela 4);

0.00

5.03

10.06

15.09

20.12

25.15

0 5 10 15 20 25DISTÂNCIA

VA

RIO

GR

AM

A

Figura 21: Modelo de variograma isotrópico ajustado aos dados da variável normal.

0.00

1.45

2.90

4.35

5.80

7.25

0 5 10 15 20 25DISTÂNCIA

VA

RIO

GR

AM

A

Figura 22: Modelo de variograma isotrópico ajustado aos dados da variável lognormal.

0.00

1.66

3.31

4.97

6.63

8.29

0 5 10 15 20 25DISTÂNCIA

VA

RIO

GR

AM

A

Figura 23: Modelo de variograma com anisotropia zonal aos dados da variável lognormal invertida.

Page 53: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

40

Tabela 4: Estatísticas das variáveis selecionadas para o estudo do efeito de correção na krigagem lognormal.

Variável Média Desvio padrão CV Mediana Log1 1,005 0,100 0,100 1,000 Log2 1,020 0,205 0,201 1,000 Log3 1,046 0,319 0,306 1,000 Log4 1,083 0,448 0,414 1,000 Log5 1,132 0,598 0,529 1,000 Log6 1,196 0,778 0,651 1,000 Log7 1,275 0,997 0,782 1,000 Log8 1,373 1,271 0,925 1,000 Log9 1,494 1,616 1,082 1,000 Log10 1,640 2,057 1,254 0,999 Log11 1,818 2,626 1,444 0,999 Log12 2,035 3,367 1,655 0,999 Log13 2,299 4,339 1,887 0,999 Log14 2,621 5,621 2,145 0,999 Log15 3,016 7,323 2,429 0,999 Log16 3,501 9,593 2,740 0,999 Log17 4,099 12,631 3,081 0,999 Log18 4,841 16,714 3,453 0,999

As imagens dos dados completos encontram-se, sempre de duas em duas variáveis,

nas Figuras 24 a 32. Nessas figuras, pode-se observar como uma distribuição

espacial passa gradativamente de aproximadamente normal (CV=0,100) até uma

distribuição tipicamente lognormal (CV=1,254) e daí com assimetrias positivas cada

vez mais realçadas (CV=3,453).

0

10

20

30

40

50

0 10 20 30 40 50

1.39835

0.71513

1.05674

0

10

20

30

40

50

0 10 20 30 40 50

1.95537

0.51141

1.23339

Figura 24: Imagens dos dados completos: variável Log1 (esquerda) e variável Log2 (direita).

Page 54: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

41

0

10

20

30

40

50

0 10 20 30 40 50

2.73429

0.36573

1.55001

0

10

20

30

40

50

0 10 20 30 40 50

3.82348

0.26154

2.04251

Figura 25: Imagens dos dados completos: variável Log3 (esquerda) e variável Log4 (direita).

0

10

20

30

40

50

0 10 20 30 40 50

5.34656

0.18704

2.76680

0

10

20

30

40

50

0 10 20 30 40 50

7.47634

0.13376

3.80505

Figura 26: Imagens dos dados completos: variável Log5 (esquerda) e variável Log6 (direita).

0

10

20

30

40

50

0 10 20 30 40 50

10.45451

0.09565

5.27508

0

10

20

30

40

50

0 10 20 30 40 50

14.61903

0.06840

7.34372

Figura 27: Imagens dos dados completos: variável Log7 (esquerda) e variável Log8 (direita).

Page 55: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

42

0

10

20

30

40

50

0 10 20 30 40 50

20.44248

0.04892

10.24570

0

10

20

30

40

50

0 10 20 30 40 50

28.58567

0.03498

14.31033

Figura 28: Imagens dos dados completos: variável Log9 (esquerda) e variável Log10 (direita), que representa uma distribuição tipicamente lognormal.

0

10

20

30

40

50

0 10 20 30 40 50

39.97267

0.02502

19.99884

0

10

20

30

40

50

0 10 20 30 40 50

55.89565

0.01789

27.95677

Figura 29: Imagens dos dados completos: variável Log11 (esquerda) e variável Log12 (direita).

0

10

20

30

40

50

0 10 20 30 40 50

78.16149

0.01279

39.08714

0

10

20

30

40

50

0 10 20 30 40 50

109.29686

0.00915

54.65301

Figura 30: Imagens dos dados completos: variável Log13 (esquerda) e variável Log14 (direita).

Page 56: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

43

0

10

20

30

40

50

0 10 20 30 40 50

152.83489

0.00654

76.42072

0

10

20

30

40

50

0 10 20 30 40 50

213.71615

0.00468

106.86042

Figura 31: Imagens dos dados completos: variável Log15 (esquerda) e variável Log16 (direita).

0

10

20

30

40

50

0 10 20 30 40 50

298.84926

0.00335

149.42631

0

10

20

30

40

50

0 10 20 30 40 50

417.89484

0.00239

208.94861

Figura 32: Imagens dos dados completos: variável Log17 (esquerda) e variável Log18 (direita).

Para esses dados completos, foram extraídas amostras com 121 pontos de

dados com base no processo da amostragem aleatória estratificada. A título de

ilustração a Figura 33 apresenta o mapa de localização de pontos para a variável

tipicamente lognormal (Log10).

Page 57: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

44

0

10

20

30

40

50

0 10 20 30 40 50

9.32204

0.08296

4.70250

Figura 33: Mapa de localização de pontos para a variável Log10.

Antes de prosseguir, seria interessante verificar as estatísticas das amostras

assim obtidas (Tabela 5).

Tabela 5: Estatísticas das amostras extraídas dos conjuntos completos por amostragem aleatória estratificada.

Variável Média Desvio padrão CV Mediana Log1 1,008 0,097 0,096 0,998 Log2 1,024 0,197 0,192 0,996 Log3 1,051 0,305 0,291 0,994 Log4 1,088 0,426 0,391 0,992 Log5 1,137 0,562 0,494 0,990 Log6 1,198 0,719 0,600 0,988 Log7 1,274 0,904 0,710 0,986 Log8 1,366 1,123 0,822 0,984 Log9 1,476 1,384 0,938 0,982 Log10 1,608 1,699 1,056 0,980 Log11 1,766 2.078 1,177 0,978 Log12 1,953 2,539 1,300 0,976 Log13 2,176 3,098 1,424 0,974 Log14 2,440 3,780 1,549 0,972 Log15 2,753 4,611 1,675 0,970 Log16 3,126 5,628 1,801 0,969 Log17 3,568 6,873 1,926 0,967 Log18 4,095 8,398 2,051 0,965

Como se verifica nesta tabela, a amostra selecionada não representa a

variabilidade total do conjunto completo, pois o coeficiente de variação amostral é

sempre menor que o coeficiente de variação populacional. Cabe ressaltar que a

amostra poderia apresentar uma variância maior que a variância da população,

Page 58: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

45

dependendo do arranjo dos pontos e valores selecionados. Mas, as amostras

selecionadas dos conjuntos completos são suficientes para fins do estudo.

Os conjuntos completos e amostrais representam os materiais para o estudo

de investigação, objeto desta pesquisa de mestrado.

Com relação aos métodos, serão utilizados os algoritmos desenvolvidos por

Yamamoto (2005 e 2007), os quais estão disponibilizados na versão 3.0 do Sistema

GeoVisual (Yamamoto, 2006).

Especificamente, este trabalho deverá focar o problema do déficit de variância,

através da sua quantificação em função do número de pontos vizinhos considerados.

Segundo Yamamoto (2000), o déficit de variância para a krigagem ordinária

pode ser calculada:

( ){ } ( ){ } ( ) 022 ≥+=− ∗ µσ xxZVarxZVar OKOK

Onde µ é o multiplicador de Lagrange. Esse mesmo autor também mostrou que o

déficit de variância pode ser representado em termos da variância de interpolação

como:

( ){ } ( ){ } { } 02 ≥=− ∗oOK SExZVarxZVar ,

que pode ser interpretado como a variância de suavização do estimador da

krigagem ordinária ( )xZOK∗ . Segundo Yamamoto (2000), essa expressão faz sentido

como uma medida do déficit de variância, pois quanto maior a variância de

interpolação 2oS como a média de todos os valores possíveis para uma dada

configuração, maior será a variância de suavização do estimador da krigagem.

Comparando as duas expressões do déficit de variância, fica evidente que a

segunda que considera a variância de interpolação deverá ser mais precisa em

relação à primeira que leva em conta a variância de krigagem e o multiplicador de

Lagrange. Como mencionado anteriormente, a variância de krigagem não apresenta

precisão local e, portanto, não pode ser utilizada para o cálculo do déficit de

variância.

Page 59: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

46

7. RESULTADOS E DISCUSSÃO

O método de correção do efeito de suavização da krigagem ordinária, proposto por

Yamamoto (2005), tem como objetivo proporcionar uma única imagem

compartilhando tanto a precisão local como a precisão global. Entretanto, o método

não foi exaustivamente testado para diferentes distribuições estatísticas, haja vista

aquele autor ter testado o seu método em distribuições com assimetria positiva.

Assim, o objetivo principal deste trabalho é fazer um estudo completo sobre a

eficiência da correção do efeito de suavização da krigagem ordinária, considerando

diferentes distribuições estatísticas. Como referido anteriormente, três distribuições

serão consideradas neste estudo: normal, lognormal e lognormal invertida.

7.1 Estudo da influência do tipo de distribuição e do tamanho da amostra

Além da influência do tipo de distribuição estatística, é importante saber como é a

eficiência do método frente a diferentes tamanhos de amostras. Assim, foram

considerados, para cada distribuição estatística, quatro tamanhos de amostras: 36,

64, 90 e 121 pontos de dados, ou seja, 1,44, 2,56, 3,60 e 4,84% da distribuição

completa, respectivamente. Todas as amostras foram obtidas usando um

procedimento estatístico clássico de amostragem aleatória estratificada. Cabe

lembrar que o tamanho máximo de amostra corresponde a 4,84% da distribuição

completa, o que consideramos bastante razoável, em termos práticos.

As estatísticas descritivas das amostras em comparação àquelas dos

conjuntos completos encontram-se nas Tabelas 6 a 8, respectivamente para as

distribuições: normal, lognormal e lognormal invertida.

Tabela 6: Estatísticas descritivas para o conjunto completo e amostras representativas da distribuição normal.

Estatística Completo Amostra36 Amostra64 Amostra90 Amostra121 No. dados 2500 36 64 90 121 Média 15,500 16,277 15,388 15,895 15,476 D. padrão 4,587 5,382 4,543 4,263 4,748 C. variação 0,296 0,331 0,295 0,268 0,307 Máximo 30,923 26,582 23,512 29,465 27,700 Q. superior 18,598 19,712 18,621 18,640 19,026 Mediana 15,498 16,459 15,595 15,207 15,239 Q. inferior 12,396 11,712 12,528 12,427 12,224 Mínimo 0,077 0,077 4,418 8,363 1,939

Page 60: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

47

Tabela 7: Estatísticas descritivas para o conjunto completo e amostras representativas da distribuição lognormal.

Estatística Completo Amostra36 Amostra64 Amostra90 Amostra121 No. dados 2500 36 64 90 121 Média 1,852 2,473 1,625 1,999 1,852 D. padrão 2,555 3,317 1,622 3,399 2,555 C. variação 1,379 1,341 0,998 1,671 1,379 Máximo 18,426 14,106 6,776 28,083 18,426 Q. superior 2,321 2,734 2,107 2,118 2,321 Mediana 0,940 1,257 1,023 0,932 0,940 Q. inferior 0,457 0,405 0,492 0,480 0,457 Mínimo 0,039 0,025 0,071 0,182 0,039

Tabela 8: Estatísticas descritivas para o conjunto completo e amostras representativas da distribuição lognormal invertida.

Estatística Completo Amostra36 Amostra64 Amostra90 Amostra121 No. dados 2500 36 64 90 121 Média 52,690 52,515 52,714 52,774 52,614 D. padrão 2,135 2,366 1,971 2,111 2,081 C. variação 0,041 0,045 0,037 0,040 0,040 Máximo 56,000 55,402 55,373 55,625 55,839 Q. superior 54,295 54,224 54,326 54,651 54,145 Mediana 53,157 53,107 52,744 53,025 52,991 Q. inferior 51,709 51,531 51,354 51,553 51,553 Mínimo 45,199 45,415 46,913 46,411 45,353

Os valores apresentados na estatística descritiva mostram que os conjuntos

amostrais são representativos do conjunto de dados completo. As distribuições

lognormais são as que apresentam maior variabilidade dos coeficientes de variação.

Este aspecto será abordado mais à frente.

Os variogramas experimentais foram calculados e modelados para cada

amostra, conforme as Figuras 34 a 36.

Page 61: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

48

a)

0.00

9.08

18.17

27.25

36.34

45.42

0.00 5.00 10.00 15.00 20.00 25.00DISTÂNCIA

VA

RIO

GR

AM

A= 0

b)

0.00

5.71

11.43

17.14

22.85

28.56

0.00 7.00 14.00 21.00 28.00 35.00DISTÂNCIA

VA

RIO

GR

AM

A

= 135

c)

0.00

4.26

8.51

12.77

17.03

21.28

0.00 7.00 14.00 21.00 28.00 35.00DISTÂNCIA

VA

RIO

GR

AM

A

= 135

d)

0.00

5.03

10.06

15.09

20.12

25.15

0.00 7.00 14.00 21.00 28.00 35.00DISTÂNCIA

VA

RIO

GR

AM

A

= 0

Figura 34: Variogramas experimentais e modelos ajustados para as amostras representativas da distribuição normal, sendo a) 36, b) 64,c) 90 e d) 121 dados.

a)

0.00

3.40

6.79

10.19

13.59

16.99

0.00 5.00 10.00 15.00 20.00 25.00DISTÂNCIA

VA

RIO

GR

AM

A

= 0

b)

0.00

0.75

1.50

2.25

3.00

3.74

0.00 7.00 14.00 21.00 28.00 35.00DISTÂNCIA

VA

RIO

GR

AM

A

= 135

c)

0.00

3.01

6.01

9.02

12.02

15.03

0.00 5.00 10.00 15.00 20.00 25.00DISTÂNCIA

VA

RIO

GR

AM

A

= 135

d)

0.00

1.45

2.90

4.35

5.80

7.25

0.00 5.00 10.00 15.00 20.00 25.00DISTÂNCIA

VA

RIO

GR

AM

A

= 0

Figura 35: Variogramas experimentais e modelos ajustados para as amostras representativas da distribuição lognormal, sendo a) 36, b) 64,c) 90 e d) 121 dados.

Page 62: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

49

a)

0.00

1.75

3.50

5.25

7.00

8.75

0.00 8.00 16.00 24.00 32.00 40.00DISTÂNCIA

VA

RIO

GR

AM

A

= 135

b)

0.00

1.42

2.85

4.27

5.69

7.12

0.00 7.00 14.00 21.00 28.00 35.00DISTÂNCIA

VA

RIO

GR

AM

A

= 135 = 45

c)

0.00

1.73

3.46

5.20

6.93

8.66

0.00 5.00 10.00 15.00 20.00 25.00DISTÂNCIA

VA

RIO

GR

AM

A

= 45 = 135

d)

0.00

1.66

3.31

4.97

6.63

8.29

0.00 5.00 10.00 15.00 20.00 25.00DISTÂNCIA

VA

RIO

GR

AM

A

= 45 = 135

Figura 36: Variogramas experimentais e modelos ajustados para as amostras representativas da distribuição lognormal invertida, sendo a) 36, b) 64,c) 90 e d) 121 dados.

Para as amostras com 36 pontos, os variogramas foram calculados em

apenas uma direção principal, enquanto as outras amostras, por possuírem maior

número de pares, apresentam variogramas mais robustos.

Todos os resultados foram obtidos do processamento do Programa

Crossordkrig2E do Sistema GeoVisual (Yamamoto, 2007).

Inicialmente, serão apresentados os resultados relativos ao cálculo do déficit

de variância. Como se sabe, quanto maior o número de pontos de dados

considerados no cálculo através da krigagem ordinária, maior a suavização. Assim,

( )[ ]xZVar KO*

diminui com o aumento do número de pontos vizinhos. Como o Sistema

GeoVisual trabalha com o método dos quadrantes para localização dos vizinhos

próximos, a vizinhança será referida de acordo com o número de pontos por

quadrante, ou simplesmente nppq. Por outro lado, quanto maior a vizinhança, maior

a variância de interpolação e, portanto, maior a componente { }2oSE , compensando o

déficit de variância. Assim, uma primeira medida da eficiência pode ser obtida da

análise do déficit de variância, como fez Yamamoto (2005).

Page 63: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

50

7.1.1 Déficit de variância

As Tabelas 9 a 12 apresentam os componentes para cálculo do déficit de

variância para as amostras da distribuição normal, respectivamente com 36, 64, 90 e

121 pontos de dados. A Figura 9 apresenta os gráficos dos componentes de

variância.

Tabela 9: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 36 pontos de dados da distribuição normal.

Nppq ( )[ ]xZVar KO* { }2

oSE ( )[ ] { }2*oKO SExZVar + 2% amostralS

1 12,436 15,048 27,484 94,880 2 9,830 17,053 26,883 92,804 3 8,382 18,895 27,278 94,167 4 7,054 20,621 27,676 95,541 5 6,117 21,665 27,782 95,908 6 5,618 22,097 27,715 95,677 7 5,444 22,284 27,278 95,721 8 5,420 22,311 27,731 95,732 9 5,417 22,319 27,733 95,738 10 5,417 22,316 27,733 95,738

Tabela 10: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 64 pontos de dados da distribuição normal.

Nppq ( )[ ]xZVar KO*

{ }2oSE ( )[ ] { }2*

oKO SExZVar + 2% amostralS

1 12,282 7,627 19,909 96,449 2 10,237 9,822 20,059 97,145 3 8,625 11,603 20,228 97,992 4 7,520 12,841 20,361 98,637 5 6,530 13,740 20,270 98,197 6 5,776 14,580 20,356 98,612 7 5,247 15,072 20,319 98,433 8 4,899 15,408 20,307 98,376 9 4,593 15,615 20,213 97,919 10 4,382 15,779 20,161 97,671

Tabela 11: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 90 pontos de dados da distribuição normal.

Nppq ( )[ ]xZVar KO*

{ }2oSE ( )[ ] { }2*

oKO SExZVar + 2% amostralS

1 10,217 7,260 17,477 96,164 2 9,184 8,959 18,143 99,829 3 8,037 10,020 18,057 99,352 4 7,165 10,977 18,142 99,823 5 6,400 11,720 18,120 99,701 6 5,729 12,368 18,097 99,572 7 5,138 12,912 18,050 99,316 8 4,751 13,238 17,989 98,982 9 4,469 13,449 17,918 98,591 10 4,255 13,641 17,896 98,467

Page 64: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

51

Tabela 12: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 121 pontos de dados da distribuição normal.

Nppq ( )[ ]xZVar KO* { }2

oSE ( )[ ] { }2*oKO SExZVar + 2% amostralS

1 14,714 7,611 22,325 99,047 2 12,000 9,624 22,597 100,250 3 11,618 10,938 22,555 100,670 4 10,566 11,894 22,460 99,644 5 9,646 12,888 22,534 99,974 6 8,666 13,818 22,484 99,750 7 7,763 14,621 22,385 99,311 8 7,105 15,146 22,251 98,716 9 6,617 15,550 22,670 98,344 10 6,223 15,947 22,717 98,861

a)

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10

b)

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 c)

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10

d)

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 Var[Z*ko] E{So2} Var[Z*ko]+E{So2} Var. Amostral

Figura 37: Gráficos dos componentes de variância para amostras da distribuição normal para amostras com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados.

A Figura 37a mostra claramente que a soma de variâncias ( )[ ] { }2*oKO SExZVar +

não atinge a variância amostral que é o objetivo da correção. Como para as demais

amostras, a correção é efetiva, pode-se concluir que a amostra de 36 pontos não

garante a continuidade espacial.

Da mesma forma, as Tabelas 13 a 16 apresentam os resultados da análise do

déficit de variância para as amostras da distribuição lognormal. Os gráficos do déficit

de variância encontram-se na Figura 38.

Page 65: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

52

Tabela 13: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 36 pontos de dados da distribuição lognormal.

Nppq ( )[ ]xZVar KO* { }2

oSE ( )[ ] { }2*oKO SExZVar + 2% amostralS

1 4,420 5,427 9,847 89,526 2 3,605 6,378 9,983 90,759 3 3,092 6,945 10,037 91,251 4 2,618 7,508 10,126 92,060 5 2,276 7,958 10,235 93,048 6 2,073 8,088 10,161 92,379 7 2,004 8,161 10,166 92,422 8 1,995 8,169 10,164 92,407 9 1,994 8,171 10,165 92,417 10 1,994 8,171 10,165 92,417

Tabela 14: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 64 pontos de dados da distribuição lognormal.

Nppq ( )[ ]xZVar KO* { }2

oSE ( )[ ] { }2*oKO SExZVar + 2% amostralS

1 1,595 0,940 2,535 96,354 2 1,351 1,262 2,613 99,291 3 1,170 1,469 2,639 100,308 4 1,032 1,605 2,637 100,234 5 0,904 1,712 2,616 99,419 6 0,805 1,790 2,596 98,553 7 0,736 1,843 2,578 97,993 8 0,680 1,874 2,554 97,056 9 0,635 1,898 2,533 96,272 10 0,599 1,919 2,519 95,714

Tabela 15: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 90 pontos de dados da distribuição lognormal.

Nppq ( )[ ]xZVar KO* { }2

oSE ( )[ ] { }2*oKO SExZVar + 2% amostralS

1 4,194 4,998 9,192 82,434 2 5,554 6,899 12,453 111,676 3 4,741 7,396 12,137 108,848 4 4,100 8,261 12,361 110,854 5 3,607 8,658 12,265 109,995 6 3,203 8,996 12,199 109,399 7 2,766 9,310 12,076 108,302 8 2,534 9,373 11,907 106,779 9 2,344 9,353 11,697 104,899 10 2,223 9,391 11,614 104,155

Page 66: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

53

Tabela 16: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 121 pontos de dados da distribuição lognormal.

Nppq ( )[ ]xZVar KO* { }2

oSE ( )[ ] { }2*oKO SExZVar + 2% amostralS

1 3,788 2,518 6,306 96,621 2 3,674 3,264 6,937 106,289 3 3,205 3,621 6,826 104,591 4 2,811 3,862 6,673 102,249 5 2,536 4,127 6,663 102,084 6 2,277 4,336 6,612 101,311 7 2,010 4,449 6,459 98,964 8 1,830 4,534 6,364 97,509 9 1,673 4,559 6,232 95,481 10 1,557 4,616 6,173 94,583

a)

0

2

4

6

8

10

12

1 2 3 4 5 6 7 8 9 10

b)

0

2

4

6

8

10

12

1 2 3 4 5 6 7 8 9 10

c)

0

2

4

6

8

10

12

1 2 3 4 5 6 7 8 9 10

d)

0

2

4

6

8

10

12

1 2 3 4 5 6 7 8 9 10

Var[Z*ko] E{So2} Var[Z*ko]+E{So2} Var. Amostral Figura 38: Gráficos dos componentes de variância para amostras da distribuição lognormal para amostras com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados. Para a distribuição lognormal há comportamentos distintos em relação ao

tamanho das amostras. Para a amostra de 36 pontos, a soma dos componentes de

variância não alcança o objetivo que é a variância amostral. Em relação à amostra

de 64 pontos (38b), verifica-se que o objetivo é alcançado com nppq variando de 2 a

5. Para as amostras com 90 e 121 pontos de dados, há a sobrecorreção da

variância. A distribuição lognormal pode apresentar esse problema de sobrecorreção,

Page 67: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

54

pois uns poucos valores anômalos são responsáveis por grande parte da

variabilidade dos dados. Assim, a influência desses poucos valores altos pode ser

responsável pela sobrecorreção da variância.

Os resultados da análise do déficit de variância para os dados da distribuição

lognormal invertida estão listados nas Tabelas 17 a 20. Os gráficos dos

componentes da variância amostral como a soma de ( )[ ]xZVar KO*

e { }2oSE estão na

Figura 6.

Tabela 17: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 36 pontos de dados da distribuição lognormal invertida.

Nppq ( )[ ]xZVar KO* { }2

oSE ( )[ ] { }2*oKO SExZVar + 2% amostralS

1 3,550 2,042 5,626 100,467 2 2,941 2,499 5,440 97,136 3 2,496 2,916 5,412 96,634 4 2,110 3,326 5,437 97,079 5 1,831 3,666 5,496 98,143 6 1,659 3,857 5,516 98,498 7 1,594 3,946 5,540 98,931 8 1,583 3,972 5,556 99,208 9 1,583 3,975 5,557 99,233 10 1,583 3,975 5,557 99,234

Tabela 18: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 64 pontos de dados da distribuição lognormal invertida.

Nppq ( )[ ]xZVar KO* { }2

oSE ( )[ ] { }2*oKO SExZVar + 2% amostralS

1 2,901 1,063 3,964 101,996 2 2,332 1,438 3,770 97,004 3 1,948 1,802 3,750 96,484 4 1,682 2,106 3,788 97,478 5 1,477 2,333 3,810 98,030 6 1,326 2,530 3,856 99,203 7 1,185 2,703 3,889 100,062 8 1,074 2,846 3,920 100,870 9 0,983 2,982 3,965 102,024 10 0,913 3,088 4,001 102,956

Page 68: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

55

Tabela 19: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 90 pontos de dados da distribuição lognormal invertida.

Nppq ( )[ ]xZVar KO* { }2

oSE ( )[ ] { }2*oKO SExZVar + 2% amostralS

1 3,372 1,130 4,502 101,030 2 2,858 1,496 4,354 97,716 3 2,48 1,870 4,350 97,617 4 2,202 2,175 4,377 98,234 5 1,951 2,437 4,388 98,479 6 1,730 2,662 4,392 98,580 7 1,558 2,846 4,404 98,847 8 1,418 3,020 4,438 99,604 9 1,285 3,185 4,470 100,328 10 1,177 3,321 4,498 100,955

Tabela 20: Componentes do déficit de variância e eficiência em relação à variância amostral para amostra com 121 pontos de dados da distribuição lognormal invertida.

Nppq ( )[ ]xZVar KO* { }2

oSE ( )[ ] { }2*oKO SExZVar + 2% amostralS

1 3,534 1,023 4,558 105,248 2 3,136 1,353 4,489 103,688 3 2,789 1,684 4,473 103,295 4 2,444 2,010 4,454 102,859 5 2,188 2,274 4,462 103,042 6 1,945 2,512 4,457 102,950 7 1,739 2,719 4,458 102,944 8 1,553 2,890 4,443 102,585 9 1,393 3,035 4,427 102,233 10 1,247 3,160 4,407 101,774

A distribuição lognormal invertida tem como principal característica a sua

baixa variância, pois ela é fechada à esquerda (origem em zero, pois não existem

teores negativos) e fechada à direita (teor máximo de uma determinada variável, por

exemplo, Feo igual a 68,4% em minério de ferro). Em geral, a variância amostral

pode ser recuperada através da equação do déficit de variância, inclusive para a

amostra com 36 pontos de dados, mostrando que a distribuição lognormal invertida

tem como característica a baixa variabilidade espacial. A Figura 39d mostra uma

leve sobrecorreção para a amostra com 121 pontos de dados.

Page 69: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

56

a)

0

1

2

3

4

5

6

1 2 3 4 5 6 7 8 9 10

b)

0

1

2

3

4

5

6

1 2 3 4 5 6 7 8 9 10

c)

0

1

2

3

4

5

6

1 2 3 4 5 6 7 8 9 10

d)

0

1

2

3

4

5

6

1 2 3 4 5 6 7 8 9 10

Var[Z*ko] E{So2} Var[Z*ko]+E{So2} Var. Amostral Figura 39: Gráficos dos componentes de variância para amostras da distribuição lognormal invertida para amostras com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados.

7.1.2 Relação entre variância inicial e variância amostral

Outro aspecto a ser analisado em relação à eficiência da correção do efeito

de suavização da krigagem ordinária refere-se à variância inicial em relação à

variância amostral e a variância corrigida, bem como o fator ótimo. Na realidade,

quanto mais próximo a variância inicial for da variância amostral, melhor o ajuste,

embora o fator ótimo possa fazer o trabalho de trazer a variância inicial para a

variância amostral. Porém, isso não é desejável, pois o fator ótimo sendo menor que

um, significa que a quantidade de correção ( )xZoNS

*

é diminuída para que a variância

corrigida fique próxima da variância amostral. Por outro lado, se o fator ótimo for

maior que um, significa que a quantidade de correção ( )xZoNS

*

é aumentada para que

a variância corrigida se aproxime da variância amostral. Portanto, o objetivo deste

estudo é verificar qual a condição de vizinhança em que a melhor relação pode ser

obtida. O Programa Crossordkrig2E oferece duas possibilidades de correção do

Page 70: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

57

efeito de suavização, através da opção para interpolação da variável secundária oSN ,

ou seja, do número de desvios padrão. A primeira opção foi denominada condição

mínima, em que a variável secundária é interpolada com nppq igual a um. A outra

opção permite interpolar o valor da variável secundária usando o nppq igual ao nppq

que está sendo utilizado para interpolar o valor da variável de interesse ( )oKO xZ *

e,

portanto, esta condição foi chamada nppq=grid.

Os resultados desta análise em relação à variância inicial e variância corrigida,

bem como o cálculo do fator ótimo encontram-se nas Tabelas 21 a 24 para a

distribuição normal.

Tabela 21: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 36 pontos de dados da distribuição normal (variância amostral = 28,967).

Nppq=1 Nppq=grid Nppq Variância

inicial Fator ótimo

Variância corrigida

Variância inicial

Fator ótimo

Variância corrigida

1 30,850 0,930 28,881 30,850 0,930 28,881 2 28,085 1,031 28,403 26,029 1,114 27,522 3 25,853 1,115 27,628 21,626 1,356 26,117 4 23,669 1,201 26,977 17,916 2,000 24,921 5 23,586 1,191 27,061 16,344 1,741 24,570 6 23,075 1,207 26,920 15,075 1,861 24,120 7 23,039 1,206 26,925 14,772 1,888 24,002 8 23,045 1,206 26,945 14,730 1,892 24,000 9 23,053 1,205 26,951 14,725 1,893 23,997 10 23,054 1,205 26,951 14,725 1,893 23,997

Tabela 22: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 64 pontos de dados da distribuição normal (variância amostral = 20,642).

Nppq=1 Nppq=grid Nppq Variância

inicial Fator ótimo

Variância corrigida

Variância inicial

Fator ótimo

Variância corrigida

1 20,890 0,979 20,515 20,890 0,979 20,515 2 20,201 1,032 20,549 19,169 1,122 20,469 3 19,372 1,083 20,419 16,951 1,314 20,074 4 19,388 1,072 20,427 15,842 1,403 19,953 5 18,898 1,094 20,341 13,997 1,600 19,260 6 18,936 1,085 20,305 12,851 1,719 18,780 7 18,113 1,126 20,130 11,513 1,931 18,321 8 18,220 1,116 20,125 11,129 1,971 18,189 9 18,660 1,121 20,077 10,562 2,056 17,918 10 17,826 1,132 20,030 10,198 2,124 17,640

Page 71: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

58

Tabela 23: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 90 pontos de dados da distribuição normal (Variância amostral = 18, 174).

Nppq=1 Nppq=grid Nppq Variância

inicial Fator ótimo

Variância corrigida

Variância inicial

Fator ótimo

Variância corrigida

1 17,799 1,035 18,044 17,799 1,035 18,044 2 19,234 0,922 18,172 17,942 1,019 18,070 3 18,654 0,967 18,154 16,458 1,147 17,633 4 18,212 0,997 18,133 14,928 1,293 17,258 5 18,104 1,004 18,117 13,923 1,393 17,016 6 17,950 1,012 18,095 12,967 1,487 16,713 7 17,935 1,012 18,096 12,136 1,571 16,488 8 17,927 1,012 18,088 11,573 1,631 16,306 9 17,504 1,034 17,982 10,966 1,711 16,094 10 17,419 1,038 17,967 10,551 1,768 16,015

Tabela 24: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 121 pontos de dados da distribuição normal (Variância amostral = 22,540).

Nppq=1 Nppq=grid Nppq Variância

inicial Fator ótimo

Variância corrigida

Variância inicial

Fator ótimo

Variância corrigida

1 26,281 0,741 22,540 26,281 0,741 22,540 2 25,614 0,807 22,539 24,270 0,856 22,538 3 25,257 0,845 22,539 22,916 0,974 22,522 4 24,749 0,882 22,539 21,266 1,091 22,240 5 23,868 0,930 22,539 19,235 1,259 21,983 6 23,559 0,950 22,539 17,737 1,386 21,808 7 23,249 0,968 22,539 16,298 1,515 21,704 8 22,537 0,987 22,537 15,035 1,647 21,512 9 22,698 0,993 22,531 14,156 1,747 21,469 10 22,363 1,007 22,499 13,317 1,857 21,418

Nota-se, mais uma vez, que o nppq menor ou igual a 4 gera uma variância

corrigida mais próxima da variância amostral, enquanto o nppq maior que 4 tende a

diminuir a variância corrigida, aumentando o efeito de suavização.

Os resultados podem ser visualizados através dos gráficos de variância e

fator ótimo em função do número de pontos por quadrante (nppq). As Figuras 40 e

41 ilustram os gráficos de variância e do fator ótimo, respectivamente.

Page 72: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

59

a)

1012141618202224262830

1 2 3 4 5 6 7 8 9 10

b)

1012

141618

20222426

2830

1 2 3 4 5 6 7 8 9 10 c)

1012141618

202224262830

1 2 3 4 5 6 7 8 9 10

d)

10

12

14

16

18

20

22

24

26

28

30

1 2 3 4 5 6 7 8 9 10 Variância Amostral S2 Var[Z**ko] (nppq=grid) Var. Corrigida (nppq=grid) Var[Z**ko] (cond. mín.) Var. Corrigida (cond. mín.)

Figura 40: Gráficos da variância inicial e variância corrigida em função do nppq para as amostras da distribuição normal com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados.

a)

0.6

0.8

1

1.2

1.4

1.6

1.8

2

2.2

1 2 3 4 5 6 7 8 9 10

b)

0.6

0.8

1

1.2

1.4

1.6

1.8

2

2.2

1 2 3 4 5 6 7 8 9 10 c)

0.6

0.8

1

1.2

1.4

1.6

1.8

2

2.2

1 2 3 4 5 6 7 8 9 10

d)

Figura 41: Gráficos da variação do fator ótimo em função do nppq para as amostras da distribuição normal com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados.

Page 73: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

60

Embora a análise considere tanto os gráficos de variância, quanto os gráficos

do fator ótimo, observou-se que, para esse tipo de distribuição a análise pode ser

feita à partir apenas dos gráficos do fator ótimo em função do nppq.

A Figura 41a mostra que somente a condição mínima para nppq=2 consegue

aproximar o fator ótimo em torno de um. Para as amostras com 64 e 90 pontos de

dados, a condição mínima garante para qualquer vizinhança fatores ótimos próximos

de um. Para a amostra com 121 pontos de dados, verifica-se que a condição mínima

tende a um fator ótimo igual a 1 quando a vizinhança aumenta.

Por outro lado, o fator ótimo para a condição nppq=grid é obtido com uma

vizinhança igual a 3 pontos por quadrante. Na estimativa, o melhor é usar o menor

número de vizinhos próximos que evita erros decorrentes da utilização de amostras

muito distantes e, portanto, muito diferentes em relação ao valor a ser estimado.

Portanto, neste caso, a melhor opção é utilizar o nppq=grid com uma vizinhança

igual a 3 pontos por quadrante. Esse resultado mostrou ao orientador a necessidade

de uma implementação futura no programa Crossordkrig2E para efetuar uma análise

completa da vizinhança em função das opções de condição mínima e nppq=grid.

Os resultados para as amostras da distribuição lognormal encontram-se nas

Tabelas 25 a 28 e Figuras 42 e 43.

Tabela 25: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 36 pontos de dados da distribuição lognormal (Variância Amostral = 10,999).

Nppq=1 Nppq=grid Nppq Variância

inicial Fator ótimo

Variância corrigida

Variância inicial

Fator ótimo

Variância corrigida

1 11,825 0,825 10,778 11,825 0,825 10,778 2 11,406 0,965 10,928 10,516 1,047 10,819 3 10,851 1,012 10,909 9,542 1,145 10,377 4 10,882 1,009 10,911 8,982 1,000 10,049 5 10,770 1,017 10,822 8,403 1,255 9,595 6 10,622 1,027 10,776 8,043 1,293 9,356 7 10,572 1,031 10,747 7,919 1,306 9,260 8 10,557 1,032 10,741 7,899 1,308 9,243 9 10,555 1,032 10,740 7,895 1,309 9,240 10 10,555 1,032 10,740 7,895 1,309 9,240

Page 74: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

61

Tabela 26: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 64 pontos de dados da distribuição lognormal (Variância Amostral = 2,631).

Nppq=1 Nppq=grid Nppq Variância

inicial Fator ótimo

Variância corrigida

Variância inicial

Fator ótimo

Variância corrigida

1 2,389 1,198 2,607 2,389 1,198 2,607 2 2,455 1,106 2,611 2,416 1,132 2,587 3 2,371 1,139 2,598 2,174 1,285 2,545 4 2,364 1,129 2,589 2,133 1,198 2,544 5 2,368 1,115 2,583 1,956 1,393 2,518 6 2,376 1,104 2,584 1,802 1,506 2,497 7 2,322 1,124 2,574 1,66 1,635 2,435 8 2,324 1,119 2,57 1,597 1,679 2,415 9 2,310 1,121 2,564 1,513 1,758 2,378 10 2,295 1,125 2,559 1,460 1,807 2,349

Tabela 27: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 90 pontos de dados da distribuição lognormal (Variância Amostral = 11,151).

Nppq=1 Nppq=grid Nppq Variância

inicial Fator ótimo

Variância corrigida

Variância inicial

Fator ótimo

Variância corrigida

1 20,125 0,577 11,101 20,125 0,577 11,101 2 26,663 0,399 11,078 27,143 0,395 11,047 3 26,569 0,438 11,076 27,084 0,432 11,028 4 26,044 0,474 11,075 26,628 0,466 10,967 5 25,963 0,495 11,081 25,812 0,497 10,958 6 25,890 0,511 11,095 25,176 0,522 10,954 7 26,107 0,525 11,100 25,279 0,538 10,930 8 26,154 0,533 11,103 24,767 0,554 10,952 9 26,154 0,540 11,118 24,356 0,567 10,988 10 26,068 0,546 11,123 23,735 0,583 11,009

Tabela 28: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 121 pontos de dados da distribuição lognormal (Variância Amostral = 6,526).

Nppq=1 Nppq=grid Nppq Variância

inicial Fator ótimo

Variância corrigida

Variância inicial

Fator ótimo

Variância corrigida

1 8,847 0,645 6,512 8,847 0,645 6,512 2 9,807 0,578 6,521 9,926 0,569 6,519 3 10,010 0,605 6,521 9,962 0,608 6,518 4 9,874 0,643 6,521 9,605 0,660 6,516 5 9,570 0,680 6,521 8,859 0,729 6,513 6 9,416 0,706 6,522 8,278 0,791 6,512 7 9,268 0,732 6,523 7,721 0,855 6,515 8 9,191 0,748 6,524 7,257 0,909 6,517 9 9,148 0,759 6,524 6,881 0,955 6,517 10 9,164 0,764 6,524 6,653 0,984 6,515

Page 75: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

62

a)

7

8

9

10

11

12

1 2 3 4 5 6 7 8 9 10

b)

1.4

1.6

1.8

2.0

2.2

2.4

2.6

2.8

1 2 3 4 5 6 7 8 9 10 c)

10

12

14

16

18

20

22

24

26

1 2 3 4 5 6 7 8 9 10

d)

6

7

8

9

10

1 2 3 4 5 6 7 8 9 10 Variância Amostral S2 Var[Z**ko] (nppq=grid) Var. Corrigida (nppq=grid) Var[Z**ko] (cond. mín.) Var. Co rrigida (cond. mín.)

Figura 42: Gráficos da variância inicial e variância corrigida em função do nppq para as amostras da distribuição lognormal com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados.

a)

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

1 2 3 4 5 6 7 8 9 10

b)

0.2

0.4

0.6

0.8

1.0

1.2

1.4

1.6

1.8

1 2 3 4 5 6 7 8 9 10 c)

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

1 2 3 4 5 6 7 8 9 10

d)

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

1 2 3 4 5 6 7 8 9 10

Figura 43: Gráficos da variação do fator ótimo em função do nppq para as amostras da distribuição lognormal com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados.

Page 76: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

63

Para a distribuição lognormal, se observa dois comportamentos distintos em

relação ao tamanho das amostras: em amostras pequenas, as variâncias iniciais são

menores que a variância amostral (Figuras 42a e 42b); enquanto para amostras

grandes, as variâncias iniciais são maiores que a variância amostral (Figuras 42c e

43d). Assim, para as amostras pequenas os fatores ótimos são obtidos com a

interpolação do número de desvios padrão usando a condição mínima, ou seja,

usando nppq=1. Para as amostras grandes, os fatores ótimos são sempre menores

que um, pois as variâncias iniciais são bem maiores que a variância amostral. Os

coeficientes de variação para as amostras grandes foram iguais a 1,671 e 1,379,

respectivamente para 90 e 121 pontos de dados. Evidentemente, a variância

corrigida em qualquer um desses casos aproxima-se da variância amostral,

mostrando a eficiência do algoritmo de correção do efeito de suavização da

krigagem ordinária.

Os resultados para as amostras da distribuição lognormal invertida

encontram-se nas Tabelas 29 a 32 e Figuras 44 e 45.

Tabela 29: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 36 pontos de dados da distribuição lognormal invertida (Variância Amostral = 5,600).

Nppq=1 Nppq=grid Nppq Variância

inicial Fator ótimo

Variância corrigida

Variância inicial

Fator ótimo

Variância corrigida

1 5,003 1,292 5,429 5,003 1,292 5,429 2 4,473 1,472 5,279 4,125 1,796 5,250 3 4,360 1,423 5,257 3,698 1,955 5,102 4 4,040 1,329 5,298 3,438 1,967 5,137 5 4,201 1,363 5,280 2,983 2,310 5,063 6 4,147 1,360 5,261 2,759 2,518 4,977 7 4,122 1,359 5,245 2,674 2,565 4,948 8 4,111 1,358 5,241 2,655 2,581 4,938 9 4,110 1,358 5,241 2,653 2,582 4,936 10 4,110 1,358 5,241 2,653 2,582 4,936

Page 77: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

64

Tabela 30: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 64 pontos de dados da distribuição lognormal invertida (Variância Amostral= 2,631).

Nppq=1 Nppq=grid Nppq Variância

inicial Fator ótimo

Variância corrigida

Variância inicial

Fator ótimo

Variância corrigida

1 2,389 1,198 2,607 2,389 1,198 2,607 2 2,455 1,106 2,611 2,416 1,132 2,587 3 2,371 1,139 2,598 2,174 1,285 2,545 4 2,364 1,129 2,589 2,133 1,283 2,544 5 2,368 1,115 2,583 1,956 1,393 2,518 6 2,376 1,104 2,584 1,802 1,506 2,497 7 2,322 1,124 2,574 1,660 1,635 2,435 8 2,324 1,119 2,570 1,597 1,679 2,415 9 2,310 1,121 2,564 1,513 1,758 2,378 10 2,295 1,125 2,559 1,460 1,807 2,349

Tabela 31: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 90 pontos de dados da distribuição lognormal invertida (Variância Amostral = 4,458).

Nppq=1 Nppq=grid Nppq Variância

inicial Fator ótimo

Variância corrigida

Variância inicial

Fator ótimo

Variância corrigida

1 4,489 0,978 4,432 4,489 0,978 4,432 2 4,167 1,158 4,387 3,922 1,356 4,358 3 4,140 1,137 4,383 3,652 1,506 4,329 4 4,109 1,128 4,375 3,360 1,672 4,298 5 4,105 1,112 4,387 3,082 1,834 4,294 6 4,048 1,118 4,379 2,769 2,073 4,262 7 4,057 1,104 4,374 2,545 2,241 4,234 8 4,074 1,093 4,378 2,390 2,350 4,200 9 4,057 1,091 4,373 2,217 2,494 4,181 10 4,057 1,087 4,376 2,065 2,632 4,173

Tabela 32: Variâncias inicial e corrigida e fator ótimo para as condições mínima e nppq=grid para a amostra com 121 pontos de dados da distribuição lognormal invertida (Variância Amostral = 4,330).

Nppq=1 Nppq=grid Nppq Variância

inicial Fator ótimo

Variância corrigida

Variância inicial

Fator ótimo

Variância corrigida

1 5.257 0.520 4.330 5.257 0.520 4.330 2 4.814 0.757 4.330 4.639 0.824 4.330 3 4.691 0.847 4.330 4.296 1.018 4.326 4 4.657 0.881 4.330 4.054 1.140 4.310 5 4.655 0.897 4.330 3.831 1.242 4.283 6 4.628 0.915 4.330 3.540 1.381 4.272 7 4.621 0.925 4.330 3.266 1.517 4.258 8 4.622 0.931 4.330 3.012 1.450 4.233 9 4.550 0.951 4.330 2.741 1.814 4.190 10 4.500 0.962 4.330 2.490 1.989 4.171

Page 78: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

65

a)

1

2

3

4

5

6

1 2 3 4 5 6 7 8 9 10

b)

1

2

3

4

5

6

1 2 3 4 5 6 7 8 9 10 c)

1

2

3

4

5

6

1 2 3 4 5 6 7 8 9 10

d)

1.0

2.0

3.0

4.0

5.0

6.0

1 2 3 4 5 6 7 8 9 10 Variância Amostral S2 Var[Z**ko] (nppq=grid) Var. Corrigida (nppq=grid) Var[Z**ko] (cond. mín.) Var. Co rrigida (cond. mín.)

Figura 44: Gráficos da variância inicial e variância corrigida em função do nppq para as amostras da distribuição lognormal invertida com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados.

a)

0.40.60.81.01.21.41.61.8

2.02.22.42.6

1 2 3 4 5 6 7 8 9 10

b)

0.4

0.60.8

1.01.2

1.41.6

1.82.0

2.22.4

2.6

1 2 3 4 5 6 7 8 9 10 c)

0.40.60.8

1.01.21.41.6

1.82.02.22.4

2.6

1 2 3 4 5 6 7 8 9 10

d)

0.4

0.60.8

1.0

1.21.4

1.6

1.8

2.02.2

2.4

2.6

1 2 3 4 5 6 7 8 9 10

Figura 45: Gráficos da variação do fator ótimo em função do nppq para as amostras da distribuição lognormal invertida com 36 (a), 64 (b), 90 (c) e 121 (d) pontos de dados.

Page 79: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

66

Para a distribuição lognormal invertida, a amostra com 36 pontos de dados

não apresenta fatores ótimos próximos a um, pois as variâncias iniciais são sempre

menores que as variâncias amostrais. Para as outras amostras, os fatores ótimos

são próximos de um para quase toda a vizinhança pesquisada. Conclui-se assim

que a distribuição lognormal invertida, apresentando alta continuidade espacial, não

requer um grande esforço para fazer a correção do efeito de suavização da

krigagem ordinária.

7.2 Estudo da eficiência da correção em distribuições lognormais com aplicação da

krigagem normal

Numa segunda parte desta pesquisa, vamos considerar agora o estudo da

eficiência da correção do efeito de suavização (tanto com a condição nppq=1 e

nppq=nppq do grid) em distribuições lognormais. Como mencionado anteriormente,

vamos considerar 18 distribuições com assimetrias positivas, onde somente a

variável Log12, com CV=1,300 (maior que 1,255), pode ser considerada tipicamente

lognormal. Então, temos desde distribuições próximas da normal até distribuições

lognormais. Outra maneira de medir a eficiência do método de correção do efeito de

suavização, é através da comparação da imagem calculada com a imagem do

conjunto completo. Essa comparação pode ser feita através do cálculo do

coeficiente de correlação, bem como pela medida do erro quadrático médio (RMS).

Os resultados serão apresentados e discutidos variável à variável.

A Tabela 33 e Figura 46 apresentam os resultados para a variável Log1.

Tabela 33: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log1.

Cv= 0,096 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,9395 0,9356 0,9356 0,0374 0,0354 0,0354 2 0,9267 0,9433 0,9439 0,0432 0,0335 0,0333 3 0,8999 0,9432 0,9372 0,0502 0,0335 0,0352 4 0,8678 0,9405 0,9205 0,0568 0,0343 0,0394 5 0,8377 0,9394 0,9069 0,0618 0,0346 0,0425 6 0,8179 0,9397 0,9020 0,0650 0,0345 0,0436 7 0,8028 0,9411 0,9022 0,0672 0,0341 0,0435 8 0,7906 0,9415 0,9004 0,0688 0,0340 0,0439 9 0,7804 0,9410 0,8975 0,0701 0,0341 0,0445 10 0,7690 0,9401 0,8912 0,0714 0,0344 0,0458

Page 80: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

67

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

target Z(x) x Z*KO(x)

Z(x) x Z**KO(x) (cond. mín.) Z(x) x Z**KO(x) (nppq=grid)

0.030

0.035

0.040

0.045

0.050

0.055

0.060

0.065

0.070

0.075

0.080

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 46: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log1. Coeficiente de correlação (esquerda) e erro RMS (direita).

Para a variável Log1 fica evidente que a condição mínima para interpolação

da variável secundária (número de desvios padrão de interpolação) produz os

melhores resultados. A krigagem ordinária depende fortemente da vizinhança. Os

seus resultados deterioram com o aumento da vizinhança. Entretanto, as estimativas

com efeito de suavização corrigido praticamente independem da vizinhança

considerada, demonstrando a efetividade do algoritmo de pós-processamento para

correção do efeito de suavização da krigagem ordinária.

Para a variável Log2, os resultados encontram-se na Tabela 34 e Figura 47.

Tabela 34: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log2.

Cv= 0,192 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,9411 0,9377 0,9377 0,0753 0,0709 0,0709 2 0,9276 0,9446 0,9446 0,0881 0,0676 0,0676 3 0,8994 0,9450 0,9397 0,1030 0,0673 0,0705 4 0,8653 0,9424 0,9213 0,1170 0,0689 0,0801 5 0,8344 0,9415 0,9075 0,1271 0,0694 0,0866 6 0,8144 0,9411 0,9010 0,1335 0,0697 0,0894 7 0,7989 0,9422 0,9010 0,1380 0,0690 0,0894 8 0,7866 0,9427 0,8995 0,1413 0,0688 0,0900 9 0,7761 0,9421 0,8964 0,1439 0,0691 0,0913 10 0,7645 0,9412 0,8899 0,1466 0,0696 0,0940

Page 81: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

68

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

target Z(x) x Z*KO(x)

Z(x) x Z**KO(x) (cond. mín.) Z(x) x Z**KO(x) (nppq=grid)

0.06

0.07

0.08

0.09

0.10

0.11

0.12

0.13

0.14

0.15

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

Figura 47: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log2. Coeficiente de correlação (esquerda) e erro RMS (direita).

Para essa variável, valem as mesmas considerações feitas para a variável

Log1. Onde fica evidente que a condição mínima produz melhores resultados.

A Tabela 35 e Figura 48 apresentam os resultados para a variável Log3.

Tabela 35: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log3.

Cv= 0,291 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x)

Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,9411 0,9373 0,9411 0,1167 0,1102 0,1102 2 0,9265 0,9433 0,9265 0,1381 0,1062 0,1063 3 0,8997 0,9447 0,8997 0,1603 0,1050 0,1084 4 0,8665 0,9424 0,8665 0,1815 0,1071 0,1223 5 0,8361 0,9415 0,8361 0,1972 0,1079 0,1318 6 0,8165 0,9408 0,8165 0,2071 0,1086 0,1365 7 0,8012 0,9414 0,8012 0,2140 0,1080 0,1368 8 0,7889 0,9418 0,7889 0,2193 0,1076 0,1380 9 0,7786 0,9413 0,7786 0,2234 0,1081 0,1399 10 0,7672 0,9404 0,7672 0,2276 0,1089 0,1440

Page 82: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

69

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

target Z(x) x Z*KO(x)

Z(x) x Z**KO(x) (cond. mín.) Z(x) x Z**KO(x) (nppq=grid)

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

0.16

0.18

0.20

0.22

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Figura 48: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log3. Coeficiente de correlação (esquerda) e erro RMS (direita).

Novamente, para a variável Log3 se observa o mesmo comportamento em

relação às variáveis anteriores.

Para as variáveis Log4 a Log18, os resultados encontram-se nas Tabelas 36

a 50 e Figuras 49 a 63, respectivamente. Em todas essas tabelas e figuras, se pode

verificar o mesmo comportamento observado para as variáveis Log1 a Log3. Na

realidade, o coeficiente de correlação vai diminuindo com o aumento do coeficiente

de variação.

Tabela 36: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log4.

Cv= 0,391 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,9386 0,9346 0,9346 0,1656 0,1570 0,1570 2 0,9223 0,9387 0,9385 0,1987 0,1547 0,1550 3 0,8940 0,9403 0,9378 0,2304 0,1527 0,1559 4 0,8584 0,9383 0,9204 0,2609 0,1552 0,1756 5 0,8268 0,9379 0,9080 0,2824 0,1558 0,1881 6 0,8070 0,9368 0,9001 0,2958 0,1571 0,1956 7 0,7911 0,9370 0,8991 0,3054 0,1568 0,1965 8 0,7785 0,9377 0,8971 0,3126 0,1560 0,1983 9 0,7684 0,9372 0,8941 0,3181 0,1565 0,2010 10 0,7573 0,9363 0,8883 0,3237 0,1576 0,2062

Page 83: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

70

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

target Z(x) x Z*KO(x)

Z(x) x Z**KO(x) (cond. mín.) Z(x) x Z**KO(x) (nppq=grid)

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0.35

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Figura 49: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log4. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 37: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log5.

Cv= 0,494 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

1 0,9334 0,9293 0,9293 0,2269 0,2159 0,2159 2 0,9147 0,9300 0,9292 0,2762 0,2201 0,2213 3 0,8817 0,9316 0,9295 0,3216 0,2176 0,2209 4 0,8404 0,9299 0,9078 0,3640 0,2203 0,2513 5 0,8078 0,9297 0,8955 0,3911 0,2205 0,2667 6 0,7869 0,9281 0,8859 0,4080 0,2230 0,2779 7 0,7698 0,9278 0,8841 0,4201 0,2235 0,2798 8 0,7566 0,9289 0,8824 0,4293 0,2217 0,2817 9 0,7463 0,9288 0,8805 0,4362 0,2219 0,2838 10 0,7352 0,9280 0,8756 0,4432 0,2231 0,2893

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

target Z(x) x Z*KO(x)

Z(x) x Z**KO(x) (cond. mín.) Z(x) x Z**KO(x) (nppq=grid)

0.20

0.25

0.30

0.35

0.40

0.45

0.50

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Figura 50: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log5. Coeficiente de correlação (esquerda) e erro RMS (direita).

Page 84: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

71

Tabela 38: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log6.

Cv= 0,600 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,9282 0,9215 0,9215 0,3023 0,2928 0,2928 2 0,9069 0,9221 0,9230 0,3708 0,3011 0,2994 3 0,8846 0,9247 0,9265 0,4134 0,2961 0,2927 4 0,8552 0,9238 0,9158 0,4566 0,2978 0,3125 5 0,8257 0,9229 0,9066 0,4928 0,2996 0,3284 6 0,8072 0,9221 0,8994 0,5158 0,3011 0,3401 7 0,7925 0,9216 0,8973 0,5321 0,3020 0,3434 8 0,7809 0,9219 0,8953 0,5441 0,3013 0,3466 9 0,7720 0,9220 0,8953 0,5527 0,3013 0,3494 10 0,7613 0,9211 0,8883 0,5622 0,3029 0,3573

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

target Z(x) x Z*KO(x)

Z(x) x Z**KO(x) (cond. mín.) Z(x) x Z**KO(x) (nppq=grid)

0.20

0.25

0.30

0.35

0.40

0.45

0.50

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

Figura 51: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log6. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 39: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log7.

Cv= 0,710 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

1 0,919 0,911 0,911 0,404 0,394 0,394 2 0,894 0,908 0,909 0,501 0,418 0,415 3 0,869 0,911 0,914 0,558 0,412 0,404 4 0,835 0,910 0,901 0,615 0,413 0,432 5 0,804 0,909 0,892 0,658 0,415 0,450 6 0,786 0,909 0,884 0,685 0,416 0,466 7 0,771 0,908 0,882 0,704 0,418 0,470 8 0,759 0,908 0,880 0,719 0,417 0,474 9 0,749 0,909 0,879 0,730 0,416 0,476 10 0,738 0,908 0,873 0,741 0,418 0,486

Page 85: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

72

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) target

0.20

0.22

0.24

0.26

0.28

0.30

0.32

0.34

0.36

0.38

0.40

0.42

0.44

0.46

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Figura 52: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log7. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 40: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log8.

Cv= 0,822 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,908 0,899 0,899 0,538 0,528 0,528 2 0,879 0,891 0,893 0,677 0,577 0,572 3 0,851 0,894 0,899 0,747 0,570 0,557 4 0,814 0,893 0,885 0,820 0,573 0,592 5 0,783 0,893 0,877 0,871 0,573 0,610 6 0,765 0,892 0,868 0,902 0,575 0,631 7 0,749 0,891 0,865 0,925 0,578 0,637 8 0,737 0,892 0,864 0,892 0,575 0,641 9 0,727 0,892 0,863 0,956 0,574 0,643 10 0,716 0,891 0,858 0,969 0,576 0,654

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 53: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log8. Coeficiente de correlação (esquerda) e erro RMS (direita).

Page 86: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

73

Tabela 41: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log9.

Cv= 0,938 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

1 0,893 0,884 0,884 0,717 0,706 0,706 2 0,860 0,871 0,873 0,913 0,795 0,789 3 0,829 0,873 0,880 1,003 0,790 0,768 4 0,788 0,872 0,864 1,096 0,793 0,815 5 0,757 0,872 0,858 1,154 0,792 0,831 6 0,738 0,871 0,848 1,190 0,795 0,857 7 0,721 0,869 0,845 1,218 0,801 0,866 8 0,708 0,870 0,843 1,239 0,796 0,869 9 0,698 0,871 0,843 1,254 0,793 0,871 10 0,687 0,870 0,884 1,270 0,796 0,882

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.5

0.6

0.7

0.8

0.9

1.0

1.1

1.2

1.3

1.4

1.5

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 54: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log9. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 42: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log10.

Cv= 1,056 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

1 0,877 0,866 0,866 0,955 0,943 0,943 2 0,837 0,847 0,850 1,234 1,094 1,085 3 0,807 0,849 0,859 1,342 1,088 1,057 4 0,763 0,848 0,842 1,454 1,092 1,112 5 0,733 0,848 0,839 1,521 1,091 1,122 6 0,713 0,847 0,829 1,564 1,094 1,153 7 0,696 0,844 0,825 1,596 1,103 1,166 8 0,682 0,846 0,824 1,621 1,097 1,169 9 0,672 0,848 0,824 1,640 1,092 1,167 10 0,662 0,847 0,821 1,658 1,095 1,178

Page 87: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

74

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.5

0.6

0.7

0.8

0.9

1.0

1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

1.9

2.0

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 55: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log10. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 43: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log11.

Cv= 1,177 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,859 0,847 0,847 1,270 1,259 1,259 2 0,814 0,822 0,826 1,665 1,499 1,486 3 0,783 0,823 0,835 1,788 1,494 1,450 4 0,741 0,822 0,819 1,919 1,499 1,510 5 0,711 0,822 0,819 1,998 1,497 1,511 6 0,692 0,822 0,811 2,048 1,500 1,542 7 0,675 0,819 0,806 2,086 1,511 1,560 8 0,661 0,820 0,806 2,116 1,504 1,563 9 0,651 0,822 0,807 2,138 1,497 1,558 10 0,641 0,822 0,804 2,159 1,500 1,571

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.2

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 56: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log11. Coeficiente de correlação (esquerda) e erro RMS (direita).

Page 88: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

75

Tabela 44: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log12.

Cv= 1,300 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

1 0,841 0,826 0,826 1,687 1,678 1,678 2 0,788 0,795 0,799 2,247 2,050 2,032 3 0,761 0,796 0,809 2,376 2,046 1,989 4 0,723 0,795 0,798 2,520 2,051 2,039 5 0,693 0,794 0,799 2,614 2,051 2,037 6 0,677 0,795 0,796 2,670 2,049 2,050 7 0,662 0,793 0,791 2,714 2,058 2,071 8 0,650 0,794 0,791 2,749 2,053 2,075 9 0,640 0,796 0,792 2,775 2,045 2,071 10 0,631 0,795 0,789 2,801 2,048 2,085

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.5

0.7

0.9

1.1

1.3

1.5

1.7

1.9

2.1

2.3

2.5

2.7

2.9

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 57: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log12. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 45: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log13.

Cv= 1,424 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,820 0,803 0,803 2,244 2,236 2,236 2 0,760 0,765 0,770 3,038 2,806 2,785 3 0,735 0,766 0,780 3,181 2,803 2,734 4 0,699 0,764 0,771 3,341 2,809 2,781 5 0,670 0,764 0,771 3,453 2,813 2,781 6 0,655 0,765 0,769 3,517 2,809 2,790 7 0,642 0,763 0,769 3,568 2,818 2,795 8 0,629 0,764 0,769 3,610 2,813 2,798 9 0,620 0,766 0,771 3,641 2,803 2,788 10 0,610 0,765 0,769 3,672 2,806 2,801

Page 89: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

76

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.5

0.9

1.3

1.7

2.1

2.5

2.9

3.3

3.7

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 58: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log13. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 46: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log14.

Cv= 1,549 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,797 0,778 0,778 2,989 2,979 2,979 2 0,730 0,734 0,739 4,117 3,840 3,815 3 0,705 0,734 0,749 4,288 3,841 3,757 4 0,668 0,732 0,740 4,481 3,849 3,813 5 0,640 0,732 0,742 4,608 3,853 3,801 6 0,625 0,732 0,741 4,682 3,848 3,808 7 0,611 0,730 0,743 4,742 3,859 3,798 8 0,599 0,731 0,743 4,790 3,853 3,799 9 0,590 0,734 0,746 4,826 3,841 3,787 10 0,580 0,733 0,744 4,862 3,845 3,800

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

5.0

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 59: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log14. Coeficiente de correlação (esquerda) e erro RMS (direita).

Page 90: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

77

Tabela 47: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log15.

Cv= 1,675 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,773 0,753 0,753 3,979 3,969 3,969 2 0,698 0,701 0,706 5,591 5,256 5,227 3 0,675 0,701 0,717 5,781 5,259 5,161 4 0,639 0,699 0,708 6,000 5,268 5,216 5 0,613 0,698 0,712 6,148 5,275 5,195 6 0,598 0,700 0,712 6,233 5,267 5,201 7 0,586 0,698 0,715 6,302 5,278 5,179 8 0,574 0,699 0,719 6,360 5,270 5,154 9 0,565 0,701 0,722 6,402 5,256 5,135 10 0,556 0,701 0,722 6,443 5,258 5,145

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

5.0

5.5

6.0

6.5

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 60: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log15. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 48: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log16.

Cv= 1,801 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,776 0,742 0,742 4,367 4,581 4,581 2 0,664 0,667 0,671 7,617 7,206 7,176 3 0,640 0,666 0,682 7,871 7,208 7,097 4 0,600 0,665 0,670 8,153 7,215 7,190 5 0,578 0,666 0,676 8,299 7,212 7,154 6 0,561 0,666 0,676 8,404 7,208 7,151 7 0,545 0,661 0,679 8,489 7,245 7,132 8 0,531 0,663 0,684 8,559 7,231 7,098 9 0,521 0,666 0,690 8,609 7,209 7,058 10 0,511 0,665 0,691 8,656 7,215 7,062

Page 91: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

78

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

2.0

2.5

3.0

3.5

4.0

4.5

5.0

5.5

6.0

6.5

7.0

7.5

8.0

8.5

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 61: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log16. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 49: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log17.

Cv= 1,926 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

1 0,755 0,718 0,718 5,715 5,994 5,994 2 0,635 0,635 0,640 10,330 9,846 9,806 3 0,611 0,634 0,650 10,620 9,855 9,720 4 0,572 0,632 0,640 10,953 9,872 9,822 5 0,548 0,632 0,647 11,136 9,876 9,767 6 0,532 0,632 0,648 11,258 9,871 9,755 7 0,517 0,628 0,652 11,356 9,908 9,724 8 0,504 0,630 0,661 11,438 9,892 9,648 9 0,495 0,632 0,669 11,496 9,867 9,576 10 0,485 0,632 0,669 11,550 9,872 9,582

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) coeficiente target

4.0

5.0

6.0

7.0

8.0

9.0

10.0

11.0

12.0

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 62: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log17. Coeficiente de correlação (esquerda) e erro RMS (direita).

Page 92: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

79

Tabela 50: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log18.

Cv= 2,051 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

1 0,733 0,694 0,694 7,504 7,837 7,837 2 0,604 0,602 0,608 14,058 13,480 13,430 3 0,581 0,601 0,617 14,395 13,493 13,340 4 0,542 0,599 0,607 14,783 13,515 13,453 5 0,521 0,598 0,614 14,993 13,521 13,387 6 0,504 0,599 0,616 15,136 13,514 13,372 7 0,490 0,595 0,620 15,250 13,556 13,329 8 0,478 0,597 0,630 15,346 13,536 13,233 9 0,468 0,599 0,640 15,415 13,507 13,124 10 0,459 0,599 0,645 15,479 13,513 13,078

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) coeficiente target

5.0

6.0

7.0

8.0

9.0

10.0

11.0

12.0

13.0

14.0

15.0

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 63: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log18. Coeficiente de correlação (esquerda) e erro RMS (direita). 7.3 Estudo da eficiência da correção em distribuições lognormais com aplicação da

krigagem lognormal

Neste item, se pretende avaliar o impacto da transformada logarítmica e sua

transformada reversa em distribuições lognormais. Para isso, será considerada a

opção lognormal do Programa Crossordkrig2E. Além disso, há necessidade de se

recalcular todos os semivariogramas experimentais com a opção lognormal e depois

modelá-los.

Neste estudo, foram consideradas apenas 10 variáveis das 18 variáveis

disponíveis (Log1, Log3, Log5, Log7, Log9, Log11, Log13, Log15, Log16 e Log18).

Os resultados encontram-se nas Tabelas 51 a 60 e Figuras 64 a 73. Comparando-se

estes resultados (krigagem lognormal) com os anteriores correspondentes (krigagem

Page 93: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

80

normal), pode-se concluir que em geral os resultados da krigagem lognormal são

ligeiramente superiores à krigagem normal. Tratando-se de distribuições lognormais,

qualquer ganho em precisão local é significativo.

Tabela 51: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log1.

Cv= 0,096 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,93926 0,93501 0,93501 0,03745 0,03552 0,03552 2 0,92748 0,94376 0,94472 0,04279 0,03336 0,03308 3 0,91009 0,94411 0,94168 0,04792 0,03325 0,03395 4 0,89108 0,94198 0,93375 0,05248 0,03387 0,03611 5 0,86886 0,94039 0,92515 0,05707 0,03433 0,03830 6 0,85236 0,94073 0,94073 0,06059 0,03424 0,03424 7 0,83752 0,94146 0,92141 0,06322 0,03403 0,03915 8 0,82735 0,94143 0,91933 0,06498 0,03404 0,03963 9 0,81818 0,94126 0,91652 0,06640 0,03409 0,04030 10 0,80805 0,94025 0,91080 0,06782 0,03438 0,04161

0.40

0.50

0.60

0.70

0.80

0.90

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 64: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log1. Coeficiente de correlação (esquerda) e erro RMS (direita).

Tabela 52: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log3.

Cv= 0,291 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,9400 0,9380 0,9380 0,1178 0,1093 0,1093 2 0,9261 0,9442 0,9445 0,1383 0,1055 0,1051 3 0,9076 0,9456 0,9434 0,1553 0,1041 0,1061 4 0,8865 0,9431 0,9343 0,1707 0,1064 0,1141 5 0,8611 0,9414 0,9252 0,1862 0,1080 0,1216 6 0,8419 0,9404 0,9203 0,1976 0,1090 0,1252 7 0,8255 0,9407 0,9182 0,2059 0,1086 0,1268 8 0,8149 0,9407 0,9157 0,2113 0,1087 0,1287 9 0,8055 0,9402 0,9124 0,2156 0,1092 0,1311 10 0,7951 0,9392 0,9056 0,2199 0,1100 0,1359

Page 94: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

81

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.0

0.1

0.2

0.3

0.4

0.5

0.6

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 65: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log3. Coeficiente de correlação (esquerda) e erro RMS (direita).

Tabela 53: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log5.

Cv= 0,494 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

1 0,9334 0,9333 0,9333 0,2284 0,2091 0,2091 2 0,9153 0,9350 0,9353 0,2771 0,2124 0,2119 3 0,8931 0,9370 0,9353 0,3114 0,2092 0,2118 4 0,8661 0,9342 0,9229 0,3436 0,2135 0,2305 5 0,8351 0,9325 0,9122 0,3735 0,2161 0,2456 6 0,8125 0,9304 0,9039 0,3940 0,2195 0,2564 7 0,7951 0,9304 0,9014 0,4078 0,2196 0,2596 8 0,7832 0,9304 0,8983 0,4171 0,2197 0,2635 9 0,7733 0,9296 0,8952 0,4244 0,2209 0,2675 10 0,7621 0,9287 0,8863 0,4318 0,2223 0,2782

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.1

0.2

0.3

0.4

0.5

0.6

0.7

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 66: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log5. Coeficiente de correlação (esquerda) e erro RMS (direita).

Page 95: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

82

Tabela 54: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log7.

Cv= 0,710 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,9190 0,9208 0,9208 0,4077 0,3715 0,3715 2 0,8943 0,9156 0,9166 0,5106 0,4021 0,3999 3 0,8692 0,9179 0,9177 0,5673 0,3966 0,3965 4 0,8377 0,9149 0,9028 0,6207 0,4032 0,4290 5 0,8026 0,9131 0,8908 0,6683 0,4067 0,4536 6 0,7773 0,9100 0,8792 0,6998 0,4135 0,4762 7 0,7583 0,9094 0,8760 0,7207 0,4148 0,4820 8 0,7457 0,9093 0,8719 0,7345 0,4151 0,4897 9 0,7352 0,9085 0,8689 0,7453 0,4170 0,4952 10 0,7236 0,9073 0,8570 0,7564 0,4194 0,5163

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 67: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log7. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 55: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log9.

Cv= 0,938 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,8961 0,9005 0,9005 0,7184 0,6549 0,6549 2 0,8622 0,8855 0,8876 0,9294 0,7569 0,7501 3 0,8306 0,8877 0,8898 1,0230 0,7485 0,7399 4 0,7885 0,8842 0,8689 1,1132 0,7577 0,8001 5 0,7488 0,8835 0,8562 1,1817 0,7586 0,8354 6 0,7230 0,8796 0,8415 1,2226 0,7695 0,8743 7 0,7032 0,8783 0,8362 1,2510 0,7733 0,8879 8 0,6899 0,8779 0,8309 1,2698 0,7740 0,9015 9 0,6785 0,8771 0,8293 1,2850 0,7761 0,9057 10 0,6664 0,8757 0,8129 1,3001 0,7804 0,9451

Page 96: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

83

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.3

0.5

0.7

0.9

1.1

1.3

1.5

1.7

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 68: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log9. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 56: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log11.

Cv= 1,177 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,8646 0,8729 0,8729 1,2671 1,1603 1,1603 2 0,8201 0,8452 0,8491 1,6913 1,4251 1,4085 3 0,7792 0,8471 0,8534 1,8440 1,4120 1,3796 4 0,7257 0,8430 0,8243 1,9876 1,4244 1,4893 5 0,6830 0,8432 0,8100 2,0802 1,4201 1,5416 6 0,6573 0,8378 0,7939 2,1316 1,4390 1,5992 7 0,6362 0,8354 0,7866 2,1690 1,4485 1,6243 8 0,6215 0,8351 0,7786 2,1950 1,4479 1,6520 9 0,6099 0,8345 0,7685 2,2151 1,4494 1,6857 10 0,5978 0,8328 0,7458 2,2346 1,4559 1,7582

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

0.4

0.6

0.8

1.0

1.2

1.4

1.6

1.8

2.0

2.2

2.4

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 69: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log11. Coeficiente de correlação (esquerda) e erro RMS (direita).

Page 97: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

84

Tabela 57: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log13.

Cv= 1,424 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,8262 0,8383 0,8383 2,2361 2,0665 2,0665 2 0,7703 0,7963 0,8026 3,0834 2,6838 2,6480 3 0,7248 0,7978 0,8095 3,3091 2,6627 2,5820 4 0,6656 0,7934 0,7781 3,5179 2,6763 2,7373 5 0,6207 0,7937 0,7624 3,6472 2,6672 2,8130 6 0,5948 0,7877 0,7451 3,7158 2,6937 2,8978 7 0,5729 0,7844 0,7372 3,7663 2,7110 2,9363 8 0,5580 0,7840 0,7276 3,8009 2,7080 2,9815 9 0,5462 0,7837 0,7157 3,8276 2,7071 3,0367 10 0,5343 0,7815 0,6867 3,8532 2,7175 3,1656

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 70: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log13. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 58: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log15.

Cv= 1,675 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid)

1 0,7812 0,7984 0,7984 3,9585 3,6929 3,6929 2 0,7164 0,7415 0,7502 5,6442 5,0553 4,9871 3 0,6622 0,7420 0,7612 5,9959 5,0229 4,8427 4 0,5956 0,7368 0,7232 6,3058 5,0408 5,0932 5 0,5507 0,7373 0,7070 6,4777 5,0207 5,1981 6 0,5244 0,7305 0,6898 6,5658 5,0591 5,3142 7 0,5013 0,7263 0,6797 6,6335 5,0883 5,3829 8 0,4863 0,7263 0,6670 6,6791 5,0788 5,4653 9 0,4750 0,7264 0,6501 6,7127 5,0728 5,5744 10 0,4632 0,7234 0,6149 6,7457 5,0899 5,7938

Page 98: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

85

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

5.0

5.5

6.0

6.5

7.0

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 71: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log15. Coeficiente de correlação (esquerda) e erro RMS (direita). Tabela 59: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log16.

Cv= 1,801 Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,7570 0,7769 0,7769 5,2630 4,9401 4,9401 2 0,6858 0,7125 0,7226 7,6602 6,9433 6,8483 3 0,6305 0,7127 0,7360 8,0807 6,8996 6,6409 4 0,5622 0,7076 0,6977 8,4515 6,9153 6,9349 5 0,5171 0,7084 0,6816 8,6526 6,8861 7,0558 6 0,4912 0,7016 0,6647 8,7531 6,9291 7,1905 7 0,4683 0,6971 0,6541 8,8309 6,9657 7,2771 8 0,4533 0,6972 0,6405 8,8833 6,9518 7,3809 9 0,4425 0,6975 0,6216 8,9212 6,9410 7,5261 10 0,4314 0,6944 0,5832 8,9582 6,9615 7,8125

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid) coeficiente target

3.0

3.5

4.0

4.5

5.0

5.5

6.0

6.5

7.0

7.5

8.0

8.5

9.0

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 72: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log16. Coeficiente de correlação (esquerda) e erro RMS (direita).

Page 99: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

86

Tabela 60: Coeficientes de correlação e erro RMS entre a imagem calculada e a imagem do conjunto completo para a variável Log18.

Cv= 2,050

Coeficiente de Correlação Erros RMS

NPPQ Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) Z(x) x Z*KO(x) Z(x) x Z**KO(x)

(cond. mín.) Z(x) x Z**KO(x)

(nppq=grid)

1 0,7059 0,7317 0,7317 9,3457 8,8503 8,8503 2 0,6293 0,6541 0,6664 14,1364 13,0921 12,9231 3 0,5652 0,6531 0,6865 14,7916 13,0254 12,5049 4 0,4916 0,6468 0,6414 15,3324 13,0431 12,9874 5 0,4478 0,6483 0,6255 15,5986 12,9876 13,1462 6 0,4216 0,6410 0,6069 15,7314 13,0445 13,3501 7 0,3984 0,6360 0,5959 15,8333 13,1001 13,4824 8 0,3842 0,6367 0,5794 15,9002 13,0715 13,6693 9 0,3736 0,6376 0,5522 15,9484 13,0437 13,9616 10 0,3629 0,6341 0,5132 15,9947 13,0726 14,3754

0.30

0.35

0.40

0.45

0.50

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)

Z(x) x Z**KO(x) (nppq=grid) coeficiente target

6

7

8

9

10

11

12

13

14

15

16

1 2 3 4 5 6 7 8 9 10

NPPQ

Z(x) x Z*KO(x) Z(x) x Z**KO(x) (cond. mín.)Z(x) x Z**KO(x) (nppq=grid)

Figura 73: Variação das estatísticas comparativas com o aumento do número de pontos por quadrante para a variável Log18. Coeficiente de correlação (esquerda) e erro RMS (direita).

Nota-se que, conforme aumenta o coeficiente de variação, torna-se menor o

coeficiente de correlação entre a variável estimada e o dado real. Além disso, a

variável corrigida calculada em condição mínima apresentou resultados superiores

aos calculados com nppq=grid.

Foi feito um estudo comparativo entre as duas técnicas, as figuras 74 a 83

apresentam os diagramas de dispersão entre Z(x) e Z**KO(x) e entre Z(x) e

Z**KOL(x) para a NPPQ=1. As figuras 84 a 93 apresentam os diagramas de

dispersão entre Z(x) e Z**KO(x) e entre Z(x) e Z**KOL(x) para a NPPQ=5.

Page 100: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

87

0.7

0.8

0.9

1.1

1.2

1.3

0.7 0.8 0.9 1.1 1.2 1.3Z**OK

Log1 Coef. Correlação = 0,936

0.7

0.8

0.9

1.1

1.2

1.3

0.7 0.8 0.9 1.1 1.2 1.3EXP(Y**OK)

Log1 Coef. Correlação = 0,936

Figura 74: Diagramas de dispersão da variável Log 1 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1.

0.3

0.7

1.1

1.5

1.8

2.2

0.3 0.7 1.1 1.5 1.8 2.2Z**OK

Log3 Coef. Correlação = 0,94

0.3

0.7

1.0

1.3

1.7

2.0

0.3 0.7 1.0 1.3 1.7 2.0EXP(Y**OK)

Log3 Coef. Correlação = 0,941

Figura 75: Diagramas de dispersão da variável Log 3 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1.

0.2

1.0

1.7

2.5

3.2

4.0

0.2 1.0 1.7 2.5 3.2 4.0Z**OK

Log5 Coef. Correlação = 0,933

0

1

2

2

3

4

0 1 2 2 3 4EXP(Y**OK)

Log5 Coef. Correlação = 0,941

Figura 76: Diagramas de dispersão da variável Log 5 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1.

Page 101: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

88

0

1

2

4

5

6

0 1 2 4 5 6Z**OK

Log7 Coef. Correlação = 0,926

0

1

2

4

5

6

0 1 2 4 5 6EXP(Y**OK)

Log7 Coef. Correlação = 0,935

Figura 77: Diagramas de dispersão da variável Log 7 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1.

0

2

4

6

8

10

0 2 4 6 8 10Z**OK

Log9 Coef. Correlação = 0,909

0

2

4

6

8

10

0 2 4 6 8 10EXP(Y**OK)

Log9 Coef. Correlação = 0,925

Figura 78: Diagramas de dispersão da variável Log 9 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1.

0

3

6

9

12

15

0 3 6 9 12 15Z**OK

Log1

1

Coef. Correlação = 0,896

0

3

6

9

12

15

0 3 6 9 12 15EXP(Y**OK)

Log1

1

Coef. Correlação = 0,92

Figura 79: Diagramas de dispersão da variável Log 11 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1.

Page 102: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

89

0

5

10

15

20

25

0 5 10 15 20 25Z**OK

Log1

3Coef. Correlação = 0,873

0

5

10

15

20

25

0 5 10 15 20 25EXP(Y**OK)

Log1

3

Coef. Correlação = 0,907

Figura 80: Diagramas de dispersão da variável Log 13 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1.

0

7

14

21

28

35

0 7 14 21 28 35Z*OK

Log1

5

Coef. Correlação = 0,878

0

7

14

21

28

35

0 7 14 21 28 35EXP(Y**OK)

Log1

5

Coef. Correlação = 0,898

Figura 81: Diagramas de dispersão da variável Log 15 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1.

0

8

16

24

32

40

0 8 16 24 32 40Z**OK

Log1

6

Coef. Correlação = 0,836

0

8

16

24

32

40

0 8 16 24 32 40EXP(Y**OK)

Log1

6

Coef. Correlação = 0,905

Figura 82: Diagramas de dispersão da variável Log 16 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1.

Page 103: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

90

0

11

22

33

44

55

0 11 22 33 44 55Z*OK

Log1

8Coef. Correlação = 0,866

0

11

22

33

44

55

0 11 22 33 44 55EXP(Y**OK)

Log1

8

Coef. Correlação = 0,898

Figura 83: Diagramas de dispersão da variável Log 18 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=1.

0.7

0.8

0.9

1.1

1.2

1.3

0.7 0.8 0.9 1.1 1.2 1.3Z**OK

Log1 Coef. Correlação = 0,94

0.7

0.8

0.9

1.1

1.2

1.3

0.7 0.8 0.9 1.1 1.2 1.3EXP(Y**OK)

Log1 Coef. Correlação = 0,941

Figura 84: Diagramas de dispersão da variável Log 1 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5.

0.3

0.7

1.1

1.5

1.8

2.2

0.3 0.7 1.1 1.5 1.8 2.2Z**OK

Log3 Coef. Correlação = 0,946

0.3

0.7

1.1

1.5

1.8

2.2

0.3 0.7 1.1 1.5 1.8 2.2EXP(Y**OK)

Log3 Coef. Correlação = 0,942

Figura 85: Diagramas de dispersão da variável Log 3 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5.

Page 104: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

91

0.2

1.0

1.7

2.5

3.2

4.0

0.2 1.0 1.7 2.5 3.2 4.0Z**OK

Log5 Coef. Correlação = 0,938

0.2

1.0

1.7

2.5

3.2

4.0

0.2 1.0 1.7 2.5 3.2 4.0EXP(Y**OK)

Log5 Coef. Correlação = 0,941

Figura 86: Diagramas de dispersão da variável Log 5 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5.

0

1

2

4

5

6

0 1 2 4 5 6Z**OK

Log7 Coef. Correlação = 0,935

0.1

1.3

2.5

3.6

4.8

6.0

0.1 1.3 2.5 3.6 4.8 6.0EXP(Y**OK)

Log7 Coef. Correlação = 0,938

Figura 87: Diagramas de dispersão da variável Log 7 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5.

0

2

4

6

8

10

0 2 4 6 8 10Z**OK

Log9 Coef. Correlação = 0,909

0

2

4

6

8

10

0 2 4 6 8 10EXP(Y**OK)

Log9 Coef. Correlação = 0,927

Figura 88: Diagramas de dispersão da variável Log 9 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5.

Page 105: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

92

0

3

6

9

12

15

0 3 6 9 12 15Z**OK

Log1

1Coef. Correlação = 0,901

0

3

6

9

12

15

0 3 6 9 12 15EXP(Y**OK)

Log1

1

Coef. Correlação = 0,92

Figura 89: Diagramas de dispersão da variável Log 11 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5.

0

5

10

15

20

25

0 5 10 15 20 25Z**OK

Log1

3

Coef. Correlação = 0,878

0

5

10

15

20

25

0 5 10 15 20 25EXP(Y**OK)

Log1

3

Coef. Correlação = 0,905

Figura 90: Diagramas de dispersão da variável Log 13 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5.

0

7

14

21

28

35

0 7 14 21 28 35Z**OK

Log1

5

Coef. Correlação = 0,86

0

7

14

21

28

35

0 7 14 21 28 35EXP(Y**OK)

Log1

5

Coef. Correlação = 0,896

Figura 91: Diagramas de dispersão da variável Log 15 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5.

Page 106: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

93

0

8

16

24

32

40

0 8 16 24 32 40Z**OK

Log1

6Coef. Correlação = 0,852

0

8

16

24

32

40

0 8 16 24 32 40EXP(Y**OK)

Log1

6

Coef. Correlação = 0,905

Figura 92: Diagramas de dispersão da variável Log 16 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5.

0

11

22

33

44

55

0 11 22 33 44 55Z**OK

Log1

8

Coef. Correlação = 0,83

0

11

22

33

44

55

0 11 22 33 44 55EXP(Y**OK)

Log1

8Coef. Correlação = 0,897

Figura 93: Diagramas de dispersão da variável Log 18 entre Z(x) e Z**KO(x) (esquerda) e entre Z(x) e Z**KOL(x) (direita) para a NPPQ=5.

Nos diagramas de dispersão, fica clara a superestimativa dos valores, no

entanto a estimativa por krigagem lognormal apresentou coeficientes de correlação

mais próximos a um na maioria das situações, exceto para a variável Log3 com

nppq=5. Fica evidente que a técnica de krigagem lognormal e a correção das

estimativas no domínio logarítmico apresenta resultados mais próximos dos valores

reais.

Com relação a vizinhança, o nppq=1 apresentou, comparativamente

coeficientes de correlação maiores e a diferença entre os coeficientes de correlação

para nppq=1 e nppq=5 aumenta conforme aumenta-se o coeficiente de variação.

Page 107: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

94

Foi analisado o comportamento do fator ótimo em relação ao aumento do

coeficiente de variação para diferentes números de pontos por quadrante tanto para

a condição mínima (figura 94), quanto para condição de nppq=grid (figura 95).

Fator Ótimo (Condição Mínima)

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1.05

1.10

0.10 0.19 0.29 0.39 0.49 0.60 0.71 0.82 0.94 1.06 1.18 1.30 1.42 1.55 1.68 1.80 1.93 2.05CV

Fato

r Ó

timo

v nppq = 1

nppq = 2nppq = 3nppq = 4nppq = 5nppq = 6nppq = 7nppq = 8nppq = 9nppq = 10

Fator Ótimo (NPPQ=Grid)

0.6

0.7

0.8

0.9

1.0

1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

1.9

2.0

2.1

2.2

2.3

0.10 0.19 0.29 0.39 0.49 0.60 0.71 0.82 0.94 1.06 1.18 1.30 1.42 1.55 1.68 1.80 1.93 2.05CV

Fato

r Ó

timo

v nppq = 1

nppq = 2

nppq = 3nppq = 4

nppq = 5

nppq = 6

nppq = 7

nppq = 8nppq = 9

nppq = 10

Figura 94: Gráficos comparando o Fator Ótimo em função do número de pontos por quadrante na krigagem ordinária. (a) para NPPQ em condição mínima e (b) para NPPQ igual ao grid.

Page 108: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

95

Fator Ótimo (Condição Mínima)

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

1.00

1.05

1.10

1.15

0.10 0.29 0.49 0.71 0.94 1.18 1.42 1.68 1.93 2.05CV

Fato

r Ó

timo

v

nppq = 1nppq = 2nppq = 3nppq = 4nppq = 5nppq = 6nppq = 7nppq = 8nppq = 9nppq = 10

Fator Ótimo (NPPQ=Grid)

0.6

0.7

0.8

0.9

1.0

1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

1.9

2.0

2.1

2.2

2.3

0.10 0.29 0.49 0.71 0.94 1.18 1.42 1.68 1.93 2.05CV

Fato

r Ó

timo

v

nppq = 1

nppq = 2

nppq = 3nppq = 4

nppq = 5

nppq = 6

nppq = 7

nppq = 8nppq = 9

nppq = 10

Figura 95: Gráficos comparando o Fator Ótimo em função do número de pontos por quadrante na krigagem logarítimica ordinária. (a) para NPPQ em condição mínima e (b) para NPPQ igual ao grid.

Na condição mínima, o fator ótimo próximo de um é obtido em vizinhanças

variáveis, não sendo possível definir uma vizinhança ótima, no entando, observa-se

um maior achatamento no comportamento das curvas de vizinhança para o fator

ótimo obtido por krigagem logarítmica ordinária.

Para um nppq igual ao grid, independentemente do coeficiente de variação,

tanto na krigagem normal, quanto na krigagem logarítmica apenas as vizinhanças 2

Page 109: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

96

e 3 apresentam valores de fator ótimo próximos a um. O mesmo achatamento

observado na condição mínima ocorre no fator ótimo da krigagem logarítmica, porém

o espaçamento entre as curvas é mais acentuado, mostrando maior variabilidade

nos resultados em função da variação do nppq.

Page 110: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

97

8. CONSIDERAÇÕES FINAIS

Nesta pesquisa, foi possível estudar o comportamento de diferentes

distribuições estatísticas em relação à correção do efeito de suavização da

krigagem ordinária. Dentre as distribuições estudadas (normal, lognormal e

lognormal invertida), as distribuições normal e lognormal invertida são aquelas

que não apresentam dificuldades na correção do efeito de suavização da

krigagem ordinária. Além disso, a distribuição lognormal invertida, devido à sua

baixa variabilidade, é aquela mais fácil de ser trabalhada, mesmo em condições

adversas com pequeno número de pontos de dados (amostra com 36 pontos). A

baixa variabilidade espacial tem conseqüência na continuidade espacial da

variável em estudo.

A distribuição lognormal é uma distribuição típica de variáveis que

representam fenômenos raros, tais como: teores de metais raros, nível de

contaminantes em um determinado sítio etc. A característica principal desta

distribuição é a presença de uns poucos valores altos em meio a um grande

número de valores baixos. Quando valores baixos são influenciados pelos

valores altos, há deterioração da precisão local. Assim, para dados que

apresentem este tipo de distribuição, deve-se utilizar a técnica da krigagem

lognormal que trabalha com os dados transformados para o domínio logarítmico

e depois faz a transformada reversa.

Outro aspecto a ser considerado na correção do efeito de suavização da

krigagem ordinária é, sem dúvida, o número de pontos por quadrante para

interpolação do valor da variável de interesse em um ponto não amostrado.

Embora o algoritmo de pós-processamento seja eficiente na correção do efeito

de suavização, deve-se evitar utilizar fatores muito diferentes de um, pois

alteram as quantidades de correção originais e, portanto, modificando

significativamente as suas características. Assim, o número de vizinhos

próximos deve ser pesquisado de tal modo a garantir que o fator de correção

esteja próximo de um. E, nesta pesquisa, foi possível demonstrar que sempre

Page 111: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

98

existe uma condição em que o fator de correção está próximo de um, seja com

nppq=1 (condição mínima), como para nppq=grid (condição máxima).

Como mencionado anteriormente, a krigagem lognormal deve ser

empregada sempre que os dados apresentem distribuição lognormal. Foi

utilizado nesta pesquisa um algoritmo inédito que se mostrou superior à solução

tradicional. Na realidade, a krigagem lognormal é melhor que a krigagem normal

para distribuições com assimetria positiva apresentando coeficientes de variação

maiores que 0,938. Os resultados da krigagem lognormal, para distribuições

com coeficientes de variação menores que 0,938, foram no mínimo iguais ou

superiores que os mesmos obtidos pela krigagem normal. Entretanto, para

distribuições com coeficientes de variação superiores a 0,938, houve ganho

significativo de precisão local com a aplicação da técnica da krigagem

lognormal. Tratando-se de dados com distribuição lognormal, o ganho em

precisão local é bastante considerável, pois esta distribuição é muito difícil de

ser trabalhada.

Finalmente, o algoritmo de pós-processamento para correção do efeito de

suavização da krigagem ordinária mostrou-se eficiente em todas as situações

estudadas e, além disso, melhor que a solução tradicional para a transformada

reversa da krigagem lognormal.

Page 112: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

99

REFERÊNCIAS BIBLIOGRÁFICAS

Armstrong, M., 1994, Is research in mining geostats as dead as a dodo?: in Dimitrakopoulos, R., ed., Geostatistics for the next century: Kluwer Academic, Dordrecht, Netherlands, p. 303–312.

Armstrong, M., 1998, Basic Linear Geostatistics: Ed. Springer, 153 p.

Brooker , P.I. 1979. Kriging. Engineering & Mining Journal,180(9): 148-153.

Caers, J., 2000, Adding local accuracy to direct sequential simulation: Math. Geol., v. 32, no. 7, p. 815–850.

Caers, J., 2003, History matching under a training image-based geological model constraint: Soc. Petrol. Eng. J., SPE #74716, p. 218–226.

Deutsch, C. V., e Journel, A. G., 1992, GSLIB: Geostatistical software library and user’s guide: Oxford University Press, New York, 340 p.

David, M., Marcotte, D. e Soulíe, M.,1984 A., Conditional bias in kriging and a suggested correction. in Verly, G., David, M., Journel, A. G., e Marechal, A. eds.,Geostatistics for natural resources characterization, Part 1: D. Reidel, Dordrecht, Holland,p. 217–231.

Goovaerts, P., 1997, Geostatistics for natural resources evaluation: Oxford University Press, New York, 483 p.

Goovaerts, P., 1998, Accounting for estimation optimality criteria in simulated annealing: Math. Geology, v. 30, no. 5, p. 511–534.

Guertin, K., 1984, Correcting conditional bias, in Verly, G., David, M., Journel, A. G., e Marechal, A., eds.,Geostatistics for natural resources characterization, Part 1: D. Reidel, Dordrecht, Holland,p. 245–260.

Hohn, M. E., 1999, Petroleum and Geostatistics. Kluwer Academic Publishers, Dordrecht, 235 p.

Isaaks, E. H., e Srivastava, R. M., 1989, An introduction to applied geostatistics: Oxford University Press, New York, 561 p.

Journel, A. G., 1994, Modelling uncertainty: Some conceptual thoughts, in Dimitrakopoulos, R., ed.,Geostatistics for the next century: Kluwer, Dordrecht, Holland, p. 30–43.

Journel, A. G., e Huijbregts, C. J., 1978, Mining geostatistics: Academic Press, London, 600 p.

Page 113: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

100

Journel, A., Kyriakidis, P. C., e Mao, S., 2000, Correcting the smoothing effect of estimators: A spectral postprocessor: Math. Geol., v. 32, no. 7, p. 787–813.

Journel, A. e Xu, W., 1994, Posterior identification of histograms conditional to local data: Math. Geology, v. 26, no. 3, p. 323-359.

Journel e Rossi (1989) Journel, A. G., and Rossi, M. E., 1989, When do we need a trend model in kriging?: Math. Geology, v. 21, no. 7, p. 715–739.

Olea, R. A., 1991, Geostatistical glossary and multilingual dictionary: Oxford University Press, New York, 175 p.

Olea, R. A., and Pawlowsky, V., 1996, Compensating for estimation smoothing in kriging, Math. Geology, v. 28, no. 4, p. 407–417.

Pan, G.C., 1995, Practical Issues of geostatistical reserve estimation in the mining industry. Smothing Effect, conditional bias and recoverable reserves, CIM Bulletin, 88(993):31-37.

Pan, G.C., 1998, Smothing Effect, conditional bias and recoverable reserves, CIM Bulletin, 91(1019):81-86.

Rocha, M.M. 1999. Estudo comparative entre os métodos computacionais de avaliação de reservas e controle de teores da Mina de Capanema, Santa Bárbara, MG. São Paulo, IG-USP. Dissertação de Mestrado. 78p.

Rocha, M.M. e Yamamoto, J. K., 2001, Comparison Between Kriging Variance and Interpolation Variance as Uncertainty Measurements in the Capanema Iron Mine, State of Minas Gerais—Brazil: Natural Resources Research, Vol. 9, No. 3 ,p.223-235.

Sameshima, R., 2000 Modelagem geoestatística aplicada à jazida de apatita de Araxá, MG., Universidade de São Paulo 115 p.( Tese de doutoramento)

Yamamoto, J.K., 1991, Comparação de métodos computacionais para a avaliação de reservas: um estudo de caso da jazida de cobre de Chapada – GO. Universidade de São Paulo 175p. (Tese de doutoramento)

Yamamoto, J.K., 2000, An alternative measure of the reliability of ordinary kriging estimates: Math. Geol., v. 32, no. 4, p. 489–509.

Yamamoto, J.K., 2005, Correcting the Smoothing Effect of Ordinary Kriging Estimates: Math. Geol., v. 37, no. 1, p. 69–94.

Yamamoto, J.K., 2006, Software Geovisual, Versão acadêmica 3.0.

Yamamoto, J.K. 2007a. On unbiased backtransform of lognormal kriging estimates. Computational Geosciences. DOI 10.1007/s10596-007-9046x.

Page 114: Agradecimentos À FAPESP, processo número 03/10087-4. E ao ... · ... Fernando Machado, Anderson Milan, Pedro Simões, Letícia Vicente ... mesma configuração de dados (segundo

101

Yamamoto, J.K. 2007b. Improving ore reserve calculations for lognormal data. Em http://downloads.gecamin.cl/cierre_eventos/apcom2007/prsntcns/00051_00276_pr.pdf, acesso em 16 de maio de 2007.

Yamamoto, J.K. 2007c. GeoVisual: Laboratório de Geoestatística Aplicada. Sig

Yao, T., 1998b, Conditional spectral simulation with phase identification: Math. Geology, v. 30, no. 3, p. 285–308.