estatistica espacial aplicada a agricultura de precisao

82
UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ - UNIOESTE CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA AGRÍCOLA ESTATÍSTICA ESPACIAL APLICADA À AGRICULTURA DE PRECISÃO GUSTAVO HENRIQUE DALPOSSO CASCAVEL - PR Janeiro – 2010

Upload: jose-de-paula-silva

Post on 10-Nov-2015

9 views

Category:

Documents


0 download

DESCRIPTION

Estatistica Espacial aplicada a agricultura de precisao é um compendio sobre o assunto com apresentacao de ferramentas.

TRANSCRIPT

  • UNIVERSIDADE ESTADUAL DO OESTE DO PARAN - UNIOESTE

    CENTRO DE CINCIAS EXATAS E TECNOLGICAS

    PROGRAMA DE PS-GRADUAO EM ENGENHARIA AGRCOLA

    ESTATSTICA ESPACIAL APLICADA AGRICULTURA DE

    PRECISO

    GUSTAVO HENRIQUE DALPOSSO

    CASCAVEL - PR

    Janeiro 2010

  • GUSTAVO HENRIQUE DALPOSSO

    ESTATSTICA ESPACIAL APLICADA AGRICULTURA DE

    PRECISO

    Dissertao apresentada ao Programa de Ps-

    Graduao em Engenharia Agrcola, em

    cumprimento parcial aos requisitos para obteno

    do ttulo de Mestre em Engenharia Agrcola, pela

    UNIOESTE/Campus de Cascavel, rea de

    concentrao Engenharia de Sistemas

    Agroindustriais.

    Orientador: Professor Dr. Miguel Angel Uribe

    Opazo

    Co-orientador: Professor Dr. Erivelto Mercante

    CASCAVEL

    Janeiro - 2010

  • Dalposso, Gustavo Henrique D149 Estatstica espacial aplicada agricultura de preciso. /

    Gustavo Henrique Dalposso. Cascavel, 2010. 66 f.

    Orientador: Prof. Dr. Miguel Angel Uribe Opazo. Dissertao(Mestrado) Universidade Estadual do Oeste do Paran.

    1. Estatstica Aplicada - Agricultura. 2. Geoestatistica . 3. Estatstica Espacial. 4. ndice de Moran. I. Opazo, Miguel Angel Uribe. II. Ttulo.

    CDD 519.5 Ficha Catalogrfica Biblioteca do Campus Cascavel

  • DEDICO

    A Henrique Luis

  • AGRADECIMENTOS

    Ao meu orientador Dr. Miguel Angel Uribe Opazo que me conduziu neste trabalho e

    proporcionou o meu desenvolvimento no Programa de Ps-graduao e por ser um grande amigo e

    profissional.

    Ao meu co-orientador Dr. Erivelto Mercante pela parceria firmada, pois esta alm de render

    diversos trabalhos, rendeu uma grande amizade.

    Ao meu amigo professor Jerry Adriani Johann, pelos trabalhos desenvolvidos no LEA, pois

    estes fizeram parte de minha formao.

    A todos os pesquisadores do grupo GGEA, pela oportunidade oferecida.

    Ao Programa de Ps-graduao em Engenharia Agrcola e a todos os professores do curso.

    CAPES pela bolsa concedida.

  • SUMRIO LISTA DE TABELAS ......................................................................... viii

    LISTA DE FIGURAS .......................................................................... ix

    LISTA DE SMBOLOS ....................................................................... x

    RESUMO ............................................................................................. xii

    ABSTRACT ......................................................................................... xiii

    1 INTRODUO .................................................................................. 1

    2 GEOESTATSTICA APLICADA AGRICULTURA DE PRECISO .........................................................................................

    2

    2.1 INTRODUO .................................................................................... 2

    2.2 REVISO BIBLIOGRFICA ............................................................. 4

    2.2.1 Evoluo da geoestatstica .................................................................... 4

    2.2.2 Hipteses e caractersticas importantes ................................................ 4

    2.2.3 Modelo geoestatstico ........................................................................... 6

    2.2.4 Parmetros da estrutura de dependncia espacial ................................. 8

    2.2.5 Modelagem da estrutura de dependncia espacial ................................ 10

    2.2.6 Estimao de parmetros ...................................................................... 13

    2.2.7 Estimador linear geoestatstico: Krigagem ........................................... 15

    2.2.8 Validao cruzada ................................................................................ 16

    2.2.9 Influncia local ..................................................................................... 18

    2.2.10 Acurcia em mapas temticos .............................................................. 19

    2.2.11 Modelagem cartogrfica ....................................................................... 24

    2.3 MATERIAL E MTODOS .................................................................. 25

    2.3.1 Material ................................................................................................. 25

    2.3.2 Metodologia .......................................................................................... 25

    2.4 RESULTADOS E DISCUSSO ......................................................... 29

    2.5 CONCLUSO ...................................................................................... 42

  • 2.6 REFERNCIAS ................................................................................... 43

    3 ESTATSTICA DE REAS APLICADA AGRCULTURA DE PRECISO ...................................................................................

    46

    3.1 INTRODUO .................................................................................... 46

    3.2 ANLISE DE DADOS DE REAS ................................................... 47

    3.2.1 Anlise exploratria .............................................................................. 47

    3.2.2 Elementos bsicos ................................................................................ 47

    3.2.3 Indicador global de autocorrelao espacial ......................................... 49

    3.2.4 Diagrama de espalhamento de Moran .................................................. 50

    3.2.5 Mapa de espalhamento de Moran ......................................................... 51

    3.2.6 ndice local de associao espacial (LISA) ........................................... 52

    3.2.7 Lisa map ............................................................................................... 52

    3.2.8 Moran map ............................................................................................ 53

    3.3 MATERIAL E MTODOS .................................................................. 54

    3.3.1 Material ................................................................................................. 54

    3.3.2 Metodologia .......................................................................................... 55

    3.4 RESULTADOS E DISCUSSO ......................................................... 56

    3.5 CONCLUSO ...................................................................................... 65

    3.6 REFERNCIAS ................................................................................... 66

  • LISTA DE TABELAS

    Tabela 1 Matriz dos erros genrica de ordem k x k ............................................. 18 Tabela 2 Matriz de confuso da k-sima classe .................................................. 20

    Tabela 3 Mtricas derivadas da matriz de confuso por classe ........................... 21 Tabela 4 Matriz de confuso total ....................................................................... 21 Tabela 5 Mtricas derivadas da matriz de confuso total ................................... 22 Tabela 6 Parmetros do semivariograma omnidirecional ................................... 30

    Tabela 7 Modelos ajustados e parmetros obtidos do conjunto amostral completo da produtividade de trigo [t ha-1] ..........................................

    31

    Tabela 8 Validao cruzada para a produtividade de trigo [t ha-1] relativa a todo o conjunto amostral ...................................................................... 31

    Tabela 9 Modelos ajustados e parmetros do conjunto amostral da produtividade de trigo [t ha-1] sem as amostras influentes ...................

    33

    Tabela 10 Validao cruzada para a produtividade de trigo [t ha-1] sem as amostras influentes ...............................................................................

    34

    Tabela 11 Matriz dos erros dos pixels mapas de produtividade de trigo .............. 36 Tabela 12 Produo estimada em cada classe da legenda ..................................... 36 Tabela 13 ndices de acurcia de usurio (AU) e produtor (AP) .......................... 37 Tabela 14 Estatsticas do ndice Kappa ( K ) ................................................... 37 Tabela 15 Elementos (pixels) da matriz de confuso da classe Ck ....................... 37 Tabela 16 Mtricas obtidas das matrizes de confuso de cada classe ................... 38 Tabela 17 Matriz de confuso total da produtividade de trigo .............................. 38 Tabela 18 ndice I de Moran dos ndices NDVI e GVI ......................................... 55

    Tabela 19 Porcentagens de municpios em cada quadrante do grfico de espalhamento de Moran dos ndices NDVI e GVI ............................... 57

    Tabela 20 ndice local de associao espacial (LISA) do ndice NDVI ............... 58 Tabela 21 ndice local de associao espacial (LISA) do ndice GVI .................. 59

  • LISTA DE FIGURAS

    Figura 1 Funes covarincia e variograma ....................................................... 8

    Figura 2 (A) Localizao dos 50 pontos amostrais e (B) Diviso da rea em talhes ...................................................................................................

    23

    Figura 3 Roteiro da anlise geoestatstica ........................................................... 26 Figura 4 Grfico boxcox da produtividade de trigo ............................................ 27

    Figura 5 Grfico espacial da produtividade de trigo ................................. 27 Figura 6 Grfico boxplot da produtividade de soja ................................... 28 Figura 7 Grfico das coordenada versus produtividade de trigo ............... 28

    Figura 8 Semivariogramas direcionais da produtividade de trigo ............. 29 Figura 9 Semivariograma experimental da produtividade de trigo .................... 29 Figura 10 Envelopes simulados ............................................................................ 30

    Figura 11 (A) Grfico de diagnstico |Lmax|; (B) Localizao dos pontos influentes na rea monitorada ...............................................................

    32

    Figura 12 Semivariograma experimental construdo sem os pontos influentes ... 33

    Figura 13 Semivariogramas ajustado: (A) completo e (B) sem os pontos influentes .............................................................................................. 34

    Figura 14 (A) Mapa temtico da produtividade de trigo utilizando 50 elementos amostrais na interpolao e (B) Mapa temtico da produtividade de trigo utilizando 48 elementos amostrais na interpolao......................

    35 Figura 15 Mapa da diferena de produtividade em mdulo entre os dois mapas . 35 Figura 16 Representao dos tipos de contiguidade entre reas. (A)

    Contiguidade Queen rainha, (B) Contiguidade Rook torre e (C) Contiguidade Bishop bispo................................................................

    47

    Figura 17 Construo do grfico de disperso do ndice I de Moran ................... 49 Figura 18 Legenda do mapa de espalhamento de Moran ..................................... 50

    Figura 19 Shapefile dos 36 municpios estudados na Regio Oeste do Paran ..........................................................................................

    52

    Figura 20 Roteiro de anlise que ser trabalhado com ndices de vegetao ....... 53 Figura 21 Evoluo temporal do ndice NDVI ..................................................... 54 Figura 22 Evoluo temporal do ndice GVI ........................................................ 55

    Figura 23 Diagrama de espalhamento de Moran (Moran Scatterplot) para os ndices NDVI e GVI em 23/11/2004, 25/12/2004 e 11/02/2005 .......... 56

    Figura 24 Mapa de significncia LISA do ndice de vegetao NDVI da soja .... 60 Figura 25 Mapa de significncia LISA do ndice de vegetao GVI da soja ....... 61 Figura 26 LISA cluster map do ndice NDVI da soja na safra 2004/2005............ 61

  • LISTA DE SMBOLOS Captulo 2

    )(sZ Valor do atributo na localizao s

    )( hsZ + Valor do atributo na localizao s + h C(h) Funo de covarincia Mdia

    d Espao euclidiano d-dimensional (d 1)

    Matriz de covarincia (s) Modelo espacial linear

    i Parmetros desconhecidos a serem estimados 1 Efeito pepita ou erro de varincia

    2 Contribuio ou varincia de disperso a Alcance ou raio de dependncia espacial

    3 Funo do alcance R Matriz que funo de 3 In Matriz identidade de ordem n

    )(h Funo semivarincia C Patamar

    Vetor de parmetros. OLS Mnimos quadrados ordinrios WLS1 Mnimos quadrados ponderados ML Mxima verossimilhana RML Mxima verossimilhana restrita

    )(L Funo de verossimilhana

    l ( ) Funo log-verossimilhana EM Erro mdio

    )( )(isZ Representa o valor predito por krigagem ordinria no ponto is , sem considerar a observao )( isZ .

    ER Erro mdio reduzido )( )(is Desvio padro da krigagem no ponto is , sem considerar a observao )( isZ

    DPEM Desvio padro do erro mdio SER Desvio padro dos erros reduzidos EA Erro absoluto

    Vetor de perturbao das respostas

  • 0 Ponto de no perturbao LD() Afastamento da verossimilhana EG Exatido global Ck Classe k do mapa temtico AU Acurcia de usurio AP Acurcia de produtor

    K ndice Kappa

    2 Varincia T ndice Tau S ndice de sensibilidade E ndice de especificidade TFPk Taxa de falso positivo TFNk Taxa de falso negativo CCM Coeficiente de correlao de Matthews E Efeito pepita relativo

    Captulo 3

    W Matriz de proximidade espacial Z Vetor dos desvios Wz Vetor de mdias ponderadas I ndice de Moran Global x Mdia dos atributos

    iI ndice LISA 2 varincia da distribuio dos valores dos desvios

  • RESUMO

    As metodologias fornecidas pela estatstica espacial so de grande importncia para estudos envolvendo dados relacionados agricultura, pois permitem conhecer a variabilidade espacial dos atributos estudados e identificar regies que apresentam caractersticas semelhantes, o que permite realizar tratamentos localizados, maximizando as produtividades e minimizando os impactos causados pela aplicao de insumos em excesso. Um dos ramos da estatstica espacial a geoestatstica, que utiliza um conjunto de variveis regionalizadas para modelar a estrutura de dependncia espacial, possibilitando a elaborao de mapas temticos. Atualmente os estudos geoestatsticos no terminam com a elaborao dos mapas, pois alm de estimar o atributo monitorado em locais no amostrados se faz necessrio investigar a qualidade destes mapas, investigando pontos influentes e utilizando medidas que permitam comparar mapas e realizar estimaes de reas. Outra forma de investigao conhecida como estatstica espacial de reas, em que os objetos de anlise so polgonos que representam talhes, bairros, municpios, estados entre outros. Neste tipo de anlise, procura-se identificar autocorrelaes espaciais em nvel global e local, e a forma usual de apresentao dos resultados feita utilizando mapas temticos. Neste trabalho utilizou-se a geoestatstica para investigar a produtividade de trigo em uma rea agrcola de 13,7 hectares no municpio de Salto do Lontra Pr. Das 50 amostras coletadas, identificou-se duas como influentes e, com isso, optou-se por construir dois mapas temticos e compar-los utilizando mtricas derivadas da matriz dos erros. Os resultados mostraram que os mapas so diferentes e a retirada dos pontos influentes foi de fundamental importncia para melhorar a qualidade do mapa temtico, visto que a diferena entre a produtividade estimada e a produtividade real foi de apenas 40 quilos. Para apresentar os recursos fornecidos pela estatstica espacial de reas comparou-se os ndices de vegetao NDVI e GVI da produtividade de soja de 36 municpios da regio Oeste do Paran no ano agrcola 2004/2005. Os resultados permitiram identificar regies com caractersticas semelhantes e que a soja cultivada em perodos distintos na regio.

    Palavras-chave: matriz dos erros, ndice I de Moran, matriz de contiguidade

  • SPATIAL STATISTICS APPLIED TO PRECISION AGRICULTURE

    ABSTRACT

    The methods provided by the spatial statistics are of great importance for studies involving data related to agriculture, for they allow one to know the space variability of the study and identify regions that have similar characteristics, which allows completely localized treatment, maximizing productivity and minimizing the impacts of excessive input application.

    One of the branches of spatial statistics is geostatistics, which uses a set of regionalized variables to model the structure of spatial dependence, allowing the preparation of thematic maps. Currently, geostatistical studies do not end with the preparation of maps, but also estimates monitored the attribute in non-sampled locations. It is necessary to investigate the quality of these maps, investigating influential points and using measurements to compare maps and area estimations.

    Another form of research is known as spatial statistics of areas where the objects of analysis are polygons representing blocks, neighborhoods, cities, states and others. This type of analysis seeks to identify spatial autocorrelation in global and local levels, and the usual form of reporting is through thematic maps.

    In this work we used geostatistics to investigate the productivity of wheat in an agricultural area of 13.7 hectares in the municipality of Salto do Lontra PR. Out of the 50 samples, two were identified as influential, and thus, we chose to build two thematic maps and to compare them using metrics derived from the matrix of errors. The results showed that the maps are different and the removal of influential points was essential to improve the quality of thematic map, since the difference between the estimated yield and actual yield was only 40 Kilos.

    In order to display the resources provided by the spatial statistics of areas we compared to the vegetation rates NDVI and GVI's of soybean yield from 36 cities in Western Paran in the agricultural year of 2004/2005. The results showed regions with similar characteristics and that soybeans grow at different times in the region.

    Keywords: error matrix, Morans I Index, contiguity matrix

  • 1 INTRODUO

    A constante evoluo da informtica, no que diz respeito ao desenvolvimento de softwares e hardwares, aliada ao crescimento da cincia, em relao criao de novos mtodos de pesquisa, est mudando a forma como o homem investiga a agricultura, e isso implica em melhores condies de trabalho para o profissional do campo, que em contrapartida, consegue oferecer produtos com melhor qualidade, proporcionando uma melhor condio de vida para todos, e principalmente, utilizando os recursos do meio ambiente racionalmente. Esta prtica de investigao, que visa estabelecer condies ideais as espcies cultivadas na agricultura, sejam elas qumicas, fsicas ou biolgicas conhecida como agricultura de preciso (AP). Segundo MOLIN (1997), a agricultura de preciso surge como uma nova demanda de informtica na agricultura, pois implica na coleta e manipulao de uma grande quantidade de dados que s podem ser gerenciados por mtodos computacionais. Todo o embasamento dessa nova tecnologia est na anlise da variabilidade espacial dos fatores de produo, especialmente o solo. A partir dessa anlise as decises devem ser tomadas para que se faa ento a aplicao dos insumos de uma forma localizada e com dosagens precisas.

    Entre os diversos mtodos utilizados para monitorar a agricultura, destaca-se a estatstica espacial, termo este referente aos mtodos estatsticos que incorporam nas anlises informaes sobre a localizao, como as coordenadas geogrficas do ponto em que a amostra foi coletada ou a localizao do polgono que representa a regio em estudo. Dentro da estatstica espacial encontram-se diferentes abordagens para anlise de dados georreferenciados, como por exemplo, a geoestatstica e a estatstica espacial de reas.

    A teoria das variveis regionalizadas, ou geoestatstica como mais conhecida, uma cincia que teve seu inicio em investigaes realizadas em minas de ouro na frica do Sul. Por meio de uma anlise geoestatstica possvel estimar dados em locais no amostrados analisando o comportamento espacial do fenmeno e minimizando o erro da estimao.

    O conjunto de recursos proporcionado pela anlise espacial em unidades de reas muito importante dentro do universo de possibilidades j disponibilizados em diversos Sistemas de Informao Geogrfica. A apresentao dos resultados geralmente feita atravs de mapas, que visam identificar regies com caractersticas semelhantes, formando os conhecidos clusters. Nestes mapas, a variao do atributo no espao no representada por uma superfcie contnua, como o caso da geoestatstica, e sim por variaes abruptas de valores. Apesar de limitadas s caractersticas de cada rea, muitas inferncias sobre padres ou comportamentos espaciais dos diversos atributos podem ser realizadas.

  • Neste contexto, o objetivo geral deste trabalho utilizar recursos da estatstica espacial para investigar variveis vinculadas agricultura.

    2 GEOESTATSTICA APLICADA AGRICULTURA DE PRECISO

    2.1 INTRODUO

    O conjunto de atividades agrcolas, compreendendo a produo de alimentos, fibras e energia, pode ser encarado como a alavanca da economia brasileira, e isto de grande importncia, visto que muitos pases desenvolvidos tm excesso de produo agrcola, sendo esta uma das condies para se terem tornado ricos, pois o fato de serem auto-suficientes na produo agrcola tem sido determinante para os elevados nveis de prosperidade. Um fato que de certa forma barra o crescimento da agricultura no Brasil que muitas reas agrcolas comerciais, por trabalharem com produo em larga escala, so tratadas como homogneas, o que acaba trazendo prejuzos para o produtor e para o meio ambiente. Um exemplo a aplicao de fertilizantes calculados com base em ndices mdios de fertilidade. Esta aplicao feita de forma uniforme em toda a rea e, como conseqncia, reas com maior nvel de fertilidade so adubadas em excesso e reas mais pobres no so corrigidas. O mesmo ocorre na aplicao de agro qumicos no combate de pragas e doenas, em que o tratamento uniforme gera problemas de poluio em reas com baixos nveis de infestao. Uma soluo eficaz para contornar este problema apresentada pela agricultura de preciso por meio da geoestatstica, ramo da estatstica espacial que permite estudar superfcies contnuas. A grande diferena em relao estatstica tradicional que, por meio desta metodologia, alm do valor do atributo no ponto em estudo, a sua localizao tambm incorporada na anlise. Esse fato faz com que elementos amostrais prximos tenham valores mais semelhantes e sejam mais correlacionadas do que elementos amostrais mais distantes do ponto estudado. Desta maneira, possvel realizar estimaes em locais no amostrados, permitindo criar mapas temticos que descrevam o comportamento do atributo que est sendo investigado na rea em estudo. A geoestatstica fornece uma soluo para este tipo de problema atravs do interpolador krigagem, nome dado em homenagem ao engenheiro de minas Daniel Krige, pioneiro que, ao realizar trabalhos com dados de minerao, concluiu que a variao destes apresentava uma estruturao que dependia da distncia de amostragem e, desta constatao, surgiram os conceitos bsicos de geoestatstica.

  • Atualmente a geoestatstica encontra-se consolidada como cincia, porm, sua evoluo contnua e dia aps dia surgem novas teorias, mtodos, programas e ndices que ajudam o pesquisador a melhor entender o comportamento do atributo na rea estudada.

  • 2.2 REVISO BIBLIOGRFICA

    2.2.1 Evoluo da geoestatstica

    A geoestatstica tem por objetivo a caracterizao da disperso espacial e espao-temporal das grandezas que definem a quantidade e a qualidade de recursos naturais, tais como florestas, recursos geolgicos, hidrolgicos, ecolgicos ou outros fenmenos espaciais em que os atributos manifestam uma certa estrutura no espao e/ou no tempo, como a contaminao de solos e aquferos, temperatura e pluviometria de uma regio. O seu corpo metodolgico consiste basicamente num conjunto de instrumentos estatsticos que quantificam a continuidade espacial da grandeza em estudo, em modelos de interpolao espacial tendo por base a sua variabilidade estrutural (SOARES, 2000). A teoria das variveis regionalizadas surgiu em meados de 1960 ligada escola francesa hoje conhecida como Centre de Geoestatistique de Fontainebleau, fundada por Georges Matheron. Ao estudar dados de concentrao de ouro em 1951 na frica do Sul, o engenheiro de minas Daniel Krige concluiu que no conseguia encontrar sentido nas varincias se no levasse em considerao a distncia entre as amostras. Baseado nessa observao, Matheron desenvolveu a teoria das variveis regionalizadas, que contm os fundamentos da geoestatstica.

    Segundo LADIM (2006), as variveis regionalizadas so constitudas por um duplo aspecto contraditrio. Pela sua caracterstica aleatria apresenta irregularidades e variao imprevisvel de um ponto para outro e pela sua caracterstica estrutural apresenta relaes existentes entre os pontos no espao motivadas pela sua gnese. Em outras palavras, impossvel estimar com exatido o valor de um atributo - por exemplo, a produtividade num determinado ponto da rea agrcola (aspecto aleatrio) -, mas provvel que se encontre produtividade elevada perto de locais com produtividade alta (aspecto estrutural).

    2.2.2 Hipteses e caractersticas importantes

    Tem-se que uma varivel regionalizada uma funo numrica com distribuio espacial, que varia de um ponto a outro com continuidade aparente, mas cujas variaes no podem ser representadas por uma funo simples, assim, para melhor compreenso dessa ferramenta, se faz necessrio uma apresentao terica de algumas caractersticas importantes.

    a) Localizao

  • Os valores de uma varivel regionalizada so dependentes de suas funes espaciais relativas dentro do campo geomtrico e, alm disso, estes valores so dependentes do tamanho da amostra, de sua forma e orientao (suporte amostral).

    b) Continuidade

    A continuidade espacial apresentada pela varivel regionalizada entre amostras vizinhas reflete o grau de dependncia ou independncia espacial entre as amostras. Espera-se que as amostras mais prximas apresentem maior dependncia do que as que esto mais distantes (CRESSIE, 1993). Dada uma caracterstica quantitativa )(sZ , os diagramas de representao dos pares de pontos )(sZ vs )( hsZ + , so algumas das estatsticas que contm informao mais rica sobre a continuidade espacial de )(sZ . Quando a continuidade espacial no identificada, diz-se que h presena de efeito pepita puro. Isto indica um tipo extremo de comportamento do variograma prximo origem e reflete a variao espacial de um fenmeno de transio onde para um dado valor de patamar a amplitude ter um valor infinitesimalmente menor que as distncias de observao (JOURNEL & HUIJBREGTS, 1978). Diante da presena do efeito pepita puro ressalta-se no se deve utilizar o mtodo geoestatstico de interpolao.

    c) Anisotropias

    A anisotropia uma caracterstica muito frequente nos elementos da natureza, isto , a variabilidade ou distribuio espacial de tais elementos ocorre mais intensamente numa direo e menos intensamente em outra direo. Quando a variabilidade espacial em uma rea apresenta comportamento semelhante para distintas direes, dizemos que os dados so isotrpicos. A isotropia de suma importncia para a estimativa de locais no-amostrados. utilizada na construo de mapas temticos de variabilidade, pois, por meio da identificao de que a varivel analisada isotrpica, o estudo da dependncia espacial pode ser feito por meio de um nico semivariograma, chamado de omnidirecional (CARVALHO et al., 2008).

    d) Estacionaridade

    O conjunto de variveis aleatrias Z(si), i = 1,...,n, constituem uma funo aleatria da qual s se conhece uma realizao z(si), ou seja, o conjunto de dados amostrais.

    Para estimar valores em locais no amostrados, deve-se introduzir as restries de estacionaridade estatstica. A existncia de estacionaridade permite que o experimento

  • possa ser repetido mesmo que as amostras sejam coletadas em pontos diferentes, pois elas pertencem mesma populao com os mesmos momentos estatsticos (VIEIRA, 2000). Uma funo aleatria considerada estacionria quando o valor esperado para sua realizao o mesmo para todos os pontos da rea em estudo, ou seja, E[Z(s1)] = E[Z(s2)] =...= E[Z(si)] = . Este parmetro, que passa a ser independente da localizao de si, pode ser estimado por uma mdia aritmtica dos valores das realizaes das variveis aleatrias. Concretamente, a hiptese de estacionaridade da mdia, ou de primeira ordem como conhecida, implica que possa ser estimada pela mdia aritmtica das observaes. Julgar esta hiptese de estacionaridade como apropriada julgar a mdia das amostras como representativa da rea em estudo.

    Para a anlise geoestatstica necessrio tambm a estacionaridade de segunda ordem, que implica que para cada par de uma varivel aleatria, a funo de covarincia

    )](),([)( hsZsZCovhC += existe e seja dependente da distncia h, implicando na ocorrncia de varincia finita. Usualmente, a aceitao de uma estacionaridade de segunda ordem no pode ser satisfeita. Necessita-se ento de outro modelo estatstico, menos limitado, que baseado na hiptese intrnseca, a qual considera apenas que a mdia dos valores )(sZ e a varincia dos incrementos )()( hsZsZ + ocorrem independentemente da localizao na regio, sendo funo apenas do valor de h . Esta hiptese requer somente a hiptese de existncia do semivariograma, sem a exigncia da varincia finita. Assim, a varincia de )(sZ no finita, mas a varincia do primeiro incremento de Z finita, e este incremento fracamente estacionrio (VIEIRA et al., 1983). Assumida a estacionaridade, por meio da hiptese intrnseca, e considerando que a associao das variveis em pontos distintos maior medida que se reduz a distncia entre eles, o passo seguinte descrever e modelar estas relaes entre distncias e associao espacial.

    2.2.3 Modelo geoestatstico

    O fato dos modelos geoestatsticos incorporarem a incerteza na sua formalizao no significa que o fenmeno em si tenha resultado de um processo aleatrio, mas serve somente de base metodolgica inferncia espacial ou estimao de grandezas em reas no amostradas e quantificao da incerteza associada ao estimador (SOARES, 2000). MARDIA & MARSHALL (1984) consideram um processo estocstico gaussiano { }SssZ ii ),( , em que dS , sendo d espao euclidiano d-dimensional (d 1). Ou seja, o processo TnsZsZZ ))(),...,(( 1= , em que is e us (i,u = 1,...,n) so localizaes espaciais conhecidas, tm distribuio normal n-variada com vetor de mdias 1 e matriz de

  • covarincia , isto , Z ~ ),1( nN , em que uma constante; 1 um vetor formado pelo algarismo 1 de ordem nx1 e uma matriz definida positiva, de ordem n, dada por

    [ ]))(),(( ui sZsZCov= . Supondo-se que os dados so descritos pelo modelo da Equao (1):

    )()()( iii sssZ += (1)

    em que os termos determinstico )( is e estocstico )( is podem depender da localizao espacial em que )( isZ foi obtida. Assume-se que o erro estocstico tem mdia zero,

    [ ] 0)( =isE , e que a variao entre pontos no espao determinada por alguma funo de covarincia [ ])(),(),( uiui ssCovssC = . Assume-se que para algumas funes conhecidas de s, como x1(s), x2(s),...,xp(s), a mdia do processo estocstico dada pelo modelo espacial linear apresentado na Equao (2):

    =

    =

    p

    u

    uu sxs1

    )()( (2)

    em que p ,...,1 so parmetros desconhecidos a serem estimados. A funo de covarincia ),( ui ssC tambm especificada por um vetor q-dimensional

    Tq ),...,( 1 = . Por simplicidade, pode-se utilizar as seguintes notaes: ii zsZ =)( ,

    TnzzZ ),...,( 1= , )( iuiu sxx = , Tipii xxx ),...,( 1= , em que X uma matriz nxp com suas linhas

    Tix ,

    Tp ),...,( 1 = , )( ii s = , Tn ),...,( 1 = , com i = 1,...,n e u = 1,...,p.

    Desta forma, Tii xs =)( , e ento, i

    Tii xz += (3)

    De forma equivalente, em notao matricial, tem-se: += XZ

    (4) Ento, 0)( =E e a matriz de covarincia de [ ])( iu= , em que

    ).,( uiiu ssC= Assume-se que no singular e que X tem colunas com posto completo. Considerando-se de maneira particular a forma paramtrica da matriz de covarincia,

    RI n 21 += (5)

  • em que:

    1 : efeito pepita ou erro de varincia;

    2 : contribuio ou varincia de disperso;

    R: matriz que funo de 3 onde 3 funo do alcance (a) do modelo; In: matriz identidade de ordem n.

    A forma paramtrica da matriz de covarincia, dada na Equao 5, ocorre para vrios processos isotrpicos, nos quais a covarincia ),( ui ssC definida segundo a funo de covarincias iuiu rhC 2)( = , em que uiiu ssh = a distncia euclidiana entre si e su. Nas funes de covarincias )( iuhC , a varincia do processo estocstico Z

    21)0( +=C . Assim, a funo variograma pode ser definida como:

    )()0()( hCCh = (6)

    Pela Equao (6), pode-se obter a funo covarincia:

    )()0()( hChC = (7)

    A covarincia C(h) e o variograma )(h so equivalentes para caracterizar a dependncia espacial.

    2.2.4 Parmetros da estrutura de dependncia espacial

    Os parmetros fornecidos pela estrutura de dependncia espacial so de grande importncia na anlise geoestatstica, pois so utilizados no processo de krigagem, que o interpolador geoestatstico que cria o mapa temtico do atributo estudado.

    i) Efeito pepita ( 1 )

    Teoricamente, o valor do variograma nulo: 0)( =h para h = 0. Na prtica h um valor mnimo de h entre amostras para o qual pode ser quantificado o valor de )(h . Quando esse valor de )( minh elevado, o que significa que h uma grande variabilidade pequena escala, isto , referente s menores distncias entre amostras ou observaes, pode acontecer de )(h no tender para 0 quando h tende para 0. H na realidade uma

  • inflexo ou descontinuidade no andamento do variograma a uma escala no captada pelas amostras, isto , entre h = 0 e hmim. Nestas situaes, o variograma modelado por uma ordenada na origem igual a uma constante 1 denominada por efeito pepita (SOARES, 2000).

    ii) Contribuio ( 2 )

    tambm conhecida como varincia de disperso e representa as diferenas espaciais entre os valores de uma varivel tomada em dois pontos separados por distncias cada vez maiores.

    iii) Alcance ( )( 3ga = )

    a distncia a partir da qual os elementos amostrais passam a ser no correlacionados. Em outras palavras, o alcance reflete o grau de homogeneizao entre os elementos amostrais, ou seja, quanto maior for o alcance maior ser a homogeneidade entre as amostras. O alcance a distncia que separa o campo estruturado (amostras correlacionadas) do campo aleatrio (amostras independentes).

    iv) Patamar ( 21 +=C )

    O Patamar ( 21 + ) corresponde ao ponto onde toda semivarincia da amostra de influncia aleatria, correspondendo a varincia total (s2) obtida pela estatstica clssica (TRANGMAR et al., 1985).

    A Figura 1 ilustra o andamento tpico das funes variograma )(h e covarincia )(hC .Como a funo variograma uma medida da varincia das diferenas nos valores da

    varivel regionalizada entre pontos separados por uma distncia h, pontos mais prximos, por estarem correlacionados tero essa varincia pequena, aumentando medida que os pontos se distanciam.

  • Figura 1 Funes covarincia e variograma.

    O contrrio acontece para a funo covarincia, que grande para distncias pequenas diminuindo medida que a distncia aumenta, pois esta funo mede a correlao entre pontos separados por uma distncia h.

    2.2.5 Modelagem da estrutura de variabilidade espacial

    Os semivariogramas e correlogramas amostrais podem no ser suficientes para descrever o padro de variabilidade espacial do fenmeno estudado, visto que contm estimativas apenas para algumas distncias que a malha amostral permite calcular. Um dos produtos finais da anlise geoestatstica o mapa temtico gerado por krigagem, e este tipo de interpolao exige medidas para outras distncias. Os modelos ajustados para o semivariograma experimental, apresentados por ISAAKS & SRIVASTAVA (1989) e CRESSIE (1993), so divididos em modelos transitivos, que possuem patamar, e modelos no transitivos, que no possuem patamar. Modelos com patamar so aqueles em que a semivarincia estabiliza-se em torno de um valor chamado patamar (C) aps certa distncia, chamada alcance (a). Nestes casos, observaes separadas por distncias maiores que a so consideradas no correlacionadas. Os modelos esfricos, exponencial, gaussiano, circular, Matrn e exponencial potncia so exemplos de funes com patamar. Modelos sem patamar so aqueles em que no h indicao de estabilizao da semivarincia. Este comportamento pode ser devido ao fato de que no foram obtidos elementos amostrais suficientes afastados para que o patamar fosse detectado, ou pode ser uma indicao de que a hiptese intrnseca no vlida.

  • a) Modelo esfrico

    Trata-se de um dos modelos mais usuais em geoestatstica. Ele apresenta um crescimento rpido a atinge o patamar a 2/3 do alcance. A funo semivarincia deste modelo tem a forma:

    3

    321

    3

    3321 0,

    ,

    21

    23

    0,0

    )(

    +

    +

    =

    = h

    h

    hh

    h

    h (8)

    A funo covarincia dada por:

    3

    3

    3

    332

    21

    0,

    ,0

    21

    231

    0,

    )(

    +

    =+

    = h

    h

    hh

    h

    hC (9)

    b) Modelo exponencial

    Este modelo atinge o patamar assintoticamente, com o alcance prtico definido como a distncia na qual o valor do modelo 95% do patamar (ISAAKS & SRIVASTAVA, 1989). A funo semivarincia deste modelo tem a forma:

    3

    321

    321 0,

    ,

    exp1

    0,0

    )(

    +

    +

    =

    = h

    h

    h

    h

    h (10)

    A funo covarincia dada por:

    >

  • c) Modelo gaussiano

    Os modelos esfrico e exponencial apresentam um crescimento relativamente rpido junto da origem, denunciando um comportamento tpico de fenmenos relativamente irregulares. Outros fenmenos, bem mais regulares e contnuos, denunciam um crescimento lento de )(h com um comportamento parablico na origem. Este o caso de variogramas ajustveis por modelos gaussianos. A funo semivarincia deste modelo tem a forma:

    3

    321

    2

    321 0,

    ,

    exp1

    0,0

    )(

    +

    +

    =

    = h

    h

    h

    h

    h (12)

    A funo covarincia dada por:

    3

    3

    2

    32

    21

    0,

    ,0

    exp

    0,

    )(

    =+

    = h

    h

    h

    h

    hC (13)

    d) Modelo circular

    O modelo circular apresenta validez apenas nos planos unidimensionais e bidimensionais, no podendo ser aplicado a planos tridimensionais, onde aplicado o modelo esfrico. A funo semivarincia deste modelo tem a forma:

    3

    321

    23

    2

    33

    121 0,

    ,

    12cos21

    0,0

    )(

    pipi

    +

    +

    +

    =

    = h

    h

    hhh

    h

    h (14)

    A funo covarincia dada por:

  • +

    =

    =

    0,)(21

    0,0

    )(33

    1121 h

    hKhk

    h

    hk

    kk

    (16)

    em que:

    321 ,, e k so parmetros;

    kK a funo de Bessel de terceiro tipo, de ordem k ;

    A funo covarincia dada por:

    ( )

    >

    =

    =

    0,)(2

    0,0

    )(33

    112 h

    hKhk

    h

    hCk

    kk

    (17)

    2.2.6 Estimao de parmetros

    Escolher um modelo adequado implica em obter estimadores do vetor de parmetro T),,( 321 = com mtodos de estimao tais como: mnimos quadrados ordinrios

    (OLS), mnimos quadrados ponderados (WLS1) (CRESSIE, 1985), mxima verossimilhana (ML) e mxima verossimilhana restrita (RML) (MARDIA & MASHALL, 1984).

    O mtodo de estimao de mnimos quadrados ordinrios - OLS, consiste na

    obteno de um vetor de parmetros estimador de T),,( 321 = , que minimiza a Equao (18), onde k indica o nmero de lags que constituem o semivariograma experimental, )( jh o valor estimado da semivarincia experimental, que correspondente

  • ao j-simo lag, para j =1, 2,..., k e ),( jh representa o valor estimado que corresponde ao j-simo lag para j =1, 2,...,k; obtido pelo modelo ajustado ao semivariograma experimental, e depende do vetor de parmetros .

    [ ]21

    ),()(=

    k

    jjj hh ou [ ]2

    1),()(

    =

    k

    jjj hChC (18)

    O mtodo de estimao de mnimos quadrados ponderados - WLS1 define pesos diretamente proporcionais ao nmero de pares de pontos amostrais que contribuem para a semivarincia estimada a cada lag. Segundo o mtodo, o vetor de parmetros a ser escolhido o que minimiza a Equao (19):

    [ ]21

    ),()()( jjk

    jj hhhN

    =

    ou [ ]21

    ),()()( jjk

    jj hChChN

    =

    (19)

    A estimao de parmetros por mxima verossimilhana - ML um mtodo analtico, muito utilizado na teoria estatstica. A funo de verossimilhana de n variveis aleatrias

    Z1,...,Zn definida como a densidade conjunta dada por ZnZf ,...,1 (z1,...,zn; ), que dever ser considerada como uma funo do vetor de q-parmetros desconhecidos = (1,..., q) (espao paramtrico). Seja (Z1,...,Zn) um vetor aleatrio n-dimensional de uma populao com funo densidade de probabilidade conjunta ZnZf ,...,1 (z1,...,zn; ), ento a funo de verossimilhana ser:

    );,...,(,...)( 11 nZZ zzfL n= (20)

    A funo de verossimilhana pode ser entendida como a intensidade de contribuies dos parmetros na produo de uma dada amostra. Sob uma distribuio normal n-variada dos erros, tem-se ),(~ XNZ n e os parmetros desconhecidos do modelo podem ser estimados maximizando-se a funo de verossimilhana, como considerado por MARDIA & MARSHALL (1984). Por motivos de simplicidade de clculos, utiliza-se o logaritmo da funo verossimilhana, chamada de funo log-verossimilhana, definida por:

    l ( ) = )2log(2

    pin

    21 log| )( |

    21 (Z X)T )( -1 (Z X) (21)

  • A funo de verossimilhana , basicamente, uma funo do vetor de parmetros ento, a melhor estimativa para o vetor de parmetros ser aquela que maximiza a

    funo de verossimilhana ou de logaritmo da funo verossimilhana. Outro mtodo, freqentemente utilizado para estimar os parmetros da matriz de

    covarincia )( o mtodo de mxima verossimilhana restrita RML, que obtm estimadores menos viciados que os estimadores obtidos por ML. Nos ensaios de campo na agricultura e nas pesquisas com melhoramento animal, como mtodo de seleo, a estimao de mxima verossimilhana restrita dos parmetros de covarincia espacial, tem sido preferida de mxima verossimilhana (CRESSIE & LAHIRI, 1996). Neste caso, o logaritmo da funo de log-verossimilhana restrita dada pela equao (22):

    ,

    21|)log(|

    21||log

    21|)log(|

    21)2log(

    2)( 1 PZZXXXXpnl TTTR +

    =

    pi (22)

    em que ,

    )(1 AIP = , com 111 )( = TT XXXXA .

    Com o desenvolvimento de recursos computacionais os mtodos ML e RML tm sido tcnicas de estimao muito utilizadas, pois tm propriedades da teoria das grandes amostras que torna o seus resultados mais eficientes (DIGGLE & RIBEIRO JR., 2007).

    2.2.7 Estimador linear geoestatstico: Krigagem

    O estimador geoestatstico denominado por Krigagem, que uma denominao que foi empregue pela primeira vez por Matheron, em homenagem aos trabalhos pioneiros de Krige. Krigagem Normal (Ordinary Kriging) a denominao mais usual dos algoritmos de krigagem, uma famlia que cobre os estimadores no-estacionrios (Krigagem Simples, Krigagem com modelo de deriva, tambm conhecida por krigagem universal, e krigagem com deriva externa), o estimador de corregionalizaes (Co-Krigagem), o estimador de funes de distribuio de probabilidades, o estimador de variveis categricas para a caracterizao da morfologia de corpos em fenmenos espaciais (Krigagem da Indicatriz) e os estimadores no-lineares (Krigagem MultiGaussiana e Krigagem Disjuntiva). A krigagem ordinria interpretada como o valor interpolado de uma varivel regionalizada Z, em um local 0s , podendo ser determinada pela Equao (23):

  • =

    =

    n

    iii sZsZ

    10 )()( (23)

    restrito a:

    =

    =

    n

    ii

    11

    em que:

    )( 0sZ : Representa o valor estimado de Z em 0s ; n: Representa a quantidade de valores medidos )( isZ ;

    i : So os pesos associados aos valores medidos. A krigagem ordinria para n pontos amostrais constitui-se de 1+n equaes, com

    1+n incgnitas, podendo ser representada por meio de uma equao matricial dada em (24):

    LK = (24) sendo:

    =

    01...111..........

    1...1...

    21

    22221

    11211

    nnnn

    n

    n

    CCC

    CCCCCC

    K ,

    =

    n

    .

    2

    1

    ,

    =

    1

    .

    0

    20

    10

    nC

    CC

    L

    Nesta equao K uma matriz de semivarincias de ordem )1()1( ++ nxn entre os pares de pontos amostrados; o vetor de pesos; L um vetor de semivarincias da amostra em relao ao ponto a ser estimado 0s , e representa o parmetro de Lagrange. O vetor de parmetros obtido pelo produto do inverso da matriz K pelo vetor L . No mtodo da krigagem, os pesos so atribudos de acordo com a variabilidade espacial expressa no semivariograma, no entanto, o que torna a krigagem um interpolador timo a maneira como os pesos so distribudos, no sendo tendencioso, tendo varincia mnima e possibilitando que se conhea a varincia da estimativa (WEBSTER & OLIVER, 1990).

    2.2.8 Validao cruzada

    A validao cruzada, ou cross validation, trata-se da adaptao da estatstica paramtrica de validao cruzada a um conjunto de dados )( sZ . O processo consiste em

  • retirar-se uma amostra )( 0sZ do conjunto de dados e estimar-se no local da amostra o valor

    )]([ 0sZ , por exemplo, utilizando o estimador linear de krigagem. Do conjunto formado por

    valores reais e estimados )](),([ sZsZ , calcula-se algumas estatsticas bsicas, como mdias e varincia dos desvios e mdia dos mdulos dos desvios, com objetivo de aferir a qualidade do modelo escolhido para o variograma.

    CRESSIE (1993) apresenta o erro mdio reduzido ( ER ), o desvio padro dos erros mdios ( EMDP ) e o desvio padro dos erros reduzidos ( ERS ) como instrumento para avaliar modelos. O erro mdio definido como:

    =

    =

    n

    iii sZsZ

    nEM

    1)( ))()((

    1 (25)

    em que: n : representa o nmero de dados;

    )( isZ : representa o valor observado no ponto si;

    )( )(isZ : representa o valor predito por krigagem ordinria no ponto is , sem considerar a observao )( isZ .

    Esse procedimento pode ser visto como um experimento no qual se imita o processo de estimao, ao supor que nunca se toma uma amostra naquela localizao. Uma vez que a estimao feita, pode-se compar-la ao valor da amostra que foi inicialmente removida do conjunto de dados amostrais. Este procedimento, mtodo de deixar um fora, repetido para todas as amostras disponveis (FARACO et al. 2008). Segundo McBRATNEY & WEBSTER (1986), o erro mdio reduzido definido como:

    =

    =

    n

    i i

    ii

    s

    sZsZn

    ER1 )(

    )(

    )()()(1

    (26)

    em que:

    )( )(is : desvio padro da krigagem no ponto is , sem considerar a observao )( isZ .

    O desvio padro dos erros reduzidos obtido a partir da seguinte expresso:

    =

    =

    n

    i i

    iiER

    s

    sZsZ

    nS

    1 )(

    )(

    )()()(1

    (27)

  • FARACO et al. (2008) comentam que conhecendo-se o conjunto de valores medidos e preditos por krigagem ordinria )( isZ e )( )(isZ , respectivamente, possvel definir o erro absoluto na unidade da varivel da unidade estudada, pela Equao (28):

    =

    =

    n

    iii SZsZEA

    1)( )()( (28)

    Segundo McBRATNEY & WEBSTER (1986), aplicando-se a condio de no tendenciosidade, o valor populacional para o erro mdio reduzido deve ser zero e do desvio

    padro do erro reduzido deve ser igual a um. Assim, os valores de EM e ER mais prximos

    de zero, o menor valor do DP e o valor de ERS mais prximo de um so os critrios para a

    escolha do melhor modelo ajustado.

    2.2.9 Influncia local

    Em muitas situaes pode-se observar um conjunto de dados com observaes aberrantes ou discrepantes que podem ser consideradas influentes, isto , mudam algum tipo de deciso na construo de modelos geoestatsticos (BORSSOI et al., 2009). O mtodo de influncia local proposto por COOK (1986) avalia o efeito simultneo de observaes sobre os estimadores de mxima verossimilhana (MV) sem a necessidade de sua eliminao do conjunto de dados. CHRISTENSEN et al. (1993) estudam mtodos de diagnsticos baseado em eliminao de casos em modelos lineares espaciais. Para um conjunto de dados observados seja l() o logaritmo da funo verossimilhana do modelo postulado, em que = (, 1, 2, 3)T e seja um vetor de perturbaes pertencente a um espao de perturbaes . Seja l(/) o logaritmo da funo verossimilhana correspondente ao modelo perturbado por . Assume-se que existe um 0 tal que l() = l(/0), para todo e que l(/) duas vezes diferencivel em (T, T)T . Considere-se o seguinte esquema de perturbao: Z = Z + , com = (1,...,n)T vetor de perturbao das respostas e 0 = (0,...,0)T o ponto de no perturbao. Com este esquema de perturbao pretende-se detectar possveis outliers nos dados que afetam o estimador de mxima verossimilhana de . Logo o logaritmo da funo verossimilhana perturbada l(/), para o modelo gaussiano est dado por:

    )()(21||log

    21)2log(

    2)/( 1 pi XZXZnl T =

    .

  • A influncia da perturbao no estimador de MV do vetor de parmetros pode

    ser avaliada pelo afastamento da verossimilhana, definido por LD() = ))()((2 ll , em

    que, : estimador de MV de do modelo postulado; e : estimador de MV de do modelo

    perturbado. COOK (1986) props estudar o comportamento local de LD() em torno de 0, utilizando a curva normal Cl de LD() em 0 na direo de algum vetor unitrio l, definido Cl = 2|lTTL-1l|, com ||l|| = 1, em que, L: a matriz de informao observada, avaliada em

    = ; : uma matriz de ordem (pq) x n dada por = (T, T)T, avaliada em = e em = 0, em que,

    = XT1 e = Tl

    )/(2

    , com 112

    )()/(

    =

    i

    TT

    XZl

    ,

    =

    LLLL

    L , em que, L = -(XT-1X); L = Tl

    )(2

    , com

    qjXlj

    T

    j...,,1,)( 11

    2

    =

    =

    ; L = LT; e L =

    T

    l

    )(2

    , com

    11121211221

    21)(

    +

    =

    ijjiji

    T

    jijijitr

    l

    Seja Lmax o auto-vetor, normalizado, associado ao maior autovalor, em mdulo, da matriz B = TL-1. O grfico dos elementos |Lmax| versus i (ordem dos dados) pode revelar qual o tipo de perturbao que tem a maior influncia em LD(), na vizinhana de 0 (COOK, 1986; BORSSOI et al., 2009).

    2.2.10 Acurcia em mapas temticos

    A elevada quantidade de recursos existentes para elaborao de informaes acaba levando o pesquisador a confeccionar vrios mapas temticos, sendo necessrio utilizar tcnicas que possam compar-los, como a quantificao das reas e a determinao da concordncia entre seus pixels1, informaes estas que so geradas pela matriz dos erros dos mapas. A Tabela 1 apresenta a forma genrica de uma matriz dos erros. Nesta matriz, os pixels do mapa real ou de referncia so quantificados nas colunas enquanto que os pixels do mapa modelo so quantificados nas linhas. Cada elemento da matriz representa a quantidade de pixels pertencentes classe i do mapa modelo e classe j do mapa de referncia.

    1 Aglutinao das palavras Picture e Element, e representa o menor elemento num dispositivo de exibio ao

    qual possvel atribuir-se um valor. Neste trabalho, os pixels sero definidos com os elementos da matriz dos valores krigados.

  • Tabela 1: Matriz dos erros genrica de ordem k x k Mapa de referncia

    Classe C1 C2 ... Ck Total por

    linha ni.

    C1 n11 n12 ... n1k n1. C2 n21 n22 ... n2k n2. . . . . .

    . . . . .

    . . . . .

    Ck nk1 nkk ... nkk nk.

    M

    apa

    mo

    delo

    Total por coluna

    n.j n.1 n.2 ... n.k n

    k: nmero de classes; nij: nmero de pixels classificados na classe i do mapa modelo e na classe j do mapa de referncia.

    A diagonal principal (quando i = j) representa casos em que os pixels tiveram a mesma classificao nos dois mapas enquanto que os elementos fora da diagonal principal representam as classificaes errneas. Observa-se que se os dois mapas forem iguais, todos os elementos fora da diagonal principal sero nulos.

    Uma mtrica utilizada para avaliar a acurcia dos mapas construdos a exatido global (EG) do mapa modelo, que tem o objetivo de determinar o percentual de acerto da classificao realizada e pode ser extrada da matriz dos erros pela Equao (29).

    n

    n

    EG

    k

    iii

    =

    =1

    (29)

    A exatido global uma estatstica de avaliao utilizada para mensurar a similaridade entre algo real ou controlado e um modelo ajustado, porm, conveniente apresentar esta medida associada a outras mtricas que levem em considerao os demais valores contidos na matriz dos erros e no somente os valores da diagonal principal. Os ndices de acurcia de usurio (AU) e acurcia de produtor (AP) so maneiras de representar a preciso de uma classe ou categoria individualmente. O ndice de acurcia de usurio (AUi) representa o quociente entre o nmero de pixels classificados corretamente na classe i sobre o total de pixels classificados na classe i do mapa modelo. Este ndice pode ser calculado com os elementos da matriz dos erros e apresentado na Equao (30):

    =

    i

    iii

    n

    nAU ; i = 1,...,k (30)

    O ndice de acurcia de produtor (APi) uma estatstica que fornece a probabilidade de um pixel ser classificado na classe i se ele realmente pertence a classe i. Este ndice obtido pela Equao (31):

  • i

    iii

    n

    nAP

    .

    = ; i = 1,...,k (31)

    Como GONG & HOWARTH (1990) relatam, o ndice Kappa (COHEN, 1960) uma estatstica utilizada para mensurar a exatido das classificaes temticas. Este ndice vem sendo recomendado como uma medida apropriada da exatido por utilizar todos os elementos da matriz dos erros ao invs de apenas utilizar aqueles que se situam na diagonal principal da mesma, o que ocorre quando se calcula a exatido global da classificao. O ndice Kappa fornece uma medida de concordncia entre os valores do mapa modelo e os valores do mapa de referncia e segundo CONGALTON & GREEN (1999) pode ser calculado pela Equao (32):

    =

    = =

    = k

    iii

    k

    i

    k

    iiiii

    nnn

    nnnn

    K

    1

    2

    1 1 (32)

    A varincia do ndice Kappa, utilizada na construo de intervalos de confiana e testes de hipteses, pode ser calculada conforme a equao (33):

    +

    +

    = 42

    224

    21

    32

    32112

    2

    112

    )1()4()1(

    )1()2)(1(2

    )1()1(1)(

    n

    K (33)

    em que:

    =

    =

    k

    iiin

    n 11

    1 ; =

    =

    k

    iii nn

    n 122

    1 ; )(11

    23 ii

    k

    iii nnn

    n

    =

    += ; 21 1

    34 )(1

    ji

    k

    i

    k

    jij nnn

    n

    = =

    += .

    Utilizando o ndice Kappa juntamente com sua varincia, possvel construir um intervalo de confiana de (1 - )% utilizando a Equao (34):

    )()%)1(;( 22/ KzKKIC = (34)

    Alm dos ndices de exatido global e Kappa, que so muito utilizados, MA & REDMOND (1995) apresentaram o ndice Tau (T), que fornece uma medida quantitativa relativamente precisa e intuitiva sobre a acurcia da classificao. O ndice Tau similar ao ndice Kappa, sendo calculado conforme a equao (35), em que pk indica a probabilidades a priori para cada classe.

  • k

    k

    k

    iii

    p

    pn

    n

    T

    =

    =

    1

    1

    (35)

    Quando as probabilidades a priori para as classes forem iguais, temos pi = 1/k, onde k representa o nmero de classes da matriz dos erros. Uma outra forma de comparar mapas temticos pode ser utilizada mediante a criao da matriz de confuso por classe (FIELDING & BELL, 1997), matriz esta que pode ser obtida com os elementos da matriz dos erros. A Tabela 2 apresenta a forma genrica da matriz de confuso da k-sima classe.

    Tabela 2: Matriz de confuso da k-sima classe Mapa de referncia

    Verdadeiro (V) Falso (F) Verdadeiro (V) ak bk

    Ma

    pa

    mo

    delo

    Falso (F) ck dk

    Em que:

    ak = kkn : quantidade de pixels da classe k do mapa real que foram classificados

    corretamente como pertencentes a classe k no mapa modelo.

    bk = :kkk nn quantidade de pixels que no pertencem a classe k do mapa real e

    foram classificados como pertencentes a classe k no mapa modelo.

    ck = :kkk nn quantidade de pixels que pertencem a classe k do mapa real e que

    pertencem a uma classe diferente no mapa modelo.

    dk = :)( kkk cban ++ quantidade de pixels que no pertencem a classe k no mapa real e foram classificados como no pertencente a classe k no mapa modelo.

    A Tabela 3 apresenta algumas mtricas, derivadas da matriz de confuso por classe, e utilizadas na comparao dos mapas temticos. O ndice de sensibilidade (Sk) uma medida que indica a probabilidade de um pixel no mapa modelo ser classificado como pertencente classe k se realmente ele pertence classe k no mapa real, sendo assim uma medida equivalente acurcia de produtor (FIELDING & BELL 1997).

  • Tabela 3: Mtricas derivadas da matriz de confuso por classe Mtrica Equao

    ndice de sensibilidade (Sk) ak/(ak+ck) ndice de especificidade (Ek) dk/(bk+dk) Taxa de falso positivo (TFPk) (Erro de comisso) bk/(bk+dk) Taxa de falso negativo (TFNk) (Erro de omisso) ck/(ak+ck)

    O ndice de especificidade (Ek) indica a probabilidade de um pixel no pertencente classe k do mapa real ser classificado como no pertencente classe k no mapa modelo (LURZ et al. 2001). Os erros de comisso tambm so conhecidos como erros de superestimativa, ou seja, indicam a proporo de pixels que no pertencem classe k no mapa real que so classificados como pertencentes classe k no mapa modelo. Os erros de omisso so considerados graves, pois indicam a proporo de pixels que pertencem classe k do mapa real e foram classificados em outras classes no mapa modelo. Com base nessas mtricas, possvel comparar individualmente as classes do modelo com as classes do mapa real. Para uma comparao global dos mapas, JENNESS & WYNNE (2005) apresentam a matriz de confuso total, indicada na Tabela 4.

    Tabela 4: Matriz de confuso total Mapa de referncia

    Verdadeiro (V) Falso (F) Verdadeiro (V) a =

    =

    k

    iiin

    1

    b ==

    k

    i

    k

    ijijn

    1

    Ma

    pa M

    ode

    lo

    Falso (F) c = =

    k

    j

    k

    jiijn

    1 d =

    =

    k

    i

    k

    ji

    k

    ijijn

    1

    A Tabela 5 apresenta algumas mtricas derivadas da matriz de confuso total. Os ndices de sensibilidade total (S) e especificidade total (E) so anlogos s suas verses por classe, com a diferena de que agora apresentam medidas para o mapa completo. O coeficiente de correlao de Matthews (CCM) uma verso discreta do coeficiente de correlao de Pearson, e seus valores se encontram no intervalo [-1;1], sendo que o valor 1 equivale a uma predio perfeita, 0 equivale a uma predio aleatria e -1 significa uma predio inversa.

    Tabela 5 Mtricas derivadas da matriz de confuso total Mtrica Equao

    S a/(a+c) E d/(b+d)

    CCM ((ad)-(bc))/((a+b)(a+c)(d+b)(d+c))(1/2)

  • 2.2.11 Modelagem cartogrfica

    A modelagem cartogrfica um tipo de tcnica de anlise espacial, que consiste numa coleo de mapas sobre determinados atributos, onde cada mapa uma varivel sujeita a operaes matemticas tradicionais. A modelagem cartogrfica apresenta-se hoje como uma importante tcnica de anlise espacial geogrfica. Ela aparece, como definio, num contexto de utilizao de tecnologias de Geoprocessamento, no incio da dcada de 1990, com TOMLIN (1990), em que ele introduz um conceito novo - lgebra de mapas -, atualmente muito explorado por pesquisadores e desenvolvido em alguns softwares de Geoprocessamento.

    Segundo BERRY (1993), uma linguagem de modelagem cartogrfica usa uma sequncia de funes primitivas para realizar uma anlise complexa de mapas. Nesse sentido, ela semelhante lgebra tradicional, na qual operadores primitivos (adio, subtrao, exponenciao) so logicamente sequenciados com variveis para que se forme uma equao. No entanto, na lgebra cartogrfica, mapas inteiros representam as variveis. A unidade bsica de processamento o pixel, que pode ser processado independentemente, integrado numa vizinhana ou integrado em regio de elementos com o mesmo atributo.

  • 2.3 MATERIAL E MTODOS

    2.3.1 Material

    A anlise de um conjunto de dados reais foi efetuada com o propsito de ilustrar a aplicao das tcnicas geoestatsticas. A rea experimental compreende uma rea de produo de gros com 13,7 hectares de extenso, localizada no municpio de Salto do Lontra PR, que foi cultivado com trigo variedade IAPAR 78. Na rea monitorada, foi definida uma grade amostral regular de 50 x 50 m totalizando 50 posies georreferenciadas (Figura 2 (A)). Na Figura 2 (B) observa-se que esta rea tambm foi dividida em nove talhes denominados de A a I, para facilitar a colheita mecnica e com isso poder determinar a produo real. A pequena rea em cinza na Figura 2 (B) representa uma regio de pedras que no monitorada no experimento.

    Figura 2 (A) Localizao dos 50 pontos amostrais e (B) Diviso da rea em talhes.

    Nos pontos de amostragem, foram coletadas as parcelas de trigo. Estas amostras foram trilhadas de forma manual, pesadas e posteriormente transformadas em t ha-1.

    A anlise geoestatstica foi realizada utilizado os pacotes geoR (RIBEIRO JR & DIGGLE, 2001) e Splancs ( ROWLINGSON & DIGGLE, 1993) do software R.

    2.3.2 Metodologia

    Uma anlise geoestatstica composta de diversos procedimentos que devem ser utilizados com bastante cautela, pois no se tratam de uma simples aplicao de frmulas para obter resultados. Para uma correta investigao o pesquisador deve sempre estar refazendo e comparando suas anlises, e isto faz com que o roteiro a ser seguido, bem como os resultados intermedirios e finais no sejam obtidos de forma nica.

  • A seguir so descritos os passos da anlise geoestatstica. Inicia-se com uma anlise exploratria que vem seguida de diversos procedimentos at a confeco de mapas temticos que detalhem o comportamento do atributo estudado.

    a) Anlise descritiva geral

    Em uma anlise descritiva geral, a nica informao investigada o conjunto amostral do atributo estudado - assim, a posio do atributo no considerada. O objetivo fundamental a identificao inicial do comportamento dos dados, sem nenhuma pretenso de inferncia. O uso de medidas de posio, tendncia central, variao, assimetria e curtose, associadas a informaes grficas como o histograma, boxplot e ramo-e-folhas permite uma primeira viso dos aspectos gerais do conjunto de dados.

    b) Anlise descritiva espacial

    Embora seja mais detalhada que a anlise descritiva geral, uma vez que leva em considerao a posio da amostra, a inteno to somente ter um indicativo do comportamento dos dados agora associando-os s suas posies na regio amostrada. Um grfico que rico em informao o postplot, que consiste em apresentar a malha de pontos coletados separados por cores/smbolos identificando os quartis da distribuio dos dados. A partir deste grfico possvel identificar se existem regies com concentrao de altos ou baixos valores amostrais. Uma outra opo de anlise um grfico tridimensional que mostra a superfcie definida pela amostra. A anlise idntica feita com o grfico postplot e d uma idia visual inicial do comportamento do atributo na regio estudada.

    c) Anlise variogrfica

    Para que a interpolao por krigagem possa ser realizada com eficcia, so necessrias estimativas de semivarincias (covarincias) para distncias alm das fornecidas pela malha amostral. Um modelo que descreva a semivarincia (covarincia) em funo da distncia ento ajustado a partir de um conjunto discreto de pontos, estimativas da semivarincia (covarincia) para os diferentes lags. No presente trabalho foram avaliados os modelos exponencial, esfrico e gaussiano utilizando os mtodos de estimao de mnimos quadrados ordinrios (OLS), mnimos quadrados ponderados, mxima verossimilhana (ML) e mxima verossimilhana restrita (RML).

  • d) Validao cruzada

    A idia central avaliada pela validao cruzada que se o fenmeno foi satisfatoriamente modelado, possvel reproduzir, com boa aproximao, informaes da amostra. Desta forma, o procedimento consiste em retirar um ponto do conjunto original das amostras coletadas e estim-lo utilizando o restante das amostras. Aps realizar a estimativa de todos os pontos, possvel obter medidas que ajudem a escolher o modelo que melhor descreva a variabilidade espacial do atributo estudado.

    e) Krigagem ordinria

    Na maioria das pesquisas relacionadas geoestatstica, o profissional est interessado em estimar valores em locais no amostrados, seja por um interesse local ou pela inteno de obter um detalhamento da rea que vai alm do permitido pela amostra. Nestes casos, o procedimento adotado a interpolao. A literatura apresenta uma vasta coleo de interpoladores, desde os conhecidos modelos deterministas, como polgonos de influncia, triangulao e inverso do quadrado das distncias, at a proposta de predio geoestatstica, conhecida como krigagem. Neste trabalho ser utilizado a krigagem ordinria, interpolador mais eficaz que os deterministas por incorporar a estrutura de dependncia espacial do atributo estudado.

    f) Anlise de diagnstico

    Com o objetivo de investigar a existncia de pontos influentes no conjunto amostral do atributo estudado, ser analisado o grfico de influncia local ixLmax (ordem dos dados), que prope avaliar a influncia conjunta das observaes sob pequenas perturbaes no modelo, identificando assim, pontos que possam causar alguma interferncia ou provoquem grandes desvios nos resultados do ajuste.

    g) Comparao de mapas

    Para comparar mapas obtidos por diferentes tcnicas, sero utilizadas as mtricas derivadas da matriz dos erros e tambm ser criando um mapa de diferenas utilizando a lgebra de mapas.

    A Figura 3 apresenta o roteiro desta anlise. Observa-se que dois mapas sero gerados. O primeiro obtido pelo ajuste de um modelo terico, selecionado por validao cruzada, utilizando todos os pontos do conjunto de dados amostrais, e o segundo, utilizando

  • a anlise de diagnsticos para retirar pontos detectados como influentes. Para finalizar o estudo, os mapas sero comparados utilizando a subtrao em mdulo de um mapa pelo outro, que evidencia regies que foram diferentes em ambos os mapas e tambm ser construda a matriz dos erros, considerando o mapa com todos os pontos como o de referncia e o mapa sem os pontos influentes como modelo. Com esta matriz, ser possvel calcular as mtricas de acurcia.

    Figura 3 Roteiro da anlise geoestatstica.

  • 2.4 RESULTADOS E DISCUSSO

    A anlise exploratria dos elementos amostrados apresentou uma produtividade mdia de trigo de 1,31 t ha-1, sendo a produo mnima de 0,30 t ha-1 e mxima de 2,40 t ha-1 com desvio padro de 0,54 t ha-1 e coeficiente de variao (CV) de 41,40%. Apesar desta alta heterogeneidade entre os valores amostrais (CV > 30%), pode-se considerar que o conjunto apresenta uma distribuio normal de probabilidades, pois pelo teste de normalidade de Anderson-Darling obteve-se um nvel descritivo (p-valor) de 0,102 o que indica normalidade dos dados com nvel de 5% de significncia. Analisando o grfico boxcox da produtividade de trigo na Figura 4, observa-se que no h necessidade de transformar os dados, visto que o 1= encontra-se no intervalo de 95 % de confiana.

    Figura 4 Grfico boxcox da produtividade de trigo.

    A Figura 5 apresenta o grfico espacial da rea em estudo, representando a produtividade de trigo classificada por quartis.

    Figura 5 - Grfico espacial da produtividade de trigo.

  • Destaca-se nesse grfico a regio norte da rea por apresentar um aglomerado com produtividade baixa e a regio leste por apresentar um aglomerado com maiores valores de produtividade. A Figura 6 apresenta o grfico boxplot da produtividade de soja.

    Figura 6 Grfico boxplot da produtividade de trigo.

    Observando o grfico da Figura 6 observa-se que o conjunto de dados simtrico e tambm destaca-se a ausncia de pontos discrepantes no conjunto de dados amostrais. Com finalidade de verificar a existncia de tendncias, heterogeneidades de varincias e comportamentos isolados foram construdos os grficos da Figura 7. Para cada linha e coluna foram assinalados os valores encontrados.

    Figura 7 Grfico das coordenada versus produtividade de trigo.

    Nos dois grficos existem pequenas flutuaes dos valores em relao mdia. Porm, isto no caracteriza problemas visto que em ambas as direes as disperses so semelhantes. As anlises exploratrias indicam que o comportamento do conjunto de dados

  • de produtividade de trigo no mostra problemas que afrontem as hipteses de estacionaridade.

    Para realizar o estudo variogrfico, necessrio conhecer a distncia mxima entre os pontos amostrais, com intuito de definir o ponto de corte. Para construir o semivariograma utilizando o conjunto amostral a distncia mxima entre duas amostras de 487,8781 m e como vamos padronizar um corte de 50% (CLARK, 1979), a distncia a ser considerada ser de 244 m. Para identificar a existncia de anisotropia, construiu-se os semivariogramas direcionais da Figura 8.

    Figura 8 Semivariogramas direcionais da produtividade de trigo.

    Observa-se na Figura 8 que os semivariogramas direcionais apresentam um comportamento semelhante para as direes monitoradas, indicando que os dados so isotrpicos e assim, podemos considerar um nico semivariograma, conhecido como semivariograma omnidirecional, apresentado na Figura 9.

    Figura 9 Semivariograma experimental da produtividade de trigo.

    Observa-se que a primeira semivarincia encontra-se na distncia de 50 m, indicando que no se tem conhecimento do fenmeno a menores distncias. Este semivariograma foi gerado utilizando o estimador de Matheron e um ngulo de tolerncia de 22,5 o. Uma forma de investigar a dependncia espacial proporcionada pela construo de

  • envelopes simulados, apresentados na Figura 10. Na anlise dos envelopes simulados deve haver ao menos um ponto do semivariograma fora do envelope. Se isso ocorrer rejeita-se a hiptese nula, de que no h dependncia espacial.

    Figura 10 Envelopes simulados.

    Nesta simulao encontrou-se um ponto fora dos envelopes, conforme destacado na Figura 9. Este fato sugere a existncia de correlao espacial da produtividade de trigo na rea monitorada. Destaca-se que foi estipulado um mnimo de 30 pares de pontos para cada semivarincia plotada nos grficos das Figuras 8,9 e 10. A Tabela 6 apresenta informaes mais detalhadas do semivariograma experimental da produtividade de trigo, como a distncia em que foi computada a semivarincia e o nmero de pares utilizados.

    Tabela 6 Parmetros do semivariograma omnidirecional h pares (h)

    50,846 82 0,141 69,538 75 0,194

    100,692 66 0,240 113,154 123 0,241 144,308 53 0,277 150,538 53 0,265 156,769 97 0,295 181,692 82 0,342 200,385 38 0,382 206,615 71 0,383 212,846 32 0,354 225,308 60 0,342

    Observa-se na Tabela 6 que a maior quantidade de pares ocorreu a uma distncia de 113,15 m, com 123 pares. A menor quantidade de pares ocorreu a uma distncia de 212,84 m, com 32 pares - porm, superior ao limite definido a priori de 30 pares de pontos.

    A Tabela 7 apresenta as estimativas dos parmetros referentes aos ajustes dos modelos tericos de semivariograma, juntamente com os respectivos mtodos de

  • estimao. Observa-se que o maior raio de dependncia espacial obtido com o modelo exponencial, com aproximadamente 389 m nos mtodos WLS1, ML e RML.

    Tabela 7 - Modelos ajustados e parmetros obtidos do conjunto amostral completo da produtividade de trigo [t ha-1]

    Modelo Mtodo a 1 2 1 + 2 E(%) OLS 359,4886 0,0000 0,4229 0,4229 0,00

    WLS1 389,4457 0,0000 0,4373 0,4373 0,00 ML 389,4450 0,0166 0,3518 0,3684 4,51 Exponencial

    RML 389,4452 0,0086 0,3848 0,3934 2,19 OLS 310,1955 0,0672 0,3392 0,4064 16,54

    WLS1 311,3712 0,0669 0,3405 0,4074 16,42 ML 137,6487 0,0117 0,2611 0,2728 4,29 Esfrico

    RML 141,7012 0,0105 0,2759 0,2864 3,67 OLS 276,7686 0,1300 0,2797 0,4097 31,73

    WLS1 273,0037 0,1284 0,2787 0,4071 31,54 ML 269,1884 0,1051 0,2961 0,4012 26,20 Gaussiano

    RML 302,6388 0,1056 0,4164 0,522 20,23 OLS: mnimos quadrados ordinrios, WLS1: mnimos quadrados ponderados, ML: mxima verossimilhana, RML: mxima verossimilhana restrita, a: ancance, 1 : efeito pepita, 2 : contribuio, 1 + 2 : patamar e E: efeito pepita relativo 100.( 1 /( 1 + 2 ))

    O efeito pepita relativo (E) na Tabela 7 utilizado para mensurar o grau de dependncia espacial segundo a classificao proposta por CAMBARDELLA et al. (2004). Observa-se que os ajustes utilizando modelos exponenciais apresentam os menores valores para o efeito pepita relativo, indicando uma forte dependncia espacial. Dos quatro ajustes realizados com o modelo gaussiano, 3 deles apresentam coeficiente de efeito pepita relativo superior a 25 %, indicando uma moderada dependncia espacial.

    Como tem-se vrios modelos e mtodos, necessrio utilizar tcnicas que permitam escolher o melhor ajuste, como por exemplo, a validao cruzada, apresentada na Tabela 8.

    Tabela 8 - Validao cruzada para a produtividade de trigo [t ha-1] relativa a todo o conjunto amostral

    Modelo Mtodo EM ER

    DPEM SER EA OLS -0,002074 -0,002220 0,3564242 0,9521044 12,78630

    WLS1 -0,002310 -0,0025460 0,3563375 0,9716647 12,78598 ML -0,001719 -0,001899 0,3581258 0,9950070 12,84087 Exponencial

    RML -0,002006 -0,002238 0,3571692 0,9924911 12,79904 OLS -0,002417 -0,002660 0,3674936 0,9379480 13,43437

    WLS1 -0,002439 -0,002689 0,3675304 0,9391278 13,43475 ML 0,0005531 0,0010620 0,3620052 0,9890566 13,10038 Esfrico

    RML 0,0002486 0,0006794 0,3630399 0,9865988 13,20557 OLS -0,001874 -0,001957 0,3687667 0,9190851 13,54737

    WLS1 -0,001864 -0,001948 0,3683358 0,9220606 13,52683 ML -0,002367 -0,002709 0,3652186 1,0011898 13,41738 Gaussiano

    RML -0,003308 -0,003882 0,3645614 1,0007248 13,42031 EM : erro mdio, ER : erro mdio reduzido, DPEM :desvio padro do erro mdio, SER: desvio padro dos erros reduzidos e EA: erro absoluto.

  • Segundo o critrio de validao cruzada o melhor modelo o que fornece os valores

    de EM e ER mais prximos de zero, o valor DPEM menor e o valor de SER mais prximo de um. Optou-se por escolher o modelo exponencial - ML como o que melhor se ajustou, visto que das cinco estatsticas investigadas ele apresenta um melhor desempenho em trs.

    A Figura 11 (A) apresenta o grfico de diagnstico dos auto-vetores |Lmax|, utilizando o modelo espacial exponencial ML.

    Figura 11 - (A) Grfico de diagnstico |Lmax|; (B) Localizao dos pontos influentes na rea monitorada.

    Verifica-se que as observaes 12 e 18 foram consideradas influentes e podem mudar algum tipo de deciso na construo de modelos geoestatsticos e/ou na construo dos mapas temticos. A Figura 11 (B) apresenta a localizao dos pontos influentes na rea monitorada. A amostra no 12 refere-se a uma produtividade de 2,40 t ha-1 e a amostra no 18 representa um elemento amostral com produtividade de 0,55 t ha-1. Desta forma, optou-se por fazer uma nova anlise variogrfica retirando os dois pontos considerados influentes e verificando de que maneira eles afetam a anlise espacial. A Figura 12 apresenta o semivariograma experimental da produtividade de trigo gerado sem os dois pontos influentes. Destaca-se um comportamento semelhante quando comparado com o semivariograma que foi construdo com todos os pontos amostrais na Figura 9.

    Figura 12 Semivariograma experimental construdo sem os pontos influentes.

  • A Tabela 9 apresenta os parmetros ajustados utilizando os mtodos de estimao de mnimos quadrados ordinrios (OLS), mnimos quadrados ponderados (WLS1), mxima verossimilhana (ML) e mxima verossimilhana restrita (RML) sem os pontos influentes.

    Tabela 9 - Modelos ajustados e parmetros do conjunto amostral da produtividade de trigo [t ha-1] sem as amostras influentes

    Modelo Mtodo a 1 2 1 + 2 E(%) OLS 545,3916 0,0000 0,4836 0,4836 0,00

    WLS1 549,0667 0,0000 0,4847 0,4847 0,00 ML 562,9345 0,0000 0,4178 0,4178 0,00 Exponencial

    RML 389,4452 0,0000 0,317 0,317 0,00 OLS 246,9547 0,0144 0,3262 0,3406 4,23

    WLS1 233,5746 0,0000 0,3332 0,3332 0,00 ML 140,2367 0,0000 0,2173 0,2173 0,00 Esfrico

    RML 142,0542 0,0000 0,2243 0,2243 0,00 OLS 225,0066 0,0786 0,2700 0,3486 22,55

    WLS1 225,0065 0,0783 0,2695 0,3478 22,51 ML 121,3996 0,0143 0,2477 0,2620 5,46 Gaussiano

    RML 125,6102 0,0165 0,2644 0,2809 5,87

    Observa-se que os ajustes realizados utilizando o modelo exponencial com os mtodos OLS, WLS1 e ML apresentaram um raio de dependncia espacial superior distncia mxima que de 487, 8781 m e portanto, estes modelos sero desconsiderados da anlise, pois apesar de estarem matematicamente corretos, eles no condizem com a realidade. A Tabela 10 apresenta as estatsticas da validao cruzada referentes ao conjunto de dados sem os pontos influentes. Novamente, procura-se por valores de EM e ER

    mais prximos de zero, menores valores para o DPEM , valores de SER mais prximo de um e o menor erro absoluto. Analisando a Tabela 10, optou-se por escolher o gaussiano RML como o modelo que melhor se ajusta ao semivariograma experimental gerado com o conjunto de dados composto de 48 elementos amostrais.

    Tabela 10 - Validao cruzada para a produtividade de trigo [t ha-1] sem as amostras influentes

    Modelo Mtodo EM ER

    DPEM SER EA Exponencial RML 0,0009800 0,0017480 0,3053484 0,9413290 10,76085

    OLS 0,0010440 0,0018390 0,2974865 0,8996713 10,42330 WLS1 0,0011600 0,0021600 0,2918369 0,9390484 10,26458

    ML 0,0037200 0,0057110 0,3017940 0,9260413 10,74068 Esfrico RML 0,0036180 0,0055120 0,3026852 0,9203176 10,77810 OLS 0,0007296 0,0015100 0,3222009 0,9596583 11,35211

    WLS1 0,0007271 0,0015100 0,3221772 0,9614916 11,35204 ML 0,0026980 0,0048850 0,2720037 1,0011951 9,813561 Gaussiano

    RML 0,0019660 0,0036590 0,2723834 0,9993793 9,73965 EXP: exponencial, ESF: esfrico, GAUSS: gaussiano, EM : erro mdio, ER : erro mdio reduzido, DPEM :desvio padro do erro mdio, SER: desvio padro dos erros reduzidos e EA: erro absoluto.

  • A Figura 13 (A) apresenta o semivariograma experimental do conjunto completo de dados juntamente com o modelo ajustado (exponencial ML), e a Figura 13 (B) apresenta o semivariograma experimental gerado sem os pontos influentes juntamente com o modelo ajustado (gaussiano RML). Conclui-se que os pontos influentes alteram a escolha do modelo e os valores dos parmetros.

    Figura 13 Semivariogramas ajustado: (A) completo e (B) sem os pontos influentes.

    A Figura 14 (A) apresenta o mapa da produtividade de trigo gerado por krigagem ordinria utilizando os parmetros ( 1 = 0,0166; 2 = 0,3518; a = 389,4450) fornecidos pelo modelo exponencial ML, obtidos do estudo realizado com todo o conjunto amostral e a Figura 14 (B) apresenta o mapa gerado utilizando os parmetros ( 1 = 0,0165; 2 = 0,2644; a = 125,6102) fornecidos pelo modelo gaussiano RML, obtidos pelo estudo dos dados sem as amostras influentes. Para construo destes mapas, foi criado um grid de interpolao formado por 5423 pixels.

    Observa-se que os mapas apresentam um comportamento semelhante. Porm, possvel identificar diferenas, no somente nos locais dos pontos influentes como tambm em outras regies.

    Figura 14 - (A) Mapa temtico da produtividade de trigo utilizando 50 elementos amostrais na interpolao e (B) Mapa temtico da produtividade de trigo utilizando 48 elementos amostrais na interpolao.

    Destaca-se que os mapas foram construdos utilizando 5 classes, sendo este nmero definido de tal forma que possibilite tanto uma identificao visual das reas de

  • produtividade quanto uma praticidade em realizar aplicaes localizadas de insumos, pois uma grande quantidade de intervalos implica em reas muito pequenas em cada classe, o que dificulta a demarcao no campo. A diferena entre os mapas melhor visualizada na Figura 15, que apresenta o mapa temtico da diferena de produtividade em mdulo entre os dois mapas.

    Figura 15 - Mapa da diferena de produtividade em mdulo entre os dois mapas

    Observa-se na Figura 15 que as regies de maior diferena so exatamente as regies dos pontos influentes. Porm, diversas outras regies apresentam diferenas, o que mostra que a retirada dos pontos influentes afetou o mapa como um todo.

    Para melhor comparar estes mapas, conveniente quantificar seus 5423 pixels em uma matriz, conhecida como matriz dos erros, definindo o mapa gerado com todos os pontos como o de referncia, visto que ele elaborado por mtodos geoestatsticos mais conhecidos e o mapa gerado sem os pontos influentes como o mapa modelo, devido implantao dos estudos de diagnsticos em influncia local. A Tabela 11 apresenta a matriz dos erros que compara os dois mapas.

    Tabela 11 - Matriz dos erros dos pixels dos mapas de produtividade de trigo Mapa Padro

    Mapa Modelo C1 C2 C3 C4 C5 TOTAL

    C1 485 272 9 0 0 766 C2 45 1202 124 18 0 1389 C3 7 206 1218 99 19 1549 C4 0 0 135 616 241 992 C5 0 0 0 135 592 727

    TOTAL 537 1680 1486 868 852 5423 C1: [0,371; 0784), C2:[0,784;1,198), C3:[1,198; 1,611), C4:[1,611; 2,024) e C5:[2,024; 2,437).

  • Na matriz dos erros, os pixels do mapa padro ou de referncia so quantificados nas colunas e os pixels do mapa modelo so quantificados nas linhas. Assim, tem-se que dos 5423 pixels, 537 esto na primeira classe do mapa padro e 766 esto na primeira classe do mapa modelo.

    Esta primeira informao permite realizar uma estimativa da produo de trigo na rea para ser comparada com a produo de trigo real, colhida e pesada pelo produtor, que foi de 18,49 toneladas. A rea total monitorada de 13,551 hectares e esta corresponde a 5423 pixels. Realizando uma regra de trs, podemos verificar que os 537 pixels da primeira classe do mapa gerado com todos os pontos representam uma rea de 1,3419 hectares. Multiplicando esta rea pelo ponto mdio da primeira classe (0,5778), obtemos a estimativa de 0,78 toneladas. Seguindo o mesmo procedimento para as outras classes, obtemos as estimativas da Tabela 12.

    Tabela 12 Produo (t) estimada em cada classe MAPA C1 C2 C3 C4 C5 Total

    Referncia 0,78 4,16 5,21 3,94 4,75 18,84 Modelo 1,11 3,44 5,43 4,50 4,05 18,54

    Observa-se na Tabela 12 que a produo total estimada pelo mapa padro foi de 18,84 toneladas, 350 quilos superior produo real, que foi de 18,49 toneladas e a produo total estimada utilizando o mapa modelo foi de 18,54 toneladas, 50 quilos superior produo real. Diante desta observao, destaca-se que a retirada dos pontos influentes foi de grande importncia na anlise, pois permitiu estimar a produo com maior preciso. A diagonal principal da matriz dos erros da Tabela 11 indica a quantidade de pixels classificados identicamente nos dois mapas. Estes elementos permitem calcular a exatido global (EG), uma das primeiras medidas de acurcia que pode ser utilizada na comparao dos mapas. Da Tabela 11 tem-se que EG = 0,76 ou seja, a exatido global foi de 76 %. Este valor tambm indica que os mapas temticos apresentam diferenas, pois de acordo com ANDERSON et al. (1976), o nvel mnimo de preciso aceitvel de 85 %. A acurcia pode ser investigada para cada classe individualmente por meio da anlise dos ndices de acurcia de usurio e de produtor, apresentados na Tabela 13.

    Tabela 13 ndices de acurcia de usurio (AU) e produtor (AP)

    C1:[0,371;0784) C2:[0,784;1,198) C3:[1,198; 1,611) C4:[1,611;2,024) C5:[2,024;2,437) AUi 0,6432 0,8654 0,7863 0,6210 0,8143 APi 0,9032 0,7155 0,8197 0,7097 0,6948

    Observa-se pela Tabela 8 que a classe C4 do mapa modelo apresentou um ndice de acurcia de usurio de 0,6210 o que indica que 37,9 % dos pixels que pertencem a esta

  • classe no mapa modelo pertencem a outras classes no mapa de referncia. Observando o ndice de acurcia de produtor da classe C4, tem-se que a probabilidade de um pixel ser classificado nesta classe do mapa modelo se ele realmente pertence a esta classe no mapa de referncia de 0,7097. A Tabela 14 apresenta o ndice Kappa com sua respectiva varincia. Analisando a Tabela 14, observa-se que o valor de Kappa 0,69, o que, segundo classificao de LADIS & KOCK (1997), indica uma semelhana muito boa.

    Tabela 14 - Estatsticas do ndice Kappa ( K ) K

    0,69 )(2 K 0,00084

    IC(K, 95%) [0,63; 0,75]

    O ndice Tau obtido da matriz dos erros considerando a igualdade das probabilidades a priori para cada classe foi 0,70, que apesar de ser superior ao ndice Kappa, tambm indica uma semelhana muito boa entre os mapas temticos da produtividade de trigo. A Tabela 15 apresenta os elementos das matrizes de confuso da classe Ck, que so utilizados para calcular mtricas adicionais, proporcionando uma investigao mais detalhada.

    Tabela 15 Elementos (pixels) da matriz de confuso da classe Ck

    Ck ak bk ck dk C1 485 281 52 4605 C2 1202 187 478 3556 C3 1218 331 268 3606 C4 616 376 252 4179 C5 592 135 260 4436

    Como os elementos ak e dk representam predies corretas e os elementos bk e ck representam predies errneas, destaca-se a classe C1 com apenas 4% de pixels classificados erroneamente e a classe C4 com 11% de pixels classificados erroneamente. A Tabela 16 apresenta as mtricas obtidas das matrizes de confuso de cada classe Ck.

    Tabela 16 Mtricas obtidas das matrizes