universidade estudual do oeste do paranÁ...

Download UNIVERSIDADE ESTUDUAL DO OESTE DO PARANÁ ...tede.unioeste.br/bitstream/tede/2893/1/Everton.pdfAgradeço ao Prof. Dr. Jerry Adriani Johann, meu coorientador, pela importante orientação

If you can't read please download the document

Upload: doandat

Post on 25-May-2018

216 views

Category:

Documents


1 download

TRANSCRIPT

  • UNIVERSIDADE ESTUDUAL DO OESTE DO PARAN CAMPUS CASCAVEL

    CENTRO DE CINCIAS EXATAS E TECNOLGICAS

    PROGRAMA DE PS-GRADUAO EM ENGENHARIA AGRCOLA:

    ENGENHARIA DE SISTEMAS AGROINDUSTRIAIS E TECNOLOGIA DA PRODUO

    AGRCOLA

    ANLISE DA PRODUTIVIDADE DA SOJA ASSOCIADA A FATORES

    AGROMETEOROLGICOS, POR MEIO DE ESTATSTICA ESPACIAL DE REA, NA

    REGIO OESTE DO ESTADO DO PARAN

    EVERTON COIMBRA DE ARAJO

    Cascavel Paran Brasil

    Dezembro 2012

  • EVERTON COIMBRA DE ARAJO

    ANLISE DA PRODUTIVIDADE DA SOJA ASSOCIADA A FATORES

    AGROMETEOROLGICOS, POR MEIO DE ESTATSTICA ESPACIAL DE REA, NA

    REGIO OESTE DO ESTADO DO PARAN

    Tese apresentada ao Programa de Ps-

    Graduao em Engenharia Agrcola em

    cumprimento parcial aos requisitos para

    obteno do ttulo de Doutor em Engenharia

    Agrcola, rea de concentrao em Engenharia

    de Sistemas Agroindustriais e Tecnologia da

    Produo Agrcola, da Universidade Estadual

    do Oeste do Paran, campus Cascavel.

    Orientador: Prof. Dr. Miguel Angel Uribe Opazo

    Coorientador: Prof. Dr. Jerry Adriani Johann

    Cascavel Paran Brasil

    Dezembro 2012

  • Reviso de portugus, ingls e normas realizadas em 10 de janeiro de 2013 por Dhandara Soares de Lima.

    EVERTON COIMBRA DE ARAJO

    Dados Internacionais de Catalogao-na-Publicao (CIP)

    Biblioteca Central do Campus de Cascavel Unioeste

    Ficha catalogrfica elaborada por Jeanine da Silva Barros CRB-9/1362

    C633a

    Coimbra, Everton

    Anlise da produtividade da soja associada a fatores agrometeorolgicos, por meio de estatstica espacial de rea na Regio Oeste do Estado do Paran. / Cascavel, PR: UNIOESTE, 2012.

    116 f. ; 30 cm.

    Orientador: Prof. Dr. Miguel Angel Uribe Opazo Co-orientador: Prof. Dr. Jerry Adriani Johann Tese (Doutorado) Universidade Estadual do Oeste do Paran. Programa de Ps-Graduao Stricto Sensu em Engenharia Agrcola,

    Centro de Cincias Exatas e Tecnolgicas. Bibliografia.

    1. Autocorrelao espacial. 2. Similaridade espacial. 3. Regresso

    espacial. I. Universidade Estadual do Oeste do Paran. II. Ttulo. CDD 21. ed. 631.86

  • EVERTON COIMBRA DE ARAJO

    Anlise da produtividade da soja associada a fatores agrometeorolgicos, por meio

    de estatstica espacial de rea, na regio oeste do estado do Paran

    Tese apresentada ao Programa de Ps-Graduao stricto-sensu em Engenharia Agrcola

    em cumprimento parcial aos requisitos para obteno do ttulo de Doutor em Engenharia

    Agrcola, rea de concentrao em Engenharia de Sistemas Agroindustriais e Tecnologia da

    Produo Agrcola, da Universidade Estadual do Oeste do Paran, campus Cascavel,

    apresentada seguinte banca examinadora:

    Orientador: Prof. Dr. Miguel Angel Uribe Opazo

    Centro de Cincias Exatas e Tecnolgicas, UNIOESTE

    Coorientador: Prof. Dr. Jerry Adriani Johann

    Centro de Cincias Exatas e Tecnolgicas, UNIOESTE

    Banca 1: Prof. Dr. Rubens Augusto Camargo Lamparelli

    UNICAMP, Ncleo Interdisciplinar de Planejamento Energtico

    Banca 2: Profa. Dra. Luciana Pagliosa Carvalho Guedes

    Centro de Cincias Exatas e Tecnolgicas, UNIOESTE

    Banca 3: Prof. Dr. Adair Santa Catarina

    Centro de Cincias Exatas e Tecnolgicas, UNIOESTE

    Banca 4: Profa. Dra. Rosangela Aparecida Botinha Assumpo

    Universidade Tecnolgica Federal do Paran Campus Dois Vizinhos

    Cascavel Paran Brasil

    Dezembro 2012

  • ii

    BIOGRAFIA

    Everton Coimbra de Arajo, graduado em Tecnologia em Processamento de Dados pelo

    CESUFOZ em 2000; especialista em Projeto e Desenvolvimento de Sistemas Baseados em

    Objetos para Internet pela UTFPR em 2006; e Mestre em Cincia da Computao pela

    UFSC em 2002. Ingressou no ano de 2009 no Programa de Ps-Graduao em Engenharia

    Agrcola Engenharia de Sistemas Agroindustriais/Tecnologia da Produo Agrcola, sob a

    orientao do Prof. Dr. Miguel Angel Uribe-Opazo, estudando o tema: Estatstica Espacial

    de rea na Produtividade da Soja e Fatores Agrometeorolgicos na Regio Oeste do Estado

    do Paran.

  • iii

    Agradecimentos

    Agradeo a todos que acompanharam mais esta etapa de minha vida pessoal e

    profissional e, de alguma maneira, me auxiliaram.

    Agradeo com um carinho especial meu Orientador, Prof. Dr. Miguel Angel Uribe-

    Opazo, que deu a mim a oportunidade e a confiana para ingressar no programa de Ps-

    Graduao em Engenharia Agrcola (PGEAGRI) da UNIOESTE, campus de Cascavel, e que

    me propiciou grandes aprendizados, no s na vida acadmica, mas tambm na pessoal,

    estando sempre presente nos momentos em que precisei de apoio.

    Agradeo ao Prof. Dr. Jerry Adriani Johann, meu coorientador, pela importante

    orientao durante o desenvolvimento da tese.

    Obrigado.

  • iv

    ANLISE DA PRODUTIVIDADE DA SOJA ASSOCIADA A FATORES

    AGROMETEOROLGICOS, POR MEIO DE ESTATSTICA ESPACIAL DE REA, NA

    REGIO OESTE DO ESTADO DO PARAN

    RESUMO

    Este trabalho apresenta mtodos para serem aplicados na estatstica espacial de rea na

    produtividade da soja e fatores agrometeorolgicos na regio oeste do estado do Paran.

    Os dados utilizados esto relacionados aos anos-safra de 2000/2001 a 2007/2008, sendo as

    variveis: produtividade da soja (t ha-1) e agrometeorolgicas, tais como precipitao pluvial

    (mm), temperatura mdia (oC) e radiao solar global mdia (W m-2). Em uma primeira fase

    foram utilizados ndices de autocorrelao espacial (Moran Global e Local) e apresentados

    modelos de regresso espacial mltipla, com avaliaes de desempenho. A estimativa dos

    parmetros dos modelos ajustados se deu pelo uso do mtodo de Mxima Verossimilhana

    e a avaliao do desempenho dos modelos foi realizada com base no coeficiente de

    determinao (R2), no mximo valor do logaritmo da funo do mximo valor do logaritmo da

    funo verossimilhana e no critrio de informao bayesiano de Schwarz. Em uma

    segunda etapa foram realizadas anlises de agrupamento espacial por meio da estatstica

    multivariada, buscando identificar associaes no mesmo conjunto de variveis, porm com

    um nmero maior de anos-safra. Finalmente, os dados de um ano-safra foram aplicados em

    uma abordagem baseada em agrupamento difuso, por meio do algoritmo Fuzzy c-Means,

    tendo a similaridade medida pela definio de um ndice com este objetivo. O estudo da

    primeira fase permitiu verificar a correlao e a autocorrelao espacial entre a

    produtividade da soja e os elementos agrometeorolgicos, por meio da anlise espacial de

    rea, usando tcnicas como o ndice I de Moran Global e Local uni e bivariado e os testes

    de significncia. Foi possvel demonstrar que, por meio dos indicadores de desempenho

    utilizados, os modelos SAR e CAR ofereceram melhores resultados em relao ao modelo

    de regresso mltipla clssica. Na segunda fase, foi possvel apresentar a formao de

    grupos de municpios utilizando as similaridades das variveis em anlise. A anlise de

    agrupamento foi um instrumento til para uma melhor gesto das atividades de produo da

    agricultura, em funo de que, com o agrupamento, foi possvel se estabelecer similaridades

    que proporcionem parmetros para uma melhor gesto dos processos de produo que

    traga, quantitativa e qualitativamente, resultados almejados pelo agricultor. Na etapa final,

    por meio do algoritmo Fuzzy c-Means, foi possvel a formao de grupos de municpios

    similares produtividade de soja, utilizando o Mtodo de Deciso pelo Maior Grau de

    Pertinncia (MDMGP) e o Mtodo de Deciso pelo Limiar (MDL ). Posteriormente, a

    identificao do nmero adequado de agrupamentos foi obtida utilizando a Entropia de

    Partio Modificada. Para mensurar o nvel de similaridade de cada agrupamento, foi criado

    e utilizado um ndice de Similaridade de Clusters (ISCl), que considera o grau de pertinncia

    de cada municpio dentro do agrupamento a que pertence. Dentro das perspectivas deste

    estudo, o mtodo empregado se mostrou adequado, permitindo identificar agrupamentos de

    municpios com graus de similaridades da ordem de 60 a 78%.

    Palavras-chave: Autocorrelao espacial, Similaridade espacial, Regresso espacial

  • v

    ANLISE DA PRODUTIVIDADE DA SOJA ASSOCIADA A FATORES

    AGROMETEOROLGICOS, POR MEIO DE ESTATSTICA ESPACIAL DE REA, NA

    REGIO OESTE DO ESTADO DO PARAN

    ABSTRACT

    This paper aimed to present methods to be applied in the area of spatial statistics on

    soybean yield and agrometeorological factors in Western Paran state. The data used,

    related to crop years from 2000/2001 to 2007/2008, are the following variables: soybean

    yield (t ha-1) and agrometeorological factors, such as rainfall (mm), average temperature (oC)

    and solar global radiation average (W m-2). In the first phase,it was used indices of spatial

    autocorrelation (Moran Global and Local) and presented multiple spatial regression models,

    with performance evaluations. The estimation of parameters occurred when using the

    Maximum Likelihood method and the performance evaluation of the models was based on

    the coefficient of determination (R2), the maximum value of the function of the logarithm of

    the maximum value of the likelihood function logarithm and the Bayesian information criterion

    of Schwarz. In a second step, cluster analysis was performed using spatial statistical

    multivariate associations, seeking to identify the same set of variables, but with a larger

    number of crop years. Finally, the data from one crop year were utilized in an approach

    based on fuzzy clustering, through the Fuzzy C-Means algorithm and the similarity measure

    by defining an index for this purpose. The first phase of the study showed the correlation

    between spatial autocorrelation and soybean yield and agrometeorological elements, through

    the analysis of spatial area, using techniques such as index Global Moran's I and Local

    univariate and bivariate and significance tests. It was possible to demonstrate, through the

    performance indicators used, that the SAR and CAR models offered better results than the

    classical multiple regression model. In the second phase, it was possible to present the

    formation of groups of cities using the similarities of the variables under analysis. Cluster

    analysis is a useful tool for better management of production activities in agriculture, since,

    with the grouping, it was possible to establish similarities parameters that provide better

    management of production processes that bring quantitative and qualitatively better, results

    sought by the farmer. In the final step, through the use of Fuzzy C-Means algorithm, it was

    possible to form groups of cities of similar soybean yield using the method of decision by the

    Higher Degree of Relevance (MDMGP) and Method of Decision Threshold by ( CDM).

    Subsequently, identification of the adequate number of clusters was obtained using modified

    partition entropy. To measure the degree of similarity of each cluster, a Cluster Similarity

    Index (ISCl) was designed and used, which considers the degree of relevance of each city

    within the group to which it belongs. Within the perspective of this study, the method used

    was adequate, allowing to identify clusters of cities with degrees of similarities in the order of

    60 to 78%.

    KEY WORDS: Spatial autocorrelation, spatial similarity, similarity index.

  • vi

    SUMRIO

    INTRODUO ..................................................................................................................... 12

    1 ANLISE ESPACIAL DA PRODUTIVIDADE DA SOJA E DOS DADOS

    AGROMETEOROLGICOS ................................................................................................ 15

    1.1 A cultura da soja .................................................................................................... 15

    1.2 Dados agrometeorolgicos .................................................................................... 20

    1. 2. 1 Temperatura do ar .......................................................................................... 17

    1. 2. 2 Precipitao pluvial ......................................................................................... 18

    1. 2. 3 Radiao Solar Global .................................................................................... 18

    1.3 Geoprocessamento ............................................................................................... 19

    1. 3. 1 Sistemas de Informaes Geogrficas (SIG) .................................................. 19

    1.3.1.1 reas de Aplicao do SIG........................................................................ 25

    1.4 Anlise espacial ..................................................................................................... 21

    1. 4. 1 Anlise Exploratria de Dados Espaciais (AEDE) ........................................... 23

    1. 4. 2 Matriz de proximidade espacial....................................................................... 24

    1. 4. 3 Vetor dos desvios e vetor de mdias ponderadas .......................................... 30

    1. 4. 4 Dependncia Espacial .................................................................................... 27

    1. 4. 5 Estatstica Espacial de rea ........................................................................... 29

    1. 4. 6 Anlise de variveis espaciais de reas ......................................................... 30

    1.5 Autocorrelao espacial......................................................................................... 31

    1. 5. 1 Autocorrelao espacial global univariada ...................................................... 32

    1. 5. 2 Autocorrelao espacial global multivariada ................................................... 33

    1. 5. 3 Autocorrelao espacial local ......................................................................... 34

    1. 5. 4 Indicadores Locais de Associao Espacial (LISA) Univariado ....................... 34

    1. 5. 5 Indicadores Locais de Associao Espacial (LISA) Multivariado ..................... 35

    1. 5. 6 Anlise Grfica da Autocorrelao Espacial ................................................... 39

    1.6 reas de influncia ................................................................................................ 38

    1.7 Modelagem espacial .............................................................................................. 40

    1. 7. 1 Modelos de regresso espacial ...................................................................... 42

    1.7.1.1 Regresso linear espacial......................................................................... 47

    1.7.1.2 SAR (Spatial Auto Regressive Model) ou Spatial Lag Model.................... 47

    1.7.1.3 CAR (Conditional Auto Regressive Model) ou Spatial Error Model.......... 47

    1.8 Estatstica multivariada .......................................................................................... 44

    1. 8. 1 Anlise de Agrupamentos (AA) ....................................................................... 50

    1. 8. 2 Dendograma ................................................................................................... 47

  • vii

    1. 8. 3 ndice RMSSTD e RS ..................................................................................... 48

    1.9 Conjuntos fuzzy como modeladores de incerteza .................................................. 49

    1. 9. 1 Conceito de Fuzzy C-means ........................................................................... 51

    1.9.1.1 Similaridade.................................................................................................... 51

    1. 9. 2 Medindo a Validade do Agrupamento ............................................................. 52

    1.9.2.1 Fuzziness Performance Index (FPI)............................................................... 53

    1.9.2.2 Modified Partition Entropy (MPE)................................................................... 54

    1.9.2.3 Compactness and Separation (CS)............................................................... 54

    1.9.2.4 Inter Class Contrast (ICC)............................................................................. 55

    1.10 REFERNCIAS ..................................................................................................... 56

    2 MODELO DE REGRESSO ESPACIAL PARA ESTIMATIVA DA PRODUTIVIDADE DA

    SOJA ASSOCIADA A VARIVEIS AGROMETEOROLGICAS NA REGIO OESTE DO

    ESTADO DO PARAN ........................................................................................................ 64

    2.1 INTRODUO ...................................................................................................... 65

    2.2 MATERIAIS E MTODOS ..................................................................................... 66

    2.3 RESULTADOS E DISCUSSO ............................................................................. 71

    2.4 CONCLUSES ..................................................................................................... 78

    2.5 AGRADECIMENTOS ............................................................................................. 78

    2.6 REFERNCIAS ..................................................................................................... 79

    3 ANLISE DE AGRUPAMENTO DA VARIABILIDADE ESPACIAL DA PRODUTIVIDADE

    DA SOJA E VARIVEIS AGROMETEOROLGICAS NA REGIO OESTE DO PARAN .. 82

    3.1 INTRODUO ...................................................................................................... 82

    3.2 MATERIAL E MTODOS ...................................................................................... 83

    3.3 RESULTADOS E DISCUSSO ............................................................................. 88

    3.4 CONCLUSES ..................................................................................................... 96

    3.5 AGRADECIMENTOS ............................................................................................. 96

    3.6 REFERNCIAS ..................................................................................................... 96

    4 CLASSIFICAO DE REAS ASSOCIADAS PRODUTIVIDADE DA SOJA E

    VARIVEIS AGROMETEOROLGICAS POR MEIO DE AGRUPAMENTO FUZZY ........... 99

    4.1 INTRODUO ...................................................................................................... 99

    4.2 MATERIAIS E MTODOS ................................................................................... 101

    4.3 RESULTADOS E DISCUSSO ........................................................................... 104

    4.4 CONCLUSO ...................................................................................................... 108

    4.5 REFERNCIAS ................................................................................................... 109

    CONSIDERAES FINAIS ............................................................................................... 112

  • viii

    Lista de Tabelas

    Tabela 1 Mapa Box Map. ..................................................................................................... 36

    Tabela 2 ndice I de Moran Global de autocorrelao espacial para as variveis em estudo.

    ............................................................................................................................................ 71

    Tabela 3 ndice I de Moran Bivariado e nvel descritivo (p-valor). ........................................ 74

    Tabela 4 Resumo de modelos ajustados e da anlise com os parmetros obtidos para o

    Modelo SAR. ....................................................................................................................... 75

    Tabela 5 Resumo de modelos ajustados e da anlise com os parmetros obtidos para o

    Modelo CAR. ....................................................................................................................... 76

    Tabela 6 Resumo de modelos ajustados e da anlise com os parmetros obtidos para o

    Modelo de Regresso Mltipla Clssica. ............................................................................. 78

    Tabela 7 Processo de agrupamento por similaridade e distncia euclidiana dos municpios

    da rea em estudo, considerando as variveis Prod, Prec, TMed, Rs, LISA. ....................... 89

    Tabela 8 Processo de agrupamento por similaridade e distncia dos municpios da rea em

    estudo para os anos-safra de 2000/2001 a 2007/2008. ....................................................... 94

    Tabela 9 Estatsticas descritivas das variveis e de seus respectivos valores padronizados

    no ano-safra de 2007/2008. ............................................................................................... 104

    Tabela 10 Graus de incluso entre os agrupamentos estabelecidos pelo mtodo MDMGP

    .......................................................................................................................................... 105

    Tabela 11 Distribuio dos municpios nos agrupamentos de acordo com os mtodos de

    pertinncia MDMGP e MDL ............................................................................................. 105

    Tabela 12 Estatsticas para as variveis do estudo em cada agrupamento da regio de

    estudo ................................................................................................................................ 107

  • ix

    Lista de Figuras

    Figura 1 Mapa de John Snow (1855) mostrando os locais de ocorrncia de epidemia de clera em

    Londres em 1854 (CMARA; MONTEIRO, 2004)......................................................................................... 22

    Figura 2 Mapa do estado de Roraima com diviso por municpios ............................................................ 25

    Figura 3 Matriz de vizinhana para os municpios do estado de Roraima ................................................ 25

    Figura 4 Matriz de proximidade espacial de primeira ordem, normalizada pelas linhas ......................... 26

    Figura 5 Representao dos tipos de contiguidade entre reas. (a) Contiguidade Queen (rainha), (b)

    Contiguidade Rook (torre) e (c) Contiguidade Bishop (bispo) ..................................................................... 26

    Figura 6 Padres de distribuio espacial de pontos ................................................................................... 28

    Figura 7 Valores de Produtividade para os dados da safra de 2001/2002, em 48 municpios da regio

    oeste do estado do Paran agrupados pela mdia estadual ....................................................................... 30

    Figura 8 Matriz de Diagramas de Disperso de Moran apresentado por Anselin et al. (2004) .............. 33

    Figura 9 Estrutura do diagrama de disperso de Moran onde W_Varivel caracteriza a varivel de

    interesse defasada espacialmente................................................................................................................... 36

    Figura 10 Mapas para uma anlise grfica da autocorrelao espacial .................................................... 37

    Figura 11 Determinao de reas de influncia pelo mtodo de Thiessen ............................................... 39

    Figura 12 Exemplo de juno espacial ............................................................................................................. 40

    Figura 13 Dendogramas .................................................................................................................................... 47

    Figura 14 Trajetria dos ndices RMSSTD (a) e RS (b) em funo do aumento do nmero de clusters

    (grupos) ................................................................................................................................................................ 48

    Figura 15 Exemplo de similaridades ................................................................................................................ 52

    Figura 16 Regio Oeste do Paran, com destaque para os municpios com estaes meteorolgicas:

    (2) Assis Chateaubriand, (8) Cascavel, (15) Foz do Iguau, (16) Guara, (32) Palotina, (36) Santa

    Helena, (41) So Miguel do Iguau, e (45) Toledo. ...................................................................................... 66

    Figura 17 Mapa de espalhamento de Moran Global para a varivel Produtividade da Soja. ................. 72

    Figura 18 Indicador local de autocorrelao espacial (LISA) para a varivel Produtividade de Soja. .. 73

    Figura 19 Mapa de espalhamento de Moran local para a varivel Produtividade da soja. ..................... 74

    Figura 20 Mapa de espalhamento de Moran local para os resduos padronizados do modelo SAR. ... 76

    Figura 21 Mapa dos resduos padronizados da regresso espacial gerada pelo modelo Spatial Error,

    considerando o mtodo do desvio-padro. .................................................................................................... 77

    Figura 22 Mapa de localizao da regio oeste do estado do Paran. ..................................................... 84

  • x

    Figura 23 Regio oeste do Paran, com destaque para os municpios com estaes meteorolgicas.

    ............................................................................................................................................................................... 84

    Figura 24 Grfico de estimao do nmero timo de clusters para os anos-safra em estudo por meio

    das estatsticas RMSSTD e RS ........................................................................................................................ 88

    Figura 25 Dendogramas gerados com as variveis produtividade da soja (t ha-1

    ), precipitao pluvial

    (mm), temperatura mdia do ar (C), radiao solar global mdia (W m-2) e ndice LISA para os 48

    municpios da rea de estudo em oito anos. .................................................................................................. 90

    Figura 26 Mapa temtico de anlise dos agrupamentos dos municpios da pesquisa com base no

    ndice de similaridade, considerando as variveis na Produtividade da soja (t ha-1

    ), Precipitao

    pluvial (mm), Temperatura Mdia do ar (C), Radiao Solar Global Mdia (W m-2

    ) e ndice LISA

    Univariado. ........................................................................................................................................................... 92

    Figura 27 Grfico de estimao do nmero timo de clusters para todas as safras em estudo, como

    um nico conjunto, por meio das estatsticas RMSSTDe RS. ..................................................................... 93

    Figura 28 Mapa temtico e dendograma de anlise dos agrupamentos dos municpios da pesquisa

    com base no ndice de similaridade considerando as variveis na produtividade da soja (t ha-1

    ),

    precipitao pluvial (mm), temperatura mdia do ar (C), radiao solar global mdia (W m-2

    ) e ndice

    LISA univariado, para todos os anos-safra em estudo. ................................................................................ 94

    Figura 29 Regio oeste do Paran com destaque para os municpios com estaes meteorolgicas

    ............................................................................................................................................................................. 101

    Figura 30 Distribuio dos agrupamentos impostos pelo FCM decorrente dos mtodos: MDMGP(a),

    MDL 0,5 (b), MDL 0,65 (c) e MDL 0,8 (d) .............................................................................................. 106

    Figura 31 Mapa temtico da produtividade da soja..................................................................................... 108

  • xi

    Lista de Siglas

    AEDE Anlise Exploratria de Dados Espaciais

    CAR Conditional Auto Regressive Model

    CS Compactness and Separation

    EEA Estatstica Espacial de rea

    FCM Fuzzy c-Means

    FPI Fuzziness Performance Index

    ICC Inter Class Contrast

    LISA Local Indicator of Spatial Association

    MPE Modified Partition Entropy

    MQO Mnimos Quadrados Ordinrios

    PIB Produto Interno Bruto

    RMSSTD Root Mean Square Standard Deviation

    RS R-Square

    SAR Spatial Auto Regressive Model

    SIG Sistemas de Informao Geogrfica

  • 12

    INTRODUO

    De acordo com Guimares e Alvarez (2011), nas transformaes tcnico-produtivas

    da agricultura brasileira, iniciadas na dcada de 1960, a soja tem se destacado como o

    principal produto do agronegcio, trazendo ao pas, desde 1976, a posio de segundo

    maior produtor mundial, sendo superado apenas pelos Estados Unidos. Em 2010, o Brasil

    respondeu por 26,2% da produo mundial de soja (CONAB, 2010), que correspondeu a

    67,5 milhes de toneladas de soja, cultivada em uma rea de 24,2 milhes de hectares

    (rea equivalente ao territrio do Reino Unido) (CONAB, 2010). Em termos comerciais, a

    soja foi responsvel por cerca de 9% das exportaes brasileiras, perfazendo R$ 17,5

    bilhes. Em relao ao PIB do agronegcio desse mesmo ano, a commodity respondeu por

    5,6% de um total de R$ 821,8 bilhes, que correspondeu a uma participao de 1,25% do

    PIB nacional (BRASIL, 2012; CEPEA, 2012).

    Em relao aos estados produtores, Guimares e Alvarez (2011) destacam que o

    Paran, de 1960 at o final da dcada de 1990, foi o principal estado produtor do pas, tanto

    em rea cultivada quanto em volume produzido, sendo esse estado responsvel, ainda em

    2010, por 21% da soja colhida no Brasil. Os autores ressaltam, entretanto, que em

    decorrncia da expanso agrcola em direo ao Cerrado, na dcada de 1980, o Paran

    perdeu a liderana produtiva para Mato Grosso, que responde atualmente por cerca de 27%

    da produo brasileira (CONAB, 2010).

    A gerao de informaes relacionadas aos cultivos agrcolas, como rea cultivada,

    produo e rendimento de gros, um dos objetivos das estimativas de safras. Aliado a

    essas estimativas, o conhecimento de sua distribuio no espao geogrfico se torna uma

    informao importante para o planejamento, a logstica e a segurana alimentar, alm da

    extrema relevncia para a formao de preos (FIGUEIREDO, 2005; ASSAD et al., 2007).

    A precipitao pluvial, a radiao solar global e a temperatura mdia so elementos

    agrometeorolgicos limitantes e o conhecimento das ocorrncias deles dentro do ciclo das

    culturas permite entender a importncia deles em estimativas de safra (CARGNELUTTI

    FILHO et al., 2009). O emprego de mtodos estatsticos multidimensionais torna-se,

    portanto, uma tcnica fundamental na anlise dessas inter-relaes, j que considerada

    tambm a localizao dos dados.

    Modelos que empregam variveis agrometeorolgicas geralmente integram o

    acmulo (ou a perda) de biomassa das culturas ao longo do tempo, utilizando informaes

    de dados pontuais de estaes meteorolgicas de superfcie. Ento, faz-se necessrio

    interpolar os dados para obteno dos resultados, por exemplo, em escalas regionais,

    estaduais e outras. Posteriormente os resultados podem ser classificados ou agrupados por

    unidades de rea e apresentados na forma de mapas (ROMANI et al., 2003).

  • 13

    Os Sistemas de Informao Geogrfica (SIG) facilitam e contribuem no processo de

    anlise dos dados, pois fornecem recursos para visualizao, manipulao, armazenamento

    e processamentos de variveis georreferenciadas. Quando utilizadas em conjunto com SIG,

    tcnicas estatsticas para anlise de dados espaciais de reas podem ser desenvolvidas,

    permitindo e subsidiando a Anlise Espacial de rea (ZIBORDI et al., 2006).

    Uma vez que Estatstica Espacial de rea (EEA) faz uso das coordenadas

    espaciais no processo de coleta, descrio e anlise dos dados, esta tcnica concentra seu

    interesse nos processos que ocorrem no espao e buscam, por meio do emprego de seus

    mtodos, descrever e analisar o comportamento desses processos. As reas (com

    contagens) utilizadas na EEA representam dados agregados (polgonos), como os

    municpios deste estudo. A apresentao usual desses dados se faz pelo uso de mapas

    temticos, com cores destacando o padro espacial do fenmeno em estudo. A anlise

    espacial de rea busca por um modelo inferencial que incorpore explicitamente as relaes

    espaciais constituintes deste fenmeno, objetivando identificar padres de dependncia

    espacial das variveis em estudo.

    Desta maneira, este mtodo busca descrever a distribuio espacial, os padres de

    associao espacial (spatial clusters), verificar a existncia de diferentes regimes espaciais

    ou outras formas de instabilidade espacial, alm de identificar observaes atpicas. Esta

    situao pode tambm ser subsidiada por meio da anlise de agrupamento (cluster

    analysis), uma tcnica oferecida pela anlise multivariada, que identifica grupos, com

    propriedades homogneas entre os elementos amostrais, em objetos de dados

    multivariados.

    Outra tcnica para anlise de agrupamentos a teoria de conjuntos nebulosos,

    conhecida como teoria dos conjuntos fuzzy, que se mostra boa para modelar a relao entre

    a produtividade da soja e as variveis agrometeorolgicas, pois tem sido utilizada por se

    basear na caracterizao de classes que no possuem limites rgidos entre si.

    O objetivo geral deste trabalho foi estudar tcnicas de Estatstica Espacial de rea

    nas formas Univariada e Multivariada no estudo da produtividade da soja (t ha-1) na regio

    oeste do estado do Paran, da safra 2000/2001 at a safra 2007/2008, associadas aos

    fatores agrometeorolgicos: precipitao pluvial (mm), temperatura mdia do ar (oC) e

    radiao solar global (W m-2).

    Esta tese est organizada em quatro captulos. O primeiro captulo apresenta um

    levantamento bibliogrfico sobre as metodologias adotadas. No segundo, objetivou-se

    analisar espacialmente, para os anos-safras 2005/2006 a 2007/2008, a produtividade da

    soja e as variveis agrometeorolgicas, por meio dos ndices de correlao e autocorrelao

    espacial (ndices de Moran Global e Moran Local (LISA) uni e bivariado) e seus testes de

    significncia e gerar modelos de regresso espacial mltipla autorregressivos (SAR) e

    modelos de erro espacial (CAR) entre as variveis estudadas. O terceiro captulo buscou

  • 14

    realizar uma anlise de agrupamento da variabilidade espacial da produtividade da soja e de

    variveis agrometeorolgicas e do ndice de Moran Local univariado para a produtividade da

    soja (LISA). Finalizando, no quarto captulo foram classificadas, por meio da tcnica fuzzy

    para agrupamentos, reas associadas produtividade da soja (t ha-1) na regio oeste do

    estado do Paran, considerando as variveis agrometeorolgicas.

  • 15

    1 ANLISE ESPACIAL DA PRODUTIVIDADE DA SOJA E DOS DADOS

    AGROMETEOROLGICOS

    1.1 A cultura da soja

    De acordo com Klosowski (1997), devido farta aplicabilidade de seus produtos e

    da facilidade de seu cultivo, a soja extremamente importante para a humanidade, o que

    vem motivando sua expanso no Brasil. cultivada h mais de cinco mil anos no Oriente,

    especialmente na China, regio caracterizada por clima temperado. No Ocidente, tornou-se

    conhecida no sculo XX, por meio de sua explorao comercial nos Estados Unidos. Na

    Europa, segundo Costa (1996) e Embrapa (2006), a soja foi introduzida na metade do

    sculo XVIII pelos holandeses; entretanto, s depois de 1914 que comeou a despertar

    interesse nos meios agronmicos.

    Na Amrica do Sul, de acordo com Freire e Vernetti (1999), a soja foi introduzida

    inicialmente na Argentina (final do sculo XIX). No Brasil, foi cultivada por imigrantes

    japoneses, primeiramente no estado de So Paulo e em seguida nos estados de Minas

    Gerais, Paran, Santa Catarina e Rio Grande do Sul (tambm pelos japoneses). Em termos

    de produo espacial, a cultura da soja vem ampliando sua rea, com destaque para a

    Regio Sul e a Centro-Oeste, embora as fronteiras agrcolas tenham avanado muito nas

    ltimas dcadas (YOKOO; SILVEIRA, 2006).

    Yokoo e Silveira (2006) ressaltam que a demanda por informaes concretas e

    eficientes sobre o desenvolvimento das culturas agrcolas ao longo de seus ciclos vem

    aumentando constantemente. Esse aumento se deve tanto por razes que implicam o

    aumento da produtividade como por questes de ordem econmica e ambiental, pois,

    ressaltamos autores, a soja tem estado entre os cultivos mais representativos na pauta do

    mercado externo.

    No cenrio paranaense, Freire e Vernetti (1999) comentam que a cultura da soja

    obteve destaque em meados da dcada de 1950, pois at ento sua pequena produo era

    destinada ao consumo domstico e alimentao de sunos. Na Regio Sul do estado e em

    pequenas reas, afirmam os autores, era utilizada como alternativa ao lado do arroz

    sequeiro. A cultura da soja, at os anos 1950, no figurava como cultivo comercial para as

    regies norte, noroeste, oeste e sudoeste do Paran. O que a impulsionou foi a grande

    geada de 1953, que destruiu parte dos cafezais das regies norte e noroeste do estado, o

    que forou a maioria dos agricultores ao cultivo de cereais, intercalando com a cultura do

    caf.

    De acordo com a Embrapa (2005), foi na regio sul do estado do Paran,

    particularmente nos Campos Gerais, que houve um maior desenvolvimento da cultura da

  • 16

    soja. Na regio sudoeste do estado, inicialmente a soja era plantada em pequenas

    propriedades. O oeste do Paran, em razo da fertilidade das terras, do seu baixo preo e

    das condies de clima propcias, foi alvo de interesse de agricultores sulistas no final da

    dcada de 1960 (YOKOO; SILVEIRA, 2006).

    Yokoo e Silveira (2006) ressaltam que a partir de 1965 foi constatado grande

    aumento da rea cultivada com a soja no Paran, dada a facilidade de comercializao. At

    esse perodo, a tecnologia de cultivo vinha principalmente do Rio Grande do Sul e de So

    Paulo, pois no Paran a pesquisa com a soja se restringia a alguns experimentos de

    variedades e de pocas de semeadura realizados pela Secretaria da Agricultura e pelo

    instituto de pesquisas IRI. Foi a partir da dcada de 1970 que essa cultura adquiriu maior

    expressividade, acentuando-se a partir de 1975 (KASTER et al., 1989; ALMEIDA et al.,

    1999).

    Na regio oeste do estado do Paran, acultura da soja tem importncia social e

    econmica pela elevada produtividade e pela extenso da rea cultivada, constituindo-se

    em uma das principais regies produtoras do estado (DERAL/SEAB, 2000; ROESE et al.,

    2001). Ayoade (1986) ressalta que o cultivo da soja ocorre nas estaes de

    primavera/vero.

    1.2 Dados agrometeorolgicos

    Uma observao meteorolgica de superfcie consiste na medio ou determinao

    de todos os elementos que, em seu conjunto, representem as condies meteorolgicas em

    um dado momento e em um determinado lugar, utilizando-se de instrumental adequado e

    valendo-se do sentido da viso. As observaes realizadas de maneira sistemtica,

    uniforme, ininterrupta e em horas estabelecidas permitem conhecer as caractersticas e

    variaes dos elementos atmosfricos. Esses elementos constituem os dados bsicos para

    informar o tempo que est ocorrendo nas diferentes estaes meteorolgicas (INMET,

    1999).

    De acordo com Vianello e Alves (2001), os dados agrometeorolgicos, como

    temperatura mdia do ar, precipitao pluvial e radiao solar, podem ser obtidos mediante

    leituras ou registros contnuos, diretamente dos instrumentos. As observaes

    meteorolgicas so realizadas em estaes meteorolgicas, que so locais tecnicamente

    escolhidos e preparados para tais fins. Em relao aos elementos do clima, os autores os

    definem como grandezas meteorolgicas que comunicam ao meio atmosfrico suas

    propriedades e caractersticas peculiares. Os principais elementos, pertinentes a este

    estudo, so: temperatura do ar, precipitao pluvial e radiao solar.

    Segundo Carmo Neto et al. (2011), a agricultura a atividade econmica que

    apresenta maior dependncia das condies climticas, as quais so consideradas como

  • 17

    um dos principais fatores responsveis pelas oscilaes nas produes das culturas. As

    variveis climticas influenciam todo o ciclo fenolgico das plantas e tambm determinam a

    produo e a produtividade das culturas.

    Yokoo e Silveira (2006) ressaltam que se torna cada vez mais fcil identificar,

    dentro do ano e das regies, por meio das previses agrometeorolgicas e com o apoio de

    anlises de sries histricas de dados agrometeorolgicos, quais pocas so mais

    adequadas para o cultivo de cada cultivar. Conforme Mota (2002), a previso

    agrometeorolgica trata da avaliao do estado presente e futuro das culturas, inclusive das

    datas do desenvolvimento e da produtividade da colheita (quantidade e qualidade), assim

    como outros fatores que afetam a produo, como a densidade da semeadura e a escolha

    das reas a serem plantadas. O autor ainda ressalta que esse processo diferente das

    previses meteorolgicas para a agricultura, pois esta trata das previses dos elementos

    meteorolgicos que afetam as atividades agrcolas, como, por exemplo, previses para

    fumigao e para estimar a probabilidade de ocorrncia de condies potencialmente

    perigosas (geada, incndio, granizo e chuva forte).

    1. 2. 1 Temperatura do ar

    Silva (2008) afirma que, como a maioria dos gases, o ar no um bom condutor de

    calor e tarda muito a alcanar o equilbrio trmico com os demais corpos com os quais se

    acha em contato. A autora ressalta que nas camadas de ar adjacentes ao solo que se

    verificam as variaes mais rpidas dos valores de temperatura do ar e a partir de

    determinada altitude (correspondente superfcie de 850 hPa) que se verifica um

    decrscimo mais ou menos regular. lembrado ainda pela autora que a distribuio de

    temperatura no planeta influenciada por diversos fatores, tais como a latitude, a

    distribuio dos continentes e mares, as correntes martimas, os ventos predominantes e

    pela ao das massas de ar.

    De acordo com Silva (2008), a temperatura do ar controlada principalmente pela

    radiao solar e sua distribuio depende da latitude. A autora ressalta que cidades na

    mesma latitude esto mesma distncia do equador e tendem a ter a mesma temperatura,

    mas a temperatura depende de outros fatores tambm, como a altitude. A oscilao diurna

    da temperatura, conforme afirmao da mesma autora, varia notavelmente de amplitude

    segundo as condies locais e a poca do ano, de tal maneira que se considera a referida

    amplitude como um dos ndices climatolgicos mais significativos.

    Segundo Caramori (2003), entre os elementos meteorolgicos que mais afetam a

    produtividade agrcola no mundo destacam-se a temperatura e a precipitao. A

    temperatura, de acordo com o autor, de tal maneira limitante aos cultivos que a

    distribuio geogrfica das espcies vegetais no globo est confinada aos limites trmicos

  • 18

    tolerados por cada espcie ou variedade. Por outro lado, afirma o autor, a disponibilidade

    hdrica o fator que mais causa frustraes de safra em todo o mundo.

    1. 2. 2 Precipitao pluvial

    A precipitao definida como conjunto de partculas lquidas ou slidas que caem

    das nuvens (chuva, chuvisco, granizo e neve), conjunto de partculas em suspenso na

    atmosfera (nevoeiro e bruma) e como partculas que se depositam (geada e orvalho)

    (INMET, 1999). Para as condies climticas do Brasil, a chuva a precipitao mais

    significativa em termos de volume. o elemento alimentador da fase terrestre do ciclo

    hidrolgico e constitui, portanto, fator importante para os processos de escoamento

    superficial direto, infiltrao, evaporao, evapotranspirao, recarga de aquferos e vazo

    dos rios. A precipitao sempre equilibra a evaporao em termos globais, a fim de manter

    harmnico o equilbrio hidrolgico (SILVA, 2008).

    A chuva, por sua grande variabilidade em termos espacial e temporal, constitui-se

    em um dos elementos climticos de maior importncia para a agricultura, por sua grande

    influncia em todos os estgios do desenvolvimento das plantas (VILHENA et al., 2009). O

    excesso ou a deficincia hdrica em determinados subperodos de desenvolvimento dos

    cultivos agrcolas pode acarretar prejuzos, em termos de produtividade e de economia,

    sendo, portanto, de grande importncia os estudos voltados para a avaliao da influncia

    dos regimes pluviomtricos na produo agrcola (SILVA et al., 2011).

    1. 2. 3 Radiao Solar Global

    A radiao solar incidente no topo da atmosfera terrestre varia basicamente com a

    latitude e o tempo, a qual, ao atravessar a atmosfera, interage com seus constituintes. Parte

    dessa radiao que espalhada em outras direes especfica da radiao solar difusa; a

    outra parte, que chega diretamente superfcie do solo, denominada de radiao solar

    direta. Somando a radiao difusa com a direta obtm-se a radiao solar global (SILVA et

    al., 2009).

    Ayoade (1986) considera que a radiao solar a energia que aciona o sistema

    agrcola, determinando as caractersticas trmicas do ambiente, especialmente as

    temperaturas do ar e do solo. Determina tambm a durao do dia, ou seja, o

    fotoperiodismo (resposta dos vegetais luminosidade). O autor ainda complementa que, se

    no houver radiao suficiente, o sistema radicular da planta no se desenvolve

    completamente.

  • 19

    1.3 Geoprocessamento

    A obteno de informaes sobre a distribuio geogrfica de fenmenos e objetos

    parte importante das atividades de organizao da sociedade. Antes contidas em mapas e

    documentos em papel impresso, o desenvolvimento da Informtica, na segunda metade do

    sculo XX, possibilitou armazenar e representar tais informaes em ambiente

    computacional, culminando no advento da prtica do Geoprocessamento, tido como: [...]

    um ramo do processamento de dados que opera transformaes nos dados contidos em

    uma base de dados referenciada territorialmente (geocodificada), usando recursos

    analticos, grficos e lgicos, para a obteno e apresentao das transformaes

    desejadas (SILVA, 1992).

    Renem-se hardware, software, base de dados, metodologias e operador, que

    analogicamente correspondem s ferramentas materiais e virtuais de trabalho, matria-

    prima, s tcnicas do ofcio e ao trabalhador. Com os componentes tcnicos de suporte

    material (hardware) e os programas de manipulao de dados no suporte lgico (software),

    trabalhar com Geoprocessamento significa utilizar computadores como instrumentos de

    manuseio de dados para representao digital do espao geogrfico (DOMINGUES;

    FRANOSO, 2008). O conjunto de dados cujo significado contm associaes ou relaes

    de natureza espacial formam uma informao geogrfica (GONALVES, 2008), dispostas

    em planilhas alfanumricas, matrizes e representaes grficas vetoriais. Para que essas

    informaes sejam submetidas ao processamento computacional, a cada tipo de informao

    associado um valor numa escala de medida ou referncia, o que insere a representao

    dos fenmenos geogrficos na lgica dos sistemas de informao (MATIAS, 2002).

    Vrias so as Cincias que se beneficiam de seus resultados, como a Agronomia e

    o Urbanismo. Transpondo limites cientficos disciplinares por meio dos trabalhos de

    localizao dos fenmenos e equacionamento e esclarecimento das condies espaciais, o

    Geoprocessamento :

    [...] uma tecnologia transdisciplinar que, atravs da axiomtica da localizao e do processamento de dados geogrficos, integra vrias disciplinas, equipamentos, programas, processos, entidades, dados, metodologias e pessoas para coleta, tratamento, anlise e apresentao de informaes associadas a mapas digitais georreferenciados. (ROCHA, 2002, p.210)

    1. 3. 1 Sistemas de Informaes Geogrficas (SIG)

    O termo Sistemas de Informao Geogrfica (SIG) aplicado em sistemas que

    realizam o tratamento computacional de dados geogrficos e armazenam a geometria e os

    atributos dos dados que esto georreferenciados, isto , localizados na superfcie terrestre e

    representados numa projeo cartogrfica (DRUCK et al., 2004). A principal diferena de um

  • 20

    SIG para um sistema de informao convencional sua capacidade de armazenar tanto os

    atributos descritivos como as geometrias dos diferentes tipos de dados geogrficos (NALON

    et al., 2011).

    Desde sua concepo inicial, mais simplista e voltada para o projeto e para a

    construo de mapas, os SIG tm incorporado uma crescente variedade de funes. Em

    especial, apresentam mecanismos sofisticados para manipulao e anlise espacial de

    dados, permitindo uma visualizao bem mais intuitiva dos dados do que a obtida por meio

    de relatrios e grficos convencionais (SILVA et al., 2009).

    Pinheiro e Silva (2009) dividem a evoluo dos SIG em trs fases: manipulao e

    visualizao de banco de dados (primeira fase), operaes analticas de dados no-grficos

    e estrutura organizacionais (segunda fase) e anlise espacial (terceira fase).

    Iniciada na dcada de 1950, a primeira fase marcada pela necessidade de

    armazenar, organizar, processar e visualizar dados, originando os SIG baseados na

    manipulao e visualizao de dados. Na segunda fase, o aumento da capacidade de

    processamento e de memria dos computadores possibilitou novas concepes e a

    popularizao dos SIG, conforme Teixeira et al. (1995). Nesta fase, as operaes analticas

    so enfatizadas por meio de modelos matemticos. A terceira fase, dcada de 1980, foi

    marcada pela reduo de recursos para a pesquisa cientfica enquanto havia um

    crescimento do setor industrial e comercial dos SIG. Nesta fase, o potencial dos SIG foi mais

    explorado, combinando atributos no-geogrficos com as relaes topolgicas dos objetos

    geogrficos para efetuar anlises espaciais sobre dados georreferenciados

    (PINHEIRO;SILVA, 2009). Os SIG tambm podem ser considerados como um tipo de

    Sistema de Informao, que envolve de maneira sistmica e interativa um Banco de Dados,

    Tecnologia e Pessoal, sendo capaz de realizar Anlises Espaciais, armazenar, manipular,

    visualizar e operar dados georreferenciados para a obteno de novas informaes.

    Conforme Miranda (2005), a abordagem mais adequada para a definio de SIG

    a que enfatiza a importncia da anlise espacial e da modelagem que pode ser realizada, na

    qual o SIG visto mais como uma cincia de informao espacial do que uma tecnologia.

    As definies de SIG refletem, cada uma sua maneira, a multiplicidade de usos e vises

    possveis dessa tecnologia e apontam para uma perspectiva interdisciplinar de sua

    utilizao. A partir desses conceitos, possvel indicar duas importantes caractersticas de

    SIG. Primeiro, tais sistemas possibilitam a integrao, em uma nica base de dados, de

    informaes geogrficas provenientes de fontes diversas, como dados cartogrficos, dados

    de censo e cadastro urbano e rural, imagens de satlite e modelos numricos de terreno.

    Segundo, SIG oferecem mecanismos para recuperar, manipular e visualizar esses dados,

    por meio de algoritmos de manipulao e anlise (CAMARA et al., 1996).

    Desta maneira, o SIG pode ser entendido como ferramenta computacional para o

    geoprocessamento, que permite realizar anlises complexas, ao integrar dados de diversas

  • 21

    fontes (fotos areas, imagens de satlite, cartas topogrficas, imagens vetoriais e dados

    cadastrais das regies observadas) e criar bancos de dados georreferenciados (CMARA et

    al., 2001).

    1. 3. 1. 1 reas de Aplicao do SIG

    Oliveira (1997) apresenta uma relao das diversas reas de aplicao de SIG,

    divididas em cinco grupos principais:

    ocupao humana;

    uso da terra;

    uso de recursos naturais;

    meio ambiente; e

    atividades econmicas.

    Segundo Oliveira (1997), a noo de anlise espacial num SIG baseia-se na ideia

    da integrao de dados espaciais e de atributos alfanumricos, traduzindo-se numa srie de

    funes relacionadas com a seleo, a pesquisa e a modelagem de dados.

    1.4 Anlise espacial

    A compreenso da distribuio espacial de dados oriundos de fenmenos ocorridos

    no espao para a elucidao de questes centrais em diversas reas do conhecimento seja

    em ambiente, em sade, em geologia, em agronomia, entre outras, constitui um grande

    desafio. A ideia central incorporar o espao anlise que se deseja fazer (SANTOS et al.,

    2004).

    Bailey (1994) define a anlise espacial como uma ferramenta que possibilita

    manipular dados espaciais de diferentes formas e extrair conhecimento adicional como

    resposta, incluindo funes bsicas como consulta de informaes espaciais dentro de

    reas de interesse definidas, manipulao de mapas e produo de alguns breves sumrios

    estatsticos dessa informao, incorporando tambm funes como a investigao de

    padres e relacionamentos dos dados na regio de interesse, buscando, assim, um melhor

    entendimento do fenmeno e a possibilidade de se fazer predies.

    Um exemplo pioneiro do uso da anlise espacial de rea, ao qual intuitivamente se

    incorporou a categoria espao s anlises dos eventos, foi realizado no sculo XIX por John

    Snow. Em 1854, ocorria em Londres uma das vrias epidemias de clera trazidas das

    ndias. Pouco se sabia ento sobre os mecanismos causais da doena. Uns achavam que

    estava relacionado aos gases e odores, concentrados nas regies baixas e pantanosas da

    cidade, e outros ingesto de gua insalubre. Um mapa localizava a residncia dos bitos

    ocasionados pela doena (representado por pontos) e as bombas de gua que abasteciam

  • 22

    a cidade (representado por cruzes), permitindo visualizar claramente o epicentro da

    epidemia (Figura 1). Estudos posteriores confirmaram essa hiptese, corroborada por outras

    informaes, tais como a localizao do ponto de captao de gua desta bomba jusante

    da cidade em local onde a concentrao de dejetos, inclusive de pacientes colricos, era

    mxima. Essa uma situao tpica em que a relao espacial entre os dados contribuiu

    significativamente para o avano na compreenso do fenmeno, sendo um dos primeiros

    exemplos da anlise espacial (CMARA et al., 2002).

    Figura 1 Mapa de John Snow (1855) mostrando os locais de ocorrncia de epidemia de clera em Londres em 1854 (CMARA; MONTEIRO, 2004).

    Para Meneses (2003), a anlise espacial apresenta duas vertentes principais:

    estatstica espacial e geocomputao. A primeira gera modelos matemticos de distribuio

    e correlao, os quais incorporam propriedades de significncia e incerteza, resultantes da

    dimenso espacial. J a geocomputao usa tcnicas de redes neurais, busca heurstica e

    autmatos celulares para explorar grandes bases de dados e gerar resultados empricos

    (no-exatos) melhores que as tcnicas convencionais, mas com ampla aplicabilidade

    prtica. Esses instrumentos de anlise espacial proporcionam maior confiabilidade aos

    resultados de investigaes sobre a realidade modelada (CMARA, 2001).

    Segundo Cmara et al. (2002), as tcnicas subsidiadas pela estatstica espacial de

    rea permitem descrever a distribuio das variveis de estudo, identificar observaes

    atpicas no s em relao ao tipo de distribuio, mas tambm em relao aos vizinhos e

    buscar a existncia de padres na distribuio espacial. Por meio desses procedimentos,

    possvel estabelecer hipteses sobre as observaes, de maneira a selecionar o modelo

    inferencial melhor suportado pelos dados.

    A localizao espacial dos dados pode ser representada de forma regular ou

    irregular e seus ndices podem ser definidos a partir de uma rea no espao, ora fixados

  • 23

    contveis (LI, 2007). Os dados podem ser classificados seguindo outra denominao: dados

    de processos pontuais e dados de reas. Esses dados guardam, respectivamente, forte

    relao com os dados ambientais e socioeconmicos. Para Cressie (1993), os dados de

    superfcie contnua so ainda denominados, respectivamente, de Geostatistical data (dados

    contnuos no espao) e os dados de rea Lattice data (dados agrupados em reas). O

    primeiro grupo se refere a dados contnuos, como uma amostra de uma distribuio

    contnua. O segundo grupo consiste em uma coleo fixa de localizaes espaciais

    discretas (pontos ou polgonos).

    1. 4. 1 Anlise Exploratria de Dados Espaciais (AEDE)

    A anlise de dados espaciais pode ser empreendida sempre que as informaes

    estiverem espacialmente localizadas e quando for preciso levar em conta, explicitamente, a

    importncia do arranjo espacial dos fenmenos na anlise ou na interpretao de resultados

    desejados (BAILEY; GATTREL, 1995).

    O objetivo da anlise espacial aprofundar a compreenso do processo, avaliar

    evidncias de hipteses a ele relacionadas ou, ainda, tentar prever valores em reas onde

    as observaes no esto disponveis (BAILEY; GATTREL, 1995). Como salientaram os

    autores, basicamente pode-se distinguir entre os vrios mtodos aqueles que:

    so essencialmente voltados visualizao dos dados espaciais;

    so exploratrios, investigando e resumindo relaes e padres mapeados; e

    contam com a especificao de um modelo estatstico e a estimao de

    parmetros.

    A visualizao grfica uma etapa fundamental da anlise espacial. Por meio dela

    possvel identificar padres espaciais nos dados, gerando hipteses testveis, bem como

    avaliar o ajuste de modelos propostos ou, ainda, a validade das previses resultantes. De

    fato, h uma srie de questes que podero justificar uma visualizao criteriosa dos dados,

    tais como (CARDOSO et al., 2011):

    H variveis com valores extremos (muito altos ou muito baixos)?

    As observaes se dividem em grupos distintos?

    Existem associaes entre as variveis?

    As questes anteriores podem ser respondidas com o auxlio de mtodos grficos

    ou estatsticas descritivas. Essas tcnicas so conhecidas como Anlise Exploratria de

    Dados Espaciais, podendo ser classificadas em Univariadas ou Multivariadas, dependendo

    do nmero de variveis envolvidas. Dentre as tcnicas univariadas, destacam-se os

    histogramas, os mapas, as estimativas de densidade e boxplots, enquanto entre as tcnicas

  • 24

    multivariadas podero ser empregadas matrizes de disperso, grficos ligados aos mapas

    (linked plots) e grficos de coordenadas paralelas, por exemplo (LIMA, 2010).

    A anlise exploratria uma ferramenta utilizada na caracterizao do arranjo

    espacial dos eventos. Os indicadores da anlise exploratria buscam avaliar no apenas a

    posio absoluta dos eventos, mas tambm identificam a sua distribuio relativa, de

    maneira a buscar padres de associaes espaciais (clusters espaciais), regimes espaciais

    ou outras formas de instabilidade espacial (no-estacionaridade). A anlise consiste na

    observao de algum tipo de padro sistemtico ou se esto distribudos aleatoriamente no

    espao (MONTENEGRO, 2008). De acordo com Messner et al. (1999), a AEDE um

    conjunto de tcnicas de anlise estatstica de informao geogrfica.

    A AEDE contribui para indicar uma apropriada modelagem economtrica espacial,

    ao permitir a identificao de localidades atpicas (outliers espaciais). A partir desse mtodo,

    possvel extrair medidas de autocorrelao espacial e local, investigando a influncia dos

    efeitos espaciais por intermdio de instrumentos quantitativos e no somente pela

    inspeo visual de mapas (MONTENEGRO, 2008).

    Os mtodos convencionais, como regresses mltiplas, no so formas

    apropriadas de lidar com dados georreferenciados, visto que no so confiveis para

    detectar agrupamentos e padres espaciais significativos. Dessa maneira, a AEDE deve ser

    a primeira etapa para revelar padres espaciais, que devero anteceder quaisquer modelos

    espaciais (ANSELIN; BERA, 1988).

    Anselin e Bera (1998) assumem que difcil diferenciar autocorrelao espacial de

    heterogeneidade espacial. Os autores argumentam que em uma cross-section os dois

    problemas podem ser equivalentes do ponto de vista da observao, gerando dificuldades

    em determinar se o problema ocasionado pela heterocedasticidade ou pela autocorrelao

    espacial. Cross-sectional data ou cross section (de uma populao de estudo) em estatstica

    e econometria um tipo de dado unidimensional definido. Cross-sectional data refere-se aos

    dados coletados atravs da observao de muitos assuntos (como indivduos, empresas ou

    pases/regies) no mesmo ponto do tempo ou sem levar em conta as diferenas de tempo.

    A anlise dos dados cross-sectional geralmente consiste em comparar as diferenas entre

    os sujeitos.

    1. 4. 2 Matriz de proximidade espacial

    Um procedimento necessrio para a anlise de dados de rea a construo de

    uma matriz de vizinhana, tambm conhecida como matriz de distncia, matriz de

    conectividade ou matriz de proximidade. Essa matriz de conectividade indica a relao

    espacial de cada rea com as demais, podendo ser composta, por exemplo, apenas pela

  • 25

    lista de vizinhos de cada municpio; ou a distncia entre municpios ligados por estradas; ou

    a conectividade ponderada pelo comprimento da fronteira comum (BRASIL, 2006).

    A Figura 2 apresenta os municpios do estado de Roraima, a partir dos quais foi

    construda uma matriz baseada na vizinhana, por meio da atribuio de valores: 1 para os

    municpios que possuem fronteiras em comum, e 0 para os municpios que no

    compartilham fronteiras (BRASIL, 2006). A matriz de vizinhana referente ao mapa da

    Figura 2 pode ser vista na Figura 3. Observe, por exemplo, que a capital Boa Vista tem sete

    vizinhos e que o municpio de Uiramut, no extremo norte, tem apenas dois vizinhos.

    Figura 2 Mapa do estado de Roraima com diviso por municpios

    Figura 3 Matriz de vizinhana para os municpios do estado de Roraima

    De acordo com Cmara et al. (2002), a matriz de vizinhana, tambm chamada de

    proximidade espacial W, uma ferramenta bsica para estimar a variabilidade espacial de

    dados de reas. Como demonstrado graficamente pelas Figuras 4 e 5, dado um conjunto de

    n reas {A1,..,An}, constri-se a matriz W, n x n, onde cada um dos elementos wij representa

    uma medida de proximidade entre Ai e Aj. Essa medida de proximidade pode ser calculada

    a partir de um dos seguintes critrios:

    wij = 1, se o centroide de Ai est a uma determinada distncia de Aj; caso

    contrrio wij = 0; para i j = 1, 2,..., n;

    wij = 1, se Ai compartilha um lado comum com Aj, caso contrrio wij = 0; para i j

    = 1, 2,..., n;

    wij= lij/li, sendo lij o comprimento da fronteira entre Ai e Aj e li o permetro de Ai;

    para i j = 1, 2,..., n.

    Como a matriz de proximidade utilizada em clculos de indicadores na fase de

    anlise exploratria, muito til normalizar suas linhas, para que a soma dos pesos de cada

    linha seja igual a 1. Isso simplifica muito vrios clculos de ndices de autocorrelao

    espacial. A Figura 4 ilustra um exemplo simples de matriz de proximidade espacial

    normalizada, em que os valores dos elementos da matriz refletem o critrio de adjacncia.

  • 26

    A B C D E

    A 0 1 0 0 0

    B 0.25 0 0.25 0.25 0.25

    C 0 1 0 0 0

    D 0 0.5 0 0 0.5

    E 0 0.5 0 0.5 0

    Figura 4 Matriz de proximidade espacial de primeira ordem, normalizada pelas linhas

    importante convencionar as formas de vizinhana quando se utiliza matrizes de

    proximidade espacial que considerem a contiguidade. Desta maneira, os critrios baseiam-

    se em movimentos de peas presentes no jogo de xadrez, tais como a rainha (Queen), a

    torre (Rook) e o bispo (Bishop) (LESAGE, 1999; RODRIGUES et al., 2009). A Figura 5

    apresenta esses critrios para identificar os vizinhos da rea J.

    A B C D

    E F G H

    I J K L

    M N O P

    (a)

    A B C D

    E F G H

    I J K L

    M N O P

    (b)

    A B C D

    E F G H

    I J K L

    M N O P

    (c)

    Figura 5 Representao dos tipos de contiguidade entre reas. (a) Contiguidade Queen (rainha), (b) Contiguidade Rook (torre) e (c) Contiguidade Bishop (bispo)

    A Figura 5a demostra a adoo do critrio Queen, em que todas as reas que

    tiverem interseco no-nula com a rea J sero vizinhas de J. Na Figura 5b apresenta-se o

    critrio Rook, que tem como vizinhos apenas os que tiverem um lado em comum da rea J.

    J a Figura 5c representa o critrio Bishop, que relaciona como vizinhos da rea J apenas

    as reas que se localizam nas diagonais.

    A ideia da matriz de proximidade espacial pode ser generalizada para vizinhos dos

    vizinhos, e isso caracteriza a ordem da matriz. Considerando o critrio de vizinhana Rook e

    uma matriz de ordem 2 na Figura 5b, os vizinhos de F, I, N e K tambm seriam

    considerados vizinhos de J.

    1. 4. 3 Vetor dos desvios e vetor de mdias ponderadas

    Sabe-se que a cada rea i est associado um nmero real (xi), que representa o

    valor do atributo na rea i. Para o clculo do vetor de desvios Z, calculada, primeiramente,

    a mdia () dos valores dos atributos, considerando as n reas. Cada elemento i de Z,

    denominado zi, obtido subtraindo-se o valor da mdia, do valor do atributo correspondente,

    ou seja, zi = xi - , para i = 1,..., n. Em caso de no ter a mdia populacional considera-se a

    mdia amostral x (ANSELIN, 1996).

  • 27

    O vetor de mdias ponderadas (Wz) obtido pela multiplicao do vetor transposto

    dos desvios, pela matriz de proximidade espacial com linhas normalizadas, onde cada

    elemento de uma linha i qualquer, originariamente com valor 1, dividido pelo nmero de

    elementos no-nulos da mesma linha. Desta maneira, como resultado, cada elemento Wzi,

    contm um valor correspondente mdia dos desvios dos vizinhos da rea i, caracterizando

    uma mdia mvel espacial.

    Com a definio do vetor de mdias ponderadas, pode-se estabelecer outro mapa

    em uma anlise exploratria, simplesmente calculando a mdia mvel espacial dos atributos

    estudados. Segundo Druck et al. (2004), o clculo de uma mdia mvel espacial uma

    maneira de explorar a variao da tendncia espacial dos dados, pois a operao tende a

    produzir uma superfcie com menor flutuao que os dados originais.

    1. 4. 4 Dependncia Espacial

    Um conceito-chave na compreenso e anlise dos fenmenos espaciais a

    dependncia espacial. Essa noo parte da primeira lei da geografia: Todas as coisas so

    parecidas, mas coisas mais prximas se parecem mais que coisas mais distantes

    (TOBLER, 1979). Pode-se afirmar que a maior parte das ocorrncias, sejam estas naturais

    ou sociais, apresentam entre si uma relao que depende da distncia. Esse princpio quer

    dizer que, se encontrarmos poluio num trecho de um lago, provvel que locais prximos

    a esta amostra tambm estejam poludos. Ou que, se a presena de uma rvore adulta inibe

    o desenvolvimento de outras, esta inibio diminui com a distncia e, aps determinado raio,

    outras rvores grandes sero encontradas (CMARA et al., 2004).

    A dependncia espacial, ou autocorrelao espacial, refere-se correlao entre o

    mesmo atributo em dois locais ou em dois perodos de tempo. Na ausncia de dependncia

    espacial, a proximidade das duas localidades no influencia o comportamento conjunto de

    atributos observados. Quando h dependncia espacial (autocorrelao espacial positiva ou

    negativa), ento as observaes mais prximas so mais semelhantes do que as

    observaes distantes (LI, 2007).

    Aps a obteno de dados espaciais, a primeira questo que surge se existe

    algum padro espacial, ou seja, esses locais ou pequenas reas que so prximas umas

    das outras tendem a se comportar da mesma forma que aqueles mais distantes uns dos

    outros? A questo pode ser colocada como um teste, onde, se houver dependncia espacial

    nos dados, ento se deseja medi-la e estima-la (CMARA et al., 2004).

    De acordo com Anselin (1988), a dependncia espacial se manifesta pela falta de

    independncia que geralmente est presente entre as observaes cross-section. Segundo

    Chasco (2003), primeira vista, a dependncia espacial pode parecer similar mais

    conhecida dependncia presente nos testes economtricos de correlao de sries, nos

  • 28

    modelos de distribuio de atrasos e em outras anlises de sries temporais. No entanto,

    essa semelhana apenas real em parte, devido natureza multidirecional da dependncia

    no espao que, frente clara situao unidirecional do tempo, faz necessrio o uso de uma

    estrutura metodolgica diferente.

    Segundo Lesage (1998), a presena de dependncia espacial significa que uma

    observao est associada a uma localizao i depende de observaes nas localizaes j,

    sendo que i j. ( ) . Anselin (1988) baseou a dependncia espacial por

    meio da noo de contiguidade binria entre as unidades espaciais, ou seja, a estrutura dos

    vizinhos era expressa a partir dos valores binrios, 0 e 1. Dessa maneira, se duas unidades

    espaciais tm uma fronteira comum, ento tais unidades so consideradas contguas e

    recebem o valor um. Contrariamente, as unidades no-vizinhas recebem o valor zero para

    classific-las. Isso implica afirmar que, conforme Lesage (1998), observaes que esto

    mais prximas uma das outras devem refletir um maior grau de dependncia espacial do

    que as mais distantes. Consequentemente, o poder da dependncia espacial entre as

    observaes deve declinar com a distncia entre elas. Quanto dependncia espacial, as

    unidades vizinhas devem apresentar um maior grau de dependncia espacial do que as

    unidades localizadas distantes. (LESAGE, 1998).

    Dados espaciais no formam um conjunto de amostras independentes. Uma

    importante diferena em relao a dados sem essa peculiaridade que cada observao

    no traz uma informao independente, e o conjunto de todas as observaes utilizado

    integralmente para descrever o padro do fenmeno estudado (BRASIL, 2006).

    Duas questes estatsticas devem levar em considerao a presena de

    dependncia espacial: a identificao de padres espaciais e a anlise do efeito de

    algum fator de risco sobre um desfecho para a localizao geogrfica. Para a identificao

    de padres espaciais, preciso estimar a presena, forma e intensidade da dependncia

    espacial (BRASIL, 2006).

    Espacialmente aleatria qualquer ocorrncia cuja distribuio espacial no

    apresente qualquer padro espacial detectvel. Na Figura 6a os pontos esto distribudos

    aleatoriamente, na Figura 6b esto aglomerados (clusterizados) e na Figura 6c distribudos

    de forma regular, ou seja, no-aleatria (BRASIL, 2006).

    (a) (b) (c)

    Figura 6 Padres de distribuio espacial de pontos

  • 29

    1. 4. 5 Estatstica Espacial de reas

    A necessidade de quantificao da dependncia espacial presente em um conjunto

    de geodados levou ao desenvolvimento da chamada estatstica espacial. Segundo Anselin

    (1992), [...] a caracterstica que distingue a anlise estatstica dos dados espaciais que

    seu foco principal est em inquirir padres espaciais de lugares e valores, a associao

    espacial entre eles e a variao sistemtica do fenmeno por localizao.

    As tcnicas de estatstica espacial distinguem-se das demais tcnicas empregadas

    em anlise estatstica por considerar explicitamente as coordenadas dos dados no processo

    de coleta, descrio ou anlise dos dados. Utiliza-se o termo autocorrelao espacial para

    diferenciar da correlao da estatstica convencional, tendo em vista que nessa a correlao

    obtida a partir de duas variveis diferentes, sem referncia a sua posio no espao; no

    caso da autocorrelao, empregam-se no clculo os valores de uma mesma varivel em

    duas posies diferentes (ROCHA, 2004).

    A anlise de dados espaciais de rea est associada a mtodos utilizados quando

    a localizao est associada a reas delimitadas por polgonos, o que ocorre com muita

    frequncia quando se lida com eventos agregados por municpios, bairros ou setores

    censitrios, em que no se dispe da localizao exata dos eventos, mas de um nico valor

    por rea (DRUCK et al., 2004). Esses mtodos podem ser divididos entre: mtodos que

    esto relacionados visualizao dos dados, mtodos chamados exploratrios e aqueles

    centralizados na especificao do modelo estatstico e na estimativa de parmetros

    (AVELAR, 2008).

    Para uma anlise da distribuio espacial, levando em conta a localizao das

    amostras, necessrio aplicar tcnicas da estatstica espacial para analisar dados que

    podem ser classificados em eventos de padres espaciais, superfcies contnuas ou reas

    com contagens (CRESSIE, 1993). Uma das tcnicas para a rea de contagens o ndice

    global de Moran (GETIS; ORD, 1992; BAILEY;GATRELL, 1995).

    Com base na coleta sistemtica de informaes quantitativas, os objetivos da

    estatstica espacial so: descrio cuidadosa e precisa de eventos no espao geogrfico

    (incluindo a descrio de padres); explorao sistemtica do padro de eventos e de sua

    associao no espao, com o objetivo de ganhar o melhor entendimento dos processos que

    podem ser responsveis pela distribuio observada, e melhora da habilidade de predizer e

    controlar eventos que possam ocorrer nos espaos geogrficos (AVELAR, 2008). Assuno

    et al. (2001a) afirmam que a caracterstica fundamental da estatstica espacial, que se

    diferencia da estatstica clssica, o uso explcito da referncia geogrfica no modelo, isto

    , o uso explcito das coordenadas espaciais no processo de coleta, descrio e anlise dos

    dados. Assim, o interesse est centrado nos processos que ocorrem no espao e os

    mtodos empregados buscam descrever e analisar o comportamento desses processos.

  • 30

    Essa caracterstica faz com que estudos sobre o assunto exibam comportamento complexo,

    para serem analisados por mtodos tradicionais de estatstica (ASSUNO, 2001).

    Uma vez que a estatstica espacial de rea faz uso da referncia geogrfica no

    modelo, isto , das coordenadas espaciais no processo de coleta, descrio e anlise dos

    dados, seu interesse est centrado nos processos que ocorrem no espao e os mtodos

    empregados buscam descrever e analisar o comportamento desses processos

    (ASSUNO, 2001b).

    A forma usual de apresentao de dados agregados por reas o uso de mapas

    de diferentes tonalidades de cores com o padro espacial do fenmeno (CMARA et al.,

    2002). A Figura 7 exibe a distribuio espacial da produtividade da soja para 48 municpios

    da regio oeste do estado do Paran, para os dados da safra 2001/2002. Verifica-se que

    91,66% dos 48 municpios estudados, para os dados da safra de 2001/2002 esto acima da

    mdia estadual (2.766 kg ha-1), segundo os dados da Conab (2010). Para a mdia nacional

    (2.407 kg ha-1), verifica-se que 100% dos municpios estudados tiveram uma produtividade

    maior.

    Figura 7 Valores de Produtividade para os dados da safra de 2001/2002, em 48 municpios da regio oeste do estado do Paran agrupados pela mdia estadual.

    1. 4. 6 Anlise de variveis espaciais de reas

    Uma das tcnicas mais utilizadas no estudo de fenmenos de reas a Anlise de

    Autocorrelao Espacial (CARVALHO, 1997). Essa tcnica permite identificar a estrutura de

    correlao espacial que melhor descreve o padro de distribuio dos dados. A ideia bsica

    estimar a magnitude da Autocorrelao Espacial entre as reas, evidenciando como os

    valores esto correlacionados no espao (ANSELIN, 2002).

    Neste caso, as tcnicas so utilizadas para estimar quanto do valor observado de

    um atributo numa regio dependente dos valores dessa mesma varivel nas localizaes

  • 31

    vizinhas. Enquadram-se nessa categoria o ndice Global de Moran (TEXEIRA; BERTELLA,

    2010).

    Os indicadores globais de autocorrelao espacial, como o ndice de Moran,

    fornecem um nico valor como medida da associao espacial para todo o conjunto de

    dados, o que til na caracterizao da regio de estudo como um todo. No entanto,

    quando se lida com um grande nmero de reas, muito provvel que ocorram diferentes

    regimes de associao espacial e que apaream locais em que a dependncia espacial

    ainda mais pronunciada (CMARA et al., 2002).

    Por meio das anlises locais ou modelagens locais, busca-se testar a presena

    de diferenas espaciais ao invs de assumir que estas no existem. Essas anlises

    desagregam as estatsticas globais segundo seus constituintes locais, concentrando-se mais

    nas excees locais do que na busca por regularidades globais (FOTHERINGHAM et al.,

    2000).

    Entre as tcnicas univariadas aplicadas anlise local existem as abordagens

    grficas e aquelas voltadas para o desenvolvimento formal de estatsticas univariadas

    locais. Entre as abordagens grficas busca-se, prioritariamente, identificar excees locais

    s tendncias gerais na distribuio dos dados e nas relaes entre variveis. Trabalha-se,

    neste sentido, com o auxlio de histogramas, grficos de disperso e grficos em trs

    dimenses (MELO;HEPP, 2008).

    As tcnicas grficas mais complexas para demonstrar relaes locais em bancos

    de dados univariados incluem o Spatial Lagged Scatterplot, o Variogram Cloud Plot e o

    Moran Scatterplot. Destaca-se, nesta lista, o Moran Scatterplot, que, alm de permitir a

    identificao de grupos de valores, tambm permite a identificao de valores extremos na

    distribuio e apresenta uma visualizao do nvel de autocorrelao espacial existente

    (SALAME, 2008).

    1.5 Autocorrelao espacial

    A estrutura de dependncia entre os valores observados nas vrias reas do

    fenmeno em estudo analisada pela funo de autocorrelao espacial. Autocorrelao,

    como o prprio nome indica, mede a correlao da prpria varivel, e, sendo espacial, no

    espao. A correlao de uma varivel com ela mesma, medida no mesmo local, ser

    sempre 1 (UM). Entretanto, a correlao de uma varivel com ela mesma, porm medida

    nas reas vizinhas, ter um valor que varia entre -1 e 1 (como qualquer medida de

    correlao). Quanto mais prximo de 1 (UM), maior a semelhana entre vizinhos. O valor 0

    (zero) indica inexistncia de correlao, e valores negativos indicam dessemelhana

    (CMARA et al., 2002).

  • 32

    1. 5. 1 Autocorrelao espacial global univariada

    A autocorrelao espacial global pode ser calculada por meio da estatstica I de

    Moran (BAILEY; GATRELL, 1995), a qual permite analisar se os dados so aleatoriamente

    distribudos no espao, ou seja, se a varivel sob anlise est autocorrelacionada

    espacialmente.

    Segundo Cressie (1993), formalmente, a estatstica I de Moran pode ser expressa

    pela equao (1).

    n

    i

    i

    n

    i

    n

    j

    ijji

    zS

    wzzn

    I

    1

    2

    0

    1 1 Eq.(1)

    em que n o tamanho da amostra; )( xxz ii e )( xxz jj so as variveis das

    populaes i e j centradas na mdia; wij o elemento da matriz quadrada e simtrica W, n x

    n, a qual expressa a relao espacial entre as n populaes, e S0 o somatrio dos

    elementos wij da matriz simtrica de pesos espaciais W.

    Tendo como exemplo a produtividade de soja, a indicao de autocorrelao

    espacial positiva revela que h similaridade entre os municpios, ou seja, municpios com

    alta produtividade tendem a estarem rodeados por municpios vizinhos que tambm

    apresentam alta produtividade ou municpios com baixa produtividade rodeados por vizinhos

    que possuem baixa produtividade. Por outro lado, a autocorrelao espacial negativa indica

    que existe uma dissimilaridade entre os valores do atributo estudado e da localizao

    espacial deste atributo. Assim, nesse exemplo, municpios com baixa produtividade esto

    rodeados por municpios que apresentam alta produtividade ou municpios com alta

    produtividade rodeados por vizinhos que apresentam baixos valores desta varivel de

    interesse.

    De acordo com Jing e Cai (2009), um aspecto interessante na estatstica I de Moran

    que possvel a visualizao como sendo uma inclinao em um grfico de disperso da

    varivel espacialmente defasada (Wx) sobre a varivel original (x), ou o chamado Moran

    Scatter plot. Isso fornece uma maneira fcil de categorizar a natureza da autocorrelao

    espacial em quatro tipos, correspondentes aos clusters espaciais e outliers espaciais.

    A estimativa da significncia do ndice de Moran, de acordo com Kampel et al.

    (2000) e Cmara et al. (2002), pode ser abordada de duas maneiras: a primeira associa o

    ndice a uma distribuio estatstica, onde geralmente considera a varivel como sendo uma

    distribuio normal padro, cuja significncia obtida por comparao direta do valor de Z

    com o valor da probabilidade tabelada; a segunda abordagem um teste de

    pseudossignificncia que gera diferentes permutaes dos valores de atributos associados

    s zonas, onde cada permutao produz um novo arranjo espacial dos valores

  • 33

    redistribudos entre as reas, sendo a sua significncia obtida a partir de uma distribuio

    emprica I de Moran. Se o valor do ndice I de Moran medido corresponder a um extremo

    da distribuio simulada, ento se trata de um evento com significncia estatstica.

    1. 5. 2 Autocorrelao espacial global multivariada

    A autocorrelao espacial global verifica a existncia de um padro de associao

    espacial entre duas variveis. O objetivo revelar se os valores da varivel observada em

    uma dada regio guardam uma relao com os valores de outra varivel observada em

    regies vizinhas. Isso significa que a estatstica I de Moran (Equao 2) pode ser calculada

    para duas variveis em estudo.

    n

    i

    i

    n

    i

    n

    j

    jiji

    n

    i

    n

    j

    ij

    yx

    xx

    yywxx

    w

    nI

    1

    2

    1 1

    1 1

    )(

    )()(

    Eq. (2)

    A interpretao para o I de Moran multivariado pode ser descrita da mesma

    maneira que a estatstica I de Moran univariada, caso o valor do Iyx de Moran multivariado

    for positivo, municpios que apresentam valores elevados (y) esto rodeados por municpios

    vizinhos que apresentam nvel (x) alto. De outra forma, municpios com baixos valores de (y)

    so vizinhos de outros com baixo nvel de (x) (FERRARIO et al., 2009).

    Para uma anlise multivariada, com mais de duas variveis em estudo, faz-se uso

    da Matriz de Diagramas de Disperso de Moran (Morans Scatterplot Matrix). Nesta matriz,

    os eixos inferiores so as variveis em estudo (todas normalizadas), nos eixos verticais

    esto as variveis espacialmente defasadas (com os lags espaciais aplicados s variveis

    normalizadas). Essa ferramenta permite uma viso do padro espacial de cada varivel com

    ela prpria, bem como a defasagem espacial com as outras variveis (ANSELIN et al.,

    2004). A Figura 8 apresenta uma matriz de diagramas de disperso de Moran.

    Figura 8 Matriz de Diagramas de Disperso de Moran apresentado por Anselin et al. (2004)

  • 34

    1. 5. 3 Autocorrelao espacial local

    O objetivo da autocorrelao espacial captar padres de associao local

    (clusters ou outliers espaciais). Embora seja capaz de apontar a tendncia geral de

    agrupamento dos dados, o I de Moran uma medida global e por isso no revela padres

    locais de associao espacial, quer dizer, so geralmente ocultados pelas estatsticas de

    autocorrelao global.

    OI de Moran pode no identificar clusters locais importantes em uma regio global,

    quer sejam clusters positivos ou clusters negativos. A autocorrelao local pode ser

    calculada pela estatstica I de Moran local, tambm conhecido como Local Indicator of

    Spatial Association (LISA) (ANSELIN, 1995).

    1. 5. 4 Indicadores Locais de Associao Espacial (LISA) Univariado

    Segundo Anselin (1995), um Local Indicator of Spatial Association (LISA) ser

    qualquer estatstica que satisfaa a dois critrios:

    a) um indicador LISA deve possuir para cada observao, uma indicao de

    clusters espaciais significantes de valores similares em torno da observao

    (regio, por exemplo);

    b) o somatrio dos LISAs para todas as regies proporcional ao indicador de

    autocorrelao espacial global.

    Segundo Le Gallo e Erthur (2003), a estatstica LISA, baseada no I de Moran local

    para a varivel x, no perodo t, Xt=(x1,..xn)t, pode ser especificada da seguinte forma:

    n

    j

    ttjij

    tti

    ti xwx

    I1

    ,2

    0

    ,

    , )(

    Eq. (3)

    sendo 20 a varincia dos dados populacionais, com

    n

    x tti

    n

    i

    2

    ,

    12

    0

    )(

    Eq. (4)

    Na qual xi,t a observao de uma varivel de interesse na regio i para o perodo

    (ano por exemplo) t (ou espao t), a mdia das observaes entre as regies no perodo

    t para a qual o somatrio em relao a j tal que somente os valores vizinhos diretos de j

    so includos no clculo da estatstica.

    A estatstica pode ser interpretada da seguinte maneira:

    valores positivos de Ii,t significam que existem clusters espaciais com valores

    similares (alto ou baixo);

    valores negativos significam que existem clusters espaciais com valores

    diferentes entre as regies e seus vizinhos.

  • 35

    De acordo com Anselin (1995), a estatstica LISA utilizada tambm para medir a

    hiptese de ausncia de associao espacial local. importante salientar que, assim como

    a distribuio para as estatsticas globais, a distribuio genrica para a estatstica LISA

    tambm de difcil apurao. Portanto, para solucionar tal problema, deve-se trabalhar com

    resultados assintticos. Logo, a alternativa a utilizao de uma aleatorizao que permita

    auferir pseudonveis de significncia.

    Rusche (2009) ressalta que a estatstica local de Moran pode ser utilizada para uma

    avaliao inicial da estrutura local dos regimes espaciais, uma v