cap_01.pdf livro - metodos estatisticos em geografia

Upload: joabe-viviane

Post on 18-Oct-2015

143 views

Category:

Documents


4 download

TRANSCRIPT

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    1/

    1Introduo aos MtodosEstatsticos para Geografia 1

    1.1 Introduo

    O estudo de fenmenos geogrficos normalmente requer a aplicao de mtodosestatsticos para produzir uma nova compreenso. As questes a seguir servem parailustrar a grande variedade de reas nas quais a anlise estatstica tem sido aplicada aproblemas geogrficos:

    1. Como se d a variao dos nveis de chumbo no sangue de crianas no espao?Os nveis esto espalhados de forma aleatria pela cidade, ou existe um padrogeogrfico discernvel? Como os padres esto relacionados s caractersticasda residncia e dos moradores? (Griffithet al.1998)

    2. possvel descrever a difuso geogrfica da democracia que ocorreu no perodo

    ps Segunda Guerra Mundial como um processo contnuo ao longo do tempo,ou ela ocorreu em ondas, ou mesmo, teve breves perodos de difuso, intermi-tentes, que ocorreram em determinados perodos de tempo? (OLoughlihet al.1998)

    3. Quais so os efeitos do aquecimento global na distribuio geogrfica dasespcies? Por exemplo, que mudanas ocorrero nos tipos e na distribui-o espacial das espcies de rvores em reas especficas? (MacDonald et al.1998)

    4. Quais so os efeitos de diferentes estratgias de marketing no desempenho doproduto? Por exemplo, as estratgias de marketing de massa so eficazes, apesarde localizadas mais distantes de seus mercados? (Cornish, 1997)

    Todos esses estudos fazem uso da anlise estatstica para chegar s suas concluses.Mtodos de anlise estatstica tm papel central no estudo de problemas geogrficos em uma pesquisa sobre artigos que tinham um foco geogrfico, Slocum (1990) desco-briu que 53% desses fizeram uso de, pelo menos, um mtodo quantitativo tradicional.O papel da anlise quantitativa na geografia pode ser visto dentro de um contexto maisamplo atravs de sua ligao com o mtodo cientfico, que proporciona uma estruturamais geral para o estudo dos problemas geogrficos.

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    2/

    2 Mtodos Estatsticos para Geografia

    1.2 O mtodo cientfico

    Os cientistas sociais, assim como os cientistas fsicos, geralmente fazem uso do m-todo cientficonas suas tentativas de compreender o mundo. A Figura 1.1 ilustra essemtodo, a partir de tentativas iniciais de organizar as ideias sobre um assunto, para aconstruo de uma teoria.

    Suponha que estamos interessados em descrever e explicar o padro espacial doscasos de cncer em uma rea metropolitana. Podemos comear registrando as in-cidncias recentes sobre um mapa. Tais exerccios descritivos muitas vezes levam aum resultado inesperado na Figura 1.2, podemos identificar dois grupos bastan-te distintos de casos. Os surpreendentes resultados gerados atravs do processo dedescrio naturalmente nos levam para o prximo passo na rota para a explicao,forando-nos a gerar hipteses sobre o processo subjacente. Uma definio rigoro-

    sa do termohiptese de uma proposio cuja verdade ou falsidade suscetvel de sertestada. Tambm podemos pensar em hipteses como possveis respostas para nossasurpresa inicial. Por exemplo, uma hiptese neste exemplo que o padro de casos decncer est relacionado distncia das usinas de energia locais.

    Para testar a hiptese, precisamos de ummodelo, que um dispositivo destinado asimplificar a realidade para que a relao entre as variveis possa ser melhor estudada.Enquanto a hiptese pode sugerir uma relao entre duas variveis, um modelo mais detalhado, pois sugere a natureza da relao entre as variveis. No nosso exem-plo, podemos especular que o risco de cncer diminui com o aumento da distncia atuma usina de energia. Para testar esse modelo, poderamos representar graficamente

    Organizar Surpreender

    Validar

    Formalizar

    Conceito

    Teoria Leis Modelo

    Descrio Hiptese

    FIGURA 1.1 O mtodo cientfico.

    FIGURA 1.2 Distribuio dos casos de cncer.

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    3/

    Introduo aos Mtodos Estatsticos para Geografia 3

    as taxas de cncer para uma subreaversusa distncia que o centroide da subrea estde uma usina. Se observarmos uma curva de inclinao descendente, teremos algumsubsdio para nossa hiptese (ver Figura 1.3).

    Os modelos so validados pela comparao de dados observados com o que seespera. Se o modelo uma boa representao da realidade, haver uma correspondn-cia entre os dois. Se as observaes e as expectativas so muito distantes, precisamosvoltar prancheta e apresentar uma nova hiptese. Pode ser o caso, por exemplo,que o padro na Figura 1.2 deve-se simplesmente ao fato de a prpria populao estaragrupada. Se esta nova hiptese for verdadeira, ou se houver evidncia a seu favor, opadro espacial de cncer, ento, torna-se incompreensvel; uma taxa semelhante emtoda a populao produz aparente aglomerao de cncer por causa da distribuioespacial da populao.

    Embora os modelos frequentemente sejam utilizados para entender situaes par-ticulares, mais frequentemente ainda queremos aprender sobre o processo subjacenteque levou a elas. Gostaramos de ser capazes degeneralizar, a partir de um estudo, afir-maes sobre outras situaes. Uma razo para o estudo do padro espacial dos casosde cncer determinar se existe uma relao entre as taxas de cncer e as distncias ausinasespecficas; um objetivo mais geral conhecer a relao entre as taxas de cncer ea distncia aqualquerusina. Uma forma de fazer tais generalizaes acumular muitasevidncias. Se fssemos repetir a nossa anlise em vrios locais pelo pas, e se os nos-sos resultados fossem semelhantes em todos os casos, poderamos ter descoberto uma

    generalizao emprica. Em um sentido estrito, as leisso, por vezes, definidas comodeclaraes universais de alcance ilimitado. No nosso exemplo, nossa generalizao noteria alcance ilimitado, e poderamos querer, por exemplo, limitar a nossa generalizaoou lei emprica para usinas de energia e casos de cncer no pas de interesse.

    Einstein chamou teorias de criaes livres da mente humana. No contexto donosso diagrama, podemos pensar em teorias como conjuntos de generalizaes ouleis. O todo maior que a soma de suas partes no sentido que lhe d maior discerni-mento do que o produzido pelas generalizaes ou leis isoladas. Se, por exemplo, ge-ramos outras leis empricas que relacionam as taxas de cncer a outros fatores, comodieta, comeamos a construir uma teoria da variao espacial nas taxas de cncer.

    Os mtodos estatsticos ocupam um papel central no mtodo cientfico, como re-

    tratado na Figura 1.1, pois nos permitem sugerir e testar hipteses usando modelos.Na prxima seo, vamos rever alguns importantes tipos de abordagens estatsticasna geografia.

    Taxadecnceremum

    asubrea

    Distncia da usina

    FIGURA 1.3 Taxa de cncer versusdistncia da usina.

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    4/

    4 Mtodos Estatsticos para Geografia

    1.3 Abordagens exploratria e confirmatria na geografia

    O mtodo cientfico nos proporciona uma abordagem estruturada para responder asquestes de interesse. No cerne do mtodo est o desejo de formar e testarhipteses.Como vimos, as hipteses podem ser pensadas vagamente como respostas com po-tencial para as perguntas. Por exemplo, um mapa de nevasca pode sugerir a hiptesede que a distncia do local at um lago prximo pode desempenhar um papel impor-tante na distribuio de quantidades de neve.

    Gegrafos usam a anlise espacial no contexto do mtodo cientfico, pelo menos,de duas maneiras distintas. Os mtodosexploratriosde anlise so usados parasugerirhipteses; mtodos confirmatriosso, como sugere o nome, usados para ajudar aconfirmar as hipteses. Um mtodo de visualizao ou descrio que levou desco-berta de agrupamentos na Figura 1.2 pode ser um mtodo exploratrio, enquanto

    um mtodo estatstico que confirmou que tal arranjo de pontos seria improvvel deocorrer acidentalmente seria um mtodo confirmatrio. Neste livro, vamos nos con-centrar principalmente nos mtodos confirmatrios.

    Devemos observar aqui dois pontos importantes. Primeiro, os mtodos confir-matrios nem sempre confirmam ou refutam hipteses o mundo um lugar mui-to complicado, e os mtodos geralmente tm limitaes importantes que impedemessa confirmao e refutao. No entanto, eles so importantes na estruturao denosso pensamento e na escolha de uma abordagem rigorosa e cientfica para respon-der s perguntas. Segundo, o uso de mtodos exploratrios nos ltimos anos temaumentado rapidamente. Isso tem ocorrido como resultado de uma combinaoda disponibilidade de grandes bases de dados e de softwares sofisticados (incluindo

    SIG) e um reconhecimento de que os mtodos estatsticos confirmatrios so ade-quados em determinadas situaes e em outras, no. Ao longo deste livro, vamosmanter o leitor ciente desses pontos indicando algumas das limitaes da anliseconfirmatria.

    1.4 Probabilidade e estatstica

    1.4.1 Probabilidade

    A probabilidade pode ser pensada como uma medida de incerteza, assumindo valorque varia de zero a um. Experimentos e processos muitas vezes tm vrios resultadospossveis, e um resultado especfico incerto at que seja observado. Se sabemos queum resultado particular com certeza no ocorrer, diz-se que esse resultado tem pro-babilidade igual a zero. No outro extremo, se sabemos que um resultadovaiocorrer,diz-se que tem probabilidade igual a um. O foco principal do estudo da probabilidade o estudo das possibilidades dos vrios resultados. O quanto possvel ou provveluma cidade ser atingida por dois furaces em uma temporada? Qual a probabilidadede um morador de determinada comunidade, que mora a 4 km de distncia de umnovo supermercado, se tornar um novo cliente?

    As probabilidades podem ser obtidas de diferentes maneiras, que vo desde cren-

    as subjetivas at o uso de frequncias relativas de eventos passados. Quando quiser

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    5/

    Introduo aos Mtodos Estatsticos para Geografia 5

    adivinhar se uma moeda retornar cara quando lanada, voc pode optar por acredi-tar que a probabilidade de 0,5, ou pode efetivamente jogar a moeda inmeras vezespara determinar a proporo de vezes que o resultado cara. Se voc jogou a moeda

    mil vezes, e apareceu cara 623 vezes, uma estimativa da probabilidade de cara sugeri-da pela frequncia relativa de 623/1000 =0,623.

    O estudo da probabilidade tem as suas origens, pelo menos em algum grau, nasquestes de jogos de azar que surgiram no sculo 17. Em particular, nas correspon-dncias entre Pascal e DeMere, em 1651, interessados na maneira correta de definirum jogo de azar que teve de ser encerrado antes da sua concluso. Suponha que oprimeiro jogador com trs vitrias declarado o vencedor e possa reivindicar o pr-mio de 64 euros. DeMere e Pascal debateram sobre como dividir os euros, dado queo jogo tinha que ser encerrado, e dado que DeMere tinha duas vitrias e Pascal tinhauma vitria. Pascal argumentou que DeMere deveria receber dois teros dos euros(2/3 de 64 42,67); Pascal receberia os restantes 21,33 euros.

    DeMere argumentou que eles deveriam considerar o que poderia acontecer seeles continuassem. Com probabilidade igual a , Pascal poderia ganhar a prximarodada, e eles, ento, dividiriam o montante de dinheiro (cada um recebendo 32 eu-ros), pois teriam chances iguais de vitria na disputa. Com probabilidade tambmigual a , DeMere poderia ganhar a prxima rodada e consequentemente o prmiototal de 64 euros. Ele argumentou que sua cota era a mdia destes dois resultados(32 + 64)/2 = 48 (e no 42,67, como Pascal havia sugerido). O raciocnio de De-Mere, baseado em probabilidades e possibilidades dos resultados, constitui a baseda probabilidade moderna.

    Qual a diferena entre probabilidadee estatstica? O campo da probabilidade

    fornece a base matemtica para aplicaes estatsticas. Cursos anuais de probabi-lidade e estatstica normalmente so divididos em um curso de probabilidade noprimeiro semestre e, um curso de estatstica no segundo semestre. A Probabilidade discutida nos Captulos 3 e 4; na prxima seo, descrevemos em detalhes o cam-po da estatstica.

    1.4.2 Estatstica

    Historicamente, statistera uma palavra relacionada a um poltico e statisticsera oramo das cincias polticas relacionado com a coleta, classificao e discusso dosfatos envolvidos na condio de um estado ou comunidade (Hammnond and Mc-

    Cullagh, 1978). Um bom exemplo deste uso que vigora at hoje o termo estats-tica vital usado para descrever a coleta e tabulao de informaes dos indicadoresde uma regio e os nmeros de nascimentos e mortes.

    McGrew e Monroe (2000) definem estatstica como a coleta, classificao, apre-sentao e anlise de dados numricos. Observe que essa definio contm tanto asfunes histricas de coleta, classificao e apresentao, mas tambm aanlisede da-dos. As definies modernas tm em comum o objetivo de inferir, a partir de umaamostra, a natureza dos dados de uma populao maior do que a amostra extrada. Emgeral, a estatstica subdivide-se em duas reas gerais: estatstica descritiva,usada pararesumir e apresentar informaes, e isso est em consonncia com a definio maishistrica da rea, eestatstica inferencial, que como o nome indica, permite a infernciasobre uma populao maior a partir de uma amostra.

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    6/

    6 Mtodos Estatsticos para Geografia

    1.4.3 Paradoxos da probabilidade

    Os seguintes paradoxos so descritos tanto por curiosidade quanto para mostrar

    que, embora o uso da probabilidade para responder perguntas possa levar a resulta-dos intuitivos, necessrio cuidado ao pensar sobre resultados aparentemente nointuitivos.

    1.4.3.1 Um paradoxo espacial: movimento aleatrio em vrias dimen-

    ses Este paradoxo foi retirado de Karlin e Taylor (1975). Considere uma linhanumerada como na Figura 1.4, e suponha que nossa posio inicial esteja na ori-gem. Lanamos uma moeda para determinar o nosso movimento; se for cara nosmovemos para a direita, se for coroa nos movemos para a esquerda. Se jogarmos amoeda muitas vezes, certo que, em algum momento, retornaremos para a origem(implicando que, naquele momento, o nmero total de caras igual ao nmero total

    de coroas). Isso no deveria ser surpresa est de acordo com a nossa intuio deque os nmeros de caras e coroas observados ao lanar uma moeda deveriam seraproximadamente iguais.

    Agora, considere a generalizao do experimento para duas dimenses (Figura 1.5),no qual o resultado do lanamento de duas moedas determina o movimento na gradebidimensional. Uma moeda rege o movimento na direo vertical e outra na direo ho-rizontal (por exemplo, ir para cima e direita se as duas moedas so caras, e para baixoe esquerda, se ambas so coroas). Novamente, possvel mostrar que, embora o ca-minho possa vagar pelo espao bidimensional, certo que haver um retorno origem.

    4 3 2 1 0 1 2 3 4

    Coroa Cara

    FIGURA 1.4 Espao unidimensional para movimento aleatrio.

    Cara

    CaraCoroa

    Coroa

    FIGURA 1.5 Espao bidimensional para caminho aleatrio.

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    7/

    Introduo aos Mtodos Estatsticos para Geografia 7

    Finalmente, amplie o procedimento para trs dimenses; cada uma das trs moe-das determina o movimento em uma das trs dimenses. O movimento comea naorigem e continua nos pontos de uma grade dentro de um cubo. Verifica-se, agora,

    que um retorno origem no garantido! Ou seja, h uma probabilidade maiorque zero de que o caminho aleatrio vagar para longe da origem e nunca maisvoltar! Esta concluso tambm verdadeira para caminhos aleatrios em todas asdimenses maiores que trs. Este um exemplo no qual o processo de induo fa-lha o que verdadeiro em uma e duas dimenses no pode ser generalizado paradimenses superiores. Alm disso, ele destaca o fato de que, embora a nossa intuiofrequentemente seja boa, ela no perfeita. Precisamos confiar no apenas em nossaintuio sobre a probabilidade, mas em uma base terica mais consistente da teoriada probabilidade.

    1.4.3.2 Um paradoxo no espacial: qualidade da torta Este paradoxo da pro-babilidade foi extrado da seo de Jogos Matemticos daScientific American.

    Considere um indivduo que vai a um restaurante todo dia para comer um pedaode torta. O restaurante sempre tem torta de ma e de cereja, e s vezes torta de mir-tilo. A qualidade das tortas avaliada numa escala de um (pssima) a seis (excelente),e a variabilidade diria da qualidade de cada uma resumida na Figura 1.6. Por exem-plo, a torta de cereja ou muito boa (ela tem avaliao cinco em 49% das vezes) oupouco saborosa (ela tem avaliao um em 51% das vezes). O cliente pretende fazeruma escolha, de modo a maximizar a proporo de vezes que escolhe a melhor torta.( claro que a pessoa no conhece a qualidade da torta antes de solicit-la!)

    Inicialmente, considere a deciso enfrentada pelo cliente nos dias em que no h

    torta de mirtilo. As possibilidades so apresentadas na Tabela 1.1 (a melhor escolhapara o dia est em negrito).As probabilidades representam as propores de vezes que determinadas com-

    binaes das qualidades das tortas iro ocorrer. Se os clientes escolherem a torta dema, vo escolher a melhor torta que o restaurante tem para oferecer em cerca de62% das vezes (0,1078 +0,1122 +0,1122 +0,2856 =0,6178). Se eles optarem pelade cereja, vo escolher a melhor torta em apenas 38% das vezes (0,1078 +0,2744 =0,3822). A escolha clara torta de ma.

    Agora vamos examinar o que acontece quando o restaurante tambm tem a torta demirtilo. As possibilidades so apresentadas na Tabela 1.2. Aqui, a torta de ma melhor

    2

    46

    3

    1

    5

    56%

    22%22%

    100% 51%

    49%Ma Mirtilo Cereja

    FIGURA 1.6 Frequncia relativa da qualidade das tortas.

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    8/2

    8 Mtodos Estatsticos para Geografia

    em 33% das vezes (0,1078 +0,1122 +0,1122 =0,3322), a de cereja melhor em cercade 38% das vezes (0,1078 +0,2744 =0,3822) e a de mirtilo melhor em quase 29%das vezes (ela a melhor torta apenas nos dias em que a de ma tem avaliao dois e a

    de cereja, avaliao um o que ocorre 28,56% das vezes).Agora a melhor escolha a torta de cereja. Assim, temos um cenrio surreal. A

    estratgia tima deve ser o indivduo perguntar se tem torta de mirtilo, se no tiver, apessoa deve escolher a torta de ma, e se tiver, a pessoa deve escolher a torta de cereja!

    Lembre-se de que o objetivo aqui foi o de maximizar o nmero de vezes queuma pessoa poderia escolher a melhor torta. Um objetivo mais comum, utilizadona teoria econmica, maximizar a vantagem esperada, que, neste caso, significariafazer uma escolha para maximizar a mdia da qualidade da torta. A de ma temuma qualidade mdia de (6 0,22) +(4 0,22) +(2 0,56) = 3,32. A torta decereja tem uma qualidade mdia de (5 0,49) + (1 0,51) = 2,96, e a de mirtilotem uma qualidade mdia de 3. Usando esse objetivo, deve-se escolher a de ma seeles no tm a de mirtilo (como antes); se tiverem a torta de mirtilo, deve-se aindaescolher a de ma, j que tem a melhor qualidade mdia. O objetivo do economistade maximizar leva a resultados consistentes; outros objetivos podem possivelmentelevar a resultados no intuitivos.

    Como apontado no artigo original, o exemplo com tortas interessante, masassume maior importncia se considerarmos as informaes na Figura 1.6 represen-tando a eficcia de trs substncias alternativas no tratamento de uma doena.

    TABELA 1.1 Qualidades e probabilidades das tortas de ma e de cereja

    Ma Cereja Probabilidade

    6 5 0,22 0,49 =0,1078

    6 1 0,22 0,51 =0,1122

    4 5 0,22 0,49 =0,1078

    4 1 0,22 0,51 =0,1122

    2 5 0,56 0,49 =0,2744

    2 1 0,56 0,51 =0,2856

    TABELA 1.2 Qualidades e probabilidades das tortas de ma, de mirtilo e decereja

    Ma Mirtilo Cereja Probabilidade

    6 3 5 0,22 0,49 =0,1078

    6 3 1 0,22 0,51 =0,1122

    4 3 5 0,22 0,49 =0,1078

    4 3 1 0,22 0,51 =0,1122

    2 3 5 0,56 0,49 =0,2744

    2 3 1 0,56 0,51 =0,2856

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    9/2

    Introduo aos Mtodos Estatsticos para Geografia 9

    1.4.4 Aplicaes geogrficas de probabilidade e estatstica

    Esta seo fornece exemplos de aplicaes geogrficas de probabilidade e estatstica.

    Os dois primeiros podem ser descritos como tradicionais, aplicaes comuns, do tipoque iremos abordar mais tarde no livro. Os outros dois so ilustrativos das formasnicas e inovadoras em que a probabilidade e a estatstica podem ser utilizadas pararesolver questes geogrficas.

    1.4.4.1 Agulha de Buffon e as distncias de migrao Existem pouqussimosdados coletados nos Estados Unidos sobre as distncias percorridas pelas pessoasquando mudam de endereo residencial. No entanto, esta uma medida bsica per-tencente a um importante fenmeno geogrfico. Como so coletadas informaessobre a proporo de pessoas que mudam seu municpio de residncia, isso pode serusado, juntamente com os conceitos de probabilidade, para estimar a distncia de

    migrao.Comeamos com o trabalho de Buffon, um naturalista do sculo 17. Buffon tinha

    interesse em muitos assuntos, desde temas da botnica at a resistncia de navios nomar. Ele tambm se interessava por probabilidade e, incorporada a um anexo para oquarto volume de seu tratado de 24 volumes sobre histria natural, est a seguintepergunta.

    Suponha que temos um conjunto de vrias linhas paralelas, separadas por umadistncia constante,s. Agora, lance uma agulha de comprimentoLsobre o conjuntode linhas paralelas (veja Figura 1.7). Qual a probabilidade de a agulha cruzar umalinha? Claramente, esta probabilidade ser maior medida que o comprimento daagulha cresa, e a medida que a distncia entre as linhas paralelas diminua. Buffonconcluiu que a probabilidade (p) de uma agulha lanada aleatoriamente cruzar aslinhas era . A agulha de Buffon, na realidade, era usada, nesta poca, paraestimar ; se uma agulha de comprimento conhecido jogada muitas vezes sobreum conjunto de linhas paralelas separadas por uma distncia conhecida, pode-se cal-cularpcomo a razo entre o nmero de cruzamentos e o nmero de lanamentos. Oelemento desconhecido que resta na equao . Beckmann (1971), por exemplo,se refere a um Capito Fox, que passou pelo menos uma parte de seu tempo nesteassunto enquanto se recuperava de ferimentos sofridos na Guerra Civil dos EstadosUnidos. A agulha deve ser lanada um nmero muito grande de vezes para estimar,com um nvel de preciso razovel, o valor de , mas, infelizmente, o lanamento de

    agulhas nunca se desenvolveu como um passatempo popular.

    L

    s

    FIGURA 1.7 Agulha de Buffon em um conjunto de linhas paralelas.

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    10

    10 Mtodos Estatsticos para Geografia

    Laplace generalizou a questo para o caso de uma grade quadrada (veja Figura1.8). Quando o lado de um quadrado igual as , a probabilidade de cruzaruma linha ,assim, igual a .

    Vamos voltar para a conexo com a estimativa da distncia de migrao. Defina asextremidades da agulha como a origem e o destino de um migrante; queremos estimaresse comprimento desconhecido da agulha (L), que corresponde distncia de migra-o. Adotaremos a hiptese de que os municpios so aproximadamente quadrados domesmo tamanho (ou seja, um mapa da regio ficar mais ou menos como uma grade

    quadrada). Podemos estimar o lado de um quadrado,s, como a raiz quadrada da reamdia dos municpios. Tambm podemos estimar pusando os dados coletados sobrea proporo de todos os migrantes que trocam de municpio de residncia, quando semudam. Finalmente, claro que j sabemos o valor de . Podemos resolver a equaode Laplace para a distncia desconhecida de migrao:

    Usando dados dos Estados Unidos, p=0,35 e s=33 milhas, ento, estimamos Lcomo aproximadamente 10 milhas. Apesar da percepo de que o movimento delonga distncia talvez seja a regra, a maioria dos indivduos move uma curta distnciaquando se mudam.

    Embora a hiptese de municpios quadrados de tamanhos iguais seja claramenteirracional, o objetivo primrio de um modelo simplificar a realidade. No supomosnem afirmamos que os municpios sejam quadrados de tamanhos iguais. Poderamosser mais exatos realizando um experimento onde jogamos agulhas de um determina-do tamanho sobre um mapa dos municpios norte-americanos; tentando diferentestamanhos de agulha, acabaremos por encontrar uma que nos fornea a probabili-dade de movimento intermunicipal equivalente ao valor aproximado dep. Ns noavaliamos esta hiptese mais profundamente aqui, mas a suposio de municpiosquadrados de tamanhos iguais relativamenterobusta a concluso no muda muitoquando a hiptese no se mantm constante. Em vez disso, essa hiptese nos permite

    obter uma estimativa razovel da distncia de migrao.

    L

    s

    s

    FIGURA 1.8 Agulha de Buffon em uma grade quadrada.

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    11

    Introduo aos Mtodos Estatsticos para Geografia 11

    1.4.4.2 Dois lugares diferentes em termos de qualidade do ar? Suponha queestamos interessados em comparar as quantidades de partculas suspensas no ar emduas cidades. Diariamente coletamos dados de 10PM (partculas de 10 micrmetrosou menores). Suponha que coletamos cinco amostras por dia na cidade A e cinco nacidade B, e essas sejam concebidas para estimar a verdadeira mdia em cada cidade.A Tabela 1.3 apresenta os resultados.

    A mdia amostral na cidade B claramente superior da cidade A. Mas tenhaem mente que coletamos apenas uma amostra; certamente existe uma flutuao deum dia para outro, e assim a verdadeira mdia poderia ser a mesma (isto , se ns

    tomssemos uma grande amostra ao longo de um grande nmero de dias, as mdiaspoderiam ser iguais).No devemos concluir imediatamente que a cidade B tem uma mdia verdadei-

    ra da contagem de partculas suspensas no ar maior; nossos resultados poderiam serdecorrentes das flutuaes das amostragem. Em vez disso, precisamos dar ateno diferena observada entre as mdias amostrais frente diferena entre as mdiasamostrais que podemos esperar, to somente, por variaes das amostragens (quandoas mdias verdadeiras so iguais). Se essas diferenas so pequenas em relao dife-rena que se poderia esperar, mesmo quando as verdadeiras mdias so iguais, vamosaceitar a possibilidade de que as verdadeiras mdias so iguais. Por outro lado, se a di-ferena observada para as mdias amostrais maior do que a diferena esperada para

    tais flutuaes na amostragem, conclumos que as duas cidades tm diferentes nveisde quantidades de partculas. Detalhes de problemas como este (incluindo os limiaresde diferena que devem ser definidos para distinguir entre aceitao e rejeio da ideiade que as mdias so iguais) so abordados no Captulo 5, que trata de questes deinferncia estatstica.

    1.4.4.3 Os preos dos imveis residenciais so mais baixos nas proximidadesdos aeroportos? Um importante objetivo em geografia urbana compreender a

    variao espacial dos preos dos imveis residenciais. Caractersticas como o tamanhodo lote, a quantidade de quartos e a idade do imvel, tm uma clara influncia sobreo preo de venda. Caractersticas da vizinhana tambm podem influenciar os preos:

    TABELA 1.3 Leituras hipotticas de 10 PM (a unidade

    micrograma por metro cbico)

    Cidade A Cidade B

    40 45

    38 41

    52 59

    35 34

    26 25

    Amostra

    mdia

    Amostra

    mdia

    38,2 40,8

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    12

    12 Mtodos Estatsticos para Geografia

    se uma casa est situada prxima a um parque industrial ou de recreao provvelque cause um efeito evidente sobre o preo!

    Um aeroporto prximo poderia ter um impacto positivo sobre os preos, uma

    vez que a acessibilidade um aspecto desejvel. No entanto, possuir uma casa na tra-jetria de voo de um aeroporto pode no ser algo positivo quando o nvel de rudo levado em considerao. Poderamos tomar uma amostra de casas prximas do ae-roporto em questo; tambm poderamos encontrar uma amostra de casas que noestejam prximas do aeroporto e com caractersticas similares (por exemplo, nmerosemelhante de quartos, espao, tamanho do lote, etc.). Suponha que descobrimosque as casas prximas do aeroporto tm um preo mdio de venda inferior ao dascasas que no esto localizadas prximas do aeroporto. Precisamos decidir se (a) aamostra reflete uma diferena verdadeira entre os preos dos imveis, baseado nalocalizao em relao ao aeroporto, ou (b) a diferena entre os dois locais no significativa, e a diferena amostral observada nos preos resultado de flutuaesda amostragem (tenha em mente que as nossas amostras representam uma peque-na frao das casas que poderiam potencialmente ser vendidas; se ns sassemos ecoletssemos mais dados, a diferena mdia de preo de venda provavelmente seriadiferente).

    Este , novamente, um problema de estatstica inferencial, com base em um desejode fazer uma inferncia a partir de uma amostra.Voltaremos a este problema mais tarde,e vamos discutir como um limiar crtico de diferena pode ser definido; se a diferenaobservada inferior a este limite, podemos tomar como concluso (b); se a diferenaestiver acima do limite, temos que decidir pela opo (a).

    1.4.4.4 Por que o trfego se move mais rpido na outra pista?Quase todosconcordam que o trfego parece sempre andar mais rpido na outra pista. Recente-

    mente, tem havido vrias explicaes estatsticas para esta questo. Essas explicaesincluem:

    (a) Redelmeier e Tibshirani (2000) criaram uma simulao em que duas faixastinham caractersticas idnticas, em termos do nmero de veculos e de suas ve-locidades mdias. A nica diferena entre as duas pistas era o espaamento ini-cial entre os veculos. Na simulao, os veculos hipotticos poderiam acelerarquando viajavam lentamente, e poderiam desacelerar quando se aproximavammuito do veculo da frente. No surpreendentemente, enquanto se moviam ra-pidamente, os veculos ficavam relativamente distantes um do outro, enquantoquando se moviam lentamente, ficavam mais prximos. Como as velocidadesmdias em cada pista eram semelhantes, e o nmero de carros em cada pistaera idntico, cada veculo era ultrapassado pelo mesmo nmero de veculos quetinha ultrapassado. No entanto, o nmero de intervalos de tempo de um segun-do em que o veculo era ultrapassado foi maior do que o nmero de intervalosem que o veculo ultrapassa outro veculo. Assim, mais tempo gasto sendoultrapassado por outros veculos do que gasto na ultrapassagem de veculos(carros velozes esto dispersos, e so os nicos ultrapassando... voc est ultra-passando os carros lentos, que esto agrupados, de modo que no leva muitotempo para faz-lo).

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    13

    Introduo aos Mtodos Estatsticos para Geografia 13

    (b) Bostrom (2001) tem, superficialmente, uma simples resposta pergunta os carrosda outra pistaestose movendo mais rpido! Se os carros na via rpida esto maisespalhados, a densidade de veculos ser maior na pista lenta. Agora, se voc esco-

    lher aleatoriamente um carro a qualquer momento, existe uma probabilidade relati-vamente elevada que ser da pista lenta, j que onde a densidade de carros maior.Assim, em qualquer dado momento, a maioria dos motoristas esto, na verdade, napista lenta, e os carros na outra pistaesto,de fato, se movendo mais rpido.

    (c) Dawson e Riggs (2004) observam que, se voc est viajando um pouco acimaou um pouco abaixo do limite de velocidade, e se voc observar atentamente as

    velocidades dos veculos que o ultrapassam assim como a velocidade dos ve-culos que voc est ultrapassando, haver um erro na percepo da velocidademdia verdadeira. Em particular, os motoristas que viajam um pouco abaixo da

    velocidade mdia percebero o trfego de forma mais rpida do que realmenteest, enquanto os motoristas que viajam um pouco acima da velocidade mdiasentiro o trfego mais lento do que ele realmente est. A razo tem a ver com aseleo de veculos cujas velocidades esto sendo observadas esta amostra sertendenciosa porque ir incluir muitos veculos dos muito rpidos e dos muitolentos, mas poucos dos veculos indo sua prpria velocidade. Apesar de Daw-son e Riggs no mencionarem isso, se a distribuio de velocidades distorcidade tal forma que mais da metade dos veculos est andando mais lentamente doque a velocidade mdia (hiptese provvel), ento, mais da metade dos veculos

    vai perceber o trfego mais rpido do que ele realmente est.

    1.5 Mtodos descritivos e inferenciais

    Uma caracterstica fundamental dos dados geogrficos que traz a necessidade de an-lise estatstica que frequentemente eles podem ser considerados como uma amostrade uma populao maior. A anlise estatsticadescritivase refere ao uso de determina-dos mtodos que so aplicados para descrever e resumir as caractersticas da amostra,enquanto a anlise estatsticainferencialrefere-se aos mtodos utilizados para inferiralgo sobre a populao da amostra. Mtodos descritivos esto inseridos na classe detcnicas exploratrias, enquanto a estatstica inferencial encontra-se na classe dos m-todos confirmatrios. Sumrios descritivos dos dados podem ser visuais (por exem-plo, na forma de grficos e mapas) ou numricos; a mdia e a mediana so exemplos

    deste ltimo caso.Para comear a entender melhor a natureza da estatstica inferencial, suponha que

    lhe entregue uma moeda e pedido para determinar se ela honesta (isto , a pro-babilidade de ser cara a mesma probabilidade de ser coroa). Um caminho naturalpara coletar algumas informaes seria jogar a moeda vrias vezes. Suponha que voc

    joga a moeda dez vezes e observa caras em oito vezes. Um exemplo de estatstica des-critiva a proporo de caras observada neste caso, 8/10 =0,8. Entramos no domnioda estatstica inferencial quando tentamos julgar se a moeda honesta. Planejamosfazer issoinferindose a moeda honesta, com base nos resultados da amostra. Oitocaras mais do que quatro, cinco ou seis que poderiam nos deixar mais confortveis emuma declarao de que a moeda honesta, mas oito caras realmente o suficiente paradizer que a moedano honesta?

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    14

    14 Mtodos Estatsticos para Geografia

    H pelo menos dois caminhos a percorrer para responder questo de saber se amoeda honesta. Uma perguntar o que aconteceriase a moedafossehonesta, e si-mular uma srie de experincias idnticas s que acabamos de realizar. Ou seja, se pu-

    dssemos jogar repetidamente uma moeda honesta conhecida dez vezes e, a cada vez,registrar o nmero de caras, saberamos exatamente o quo incomum realmente eraum total de oito caras. Se oito caras aparece com bastante frequncia com a moedahonesta, julgaremos a nossa moeda original como sendo honesta. Por outro lado, seoito caras um evento extremamente raro para uma moeda honesta, vamos concluirque nossa moeda original no honesta.

    Mantendo essa ideia, suponha que voc se prope a realizar tal experimento 100 ve-zes. Por exemplo, poderamos ter 100 alunos de uma turma grande, cada um lanandouma moeda, sabidamente honesta, dez vezes. Aps a organizao dos resultados, supo-nha que voc encontre os resultados mostrados na Tabela 1.4. Notamos que oito carasocorreu 8% das vezes. Ainda precisamos de uma diretriz para nos dizer se o resultadoobservado de oito caras deve levar-nos concluso de que a moeda (ou no) hones-ta. A diretriz usual perguntar qual a probabilidade de o resultado ser igual ou maiordo que o observado,sea nossa hiptese inicial de que possumos uma moeda honesta(chamada de hiptesenula) verdadeira. A prtica comum aceitar a hiptese nula sea probabilidade de um resultado to extremo como o que observamos for maior do que5%. Assim, aceitaramos a hiptese nula de uma moeda honesta, se a nossa experinciativer mostrado que oito ou mais caras no incomum e de fato tendem a ocorrer maisdo que 5% das vezes.

    Por outro lado, vamos rejeitar a hiptese nula de que a nossa moeda original honesta se os resultados do nosso experimento indicam que oito ou mais caras, em

    dez, um evento raro para moedas honestas. Se as moedas honestas derem comoresultado oito ou mais caras em menos de 5% das vezes, decidimos rejeitar a hiptesenula e concluimos que nossa moeda no honesta.

    Neste exemplo, oito ou mais caras ocorreu 12 vezes em 100, quando uma moedahonesta foi lanada dez vezes. O fato de que eventos to extremos, ou mais extremosdo que o observado, ocorrero 12% das vezes com uma moedahonestanos leva aaceitar a inferncia de que a nossa moeda original honesta. Se tivssemos observa-do nove caras com a nossa moeda original, teramos que julg-la desonesta, j que

    TABELA 1.4 Resultados hipotticos de 100 lanamentos de10 moedas cada

    Nmero de caras Frequncia de ocorrncias

    0 0

    1 1

    2 4

    3 8

    4 15

    5 22

    6 30

    7 8

    8 89 3

    10 1

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    15

    Introduo aos Mtodos Estatsticos para Geografia 15

    eventos to raros ou mais raros que este (isto , quando o nmero de caras iguala 9 ou 10) ocorreram apenas quatro vezes nos 100 testes com uma moeda honesta.Observe, tambm, que o resultado observado no prova que a moeda imparcial.

    Ela aindapoderiaser desonesta; no h, no entanto, evidncias suficientes para apoiara alegao.

    A abordagem descrita um exemplo domtodo de Monte Carlo, e vrios exemplosda sua utilizao so dados no Captulo 10. Uma segunda maneira de responder aoproblema inferencial fazer uso do fato de que este um experimento binomial; noCaptulo 3, vamos aprender a usar essa abordagem.

    1.6 A natureza do pensamento estatstico

    A American Statistical Association (1993, citada em Mallows, 1998) observa que opensamento estatstico :

    (a) a avaliao da incerteza e da variabilidade dos dados, e seu impacto na tomada dedeciso, e

    (b) o uso do mtodo cientfico na abordagem de questes e problemas.

    Mallows (1998), em seu Discurso Presidencial American Statistical Association,argumenta que o pensamento estatstico no simplesmente o senso comum, nem simplesmente o mtodo cientfico. Em vez disso, ele sugere que os estatsticos deemmais ateno s questes que surgem no incio do estudo de um problema ou questo.Em particular, Mallows argumenta que os estatsticos devem: (a) avaliar quais dadosso relevantes para o problema, (b) considerar como os dados relevantes podem serobtidos, (c) esclarecer as bases de todas as hipteses, (d) expor os argumentos de todosos lados da questo, e s ento (e) formular as questes que podem ser tratadas por m-todos estatsticos. Ele tem a sensao de que os estatsticos muitas vezes confiam demaisem (e), bem como na real utilizao dos mtodos que se seguem. Suas ideias servempara nos lembrar que a anlise estatstica um exerccio completo que no consistesimplesmente de ligar os nmeros a uma frmula e relatar um resultado. Em vezdisso, requer uma avaliao abrangente de questes, perspectivas alternativas, dados,hipteses, anlises e interpretaes.

    Mallows define o pensamento estatstico como aquele que considera a relao do

    dado quantitativo com um problema do mundo real, muitas vezes na presena da in-certeza e da variabilidade. Ele tenta tornar preciso e explcito o que os dados tm adizer sobre o problema de interesse. Ao longo deste livro, vamos aprender vrios m-todos que so usados e implementados, mas tambm vamos aprender a interpretar osresultados e compreender suas limitaes. Muitas vezes, estudantes trabalhando comproblemas geogrficos tm apenas a conscincia de que precisam da estatstica, e suaresposta procurar um especialista em estatstica em busca de conselhos sobre comocomear. A primeira resposta do estatstico deveria ser dada na forma de perguntas: (1)Qual o problema? (2) Quais os dados que voc tem, e quais so as suas limitaes?(3) A anlise estatstica relevante, ou algum outro mtodo de anlise mais adequa-do? importante que o estudante pense primeiro sobre essas questes. Talvez uma des-

    crio simples ser suficiente para alcanar o objetivo. Talvez alguma anlise inferencialsofisticada ser necessria. Mas, o desenrolar subsequente dos acontecimentos deve serguiado pelos problemas significativos e pelas questes de interesse, como a restrio na

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    16

    16 Mtodos Estatsticos para Geografia

    disponibilidade e a qualidade dos dados. No deve ser conduzido por um sentimentode que preciso usar anlise estatstica, simplesmente por uma questo de us-la.

    1.7 Consideraes especiais sobre dado espacial

    Fotheringham e Rogerson (1993) classificam e discutem uma srie de problemas ge-rais e caractersticas associadas a problemas de anlise espacial. essencial que aque-les que trabalham com dado espacial tenham conscincia dessas questes. Apesar detodas as suas classificaes serem relevantes para a anliseestatsticaespacial, as maispertinentes so:

    (a) o problema da unidade de rea modificvel;

    (b) problemas de fronteira; (c) procedimentos de amostragem espacial; (d) a autocorrelao espacial ou dependncia espacial.

    1.7.1 O problema da unidade de rea modificvel

    O problema da unidade de rea modificvel se refere ao fato de os resultados dasanlises estatsticas serem sensveis ao sistema de zoneamento utilizado para informarsobre os dados agregados. Muitos conjuntos de dados espaciais so agregados em zo-nas, e a natureza da configurao zonal pode influenciar fortemente a interpretao.O ponto inicial de uma seta representa a origem de um migrante e a extremidade re-

    presenta o seu destino. O painel (a), da Figura 1.9, mostra um sistema de zoneamen-to e o painel (b) outro. As setas representam os fluxos migratrios dos indivduos, eeles so idnticos em cada painel. No painel (a), nenhuma migrao interzonal re-gistrada, enquanto uma interpretao do painel (b) levaria concluso de que houveum forte movimento para o sul, desde que cinco migraes de uma zona para outrapoderiam ser relatadas. Em termos mais gerais, muitas das ferramentas estatsticasdescritas nos captulos seguintes produziriam resultados diferentes com a adoo dediferentes sistemas de zoneamento.

    (a) (b)

    FIGURA 1.9 Dois sistemas de zoneamento diferentes para dados de migrao (observa-

    o: as setas mostram a origem e o destino dos migrantes).

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    17

    Introduo aos Mtodos Estatsticos para Geografia 17

    O problema da unidade de rea modificvel tem dois diferentes aspectos que de-vem ser avaliados. O primeiro est relacionado com a colocao de limites zonais,para zonas ou sub-regies de um determinado tamanho. Se fssemos medir as taxas

    de mobilidade, poderamos sobrepor uma grade de clulas quadradas na rea de es-tudo. A grade poderia ser colocada, girada e orientada de muitas maneiras diferentessobre a rea de estudo. O segundo aspecto refere-se escala geogrfica. Se substituir-mos a grade por outra com clulas quadradas maiores, os resultados da anlise seriamdiferentes. Migrantes, por exemplo, so menos propensos a cruzar clulas da grademaior do que so na grade menor.

    Como Fotheringham e Rogerson observam (1993), a tecnologia SIG agora facilitaa anlise de dados usando sistemas alternativos de zoneamento, e deve se tornar maisrotineiro examinar a sensibilidade dos resultados para unidades de rea modificveis.

    1.7.2 Problemas de fronteiraAs reas de estudo so delimitadas, e importante reconhecer que os eventos forada rea de estudo podem afetar aqueles no interior da mesma. Se estamos inves-tigando as reas de mercado dosshopping centersem um municpio, seria um erronegligenciar a influncia de um grandeshopping center situado imediatamente forados limites do municpio. Uma soluo delimitar uma regio ao redor da rea deestudo para incluir feies que afetam a anlise dentro da rea primria de interes-se. Um exemplo do uso de tais regies em anlise do padro de pontos dado noCaptulo 10.

    Tanto o tamanho como a forma das reas podem afetar a medio e a interpretao.

    Existem muitos migrantes deixando Rhode Island a cada ano, mas isso parcialmentedevido ao pequeno tamanho do estado quase todo o movimento ser um passo parafora do estado! De modo semelhante, Tennessee observa mais emigrantes que outrosestados com a mesma rea de territorial em parte devido sua forma retangular estreita.Isso ocorre porque os indivduos em Tennessee vivem, em mdia, mais prximos dafronteira do que os indivduos em outros estados com a mesma rea. Um movimento dedeterminado comprimento em uma direo aleatria , assim, mais provvel de levar umindivduo do Tennessee para fora do Estado.

    1.7.3 Procedimentos de amostragem espacial

    A anlise estatstica baseada em dados amostrais. Geralmente, supe-se que as ob-servaes da amostra so colhidas aleatoriamente de alguma grande populao de in-teresse. Se estamos interessados na localizao de pontos de amostragem para coletade dados sobre vegetao ou solo, por exemplo, existem muitas maneiras de se fazerisso. Pode-se escolher as coordenadasxeyde forma aleatria; isto conhecido comoumaamostra aleatria simples. Outra alternativa seria escolher uma amostra espacialestratificada, certificando-se de que escolhemos um nmero predeterminado de ob-servaes de cada uma das vrias sub-regies, com uma amostragem aleatria simplesdentro das sub-regies. Mtodos alternativos de amostragem so discutidos em maisdetalhes na Seo 5.7.

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    18/

    18 Mtodos Estatsticos para Geografia

    1.7.4 Autocorrelao espacial

    A autocorrelao espacial refere-se relao entre o valor de uma varivel em um

    ponto no espao e o valor dessa mesma varivel em uma localidade prxima. O com-portamento quanto ao modo de viagem dos moradores de uma casa provavelmenteest relacionado ao comportamento dos residentes em casas prximas, pois ambasas famlias tm acessibilidades semelhantes para outros locais. Assim, as observaesde duas famlias, provavelmente, no so independentes, apesar da exigncia de in-dependncia estatstica para a anlise estatstica padro. Autocorrelao espacial (oudependncia espacial) pode, portanto, causar srios efeitos sobre a anlise estatsticae, portanto, conduzir a interpretaes erradas. Isto tratado mais detalhadamente nosCaptulos 5 e 10.

    1.8 A estrutura do livro

    O Captulo 2 trata de mtodos de estatstica descritiva so estudadas as abordagensvisual e numrica para descrio de dados. Os Captulos 3 e 4 fornecem o importanteembasamento sobre probabilidade que facilita a compreenso da estatstica inferen-cial. A inferncia sobre uma populao a partir de uma amostra feita, pela primeira

    vez, usando a amostra para fazer estimativas das caractersticas da populao. Porexemplo, uma amostra de indivduos pode resultar em dados sobre o rendimento;a mdia amostral fornece uma estimativa da renda mdia desconhecida de toda apopulao em estudo. O Captulo 5 fornece detalhes sobre como essas estimativas

    da amostra podem ser utilizadas tanto para construir intervalos de confiana quecontm o valor verdadeiro da populao com uma probabilidade desejada, quantopara testar hipteses formalmente sobre os valores da populao. O captulo tambmcontm detalhes sobre a natureza da amostragem e a escolha do tamanho adequadode uma amostra.

    O Captulo 5 apresenta descries de testes de hipteses elaborados para deter-minar se concebvel que duas populaes possuam as mesmas caractersticas. Porexemplo, o teste da diferena das mdias de duas amostras trata sobre a possibilidadede duas amostras terem vindo de populaes que apresentam mdias idnticas (esteobjetivo foi ilustrado nos exemplos das Sees 1.4.4.2 e 1.4.4.3). O Captulo 6 tratado mtodo de anlise da varincia, que amplia esses testes de duas amostras para o

    caso de mais de duas amostras. Por exemplo, dados sobre o comportamento de deslo-camento (por exemplo, a distncia percorrida at um equipamento pblico, como par-ques e bibliotecas) podem estar disponveis para cinco diferentes regies geogrficas,e pode ser de interesse testar a hiptese de que a verdadeira distncia mdia percorridafoi a mesma para todas as regies. No Captulo 7, comeamos nossa explorao demtodos que tratam da relao entre duas ou mais variveis. O Captulo 7 introduz osmtodos de correlao, e o Captulo 8 estende esta introduo ao tema da regressolinear simples, onde uma varivel suposta dependente linearmente de outra. Regres-so , provavelmente, o mtodo mais amplamente utilizado da estatstica inferenciale, no Captulo 9, feita uma abordagem adicional onde a dependncia linear de uma

    varivel em relao a outras variveis (ou seja, a regresso linear mltipla) tratada.

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    19/

    Introduo aos Mtodos Estatsticos para Geografia 19

    Uma das questes bsicas enfrentadas pelos gegrafos se os dados geogrficosapresentam padres espaciais. Isso relevante por si s (quando, por exemplo, pode-mos perguntar se os locais de ocorrncias de crimes esto mais agrupados geografica-

    mente do que eram no passado) e para abordar o problema fundamental da depen-dncia espacial dos dados geogrficos quando da realizao de testes estatsticos. Comrelao a este ltimo, os testes estatsticos inferenciais quase sempre assumem que asobservaes de dados so independentes; no entanto, muitas vezes este no o casoquando os dados so coletados em localizaes geogrficas. Em vez disso, os dadosso, com frequncia, espacialmente dependentes o valor de uma varivel em um local provavelmente semelhante ao valor da varivel em um local prximo. Essa caracte-rstica dos dados geogrficos muitas vezes referida como Primeira Lei da Geografia,de Tobler. O Captulo 10 dedicado aos mtodos e testes estatsticos elaborados paradeterminar se os dados apresentam padres espaciais. O Captulo 11 retorna ao tpicoda regresso, focalizando em como realizar anlises da dependncia de uma varivel emrelao a outras, quando a dependncia espacial est presente nos dados.

    Finalmente, muitas vezes desejvel resumir grandes conjuntos de dados contendoum grande nmero de observaes e um grande nmero de variveis. Por exemplo,muitas vezes difcil saber por onde comear quando se utiliza dados do censo de mui-tas sub-regies diferentes (por exemplo, setores censitrios) para resumir a naturezade uma regio geogrfica, em parte porque so muitas variveis e muitas sub-regiesdiferentes. O Captulo 12 introduz a anlise fatorial e a anlise de agrupamentos comoduas abordagens para a sntese dos dados. A anlise fatorial reduz o nmero originalde variveis a um nmero menor de dimenses subjacentes ou de fatores, e a anlisede agrupamentos divide as observaes (ou seja, os dados de sub-regies geogrficas

    particulares) em categorias ou grupos. O Eplogo contm alguns pensamentos finaissobre novos rumos e aplicaes.

    1.9 Bancos de dados

    1.9.1 A fora do sinal de telefone celular no condado de Erie,Nova York, EUA

    A fora do sinal de um telefone celular medida de acordo com a intensidade da forado sinal (RSSI). Os valores de RSSI so negativos; sinais mais fortes tm valores que

    so menos negativos, e sinais mais fracos tm valores que so mais negativos. Essebanco de dados composto de 229 amostras de medies de RSSI feitas em umaregio do condado de Erie, que fica no estado de Nova York e tem Buffalo como suamaior cidade. Para mais informaes sobre RSSI, sua distribuio espacial e aplica-es na notificao de acidente para a emergncia, consulte Akellaet al.(2003).

    Um conjunto de variveis est associado a cada medio, incluindo as coorde-nadas de localizao, medies topogrficas (declividade e altitude), e variveis re-lacionadas visibilidade e distncia da torre de celular mais prxima. As colunas de

    variveis so definidas como se segue:

    1. nmero de identificao (ID): so sequenciais e variam de 1 a 229

    2. valor de RSSI

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    20

    20 Mtodos Estatsticos para Geografia

    3. coordenaday 4. coordenadax 5. declividade

    6. altitude 7. visibilidade 8. alcance 9. distncia

    Ao nos referirmos aos subconjuntos do banco de dados RSSI, adotaremos:

    1. Subconjunto A: contm as 17 observaes que tm a coordenadaxmenor que4.713.000 e coordenaday672.500 (estas so as 17 observaes na poro doextremo sudoeste da rea de estudo). Usaremos essas observaes para realizaralguns clculos mo principalmente nos exerccios ao final de cada captulo.

    Os nmeros de identificao, ID, para essas 17 observaes so 65-69, 72-74,95-98, 100-103 e 163. 2. Subconjunto B: contm as seis observaes com coordenada y superior a

    677.500 e coordenadaxmaior que 4.720.000 (essas observaes esto no ex-tremo da poro nordeste da rea de estudo). Usaremos essas observaes parailustraes dentro de cada captulo. Os nmeros de identificao, ID, para essasseis observaes so 17, 18, 19, 46, 117 e 118.

    1.9.2 Venda de casas em Tyne and Wear

    Este um arquivo no formato SPSS constitudo de 562 casos (linhas) e 53 variveis

    (colunas). Os 562 casos representam casas em Tyne and Wear que foram compradascom hipotecas da Nationwide Building Society em 1991. As variveis consistem deuma mistura de informaes de identificao, de atributos da habitao e de atributosdo censo das reas em que as casas esto localizadas.

    1.9.2.1 Definies das variveis

    id um nmero de identificao. Observe que ele no varia de1 a 562 porque alguns casos foram removidos do arquivooriginal devido falta de dados.

    easting/northing grade de referncia para a propriedade elaborada pela OS*.

    postcode O cdigo postal da propriedade. Voc pode us-lo no en-dereo www.upmystreet.com para descobrir mais informaessobre a rea na qual a propriedade se localiza. Este site dainternet tambm fornece um mapa geral da rea coberta pelocdigo postal. Um mapa alternativo pode ser obtido em

    www.streetmap.co.uk. As unidades de cdigos postais forne-cem um bom nvel de resoluo espacial aproximadamente15 propriedades dividem o mesmo cdigo postal no ReinoUnido.

    ward cdigo de seis dgitos do censo (setor)

    *N. de T.: OS: Ordinance Survey: organizao do governo que faz mapas oficiais detalhados da Gr--Bretanha e Irlanda do Norte.

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    21

    Introduo aos Mtodos Estatsticos para Geografia 21

    ward name nome do setortywr_/tywr_id cdigo do setor para mapeamento

    district 1=

    Gateshead2 =Newcastle3 =North Tyneside4 =South Tyneside5 =Sunderland

    price preo de venda da casa em (Lembre-se: valores de 1991!)dprice varivel nominal que assume o valor:

    1 se a casa est abaixo do preo mdio para o condado2 caso contrrio

    garage uma varivel dummy que assume o valor:

    1 se possui garagem0 se no possui garagem

    centheat uma varivel dummy que assume o valor:1 se a casa tem sistema central de aquecimento completo0 se a casa no tem ou tem apenas sistema parcial de aque-cimento

    bedrooms nmero de quartosbathrooms nmero de banheirosdateblt ano em que a casa foi construdaprewar uma varivel qualitativa que assume o valor:

    1 se a casa foi construda no perodo 187519140 caso contrrio

    interwar uma varivel qualitativa que assume o valor:1 se a casa foi construda no perodo 191519390 caso contrrio

    postwar uma varivel dummy que assume o valor:1 se a casa foi construda no perodo 194019590 caso contrrio

    sixties uma varivel dummy que assume o valor:

    1 se a casa foi construda no perodo 196019750 caso contrrio

    newest uma varivel dummy que assume o valor:1 se a casa foi construda no perodo 197619910 caso contrrio

    flr_area rea construda da casa, em metros quadradosdetached uma varivel dummy que assume o valor:

    1 se a casa uma construo sem vizinho prximo0 caso contrrio

    semidet uma varivel dummy que assume o valor:1 se a casa tem vizinho de um lado0 caso contrrio

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    22

    22 Mtodos Estatsticos para Geografia

    terrace uma varivel dummy que assume o valor:1 se faz parte de um conjunto de casas conjugadas

    0 caso contrrioflat uma varivel dummy que assume o valor:1 se a casa parte de outra casa0 caso contrrio

    area rea do setor (ignorar)age0_15 porcentagem da populao do setor com idade entre 015age16_24 porcentagem da populao do setor com idade entre 1624age25_64 porcentagem da populao do setor com idade entre 2564age65_ porcentagem da populao do setor com idade maior ou

    igual a 65

    ethnic porcentagem de populao no branca no setoreconact porcentagem de populao economicamente ativa no setorunempl porcentagem de populao desempregada no setorownocc porcentagem do setor ocupada por proprietriosprivrent porcentagem de casas do setor ocupada por inquilino privadopublrent porcentagem de casas do setor ocupadas por inquilino com

    aluguel pago pelo governonocar porcentagem de casas no setor sem um carrocarshh nmero mdio de carros por casa no setorcrowdhh nmero mdio de casa com superlotaoenergy porcentagem da populao do setor empregada no setor de

    energiamfg porcentagem da populao do setor empregada na indstriaConst porcentagem da populao do setor empregada na construodistbn porcentagem da populao do setor empregada no setor de

    distribuiofinance porcentagem da populao do setor empregada no setor de

    finanasservice porcentagem da populao do setor empregada no setor de

    serviossc_1/2/3/4/5 porcentagem da populao do setor nas classes sociais

    1/2/3/4/5depchild porcentagem de famlias com filhos dependentesmultfam porcentagem de pessoas vivendo em unidades multi-familiares

  • 5/27/2018 Cap_01.PDF Livro - Metodos Estatisticos Em Geografia

    23

    Introduo aos Mtodos Estatsticos para Geografia 23

    1.9.3 Dados do censo de 1990 para o condado de Erie,Nova York

    Uma tabela de tamanho 235 5 foi construda da coleta (do Censo de 1990 dos Es-tados Unidos) e decorrente das seguintes informaes dos 235 setores censitrios docondado de Erie, Nova York (os nomes das variveis esto entre parnteses):

    (a) Mediana da renda familiar (medhsinc) (b) Porcentagem de famlias chefiadas por mulheres (femaleh) (c) Porcentagem dos graduados no ensino mdio que tm diploma profissional (educ) (d) Porcentagem de residncias ocupadas pelo proprietrio (tenure) (e) Porcentagem de moradores que mudaram para sua residncia atual antes de 1959

    (lres)