-
UNIVERSIDADE DE SO PAULO
ESCOLA DE ENGENHARIA DE SO CARLOS
ANABELE LINDNER
Anlise desagregada de dados de demanda por transportes atravs de modelagem
geoestatstica e tradicional
So Carlos
2015
-
ANABELE LINDNER
Anlise desagregada de dados de demanda por transportes atravs de modelagem
geoestatstica e tradicional
Dissertao apresentada Escola de Engenharia de So Carlos como parte dos requisitos para a obteno do ttulo de Mestre em Cincias, Programa de Ps-graduao em Engenharia de Transportes.
rea de concentrao: Planejamento e Operao de Sistemas de Transporte.
Orientadora: Prof. Dra. Cira Souza Pitombo
So Carlos
2015
-
AUTORIZO A REPRODUO TOTAL OU PARCIAL DESTE TRABALHO,POR QUALQUER MEIO CONVENCIONAL OU ELETRNICO, PARA FINSDE ESTUDO E PESQUISA, DESDE QUE CITADA A FONTE.
Lindner, Anabele L735a Anlise desagregada de dados de demanda por
transportes atravs de modelagem geoestatstica etradicional / Anabele Lindner; orientadora Cira SouzaPitombo. So Carlos, 2015.
Dissertao (Mestrado) - Programa de Ps-Graduao em Engenharia de Transportes e rea de Concentrao emPlanejamento e Operao de Sistemas de Transporte --Escola de Engenharia de So Carlos da Universidade deSo Paulo, 2015.
1. Geoestatstica. 2. Regresso logstica. 3. Demanda por transportes. I. Ttulo.
-
Se projetas alguma coisa, ela te sair bem
e a luz brilhar em teus caminhos.
J, 22:28
-
AGRADECIMENTOS
Agradeo primeiramente a Deus, pelas oportunidades concebidas em minha vida e
fora contemplada na jornada.
Agradeo minha famlia, especialmente aos meus pais, pelos princpios ensinados,
os quais permitiram que eu me tornasse uma pessoa perseverante.
Agradeo ao Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico
(CNPq) pelo apoio pesquisa.
Agradeo professora, Cira Souza Pitombo, que se prontificou a me orientar e
sempre foi muito solcita e disponvel.
Agradeo s amizades que se edificaram nesta etapa. Tenho uma imensa gratido
pelos amigos Felipe Costa Bethonico, Lucas Assirati e Samille Santos Rocha, no
apenas pelo companheirismo, mas tambm pela preocupao, solidariedade e apoio
nos momentos difceis deste Mestrado.
Agradeo ao amicssimo Diego Fernandes Neris, que me encorajou a fazer esta Ps
Graduao e me inspira com o seu sucesso.
Agradeo a Mrcia Pereira de Andrade, professora fundamental na minha iniciao
aos estudos da rea de Engenharia de Transportes desde o perodo da Graduao.
-
RESUMO
LINDNER, A. Anlise desagregada de dados de demanda por transportes atravs de modelagem geoestatstica e tradicional. 2015. 106p. Dissertao
(Mestrado em Cincias) - Departamento de Engenharia de Transportes, Escola de
Engenharia de So Carlos, Universidade de So Paulo, So Carlos, 2015.
O conhecimento do padro de deslocamento populacional bem como a estimativa
de demanda por transportes so de fundamenta l importncia para a tomada de
decises relativas ao planejamento urbano e de transportes. Em geral, a obteno
destas informaes realizada por modelos tradicionais como o modelo quatro
etapas. Entretanto, modelos clssicos no levam em conta a dependncia espacial
das variveis. A Geoestatstica, valendo-se da utilizao de variveis regionalizadas,
apresenta-se como uma ferramenta auxiliar capaz de modelar informaes
espaciais. Este trabalho tem por objetivo estimar dados desagregados de demanda
por transportes atravs de modelagem geoestatstica e tradicional. Neste estudo, a
modelagem tradicional e a geoestatstica puderam ser comparadas por meio de um
banco de dados referente pesquisa Origem/Destino da Regio Metropolitana de
So Paulo, realizada em 2007. A abordagem tradicional se baseou em um modelo
de regresso enquanto que a abordagem geoestatstica consistiu na estimao
espacial de variveis com base na modelagem de semivariogramas e Krigagem. Ao
final do trabalho, foi possvel realizar a comparao dos resultados da abordagem
tradicional e geoestatstica em coordenadas de valores conhecidos. Os resultados
indicaram que a modelagem tradicional apontou uma taxa de acertos de 96% pelo
modelo de Regresso Logstica Mltipla adotada para a varivel dicotmica de preferncia por modo motorizado (varivel objeto de estudo). A abordagem tradicional baseou-se na calibrao de um modelo por meio de outras oito variveis.
Entretanto, a modelagem geoestatstica, utilizando-se apenas das coordenadas
geogrficas domiciliares, resultou em 67% de taxa de acertos de previso da
varivel. Isso demonstrou que, apesar de possuir menor taxa de acertos, a
modelagem geoestatstica, por utilizar menor nmero de informaes para previso
-
da varivel, teve um resultado satisfatrio e demonstra-se promissora na rea de
planejamento de transportes, sobretudo considerando sua habilidade de estimao
em outras coordenadas geogrficas alm das amostradas.
Palavras-chave: Geoestatstica, regresso logstica, demanda por transportes.
-
ABSTRACT
LINDNER, A. Disaggregated data analysis on transportation demand through traditional and geostatistical modeling. 2015. 106p. Thesis (Master of Science)
Engineering School of So Carlos, University of So Paulo. So Carlos, 2015.
The comprehension of population displacement patterns and travel demand
forecasting is crucial on making decisions related to urban transportation planning. In
order to obtain this information, classic models like the sequential Four-step model
are applied. However, classic models do not consider spatial location in their
approach. Geostatistics is displayed as a suitable complementary instrument able to
model spatial information. This work intends to forecast disaggregated data on
transportation demand through traditional and geostatistical modeling. The present
study compares the results from classic approach and Geostatistics through an
Origin-Destination Survey dataset, carried out in So Paulo Metropolitan Area in
2007. The classic approach was based on regression models whereas Geostatistics
consisted in variable spatial estimation by semivariograms modeling and Kriging. At
the end of the study, a comparison between regression and geostatistical analysis
was conducted through results of prediction in locations where the values of the
variable are known. Results indicated that classic modeling had a 96% hit rate by
Multiple Logistic Regression adopted for the dummy variable preference for motorized travel mode (object of study variable). Classic modeling was based on a training model using other eight predictor variables. Meanwhile, Geostatistics, using
only residential geographical coordinate, resulted in a 67% hit rate for predicting the
variable object of study. This demonstrates that, even though Geostatiscs had lower
hit rate compared to Multiple Logistic Regression, it had satisfactory outcome and
proves to be a promising approach in transport planning, given that it considered less
information to predict the variable, especially considering its ability of estimating in
other geographical coordinates in addition to those sampled.
Keywords: Geostatistics, logistic regression, demand for transportation
-
.
-
LISTA DE FIGURAS
Figura 2.1: Grfico de disperso para varivel dependente com apenas duas
categorias.................................................................................................................. 35
Figura 2.2: Curva S de probabilidade para a varivel dependente binria. .............. 36
Figura 3.1: Etapa 1) para processo de obteno do semivariograma...................... 46
Figura 3.2: Etapa 2) para processo de obteno do semivariograma...................... 46
Figura 3.3: Etapa 3) para processo de obteno do semivariograma...................... 46
Figura 3.4: Etapa 4) para processo de obteno do semivariograma...................... 47
Figura 3.5: Parmetros para interpretao grfica do semivariograma.................... 48
Figura 3.6: Representao de uma varivel espacial isotrpica e anisotrpica....... 49
Figura 3.7: Exemplos de melhores ajustes para semivariogramas experimentais. .. 50
Figura 3.8: Fluxograma para abordagem bsica de calibrao e validao de
modelos..................................................................................................................... 51
Figura 4.1: Regio Metropolitana de So Paulo e Zonas de Trfego....................... 59
Figura 4.2: Representao dos domiclios apurados na Pesquisa O/D.................... 60
Figura 4.3: Esquema simplificado do mtodo proposto............................................ 62
Figura 4.4: Processo de calibrao/validao.......................................................... 67
Figura 4.5: Representao da interpolao dos valores de coordenadas................ 70
Figura 5.1: Histogramas das variveis de demanda por transporte.......................... 74
-
Figura 5.2: Semivariogramas experimentais nas direes: omnidirecional, (0, -90),
(15, -75), (30, -60) e (45, -45) para preferncia por modo motorizado..............77
Figura 5.3: Semivariogramas experimentais nas direes (60, -30) e (75, -15)
para preferncia por modo motorizado......................................................................78
Figura 5.4: Amplitudes e razes das direes estudadas e elipside de anisotropia
geomtrica................................................................................................................. 79
Figura 5.5: Semivariogramas ajustados para a direo principal (-15) e direo
ortogonal (75)........................................................................................................... 79
Figura 5.6: Mapa krigado para a varivel preferncia por modo motorizado.............80
Figura 5.7: Mapa da taxa de acertos para a abordagem geoestatstica (validao
pela mdia dos ns adjacentes).................................................................................83
Figura 5.8: Mapa da taxa de acertos para a abordagem geoestatstica (validao
cruzada)..................................................................................................................... 84
Figura 5.9: Mapa da taxa de acertos por municpio para a RLM.............................. 87
Figura 5.10: Grficos de comparao de taxas de acertos entre a modelagem
Geoestatstica (mdia e validao cruzada) e a modelagem por RLM..................... 89
Figura 5.11: Proporo de registros por municpio da RMSP................................... 90
-
LISTA DE TABELAS
Tabela 3.1: Tipos de dados e problemas em anlise espacial................................. 40
Tabela 4.1: Informaes dos municpios da RMSP.................................................. 61
Tabela 4.2: Informaes uti lizadas da Pesquisa O/D RMSP 2007............................64
Tabela 4.3: Medidas descritivas para as variveis quantitativas............................... 65
Tabela 4.4: Percentual de observaes da varivel critrio de renda.......................65
Tabela 4.5: Percentual de observaes da varivel preferncia por modo motorizado..................................................................................................................65
Tabela 4.6: Medidas estatsticas avaliadas nas modelagens................................... 71
Tabela 5.1: Parmetros para clculo dos semivariogramas experimentais. ............. 76
Tabela 5.2: Resultados de validao pela mdia dos ns adjacentes (modelagem
geoestatstica)........................................................................................................... 81
Tabela 5.3: Resultados da validao cruzada (modelagem geoestatstica). ............ 82
Tabela 5.4: Resultados para qualidade do ajuste da RLM....................................... 86
Tabela 5.5: Resultados de validao para RLM........................................................ 87
-
LISTA DE ANEXOS E APNDICE
Anexo 1: Mapa da Regio Metropoli tana de So Paulo ... .. .. .. .. ... .. .. .. ... . 105
Apndice 1: Resultados de taxa de acertos para a validao por municpio....... 106
-
SUMRIO
1. INTRODUO...................................................................................................... 25
1.1 PROBLEMA DE PESQUISA........................................................................... 26
1.2 JUSTIFICATIVA............................................................................................... 26
1.3 OBJETIVO....................................................................................................... 27
1.3.1 Objetivos especficos................................................................................. 27
1.4 ESTRUTURA DO TRABALHO........................................................................ 27
2. MODELAGEM DE DEMANDA POR TRANSPORTES......................................... 29
2.1 CONSIDERAES INICIAIS...........................................................................29
2.2 MODELO QUATRO ETAPAS..........................................................................31
2.3 ESCOLHA MODAL.......................................................................................... 33
2.3.1 Regresso Logstica.................................................................................. 35
2.3.1.1 Regresso Logstica Simples ....................................................................................... 36
2.3.1.2 Regresso Logstica Mltipla........................................................................................ 37
2.3.1.3 Regresso Logstica Multinomial .................................................................................. 38
3. ESTATSTICA ESPACIAL.................................................................................... 39
3.1 CONCEITOS DE ESTATSTICA ESPACIAL.................................................. 39
3.2 GEOESTATSTICA.......................................................................................... 42
3.2.1 Anlise das variveis regionalizadas......................................................... 43
3.2.2 Modelagem de semivariogramas experimentais........................................ 44
3.2.2.1 Parmetros para definio do semivariograma............................................................ 44
3.2.2.2 Processo de obteno do semivariograma................................................................... 45
-
3.2.2.3 Interpretao grfica do semivariograma..................................................................... 47
3.2.2.4 Ajuste do semivariograma experimental ....................................................................... 49
3.2.3 Validao ................................................................................................... 51
3.2.4 Krigagem .................................................................................................... 54
3.2.4.1 Krigagem Indicativa (KI)................................................................................................ 55
3.2.5 Geoestatstica e Transportes..................................................................... 57
4. MATERIAIS E MTODO...................................................................................... 59
4.1 MATERIAIS..................................................................................................... 59
4.1.1 Banco de dados e rea de estudo ............................................................. 59
4.1.2 Software .....................................................................................................62
4.2 MTODO.......................................................................................................... 62
4.1.1 Tratamento e visualizao de dados......................................................... 63
4.1.2 Escolha da varivel objeto de estudo........................................................ 66
4.1.3 Modelagem de demanda por transportes.................................................. 66
4.1.3.1 Modelagem geoestatstica............................................................................................ 67
4.1.3.2 Modelagem tradicional .................................................................................................. 71
4.1.4 Comparao dos resultados...................................................................... 72
5. RESULTADOS E DISCUSSES.......................................................................... 73
5.1 TRATAMENTO E VISUALIZAO DE DADOS............................................. 73
5.2 ESCOLHA DA VARIVEL OBJETO DE ESTUDO......................................... 74
5.3 MODELAGEM GEOESTATSTICA................................................................. 75
5.3.1 Anlise da estrutura espacial ..................................................................... 76
5.3.2 Krigagem .................................................................................................... 80
5.3.3 Validao ................................................................................................... 81
-
5.3.3.4 Validao por municpio............................................................................................... 83
5.4 MODELAGEM TRADICIONAL........................................................................ 84
5.4.1 Regresso Logstica Mltipla ..................................................................... 84
5.4.2 Validao ................................................................................................... 86
5.4.2.1 Validao por municpio............................................................................................... 87
5.5 COMPARAO DOS RESULTADOS............................................................ 88
6. CONCLUSES E RECOMENDAES............................................................... 91
5.1 CONCLUSES................................................................................................ 91
5.2 RECOMENDAES........................................................................................ 95
REFERNCIAS BIBLIOGRFICAS....................................................................... 97
LISTA DE ANEXOS E APNDICE ........................................................................ 105
-
25
1. INTRODUO
No captulo 1 dessa dissertao, uma introduo feita apresentando o problema da pesquisa, a justificativa do estudo, os objetivos e a estrutura do texto.
Estimativas de demanda por transportes auxiliam a tomada de deciso
relativa ao planejamento urbano e de transportes. Tradicionalmente, so utilizados
modelos diretos ou sequenciais para prever a demanda por transportes. O modelo
mais utilizado ainda o modelo quatro etapas, as quais so: (1) gerao de viagens;
(2) distribuio de viagens; (3) diviso modal e (4) alocao de trfego.
Os modelos clssicos, usualmente, no consideram a dependncia espacial
de dados na anlise. Diante deste fato, a incluso de tcnicas de anlise espacial
preenche essa lacuna e abre espao para uma ferramenta adicional para incremento
de modelagem e estimao da demanda por transportes, a partir da incorporao de
localizaes espaciais.
Tcnicas de anlise espacial diferenciam-se das tcnicas tradicionais. Ao
invs de serem promovidas anlises estatsticas globais, ou seja, dos dados como
um todo sem a preocupao da posio espacial, so realizadas anlises
estatsticas locais com o enfoque de expor os resultados obtidos em uma
representao grfica.
No contexto da anlise espacial, a geoestatstica se diferencia, pois, aps a
realizao das estatsticas locais por meio de semivariogramas, os resultados
obtidos so uti lizados como instrumento para o processo de estimao denominado
Krigagem. Mostra-se, ento, como uma ferramenta completa, porque, alm de
promover a anlise dos dados pr-existentes, capaz de inferir sobre dados
desconhecidos.
A aplicao da Geoestatstica passou a ser mais usual na dcada de 1980,
sendo utilizada pela lavra e prospeco mineira, agricultura de preciso, anlise
-
26
espacial de crimes, cartografia, climatologia, oceanologia, geotecnia, hidrogeologia
(YAMAMOTO e LANDIM, 2013). A utilizao das tcnicas de Geoestatstica na
Engenharia de Transportes ainda incipiente. Autores como Braxmeier et al. (2005) e Du e Aultman-Hall (2006) iniciaram pesquisa com aplicao de tcnicas de
interpolao espacial de dados (Krigagem) para estimao da velocidade e do
tempo de viagem.
1.1 PROBLEMA DE PESQUISA
O problema da presente pesquisa, que motivou a realizao do trabalho,
baseia-se no fato de que a modelagem tradicional de demanda por transportes
desconsidera a localizao espacial das variveis. No entanto, sabe-se que a
demanda por transportes um problema locacional, alm de socioeconmico e
demogrfico.
1.2 JUSTIFICATIVA
Embora os mtodos tradicionais no abordem a localizao espacial das
variveis na anlise, a Geoestatstica considera essa condio e se mostra
potencialmente vantajosa para modelagem e estimao de demanda por
transportes. Contudo, so poucos os trabalhos na rea de estatstica espacial para o
planejamento de transportes. O trabalho aqui exposto procura contribuir com
informaes e propor mtodo que viabilize a aplicao da Geoestatstica no
planejamento de transportes para que a tcnica aprimore estudos j existentes. Da
mesma forma, pretende-se contribuir com as adequaes de dados relativos a
viagens na abordagem da anlise geoestatstica.
Este trabalho de mestrado utilizou dados desagregados (por domiclio), os
quais puderam se adequar melhor s suposies de continuidade espacial da
-
27
Geoestatstica, quando comparados a dados agregados por zonas de trfego, por
exemplo.
1.3 OBJETIVO
O trabalho teve como objetivo principal estimar dados desagregados de
demanda por transportes atravs de modelagem geoestatstica e tradicional.
1.3.1 Objetivos especficos
Obter estimativas da varivel de estudo pela abordagem tradicional de anlise
de demanda por transportes;
Obter a superfcie espacial de estimao da varivel objeto de estudo;
Testar a adequabilidade da tcnica de anlise espacial por meio de
comparao entre as abordagens;
Analisar os resultados da modelagem por municpio da RMSP, discutindo as
similaridades e diferenas.
1.4 ESTRUTURA DO TRABALHO
A dissertao de mestrado, aqui apresentada, formada por seis captulos,
alm desta introduo.
No segundo e terceiro captulos, so apresentados embasamentos tericos
para o pleno entendimento deste trabalho. O segundo captulo aborda alguns
conceitos bsicos de modelagem tradicional utilizados na anlise de demanda por
transportes. No terceiro captulo, so apresentadas consideraes sobre as tcnicas
de anlise espacial de dados e conceitos relacionados anlise espacial de
superfcies, conhecida como Geoestatstica.
-
28
No quarto captulo so explanados os materiais, software e o mtodo utilizados para a obteno da estimao da varivel objeto de estudo a ser definida
por meio de modelagem geoestatstica e tradicional (regresso).
O quinto captulo apresenta os resultados obtidos seguindo-se as etapas do
mtodo proposto, bem como as principais discusses. O sexto captulo expe as
concluses e recomendaes.
-
29
2. MODELAGEM DE DEMANDA POR TRANSPORTES
O captulo 2 tem por intuito oferecer ao leitor um referencial terico acerca dos mtodos tradicionais de modelagem de demanda. O texto enfatiza o modelo de quatro etapas, pois este ainda o mais utilizado na prtica. Alm disso, o captulo reserva um enfoque relacionado escolha modal, especificamente descrevendo modelos logsticos.
2.1 CONSIDERAES INICIAIS
Um modelo criado com a finalidade de representar um sistema. Tal
representao pode ser realizada atravs de vrios tipos de linguagem: matemtica,
lgica, grfica, fsica (modelo reduzido).
A elaborao de um modelo objetiva a simplificao da realidade e a
definio de elementos e relaes relevantes.
Modelos podem ser classificados com referncia s tcnicas utilizadas
(WILSON 1 , 1967 apud NOVAES, 1982): i) anlises estatsticas; ii) sistemas de equao; iii) simulao; iv) algoritmos ou processos heursticos.
Tradicionalmente, o embasamento para modelagem de fenmenos urbanos
e de demanda por transportes segue quatro tipos bsicos de posturas cientficas
(NOVAES, 1982):
a) Abordagem emprica: ajuste de relaes matemticas, comumente amparado
por anlise de regresso ou outro processo estatstico.
b) Enfoque microanaltico ou comportamental: conduta geral determinada por
anlise de comportamento de indivduos. Um entrave encontrado pela
adoo dessa tcnica est no fato de que indivduos submetidos a mesmas
condies atuam de formas diferentes.
1 Wilson, A. (1967) Mathematical models in planning. Architectural Association Journal, 82, p. 260-65.
-
30
c) Analogias: os elementos objetos de estudo so analisados de maneira
alusria a tcnicas e modelos utilizados em outros campos da cincia. Um
exemplo clssico no planejamento de transportes o modelo gravitacional.
d) Enfoque macroanaltico ou da fsica social: consiste no estabelecimento de
relaes baseadas no comportamento individual de cada categoria e os nveis
de demanda agregados, que so observados na realidade atravs de
formulaes probabilsticas.
Embora desenvolvidas no passado, essas tcnicas ainda so amplamente
utilizadas. Por meio do advento de recursos computacionais e matemticos
modernos e mais precisos, tais tcnicas tm sido aprimoradas por meio de
ferramentas, que antes eram inviveis. Dentre essas ferramentas, pode-se citar a
Anlise Espacial (Regresso Espacial), Redes Neurais, Lgica Fuzzy, Algoritmos
Genticos e Autmatos Celulares e Sistemas de Informao Geogrfica (SIG).
Lopes (2005) demonstrou, em seu trabalho, que a introduo de variveis
espaciais ao estudo de modelos de demanda por transporte apresentou resultados
positivos, quando comparados a modelos tradicionais. Isso acontece, pois os SIGs
permitem a identificao de padres espaciais das variveis de demanda por
transportes e das variveis socioeconmicas, enquanto as demais ferramentas
restringem-se caracterizao das relaes intervenientes nas variveis modeladas.
(PAIVA, 2010).
Contudo, apesar de conveniente a introduo de novos conceitos e tcnicas,
necessrio o entendimento das abordagens tradicionais.
Estimativas de demanda por transportes auxi liam a tomada de deciso
relativa ao planejamento urbano. A previso da demanda por modelos tradicionais
considera a utilizao do sistema de transportes em funo da dinmica do
ambiente. O modelo mais uti lizado ainda o modelo quatro etapas, descrito na
prxima seo.
-
31
2.2 MODELO QUATRO ETAPAS
Um dos modelos largamente empregado no planejamento de transportes o modelo sequencial de quatro etapas (SOUZA e DAGOSTO, 2013; PALHARES, 2008; PEREIRA e OLIVEIRA, 2014). Apesar de ser conhecido como um modelo, se
configura mais como um mtodo ou um procedimento e sua finalidade , principalmente, a de previso de viagens entre as diversas zonas de trfego (matriz O/D). O mtodo se baseia no contexto de que a realizao de uma viagem tem estreita relao com um processo desenvolvido em quatro fases: i) Gerao de viagens, ii) Distribuio de viagens, iii) Diviso Modal e iv) Alocao de Trfego (LOPES, 2005; TEDESCO, 2008). As quatro etapas so descritas, de maneira sintetizada, em seguida.
i) Gerao de viagens
Origina o processo com a finalidade de prever o nmero de viagens de e
para uma determinada regio em estudo (viagens produzidas e atra das por unidade de rea considerada). Tal previso geralmente realizada por mtodos de estimao de demanda. Os resultados dessa etapa servem de ponto de partida para
as demais etapas do processo. Ortzar e Willumsen (2011) apresentam os
seguintes fatores que influenciam a produo de viagens: renda, propriedade de automvel, estrutura do domic lio, tamanho da famlia, valor do solo, densidade residencial, acessibilidade. Como fatores que influenciam a atrao de viagens numa dada zona pode-se citar: o nmero de empregos ofertados, o nvel de atividade comercial e o nmero de matrculas escolares. Os seguintes modelos de gerao de viagens podem ser citados: Fator de Crescimento, Taxas de Viagens, Anlise de Categorias e Regresso.
ii) Distribuio de viagens
Este o procedimento de distribuio de demanda de uma rea para as demais, originando uma matriz de origens e destinos de viagens (pares O/D).
-
32
Usualmente utilizam-se modelos baseados em analogia, sendo o gravitacional o
mais pertinente para esse fim (MEYER e STRASZHEIM, 1974). Outros modelos
comumente aceitos so os Modelos de Fator de Crescimento tais como o Mtodo do Crescimento Uniforme, o Mtodo do Crescimento Mdio, Mtodo de Fratar e o Mtodo de Furness.
iii) Diviso modal
Esta etapa objetiva a alocao de pares O/D entre os meios de transporte
existentes (ou a serem criados), sem a preocupao com a definio das rotas. A
diviso modal feita com base nas variveis que o usurio utiliza para fazer a sua escolha. Os fatores que influenciam a escolha modal incluem usualmente
caractersticas socioeconmicas e caractersticas dos servios dos modos de transporte. Os modelos de diviso modal classificam-se em determinsticos e probabilsticos. Os modelos determinsticos utilizam mtodos quantitativos para
determinar a proporo de viagens em cada modo, tais como Regresso Linear, Classificao Cruzada, Curvas de Desvio. Os modelos probabilsticos utilizam a probabilidade de escolha de cada modo para determinar a proporo de viagens. Os
modelos probabilsticos mais utilizados so os economtricos (logstico e probit).
iv) Alocao de Trfego
A ltima etapa do processo consiste na alocao dos fluxos de cada modo
para cada par O/D da rede de transportes (OLIVEIRA, 2013). Os modelos de
alocao so utilizados para fornecer estimativas de fluxos de trfego em vias estratgicas. Um conceito que deve ser considerado em quase todos os modelos de atribuio de trfego o custo de deslocamento. Diante das diversas alternativas que o usurio tenha para efetuar uma viagem, naturalmente ponderada uma srie
de fatores para decidir qual percurso seguir.
O mtodo de quatro etapas foi um dos componentes do Urban Transportation Planning System (UTPS), desenvolvido nos EUA, com o objetivo de
-
33
promover uma padronizao dos mtodos de modelagem para transportes (HANSON e GIULIANO, 2004). Um fato importante a ser considerado o de que, apesar de induzir o pensamento de que as etapas devam ter sua sequncia
respeitada, esta no uma obrigao. Inicialmente, o modelo foi concebido em trs etapas, sendo que a etapa de diviso modal foi adicionada a partir dos anos 60, passando a considerar os modos privados e pblicos. Desde ento, este modelo
passou a considerar as viagens como um fator associado s pessoas e no aos automveis (TEDESCO, 2008).
Apesar de amplamente utilizado, o modelo de quatro etapa, devido sua natureza sequencial, pode propagar eventuais erros sem que se saibam quais sero os efeitos finais (VASCONCELOS, 2000). Alm disso, o modelo no considera a dependncia espacial das variveis. Neste contexto, torna-se conveniente a
utilizao de novas abordagens relativas aos modelos, como a incluso de variveis com dependncia espacial (variveis regionalizadas) por meio da Geoestat stica, por exemplo.
2.3 ESCOLHA MODAL
Variveis como o nmero de viagens produzidas e atradas, fluxo de trfego
e escolha modal so essenciais para o planejamento e previso de demanda por
transportes. Dentre essas variveis, a previso da varivel de escolha modal, que se
caracteriza como altamente dependente de fatores humanos, se baseia em fatores
comportamentais. Os fatores comportamentais podem ser divididos em:
Descritivos: explicam como os indivduos se comportam;
Abstratos: so baseados em termos no especficos a uma situao particular;
Operacionais: os parmetros e variveis necessitam ser estimados e mensurados
(RODRIGUES, 2012).
Conforme Rodrigues (2012), modelos probabilsticos so capazes de
representar o comportamento dos indivduos de maneira satisfatria, considerando
os trs fatores comportamentais.
-
34
Existem muitos casos em que o fenmeno que se deseja modelar discreto,
ao invs de contnuo. Esses so casos em que as decises estudadas so
resultados de uma seleo dentre distintas alternativas discretas. Nesses casos,
conveniente o uso de modelos de escolha discreta. Os modelos de escolha discreta
podem ser de trs tipos:
Categricos: a varivel dependente no tem significado por si s, representa
apenas uma codificao, ex: 1, se o indivduo trabalha e 0, caso contrrio.
Com resposta ordenada: a varivel dependente reflete um conceito por trs
de sua ordem, ex: 1 muito satisfeito, 2 satisfeito, 3 insatisfeito.
Contveis: a varivel dependente tem significado por si s, ex: nmero de
patentes registradas de um pas.
Alm dos modelos economtricos e de pressupostos de escolha discreta,
relevantes a estudos de demanda por transportes, importante destacar a Funo
Utilidade. Uma Funo Utilidade uma expresso matemtica que determina o grau
de satisfao que o usurio do transporte obtm com a escolha do modo. De forma
geral, a Funo Utilizada definida pela soma de variveis e seus pesos relativos,
tal como indicada pela Equao 2.1.
= 0 + 11 + 22 + + (2.1)
Onde, U a utilidade derivada da escolha medida pelos atributos, xi, xi so
as variveis de transporte, ai so os pesos relativos s variveis e o erro aleatrio que segue distribuio de Weibull. Exemplos dos atributos relativos a
transportes so: custo, tempo de viagem, tempo de espera, e algumas variaes
destes. A escolha pela uti lidade prev que o tomador de decises realize
compensaes entre os atributos de cada modo para escolher um no qual seu
benefcio seja o maior possvel (NOVAES, 1982), tal como:
UMODO1 > UMODO 2 > UMODO 3 Escolhe-se o modo 1.
-
35
2.3.1 Regresso Logstica
Para prever se uma alternativa ser escolhida, o valor de um determinado
modo pode ser contrastado com uma opo alternativa, de maneira a ser
transformado em uma probabilidade entre 0 e 1. Entretanto, escolhas discretas
no podem ser calibradas usando ajustes de curva como mnimos quadrados, pois
sendo a varivel dependente uma probabilidade, a modelagem por uma curva em
forma de S se faz necessria. Um dos modelos de escolha discreta mais utilizado na
Engenharia de Transporte o logstico (ORTZAR e WILLUMSEN, 2011).
Se a discretizao se restringe apenas a duas opes, a regresso logstica
dita binomial, caso haja mais opes, a regresso generalizada e nomeada
multinomial. Vale salientar que essas regresses tambm so denominadas por
Modelos Logit Binomial e Logit Multinomial.
A diferena da Regresso Logstica para a Regresso Linear de que a
varivel dependente no contnua, mas sim, qualitativa. A Regresso Logstica
Binomial normalmente expressa por duas categorias (binrias), conforme
representado pela Figura 2.1, que representa a relao entre varivel dependente
binria (y) e varivel independente contnua (x).
Figura 2.1: Grfico de disperso para varivel dependente com apenas duas categorias.
Portanto, o mtodo dos mnimos quadrados que era a base da Regresso
Linear, j no oferece estimadores plausveis. A soluo para isso o uso da
Regresso Logstica, pois essa permite o uso de um modelo (curva em S) para
prever a probabilidade de um evento especfico, ilustrado na Figura 2.2.
-
36
Figura 2.2: Curva S de probabilidade para a varivel dependente binria.
2.3.1.1 Regresso Logstica Simples
Na Regresso Logstica Simples, a varivel dependente possui apenas duas
categorias (0 e 1) e apenas uma varivel independente envolvida. O modelo de
Regresso para a curva S normalmente implica em dificuldades relativas ao clculo.
Para isto possvel considerar uma transformao logstica de que calculada mais facilmente. A funo logstica g (x) dada por:
g x = ln
1 (2.2)
g x = 0 + 1 x (2.3)
Sendo 0 e 1 os coeficientes da equao de calibrao.
Em posse da Regresso Logstica Simples (Equao 2.3), simples calcular
o valor da probabilidade .
=1
1 + eg(x) (2.4)
Anlises qualitativas podem ser feitas considerando as equaes 2.3 e 2.4:
Se 1 < 0, crescente Se 1 > 0, decrescente Se x e 1 < 0, 0 Se x e 1 > 0, 1 Se 1 = 0, g(x) independente de x
-
37
Em nveis muito baixos, a probabilidade tende a 0. Entretanto, quando a
varivel aumenta, a probabilidade aumenta para cima da curva, mas em seguida, a
inclinao comea a diminuir, de forma que, em qualquer nvel, a probabilidade
tender a 1, no extrapolando esse valor.
A qualidade do ajuste pode ser mensurada atravs de medidas estatsticas
tradicionais como erro padro e significncia; e tambm por medidas estatsticas
apropriadas apenas para a anlise de Regresso Logstica, tais como: valor Wald,
valor da verossimilhana (-2LL), testes de regresso de Cox & Snell e Nagelkerke,
chi-quadrado avaliado pelo teste de Hosner & Lemeshow (HAIR et al., 2010).
2.3.1.2 Regresso Logstica Mltipla
A Regresso Logstica Mltipla (RLM) consiste da generalizao do modelo
de Regresso Logstica Simples. Novamente, a varivel dependente binria,
porm, existe mais de uma varivel independente, ou seja, caso mltiplo.
A generalizao consiste em uma alterao na funo logstica, que agora
considera as mltiplas variveis independentes:
g x = 0 + 1x1 + 2x2 ++n xn (2.5)
g x = i xi
n
i=0
(2.6)
Sendo x0 = 1, 0, 1,..., n os coeficientes da equao de calibrao e n o
nmero de variveis independentes.
Por meio da Regresso Logstica Mltipla (Equao 2.6), calcula-se a
probabilidade (Equao 2.4), com g(x) adequado.
As mesmas medidas de avaliao da Regresso Logstica Simples podem
ser usadas para RLM.
-
38
2.3.1.3 Regresso Logstica Multinomial
Pode-se modificar a Regresso Logstica Mltipla de maneira que a varivel
dependente apresente mais de dois nveis de codificao. Ao invs de apenas ter-se
0 e 1, agora pode-se obter 0, 1, 2, por exemplo.
Faz-se necessrio k funes logsticas para cada uma das k categorias que
a varivel dependente pode assumir:
g1 x = 1,0 + 1,1x1 + 1,2x2 + +1,n xn
g2 x = 2,0 + 2,1x1 + 2,2x2 ++2,n xn
gk x = k,0 + k,1x1 + k ,2x2 ++k ,n xn
gk x = k,i xi
n
i=0
(2.7)
Sendo x0 = 1, k,0, k,1,..., k,n os coeficientes da equao de calibrao e n o
nmero de variveis independentes.
Isso ir gerar as probabilidades k para cada uma das k classes.
k =1
1 + egk (x) (2.8)
As medidas de avaliao usadas na Regresso Logstica Simples e
Regresso Logstica Mltipla tambm podem ser usadas para Regresso Logstica
Multinomial (FIGUEIRA, 2006).
-
39
3. ESTATSTICA ESPACIAL
O captulo 3 versa sobre o referencial terico acerca da estatstica espacial, com nfase na Geoestatstica. A estatstica espacial de grande relevncia, uma vez que apresenta um mtodo alternativo de anlise quando comparado aos modelos clssicos de demanda por transportes. O captulo tambm descreve e conceitualiza o processo de modelagem geoestatstica: (1) anlise de variveis regionalizadas, (2) modelagem de semivariogramas experimentais, (3) validao e (4) Krigagem.
3.1 CONCEITOS DE ESTATSTICA ESPACIAL
Compreender a distribuio espacial de dados oriundos de fenmenos
ocorridos no espao constitui um grande desafio para a elucidao de questes
centrais em diversas reas do conhecimento, seja em sade (LAPA et al., 2006), em economia (PEROBELLI, 2004), em meteorologia (SIQUEIRA et al., 2007), em transportes (PITOMBO et al., 2010a). Com o advento de recursos computacionais poderosos, tornam-se cada vez mais usuais estudos onde a distribuio espacial
dos dados avaliada. Este processo denominado An lise Espacial (DRUCK et al., 2004).
Anlises estatsticas tradicionais, baseadas na independncia das
observaes, tm sido substitudas por anlises espaciais, as quais consideram as
correlaes entre observaes vizinhas. Estas anlises so baseadas na teoria das
variveis regionalizadas (MATHERON, 1971), a qual considera as caractersticas
estruturais e aleatrias de uma varivel espacialmente distribuda, de forma a
descrev-la adequadamente.
Um dos conceitos bsicos de anlise espacial o estudo do comportamento
das variveis. Caso haja disperso espacial no uniforme dos valores amostrais,
pode-se dizer que a varivel tem comportamento anisotrpico. Caso contrrio, o
comportamento espacial isotrpico.
-
40
Uma vantagem da anlise espacial a de que esta mais propcia para lidar
com a anisotropia, pois representa bem a variabilidade espacial da propriedade em
estudo. Procedimentos determinsticos para este fim so considerados limitados,
pois no consideram a estrutura de autocorrelao espacial bem como a anisotropia
presente (CAMARGO, 2001).
Diversos tipos de anlises podem ser promovidos de acordo com o tipo do
dado o qual se trabalha. A Tabela 3.1, adaptada de Druck et al. (2004), ilustra a questo.
Tabela 3.1: Tipos de dados e problemas em anlise espacial Problemas em anlise
espacial Tipos de dados Exemplo Aplicaes tpicas
Anlise de padres pontuais Eventos localizados
Ocorrncia de doenas
Determinao de padres e agrupamentos
Anlise de superfcies Amostras de campo e matrizes Depsitos minerais Interpolao e medidas de
incerteza
Anlise de reas Polgonos e atributos Dados censitrios Regresso e distribuies
conjuntas Fonte: Druck et al., 2004 (adaptado).
A anlise espacial, em seu carter exploratrio, pode ocorrer de diversas
maneiras. Em seguida, so citadas representaes de anlise espacial exploratria.
- Visualizao de Dados: Trata-se da forma mais simples e intuitiva de
realizar uma anlise espacial. Consiste em considerar valores de corte de maneira a
identificar valores extremos no espao amostral. Isto , considerando um valor de
corte propcio a anlise, apenas os valores acima do valor de corte so exibidos em
uma superfcie espacial (DRUCK et al., 2004).
- Grficos de Mdias e Medianas: Estes grficos so construdos levando
em conta as coordenadas geogrficas dos centroides de reas com valores comuns
de maneira a montar uma matriz de mdias e medianas entre cada par de reas.
Dessa forma, estes grficos (matrizes) permitem explorar simultaneamente a
presena de tendncias espaciais. Quando se encontra uma tendncia espacial ao
longo de alguma direo, os valores dessa matriz variam suavemente, caso
-
41
contrrio, para valores muito discrepantes, considera-se a no presena de
tendncia espacial (DRUCK et al., 2004).
- Anlise de Autocorrelao Espacial: Esta anlise muito parecida com a
anterior, alterando apenas a abordagem considerada. Ela visa identificar estrutura
de correlao espacial pela estimao da magnitude da autocorrelao espacial
entre as reas. Quando se dispe de um nmero grande de reas, muito provvel
que existam diferentes regimes de correlao (DRUCK et al., 2004).
- Semivariograma: O semivariograma uma representao grfica
indicadora da dependncia espacial atravs do clculo de varincia entre pontos da
amostra. Nele considerada a associao de um valor nico de atributo a cada
ponto geogrfico. Atravs dos valores calculados, pode-se descrever dados como
sendo no-estacionrios quando o semivariograma no se estabiliza, e estacionrios
quando o semivariograma estabilizado. Os semivariogramas devem ser realizados
para todas as direes de interesse (DRUCK et al., 2004).
- Anlises baseadas em estimadores: Algumas vezes conveniente realizar
a reestimao dos valores do espao amostral, de maneira a suprimir a ausncia de
dados em determinadas reas ou at mesmo realizar uma suavizao de flutuaes
aleatrias muito intensas. Para isto, algumas tcnicas so utilizadas. Um exemplo
a estimativa bayesiana local, que consiste em estimar valores convergindo os dados
para mdias locais. Aps a estimao, os dados so visualizados como um todo em
um mapa. Esta tcnica pode ser combinada com as quatro citadas anteriormente
(DRUCK et al., 2004).
Enquanto as tcnicas de anlise exploratria descrevem e visualizam dados
espaciais para a verificao da existncia de padres de associao espacial, as
tcnicas de anlise confirmatria envolvem o conjunto de modelos de estimao e
procedimentos para sua validao, geralmente realizados por regresses (KREMPI,
2004). No entanto, a utilizao dessa ferramenta depende de uma averiguao
preliminar de existncia de homogeneidade espacial. Caso seja identificada
-
42
homogeneidade espacial, podem-se usar modelos globais, caso contrrio, so
utilizados modelos locais.
Para o caso de modelos com efeitos espaciais globais, supe-se que
possvel capturar a estrutura de correlaes espaciais por meio de um nico
parmetro (varivel), que deve ser adicionado ao modelo de regresso tradicional.
J para o caso de modelos com efeitos espaciais locais, os coeficientes de
regresso precisam refletir a heterogeneidade espacial. Para isso conveniente a
diviso do espao de estudo em subregies, cada uma com seu padro espacial
prprio (DRUCK et al., 2004). Cada regime das subregies colabora com os seus prprios valores para os coeficientes que iro compor, por exemplo, uma regresso
geograficamente ponderada, regresso esta que considera que pontos mais
prximos ao ponto da regio de estudo tm maior influncia nos parmetros
estimados desta regresso (CARVALHO et al., 2006).
Dentre estas anlises, baseadas na teoria das variveis regionalizadas
(MATHERON, 1971), destaca-se a Geoestatstica, tambm conhecida como anlise
espacial de superfcies, cuja base conceitual anloga. A Geoestatstica
desempenha papel semelhante s anlises de estatstica espacial descritas
anteriormente, porm mais rebuscada, pois combina a utilizao de
semivariogramas experimentais com um poderoso estimador, a Krigagem.
3.2 GEOESTATSTICA
O processo de modelagem geoestatstica melhor definido quando
segregado pelas etapas de: (1) Anlise das variveis regionalizadas; (2) Modelagem
de semivariogramas experimentais; (3) Validao e (4) Krigagem. Tais etapas so
descritas nas sees subsequentes.
-
43
3.2.1 Anlise das variveis regionalizadas
Quando um fenmeno distribui-se espacialmente e exibe certa estrutura
espacial, deve-se dizer que este um fenmeno regionalizado. Haver ento pontos
do espao com certas caractersticas referentes a este fenmeno. Diz-se ento que
essas variveis, que descrevem as caractersticas do fenmeno, so denominadas
variveis regionalizadas (MATHERON, 1971).
A teoria das variveis regionalizadas, desenvolvida por Matheron, diz que,
sendo a varivel regionalizada distribuda no espao (ou tempo), esta pode ser vista
como resultado de uma funo aleatria (processo aleatrio, campo aleatrio ou
processo estocstico). Esta teoria consolida o alicerce da Geoestatstica
(CAMARGO et al., 2001).
A Geoestatstica estuda o comportamento das variveis regionalizadas, que,
diferentemente das aleatrias, possuem uma distribuio e variao espacial com
continuidade aparente. A variao espacial de uma varivel regionalizada
composta de trs componentes (PEREIRA, 2011):
Componente estrutural no aleatria: associada a um valor mdio
constante ou uma tendncia constante;
Componente aleatria: componente espacialmente correlacionada;
Componente de rudo aleatrio: trata-se do erro residual da varivel
regionalizada.
A estrutura espacial de uma varivel regionalizada pode apresentar
comportamento diferente dependendo da direo de estudo (anisotropia). Dessa
forma, a anlise e modelagem da estrutura espacial de uma varivel regionalizada
tem como ferramenta primria o semivariograma (GONALVES et al., 2001; SOUZA et al., 2004).
A natureza das variveis regionalizadas pode ser de dois tipos: quantitativa e
qualitativa. As variveis quantitativas podem ser contnuas ou discretas. As variveis
qualitativas (categricas) podem ser subclassificadas em nominal e ordinal.
-
44
3.2.2 Modelagem de semivariogramas experimentais
O semivariograma condensa as informaes obtidas pelas variveis
regionalizadas por meio de uma representao grfica em que a ordenada a
varincia entre pares de observaes () e a abscissa a distncia entre estes pares (h).
A construo do semivariograma uma etapa da modelagem geoestatstica
que trata da anlise do comportamento estrutural das variveis regionalizadas. O
fenmeno espacial avaliado pela mensurao das varincias entre pares de
pontos. A varincia entre pontos () definida como a diferena quadrtica mdia entre observaes de uma varivel aleatria Z(x), separadas por uma distncia h
(Equao 3.1).
h = Z x Z(x + h) 2 (3.1)
Dessa forma, valores baixos indicam menor variabilidade, ou seja, maior
similaridade entre as observaes (MELLO, 2004). A funo do semivariograma
determinada pela metade da mdia das varincias entre os pontos:
h =1
2N Z x Z(x + h) 2
n(h)
i=1
(3.2)
Em que, N nmero total de observaes da amostra em cada lag (h).
Alguns autores utilizam a terminologia variograma para a modelagem
geoestatstica. O variograma definido como metade do semivariograma.
3.2.2.1 Parmetros para definio do semivariograma
A elaborao de semivariogramas demanda a definio dos seguintes
parmetros:
-
45
Distncia de corte (dcorte): limite superior para clculo do semivariograma. O valor usual metade da maior distncia entre pontos da amostra (LANDIM,
2004).
Lag: segmentos delimitados a fim de auxiliar o clculo das varincias entre
pares de pontos. So definidos os parmetros para o lag ( ):
o Tamanho do lag (h): distncia mdia entre amostras vizinhas;
o Nmero de lags (nlags): valor escolhido de maneira que: < para que haja representao completa das amostras;
o Tolerncia de lag (h): valores dentro dos limites (h + h) e (h - h) so considerados como pertencentes a h.
Direo angular (): direo adotada para elaborao do semivariograma que
melhor representa a distribuio espacial dos dados. Deste parmetro,
definem-se: o Tolerncia angular (): valores dentro dos limites ( + ) e ( - )
so considerados como pertencentes a . o Direo ortogonal ( + 90): direo ortogonal direo adotada para
elaborao do semivariograma.
3.2.2.2 Processo de obteno do semivariograma
Considera-se o lag de tamanho h com tolerncia h e a direo angular com tolerncia angular ; nlags o nmero de lags, N=[n1, n2, n3,... nN] o nmero total de amostras; e dcorte a distncia de corte.
1) O processo tem incio em um primeiro ponto n1 da amostra. Para toda observao distante h h e com ngulo entre deste ponto, calcula-se a diferena entre os valores dos pares (Figura 3.1);
-
46
Figura 3.1: Etapa 1) para processo de obteno do semivariograma experimental.
2) Refaz-se o passo 1) para todas as N amostras (Figura 3.2);
Figura 3.2: Etapa 2) para processo de obteno do semivariograma experimental.
3) Obtm-se a varincia para o lag de tamanho h. Este valor estar representado
por um dos pontos no semivariograma experimental, onde o eixo y representado
pela varincia e o eixo x pela distncia h (Figura 3.3);
Figura 3.3: Etapa 3) para processo de obteno do semivariograma experimental.
4) Repete-se os passos de 1) at 3) para os lags 2h, 3h, , nlags*h, afim de se obter
(2h), (3h), , (nlags*h), desde que os valores de distncia no excedam a distncia de corte (dcorte), conforme Figura 3.4.
-
47
Figura 3.4: Etapa 4) para processo de obteno do semivariograma experimental.
3.2.2.3 Interpretao grfica do semivariograma
Os parmetros grficos do semivariograma podem ser observados na Figura
3.5. O alcance ou amplitude (a) a distncia em que as amostras se apresentam
correlacionadas espacialmente. Desta distncia em diante, considera-se que no
existe mais dependncia espacial entre as amostras, porque a varincia entre pares de amostras no se altera com a distncia h (CAMARGO, 1998). O patamar
(C) o valor do eixo de varincia correspondente ao alcance (a).
medida que h tende a zero, a varincia se aproxima de um valor que revela a descontinuidade do semivariograma para distncias menores do que a
distncia mdia entre as amostras. Este valor definido como efeito pepita (Co). O
efeito pepita representa a incerteza pequena escala, como tambm a alta
variabilidade da varivel em distncias pequenas (SOARES, 2006). Podem ocorrer
tambm casos onde o efeito pepita seja nulo, ou seja, so identificadas varincias
nulas entre pontos a curtas distncias (h 0). Quando existente, esta
descontinuidade junto origem pode ocorrer devido a erros de medio ou
-
48
inconstncia de variveis (SOUSA e MUGE, 1990). O efeito pepita pode ser devido
: i) possvel existncia de erros de amostragem e ii) microrregionalizaes no
perceptveis escala de anlise.
O patamar (sill), observado na Figura 3.5 mede a varincia do espao amostral. O sill pode ser definido como a varincia terica dos dados ou, conforme Leung (2002) pode ser substitudo pela mdia entre as varincias experimentais
(mdia dos pontos de varincia ).
A contribuio (C1) a diferena entre o patamar (C) e o efeito pepita (C0).
Figura 3.5: Parmetros para interpretao grfica do semivariograma.
O comportamento espacial isotrpico da varivel (Figura 3.6 (a)) justifica a
escolha de um semivariograma omnidirecional (CORREIA, 2010). Caso contrrio,
para anisotropia (efeito de direo), deve-se examinar semivariogramas para
diversas direes de variabilidade espacial. Na anisotropia (Figura 3.6 (b)), a funo
do semivariograma varia de acordo com a direo (YAMAMOTO e LANDIM, 2013).
De modo contnuo, a variabilidade dos dados acontece em uma dada direo
particular (SOARES, 2006). A direo principal refere-se ao ngulo de mxima
variabilidade espacial dos dados, no exemplo de anisotropia da Figura 3.6 (b), a
direo principal visualizada como = - 45.
-
49
Isotropia Espacial (a) Anisotropia Espacial (b)
Figura 3.6: Representao de uma varivel espacial isotrpica (a) e anisotrpica (b).
A anisotropia representada por dois tipos principais: geomtrica e zonal.
Segundo Soares (2006), a anisotropia geomtrica um modelo no qual a
continuidade espacial, denunciada pelas amplitudes dos semivariogramas, varia da
direo de maior continuidade (amplitude) direo de menor amplitude,
perpendicular quela, de um modo gradual segundo a equao da elipse no plano
daquelas duas direes. Dessa forma, os semivariogramas de dados com estrutura
anisotrpica geomtrica se caracterizam pela existncia de um nico patamar e
amplitudes diferentes. No entanto, dados espaciais com anisotropia zonal
apresentam patamares diferentes, conforme direo analisada, mas todos sob um
mesmo alcance (YAMAMOTO e LANDIM, 2013).
3.2.2.4 Ajuste do semivariograma experimental
O ajuste de semivariogramas experimentais realizado de acordo com
modelos tericos, conforme Figura 3.7.
-
50
Cbico
Esfrico
Exponencial
Gaussiano
Pentaesfrico
Lei de Potncia
Efeito Senoidal
Figura 3.7: Exemplos de melhores ajustes para semivariogramas experimentais. Fonte: OLEA (2006).
Os modelos tericos podem ser para um semivariograma cbico, esfrico,
exponencial, gaussiano, pentaesfrico, lei de potncia e efeito senoidal. Embora as
sete curvas sejam convenientes a modelos de ajuste, as trs curvas mais utilizadas
na literatura so: exponencial, esfrica e gaussiana, cujas expresses esto
representadas nas Equaes 3.3, 3.4 e 3.5, respectivamente (OLEA, 2006).
- Exponencial:
Ex h = C 1 e3h a (3.3)
-
51
- Gaussiano:
G h = C 1 e3 h a
2
(3.4)
- Esfrico:
Sp h = C 3h2a
12 h
a
3 , 0 h < |a|
C, a |h|
(3.5)
A correta elaborao de semivariogramas experimentais e a qualidade do
ajuste so fundamentais para a etapa de Krigagem.
3.2.3 Validao
O processo de validao uma das etapas de obteno de um modelo que
represente de forma adequada a realidade. Kramer (1998) desenvolve em seu
estudo um esquema bsico que deve ser seguido durante o processo de escolha de
um modelo representativo mais adequado. A Figura 3.8 ilustra o esquema.
Figura 3.8: Fluxograma para abordagem bsica de calibrao e validao de modelos.
Fonte: Kramer,1998 (traduzido e adaptado).
-
52
O uso de dados adequados pesquisa pode parecer algo intrnseco, porm
no um passo trivial. Muitos fatores influenciam a adequabilidade dos dados, tais
como nmero de amostras destinadas ao conjunto de calibrao e validao,
preciso dos dados utilizados na calibrao. Entretanto, apenas aps realizar os
passos seguintes que muitas vezes problemas so evidenciados e por isso que,
de acordo com o esquema, sempre possvel o retorno ao passo inicial aps
aprimoramento de acordo com as necessidades.
Dos passos do esquema, a construo dos modelos o mais simples.
Atravs de adventos computacionais modernos, vrios pacotes computacionais
permitem a manipulao de uma grande quantidade de dados a fim de estabelecer
procedimentos que possibilitem a extrao de informaes relativas aos objetos de
estudo. Esta etapa nomeada calibrao e realizada utilizando uma parte dos
dados originais destinada apenas para esse propsito.
O passo seguinte consiste em testar os modelos implementados no passo
anterior. A melhor forma de averiguar se uma calibrao foi feita de maneira errnea
por meio de um conjunto de testes. Esse conjunto de testes, denominado
validao, realizado com a parcela de dados complementar utilizada na
calibrao. Para tal, considera-se que essas amostras de validao sejam
desconhecidas e, utilizando a calibrao prvia, tenta -se estimar seus valores. A
seguir, os valores previstos so comparados com os valores conhecidos para essas
amostras. Dessa forma, com o objetivo de avaliar a qualidade do mtodo
estabelecido, medidas de erro entre as previses e os valores observados so
mensuradas.
Posterior calibrao e validao dos modelos criados, pode-se escolher o
modelo que melhor atendeu s expectativas. Entretanto, este modelo deve ser
usado com cautela, pois contempla apenas fatores envolvidos nas condies
propostas. Isso quer dizer que, para o conjunto de dados em questo, o melhor
modelo escolhido pode ser uma boa representao da realidade nas condies de
tempo e espao estabelecidas. Dessa forma, o modelo deve ser usado com certo
-
53
nvel de ceticismo uma vez que o evento modelado possa ser submetido a diferentes
fatores externos dos estabelecidos inicialmente.
De maneira a suprimir eventuais inadequaes provenientes de novas
condies, a etapa seguinte estabelece que o modelo possa sofrer alteraes e
aprimoramentos a fim de se adaptar a possveis necessidades futuras.
Para a Geoestatstica, as etapas do esquema apresentado so igualmente
vlidas. Um dos fatores que influencia a adequabilidade dos dados, alm do nmero
de elementos da amostra, a correta escolha da varivel de estudo. A escolha dos
dados deve contemplar o uso de variveis regionalizadas, pois estas so
fundamentais no processo de construo de semivariogramas.
O processo de ajustes dos semivariogramas identifica a direo principal de
tendncia dos dados utilizados. Atravs do semivariograma relativo direo
principal, o modelo de calibrao estabelecido por meio do processo de Krigagem.
A verificao da qualidade da modelagem geoestatstica realizada por
validao. Nesta etapa, quantificado o erro e a varincia dos resduos a partir dos
valores observados e estimados nas coordenadas de valores conhecidos das
variveis. Para o tamanho do conjunto de validao, em geral utiliza-se um nmero
igual a 30% do total de elementos da amostra (LUZ, 2003).
Um procedimento de validao utilizado com frequncia na Geoestatstica o
teste do ponto fictcio (validao cruzada). Este teste consiste em subdividir o
conjunto de dados destinados validao em grupos de mesmo tamanho. Cada
grupo usado individualmente como teste, enquanto os outros so usados para
calibrao. Quando um grupo usado como teste, apesar de se conhecer os valores
a priori, assume-se esses valores como sendo desconhecidos. Ento, tenta-se estimar os valores deste grupo atravs da calibrao feita pelos grupos
complementares. O processo se repete at que todos os grupos tenham passado
pelo processo de validao. Esta tcnica interessante, pois, diferente da validao
convencional, evita a superposio dos conjuntos de teste. A validao cruzada
adotada por este trabalho define grupos unitrios.
-
54
3.2.4 Krigagem
A Krigagem um dos mtodos de estimativa utilizada na Geoestatstica. A
teoria foi desenvolvida a partir do trabalho do seu inventor Daniel G. Krige. Trata-se
de um processo de predio linear, pois suas estimativas so combinaes lineares
ponderadas por dados existentes. A Krigagem fornece, em geral, estimativas no
tendenciosas e com varincia mnima (LANDIM, 2003).
A Krigagem difere-se de outros interpoladores, pois parte do pressuposto
que pontos prximos no espao tendem a ter valores mais parecidos do que pontos
afastados. Esse pressuposto garantido por uma ponderao intrnseca ao mtodo.
A partir das curvas ajustadas de semivariogramas do espao amostral,
valores de efeito pepita (Co), contribuio (C1) e amplitude (a) so utilizados para a
definio de pesos W (ponderadores). A funo dos ponderadores a de ditar a
influncia dos dados amostrais na estimao de novos valores. O estimador de
Krigagem dado pela Equao 3.6.
Z(x0) = i Z(xi )n
i=1
(3.6)
O sistema de Krigagem constitudo por ponderadores com o objetivo de
conduzir estimativas a erros nulos (no enviesamento universal) e minimizao da
varincia (otimizao):
= G 1 M (3.7)
Os ponderadores do estimador de Krigagem resumem dois fatores: 1) o fator
de distncia estrutural entre amostras e o ponto a estimar; 2) o fator desagregao
originado pela matriz de covarincias entre as amostras, ou seja, quanto mais
correlacionadas estiverem, maior a redundncia e menor ser o peso individual na
construo do estimador (SOARES, 2006). A soluo para os ponderadores da
Krigagem Ordinria dada pelas representaes matriciais:
-
55
,
,
.
Os ponderadores de Krigagem so considerados dentro de uma rea de
atuao estabelecida por um elipside de raios determinados pelas amplitudes da
direo principal e ortogonal.
As formas mais usuais de Krigagem so a Krigagem Simples (KS) e a
Ordinria (KO). A KS utilizada quando a mdia assumida como estatisticamente
constante para toda rea de abrangncia das amostras. J a KO, por sua vez,
considera a mdia flutuante ou mvel por toda rea.
As varincias de Krigagem no so normalmente medidas de acurcia de
estimativa local. Para satisfazer esta necessidade, uma das solues a Krigagem
Indicativa (KI). Na KI, o enfoque passa a ser o de definir reas com maior ou menor
probabilidade de ocorrncia de um determinado evento. Diferentemente da KO,
onde o enfoque a estimao de um determinado valor. Neste trabalho, o
interpolador utilizado a KI, descrita na subseo seguinte.
3.2.4.1 Krigagem Indicativa (KI)
A KI consiste basicamente na aplicao da KO para variveis transformadas,
ou seja, a varivel resultante da aplicao da funo no linear f(x) =0 ou f(x)=1. O
conceito inicial foi apresentado como proposta para construo de uma funo de
distribuio de probabilidades acumuladas para estimativa de distribuies espaciais
(LANDIM e STURARO, 2002).
-
56
O primeiro passo da KI consiste em transformar os dados iniciais em
indicadores, isto , transformar valores que esto acima de um determinado valor de
corte em 0 e os que esto abaixo em 1.
ij(vc) 1, se vj vc 0, se vj >vc
Onde vc o nvel de corte e vj o valor observado. Os passos seguintes so
anlogos KO, porm aplicados aos dados transformados.
A frequncia acumulada dos valores observados abaixo do nvel de corte
representada por:
F(vc) =1n ijvc
n
j=1
(3.6)
De maneira anloga, a proporo de valores abaixo do nvel de corte pode
tambm ser considerada como a mdia ponderada dos indicadores situados na
vizinhana do local avaliado segundo:
F (vc) = wj ijvc
n
j=1
(3.7)
Sendo wj os pesos, ij os indicadores e vc o nvel de corte.
Em posse das frequncias acumuladas, da proporo de valores e de
semivariogramas experimentais, so calculadas as probabilidades para
determinados locais da rea amostral (LIMA et al., 2008).
No presente trabalho, a varivel objeto de estudo escolhida no uma
varivel contnua transformada de probabilidade, mas sim, uma varivel discreta
relativa escolha de modo motorizado, conforme descrito no captulo posterior.
-
57
3.2.5 Geoestatstica e Transportes
A proposta de utilizao da Geoestatstica na Engenharia de Transportes
ainda incipiente. Alguns trabalhos, como os de Braxmeier et al. (2005) e Du e Aultman-Hall (2006) deram incio aos estudos na rea de Engenharia de Trfego. O
conhecimento da anlise espacial de Geoestatstica, no campo de modelagem de
demanda por transportes, ainda requer muitos conhecimentos bsicos,
principalmente acerca das variveis, que encontram obstculos por envolverem
questes de comportamento humano. Alguns trabalhos provenientes do estudo da
Geoestatstica na rea de demanda por transportes so mencionados a seguir.
Teixeira (2003) relacionou aspectos socioeconmicos gerao de viagens
atravs da Geoestatstica. Neste trabalho, foi aplicada a Krigagem Ordinria para a
apresentao de uma metodologia para definir o zoneamento por reas
homogneas relacionadas ao planejamento de transportes por meio de aspectos
econmicos e de viagens da populao atravs dos setores censitrios.
Pitombo e Sousa (2009) aplicaram conceitos geoestatsticos para analisar
gerao de viagens urbanas por modo de transporte e motivo de viagem. No
trabalho, em que foram utilizadas as tcnicas de Krigagem Ordinria e um banco de
dados agregado por Zona de Trfego, estimou-se as variveis para 40.000 pontos.
No trabalho de Pitombo et al. (2010b) e Pitombo et al. (2014) tambm foram previstos dados de gerao de viagens de dados agregados pela Geoestatstica,
contudo, foi utilizada, alm da Krigagem Ordinria, a Krigagem com Deriva Externa.
Miura (2010) descreveu, em seu estudo, uma abordagem para estimao de
tempo de viagem, atravs de Krigagem Ordinria. Os resultados demonstraram que
as propriedades geoestatsticas de dados de tempo de viagem so to favorveis
quanto os dados de malha viria.
Costa et al. (2013) estimaram a probabilidade da escolha modal atravs da Geoestatstica por meio de dados desagregados, utilizando tcnicas de rvore de
Deciso e Krigagem Ordinria.
-
58
Pitombo et al. (2015) propuseram um mtodo de duas etapas para a estimao da escolha modal, atravs de um banco de dados domiciliar na cidade
de So Carlos. Foram selecionados os atributos que mais influenciam na
escolha modal por meio de rvore de Deciso e aps a comparao da eficcia da
rvore de Deciso com um Modelo Multinomial Logstico, realizou-se uma Krigagem
Ordinria para prever a escolha modal, a partir da localizao espacial.
Rocha (2014) analisou a gerao de viagens urbanas por transporte coletivo
atravs da Geoestatstica, por meio de Krigagens Ordinria e com Deriva Externa
em um banco de dados agregado referente Regio Metropolitana de Salvador.
Rocha et al. (2014) propuseram uma tentativa inicial de melhorar a modelagem Geoestatstica a partir de dados muito agregados, sabendo que , muitas
vezes, apenas estes esto disponibilizados e que, no entanto, a Geoestatstica
manipula melhor dados contnuos no espao.
-
59
4. MATERIAIS E MTODO
Uma vez que nos captulos 2 e 3 foi discutido o referencial terico necessrio para o entendimento das atividades deste trabalho, o capitulo 4 descreve os materiais e o mtodo. Foram utilizados como banco de dados a Pesquisa Origem/Destino da rea de estudo explanada a seguir e como pacotes computacionais: o IBM SPSS 22, o ESRI ArcGIS Platform 10.1, e o GeoMS 1.0. As etapas metodolgicas tambm so descritas, posteriormente aos materiais.
4.1 MATERIAIS
4.1.1 Banco de dados e rea de estudo
Os dados utilizados neste trabalho so referentes Pesquisa Origem/Destino
(O/D) realizada na Regio Metropolitana de So Paulo (RMSP) em 2007 pela
Companhia do Metropolitano de So Paulo. Na RMSP esto contidas 460 Zonas de
Trfego em 39 municpios (Figura 4.1). O Anexo 01 apresenta o mapa com a
denominao de todos os municpios da RMSP.
Figura 4.1: Regio Metropolitana de So Paulo e Zonas de Trfego.
Fonte: Metr (2007)
Municpio de So Paulo
-
60
A Pesquisa O/D fornece dados para o conhecimento da natureza dos
deslocamentos da populao, identificando as principais viagens dirias, conforme
motivo e modo de transporte. A lm disso, a Pesquisa O/D permite estabelecer
relaes quantitativas entre as viagens realizadas e outras variveis, como
caractersticas socioeconmicas da populao e aspectos de ocupao urbana, de
forma a estabelecer projees futuras das necessidades de viagens das pessoas.
Na Pesquisa O/D da RMSP de 2007 foram levantadas informaes de 30 mil
domiclios (Figura 4.2), escolhidos aleatoriamente e distribudos nas 460 Zonas de
Trfego na RMSP (Figura 4.1). A distncia entre o par de domiclios mais afastados
entre si de aproximadamente 142 quilmetros, enquanto a mdia entre os pares
de domiclios mais prximos de 146 metros.
Figura 4.2: Representao dos domiclios apurados na Pesquisa O/D da RMSP (2007).
A RMSP possui uma populao de 19,8 milhes de habitantes (IBGE, 2010)
na rea de 7.946 km. A Tabela 4.1 apresenta as informaes relacionadas aos
municpios da RMSP e aos domiclios da Pesquisa O/D. Observa-se que a maior
quantidade de domiclios entrevistados (Pesquisa O/D) est representada pelos
municpios de So Paulo, Osasco, Santo Andr, Mogi das Cruzes e Guarulhos.
Estes municpios so os municpios mais populosos, no entanto, estes no
condizem com as respectivas maiores reas ou densidades.
-
61
Tabela 4.1: Informaes dos municpios da RMSP Cd Municpio Domiclios* Habitantes** rea** km
Densidade hab/km
36 So Paulo 77,25% 11.253.503 1521,11 7.398 24 Osasco 2,52% 666.740 64,954 10.265 32 Santo Andre 2,08% 676.407 175,782 3.848 23 Mogi das Cruzes 2,04% 387.779 712,541 544 15 Guarulhos 2,03% 1.221.979 318,675 3.835 33 So Bernardo do Campo 1,54% 765.463 409,508 1.869 34 So Caetano do Sul 1,01% 149.263 15,331 9.736 2 Barueri 0,97% 240.749 65,701 3.664 22 Mau 0,86% 417.064 61,909 6.737 6 Carapicuiba 0,79% 369.584 34,546 10.698 27 Ribeiro Pires 0,71% 113.068 99,075 1.141 7 Cotia 0,66% 201.150 323,994 621 37 Suzano 0,65% 262.480 206,236 1.273 8 Diadema 0,61% 386.089 30,756 12.553 9 Embu das Artes 0,55% 240.230 70,398 3.412 18 Itaquaquecetuba 0,48% 321.770 82,622 3.894 19 Jandira 0,42% 108.344 17,449 6.209 11 Ferraz de Vasconcelos 0,39% 168.306 29,564 5.693 26 Po 0,39% 106.013 17,264 6.141 28 Rio Grande da Serra 0,38% 43.974 36,341 1.210 38 Taboo da Serra 0,38% 244.528 20,388 11.994 10 Embu-Guacu 0,33% 62.769 155,641 403 5 Cajamar 0,30% 64.114 131,386 488 17 Itapevi 0,29% 200.769 82,658 2.429 31 Santana de Parnaiba 0,26% 108.813 179,949 605 12 Francisco Morato 0,23% 154.472 49,001 3.152 13 Franco da Rocha 0,23% 131.604 132,775 991 1 Aruj 0,21% 74.905 96,167 779 39 Vargem Grande Paulista 0,21% 42.997 42,489 1.012 16 Itapecerica da Serra 0,17% 152.614 150,742 1.012 21 Mairipor 0,16% 80.956 320,697 252 35 So Lourenco da Serra 0,16% 13.973 186,456 75 30 Santa Isabel 0,15% 50.453 363,332 139 3 Biritiba-Mirim 0,14% 28.575 317,406 90 25 Pirapora do Bom Jesus 0,14% 15.733 108,489 145 20 Juquitiba 0,13% 28.737 522,169 55 29 Salesopolis 0,09% 15.635 424,997 37 14 Guararema 0,07% 25.844 270,816 95 4 Caieiras 0,02% 86.529 97,642 886
*Informao obtida pela proporo de domiclios entrevistados pela Pesquisa O/D (2007). **Informao obtida pelo censo 2010 (IBGE). Obs: Em verde esto representados os cinco menores valores para cada atributo e em vermelho os cinco maiores valores.
-
62
4.1.2 Software
Os resultados obtidos neste trabalho de mestrado valeram-se de um conjunto
de ferramentas computacionais, que auxiliaram em diversos campos, tais como:
anlises estatsticas tradicionais, anlise espacial e modelagem geoestatstica
aplicadas ao campo da Engenharia de Transportes.
No mbito das estatsticas tradicionais, clculos como o de regresso e testes
de qualidade (chi-quadrado, taxa de acertos) foram realizados atravs do software IBM SPSS Statistics 22.
Com relao anlise espacial, os sistemas de informao geogrfica (SIGs)
provm ferramental necessrio para o estabelecimento da visualizao de dados por
meio de mapas. A gerao de superfcie espacial foi realizada pelo software ESRI ArcGIS Platform, verso 10.1.
No campo da Geoestatstica, as etapas de visualizao estatstica dos
dados, gerao de semivariogramas experimentais, ajuste por curvas tericas,
interpolao por Krigagem e validao cruzada (teste do ponto fictcio) foram obtidas
atravs do software GeoMS 1.0, desenvolvido pelo Centro de Modelizao de Reservatrios Petrolferos (CMRP-Portugal).
4.2 MTODO
O processo metodolgico adotado se baseia nas etapas ilustradas na Figura
4.3 e descritas na sequncia.
Figura 4.3: Esquema simplificado do mtodo proposto.
-
63
4.1.1 Tratamento e visualizao de dados
Os dados desagregados originalmente apresentavam 196.698 registros, em
que cada registro representava uma viagem da Pesquisa Origem/Destino. Em se
tratando de um estudo espacial, torna-se necessrio que as informaes estejam
vinculadas a coordenadas geogrficas. Como o estudo das viagens isoladas no
representa um espao, o mtodo visou transformao do banco de dados
relacionados a viagens para informaes atreladas aos domiclios.
Por se tratar de um banco de dados referente Pesquisa O/D, observou-se
que havia casos em que coordenadas geogrficas estavam associadas a mais de
um domiclio. Como uma das suposies da Geoestatstica sugere que cada
elemento do espao tenha representao nica, houve necessidade da adoo de
um valor singular para cada elemento de espao. Dessa forma, para cada caso de
coordenada geogrfica repetida, sorteou-se (atravs de pseudoaleatoriedade
baseada em semente temporal) um domiclio para sua representao espacial.
As informaes de interesse para este projeto esto descritas na Tabela 4.2,
juntamente com as suas naturezas. Originalmente, a Pesquisa O/D indica os modos
realizados para cada viagem. Neste trabalho, como cada linha de viagem tem suas
informaes compiladas em informaes/domiclios, a varivel de modo de viagem de cada linha do banco de dados foi transformada em variveis de proporo (%) de viagens por modo.
Os modos de transporte foram classificados como: Transporte Individual
Motorizado, Transporte no Motorizado e Transporte Pblico. O Transporte
Individual Motorizado inclui viagens em que o indivduo dirige automvel ou
motocicleta. O Transporte no Motorizado refere-se ao uso de bicicleta e modo a p.
O Transporte Pblico inclui viagens por nibus do municpio de So Paulo, nibus
de outros municpios, nibus metropolitano, micronibus do municpio de So Paulo,
micronibus de outros municpios, micronibus metropolitano, metr e trem.
-
64
Tabela 4.2: Informaes utilizadas da Pesquisa O/D RMSP 2007. Informaes por domiclio Natureza Coordenada geogrfica x (*) UTM
Coordenada geogrfica y (*) UTM Zona Qualitativa
Municpio Qualitativa
Nmero de pessoas (**) Quantitativa Discreta Critrio de renda (**) Qualitativa
Quantidade de automveis (**) Quantitativa Discreta
Quantidade de motocicletas (**) Quantitativa Discreta Quantidade de bicicletas (**) Quantitativa Discreta
Nmero total de viagens (*) (**) Quantitativa Discreta
% de viagens por transporte individual motorizado (*) Quantitativa Cont nua % de viagens por transporte no motorizado (*) Quantitativa Cont nua
% de viagens por transporte pblico (*) Quantitativa Cont nua
Distncia total de viagens (*) (**) Quantitativa Cont nua Distncia por transporte individual motorizado (*) (**) Quantitativa Cont nua
Distncia por transporte no motorizado (*) (**) Quantitativa Cont nua
Distncia por transporte pblico (*) (**) Quantitativa Cont nua Preferncia por modo motorizado (*) (**) Categrica Dicotmica
(*) Varivel avaliada para a determinao da varivel objeto de estudo na anlise de estrutura espacial. (**) Varivel utilizada para a modelagem tradicional.
A varivel preferncia por modo motorizado originalmente no consta nos dados da Pesquisa O/D. Esta varivel foi inserida com o intuito de prover
informaes complementares ao estudo e suavizar possveis efeitos de
microrregionalizaes inerentes s preferncias modais/domiclio, principalmente no
caso de viagens no motorizadas. Dessa forma, para esta varivel, foi necessrio
um tratamento adicional. Este consistiu da transformao da varivel de proporo de viagens por transporte pblico e por transporte individual motorizado em uma varivel categrica, em que:
Proporo de viagens por Transporte Pblico >Transporte Individual Motorizado 1
Proporo de viagens por Transporte Individual Motorizado > Transporte Pblico 0
Esta varivel caracteriza a preferncia entre o modo de transporte pblico e
modo individual motorizado nos domiclios da RMSP. Portanto, foram eliminados os
-
65
casos em que a proporo de viagens por transporte pblico foi igual proporo por transporte individual motorizado. Devido a esta etapa de eliminao, esta varivel tem um nmero de registros menores do que as demais variveis.
A Tabela 4.3 apresenta a caracterizao das variveis quantitativas atravs
das medidas descritivas de mdias, desvios padro, modas, mnimos e mximos.
Tabela 4.3: Medidas descritivas para as variveis quantitativas.
Informaes por domiclio mdia desvio padro moda mnimo mximo
Nmero de pessoas 3,3 1,6 3 1 24 Quantidade de automveis 0,9 0,9 1 0 8 Quantidade de motocicletas 0,1 0,3 0 0 9
Quantidade de bicicletas 0,5 0,9 0 0 12 Nmero total de viagens 6,8 4,6 2 1 68
% de viagens por transporte individual motorizado 27% 32% 0% 0% 100% % de viagens por transporte no motorizado 17% 24% 0% 0% 100%
% de viagens por transporte pblico 33% 32% 0% 0% 100% Distncia total de viagens (km) 38,4 34,5 7,2 0,0016 427,1
Distncia por transporte individual motorizado (km) 12,1 19,9 0,0 0,0000 273,0 Distncia por transporte no motorizado (km) 2,0 7,5 0,0 0,0000 124,5
Distncia por transporte pblico (km) 19,8 27,5 0,0 0,0000 423,9
A Tabela 4.4 apresenta o percentual de observaes para a caracterizao
da varivel qualitativa critrio de renda .
Tabela 4.4: Percentual de observaes da varivel critrio de renda. Critrio de Renda (Classes)
1 (A1) 2 (A2) 3 (B1) 4 (B2) 5 (C1) 6 (C2) 7 (D) 8 (E)
3,0% 11,7% 17,3% 24,3% 23,2% 14,4% 5,7% 0,4%
A Tabela 4.5 apresenta o percentual de observaes para a varivel
categrica dicotmica preferncia por modo motorizado .
Tabela 4.5: Percentual de observaes da varivel preferncia por modo motorizado. Preferncia por modo motorizado
0 1 Transporte individual motorizado Transporte pblico
44,8% 55,3%
-
66
Devido ao tratamento diferenciado entre a varivel de preferncia por modo motorizado e as demais, este trabalho possui uma amostra considerando a varivel dicotmica (preferncia por modo motorizado) e uma amostra considerando as demais variveis, cujo nmero de registros superior ao da primeira.
4.1.2 Escolha da varivel objeto de estudo
A escolha da varivel objeto de estudo se deu pela anlise univariada dos
dados. Atentou-se para a escolha de uma varivel que se adequasse melhor
estatstica espacial.
Com o objetivo de analisar o comportamento da varivel e as tendncias
espaciais, a elaborao de mapas temticos pontuais para as nove variveis no se
mostra como alternativa vivel, pois a grande quantidade de pontos (domiclios) faz
com que as informaes se sobreponham. Dessa forma, a anlise univariada para
cada caso especfico de varivel foi considerada.
As nove variveis relativas demanda de transporte analisadas foram:
proporo de viagens por modo de transporte (3), distncia total de viagens (1), total de viagens por domiclio (1), distncia de viagens por modo de transporte (3) e preferncia por modo motorizado (1).
4.1.3 Modelagem de demanda por transportes
Posterior definio da varivel de demanda mais adequada s suposies
de anlise espacial, os dados passaram pelas etapas de modelagem geoestatstica
e de modelagem tradicional, com o intuito de obter as estimaes das variveis para
coordenadas de valores conhecidos. Assim, tornou-se possvel a realizao de
anlises comparativas. Os processos de modelagem da varivel de demanda
escolhida (objeto de estudo) podem ser observados na Figura 4.4.
-
67
Figura 4.4: Processo de calibrao/validao pela abordagem geoestat stica e tradicional.
A amostra foi separada em duas partes: a primeira parte (70%), reservada
para calibrao dos dados e a segunda (30%), para validao. Tais propores de
subamostras foram utilizadas para ambas as abordagens. A escolha da razo 70/30
foi emprica. No entanto, no h uma proporo padro para estipular os tamanhos
dos conjuntos de calibrao e validao. Valores comuns para a razo so: 60/40,
70/30, 80/20. importante salientar que a diviso deve ser feita de maneira
randmica e a maior proporo deve ser para o conjunto de calibrao.
4.1.3.1 Modelagem geoestatstica
O processo de modelagem geoestatstica segue os passos de: i) Anlise da
estrutura espacial, ii) Krigagem, iii) Validao.
i) Anlise da estrutura espacial
A anlise da estrutura espacial realizada pela elaborao de
semivariogramas experimentais e posterior ajuste por curvas tericas (esfrica,
exponencial, gaussiana), o qual permite a identificao da direo principal.
Com o objetivo de analisar as tendncias espaciais, a elaborao de mapas
temticos pontuais no se mostra como alternativa vivel, pois a grande quantidade
-
68
de pontos (domiclios) faz com que as informaes se sobreponham. Assim sendo,
semivariogramas experimentais foram calculados. Os semivariogramas demonstram
graficamente a variabilidade espacial, alm disso, esta informao torna-se
mensurvel.
Calculou-se o semivariograma para o caso omnidirecional, considerando,
dessa forma, uma tolerncia de 180. Entretanto, uma abordagem exclusivamente
omnidirecional seria vlida apenas para casos de isotropia. Os casos de anisotropia
demandam a definio da direo preferencial dos dados. Considerando a
possibilidade de anisotropia da varivel, os semivariogramas foram obtidos tambm
para ngulos de teste variando de 15 e adotando uma tolerncia de 1.
O clculo dos semivariogramas teve incio com a escolha do tamanho de lag
para cada uma das direes realizadas no estudo. Utilizou-se para o caso
omnidirecional um tamanho de lag obtido pela mdia da distncia euclidiana entre
vizinhos prximos considerando todas as direes angulares. Para os demais
semivariogramas, uti lizou-se a mdia da distncia euclidiana para cada uma das
direes angulares estudadas.
Posteriormente elaborao, foram investigados os parmetros dos
semivariogramas experimentais. A investigao intencionou a identi ficao de
caractersticas para semivariogramas com indcios de um bom ajuste:
Menor efeito pepita;
Adequabilidade a curvas tericas (esfrica, exponencial, gaussiana);
Maiores valores para a razo de amplitude entre os pares de direo.
Quando satisfeitos, estes parmetros indicam semivariogramas com maiores
tendncias espaciais. Por meio desta anlise geoestatstica, os resultados
apontaram a direo principal de estudo.
A partir de todos os semivariogramas, avaliou-se a estrutura espacial para
realizao dos passos de ajuste e definio dos parmetros grficos. O patamar foi