universidade federal do rio de janeiro uso de big …use of big data to further sustainable...
TRANSCRIPT
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO
USO DE BIG DATA NA PROMOÇÃO DA MOBILIDADE SUSTENTÁVEL:
APLICAÇÃO DA ANÁLISE DE COMPONENTES PRINCIPAIS PARA
ESTIMAÇÃO DE PADRÕES DE COMPORTAMENTO DE USUÁRIOS DO
APLICATIVO BIKLIO
EDUARDO RAID RODRIGUES
2020
USO DE BIG DATA NA PROMOÇÃO DA MOBILIDADE SUSTENTÁVEL:
APLICAÇÃO DA ANÁLISE DE COMPONENTES PRINCIPAIS PARA
ESTIMAÇÃO DE PADRÕES DE COMPORTAMENTO DE USUÁRIOS DO
APLICATIVO BIKLIO
EDUARDO RAID RODRIGUES
Projeto de Graduação apresentado ao curso de Engenharia Civil da Escola Politécnica, Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários à obtenção do título de Engenheiro.
Orientador: Matheus Henrique de Sousa Oliveira
RIO DE JANEIRO
Março de 2020
USO DE BIG DATA NA PROMOÇÃO DA MOBILIDADE SUSTENTÁVEL:
APLICAÇÃO DA ANÁLISE DE COMPONENTES PRINCIPAIS PARA
ESTIMAÇÃO DE PADRÕES DE COMPORTAMENTO DE USUÁRIOS DO
APLICATIVO BIKLIO
Eduardo Raid Rodrigues PROJETO DE GRADUAÇÃO SUBMETIDO AO CORPO DOCENTE DO CURSO
DE ENGENHARIA CIVIL DA ESCOLA POLITÉCNICA DA UNIVERSIDADE
FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS
NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE ENGENHEIRO CIVIL.
Examinado por:
________________________________________________ Prof. Matheus Henrique de Sousa Oliveira, D.Sc.
________________________________________________ Prof. Glaydston Mattos Ribeiro, D.Sc.
________________________________________________ Prof. Ricardo de Souza Alencar, M.Sc.
RIO DE JANEIRO, RJ - BRASIL MARÇO de 2020
Rodrigues, Eduardo Raid Uso de Big Data na promoção da mobilidade sustentável:
Aplicação da análise de componentes principais para
estimação de padrões de comportamento de usuários do
aplicativo BIKLIO / Eduardo Raid Rodrigues – Rio de Janeiro:
UFRJ/Escola Politécnica, 2020.
XII, 79 p.: il.; 29,7 cm. Orientador: Matheus Henrique de Sousa Oliveira
Projeto de Graduação – UFRJ/ Escola Politécnica/ Curso de Engenharia Civil, 2019.
Referências Bibliográficas: p. 74-79 1. Introdução 2. Mobilidade e Desenvolvimento Sustentável 3. Transformando Dados em Informação 4. Análise Multivariada 5. Método e Aplicação 6. Considerações Finais I. Oliveira, Matheus Henrique de Sousa II. Universidade Federal do Rio de Janeiro, Escola Politécnica, Curso de Engenharia Civil. III. Título
AGRADECIMENTOS
Agradeço aos meus pais, por tudo. Ao meu irmão, que sempre foi referência. E às
minhas avós, pelo amor e carinho.
Agradeço aos meus grandes amigos da vida, que sempre me apoiaram, e às
amizades que construí dentro da faculdade.
Agradeço a UFRJ pelo ensino de ponta, pela ampliação da minha visão de mundo
e pelas oportunidades que me proporcionou.
Por fim, agradeço a todos os meus professores e mestres, em especial ao Matheus,
meu orientador, que comprou essa briga comigo.
Resumo do Projeto de Graduação apresentado à Escola Politécnica/ UFRJ como parte
dos requisitos necessários para a obtenção do grau de Engenheiro Civil.
USO DE BIG DATA NA PROMOÇÃO DA MOBILIDADE SUSTENTÁVEL:
APLICAÇÃO DA ANÁLISE DE COMPONENTES PRINCIPAIS PARA
ESTIMAÇÃO DE PADRÕES DE COMPORTAMENTO DE USUÁRIOS DO
APLICATIVO BIKLIO
Eduardo Raid Rodrigues
Março de 2020
Orientador: Matheus Henrique de Sousa Oliveira
Curso: Engenharia Civil
A preocupação mundial com a sustentabilidade reflete a necessidade de se pensar em
políticas e soluções de transporte de forma articulada com o uso do solo e que levem em
conta aspectos sociais, ambientais e econômicos. Principalmente em países em
desenvolvimento como o Brasil, busca-se caminhos para reduzir as externalidades
negativas associadas ao acelerado processo de urbanização das cidades e do crescimento
excessivo da frota de veículos individuais motorizados. A transformação dessa realidade
ocorre a medida em que a mobilidade urbana é orientada ao uso de modos menos
agressivos ambientalmente e que melhor aproveitam os recursos e a infraestrutura urbana
existente, além de estar alinhada aos princípios de integração e equidade. Atualmente, o
uso da tecnologia da informação e comunicação permite que muitos dos dados gerados
pelas cidades sejam transformados em informação útil, tanto para agentes públicos como
para serviços privados. Diante desse contexto, este trabalho buscou aplicar a técnica da
Análise de Componentes Principais a uma base de dados de um aplicativo que incentiva
a mobilidade por bicicleta, o BIKLIO. A partir dos resultados, constatou-se que, com
poucos componentes principais, era possível explicar grande parte da rotina diária de
deslocamento dos usuários do aplicativo.
Palavras-chave: Análise de Componentes Principais; mobilidade sustentável;
cidades inteligentes; bicicleta
Abstract of Undergraduate Project presented to POLI/UFRJ as a partial fulfillment of the
requirements for the degree of Civil Engineer.
USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF
PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE
OF BIKLIO USERS.
Eduardo Raid Rodrigues
March 2020
Adviser: Matheus Henrique de Sousa Oliveira
Course: Civil Engineering
The global concern about sustainability highlights the necessity of regarding the
integrated approach of transport solutions and public policies and the use of land, also
considering social, environmental and economic issues. Particularly in developing
countries like Brazil, there is an effort in finding ways to reduce the negatives externalities
associated to the accelerated urbanization process and the ingress of the individual car
fleet. This transition occurs when urban mobility is oriented to transportation modes that
are environmentally friendly and use available resources and existing infrastructure in a
more efficient way, also regarding social equality and integration principles. Nowadays,
the information and communication technology plays an important role in transforming
data generated by the cities in useful information for public and private agents. In this
scenario, it is applied the Principle Component Analysis on the data base of an application
that rewards bike commuting, BIKLIO. Out of the values found, it was verified that a few
principle components accounted to a high percentage of the total variance of the data and,
thus, a structure in the user’s routine could be identified.
Keywords: Principle Component Analysis; sustainable mobility; intelligent cities; bike
transit
SUMÁRIO
1 INTRODUÇÃO .................................................................................................. 1
APRESENTAÇÃO DO TEMA E JUSTIFICATIVA ..................................... 1
OBJETIVO ................................................................................................... 2
METODOLOGIA ......................................................................................... 3
ESTRUTURA DO TRABALHO ................................................................... 3
2 MOBILIDADE E DESENVOLVIMENTO SUSTENTÁVEL .......................... 5
MOBILIDADE URBANA SUSTENTÁVEL ................................................ 6
2.1.1 Sustentabilidade ambiental ......................................................................... 7
2.1.2 Sustentabilidade econômica ........................................................................ 8
2.1.3 Justiça Social.............................................................................................. 9
ATRIBUTOS DA MOBILIDADE SUSTENTÁVEL....................................10
BICICLETA E ACESSIBILIDADE .............................................................12
2.3.1 Benefícios da bicicleta .............................................................................. 14
2.3.2 Componentes de integração do modo cicloviário ...................................... 16
2.3.2.1 Infraestrutura urbana e fatores culturais ............................................16
2.3.2.2 Sistema de compartilhamento de bicicletas .......................................17
2.3.2.3 Estacionamento de bicicletas nos terminais de transporte ..................17
2.3.2.4 Integração do planejamento e operação .............................................17
2.3.2.5 Integração de informações ................................................................18
2.3.2.6 Regulamentação e uso de bicicletas a bordo ......................................18
2.3.3 Impacto da integração da bicicleta com transportes de massa.................... 18
3 TRANSFORMADO DADOS EM INFORMAÇÃO .........................................21
CIDADES INTELIGENTES ........................................................................22
3.1.1 Digitalização e Cidades inteligentes ......................................................... 24
SISTEMAS INELIGENTES DE SERVIÇOS ...............................................26
ANÁLISE DE BIG DATA E A AMOBILIDADE URBANA ........................28
3.3.1 O Aplicativo BIKLIO ............................................................................... 30
4 ANÁLISE MULTIVARIADA ...........................................................................33
CONCEITO DA ÁLGEBRA MATRICIAL ..................................................33
4.1.1 Autovalores .............................................................................................. 33
4.1.2 Autovetores .............................................................................................. 34
4.1.3 Matrizes de covariância e correlação ........................................................ 35
4.1.3.1 Matriz de Covariância.......................................................................35
4.1.3.2 Matriz de Correlação ........................................................................36
TÉCNICAS MULTIVARIADAS .................................................................37
ANÁLISE DE COMPONENTES PRINCIPAIS ...........................................40
4.3.1 Definição ................................................................................................. 40
4.3.2 Interpretação algébrica ............................................................................. 41
4.3.3 Interpretação geométrica ......................................................................... 43
4.3.4 Matriz de covariância e matriz de correlação ............................................ 44
4.3.5 Quantos componentes principais escolher? ............................................... 46
4.3.5.1 Porcentagem acumulada do total de variância ...................................46
4.3.5.2 Valor da variância dos componentes principais .................................47
ANÁLISE FATORIAL ................................................................................47
COMPARAÇÃO ENTRE MÉTODOS .........................................................49
5 MÉTODO E APLICAÇÃO ...............................................................................51
BANCO DE DADOS ...................................................................................51
5.1.1 Tratamento dos dados ............................................................................... 52
MODELO PROPOSTO ................................................................................55
5.2.1 Análise de componentes principais no modelo proposto ........................... 55
RESULTADOS OBTIDOS NA MODELAGEM E ANÁLISES ...................56
5.3.1 Indivíduo .................................................................................................. 56
5.3.1.1 Componentes principais ....................................................................57
5.3.1.2 Variância ..........................................................................................59
5.3.2 Cidade de Lisboa ...................................................................................... 60
5.3.2.1 Componentes principais ....................................................................60
5.3.2.2 Variância ..........................................................................................63
5.3.3 Comparação de resultados ........................................................................ 64
6 CONSIDERAÇÕES FINAIS .............................................................................66
CONCLUSÃO .............................................................................................66
PESQUISAS FUTURAS ..............................................................................67
1 1 INTRODUÇÃO
APRESENTAÇÃO DO TEMA E JUSTIFICATIVA
Desde meados do século passado, muitas cidades brasileiras passaram a apresentar
sistemas de mobilidade de baixa qualidade e de alto custo, com impactos negativos na
vida das pessoas e nos custos econômicos e ambientais para a sociedade
(VASCONCELLOS, 2011).
Esse processo de degradação da mobilidade urbana foi causado, principalmente,
por causa do aumento do transporte individual motorizado, pelo acelerado processo de
urbanização e pela falta de planejamento público. Como consequência, houve forte
crescimento dos índices de acidentes de trânsito e congestionamentos, além do aumento
da quantidade de emissão de gases poluentes no ambiente. E não há evidências de que
este quadro se altere no futuro próximo, já que os incentivos à produção, venda e
utilização de veículos privados prevalecem sobre medidas de estímulo ao uso do
transporte público e do transporte não motorizado (CARVALHO, 2016).
Diante desse contexto, o debate sobre os principais atributos que caracterizariam
um modelo de mobilidade urbana sustentável e os caminhos e os princípios a se seguirem
para viabilizá-lo se tornou cada vez mais forte e relevante para o desenvolvimento das
cidades. Segundo Mello (2015), pensar na mobilidade sustentável requer a consideração
de três dimensões: social, ambiental e econômica.
Nesse cenário, as políticas de incentivo ao uso da bicicleta, seja para viagens de
curta e média distância ou para integração com meios coletivos de transporte, são
importantes para a transição do comportamento dos indivíduos no caminho de reduzir as
externalidades negativas associadas ao uso excessivo de automóveis nas cidades
(MELLO, 2015).
Discutir as cidades, então, torna-se um tema crítico e de grande importância,
particularmente com vistas ao cenário futuro de crescimento populacional nos centros
urbanos (BERNARDES et al., 2017). A busca por soluções inteligentes para o
enfrentamento dos desafios relacionados forte urbanização e seus impactos traz o
conceito de Cidades Inteligentes (Smart City) (ANDRADE et al., 2016), que está
diretamente relacionado à aplicação da tecnologia da informação e comunicação na
solução de problemas, melhora de serviços, otimização de recursos e adaptação da
infraestrutura existente nas cidades.
2 Com as cidades ao redor do mundo coletando constantemente dados da vida
urbana, o grande desafio, atualmente, é saber como processar e analisá-los de forma que
seja possível, a partir deles, produzir conhecimento e informação útil. No âmbito das
análises de Big Data, avanços tecnológicos ligados ao desenvolvimento de hardwares e
softwares vêm nos ajudando a aplicar técnicas de análise complexas, especialmente
quando envolvem problemas de múltiplas variáveis.
Para o desenvolvimento desse trabalho, foi adotada a premissa de que apesar de
observações discretas do comportamento de um indivíduo parecerem aleatórias,
tipicamente elas se repetem de forma que podem ser identificadas rotinas na vida de
qualquer pessoa. Para muitos, os dias de semana são aqueles em que se deve acordar cedo
para o trabalho, realizar uma pausa para o almoço e voltar no final do dia para casa. As
rotinas de finais de semanas são caracterizadas, muitas vezes, por passeio de lazer durante
o dia, saída com amigos em um sábado a noite ou um almoço de domingo em família
(EAGLE e PENTLAND, 2009).
O cerne da pesquisa está, portanto, na exploração e investigação da base de dados
de um aplicativo de mobilidade sustentável, o BIKLIO. Este aplicativo tem como
principal objetivo criar uma rede de conexões entre ciclistas de uma cidade e
estabelecimentos comerciais parceiros, que oferecem, pela plataforma, benefícios aos
usuários que optam por se deslocar de bicicleta. A base usada contém registros de
utilização do aplicativo de todos os usuários da cidade de Lisboa desde o lançamento do
aplicativo, em setembro de 2017.
A análise dos dados foi feita através da utilização de uma técnica de análise
multivariada conhecida por Análise de Componentes Principais, cujo princípio está na
redução dimensional de uma base complexa por meio da definição de novas variáveis
que, em menor número, explicam boa parte da variância original dos dados.
OBJETIVO
O objetivo primário do trabalho é conduzir um exemplo de aplicação de uma
técnica de análise multivariada (a Análise de Componentes Principais) a partir da
modelagem de dados de um aplicativo de mobilidade para observar a existência de
padrões de comportamento entre usuários.
3 Além disso, o presente trabalho visa aprimorar a bibliografia existente, sobretudo
nas pesquisas brasileiras, sobre o tema da mobilidade urbana, explorando a importância
da mobilidade ativa como via para o desenvolvimento sustentável.
Também faz parte do escopo do objetivo do trabalho expor a importância da
tecnologia da informação na geração de conhecimento e consolidação de cidades
inteligentes.
METODOLOGIA
Inicialmente, fez-se uma revisão bibliográfica a respeito dos conceitos da
mobilidade urbana sustentável, das atribuições da mobilidade por bicicleta e da aplicação
da análise de dados em diversos sistemas.
Em seguida, consultou-se a literatura disponível acerca da técnica de análise
multivariada base para a modelagem pretendida: Análise de Componentes Principais
(ACP).
Procedeu-se à modelagem em si, adotando como ponto de partida o tratamento e
estruturação dos dados provenientes de uma base de registros de viagens de um aplicativo
de mobilidade, o BIKLIO. Com o modelo pronto, foi aplicada a técnica multivariada e
extraídos os resultados em dois diferentes cenários: (i) utilizando-se os registros de
viagens de um único indivíduo e (ii) fazendo a análise dos registros de todos os usuários
do aplicativo na cidade de Lisboa. Os resultados foram interpretados individualmente e,
também, de forma comparativa.
ESTRUTURA DO TRABALHO
Neste trabalho, o primeiro capítulo limitou-se a introduzir e inteirar o leitor a
respeito do tema a ser desenvolvido, expondo a justificativa, objetivo, metodologia, e
como o trabalho foi estruturado.
A partir do segundo capítulo, procedeu-se com o desenvolvimento do tema a partir
da literatura existente. Foram apresentados conceitos que englobam a mobilidade
sustentável e os fatores que justificam a inserção e a importância do uso das bicicletas em
políticas públicas.
O terceiro capítulo trata da análise de Big Data como um dos pilares para o
surgimento de cidades inteligentes. Neste capítulo, também são conceituados os sistemas
4 inteligentes de serviços e elencados suas possíveis categorizações, além de tratar da
análise de Big Data em serviços de mobilidade.
O quarto capítulo aborda alguns conceitos da álgebra matricial importantes para o
entendimento da ferramenta utilizada na análise do modelo proposto. Em seguida, é
apresentada a técnica da Análise de Componentes Principais como ferramenta para achar
padrões em modelos com múltiplas variáveis correlacionadas.
No quinto capítulo, os resultados obtidos com as modelagens foram apresentados,
tanto para a aplicação em uma base de um único usuário quanto para a base de registros
da cidade de Lisboa. Eles foram investigados individualmente e comparados entre si
posteriormente.
No sexto e último capítulo, foram discutidas as conclusões obtidas, além de
sugestões para futuros desenvolvimentos do tema.
Por fim, são apresentadas as referências bibliográficas, ordenadas
alfabeticamente.
5 2 MOBILIDADE E DESENVOLVIMENTO SUSTENTÁVEL
Tornar as cidades mais inclusivas e sustentáveis até 2030 é um dos desafios do
Brasil e de outros 192 países que se comprometeram, em 2015, com os Objetivos de
Desenvolvimento Sustentável da ONU (ONU, 2019). Segundo Mello (2015), o termo
sustentabilidade tornou-se palavra chave nas últimas décadas, o que reflete a preocupação
mundial a respeito do tema.
O conceito mais amplamente aceito para a sustentabilidade é o de um padrão de
desenvolvimento que atenda às necessidades do presente sem comprometer o
atendimento das gerações futuras (WCED, 1987). Nesse âmbito, é reconhecida a
existência de três dimensões principais: econômica, social e ambiental (MELLO, 2015).
Esta tridimensionalidade faz parte de um processo evolutivo, com ênfase inicial
puramente econômica, seguida da inclusão de aspectos sociais, até a abordagem de
aspectos ambientais mais recentemente (LEMOS, 2011).
Na engenharia de transportes, o desafio para promover a sustentabilidade está
inteiramente relacionado ao desenvolvimento e promoção da mobilidade sustentável
(MELLO, 2015).
A mobilidade é parte vital do desenvolvimento das cidades e, portanto, as soluções
de planejamento da mobilidade urbana devem levar em consideração a relevância das três
dimensões, caso contrário pode haver prejuízo a qualidade de vida da população. Fato é
que, ao longo dos últimos anos, aumentou-se o reconhecimento dos impactos causados
pelo uso excessivo dos automóveis nas cidades, principalmente em termos de poluição
sonora, congestionamentos, segurança no trânsito, mudanças climáticas e sedentarismo
(FISHMAN, 2016).
Nesse contexto, Curtis (2008) aborda a questão da sustentabilidade e dos sistemas
de transporte e pontua a necessidade de haver um equilíbrio entre as externalidades
negativas (uso de energia, poluição e emissão de gases) e as positivas (alto nível de
acessibilidade). Segundo Mello (2015), para entender melhor a articulação entre esses
dois campos, é preciso conhecer mais sobre a relação entre transporte e uso do solo, que
é uma preocupação inerente ao conceito de acessibilidade.
Holden et. Al (2013) relata, portanto, o surgimento de um novo conceito de
transporte de passageiros, em que se considera não só os impactos ambientais e
econômicos, como a equidade social, saúde, segurança e qualidade de vida dos usuários.
6 A garantia de acessibilidade, nesse contexto, pode ser vista como elemento capaz de gerar
inclusão social, seja por meio do planejamento da ocupação e uso do solo, seja por meio
de medidas relativas ao sistema de transportes (LUZ, 2018).
A Figura 1 mostra como acontece a articulação entre acessibilidade e a mobilidade
sustentável.
Figura 1 - Articulação da acessibilidade com a mobilidade sustentável (LUZ, 2018)
Assim, tratar o binômio transportes e sustentabilidade requer que sejam
considerados os objetivos de desenvolvimento, o perfil de mobilidade almejado e, por
conseguinte, o padrão de acessibilidade necessário para alicerçar o alcance da
sustentabilidade (MELLO, 2015).
MOBILIDADE URBANA SUSTENTÁVEL
A mobilidade sustentável pode ser entendida como a promoção do equilíbrio entre
a satisfação das necessidades humanas de deslocamento com a proteção do ambiente
natural. Isto implica que a oferta de bens e serviços deve estar disponível e compatível
com as demandas da população, além de apresentar estabilidade e regularidade ao longo
do tempo. Tudo isso de forma que o impacto ambiental não comprometa a capacidade
futura de satisfação das demandas das próximas gerações (CARVALHO, 2016).
Assim, da mesma forma que se trabalha o desenvolvimento sustentável nas três
dimensões principais – econômica, social e ambiental –, o mesmo pode ser feito em
relação aos sistemas de mobilidade. Trazendo essas dimensões para o campo da
mobilidade urbana, podem-se traçar os pressupostos básicos de uma mobilidade urbana
sustentável, nos quais a proteção ambiental, a sustentabilidade econômica e a justiça
social se tornam condicionantes importantes no processo de planejamento (Figura 2)
(CARVALHO, 2016).
7
Figura 2 - Dimensões da mobilidade urbana sustentável (CARVALHO, 2016)
2.1.1 Sustentabilidade ambiental
Sob a ótica da sustentabilidade ambiental, as cidades devem ter permanente
preocupação em aumentar a participação do transporte público coletivo e do transporte
não motorizado em sua matriz de modos de deslocamentos. Como mostra a Figura 3, os
gastos de energia e, consequentemente, emissões de poluentes per capita são muito
menores entre os modos coletivos de transporte. Assim, cidades orientadas à mobilidade
ativa e ao transporte público apresentam menores níveis de poluição atmosférica e sonora,
além de serem mais funcionais do que as cidades com alto grau de uso de veículos
motorizados privados (CARVALHO, 2016).
Figura 3 - Emissões de CO2 as modalidades de transporte urbano por passageiro e
quilômetro (IPEA, 2011)
Vale ressaltar, ainda, que as questões ligadas à organização, à forma e ao
desenvolvimento das cidades também são importantes para a sustentabilidade ambiental.
Pesquisas da UN Habitat (2013) apontam que cidades com formas urbanas mais densas
são orientadas ao transporte público e ao uso misto do solo. Essas características criam
8 condições favoráveis tanto para o uso de transportes compartilhados quanto para opções
de mobilidade ativa (ex: a pé, bicicleta). Por outro lado, cidades menos densas, com áreas
mais espraiadas e grandes vazios urbanos são altamente dependentes de transporte
motorizado individual. Isso ocorre porque as viagens são mais extensas e não há escala
adequada para viabilizar sistemas de transporte de massa.
Ainda, segundo Carvalho (2016), a tecnologia à combustão atual está chegando
no seu limite de eficiência e, portanto, ganhos maiores no futuro demandarão grandes
alterações tecnológicas, como os veículos híbridos, por exemplo, ou alteração completa
da matriz energética, com a utilização de combustíveis mais limpos (hidrogênio,
biocombustíveis etc.).
Dessa forma, as políticas públicas que busquem maior sustentabilidade ambiental
para os sistemas de mobilidade urbana devem seguir dois caminhos: i) aumento da
eficiência da rede, com a maior participação dos modos de transporte coletivo e dos não
motorizados na matriz de modos de deslocamentos; e ii) aumento da eficiência dos
veículos automotores, com a utilização de combustíveis mais limpos e a busca de maior
eficiência das tecnologias à combustão tradicionais (CARVALHO, 2016).
2.1.2 Sustentabilidade econômica
Os sistemas de mobilidade, com destaque para o transporte público, devem
apresentar equilíbrio econômico-financeiro. Para tanto, os custos dos serviços têm de ser
definidos corretamente pelo poder público, com políticas claras e transparentes de
financiamento e custeio (CARVALHO, 2016).
No Brasil, como o financiamento da operação é realizado quase que
exclusivamente pela arrecadação tarifárias, as classes mais altas contribuem muito pouco
com o custeio do transporte público, mesmo que sejam beneficiárias indiretas dos
serviços prestados. Por outro lado, os mais pobres e, consequentemente, mais
dependentes dos serviços de transporte público, comprometem boa parte de suas rendas
para este fim (CARVALHO, 2016).
Segundo Carvalho (2016), para tornar o financiamento do transporte público mais
equitativo, torna-se necessária a discussão sobre fontes alternativas de financiamento aos
sistemas de mobilidade. De forma geral, o financiamento deve contemplar maiores
dispêndios por parte dos mais ricos e ser oriundo, principalmente, das compensações das
9 modalidades que provocam maiores externalidades, como o transporte individual, por
exemplo.
Além disso, os sistemas de planejamento de transporte têm de dispor de recursos
externos ao setor para que haja condições de ampliação e qualificação constantes dos
serviços de mobilidade. Nesse sentido, novas fontes de financiamento tornam-se
fundamentais, não só para redução dos preços cobrados, mas, também, para atender aos
anseios da sociedade quanto à melhoria do sistema de transporte (CARVALHO, 2016).
2.1.3 Justiça Social
A dimensão da justiça social na mobilidade sustentável se refere, basicamente, aos
princípios de acessibilidade universal. Garantir acessibilidade universal implica que os
serviços de transporte tenham de atender a todos os cidadãos ou seja, toda a população
tem o direito de usufruir das oportunidades e dos equipamentos das cidades
(CARVALHO, 2016).
Para que isso ocorra, o sistema de transporte tem de ser dimensionado e planejado
de forma abrangente, focando, inclusive, nos grupos minoritários que apresentam
dificuldades de mobilidade, como pessoas com deficiência e os mais pobres
(CARVALHO, 2016)
Neste contexto, pode-se estabelecer uma distinção clara entre crescimento
(aspectos quantitativos) e desenvolvimento (aspectos qualitativos). Litman (2008)
argumenta que, na atualidade, uma ênfase maior nos aspectos qualitativos faz parte de um
processo de mudança de paradigma. Em outras palavras, o crescimento econômico é
condição importante, mas não suficiente para o desenvolvimento, já que este pressupõe
que haja um processo de inclusão social (HADDAD, 2001), com distribuição das
oportunidades de forma igualitárias entre às pessoas (MACHADO, 2010). Kusakabe
(2013) destaca, ainda, que não é possível haver desenvolvimento sustentável enquanto a
pobreza e as injustiças sociais forem presentes.
Para Carvalho (2016), as condições de mobilidade da população são bastante
críticas sob a ótica da equidade social. As classes mais altas contam com um maior índice
de mobilidade (viagens por habitantes) em função da sua maior renda. Já os mais pobres,
têm sua mobilidade bastante impactada, tanto pelas privações nos deslocamentos em
função da renda como pelas piores condições de transporte às quais são submetidos.
10 Assim, a deterioração do transporte público e o seu encarecimento prejudicam, sobretudo,
as classes mais baixas, provocando aumento das desigualdades existentes nas condições
de mobilidade da população.
As políticas para minimizar essas iniquidades estão relacionadas à priorização e
ao barateamento do transporte público em relação ao transporte individual e, também, a
melhor distribuição de empregos e oportunidades no território (CARVALHO, 2016).
Nesse sentido, um princípio importante na dimensão social é a da modicidade
tarifária. Isso significa que as tarifas dos transportes públicos devem ser acessíveis a todos
os segmentos da população e as políticas sociais de concessão de benefícios devem focar
nas classes menos favorecidas (CARVALHO, 2016).
Outro princípio importante é a equidade nas condições de mobilidade das pessoas
e, também, no uso do espaço urbano. Historicamente, os mais pobres moram nas
periferias, distante das áreas mais dinâmicas economicamente e que concentram a maior
parte dos empregos, oportunidades e serviços urbanos. Somado a isso, os investimentos
em mobilidade costumam ser destinados às áreas mais ricas e aos sistemas de transporte
privado, corroborando para precarização da condição de vida de uma grande parcela da
população (CARVALHO, 2016).
Traçando um paralelo entre o uso e ocupação do solo e o desenvolvimento
sustentável, Mello (2015) aponta que à medida que as áreas urbanas se tornam menos
espraiadas, a qualidade de vida das pessoas, principalmente aquelas que vivem nos
subúrbios, tende a aumentar. Isto se justifica porque, nesses casos, as áreas residenciais
passam a acessar com maior facilidade os serviços, o emprego e a renda, ao mesmo tempo
que os centros tradicionais e consolidados se tornam menos congestionados.
ATRIBUTOS DA MOBILIDADE SUSTENTÁVEL
Somado aos esforços no sentido de alcançar um conceito mais preciso e completo
de mobilidade sustentável, é necessário entender as ações mais adequadas para serem
tomadas com relação a mobilidade existente. Para tanto, é importante compreender os
atributos que estão envolvidos nesse contexto. Mello (2015), então, destaca cinco
atributos (Figura 3) capazes de expressar a sustentabilidade na mobilidade.
11
Figura 4 - Atributos da mobilidade sustentável (LUZ, 2018)
Segundo Mello (2015), para a mobilidade ser sustentável, ela deve ser:
• Produtiva: Atributo da dimensão econômica (LITMAN, 2015), refletindo uma
mobilidade que favorece o uso de meios de transportes mais eficientes em termos
de recursos energéticos (EPA, 2012; WAPC, 2012) e que utilizam a
infraestrutura existente de forma mais racional (MELLO, 2015). Isto é,
direcionada às modalidades de maior capacidade e mais efetivas em atender a
demandas de viagens, sempre de forma integrada aos demais modos de menor
capacidade (LUZ, 2018). O mesmo se aplica a utilização do espaço viário, que
deve priorizar os modos coletivos de transporte, e a proteção das modalidades
mais vulneráveis, como as não motorizadas (UITP, 2003);
• Inclusiva: A inacessibilidade ou isolamento geralmente não é considerada no
planejamento de transporte (LITMAN, 2015). Apesar desta não ser uma
realidade dos setores da sociedade com maior poder aquisitivo, que dispõem de
alternativas para se deslocar, ela existe entre as camadas mais pobres, violando
o direito de cidadania (MELLO, 2015). A imobilidade, expressa pelo número
significativo de pessoas que não se deslocam e, por isso, não desfrutam do
território e de seus direitos, é uma questão séria. Isto porque a mobilidade deve
representar condições que permitam o atendimento universal das necessidades
de viagens, em especial daqueles com restrições físicas e de renda (ABLEY e
HALDEN, 2013);
• Segura: A mobilidade deve garantir o compromisso com a saúde, a integridade
e o direito à vida, e ocorrer em condições seguras, com menos riscos, conflitos,
12 acidentes e mortes nas viagens, particularmente no trânsito (FERSI/ ECTRI,
2009; LITMAN e FITZROY, 2014);
• Justa Socialmente: A mobilidade com qualidade de serviço para todos e que
possa ser realizada em tempos acessíveis. Estas condições são importantes para
que todos desfrutem de atividades e oportunidades fundamentais para se
melhorar a qualidade de vida e o bem-estar social (WELCH, 2013; WELCH e
MISHRA, 2013); e
• Verde: A mobilidade verde é compromissada com modos de transporte que
utilizam energia limpa e em condições focadas na redução da poluição
atmosférica, sonora e emissões de gases do efeito estufa (PORTER et al., 2013).
A consideração dos atributos acima mencionados significa, na prática, que há um
processo evolutivo em andamento, através do qual as dimensões social e ambiental
passam a ser incorporadas na agenda, junto com a dimensão econômica. E as três são
válidas em qualquer escala territorial, alterando-se apenas a maneira de como lidar com
os transportes e o uso do solo na contemplação da sustentabilidade (MELLO, 2015).
Através do aproveitamento e combinação de oportunidades como a otimização de
serviços digitais de mobilidade, novos métodos construtivos e de fabricação e novos
modelos de negócios, um novo sistema de mobilidade urbana pode ser traçado para
atender anseios econômicos, sociais e ambientais no desenvolvimento da cidade (ELLEN
MACARTHUR FOUNDATION, 2019).
Além disso, a necessidade de se considerar uma visão sistêmica e sustentável a
respeito da mobilidade urbana garantiu um aumento de visibilidade para o modo
cicloviário. Soluções de mobilidade que incentivam a transição para transportes ativos (a
pé, bicicleta) e veículos leves (carros elétricos, patinetes, micro-ônibus) são
frequentemente viáveis e podem garantir ganhos produtivos, melhora da saúde pública,
redução do consumo de recursos finitos e diminuir emissão de poluentes (ELLEN
MACARTHUR FOUNDATION, 2019).
BICICLETA E ACESSIBILIDADE
O transporte motorizado é visto por Sanz (1996) (apud Machado, 2010) como a
causa principal dos impactos ao meio ambiente urbano, e dentre as alternativas para
minimizar suas consequências ambientais e sociais negativas está a redução da
13 mobilidade motorizada individual, tanto no que ser refere ao volume quanto à distância
dos deslocamentos.
Em 2018, os veículos circulantes (automóveis, motocicletas, comerciais leves e
caminhões) no Brasil já contabilizavam 44,8 milhões de unidades, com aumento de 1,9%
em relação ao ano anterior. E as projeções para os anos seguintes são de crescimento
ainda mais acentuado, com 2,3% em 2019 e 2,6% em 2020 (SINDIPEÇAS e ABIPEÇAS,
2019).
A Figura 5 mostra essa mudança significativa dos padrões de viagens desde
meados do século XX na cidade do Rio de Janeiro. Com o avanço da indústria
automobilística e os incentivos fiscais do governo para a compra de automóveis,
favoreceu-se o deslocamento motorizado individual (CARVALHO, 2016).
Figura 5 - Distribuição de viagens motorizadas (CARVALHO, 2016)
Outros impactos deste processo são exemplificados pela Figura 6, que apresenta
o desperdício estrutural associado aos sistemas tradicionais de mobilidade. A Ellen
Macarthur Foundation (2015) aponta, por exemplo, que os carros na Europa, que têm em
média 5 assentos, carregam apenas 1,5 pessoas por viagem, gerando espaços ociosos e
contribuindo para o aumento de congestionamentos. Além disso, 86% da energia
potencial do tanque de combustível não contribui para o deslocamento do veículo,
transformando-se em perda. A pesquisa revela, ainda, que até 50% das terras nos centros
urbanos são ocupadas por estradas, ruas, estacionamentos e postos de serviços, contudo
apenas 10% das vias são efetivamente utilizadas nos horários de pico de deslocamento.
Dessa forma, de acordo com Costa et al. (2004), torna-se fundamental promover
o equilíbrio entre os diferentes modos de transporte e incentivar os modos não
motorizados.
14 É importante enfatizar que ao tornar o uso do automóvel menos atrativo, os meios
de transporte devem ser melhorados (transporte público, infraestrutura para o ciclista,
infraestrutura para caminhadas, etc.) (GÄRLING et al., 2003). De forma mais abrangente,
a Gestão da Mobilidade pode ser descrita como uma estratégia que ajuda na redução do
volume total de tráfego através do encorajamento nas mudanças no comportamento de
indivíduos e de organizações, como o uso da bicicleta.
Figura 6 - Desperdício estrutural no sistema de mobilidade tradicional (ELLEN
MACARTHUR FOUNDATION, 2015)
2.3.1 Benefícios da bicicleta
A bicicleta integra o conjunto conhecido como meios de transporte não-
motorizados, definidos como aqueles em que as viagens são livres de consumo de
combustíveis fósseis. Ela é o meio de transporte que apresenta o menor consumo de
energia primária em MJ (Mega Joule) por passageiro-km, enquanto que o automóvel é o
líder de consumo (ver Figura 7) (SILVEIRA, 2010).
Dessa forma, políticas de incentivo ao uso da bicicleta, seja para viagens de curta
e média distância ou para integração com meios coletivos de transporte, são importantes
para a transição do comportamento dos indivíduos no caminho de reduzir impactos
ambientais na mobilidade.
15
Figura 7 - Comparação dos diversos meios de transporte do ponto de vista ecológico em relação ao automóvel para um deslocamento equivalente em pessoas/quilômetro. Base –
100 (automóvel sem catalisador) (COMISSÃO EUROPEIA, 2000).
Além de ser rápida e eficiente em trajetos urbanos curtos, a bicicleta garante uma
melhor acessibilidade à população, sendo seus benefícios de diversas naturezas:
• Econômica: diminuição da parte do orçamento familiar destinada ao automóvel,
redução das horas de trabalho perdidas no congestionamento e redução das
despesas médicas devido aos exercícios regulares;
• Política: redução da dependência energética e econômica de recursos não
renováveis;
• Social: democratização da mobilidade e melhor autonomia e acessibilidade;
• Ecológica: não utiliza combustíveis fósseis e não gera gases de efeito estufa
Todavia, esses benefícios não se limitam ao campo do indivíduo, atingindo,
também, a coletividade urbana. Dentre eles pode-se destacar (COMISSÃO EUROPÉIA,
2000):
• Ausência total de impacto sobre a qualidade de vida na cidade (nem ruído, nem
poluição);
• Preservação dos monumentos e das plantações;
• Uso mais racional e eficiente do solo, tanto para se deslocar quanto para
estacionar.
16 • Menor degradação da rede viária e redução de programas de novas
infraestruturas viárias;
• Diminuição dos congestionamentos e das perdas econômicos a eles atrelados;
• Maior fluidez da circulação de veículos;
• Maior poder de atração dos transportes públicos;
• Melhor acessibilidade aos serviços tipicamente urbanos;
2.3.2 Componentes de integração do modo cicloviário
Para a Comissão das Comunidades Europeias (apud Costa, 2008), repensar a
mobilidade urbana passa por otimizar a utilização de todos os meios de transporte, mas
também pela integração entre diferentes modos coletivos e individuais.
Transportes de massa, como metro, trens e BRT têm o diferencial de possuírem
grande capacidade e boa eficiência na relação de custo e uso do solo. Contudo, esses
modos de transporte nem sempre atendem à todas as necessidades dos usuários, que
buscam maior conveniência e integração com o restante do sistema (ELLEN
MACARTHUR FOUNDATION, 2019).
Kager e Harms (2017) destacam em seus estudos seis componentes que
determinam o grau de integração do modo cicloviário com outros mecanismos de
mobilidade, especialmente os transportes de massa.
2.3.2.1 Infraestrutura urbana e fatores culturais
A integração do modo cicloviário com transportes de massa, e os consequentes
resultados dessa sinergia, depende fundamentalmente da provisão de uma infraestrutura
urbana adequada e do fortalecimento cultural nesse sentido, para que ambos subsistemas
sejam efetivamente utilizados (CERVERO et al, 2012). Todavia, mudar uma cultura de
transporte existente ou prover a infraestrutura necessária em um contexto com demanda
limitada é um desafio para as políticas públicas. A complexidade do problema está na
interligação entre o investimento e o aumento do uso desses sistemas, já que pesquisas
revelam que não há uma solução única que garanta esta efetiva mudança de
comportamento dos usuários (PUCHER et al, 2010).
17 A infraestrutura e a cultura são fundamentais para que se obtenha os benefícios
dessa integração entre modo cicloviário e modos de transporte de massa. Por outro lado,
Brons et al (2019) defende que, até certo ponto, a ausência da infraestrutura de um
subsistema pode ser compensada pelo investimento nos outros subsistemas, se
circunstâncias locais e as oportunidades fizerem destas boas escolhas.
2.3.2.2 Sistema de compartilhamento de bicicletas
Os sistemas de compartilhamento de bicicletas são peças fundamentais na
integração da malha cicloviária com os demais modos de transporte urbano. Eles têm o
diferencial de garantir a disponibilidade de bicicletas, especialmente em viagens que não
têm a casa como origem. (FISHMAN, 2016).
O princípio do sistema de compartilhamento de bicicleta é simples: os indivíduos
usam as bicicletas de acordo com suas necessidades sem se preocupar com as
responsabilidades e os custos de aquisição, garantindo aos usuários uma forma
ecologicamente correta de transporte público. Em termos de mobilidade, esse sistema
também se apresenta como uma boa solução às viagens de curtas e médias distâncias que
são consideradas longas para serem realizadas a pé, como o caminho de uma residência
até um transporte público de massa ou de um terminal até o ambiente de trabalho
(SHAHEEN, GUZMAN E ZHANG, 2010).
2.3.2.3 Estacionamento de bicicletas nos terminais de transporte
Segundo Kager e Harms (2017), a infraestrutura para estacionar bicicletas
particulares deve ser direcionada ao serviço de curta duração (até 24 ou 48 horas),
próximo ao local de residência dos usuários. Já a infraestrutura de estacionamento para
períodos mais longos pode ser trabalhada em áreas comerciais, onde o compartilhamento
não seja viável. De fato, em centros urbanos, os sistemas de compartilhamento de
bicicletas oferecem uma solução mais eficiente, flexível e viável economicamente, por
isso devem ser considerados como primeira opção nesses casos.
2.3.2.4 Integração do planejamento e operação
Apenas com planejamento e gerenciamento integrados é possível desenvolver
ações eficazes e eficientes frente às ameaças e oportunidades do sistema, além de
comparar os benefícios atrelados aos investimentos, aos custos de operação e às políticas
18 públicas adotadas. Idealmente, a integração entre os modos de transporte deve partir de
uma organização comum que planeja e intervém sobre ambos os sistemas. Em outros
cenários, o governo deveria, ao menos, adotar medidas e estratégias para que essa
integração a nível de regulamentação, planejamento e operação seja possível (KAGER E
HARMS, 2017).
2.3.2.5 Integração de informações
O componente de integração de informações representa a ponta final do vínculo
de integração entre o modo cicloviário e os demais modos de transporte. Ele está
relacionado às sinalizações de trânsito, mapas, informações de viagem, formas de
pagamento, marketing ou alugueis. São exemplos práticos dessa integração as
sinalizações em ciclovias e ciclofaixas indicando locais de estacionamento e paradas,
mapas mostrando as principais rotas para bicicletas e cartões de cobrança que integram
sistemas compartilhados de bicicletas com outros modais (KAGER E HARMS, 2017).
2.3.2.6 Regulamentação e uso de bicicletas a bordo
Sob o ponto de visto do usuário do sistema, a possibilidades de levar bicicletas a
bordo de ônibus (em racks) e trens de forma confiável, rápida, barata e confortável seria,
provavelmente, a melhor maneira para promover a integração do modo cicloviário. No
entanto, apenas uma pequena parcela dos indivíduos opta por esta forma de utilização.
Fato é que o uso de bicicletas a bordo é muito restrito em escalas maiores, devido ao
espaço ocupado por elas nos vagões, elevadores, escadas e plataformas e ao aumento do
tempo de embarque e desembarque. Salvo em casos bem específicos, como a
regulamentação em horários de baixa demanda, este componente não é recomendado
(KAGER E HARMS, 2017).
2.3.3 Impacto da integração da bicicleta com transportes de massa
Essa integração tem dois objetivos diretos: incluir a bicicleta como meio de
transporte habitual nas viagens por motivo de trabalho ou escola nas cidades, e reforçar
modos coletivos como principais meios de transporte para viagens médias e longas das
populações nos médios e grandes aglomerados urbanos (MINISTÉRIO DAS CIDADES,
2007b).
19 Uma melhor integração do modo cicloviário no sistema de transportes da cidade
impacta diretamente nos padrões de viagens e no modo de uso e ocupação do solo,
garantindo maior acessibilidade à população. Os benefícios e impactos dessa integração
derivam do potencial do modo cicloviário de ser altamente flexível, requerer poucos
recursos de investimento e apresentar alta competitividade em relação a velocidade de
deslocamento nos trajetos urbanos de até 5 km (KAGER E HARMS, 2017).
Dessa forma, aproximar a bicicleta dos terminais e locais de grande demanda de
passageiros é permitir a valorização dos meios coletivos e a ampliação do raio de ação
dos ciclistas nas cidades e nos espaços regionais (MINISTÉRIO DAS CIDADES, 2007b).
Figura 8 - Mecanismo de aumento da área de influência (KAGER E HARMS, 2017).
Para Kager e Harms (2017), um dos mecanismos, através do qual a bicicleta afeta
os padrões de viagem e a ocupação do solo, é a ampliação o raio de influência das estações
de transportes de massa em até 9 vezes comparado com o deslocamento a pé (Figura 8).
Os resultados podem ser percebidos de duas maneiras: mais residências acessam um
número maior de estações, aumentando as opções de viagens para esses indivíduos,
enquanto as estações ficam conectadas a mais residências, aumentando o uso das mesmas,
de suas facilidades e serviços.
Com essa ampliação, as áreas de influência muitas vezes se interceptam. Isto
significa que há, também, um aumento das possibilidades de escolha dos ciclistas, que
podem customizar seus trajetos de acordo com suas preferências, seja aquele com melhor
infraestrutura, com presença de lojas e mercados ou que o destino seja uma estação com
mais facilidades (KAGER E HARMS, 2017).
20 Vale ressaltar, ainda, que esses fatores aumentam a competitividade do transporte
público frente aos outros meios de transportes, tanto para os ciclistas como para aqueles
que não os acessam de bicicleta. E como se trata de um processo cíclico e retroalimentado,
ele tem efeitos de segunda ordem. Nos locais em que modos de transporte de massa são
mais atraentes, espera-se que as pessoas tenham mais disposição para realizar o
deslocamento até uma estação ou a partir dela (KAGER E HARMS, 2017).
Assim, Kager e Harms (2017) concluem que modos de transporte mais integrados
e acessíveis fortalecem os espaços urbanos, já que ampliam as opções de áreas destinadas
a residências, comércio, lazer, etc, e podem impactar as tomadas de decisão dos cidadãos
a longo prazo a respeito, por exemplo, dos destinos de viagens, da posse de automóveis,
da necessidade de estacionamento e da rotina de atividades. Esses comportamentos foram
estudados por Klinger (2017), que identificou que pessoas recém mudadas para cidades
orientadas ao transporte público e ao ciclismo estavam mais suscetíveis a adotar escolhas
de mobilidade multimodais, mesmo que fossem originalmente de cidades com sistemas
de transportes menos acessíveis.
Por fim, Kager e Harms (2017) pontuam que nos lugares em que a integração entre
o ciclismo e o transporte público está consolidada, há maior ocupação dos espaços
públicos. E quando se tem mais pessoas circulando nas ruas, elas se tornam mais seguras
e atrativas na percepção dos cidadãos, sendo, portanto, fator decisivo no desenvolvimento
de cidades mais dinâmicas, sustentáveis e saudáveis.
21 3 TRANSFORMADO DADOS EM INFORMAÇÃO
As cidades ao redor do mundo estão constantemente coletando dados da vida
urbana os quais contribuem para a geração de informação útil aos cidadãos, visitantes,
autoridades públicas e trabalhadores locais (CARAGLIU et al., 2011). Com o
crescimento da internet e uso massivo da tecnologia de informação e comunicação (TIC),
a quantidade de dados gerados e disponibilizados cresceu exponencialmente (AVILA,
2017). A Figura 9 mostra essa tendência e indica que, até este ano, esse número deve
chegar na casa dos 40 Zettabytes (ou 40 trilhões de gigabytes).
No atual contexto da transformação digital, o efetivo uso desse grande volume de
dados, conhecido atualmente como Big Data, terá capacidade de transformar economias,
otimizar processos produtivos e será peça chave na consolidação de empresas
competitivas no mercado (MANYKA et al., 2011).
Figura 9 – Volume de dados gerados no mundo de 2010 a 2020 (AVILA, 2017)
O Big Data tipicamente descreve um largo e complexo conjunto de dados
representados digitalmente por registros da atividade humana. Ele pode ser definido em
termos de escala e volume, ou pelos seus impactos nas organizações. As análises de Big
Data envolvem processos cognitivos e computacionais para identificar padrões nos dados
22 e Kumar et al., (2013) dizem que o correto uso desses dados pode beneficiar as relações
entre empresas, clientes e a sociedade nos sistemas inteligentes.
Por outro lado, até recentemente, muita dessa informação desaparecia. Ou não era
coletada, ou era descartada (HAIR et al., 2005). Segundo Gantz e Reinsel (2012), apesar
da porção do universo digital contendo valor analítico estar crescendo, apenas uma
pequena parte dele é de fato explorada.
Assim, frente a esse enorme volume de informação disponível, o grande desafio
passa ser como selecionar e gerir esses dados de tal maneira que possamos transformá-
los em informação e conhecimento eficaz (HAIR et al., 2005).
Diante desse cenário, muito se tem discutido a respeito das cidades inteligentes
como uma nova proposição para o gerenciamento das cidades, valendo-se do intenso uso
das tecnologias da informação e comunicação como meio para viabilizar as cidades do
futuro e equalizar as questões trazidas pela rápida urbanização.
CIDADES INTELIGENTES
O século XXI está sendo marcado por importantes fenômenos sociais e,
principalmente, por grande concentração de pessoas em ambientes estritamente urbanos
(ONU, 2012). Até 2050, projeta-se que o número de pessoas no mundo deve chegar a
casa dos 9 bilhões e, desta população, estima-se que cerca de 66% estarão vivendo em
cidades (Figura, 10) (ONU, 2012). As cidades garantem aos seus habitantes diversas
facilidades da vida urbana (como cultura, lazer, transporte público, saúde, etc...), mas, por
vezes, elas não estão preparadas para atender a demanda necessária (ANDRADE et al.,
2016).
Figura 10 - Tendências de urbanização global: porcentagem da população morando em
áreas urbanas (DELLOITE, 2017)
23
O rápido fluxo de pessoas em direção aos centros urbanos e o adensamento
populacional trazem consigo desafios enormes para os governos, pois nem sempre a
infraestrutura urbana acompanha o crescimento das cidades. Esses desafios, decorrentes
da imediata necessidade de atendimento às demandas por serviços adequados, estimulam
a criação de novas áreas de conhecimento para a prevenção ou solução dos problemas
decorrentes desse fenômeno. (ANDRADE et al., 2016; BERNARDES et al., 2017).
Um desafio significativo vivido atualmente por grande parte das cidades diz
respeito à mobilidade urbana. Com o crescimento desordenado das cidades e a
especulação imobiliária nos centros, cada vez mais pessoas se instalam em periferias,
exigindo, assim, que a infraestrutura chegue até esses locais. Portanto, a mobilidade
urbana deve ser pensada com o mesmo dinamismo do desenvolvimento urbano, para que
se atendam as necessidades atuais, mas se tenha alternativas para a demanda futura
(ANDRADE et al., 2016).
Discutir as cidades, então, torna-se um tema crítico e de grande importância,
particularmente com vistas ao cenário futuro de crescimento populacional nos centros
urbanos (BERNARDES et al., 2017). A busca por soluções inteligentes para o
enfrentamento dos desafios relacionados a forte urbanização e seus impactos traz o
conceito de Cidades Inteligentes (Smart City), que é envolvido em uma nova abordagem
para mitigar e tratar os problemas nas cidades, visando que as mesmas sejam mais
sustentáveis e que contem com a efetiva participação da população em sua construção e
desenvolvimento (ANDRADE et al., 2016).
Já existem muitos projetos de cidades inteligente, como o Oceanix, Masdar e
XCloud. E recentemente, a Toyota anunciou a criação da Woven City, uma cidade
inteligente na base do monte Fuji que terá um ecossistema totalmente conectado e
sustentável. Mas fato é que nem todas as cidades podem ser reconstruídas do zero, então
a pergunta que fica é: como podemos transformar as cidades de hoje em cidades
inteligentes? (FIRJAN, 2019).
Construir cidades inteligentes significa entender de forma plena as
particularidades de cada região e, independentemente delas, atender às necessidades de
interação cidadão-governo, que é crescente e absolutamente crítica (WOLFRAM, 2012).
Portanto, o desenvolvimento da inteligência nas cidades está associado às características
individuais de cada uma, traduzidas em sistemas de informações robustos, plenamente
integrados e que se valham dos avanços promovidos pela indústria de tecnologia da
24 informação. As aplicações da TIC para a criação de cidades inteligentes são inúmeras e
começam a ser disponibilizadas de forma adaptada às necessidades de cada centro urbano,
com objetivo de solucionar problemas e adaptar a infraestrutura existente (WOLFRAM,
2012).
3.1.1 Digitalização e Cidades inteligentes
Se nos anos 1990 o debate entre as novas tecnologias de informação e
comunicação e o espaço urbano girava em torno do termo “cidades digitais”, hoje o termo
emergente é “cidades inteligentes”. O digital era compreendido como o acesso aos
computadores e à implantação da internet no espaço urbano, mas inteligente aqui é
sinônimo de uma cidade onde tudo é sensível ao ambiente e produz, consome e distribui
uma grande quantidade de informações em tempo real (LEMOS, 2013).
Assim, enquanto as cidades digitais são caracterizadas por aspectos puramente
técnicos, as definições para as cidades inteligentes vão além. De acordo com Dutta et al.
(2011), as cidades inteligentes têm foco em um modelo particularizado, com visão
moderna do desenvolvimento urbano e que reconhecem a crescente importância das
tecnologias da informação e comunicação no direcionamento da competitividade
econômica, da sustentabilidade ambiental e da qualidade de vida geral. “As cidades são consideradas inteligentes quando são
identificadas contendo investimentos inteligentes ao longo dos
eixos: economia, mobilidade, meio ambiente, recursos humanos e
estilos de vida inteligentes. Os significativos avanços tecnológicos
e das tecnologias da informação e comunicação (TIC) agora fazem
das plataformas tecnológicas embarcadas um instrumento
potencialmente significativo para sensorizar e monitorar a
funcionalidade e o desempenho das cidades, permitindo ampliar
sobremaneira suas capacidades de gerenciar recursos com mais
eficiência e prover conectividade e informações de forma
transparente aos seus cidadãos e visitantes.” (C40 SÃO PAULO
CLIMATE SUMMIT, 2011, p. 32)
Essa evolução de paradigmas ocorreu, principalmente, por causa da popularização
da internet e o agressivo desenvolvimento de sistemas de geolocalização, acesso,
consumo e distribuição de informação, permitindo que os usuários participassem da
25 criação de conteúdo. Atualmente, a partir de terminais móveis (como tablets e
smartphones) é possível ter acesso à internet, ao desenvolvimento e utilização de
aplicativos e, principalmente, à informação em tempo real, o que contribuiu para que as
cidades inteligentes se disseminassem (ANDRADE et al., 2016; LEMOS, 2013).
A TIC aparece, então, como viabilizadora de um sistema nervoso para as cidades
inteligentes, tornando os dados da vida urbana tangíveis por meio da criação e execução
de projetos voltados para sua captura e tratamento em tempo real. Além disso, o
processamento de dados inteligente é usado como base para as tomadas de decisões de
empresas, governos e cidadãos. A TIC fornece, portanto, as interfaces adequadas para
que os cidadãos se envolvam com sua cidade e para que o poder público possa atuar de
forma preventiva por meio do uso de sistemas de monitoramento, gerenciamento e painéis
analíticos (LEMOS, 2013; BERNARDES et al., 2017).
Segundo Finger (2017), enquanto as cidades tradicionais apresentam duas
camadas principais, a de infraestrutura e de serviços, as cidades inteligentes incorporam
mais uma camada entre essas duas, a dos dados. Nas cidades inteligentes, há, portanto,
uma combinação dos sistemas urbanos e da digitalização das informações, que ocorre em
três etapas: geração, conexão e análise dos dados.
A etapa de geração de dados se dá a partir dos diferentes dispositivos móveis
utilizados, como GPS, smartphones, satélites, etc. Com o crescimento da Internet das
Coisas e maior acessibilidade da população à tecnologia da informação, a quantidade de
dados gerados aumentou exponencialmente, inclusive nas cidades. A segunda etapa
refere-se à própria Internet, que funciona como infraestrutura onde todos esses dados
estão disponíveis e acessíveis. Por fim, a terceira etapa está ligada a capacidade de
processamento e análise dessa grande quantidade de dados a fim de torna-la útil (LUZ,
2018).
Neste sentido, novas ferramentas, como machine learning e a inteligência
artificial, estão sendo desenvolvidas para processar e analisar esse grande volume de
dados (Big Data) e apresentá-los de forma inteligível.
A principal implicação da digitalização nas cidades é a gestão inteligente das
infraestruturas urbanas, aumentando a eficiência e otimizando as cadeias de valor. A
segunda grande implicação é o desenvolvimento de serviços inteligentes e novos modelos
de negócios utilizando a camada dos dados (FINGER et. al., 2017).
26 SISTEMAS INTELIGENTES DE SERVIÇO
Os sistemas de serviços inteligentes são definidos por Medina-Borja (2015) como
aqueles em que há aprendizado, constante adaptação e tomada de decisão baseada em
recebimento, transmissão e processamento de dados. Nesse sentido, estudos revelam que
a análise de Big Data pode contribuir para inovar e potencializar as aplicações desses
serviços (MAGLIO e LIM, 2016).
Fabricantes de automóveis analisam as condições dos veículos e os dados
coletados por serviços de bordo para gerar informação aos motoristas, como a eficiência
do motor, segurança, consumo e navegação (LIM et al., 2015). Consumidores do varejo
estão sempre alimentando dados de lojas, cujas análises podem revelar padrões de
consumo relevantes e ajudar a desenvolver novos serviços e aprimorar os existentes. As
redes sociais (Facebook, Instagram, Twitter e blogs) analisam o comportamento de seus
usuários para direcionar anúncios e criar redes cada vez mais alinhadas com os interesses
dos indivíduos. Esses são só alguns exemplos de sistemas inteligentes que permitem
extrair informações a partir da análise de Big Data (MAGLIO e LIM, 2016).
Figura 11 - Quatro usos de Big Data em sistemas inteligentes de serviço (MAGLIO e
LIM, 2016)
27 Os casos de análise de Big Data em sistemas inteligentes de serviço podem ser
divididos em quatro quadrantes como mostra a Figura 11. Essa categorização é feita de
acordo com a origem dos dados, se são coletados majoritariamente dos usuários ou de
objetos do sistema, e de acordo com a finalidade do uso, se são usados para gerar
informação às pessoas ou para gerir os próprios objetos (MAGLIO e LIM, 2016):
1. Gestão inteligente de operações
Categoria caracterizada por dados obtidos de objetos e destinados a gestão dos
mesmos. Casos nessa categoria têm como objetivo aperfeiçoar os processos de operação
de um determinado sistema de serviço. Busca-se um controle eficiente e eficaz dos
sistemas por meio do profundo entendimento dos mesmos através da análise de dados.
São exemplos os serviços inteligentes de coleta de lixo, que obtém dados de caçambas
usando etiquetas de identificação por rádio frequência, e planejam as rotas e horários de
coleta; ou o controle de tráfego inteligente em Cingapura, que coleta dados de ruas e taxis
para prever demandas futuras e controlar sinais de trânsito de forma eficiente (MAGLIO
e LIM, 2016).
2. Customização e prevenção inteligente
Estes casos se baseiam em dados obtidos das pessoas para gerir os objetos do
sistema. Através da análise dos dados, busca-se entender as questões e necessidades dos
usuários de um determinado sistema de serviço para, então, customizar a operação do
sistema de acordo com essas necessidades (MAGLIO e LIM, 2016). Muitos casos de
cidades inteligente correspondem a esta categoria (CARAGLIU et al., 2011). À exemplo,
tem-se: o sistema de prevenção de crimes em São Francisco, em que os registros de crimes
são usados para prever locais de prováveis novas ocorrências e definir localização de
patrulhas (MAGLIO e LIM, 2016); e o serviço de ônibus noturnos de Seoul, que analisa
as chamadas telefônicas e os dados de uso de táxi dos moradores e visitantes da cidade
para identificar o comportamento de deslocamento das pessoas no período da noite e
poder otimizar as rotas e horários dos ônibus noturnos (MAGLIO e LIM, 2016).
3. Treinamento inteligente
Esta categoria engloba os casos em que são analisados dados de pessoas e cuja
finalidade é providenciar treinamento baseado em evidências ou desenvolver controle de
28 processos baseado em profundo conhecimento do comportamento humano (MAGLIO e
LIM, 2016). Exemplos representativos dessa categoria incluem a gestão de jogadores,
que envolve avaliação e melhoria do condicionamento de atletas usando dados detalhados
de suas próprias atividades ao longo do tempo; acessórios esportivos de controle de
atividade, que coletam diariamente dados dos usuários e os ajudam a traçar metas; e
serviços de monitoramento de bebês, que coletam dados dos bebês e do ambiente externo
para informar aos pais as condições em que se encontram e prever comportamentos
(MAGLIO e LIM, 2016).
4. Adaptação inteligente e controle de risco
Por fim, esta categoria envolve a coleta de dados de objetos para ajudar as pessoas.
Casos nesta categoria têm como objetivo a análise de dados de serviços que afetam a vida
das pessoas para que elas possam adaptar os objetos do sistema e reduzir riscos. São
exemplos: navegação inteligente em Milão, que analisa dados de fatores que afetam o
trânsito na cidade, como acidentes, condição do tempo, construções e eventos, para gerar
informação de navegação aos cidadãos e visitantes; e serviços de planejamento de frotas,
que recolhem dados das operação de transporte de caminhões e analisam essas
informações para melhorar a eficiência e produtividades das operações para os motoristas
(MAGLIO e LIM, 2016).
Com a possibilidade de tudo estar conectado, novos projetos voltados para cidades
inteligentes ganham um espaço cada vez maior e podem trazer além de ganhos para o
governo, benefícios para as pessoas. A interação de sistemas, principalmente em áreas
relacionadas à mobilidade urbana, permitirá maior comodidade, segurança, redução de
custos e de recursos naturais (MAGLIO e LIM, 2016).
ANÁLISE DE BIG DATA E A MOBILIDADE URBANA
Nos dias atuais, os sistemas de planejamento de mobilidade urbana contam com
uma grande vantagem: a disponibilidade de dados somada à tecnologia avançada para
processá-los e analisá-los. Governos e operadores de transporte podem usar esse amplo
conjunto de dados (como registro de viagens pendulares, dados de ônibus, de metrôs e
dos impactos de grandes eventos nos transportes) para gerar informação às áreas de
planejamento, gestão e operação de transportes de uma cidade. Além disso, informações
em tempo real geram soluções rápidas para monitorar e regular fluxos de veículos,
29 planejar rotas e notificar ocorrência de acidentes, por exemplo (ELLEN MACARTHUR
FOUNDATION, 2019).
Outro ponto importante é entender os benefícios sociais e o valor econômico por
trás da disponibilização de dados públicos a respeito da mobilidade. Nesse contexto, a
atuação de iniciativas privadas, dos próprios cidadãos e dos órgãos públicos em conjunto
se torna essencial para alavancar o desenvolvimento de serviços inteligentes de
mobilidade, responsáveis, por exemplo, por incentivar mobilidade sustentável nos centros
urbanos (DELLOITE, 2017).
Com a popularização aparelhos eletrônicos portáteis, que permitem rastrear os
deslocamentos dos indivíduos na cidade, abre-se uma janela de oportunidades para
políticas de planejamento baseadas em dados. No entanto, apesar de ser comumente
aceito que existe um grande valor analítico por trás desses dados, não se tem uma maneira
pré-definida e correta para traduzi-los em informação útil e em mudanças concretas
(TRACE, 2019), o que aumenta a necessidade de debates e pesquisas a respeito do tema.
Um caso interessante e que abriu espaço para o debate sobre o valor por trás desses
dados é o de Londres. Há cerca de 10 anos, o TfL (Transport for London), órgão
responsável pelo controle do sistema de transporte da Grande Londres, decidiu
disponibilizar uma significativa quantidade de dados em formato aberto para que
qualquer pessoa pudesse ter acesso a eles, e sem nenhum tipo de cobrança. O objetivo era
estimular a produção de novos produtos e serviços para que fossem levados rapidamente
a mercado e, por conseguinte, fortalecesse o próprio canal de troca de informação da TfL.
O resultado foi a criação de mais de 600 aplicativos desenvolvidos a partir dos dados
disponíveis, usados no decorrer do tempo por até 42% dos londrinos, além de uma série
de benefícios para as partes interessadas (DELLOITE, 2017).
Dentre os benefícios para os usuários da rede de mobilidade pode-se citar a
otimização do tempo e o melhor planejamento de viagens, que se torna mais preciso e
confiável devido às informações disponíveis em tempo real. A cidade de Londres ganha
com o crescimento econômico das empresas de mobilidade e maior geração de empregos.
Por fim, o TfL também se beneficia, tanto com uma economia financeira, já que os
aplicativos não são produzidos internamente e sim por terceiros, quanto com aumento das
oportunidades comerciais e de parcerias que agregam valor mútuo (DELLOITE, 2017).
No cenário atual, a TfL tem a oportunidade de disponibilizar ainda mais dados e
fortalecer outras parcerias com o intuito de explorar e estimular o desenvolvimento de
serviços inovadores e de melhorar a experiência dos usuários no transporte.
30 Também nesse contexto, pode-se destacar o projeto TRACE, que surgiu nos
últimos anos com o objetivo de fomentar o uso da mobilidade ativa nas cidades. Para
tanto, o projeto servia-se da análise dos dados de serviços de rastreamento e navegação,
assim como do desenvolvimento de ferramentas de mobilidade próprias, que gerassem
informação sobre o comportamento dos usuários (TRACE, 2019).
O projeto surgiu, portanto, com o foco de determinar medidas que incentivassem
os deslocamentos a pé e de bicicleta nas viagens a trabalho, estudo e a lazer. E essas
medidas puderam ser aprimoradas com o uso das ferramentas do TRACE, tanto as
relacionadas à mudança de comportamento (Biklio, Positive Drive, Traffic Snake Game),
quanto as ligadas ao suporte aos planos de mobilidade (TATto). Esses aplicativos foram
testados em 8 cidades piloto e avaliadas em termos de seus impactos (TRACE, 2019).
Como um todo, o projeto TRACE permitiu o desenvolvimento de uma ampla base
de conhecimento a respeito das possibilidades, soluções e benefícios que permeiam o
rastreamento de viagens realizadas por bicicleta e á pé. Além disso, as ferramentas criadas
e dados disponibilizados puderam ser explorados pelo mercado da tecnologia de
comunicação e informação e por usuários interessados (TRACE, 2019).
A partir da interpretação dos resultados do projeto, pôde-se categorizar os
objetivos que envolvem o rastreamento de deslocamentos por bicicleta e a pé em 4
grupos: 1. Conectar interesses das partes envolvidas: parceiros (lojas, teatros, cinemas,
seguradoras, etc.) podem oferecer recompensas aos usuários que, por exemplo, chegam
até um estabelecimento de bicicleta ou mantém hábitos saudáveis; 2. Análise de dados:
são extraídas informações a respeito do nível de serviço das infraestruturas existente, dos
caminhos de preferência e da quantidade de demanda por horário; 3. Monitoramento de
medidas: avaliação detalhada dos impactos gerados pela implantação de novas rotas,
radares, sinalização, ou por canteiros de construção na mobilidade urbana, e; 4.
Ferramenta de comunicação: aumentar a visibilidade de ciclistas e pedestre para
autoridades e o público em geral, como forma de influenciar tomadas de decisão em prol
da mobilidade sustentável e ativa (TRACE, 2019).
3.3.1 O Aplicativo BIKLIO
Os dados utilizados neste trabalho foram extraídos de uma base de registros das
viagens realizadas pelos usuários do aplicativo BIKLIO. O aplicativo pode ser instalado
31 em qualquer smartphone e oferece uma plataforma onde ciclistas de uma cidade podem
se conectar com outros ciclistas e com estabelecimentos comercias parceiros, de forma a
fortalecer uma economia local sustentável. Hoje, a BIKLIO é uma startup presente em 7
países diferentes da Europa (Figura 12).
Figura 12 - Cidades onde a BIKLIO está presente
O modelo de negócio da BIKLIO consiste na oferta de benefícios para usuários
do aplicativo que optam por se locomover de bicicleta. Na visão da empresa, há 3 agentes
que podem ser impactados positivamente com a oferta deste serviço: os ciclistas, o
comerciante e a cidade (Figura 13).
Figura 13 – Agentes impactados pelo app BIKLIO
Sob o ponto de vista do ciclista, o mesmo pode mapear quais benefícios estão
sendo oferecidos próxima a sua localização atual. Caso o deslocamento até o
estabelecimento parceiro (BIKLIO spot) seja realizado por meio da bicicleta, o aplicativo
identificará a viagem e o usuário poderá resgatar sua oferta (Figura 14).
Para o comerciante, o aplicativo é uma forma de aumentar a visibilidade da marca
e de direcionar seus benefícios para um público específico, a fim de aumentar as chances
de fidelização de um cliente. O perfil dos ciclistas varia de cidade para cidade, mas, em
32 geral, pode-se dizer que são pessoas que se preocupam com o desenvolvimento
sustentável e seguem um estilo de vida mais saudável. Nesse sentido, estabelecimentos
que praticam valores parecidos podem encontrar, na plataforma, clientes que criem
identificação com seus produtos mais facilmente.
Figura 4 – Esquema de obtenção de benefício no BIKLIO
Sob a perspectiva da produção de dados, é fácil compreender que os usuários do
BIKLIO estão constantemente alimentando a base do aplicativo. A medida que alguém
utiliza o app, as informações sobre o deslocamento são automaticamente armazenadas no
sistema. Ainda, é possível extrair informações a respeito do perfil dos usuários e dos
estabelecimentos comerciais parceiros.
Nesse sentido, pode-se concluir que os dados armazenados pelo aplicativo contém
alto valor analítico e, caso sejam bem manipulados, podem fornecer informações
extremamente úteis, tanto para os desenvolvedores da ferramenta como para instituições
de pesquisa. Isso porque identificar as rotas de preferência dos ciclistas pode ser relevante
na compreensão dos fatores mais relevantes na escolha dos percursos das viagens por
bicicleta, se são aqueles com melhor infraestrutura, mais agradáveis, ou simplesmente
mais rápidos. Além disso, sabendo-se por qual tipo de oferta cada usuário se sente mais
atraído, é possível personalizar o direcionamento de novos benefícios. Ainda, entender os
horários de maior circulação de ciclistas pode ajudar a orientar políticas públicas de
incentivo à bicicleta, como criação de faixas exclusivas e serviços de carregamento de
bicicletas a bordo.
33 4 ANÁLISE MULTIVARIADA
CONCEITOS DE ÁLGEBRA MATRICIAL
Este trabalho explora o uso da análise de componentes principais, uma técnica
multivariada, na interpretação de uma base de dados de usuários de bicicleta. O
entendimento desta técnica está atrelado a aplicação da álgebra matricial básica, em que
são avaliados os autovetores e autovalores de uma matriz de covariância ou uma matriz
de correlações (PITOMBO e LINDNER, 2016).
4.1.1 Autovalores
Dada uma matriz quadrada ! de ordem ", com entradas reais, pode-se dizer que
os autovalores de ! correspondem aos valores de $ ∈ ℝ que satisfazem a solução não
trivial (( ≠ 0) da Equação (4.0):
! ∙ ( = $ ∙ ( (4.0)
onde ( é um vetor de dimensão (" × 1) e $ é um escalar.
Os " autovalores {$1, $3, $4, ⋯ , $6} da matriz ! podem ser calculados através das
raízes do seu polinômio característico definido por (4.1):
8(λ) = det(! − $>) (4.1)
sendo > uma matriz identidade de dimensões (" × ").
A equação det(! − $>) = 0 é também conhecida como equação característica e,
pelas propriedades dos determinantes, 8 é um polinômio de grau ", igual a ordem da
matriz !.
34 4.1.2 Autovetores
O vetor coluna (? que satisfaz a Equação (4.0) é definido como sendo o autovetor
à direita da equação ! associado ao autovalor $?. Para as " soluções possíveis, a Equação
(4.0) pode ser genericamente expressa da seguinte forma:
! ∙ (? = $? ∙ (?@ = {1,2,⋯ , "} (4.2)
onde (? é um vetor de dimensão (" × 1).
(? = B
(1?(3?⋮(6?
D (4.3)
Geometricamente, (E⃗ é um vetor que não muda de direção quando se aplica a
matriz !. Como pode ser ilustrado na Figura 15, o autovetor é levado a um múltiplo de si
mesmo.
Figura 13 – Interpretação geométrica de um autovetor
O conjunto formado pelos autovetores à direita da matriz ! é representado pela
matriz ( a seguir:
( = [(1 (3 ⋯ (? ⋯ (6] (4.4)
35 4.1.3 Matrizes de covariância e correlação
De forma geral, tanto a covariância quanto a correlação medem o grau de relação
e dependência entre variáveis. No entanto, enquanto a covariância mede apenas a direção,
o coeficiente de correlação mede tanto a força quanto a direção da relação linear entre
duas variáveis.
O coeficiente de correlação é uma função da covariância e seus valores são
padronizados, variando de -1 a 1. Ele pode ser obtido dividindo-se a covariância pelo
produto dos desvios padrão das variáveis. Portanto, valores positivos de covariância
sempre resultarão em valores positivos de correlação e o mesmo se aplica aos valores
negativos (MINITAB, 2019).
Para duas variáveis x e y, as fórmulas para o cálculo dos coeficientes de
covariância e correlação são dadas, respectivamente, pelas Equações (4.5) e (4.6).
IJK(L, M) =∑ (L? − L̅)(M? − MP)6?Q1
" − 1 (4.5)
IJRR(L, M) =Ε[(L? − L̅)(M? − MP)]
TUTV (4.6)
onde:
L̅ é a média aritmética da variável x;
MP é a média aritmética da variável y;
TU é o desvio padrão da variável x;
TV é o desvio padrão da variável y.
4.1.3.1 Matriz de Covariância
A matriz W (" × X) exemplificada em (4.7) pode ser interpretada como uma matriz
de variáveis, na qual cada coluna LY representa um vetor contendo " coletas de uma
variável Z.
36
W = B
L11 L13 ⋯ L1[L31 L33 ⋯ L3[⋮ ⋮ ⋱ ⋮L61 L63 ⋯ L6[
D (4.7)
Dessa forma, cada elemento ]?Y da matriz de covariância ^ (4.8) representa a
covariância entre as i-ésima e j-ésima variáveis da matriz W e pode ser calculado pela
Equação (4.5), na qual L̅ e MP são as médias aritméticas dos elementos das colunas L? e LY
da matriz W, respectivamente. Como ]?Y = ]Y?, a matriz de covariância obtida é uma
matriz simétrica de ordem X.
^ = B
]11 ]13 ⋯ ]1[]31 ]33 ⋯ ]3[⋮ ⋮ ⋱ ⋮][1 ][3 ⋯ ][[
D (4.8)
4.1.3.2 Matriz de Correlação
Partindo da base de dados da matriz W, a matriz de correlação _ (4.9) pode ser
obtida usando-se a mesma lógica do cálculo da matriz de covariância, mas, desta vez,
aplicando-se a Equação (4.6).
Nota-se que a matriz _ continua sendo uma matriz quadrada, simétrica e de ordem
X, porém os valores de seus elementos foram normalizados, variando de -1 a 1, e são
adimensionais. Vale ressaltar, também, que a diagonal principal da matriz de correlação
_ é composta apenas por elementos unitários, o que faz sentido já que a correlação de
uma variável com ela mesma deve retornar o maior valor possível.
_ =
⎣⎢⎢⎡1 R13 ⋯ R1[R31 1 ⋯ R3[⋮ ⋮ ⋱ ⋮R[1 R[3 ⋯ 1 ⎦
⎥⎥⎤ (2.0)
37 TÉCNICAS MULTIVARIADAS
As análises de Big Data, normalmente, podem ser estruturadas utilizando-se
métodos estatísticos simples. Todavia, quando busca-se ampliar o entendimento a
respeito de um determinado assunto, muitas vezes é necessário que sejam consideradas
em uma análise diversas variáveis (CARVALHO, 2017). Nesses casos, avanços
tecnológicos ligados ao desenvolvimento de hardwares e softwares vêm nos ajudando a
aplicar técnicas multivariadas mais complexas.
As técnicas de análise multivariadas são definidas como as técnicas estatísticas
em que se avaliam simultaneamente múltiplas medidas sobre o mesmo objeto de
investigação. Ademais, para que a análise seja considerada multivariada, todas as
variáveis devem ser aleatórias e inter-relacionadas de tal forma que seus efeitos não
possam ser significativamente interpretados isoladamente (HAIR et al., 2005).
Alguns autores declaram, ainda, que o propósito da análise multivariada é medir,
explicar e predizer o grau de relacionamento entre as variáveis, por isso sua característica
multivariada repousa nas combinações e não somente na quantidade de observações e
variáveis (HAIR et al., 2005).
Para Hair et al (2005), a escolha da técnica multivariada mais adequada para cada
análise depende das respostas para três perguntas:
1. As variáveis podem ser dividas em classificações independentes e
dependentes com base em alguma teoria?
2. Se podem, quantas variáveis são tratadas como dependentes em uma única
análise?
3. Como as variáveis, sejam dependentes ou independentes, são medidas?
A resposta à primeira questão indica se uma técnica de dependência ou
independência deveria ser usada. É possível observar na Figura 2 que esta avaliação
define qual caminho deverá ser tomado no primeiro ponto de decisão, a partir do qual se
estabelece uma separação entre o lado esquerdo (dependência) e o direito
(interdependência).
Em linhas gerais, uma técnica de dependência é aquela na qual uma variável ou
um conjunto de variáveis é identificada como a variável dependente a ser prevista ou
explicada por outras variáveis conhecidas independentes. As técnicas de dependência
podem ser classificadas de acordo com o número de relações de dependência e, também,
conforme o tipo de escala empregada pelas variáveis. São exemplos dessa técnica a
38 análise de correlação canônica, a regressão múltipla e a análise de variância multivariada
(MANOVA).
Por outro lado, as técnicas de independência são aquelas em que não há uma
variável ou grupo de variáveis definida como sendo dependente ou independente. Os
procedimentos envolvem a análise simultânea de todas as variáveis do conjunto (HAIR
et al, 2005).
Figura 14 - Seleção de uma técnica multivariada (HAIR et al, 2005)
39
Figura 15 - Seleção de uma técnica multivariada (HAIR et al, 2005)
Como o objetivo deste trabalho é analisar uma estrutura de variáveis
independentes, seguindo o lado direito do diagrama apresentado nas Figuras 16 e 17, a
técnica mais apropriada para ser utilizada segundo Hair et al (2005) é a análise fatorial.
A estruturação da análise de dados deste trabalho foi feita com a utilização da
metodologia de análise de componentes principais (ACP), que muitas vezes aparece na
literatura como um caso especial da análise fatorial, mas que Jolliffe (2002) defende que
são técnicas distintas, mesmo apresentado escopos muito parecidos.
Nas próximas seções, serão apresentados os princípios básicos dos dois métodos,
com maior detalhamento para o método da análise de componentes principais.
40 ANÁLISE DE COMPONENTES PRINCIPAIS
4.3.1 Definição
O Análise de Componentes Principais (ACP) é uma técnica multivariada que tem
por objetivo reduzir a dimensão de uma base de dados composta por um grande número
de variáveis correlacionadas, com menor perda de informação possível (JOLLIFFE,
2002). Segundo Souza (1995), a ACP procura explicar uma estrutura de variâncias-
covariâncias utilizando poucas combinações lineares das variáveis originais a fim de
simplificar a interpretação dos dados, colocando-os em uma forma mais adequada para
análise e facilitando a evidenciação de tendências.
É comumente aceito que a técnica de componentes principais foi originalmente
descrita por Pearson (1901) na busca por linhas e planos que melhor descrevessem um
conjunto de pontos em um espaço p-dimensional. Posteriormente, ela foi consolidada na
análise de estruturas de correlação por Hotelling (1933). A motivação de Hotelling estava
na possível existência de um conjunto menor de variáveis independentes que pudessem
caracterizar bem os valores das variáveis originais. Ele observou que essas novas
variáveis eram chamadas de “fatores” em estudos anteriores desenvolvidos na área da
psicologia, mas propôs a introdução do termo alternativo “componentes” para evitar
confusões nos estudos da matemática, que já tinha outras atribuições para a palavra
“fatores”. Ainda, ele nomeou de “componentes principais” aqueles que melhor
conseguiam explicar de maneira significativa a estrutura e variância da base de dados
original. A análise feita para se identificar esses componentes ficou conhecida como
“método de componentes principais” (JOLLIFFE, 2002).
Segundo Jolliffe (2002), a ACP é a técnica de redução dimensional mais
conhecida e usada mundialmente quando se busca diminuir o número de variáveis, devido
a sua relativa fácil aplicação em problemas numéricos. Entretanto, considera-se que os
cálculos que envolvem a aplicação da ACP sejam viáveis de serem executados a mão
apenas quando são analisadas até no máximo 4 variáveis. Por isso, o uso dessa análise só
foi amplamente difundido após o desenvolvimento de computadores eletrônicos e graças
a ampla disponibilidade de softwares aplicados, permitindo sua utilização em várias áreas
da ciência (SOUZA, 1995).
Apesar de ser uma técnica aparentemente simples de ser aplicada, muitas
pesquisas relacionadas a ACP vêm sendo desenvolvidas. Hoje é possível encontrar na
41 literatura exemplos de aplicações da ACP em diversas áreas como agricultura, biologia,
química, estudos demográficos, ecologia, genética, psicologia, estudos de rotinas, dentre
muitas outras (JOLLIFFE, 2002).
4.3.2 Interpretação algébrica
A análise de componentes principais tem como ponto de partida uma base de
dados contendo X variáveis aleatórias e " observações/amostras. Esses dados podem
organizados em linhas e colunas e representados pela matriz de variáveis W (1.8).
Para Sartorio (2008), a técnica da ACP consiste basicamente em transformar um
conjunto original de variáveis aleatórias (W1, W3, W4,⋯ ,W[) em um outro conjunto com
mesma dimensão (f1, f3, f4,⋯ , f[), tal que:
f? = g?1W1 + g?3W3 + ⋯+ g?[W[ (2.0)
Onde:
f? é um vetor coluna com " elementos
Os elementos desse novo conjunto são variáveis não correlacionadas e cada um
está associado a um componente principal que, algebricamente, é uma combinação linear
das X variáveis aleatórias W1, W3, W4,⋯ ,W[ (SOUZA, 1995).
O componente principal f1 é o arranjo que melhor representa a distribuição dos
dados e que retém a maior quantidade de informação da base, seguido pelo f3, e assim
por diante. A importância dos componentes principais é dada pelas suas respectivas
variâncias e são ordenados conforme (2.1) (SOUZA, 1995).
igR(f1) > igR(f3) > ⋯ > igR(f[) (2.1)
onde:
igR(f?) denota a variância de f?
A solução de maximização do problema e tão logo a determinação dos
componentes principais está atrelada a aplicação de conceitos básicos da álgebra linear e
recai sobre a identificação dos autovalores e autovetores da matriz de covariância ^,
descrita no capítulo anterior (JOLLIFFE, 2002).
42 Segundo Manly (2005), o autovalor $? da matriz de covariância ^ corresponde à
variância do componente principal f?. Neste caso, ele diz que igR(f?) = $? e, como não
é possível obter valores negativos associados aos autovalores de uma matriz de
covariância, os X autovalores da matriz S assumem valores maiores ou iguais a zero e são
ordenados da seguinte forma:
$1 ≥ $3 ≥ $4 ≥ ⋯ ≥ $[ ≥ 0 (2.2)
As constantesg?1, g?3, ⋯ , g?[ são os elementos do autovetor (? associado ao
autovalor $? damatrizdecovariância^. A análise dos autovetores se faz relevante na
medida em que os seus elementos representam os “pesos” de importância que cada
variável original W? tem dentro de cada componente principal. As constantes g?Y são
definidas pela combinação linear que retorna o maior valor de igR(f?) possível, sujeita
a restrição (2.3). A colocação dessa restrição é necessária pois, em caso contrário, a
igR(f?) cresceria indefinidamente com o aumento do valor de qualquer constante g?Y
(MANLY, 2005).
g?13 + g?33 +⋯+ g?[3 = 1 (2.3)
Uma importante propriedade dos autovalores é que a soma de seus valores é igual
a soma dos elementos da diagonal da matriz de origem, no caso, ̂ (1.9) (MANLY, 2005).
Dessa forma, tem-se que:
$1 + $3 + $4 +⋯+ $[ = ]11 + ]33 + ]44 + ⋯+ ][[ (2.3)
Como o elemento ]?? corresponde a variância de W? e $? corresponde a variância
de f?, a equação (2.3) indica que a soma das variâncias dos componentes principais é
igual a soma das variâncias da base de dados original (MANLY, 2005). Ainda, no caso
particular da matriz de correlação _, cujos elementos da diagonal principal são todos
unitários, tem-se que:
v$?
[
?Q1
=v]YY
[
YQ1
= X (2.4)
As componentes principais também podem ser caracterizadas de acordo com a sua
importância relativa, ou seja, ela passa a ser avaliada pela porcentagem de sua variância
43 correspondente sobre a soma total das variâncias. Para Manly (2005), em certos estudos,
por exemplo, é desejável que a variância acumulada nos dois primeiros componentes
principais exceda 70-80%.
4.3.3 Interpretação geométrica
A análise de componentes principais também pode ser interpretada por uma
perspectiva espacial e geométrica. A Figura 18 representa a plotagem de 50 observações
feitas com relação a duas variáveis fortemente correlacionadas L1, L3. É claro que os casos
em que X = 2 são bem simples e pouco realistas, mas para fins visualização, eles têm a
vantagem de poderem ser graficamente apresentados em apenas 2 dimensões (JOLLIFFE,
2002).
Figura 16 - Gráfico de 50 observações em duas variáveis (JOLLIFE, 2002)
É possível observar que, apesar de existir variância considerável nas duas
variáveis, ela é maior na direção do eixo de L3. Assim, ao realizar a ACP considerando
dois componentes principais w1, w3, obtém-se o gráfico da Figura 19.
44
Figura 17 - 50 observações com relação aos seus componentes principais (JOLLIFFE,
2002)
Fica claro, portanto, que a componente principal w1 retém a maior parte da
variância original, enquanto que na direção de w3 a variância é bem pequena. Para casos
gerais em que X > 2 e as variáveis sejam correlacionadas, é esperado que a maior parte
da variância esteja acumulada nos primeiros eixos principais e os últimos sejam menos
representativos (JOLLIFFE, 2002).
Nesse sentido, o objetivo da ACP é rotacionar rigidamente os eixos de um espaço
p-dimensional, associado às variáveis W1, W3, W4,⋯ ,W[, para novas posições (eixos
principais), associadas aos componentes principais (JOLLIFFE, 2002).
Além de serem ordenados de acordo com a variância, outra propriedade dos
componentes principais é que a covariância entre eles é zero, o que, graficamente, é
representado pela ortogonalidade entre cada par de eixos principais (JOLLIFFE, 2002).
4.3.4 Matriz de covariância e matriz de correlação
Os componentes principais buscam, de forma sucessiva, maximizar a variância da
base de dados original e podem ser achados através dos autovalores e autovetores da
45 matriz de covariância ^. Todavia, algumas modificações na técnica são adotadas para
evitar, principalmente, dois problemas recorrentes que dificultam a interpretação dos
componentes principais: mistura de unidades de medida e diferença de escalas
(JOLLIFFE, 2002).
Muitas vezes as variáveis de um problema possuem diferentes unidades de
medida, o que torna incoerente a determinação de uma combinação linear entre elas. É o
caso em que se avaliam, por exemplo, dados de altura, temperatura e peso de um
indivíduo. Jolliffe (2002) também aponta para os diferentes componentes principais que
podem ser obtidos ao se optar pela escala Celsius ao invés da Farenheit na medição de
temperaturas, já que são escalas intervalares e a variação entre as medidas é diferente.
Outra situação que pode prejudicar a interpretação dos dados é quando as variáveis
apresentam a mesma unidade de medida, porém algumas delas possuem variâncias muito
maiores que as outras. Nesses casos, os primeiros componentes principais são
completamente dominados pelas variáveis com variância elevada, podendo levar a
resultados que não caracterizem com precisão as informações da base original
(JOLLIFFE, 2002).
Para contornar essas arbitrariedades, as variáveis devem ser normalizadas para
que apresentem variações unitárias. Ao buscar-se combinações lineares de variáveis
normalizadas, os componentes principais passam a ser definidos pelos autovalores e
autovetores da matriz de correlação _ e não mais da matriz de covariância ^ (JOLLIFFE,
2002).
Segundo Souza (1995), a aplicação da ACP a partir de uma matriz de covariâncias
^ é aconselhável apenas nos casos em que os dados apresentam uma mesma unidade de
medida e dimensão não muito discrepante. Nas demais situações, é recomendada a
normalização dos dados.
Saha (2018) em seus estudos compara a aplicação da ACP em três cenários
diferentes:
1. Matriz de covariância em dados normalizados
2. Matriz de correlação em dados normalizados
3. Matriz de correlação em dados não-normalizados
Em todos os casos, os autovalores e autovetores extraídos da análise, assim como
a contribuição dos primeiros componentes principais, apresentaram os mesmos valores,
podendo-se concluir que normalizar os dados com posterior aplicação da ACP a partir da
46 matriz de covariância leva ao mesmo resultado que a aplicação da ACP pela matriz de
correlação.
4.3.5 Quantos componentes principais escolher?
O cerne do método da ACP está na redução dimensional de X variáveis para x
componentes principais, sendo x < X. Em seu livro, Jolliffe (2002) apresenta diversos
procedimentos da literatura para a escolha desse número mínimo de componentes que
retém informação suficiente para sustentar uma análise de dados relevante. Todavia, a
conclusão que se chega é que diferentes objetivos na aplicação da ACP levam a diferentes
necessidades com relação aos números de componentes principais que devem ser retidos
na análise. Apesar disso, dois critérios relativamente simples e que funcionam bem em
muitos casos são descritos nos próximos itens.
4.3.5.1 Porcentagem acumulada do total de variância
Este é possivelmente o critério mais intuitivo para definição do valor de x e
consiste, basicamente, em estabelecer um limite mínimo z∗, como 80% ou 90%, acima
do qual deve estar o total de variância acumulada dos componentes principais
selecionados (z|). A quantidade de componente é, portanto, o menor valor de x para o
qual o limite z∗ previamente definido é superado ( z| > z∗). No caso da ACP a partir da
matriz de correlação, tem-se que:
z|Q100X vf?
|
?Q1
(2.4)
Sendo,
X = total de variância (no caso da matriz de correlação)
f? = variância do componente principal @
Segundo Jolliffe (2002), apesar da linha de corte ser normalmente entre 70% e 90%,
não há uma forma exata de definir o valor de z∗, ele pode ser maior ou menor dependendo
do detalhamento da base dados e do nível de correlação entre as variáveis. Além disso, é
esperado um valor de z∗ menor a medida que X, ou seja, o total de variância, aumenta ou
que o número de observações " seja maior.
47 4.3.5.2 Valor da variância dos componentes principais
Este critério é usado exclusivamente em análises a partir das matrizes de
correlação, mas pode ser adaptado para as matrizes de covariância também. Parte-se do
princípio de que se todas as variáveis W1, W3, W4,⋯ , W[ fossem completamente
independentes umas das outras e não-correlacionadas, então todos os componentes
principais teriam variância unitária e seriam equivalentes às variáveis originais.
A partir desse pressuposto, os componentes principais que tenham variância f <
1 são entendidos como aqueles que contêm menos informação do que uma das variáveis
originais e, por isso, devem ser descartados. Essa regra, na sua forma mais simples, é
conhecida como Regra de Kaiser, que considera apenas os componentes principais com
variância maior que 1 (JOLLIFFE, 2002).
Por outro lado, Jolliffe (2002) diz que este critério simples de eliminação pode
prejudicar a análise nos casos em que se tem, por exemplo, um grupo de variáveis
fortemente correlacionadas junto com uma variável que seja, de certa forma,
independente das outras. Nesse caso, apesar de ser retido um componente principal com
f > 1, que representa bem o grupo de variáveis correlacionadas, o fato de ter uma
variável independente não apareceria na análise dos resultados.
Para tanto, baseado em estudos anteriores, Jolliffe (2002) sugere que a Regra de
Kaiser seja adaptada tomando como critério de descarte dos componentes principais a
relação f? < 0,7 a fim de obter resultados mais assertivos.
ANÁLISE FATORIAL
Figueiredo Filho e Silva Junior (2010) definem a análise fatorial como um
conjunto de técnicas multivariadas com objetivo de encontrar uma estrutura subjacente
em uma matriz de dados e determinar um novo grupo de variáveis latentes (fatores) que
melhor representam o conjunto de variáveis observadas.
48
Figura 18 - Representação da análise fatorial
Ainda, a Análise Fatorial (AF) pode ser caracterizada sob uma ótica exploratória
ou confirmatória. Quando as variáveis são encaixadas em um grupo de acordo com sua
correlação, a análise é exploratória, e quando já se tem uma suspeita de composição dos
fatores e apenas busca-se uma confirmação, ela é confirmatória (CARVALHO, 2017).
A AF prevê que as variáveis observáveis L1, L3,⋯ , L6 geram xvariáveis não-
observáveis M1, M3,⋯ , M|. O método assume, ainda, que as variáveis são combinações
lineares dos fatores somado a um termo de erro. Dessa forma, para Z = 1,2…",
LY = v$Y�M� + ÄY|
1
(2.5)
ou em formato de matriz de resultados,
Å = ÇÉ + Ñ (2.6)
As soluções para as cargas $Y� que maximizam a variância da base de dados, ou
seja, a quantidade de informação retida, não são únicas. Em particular, caso a matriz de
cargas Ç seja multiplicada por uma matriz ortogonal Ö, o resultado obtido será tão
representativo quanto o original, porém com eixos rotacionados, o que pode simplificar a
estrutura do problema. A ideia da rotação é, portanto, buscar dentre as melhores soluções,
aquela que pode ser mais facilmente interpretada, ou seja, que possibilite ver claramente
quais fatores influenciam cada variável e quais não (JOLLIFFE e MORGAN, 1992).
A análise fatorial é geralmente aplicada quando: 1) não há evidências suficientes
que explicitem como os itens de determinado instrumento devem ser agrupados e
avaliados; ou 2) quando o pesquisador quer confirmar ou refutar a estrutura fatorial de
49 determinado instrumento (BROWN, 2006). Durante a realização de uma análise
exploratória, o pesquisador precisa tomar diversas decisões a fim de se obter uma
estrutura fatorial adequada e, portanto, essa técnica possui alto potencial de produzir
resultados pouco assertivo e confiáveis (DAMASIO, 2012)
COMPARAÇÃO ENTRE MÉTODOS
A Análise de Componentes Principais (ACP) e a Análise Fatorial (AF) são
ferramentas muito importantes nas análises multivariadas. Como apontado anteriormente,
é recorrente encontrar na literatura a ACP sendo descrita como um caso especial da AF
ou sendo considerada uma opção de ferramenta dentro de bibliotecas de programação
para análise fatorial. Apesar disso, elas são técnicas distintas (JOLLIFFE, 2002).
Tanto a ACP quando a AF tem como objetivo a redução dimensional de uma base
dados contendo um número grande de variáveis (") em um novo conjunto menor de
variáveis (x)com menor perda de informação possível, mas a forma de executá-la é
diferente em cada método.
Damasio (2012) aponta que a diferença entre as AFs e as ACPs resta sobre a forma
como os itens são retidos. Segundo ele, em ambos os métodos a redução dimensional
assume que a variância possui 3 componentes: variância específica, variância comum e
variância de erro. A primeira refere-se a parcela da variância do item que não é
compartilhada com as demais variáveis. A variância comum está ligada a parcela da
variância que é compartilhada entre todos os itens que integram determinado fator ou
componente. Por fim, a variância de erro refere-se a parcela do item não explicada pelo
fator ou componente.
Na ACP, os índices resultantes das análises de determinado componente incluem
tanto a variância comum como a específica. Já na AF, apenas a variância comum é
considerada. Como as análises fatoriais buscam revelar construtos latentes que explicam
a covariância dos itens, as variâncias específicas não são consideradas (DAMASIO,
2012).
A comparação dos resultados obtidos da aplicação das duas análises revela que na
ACP as variáveis tendem a apresentar cargas fatoriais e comunalidades mais elevadas
assim como taxas de variância explicada infladas em relação a AF. Isso ocorre justamente
porque a variância específica de cada item é considerada. Esses resultados, todavia,
50 podem ser imprecisos quando busca-se compreender um construto latente que gera a
covariância entre os itens (DAMASIO, 2012).
Jolliffe e Morgan (1992) comparam os resultados obtidos em diversas análises
usando os dois métodos e apontam 3 diferenças entre as ACP e AF:
1. Na AF, ao alterarmos o número de fatores analisados de x para (x + 1),
a natureza dos fatores é modificada e a variância total redistribuída. Já na
ACP, a mesma alteração apenas fornece um componente extra, sem alterar
o total de variância explicada pelos anteriores.
2. Enquanto na ACP os componentes principais são combinações lineares
das variáveis Ls, na AF as variáveis é que são combinações lineares dos
fatores, mais um termo de erro. Ao menos que os dados sejam extraídos
de uma análise multivariada normalizada, não se pode garantir que os
fatores possam ser representados como funções lineares das variáveis.
3. Salvo em situações particulares, não é possível calcular de forma análoga
os fatores resultantes na AF e os componentes principais na ACP. Uma
vez estimados, os fatores podem ser manipulados segundo os mesmos
critérios dos componentes principais, mas a AF é normalmente mais usada
na interpretação das informações ligadas a correlação entre os itens, e não
nas análises subsequentes e específicas a partir dos resultados.
Entendendo que o objetivo do trabalho não é identificar um constructo latente
entre as variáveis e sim avaliar as cargas individuais de cada uma dentro de cada
componente, optou-se pelo uso da análise de componentes principais. Além disso, com
base nos estudos anteriores, a aplicação da ACP se mostrou satisfatória na redução
dimensional e simplificação de estruturas de dados ligados ao comportamento de
usuários, o que fortaleceu a escolha.
51 5 MÉTODO E APLICAÇÃO
BANCO DE DADOS
Através do uso de algoritmos e sensores de vibração nos aparelhos de celular, o
aplicativo BIKLIO reconhece quando o usuário está se locomovendo por bicicleta. Todos
esses deslocamentos, identificados pelo aplicativo como sendo realizados por meio da
bicicleta, são armazenados em uma base de dados. Os registros contêm as informações
de data e horário de início e término de cada viagem e estão associados ao número de
identificação do usuário no sistema.
A Figura 21 mostra parte do registro de viagens de um usuário arbitrário >. Os
dados são extraídos com extensão .json e o armazenamento das informações é estruturado
de forma que:
• “userId”: indica o número de identificação do usuário
• “start”: indica o início de uma viagem
• “end”: indica o término de uma viagem
• “$date”: indica a data/horário de cada início e término de viagem, com
precisão de milésimos de segundo
Figura 19 - Estrutura de registros de viagens
Para o desenvolvimento deste trabalho, foi disponibilizada a base de dados de
todos os usuários da cidade de Lisboa, desde o lançamento do aplicativo até o mês de
fevereiro de 2020. No total, foram analisados os registros de 454 usuários diferentes.
Tanto para o processo de tratamento dos dados da base como para a própria aplicação da
52 Análise de Componentes Principais foi utilizado o software da plataforma de
desenvolvimento integrado Spyder, com código aberto para programação científica em
linguagem Python.
5.1.1 Tratamento dos dados
Muitos fatores podem levar ao armazenamento dos dados com erros ou baixa
representatividade, como o desligamento do gps, esgotamento da bateria do aparelho
celular durante um trajeto ou simplesmente um erro no algoritmo.
Ademais, como pode ser observado na amostra de registros da Figura 21, o tempo
de cada viagem é, normalmente, muito curto, com variações de segundos ou poucos
minutos. Isso acontece porque não há uma precisão tão alta dos sensores do aparelho e
porque a cada vez que o ciclista realiza uma parada momentânea, seja por causa de um
sinal de trânsito ou para ajustar o capacete, a viagem é encerrada. Tomando como
exemplo uma viagem de 20 minutos, em que o ciclista sai do ponto A até o ponto B, as
eventuais paradas que o usuário realiza ao longo do percurso e as variações de velocidade
e vibração captadas pelo aparelho celular fazem com que as viagens sejam fracionadas
em registros mais curtos, que juntos representam o trajeto completo. Portanto, é
indispensável que seja realizado um tratamento dos dados para melhor interpretação dos
resultados.
Para os 454 usuários analisados, obteve-se um total de 908.525 registros de
viagens, sabendo-se que, como dito anteriormente, essas viagens não configuram um
trajeto total do indivíduo desde a origem até o destino final. Por outro lado, pelo Gráfico
5.1, em que os usuários estão ordenados de acordo com o total de registros de viagens de
cada um, observou-se que a maior parte desses registros está concentrada na atividade de
poucos usuários. Considerando as 30 pessoas que mais utilizam o aplicativo, é possível
obter 97% do total de registros da base.
Para o tratamento em si, foram desconsideradas viagens com ano de registro de
1970, tipicamente associadas às situações em que o sistema é reiniciado ou desligado
durante um percurso de bicicleta. Observou-se a ocorrência deste erro em 103.577
registros, ou seja, 11,4% da base total. Como não havia nenhuma referência que
permitisse a estimação da data e horário mais precisos de realização dessas viagens,
assumiu-se que, como a falha ocorria ao acaso, a exclusão dessas viagens da análise não
53 comprometeria o resultado final. Além disso, os horários de início e fim de cada viagem
foram simplificados de forma a serem representados com precisão apenas de minutos.
Gráfico 5.1 – Total de registros por usuário
Outro tratamento realizado foi a individualização de cada trajeto completo de
bicicleta, já que as viagens separadas não representam o percurso inteiro do usuário do
ponto de partida até o seu destino final, e sim parte dele. Dessa forma, foi preciso definir
um intervalo máximo que podia existir entre o final de uma viagem e o início da seguinte
para que as duas fossem consideradas como pertencentes a um mesmo trajeto. Para tanto,
foram realizadas simulações variando-se os intervalos máximos e observando-se o
tamanho da base remanescente. Pelo Gráfico 5.2, é possível perceber que, a partir de 7
minutos de intervalo, a curva fica menos angulada, ou seja, há uma variação menor no
tamanho da base. Assumiu-se, portanto, que registros com intervalo menor que 7 minutos
comporiam uma mesma viagem.
Gráfico 5.2 – Tamanho da base com variação dos intervalos máximos
54 Posteriormente, os dados foram organizados em uma nova base, na qual as viagens
são listadas e dividas em 3 campos: (i) data de início da viagem (start), (ii) data de fim
da viagem (end), (iii) tempo total de viagem (etime). O tamanho da nova base, após o
processo anterior, reduziu para 558.115 registros e vale ressaltar que cada um deles está
associado a um trajeto específico. A Figura 22 mostra parte dessa base referente às
viagens do mesmo usuário >.
Figura 20 - Base tratada com individualização das viagens
Apesar do tratamento realizado para agrupar os registros e individualizar os trajetos,
nota-se, ainda assim, que muitas viagens contêm tempos de duração curtos, entre 0 e 2
minutos, provavelmente fruto de alguma falha do algoritmo do aplicativo. Assumindo
que a distância mínima percorrida em um trajeto de bicicleta seja de 1,0 km e que a
velocidade média da bicicleta no centro urbano é de 20 km/h (CRUZ, 2015), então os
registros com intervalo de duração menor que 3 minutos foram desconsideradas da
análise. Dessa forma, 8.271 viagens foram retiradas da base.
Outro ponto relevante é que, durante a tratamento dos dados, observou-se que
muitos registros haviam sido armazenados de forma duplicada, principalmente em
registros dos anos de 2019 e 2020. Deduziu-se que esse problema havia sido consequência
de alguma atualização recente do servidor e, para que não houvesse interferência nos
resultados, a base foi tratada retirando-se todos os elementos repetidos. Então, foi definida
uma nova base a partir da qual o modelo foi proposto. Esta base final ficou com 14.071
registros.
55 MODELO PROPOSTO
Como é previsto no método de análise por componentes principais, o ponto de
partida para a modelagem do problema foi a definição da estrutura matricial com X
variáveis independentes e " observações distintas.
Optou-se, então, por representar os dados da base de viagens através da matriz de
elementos binários Ü(" × 24) (3.0)
Ü = B
x11 x13 ⋯ x13àx31 x33 ⋯ x33à⋮ ⋮ ⋱ ⋮
x61 x63 ⋯ x63à
D (3.0)
Onde:
Cada colunaZ corresponde a uma hora diária
" = total de dias em que houve, ao menos, uma viagem de bicicleta
x?Y = 1, se o usuário iniciou alguma viagem de bicicleta na hora Z do dia @
x?Y = 0, se o usuário não iniciou nenhuma viagem de bicicleta na hora Z do dia @
Vale ressaltar, ainda, que as linhas da matriz, além de corresponderem aos dias
em que houve, pelo menos, um registro de viagem de bicicleta, também são caracterizadas
por um número de identificação do usuário. Assim, mesmo que duas pessoas utilizem o
aplicativo no mesmo dia, as viagens de cada usuário serão registradas em linhas
diferentes, preservando as particularidades das rotinas de cada indivíduo.
5.2.1 Análise de componentes principais no modelo proposto
Ao aplicar a análise de componentes principais no modelo proposto, busca-se,
principalmente, olhar para dois parâmetros: o peso de cada variável independente nos
componentes principais e a quantidade de informação retida por cada um deles.
Nesta análise, especificamente, os componentes principais são vetores ortogonais
de dimensões (1 × 24) que representam o comportamento de viagens de um indivíduo
ou de um grupo. Como as viagens normalmente estão associadas à uma rotina, é esperado
que exista uma repetição das atividades e uma correlação entre as horas do dia (variáveis
independentes do problema), ou seja, se o usuário usa a bicicleta para ir ao trabalho ou a
56 um curso, é provável que, nesses dias, seja observado um padrão de comportamento que
envolve a realização de viagens na parte da manhã e outras na parte da tarde.
Para se interpretar adequadamente e dar nome aos componentes, é importante
analisar, também, os valores das cargas fatoriais das variáveis. Em outras palavras, deve
ser analisada a contribuição (negativa ou positiva) das variáveis (horas do dia) em relação
a cada um dos 24 componentes. Quanto maior a contribuição positiva de uma variável,
maior será sua representatividade e importância para o componente.
Cada componente principal está associado a um valor escalar. Eles são,
respectivamente, os autovetores e autovalores da matriz de covariância obtida a partir das
variáveis da matriz Ü. Os autovalores representam a variância de cada componente e são
extraídos em ordem decrescente, de forma que o primeiro componente principal (PC1) é
o que retém maior quantidade de informação da base e o componente PC24 é o menos
representativo. Para esta análise, foram consideradas as porcentagens acumuladas do total
de variância de acordo com o número de componentes escolhidos.
RESULTADOS OBTIDOS NA MODELAGEM E ANÁLISES
A aplicação da análise de componentes principais se deu em duas etapas. Primeiro,
o método foi aplicado a uma base de dados contendo registros de viagens apenas do
usuário I, escolhido por ser um dos usuários com maior frequência de utilização do
aplicativo. Em seguida, realizou-se a mesma análise tomando como base os registros de
todos os usuários da cidade de Lisboa. Dessa forma, foi possível identificar as
particularidades dos resultados em cada um dos casos e traçar um comparativo entre a
relevância da aplicação do método em uma análise individual e em grupo.
5.3.1 Indivíduo
Assim como no caso da cidade de Lisboa, a base de dados do indivíduo I também
foi tratada e estruturada usando as mesmas premissas anteriores. Ao final do tratamento
a base final continha 133 registros de viagens individualizadas.
57 5.3.1.1 Componentes principais
A tabela 1 apresenta todos os componentes extraídos da análise do banco de dados
do usuário I. Para facilitar a interpretação dos resultados, foram destacadas em cada linha
as variáveis que possuem maiores cargas fatoriais e que, portanto, caracterizam melhor
os respectivos componentes.
Sendo assim, algumas constatações podem ser feitas:
• O componente PC1 representa o padrão de deslocamento diário mais
significativo do usuário I. Ele é caracterizado, principalmente, por viagens realizadas às
15:00. Há, também, uma pequena carga fatorial às 9:00 que indica a tendência de fluxo
pendular do componente, apesar do horário em é realizado o deslocamento casa-
trabalho/casa-estudo variar mais do que na viagem de retorno.
• Os componentes PC2 e PC3 descrevem outras variações das viagens pendulares
realizadas pelo usuário I. O primeiro é caraterizado por viagens realizadas por volta de
8:00 e de 17:00. Já o segundo, além de evidenciar tendência de viagens pela parte da
manhã e do final da tarde, também apresenta uma carga fatorial elevada perto de 13:00,
o que pode representar um comportamento de deslocamentos realizados durante o horário
de almoço do usuário, por exemplo.
• O componente PC4 também representa uma viagem pendular, mas,
diferentemente dos componentes anteriores, a viagem residência-trabalho/residência-
estudo se dá um pouco mais tarde, por volta das 11:00.
• Os componentes PC5, PC6 e PC7 representam rotinas de meio período,
possivelmente caracterizando uma volta antecipada para casa, por exemplo.
• As rotinas representadas pelos PC 8 e PC 9 e PC11 são caracterizadas por
viagens na parte de manhã e outras a noite, por volta 21:00. Nesses dias, é possível
identificar uma extensão do horário de trabalho ou estudo ou, ainda, a realização de
atividades noturnas, por exemplo.
• O PC10 e PC13 representam rotinas diárias que se iniciam por volta de 8:00 e
terminam entre 13:00 e 14:00.
• O PC12 contem cargas fatoriais elevadas nos horários de 7:00 e 10:00 e pode
estar associado a um dia de final de semana do usuário em que realiza alguma atividade
de lazer diurna.
58
Tabela 1 – Matriz de componentes - Aplicação da ACP na base de dados do usuário I
Componente
00:00
01:00
02:00
03:00
04:00
05:00
06:00
07:00
08:00
09:00
10:00
11:00
12:00
13:00
14:00
15:00
16:00
17:00
18:00
19:00
20:00
21:00
22:00
23:00
PC1 0.00 -0.01 -0.01 0.00 0.00 0.00 0.00 -0.02 -0.16 0.14 -0.07 -0.14 -0.27 0.11 0.08 0.87 0.22 0.16 -0.03 0.02 0.02 -0.01 -0.03 -0.04
PC2 -0.02 0.00 0.03 0.00 0.00 0.00 0.00 -0.03 0.20 -0.22 -0.12 -0.46 0.15 -0.17 -0.08 0.00 -0.27 0.73 -0.08 0.01 0.03 0.08 0.00 0.00
PC3 0.06 -0.01 0.03 0.00 0.00 0.00 0.00 -0.01 0.03 0.24 -0.07 0.02 0.02 0.50 -0.11 -0.26 0.49 0.40 0.44 0.03 -0.03 -0.03 -0.04 -0.01
PC4 -0.03 0.00 0.01 0.00 0.00 0.00 0.00 0.07 -0.09 0.18 0.19 0.57 -0.47 -0.33 0.08 -0.13 -0.04 0.47 -0.13 -0.01 0.07 0.01 -0.01 0.05
PC5 -0.02 -0.01 -0.02 0.00 0.00 0.00 0.00 -0.01 -0.09 0.14 0.28 0.29 0.42 0.55 0.17 0.14 -0.42 0.18 -0.25 0.00 -0.03 -0.05 -0.05 -0.03
PC6 -0.03 -0.01 -0.01 0.00 0.00 0.00 0.00 -0.01 -0.02 0.63 0.12 -0.01 0.48 -0.41 -0.37 0.10 0.14 0.00 -0.06 0.00 0.03 0.09 -0.02 -0.03
PC7 0.00 -0.01 -0.02 0.00 0.00 0.00 0.00 -0.31 -0.14 0.03 0.01 -0.09 0.26 -0.22 0.77 -0.12 0.34 0.08 -0.10 -0.06 -0.10 0.03 -0.02 -0.05
PC8 -0.01 0.01 0.00 0.00 0.00 0.00 0.00 0.22 0.02 0.52 0.11 -0.44 -0.33 0.13 0.28 -0.18 -0.30 -0.11 0.05 0.06 0.01 0.36 0.02 -0.01
PC9 -0.01 0.00 -0.06 0.00 0.00 0.00 0.00 0.50 -0.09 -0.14 -0.16 0.02 0.04 0.12 -0.09 -0.09 0.33 0.04 -0.53 -0.12 -0.28 0.39 -0.01 -0.15
PC10 -0.02 -0.01 0.07 0.00 0.00 0.00 0.00 0.21 0.72 0.21 -0.37 0.20 0.03 -0.05 0.24 0.12 -0.06 -0.04 0.01 -0.04 -0.20 -0.25 -0.05 -0.16
PC11 0.01 -0.02 0.05 0.00 0.00 0.00 0.00 -0.42 0.45 -0.14 0.28 0.16 -0.05 0.05 -0.07 0.13 0.07 -0.06 0.07 -0.07 -0.09 0.66 -0.06 -0.02
PC12 0.02 -0.01 0.03 0.00 0.00 0.00 0.00 0.41 0.25 -0.17 0.75 -0.20 0.03 -0.07 0.08 0.06 0.22 0.00 0.08 -0.08 -0.01 -0.25 -0.06 0.05
PC13 -0.02 0.03 -0.05 0.00 0.00 0.00 0.00 -0.43 0.22 0.17 0.12 -0.21 -0.26 0.18 -0.19 -0.16 0.16 -0.03 -0.59 0.01 0.01 -0.34 0.14 -0.04
PC14 -0.01 -0.03 -0.03 0.00 0.00 0.00 0.00 0.13 0.19 -0.04 -0.11 0.05 0.09 0.08 0.12 -0.01 0.17 -0.04 -0.18 0.17 0.87 0.13 -0.15 0.13
PC15 -0.02 -0.01 -0.02 0.00 0.00 0.00 0.00 0.00 0.05 0.08 -0.11 -0.02 0.01 0.04 0.02 0.03 0.01 -0.01 -0.08 -0.31 -0.15 0.00 -0.14 0.91
PC16 0.01 -0.05 0.03 0.00 0.00 0.00 0.00 0.06 0.04 0.02 -0.01 0.05 0.06 0.03 0.05 0.05 0.01 0.03 0.07 -0.44 0.20 0.06 0.86 0.01
PC17 -0.04 -0.06 -0.02 0.00 0.00 0.00 0.00 0.07 0.08 -0.04 0.03 0.06 0.07 -0.02 0.05 0.05 0.08 0.01 -0.03 0.81 -0.20 0.06 0.42 0.30
PC18 -0.09 0.99 0.09 0.00 0.00 0.00 0.00 0.02 0.01 0.00 0.01 0.02 0.03 0.01 0.02 0.02 0.02 0.01 0.01 0.02 0.02 0.02 0.06 0.03
PC19 0.88 0.12 -0.44 0.00 0.00 0.00 0.00 0.01 0.05 0.02 0.00 0.02 0.01 -0.04 0.01 0.02 -0.04 0.02 -0.01 0.02 -0.01 0.00 0.02 0.01
PC20 0.45 -0.04 0.88 0.00 0.00 0.00 0.00 0.00 -0.07 0.02 -0.01 0.00 0.01 0.00 0.00 0.00 0.01 -0.02 -0.12 0.04 0.01 0.00 -0.01 0.04
PC21 0.00 0.00 0.00 -0.05 0.94 -0.22 0.27 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
PC22 0.00 0.00 0.00 -0.95 -0.06 -0.23 -0.18 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
PC23 0.00 0.00 0.00 0.25 0.18 -0.36 -0.88 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
PC24 0.00 0.00 0.00 0.17 -0.29 -0.88 0.35 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
59 • Do PC14 ao PC24, nota-se que o comportamento do usuário deixa de ser
representado por viagens pendulares e rotineiras e passa a ser caracterizado por viagens
pontuais, em horários alternativos e pouco representativas. Nesses casos, é possível
perceber que, no geral, uma variável possui uma carga muito maior do que as outras, o
que significa que esta não está tão correlacionada com as demais. Os componentes com
essas características, não surpreendente, são aqueles que retêm menor quantidade de
informação da base, já que as viagens são esporádicas, não fazem parte de uma rotina do
usuário e, portanto, representam pouco da variância dos dados.
5.3.1.2 Variância
A partir da tabela 2, é possível identificar a participação de cada componente na
variância total dos dados, assim como a variância total acumulada, a medida em que são
considerados mais componentes na análise.
Tabela 2 - Variância por componente e acumulada - ACP aplicada a base de dados do
usuário I
Número de componentes
Variância por componente
Variância acumulada
1 13.41% 13.41% 2 11.94% 25.34% 3 10.34% 35.69% 4 9.81% 45.50% 5 8.45% 53.94% 6 6.76% 60.70% 7 6.16% 66.86% 8 5.99% 72.85% 9 4.84% 77.69%
10 4.27% 81.96% 11 3.90% 85.86% 12 3.73% 89.59% 13 2.88% 92.47% 14 2.37% 94.85% 15 1.61% 96.46% 16 1.24% 97.69% 17 1.10% 98.79% 18 0.44% 99.24% 19 0.41% 99.64% 20 0.36% 100.00% 21 0.00% 100.00% 22 0.00% 100.00% 23 0.00% 100.00% 24 0.00% 100.00%
60 Como prevê o método, os primeiros componentes são aqueles que carregam a
maior quantidade de informação da base de dados e, com apenas 10 componentes
principais, é possível explicar o comportamento do usuário I com mais de 80% de
precisão. Fato é que, como as variáveis (horas do dia) estão correlacionadas e as viagens
fazem parte de uma rotina de deslocamento que se repete ao longo do uso do aplicativo,
é compreensível que os primeiros componentes principais realmente retenham uma maior
variância das informações e representem os padrões de viagens mais comuns, ou seja, os
deslocamentos casa-trabalho/casa-estudo.
Já as contribuições dos componentes PC11 ao PC24 são consideravelmente mais
baixas do que os primeiros. Como visto no item anterior, eles representam viagens
realizadas em horários alternativos e, como pode ser observada pela variância associada
a esses componentes, essas viagens estão fora da rotina do usuário. São deslocamentos
realizados com frequência muito baixa e que pouco caracterizam o comportamento
padrão do indivíduo.
5.3.2 Cidade de Lisboa
5.3.2.1 Componentes principais
A tabela 3 apresenta os componentes extraídos da ACP aplicada ao banco de
dados contendo registros de todos os usuários do aplicativo BIKLIO na cidade de Lisboa.
Novamente, para facilitar a interpretação dos resultados, foram destacadas em cada linha
as variáveis que possuem maiores cargas fatoriais e que, portanto, caracterizam melhor
os respectivos componentes.
Sendo assim, algumas constatações podem ser feitas:
• O PC1 representa um padrão de viagem pendular, em que há um deslocamento
pela parte da manhã, cerca de 8:00, e outro na final da tarde, por volta de 18:00. O motivo
dessa viagem é, provavelmente, casa-trabalho/casa-estudo.
• O PC2 indica cargas fatoriais elevadas nos horários de 16:00 e 17:00 e uma carga
menor às 8:00. Esse componente pode estar associado a uma rotina pendular em que se
privilegia o uso de bicicleta, principalmente, no retorno para a residência.
• O PC3 também pode estar associado a dinâmica de viagem por motivo de
trabalho/estudo e apresenta cargas mais elevadas nos horários de 9:00 e 17:00.
61 • O PC4 apresenta cargas altas nos horários entre 13:00 e 16:00 e, também, às
16:00. Pode estar associado a deslocamentos para lazer, cursos, etc...
• PC5 e PC6 são caracterizados por viagens pendulares com retornos mais cedo e
mais tarde, respectivamente.
• PC7 apresenta cargas mais elevadas por volta do 12:00 e pode estar associado
ao uso da bicicleta em horário de almoço.
• O PC8 possui cargas fatoriais elevadas apenas por volta de 10:00. Esse padrão
pode estar associado, por exemplo, aos deslocamentos que são feitos por bicicleta quando
a origem é a casa, mas que na viagem de retorno é escolhido outro modo de transporte.
• Do PC9 ao PC12, nota-se que as cargas positivas estão distribuídas entre horários
de manhã, tarde e noite. Esses padrões podem estar associados aos dias de lazer e finais
de semana, por exemplo.
• O PC13 e PC14 estão associadas às rotinas de meio período, em que há uma
viagem por volta de 7:00 e outra entre 11:00 e 12:00.
• Do PC15 ao PC24, pode-se observar que o comportamento do grupo, assim
como o do usuário, deixa de ser representado por viagens pendulares e rotineiras e passa
a ser caracterizado por viagens pontuais, em horários alternativos e pouco representativas.
Dessa forma, esses componentes são, praticamente, associados à uma única variável e
retêm uma baixa parcela da variância dos dados.
62
Tabela 3 – Matriz de componentes - Aplicação da ACP na base de dados da cidade de Lisboa
Componente
00:00
01:00
02:00
03:00
04:00
05:00
06:00
07:00
08:00
09:00
10:00
11:00
12:00
13:00
14:00
15:00
16:00
17:00
18:00
19:00
20:00
21:00
22:00
23:00
PC1 -0.02 -0.01 -0.01 -0.01 -0.01 -0.02 -0.02 0.02 0.43 0.18 -0.11 -0.07 -0.08 -0.05 -0.05 -0.10 -0.06 0.17 0.83 0.12 -0.02 0.00 -0.01 -0.02
PC2 -0.01 -0.01 0.00 0.00 0.01 0.02 0.02 0.09 0.13 -0.34 -0.17 -0.05 -0.02 0.03 -0.01 0.11 0.38 0.74 -0.08 -0.31 -0.09 -0.02 -0.01 -0.02
PC3 -0.01 -0.01 -0.01 -0.01 -0.01 -0.02 -0.03 -0.03 0.24 0.71 0.20 0.07 0.11 0.13 0.14 0.08 0.00 0.40 -0.33 0.26 0.04 -0.03 0.01 -0.01
PC4 0.00 0.00 -0.01 -0.01 0.00 0.00 0.00 -0.09 -0.54 0.10 0.13 0.12 0.16 0.31 0.39 0.30 0.34 0.02 0.40 0.00 0.08 0.03 0.03 0.01
PC5 -0.01 0.00 0.00 0.00 0.00 0.00 0.00 0.02 0.48 0.16 0.09 0.12 0.12 0.22 0.07 0.10 0.30 -0.43 -0.03 -0.60 -0.08 -0.05 -0.04 -0.03
PC6 -0.01 0.00 -0.01 -0.01 0.00 -0.01 -0.01 0.06 0.40 -0.44 0.04 0.04 0.18 0.24 0.17 0.11 0.27 -0.17 -0.08 0.63 0.02 0.01 0.01 0.00
PC7 0.00 0.00 0.00 0.00 -0.01 -0.03 -0.04 -0.01 0.07 -0.27 0.21 0.22 0.36 0.39 0.14 -0.07 -0.66 0.20 0.06 -0.19 -0.05 0.00 0.00 0.01
PC8 -0.01 0.01 0.00 0.00 0.00 0.00 -0.01 -0.07 0.10 -0.18 0.81 0.13 -0.19 -0.45 0.09 0.08 0.06 0.07 0.08 -0.05 0.10 0.02 -0.01 0.01
PC9 -0.01 -0.01 0.00 0.00 0.00 0.00 -0.01 -0.07 0.17 -0.05 -0.21 -0.27 -0.40 -0.03 0.45 0.56 -0.33 -0.04 -0.07 -0.08 0.22 0.05 0.04 0.01
PC10 0.01 0.00 0.00 0.00 -0.01 -0.01 -0.02 -0.29 0.06 -0.05 0.02 -0.21 -0.12 0.21 0.19 -0.58 0.13 0.04 -0.05 -0.10 0.62 0.12 0.08 0.02
PC11 -0.01 0.00 0.00 0.00 0.00 0.00 -0.01 -0.02 0.06 0.01 -0.30 0.19 0.59 -0.60 0.30 -0.01 0.00 0.00 0.00 -0.06 0.25 0.07 0.05 0.00
PC12 0.01 0.00 0.00 -0.01 0.00 -0.01 0.00 -0.15 0.03 -0.01 -0.02 0.21 0.10 0.10 -0.64 0.43 -0.02 0.02 0.04 0.00 0.55 0.09 0.04 0.02
PC13 -0.01 -0.01 -0.01 -0.01 -0.01 -0.01 -0.01 0.76 -0.07 0.05 0.20 -0.47 0.22 0.03 -0.04 0.03 -0.02 -0.03 0.04 -0.05 0.29 -0.06 -0.04 0.00
PC14 -0.01 -0.01 -0.01 0.00 0.00 0.00 -0.01 0.52 -0.02 0.02 -0.16 0.68 -0.40 0.04 0.14 -0.14 -0.01 0.00 -0.01 0.02 0.20 0.06 0.00 0.00
PC15 0.00 0.02 0.00 0.00 -0.01 -0.02 -0.02 0.08 0.02 0.04 0.04 -0.06 0.03 0.02 -0.03 0.01 0.01 0.00 -0.02 -0.02 -0.17 0.97 0.10 0.00
PC16 0.00 0.01 0.01 0.00 -0.01 -0.01 -0.04 0.06 0.01 0.00 0.03 0.00 0.00 0.00 -0.04 0.00 0.01 -0.01 0.01 -0.02 -0.07 -0.12 0.98 0.14
PC17 0.10 0.02 0.03 0.00 -0.02 -0.02 -0.10 0.01 0.02 0.01 -0.01 0.00 0.00 0.00 0.01 0.00 0.02 0.01 0.01 -0.01 -0.02 0.00 -0.14 0.98
PC18 -0.07 -0.02 -0.01 -0.01 0.10 0.11 0.98 0.01 0.03 0.02 0.02 0.00 0.01 0.02 0.02 -0.01 -0.04 0.01 0.01 0.01 0.02 0.02 0.03 0.12
PC19 0.99 0.09 0.03 0.03 0.01 -0.03 0.08 0.02 0.02 0.00 0.00 0.00 0.00 -0.01 0.02 0.00 0.00 0.01 0.01 0.01 0.00 0.00 0.01 -0.09
PC20 0.03 0.07 0.02 0.04 -0.01 0.99 -0.11 0.00 0.02 0.01 0.01 0.01 0.01 0.01 0.01 0.00 -0.02 0.00 0.01 0.01 0.01 0.02 0.01 0.01
PC21 -0.10 0.98 0.16 0.05 0.00 -0.06 0.03 0.01 0.01 0.01 -0.01 0.00 -0.01 0.00 0.00 0.01 0.00 0.01 0.01 0.00 0.01 -0.02 -0.01 -0.01
PC22 -0.03 -0.17 0.88 0.38 0.22 -0.02 -0.01 0.01 0.00 0.00 0.01 0.00 0.00 0.01 0.00 0.00 0.01 0.00 0.01 0.00 0.01 0.00 0.00 -0.01
PC23 0.00 0.04 -0.30 0.17 0.93 -0.01 -0.10 0.01 0.00 0.00 0.00 -0.01 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.01
PC24 -0.02 0.00 -0.33 0.90 -0.27 -0.03 0.03 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.01
63 5.3.2.2 Variância
Tabela 4 - Variância dos componentes da ACP aplicada a base de dados da cidade de Lisboa
Número de componentes
Variância por componente
Variância acumulada
1 9.31% 9.31% 2 8.92% 18.23% 3 8.17% 26.41% 4 7.57% 33.97% 5 7.39% 41.36% 6 6.93% 48.30% 7 6.53% 54.83% 8 5.66% 60.49% 9 5.30% 65.79%
10 4.88% 70.66% 11 4.60% 75.26% 12 4.47% 79.73% 13 4.29% 84.02% 14 4.17% 88.18% 15 3.20% 91.39% 16 2.37% 93.76% 17 1.60% 95.36% 18 1.37% 96.73% 19 1.12% 97.86% 20 0.75% 98.61% 21 0.55% 99.16% 22 0.35% 99.51% 23 0.28% 99.79% 24 0.21% 100.00%
Da mesma forma que na análise dos dados do usuário I, a partir da tabela 4 é
possível identificar a participação de cada componente na variância total dos dados, assim
como a variância acumulada, a medida em que são considerados mais componentes na
análise.
Por mais que a base original contasse com registros de 454 indivíduos, a análise
do Gráfico 5.1 permitiu concluir que a maioria desses usuários não usavam com
frequência o aplicativo e, portanto, não armazenavam uma quantidade significativa de
dados de suas rotinas. Dessa forma, o comportamento do grupo foi dominado pelos
registros dos poucos usuários que usavam o app com uma frequência muito superior aos
outros.
64 Considerando os 12 componentes principais, é possível definir o padrão de
comportamento do grupo, representado pelos usuários do aplicativo BIKLIO da cidade
de Lisboa, com cerca de 80% de acurácia.
Mais uma vez, nota-se que os últimos componentes, principalmente a partir do
PC17, explicam muito pouco do comportamento dos usuários da cidade de Lisboa. Pode-
se concluir que mesmo na análise de grupo os padrões mais representativos de viagens
diárias são aqueles que contemplam um deslocamento pela parte da manhã,
provavelmente com destino de trabalho/estudo, e outro no final da tarde, com destino
casa.
5.3.3 Comparação de resultados
Comparando-se os dois resultados, é possível perceber que a aplicação da análise
de componentes principais no banco de dados de um único usuário do aplicativo fornece,
de forma geral, resultados mais representativos quanto aos padrões de viagem de
bicicleta. Fazendo uma análise da variância acumulada dos 5 componentes principais em
cada caso, no cenário do indivíduo, eles representam 53,9% da variância total da base de
dados, enquanto que na análise da cidade de Lisboa este número cai para 41,36%. Essa
diferença se justifica porque a rotina do usuário I, no primeiro cenário, não sofreu
interferência do comportamento dos demais usuários.
Outro ponto relevante é que o usuário I foi escolhido dentre aqueles que usavam
com mais frequência o aplicativo. É de se esperar que alguém que faz uso do app desde
o seu lançamento tenha um padrão diário de deslocamento de bicicleta mais bem definido
e, também, já tenha incorporado o uso do aplicativo na sua rotina, o que pode ter
contribuído para o aparecimento da diferença de resultados mencionada acima.
Além disso, analisando individualmente cada componente, é possível perceber
que as cargas fatoriais na primeira análise (do indivíduo) aparecem sempre concentradas
em duas ou três variáveis, o que permite traduzir melhor os padrões de comportamentos
observados. No segundo caso (da cidade de Lisboa), os componentes são mais difíceis de
serem interpretados porque as rotinas dos usuários se misturam e a distribuição das cargas
fatoriais fica mais caótica, como pode ser observado no PC4 desta análise. Apesar desse
componente explicar 7,57% do comportamento diário do grupo, ele não traduz com
clareza em quais momentos ocorrem as viagens.
65 É possível notar, ainda, que os últimos componentes de ambas as análises eram
pouco representativos e que eles basicamente correspondiam às viagens realizadas em
horários bem específicos, ou seja, estavam associadas à apenas uma variável. Apesar da
análise da cidade de Lisboa contar com registros de viagens de 454 usuários, não houve
registro de comportamento rotineiro de viagens de bicicleta na parte da noite e de
madrugada, por exemplo.
66 6 CONSIDERAÇÕES FINAIS
CONCLUSÃO
Este trabalho tem como principais objetivos: (i) expandir a literatura relacionada
ao tema da mobilidade urbana sustentável, (ii) expor a importância da análise de dados
como ferramenta para o desenvolvimento de cidades inteligentes e (iii) verificar os
resultados da aplicação de um método de análise multivariada em um banco de dados de
um aplicativo de mobilidade.
Conforme pôde ser observado ao longo do trabalho, a acelerado processo de
urbanização vivenciado nas cidades atualmente têm consequências sistemáticas na vida
dos cidadãos e no adequado funcionamento da infraestrutura urbana existente. No que
tange a mobilidade urbano, muito se tem discutido a respeito de mudanças em políticas
públicas e criação de novas tecnologias capazes de minimizar os impactos negativos
provocados pelo fortalecimento da cultura do transporte individual motorizado.
A partir da literatura existente, buscou-se detalhar os conceitos por trás da
mobilidade sustentável que, atualmente, devem englobar as três dimensões principais:
econômica, social e ambiental. Focando na mobilidade ativa como medida para tornar as
cidades socialmente justas, ambientalmente sustententáveis e economicamente viáveis,
foram expostos os benefícios associados ao uso da bicicleta, tanto para o usuário quanto
para a comunidade, assim como as vantagens relacionadas a integração da malha
cicloviária aos transportes de massa, principalmente.
Corroborando para o debate a respeito das vias para o desenvolvimento da
mobilidade sustentável nas cidades, foram apresentados projetos que alinham a
tecnologia da informação e comunicação (TIC) ao aperfeiçoamento de serviços de
mobilidade e de políticas públicas. Também nesse contexto, foi discutido a importância
da TIC na consolidação de cidades inteligentes e na transformação de dados em
informação e conhecimento eficaz.
Sendo assim, a partir de um banco de dados de um aplicativo de mobilidade, que
visa, sobretudo, fomentar o uso de bicicletas nos centros urbanos, foi aplicado a técnica
de análise multivariada conhecida por Análise de Componentes Principais (ACP). O
cerne da pesquisa fica justamente por conta das informações retiradas da modelagem e na
interpretação dos resultados de forma a identificar os padrões de comportamentos dos
usuários do aplicativo.
67 Os resultados obtidos permitiram concluir que os padrões diários de viagens dos
usuários do aplicativo, considerando tanto uma análise individual quanto uma análise de
grupo, podem ser explicados por um número relativamente pequeno de componentes
principais. Na modelagem, as horas do dia representavam as variáveis independentes da
análise e, observando o peso que cada variável tinha sobre os componentes principais,
concluiu-se que os usuários mantinham um comportamento rotineiro e pendular, que
traduziam boa parte do histórico diário de deslocamentos por bicicleta usando o
aplicativo.
PESQUISAS FUTURAS
A pesquisa revela o potencial da análise de componentes principais em identificar
padrões diários do comportamento humano, neste caso, com relação à mobilidade por
bicicleta. Entretanto, a metodologia e o modelo implementados também estão sujeitos a
aprimoramentos.
Em trabalhos futuros, pode-se, por exemplo, fazer uma comparação dos
componentes principais, que definem os padrões diários de deslocamento mais relevantes,
em grupos de cidades culturalmente diferentes. Seria relevante, também, que a análise
fosse feita a partir de um banco de dados de sistemas de compartilhamentos de bicicletas,
os quais enfrentam muitos desafios relacionados à previsão de demanda e realocação dos
equipamentos. Outra possibilidade de extensão da pesquisa é com relação a interpretação
dos resultados de análise feitas em bases de diferentes grupos de usuários, como jovens e
adultos, mulheres e homens ou turistas e residentes, de forma que se possa até prever
comportamentos de determinados grupos sociais.
68 REFERÊNCIAS BIBLIOGRÁFICAS
ABLEY, S., HALDEN. D. The New Zealand accessibility analysis methodology. NZ Transport Agency research - report 512. New Zealand, 2013.
ANDRADE, J. N. e GALVÃO, D., 2016, O Conceito de Smart Cities aliado à Mobilidade Urbana. Revista HumanÆ. Questões controversas do mundo contemporâneo, v. 10, n. 1- (Ano, 2016)
LEMOS, A., “Cidades Inteligentes: de que forma as novas tecnologias —como a computação em nuvem, o big data e a internet das coisas — podem melhorar a condição de vida nos espaços urbanos?”. http://dx.doi.org/10.12660/gvexec.v12n2.2013.20720
AVILA, T., 2017, “O que faremos com 40 trilhões de gigabytes de dados disponíveis em 2020?” Disponível em : https://br.okfn.org/2017/09/29/o-que-faremos-com-os-40-trilhoes-de-gigabytes-de-dados-disponiveis-em-2020/. Acesso em: 1 set. 2019.
BERNARDES, R. C. et al., 2017, Cidades Inteligentes: casos e perspectivas para as cidades brasileiras. Led. Revista Tecnológica da Fatec Americana, vol. 05, n. 01, out-206/mar-2017.
BRONS, M., Givoni, M., Rietveld, P., 2009, “Access to railway stations and its potential in increasing rail use”, Transportation Research Part A, 43: 136-149, http://dx.doi.org/10.1016/j.tra.2008.08.002
C40 SÃO PAULO CLIMATE SUMMIT, 2011. Síntese do C40 São Paulo Climate Summit 2011. São Paulo: Prefeitura de São Paulo, 2011.
CARAGLIU, A., Del Bo, C. & Nijkamp, P., 2011. Smart cities in Europe. Journal of urban technology, 18(2), 65-82.
CARVALHO, L., 2017. Análise fatorial: um importante técnica multivariada. Disponível em: https://www.abgconsultoria.com.br/blog/analise-fatorial/. Acesso em: 20 set. 2019.
CARVALHO, C., 2016, “Mobilidade Urbana Sustentável: Conceitos, Tendências e Reflexões”. Disponível em: < http://repositorio.ipea.gov.br/bitstream/11058/6664/1/td_2198.pdf> Acesso em: 20 set. 2019
CERVERO, R., Caldwell, B., Cuellar, J., 2012, “Bike-and-Ride: Build It and They Will Come”, Institute of Transport Studies, University of California, Working Paper 2012-5, http://its.berkeley.edu/sites/default/files/publications/UCB/2012/VWP/UCB-ITS-VWP-2012-5.pdf
COSTA, M.S.; SILVA ,A.N.R.; RAMOS R.A.R., 2004, Indicadores de Mobilidade Urbana Sustentável para o Brasil e Portugal. CD: Workshop “Plano Integrado: em busca de desenvolvimento Sustentável para Cidades de Pequeno e Médio Portes”. Universidade do Minho, Braga, Portugal, 2004.
69 COSTA, M. da S. Um índice de mobilidade urbana sustentável. Tese de Doutorado. São
Paulo: Universidade Federal de São Carlos, 2008.
COMISSÃO EUROPÉIA, 2000, Cidades para Bicicletas, Cidades de Futuro, Luxemburgo, Serviços das Publicações Oficiais das Comunidades Européias.
CURTIS, C., 2008, Planning for sustainable accessibility: the implementation challenge. Transport Policy, 15, 104-112, 2008.
CRUZ, W., 2015, Bicicletas atrapalham o trânsito?. Disponível em: < http://vadebike.org/2012/03/bicicletas-nao-atrapalham-o-transito/>. Acesso em: 23 mar, 2020
DAMASIO, B. F., 2012. Uso da análise fatorial exploratória em psicologia. Avaliação Psicológica, 2012, 11(2), pp. 213-228
DELLOITE, 2017. “Assessing the value of TfL’s open data and digital partnerships”.
DUTTA, S. et al., 2012. The Global Innovation Index 2011: accelerating growth and development. Fontainebleau: INSEAD, 2011. ERNST
EAGLE, N. e PENTLAND, A., 2009, Reality mining: sensing complex social systems. Pers Ubiquit Comput 4:255–268
ELLEN MACARTHUR FOUNDATION, 2015, Growth Within: a circular economy vision for a competitive Europe (2015)
ELLEN MACARTHUR FOUNDATION, 2019, Circular Economy in Cities, Disponível em: < www.ellenmacarthurfoundation.org/our-work/activities/> Acesso em: 4 nov. 2019
EPA., 2012, Sources of greenhouse gas emissions. United States Environmental Protection Agency, 2012.
FERSI/ ECTRI., 2009, The sustainable safety approach to Road Transport and Mobility. Road Safety Roadmap (Final Version, 23.01.09).
FIGUEIREDO FILHO, Dalson Brito; SILVA JUNIOR, José Alexandre da, 2010. Visão além do alcance: uma introdução à análise fatorial. Opin. Publica, Campinas , v. 16, n. 1, p. 160-185, June 2010
FINGER, B. et al., 2017. Research for TRAN Committee – Infrastructure funding challenges in the sharing economy, European Parliament, Policy Department for Structural and Cohesion Policies, Brussels
FIRJAN, 2019. Post sobre cidades inteligentes. Disponível em: https://www.instagram.com/casafirjan/
FISHMAN, E., 2016, Bikeshare: A Review of Recent Literature, Transport Reviews: A Transnational Transdisciplinary Journal
GANTZ, J., RAISEL, D., 2012, “The Digital Universe In 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East. EMC Corporation”. Disponível
70 em: http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-
2020.pdf. Acesso em: 10 set. 2019.
GÄRLING, T, Eek, D, Loukopoulos, P, Fujii, S, Johansson-Stenman, O, Kitamura, R, Pendyala, R. E Vilhelmson, B., 2003, “A Conceptual Analysis of Impact of Travel Demand Management on Private Car Use”. Running Head: Impacts of Travel Demand Management. Transport Policy, 9(1), p. 59-70.
HADDAD, P. R., 2001, Clusters e desenvolvimento regional no Brasil. Revista Brasileira de Competitividade, ano 1, no 2, ago-nov./2001.
HAIR, J. F., Anderson, R. E., Tatham, R. L. & Black, W. C., 2005. Análise multivariada de dados. Publicado por Bookman Companhia Editora Ltda.
HOLDEN, E., LINNERUD, K., BANISTER, D. Sustainable passenger transport: back to Brundtland. Transportation Research Part A, 54, 2013, p.67-77.
JOLLIFFE, I. T., 2012. Principal Component Analysis, Second Edition.
JOLLIFFE, I. T. e MORGAN, B. J. S., 1992. Principal component analysis and exploratory factor analysis. Stat Methods Med Res 1992 1: 69 DOI: 10.1177/096228029200100105
KAGER, R. E HARMS, L., 2017, Synergies from Improved Cycling -Transit Integration: Towards an integrated urban mobility system. Prepared for the Roundtable on Integrated and Sustainable Urban Transport 24-25 April 2017, Tokyo
KLINGER, T., 2017, Moving from monomodality to multimodality? Changes in mode choice of new residents. Transportation Research Part A (in press) http://dx.doi.org/10.1016/j.tra.2017.01.008
KUMAR, V., Chattaraman, V., Neghina, C., Skiera, B., Aksoy, L., Buoye, A. & Henseler, J., 2013. Data-driven services marketing in a connected world. Journal of Service Management, 24(3), 330-352.
KUSAKABE, E., 2013, Advancing sustainable development at the local level: the case of machisukuri in Janapense cities. Progress in Planning, 80, pp. 1-65, 2013.
LEMOS, D. S. da C. P. da S., 2011, Análise das relações existentes entre a acessibilidade e o desenvolvimento no município de Petrópolis. Tese de Doutorado. Rio de Janeiro: UFRJ, 2011.
LIM, C. H., Kim, M. J., Heo, J. Y. & Kim, K. J., 2015. Design of informatics-based services in manufacturing industries: case studies using large vehicle-related databases. Journal of Intelligent Manufacturing.
LITMAN, T., 2008, Sustaibable transportation indicators: a recommended research program for developing sustainable transportation indicators and data. Paper 09-3403. Transportation Research Board Annual Meeting, 2008.
71 LITMAN, T., 2015, Evaluating accessibility for transportation planning measuring
people’s ability to reach desired goods and activities. Victoria Transport Policy Institute. 56 p., 2015.
LITMAN, T., FITZROY, S. Safe travels: evaluating mobility management traffic safety impacts. Victoria Transport Policy Institute. 64 p., 2014
LUZ, G., 2018, Mobility as a Service na promoção da mobilidade sustentável: O caso do Rio de Janeiro. Projeto de Graduação – UFRJ / Escola Politécnica / Rio de Janeiro
MACHADO, L., 2010, Índice de mobilidade sustentável para avaliar a qualidade de vida urbana: estudo de caso na região metropolitana de Porto Alegre. Dissertação de Mestrado. Porto Alegre: Universidade Federal do Rio Grande do Sul, 2010.
MAGLIO, P. e LIM, C., 2016. Innovation and Big Data in Smart Service Systems. Journal of Innovation Management (2016).
MANLY, B. F. J., 2005. Multivariate Statistical Methods: A primer. Fourth edition.
MANYKA, J., Chui, M., Brown, B., Bughin, J, Dobbs, R., Roxburgh, C., and Byers, A., 2011. Big data: The Next Frontier For Innovation, Competition, And Productivity. McKinsey Global Institute. Disponível em: http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation. Acesso em: 30 ago. 2019
MELLO, A. J. R. A Acessibilidade ao Emprego e Sua Relação Com a Mobilidade e o Desenvolvimento Sustentáveis: o caso da Região Metropolitana do Rio de Janeiro. Rio de Janeiro, 2015. Tese (Doutorado em Engenharia de Transportes) – Programa de Engenharia de Transportes, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2015.
MINISTÉRIO DAS CIDADES, 2007b, Plano de Mobilidade por Bicicleta nas Cidades, Coleção Bicicleta Brasil, caderno 1, Secretaria Nacional de Transporte e da Mobilidade Urbana, Brasília.
MINITAB, 2019. Disponível em: https://support.minitab.com/pt-br/minitab/18/help-and-how-to/statistics/basic-statistics/supporting-topics/correlation-and-covariance/what-is-covariance/. Acesso em: 20 set. 2019
ONU, 2012. World Urbanization Prospects, The 2011 revision, 2012. Disponível em http://esa.un.org/unpd/wup/index.htm. Acesso em 15. set. 2019.
ONU, 2019, “ Transformando Nosso Mundo: A Agenda 2030 para o Desenvolvimento sustentável” Disponível em: < https://nacoesunidas.org/pos2015/agenda2030/> Acesso em: 20 out. 2019
PITOMBO, C. S. e LINDNER, A., 2016. Modelo logit binomial com componentes principais para estimação de preferência por modo de transporte motorizado. The Journal of Trnsport Literature.
PORTER, C. D., Brown, A., Deflorio, J., Mckenzie, E., Tao, W., Vimmerstedt, L., 2013, Effects of travel reduction and efficient driving on transportation: energy use and greenhouse gas emissions. Transportation Energy Future Series. 98p, 2013.
72 PUCHER, J., Dill, J. and Handy, S., 2010, “Infrastructure, programs, and policies to
increase bicycling: An international review”, Preventive Medicine, 50
SAHA, S. 2018. “Baffled by Covariance and Correlation??? Get the Math and the Application in Analytics for both the terms..”. Disponível em: https://towardsdatascience.com/let-us-understand-the-correlation-matrix-and-covariance-matrix-d42e6b643c22. Acesso em: 20 set. 2019.
SARTORIO, S. D., 2008. Aplicações de técnicas de análise multivariada em experimentos agropecuários usando o software R. Dissertação apresentada para obtenção do título de Mestre em Agronomia.
SHAHEEN, S., GUZMAN, S. e ZHANG, H., 2010, Bikesharing in Europe, the Americas, and Asia, Transportation Research Record: Journal of the Transportation Research Board.
SILVEIRA, M. O., 2010, Mobilidade Sustentável: A Bicicleta Como Um Meio De Transporte Integrado. Dissertação de Mestrado, COPPE, da UFRJ
SINDIPEÇAS e ABIPEÇAS, 2019, Relatório da Frota Circulante. Disponível em: < https://www.sindipecas.org.br/sindinews/Economia/2019/RelatorioFrotaCirculante_Maio_2019.pdf> Acesso em: 10 jan. 2020
SOUZA, A., 1995. Aplicações De Algumas Técnicas Multivariadas. Disponível em: ftp://ftp.ufv.br/def/disciplinas/ENF642/ApostilaTECMULTIVARIADAS
UITP., 2003, Better urban mobility in developing countries: solutions and good practices. Union Internationale des Transports Publics. Brussels. December. 43 p., 2003
UN HABITAT, 2013, Planning and Design for sustainable urban mobility. Global report on human settlements 2013 - United Nations Human Settlements Programme
TRACE, 2019. Disponível em: http://h2020-trace.eu/trace-tools/biklio/
VASCONCELLOS, E. A., 2011, “Transporte e mobilidade urbana”. Disponível em: < http://repositorio.ipea.gov.br/bitstream/11058/1373/1> Acesso em: 10 jan. 2019
WAPC., 2012, Guidelines for preparation of integrated transport plans. Western Australian Planning Commission, 2012.
WCED. World Comission on Environment and Development. Our Commom Future. Oxford and New York: Oxford University Press, 1987. Disponível em: http://www.un- documents.net/ourcommon-future.pdf
WELCH, T.F. & MISHRA, S., 2013, A measure of equity for public transit connectivity. Journal of Transport Geography, 33, 29–41, 2013.
WELCH, T.F.,2013, Equity in transport: The distribution of transit access and connectivity among affordable housing units. Transport Policy, 30, 283–293, 2013.
WOLFRAM, M., 2012. Deconstructing smart cities: an intertextual reading of concepts and practices for integrated urban and ICT development. 2012. p. 171-181.