dissertação.avaliação.imóveis
TRANSCRIPT
-
8/12/2019 Dissertao.Avaliao.Imveis
1/104
Universidade Federal de Santa Catarina
Programa de Ps-Graduao em Engenharia de Produo
CONSTRUO DE UM MODELO DE REGRESSO
PARA AVALIAO DE IMVEIS
Dissertao de Mestrado
Sebastio Gazola
Florianpolis
2002
-
8/12/2019 Dissertao.Avaliao.Imveis
2/104
CONSTRUO DE UM MODELO DE REGRESSO
PARA AVALIAO DE IMVEIS
Dissertao apresentada no
Programa de Ps-Graduao em
Engenharia de Produo a
Universidade Federal de Santa Catarina
como requisito parcial para obteno
do grau de Mestre em
Engenharia de Produo.
Orientador: Pedro Alberto Barbetta, Dr.
Florianpolis
2002
-
8/12/2019 Dissertao.Avaliao.Imveis
3/104
Sebastio Gazola
Construo de um Modelo de Regresso
para Avaliao de Imveis
Esta dissertao foi julgada adequada e aprovada para a
obteno do ttulo de Mestre em Engenharia de Produo no
Programa de Ps-Graduao em Engenharia de Produo
da Universidade Federal de Santa Catarina
Florianpolis, 08 de outubro de 2002.
Edson Pacheco Paladini, Dr.
Coordenador do Programa
BANCA EXAMINADORA
________________________________
Prof. Pedro Alberto Barbetta, Dr.
Orientador
________________________________
Prof. Norberto Hochheim, Dr.
________________________________
Prof. Paulo Jos Ogliari, Dr.
-
8/12/2019 Dissertao.Avaliao.Imveis
4/104
A minha esposa, Vilma
pelo apoio constante.
A meus fi lhos Vicente e Marina.
-
8/12/2019 Dissertao.Avaliao.Imveis
5/104
AGRADECIMENTOS
minha faml ia, pelo apoio e compreenso, em especial
minha esposa Vilma;
Ao Departamento de Estatstica da UEM;
Prof. Terezinha Aparecida Guedes, pelo apoio;
Prof. Isolde Previdell i , pela viabilizao do curso;
todos os alunos do curso pelo apoio e amizade e em
especial s colegas Angela, Clara, Cldina e Zeza;
Ao Programa de Ps-graduao em Engenharia de Produo
da UFSC pelo empenho;
Prof. Eunice Passaglia e toda equipe do LED,
responsveis pelo funcionamento do curso;
Ao meu orientador, Prof. Pedro Alberto Barbetta, que apoiou
o desenvolvimento do trabalho e ofereceu todas as
contribuies necessrias para sua realizao;
a todos que direta ou indiretamente
contriburam para a realizao
desta pesquisa.
-
8/12/2019 Dissertao.Avaliao.Imveis
6/104
Resumo
GAZOLA, Sebastio. Construo de um modelo de regresso para
avaliao de imveis. 2002. 110f. Dissertao (Mestrado em
Engenharia de Produo) Programa de Ps-Graduao em
Engenharia de Produo, UFSC, Florianpolis.
Este trabalho apresenta uma estratgia de construo de um
modelo de regresso para determinar o preo de um imvel em funo
de suas caractersticas. O modelo foi determinado uti l izando-se a
Regresso Linear Mltipla com a tcnica de Ridge Regression , paracontornar o problema de multicolinearidade. A estratgia de construo
foi aplicada a um conjunto de dados referentes a apartamentos da
cidade de Cricima, SC. O modelo determinado apresentou-se de fcil
interpretao e util izao, util izando 11 variveis independentes e
proporcionando um bom ajuste aos dados e uma boa capacidade
preditiva. Ele atendeu todas as suposies tericas para sua
existncia e util izao.
Palavras-chave: Regresso Linear Mltipla, Avaliao de Imveis,
Multicolinearidade.
-
8/12/2019 Dissertao.Avaliao.Imveis
7/104
Abstract
GAZOLA, Sebastio. Construo de um modelo de regresso para
avaliao de imveis. 2002. 110f. Dissertao (Mestrado em
Engenharia de Produo) Programa de Ps-Graduao em
Engenharia de Produo, UFSC, Florianpolis.
This work presents a strategy for the building of a regression
model to determine the price of a property as a function of i ts
characteristics. The model was determined using the Multiple Linear
Regression with the Ridge Regression technique, to outline themulticoll inearity problem. The construction strategy was applied to a
data set from flats of the Cricima city, SC. The model was shown to be
of easy interpretation and use, applying 11 independent variables and
providing a good adjustment to the data and a good predictive capacity.
The theoretical suppositions for its existence and usage were met.
Key-Words: Multiple Linear Regression, Evaluation of flats,
Multicolinearity.
-
8/12/2019 Dissertao.Avaliao.Imveis
8/104
SUMRIO
1 - INTRODUO
1.1 - CONTEXTUALIZAO
1.2 - PROBLEMA
1.3 - OBJETIVOS
1.3.1 Objetivo Geral
1.3.2 Objetivos Especficos
1.4 - MTODOS DE DESENVOLVIMENTO DA PESQUISA
1.5 DELIMITAES DA PESQUISA
1.5 ESTRUTURA
2 - AVALIAO DE IMVEIS
2.1 INTRODUO
2.2 MERCADO IMOBILIRIO
2.3 VALOR
2.4 MTODOS DE AVALIAO
2.5 AMOSTRAGEM EM MERCADO IMOBILIRIO
2.6 NVEIS DE RIGOR
3 MTODOS REGRESSO LINEAR MLTIPLA
3.1 INTRODUO
3.2 O MODELO
3.3 INFERNCIA ESTATSTICA
3.3.1 Intervalos de Confiana
3.3.2 Testes de Hipteses
3.4 PODER DE EXPLICAO DO MODELO
3.5 RELACIONAMENTO ENTRE VARIVEIS
3.5.1 Correlao
3.5.2 Anlise Fatorial de Correspondncias
3.6 TRANSFORMAES DE VARIVEIS
3.6.1 Linearidade
14
14
16
16
16
16
17
18
18
20
20
21
22
24
26
28
30
30
31
33
34
35
37
38
38
40
41
42
-
8/12/2019 Dissertao.Avaliao.Imveis
9/104
3.6.2 Varincia no-constante e no-normalidade dos
Erros
3.6.3 Variveis Dummy
3.7 MULTICOLINEARIDADE
3.7.1 Efeitos da Multicolinearidade
3.7.2 Detectando a Multicolinearidade
3.7.3 Solues para o Problema da Multicolinearidade
3.8 SELEO DE VARIVEIS REGRESSORAS
3.8.1 Cuidados no Uso do Modelo
3.9 RESDUOS
3.9.1 Anlise de Resduos3.10 DIAGNSTICO DO MODELO
4 ESTRATGIA PARA A CONSTRUO DO MODELO
E APLICAO EM UM ESTUDO DE CASO
4.1 ROTEIRO PARA CONSTRUO DO MODELO
4.1.1 Identificao das Variveis Independentes
4.1.2 Levantamento de dados
4.1.3 Transformaes de Variveis
4.1.4 Anlise Exploratria
4.1.5 Construo do Modelo
4.1.6 Anlise Crtica das Variveis
4.1.7 Anlise dos Resduos
4.1.8 Verificao da Aplicabilidade do Modelo
4.2 CASO EM ESTUDO4.3 IDENTIFICAO E APRESENTAO DAS VARIVEIS
4.4 LEVANTAMENTO DE DADOS
4.5 TRANSFORMAO DE VARIVEIS
4.6 ANLISE EXPLORATRIA DAS VARIVEIS
4.6.1 Relao da varivel dependente com as
variveis independentes
4.6.2 Multicolinearidade
44
45
46
47
49
51
53
57
57
5861
65
65
65
66
67
68
69
70
71
72
7373
74
75
80
80
84
-
8/12/2019 Dissertao.Avaliao.Imveis
10/104
4.7 CONSTRUO DO MODELO
4.8 ANLISE DE RESDUOS
4.9 AVALIAO PRTICA DO MODELO CONSTRUDO
4.10 CONSIDERAES
5 CONSIDERAES FINAIS
5.1 Concluses
5.2 Sugestes para novas pesquisas
REFERNCIAS
APNDICE
Apndice A: Plotagem das variveis uti l izando anlise
fatorial de correspondncias
Apndice B: Correlao entre as variveis independentes
Apndice C: Grficos de cada varivel independente do
modelo versus resduos padronizados
Apndice D: Omisso de variveis valores observados das
variveis independentes versus resduos
86
89
94
97
98
98
100
101
105
105
106
107
109
-
8/12/2019 Dissertao.Avaliao.Imveis
11/104
LISTA DE FIGURAS
Fig. 3.1 - Exemplo de relao linear pela plotagem da variveldependente versus varivel independente 43
Fig. 3.2 - Exemplo de relao linear pela plotagem dos resduos
versus varivel independente 43
Fig. 3.3 - Exemplo de mdia zero 58
Fig. 3.4 - Exemplo de independncia dos erros pela plotagem de
resduos 59
Fig. 3.5 - Exemplo de varincia no-constante pela plotagem dos
resduos versus varivel independente 60
Fig. 3.6 - Exemplo de distribuio normal dos erros pela
plotagem dos resduos 61
Fig. 3.7 - Exemplo de no adequao do modelo pela plotagem
dos resduos versus varivel independente 62
Fig. 3.8 - Exemplo de valores discrepantes pela plotagem dos
resduos versus valores ajustados 63
Fig. 3.9 - Exemplo da omisso de variveis independentes pela
plotagem da varivel dependente versus varivel
independente63
Fig. 4.1 Diagrama de caixa das variveis quantitati vas 78
Fig. 4.2 Diagrama de caixa das variveis quantitati vas 79
Fig. 4.3 Grfico de disperso da varivel dependente versus
variveis quantitativas independentes 81
Fig. 4.4 Varincia constante - plotagem de resduos versus
valores preditos 90
-
8/12/2019 Dissertao.Avaliao.Imveis
12/104
Fig. 4.5 Normalidade - plotagem de resduos versus valores
esperados esperados pela distribuio normal
91
Fig. 4.6 Valores discrepantes - plotagem dos valores preditosversus resduos padronizados 92
Fig. 4.7 Omisso de variveis - valores observados da varivel
sute versus resduos padronizados 92
Fig. 4.8 Omisso de variveis - valores observados da varivel
garagem versus resduos padronizados 93
Fig. 4.9 Omisso de variveis - valores observados da varivel
idade versus resduos padronizados 93
LISTA DE QUADROS
Quadro 4.1 Descrio das variveis independente quantitati vas 73
Quadro 4.2 Descrio das variveis independentes qualitativas 74
Quadro 4.3 Nova categorizao das variveis RH e ZF 75
Quadro 4.4 Transformao das variveis qualitativas em
dummy76
-
8/12/2019 Dissertao.Avaliao.Imveis
13/104
LISTA DE TABELAS
Tabela 3.1 Anlise de Varincia para testar a significncia domodelo 36
Tabela 4.1 - Correlao linear (Pearson) entre a varivel
dependente ln(preo) e as variveis independentes
quantitativas 80
Tabela 4.2 Teste F da ANOVA para varivel dependente
ln(preo) versus variveis independentesqualitativas 82
Tabela 4.3 Razes caractersticas da matriz das correlaes 85
Tabela 4.4 Ridge Regressionpara determinao da equao 87
Tabela 4.5 Medidas referentes ao ajuste da equao 87
Tabela 4.6 Anlise de varincia para a significncia da
equao 89
Tabela 4.7 Comparao da distribuio dos resduos
padronizados com a distribuio normal padro 90
Tabela 4.8 Percentual de valores preditos nas faixas de 5% a
40% 94
Tabela 4.9 Exemplo da variao do preo predito de um imvelde valor R$ 30.000,00 95
Tabela 4.10 Percentual de valores preditos nas faixas de 5% a
40%, pelo modelo construdo por Zancan, 1995 96
Tabela 4.11 Predies de novas observaes pela equao
ajustada 97
-
8/12/2019 Dissertao.Avaliao.Imveis
14/104
14
__________________________________________ Captulo 1
INTRODUO
1.1 - CONTEXTUALIZAO
Os primeiros estudos sobre avaliao de imveis no Brasil datam de1918, e em 1923 foram introduzidos novos mtodos de avaliao de
terrenos, que a partir de 1929 comearam a ser sistematicamente
aplicados. A partir da a engenharia de avaliao no Brasil vem
crescendo e evoluindo nas tcnicas de avaliao. Atualmente um
grande nmero de profissionais vem desenvolvendo estudos nesse
campo, visando dar matria o suporte cientifico necessrio como
apoio aos mtodos tcnicos at ento util izados (Fiker, 1997, p.17).
O desenvolvimento da engenharia de avaliao, o crescimento do
nmero de profissionais atuando nesse campo e as necessidade do uso
das tcnicas de avaliao pelo mercado privado e tambm pelos rgos
pblicos, levaram a Associao Brasileira de Normas Tcnicas a
elaborar a Norma para Avaliao de Imveis Urbanos n. 5676/89
(Antiga NB 502).
A Caixa Econmica Federal responsvel por aproximadamente200.000 laudos de avaliao por ano, envolvendo em torno de 3.500
engenheiros, sendo a maior entidade contratante ou executora de
servios de avaliao de imveis no pas (Dantas, 1998).
A possibi lidade de contribuir, atravs de uma simples, clara e
acessvel metodologia cientifica de Regresso Linear Mltipla e
Inferncia Estatstica, para essa gama de profissionais avaliadores e
empresas, no que se refere a dar subsdios para a melhoria da
-
8/12/2019 Dissertao.Avaliao.Imveis
15/104
15
qualidade das avaliaes, a principal justificativa para a realizao
deste trabalho.
Uma justificativa do porqu realizar a avaliao em massa de
imveis , principalmente, para a elaborao ou atualizao do
cadastro fiscal dos municpios, pois a base para cobrana dos
tributos. Os mtodos usados para manter estes cadastros atualizados
so, na maioria das vezes, no satisfatrios do ponto de vista da
realidade do mercado imobilirio, e tambm muito onerosos aos
municpios. Por isto, a grande maioria dos municpios tem seu cadastro
desatualizado, levando a injustias na tributao e grande perda na
arrecadao dos tributos, os quais so fundamentais para a
administrao pblica (Zancan, 1995, p.12-17). Assim, uma
metodologia adequada, ou seja, que tenha bom poder de predio e
no seja onerosa, de fundamental importncia aos municpios.
Outra importncia para a avaliao de imveis a realizao de
laudos de avaliao, relativos a programas habitacionais, a patrimnios
da Unio, seguros, entre outros (Dantas, 1998).
A regresso l inear mltipla foi escolhida como mtodo para ser
aplicado avaliao de imveis por fornecer um modelo de fcil
interpretao e, principalmente, de simples aplicabil idade .
Assim, o presente trabalho procura oferecer uma contribuio na
rea da Engenharia de Avaliao, mais especificamente, nos problemas
de avaliao em massa de imveis urbanos. Os dois pontos principais
dessa contribuio so: primeiro, a metodologia para construo de ummodelo de regresso linear mltipla para estimar o preo do imvel,
com um bom ajuste aos dados observados e que fornea uma
estimativa calibrada, no distante da realidade; e o segundo ponto
consiste na metodologia de anlise e diagnstico do modelo construdo.
-
8/12/2019 Dissertao.Avaliao.Imveis
16/104
16
1.2 - PROBLEMA
possvel construir um modelo de regresso linear mltipla queatenda todas as suposies tericas e que seja adequado para predizer
o valor de um imvel em funo de suas caractersticas?
1.3 OBJETIVOS
1.3.1 Objetivo Geral
O objetivo geral descrever como se pode construir um modelo de
regresso linear mltipla, que possa predizer o valor de um imvel emfuno de suas caractersticas.
1.3.2 Objetivos Especficos
1 - Identificar um conjunto de variveis independentes significativas
para comporem o modelo de regresso;
2 - Verificar se o modelo proposto atende todas as suposies tericas
consideradas inicialmente para sua existncia;
3 - Realizar o diagnstico do modelo para tomada de deciso quanto a
sua aceitao;
-
8/12/2019 Dissertao.Avaliao.Imveis
17/104
-
8/12/2019 Dissertao.Avaliao.Imveis
18/104
18
1.5 DELIMITAES DA PESQUISA
Dentre as vrias tcnicas que podem ser util izadas para a avaliaode imveis, restringiu-se nesta pesquisa, ao uso das tcnicas clssicas
de regresso l inear mltipla.
A aplicao da estratgia de construo de um modelo de
regresso, proposto nesta dissertao, restringe-se aos imveis
descritos por Zancan (1995). Observa-se que os dados foram obtidos
pela prpria pesquisadora, usando o banco de dados imobilirio de
Cricima, SC, em confronto com o cadastro urbano do municpio. Aamostragem util izada no est claramente especificada.
1.6 ESTRUTURA
A dissertao est estruturada em cinco captulos, construdos de
forma facilitar o entendimento e compreenso do leitor desde os
objetivos at a concluso.
O primeiro captulo, denominado introduo, faz uma
contextualizao do assunto, cita o problema de pesquisa, os objetivos,
os mtodos para desenvolvimento do trabalho e sua estrutura.
O segundo captulo trata da reviso de literatura sobre a avaliao
de imveis. Apresenta os principais conceitos e definies relacionadas
a definio de imveis urbanos.
O captulo trs apresenta toda metodologia estatstica necessria,
de forma detalhada, da construo at o diagnstico do modelo, para
realizao da anlise de dados com a finalidade de atingir os objetivos
do trabalho.
O captulo quatro descreve um roteiro estratgico para a construodo modelo e faz a anlise dos dados, do caso dos apartamentos da
-
8/12/2019 Dissertao.Avaliao.Imveis
19/104
19
cidade de Cricima (Zancan, 1995), descrevendo detalhadamente os
resultados e realizando a anlise para cada um deles.
O captulo cinco faz uma concluso com base nos estudos
realizados nos captulos anteriores e apresenta sugestes para outras
possveis anlises que podem ser realizadas.
-
8/12/2019 Dissertao.Avaliao.Imveis
20/104
20
_______________________________________________ Captulo 2
AVALIAO DE IMVEIS
2.1 - INTRODUO
A necessidade de uma avaliao adequada de imveis cresceu e
evoluiu junto com o prprio crescimento e evoluo do mercado
imobilirio, j que ambos so complementares e interdependentes.
A tentativa de contextualizar o cone avaliao cria uma l ista
interminvel de conceitos, onde cada autor contextualiza de acordo
com as suas prioridades pessoais. Na verdade, isto possvel se
considerarmos a multidisciplinidade da avaliao, ou seja, sua
dependncia tanto de tcnicas racionais (nas reas de cincias exatas,
naturais e sociais) como de percepo no-racional (bom-senso e bom-
julgamento). A introduo do feeling que torna possvel a
variabil idade contextual (IBAPE, 1974, p.64; Ayres, 1996, p.11), e a
multidiscipl inidade que torna a avaliao flexvel (Dantas, 1998, p.3).
Existem vrias formas diferentes de se desenvolver as avaliaes
de imveis, dependendo dos dados disponveis ou da preferncia do
avaliador. Outras vezes, o imvel pode ser avaliado percorrendo-se
caminhos diferentes para a confirmao do valor de avaliao (Moreira
Filho, et al. 1993, p.4).De forma geral e resumida, pode-se definir avaliao como uma
operao tcnica realizada na estimativa do valor de um bem; ou como
uma determinao tcnica do valor de um imvel e/ou de um direito
sobre ele (NBR 5676/90); ou ainda como uma arte, dependente de
conhecimento tcnico e de bom-senso, de estimar valores
propriedades especficas (Moreira, 1990).
Sem dvida, esta lt ima definio genericamente mais apropriada,pois considera o conhecimento tcnico e a capacidade de percepo
-
8/12/2019 Dissertao.Avaliao.Imveis
21/104
21
no-tcnica de um bem. Agora, independentemente do conceito de
avaliao que tomemos como adequada, necessrio definir o valor do
bem considerado e o prprio mercado imobilirio.
2.2 - MERCADO IMOBILIRIO
O mercado imobilirio a instncia de determinao dos preos de
imveis urbanos que, como quaisquer outras mercadorias, passa pelo
crivo da oferta e da demanda (Moscovitch, 1997).
A existncia do mercado imobil irio depende da presena de trscomponentes: os bens imveis disponveis, os vendedores e os
compradores. Assim sendo, o fator determinante na formao dos
preos ser a relao quantitativa dentre os trs, onde a situao ideal
ser aquela onde haja uma abundncia equilibrada dentre os mesmos.
Isto determinar, num dado momento, um preo de equilbrio de
mercado que podemos considerar como sendo um preo justo. Este
mercado, considerado como sendo de concorrncia perfeita, inatingvel. O extremo esta situao, ou seja, um mercado de
concorrncia imperfeita, cria um desbalano que faz os preos se
afastarem do ideal ou justo. o caso do monoplio (raro) e oligoplio
(mais comum) que viesam os preos para cima; ou do monopsnio
(raro) e ol igopsnio (mais comum) que viesam os preos para baixo.
Obviamente, somente no mercado de concorrncia perfeita, a
construo do valor de um bem pode seguir a lei da oferta e procura(Dantas, 1998, p.9).
Os imveis so bens economicamente nicos, pois so
heterogneos, fixos e durveis. A durabilidade permite a formao de
estoque que domina o mercado, a heterogeneidade o torna
insubstituvel, e a imobilidade o relaciona com a acessibilidade e com a
estrutura vicinal (Smith et al., 1988). Se associarmos isto ao fato do
mercado ser particulado e, portanto, contar com a ao simultnea de
vrios agentes no coordenados, poderemos explicar, pelo menos
-
8/12/2019 Dissertao.Avaliao.Imveis
22/104
22
parcialmente, a enorme variabilidade de preos (Gonzlez e Formoso,
2000).
A indeslocabil idade torna o imvel um bem imperfeito por natureza,
ou seja, com diferenas inter e intra grupos de bens. Por este motivo, o
mercado imobilirio ser sempre de concorrncia imperfeita podendo
apresentar todas as gradaes de imperfeio. Dessa forma, cada bem
imobil irio acabar por gerar em torno de s um micro-mercado que
guardar caracteres to intimamente relacionados que dificultar a
relao deste com o macro-mercado que o circunda. Isto dificulta a
avaliao do bem porque condiciona a avaliao coleta de dados do
micro-mercado considerado. Se os elementos amostrais foreminsuficientes dentro do micro-mercado, a coleta de elementos do
macro-mercado circundante gerar tendncias de mercado que
invalidariam a avaliao (Auricchio apudTrivelloni, 1998, p.12).
2.3 - VALOR
Atribui-se valor a tudo que ti l ou escasso. Cabe avaliao
traduzir essa util idade ou escassez numa quantia monetria e associar
uma necessidade e/ou desejo de possuir um bem (Ayres, 1996, p.21).
Assim, pode-se definir valor como a relao entre a intensidade das
necessidades econmicas humanas, objetivas ou subjetivas, e a
quantidade de bens disponveis para atend-las (Fiker, 1997, p.21).
Vrios tipos de valores podem ser atribudos a um bem (Venal,Comercial, de Mercado, etc). No entanto, numa avaliao, o valor a ser
determinado o valor de mercado (Dantas, 1998, p.7). Estas
atribuies so impostas pelo mercado que determina o valor pela lei
da oferta e da procura. Assim, o valor de mercado o preo consciente
determinado por um vendedor e pago por um comprador a um bem, sem
coao de ambos os lados (Ayres, 1996, p.21).
O valor de um bem pode ser subjetivado dependendo das
circunstncias que envolvem a avaliao e do modo como examinado,
mas sempre depender de sua util idade. A localizao do imvel um
-
8/12/2019 Dissertao.Avaliao.Imveis
23/104
23
componente essencial de seu valor. Este valor estaria correlacionado a
aspectos que compem a qualidade de vida da rea urbana onde o
imvel est situado, por exemplo, as reas urbanas mais bem providas
de equipamentos pblicos so as que possuem imveis com maiores
valores venais. Por outro lado, independente da sua util izao, o valor
de um imvel a soma de dois sub-valores aditivos, o valor da
edificao que dada pelo seu custo (includa a remunerao do
construtor) e o valor do terreno que est intimamente relacionado s
condies urbanas de sua localizao (incorpora as vantagens e
desvantagens espaciais) (Moscovitch, 1997).
No entanto, o valor do bem difere e no deve ser confundido com opreo do bem, que representa a quantidade de dinheiro paga pelo
mesmo. Assim, a necessidade de venda ou compra imediata e/ou a no
existncia de um livre comrcio podem alterar o preo de um bem,
tornando-o superior ou inferior ao valor avaliado (Moreira Filho, 1993).
Dessa forma, defini-se o preo hednico como o preo implcito de
atributos e so revelados agentes econmicos a partir da observao
de preos de produtos diferenciados e a quantidade especfica decaractersticas a eles associados (Rosen, 1974).
O valor de mercado normatizado pela NBR 5676/90, como um
valor nico num dado instante, independente da finalidade da avaliao
e subjugada a um mercado de concorrncia perfeita. Obviamente, o
mercado imobilirio no , pela sua prpria natureza, de concorrncia
perfeita (Dantas, 1998, p.8). Na verdade, o mercado imobil irio um
dos segmentos de mercado que mais se ajusta ao mercado terico daconcorrncia imperfeita. Isto faz com que o preo de um bem seja
desviado daquele determinado teoricamente pelo mercado de
concorrncia perfeita (Barbosa Filho, 1988). Portanto, o que realmente
se paga numa negociao imobiliria o preo e no o valor (Dantas,
1998, p.8).
Existe, portanto, a necessidade da busca por tcnicas que tornem
mais precisas as formas de se estimar o valor de um bem aproximando-
o ao mximo do seu valor de mercado.
-
8/12/2019 Dissertao.Avaliao.Imveis
24/104
24
2.4 - MTODOS DE AVALIAO
Pode-se definir as metodologias avaliatrias como sendo as vrias
e diferentes vias percorridas com o objetivo de atribuir valor a um
imvel. Cada via util izada caracterizada como um mtodo de
avaliao diferente. No entanto, independentemente da metodologia
aplicada, esta dever apoiar-se em pesquisa de mercado e considerar
os preos comercializados e/ou ofertados, bem como outros elementos
e atributos que influenciam o valor (NBR-5676/90). A escolha da
metodologia mais apropriada para uma dada avaliao depende das
condies atuais do mercado, do tipo de servio a que se presta e dapreciso que se deseja.
Os mtodos avaliatrios pertencem a dois grupos, por vezes
conjugados, os mtodos diretos e os mtodos indiretos. Considera-se
um mtodo como sendo direto quando o valor resultado da avaliao
independe de outros. Por outro lado, o mtodo considerado indireto
sempre necessita de resultados de algum mtodo direto (Dantas, 1998,
p.15).Os mtodos diretos subdividem-se em mtodo comparativo de
dados de mercado e mtodo comparativo de custo de reproduo de
benfeitorias. J os mtodos indiretos organizam-se em trs grupos, o
mtodo de renda, o mtodo involutivo e o mtodo residual (NBR-
5676/90).
No mtodo comparativo de dados de mercado, o valor do bem
avaliado por comparao com dados do mercado similares quanto ascaractersticas intrnsecas e extrnsecas; para isto exige a presena de
um conjunto atual de dados que represente estatisticamente o
mercado. Portanto, qualquer bem pode ser avaliado por este mtodo,
desde que existam dados suficientes e atuais no mercado imobilirio
que possam ser util izados para represent-los estatisticamente
(Trivelloni, 1998, p.20; NBR 5676/90).
Pelo mtodo comparativo de custo de reproduo de benfeitorias, o
valor das benfeitorias avaliado pela reproduo dos custos
componentes, via composio dos custos baseada em oramento
-
8/12/2019 Dissertao.Avaliao.Imveis
25/104
25
simples ou detalhado, podendo incluir o valor do terreno e o custo da
comercializao e considerando o grau de desgaste fsico e/ou o
arcaicasmo funcional (Zancan, 1995; NBR 5676/90).
O mtodo da Renda avalia o valor do imvel ou de suas partes
componentes em funo de um rendimento j existente ou previsto pelo
bem no mercado, ou seja, o valor econmico do bem (Ayres, 1996,
p.23; NBR 5676/90).
No mtodo involutivo, o valor do terreno estimado por estudos da
viabilidade tcnica-econmica do seu aproveitamento, considerando
como aproveitamento eficiente a realizao de um empreendimento
imobil irio hipottico compatvel com as caractersticas do imvel ecom as condies do mercado (Moreira Filho, 1993, p.5; NBR 5676/90).
J pelo mtodo residual, obtm-se o valor do terreno a partir da
diferena entre o valor total do imvel e o valor das benfeitorias,
levando-se em conta o fator de comercializao (Fiker, 1997, p.27;
NBR 5676/90).
A uti l izao dos mtodos diretos tm preferncia e sempre que
existirem dados de mercado suficientes para util izao do mtodocomparativo ele deve ser escolhido (Dantas, 1998, p.15)
Quando analisa-se os vrios mtodos citados anteriormente, pode-
se observar que de uma forma, ou de outra, todos so comparativos.
No mtodo comparativo comparam-se bens semelhantes; no mtodo de
custo, comparam-se os prprios custos no mercado; nos mtodos da
renda e involutivo compara-se a possibilidade de renda do bem; e no
mtodo residual, compara-se o grau de comercializao do mercado(Dantas, 1998, p.44).
No entanto, quando a questo avaliao de imveis, o mtodo
mais util izado e recomendado o mtodo comparativo de dados de
mercado, j que este mtodo permite que a estimativa considere as
diferentes tendncias do mercado imobil irio que, por sua vez,
diferenciam-se das tendncias de outros ramos da economia. Este
mtodo estima valores baseado na comparao com outros
semelhantes, partindo-se de um grupo de dados somado s
informaes sobre transaes e ofertas do mercado, e originando com
-
8/12/2019 Dissertao.Avaliao.Imveis
26/104
26
isto uma amostragem estatstica de dados do mercado imobilirio. Na
prtica, de modo geral, a semelhana entre o imvel avaliado e os
componentes da amostra imperfeita e incompleta, por faltar algum
atributo que tenha influenciado no valor ou por apresent-lo de forma
parcial. Portanto, os atributos dos dados pesquisados que influenciam
o valor devem ser ponderados por homogeneizao ou inferncia
estatstica, respeitando os nveis de rigor definidos na NBR-5676/89. A
util izao da inferncia estatstica permite uma avaliao isenta de
subjetividade e repleta de confiabil idade (Moreira Filho, 1993, p.7;
Gonzlez, 2000).
Dentro deste contexto, podemos verificar que, tradicionalmente,usavam-se as tabelas na comparao de vendas para justificar o
estado real e/ou estimar valores aproximados. Mais recentemente, os
modelos de preos hednicos (regresso mltipla) tem sido util izados
para completar o mtodo de comparao de vendas. Contudo, os dois
mtodos tem experimentado crticas das comunidades acadmica e
profissional. O primeiro mtodo , freqntemente, crit icado por uti l izar
julgamentos subjetivos para determinar os ajustes necessrios etambm, por ser impreciso, tornando difci l para o avaliador obter
dados seguros e comprovados. A regresso mltipla tem produzido,
freqntemente, srios problemas para a avaliao do estado real que
resulta, primariamente, de estudos de multicolinearidade nas variveis
independentes e a partir de incluses de propriedades outlier na
amostra. Alm disso, a colinearidade dentro dos dados pode tornar a
regresso mltipla um modelo inadequado para um mercado que requerrespostas rpidas e precisas. No entanto, a regresso um mtodo
padro aceitvel para a avaliao de imveis. (Worzala et al. 1995).
2.5 AMOSTRAGEM EM MERCADO IMOBILIRIO
Quando se trabalha com o mercado imobilirio, qualquer que seja o
segmento, terrenos urbanos, imveis t ipo apartamentos, imveis t ipo
residncias, etc., geralmente impraticvel a obteno dos dados de
-
8/12/2019 Dissertao.Avaliao.Imveis
27/104
27
toda a populao. Isto ocorre devido ao grande nmero de elementos
na populao, custos elevados para obteno dos dados ou o grande
perodo de tempo que se faz necessrio. Assim, conveniente
trabalhar com uma amostra (Dantas, 1998, p.69).
A situao ideal para uma amostra aquela onde cada elemento da
populao tem a mesma probabilidade de ser selecionado, ou seja,
uma amostra do t ipo probabilst ica aleatria. Em muitos casos, ainda,
se faz necessrio uma amostra do t ipo probabilst ica aleatria
estratificada. Esta ltima deve ser usada quando se tem, por exemplo,
regies e a populao de indivduos difere consideravelmente de uma
para a outra.Quando se trabalha com dados de mercado muito difcil de se ter
uma amostra estatisticamente ideal. Para no inviabilizar as
inferncias, deve-se evitar usar um banco de dados, sem a
investigao do mercado no momento de realizar uma nova avaliao.
Podem ter ocorrido mudanas no mercado e estas no poderiam deixar
de serem captadas pela amostra, caso contrrio a amostra seria
tendenciosa. Ainda, a amostra deve ser equilibrada, por exemplo,quando uma categoria for exageradamente maior que as outras, acima
de 70%, deve-se ajustar um modelo especfico para tal categoria. A
amostra deve ser formada por imveis cujos preos, ou valores, so os
praticados no mercado e com todas suas caractersticas fsicas,
locacionais e econmicas (Dantas, 1998, p.49).
O preo praticado aquele que resulta de uma livre negociao
entre o vendedor e o comprador. Este preo representativo domercado ou da populao em estudo. J os preos de oferta podem
elevar o valor da mdia dos preos praticados no mercado, podendo
servir como um indicador do l imite superior dos preos de mercado.
Contudo, podem fazer parte da amostra, desde que, atualizados e
identificados. Por outro lado, no devem compor a amostra, os preos
provenientes de desapropriaes, transmisso causa mortis,
transaes entre parentes e outro (Dantas, 1998, p49-51).
-
8/12/2019 Dissertao.Avaliao.Imveis
28/104
28
2.6 - NVEIS DE RIGOR
Os nveis de rigor que caracterizam uma determinada avaliao de
acordo com a preciso obtida no trabalho, so normatizados pela NBR
5676/90. O nvel de rigor almejado numa dada avaliao relaciona-se
diretamente com as informaes extradas do mercado, ou seja, a
preciso do mercado ser determinada por este nvel que ser, por sua
vez, tanto maior quanto menor for a subjetividade presente na
avaliao. O rigor de uma avaliao est condicionado abrangncia
da pesquisa, confiabilidade e adequao dos dados coletados,
qualidade do processo avaliatrio e ao menor grau de subjetividadeempregado pelo avaliador. Assim, os trabalhos avaliatrios podem, de
acordo com a norma, ser classificados como de nvel de rigor expedito,
normal, r igoroso e rigoroso especial.
Na avaliao expedita o valor obtido sem a util izao de qualquer
instrumento matemtico. Dessa forma, a ausncia de rigor matemtico
determina que o valor seja atribudo atravs de escolha arbitrria, no
caracterizando o aspecto tcnico da avaliao, e bastando somenteque o avaliador tenha bom nvel de conhecimento de mercado.
A avaliao normal uti l iza mtodos estatsticos e requer exigncias
com relao coleta e tratamento dos dados. Permite a
homogeneizao dos elementos e a eliminao estatstica de dados
discrepantes sempre que o nmero destes for maior ou igual a cinco.
Nas avaliaes rigorosas, o trabalho dever apresentar, atravs de
metodologia adequada, iseno de subjetividade. O tratamento dosdados devem se basear em processos de inferncia estatstica que
permitam calcular estimativas no tendenciosas do valor. O valor f inal
da avaliao, resultado do tratamento estatstico adotado, deve estar
contido em um intervalo de confiana fechado e mximo de 80%, desde
que as hipteses nulas sejam testadas ao nvel de significncia mximo
de 5%.
A avaliao rigorosa especial caracteriza-se pelo encontro de um
modelo estatstico o mais abrangente possvel, ou seja, que incorpore o
maior nmero de caracteres que contribuem para a formao do valor.
-
8/12/2019 Dissertao.Avaliao.Imveis
29/104
29
A funo estimada da formao de valor deve ser eficiente e no
tendenciosa, portanto, as hipteses nulas da equao de regresso
devem ser rejeitadas ao nvel de significncia mximo de 1%, e dos
respectivos coeficientes ao nvel de significncia mximo de 10%
unicaudal ou 5% em cada ramo do teste bicaudal. Devem ser
analisadas as seguintes condies bsicas referentes aos resduos no
explicados: normalidade, homocedasticidade, no auto-regresso e
independncia entre variveis independentes.
-
8/12/2019 Dissertao.Avaliao.Imveis
30/104
30
_______________________________________________ Captulo 3
MTODOS - REGRESSO LINEAR MLTIPLA
3.1 - INTRODUO
A origem do termo Regresso deu-se por Francis Galton, quando
em um ensaio com pais e fi lhos ele estudou o relacionamento das
alturas dos mesmos. A lei de regresso universal de Galton foi
confirmada mais tarde por Karl Pearson, que atravs de um grande
ensaio constatou que a altura mdia dos filhos de pais altos era inferior
a altura de seus pais e que a altura mdia de filhos de pais baixos era
superior a altura de seus pais, ou seja, ele concluiu que a altura tanto
dos filhos altos como baixos tendem para a mdia de todos os homens
(Gujarati, 2000, p.3).
Na atualidade, a interpretao da regresso bem diferente. De
modo geral pode-se dizer que a anlise de regresso o estudo de
uma varivel (a varivel dependente) em funo de uma ou mais
variveis (as variveis independentes), com o objetivo de estimar e/ou
prever a mdia populacional ou valor mdio da varivel dependente,
util izando valores observados por amostragem das variveis
independentes (Gujarati, 2000, p.9).
Atualmente a anlise de regresso mltipla uma das ferramentasou mtodos estatsticos uti l izados com maior freqncia. uma
metodologia estatstica para predizer valores de uma varivel resposta
(dependente) para uma coleo de valores de variveis preditoras
(independentes).
Em engenharia de avaliaes, considera-se geralmente como
varivel dependente os preos vista de mercado em oferta e
efetivamente transacionados, e como variveis independentes ascaractersticas do imvel decorrentes dos aspectos fsicos e de
-
8/12/2019 Dissertao.Avaliao.Imveis
31/104
31
localizao, bem como de aspectos econmicos. Observa-se que as
variveis independentes podem ser tanto de natureza quantitativa como
qualitativa (Dantas, 1998, p.51,52).
A teoria econmica especif ica t ipicamente relaes funcionais
exatas entre variveis. Porm, na realidade, no se verif ica tal relao
funcional exata. Isto diz que a teoria econmica deve ser ampliada com
a introduo de elementos probabilsticos. Assim, a tarefa principal
administrar um ponto entre as relaes exatas e as relaes instveis
da realidade econmica (Goldberger, 1970, p.11-16).
3.2 - O MODELO
O modelo de regresso linear mltipla descreve uma varivel
dependente Y como funo de vrias variveis regressoras ou
independentes. Um modelo geral, com p variveis regressoras, dado
por:
Y i= 0 + 1X i 1 + 2X i 2+ ... + pX i p+ i ( i=1,...,n).
onde:
Y i representa as observaes da chamada varivel dependente,
varivel explicada ou varivel resposta;
X i k so chamadas de variveis independentes, variveis explicativas,variveis regressoras ou covariveis (k = 1, 2, ..., p);
i so os parmetros da populao;
i so os erros aleatrios
Os erros aleatrios representam os inmeros fatores que,
conjuntamente, podem interferir nas observaes da varivel
dependente Y (Charnet et al. , 1999, p.170).
-
8/12/2019 Dissertao.Avaliao.Imveis
32/104
32
A representao do modelo na forma matricial Y = X + , onde:
Y=
n
1
Y
Y
M X =
npn1
1p11
XX1
XX1
L
MOMM
L
=
p
0
M =
n
1
M
A funo de regresso do modelo, descrita em termos de valor
esperado, dada por:
E(Y) = 0+ 1X1 + 2X2+ ... + pXp
Nesse modelo, xj o valor f ixo da varivel regressora Xj,
j=1,2,.. .,p. Os parmetros j so denominados coeficientes de
regresso. Podemos interpretar j como a mudana esperada em Y
devido ao aumento de uma unidade em Xj , estando as outras variveis
Xk , k j , f ixas.
O coeficiente 0 o intercepto da superfcie de resposta
(regresso). Se a abrangncia do modelo inclui (0, 0, ..., 0) ento 0 representa a resposta mdia E(Y) neste ponto. Em outras situaes, 0
no tem qualquer outro significado como um termo separado no modelo
de regresso.
Um dos objetivos da anlise de regresso desenvolver uma
equao que permita ao investigador estimar respostas para valores
dados de variveis preditoras. Para descrever a equao necessrio
estimar os valores para os coeficientes de regresso e a varincia 2
do erro com os dados observados.
Os coeficientes de regresso podem ser estimados por vrios
mtodos, um dos mais usados o mtodo de mnimos quadrados. Este
mtodo consiste em encontrar uma estimativa para os parmetros de
forma que a soma do quadrado dos erros seja mnima. Os estimadores
gerados por este mtodo so no viesados e consistentes (Neter e
Wasserman, 1974, p.37,226).
-
8/12/2019 Dissertao.Avaliao.Imveis
33/104
33
O estimadores para o vetor de parmetros e para a varincia 2
so dados, respectivamente, por:
b=(XX) -1XY e S2=(Y-Xb) (Y-Xb)/(n-p-1).
As suposies exigidas para o modelo de regresso l inear mltipla,
alm das estimativas dos parmetros, so as seguintes:
1) as variveis independentes so nmeros reais sem perturbaes
aleatrias.
2) o nmero de observaes, n, deve ser superior ao nmero de
parmetros, p, estimados.
3) os erros so variveis aleatrias com as seguintes suposies:
- valor esperado zero - E( i) = 0;
- varincia constante - Var( i) = 2;
- no correlaciona dos - Cov( i, j) = 0, ij .
4) a distribuio dos erros normal, i N(0, 2). Como os erros so
no correlacionados, pode-se afirmar, sob a hiptese de
normalidade, que estes so independentes.
5) no deve existir nenhuma relao exata entre as variveis
independentes.
3.3 - INFERNCIA ESTATSTICA
Os parmetros populacionais so estimados pontualmente a partir
de uma amostra, porm necessrio obter informaes sobre seu
comportamento probabilstico. Este estudo realizado atravs dosintervalos de confiana e testes de hipteses.
-
8/12/2019 Dissertao.Avaliao.Imveis
34/104
34
3.3.1 - Intervalos de Confiana
O intervalo de confiana fornece informao sobre a preciso das
estimativas. o intervalo do qual pode-se afirmar, com certa confiana,
que o verdadeiro valor de um parmetro populacional est contido nele,
ou seja, o intervalo de confiana estabelece limites para o valor objeto
de estudo. Os intervalos de confiana mais usuais em uma anlise de
regresso so descritos a seguir.
Intervalo de confiana para o parmetro k: para o modelo onde os
erros tm distribuio normal, o intervalo de confiana para k , dadopor
(bk t (1 - / 2 ; n -p -1 ) . S(bk) ; bk + t (1 - / 2 ; n -p -1 ) . S(bk))
onde bk o estimador de k , t (1 - / 2 ; n -p -1 ) o valor da estatstica t com
significncia e (n-p-1) graus de l iberdade e S(b k) o desvio-padro
estimado de bk . S2(bk) o k-simo elemento da diagonal principal da
matriz:S2(b)=QME(XX) -1
Intervalo de confiana para valores mdios preditos: o valor mdio
estimado para um caso (imvel) i dado por bX'iiY = , ( [ ]iX1X ='
i ). O
intervalo de confiana para o valor mdio estimado calculado por:
( iY t (1 - / 2 ; n -p -1 ) . S( iY ) ; iY + t (1 - / 2 ; n -p -1 ) . S( iY ))
onde kY o valor mdio estimado para o caso i, t (1 - / 2 ; n -p -1 ) o valor
da estatstica t com signif icncia e (n-p-1) graus de l iberdade e S( iY )
o desvio-padro de iY . S2( iY ) dada por
S2( iY )=(QME)'
iX (XX)-1X i=
'
iX S2(b)X i
Desta forma, possvel comparar o valor observado com o valorestimado e a preciso do ajuste.
-
8/12/2019 Dissertao.Avaliao.Imveis
35/104
35
Intervalo de confiana para valores preditos: o valor predito para um
novo caso observado h dado por bX'h
=hY . E o intervalo de confiana
para este novo caso observado dado por
( hY t (1 - /2 ; n -p -1 ) . S(pred) ; hY + t (1 - /2 ; n -p -1 ) . S(pred)).
Onde hY o valor predito para o novo caso h, t (1 - / 2 ; n -p -1 ) o valor
da estatstica t com signif icncia e (n-p) graus de l iberdade e S(pred)
o desvio-padro do valor predito. S 2(predito) dado por
S2
(predito)=QME(1+'
hX (XX)-1
Xh)
3.3.2 - Testes de Hipteses
O teste de hiptese uma regra usada para decidir se uma hiptese
estatstica deve ser rejeitada ou no. O objetivo do teste de hiptese
decidir se uma hiptese sobre determinada caracterstica da populao ou no apoiada pela evidncia obtida de dados amostrais. Os testes
de hipteses so os primeiros estudos realizados para a verificao da
validade do modelo. Os testes de hipteses necessrios em uma
anlise de regresso so descritos abaixo.
Teste de hiptese para a significncia do modelo: este teste usado
para estabelecer se existe ou no alguma relao entre a varivel
dependente e o conjunto de variveis independentes. Consiste em
testar as seguintes hipteses (Neter e Wasserman, 1974, p.228):
H0 : 1= 2 = ... = p = 0
H1 : k 0 para algum k
A estatstica do teste tem, sob H0 , a distribuio F com p e (n-p-1)
graus de liberdade. A rejeio da hiptese H 0 indica a existncia de
regresso.
-
8/12/2019 Dissertao.Avaliao.Imveis
36/104
36
As quantidades necessrias para calcular o valor observado dessa
estatstica esto dispostas na tabela 3.1, denominada de tabela de
anlise de varincia - ANOVA.
Tabela 3.1:Anlise de Varincia para testar a significncia do modelo
Fontes de
Variao
Soma de
Quadrados
Graus de
Liberdade
Quadrado
MdioF0
Regresso SQR p QMR=P
SQR
QME
QMR
Resduo SQE n-p-1 QME=1PN
SQE
Total SQT n-1 QMT=1N
SQT
onde:
SQR = bXY- n y 2 , SQE = YY bXY e SQT = SQE + SQR
A existncia de uma relao de regresso, por si s, no garanteque predies teis podem ser feitas usando este modelo (Neter et al.,
1996, p.230). Este teste apenas a primeira etapa na verificao de
aceitao do modelo.
Teste de hiptese para o parmetro k: Aps a verificao de que
pelo menos um dos parmetros k signif icativo, deve-se testar a
significncia de cada um deles, isto , para cada parmetro k (k=1,...,p), testam-se as hipteses:
H0 : k = 0
H1 : k 0
O teste para cada parmetro feito uti l izando a estatstica t de
Student com (n-p-1) graus de liberdade, o desvio padro amostral S(bk)
e o estimador b k . A estatstica do teste dada por
-
8/12/2019 Dissertao.Avaliao.Imveis
37/104
37
t* =)S(b
b
K
K
Se t* t (1 - / 2 ;n -p -1 ), o teste no rejeita H0 ; caso contrrio o teste
rejeita H0 em favor de H1 . A rejeio de H 0 indica uma contribuio
significativa da varivel independente Xk no modelo.
Teste de hiptese para um subconjunto de parmetros:Aps o teste
t sugerir as variveis independentes a serem usadas na equao,
importante examinar se a varivel dependente pode ser explicada pelas
variveis sugeridas to adequadamente quanto por todas as variveis.
Para isto, testam-se as hipteses:
H0 : q+ 1= q+2= ... = p-1= 0, q
-
8/12/2019 Dissertao.Avaliao.Imveis
38/104
-
8/12/2019 Dissertao.Avaliao.Imveis
39/104
39
[ ]1/22i2iii
XY
)Y(Y)X(X
)Y)(YX(Xr
=
Este valor sempre est entre 1 e 1. Quanto mais prximo de 1 e 1
maior a tendncia de relao linear positiva e negativa
respectivamente; e quando estiver prximo de zero indica ausncia de
correlao l inear entre as variveis (Dantas, 1998, p.114).
A matriz das correlaes entre as variveis independentes pode ser
util izada para orientar os primeiros passos para a construo da
equao de regresso. Um valor do determinante da matriz das
correlaes das variveis independentes prximo de zero indicao
de multicolinearidade (Dantas, 1998, p.132,133).
A regresso e a correlao esto intimamente relacionadas, porm
so muito diferentes conceitualmente. O coeficiente de correlao
mede a intensidade da associao linear entre duas variveis
aleatrias, enquanto a regresso tenta estimar ou prever o valor mdio
de uma varivel aleatria com base nos valores fixados de outras
variveis fixadas. A anlise de correlao trata duas variveis
simetricamente, no distingue a varivel dependente e independente e
supe as duas aleatrias. Na regresso h uma assimetria em como as
variveis dependente e independente so tratadas. A varivel
dependente suposta ser estatstica, aleatria ou estocstica, isto ,
ter uma distribuio de probabil idade (Gujarati, 2000, p.9).
A regresso mostra como as variveis esto relacionadas e a
correlao mostra o grau de relacionamento entre elas. O nmero
fornecido pela correlao um retrato instantneo de quo prximo
esto duas variveis que variam juntas. Alguns economistas
consideram a correlao uma tcnica pouco poderosa, porm como a
correlao e a regresso esto intimamente ligadas matematicamente,
muitas vezes a correlao um auxlio til na regresso (Wonnacott e
Wonnacott, 1978, p.98-102).
-
8/12/2019 Dissertao.Avaliao.Imveis
40/104
40
3.5.2 - Anlise Fatorial de Correspondncias
A Anlise Fatorial de Correspondncias uma das tcnicas
multivariadas que permite examinar relaes geomtricas do
cruzamento ou contingenciamento de variveis categricas, analisando
a distribuio de massa de um conjunto de observaes, tendo como
princpios bsicos, a proximidade geomtrica e a reduo de
dimensionalidade. No um mtodo para prova de hipteses, mas sim
uma tcnica descritiva e explanatria, ou seja, nenhum teste de
significado estatstico costumeiramente aplicado aos resultados de
uma anlise fatorial de correspondncia, que tem como princpioreproduzir, de forma simplif icada, as informaes de uma grande tabela
de freqncia. Esta tcnica permite estudar uma populao de
indivduos descrita por variveis que podem ser do t ipo qualitativo,
quantitativo ou uma mescla de ambos, desde que os dados contnuos
sejam discretizados e restri tos a valores posit ivos (Pereira, 2001,
p.133).
A transformao de variveis contnuas em qualitativas tem afinalidade de tornar homogneo os conjuntos de dados que so
compostos de variveis numricas e de variveis qualitativas. Ainda se
pode ter interesse em realizar uma codificao qualitativa at quando
se dispe de um conjunto de variveis numricas, sobre o qual se pode
aplicar adequadamente a chamada anlise de componentes principais.
Uma anlise fatorial de correspondncia mltipla sobre as mesmas
variveis codificadas em classes, d outra aproximao para os dados,pois permite exibir, possveis relaes no lineares entre as variveis.
Tais fenmenos so invisveis nos resultados de uma anlise de
componentes principais, que no leva em conta, mais que relaes
lineares (Escofier e Pags, 1992, p.7-25).
Para codif icar uma varivel contnua em classes, ou seja, recortar o
seu intervalo de variao em subintervalos que definem outras
modalidades, necessrio determinar o nmero de intervalos e seus
limites. Diminuindo o excesso do nmero de classes, se agrupam
indivduos cada vez mais distintos e, por isto, perde-se muita
-
8/12/2019 Dissertao.Avaliao.Imveis
41/104
41
informao. Por outro lado, aumentando o nmero de casos correse o
risco de se obter classes com pouca informao. A experincia mostra
que no til superar o nmero de oito modalidades na codificao de
variveis quantitativas e que quatro ou cinco so suficientes (Escofier e
Pags, 1992, p.66-69).
3.6 - TRANSFORMAES DE VARIVEIS
As variveis so um conjunto de medidas repetidas de um
determinado objeto de estudo sendo que estas medidas podem serrealizadas em diferentes unidades, que levam a classific-las como
quantitativas ou qualitativas (Pereira, 2001, p.43,44).
O primeiro aspecto a ser analisado com relao aos dados,
estudando o tipo, comparando as grandezas e o comportamento entre
as variveis. Ento deve-se preparar estes dados para a anlise de
regresso.
Algumas vezes se faz necessrio algum tipo de transformao nasvariveis e tambm o uso de variveis dummy. As transformaes so
necessrias quando ocorre a falta de linearidade, varincia no-
constante dos erros e no-normalidade dos erros; possibilitando a
construo de modelos mais simples. Por razes prticas, modelos
mais simples so mais fceis de se estudar a validade e tambm de
serem testados.
Geralmente transformaes simples da varivel dependente, dasvariveis independentes ou de ambas possibilitam a construo de um
modelo de regresso linear apropriado ao conjunto de dados
transformados.
Quando se procura ajustar modelos a dados imobilirios, a
transformao logartmica a preferida, pois as variveis pertinentes a
imveis pertencem ao campo dos nmeros reais positivos e os valores
transformados tambm sero, assim a especificao logartmica se
adequa melhor na descrio dos preos das unidades em relao a
seus respectivos atributos (Macedo, 1998; Dantas, 1998, p.143).
-
8/12/2019 Dissertao.Avaliao.Imveis
42/104
42
Outro aspecto que a prpria ABNT sugere a transformao
logartmica na varivel resposta porque torna o modelo aditivo.
No entanto existem muitas possibilidades de transformaes, e
muitos modelos podem ser descritos. A escolha de qual a melhor
transformao a se fazer exige um conhecimento do comportamento
das variveis em estudo. A razo principal para a realizao das
transformaes poder fazer uso de um modelo de regresso na forma
mais simples em vez de uma forma mais complicada obtido com as
variveis originais (Draper e Smith, 1981, p.221).
3.6.1 - Linearidade
A linearidade ocorre quando os pontos permitem um ajuste atravs
de um hiperplano. Isto pode ser investigado atravs do coeficiente de
correlao calculado entre a varivel dependente e cada varivel
independente, e ainda analisando os seguintes grficos:
varivel dependente versus varivel independente: havendo vrias
variveis regressoras, recomendado o grfico com cada uma delas,
devendo-se observar se os pontos esto alinhados, conforme mostra a
Figura 3.1.
resduos versus varivel independente: devendo observar se os
pontos esto dispostos aleatoriamente, sem quaisquer tipos detendncia, conforme Figura 3.2, devendo tambm ser construdo para
cada varivel independente.
-
8/12/2019 Dissertao.Avaliao.Imveis
43/104
43
varivel idependente
vari
ve
ldependen
te
Figura 3.1: exemplo de relao linear pela plotagem
da varivel dependente versus varivel independente.
Dados fictcios.
varivel independente
resduos
Figura 3.2: exemplo de relao linear pela plotagem
dos resduos versus varivel independente.
Dados fictcios.
Quando ocorre a falta de linearidade, sendo a distribuio dos erros
aproximadamente normal e com varincia razoavelmente constante,
transformaes na varivel independente devem ser testadas. Isto
porque transformaes na varivel dependente, tal como atransformao por raiz quadrada, pode mudar o tipo de distribuio e
-
8/12/2019 Dissertao.Avaliao.Imveis
44/104
44
provocar uma diferena nas varincias dos erros (Neter et al, 1996,
p.126-128).
As transformaes para uma varivel independente X para a no-
l inearidade do modelo, dentre outras transformaes, podem ser:
Logartmica , X = logX (na base 10 ou e)
Raiz quadrada, X = X
Quadrtica, X = X2
Exponencial, X = exp(X)
Recproca, X = 1/X
Exponencial negativa, X = Exp(X)
3.6.2 - Varincia no-constante e no-normalidade dos erros
Quando se comprova a heterogeneidade da varincia, as
estimativas das varincias dos estimadores dos parmetros so
tendenciosos, levando valores incorretos das inferncias. Neste caso
h necessidade de estabilizar a varincia, que pode ser feito atravs de
transformaes na varivel resposta.
A suposio de normalidade dos erros deve ser satisfeita para que
se possa calcular os intervalos de confiana e fazer inferncias.
Uma varincia no-constante e a no-normalidade dos erros
aparecem freqentemente ao mesmo tempo, e alguma transformao
na varivel resposta deve ser feita. claro que uma transformao navarivel resposta tambm pode resolver o problema de falta de
linearidade de uma relao de regresso. Outras vezes, uma
transformao simultnea da varivel resposta e da varivel preditora
ser necessria para obter uma relao de regresso linear (Neter et
al. , 1996, p.129-132).
Exemplos de transformaes da varivel resposta Y para a varincia
no-constante e a no-normalidade dos erros so:
-
8/12/2019 Dissertao.Avaliao.Imveis
45/104
45
Logartmica, Y = logY (na base 10 ou e)
Raiz quadrada, Y = Y
Quadrtica, Y = Y2
Recproca, Y = 1/Y
Arco seno, Y = arcsen Y
Box-Cox, Y=Y.
O procedimento de Box-Cox identifica automaticamente uma
transformao da faml ia de transformaes de potncia sobre Y. O
parmetro determinado dos dados. Para =0 define-se a
transformao logartmica (Neter et al, 1996, p.129-132).
3.6.3 - Variveis Dummy
As variveis usadas nas equaes de regresso podem no serem
quantitativas. Isto geralmente ocorre quando se estuda o
comportamento do mercado imobilirio, que alm de ser caracterizado
por variveis quantitativas como valores de venda ou locao e idade
tambm caracterizado por variveis qualitativas como presena
de elevador (sim ou no), situado na regio A ou B ou C e padro de
acabamento (timo, bom, regular ou ruim) dentre outras. Estas
variveis so comumente chamadas de variveis dummy (Dantas,
1998, p.157,158).
Para as variveis que apresentam um aspecto dicotmico, como por
exemplo a presena de elevador (sim ou no), relaciona-se
determinado nmero as caractersticas. Geralmente usa-se o nmero
um quando determinada caracterstica est presente e o nmero zero
em caso contrrio (Moreira Filho, 1993, p.85-87).
As variveis com mais de dois nveis, como por exemplo as regies
A, B ou C, podem ser trabalhadas como duas variveis dicotmicas,
sendo regio A (sim ou no) e regio B (sim ou no), estando a regio
C contemplada na anlise quando se tem no para a regio A e no
-
8/12/2019 Dissertao.Avaliao.Imveis
46/104
46
para a regio B. Generalizando, tem-se que uma varivel com p nveis
pode ser reescrita como (p-1) variveis dicotmicas.
Quando se faz uma regresso da varivel dependente sobre as
variveis independentes dummy, os coeficientes de mnimos
quadrados das variveis dummy so as mdias das celas em que
esto tabulados (Johnston, 1974, p.239-241).
3.7 - MULTICOLINEARIDADE
Em anlise de regresso l inear mltipla, existe um freqenteinteresse com relao a natureza e significncia das relaes entre as
variveis independentes e a varivel dependente. Em muitas aplicaes
de administrao e economia, freqntemente encontram-se variveis
independentes que esto correlacionadas entre elas mesmas e,
tambm, com outras variveis que no esto includas no modelo, mas
esto relacionadas varivel dependente (Neter e Wasserman, 1974,
p.339).Define-se como multicolinearidade a existncia de relaes lineares
entre as variveis independentes. Quando a relao exata tem-se o
caso da multicolinearidade perfeita.
Na prtica atual, raramente, encontramos variveis independentes
que so perfeitamente relacionadas. Este caso no traz problemas,
pois facilmente detectado e pode ser resolvido simplesmente
eliminando uma ou mais variveis independentes do modelo.O interesse no que se refere a multicolinearide est nos casos em
que ela ocorre com alto grau, isto , quando duas variveis
independentes esto altamente correlacionadas ou quando h uma
combinao quase linear entre um conjunto de variveis
independentes. Assim, a multicolinearidade mais uma questo de
grau do que de natureza (Kmenta, 1978, p.411-423).
O fato de muitas funes de regresso diferentes proporcionarem
bons ajustes para um mesmo conjunto de dados porque os
coeficientes de regresso atendem vrias amostras onde as variveis
-
8/12/2019 Dissertao.Avaliao.Imveis
47/104
47
independentes so altamente correlacionadas. Assim, os coeficientes
de regresso estimados variam de uma amostra para outra quando as
variveis independentes esto altamente correlacionadas. Isto leva a
informaes imprecisas a respeito dos coeficientes verdadeiros (Neter
e Wasserman, 1974, p.344).
A multicolinearidade geralmente causada pela prpria natureza
dos dados, principalmente nas reas de economia com variveis que
representam valores de mercado. Algumas vezes a multicolinearidade
pode tambm ocorrer devido a amostragem inadequada (Elian, 1998).
3.7.1 - Efeitos da Multicolinearidade
Efeito da Multicolinearidade nos Coeficientes de Regresso: quando as
variveis independentes so correlacionadas, o coeficiente de
regresso de alguma varivel independente depende de qual outra
varivel independente includa no modelo, pois adicionando ou
deletando uma das variveis independentes mudam-se os coeficientesde regresso. Assim, um coeficiente de regresso deixa de refletir os
efeitos inerentes de uma particular varivel independente sobre a
varivel dependente, mas reflete apenas um efeito parcial.
Note que o coeficiente de regresso de uma varivel independente
X1 inalterado quando uma varivel independente X 2, no
correlacionada com X1 , adicionada no modelo de regresso, pois,
212r1
12.r
y2.r
2
1
2)1xi1(x
2)yi
(y
2)1xi1(x
)yi
)(y1xi1(x
1b
=
onde ry2 o coeficiente de correlao entre as variveis Y e X2 e r12
o coeficiente de correlao entre as variveis X 1e X2 .
Se X1 e X2 forem no correlacionadas, tem-se r12 =0, e, portanto,
=
2)1xi1(x
)yi
)(y1xi1(x
1b , que o coeficiente de X1 na regresso simples de Y
-
8/12/2019 Dissertao.Avaliao.Imveis
48/104
48
sobre X1 . Logo, se X1 e X2 no so correlacionados, a adio de X 2 no
modelo de regresso no muda o coeficiente de X1.
Efeito da Multicolinearidade na Soma de Quadrados de Regresso :
quando variveis independentes so correlacionadas, no existe uma
soma de quadrados nica que pode ser atribuda a uma varivel
independente refletindo o efeito na reduo da variao total em Y, ou
seja, a soma de quadrado associada a uma varivel independente
varia, dependendo sobre que varivel independente esteja includa no
modelo.
Efeito da Multicolinearidade nos Testes para os Coeficientes de
Regresso : um abuso freqnte nos modelos de regresso
observado ao se examinar a estatstica t* para cada coeficiente de
regresso. possvel que quando um conjunto de variveis
independentes esteja relacionado varivel dependente, obtendo todos
os testes individuais sob os coeficientes de regresso, eles levaro
concluso que os coeficientes so iguais a zero devido amulticolinearidade entre as variveis independentes. Os coeficientes de
regresso estimados individualmente podem no ser estatisticamente
significativos, ainda que possa existir uma relao estatstica entre a
varivel dependente e o conjunto de variveis independentes (Matos,
2000, p.124-129).
Apesar das conseqncias dos efeitos da multicolinearidade,
citados anteriormente, a alta Multicolinearidade no , geralmente, umproblema quando o propsito da anlise de regresso fazer
inferncias sobre a funo resposta ou predies de novas
observaes, contanto que estas inferncias sejam feitas dentro do
mbito das observaes (Neter e Wasserman, 1974, p.345; Neter et al.,
1996, p.285,295).
Para fazer boas previses o pesquisador deve ter confiana de que
o carter e o tamanho do relacionamento global se manter de perodo
para perodo. Note que, a questo de confiana um problema
-
8/12/2019 Dissertao.Avaliao.Imveis
49/104
49
existente em todos os modelos de previses, com ou sem a presena
de multicolinearide (Chatterjee e Price, 1977, p.151-153).
Quando o relacionamento entre as variveis independentes se
mantm, no perodo previsto e no perodo da amostra, as previses so
corretas at mesmo fora da amostra (Judge et al. , 1988, p.859-861).
Nota-se, ento, que quando os valores das variveis independentes,
para as quais se desejam as previses, obedecem as mesmas
dependncias da matriz original, a multicolinearidade no um
problema. Como nas aplicaes econmicas a multicolinearidade,
quando existe, uma caracterstica da populao, a estrutura
permanece de amostra para amostra, no sendo um caso de umaamostra simplesmente infectada pela Multicolinearidade. Portanto,
pode-se usar a equao de regresso estimada para fazer inferncias
sobre a funo resposta ou predies de novas observaes (Neter et
al. , 1996, p.285-295).
3.7.2 - Detectando a Multicolinearidade
Existem muitas sugestes, ou mtodos propostos, para detectar a
multicolinearidade. Os mais comumente usados so:
coeficiente de correlao simples: uma medida comumente usada
no caso de duas variveis independentes, sendo suficiente para
detectar a colinearidade. Considera-se que um coeficiente decorrelao maior que 0,80 ou 0,90 indicativo de um problema srio de
colinearidade. Porm, para mais de duas variveis independentes,
mesmo os coeficientes de correlao sendo baixos ainda pode existir a
multicolinearidade, pois pares de correlaes podem no dar viso de
intercorrelacionamentos mais complexos entre trs ou mais variveis
(Judge et al. , 1980, p.458,459).
determinante de (XX): Se as variveis independentes esto
padronizadas, tal que (XX) contm elementos que so os coeficientes
-
8/12/2019 Dissertao.Avaliao.Imveis
50/104
50
de correlao linear entre as variveis independentes, ento o
determinante de (XX) um valor no intervalo [0;1]. Caso as variveis
independentes no estejam padronizadas, melhor analisar o
determinante da matriz de correlaes entre as variveis
independentes, Rx , que sempre assume valores no intervalo [0,1]. Um
valor deste determinante prximo de zero indicativo de
multicolinearidade (Elian, 1998, p.125; Neter e Wasserman, 1974,
p.347).
coeficiente de explicao do modelo, R2: o R2 tendo um valor alto,
mas os coeficientes de correlao parcial tendo valores baixos, tem-sea indicao de multicolinearidade.
regresses auxiliares: se o valor de R2, calculado da regresso de
cada varivel independente sobre as outras (k-1) variveis
independentes alto, ento h indicativo de multicolinearidade.
razes caractersticas: Sejam i, i=1,...,p, as razes caractersticas deRx, tem-se que det(Rx)= i. Baixos valores de uma ou mais razes
caractersticas, comparado com o maior valor, so indicativos de
multicolinearidade. Um critrio, bem eficiente, na quantif icao da
multicolinearidade, a anlise do valor de L, dado por
L=mx /mn,
onde mx o maior valor das razes caractersticas e mn o menorvalor das razes caractersticas. Se L < 100, considera-se no existir
multicolinearidade, se 100 < L < 1000 existe multicolinearidade
moderada e se L > 1000 h indicativo de multicolinearidade sria
(Elian, 1998, p.131).
O grfico dos resduos: o grfico dos resduos versus cada varivel
independente, inclusive as variveis que no fazem parte da equaode regresso, indicam a inexistncia de correlacionamento quando os
-
8/12/2019 Dissertao.Avaliao.Imveis
51/104
51
pontos estiverem dispostos aleatoriamente, sem qualquer padro. Caso
contrrio, se apresentarem algum tipo de tendncia, h indicativo de
correlacionamento.
3.7.3 - Solues para o Problema de Multicolinearidade
A existncia de multicolinearidade tendo sido detectada e
considerada prejudicial, indica que o pesquisador deve procurar
solues para suavizar seus efeitos ruins. Vrias medidas corretivas
tm sido propostas, desde simples s mais complexas, para suavizaros efeitos provocados pela multicolinearidade (Elian,1988, p.131-134;
Judge et al. , 1980, p.464-468).
Remoo de variveis - uma medida simples remover uma ou vrias
variveis independentes, pouco importantes no contexto geral, que
venham a diminuir a multicolinearidade. Porm, esta ao no ajuda a
avaliar os efeitos da varivel independente, pois nenhuma informao obtida cerca da varivel removida, e tambm porque o valor do
coeficiente de regresso para a varivel independente remanescente
no modelo afetada pelas variveis independentes correlacionadas
no includas no modelo.
Ampliao do tamanho da amostra - algumas vezes possvel
adicionar algumas observaes na amostra que elimina o padro demulticolinearidade. Esta medida usada quando o problema causado
por informao amostral inadequada. Porm, em administrao e
economia muitas variveis independentes no podem ser controladas
de forma que novas observaes tendero a mostrar o mesmo padro
de intercorrelao.
Ridge Regression -outro critrio, para o qual tem-se dado ateno,
Ridge Regression (Regresso em Cumeeira) que consiste no uso de
-
8/12/2019 Dissertao.Avaliao.Imveis
52/104
52
estimadores tendenciosos para os coeficientes. O estimador em crista
na verdade uma famlia de estimadores dados por:
b(k)=(XX+kI) -1XY ,
onde k um valor pequeno que deve ser escolhido a critrio do
pesquisador. Em geral, aumenta-se gradativamente o valor de k at
que os estimadores dos coeficientes tornam-se estveis, no variam.
Se a escolha for k=0, tem-se o estimador de mnimos quadrados (Neter
et al., 1996, p.411-416; Elian, 1998, p.133; Draper e Smith, 1981,
p.313-349).
Na presena de multicolinearidade sempre existe um valor de k parao qual os estimadores de Ridge Regression produzem um QME
(quadrado mdio do erro) menor do que o QME produzido pelos
estimadores de mnimos quadrados ordinrios. A dificuldade desta
questo que o valor de k varia de uma aplicao para outra e
desconhecido. Assim, embora exista este valor de k, no existe um
caminho conhecido para obt-lo, mesmo quando obtm-se um k que
produza um MSE menor do que o MSE de mnimos quadradosordinrios para um problema prtico especfico (Draper e Smith, 1981,
p.315,316).
A funo de regresso estimada pela Ridge Regression produz
predies de novas observaes que tendem a serem mais precisas do
que as predies feitas pela funo de regresso estimada pelo mtodo
de mnimos quadrados, quando as variveis independentes so
correlacionadas e a nova observao segue o mesmo padro demulticolinearidade. Esta preciso na predio de novas observaes
favorecida pela Ridge Regression , especialmente quando a
multicolinearidade forte (Neter et al., 1996, p.411-416).
Componentes principais uma outra forma que pode ser util izada
para tratar o problema causado pela multicolinearidade a tcnica de
componentes principais.
Esta tcnica permite que todas as variveis independentes
participam de certa forma do modelo. Atravs desta tcnica, possvel
-
8/12/2019 Dissertao.Avaliao.Imveis
53/104
53
reduzir um grande nmero de variveis independentes em um nmero
razoavelmente pequeno de novas variveis independentes, que so
chamadas de componentes e so determinadas pela combinao linear
das variveis originais. Estas novas variveis (ou componentes
principais) so no correlacionadas e so usadas para determinar o
modelo de regresso.
O objetivo da anlise de componentes principais representar ou
descrever um conjunto de variveis por um outro conjunto menor de
novas variveis, sem perda significativa da informao original (Reis,
1997, p.255). A reduo da dimensionalidade das variveis consiste no
fato de que as primeiras componentes principais possam explicar amaior parte da variabil idade total dos dados originais.
A anlise de componentes principais permite um estudo detalhado
da importncia de cada varivel, fornecendo a quantidade de
explicao na componente principal e seu relacionamento com as
demais variveis. Sobre a anlise de componentes principais pode ser
visto em Escofier e Pags (1990) e Bouroche e Saporta (1982).
3.8 - SELEO DE VARIVEIS REGRESSORAS
Um dos problemas mais difceis e freqntes em anlise de
regresso a seleo do conjunto de variveis independentes para
serem includas no modelo (Neter e Wasserman, 1974, p.371).
O investigador deve especificar o conjunto de variveisindependentes a ser empregado para descrever, controlar ou predizer a
varivel dependente.
Um problema muito difcil de relacionamento que aparece na
seleo de variveis quando uma equao de regresso construda
com o objetivo de predio e envolve muitas variveis. Talvez, muitas
delas, contribuam pouco ou nada para preciso da predio. A escolha
apropriada de algumas delas fornece a melhor predio, porm o
problema quantas e quais variveis selecionar (Snedecor e Cochram,
1972, p.412,413).
-
8/12/2019 Dissertao.Avaliao.Imveis
54/104
54
Em alguns campos, a teoria pode ajudar na seleo das variveis
independentes a serem empregadas e na especificao da forma
funcional da relao de regresso. Em tais campos, os experimentos
podem ser controlados para fornecer dados sobre a base de que os
parmetros de regresso podem ser estimados e a forma terica da
regresso testada. Em muitos outros campos, entretanto, modelos
tericos so raros. Assim, os investigadores so freqntemente
forados a explorar as variveis independentes para que possam
realizar estudos sobre a varivel dependente. Obviamente, tais
conjuntos de variveis independentes so grandes. Algumas das
variveis independentes podem ser removidas seletivamente. Umavarivel independente pode no ser fundamental ao problema; pode
estar sujeita a grandes erros de medidas; e pode efetivamente duplicar
outra varivel independente da l ista. Outras variveis independentes,
que no podem ser medidas, podem ser deletadas ou substitudas por
variveis que esto altamente correlacionadas com estas.
Tipicamente, o nmero de variveis independentes que permanece,
aps esta seleo inicial, ainda grande. Posteriormente, muitasdestas variveis estaro altamente intercorrelacionadas. Portanto, o
investigador geralmente desejar reduzir o nmero de variveis
independentes a serem usadas no modelo final. Existem vrias razes
para isto. Um modelo de regresso com um nmero grande de variveis
independentes caro para se util izar. Dessa forma, modelos de
regresso com um nmero limitado de variveis independentes so
fceis para se avaliar e estudar. Finalmente, a presena de muitasvariveis independentes altamente intercorrelacionadas, podem
adicionar pouco ao poder de predio do modelo, enquanto retira suas
habilidades descritivas e aumenta os erros de predio.
O problema ento como reduzir a lista de variveis independentes
de forma a obter a melhor seleo de variveis independentes. Este
conjunto precisa ser suficientemente pequeno para que a manuteno
dos custos de atualizao do modelo sejam manuseveis e a anlise
facilitada, e ainda, deve ser grande o suficiente de forma que seja
possvel uma descrio, um controle e uma predio adequados.
-
8/12/2019 Dissertao.Avaliao.Imveis
55/104
55
Os procedimentos de procura para se encontrar o melhor conjunto
de variveis independentes devem ser empregados aps o investigador
ter estabelecido a forma funcional da relao de regresso, ou seja, se
as variveis dadas esto na forma l inear, quadrtica, etc; se as
variveis independentes so primeiramente transformadas, como por
exemplo por transformao logartmica; e se algum termo de interao
foi includo. Neste ponto, os procedimentos de procura so empregados
para reduzir o nmero de variveis independentes.
Existem muitos procedimentos de seleo, mas nenhum deles pode,
comprovadamente, produzir o melhor conjunto de variveis
independentes. No existe um conjunto timo de variveisindependentes, pois o processo de seleo das variveis possui
julgamentos subjetivos. Dentre os procedimentos, pode-se citar como
os mais comumente usados: todas as regresses possveis, backward,
forward e stepwise.
Todas as regresses possveis : este procedimento consiste em
ajustar todas as possveis equaes de regresso. Aps a obteno detodas as regresses, deve-se util izar os critrios para comparao dos
modelos ajustados. Alguns critrios que podem ser usados so o R 2
(coeficiente de explicao), MSE (quadrado mdio dos resduos) e C p
(estatstica de Mallows).
Para alguns conjuntos de variveis, os trs critrios podem levar
para o mesmo melhor conjunto de variveis independentes. Este no
o caso geral, pois diferentes critrios podem sugerir diferentesconjuntos de variveis independentes. Daniel e Wood (1971, p.86)
recomendam, no caso de um grande nmero de equaes alternativas,
o critrio do erro quadrado total para caracterizar a equao. A
principal desvantagem do procedimento de procura de todas as
regresses possveis a quantidade de esforo computacional
necessria. J que cada varivel independente potencial pode ser
includa ou excluda, gerando (2P - 1) regresses possveis quando
existem p variveis independentes potenciais (Elian, 1998, p.139;
Draper e Smith, 1981, p.296).
-
8/12/2019 Dissertao.Avaliao.Imveis
56/104
56
stepwise (passo a passo): , provavelmente, o mais amplamente
usado dos mtodos de pesquisa que no requerem a computao de
todas as regresses possveis. Ele foi desenvolvido para economizar
esforos computacionais, quando comparado com a abordagem de
todas as regresses possveis, enquanto atinge um conjunto de
variveis independentes razoavelmente bom. Essencialmente, este
mtodo de pesquisa computa uma seqncia de equaes de
regresso, adicionando ou deletando uma varivel independente em
cada passo. A rotina de regresso stepwise permite que uma varivel
independente, trazida para dentro do modelo em um estgio anterior,
seja removida subseqentemente se ela no ajudar na conjuno comvariveis adicionadas nos ltimos estgios. Esta rotina empregada,
conduz a um teste para rastrear alguma varivel independente que seja
altamente correlacionada com variveis independentes j includas no
modelo. A l imitao da procura da regresso stepwise que ela
presume a existncia de um nico conjunto timo de variveis
independentes e busca identific-lo. Como notado anteriormente, no
existe freqntemente um nico conjunto timo. Outra l imitao darotina de regresso stepwise , que ela algumas vezes surge com um
conjunto de variveis independentes razoavelmente fraco para
predies, quando as variveis independentes esto altamente
correlacionadas (Draper e Smith, 1981, p.307-312).
Seleo forward: este procedimento de procura uma verso
simplificada da regresso stepwise , omitindo o teste, se uma variveluma vez que tenha entrado no modelo deva ser retirada. Este
procedimento considera, inicialmente, um modelo simples usando a
varivel de maior coeficiente de correlao com a varivel dependente.
Uma varivel por vez incorporada at que no haja mais incluso, e
as variveis selecionadas definem o modelo.
Eliminao backward: este procedimento de procura oposto
seleo forward. Ele comea com o modelo contendo todas as variveis
independentes potenciais. O procedimento de eliminao backward
-
8/12/2019 Dissertao.Avaliao.Imveis
57/104
57
requer mais computaes que o mtodo de seleo forward, j que ela
comea com o maior modelo possvel. Entretanto, ela tem uma
vantagem de mostrar ao analista as implicaes do modelo com muitas
variveis.
3.9 CUIDADOS NO USO DO MODELO
claro que o rastreamento de variveis por um processo de seleo
computadorizado somente um passo na construo de um modelo de
regresso. Uma vez que o conjunto de variveis independentes temsido identificado o modelo resultante necessita ser estudado.
Um teste formal para a falta de ajuste pode ser feito e a plotagem
dos resduos deve ser empregada para identificar a natureza da falta
de ajuste, pontos discrepantes, e outras deficincias.
O processo de construo de um modelo de regresso requer
repetidas anlises sobre o conjunto de dados para checar se o modelo
ajusta-se bem os dados. Um modelo ruim pode levar a predieserrneas. Este fato pode ocorrer devido a m escolha das variveis
independentes. Uma forma de medir as predies tendenciosas
deixar alguns dos dados originais fora dos clculos para determinao
do modelo e us-los para realizar o ajustamento do poder predit ivo do
modelo (Neter e Wasserman, 1974, p.388).
3.10 - RESDUOS
Os resduos so definidos como as n diferenas ei = Yi - iY , i=1,...,n
onde Yi uma observao e iY o valor ajustado. Observe que os
resduos ei so as diferenas entre o que observado e o que
predito pela equao de regresso, isto , a quantidade que a equao
de regresso no tem capacidade para explicar. Assim pode-se pensar
ei como os erros observados se o modelo est correto, lembrando que
-
8/12/2019 Dissertao.Avaliao.Imveis
58/104
58
as suposies impostas para erros, citadas na seo 3.1.1 deste
captulo, so: a independncia, a mdia zero, a varincia constante e
que seguem a distribuio normal. Se o modelo ajustado est correto,
os resduos exibiro tendncias que tendem a confirmar as suposies
feitas, ou por fim, exibiro uma recusa das suposies (Elian, 1998,
p.41,91).
Para examinar os resduos e checar o modelo so util izadas as
ferramentas grficas que so fceis de construir e revelam claramente
a validao das suposies. Neste sentido, apresenta-se aqui a
metodologia de interpretao dos grficos dos resduos.
3.10.1 - Anlise de Resduos
Com a definio do modelo, deve-se realizar a anlise dos resduos,
a fim de procurar evidncias sobre eventuais violaes das suposies
de mdia zero, independncia, homocedasticidade e normalidade.
mdia zero: a verificao de que os erros tm valor esperado zero
pode ser investigado pelo grfico da plotagem dos resduos versus
valores preditos, como mostra a figura 3.3, devendo os pontos estarem
distribudos em torno do zero.
valores preditos
resduos
Figura 3.3:Exemplo de mdia zero.Dados fictcios.
-
8/12/2019 Dissertao.Avaliao.Imveis
59/104
59
independncia: a inexistncia de autocorrelao dos erros pode ser
investigada atravs do grfico dos resduos versus sequncia no tempo
(ou sequncia de coleta de dados), pode-se verificar a independncia
dos resduos quando eles se distribuem aleatoriamente, em torno de
zero, conforme figura 3.4.
sequncia de coleta
re
sduos
-
-
Figura 3.4:Exemplo de independncia dos erros pela
plotagem dos resduos.
Dados fictcios.
Uma outra forma de verificao da existncia de autocorrelao dos
erros pode ser feita pela estatstica de Durbin-Watson.
Util izando-se da razo,
=
=
=n
1i
2
i
n
2i
1ii
e
)e(e
d
e fazendo-se uso da distribuio (dos valores) tabelada por Durbin-
Watson, testa-se a hiptese nula de que os erros so no
correlacionados contra a hiptese alternativa de que os erros so
correlacionados. O valor de d est estreitamente relacionado com o
valor da correlao dos resduos r. Tem-se que:
d 2(1-r).
Se o valor de r prximo de zero, ento a estatstica de Durbin-
Watson d 2, que indica que os erros do modelo so no
correlacionados (Hil l et al., 1999).
-
8/12/2019 Dissertao.Avaliao.Imveis
60/104
60
Quando detectada a autocorrelao dos erros, deve-se considerar
a possibilidade que variveis independentes importantes foram
excludas do modelo de regresso ou, ainda, h indicao de que o
modelo ruim. Isto leva estimativas no confiveis ou tendenciosas.
A validade do teste de Durbin-Watson depende dos erros terem
mdia zero e varincia constante e ainda as variveis independentes
no serem aleatrias. Isto ocorre quando valores da varivel
dependente defasadas aparecem como variveis independentes
(Hoffmann e Vieira, 1983, p.251,252).
O problema de autocorrelao entre os resduos costuma acontecer
quando as observaes so realizadas ao longo do tempo, que no ocaso usual na amostragem de avaliao de imveis.
varincia constante: a suposio de varincia constante ou
homogeneidade de varincia verificada facilmente atravs dos
grficos dos resduos versus variveis independentes ou resduos
versus valores preditos. Quando o grfico produz forma de megafone,
implica que a varincia no constante, conforme mostra a figura 3.5,por outro lado, quando esto distribudos aleatoriamente em torno de
uma reta horizontal que passa pela origem, sem qualquer padro, h
indicao de varincia constante.
varivel independente
res
duos
Figura 3.5: Exemplo de varincia no-constante pela
plotagem dos resduos versus varivel independente.
Dados fictcios.
-
8/12/2019 Dissertao.Avaliao.Imveis
61/104
61
distribuio normal: o grfico construdo pelos resduos ordenados
versus os respectivos valores tericos da distribuio normal, mostra a
normalidade dos erros quando os pontos se distribuem em torno de
uma l inha, conforme mostra a f igura 3.6.
valor esperado sob normalidade
re
sduos
Figura 3.6:Exemplo de distribuio normal dos erros
pela plotage