dissertação.avaliação.imóveis

8/12/2019 Dissertao.Avaliao.Imveis

1/104

Universidade Federal de Santa Catarina

Programa de Ps-Graduao em Engenharia de Produo

CONSTRUO DE UM MODELO DE REGRESSO

PARA AVALIAO DE IMVEIS

Dissertao de Mestrado

Sebastio Gazola

Florianpolis

2002


2/104

CONSTRUO DE UM MODELO DE REGRESSO

PARA AVALIAO DE IMVEIS

Dissertao apresentada no

Programa de Ps-Graduao em

Engenharia de Produo a

Universidade Federal de Santa Catarina

como requisito parcial para obteno

do grau de Mestre em

Engenharia de Produo.

Orientador: Pedro Alberto Barbetta, Dr.

Florianpolis

2002


3/104

Sebastio Gazola

Construo de um Modelo de Regresso

para Avaliao de Imveis

Esta dissertao foi julgada adequada e aprovada para a

obteno do ttulo de Mestre em Engenharia de Produo no

Programa de Ps-Graduao em Engenharia de Produo

da Universidade Federal de Santa Catarina

Florianpolis, 08 de outubro de 2002.

Edson Pacheco Paladini, Dr.

Coordenador do Programa

BANCA EXAMINADORA

________________________________

Prof. Pedro Alberto Barbetta, Dr.

Orientador

________________________________

Prof. Norberto Hochheim, Dr.

________________________________

Prof. Paulo Jos Ogliari, Dr.


4/104

A minha esposa, Vilma

pelo apoio constante.

A meus fi lhos Vicente e Marina.


5/104

AGRADECIMENTOS

minha faml ia, pelo apoio e compreenso, em especial

minha esposa Vilma;

Ao Departamento de Estatstica da UEM;

Prof. Terezinha Aparecida Guedes, pelo apoio;

Prof. Isolde Previdell i , pela viabilizao do curso;

todos os alunos do curso pelo apoio e amizade e em

especial s colegas Angela, Clara, Cldina e Zeza;

Ao Programa de Ps-graduao em Engenharia de Produo

da UFSC pelo empenho;

Prof. Eunice Passaglia e toda equipe do LED,

responsveis pelo funcionamento do curso;

Ao meu orientador, Prof. Pedro Alberto Barbetta, que apoiou

o desenvolvimento do trabalho e ofereceu todas as

contribuies necessrias para sua realizao;

a todos que direta ou indiretamente

contriburam para a realizao

desta pesquisa.


6/104

Resumo

GAZOLA, Sebastio. Construo de um modelo de regresso para

avaliao de imveis. 2002. 110f. Dissertao (Mestrado em

Engenharia de Produo) Programa de Ps-Graduao em

Engenharia de Produo, UFSC, Florianpolis.

Este trabalho apresenta uma estratgia de construo de um

modelo de regresso para determinar o preo de um imvel em funo

de suas caractersticas. O modelo foi determinado uti l izando-se a

Regresso Linear Mltipla com a tcnica de Ridge Regression , paracontornar o problema de multicolinearidade. A estratgia de construo

foi aplicada a um conjunto de dados referentes a apartamentos da

cidade de Cricima, SC. O modelo determinado apresentou-se de fcil

interpretao e util izao, util izando 11 variveis independentes e

proporcionando um bom ajuste aos dados e uma boa capacidade

preditiva. Ele atendeu todas as suposies tericas para sua

existncia e util izao.

Palavras-chave: Regresso Linear Mltipla, Avaliao de Imveis,

Multicolinearidade.


7/104

Abstract

GAZOLA, Sebastio. Construo de um modelo de regresso para

avaliao de imveis. 2002. 110f. Dissertao (Mestrado em

Engenharia de Produo) Programa de Ps-Graduao em

Engenharia de Produo, UFSC, Florianpolis.

This work presents a strategy for the building of a regression

model to determine the price of a property as a function of i ts

characteristics. The model was determined using the Multiple Linear

Regression with the Ridge Regression technique, to outline themulticoll inearity problem. The construction strategy was applied to a

data set from flats of the Cricima city, SC. The model was shown to be

of easy interpretation and use, applying 11 independent variables and

providing a good adjustment to the data and a good predictive capacity.

The theoretical suppositions for its existence and usage were met.

Key-Words: Multiple Linear Regression, Evaluation of flats,

Multicolinearity.


8/104

SUMRIO

1 - INTRODUO

1.1 - CONTEXTUALIZAO

1.2 - PROBLEMA

1.3 - OBJETIVOS

1.3.1 Objetivo Geral

1.3.2 Objetivos Especficos

1.4 - MTODOS DE DESENVOLVIMENTO DA PESQUISA

1.5 DELIMITAES DA PESQUISA

1.5 ESTRUTURA

2 - AVALIAO DE IMVEIS

2.1 INTRODUO

2.2 MERCADO IMOBILIRIO

2.3 VALOR

2.4 MTODOS DE AVALIAO

2.5 AMOSTRAGEM EM MERCADO IMOBILIRIO

2.6 NVEIS DE RIGOR

3 MTODOS REGRESSO LINEAR MLTIPLA

3.1 INTRODUO

3.2 O MODELO

3.3 INFERNCIA ESTATSTICA

3.3.1 Intervalos de Confiana

3.3.2 Testes de Hipteses

3.4 PODER DE EXPLICAO DO MODELO

3.5 RELACIONAMENTO ENTRE VARIVEIS

3.5.1 Correlao

3.5.2 Anlise Fatorial de Correspondncias

3.6 TRANSFORMAES DE VARIVEIS

3.6.1 Linearidade

14

14

16

16

16

16

17

18

18

20

20

21

22

24

26

28

30

30

31

33

34

35

37

38

38

40

41

42


9/104

3.6.2 Varincia no-constante e no-normalidade dos

Erros

3.6.3 Variveis Dummy

3.7 MULTICOLINEARIDADE

3.7.1 Efeitos da Multicolinearidade

3.7.2 Detectando a Multicolinearidade

3.7.3 Solues para o Problema da Multicolinearidade

3.8 SELEO DE VARIVEIS REGRESSORAS

3.8.1 Cuidados no Uso do Modelo

3.9 RESDUOS

3.9.1 Anlise de Resduos3.10 DIAGNSTICO DO MODELO

4 ESTRATGIA PARA A CONSTRUO DO MODELO

E APLICAO EM UM ESTUDO DE CASO

4.1 ROTEIRO PARA CONSTRUO DO MODELO

4.1.1 Identificao das Variveis Independentes

4.1.2 Levantamento de dados

4.1.3 Transformaes de Variveis

4.1.4 Anlise Exploratria

4.1.5 Construo do Modelo

4.1.6 Anlise Crtica das Variveis

4.1.7 Anlise dos Resduos

4.1.8 Verificao da Aplicabilidade do Modelo

4.2 CASO EM ESTUDO4.3 IDENTIFICAO E APRESENTAO DAS VARIVEIS

4.4 LEVANTAMENTO DE DADOS

4.5 TRANSFORMAO DE VARIVEIS

4.6 ANLISE EXPLORATRIA DAS VARIVEIS

4.6.1 Relao da varivel dependente com as

variveis independentes

4.6.2 Multicolinearidade

44

45

46

47

49

51

53

57

57

5861

65

65

65

66

67

68

69

70

71

72

7373

74

75

80

80

84


10/104

4.7 CONSTRUO DO MODELO

4.8 ANLISE DE RESDUOS

4.9 AVALIAO PRTICA DO MODELO CONSTRUDO

4.10 CONSIDERAES

5 CONSIDERAES FINAIS

5.1 Concluses

5.2 Sugestes para novas pesquisas

REFERNCIAS

APNDICE

Apndice A: Plotagem das variveis uti l izando anlise

fatorial de correspondncias

Apndice B: Correlao entre as variveis independentes

Apndice C: Grficos de cada varivel independente do

modelo versus resduos padronizados

Apndice D: Omisso de variveis valores observados das

variveis independentes versus resduos

86

89

94

97

98

98

100

101

105

105

106

107

109


11/104

LISTA DE FIGURAS

Fig. 3.1 - Exemplo de relao linear pela plotagem da variveldependente versus varivel independente 43

Fig. 3.2 - Exemplo de relao linear pela plotagem dos resduos

versus varivel independente 43

Fig. 3.3 - Exemplo de mdia zero 58

Fig. 3.4 - Exemplo de independncia dos erros pela plotagem de

resduos 59

Fig. 3.5 - Exemplo de varincia no-constante pela plotagem dos

resduos versus varivel independente 60

Fig. 3.6 - Exemplo de distribuio normal dos erros pela

plotagem dos resduos 61

Fig. 3.7 - Exemplo de no adequao do modelo pela plotagem

dos resduos versus varivel independente 62

Fig. 3.8 - Exemplo de valores discrepantes pela plotagem dos

resduos versus valores ajustados 63

Fig. 3.9 - Exemplo da omisso de variveis independentes pela

plotagem da varivel dependente versus varivel

independente63

Fig. 4.1 Diagrama de caixa das variveis quantitati vas 78

Fig. 4.2 Diagrama de caixa das variveis quantitati vas 79

Fig. 4.3 Grfico de disperso da varivel dependente versus

variveis quantitativas independentes 81

Fig. 4.4 Varincia constante - plotagem de resduos versus

valores preditos 90


12/104

Fig. 4.5 Normalidade - plotagem de resduos versus valores

esperados esperados pela distribuio normal

91

Fig. 4.6 Valores discrepantes - plotagem dos valores preditosversus resduos padronizados 92

Fig. 4.7 Omisso de variveis - valores observados da varivel

sute versus resduos padronizados 92


garagem versus resduos padronizados 93


idade versus resduos padronizados 93

LISTA DE QUADROS

Quadro 4.1 Descrio das variveis independente quantitati vas 73

Quadro 4.2 Descrio das variveis independentes qualitativas 74

Quadro 4.3 Nova categorizao das variveis RH e ZF 75

Quadro 4.4 Transformao das variveis qualitativas em

dummy76


13/104

LISTA DE TABELAS

Tabela 3.1 Anlise de Varincia para testar a significncia domodelo 36

Tabela 4.1 - Correlao linear (Pearson) entre a varivel

dependente ln(preo) e as variveis independentes

quantitativas 80

Tabela 4.2 Teste F da ANOVA para varivel dependente

ln(preo) versus variveis independentesqualitativas 82

Tabela 4.3 Razes caractersticas da matriz das correlaes 85

Tabela 4.4 Ridge Regressionpara determinao da equao 87

Tabela 4.5 Medidas referentes ao ajuste da equao 87

Tabela 4.6 Anlise de varincia para a significncia da

equao 89

Tabela 4.7 Comparao da distribuio dos resduos

padronizados com a distribuio normal padro 90

Tabela 4.8 Percentual de valores preditos nas faixas de 5% a

40% 94

Tabela 4.9 Exemplo da variao do preo predito de um imvelde valor R$ 30.000,00 95

Tabela 4.10 Percentual de valores preditos nas faixas de 5% a

40%, pelo modelo construdo por Zancan, 1995 96

Tabela 4.11 Predies de novas observaes pela equao

ajustada 97


14/104

14

__________________________________________ Captulo 1

INTRODUO

1.1 - CONTEXTUALIZAO

Os primeiros estudos sobre avaliao de imveis no Brasil datam de1918, e em 1923 foram introduzidos novos mtodos de avaliao de

terrenos, que a partir de 1929 comearam a ser sistematicamente

aplicados. A partir da a engenharia de avaliao no Brasil vem

crescendo e evoluindo nas tcnicas de avaliao. Atualmente um

grande nmero de profissionais vem desenvolvendo estudos nesse

campo, visando dar matria o suporte cientifico necessrio como

apoio aos mtodos tcnicos at ento util izados (Fiker, 1997, p.17).

O desenvolvimento da engenharia de avaliao, o crescimento do

nmero de profissionais atuando nesse campo e as necessidade do uso

das tcnicas de avaliao pelo mercado privado e tambm pelos rgos

pblicos, levaram a Associao Brasileira de Normas Tcnicas a

elaborar a Norma para Avaliao de Imveis Urbanos n. 5676/89

(Antiga NB 502).

A Caixa Econmica Federal responsvel por aproximadamente200.000 laudos de avaliao por ano, envolvendo em torno de 3.500

engenheiros, sendo a maior entidade contratante ou executora de

servios de avaliao de imveis no pas (Dantas, 1998).

A possibi lidade de contribuir, atravs de uma simples, clara e

acessvel metodologia cientifica de Regresso Linear Mltipla e

Inferncia Estatstica, para essa gama de profissionais avaliadores e

empresas, no que se refere a dar subsdios para a melhoria da


15/104

15

qualidade das avaliaes, a principal justificativa para a realizao

deste trabalho.

Uma justificativa do porqu realizar a avaliao em massa de

imveis , principalmente, para a elaborao ou atualizao do

cadastro fiscal dos municpios, pois a base para cobrana dos

tributos. Os mtodos usados para manter estes cadastros atualizados

so, na maioria das vezes, no satisfatrios do ponto de vista da

realidade do mercado imobilirio, e tambm muito onerosos aos

municpios. Por isto, a grande maioria dos municpios tem seu cadastro

desatualizado, levando a injustias na tributao e grande perda na

arrecadao dos tributos, os quais so fundamentais para a

administrao pblica (Zancan, 1995, p.12-17). Assim, uma

metodologia adequada, ou seja, que tenha bom poder de predio e

no seja onerosa, de fundamental importncia aos municpios.

Outra importncia para a avaliao de imveis a realizao de

laudos de avaliao, relativos a programas habitacionais, a patrimnios

da Unio, seguros, entre outros (Dantas, 1998).

A regresso l inear mltipla foi escolhida como mtodo para ser

aplicado avaliao de imveis por fornecer um modelo de fcil

interpretao e, principalmente, de simples aplicabil idade .

Assim, o presente trabalho procura oferecer uma contribuio na

rea da Engenharia de Avaliao, mais especificamente, nos problemas

de avaliao em massa de imveis urbanos. Os dois pontos principais

dessa contribuio so: primeiro, a metodologia para construo de ummodelo de regresso linear mltipla para estimar o preo do imvel,

com um bom ajuste aos dados observados e que fornea uma

estimativa calibrada, no distante da realidade; e o segundo ponto

consiste na metodologia de anlise e diagnstico do modelo construdo.


16/104

16

1.2 - PROBLEMA

possvel construir um modelo de regresso linear mltipla queatenda todas as suposies tericas e que seja adequado para predizer

o valor de um imvel em funo de suas caractersticas?

1.3 OBJETIVOS

1.3.1 Objetivo Geral

O objetivo geral descrever como se pode construir um modelo de

regresso linear mltipla, que possa predizer o valor de um imvel emfuno de suas caractersticas.

1.3.2 Objetivos Especficos

1 - Identificar um conjunto de variveis independentes significativas

para comporem o modelo de regresso;

2 - Verificar se o modelo proposto atende todas as suposies tericas

consideradas inicialmente para sua existncia;

3 - Realizar o diagnstico do modelo para tomada de deciso quanto a

sua aceitao;


17/104


18/104

18

1.5 DELIMITAES DA PESQUISA

Dentre as vrias tcnicas que podem ser util izadas para a avaliaode imveis, restringiu-se nesta pesquisa, ao uso das tcnicas clssicas

de regresso l inear mltipla.

A aplicao da estratgia de construo de um modelo de

regresso, proposto nesta dissertao, restringe-se aos imveis

descritos por Zancan (1995). Observa-se que os dados foram obtidos

pela prpria pesquisadora, usando o banco de dados imobilirio de

Cricima, SC, em confronto com o cadastro urbano do municpio. Aamostragem util izada no est claramente especificada.

1.6 ESTRUTURA

A dissertao est estruturada em cinco captulos, construdos de

forma facilitar o entendimento e compreenso do leitor desde os

objetivos at a concluso.

O primeiro captulo, denominado introduo, faz uma

contextualizao do assunto, cita o problema de pesquisa, os objetivos,

os mtodos para desenvolvimento do trabalho e sua estrutura.

O segundo captulo trata da reviso de literatura sobre a avaliao

de imveis. Apresenta os principais conceitos e definies relacionadas

a definio de imveis urbanos.

O captulo trs apresenta toda metodologia estatstica necessria,

de forma detalhada, da construo at o diagnstico do modelo, para

realizao da anlise de dados com a finalidade de atingir os objetivos

do trabalho.

O captulo quatro descreve um roteiro estratgico para a construodo modelo e faz a anlise dos dados, do caso dos apartamentos da


19/104

19

cidade de Cricima (Zancan, 1995), descrevendo detalhadamente os

resultados e realizando a anlise para cada um deles.

O captulo cinco faz uma concluso com base nos estudos

realizados nos captulos anteriores e apresenta sugestes para outras

possveis anlises que podem ser realizadas.


20/104

20

_______________________________________________ Captulo 2

AVALIAO DE IMVEIS

2.1 - INTRODUO

A necessidade de uma avaliao adequada de imveis cresceu e

evoluiu junto com o prprio crescimento e evoluo do mercado

imobilirio, j que ambos so complementares e interdependentes.

A tentativa de contextualizar o cone avaliao cria uma l ista

interminvel de conceitos, onde cada autor contextualiza de acordo

com as suas prioridades pessoais. Na verdade, isto possvel se

considerarmos a multidisciplinidade da avaliao, ou seja, sua

dependncia tanto de tcnicas racionais (nas reas de cincias exatas,

naturais e sociais) como de percepo no-racional (bom-senso e bom-

julgamento). A introduo do feeling que torna possvel a

variabil idade contextual (IBAPE, 1974, p.64; Ayres, 1996, p.11), e a

multidiscipl inidade que torna a avaliao flexvel (Dantas, 1998, p.3).

Existem vrias formas diferentes de se desenvolver as avaliaes

de imveis, dependendo dos dados disponveis ou da preferncia do

avaliador. Outras vezes, o imvel pode ser avaliado percorrendo-se

caminhos diferentes para a confirmao do valor de avaliao (Moreira

Filho, et al. 1993, p.4).De forma geral e resumida, pode-se definir avaliao como uma

operao tcnica realizada na estimativa do valor de um bem; ou como

uma determinao tcnica do valor de um imvel e/ou de um direito

sobre ele (NBR 5676/90); ou ainda como uma arte, dependente de

conhecimento tcnico e de bom-senso, de estimar valores

propriedades especficas (Moreira, 1990).

Sem dvida, esta lt ima definio genericamente mais apropriada,pois considera o conhecimento tcnico e a capacidade de percepo


21/104

21

no-tcnica de um bem. Agora, independentemente do conceito de

avaliao que tomemos como adequada, necessrio definir o valor do

bem considerado e o prprio mercado imobilirio.

2.2 - MERCADO IMOBILIRIO

O mercado imobilirio a instncia de determinao dos preos de

imveis urbanos que, como quaisquer outras mercadorias, passa pelo

crivo da oferta e da demanda (Moscovitch, 1997).

A existncia do mercado imobil irio depende da presena de trscomponentes: os bens imveis disponveis, os vendedores e os

compradores. Assim sendo, o fator determinante na formao dos

preos ser a relao quantitativa dentre os trs, onde a situao ideal

ser aquela onde haja uma abundncia equilibrada dentre os mesmos.

Isto determinar, num dado momento, um preo de equilbrio de

mercado que podemos considerar como sendo um preo justo. Este

mercado, considerado como sendo de concorrncia perfeita, inatingvel. O extremo esta situao, ou seja, um mercado de

concorrncia imperfeita, cria um desbalano que faz os preos se

afastarem do ideal ou justo. o caso do monoplio (raro) e oligoplio

(mais comum) que viesam os preos para cima; ou do monopsnio

(raro) e ol igopsnio (mais comum) que viesam os preos para baixo.

Obviamente, somente no mercado de concorrncia perfeita, a

construo do valor de um bem pode seguir a lei da oferta e procura(Dantas, 1998, p.9).

Os imveis so bens economicamente nicos, pois so

heterogneos, fixos e durveis. A durabilidade permite a formao de

estoque que domina o mercado, a heterogeneidade o torna

insubstituvel, e a imobilidade o relaciona com a acessibilidade e com a

estrutura vicinal (Smith et al., 1988). Se associarmos isto ao fato do

mercado ser particulado e, portanto, contar com a ao simultnea de

vrios agentes no coordenados, poderemos explicar, pelo menos


22/104

22

parcialmente, a enorme variabilidade de preos (Gonzlez e Formoso,

2000).

A indeslocabil idade torna o imvel um bem imperfeito por natureza,

ou seja, com diferenas inter e intra grupos de bens. Por este motivo, o

mercado imobilirio ser sempre de concorrncia imperfeita podendo

apresentar todas as gradaes de imperfeio. Dessa forma, cada bem

imobil irio acabar por gerar em torno de s um micro-mercado que

guardar caracteres to intimamente relacionados que dificultar a

relao deste com o macro-mercado que o circunda. Isto dificulta a

avaliao do bem porque condiciona a avaliao coleta de dados do

micro-mercado considerado. Se os elementos amostrais foreminsuficientes dentro do micro-mercado, a coleta de elementos do

macro-mercado circundante gerar tendncias de mercado que

invalidariam a avaliao (Auricchio apudTrivelloni, 1998, p.12).

2.3 - VALOR

Atribui-se valor a tudo que ti l ou escasso. Cabe avaliao

traduzir essa util idade ou escassez numa quantia monetria e associar

uma necessidade e/ou desejo de possuir um bem (Ayres, 1996, p.21).

Assim, pode-se definir valor como a relao entre a intensidade das

necessidades econmicas humanas, objetivas ou subjetivas, e a

quantidade de bens disponveis para atend-las (Fiker, 1997, p.21).

Vrios tipos de valores podem ser atribudos a um bem (Venal,Comercial, de Mercado, etc). No entanto, numa avaliao, o valor a ser

determinado o valor de mercado (Dantas, 1998, p.7). Estas

atribuies so impostas pelo mercado que determina o valor pela lei

da oferta e da procura. Assim, o valor de mercado o preo consciente

determinado por um vendedor e pago por um comprador a um bem, sem

coao de ambos os lados (Ayres, 1996, p.21).

O valor de um bem pode ser subjetivado dependendo das

circunstncias que envolvem a avaliao e do modo como examinado,

mas sempre depender de sua util idade. A localizao do imvel um


23/104

23

componente essencial de seu valor. Este valor estaria correlacionado a

aspectos que compem a qualidade de vida da rea urbana onde o

imvel est situado, por exemplo, as reas urbanas mais bem providas

de equipamentos pblicos so as que possuem imveis com maiores

valores venais. Por outro lado, independente da sua util izao, o valor

de um imvel a soma de dois sub-valores aditivos, o valor da

edificao que dada pelo seu custo (includa a remunerao do

construtor) e o valor do terreno que est intimamente relacionado s

condies urbanas de sua localizao (incorpora as vantagens e

desvantagens espaciais) (Moscovitch, 1997).

No entanto, o valor do bem difere e no deve ser confundido com opreo do bem, que representa a quantidade de dinheiro paga pelo

mesmo. Assim, a necessidade de venda ou compra imediata e/ou a no

existncia de um livre comrcio podem alterar o preo de um bem,

tornando-o superior ou inferior ao valor avaliado (Moreira Filho, 1993).

Dessa forma, defini-se o preo hednico como o preo implcito de

atributos e so revelados agentes econmicos a partir da observao

de preos de produtos diferenciados e a quantidade especfica decaractersticas a eles associados (Rosen, 1974).

O valor de mercado normatizado pela NBR 5676/90, como um

valor nico num dado instante, independente da finalidade da avaliao

e subjugada a um mercado de concorrncia perfeita. Obviamente, o

mercado imobilirio no , pela sua prpria natureza, de concorrncia

perfeita (Dantas, 1998, p.8). Na verdade, o mercado imobil irio um

dos segmentos de mercado que mais se ajusta ao mercado terico daconcorrncia imperfeita. Isto faz com que o preo de um bem seja

desviado daquele determinado teoricamente pelo mercado de

concorrncia perfeita (Barbosa Filho, 1988). Portanto, o que realmente

se paga numa negociao imobiliria o preo e no o valor (Dantas,

1998, p.8).

Existe, portanto, a necessidade da busca por tcnicas que tornem

mais precisas as formas de se estimar o valor de um bem aproximando-

o ao mximo do seu valor de mercado.


24/104

24

2.4 - MTODOS DE AVALIAO

Pode-se definir as metodologias avaliatrias como sendo as vrias

e diferentes vias percorridas com o objetivo de atribuir valor a um

imvel. Cada via util izada caracterizada como um mtodo de

avaliao diferente. No entanto, independentemente da metodologia

aplicada, esta dever apoiar-se em pesquisa de mercado e considerar

os preos comercializados e/ou ofertados, bem como outros elementos

e atributos que influenciam o valor (NBR-5676/90). A escolha da

metodologia mais apropriada para uma dada avaliao depende das

condies atuais do mercado, do tipo de servio a que se presta e dapreciso que se deseja.

Os mtodos avaliatrios pertencem a dois grupos, por vezes

conjugados, os mtodos diretos e os mtodos indiretos. Considera-se

um mtodo como sendo direto quando o valor resultado da avaliao

independe de outros. Por outro lado, o mtodo considerado indireto

sempre necessita de resultados de algum mtodo direto (Dantas, 1998,

p.15).Os mtodos diretos subdividem-se em mtodo comparativo de

dados de mercado e mtodo comparativo de custo de reproduo de

benfeitorias. J os mtodos indiretos organizam-se em trs grupos, o

mtodo de renda, o mtodo involutivo e o mtodo residual (NBR-

5676/90).

No mtodo comparativo de dados de mercado, o valor do bem

avaliado por comparao com dados do mercado similares quanto ascaractersticas intrnsecas e extrnsecas; para isto exige a presena de

um conjunto atual de dados que represente estatisticamente o

mercado. Portanto, qualquer bem pode ser avaliado por este mtodo,

desde que existam dados suficientes e atuais no mercado imobilirio

que possam ser util izados para represent-los estatisticamente

(Trivelloni, 1998, p.20; NBR 5676/90).

Pelo mtodo comparativo de custo de reproduo de benfeitorias, o

valor das benfeitorias avaliado pela reproduo dos custos

componentes, via composio dos custos baseada em oramento


25/104

25

simples ou detalhado, podendo incluir o valor do terreno e o custo da

comercializao e considerando o grau de desgaste fsico e/ou o

arcaicasmo funcional (Zancan, 1995; NBR 5676/90).

O mtodo da Renda avalia o valor do imvel ou de suas partes

componentes em funo de um rendimento j existente ou previsto pelo

bem no mercado, ou seja, o valor econmico do bem (Ayres, 1996,

p.23; NBR 5676/90).

No mtodo involutivo, o valor do terreno estimado por estudos da

viabilidade tcnica-econmica do seu aproveitamento, considerando

como aproveitamento eficiente a realizao de um empreendimento

imobil irio hipottico compatvel com as caractersticas do imvel ecom as condies do mercado (Moreira Filho, 1993, p.5; NBR 5676/90).

J pelo mtodo residual, obtm-se o valor do terreno a partir da

diferena entre o valor total do imvel e o valor das benfeitorias,

levando-se em conta o fator de comercializao (Fiker, 1997, p.27;

NBR 5676/90).

A uti l izao dos mtodos diretos tm preferncia e sempre que

existirem dados de mercado suficientes para util izao do mtodocomparativo ele deve ser escolhido (Dantas, 1998, p.15)

Quando analisa-se os vrios mtodos citados anteriormente, pode-

se observar que de uma forma, ou de outra, todos so comparativos.

No mtodo comparativo comparam-se bens semelhantes; no mtodo de

custo, comparam-se os prprios custos no mercado; nos mtodos da

renda e involutivo compara-se a possibilidade de renda do bem; e no

mtodo residual, compara-se o grau de comercializao do mercado(Dantas, 1998, p.44).

No entanto, quando a questo avaliao de imveis, o mtodo

mais util izado e recomendado o mtodo comparativo de dados de

mercado, j que este mtodo permite que a estimativa considere as

diferentes tendncias do mercado imobil irio que, por sua vez,

diferenciam-se das tendncias de outros ramos da economia. Este

mtodo estima valores baseado na comparao com outros

semelhantes, partindo-se de um grupo de dados somado s

informaes sobre transaes e ofertas do mercado, e originando com


26/104

26

isto uma amostragem estatstica de dados do mercado imobilirio. Na

prtica, de modo geral, a semelhana entre o imvel avaliado e os

componentes da amostra imperfeita e incompleta, por faltar algum

atributo que tenha influenciado no valor ou por apresent-lo de forma

parcial. Portanto, os atributos dos dados pesquisados que influenciam

o valor devem ser ponderados por homogeneizao ou inferncia

estatstica, respeitando os nveis de rigor definidos na NBR-5676/89. A

util izao da inferncia estatstica permite uma avaliao isenta de

subjetividade e repleta de confiabil idade (Moreira Filho, 1993, p.7;

Gonzlez, 2000).

Dentro deste contexto, podemos verificar que, tradicionalmente,usavam-se as tabelas na comparao de vendas para justificar o

estado real e/ou estimar valores aproximados. Mais recentemente, os

modelos de preos hednicos (regresso mltipla) tem sido util izados

para completar o mtodo de comparao de vendas. Contudo, os dois

mtodos tem experimentado crticas das comunidades acadmica e

profissional. O primeiro mtodo , freqntemente, crit icado por uti l izar

julgamentos subjetivos para determinar os ajustes necessrios etambm, por ser impreciso, tornando difci l para o avaliador obter

dados seguros e comprovados. A regresso mltipla tem produzido,

freqntemente, srios problemas para a avaliao do estado real que

resulta, primariamente, de estudos de multicolinearidade nas variveis

independentes e a partir de incluses de propriedades outlier na

amostra. Alm disso, a colinearidade dentro dos dados pode tornar a

regresso mltipla um modelo inadequado para um mercado que requerrespostas rpidas e precisas. No entanto, a regresso um mtodo

padro aceitvel para a avaliao de imveis. (Worzala et al. 1995).

2.5 AMOSTRAGEM EM MERCADO IMOBILIRIO

Quando se trabalha com o mercado imobilirio, qualquer que seja o

segmento, terrenos urbanos, imveis t ipo apartamentos, imveis t ipo

residncias, etc., geralmente impraticvel a obteno dos dados de


27/104

27

toda a populao. Isto ocorre devido ao grande nmero de elementos

na populao, custos elevados para obteno dos dados ou o grande

perodo de tempo que se faz necessrio. Assim, conveniente

trabalhar com uma amostra (Dantas, 1998, p.69).

A situao ideal para uma amostra aquela onde cada elemento da

populao tem a mesma probabilidade de ser selecionado, ou seja,

uma amostra do t ipo probabilst ica aleatria. Em muitos casos, ainda,

se faz necessrio uma amostra do t ipo probabilst ica aleatria

estratificada. Esta ltima deve ser usada quando se tem, por exemplo,

regies e a populao de indivduos difere consideravelmente de uma

para a outra.Quando se trabalha com dados de mercado muito difcil de se ter

uma amostra estatisticamente ideal. Para no inviabilizar as

inferncias, deve-se evitar usar um banco de dados, sem a

investigao do mercado no momento de realizar uma nova avaliao.

Podem ter ocorrido mudanas no mercado e estas no poderiam deixar

de serem captadas pela amostra, caso contrrio a amostra seria

tendenciosa. Ainda, a amostra deve ser equilibrada, por exemplo,quando uma categoria for exageradamente maior que as outras, acima

de 70%, deve-se ajustar um modelo especfico para tal categoria. A

amostra deve ser formada por imveis cujos preos, ou valores, so os

praticados no mercado e com todas suas caractersticas fsicas,

locacionais e econmicas (Dantas, 1998, p.49).

O preo praticado aquele que resulta de uma livre negociao

entre o vendedor e o comprador. Este preo representativo domercado ou da populao em estudo. J os preos de oferta podem

elevar o valor da mdia dos preos praticados no mercado, podendo

servir como um indicador do l imite superior dos preos de mercado.

Contudo, podem fazer parte da amostra, desde que, atualizados e

identificados. Por outro lado, no devem compor a amostra, os preos

provenientes de desapropriaes, transmisso causa mortis,

transaes entre parentes e outro (Dantas, 1998, p49-51).


28/104

28

2.6 - NVEIS DE RIGOR

Os nveis de rigor que caracterizam uma determinada avaliao de

acordo com a preciso obtida no trabalho, so normatizados pela NBR

5676/90. O nvel de rigor almejado numa dada avaliao relaciona-se

diretamente com as informaes extradas do mercado, ou seja, a

preciso do mercado ser determinada por este nvel que ser, por sua

vez, tanto maior quanto menor for a subjetividade presente na

avaliao. O rigor de uma avaliao est condicionado abrangncia

da pesquisa, confiabilidade e adequao dos dados coletados,

qualidade do processo avaliatrio e ao menor grau de subjetividadeempregado pelo avaliador. Assim, os trabalhos avaliatrios podem, de

acordo com a norma, ser classificados como de nvel de rigor expedito,

normal, r igoroso e rigoroso especial.

Na avaliao expedita o valor obtido sem a util izao de qualquer

instrumento matemtico. Dessa forma, a ausncia de rigor matemtico

determina que o valor seja atribudo atravs de escolha arbitrria, no

caracterizando o aspecto tcnico da avaliao, e bastando somenteque o avaliador tenha bom nvel de conhecimento de mercado.

A avaliao normal uti l iza mtodos estatsticos e requer exigncias

com relao coleta e tratamento dos dados. Permite a

homogeneizao dos elementos e a eliminao estatstica de dados

discrepantes sempre que o nmero destes for maior ou igual a cinco.

Nas avaliaes rigorosas, o trabalho dever apresentar, atravs de

metodologia adequada, iseno de subjetividade. O tratamento dosdados devem se basear em processos de inferncia estatstica que

permitam calcular estimativas no tendenciosas do valor. O valor f inal

da avaliao, resultado do tratamento estatstico adotado, deve estar

contido em um intervalo de confiana fechado e mximo de 80%, desde

que as hipteses nulas sejam testadas ao nvel de significncia mximo

de 5%.

A avaliao rigorosa especial caracteriza-se pelo encontro de um

modelo estatstico o mais abrangente possvel, ou seja, que incorpore o

maior nmero de caracteres que contribuem para a formao do valor.


29/104

29

A funo estimada da formao de valor deve ser eficiente e no

tendenciosa, portanto, as hipteses nulas da equao de regresso

devem ser rejeitadas ao nvel de significncia mximo de 1%, e dos

respectivos coeficientes ao nvel de significncia mximo de 10%

unicaudal ou 5% em cada ramo do teste bicaudal. Devem ser

analisadas as seguintes condies bsicas referentes aos resduos no

explicados: normalidade, homocedasticidade, no auto-regresso e

independncia entre variveis independentes.


30/104

30

_______________________________________________ Captulo 3

MTODOS - REGRESSO LINEAR MLTIPLA

3.1 - INTRODUO

A origem do termo Regresso deu-se por Francis Galton, quando

em um ensaio com pais e fi lhos ele estudou o relacionamento das

alturas dos mesmos. A lei de regresso universal de Galton foi

confirmada mais tarde por Karl Pearson, que atravs de um grande

ensaio constatou que a altura mdia dos filhos de pais altos era inferior

a altura de seus pais e que a altura mdia de filhos de pais baixos era

superior a altura de seus pais, ou seja, ele concluiu que a altura tanto

dos filhos altos como baixos tendem para a mdia de todos os homens

(Gujarati, 2000, p.3).

Na atualidade, a interpretao da regresso bem diferente. De

modo geral pode-se dizer que a anlise de regresso o estudo de

uma varivel (a varivel dependente) em funo de uma ou mais

variveis (as variveis independentes), com o objetivo de estimar e/ou

prever a mdia populacional ou valor mdio da varivel dependente,

util izando valores observados por amostragem das variveis

independentes (Gujarati, 2000, p.9).

Atualmente a anlise de regresso mltipla uma das ferramentasou mtodos estatsticos uti l izados com maior freqncia. uma

metodologia estatstica para predizer valores de uma varivel resposta

(dependente) para uma coleo de valores de variveis preditoras

(independentes).

Em engenharia de avaliaes, considera-se geralmente como

varivel dependente os preos vista de mercado em oferta e

efetivamente transacionados, e como variveis independentes ascaractersticas do imvel decorrentes dos aspectos fsicos e de


31/104

31

localizao, bem como de aspectos econmicos. Observa-se que as

variveis independentes podem ser tanto de natureza quantitativa como

qualitativa (Dantas, 1998, p.51,52).

A teoria econmica especif ica t ipicamente relaes funcionais

exatas entre variveis. Porm, na realidade, no se verif ica tal relao

funcional exata. Isto diz que a teoria econmica deve ser ampliada com

a introduo de elementos probabilsticos. Assim, a tarefa principal

administrar um ponto entre as relaes exatas e as relaes instveis

da realidade econmica (Goldberger, 1970, p.11-16).

3.2 - O MODELO

O modelo de regresso linear mltipla descreve uma varivel

dependente Y como funo de vrias variveis regressoras ou

independentes. Um modelo geral, com p variveis regressoras, dado

por:

Y i= 0 + 1X i 1 + 2X i 2+ ... + pX i p+ i ( i=1,...,n).

onde:

Y i representa as observaes da chamada varivel dependente,

varivel explicada ou varivel resposta;

X i k so chamadas de variveis independentes, variveis explicativas,variveis regressoras ou covariveis (k = 1, 2, ..., p);

i so os parmetros da populao;

i so os erros aleatrios

Os erros aleatrios representam os inmeros fatores que,

conjuntamente, podem interferir nas observaes da varivel

dependente Y (Charnet et al. , 1999, p.170).


32/104

32

A representao do modelo na forma matricial Y = X + , onde:

Y=

n

1

Y

Y

M X =

npn1

1p11

XX1

XX1

L

MOMM

L

=

p

0

M =

n

1

M

A funo de regresso do modelo, descrita em termos de valor

esperado, dada por:

E(Y) = 0+ 1X1 + 2X2+ ... + pXp

Nesse modelo, xj o valor f ixo da varivel regressora Xj,

j=1,2,.. .,p. Os parmetros j so denominados coeficientes de

regresso. Podemos interpretar j como a mudana esperada em Y

devido ao aumento de uma unidade em Xj , estando as outras variveis

Xk , k j , f ixas.

O coeficiente 0 o intercepto da superfcie de resposta

(regresso). Se a abrangncia do modelo inclui (0, 0, ..., 0) ento 0 representa a resposta mdia E(Y) neste ponto. Em outras situaes, 0

no tem qualquer outro significado como um termo separado no modelo

de regresso.

Um dos objetivos da anlise de regresso desenvolver uma

equao que permita ao investigador estimar respostas para valores

dados de variveis preditoras. Para descrever a equao necessrio

estimar os valores para os coeficientes de regresso e a varincia 2

do erro com os dados observados.

Os coeficientes de regresso podem ser estimados por vrios

mtodos, um dos mais usados o mtodo de mnimos quadrados. Este

mtodo consiste em encontrar uma estimativa para os parmetros de

forma que a soma do quadrado dos erros seja mnima. Os estimadores

gerados por este mtodo so no viesados e consistentes (Neter e

Wasserman, 1974, p.37,226).


33/104

33

O estimadores para o vetor de parmetros e para a varincia 2

so dados, respectivamente, por:

b=(XX) -1XY e S2=(Y-Xb) (Y-Xb)/(n-p-1).

As suposies exigidas para o modelo de regresso l inear mltipla,

alm das estimativas dos parmetros, so as seguintes:

1) as variveis independentes so nmeros reais sem perturbaes

aleatrias.

2) o nmero de observaes, n, deve ser superior ao nmero de

parmetros, p, estimados.

3) os erros so variveis aleatrias com as seguintes suposies:

- valor esperado zero - E( i) = 0;

- varincia constante - Var( i) = 2;

- no correlaciona dos - Cov( i, j) = 0, ij .

4) a distribuio dos erros normal, i N(0, 2). Como os erros so

no correlacionados, pode-se afirmar, sob a hiptese de

normalidade, que estes so independentes.

5) no deve existir nenhuma relao exata entre as variveis

independentes.

3.3 - INFERNCIA ESTATSTICA

Os parmetros populacionais so estimados pontualmente a partir

de uma amostra, porm necessrio obter informaes sobre seu

comportamento probabilstico. Este estudo realizado atravs dosintervalos de confiana e testes de hipteses.


34/104

34

3.3.1 - Intervalos de Confiana

O intervalo de confiana fornece informao sobre a preciso das

estimativas. o intervalo do qual pode-se afirmar, com certa confiana,

que o verdadeiro valor de um parmetro populacional est contido nele,

ou seja, o intervalo de confiana estabelece limites para o valor objeto

de estudo. Os intervalos de confiana mais usuais em uma anlise de

regresso so descritos a seguir.

Intervalo de confiana para o parmetro k: para o modelo onde os

erros tm distribuio normal, o intervalo de confiana para k , dadopor

(bk t (1 - / 2 ; n -p -1 ) . S(bk) ; bk + t (1 - / 2 ; n -p -1 ) . S(bk))

onde bk o estimador de k , t (1 - / 2 ; n -p -1 ) o valor da estatstica t com

significncia e (n-p-1) graus de l iberdade e S(b k) o desvio-padro

estimado de bk . S2(bk) o k-simo elemento da diagonal principal da

matriz:S2(b)=QME(XX) -1

Intervalo de confiana para valores mdios preditos: o valor mdio

estimado para um caso (imvel) i dado por bX'iiY = , ( [ ]iX1X ='

i ). O

intervalo de confiana para o valor mdio estimado calculado por:

( iY t (1 - / 2 ; n -p -1 ) . S( iY ) ; iY + t (1 - / 2 ; n -p -1 ) . S( iY ))

onde kY o valor mdio estimado para o caso i, t (1 - / 2 ; n -p -1 ) o valor

da estatstica t com signif icncia e (n-p-1) graus de l iberdade e S( iY )

o desvio-padro de iY . S2( iY ) dada por

S2( iY )=(QME)'

iX (XX)-1X i=

'

iX S2(b)X i

Desta forma, possvel comparar o valor observado com o valorestimado e a preciso do ajuste.


35/104

35

Intervalo de confiana para valores preditos: o valor predito para um

novo caso observado h dado por bX'h

=hY . E o intervalo de confiana

para este novo caso observado dado por

( hY t (1 - /2 ; n -p -1 ) . S(pred) ; hY + t (1 - /2 ; n -p -1 ) . S(pred)).

Onde hY o valor predito para o novo caso h, t (1 - / 2 ; n -p -1 ) o valor

da estatstica t com signif icncia e (n-p) graus de l iberdade e S(pred)

o desvio-padro do valor predito. S 2(predito) dado por

S2

(predito)=QME(1+'

hX (XX)-1

Xh)

3.3.2 - Testes de Hipteses

O teste de hiptese uma regra usada para decidir se uma hiptese

estatstica deve ser rejeitada ou no. O objetivo do teste de hiptese

decidir se uma hiptese sobre determinada caracterstica da populao ou no apoiada pela evidncia obtida de dados amostrais. Os testes

de hipteses so os primeiros estudos realizados para a verificao da

validade do modelo. Os testes de hipteses necessrios em uma

anlise de regresso so descritos abaixo.

Teste de hiptese para a significncia do modelo: este teste usado

para estabelecer se existe ou no alguma relao entre a varivel

dependente e o conjunto de variveis independentes. Consiste em

testar as seguintes hipteses (Neter e Wasserman, 1974, p.228):

H0 : 1= 2 = ... = p = 0

H1 : k 0 para algum k

A estatstica do teste tem, sob H0 , a distribuio F com p e (n-p-1)

graus de liberdade. A rejeio da hiptese H 0 indica a existncia de

regresso.


36/104

36

As quantidades necessrias para calcular o valor observado dessa

estatstica esto dispostas na tabela 3.1, denominada de tabela de

anlise de varincia - ANOVA.

Tabela 3.1:Anlise de Varincia para testar a significncia do modelo

Fontes de

Variao

Soma de

Quadrados

Graus de

Liberdade

Quadrado

MdioF0

Regresso SQR p QMR=P

SQR

QME

QMR

Resduo SQE n-p-1 QME=1PN

SQE

Total SQT n-1 QMT=1N

SQT

onde:

SQR = bXY- n y 2 , SQE = YY bXY e SQT = SQE + SQR

A existncia de uma relao de regresso, por si s, no garanteque predies teis podem ser feitas usando este modelo (Neter et al.,

1996, p.230). Este teste apenas a primeira etapa na verificao de

aceitao do modelo.

Teste de hiptese para o parmetro k: Aps a verificao de que

pelo menos um dos parmetros k signif icativo, deve-se testar a

significncia de cada um deles, isto , para cada parmetro k (k=1,...,p), testam-se as hipteses:

H0 : k = 0

H1 : k 0

O teste para cada parmetro feito uti l izando a estatstica t de

Student com (n-p-1) graus de liberdade, o desvio padro amostral S(bk)

e o estimador b k . A estatstica do teste dada por


37/104

37

t* =)S(b

b

K

K

Se t* t (1 - / 2 ;n -p -1 ), o teste no rejeita H0 ; caso contrrio o teste

rejeita H0 em favor de H1 . A rejeio de H 0 indica uma contribuio

significativa da varivel independente Xk no modelo.

Teste de hiptese para um subconjunto de parmetros:Aps o teste

t sugerir as variveis independentes a serem usadas na equao,

importante examinar se a varivel dependente pode ser explicada pelas

variveis sugeridas to adequadamente quanto por todas as variveis.

Para isto, testam-se as hipteses:

H0 : q+ 1= q+2= ... = p-1= 0, q


38/104


39/104

39

[ ]1/22i2iii

XY

)Y(Y)X(X

)Y)(YX(Xr

=

Este valor sempre est entre 1 e 1. Quanto mais prximo de 1 e 1

maior a tendncia de relao linear positiva e negativa

respectivamente; e quando estiver prximo de zero indica ausncia de

correlao l inear entre as variveis (Dantas, 1998, p.114).

A matriz das correlaes entre as variveis independentes pode ser

util izada para orientar os primeiros passos para a construo da

equao de regresso. Um valor do determinante da matriz das

correlaes das variveis independentes prximo de zero indicao

de multicolinearidade (Dantas, 1998, p.132,133).

A regresso e a correlao esto intimamente relacionadas, porm

so muito diferentes conceitualmente. O coeficiente de correlao

mede a intensidade da associao linear entre duas variveis

aleatrias, enquanto a regresso tenta estimar ou prever o valor mdio

de uma varivel aleatria com base nos valores fixados de outras

variveis fixadas. A anlise de correlao trata duas variveis

simetricamente, no distingue a varivel dependente e independente e

supe as duas aleatrias. Na regresso h uma assimetria em como as

variveis dependente e independente so tratadas. A varivel

dependente suposta ser estatstica, aleatria ou estocstica, isto ,

ter uma distribuio de probabil idade (Gujarati, 2000, p.9).

A regresso mostra como as variveis esto relacionadas e a

correlao mostra o grau de relacionamento entre elas. O nmero

fornecido pela correlao um retrato instantneo de quo prximo

esto duas variveis que variam juntas. Alguns economistas

consideram a correlao uma tcnica pouco poderosa, porm como a

correlao e a regresso esto intimamente ligadas matematicamente,

muitas vezes a correlao um auxlio til na regresso (Wonnacott e

Wonnacott, 1978, p.98-102).


40/104

40

3.5.2 - Anlise Fatorial de Correspondncias

A Anlise Fatorial de Correspondncias uma das tcnicas

multivariadas que permite examinar relaes geomtricas do

cruzamento ou contingenciamento de variveis categricas, analisando

a distribuio de massa de um conjunto de observaes, tendo como

princpios bsicos, a proximidade geomtrica e a reduo de

dimensionalidade. No um mtodo para prova de hipteses, mas sim

uma tcnica descritiva e explanatria, ou seja, nenhum teste de

significado estatstico costumeiramente aplicado aos resultados de

uma anlise fatorial de correspondncia, que tem como princpioreproduzir, de forma simplif icada, as informaes de uma grande tabela

de freqncia. Esta tcnica permite estudar uma populao de

indivduos descrita por variveis que podem ser do t ipo qualitativo,

quantitativo ou uma mescla de ambos, desde que os dados contnuos

sejam discretizados e restri tos a valores posit ivos (Pereira, 2001,

p.133).

A transformao de variveis contnuas em qualitativas tem afinalidade de tornar homogneo os conjuntos de dados que so

compostos de variveis numricas e de variveis qualitativas. Ainda se

pode ter interesse em realizar uma codificao qualitativa at quando

se dispe de um conjunto de variveis numricas, sobre o qual se pode

aplicar adequadamente a chamada anlise de componentes principais.

Uma anlise fatorial de correspondncia mltipla sobre as mesmas

variveis codificadas em classes, d outra aproximao para os dados,pois permite exibir, possveis relaes no lineares entre as variveis.

Tais fenmenos so invisveis nos resultados de uma anlise de

componentes principais, que no leva em conta, mais que relaes

lineares (Escofier e Pags, 1992, p.7-25).

Para codif icar uma varivel contnua em classes, ou seja, recortar o

seu intervalo de variao em subintervalos que definem outras

modalidades, necessrio determinar o nmero de intervalos e seus

limites. Diminuindo o excesso do nmero de classes, se agrupam

indivduos cada vez mais distintos e, por isto, perde-se muita


41/104

41

informao. Por outro lado, aumentando o nmero de casos correse o

risco de se obter classes com pouca informao. A experincia mostra

que no til superar o nmero de oito modalidades na codificao de

variveis quantitativas e que quatro ou cinco so suficientes (Escofier e

Pags, 1992, p.66-69).

3.6 - TRANSFORMAES DE VARIVEIS

As variveis so um conjunto de medidas repetidas de um

determinado objeto de estudo sendo que estas medidas podem serrealizadas em diferentes unidades, que levam a classific-las como

quantitativas ou qualitativas (Pereira, 2001, p.43,44).

O primeiro aspecto a ser analisado com relao aos dados,

estudando o tipo, comparando as grandezas e o comportamento entre

as variveis. Ento deve-se preparar estes dados para a anlise de

regresso.

Algumas vezes se faz necessrio algum tipo de transformao nasvariveis e tambm o uso de variveis dummy. As transformaes so

necessrias quando ocorre a falta de linearidade, varincia no-

constante dos erros e no-normalidade dos erros; possibilitando a

construo de modelos mais simples. Por razes prticas, modelos

mais simples so mais fceis de se estudar a validade e tambm de

serem testados.

Geralmente transformaes simples da varivel dependente, dasvariveis independentes ou de ambas possibilitam a construo de um

modelo de regresso linear apropriado ao conjunto de dados

transformados.

Quando se procura ajustar modelos a dados imobilirios, a

transformao logartmica a preferida, pois as variveis pertinentes a

imveis pertencem ao campo dos nmeros reais positivos e os valores

transformados tambm sero, assim a especificao logartmica se

adequa melhor na descrio dos preos das unidades em relao a

seus respectivos atributos (Macedo, 1998; Dantas, 1998, p.143).


42/104

42

Outro aspecto que a prpria ABNT sugere a transformao

logartmica na varivel resposta porque torna o modelo aditivo.

No entanto existem muitas possibilidades de transformaes, e

muitos modelos podem ser descritos. A escolha de qual a melhor

transformao a se fazer exige um conhecimento do comportamento

das variveis em estudo. A razo principal para a realizao das

transformaes poder fazer uso de um modelo de regresso na forma

mais simples em vez de uma forma mais complicada obtido com as

variveis originais (Draper e Smith, 1981, p.221).

3.6.1 - Linearidade

A linearidade ocorre quando os pontos permitem um ajuste atravs

de um hiperplano. Isto pode ser investigado atravs do coeficiente de

correlao calculado entre a varivel dependente e cada varivel

independente, e ainda analisando os seguintes grficos:

varivel dependente versus varivel independente: havendo vrias

variveis regressoras, recomendado o grfico com cada uma delas,

devendo-se observar se os pontos esto alinhados, conforme mostra a

Figura 3.1.

resduos versus varivel independente: devendo observar se os

pontos esto dispostos aleatoriamente, sem quaisquer tipos detendncia, conforme Figura 3.2, devendo tambm ser construdo para

cada varivel independente.


43/104

43

varivel idependente

vari

ve

ldependen

te

Figura 3.1: exemplo de relao linear pela plotagem

da varivel dependente versus varivel independente.

Dados fictcios.

varivel independente

resduos

Figura 3.2: exemplo de relao linear pela plotagem

dos resduos versus varivel independente.

Dados fictcios.

Quando ocorre a falta de linearidade, sendo a distribuio dos erros

aproximadamente normal e com varincia razoavelmente constante,

transformaes na varivel independente devem ser testadas. Isto

porque transformaes na varivel dependente, tal como atransformao por raiz quadrada, pode mudar o tipo de distribuio e


44/104

44

provocar uma diferena nas varincias dos erros (Neter et al, 1996,

p.126-128).

As transformaes para uma varivel independente X para a no-

l inearidade do modelo, dentre outras transformaes, podem ser:

Logartmica , X = logX (na base 10 ou e)

Raiz quadrada, X = X

Quadrtica, X = X2

Exponencial, X = exp(X)

Recproca, X = 1/X

Exponencial negativa, X = Exp(X)

3.6.2 - Varincia no-constante e no-normalidade dos erros

Quando se comprova a heterogeneidade da varincia, as

estimativas das varincias dos estimadores dos parmetros so

tendenciosos, levando valores incorretos das inferncias. Neste caso

h necessidade de estabilizar a varincia, que pode ser feito atravs de

transformaes na varivel resposta.

A suposio de normalidade dos erros deve ser satisfeita para que

se possa calcular os intervalos de confiana e fazer inferncias.

Uma varincia no-constante e a no-normalidade dos erros

aparecem freqentemente ao mesmo tempo, e alguma transformao

na varivel resposta deve ser feita. claro que uma transformao navarivel resposta tambm pode resolver o problema de falta de

linearidade de uma relao de regresso. Outras vezes, uma

transformao simultnea da varivel resposta e da varivel preditora

ser necessria para obter uma relao de regresso linear (Neter et

al. , 1996, p.129-132).

Exemplos de transformaes da varivel resposta Y para a varincia

no-constante e a no-normalidade dos erros so:


45/104

45

Logartmica, Y = logY (na base 10 ou e)

Raiz quadrada, Y = Y

Quadrtica, Y = Y2

Recproca, Y = 1/Y

Arco seno, Y = arcsen Y

Box-Cox, Y=Y.

O procedimento de Box-Cox identifica automaticamente uma

transformao da faml ia de transformaes de potncia sobre Y. O

parmetro determinado dos dados. Para =0 define-se a

transformao logartmica (Neter et al, 1996, p.129-132).

3.6.3 - Variveis Dummy

As variveis usadas nas equaes de regresso podem no serem

quantitativas. Isto geralmente ocorre quando se estuda o

comportamento do mercado imobilirio, que alm de ser caracterizado

por variveis quantitativas como valores de venda ou locao e idade

tambm caracterizado por variveis qualitativas como presena

de elevador (sim ou no), situado na regio A ou B ou C e padro de

acabamento (timo, bom, regular ou ruim) dentre outras. Estas

variveis so comumente chamadas de variveis dummy (Dantas,

1998, p.157,158).

Para as variveis que apresentam um aspecto dicotmico, como por

exemplo a presena de elevador (sim ou no), relaciona-se

determinado nmero as caractersticas. Geralmente usa-se o nmero

um quando determinada caracterstica est presente e o nmero zero

em caso contrrio (Moreira Filho, 1993, p.85-87).

As variveis com mais de dois nveis, como por exemplo as regies

A, B ou C, podem ser trabalhadas como duas variveis dicotmicas,

sendo regio A (sim ou no) e regio B (sim ou no), estando a regio

C contemplada na anlise quando se tem no para a regio A e no


46/104

46

para a regio B. Generalizando, tem-se que uma varivel com p nveis

pode ser reescrita como (p-1) variveis dicotmicas.

Quando se faz uma regresso da varivel dependente sobre as

variveis independentes dummy, os coeficientes de mnimos

quadrados das variveis dummy so as mdias das celas em que

esto tabulados (Johnston, 1974, p.239-241).

3.7 - MULTICOLINEARIDADE

Em anlise de regresso l inear mltipla, existe um freqenteinteresse com relao a natureza e significncia das relaes entre as

variveis independentes e a varivel dependente. Em muitas aplicaes

de administrao e economia, freqntemente encontram-se variveis

independentes que esto correlacionadas entre elas mesmas e,

tambm, com outras variveis que no esto includas no modelo, mas

esto relacionadas varivel dependente (Neter e Wasserman, 1974,

p.339).Define-se como multicolinearidade a existncia de relaes lineares

entre as variveis independentes. Quando a relao exata tem-se o

caso da multicolinearidade perfeita.

Na prtica atual, raramente, encontramos variveis independentes

que so perfeitamente relacionadas. Este caso no traz problemas,

pois facilmente detectado e pode ser resolvido simplesmente

eliminando uma ou mais variveis independentes do modelo.O interesse no que se refere a multicolinearide est nos casos em

que ela ocorre com alto grau, isto , quando duas variveis

independentes esto altamente correlacionadas ou quando h uma

combinao quase linear entre um conjunto de variveis

independentes. Assim, a multicolinearidade mais uma questo de

grau do que de natureza (Kmenta, 1978, p.411-423).

O fato de muitas funes de regresso diferentes proporcionarem

bons ajustes para um mesmo conjunto de dados porque os

coeficientes de regresso atendem vrias amostras onde as variveis


47/104

47

independentes so altamente correlacionadas. Assim, os coeficientes

de regresso estimados variam de uma amostra para outra quando as

variveis independentes esto altamente correlacionadas. Isto leva a

informaes imprecisas a respeito dos coeficientes verdadeiros (Neter

e Wasserman, 1974, p.344).

A multicolinearidade geralmente causada pela prpria natureza

dos dados, principalmente nas reas de economia com variveis que

representam valores de mercado. Algumas vezes a multicolinearidade

pode tambm ocorrer devido a amostragem inadequada (Elian, 1998).

3.7.1 - Efeitos da Multicolinearidade

Efeito da Multicolinearidade nos Coeficientes de Regresso: quando as

variveis independentes so correlacionadas, o coeficiente de

regresso de alguma varivel independente depende de qual outra

varivel independente includa no modelo, pois adicionando ou

deletando uma das variveis independentes mudam-se os coeficientesde regresso. Assim, um coeficiente de regresso deixa de refletir os

efeitos inerentes de uma particular varivel independente sobre a

varivel dependente, mas reflete apenas um efeito parcial.

Note que o coeficiente de regresso de uma varivel independente

X1 inalterado quando uma varivel independente X 2, no

correlacionada com X1 , adicionada no modelo de regresso, pois,

212r1

12.r

y2.r

2

1

2)1xi1(x

2)yi

(y

2)1xi1(x

)yi

)(y1xi1(x

1b

=

onde ry2 o coeficiente de correlao entre as variveis Y e X2 e r12

o coeficiente de correlao entre as variveis X 1e X2 .

Se X1 e X2 forem no correlacionadas, tem-se r12 =0, e, portanto,

=

2)1xi1(x

)yi

)(y1xi1(x

1b , que o coeficiente de X1 na regresso simples de Y


48/104

48

sobre X1 . Logo, se X1 e X2 no so correlacionados, a adio de X 2 no

modelo de regresso no muda o coeficiente de X1.

Efeito da Multicolinearidade na Soma de Quadrados de Regresso :

quando variveis independentes so correlacionadas, no existe uma

soma de quadrados nica que pode ser atribuda a uma varivel

independente refletindo o efeito na reduo da variao total em Y, ou

seja, a soma de quadrado associada a uma varivel independente

varia, dependendo sobre que varivel independente esteja includa no

modelo.

Efeito da Multicolinearidade nos Testes para os Coeficientes de

Regresso : um abuso freqnte nos modelos de regresso

observado ao se examinar a estatstica t* para cada coeficiente de

regresso. possvel que quando um conjunto de variveis

independentes esteja relacionado varivel dependente, obtendo todos

os testes individuais sob os coeficientes de regresso, eles levaro

concluso que os coeficientes so iguais a zero devido amulticolinearidade entre as variveis independentes. Os coeficientes de

regresso estimados individualmente podem no ser estatisticamente

significativos, ainda que possa existir uma relao estatstica entre a

varivel dependente e o conjunto de variveis independentes (Matos,

2000, p.124-129).

Apesar das conseqncias dos efeitos da multicolinearidade,

citados anteriormente, a alta Multicolinearidade no , geralmente, umproblema quando o propsito da anlise de regresso fazer

inferncias sobre a funo resposta ou predies de novas

observaes, contanto que estas inferncias sejam feitas dentro do

mbito das observaes (Neter e Wasserman, 1974, p.345; Neter et al.,

1996, p.285,295).

Para fazer boas previses o pesquisador deve ter confiana de que

o carter e o tamanho do relacionamento global se manter de perodo

para perodo. Note que, a questo de confiana um problema


49/104

49

existente em todos os modelos de previses, com ou sem a presena

de multicolinearide (Chatterjee e Price, 1977, p.151-153).

Quando o relacionamento entre as variveis independentes se

mantm, no perodo previsto e no perodo da amostra, as previses so

corretas at mesmo fora da amostra (Judge et al. , 1988, p.859-861).

Nota-se, ento, que quando os valores das variveis independentes,

para as quais se desejam as previses, obedecem as mesmas

dependncias da matriz original, a multicolinearidade no um

problema. Como nas aplicaes econmicas a multicolinearidade,

quando existe, uma caracterstica da populao, a estrutura

permanece de amostra para amostra, no sendo um caso de umaamostra simplesmente infectada pela Multicolinearidade. Portanto,

pode-se usar a equao de regresso estimada para fazer inferncias

sobre a funo resposta ou predies de novas observaes (Neter et

al. , 1996, p.285-295).

3.7.2 - Detectando a Multicolinearidade

Existem muitas sugestes, ou mtodos propostos, para detectar a

multicolinearidade. Os mais comumente usados so:

coeficiente de correlao simples: uma medida comumente usada

no caso de duas variveis independentes, sendo suficiente para

detectar a colinearidade. Considera-se que um coeficiente decorrelao maior que 0,80 ou 0,90 indicativo de um problema srio de

colinearidade. Porm, para mais de duas variveis independentes,

mesmo os coeficientes de correlao sendo baixos ainda pode existir a

multicolinearidade, pois pares de correlaes podem no dar viso de

intercorrelacionamentos mais complexos entre trs ou mais variveis

(Judge et al. , 1980, p.458,459).

determinante de (XX): Se as variveis independentes esto

padronizadas, tal que (XX) contm elementos que so os coeficientes


50/104

50

de correlao linear entre as variveis independentes, ento o

determinante de (XX) um valor no intervalo [0;1]. Caso as variveis

independentes no estejam padronizadas, melhor analisar o

determinante da matriz de correlaes entre as variveis

independentes, Rx , que sempre assume valores no intervalo [0,1]. Um

valor deste determinante prximo de zero indicativo de

multicolinearidade (Elian, 1998, p.125; Neter e Wasserman, 1974,

p.347).

coeficiente de explicao do modelo, R2: o R2 tendo um valor alto,

mas os coeficientes de correlao parcial tendo valores baixos, tem-sea indicao de multicolinearidade.

regresses auxiliares: se o valor de R2, calculado da regresso de

cada varivel independente sobre as outras (k-1) variveis

independentes alto, ento h indicativo de multicolinearidade.

razes caractersticas: Sejam i, i=1,...,p, as razes caractersticas deRx, tem-se que det(Rx)= i. Baixos valores de uma ou mais razes

caractersticas, comparado com o maior valor, so indicativos de

multicolinearidade. Um critrio, bem eficiente, na quantif icao da

multicolinearidade, a anlise do valor de L, dado por

L=mx /mn,

onde mx o maior valor das razes caractersticas e mn o menorvalor das razes caractersticas. Se L < 100, considera-se no existir

multicolinearidade, se 100 < L < 1000 existe multicolinearidade

moderada e se L > 1000 h indicativo de multicolinearidade sria

(Elian, 1998, p.131).

O grfico dos resduos: o grfico dos resduos versus cada varivel

independente, inclusive as variveis que no fazem parte da equaode regresso, indicam a inexistncia de correlacionamento quando os


51/104

51

pontos estiverem dispostos aleatoriamente, sem qualquer padro. Caso

contrrio, se apresentarem algum tipo de tendncia, h indicativo de

correlacionamento.

3.7.3 - Solues para o Problema de Multicolinearidade

A existncia de multicolinearidade tendo sido detectada e

considerada prejudicial, indica que o pesquisador deve procurar

solues para suavizar seus efeitos ruins. Vrias medidas corretivas

tm sido propostas, desde simples s mais complexas, para suavizaros efeitos provocados pela multicolinearidade (Elian,1988, p.131-134;

Judge et al. , 1980, p.464-468).

Remoo de variveis - uma medida simples remover uma ou vrias

variveis independentes, pouco importantes no contexto geral, que

venham a diminuir a multicolinearidade. Porm, esta ao no ajuda a

avaliar os efeitos da varivel independente, pois nenhuma informao obtida cerca da varivel removida, e tambm porque o valor do

coeficiente de regresso para a varivel independente remanescente

no modelo afetada pelas variveis independentes correlacionadas

no includas no modelo.

Ampliao do tamanho da amostra - algumas vezes possvel

adicionar algumas observaes na amostra que elimina o padro demulticolinearidade. Esta medida usada quando o problema causado

por informao amostral inadequada. Porm, em administrao e

economia muitas variveis independentes no podem ser controladas

de forma que novas observaes tendero a mostrar o mesmo padro

de intercorrelao.

Ridge Regression -outro critrio, para o qual tem-se dado ateno,

Ridge Regression (Regresso em Cumeeira) que consiste no uso de


52/104

52

estimadores tendenciosos para os coeficientes. O estimador em crista

na verdade uma famlia de estimadores dados por:

b(k)=(XX+kI) -1XY ,

onde k um valor pequeno que deve ser escolhido a critrio do

pesquisador. Em geral, aumenta-se gradativamente o valor de k at

que os estimadores dos coeficientes tornam-se estveis, no variam.

Se a escolha for k=0, tem-se o estimador de mnimos quadrados (Neter

et al., 1996, p.411-416; Elian, 1998, p.133; Draper e Smith, 1981,

p.313-349).

Na presena de multicolinearidade sempre existe um valor de k parao qual os estimadores de Ridge Regression produzem um QME

(quadrado mdio do erro) menor do que o QME produzido pelos

estimadores de mnimos quadrados ordinrios. A dificuldade desta

questo que o valor de k varia de uma aplicao para outra e

desconhecido. Assim, embora exista este valor de k, no existe um

caminho conhecido para obt-lo, mesmo quando obtm-se um k que

produza um MSE menor do que o MSE de mnimos quadradosordinrios para um problema prtico especfico (Draper e Smith, 1981,

p.315,316).

A funo de regresso estimada pela Ridge Regression produz

predies de novas observaes que tendem a serem mais precisas do

que as predies feitas pela funo de regresso estimada pelo mtodo

de mnimos quadrados, quando as variveis independentes so

correlacionadas e a nova observao segue o mesmo padro demulticolinearidade. Esta preciso na predio de novas observaes

favorecida pela Ridge Regression , especialmente quando a

multicolinearidade forte (Neter et al., 1996, p.411-416).

Componentes principais uma outra forma que pode ser util izada

para tratar o problema causado pela multicolinearidade a tcnica de

componentes principais.

Esta tcnica permite que todas as variveis independentes

participam de certa forma do modelo. Atravs desta tcnica, possvel


53/104

53

reduzir um grande nmero de variveis independentes em um nmero

razoavelmente pequeno de novas variveis independentes, que so

chamadas de componentes e so determinadas pela combinao linear

das variveis originais. Estas novas variveis (ou componentes

principais) so no correlacionadas e so usadas para determinar o

modelo de regresso.

O objetivo da anlise de componentes principais representar ou

descrever um conjunto de variveis por um outro conjunto menor de

novas variveis, sem perda significativa da informao original (Reis,

1997, p.255). A reduo da dimensionalidade das variveis consiste no

fato de que as primeiras componentes principais possam explicar amaior parte da variabil idade total dos dados originais.

A anlise de componentes principais permite um estudo detalhado

da importncia de cada varivel, fornecendo a quantidade de

explicao na componente principal e seu relacionamento com as

demais variveis. Sobre a anlise de componentes principais pode ser

visto em Escofier e Pags (1990) e Bouroche e Saporta (1982).

3.8 - SELEO DE VARIVEIS REGRESSORAS

Um dos problemas mais difceis e freqntes em anlise de

regresso a seleo do conjunto de variveis independentes para

serem includas no modelo (Neter e Wasserman, 1974, p.371).

O investigador deve especificar o conjunto de variveisindependentes a ser empregado para descrever, controlar ou predizer a

varivel dependente.

Um problema muito difcil de relacionamento que aparece na

seleo de variveis quando uma equao de regresso construda

com o objetivo de predio e envolve muitas variveis. Talvez, muitas

delas, contribuam pouco ou nada para preciso da predio. A escolha

apropriada de algumas delas fornece a melhor predio, porm o

problema quantas e quais variveis selecionar (Snedecor e Cochram,

1972, p.412,413).


54/104

54

Em alguns campos, a teoria pode ajudar na seleo das variveis

independentes a serem empregadas e na especificao da forma

funcional da relao de regresso. Em tais campos, os experimentos

podem ser controlados para fornecer dados sobre a base de que os

parmetros de regresso podem ser estimados e a forma terica da

regresso testada. Em muitos outros campos, entretanto, modelos

tericos so raros. Assim, os investigadores so freqntemente

forados a explorar as variveis independentes para que possam

realizar estudos sobre a varivel dependente. Obviamente, tais

conjuntos de variveis independentes so grandes. Algumas das

variveis independentes podem ser removidas seletivamente. Umavarivel independente pode no ser fundamental ao problema; pode

estar sujeita a grandes erros de medidas; e pode efetivamente duplicar

outra varivel independente da l ista. Outras variveis independentes,

que no podem ser medidas, podem ser deletadas ou substitudas por

variveis que esto altamente correlacionadas com estas.

Tipicamente, o nmero de variveis independentes que permanece,

aps esta seleo inicial, ainda grande. Posteriormente, muitasdestas variveis estaro altamente intercorrelacionadas. Portanto, o

investigador geralmente desejar reduzir o nmero de variveis

independentes a serem usadas no modelo final. Existem vrias razes

para isto. Um modelo de regresso com um nmero grande de variveis

independentes caro para se util izar. Dessa forma, modelos de

regresso com um nmero limitado de variveis independentes so

fceis para se avaliar e estudar. Finalmente, a presena de muitasvariveis independentes altamente intercorrelacionadas, podem

adicionar pouco ao poder de predio do modelo, enquanto retira suas

habilidades descritivas e aumenta os erros de predio.

O problema ento como reduzir a lista de variveis independentes

de forma a obter a melhor seleo de variveis independentes. Este

conjunto precisa ser suficientemente pequeno para que a manuteno

dos custos de atualizao do modelo sejam manuseveis e a anlise

facilitada, e ainda, deve ser grande o suficiente de forma que seja

possvel uma descrio, um controle e uma predio adequados.


55/104

55

Os procedimentos de procura para se encontrar o melhor conjunto

de variveis independentes devem ser empregados aps o investigador

ter estabelecido a forma funcional da relao de regresso, ou seja, se

as variveis dadas esto na forma l inear, quadrtica, etc; se as

variveis independentes so primeiramente transformadas, como por

exemplo por transformao logartmica; e se algum termo de interao

foi includo. Neste ponto, os procedimentos de procura so empregados

para reduzir o nmero de variveis independentes.

Existem muitos procedimentos de seleo, mas nenhum deles pode,

comprovadamente, produzir o melhor conjunto de variveis

independentes. No existe um conjunto timo de variveisindependentes, pois o processo de seleo das variveis possui

julgamentos subjetivos. Dentre os procedimentos, pode-se citar como

os mais comumente usados: todas as regresses possveis, backward,

forward e stepwise.

Todas as regresses possveis : este procedimento consiste em

ajustar todas as possveis equaes de regresso. Aps a obteno detodas as regresses, deve-se util izar os critrios para comparao dos

modelos ajustados. Alguns critrios que podem ser usados so o R 2

(coeficiente de explicao), MSE (quadrado mdio dos resduos) e C p

(estatstica de Mallows).

Para alguns conjuntos de variveis, os trs critrios podem levar

para o mesmo melhor conjunto de variveis independentes. Este no

o caso geral, pois diferentes critrios podem sugerir diferentesconjuntos de variveis independentes. Daniel e Wood (1971, p.86)

recomendam, no caso de um grande nmero de equaes alternativas,

o critrio do erro quadrado total para caracterizar a equao. A

principal desvantagem do procedimento de procura de todas as

regresses possveis a quantidade de esforo computacional

necessria. J que cada varivel independente potencial pode ser

includa ou excluda, gerando (2P - 1) regresses possveis quando

existem p variveis independentes potenciais (Elian, 1998, p.139;

Draper e Smith, 1981, p.296).


56/104

56

stepwise (passo a passo): , provavelmente, o mais amplamente

usado dos mtodos de pesquisa que no requerem a computao de

todas as regresses possveis. Ele foi desenvolvido para economizar

esforos computacionais, quando comparado com a abordagem de

todas as regresses possveis, enquanto atinge um conjunto de

variveis independentes razoavelmente bom. Essencialmente, este

mtodo de pesquisa computa uma seqncia de equaes de

regresso, adicionando ou deletando uma varivel independente em

cada passo. A rotina de regresso stepwise permite que uma varivel

independente, trazida para dentro do modelo em um estgio anterior,

seja removida subseqentemente se ela no ajudar na conjuno comvariveis adicionadas nos ltimos estgios. Esta rotina empregada,

conduz a um teste para rastrear alguma varivel independente que seja

altamente correlacionada com variveis independentes j includas no

modelo. A l imitao da procura da regresso stepwise que ela

presume a existncia de um nico conjunto timo de variveis

independentes e busca identific-lo. Como notado anteriormente, no

existe freqntemente um nico conjunto timo. Outra l imitao darotina de regresso stepwise , que ela algumas vezes surge com um

conjunto de variveis independentes razoavelmente fraco para

predies, quando as variveis independentes esto altamente

correlacionadas (Draper e Smith, 1981, p.307-312).

Seleo forward: este procedimento de procura uma verso

simplificada da regresso stepwise , omitindo o teste, se uma variveluma vez que tenha entrado no modelo deva ser retirada. Este

procedimento considera, inicialmente, um modelo simples usando a

varivel de maior coeficiente de correlao com a varivel dependente.

Uma varivel por vez incorporada at que no haja mais incluso, e

as variveis selecionadas definem o modelo.

Eliminao backward: este procedimento de procura oposto

seleo forward. Ele comea com o modelo contendo todas as variveis

independentes potenciais. O procedimento de eliminao backward


57/104

57

requer mais computaes que o mtodo de seleo forward, j que ela

comea com o maior modelo possvel. Entretanto, ela tem uma

vantagem de mostrar ao analista as implicaes do modelo com muitas

variveis.

3.9 CUIDADOS NO USO DO MODELO

claro que o rastreamento de variveis por um processo de seleo

computadorizado somente um passo na construo de um modelo de

regresso. Uma vez que o conjunto de variveis independentes temsido identificado o modelo resultante necessita ser estudado.

Um teste formal para a falta de ajuste pode ser feito e a plotagem

dos resduos deve ser empregada para identificar a natureza da falta

de ajuste, pontos discrepantes, e outras deficincias.

O processo de construo de um modelo de regresso requer

repetidas anlises sobre o conjunto de dados para checar se o modelo

ajusta-se bem os dados. Um modelo ruim pode levar a predieserrneas. Este fato pode ocorrer devido a m escolha das variveis

independentes. Uma forma de medir as predies tendenciosas

deixar alguns dos dados originais fora dos clculos para determinao

do modelo e us-los para realizar o ajustamento do poder predit ivo do

modelo (Neter e Wasserman, 1974, p.388).

3.10 - RESDUOS

Os resduos so definidos como as n diferenas ei = Yi - iY , i=1,...,n

onde Yi uma observao e iY o valor ajustado. Observe que os

resduos ei so as diferenas entre o que observado e o que

predito pela equao de regresso, isto , a quantidade que a equao

de regresso no tem capacidade para explicar. Assim pode-se pensar

ei como os erros observados se o modelo est correto, lembrando que


58/104

58

as suposies impostas para erros, citadas na seo 3.1.1 deste

captulo, so: a independncia, a mdia zero, a varincia constante e

que seguem a distribuio normal. Se o modelo ajustado est correto,

os resduos exibiro tendncias que tendem a confirmar as suposies

feitas, ou por fim, exibiro uma recusa das suposies (Elian, 1998,

p.41,91).

Para examinar os resduos e checar o modelo so util izadas as

ferramentas grficas que so fceis de construir e revelam claramente

a validao das suposies. Neste sentido, apresenta-se aqui a

metodologia de interpretao dos grficos dos resduos.

3.10.1 - Anlise de Resduos

Com a definio do modelo, deve-se realizar a anlise dos resduos,

a fim de procurar evidncias sobre eventuais violaes das suposies

de mdia zero, independncia, homocedasticidade e normalidade.

mdia zero: a verificao de que os erros tm valor esperado zero

pode ser investigado pelo grfico da plotagem dos resduos versus

valores preditos, como mostra a figura 3.3, devendo os pontos estarem

distribudos em torno do zero.

valores preditos

resduos

Figura 3.3:Exemplo de mdia zero.Dados fictcios.


59/104

59

independncia: a inexistncia de autocorrelao dos erros pode ser

investigada atravs do grfico dos resduos versus sequncia no tempo

(ou sequncia de coleta de dados), pode-se verificar a independncia

dos resduos quando eles se distribuem aleatoriamente, em torno de

zero, conforme figura 3.4.

sequncia de coleta

re

sduos

-

-

Figura 3.4:Exemplo de independncia dos erros pela

plotagem dos resduos.

Dados fictcios.

Uma outra forma de verificao da existncia de autocorrelao dos

erros pode ser feita pela estatstica de Durbin-Watson.

Util izando-se da razo,

=

=

=n

1i

2

i

n

2i

1ii

e

)e(e

d

e fazendo-se uso da distribuio (dos valores) tabelada por Durbin-

Watson, testa-se a hiptese nula de que os erros so no

correlacionados contra a hiptese alternativa de que os erros so

correlacionados. O valor de d est estreitamente relacionado com o

valor da correlao dos resduos r. Tem-se que:

d 2(1-r).

Se o valor de r prximo de zero, ento a estatstica de Durbin-

Watson d 2, que indica que os erros do modelo so no

correlacionados (Hil l et al., 1999).


60/104

60

Quando detectada a autocorrelao dos erros, deve-se considerar

a possibilidade que variveis independentes importantes foram

excludas do modelo de regresso ou, ainda, h indicao de que o

modelo ruim. Isto leva estimativas no confiveis ou tendenciosas.

A validade do teste de Durbin-Watson depende dos erros terem

mdia zero e varincia constante e ainda as variveis independentes

no serem aleatrias. Isto ocorre quando valores da varivel

dependente defasadas aparecem como variveis independentes

(Hoffmann e Vieira, 1983, p.251,252).

O problema de autocorrelao entre os resduos costuma acontecer

quando as observaes so realizadas ao longo do tempo, que no ocaso usual na amostragem de avaliao de imveis.

varincia constante: a suposio de varincia constante ou

homogeneidade de varincia verificada facilmente atravs dos

grficos dos resduos versus variveis independentes ou resduos

versus valores preditos. Quando o grfico produz forma de megafone,

implica que a varincia no constante, conforme mostra a figura 3.5,por outro lado, quando esto distribudos aleatoriamente em torno de

uma reta horizontal que passa pela origem, sem qualquer padro, h

indicao de varincia constante.

varivel independente

res

duos

Figura 3.5: Exemplo de varincia no-constante pela

plotagem dos resduos versus varivel independente.

Dados fictcios.


61/104

61

distribuio normal: o grfico construdo pelos resduos ordenados

versus os respectivos valores tericos da distribuio normal, mostra a

normalidade dos erros quando os pontos se distribuem em torno de

uma l inha, conforme mostra a f igura 3.6.

valor esperado sob normalidade

re

sduos

Figura 3.6:Exemplo de distribuio normal dos erros

pela plotage

dissertação.avaliação.imóveis

Documents