anÁlise estatÍstica multivariada: … · anÁlise estatÍstica multivariada: avaliando a...

15
ANÁLISE ESTATÍSTICA MULTIVARIADA: AVALIANDO A (IN)SOLVÊNCIA DE EMPRESAS COMERCIAIS UTILIZANDO REGRESSÃO LOGÍSTICA JOSE WILLER DO PRADO (UFLA ) [email protected] FABIOLA ADRIANE CARDOSO SANTOS (IFMG ) [email protected] LUIZ KENNEDY CRUZ MACHADO (UFLA ) [email protected] ANDRE SPURI GARCIA (UFLA ) [email protected] MARCO TULIO DINALI VIGLIONI (UFLA ) [email protected] Na atualidade, as empresas que oferecem crédito buscam cada vez mais o auxílio de ferramentas estatísticas modernas para combater a inadimplência em suas transações. A análise correta do crédito sempre se apresentou como fator chave para ass instituições que o fornecem. Nesse sentido, o objetivo do presente estudo é gerar um modelo de Credit Scoring (modelo estatístico de avaliação do crédito) empregando as técnicas de Análise Fatorial e Regressão Logística para avaliar a capacidade de classificação de insolvência e solvência para empresas comerciais. Por estas técnicas obtivemos os parâmetros a respeito do grau de eficiência do modelo gerado e aplicado às empresas comerciais. Observou-se, ainda, que o método de Análise Fatorial auxiliou a Regressão Logística na acurácia de acerto para a classificação. Pode-se concluir que após o uso da Análise Fatorial a Regressão Logística obteve precisão de acerto de 92% nas classificações de empresas comerciais, o que valida o modelo. Neste sentido, o modelo gerado é apropriado para a classificação do risco de crédito. Palavras-chave: Reconhecimento de padrões, análise de crédito, análise fatorial XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil João Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016.

Upload: lamkhanh

Post on 28-Aug-2018

234 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

ANÁLISE ESTATÍSTICA

MULTIVARIADA: AVALIANDO A

(IN)SOLVÊNCIA DE EMPRESAS

COMERCIAIS UTILIZANDO

REGRESSÃO LOGÍSTICA

JOSE WILLER DO PRADO (UFLA )

[email protected]

FABIOLA ADRIANE CARDOSO SANTOS (IFMG )

[email protected]

LUIZ KENNEDY CRUZ MACHADO (UFLA )

[email protected]

ANDRE SPURI GARCIA (UFLA )

[email protected]

MARCO TULIO DINALI VIGLIONI (UFLA )

[email protected]

Na atualidade, as empresas que oferecem crédito buscam cada vez

mais o auxílio de ferramentas estatísticas modernas para combater a

inadimplência em suas transações. A análise correta do crédito sempre

se apresentou como fator chave para ass instituições que o fornecem.

Nesse sentido, o objetivo do presente estudo é gerar um modelo de

Credit Scoring (modelo estatístico de avaliação do crédito)

empregando as técnicas de Análise Fatorial e Regressão Logística

para avaliar a capacidade de classificação de insolvência e solvência

para empresas comerciais. Por estas técnicas obtivemos os parâmetros

a respeito do grau de eficiência do modelo gerado e aplicado às

empresas comerciais. Observou-se, ainda, que o método de Análise

Fatorial auxiliou a Regressão Logística na acurácia de acerto para a

classificação. Pode-se concluir que após o uso da Análise Fatorial a

Regressão Logística obteve precisão de acerto de 92% nas

classificações de empresas comerciais, o que valida o modelo. Neste

sentido, o modelo gerado é apropriado para a classificação do risco de

crédito.

Palavras-chave: Reconhecimento de padrões, análise de crédito,

análise fatorial

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016.

Page 2: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

2

1. Introdução

Na atualidade os mercados se tornaram mais expostos a uma instabilidade mundial que surge

independente da empresa participar ou não de determinado nicho de mercado. O medo de que

uma nova bolha não sistêmica cause uma crise global sistêmica é sempre iminente e

acompanhada por todos os agentes. Neste sentido, as empresas que oferecem crédito buscam

cada vez mais o auxílio de ferramentas para combater a inadimplência em suas transações. O

conhecimento destas pode ajudar a modelar a probabilidade de insolvência das empresas.

Segundo Boratti (2002) e Prado et al. (2016), os principais estudos envolvendo a análise de

crédito tiveram início com o trabalho de Edward Altman em 1968, quando o autor utilizou

instrumentos estatísticos mais robustos, como é o caso da análise discriminante múltipla, para

avaliar a insolvência empresarial. No Brasil, segundo estes autores, o pioneiro no uso da

análise discriminante foi Stephen Charles Kanitz em 1978 com o livro “Como prever

falências”.

A análise correta do crédito sempre se apresentou como fator chave para as instituições que o

fornecem. A importância desta para o sistema financeiro é facilmente observada nos relatórios

emitidos pelo Banco Central do Brasil (BACEN, 2016). Segundo o BACEN (2016), o volume

total dos empréstimos no sistema financeiro atingiu R$3.026 bilhões em fevereiro de 2016,

um aumento de 11,0% em doze meses. Por sua vez, a relação crédito/PIB saltou de 55,5% em

fevereiro de 2015 para 58,6% para o mesmo período de 2016.

O crédito para o setor privado totalizou R$2.812 bilhões em fevereiro de 2016, aumentando

2,1 % no trimestre. A taxa de inadimplência das modalidades que compõem o crédito

referencial (taxa média de juros nos atrasos superiores há 90 dias) atingiu 2,8% em fevereiro,

com estabilidade no trimestre e recuo de 0,1 p.p. em doze meses (BACEN, 2016).

Neste contexto, algumas das ferramentas utilizadas pelos analistas de crédito para tentar

diminuir a taxa de inadimplência nas transações estão na análise dos indicadores econômico-

financeiros das empresas, por meio de técnicas multivariadas tais como a Análise Fatorial e a

Regressão Logística. Estas têm por finalidade descrever a relação entre diversas variáveis

(observações) independentes, possibilitando a análise simultânea de medidas múltiplas para

cada indivíduo, além de ser adequada para a análise dos indicadores econômico-financeiros

das empresas.

Diante do exposto, o objetivo do presente estudo é gerar um modelo de Credit Scoring

(modelo estatístico de avaliação do crédito) empregando as técnicas de Análise Fatorial e

Regressão Logística para avaliar a capacidade de classificação de insolvência e solvência para

empresas comerciais.

Além desta introdução, o trabalho conta com uma segunda seção que irá tratar do referencial

teórico sobre o tema, com uma breve exposição sobre os indicadores econômico-financeiros.

A terceira seção trabalha os critérios metodológicos e apresenta a Regressão Logística e a

Análise Fatorial. A quarta seção é composta pela discussão dos resultados. Por fim, a última

seção aborda as considerações finais, destacando os principais achados.

2. Referencial teórico

Uma vez que o tema é relevante para a economia como um todo, vários autores fizeram

considerações sobre o crédito. Uma das definições mais encontradas em trabalhos sobre

crédito é de autoria de Schrickel (2000, p. 25), que o define como:

Todo ato de vontade ou disposição de alguém de destacar ou ceder,

temporariamente, parte de seu patrimônio a um terceiro, com a expectativa de que

esta parcela volte a sua posse integralmente, depois de decorrido o tempo estipulado.

Page 3: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

3

Essa parte do patrimônio pode ser materializada por dinheiro (empréstimo

monetário) ou bens (empréstimo para uso, ou venda com pagamento parcelado, ou a

prazo).

Neste contexto, as técnicas estatísticas multivariadas têm sido utilizadas na concessão de

crédito e consideradas como ferramentas úteis no reconhecimento da inadimplência de

crédito. Silva (2008) salienta que na criação de um modelo de previsão de risco de crédito é

importante saber identificar qual dentre as técnicas estatísticas será a mais eficiente para a

modelagem dos dados, de maneira a conseguir uma melhor previsão para a inadimplência.

Santos (2012) elucida que a abordagem estatística, baseada na pontuação, se originou como

um dos métodos mais importantes de suporte à tomada de decisão para grandes volumes de

propostas de crédito, tanto para pessoas físicas como jurídicas.

Silva (2008) salienta que devido à sua contribuição para o processo de análise, o uso de

métodos quantitativos tem sido muito divulgado, levando muitos bancos a uma corrida em

busca de técnicas para avaliação do risco de crédito dos clientes. Entretanto, esses métodos de

previsão não podem ser interpretados como receitas milagrosas capazes de resolver todos os

problemas advindos do risco de crédito contido nas operações. Neste sentido, os modelos

devem ser interpretados como um instrumento complementar para o analista (SILVA, 2008).

2.1 Indicadores econômico-financeiros

A análise dos indicadores econômico-financeiros é considerada, por muitos autores, de grande

valia quando se trata de obter informações advindas do Balanço Patrimonial e da

Demonstração de Resultados da empresa. Segundo Assaf Neto (2005), para se estabelecer

uma melhor metodologia de avaliação e compreender melhor o significado dos indicadores

econômico-financeiros é necessário dividir os indicadores em grupos homogêneos de análises.

Atualmente vários são os indicadores econômico-financeiros apresentados na literatura. Estes,

no entanto, são agrupados em categorias por suas afinidades. As categorias mais vistas em

livros de finanças são: Indicadores de Estrutura de Capitais; Indicadores de Liquidez;

Indicadores de Atividade; Indicadores de Análises de Ações; Indicadores de Endividamento e

Estrutura; Indicadores de Rentabilidade e Indicadores de Valor de Mercado.

Na prática, o especialista procura fazer com que cada um dos indicadores apresente o maior

número de informações possíveis sobre a empresa. Neste sentido, a busca por um pequeno

grupo de indicadores que consiga explicar de maneira objetiva o comportamento financeiro de

uma empresa é considerado o ideal para a análise (SILVA, 2008).

3. Metodologia

O presente estudo se constitui em uma pesquisa predominantemente explicativa. A pesquisa

explicativa busca esclarecer quais fatores contribuem para a ocorrência de determinado

fenômeno (VERGARA, 2008). Quanto à forma de abordagem, esta pesquisa é qualificada

Page 4: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

4

como quantitativa. Segundo Martins e Theóphilo (2009, p.107), nesse tipo de pesquisa os

dados são quantificados e a validação da prova científica utiliza testes, graus de significância

e sistematizações.

O banco de dados foi selecionado em corte-transversal (crosssection) e os dados são

secundários e retirados da pesquisa de Carvalho (2004). A amostra contém cinquenta

empresas solventes e cinquenta empresas insolventes. Estes últimos dados foram coletados

um ano antes da ocorrência de insolvência. Ademais, as insolventes foram classificadas como

grupo „1‟ e as solventes como grupo „0‟. Das 100 empresas comerciais, 33 são Açougues, 17

Distribuidora de Bebidas, 13 Hortifrutigranjeiros, 25 Padarias e 12 Peixarias. O recurso

computacional utilizado para análise dos modelos estatísticos é o Statistic Package for the

Social Science® (SPSS).

3.1 Indicadores econômico-financeiros

Já a escolha dos indicadores econômico-financeiros utilizados neste artigo deve-se ao fato de

Sanvicente e Minardi (1998), Silva (2004) e Prado (2016) os terem enfatizado como

indicadores significativos para a previsão de insolvência de empresas. Neste sentido, a Tabela

1 demonstra os indicadores econômico-financeiros utilizados como variáveis (independente). Tabela 1 – Indicadores econômico-financeiros utilizados

Fonte: Adaptado de Sanvicente e Minardi (1998), Carvalho (2004), Silva (2004) e Prado (2016)

Definidas as variáveis utilizadas para estimar o modelo de Regressão Logística, o primeiro

passo é efetuar a substituição dos termos insolventes e solventes por números. Com este

Page 5: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

5

artifício, na Regressão Logística para “empresas insolventes” atribui-se o número “1” e no

lugar de “empresas solventes” atribui-se o valor “0”. Faz-se necessário mencionar que na

Regressão Logística a variável dependente (variável resposta) é do tipo dicotômica e assume

apenas dois valores possíveis “0” ou “1”.

2.2 Regressão logística

A regressão logística (logistic regression ou logit analysis), segundo Guimarães e Chaves

Neto (2002), consiste fundamentalmente na busca de um modelo que permita relacionar uma

variável y, chamada “variável resposta” (variável dependente), aos “fatores” (variáveis

independentes) X1i, X2i, ..., Xni que supõe-se influenciar as ocorrências de um evento. A

variável resposta, no entanto, deve ser do tipo dicotômica, assumindo apenas dois valores

possíveis (0 ou 1). Neste caso, existe interesse apenas na ocorrência, ou não, do evento em

questão.

O modelo de regressão logística pode ser representado por uma função da seguinte forma:

(1)

Onde:

P (Y=1) = é a probabilidade relativa que um determinado evento ocorra;

e ≅ 2,718;

(x) = B0 + B1X1i + B2X2i+ ⋅⋅⋅ + BnXni ;

Sendo que:

B0 é uma constante e B1, B2 ... Bn são os coeficientes estimados a partir dos dados de

X1i, X2i, ..., Xni (variáveis independentes).

Hosmer Junior e Lemeshow (2004) salientam que os coeficientes B0, B1, ..., Bn são estimados

a partir do conjunto de dados em questão pelo método da máxima verossimilhança, que

Page 6: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

6

encontra uma combinação de coeficientes que maximiza a probabilidade da amostra ter sido

observada. Considerando certa combinação de coeficientes B0, B1, ..., Bn e variando os

valores de X observa-se que a curva logística tem comportamento probabilístico em forma de

S (FIGURA 1).

Figura 1 – Gráfico da Função Sigmóide

Fonte: Guimarães e Chaves Neto (2002, p. 8)

Para estimar o modelo de regressão logística esta função sigmóide (curva logística) é ajustada

aos dados reais. Esse formato dado á regressão logística possui um alto grau de generalidade,

aliada a aspectos muito desejáveis, como:

1º - Quando (x) → + ∞, então P (Y = 1)→ 1

2º - Quando (x) → − ∞, então P (Y = 1)→ 0

Assim, tanto se pode estimar diretamente a probabilidade de ocorrência de um evento como se

pode estimar a probabilidade de não ocorrência do mesmo por diferença:

P (Y = 0) = 1 – P (Y = 1) (2)

Page 7: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

7

Entretanto, segundo Corrar et al. (2007) o primeiro passo para dar início a regressão logística

é converter a probabilidade associada a cada observação em razão de chance (odds ratio), ou

seja, a possibilidade de sucesso comparada a de fracasso.

Esta relação pode ser expressa da seguinte forma:

(3)

Ao utilizar-se a regressão logística, para facilitar a interpretação dos resultados, a principal

suposição é a de que o logaritmo da razão entre as probabilidades de ocorrência e não

ocorrência do evento seja linear:

(4)

E, por conseguinte,

(5)

Por isso, segundo Garson (2000), ao se fazer a interpretação dos coeficientes da regressão

logística opta-se por interpretar o eB e não diretamente o B.

2.3 Análise fatorial

A Análise Fatorial (AF), segundo Corrar et al. (2007), pressupõem que altas correlações entre

as variáveis geram o agrupamento que configura os fatores. É preciso levar em consideração

que a simples existência do fator explica a correlação que existe em um determinado grupo de

variáveis. A Análise Fatorial, quando desvenda um fator, torna estruturas complexas de

relacionamento em estruturas mais simples de serem compreendidas (FIGURA 2).

Figura 2 – Variáveis latentes e a formação de fatores

Page 8: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

8

Fonte: Corrar et al. (2007, p. 75)

Spearman (1904) sugeriu a existência de uma variável “invisível” que explica parcialmente as

variações em cada uma delas. Uma variável padronizada (de média zero e variância um) – Xi

– é explicada por uma constante – αi – multiplicada por um fator (de média zero e variância

um) – F. Todavia é preciso considerar um erro – ei – devido ao fato de que uma variável

possui características que não são comuns a nenhuma das outras variáveis no estudo, por isso

o fator não consegue explicá-la (CORRAR et al., 2007).

Esta pode ser visualizada assim:

Xi = αi F + ei (6)

Onde:

Xi = variável i analisada

αi = é uma constante

F = é o fator

ei = é o erro

Assim, o fator representa a parcela da variação total dos dados que pode ser explicada de

forma conjunta para todas as variáveis que o compõem.

As variações em uma variável podem ser explicadas pelo seguinte modelo:

(7)

Page 9: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

9

Onde Xi são as variáveis padronizadas, αi são as cargas fatoriais, Fj são os fatores comuns e ei

é o erro que representa a parcela da variável i que não pode ser explicada por um fator nem

por outra variável do conjunto analisado.

Por sua vez, os fatores poderiam ser estimados pela combinação linear das variáveis

originais:

(8)

Onde Fj são os fatores comuns não relacionados, ωji são os coeficientes dos escores fatoriais e

Xi são as variáveis originais.

Assim, é possível determinar o que realmente é importante ser medido e acompanhado a partir

do ponto que se conhece o grau de relacionamento entre as variáveis. Segundo Hair et al.

(2009), as cargas fatoriais acima de 0,5 são consideradas estatisticamente significativas.

4. Resultados e discussão

Neste tópico são demonstrados os resultados obtidos a partir o modelo matemático gerado e

como estes se comportam na classificação dos casos sugeridos (Insolvente e Solvente).

4.1 Regressão logística

Para gerar o modelo de Regressão Logística optou-se pelo uso de todos os oito indicadores no

modelo. Entretanto, avaliando o modelo como um todo pelos testes Wald, Cox & Snell,

Nagelkerke e Hosmer & Lemeshow, observou-se que o modelo não apresentou uma

estatística robusta. Neste sentido, utilizou-se uma alternativa para agrupar variáveis a partir do

método de componentes principais (Análise Fatorial).

4.1.1 Análise fatorial para a regressão logística

Combinados os indicadores e as alterações nos números de fatores, considerando os testes

KMO, Teste de Barlett, MSA e Análise das Comunalidades, conclui-se que o melhor modelo

será gerado pelo agrupamento dos indicadores X3, X4, X5, X6, X7 e X8 em três fatores, os

dados gerados deste processo serão apresentados a seguir.

A Tabela 2 apresenta os resultados que validam a utilização da Análise Fatorial. O teste de

KMO (Kaiser-Meyer-Olkin) representa o grau de explicação das variáveis a partir dos fatores

encontrados, apresentando 0,672 - valor razoável na faixa de 0,6 a 0,7. O teste de Esfericidade

de Bartlett afirma que quanto mais próximo de zero for o nível de significância, maior será a

adequação da análise fatorial ao conjunto de dados (Sig. < 0,05).

Page 10: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

10

Tabela 2 – Teste de KMO e Bartlett

Fonte: Dados da Pesquisa (2012)

A Tabela 3 apresenta a matriz de correlações anti-imagem que oferece sinais acerca da

necessidade de eliminação de alguma variável no modelo. A partir da análise da diagonal

principal da matriz identifica-se o índice de Medida de Adequação de Amostra (Measure of

Sampling Adequacy – MSA). Segundo Hair et al. (2009) valores nesta diagonal inferiores a

0,05, são considerados insignificantes para a análise e podem ser excluídos, o que não ocorre

nesta análise. Tabela 3 – Matriz Anti-imagem – Correlação

a. Medidas de adequação de amostragem (MSA)

Fonte: Dados da Pesquisa (2012)

Cabe observar que a tabela de comunalidades (Tabela 4) demonstra valores superiores a 0,9

indicando que cada variável poderia representar um único fator devido ao seu alto poder

explicativo em relação a todas as outras variáveis. Hair et al. (2009), afirmam que as

comunalidades representam a quantia de variância explicada pela solução fatorial para cada

variável. Tabela 4 – Comunalidades

Fonte: Dados da Pesquisa (2012)

A Tabela 5 demonstra o grau de explicação atingido pelos fatores gerados pela análise

fatorial. Observa-se que os três fatores calculadas pela análise fatorial explicam 92% da

variância total dos dados originais. Para Corrar et al. (2007) os valores superiores a 90% são

considerados ótimos. Tabela 5 – Variação total explicada

Page 11: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

11

Método de extração: análise do componente principal

Fonte: Dados da Pesquisa (2012)

Adiante, faz-se necessário a interpretação de quais variáveis irão compor cada um dos fatores

específicos. Para isso será usada a Matriz de Componente Rotativa (rotação ortogonal), que

segundo Corrar et al. (2007) é o tipo de rotação mais utilizado.

Na Tabela 6 pode-se verificar quais variáveis irão compor cada fator, ou seja, quando a

correlação da variável-fator é próxima de +1 ou -1, indicando uma associação positiva ou

negativa entre a variável e o fator, enquanto próxima de 0 indica uma falta de associação. Tabela 6 – Matriz de componente rotativa

Método de rotação: Varimax com normalização de Kaiser

Fonte: Dados da Pesquisa (2012)

Conclui-se com a Tabela 6 que:

O Fator 1 é composto pelos indicadores X4 (Relação entre o Lucro Operacional

acrescido das Despesas Financeiras e o Ativo Total deduzido dos Investimentos) e por

X5 (Margem de Lucro Operacional), este será nomeado de IR – Indicador de

Rentabilidade, considerando que estas duas variáveis compõem Indicadores de

Rentabilidade;

O Fator 2 é composto pelos indicadores X6 (Patrimônio Líquido sobre

Endividamento) e por X8 (Saldo de Tesouraria), este fator recebeu o nome de FD –

Fator Disponíveis. Considera-se, que as variáveis que o compõe recebem valores

maiores contribuem para que a empresa seja solvente e quando recebem valores

menores contribuem para o aumento dos exigíveis de curto prazo da empresa;

O Fator 3 é composto pelos indicadores X3 (Necessidade de Capital de Giro sobre

Vendas) e por X7 (Necessidade de Capital de Giro), que aqui será tratado por IL –

Indicador de Liquidez, em razão de suas variáveis pertencerem aos Indicadores de

Liquidez.

Page 12: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

12

A partir do cálculo dos escores da Análise Fatorial inicia-se a Regressão Logística. Observa-

se que para utilizar os escores em outros procedimentos estatísticos, como é o caso da

Regressão Logística, estes coeficientes podem ser obtidos por três métodos diferentes.

Optamos apenas por utilizar o método de mínimos quadrados ordinários.

4.1.2 Regressão logística a partir dos fatores gerados pela análise fatorial

De posse do cálculo dos três fatores o modelo de Regressão Logística apresentou estatísticas

satisfatórias para o teste de Wald, que atingiu significância de 100% para a constante incluída

no modelo. No caso dos testes considerados pseudos-R², o Cox & Snell apresentou 51% de

explicação das variáveis independentes nas variações dentro do log da razão de chance,

enquanto o Nagelkerke afirma que o modelo é capaz de explicar aproximadamente 69% das

variações atribuídas a variável dependente.

No teste de Hosmer e Lemeshow os resultados são desfavoráveis, considerando que a

significância apresentada é inferior a 0,05 e, neste caso, quanto maior for à significância

melhor será o teste. Entretanto, existem algumas limitações em relação ao teste que podem

estar relacionadas ao tamanho da amostra (CORRAR et al., 2007). Contudo, como existem

outros indicadores de precisão favoráveis, decide-se dar continuidade as estatísticas.

A Tabela 7 demonstra que o modelo registra um percentual de acerto de 92% que é

considerado ótimo pelo fato de estar numa faixa acima de 90%. Estatisticamente, a utilização

dos fatores para o cálculo da Regressão Logística se apresenta de forma adequada para

classificar as empresas candidatas a crédito quanto a sua insolvência ou solvência. Tabela 7 – Tabela de classificação

a final

a. O valor de corte é 0,5

Fonte: Dados da Pesquisa (2012)

A Tabela 8 demonstra as variáveis que compõem o modelo de Regressão Logística. A

estatística gerada a partir dos Fatores (IR, FD e IL) apresenta aspectos positivos ao tentar

estimar a probabilidade a partir de cada coeficiente em particular, sendo eles: Estatística Wald

– apresenta um coeficiente Wald > 0 para cada fator, exercendo efeito discriminatório sobre a

probabilidade de a empresa ser insolvente ou solvente, Limite Superior e Inferior – os

coeficientes dos fatores independentes (B) elevados a constante e dentro do intervalo de

confiança. No exemplo do fator ID, o valor -3,731 elevado a constante e encontra-se na

coluna Exp(B) (0,024). Observa-se que este está no limite estabelecido pelas colunas Inferior

e Superior (0,004 a 0,144 respectivamente) assim como todos os outros fatores utilizados. E

Sig. – A significância (Sig.) é considerada boa conforme a Tabela 8, pois está abaixo de 0,05. Tabela 8 – Variáveis na equação

Page 13: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

13

a. Variáveis inseridas na etapa 1: IR, FD, IL

Fonte: Dados da Pesquisa (2012)

Realizados os procedimentos obteve-se um modelo de Regressão Logística capaz de

classificar as empresas em insolvente e solvente. Utilizando-se dos coeficientes da Tabela 8

na coluna B pode-se esboçar a equação da Regressão Logística, ou seja, o Credit Scoring

gerado:

(9)

Pela equação observa-se que P (Y=1) apresenta saída do tipo dicotômica, assumindo apenas

dois valores possíveis “0” ou “1”. Assim, quanto mais próximo de 1 for o resultado, a

empresa será considerada insolvente. Quanto o resultado estiver próximo de 0 a empresa será

tratada como solvente.

5. Considerações finais

Em vista do exposto, conclui-se que o uso da Análise Fatorial contribui para desenvolver uma

estatística robusta para a Regressão Logística, que obteve 92% de precisão. Neste sentido, o

modelo gerado é apropriado para a classificação do risco de crédito.

Contudo, outro dado importante que pode ser observado na Tabela 7 situa-se no tipo de erro

ocorrido no modelo matemático. A Regressão Logística apresenta 7% de chances de incorrer

em erro do tipo I (classificar empresas insolventes como solventes e o empréstimo acarretar

em perdas financeiras) e 1% de chances de incorrer em erro tipo II (classificar empresas

solventes como insolventes e não conceder o crédito as mesmas, deixando assim de auferir

lucros). É importante mencionar que o erro tipo I para uma empresa que oferece crédito é o

pior tipo de erro, considerando que este resultará em perdas financeiras para a mesma.

O modelo matemático aqui apresentado tem o intuito de auxiliar o processo decisório do

gerente responsável pelo crédito e não substitui a sua opinião no ato de concessão de crédito.

Acredita-se que o profissional que conta com este tipo de recurso está em vantagem

competitiva sobre aqueles que não o utilizam no seu processo decisório.

Entre as limitações do estudo existe a ausência de uma amostra específica de apenas um setor

do comercio, o que poderia acarretar em melhor acurácia de acerto. Ademais, existe a

limitação por se ter trabalhado somente com dados de um ano antes da insolvência, sendo que

dados de 2 ou 3 anos antes da insolvência também poderiam apresentar resultados relevantes.

Page 14: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

14

Como sugestão para estudos futuros recomenda-se o uso de dados específicos por setor do

comércio, períodos diferentes para seleção dos dados de empresas insolventes e também a

utilização de outras metodologias de modelagem para avaliação da solvência empresarial no

setor do comércio.

Referências

ASSAF NETO, A. Finanças Corporativas e Valor. 2. ed. São Paulo: Atlas, 2005.

BANCO CENTRAL DO BRASIL – BACEN. Relatório de Inflação. Brasília-DF: [s.n.], v.

17, nº 1, 2016 p. 1-151.

BORATTI, I. J. Tomada de decisão em relação ao crédito em uma instituição financeira:

um estudo de caso do banco do brasil. 2002. 152p. Dissertação (Mestrado em Administração

Pública), Fundação Getúlio Vargas, Rio de Janeiro, 2002.

CARVALHO, A. T. Modelo de previsão de insolvência para empresas comerciais. 2004,

129p. Dissertação (Mestrado em Engenharia de Produção) - Universidade Federal de Santa

Catarina, Florianópolis, 2004.

CORRAR, L. J. et al. Analise Multivariada: para os cursos de Administração, Ciências

Contábeis e Economia. São Paulo: Atlas, 2007.

GARSON, D. G. PA 765 statnotes: an online textbook. Disponível em:

<http//wwz.chass.ncsu.edu/garson/pa765/logistic.htm> Acesso em: 10 mar. 2016.

GUIMARÃES, I. A.; CHAVES NETO, A. Reconhecimento de Padrões: Metodologias

Estatísticas em Crédito ao Consumidor. RAE, v. 1, n. 2, 2002.

HAIR, J. F. et al. Análise multivariada de dados. 6. ed. Porto Alegre: Bookman, 2009. 688

p.

HOSMER JUNIOR, D. W.; LEMESHOW, S. Applied logistic regression. New York: J.

Wiley, 2004. 383 p.

MARTINS, G. A.; THEÓPHILO, C. R. Metodologia da investigação científica para

ciências sociais aplicadas. São Paulo: Atlas, 2009.

PRADO, J. W. et al. Multivariate analysis of credit risk and bankruptcy research data: a

bibliometric study involving different knowledge fields (1968-2014). Scientometrics,

Amsterdam, v. 106, n. 3, p. 1007-1029, 2016.

PRADO, J. W. Risco de crédito: uma abordagem utilizando análise discriminante, regressão

logística e redes neurais artificiais. 228 p. Dissertação (Mestrado em Administração) -

Universidade Federal de Lavras, Lavras, 2016.

SANTOS, J. O. Análise de crédito: empresas, pessoas físicas, agronegócio e pecuária. 5. ed.

Page 15: ANÁLISE ESTATÍSTICA MULTIVARIADA: … · anÁlise estatÍstica multivariada: avaliando a (in)solvÊncia de empresas comerciais utilizando regressÃo logÍstica jose willer do prado

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

15

São Paulo: Atlas, 2012. 352 p.

SANVICENTE, A. Z.; MINARDI, A. M. A. F. Identificação de indicadores contábeis

significativos para previsão de concordata de empresas. Instituto Brasileiro de Mercado de

Capitais, Working Paper, Out. 1998.

SCHRICKEL, W. K. Análise de crédito: concessão e gerencia de empréstimos. 5. ed. São

Paulo: Atlas, 2000. 353 p.

SILVA, J. P. Análise Financeira de Empresas. 6. ed. São Paulo: Atlas, 2004.

SILVA, J. P. Gestão e Análise de Risco de Crédito. 6. ed. São Paulo: Atlas, 2008. 421 p.

SPEARMAN, C. General Intelligence Objectivelly Determined and Measured. American

Journal of Psychology, v. 15, p. 201-293, 1904.

VERGARA, S. C. Projetos e relatórios de pesquisa em administração. 9. ed. São Paulo:

Atlas, 2008. 94 p.