universidade federal fluminense escola de …app.uff.br/riuff/bitstream/1/2816/1/projeto final de...
TRANSCRIPT
UNIVERSIDADE FEDERAL FLUMINENSE
ESCOLA DE ENGENHARIA
GRADUAÇÃO EM ENGENHARIA DE PRODUÇÃO
DANILO HENRIQUE DE OLIVEIRA RIBEIRO
ANÁLISE ESTATÍSTICA DE CONTAS TÉCNICAS EM UMA EMPRESA DE
RESSEGUROS ATRAVÉS DO SOFTWARE R
NITERÓI-RJ
2016
3
DANILO HENRIQUE DE OLIVEIRA RIBEIRO
ANÁLISE ESTATÍSTICA DE CONTAS TÉCNICAS EM UMA EMPRESA DE
RESSEGUROS ATRAVÉS DO SOFTWARE R
Projeto final apresentado ao curso de
Graduação em Engenharia de Produção da
Universidade Federal Fluminense como
requisito parcial para a conclusão de curso.
Orientador: Prof. Dr. Valdecy Pereira
NITERÓI-RJ
2016
4
DANILO HENRIQUE DE OLIVEIRA RIBEIRO
ANÁLISE ESTATÍSTICA DE CONTAS TÉCNICAS EM UMA EMPRESA DE
RESSEGUROS ATRAVÉS DO SOFTWARE R
Projeto final apresentado ao curso de Graduação em Engenharia de Produção da
Universidade Federal Fluminense como requisito parcial para a conclusão de curso.
Aprovada em:
BANCA EXAMINADORA
_____________________________________________
Prof. Dr. Valdecy Pereira - Orientador
Universidade Federal Fluminense
____________________________________________
Prof. Dr. Carlos Francisco Simões Gomes
Universidade Federal Fluminense
____________________________________________
Prof. Dr. Helder Gomes Costa
Universidade Federal Fluminense
________
____________________________________________
Prof. Msc. Maria Helena Mello
Universidade Federal Fluminense
5
AGRADECIMENTOS
Agradeço aos meus pais por me incentivarem no caminho dos estudos e
seguir bons costumes de ética, educação e convivência.
Agradeço aos meus amigos por todo apoio nessa jornada e também pela
diversão durante todos os anos junto comigo.
Agradeço ao meu orientador Valdecy por me guiar, seja durante as aulas
quanto também no estudo aqui apresentado.
6
RESUMO
O presente trabalho analisa, através de um estudo de caso, os contratos proporcionais
em uma empresa de resseguro de forma a descobrir quais características são impactantes
para o melhor resultado da gestão do contrato. Com a coleta dos dados, foi elaborada
uma análise estatística pelo modelo de regressão linear múltipla afim de encontrar quais
variáveis possuem maior relação com o resultado final do contrato com o auxílio do
software estatísticos R.
Após a análise do modelo foram encontradas quais características estariam impactando
o balanço final de cada contrato. Além disso, foi descoberto qual o maior enfoque que a
empresa terá no gerenciamento do setor de contas técnicas.
Apesar do estudo apresentar bons resultados, foi delimitado a coleta para os contratos
com vigência do ano de 2015 e feita em um período fixo no ano. Visto o resultado e o
quanto pode ser benéfico a empresa esse estudo, vale ressaltar a abrangência desse
estudo para outros anos de vigência e também a constante coleta de dados para a
construção de um modelo mais completo da situação.
Palavras-chave: regressão linear múltipla, análise estatística, contratos proporcionais,
resseguro
7
ABSTRACT
This study analyzes, through a case study, the proportional reinsurance contracts in a
company in order to find out which features are affecting for the best result of contract
management. With data collection, statistical analysis by multiple linear regression
model was developed in order to find which variables have the greatest relationship
with the end result of the contract with the help of statistical software R.
After the analysis of the model were found which characteristics would be impacting
the bottom line of each contract. Moreover, it was discovered what the increased focus
that the company should have the management of technical accounts sector.
Although the study show good results, was delimited collection for contracts with 2015
year of force and made in a fixed period in the year. Since the result and how much can
be beneficial to the company this study, it is worth mentioning the scope of this study to
other years of operation and also the constant collection of data to build a more
complete model of the situation.
Key-words: multiple linear regression, statistical analysis, proportional treaties,
reinsurance
8
LISTA DE FIGURAS
Figura 2.1 – Variância, p.22
Figura 3.1 – Variável Start_Date, p.28
Figura 3.2 – Variável Broker, p.29
Figura 3.3 – Variável ER_QP, p.29
Figura 3.4 – Variável EPI, p.30
Figura 3.5 – Variável ln (EPI) , p.30
Figura 3.6 – Variável Participacao, p.31
Figura 3.7 – Variável Perc_QP, p.31
Figura 3.8 – Variável Capacidade_Max, p.32
Figura 3.9 – Variável ln (Capacidade_Max), p.32
Figura 3.10 – Variável COB, p.33
Figura 3.11 – Variável Moedas, p.33
Figura 3.12 – Variável Premio, p.34
Figura 3.13 – Variável ln (Premio+1), p.34
Figura 3.14 – Variável Contas_Atrasadas, p.35
Figura 3.15 – Variável Accounts_Lancadas, p.35
Figura 3.16 – Variável Analista, p.36
Figura 3.17 – Variável Tempo_Medio, p.36
Figura 3.18 – Correlações, p.37
Figura 3.19 – Significância das correlações, p.38
Figura 4.1 – Distribuição dos resíduos, p.40
Figura 4.2 – QQ Plot, p.41
Figura 4.3 – Resíduos Studentizados vs. Valores Previstos, p.41
Figura 4.4 – EPI vs. Valores Previstos, p.43
10
LISTA DE TABELAS
Tabela 3.1 – Definições das variáveis, p.26
Tabela 4.1 – Estatísticas descritivas do modelo, p.39
Tabela 4.2 – VIF, p.42
Tabela 4.3 – GVLMA, p.42
Tabela 4.4 – Modelo Leaps, p.43
Tabela 4.5 – Modelo Leaps Refinado, p.44
Tabela 4.6 – GVLMA, p.45
Tabela 4.7 – Interpretação, p.46
11
LISTA DE ABREVIATURAS, SIGLAS E SÍMBOLOS
EPI – Estimate Premium Income
FUNENSEG – Escola Nacional de Seguros
GVLMA - Global Validation of Linear Model Assumptions
SSE – Error Sum of Squares
SSR – Regression Sum of Squares
SST – Total Sum of Squares
SUSEP – Superintendência de seguros privados
VIF – Variance Inflator Factor
12
SUMÁRIO
1.INTRODUÇÃO..........................................................................................................12
1.1O RESSEGURO.........................................................................................................12
1.2 O PROBLEMA E A HIPÓTESE DA PESQUISA...................................................14
1.3 OBJETIVOS DA PESQUISA...................................................................................14
1.4 DELIMITAÇÃO DA PESQUISA.............................................................................14
1.5 ESTRUTURA DO TRABALHO..............................................................................15
2. REFERENCIAL TEÓRICO....................................................................................16
2.1 O RESSEGURO........................................................................................................16
2.1 CONTRATOS DE RESSEGURO.............................................................................16
2.1.1 CONTRATOS PROPORCIONAIS DE RESSEGURO.........................................17
2.2 REGRESSÃO LINEAR MÚLTIPLA.......................................................................18
2.3 PRESSUPOSTOS DA REGRESSÃO LINEAR MÚLTIPLA –
COLINEARIDADE,........................................................................................................23
2.4 VALIDAÇÃO DOS RESÍDUOS..............................................................................24
2.5 PODER DE PREDIÇÃO DO MODELO E SELEÇÃO DE VARIÁVEIS
INDEPENDENTES.........................................................................................................25
3. METODOLOGIA......................................................................................................26
3.1 POPULAÇÃO E AMOSTRA...................................................................................26
3.2 COLETA DE DADOS..............................................................................................26
3.3 TRATAMENTO E ANÁLISE DE DADOS.............................................................26
3.4 DELIMITAÇÕES DO ESTUDO..............................................................................37
4. REGRESSÃO LINEAR MÚLTIPLA....................................................................38
4.1 ANÁLISE ESTATÍSTICA DOS DADOS................................................................38
4.2 SELEÇÃO DE UM MODELO PARCIMONIOSO..................................................42
4.3 INTERPRETAÇÃO DAS VARIÁVEIS DO MODELO FINAL.............................44
5. CONCLUSÃO............................................................................................................47
6. REFERÊNCIAS BIBLIOGRÁFICAS....................................................................49
13
ANEXOS........................................................................................................................50
14
1. INTRODUÇÃO
No presente capítulo é abordado o contexto da pesquisa, o objetivo geral e os
objetivos específicos, bem como a delimitação da pesquisa.
Na Seção 1.1 são apresentadas as características principais do seguro e do
resseguro, além de situar a empresa IRB Brasil Re e a gerência de contas técnicas nesse
ramo.
Na Seção 1.2 é apresentada a pergunta e a hipótese levantada que fundamentam
a pesquisa desenvolvida pelo trabalho.
Na Seção 1.3 são apresentados o objetivo geral da pesquisa e os objetivos
específicos.
Na Seção 1.4 é apresentada a delimitação da pesquisa e finalmente o capítulo se
encerra com a Seção 1.5 que resume a estrutura do trabalho.
1.1 O ESTUDO DE CASO
Neste trabalho, tratar-se de um problema ocasionado em uma empresa de
resseguros, o IRB Brasil Re (Instituto Brasileiro de Resseguros), mais especificamente
na gerência de contas técnicas. O IRB Brasil Re é atualmente uma empresa privada
especializada em atender as demandas do mercado ressegurador brasileiro para todos os
riscos, como por exemplo: propriedades, financeiros, de petróleo e gás, rurais, vida,
engenharia, transportes e responsabilidade civil. (IRB, 2016)
A gerência de contas técnicas do IRB, objeto deste estudo, obteve papel
importante durante esses anos para o desenvolvimento da empresa. Sua
responsabilidade no contexto geral é a avaliação de contas técnicas referentes aos
contratos proporcionais através de prestações de contas, adiantamentos, alterações de
reservas e outras ações pontuais. Além das tarefas anteriormente mencionadas, a
necessidade de contato com parceiros de cada seguradora é imprescindível no cotidiano
dos colaboradores dessa área.
15
1.2 PROBLEMA E HIPÓTESE DA PESQUISA
Considerando a complexidade dos contratos proporcionais, pode-se indagar que:
Poder-se-á averiguar por meio de um modelo matemático e dados históricos, o
sucesso de um contrato proporcional?
E partindo do pressuposto:
Haveria a possibilidade de identificar quais características dos contratos
proporcionais seriam mais críticas para o processo?
1.3 OBJETIVOS DA PESQUISA
O estudo tem como objetivo geral entender como se comportam as variáveis que
impactam e quão são significantes nos contratos proporcionais gerenciados pela
empresa que é objeto de estudo, especificamente através da utilização da ferramenta
estatística, a Regressão Linear Múltipla, que poderá também prever o resultado
esperado de um contrato proporcional dadas as suas características.
1.4 DELIMITAÇÕES DA PESQUISA
Na coleta de dados, verificou-se delimitações frente a inúmeras características,
principalmente pela grande quantidade de variáveis e contratos analisados. Como foco
do estudo, foram analisados apenas os contratos proporcionais, pois se trata do foco da
gerência de contas técnicas. Assim, os contratos não proporcionais e os facultativos não
serão mencionados neste trabalho.
Foram coletados os dados dos contratos proporcionais mais atuais cadastrados
no sistema da empresa com período de vigência no ano de 2015. Apesar de mostrar a
maior quantidade de movimento pela gerência no próximo ano, alguns deles ainda
perpetuam e estabelecem o cotidiano dos analistas. Pelo mesmo fato de se tratar de
contratos recentes, alguns deles não apresentaram dados de balanço financeiro por causa
de seu cadastro atual mais o tempo máximo em que a seguradora tem para enviar a
prestação de contas, pois alguns terão novos dados a mudarem os parâmetros do
contrato.
Também o processo de coleta foi realizado de forma única durante o período de
janeiro e fevereiro de 2016. Este fato pode prejudicar as interpretações frente as
16
constantes mudanças dos valores apresentados durante o período de vigência dos
contratos.
1.5 ESTRUTURA DO TRABALHO
No Capítulo 1 é abordado o contexto da pesquisa, o objetivo geral e os objetivos
específicos, bem como a delimitação da pesquisa.
No Capítulo 2 é abordado o referencial teórico do estudo abrangendo os
contratos de resseguro e mais especificamente os contratos proporcionais
No Capítulo 3 apresenta-se os dados e sua natureza, a forma de coleta, o
tratamento dos dados e as delimitações do método.
No Capítulo 4 é relatada a metodologia desse trabalho, abordando todos os
dados coletados na pesquisa e o referencial teórico utilizado.
No Capítulo 5, o presente trabalho é concluído e são apresentados os pontos
conclusivos destacados, seguidos de recomendações para estudos futuros.
17
2 REFERENCIAL TEÓRICO
No presente capítulo é abordado o referencial teórico do estudo abrangendo os
contratos de resseguro e mais especificamente os contratos proporcionais.
Na seção 2.1 é apresentado as principais definições de seguro e resseguro e suas
características.
Na Seção 2.2 é apresentado os contratos de seguro e resseguro, e suas principais
características, além de demonstrar uma comparação entre os dois tipos de contrato.
Na Seção 2.2.1 é apresentado mais especificamente os contratos proporcionais
de resseguro, suas principais características e suas divisões.
Na Seção 2.3 é apresentado o modelo de regressão linear múltipla e os conceitos
envolvidos para a análise estatística.
2.1 O RESSEGURO
Alvim (1999) considera o seguro como a transferência do risco do segurado para
o segurador, o compartilhamento, entre muitos segurados, dos danos que deveriam ser
suportados por um deles.
O prêmio é a importância paga pelo segurado, ou estipulante, à seguradora para
que se tenha direito a receber indenização por danos decorrentes do risco identificado e
ocasionador do sinistro (DELGADO, 2004).
Manica (2010) conceitua o risco como o perigo a que está sujeito o interesse
segurado, em consequência do possível acontecimento de evento futuro, alheio à
vontade das partes. Portanto, o pagamento do prêmio está atrelado a uma eventual
probabilidade de ocorrência do risco.
Para Rios (2005), o resseguro é uma operação que visa à transferência de parte
ou mesmo de todo o risco assumido por uma companhia de seguros, mediante preço ou
uma porcentagem dos prêmios, a uma outra companhia.
De acordo com a FUNENSEG (Escola Nacional de Seguros, 2003) , o resseguro
é definido como um mecanismo de transferência de risco, através do qual o segurador
(ressegurado) transfere parte ou todo o risco da apólice por ele emitida a outro
18
segurador (ressegurador), que concorda em indenizá-lo pelas perdas decorrentes da
referida apólice, em troca de um prêmio de resseguro, e de acordo com os termos do
contrato de resseguro.
Assim, Piza (2005), afirma que as empresas de seguro buscam homogeneizar e
limitar as responsabilidades securitárias que assumem, no curso do exercício de sua
atividade empresarial, normalizando o comportamento de suas carteiras de riscos e
garantindo-as dos desvios ou desequilíbrios que, como visto, afetam a frequência, a
intensidade, a distribuição temporal ou a própria importância atinente aos sinistros de
tais riscos.
Conforme orientado pela SUSEP (Superintendência de Seguros Privados, 2013),
os contratos de resseguro em sua maioria abrangem diversos ramos e/ou grupo de
ramos, sendo que seus prêmios devem ser rateados entre os ramos (no caso das
seguradoras) ou entre os grupos de ramos (no caso dos resseguradores) para o registro
na contabilidade. Os rateios devem ser realizados de acordo com a exposição de risco
por ramo/grupo de ramo informada pela cedente nos contratos, nos endossos e nas
prestações de contas técnicas.
Demonstrada a natureza seguradora do contrato de resseguro, sem, entretanto,
negligenciar-se suas características particulares que o distinguem da estrutura
tradicional do seguro, é o resseguro um contrato oneroso, aleatório, consensual, de
estrita boa-fé, bilateral e de trato sucessivo (RIOS, 2005).
2.2 CONTRATOS DE RESSEGURO
De forma a estabelecer um vínculo expondo todos os negócios a serem
realizados durante determinado período, a seguradora e a resseguradora elaboram um
contrato de resseguro de forma que agrade a ambas as partes. Entretanto, existem
diferenças entre os contratos de seguros e os de resseguro.
O caráter aleatório do contrato de seguro reside no fato de que a vantagem da
qual resulta sua onerosidade não pode ser determinada no momento da celebração do
mesmo, dependendo da realização ou não de um evento futuro. (ALVIM, 1999)
De acordo com Camelo (2006), no contrato de seguro a obrigação está ligada a
um evento incerto e futuro. Já no contrato de resseguro, não necessariamente a
19
obrigação é o evento, mas sim o desembolso patrimonial do segurador cedente que
caracteriza a execução continuada. O evento que finaliza e torna o contrato perfeito, está
em repor o patrimônio que o segurador desembolsou para com o segurado, em função
do contrato de seguro, que pode ser patrimonial ou pessoal, durante todo o período de
vigência do contrato e até o limite pactuado por segurador e ressegurador.
Camelo (2006) ainda menciona as três diferenças sobre os contratos de seguro e
resseguro:
No contrato de seguro o contratante do mesmo não é uma empresa seguradora,
pode ser uma pessoa jurídica especializada em qualquer outro negócio, ou uma
pessoa física; já no contrato de resseguro, necessariamente, de um lado ter-se-ão
seguradores e do outro, empresas especializadas em resseguro. Assim, jamis será
possível se ter um contrato de resseguro entre uma pessoa jurídica e outra física.
O objeto contratual do seguro pode ser uma propriedade, pessoa ou benefício
exposto à perda ou destruição, ou ainda, alguma responsabilidade civil que o
segurado está exposto à perda patrimonial para o segurado, cuja
responsacilidade de indenizar recairá sobre o segurador. Diferentemente, o
objeto do resseguro está tão somente no dever de indenizar o segurador, que
sofreu redução financeira de seu patrimônio. O ressegurador toma conhecimento
e participa no contrato até sua parcela de proteção para pagamento dos prejuízos
primários que o ressegurador terá. Todo contrato de resseguro, portanto é um
contrato de indenização que pressupõe a existência de um ou mais contratos de
seguro, ou seja, tem que haver, necessariamente, a operação de seguro, para se
falar em resseguro. O resseguro está limitado ao montante de prêmio pago pela
seguradora cedente sob as apólices subscritas. Na prática, muitos contratos de
resseguro prevêem somente uma compensação parcial, com uma parte assumida
pela própria cedente. No seguro não necessariamente ter-se-á uma indenização
como objeto do contrato de seguro, o objeto a ser protegido pode ser a vida, a
saúde, bem imóveis, conserto do veículo, etc.
A última diferença essencial entre ambos está na internacionalização do
resseguro, eis que normalmente os riscos do contrato primário de seguro estão
em patrimônios como carros, empresas sediadas no país, seguro de vida ou
saúde, etc. Enquanto no resseguro, os direitos extrapolam o âmbito de um país,
são contratos transfronteiriços onde um ressegurador pode proteger a capacidade
20
financeira de vários resseguradores de diversas parter do mundo, basta que tenha
liquidez e confiabilidade do mercado. O seguro se paresenta como garantia de
proteção para bens situados e com os riscos expostos dentro do país da
contratação.
2.2.1 CONTRATOS PROPORCIONAIS DE RESSEGURO
Para Tilger (2009), os contratos proporcionais possuem uma relação de
proporcionalidade entre as parcelas de participação do ressegurador e da seguradora, na
importância segurada, é utilizada para a divisão dos prêmios e das responsabilidades nos
sinistros, ou seja, se uma seguradora possui uma participação de 95% da importância
segurada, então ela ficará com 95% dos prêmios e responderá por 95% do valor das
indenizações.
De acordo com Riley (2009), os contratos proporcionais se subdividem em três
categorias principais: cota-parte, excesso de responsabilidade e facultativo-obrigatório.
Os contratos cota-parte são acordos onde o ressegurado é obrigado a ceder e o
ressegurador é obrigado a aceitar uma porcentagem fixa de todos os riscos que estejam
de acordo com os termos do contrato. Os contratos de excesso de responsabilidade são
acordos que cobrem todos os riscos segurados que possuem importâncias seguradas
acima de um valor específico. Os contratos facultativos-obrigatórios se referem à
obrigação dos resseguradores de aceitar quaisquer riscos cedidos, desde que estejam
dentro dos termos e condições da cobertura propriamente dita.
Pelas orientações da SUSEP ao mercado, o registro contábil dos prêmios de
contratos proporcionais e seus requisitos estariam uniformizados. o EPI (Estimate
Premium Income) corresponde a uma estimativa dos prêmios de seguros totais que
serão, em parte, cedidos pela cedente ao ressegurador. Durante a vigência do contrato, a
cedente cederá um conjunto de apólices. Entretanto, no início do contrato, a cedente não
tem como assegurar o montante exato a ser repassado. Dessa forma a cedente realiza
uma estimativa da receita de prêmio de seguro que, em parte, será repassada ao longo da
vigência do contrato.
2.3 REGRESSÃO LINEAR MÚLTIPLA
Segundo Gujarati (2000), a análise de regressão ocupa-se do estudo da
dependência de uma variável, a variável dependente, em relação a uma ou mais
21
variáveis, as variáveis explicativas, com o objetivo de estimar e/ou prever a média ou
valor médio da dependente em termos dos valores conhecidos das explicativas.
Conforme indicado por Pereira (2015) uma função de regressão é expressada
através de uma distribuição Y variando em função de X pela seguinte equação:
𝑌 = 𝛽0 + 𝛽1𝑋1 +⋯+ 𝛽𝑖𝑋𝑖 (2.01)
Onde:
𝑌= Variável Dependente (Variável de Resposta);
𝑋𝑖= Variável Independente 𝑖 (Preditor 𝑖);
𝛽0= Intercepto;
𝛽𝑖= Coeficientes de Regressão (Inclinação ou Elasticidade).
Onde, Y é a variável dependente, X1, X2 e Xi são as variáveis independentes ou
explanatórias. Os coeficientes de regressão β0, β1, β2 e βi também são conhecidos como
coeficiente de inclinação ou coeficientes de elasticidade e medem o efeito de mudança
nas variáveis independentes sobre a variável dependente Y. Os valores dos coeficientes
de regressão são ilimitados, podendo ser positivos ou negativos e independem das
unidades de medidas das variáveis. Em geral, valores elevados significam que a variável
dependente é muito sensível a variações na variável independente.
O número mínimo de variáveis independentes pode ser calculado pela Regra de
Evans, que possui um caráter mais conservador exigindo pelo menos dez observações
para cada variável independente (DOANE e SEWARD, 2010):
𝑛
𝑘≥ 10 (2.02)
Onde
𝑛 = número de observações
𝑘 = número de variáveis independentes
Outra regra muito utilizada é a Regra de Doane, porém esta possui caráter mais
relaxado, pois para cada variável independente são necessárias pelo menos cinco
observações. Logo, pode-se concluir que a relação 𝑛 𝑘⁄ deve ser a maior possível
(HAIR et al., 2009)
22
Se a variável dependente for representada pela matriz Y:
𝑌 = [
𝑦1𝑦2⋮𝑦𝑖
] (2.03)
E as variáveis independentes pela matriz X (matriz design):
𝑋 = [
11⋮1
𝑥11𝑥21⋮𝑥𝑖1
⋯⋯⋱⋯
𝑥1𝑗𝑥2𝑗⋮𝑥𝑖𝑗
] (2.04)
Pode-se representar os coeficientes de regressão, pela matriz 𝜷, que é calculada
como:
𝛽 = (𝑋′𝑋)−1𝑋′𝑌 (2.05)
Uma vez obtido o modelo de regressão linear múltipla, deve-se analisá-lo e
validá-lo. Primeiramente uma análise da variância e do desvio padrão dos resíduos deve
ser feita, para se determinar a significância de cada βi.
𝜎² =∑ (𝑦𝑖−𝑦��)²𝑛𝑖=1
𝑛−(𝑘+1) e 𝜎 = √𝜎² (2.06)
Onde:
𝜎² = Variância dos resíduos
𝜎 = Desvio padrão dos resíduos
𝑛 = Número de observações
𝑘 = Número total de variáveis dependentes
�� = o valor estimado da variável independente.
De forma a descobrir o erro padrão dos coeficientes de regressão, usa-se a matriz
de variância-covariância 𝑪.
𝐶 = ��2(𝑋′𝑋)−1 (2.07)
Para cada estimador 𝛽 haverá um intervalo de confiança determinado pela
função t de Student.
23
𝛽𝑖 ± 𝑡𝑛−(𝑘+1);𝛼/2 × 𝜎𝛽𝑖 (2.08)
Com as seguintes hipóteses:
𝐻0: 𝛽𝑖 = 0 (não existe relação linear entre 𝑥𝑖 e 𝑦)
𝐻1: 𝛽𝑖 ≠ 0 (não existe relação linear entre 𝑥𝑖 e 𝑦)
𝑡𝑡𝑒𝑠𝑡𝑒 =𝐵𝑖
𝜎𝐵𝑖 (2.09)
𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 = 𝑡𝑛−(𝑘+1);𝛼/2 (2.10)
Caso 𝑡𝑡𝑒𝑠𝑡𝑒 > 𝑡𝑐𝑟í𝑡𝑖𝑐𝑜ou 𝑡𝑡𝑒𝑠𝑡𝑒 < −𝑡𝑐𝑟í𝑡𝑖𝑐𝑜, rejeita-se a hipótese nula e afirma-se
que 𝛽𝑖 é diferente de zero e existe uma relação linear entre 𝑥𝑖 e y.
A adequação do modelo em relação aos dados é representado pela variância total
(SST – Total Sum of Squares) do modelo e a sua composição que é representada pela
soma da variância explicada (SSR – Regression Sum of Squares) e da variância não-
explicada (SSE – Error Sum of Squares) :
∑ (𝑦𝑖 − ��)2𝑛𝑖=1 = ∑ (��𝑖 − ��)2𝑛
𝑖=1 + ∑ (𝑦𝑖 − ��𝑖)2𝑛
𝑖=1 (2.11)
𝑆𝑆𝑇 = 𝑆𝑆𝑅 + 𝑆𝑆𝐸 (2.12)
Onde:
𝑆𝑆𝑇 = Mede a variação dos valores de 𝑦𝑖 em torno de sua média ��;
𝑆𝑆𝑅 = Variação atribuída pela relação entre 𝑋 e 𝑌;
𝑆𝑆𝐸 = Varição de 𝑌 atribuída a outros fatores que não sejam 𝑋.
A Figura 2.1 resume graficamente a relação entre a variância explicada e a
variância não-explicada com a variância total.
24
Figura 2.1. Variância
Fonte: Pereira (2015)
Em seguida, realiza-se o teste de hipótese pela distribuição de probabilidade
contínua F de Fisher-Snedecor, onde:
𝐻0: O modelo não é adequado
𝐻1: O modelo é adequado
𝐹𝑡𝑒𝑠𝑡𝑒 = [∑ (��𝑖−��)
2𝑛𝑖=1 ]/(𝑘)
[∑ (𝑦𝑖−��𝑖)2𝑛
𝑖=1 ]/[𝑛−(𝑘+1)] (2.13)
Onde
𝐹𝑡𝑒𝑠𝑡𝑒 = distribuição de probabilidade contínua F de Fisher-Snedecor
𝑦𝑖 = valor da variável independente
��𝑖 = valor estimado da variável independente
k = número total de variáveis dependentes
n = número de observações
Caso 𝐹𝑡𝑒𝑠𝑡𝑒 > 𝐹𝑘;𝑛−(𝑘+1);𝛼 rejeita-se a hipótese nula e afirma-se que o modelo
encontrado é adequado.
Y
X
SST
SSR
SSE
𝑦𝑖 − ����𝑖 − ��
𝑦𝑖 − ��𝑖
𝑦𝑖
𝑥𝑖
25
Para se medir a força da relação indicando que o modelo explica um percentual
da variância da variável dependente, usa-se a variável r², conhecida tanto como r-
quadrado ou como o coeficiente de deteminação. Em um caso com r² igual a 0,9
significa que 90% da variância da variável dependente decorre da variável independente
e os restante 10% não são explicados pela mesma. Quanto mais próximo de 1, melhor
será o ajuste. Determinada as variâncias, pode-se calcular o r-quadrado como
(FÁVERO et al., 2009, PEREIRA, 2015):
𝑟² = 1 − ∑ (𝑦𝑖−𝑦��)²𝑛𝑖=1
∑ (𝑦𝑖−𝑦𝑖 )²𝑛𝑖=1
(2.14)
𝑟 = √𝑟² (2.15)
Onde:
r² = r-quadrado
y = valor da variável dependente
�� = o valor estimado da variável independente.
O (r²)a ou r²-ajustado é uma medida que ajusta o r² em função do número de k
variáveis independentes utilizadas:
(𝑟2)𝑎 = 1 − (1 − 𝑟2)𝑛−1
𝑛−𝑘−1 (2.16)
Onde:
(𝑟2)𝑎 = r²-ajustado
𝑟² = r-quadrado
n = número de observações
k = número total de variáveis dependentes
Tem-se o seguinte testes de hipótese para testar se a correlação é significativa:
𝐻0: A correlação não é significativa
𝐻1: A correlação é significativa
𝑡𝑡𝑒𝑠𝑡𝑒 = 𝑟
√1−(𝑟)2
𝑛−2
(2.17)
26
𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 = 𝑡𝑛−2;𝛼/2 (2.18)
Onde:
𝑡𝑡𝑒𝑠𝑡𝑒 = teste t de Student
𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 = valor do teste t onde se rejeita ou afirma a hipótese nula
Caso 𝑡𝑡𝑒𝑠𝑡𝑒 > 𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 ou 𝑡𝑡𝑒𝑠𝑡𝑒 < −𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 rejeita-se a hipótese nula e afirma-se
que existe uma correlação significativa para o modelo.
Gujarati (2000) conclui em sua obra que muitos pesquisadores tentam
maximizar r², porém isto pode ser perigoso porque na análise de regressão, o objetivo
não é obter apenas um r², mas sim obter estimativas confiáveis dos verdadeiros
coeficientes de regressão da população que permitem a inferência estatística sobre eles.
Na análise empírica, não é incomum obter um r² muito alto, mas ao descobrir que
alguns dos coeficientes de regressão não são estatisticamente significativos ou mostrem
sinais contrários significativos a priori. Portanto, o pesquisador deve se preocupar mais
com a relevância lógica ou teórica das variáveis explicativas para a variável dependente
e sua significância estatística.
2.4 PRESSUPOSTOS DA REGRESSÃO LINEAR MÚLTIPLA -
COLINEARIDADE
Segundo Pereira (2015) a colinearidade (correlação entre duas variáveis
independentes) ou a multicolinearidade (correlação entre múltiplas variáveis
independentes) podem tornar o modelo inviável, pois:
as estimativas podem ser instáveis;
o erro padrão pode ser não confiável;
o range dos intervalos de confiança pode se tornar muito amplo;
o coeficiente de determinação pode ser alto, ainda que os teste t sejam
insignificantes.
Caso seja detectada a existência de colinearidade, a remoção de uma das
variáveis ou a normalização de todas as variáveis, pode contornar o problema. Para se
detectar esse problema é necessário calcular o VIF (Variance Inflator Factor) para cada
preditor. Se o seu valor for maior que 5, o preditor é altamente relacionado indicando
colinearidade :
27
𝑉𝐼𝐹𝑗 =1
1−(𝑟2)𝑗 (2.19)
Onde:
(𝑟2)𝑗= Coeficiente de determinação entre o preditor 𝑗 e todos os outros
preditores.
1 − (𝑟2)𝑗= Tolerância entre o preditor 𝑗 e todos os outros preditores. Quanto
maior a tolerância, menores são as chances de ocorrer a colinearidade ou a
multicolinearidade.
2.5 VALIDAÇÃO DOS RESÍDUOS
Uma vez verificada a adequação do modelo estimado, é necessário validar
também os seus resíduos, conhecido também como resíduos. As características desses
resíduos seguem os seguintes padrões:
ser normalmente distribuídos
são homocedásticos;
são independentes , ou seja, não são correlacionados dentro de uma série de
tempo.
Os Resíduos Studentizados são os resíduos de um modelo dividos pela
estimativa do seu desvio padrão, então valores acima de +3 ou menores do que -3
podem indicar a existência de outliers.
A normalidade dos resíduos pode ser verificada visualmente através do QQ Plot
que compara distribuição dos resíduos com a distribuição normal. Se o gráfico
apresentar uma tendência linear (em um ângulo de aproximadamente 450), então
assume-se que os resíduos são normalmente distribuídos. O teste de Shapiro-Wilk
também pode ser utilizado para esse fim, e possui as seguintes hipóteses:
𝐻0: A amostra provém de uma Distribuição Normal
𝐻1: A amostra não provém de uma Distribuição Normal
Para verificar se os resíduos são homocedásticos (variância constante) o gráfico
dos mesmos contra os valores previstos pelo modelo deve ser feito e o ideal é que não
28
haja padrões nesse gráfico. O teste de Breusch-Pagan pode ser feito para se verificar a
homocedasticidade e com a seguinte hipótese:
𝐻0: Os resíduos são homocedásticos
𝐻1: Os resíduos não são homocedásticos
Finalmente, para verificar se os resíduos são independentes (não
autocorrelacionados) o teste de Durbin-Watson (DW) pode ser calculdado como:
𝐷𝑊 = ∑ (𝑒𝑖 − 𝑒𝑖−1)
2𝑛𝑖=2
∑ (𝑒𝑖)2𝑛𝑖=1
(2.20)
E com as seguintes considerações:
𝐷𝑊 < 2 → Indica autocorrelação positiva (Comum)
𝐷𝑊 ≅ 2 → Sem autocorrelação
𝐷𝑊 > 2 → Indica autocorrelação negativa (Raro)
Esse pressuposto só deve ser verificado se os dados analisados pertencerem a
uma série temporal.
O software R oferece um pacote chamado GVLMA (Global Validation of Linear
Model Assumption) que testa todos os pressupostos do modelo de uma única vez,
validando-o em uma única etapa.
2.6 PODER DE PREDIÇÃO DO MODELO E SELEÇÃO DE VARIÁVEIS
INDEPENDENTES
O 𝐴𝐼𝐶 (Akaike Information Criterion) é um critérios de informação que serve
para comparar diferentes modelos para um mesmo problema (Exemplo: Comparar um
modelos com diferentes combinações de variáveis independentes). Quanto menor o
valor do 𝐴𝐼𝐶, melhor é o modelo. E ele pode ser calculado como:
𝐴𝐼𝐶 = 𝑛 × 𝑙𝑛 (𝑆𝑆𝐸
𝑛) + 2 × (𝑘 + 1) (2.21)
O software R oferece um pacote chamado Leaps que pode testar todas as
combinações signicativas das variáveis independentes de uma única vez, escolhendo o
modelo de menor AIC.
29
3 METODOLOGIA
No presente capítulo é abordado a metodologia, incluindo os dados e sua
natureza, a forma de coleta, o tratamento dos dados e as delimitações do método.
Na Seção 3.1 é explicado quais dados foram coletados e sua natureza.
Na Seção 3.2 é informado o meio como os dados foram coletados e os
programas utilizados para metodologia.
Na Seção 3.3 é apresentada cada uma variável e suas características mais
importantes.
Na Seção 3.4 é apresentada a delimitação do método e as possíveis
consequências de um estudo mais abrangente para minimizar tais problemas.
3.1 POPULAÇÃO E AMOSTRA
Conforme indicado no Capítulo 1, os contratos proporcionais foram alvo desse
estudo e mais precisamente serão utilizados os contratos referentes ao ano de subscrição
de 2015. Foram coletados dados da amostra referentes aos contratos nacionais
abrangendo toda a participação da resseguradora.
3.2 COLETA DE DADOS
Os dados foram coletados pelo próprio pesquisador através do sistema
computacional utilizado na empresa IRB Brasil. Nesse sistema foi possível adquirir
todas as informações sobre os contratos proporcionais e a toda e qualquer mudança
ocorrida nos mesmos. O período da coleta ocorreu entre janeiro de 2016 e fevereiro de
2016.
3.3 TRATAMENTO E ANÁLISE DE DADOS
A Tabela 3.1, indica as variáveis utilizadas e as características de cada uma, em
seguida uma visão mais detalhada de cada uma delas é feita através de Figuras onde
pode ser visto o gráfico de dispersão, o box-plot e o histograma de cada uma.
Tabela 3.1 Definições das variáveis
Variável Tipo ID Min Mediana Max
Cedente - - - - -
Mês de início Numérica Start_Date 1 4 12
30
(Meses)
Existência de
Corretora
Binária
(0: N; 1: S) Broker 0 0 1
Tipo de Contrato
Proporcional
Binária
(0: QP; 1: ER) ER_QP 0 1 1
EPI Numérica
($) EPI $0,00 $5.359,00 $66.000.00,00
Participação da
Resseguradora
Numérica
(%) Participacao 1,88% 50,00% 100,00%
Divisão do Ramo Numérica
(Contagem) COB 1 2 14
Capacidade Máxima
de Resseguro
Numérica
($) Capacidade_Max $10.000,00 $10.000.002,00 $995.000.005,00
Número de Moedas
Utilizadas
Numérica
(Contagem) Moedas 1 1 3
Prêmio Performado Numérica
($) Premio $0,00 $108.166,00 $29.884.307,00
Número de Contas
Atrasadas
Binária
(0: S; 1: N) Contas_Atrasadas 0 0 1
Número de
Lançamentos
Realizados
Numérica
(Contagem)
Accounts_Lancad
as 0 2 6
Cargo do Analista
Categórica
(A1; A2; A3;
A4; A5; A6)
Analista 1 5 6
Tempo Médio de
Lançamento
Numérica
(Dias) Tempo_Medio 0 16 53
Cedente - Nome do parceiro: No campo cedente foi utilizado uma variável
descritiva utilizando o nome do parceiro. Foi decodificado esse campo para dispor mais
confidencialidade do parceiro para com esta empresa.
Mês de início - Mês de início do contrato: Para o mês de início, foram
substituídos os nomes por uma ordem de acordo com o calendário. Por exemplo, janeiro
é representado pelo número 1, fevereiro por 2, dentre outros. Esse campo indica o
primeiro mês no qual os riscos possuem vigência e serão tratados dentro do contrato.
Abaixo na figura 3.1, observamos o histograma, o box-plot e a dispersão das
observações da variável mencionada.
Figura 3.1. Variável Start_Date
31
Existência de corretora - Existência ou não da corretora no contrato: No
campo existência de corretora foi definido uma variável binária que identifica se para
aquele contrato, há um interloucutor entre a seguradora e a resseguradora. Caso o
número seja 1, existe uma corretora intermediando as prestações de contas e 0 caso
contrário. Abaixo na figura 3.2, observamos o histograma, o box-plot e a dispersão das
observações da variável mencionada.
Figura 3.2. Variável Broker
Tipo de contrato proporcional - Divisão entre contrato de Excedente de
Responsabilidade ou Quota-Parte: Os tipos de contratos proporcionais são classificados
em dois grupos principais sendo Excedente de Responsabilidade representados pelo
valor 1 e Quota-Parte pelo valor 0.
Os contratos quota-parte são acordos onde o ressegurado é obrigado a ceder e o
ressegurador é obrigado a aceitar uma porcentagem fixa de todos os riscos que estejam
de acordo com os termos do contrato. Os contratos de excesso de responsabilidade são
0 50 100 150
24
68
10
Observations
Sta
rt_D
ate
24
68
10
Observations
Sta
rt_D
ate
Start_Date
Fre
quency
2 4 6 8 10
010
30
50
0 50 100 150
0.0
0.4
0.8
Observations
Bro
ker
0.0
0.4
0.8
Observations
Bro
ker
Broker
Fre
quency
0.0 0.4 0.8
020
60
100
32
acordos que cobrem todos os riscos segurados que possuem importâncias seguradas
acima de um valor específico. Os contratos facultativos-obrigatórios se referem à
obrigação dos resseguradores de aceitar quaisquer riscos cedidos, desde que estejam
dentro dos termos e condições da cobertura propriamente dita (Riley, 2009). Abaixo na
figura 3.3, observamos o histograma, o box-plot e a dispersão das observasões da
variável mencionada.
Figura 3.3. Variável ER_PQ
EPI - Estimativa dos prêmios a serem performados durante a vigência do
contrato: De acordo com orientação da SUSEP, 2013, o EPI (Estimate Premium
Income) corresponde a uma estimativa dos prêmios de seguros totais que serão, em
parte, cedidos pela cedente ao ressegurador. Durante a vigência do contrato, a cedente
cederá um conjunto de apólices. Entretanto, no início do contrato, a cedente não tem
como assegurar o montante exato a ser repassado. Dessa forma a cedente realiza uma
estimativa da receita de prêmio de seguro que, em parte, será repassada ao longo da
vigência do contrato. Abaixo na figura 3.4, observamos o histograma, o box-plot e a
dispersão das observasões da variável mencionada.
Figura 3.4. Variável EPI
0 50 100 150
0.0
0.4
0.8
Observations
ER
_P
Q
0.0
0.4
0.8
Observations
ER
_P
Q
ER_PQ
Fre
quency
0.0 0.4 0.8
020
40
60
80
33
Devido a ordem de grandeza de alguns valores dessa variável, foi necessário
realizar uma transformação logarítmica natural dos dados, e o seu resultado pode ser
visto na figura 3.5 a seguir:
Figura 3.5. Variável ln (EPI)
Participação da resseguradora: Percentual em que a empresa participa do
resseguro: A participação da resseguradora é definida pelo percentual que a empresa
participa do resseguro, visto que uma ou mais empresas podem dividir os riscos
assumidos. Abaixo na figura 3.6, observamos o histograma, o box-plot e a dispersão das
observasões da variável mencionada.
0 50 100 150
0e+
00
3e+
07
6e+
07
Observations
EP
I
0e+
00
3e+
07
6e+
07
Observations
EP
I
EPI
Fre
quency
0e+00 3e+07 6e+07
050
100
150
0 50 100 150
10
12
14
16
18
Observations
EP
I
10
12
14
16
18
Observations
EP
I
EPI
Fre
quency
8 10 14 18
010
20
30
40
34
Figura 3.6. Variável Participacao
Divisão entre seguro e resseguro - Divisão entre a parte cedida e retida do
contrato: Os contratos de quota-parte são marcados pelo percentual de risco assumido.
Abaixo na figura 3.7, observamos o histograma, o box-plot e a dispersão das
observasões da variável mencionada.
Figura 3.7. Variável Perc_QP
Capacidade máxima de resseguro - A quantia máxima assumida pelo contrato
em suas apólices para os riscos estabelecidos: A capacidade máxima de resseguro é a
quantia máxima assumida pelo contrato em suas apólices para os riscos estabelecidos.
Abaixo na figura 3.8, observamos o histograma, o box-plot e a dispersão das
observasões da variável mencionada.
0 50 100 150
0.0
0.4
0.8
Observations
Part
icip
acao
0.0
0.4
0.8
Observations
Part
icip
acao,
Participacao
Fre
quency
0.0 0.4 0.8
010
30
50
0 50 100 150
0.0
0.4
0.8
Observations
Perc
_Q
P
0.0
0.4
0.8
Observations
Perc
_Q
P
Perc_QP
Fre
quency
0.0 0.4 0.8
020
40
60
80
35
Figura 3.8. Variável Capacidade_Max
Devido a ordem de grandeza de alguns valores dessa variável, foi necessário
realizar uma transformação logarítmica natural dos dados, e o seu resultado pode ser
visto na figura 3.9 a seguir:
Figura 3.9. Variável ln (Capacidade_Max)
Quantidade de subdivisões do ramo - Número de subdivisões do ramo
original: As subdivisões do ramo original do contrato foram alocadas numericamente
pela quantidade envolvida devido as diversas ramificações. O objetivo é incluir a
dificuldade da análise do lançamento da prestação por causa de mais separações.
Abaixo na figura 3.10, observamos o histograma, o box-plot e a dispersão das
observasões da variável mencionada.
0 50 100 150
0e+
00
4e+
08
8e+
08
Observations
Capacid
ade_M
ax
0e+
00
4e+
08
8e+
08
Observations
Capacid
ade_M
ax
Capacidade_Max
Fre
quency
0e+00 4e+08 8e+08
050
100
150
0 50 100 150
10
14
18
Observations
Capacid
ade_M
ax
10
14
18
Observations
Capacid
ade_M
ax
Capacidade_Max
Fre
quency
10 14 18
010
20
30
40
36
Figura 3.10. Variável COB
Número de moedas utilizadas - A quantidade de moedas negociadas pelo
segurador em suas apólices: O campo número de moedas utilizadas trata da quantidade
de moedas negociadas pelo segurador em suas apólices. Apesar de ser adotado no
pagamento apenas uma única moeda como instrumento de negociação, nos lançamentos
podem ser observadas mais de uma. Abaixo na figura 3.11, observamos o histograma, o
box-plot e a dispersão das observasões da variável mencionada.
Figura 3.11. Variável Moedas
Prêmio performado - O valor dos prêmios das prestações de contas
enviadas pela seguradora ou corretora até o momento da coleta dos dados: O prêmio
performado é o valor em reais dos prêmios das prestações de contas enviadas pela
seguradora ou corretora até o momento da coleta dos dados. No saldo final performado,
possui o mesmo modelo, porém existe a inclusão de outros valores totalizando o
pagamento a ser executado pela parte devedora. Abaixo na figura 3.12, observamos o
histograma, o box-plot e a dispersão das observasões da variável mencionada.
0 50 100 150
24
68
12
Observations
CO
B
24
68
12
Observations
CO
B
COB
Fre
quency
0 2 4 6 8 12
020
40
60
80
0 50 100 150
1.0
1.5
2.0
2.5
3.0
Observations
Moedas
1.0
1.5
2.0
2.5
3.0
Observations
Moedas
Moedas
Fre
quency
1.0 1.5 2.0 2.5 3.0
040
80
120
37
Figura 3.12. Variável Premio
Devido a ordem de grandeza de alguns valores dessa variável, foi necessário
realizar uma transformação logarítmica natural dos dados acrescidos de uma unidade
(pois existem observações com o valor de 0), e o seu resultado pode ser visto na figura
3.13 a seguir:
Figura 3.13. Variável ln (Premio +1)
Número de contas atrasadas - Atraso da entrega das prestações de contas:
Caso o parceiro não tenha enviado a empresa as pretações de contas, ela estará em
atraso. Definir-se-á esse atraso por uma variável binária, em que 1 simboliza o atraso e
0 a entrega no prazo. Abaixo na figura 3.14, observamos o histograma, o box-plot e a
dispersão das observasões da variável mencionada.
Figura 3.14. Variável Contas_Atrasadas
0 50 100 1500.0
e+
00
1.5
e+
07
3.0
e+
07
Observations
Pre
mio
0.0
e+
00
1.5
e+
07
3.0
e+
07
ObservationsP
rem
ioPremio
Fre
quency
0.0e+00 1.5e+07 3.0e+07
050
100
150
0 50 100 150
05
10
15
Observations
Pre
mio
05
10
15
Observations
Pre
mio
Premio
Fre
quency
0 5 10 15
010
20
30
40
50
38
Número de unidades de lançamentos realizadas - Trabalho performado pelo
analista contabilizado por unidade de lançamento: O número de unidades de
lançamentos corresponde ao trabalho do analista encarregado por aquela prestação de
contas a ser registrado no sistema. Se houver alguma mudança na prestação de contas
enviada, uma nova unidade de lançamento deve ser refeita anulando a anterior. Abaixo
na figura 3.15, observamos o histograma, o box-plot e a dispersão das observasões da
variável mencionada.
Figura 3.15. Variável Accounts_Lancadas
Cargo do analista: Importância do analista frente a organização: O cargo do
analista a fazer a análise e registro da prestação de contas foi avaliada como o menor
número, 1, para o cargo de menor remuneração até o maior número, 6, com o cargo de
maior remuneração dos analistas do setor. Abaixo na figura 3.16, observamos o
histograma, o box-plot e a dispersão das observasões da variável mencionada.
Figura 3.16. Variável Analista
0 50 100 150
0.0
0.4
0.8
Observations
Conta
s_A
trasadas
0.0
0.4
0.8
Observations
Conta
s_A
trasadas
Contas_Atrasadas
Fre
quency
0.0 0.4 0.8
020
60
100
0 50 100 150
01
23
45
6
Observations
Accounts
_Lancadas
01
23
45
6
Observations
Accounts
_Lancadas
Accounts_Lancadas
Fre
quency
0 1 2 3 4 5 6
010
20
30
40
39
Devido a natureza categórica dessa variável foi necessária a transformação da
mesma em variáveis dummy. Como existem 6 categorias, 5 variáveis dummy são
necessárias: Analista_A (1 se pertence a primeira categoria e 0, caso contrário),
Analista_B (1 se pertence a segunda categoria e 0 caso contrário), Analista_C (1 se
pertence a terceira categoria e 0 caso contrário), Analista_D (1 se pertence a quarta
categoria e 0 caso contrário) e Analista_E (1 se pertence a quinta categoria e 0 caso
contrário).
Tempo médio de lançamento do contrato: Tempo performado da data
de entrega das prestações até a data de conclusão: O tempo médio de lançamento foi
avaliado em dias desde o recebimento da conta até a data final de revisão e aprovação.
Todos os tempos de todos os accounts foram registrados e calculados por uma média de
seus valores. Abaixo na figura 3.17, observamos o histograma, o box-plot e a dispersão
das observasões da variável mencionada.
Figura 3.17. Variável Tempo_Medio
0 50 100 150 200
12
34
56
Observations
Analis
ta
12
34
56
Observations
Analis
ta
Observations
Analis
ta
1 2 3 4 5 6
020
40
60
80
0 50 100 150
010
20
30
40
50
Observations
Tem
po_M
edio
010
20
30
40
50
Observations
Tem
po_M
edio
Tempo_Medio
Fre
quency
0 10 30 50
010
30
50
40
A Figura 3.18, obtida através do software R, apresenta a correlação a 5% de
significância entre as variáveis utilizadas pelo modelo, já feitas as transformações.
Variáveis que possuam uma alta correlação podem não ser significativos para o modelo
e geram um problema de colinearidade. A decisão de qual variável deve ficar e qual
deve sair será dada por aquela que minimizar o valor do AIC.
Figura 3.18. Correlações
A Figura 3.19, também obtida através do software R, indica quais valores de
correlação possuem um nível significância de 5%.
41
Figura 3.19. Significância das Correlações
3.4 LIMITAÇÕES DO MÉTODO
Na especificação do modelo, Gujarati (2000) reflete para o fato que alguns
resíduos podem ocorrer devido a omissões de variáveis relevantes, a inclusão de
variáveis desnecessárias, adoção de forma funcional errada ou resíduos de medição.
Além disso, os dados coletados podem apresentar variações conforme o período
da coleta e não apresentarem o resultado definitivo para aquele contrato e,
consequentemente uma divergência com o modelo apresentado. A maneira mais eficaz
seria a elaboração desse modelo por longos períodos de tempo e abranger o maior
número de contratos possíveis.
42
4 REGRESSÃO LINEAR MÚLTIPLA
A seção 4.1 aborda a análise estatística dos dados apresentados anteriormente e
verifica as condições para a validação de um modelo.
Na seção 4.2 propõem-se a adequação de um modelo parcimonioso que expresse
melhor os dados e seja mais conciso para uma melhor análise qualitativa
Na seção 4.3 as variáveis do modelo final são interpretadas quantitativamente e
qualitativamente.
4.1 ANÁLISE ESTATÍSTICA DOS DADOS
No total 182 observações foram coletadas e como o total de variáveis é de 18,
pode-se concluir que as regras de Evans e de Doane foram respeitadas, pois:
𝑛
𝑘=182
18≅ 10,11
Prosseguindo com o estudo, utilizou-se a regressão linear múltipla para
construção de um modelo cujo resultado obtido através da utlização do software R
descrita na tabela 4.1 abaixo:
Tabela 4.1 Estatísticas descritivas do modelo Variables Estimate Std. Err. t p-value Intercept 7.709741 0.961462 8.019 1.92e-13 Start_Date 0.205879 0.041246 4.992 1.52e-06 Broker -0.637728 0.234499 -2.720 0.00724 ER_PQ 0.987703 0.335946 2.940 0.00376 Participacao -1.746942 0.339344 -5.148 7.46e-07 Perc_QP -0.463484 0.477251 -0.971 0.33290 Capacidade_Max 0.329926 0.048042 6.868 1.29e-10 COB 0.075950 0.041961 1.810 0.07212 Moedas 0.070114 0.191201 0.367 0.71431 Premio 0.153359 0.023788 6.447 1.22e-09 Accounts_Lancadas 0.169421 0.096700 1.752 0.08164 Contas_Atrasadas -0.056796 0.220935 -0.257 0.79744 Analista_A -1.133160 0.459175 -2.468 0.01462 Analista_B -0.649056 0.397841 -1.631 0.10471 Analista_C -0.502610 0.753420 -0.667 0.50564 Analista_D -0.389975 0.308032 -1.266 0.20730 Analista_E -0.497075 0.307474 -1.617 0.10788 Tempo_Medio -0.025477 0.009293 -2.741 0.00680 Residual standard error: 1.13 Multiple R-squared: 0.65 Adjusted R-squared: 0.62 F-statistic: 18.05 (p-value: < 2.2e-16)
43
As variáveis não significativas (5%) estão em negrito na Tabela 4.1 e são elas:
Perc_QP, COB, Moedas, Accounts_Lancadas, Contas_Atrasadas, Analista_A,
Analista_B, Analista_C, Analista_D e Analista_E. O erro padrão possui um valor de
1,13; o 𝑟2possui um valor de 0,65; o 𝑟2-ajustado possui um valor de 0,62 e modelo se
mostrou significantemente adequado.
A Figura 4.1 demonstra o histograma da distribuição dos resíduos studentizados
e que aparentemente possui uma distribuição normal.
Figura 4.1. Distribuição dos resíduos
A Figura 4.2 indica o QQ plot da distribuição dos resíduos studentizados e a sua
diagonal está próxima de ângulo de 45 graus sugerindo que os resíduos são
normalmente distribuídos.
Figura 4.2. QQ Plot
44
Finalmente o teste de Shapiro-Wilk com um p-valor de 0.3578 e considerando-
um nível de significância de 5%, pode-se concluir que a hipótese nula pode ser aceita,
ou seja, os resíduos possuem uma distribuição normal.
A homocedasticidade pode ser averiguada graficamente pela Figura 4.3, que
indica a não existência de padrões evidentes na dispersão dos resíduos e o teste de
Breusch-Pagan com um p-valor de 0.00149, considerando-se um nível de significância
de 1%, pode-se concluir que a hipótese nula pode ser aceita, ou seja, os resíduos
possuem homocedasticidade.
Figura 4.3. Resíduos Studentizados vs Valores Previstos
-2
-1
0
1
2
-3 -2 -1 0 1 2 3
theoretical
sam
ple
-2
-1
0
1
2
12 14 16
regression$fitted.values
sre
sid
45
A colinearidade foi verificada pelo VIF e nenhum valor excedeu o valor de 5,
essa verificação garante que esse conjunto de variáveis, e consequentemente os seus
subconjuntos, não possuem colinearidade ou multi-colinearidade. Os resultados estão
presentes na Tabela 4.2:
Tabela 4.2 VIF
Start_Date 2.703799 Broker 1.858880 ER_PQ 3.969546 Participacao 1.995313 Perc_QP 3.806081 Capacidade_Max 1.883103 COB 1.297263 Moedas 1.499870 Premio 2.690765 Accounts_Lancadas 3.590880 Contas_Atrasadas 1.650058 Analista_A 1.701122 Analista_B 2.199643 Analista_C 1.307487 Analista_D 2.719083 Analista_E 3.211674 Tempo_Medio 2.182811
A utilzação do pacote GVLMA do R testa todos os pressupostos de uma única
vez e o resultado pode ser visto na Tabela 4.3
Tabela 4.3 GVLMA Value p-value Decision
Global Stat 5.6063 0.23054 Assumptions acceptable. Skewness 0.9009 0.34253 Assumptions acceptable. Kurtosis 0.7268 0.39391 Assumptions acceptable. Link Function 3.0010 0.08321 Assumptions acceptable. Heteroscedasticity 0.9775 0.32282 Assumptions acceptable.
O “Global Stat” indica que um modelo linear se adequa aos dados utilzados, já a
“Skewness” e a “Kurtosis” indicam que os resíduos possuem uma distribuição normal,
o “Link Function” indica que existe uma relação linear entre as variáveis utilizadas e a
“Heteroscedasticity” atesta que os resíduos são homocedásticos.
Finalmente a Figura 4.4 mostra as curvas do EPI real (valores transformados) e
dos valores previstos pelo modelo.
Figura 4.4. EPI vs Valores Previstos
46
4.2 SELEÇÃO DE UM MODELO PARCIMONIOSO
O modelo apresentado é válido, entretanto, de forma a deixá-lo mais
parcimonioso e focar os esforços em menores quantidades de variáveis, optou-se por
utilizar o procedimento no software R através do pacote Leaps que retorna o melhor
modelo com menos variáveis (caso exista) de acordo com critério de menor AIC. Os
resultados podem ser vistos na Figura 4.5:
Figura 4.5. Leaps
O resultado para esse novo modelo indica o uso de 10 variáveis (possuindo um
AIC de 8,7): Start_Date, Broker, ER_QP, Participacao, Capacidade_Max, COB,
Cp
(In
terc
ep
t)
Sta
rt_
Da
te
Bro
ke
r
ER
_P
Q
Pa
rtic
ipa
ca
o
Pe
rc_
QP
Ca
pa
cid
ad
e_
Ma
x
CO
B
Mo
ed
as
Pre
mio
Acco
un
ts_
La
nca
da
s
Co
nta
s_
Atr
asa
da
s
An
alista
_A
An
alista
_B
An
alista
_C
An
alista
_D
An
alista
_E
Te
mp
o_
Me
dio
170120
773621181716141413121111
9.49.28.7
47
Premio, Accounts_Lancadas, Analista_A e Tempo_Medio. A Tabela 4.4 indica o
resultado da regressão feita com essas 10 variáveis:
Tabela 4.4 Modelo Leaps Variables Estimate Std. Err. t p-value Intercept 7.718622 0.806576 9.570 < 2e-16 Start_Date 0.199929 0.034821 5.742 4.19e-08 Broker -0.498615 0.202097 -2.467 0.01460 ER_PQ 0.730770 0.182350 4.008 9.14e-05 Participacao -1.814239 0.290506 -6.245 3.24e-09 Capacidade_Max 0.306028 0.040416 7.572 2.19e-12 COB 0.105025 0.039056 2.689 0.00787 Premio 0.156723 0.022980 6.820 1.51e-10 Accounts_Lancadas 0.136413 0.085459 1.596 0.11228 Analista_A -0.689076 0.384991 -1.790 0.07525 Tempo_Medio -0.025190 0.009086 -2.772 0.00618 Residual standard error: 1.12 Multiple R-squared: 0.64 Adjusted R-squared: 0.62 F-statistic: 30.62 (p-value: < 2.2e-16)
As variáveis Accounts_Lancadas e Analista_A não são significativas a um nível
de 5% e por isso um novo modelo foi gerado sem as mesmas. A Tabela 4.5 indica o
resultado da regressão feita com as 8 variáveis restantes:
Tabela 4.5 Modelo Leaps Refinado Variables Estimate Std. Err. t p-value Intercept 7.641765 0.777679 9.826 < 2e-16 Start_Date 0.165407 0.031495 5.252 4.38e-07 Broker -0.497423 0.201765 -2.465 0.01466 ER_PQ 0.759280 0.184139 4.123 5.79e-05 Participacao -1.685163 0.281091 -5.995 1.15e-08 Capacidade_Max 0.320021 0.039659 8.069 1.14e-13 COB 0.110764 0.039129 2.831 0.00519 Premio 0.169449 0.020931 8.096 9.74e-14 Tempo_Medio -0.022822 0.008904 -2.563 0.01123 Residual standard error: 1.14 Multiple R-squared: 0.63 Adjusted R-squared: 0.61 F-statistic: 36.64 (p-value: < 2.2e-16)
Todas as variáveis são significativas a um nível de 5%, o erro padrão possui um
valor de 1,14; o 𝑟2possui um valor de 0,63; o 𝑟2-ajustado possui um valor de 0,61 e
modelo se mostrou significantemente adequado. A utilzação do pacote GVLMA
mostrou que esse modelo cumpre todos os pressupostos e por isso pode ser validado,
conforme as informações da Tabela 4.6:
48
Tabela 4.6 GVLMA Value p-value Decision
Global Stat 6.7038 0.15240 Assumptions acceptable. Skewness 1.1016 0.29392 Assumptions acceptable. Kurtosis 0.4433 0.50554 Assumptions acceptable. Link Function 3.7980 0.05132 Assumptions acceptable. Heteroscedasticity 1.3609 0.24338 Assumptions acceptable.
Finalmente a Figura 4.6 mostra as curvas do EPI real (valores transformados) e
dos valores previstos pelo modelo final.
Figura 4.6. EPI vs Valores Previstos – Modelo Final
4.3 INTERPRETAÇÃO DAS VARIÁVEIS DO MODELO FINAL
A interpretação das variáveis independentes de um modelo de regressão é uma
etapa necessária a compreensão de sua relação com a variável dependente EPI
transformada, assim é necessário realizar um passo de conversão das variáveis
transformadas para os seus valores originais. A Tabela 4.7 resume essa etapa
quantitativa e em seguida uma análise qualitativa das mesmas será feita:
Tabela 4.7 Interpretação
Variável ID Coeficiente Transformação Resultado
Mês de início Start_Date 0,165407 𝑌 = 𝑒0,165407 1,18
Existência de
Corretora Broker -0,497423 𝑌 = 𝑒−0,4974237 0,61
Tipo de Contrato
Proporcional ER_QP 0,759280 𝑌 = 𝑒0,759280 2,14
49
Participação da
Resseguradora Participacao -1,685163 𝑌 = 𝑒−1,685163 0,18
Divisão do Ramo COB 0,110764 𝑌 = 𝑒0,110764 1,12
Capacidade
Máxima de
Resseguro
Capacidade_Max 0,320021 𝑌 = 𝑒ln(1,1)×0,320021 1,03
Prêmio Performado Premio 0,169449 𝑌 = 𝑒ln(1,1)×0,169449 1,02
Tempo Médio de
Lançamento Tempo_Medio -0.022822 𝑌 = 𝑒−0.022822 0,98
Mês de início (Start_Date): Um aumento de uma unidade nessa variável,
impacta no aumento médio de 18% no EPI.
Existência de Corretora (Broker): Um aumento de uma unidade nessa variável,
impacta na diminuição média de 39% no EPI.
Tipo de Contrato Proporcional (ER_QP): Um aumento de uma unidade nessa
variável, impacta no aumento médio de 114% no EPI.
Participação da Resseguradora (Participacao): Um aumento de uma unidade
nessa variável, impacta na diminuição média de 82% no EPI.
Divisão do Ramo (COB): Um aumento de uma unidade nessa variável, impacta
no aumento médio de 12% no EPI.
Capacidade Máxima de Resseguro (Capacidade_Max): Um aumento de 10%
nessa variável, impacta no aumento médio de 3% no EPI.
Prêmio Performado (Premio): Um aumento de 10% nessa variável, impacta no
aumento médio de 2% no EPI.
Tempo Médio de Lançamento (Tempo_Medio): Um aumento de uma unidade
nessa variável, impacta na diminuição média de 2% no EPI.
Qualitativamente pode-se inferir que o tipo de contrato analisado é um dos
principais fatores para o aumento do EPI. Caso o contrato seja do tipo excedente de
responsabilidade existem maiores chances para um maior lucro. De acordo com Riley
(2009), algumas companhias de seguro se recusam até mesmo a considerar um contrato
de quota-parte, acreditando que estarão cedendo seu negócio mais rentável, fato que
corrobora o resultado do estudo.
Pode-se observar também que a maior parte dos contratos onde o EPI foi maior,
a participação da resseguradora foi menor. Uma possibilidade para este fato é que as
seguradoras tendem a minimizar os riscos de seus contratos com maior volume
50
financeiro em mais resseguradoras. Assim, caso ocorra um sinistro de grandes
proporções, o risco de uma resseguradora descumprir com o seu dever de pagadora
diminui consideravelmente. Outro fato a mencionar é a competitividade do mercado
brasileiro de resseguros o qual torna mais difícil uma resseguradora participar
unicamente no contrato.
No caso de haver uma corretora intermediando o contrato, o EPI também tende a
ser menor. Apesar de ser considerado um facilitador para a seguradora e resseguradora,
comprovou-se que a relação nem sempre é benéfica para o resultado.
A análise da variável “Mês de início” mostra que os contratos iniciados em
dezembro foram aqueles que obtiveram, em média, maior EPI, indicando uma positiva
melhora no desempenho da empresa para o ano do estudo. Além disso, pode-se dizer
que os contratos analisados pela empresa possuem grandes chances de bons resultados
visto que o prêmio performado está alinhado com as expectativas.
Em relação a divisão do ramo, é importante ressaltar que a seguradora e
resseguradora recorrem a maneiras de administrar melhor os riscos, seja por causa da
quantidade ou volume dos possíveis sinistros. Portanto, para contratos com EPIs
maiores, uma divisão mais específica do ramo é comumente usada. Ocorre também que
a complexidade desses contratos pode levar a um tempo mais elevado para o cadastro da
prestação no sistema, impactando também no resultado.
A capacidade máxima da resseguradora tende a aumentar de acordo com o EPI.
Isso reflete na possibilidade de ocorrer maiores sinistros e ao assumir maiores riscos, os
prêmios também são maiores.
51
5 CONCLUSÃO
No começo do estudo foram levantadas diversas características do resseguro e a
forma como o IRB Brasil Re posiciona-se neste mercado, através de pesquisas na
literatura. De maneira a garantir sua posição líder no mercado, a gerência de contas
técnicas tornou-se papel fundamental no crescimento da empresa devido principalmente
ao acompanhamento e análise de contratos proporcionais.
A fim de compreender a afirmativa anterior, seria possível descobrir, a partir de
dados históricos, quais características desses contratos seriam as mais relevantes para o
processo. Para isso, foram apresentadas as características mais importantes dos
contratos proporcionais e determinar um modelo estatístico através da regressão linear
múltipla.
Portanto, foram coletados os dados referentes as características consideradas
mais importantes e analisadas as relações das variáveis independentes com a variável
dependente EPI, aspecto de vital importância para um sucesso do contrato. O software
R auxiliou no cálculo do modelo demonstrando a eficiência do modelo. A partir disso, a
análise dos resultados orientou os estudos para um modelo mais conciso, o qual
abrangisse um número menor de variáveis para uma tomada de decisão mais rápida.
Também, verificou-se que o modelo possui grande aceitabilidade caso novos dados
fossem incluídos.
No começo do estudo foi indagado se era possível averiguar por meio de um
modelo matemático e dados históricos, o sucesso de um contrato proporcional. Além
disso, questionou-se se haveria a possibilidade de identificar quais características dos
contratos proporcionais seriam mais críticas para o processo. Portanto, o objetivo geral
do estudo foi alcançado, pois foram identificados a forma como as características
principais dos contratos proporcionais impactam o resultado. Além disso, foram
estabelecidos quais elementos deverão ter maior importância em uma tomada de decisão
para novos contratos.
A empresa deverá se atentar em diversos aspectos dos contratos proporcionais,
porém é possível a detecção daqueles que irão apontar para um resultado melhor,
através de um levantamento dos dados registrados. O estudo abrangiu apenas os
52
contratos com o ano de vigência de 2015 e uma análise mais profunda poderá atingir
resultados ainda mais expressivos.
Nesse contexto, o estudo indica a gerência de contas técnicas quais contratos
deverão possuir um acompanhamento mais detalhado para que os resultados atinjam o
esperado. Como apontado anteriormente, os contratos de excedente de responsabilidade
indicaram a maior influência no EPI e, por isso, devem ser tratados mais
individualmente, seja por um profissional mais especializado nesse determinado assunto
ou outra medida como uma divisão maior do ramo.
A gerência também precisa se preocupar com a velocidade do serviço
performado pelos analistas e o que pode impactar na demora do cadastramento no
sistema. Esse fator ainda precisa estar alinhado com outras características como a
divisão do ramo
O estudo aponta também a possibilidade do sucesso nos contratos de resseguro,
indicando se o resultado irá melhorar conforme o mês de vigência e a diferença entre o
performado e o estimado.
Portanto, nota-se que os benefícios de um aprimoramento desse estudo pode
demonstrar importantes resultados para a empresa, seja no acompanhamento dos
contratos, na subscrição de novos contratos ou melhoria do desempenho.
53
6 REFERÊNCIAS BIBLIOGRÁFICAS
ALVIM, Pedro. O contrato de seguro. 3ª ed.. Rio de Janeiro: Forense, 1999
CAMELO, Joice Bier, Contrato de resseguro, Pontifícia Universidade Católica do Rio
Grande do Sul, 2006
DELGADO, José Augusto. Comentários ao novo código civil, volume XI, tomo 1: das
várias espécies de contrato, do seguro. Rio de Janeiro: Forense, 2004.
DOANE, D.; Seward, L. Applied Statistics in Business and Economics. 3rd Edition.
Mcgraw-Hill/Irwin Series, Operations and Decision Sciences. 2010
FÁVERO, L. P.; BELFIORE, P.; SILVA, F. L.; CHAN, B. Análise de Dados:
Modelagem Multivariada para Tomada de Decisões. CAMPUS, 2009.
GUJARATI, D.N. Econometria básica. São Paulo: Makron Books, 2000
HAIR, J. F.; BLACK, W. C.; BABIN, B. J.; ANDERSON, R. E.; TATHAM, R. L.
Análise Multivariada de Dados. BOOKMAN, 2009.
IRB Re Brasil (Instituto Brasileiro de Resseguros) <https://www.irbbrasilre.com/>
Acessado em 10/05/2016.
LEVINE, D. M.; STEPHAN, D. F.; KREHBIEL, T. C.; BERENSON, M. L. Estatística
- Teoria e Aplicações - Usando Microsoft Excel. LTC, 2012.
MANICA, Lais O contrato de seguro de vida, Universidade Federal do Rio Grande do
Sul, 2010.
PEREIRA, V (2015). Notas de aula (UFF – Estatística Multivariada): Estatística
Multivariada (SPSS) - 07 - Regressão Linear Múltipla. DOI: 10.13140 /
RG.2.1.2492.1685 <https : / / www. researchgate . net / publication / 287198885 _
Estatistica_Multivariada_SPSS_-_07_-_Regressao_Linear_Multipla >.Acessado em
16/06/2016.
PIZA, Paulo Luiz de Toledo. Tendências em matéria de resseguro – caso e ocaso
brasileiro. Revista Brasileira de Direito de Seguros. São Paulo, v.3, n.9, p 14-21,
maio/ago. 2000
RILEY, Keith O quebra-cabeça do resseguro. Rio de Janeiro: Funenseg, 2009
54
RIOS, Vivian Tristão O resseguro no Brasil, Rio de Janeiro: Pontifícia Católica do Rio
de Janeiro, 2005
TILGER, Fernando Elaborando um programa de resseguro, Revista Brasileira de Risco
e Seguro, Rio de Janeiro, 2009
ANEXOS
56
Dados transformados – Parte 1.
ln_(EPI) Start_Date Broker ER_PQ Participacao Perc_QP ln(Capacidade_Max) COB Moedas
16,192414 1 0 1 0,15 0,5 17,727534 2 2
16,4182 1 0 1 0,1 0,2 17,216708 5 3
14,978661 1 0 0 0,1 0 19,25272 1 3
16,785925 1 0 0 0,1 0 19,413933 2 3
15,520259 1 0 0 0,1 0 18,603002 2 3
13,527828 1 1 1 0,4 0,65 14,771022 2 1
14,220976 1 1 0 0,05 0 17,216708 4 1
9,680344 4 0 0 1 0 10,341759 1 1
14,151983 7 0 0 1 0 11,512975 2 1
16,482739 1 0 0 0,07 0 19,008467 1 3
10,20559 9 0 1 1 0,5 9,9034876 1 1
9,4862282 9 0 0 1 0 11,891362 1 1
16,618871 1 1 0 0,15 0 18,683045 6 1
13,429427 2 0 0 1 0 16,118096 2 1
11,46175 2 0 0 1 0 16,118096 2 1
13,211681 2 0 0 1 0 13,592368 3 1
15,789592 1 1 1 0,4 0,6 17,686712 6 2
14,914123 11 0 0 1 0 16,118096 5 1
12,324389 1 0 1 1 0,2 10,126631 1 1
13,072164 1 0 0 1 0 14,133964 1 1
11,275937 1 0 1 1 0,2 12,323856 1 1
13,439798 1 0 0 1 0 18,409367 1 1
14,448908 8 0 0 0,2 0 16,118096 3 1
10,85769 9 0 1 1 0,5 9,6158055 1 1
10,44462 1 0 0 1 0 12,429216 1 1
11,338572 1 0 0 1 0 14,690981 2 1
9,8428794 1 0 0 1 0 10,404263 1 1
12,721886 8 0 0 1 0 14,914123 3 1
15,464169 1 1 1 0,305 0,4 18,197537 1 1
15,201805 4 1 1 0,325 0,4 18,420681 1 1
14,978661 3 1 1 0,4 0,4 15,201805 3 2
16,235879 2 0 1 0,1 0,25 15,137266 6 2
14,797746 5 1 0 0,3 0 18,890684 3 1
13,997832 9 0 0 1 0 15,424948 6 1
14,508658 4 1 1 0,05 0,4 15,894952 5 1
13,903521 3 1 1 0,3 0,3 16,012735 1 2
16,225334 4 1 1 0,18 0,4 16,118096 3 2
16,064506 5 1 0 0,4 0 18,603002 2 2
13,527828 4 1 0 0,35 0 17,727534 3 1
12,429216 1 0 0 1 0 16,118096 2 1
57
15,442297 4 1 1 0,35 0,55 18,515991 3 1
15,063832 1 0 0 1 0 16,47577 5 1
10,509334 1 0 0 1 0 15,70258 2 1
12,280963 1 0 0 1 0 16,47577 2 1
12,794153 1 0 0 1 0 16,549878 2 1
15,236206 2 1 1 1 0,92 19,25359 6 3
15,520259 1 0 0 0,05 0 16,811243 6 1
14,52846 4 1 1 0,45 0,8 16,588099 2 1
15,566101 4 1 0 0,32 0 18,845948 1 1
14,696245 4 1 1 0,285 0,65 16,38046 1 2
16,860033 4 1 1 0,15 0,7 18,064006 5 2
12,270103 1 1 1 1 0,5 15,068274 1 1
15,89994 4 0 1 0,4 0,4 18,197537 8 2
15,026384 10 0 0 1 0 16,118096 5 1
14,608503 4 0 1 0,15 0,85 16,17872 6 2
14,84513 4 0 1 0,2 0,8 18,197537 1 1
16,023785 4 0 0 0,8 0 18,064034 1 2
16,161155 4 0 1 0,4 0,4 16,300417 1 2
11,512925 4 0 0 0,8 0 17,50444 3 2
15,581952 4 0 1 0,5 0,325 16,785925 3 1
14,220976 4 0 1 0,8 0,5 17,216708 2 2
14,689429 4 1 0 0,5 0 16,705882 6 2
13,142643 3 1 1 0,5 0,5 14,731801 1 1
14,318707 1 0 0 1 0 16,118096 3 1
15,068274 4 1 1 0,5 0,7 18,064006 1 1
14,914123 1 0 1 1 0,95 16,066802 3 1
15,156808 6 1 1 0,5 0,956 18,558005 3 1
15,911674 1 0 1 1 0,1 15,424948 1 1
16,399935 6 1 1 0,4 0,975 20,004801 2 2
13,985555 1 0 1 1 0,1 13,122363 1 1
12,351363 1 0 1 1 0,7 13,928839 1 1
12,784188 5 0 0 1 0 13,815511 1 1
15,123843 6 0 0 1 0 16,118096 6 1
13,235692 1 0 1 1 0,07 12,860999 1 1
15,830414 1 1 0 1 0 15,894952 6 1
14,508658 12 1 0 0,2 0 16,118096 2 1
16,160137 7 0 1 0,35 0,11 13,217674 3 1
15,810336 6 0 1 0,35 0,2 12,206073 2 2
15,031906 1 1 0 1 0 16,118096 3 1
15,424948 6 0 1 0,61 0,25 15,830414 7 2
17,867296 6 0 0 0,61 0 19,413933 7 2
15,538277 7 1 0 0,075 0 18,092177 7 1
13,20396 7 0 0 1 0 13,384728 1 1
13,527828 4 1 0 0,6 0 14,508658 5 1
12,128111 7 0 1 1 0,1 10,008848 5 1
58
12,409013 7 0 0 1 0 15,424948 5 1
15,778129 8 1 0 0,475 0 18,826146 11 2
14,517355 4 0 1 1 0,995 18,415668 1 2
13,791603 4 0 1 1 0,99 17,206658 1 2
13,413953 7 0 0 1 0 15,181602 2 1
15,214227 7 0 1 0,75 0,9 16,705882 1 1
15,358809 7 0 1 0,75 0,9 16,705882 1 1
16,922768 7 0 1 0,75 0,6666667 14,79634 2 1
16,084193 7 0 1 0,75 0,6666667 14,79634 1 1
17,265636 7 0 1 0,75 0,15 12,611538 2 1
13,458836 8 0 0 0,72 0 16,811243 9 2
17,88569 4 1 1 0,4 0,95 14,457364 1 1
14,611786 5 1 1 0,4 0,15 15,319588 2 2
15,137266 8 0 1 0,105 0,15 13,304685 3 2
13,652992 10 0 0 0,8 0 17,370859 1 2
15,039286 8 0 1 0,05 0,2 14,151983 3 1
13,122363 7 0 1 0,14 0,5 14,508658 3 2
15,250595 8 0 1 0,25 0,2 17,216708 3 1
17,910443 9 1 0 0,42 0 17,909855 6 1
18,005165 1 0 1 0,4 0,995 20,718253 3 2
12,89922 4 0 1 0,05 0,8 18,197537 1 1
14,914123 9 0 1 0,78 0,3 14,220976 3 1
15,250595 9 0 0 0,78 0 17,370859 3 1
10,596635 9 0 0 1 0 15,424948 6 1
13,458836 11 1 0 0,1 0 15,894952 1 1
12,611538 11 1 1 0,1 0,5 13,815511 1 1
15,308415 10 0 0 0,65 0 16,38046 3 1
16,001562 10 0 1 0,65 0,1 12,206073 3 1
12,611538 10 0 0 0,6 0 18,603002 1 1
14,220976 10 0 1 0,6 0,3 16,993564 1 1
14,631473 10 1 1 0,25 0,7 16,860033 1 2
15,943742 10 1 1 0,5 0,7 18,534009 3 1
16,213406 12 1 0 0,2 0 16,75995 5 2
10,819778 4 1 0 0,5 0 15,424948 6 1
15,830414 11 1 1 0,45 0,25 18,287149 1 1
15,830414 12 1 0 0,2 0 13,151938 1 1
13,384728 11 0 1 0,1 0,1 11,512925 2 2
14,522067 11 0 0 1 0 19,062535 4 1
11,338572 11 0 0 1 0 17,147715 2 1
12,881438 4 1 1 0,28 0,95 19,427178 1 1
15,026856 4 1 1 0,28 0,95 19,139496 1 2
10,28941 1 0 0 1 0 10,819778 1 1
11,661345 7 0 1 1 0,15 11,407565 1 1
16,549878 1 0 1 0,405 0,7 15,250595 1 1
14,888805 1 0 1 0,05 0,9 16,012735 2 2
59
14,841654 1 1 0 0,5 0 18,515991 3 1
13,978721 1 1 1 0,5 0,3 14,914123 4 1
15,137266 1 1 1 0,2 0,1 14,508658 11 1
10,819778 3 0 1 1 0,5 11,198215 2 1
10,819778 3 0 0 1 0 16,118099 3 1
15,486984 1 0 1 0,5 0,95 17,858562 1 1
16,332902 9 0 0 1 0 16,118096 5 1
13,774689 9 1 0 0,4 0 17,909855 1 2
13,854731 9 1 1 0,4 0,9 14,808762 1 2
15,65606 1 0 1 0,5 0,9 18,720785 2 2
8,5865793 2 0 0 1 0 9,2103404 1 1
14,847314 1 1 0 0,15 0 19,335771 1 2
15,761035 1 0 1 0,0188 0,25 16,436549 8 2
13,575967 1 0 1 0,5 0,3 14,220976 3 1
13,424996 1 0 0 0,5 0 16,811243 3 1
15,869294 6 0 1 0,4 0,81 17,005987 2 1
13,794811 3 1 0 0,5 0 17,622173 1 1
11,512925 1 0 0 1 0 16,395727 1 1
13,815511 1 0 1 1 0,85 15,645422 1 1
14,876767 1 1 0 0,2 0 18,683045 6 1
14,691527 4 1 1 0,06 0,25 14,731801 2 2
11,570845 2 0 0 1 0 16,118096 2 1
14,135677 9 0 0 1 0 16,118098 5 1
15,789592 3 0 1 0,5 0,4 14,285514 2 1
15,214227 7 0 1 0,2 0,9 18,20996 1 1
15,334428 7 1 1 0,34 0,8 15,894952 2 2
14,363679 7 0 0 0,75 0 16,012735 7 1
16,930225 7 0 1 0,75 0,1 12,611538 7 1
14,961611 7 0 0 0,5 0 15,894952 3 2
16,036508 7 0 1 0,5 0,675 14,115615 3 2
15,520259 7 1 1 1 0,7999 18,197412 7 1
13,910821 7 1 1 1 0,7999 18,197412 6 1
14,880221 7 1 0 0,7999 0 19,902285 6 1
16,496532 7 1 1 1 0,7999 16,993439 2 1
14,690979 7 1 0 0,7999 0 18,75716 2 1
16,231424 7 1 1 1 0,7999 19,80685 4 2
11,589887 7 1 1 1 0,7999 15,20168 1 1
13,304685 7 1 1 1 0,7999 17,504265 1 1
15,586472 9 0 1 0,4 0,45 16,130518 2 1
14,247943 2 1 1 0,05 0,85 14,569282 1 2
13,982932 5 1 0 0,2 0 15,262435 1 1
14,631913 5 1 1 0,2 0,2 11,918391 1 1
13,815511 9 1 1 0,35 0,4 16,300417 3 2
12,942949 4 0 1 1 0,5 11,736069 1 1
13,822555 9 1 0 0,2 0 17,189679 2 1
60
12,948522 9 1 1 0,2 0,15 11,695247 2 1
14,115615 9 1 1 0,3 0,3 15,319588 14 1
14,731801 9 1 0 0,275 0 18,826146 6 2
14,962913 9 1 1 0,275 0,3 17,216708 6 2
11,512925 4 0 0 1 0 13,122363 1 1
16,295843 11 0 1 0,125 0,55 17,129697 3 2
12,799399 5 0 1 0,8 0,99 14,621267 1 1
Dados transformados – Parte 2.
ln(Premio + 1)
Accounts_Lancadas Contas_Atrasadas Analista_A Analista_B Analista_C Analista_D Analista_E Tempo_Medio
14,78578776 1 1 0 0 0 1 0 31
13,67888078 3 0 0 0 0 0 1 29
13,11335512 2 0 0 0 0 0 1 29
13,90681341 2 0 0 0 0 0 1 29
11,79040818 2 0 0 0 0 0 1 29
11,74962567 6 1 0 0 0 1 0 26
10,81237192 3 0 0 0 0 0 0 19
9,325007447 3 0 0 0 0 0 1 8
13,55428924 2 0 0 0 0 0 1 24
12,23684038 3 0 0 0 0 0 1 29
0 1 0 0 0 0 0 1 32
7,771459249 1 0 0 0 0 0 1 32
14,18497929 4 0 0 0 0 0 0 43
12,7261642 5 0 0 0 0 0 1 28
11,29599395 3 0 0 0 0 0 1 32
12,92971855 3 0 0 0 0 0 1 27
14,48988676 3 0 0 0 0 0 0 16
0 0 0 0 0 0 0 1 0
11,37312498 2 1 0 0 0 1 0 17
12,31365512 2 1 0 0 0 1 0 17
11,23489374 3 1 0 0 0 1 0 32
12,47920811 3 1 0 0 0 1 0 32
0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 1 0
9,890938643 4 1 0 0 0 1 0 33
10,70729961 4 1 0 0 0 1 0 33
9,559063685 4 1 0 0 0 1 0 33
11,81998081 1 1 0 1 0 0 0 38
13,22995663 3 0 0 0 0 0 0 16
13,0614368 4 0 0 0 0 0 1 19
13,11916924 3 0 0 0 0 0 1 8
61
12,56746984 4 0 1 0 0 0 0 23
9,487268831 1 1 0 0 0 0 1 3
0 0 0 0 0 0 1 0 0
10,26874714 2 1 0 0 0 0 1 29
12,1392636 3 0 0 0 0 0 0 24
14,00982683 3 0 0 0 0 1 0 7
13,38676954 1 1 0 0 0 1 0 9
0 3 0 0 0 0 0 1 37
11,59775399 2 1 0 0 0 1 0 28
12,97443263 4 1 0 0 0 0 1 38
14,49915794 2 1 0 0 0 1 0 28
10,27306984 2 1 0 0 0 1 0 28
11,42093089 2 1 0 0 0 1 0 28
12,73996439 2 1 0 0 0 1 0 28
14,33781075 3 0 0 0 0 1 0 5
0 4 0 0 0 0 0 1 10
12,18915286 3 1 0 0 0 0 1 8
13,0411371 2 1 0 0 0 1 0 8
13,20080819 4 1 0 0 0 0 1 14
13,92972774 6 0 0 0 0 0 1 30
13,60360822 4 0 1 0 0 0 0 17
15,09686121 2 1 0 1 0 0 0 19
0 0 0 0 1 0 0 0 0
11,20820927 3 0 0 1 0 0 0 38
10,37806415 2 1 0 1 0 0 0 18
14,61493005 4 1 0 1 0 0 0 18
14,59857808 4 1 0 1 0 0 0 18
6,201117508 2 1 0 1 0 0 0 26
14,56046196 2 1 0 1 0 0 0 25
11,12838309 2 1 0 1 0 0 0 18
11,56738534 2 1 0 0 0 1 0 17
11,67521309 5 0 0 0 0 1 0 4
13,644836 3 1 0 0 0 1 0 24
11,83594519 2 0 0 0 0 1 0 2
14,09545909 3 1 0 0 0 1 0 32
11,73723953 2 0 0 0 0 1 0 18
14,302437 5 1 0 0 0 1 0 16
15,23975888 4 0 0 0 0 0 1 8
13,00478612 3 1 0 0 0 1 0 30
11,16175293 2 1 0 0 0 1 0 28
0 0 1 0 1 0 0 0 0
14,37211028 4 0 0 0 0 1 0 15
12,07674708 6 1 0 0 0 0 1 23
15,63529837 4 1 0 0 0 0 1 14
0 0 0 0 0 0 0 1 0
62
13,18249702 1 1 0 0 0 0 1 2
13,05515709 2 0 0 0 0 1 0 19
14,83093661 4 0 0 0 0 0 1 17
14,71372437 2 0 0 0 0 0 1 34
17,21284408 2 0 0 0 0 0 1 34
12,19923235 1 0 0 0 0 0 0 6
12,0999261 2 0 0 1 0 0 0 33
12,93977294 2 1 0 0 0 0 1 19
12,45675603 1 1 0 0 0 1 0 15
10,90156396 1 1 0 0 0 1 0 15
11,08933218 1 0 0 0 0 0 1 18
14,25973318 5 0 0 1 0 0 0 25
0 0 1 0 1 0 0 0 0
11,6170851 2 0 0 1 0 0 0 43
0 0 0 0 0 0 0 1 0
13,72278562 1 1 0 0 0 0 1 4
16,91589216 4 0 0 0 0 0 1 21
14,2180185 2 1 0 0 0 0 1 4
16,43145098 4 0 0 0 0 0 1 27
10,56839908 2 0 0 0 0 0 1 18
15,82504455 6 0 0 0 0 1 0 17
11,98504024 1 1 0 0 0 1 0 2
11,93856875 2 0 1 0 0 0 0 43
0 0 0 0 0 0 0 1 0
9,544622355 1 0 1 0 0 0 0 35
0 0 0 0 0 1 0 0 0
11,58506081 1 0 1 0 0 0 0 35
15,59483209 1 0 0 0 0 0 0 24
16,0034216 5 0 0 0 0 0 1 5
0 0 1 0 1 0 0 0 0
12,94808008 1 0 0 0 0 0 1 13
12,9664791 1 0 0 0 0 0 1 13
0 0 0 0 0 0 1 0 0
0 0 0 1 0 0 0 0 0
0 0 0 1 0 0 0 0 0
0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 1 0 0
0 0 0 0 0 0 1 0 0
0 0 0 0 0 0 0 0 0
0 0 1 0 1 0 0 0 0
0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0
63
0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 1 0
0 0 1 0 0 0 1 0 0
14,97475796 2 1 0 0 0 1 0 34
9,780526949 4 1 0 0 0 1 0 33
10,75965687 1 0 0 0 0 1 0 20
13,90945464 4 0 0 1 0 0 0 41
11,08224516 3 0 0 0 0 0 1 19
14,17749142 4 1 0 0 0 0 1 34
13,10242157 4 1 0 0 0 0 1 34
12,97560274 4 0 0 0 0 0 0 17
7,041787796 3 0 0 0 0 0 1 21
7,259791481 3 0 0 0 0 0 1 21
13,86491387 3 1 0 0 0 0 1 6
13,88191539 2 0 0 0 0 1 0 13
0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 1 0
14,42474775 5 1 0 0 0 0 1 53
8,586771492 1 0 0 0 0 0 1 7
12,3180029 5 0 0 1 0 0 0 20
13,31203807 3 1 0 0 0 0 0 29
12,80026003 5 0 0 0 0 0 1 19
12,46091163 5 0 0 0 0 0 1 19
14,70436801 6 0 0 1 0 0 0 45
11,97933834 3 0 0 0 0 1 0 8
0 0 1 0 0 0 1 0 0
0 0 1 0 0 0 1 0 0
11,64886725 3 1 0 0 0 0 0 29
9,748578418 2 1 0 0 0 0 1 16
11,26447346 3 0 0 0 0 1 0 30
0 0 0 0 0 0 1 0 0
13,63336891 3 0 0 0 0 0 1 16
4,807457755 1 1 0 0 0 0 1 9
0 0 0 0 0 0 1 0 0
6,104235041 2 1 0 0 0 0 1 40
15,11862088 2 0 0 0 0 0 1 41
12,8166285 3 0 0 0 0 0 1 21
14,4004415 3 0 0 0 0 0 1 21
10,06359247 1 1 0 0 0 0 0 12
9,002446206 1 1 0 0 0 0 0 12
0 0 0 0 0 0 0 0 0
12,63963899 1 1 0 0 0 0 0 12
8,242603702 1 1 0 0 0 0 0 12
10,37509458 1 1 0 0 0 0 0 12
64
8,407476535 1 1 0 0 0 0 0 12
0 0 0 0 0 0 0 0 0
0 0 0 0 0 1 0 0 0
0 0 1 0 0 0 1 0 0
10,78080063 2 0 1 0 0 0 0 8
12,01497576 2 0 1 0 0 0 0 8
0 0 0 0 0 0 0 1 0
0 0 1 0 0 0 0 0 0
8,874036521 1 0 1 0 0 0 0 4
5,926072328 1 0 1 0 0 0 0 4
0 0 0 0 0 0 0 0 0
0 1 0 0 0 0 1 0 2
0 1 0 0 0 0 1 0 5
0 0 1 0 0 0 0 0 0
0 0 0 0 0 1 0 0 0
13,02290426 1 0 0 0 0 0 1 6
65
CODES
par(mfrow = c(1,3))
plot(data$EPI, xlab = "Observations", ylab = "EPI")
boxplot(data$EPI, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab = "EPI") #Box
plot
hist(data$EPI, main = "", xlab = "EPI", ylab = "Frequency") # Histograma
plot(data$Premio, xlab = "Observations", ylab = "Premio")
boxplot(data$Premio, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab = "Premio")
hist(data$Premio, main = "", xlab = "Premio", ylab = "Frequency")
plot(data$Start_Date, xlab = "Observations", ylab = "Start_Date")
boxplot(data$Start_Date, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =
"Start_Date")
hist(data$Start_Date, main = "", xlab = "Start_Date", ylab = "Frequency")
plot(data$Broker, xlab = "Observations", ylab = "Broker")
boxplot(data$Broker, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab = "Broker")
hist(data$Broker, main = "", xlab = "Broker", ylab = "Frequency")
plot(data$ER_PQ, xlab = "Observations", ylab = "ER_PQ")
boxplot(data$ER_PQ, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab = "ER_PQ")
hist(data$ER_PQ, main = "", xlab = "ER_PQ", ylab = "Frequency")
plot(data$Participacao, xlab = "Observations", ylab = "Participacao")
boxplot(data$Participacao, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =
"Participacao,")
hist(data$Participacao, main = "", xlab = "Participacao", ylab = "Frequency")
plot(data$Perc_QP, xlab = "Observations", ylab = "Perc_QP")
boxplot(data$Perc_QP, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =
"Perc_QP")
hist(data$Perc_QP, main = "", xlab = "Perc_QP", ylab = "Frequency")
plot(data$Capacidade_Max, xlab = "Observations", ylab = "Capacidade_Max")
boxplot(data$Capacidade_Max, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =
"Capacidade_Max")
hist(data$Capacidade_Max, main = "", xlab = "Capacidade_Max", ylab = "Frequency")
plot(data$COB, xlab = "Observations", ylab = "COB")
boxplot(data$COB, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab = "COB")
hist(data$COB, main = "", xlab = "COB", ylab = "Frequency")
plot(data$Moedas, xlab = "Observations", ylab = "Moedas")
boxplot(data$Moedas, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =
"Moedas")
hist(data$Moedas, main = "", xlab = "Moedas", ylab = "Frequency")
plot(data$Balanco_Final, xlab = "Observations", ylab = "Balanco_Final")
boxplot(data$Balanco_Final, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =
"Balanco_Final")
hist(data$Balanco_Final, main = "", xlab = "Balanco_Final", ylab = "Frequency")
plot(data$Accounts_Lancadas, xlab = "Observations", ylab = "Accounts_Lancadas")
66
boxplot(data$Accounts_Lancadas, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab
= "Accounts_Lancadas")
hist(data$Accounts_Lancadas, main = "", xlab = "Accounts_Lancadas", ylab = "Frequency")
plot(data$Contas_Atrasadas, xlab = "Observations", ylab = "Contas_Atrasadas")
boxplot(data$Contas_Atrasadas, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =
"Contas_Atrasadas")
hist(data$Contas_Atrasadas, main = "", xlab = "Contas_Atrasadas", ylab = "Frequency")
plot(data$Analista, xlab = "Observations", ylab = "Analista")
boxplot(data$Analista, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =
"Analista")
hist(data$Analista, main = "", xlab = "Analista", ylab = "Frequency")
plot(data$Tempo_Medio, xlab = "Observations", ylab = "Tempo_Medio")
boxplot(data$Tempo_Medio, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =
"Tempo_Medio")
hist(data$Tempo_Medio, main = "", xlab = "Tempo_Medio", ylab = "Frequency")
library(corrplot)
corrplot(cor(data), method = "circle", tl.cex = 0.7, tl.offset = 0.5, mar = c(1,0,0,0), number.cex = 0.5, bg = "white",
addCoef.col = "black", diag = FALSE)
library (psych)
pval <- corr.test(cor(data), adjust="none")$p
corrplot(cor(data), method = "circle", tl.cex = 0.7, tl.offset = 0.5, mar = c(1,0,0,0), number.cex = 0.5, bg = "white",
addCoef.col = "black", diag = FALSE, p.mat = pval, sig.level = 0.05)
regression <- lm(EPI ~ ., data = data)
resid <- residuals(regression)
shapiro.test(resid)
qqPlot(regression, id.n = 3)
par( mar = c(5, 4.5, 4, 2) + 0.1)
sresid <- rstudent(regression)
hist(sresid, main = "Studentized Residuals", breaks = "FD", freq = FALSE)
curve(dnorm(x, mean = 0, sd = 1), col = "red", lwd = 2, add = TRUE)
library(car)
ncvTest(regression)
vif(regression)
library(gvlma)
gvmodel <- gvlma(regression)
summary(gvmodel)
predicted <- fitted(regression)
plot(data$EPI, type = "l", col = "red")
lines(predicted,col = "blue")
library(plotly)
plot_ly(data = data, y = EPI, name = "EPI", type = "line")
add_trace(y = predicted , name = "Predicted", type = "line")
library(leaps)
leaps <- regsubsets(EPI ~ ., data = data_out, nbest = 1, nvmax = 18)
plot(leaps, scale = "bic")