universidade federal fluminense escola de …app.uff.br/riuff/bitstream/1/2816/1/projeto final de...

66
UNIVERSIDADE FEDERAL FLUMINENSE ESCOLA DE ENGENHARIA GRADUAÇÃO EM ENGENHARIA DE PRODUÇÃO DANILO HENRIQUE DE OLIVEIRA RIBEIRO ANÁLISE ESTATÍSTICA DE CONTAS TÉCNICAS EM UMA EMPRESA DE RESSEGUROS ATRAVÉS DO SOFTWARE R NITERÓI-RJ 2016

Upload: hoangdan

Post on 20-Nov-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

UNIVERSIDADE FEDERAL FLUMINENSE

ESCOLA DE ENGENHARIA

GRADUAÇÃO EM ENGENHARIA DE PRODUÇÃO

DANILO HENRIQUE DE OLIVEIRA RIBEIRO

ANÁLISE ESTATÍSTICA DE CONTAS TÉCNICAS EM UMA EMPRESA DE

RESSEGUROS ATRAVÉS DO SOFTWARE R

NITERÓI-RJ

2016

2

3

DANILO HENRIQUE DE OLIVEIRA RIBEIRO

ANÁLISE ESTATÍSTICA DE CONTAS TÉCNICAS EM UMA EMPRESA DE

RESSEGUROS ATRAVÉS DO SOFTWARE R

Projeto final apresentado ao curso de

Graduação em Engenharia de Produção da

Universidade Federal Fluminense como

requisito parcial para a conclusão de curso.

Orientador: Prof. Dr. Valdecy Pereira

NITERÓI-RJ

2016

4

DANILO HENRIQUE DE OLIVEIRA RIBEIRO

ANÁLISE ESTATÍSTICA DE CONTAS TÉCNICAS EM UMA EMPRESA DE

RESSEGUROS ATRAVÉS DO SOFTWARE R

Projeto final apresentado ao curso de Graduação em Engenharia de Produção da

Universidade Federal Fluminense como requisito parcial para a conclusão de curso.

Aprovada em:

BANCA EXAMINADORA

_____________________________________________

Prof. Dr. Valdecy Pereira - Orientador

Universidade Federal Fluminense

____________________________________________

Prof. Dr. Carlos Francisco Simões Gomes

Universidade Federal Fluminense

____________________________________________

Prof. Dr. Helder Gomes Costa

Universidade Federal Fluminense

________

____________________________________________

Prof. Msc. Maria Helena Mello

Universidade Federal Fluminense

5

AGRADECIMENTOS

Agradeço aos meus pais por me incentivarem no caminho dos estudos e

seguir bons costumes de ética, educação e convivência.

Agradeço aos meus amigos por todo apoio nessa jornada e também pela

diversão durante todos os anos junto comigo.

Agradeço ao meu orientador Valdecy por me guiar, seja durante as aulas

quanto também no estudo aqui apresentado.

6

RESUMO

O presente trabalho analisa, através de um estudo de caso, os contratos proporcionais

em uma empresa de resseguro de forma a descobrir quais características são impactantes

para o melhor resultado da gestão do contrato. Com a coleta dos dados, foi elaborada

uma análise estatística pelo modelo de regressão linear múltipla afim de encontrar quais

variáveis possuem maior relação com o resultado final do contrato com o auxílio do

software estatísticos R.

Após a análise do modelo foram encontradas quais características estariam impactando

o balanço final de cada contrato. Além disso, foi descoberto qual o maior enfoque que a

empresa terá no gerenciamento do setor de contas técnicas.

Apesar do estudo apresentar bons resultados, foi delimitado a coleta para os contratos

com vigência do ano de 2015 e feita em um período fixo no ano. Visto o resultado e o

quanto pode ser benéfico a empresa esse estudo, vale ressaltar a abrangência desse

estudo para outros anos de vigência e também a constante coleta de dados para a

construção de um modelo mais completo da situação.

Palavras-chave: regressão linear múltipla, análise estatística, contratos proporcionais,

resseguro

7

ABSTRACT

This study analyzes, through a case study, the proportional reinsurance contracts in a

company in order to find out which features are affecting for the best result of contract

management. With data collection, statistical analysis by multiple linear regression

model was developed in order to find which variables have the greatest relationship

with the end result of the contract with the help of statistical software R.

After the analysis of the model were found which characteristics would be impacting

the bottom line of each contract. Moreover, it was discovered what the increased focus

that the company should have the management of technical accounts sector.

Although the study show good results, was delimited collection for contracts with 2015

year of force and made in a fixed period in the year. Since the result and how much can

be beneficial to the company this study, it is worth mentioning the scope of this study to

other years of operation and also the constant collection of data to build a more

complete model of the situation.

Key-words: multiple linear regression, statistical analysis, proportional treaties,

reinsurance

8

LISTA DE FIGURAS

Figura 2.1 – Variância, p.22

Figura 3.1 – Variável Start_Date, p.28

Figura 3.2 – Variável Broker, p.29

Figura 3.3 – Variável ER_QP, p.29

Figura 3.4 – Variável EPI, p.30

Figura 3.5 – Variável ln (EPI) , p.30

Figura 3.6 – Variável Participacao, p.31

Figura 3.7 – Variável Perc_QP, p.31

Figura 3.8 – Variável Capacidade_Max, p.32

Figura 3.9 – Variável ln (Capacidade_Max), p.32

Figura 3.10 – Variável COB, p.33

Figura 3.11 – Variável Moedas, p.33

Figura 3.12 – Variável Premio, p.34

Figura 3.13 – Variável ln (Premio+1), p.34

Figura 3.14 – Variável Contas_Atrasadas, p.35

Figura 3.15 – Variável Accounts_Lancadas, p.35

Figura 3.16 – Variável Analista, p.36

Figura 3.17 – Variável Tempo_Medio, p.36

Figura 3.18 – Correlações, p.37

Figura 3.19 – Significância das correlações, p.38

Figura 4.1 – Distribuição dos resíduos, p.40

Figura 4.2 – QQ Plot, p.41

Figura 4.3 – Resíduos Studentizados vs. Valores Previstos, p.41

Figura 4.4 – EPI vs. Valores Previstos, p.43

9

Figura 4.5 – Leans, p.43

Figura 4.6 – EPI vs. Valores Previstos – Modelo Final, p.45

10

LISTA DE TABELAS

Tabela 3.1 – Definições das variáveis, p.26

Tabela 4.1 – Estatísticas descritivas do modelo, p.39

Tabela 4.2 – VIF, p.42

Tabela 4.3 – GVLMA, p.42

Tabela 4.4 – Modelo Leaps, p.43

Tabela 4.5 – Modelo Leaps Refinado, p.44

Tabela 4.6 – GVLMA, p.45

Tabela 4.7 – Interpretação, p.46

11

LISTA DE ABREVIATURAS, SIGLAS E SÍMBOLOS

EPI – Estimate Premium Income

FUNENSEG – Escola Nacional de Seguros

GVLMA - Global Validation of Linear Model Assumptions

SSE – Error Sum of Squares

SSR – Regression Sum of Squares

SST – Total Sum of Squares

SUSEP – Superintendência de seguros privados

VIF – Variance Inflator Factor

12

SUMÁRIO

1.INTRODUÇÃO..........................................................................................................12

1.1O RESSEGURO.........................................................................................................12

1.2 O PROBLEMA E A HIPÓTESE DA PESQUISA...................................................14

1.3 OBJETIVOS DA PESQUISA...................................................................................14

1.4 DELIMITAÇÃO DA PESQUISA.............................................................................14

1.5 ESTRUTURA DO TRABALHO..............................................................................15

2. REFERENCIAL TEÓRICO....................................................................................16

2.1 O RESSEGURO........................................................................................................16

2.1 CONTRATOS DE RESSEGURO.............................................................................16

2.1.1 CONTRATOS PROPORCIONAIS DE RESSEGURO.........................................17

2.2 REGRESSÃO LINEAR MÚLTIPLA.......................................................................18

2.3 PRESSUPOSTOS DA REGRESSÃO LINEAR MÚLTIPLA –

COLINEARIDADE,........................................................................................................23

2.4 VALIDAÇÃO DOS RESÍDUOS..............................................................................24

2.5 PODER DE PREDIÇÃO DO MODELO E SELEÇÃO DE VARIÁVEIS

INDEPENDENTES.........................................................................................................25

3. METODOLOGIA......................................................................................................26

3.1 POPULAÇÃO E AMOSTRA...................................................................................26

3.2 COLETA DE DADOS..............................................................................................26

3.3 TRATAMENTO E ANÁLISE DE DADOS.............................................................26

3.4 DELIMITAÇÕES DO ESTUDO..............................................................................37

4. REGRESSÃO LINEAR MÚLTIPLA....................................................................38

4.1 ANÁLISE ESTATÍSTICA DOS DADOS................................................................38

4.2 SELEÇÃO DE UM MODELO PARCIMONIOSO..................................................42

4.3 INTERPRETAÇÃO DAS VARIÁVEIS DO MODELO FINAL.............................44

5. CONCLUSÃO............................................................................................................47

6. REFERÊNCIAS BIBLIOGRÁFICAS....................................................................49

13

ANEXOS........................................................................................................................50

14

1. INTRODUÇÃO

No presente capítulo é abordado o contexto da pesquisa, o objetivo geral e os

objetivos específicos, bem como a delimitação da pesquisa.

Na Seção 1.1 são apresentadas as características principais do seguro e do

resseguro, além de situar a empresa IRB Brasil Re e a gerência de contas técnicas nesse

ramo.

Na Seção 1.2 é apresentada a pergunta e a hipótese levantada que fundamentam

a pesquisa desenvolvida pelo trabalho.

Na Seção 1.3 são apresentados o objetivo geral da pesquisa e os objetivos

específicos.

Na Seção 1.4 é apresentada a delimitação da pesquisa e finalmente o capítulo se

encerra com a Seção 1.5 que resume a estrutura do trabalho.

1.1 O ESTUDO DE CASO

Neste trabalho, tratar-se de um problema ocasionado em uma empresa de

resseguros, o IRB Brasil Re (Instituto Brasileiro de Resseguros), mais especificamente

na gerência de contas técnicas. O IRB Brasil Re é atualmente uma empresa privada

especializada em atender as demandas do mercado ressegurador brasileiro para todos os

riscos, como por exemplo: propriedades, financeiros, de petróleo e gás, rurais, vida,

engenharia, transportes e responsabilidade civil. (IRB, 2016)

A gerência de contas técnicas do IRB, objeto deste estudo, obteve papel

importante durante esses anos para o desenvolvimento da empresa. Sua

responsabilidade no contexto geral é a avaliação de contas técnicas referentes aos

contratos proporcionais através de prestações de contas, adiantamentos, alterações de

reservas e outras ações pontuais. Além das tarefas anteriormente mencionadas, a

necessidade de contato com parceiros de cada seguradora é imprescindível no cotidiano

dos colaboradores dessa área.

15

1.2 PROBLEMA E HIPÓTESE DA PESQUISA

Considerando a complexidade dos contratos proporcionais, pode-se indagar que:

Poder-se-á averiguar por meio de um modelo matemático e dados históricos, o

sucesso de um contrato proporcional?

E partindo do pressuposto:

Haveria a possibilidade de identificar quais características dos contratos

proporcionais seriam mais críticas para o processo?

1.3 OBJETIVOS DA PESQUISA

O estudo tem como objetivo geral entender como se comportam as variáveis que

impactam e quão são significantes nos contratos proporcionais gerenciados pela

empresa que é objeto de estudo, especificamente através da utilização da ferramenta

estatística, a Regressão Linear Múltipla, que poderá também prever o resultado

esperado de um contrato proporcional dadas as suas características.

1.4 DELIMITAÇÕES DA PESQUISA

Na coleta de dados, verificou-se delimitações frente a inúmeras características,

principalmente pela grande quantidade de variáveis e contratos analisados. Como foco

do estudo, foram analisados apenas os contratos proporcionais, pois se trata do foco da

gerência de contas técnicas. Assim, os contratos não proporcionais e os facultativos não

serão mencionados neste trabalho.

Foram coletados os dados dos contratos proporcionais mais atuais cadastrados

no sistema da empresa com período de vigência no ano de 2015. Apesar de mostrar a

maior quantidade de movimento pela gerência no próximo ano, alguns deles ainda

perpetuam e estabelecem o cotidiano dos analistas. Pelo mesmo fato de se tratar de

contratos recentes, alguns deles não apresentaram dados de balanço financeiro por causa

de seu cadastro atual mais o tempo máximo em que a seguradora tem para enviar a

prestação de contas, pois alguns terão novos dados a mudarem os parâmetros do

contrato.

Também o processo de coleta foi realizado de forma única durante o período de

janeiro e fevereiro de 2016. Este fato pode prejudicar as interpretações frente as

16

constantes mudanças dos valores apresentados durante o período de vigência dos

contratos.

1.5 ESTRUTURA DO TRABALHO

No Capítulo 1 é abordado o contexto da pesquisa, o objetivo geral e os objetivos

específicos, bem como a delimitação da pesquisa.

No Capítulo 2 é abordado o referencial teórico do estudo abrangendo os

contratos de resseguro e mais especificamente os contratos proporcionais

No Capítulo 3 apresenta-se os dados e sua natureza, a forma de coleta, o

tratamento dos dados e as delimitações do método.

No Capítulo 4 é relatada a metodologia desse trabalho, abordando todos os

dados coletados na pesquisa e o referencial teórico utilizado.

No Capítulo 5, o presente trabalho é concluído e são apresentados os pontos

conclusivos destacados, seguidos de recomendações para estudos futuros.

17

2 REFERENCIAL TEÓRICO

No presente capítulo é abordado o referencial teórico do estudo abrangendo os

contratos de resseguro e mais especificamente os contratos proporcionais.

Na seção 2.1 é apresentado as principais definições de seguro e resseguro e suas

características.

Na Seção 2.2 é apresentado os contratos de seguro e resseguro, e suas principais

características, além de demonstrar uma comparação entre os dois tipos de contrato.

Na Seção 2.2.1 é apresentado mais especificamente os contratos proporcionais

de resseguro, suas principais características e suas divisões.

Na Seção 2.3 é apresentado o modelo de regressão linear múltipla e os conceitos

envolvidos para a análise estatística.

2.1 O RESSEGURO

Alvim (1999) considera o seguro como a transferência do risco do segurado para

o segurador, o compartilhamento, entre muitos segurados, dos danos que deveriam ser

suportados por um deles.

O prêmio é a importância paga pelo segurado, ou estipulante, à seguradora para

que se tenha direito a receber indenização por danos decorrentes do risco identificado e

ocasionador do sinistro (DELGADO, 2004).

Manica (2010) conceitua o risco como o perigo a que está sujeito o interesse

segurado, em consequência do possível acontecimento de evento futuro, alheio à

vontade das partes. Portanto, o pagamento do prêmio está atrelado a uma eventual

probabilidade de ocorrência do risco.

Para Rios (2005), o resseguro é uma operação que visa à transferência de parte

ou mesmo de todo o risco assumido por uma companhia de seguros, mediante preço ou

uma porcentagem dos prêmios, a uma outra companhia.

De acordo com a FUNENSEG (Escola Nacional de Seguros, 2003) , o resseguro

é definido como um mecanismo de transferência de risco, através do qual o segurador

(ressegurado) transfere parte ou todo o risco da apólice por ele emitida a outro

18

segurador (ressegurador), que concorda em indenizá-lo pelas perdas decorrentes da

referida apólice, em troca de um prêmio de resseguro, e de acordo com os termos do

contrato de resseguro.

Assim, Piza (2005), afirma que as empresas de seguro buscam homogeneizar e

limitar as responsabilidades securitárias que assumem, no curso do exercício de sua

atividade empresarial, normalizando o comportamento de suas carteiras de riscos e

garantindo-as dos desvios ou desequilíbrios que, como visto, afetam a frequência, a

intensidade, a distribuição temporal ou a própria importância atinente aos sinistros de

tais riscos.

Conforme orientado pela SUSEP (Superintendência de Seguros Privados, 2013),

os contratos de resseguro em sua maioria abrangem diversos ramos e/ou grupo de

ramos, sendo que seus prêmios devem ser rateados entre os ramos (no caso das

seguradoras) ou entre os grupos de ramos (no caso dos resseguradores) para o registro

na contabilidade. Os rateios devem ser realizados de acordo com a exposição de risco

por ramo/grupo de ramo informada pela cedente nos contratos, nos endossos e nas

prestações de contas técnicas.

Demonstrada a natureza seguradora do contrato de resseguro, sem, entretanto,

negligenciar-se suas características particulares que o distinguem da estrutura

tradicional do seguro, é o resseguro um contrato oneroso, aleatório, consensual, de

estrita boa-fé, bilateral e de trato sucessivo (RIOS, 2005).

2.2 CONTRATOS DE RESSEGURO

De forma a estabelecer um vínculo expondo todos os negócios a serem

realizados durante determinado período, a seguradora e a resseguradora elaboram um

contrato de resseguro de forma que agrade a ambas as partes. Entretanto, existem

diferenças entre os contratos de seguros e os de resseguro.

O caráter aleatório do contrato de seguro reside no fato de que a vantagem da

qual resulta sua onerosidade não pode ser determinada no momento da celebração do

mesmo, dependendo da realização ou não de um evento futuro. (ALVIM, 1999)

De acordo com Camelo (2006), no contrato de seguro a obrigação está ligada a

um evento incerto e futuro. Já no contrato de resseguro, não necessariamente a

19

obrigação é o evento, mas sim o desembolso patrimonial do segurador cedente que

caracteriza a execução continuada. O evento que finaliza e torna o contrato perfeito, está

em repor o patrimônio que o segurador desembolsou para com o segurado, em função

do contrato de seguro, que pode ser patrimonial ou pessoal, durante todo o período de

vigência do contrato e até o limite pactuado por segurador e ressegurador.

Camelo (2006) ainda menciona as três diferenças sobre os contratos de seguro e

resseguro:

No contrato de seguro o contratante do mesmo não é uma empresa seguradora,

pode ser uma pessoa jurídica especializada em qualquer outro negócio, ou uma

pessoa física; já no contrato de resseguro, necessariamente, de um lado ter-se-ão

seguradores e do outro, empresas especializadas em resseguro. Assim, jamis será

possível se ter um contrato de resseguro entre uma pessoa jurídica e outra física.

O objeto contratual do seguro pode ser uma propriedade, pessoa ou benefício

exposto à perda ou destruição, ou ainda, alguma responsabilidade civil que o

segurado está exposto à perda patrimonial para o segurado, cuja

responsacilidade de indenizar recairá sobre o segurador. Diferentemente, o

objeto do resseguro está tão somente no dever de indenizar o segurador, que

sofreu redução financeira de seu patrimônio. O ressegurador toma conhecimento

e participa no contrato até sua parcela de proteção para pagamento dos prejuízos

primários que o ressegurador terá. Todo contrato de resseguro, portanto é um

contrato de indenização que pressupõe a existência de um ou mais contratos de

seguro, ou seja, tem que haver, necessariamente, a operação de seguro, para se

falar em resseguro. O resseguro está limitado ao montante de prêmio pago pela

seguradora cedente sob as apólices subscritas. Na prática, muitos contratos de

resseguro prevêem somente uma compensação parcial, com uma parte assumida

pela própria cedente. No seguro não necessariamente ter-se-á uma indenização

como objeto do contrato de seguro, o objeto a ser protegido pode ser a vida, a

saúde, bem imóveis, conserto do veículo, etc.

A última diferença essencial entre ambos está na internacionalização do

resseguro, eis que normalmente os riscos do contrato primário de seguro estão

em patrimônios como carros, empresas sediadas no país, seguro de vida ou

saúde, etc. Enquanto no resseguro, os direitos extrapolam o âmbito de um país,

são contratos transfronteiriços onde um ressegurador pode proteger a capacidade

20

financeira de vários resseguradores de diversas parter do mundo, basta que tenha

liquidez e confiabilidade do mercado. O seguro se paresenta como garantia de

proteção para bens situados e com os riscos expostos dentro do país da

contratação.

2.2.1 CONTRATOS PROPORCIONAIS DE RESSEGURO

Para Tilger (2009), os contratos proporcionais possuem uma relação de

proporcionalidade entre as parcelas de participação do ressegurador e da seguradora, na

importância segurada, é utilizada para a divisão dos prêmios e das responsabilidades nos

sinistros, ou seja, se uma seguradora possui uma participação de 95% da importância

segurada, então ela ficará com 95% dos prêmios e responderá por 95% do valor das

indenizações.

De acordo com Riley (2009), os contratos proporcionais se subdividem em três

categorias principais: cota-parte, excesso de responsabilidade e facultativo-obrigatório.

Os contratos cota-parte são acordos onde o ressegurado é obrigado a ceder e o

ressegurador é obrigado a aceitar uma porcentagem fixa de todos os riscos que estejam

de acordo com os termos do contrato. Os contratos de excesso de responsabilidade são

acordos que cobrem todos os riscos segurados que possuem importâncias seguradas

acima de um valor específico. Os contratos facultativos-obrigatórios se referem à

obrigação dos resseguradores de aceitar quaisquer riscos cedidos, desde que estejam

dentro dos termos e condições da cobertura propriamente dita.

Pelas orientações da SUSEP ao mercado, o registro contábil dos prêmios de

contratos proporcionais e seus requisitos estariam uniformizados. o EPI (Estimate

Premium Income) corresponde a uma estimativa dos prêmios de seguros totais que

serão, em parte, cedidos pela cedente ao ressegurador. Durante a vigência do contrato, a

cedente cederá um conjunto de apólices. Entretanto, no início do contrato, a cedente não

tem como assegurar o montante exato a ser repassado. Dessa forma a cedente realiza

uma estimativa da receita de prêmio de seguro que, em parte, será repassada ao longo da

vigência do contrato.

2.3 REGRESSÃO LINEAR MÚLTIPLA

Segundo Gujarati (2000), a análise de regressão ocupa-se do estudo da

dependência de uma variável, a variável dependente, em relação a uma ou mais

21

variáveis, as variáveis explicativas, com o objetivo de estimar e/ou prever a média ou

valor médio da dependente em termos dos valores conhecidos das explicativas.

Conforme indicado por Pereira (2015) uma função de regressão é expressada

através de uma distribuição Y variando em função de X pela seguinte equação:

𝑌 = 𝛽0 + 𝛽1𝑋1 +⋯+ 𝛽𝑖𝑋𝑖 (2.01)

Onde:

𝑌= Variável Dependente (Variável de Resposta);

𝑋𝑖= Variável Independente 𝑖 (Preditor 𝑖);

𝛽0= Intercepto;

𝛽𝑖= Coeficientes de Regressão (Inclinação ou Elasticidade).

Onde, Y é a variável dependente, X1, X2 e Xi são as variáveis independentes ou

explanatórias. Os coeficientes de regressão β0, β1, β2 e βi também são conhecidos como

coeficiente de inclinação ou coeficientes de elasticidade e medem o efeito de mudança

nas variáveis independentes sobre a variável dependente Y. Os valores dos coeficientes

de regressão são ilimitados, podendo ser positivos ou negativos e independem das

unidades de medidas das variáveis. Em geral, valores elevados significam que a variável

dependente é muito sensível a variações na variável independente.

O número mínimo de variáveis independentes pode ser calculado pela Regra de

Evans, que possui um caráter mais conservador exigindo pelo menos dez observações

para cada variável independente (DOANE e SEWARD, 2010):

𝑛

𝑘≥ 10 (2.02)

Onde

𝑛 = número de observações

𝑘 = número de variáveis independentes

Outra regra muito utilizada é a Regra de Doane, porém esta possui caráter mais

relaxado, pois para cada variável independente são necessárias pelo menos cinco

observações. Logo, pode-se concluir que a relação 𝑛 𝑘⁄ deve ser a maior possível

(HAIR et al., 2009)

22

Se a variável dependente for representada pela matriz Y:

𝑌 = [

𝑦1𝑦2⋮𝑦𝑖

] (2.03)

E as variáveis independentes pela matriz X (matriz design):

𝑋 = [

11⋮1

𝑥11𝑥21⋮𝑥𝑖1

⋯⋯⋱⋯

𝑥1𝑗𝑥2𝑗⋮𝑥𝑖𝑗

] (2.04)

Pode-se representar os coeficientes de regressão, pela matriz 𝜷, que é calculada

como:

𝛽 = (𝑋′𝑋)−1𝑋′𝑌 (2.05)

Uma vez obtido o modelo de regressão linear múltipla, deve-se analisá-lo e

validá-lo. Primeiramente uma análise da variância e do desvio padrão dos resíduos deve

ser feita, para se determinar a significância de cada βi.

𝜎² =∑ (𝑦𝑖−𝑦��)²𝑛𝑖=1

𝑛−(𝑘+1) e 𝜎 = √𝜎² (2.06)

Onde:

𝜎² = Variância dos resíduos

𝜎 = Desvio padrão dos resíduos

𝑛 = Número de observações

𝑘 = Número total de variáveis dependentes

�� = o valor estimado da variável independente.

De forma a descobrir o erro padrão dos coeficientes de regressão, usa-se a matriz

de variância-covariância 𝑪.

𝐶 = ��2(𝑋′𝑋)−1 (2.07)

Para cada estimador 𝛽 haverá um intervalo de confiança determinado pela

função t de Student.

23

𝛽𝑖 ± 𝑡𝑛−(𝑘+1);𝛼/2 × 𝜎𝛽𝑖 (2.08)

Com as seguintes hipóteses:

𝐻0: 𝛽𝑖 = 0 (não existe relação linear entre 𝑥𝑖 e 𝑦)

𝐻1: 𝛽𝑖 ≠ 0 (não existe relação linear entre 𝑥𝑖 e 𝑦)

𝑡𝑡𝑒𝑠𝑡𝑒 =𝐵𝑖

𝜎𝐵𝑖 (2.09)

𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 = 𝑡𝑛−(𝑘+1);𝛼/2 (2.10)

Caso 𝑡𝑡𝑒𝑠𝑡𝑒 > 𝑡𝑐𝑟í𝑡𝑖𝑐𝑜ou 𝑡𝑡𝑒𝑠𝑡𝑒 < −𝑡𝑐𝑟í𝑡𝑖𝑐𝑜, rejeita-se a hipótese nula e afirma-se

que 𝛽𝑖 é diferente de zero e existe uma relação linear entre 𝑥𝑖 e y.

A adequação do modelo em relação aos dados é representado pela variância total

(SST – Total Sum of Squares) do modelo e a sua composição que é representada pela

soma da variância explicada (SSR – Regression Sum of Squares) e da variância não-

explicada (SSE – Error Sum of Squares) :

∑ (𝑦𝑖 − ��)2𝑛𝑖=1 = ∑ (��𝑖 − ��)2𝑛

𝑖=1 + ∑ (𝑦𝑖 − ��𝑖)2𝑛

𝑖=1 (2.11)

𝑆𝑆𝑇 = 𝑆𝑆𝑅 + 𝑆𝑆𝐸 (2.12)

Onde:

𝑆𝑆𝑇 = Mede a variação dos valores de 𝑦𝑖 em torno de sua média ��;

𝑆𝑆𝑅 = Variação atribuída pela relação entre 𝑋 e 𝑌;

𝑆𝑆𝐸 = Varição de 𝑌 atribuída a outros fatores que não sejam 𝑋.

A Figura 2.1 resume graficamente a relação entre a variância explicada e a

variância não-explicada com a variância total.

24

Figura 2.1. Variância

Fonte: Pereira (2015)

Em seguida, realiza-se o teste de hipótese pela distribuição de probabilidade

contínua F de Fisher-Snedecor, onde:

𝐻0: O modelo não é adequado

𝐻1: O modelo é adequado

𝐹𝑡𝑒𝑠𝑡𝑒 = [∑ (��𝑖−��)

2𝑛𝑖=1 ]/(𝑘)

[∑ (𝑦𝑖−��𝑖)2𝑛

𝑖=1 ]/[𝑛−(𝑘+1)] (2.13)

Onde

𝐹𝑡𝑒𝑠𝑡𝑒 = distribuição de probabilidade contínua F de Fisher-Snedecor

𝑦𝑖 = valor da variável independente

��𝑖 = valor estimado da variável independente

k = número total de variáveis dependentes

n = número de observações

Caso 𝐹𝑡𝑒𝑠𝑡𝑒 > 𝐹𝑘;𝑛−(𝑘+1);𝛼 rejeita-se a hipótese nula e afirma-se que o modelo

encontrado é adequado.

Y

X

SST

SSR

SSE

𝑦𝑖 − ����𝑖 − ��

𝑦𝑖 − ��𝑖

𝑦𝑖

𝑥𝑖

25

Para se medir a força da relação indicando que o modelo explica um percentual

da variância da variável dependente, usa-se a variável r², conhecida tanto como r-

quadrado ou como o coeficiente de deteminação. Em um caso com r² igual a 0,9

significa que 90% da variância da variável dependente decorre da variável independente

e os restante 10% não são explicados pela mesma. Quanto mais próximo de 1, melhor

será o ajuste. Determinada as variâncias, pode-se calcular o r-quadrado como

(FÁVERO et al., 2009, PEREIRA, 2015):

𝑟² = 1 − ∑ (𝑦𝑖−𝑦��)²𝑛𝑖=1

∑ (𝑦𝑖−𝑦𝑖 )²𝑛𝑖=1

(2.14)

𝑟 = √𝑟² (2.15)

Onde:

r² = r-quadrado

y = valor da variável dependente

�� = o valor estimado da variável independente.

O (r²)a ou r²-ajustado é uma medida que ajusta o r² em função do número de k

variáveis independentes utilizadas:

(𝑟2)𝑎 = 1 − (1 − 𝑟2)𝑛−1

𝑛−𝑘−1 (2.16)

Onde:

(𝑟2)𝑎 = r²-ajustado

𝑟² = r-quadrado

n = número de observações

k = número total de variáveis dependentes

Tem-se o seguinte testes de hipótese para testar se a correlação é significativa:

𝐻0: A correlação não é significativa

𝐻1: A correlação é significativa

𝑡𝑡𝑒𝑠𝑡𝑒 = 𝑟

√1−(𝑟)2

𝑛−2

(2.17)

26

𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 = 𝑡𝑛−2;𝛼/2 (2.18)

Onde:

𝑡𝑡𝑒𝑠𝑡𝑒 = teste t de Student

𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 = valor do teste t onde se rejeita ou afirma a hipótese nula

Caso 𝑡𝑡𝑒𝑠𝑡𝑒 > 𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 ou 𝑡𝑡𝑒𝑠𝑡𝑒 < −𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 rejeita-se a hipótese nula e afirma-se

que existe uma correlação significativa para o modelo.

Gujarati (2000) conclui em sua obra que muitos pesquisadores tentam

maximizar r², porém isto pode ser perigoso porque na análise de regressão, o objetivo

não é obter apenas um r², mas sim obter estimativas confiáveis dos verdadeiros

coeficientes de regressão da população que permitem a inferência estatística sobre eles.

Na análise empírica, não é incomum obter um r² muito alto, mas ao descobrir que

alguns dos coeficientes de regressão não são estatisticamente significativos ou mostrem

sinais contrários significativos a priori. Portanto, o pesquisador deve se preocupar mais

com a relevância lógica ou teórica das variáveis explicativas para a variável dependente

e sua significância estatística.

2.4 PRESSUPOSTOS DA REGRESSÃO LINEAR MÚLTIPLA -

COLINEARIDADE

Segundo Pereira (2015) a colinearidade (correlação entre duas variáveis

independentes) ou a multicolinearidade (correlação entre múltiplas variáveis

independentes) podem tornar o modelo inviável, pois:

as estimativas podem ser instáveis;

o erro padrão pode ser não confiável;

o range dos intervalos de confiança pode se tornar muito amplo;

o coeficiente de determinação pode ser alto, ainda que os teste t sejam

insignificantes.

Caso seja detectada a existência de colinearidade, a remoção de uma das

variáveis ou a normalização de todas as variáveis, pode contornar o problema. Para se

detectar esse problema é necessário calcular o VIF (Variance Inflator Factor) para cada

preditor. Se o seu valor for maior que 5, o preditor é altamente relacionado indicando

colinearidade :

27

𝑉𝐼𝐹𝑗 =1

1−(𝑟2)𝑗 (2.19)

Onde:

(𝑟2)𝑗= Coeficiente de determinação entre o preditor 𝑗 e todos os outros

preditores.

1 − (𝑟2)𝑗= Tolerância entre o preditor 𝑗 e todos os outros preditores. Quanto

maior a tolerância, menores são as chances de ocorrer a colinearidade ou a

multicolinearidade.

2.5 VALIDAÇÃO DOS RESÍDUOS

Uma vez verificada a adequação do modelo estimado, é necessário validar

também os seus resíduos, conhecido também como resíduos. As características desses

resíduos seguem os seguintes padrões:

ser normalmente distribuídos

são homocedásticos;

são independentes , ou seja, não são correlacionados dentro de uma série de

tempo.

Os Resíduos Studentizados são os resíduos de um modelo dividos pela

estimativa do seu desvio padrão, então valores acima de +3 ou menores do que -3

podem indicar a existência de outliers.

A normalidade dos resíduos pode ser verificada visualmente através do QQ Plot

que compara distribuição dos resíduos com a distribuição normal. Se o gráfico

apresentar uma tendência linear (em um ângulo de aproximadamente 450), então

assume-se que os resíduos são normalmente distribuídos. O teste de Shapiro-Wilk

também pode ser utilizado para esse fim, e possui as seguintes hipóteses:

𝐻0: A amostra provém de uma Distribuição Normal

𝐻1: A amostra não provém de uma Distribuição Normal

Para verificar se os resíduos são homocedásticos (variância constante) o gráfico

dos mesmos contra os valores previstos pelo modelo deve ser feito e o ideal é que não

28

haja padrões nesse gráfico. O teste de Breusch-Pagan pode ser feito para se verificar a

homocedasticidade e com a seguinte hipótese:

𝐻0: Os resíduos são homocedásticos

𝐻1: Os resíduos não são homocedásticos

Finalmente, para verificar se os resíduos são independentes (não

autocorrelacionados) o teste de Durbin-Watson (DW) pode ser calculdado como:

𝐷𝑊 = ∑ (𝑒𝑖 − 𝑒𝑖−1)

2𝑛𝑖=2

∑ (𝑒𝑖)2𝑛𝑖=1

(2.20)

E com as seguintes considerações:

𝐷𝑊 < 2 → Indica autocorrelação positiva (Comum)

𝐷𝑊 ≅ 2 → Sem autocorrelação

𝐷𝑊 > 2 → Indica autocorrelação negativa (Raro)

Esse pressuposto só deve ser verificado se os dados analisados pertencerem a

uma série temporal.

O software R oferece um pacote chamado GVLMA (Global Validation of Linear

Model Assumption) que testa todos os pressupostos do modelo de uma única vez,

validando-o em uma única etapa.

2.6 PODER DE PREDIÇÃO DO MODELO E SELEÇÃO DE VARIÁVEIS

INDEPENDENTES

O 𝐴𝐼𝐶 (Akaike Information Criterion) é um critérios de informação que serve

para comparar diferentes modelos para um mesmo problema (Exemplo: Comparar um

modelos com diferentes combinações de variáveis independentes). Quanto menor o

valor do 𝐴𝐼𝐶, melhor é o modelo. E ele pode ser calculado como:

𝐴𝐼𝐶 = 𝑛 × 𝑙𝑛 (𝑆𝑆𝐸

𝑛) + 2 × (𝑘 + 1) (2.21)

O software R oferece um pacote chamado Leaps que pode testar todas as

combinações signicativas das variáveis independentes de uma única vez, escolhendo o

modelo de menor AIC.

29

3 METODOLOGIA

No presente capítulo é abordado a metodologia, incluindo os dados e sua

natureza, a forma de coleta, o tratamento dos dados e as delimitações do método.

Na Seção 3.1 é explicado quais dados foram coletados e sua natureza.

Na Seção 3.2 é informado o meio como os dados foram coletados e os

programas utilizados para metodologia.

Na Seção 3.3 é apresentada cada uma variável e suas características mais

importantes.

Na Seção 3.4 é apresentada a delimitação do método e as possíveis

consequências de um estudo mais abrangente para minimizar tais problemas.

3.1 POPULAÇÃO E AMOSTRA

Conforme indicado no Capítulo 1, os contratos proporcionais foram alvo desse

estudo e mais precisamente serão utilizados os contratos referentes ao ano de subscrição

de 2015. Foram coletados dados da amostra referentes aos contratos nacionais

abrangendo toda a participação da resseguradora.

3.2 COLETA DE DADOS

Os dados foram coletados pelo próprio pesquisador através do sistema

computacional utilizado na empresa IRB Brasil. Nesse sistema foi possível adquirir

todas as informações sobre os contratos proporcionais e a toda e qualquer mudança

ocorrida nos mesmos. O período da coleta ocorreu entre janeiro de 2016 e fevereiro de

2016.

3.3 TRATAMENTO E ANÁLISE DE DADOS

A Tabela 3.1, indica as variáveis utilizadas e as características de cada uma, em

seguida uma visão mais detalhada de cada uma delas é feita através de Figuras onde

pode ser visto o gráfico de dispersão, o box-plot e o histograma de cada uma.

Tabela 3.1 Definições das variáveis

Variável Tipo ID Min Mediana Max

Cedente - - - - -

Mês de início Numérica Start_Date 1 4 12

30

(Meses)

Existência de

Corretora

Binária

(0: N; 1: S) Broker 0 0 1

Tipo de Contrato

Proporcional

Binária

(0: QP; 1: ER) ER_QP 0 1 1

EPI Numérica

($) EPI $0,00 $5.359,00 $66.000.00,00

Participação da

Resseguradora

Numérica

(%) Participacao 1,88% 50,00% 100,00%

Divisão do Ramo Numérica

(Contagem) COB 1 2 14

Capacidade Máxima

de Resseguro

Numérica

($) Capacidade_Max $10.000,00 $10.000.002,00 $995.000.005,00

Número de Moedas

Utilizadas

Numérica

(Contagem) Moedas 1 1 3

Prêmio Performado Numérica

($) Premio $0,00 $108.166,00 $29.884.307,00

Número de Contas

Atrasadas

Binária

(0: S; 1: N) Contas_Atrasadas 0 0 1

Número de

Lançamentos

Realizados

Numérica

(Contagem)

Accounts_Lancad

as 0 2 6

Cargo do Analista

Categórica

(A1; A2; A3;

A4; A5; A6)

Analista 1 5 6

Tempo Médio de

Lançamento

Numérica

(Dias) Tempo_Medio 0 16 53

Cedente - Nome do parceiro: No campo cedente foi utilizado uma variável

descritiva utilizando o nome do parceiro. Foi decodificado esse campo para dispor mais

confidencialidade do parceiro para com esta empresa.

Mês de início - Mês de início do contrato: Para o mês de início, foram

substituídos os nomes por uma ordem de acordo com o calendário. Por exemplo, janeiro

é representado pelo número 1, fevereiro por 2, dentre outros. Esse campo indica o

primeiro mês no qual os riscos possuem vigência e serão tratados dentro do contrato.

Abaixo na figura 3.1, observamos o histograma, o box-plot e a dispersão das

observações da variável mencionada.

Figura 3.1. Variável Start_Date

31

Existência de corretora - Existência ou não da corretora no contrato: No

campo existência de corretora foi definido uma variável binária que identifica se para

aquele contrato, há um interloucutor entre a seguradora e a resseguradora. Caso o

número seja 1, existe uma corretora intermediando as prestações de contas e 0 caso

contrário. Abaixo na figura 3.2, observamos o histograma, o box-plot e a dispersão das

observações da variável mencionada.

Figura 3.2. Variável Broker

Tipo de contrato proporcional - Divisão entre contrato de Excedente de

Responsabilidade ou Quota-Parte: Os tipos de contratos proporcionais são classificados

em dois grupos principais sendo Excedente de Responsabilidade representados pelo

valor 1 e Quota-Parte pelo valor 0.

Os contratos quota-parte são acordos onde o ressegurado é obrigado a ceder e o

ressegurador é obrigado a aceitar uma porcentagem fixa de todos os riscos que estejam

de acordo com os termos do contrato. Os contratos de excesso de responsabilidade são

0 50 100 150

24

68

10

Observations

Sta

rt_D

ate

24

68

10

Observations

Sta

rt_D

ate

Start_Date

Fre

quency

2 4 6 8 10

010

30

50

0 50 100 150

0.0

0.4

0.8

Observations

Bro

ker

0.0

0.4

0.8

Observations

Bro

ker

Broker

Fre

quency

0.0 0.4 0.8

020

60

100

32

acordos que cobrem todos os riscos segurados que possuem importâncias seguradas

acima de um valor específico. Os contratos facultativos-obrigatórios se referem à

obrigação dos resseguradores de aceitar quaisquer riscos cedidos, desde que estejam

dentro dos termos e condições da cobertura propriamente dita (Riley, 2009). Abaixo na

figura 3.3, observamos o histograma, o box-plot e a dispersão das observasões da

variável mencionada.

Figura 3.3. Variável ER_PQ

EPI - Estimativa dos prêmios a serem performados durante a vigência do

contrato: De acordo com orientação da SUSEP, 2013, o EPI (Estimate Premium

Income) corresponde a uma estimativa dos prêmios de seguros totais que serão, em

parte, cedidos pela cedente ao ressegurador. Durante a vigência do contrato, a cedente

cederá um conjunto de apólices. Entretanto, no início do contrato, a cedente não tem

como assegurar o montante exato a ser repassado. Dessa forma a cedente realiza uma

estimativa da receita de prêmio de seguro que, em parte, será repassada ao longo da

vigência do contrato. Abaixo na figura 3.4, observamos o histograma, o box-plot e a

dispersão das observasões da variável mencionada.

Figura 3.4. Variável EPI

0 50 100 150

0.0

0.4

0.8

Observations

ER

_P

Q

0.0

0.4

0.8

Observations

ER

_P

Q

ER_PQ

Fre

quency

0.0 0.4 0.8

020

40

60

80

33

Devido a ordem de grandeza de alguns valores dessa variável, foi necessário

realizar uma transformação logarítmica natural dos dados, e o seu resultado pode ser

visto na figura 3.5 a seguir:

Figura 3.5. Variável ln (EPI)

Participação da resseguradora: Percentual em que a empresa participa do

resseguro: A participação da resseguradora é definida pelo percentual que a empresa

participa do resseguro, visto que uma ou mais empresas podem dividir os riscos

assumidos. Abaixo na figura 3.6, observamos o histograma, o box-plot e a dispersão das

observasões da variável mencionada.

0 50 100 150

0e+

00

3e+

07

6e+

07

Observations

EP

I

0e+

00

3e+

07

6e+

07

Observations

EP

I

EPI

Fre

quency

0e+00 3e+07 6e+07

050

100

150

0 50 100 150

10

12

14

16

18

Observations

EP

I

10

12

14

16

18

Observations

EP

I

EPI

Fre

quency

8 10 14 18

010

20

30

40

34

Figura 3.6. Variável Participacao

Divisão entre seguro e resseguro - Divisão entre a parte cedida e retida do

contrato: Os contratos de quota-parte são marcados pelo percentual de risco assumido.

Abaixo na figura 3.7, observamos o histograma, o box-plot e a dispersão das

observasões da variável mencionada.

Figura 3.7. Variável Perc_QP

Capacidade máxima de resseguro - A quantia máxima assumida pelo contrato

em suas apólices para os riscos estabelecidos: A capacidade máxima de resseguro é a

quantia máxima assumida pelo contrato em suas apólices para os riscos estabelecidos.

Abaixo na figura 3.8, observamos o histograma, o box-plot e a dispersão das

observasões da variável mencionada.

0 50 100 150

0.0

0.4

0.8

Observations

Part

icip

acao

0.0

0.4

0.8

Observations

Part

icip

acao,

Participacao

Fre

quency

0.0 0.4 0.8

010

30

50

0 50 100 150

0.0

0.4

0.8

Observations

Perc

_Q

P

0.0

0.4

0.8

Observations

Perc

_Q

P

Perc_QP

Fre

quency

0.0 0.4 0.8

020

40

60

80

35

Figura 3.8. Variável Capacidade_Max

Devido a ordem de grandeza de alguns valores dessa variável, foi necessário

realizar uma transformação logarítmica natural dos dados, e o seu resultado pode ser

visto na figura 3.9 a seguir:

Figura 3.9. Variável ln (Capacidade_Max)

Quantidade de subdivisões do ramo - Número de subdivisões do ramo

original: As subdivisões do ramo original do contrato foram alocadas numericamente

pela quantidade envolvida devido as diversas ramificações. O objetivo é incluir a

dificuldade da análise do lançamento da prestação por causa de mais separações.

Abaixo na figura 3.10, observamos o histograma, o box-plot e a dispersão das

observasões da variável mencionada.

0 50 100 150

0e+

00

4e+

08

8e+

08

Observations

Capacid

ade_M

ax

0e+

00

4e+

08

8e+

08

Observations

Capacid

ade_M

ax

Capacidade_Max

Fre

quency

0e+00 4e+08 8e+08

050

100

150

0 50 100 150

10

14

18

Observations

Capacid

ade_M

ax

10

14

18

Observations

Capacid

ade_M

ax

Capacidade_Max

Fre

quency

10 14 18

010

20

30

40

36

Figura 3.10. Variável COB

Número de moedas utilizadas - A quantidade de moedas negociadas pelo

segurador em suas apólices: O campo número de moedas utilizadas trata da quantidade

de moedas negociadas pelo segurador em suas apólices. Apesar de ser adotado no

pagamento apenas uma única moeda como instrumento de negociação, nos lançamentos

podem ser observadas mais de uma. Abaixo na figura 3.11, observamos o histograma, o

box-plot e a dispersão das observasões da variável mencionada.

Figura 3.11. Variável Moedas

Prêmio performado - O valor dos prêmios das prestações de contas

enviadas pela seguradora ou corretora até o momento da coleta dos dados: O prêmio

performado é o valor em reais dos prêmios das prestações de contas enviadas pela

seguradora ou corretora até o momento da coleta dos dados. No saldo final performado,

possui o mesmo modelo, porém existe a inclusão de outros valores totalizando o

pagamento a ser executado pela parte devedora. Abaixo na figura 3.12, observamos o

histograma, o box-plot e a dispersão das observasões da variável mencionada.

0 50 100 150

24

68

12

Observations

CO

B

24

68

12

Observations

CO

B

COB

Fre

quency

0 2 4 6 8 12

020

40

60

80

0 50 100 150

1.0

1.5

2.0

2.5

3.0

Observations

Moedas

1.0

1.5

2.0

2.5

3.0

Observations

Moedas

Moedas

Fre

quency

1.0 1.5 2.0 2.5 3.0

040

80

120

37

Figura 3.12. Variável Premio

Devido a ordem de grandeza de alguns valores dessa variável, foi necessário

realizar uma transformação logarítmica natural dos dados acrescidos de uma unidade

(pois existem observações com o valor de 0), e o seu resultado pode ser visto na figura

3.13 a seguir:

Figura 3.13. Variável ln (Premio +1)

Número de contas atrasadas - Atraso da entrega das prestações de contas:

Caso o parceiro não tenha enviado a empresa as pretações de contas, ela estará em

atraso. Definir-se-á esse atraso por uma variável binária, em que 1 simboliza o atraso e

0 a entrega no prazo. Abaixo na figura 3.14, observamos o histograma, o box-plot e a

dispersão das observasões da variável mencionada.

Figura 3.14. Variável Contas_Atrasadas

0 50 100 1500.0

e+

00

1.5

e+

07

3.0

e+

07

Observations

Pre

mio

0.0

e+

00

1.5

e+

07

3.0

e+

07

ObservationsP

rem

ioPremio

Fre

quency

0.0e+00 1.5e+07 3.0e+07

050

100

150

0 50 100 150

05

10

15

Observations

Pre

mio

05

10

15

Observations

Pre

mio

Premio

Fre

quency

0 5 10 15

010

20

30

40

50

38

Número de unidades de lançamentos realizadas - Trabalho performado pelo

analista contabilizado por unidade de lançamento: O número de unidades de

lançamentos corresponde ao trabalho do analista encarregado por aquela prestação de

contas a ser registrado no sistema. Se houver alguma mudança na prestação de contas

enviada, uma nova unidade de lançamento deve ser refeita anulando a anterior. Abaixo

na figura 3.15, observamos o histograma, o box-plot e a dispersão das observasões da

variável mencionada.

Figura 3.15. Variável Accounts_Lancadas

Cargo do analista: Importância do analista frente a organização: O cargo do

analista a fazer a análise e registro da prestação de contas foi avaliada como o menor

número, 1, para o cargo de menor remuneração até o maior número, 6, com o cargo de

maior remuneração dos analistas do setor. Abaixo na figura 3.16, observamos o

histograma, o box-plot e a dispersão das observasões da variável mencionada.

Figura 3.16. Variável Analista

0 50 100 150

0.0

0.4

0.8

Observations

Conta

s_A

trasadas

0.0

0.4

0.8

Observations

Conta

s_A

trasadas

Contas_Atrasadas

Fre

quency

0.0 0.4 0.8

020

60

100

0 50 100 150

01

23

45

6

Observations

Accounts

_Lancadas

01

23

45

6

Observations

Accounts

_Lancadas

Accounts_Lancadas

Fre

quency

0 1 2 3 4 5 6

010

20

30

40

39

Devido a natureza categórica dessa variável foi necessária a transformação da

mesma em variáveis dummy. Como existem 6 categorias, 5 variáveis dummy são

necessárias: Analista_A (1 se pertence a primeira categoria e 0, caso contrário),

Analista_B (1 se pertence a segunda categoria e 0 caso contrário), Analista_C (1 se

pertence a terceira categoria e 0 caso contrário), Analista_D (1 se pertence a quarta

categoria e 0 caso contrário) e Analista_E (1 se pertence a quinta categoria e 0 caso

contrário).

Tempo médio de lançamento do contrato: Tempo performado da data

de entrega das prestações até a data de conclusão: O tempo médio de lançamento foi

avaliado em dias desde o recebimento da conta até a data final de revisão e aprovação.

Todos os tempos de todos os accounts foram registrados e calculados por uma média de

seus valores. Abaixo na figura 3.17, observamos o histograma, o box-plot e a dispersão

das observasões da variável mencionada.

Figura 3.17. Variável Tempo_Medio

0 50 100 150 200

12

34

56

Observations

Analis

ta

12

34

56

Observations

Analis

ta

Observations

Analis

ta

1 2 3 4 5 6

020

40

60

80

0 50 100 150

010

20

30

40

50

Observations

Tem

po_M

edio

010

20

30

40

50

Observations

Tem

po_M

edio

Tempo_Medio

Fre

quency

0 10 30 50

010

30

50

40

A Figura 3.18, obtida através do software R, apresenta a correlação a 5% de

significância entre as variáveis utilizadas pelo modelo, já feitas as transformações.

Variáveis que possuam uma alta correlação podem não ser significativos para o modelo

e geram um problema de colinearidade. A decisão de qual variável deve ficar e qual

deve sair será dada por aquela que minimizar o valor do AIC.

Figura 3.18. Correlações

A Figura 3.19, também obtida através do software R, indica quais valores de

correlação possuem um nível significância de 5%.

41

Figura 3.19. Significância das Correlações

3.4 LIMITAÇÕES DO MÉTODO

Na especificação do modelo, Gujarati (2000) reflete para o fato que alguns

resíduos podem ocorrer devido a omissões de variáveis relevantes, a inclusão de

variáveis desnecessárias, adoção de forma funcional errada ou resíduos de medição.

Além disso, os dados coletados podem apresentar variações conforme o período

da coleta e não apresentarem o resultado definitivo para aquele contrato e,

consequentemente uma divergência com o modelo apresentado. A maneira mais eficaz

seria a elaboração desse modelo por longos períodos de tempo e abranger o maior

número de contratos possíveis.

42

4 REGRESSÃO LINEAR MÚLTIPLA

A seção 4.1 aborda a análise estatística dos dados apresentados anteriormente e

verifica as condições para a validação de um modelo.

Na seção 4.2 propõem-se a adequação de um modelo parcimonioso que expresse

melhor os dados e seja mais conciso para uma melhor análise qualitativa

Na seção 4.3 as variáveis do modelo final são interpretadas quantitativamente e

qualitativamente.

4.1 ANÁLISE ESTATÍSTICA DOS DADOS

No total 182 observações foram coletadas e como o total de variáveis é de 18,

pode-se concluir que as regras de Evans e de Doane foram respeitadas, pois:

𝑛

𝑘=182

18≅ 10,11

Prosseguindo com o estudo, utilizou-se a regressão linear múltipla para

construção de um modelo cujo resultado obtido através da utlização do software R

descrita na tabela 4.1 abaixo:

Tabela 4.1 Estatísticas descritivas do modelo Variables Estimate Std. Err. t p-value Intercept 7.709741 0.961462 8.019 1.92e-13 Start_Date 0.205879 0.041246 4.992 1.52e-06 Broker -0.637728 0.234499 -2.720 0.00724 ER_PQ 0.987703 0.335946 2.940 0.00376 Participacao -1.746942 0.339344 -5.148 7.46e-07 Perc_QP -0.463484 0.477251 -0.971 0.33290 Capacidade_Max 0.329926 0.048042 6.868 1.29e-10 COB 0.075950 0.041961 1.810 0.07212 Moedas 0.070114 0.191201 0.367 0.71431 Premio 0.153359 0.023788 6.447 1.22e-09 Accounts_Lancadas 0.169421 0.096700 1.752 0.08164 Contas_Atrasadas -0.056796 0.220935 -0.257 0.79744 Analista_A -1.133160 0.459175 -2.468 0.01462 Analista_B -0.649056 0.397841 -1.631 0.10471 Analista_C -0.502610 0.753420 -0.667 0.50564 Analista_D -0.389975 0.308032 -1.266 0.20730 Analista_E -0.497075 0.307474 -1.617 0.10788 Tempo_Medio -0.025477 0.009293 -2.741 0.00680 Residual standard error: 1.13 Multiple R-squared: 0.65 Adjusted R-squared: 0.62 F-statistic: 18.05 (p-value: < 2.2e-16)

43

As variáveis não significativas (5%) estão em negrito na Tabela 4.1 e são elas:

Perc_QP, COB, Moedas, Accounts_Lancadas, Contas_Atrasadas, Analista_A,

Analista_B, Analista_C, Analista_D e Analista_E. O erro padrão possui um valor de

1,13; o 𝑟2possui um valor de 0,65; o 𝑟2-ajustado possui um valor de 0,62 e modelo se

mostrou significantemente adequado.

A Figura 4.1 demonstra o histograma da distribuição dos resíduos studentizados

e que aparentemente possui uma distribuição normal.

Figura 4.1. Distribuição dos resíduos

A Figura 4.2 indica o QQ plot da distribuição dos resíduos studentizados e a sua

diagonal está próxima de ângulo de 45 graus sugerindo que os resíduos são

normalmente distribuídos.

Figura 4.2. QQ Plot

44

Finalmente o teste de Shapiro-Wilk com um p-valor de 0.3578 e considerando-

um nível de significância de 5%, pode-se concluir que a hipótese nula pode ser aceita,

ou seja, os resíduos possuem uma distribuição normal.

A homocedasticidade pode ser averiguada graficamente pela Figura 4.3, que

indica a não existência de padrões evidentes na dispersão dos resíduos e o teste de

Breusch-Pagan com um p-valor de 0.00149, considerando-se um nível de significância

de 1%, pode-se concluir que a hipótese nula pode ser aceita, ou seja, os resíduos

possuem homocedasticidade.

Figura 4.3. Resíduos Studentizados vs Valores Previstos

-2

-1

0

1

2

-3 -2 -1 0 1 2 3

theoretical

sam

ple

-2

-1

0

1

2

12 14 16

regression$fitted.values

sre

sid

45

A colinearidade foi verificada pelo VIF e nenhum valor excedeu o valor de 5,

essa verificação garante que esse conjunto de variáveis, e consequentemente os seus

subconjuntos, não possuem colinearidade ou multi-colinearidade. Os resultados estão

presentes na Tabela 4.2:

Tabela 4.2 VIF

Start_Date 2.703799 Broker 1.858880 ER_PQ 3.969546 Participacao 1.995313 Perc_QP 3.806081 Capacidade_Max 1.883103 COB 1.297263 Moedas 1.499870 Premio 2.690765 Accounts_Lancadas 3.590880 Contas_Atrasadas 1.650058 Analista_A 1.701122 Analista_B 2.199643 Analista_C 1.307487 Analista_D 2.719083 Analista_E 3.211674 Tempo_Medio 2.182811

A utilzação do pacote GVLMA do R testa todos os pressupostos de uma única

vez e o resultado pode ser visto na Tabela 4.3

Tabela 4.3 GVLMA Value p-value Decision

Global Stat 5.6063 0.23054 Assumptions acceptable. Skewness 0.9009 0.34253 Assumptions acceptable. Kurtosis 0.7268 0.39391 Assumptions acceptable. Link Function 3.0010 0.08321 Assumptions acceptable. Heteroscedasticity 0.9775 0.32282 Assumptions acceptable.

O “Global Stat” indica que um modelo linear se adequa aos dados utilzados, já a

“Skewness” e a “Kurtosis” indicam que os resíduos possuem uma distribuição normal,

o “Link Function” indica que existe uma relação linear entre as variáveis utilizadas e a

“Heteroscedasticity” atesta que os resíduos são homocedásticos.

Finalmente a Figura 4.4 mostra as curvas do EPI real (valores transformados) e

dos valores previstos pelo modelo.

Figura 4.4. EPI vs Valores Previstos

46

4.2 SELEÇÃO DE UM MODELO PARCIMONIOSO

O modelo apresentado é válido, entretanto, de forma a deixá-lo mais

parcimonioso e focar os esforços em menores quantidades de variáveis, optou-se por

utilizar o procedimento no software R através do pacote Leaps que retorna o melhor

modelo com menos variáveis (caso exista) de acordo com critério de menor AIC. Os

resultados podem ser vistos na Figura 4.5:

Figura 4.5. Leaps

O resultado para esse novo modelo indica o uso de 10 variáveis (possuindo um

AIC de 8,7): Start_Date, Broker, ER_QP, Participacao, Capacidade_Max, COB,

Cp

(In

terc

ep

t)

Sta

rt_

Da

te

Bro

ke

r

ER

_P

Q

Pa

rtic

ipa

ca

o

Pe

rc_

QP

Ca

pa

cid

ad

e_

Ma

x

CO

B

Mo

ed

as

Pre

mio

Acco

un

ts_

La

nca

da

s

Co

nta

s_

Atr

asa

da

s

An

alista

_A

An

alista

_B

An

alista

_C

An

alista

_D

An

alista

_E

Te

mp

o_

Me

dio

170120

773621181716141413121111

9.49.28.7

47

Premio, Accounts_Lancadas, Analista_A e Tempo_Medio. A Tabela 4.4 indica o

resultado da regressão feita com essas 10 variáveis:

Tabela 4.4 Modelo Leaps Variables Estimate Std. Err. t p-value Intercept 7.718622 0.806576 9.570 < 2e-16 Start_Date 0.199929 0.034821 5.742 4.19e-08 Broker -0.498615 0.202097 -2.467 0.01460 ER_PQ 0.730770 0.182350 4.008 9.14e-05 Participacao -1.814239 0.290506 -6.245 3.24e-09 Capacidade_Max 0.306028 0.040416 7.572 2.19e-12 COB 0.105025 0.039056 2.689 0.00787 Premio 0.156723 0.022980 6.820 1.51e-10 Accounts_Lancadas 0.136413 0.085459 1.596 0.11228 Analista_A -0.689076 0.384991 -1.790 0.07525 Tempo_Medio -0.025190 0.009086 -2.772 0.00618 Residual standard error: 1.12 Multiple R-squared: 0.64 Adjusted R-squared: 0.62 F-statistic: 30.62 (p-value: < 2.2e-16)

As variáveis Accounts_Lancadas e Analista_A não são significativas a um nível

de 5% e por isso um novo modelo foi gerado sem as mesmas. A Tabela 4.5 indica o

resultado da regressão feita com as 8 variáveis restantes:

Tabela 4.5 Modelo Leaps Refinado Variables Estimate Std. Err. t p-value Intercept 7.641765 0.777679 9.826 < 2e-16 Start_Date 0.165407 0.031495 5.252 4.38e-07 Broker -0.497423 0.201765 -2.465 0.01466 ER_PQ 0.759280 0.184139 4.123 5.79e-05 Participacao -1.685163 0.281091 -5.995 1.15e-08 Capacidade_Max 0.320021 0.039659 8.069 1.14e-13 COB 0.110764 0.039129 2.831 0.00519 Premio 0.169449 0.020931 8.096 9.74e-14 Tempo_Medio -0.022822 0.008904 -2.563 0.01123 Residual standard error: 1.14 Multiple R-squared: 0.63 Adjusted R-squared: 0.61 F-statistic: 36.64 (p-value: < 2.2e-16)

Todas as variáveis são significativas a um nível de 5%, o erro padrão possui um

valor de 1,14; o 𝑟2possui um valor de 0,63; o 𝑟2-ajustado possui um valor de 0,61 e

modelo se mostrou significantemente adequado. A utilzação do pacote GVLMA

mostrou que esse modelo cumpre todos os pressupostos e por isso pode ser validado,

conforme as informações da Tabela 4.6:

48

Tabela 4.6 GVLMA Value p-value Decision

Global Stat 6.7038 0.15240 Assumptions acceptable. Skewness 1.1016 0.29392 Assumptions acceptable. Kurtosis 0.4433 0.50554 Assumptions acceptable. Link Function 3.7980 0.05132 Assumptions acceptable. Heteroscedasticity 1.3609 0.24338 Assumptions acceptable.

Finalmente a Figura 4.6 mostra as curvas do EPI real (valores transformados) e

dos valores previstos pelo modelo final.

Figura 4.6. EPI vs Valores Previstos – Modelo Final

4.3 INTERPRETAÇÃO DAS VARIÁVEIS DO MODELO FINAL

A interpretação das variáveis independentes de um modelo de regressão é uma

etapa necessária a compreensão de sua relação com a variável dependente EPI

transformada, assim é necessário realizar um passo de conversão das variáveis

transformadas para os seus valores originais. A Tabela 4.7 resume essa etapa

quantitativa e em seguida uma análise qualitativa das mesmas será feita:

Tabela 4.7 Interpretação

Variável ID Coeficiente Transformação Resultado

Mês de início Start_Date 0,165407 𝑌 = 𝑒0,165407 1,18

Existência de

Corretora Broker -0,497423 𝑌 = 𝑒−0,4974237 0,61

Tipo de Contrato

Proporcional ER_QP 0,759280 𝑌 = 𝑒0,759280 2,14

49

Participação da

Resseguradora Participacao -1,685163 𝑌 = 𝑒−1,685163 0,18

Divisão do Ramo COB 0,110764 𝑌 = 𝑒0,110764 1,12

Capacidade

Máxima de

Resseguro

Capacidade_Max 0,320021 𝑌 = 𝑒ln(1,1)×0,320021 1,03

Prêmio Performado Premio 0,169449 𝑌 = 𝑒ln(1,1)×0,169449 1,02

Tempo Médio de

Lançamento Tempo_Medio -0.022822 𝑌 = 𝑒−0.022822 0,98

Mês de início (Start_Date): Um aumento de uma unidade nessa variável,

impacta no aumento médio de 18% no EPI.

Existência de Corretora (Broker): Um aumento de uma unidade nessa variável,

impacta na diminuição média de 39% no EPI.

Tipo de Contrato Proporcional (ER_QP): Um aumento de uma unidade nessa

variável, impacta no aumento médio de 114% no EPI.

Participação da Resseguradora (Participacao): Um aumento de uma unidade

nessa variável, impacta na diminuição média de 82% no EPI.

Divisão do Ramo (COB): Um aumento de uma unidade nessa variável, impacta

no aumento médio de 12% no EPI.

Capacidade Máxima de Resseguro (Capacidade_Max): Um aumento de 10%

nessa variável, impacta no aumento médio de 3% no EPI.

Prêmio Performado (Premio): Um aumento de 10% nessa variável, impacta no

aumento médio de 2% no EPI.

Tempo Médio de Lançamento (Tempo_Medio): Um aumento de uma unidade

nessa variável, impacta na diminuição média de 2% no EPI.

Qualitativamente pode-se inferir que o tipo de contrato analisado é um dos

principais fatores para o aumento do EPI. Caso o contrato seja do tipo excedente de

responsabilidade existem maiores chances para um maior lucro. De acordo com Riley

(2009), algumas companhias de seguro se recusam até mesmo a considerar um contrato

de quota-parte, acreditando que estarão cedendo seu negócio mais rentável, fato que

corrobora o resultado do estudo.

Pode-se observar também que a maior parte dos contratos onde o EPI foi maior,

a participação da resseguradora foi menor. Uma possibilidade para este fato é que as

seguradoras tendem a minimizar os riscos de seus contratos com maior volume

50

financeiro em mais resseguradoras. Assim, caso ocorra um sinistro de grandes

proporções, o risco de uma resseguradora descumprir com o seu dever de pagadora

diminui consideravelmente. Outro fato a mencionar é a competitividade do mercado

brasileiro de resseguros o qual torna mais difícil uma resseguradora participar

unicamente no contrato.

No caso de haver uma corretora intermediando o contrato, o EPI também tende a

ser menor. Apesar de ser considerado um facilitador para a seguradora e resseguradora,

comprovou-se que a relação nem sempre é benéfica para o resultado.

A análise da variável “Mês de início” mostra que os contratos iniciados em

dezembro foram aqueles que obtiveram, em média, maior EPI, indicando uma positiva

melhora no desempenho da empresa para o ano do estudo. Além disso, pode-se dizer

que os contratos analisados pela empresa possuem grandes chances de bons resultados

visto que o prêmio performado está alinhado com as expectativas.

Em relação a divisão do ramo, é importante ressaltar que a seguradora e

resseguradora recorrem a maneiras de administrar melhor os riscos, seja por causa da

quantidade ou volume dos possíveis sinistros. Portanto, para contratos com EPIs

maiores, uma divisão mais específica do ramo é comumente usada. Ocorre também que

a complexidade desses contratos pode levar a um tempo mais elevado para o cadastro da

prestação no sistema, impactando também no resultado.

A capacidade máxima da resseguradora tende a aumentar de acordo com o EPI.

Isso reflete na possibilidade de ocorrer maiores sinistros e ao assumir maiores riscos, os

prêmios também são maiores.

51

5 CONCLUSÃO

No começo do estudo foram levantadas diversas características do resseguro e a

forma como o IRB Brasil Re posiciona-se neste mercado, através de pesquisas na

literatura. De maneira a garantir sua posição líder no mercado, a gerência de contas

técnicas tornou-se papel fundamental no crescimento da empresa devido principalmente

ao acompanhamento e análise de contratos proporcionais.

A fim de compreender a afirmativa anterior, seria possível descobrir, a partir de

dados históricos, quais características desses contratos seriam as mais relevantes para o

processo. Para isso, foram apresentadas as características mais importantes dos

contratos proporcionais e determinar um modelo estatístico através da regressão linear

múltipla.

Portanto, foram coletados os dados referentes as características consideradas

mais importantes e analisadas as relações das variáveis independentes com a variável

dependente EPI, aspecto de vital importância para um sucesso do contrato. O software

R auxiliou no cálculo do modelo demonstrando a eficiência do modelo. A partir disso, a

análise dos resultados orientou os estudos para um modelo mais conciso, o qual

abrangisse um número menor de variáveis para uma tomada de decisão mais rápida.

Também, verificou-se que o modelo possui grande aceitabilidade caso novos dados

fossem incluídos.

No começo do estudo foi indagado se era possível averiguar por meio de um

modelo matemático e dados históricos, o sucesso de um contrato proporcional. Além

disso, questionou-se se haveria a possibilidade de identificar quais características dos

contratos proporcionais seriam mais críticas para o processo. Portanto, o objetivo geral

do estudo foi alcançado, pois foram identificados a forma como as características

principais dos contratos proporcionais impactam o resultado. Além disso, foram

estabelecidos quais elementos deverão ter maior importância em uma tomada de decisão

para novos contratos.

A empresa deverá se atentar em diversos aspectos dos contratos proporcionais,

porém é possível a detecção daqueles que irão apontar para um resultado melhor,

através de um levantamento dos dados registrados. O estudo abrangiu apenas os

52

contratos com o ano de vigência de 2015 e uma análise mais profunda poderá atingir

resultados ainda mais expressivos.

Nesse contexto, o estudo indica a gerência de contas técnicas quais contratos

deverão possuir um acompanhamento mais detalhado para que os resultados atinjam o

esperado. Como apontado anteriormente, os contratos de excedente de responsabilidade

indicaram a maior influência no EPI e, por isso, devem ser tratados mais

individualmente, seja por um profissional mais especializado nesse determinado assunto

ou outra medida como uma divisão maior do ramo.

A gerência também precisa se preocupar com a velocidade do serviço

performado pelos analistas e o que pode impactar na demora do cadastramento no

sistema. Esse fator ainda precisa estar alinhado com outras características como a

divisão do ramo

O estudo aponta também a possibilidade do sucesso nos contratos de resseguro,

indicando se o resultado irá melhorar conforme o mês de vigência e a diferença entre o

performado e o estimado.

Portanto, nota-se que os benefícios de um aprimoramento desse estudo pode

demonstrar importantes resultados para a empresa, seja no acompanhamento dos

contratos, na subscrição de novos contratos ou melhoria do desempenho.

53

6 REFERÊNCIAS BIBLIOGRÁFICAS

ALVIM, Pedro. O contrato de seguro. 3ª ed.. Rio de Janeiro: Forense, 1999

CAMELO, Joice Bier, Contrato de resseguro, Pontifícia Universidade Católica do Rio

Grande do Sul, 2006

DELGADO, José Augusto. Comentários ao novo código civil, volume XI, tomo 1: das

várias espécies de contrato, do seguro. Rio de Janeiro: Forense, 2004.

DOANE, D.; Seward, L. Applied Statistics in Business and Economics. 3rd Edition.

Mcgraw-Hill/Irwin Series, Operations and Decision Sciences. 2010

FÁVERO, L. P.; BELFIORE, P.; SILVA, F. L.; CHAN, B. Análise de Dados:

Modelagem Multivariada para Tomada de Decisões. CAMPUS, 2009.

GUJARATI, D.N. Econometria básica. São Paulo: Makron Books, 2000

HAIR, J. F.; BLACK, W. C.; BABIN, B. J.; ANDERSON, R. E.; TATHAM, R. L.

Análise Multivariada de Dados. BOOKMAN, 2009.

IRB Re Brasil (Instituto Brasileiro de Resseguros) <https://www.irbbrasilre.com/>

Acessado em 10/05/2016.

LEVINE, D. M.; STEPHAN, D. F.; KREHBIEL, T. C.; BERENSON, M. L. Estatística

- Teoria e Aplicações - Usando Microsoft Excel. LTC, 2012.

MANICA, Lais O contrato de seguro de vida, Universidade Federal do Rio Grande do

Sul, 2010.

PEREIRA, V (2015). Notas de aula (UFF – Estatística Multivariada): Estatística

Multivariada (SPSS) - 07 - Regressão Linear Múltipla. DOI: 10.13140 /

RG.2.1.2492.1685 <https : / / www. researchgate . net / publication / 287198885 _

Estatistica_Multivariada_SPSS_-_07_-_Regressao_Linear_Multipla >.Acessado em

16/06/2016.

PIZA, Paulo Luiz de Toledo. Tendências em matéria de resseguro – caso e ocaso

brasileiro. Revista Brasileira de Direito de Seguros. São Paulo, v.3, n.9, p 14-21,

maio/ago. 2000

RILEY, Keith O quebra-cabeça do resseguro. Rio de Janeiro: Funenseg, 2009

54

RIOS, Vivian Tristão O resseguro no Brasil, Rio de Janeiro: Pontifícia Católica do Rio

de Janeiro, 2005

TILGER, Fernando Elaborando um programa de resseguro, Revista Brasileira de Risco

e Seguro, Rio de Janeiro, 2009

ANEXOS

55

56

Dados transformados – Parte 1.

ln_(EPI) Start_Date Broker ER_PQ Participacao Perc_QP ln(Capacidade_Max) COB Moedas

16,192414 1 0 1 0,15 0,5 17,727534 2 2

16,4182 1 0 1 0,1 0,2 17,216708 5 3

14,978661 1 0 0 0,1 0 19,25272 1 3

16,785925 1 0 0 0,1 0 19,413933 2 3

15,520259 1 0 0 0,1 0 18,603002 2 3

13,527828 1 1 1 0,4 0,65 14,771022 2 1

14,220976 1 1 0 0,05 0 17,216708 4 1

9,680344 4 0 0 1 0 10,341759 1 1

14,151983 7 0 0 1 0 11,512975 2 1

16,482739 1 0 0 0,07 0 19,008467 1 3

10,20559 9 0 1 1 0,5 9,9034876 1 1

9,4862282 9 0 0 1 0 11,891362 1 1

16,618871 1 1 0 0,15 0 18,683045 6 1

13,429427 2 0 0 1 0 16,118096 2 1

11,46175 2 0 0 1 0 16,118096 2 1

13,211681 2 0 0 1 0 13,592368 3 1

15,789592 1 1 1 0,4 0,6 17,686712 6 2

14,914123 11 0 0 1 0 16,118096 5 1

12,324389 1 0 1 1 0,2 10,126631 1 1

13,072164 1 0 0 1 0 14,133964 1 1

11,275937 1 0 1 1 0,2 12,323856 1 1

13,439798 1 0 0 1 0 18,409367 1 1

14,448908 8 0 0 0,2 0 16,118096 3 1

10,85769 9 0 1 1 0,5 9,6158055 1 1

10,44462 1 0 0 1 0 12,429216 1 1

11,338572 1 0 0 1 0 14,690981 2 1

9,8428794 1 0 0 1 0 10,404263 1 1

12,721886 8 0 0 1 0 14,914123 3 1

15,464169 1 1 1 0,305 0,4 18,197537 1 1

15,201805 4 1 1 0,325 0,4 18,420681 1 1

14,978661 3 1 1 0,4 0,4 15,201805 3 2

16,235879 2 0 1 0,1 0,25 15,137266 6 2

14,797746 5 1 0 0,3 0 18,890684 3 1

13,997832 9 0 0 1 0 15,424948 6 1

14,508658 4 1 1 0,05 0,4 15,894952 5 1

13,903521 3 1 1 0,3 0,3 16,012735 1 2

16,225334 4 1 1 0,18 0,4 16,118096 3 2

16,064506 5 1 0 0,4 0 18,603002 2 2

13,527828 4 1 0 0,35 0 17,727534 3 1

12,429216 1 0 0 1 0 16,118096 2 1

57

15,442297 4 1 1 0,35 0,55 18,515991 3 1

15,063832 1 0 0 1 0 16,47577 5 1

10,509334 1 0 0 1 0 15,70258 2 1

12,280963 1 0 0 1 0 16,47577 2 1

12,794153 1 0 0 1 0 16,549878 2 1

15,236206 2 1 1 1 0,92 19,25359 6 3

15,520259 1 0 0 0,05 0 16,811243 6 1

14,52846 4 1 1 0,45 0,8 16,588099 2 1

15,566101 4 1 0 0,32 0 18,845948 1 1

14,696245 4 1 1 0,285 0,65 16,38046 1 2

16,860033 4 1 1 0,15 0,7 18,064006 5 2

12,270103 1 1 1 1 0,5 15,068274 1 1

15,89994 4 0 1 0,4 0,4 18,197537 8 2

15,026384 10 0 0 1 0 16,118096 5 1

14,608503 4 0 1 0,15 0,85 16,17872 6 2

14,84513 4 0 1 0,2 0,8 18,197537 1 1

16,023785 4 0 0 0,8 0 18,064034 1 2

16,161155 4 0 1 0,4 0,4 16,300417 1 2

11,512925 4 0 0 0,8 0 17,50444 3 2

15,581952 4 0 1 0,5 0,325 16,785925 3 1

14,220976 4 0 1 0,8 0,5 17,216708 2 2

14,689429 4 1 0 0,5 0 16,705882 6 2

13,142643 3 1 1 0,5 0,5 14,731801 1 1

14,318707 1 0 0 1 0 16,118096 3 1

15,068274 4 1 1 0,5 0,7 18,064006 1 1

14,914123 1 0 1 1 0,95 16,066802 3 1

15,156808 6 1 1 0,5 0,956 18,558005 3 1

15,911674 1 0 1 1 0,1 15,424948 1 1

16,399935 6 1 1 0,4 0,975 20,004801 2 2

13,985555 1 0 1 1 0,1 13,122363 1 1

12,351363 1 0 1 1 0,7 13,928839 1 1

12,784188 5 0 0 1 0 13,815511 1 1

15,123843 6 0 0 1 0 16,118096 6 1

13,235692 1 0 1 1 0,07 12,860999 1 1

15,830414 1 1 0 1 0 15,894952 6 1

14,508658 12 1 0 0,2 0 16,118096 2 1

16,160137 7 0 1 0,35 0,11 13,217674 3 1

15,810336 6 0 1 0,35 0,2 12,206073 2 2

15,031906 1 1 0 1 0 16,118096 3 1

15,424948 6 0 1 0,61 0,25 15,830414 7 2

17,867296 6 0 0 0,61 0 19,413933 7 2

15,538277 7 1 0 0,075 0 18,092177 7 1

13,20396 7 0 0 1 0 13,384728 1 1

13,527828 4 1 0 0,6 0 14,508658 5 1

12,128111 7 0 1 1 0,1 10,008848 5 1

58

12,409013 7 0 0 1 0 15,424948 5 1

15,778129 8 1 0 0,475 0 18,826146 11 2

14,517355 4 0 1 1 0,995 18,415668 1 2

13,791603 4 0 1 1 0,99 17,206658 1 2

13,413953 7 0 0 1 0 15,181602 2 1

15,214227 7 0 1 0,75 0,9 16,705882 1 1

15,358809 7 0 1 0,75 0,9 16,705882 1 1

16,922768 7 0 1 0,75 0,6666667 14,79634 2 1

16,084193 7 0 1 0,75 0,6666667 14,79634 1 1

17,265636 7 0 1 0,75 0,15 12,611538 2 1

13,458836 8 0 0 0,72 0 16,811243 9 2

17,88569 4 1 1 0,4 0,95 14,457364 1 1

14,611786 5 1 1 0,4 0,15 15,319588 2 2

15,137266 8 0 1 0,105 0,15 13,304685 3 2

13,652992 10 0 0 0,8 0 17,370859 1 2

15,039286 8 0 1 0,05 0,2 14,151983 3 1

13,122363 7 0 1 0,14 0,5 14,508658 3 2

15,250595 8 0 1 0,25 0,2 17,216708 3 1

17,910443 9 1 0 0,42 0 17,909855 6 1

18,005165 1 0 1 0,4 0,995 20,718253 3 2

12,89922 4 0 1 0,05 0,8 18,197537 1 1

14,914123 9 0 1 0,78 0,3 14,220976 3 1

15,250595 9 0 0 0,78 0 17,370859 3 1

10,596635 9 0 0 1 0 15,424948 6 1

13,458836 11 1 0 0,1 0 15,894952 1 1

12,611538 11 1 1 0,1 0,5 13,815511 1 1

15,308415 10 0 0 0,65 0 16,38046 3 1

16,001562 10 0 1 0,65 0,1 12,206073 3 1

12,611538 10 0 0 0,6 0 18,603002 1 1

14,220976 10 0 1 0,6 0,3 16,993564 1 1

14,631473 10 1 1 0,25 0,7 16,860033 1 2

15,943742 10 1 1 0,5 0,7 18,534009 3 1

16,213406 12 1 0 0,2 0 16,75995 5 2

10,819778 4 1 0 0,5 0 15,424948 6 1

15,830414 11 1 1 0,45 0,25 18,287149 1 1

15,830414 12 1 0 0,2 0 13,151938 1 1

13,384728 11 0 1 0,1 0,1 11,512925 2 2

14,522067 11 0 0 1 0 19,062535 4 1

11,338572 11 0 0 1 0 17,147715 2 1

12,881438 4 1 1 0,28 0,95 19,427178 1 1

15,026856 4 1 1 0,28 0,95 19,139496 1 2

10,28941 1 0 0 1 0 10,819778 1 1

11,661345 7 0 1 1 0,15 11,407565 1 1

16,549878 1 0 1 0,405 0,7 15,250595 1 1

14,888805 1 0 1 0,05 0,9 16,012735 2 2

59

14,841654 1 1 0 0,5 0 18,515991 3 1

13,978721 1 1 1 0,5 0,3 14,914123 4 1

15,137266 1 1 1 0,2 0,1 14,508658 11 1

10,819778 3 0 1 1 0,5 11,198215 2 1

10,819778 3 0 0 1 0 16,118099 3 1

15,486984 1 0 1 0,5 0,95 17,858562 1 1

16,332902 9 0 0 1 0 16,118096 5 1

13,774689 9 1 0 0,4 0 17,909855 1 2

13,854731 9 1 1 0,4 0,9 14,808762 1 2

15,65606 1 0 1 0,5 0,9 18,720785 2 2

8,5865793 2 0 0 1 0 9,2103404 1 1

14,847314 1 1 0 0,15 0 19,335771 1 2

15,761035 1 0 1 0,0188 0,25 16,436549 8 2

13,575967 1 0 1 0,5 0,3 14,220976 3 1

13,424996 1 0 0 0,5 0 16,811243 3 1

15,869294 6 0 1 0,4 0,81 17,005987 2 1

13,794811 3 1 0 0,5 0 17,622173 1 1

11,512925 1 0 0 1 0 16,395727 1 1

13,815511 1 0 1 1 0,85 15,645422 1 1

14,876767 1 1 0 0,2 0 18,683045 6 1

14,691527 4 1 1 0,06 0,25 14,731801 2 2

11,570845 2 0 0 1 0 16,118096 2 1

14,135677 9 0 0 1 0 16,118098 5 1

15,789592 3 0 1 0,5 0,4 14,285514 2 1

15,214227 7 0 1 0,2 0,9 18,20996 1 1

15,334428 7 1 1 0,34 0,8 15,894952 2 2

14,363679 7 0 0 0,75 0 16,012735 7 1

16,930225 7 0 1 0,75 0,1 12,611538 7 1

14,961611 7 0 0 0,5 0 15,894952 3 2

16,036508 7 0 1 0,5 0,675 14,115615 3 2

15,520259 7 1 1 1 0,7999 18,197412 7 1

13,910821 7 1 1 1 0,7999 18,197412 6 1

14,880221 7 1 0 0,7999 0 19,902285 6 1

16,496532 7 1 1 1 0,7999 16,993439 2 1

14,690979 7 1 0 0,7999 0 18,75716 2 1

16,231424 7 1 1 1 0,7999 19,80685 4 2

11,589887 7 1 1 1 0,7999 15,20168 1 1

13,304685 7 1 1 1 0,7999 17,504265 1 1

15,586472 9 0 1 0,4 0,45 16,130518 2 1

14,247943 2 1 1 0,05 0,85 14,569282 1 2

13,982932 5 1 0 0,2 0 15,262435 1 1

14,631913 5 1 1 0,2 0,2 11,918391 1 1

13,815511 9 1 1 0,35 0,4 16,300417 3 2

12,942949 4 0 1 1 0,5 11,736069 1 1

13,822555 9 1 0 0,2 0 17,189679 2 1

60

12,948522 9 1 1 0,2 0,15 11,695247 2 1

14,115615 9 1 1 0,3 0,3 15,319588 14 1

14,731801 9 1 0 0,275 0 18,826146 6 2

14,962913 9 1 1 0,275 0,3 17,216708 6 2

11,512925 4 0 0 1 0 13,122363 1 1

16,295843 11 0 1 0,125 0,55 17,129697 3 2

12,799399 5 0 1 0,8 0,99 14,621267 1 1

Dados transformados – Parte 2.

ln(Premio + 1)

Accounts_Lancadas Contas_Atrasadas Analista_A Analista_B Analista_C Analista_D Analista_E Tempo_Medio

14,78578776 1 1 0 0 0 1 0 31

13,67888078 3 0 0 0 0 0 1 29

13,11335512 2 0 0 0 0 0 1 29

13,90681341 2 0 0 0 0 0 1 29

11,79040818 2 0 0 0 0 0 1 29

11,74962567 6 1 0 0 0 1 0 26

10,81237192 3 0 0 0 0 0 0 19

9,325007447 3 0 0 0 0 0 1 8

13,55428924 2 0 0 0 0 0 1 24

12,23684038 3 0 0 0 0 0 1 29

0 1 0 0 0 0 0 1 32

7,771459249 1 0 0 0 0 0 1 32

14,18497929 4 0 0 0 0 0 0 43

12,7261642 5 0 0 0 0 0 1 28

11,29599395 3 0 0 0 0 0 1 32

12,92971855 3 0 0 0 0 0 1 27

14,48988676 3 0 0 0 0 0 0 16

0 0 0 0 0 0 0 1 0

11,37312498 2 1 0 0 0 1 0 17

12,31365512 2 1 0 0 0 1 0 17

11,23489374 3 1 0 0 0 1 0 32

12,47920811 3 1 0 0 0 1 0 32

0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 1 0

9,890938643 4 1 0 0 0 1 0 33

10,70729961 4 1 0 0 0 1 0 33

9,559063685 4 1 0 0 0 1 0 33

11,81998081 1 1 0 1 0 0 0 38

13,22995663 3 0 0 0 0 0 0 16

13,0614368 4 0 0 0 0 0 1 19

13,11916924 3 0 0 0 0 0 1 8

61

12,56746984 4 0 1 0 0 0 0 23

9,487268831 1 1 0 0 0 0 1 3

0 0 0 0 0 0 1 0 0

10,26874714 2 1 0 0 0 0 1 29

12,1392636 3 0 0 0 0 0 0 24

14,00982683 3 0 0 0 0 1 0 7

13,38676954 1 1 0 0 0 1 0 9

0 3 0 0 0 0 0 1 37

11,59775399 2 1 0 0 0 1 0 28

12,97443263 4 1 0 0 0 0 1 38

14,49915794 2 1 0 0 0 1 0 28

10,27306984 2 1 0 0 0 1 0 28

11,42093089 2 1 0 0 0 1 0 28

12,73996439 2 1 0 0 0 1 0 28

14,33781075 3 0 0 0 0 1 0 5

0 4 0 0 0 0 0 1 10

12,18915286 3 1 0 0 0 0 1 8

13,0411371 2 1 0 0 0 1 0 8

13,20080819 4 1 0 0 0 0 1 14

13,92972774 6 0 0 0 0 0 1 30

13,60360822 4 0 1 0 0 0 0 17

15,09686121 2 1 0 1 0 0 0 19

0 0 0 0 1 0 0 0 0

11,20820927 3 0 0 1 0 0 0 38

10,37806415 2 1 0 1 0 0 0 18

14,61493005 4 1 0 1 0 0 0 18

14,59857808 4 1 0 1 0 0 0 18

6,201117508 2 1 0 1 0 0 0 26

14,56046196 2 1 0 1 0 0 0 25

11,12838309 2 1 0 1 0 0 0 18

11,56738534 2 1 0 0 0 1 0 17

11,67521309 5 0 0 0 0 1 0 4

13,644836 3 1 0 0 0 1 0 24

11,83594519 2 0 0 0 0 1 0 2

14,09545909 3 1 0 0 0 1 0 32

11,73723953 2 0 0 0 0 1 0 18

14,302437 5 1 0 0 0 1 0 16

15,23975888 4 0 0 0 0 0 1 8

13,00478612 3 1 0 0 0 1 0 30

11,16175293 2 1 0 0 0 1 0 28

0 0 1 0 1 0 0 0 0

14,37211028 4 0 0 0 0 1 0 15

12,07674708 6 1 0 0 0 0 1 23

15,63529837 4 1 0 0 0 0 1 14

0 0 0 0 0 0 0 1 0

62

13,18249702 1 1 0 0 0 0 1 2

13,05515709 2 0 0 0 0 1 0 19

14,83093661 4 0 0 0 0 0 1 17

14,71372437 2 0 0 0 0 0 1 34

17,21284408 2 0 0 0 0 0 1 34

12,19923235 1 0 0 0 0 0 0 6

12,0999261 2 0 0 1 0 0 0 33

12,93977294 2 1 0 0 0 0 1 19

12,45675603 1 1 0 0 0 1 0 15

10,90156396 1 1 0 0 0 1 0 15

11,08933218 1 0 0 0 0 0 1 18

14,25973318 5 0 0 1 0 0 0 25

0 0 1 0 1 0 0 0 0

11,6170851 2 0 0 1 0 0 0 43

0 0 0 0 0 0 0 1 0

13,72278562 1 1 0 0 0 0 1 4

16,91589216 4 0 0 0 0 0 1 21

14,2180185 2 1 0 0 0 0 1 4

16,43145098 4 0 0 0 0 0 1 27

10,56839908 2 0 0 0 0 0 1 18

15,82504455 6 0 0 0 0 1 0 17

11,98504024 1 1 0 0 0 1 0 2

11,93856875 2 0 1 0 0 0 0 43

0 0 0 0 0 0 0 1 0

9,544622355 1 0 1 0 0 0 0 35

0 0 0 0 0 1 0 0 0

11,58506081 1 0 1 0 0 0 0 35

15,59483209 1 0 0 0 0 0 0 24

16,0034216 5 0 0 0 0 0 1 5

0 0 1 0 1 0 0 0 0

12,94808008 1 0 0 0 0 0 1 13

12,9664791 1 0 0 0 0 0 1 13

0 0 0 0 0 0 1 0 0

0 0 0 1 0 0 0 0 0

0 0 0 1 0 0 0 0 0

0 0 0 0 0 0 0 1 0

0 0 0 0 0 0 0 1 0

0 0 0 0 0 0 0 1 0

0 0 0 0 0 0 0 1 0

0 0 0 0 0 0 1 0 0

0 0 0 0 0 0 1 0 0

0 0 0 0 0 0 0 0 0

0 0 1 0 1 0 0 0 0

0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0

63

0 0 0 0 0 0 0 1 0

0 0 0 0 0 0 0 1 0

0 0 0 0 0 0 0 1 0

0 0 1 0 0 0 1 0 0

14,97475796 2 1 0 0 0 1 0 34

9,780526949 4 1 0 0 0 1 0 33

10,75965687 1 0 0 0 0 1 0 20

13,90945464 4 0 0 1 0 0 0 41

11,08224516 3 0 0 0 0 0 1 19

14,17749142 4 1 0 0 0 0 1 34

13,10242157 4 1 0 0 0 0 1 34

12,97560274 4 0 0 0 0 0 0 17

7,041787796 3 0 0 0 0 0 1 21

7,259791481 3 0 0 0 0 0 1 21

13,86491387 3 1 0 0 0 0 1 6

13,88191539 2 0 0 0 0 1 0 13

0 0 0 0 0 0 0 1 0

0 0 0 0 0 0 0 1 0

14,42474775 5 1 0 0 0 0 1 53

8,586771492 1 0 0 0 0 0 1 7

12,3180029 5 0 0 1 0 0 0 20

13,31203807 3 1 0 0 0 0 0 29

12,80026003 5 0 0 0 0 0 1 19

12,46091163 5 0 0 0 0 0 1 19

14,70436801 6 0 0 1 0 0 0 45

11,97933834 3 0 0 0 0 1 0 8

0 0 1 0 0 0 1 0 0

0 0 1 0 0 0 1 0 0

11,64886725 3 1 0 0 0 0 0 29

9,748578418 2 1 0 0 0 0 1 16

11,26447346 3 0 0 0 0 1 0 30

0 0 0 0 0 0 1 0 0

13,63336891 3 0 0 0 0 0 1 16

4,807457755 1 1 0 0 0 0 1 9

0 0 0 0 0 0 1 0 0

6,104235041 2 1 0 0 0 0 1 40

15,11862088 2 0 0 0 0 0 1 41

12,8166285 3 0 0 0 0 0 1 21

14,4004415 3 0 0 0 0 0 1 21

10,06359247 1 1 0 0 0 0 0 12

9,002446206 1 1 0 0 0 0 0 12

0 0 0 0 0 0 0 0 0

12,63963899 1 1 0 0 0 0 0 12

8,242603702 1 1 0 0 0 0 0 12

10,37509458 1 1 0 0 0 0 0 12

64

8,407476535 1 1 0 0 0 0 0 12

0 0 0 0 0 0 0 0 0

0 0 0 0 0 1 0 0 0

0 0 1 0 0 0 1 0 0

10,78080063 2 0 1 0 0 0 0 8

12,01497576 2 0 1 0 0 0 0 8

0 0 0 0 0 0 0 1 0

0 0 1 0 0 0 0 0 0

8,874036521 1 0 1 0 0 0 0 4

5,926072328 1 0 1 0 0 0 0 4

0 0 0 0 0 0 0 0 0

0 1 0 0 0 0 1 0 2

0 1 0 0 0 0 1 0 5

0 0 1 0 0 0 0 0 0

0 0 0 0 0 1 0 0 0

13,02290426 1 0 0 0 0 0 1 6

65

CODES

par(mfrow = c(1,3))

plot(data$EPI, xlab = "Observations", ylab = "EPI")

boxplot(data$EPI, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab = "EPI") #Box

plot

hist(data$EPI, main = "", xlab = "EPI", ylab = "Frequency") # Histograma

plot(data$Premio, xlab = "Observations", ylab = "Premio")

boxplot(data$Premio, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab = "Premio")

hist(data$Premio, main = "", xlab = "Premio", ylab = "Frequency")

plot(data$Start_Date, xlab = "Observations", ylab = "Start_Date")

boxplot(data$Start_Date, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =

"Start_Date")

hist(data$Start_Date, main = "", xlab = "Start_Date", ylab = "Frequency")

plot(data$Broker, xlab = "Observations", ylab = "Broker")

boxplot(data$Broker, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab = "Broker")

hist(data$Broker, main = "", xlab = "Broker", ylab = "Frequency")

plot(data$ER_PQ, xlab = "Observations", ylab = "ER_PQ")

boxplot(data$ER_PQ, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab = "ER_PQ")

hist(data$ER_PQ, main = "", xlab = "ER_PQ", ylab = "Frequency")

plot(data$Participacao, xlab = "Observations", ylab = "Participacao")

boxplot(data$Participacao, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =

"Participacao,")

hist(data$Participacao, main = "", xlab = "Participacao", ylab = "Frequency")

plot(data$Perc_QP, xlab = "Observations", ylab = "Perc_QP")

boxplot(data$Perc_QP, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =

"Perc_QP")

hist(data$Perc_QP, main = "", xlab = "Perc_QP", ylab = "Frequency")

plot(data$Capacidade_Max, xlab = "Observations", ylab = "Capacidade_Max")

boxplot(data$Capacidade_Max, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =

"Capacidade_Max")

hist(data$Capacidade_Max, main = "", xlab = "Capacidade_Max", ylab = "Frequency")

plot(data$COB, xlab = "Observations", ylab = "COB")

boxplot(data$COB, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab = "COB")

hist(data$COB, main = "", xlab = "COB", ylab = "Frequency")

plot(data$Moedas, xlab = "Observations", ylab = "Moedas")

boxplot(data$Moedas, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =

"Moedas")

hist(data$Moedas, main = "", xlab = "Moedas", ylab = "Frequency")

plot(data$Balanco_Final, xlab = "Observations", ylab = "Balanco_Final")

boxplot(data$Balanco_Final, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =

"Balanco_Final")

hist(data$Balanco_Final, main = "", xlab = "Balanco_Final", ylab = "Frequency")

plot(data$Accounts_Lancadas, xlab = "Observations", ylab = "Accounts_Lancadas")

66

boxplot(data$Accounts_Lancadas, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab

= "Accounts_Lancadas")

hist(data$Accounts_Lancadas, main = "", xlab = "Accounts_Lancadas", ylab = "Frequency")

plot(data$Contas_Atrasadas, xlab = "Observations", ylab = "Contas_Atrasadas")

boxplot(data$Contas_Atrasadas, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =

"Contas_Atrasadas")

hist(data$Contas_Atrasadas, main = "", xlab = "Contas_Atrasadas", ylab = "Frequency")

plot(data$Analista, xlab = "Observations", ylab = "Analista")

boxplot(data$Analista, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =

"Analista")

hist(data$Analista, main = "", xlab = "Analista", ylab = "Frequency")

plot(data$Tempo_Medio, xlab = "Observations", ylab = "Tempo_Medio")

boxplot(data$Tempo_Medio, horizontal = FALSE, axes = TRUE, outline = TRUE, xlab = "Observations", ylab =

"Tempo_Medio")

hist(data$Tempo_Medio, main = "", xlab = "Tempo_Medio", ylab = "Frequency")

library(corrplot)

corrplot(cor(data), method = "circle", tl.cex = 0.7, tl.offset = 0.5, mar = c(1,0,0,0), number.cex = 0.5, bg = "white",

addCoef.col = "black", diag = FALSE)

library (psych)

pval <- corr.test(cor(data), adjust="none")$p

corrplot(cor(data), method = "circle", tl.cex = 0.7, tl.offset = 0.5, mar = c(1,0,0,0), number.cex = 0.5, bg = "white",

addCoef.col = "black", diag = FALSE, p.mat = pval, sig.level = 0.05)

regression <- lm(EPI ~ ., data = data)

resid <- residuals(regression)

shapiro.test(resid)

qqPlot(regression, id.n = 3)

par( mar = c(5, 4.5, 4, 2) + 0.1)

sresid <- rstudent(regression)

hist(sresid, main = "Studentized Residuals", breaks = "FD", freq = FALSE)

curve(dnorm(x, mean = 0, sd = 1), col = "red", lwd = 2, add = TRUE)

library(car)

ncvTest(regression)

vif(regression)

library(gvlma)

gvmodel <- gvlma(regression)

summary(gvmodel)

predicted <- fitted(regression)

plot(data$EPI, type = "l", col = "red")

lines(predicted,col = "blue")

library(plotly)

plot_ly(data = data, y = EPI, name = "EPI", type = "line")

add_trace(y = predicted , name = "Predicted", type = "line")

library(leaps)

leaps <- regsubsets(EPI ~ ., data = data_out, nbest = 1, nvmax = 18)

plot(leaps, scale = "bic")