modelo de gestÃo de riscos a partir da...

17
MODELO DE GESTÃO DE RISCOS A PARTIR DA ANÁLISE ENVOLTÓRIA DE DADOS (DEA) Vitor Augusto Leivas Craveiro (UnB ) [email protected] Paula Caminha Soares (UnB ) [email protected] Rodolfo Lisita Pinto (UnB ) [email protected] Ana Carolina Nerva Blumm (UnB ) [email protected] Joao Carlos Felix Souza (UnB ) [email protected] O artigo a seguir apresenta uma análise dos dados atípicos de uma instituição que concede benefícios à população brasileira. Para este estudo, é feito o uso de duas diferentes metodologias que se complementam para identificação dos padrões desse risco operacional. A primeira delas é a clusterização que, através do software SAS (Statistical Analysis System), agrupa os dados considerando suas distâncias do padrão. A segunda é a análise envoltória de dados (DEA) que ranqueia os dados mais atípicos obtidos na metodologia anterior, analisando suas eficiências relativas - a partir da maior eficiência, são calculadas as eficiências dos demais dados. O banco de dados utilizado neste estudo representa os indivíduos beneficiários da instituição analisada, considerando o tipo de benefício recebido e a região geográfica dos mesmos. Os resultados obtidos distinguem os indivíduos mais atípicos dentro do banco de dados utilizados. Desta forma, o estudo a seguir refina a amostra de indivíduos a ser analisada numa futura investigação de campo, direcionando àqueles apresentados como mais atípicos. Palavras-chaves: Clusterização, análise envoltória de dados, análise de eficiência, gestão de riscos, risco operacional. XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

Upload: others

Post on 25-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

MODELO DE GESTÃO DE RISCOS A

PARTIR DA ANÁLISE ENVOLTÓRIA DE

DADOS (DEA)

Vitor Augusto Leivas Craveiro (UnB )

[email protected]

Paula Caminha Soares (UnB )

[email protected]

Rodolfo Lisita Pinto (UnB )

[email protected]

Ana Carolina Nerva Blumm (UnB )

[email protected]

Joao Carlos Felix Souza (UnB )

[email protected]

O artigo a seguir apresenta uma análise dos dados atípicos de uma

instituição que concede benefícios à população brasileira. Para este

estudo, é feito o uso de duas diferentes metodologias que se

complementam para identificação dos padrões desse risco operacional. A

primeira delas é a clusterização que, através do software SAS (Statistical

Analysis System), agrupa os dados considerando suas distâncias do

padrão. A segunda é a análise envoltória de dados (DEA) que ranqueia os

dados mais atípicos obtidos na metodologia anterior, analisando suas

eficiências relativas - a partir da maior eficiência, são calculadas as

eficiências dos demais dados. O banco de dados utilizado neste estudo

representa os indivíduos beneficiários da instituição analisada,

considerando o tipo de benefício recebido e a região geográfica dos

mesmos. Os resultados obtidos distinguem os indivíduos mais atípicos

dentro do banco de dados utilizados. Desta forma, o estudo a seguir refina

a amostra de indivíduos a ser analisada numa futura investigação de

campo, direcionando àqueles apresentados como mais atípicos.

Palavras-chaves: Clusterização, análise envoltória de dados, análise de

eficiência, gestão de riscos, risco operacional.

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

Page 2: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

2

Introdução

De acordo com Coimbra (2004), as empresas ou instituições atuais, independentes de seu

tamanho ou ramo de atividade, estão sujeitas a riscos. O risco é naturalmente associado a

qualquer situação adversa, perigo, algo que deve ser superado.

A organização analisada no presente projeto é uma instituição responsável pelos pagamentos de

benefícios aos trabalhadores brasileiros. Os serviços oferecidos pela empresa são prestados por

meio de agências de atendimento, localizadas em todo o território brasileiro.

Há, no entanto, uma diferença entre os valores dos benefícios que são concedidos por cada

agência. Nesse sentido, o estudo tem por objetivo encontrar potenciais dados atípicos nas

agências de atendimento, ou seja, encontrar os denominados “outliers” – observações

"anormais", contaminantes, estranhas ou extremas (FIGUEIRA, 1998).

Para obtenção de tais resultados, é feita uma análise do risco operacional a que a empresa está

submetida através da clusterização dos dados disponíveis. Será utilizado o software SAS

(Sistema de Análise Estatística), que identificará as características das regiões com maior

frequência de dados atípicos. Feito isso, será executada a metodologia DEA (Análise Envoltória

de Dados), que analisará os indivíduos de agencias com relação às suas eficiências, a partir dos

benefícios que cada uma concede e a quantidade de recursos que esta utiliza para concede-lo.

Essa análise ira gerar eficiência para todos os indivíduos clusterizados, possibilitando assim o

ranqueamento dos indivíduos. Os tópicos subsequentes detalham o procedimento realizado para a

obtenção dos resultados.

1. Fundamentação teórica

1.1. Gestão de riscos

A globalização, o aumento tecnológico e o aumento da competitividade fazem com que o

gerenciamento de risco seja cada vez mais imprescindível para as organizações. Segundo

Bernstein (1997), a genealogia do termo risco é ousar. Com isso, pode-se interpretar que o risco é

uma opção, envolvendo uma tomada de decisão, e suas decorrências influenciam o futuro das

empresas. Conforme Raff (2000) é necessário tomar essas decisões frequentemente no mundo

Page 3: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

3

dos negócios e para isso os estudos dos riscos são cada vez mais aprofundados. De acordo com o

autor, os principais riscos empresariais internos podem ser categorizados em: estratégicos,

operacionais e financeiros.

O risco estratégico pode surgir de um desalinhamento entre o planejamento estratégico da

empresa e o resultado, ocorrido, por exemplo, de inovações tecnológicas inesperadas introduzidas

por organizações, no costume dos consumidores e na política regulatória (CARLTON, 1999). O

risco operacional é atrelado a falhas humanas, problemas de sistemas, falha na execução dos

procedimentos que podem impactar a produtividade. Por fim, o risco financeiro está associado à

volatilidade no mercado financeiro e, de acordo com Jorion (2004), decorre das oscilações nos

preços dos ativos com os quais a empresa trabalha, do risco do crédito que está submetida, ou do

risco de liquidez. O presente artigo tem como foco identificar dados atípicos de uma instituição

originados de possíveis riscos operacionais.

1.1.1. Riscos operacionais

Uma definição apropriada do risco operacional, como escrito anteriormente, é que ele é originado

por perdas decorrentes da inadequação, falhas nos processos internos de uma empresa, ações

humanas e sistemas. Culp (2001) acredita que os riscos operacionais surgem em função da

desatenção em processos, sistemas e, também, pelas falhas humanas no desempenho de

atividades. Segundo o mesmo autor, os pontos a seguir exemplificam os riscos operacionais:

- Pessoas: falta de conhecimento, erro de empregados, fraudes, perda de pessoal-

chave, disputa-legal com empregados;

- Processos: erros contábeis, riscos de projeto, erros aleatórios, risco de contrato;

- Sistemas: má qualidade dos dados, erros de programação, incapacidade do

sistema, falhas do sistema.

Os resultados a serem apresentados neste trabalho foram advindos por algum dos fatores

representados acima, assim tem-se como objetivo identificar as tendências e padrões das

atipicidades encontradas para facilitar com que a instituição mitigue esse risco.

Page 4: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

4

1.2. Análise envoltória de dados (DEA)

Os modelos clássicos de Análise Envoltória de Dados (DEA) foram introduzidos por Charnes et

al. em 1978 (baseada em retornos constantes em escala - CRS) e estendidos por Banker em 1984

(com retornos variáveis de escala - VRS), consistindo em uma metodologia não paramétrica para

mensuração comparativa da eficiência de unidades tomadoras de decisão (Decision Making Units

– DMU’s), com base nas melhores práticas. O conjunto de DMU’s deve ser homogêneo e ter em

comum a utilização dos mesmos inputs e a produção dos mesmos outputs.

Para que seja possível estudar a DEA, é necessário reforçar os conceitos e diferenciar eficiência e

eficácia. Eficiência encaixa-se no âmbito de comparação entre as variáveis de input (entrada) e

output (saída), sendo que a primeira fornece insumos ao processo e a segunda resulta na saída

dele, onde a maior eficiência caracteriza-se por menores valores de input e maiores de output.

Charnes et al. (1985) consideram que a unidade 100% eficiente é aquela que tem o maior

desempenho relativo dentro da amostra utilizada. Este raciocínio indica que existe uma

combinação técnica e alocativa ótima definida como eficiência. Eficácia é a capacidade de a

unidade produtiva atingir a produção que tinha como meta (Batista, 2007). A principal diferença

entre esses dois conceitos é que a eficiência considera os recursos utilizados para a caracterização

do processo ou indivíduo, e a eficácia avalia apenas se o objetivo foi alcançado.

1.3. Cluster

A clusterização é um processo de classificação não supervisionada de dados que resulta em

agrupamentos ou “clusters” (JAIN et al., 1999). Para Porter (1999), os clusters são

estabelecimentos correlatos dentro de uma determinada área que estão vinculados por elementos

comuns e complementares. Ou seja, um cluster é um agrupamento de semelhantes por

determinado aspecto.

O modelo de clusterização (Figura 1) neste estudo, basicamente, utiliza características pré-

selecionadas, em seguida mede a similaridade dessas características entre os cadastrados, separa-

os em grupos com particularidades próximas e, por fim, apresenta os grupos definidos.

Page 5: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

5

Fonte: GOMES, MOSCATO & VON ZUBEN (2004)

Nesse sentido, o fator que aglomera grupos de indivíduos que recebem benefícios destoantes dos

demais é que está sendo alvo do estudo. Esse fator caracteriza esses indivíduos, possivelmente

por ocorrer uma fraude ou erro de cadastro.

A forma como ocorre o agrupamento depende implicitamente do objetivo da análise, das

hipóteses criadas e da configuração inicial dos dados (DUBES & JAIN, 1976; FISHER & VAN

NESS, 1971). As maneiras mais utilizadas são as hierárquicas (Single Link e Complete Link) e as

particionais (Métrica Euclidiana – k-means–, Teoria dos Grafos, Mistura de Densidades –

Expectation Maximization).

2. Metodologia

A fim de encontrar possíveis atipicidades dentro da massa de dados, duas frentes de tratamento

de dados devem ser seguidas. A primeira é feita a clusterização dos dados com o auxílio do

software SAS. Com essa clusterização, foi possível encontrar dados que fogem do padrão dentro

do universo estudado. A segunda é a Análise Envoltória de Dados – DEA (Data Envelopment

Analysis) – a fim de ranquear os indivíduos pela eficiência relativa e identificar o padrão de

características que eles seguem diferente dos demais. O DEA (Data Envelopment Analysis) é

uma metodologia que analisa de maneira multidimensional a partir da definição de alguns

parâmetros para criar eficiência relativa para todos os dados analisados:

Figura 1 - Processo de clusterização

Page 6: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

6

- Identificação – para que se possa fazer o rastreamento de informações dentro de

um complexo algoritmo, existem alguns campos de identificação das variáveis no sistema que

ficam visíveis até a etapa final do algoritmo;

- DMUS – representam a quantidade de informações que serão processadas. Em

termos práticos, é o número de linhas que estão sendo fornecidas ao sistema.

- Inputs – representam as entradas do processo de concessão do benefício;

- Outputs – representam as saídas do processo de concessão de benefícios.

3. Apresentação dos dados

Tanto para a clusterização, quanto para a análise envoltória de dados, foram utilizadas as

informações fornecidas pela própria instituição em questão. Foram disponibilizados dados de três

benefícios diferentes, suficiente para que esse estudo fosse realizado.

A empresa em foco tem por objetivo oferecer benefícios que garantem tranquilidade aos

trabalhadores brasileiros. Para isso, ela conta com aproximadamente 1200 unidades de

atendimento responsáveis por esclarecer dúvidas, conceder e manter os benefícios de seus

contribuintes.

Cada benefício concedido é tratado como uma espécie dentro da organização. Para cada espécie,

há um banco de dados de seus beneficiários, que ultrapassam 19 mil e que são classificados

através de 80 variáveis. Portanto, pela numerosa quantidade de dados, este banco por espécie é

considerado extenso e complexo.

Devida à grande extensão territorial brasileira e à sua dispersão populacional, a empresa em

questão agrupa o gerenciamento de suas agencias de atendimento em cinco regiões. São elas:

- São Paulo;

- Minas Gerais, Rio de Janeiro e Espírito Santo;

- Estados da Região Sul;

- Estados da Região Nordeste;

- Estados da Região Norte, Centro-Oeste e Distrito Federal.

Esta divisão também foi adotada para identificar os dados utilizados.

Page 7: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

7

Para o estudo, foram considerados apenas três dos diversos benefícios possíveis de serem

concedidos. Todos eles envolvem pagamentos de taxas mensais aos beneficiários, ou seja, geram

gastos que potencializam a possibilidade de desvios.

4. Análise dos Resultados

4.1. Cluster

No estudo, realizaram-se clusters para as três espécies de benefícios. Para que os clusters sejam

feitos, o banco de dados de entrada é filtrado, a fim de obter a separação por sexo e por zona de

habitação dos indivíduos, ou seja, urbano/rural e masculino/feminino. Feito isto, utiliza-se a

Métrica Euclidiana k-means para agrupar os dados de 8 em 8 grupos. O motivo de gerar oito

grupos é pela prévia divisão de tamanho máximo de grupos toleráveis.

A separação dos grupos foi resultante de uma semelhança entre o valor bruto do benefício

recebido pelos indivíduos que frequentam as agências. Apenas alguns dos clusters foram

selecionados para continuar o estudo – aqueles que possuíam um valor bruto médio recebido por

individuo destoante dos demais clusters. Estes clusters destoantes geram os dados atípicos e

foram originados possivelmente por erro de cadastramento ou fraude.

A análise a seguir distribui estes dados atípicos de acordo com sua localização, com seu sexo e

com a zona habitacional. Primeiramente, o gráfico a seguir representa a porcentagem de dados

atípicos encontrados em cada região.

Page 8: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

8

Figura 2 - Gráfico de tendência

Fonte: Elaborado pelos autores (2013)

Os valores representam a razão entre a quantidade de dados atípicos e a quantidade de indivíduos

naquela região, evidenciando a probabilidade de se encontrar maior número de casos atípicos em

cada uma dessas localizações.

Visualizando o gráfico, é possível identificar que os estados de Minas Gerais, Espirito Santo e

Rio de Janeiro possuem a segunda maior chance de ocorrer casos atípicos. Em contraponto, esta

região é a segunda menor em indivíduos cadastrados, justificando a alta probabilidade de

ocorrência de perdas operacionais e identificando probabilidade de risco.

A tabela 1 apresenta as quantidades e distribuições das informações a respeito do sexo e da zona

de habitação dos registros considerados atípicos.

Tabela 1 - Categorização dos dados atípicos

Fonte: Elaborado pelos autores (2013)

Page 9: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

9

A análise da tabela 1 mostra que, na maioria, as mulheres estão ligadas às atipicidades

encontradas, independente da zona em que vivem. Avaliando estes resultados por região, temos:

São Paulo

Segundo o IBGE (2011), o estado de São Paulo possui 49% de sua população composta por

homens e, logo, 51% de mulheres. Diante destes valores, esperava-se que na tabela fosse

encontrada uma proporção semelhante. No entanto, nota-se que o valor para mulheres representa

aproximadamente 40% dos dados atípicos e 60% para homens. Outro fator em destaque, é que o

estado tem apenas 6% da sua população habitando o meio rural (IBGE, 2011). Porém, ao analisar

a tabela, visualiza-se que para ambos os sexos o valor de dados atípicos no meio rural é superior

ao meio urbano. Estas duas características são indicativas de anormalidade que pode configurar

fraude.

MG, RJ, ES; Região Sul; Norte e Centro-Oeste

As três regiões podem ser analisadas em conjunto, já que possuem características semelhantes.

De acordo com o IBGE (2011), estes estados têm em média 85% de sua população urbana e 10%

rural. Contudo, a tabela 1 evidencia quase 50% de dados atípicos na zona rural. Esse fato ratifica

anomalias.

Nordeste

De acordo com o IBGE (2011), a região nordeste tem cerca de 50% da sua população masculina

e 50% feminina. Entretanto, os dados obtidos refletem que 77% dos registros atípicos são de

mulheres, não obedecendo a proporcionalidade esperada pelo senso consultado. Outra evidência

de risco operacional, é que a região possui 73,1% de sua população urbana; embora os resultados

obtidos expressem um quantitativo com cerca de 50%.

4.2. Análise envoltória de dados

Para utilizar a metodologia DEA, deve-se primeiro definir as variáveis de identificação, de input

e de output. Para realizar este trabalho, as seguintes variáveis foram utilizadas:

Variáveis de identificação

Page 10: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

10

As variáveis de identificação refletem as características que definem os indivíduos considerados

atípicos pela análise apresentada anteriormente.

- Espécie: indica qual o tipo de benefício é concedido ao usuário. Com ela, é

possível saber quais benefícios são potencialmente mais suscetíveis à fraude;

- Sequencial:corresponde ao número de identificação do beneficiário da instituição

analisada. Ela tem a funcionalidade de diferenciar um indivíduo de outro;

- Localização geográfica: identifica a região do Brasil em que o indivíduo se

encontra. Ela indica o lugar em que o benefício é concedido e, consequentemente, a

tendência de dados atípicos por localidade brasileira;

- Sexo: classifica o indivíduo em masculino ou feminino. Esta classificação permite

a análise dos resultados pela tendência comparativa entre homens e mulheres.

Variáveis de input

As variáveis de input são as variáveis que atuam como entrada do processo de concessão de

benefícios.

- Data relativa: Considerando o princípio de eficiência do DEA – baixos valores de

entrada e altos valores de saída – deve-se criar uma nova variável de input que atenda tal

requisito. Esta variável é definida a partir das variáveis originais: Data de Nascimento dos

Beneficiários e Data de Início do Benefício. Primeiramente, estas datas foram

transformadas em números inteiros, a partir da data 01/01/1900 (padrão do Excel). Por

exemplo, se existir um número “2” nesse input de entrada do DEA, esse dado corresponde

à data 02/01/1900, o número “3” corresponde à data 03/01/1900, e assim sucessivamente.

Quanto menor a diferença entre os valores correspondentes à Data de Nascimento e à

Data de Início do Beneficio, menor era a idade da pessoa quando começou a receber o

benefício. Esta comparação de datas é explicitada pela fórmula (1):

(1)

Page 11: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

11

A análise desta fórmula indica que quanto menor o valor obtido, mais jovem é o indivíduo

em questão.

Uma vez que o DEA indica como potencial fraude os dados que possuem o input

pequeno, é necessário adequar esse resultado para que o conceito de eficiência do DEA

permaneça. Então, para a data relativa ser considerada input, foi utilizado a seguinte

adaptação da equação (1):

(2)

,

O resultado obtido sendo pequeno indica duas datas próximas, o que acarreta na

caracterização de uma perda operacional.

- Valor da renda mensal inicial: representa o valor que o indivíduo recebedor

ganhava mensalmente antes de se tornar um beneficiário. Esta variável é relevante por

representar a discrepância entre o valor inicial e final da renda, podendo encontrar

indivíduos que tiveram crescimentos de renda atípicos.

Variáveis de output

As variáveis de output são as variáveis que atuam como saída do processo de concessão de

benefícios.

- Valor bruto: esta variável se refere à quantia paga aos beneficiários sem nenhum

abatimento. Com isso, ela pode apontar uma discrepância nos recebimentos de benefícios

entre os indivíduos considerados.

- Crescimento da renda mensal: a variável é obtida através da relação entre o valor

da renda mensal inicial somado ao seu reajuste. Após tal soma, o valor obtido é dividido

pela renda mensal inicial visando obter a proporção de crescimento do valor recebido pelo

indivíduo. Porém, por se tratar de porcentagem, é necessário subtrair tal divisão por um,

visando encontrar somente o crescimento. A equação (3) expressa a função:

(3)

Page 12: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

12

Com essas variáveis e a partir dos resultados obtidos na clusterização, fez-se a análise DEA. Esta

análise teve como objetivo ranquear os dados já considerados atípicos pela clusterização de

acordo com sua eficiência relativa, ou seja, sua potencialidade de perda por fraude. O ranque

pode direcionar a apuração ou não de fraudes em uma ordem decrescente de certeza, além de

auxiliar a empresa a investigar os indivíduos que apresentam dados destoantes e criar uma rotina

de controle para evitar este cenário novamente.

Com o ranque é possível evidenciar uma relação entre as variáveis de input e output que conduz a

uma maior probabilidade de risco. A fim de legitimar o algoritmo realizado pelo software,

realiza-se uma análise amostral (aproximadamente 10% do universo) manualmente nos

resultados para verificar sua consistência. Calcula-se a média dos valores de input e de output dos

14 primeiros e 14 últimos DMU’s do ranque. Esta análise comprova que de fato o algoritmo

acusa como eficiente os DMU’s com valores baixos de input e valores altos de output. A tabela 2

abaixo representa tais médias:

Tabela 2- Médias entre inputs e outputs

Fonte:

Elaborado pelos autores (2013)

Com o resultado obtido, é possível classificar todos os 280 indivíduos considerados atípicos. A

tabela 3 abaixo apresenta os primeiros 50 indivíduos desse ranque:

Page 13: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

13

Tabela 3 - Ranque dos primeiros 50 indivíduos atípicos

Page 14: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

14

Resultado DEA

Ranking Nº de identificação DMU Valor Bruto Crescimento Data Relativa Valor da Renda Inicial Eficiência

1 193640 292896 0,07757601 0,01970661 37756,00 1,000000

2 12904 479600 0,28865483 0,38719434 16615,00 1,000000

3 82030 664723 0,51227112 0,66158099 12976,00 1,000000

4 197258 328652 0,46670264 0,79843142 7042,00 1,000000

5 197929 508404 0,57066337 0,74465463 8909,00 1,000000

6 163461 458120 0,01372283 0,44281130 210845,00 1,000000

7 147667 485823 0,51123119 0,66809863 9503,00 0,993629

8 195390 691536 0,37689994 0,47306146 18348,00 0,982390

9 136062 274158 0,08263204 0,18343836 33172,00 0,971540

10 174504 344967 0,46705524 0,73992958 7386,00 0,968516

11 190628 397574 0,48617341 0,76563485 8177,00 0,925656

12 117038 344700 0,12118123 0,27883275 28445,00 0,904286

13 197217 468585 0,47131865 0,71515343 9942,00 0,857718

14 197928 593360 0,36411389 0,53368054 16296,00 0,855758

15 188383 206700 0,34181939 0,82636915 6046,00 0,853069

16 1091 338408 0,11993054 0,29294878 28217,00 0,852718

17 188893 444458 0,44592957 0,71309729 9967,00 0,813754

18 34028 339528 0,41134965 0,69475981 8254,00 0,777497

19 197464 413864 0,20823346 0,43105373 19875,00 0,770810

20 196827 341345 0,41135816 0,76239835 8298,00 0,766527

21 195368 456747 0,28793230 0,54403564 15863,00 0,762833

22 1498 94600 0,21828868 0,87722233 4330,00 0,760675

23 3989 334693 0,12487948 0,33933194 26800,00 0,748909

24 20471 356284 0,15369229 0,39709708 23178,00 0,705230

25 413 258985 0,10538127 0,28131945 24576,00 0,689475

26 193728 371127 0,38197509 0,72191534 9716,00 0,688201

27 126296 393541 0,26720600 0,49008067 14728,00 0,684561

28 81869 378063 0,19876084 0,35073048 19021,00 0,677288

29 187017 361330 0,31950659 0,61124098 11309,00 0,672538

30 187738 342428 0,37224481 0,73430956 9199,00 0,660974

31 10306 384190 0,35224168 0,72752935 10907,00 0,651786

32 194277 336256 0,14418593 0,41677087 23321,00 0,636790

33 48428 323080 0,20206392 0,44252293 15989,00 0,623693

34 123539 322083 0,13497171 0,40736602 23863,00 0,621238

35 194920 335941 0,17077787 0,43515594 19669,00 0,620766

36 180611 335652 0,25063620 0,51683083 13392,00 0,614192

37 191591 358954 0,31086343 0,66662817 11547,00 0,601499

38 191873 158492 0,24694921 0,81597133 6418,00 0,595070

39 193380 323254 0,14584642 0,44276556 22164,00 0,582116

40 157072 359705 0,20362581 0,54964946 17665,00 0,578883

41 199200 359210 0,29041151 0,64538417 12369,00 0,578133

42 30085 325909 0,14173535 0,47812304 18273,00 0,572070

43 10769 347909 0,19413481 0,54991587 17921,00 0,557400

44 24701 321848 0,15160057 0,46698469 21230,00 0,553936

45 43527 287379 0,13240831 0,41433930 21704,00 0,550799

46 178505 286096 0,08789522 0,14183630 32545,00 0,549139

47 79582 330497 0,15985311 0,54985692 16202,00 0,544604

48 93182 350287 0,22186914 0,60413219 15788,00 0,541782

49 189035 330991 0,27614801 0,65689586 11986,00 0,541168

50 199326 332900 0,15490939 0,56557100 16719,00 0,532860

OUTPUT INPUT

Fonte:

Page 15: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

15

Elaborado pelos autores (2013)

O histograma representado na Figura 3 agrupa todos os 280 indivíduos por sua classificação no

ranque.

Figura4 – Eficiência dos dados atípicos

Fonte: Elaborado pelos autores (2013)

O eixo X do histograma representa o número de ocorrências encontradas e o eixo Y representa

valores de eficiências em um determinado intervalo.

Deve-se frisar que todos os indivíduos apresentados no gráfico acima já possuem características

incomuns do padrão do banco de dados disponível, por terem sido clusterizados anteriormente.

Contudo, entende-se que a grande maioria dos dados atípicos apresenta uma divergência mais

amena em relação aos potencialmente mais atípicos, diminuindo gradativamente o número de

indivíduos conforme aumenta o valor DEA.

5. Conclusão

A gestão de riscos é primordial para garantir que uma empresa atinja seus objetivos sem enfrentar

adversidades não esperadas. Embora a teoria desta gestão possa parecer relativamente simples,

sua principal premissa é a identificação das perdas e consequentemente dos riscos em que a

organização está imposta, o que requer o uso de ferramentas, metodologias e técnicas adequadas.

Page 16: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

16

Apesar da complexidade dos riscos serem variáveis, este artigo aborda um conjunto de

metodologias para melhorar a sua identificação, independente da sua origem e nível.

Assim, essas metodologias podem ser aplicadas em qualquer âmbito empresarial.

Especificamente para este estudo, o resultado aponta provavelmente possíveis fraudes ou falhas

de cadastro, o que varia de acordo com a realidade da empresa. A gestão de riscos é um processo

dinâmico, com isso deve-se sempre buscar instrumentos e ferramentas estatísticas paramétricas e

não paramétricas para modelos de controle que propiciem ações efetivas para sua mitigação.

REFERÊNCIAS

BANKER, R. D. Estimating most productive scale size using Data Envelopment Analysis.

European Journal of Operational Research, v. 17, p. 35-44, 1984.

BATISTA, D.; CARVALHO, A. Avaliação do desempenho operacional de uma serraria

através de estudo de tempo, rendimento e eficiência. Scientia Forestalis, v. 75, p. 31-38, 2007.

BERNSTEIN, P. L. Desafio aos Deuses: a Fascinante História do Risco. Rio de Janeiro:

Campus, 1997.

CARLTON, T. Risk and capital management in non-financial companies. Risk and Capital

Management Conference Proceedings, Australian Prudential Regulation Authority, 1999.

CHARNES, A.; COOPER, W.; RHODES, E. Measuring the efficiency of decision making

units. European Journal of Operational Research, v. 2, p. 429-444, 1978.

CHARNES, A; CLARK, W.; GOLANY, B. A developmental study of data envelopment

analysis in measuring the efficiency of maintenance units in the US air forces. Thompson and

R.M. Thrall, Eds., Annals Of Operation Research, v.2, p. 95-112, 1985.

COIMBRA, F. Gestão Estratégica de Riscos: Instrumento de Criação de Valor. Seminário

Nacional de Educação à Distância, 7, 2004. Anais… São Paulo: Universidade de São Paulo, 2004.

CULP, C. L. Risk Transfer Derivatives in Theory and Practice. USA: Wiley, 2001.

Page 17: MODELO DE GESTÃO DE RISCOS A PARTIR DA ...abepro.org.br/biblioteca/enegep2013_TN_STO_179_020_22142.pdforiginados de possíveis riscos operacionais. 1.1.1. Riscos operacionais Uma

XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos

Salvador, BA, Brasil, 08 a 11 de outubro de 2013.

17

DUBES, R.; JAIN, A. Clustering Techniques: The User’s Dilemma. Pattern Recognition, v. 8, p.

247-260, 1976.

FIGUEIRA, M. Identificação de Outliers. Millenium - Revista do Instituto Politécnico de Viseu,

Portugal, v. 1, n. 12, out. 1998. Disponível em: http://www.ipv.pt/millenium/arq12.htm. Acesso

em: 13 de mar. 2013.

FISHER, L.; VAN NESS, J. Admissible Clustering Procedures. Biometrika, v. 58, p. 91-104,

1971.

GOMES, L.C.T. ; VON ZUBEN, F. J. ; MOSCATO, P. A Proposal for Direct-Ordering Gene

Expression Data by Self-Organising Maps. Applied Soft Computing (Print), 2004.

INSTITUITO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Primeiros Resultados

Definitivos do Censo 2010: população do Brasil é de 190.755.799. Disponível em:

http://saladeimprensa.ibge.gov.br/noticias?view=noticia&id=1&busca=1&idnoticia=1866.

Acesso em: 20 de mar. 2013.

JAIN, A., MURTY, M. & FLYNN, P. Data Clustering: A Review, ACM Computing Surveys, v.

31, n. 3, p. 264-323, 1999.

JORION, P. Value at Risk. 2º ed. São Paulo: BM&F, 2004.

PORTER, E. M. Competição – Estratégias competitivas essenciais. 7ª Edição. Rio de Janeiro:

Editora Campus, 1999.

RAFF, D. M. G. Risk Management in an Age of Change. Philadelphia: Wharton School,

University of Pennsylvania, 2000.

SAS THE POWER TO KNOW. Soluções: fraudes e crimes financeiros. Disponível em:

http://www.sas.com/offices/latinamerica/brazil/solucoes/fraude.html. Acesso em: 18 de mar.

2013.