anais 18º congresso de computaÇÃo e sistemasulbra-to.br/encoinfo/download/anais/2016.pdf · a...

161
XVII Encoinfo Congresso de Computação e Sistemas de Informação ISSN: 2447-0767 1 ENCOINFO 2016 XVIII Congresso de Computação e Sistemas de Informação 09 a 12 de Maio de 2016 Palmas – Tocantins ANAIS 18º CONGRESSO DE COMPUTAÇÃO E SISTEMAS Realização Curso de Bacharelado em Sistemas de Informação Curso de Bacharelado em Ciência da Computação

Upload: donga

Post on 20-Sep-2018

259 views

Category:

Documents


3 download

TRANSCRIPT

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 1

    ENCOINFO 2016 XVIII Congresso de Computao e Sistemas de Informao

    09 a 12 de Maio de 2016 Palmas Tocantins

    ANAIS 18 CONGRESSO DE COMPUTAO E SISTEMAS

    Realizao

    Curso de Bacharelado em Sistemas de Informao Curso de Bacharelado em Cincia da Computao

  • 2 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Nota: Os conceitos e a redao contidos nos resumos dos artigos so de exclusiva responsabilidade de seus autores, pois os mesmos foram transcritos na ntegra para esta publicao.

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 3

    ENTIDADE MANTENEDORA

    Associao Educacional Luterana do Brasil

    Presidente Paulo Augusto Seifert

    CENTRO UNIVERSITRIO LUTERANO DE PALMAS

    Reitor Adriano Chiarini da Silva

    Diretora Acadmica Parcilene Fernandes de Brito Diretora Acadmica Adjunta

    Adriana Ziemer Gallert Dimy Sousa Freitas

    Diretora Administrativa Shirley Silvia Borges de Oliveira Rodrigues

    Assessora da Reitoria Alda Adriana Lima Gonalves

    Assessor Jurdico Josu Pereira de Amorim

    Coordenadora de Pesquisa Conceio Aparecida Previero

    Coordenadora de Ps-Graduao Micheline Pimentel Ribeiro

    Coordenador de Extenso e Assuntos Comunitrios Luiz Gustavo Santana

    Secretria Geral Drili Drvela Cabral Arajo

    Assessor de Comunicao Social Leonardo Maximiano

    Capelo Pastor Ari Schulz

  • 4 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Bacharelado em Sistemas de Informao Bacharelado em Cincia da Computao

    Coordenadora dos Cursos Parcilene Fernandes de Brito

    Coordenadora Adjunta de Sistemas de Informao

    Madianita Bogo Marioti

    Coordenador Adjunto de Cincia da Computao Fabiano Fagundes

    Coordenador de Estgios e de Trabalhos de Concluso de Curso

    Fernando Luiz de Oliveira

    Coordenador do Projeto Informtica & Sociedade Fernando Luiz de Oliveira

    Edeilson Milhomem da Silva

    Coordenadores da Fbrica de Software Jackson Gomes de Souza

    Edeilson Milhomem da Silva

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 5

  • 6 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    ENCOINFO 2016

    Comisso Organizadora

    Cristina DOrnellas Filipakis Edeilson Milhomem da Silva

    Fabiano Fagundes Fernando Luiz de Oliveira Jackson Gomes de Souza Madianita Bogo Marioti

    Parcilene Fernandes de Brito

    Arte e Capa Jackson Gomes de Souza

    Site do Evento

    Fbrica de Software

    Fbrica de Software Edeilson Milhomem da Silva

    Jackson Gomes de Souza Antnio Carlos Mota Jnior

    Gabriel Borges Lucas Henrique Roese

    Murillo Roseno Robson Ferreira Gomes

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 7

  • 8 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Equipe Editorial

    Editora Chefe

    Parcilene Fernandes de Brito

    Editores Assistentes

    Jackson Gomes de Souza

    Edeilson Milhomem da Silva

    Fabiano Fagundes

    Comit Tcnico

    Alberto Csar Cavalcanti Frana Universidade Federal Rural de Pernambuco

    Andreia Rosangela Kessler Mhlbeier Instituto Federal de Santa Catarina

    Bruno Vilar Instituto de Pesquisas Eldorado

    Daniel Costa de Paiva Universidade de So Paulo

    Edilson Ferneda - Universidade Catlica de Braslia

    Eliane Pozzebon - Universidade Federal de Santa Catarina

    Flavius Gorgnio Universidade Federal do Rio Grande do Norte

    Kalil Araujo Bispo - Universidade Federal de Sergipe

    Leandro Maciel Almeida Universidade Federal de Pernambuco

    Leandro Pasa Universidade Tecnolgica Federal do Paran/Universidade Federal do Rio Grande do Norte

    Luciana de Oliveira Rech Universidade Federal de Santa Catarina

    Luciano de Souza Cabral Instituto Federal de Pernambuco

    Maria Adelina Silva Brito Universidade de So Paulo

    Maristela Oliveira dos Santos Universidade de So Paulo

    Paulyne Juc Universidade Federal do Cear

    Raul Sidnei Wazlawick - Universidade Federal de Santa Catarina

    Ricardo Arajo Costa - Banco Central do Brasil

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 9

    Rodolfo Adamshuk Silva Universidade de So Paulo

    Silvana Morita Melo Universidade de So Paulo

    Simone Senger Souza Universidade de So Paulo

    Tales Rebequi - Banco Ita - Tecnologia

    Victor Hugo Santiago Costa Pinto Universidade de So Paulo

  • 10 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 11

    APRESENTAO

    O Encoinfo atinge a maturidade. O que comeou como o primeiro Encontro de Estudantes

    de Computao e Informtica do Tocantins foi se desenvolvendo e chegou ao seu dcimo-

    oitavo ano como Congresso de Computao e Sistemas de Informao.

    Buscou-se, desde a primeira edio, oferecer comunidade tocantinense a possibilidade de

    apresentar e publicar artigos completos nos anais de um evento cientfico de qualidade.

    Estes artigos so avaliados por um Comit Cientfico e a reviso ocorre de acordo com o

    sistema duplo de reviso annima ou cega, em que tanto os nomes dos revisores quanto dos

    autores permanece sigiloso durante o processo de avaliao.

    Foi com estas publicaes em seus currculos, desde l no incio e ainda agora, que muitos

    alunos foram aceitos em programa de ps-graduao de renome em todo o pas. Uma volta

    no tempo e, ao ver os 8 artigos apresentados no primeiro evento, observamos que de 7

    deles saram professores universitrios que atua hoje em instituies de ensino do Tocantins

    e Gois. Proporo que se mantm nos eventos seguintes, evidenciando que um dos

    objetivos iniciais do evento foi atingido com sucesso.

    E com isso em mente e com a certeza da concretizao de sonhos de quem esteve l em

    1999 criando este evento que oferecemos comunidade o 18 Congresso de Computao e

    Sistemas de Informao.

    Que venham mais 18 anos!

    Comisso Organizadora

  • 12 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 13

    SUMRIO

    Palestrantes ...................................................................................................................... 15

    Minicursos ........................................................................................................................ 19

    Artigos Completos

    A Importncia da Auditoria de TI: Estudo de Caso em um rgo do Governo

    do Estado do Tocantins ..................................................................................................... 25

    Fabricio da Silva Rodrigues, Brunna Caroline do Carmo Mouro,

    Thatiane de Oliveira Rosa

    Adequao e Testagem do IMP Digital para a Anlise do Esquema Corporal ............... 34

    Leomar Camargo de Souza, Pierre Soares Brando, Fernando Luiz de Oliveira,

    Fabiano Fagundes

    Aplicao da Tcnica de Text Mining para Comentrios Relacionados ao

    Contexto do Turismo ......................................................................................................... 43

    Felipe Eduardo Bechert Schmitz, Parcilene Fernandes de Brito

    Aplicao das Boas Prticas da User Experience na Nova Interface

    do Portal (En)Cena ............................................................................................................ 52

    Srgio Silva Barros, Parcilene Fernandes Brito

    Aplicao de Ferramenta OLAP para Identificar Quebras de Ligaes Qumicas em

    Molculas de Antocianina ................................................................................................. 61

    Ranyelson Neres Carvalho, Madianita Bogo Marioti, Walkiria Regis de Medeiros

    Avaliao dos Processos de Desenvolvimento de Software das Unidades

    Organizacionais da Administrao Pblica do Estado do Tocantins

    com Base no MPS.BR ....................................................................................................... 70

    Felipe Oliveira Simes, Tathinay de Souza Siqueira,

    Brunna Caroline do Carmo Mouro, Thatiane de Oliveira Rosa,

    Andr Mesquita Rincon

    CODE LIVE: Gamificao de um Ambiente Virtual de Programao ............................ 78

    Djonathas Carneiro Cardoso, Jesiel Souza Padilha, Jackson Gomes de Sousa, Fabiano

    Fagundes, Parcilene Fernandes de Brito

    Estudo da Segmentao do ICMS no Estado do Tocantins entre 2013 e 2014 ................ 87

    Leomar Camargo de Souza, Haroldo Fernando Fritsch, Fernando Luiz de Oliveira

    Modelo de inferncia de locais potencialmente favorveis a acidentes fatais e

    graves em Palmas-TO ....................................................................................................... 97

    Pedro Henrique Gomes Camargo, Fernando Luiz de Oliveira,

    Felipe Dias da Silva Cabral, Joo Batista Borges Junior, Maicon Juliano Fristh

    Modelo de Inferncia de Preferncias de Clientes em Shoppings Centers ....................... 104

  • 14 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Douglas J. Ramalho Araujo, Jackson Gomes Souza, Parcilene Fernandes de Brito,

    Edeilson Milhomem da Silva

    Modelo de Visualizao de Informao de um Processo de Anlise de

    Sentimentos no Contexto do Turismo ............................................................................... 113

    Lucas Henrique Roese, Parcilene Fernandes de Brito

    ORDENA Um Jogo Educacional para Auxlio ao Ensino de Mtodos

    de Ordenao ..................................................................................................................... 123

    Haroldo Fernando Fritsch, Edeilson Milhomem da Silva, Jackson Gomes de Souza

    Proposta de Framework para uso Coexistente de Prticas geis das

    Metodologias Scrum e TDD ............................................................................................. 132

    Mrcia M. Savoine, Joyce Karoline M. Matias, Vanessa F. Rocha,

    Andr M. Rincon, Andr Magno C. Arajo

    Sistema de Avaliao de Usabilidade: usando Heursticas de Usabilidade

    e Inteligncia Artificial para a Avaliao Ergonmica de Softwares ............................... 141

    Fernando Lcio, Guilherme Reinaldo, Matheus Gregorio, Miguel Lemos,

    Rodrigo Melo

    Utilizao do Algoritmo de Mquina de Vetores de Suporte (SVM) para

    Predio de Dados Climticos ........................................................................................... 149

    Kevin Martins Arajo, Edeilson Milhomem da Silva

    Programa .......................................................................................................................... 159

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 15

    PALESTRANTES

  • 16 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 17

    Gisele L. Pappa DCC/UFMG

    Palestra: Inteligncia Computacional: Passado, Presente e Futuro

    Resumo: A rea de inteligncia computacional engloba vrios mtodos computacionais

    inspirados na natureza, tais como algoritmos genticos - que so inspirados na teoria da

    evoluo de Darwin, e redes neurais artificiais - inspiradas no funcionamento do crebro humano.

    Essa palestra ir introduzir a rea de inteligncia computacional, mostrar como os primeiros

    algoritmos foram concebidos, discutir os mtodos mais utilizados nos dias de hoje e as

    tendncias para o futuro em termos de algoritmos e aplicaes.

    Mini CV: Professora do Departamento de Cincia da Computao da UFMG e Bolsista de

    Produtividade em Pesquisa Nvel 2 do CNPq. Ela doutora em Cincia da Computao pela

    Universidade de Kent, na Inglaterra (2007). Foi coordenadora do comit de programa do BRACIS

    2015 (principal conferncia nacional na rea de inteligncia artificial), alm de estar envolvida em

    diversas atividades da GECCO (conferncia internacional sobre computao bio-inspirada) desde

    2012 Seus principais interesses de pesquisa esto nas reas de aprendizado de mquina e

    inteligncia computacional, com foco em algoritmos de programao gentica. Dentre seus

    ltimos projetos, destacam-se o foco nos dados vindos de redes sociais e suas aplicaes na

    sade e no monitoramento de eventos.

  • 18 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Anselmo Castelo Branco Ferreira

    Recod/UNICAMP

    Palestra: Problemas e Solues em Anlise Forense de Documentos

    Resumo: A popularizao da tecnologia da informao nos dias de hoje ampliou os conceitos de

    crime. A tecnologia forense, antes aplicada anlise por meios computacionais de pistas deixadas

    em locais fsicos, precisa tambm analisar documentos em computadores visando a busca de

    indcios de crimes nos mesmos. Nessa palestra sero abordadas as principais tcnicas propostas

    na literatura cientfica em Anlise Forense de Documentos: tcnicas responsveis por atribuir a

    origem de um documento (atribuio de fonte), que verificam se h mensagem escondida em

    imagens (esteganlise), que identificam tentativas de burlar sistemas biomtricos (anti-spoofing)

    e que verificam se um documento digital como uma imagem verdadeiro ou manipulado

    (deteco de adulteraes). Tambm sero discutidos os principais problemas encontrados por

    peritos forenses na rea, como os avanos na tecnologia e tcnicas anti-forenses bem como os

    desafios atuais na rea.

    Mini CV: Anselmo Castelo Branco Ferreira formado em Tecnologia em Anlise e

    Desenvolvimentos de Sistemas pela Faculdade de Tecnologia da UNICAMP. Possui mestrado em

    Tecnologia e Inovao pela UNICAMP e atualmente cursa doutorado no Instituto de Computao

    da UNICAMP, orientado pelo prof. Dr. Anderson Rocha. membro do laboratrio de inferncia

    em dados complexos (RECOD) do Instituto de Computao da UNICAMP, onde pesquisa a

    padronizao de tcnicas para a identificao de adulteraes em imagens, atribuio de fonte de

    documentos e busca de crimes em imagens de sensoriamento remoto. revisor de trs

    peridicos cientficos internacionais e sua pesquisa focada em solues de Viso Computacional

    e Aprendizado de Mquina aplicadas ao reconhecimento de crimes em documentos.

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 19

    MINICURSOS

  • 20 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 21

    Arduino

    Glaycow Sivleira e Antnio Carlos Mota Jnior - Acadmicos de Sistemas de Informao e Cincia da Computao CEULP

    Aprendizagem de Mquina: Redes Bayesianas

    Douglas Ramalho - Egresso de Sistemas de Informao CEULP

    Desenvolvimento de Aplicativos para Dispositivos Mveis com Ionic Framework

    Van Neves - Egresso de Sistemas de Informao CEULP

    Introduo ao Web Design com HTML 5 e CSS 3

    Gabriel Borges e Robson Gomes - Fbrica de Software do CEULP

    Desenvolvimento Front-End com AngularJS

    Lucas Henrique Roese e Jesiel Souza Padilha - Fbrica de Software do CEULP

    Canvas e Design Thinking

    Jeferson Moraes e Brbara Nunes SEBRAE

    Desenvolvimento Web com Python e Django

    Fbio Castro Arajo e Charles Rockenbach - Egressos de Sistemas de Informao CEULP

  • 22 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 23

    ARTIGOS COMPLETOS

  • 24 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 25

    A Importncia da Auditoria de TI: Estudo de Caso em um rgo

    do Governo do Estado do Tocantins

    Fabricio da Silva Rodrigues1, Brunna Caroline do Carmo Mouro

    1, Thatiane de

    Oliveira Rosa1

    1 Curso de Gesto da Tecnologia da Informao - Instituto Federal de Educao, Cincia e

    Tecnologia do Tocantins, Campus Paraso (IFTO)

    Distrito Agroindustrial, BR 153, KM 480 Caixa Postal 151 77.600-000 Paraso do

    Tocantins TO Brasil

    [email protected], [email protected],

    [email protected]

    Resumo. A TI tem se demonstrado um fator de sucesso dentro das organizaes,

    devido s vantagens que ela proporciona. Diante disso, o controle dos processos de

    TI se faz importante, alm de ser necessrio que ela esteja alinhada com os

    objetivos da organizao e por isso precisa de um planejamento e monitoramento.

    Logo, os gestores devem ter um olhar estratgico sobre a TI e sempre avaliar os

    seus processos para que assim confirme se os seus objetivos esto conforme os do

    negcio. Diante deste contexto, o objetivo deste trabalho avaliar a infraestrutura

    de TI de uma organizao pblica, por meio do procedimento de auditoria de TI.

    1. Introduo Com o passar dos anos, a TI tem ganhado importncia no ambiente organizacional,

    aumentando assim a necessidade dos gestores realizarem monitoramento e avaliao dos

    processos, para que assim possa utiliz-la de forma mais eficiente. Diante disso, foram criados

    mtodos e prticas para gerenciar processos de TI, surgindo o conceito de governana de TI,

    que tem como finalidade organizar, monitorar e controlar os processos, de forma que fique

    mais transparente possvel o seu papel dentro da organizao perante os stakeholders, fazendo

    com que a TI possa cada vez mais estar alinhada aos objetivos da organizao. A partir disso,

    foram desenvolvidas ferramentas como o COBIT (Control Objectives for Information and

    Related Technology).

    Nas ltimas dcadas, o conceito de auditoria de TI tem sido muito discutido em

    organizaes pblicas e privada. No caso das organizaes pblicas, existe uma grande

    necessidade de controle e monitoramento da utilizao da TI, o que as obriga a fazerem uso

    de auditorias, para verificar os aspectos relativos confiabilidade, integridade, eficcia,

    eficincia, confidencialidade, disponibilidade, e conformidade, das informaes geridas pela

    TI dentro da organizao (MONTEIRO, 2008).

    Auditoria de TI um tipo de averiguao na qual se analisa sistemas, ambiente

    computacional, infraestrutura de TI, segurana das informaes, e controle interno da

    organizao identificando as fraquezas e pontos fortes (DIAS, 2000). Para realizar uma

    auditoria de TI preciso conhecer os seus processos existentes na organizao a ser auditada.

    Como parmetro deve-se utilizar a documentao do COBIT, normas de governana, servios

    e manuais de auditorias de TI, para que se possa ter uma direo de como proceder

    (HANASHIRO, 2009).

    Segundo Hanashiro (2009), o assunto auditoria de TI muito amplo, pois existem

    vrios tipos, como: Auditoria de Infraestrutura; Auditoria de Gesto; Auditoria de Segurana;

    Auditoria de Licitaes e Contratos; e Auditoria de Softwares. importante ressaltar que o

    presente trabalho ir abordar a Auditoria de Infraestrutura de forma mais detalhada. Esse tipo

    de auditoria foi escolhido, pois segundo Weill e Ross (2006), a infraestrutura a base da

    capacidade da TI, tida como servios compartilhados pela organizao e coordenados

    centralmente. Alm disso, o conjunto de sistemas de infraestrutura fornece a capacidade

  • 26 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    humana e tcnica que alavanca a capacidade do negcio, que necessria para o

    posicionamento competitivo da organizao.

    Diante do contexto apresentado, esta pesquisa visa avaliar a infraestrutura de uma

    organizao pblica no Estado do Tocantins, utilizando procedimento de auditoria baseado

    em modelos e normas.

    2. Infraestrutura e Auditoria de TI Weill e Ross (2006) consideram a infraestrutura de TI a base tecnolgica de uma organizao,

    a qual tem por objetivo subsidiar componentes tecnolgicos para disponibilizar servios

    confiveis, que so compartilhados em uma organizao. Concordando com Miglioli (2006) e

    Albertin (2005), que afirmam que a infraestrutura de TI organizada e formada por hardware,

    software, banco de dados, redes de computadores e pessoas. Atravs desses componentes

    possvel manipular, gerar, distribuir dados e informaes para toda organizao.

    Visto que cada vez mais processos dependem da TI para serem executados, a

    realizao de auditorias por parte dos rgos mostra-se essencial para garantir que a gesto de

    TI colabore para o atendimento dos objetivos da organizao. Assim como favorea a

    avaliao correta de riscos de TI (MONTEIRO, 2008). Outro fato relevante para a realizao

    de auditorias que hoje as informaes que transitam nas organizaes so geridas, em sua

    maioria, por ferramentas de TI (HANASHIRO, 2007).

    Segundo Hanashiro (2009) a auditoria de TI tem o objetivo de verificar a

    conformidade e a operacionalidade dos controles dos processos, que se baseiam em

    Tecnologia da Informao. Albertin (2002) complementa informando que a auditoria est

    baseada em confiana e controles internos, visando confirmar se tais controles existem, foram

    implementados e se so confiveis. Esta pesquisa est direcionada infraestrutura, escolha

    que se fundamenta no estudo de Weill e Ross (2006), onde afirmam que a infraestrutura a

    base da capacidade da TI, que alavanca a capacidade humana e tcnica e consequentemente a

    capacidade do negcio, que necessria para o posicionamento competitivo da organizao

    no mercado.

    Para realizar uma auditoria de TI necessrio cumprir etapas, e cada etapa tem seu

    objetivo. Monteiro (2008) orienta que ela seja realizada em quatro etapas, sendo:

    planejamento, execuo, relatrio e acompanhamento.

    Planejamento: onde o auditor independente estabelece a estratgia de execuo, definindo o objetivo geral, o objeto a ser auditado, e os procedimentos gerais (TCU, 2010; CFC, 2008;

    HANASHIRO, 2007). Esta etapa composta pelas seguintes atividades (TCU, 2010): anlise

    preliminar do objeto de auditoria, definio do objetivo e escopo da auditoria, especificao

    dos critrios de auditoria, elaborao da matriz de planejamento, validao da matriz de

    planejamento, elaborao de instrumentos de coleta de dados, e elaborao do projeto de

    auditoria;

    Execuo: consiste em executar o planejamento elaborado a fim de se obter evidncias. As principais atividades realizadas so: desenvolvimento dos trabalhos de campo, anlise dos

    dados coletados, elaborao da matriz de achados, validao da matriz de achados, elaborao

    da anlise de riscos (TCU, 2010);

    Relatrio: Todas as atividades realizadas sero registradas, para que seja possvel extrair evidncias e informaes de como est o desempenho das atividades executas e tambm obter

    feedback (TCU, 2010);

    Acompanhamento: Nesta etapa o principal ponto o monitoramento de tudo que foi implantado e executado, utilizando para isso mtricas para mensurar o andamento das

    atividades (TCU, 2010).

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 27

    3. COBIT O COBIT um modelo que contm todos os domnios e processos de governana de TI,

    tendo como objetivo auxiliar os auditores de sistemas, gerentes de TI e administradores em

    geral a visar um melhor direcionamento tecnolgico para a organizao atravs de mtodos e

    prticas de excelncia. Ele prope uma srie de objetivos e de boas prticas a serem seguidos

    (COBIT 4.1, 2007).

    O COBIT possui quatro domnios, os quais permitem que gestores e auditores de TI

    definam melhor as medies e controlem a governana, que so: Planejar e Organizar,

    Adquirir e Implementar, Entregar e Suportar e Monitorar e Avaliar. Cada domnio possui seus

    processos, totalizando 34 (COBIT 4.1, 2007). Alguns dos processos que se mostram

    relevantes para esta pesquisa, so elencados a seguir.

    Planejar e Organizar: PO1 - Definir o plano estratgico de TI; PO4 - Definir a organizao de TI e seus relacionamentos; PO5 - Gerenciar os investimentos de TI; PO6 - Gerenciar a

    comunicao das direes de TI; PO9 - Avaliar os Riscos;

    Adquirir e Implementar: AI1 - Identificar solues automatizadas; AI4 - Manter operao em uso; AI6 - Gerenciar mudanas; AI7 - Instalar e certificar solues e mudanas;

    Entregar e Suportar: ES1 - Definir e manter os acordos de nveis de servios; ES4 - Assegurar a continuidade dos servios; ES5 - Garantir a segurana dos servios; ES10 -

    Gerenciar problemas e incidentes; ES12 - Gerenciar a infraestrutura fsica; ES13 - Gerenciar

    as operaes;

    Monitorar e Avaliar: MA1 - Monitorar e avaliar o desempenho; MA2 - Monitorar e avaliar os controles internos; MA4 - Prover a governana de TI.

    O COBIT possui um modelo de maturidade, composto por seis nveis, que visa

    identificar o grau de maturidade atual da organizao (Tabela 1).

    Tabela 1. Nveis de Maturidade (COBIT 4.1, 2007).

    Nvel Maturidade

    0 Inexistente No existe um processo definido, a organizao no reconhece um gerenciamento a ser iniciado.

    1 Inicial/Ad hoc A organizao reconhece que precisa ser resolvido alguns problemas, mas no inicia um processo

    padronizado, mostrando muita desorganizao desses processos.

    2 Repetvel, porm

    Intuitivo

    Os processos neste estgio so reconhecidos e padronizados, mas no h uma comunicao e um

    treinamento formal dos procedimentos, a reponsabilidade fica mais por parte de cada indivduo.

    3 Processo Definido Neste estgio os procedimentos j so definidos, padronizados, documentados e comunicados,

    aqui feito um treinamento.

    4 Gerenciado e

    Mensurvel

    realizado um controle contnuo do que j foi implementado, e analisado o feedback, buscando,

    atravs disso, melhorias ou mudanas nos processos j definidos.

    5 Otimizado Neste estgio, grande parte dos processos esto bem refinados, buscando sempre a otimizao para

    aprimorar a qualidade e efetividade da organizao.

    Aps compreender o COBIT de forma genrica, a prxima seo realiza uma

    explanao sobre a norma ISO NBR 27002, que dispe sobre a segurana da informao e

    possui alguns procedimentos relacionados auditoria de infraestrutura de TI.

    4. ISO/IEC NBR 27002 A norma NBR ISO/IEC 27002, dispe sobre a segurana da informao, estabelecendo

    diretrizes e princpios para planejar, organizar, implementar, monitorar e melhorar a

    segurana da informao em uma organizao. Esta norma contm 11 sees de controle

    de segurana da informao, sendo que cada seo tem sua categoria e cada categoria

    principal tem a sua definio e os objetivos a serem alcanados. A Tabela 2 apresenta os

    Controles de Segurana da Informao (CSI) e seus objetivos.

    Tabela 2. Controles de Segurana da Informao (NBR ISO/IEC 27002, 2005).

    Controle Objetivo

    CSI 1. Poltica de Segurana da

    Informao

    Estabelecer um planejamento de segurana da informao, alinhada com os

    objetivos da organizao. Elaborar um documento contendo diretrizes e

    mtodos relacionados segurana da informao.

  • 28 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    CSI 2. Organizando a Segurana da

    Informao

    A segurana da informao deve ser gerenciada, para iniciar e controlar a

    implementao de sua segurana dentro da organizao.

    CSI 3. Gesto de Ativos Administrar, manter e proteger todos os ativos da organizao.

    CSI 4. Segurana em Recursos

    Humanos

    Conscientizar e assegurar que todo o pessoal envolvido na organizao,

    entenda suas responsabilidades e assinem acordos sobre os seus papis e

    responsabilidades.

    CSI 5. Segurana Fsica e do

    Ambiente

    A proteo das instalaes fsicas se faz necessria para proteo dos dados

    lgicos, preveno ao acesso fsico no autorizado, danos e interferncias.

    CSI 6. Gesto das Operaes e

    Comunicaes

    Administrar as operaes e comunicaes garantindo a operao segura e

    correta dos recursos de processamento da informao, definir procedimentos

    e responsabilidades pela gesto e operao de todos os recursos de

    processamento das informaes.

    CSI 7. Controle de Acesso Controlar o acesso informao e proteg-la de modo que somente pessoas

    autorizadas possam ter acesso, de acordo com seu privilgio.

    CSI 8. Aquisio, Desenvolvimento

    e Manuteno dos Sistemas de

    Informao

    Garantir que a segurana parte integrante dos sistemas de informao

    CSI 9. Gesto de Incidentes de

    Segurana da Informao

    As fragilidades e eventos de segurana da informao encontrados devem

    ser comunicados, permitindo a ao corretiva em tempo hbil.

    CSI 10. Gesto da Continuidade do

    Negcio

    A continuidade do negcio no deve ser interrompida, para isso, deve-se

    proteger os processos crticos contra erros ou desastres significativos.

    CSI 11. Conformidade O projeto, o sistema, a operao, o uso, e a gesto devem estar em

    conformidade com os requisitos legais.

    Vale ressaltar que a seo Segurana fsica e do ambiente ser adotada como base

    para realizar a anlise de segurana da informao, na organizao estudada. Esta seo

    da norma NBR ISO/IEC 27002 dispe sobre a segurana dos equipamentos e do ambiente.

    Assim parte do pressuposto de que toda informao lgica est inserida em ambiente fsico,

    ou em um equipamento. Portanto, para que seja possvel proteger os dados lgicos,

    necessrio proteger e prevenir possveis riscos relacionados s instalaes fsicas (NBR

    ISO/IEC 27002, 2005). Diante disso, a norma apresenta as seguintes recomendaes:

    Proteo do acesso ao ambiente, Proteo contra ameaas externas e do meio ambiente,

    Proteo dos equipamentos de TI, Segurana do cabeamento e Manuteno dos

    equipamentos.

    5. Resultado e Discusses

    5.1. Caracterizao da Instituio Estudada

    A instituio escolhida para a realizao do estudo de caso constitui-se em uma unidade de

    um rgo do Governo do Estado do Tocantins, que visa prestar servios relacionados rea

    agropecuria. Dentre os servios prestados pode-se citar fiscalizao de lojas agropecurias e

    de vacinao dos animais em reas de riscos, entre outros servios, Nesse contexto a TI

    mostra-se um recurso muito importante para atingir a realizao dos servios propostos.

    A instituio possui uma Coordenao de TI, com objetivo de criar ferramentas e gerir

    os equipamentos computacionais, para a eficincia da realizao das atividades dos

    funcionrios. Um dos principais sistemas utilizados pela instituio foi desenvolvido por tal

    coordenao. Para que as unidades de atendimento, que compem esse rgo, possam utilizar

    o sistema em questo e usufruir dos seus benefcios, deve-se ter uma infraestrutura de TI

    composta por no mnimo: computador, impressora, modem roteador, linha telefnica, acesso

    internet e funcionrios capacitados para operar o sistema.

    5.2. Procedimentos Realizados

    No contexto deste trabalho o objeto de auditoria constitui-se da Infraestrutura de TI da

    unidade adotada para o estudo de caso. O objetivo da realizao da auditoria em questo

    analisar a infraestrutura de TI do ambiente, esclarecendo como esta composta e utilizada e

    quais prticas os gestores podero seguir para se ter um melhor aproveitamento da

    infraestrutura de TI.

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 29

    O responsvel pela realizao da simulao de auditoria em questo foram os autores

    deste trabalho. Portanto, para executar tal simulao e avaliar a infraestrutura da unidade, os

    procedimentos realizados foram os seguintes:

    1 procedimento: Anlise de infraestrutura de rede, envolvendo elementos como cabeamento, dispositivos, estrutura e problemas da rede;

    2 procedimento: Anlise dos sistemas operacionais e softwares instalados nas mquinas, sendo verificada a compatibilidade com programas essenciais e problemas no sistema

    operacional;

    3 procedimento: Anlise da segurana fsica do ambiente, examinando extintores de incndio, aterramento dos equipamentos e sistemas de alarmes e proteo;

    4 procedimento: Anlise do mecanismo de armazenamento de arquivos, sendo averiguados os procedimentos e equipamento de backup;

    5 procedimento: Aplicao de um questionrio subjetivo no formato de entrevista oral com o responsvel tcnico em TI da unidade, e na aplicao do questionrio objetivo para o

    chefe geral da unidade, para que fosse possvel avaliar o controle interno da unidade.

    5.3. Resultados Encontrados

    A partir da aplicao dos questionrios e do estudo feito no processo de avaliao de riscos

    (PO09) relacionado ao domnio de planejamento e organizao do COBIT tornou-se possvel

    realizar uma anlise de riscos de TI encontrados na organizao. Os resultados encontrados

    so apresentados na Tabela 3.

    Tabela 3. Anlise de Riscos

    Nome Descrio Probabilidade Magnitude Impacto Mitigao

    Acesso rede

    somente via

    cabo.

    Alcance de

    cobertura de rede

    limitada.

    Altamente

    provvel Baixa

    Acesso internet e

    rede local s pode ser

    realizado por meio de

    computadores ou

    dispositivos via cabo.

    Adquirir um

    dispositivo de

    modem

    roteador WI-

    FI.

    Perda total de

    arquivos.

    Perda total de

    arquivos

    armazenados nos

    computadores.

    Provvel Alta

    Arquivos importantes

    podero no ser

    recuperados caso o

    computador

    apresente um

    problema grave.

    Realizar

    backup mensal

    dos arquivos

    utilizando

    acesso remoto.

    Erros e falhas no

    computador.

    Computador pode

    apresentar muitos

    problemas, por

    falta de

    manutenes

    preventivas.

    Provvel Alta

    O computador fica

    indisponvel para uso

    no atendimento ao

    pblico, uma vez que

    preciso desloca-lo

    para o setor de

    suporte de TI, a fim

    de executar

    manuteno

    corretiva.

    Realizar

    manuteno

    preventiva por

    meio de

    assistncia

    remota.

    Quantidade

    excessiva de

    cabos rede de

    internet.

    Aumento

    excessivo de

    utilizao de cabos

    ethernet.

    Muito provvel Mdia

    Desorganizao no

    ambiente, e

    probabilidade de

    acontecer problemas

    nos cabos.

    Estruturar e

    organizar

    cabos de rede

    ou adquirir

    dispositivo

    WI-FI.

    Falhas de

    equipamentos e

    curto- circuito na

    rede eltrica

    (conforme

    ISO/IEC27002:

    Falta de

    aterramento. Pouco provvel Alta

    Choques eltricos,

    equipamentos podem

    no funcionar

    corretamente, risco

    de incndio.

    Implantar um

    aterramento.

  • 30 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    2005)

    Incndio

    (conforme

    ISO/IEC27002:

    2005)

    Falta de extintor de

    incndio. Pouco provvel Alta

    Risco de vida dos

    funcionrios.

    Adquirir

    extintor de

    incndio.

    Alm da anlise dos riscos, realizou-se um diagnstico da infraestrutura de TI do

    ambiente utilizando como base as respostas obtidas a partir dos questionrios e das

    observaes in loco. Os resultados dessa anlise so exibidos na Tabela 4.

    Tabela 4. Anlise das Observaes

    Processo de TI Resultados encontrados

    Hardware

    - Falta de equipamentos reservas (nobreak, modem, impressora e switch);

    - Falta de manuteno preventiva de hardware;

    - Pouca memria RAM instalada em um dos computadores;

    - Desligamento inesperado de computadores devido a bateria de o nobreak estar desgastada.

    Recomendaes:

    - Adotar polticas de manutenes preventivas: Fazer averiguaes nos equipamentos de TI para

    acompanhar se esto funcionando corretamente;

    - Incentivo de planejamento e investimento em novos hardwares: Adquirir equipamentos que

    resultem na melhor execuo dos processos, realizar um levantamento de quais equipamentos

    esto em desuso e quais precisam ser trocados, investir na compra de mais equipamentos de

    hardware para serem substitutos caso venha acontecer algum problema.

    Software

    - Softwares instalados nos computadores esto em perfeito funcionamento.

    - O software denominado de Kurupira mostrou-se interessante, pois proporciona bloqueio de sites

    proibidos, no entanto foi observado que um dos computadores encontra-se sem esse software

    instalado, permitindo assim o acesso a sites proibidos por parte do usurio.

    - Foi encontrado um problema de um dos computadores est instalado o sistema operacional

    Windows 7 de 32 bits, sendo que o computador possui 4GB de memria RAM, ocasionado assim

    a perda de 1GB, ou seja, o computador est utilizando somente 3 GB da memria RAM.

    Recomendaes:

    - Adotar polticas de manuteno preventiva de software: verificar periodicamente se todos os

    softwares dos computadores esto em perfeita configurao e funcionamento;

    - Adotar polticas de legalidade: Verificar se os softwares proprietrios instalados nos

    computadores esto todos licenciados;

    - Instalar um sistema operacional de 64 bits no computador que possui mais de 4GB de memria,

    a fim de aproveitar toda a memria RAM instalada neste computador.

    Redes de

    Computadores

    - Limitao da rede;

    - Perda do sinal DSL;

    - Velocidade da internet lenta;

    - Falta de compartilhamento dos arquivos;

    - Acesso internet somente via cabo;

    - Cabos de rede instados sem estruturao.

    A conexo da rede cabeada, sendo observados problemas de limitao, pois o alcance no chega

    a todos dentro da organizao. Alm disso, existem problemas constantes de queda do sinal de

    internet e velocidade lenta. Outro problema identificado, que os arquivos dos computadores no

    esto compartilhados em rede, dificultando assim o acesso rpido pelos funcionrios, fazendo com

    que tenham que se descolar de um computador para outro.

    Recomendaes:

    - Reestruturar a rede da unidade a fim de ter melhor gerenciamento dos recursos e a

    disponibilizao de servios de melhor qualidade;

    - Adquirir um modem roteador WI-FI

    - Aumentar velocidade contratada da internet;

    - Ativar o compartilhamento de rede do Windows;

    - Reestruturar cabos de rede, instalando-os em caneletas.

    Servidores

    (funcionrios)

    - Existem 8 funcionrios na unidade, sendo 3 da rea administrativa, 2 fiscais, 1 inspetor, 1

    motorista e 1auxiliar de servios gerais;

    - No existe um cargo na rea de informtica dentro da organizao, mas um dos administrativos

    responde pela rea da informtica;

    - Falta de treinamento dos servidores que utilizam a TI para realizar suas atividades, muitas vezes

    alguns servidores no sabem lidar com um software novo instalado nos computadores e tambm

    no sabe lidar com equipamentos de hardware novos.

    Recomendaes:

    - Realizar treinamento dos usurios que utilizam a TI, para que assim possam ter conhecimento de

    como utilizar a tecnologia corretamente e novas tendncias da TI. Uma vez que um usurio com

    conhecimento evita problemas futuros na organizao, cada usurio tem que saber com qual

    tecnologia est lidando no dia a dia.

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 31

    Backup

    - Foram encontrados muitos arquivos importantes armazenados nos computadores, mas no h

    procedimento de backup dos mesmos, representando um grande risco de perda dos dados

    armazenados nos computadores.

    Recomendaes:

    - Adotar polticas de backup: realizar o procedimento de guardar os arquivos em outros

    dispositivos, como pendrives, HD externos, CDs, DVDs e servidores da nuvem e uma cpia

    desses arquivos, em pelos menos em dois computadores da organizao, j que no existe um

    servidor instalado.

    Segurana do ambiente

    - Falta de proteo na sala dos equipamentos de TI;

    - Falta de sistema de alarmes instalados;

    - Pouca proteo contra roubo de perifricos internos do computador;

    - No existe extintor de incndio;

    - No existe aterramento devidamente instalado.

    - No adotar polticas de segurana, representa um problema srio organizao, como visto a

    organizao no possui nem o mnimo exigido para garantir a segurana do ambiente.

    Recomendao:

    - Adotar polticas de segurana conforme a norma ISO/IEC NBR 27002;

    - Adquirir uma trava de cabo para os computadores;

    - Adquirir cadeados e chaveamento por senhas para dificultar a entrada de pessoas no autorizadas

    sala de equipamentos da unidade;

    - Instalar sistema de alarmes no prdio;

    - Adquirir urgentemente um extintor de incndio;

    - Realizar o aterramento para proteo dos equipamentos de TI e dos usurios.

    Planejamento e

    controle de TI

    - Foi encontrada uma documentao sobre controle de equipamentos patrimonial denominado de

    guia dos bens patrimoniais, contendo todos os bens da organizao, incluindo os equipamentos de

    TI. Entretanto, no existe uma documentao especfica dos equipamentos de TI;

    - No existe um planejamento estratgico direcionado tecnologia da informao na organizao;

    - Pouco espao para acomodao dos equipamentos de TI.

    Recomendao:

    - Alocar os equipamentos de TI para um espao maior;

    - Adotar polticas de planejamento e controle de TI: desenvolver um documento contendo todas as

    informaes da Infraestrutura de TI atual, e tambm desenvolver um manual com os

    procedimentos corretos para seu uso.

    - Implementao de um sistema de inventrios de TI, que possibilite cadastrar todos os

    equipamentos de TI, softwares, contratos, arquivos, problemas e incidentes encontrados na

    unidade local. Com esse sistema possvel manter o controle da infra de TI, pois possibilita o

    acesso a todas as informaes cadastradas sobre a infraestrutura tecnolgica da organizao, e

    encontrar melhores solues para cada tipo de problema tratado.

    De maneira geral foi visto que a infraestrutura de TI da unidade analisada est fora das

    recomendaes descritas nos manuais e normas apresentados neste trabalho. Dentre os

    problemas identificados, pode-se destacar a no realizao de um planejamento estratgico de

    TI, e consequentemente no execuo de investimentos mnimos na melhoria da

    infraestrutura, a no realizao de manutenes peridicas tanto em hardwares como em

    softwares. A rede no gerenciada, e a infraestrutura existente hoje precria. Atualmente

    no existe mecanismo de backup de arquivos. Os funcionrios no recebem treinamento para

    utilizao correta e mais eficiente da TI. Alm disso, foram identificados srios problemas de

    segurana, no existindo equipamentos considerados bsicos, como extintor.

    Tais problemas dificultam que os objetivos da organizao sejam atendidos, sendo,

    portanto imprescindvel que acontea uma mudana na forma de gerenciamento da

    infraestrutura de TI. A situao encontrada prejudica a organizao local e a matriz, os seus

    funcionrios, os usurios dos servios (como proprietrio e produtores rurais), e a

    comunidade, que de forma indireta necessita que esses servios funcionem plenamente.

    Com isso possvel constatar que o nvel de maturidade (de acordo com as

    recomendaes do COBIT) da organizao analisada 0, uma vez que verificou-se que no

    existe um processo definido, e a organizao no reconhece um gerenciamento a ser iniciado.

    6. Consideraes Finais O presente trabalho foi direcionado para auditoria de infraestrutura de TI, atravs do COBIT e

    de livros na rea foi possvel desenvolver questionrios para extrair informaes que deram

    embasamento para conquistar o objetivo deste trabalho, ou seja, avaliar a infraestrutura de TI

    de uma organizao pblica.

  • 32 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Com a execuo do estudo de caso foi possvel perceber a realidade de como a

    infraestrutura da unidade analisada organizada. Neste caso, constatou-se uma situao

    precria, no existindo procedimentos regulares de manuteno preventiva de hardware,

    software e rede. Alm de no existir um planejamento estratgico e consequentemente falta de

    investimento na infraestrutura de TI, o que por sua vez afeta diretamente na qualidade dos

    servios oferecidos pela unidade.

    Atravs da avaliao foram realizadas algumas recomendaes de prticas a serem

    seguidas pelos gestores, para o melhor aproveitamento dos processos de TI existentes e para

    sanar os problemas encontrados.

    O chefe responsvel pela unidade reconheceu os problemas existentes, e explicou que

    no depende dele para realizar as mudanas necessrias na infraestrutura de TI, e sim de

    superiores, mas afirma estar disposto a mudar isso, levando os resultados encontrados nesta

    pesquisa ao diretor regional, a fim de discutirem e definirem estratgias para resoluo dos

    problemas detectados.

    Ficam aqui recomendaes para outras pesquisas no assunto, bem como outras formas

    de avaliar uma infraestrutura de tecnologia da informao em uma organizao. Sendo assim,

    como trabalhos futuros prope-se que este estudo seja ampliado, a fim de verificar se a

    realidade encontrada nesta unidade a mesma de outras no Estado do Tocantins.

    References

    Albertin, Alberto Luiz. Administrao de Informtica: funes e fatores crticos de sucesso;

    colaborao de Rosa Maria de Moura. 4 ed. So Paulo: Atlas, 2002.

    Albertin, Alberto Luiz. Beneficio do uso de tecnologia da informao no desempenho

    empresarial. GV pesquisa, 2005.

    Associao Brasileira de Normas e Tcnicas ABNT. NBR ISO/IEC 27002: Tecnologia da

    informao: Tcnicas de segurana: Cdigo de prtica para a gesto de segurana da

    informao. Rio de Janeiro, 2005

    CFC. Manual de Auditoria de Sistemas. Disponvel

    em:. Acesso em: 21 de Mar. 2014.

    COBIT 4.1 The IT Governance Institute. 2007. Disponvel em: <

    http://www.isaca.org/knowledge-center/cobit/pages/overview.aspx >. Acesso em: 06Abr.

    2014.

    Dias, Cludia. Segurana e Auditoria da Tecnologia da Informao.1.ed. Rio de Janeiro:

    Axcel Books, 2000.

    Hanashiro, Mara. Metodologia Para Desenvolvimento De Procedimentos E Planejamento De

    Auditorias De Ti Aplicada Administrao Pblica Federal. 2007. 168 p. Dissertao

    (Mestrado em Engenharia Eltrica). Faculdade de Tecnologia, Universidade de Braslia,

    Braslia/DF, 2007. Disponvel em:<

    http://portal2.tcu.gov.br/portal/pls/portal/docs/2053984.PDF>. Acesso em: 09 Abr. 2014.

    Hanashiro, Mara. Auditoria de TI na CGU. 2009. 95 p. Relatrio tcnico cientifico

    (especializao em auditoria interna). TCU, Braslia/DF, 2009. Disponvel

    em:. Acesso em: 02 Abr.

    2014.

    Miglioli, Afrnio Maia. Tomada de Deciso na Pequena Empresa. 2006. 107p.

    Dissertao (Mestre em engenharia da produo). Escola de Engenharia de So Carlos, So

    Carlos-SP, 2006. Disponvel

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 33

    em:. Acesso em: 31 mai. 2015.

    Monteiro, Gustavo Bastos. Auditoria de tecnologia da informao na administrao pblica

    no mbito dos municpios do estado do rio de janeiro. 2008. 132 p. Dissertao

    (Mestrado em administrao pblica). Escola

    Brasileira de Administrao Publica , Fundao Getlio Vargas, Rio de Janeiro, 2008. Disp

    onvel em:< http://www.ecg.tce.rj.gov.br/dissertacoes>. Acesso em: 28 Mar. 2015.

    TCU. Manual de Auditoria Operacional. 2010. Disponvel

    em:. Acesso em: 20 mar.

    2015.

    Weill; Peter; ROSS; Jeanne W. Governana de TI: Tecnologia da Informao. So Paulo: M.

    Books Brasil Editora Ltda. 2006.

  • 34 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Adequao e testagem do IMP Digital para a anlise do esquema

    corporal1

    Leomar Camargo de Souza, Pierre Soares Brando, Fernando Luiz de Oliveira4,

    Fabiano Fagundes5

    Mestrando em Informtica da Universidade de Braslia

    3 Fisioterapeuta e Educador Fsico. Mestre em Gerontologia. Professor no curso de Educao

    Fsica e de disciplinas institucionais do CEULP/ULBRA

    4 Mestre em Cincia da Computao e Professor dos cursos de Sistemas de Informao e

    Cincia da Computao do CEULP/ULBRA

    5 Psiclogo,

    Mestre em Cincia da Computao e Professor dos cursos de Sistemas de

    Informao e Cincia da Computao do CEULP/ULBRA

    [email protected], {pierrebrandao, fernando.luiz,

    fagundes}@ceulp.edu.br

    Resumo. O IMP Digital um software que visa automatizar a tcnica de Image

    Marking Procedure (IMP) na avaliao das modificaes que o corpo humano sofre

    ao longo do tempo. Para isso, o software utiliza o Microsoft Kinect na captura das

    regies corpreas que avaliam o grau de Percepo Corporal que um indivduo tem

    com o seu corpo. Entretanto, constatou-se que o software apresentava carncia de

    funcionalidades para o gerenciamento das informaes das avaliaes realizadas.

    Dessarte, o presente trabalho teve como objetivo o desenvolvimento de melhorias e

    a implementao de novas funcionalidades ao software bem como a realizao de

    testes para averiguar a preciso dos resultados fornecidos pelo software em

    comparao ao mtodo tradicional - manual - da tcnica de IMP.

    1. Introduo

    Existem diversos estudos acerca da relao que o ser humano tem consigo e com seu corpo,

    por meio da representao social na qual ele est inserido. Essa relao est diretamente

    ligada Percepo Corporal (PC), que o reconhecimento que um indivduo tem de seu

    corpo no decorrer da vida. Thurm (2007) afirma que a PC corresponde ao conjunto de

    representaes neurofisiolgicas e espaciais que permite que o indivduo reconhea

    conscientemente seu corpo e seus segmentos no tempo e no espao, com informaes

    vivenciadas e armazenadas no decorrer da vida.

    A PC pode ser decomposta em duas caractersticas primordiais: Imagem Corporal (IC)

    e Esquema Corporal (EC). A IC definida como a conscincia que o ser humano tem em

    relao ao seu convvio cultural e tico, associado a suas metas, expectativas, padres e

    preocupaes (FERREIRA et al, 2012). O EC corresponde representao das partes do

    corpo no espao e permite ao indivduo reconhecer estas partes e a interao que elas tm com

    o meio, originando a percepo de sua dimenso corporal (CHAVES, 2014, p.16).

    Um dos meios de se avaliar as alteraes sofridas pelo corpo em relao a PC

    atravs da tcnica de IMP, proposta por Askevold (1975), em que o paciente projetado por

    meio de um auto desenho e onde o EC avaliado sem que haja nenhum intermdio visual,

    1 Projeto vinculado ao Grupo de Estudos e Pesquisa em Tecnologia, Sade e Qualidade de Vida GEPETS.

    Endereo:

    http://dgp.cnpq.br/dgp/espelhogrupo/8640931866899270

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 35

    cognitivo ou qualquer artefato externo, com o intuito de fornecer resultados menos

    tendenciosos. Existem outros meios para avaliar o EC, que atingem resultados equivalentes

    aos resultados do IMP, como o caso do Kinesthetic Size Estimating Apparatus, ou Aparato

    Sinestsico de Estimativa de Largura Corporal, que compreende um basto graduado em

    centmetros em que o sujeito dever mostrar, por meio do posicionamento das mos no

    basto, a largura dos pontos anatmicos tocados em seu corpo, que so os mesmos tocados no

    IMP (THURM, 2007, p.28).

    A caracterstica fundamental do IMP a marcao de sete pontos correspondentes as

    regies do corpo do corpo humano, de modo que sejam calculados o ndice de Percepo

    Corporal (IPC). So eles: o pice da cabea, a articulao acrmio-clavicular esquerda, a

    articulao acrmio-clavicular direita, a curva da cintura esquerda, a curva da cintura direita,

    o trocanter maior do fmur esquerdo e o trocanter maior do fmur direito.

    Contudo, apesar do IMP ter sua eficincia comprovada cientificamente por meio de

    diversos estudos no mundo inteiro, o uso do procedimento manual chega a ser exaustivo, pois

    exige um dado esforo do avaliador para utilizao da tcnica e principalmente na coleta das

    informaes para o clculo do IPC. Sendo assim, com essa viso, Chaves (2014) desenvolveu

    um software capaz de substituir o mtodo tradicional e os materiais utilizados pelo IMP por

    um mtodo automatizado, utilizando o Microsoft Kinect - pertencente ao console Xbox, em

    que a mo a referncia para captura dos sete pontos referentes as regies do corpo. Contudo,

    o software no armazenava nenhuma informao da avaliao para consultas posteriores, de

    modo que, se um profissional desejasse salvar alguma informao da avaliao emitida pelo

    software, teria que fazer tal processo de forma manual, acarretando gasto de tempo e material.

    Tal situao tambm inviabilizava um trabalho de avaliao da preciso dos resultados

    fornecidos pelo software em comparao ao mtodo tradicional da tcnica.

    Com essas necessidades, o presente trabalho teve como objetivo o desenvolvimento de

    melhorias para o software acrescentando funcionalidades para gerenciamento as avaliaes

    realizadas e obteno de relatrio das avaliaes bem como realizar correes de algumas

    funcionalidades existentes. Tambm fez parte do escopo desse trabalho a integrao do

    software em uma plataforma, denominada FisioKinect, para agregao dos trabalhos

    desenvolvidos no Grupo de Pesquisa do qual este projeto faz parte.

    2. Metodologia

    Para atingir os objetivos propostos neste trabalho, utilizou--se como desenho de estudo uma

    pesquisa com finalidade metodolgica aplicada, objetivo metodolgico exploratrio e

    natureza quantitativa, sendo realizado em laboratrio com procedimento quase experimental

    em um estudo piloto para teste de acurcia. A Figura 1 apresenta um resumo de um modo

    geral da metodologia utilizada no presente trabalho.

    Figura 1. Etapas da metodologia

  • 36 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Primeiramente, realizou--se um estudo das funcionalidades do software desenvolvido

    por Chaves (2014), alm de conceitos referentes PC, IC, EC, IMP e IPC. Posteriormente,

    consultou--se um profissional da sade com conhecimento das tcnicas do IMP tradicional

    para realizar o levantamento de requisitos, onde foram desenvolvidas novas funcionalidades,

    alm de corrigir funcionalidades j existentes.

    Ao trmino da implementao, o software foi integrado ao projeto unificado do LTS,

    que contm alguns softwares desenvolvidos em outros trabalhos, tais como software para

    coleta de atributos antropomtricos e software para avaliao da amplitude e movimento,

    dentre outros, de modo que eles se conectassem por meio de uma nica base de dados.

    Por fim, realizou--se a coleta de avaliaes utilizando o mtodo tradicional do IMP e

    posteriormente, utilizando o software em questo, para que fosse verificada a eficincia da

    software em relao ao mtodo tradicional.

    3. Desenvolvimento

    O levantamento de requisitos aconteceu no primeiro trimestre de 2015, com a participao de

    um profissional fisioterapeuta com conhecimento no domnio do IMP. Questes como layout,

    usabilidade e disposio dos dados foram levantadas a fim de de tornar o uso da aplicao da

    forma mais simples possvel. Posteriormente, iniciou-se o levantamento de requisitos para as

    novas funcionalidades. As subsees seguintes exibem informaes do FisioKinect, bem

    como informaes dos artefatos desenvolvidos durante o decorrer de todo o trabalho.

    3.1. FisioKinect

    A plataforma FisioKinect voltada especificamente para a integrao de softwares

    desenvolvidos no Grupo de Pesquisa ao qual este trabalho est relacionado, que envolvem

    anlises e avaliaes do corpo humano utilizando o Kinect. Ela conta com funcionalidades

    para gerenciamento dos pacientes, de modo que haja um nico registro do mesmo na base de

    dados, fazendo com que este seja utilizado em qualquer software integrado. Dessa forma,

    possvel visualizar detalhadamente cada avaliao que foi realizada para um paciente

    especfico, de modo que se tenha todas as informaes necessrias em poucos cliques.

    Acrescente-se que cada software integrado segue o padro de design da plataforma,

    para que o usurio tenha a impresso de estar usando um nico software, e no vrios

    softwares integrados em uma plataforma. A Figura 2 apresenta a tela inicial do FisioKinect,

    com os softwares desenvolvidas at o terceiro trimestre de 2015.

    Figura 2. Tela inicial da plataforma FisioKinect

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 37

    Conforme a Figura 2, at o presente momento, existem seis softwares integrados ao

    projeto, que esto localizadas ao lado esquerdo da imagem. Ao lado direito, h um

    datagrid para exibio dos pacientes cadastrados, e logo abaixo encontra-se as opes

    para gerenci-los. No canto inferior direito h o boto Relatrio, para acesso aos softwares

    que esto integrados e que contenham a funcionalidade de relatrios.

    3.2. Gerenciar avaliaes

    A primeira etapa de implementao foi desenvolver funcionalidades para gerenciamento das

    avaliaes realizadas, j que o software no possua tal recurso implementado. A Figura 3

    mostra a tela de gerenciamento das avaliaes realizadas atravs do software.

    Figura 3. Tela de gerenciamento das avaliaes realizadas

    Conforme exibe a figura acima, existe um boto Nova avaliao que, depois de

    acionado, exibe uma nova janela para selecionar o paciente no qual se deseja realizar a

    avaliao. O campo de texto ao meio responsvel pela pesquisa das avaliaes. O boto

    Inserir IPC Manual responsvel por inserir o valor do IPC Geral de uma avaliao

    realizada pelo mtodo tradicional, para que o usurio tenha tanto o resultado da avaliao feita

    pelo sistema, quanto a avaliao feito pelo mtodo tradicional. Para isso, basta que o usurio

    selecione uma avaliao que ainda no tenha o valor do IPC de uma avaliao pelo mtodo

    tradicional e clique no boto mencionado, que uma nova tela ser exibida para que seja

    informado o resultado obtido.

    3.2.1. Nova avaliao

    Para acessar tal funcionalidade, necessrio que o paciente esteja cadastrado na base de dados

    do FisioKinect. Com o paciente selecionado, exibida a tela de avaliao, conforme ilustra a

    Figura 4.

  • 38 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Figura 4. Tela de avaliao da percepo corporal

    No levantamento de requisitos, ficou definida a alterao do modo como eram

    capturados os pontos relativos IP. Na verso anterior do software, eram capturados apenas

    um ponto por cada regio do corpo, sendo assim, a nova abordagem consistiu em capturar trs

    pontos para cada regio, totalizando 21 pontos para as sete regies. Com isso, cada vez que

    uma regio capturada, calcula-se a mdia dos trs pontos, de acordo com a abordagem

    proposta por Askvold (1975), que indica a necessidade de repetir-se a avaliao para maior

    preciso. A sequncia de captura dos pontos pode ser verificada pelo usurio clicando no

    boto azul a esquerda do box da Imagem Percebida.

    Para iniciar uma avaliao, preciso que o paciente seja identificado pelo software.

    Para isso, o mesmo tem que estar com as duas mos acima da cabea. Tal requisito foi

    pensado para, caso haja a necessidade do avaliador entrar no campo de viso do Kinect, evitar

    que este seja considerado na avaliao. Uma vez que tenha o paciente identificado, basta que

    o avaliador clique no boto Iniciar Avaliao. Aps isso, o avaliado indica com a palma da

    mo as regies que so avaliadas no IMP. Para capturar a regio existem duas formas: na

    primeira, o paciente deve falar OK em voz alta; na segunda o avaliador clica no boto

    Capturar Ponto quando tiver uma indicao do paciente para que o ponto seja capturado.

    Aps realizar todo procedimento da avaliao, basta clicar no boto Resultado, quando ser

    exibida a tela da Figura 5.

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 39

    Figura 5. Tela de avaliao da percepo corporal

    Como mostra a Figura 5, exibida a projeo da avaliao realizada e o IPC

    Especfico de cada ponto capturado, alm do IPC Geral. A diferena entre essa tela de

    resultados e tela original da aplicao o acrscimo do boto Salvar avaliao e a reduo

    das opes de visualizao, logo abaixo da projeo. O motivo de tal reduo deu-se pelo fato

    de que algumas das opes da antiga verso da aplicao estavam vinculadas a todos os

    pontos capturados para cada regio do corpo. Sendo assim, essas opes tornaram-se

    desnecessrias, uma vez que a mdia dos pontos de cada regio foi calculada na tela anterior.

    Ao lado do box de IPC Especfico existe uma numerao e o boto ?, que, ao ser clicado,

    exibe uma tela - Figura 6 - para identificar a referncia dos valores ao lado da numerao.

    Figura 6. Tela de auxlio ao usurio quanto ao IPC Especfico

    O IPC de cada regio do corpo calculado atravs da frmula:

    . J o IPC Geral (IPCg) a mdia do IPC da altura da cabea, IPC da

    largura do ombro, IPC da largura da cintura e o IPC da largura do trocnter.

    3.2.2. Detalhes de uma avaliao Essa funcionalidade responsvel por exibir todos os dados da avaliao que foram salvos

    pelo avaliador. Para isso, o usurio deve estar na tela apresentado na Figura 3 e clicar duas

    vezes sobre a avaliao desejada. Feito isso, uma nova tela exibida, conforme a Figura 7.

  • 40 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Figura 7. Tela de detalhes da avaliao

    Alm de exibir todas as informaes presentes na tela de resultado - apresentado na

    Figura 5 - ainda exibe o valor do IPC Geral da avaliao realizada pelo mtodo tradicional,

    bem como sua classificao. Nessa funcionalidade tambm possvel imprimir as

    informaes da avaliao.

    3.3. Gerenciamento de relatrios

    Uma vez que as informaes de uma avaliao so salvas, surgiu a necessidade da

    implementao de um mdulo capaz de gerar os relatrios. Para isso, foi criada uma nica tela

    para o relatrio referente PC. Nessa tela o usurio seleciona o tipo de relatrio desejado e

    informa o(s) parmetro(s) de pesquisa, se houver.

    Figura 8. Tela para emisso de relatrios

    Vrios tipos de relatrios podem ser gerados pela tela acima, sem a necessidade de

    mudar de tela, onde cabe ao usurio selecionar o tipo de relatrio desejado, no combobox

    localizado no campo superior esquerdo da tela. Como existem vrias categorias de relatrios e

    nem todas contm os mesmos tipos de parmetros, foi necessrio criar quatro diferentes

    campos, para filtragem das informaes.

    Na medida em que uma categoria de relatrio selecionada no combobox, h um

    mtodo responsvel por fazer com que trs dos quatros campos fiquem invisveis. As

    excees ficam para a relao geral, onde nenhum campo visvel e os relatrios com

    intervalo de datas, onde dois campos ficam visveis.

    3.4 Antiga verso do software em relao a nova verso

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 41

    A antiga verso do software possua apenas duas telas: de avaliao e resultados. Abaixo, na

    Figura 9 apresentado um antes e depois das alteraes realizadas.

    Figura 9. Comparativo entre o antes e depois das alteraes do software

    Como percebe-se, a nova verso visou deixar o layout da aplicao mais limpo,

    mesmo com a adio de mais informaes na tela - que o caso da tela de avaliao. Tambm

    foram reduzidas quatro opes no box Opes de Visualizao da tela de resultados, devido

    nova abordagem para captura dos pontos referentes as regies do corpo, conforme explicado

    anteriormente.

    3.5 Testando o software

    Os testes aconteceram na segunda quinzena de maio de 2015 no LTS, onde avaliou-se oito

    pessoas com idade entre 19 e 41 anos. Primeiramente, coletaram-se os dados pelo mtodo

    tradicional do IMP e posteriormente pela avaliao digital.

    No procedimento manual utilizou-se papel craft e pincis para marcao dos pontos.

    Nas avaliaes realizadas pelo software o sensor Kinect encontrava-se a 1,14m altura. A

    distncia entre o participante e o dispositivo foi de 2,8m. A Tabela 1 exibe as classificaes

    das avaliaes conforme a especificao proposta por Segheto et al. (2010).

    Tabela 1. Classificao das avaliaes realizadas

    PARTICIPANTE CLASSIFICAO MANUAL CLASSIFICAO DIGITAL

    1 Normoesquemtico Normoesquemtico

    2 Hipoesquemtico Normoesquemtico

    3 Hipoesquemtico Normoesquemtico

    4 Normoesquemtico Normoesquemtico

    5 Hipoesquemtico Normoesquemtico

    6 Hipoesquemtico Hipoesquemtico

    7 Hipoesquemtico Hipoesquemtico

    8 Normoesquemtico Hipoesquemtico

  • 42 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Conforme exibido na Tabela 1, tem-se que houve concordncia entre a avaliao

    tradicional e a avaliao digital em 4 dos 8 casos, superestimao em 3 casos e subestimao

    em 1 caso.

    importante ressaltar que na avaliao realizada pelo software o paciente utiliza a

    palma da mo na captura dos pontos utilizados no IMP e, no procedimento manual, usado

    um pincel para projetar os pontos no papel craft. Deste modo, h diferena quanto ao grau de

    preciso dos pontos coletados, ainda assim, a ferramenta mostrou concordncia em metade

    dos casos do estudo.

    Este resultado no invalida a utilizao da ferramenta e novos estudos podem propor

    novas faixas de valores de clculo e/ou formas de melhorar a preciso da captura dos pontos

    com o kinect.

    Outro detalhe importante que mesmo realizando duas avaliaes tanto pelo sistema

    quanto pelo mtodo manual, quase impossvel obter os mesmos resultados. Sendo assim,

    novos estudos devem avaliar no apenas a concordncia entre os mtodos, mas tambm intra

    mtodos.

    4. Concluso

    As alteraes realizadas no IMP Digital simplificam o trabalho dos profissionais da sade,

    fazendo com que as informaes referentes s avaliaes de Percepo Corporal sejam

    gerenciadas de maneira mais eficiente, alm da possibilidade de gerenciar relatrios que

    podem ser utilizado para acompanhamento do paciente quando este se submeta a um

    tratamento de longa durao. A testagem da ferramenta mostrou concordncia entre os

    resultados dos dois mtodos em metade dos casos, todavia novos estudos so necessrios.

    5. Referncias

    ASKEVOLD, Finn. Measuring Body Image. Psychotherapy And Psychosomatics, [s.l.], v.

    26, n. 2, p.71-77, 1975. S. Karger AG.

    CHAVES, Carlos Diego Carvalho. Automatizao do Image Marking Procedure para

    anlise do esquema corporal utilizando o Kinect. 2014. 67 f. TCC (Graduao) - Curso

    de Sistemas de Informao, Centro Universitrio Luterano de Palmas, Palmas - To, 2014.

    FERREIRA, Cntia de Cssia et al. Anlise da imagem e esquema corporal em indivduos

    com diagnstico de sndrome de ps-poliomielite. Revista Neurocincia, So Paulo, n. 20,

    p.50-57, 2012.

    SEGHETO, Wellington et al. Proposta de categorizao para anlise da percepo

    corporal. In: I Simpsio Internacional de Imagem Corporal e o I Congresso Brasileiro de

    Imagem Corporal, 1, 2010, Campinas: Centro de Convenes da Unicamp, 2010. P. 1 - 6.

    THURM, Bianca Elisabeth. Efeitos da dor crnica em atletas de alto rendimento em

    relao ao Esquema Corporal, Agilidade Psicomotora e estados de Humor. 82 f.

    Dissertao (Mestrado) - Curso de Educao Fsica, Universidade So Judas Tadeu, So

    Paulo, 2007.

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 43

    Aplicao da tcnica de Text Mining para comentrios

    relacionados ao contexto do Turismo

    Felipe E. B. Schmitz, Parcilene F. de Brito

    Sistemas de Informao Centro Universitrio Luterano de Palmas (CEULP/ULBRA)

    Avenida Teotnio Segurado 1501 Sul Palmas TO Brazil

    {felipeebs,parcilene}@gmail.com

    Resumo. Este artigo apresenta o processo de Text Mining e anlise de dados

    sobre uma base de comentrios extrados de um site relacionado temtica

    turismo. Sobre o banco de dados minerado de comentrios de um site de turismo

    e aspectos extrados atravs da tcnica de anlise de sentimentos por Christhie

    (2015), aplicou-se a tcnica de associao com o algoritmo Apriori para extrair

    as regras associativas entre os aspectos positivos mais frequentes nos

    comentrios. A partir destas regras, foi possvel identificar conexes, analisar

    como estes aspectos interagem e tirar concluses sobre a importncia destes

    aspectos para o domnio estudado.

    1. Introduo A criao de ferramentas de interao e colaborao na internet acarreta no crescimento

    contnuo da quantidade de informaes disponveis sobre as mais diversas temticas. Uma

    forma de colaborao que se tornou comum na internet foi o compartilhamento de opinies de

    usurios sobre todo tipo de assunto. A grande quantidade de crticas fornecidas sobre um

    produto ou servio se mostra valiosa, tanto para clientes que querem tomar a deciso

    informada sobre o que ser adquirido, quanto para os fornecedores, inclusive concorrentes,

    que querem conhecer os pontos positivos e negativos avaliados para se adaptar e conquistar

    esses clientes.

    Mas o acompanhamento dessa grande quantidade de informao se tornou

    impraticvel sem o auxlio de ferramentas capazes de fazer agregaes e fornecer dados

    sucintos e relevantes.

    Este trabalho integra a pesquisa desenvolvida por Brito (2015), que tem como foco a

    anlise de avaliaes de usurios sobre destinos tursticos. Em Christhie (2015), os

    comentrios e dados relacionados foram extrados do site TripAdvisor, passaram por pr-

    processamento e anlise de sentimentos a nvel de aspecto para extrair opinies positivas e

    negativas. Depois de extrados e processados, os dados obtidos servem de entrada para

    diversos tipos de anlises, entre eles a classificao, agrupamento e associao. O banco de

    dados resultante foi utilizado como base para o presente trabalho.

    2. Text Mining O Text Mining uma etapa intermediria do processo KDT, sigla em ingls para Descoberta

    de Conhecimento em Textos. Dentro deste processo maior, a minerao de textos uma etapa

    de recuperao da informao, que acontece aps a coleta de documentos e resulta em uma

    base de informaes das quais ser extrado o conhecimento.

    Segundo Feldman (2007, p. 1, traduo nossa), a minerao de texto ou Text Mining

    pode ser definida como um processo anlogo ao Data Mining, no qual se extrai informaes

    teis de documentos textuais atravs da identificao e explorao de padres interessantes.

    Text Mining uma tcnica de automao de anlise de grandes quantidades de documentos

    textuais para se obter conhecimento sobre um determinado domnio.

  • 44 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Figura 1: Arquitetura bsica de um sistema de Text Mining

    Fonte: Schmitz (2015, p. 7)

    Na Figura 1, Tokenizao refere-se separao do texto nos documentos a serem

    analisados, atravs da remoo de smbolos e marcaes. Normalizao Lxica e Morfolgica

    referem-se preparao desse texto para ser processado e, de certa forma, compreendido por

    um computador. Anlise Sinttica a parte do processo em que o texto processado e

    organizado por algum algoritmo preparado para encontrar padres e auxiliar no processo de

    Extrao da Informao, que de fato o momento em que um especialista analisa o que foi

    encontrado para extrair conhecimento sobre o domnio. Todas estas etapas so explicadas com

    mais detalhes nas sees subsequentes.

    2.1. Captao de dados textuais

    O elemento chave do Text Mining a coleo de documentos, que pode ser definida como

    qualquer grupo de elementos textuais a serem processados. Os elementos textuais podem

    variar de pequenos trechos de poucos caracteres at livros completos, e a quantidade entre

    algumas centenas at dezenas de milhes (e contando). A coleo de documentos pode ser

    esttica, contendo apenas os elementos coletados inicialmente, ou dinmica, caracterizada

    pela incluso de novos elementos ao longo do tempo.

    Os documentos podem ser coletados a partir de uma base (e.g. PubMed, IEEExplore,

    ACM Digital Library, Domnio Pblico), fornecidos manualmente (arquivos ou textos

    alimentados por um ser humano) ou obtidos com o uso de um crawler, que descobre

    elementos textuais a partir de uma pgina web e links subsequentes.

    2.2. Pr-processamento

    Esta etapa da minerao de texto consiste em preparar a coleo de documentos para a

    extrao do conhecimento. Ela pode ser dividida em alguns processos gerais, mas podem

    variar em quantidade de acordo com a necessidade de preparao do domnio. A ordem mais

    comum desses processos pode ser observada na Figura 2. Figura 2: Etapas comuns do pr-processamento

    Fonte: Schmitz (2015, p. 8).

    A Anlise Lxica (Tokenizao) consiste na converso de uma cadeia de caracteres de

    entrada em um vetor de palavras ou tokens, isto , a separao de palavras e eliminao de

    marcaes, smbolos, caracteres especiais e espaos. Nesta etapa tambm podem ser

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 45

    utilizados dicionrios de sinnimos para padronizar o texto e eliminar possveis erros

    ortogrficos.

    A Identificao de Termos Compostos (Word-phrase formation) a deteco de

    conceitos que s podem ser expressos atravs da utilizao de duas ou mais palavras

    adjacentes, as quais perdem o sentido quando separadas. Para isso podem ser utilizadas

    tcnicas de contage de palavras ou dicionrios de termos pr-definidos.

    A Remoo de Termos Irregulares (stopwords) a etapa em que ocorre a remoo de

    palavras que no fazem diferena na indexao, como artigos, conjunes e preposies.

    Essas palavras podem apresentar uma frequncia muito alta e no tem nenhum valor para a

    busca dentro do contexto do documento, por isso devem ser removidas antes da extrao do

    conhecimento.

    A Normalizao Morfolgica (stemming) consiste na reduo de palavras ao seu

    radical pela eliminao de sufixos, plurais e inflexes de gnero. Com esse processo

    possvel diminuir o tamanho de um documento em at 50% (MORAIS, 2007).

    O Clculo de Relevncia visa identificar em um texto quais palavras representam

    maior peso ou relevncia em relao s outras palavras. A definio desse peso pode ser

    calculada, dependendo do caso, analisando-se a frequncia, posio sinttica, palavras

    adjacentes, estrutura do documento e at a classe gramatical de um termo.

    2.3. Organizao dos documentos da coleo

    A prxima etapa do Text mining consiste na organizao dos documentos da coleo. Os

    documentos podem passar por dois processos distintos, a classificao ou clustering.

    A Classificao o processo assistido de separao dos documentos em categorias pr-

    determinadas, onde necessrio um treinamento prvio do algoritmo para poder reconhecer a

    categoria de um texto.

    Clustering o processo no supervisionado de separao dos documentos por semelhana e

    correlao de contedo, que no utiliza categorias pr-definidas. O clustering pode ser plano,

    onde os documentos so separados em um nmero de conjuntos no-relacionados, ou

    hierrquico, onde todos os documentos esto relacionados, mas so divididos em grupos cada

    vez menores de acordo com as diferenas.

    2.4. Anlise de dados Regras de associao (Apriori)

    Anlise de dados a atividade de transformar um conjunto de dados de maneira a possibilitar

    uma anlise racional. Existem diversas formas de anlise de dados, de listagem, tabelas e

    grficos a regras de associao. Para a aplicao no domnio do trabalho foi utilizada uma

    tcnica de associao chamada Apriori.

    Regras de associao tem o objetivo de determinar os elementos que implicam a

    presena de outros elementos em um conjunto, ou seja, identificar padres frequentes de

    dados.

    O algoritmo Apriori, introduzido inicialmente por Agrawal (1993), parte do princpio

    de que, se um conjunto frequente, todos seus subconjuntos tambm devem ser frequentes. A

    anlise consiste nas duas etapas a seguir. (1) identificar conjuntos frequentes e (2) gerar regras

    de associao a partir dos conjuntos frequentes. Para um melhor entendimento do processo,

    considere o fluxograma apresentado na Figura 3.

  • 46 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    Figura 3: Fluxograma do algoritmo Apriori

    Fonte: Schmitz (2015, p. 15).

    Como primeiro passo, o algoritmo identifica os conjuntos possveis com a quantidade

    de itens (k) mnima, ou seja, os itens nicos existentes no conjunto. Em cada iterao o k

    incrementado para a gerao de conjuntos (itemsets) candidatos.

    Conjuntos candidatos so todas as possibilidades de combinaes de tamanho k entre

    os itens do conjunto anterior. Itemsets frequentes so os conjuntos, dentre os candidatos, que

    tm o suporte mnimo, ou seja, que ocorrem pelo menos um nmero determinado de vezes. O

    suporte pode ser uma quantidade fixa no algoritmo ou uma porcentagem referente ao nmero

    total de dados.

    Estes passos do algoritmo repetem-se at que seja gerado um conjunto vazio de

    itemsets frequentes, i.e., quando no h ocorrncias com o suporte mnimo para nenhum

    conjunto candidato. Neste caso, as listas de conjuntos frequentes das iteraes anteriores so

    utilizadas para a gerao das regras de associao.

    Para se gerar as regras de associao, cada Itemset frequente passa por duas

    etapas. Na primeira etapa os conjuntos so divididos em todos seus subconjuntos

    possveis. Na segunda etapa so filtrados os conjuntos com a confiana mnima. A confiana

    c calculada a partir do suporte (frequncia) do conjunto I em relao ao conjunto S

    ( ). As regras com a confiana maior ou igual mnima so,

    ento, sugeridas no formato .

    3. Metodologia Para a realizao da anlise dos dados foi escolhida a ferramenta Weka, desenvolvida na

    Universidade de Waikato, que consiste em uma coleo de algoritmos de anlise de dados e

    aprendizado de mquina e fornece uma interface grfica que facilita a configurao e

    utilizao desses algoritmos. O Weka trabalha com um formato de arquivo prprio, ARFF

    (Attribute-Relation File Format), que descreve instncias que compartilham os mesmos

    atributos. Os dados extrados para anlise foram convertidos para este formato utilizando uma

    biblioteca JAVA fornecida junto com a ferramenta.

  • XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 47

    4. Resultados Para realizar as anlises foram extrados os 20 aspectos positivos (caractersticas sobre

    destinos tursticos) com maior frequncia entre as avaliaes (comentrios de usurios do site

    TripAdvisor) e os dados foram exportados considerando a presena ou ausncia de tal aspecto

    em cada comentrio. A lista de aspectos foi, depois, alterada pare remover aspectos

    redundantes.

    Com a lista de aspectos, foi realizada a consulta no banco de dados que extrai a lista

    de aspectos, dentre os 20 analisados, para cada comentrio. Aps a filtragem de valores

    vazios, esta consulta retornou 894.310 resultados. Para esta anlise, a confiana mnima das

    regras de associao foi modificada para retornar uma quantidade satisfatria de regras sobre

    o nmero elevado de conjuntos analisados. O algoritmo encontrou 82 regras de associao

    com confiana entre 40% de 51%.

    Segundo anlise das regras de associao pela especialista no domnio, responsvel

    pelo projeto desenvolvido em Brito (2015), essas inferncias indicam algumas relaes

    interessantes para anlise de produtos tursticos. Por exemplo a grande ocorrncia do aspecto

    hotel nos comentrios. Hotel um dos trs objetos gerais do estudo (Hotel, Restaurante e

    Atraes), mas utilizado pelos autores dos comentrios tanto como um objeto quanto uma

    caracterstica (aspecto), ou seja, hotel, juntamente com outras caractersticas relacionadas,

    citado por usurios do site como um fator importante para descrever suas experincias.

    Nas tabelas a seguir so apresentadas as regras de associao geradas a partir da

    aplicao do algoritmo Apriori. A primeira coluna apresenta a Premissa, um conjunto

    frequente de aspectos. Em seguia a quantidade de ocorrncias (suporte) desta premissa. A

    terceira coluna apresenta a quantidade de ocorrncias do aspecto analisado (resultado) e a

    ltima coluna apresenta a confiana da regra, baseada nos dois nmeros anteriores. Cada

    tabela apresenta as premissas e ocorrncias de apenas um aspecto, seguidas de um grfico

    para melhor analisar as frequncias e o ndice de confiana. Tabela 1: Regras de associao com consequncia Hotel

    Premissa Ocorrncia Ocorrncia

    Hotel

    Confiana

    restaurante "cafe da manha" quartos 459 219 0.48

    comida funcionarios quartos 334 159 0.48

    comida "cafe da manha" quartos 242 109 0.45

    restaurante "cafe da manha" vista 210 94 0.45

    restaurante quartos 2059 921 0.45

    comida "cafe da manha" funcionarios 254 113 0.44

    restaurante "cafe da manha"

    funcionarios 389 169

    0.43

    restaurante funcionarios quartos 238 102 0.43

    atendimento restaurante quartos 549 234 0.43

    "cafe da manha" qualidade

    funcionarios 335 142

    0.42

    restaurante "cafe da manha" 2583 1078 0.42

    restaurante localizacao "cafe da

    manha" 684 285

    0.42

    atendimento restaurante localizacao

    "cafe da manha" 214 89

    0.42

    atendimento restaurante "cafe da

    manha" 687 284

    0.41

    restaurante localizacao quartos 516 213 0.41

  • 48 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767

    comida quartos 2418 996 0.41

    "cafe da manha" quartos opcoes 256 104 0.41

    pratos quartos 251 101 0.4

    comida "cafe da manha" 1565 627 0.4

    comida localizacao quartos 385 154 0.4

    A Tabela 1 apresenta as premissas que tiveram como consequncia o aspecto

    hotel, e as ocorrnc