universidade federal do rio grande do norte … · ao meu orientador, professor doutor túlio...

130
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE UNIVERSIDADE FEDERAL DO CEARÁ UNIVERSIDADE FEDERAL DA PARAÍBA UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO Programa de Pós-Graduação em Desenvolvimento e Inovação Tecnológica em Medicamentos - PPgDITM Marco Vinícius Monteiro Navarro EMPREGO DE REDES NEURAIS ARTIFICIAIS SUPERVISIONADAS E NÃO SUPERVISIONADAS NO ESTUDO DE PARÂMETROS REOLÓGICOS DE EXCIPIENTES FARMACÊUTICOS SÓLIDOS Natal - RN 2014

Upload: others

Post on 02-Sep-2019

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

UNIVERSIDADE FEDERAL DO CEARÁ

UNIVERSIDADE FEDERAL DA PARAÍBA

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO

Programa de Pós-Graduação em Desenvolvimento e Inovação Tecnológica em

Medicamentos - PPgDITM

Marco Vinícius Monteiro Navarro

EMPREGO DE REDES NEURAIS ARTIFICIAIS SUPERVISIONADAS E

NÃO SUPERVISIONADAS NO ESTUDO DE PARÂMETROS

REOLÓGICOS DE EXCIPIENTES FARMACÊUTICOS SÓLIDOS

Natal - RN

2014

Page 2: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

Marco Vinícius Monteiro Navarro

EMPREGO DE REDES NEURAIS ARTIFICIAIS SUPERVISIONADAS E

NÃO SUPERVISIONADAS NO ESTUDO DE PARÂMETROS

REOLÓGICOS DE EXCIPIENTES FARMACÊUTICOS SÓLIDOS

Tese apresentada ao Programa de Pós-Graduação em

Desenvolvimento e Inovação Tecnológica em Medicamentos da

Universidade Federal do Rio Grande do Norte, como requisito para

obtenção do título de Doutor no referido Programa.

Área de concentração: Inovação Tecnológica em Medicamentos

Orientador: Prof. Dr. Túlio Flávio Accyoli de Lima e Moura

Natal - RN

Fevereiro de 2014

Page 3: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

Apoio ao Usuário

Catalogação de Publicação na Fonte. UFRN – Biblioteca Setorial do Centro de Ciências da Saúde

Navarro, Marco Vinícius Monteiro.

Emprego de redes neurais artificiais supervisionadas e não supervisionadas no estudo de parâmetros reológicos de excipientes farmacêuticos sólidos / Marco Vinícius Monteiro Navarro. – Natal/RN, 2014.

130f.: il.

Orientador: Profa. Dr. Túlio Flávio Accyoli de Lima e Moura.

Tese apresentada ao Programa de Pós-Graduação em Desenvolvimento e Inovação Tecnológica em Medicamentos da Universidade Federal do Rio Grande do Norte.

1. Redes Neurais Artificiais – RNA – Tese. 2. Parâmetro reológico – Tese. 3. Excipiente farmacêutico sólido – Tese. I. Moura, Túlio Flávio Accyoli de Lima e. II. Título.

RN/UF/BSA01 CDU: 615.012:005.591.6

Page 4: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

Marco Vinícius Monteiro Navarro

EMPREGO DE REDES NEURAIS ARTIFICIAIS SUPERVISIONADAS E NÃO

SUPERVISIONADAS NO ESTUDO DE PARÂMETROS REOLÓGICOS DE

EXCIPIENTES FARMACÊUTICOS SÓLIDOS

Tese apresentada ao Programa de Pós-Graduação em

Desenvolvimento e Inovação Tecnológica em Medicamentos da

Universidade Federal do Rio Grande do Norte, como requisito para

obtenção do título de Doutor no referido Programa.

Orientador: Prof. Dr. Túlio Flávio Accyoli de Lima e Moura

______________________________________________________

Presidente: Prof. Túlio Flávio Accyoli de Lima e Moura, Dr. - Orientador, UFRN

______________________________________________________

Membro: Prof. Marco Vinícius Chaud, Dr. - Universidade de Sorocaba

______________________________________________________

Membro: Prof. Eduardo de Jesus Oliveira, Dr. - UFPB

______________________________________________________

Membro: Prof. Euzébio Guimarães Barbosa, Dr. - UFRN

______________________________________________________

Membro: Profª. Waldenice de Alencar Morais, Dra. - UFRN

Natal, 05 de Fevereiro de 2014

Page 5: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

Para meus filhos amados,

Clara e Miguel.

Page 6: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

AGRADECIMENTOS

Em nome de Deus, O Clemente, O Misericordioso!

Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela

confiança em quem quase ninguém mais acreditava; e por acreditar numa ideia nova, fora de

sua linha de pesquisa, aceitando todos os riscos inerentes a uma estrada ainda desconhecida.

A Giovani Ângelo Silva da Nóbrega, amigo, companheiro, meu maior

colaborador, que tornou possível a existência deste trabalho.

Ao Professor Doutor Cícero Flávio Soares de Aragão e a Professora Doutora

Fernanda Nervo Raffin por não terem desistido de mim.

A todos os meus colegas do DFAR/UFRN, especialmente ao Professor Nilsen

Carvalho Fernandes de Oliveira Filho (in memoriam) por terem me oferecido essa nova

oportunidade.

Às minhas colegas do LDM, MSc. Fátima Duarte Freire; MSc. Mara Rúbia

Winter; MSc. Janaína Góes, pela amizade, cooperação e tolerância.

Às minhas colegas MSc. Edilene Pereira Lavor e MSc. Daiane Soares pela

confiança e generosidade.

A todos os amigos doutorandos do PPgDITM, companheiros que tornaram essa

jornada mais produtiva e leve.

A todos os professores do PPgDITM pela dedicação com que doaram parte de

seus conhecimentos e experiências em prol de nossa formação científica.

Page 7: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

AGRADECIMENTOS ESPECIAIS

Às pessoas que contribuíram não apenas com este trabalho, mas ao longo de toda

a minha vida para minha formação como perofissional e como pessoa, e sem as quais eu não

teria chegado até aqui, especialmente:

À minha esposa Elian Neri Marques pelo amor e cuidados que me dispensa, e pela

imensa colaboração, compreensão e tolerância no dia a dia.

À minha mãe Judith Teixeira da Silva, por toda renúncia e sacrifício feito para que

eu fizesse um curso superior, numa época em que isso seria quase impossível para uma pessoa

como eu.

Ao meu irmão Márcio Antônio Monteiro Navarro, por todo apoio e incentivo e

por sempre ter sido o melhor irmão que uma pessoa pode ter.

Meus pais adotivos, vovô Márcio de Morais Navarro (in memoriam), vovó Ana

Jandira Monteiro Navarro (in memoriam) e tia Ana Maria Monteiro Navarro (in memoriam),

meus pais na prática, a quem devo eternamente pelo amor e educação. Também à minha tia

Palmira Navarro (in memoriam), grande incentivadora de minha educação e também

importante cuidadora num momento crítico na minha infância e ao meu tio Antônio Sérgio

Monteiro Navarro (in memoriam), pelo incentivo à leitura e à erudição.

Minha tia Edith Teixeira dos Santos e seu marido, meu tio João Olímpio dos

Santos por todo carinho e cuidados, e pelo apoio incondicional durante todos os anos desde

que a esta terra retornei.

Todos os meus amigos, verdadeiros amigos, os melhores amigos do mundo,

velhos camaradas que tenho a sorte de ter tido ao meu lado desde que cheguei a Natal há

exatos 33 anos, representados pelo meu compadre João Bernardo da Silva, (Chico Floyd);

meu primo Ivan Lopes da Silva; Francisco Alves de Souza (Souza); Sebastião Ferreira da

Silva, (o “Cabecinha”, que representa todos os grandes amigos que tive como trabalhador); e

Carlos Alberto (in memoriam), Marconi Rogério Pereira de Medeiros (in memoriam), e o

compadre Fernando Luiz Alves Freire (in memoriam) por todo apoio e carinho em horas

difíceis. Amigos são pra essas coisas.

Page 8: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

Fazer uma tese significa divertir-se e a tese é como um porco: nada se desperdiça.

(Umberto Eco).

Page 9: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

RESUMO

Neste trabalho Redes Neurais Artificiais (RNAs) baseadas em algoritmos supervisionados e

não supervisionados foram investigados para uso no estudo de parâmetros reológicos de

excipientes farmacêuticos sólidos visando a elaboração ferramentas computacionais para a

confecção de formas farmacêuticas sólidas. Entre as quatro RNAs supervisionadas, o melhor

desempenho de aprendizado foi obtido com uma rede perceptron multicamada alimentada à

frente, cuja arquitetura foi composta por oito neurônios na camada de entrada, dezesseis

neurônios na camada escondida e um neurônio na camada de saída. A curva de aprendizado

em relação ao ângulo de repouso apresentou uma redução da taxa de erro com comportamento

anômalo, enquanto que para o índice de Carr (IC) e fator de Hausner (FH) a capacidade de

ajustamento e aprendizado foi considerada muito boa portanto IC e FH foram considerados

bons descritores para as etapas posteriores do desenvolvimento das RNAs supervisionadas.

Foi avaliada a capacidade de clusterização para cinco estratégias não supervisionadas. As

RNAs baseadas em estratégias não supervisionadas puramente competitivas, "Winner-Take-

All" clássica, "Frequency-Sensitive Competitive Learning" e "Rival-Penalize Competitive

Learning" (WTA, FSCL e RPCL, respectivamente) foram capazes de reconhecer

agrupamentos dentro de uma base de dados, porém essa clusterização foi deficiente e com

graves erros de classificação, agrupando dados com propriedades conflitantes dentro de um

mesmo agrupamento e mesmo em um mesmo neurônio; além disso não foi possível

estabelecer quais os critérios de clusterização adotados pelas redes. As redes Self-Organizing

Maps (SOM) and Neural Gas (NG) mostraram uma melhor capacidade de clusterização.

Ambas reconheceram dois agrupamentos majoritários de dados, correspondentes à lactose

(LAC) e celulose (CEL). Entretanto o SOM apresentou alguns erros na classificação dos

excipiente minoritários, estearato de magnésio (EMG), talco (TLC) e atapulgita (ATP). A

rede NG, por seu turno, mostrou uma capacidade de classificação dos dados muito precisa e

consistente e resolveu os problemas de classificação mostrados pela rede SOM, apresentando-

se, portanto, como a rede mais apropriada para a classificação dos dados deste estudo. O

emprego das redes NG na área de tecnologia farmacêutica é até então inédito. este trabalho

demonstrou que as redes Neural Gas têm grande potencial para uso em sistemas de

classificação automática de excipientes farmacêuticos sólidos e como nova ferramenta para

mineração e clusterização de dados no desenvolvimento de medicamentos.

Page 10: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

Palavras-chave: Redes Neurais Artificiais. Algoritmos Não Supervisionados. Neural Gas.

Mapas Auto-organizáveis. Mapas de Kohonen. SOM. Excipientes Farmacêuticos Sólidos.

Parâmetros Reológicos. Winner-Take-All. Frequency-Sensitive Competitive Learning. Rival-

Penalize Competitive Learning.

Page 11: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

ABSTRACT

In this paper artificial neural network (ANN) based on supervised and unsupervised

algorithms were investigated for use in the study of rheological parameters of solid

pharmaceutical excipients, in order to develop computational tools for manufacturing solid

dosage forms. Among four supervised neural networks investigated, the best learning

performance was achieved by a feedfoward multilayer perceptron whose architectures was

composed by eight neurons in the input layer, sixteen neurons in the hidden layer and one

neuron in the output layer. Learning and predictive performance relative to repose angle was

poor while to Carr index and Hausner ratio (CI and HR, respectively) showed very good

fitting capacity and learning, therefore HR and CI were considered suitable descriptors for the

next stage of development of supervised ANNs. Clustering capacity was evaluated for five

unsupervised strategies. Network based on purely unsupervised competitive strategies, classic

"Winner-Take-All", "Frequency-Sensitive Competitive Learning" and "Rival-Penalize

Competitive Learning" (WTA, FSCL and RPCL, respectively) were able to perform

clustering from database, however this classification was very poor, showing severe

classification errors by grouping data with conflicting properties into the same cluster or even

the same neuron. On the other hand it could not be established what was the criteria adopted

by the neural network for those clustering. Self-Organizing Maps (SOM) and Neural Gas

(NG) networks showed better clustering capacity. Both have recognized the two major

groupings of data corresponding to lactose (LAC) and cellulose (CEL). However, SOM

showed some errors in classify data from minority excipients, magnesium stearate (EMG) ,

talc (TLC) and attapulgite (ATP). NG network in turn performed a very consistent

classification of data and solve the misclassification of SOM, being the most appropriate

network for classifying data of the study. The use of NG network in pharmaceutical

technology was still unpublished. NG therefore has great potential for use in the development

of software for use in automated classification systems of pharmaceutical powders and as a

new tool for mining and clustering data in drug development.

Keywords: Artificial Neural Networks; Unsupervised Algorithms; Neural Gas; Self-

Organizing Maps; Pharmaceutical Solid Excipients; Rheological Parameters; Winner-Take-

All; Frequency-Sensitive Competitive Learning; Rival-Penalize Competitive Learning.

Page 12: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

LISTA DE FIGURAS

Figura 1- Representação de um típico neurônio motor ................................... Página 8

Figura 2- Representação de um neurônio artificial inserido numa rede

perceptron de camadas múltiplas ....................................................

Página 10

Figura 3- Representação de um esquema matemático correspondente a um

neurônio artificial .............................................................................

Página 11

Figura 4- Representação esquemática das principais arquiteturas de redes

neurais artificiais ..............................................................................

Página 14

Figura 5- Representação esquemática de uma RNA sob aprendizado

competitivo ......................................................................................

Página 20

Figura 6- Regra de ajuste para o neurônio vencedor ....................................... Página 22

Figura 7- Distribuição bidimensional de vetores de peso frente a um

conjunto de amostras .......................................................................

Página 23

Figura 8- Esquema bidimensional para análise de clusters ............................. Página 24

Figura 9- Simplificação esquemática da conectividade inibitória em redes

WTA ................................................................................................

Página 26

Figura 10- Mapa topológico (SOM) bidimensional mostrando o neurônio

vencedor e influência cooperativa sobre suas vizinhanças ..............

Página 29

Figura 11- Grade de neurônios bidimensional 7X7 mostrando o BMU e seu

raio de abrangência, R .....................................................................

Página 30

Figura 12- Representação esquemática de um mapa de contexto SOM para

topologia bidimensional com formação de três classes ...................

Página 33

Figura 13- Representação de uma matriz-U bidimensional .............................. Página 33

Figura 14- Representação de uma matriz-U tridimensional .............................. Página 34

Figura 15- Representação de um gráfico de planos de componentes ................ Página 35

Figura 16- Ilustração do aparato para determinação do ângulo de repouso ...... Página 48

Figura 17- Descrição esquemática das etapas de pré-processamento e pós-

processamento para as RNAs supervisionadas ................................

Página 52

Figura 18- Grid de 7 X 7 neurônios .................................................................. Página 55

Figura 19- Rede MLP escolhida para o estudo .................................................. Página 56

Figura 20- Índice de Carr - Curva de decaimento do erro médio quadrático .... Página 57

Figura 21- Fator de Hausner Curva de decaimento do erro médio quadrático .. Página 58

Figura 22- Ângulo de Repouso - curva de decaimento do erro médio

Page 13: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

quadrático .......................................................................................... Página 59

Figura 23- Índice de Carr – nível de ajuste entre os dados experimentais e os

calculados pela rede .........................................................................

Página 61

Figura 24 Fator de Hausner – nível de ajuste entre os dados experimentais e

calculados pela rede .........................................................................

Página 61

Figura 25- Índice de Carr – erro percentual do nível de ajuste entre os dados

experimentais e os calculados pela rede ..........................................

Página 62

Figura 26- Fator de Hausner – erro percentual do nível de ajuste entre os

dados experimentais e os calculados pela rede ................................

Página 62

Figura 27 Matrizes-U tridimensionais e bidimensionais para as estratégias

puramente competitivas ...................................................................

Página 67

Figura 28 Matriz-U para as representações do algoritmo WTA clássico ........ Página 68

Figura 29 Matriz-U 2D para as representações do algoritmo RPCL ............... Página 69

Figura 30 Matriz-U 2D para as representações do algoritmo FSCL ................ Página 70

Figura 31 Gráfico do plano de componentes do índice de Carr para a rede

WTA ................................................................................................

Página 72

Figura 32 Gráfico do plano de componentes do índice de Carr para a rede

RPCL ...............................................................................................

Página 73

Figura 33 Gráfico do plano de componentes do índice de Carr para a rede

FSCL ................................................................................................

Página 74

Figura 34 Matrizes-U tridimensionais e bidimensionais para as estratégias

competitivo-cooperativas .................................................................

Página 76

Figura 35 Matriz-U 2D para as representações do algoritmo SOM ................. Página 78

Figura 36 Gráfico do plano de componentes do índice de Carr para a rede

SOM .................................................................................................

Página 79

Figura 37 Separação de dados de agrupamento próximos a uma linha de

fronteira ............................................................................................

Página 82

Figura 38 Matriz-U 2D para as representações do algoritmo NG .................... Página 83

Figura 39 Gráfico do plano de componentes do índice de Carr para a rede

NG ....................................................................................................

Página 84

Page 14: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

LISTA DE EQUAÇÕES

(1) Aproximação de distâncias euclidianas entre dados de entrada e

neurônios em aprendizado competitivo .................................................

Página 21

(2) Ajuste de pesos para o neurônio vencedor numa rede de aprendizado

competitivo .............................................................................................

Página 21

(3) Notação algorítmica para o ajuste de pesos para o neurônio vencedor

numa rede de aprendizado competitivo ..................................................

Página 21

(4) Conjunto de distorções de sinais ............................................................ Página 36

(5) Fator de Hausner .................................................................................... Página 43

(6) Índice de Carr ......................................................................................... Página 43

(7) Ângulo de repouso ................................................................................. Página 49

Page 15: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

LISTA DE TABELAS

Tabela 1- Equações correspondentes às funções de agregação e de ativação

totalmente diferenciáveis ................................................................... Página 12

Tabela 2- Alguns dos excipientes mais comuns na preparação de formas

farmacêuticas sólidas e suas principais funções

farmacotécnicas..................................................................................

Página 42

Tabela 3- Limites indicativos de fluidez baseados no índice de Carr ................ Página 44

Tabela 4- Excipientes puros e suas misturas binárias ........................................ Página 47

Tabela 5- Comparação entre os erros percentuais de IC e FH ........................... Página 63

Tabela 6- Limites indicativos de fluidez baseados em IC e FH como fonte

para a representação de cores nos gráficos dos planos de

componentes........................................................................................ Página 72

Page 16: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

LISTA DE ABREVIATURAS

ADALINE: Adaptive Linear Element

ART: Adaptive Resonance Theory

BMU: Best Matching Unity ou Best Matching Neuron

FL: Lógica Fuzzy (Fuzzy Logic)

FSCL: aprendizado competitivo por frequência sensitiva (Frequency Sensitive Competitive

Learning)

GA: Algoritmos Genéticos (Genetic Algorithms)

IA: Inteligência artificial

KDD: Descoberta de Conhecimento em Bases de Dados (Knowledge Discovery in Database)

LMS: Least Mean Squares

MLP: Perceptrons Multicamadas (Multilayer Perceptrons)

MTC: Computador de Teste de Memória (Memory Test Computer)

NG: Neural Gas

PDP: Processador de distribuição em paralelo.

PCA: Análise de componentes principais (principal component analysis)

QbD: Quality by Design

QSAR: Relação estrutura-atividade quantitativa (quantitative structure activity relationship)

RNA: Rede neural artificial

RPCL: aprendizado competitivo por penalização de rival (Rival – Penalize Competitive

Learning).

RSM: metodologia de superfície de resposta (response surface methodology)

SI: Sistemas Inteligentes

SOM: mapas auto organizáveis ou mapas de Kohonen (Self – organizing Maps)

SVM: Máquina de Vetor de Suporte (Support Vector Machine)

WTA: “o vencedor leva tudo” (winner take all)

Page 17: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

XOR: Função “ou-exclusivo”; Disjunção Exclusiva

Page 18: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

LISTA DE SÍMBOLOS

Distância euclidiana entre um vetor entrada em relação a um vetor de pesos

{wj} Vetor de pesos de um neurônio.

η Taxa de aprendizagem de uma RNA

xn Vetor de entrada

{xn} Conjunto de dados amostrais apresentados a uma RNA (vetores de entrada)

w Peso de um neurônio

Conjunto de vizinhança

Denota norma Euclidiana

Peso de neurônios vizinhos

M Espaço topológico de entrada

Mi Campo receptivo de um neurônio dentro do espaço M

∆wj Variações entre pesos sinápticos

Dx Conjunto de distorções associado a um sinal de entrada x

Densidade bruta

Densidade após a compactação

IC Índice de Carr

FH Fator de Hausner

α Ângulo de repouso

VC ={.} Conjunto de entradas da celulose e misturas analisados pela rede SOM

VL ={.} Conjunto de entradas da lactose e misturas analisados pela rede SOM

V'C ={.} Conjunto de entradas da celulose e misturas analisados pela rede NG

V'L ={.} Conjunto de entradas da lactose e misturas analisados pela rede NG

dBA Distância Euclidiana entre dois pontos

Page 19: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

LISTA DE ALGORITMOS

Algoritmo 1A - Sumário de um algoritmo competitivo na fase de treinamento .. Página 23

Algoritmo 1B - Sumário de um algoritmo competitivo na fase operacional ........ Página 23

Algoritmo 2 - Sumário do algoritmo SOM, fase de treinamento ............................ Página 31

Algoritmo 3 - Sumário do algoritmo SOM, fase operacional ................................. Página 34

Algoritmo 3 - Sumário do algoritmo NG ............................................................... Página 37

Page 20: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

SUMÁRIO

1 INTRODUÇÃO ........................................................................................ Página 1

2 REVISÃO DA LITERATURA .............................................................. Página 4

2.1 BREVE HISTÓRIA DA EVOLUÇÃO DA IA E RNAs .............................. Página 4

2.2 REDES NEURAIS ARTIFICIAIS ................................................................. Página 8

2.3 PARADIGMAS DE APRENDIZADO E TREINAMENTO DE REDES

..........................................................................................................................

Página 15

2.4 AUTO ORGANIZAÇÃO E MINERAÇÃO DE DADOS ............................. Página 19

2.5 ALGORITMOS DE APRENDIZAGEM NÃO SUPERVISIONADA .......... Página 20

2.5.1 WINNER-TAKE-ALL (WTA) ....................................................................... Página 26

2.5.2 FREQUENCY-SENSITIVE COMPETITIVE LEARNING (FSCL) ............. Página 27

2.5.3 RIVAL-PENALIZE COMPETITIVE LEARNING (RPCL) ......................... Página 28

2.5.4 SELF-ORGANIZING MAP (SOM) ............................................................. Página 29

2.5.5 NEURAL GAS (NG) .................................................................................... Página 36

2.6 APLICAÇÕES FARMACÊUTICAS DAS RNAS ........................................ Página 38

2.7 PROPRIEDADES REOLÓGICAS DE EXCIPIENTES SÓLIDOS .............. Página 42

3 OBJETIVOS ............................................................................................. Página 45

3.1 OBJETIVO GERAL ....................................................................................... Página 45

3.2 OBJETIVOS ESPECÍFICOS ........................................................................ Página 45

4 MATERIAL E MÉTODOS .................................................................... Página 46

4.1 PREPARAÇÃO DAS AMOSTRAS ............................................................ Página 46

4.2 IMPLEMENTAÇÃO DAS REDES NEURAIS SUPERVISIONADAS ....... Página 50

4.3 IMPLEMENTAÇÃO DAS REDES NEURAIS NÃO

SUPERVISIONADAS

................................................................................................................

Página 53

5 RESULTADOS E DISCUSSÃO ............................................................. Página 56

5.1 REDES SUPERVISIONADAS ...................................................................... Página 56

5.2 REDES NÃO SUPERVISIONADAS ............................................................ Página 65

5.2.1 WTA, RPCL E FSCL ..................................................................................... Página 66

5.2.2 NG E SOM ...................................................................................................... Página 76

5.2.2.1 SELF-ORGANIZING MAP ........................................................................... Página 78

5.2.2.2 NEURAL GAS ............................................................................................... Página 83

6 CONCLUSÕES ........................................................................................ Página 86

Page 21: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

7 PERSPECTIVAS FUTURAS ................................................................. Página 88

REFERÊNCIAS BIBLIOGRÁFICAS ................................................... Página 90

APÊNDICE A ........................................................................................... Página 107

Page 22: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

1

1 INTRODUÇÃO

Uma forma farmacêutica tem propriedades que são determinadas pelos compo-

nentes da formulação, pela proporção dos mesmos e pelas condições do processo de fabrica-

ção. Portanto a obtenção de uma formulação com ótimo desempenho galênico e biofarmacêu-

tico depende da determinação do melhor conjunto dessas condições, ou seja, as especificações

e características dos componentes/matérias-primas, o delineamento dos processos envolvidos,

a definição dos equipamentos e de seus parâmetros operacionais. Encontrar esse conjunto de

condições ideais nas diferentes etapas do desenvolvimento de um medicamento é uma etapa

do processo que consome bastante tempo e recursos, demandando esforços permanentes de

pesquisa para a sua otimização (DAVIES, 2004; GIBSON, 2004).

Quando há a necessidade, e ao mesmo tempo dificuldade de obtenção e/ou manejo

de dados sobre as propriedades dos componentes de uma formulação, os modelos de predição

e/ou classificação dessas propriedades são especialmente valiosos. Ao longo do processo de

otimização de uma formulação farmacêutica são produzidos conjuntos de dados de estrutura

inerentemente complexa e de difícil análise, e de cuja interpretação depende o resultado de

todo um trabalho. Atualmente as estratégias baseadas em abordagens estatísticas ou computa-

cionais vêm-se tornando cada vez mais importante para o processamento e interpretação des-

ses dados. Dentre as técnicas estatísticas destacam-se o design experimental e a análise mul-

tivariada de dados (GIL et al., 2008, MATERO et al, 2013).

Noutra via, os avanços na matemática e nas ciências da computação permitiram o

desenvolvimento de técnicas alternativas poderosas para a seleção e modelagem de dados de

sistemas complexos. Essas técnicas compõem uma grande área conhecida como Sistemas

Inteligentes (SI) ou mais popularmente, inteligência artificial (IA). As redes neurais artifi-

ciais (RNAs) são as mais importantes das técnicas de IA devido à sua grande habilidade em

mapear a fazer inferências a partir de sistemas complexos e não lineares. Junto com RNAs,

são associadas ferramentas importantes de IA: sistemas baseados em Lógica Fuzzy (Fuzzy

Logic, FL), a computação evolutiva e os algoritmos genéticos (Genetic Algorithms, GA), os

sistemas baseados em inteligência coletiva (Swarm Intelligence) (DASGUPTA e MICHA-

LEWICZ, 1997; GOLDBERG, 1989; HAYKIN, 1999; HAYKIN, 2001; JAGIELSKA et al,

1999; JANG et al., 1997; KENNEDY e EBERHART, 2001; MICHALEWICZ, 1999; PE-

DRYCZ e GOMIDE, 2007; POOLE et al, 1998; ROCHA, et al., 2007; SPECTOR, 2006;

WESOLOWSKI e SUCHACZ, 2012; ZADEH, 1994).

Page 23: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

2

Uma RNA é um processador maciçamente paralelo, constituído de unidades de

processamento simples que têm a propensão natural de armazenar conhecimento experimental

e torna-lo disponível para o uso (HAYKIN, 2001). As RNAs são modelos computacionais

inspirados no sistema nervoso de seres vivos, particularmente no cérebro humano. Mais espe-

cificamente, inspira-se na propriedade que tem o cérebro de processar as informações de for-

ma altamente complexa, não linear e em paralelo, e ainda na plasticidade do sistema nervoso,

na sua estrutura neuronal e em sua capacidade de desenvolver regras próprias através da expe-

riência, o que permite a sua adaptação constante ao ambiente: o aprendizado (HAYKIN,

1999; HAYKIN, 2001).

A capacidade computacional de uma RNA é bastante limitada quando comparada

a um cérebro biológico, particularmente o cérebro humano. Porém, resguardadas essa limita-

ção, uma rede neural artificial também adquire conhecimento aprendendo a partir de seu am-

biente e esses conhecimentos são armazenados através das forças de conexão entre os neurô-

nios, os pesos sinápticos. Disso derivam as características mais importantes que credenciam

todas as aplicações das RNAs (HAYKIN, 1999; HAYKIN, 2001; DA SILVA, et al., 2010):

i. adaptação pela experiência, onde os pesos sinápticos são ajustados constantemen-

te frente à apresentação sucessiva de exemplos relacionados ao comportamento do

processo (padrões, amostras, medidas);

ii. capacidade de aprendizado, proveniente da extração, pela rede, das relações exis-

tentes entre as diversas variáveis que compõem o sistema, através da aplicação de

um método de treinamento;

iii. habilidade de generalizações donde, uma vez treinada, a rede é capaz de generali-

zar o conhecimento adquirido, possibilitando estimar soluções até então desconhe-

cidas;

iv. armazenamento distribuído, em que o conhecimento adquirido fica disperso nas

diversas sinapses dentro da arquitetura da rede, aumentando a robustez da rede

frente a eventuais neurônios que se tornem inoperantes, contribuindo para a tole-

rância às falhas;

v. facilidade de prototipagem, dependendo da especificidade da aplicação, da maio-

ria das arquiteturas neurais em hardware ou software.

Page 24: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

3

As RNAs são construções matemáticas capazes de aprender as relações entre os

dados, sem a necessidade de conhecimento prévio de sua natureza, daquilo que representam, e

não fazem nenhuma pressuposição sobre a função pela qual esses dados são relacionados:

simplesmente criam e acessam uma variedade de modelos matemáticos para determinar aque-

le em que os dados experimentais se encaixam melhor. Isso faz com que as aplicações das

RNAs se estendam através das áreas mais diversas possíveis, indo desde a avaliação de ima-

gens de satélite, identificação de perfis de crédito para clientes em instituições financeiras,

reconhecimento de faces, de voz e de escrita (HAYKIN, 2001; DA SILVA, et al., 2010).

Na área biomédica podem ser aplicadas no diagnóstico de infartos e doenças car-

díacas, prognóstico através do reconhecimento de padrões em sinais biológicos, exames clíni-

cos e diagnóstico de imagens. Além disso os recursos de uma RNA podem ser incrementados

através da combinação com as outras ferramentas de IA previamente mencionadas, GA ou

FL, o que tem contribuído para o aumento do emprego na área farmacêutica, particularmente

no desenvolvimento e otimização de sistemas de liberação modulada e formulações de libera-

ção imediata de fármacos, em processos intermediários de produção como a granulação; no

desenvolvimento de formulações tópicas e de filmes de revestimento (YAN et al, 2006; RA-

FIEE, et al, 2009; ARIF et al, 2010; SMOLAR et al, 2010).

O desenvolvimento e emprego de técnicas de computacionais de otimização na

área farmacêutica torna-se ainda importante desde que foi introduzido o conceito de Quality

by Design (QbD) como um marco regulatório de qualidade em medicamentos. Uma vez que a

QbD está voltada a compreender como os parâmetros da formulação e dos processos afetam

as características do produto e à monitoração e otimização online de sua produção, as RNAs

se apresentam como ferramentas muito úteis na obtenção de detalhes desses processos e nas

tomadas de decisão em relação a eles, com enorme potencial de contribuição à inovação tec-

nológica na área farmacêutica no Brasil (AKSU et al., 2013; AKSU et al., 2012; ROY, 2012).

Page 25: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

4

2 REVISÃO DA LITERATURA

2.1 BREVE HISTÓRIA DA EVOLUÇÃO DA IA E RNAs

Analisando historicamente, a IA resultou de uma evolução que data de milênios

atrás. Se assumirmos que a IA é fundada sobre o tripé lógica, probabilidade e computação,

a ideia de construir um ser ou máquina que emulasse a inteligência humana tem origem na

Grécia antiga, uma vez que a lógica formal foi inicialmente postulada pelos filósofos nessa

época de nossa história. A evolução continuou através do desenvolvimento da matemática,

principalmente cálculo e estatística. Mas essa aspiração só veio a se completar e finalmente

transformar-se em realidade a partir da segunda metade do século XIX e primeira metade do

século XX, respectivamente após o conhecimento de como funciona a mente humana e com

o desenvolvimento do computador eletrônico (RUSSELL e NORVIG, 2003; SHARKEY e

SHARKEY, 2006).

No século XVII já se pensava que para se criar uma “inteligência artificial”, em

primeiro lugar devia-se entender os princípios de funcionamento da inteligência humana

para construir um dispositivo de acordo com esse projeto. Essas suposições tornaram-se pro-

posições formais no século XIX, quando William Paley argumentou que eram necessários

“elementos inteligentes” para se produzir de sistemas adaptativos complexos. Sua proposição

foi veementemente refutada por Charles Darwin em 1859, que demonstrou que um sistema

complexo e adaptativo poderia ser criado sem um “elemento inteligente”, e sim surgir natu-

ralmente a partir de um processo de seleção aleatória (SPECTOR, 2006).

Poucos anos depois, em 1890, com os avanços da neurobiologia, as raízes da IA,

particularmente das redes neurais, foram plantadas: William James postulou que a quantidade

de atividade em qualquer ponto da córtex cerebral é a soma das tendências de todos os outros

pontos de descarga no local. Numa outra frente, os psicólogos experimentalistas trabalhavam

para entender de que forma acontecia nos animais, o aprendizado, o esquecimento, os proces-

sos de identificação e outras tarefas; esses experimentos psicofísicos foram fundamentais para

a compreensão de como funcionavam os neurônios, individualmente ou em grupos (ME-

RHOTRA et al., 1996).

Page 26: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

5

Outro passo importante foi dado em 1920, quando os psicólogos da corrente Ges-

talt (ou psicologia da forma) estabeleceram que a resolução exitosa de um problema requeria

a criação de uma representação cognitiva para a percepção dos objetos envolvidos no pro-

blema, para então reorganizar essas representações numa nova representação que permitisse

sua solução; isto viria a ser a base do processamento de dados para a resolução de proble-

mas complexos (CONDELL et al, 2010). Rashevsky, em 1938, em seus estudos sobre neuro-

dinâmica, também conhecidos como teoria do campo neural, representou a ativação e propa-

gação de sinais em redes neurais biológicas através de equações diferenciais (MERHOTRA

et al., 1996).

O cume da fase inicial da construção das bases da IA e, por conseguinte, das redes

neurais artificiais, foi então alcançado em 1943, quando McCulloch e Pitts criaram o primeiro

modelo artificial de neurônios biológicos, descrevendo o cálculo de lógica proposicional

baseado na natureza “tudo ou nada” típica da atividade nervosa, cuja rede constituída por es-

ses modelos artificiais seria capaz de calcular qualquer função computável. Esse artigo inau-

gurou a idade das RNAs e influenciou John Von Neumann a desenvolver entre 1943 e 1946, o

que viria a ser o primeiro computador de uso geral (McCULLOCH e PITTS, 1943; MERHO-

TRA et al, 1996).

Ashby, em 1947, cunhou o termo "autoadaptação", no contexto da IA, e no final

de 1950 postulou que o comportamento adaptativo de um sistema não era inato, mas aprendi-

do, e através do aprendizado o comportamento de um sistema tenderia a melhorar (ASHBY,

1947; ASHBY, 1960). Em 1949, Hebb, em seu influente livro "A Organização do Comporta-

mento", introduziu a regra de aprendizagem: a ativação repetida de um neurônio por ou-

tro, através de uma sinapse particular, aumenta a condutância (MERHOTRA et al,

1996;. LANSNER, 2009).

A regra baseava-se em quatro pontos fundamentais: a informação é armazenada

nos pesos de uma rede neural; o coeficiente de aprendizado é proporcional ao produto dos

valores de ativação do neurônio; os pesos são simétricos, ou seja, o peso da conexão de A

para B é igual a de B para A; quando ocorre o aprendizado os pesos são alterados (atualiza-

ção). Então o aprendizado resultaria do fortalecimento de certos padrões de atividade neural

pelo aumento da probabilidade (peso) de disparo de neurônios induzido entre as sinapses, e

pelo aumento da eficácia dessas sinapses através da ativação repetida de um neurônio pelo

neurônio anterior (MERHOTRA et al, 1996;. LANSNER, 2009).

Page 27: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

6

Farley e Clark, em 1954, usaram um computador de teste de memória (MTC) para

testar a capacidade de um computador digital em se auto-organizar para executar tarefas sim-

ples (FARLEY E CLARK, 1954). Depois, em 1956, Rochester e colaboradores testaram o

postulado de Hebb através da simulação de redes neuronais numa calculadora eletrônica IBM

Tipo 704, dando um passo importante para o desenvolvimento de modelos computacionais de

aprendizagem e sistemas adaptativos (ROCHESTER, et al, 1956). No mesmo ano, o termo IA

foi cunhado pela primeira vez na conferência de Dartmouth (MILLER, 2003).

Rosenblatt, baseando-se no postulado de Hebb, introduziu o conceito de percep-

trons, equações com as quais era possível prever as curvas de aprendizagem a partir de variá-

veis neurológicas e, da mesma forma, prever as variáveis neurológicas a partir de curvas de

aprendizagem (ROSENBLATT, 1956). Assume-se que os perceptrons são os primeiros neu-

rônios artificiais e que a rede perceptron foi a primeira RNA da história; o perceptron, bloco

básico de construção das RNAs, forneceu a base teórica e experimental de todos os modelos

neurais artificiais, tais com as redes de Kohonem e o algoritmo backpropagation, que viriam a

ser implementados quase quatro décadas depois (WIDROW e HOFF, 1960; LARA, 1998;

KANAL, 2001).

Mas em 1969 a neurocomputação viria sofrer um grande revés devido à revelação

das deficiências dos peceptrons por Minsky e Pappert. Eles demonstraram que uma rede neu-

ral de uma única camada (rede perceptron e também Adaline) aprendia apenas padrões line-

armente separáveis e era incapaz de aprender o relacionamento entre as entradas e saídas de

funções simples, do tipo XOR (“ou-exclusivo”, também conhecido como disjunção exclusiva,

base para os problemas de “portas lógicas”). Com essa publicação ficou então demonstrada a

impossibilidade para as RNAs da época de fazerem uma classificação correta para padrões

não linearmente separáveis (MINSKY e PAPPERT, 1969; LARA, 1998; KANAL, 2001).

Como reflexo, a evolução das RNAs praticamente parou durante a década seguin-

te: a maioria dos pesquisadores abandonou a área e os recursos desapareceram. Entretanto

alguns trabalhos nessa “entressafra” merecem destaque, como a implementação de algoritmos

de predição utilizando gradiente reverso, apresentado por Paul Werbos, em 1974; a imple-

mentação das redes ART (Adaptive Resonance Theory) por Grossberg, em 1980; a formula-

ção dos mapas auto-organizáveis por Teuvo Kohonen, em 1982; e a proposição das redes

recorrentes baseadas em funções de energia, por Hopfield, em 1982 (WERBOS, 1974;

GROSSBERG, 1980; KOHONEN, 1982).

Page 28: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

7

E foi baseado no trabalho de Werbos - que em 1974 descreveu pela primeira vez o

algoritmo de retro propagação de erro (backpropagation algorithm, ou simplesmente back-

propagation) - que Rumelhart e colaboradores apresentaram em 1986, o backpropagation

totalmente desenvolvido: um algoritmo que permitia ajustar os pesos em uma rede com mais

de uma camada de neurônios, solucionando inclusive o problema de aprendizado da função

lógica XOR. Nasciam assim os perceptrons multicamadas – multilayer perceptrons, MLP – a

estrutura da maioria das redes neurais supervisionadas utilizadas na atualidade (RUME-

LHART, 1986; LARA, 1998; BISHOP, 1999; KANAL, 2001; ROCHA et al, 2007).

Porém o passo decisivo veio com Hornik, que apresentou em 1989 as redes feed-

forward (alimentadas à frente), redes que com um número suficiente de “neurônios escondi-

dos", ou intermediários entre as unidades de entrada e saída, funcionariam como “aproxima-

dores universais”, ou seja, redes neurais que poderiam em tese aproximar praticamente qual-

quer função de interesse, para qualquer grau de exatidão desejado. Esses avanços, somados ao

desenvolvimento de novos algoritmos, possibilitaram a superação das deficiências do percep-

tron de Rosenblatt (HORNIK et al, 1986; KANAL, 2001; ROCHA et al, 2007).

Desde então o desenvolvimento de redes neurais artificiais tem sido explosivo. Is-

so é evidenciado pelo número de cientistas, os montantes de financiamento, o número de

grandes conferências, bem como o número de revistas voltadas ao tema. O surgimento de

novos algoritmos, a hibridização de RNAs com outras técnicas, tais como FL e GA, permiti-

ram um incremento na eficiência do treinamento de RNAs em diversas aplicações. Soma-se a

isso o desenvolvimento de RNAs baseadas em máquinas de vetor de suporte (support vector

machines, SVM) e de novos softwares e hardwares - esforços que vêm cada vez mais contri-

buindo para a expansão nas áreas de aplicação das ANNs (HAGAN e MENHAJ, 1994;

VAPNIK, 1998).

Page 29: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

8

2.2 REDES NEURAIS ARTIFICIAIS

A estrutura das RNAs foi desenvolvida a partir de comparações com modelos co-

nhecidos de cérebros biológicos, principalmente do cérebro humano. O cérebro é o órgão

mais nobre do corpo humano. Sua função é produzir ações associadas a cada uma das funcio-

nalidades do corpo, das quais as mais refinadas são o pensar e o memorizar, atividades essas

decorrentes de um complexo processamento e armazenamento de informações regidos por

elementos processadores biológicos que operam maciçamente em paralelo: os neurônios

(SHEPHERD, 1990; GUYTON e HALL, 2006).

Os neurônios são a unidade elementar do cérebro (Figura 1). Eles são constituídos

de três partes – o corpo celular, os axônios e os dendritos – e sua função é conduzir impul-

sos (informação) para um neurônio seguinte. A transmissão do impulso ocorre nas sinapses,

que são as conexões interneuronais, e é mediada pela liberação de neurotransmissores na fen-

da sináptica (SHEPHERD, 1990; GUYTON e HALL, 2006).

Figura 1: Representação de um típico neurônio motor: os dendritos coletam os sinais elétricos, o cor-

po celular integra os sinais que chegaram e geram um sinal de saída para os axônios e os axônios

transmitem o sinal de saída para os dendritos de outro neurônio ou para alguma célula efetora, de a-

cordo com o sentido representado pelas setas.

Fonte: GUYTON e HALL, 2006.

Page 30: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

9

Os neurotransmissores são os responsáveis por ponderar a transmissão elétri-

ca (informação) de um neurônio para outro, de modo que a funcionalidade do neurônio fica

na dependência do comportamento dessas ponderações sinápticas, que são dinâmicas e por

sua vez dependem da química do cérebro no momento (HODKIN e HUXLEY, 1952; GUY-

TON e HALL, 2006).

As atividades de um neurônio biológico, individualmente, são muito simples; po-

rém quando operam em conjunto, os neurônios são responsáveis por todos os processamentos

gerenciados e executados pelo cérebro. Isto porque estima-se que existam cerca de 100 bi-

lhões de neurônios no cérebro e considerando que cada um deles esteja interligado através de

sinapses a outros 6000 neurônios, teríamos então 600 trilhões de sinapses – as ponderações

responsáveis por todas as atividades gerenciáveis pelo cérebro, das mais elementares às mais

complexas (SHEPHERD, 1990).

O elemento computacional básico de uma RNA é o neurônio artificial, um mo-

delo matemático inspirado na análise da geração e propagação de impulsos elétricos pela

membrana celular neuronal; o neurônio artificial recebe uma ou mais informações de entrada

e produz uma informação de saída, nos moldes do perceptron de Rosenblatt (Figuras 2 e 3).

Os neurônios das RNAs são não lineares, fornecem saídas tipicamente contínuas e realizam

funções simples como coletar os sinais de entrada, para então agrega-los de acordo com sua

função operacional e produzir uma resposta levando em consideração sua função de ativação

inerente, analogamente aos dendritos, corpo celular e axônios, respectivamente (HODKIN e

HUXLEY, 1952; HAYKIN, 2001).

Para iniciar uma descrição de uma RNA e de seus elementos básicos, os neurô-

nios, considere-se uma rede neural supervisionada implementada para otimização de parâ-

metros de uma formulação farmacêutica (Figura 2A). Os diversos sinais de entrada oriundos

do meio externo são representados pelo conjunto {x1, x2, x3, ... xn}, de forma análoga aos im-

pulsos captados pelos dendritos nos neurônios biológicos (Figura 2C). Esses sinais são valo-

res assumidos pelas variáveis de uma aplicação específica e geralmente são normalizados para

incrementar a eficiência do algoritmo de aprendizagem. As ponderações efetuadas nas sinap-

ses dos neurônios biológicos correspondem nos neurônios artificiais aos conjuntos de pesos

sinápticos {w1, w2, w3, ... wn} (HAYKIN, 2001; DA SILVA et al., 2010).

Page 31: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

10

Figura 2: Representação de um neurônio artificial (c) inserido numa rede perceptron de camadas múl-

tiplas, MLP (b), visando hipoteticamente à otimização de uma formulação farmacêutica (a): os neurô-

nios dissecados correspondem à esfera alimentada pelos sinais de entrada ponderados, em c). No neu-

rônio estão evidenciados seus elementos básicos.

Fonte: adaptado de ROWE e ROBERTS, 1998.

Os pesos sinápticos são os valores que servirão para ponderar cada uma das variá-

veis de entrada da rede, permitindo quantificar sua relevância em relação à funcionalidade do

respectivo neurônio. A relevância de cada entrada {xi,}, portanto, é então executada por meio

de multiplicações pelos respectivos pesos sinápticos {wi}, ponderando-se, desse modo, todas

as informações externas que chegam ao neurônio (HAYKIN, 2001; DA SILVA et al., 2010).

Page 32: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

11

Os sinais de entrada já ponderados são agregados pelo combinador linear,

Σ, de modo a produzir um valor de potencial de ativação. Esse combinador linear cor-

responde a uma função de agregação, que pode ser uma função linear ou radial (Tabela

1). É o limiar de ativação que especifica qual será o patamar apropriado para que o

resultado produzido pelo combinador linear possa gerar um valor de disparo em direção

à saída do neurônio. É possível então estabelecer que a saída do corpo celular artificial,

denotada aqui por u, corresponde à soma ponderada de suas entradas, balanceada pelo

limiar de ativação. Noutras palavras, o potencial de ativação, u, corresponde à diferen-

ça do valor produzido entre o combinador linear e o limiar de ativação. Se esse valor é

positivo (u ≥ θ) o neurônio produz um potencial excitatório, ou seja, dispara; e se o va-

lor for negativo (u ≤ θ), o potencial será inibitório, ou seja, o neurônio não dispara (DA

SILVA et al., 2010).

Figura 3: Representação de um esquema matemático correspondente a um neurônio artificial: A) re-

presentação esquemática do corpo do neurônio, analogamente à figura 2; B) representação matemática

do potencial de ativação; C) representação matemática do sinal de saída gerado pelo neurônio.

Fonte: adaptado de ROWE e ROBERTS, 1998; DASILVA 2012.

De forma sintética, matematicamente, no funcionamento de um neurônio artificial

o conjunto de valores representantes das variáveis é apresentado aos neurônios como dados de

entrada e cada uma dessas entradas será multiplicada pelo seu peso sináptico correspondente

(Figura 3). O potencial de ativação é produzido quando da soma ponderada dos sinais de en-

trada é subtraído o limiar de ativação, o qual é aplicado em uma função de ativação apropria-

da (Tabela 1), cujo sinal é compilado na saída do neurônio. Os critérios de aplicação para as

funções de ativação dependem da natureza do problema (HAYKIN, 2001; DA SILVA et al.,

2010; WESOLOWSKI e SUCHACZ, 2012).

Page 33: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

12

Tabela 1: Equações correspondentes às funções de agregação e funções de ativação totalmente dife-

renciáveis. u: soma ponderada de todas as entradas nos neurônios; m: número de entradas no neurô-

nio; xi: sinal de entrada do i-ésimo neurônio; wi: peso do i-ésimo neurônio; σ: espalhamento radial; e:

base do logaritmo natural.

Fonte: adaptado de HAYKIN, 2001; DA SILVA et al., 2010; WESOLOWSKI e SUCHACZ, 2012.)

Uma rede neural, por sua vez, é formada por neurônios e sinapses que os interli-

gam. Consiste num conjunto de neurônios relacionados com seus pesos sinápticos (coeficien-

tes), e que se comunicam através do envio de sinais de um neurônio para o outro ao longo de

um grande número de ligações ponderadas. Cada peso sináptico define a importância relativa

de um sinal de entrada e calcula a média ponderada desses sinais. Os pesos são armazenados

nas sinapses e esses resultados serão utilizados como entradas para uma função de ativação. O

resultado do cálculo pode, ou não, ser o valor da entrada do neurônio seguinte, caso o cálculo

resulte em ativação ou não ativação do neurônio, respectivamente (HAYKIN, 2001).

Uma RNA é dividida em três partes básicas: uma camada de entrada; uma ou

mais camadas escondidas, também chamadas de camadas intermediárias, ocultas ou invisí-

veis; e uma camada de saída (Figura 2B). É na camada de entrada que os dados do conjun-

to {x1, x2, x3, ... xn} são recebidos, dados estes que são geralmente normalizados entre 0 e 1

em relação às faixas de variação dinâmicas geradas pelas funções de ativação, de modo a me-

lhorar a precisão numérica frente às operações matemáticas realizadas pela rede (HAYKIN,

2001).

Page 34: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

13

Nas camadas escondidas são extraídas as características associadas ao processo

ou sistema a ser inferido e é nelas que é realizada boa parte do processamento interno da rede;

a despeito disso, algumas arquiteturas de rede podem prescindir dessa camada oculta, con-

forme veremos adiante. Na camada de saída são produzidos e apresentados os resultados

finais da rede (HAYKIN, 2001; DA SILVA et al., 2010).

Quando formada uma RNA, os neurônios devem obedecer a uma organização es-

trutural que caracterizará essa rede. Essa organização estrutural é chamada de arquitetura da

rede e esses arranjos são essencialmente estruturados através do direcionamento das conexões

sinápticas dos neurônios. Embora existam muitas arquiteturas de rede possíveis, podemos

classifica-las em quatro grupos conforme a disposição dos neurônios, a forma como se interli-

gam e a constituição de suas camadas. São elas as redes feedforward de camada simples,

redes feedforward de camadas múltiplas, redes recorrentes e redes reticuladas (Figura 4).

Nas redes feedforward de camada única só existe uma camada de neurônios en-

trada e uma de saída; nelas o fluxo da informação é unidirecional, no sentido da entrada para a

saída da rede e a quantidade de saídas sempre coincide com o número de neurônios da rede.

São redes empregadas tipicamente na resolução de problemas de classificação de padrões e

filtragem linear (Figura 4A). Nas redes feedforward de camadas múltiplas há uma ou mais

camadas escondidas, cuja quantidade e número de neurônios nelas contidos dependerá da

complexidade do problema e da quantidade e qualidade dos dados disponíveis, porém a quan-

tidade de saídas também coincidirá com o número de neurônios da camada de saída. São a-

propriadas à resolução de problemas mais complexos, por exemplo, a aproximação de fun-

ções, identificação de sistemas, otimização e controle de processos, robótica (Figura 4B). As

redes perceptron multicamadas (multilayer perceptron, MLP, figura 1B) e as redes de função

de base radial (radial basis function, RBF) são os principais representantes dessa arquitetura

(MEHOTRA et al, 1996; DA SILVA et al., 2010)

Page 35: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

14

Figura 4: Representação esquemática das principais arquiteturas de redes neurais artificiais. A) rede

feedfoward de camada simples; B) rede feedfoward de camadas múltiplas; C) rede recorrente; D) rede

com estrutura reticulada.

Fonte: adaptado de DA SILVA et al., 2010

Nas redes recorrentes as saídas são realimentadas como sinais de entrada para

outros neurônios, qualificando essas redes para processamentos dinâmicos, como os usados

para previsão de séries temporais e ainda na otimização e controle de processos (Figura 4C).

As redes de Hopfield são exemplo dessa arquitetura; as redes MLP também podem ser redes

realimentadas. As redes com estrutura reticulada têm como característica principal a dispo-

sição espacial dos neurônios apropriada para extração de características, ou seja, a localização

do neurônio está diretamente relacionada com o processo de ajuste dos seus pesos e limiares

de ativação, sendo a rede de Kohonen, que é treinada por processo competitivo/cooperativo,

a mais importante das redes com essa arquitetura (MEHOTRA et al, 1996; HAYKIN, 2001;

DA SILVA et al., 2010).

Page 36: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

15

2.3 PARADIGMAS DE APRENDIZADO E TREINAMENTO DE REDES

Todo o trabalho executado por uma RNA é o resultado de sua mais importante

propriedade, o aprendizado. Como todo o conceito relacionado a RNAs baseia-se no funcio-

namento do cérebro humano, a forma de aprendizado segue naturalmente esse paralelo. A

construção mental do conhecimento está baseada em dois paradigmas principais: o simbo-

lismo e o conexionismo. No paradigma simbólico o conhecimento é representado por regras

lógicas e símbolos, e o comportamento inteligente resulta da aplicação/execução dessas regras

e manipulação desses símbolos. No conexionismo, o conhecimento está relacionado ao pro-

cessamento das informações, que se dá em redes neuronais, através de estimulações de grupos

de neurônios de forma paralela (diferentes redes de neurônios em diferentes partes do cérebro

processam a mesma informação). É daí que o homem desenvolve a capacidade de produzir

generalizações a partir de experiências específicas (MOTA e ZIMMER, 2005).

Historicamente, a IA clássica originou-se no paradigma da computação simbólica.

Postulava-se que qualquer pensamento inteligente pode ter sua raiz nas computações de sis-

temas simbólico-físicos. De acordo com o paradigma simbólico o cérebro constrói seus mode-

los de estruturas cognitivas de armazenamento e organização de conhecimento semelhante

aos arquivos de um computador, como os esquemas e os frames (MINSKY, 1981; HAY-

KIN, 2001; MOTA; ZIMMER, 2005).

Teoricamente no processamento da informação a cognição é uma operação coor-

denada de vários processos mentais realizados em um sistema de memória multicomponen-

cial: memória sensorial, memória de trabalho, memória de curto prazo e memória de longo

prazo. O processamento de informação consiste essencialmente na transformação de símbolos

de acordo com regras, que na IA estariam estabelecidas num programa computacional. No

simbolismo a ênfase é dada aos processos mentais – softwares – sem preocupação alguma

com a relação desses com a estrutura onde ocorrem: o cérebro – ou hardware – distinguindo a

realidade mental da realidade física. Dessa forma, os modelos simbólicos refletem os princí-

pios baseados na serialidade dos processos cognitivos (HAYKIN, 2001; HORGAN, 1997;

MOTA e ZIMMER, 2005).

Page 37: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

16

Nas RNAs o processo de aprendizado é prioritariamente conexionista. No cone-

xionismo os processos cognitivos levam em conta a base física e o meio ambiente onde se

situa o sistema em que eles ocorrem. Enquanto a modelagem simbólica, realizada em compu-

tadores digitais, objetiva modelar a mente como um processador de símbolos serial e tem co-

mo objetivo principal criar uma única arquitetura cognitiva que possa desempenhar qualquer

tarefa, o conexionismo procura projetar computadores inspirados no cérebro, que é um pro-

cessador de distribuição em paralelo (PDP). A abordagem PDP tenta elucidar os princípios

gerais que governam todos os aspectos da cognição, e busca, portanto, através de modelos e

simulações extremamente simples, capturar o conjunto de princípios gerais sobre a natureza

da aprendizagem e do processamento no sistema cognitivo humano, emulando esses princí-

pios numa máquina computacional. Desse modo a semântica do domínio não precisa ser in-

troduzida explicitamente no sistema: o sistema pode induzir este conhecimento através de um

processo de aprendizagem (POERSH, 2004; MOTA e ZIMMER, 2005).

A propriedade mais importante das redes neurais, portanto, é a habilidade de a-

prender de seu ambiente e com isso melhorar seu desempenho. Isso é feito através de um

processo iterativo de ajustes aplicado a seus pesos, denominado treinamento. O aprendiza-

do ocorre quando a rede neural atinge uma solução generalizada para uma classe de proble-

mas, ou seja, um conjunto de padrões de entrada (amostras) que expressam o comportamento

do sistema é apresentado repetidas vezes à RNA (processo iterativo) e depois de aprender as

relações entre as entradas e as saídas, as redes são capazes de fazer generalizações sobre esse

sistema (HAYKIN, 2001; DA SILVA et al., 2010).

Há diferentes processos de aprendizado, cada qual adequado aos diferentes tipos

de RNAs, mas de modo geral os processos de aprendizado podem ser classificado em dois

grupos: os processos associativos e os processos não-associativo. O aprendizado associativo,

que é o modelo para as RNAs supervisionadas, implica em aprender sobre o relacionamento

que há entre pares de estímulos. Já o aprendizado não-associativo, que é o modelo para as

RNAs não-supervisionadas, não há estímulos secundários para associar com os estímulos

primários. Neste tipo de aprendizado, a repetição de um estímulo fornece a oportunidade para

aprender sobre suas propriedades (KRÖSE e VAN DER SMAGT, 1996; DA SILVA et al.,

2010).

Page 38: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

17

O aprendizado numa rede neural resulta do processo de treinamento. O treina-

mento numa RNA consiste na aplicação de passos ordenados necessários à sintonização dos

pesos sinápticos e limiares (thresholds, θ), onde objetivo final é a criação de generalizações

de soluções em suas saídas. Dá-se o nome de algoritmo de aprendizado ao conjunto desses

passos ordenados, que extrai características discriminantes do sistema a partir de amostras do

mesmo. As amostras são divididas em dois subconjuntos, o subconjunto de treinamento,

que abarca de 60 a 90% do conjunto total e é usado para o aprendizado da rede; e o subcon-

junto de teste, composto de 10 a 40% das amostras e é usado para verificar se as generaliza-

ções estão em patamares aceitáveis para, por conseguinte, validar a topologia de rede adotada

(DA SILVA et al., 2010; HAYKIN, 1999; HAYKIN, 2001; MEHROTRA, et al., 1996).

Dá-se o nome de época de treinamento, ou ciclo, a cada apresentação completa

dos n-pares (entrada e saída) do subconjunto de treinamento à rede. A correção dos pesos em

cada época de treinamento pode ser feita pelo modo padrão, que se dá a cada apresentação

do subconjunto de treinamento à rede e cada correção de peso baseia-se no erro individual

do exemplo apresentado naquela iteração, portanto ocorrem n-correções em cada ciclo; e pelo

modo batch, onde é feita apenas uma correção por ciclo, no qual todos os exemplos do sub-

conjunto de treinamento são apresentados à rede, que calcula o erro médio e desse resultado

corrige os pesos. Então, independentemente do modo pelo qual foi efetuada a correção, o a-

juste dos pesos e limiares se dá pelo erro observado na comparação entre o dado de saída de-

sejada e aquele previsto pela rede (defasagem). Quando esse erro estiver dentro de limites

aceitáveis a rede neural está treinada (DA SILVA et al., 2010; HAYKIN, 1998; KRÖSE;

VAN DER SMAGT, 1996; MEHROTRA, et al., 1996).

Há três principais estratégias de treinamento: o treinamento (ou aprendizado)

supervisionado, o treinamento por reforço e o treinamento não supervisionado. No a-

prendizado supervisionado, a RNA é treinada com auxílio de um “supervisor” ou professor.

A rede deverá possuir pares de entrada e saída (conjunto de entradas e conjunto de saídas de-

sejadas para cada entrada), disponibilizados numa tabela de dados entrada/saída, também co-

nhecida como tabela atributos/valores), de modo que toda vez que for apresentada à rede uma

entrada, deverá ser verificado se a saída obtida, gerada a partir dos cálculos efetuados a

partir dos pesos que a rede possui, confere com a saída desejada para àquela entrada; se for

diferente, a rede deverá ajustar os pesos de forma que armazene o conhecimento desejado.

Esta interatividade do treino deverá ser repetida com todo conjunto de treinamento (entradas e

saídas), até que a taxa de acerto esteja dentro de uma faixa considerada satisfatória. O “pro-

Page 39: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

18

fessor” na verdade é a própria tabela que ensina à rede qual a resposta correta para cada entra-

da apresentada – um conhecimento indutivo apriorístico (KRÖSE e VAN DER SMAGT,

1996; MEHROTRA, et al., 1996; HAYKIN, 1998; HAYKIN, 2001; DA SILVA et al.,, 2010).

O aprendizado por reforço é considerado uma variação do treinamento supervi-

sionado. Não há a presença do professor, mas de um “crítico externo” ou rede crítica, que

avalia a resposta fornecida pela rede através da criação de uma função custo, J – que tem a

finalidade de prever o reforço – e aplicar um procedimento de aprendizado que adapta os pe-

sos dos neurônios de modo a estabelecer um mapeamento que minimiza o valor de J. Noutras

palavras, o algoritmo de treino, geralmente baseado em métodos estocásticos, ajusta os parâ-

metros internos dos neurônios baseado em quaisquer informações qualitativas ou quantitativas

inferidas do sistema mapeado (ambiente) que são usadas para medir e corrigir o desempenho

do aprendizado. O treinamento é, portanto, por tentativa e erro: se a resposta for satisfatória

o neurônio é “recompensado” pelo incremento de seu peso e limiar; se for insatisfatória, o

neurônio é “punido” (KRÖSE e VAN DER SMAGT, 1996; SUTTON e BARTO, 1998; DA

SILVA et al., 2010).

No aprendizado não supervisionado não existe um conjunto de saídas deseja-

das, portanto não há professores, uma vez que não existem agentes externos que indiquem

uma resposta desejada para um dado padrão de entrada. Esse treinamento também é conheci-

do como auto supervisionado ou auto organizado, uma vez que a própria rede se auto orga-

niza em relação às particularidades encontradas entre os elementos do subconjunto amostra,

identificando subconjunto que contêm similaridades (clusters). O aprendizado, então, ocorre

pela descoberta de padrões ou relevâncias dentro da massa de dados pela rede ao longo do

treinamento, de forma que os dados são agrupados (clusterizados) conforme esses padrões.

Dependendo do conhecimento do problema por parte do projetista da rede e também do tipo

de algoritmo não supervisionado escolhido, o número máximo de clusters pode ser previa-

mente determinado (KRÖSE e VAN DER SMAGT, 1996; HAYKIN, 1998; HAYKIN, 2001;

DA SILVA et al., 2010).

Page 40: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

19

2.4 AUTO ORGANIZAÇÃO E MINERAÇÃO DE DADOS

A auto organização dá origem a estruturas e ordens sem que estas sejam impostas

ao sistema; é um fenômeno interno ao sistema, resultante da interação entre seus componen-

tes, independente da natureza física dos mesmos (MITCHELL, 2006). Os algoritmos de a-

prendizado não supervisionado buscam encontrar estruturas ocultas em massas de dados não

rotulados, através da descoberta e classificação de características salientes nesses dados, e

cujas técnicas estão baseadas principalmente em métodos de mineração de dados (data mi-

ning). A mineração de dados é parte do processo de descoberta de conhecimento em bases

de dados (knowledge discovery in database, KDD), que corresponde à extração não trivial de

informações implícitas, previamente desconhecidas e potencialmente úteis a partir de uma

massa de dados (COSTA et al, 2011; FRAWLEY et al, 1992; HAYKIN, 1999; HAYKIN,

2001; HINTON; SEJNOWSKI, 1999).

Os dados gerados no desenvolvimento de formulações farmacêuticas são tipica-

mente dados multivariados com características de sistemas complexos, portanto o formulador

deve trabalhar em um espaço de design multidimensional por natureza e impossível de ser

conceitualizado, suscitando o emprego de técnicas avançadas de computação, que incluem os

chamados sistemas especialistas (ROWE e COLBOURN, 2006), que lançam mão de algo-

ritmos de aprendizado não supervisionados que identificam padrões de interesse e os descre-

vem de forma concisa e com significado claro. O processo de classificação categoriza ou

agrupa (clusteriza) os registros em subclasses que refletem os padrões inerentes nos dados,

enquanto o processo descritivo sumariza as qualidades relevantes das classes identificadas

(FRAWLEY et al, 1992; ROWE e COLBOURN, 2006).

Embora tanto o processo de classificação como o processo descritivo estejam pre-

sentes em ambos algoritmos de aprendizado supervisionado e algoritmos não supervisio-

nado, estes são características mais marcantes de não supervisionados. É necessário, entretan-

to, um esclarecimento neste ponto: a análise de dados por método não supervisionado não

dispensa um especialista de área. O conhecimento acerca do conteúdo da base de dados aju-

da a tornar o “conhecimento” nela descoberto mais significativo para o usuário final, e esse

conhecimento da área de domínio é usualmente fornecido por um especialista nessa área

de domínio (FRAWLEY et al, 1992).

Page 41: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

2.5 ALGORITMOS DE APRENDIZAGEM NÃO SUPERVISIONADA

O aprendizado competitivo

qual os neurônios competem entre si pelo direito de responder ao estímulo de um subconjunto

de dados de entrada; funciona através do aumento da especialização de cada neurônio da rede

em relação a subconjuntos de entradas

ters automaticamente dentro de uma massa de dados

estatisticamente salientes nesses dados

Figura 5: Representação esquemática de uma RNA sob aprendizado competitivo. As setas retas com

pontas cheias partindo da camada de entrada representam as conexões excitatórias entre cada entrada

de x1 a xn, a cada neurônio de 1 até j, ponderadas pesos vetores de peso w

vas de ponta oca representam os efeitos inibitórios entre os neurônios da camada de saída

Tomando como exemplo uma rede neural contendo apenas uma camada de neur

nios, o princípio básico da aprendizagem competitiva é a competição entre neurônios com

objetivo de que um deles saia vencedor (processos não supervisionados), e cujo prêmio será o

ajuste de seus pesos proporcionalmente aos valores da entrada para que aperfeiço

para a próxima competição

neurônio sobre o outro, implicando o quanto um neurônio pode influenciar sobre a resposta de

saída de outro neurônio (CARPENTER;

ALGORITMOS DE APRENDIZAGEM NÃO SUPERVISIONADA

aprendizado competitivo é uma forma de aprendizado não supervisionado na

qual os neurônios competem entre si pelo direito de responder ao estímulo de um subconjunto

de dados de entrada; funciona através do aumento da especialização de cada neurônio da rede

tos de entradas, o que o torna bastante apropriado para encontrar clu

ters automaticamente dentro de uma massa de dados através da descoberta de características

estatisticamente salientes nesses dados (CARPENTER e GROSSBERG, 1987).

esquemática de uma RNA sob aprendizado competitivo. As setas retas com

pontas cheias partindo da camada de entrada representam as conexões excitatórias entre cada entrada

, a cada neurônio de 1 até j, ponderadas pesos vetores de peso w1,1, w

vas de ponta oca representam os efeitos inibitórios entre os neurônios da camada de saída

Fonte: DA SILVA et al., 2010.

Tomando como exemplo uma rede neural contendo apenas uma camada de neur

o princípio básico da aprendizagem competitiva é a competição entre neurônios com

objetivo de que um deles saia vencedor (processos não supervisionados), e cujo prêmio será o

ajuste de seus pesos proporcionalmente aos valores da entrada para que aperfeiço

para a próxima competição (Figura 5). As conexões laterais assumem o efeito inibitório de um

neurônio sobre o outro, implicando o quanto um neurônio pode influenciar sobre a resposta de

(CARPENTER; GROSSBERG, 1987; DA SILVA

20

ALGORITMOS DE APRENDIZAGEM NÃO SUPERVISIONADA

é uma forma de aprendizado não supervisionado na

qual os neurônios competem entre si pelo direito de responder ao estímulo de um subconjunto

de dados de entrada; funciona através do aumento da especialização de cada neurônio da rede

o que o torna bastante apropriado para encontrar clus-

através da descoberta de características

(CARPENTER e GROSSBERG, 1987).

esquemática de uma RNA sob aprendizado competitivo. As setas retas com

pontas cheias partindo da camada de entrada representam as conexões excitatórias entre cada entrada

, w1,2, wn1, n,; as setas cur-

vas de ponta oca representam os efeitos inibitórios entre os neurônios da camada de saída.

Tomando como exemplo uma rede neural contendo apenas uma camada de neurô-

o princípio básico da aprendizagem competitiva é a competição entre neurônios com

objetivo de que um deles saia vencedor (processos não supervisionados), e cujo prêmio será o

ajuste de seus pesos proporcionalmente aos valores da entrada para que aperfeiçoe seu estado

. As conexões laterais assumem o efeito inibitório de um

neurônio sobre o outro, implicando o quanto um neurônio pode influenciar sobre a resposta de

ILVA et al., 2010).

Page 42: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

21

A regra mais usual que se usa para definir o neurônio vencedor é a que determina

a menor distância euclidiana entre o vetor de pesos de cada neurônio e o vetor de entrada, de

um conjunto contendo elementos de n-ésimas amostras {xn} apresentadas na entrada da rede:

aquele neurônio j que obtiver a menor distância frente a amostra x será considerado o vence-

dor, de acordo com a equação 1, onde ��������corresponde à distância euclidiana entre o vetor de

entrada representando a n-ésima {xn} amostra em relação ao vetor de pesos do j-ésimo neurônio {wj};

j corresponde aos neurônios 1, 2, ... j. (COSTA, et al 2011).

�� ��� � �∑ ������ � �� � ����� (1)

Representando graficamente (Figura 6), o vetor de pesos do neurônio é ajustado

de modo a aproxima-lo cada vez mais da amostra apresentada, de acordo com a equação 1,

onde o vetor de pesos do neurônio vencedor é ajustado junto ao valor da taxa de aprendiza-

gem, ῃ, e do número de épocas, n. Comparando as figuras 4 e 5, três neurônios representados

pelos vetores de peso w(1), w(2) e w(3), e competem entre si em relação às entrada x1 e x2, e

todos os vetores de pesos e o vetor de entrada já estão normalizados e encerrados em um cír-

culo de raio unitário (a normalização nesse caso visa aumentar a eficiência do algoritmo). O

vetor w(2) aquele que mais se aproxima do vetor x(n), portanto é o neurônio vencedor. Como

prêmio por sua vitória, seu vetor de peso será ajustado para que se aproxime ainda mais da

amostra, de acordo com a equação 2, cuja representação algorítmica corresponde à equação

3, onde ������� � corresponde ao peso ajustado do neurônio vencedor (ver também Algoritmo 1A que

mostra um sumário do algoritmo competitivo na fase de treinamento):

������� � � ����!"�#"� � $ ��� �� � (2)

������� � % ����!"�#"� � $ ��� � � � (3)

Page 43: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

22

Figura 6: regra de ajuste para o neurônio vencedor, onde ῃ corresponde à taxa de aprendizado e as-

sume-se que todos os valores, tanto dos vetores de pesos como de entradas estão normalizados entre 0

e 1.

Fonte: DA SILVA et al., 2010.

Numa representação mais prática (Figura 7), temos uma distribuição espacial bi-

dimensional de quatro vetores de pesos representando cada um dos quatro neurônios de uma

rede neural competitiva após a convergência do algoritmo competitivo. Neste caso, cada um

dos vetores de peso dos neurônios está posicionado no centro dos quatro aglomerados (clus-

ters) que representam as classes associadas ao problema, e a quantidade de classes está vincu-

lada ao número de neurônios utilizados na estrutura neural.

Como o aprendizado é não supervisionado, a quantidade inicial de neurônios a ser

utilizada para representar as classes com características em comum é, a priori, desconhecida.

Os padrões a serem classificados estão projetados no espaço em que estão definidos os veto-

res de pesos, cuja dimensão é igual àquela na qual as amostras de entradas estão definidas

(CARPENTER; GROSSBERG, 1987; DA SILVA et al., 2010).

Page 44: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

23

Figura 7: Distribuição bidimensional de vetores de peso frente a um conjunto de amostras.

Fonte: DA SILVA et al., 2010.

Algoritmo 1A: sumário de um algoritmo competitivo na fase de treinamento.

&''''''''''('''''''''') *+, -.�/0 1 21��3��1 �/ 451��04 �/ �0/��45/��1 67�8�9; *;, <��2�40 1 =/�10 �/ >/�1� �/ 24�4 �/30ô��1 21����/04��1 1 =4@10 �4� �+ >0�5/�04� 451��04� �/ �0/��45/��1; *A, B1054@�C40 1� =/�10/� �/ 451��04� / �/ >/�1�; *D, E�>/2�F�240 4 �474 �/ 4>0/���C4G/5 HIJ; *K, <��2�40 1 21��4�10 �/ é>124� Hé>124 % MJ; *N, O/>/��0 4� ����03çõ/�:

&''''('''')*N. +, T404 �1�4� 4� 451��04� 67�8�9, F4C/0: *N. +. +, V4@23@40 4� ����â�2�4� E32@���4�4� /��0/ 78 / X���, 21�F105/ 4 /7>0/��ã1 �+�;

*N. +. ;, Z/2@4040 =/�2/�10 1 �/30ô��1 � [3/ �/�\4 4 5/�10 ����â�2�4 E32@���4�4; *N. +. A, ]�3��40 1 =/�10 �/ >/�1� �1 �/30ô��1 =/�2/�10 21�F105/ 4 /7>0/��ã1 �A�; *N. +. D, B1054@�C40 1 =/�10 �/ >/�1� [3/ F1� 4�3��4�1 �4 ����03çã1 >0/2/�/��/; *N. ;, é>124 % é>124 $ +

^

]�é [3/ �ã1 \4�4 53�4�ç4 ��G��F�24��=4 �1� >/�1� _�5 H]@G10��51 V15>/����=1 � _4�/ �/ `0/��45/��1J

^

Fonte: DA SILVA et al., 2010.

Page 45: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

24

Cada vetor de peso dos neurônios estará posicionado no centro de um aglomerado

de dados que têm características em comum, cluster, após o algoritmo competitivo convergir.

Um cluster é um conjunto de objetos (dados) no qual cada objeto está mais próximo (ou é

mais similar) a objetos dentro do cluster do que qualquer outro objeto fora do dele; ou ainda

um cluster é um conjunto de objetos no qual cada objeto está mais próximo ao protótipo que

define o cluster do que dos protótipos de quaisquer outros clusters. O protótipo é aquele dado

que reúne características que melhor representam o conjunto de dados (relevância estatística,

saliência) e corresponde ao centroide, que é o “centro gravitacional” desse cluster (JAIN e

DUBES, 1988;).

Esses clusters representarão suas respectivas classes e sua quantidade representada

dependerá do número de neurônios na rede neural. Essa característica representa a base de

algumas limitações encontradas no aprendizado não supervisionado: o número de clusters na

análise de um conjunto de dados pode variar conforme a resolução exigida, seja “grosseira”

ou mais “fina” (DA SILVA et al., 2010; JAIN; DUBES, 1988; JAIN et al. 1999). Exemplifi-

cando, consideremos que certos dados de entrada são representados, após clusterização, por

corpos esferoides (Figura 8). Numa primeira análise, perguntar-se-ia “quantos clusters podem

ser identificados na figura 8A?”

Figura 8: Esquema bidimensional para análise de clusters, mostrando que o número de clusters pode variar de acordo com o critério empregado.

Fonte: DA SILVA et al., 2010.

Num nível mais alto, global, de similaridade pode-se identificar quatro clusters

formados (Figura 8B); porém num nível local ou nível menor de similaridade, pode-se identi-

ficar 12 clusters (Figura 8C). Portanto o ponto crucial numa análise de clusters é estabelecer

qual o nível de proximidade (similaridade), como deve-se medi-lo, e se essa noção de simi-

laridade depende do tipo de problema que se está analisando. Essa definição, portanto, exige a

Page 46: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

25

análise por um especialista no problema, de modo a esclarecer com máxima acurácia em que

grupos devem ser alocados determinados dados, com ou sem a aplicação de estratégias esta-

tísticas (JAIN; DUBES, 1988).

Resolvida a questão da determinação do número de clusters representativos das

amostras, num estudo de classificação de amostras, após a convergência da rede, quando uma

nova amostra for apresentada à entrada da RNA a sua classificação segue os passos determi-

nados pela fase operacional do algoritmo (Algoritmo 1B); basta então analisar pelo meio mais

adequado qual o neurônio vencedor para estabelecer à qual classe essa amostra pertence.

Algoritmo 1B: sumário de um algoritmo competitivo na fase operacional.

&''''''('''''') *1, bcde�ef�gd g ghi��dg H�J g �ed jkg��ljgg; *2, nidhgkogd i pe�id H�J jidde�cifef�e à ghi��dg; *3, b��shd i� pe�ide� e ce�i� 6� 9 tá gts��gi� sdgf�e g lg�e e �defghef�i; *4, w�ejs�e g� �exsf�e� f�dsçõe�: *4.1, ygkjskgd g� ��âfjg� wsjkgfg� ef�de � e � jiflidhe g e�cde��ãi 1; *4.2, zejkgdgd jihi pefjeid i fesdôfi t {se jif�ef|g g hefid ��âfjg wsjkgfg; *4.3, b��ijgd g ghi��dg à{sekg jkg��e {se e��á �efi decde�ef�gg céki fesdôfi pefjeid; *5, z�cif~kogd g jkg��e eh {se g ghi��dg li g��ijgg. �h Hbkxid�hi yihce��pi � �g�e e �cedgçãiJ

Fonte: DA SILVA et al., 2010.

Vários algoritmos baseados em aprendizagem não supervisionada têm sido desen-

volvidos ao longo das últimas três décadas para a análise e identificação de clusters numa

massa de dados. Estes incluem os algoritmos winner take all (WTA, “o vencedor leva tudo”),

Frequency-sensitive Competitive Learning (FSCL, aprendizado por frequência sensitiva

competitiva), Rival-penalize Competitive Learning (RPCL, aprendizado competitivo por

penalização de rival), Self-Organizing Map (SOM, mapa auto-organizável ou mapa de Ko-

honen) e Neural Gas, NG (AGGARWAL, 2012; BALAKIN et al, 2006; BUDURA et al,

2006; COSTA et al, 2011; DA SILVA et al., 2010; MAASS, 2000; MALONE, et al, 2006).

Page 47: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

26

2.5.1 WINNER-TAKE-ALL (WTA)

WTA é um princípio computacional pelo qual os neurônios competem entre si pe-

la ativação na camada de saída através da inibição mútua enquanto, simultaneamente, ativam

a si próprios através de conexões reflexivas (Figura 9). Após algum tempo, somente o neurô-

nio com maior estado de ativação permanecerá ativo, aquele de entrada mais forte, enquanto

todos os outros serão desativados; portanto a rede usa inibição não linear para selecionar o

maior conjunto de entradas (CARPENTER; GROSSBERG, 1987; MAASS, 2000; OSTER et

al. 2009).

Noutras palavras, no aprendizado competitivo quando cada padrão de entrada é

apresentado à rede, o neurônio vencedor (Best Matching Neuron, BMU) é ativado na camada

de saída e seu peso modificado, enquanto os demais neurônio perdedores permanecem inati-

vos. Este é o princípio do aprendizado competitivo simples, ou clássico, aqui tratado "o ven-

cedor leva tudo", WTA (HAYKIN, 2001; MA; CAO, 2006; RUMELHART e ZIPSER, 1986).

Figura 9: Simplificação esquemática da conectividade inibitória em redes WTA A) com um neurônio

inibitório global (em preto); B) com conexões inibitórias diretas entre os neurônios representadas

pelas linhas cinza

Fonte: AGGARWAL, 2012.

As redes WTA são inspiradas nos processos de decisão tipo “tudo ou nada” típico

dos neurônios corticais, portanto essa especificidade também é obedecida numa rede WTA

típica, onde a inibição entre neurônios excitatórios é mediada por populações de neurônios

inibitórios. Para ajustar a quantidade de inibição entre neurônios, e portanto a força da compe-

tição, ambos os tipos de conexão podem ser modificadas (MAASS, 2000; OSTER, et al.

2009).

Page 48: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

27

2.5.2 FREQUENCY SENSITIVE COMPETITIVE LEARNING (FSCL)

Além de ser incapaz de selecionar automaticamente o número ótimo de clusters,

requerendo que o usuário determine qual o número de clusters antes de inicializar o algoritmo,

outra grande desvantagem das redes neurais competitivas clássicas, como K-means e WTA, é

a subutilização de neurônios, chamada de o problema das “unidades mortas” ou também

problema do “vetor preso”. Uma unidade morta é definida como um neurônio (ou nó, ou

nodo) que nunca encontra um vetor de entrada próximo a ele. Isso decorre principalmente do

fato de que os centros são inicializados de forma imprópria e, portanto, existe um centro wc

que não representa nenhum vetor de entrada, que por decorrência assume o status de unidade

morta (NAIR, et al., 2003).

Para contornar essa desvantagem foi criado o algoritmo FSCL. O FSCL deriva do

K-means, porém com a adição do chamado fator de consciência, que remove o problema das

unidades mortas, mas retém as vantagens computacionais do algoritmo de origem. Para isso o

FSCL leva em conta com qual frequência cada unidade neural sai vencedora de uma competi-

ção e essa informação é levada em conta para assegurar que durante o processo de treinamen-

to todas as unidades neurais sejam modificadas um número aproximadamente igual de vezes

(AGGARWAL, et al., 2012; AHALT, et al., 1990; AHALT; FOWLER, 1993; CARD; KA-

MASU, 1998; GALANOPOULOS et al. 1998; NAIR, et al., 2003).

O fator de consciência”, também chamado de frequência relativa de vitórias é um

parâmetro que atua diminuindo a taxa de vitórias do neurônio que está vencendo com maior

frequência, dando oportunidade aos neurônios não vencedores, para que no processo de trei-

namento todos os neurônios tenham chance de ser atualizados. O mecanismo de consciência

escala multiplicativamente a distorção (distância do neurônio, ou vetor codebook, para o dado

de entrada), multiplicando esta pelo número de vezes que o exemplar venceu no passado, num

processo “punitivo”, de modo a desencorajar os neurônios vencedores a atrair novas entradas

(BANERJEE; GHOSH, 2004; BUDURA, 2006; DE SIENO et al., 1998).

Page 49: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

28

2.5.3 RIVAL-PENALIZE COMPETITIVE LEARNING (RPCL)

Embora o FSCL funcione bem formando clusters com sucesso sem as unidades

mortas, ele ainda apresenta o mesmo problema do K-means – é necessário saber exatamente o

número de clusters, ou seja, sua performance diminui rapidamente se k não for bem especifi-

cado (AGGARWAL, et al., 2012). Xu et al propuseram uma estratégia de determinação au-

tomática do número de nós (nodos) baseada na determinação do número de nós como função

do grau de similaridade entre eles. A essa estratégia dá-se o nome RPCL, que é uma modifi-

cação do RPCL que contorna o problema encontrado no referido algoritmo (XU et al, 1993;

NAIR et al 2003). Uma das maiores vantagens do RPCL é a capacidade de determinar auto-

maticamente o número de nodos no espaço de entrada necessários à melhor representação dos

clusters, ao determinar o número de nodos como uma função do grau de similaridade entre

esses neurônios (NAIR et al 2003; AGGARWAL, et al., 2012).

Page 50: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

29

2.5.4 SELF ORGANIZING MAP (SOM)

O algoritmo SOM proposto por Teuvo Kohonem é uma das mais bem sucedidas

estratégias de classificação baseada em aprendizado competitivo (KOHONEN, 1982). Entre-

tanto, diferentemente das estratégias puramente competitivas como WTA, FSCL e RPCL, o

SOM segue o princípio competitivo-cooperativo, segundo o qual neurônios vizinhos compe-

tem entre si através de interações laterais mútuas e o neurônio BMU determina a localização

espacial de uma vizinhança topológica de neurônios excitados que ajustam seus pesos sinápti-

cos proporcionalmente ao neurônio vencedor (KOHONEN, 1982; RITTER e KOHONEN,

1989; RUMELHART; ZIPSER, 1986).

Numa rede SOM os neurônios são arranjados em estruturas de uma dimensão (ar-

ray) ou mais frequentemente em duas dimensões (grid ou grade). Cada neurônio numa grade

está associado a um peso que tem a mesma dimensão do vetor de entrada {x}, e que será a-

presentado à toda a grade. Cabe à rede SOM aprender esses modelos para poder mapear da

forma mais fiel possível num espaço de saída unidimensional (1D) ou bidimensional (2D), os

dados multidimensionais e complexos apresentados no espaço de entrada, alocando aqueles

similares em espaços fisicamente próximos no mapa, como é esquematicamente mostrado na

Figura 10 (AGRAWAL, et al, 2012; HAYKIN, 2001; KOHONEN, 1982; KOHONEN, 1990;

RUMELHART; ZIPSER, 1986; RITTER; KOHONEN, 1989; RAUBER, 2002; XU et al,

1993).

Figura 10: mapa topológico (SOM) bidimensional mostrando o neurônio vencedor (BMU) e influên-

cia cooperativa sobre suas vizinhanças.

Fonte: ULTSCH, 1996.

Page 51: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

30

No treinamento de uma rede SOM na fase de competição, a distância Euclidiana

de um vetor de entrada para cada peso dos neurônios é calculada a cada iteração e o neurônio

com a menor distância entre o seu peso e o vetor de entrada será declarado vencedor. Na fase

cooperativa o BMU determinará a posição dos neurônios vizinhos que estiverem excitados,

aproximando-os de segundo raio de abrangência, R (Figura 11). Considerando o neurônio 25

como BMU e assumindo R=1, o conjunto de vizinhança seria {18, 24, 26, 32}. Se R=1,75, o

conjunto vizinhança incluirá mais 4 neurônios, passado a ser {17, 18, 19, 24, 26, 31, 32, 33}.

Uma função gaussiana então atualiza os pesos dos neurônios que foram aproximados ao BMU

proporcionando uma taxa de decaimento, que se intensifica para os neurônios mais afastados

do BMU, mas que devem ser contemplados desde pertençam ao conjunto vizinhança. Neste

caso, assumindo R=1,75, os ajustes dos vetores de peso dos neurônios 18, 24, 26 e 32 seriam

maiores do que os ajustes dos pesos dos neurônios 17, 19, 31, e 33, que estão mais afastados

do BMU. (ARCOVERDE et al, 2011; DA SILVA et al., 2010; HAYKIN, 2001).

Figura 11: Grade de neurônios bidimensional 7X7 (7 linhas por 7 colunas de neurônios) mostrando o

BMU (neurônio 25) e seu raio de abrangência (R) - neurônios em tons de cinza que representam a

influência cooperativa sobre as vizinhanças.

Fonte: adaptado de DA SILVA et al., 2010 e ULTSCH, 1996.

O processo de treinamento pode ser dividido em duas fases: uma primeira, de or-

denação, e uma segunda, de convergência. Na fase de ordenação, são utilizados raios de in-

fluência e taxas de aprendizagem maiores, e na convergência, estes valores são reduzidos. Os

detalhes das instruções estão sumarizadas no algoritmo 2, mas deve-se relembrar que nos ma-

pas auto-organizáveis as saídas são desconhecidas, portanto cabe enfatizar que pode ser ne-

cessário o uso de ferramentas estatísticas e do conhecimento de especialistas nas etapas <9> e

<10>.

Page 52: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

31

Algoritmo 2: sumário do algoritmo SOM, fase de treinamento.

&''''''''''''''('''''''''''''')*1, zelfd i hgcg �icikóxji g dee; *2, �if�gd i� jiftsf�i� e pof|gfçg6Ω 9; *3, �fjgd i� pe�ide� e ce�i e jgg fesdôfi 6� 9, jif�edgfii� pgkide� g� f� cdhedg� ghi��dg� e �defghef�i; *4, �~�ed i jiftsf�i e ghi��dg� e �defghef�i H��J; *5, nidhgkogd i� pe�ide� g� ghi��dg� e i� ce�i�; *6, e�cejljgd g �g�g e gcdefogi *7, �fjgd i jif�gid e fúhedi e écijg� Hécijg % 0J; *8, �ece�d g� f��dsçõe�:

&'''''''(''''''')*8.1, �gdg �ig� g� ghi��dg� e �defghef�i H��J, lgoed:

&''''''('''''')*8.1.1, ygkjskgd g� ��âfjg� wsjkgfg� ef�de �� e � jiflidhe g e�cde��ãi �1�; *8.1.2, zejkgdgd jihi pefjeid i fesdôfi {se jif�ef|g g hefid ��âfjg wsjkgfg: pefjeid � argmin 6��� � � �9 ; *8.1.3, bts��gd i pe�id e ce�i� i pefjeid, jiflidhe g dexdg: �� � % �� � $ � ��� � � �; *8.1.4, bts��gd i pe�id e ce�i� i� fesdôfi� pof|i� gi pefjeid, elfi� eh Ω� �, jiflidhe

g dexdg: ���� % ���� $ �2 ����� � �����; *8.1.5, nidhgkogd i pe�id e ce�i� {se li gts��gi fg f��dsçãi gf�edid

^

*8.2, écijg % écijg $ 1

^

g�é {se fãi |gtg hsgfçg �xfljg�pg fi� pe�ide� e ce�i�;*9, bfgk�gd i hgcg p�gfi g e��dgçãi e jgdgj�edí��jg�; *10, �ef�ljgd g� dexõe� {se ci��~k�eh g elfçãi e jkg��e�.�h Hbkxid�hi e �i|ifef � �g�e e �defghef�iJ

Fonte: DA SILVA et al., 2010.

Uma vez que a rede tenha sido treinada é gerado um mapa topológico representa-

tivo do espaço de dados, chamado mapa de contexto, que deve estar particionado em regiões

que definem as classes (clusters) a que pertencem esses dados (Figura 12). O mapa de contex-

to é gerado a partir das análises efetuadas após a fase de treinamento e é uma ferramenta faci-

litadora para a análise do fenômeno em foco.

Page 53: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

32

Figura 12: representação esquemática de um mapa de contexto SOM para topologia bidimensional

com formação de três classes: Classe A, vermelho; Classe B, azul; Classe C, verde.

Fonte: Autoria própria.

Dentre as heurísticas adotadas para geração de mapas de contexto, uma das mais

importantes é a matriz de distâncias unificada, matriz-U, que permite analisar visualmente

a existência de possíveis agrupamentos. Numa matriz-U bidimensional (Figura 13) os neu-

rônios geralmente são representados como estruturas hexagonais e as distâncias Euclidianas

entre vetores de neurônios são mostradas em imagens em escala cinza ou, eventualmente,

coloridas, de acordo com a distância entre cada neurônio vizinho: quanto mais escuro, maior a

distância entre nodos, e vice-versa (ULTSCH, 2004; THOMASSEI e HAPPIETTE, 2007;

ARCOVERDE et al, 2011).

Figura 13: representação de uma matriz-U bidimensional: (A) rede SOM; (B) Matriz-U. A barra de

intensidade de cinza indica o nível de proximidade entre os neurônios

Fonte: THOMASSEI e HAPPIETTE, 2007.

Page 54: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

33

Numa matriz-U tridimensional a distância entre neurônios é mostrada grafica-

mente com valores de altura que formam estruturas como picos tridimensionais, criando uma

paisagem 3D no gráfico (Figura 14). A altura é calculada através da soma das distâncias de

todas a vizinhança imediata normalizada pela maior altura encontrada. O valor, portanto, será

mais alto onde há poucos ou nenhum dados, de modo que são formadas "cadeias de monta-

nhas" como fronteiras de clusters. Do outro lado, a soma será baixa em áreas de alta densida-

de de dados, de modo que os clusters são mostrados como "vales" na paisagem (ULTSCH,

2004; THOMASSEI e HAPPIETTE, 2007).

Figura 14: representação de uma matriz-U tridimensional: os vales de cor azul-escuro em (A), (B) e

(C) correspondem a três agrupamentos de dados (clusters). A cadeia de montanhas que separa esses

vales são as fronteiras desses clusters; quanto mais as cores tendem para amarelo/vermelho nessa regi-

ão, menor a densidade de dados nos neurônios correspondentes.

Fonte: Imagem disponível em <http://lester.solbakken.name/>, acessada em 19/12/2013.

Outra forma interessante e bastante útil de mapa de contexto para descoberta

de conhecimento em massas de dados são os chamados planos de componentes, que

permitem visualizar as correlações entre os diversos atributos (variáveis) de entrada de

um mapa de Kohonen (Figura 15). É possível gerar um plano de componente para cada

atributo de entrada, e esse plano de componentes é uma representação gráfica codificada

por cores dos valores de cada variável de vetor de peso, onde os neurônios com cores

similares representam características similares (ARCOVERDE et al, 2011).

Page 55: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

34

Figura 15: representação de um gráfico de planos de componentes. A caixa verde destaca a matriz-U

do som. Os demais gráficos são os planos de componentes, que representam cada um dos atributos

usados para gerar o SOM.

Fonte: adaptado de ARCOVERDE et al, 2011.

Algoritmo 3: sumário do algoritmo SOM, fase operacional.

&''''''('''''')*1, bcde�ef�gd g ghi��dg H�J g �ed jkg��ljgg e fidhgkogd; *2, b��shd i� pe�ide� e ce�i6� 9 tá gts��gi� sdgf�e g lg�e e �defghef�i;*3, w�ejs�gd g� �exsf�e� f��dsçõe�:

&'''(''')*3.1, ygkjskgd g� ��âfjg� wsjkgfg� ef�de � e � jiflidhe g e�cde��ãi �1�; *3.2, zejkgdgd jihi pefjeid i fesdôfi t {se jif�ef|g g hefid ��âfjgwsjkgfg; *3.3, �ijgkogd i fesdôfi pefjeid ef�di i hgcg gs�i idxgfoápek; *3.4, b��ijgd g hi��dg à jkg��e {se li ef�ljgg g cgd�d g jiflejçãi i hgcg e jif�e��i;

^

*4, z�cif~kogd g epef�sgk jkg��e eh {se g ghi��dg li g��ijgg. ��� H ¡¢£¤�¥�£ ¦§ ¨£©£ª§ª � �«¬§ ¦§ ­®§¤«çã£J

Fonte: DA SILVA et al., 2010.

Page 56: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

35

Portanto, depois que uma rede SOM é treinada, quando é apresentada à ela uma

nova amostra como dado de entrada a ser classificada, basta que se determine qual foi o neu-

rônio vencedor na competição, e com a ajuda do mapa de contexto (matriz-U e/ou planos de

componentes, por exemplo) identificar qual a classe esse neurônio representa e classificar a

nova amostra como pertencente à classe do neurônio vencedor, seguindo as instruções conti-

das nos passos algorítmicos para a fase operacional (Algoritmo 3).

Page 57: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

36

2.5.5 NEURAL GAS (NG)

A performance de uma rede SOM na classificação e principalmente na quantiza-

ção de vetores depende de um conhecimento apriorístico sobre a estrutura topológica do es-

paço topológico de entrada (Manifold, M), que nem sempre está disponível ou pode ser difí-

cil de ser obtido se a estrutura topológica de M for muito heterogênea (por exemplo, quando

M é composto por subconjuntos de diferentes dimensões ou disjunções, e altamente fratura-

dos). A rede Neural Gas é uma RNA que foi desenvolvida inspirada no SOM, mas capaz de

contornar as limitações associadas à sua rigidez: uma rede capaz de quantizar M heterogene-

amente estruturados do ponto de vista topológico e aprender as relações entre sinais de entra-

da sem a necessidade de uma pré especificação topologia da rede (MARTINETZ e SCHUL-

TEN, 1991).

Numa rede NG, os pesos sinápticos wj são ajustados independentemente de qual-

quer arranjo topológico dos neurônios na rede. Estes ajustes são afetados, na verdade, pelo

arranjo topológico dos campos receptivos dentro do espaço de entrada; noutras palavras, as

variações nos pesos sinápticos ∆wj, não são determinadas pelo arranjo dos neurônios dentro

de um retículo pré estruturado, mas pelas distâncias relativas entre as unidades neurais dentro

do espaço de entrada. Portanto a mudança mais importante feita na rede NG em relação à rede

SOM é na regra de adaptação: ao invés da regra "o vencedor leva tudo", adotada pelo SOM,

a regra de ajuste da rede NG é "o vencedor leva mais" (winner-take-most, WTM). A regra

WTM consiste em fornecer as informações sobre o campo receptivo como um conjunto de

distorções Dx, associado a cada sinal de entrada x (Equação 4). A cada vez que um sinal x é

apresentado, é o ordenamento do conjunto Dx em relação a x que determina o ajuste dos pesos

sinápticos. Os campos receptivos Mi e Mj de neurônios adjacentes i e j em M desenvolvem

conexões representadas pela matriz Cij normalizadas entre zero e 1. Ao final do aprendizado,

é a conectividade da matriz que representa a similaridade (relação de vizinhança) entre os

dados de entrada (MARTINETZ e SCHULTEN, 1991).

z¯ � 6�p � � �, t � 1, . . . , n9 (4)

O algoritmo 4 sumariza as instruções de uma Neural Gas. Infere-se que cada uni-

dade neural tem que descobrir apenas o quanto e não quais unidade neurais estão mais pro-

ximamente ajustadas ao sinal de entrada.

Page 58: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

37

Algoritmo 4: sumário do algoritmo NG.

&'''''(''''')*1, b�d~sd sh pgkid fjgk gi� ce�i� � ° ��e jikijgd �ii� i� y� eh oedi; *2, ±ekejifgd sh pe�id e ef�dgg p i e�cgçi e ef�dgg �; *3, w�ejs�gd shg e�gcg e ggc�gçãi cgdg i� ce�i� e gjidi jih:

���# # � �� !�²# $ ³. e´µ¶·¸¹º¶ »¼½¾ , � 1,… ,n;*4, ±e y�À�� � 0, jikijgd y�À�� � 1 e ��À�� � 0. ±e y�À�� � 1 jikijgd ��À�� � 0; *5, bshef�gd g ge e �ig� g� jife�õe� e À jikijgfi ��À � ��À $ 1, cgdg �ii t jih y�À � 1; *6, �ehiped �ig� g� jife�õe� À{se e�jegh �es �ehci e pg, jikijgfi y�À � 0 cgdg �ii t jih y�À � 1 e ��À Á �. yif�fsgd jih 1.

Fonte: DA SILVA et al., 2010.

Page 59: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

38

2.6 APLICAÇÕES FARMACÊUTICAS DAS RNAs.

As RNAs são ferramentas poderosas na simulação de relações não lineares e de

alta complexidade entre dados, e suas aplicações relacionam-se com sua capacidade de classi-

ficação e reconhecimento de padrões, a capacidade de predição e modelagem. Assim, as redes

supervisionadas se apresentam como alternativas a técnicas estatísticas de modelagem como

metodologia de superfície de resposta (response surface methodology, RSM), e as redes não

supervisionadas em substituição a técnicas quimiométricas como análise de componentes

principais (principal component analysis, PCA). Em função dessas propriedades as RNAs

vêm sendo utilizadas com resultados excelentes em áreas diversas e de grande importância em

farmácia, desde o campo das análises clínicas e farmacológicas, interpretação de dados analí-

ticos e no design de formas farmacêuticas (WESOLOWSKI e SUCHACZ, 2012).

A predição de propriedades físico-químicas de compostos orgânicos de interesse

farmacêutico pode ser feita de forma eficiente através do emprego de RNAs. A maioria das

propriedades físico-químicas pode ser prevista utilizando as estruturas moleculares como des-

critores, desde que utilizando redes com arquiteturas apropriadas, o que suscita a necessidade

de desenvolvimento critérios de Boas Práticas para validação dos modelos (TASKINEN e

YLIRUUSI, 2003).

As redes neurais vêm sendo pesquisadas em modelagem de órgãos e tecidos e,

principalmente, no diagnóstico de doenças a partir de exames baseados em análises de varre-

dura, tais como eletrocardiogramas (ECGs), tomografias e ultrassonografias. Tomando o di-

agnóstico e prognóstico de doenças cardiovasculares, as RNAs baseadas em função de base

radial (RBF) têm sido usadas para melhorar o monitoramento da atividade atrial em ECGs de

superfície, e para o desenvolvimento de sistemas especialistas baseados em diagnósticos co-

mo ferramentas importantes na personalização do acompanhamento e recomendações aos

pacientes cardíacos (MATEO e RIETA, 2013; YASNITSKY et al. 2013).

A busca por novas moléculas com potencial uso farmacêutico, o delineamento e

controle de processos farmacêuticos, e a determinação de propriedades físico-químicas de

novas moléculas são campos em expansão na área farmacêutica para as RNAs. A otimização

de microemulsões através de redes neurais supervisionadas híbridas pode ser obtida com mais

de 80% de precisão na previsão de dados e os fatores interferentes sobre índice de polidisper-

Page 60: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

39

são na obtenção de nanosuspensões farmacêuticas foram cessados com sucesso através de

RNAs (AGATONOVIC-KUSTRIN et al., 2012; AGHAJANI et al. 2012).

As RNAs promoveram um salto de qualidade no estudo de relação estrutura-

atividade quantitativa (quantitative structure activity relationship, QSAR) para a descoberta

de novos fármacos. Estudos sobre a influência de grupos substituintes em flavonoides sobre a

inibição da aldose redutase (AR) e sobre a eliminação de radicais livres, os principais agentes

deletérios na diabetes mellitus, conduziram a 10 possíveis compostos com potente atividade

sobre AR e eliminação de radicais livres. A atividade antitumoral de etinilnitrosouréias atra-

vés de modelos baseados em estudos de QSAR demonstrou que as RNAs podem ser ferra-

mentas poderosas no0 desenvolvimento de fármacos com propriedades antitumorais (JIGNE-

SHKUMAR, 2013; MANALLACK e LIVINGSTONE, 1999; PATRA e CHUA, 2010; QUIN

et al., 2011).

A otimização de formulações contendo ingredientes ativos quimicamente incom-

patíveis pode ser feita de forma eficiente com a utilização de RNAs. Tomando como exemplo

o desenvolvimento de comprimidos contendo aspirina e ranitidina, as redes neurais identifica-

ram os parâmetros críticos do processo e estabeleceram as relações quantitativas com as res-

postas (saídas, outputs) mais relevantes - rendimento, ângulo de repouso e degradação da as-

pirina - estabelecendo as condições de otimização na obtenção dos grânulos. As performances

das RNAs comparadas com a RSM na modelagem e capacidade de predição demonstram uma

clara superioridade das redes neurais quanto mais a relação entre os dados se torna complexa

e não linear, como as relações entre as concentrações dos excipientes e as propriedades de

ejeção do comprimido (BOURQUIN et al., 1998; WANG et al., 2003) .

A versatilidade das RNAs suscita o desenvolvimento de uma metodologia univer-

sal de RNAs para a construção de sistemas de apoio à decisão projetados para o desenvolvi-

mento de várias formas farmacêuticas. Duas formas farmacêuticas diferentes (dispersões sóli-

das e microemulsões, DS e ME) foram modeladas utilizando os mesmos ambientes e a mesma

metodologia (software e hardware). A modelagem foi bem sucedida tanto para as DS como

para as ME, o que implica que tanto formas farmacêuticas sólidas como líquidas, de composi-

ção totalmente diferentes, e obtidas com o uso de tecnologias completamente diferentes, po-

dem ser modeladas com sucesso pela utilização das mesmas ferramentas e metodologias, su-

gerindo ser flexíveis o suficiente para cobrir ampla variedade de formas farmacêuticas

(MENDIK e YACHOWICK, 2007).

Page 61: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

40

RNAs com finalidade preditiva e como ferramentas de mineração de dados podem

ser utilizadas para identificação de variáveis críticas de processo na otimização de obtenção

de pellets. Nesse caso, as variáveis dependentes de fatores da formulação e variáveis depen-

dentes dos ingredientes ativos e a relevância relativa dessas variáveis podem ser identificadas,

e a redução drástica no número de dados de relevância e o estabelecimento de relações quanti-

tativas entre os inputs selecionados resultam no estabelecimento do conjunto de regras capa-

zes de estabelecer de forma simples as relações quantitativas entre os diversos fatores envol-

vidos no processo de peletização (MENDYK et al. 2010).

Estudos de melhoria da solubilidade de fármacos pouco solúveis através do em-

prego de polímeros em dispersões sólidas e misturas físicas podem gerar modelos preditivos

bastante úteis. Utilizando o cetoprofeno como fármaco modelo, as RNAs estabeleceram rela-

ções precisas entre características físico-químicas dos carreadores e o perfil de dissolução do

fármaco, de modo que a extrapolação da aplicabilidade do modelo para outros carreadores

pode ser considerada segura (MENDYK e JACHOWICZ, 2007).

RNAs e redes neurais baseadas em lógica neurofuzzy (NL) podem ser utilizadas

com eficiência na geração de modelos para comprimidos de liberação imediata. Comparando

a performance dos dois modelos em relação à propriedade de previsão e a de geração de mo-

delos de fácil compreensão, ambas as ferramentas foram comparáveis quanto à predição da

resistência mecânica e do perfil de dissolução dos comprimidos, mas com uma ligeira superi-

oridade das redes NL quanto à geração de conjuntos de regras representativas das relações de

causa e efeito entre os parâmetros, enquanto as RNAs foram ligeiramente superiores na capa-

cidade preditiva (SHAO et al., 2006).

O estudo do emprego de RNAs no desenvolvimento de formas farmacêuticas de

liberação controlada/modificada é um campo efervescente sumarizado em da aplicação de

redes neurais nessa área pode ser encontrado (SUN et al., 2003; TAKAYAMA et al., 2003;

VIATHIYALINGAM e KHAN, 2002). O desenvolvimento de comprimidos de liberação con-

trolada de teofilina através de modelagem por RNAs dos parâmetros quantidade de excipien-

te, força de compressão e perfil de liberação demonstraram uma boa correlação entre os valo-

res de perfil de liberação observados experimentalmente e os preditos pelas redes, correlação

bem superior à estabelecida através de regressão polinomial (TAKAYAMA et al., 2000).

Page 62: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

41

O estado da arte da tecnologia farmacêutica de pós, no sentido de seu mais alto es-

tágio de desenvolvimento, atualmente já está diretamente relacionado com o emprego de re-

des neurais artificiais. Da seleção de fornecedores, classificação de pós, à criação de sistemas

especializados para o desenvolvimento de formulações sólidas, o uso de RNAs é atualmente

um dos fatores mais relevantes a ser levado em conta para atingir um topo da pirâmide de

conhecimentos na área de tecnologia farmacêutica de sistemas pulverulentos (LEUENBER-

GER e LANZ, 2005).

Page 63: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

42

2.7 PROPRIEDADES REOLÓGICAS DE EXCIPIENTES SÓLIDOS

As propriedades micromeríticas das partículas que compõem os ingredientes ati-

vos e os excipientes de uma forma farmacêutica sólida (comprimidos e cápsulas duras de ge-

latina) são determinantes para o sucesso de sua fabricação. O tamanho e a área das partículas

são propriedades micromeríticas fundamentais e delas provêm as propriedades micromeríticas

derivadas: a porosidade, as propriedades de volume e as propriedades de fluxo (MARTIN,

1993).

As propriedades de fluxo de uma forma farmacêutica sólida são governadas pri-

mordialmente por seus componentes majoritários. Quando o fármaco está presente em altas

dosagens, é ele quem mais influencia na compactação; quando a dosagem do fármaco é baixa,

é o diluente que prepondera sobre as propriedades de compactação, e a presença de outros

excipientes também influi sobre essas propriedades (DAVIES, 2004).

Tabela 2: Alguns dos excipientes mais comuns na preparação de formas farmacêuticas sólidos e suas

principais funções farmacotécnicas.

FUNÇÃO EXCIPIENTE CONCENTRAÇÃO / %

DILUENTE LACTOSE

CELULOSE MICROCRISTALINA

AMIDO E DERIVADOS

*

*

*

LUBRIFICANTE

ESTEARATO DE MAGNÉSIO

ESTEARATO DE CÁLCIO

0,25 – 2,0

0,5 – 4,0

ANTIADERENTE ESTEARATO DE MAGNÉSIO

CELULOSE MICROCRISTALINA

TALCO

0,2 – 2,0

5,0 – 20,0

1,0 – 5,0

DESLIZANTES TALCO

AEROSIL

AMIDO

1,0 – 5,0

0,1 – 0,5

1,0 – 10,0

DESAGREGANTE AMIDO

CELULOSE MICROCRISTALINA

CARBOXIMETILCELULOSE Ca++

5,0 – 10,0

5,0 – 20,0

1,0 – 15,0

Fonte: PHARMACEUTICAL MANUFACTURING HANDBOOK, 2008; HANDBOOK OF

PHARMACEUTICAL EXCIPIENTS, 2009.

A boa fluidez dos pós que compõem uma forma farmacêutica sólida é fundamen-

tal para a manufatura de comprimidos ou capsulas. Essa fluidez depende de vários fatores,

Page 64: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

43

entre eles a pureza, a cristalinidade, as forças eletrostáticas interparticulares, a densidade, o

tamanho e o formato das partículas, a presença de umidade, as dimensões do compartimento

receptor (câmara de compactação ou cápsula dura) e as interações entre as partículas e a su-

perfície interna desses compartimentos. É necessário destacar que o fluxo desses pós asseme-

lha-se aos líquidos não Newtonianos, onde as forças atrativas interparticulares faz com que

um pó a granel apresente um fluxo plástico ou dilatante (DAVIES, 2004; LEE, 2008).

Existem vários métodos para avaliar a fluidez de pós, mas independente do méto-

do, os parâmetros mais comuns usados nessa avaliação são o fator de Hausner, FH, e Índice

de Carr, IC, também conhecido como índice de compressibilidade. Ambos expressam as pro-

priedades de fluxo em termos de densidade aparente desses pós, e um aumento nessa densida-

de está relacionado com sua propriedade de compactação. A densidade de compactação, por

seu turno, é a densidade aparente máxima que pode ser atingida sem a deformação das partí-

culas; na prática é a menor densidade obtida após submeter a amostra a batidas padronizadas

(DAVIES, 2004).

O fator de Hausner e o índice de Carr são calculados de acordo com relações sim-

ples e de fácil obtenção experimental (Equações 5 e 6, onde DB é a densidade bruta e DC é a

densidade após compactação). Em termos numéricos, os valores de IC, bem como de FH, são

apenas indicativos (Tabela 3), porém fornecem informações relevantes sobre as propriedades

de fluxo de um determinado pó, seja excipiente ou PA (LEE, 2008).

� � ÃÄÃÅ (5)

�y% � �ÀÀÇ�ÃÄ´ÃÅ�ÃÅ (6)

No caso do índice de Carr (Tabela 3), os valores podem ser mais ou menos

representados de forma absoluta conforme estabelecido na tabela, mas de modo geral

admite-se que valores de IC abaixo de 15 podem ser indicativos de um excelente fluxo

ou, por outro lado, valores ultrapassando 20 podem indicar uma fluidez muito ruim. Já

os limites para FH não são tão bem delimitados quanto IC, porém assume-se que valo-

res de FH em torno de 1,2 indicam um fluxo excelente, enquanto aqueles acima de 1,6

estão relacionados a pós coesivos (THE PARMACEUTICAL CODEX, 1994; LEE,

2008).

Page 65: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

44

Tabela 3: Limites indicativos de fluidez baseados no Índice de Carr).

ÍNDICE DE CARR FLUIDEZ

5 – 11 Excelente

12 – 17 Bom

18 – 22 Satisfatório

23 – 32 Pobre

33 – 39 Muito pobre

> 40 Extremamente pobre

Fonte: LEE, 2008; USP 31, 2008.

Outro método comum e de simples aplicação para medir a fluidez de pós é a

determinação do Ângulo de Repouso (α), que corresponde ao ângulo de um cone for-

mado por um pequeno monte de pó e a superfície horizontal no qual se encontra. O ân-

gulo de repouso corresponde ao ponto em que a coesividade de um pó excede a força

que tende a causar sua avalanche. Assim, um pó com ótima fluidez forma cones achata-

dos, portanto com valor de α baixos; ao contrário, quanto mais agudo o ângulo formado,

ou seja, mais alto o valor de α, maior a coesividade e pior a fluidez desse pó. Há certa

imprecisão nos limites estabelecidos para α, mas assume-se que valores inferiores a

30° geralmente indicam bom fluxo, enquanto valores superiores a 40° relacionam-se a

pós que têm problemas de fluxo (DAVIES, 2004; LEE, 2008).

Cabe ao formulador, portanto, através de ensaios apropriados, assegurar que

as propriedades de fluxo dos pós estão adequadas para estes sejam utilizados nos equi-

pamentos farmacêuticos modernos. Por outro lado, dados micromeríticos representam

sistemas de dados complexos e não lineares que podem ser modelados tanto por redes

neurais supervisionadas como por redes não supervisionadas (KACHRIMANIS et al.,

2003).

Page 66: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

45

3 OBJETIVOS

3.1 OBJETIVO GERAL

Este trabalho visa desenvolver e avaliar redes neurais artificiais baseadas em algo-

ritmos supervisionados e não supervisionados para emprego no estudo de propriedades de

fluxo de excipientes farmacêuticos visando o desenvolvimento de modelos computacionais

aplicáveis no desenvolvimento de formas farmacêuticas sólidas.

3.2 OBJETIVOS ESPECÍFICOS

a) Desenvolver estudos baseados em rede feedfoward MLP, analisando a performance

quanto à capacidade de interpolar dados referentes aos parâmetros reológicos dos ex-

cipientes.

b) Desenvolver e avaliar a performance de classificação de três algoritmos baseados em

estratégias puramente competitivas (WTA, FSCL e RPCL).

c) Desenvolver e avaliar a performance de classificação de dois algoritmos baseados em

estratégias competitivo-cooperativas (SOM e NG).

d) Avaliar a performance da rede Neural Gas como nova ferramenta de mineração e clas-

sificação de dados.

e) Criar um protótipo de banco de dados como fonte para o desenvolvimento de estraté-

gias para desenvolvimento de um programa de Quality by Design, QbD, preconizado

pelo guia ICH-Q8 para desenvolvimento de produtos farmacêuticos (FDA - GUI-

DANCE FOR INDUSTRY, 2009).

f) Iniciar o desenvolvimento de ferramentas de IA para otimização de formuçlações far-

macêuticas.

Page 67: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

46

4 MATERIAL E MÉTODOS

4.1 PREPARAÇÃO DAS AMOSTRAS

Foram utilizados seis diferentes excipientes: Atapulgita (ATP), coletada em depó-

sitos naturais na região de Guadalupe, Estado do Piauí; Talco (TLC, Magnesita S.A.); Estea-

rato de Magnésio (MGS, Stearinerie Dubois); Lactose Monohidratada (LAC, Blanver); duas

amostras de celulose microcristalina de dois diferentes fabricantes (M101, Microcel 101®,

Blanver; CEL, Avicel); dióxido de silício coloidal (AER, Aerosil 200®). Todos os excipien-

tes foram usados em grau farmacêutico, exceto ATP, que foi usada sem purificação adicional.

As celuloses (M101 e CEL) e a LAC foram escolhidas como excipientes majoritá-

rios para misturas binárias porque são dois dos excipientes mais comuns utilizados para essa

função e por apresentarem características de fluidez suficientemente diferentes para distingui-

las com clareza (TAN e NEWTON, 1990; GOHEL, 2005; ROWE et al. 2009). Seguindo esse

mesmo critério, os demais excipientes foram misturados aos excipientes majoritários nas pro-

porções de 1 a 2% (Tabela 4) visando avaliar o efeito de cada excipiente minoritário sobre a

fluidez, na classificação automática desses pós.

As misturas binárias foram preparadas por diluição geométrica manual entre os

excipientes majoritários (LAC, M101 e CEL) e cada um dos excipientes minoritários nas dilu-

ições mostradas na Tabela 4: foram pesadas massa (em grama) correspondentes a 99 partes do

excipiente majoritário e 1 parte do excipiente minoritário. A massa do excipiente majoritário

foi dividida em cinco partes iguais. À primeira porção do excipiente majoritário foi adiciona-

da a quantidade total do excipiente minoritário, e em seguida a mistura foi passada por um

tamis manual com auxílio de espátula de aço inoxidável por cinco vezes. Adicionou-se em

seguida à mistura a segunda parte do excipiente majoritário, repetindo-se o procedimento de

tamisação por cinco vezes. O mesmo procedimento foi repetido após a adição da terceira,

quarta e quinta parte do excipiente majoritário, completando a mistura binária. O procedimen-

to foi repetido para a obtenção de todas as misturas binárias.

Page 68: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

47

Tabela 4: Excipientes puros e suas misturas binárias. O rótulo corresponde ao código de entrada para as redes neurais.

RÓTULO EXCIPIENTE OU MISTURA

5 ATP

6 CEL

7 LCT

8 MGS

9 TLC

10 M101

11 CEL / ATP – 99% : 1%

12 CEL / ATP – 98,5% : 1,5%

13 CEL / ATP – 98% : 2%

14 CEL / TLC – 99% : 1%

15 CEL / TLC – 98,5% : 1,5%

16 CEL / TLC – 98% : 2%

17 CEL / MGS – 99% : 1%

18 CEL / MGS – 98,5% : 1,5%

19 CEL / MGS – 98% : 2%

20 LCT / TLC – 99% : 1%

21 LCT / TLC – 98,5% : 1,5%

22 LCT / TLC – 98% : 2%

23 LCT / MGS – 99% : 1%

24 LCT / MGS – 98,5% : 1,5%

25 LCT / MGS – 98% : 2%

26 LCT / AER – 99% : 1%

27 LCT / AER – 98,5% : 1,5%

28 LCT / AER – 98% : 2%

29 CEL / AER – 99% : 1%

30 CEL / AER – 98,5% : 1,5%

31 CEL / AER – 98% : 2%

32 LCT / ATP – 99% : 1%

33 LCT / ATP – 98,5% : 1,5%

34 LCT / ATP – 98% : 2%

Fonte: Dados do trabalho

Page 69: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

48

Destes excipientes, apenas AER não teve suas propriedades (volume aparente, vo-

lume após compactação, densidade aparente, densidade após compactação e parâmetros reo-

lógicos) avaliadas individualmente devido à sua baixíssima densidade aparente, que inviabili-

zam quaisquer dessas medidas nas condições experimentais adotadas. Entretanto misturas

binárias entre AER e os diluentes CEL, M101 e LAC foram preparadas e avaliadas da mesma

forma que todas as demais misturas binárias.

As densidades bruta (DB) e de compactação (DC) foram determinadas a partir da

razão entre o volume aparente (V0) e o volume ocupado por 30g de pó após compactação,

segundo o seguinte procedimento geral: foram pesados cerca de 30g de cada excipiente puro

ou mistura binária em balança eletrônica Bioprecisa FA 2104-N. Os volumes aparente (V0) e

de compactação foram registrados pela adição cuidadosa da massa pesada do pó no recipiente

graduado do compactador de pós (Nova Ética 303 D) que em seguida foi submetido a 10, 500

e 1250 compactações, registrando-se os volumes V10, V500 e V1250, respectivamente. Para o

cálculo de DB e DC arbitrou-se como volume aparente o valor registrado para V10 e V500 como

volume de compactação porque não houve diferença significativa entre V500 e V1250; as densi-

dades, portanto, foram calculadas segundo a relação: DB = m / V10 e DC = m / V500. Os valores

de FH e IC foram calculados de acordo com as equações 5 e 6 (EUROPEAN PHARMACO-

POEA, 2002).

Figura 16: Ilustração do aparato para determinação do ângulo de repouso.

Fonte: LAMOLHA e SERRA, 2007.

Para determinação do ângulo de repouso estático, cerca 30g de pó foram deixados

fluir o mais regularmente possível por um funil de 20,0cm de diâmetro superior e 2,0cm de

diâmetro inferior colocado a 15,0 cm centímetros de altura de uma superfície nivelada coberta

com papel milimetrado, conforme a ilustração da Figura 16 (PRISTA et al., 1995). O ângulo

Page 70: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

49

de repouso é calculado de acordo com a equação 7, onde È é o ângulo de repouso, h é a altura do

cone formado pelo pó e r é o raio do cone formado pelo pó.

tanÈ � ²" (7)

Page 71: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

50

4.2 IMPLEMENTAÇÃO DAS REDES NEURAIS SUPERVISIONADAS

O banco de dados consistiu de 1080 amostras (Apêndice A), cujos atributos (veto-

res) de entrada são a massa, V0, V10, V500, V1250, DB, DC. Foram considerados aqui como V0

os valores de volume observados sem nenhuma compactação (diferentemente do usado para

cálculo da densidade de compactação, que foi V10). Cada um dos atributos está relacionado

aos excipientes puros ou misturas binárias rotulados com números de 5 a 34, num total de 30

rótulos. Mais especificamente, os rótulos de 5 a 10 correspondem aos excipientes puros en-

quanto os rótulos de 11 a 34 representam as misturas binárias (Tabela 4 e Apêndice A).

No estágio inicial dos estudos foram testadas condições para o desenvolvimento

de uma rede neural supervisionada (rede MLP com função sigmoide) com fins preditivos.

Para tal foi utilizado o mesmo banco de dados geral, porém acrescido das propriedades reoló-

gicas de quatro fármacos, rifampsina (Novartis India), isoniazida (Second Pharma), etambutol

(Hildose) e pirazinamida (Davilson). Foram testadas quatro redes supervisionadas MLP com

mesmo número de neurônios na camada de entrada e de saída (8 e 1, respectivamente), vari-

ando-se apenas o número de camadas da camada escondida (monocamada e bicamada) e de

seus respectivos neurônios, conforme a descrição:

a. Ambiente de desenvolvimento

• Ferramentas de desenvolvimento:

i. Normalização e plotagem dos dados: MATLAB® versão 2011 para

LINUX.

ii. Implementação da rede neural na linguagem JAVA, versão 7:

NETBEANS 7.

iii. Sistema operacional: LINUX, Distribuição Debian 6.

b. Detalhamento das redes neurais:

• Descrição:

i. Rede MLP com função de ativação sigmoide

• Topologia:

i. Número de entradas (inputs): 8

Page 72: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

51

ii. Número de saídas (outputs): 1

iii. Número de camadas escondidas:

1. Rede 1: monocamada com 16 neurônios.

2. Rede 2: bicamada com 8 e 4 neurônios, respectivamente em

cada camada.

3. Rede 3: bicamada com 16 e 4 neurônios, respectivamente

em cada camada.

4. Rede 4: bicamada com 16 e 8 neurônios, respectivamente

em cada camada.

c. Conjuntos de treinamento e de teste:

• Dados: 102 instâncias (vetores)

• Conjunto de treinamento: 68 vetores (2/3 do conjunto de dados)

• Conjunto de teste: 34 vetores (1/3 do conjunto de dados)

d. Pré-processamento:

• Normalização dos dados (valores entre 0 e 1) – utilizando duas técnicas de

normalização em sequência:

i. Primeira: normalização em Z (Z-score).

ii. Segunda: normalização pelos máximos e mínimos.

e. Pós-processamento:

• Foram aplicadas ao conjunto de dados as operações inversas às usadas no

pré-processamento, ou seja desnormalização pelos máximos e mínimos e

pelo Z-score (Figura 17).

Page 73: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

Figura 17: Descrição esquemática das etapas de pré

escrição esquemática das etapas de pré-processamento e pós-processamento

RNAs supervisionadas.

Fonte: Autoria própria

52

processamento para as

Page 74: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

53

4.3 IMPLEMENTAÇÃO DAS REDES NEURAIS NÃO SUPERVISIONADAS

Os algoritmos das redes não supervisionadas foram implementados em MA-

TLAB® versão 2011 para LINUX e SOM Toolbox versão 2.0, de acesso livre

(http://www.cis.hut.fi/somtoolbox/). Para permitir uma comparação adequada foram usados,

dentro do possível, parâmetros idênticos para todos os algoritmos (taxa de aprendizagem ini-

cial, taxa de aprendizagem final, Grid de neurônios, número de épocas de treinamento), dife-

renciando-se apenas os parâmetros característicos e exclusivos de cada algoritmo. Os parâme-

tros de entrada para execução dos algoritmos estão descritos como se segue:

a. WTA

• Taxa de aprendizagem inicial: 0.8

• Taxa de aprendizagem final: 0.001

• Grid: 7 X 7

• Número de Épocas = 100;

A Taxa de aprendizagem teve um decaimento exponencial.

b. FSCL

• Taxa de ajuste da frequência de vitórias: 0.1

• Taxa de aprendizagem inicial: 0.8

• Taxa de aprendizagem final: 0.001

• Grid: 7 X 7

• Número de Épocas = 100;

A Taxa de aprendizagem teve um decaimento exponencial.

Page 75: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

54

c. RPCL

• Taxa de aprendizagem inicial: 0.8

• Taxa de aprendizagem final: 0.001

• Taxa de penalização: 0.001

• Grid: 7 X 7

• Número de Épocas = 100;

A Taxa de aprendizagem teve um decaimento exponencial e a taxa

de penalização dada ao segundo vitorioso foi mantida constante.

d. SOM

• Parâmetro de vizinhança inicial: 10

• Parâmetro de vizinhança final: 0.01

• Taxa de aprendizagem inicial: 0.8

• Taxa de aprendizagem final: 0.001

• Grid: 7 X 7

• Número de Épocas = 100;

Tanto o parâmetro de vizinhança como a taxa de aprendizagem ti-

veram um decaimento exponencial.

e. NG

• Parâmetro de vizinhança inicial: 10

• Parâmetro de vizinhança final: 0.01

• Taxa de aprendizagem inicial: 0.8

• Taxa de aprendizagem final: 0.001

• Grid: 7 X 7

Page 76: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

55

• Número de Épocas = 100;

O parâmetro de vizinhança e a taxa de aprendizagem tiveram um decaimento ex-

ponencial.

O Grid corresponde à grade de neurônios, ou seja, ao arranjo bidimensional desses neurô-

nios. No presente estudo o que se mostrou mais apropriado após screening prévio foi o de

7X7 neurônios (Figura 17). Para interpretação das matrizes-U, todas as leituras serão

feitas de cima para baixo e da esquerda para direita.

Figura 18: Grid de 7 X 7 neurônios.

Fonte: Autoria própria.

Page 77: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

56

5 RESULTADOS E DISCUSSÃO 5.1 REDES SUPERVISIONADAS

Nessa etapa testou-se o desenvolvimento de redes supervisionadas com fins predi-

tivos em relação ao comportamento reológico de pós para formas farmacêuticas sólidas. Para

a escolha da melhor arquitetura de rede MLP, inicialmente quatro redes neurais foram treina-

das e suas performances foram comparadas baseando-se nas suas curvas de aprendizado. O os

melhores resultados foram encontrados para a rede de topologia mais simples (Rede 1) que

compreende 8 neurônios de entrada, uma única camada escondida com 16 neurônios, e 1 neu-

rônio de saída (Figura 19).

Figura 19: rede MLP escolhida para o estudo. As setas indicam o fluxo dos dados de entrada, os cír-

culos verdes correspondem aos neurônios da camada de entrada, os azuis aos neurônios da camada

escondida e o amarelo ao neurônio da camada de saída.

Fonte: Dados do trabalho

Page 78: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

Foram apresentados como

da camada de entrada), a massa, o volum

densidade bruta e compactada

entre esses dados de entrada.

atributos de saída: IC, FH e

Uma das forma

visionada é através da análise da curva de decaimento de erro, que expressa a capacidade de

adaptação da rede através da redução da taxa de erro a medida em que os dados são reaprese

tados à rede.

Figura 20: Índice de Carr

Cada apresentação do

poca de treinamento e uma rede com boa capacidade de adaptação e aprendizado mostrará

uma diminuição adequada da taxa de erro ao longo do processo de aprendizado

atributos de saída testados apresentaram um decaimento de erro quadrático exponencial. Para

os atributos IC e FH (Figuras

parece ter indicado de uma

brupta do erro médio quadrático já nas primeiras iterações,

a zero.

Foram apresentados como atributos de entrada (dados apresentados aos neurônios

, a massa, o volume aparente, os volumes compactados

densidade bruta e compactada (Tabela 4 e Apêndice 1). Não foi estabelecida nenhuma relação

entre esses dados de entrada. Analisamos a capacidade de predição da rede em relação a três

atributos de saída: IC, FH e α.

Uma das formas de expressar a performance de aprendizado de uma RNA supe

visionada é através da análise da curva de decaimento de erro, que expressa a capacidade de

adaptação da rede através da redução da taxa de erro a medida em que os dados são reaprese

: Índice de Carr – curva de decaimento do erro médio quadrático.

Fonte: Dados do trabalho

Cada apresentação do conjunto de dados à rede corresponde a uma iteração ou

e uma rede com boa capacidade de adaptação e aprendizado mostrará

uma diminuição adequada da taxa de erro ao longo do processo de aprendizado

atributos de saída testados apresentaram um decaimento de erro quadrático exponencial. Para

s IC e FH (Figuras 20 e 21, respectivamente) o decaimento observado

de uma boa performance de aprendizado. Chama à atenção a redução

brupta do erro médio quadrático já nas primeiras iterações, quando já atinge um nível

57

(dados apresentados aos neurônios

ompactados, e os valores de

. Não foi estabelecida nenhuma relação

a capacidade de predição da rede em relação a três

s de expressar a performance de aprendizado de uma RNA super-

visionada é através da análise da curva de decaimento de erro, que expressa a capacidade de

adaptação da rede através da redução da taxa de erro a medida em que os dados são reapresen-

curva de decaimento do erro médio quadrático.

à rede corresponde a uma iteração ou é-

e uma rede com boa capacidade de adaptação e aprendizado mostrará

uma diminuição adequada da taxa de erro ao longo do processo de aprendizado. Todos os

atributos de saída testados apresentaram um decaimento de erro quadrático exponencial. Para

) o decaimento observado em princípio

Chama à atenção a redução a-

quando já atinge um nível próximo

Page 79: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

Figura 21: Fator de Hausner

A curva de aprendizado para o ângulo de repouso

cia irregularidade na performance de apren

de erro em forma de degrau, com decaimento bastante irregular nas primeiras duas mil iter

ções, estabilizando-se com uma taxa de erro médio relativamente alta até aproximadamente

dez mil iterações e só a pa

finais.

Devemos considerar aqui a natureza dos experimentos e seu efeito sobre os dados

de entrada. Esses ensaios reológicos preliminares, apesar de fornecerem informações valiosas

acerca da fluidez dos pós, trazem intrinsecamente fontes de erros experimentais. An

cada um dos experimentos, apesar das medidas de massa serem executadas com precisão, as

medidas de volume, ao contrário, têm um nível de acurácia bastante inferior, uma vez que é

feita através da observação direta do volume do pó dentro de um

um nível de imprecisão relativamente alto. A despeito disso, as curvas de decaimento de erro

para o FH e IC sugerem que a rede MLP foi refratária a essas fontes de erro.

: Fator de Hausner – curva de decaimento do erro médio quadrático.

Fonte: Dados do trabalho

A curva de aprendizado para o ângulo de repouso (Figura 22

cia irregularidade na performance de aprendizado, caracterizada por uma curva de decaimento

em forma de degrau, com decaimento bastante irregular nas primeiras duas mil iter

se com uma taxa de erro médio relativamente alta até aproximadamente

dez mil iterações e só a partir daí reduzindo seus valores até próximo de zero

Devemos considerar aqui a natureza dos experimentos e seu efeito sobre os dados

de entrada. Esses ensaios reológicos preliminares, apesar de fornecerem informações valiosas

acerca da fluidez dos pós, trazem intrinsecamente fontes de erros experimentais. An

cada um dos experimentos, apesar das medidas de massa serem executadas com precisão, as

medidas de volume, ao contrário, têm um nível de acurácia bastante inferior, uma vez que é

feita através da observação direta do volume do pó dentro de uma pro

um nível de imprecisão relativamente alto. A despeito disso, as curvas de decaimento de erro

que a rede MLP foi refratária a essas fontes de erro.

58

curva de decaimento do erro médio quadrático.

(Figura 22), entretanto, denun-

dizado, caracterizada por uma curva de decaimento

em forma de degrau, com decaimento bastante irregular nas primeiras duas mil itera-

se com uma taxa de erro médio relativamente alta até aproximadamente

rtir daí reduzindo seus valores até próximo de zero nas iterações

Devemos considerar aqui a natureza dos experimentos e seu efeito sobre os dados

de entrada. Esses ensaios reológicos preliminares, apesar de fornecerem informações valiosas

acerca da fluidez dos pós, trazem intrinsecamente fontes de erros experimentais. Analisando

cada um dos experimentos, apesar das medidas de massa serem executadas com precisão, as

medidas de volume, ao contrário, têm um nível de acurácia bastante inferior, uma vez que é

proveta, que já apresenta

um nível de imprecisão relativamente alto. A despeito disso, as curvas de decaimento de erro

que a rede MLP foi refratária a essas fontes de erro.

Page 80: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

59

Figura 22: Ângulo de Repouso – curva de decaimento do erro médio quadrático.

Fonte: Dados do trabalho

A determinação experimental do ângulo de repouso, por sua vez, teve um nível de

imprecisão muito mais alto em suas medidas comparados aos ensaios baseados na determina-

ção de densidade, gerando importantes fontes de erro. Embora haja uma boa correlação entre

IC e o ângulo de repouso (DAVIES, 2004; LEE, 2008), a rede MLP apresentou um baixo ní-

vel de ajuste entre os dados experimentais e os calculados pela rede (gráfico não mostrado),

reforçando a ideia de uma aparente dificuldade de aprendizado já mostrada pelo perfil aparen-

temente anômalo na curva de aprendizado.

Entretanto esse comportamento não significa que α seja um parâmetro inadequado

para essa aplicação; na verdade, o fato de que o valor da tangente de um ângulo de um cone

de pó traga em si certo grau de imprecisão, por outro lado pode ser sugestivo de que pode não

haver dependência linear com outros parâmetros de entrada, no caso as variações de volume;

uma vez comprovada essa hipótese, uma rede MLP corretamente ajustada em relação a esse

parâmetro pode ser um bom interpolador. A continuidade deste trabalho, etapa atual do de-

senvolvimento, consiste em testar outras arquiteturas de rede e algoritmos na interpolação de

dados contendo valores de α.

Page 81: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

60

Numa etapa posterior deste estudo, a coluna referente aos valores de ângulo de re-

pouso foi excluída para evitar possíveis interferências sobre a performance de clusterização

dos algoritmos não supervisionados. Utilizamos a partir dessa etapa os dados de IC e FH co-

mo atributos de saída.

A principal finalidade do desenvolvimento de uma RNA supervisionada no esco-

po deste trabalho é o desenvolvimento de uma boa ferramenta de predição de comportamento

reológico de pós no desenvolvimento de comprimidos. Logo, uma vez determinados como

atributos de saída (outputs), neste caso IC e FH, foi testada a capacidade de predição da rede

MLP baseada nesses atributos. A RNA após o treinamento calcula de forma preditiva os valo-

res dos atributos de saída e uma vez calculados esses valores são reapresentados à rede e

comparado com o conjunto teste de dados.

O nível de ajuste entre os dados experimentais e aqueles calculados pela rede ex-

pressa o quanto o resultado previsto pela rede está próximo do resultado experimental: quanto

maior o nível de ajuste entre os dados experimentais e os calculados pela rede, melhor a capa-

cidade preditiva da rede. As figuras 23 e 24 expressam o nível de ajuste para IC e FH, respec-

tivamente. Nos gráficos apresentados, os círculos representam os dados experimentais e os

asteriscos os dados calculados, de modo que a representação visual do ajuste corresponde ao

encaixe dos asteriscos dentro dos círculos.

Percebe-se intuitivamente que houve um alto ajuste entre os dados para ambos os

atributos de saída testados, entretanto o ajuste dos dados de IC foi ainda maior do que a ob-

servada para o FH. A confirmação é mostrada nos gráficos de erro percentual do nível de a-

juste entre os dados experimentais e aqueles calculados pela rede (Figuras 25 e 26; Tabela 5).

Nenhum erro chegou a 10%, o que indica que a rede teve uma boa capacidade preditiva para

os dados estudados. O maior erro de predição foi observado para o oitavo ponto do gráfico de

percentual de erro para FH, correspondente ao rótulo 12 (CEL / ATP, 98,5% : 1,5%), cujo

valor absoluto ficou em torno de 9,4%.

Page 82: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

61

Figura 23: Índice de Carr – nível de ajuste entre os dados experimentais e os calculados pela rede. Os

círculos correspondem aos valores experimentais e os asteriscos aos valores calculados pela rede ao

final do treinamento, da comparação entre o conjunto de treinamento e o conjunto teste.

Fonte: Dados do trabalho

Figura 24: Fator de Hausner – nível de ajuste entre os dados experimentais e calculados pela rede. Os

círculos correspondem aos valores experimentais e os asteriscos aos valores calculados pela rede ao

final do treinamento, da comparação entre o conjunto de treinamento e o conjunto teste.

Fonte: Dados do trabalho

Page 83: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

Figura 25: Índice de Carr – erro percentual do nível de ajuste entre os dados experimentais e os calc

Figura 26: Fator de Hausner –

erro percentual do nível de ajuste entre os dados experimentais e os calc

lados pela rede.

Fonte: Dados do trabalho

erro percentual do nível de ajuste entre os dados experimentais e os

pela rede.

Fonte: Dados do trabalho

62

erro percentual do nível de ajuste entre os dados experimentais e os calcu-

dados experimentais e os calculados

Page 84: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

63

Tabela 5: comparação entre os erros percentuais de IC e FH. Os índices C1, C2 e C3 correspondem às propor-

ções nas misturas binárias 99,0 : 1,0; 98,5 : 1,5 e 98,0 : 2,0 respectivamente.

ATRIBUTO RÓTULO (LABEL) ERRO / % IC ERRO / % FH

1 1 – RIF 0,8 2,2

2 2 – ISO 1,7 4,9

3 3 – PZM 0,1 0,2

4 4 – ETB 0,9 1,2

5 5 – ATP 0,2 5,0

6 6 – CEL 0,15 ≈ 0

7 7 – LCT 0,1 2,2

8 8 – EMG 7,2 9,4

9 9 – TLC 4,3 0,7

10 10 – M101 0,25 0,15

11 11 – CMC / ATP C1 0,5 0,2

12 12 – CMC / ATP C2 0,25 0,25

13 13 – CMC / ATP C3 0,4 0,2

14 14 – CMC / TLC C1 0,1 0,1

15 15 – CMC / TLC C2 0,25 0,1

16 16 – CMC / TLC C3 0,1 0,25

17 17 – CMC / EMG C1 0,5 0,15

18 18 – CMC / EMG C2 0,1 0,1

19 19 – CMC / EMG C3 0,7 0,2

20 20 – LCT / TLC C1 0,2 2,0

21 21 – LCT / TLC C2 0,6 3,5

22 22 – LCT / TLC C3 0 0,5

23 23 – LCT / EMG C1 0,6 4,7

24 24 – LCT / EMG C2 1,6 5,7

25 25 – LCT / EMG C3 1,5 4,8

26 26 – LCT / AER C1 0,1 4,7

27 27 – LCT / AER C2 0,7 4,0

28 28 – LCT / AER C3 0,7 0,3

29 29 – CMC / AER C1 0,25 0,4

30 30 – CMC / AER C2 0,1 0,15

31 31 – CMC / AER C3 0,6 0,1

32 32 – LCT / ATP C1 0,3 2,2

33 33 – LCT / ATP C2 0,4 0,7

34 34 – LCT / ATP C3 0,35 1,5

Fonte: Dados do trabalho

Page 85: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

64

Essas observações mostram que embora nenhuma informação fosse passada à

RNA, a relação de dependência entre FH/IC e os dados experimentais foi apreendida pela

rede sem dificuldades, e de fato os modelos descritivos dessa relação envolvem apenas valo-

res de densidade e são bastante elementares. O ponto positivo é que FH e IC, apesar de serem

inferidos a partir de medidas experimentais relativamente imprecisas, podem ser bons descri-

tores para relacionar características reológicas com propriedades micromeríticas, por exem-

plo. Por outro lado a curva de aprendizado mostra que o parâmetro α segue outro critério.

Embora haja uma relação matemática simples capaz de inferir os valores de α a partir de me-

didas experimentais, o nível de imprecisão dessas medidas parece interferir na inferência a

partir das fórmulas analíticas existentes para descrição desse parâmetro.

Em decorrência disso, passo atual deste trabalho envolve o desenvolvimento de

redes MLP interpolando espectros na região do infravermelho próximo (NIR) e características

físicas e micromeríticas de misturas de excipientes, utilizando FH e IC como descritores. As-

sociando ao outro bloco dessa linha de estudo, o desempenho das redes não supervisionadas

aponta para o desenvolvimento de dispositivos conjuntos (ensemble) envolvendo algoritmos

supervisionados e não supervisionados para emprego na otimização reológica de misturas de

pós para máquinas de compressão e enchimento de cápsulas duras.

Page 86: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

65

5.2 REDES NÃO SUPERVISIONADAS

Os rótulos (labels) da tabela (Apêndice A) referem-se aos excipientes puros, CEL,

ATP, LAC EMG e TLC e suas misturas binárias com os excipientes majoritários em relações

99:1, 98,5:1,5 e 98:2. Lactose e celulose foram escolhidas como excipientes majoritários (di-

luentes) nessas misturas. Diferentemente do estudo da rede MLP, como as redes não supervi-

sionadas não pressupõem nenhum atributo de saída dada suas funções classificativas e pros-

pectivas, todos os dados, incluindo IC, FH e α foram apresentados indistintamente às redes

sem conhecimento a priori sobre as relações entre essas propriedades, com intuito de analisar

sua capacidade de classificação. A precisão dessa classificação pode ser analisada em dois

níveis: no nível global, de similaridade mais alta, e no nível local que é um nível menor de

similaridade.

Os dados da tabela no Apêndice A correspondem a um espaço multidimensional,

e dele se pretende avaliar a capacidade de cada algoritmo de extrair as relações intrínsecas

existentes entre esses dados. A representação do espaço multidimensional será projetada co-

mo mapa de contexto em planos 2D e 3D, através das respectivas matrizes-U de cada algorit-

mo estudado, que conforme já descrito, são uma representação gráfica bidimensional ou tri-

dimensional da distância euclidiana entre vetores de neurônios vizinhos, projetadas a partir de

um espaço multidimensional.

Neste estudo foi empregada a lactose spray-dryied, cujas propriedades de fluxo

(IC e FH) são superiores à lactose comum e à celulose, criando as condições para avaliar a

sensibilidade e seletividade das redes quanto à determinação de critérios intrínsecos de cluste-

rização (ALEXANDER, 2006; FAQIH, 2006; TAN e NEWTON, 1990; GOHEL, 2005; RO-

WE et al. 2009). Em tese as propriedades reológicas aqui estudadas – IC, FH e α – permitiri-

am alinhar esses dois excipientes em posições suficientemente distintas, onde a CEL represen-

taria um sistema pulverulento com fluxo deficiente, enquanto a LAC representaria um sistema

com propriedades um pouco melhores. Associa-se aqui a ideia de que em cada sistema o

componente minoritário não excede 2% na mistura, induzindo que o comportamento reológi-

co dessa mistura assuma o comportamento do componente majoritário. Essas premissas con-

duzem à expectativa de que os cinco algoritmos aqui estudados sejam capazes de reconhecer

características dessemelhantes, e conforme sua saliência, ser capaz de reconhecer agrupamen-

tos na massa de dados fornecida na tabela de atributos.

Page 87: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

66

5.2.1 WTA, RPCL e FSCL

Preliminarmente, não houve diferença de comportamento reológico entre os dois

tipos de celulose utilizados, CEL e M101, de modo que daqui por diante ambas serão tratadas

como um único grupo, CEL. Desse modo pode-se verificar que 90% dos dados apresentados

às redes são relacionados às propriedades de LAC e CEL e suas respectivas misturas (Apên-

dice A).

Iniciamos nossos estudos avaliando a capacidade classificativa dos três algoritmos

puramente competitivos utilizados neste estudo: WTA, RPCL e FSCL. Daqui em diante os

algoritmos puramente competitivos serão chamados apenas de "competitivos", por represen-

tarem a forma clássica desse princípio de aprendizado automático. O desempenho comparati-

vo das duas redes baseadas em princípios competitivo-cooperativos, SOM e NG será avaliado

subsequentemente.

A Figura 27 corresponde à justaposição das matrizes-U 3D e 2D dos três algorit-

mos competitivos. Os gráficos 27A na Figura 27 correspondem às matrizes-U tridimensionais,

onde as regiões planas (vales) em azul escuro correspondem aos neurônios mais densamente

povoados com dados. A densidade de dados diminui com a diminuição da intensidade na co-

loração azul em direção aos tons de amarelo/laranja: quanto mais intenso o laranja, menos

dados ou nenhum dado estará associado e esse neurônio ou grupo de neurônios. Os picos,

portanto, correspondem às regiões de baixa densidade de dados, estabelecendo as fronteiras

entre os agrupamentos de dados.

Os gráficos 27B e 27C correspondem às matrizes-U bidimensionais para cada al-

goritmo. Nestas figuras os neurônios estão representados como estruturas hexagonais justa-

postas em formato de "colmeia", dispostos em sete colunas por sete linhas, totalizando os 49

neurônios representantes das redes. Para localização e enumeração dos neurônios, arbitrou-se

uma numeração seguindo as colunas de cima para baixo e da direita para a esquerda para to-

das as matrizes-U bidimensionais.

Para facilitar a classificação por inspeção visual, apenas para as matrizes-U bi-

dimensionais, adotamos um sistema de cores para identificação dos rótulos de amostras: a cor

azul representa LAC (rótulo 7) e suas misturas (rótulos 20 - 28; 32 - 34.); a cor verde repre-

senta CEL (rótulo 6) e suas misturas (rótulos 7; 10 - 19; 29 - 31); a cor rosa representa EMG

Page 88: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

(rótulo 8) a cor vermelha representa ATP; a cor laranja representa TLC (rótulo 9).

ros anotados dentro dos neurônios correspondem aos rótulos dos atributos de entrada aos

quais o neurônio está associado.

los.

Figura 27: matrizes-U tridimensionais e bidimensionais para as estratégias puramente competitivas.

(A): matrizes-U tridimensionais;

zes-U bidimensionais, azul:

(rótulo 8) a cor vermelha representa ATP; a cor laranja representa TLC (rótulo 9).

ros anotados dentro dos neurônios correspondem aos rótulos dos atributos de entrada aos

quais o neurônio está associado. Consultar Apêndice A ou Tabela 4 para verificação dos rót

U tridimensionais e bidimensionais para as estratégias puramente competitivas.

U tridimensionais; (B) e (C): matrizes-U bidimensionais. Esquema de cores nas matr

U bidimensionais, azul: LAC; verde: CEL; rosa: EMG; laranja: TLC; vermelho: ATP.

Fonte: dados do trabalho

67

(rótulo 8) a cor vermelha representa ATP; a cor laranja representa TLC (rótulo 9). Os núme-

ros anotados dentro dos neurônios correspondem aos rótulos dos atributos de entrada aos

para verificação dos rótu-

U tridimensionais e bidimensionais para as estratégias puramente competitivas.

U bidimensionais. Esquema de cores nas matri-

verde: CEL; rosa: EMG; laranja: TLC; vermelho: ATP.

Page 89: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

68

Nas matrizes-U (B), o agrupamento dos dados é mostrado através da associação

das cores adotadas na codificação aos neurônios ocupados por dados: neurônios coloridos

contêm dados identificados pelo diagrama de cores. Nas matrizes-U (C) pode-se visualizar

quais entradas estão associadas a cada neurônio ocupado através dos números correspon-

dente aos rótulos dentro do neurônio.

Por inspeção visual as figuras 27A mostram que a rede WTA reconheceu dois a-

grupamentos na massa de dados, enquanto a rede RPCL também reconheceu dois agrupamen-

tos, porém apresentou dois neurônios isolados, e a rede FSCL reconheceu três agrupamentos.

Nenhuma das três estratégias foi capaz de reconhecer algum tipo de classificação subjacente,

como a detecção de subclusters dentro de clusters principais.

Mesmo claramente separados, nenhum dos possíveis clusters parece ter sido agru-

pado segundo algum critério detectável. Numa análise detalhada dos dados associados aos

neurônios se observa que nestes clusters estão associados indiscriminadamente, tanto os neu-

rônios associados ao conjunto LCT, como neurônios associados ao conjunto CEL.

Figura 28: matriz-U para as representações do algoritmo WTA clássico. Os números dentro do neurô-

nio correspondem aos rótulos dos dados que foram associados por esse neurônio.

Fonte: dados do trabalho

Page 90: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

69

Para um maior detalhamento, considere-se como exemplo a classificação feita pe-

la rede WTA, onde algumas entradas de categorias díspares foram alocadas, inclusive, dentro

de um mesmo neurônio (Figura 28). No neurônio 13, por exemplo, ficaram alocados TLC

(rótulo 9) e representantes do grupo CEL (rótulos 14, 19 e 31) e LAC (rótulo 23). Compor-

tamento similar também pode ser observado para as classificações feitas através das redes

RPCL e FSCL (Figuras 29 e 30).

Figura 29: matriz-U 2D para as representações do algoritmo RPCL. Os números dentro do neurônio

correspondem aos rótulos dos dados que foram associados por esse neurônio.

Fonte: dados do trabalho

Pode-se notar, nesse caso, que o mesmo tipo de erro de alocação foi repetido em

outros neurônios nas outras duas redes, cujos casos extremos foram anotados para os neurô-

nios:

→ RPCL:

o 15, 35 e 36 contendo entradas de CEL, MGS e LAC;

Page 91: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

70

→ FSCL:

o 14, contendo entradas de TLC, MGS e LAC;

o 20, 30 e 43 contendo entradas de TLC, LAC e CEL;

o 44, contendo entradas de CEL, MGS e LAC;

Figura 30: matriz-U 2D para as representações do algoritmo FSCL. Os números dentro do neurônio

correspondem aos rótulos dos dados que foram associados por esse neurônio.

Fonte: dados do trabalho

Há também um grande número de neurônios inativos nas grades. Nos três casos,

menos da metade dos neurônios está ativa, sendo o pior caso anotado para FSCL, que teve

apenas 17 neurônios ativos (pouco menos de 35%), enquanto as redes WTA e RPCL apresen-

taram apenas 21 de seus neurônios ativos (por volta de 43%). Por outro lado há uma sobrecar-

ga de dados em alguns neurônios, caracterizada pela representação de um grande número de

dados por uma mesma unidade neuronal. Nos três casos o neurônio 15 foi o neurônio com

maior recorrência de sobrecarga, destacando-se também, os neurônios 13, 21 e 49 na rede

WTA; os neurônios 21, 41, 42 e 49 na rede RPCL e os neurônios 13, 21, 28 e principalmente

49 na rede FSCL. Esses pontos de sobrecarga atuaram como centros de massa na formação

dos agrupamentos.

Page 92: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

71

Essas características anômalas, representadas pela alocação indiscriminada de en-

tradas dentro de um mesmo neurônio e pelo grande número de neurônios inativos na grade e,

por conseguinte, pela sobrecarga de neurônios específicos, configuram uma distorção na re-

presentação do espaço de dados. Essa distorção pode estar associada possivelmente a dois

problemas: o primeiro deles é uma inadequação do tamanho da grade ao conjunto de dados

apresentado às redes, o que faz com que os critérios de alocação e de definição das fronteiras,

especialmente para separação de subconjuntos de dados, possam induzir erros de classificação

semelhantes aos encontrados (PAVLIDIS et al., 2006; ANTZOULATOS et al., 2009).

O segundo problema resulta de uma característica intrínseca desses três algorit-

mos: os algoritmos baseados no princípio “o vencedor leva tudo” tendem a ignorar as infor-

mações sobre a estrutura geométrica dos dados remanescentes após a vitória do neurônio

BMI, supervalorizando o neurônio vencedor, fazendo com que ele associe seu vetor de peso a

vetores de entrada sem se basear em critérios de discriminação mais acurados para alocação

de dados com características de similaridade próximas; noutras palavras, o BMU aloca todos

os dados próximos indiscriminadamente (HAYKIN, 2001).

A inadequação do tamanho da grade e a supervalorização do BMU redundam nu-

ma possível causa da indução dos erros reconhecidos pela análise das matrizes-U. Restou i-

dentificar a natureza semântica do erro para estabelecer a veracidade dessa relação, e a análise

dos planos de componentes do índice da Carr para as três redes foi esclarecedora nesse senti-

do (Figuras 31, 32 e 33, código de cores mostrado na Tabela 6).

É prudente chamar à atenção que o sentido da codificação de cores nos gráficos de

planos de componentes é diferente do adotado nas matrizes-U: enquanto nas matrizes-U as

cores representam os rótulos das entradas, no plano de componentes as cores representam

as características de fluidez dos excipientes, refletidos pelos parâmetro IC e FH.

Em primeiro lugar pode-se observar com clareza que as redes foram insensíveis às

características distintivas entre os principais conjuntos de dados apresentados, no caso índice

de Carr. Essa insensibilidade parece ser a causa da alocação de dados com características con-

flitantes dentro de um mesmo agrupamento e até mesmo dentro de um mesmo neurônio, ca-

racterizando um típico erro de classificação.

Page 93: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

72

Tabela 6: Limites indicativos de fluidez baseados em IC e FH como fonte para a representação de

cores nos gráficos dos planos de componentes

FLUIDEZ COR IC/% FH

Excelente vermelho 5 – 11 1.00 – 1.11

Bom verde 12 – 17 1.12 – 1.18

Aceitável azul 18 – 22 1.19 – 1.34

Pobre rosa 23 – 32 1.35 – 1.45

Muito pobre amarelo 33 – 39 1.46 – 1.59

Fonte: adaptado de USP; THE PARMACEUTICAL CODEX, 1994.

Figura 31: Gráfico do plano de componentes do índice de Carr para a rede WTA. Vermelho: Excelen-

te; Verde: Bom; Azul, Aceitável; Rosa: Pobre; Amarelo: Muito pobre. Abaixo, à direita, a matriz-U

2D da rede.

Fonte: Dados do trabalho

Page 94: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

73

Tomando como exemplo apenas duas propriedades que determinam as diferenças

entre a fluidez de sistemas pulverulentos - propriedades micromeríticas (tamanho e forma de

partículas) e propriedades físicas de superfície (cargas eletrostáticas) - espera-se que sistemas

com composição diferentes possam ser reconhecidos por uma rede não supervisionada, desde

que as diferenças entre essas propriedades em cada sistema seja minimamente destacável e

que a rede tenha sensibilidade pra reconhecer as diferenças e habilidade de classificação base-

ando-se nessas diferenças.

Assumindo que os sistemas pulverulentos em estudo apresentem diferenças detec-

táveis em seus parâmetros de fluidez, IC e FH, espera-se que uma rede não supervisionada

com características apropriadas seja capaz de classificar os sistemas segundo esse critério. A

inspeção detalhada dos dados estabeleceu que o ou os critérios adotados pelas redes WTA,

RPCL e FSCL para classificação dos dados não pode ser indeterminado.

Figura 32: Gráfico do plano de componentes do índice de Carr para a rede RPCL. Vermelho: Exce-

lente; Verde: Bom; Azul, Aceitável; Rosa: Pobre; Amarelo: Muito pobre. Abaixo, à direita, a matriz-U

2D da rede.

Fonte: Dados do trabalho

Page 95: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

74

Figura 33: Gráfico do plano de componentes do índice de Carr para a rede FSCL. Vermelho: Excelen-

te; Verde: Bom; Azul, Aceitável; Rosa: Pobre; Amarelo: Muito pobre. Abaixo, à direita, a matriz-U

2D da rede.

Fonte: Dados do trabalho

O principal desdobramento da incapacidade de adoção de um critério plausível é

que, embora tenham-se formado grupos detectáveis, classificados claramente pelas três redes,

o conteúdo dos agrupamentos não tem nenhum sentido técnico ou prático. Essa parece ser a

causa da alocação de dados com características conflitantes dentro dos agrupamentos e/ou dos

neurônios. Segue-se disso que, analisando o desempenho de classificação das três redes se-

gundo o índice de Carr, as três redes mostraram um alto índice de classificações conflituosas.

A rede RPCL teve o pior desempenho, apresentando classificações conflituosas

em 13 dos 21 neurônios ocupados, ou seja, houve erro de classificação em quase 62% dos

neurônios ativos na rede. A segunda pior classificação baseada nesses critérios foi a efetuada

pela rede FSCL, que apresentou conflitos em 9 dos 21 neurônios ocupados (cerca de 43%); e

finalmente WTA, com erro de classificação em 6 de 21 neurônios ocupados, quase 27% dos

neurônios.

Page 96: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

75

Pode-se observar então que as redes baseadas no princípio de classificação "o

vencedor leva tudo", estratégias puramente competitivas, não estabeleceu distinção entre ele-

mentos representantes de LAC, CEL, MGS, ATP e TLC; estes elementos foram distribuídos

indistintamente nos grupos formados pelas três redes. Por conseguinte, o critério de alocação

desses dados foi indeterminado, e nesse ponto de vista, ao definir IC (e FH) como critérios

naturais de classificação para esse universo de dados, a alocação indistinta dos representantes

das "famílias" denunciou uma grande falha de classificação feita por esses algoritmos denun-

ciada pela alocação conflitante de dados.

As três redes foram, portanto, ineficazes na classificação dos dados para as condi-

ções experimentais adotadas. Os erros de classificação observados podem estar ligados à ina-

dequação do tamanho da rede, portanto não significa que as redes WTA, RPCL e FSCL não

possam ser aplicadas para esse tipo de análise de agrupamento. Há poucos estudos comparati-

vos entre algoritmos competitivos não supervisionados na literatura especializada; para que

este estudo pudesse contribuir nesse sentido, os algoritmos foram implementados usando to-

dos os parâmetros em comum idênticos, como taxa de aprendizagem, número de épocas de

treinamento e número de neurônios na grade.

Não existe um método universal para escolha do número ótimo de neurônios e é

necessário avaliar as métricas possíveis para validar a capacidade de agrupamento de cada

algoritmo. Num estudo comparativo relativamente recente, foram utilizadas com sucesso o

critério de informação de Akaike e o critério do comprimento mínimo como métricas para

escolha do número ótimo de neurônios para redes WTA, RPCL e FSCL. Neste caso é perfei-

tamente possível a otimização das redes puramente competitivas para classificação de siste-

mas pulverulentos farmacêuticos (CRUZ, 2007).

Page 97: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

76

5.2.2 NG e SOM

Dentro da grande massa de dados apresentada aos algoritmos, tanto a rede SOM

como a NG foram capazes de distinguir dois grandes agrupamentos de dados com alto nível

de afinidade (Figura 34 A e B). Da análise de cada um dos objetos associados a cada neurô-

nio, representados pelos números dentro dos neurônios, podemos estabelecer que para ambas

as redes a identificação tomou por base, como parâmetros críticos relevantes, os conjuntos de

vetores vn=[ν5,8; ... ν34,8]T e [ν5,9; ... ν34,9]

T, onde os índices 8 e 9 correspondem aos atributos

IC e FH, determinando, portanto, o índice de Carr e o fator de Hausner como critérios de clas-

sificação automática adotada pela rede.

Figura 34: Matrizes-U tridimensionais e bidimensionais para as estratégias competitivo-cooperativas.

Fonte: Dados do trabalho

Page 98: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

77

A despeito da inexatidão inerente aos valores calculados para as propriedades IC e

FH devido à imprecisão de alguns de seus métodos de inferência, até hoje essas propriedades

são aceitas para a classificação de sistemas pulverulentos baseada no comportamento reológi-

co por serem bons descritores das propriedades a granel desses sistemas. Ao adotar um siste-

ma de rotulagem por código de cores para os atributos FH e IC foi possível inferir intuitiva-

mente o nível de correção da distribuição dos neurônios no grid pela simples verificação da

coerência de distribuição dos neurônios que agregam dados referentes a esses atributos.

Portanto é relevante destacar que o padrão de classificação por atributos IC e FH,

conforme se pode observar nos gráficos de planos de componentes (Figuras 36 e 39), torna

possível o reconhecimento das propriedades de fluxo de amostras pulverulentas por simples

inspeção visual, o que pode ser considerado vantajoso para uma classificação rápida de exci-

pientes quanto às suas propriedades de fluxo.

Baseando-nos nesses critérios, podemos avaliar que de modo geral a classificação

estabelecida pelas duas pode ser considerada bastante coerente, uma vez que os conjuntos

VC={ν6,8; ν10,8 ...ν19,8; ν29,8... ν31,8} e V’C={ν6,9; ν10,9 ...ν19,9; ν29,9... ν31,9} contêm apenas entradas

representantes da celulose e de suas misturas, enquanto os conjuntos VL={ν7,8; ν20,8 ...ν28,8;

ν32,8... ν34,8} e V’L={ν7,9; ν20,9 ...ν28,9; ν32,9... ν34,9} contêm apenas entradas relacionadas à lacto-

se e suas misturas associadas aos atributos IC e FH. V, e V' correspondem aos conjunto de

dados analisados pela rede SOM e pela rede NG, respectivamente.

Page 99: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

78

5.2.2.1 SELF-ORGANIZING MAP

Quanto ao desempenho de classificação da rede SOM pode-se observar uma regi-

ão de fronteira separando dois planos principais com alta densidade de dados, sugerindo a

existência de dois grandes clusters, visualizados como planos azul-intensos à direita e à es-

querda da matriz-U 3D da rede SOM (Figura 33A, topo). Numa inspeção mais detalhada da

matriz-U tridimensional, além da região de fronteira principal que estabelece os dois agrupa-

mentos maiores, a presença de mais duas regiões com baixa densidade de dados (picos) pode

indicar outras regiões de fronteira, sugerindo de uma classificação em três clusters, ou uma

divisão de um cluster maior em subclusters. Observa-se ainda que a distribuição dos objetos

sobre o mapa SOM foi bastante uniforme, com poucos neurônios inativos, significando que a

dimensão do mapa foi apropriada à representação do conjunto de dados de entrada.

Figura 35: Matriz-U 2D para as representações do algoritmo SOM. Os números dentro do neurônio

correspondem aos rótulos dos dados que foram associados por esse neurônio.

Fonte: Dados do trabalho

Em relação aos agrupamentos, a classificação feita pela rede SOM pode ser consi-

derada boa quando comparada às estratégias puramente competitivas porquanto a maioria dos

objetos, associados à lactose e celulose, foi corretamente agrupada nos dois clusters maiores.

Pode-se ainda observar através da matriz-U 2D (Figura 35) que dentro dos agrupamentos

principais há uma tendência de formação de subgrupos (subclusters), representados pelos

componentes EMG, adjacente ao grupamento CEL, e TLC juntamente com ATP, adjacente ao

grupo LAC.

Page 100: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

79

Entretanto ao assumir que a rede SOM teve sensibilidade para agrupar correta-

mente os conjuntos majoritários e reconhecer subgrupos adjacentes aos agrupamento maiores,

observa-se que a rede SOM apresentou um erro de classificação dos objetos das entradas 5, 8

e 9, uma vez que havia a expectativa da delimitação dos excipientes TLC, ATP e EMG (obje-

tos 5, 8 e 9, respectivamente) em clusters específicos ou em subclusters dentro dos clusters

maiores, em função da diferença de propriedades de fluxo naturalmente esperada entre eles.

Mais especificamente, ao inspecionar a matriz-U 2D, percebe-se uma separação

inesperada entre os atributos do EMG (rótulo 8) que deveriam ser alocados num mesmo neu-

rônio ou em neurônios adjacentes. Ainda mais anômala foi a separação entre os atributos do

TLC, onde parte dos dados foi associada a um neurônio que foi deslocado para formar outro

cluster menor, totalmente separado do conjunto ao qual naturalmente pertenceria, cluster esse

que foi formado a partir de uma dissociação também inesperada de alguns componentes do

grupo LAC.

Figura 36: Gráfico do plano de componentes do índice de Carr para a rede SOM. Vermelho: Excelen-

te; Verde: Bom; Azul, Aceitável; Rosa: Pobre; Amarelo: Muito pobre. Abaixo, à direita, a matriz-U

2D da rede.

Fonte: Dados do trabalho

Page 101: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

80

Analisando o gráfico do plano de componentes IC da rede SOM (Figura 36) nota-

se que embora não tenha ocorrido o erro grosseiro caracterizado pela alocação de entradas

com propriedades conflitantes num mesmo neurônio, como ocorreu nas classificações feitas

por WTA, FSCL e RPCL, a alocação das entradas de MGS, TLC e ATP não seguiu estrita-

mente o critério de classificação baseado em IC e FH, que foi o critério semântico adotado

pelas redes SOM e NG.

O cluster menor da rede SOM compreende os neurônios 3, 4 e 5, aos quais estão

relacionadas, respectivamente, as entradas {5}, {27}, {26, 33 e 34}. Se considerar-se que um

neurônio associado à ATP, apresentando valores de IC e FH classificados na categoria de

“pobre”, foi alocado num agrupamento de neurônios associados aos dados do grupo LAC,

cujos valores de IC pertencem às categorias “excelente” e “bom”, houve uma falha na classi-

ficação. É interessante notar ainda que neste cluster a rede SOM foi “cega” quanto à classifi-

cação no neurônio 4, tanto no atributo IC como FH.

ATP é um mineral cujos estudos para aplicação como excipiente farmacêutico é

relativamente recente e ainda não é empregado rotineiramente para esse fim. A origem, com-

posição e e propriedades da ATP, são similares às do TLC e tanto a rede NG como SOM clas-

sificaram os dois conjuntos de dados como pertencentes a um mesmo subcluster. Entretanto,

conforme já apontado, na rede SOM um dos neurônios associado a ATP ficou bastante deslo-

cado, denotando a dificuldade de a rede reconhecer a fronteira que distingue os objetos desse

subcluster dos demais objetos.

Semelhantemente, o posicionamento do objeto 8 (EMG) também sugere a exis-

tência de um subcluster, mas dessa vez adjacente ao grande cluster associado a CEL. Essa

alocação seguiu um critério de aproximação plausível, já que as redes SOM e NG associaram

nesse agrupamento neurônios cujos valores de IC estavam na faixa do “aceitável” ao “po-

bre”, que são numericamente próximos da classificação “muito pobre”, onde os neurônios

associados ao EMG estão classificados. Entretanto também há uma separação entre os neurô-

nios desse subcluster no SOM, que não seguiu a expectativa de justapor esses neurônios.

Uma análise detalhada indica que os erros de posicionamento dos neurônios de

EMG, TLC e ATP não estão relacionados à alocação errônea de dados com propriedades con-

flitantes, como no caso das classificações feitas pelas estratégias puramente competitivas. O

problema, nesse caso, está relacionado com a dificuldade de estabelecimento das regiões de

fronteira entre os subclusters e não no seu reconhecimento propriamente dito. Em parte esses

Page 102: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

81

erros de classificação podem ser atribuídos à rigidez na predeterminação das vizinhanças dos

neurônios que definem a atualização dos pesos sinápticos, especialmente nas vizinhanças em

torno do neurônio BMU na rede SOM (VILLMANN e CLAUSSEN, 2006).

O algoritmo SOM é talvez o mais bem sucedido algoritmo na quantização de ve-

tores, que é o principio básico da clusterização. O SOM projeta o espaço de dados M sobre a

estrutura de um mapa topográfico cujas unidades neurais estão definidas num arranjo fixo,

cuja topologia é definida a partir de certas relações previamente estabelecidas entre as vizi-

nhanças dos neurônios. O ajuste dos pesos do neurônio vencedor feito de forma concertada

com seus neurônios vizinhos dentro dos parâmetros de abrangência de vizinhança permite que

o mapa gerado (mapa de Kohonen) conserve a topologia desse espaço de entrada, M. Para que

essa redução dimensional alcance seu ótimo em termos de preservação das características do

espaço de entrada, é necessário que a topologia da rede seja ajustada com a topologia de M, o

que requer um conhecimento apriorístico dessa topologia. A fonte do erro de classificação

mostrado para as entradas 5 e 8 resultou da dificuldade da rede em obter a estrutura topológi-

ca correta de M possivelmente em função de características não explícitas desses subconjun-

tos, uma vez que é reconhecido o erro de classificação pelas redes SOM em algumas situações

em que os dados são composto por subconjuntos de dimensões efetivas diferentes ou disjuntos

e fraturados (MARTINETZ e SCHULTEN, 1991).

Uma análise detalhada dos dados numéricos aponta que os erros de classificação

do SOM também podem ser associados à dificuldade em reconhecer as fronteiras que distin-

guem os subclusters aos quais pertencem ATP e TLC, e entre EMG e os neurônios associados

ao grupo da celulose. Considerando a proximidade entre os pontos pertencentes a dois conjun-

tos de dados diferentes entre si, em relação a uma região de fronteira, se a métrica Euclidiana

produzir uma relação do tipo dBA = dBC, não é possível o algoritmo decidir com precisão se A

e C são mais semelhantes entre si do que B e C quando a relação de vizinhança é estabelecida

de forma rígida, como no caso da rede SOM (Figura 37).

A aplicação da métrica Euclidiana típica do SOM, associada a predeterminação

rígida das vizinhanças, acentuou a dificuldade de resolução dos subclusters associados à

EMG, TLC e ATP. A resolução desse defeito de classificação é claramente observada na uti-

lização da rede NG.

Page 103: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

82

Figura 37: Separação de dados de agrupamento próximos a uma linha de fronteira.

Fonte: Dados da pesquisa

Page 104: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

83

5.2.2.2 NEURAL GAS

Até o presente momento não foi encontrada nenhuma referência do emprego de

redes baseadas no algoritmo NG dentro da área farmacêutica. Este trabalho, portanto, é o pri-

meiro a descrever o uso e comparar o desempenho do algoritmo NG frente aos principais al-

goritmos usados em redes neurais não supervisionadas, inclusive em relação ao algoritmo que

lhe deu origem, o SOM.

O desempenho da rede NG pode ser considerado perfeitamente apropriado para

este conjunto de dados. A rede Neuras Gas reproduziu com o mais alto nível de fidelidade a

topologia dos dados apresentados no espaço de entrada. Semelhantemente à classificação feita

pela rede SOM há uma clara separação do conjunto em dois grandes agrupamentos de dados

de alta similaridade, representados pelos planos principais que correspondem aos agrupamen-

tos LCT e CEL. Entretanto, do ponto de vista comparativo, três regiões de fronteira foram

claramente definidas (Figura 34A, baixo) e com isso os planos ficaram mais bem distribuídos,

com os neurônios BMU 16 e 37 atuando como centros de massa do cluster LCT, enquanto

que os neurônios BMU 13 e 41 atuam como centros de massa do cluster CEL, tornando a

distribuição dos dados ainda mais uniforme do que na rede SOM. Essa boa distribuição suge-

riu à inspeção visual, a existência de possíveis subagrupamentos menores.

Figura 38: Matriz-U 2D para as representações do algoritmo NG. Os números dentro do neurônio correspondem

aos rótulos dos dados que foram associados por esse neurônio.

Fonte: Dados da pesquisa

Page 105: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

84

Na inspeção da matriz-U bidimensional (Figura 37) essa definição fica visualmen-

te mais clara. Pela disposição dos padrões de cores na grade neuronal infere-se intuitivamente

a existência de dois subagrupamentos menores adjacentes aos dois grandes agrupamentos

sugeridos pelos picos de fronteira menores ma matriz-U 3D:, um subgrupo MGS e outro

TLC/ATP, demonstrando que a rede NG encontrou a distribuição mais coerente entre todas as

redes não supervisionadas.

A análise do plano de componentes para o índice de Carr aponta que a classifica-

ção seguiu rigorosamente o critério baseado em IC e FH (Figura 38). Pela simples inspeção

visual é possível perceber que o critério semântico adotado pela rede segue um ordenamento

lógico facilmente perceptível, onde os neurônios associados as entradas com boas proprieda-

des de fluxo (vermelho e verde) e os neurônios associados a propriedades de fluxo inferiores

ficam separados em planos bem distintos.

Figura 39: Gráfico do plano de componentes do índice de Carr para a rede NG. Vermelho: Excelente;

Verde: Bom; Azul, Aceitável; Rosa: Pobre; Amarelo: Muito pobre. Abaixo, à direita, a matriz-U 2D

da rede.

Fonte: Dados da pesquisa

O mais notável é que os erros de classificação feitos pela rede SOM foram total-

mente corrigidos na rede NG. Os neurônios relacionados ao rótulo 8 foram corretamente jus-

Page 106: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

85

tapostos, formando um único subcluster ao lado do agrupamento CEL. Os dados referentes

aos objetos 5 e 9 foram associados a neurônios que ficaram alocados num mesmo subgrupo,

adotando uma representação topológica comum para os dois diferentes silicatos, TLC e ATP.

Em síntese, a rede NG classificou o conjunto de dados de entrada em quatro diferentes agru-

pamentos: os dois maiores representando os diluentes, LAC e CEL; um agrupamento repre-

sentando MGS; e um quarto agrupamento, representado os minerais ATP e TLC.

Conforme previamente discutido, a rede SOM pressupõe uma determinação pré-

via na distribuição neuronal das vizinhanças. Um dos objetivos do algoritmo NG quando foi

implementado seria contornar possíveis erros de vetorização veiculados por essa característica

do SOM. A estratégia usada para modificar o SOM consistiu em estruturar o algoritmo de tal

forma que as variações nos pesos sinápticos ∆wj, não fossem definidas pelo arranjo dos neu-

rônios dentro de uma rede com vizinhança pré estruturado, mas pelas distâncias relativas entre

os neurônios dentro do espaço de entrada, conforme a dedução à página 36, onde a regra de

adaptação pode ser considerada como a regra do vencedor leva mais ao invés de "o vence-

dor leva tudo" (MARTINETZ e SCHULTEN, 1991).

Cada item de dado é apresentado à rede à cada iteração, de tal forma que as rela-

ções topológicas entre os neurônios são instaladas durante o treinamento. Isto confere à rede

NG uma condição muito mais flexível para ajustes dos pesos de neurônios vizinhos, e essa

flexibilidade permitiu que a rede NG fosse mais sensível no reconhecimento das similaridades

entre os neurônios dos subclusters MGS, TLC e ATP, e também contornando o problema de

métrica encontrado pela rede SOM para o estabelecimento de uma região de fronteira apropri-

ada para a delimitação desses subclusters (SCHULTEN e MARTINETZ, 1991; VILLMANN

e CLAUSSEN, 2006).

Essa adequação perfeita da rede NG ao conjunto de dados ainda conferiu outra

vantagem adicional à Neural Gas: o sistema de rotulagem das categorias de propriedades por

cores permite verificar de uma forma direta e muito clara quais os excipientes ou misturas de

excipientes apresentavam características de fluxo apropriadas ou não. Essa característica mos-

trou que uma plataforma baseada numa rede NG tem potencial para emprego em softwares de

classificação de misturas de pós farmacêuticos baseados em propriedades de fluxo em catego-

rias que podem determinar se um sistema pulverulento pode estar apropriado, do ponto de

vista de fluxo, a determinadas exigências tecnológicas.

Page 107: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

86

6 CONCLUSÕES

No processo de desenvolvimento, a partir de quatro redes neurais protótipos de-

senvolvidas inicialmente, foi implementada uma RNA supervisionada MLP feedfoward com 8

neurônios de entrada, 16 neurônios escondidos e 1 neurônio de saída, usada para análise pre-

ditiva sobre três parâmetros reológicos, IC, FH e α. O aprendizado de rede e a capacidade

preditiva em relação a α foi deficiente, enquanto que em para a IC e FH a capacidade prediti-

va foi superior a 93%, credenciando esse dois parâmetros como bons descritores para a etapa

seguinte de desenvolvimento de uma RNA.

As performances de cinco algoritmos foi comparada quanto à capacidade de clas-

sificação de sistemas pulverulentos baseada em parâmetros reológicos. As redes neurais base-

adas no paradigma "o vencedor leva tudo", WTA, RPCL e FSCL, fizeram uma classificação

muito pobre e deficiente dos sistemas pulverulentos. Embora essas três redes tenham reconhe-

cido agrupamentos no espaço de entrada, todas as classificações apresentaram erros grossei-

ros, agrupando equivocadamente pós com propriedades díspares e conflitantes, e não foi pos-

sível estabelecer qual o critério de classificação automática adotado pelas redes. As redes,

portanto, não mostraram viabilidade prática para os sistemas estudados nessas condições, po-

rém não está descartada sua otimização a partir de ajustes de parâmetros que venham a favo-

recer o desempenho desses algoritmos.

As redes competitivo-cooperativas, distinguiram os grandes agrupamentos de da-

dos com alto nível de afinidade dentro da massa de dados apresentada e reproduziram com

bastante fidelidade o espaço de dados de entrada, comprovando uma elevada capacidade clas-

sificatória. Pôde-se inferir com clareza que CI e HR foram os critérios adotados pelas duas

redes para classificação automática dos dados.

A performance de classificação da rede SOM foi muito boa em comparação com

as redes puramente competitivas. A rede SOM reconheceu e classificou corretamente os da-

dos dos conjuntos LAC e CEL em agrupamento claramente separados, porém apresentou er-

ros de classificação dos dados de MGS, TLC e ATP, e foi incapaz de reconhecer estabelecer

com clareza as fronteiras para delimitar esses subclusters.

A rede NG apresentou uma capacidade excelente de classificação e de representa-

ção topológica dos dados de entrada, e sem apresentar os erros de classificação mostrados

Page 108: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

87

pela rede SOM. Os dados dos conjuntos LAC e CEL foram classificando com precisão em

dois grandes clusters claramente distintos entre si. Os dados de MGS, TLC e ATA foram alo-

cados corretamente em subclusters específicos, facilmente distinguíveis no sistema de classi-

ficação por cores adotados na matriz-U bidimensional, reproduzindo o espaço de entrada com

o nível máximo de fidelidade esperado.

A rede NG classificou a ATP, um mineral ainda em estudo quanto ao emprego

como excipiente farmacêutico, no mesmo subcluster ou categoria do TLC quanto às suas pro-

priedades reológicas, demonstrando sensibilidade suficiente para distinguir e identificar sis-

temas pulverulentos de características desconhecidas e eventualmente contaminantes, dentro

de um conjunto conhecido de pós ou sistemas pulverulentos. A rede Neural Gas, portanto,

mostrou-se promissora para o desenvolvimento de softwares para uso na classificação auto-

matizada de sistemas pulverulentos farmacêuticos.

A rotulagem por cores para as classes de atributos classificativos, CI e HR, por

sua vez, também provou ser um sistema simples e bastante intuitivo para classificação de sis-

temas pulverulentos quanto às propriedades de fluxo quando à categorização (bom, aceitável e

mau), tendo potencial para utilização em sistemas automáticos de classificação.

Este trabalho foi o primeiro na descrição do emprego de uma rede não supervisio-

nada baseada no algoritmo Neural Gas no desenvolvimento de produtos farmacêuticos. Com

ele foi possível avaliar o desempenho do algoritmo NG em comparação com os principais

algoritmos usados em redes neurais não supervisionadas.

Page 109: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

88

7 PERSPECTIVAS FUTURAS

Este trabalho foi pioneiro no Brasil a estudar o emprego de redes neurais artifici-

ais na área de farmacêutica e também foi o primeiro a empregar o algoritmo Neural Gas em

tecnologia de medicamentos. O pioneirismo tem seus ônus e bônus. Se por um lado existe a

dificuldade natural em desenvolver um trabalho sem referências próximas, do outro há a pos-

sibilidade de saltar na frente no desenvolvimento de know-how próprio capitaneado por nossa

base de pesquisa, nosso programa de pós-graduação, nossa Universidade.

Atualmente, de acordo com a tendência de desenvolvimento de estratégias de

QbD que incentivam a aplicação de técnicas modernas de modelagem de dados, nossa base de

pesquisa está fortemente motivada em desenvolver RNAs para utilização na pesquisa e pro-

dução de formas farmacêuticas.

Deste trabalho já estamos desenvolvendo o primeiro protótipo de um banco de

dados com informações experimentais a partir de trabalhos desenvolvidos por nossa base de

pesquisa. A estrutura desse banco de dados vai permitir a atualização contínua de informações

baseadas em dados experimentais, e sua expansão prevê a inserção de parâmetros espectros-

cópicos, termoanalíticos e micromeríticos criando a possibilidade de intercâmbio de dados

entre diferentes laboratórios filiados a esse sistema que pode ser implementado on-line.

A rede MLP apresentada neste trabalho está em desenvolvimento. No passo se-

guinte, dados espectroscópicos de infravermelho proximal (NIR) serão utilizados para o trei-

namento da rede a fim de torna-la apropriada para a modelagem de sistemas pulverulentos

farmacêuticos. Nossa fundamentação teórica e técnica estabelece que a espectroscopia NIR

permite inferir parâmetros micromeríticos (tamanho, distribuição e forma de partículas, por

exemplo), propriedades essas que determinam, juntamente com as propriedades elétricas de

superfície, o comportamento reológico de pós. Ao mesmo tempo o NIR fornece uma impres-

são digital de cada sistema pulverulento. Esses elementos fornecem a base para o desenvol-

vimento de um sistema de modelagem computacional baseado em redes neurais supervisiona-

das.

Numa outra frente, ao longo de nosso trabalho coletamos dados termogravimétri-

cos sobre os excipientes estudados neste trabalho. Coletamos também as curvas térmicas de

dois grupos de fármacos, tuberculostáticos e antipsicóticos já disponíveis para a alimentação

Page 110: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

89

do banco de dados. Juntamente com os espectros NIR, as curvas térmicas serão utilizadas no

desenvolvimento de redes supervisionadas para estudo de estabilidade de preparações sólidas.

O desenvolvimento das redes não supervisionadas estudadas neste trabalho está

em andamento em duas frentes no momento atual. Na primeira, estamos expandindo os estu-

dos de classificação de sistemas pulverulentos para desenvolver dispositivos não supervisio-

nados de classificação de pós para emprego mais abrangente no desenvolvimento de formas

farmacêuticas sólidas. Esses dispositivos poderão ser empregados na de seleção de fornecedo-

res de matérias primas e na otimização de misturas pulverulentas para compressão direta.

Numa segunda frente as redes não supervisionadas serão utilizadas em dispositi-

vos conjuntos com as redes MLP (sistemas ensemble). Neste caso as redes SOM e NG podem

ser utilizadas como filtros de classificação para modelagens mais complexas, envolvendo pa-

râmetros com propriedades antagônicas, como força de compressão e velocidade de dissolu-

ção.

Page 111: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

90

REFERÊNCIAS BIBLIOGRÁFICAS

AGATONOVIC-KUSTRIN, S.; MORTON, D. W.; SINGH, R. Hybrid Neural

Networks as Tools for Predicting the Phase Behavior of Colloidal Systems. Col-

loids and Surfaces A: Physicochemical and Engineering Aspects, n. 415, p. 59

- 67, 2012.

AGATONOVIC-KUSTRIN, S.; ZECEVIC, M.; ZIVANOVIC, L.; TUCKER, I.G.

Application of Artificial Neural Networks in HPLC Method Development. Jour-

nal of Pharmaceutical and Biomedical Analysis, v. 17, n.1, p. 69 - 76, 1998.

AGATONOVIC-KUSTRIN, S.; ZECEVIC, M.; ZIVANOVIC, L.; TUCKER, I.G.

Application Of Neural Networks For Response Surface Modeling in HPLC Opti-

mization. Analytica Chimica Acta, v. 364, n.3, p. 265 - 273, 1998.

AGHAJANI, M.; SHAHVERDI, A. R.; AMANI, A. The Use of Artificial Neural

Networks for Optimizing Polydispersity Index (PDI) in Nanoprecipitation Process

of Acetaminophen in Microfluidic Devices. AAPS Pharm. Sci. Tech., v. 13, n. 4,

p. 1293 - 1301, 2012.

AHALT, S. C.; FOWLER, J. E. Vector Quantization Using Artificial Neural Net-

work Models. Adaptive Methods and Emerging Techniques for Signal Pro-

cessing and Communications, p. 42 - 61, 1993.

AHALT, S. C.; KRISHNAMURTY, A. K.; CHEN, P.; MELTON, D. E. Competi-

tive Learning Algorithms for Vector Quantization. Neural Networks, v. 3, n. 3, p.

277 - 290, 1990.

AKSU, B.; AYDOĞAN, M.; KANIK, B.; AKSOY, E. A Flexible Regulatory Ap-

proach for Different Raw Materials Suppliers Using QbD Principles. Research

Journal of Pharmaceutical, Biological and Chemical Sciences, v. 4, n. 4, p.

358 - 372, 2013.

AKSU, B.; PARADKAR, A.; DE MATAS, M.; ÖZER, Ö.; GÜNERI, T.; YORK,

P. Quality by Design Approach: Application of Artificial Intelligence Techniques

Page 112: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

91

of Tablets Manufactured by Direct Compression. AAPS Pharm. Sci. Tech, v. 13,

n. 4, p. 1138 - 1146, 2012.

ALEXANDER, A. W.; CHAUDHURI, B.; FAQIH, A.; MUZZIO, F. J.; DAVIES,

C.; TOMASSONE, M. S. Avalanching Flow of Cohesive Powders. Powder Te-

chnology, v. 164, n. 1, p. 13 - 21, 2006.

ANSEL, H. C.; POPOVICH, N. G.; ALLEN JR., L. V. Farmacotécnica: Formas

Farmacêuticas e Sistemas de Liberação De Fármacos. 6. ed. São Paulo: Premier,

p. 568, 2000.

ANTZOULATOS, G. S.; IKONOMAKIS, E. K.; VRHATIS, M. N. Efficient Unsupervi-

sed Clustering Through Intelligent Optimization, in IASTED 2009, Artificial Intelligence

and Soft Computing (ASC 2009), 2009. disponível em

http://www.math.upatras.gr/~vrahatis/papers/volumes/AntzoulatosIV09_Artificial_Intellig

ence_and_Soft_Computing_MH_Hamza_ed_pp21-28_IASTED_ACTA_2009.pdf, aces-

sado em 20 de janeiro de 2014.

ARCOVERDE, G. F. B; ALMEIDA, C. M.; XIMENES, A. C; MAEDA, E. E;

ARAÚJO, L. S. Identificação de Áreas Prioritárias Para Recuperação Florestal

com o Uso de Rede Neural de Mapas Auto-Organizáveis. Boletim de Ciências.

Geodésicas, v. 17, n. 3, p. 379 - 400, 2011.

ARIF, M.; MALAGORE, I.; AFSAR, F. Automatic Detection and Localization of

Myocardial Infarction Using Back Propagation Neural Networks. IEEE: 4th In-

ternational Conference on Bioinformatics and Biomedical Engineering, p. 1 -

4, 2010.

ASHBY, W. R. Design for a brain: The Origin of Adaptive Behavior. 2. ed. New

York: John Wiley & Sons Inc., p. 286, 1960.

ASHBY, W.R. Principles of The Self-Organizing Dynamic System. Journal of

General Psychology, v. 37, p. 125 - 128, 1947.

AULTON, M. E. Delineamento de Formas Farmacêuticas, 2. ed. Porto Alegre:

Artmed, p. 677, 2005.

Page 113: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

92

BALAKIN, K. V.; SAVCHUK, N. P.; KISELYOV, A. Computer Algorithms for

Selecting Molecule Libraries for Synthesis. in: EKINS, S. ed. Computer Applica-

tions in Pharmaceutical Research and Development. New Jersey: John Wiley &

Sons, p. 361 - 375, 2006.

BALAKRISHNAN, P. V.; COOPER, M. C.; JACOB, V. S.; LEWIS, P. A. Com-

parative Performance of The FSCL Neural Net and K-Means Algorithm for Mar-

ket Segmentation. European Journal of Operational Research, v. 93, n. 2, p.

346 - 357, 1996.

BEZERRA, E. M.; BENTO, M. S.; ROCCO, J. A. F. F.; IHA, K.; LOURENÇO,

V. L.; PARDINI, L.C. Artificial Neural Network (ANN) Prediction of Kinetic Pa-

rameters of (CRFC) Composites. Computational Materials Science, v. 44, n.2, p.

656 - 663, 2008.

BISHOP, C. M. Pattern Recognition and Feed-Forward Networks. In WILSON, R.

A.; KEIL, F. C. ed. The MIT Encyclopedia of The Cognitive Sciences. Massachu-

setts: The MIT Press, p. 629 - 632, 1999.

BOURQUIN, J.; SCHMIDLI, H.; VAN HOOGEVEST, P.; LEUENBERGER, H.

Advantages of Artificial Neural Networks (ANNs) as Alternative Modeling Tech-

nique for Data Sets Showing Non-Linear Relationships Using Data From a

Galenical Study on a Solid Dosage Form. European Journal of Pharmaceutical

Sciences, v. 7, n. 1, p. 5 - 16, 1998.

BOURQUIN, J.; SCHMIDLI, H.; VAN HOOGEVEST, P.; LEUENBERGER, H.

Pitfalls of Artificial Neural Networks (ANN) Modeling Technique for Data Sets

Containing Outlier Measurements Using a Study on Mixture Properties of a Direct

Compressed Dosage Form. European Journal of Pharmaceutical Sciences, v. 7,

n. 1, p. 17 - 28, 1998.

BRYANT, C. H.; ROWE, R.C. Knowledge Discovery in Databases: Application

to Chromatography. Trends in Analytical Chemistry, v. 17, n. 1, p. 18 - 23,

1998.

Page 114: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

93

BUDURA, G.; BOTOCA, C.; MICLӐU, N., Competitive Learning Algorithms for

Data Clustering. The Scientific Journal Facta Universitatis (NIŠ), Series: Elec-

tronics and Energetics, v. 19, n. 2, p. 261 - 269, 2006.

CARPENTER, G. A.; GROSSBERG, S. A Massively Parallel Architecture for a

Self-Organizing Neural Pattern Recognition Machine. Computer Vision,

Graphics, and Image Processing, v. 37, p. 54 - 115, 1987.

CARR, R. L., Particle Behavior Storage And Flow. British Chemical Engineer-

ing, v. 15, n. 12, p. 1541 - 1549, 1970.

CONDELL, J.; WADE, J.; GALWAY, L.; MCBRIDE, M.; GORMLEY, P.;

BRENNAN, J.; SOMASUNDRAM, T. Problem Solving Techniques in Cognitive

Science. Artificial Intelligence Review, v. 34, n. 3, p. 221 - 234, 2010.

CONESA, J.A.; CABALLERO, J.A.; REYES-LABARTA, J.A. Artificial Neural

Network for Modeling Thermal Decompositions. Journal of Analytical and Ap-

plied Pyrolysis, v. 71, n.1, p. 343 - 352, 2004.

COSTA, J. A. F.; GONÇALVES, M. L.; NETTO, M. L. A. Visualização e Análise

de Agrupamentos Usando Redes Auto Organizáveis, Segmentação de Imagens e

Índices de Validação. Learning and Nonlinear Models (L&NLM) – Journal of

The Brazilian Neural Network Society, v. 9, n. 2, p. 91 - 103, 2011.

CRUZ, M. A. Avaliação de Redes Neurais Competitivas em Tarefas de Quantiza-

ção Vetorial: Um Estudo Comparativo. 2007. 119 f. Dissertação (Mestrado em Te-

leinformática) - Departamento de Engenharia de Teleinformática, Universidade

Federal do Ceará, Ceará. 2007.

DA SILVA, I. N.; SPATTI, D. H.; FLAUZINO, R. A. Redes Neurais Artificiais

Para Engenharia e Ciências Aplicadas – Curso Prático. São Paulo: Artliber

Editora, p. 399, 2010.

DANISMAN, K.; DALKIRAN, I.; CELEBI, F.V. Design of a High Precision

Temperature Measurement System Based on Artificial Neural Network for Differ-

ent Thermocouple Types. Measurement v. 39, n. 8, p. 695 - 700, 2006.

Page 115: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

94

DASGUPTA, D.; MICHALEWICZ, Z. Evolutionary Algorithms in Engineering

Applications. Berlin: Springer-Verlag, p. 561, 1997.

DAVIES, P. Oral Solid Dosage Form. In: Gibson, M. ed. Pharmaceutical

Preformulation And Formulation: A Practical Guide From Candidate Drug Selec-

tion to Commercial Dosage Form. Florida: CRC Press, 2004. cap. 11, p. 379 -

456.

EUROPEAN PHARMACOPOEA, 4 ed. Strasbourg: EDQM, 2002.

FAQIH, A.; CHAUDHURI, B.; ALEXANDER, A. W.; DAVIES, C.; MUZZIO,

F. J.; TOMASSONE, M. S. An Experimental/Computational Approach for Exam-

ining Unconfined Cohesive Powder Flow. International Journal of Pharmaceu-

tics v. 324, n. 2, p. 116 - 127, 2006.

FARLEY, B. G.; CLARK, W. A. Simulation of Self-Organizing Systems by Digi-

tal Computer. Transactions of IRE, v. 4, n. 4, p. 76 - 84, 1954.

FDA - GUIDANCE FOR INDUSTRY Q8 (R2) Pharmaceutical Development

2009. Disponível em

http://www.fda.gov/downloads/Drugs/.../Guidances/ucm073507.pdf. Acessado em

19/12/2013.

FRAWLEY, W. J.; PIATETSKY-SHAPIRO, G.; MATHEUS, C. J. Knowledge

Discovery in Databases: An Overview. AI Magazine v. 13 n. 3, p. 57 - 70, 1992.

GALANOPOULOS, A. S.; FOWLER J. E.; AHALT, S. C. Vector Quantization

Using Artificial Neural Network. Models Signal Processing in Telecommunica-

tions Information Technology: Transmission, Processing and Storage, p. 346 -

357, 1996.

GIBSON, M. Product Optimization. In: GIBSON, M. ed. Pharmaceutical

Preformulation and Formulation: A Practical Guide from Candidate Drug Selec-

tion to Commercial Dosage Form. Florida: CRC Press, p. 295 - 327, 2004.

Page 116: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

95

GIL, E. C.; CARABALLO, I.; BATAILLE, B. Tablet Design. In: GAD, S. C. ed.

Pharmaceutical Manufacturing Handbook: Production and Processes. North Caro-

lina: Willey-Interscience, p. 1008-1016, 2008.

GOHEL, M. C. A Review of Co-Processed Directly Compressible Excipients.

Journal of Pharmacy and Pharmaceutical Sciences, v. 8, n. 1, p. 76 - 93, 2005.

GOLDBERG, D. E. Genetic Algorithms In Search, Optimization, And Machine

Learning. Massachusetts: Addison – Wesley Publishing Company, p. 372, 1989.

GROSSBERG, S. How Does a Brain Build a Cognitive Code? Psychological Re-

view, v. 87, n. 1, p. 1 - 51, 1980.

GUYTON, A. C.; HALL, J. E. Tratado de Fisiologia Médica. 11. ed. Rio de Janei-

ro: Elsevier Editora Ltda, p. 1115, 2006.

HAGAN, M. T.; MENHAJ, M. B. Training Feedforward Networks With Mar-

quardt Algorithm. IEEE Transactions on Neural Networks, v. 5, n. 6, pp. 989 -

993, 1994.

HAYKIN, S. Neural Networks: A Comprehensive Foundation. 2. ed. Ontario:

Prentice Hall, p. 824, 1999.

HAYKIN, S., Redes Neurais: Princípios e Prática, 2. ed. Porto Alegre: Bookman

Companhia Editora, p. 902, 2001.

HINTON, G.; SEJNOWSKI, T. J. ed. Unsupervised Learning: Foundations of

Neural Computation. Cambridge: The MIT Press, p. 412, 1999.

HORGAN T. Connectionism and The Philosophical Foundations of Cognitive

Science. Metaphilosophy, v. 28, n. 1, p. 1 - 30, 1997.

JAGIELSKA, I.; MATTHEWS, C.; WHITFORT, T. An Investigation Into The

Application of Neural Networks, Fuzzy Logic, Genetic Algorithms, and Rough

Sets to Automated Knowledge Acquisition for Classification Problems.

Neurocomputing, v. 24, n.1, p. 37 - 54, 1999.

Page 117: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

96

JAIN, A. K.; DUBES, R. C. Algorithms for Clustering Data. New Jersey: Prentice

Hall, p. 320, 1988.

JAIN, A.K.; MURTY, M.N.; FLYNN, P.J. Data Clustering: A Review, ACM

Computing Surveys, v. 31, n. 3, p. 264 - 323, 1999.

JANG, J. S. R.; SUN, C. T.; MIZUTANI, E. Neuro-fuzzy and Soft Computing: A

Computational Approach to Learning and Machine Intelligence. New Jersey:

Prentice-Hall, p. 614, 1997.

JANSEN, M. A.; KIWATA J.; ARCEO J.; FAULL, K. F.; HANRAHAN, G.;

PORTER, E. Evolving Neural Network Optimization of Cholesteryl Ester Separa-

tion by Reversed-Phase HPLC. Analytical and Bioanalytical Chemistry, v. 397,

n. 6, p. 2367 - 2374, 2010.

JIGNESHKUMAR, P. Science of The Science, Drug Discovery and Artificial

Neural Networks. Current Drug Discovery Technologies, v. 10, n. 1, , p. 2 - 7,

2013.

KACHRIMANIS, K.; KARAMYAN, V.; MALAMATARIS, S. Artificial Neural

Networks (ANNs) and Modeling of Powder Flow. International Journal of

Pharmaceutics, v. 250, n. 1, p. 13 - 23, 2003.

KANAL, L. N. Perceptrons. In SMELSER, N.J.; BALTES, P.B., Editors. Interna-

tional Encyclopedia of The Social and Behavioral Sciences. Oxford: Elsevier, p.

11218 - 11221, 2001.

KANDIMALLA, K. K.; KANIKKANNAN N.; SINGH, M. Optimization of a Ve-

hicle Mixture for The Transdermal Delivery of Melatonin Using Artificial Neural

Networks and Response Surface Method. Journal of Controlled Release, v. 61,

n. 2, p. 71 - 82, 1999.

KENNEDY, J.; EBERHART, R. C. Swarm Intelligence. San Diego: Morgan

Kaufmann Publishers, p. 512, 2001.

Page 118: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

97

KLOS, J.; NOWICKI, P.; CIZMARIK, J. Thermal Parameters of Phenylcarbamic

Acid Derivatives Using Calculated Molecular Descriptors With MLR and ANN:

Quantitative Structure-Property Relationship Studies. Journal of Thermal Analy-

sis and Calorimetry, v. 91, n.1, p. 203 - 212, 2008.

KOHONEN, T. Self-Organized Formation of Topologically Correct Feature Map.

Biological Cybernetics, v. 43, p. 59 - 69, 1982.

KOHONEN, T. The Self-Organizing Map. Proceedings of the IEEE, v. 78, n. 9,

p. 1464 -1480, 1990.

KOTSIANTIS, S. B. ZAHARAKIS, I. D.; PINTELAS, P. E. Machine Learning: A

Review of Classification and Combining Techniques. Artificial Intelligence Re-

view, v. 26, n. 3, p. 159 – 190, 2006.

KRÖSE B.; VAN DER SMAGT, P. An Introduction to Neural Networks. 8. ed.

Amsterdam: The University of Amsterdam, 1996.

LAMOLHA, M. A.; SERRA, C. H. R.; Avaliação das Propriedades de Fluxo dos

Granulados e Dissolução de Comprimidos de Hidroclorotiazida 50 mg Obtidos por

Granulação Úmida. Brazilian Journal of Pharmaceutical Sciences, v. 43, n. 3, p.

435 - 446, 2007.

LANSNER, A. Associative Memory Models: From The Cell-Assembly Theory to

Biophysically Detailed Cortex Simulations. Trends in Neurosciences, v.32, n.3,

p. 178 - 186, 2009.

LARA, F. Artificial Neural Networks: An Introduction. Instrumentation and De-

velopment v. 3 n. 9, p. 5 - 10, 1998.

LEE, B. Pharmaceutical Preformulation: Physicochemical Properties of Excipients

and Powders and Tablet Characterization. In: GAD, S. C. ed. Pharmaceutical

Manufacturing Handbook: production and processes. North Carolina: Willey-

Interscience, p. 905 - 910, 2008.

Page 119: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

98

LEUENBERGER, H.; LANZ, M. Pharmaceutical Powder Technology — From

Art to Science: The Challenge of The FDA’s Process Analytical Technology Initi-

ative. Advanced Powder Technology, vol. 16, n. 1, p. 3 - 25, 2005.

MA, J.; CAO, B. The Mahalanobis Distance Based Rival-Penalize Competitive

Learning Algorithm. In WANG, J.; YI, Z.; ZURADA, J. M.; LU, B.; YIN, H. Ad-

vances in Neural Networks. Berlin-Heilderberg: Springer-Verlag, p. 442 - 447,

2006.

MAASS, W. On The Computational Power Of Winner-Take-All. Electronic Col-

loquium on Computational Complexity (ECCC), n. 32, p. 1 - 19, 2000.

MACLEOD, C.; CAPANNI, N. F. Artificial Biochemical Networks: A Different

Connectionist Paradigm. Artificial Intelligence Review, v. 33, n. 2, p. 123 - 134,

2010.

MACQUEEN, J. Some Methods for Classification and Analysis of Multivariate

Observations. Proceedings of the Fifth Berkeley Symposium on Mathmatical

Statistics and Probability, University of California Press, v. 1, p. 281 - 297,

1967.

MALONE, J.; MCGARRY, K.; WERMTER, S.; BOWERMAN, C. Data Mining

Using Rule Extraction from Kohonen Self-Organizing Maps. Neural Computing

& Applications, v. 15, n. 1, p. 9 - 17, 2006.

MANALLACK, D. T.; LIVINGSTONE, D. J. Neural Networks in Drug Discov-

ery: Have They Lived Up to Their Promise? European Journal of Medicinal

Chemistry, n. 34, p. 195 - 208, 1999.

MARTIN, A. Physical Pharmacy: Physical Chemical Principles in the Pharmaceu-

tical Sciences, 4 ed. Maryland: Williams & Wilkins, p. 622, 1993.

MARTINETZ, T. M.; BERKOVICH, S. G.; SCHULTEN, K. J. “Neural Gas”

Network for Vector Quantization and Its Application to Time-Series Prediction.

IEEE Transactions on Neural Networks, v. 4, n. 4, p. 558 - 569, 1993.

Page 120: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

99

MARTINETZ, T.; SCHULTEN, K. A "Neural Gas" Network Learns Topolo-

gies. In KOHONEN, T.; MÄKISARA, K.; SIMULA, O.; KANGAS, J. Editors,

Artificial Neural Networks. Amsterdam: Elsevier, p. 397 - 402, 1991.

MATEO, J.; RIETA, J. J. Radial Basis Function Neural Networks Applied to Effi-

cient QRST Cancellation in Atrial Fibrillation. Computers in Biology and Medi-

cine, v.43, n. 2, p. 154 - 163, 2013.

MATERO, S.; VAN DEN BERG, F.; POUTIIANEN, S.; RANTANEN, J.;

PAJANDER, J. Towards Better Process Understanding: Chemometrics and Multi-

variate Measurements in Manufacturing of Solid Dosage Forms. Journal of

Pharmaceutical Sciences, v. 102, n. 5, p. 1385 - 1403, 2013.

McCULLOCH, W. S.; PITTS, W. A Logical Calculus of The Ideas Immanent in

Nervous Activity. Bulletin of Mathematical Biology, v. 5, n. 4, p. 115 - 133,

1943.

MEHROTRA, K.; MOHAN, C. K.; RANKA, S. Elements of Artificial Neural

Networks. Cambridge: The MIT Press, p. 329, 1996.

MENDYK, A.; JACHOWICZ, R. Neural Network as a Decision Support System

in The Development of Pharmaceutical Formulation - Focus on Solid Dispersions.

Expert Systems with Applications, v. 28, n. 2, p. 285 - 294, 2005.

MENDYK, A.; JACHOWICZ, R. Unified Methodology of Neural Analysis in De-

cision Support Systems Built for Pharmaceutical Technology. Expert Systems

with Applications, v. 32, n. 4, p. 1124 - 1131, 2007.

MENDYK, A.; KLEINEBUDDE, P.; THOMMES, M.; YOO, A.; SZLĘK, J.;

JACHOWICZ, R. Analysis of Pellet Properties With Use of Artificial Neural Net-

works. European Journal of Pharmaceutical Sciences, v. 41, n. 3, p. 421 - 429,

2010.

MICHALEWICZ, Z. Genetic Algorithms + Data Structures = Evolution Programs.

3. ed. Berlin: Springer-Verlag, p. 387, 1999.

Page 121: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

100

MILLER, G. A. The Cognitive Revolution: A Historical Perspective. Trends in

Cognitive Sciences, v. 7, n. 3, 141 - 144, 2003.

MINSKY M., PAPERT S. Perceptrons. Cambridge: The MIT Press, 1969.

MITCHELL, M. Complex Systems: Network Thinking. Artificial Intelligence, n.

170, p. 1194 - 1212, 2006.

MOTA, M.; ZIMMER, M. C. Cognição e Aprendizagem de L2: O Que Nos Diz A

Pesquisa Nos Paradigmas Simbólico E Conexionista. Revista Brasileira de Lin-

guística Aplicada, v. 5, n. 2, p. 155 - 187, 2005.

OSTER, M.; DOUGLAS, R. LIU, S. C. Computation With Spikes in a Winner-

Take-All Network, Neural Computation, v. 21, n. 9, p. 2437 - 2465, 2009.

PATRA, J. C.; CHUA, B. H. Artificial Neural Network-Based Drug Design for

Diabetes Mellitus Using Flavonoids. Journal of Computational Chemistry, v.

32, n. 4, p. 555 - 567, 2010.

PAVLIDIS, N. G.; PLAGIANAKOS, V. P.; TASOULIS, D. K.; VRAHATIS, M.

N. Financial Forecasting Through Unsupervised Clustering and Neural Networks.

Operations Research - An International Journal, v. 6, n. 2, p. 103 - 127, 2006.

PEDRYCZ, W.; GOMIDE, F. Fuzzy System Engineering – Toward Human-

Centric Computing. New Jersey: IEEE Press – John Wiley &Sons, p. 526, 2007.

PLUMB, A. P.; ROWE, R. C.; YORK, P.; BROWN, M. Optimization of The Pre-

dictive Ability of Artificial Neural Network (ANN) Models: A Comparison of

Three ANN Programs and Four Classes of Training Algorithm. European Jour-

nal of Pharmaceutical Sciences, v. 25, n. 4, p. 395 - 405, 2005.

PLUMB, A. P.; ROWE, R. C.; YORK, P.; DOHERTY, C. The Effect of Experi-

mental Design on The Modeling of a Tablet Coating Formulation Using Artificial

Neural Networks. European Journal of Pharmaceutical Sciences, v. 16, n. 4, p.

281 - 288, 2002.

Page 122: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

101

POERSCH, J. M. Simulações Conexionistas: A Inteligência Artificial Moderna.

Linguagem em (Dis)curso, v. 4, n. 2, p. 441 - 458, 2004.

POOLE, D.; MACKWORTH, A.; GOEBEL, R. Computational Intelligence: A

Logical Approach. New York: Oxford University Press, p. 558, 1998.

PRISTA, L. N.; ALVES, A. C.; MORGADO, R. Tecnologia Farmacêutica, 5. ed.

Lisboa: Calouste Gulbenkian, 1995.

QIN, A. K.; SUNGANTHAN, P. N. Robust Growing Neural Gas Algorithm With

Application in Cluster Analysis. Neural Networks, v. 17, n. 8 - 9, p. 1135 - 1148,

2004.

QIN, Y.; DENG, H.; YAN, H.; ZHONG, R. An Accurate Nonlinear QSAR Model

for The Antitumor Activities of Chloroethylnitrosoureas Using Neural Networks.

Journal of Molecular Graphics and Modelling, n. 29, p. 826 - 833, 2011.

RAFIEE, A., MASOUMI, H., ROOSTA, A. Using Neural Network For Liver De-

tection in Abdominal MRI Images. IEEE International Conference on Signal

and Image Processing Applications (ICSIPA), p. 21 - 26, 2009.

RAUBER, A., The Growing Hierarchical Self-Organizing Map: Exploratory

Analysis Of High-Dimensional Data. IEEE Transactions on Neural Networks,

v. 13, n. 6, p.1331 - 1341, 2002.

RITTER, H.; KOHONEN, T. Self-Organizing Semantic Maps. Biological Cyber-

netics, v. 61, n. 4, p. 241 - 254, 1989.

ROCHA, M.; CORTEZ, P.; NEVES, J. Evolution of Neural Networks for Classi-

fication and Regression. Neurocomputing, v. 70, n. 16, p. 2809 - 2816, 2007.

ROCHESTER, N.; HOLLAND, J.H.; HABIT, L.H.; DUDA, W.L. Tests on a Cell

Assembly Theory of The Action of The Brain, Using a Large Digital Comput-

er. IRE Transactions on Information Theory, v. 2, n. 3, p. 80 - 93, 1956.

Page 123: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

102

ROSENBLATT, F. The Perceptron: A Probabilistic Model For Information Stor-

age And Organization In The Brain. Psychological Review, v. 65, n. 6, p. 386 -

408, 1958.

ROWE, R. C.; COLBOURN, E. A. Computers in Pharmaceutical Formulation. In:

EKINS, S. ed.. Computer Applications in Pharmaceutical Research And Develop-

ment. New Jersey: John Willey & Sons, p. 817, 2006.

ROWE, R. C.; ROBERTS, R. J. Artificial Intelligence in Pharmaceutical Product

Formulation: Neural Computing and Emerging Technologies. Pharmaceutical

Science and Technology Today v. 1, n. 5, p. 200 - 205, 1998.

ROWE, R. C.; SHESKEY, P. J.; QUINN, M. E. ed. Handbook of Pharmaceutical

Excipients. 6. ed. London: Pharmaceutical Press, p. 888, 2009.

ROY, S. Quality by Design: A Holistic Concept of Building Quality in Pharma-

ceuticals. International Journal of Pharmaceutical and Biomedical Research,

v. 3, n. 2, p. 100 - 108, 2012.

RUMELHART, D. E.; HINTON, G. E.; WILLIAMS, R.G. Learning Internal Rep-

resentations By Error Propagation. In: RUMELHART, D. E.; MCLELAND, J. L.

PDP Research Group, Parallel Distributed Processing Vol.1 – Explorations in The

Microstructure of Cognition: Foundations. Cambridge: The MIT Press, p. 318 -

392, 1986.

RUMELHART, D. E.; ZIPSER, D. Feature Discovery by Competitive Learning.

In: RUMELHART, D. E.; McLELAND, J. L., PDP Research Group, Parallel Dis-

tributed Processing Vol.1 – Explorations in The Microestructure of Cognition:

Foundations. The MIT Press, Cambridge, p. 151-193, 1986.

RUSSELL, S. J.; NORVIG, P. Artificial Intelligence: A Modern Approach, 2. ed.

New Jersey: Prentice Hall, p. 1035, 2003.

Page 124: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

103

SHAO, Q.; ROWE, R. C.; YORK, P. Comparison of Neurofuzzy Logic and Neu-

ral Networks in Modeling Experimental Data of an Immediate Release Tablet

Formulation. European Journal of Pharmaceutical Sciences, v. 28, n. 5, p. 394 -

404, 2006.

SHARKEY, N.; SHARKEY, A. Artificial Intelligence and Natural Magic. Artifi-

cial Intelligence Review, v. 25, n. 1, p. 9 - 19, 2006.

SHEPHERD, G. M. The Synaptic Organization Of The Brain. 3. ed. New York:

Oxford University Press, p. 719, 1990.

SMOLAR, P.; SINCAK, P.; JAKSA, R. Application of IA in Cardiology. IEEE

8th International Symposium on Applied Machine Intelligence and Informat-

ics, p. 267 - 270, 2010.

SOFTWARE de livre acesso <http://www.cis.hut.fi/somtoolbox>. Acessado em 20

de agosto de 2013.

SPECTOR, L. Evolution of Artificial Intelligence. Artificial Intelligence, v. 170,

n. 18, p. 1251 - 1253, 2006.

STANIFORTH, J. Powder Flow. In: AULTON, M. E. ed. Pharmaceutics: The Sci-

ence of Dosage Form Design. Edinburg: Churchill Livingstone, p. 197 - 210,

2002.

SUN, Y.; PENG, Y.; CHEN, Y.; SHUKLA, A. J. Application of Artificial Neural

Networks in The Design of Controlled Release Drug Delivery Systems. Advanced

Drug Delivery Reviews, v. 55, n. 9, p. 1201 - 1215, 2003.

SUTTON, R. S.; BARTO, A. G. Reinforcement Learning: An Introduction. Cam-

bridge: The MIT Press, p. 322, 1998.

TAKAYAMA, K.; FUJIKAWA, M.; OBATA, Y.; MORISHITA, M. Neural Net-

work Based Optimization of Drug Formulations. Advanced Drug Delivery Re-

views, v. 55, n. 9, p. 1217 - 1231, 2003.

Page 125: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

104

TAKAYAMA, K.; MORVA, A.; FUJIKAWA, M.; HATTORI, Y.; OBATA, Y.;

NAGIA, T. Formula Optimization of Theophylline Controlled-Release Tablet

Based on Artificial Neural Networks. Journal of Controlled Release, v. 68, n. 2,

p. 175 - 186, 2000.

TAN, S. B.; NEWTON, J. M. Powder Flowability as an Indication of Capsule Fill-

ing Performance. International Journal of Pharmaceutics, v. 61, p. 145 - 155,

1990.

TASKINEN, J; YLIRUUSI J. Prediction of Physicochemical Properties Based on

Neural Network Modeling. Advanced Drug Delivery Reviews, v. 55, n. 9, p.

1163 - 1183, 2003.

THE PARMACEUTICAL CODEX, 12 ed. London: The Pharmaceutical Press,

1994.

ULTSCH, A. Self-Organizing Neural Networks Perform Different from Statistical

K-Means Clustering. In: Annual Conference of the German Classification Soci-

ety, n. 19, p. 1 - 13, 1996.

ULTSCH, A. U-Matrix: a Tool to Visualize Clusters in High Dimensional Data.

Technical Report 36. CS Department, Philipps-University Marburg, 2004.

ULTSCH, A.; SIEMON, H. P. Kohonen's Self-Organizing Feature Maps for Ex-

ploratory Data Analysis. Proceedings of International Neural Networks Con-

ference (INNC), p. 305 - 308, 1990.

USP 31. The United States Pharmacopoeia National Formulary, 31. ed. Rockville:

United States Pharmacopoeial Convention, INC, 2008.

VAN KAMPEN, A. H. C.; RAMADAN, Z.; MULHOLLAND, M.; HIBBERT, D.

B.;. BUYDENS, L. M. C. Learning Classification Rules From an Ion Chromatog-

raphy Database Using a Genetic Based Classifier System. Analytica Chimica

Acta, v. 344, n. 1, p. 1 - 15, 1997.

VAPNIK, V. N. Statistical Learning Theory. New York: John Wiley & Sons, p.

768, 1998.

Page 126: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

105

VIATHIYALINGAM, S.; KHAN, M. A. Optimization and Characterization of

Controlled Release Multi-Particulate Beads Formulated With a Customized Cellu-

lose Acetate Butyrate Dispersion. International Journal of Pharmaceutics, v.

234, n. 2, p. 179 - 193, 2002.

VILLMANN, T.; CLAUSSEN, J. C. Magnification Control in Self-Organizing

Maps and Neural Gas. Neural Computation, n. 18, p. 446 - 469, 2006.

WANG, X.; CUI, F.; YONEZAWA, Y.; SUNADA, H. Preparation and Evaluation

Of Combination Tablet Containing Incompatible Active Ingredients. Chemical

and Pharmaceutical Bulletin, v. 51, n. 7, p. 772 - 778, 2003.

WEBB, R.; DOBLE, P.; DAWSON, M. Optimization of HPLC Gradient Separa-

tions Using Artificial Neural Networks (ANNs): Application To Benzodiazepines

in Post-Mortem Samples. Journal of Chromatography B, v. 877, n. 7, p. 615 -

620, 2009.

WERBOS, P. J. Beyond Regression: New Tools for Prediction and Analysis in

The Behavioral Sciences. PhD Thesis, Harvard University, Cambridge, Massa-

chusetts, 1974.

WESOLOWSKI, M.; SUCHACZ, B. Artificial Neural Networks: Theoretical

Background and Pharmaceutical Applications: A Review. Journal of AOAC In-

ternational, v. 95, n. 3, p. 652 - 668, 2012.

WIDROW, B.; HOFF, M.E. Adaptive Switching Circuits. Proceedings of IRE

Wescon Convention Record, p. 96 - 104, 1960.

XU, L.; KRZYZAK, A.; OJA, E., Rival Penalized Competitive Learning For Clus-

tering Analysis, RBF Net, and Curve Detection. IEEE Transactions on Neural

Networks, v. 4, n. 4, p. 636 - 649, 1993.

YAMASHITA, F.; HASHIDA, M. Mechanistic and Empirical Modeling of Skin

Permeation of Drugs. Advanced Drug Delivery Reviews, v. 55, n. 9 1185 - 1199,

2003.

Page 127: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

106

YAN, H; JIANG, Y.; ZHENG, J.; PENG, C.; LI, Q. A Multilayer Perceptron-

Based Medical Decision Support System for Heart Disease Diagnosis. Expert

Systems with Applications, v. 30, n. 2, pp. 272 - 281, 2006.

YASNITSKY, L.; DUMLER, A.; BOGDANOV, K.; POLESCHUK, A.;

CHEREPANOV, F.; MAKURINA, T; CHUGAYNOV, S. Diagnosis and Progno-

sis of Cardiovascular Diseases on The Basis of Neural Networks. Biomedical En-

gineering, v. 47, n. 3, p. 160 - 163, 2013.

ZADEH, L. A. Fuzzy Logic, Neural Networks, and Soft Computing. Communica-

tions of the ACM, vol. 37, n. 3, p. 77 - 84, 1994.

Page 128: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

107

APÊNDICE A - Tabela contendo o conjunto completo dos dados experimentais da aná-lise micromerítica (dataset).

LABEL/ SAMPLE Massa/g-1 V0/mL V10/mL V500/mL V1250/mL DB DC IC FH

5 – ATP 30,0004 54,0 51,5 36,5 35,5 0, 582532 0, 821929 29, 12621 1, 410959

30,0004 53,0 50,5 37,0 36,5 0, 594067 0, 810822 26, 73267 1, 364865

29,9998 53,0 49,5 36,0 35,0 0, 606057 0, 833328 27, 27273 1, 375000

6 – CEL 30,0000 96,0 87,0 65,0 65,0 0, 344828 0, 461538 25, 28736 1, 338462

30,0002 96,0 86,0 65,0 64,0 0, 34884 0, 461542 24, 4186 1, 323077

29,9999 93,5 85,0 65,0 64,0 0, 35294 0, 461537 23, 52941 1, 307692

7 – LAC 30,0002 44,0 41,0 37,0 37,0 0, 731712195 0, 810816 9, 756098 1, 108108

30,0003 45,0 42,0 37,5 37,5 0, 714292857 0, 800008 10, 71429 1, 12

30,0001 45,0 41,5 38,0 38,0 0, 722893976 0, 789476 8, 433735 1, 092105

8 – MGS 30,0002 130 122 100 86 0, 245903 0, 405408 39, 34426 1, 648649

30,0004 129 123 98 85 0, 243906 0, 405411 39, 8374 1, 662162

29,9997 130 122 98 84 0, 245899 0, 410955 40, 16393 1, 671233

9 – TLC 30,0003 60,0 54,0 32,0 31,0 0, 555561 0, 937509 40, 74074 1, 6875

29,9999 61,0 54,5 32,0 31,0 0, 550457 0, 937497 41, 2844 1, 703125

30,0000 59,0 54,0 32,0 31,0 0, 555556 0, 9375 40, 74074 1, 6875

10 - M101 30,0001 100 85 66 65 0,35294 0,45455 22,35 1,287896

30,0001 100 85,5 66,5 64,75 0,35088 0,45113 22,22 1,28571

30,0001 100 84 66,5 65,5 0,35714 0,45113 20,83 1,263174

11 - CEL/ATP

99/1

30,0002 89,0 82,0 63,5 63,0 0, 365856 0, 472444 22, 56098 1, 291339

30,0003 89,0 81,5 63,5 63,0 0, 368102 0, 472446 22, 08589 1, 283465

30,0003 89,0 81,5 63,5 63,0 0, 368102 0, 472446 22, 08589 1, 283465

12 - CEL/ATP

98,5/1,5

30,0001 91,0 83,0 63,5 62,0 0, 361447 0, 472443 23, 49398 1, 307087

30,0004 89,0 81,0 62,5 62,0 0, 370375 0, 480006 22, 83951 1, 296

29,9997 86,0 80,0 63,0 61,5 0, 374996 0, 476186 21, 25 1, 269841

13 - CEL/ATP

98/2

30, 0003 90,0 82,5 62,5 61,5 0, 36364 0, 480005 24, 24242 1,32

30, 0000 90,0 81,5 62,5 61,5 0, 368098 0,48 23, 31288 1, 304

29, 9997 88,0 81 62 61 0, 370367 0, 483866 23, 45679 1, 306452

14 - CEL/TLC

99/1

30, 0002 100 90 67,5 66,5 0, 333336 0, 444447 25 1, 333333

29, 9999 99 89 67 66 0, 337078 0, 44776 24, 7191 1, 328358

30, 0004 100 90 67 65,5 0, 333338 0, 447767 25, 55556 1, 343284

15 - CEL/TLC

98,5/1,5

29, 9999 100 87 66,5 65,5 0,344826 0,451126 23,56322 1,308271

30,0000 100 87,5 66,5 66,5 0,342857 0,451128 24 1,315789

30,0000 98 87 66 65,5 0,344828 0,454545 24,13793 1,318182

16 - CEL/TLC

98/2

29,9999 100 90 66,5 65,5 0,333332 0,451126 26,11111 1,353383

30,0003 99 88,5 66 65,5 0,338986 0,45455 25,42373 1,340909

Page 129: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

108

30,0001 99 89 66,5 65,5 0,33708 0,451129 25,2809 1,338346

17 - CEL/MGS

99/1

30,0004 95 84 64,5 63 0,357148 0,465122 23,21429 1,302326

30,0000 94 84 64,5 63,5 0,357143 0,465116 23,21429 1,302326

30,0004 93 85 65 64 0,352946 0,461545 23,52941 1,307692

18 - CEL/MGS

98,5/1,5

29,9999 91 82 62 61 0,365852 0,483869 24,39024 1,322581

29,9998 91 84 62 61 0,35714 0,483868 26,19048 1,354839

29,9999 91 83 61 60 0,361445 0,491802 26,50602 1,360656

19 - CEL/MGS

98/2

30,0002 91 83 61 60 0,361448 0,491807 26,50602 1,360656

29,9998 90 81 60,5 60 0,370368 0,495864 25,30864 1,338843

29,9999 89 80 60,5 60 0,374999 0,495866 24,375 1,322314

20 - LAC/TLC

99/1

30,0000 44 40,5 37 36 0,740741 0,810811 8,641975 1,094595

30,0004 43,5 40 37 36 0,75001 0,810822 7,5 1,081081

30,0000 43 40 36,5 36 0,75 0,821918 8,75 1,09589

21 - LAC/TLC

98,5/1,5

30,0004 42 40 36 36 0,75001 0,833344 10 1,111111

30,0000 43 40,5 36,5 36 0,740741 0,821918 9,876543 1,109589

30,0001 42 40 36 36 0,750003 0,833336 10 1,111111

22 - LAC/TLC

98/2

30,0000 45 40 36,5 36 0,75 0,821918 8,75 1,09589

30,0000 44 40,5 36,5 36 0,740741 0,821918 9,876543 1,109589

30,0004 43 40 37 36,5 0,75001 0,810822 7,5 1,081081

23 - LAC/MGS

99/1

30,0001 40,5 37,5 35,5 35 0,800003 0,845073 5,333333 1,056338

29,9998 40 37 35,5 35 0,810805 0,845065 4,054054 1,042254

29,9997 40 37 35,5 35 0,810803 0,845062 4,054054 1,042254

24 - LAC/MGS

98,5/1,5

30,0002 40 37 35,5 35 0,810816 0,845076 4,054054 1,042254

29,9999 40 37 35 35 0,810808 0,85714 5,405405 1,057143

30,0003 41 37 35 35 0,810819 0,857151 5,405405 1,057143

25 - LAC/MGS

98/2

30,0000 39 37,5 36 35 0,8 0,833333 4 1,041667

29,9997 40 37,5 35,5 35 0,799992 0,845062 5,333333 1,056338

29,9999 40 37 35,5 35 0,810808 0,845068 4,054054 1,042254

26 - LAC/AER

99/1

30,0002 46 42,5 39,5 39 0,705887 0,759499 7,058824 1,075949

30,0000 45 43 39,5 39,5 0,697674 0,759494 8,139535 1,088608

29,9999 45 43 39,5 39,5 0,697672 0,759491 8,139535 1,088608

27 - LAC/AER

98,5/1,5

30,0001 50,5 44,5 40 39,5 0,67416 0,750003 10,11236 1,1125

30,0004 49,5 44,5 39 39 0,674166 0,769241 12,35955 1,141026

29,9998 49,5 44,5 39 39 0,674153 0,769226 12,35955 1,141026

28 - LAC/AER

98/2

30,0001 52 47 40,5 40 0,6383 0,740743 13,82979 1,160494

30,0003 50 46 40 39,5 0,65218 0,750008 13,04348 1,15

30,0003 51 46,5 40 39,5 0,645168 0,750008 13,97849 1,1625

29 - CEL/AER

99/1

29,9998 87 79 62,5 61,5 0,379744 0,479997 20,88608 1,264

30,0004 87 80,5 62,5 61,5 0,372676 0,480006 22,36025 1,288

Page 130: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE … · Ao meu orientador, Professor Doutor Túlio Flávio Accioly de Lima e Moura pela confiança em quem quase ninguém mais acreditava;

109

30,0004 87 80 62,5 61,5 0,375005 0,480006 21,875 1,28

30 - CEL/AER

98,5/1,5

30,0002 87,5 81 63,5 62,5 0,370373 0,472444 21,60494 1,275591

30,0002 87,5 81 63 62 0,370373 0,476194 22,22222 1,285714

29,9999 87 81,5 62,5 62 0,368097 0,479998 23,31288 1,304

31 - CEL/AER

98/2

30,0003 93 86 65,5 64,5 0,348841 0,45802 23,83721 1,312977

30,0004 94 86 65,5 64,5 0,348842 0,458021 23,83721 1,312977

30 93 86 65,5 64,5 0,348837 0,458015 23,83721 1,312977

32 - LAC/ATP

99/1

30,0002 44 40,5 37,5 36,5 0,740746 0,800005 7,407407 1,08

30 43 40 37 37,5 0,75 0,810811 7,5 1,081081

30 44 40,5 37 37 0,740741 0,810811 8,641975 1,094595

33 - LAC/ATP

98,5/1,5

30,0004 46,5 41 37 36,5 0,731717 0,810822 9,756098 1,108108

30 44 40 36,5 36,5 0,75 0,821918 8,75 1,09589

29,9999 45,5 41 37,5 37,5 0,731705 0,799997 8,536585 1,093333

34 - LAC/ATP

98/2

29,9998 43 41 37 37 0,731702 0,810805 9,756098 1,108108

30 43,5 41 36,5 36,5 0,731707 0,821918 10,97561 1,123288

30,0001 43 40,5 37 37 0,740743 0,810814 8,641975 1,094595