vitor daniel de viterbo desenvolvimento de redes neurais ... · universidade federal de minas...
Post on 29-Oct-2020
0 Views
Preview:
TRANSCRIPT
Universidade Federal de Minas Gerais
Instituto de Ciências Exatas
Departamento de Química
Vitor Daniel de Viterbo
Desenvolvimento de redes neurais artificiais quânticas
com aplicações em Química
Belo Horizonte
2014
Universidade Federal de Minas Gerais
Instituto de Ciências Exatas
Departamento de Química
Vitor Daniel de Viterbo
Orientador: João Pedro Braga
Coorientadora: Rita de Cássia Oliveira Sebastião
Desenvolvimento de redes neurais artificiais quânticas
com aplicações em Química
Belo Horizonte
2014
UFMG/ICEx/DQ. 1018a
T. 464
Vitor Daniel de Viterbo
Desenvolvimento de redes neurais artificiais quânticas
com aplicações em Química
Tese apresentada ao Departamento de Química
do Instituto de Ciências Exatas da Universidade
Federal de Minas Gerais como requisito parcial
para obtenção do grau de Doutor em Ciências-
Química.
Belo Horizonte
2014
Para os meus avós, José Catarino, Canuta, Antônio e
Geralda, e meus sobrinhos, Heitor e Hugo.
“O discurso possibilitou a comunicação de ideias
Habilitando os seres humanos a trabalharem juntos
Para construírem o impossível
As maiores conquistas da humanidade
Surgiram do diálogo
Nossas maiores esperanças podem se tornar realidade no futuro
com a tecnologia à nossa disposição
As possibilidades são ilimitadas
Tudo o que precisamos fazer é ter certeza de que continuaremos falando”
(Stephen Hawking)
Agradecimentos
Agradeço a Deus e a Nossa Senhora. Muito obrigado Professor João Pedro Braga por me
buscar novamente para o mundo acadêmico e científico. Obrigado por aceitar esse trabalho
e permitir que ele seja uma semente para continuarmos evoluindo nessa nova fronteira ainda
cheia de conceitos e perspectivas novas. Obrigado pelo carinho de amigo e tutor. Obrigado
Professora Rita de Cássia Sebastião pelo acompanhamento em momentos decisivos.
O agradecimento apenas com palavras é pouco diante do significado desse trabalho em
minha vida. Procurar palavras para resumir a importância da influência do grupo de pessoas
que participaram desse processo ou parte dele é injusto, mas é prazeroso lembrar de cada
instante de inspiração que colaborou para este momento.
Obrigado minha mãe, Margot, meu pai José Vitor e minha irmã Vanessa, pelo incessante
apoio familiar. Obrigado minha amiga e parceira, Lívia Salum, pelo constante apoio. Um
agradecimento carinhoso para minha querida Mônica, pela inspiração e vibração pelo meu
trabalho.
Agradeço à Universidade Federal de Minas Gerais, por ter disponibilizado a sua estru-
tura. Agradeço aos funcionários da secretaria do Departamento de Química pela atenção no
atendimento.
Agradeço ao CNPq pelo suporte financeiro.
Resumo
A Química necessita de computadores velozes para o processamento de uma grande quan-
tidade de informações e dados complexos. A simulação de sistemas líquidos, a interação entre
átomos e moléculas e a identificação de moléculas necessitam de computadores mais eficientes
para a solução desses problemas.
Esta tese descreve a pesquisa, modelagem e desenvolvimento de uma rede neural artificial
usando os conceitos da Computação Quântica para trabalhar como uma rede neural quântica.
Esta tese também implementa o estudo de um algoritmo quântico de procura e o estudo dos
estados ligados que os dímeros do gás hélio, HeNe, HeAr, HeKr e HeXe podem suportar.
Três abordagens foram seguidas: a) o método da fase variável, para gerar dados. b) redes
neurais clássicas, usando os dados gerados anteriormente. c) redes neurais quânticas. O foco
é a validação e testes do conceito das redes neurais quânticas, com base na informação obtida
das redes neurais artificiais clássicas, acopladas a um algoritmo quântico. Uma rede neural
quântica foi modelada para aprender o comportamento de um sistema químico estudado
anteriormente.
O conceito da Computação Quântica e do computador quântico mostra a evolução com-
plexa da computação clássica bem como uma mudança de conceito em termos de circuitos
(hardware) e algoritmos (software).
Palavras-chave: Computação Quântica, Rede Neural Artificial Quântica, Algoritmo
Quântico, Dímeros de gás hélio.
ix
Abstract
Processing of complex data and in large amount requires the use of high-speed compu-
ters in Chemistry. Liquids systems simulations, atoms and molecules interaction and their
identification require computers more robust to solve these problems.
This thesis describes the research, modeling and development of a neural network that
utilizes the Quantum Computation to work as a quantum neural network. Additionally,
this thesis implements studies of a quantum search algorithm and number of bounds states
helium gas dimers, HeNe, HeAr, HeKr and HeXe can withstand. Three steps were followed A)
variable phase method, for data generation B) classical neural network, using data generated
by the step above. C) quantum neural network. The purpose of following these three steps
was to validate the quantum neural network. The validation was based on the information
generated by the classic neural network coupled to a quantum algorithm to model a quantum
neural network, which will learn the behavior of a chemical system previously studied.
Quantum Computation and computer approaches proves the complex evolution of classic
computing as well as changes related to hardware and software concepts.
Key-words: Quantum Computation, Quantum Artificial Neural Network, Quantum
Algorithm, Helium Dimers.
x
Lista de Figuras
2.1 Esboço da máquina de Turing. . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Símbolo da Porta NOT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Símbolo da porta AND . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4 Símbolo da Porta OR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.5 Símbolo da porta XOR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.6 Porta XOR obtida a partir da combinação de portas básicas . . . . . . . . . 13
2.7 Meio somador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.8 O primeiro transistor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.9 Estrutura física do transitor de silício (direita) e seu símbolo (esquerda) . . . 14
2.10 Comparação entre um sinal digital e um sinal analógico. . . . . . . . . . . . 16
2.11 Comparação entre um sinal digital e um sinal analógico. . . . . . . . . . . . 17
2.12 Versão simplificada de uma UCP. . . . . . . . . . . . . . . . . . . . . . . . . 18
2.13 Diagrama em blocos de um sistema mínimo. . . . . . . . . . . . . . . . . . . 19
3.2 Neurônio biológico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.3 Conexões sinápticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4 Um modelo matemático para neurônio. . . . . . . . . . . . . . . . . . . . . 25
3.5 RNA genérica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.6 Função de ativação logsig. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.7 Função de ativação do tipo tangente hiperbólica. . . . . . . . . . . . . . . . . 32
4.1 Pontos calculados utilizando-se o polinômio de Morsali. . . . . . . . . . . . . 41
4.2 Modedo de um RNA para estudo de g(r). . . . . . . . . . . . . . . . . . . . 41
4.3 Comparação entra os pontos gerados para g(r) . . . . . . . . . . . . . . . . . 43
4.4 RNA para o cálculo de g(r, ρ). . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.5 Superfície para o treinamento da RNA. . . . . . . . . . . . . . . . . . . . . . 45
4.6 Decaimento do erro da RNA para o conjunto de dados [r, ρ, g(r, ρ)]. . . . . . 46
xi
4.7 Comparação entre a superfície prevista (superior), que foi deslocada três uni-
dades de g(r) para cima, somente para efeito de comparação com a superfície
a simulada (inferior). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.8 RNA modelada para o cálculo de g(r, ρ, T ). . . . . . . . . . . . . . . . . . . . 48
4.9 comparação entre a função g(r) desejada (linha) e a função g(r) (círculos)
reproduzida pela RNA, em função de r∗, ρ∗ = 0, 6 e T ∗ = 0.9. . . . . . . . . 51
4.10 comparação entre a função g(r) desejada (linha) e a função g(r) (círculos)
reproduzida pela RNA, em função de r∗, ρ∗ = 0, 6 e T ∗ = 1.0. . . . . . . . . 52
4.11 comparação entre a função g(r) desejada (linha) e a função g(r) (círculos)
reproduzida pela RNA, em função de r∗, ρ∗ = 0, 7 e T ∗ = 1.0. . . . . . . . . 53
5.1 Deslocamento de fase para o dímero HeKr . . . . . . . . . . . . . . . . . . . 65
5.2 Energia potencial (linha cheia, espessa), deslocamento de fase (linha cheia,
fina) e equação MFV para o dímero HeXe (linha pontilhada) . . . . . . . . . 66
5.3 Mudança de fase para HeHe . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.4 RNA modelada para o estudo da formação de estados ligados, em que j é o
número total de neurônios da camada oculta, determinado experimentalmente. 73
5.5 Qualidade do aprendizado em função do número de neurônios, em que a linha
pontilhada é a função custo da rede e a linha cheia é o desvio em relação ao
dado de validação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.6 Qualidade do aprendizado em função do número de neurônios, em que a linha
pontilhada é a função custo da rede e a linha cheia é o desvio em relação ao
dado de validação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.7 Decaimento do erro da RNA em épocas . . . . . . . . . . . . . . . . . . . . . 76
6.1 Esfera de Bloch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.2 Esquema da porta quântica CNOT . . . . . . . . . . . . . . . . . . . . . . . 85
6.3 Defeito no diamante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
6.4 Porta quântica com rotação controlada. Em que el. representa o spin do
elétron e nucl. representa o spin do núcleo. . . . . . . . . . . . . . . . . . . . 88
6.5 Porta de Toffoli. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.6 Diagrama em blocos proposto para o computador quântico. . . . . . . . . . . 90
7.1 Inversão na média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.2 Fluxograma do algoritmo de Grover . . . . . . . . . . . . . . . . . . . . . . . 97
7.3 Potencial Harmônico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
7.4 Potencial Harmônico invertido para adequação ao algoritmo de Grover . . . 105
xii
7.5 Estado de |ψ〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
8.1 Símbolo da Porta NOT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
8.2 Símbolo da porta XOR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
8.3 Linha do desenvolvimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
8.4 Neurônio Quântico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
8.5 Modelo de um neurônio quântico baseado na porta CNOT, em que os dois
terminais do lado esquerdo são as entradas de estímulos e os dois terminais do
lado direito são as saídas de estímulos. . . . . . . . . . . . . . . . . . . . . . 112
8.6 Modelo proposto para um neurônio quântico . . . . . . . . . . . . . . . . . . 114
8.7 Rede neural quântica estruturada . . . . . . . . . . . . . . . . . . . . . . . . 122
8.8 Matrix de Hadamard de 64 por 64 termos, em que os quadrados brancos
equivalem a “1” e os quadrados escuros equivalem a “-1”. . . . . . . . . . . . 123
8.9 Identificação do registro de maior probabilidade de encontrar a solução, carac-
terizando o treinamento da RNAQ. . . . . . . . . . . . . . . . . . . . . . . . 124
xiii
Lista de Tabelas
2.1 Equivalências entre o sistema decimal e o sistema binário . . . . . . . . . . . 8
2.2 Tabela verdade da porta NOT. . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Tabela verdade da porta AND . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4 Tabela verdade da porta OR . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.5 Comportamento da porta OR . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.6 Tabela verdade da porta XOR . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.1 Constantes geradas para a equação 4.7 . . . . . . . . . . . . . . . . . . . . . 42
4.2 Constantes geradas para a equação 4.9 . . . . . . . . . . . . . . . . . . . . . 49
4.3 Constantes geradas para a equação 4.9 . . . . . . . . . . . . . . . . . . . . . 50
5.1 Comparação de S obtida via o método de Numerov (assumido como “exato”)
e via método da fase variável (calculado) . . . . . . . . . . . . . . . . . . . . 61
5.2 Parâmetros para o potencial de Tang . . . . . . . . . . . . . . . . . . . . . . 62
5.3 Relação dos estados ligados para diferentes dímeros de gases nobres . . . . . 64
5.4 Análise sensitiva do potencial de Tang(HeHe) . . . . . . . . . . . . . . . . . 68
5.5 Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o
dímero HeNe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.6 Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o
dímero HeAr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.7 Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o
dímero HeKr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.8 Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o
dímero HeXe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.9 Representação numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.10 Relação dos estados ligados para diferentes dímeros de gases nobres, saída da
RNA cássica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.11 Comportamento da RNA no cálculo de estados ligados . . . . . . . . . . . . 76
xiv
6.1 Comportamento da porta CNOT . . . . . . . . . . . . . . . . . . . . . . . . 86
7.1 Correlação entre o estado quântico de um registro e o espectro . . . . . . . . 100
7.2 Correlação entre o estado quântico de um registro e o espectro . . . . . . . . 103
7.3 Correlação entre o estado quântico de um registro . . . . . . . . . . . . . . . 104
7.4 Estado final do oráculo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
8.1 Correspondência entre a Rede Neural Clássica e a Rede Neural Quântica . . 113
8.2 Função XOR reproduzida pelo neurônio quântico. . . . . . . . . . . . . . . . 114
8.3 Relação dos estados ligados para diferentes dímeros de gases nobres . . . . . 115
8.4 Codificação dos elétrons do Criptônio para o uso na RNAQ . . . . . . . . . . 116
8.5 Determinação do número de estados ligados por uma RNAQ algorítimo do
Grover. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
xv
Lista de abreviaturas e siglas
CC Computação Clássica
CQ Computação Quântica
DVD Digital Versatile Disc
IA Inteligência Artificial
IV Infravermelho
ENIAC Electrical Numerical Integrator and Computer
ERIV Espectro na Região do Infravermelho
MFV Método da Fase Variável
MMC Método de Monte Carlo
MMCM Método de Monte Carlo Metroplis
MLP MultiLayer Perceptron
NAV Números Aleatórios Verdadeiros
NPA Números Pseudo-Aleatórios
OPFS Operações de Ponto Flutuantes por Segundo
RNA Rede Neural Artificial
RNAQ Rede Neural Artificial Quântica
UCP Unidade Central de Processamento
xvi
Sumário
1 Introdução geral 1
2 Noções sobre a computação clássica 4
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 A máquina de Turing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3 O bit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.4 Portas lógicas e os circuitos lógicos . . . . . . . . . . . . . . . . . . . . . . . 8
2.5 Estrutura básica de um computador clássico . . . . . . . . . . . . . . . . . . 17
2.6 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3 Noções sobre redes neurais artificiais clássicas 22
3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.2 Um modelo matemático para um neurônio . . . . . . . . . . . . . . . . . . . 25
3.3 O perceptron de múltiplas camadas . . . . . . . . . . . . . . . . . . . . . . . 26
3.4 A propagação dos estímulos em uma RNA . . . . . . . . . . . . . . . . . . . 28
3.5 O treinamento das Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . 29
3.6 A função de ativação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.7 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4 A função de distribuição radial modelada via RNA 37
4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2 O modelo de Morsali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.3 O modelo de Bamdad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.4 Simulação de líquidos via redes neurais em função de r . . . . . . . . . . . . 40
4.5 Resultados obtidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.6 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5 O estudo dos estados ligados de dímeros com o He via RNA clássica 55
5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
xvii
5.2 Análise da formação de estados ligados em dímeros de He . . . . . . . . . . . 57
5.2.1 O método da fase variável . . . . . . . . . . . . . . . . . . . . . . . . 59
5.2.2 O potencial de dímeros de gases nobres . . . . . . . . . . . . . . . . . 61
5.2.3 Os estados ligados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.3 Resultados e discussão sobre a determinação do número de estados ligados . 63
5.3.1 Análise sensitiva do potencial em relação ao parâmetro C6. . . . . . . 68
5.4 Previsão do número de estados ligados via RNA clássica . . . . . . . . . . . 70
5.5 Resultados e discussão sobre o uso de uma RNA para a determinação de
estados ligados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.6 Conclusões gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6 A Computação Quântica e o computador quântico 79
6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.2 Conceitos básicos da computação quântica . . . . . . . . . . . . . . . . . . . 80
6.3 O qubit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.4 A Porta CNOT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
6.5 Realização experimental da porta CNOT . . . . . . . . . . . . . . . . . . . . 87
6.6 O computador quântico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.7 Conclusões gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
7 Algoritmo de Grover 92
7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.2 O algoritmo quântico de busca . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.3 Inversão seletiva de fase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.4 Inversão seletiva da fase na média (Amplificação) . . . . . . . . . . . . . . . 96
7.5 Identificação de moléculas utilizando o algoritmo de Grover . . . . . . . . . . 98
7.6 Resultados e discussão sobre a aplicação do algoritmo de Grover . . . . . . . 102
7.6.1 Identificação de moléculas utilizando o algoritmo de Grover . . . . . 103
7.6.2 Determinação do mínimo de um potencial . . . . . . . . . . . . . . . 104
7.7 Conclusões gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
8 Redes neurais quânticas aplicadas ao estudo de estados ligados de dímeros
de He 108
8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
8.2 Um modelo para o neurônio quântico . . . . . . . . . . . . . . . . . . . . . . 110
8.3 A propagação em um neurônio quântico . . . . . . . . . . . . . . . . . . . . 112
8.4 A função XOR por redes neurais quânticas . . . . . . . . . . . . . . . . . . . 113
xviii
8.5 Determinação do número de estados ligados via RNAQ . . . . . . . . . . . . 115
8.6 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
9 Conclusão geral 127
Referências Bibliográficas 131
xix
Capítulo 1
Introdução geral
A utilização dos computadores para cálculos científicos permitiu obter resultados
até então inviáveis para serem feitos algebricamente. Em especial, na química, é utilizado
massivamente. Vários processos ainda demandam tempo computacional, logo, a busca por
máquinas mais rápidas e eficientes está em evidência.
O conceito de computador quântico teve seu princípio em meados de 1981, quando
Richard Feynman iniciou as especulações sobre uma máquina computacional mais eficiente
utilizando a mecânica quântica [1].
O conceito da computação quântica foi inicialmente identificado no trabalho de
Benioff, quando foi proposto um modelo para uma máquina de Turing de natureza quân-
tica [2]. O interesse aumentou quando Shor [3] em 1994 mostrou que os números podem ser
tratados no tempo por um polinômio em um computador quântico. Grover [4] em 1996 desen-
volveu um algoritmo quântico capaz de efetuar buscas em um banco de dados representado
em binário, hoje conhecido como algoritmo de Grover. Esses dois algoritmos tornaram-se
referências nos estudos relacionados à computação quântica.
Algoritmos quânticos já vêm sendo utilizados na computação para a criptografia
na transferência de dados [5]. Um algoritmo quântico promete ser mais veloz e solucionar
problemas com maior eficiência do que o algoritmo clássico. Alguns estudos mostram que
problemas complexos para os computadores clássicos podem ser resolvidos por um compu-
1
tador quântico de forma mais eficiente [6]. Como, por exemplo, na criptografia de dados
em transmissões de informações. Com base nessas perspectivas e no avanço das pesquisas,
abre-se um grande espaço de aplicações desta tecnologia [7]. Estudar as características da
computação quântica torna-se fundamental para adequá-la às áreas de interesse. Há a neces-
sidade do estudo dos conceitos da computação clássica dentro da computação quântica, para
aproveitamento de conversão dos atuais algoritmos [8, 9].
O presente trabalho tem como objetivo principal verificar a possibilidade de ex-
plorar o conceito de Computação Quântica (CQ) na modelagem de sistemas físico-químicos,
tendo como meta executar um algorítimo quântico na solução de um problema diretamente
ligado à química e a modelagem de uma rede neural artificial quântica. Assim, um con-
junto de sistemas foi estudado por metodologias clássicas, com o objetivo de gerar material
para, posteriormente ser agrupado, de forma a constituir um caminho completo, desde a
caracterização de um problema em química e a sua modelagem dentro da CQ.
O conteúdo desenvolvido está apresentado nos oito capítulos seguintes, sendo que
no Capítulo 2, foi abordado o conceito básico da computação clássica, bem como seus princí-
pios, para o suporte ao entendimento da teoria da computação quântica. Foram destacadas
neste capítulo, as portas lógicas, por se tratar da base necessária para a construção de um
computador atual. Foi, também, citada a Máquina de Turing, por ser um modelo para o
estudo de um sistema computacional e posteriormente relacionada com a arquitetura de Neu-
mann na qual os computadores atuais são organizados. O principal objetivo desse capítulo
é apresentar o bit, como menor unidade de informação, a porta NOT e a porta XOR, que
serão base para o entendimento da CQ.
No Capítulo 3, está apresentada a teoria sobre redes neurais artificiais clássicas,
cujo entendimento é fundamental para o desenvolvimento de Redes Neurais Artificiais Quân-
ticas (RNAQ).
O Capítulo 4 apresenta o estudo da função de distribuição radial via Redes Neurais
Artificiais Clássicas (RNAC), com o objetivo de mostrar a modelagem e o comportamento de
uma rede em um problema de natureza físico-química. Nesse estudo é mostrada a abordagem
clássica e uma abordagem utilizando-se uma ferramenta da inteligência artificial, a RNA.
Neste caso foi proposta uma nova forma de representar um sistema composto por um líquido
através de uma equação baseada em uma rede neural artificial, caracterizado pela função de
distribuição radial g(r).
2
O Capítulo 5 apresenta um estudo na área de físico-química e física-quântica,
sendo um trabalho sobre espalhamento quântico e o estudo da formação de estados ligados
com átomos de hélio. No trabalho sobre espalhamento explora-se o uso da computação
clássica para cálculos quânticos. O sistema quântico é representado de forma numérica e
algorítimos são usados para a resolução do problema. Os resultados dessa parte do trabalho
formam uma base de informações adotadas como a simulação de um sistema real, com o
objetivo de serem adotadas como resultado equivalente a um experimento, para a modelagem
e validação de uma RNAQ. Os estudos apresentados neste capítulo foram publicados em dois
artigos (Anexos).
O Capítulo 6 apresenta os conceitos sobre a computação quântica e seu estado da
arte. Posteriormente, foram implementados algoritmos quânticos permitindo explorar as suas
possíveis aplicações em química, como descrito no Capítulo 7 que apresenta o estudo sobre
o Algoritmo de Grover aplicado à uma análise na espectroscopia na região do infravermelho.
Finalmente, no Capítulo 8 é apresentado o conceito de um modelo para um neu-
rônio quântico e uma aplicação de uma RNAQ, usando como dados as informações obtidas
no desenvolvimento deste trabalho e apresentadas no Capítulo 5 e o capítulo (9) apresenta
as conclusões gerais.
3
Capítulo 2
Noções sobre a computação clássica
2.1 Introdução
Em 1936 Alan Turing publicou um trabalho sobre o que seria uma máquina base
para o desenvolvimento de qualquer máquina capaz de efetuar cálculos numéricos que pode
ser denominado computação. Em 1946 foi criado o primeiro computador eletrônico digital,
Electrical Numerical Integrator and Computer (ENIAC), por John Eckert e John Mauchly,
com a participação de Jonh von Neumann. Este era fabricado com mais de 17.000 válvulas
a vácuo.
As contribuições de Von Neumann foram fundamentais para o desenvolvimento
da computação clássica [10]. John von Neumann introduziu a idéia de cérebros eletrônicos
[11, 12], que consistia em modelar a arquitetura do computador segundo o sistema nervoso
central humano, utilizando a álgebra de Boole [13] e os sistemas binários.
Com a invenção do componente eletrônico chamado transistor, que substituiu a
válvula, e dos circuitos integrados, que miniaturizaram os circuitos eletrônicos, a capaci-
dade de processamento e a velocidade dos computadores evoluiram significativamente. Os
computadores populares são, hoje, mais compactos e mais poderosos que o ENIAC. Os com-
putadores podem chegar a 109 operações de ponto flutuante por segundo (OPFS) e 1015
OPFS no caso dos supercomputadores. O termo computação clássica (CC) será adotado
4
para se referenciar aos computadores atuais.
2.2 A máquina de Turing
Um dos conceitos fundamentais da computação é a máquina de Turing (Figura
2.1). Este dispositivo caracteriza-se como uma plataforma na qual um algoritmo válido deve
ser capaz de entrar em operação e envolve os conceitos das funções computáveis, dos números
computáveis e da computabilidade [14].
Figura 2.1: Esboço da máquina de Turing.
A máquina de Turing foi idealizada por Alan Turing [15]. Trata-se de uma má-
quina abstrata, mas com conceitos válidos para as máquinas reais. Em seu trabalho Turing
descreveu muito mais que uma máquina. Na realidade foi também elaborada uma “lingua-
gem” que define o comportamento lógico de um sistema computacional e um modelo com
regras, em que podem se basear os projetos dos sistemas conhecidos hoje como computadores.
Pode-se identificar na máquina de Turing três partes fundamentais: uma fita
linear; uma cabeça de leitura e escrita; e uma unidade de controle.
A fita da máquina de Turing
A fita é um dispositivo para o registro de informações. Ela deve ter a propriedade
de guardar uma informação, permitir que esta informação seja apagada e também deve
permitir que a informação possa ser substituída por outra.
Leitura e escrita
5
A cabeça de leitura e escrita tem a função de escrever (registrar), um único símbolo
dentro de um quadrado da fita, bem como ler um símbolo previamente escrito na fita e apagar
um símbolo previamente escrito na fita.
A máquina
A unidade de controle é um dispositivo com diferentes funções: controlar o movi-
mento da fita, receber um símbolo lido pela cabeça de leitura/escrita; enviar um símbolo para
ser escrito na fita pela cabeça de leitura/escrita; fazer com que a cabeça de leitura/escrita
apague um símbolo na fita; assumir qualquer estado dentro de um número finito de estados.
Para a máquina computar um número, deve ser criada uma seqüência de estados, leitura e
escrita e movimentos da fita.
Essa breve introdução sobre a máquina de Turing tem como objetivo situar o
trabalho em relação aos princípios utilizados no desenvolvimento dos computadores clássi-
cos, além de fornecer um fundamento teórico, em relação às máquinas, para se explorar a
computação quântica.
O projeto de uma máquina real, baseada na máquina de Turing, envolve a elabo-
ração de conjunto de símbolos que possibilitem a comunicação com o operador. As regras
de comportamento da unidade de controle devem ser implementadas na forma de circuitos
eletrônicos. A álgebra de Boole é a ferramenta básica para o desenvolvimento dos circuitos
eletrônicos na máquina real.
A álgebra de Boole
A álgebra de Boole teve sua origem na publicação de Boole [16] em 1854. Em seu
trabalho, Boole cria uma estrutura baseada em comportamentos lógicos e valores discretos.
Boole propôs um conjunto de leis para formar e expressar o raciocínio lógico.
Os termos “equação lógica” e “função lógica” são empregados para denotar qual-
quer função envolvendo as variáveis lógicas x, y, etc. O trabalho de Boole é bem mais extenso
do que é descrito nesse trabalho, porém a descrição aqui apresentada é o suficiente para in-
troduzir o assunto e fornecer uma base para uma discussão sobre os fundamentos necessários
para propor um computador quântico. O Álgebra de Boole é utilizada em sistemas numéricos
6
binários, cuja menor unidade de informação é o bit.
2.3 O bit
O código binário é a base numérica utilizada na máquina de Turing. Diferente-
mente do código decimal, que possui dez símbolos que vão de 0 (zero) a 9 (nove), o código
binário possui apenas dois símbolos, o 0 (zero) e o 1 (um). Cada combinação de zeros e
uns representa uma informação chamada de bit, que pode assumir o valor zero, chamado de
nível lógico zero (NL 0) ou o valor um chamado de nível lógico um (NL 1). Surge então
um sistema binário, composto por duas situações. Essas situações podem ser rotuladas em
vários aspectos e usadas para indicar situações discretas, como verdadeiro ou falso, aceso ou
apagado, aberto ou fechado, ativado ou desativado, zero ou um, ligado ou desligado.
No estudo de sistemas computacionais os números decimais serão representados
pelos algarismos seguidos pela letra D indicando a base decimal, por exemplo o número
10 (dez) passa a ser representado por 10D. Os números binários serão representados pe-
los algarismos e pela letra B, por exemplo, o número binário 10, que é equivalente ao 2
(dois) em decimal, é representado por 10B. Essa representação será adotada quando houver
a necessidade de se trabalhar com números na base decimal e na base binária durante o
desenvolvimento deste trabalho.
Diferentemente do sistema decimal em que os valores relativos dos algarismos são
organizados, como por exemplo, em unidades (100), dezenas (101), centenas(102), o código
binário tem a base 2 e suas casas são potências de 2, como por exemplo, 20, 21 e 22. A
quantidade representada é definida como uma combinação de dígitos binários e sendo obtida
de acordo com a expressão
N =m∑
n=0
Dn × 2n (2.1)
em que N é um número inteiro, m é o número de bits usados para se representar o valor em
binário e Dn é o valor absoluto do bit n.
A combinação de oito bits formam um Byte. O Byte é utilizado para a represen-
tação de grandes quantidades de dados. As máquinas digitais trabalham com a manipulação
de zeros e uns na forma de Bytes.
7
A Tabela 2.1 contém algumas relações entre as representações de números na base
decimal e na base binária.
Tabela 2.1: Equivalências entre o sistema decimal e o sistema binário para valores inteirosentre zero e dez
Decimal Binário0 00001 00012 00103 00114 01005 01016 01107 01118 10009 100110 1010
2.4 Portas lógicas e os circuitos lógicos
As portas lógicas são dispositivos que, ao estarem combinados, permitem repro-
duzir a matemática e o comportamento lógico nos sistemas digitais e permitem implementar,
fisicamente, a álgebra de Boole. Essas portas são caracterizadas pelo seu símbolo, sua tabela
de comportamento chamada de “tabela verdade” e sua expressão lógica. A tabela verdade
de uma porta lógica contém as variáveis de entrada e de saída e seus possíveis estados em
função da lógica. Essas portas são descritas a seguir. Os sistemas digitais são baseados nas
portas lógicas conhecidas como NOT, AND e OR. As outras portas lógicas são obtidas a
partir da combinação dessas três.
A porta lógica NOT
A porta mais simples da eletrônica digital é a porta NÃO, muito conhecida na
literatura como porta NOT. Esta porta é a implementação física da função NOT
f(x) = (1− x) (2.2)
em que x é um bit, então f(0) = 1 e f(1) = 0.
8
Essa regra funcionará para um bit e para um vetor de dimensão n, cujos elementos
são bits no estado 0 ou no estado 1.
O símbolo da porta NOT é mostrado na Figura 2.2, em que A é a entrada, e S é
a saída da porta.
Figura 2.2: Símbolo da Porta NOT
O comportamento da porta NOT segue a tabela verdade (Tabela 2.2).
Tabela 2.2: Tabela verdade da porta NOT.
Entrada A Saída S0 11 0
A expressão lógica que representa esta porta é S = A (lê-se S é igual a A bar-
rado). Essa porta pode ser construída utilizando-se um componente eletrônico conhecido
como transistor de junção bipolar (TJB).
Porta lógica AND
A porta lógica AND é a implementação da função lógica AND. A função lógica
AND é representada pela expressão
f(x, y) = xy (2.3)
em que x = 0 ou x = 1 e y = 0 ou y = 1 (x ∈ N| x = 0 ou x = 1)(y ∈ N| y = 0 ou y = 1).
A lógica AND entre A e B é definida como o produtório dos elementos dispostos
em uma mesma linha da matriz de estados possíveis para as entradas da porta AND (Equação
2.4).
9
E(A,B) =2∏
j=1
cij (2.4)
em que i é a linha da matriz C que contém as combinações referentes aos estados de A e B
, equivalentes a ai e bi, e j = 0 refere-se à linha da matriz C.
A porta é composta por entradas equivalentes às variáveis da função e uma saída,
equivalente ao valor que a função assume, de acordo com os valores das variáveis de entrada.
O símbolo da porta AND é mostrado na Figura 2.3.
Figura 2.3: Símbolo da porta AND
A expressão para a porta é S = A.B, em que S é a saída da porta1. A tabela
verdade da porta AND é mostrada na Tabela 2.3.
Tabela 2.3: Tabela verdade da porta AND
Entrada A Entrada B Saída S0 0 00 1 01 1 11 0 0
A porta lógica OR
A função lógica OU, mais conhecida pelo seu nome em inglês OR, representa a
soma lógica, dentro da definição de Boole [16]. Nesta função basta que uma das variáveis
seja 1 para que o valor da função seja 1 (Tabela 2.4).
O comportamento da porta OR (Figura 2.4), segue a Tabela 2.5.
1Nos circuitos físicos, as variáveis de entrada são sinais elétricos
10
Tabela 2.4: Tabela verdade da porta OR
Entrada A Entrada B Saída S0 0 00 1 11 1 11 0 1
Figura 2.4: Símbolo da Porta OR
Tabela 2.5: Comportamento da porta OR
Entrada A Entrada B Saída S0 0 00 1 11 0 11 1 1
A expressão Lógica é S = A+B.
O sinal “+” não efetua exatamente a mesma operação da matemática. Ele difere
no fato de que na matemática 1 + 1 = 2 e na eletrônica digital 1 + 1 = 1. Será mostrado
posteriormente que a soma em binário terá outro símbolo e será efetuada por uma combinação
de portas lógicas. Não há uma porta lógica que efetue sozinha uma soma idêntica à soma
encontrada na matemática.
A combinação de portas lógicas tem o objetivo criar circuitos digitais capazes de
efetuar operações lógicas e aritméticas. Nos circuitos combinacionais a ativação da saída de-
pende dos estados das entradas. Um exemplo de um circuito combinacional é o decodificador
de binário para decimal em que cada combinação binária ativa uma saída que representa
o número decimal equivalente. Esse decodificador é um gerador de produtos canônicos que
permite, a cada combinação binária, gerar uma base canônica para um espaço vetorial de n
11
dimensões.
A porta lógica XOR
A porta XOR, é utilizada na construção da Unidade Lógica e Aritmética presente
nos microprocessadores atuais. A expressão lógica da porta XOR é S = A ⊕ B. O símbolo
está representado na Figura 2.5.
Figura 2.5: Símbolo da porta XOR.
O comportamento da porta XOR segue a Tabela 2.6
Tabela 2.6: Tabela verdade da porta XOR
Entrada A Entrada B Saída S0 0 00 1 11 0 11 1 0
A função exclusive-OR, ou XOR, é fundamental na implementação da aritmética
dentro da lógica, sendo um componente responsável por parte do processo de soma de dois
bits. A expressão desta função é x(1 − y) + y(1 − x). Essa expressão é uma combinação de
funções lógicas. O termo 1 − y é o NOT de y, o termo 1 − x é o NOT de x, os produtos,
x(1− y) e y(1− x), são a AND entre x e 1− y e a AND entre y e 1− x, respectivamente. A
soma é a mesma da lógica OR. A expressão lógica desta combinação é
S = A.B + A.B (2.5)
12
Esta porta é obtida da combinação das portas lógicas básicas Figura 2.6.
Figura 2.6: Porta XOR obtida a partir da combinação de portas básicas
A porta XOR permite implementar, em binário, o comportamento da primeira
casa binária no processo de soma. Pois, 0 + 0 = 0, 0 + 1 = 1, 1 + 0 = 1 e 1 + 1 = 0, como na
tabela verdade da porta XOR, mostrada anteriormente. Como a XOR só possui uma saída,
torna-se necessária a adição de uma segunda porta para tratar o “vai um”. O “vai um” só
ocorre quando os dois bits que estão sendo somados são iguais a “1”, 1 + 1 = 0, a porta AND
apresenta o comportamento ideal para esse caso, pois, de acordo com a sua tabela verdade,
somente quando os dois bits em suas entradas forem iguais a “1”, a sua saída vai assumir o
valor “1”. Logo a soma de dois bits (bit A e o bit B) é implementada por um circuito com
duas expressões, XOR(bit A, bit B), para a soma, e AND(bit A, bit B), para o “vai um”. O
bit A e o bit B atuam simultaneamente na porta XOR e na AND. O circuito que representa
o meio somador esta representado na Figura 2.7.
Figura 2.7: Meio somador
Portas lógicas em chips de silício
13
As portas lógicas são construídas utilizando-se o transistor (Figura 2.8) desenvol-
vido a partir de chips de silício.
Figura 2.8: O primeiro transistor1.
O cristal de silício é dopado com impurezas de forma a criar materiais do tipo n,
com excesso de elétrons, e materiais do tipo p, com escassez de elétrons chamadas de lacunas.
Os materiais são dispostos em três camadas (Figura 2.9), que participam da condução de
elétrons, e uma quarta camada base para a montagem do transístor, formando um transistor
npn ou o transistor pnp. A primeira camada é chamada de coletor, a segunda (do meio)
é chamada de base e a terceira é chamada de emissor. Quando elétrons são injetados ou
retirados da camada da base, ocorre um fluxo intenso de elétrons do emissor para o coletor.
Figura 2.9: Estrutura física do transitor de silício (direita) e seu símbolo (esquerda) 1.1<http://www.inovacaotecnologica.com.br/noticias/noticia.php?artigo=primeiro-transistor>1<http://www.circuitstoday.com/monolithic-ic-component-fabrication>
14
Cada transistor, mede aproximadamente 45nm de comprimento, com mais de 100
átomos. Os microprocessadores atuais pode conter mais de 800 milhões de transistores.
O transistor funciona como uma válvula controlando o fluxo de elétrons. Basica-
mente controla-se um fluxo intenso de elétrons a partir de um fluxo de elétrons bem menor.
A razão β entre o fluxo maior e o fluxo menor pode chegar a mais de 1.000 vezes. O transistor
é utilizado como um amplificador de sinais.
Sinais digitais e sinais analógicos
Os sistemas computacionais atuais são baseados na eletrônica digital. Não há
como falar sobre o termo digital sem mencionar o termo analógico. Muito se discute sobre a
diferença de um sistema analógico de um sistema digital. Como eles são sempre comparados,
deve-se estabelecer corretamente a relação entre esses sistemas. O sistema digital não é o
oposto do sistema analógico. O sistema digital trata-se de uma discretização do sistema
analógico.
Os equipamentos atuais podem ser puramente analógicos, puramente digitais ou
um misto das duas tecnologias. Em certos casos um equipamento é classificado como digital,
mas manipula informações de natureza analógica. Os telefones celulares são um exemplo.
Os celulares digitais transmitem e recebem os sinais da voz codificados em sinais digitais,
mas são utilizados para a transmissão do sinal da voz proveniente dos humanos que é um
sinal analógico. A caracterização de um sistema como analógico ou digital pode ser feita em
função do tipo de sinal em que esse sistema atua. A função
f(x) =sen(x) + 1
2(2.6)
pode assumir “infinitos valores” entre zero e um, de forma que isso a caracteriza como um
sinal analógico. Os sinais analógicos são contínuos ao longo do tempo. Ao se gerar um sinal
a partir dessa onda, utilizando-se regras mostradas nas equações 2.7 e 2.8, tem-se uma onda
chamada de onda quadrada que possui níveis discretos ao longo do tempo, ou seja, um finito
número de valores para f(x). Isso a caracteriza com um sinal digital.
15
f(x) = 0 sesen(x) + 1
2≤ 0 (2.7)
f(x) = 1 sesen(x) + 1
2> 0 (2.8)
Tem-se, na Figura 2.10, uma comparação do sinal digital e do sinal analógico.
Figura 2.10: Comparação entre um sinal digital e um sinal analógico.
A eletrônica digital está contida na eletrônica analógica, no que se refere ao mundo
macroscópico. Ao utilizar os extremos de um sinal analógico, tem-se sinais que possuem
valores discretos. Os sinais digitais são discretos ao longo do tempo e apresentam uma
descontinuidade na transição de um estado lógico. Por exemplo, a utilização dos máximos e
mínimos de um sinal senoidal transforma essa onda em uma onda chamada quadrada.
Os sistemas digitais precisam interagir com o mundo real, que possui caracterís-
ticas analógicas. Como mostrado na Figura 2.10, uma onda senoidal se transforma em uma
onda quadrada quando representada digitalmente com duas situações. Claramente houve
uma perda significativa de informações referentes à onda senoidal. Torna-se necessário repre-
sentar essa onda senoidal com uma quantidade maior de informação digital. A solução é criar
16
uma combinação de bits que crie ondas discretas que se aproximem das ondas analógicas a
um nível aceitável de acordo com a aplicação. A Figura 2.11 é uma demonstração de como
aproximar um sinal digital de um sinal analógico. Neste caso, a onda senoidal foi represen-
tada por quatro valores possíveis (0, 00, 0, 33, 0, 66 e 1, 00) e a cada valor foi atribuído uma
combinação de bits de forma a identificá-los 00, 01, 10 e 11. Esse processo permitiu converter
um sinal analógico para um sinal digital. A aproximação pode ser melhorada aumentando-se
o números de bits.
Figura 2.11: Comparação entre um sinal digital e um sinal analógico.
2.5 Estrutura básica de um computador clássico
A computação convencional utilizada nos computadores atuais, baseia-se na ele-
trônica digital. A eletrônica digital tem como característica a manipulação de informações
discretas. Essas informações são atribuídas a circuitos eletrônicos. A vantagem em usar um
sinal digital está evidenciada na simplicidade de sua representação. As UCP atuais são bem
complexas e com muitos recursos lógicos e aritméticos, porem não são o alvo deste estudo.
Assim, uma breve descrição de sua funcionalidade foi abordada, para servir de base para
17
entendimento do processamento de informações. A UCP é caracterizada pela interação de
dois sistemas distintos, o software e o hardware. O hardware representa toda a parte física
que compõe a UCP. O software representa toda a parte intelectual de manipulação dos bits
na forma lógica ou aritmética.
A unidade central de processamento (UCP) é considerada o “cérebro” de um com-
putador e nela são processadas as informações. A princípio, sua função é permitir executar
um conjunto de comandos de tal forma a resolver um problema matemático ou lógico (Figura
2.12).
Figura 2.12: Versão simplificada de uma UCP.
A UCP deve ser capaz de receber um comando requisitando processar uma soma,
buscar a primeira grandeza, codificada em binário, armazenar essa grandeza internamente em
18
sua memória, buscar a segunda grandeza, armazenar essa grandeza internamente, proceder
com a soma, armazenar o resultado internamente ou externamente em uma memória. Uma
representação simplificada da UCP foi adotada para o atual estudo. O hardware da UCP
simplificada deste estudo permite efetuar a operação de soma de quatro bits, sendo composta
por um somador de quatro bits, que será a unidade aritmética (UA), um decodificador de
instruções, três registros e uma interface de entrada e saída . Um decodificador de instruções
atua no sistema controlando o fluxo de dados e habilitando o sistema a efetuar uma operação
na forma de instrução vinda de um software.
Um computador é basicamente composto por uma Unidade Central de Processa-
mento (UCP), hoje chamada de processador ou microprocessador, uma memória permanente,
uma memória temporária e interfaces de entrada e saída de informação, como mostrado na
Figura 2.13.
Figura 2.13: Diagrama em blocos de um sistema mínimo baseado em processador e naarquitetura de Von Neumann.
19
Esta estrutura, considerada a parte física do computador, é conhecida como hard-
ware. A UCP, responsável pela parte lógica do computador, é construída utilizando-se chips
de silício, de forma a manipular os efeitos dos movimentos dos elétrons. Os chips são compos-
tos por transístores arranjados na forma de circuitos eletrônicos. Os arranjos dos transistores
são estruturados para que seja possível implementar a álgebra de Boole.
Computação clássica
A computação clássica, utilizada nos computadores, possui regras adaptadas das
regras da matemática e regras de comportamento lógico. Para facilitar o entendimento da
computação quântica, torna-se necessário o entendimento prévio dos computadores atuais.
A computação clássica é caracterizada pela implementação de algoritmos na forma
de softwares. Um software é composto por um conjunto de instruções que serão enviadas
ao decodificador. Esse conjunto de instruções são os programas. No exemplo a seguir uma
UCP foi elaborada para responder a quatro instruções de software:
O programa para se somar os números 12 e 15 é:
Soma de dois números
Início:
CVA
CVB
SOMA
DC
Fim
Nesta versão simplificada, o programa é executado acionando-se os comandos
na sequência. Os comandos podem ser implementos como chaves que quando pressionadas
20
enviam o sinal de acionamento para a UC. A UCP utilizada nesse exemplo foi elaborada
com uma interface de entrada e saídas de quatro bits, três registros (memórias), um somador
binário de quatro bits, um decodificador de comandos e uma unidade de controle.
A computação clássica representa todo o universo de programas de computador,
criados em uma linguagem próxima à falada pelos seres humanos, em inglês, por exemplo.
Esses programas são passados para binário e executados em UCP construídas em chips de
silício. As linguagens de programação são as ferramentas que permitem que o usuário possa
interagir com os sistemas computacionais. Desta forma, as linguagens de programação são
criadas utilizando os mesmos princípios das regras utilizadas na construção dos computadores
e uma linguagem baseada na comunicação dos humanos. Linguagens de programação, como
o C++ e o FORTRAN, são amplamente utilizados na computação clássica.
2.6 Conclusões
A complexidade dos algoritmos estudados nessa primeira etapa, serviram de mo-
tivação para o estudo de um sistema computacional com capacidade de processamento mais
eficaz, uma vez que a demanda de tempo para os sistemas, relativamente simples, estudados
foi alta.
O tempo computacional foi o principal aspecto que levantou interesse no que se
refere aos algoritmos implementados. Os algoritmos considerados simples, no que refere-se
ao número de variáveis e número de linhas de programação, demandaram, relativamente, um
longo tempo para execução, em uma CPU atual. Seria necessário um super computador para
sistemas de mesma natureza mais complexos. Por exemplo, com uma quantidade maior de
partículas.
Essas evidências comprovam a necessidade de se buscar uma eficiência maior para
um sistema de processamento de dados.
21
Capítulo 3
Noções sobre redes neurais artificiais
clássicas
3.1 Introdução
Dentro do estudo da Inteligência Artificial (IA), estão inseridas as Redes Neurais
Artificiais (RNA), que se caracterizam na linha de estudo conhecida como de conexionismo.
O conexionismo é a visão da mente humana no aspecto computacional e relaciona as habili-
dades intelectuais humanas com as conexões em uma rede de neurônios artificiais. As redes
neurais podem ser classificadas em Redes Neurais Biológicas, de natureza orgânica, Redes
Neurais Artificiais, de natureza eletrônica e Redes Neurais Artificiais Simuladas, de natureza
algorítmica.
A rede neural biológica é a rede de neurônios existente nos seres vivos, a rede
neural artificial é baseada em circuitos elétricos e eletrônicos que tentam imitar o comporta-
mento das redes existentes em sistemas biológicos e a rede neural artificial simulada é a rede
desenvolvida sob a forma de algoritmos e implementada em softwares [17]. É usual chamar
as redes neurais artificiais simuladas de redes neurais artificiais, simplesmente.
Redes neurais, como redes de muitas camadas (Multilayer Percptron-MLP) e as
de Hopfield [18], têm propriedades que são úteis nos estudos de problemas que envolvem,
22
por exemplo, a determinação de parâmetros em expressões teóricas que descrevem o sistema
correlacionando-o com dados experimentais. As redes neurais também têm grande utilidade
em problemas diretos, uma vez que possibilitam a inclusão de variáveis para a melhoria na
performance do modelo elaborado para a representação de um sistema.
A capacidade das RNAs em correlacionar conjuntos de dados, de uma maneira
universal, permite a aplicação dessa técnica em problemas diretos e inversos. O uso de redes
neurais se mostrou eficiente em diversas aplicações tecnológicas para sistemas complexos,
mas destacamos a química e áreas afins [19], como no estudo de proteínas [20,21] e no estudo
de estruturas químicas [22]. Na medicina as redes neurais foram utilizadas na categorização
do batimento cardíaco de fetos [23]. Em sistemas químicos especificamente [24] utilizou uma
RNA em termoquímica e utilizou a própria estrutura da RNA para determinar os parâmetros
do sistema químico [25]. Viterbo [26] em 2001 utilizou uma RNA em problemas inversos no
estudo de aniquilação de pósitrons.
Uma RNA pode conseguir aprender o comportamento de um sistema em que
existe uma relação entre suas variáveis, podendo ser composta por camadas que neurônios
interconectados. Uma rede MLP pode ser estruturada com uma camada de entrada, composta
por uma ou várias entradas, uma ou varias camadas ocultas, com um ou vários neurônios
e uma camada de saída composta por uma ou várias saídas [18]. As conexões formam
redes distribuídas e paralelas cujo aprendizado é obtido através de ajustes adaptativos de
parâmetros [27]. Em um neurônio matemático de McCullock-Pitts as conexões sinápticas
são representadas por pesos que geralmente são identificados pela letra w da palavra weights
de origem inglesa.
Os primeiros estudos em modelagem matemática para o sistema nervoso foram
classificados como biofísica matemática e foram iniciados por Nicolas Rashevsky que propôs
um dos primeiros modelos do neurônio dando início às idéias que precederam as redes neurais
artificiais [28]. Posteriomente, McCulloch e Pitts [29] apresentaram um modelo composto por
uma rede de neurônios contendo um corpo celular (soma) e axônios, como na representação
gráfica de um neurônio biológico mostrada na Figura 3.2, os quais estão ligados por conexões
sinápticas aos dendritos de outros neurônios Figura 3.3.
23
Figura 3.2: Neurônio biológico.
Figura 3.3: Conexões sinápticas.
24
3.2 Um modelo matemático para um neurônio
Os neurônios artificiais respondem de maneira particular em relação a estímulos
recebidos e esta resposta pode ser definida como ativação. Esse modelo, posteriormente,
influenciou Jon von Neumann no desenvolvimento de computadores digitais [10]. O mo-
delo matemático de um neurônio possui conexões sinápticas chamadas pesos sinápticos,
w0, w1, w2, . . . , wNe, sendo Ne o número de entradas. Os pesos estão respectivamente as-
sociados às entradas de estímulos x0 = 1, x1, x2,. . . ,xNe. Os estímulos propagam-se a partir
dos dendritos, passando pelo corpo do neurônio, em direção aos terminais sinápticos. O ar-
ranjo de neurônios em uma RNA é configurado de forma a obter um caminho para estímulo,
da entrada para a saída da RNA. O processo em que o estímulo se propaga da entrada para
a saída da RNA chama-se propagação. Esses estímulos formam o vetor de entrada [xm] e
propagam-se através do vetor de pesos [wm], m = 0, 1, ..., Ne. A interação do elemento x0
com o elemento w0 cria o termo x0w0 chamado de bias(Figura 3.4).
Figura 3.4: Um modelo matemático para neurônio.
A junção aditiva, representada por∑
, é a soma dos estímulos de entradas modi-
25
ficados pelos pesos e seu valor é dado por
v =Ne∑
m=0
wmxm (3.1)
em que m é, portanto, o índice que identifica uma determinada entrada de estímulos e Ne é
o total de entradas.
3.3 O perceptron de múltiplas camadas
A RNA genérica, representada na Figura 3.5 é composta por entradas de estímulos
(lado esquedo) que formam a camada de entrada ou nós de entrada, camadas de neurônios
intermediárias e uma camada de saída (lado direito). O modelo de neurônio matemático
mostrado na figura 3.4, mostrada na seção anterior, foi adotado no presente trabalho. A
Figura 3.5: RNA genérica.
expressão da RNA que corresponde ao elemento de matriz yj+1(i)l associado à saída do l-ésimo
26
neurônio, da (j + 1)-ésima camada, diante do i-ésimo elemento do conjunto de referência é
dado por
yj+1(i)l = ϕ
N1∑
n=0
wj+1nl
[ϕ
(Ne∑
m=0
wjmnx
im
)] (3.2)
em que xim é o estímulo de entrada no neurônio m para a amostra i, wj
mn são os peso que
conectam as entradas aos neurônios, ϕ é a função de ativação. No caso de uma rede com
uma camada oculta (j = 1), tem-se
y2(i)l = ϕ
N1∑
n=0
w2nl
[ϕ
(Ne∑
m=0
w1mny
j+1(i)l
)] . (3.3)
Portanto, a matriz [y2(i)l ] é a saída da rede.
Esta rede de neurônios permite explorar certas propriedades atribuídas às RNAs.
Um arranjo de neurônios muito utilizado é o perceptron de várias camadas (PVC) mais
chamado de MLP. O MLP foi desenvolvido a partir do perceptron [30] caracterizado como
um classificador linear. O MLP descrito por Haykin [18] em 2001 é uma estrutura que
apresenta características adaptativas que permitem que a rede atue como um interpolador
ou como uma ferramenta de reconhecimento de padrões ( [31]) .
A MLP foi a primeira arquitetura adotada neste trabalho. Os valores dos pesos
são determinados por um processo conhecido como treinamento. Durante o treinamento, o
aprendizado da RNA é avaliado em função do erro que comete em reproduzir os dados de
treinamento. O erro é calculado pela expressão
e(i)m (W ) = d(i)
m − y(i)m , (3.4)
em que d(i)m é uma matriz que contém amostras do comportamento desejado para o sistema
em estudo sendo o alvo do processo em que os pesos são ajustados e y(t)m é um vetor que
contém a resposta da RNA no instante t para os estímulos apresentados na entrada da RNA.
Deseja-se obter um erro e(i)m (W ) que valide o aprendizado, não sendo, necessariamente, igual
a zero.
Os pesos podem ser ajustados por um processo de minimização, conhecido como
27
treinamento, baseado em mínimos quadrados. Cada procedimento de ajuste de todos o pesos,
envolvendo uma propagação e uma retropropagação completa através da estrutura da RNA,
é chamado de época. O momento de parada do treinamento é definido por um erro, ou
desvio, aceitável e é acompanhado pela expressão
ε(i) =12
Ns∑
m=1
(e(i)
m
)2. (3.5)
3.4 A propagação dos estímulos em uma RNA
A soma de estímulos é argumento da função de ativação ϕ(·) que é o próximo
estágio de funcionamento do neurônio. Deste modo, a saída y é representada pela equação:
y = ϕ
(Ne∑
m=0
wmxm
)(3.6)
O uso das redes neurais se dá, em geral, em dois momentos distintos. O primeiro
refere-se ao treinamento que consiste no uso de amostras de referência usadas para calibrar os
pesos da rede de modo a obter um mapeamento de diferentes estados do sistema em estudo.
Embora no treinamento ocorra também a propagação, distinguimos como propagação o se-
gundo momento quando é colocado uma amostra incógnita na entrada e a RNA, treinada,
correlaciona a amostra a uma classificação em virtude do treinamento anterior, a propaga-
ção e classificação de uma amostra incógnita é determinada pela RNA e a qualidade desta
determinação é utilizada para se verificar a qualidade da capacidade de previsão.
Veremos que a propagação do estímulo pela rede poderá ser representada por uma
expressão matemática. Por hora, definimos a matriz de entrada das amostras de referência
do sistema em estudo por [xim] = ([x1
m], [x2m], . . . , [xi
m], . . . , [xMm ]), i = 1, 2, . . . ,M formada
pelos M vetores-coluna de amostra de referência. O índice i = 1, ...,M é, portanto, o índice
de amostras do sistema em estudo. Definimos também a matriz [wjmn] formada pelos pesos
atribuídos às conexões entre a camada de entrada e a camada oculta, em que n = 1, . . . , N1 é
o índice de neurônios na primeira camada oculta com N1 neurônios, m = 1, . . . , Ne é o índice
de entradas com Ne entradas e j = 1, . . . , Nc, o índice de camadas com Nc camadas totais.
28
A matriz [vjn](i) representa os estados dos neurônios da camada j diante do i-ésimo
vetor de referência. A propagação dos sinais referentes ao(s) estímulo(s) para a próxima
camada (primeira camada oculta), identificada como j diante da i-ésima amostra é calculada
vj(i)n =
∑Nem=0 w
jmnx
im
yj(i)n = ϕ
(∑Nem=0 w
jmnx
im
)
yk(i)n = ϕ
(∑Nem=0 w
jmny
j(i)n
) (3.7)
em que ϕ é a função de ativação, yk(i)n é o valor da saída do neurônio n para a i-ésima amostra.
A próxima camada pode ser a camada de saída ou uma outra camada oculta.
Como entrada para a próxima camada tem-se a saída yj(i)n . Assim,
vj+1(i)l =
N1∑
n=0
wj+1nl yi
n , (3.8)
yj+1(i)l = ϕ
N1∑
n=0
wj+1nl yi
n
. (3.9)
3.5 O treinamento das Redes Neurais Artificiais
O aprendizado da RNA adotada para esse estudo se dá pela colocação de um
conjunto de referência chamado de conjunto de dados de treinamento. Esse conjunto de
dados de treinamento é composto por um conjunto de dados de entrada e um conjunto
de dados de saída (chamados de alvo do treinamento). O aprendizado caracteriza-se pela
capacidade de uma RNA prever o comportamento de um sistema em relação a informações
não fornecidas durante o processo de treinamento.
Os dados de entradas são apresentados na entrada da rede e propagamos para a
próxima camada de neurônios, a característica da próxima camada varia de acordo com o
número de camadas da rede, podendo ser uma camada oculta ou a camada de saída. A saída
da rede é então comparada com o alvo do treinamento e calculado o erro que a rede comete
em tentar simular o sistema. Esse erro é usado para o ajuste dos pesos. O ajuste dos pesos
da rede se dará através da retropropagação. A rede é estimulada da saída para a entrada
29
e seus pesos são ajustados durante o processo. A influência de cada peso, da saída para a
camada mais próxima em direção à entrada é avaliada e será um elemento de uma matriz de
correção de pesos. O processo é repetido até chegar à entrada da rede. A matriz contendo
as influências de cada peso no erro da rede é utilizada em um algoritmo de back-propagation,
como o LMPB, para se minimizar o erro que é acompanhado por uma função de custo. A
função de custo é utilizada para se determinar o grau de aprendizado da rede em relação ao
conjunto de dados de treinamento.
O Conjunto de treinamento pode ser definido pelo conjunto dos pares de referência
de entrada e saída do sistema:
T ={(x(1)
m , d(1)l )|m=1,...,Ne,l=1,...,Ns
, (x(2)m , d
(2)l ), . . . , (x(M)
m , d(M)l )
}, (3.10)
em que, d(i)m é o valor desejado para aquela saída, ou alvo de treinamento. O grau de apren-
dizado da RNA é mensurado pelo erro que a RNA apresenta na tentativa de simular o
conjunto de dados de treinamento e é dado pelo erro (Eq.3.4) cometido na última camada
ao se comparar a saída de cada neurônio para cada elemento do conjunto de treinamento,
e(i)m = d(i)
m − yj=Ns (i)m = d(i)
m − ϕ
N1∑
l=0
wj=Ns
lm x(i)l
. (3.11)
Define-se a função custo somando o erro quadrático sobre toda a camada de saída para cada
elemento do conjunto de treinamento,
ε(i) =12
Ns∑
m=1
(e(i)
m
)2. (3.12)
Assim, temos que ε(i) = ε(i)[wj=Ns
lm
]é funcional dos pesos sinápticos entre a última camada
oculta e a camada de saída.
O erro que a RNA comete deve ser um mínimo na superfície de erro dos dados.
Para computar a soma sobre o conjunto de treinamento define-se a função custo total ou
energia,
ε =1M
M∑
i=1
ε(i) (3.13)
A estratégia geral para minimizar ε é baseada na técnica de mínimos quadrados.
30
Usa-se o gradiente localmente no espaço dos pesos para determinar um sentido de variação
dos pesos de modo a constituir um passo ∆wjlm para aproximar o sistema iterativamente de
um mínimo de ε(i). Para cada elemento do conjunto de treinamento, o passo é calculado da
seguinte forma:
∆wj (i)lm = −µ ∂ε
(i)
∂wjlm
(3.14)
onde 0 < µ < 1 é chamado taxa de aprendizado. Trata-se de um fator real que torna pequeno
o passo a ser dado para forçar as iterações e evitar instabilidades no método e é escolhido
por tentativas a partir de valores próximos de zero.
O ajuste dos pesos sinápticos para a camada de saída é obtido através da com-
paração dos valores desejados com os valores de saída d(i)m − yj=Ns (i)
m através da função custo
ε(i) e calcular o passo e o gradiente associados, usando a definição (3.9), tem-se
∂ε(i)
∂wjlm
=∂ε(i)
∂e(i)m
∂e(i)m
∂yNs(i)m
∂yNs(i)m
∂vNs(i)m
∂vNs(i)m
∂wjlm
= e(i)m · (−1) · ϕ′(vNs(i)
m ) · yNs(i)m (3.15)
Portanto, temos
∆wj (i)lm = µe(i)
m ϕ′(vNs(i)
m )yNs(i)m (3.16)
Ao final da soma sobre todo o conjunto de treinamento, o passo será
∆wjlm =
M∑
i=1
∆wj (i)lm . (3.17)
Cada ciclo completo, de ensinamento da RNA, compreende uma iteração de ensi-
namento (IE).
3.6 A função de ativação
O estado do neurônio é calculado através de uma função de transferência ϕ(.),
esta função pode ser linear ou não linear. Em sistemas digitais, essa função estabelece o
estado do neurônio como ativo ou não ativo, normalmente é adotado como nível lógico 0 e
nível lógico 1, ou +1 e −1. A função log sigmóide (logsig) (Figura3.6) é um exemplo muito
utilizado na estrutura de redes.
31
Figura 3.6: Função de ativação logsig.
Outra função importante é a tangente hiperbólica (tanh) (Figura 3.7 que apresenta
limites ente −1 e +1).
Figura 3.7: Função de ativação do tipo tangente hiperbólica.
Em ambientes analógicos, que é o caso da concentração de compostos na análise
qualitativa, por se tratar de valores representados por números reais, utiliza-se uma função
linear ou a parte linear da tanh ou da logsig.
Para o ajuste dos pesos da camada oculta não temos uma definição de e(i)m . A
32
minimização de ε se dá através da retropropagação, de forma supervisionada. As saídas do
conjunto de treinamento são aplicadas como estímulos reversos na RNA, da saída para a
entrada e o efeito é usado para gerar a correção nos pesos, com ajuste determinado pela
expressão 3.14, em busca de um mínimo através do mesmo processo baseado no valor do
gradiente, referenciado pela função custo (equação 3.13). A saída para cada neurônio da
camada anterior, o erro ou desvio de cada neurônio da camada de saída e a função custo
associada à soma dos desvios podem ser escritas respectivamente por
yj+1(i)l = ϕ
N1∑
n=0
wj+1nl yi
n
, (3.18)
e(i)m = d(i)
m − yj=Ns (i)m = d(i)
m − ϕ
N1∑
l=0
wj=Ns
lm y(i)l
, (3.19)
ε(i) =12
Ns∑
l=1
(e
(i)l
)2. (3.20)
De posse destes resultados, o gradiente pode ser computado do modo a seguir:
∂ε(i)
∂wN1lm
=∂ε(i)
∂yN1(i)m
∂yN1(i)m
∂vN1(i)m
∂vN1(i)m
∂wN1lm
(3.21)
Contudo, computando a dependência ε(i) = ε(i)(e(i)m ), temos
∂ε(i)
∂wN1lm
=
Ns∑
l=1
∂ε(i)
∂e(i)l
∂e(i)l
∂yN1(i)m
∂y
N1(i)m
∂vN1(i)m
∂vN1(i)m
∂wN1lm
(3.22)
Novamente, Podemos computar adicionalmente as dependências e(i)m = e(i)
m
(v
(i)l
)e v
(i)l =
v(i)l (y(i)
l ) para obter
∂ε(i)
∂wN1lm
=
Ns∑
l=1
∂ε(i)
∂e(i)l
∂e
(i)l
∂yNs(i)l
∂yNs(i)l
∂vNs(i)l
∂vNs(i)l
∂yN1(i)m
∂y
N1(i)m
∂vN1(i)m
∂vN1(i)m
∂wN1lm
. (3.23)
Deste modo, com o cálculo das derivadas, torna-se direta a obtenção do gradiente,
∂ε(i)
∂wN1lm
=
[Ns∑
l=1
e(i)l ϕ
′(vNs(i)l )wN1
lm
]ϕ′(vN1(i)
m )yN1(i)m yN1(i)
m . (3.24)
Assim,
∆wN1 (i)lm == µ
[Ns∑
l=1
e(i)l ϕ
′(vNs(i)l )wN1
lm
]ϕ′(vN1(i)
m )yN1(i)m yN1(i)
m (3.25)
33
Ao final da soma sobre todo o conjunto de treinamento, o passo para a penúltima camada
será
∆wN1lm =
M∑
i=1
∆wN1 (i)lm (3.26)
Essa minimização é otimizada no método Levenberg-Marquardt que é uma vari-
ação do método de Newton [18] com parâmetro µ conforme a equação 3.27 como método de
minimização do erro,
∆x = (JT (x)J(x) + µI )−1JT (x)e(x) (3.27)
em que I é a matriz identidade, J é a matriz jacobiana 3.28 [32] [33] [34]
J(W ) =
∂e1,1
∂w11,1
∂e1,2
∂w11,2· · · ∂e1,q
∂w11,q
∂e2,1
∂w12,1
∂e2,2
∂w12,2· · · ∂e2,q
∂w12,q
......
. . ....
∂ep,1
∂w1p,1
∂ep,2
∂w1p,2· · · ∂ep,q
∂w1p,q
(3.28)
e e(x) é o vetor de erros. O parâmetro µ é dinâmico e é aumentado quando se tem um aumento
do erro da rede e diminuído quando se tem uma diminuição no erro da rede, estabilizando o
treinamento.
O algoritmo pode ser representado na seguinte forma:
34
Algoritmo de Levenberg-Marquardt
x← Amostras de entrada
y← Amostras de saída em função de x
Início:
n← 0
α← maxdiag(JTJ)
ys ← 0 (simulado pela RNA)
Enquanto n < nmáximo faça
∆W = −[JT (W )J(W ) + µ× I )]−1JT (W )e(W )
Wn+1 ←Wn + ∆W0
Se en(W) < en−1(W)
Wn ←Wn
n← n + 1
Fim Se
Fim Enquanto
Fim
O termo que atualiza os pesos é
∆W = −JT (W )J(W ) + µ× I )−1JT (W )e(W ). (3.29)
A cada época as matrizes de pesos são atualizadas de acordo com a equação 3.30.
Wt+1 = Wt + ∆W (3.30)
em que t é a variável que representa a época do treinamento. Desta forma a equação 3.30 é
computada até uma minimização da energia da rede a um valor desejado.
3.7 Conclusões
Neste Capítulo foram tratadas as informações básicas de um modelo de RNA, cuja
estrutura são neurônios “clássicos” modelados matematicamente e implementados sob as re-
35
gras da Computação Clássica. A eficiência dessa estrutura limita-se à eficiência do sistema
computacional (computador clássico) utilizado, dando incentivo à busca de um sistema com-
putacional mais eficiente como o computador quântico e a Computação Quântica, a serem
tratados no Capítulo 6.
As RNAs apresentam-se como uma ferramenta prática para o estudo de sistemas
complexos e seus conceitos já estão bem estabelecidos, e com uma ampla abertura para a
exploração de suas capacidades em várias áreas da ciência. Em relação ao comportamento da
RNA, pode-se observar que extrapolação aos dados de treinamento ainda devem ser alvo de
estudo, uma vez que a validação do treinamento se dá em função de informações conhecidas.
A informação física contida na estrutura da RNA nem sempre pode ser identificada, pois
redes de estruturas diferentes podem representar um mesmo sistema. Por exemplo, uma
RNA com uma camada de neurônios ocultos pode representar o mesmo sistema que uma
RNA de uma única camada, desta forma, os coeficientes que representariam um sistema
teriam significados diferentes e distribuídos ao longo da estrutura da RNA.
No Capítulo a seguir, será mostrado o desenvolvimento de uma aplicação da RNA
clássica no tratamento um sistema físico, em que dados de um modelo disponível na literatura
serão comparados. Este estudo teve como objetivo caracterizar uma estrutura de RNA para
servir de base comparativa para a rede neural quântica desenvolvida e discutida no Capítulo
8.
36
Capítulo 4
A função de distribuição radial
modelada via RNA
4.1 Introdução
Esta parte do trabalho tem o objetivo de apresentar uma aplicação de uma RNA
em um sistema físico-químico e gerar informações sobre o comportamento de uma RNA para
auxiliar na modelagem de uma RNAQ tratada no Capítulo 8.
Vários modelos de função distribuição radial são propostos na literatura [35, 36],
baseados em ajustes polinomiais. Estes ajustes polinomiais são reconhecidamente problemas
mal colocados, pois envolvem a inversão de matriz de transferência e matriz de Hilbert, como
no caso estudado neste capítulo. A distribuição radial é um fator importante no estudo de
líquidos.
Um sistema composto por átomos em um ambiente de duas dimensões pode ter
seu comportamento estudado utilizando-se o método de Monte Carlo. O estudo teórico de
um sistema caracterizado como um líquido envolve um processo de modelagem em que os
átomos e moléculas são representados por aproximações geométricas e suas interações repre-
sentadas por potenciais. DesDestaca-se, no presente estudo, determinação da distribuição
de partículas em um líquido representadas por uma função caracterizada pela distância e
37
interação entre as partículas. Propriedades termodinâmicas, bem como informações sobre
estruturas de líquidos, podem ser obtidas pela função distribuição radial [37]. O Cálculo
da pressão, da energia interna e energia livre de Helmholtz [38] são alguns exemplos das
propriedades possíveis de serem calculadas. Neste trabalho foi explorado o modelo desenvol-
vido por Morsali [35]. A distribuição radial g(r) pode ser obtida experimentalmente através
de espalhamento de nêutrons, espalhamento de raios-x, ou técnicas de simulação utilizando
Monte Carlo.
Em um líquido constituído por um gás nobre, a função de distribuição radial g(r)
indica, a partir de um átomo ai, de raio r, a probabilidade de se encontrar um segundo átomo
aj, a uma distância r + dr. Em um sistema de densidade volumétrica ρ, a densidade, a uma
distância r, é ρ(r) sendo g(r) = ρ(r)ρ
. Em distâncias relativamente maiores, a função g(r)
tende a 1, indicando que a densidade é a mesma do líquido. Através da difração de raios-x,
é possível observar que a densidade de partículas oscila em função da distância.
4.2 O modelo de Morsali
O modelo de Morsali, para a representação da distribuição radial, foi obtido da
modelagem de um fluido de Lennard-Jones, cujo potencial é representado pelo potencial de
Lennard-Jones
EP (R) =C12
R12− C6
R6(4.1)
em que R é a distância, C12 e C6 são constantes relacionadas ao alcance do potencial em
termos da parte repulsiva e da parte atrativa, detre outros, representa a interação entre duas
partículas [39], que também pode ser escrito na forma
V (r) = 4ǫ
k
[(σ
r
)12
−(σ
r
)6]
(4.2)
em que as constantes ǫ/k e σ valem 119, 8K e 3, 405 Å, respectivamente. No modelo de
Morsali a função de distribuição radial é calculada através de duas equações, em função da
distância r, em Angström (Å), entre as partículas.
Neste enfoque a função radial depende da distância reduzida r∗ = r/σ, da tempe-
ratura T ∗ = (kT )/ǫ e da densidade ρ∗ = ρσ3, em que k, σ, ǫ, r, T , and ρ são a constante de
38
Boltzmann, o parâmetro de comprimento da função do potencial de Lennard-Jones (3, 405Å),
o parâmetro de energia da função do potencial de Lennard-Jones (ǫ/k = 119, 8 K), a distância
entre as partículas, a temperatura absoluta e a densidade, respectivamente. Para valores de
r∗ > 1 tem-se a seguinte expressão:
g(r∗, T ∗, ρ∗) = 1 + (r∗)2e[−(ar∗+b)]sen[(cr∗ + d)] + (r∗)−2e−(gr∗+h)cos(kr∗ + 1). (4.3)
Para valores de r∗ ≤ 1, tem-se a equação
g(r∗, T ∗, ρ∗) = s e[−(mr∗+n)]4 , (4.4)
em que o parâmetro a(T, ρ) e o parâmetro g(T, ρ) são calculados através de uma expressão
com nove constantes, os parâmetros b(T, ρ) e h(T, ρ) são calculados através de uma expressão
com três constantes, os parâmetros c(T, ρ) e k(T, ρ) são calculados através de uma expressão
com oito constantes, os parâmetros d(ρ) e l(ρ) são calculados através de uma expressão
com quatro constantes e o parâmetro s(T, ρ) é calculado através de uma expressão com oito
constantes. Esses parâmetros determinam o formato a oscilação amortecida da função de
distribuição radial. O parâmetro m(T, ρ) é calculado através de uma expressão com seis
constantes e o parâmetro n(T, ρ) é calculado através de uma expressão com três constantes.
Esses dois parâmetros determinam o decaimento do primeiro pico da função de distribuição
radial. São ao todo 65 constantes, como descrito na referência [35].
4.3 O modelo de Bamdad
Um segundo modelo apresentado por Bamdad (2006) [36] é calculado pelas equa-
ções
g(r) = α2r∗−α3e−α4u + α5r
∗10, (4.5)
em que u = (α1
r)12 − (α1
r)6, para valores de r∗ ≤ 1, 55 e
g(r) = β1−β3e−β3(r∗−β4)cos(β5r∗−β4), (4.6)
para valores de r∗ > 1, 55, αi e βi são parâmetros ajustáveis e dependentes da temperatura e
densidade. Bamdad determinou, através da dinâmica molecular clássica, usando o algoritmo
de Verlet [40], o valor de g(r) para dezesseis temperaturas, combinadas com onze densidades,
39
dando um total de 1408 constantes, devido às características do métodos.
Os modelos de Morsali e o de Bamdad são dependentes de r, ρ e T , sendo que uma
variável deve ser considerada constante para o estudo da dependência das outras, havendo a
necessidade de um novo cálculo a cada estudo e a consulta dos dados tabelados.
Estes ajustes polinomiais são reconhecidamente problemas mal colocados, pois en-
volvem a inversão da matriz de transferência e da matriz de Hilbert, conforme será abordado
no presente estudo. Desta forma, qualquer algoritmo: menos a rede neural, decomposição em
valores singulares (SVD), Tikhonov, ou outras técnicas de resolução de problemas inversos,
terão, obrigatoriamente, de tratar os erros experimentais de forma média, ou ignorá-los, uma
vez que dados provenientes de experimentos possuem erros de medida e comprometem os
três fatores característicos que são: a existência, a continuidade e a unicidade da solução um
problema.
4.4 Simulação de líquidos via redes neurais em função
de r
A implementação de redes neurais, baseadas nos ajustes polinomiais propostos
no modelo teórico de Morsali e de Bamdad, possibilitou otimizar o volume de dados, uma
vez que a estrutura compreende as equações do modelo. Houve o aumento da resolução
da expressão para o cálculo da função de distribuição radial g(r) via RNA, pois, em uma
comparação com o trabalho de Bamdad, em que foi necessário fazer a escolha de parâmetros,
em uma tabela contendo 1936 valores, para que o seu modelo pudesse reproduzir a distribuição
radial, mostrou que no caso da RNA, os parâmetros foram compactados e distribuídos em
sua estrutura.
Em um primeiro estudo, foi modelada uma RNA para reproduzir o polinômio de
Morsali [35], ou seja, a distribuição de partículas em função de r de um fluido de Lennard-
Jones. Foi proposto um fluido composto por 2000 átomos de argônio. Foram calculados 1.021
pontos utilizando o polinômio de Morsali g(r∗, T ∗, ρ∗) para o treinamento da RNA (Figura
4.1), com a densidade ρ∗ = 0, 8880 a uma temperatura de T ∗ = 1, 095.
40
0 1 2 3 4 5 60
0.5
1
1.5
2
2.5
3
Figura 4.1: Pontos calculados utilizando-se o polinômio de Morsali.
Desta forma o estímulo de entrada da RNA (Figura 4.2) foi um vetor composto
por amostras dos valores de g(r) para diferentes valores de r∗. Portanto, o par [r, g(r)]
(entrada e saída, respectivamente), foi usado no treinamento. A equação 4.7 foi proposta
Figura 4.2: Modedo de um RNA para estudo de g(r).
41
para representar a estrutura da rede para aprendizado e reprodução desses dados.
g(r∗)ρ∗,T ∗ = b2 +i=11∑
i=1
tanh(w1ir∗ + b1j
)w2i. (4.7)
Esta equação representa uma rede de uma entrada, numericamente representada
pela variável r∗, uma camada intermediária com 11 neurônios conectados à entrada através
dos elementos w1ida matriz de pesos W1 com ativação sigmoidal e uma camada de saída com
um neurônio de saída linear, que representa g(r) (Figura 4.2). A saída é conectada à camada
intermediária através dos elementos w2ida matriz de pesos W2. Inicialmente, os valores para
as constantes w1i, w2i
, b1ie b2 são atribuídos aleatoriamente. Utiliza-se, então, o processo de
treinamento para se adequar os valores das constantes para a reprodução de g(r).
4.5 Resultados obtidos
Após o treinamento, com 25 etapas, os valores obtidos para as constantes foram
validados por comparação com os dados originais obtidos do polinômio de Morsali. Os parâ-
metros para o uso da equação 4.7 estão relacionados na Tabela 4.1, contabilizando um total
de 34 constantes. A Figura 4.3 mostra uma comparação de g(r) gerado através do polinômio
Tabela 4.1: Constantes geradas para a equação 4.7 para um sistema contendo 2000 átomosde argônio
i w1ib1i
w2ib2
1 3,2774 -12,0874 0,1956 0,46292 -4,5659 12,4266 -0,2123 -5,2150 11,6863 0,27174 -2,4162 13,4045 -0,36075 -6,3519 11,2272 -0,37956 -6,2501 7,0526 1,84017 -3,9864 12,7773 0,18038 -3,0802 12,7413 0,14299 -2,7038 12,5644 -0,269310 -18,5651 18,3682 -2,08311 1,1669 -6,2083 -0,6699
42
de Morsali e g(r) gerado através da rede após o treinamento, em que a correspondência física
para os parâmetros está distribuída ao longo da estrutura da rede.
0 1 2 3 4 5 60
0.5
1
1.5
2
2.5
3
r
g(r)
Figura 4.3: Comparação entra os pontos gerados para g(r), em que a linha contínua representag(r) obtido por Morsali e as cruzes representam g(r) gerada pela rede.
Ademais, será apresentada uma significativa redução no números de parâmetros
para se calcular g(r) baseada na implementação de uma RNA.
Simulação de líquidos via redes neurais em função de r e ρ
43
A rede proposta para se calcular g(r∗, ρ∗) foi representada pela expressão
g(r∗, ρ∗)T ∗ = b2 +(
i=I1,j=J1∑
j=1,i=1
w2kjtanh
[ i=I2∑
i=1
(b1j
+j=J2∑
j=1
w11ir∗ + w12i
ρ∗)])
(4.8)
em que os índices i e j representam os neurônios das camadas. A RNA modelada para o cálculo
de g(r, ρ)T possui em sua estrutura, 23 neurônios na camada intermediária estruturada de
acordo com a Figura 4.4.
Figura 4.4: RNA para o cálculo de g(r, ρ).
O dados de treinamento para a entrada da RNA (r e ρ) o os dados de saída
(g(r, ρ)), alvo do treinamento, estão representados graficamente na Figura 4.5.
Os pesos foram gerados de forma aleatória para o início do treinamento. Da mesma
forma que foi feito para g(r) na seção anterior, os pesos foram treinados para g(r∗, ρ∗). Neste
caso foram geradas 1021 amostras do sistema, permutando-se diferentes valores de r e ρ,
com 0, 8000 ≥ r∗ ≤ 5, 9010 e 0, 50 ≥ ρ∗ ≤ 0, 88, respectivamente. Foram necessárias 10.000
épocas (etapas de treinamento) para o completo treinamento da RNA. A função de custo
total representada pela equação 3.13 no Capítulo 3, cujo valor antes do treinamento era da
44
01
23
45
6 0.5
0.6
0.7
0.8
0.9
0
0.5
1
1.5
2
2.5
3
ρ
r
g(r)
Figura 4.5: Superfície para o treinamento da RNA.
45
ordem de 104, teve seu valor minimizado a 0.3420. O decaimento do erro da RNA para as
100 primeiras etapas de treinamento está representado no gráfico da Figura 4.6.
0 10 20 30 40 50 60 70 80 90 1000
2000
4000
6000
8000
10000
12000
Etapas de treinamento
Err
o (C
usto
tota
l)
Figura 4.6: Decaimento do erro da RNA para o conjunto de dados [r, ρ, g(r, ρ)].
A Figura 4.7 mostra uma sobreposição de uma superfície para g(r) para diferentes
valores de ρ e de r (0, 8000 ≥ r ≤ 5, 9010 e 0, 50 ≥ ρ ≤ 0, 88 ) obtido por Morsali e
uma superfície gerada por uma única expressão g(r, ρ) representada pela RNA. O tempo de
execução do algorítimo de treinamento foi de 438,1 s.
46
0 1 2 3 4 5 60.5
1
−1
0
1
2
3
4
5
6
ρr
g(r)
Figura 4.7: Comparação entre a superfície prevista (superior), que foi deslocada três unidadesde g(r) para cima, somente para efeito de comparação com a superfície a simulada (inferior).
47
Uma terceira rede foi proposta para representar a distribuição radial de forma
mais abrangente. Esta foi a principal rede gerada para o estudo da função g(r). A dimensão
da RNA foi ampliada para aceitar como entrada, além do r e ρ, a temperatura T . Portanto,
uma RNA capaz de reproduzir o valor de g(r), seja este obtido experimentalmente ou através
de modelos, em função de três variáveis, em uma única expressão, foi modelada e treinada.
A expressão modelada para esta RNA foi
g(r, ρ, T ) = b2 +(
i=I1,j=J1∑
j=1,i=1
w2kjtanh
[ i=I2∑
i=1
(b1j
+j=J2∑
j=1
w11ir + w12i
ρ+ w13iT)])
(4.9)
Para a modelagem desta rede foram usados três nós de entrada (r∗, ρ∗, T ∗), 27
neurônios na camada intermediária e um neurônio de saída (g(r, ρ, T )) como representada na
Figura 4.8.
Figura 4.8: RNA modelada para o cálculo de g(r, ρ, T ).
A função custo total foi minimizada a 0,02 após 20.000 etapas de treinamento. O
48
tempo de execução do algorítimo de treinamento foi de 2427 s. A Tabela 4.2 contém os pesos
w1 e bias b1 referentes à primeira camada de neurônios.
Tabela 4.2: Constantes geradas para a equação 4.9 para a RNA
w1(Coluna1) w1(Coluna2) w1(Coluna3) b1
-1.7011 -0.6454 -0.1085 7.05216.1692 -0.6929 0.5742 -6.94141.8349 2.7974 0.2593 -11.2092-2.6254 -0.5495 -0.0059 4.94972.3948 3.0926 -0.0877 -10.1368-1.8328 -2.7110 -0.2451 12.4464-1.3311 -1.2606 0.0054 4.1984-1.4295 7.2869 0.1405 0.001519.5939 0.1704 0.5445 -19.8880-1.5851 -1.6570 0.0147 5.5395-6.1343 0.7639 -0.5876 6.87631.6861 0.7160 0.1010 -7.01801.7422 2.0199 -0.0293 -6.2529-1.7138 9.7930 0.1563 -0.743819.8798 0.5717 0.5276 -20.35932.9664 0.7535 0.3227 -8.47079.5486 1.6501 0.3088 -11.7738-1.5891 8.6997 0.1505 -0.4216-1.3618 -1.3125 0.0059 4.5325-2.5938 -0.3534 -0.0184 4.8076
350.2151 -346.3401 222.6812 -271.10089.6003 8.3707 6.3268 -20.8263-1.7380 -2.4686 -0.2433 11.7342-2.6336 -0.7093 0.0061 5.02851.3214 -6.3172 -0.1311 -0.2980-1.6321 -2.2166 -0.2384 10.9424-19.6351 -0.3656 -0.5377 20.0254
A Tabela 4.3 contém os pesos w2 e bias b2 referentes à camada de saída.
A Figura 4.9 mostra uma comparação entre a função g(r) desejada e a função
g(r) reproduzida pela RNA, em função de r∗, ρ∗ = 0, 6 e T ∗ = 0.9. A Figura 4.10 mostra
uma comparação entre a função g(r) desejada e a função g(r) reproduzida pela RNA, em
função de r∗, ρ∗ = 0, 6 e T ∗ = 1.0. A Figura 4.11 mostra uma comparação entre a função
g(r) desejada e a função g(r) reproduzida pela RNA, em função de r∗, ρ∗ = 0, 7 e T ∗ = 1.0.
49
Tabela 4.3: Constantes geradas para a equação 4.9 para a RNA
wT2 b2
36.9206 0.4923-45.78110.4570
-94.85560.600026.3762
-100.6848109.8535-96.5782-168.9971-42.658840.2492-54.718040.3347-91.33520.53791.8265
-102.1729219.904641.3329-0.00850.0198
-55.192953.768948.538229.3006
-189.7436
50
0 1 2 3 4 5 60
0.5
1
1.5
2
2.5
r*
g(r*
,ρ*,
T*)
Figura 4.9: comparação entre a função g(r) desejada (linha) e a função g(r) (círculos) repro-duzida pela RNA, em função de r∗, ρ∗ = 0, 6 e T ∗ = 0.9.
51
0 1 2 3 4 5 60
0.5
1
1.5
2
2.5
r*
g(r*
,ρ*,
T*)
Figura 4.10: comparação entre a função g(r) desejada (linha) e a função g(r) (círculos)reproduzida pela RNA, em função de r∗, ρ∗ = 0, 6 e T ∗ = 1.0.
52
0 1 2 3 4 5 60
0.5
1
1.5
2
2.5
r*
g(r*
,ρ*,
T*)
Figura 4.11: comparação entre a função g(r) desejada (linha) e a função g(r) (círculos)reproduzida pela RNA, em função de r∗, ρ∗ = 0, 7 e T ∗ = 1.0.
53
4.6 Conclusões
Foi possível utilizar a rede como uma expressão única para o cálculo de g(r). Esta
evidência possibilitou o estudo de uma RNA estruturada em função de r, T e, posteriormente,
ρ. Os resultados desta etapa do trabalho serviram como prova de conceito na utilização
da RNA em cálculos que envolvem grandezas com significados físicos. A capacidade de
compactação de dados da RNA foi explorada. Uma vantagem no uso da rede está ligada
à sua versatilidade em generalizações. Basicamente a estrutura da rede foi modificada de
acordo com a quantidade de variáveis utilizadas no cálculo da distribuição radial. A mesma
estrutura básica foi utilizada nos três estudos, tendo sido somente o número de neurônios
modificado. O efeito do aumento de neurônios, para cada aplicação, demandou um aumento
do tempo de treinamento.
A descontinuidade das equações dos modelo de Morsali exigia que duas expressões
fossem utilizadas, uma para valores de r∗ > 1 e outra para valores de r∗ ≤ 1 para representar
a função de distribuição radial g(r). Com a RNA foi possível reproduzir com uma única
equação toda a faixa de valores de r∗, o que evidencia a vantagem em utilizar a RNA como
uma função de ajuste. A mesma comparação pode ser feita com o modelo de Bamdad, que
também utilizou diferentes equações para diferentes faixas de valores de r∗
Concluímos, através da obtenção da minimização da função custo total, que a
RNA foi eficaz na interpolação entre uma superfície e uma variável, uma vez que foi possível
criar uma expressão em duas e três dimensões. O principal aspecto na utilização da RNA,
na representação de g(r), está caracterizado na dimensão de sua equação. As equações
dos modelos de Morsali e de Bamdad eram unidimensionais em função somente de r∗, um
conjunto de dados tabelados era utilizado nas equações para valores de ρ∗ e T ∗ específicos.
Uma outra grande vantagem da RNA foi agrupar em uma única equação a de-
pendência do g(r) de ρ∗ e T ∗, permitindo obter qualquer valor de g(r) dentro da faixa de
treinamento. Portanto, infinitos valores de g(r), entre os limites de treinamento podem ser
reproduzidos.
54
Capítulo 5
O estudo dos estados ligados de
dímeros com o He via RNA clássica
5.1 Introdução
A capacidade de uma RNA em correlacionar superfícies de dados, possibilita acei-
tar dados, obtidos de processos de modelagem matemática e computacional, como dados
experimentais, desde que estes estejam devidamente validados e representem com fidelidade
o sistema real. Assim, com o objetivo de explorar a rede neural artificial, como uma impor-
tante ferramenta em interpolação e correlacionamento de superfícies de dados, na modelagem
em físico-química e, sendo o presente trabalho teórico e computacional, as informações ex-
perimentais poderiam ser obtidas de um banco de dados provenientes de experimentos ou
através de modelagem matemática e computacional dos sistemas a serem estudados. Desta
forma, dados obtidos através da modelagem de um sistema físico-químico, foram usados du-
rante o desenvolvimento do modelo e informações novas foram geradas. Além de servir como
fonte de dados para o treinamento de uma RNA, foram geradas informações suficientes para
uma publicação na área, como demonstrado no artigo publicado em 2012, durante o desen-
volvimento deste trabalho1. Neste artigo, estão descritas as principais informações utilizadas
nesta modelagem, bem como os resultados obtidos para serem utilizados na modelagem da
1LEMES, N. H. T.; VITERBO, V. D.; SEBASTIAO, R. C. O. and BRAGA, J. P.. Parametric sensitivityanalysis for the helium dimers on a model potential. Quím. Nova, São Paulo , v. 35, n. 5, 2012
55
RNA, na sequência do trabalho.
A análise sensitiva de parâmetros de um potencial para hélio e o número de estados
ligados para as moléculas de HeNe, HeAr, HeKr e HeXe, foram os itens da primeira parte
desta tese. O número de estados ligados, que esses dímeros de gases raros podem suportar,
em diferentes momentos angulares, serão apresentados e discutidos.
O método de fase variável, em conjunto com o teorema de Levinson, foi usado
para explorar o processo de espalhamento quântico em colisões de baixa energia, usando o
potencial de Tang e Toennies. Estes dímeros, podem suportar um estado ligado, mesmo para
um momento angular igual a cinco, como no caso do dímero HeXe. Estados vibracionais
excitados, com momento angular zero, também são possíveis para HeKr e HeXe. A partir de
análise sensitiva tem-se uma ordem aceitável de magnitude nos parâmetros dos potenciais.
Uma RNA clássica foi estruturada para determinar a formação de estados ligados
em dímeros de He, a partir de uma correlação dos pares de átomos, com seus respectivos
possíveis estados ligados, além de servir de prova de conceito na modelagem e na análise
da capacidade de aprendizado de uma RNA clássica, direcionada à utilização em proble-
mas físico-químicos, em relação ao comportamento do sistema, como base para a posterior
modelagem da RNA quântica.
56
5.2 Análise da formação de estados ligados em dímeros
de He
As informações, teóricas obtidas através de modelagem, em conjunto com as infor-
mações experimentais, são importantes itens para se determinar as propriedades e interações
entre átomos e permitem determinar a qualidade de potenciais. Esses potenciais devem
reproduzir, dentro de um erro experimental, uma ampla gama de dados experimentais. Po-
tenciais podem ser obtidos por um processo direto [41], com parâmetros de ajustes, para se
adequar aos dados experimentais, ou de forma inversa [42], tratando primeiramente os dados
de forma a se reproduzir o potencial necessário.
A informação dos estados ligados pode ser obtida da matriz de espalhamento S,
representada pela expressão
S =
e
i(η++η−)cos(η+ − η−), iei(η++η−)sen(η+ − η−)
iei(η++η−)sen(η+ − η−), ei(η++η−)cos(η+ − η−)
(5.1)
em que η+ e η− são dois deslocamentos de fase, que contém toda a informação necessária para
o processo de colisão [43]. O cálculo da matriz de espalhamento pode ser obtido resolvendo
a equação de Schrödinger independente do tempo [44],
d2ul(R)dR2
+
[k2 − l(l + 1)
R2− 8πµ
h2 Ep
]ul(R) = 0 (5.2)
em que h = h2π
, h é a constante de Planck, l é o momento angular, R é a coordenada do
espalhamento, µ é a massa reduzida do sistema e ul(R) é o potencial, que exigirá basicamente
as seguintes etapas: a) Determinação das condições iniciais para a função de onda; b) Solução
numérica da equação de Schrödinger e c) Determinação das condições de contorno para a
função de Bessel para a condição final.
Existem vários métodos para resolver a equação de Schrödinger como, por exem-
plo, o método das log-derivadas e o método de Numerov, discutidos por Braga [44]. Este
procedimento numérico pode ser simplificado usando uma propriedade importante da matriz
de espalhamento: a matriz S que é uma relação das amplitudes e a normalização total da
função de onda que é irrelevante.
57
Este é o aspecto fundamental para a aproximação de fase variável [45] no es-
palhamento elástico, uma alternativa teórica e um método computacional para matriz de
espalhamento descrita. A análise no presente trabalho será baseada no procedimento direto,
usando o método da fase variável para descrever o processo do espalhamento quântico.
Para um dado potencial ul(R) a condição de contorno pode ser dada por
ul(R) ∝ e−(kRl lπ2
) − Se+(kR− lπ2
) ∝ sen(kR− lπ
2+ δl) (5.3)
em que S é a matriz de espalhamento, Sl = e2iδl e δl denota o deslocamento de fase.
A matriz de espalhamento S, calculada para um dado potencial, possibilita exe-
cutar um teste mais sensível de sua qualidade, portanto médias não devem ser envolvidas.
Portanto, pequenas variações nos parâmetros do potencial, podem causar um efeito mensu-
rável em S, como será discutido. Juntamente com o método de fase variável, a aplicação do
teorema de Levinson será explorada. Este teorema importante relaciona o número de estados
ligados que uma molécula pode suportar, usando cálculos de matrizes de espalhamento com
energias insignificantes de colisão [43,46].
A análise sensitiva dos parâmetros de um potencial, de dímeros de gases nobres,
e o efeito na formação de estados ligados, foram explorados nesse trabalho. Foi discutido
como um espectro é afetado pela variação dos coeficientes de espalhamento de longo e curto
alcance. Esta análise serviu para se definir valores toleráveis para a propriedade em questão
e, portanto, os limites apropriados para qualquer potencial. O potencial a ser utilizado, no
presente estudo é o potencial genérico proposto por Tang e Toennies [47], embora outros
potenciais estejam disponíveis, em especial para a interação hélio-hélio [48]. No entanto, o
potencial de Tang e Toennies está caracterizado para várias moléculas e é apropriado para
inverter dados, em outros estudos sobre o assunto.
Esta etapa é importante como um estudo preliminar de clusters (aglomerados)
de gases nobres [49]. Esses clusters podem ser estudados usando mecânica clássica, em um
processo análogo ao usado em clusters de átomo-molécula [50, 51]. Para clusters compostos
por hélio e neônio, os efeitos quânticos são importantes, embora a aproximação clássica seja
viável para clusters partindo do argônio [52]. Informações sobre a estrutura dos estados
ligados, de gases nobres, foram obtidas e podem ser usadas como motivação para estudos em
clusters de gases nobres, usando a dinâmica quântica e a clássica [53].
58
O método da fase variável apresenta-se como uma ferramenta importante no es-
tudo da formação de estados ligados entre átomos, em especial, o átomo de He com alguns
outros gases nobres.
5.2.1 O método da fase variável
Para colisões atômicas, a matriz de espalhamento pode ser substituída pelo des-
locamento da fase δ. Este deslocamento da fase traz informações sobre o quanto a fase, para
uma função de onda calculada para um potencial real, é deslocada em comparação com uma
função de onda com potencial zero. A partir dessa diferença de fase, as quantidades em
relação ao espalhamento podem ser calculadas. A ideia principal do método da fase variável
(MFV) consiste em definir uma função de energia potencial EP (R), que seja válida a uma
certa distância, ρ e zero para valores superiores. As condições de contorno são aplicadas a ρ
que é então é propagada. O deslocamento da fase, calculado para o parâmetro ρ, é construído
quando este limite é movido para uma longa distância. Portanto, para o potencial
U(R) =
Uρ(R) 0 ≤ R ≤ ρ
0 R > ρ(5.4)
em que, U(R) = 2µ
h2Ep(R), µ é a massa reduzida do sistema, procura-se a solução na forma,
φP (R) = α(ρ)sen(kR + δ(ρ)) com k2 = 2µ
h2E. A amplitude e a fase, neste caso, dependem
do parâmetro ρ. No limite ρ → ∞ a fase obtida corresponderá ao potencial real Ep(R). A
solução é considerada para duas regiões, tal como, φ(R) para 0 ≤ R ≤ ρ e φρ(R) para R ≥ ρ.
O método de busca para a solução φ(R) e para R ≥ ρ corresponde a uma função de onda da
partícula livre,
φρ(R) = α(ρ) sin(kR + δ(ρ)) (5.5)
para obter, a partir da equação de Schrödinger, uma equação para a função de onda log-
derivativa, Yρ(R) = 1φρ(R)
dφρ(R)dR
,
dYρ(R)dR
+ k2 − Uρ(R) + Y 2ρ (R) = 0. (5.6)
59
A continuidade da função de onda na fronteira fornece
dδ(ρ)dR
= −Uρ(R)k
sin2(kR + δ(ρ)) (5.7)
que é uma equação diferencial de primeira ordem para a fase. A condição inicial, δ(R0) =
−kR0, em que R0 é um valor inicial para o raio, junto com a condição final δ = δ + lπ2 que
agrega uma possível contribuição centrífuga e possibilita determinar o deslocamento de fase
e a matriz de espalhamento. A equação 5.7 é a equação básica de fase variável.
A potencialidade do método foi enfatizada por F. Calogero numa série de artigos
derivados do MFV para o caso geral [54]. Uma equação para a matriz de espalhamento, ao
invéz da fase, foi estabelecida. No entanto, a equação para a fase é mais atrativa, uma vez
que assume uma forma real e de simples interpretação. Exemplos numéricos foram dados
por Calogero para um potencial exponencial e para um potencial constante [55]. O método
da equação de fase também foi popularizado por F. Calogero, principalmente por causa de
seu livro, escrito em 1967 [45].
O método de fase variável não tem sido explorado de forma apropriada, mesmo
para o caso de uma dimensão. O número de estados ligados pode ser facilmente obtido
no limite de energia de colisão zero, utilizando a equação de fase. Isto exige que equação
diferencial de primeira ordem seja integrada à curta distância. Por outro lado, pode-se
integrar a equação de Schrödinger, e isso envolverá uma distância muito grande, se o estado
ligado tiver uma energia muito pequena. Este é o caso dos dímeros estudados aqui, como será
discutido. O método também pode ser formulado em várias dimensões, [56], embora uma
comparação entre este método e as bem estabelecidas equações acopladas [57] não tenha sido
realizado. A matriz S pode ser obtida a partir da fase pela relação
S = ei2δ = cos(2δ) + isen(2δ) (5.8)
em que δ é a fase [58].
O potencial de Morse
Ep(R) = De(1− e−α(R−Re))2 −De (5.9)
em que De =1136 Å−2, α = 2.4Å−1 e Re =0.74Å [59], que são valores aproximados para
interação do hidrogênio, foi usado para ilustrar esse método.
60
A matriz de espalhamento, calculada a partir do método de fase variável e a partir
do método de Numerov, que é muito preciso, foram renormalizadas e são apresentados na
tabela 5.1. Os resultados são quase idênticos, indicando a validade do algoritmo de fase
variável. As parte real e imaginária, da matriz de espalhamento são dadas pela equação 5.8.
Tabela 5.1: Comparação de S obtida via o método de Numerov (assumido como “exato”) evia método da fase variável (calculado)
l Scalculado Sexato
0 -0.2521-i0.9677 -0.2521-i0.9677
1 -0.5164-i0.8563 0.5164+i0.8563
2 -0.9452-i0.3266 -0.9452-i0.3265
4 0.3851+i0.9229 0.3852+i0.9228
Os resultados indicam que o método de fase variável fornece respostas exatas
essenciais e pode ser mais explorada.
5.2.2 O potencial de dímeros de gases nobres
Estabelecer a função de energia potencial global é o primeiro passo crucial na
análise dinâmica clássica ou quântica. A função de energia potencial é, geralmente, aproxi-
mada por um potencial modelo, com parâmetros obtidos de dados experimentais disponíveis,
combinados com cálculos quânticos eletrônicos [60]. Dentro de outro enfoque, o potencial
pode ser obtido diretamente através da inversão de dados. Este irá produzir potenciais para
a propriedade experimental em estudo. Sebastião (2003) [25] obteve um potencial de alta
qualidade para reproduzir o segundo coeficiente do virial, tratando o sistema como um pro-
blema inverso e Lemes (2008) [42], também, dentro dessa abordagem, reproduziu a seção de
choque diferencial . No último caso, o potencial foi invertido usando a primeira aproximação
de Born. No entanto, para aumentar a precisão de um potencial invertido tem de se usar
uma teoria mais precisa, tal como um cálculo quântico completo.
Potenciais modelo têm que ser flexíveis para representar uma ampla gama de mo-
léculas. Este é o caso para o potencial descrito na referência [60], que utiliza uma tangente
hiperbólica para amortecer os termos de longo alcance, embora estes termos tenham uma
contribuição para o curto alcance também. Outro potencial, descrito por Slawomir e Toczy-
lowski [61], também é usado para discutir energias dos estados ligados em dímeros de gases
61
nobres, limitados para espécies a partir de hélio até o argônio. Este potencial está restrito a
estas espécies e não pode ser utilizado para outras moléculas de gases raros.
Um com uma função de amortecimento com contribuição zero em curto alcance,
foi desenvolvido por Tang e Toennies [47] na forma,
Ep(R) = Ae−bR −∑
n=3,4,5
(1− f2n(bR)e−bR)C2nR−2n (5.10)
com fm(R) =∑m
p=0xp
p! com parâmetros para 21 moléculas diatômicas de gases nobres estão
relacionados na referência [47]. Os parâmetros A e b, em conjunto com coeficientes de
dispersão foram tabelados. A função de amortecimento depende apenas no parâmetro b.
Os parâmetros C6, C8 e C10 correspondem aos termos relacionados ao alcance do potencial.
Estes cinco parâmetros, por conseguinte, definem completamente o potencial. Dentre as 21
moléculas disponíveis, o presente trabalho se concentra nas moléculas, HeHe, HeNe, HeAr,
HeKr e HeXe. Este conjunto de moléculas será suficiente para estabelecer a confiança nos
estudos sobre o assunto. Os dados para este conjunto de moléculas estão na Tabela 5.2 [47].
Tabela 5.2: Parâmetros para o potencial de Tang (em unidades atômicas) para dímerosformados por He e outros gases nobres.
Sistema A b C6 C8 C10
HeHe 41,96 2,523 1,461 14,11 183,6HeNe 98,02 2,496 3,029 36,18 545,1HeAr 124,3 2,153 9,538 167,5 3701HeKr 118,9 2,025 13,40 280,0 7257HeXe 95,90 1,853 19,54 525,0 16670
Outros potenciais para os dímeros de gases nobres, estão disponíveis, em especial
para o sistema de hélio diatômico, que foi estudado em mais detalhes. Por exemplo, Varandas
[48] apresentou um potencial de interação hélio-hélio, que tem uma precisão de um centikelvin
no mínimo. O hélio diatômico também tem sido estudado por teoria da perturbação [62].
Os efeitos relativísticos também foram incorporados neste tipo de molécula [63]. Embora
estes sejam potenciais muito precisos, eles estão limitados a um conjunto de parâmetros para
cada molécula. O objetivo, no atual trabalho, é estudar os dímeros de hélio numa análise
comparativa de mudança de fase. Uma análise crítica dos potenciais para dímeros de hélio,
merecem um estudo separado.
62
5.2.3 Os estados ligados
O número de estados ligados possíveis para os dímeros de gases raros, para di-
ferentes momentos angulares, serão apresentados e discutidos. A energia em que ocorre a
mudança de fase para diferentes momentos angulares é um número inteiro múltiplo de π. O
teorema de Levinson estabelece que esse número inteiro é igual ao número de estados ligados
que a molécula pode apresentar, para este momento angular [64] sendo
nbπ = limE→0
δl. (5.11)
A partir deste teorema é, portanto, possível utilizar as informações para prever
propriedades sobre determinados estados.
5.3 Resultados e discussão sobre a determinação do nú-
mero de estados ligados via deslocamento de fase
O Potencial para a molécula de hélio, como na equação 5.10, prevê um mínimo
de energia com 10,99 K a uma distância de 5,62 bohrs. Na verdade, os aspectos teóricos
da interação molecular He2 remetem-se a 1928, com um cálculo feito por Slater [65]. Este
cálculo dá a energia de dissociação e a distância de equilíbrio como sendo 8,9K a 5,60 bohrs.
No entanto, a questão de uma vibração estável de uma molécula diatômica He2 foi tratada,
em uma forma consistente, apenas recentemente.
A existência de uma molécula diatômica de He é uma questão de especial interesse,
pois seria a mais fraca molécula de van der Waals. Esta questão foi analisada a partir de um
aspecto teórico, utilizando a teoria do alcance efetivo [66], em que é necessária a integração da
equação de Schrödinger. Uma vez que o estado ligado de uma molécula é referido como sendo
10−8 eV, a integração é necessária até 10000 au (unidades atômicas). Portanto, lidar com
esta energia, para detectar um estado ligado, pode ser uma fonte de erro. O presente método
para detectar estados ligados, usando o limite do deslocamento de fase do espalhamento, não
tem esse problema, a integração máxima esta a 7 au.
63
A convergência do deslocamento de fase para a pequena energia de colisão tem
de ser investigada para se aplicar o teorema de Levinson. Esta convergência foi testada para
o dímero mais pesado, HeXe, em que a energia de colisão de cerca de 10−10 au foi obtida.
Esta análise para uma molécula diatômica pesada vai garantir a energia adequada para os
outros dímeros. O número de estados ligados para os dímeros de hélio são mostrados na
Tabela 5.3. Em nenhum dos valores do momento angular l houve a formação de um estado
Tabela 5.3: Relação dos estados ligados para diferentes dímeros de gases nobres
l HeHe HeNe HeAr HeKr HeXe0 0 1 1 2 21 0 1 1 1 12 0 1 1 1 13 0 0 1 1 14 0 0 1 1 15 0 0 0 1 16 0 0 0 0 0
ligado HeHe. Os dímeros de HeNe e HeAr formam no mínimo um estado ligado. Os dímeros
HeKr e HeXe têm o mesmo comportamento, apesar da diferença entre os átomos de Kr e
Xe. Para o momento angular maior do que 5, nenhuma destas moléculas pode suportar um
estado ligado.
Integração do deslocamento de fase para colisões de baixa energia deve ser reali-
zada com um algoritmo numérico muito preciso. O problema surge como uma consequência
do teorema Levinson. Neste limite de energia de colisão, o deslocamento de fase comporta-
se como uma função degrau, como exemplificado para HeKr com momento angular zero e
E = 10−8 meV (Figura 5.1).
O método de Runge-Kutta de quinta e o de sexta ordem, com passo variável,
como descrito por Forsythe [67] foram adequados para fazer a equação 5.11 aplicável. Para
esta energia de colisão, uma quantidade limitada de resultados foram validados com quatro
algarismos significativos.
Uma consideração preliminar para o número de estados ligados, pode ser realizada
considerando-se a energia de dissociação, que aumenta em um fator de cerca de 3, 0 × 10−5
a partir de hélio até o argônio, mas aumenta em 1/10 deste valor do Ar para Xe. Esse
comportamento diferente é, por conseguinte, esperado do hélio para argônio e não uma
mudança apreciável do argônio para xenônio, como mostrado na Tabela 5.2. Contudo, a
64
Figura 5.1: Deslocamento de fase para o dímero HeKr
correlação de energia de dissociação com estados ligados é uma forma de análise para um outro
fator, como a concavidade do potencial (constante de força), que também pode desempenhar
um papel importante. Como o número de estados ligados vai mudar, por exemplo, para uma
alteração de 10% do coeficiente de dispersão. A análise sensitiva (AS) fornece a resposta para
essa importante questão. A análise sensitiva pode ser utilizada de duas maneiras: direta
ou inversa. Análise sensitiva direta é importante para se discutir a formação de clusters,
em relação às perturbações nos parâmetros do potencial [52], que também foi usado para
inverter e analisar os de dados do espalhamento quântico, sob a aproximação de Born [42]
e na análise termodinâmica do segundo coeficiente do virial [68–70]. No presente trabalho a
AS foi aplicada na variação dos parâmetros do sistema, no que diz respeito à formação de
moléculas diatômicas.
A importância da análise sensitiva pode ser apreciada considerando a dependência
radial do deslocamento de fase e sua derivada, ou seja, a Equação 5.7, sobreposta pela própria
energia potencial. Estas três variáveis são consideradas em conjunto na Figura 5.2, para HeXe
l = 0 e E = 0, 1 MeV.
Não há acúmulo de fase na região clássica proibida. Antes R=4 au o potencial
65
Figura 5.2: Energia potencial (linha cheia, espessa), deslocamento de fase (linha cheia, fina)e equação MFV para o dímero HeXe (linha pontilhada)
terá pouca importância em estados ligados e propriedades de colisão. A energia de colisão
para detectar estados ligados é insignificante e a transição é de fato cerca de 6,7 au. Isto
também se reflete na equação fase variável, mostrando que dδdR
tem pequena contribuição para
ser adicionado à fase, que pode ser, graficamente, observada para valores de R inferiores a 5
au.
Por outro lado, a Equação 5.7 vai a zero em Ep(R) = 0 e não vai mudar de sinal até
a convergência. A competição entra as forças repulsivas e forças de atrativas irão se manifestar
no deslocamento de fase. Todos os deslocamentos de fase calculados neste trabalho, têm
valores positivos assintóticos, que são as forças atrativas que dominam o processo de encontrar
estados ligados. A situação é obviamente diferente para energia de colisão maior.
A região de maior sensibilidade para o potencial é perto de seu mínimo, caso em
que o derivada de fase tem o seu máximo. No entanto, esta certamente não é a única região
para a construção da fase. A mudança de fase é construída ao longo do potencial, que tem
contribuição importante da parte de longo alcance. Esta consideração preliminar, deve ser
quantificada na variação dos parâmetros do potencial.
66
Qual deve ser a influência da precisão associada ao valor sobre a formação de
estados ligados? Usando a massa atômica do hélio como sendo 4,0026 ou 4,002603267 amu
tem-se zero estados ligados, indicando que a precisão da massa atômica não é responsável pela
questão sobre a estabilidade He2. Mesmo para massa atômica igual a 4,02 amu não haverá
molécula de hélio. Considerações semelhantes também são válidas para os outros membros
da série. O número de estados ligados não vai mudar para molécula HeXe se a massa do Xe
for alterada mesmo em 10%. Desde que massas atômicas sejam precisas dentro de uma parte
por dez mil, este parâmetro não pode afetar a estabilidade da molécula diatômica.
A importância do coeficiente de dispersão deve ser investigada. Desde que os
termos de longo alcance decaiam a uma potência de R2n, pode-se esperar que a contribuição
de C10 seja menos importante. A interação dipolo-dipolo terá a contribuição mais impor-
tante para o espectro molecular, enquanto que a interação quadrupolo, termo C8, terá uma
contribuição entre dipolo e octopolo. No entanto, estes coeficientes não podem ser variados
para valores grandes, uma vez que isto irá alterar a individualidade da molécula em estudo.
Pequenas variações em torno dos valores tabelados, como na Tabela 5.2, serão analisados
para o momento angular zero.
Através da análise sensitiva para o potencial em todas as moléculas diatômicas
da série, foi observado que as grandes variações do coeficiente C10 não alteram o número de
estados ligados com l = 0. Em alguns casos, este coeficiente pode ser definido mesmo como
sendo zero, exceto para HeKr. O HeKr tem a energia de dissociação mais profunda da série
e esta interação deverá ser mais relevante.
Por outro lado, uma pequena variação do coeficiente C6 para a interação com o
hélio, cerca de 0, 46%, irá prever uma molécula He2. Isso é equivalente a variar C6 de 1,4610
au a 1,4678 au. Esse ponto representa um valor de transição que determina a existência da
molécula de Hélio, mantendo todos os outros parâmetros constantes. Em geral, para todos
os três coeficientes de dispersão e para l = 0, foi observado que uma variação máxima de
5% (HeNe) ainda é aceitável para fornecer o mesmo número de estados ligados. Esse tipo de
informação é importante na análise de problemas inversos. Os valores invertidos devem estar
nessa faixa de precisão.
67
5.3.1 Análise sensitiva do potencial em relação ao parâmetro C6.
As análises sensitivas foram feitas tendo como referência o acréscimo ou decréscimo
de estados ligados indicados por l = 0, como indicado nas tabelas a seguir. Foi feita a análise
sensitiva do potencial para o dímero HeHe, variando-se o parâmetro C6. O resultado obtido
está mostrado na Tabela 5.4.
Tabela 5.4: Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímeroHeHe
C6 original C6 alterado Variação de %C6 l = 01,461 1,46100 0,00000 01,461 1,46779 0,46475 01,461 1,46780 0,46543 1
A Figura 5.3 mostra o comportamento da mudança de fase na formação do estado
ligado para o HeHe. Esta mudança mostra a grande sensibilidade do sistema em relação ao
coeficiente C6. Isto é equivalente a mudar C6 de 1,4610 a 1,4678 au. Este ponto representa
Figura 5.3: Mudança de fase para HeHe ocasionada por uma pequena variação do coeficienteC6
um valor limiar de C6 para a existência da molécula de hélio, mantendo todos os outros
68
parâmetros constantes. Em geral, para os três coeficientes de dispersão e l = 0, verificou-se
que uma variação máxima de 5% (HeNe) ainda é aceito para dar o mesmo número de estados
ligados. Este tipo de informação é importante para a análise do problema inverso. Valores
invertidos, em sua maioria, estão dentro deste intervalo de precisão. Foram feitas as análises
sensitivas do potencial para os dímeros HeNe, HeAr, HeKr (Tabelas 5.5, 5.6, 5.7 e 5.8).
Tabela 5.5: Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímeroHeNe
C6 original C6 alterado Variação de C6 l = 03,029 0,929 -69,32%% 03,029 1,029 -66,03% 13,029 3,029 0% 13,029 5,499 81,54% 13,029 5,509 81,87% 2
Tabela 5.6: Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímeroHeAr
C6 original C6 alterado Variação de C6 l = 09,538 0,938 -90,165% 09,538 1,038 -89,117% 19,538 9,538 0% 19,538 9,988 4,717% 19,538 10,038 5,24% 2
Tabela 5.7: Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímeroHeKr
C6 original C6 alterado Variação de C6 l = 013,40 13,40 0% 213,40 26,5 94,40% 3
Tabela 5.8: Análise sensitiva do potencial de Tang em relação ao parâmetro C6 para o dímeroHeXe
C6 original C6 alterado Variação de C6 l = 019,54 15,59 -20,21% 119,54 15,69 -19,70% 219,54 19,54 0% 219,54 34,79 78,045% 219,54 34,99 79,07% 3
À medida que o momento angular é aumentado, o coeficiente de dispersão torna-
se mais importante e a parte repulsiva do potencial, menos importante. Pontos de viragem
irão se mover para a direita neste caso. Pode-se qualitativamente descrever a importância
69
da parte de curto alcance do potencial, variando o valor inicial para a integração da equação
MFV. Os valores iniciais, sem alterar o número de estados ligados são, 3,2 au (HeNe), 4,3
au (HeAr), 3,1 au (HeKr) e 3,6 au (HeXe). A molécula HeHe já não apresenta nenhum
estado ligado e essa mudança, na condição inicial, não afetará a formação do estado ligado.
Portanto, tendo os resultados para HeNe, como por exemplo, o curto intervalo do potencial,
antes de 3 au, não afetará os estados ligados. Um núcleo rígido pode ser definido neste ponto,
sem alterar o espectro de HeNe.
5.4 Previsão do número de estados ligados via RNA
clássica
Nesta etapa, uma RNA clássica foi modelada para a determinação do número de
estados ligados, completando a etapa anterior. O objetivo geral foi verificar o comportamento
de uma RNA convencional para os estados ligados, como base para a adequação e modelagem
de uma rede neural artificial quântica e como objetivo específico, desta etapa, estabelecer
uma estrutura para uma RNA clássica, que determinasse a interação entre os pares de gases
nobres. Esta estrutura deve ser capaz de correlacionar os pares de átomos com os possíveis
estados ligados.
No capítulo 3, foram apresentadas noções básicas sobre as RNA clássicas que ser-
viram como suporte para a modelagem e estruturação desta metodologia, na determinação
dos estados ligados, a partir da estrutura de pares de átomos. O primeiro passo na modela-
gem, consistiu em representar os átomos em um formato que contivesse informações físicas
que pudessem se processadas pela RNA. Foi necessário apresentar à RNA, em sua entrada,
estímulos numéricos que identificassem os pares de átomos a serem correlacionados com uma
determinada informação. Assim, foi necessário estabelecer um padrão para comunicar com
a RNA de modo a informar as estruturas e os pares de átomos que formariam, ou não, os
dímeros. A distribuição eletrônica de cada átomo apresentou-se como uma forte candidata à
essa representação.
A distribuição eletrônica é única, para cada um dos átomos de gases nobres que
participam do presente estudo. Portanto, de acordo com as características da RNA adotada,
os estímulos numéricos baseados na estrutura dos átomos foram modelados. Os elétrons
70
em uma camada eletrônica de um átomo são indistinguíveis, mas por questão de adequação
à RNA, foi determinada uma nomenclatura para cada elétron, em função da distribuição
eletrônica do átomo. Como por exemplo, para o átomo de He, que tem dois elétrons, um
elétron foi representado como elétron 1s1, por ser o primeiro elétron representado como
estímulo à RNA e o segundo elétron representado como elétron 1s2, em que 1s é a camada
em que se encontram. Não há violação das leis da Física, nessa representação, pois o estímulo
referente a cada um desses elétrons, quando presentes no átomo, será representado pelo valor
numérico de mesmo grandeza, o nível lógico “1”, e corresponde a um estímulo a ser propagado
na estrutura da RNA.
Assim, cada átomo foi representado pela sua distribuição eletrônica (Tabela 5.9).
A primeira coluna da tabela contém a identificação dos elétrons. No caso do He, mesmo
os elétrons não existentes em sua estrutura foram representados, dada a estrutura da RNA
(segunda coluna da tabela). Os elétrons citados, mas não existentes na estrutura do átomo,
foram caracterizados pelo estímulo de nível lógico “0”, por exemplo, o elétron 2s1, que não
está presente no He, recebeu o estímulo “0”. Por outro lado, o Ne possui um elétron ocupando
essa posição, assim, o elétron 2s1, para o Ne, recebe o estímulo “1” (terceira coluna da tabela).
O mesmo acontece para o restante dos elétrons desse átomo e dos elétrons do Ar e do Kr.
O número total de linhas da Tabela 5.9 foi determinado pelo número total de
elétrons do Kr (36), isso influencia diretamente no número de entradas da RNA, levando a
um número de 72 entradas, 36 entradas para um dos dois átomos cuja formação de um estado
ligado está sendo investigada.
Os dados foram utilizados como entrada da RNA, apresentados aos pares, de
forma a representar o dímero. A saída da RNA foi estruturada de acordo com números de
estados ligados para os seus respectivos dímeros. A RNA foi estruturada com 72 entradas,
sendo que 36 entradas representam o átomo de He e as outras 36 entradas representam o
segundo átomo (Ne, Ar ou Kr) e uma saída caracterizada pelos dados contidos na Tabela
5.10. As RNAs apresentam diferentes comportamentos de acordo com o número de neurônios
e o número de camadas. Em relação ao número de camadas, tem-se que, as RNA de uma
única camada, permitem a interpolação de um conjunto de dados, mas não a classificação
desse conjunto, como no exemplo da porta XOR, que envolve uma classificação em uma
separação de planos e exige uma RNA com um camada oculta. Assim, no caso da formação
de dímeros, a classificação dos dados é fundamental para o sucesso do comportamento da
RNA. Logo, a RNA para esse sistema foi estruturada com uma camada de entrada (o par de
71
Tabela 5.9: Representação numérica de acordo com a distribuição eletrônica dos átomos degases nobres, para a formação dos estímulos de entrada para a RNA clássica
Elétron He Ne Ar Kr1s1 1 1 1 11s2 1 1 1 12s1 0 1 1 12s2 0 1 1 12p1 0 1 1 12p2 0 1 1 12p3 0 1 1 12p4 0 1 1 12p5 0 1 1 12p6 0 1 1 13s1 0 0 1 13s2 0 0 1 13p1 0 0 1 13p2 0 0 1 13p3 0 0 1 13p4 0 0 1 13p5 0 0 1 13p6 0 0 1 14s1 0 0 0 14s2 0 0 0 13d1 0 0 0 13d2 0 0 0 13d3 0 0 0 13d4 0 0 0 13d5 0 0 0 13d6 0 0 0 13d7 0 0 0 13d8 0 0 0 13d9 0 0 0 13d10 0 0 0 14p1 0 0 0 14p2 0 0 0 14p3 0 0 0 14p4 0 0 0 14p5 0 0 0 14p6 0 0 0 1
72
Tabela 5.10: Relação dos estados ligados para diferentes dímeros de gases nobres, saída daRNA cássica
l HeHe HeNe HeAr HeKr0 0 1 1 2
átomos, representados pelos seus elétrons), uma camada oculta com até j neurônios e uma
saída (número de estados ligados) como mostrado na Figura 5.4.
Figura 5.4: RNA modelada para o estudo da formação de estados ligados, em que j é onúmero total de neurônios da camada oculta, determinado experimentalmente.
73
5.5 Resultados e discussão sobre o uso de uma RNA
para a determinação de estados ligados
O número de neurônios para a camada oculta foi determinado através da evolução
da RNA a partir de uma estrutura com um neurônio oculto, validação da RNA, partindo para
uma nova estrutura com um neurônio a mais e mais sinapses, se necessário, até a estrutura
final. O treinamento foi então efetuado e o erro avaliado.
A qualidade da RNA não é determinada simplesmente pela minimização do seu
erro determinado pela expressão 3.12 (descrita no Capítulo 3). Por exemplo, um treinamento
cujo erro mínimo aceitável seja atingido, permite com que a RNA reproduza com fidelidade
os dados de treinamento mas não necessariamente permite a interpolação. Um número de
neurônios inferior ao necessário, pode impedir que a RNA passe por todos os pontos com um
desvio uniforme, podendo favorecer um conjunto específico, sub-treinamento (underfitting).
Por outro lado, um número de neurônios superior ao necessário, pode fazer com que RNA
passe por todos os pontos exatamente, sem nenhum desvio, podendo negligenciar o erro
experimental, por exemplo, super-treinamento (overfitting).
Assim, para garantir a qualidade da RNA, um dímero foi deixado fora do treina-
mento, para validação. A qualidade da validação foi checada na forma de um desvio do valor
desejado, mas sem influenciar no treinamento. Portanto a qualidade de RNA foi determinada
pelo par, erro de treinamento e desvio de validação (Figura 5.5).
A estrutura ideal foi determinada através da evolução das conexões sinápticas. O
primeiro treinamento foi executado com um neurônio, o segundo com dois neurônios e assim
por diante.
O menor erro e o menor desvio, foram as referências para a validação do treina-
mento e a estrutura otimizada. Em detalhes na Figura 5.6, pode-se observar que a estrutura
com doze neurônios ocultos j = 12 apresentou o menor par erro-desvio. Assim, esta foi a
estrutura final para esta RNA.
A evolução do erro a cada iteração de ensinamento, da RNA, a um valor aceitável
está mostrada na Figura 5.7. Foram necessárias duas IE em 2,121 s de tempo de uso do
74
0 2 4 6 8 10 12 14 160
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Número de neurônios
Err
o
Figura 5.5: Qualidade do aprendizado em função do número de neurônios, em que a linhapontilhada é a função custo da rede e a linha cheia é o desvio em relação ao dado de validação
8 8.5 9 9.5 10 10.5 11 11.5 12 12.5 130
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Número de neurônios
Err
o
Figura 5.6: Qualidade do aprendizado em função do número de neurônios, em que a linhapontilhada é a função custo da rede e a linha cheia é o desvio em relação ao dado de validação
75
processador de um computador de 32 bits.
Figura 5.7: Decaimento do erro da RNA em épocas
Após o o treinamento a RNA foi capaz de calcular o número de estados ligados
para três dímeros e fazer a previsão para um dos dímeros (Tabela5.11). Os dímeros HeHe,
HeNe e HeAr, foram usados no treinamento e o dímero HeKr foi usado para a validação.
Tabela 5.11: Comportamento da RNA no cálculo de estados ligados
Dímero l = 0real l = 0 simulado via RNA previsto via RNAHeHe 0 0,00020HeNe 1 1,00010HeAr 1 1,00027HeKr 2 1,9244
O valores relacionados à RNA não foram arredondados propositalmente para mos-
trar a aproximação do valor desejado.
76
5.6 Conclusões gerais
A análise sensitiva para o cálculo do espalhamento quântico foi mostrada para
os dímeros de hélio, juntamente com a estrutura de estado ligado para diferentes momentos
angulares. Exceto para HeHe, todas as moléculas consolidaram estados. As moléculas HeKr
e HeXe podem suportar dois estados vibracionais com l = 0 e essas moléculas ainda existem
com maior momento angular. A análise foi realizada utilizando a variável método de fase e
teorema de Levinson.
A análise sensitiva foi realizada para quantificar como a mudança de fase é alterada
para os parâmetros potenciais variacionais. O efeito de massa também foi estudado para a
série. A precisão da massa não é responsável por dar um estado ligado à molécula de hélio. Por
exemplo, usando massa atômica como 4,0026 ou 4,002603267 amu ainda tem-se zero estados
ligados para este potencial. A alteração da massa do átomo de xenônio até 10% continua
deixando a molécula HeXe com dois estados ligados em nível de rotação fundamental.
A faixa aceitável para os parâmetros do potencial foi determinada considerando a
mesma estrutura do estado ligado original. Os coeficiente de dispersão foram alterados, um
de cada vez, mantendo todos os outros parâmetros constantes. A importância nos coeficientes
de dispersão aparece em ordem decrescente, do C10 para o coeficiente C6. Os resultados são
basicamente inalterados pela variação do coeficiente de C10. Por outro lado, as variações em
C6 podem ser muito importantes. Por exemplo, para molécula He2, uma variação positiva de
0, 46%, neste coeficiente, prevê uma vibração no estado ligado de momento angular zero. A
sensibilidade na parte repulsiva do potencial, foi determinada pelo estabelecimento de uma
coordenada mínima inicial, tolerável, suportar a estruturas originais dos estados ligados. Este
mínimo foi encontrado a cerca de 4,0 au, para todos os dímeros de hélio.
Embora a análise sensitiva tenha sido realizada de uma forma paramétrica, para
formar um potencial específico, os presentes resultados são úteis para o espectro de dímeros
de gases nobres para a estrutura do potencial. Levando em conta a evidência experimental,
para molécula de hélio, [69] pode-se argumentar sobre a qualidade potencial. Os resultados
têm mostrado que, melhorar o potencial não significa melhorar os parâmetros do potencial.
Na verdade, uma outra forma funcional do potencial tem de ser considerada, e isto pode ser
conseguido pela analise sensitiva [70]. Isto irá fornecer a função correta para os dímeros de
hélio.
77
Em contraste com métodos numéricos, para calcular espalhamento elástico, que
exigem o conhecimento das funções de Bessel, uma aproximação simples, com base no método
de fase variável foi discutido. O algoritmo é muito simples e várias consequências importantes
podem ser exploradas. O cálculo das matrizes de espalhamento foi realizado e comparado
com o método Numerov renormalizado. O comportamento da mudança de fase, como uma
função da energia e momentos angulares, foi explorado juntamente com exemplos numéricos
sobre o teorema de Levinson.
O método de fase variável, como aqui apresentado, pode ser mais explorado no
cálculo de outras propriedades quânticas, como as amplitudes das seções de choque diferencial
e transversal. Uma apresentação elementar do método de fase variável, para calcular a matriz
de espalhamento quântico foi proposta. Esta abordagem que foi apresentada em 1933 por
Morse e Allis, não foi totalmente explorada como uma ferramenta para introduzir ideias do
espalhamento quântico. Este presente trabalho apresentou a derivação da equação de fase
variável, seguida por uma simulação numérica unidimensional. A dependência da mudança
de fase com momento angular e de energia, juntamente com o teorema de Levinson, foram
apresentados.
Foi possível, através da RNA, estabelecer uma correlação entre a estruturas eletrô-
nicas dos átomos, deste estudo, com o número de estados ligados. A qualidade do treinamento
da RNA foi validada pela previsão feita de formação de dois estados ligados para o dímero
HeKr, o qual não participou do treinamento. Não foram estudados os estados ligados para
outro dímeros de gases nobres e exploração da capacidade máxima desta RNA ainda está em
aberto, para esse sistema.
Outro fator que merece destaque é o fato de ter sido possível identificar o átomo
por sua distribuição eletrônica, que é uma informação obtida da mecânica quântica. Na RNA
clássica esta informação foi passada na forma de dados numéricos, ou seja, a informação
quântica foi convertida para uma informação numérica, computacional clássica.
Esse procedimento apresenta-se como um incentivo para o estudo da computação
quântica e das RNAs quânticas, uma vez que são sistemas de natureza quântica e espera-
se uma eficiência significativa no processamento informações de sistema quânticos, abrindo
caminho para a exploração da Computação Quântica a ser introduzida no próximo capítulo.
78
Capítulo 6
A Computação Quântica e o
computador quântico
6.1 Introdução
O conceito de Computação Quântica (CQ) tem como base a utilização da Mecâ-
nica Quântica no processamento de informações e, a princípio, pode ser simulada em com-
putadores clássicos, para efeito de estudos e algumas aplicações. A computação quântica foi
proposta bem antes de se verificar a possibilidade da construção de um sistema que pudesse
processar informações nesse formato. Assim, a CQ divide-se em duas linhas de pesquisa, a
busca de algorítimos e metodologias para o processamento de informações e o desenvolvi-
mento de uma máquina capaz de processar os algorítimos. Em paralelo, neste capítulo, serão
mencionadas e introduzidas algumas realizações experimentais relacionadas à construção do
computador quântico, bem como os modelos propostos. O computador quântico seria a pla-
taforma física necessária para o processamento dos algorítimos quânticos. A implementação
de um computador quântico ainda se encontra no estado da arte. A empresa pioneira na
construção do protótipo de um computador quântico é a D-Wave [71]. Muitas propostas
sobre o seu funcionamento e a viabilidade de sua construção ainda são alvo de discussões.
Dentre as discussões se destacam, a compactação do processador, o aumento significativo da
capacidade de processamento de informações e a velocidade na transmissão dos dados. O foco
principal desta parte do trabalho é apresentar os principais conceitos sobre a computação
79
quântica e identificar as ferramentas para a sua implementação.
6.2 Conceitos básicos da computação quântica
Um sistema baseado na computação quântica evolui no tempo da mesma forma
que os sistemas quânticos. A equação de Schrödinger [72], obitida em 1926 por Erwin Schrö-
dinger−h2
2m∂2ψ(x, t)∂x2
+ V (x, t)ψ(x, t) = ih∂ψ(x, t)∂t
(6.1)
é fundamental no estudo dos sistemas quânticos. A evolução no tempo é unitária e gerada
pelo Hamiltoniano do sistema. O vetor que descreve o sistema no tempo é governado pela
equação de Schrödinger
ihd
dt|ψ〉 = H|ψ〉, (6.2)
em que H é a Hamiltoniana, h = h2π
e h é a constante obtida por Max Plank em 1900,
hoje conhecida como constante de Plank. Em seu trabalho, Plank usou como base a lei de
Rayleigh-Jeans e a lei de Wien para solucionar o problema da radiação do corpo negro [73]
originando a constante h que é fundamental na caracterização de sistemas quânticos. No
caso em que H for independente do tempo, para o estado inicial no tempo t = 0, tem-se
como solução
|ψ(t)〉 = e−i Hth |ψ(0)〉. (6.3)
Tem-se U = e−i Hth , em que U é um operador unitário, chamado de operador de
evolução unitário. O operador U(t), uma vez que H é autoadjunta, satisfaz (UT )∗U = I para
uma ordem linear em dt. Uma vez que o produto de operadores lineares é finito, a evolução
no tempo em um intervalo finito também é unitária (Equação 6.4).
|ψ(t)〉 = U(t)|ψ(0)〉. (6.4)
A equação de Schrödinger satisfaz os conceitos relativos à mecânica ondulatória
e caracteriza os sistemas quânticos. Portanto, até o presente momento, qualquer sistema
que tiver como fundamento de seu funcionamento a equação de Schrödinger, ou os princípios
que a sustentam, pode ser considerado um sistema quântico. Esse fator é fundamental para
80
discriminar um computador clássico de um computador quântico. Essa equação, bem como
os parâmetros que a compõem, em especial a constante de Plank h, de alguma forma devem
aparecer na estrutura do computador quântico e da Computação Quântica.
Na Computação Quântica as portas quânticas são implementadas via transforma-
ções lineares, operadores lineares, ou o operador U que envolve os estados equivalentes às
regras da computação clássica.
81
6.3 O qubit
Como na computação clássica, a computação quântica têm a sua unidade básica
de informação e é conhecida como bit quântico (quantum bit), ou qubit. Para a representa-
ção do qubit foi adotada a notação de Dirac. O qubit |ψ〉 é uma superposição dos estados
independentes, nos quais |0〉, equivalente ao vetor (1, 0),
|0〉 =
1
0
, (6.5)
referente ao estado falso ou nível lógico zero da computação clássica e o |1〉, equivalente ao
vetor (0, 1),
|1〉 =
0
1
, (6.6)
referente ao estado verdadeiro ou nível lógico um da computação clássica. A superposição,
ou estado mais geral do qubit, é representada pela expressão
|ψ〉 = α|0〉+ β|1〉 =
αβ
, (6.7)
em que, α e β são números complexos tais que
|α|2+|β|2= 1. (6.8)
Assim, |α|2 determina a probabilidade de encontrar o qubit |ψ〉 no estado |0〉 e |β|2 determina
a probabilidade de encontrar |ψ〉 no estado |1〉.
Um qubit com mais de dois estados é representado de forma semelhante. A pro-
babilidade é redistribuída nos possíveis estados. Por exemplo, um qubit de quatro estados,
equivalentes aos estados binários, clássicos, 00, 01, 10 e 11 é representado pela expressão
|ψ〉 = p00|00〉+ p01|01〉+ p10|10〉+ p11|11〉 =
p00
p01
p10
p11
, (6.9)
82
em que p00, p01, p10 e p11, são probabilidades associadas aos estados.
Fica evidente na expressão 6.9, a compactação da representação de um sistema
formado pela combinação de dois bits, gerando quatro estados, em apenas um qubit. Os
pesquisadores da empresa D-Waver alegam terem construído um computador quântico com
512 qubits que ainda está sendo avaliado pela comunidade científica. Esse computador utiliza
supercondutores trabalhando a uma temperatura de aproximadamente -273 oC. Segundo os
pesquisadores da Empresa, o seu processador utiliza a uma propriedade chamada de quantum
annealing [74], que não será discutida neste texto.
O estado do qubit pode ser representado geometricamente através da esfera de
Bloch (Figura 6.1), e representado pela expressão
|ψ〉 = cosθ
2|0〉+ eiϕsen
θ
2|1〉, (6.10)
em que θ e ϕ são números reais [75], a qual representa um qubit.
Figura 6.1: Esfera de Bloch
Durante a medida do estado de um qubit, os estados |0〉 e |1〉 são medidos si-
multaneamente, sendo |0〉 com probabilidade |α|2 e 1〉 com probabilidade |β|2. Desta forma,
diferentemente da computação clássica, a unidade mínima de informação da CQ pode pos-
suir mais do que dois estados, pois o estado do qubit, teoricamente, é qualquer ponto (em
83
função de ϕ e θ) na superfície da esfera de Bloch. Esta característica permite que muito mais
informação seja processada em uma unidade de “tempo”.
Um sistema composto por vários qubits tem o seu estado total representado pelo
produto tensorial entre seus qubits (Eq. 6.11)
|ψ〉 = |ψ1〉 ⊗ |ψ2〉 ⊗ ...⊗ |ψn〉 = |ψ1〉|ψ2〉...|ψn〉 (6.11)
Esse produto tensorial é fundamental para representar a superposição de sistemas.
Uma vez caracterizado o qubit, dentro da teoria quântica e apresentada uma rea-
lização experimental, pode-se considerar essa base para a continuidade dos estudos. Tem-se
então a necessidade de estabelecer um sistema para o processamento dessa informação. A me-
lhor referência para o desenvolvimento da CQ é a computação clássica e suas características.
Assim serão estabelecidas portas lógicas quânticas.
6.4 A Porta CNOT
De forma análoga à computação clássica, a computação quântica também tem as
portas lógicas, como mecanismo para manipulação da informação. A porta CNOT [76–78]
é uma representação matricial que manipula qubits e tem a seguinte forma:
CNOT =
1 0 0 0
0 1 0 0
0 0 0 1
0 0 1 0
(6.12)
A CNOT efetua o flip de um qubit. O flip representa uma mudança de estado do
qubit, passando de um estado
|0〉 =
0
0
1
0
(6.13)
84
para um estado
|1〉 =
0
0
0
1
(6.14)
e é expresso por
CNOT(|0〉) =
1 0 0 0
0 1 0 0
0 0 0 1
0 0 1 0
0
0
1
0
=
0
0
0
1
(6.15)
Pode-se observar que o elemento ψ|0〉3 troca de valor com o elemento ψ|0〉4, que leva o qubit
|ψ〉 de ψ|0〉 para ψ|1〉.
Essa porta pode ser representada também na forma de um circuito quântico (Fi-
gura 6.2), em que |A〉 é o controle da porta, |B〉 é um qubit, alvo do controle, e |B〉 ⊕ |A〉 é
a saída da porta.
Figura 6.2: Esquema da porta quântica CNOT
Nesta representação, o qubit |A〉 e o qubit |B〉, do lado esquerdo, são as entradas
da porta. O qubit |A〉 e o qubit |B ⊕ A〉, são as saídas da porta. O estado do qubit |A〉 e do
qubit |B〉 se propagam da esquerda para a direita. O qubit |A〉 não sofre alteração, garantindo
que a transformação seja unitária, e o qubit |A〉 interage com o qubit |B〉 de forma similar à
porta XOR, da computação clássica, apresentada anteriormente, e seu efeito, que também
se propaga da esquerda para a direita é apresentado na saída. O qubit |A〉 é chamado de
controle e o qubit |B〉 é chamado de alvo.
85
Esta operação pode ser representada pela expressão
CNOT (|A,B〉)→ |A,B ⊕ A〉, (6.16)
em que ⊕ representa a função XOR da computação clássica.
A Tabela 6.1 mostra o comportamento da porta CNOT e o estado do qubit antes
e depois do flip.
Tabela 6.1: Comportamento da porta CNOT
Antes do flip Depois do flip|A〉 |B〉 |A〉 |B ⊕ A〉0 0 0 00 1 0 11 0 1 11 1 1 0
|α〉⊗|β〉 = |α〉 |β〉 = |α, β〉
CNOT |0, ψ〉 = |0, ψ〉
|0, ψ〉 = a|0〉|0〉+ b|0〉|1〉 =
a
b
0
0
. (6.17)
CNOT |0, ψ〉 =
1 0 0 0
0 1 0 0
0 0 0 1
0 0 1 0
a
b
0
0
=
a
b
0
0
= |0, ψ〉 (6.18)
|1, ψ〉 =
0
0
a
b
(6.19)
.
86
CNOT |1, ψ〉 =
1 0 0 0
0 1 0 0
0 0 0 1
0 0 1 0
0
0
a
b
= a
0
0
0
1
+ b
0
0
1
0
(6.20)
|1, 1〉 =
0
0
0
1
(6.21)
|1, 0〉 =
0
0
1
0
(6.22)
CNOT|1, ψ〉 = a|1, 1〉+ b|1, 0〉 = |1〉 (a|1〉+ b|0〉) = |1, φ〉 (6.23)
6.5 Realização experimental da porta CNOT através
do acoplamento elétron-núcleo
Dentre os sistemas propostos na implementação do computador quântico, está o
qubit obtido a partir do desacoplamento dinâmico universal de um simples spin, em estado
sólido [79]. O fenômeno é ocasionado por uma impureza presente na estrutura do diamante.
Átomos de nitrogênio causam o aparecimento de centros contendo uma lacuna acoplada a
um spin, também referenciada como nitrogen-vacancy defect center ou (NV) (Figura 6.3).
No trabalho de Lange [79] de 2010 foi demonstrado que é possível isolar e ler
(determinar) o estado do spin em um NV , utilizando micro-ondas, caracterizando-o como
um possível candidato a um qubit.
87
Figura 6.3: Defeito no diamante, em que V é o centro da vacância, N é um átomo de nitrogênioe C são os átomos de carbono.
Experimentalmente, é possível implementar uma porta com rotação controlada
[80], representada na Figura 6.4 em que el. representa o qubit de controle e nucl representa
Figura 6.4: Porta quântica com rotação controlada. Em que el. representa o spin do elétrone nucl. representa o spin do núcleo.
o qubit alvo do controle.
Um flip, transformação de |0〉 em |1〉 ou |1〉 em |0〉, na porta CNOT equivale a
uma rotação de 180o no estado do qubit, θ = 180o, levando-o de |0〉 para |1〉 ou de |1〉 para
|0〉, dependendo do seu estado. Neste sistema o spin do elétron (el.) é o qubit de controle e o
spin nuclear (nucl.) é o qubit alvo, RX(θ) é a rotação. Esta porta foi implementada a partir
dos centros NV que são caracterizados por imperfeições na estrutura dos diamantes e criam
um par elétron núcleo que interagem da mesma forma que uma porta CNOT . Para evitar a
decoerência [80], Sar em 2012 introduziu uma série de rotações auxiliares, e utilizou a porta
CPhase , adequado a porta CNOT ao sistema físico.
Uma outra porta necessária para a construção de uma unidade central de proces-
samento quântica é a porta de Toffoli [81] (Figura 6.5), comprovada experimentalmente [82].
88
Figura 6.5: Porta de Toffoli.
6.6 O computador quântico
A arquitetura do computador quântico, a princípio, seguiria a mesma base do
computador clássico. Foi assumido e proposto, no presente trabalho, a possibilidade da im-
plementação de um computador quântico que seria composto pela unidade de processamento,
memória e interface (Figura 6.6). Dentre os vários sistemas propostos para a construção do
computador quântico, o sistema baseado no acoplamento Spin eletrônico-Spin nuclear, foi
considerado como uma realização experimental, plausível, para o processamento, com natu-
reza quântica, de uma informação no decorrer do presente estudo. A escolha desse sistema
justifica-se no fato de estar suportado por realizações experimentais significativas que per-
mitirá verificar em laboratório a validade e viabilidade da implementação e execução de um
algorítimo quântico.
A unidade central de processamento seria baseada na porta CNOT e nas propri-
edades da mecânica quântica e um possível somador como no computador clássico.
6.7 Conclusões gerais
Foi possível, agrupar um conjunto de tecnologias e experimentos, para estabelecer
um modelo compreensível de um computador quântico. Foi possível estabelecer uma relação
entre o computador clássico e seu equivalente quântico, no que se diz respeito à representação
dos dados, bit e qubit, e ao processamento, UCP clássica e UCP quântica.
89
Figura 6.6: Diagrama em blocos proposto para o computador quântico.
90
Em relação à coletânea de realizações experimentais, ficou evidente que existe
um grande avanço em direção a um modelo definitivo para o computador quântico. Esta
relação mostrada nesse trabalho foi importante para estabelecer um critério de confiabilidade
de aplicabilidade real dos algoritmos quânticos. Pois, assim que seja possível implementar
o Hardware computador quântico, todos operadores usados nos algoritmos, ou softwares
quânticos, poderão ser executados nos novos computadores.
A natureza dos computadores quânticos exigirá a implementação de uma nova
interface com o usuário e com os dispositivos de entrada e saída de dados e informações.
91
Capítulo 7
Algoritmo de Grover
7.1 Introdução
O algoritmo desenvolvido por Grover [4], utilizando uma transformação de in-
versão sobre a média, é uma aplicação direta da computação quântica na solução de um
problema. Embora desenvolvido para uma possível aplicação em um computador quântico,
este algoritmo apresenta características que podem ser exploradas em um computador clás-
sico.
O algoritmo de Grover permite fazer uma busca em um banco de dados formatado
em uma linguagem na qual um sistema quântico possa processar e apresenta vantagem em
relação aos algoritmos clássicos. A busca em um banco de dados por um algoritmo clássico
consiste na leitura de registros. Para um banco de dados contendo n registros, em média,
um algoritmo clássico efetua a leitura de 12 registros e, na pior das hipóteses, efetua a leitura
de (n − 1) registros. Em termos computacionais essa característica é medida na forma de
complexidade. A complexidade permite estimar a demanda de recursos computacionais e
o tempo de execução de um programa. Uma complexidade O(n) equivale à quantidade
de passos para resolver um problema e é diretamente proporcional ao número de variáveis
92
envolvidas. A complexidade O(n) indica que o custo computacional é linear. Um algoritmo
de busca clássico tem complexidade O(n).
7.2 O algoritmo quântico de busca
Grover demonstrou que seu algoritmo permite efetuar uma busca em um banco
de dados a uma complexidade O(√n), o que reduz significativamente o tempo de busca,
comprovado experimentalmente [80]. Dada uma função f(x), x = 1, 2, ..., n, para um valor
de x desconhecido, tem-se como objetivo encontrar o valor de x, tal que f(x) 6= 0, Esse
processo é caracterizado como um problema inverso.
Um dos princípios básicos usado nesse algorítimo é o fenômeno quântico conhecido
como superposição. Esse fenômeno permite que uma partícula excita simultaneamente em
dois lugares ao mesmo tempo, sendo que, quando ocorre uma interação, essa partícula passa a
existir em um só local. Algebricamente, é obtida através da transformada de Wash-Hadamard
[83]. Esta operação é representada pela matriz
W =1√2
1 1
1 −1
, (7.1)
que transforma o estado de um qubit em uma sobreposição de estados. Quando este operador
atua no estado |0〉, este é transformado na sobreposição dos estados |0〉 e |1〉, assumindo o
estado ( 1√2, 1√
2). Quando atua no estado |1〉, este é transformado no estado ( 1√
2,− 1√
2), assim,
1√2
1 1
1 −1
|0〉|1〉
=
1√2|0〉+ 1√
2|1〉
1√2|0〉 − 1√
2|1〉,
. (7.2)
na notação de Dirac esta sobreposição é representada na forma 1√2(|0〉+|1〉) no caso do estado
|0〉 e na forma 1√2(|0〉 − |1〉) no caso do estado |1〉. Seja x um número na base binária de n
qubits descrevendo o estado inicial do sistema e y um número, também na base binária de n
qubits descrevendo o estado resposta do sistema, o sinal da amplitude de y é determinado pela
paridade do produto dos índices de x e y, ou seja, (−1)x.y que é conhecida como transformação
de Fourier [4] e pode ser definida como
Fij = 2−n
2 (−1)x.y, (7.3)
93
em que y é a representação binária de i, e x.y é o produto binário dos bits dos string x e y.
A transformação de rotação seletiva da fase da amplitude em certos estados [84],
é uma operação fundamental no algorítimo de procura quântico. Para um sistema de dois
estados esta transformação pode ser estruturada na forma
R =
e
jφ1 0
0 ejφ2
, (7.4)
em que j =√−1 e φ2 são números reais arbitrários.
7.3 Inversão seletiva de fase
Um caso particular da rotação seletiva de fase R, é a inversão seletiva de fase
I0 [85], consiste em inverter o sinal da amplitude de um registro específico dentro de um
vetor (Figura 7.1).
Figura 7.1: Inversão na média
Trata-se de uma matriz cujos elementos são:
I0−
ij = 0 se i 6= j; I0ii = 1 se i = 0; I0
ii = −1 se i 6= 0. (7.5)
No trabalho original de Grover, um vetor de estados ψ continha um estado espe-
cífico a ser localizado. O registro de interesse estaria em um estado oposto aos estados dos
94
registos que não eram de interesse. Por exemplo, se o registro de interesse estivesse no estado
ψ = 1, os outros estados estariam iguais a ψ = 0. Um oráculo determinado pela expressão
7.6, permite localizar a posição interesse no registro.
I0−
= I − 2|ψ0〉〈ψ0|, (7.6)
Na expressão 7.6, |ψ0〉 é a origem da informação, um estado que contém a informação procu-
rada. As transformações aplicadas a esse estado irão produzir uma alteração na amplitude
de um estado particular |ψ1〉. De acordo com Grover f(x) = Ax, x = f(x)A
, |ψ0〉 = f(x)A
e
|ψ1〉 = x.
Inicialmente o algorítimo trabalha com representações binárias. Assim,
|ψ0〉 =
0
0...
1...
0
, (7.7)
e
〈ψ0|=[0 0 . . . 1 . . . 0
], (7.8)
tem-se os produtos
|ψ0〉〈ψ0|=
0 0 0 . . . 0
0 0 0 . . . 0
0 0 1 . . . 0...
......
......
0 0 0 . . . 0
, (7.9)
95
2|ψ0〉〈ψ0|=
0 0 0 . . . 0
0 0 0 . . . 0
0 0 2 . . . 0...
......
......
0 0 0 . . . 0
, (7.10)
I − 2|ψ0〉〈ψ0|=
1 0 0 . . . 0
0 1 0 . . . 0
0 0 1 . . . 0...
......
......
0 0 0 . . . 1
−
0 0 0 . . . 0
0 0 0 . . . 0
0 0 2 . . . 0...
......
......
0 0 0 . . . 0
=
1 0 0 . . . 0
0 1 0 . . . 0
0 0 −1 . . . 0...
......
......
0 0 0 . . . 1
(7.11)
7.4 Inversão seletiva da fase na média (Amplificação)
A inversão seletiva da fase mantendo a média das amplitudes é composta por
inversão da amplitude e transformação através da porta de Hadamard (Figura7.2). A porta
de Hadamard é a implementação física e simbólica da transformada de Wash-Hadamard
citada anteriormente.
De acordo com o princípio da amplificação da amplitude, um alvo ψt é atingido,
partido-se de um estado ψ0, através da aplicação da transformação −I0−WItW seguida por
W . Esta operação deve ser repetida π√
n4 vezes para que o alvo seja atingido.
W (−I0−WItW ) . . . (−I0−WItW )(−I0−WItW |ψ0〉 = |ψt〉 (7.12)
(−WI0−W )It . . . (−WI0−W )It(−WI0−W )ItW |ψ0〉 = |ψt〉 (7.13)
96
Figura 7.2: Fluxograma do algoritmo de Grover
97
(−WI0−W ) = −W (I − 2|ψ0〉〈ψ0|)W, (7.14)
−W (I − 2|ψ0〉〈ψ0|)W ≡ 2W |ψ0〉〈ψ0|W − I) (7.15)
cada elemento é igual a 1n, cada elemento é a média de todos os elemento do vetor inicial
−Wij(I − 2|ψ0〉〈ψ0|)Wij ≡ 2Wij|ψ0〉〈ψ0|Wij − Iij) = αav (7.16)
−W |ψ0〉〈ψ0|Wα = αav (7.17)
I − 2|ψ0〉〈ψ0|=
1 0 0 . . . 0
0 1 0 . . . 0
0 0 1 . . . 0...
......
......
0 0 0 . . . 1
0 0 0 . . . 0
0 0 0 . . . 0
0 0 2 . . . 0...
......
......
0 0 0 . . . 0
=
1 0 0 . . . 0
0 1 0 . . . 0
0 0 −1 . . . 0...
......
......
0 0 0 . . . 1
(7.18)
αav = 1n
∑i αi o i-ésimo elemento de 7.17 é igual a 2αav − αi. Com a inversão
do sinal do estado a magnitude aumenta de 2αav. Resumindo W |ψ0〉, It = I − 2|ψ0〉〈ψ0| e
−WI0−W .
7.5 Identificação de moléculas utilizando o algoritmo
de Grover
A identificação de moléculas é uma questão importante no controle de qualidade de
alimentos [86], controle de medicamentos [87], a segurança nos aeroportos para localização de
98
drogas e bombas e área forense [88] e detecção de contaminação de rios [89]. Neste trabalho,
foi explorada a absorção de luz na região do infravermelho. Os números de onda na região do
infravermelho estão entre 4000 e 400 cm−1 (em diferentes ligações, de diferentes substâncias,
os modos normais de vibração absorvem energia e têm números de onda diferentes, em um
espectro na região do infravermelho.) Uma molécula pode ser caracterizada por picos de
absorções no espectro na região do infravermelho [90]. Como exemplo, o intervalo entre
3650 − 3580 cm−1 é associado com O − H existentes em moléculas de álcool, o intervalo
entre 3200 − 3550 cm−1 está associado com ligações H − H que se estende em moléculas
de álcool, a faixa entre 1250 − 970 cm−1 é associada com ligações C − O em moléculas
de álcool. Cada molécula tem o seu próprio espectro de infravermelho. Como exemplo, é
possível correlacionar um espectro com a molécula de metanol usando os picos que aparecem
nos números de onda 3347, 3336, 2933, 2522, 2046, 1460, 1116, 1030 e 652 cm −1. A grande
quantidade de moléculas exige uma grande base de dados para armazenar a informação e a
sequência para localizar uma informação depende da qualidade do algoritmo utilizado para
executar a pesquisa incluindo o hardware, especialmente em sistemas em tempo real. Em
sistemas de tempo real o tempo para procurar e processar uma informação é crucial para o seu
desempenho [91]. Além disso, a identificação das substâncias podem envolver a caracterização
de um par de diferentes técnicas como espectroscopia na região do infravermelho (ERIV),
espectrometria de massa e ressonância magnética nuclear [92]. Os softwares de buscas são
baseados em algoritmos clássicos para executar uma busca em um banco de dados. Aumentar
a velocidade para encontrar dados é um dos focos da ciência da computação [93].
Devido às características do computador clássico, a representação das informações
são apresentadas de forma semelhante às regras da álgebra linear. As informações receberão
um tratamento diferente em um computador quântico. No caso de um espectro obtido na
região do infravermelho, tem de ser considerada uma diferente forma de representação dessa
informação. Como uma primeira abordagem, o sistema estudado neste trabalho, foi um
protótipo de uma base de dados de espectros na regão do infravermelho. Em seguida, o
modelo de um banco de dados que se baseia em um registro quântico em que seu endereço
foi convertido para um modelo baseado em química quântica.
O objetivo inicial foi o desenvolvimento de um algoritmo para efetuar a identi-
ficação de uma molécula por análise de espectro na região do infravermelho, utilizando um
algoritmo quântico. Basicamente, o espectro é aplicado ao algoritmo que faz uma busca
numa base de dados para fazer a correlação com espectros armazenados previamente.
99
Neste trabalho foi desenvolvida uma aplicação do algoritmo de Grover, para os
estudos iniciais, que permitiu correlacionar um espectro na região do infravermelho, de teste,
com um espectro presente em um banco de dados de espectros de infravermelho de moléculas
conhecidas. Interfaces entre o algoritmo quântico e o computador clássico podem ser neces-
sárias e viabilizam a implementação e simulação dos sistemas desenvolvidos, utilizando-se a
computação quântica.
Foram utilizados espectros na região do infravermelho de alguns hidrocarbonetos
e álcoois na fase gasosa. O espectro na região do infravermelho (ERIV) foi convertido em um
formato adequado ao algoritmo de Grover. Os espectros foram divididos em regiões e cada
região foi subdividida em faixas de números de onda. Dentro de cada região apenas uma faixa
foi usada para indicar a interação do feixe de infravermelho com a amostra. Cada faixa foi
representada por um registro quântico. O registro que representou o pico da absorção mais
intensa assumiu o estado |1〉 e o restante assumiu o estado |0〉. Esse processo foi repetido
para todas as regiões do espectros e para todos os espectros que compuseram o banco de
dados inicial.
A tabela 7.1 contém uma amostra do conversão do espectro em registros quân-
ticos, em que f0=4000 cm−1 a f1=3874 cm−1 é a primeira faixa de freqüências e represen-
tam o registro |1〉, f2=3875cm−1 a f3=3749cm−1 representam o registro |2〉, f4=3750cm−1 a
f5=3924cm−1 representam o registro |3〉, f6=3625cm−1 a f7=3499cm−1 representam o registro
|4〉, f8=3500cm−1 a f9=3374cm−1 representam o registro |5〉, f10=3375cm−1 a f11=3249cm−1
representam o registro |6〉 e f12=3250cm−1 a f13=2999cm−1 representam o registro |7〉. O
registro |0〉 foi usado para indicar a ausência de absorção nesta na região do espectro.
Tabela 7.1: Correlação entre o estado quântico de um registro e o espectro na região doinfravermelho
Registro |0〉 |1〉 |2〉 |3〉 |4〉 |5〉 |6〉 |7〉Faixa de freqüências - f0-f1 f2-f3 f4-f5 f6-f7 f8-f9 f10-f11 f12-f13
Ligação detectada - - - - - - OH -
O espectro foi dividido em quatro regiões semelhantes a essa (regiões compreen-
didas entre 4000 cm−1 a 500 cm−1). Esse banco de dados básico foi utilizado para a prova
de conceito.
100
O algoritmo de Grover foi configurado para trabalhar com três qubits e três itera-
ções de Grover, confirmando a ordem de complexidade proposta como sendo igual a O(√N).
A execução do algoritmo possibilitou localizar o conjunto de registros quânticos necessário
para identificar um espectro apresentado ao algoritmo e presente no banco de dados. Esta
prova de conceito possibilitou o avanço dos estudos dentro da computação quântica.
A velocidade para encontrar um determinado objeto em um banco de dados é
muito importante e decisivo para sistemas de tempo real, é importante para estudar a poluição
de rios, quando são utilizados detetores ou sensores para avaliar os níveis de contaminação
que em geral necessita de uma solução rápida para a ação de um agente ambiental.
Cada estado é representado em binário. A Tabela 7.1 mostra a possíveis estados
para um sistema representado por estados com oito bits. Dada a função
y = f(x), (7.19)
onde y = 1 para o estado xs e y = 0 para todos os outros estados xm, então o estado xs
vai ser a solução. O objetivo do algoritmo é encontrar xs. Em termos computacionais, xs é
o endereço do registo de que o bit de dados é armazenada uma tabela. Primeiro, o sistema
tem que estar em um estado arbitrário, como exemplo 1 |0〉. Se o sistema está em estado de
|0〉 é necessário girar a fase de π radianos usando a transformação
e
jφ1 0
0 ejφ2
, (7.20)
em que j =√−1 e φ1, φ2 são números reais arbitrários.
O operador de Grover é aplicado a O(√n) vezes. A complexidade é S(
√N), N
onde está o número de qubits. É necessário repetir a aplicação do oráculo um número de
tempo estimado em π4
√NM
, onde M é o número de soluções que são procurados.
Como dito anteriormente, o espectro infravermelho de uma molécula é um registro
relacionado ao número de onda, e não valores discretos. Foi necessário codificar o espectro
para adequar ao algoritmo quântico. A maneira de representar o espectro de infravermelho foi
modificada para ser utilizado em computador quântico de modo a tornar possível a utilização
do algoritmo de Grover. O algoritmo de Grover foi desenvolvido para encontrar apenas dados
discretos em um registo. Pode-se calibrar o espectrômetro para fornecer os dados do espectros
101
no formato apropriado para o algorítimo de Grover, de forma que não haja manipulação
prévia do dados, o que comprometeria a real aplicabilidade do algorítimo.
Foi desenvolvida uma aplicação utilizando o algoritmo de Grover, com base no
código desenvolvido por Burda [94] para correlacionar um espectro na região do infravermelho
para um grupo que representa uma molécula. Foi utilizado um espectro que abrange o
intervalo de 4000 cm−1 a 500 cm −1 dividido em cinco registros, r0, r1, r2, r3 e r4 com oito
estados (|0〉, |1〉, |2〉, |3〉, |4〉, |5〉, |6〉 e |7〉).
O formato do registro r0 é mostrado na Tabela 7.1 onde a primeira linha contém
os possíveis estados do registro, a segunda linha a representação binária do estado do registro.
No início, o estado do registro é pré-estabelecido como 1 |0〉, isso significa que nenhum pico
foi detectado ainda (Tabela 7.1).
O estado do registro está correlacionado com o pico mais intenso no grupo. Este
processo pode ser executado pelo espectrômetro após a implementação desse recurso em sua
interface de usuário. A Tabela 7.1 mostra a correlação entre os estados do espectro quântico e
os utilizados no algoritmo, como exemplo, para o primeiro grupo de intervalos de frequências
(4000-2999 cm−1), OH é o grupo, f0=4000, f1=3874, f2=3875, f3=3749, f4=3750, f5=3624,
f6=3625, f7=35499, f8=3500, f9=3374, f10=3375, f11=3249, f12=3250 e f13=2999. A mesma
ideia foi usada para o restante do espectro.
O grupo OH é representado pelo registro r0 no estado |6〉. O algoritmo de Grover
vai encontrar o estado do registro, que será comparado com os espectros de análise. É fácil de
converter o espectro na região do infravermelho para este formato, também é possível incluir
esta funcionalidade no espectrômetro.
7.6 Resultados e discussão sobre a aplicação do algo-
ritmo de Grover
A seguir são apresentados os resultados a aplicação do algoritmo de Grover em
dois problemas protótipos, que serviram como prova de conceito para o presente estudo.
102
7.6.1 Identificação de moléculas utilizando o algoritmo de Grover
A informação sobre as moléculas tem de ser armazenada numa base de dados. O
processo de pesquisa em base de dados para a identificação de moléculas consiste em fazer
uma correlação entre uma informação digitalizada a partir de um sensor e um conjunto de
dados armazenados numa base de dados. As identificações são positivas quando as leituras
correspondem com dados em um banco de dados. Neste trabalho, a base de dados foi pre-
enchida com dados de espectro na região do infravermelho de moléculas [90]. O objetivo foi
utilizar um algoritmo quântico para encontrar o endereço que contém os dados que estão
correlacionados com o espectro de uma molécula desconhecida. O algoritmo foi configurado
para trabalhar com qubits e duas interações de Grover. O algoritmo foi executado para os
cinco grupos de frequências e obteve-se os estados de saída equivalentes aos grupos OH, CH,
CC e CO, que caracterizam as moléculas de metanol.
Podemos aumentar a precisão da identificação da molécula aumentando o número
de q-bits para representar as gamas de frequências, sendo mais seletiva. Com dois passos de
Grover em cada grupo obteve-se a correlação com o banco de dados. A Tabela 7.2 mostra a
evolução do oráculo para encontrar o estado do registro r0 que mostra a localização do pico
mais importante dentro da faixa de f0 − f1. Na primeira iteração do oráculo mostra que a
localização do pico é no estado |6〉 com 78, 13% de probabilidade de acerto. A probabilidade
de ser os outros estados é igual a 3, 12%.
Tabela 7.2: Correlação entre o estado quântico de um registro e o espectro na região doinfravermelho
Registro |0〉 |1〉 |2〉 |3〉 |4〉 |5〉 |6〉 |7〉Faixa de freqüências - f0-f1 f2-f3 f4-f5 f6-f7 f8-f9 f10-f11 f12-f13
Ligação detectada - - - - - - OH -Estado inicial do registro 1 0 0 0 0 0 0 0
Estado final do registro r0 0 0 0 0 0 0 1 0
Em termos de computação quântica a informação sobre a molécula de metanol tem
o seu endereço na base de dados representado pela (|6〉,|1〉, |6〉, |1〉,|3〉). Foram necessárias dez
iterações do algoritmo de Grover contra dezessete usando a pesquisa clássica. O tamanho do
registro foi de 8, portanto na computação clássica é necessário, no pior caso, para verificar sete
posições para encontrar o alvo, a complexidade O(8), para N = 8. Utilizando o algoritmo de
Grover, foi obtido o resultado com três interações, significa complexidade O(√N), o número
103
estimado de iterações foi 2, 8 mas foi arredondado para 3, uma vez que as interações são
contadas com números inteiros.
7.6.2 Determinação do mínimo de um potencial protótipo via al-
goritmo de Grover
Nesta parte do trabalho, foi desenvolvido um algoritmo, baseado no algoritmo de
Grover, para determinar o mínimo de um potencial simples, para efeito de prova de conceito.
O algorítimo foi adaptado para poder trabalhar com valores no sistema decimal,
ao contrário do algorítimo inicial que propunha a amplificação e inversão de valores discretos
(binários).
Seja f(x) = x2 um potencial, representados na Figura 7.3, discretizado de forma a
ser representado por um vetor x com oito elementos contendo os valores reais. Cada elemento
índice do elemento dentro do vetor x foi correlacionado com um estado quântico Tabela 7.3.
Assim o algoritmo irá procurar qual o estado quântico aponta para a posição dentro do vetor
que contém a solução do problema, ou seja, o mínimo do potencial.
Tabela 7.3: Correlação entre o estado quântico de um registro e a intensidade do potencial,em que o número real passa a ser representado pelo estado quântico que indica aonde seencontra o seu valor
Registro |0〉 |1〉 |2〉 |3〉 |4〉 |5〉 |6〉 |7〉Intensidade do potencial -0,50 -0,23 0,04 0,31 0,58 0,85 1,12 1,39Estado inicial do registro 1 0 0 0 0 0 0 0
Estado final do registro |ψ0〉 0 0 0 0 0 0 1 0
Para adequação ao algoritmo quântico de Grover, o potencial foi modificado para
apresentar um máximo ao invés de um mínimo (Figura 7.3).
O algoritmo foi configurado para três iterações do oráculo. Após aplicar o algo-
ritmo obteve-se o estado |ψ〉 = 2, como mostrado na Tabela 7.4.
O estado |ψ〉 = 0 equivale a x = 1, o estado |ψ〉 = 1 equivale a x = 2, o estado
104
−0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 1.20
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
X
f(x)
Figura 7.3: Potencial Harmônico
1 2 3 4 5 6 7 8−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
Figura 7.4: Potencial Harmônico invertido para adequação ao algoritmo de Grover
105
Tabela 7.4: Estado final do oráculo.
Registro |0〉 |1〉 |2〉 |3〉 |4〉 |5〉 |6〉 |7〉Intensidade do potencial -0,50 -0,23 0,04 0,31 0,58 0,85 1,12 1,39Estado inicial do registro 1 0 0 0 0 0 0 0
Estado final do registro 0,173 0,36 0,55 0,26 0,21 0,40 0,16 -0,49Estado final normalizado |ψ0〉 0 0 1 0 0 0 0 0
0 1 2 3 4 5 6 70
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Par
te R
eal
|ψ⟩
Figura 7.5: Estado de |ψ〉 que indica o índice do registro x que contém o mínimo, sendo queo índice |2〉 equivale ao elemento “3” do vetor clássico que contém o mínimo do potencial.
106
|ψ〉 = 2 equivale a x = 3 e assim sucessivamente.
7.7 Conclusões gerais
A principal questão no estudo da mecânica quântica, em ciência da computação,
é a impossibilidade, até agora, em executar os algoritmos em um computador quântico real.
A primeira maneira de cobrir este problema foi fazer a conversão dos dados utilizados em
computadores clássicos com os dados para os computadores quânticos. Uma vez determinada
uma maneira de usar os dados clássicos em um formato adequado ao computador quântico,
é possível o desenvolvimento e a utilização dos algoritmos. A conversão de um espectro na
região do infravermelho para o trabalho foi suficiente para testar o algoritmo de Grover com
o presente problema. A eficiência do processo pode aumentar usando um registro maior.
Neste trabalho, o espectro foi dividido em regiões para alocar os picos mais importantes,
mas o ideal seria desenvolver uma maneira de codificar o espectro em um único registro.
Este processo deverá envolver a melhoria do algoritmo de Grover para trabalhar com uma
função com mais do que um estado. O estudo de interfaces é crítico para a execução do
algoritmo. O uso de uma linguagem específica para uma simulação em computador quântico
pode ser experimentado, a fim de facilitar o algoritmo de agendamento e aumentar a gama
de aplicações.
Essa aplicação do algoritmo quântico, em química, serviu de prova de conceito
da aplicabilidade da CQ em problemas reais. A determinação do mínimo de um potencial
indica a eficiência do algoritmo, uma vez que uma informação desconhecida foi localizada
sem a interação com o usuário, bem como a sua aplicabilidade em um problema real. Até
então, os dados a serem procurados eram manipulados pelo usuário. O sucesso na aplicação
do algoritmo de Grover na procura de um mínimo, caracteriza o passo inicial para a imple-
mentação de sistema baseados nas redes neurais artificiais, em que a energia mínima da rede
caracteriza o aprendizado. A não utilização de valores discretos, como proposto por Grover,
implicou na não obtenção de 100% de probabilidade na identificação do estado do registro.
Porém é nítido que o estado solução do problema foi privilegiado em sua intensidade (Figura
7.5).
107
Capítulo 8
Redes neurais quânticas aplicadas ao
estudo de estados ligados de dímeros
de He
8.1 Introdução
O atual trabalho consiste em um estudo inicial sobre as Redes Neurais Artificiais
Quânticas. O estado da arte das RNAQ ainda encontra-se em processo de estruturação. Com
o objetivo de esclarecimento e de situar o presente trabalho, o conteúdo, aqui apresentado,
constou de uma breve introdução ao conceito do computador clássico. Identificando suas
principais características funcionais, como por exemplo o bit (“0” ou “1”), cujas combinações
permitem converter o mundo real para o ambiente computacional, de forma numérica. A
porta NOT (Figura 8.1), que transforma o “0” no “1” e “1” no “0”. A porta XOR (Figura
Figura 8.1: Símbolo da Porta NOT
108
8.2) que efetua a principal operação que permite implementar a soma entre dois números,
dando ao computador clássico, a capacidade de reproduzir todo o universo matemático e
tudo que for modelado dentro de suas regras. Sendo esse computador construído a base de
silício e seguem a álgebra de Boole.
Figura 8.2: Símbolo da porta XOR.
A RNA clássica, apresentada, foi desenvolvida com o objetivo de estabelecer de
forma sólida o conceito de rede neural, para então servir como referência e guia no estudo
das redes neurais artificiais quântica. Um trabalho sobre a função de distribuição radial, foi
implementado de forma a contribuir para o entendimento da modelagem da RNA.
O estudo dos estados ligados de dímeros de He via RNA clássica caracterizou-
se como a fronteira conceitual identificada no presente trabalho, pois, esse estudo utilizou
a mecânica quântica em algoritmos desenvolvidos para o computador clássico e uma RNA
clássica desenvolvida em um computador clássico. Assim foi estabelecida a ligação entre a
mecânica clássica e o conceito de rede neural, sem discriminar essa última entre clássica ou
quântica.
Definido um problema em química, com foco no desenvolvimento e aplicação de
uma RNAQ, foi estudado o algoritmo de Grover, em que a ambientação na computação
quântica foi permitida. Um trabalho publicado em congresso evidenciou a aplicabilidade desse
algoritmo em um problema químico, utilizado como um protótipo primitivo, para validação
do método.
Esse capítulo envolve o conjunto de itens estudados durante o trabalho bem como
o aprendizado decorrente dos testes e aplicações das teorias envolvidas. Tenta-se deixar
claro a problemática da transição da computação clássica para a computação quântica, as
109
dificuldades e exigências da interface para os dados. A Figura 8.3 foi criada para mostrar
como cada item tratado nesse trabalho esteve contido dentro de um contexto, sobreposto e
em alguns casos contido dentro de outro, dentro da linha do desenvolvimento do trabalho.
Figura 8.3: Linha do desenvolvimento contendo os itens trabalhados e suas relações durantea transição entre a computação clássica e a computação quântica
O próximo passo é a modelagem e aplicação de uma RNAQ. Várias são as pro-
postas para o modelo quântico de uma RNA e para um neurônio quântico teórico.
8.2 Um modelo para o neurônio quântico
Um exemplo de aplicação da computação quântica em redes neurais é dado a
seguir. Consideremos o neurônio, proposto por Fei [95], com N entradas |x1〉 ... |xx〉, como
mostrado na Figura 8.4. |xj〉 um qubit na forma
|xj〉 = aj |0〉+ bj |1〉 = (aj, bj)T (8.1)
Neste exemplo o qubit é um vetor complexo em um espaço bi-dimensional cuja
base é {|0〉 , |1〉}. Esta base pode ser expressa como {(1, 0)T , (0, 1)T}. Os estados das bases
110
Figura 8.4: Neurônio Quântico
|0〉 e |1〉 equivalem aos valores 0 e 1 do bit clássico. Um qubit |φ〉 é a superposição desses dois
estados, sendo |φ〉 = α|0〉+β|1〉, em que β e α são probabilidade de amplitudes |α|2+|β|2= 1.
A combinação de 〈xj| e |xi〉 como em 〈xj |xi〉 denota o produto interno de dois
vetores e é um escalar, logo:
〈0 |0〉 = 〈1 |1〉 = 1 (8.2)
e
〈0 |1〉 = 〈1 |0〉 = 0 (8.3)
Outro modelo, está disponível na literatura, não tratado aqui, como o modelo de
Li [96] (Figura 8.5), que trata da porta quântica CNOT , cujo efeito do qubit de controle é
ajustado de forma a comportar-se como um peso sináptico.
111
Figura 8.5: Modelo de um neurônio quântico baseado na porta CNOT, em que os doisterminais do lado esquerdo são as entradas de estímulos e os dois terminais do lado direitosão as saídas de estímulos.
8.3 A propagação em um neurônio quântico
A propagação de um estímulo quântico caracteriza-se pela interação entre os
qubits, através das matrizes unitárias (pesos) e a sua saída será determinada por:
|y〉 = F∑
j=1
Nwj |xj〉 (8.4)
em que wj é uma matriz 2x2 atuando na base {|0〉 , |1〉}, F é um operador que pode ser
implementado por uma rede de portas quânticas.
Em um processo de treinamento, wj pode ser calculado por ajustes dos pesos
através de uma retropropagação, como nas redes clássicas. A retropropagação consiste em
ajustar os pesos, no sentido oposto à propagação dos estímulos, em função do erro que a rede
comete ao reproduzir os dados de treinamento.
112
8.4 A função XOR por redes neurais quânticas
A correspondência entre a Rede Neural Clássica e a Rede Neural Quântica, em
relação à natureza clássica e à natureza quântica, é mostrada na Tabela 8.1.
Tabela 8.1: Correspondência entre a Rede Neural Clássica e a Rede Neural Quântica
Redes Clássicas Redes QuânticasEstado do neurônio qubits
xi ∈ R |x〉 = a |0〉 + b |1〉Conexão Entrelaçamento{wij} |x0x1...xp−1〉
Regra de aprendizado Superposição de estados entrelaçados∑ps=1 x
six
sj
∑ps=1 as |x0x1...xp−1〉
Procura de um vencedor Transformação unitárian = maxarg(fi) U : ψ −→ ψ′
Resultado na saída DecorrênciaN
∑ps=1 as |xs〉 ⇒
∣∣∣xk⟩
É conhecido da literatura que uma rede neural clássica de uma única camada não
pode aprender o comportamento de uma função XOR [18]. Neste caso são necessárias duas
camadas, sendo uma com dois neurônios de entrada e um neurônio na saída.
Nos resultados apresentados a seguir, um único neurônio quântico, proposto (Fi-
gura 8.6) por [95], foi capaz de representar uma função XOR.
Considerando este neurônio com duas entradas, tem-se a saída:
|y〉 = F∑
j=1
wj |xj〉 = F (w1 |x1〉+ w2 |x2〉). (8.5)
Escolhendo
113
Figura 8.6: Modelo proposto para um neurônio quântico
w1 = w2 = H =1√2
1 1
1 −1
(8.6)
e
F =1√2
0 1
1 −1
sgn(.) 0
0 sgn(.)
(8.7)
em que sgn(.) é o sinal dos valores dos elementos para função e são determinados por um
processo de treinamento. A saída desse neurônio possibilitou reproduzir o comportamento
da função XOR Tabela 8.2.
Tabela 8.2: Função XOR reproduzida pelo neurônio quântico.
|x1〉 |x2〉 w1 |x1〉+ w2 |x2〉 |y〉|0〉 |0〉 (
√2,√
2)T |0〉|0〉 |1〉 (
√2, 0)T |1〉
|1〉 |0〉 (√
2, 0)T |1〉|1〉 |1〉 (
√2,−√
2)T |0〉
114
8.5 Determinação do número de estados ligados via
RNAQ
No Capítulo 5 estados ligados para dímeros formados por He com alguns gases
nobres foram estudados de forma a estabelecer um conjunto de informações que reproduziriam
um sistema experimental. Os dados obtidos teoricamente representam um sistema físico real
(Tabela 8.3). Assim, esses dados puderam ser usados para representar aqueles que seriam
os dados obtidos experimentalmente [97], em que um sistema composto por substâncias
em solução aquosa, foi simulado e tratado como dados de um sistema real obtidos de um
experimento.
Tabela 8.3: Relação dos estados ligados para diferentes dímeros de gases nobres
l HeHe HeNe HeAr HeKr HeXe0 0 1 1 2 21 0 1 1 1 12 0 1 1 1 13 0 0 1 1 14 0 0 1 1 15 0 0 0 1 16 0 0 0 0 0
Nesta parte do trabalho, foram escolhidos para a modelagem quatro dímeros,
HeHe, HeNe, HeAr e HeKr. Nesta modelagem o sistema foi composto por gases nobres, e as
variáveis do sistema foram representadas na forma adequada para serem processadas através
de uma linguagem relacionada à computação quântica.
Supondo que, para dois estados 0 e 1
|ψsqubit〉 = α|0〉+ β|1〉 =
αβ
, (8.8)
em que |ψsqubit〉 é o qubit que representa o estado do sistema. Como na expressão 6.9 do
115
capítulo 6, para |xn〉 estados de probabilidade pn, tem-se
|ψsqubit〉 = p0|x0〉+ p1|x1〉+ ...+ pn|xn〉 =
p0
p1...
pn
, (8.9)
em que n varia de 0 até o número de estados possíveis.
No tratamento via RNA quântica o átomo foi representado por sua distribuição
eletrônica, convertida no formato adequado à computação quântica.
O qubit recebeu a seguinte notação para representar um átomo:
|ψÁtomoqubit 〉 = p0|OrbitalEletron
0 〉+ p1|OrbitalEletron1 〉+ ...+ pn|OrbitalEletron
n 〉 =
p0
p1...
pn
, (8.10)
em que p0, p1,...pn são as amplitudes de probabilidade. O qubit foi modelado levando-se em
conta o átomo mais complexo em estudo, neste caso, o Criptônio Kr, que possui 36 elétrons,
foi o primeiro a ser representado.
Para que não houvesse conflito com a notação empregada na mecânica quântica
os elétrons foram codificados em binário de acordo com a Tabela 8.4.
Tabela 8.4: Codificação dos elétrons do Criptônio para o uso na RNAQ
Elétron Codificação
1s1 1√36|000000〉
1s2 1√36|000001〉
2s1 1√36|000010〉
2s2 1√36|000011〉
2p1 1√36|000100〉
2p2 1√36|000101〉
2p3 1√36|000110〉
2p4 1√36|000111〉
116
Tabela 8.4 – Continuação da página anterior.
Elétron Codificação
2p5 1√36|001000〉
2p6 1√36|001001〉
3s1 1√36|001010〉
3s2 1√36|001011〉
3p1 1√36|001100〉
3p2 1√36|001101〉
3p3 1√36|001110〉
3p4 1√36|001111〉
3p5 1√36|010000〉
3p6 1√36|010001〉
4s1 1√36|010010〉
4s2 1√36|010011〉
3d1 1√36|010100〉
3d2 1√36|010101〉
3d3 1√36|010110〉
3d4 1√36|010111〉
3d5 1√36|011000〉
3d6 1√36|011001〉
3d7 1√36|011010〉
3d8 1√36|011011〉
3d9 1√36|011100〉
3d10 1√36|011101〉
4p1 1√36|011110〉
4p2 1√36|011111〉
4p3 1√36|100000〉
4p4 1√36|100001〉
4p5 1√36|100010〉
4p6 1√36|100011〉
5s1 0 |100100〉5s2 0 |100101〉4d1 0 |100110〉4d2 0 |100111〉
117
Tabela 8.4 – Continuação da página anterior.
Elétron Codificação
4d3 0 |101000〉4d4 0 |101001〉4d5 0 |101010〉4d6 0 |101011〉4d7 0 |101100〉4d8 0 |101101〉4d9 0 |101110〉4d10 0 |101111〉5p1 0 |110000〉5p2 0 |110001〉5p3 0 |110010〉5p4 0 |110011〉5p5 0 |110100〉5p6 0 |110101〉6s1 0 |110110〉6s2 0 |110111〉4f 1 0 |111000〉4f 2 0 |111001〉4f 3 0 |111010〉4f 4 0 |111011〉4f 5 0 |111100〉4f 6 0 |111101〉4f 7 0 |111110〉4f 8 0 |111111〉
118
Assim, o átomo de Kr foi representado pelo qubit
|ψKrqubit〉 =
1√36|000000〉+
1√36|000001〉+
1√36|000010〉+
1√36|000011〉+
1√36|000100〉
+1√36|000101〉+
1√36|000110〉+
1√36|000111〉+
1√36|001000〉+
1√36|001001〉
+1√36|001010〉+
1√36|001011〉+
1√36|001100〉+
1√36|001101〉+
1√36|001110〉
+1√36|001111〉+
1√36|010000〉+
1√36|010001〉+
1√36|010010〉+
1√36|010011〉
+1√36|010100〉+
1√36|010101〉+
1√36|010110〉+
1√36|010111〉+
1√36|011000〉
+1√36|011001〉+
1√36|011010〉+
1√36|011011〉+
1√36|011100〉+
1√36|011101〉
+1√36|011110〉+
1√36|011111〉+
1√36|100000〉+
1√36|100001〉+
1√36|100010〉
+1√36|100011〉+ 0|100100〉+ 0|100101〉+ 0|100110〉+ 0|100111〉
+ 0|101000〉+ 0|101001〉+ 0|101010〉+ 0|101011〉+ 0|101100〉+ 0|101101〉+ 0|101110〉+ 0|101111〉+ 0|110000〉+ 0|110001〉+ 0|110010〉+ 0|110011〉+ 0|110100〉+ 0|110101〉+ 0|110110〉+ 0|110111〉+ 0|111000〉+ 0|111001〉+ 0|111010〉+ 0|111011〉+ 0|111100〉+ 0|111101〉+ 0|111110〉+ 0|111111〉
(8.11)
em que os 36 primeiros estados, |000000〉, |000001〉,..., |100011〉 representam os elétrons desse
átomo, com probabilidade igual a 1/√
36 cada uma, indicando que todos têm o mesmo peso
na representação do átomo e o restante dos estados possuem probabilidade igual a zero,
indicando que estes estados não têm peso na representação do átomo, ou seja, os orbitais
estão vazios. Os estados que representam orbitais vazios, foram adicionados para completar
um número de estados suficiente para obter uma quantidade de estados equivalente a uma
potência de base 2, neste caso 64, dada a natureza da computação quântica. Como esses
estados não possuem peso na representação do átomo, foi atribuída a probabilidade 0 aos
seus índices.
Seguindo o mesmo princípio utilizado para o Kr, o átomo de He foi representado
119
por
|ψHequbit〉 =
1√2|000000〉+
1√2|000001〉+ 0|000010〉+ 0|000011〉+ 0|000100〉+ 0|000101〉
+ 0|000110〉+ 0|000111〉+ 0|001000〉+ 0|001001〉+ 0|001010〉+ 0|001011〉+ 0|001100〉+ 0|001101〉+ 0|001110〉+ 0|001111〉+ 0|010000〉+ 0|010001〉+ 0|010010〉+ 0|010011〉+ 0|010100〉+ 0|010101〉+ 0|010110〉+ 0|010111〉+ 0|011000〉+ 0|011001〉+ 0|011010〉+ 0|011011〉+ 0|011100〉+ 0|011101〉+ 0|011110〉+ 0|011111〉+ 0|100000〉+ 0|100001〉+ 0|100010〉+ 0|100011〉+0|100100〉+0|100101〉+0|100110〉+0|100111〉+0|101000〉+0|101001〉+0|101010〉+0|101011〉+0|101100〉+0|101101〉+0|101110〉+0|101111〉+0|110000〉+0|110001〉+0|110010〉+0|110011〉+0|110100〉+0|110101〉+0|110110〉+0|110111〉+0|111000〉+0|111001〉+0|111010〉+0|111011〉+0|111100〉+0|111101〉+0|111110〉+0|111111〉
(8.12)
em que os dois primeiros estados, |000000〉, |000001〉, representam os elétrons desse átomo,
com probabilidade igual a 1/√
2.
O átomo de Ne, com seus dez elétrons, foi representado por
|ψNequbit〉 =
1√10|000000〉+
1√10|000001〉+
1√10|000010〉+
1√10|000011〉+
1√10|000100〉
+1√10|000101〉+
1√10|000110〉+
1√10|000111〉+
1√10|001000〉+
1√10|001001〉
+0|001010〉+0|001011〉+0|001100〉+0|001101〉+0|001110〉+0|001111〉+0|010000〉+0|010001〉+0|010010〉+0|010011〉+0|010100〉+0|010101〉+0|010110〉+0|010111〉+0|011000〉+0|011001〉+0|011010〉+0|011011〉+0|011100〉+0|011101〉+0|011110〉+0|011111〉+0|100000〉+0|100001〉+0|100010〉+0|100011〉+0|100100〉+0|100101〉+0|100110〉+0|100111〉+0|101000〉+0|101001〉+0|101010〉+0|101011〉+0|101100〉+0|101101〉+0|101110〉+0|101111〉+0|110000〉+0|110001〉+0|110010〉+0|110011〉+ 0|110100〉+ 0|110101〉+ 0|110110〉+ 0|110111〉+ 0|111000〉+ 0|111001〉+ 0|111010〉+ 0|111011〉+ 0|111100〉+ 0|111101〉+ 0|111110〉+ 0|111111〉
(8.13)
em que os dez primeiros estados, |000000〉, |000001〉,...,|001001〉 representam os elétrons desse
átomo, com probabilidade igual a 1/√
10.
O átomo de Ar, com seus dezoito elétrons, foi representado por
120
|ψArqubit〉 =
1√18|000000〉+
1√18|000001〉+
1√18|000010〉+
1√18|000011〉+
1√18|000100〉
+1√18|000101〉+
1√18|000110〉+
1√18|000111〉+
1√18|001000〉+
1√18|001001〉
+1√18|001010〉+
1√18|001011〉+
1√18|001100〉+
1√18|001101〉+
1√18|001110〉
+1√18|001111〉+ 1√
18|010000〉+ 1√
18|010001〉+0|010010〉+0|010011〉+0|010100〉
+0|010101〉+0|010110〉+0|010111〉+0|011000〉+0|011001〉+0|011010〉+0|011011〉+ 0|011100〉+ 0|011101〉+ 0|011110〉+ 0|011111〉+ 0|100000〉+ 0|100001〉+ 0|100010〉+ 0|100011〉+ 0|100100〉+ 0|100101〉+ 0|100110〉+ 0|100111〉+ 0|101000〉+ 0|101001〉+ 0|101010〉+ 0|101011〉+ 0|101100〉+ 0|101101〉+ 0|101110〉+ 0|101111〉+ 0|110000〉+ 0|110001〉+ 0|110010〉+ 0|110011〉+ 0|110100〉+ 0|110101〉+ 0|110110〉+ 0|110111〉+ 0|111000〉+ 0|111001〉+ 0|111010〉+ 0|111011〉+ 0|111100〉+ 0|111101〉+ 0|111110〉+ 0|111111〉
(8.14)
em que os dezoito primeiros estados, |000000〉, |000001〉,..., |010001〉 representam os elétrons
desse átomo, com probabilidade igual a 1/√
18.
Da mesma forma que a RNA clássica, a RNA quântica pode ser treinada por um
processo de aprendizado supervisionado [95]. Os conjuntos de dados para o treinamento,
obtido no trabalho citado no Capítulo 5, já publicados [98], são: [|ψHequbit〉, |ψNe
qubit〉, |ψArqubit〉,
|ψKrqubit]〉, para a entrada da rede. Esses dados são apresentados na entrada da rede aos pares.
Os dados de saída, [|ψ0qubit, |ψ1
qubit, |ψ2qubit, |ψ3
qubit], são apresentados na saída da
rede para um treinamento supervisionado. O par [|ψHequbit〉, |ψHe
qubit〉] corresponde à ativação da
saída |ψ0, indicando a não formação de estados ligados.
Considerando quatro neurônios com duas entradas, tem-se as seguintes expressões
para a rede:
∣∣∣ψ0qubit
⟩= F (w1
∣∣∣ψA1qubit
⟩+ w2
∣∣∣ψA2qubit
⟩)∣∣∣ψ1
qubit
⟩= F (w1
∣∣∣ψA1qubit
⟩+ w2
∣∣∣ψA2qubit
⟩)∣∣∣ψ2
qubit
⟩= F (w1
∣∣∣ψA1qubit
⟩+ w2
∣∣∣ψA2qubit
⟩)∣∣∣ψ3
qubit
⟩= F (w1
∣∣∣ψA1qubit
⟩+ w2
∣∣∣ψA2qubit
⟩)
(8.15)
121
Adotando-se uma estrutura similar à da RNA clássica, a RNA quântica foi estru-
turada de acordo com a figura 8.7.
Figura 8.7: Rede neural quântica estruturada para a determinação do número de estadosligados à partir da estrutura eletrônica dos pares de átomos, em que |ψA1
qubit〉 e |ψA2qubit〉 são as
entradas da rede e |ψ0qubit〉, |ψ1
qubit〉, |ψ2qubit〉 e |ψ3
qubit〉 são as saídas.
O pesos sinápticos w1 e w2, são transformações unitárias tais que:
w1 = w2 = H =1√2
1 1
1 −1
(8.16)
O operado F tem a função de atuar nos qubits de forma a correlacioná-los com
os qubits que determinam os estados das saídas.
F =1√2
0 1
1 −1
sgn(.) 0
0 sgn(.)
(8.17)
em que sgn(.) é o sinal da função.
Para o caso dos estado ligados uma matriz de pesos sinápticos de 64 linhas e 64
colunas foi escolhida como sendo a transformação unitária (Figura 8.8).
122
0 10 20 30 40 50 60 700
10
20
30
40
50
60
70
Figura 8.8: Matrix de Hadamard de 64 por 64 termos, em que os quadrados brancos equivalema “1” e os quadrados escuros equivalem a “-1”.
123
Através de um processo de treinamento os valores dos elementos de F são deter-
minados. Neste trabalho, um conjunto de 1024 matrizes de estados F foram geradas com
valores aleatórios, supondo que dentre essas matrizes, uma ou mais, contivessem um conjunto
de dados solução. Através do algorítimo de Grover, foi localizada a matriz solução, através
do vetor de erros. Não há acompanhamento do decaimento do erro, uma vez que as possíveis
soluções são geradas simultaneamente no computador quântico e o algorítimo de Grover deve
ser executado com um número finito e pré-determinado de iterações.
O Algoritmo de Grover foi executado com 25 interações quânticas e o estado final
do oráculo foi medido como sendo |ψqubit〉 = |548〉 indicando que a solução encontrava-se no
registro 548 (Figura 8.9).
0 100 200 300 400 500 600 700 800 900 10000
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Pro
babi
lidad
e
Figura 8.9: Identificação do registro de maior probabilidade de encontrar a solução, caracte-rizando o treinamento da RNAQ.
O tempo estimado para a execução do processo foi baseado no trabalho de Er-
makok [99], que realizou experimentalmente o algorítimo de Grover, utilizando ressonância
124
Tabela 8.5: Determinação do número de estados ligados por uma RNAQ algorítimo do Gro-ver.
∣∣∣ψA1qubit
⟩ ∣∣∣ψA2qubit
⟩ ∣∣∣ψsqubit
⟩∣∣∣ψHe
qubit
⟩ ∣∣∣ψHequbit
⟩ ∣∣∣ψ0qubit = 0, ψ1
qubit = 0, ψ2qubit = 0, ψ3
qubit = 0⟩
∣∣∣ψHequbit
⟩ ∣∣∣ψNequbit
⟩ ∣∣∣ψ0qubit = 0, ψ1
qubit = 1, ψ2qubit = 0, ψ3
qubit = 0⟩
∣∣∣ψHequbit
⟩ ∣∣∣ψArqubit
⟩ ∣∣∣ψ0qubit = 0, ψ1
qubit = 1, ψ2qubit = 0, ψ3
qubit = 0⟩
∣∣∣ψHequbit
⟩ ∣∣∣ψKrqubit
⟩ ∣∣∣ψ0qubit = 0, ψ1
qubit = 0, ψ2qubit = 1, ψ3
qubit = 0⟩
magnética nuclear, que também esta no foco dos estudos referentes ao computador quântico.
Assim, a preparação do estado fundamental demanda um tempo de 0,00200s e o Algorítimo
de Grover demanda um tempo de 0,00658s, ambos rodando em um computador quântico.
A Tabela 8.5 contem a relação entre os dados de entrada, que identificam o dímero
e as medidas observáveis |ψ〉 das saídas da RNAQ. Em geral os estados são amplitudes
representadas por |〈ψ|ψ〉|2
8.6 Conclusão
O neurônio quântico se mostrou eficiente e reduziu significativamente a complexi-
dade de uma rede neural. Essa redução na complexidade da RNA reflete-se na simplificação
do pacote de dados trabalhados de forma simultânea. É importante ressaltar que essa dimi-
nuição na complexidade refere-se ao código sendo executado em um computador quântico.
Considerou-se que as interfaces criadas para preencher a lacuna da não existência de um
computador quântico, acessível durante o desenvolvimento deste trabalho.
O sucesso na aplicação dos princípios quânticos no neurônio exemplificaram o
efeito da substituição dos princípios da computação clássica pelos princípios da computação
quântica.
A primeira evidência da eficiência de uma rede neural quântica ficou caracterizada
na necessidade de apenas uma camada de neurônio(s). Isso é uma vantagem considerável em
relação RNA clássica, pois a camada adicional em uma RNA clássica adiciona a propriedade
125
de classificação à sua estrutura.
A segunda característica importante da RNAQ foi a necessidade de somente um
neurônio, no caso, quântico. Em relação à rede neural quântica, foi concluído que realmente
um simples neurônio quântico é capaz de atuar como uma função XOR. Esta é uma vantagem
importante em relação à rede neural clássica, pois só é possível implementar a função XOR
quando esta rede está na topologia de duas ou mais camadas e mais de um neurônio. Uma
linguagem de programação mais próxima dos sistemas de natureza quântica é muito mais
apropriado para a resolução de problemas mais complexos.
O efeito da classificação e da correlação de dados quânticos foram mostrados. Fica
em aberto o estudo da viabilidade da expansão do número de átomos e dímeros, que a RNAQ,
seguindo o modelo aqui estudado pode suportar.
126
Capítulo 9
Conclusão geral
A interface com o usuário, em um computador clássico, mascara o que ocorre real-
mente dentro da máquina. As linguagens de programação, de alto nível, inibem a percepção
do usuário em relação à forma que o processador de um computador clássico trabalha. O
conceito de bit, em geral, é puramente lógico e não retrata o efeito físico de sua manipu-
lação em termos dos circuitos lógicos. Um nivelamento, na forma de esclarecimento, deve
ser investigado para consolidar os conhecimentos sobre o computador clássico de forma a
entender a sua estrutura mínima básica. O conceito sobre bit, portas lógicas, porta lógica
NOT e XOR, devem ser plenamente entendidos. A analogia entre o computador clássico
e o conceito do que seria, ou será, o computador quântico, deve ser de constante discussão.
O entendimento da computação quântica e sua utilização não segue o mesmo paradigma da
computação clássica. Na computação clássica, implementa-se a máquina (hardware) e pos-
teriormente desenvolvem-se programas, baseados em algoritmos, para serem executados. Na
computação quântica, essa ordem não é verdadeira, esta pode avançar de forma independente
do computador quântico. A computação quântica segue as leis da mecânica quântica e uma
vez que um algoritmo obedece essas leis, ele pode ser considerado plausível.
O computador quântico, máquina responsável por executar algoritmos quânticos,
também deve seguir as leis da mecânica quântica e deve ser capaz de responder aos estímulos
de natureza quântica.
O que discute-se é a clareza da incorporação de efeitos quânticos em algoritmos
127
de otimização. Apesar do fato de que o primeiro ponto em sistema quântico é o aparecimento
da constante de Planck que caracteriza a mecânica quântica numa forma rigorosa. Então,
como caracterizar a influência onde está a constante de Planck é uma questão relevante. Não
está explicita a influência da constante de Planck no algorítimo de Grover.
Podem então ser chamados de AQ? De forma rigorosa a resposta é: não. Grover
não precisa de interpretado como um algoritmo quântico para funcionar, mas precisa se im-
plementado sob as regras da mecânica quântica para poder ser executado em um computador
quântico e mostra a sua vantagem em relação ao clássico. Nenhum desses algoritmos começa
na equação de Schrödinger e termina em algoritmo de otimização. O que chega mais perto
disso seria o Grover, mas, aparentemente, não incorpora a constante de Planck.
Conclui-se que o desenvolvimento, tanto da Computação Quântica quanto do
computador quântico, até o atual momento, pode ser dado de forma assíncrona, pois, seguindo
as leis da quântica, ambos os desenvolvimentos irão convergir para o mesmo ponto, sendo
que inclusão da constante de Plank deve ser investigada. Uma consequência do presente
estudo foi a volta à formulação de Bohm da Mecânica Quântica. Essa formulação incorpora
de forma clara emaranhamento, não localidade e o paradoxo EPR, emprestadas no estudo
dos computadores quânticos.
Diante de algumas realizações experimentais referenciadas ao longo do texto, foi
possível idealizar uma máquina completa e até propor um sistema de processamento para
uma possível CPU quântica.
Este trabalho permitiu estabelecer de forma sólida um modelo para o computador
quântico, baseado em realizações experimentais. Propor um modelo para o computador
quântico foi primordial para situar o grupo na CQ.
A computação quântica não é simplesmente a implantação de um novo conceito
de computadores e algorítimos. Ela envolve um novo conceito na estruturação dos problemas
numéricos, armazenamento de informação e linguagem de programação. O conceito de CQ
não concentra somente na criação de algorítimos. O fato do computador quântico ser um
conceito que ainda não foi totalmente estruturado, causa uma gama de discussões sobre o
que realmente é a computação quântica e onde se estabelece a fronteira entre, computação
quântica, computador quântico, algorítimos e usuários. Ficou claro que há a necessidade de
se criar uma linguagem própria a CQ e uma interface com o usuário.
128
Os algoritmos plausíveis para a computação quântica chamam a atenção para o
desenvolvimento de uma linguagem mais amigável para a Química, a qual não é limitada
pelos recursos disponibilizados pela computação clássica.
O computador quântico promete um aumento da velocidade de processamento
e uma compactação maior do processadores. Os algoritmos quânticos prometem ser mais
velozes e solucionar problemas com maior eficiência do que os computadores clássicos. Pro-
blemas complexos para os computadores clássicos podem ser resolvidos com baixo custo
computacional por um computador quântico. Com base nessas perspectivas e no avanço das
pesquisas, abre-se um grande espaço de aplicações desta tecnologia. Estudar suas caracte-
rísticas, torna-se fundamental para sua adequação às áreas de interesse. Há necessidade do
estudo dos conceitos da computação clássica dentro da computação quântica, para aprovei-
tamento e conversão dos algoritmos atuais. Fica evidente, neste momento, a necessidade de
investigar a possibilidade de implementação experimental, em um sistema quântico real, das
informações geradas nesse trabalho.
O objetivo principal deste trabalho, o uso de um modelo de RNAQ em um sistema
químico, foi demonstrado. Foi possível executar, em um computador clássico, uma rede neural
artificial quântica, lançando mão de interfaces, para compor uma camada computacional
entre o algoritmo quântico e o computador clássico. Esta camada que pode ser olhada como
uma interface, poderá ser facilmente retirada quando da utilização do algoritmo em um
computador quântico real.
A rede neural artificial quântica, tendo os devidos ajustes temporais, em função
de ter sido rodada em um computador clássico, apresentou-se como uma estrutura extre-
mamente compacta e com velocidade superior à clássica. O sucesso desta implementação
sugere investigar sistemas mais complexos, envolvendo uma grande quantidade de átomos
e moléculas, abrindo caminho para processamento de informações na área de química, até
então inviáveis para o computador clássico, em termos temporais e em termos da grande
quantidade de variáveis. Pode-se esperar que problemas de instabilidade numérica possam
ser contornados. No entando, essa nova visão implica em abandonar a ideia de que as redes
neurais quânticas devam ser inspiradas, puramente, nas redes neurais clássicas.
O algoritmo de Grover e a teoria de Bohm devem ser investigados rigorosamente,
uma vez que, O algoritmo de Grover tem analogia na mecânica clássica e quântica e não é,
obviamente, um algoritmo que só tem a sua demostração em termos da mecânica quântica.
129
Deve ser visto como um algoritmo eficiente, de busca, dentro da mecânica clássica e visto
como um algorítimo cuja linguagem, facilmente enquadra-se dentro da filosofia da computação
quântica.
Ao contrário de Grover, a teoria de Bohm é quântica e rica em novas interpreta-
ções. Um texto separado sobre Bohm será escrito. Este trabalho enquadra-se como um início
básico, dos estudos no campo da computação quântica, no grupo de pesquisa. Por se tratar
de uma área relativamente nova, ele tem a importância de ser um texto e uma proposta
inicial para estudos posteriores.
130
Referências Bibliográficas
1 FEYNMAN, R. Simulating physics with computers. Int. J.Theor.Phys., v. 21, p. 467–488,1982.
2 BENIOFF, P. Quantum mechanical hamiltonian models of turing machines. Journalof Statistical Physics, Springer Netherlands, v. 29, p. 515–546, 1982. ISSN 0022-4715.10.1007/BF01342185. Disponível em: <http://dx.doi.org/10.1007/BF01342185>.
3 SHOR, P. W. Algorithms for quantum computation: Discrete logarithms and factoring.Proceedings, 35th Annual Symposium on Foundations of Computer Science, p. 124–134.,1994.
4 GROVER, L. K. A fast quantum mechanical algorithm for database search. Proceedings28th Annual Symposium on the Theory of Computing (STOC), ACM, New York, NY, USA,p. 212–219, 1996.
5 DU, J.-Z. et al. Threshold quantum cryptograph based on grover’s algorithm.Physics Letters A, v. 363, p. 361–368, 2007. ISSN 0375-9601. Disponível em: <http://www.sciencedirect.com/science/article/pii/S0375960106017609>.
6 MCGEOCH, C. C.; WANG, C. Experimental evaluation of an adiabiatic quantum systemfor combinatorial optimization. In: Proceedings of the ACM International Conference onComputing Frontiers. New York, NY, USA: ACM, 2013. (CF ’13), p. 23:1–23:11. ISBN978-1-4503-2053-5. Disponível em: <http://doi.acm.org/10.1145/2482767.2482797>.
7 USRA, U. S. R. A. Disponível em: <http://www.usra.edu/quantum/>, Acesso em: 05Maio 2013. Disponível em: <http://www.usra.edu/quantum/>.
8 MICHIELSEN, K.; RAEDT, H. D.; RAEDT, K. D. A simulator for quantumcomputer hardware. Nanotechnology, v. 13, n. 1, p. 23, 2002. Disponível em:<http://stacks.iop.org/0957-4484/13/i=1/a=305>.
9 STRELCHUK, S.; HORODECKI, M.; OPPENHEIM, J. Generalized teleportation andentanglement recycling. Phys. Rev. Lett., American Physical Society, v. 110, p. 010505, Jan2013. Disponível em: <http://link.aps.org/doi/10.1103/PhysRevLett.110.010505>.
10 KOWALTOWSKI, T. Von neumann: suas contribuições à computação. EstudosAvançados, scielo, v. 10, p. 237–260, 04 1996. ISSN 0103-4014.
131
11 NEUMANN, J. von. The principles of large-scale computing machines. Ann. Hist.Comp, v. 3, n. 3, p. 263–273, 1946.
12 NEUMANN, J. von. The computer and the brain,. Yale Univ. Press,New Haven, 1958.
13 BOOLE, G. The mathematical analysis of logic : being an essay towards a calculus ofdeductive reasoning. [S.l.]: Cambridge : Macmillan, Barclay, & Macmillan, 1847.
14 CHURCH, A. A Note on the Entscheidungsproblem. The Journal of Symbolic Logic,v. 1, n. 1, p. 40–41, 1936. Disponível em: <http://www.jstor.org/stable/2269326>.
15 TURING, A. M. On computable numbers, with an application to the entscheidungs-problem. Proceedings of the London Mathematical Society, s2-42, n. 1, p. 230–265, 1936.Disponível em: <http://plms.oxfordjournals.org/content/s2-42/1/230.short>.
16 BOOLE, G. An Investigation of the Laws of Thought. [S.l.]: Cambridge : Macmillan &Co., 1854. ISBN 0486600289.
17 ROGERS, J. Object-oriented neural networks in C++. Orlando, FL, USA: AcademicPress, Inc., 1996. ISBN 0-12-593115-8.
18 HAYKIN, S. Redes Neurais: Princípios e Práticas. 2. ed. [S.l.]: Artmed Editora Ltda.,2001.
19 ALMEIDA, M. et al. Artificial neural networks applied to theoretical chemistry. In:SBRN ’98: Proceedings of the Vth Brazilian Symposium on Neural Networks. Washington,DC, USA: IEEE Computer Society, 1998. p. 232. ISBN 0-8186-8629-4.
20 CHEN, X.-W.; LIU, M. Domain-based predictive models for protein-protein interactionprediction. EURASIP J. Appl. Signal Process., Hindawi Publishing Corp., New York, NY,United States, v. 2006, p. 55–55, 2006. ISSN 1110-8657.
21 CERONI, A.; FRASCONI, P.; POLLASTRI, G. Learning protein secondary structurefrom sequential and relational data. Neural Netw., Elsevier Science Ltd., Oxford, UK, UK,v. 18, n. 8, p. 1029–1039, 2005. ISSN 0893-6080.
22 RALAIVOLA, L. et al. Graph kernels for chemical informatics. Neural Netw., ElsevierScience Ltd., Oxford, UK, UK, v. 18, n. 8, p. 1093–1110, 2005. ISSN 0893-6080.
23 LISZKA-HACKZELL, J. J. Categorization of fetal heart rate patterns using neuralnetworks. J. Med. Syst., Plenum Press, New York, NY, USA, v. 25, n. 4, p. 269–276, 2001.ISSN 0148-5598.
24 SEBASTIAO, R. C. O.; BRAGA, J. P.; YOSHIDA, M. I. Artificial neural networkapplied to solid state thermal decomposition. Journal of Thermal Analysis and Calorimetry,Kluwer Academic Publishers, v. 74, p. 811–818, 2003. ISSN 1572-8943.
25 SEBASTIAO, R. et al. Nonlinear global inversion of potential energy surfaces fromthe experimentally determined second virial coefficients. Chem. Phys. Lett., 378, n. 3-4, p.406–409, 2003. ISSN 0009-2614.
132
26 VITERBO, V. C. et al. Inversion of simulated positron annihilation lifetime spectrumusing a neural network. Journal of Chemical Information and Computer Sciences, v. 41,n. 2, p. 309–313, 2001. Disponível em: <http://dx.doi.org/10.1021/ci0000833>.
27 ARBIB, M. A. The Handbook of Brain Theory and Neural Networks: Second Edition.[S.l.]: The MIT Press Cambridge, Massachussetts, 2002.
28 CULL, P. The mathematical biophysics of nicolas rashevsky. BioSystems, v. 88, p.178–184, 2007.
29 MCCULLOCH, W. S.; PITTS, W. H. A logical calculus of the ideas immanent innervous activity. Bulletin of Mathematical Biophysics, v. 5, p. 115–133, 1943.
30 ROSENBLATT, F. The perceptron: A probabilistic model for information storageand organization in the brain. Psychological Review, v. 65, n. 6, p. 386–408, 1958. ISSN0033-295X.
31 PAO, Y.-H. Adaptive Pattern Recognition and Neural Networks. Boston, MA, USA:Addison-Wesley Longman Publishing Co., Inc., 1989. ISBN 0-201-12584-6.
32 MARQUARDT, D. W. An algorithm for least-squares estimation of nonlinearparameters. J. Soc. INDUST. APPL. MATH., v. 11, n. 2, 1963.
33 COSTA, M. A.; BRAGA, A. de P.; MENEZES, B. R. de. Improving generalization ofmlps with sliding mode control and the levenberg marquardt algorithm. Neurocomputing,v. 70, p. 1342–1347, 2007.
34 HAGAN, M. T.; DEMUTH, H. B.; BEALE, M. Neural network design. Boston, MA,USA: PWS Publishing Co., 1996. ISBN 0-534-94332-2.
35 MORSALI, A. et al. An accurate expression for radial distribution function of thelennard-jones fluid. Chem. Phys., v. 310, p. 11–15, 2005.
36 BAMDAD, M. et al. A new expression for radial distribution function and infinite shearmodulus of lennard-jones fluids. Chem. Phys., v. 325, p. 554–562, 2006.
37 WINTER, R. et al. The structural properties of liquid, solid and amorphoussulphur. Journal of Physics: Condensed Matter, v. 2, p. SA215, 1990. Disponível em:<http://stacks.iop.org/0953-8984/2/i=S/a=031>.
38 SIPPL, M. J. et al. Helmholtz free energies of atom pair interactions in proteins. Foldingand Design, v. 1, n. 4, p. 289 – 298, 1996. ISSN 1359-0278.
39 BRAGA, J. P. Físico-Química. MG: Viçosa, MG: Editora da UFV, 2002. 265 p.(Capítulo 4 trata da energia potencial).
40 VERLET, L. Computer "experiments"on classical fluids. ii. equilibrium correlationfunctions. Phys. Rev., American Physical Society, v. 165, n. 1, p. 201–214, Jan 1968.
133
41 AZIZ, R. A highly accurate interatomic potential for argon. J. Chem. Phys., 99, n. 6, p.4518–4525, SEP 15 1993.
42 LEMES, N. et al. Potential energy function from differential cross-section data: Aninverse quantum scattering theory approach. Int. J. Quantum Chem., 108, n. 13, Sp. Iss. SI,p. 2623–2627, 2008. ISSN 0020-7608.
43 CHILD, M. Molecular Collision Theory. New York: Academic Press, 1974.
44 BRAGA, J. The rate of convergence of the S-matrix for the Renormalized Numerov andLog-derivate methods. J. Comp. Chem., 10, n. 3, p. 413–416, 1989. ISSN 0192-8651.
45 CALOGERO, F. Variable phase approach to potential scattering. [S.l.]: Academic Press,1967.
46 BRAGA, J. P.; MURRELL, J. N. The bound, metastable and virtual states of rare-gashydrides. Mol. Phys., v. 53, n. 2, p. 295–299, 1984. ISSN 0026-8976.
47 TANG, K.; TOENNIES, J. The van der Waals potentials between all the rare gas atomsfrom He to Rn. JOURNAL OF CHEMICAL PHYSICS, 118, n. 11, p. 4976–4983, MAR 152003. ISSN 0021-9606.
48 VARANDAS, A. J. C. J. Phys. Chem. A 2010, 114, 8505, v. 114, p. 8505, 2010.
49 XIE, J. et al. Theoretical-studies of the energetics and structures of atomic clusters. J.Chem. Phys. , 91, n. 1, p. 612–619, JUL 1 1989. ISSN 0021-9606.
50 BORGES, E. et al. A molecular dynamics simulation of ArnO3 (n=1-21) van der Waalscomplexes: Size evolution of stable structures. Chem. Phys. Lett., 472, n. 4-6, p. 194–199,2009. ISSN 0009-2614.
51 BORGES, E.; FERREIRA, G. G.; BRAGA, J. P. Structures and energies of ArnH2O(n=1-26) clusters using a nonrigid potential surface: A molecular dynamics simulation. Int.J. Quantum Chem., 108, n. 13, Sp. Iss. SI, p. 2523–2529, 2008. ISSN 0020-7608.
52 BERRY, R. Potential surfaces and dynamics - what clusters tell us. Chem. Rev. , 93,n. 7, p. 2379–2394, NOV 1993. ISSN 0009-2665.
53 PLIEGO, J.; BELCHIOR, J.; BRAGA, J. Analysis of state-to-state differentialcross sections in two-dimensional Xe-CO2 scattering with long-range effects. PHYSICALREVIEW A, 54, n. 3, p. 2091–2098, 1996. ISSN 1050-2947.
54 CALOGERO, F. A NOVEL APPROACH TO ELEMENTARY SCATTERINGTHEORY. NUOVO CIMENTO, 27, n. 1, p. 261–&, 1963.
55 CALOGERO, F.; RAVENHALL, D. GENERALIZATION OF PHASE APPROACHTO SCATTERING THEORY + SOME NUMERICAL RESULTS. NUOVO CIMENTO,32, n. 6, p. 1755–&, 1964.
134
56 MARTINAZZO, R.; BODO, E.; GIANTURCO, F. A. A modified Variable-Phasealgorithm for multichannel scattering with long-range potentials. Computer PhysicsCommunications, 151, n. , p. 187–198, 2003.
57 BRAGA, J. P. et al. A Comparative-Study Of Quantum-Mechanical And ClassicalTrajectory Calculations For An A + Bc Collinear Non-Adiabatic Collision. MOLECULARPHYSICS, 65, n. 4, p. 909–923, 1988. ISSN 0026-8976.
58 VITERBO, V. D.; LEMES, N. H. T.; BRAGA., J. P. Variable phase equation inquantum scattering. Revista Brasileira de Ensino de Física, v. 36(1), p. 1310, 2014.
59 HERZBERG, G. Molecular Spectra and Molecular Structure. [S.l.]: Van Nostrand, 1950.
60 HUXLEY, P. et al. Ground-state diatomic potentials .2. van der Waals Molecules.Journal of the Chemical Society-Faraday Transactions II, 80, n. Part 11, p. 1349–1361,1984. ISSN 0300-9238.
61 CYBULSKI, S. M.; TOCZYLOWSKI, R. R. J. Chem. Phys. 1999, 111, 10520, v. 111,p. 10520, 1999.
62 JEZIORSKA, M. et al. J. Chem. Phys. 2007, v. 127, p. 124–303, 2007.
63 JANZEN, A.; AZIZ, R. An accurate potential energy curve for helium based on abinitio calculations. JOURNAL OF CHEMICAL PHYSICS, 107, n. 3, p. 914–919, JUL 151997. ISSN 0021-9606.
64 CHILD, M.; GERBER, R. Inversion of inelastic atom-atom scattering data - recoveryof the interaction function. Molecular Physics, 38, n. 2, p. 421–432, 1979.
65 SLATER, J. C. Phys. Rev., v. 32, p. 349, 1928.
66 UANG, Y. H.; STWALLEY, W. C. J. Chem. Phys., v. 76, p. 5069, 1982.
67 FORSYTHE, G. E.; MALCOLM, M. A.; MOLER, C. B. Computer Methods forMathematical Computations. [S.l.]: Prentice-Hall, 1977.
68 LEMES, N.; SEBASTIAO, R.; BRAGA, J. Potential energy function from secondvirial data using sensitivity analysis. Inv. Prob. Sci. Eng., 14, n. 6, p. 581–587, 2006. ISSN1741-5977.
69 LUO, F. et al. J. Chem. Phys., v. 98, p. 3564, 1993.
70 LEMES, N.; BORGES, E.; BRAGA, J. Rate constants and absorption coefficients fromexperimental data: An inversion procedure based on recursive neural networks. Chem. Int.Lab. Syst., 96, n. 1, p. 84–87, 2009. ISSN 0169-7439.
71 JONES, N. The quantum compay. Nature, v. 498, p. 286–288, 2013.
72 SCHRÖDINGER, E. An undulatory theory of the mechanics of atoms and molecules.Phys. Rev., American Physical Society, v. 28, p. 1049–1070, Dec 1926. Disponível em:<http://link.aps.org/doi/10.1103/PhysRev.28.1049>.
135
73 BRAGA, J. P. Fundamentos de Química Quântica. MG: Viçosa, MG: Editora da UFV,2007. 265 p.
74 JOHNSON, M. W. et al. Quantum annealing with manufactured spins. Nature,Nature Publishing Group, a division of Macmillan Publishers Limited. All RightsReserved., v. 473, n. 7346, p. 194–198, maio 2011. ISSN 0028-0836. Disponível em:<http://dx.doi.org/10.1038/nature10012>.
75 NIELSEN, M. A.; CHUANG, I. L. in Quantum Computation and Quantum Information.New York, NY: Cambridge University Press, 2000; Chapter 1, pp 13–16. 13-16 Chapter 1 p.
76 MONROE, C. et al. Demonstration of a fundamental quantum logic gate. Phys. Rev.Lett., American Physical Society, v. 75, n. 25, p. 4714–4717, Dec 1995.
77 SAU, J. D.; TEWARI, S.; SARMA, S. D. Universal quantum computation in asemiconductor quantum wire network. Phys. Rev. A, American Physical Society, v. 82, n. 5,p. 052322, Nov 2010.
78 BENNETT, C. H.; SHOR, P. W. Quantum information theory. IEEE Transactions onInformation Theory, v. 44, n. 6, p. 2724–2742, 1998.
79 LANGE, G. de et al. Universal dynamical decoupling of a single solid-statespin from a spin bath. Science, v. 330, n. 6000, p. 60–63, 2010. Disponível em:<http://www.sciencemag.org/content/330/6000/60.abstract>.
80 SAR., T. van der et al. Decoherence-protected quantum gates for a hybridsolid-state spin register. Nature, Nature Publishing Group, a division of MacmillanPublishers Limited. All Rights Reserved., v. 484, n. 7392, p. 82–86, 2012. Disponível em:<http://dx.doi.org/10.1038/nature10900>.
81 TOFFOLI, T. Reversible computing. Lect. Notes Computer Sci. 85, Springer. 1980.
82 FEDOROV, A. et al. Implementation of a toffoli gate with superconducting circuits.Nature, v. 481, n. 7380, p. 170–172, 2011. Disponível em: <http://dx.doi.org/10.1038/nature10713>.
83 TIPSMARK, A. et al. Experimental demonstration of a hadamard gate for coherentstate qubits. Phys. Rev. A, American Physical Society, v. 84, p. 050301, Nov 2011.Disponível em: <http://link.aps.org/doi/10.1103/PhysRevA.84.050301>.
84 GROVER, L. K. Quantum Mechanics Helps in Searching for a Needle in a Haystack.Physical Review Letters, American Physical Society, v. 79, n. 2, p. 325–328, jul. 1997.Disponível em: <http://dx.doi.org/10.1103/PhysRevLett.79.325>.
85 GROVER, L. K. Trade-offs in the quantum search algorithm. Phys. Rev. A,American Physical Society, v. 66, p. 052314, Nov 2002. Disponível em: <http://link.aps.org/doi/10.1103/PhysRevA.66.052314>.
136
86 AVALLONE, R. et al. Presence of benzodiazepine-like molecules in food and theirimplication in the nutrition of cirrhotic patients. Innov Food Sci Emerg, v. 2, n. 3, p. 193 –198, 2001.
87 LI, G. et al. Separation, identification of uremic middle molecules, and preliminarystudy on their toxicity. Clin. Chim. Acta, v. 350, n. 1-2, p. 89 – 98, 2004.
88 IZAKE, E. L. Forensic and homeland security applications of modern portable ramanspectroscopy. Forensic Sci Int, v. 202, n. 1-3, p. 1 – 8, 2010.
89 MARIKKAR, J. et al. Use of gas liquid chromatography in combination with pancreaticlipolysis and multivariate data analysis techniques for identification of lard contaminationin some vegetable oils. Food Chem., v. 90, n. 1-2, p. 23 – 30, 2005.
90 SILVERSTEIN, R. M.; WEBSTER, F. X. Spectrometric Identification of OrganicCompounds. 6. ed. [S.l.: s.n.], 1997. 496 p.
91 WEIAND, K. et al. pest: Fast approximate keyword search in semantic datausing eigenvector-based term propagation. Inform Syst, v. 37, n. 4, p. 372–390, 2012.ISSN 0306-4379. Disponível em: <http://www.sciencedirect.com/science/article/pii/S030643791100144X>.
92 SCHMIDT, H. L. Food quality control and studies on human nutrition by massspectrometric and nuclear magnetic resonance isotope ratio determination. Fresen J AnalChem, Springer Berlin / Heidelberg, v. 324, p. 760–66, 1986.
93 HAO, F.; DAUGMAN, J.; ZIELINSKI, P. A Fast Search Algorithm for a LargeFuzzy Database. IEEE T Inf Foren Sec, v. 3, n. 2, p. 203–212, maio 2008. Disponível em:<http://dx.doi.org/10.1109/TIFS.2008.920726>.
94 BURDA, I. in Introduction to Quantum Computation. Boca Raton, Florida: UniversalPublishers, 2005; Chapter 5, pp 120–133.
95 FEI, L.; BAOYU, Z. A study of quantum neural networks. IEEE int. Conf. NeuralNetworks & Signal Processing, p. 14–17, 2003.
96 LI, Y.; WU, X. Harmonic measuring approach based on quantum neural network.Physics Proceia, v. 24, p. 337–344, 2012.
97 VITERBO, V. D. de; BELCHIOR, J. C. Neural networks. JCC, v. 1, p. 199, 2003.
98 LEMES, N. H. T. et al. Parametric sensitivity analysis for the helium dimers on a modelpotential. Química Nova, scielo, v. 35, p. 910–913, 2012. ISSN 0100-4042.
99 ERMAKOV, V. L.; FUNG, B. M. Experimental realization of a continuous version ofthe grover algorithm. Phys. Rev. A, American Physical Society, v. 66, p. 042310, Oct 2002.Disponível em: <http://link.aps.org/doi/10.1103/PhysRevA.66.042310>.
137
top related