introdução - banco de dados

19
BANCO DE DADOS Conteúdo 1. Definições........................................................................1 2. SGBD (Database Management System) Sistema de gerência de banco de dados..........1 3. Modelos de Banco de Dados.........................................................1 4. Modelo Conceitual.................................................................1 5. Modelo Lógico.....................................................................2 6. Modelo Físico.....................................................................2 MER - Modelo de Entidade e Relacionamento.............................................2 7. BANCO DE DADOS RELACIONAL.........................................................4 8. NORMALIZAÇÃO......................................................................6 9. MODELOS DE DADOS..................................................................8 10. ORGANIZAÇÃO DE ARQUIVOS........................................................ 10 a. Organização Seqüencial:........................................................ 10 b. Organização Sequencial-Indexado:...............................................10 c. Organização Indexada:.......................................................... 11 11. MÉTODOS de Acesso de arquivos..................................................11 SEQUENCIAL;.................................................................... 11 DIRETO;........................................................................ 11 INDEXADO;...................................................................... 11 Método de Acesso SEQUENCIAL:................................................... 11 Método de Acesso DIRETO:....................................................... 12 Método de Acesso INDEXADO:..................................................... 12 ARQUIVO INDEXADO EM ÁRVORE B+......................................................13 12. Hashing........................................................................ 14 1. Definições: Conjunto de dados interligados que tem por objetivo atender a uma comunidade. Conjunto de dados interligados que atende a um conjunto de sistemas. O banco de dados representa algum aspecto do mundo real, às vezes chamado de minimundo ou de universo do discurso (UoD). Um banco de dados é uma coleção logicamente coerente de dados com algum significado inerente.

Upload: wagner-freiria

Post on 25-Sep-2015

6 views

Category:

Documents


2 download

DESCRIPTION

Princípios Básicos sobre banco de dados

TRANSCRIPT

BANCO DE DADOSContedo1.Definies12.SGBD (Database Management System) Sistema de gerncia de banco de dados.13.Modelos de Banco de Dados14.Modelo Conceitual15.Modelo Lgico26.Modelo Fsico2MER - Modelo de Entidade e Relacionamento.27.BANCO DE DADOS RELACIONAL48.NORMALIZAO69.MODELOS DE DADOS810.ORGANIZAO DE ARQUIVOS10a.Organizao Seqencial:10b.Organizao Sequencial-Indexado:10c.Organizao Indexada:1111.MTODOS de Acesso de arquivos11SEQUENCIAL;11DIRETO;11INDEXADO;11Mtodo de Acesso SEQUENCIAL:11Mtodo de Acesso DIRETO:12Mtodo de Acesso INDEXADO:12ARQUIVO INDEXADO EM RVORE B+1312.Hashing14

1. Definies: Conjunto de dados interligados que tem por objetivo atender a uma comunidade. Conjunto de dados interligados que atende a um conjunto de sistemas. O banco de dados representa algum aspecto do mundo real, s vezes chamado de minimundo ou de universo do discurso (UoD). Um banco de dados uma coleo logicamente coerente de dados com algum significado inerente.2. SGBD (Database Management System) Sistema de gerncia de banco de dados. Software que incorpora as funes de definies, recuperaes e alteraes de dados em um banco de dados. Coleo de programas que permite aos usurios criar e manter um banco de dados. O SGBD um sistema de software de uso geral que facilita o processo de definio, construo, manupilao e compartilhamento de banco de dados entre diversos usurios e aplicaes.3. Modelos de Banco de DadosUm modelo de banco de dados, so as descries dos tipo de informaes ou dados que sero armazenadas em um determinado BD.Modelo de Dados descrio formal da estrutura de um BD.

Os nveis de abstrao de um modelo de BD so: Modelo Conceitual: Modelo Lgico: Modelo Fsico:4. Modelo ConceitualModelo Conceitual um modelo de dados Abstrato, que descreve a estrutura de um banco de dados de forma independente de um SGBD particular.Esta a primeira fase para criao de um novo BD, aqui construdo o modelo relacional, independente de qualquer BD utilizado. Nesta fase busca-se as necessidades da organizao em termos de armazenamentos de Dados independentemente da implantao.

o mais alto nvel de abstrao e no leva em conta o tipo do BD em si.Melhor compreendido por usurios fora da rea de TI.Neste modelo descrito o que deve ser registrado no BD, mas no informa como isso deve ser feito. A tcnica de modelagem conceitual mais difundida a Diagrama Entidade Relacionamento (DER).

5. Modelo Lgico Um modelo Lgico uma descrio de um banco de dados na viso do usurio de SGBD. Assim o modelo DEPENDENTE do BD escolhido a ser trabalhado. Neste modelo deve-se definir quais as TABELA que o banco contm, e para cada tabela, quais os nomes das colunas.Nesta etapa preciso utilizar o modelo criado na fase anterior e transform-lo de acordo com a estrutura de BD escolhida, definido as colunas de acordo com a entidade.

Exemplo: Produto (codigo, descrio, preco, tipo)6. Modelo FsicoNeste modelo enriquecido o BD, com detalhes que influenciam no desempenho da estrutura mas no na sua funcionalidade.Qualquer tipo de alteraes feita nesta fase, no alterar a estrtura do BD, pois ela j foi definida anteriormente, as mudanas aqui feitas so para melhora dessa estrutura. Na prtica o modelo fsico sempre alterado, buscando assim um melhor desempenho, este processo chamado de sintonia (tuning).Tuning, diz respeito ao ajusto do SGBD para melhor desempenho e um uso eficaz do mesmo.

MER - Modelo de Entidade e Relacionamento. um modelo representado por um conjunto de tabelas que so utilizadas para o armazenamento de dados. Estas tabelas possuem Relacionamentos entre si.Estes modelos de Entidade e Relacionamentos, possui Smbolos que representam as entidades, relacionamentos e atributos.Na terminologia formam do Modelo Relacional, uma linha chamado de TUPLA, um cabealho da Coluna chamado de ATRIBUTO.ENTIDADESRepresenta um conjunto de objetos ou eventos do mundo real. (Clientes, Planilhas, Carro, Pessoa);1. Dependncia ExistencialEspecificamente, se a existncia da entidade X depende da existncia da entidade Y, ento diz-se que X existencialmente dependente de Y. Operacionalmente, isto significa que se Y for removido, ento x tambm ser.A entidade Y chamada de entidade dominante e X chamada de entidade subordinada. Exemplo: Conta e Transao (Conta dominante e Transao subordinada) .

Entidade FRACA.1. Entidades fracas no tem atributos suficientes para formar uma chave primria.1. Precisam estar associadas a um conjunto identificador/proprietrio para ser significativo.2. Apesar de no terem chave primria, necessrio um discriminador;3. Uma entidade fraca representada por um duplo retngulo .

ENTIDADE FRACA uma entidade que no possui existncia prpria (sua existncia depende da existncia de outra entidade) ou que para ser identificada depende da identificao de outra entidade. No possui PRIMARI KEY.

ATRIBUTOS Propriedades das Entidades: Relacionamento entre Entidades: Identifica a unio entre as entidade. Tem a funo de representar os atributos envolvidos no relacionamento. Associao entre entidades.

Tabela Derivadas: so tabelas virtuais montadas em tempo de execuo dentro de um. Este tipo de implementao pode ser bastante til a nvel de desenvolvimento em determinadas situaes.

1. Obrigatrios ou Opcionais. Monovaloreado ou Multivalorado: Simples ou Compostos;

So propriedades (caractersticas) que identificam as entidades. Uma entidade representada por um conjunto de atributos. Nome, endereo, telefone e cidade, por exemplo, so atributos da entidade Clientes. Enquanto que salrio, cargo e departamento so atributos da entidade funcionrios.

Atributo SimplesNo possui qualquer caracterstica especial. A maioria dos atributos sero simples.Quando um atributo no composto, recebe um valor nico como nome, por exemplo e no um atributo chave, ento ele ser atributo simples.

Atributo Composto1. O seu contedo formado por vrios itens menores. Exemplo: Endereo. Seu contedo poder ser dividido em vrios outros atributos, como: Rua, Nmero, Complemento, Bairro, Cep e Cidade.2. Questo . Quando da modelagem de dados de um banco de dados relacional, podem ser utilizados atributos compostos, sobre os quais correto afirmar que.3. podem ser decompostos em outros atributos simples ou ainda compostos.

Atributo Multivalorado1. O seu contedo formado por mais de um valor.2. Exemplo: Telefone. Uma pessoa poder ter mais de um nmero de telefone. indicado colocando-se um asterisco precedendo o nome do atributo.

Atributo Determinante1. Identifica de forma nica uma entidade, ou seja, no pode haver dados repetidos.2. indicado sublinhando-se o nome do atributo. Exemplo: CNPJ, CPF, Cdigo do fornecedor, Nmero da matrcula, etc. Os atributos determinantes sero as chaves primrias no banco de dados e seu uso tem implicaes na normalizao de dados.

7. BANCO DE DADOS RELACIONAL

Permites uma independncia de dados nos sistemas gerenciadores de banco de dados e providenciar-se um conjunto de funes apoiadas em lgebra relacional para armazenamento e recuperao de dados, tendo por base a teoria dos conjuntos e a lgebra relacional. Esse modelo foi resultado de um estudo terico realizado por Codd.

Em 1985, Edgar Frank Codd, criador do modelo relacional, publicou um artigo onde definia 13 regras para que um (SGBD) fosse considerado relacional:

1. Regra Fundamental: Um SGBD relacional deve gerir os seus dados usando apenas suas capacidades relacionais;1. Regra da informao: Toda informao deve ser representada de uma nica forma, como dados em uma tabela;2. Regra da garantia de acesso: Todo o dado pode ser acedido logicamente usando o nome da tabela, o valor da chave primria da linha e o nome da coluna.3. Regra da sub-linguagem abrangente: Um sistema relacional pode suportar vrias linguagens e formas de uso, porm deve possuir ao menos uma linguagem com sintaxe bem definida e expressa por cadeia de caracteres.4. Insero, atualizao e eliminao de alto nvel: Simplificando, significa dizer que as operaes de manipulao de dados devem poder ser aplicadas a vrias linhas de uma vez, ao invs de apenas uma por vez.5. Independncia dos dados fsicos:6. Independncia lgica de dados7. Independncia de distribuio: A linguagem de manipulao de dados deve possibilitar que as aplicaes permaneam inalteradas estejam os dados centralizados ou distribudos fisicamente.

Restrio de Integridade1. Esta restrio diz que: Uma tupla que chave primria pode ser NULL. Isso porque os valores das chaves primrias so utilizadas para identificar tuplas individuais em uma relao.

Integridade ReferencialA Integridade Referencial utilizada para garantir a Integridade dos dados entre as tabelas relacionadas. Por exemplo, considere um relacionamento do tipo Um-para-Vrios entre a tabela Clientes e a tabela Pedidos. Com a Integridade Referencial, o banco de dados no permite que seja cadastrado um pedido para um cliente que ainda no foi cadastrado. O banco de dados verifica se o cdigo do cliente que foi digitado j existe na tabela Clientes. Se no existir, o cadastro do pedido no ser aceito. Com o uso da Integridade Referencial possvel ter as seguintes garantias (ainda usando o exemplo entre as tabelas Clientes e Pedidos):1. Quando o Cdigo de um cliente for alterado na Tabela Clientes, podemos configurar para o banco de dados atualizar, automaticamente, todos os Cdigos do Cliente na Tabela Pedidos, de tal maneira que no fiquem Registros rfos, isto , registros de Pedidos com um Cdigo de Cliente para o qual no existe mais um correspondente na Tabela Clientes. Quando um Cliente for excludo da Tabela Clientes, podemos configurar para que o banco de dados exclua, automaticamente, na tabela Pedidos, todos os Pedidos para o Cliente que est sendo Excludo. Essa opo conhecida como"Propagar excluso dos registros relacionados".

8. NORMALIZAO1 Primeira Forma Normal: "Uma Tabela est na Primeira Forma Normal quando seus atributos no contm grupos de Repetio".

Por isso dissemos que uma Tabela que possui Grupos de Repetio no est na Primeira Forma Normal. Considere a estrutura da Tabela Indicada na Prxima Figura:

Tabela que no est na Primeira Forma Normal. Uma tabela com esta estrutura apresentaria diversos problemas. Por exemplo se um casal tiver mais de um filho, teremos que digitar o Nome do Pai e da Me diversas vezes, tantas quantos forem os filhos. Isso forma um Grupo de Repetio. Alm do mais pode ser que por erro de digitao o Nome dos Pais no seja digitado exatamente igual todas as vezes, o que pode acarretar problemas na hora de fazer pesquisas ou emitir relatrios.

Este problema ocorre porque "Misturamos Assuntos" em uma mesma tabela. Colocamos as informaes dos Pais e dos Filhos em uma mesma tabela. A resoluo para este problema simples: Criamos uma tabela separada para a Informao dos Pais e Relacionamos a tabela Pais com a Tabela Filhos atravs de um relacionamento do tipo Um para Vrios, ou seja, um casal da Pais pode ter Vrios Filhos.Observe na figura abaixo as duas tabelas: Pais e Filhos, j normalizadas.

Informaes sobre Pais e Filhos em Tabelas Separadas.As duas tabelas Resultantes da Aplicao da Primeira Forma Normal: Pais e Filhos esto na Primeira Forma Normal.

2 Segunda Forma Normal:Ocorre quando a chave Primria composta por mais de um campo. Neste caso, devemos observar se todos os campos que no fazem parte da chave dependem de todos os campos que compem a chave. Se algum campo depender somente de parte da chave composta, ento este campo deve pertencer a outra tabela.

Tabela com uma Chave Primria Composta. No est Na Segunda Forma Normal. A Chave Primria Composta formada pela combinao dos Campos "NmeroDaMatrcula" e "CdigoDoCurso". O Campo Avaliao depende tanto do CdigoDoCurso quanto do NmeroDaMatrcula, porm o campo DescrioDoCurso, depende apenas do CdigoDoCurso, ou seja, dado o cdigo do curso possvel localizar a respectiva descrio, independentemente do NmeroDaMatrcula. Com isso temos um campo que no faz parte da Chave Primria e depende apenas de um dos campos que compem a chave Primria Composta, por isso que dizemos que esta tabela no est na Segunda Forma Normal. A Resoluo para este problema tambm simples: "Dividimos a Tabela que no est na Segunda Forma Normal em duas outras tabelas, conforme indicado pela figura abaixo, sendo que as duas tabelas resultantes esto na Segunda Forma Normal.

Informaes sobre Avaliaes e Cursos em Tabelas Separadas. OBS -> A Distino entre a Segunda e a Terceira forma normal, que veremos logo em seguida, muitas vezes confusa. A Segunda Forma normal est ligada a ocorrncia de Chaves Primrias compostas.

3 Terceira Forma Normal: Na definio dos campos de uma entidade podem ocorrer casos em que um campo no seja dependente diretamente da chave primria ou de parte dela, mas sim dependente de um outro campo da tabela, campo este que no a Chave Primria. Quando isto ocorre, dizemos que a tabela no est na Terceira Forma Normal:

Tabela com um Campo dependente de Outro campo que no a Chave Primria. No est na Terceira Forma Normal.Observe que o Campo DescrioDoCargo depende apenas do Campo CdigoDoCargo, o qual no faz parte da Chave Primria. Por isso dizemos que esta tabela no est na terceira forma normal. Novamente basta dividir a tabela em duas outras, conforme indicado pela figura a seguir. As duas tabelas resultantes esto na Terceira Forma Normal. .

Tabelas Resultantes que esto na Terceira Forma Normal. Com isso podemos concluir que como resultado do Processo de Normalizao, iremos obter um nmero maior de tabelas, porm sem problemas de redundncia e inconsistncia dos dados.9. MODELOS DE DADOS

Uma coleo de ferramentas conceituais para descrio de dados, relacionamento de dados, semntica de dados e restries de consistncias. os vrios modelos de dados dividem-se em trs diferemte grupos: 1. Modelo baseado em Objetos; 2. Modelos Lgicos baseados em Registro; 3. Modelos Fsicos de Dados;

1. Modelo baseado em Objetos;Este modelos so usados na descrio dos dados no nvel lgico e de viso. So caracterizados por dispor de recursos de estruturas bem mais flexveis e por viabilizar a especificaes de dados.1.1 Modelo Entidade-Relacionamento: Tem por base a percepo do mundo real como um conjunto de Objetos Bsicos, chamdo entidades, e o relacionamento entre eles. O relacionamento uma Associao entre as Entidades.1.2 Modelo Orientado a Objeto: Tem por base um conjunto de objetos. Um objeto contm valores armazenados em vrias instncias dentro do objeto. Instncia o conjunto de informaes contidas em um determinado BD em um momento. Um objeto tambm tm Mtodos que operam este objeto.2. Modelos Lgicos baseados em Registro;So usados para descrever os dados no nvel lgico e de viso. So usados tanto para especificar a estrutura lgica do BD quanto para implementar um descrio de alto nvel.2.1 Modelo Relacional: Modelo na qual representado como uma coleo de relao. Pode-se pensar uma tabela como uma Coleo de relaes, onde cada linha representa um conjunto de dados relacionados entre si. os dados de uma linha representam fatos do mundo real.

2.2 Modelo Hierrquico; A organizao do modelo hierrquico do tipo rvore. Estra estrutura pode ser pensada como um a raiz que se distribui em ramos e folhas. O caminho raiz-galho-folha nico, no existindo duas formas diferentes de chegar a uma folha a partir da raiz.

2.3 Modelo de Rede;O modelo em redes surgiu como uma extenso ao modelo hierrquico, ELIMINNANDO O CONCEITO DE HIERARQUIA e permitindo que um mesmo registro estivesse envolvido em vrias associaes. No modelo em rede, os registros so organizados em grafos onde aparece um nico tipo de associao (set) que define uma relao 1:N entre 2 tipos de registros: proprietrio e membro. Desta maneira, dados dois relacionamentos 1:N entre os registros A e D e entre os registros C e D possvel construir um relacionamento M:N entre A e D.

3. Modelo Fsico de Dados a descrio do modelo mais baixo, esse modelo catam os aspectos de implementao do sistemas de BD.Questes Modelo Relacional.01. No Modelo Relacional de banco de dados:1. a) o cabealho de uma tabela contm os atributos."Na terminologia formal do modelo relacional, uma linha chamada de tupla, um cabealho da coluna chamado de atributo e a tabela chamada de relao." [Esmari e Navathe, 2011]Um modelo de banco de dados uma descrio dos tipos de informaes que esto armazenadas em uma banco de dados.

Linguagem de Modelagem de Dados usada para construir um modelos de dados.Esta linguagem pode ser classificada de acordo

linguagem de modelagem de dados podem aparecer de dois modos.1. linguagens textuais; linguagem de grficos;

ATRIBUTOS SIMPLES atributos de valores simples, no possui nada de especial, a maioria dos atributos so, simples quando ele no composto nem um atributo chave. COMPOSTO o seu contedo formado por vrios itens menores, divididos em vrios atributos. Normalmente estes atributos so abreviados e no devem conter espaamento em brnaco. Podem ser decompostos em outros atributos simples ou ainda compostos. MULTIVALORADO seu contedo formado por mais de um valor. exemplo: uma pessoa pode ter vrios telefones, 2 endereos. Indicado colocando uma asterisco precedente o nome do atributo. DETERMINANTE a chave primria. indicado sublinhando-se o nome do atributo. CPF,RG...

Projeto de Banco de Dados - Carlos Alberto Heuser"10. ORGANIZAO DE ARQUIVOS O Tema organizao de arquivos, refere-se a forma de como os registros so armazenados em um computador. Mtodos de dispor registros em arquivos armazenados em disco.Tipos de Organizao de arquivos:1. SEQUENCIAL2. SEQUENCIAL-INDEXADO3. INDEXADO

a. Organizao Seqencial: A organizao sequencial caracteriza-se pela existncia de uma chave de ORDENAO. Essa chave determina a ordem que esses registros so armazenados e pode ser SIMPLES ou COMPOSTA. Geralmente coincide com a chave primria mas no obrigatoriamente.

b. Organizao Sequencial-Indexado: Utilizao de um ndice na organizao sequencial, para ajudar nas buscas. Arquivo seqencial, acrescido de um ndice (estrutura de acesso). Os ndices permite a rpida determinao dos endereos de um registro no arquivo. O endereo identifica onde est o arquivo na memria secundria. O conjunto de ndice e endereo do arquivo, ocupa um espao bem menor do que os dados, agilizando assim as buscas.

c. Organizao Indexada: Nesse meio ser utilizado um ndice para a organizao lgica das tuplas e utilizar se possvel as chaves primrias para organizao fsica dos dados. Possui ento duas colunas a primeira utilizando a indexao lgica e a segunda armazenando um valor endereo fsico, que serve como referncia para a busca na memria. Os dados so sempre ordenados pelos valores lgico. sempre ignorado a ordem fsica dos dados. Sempre que um arquivo ndice lgico for referenciado por um programa, ele ser carregado para a memria principal, tornando desprezvel o tempo de busca. O algoritmo da Busca sempre o de rvore binria.

11. MTODOS de Acesso de arquivos SEQUENCIAL; DIRETO; INDEXADO;

Podemos realizar a consulta de arquivos de dados de trs formas: Consulta SIMPLES: um valor definido e pesquisado at ser encontrado. Ex.: estado='GO'. Consulta por FAIXA de valores: fornecido uma faixa de valores que ser utilizado para pesquisa. Ex.: data entre '01/01/2003' e '15/01/2003' Consulta BOOLEANA:consiste na combinao de consultas simples, faixa ou ambas. Exe:estado='GO' e data entre '01/01/2003' e '15/01/2003'

Mtodo de Acesso SEQUENCIAL: Num arquivo sequencial, a ordem lgica e fsica dos registros armazenados a mesma. Como os registros so armazenados um aps o outro em sequncia, a leitura de um registro n requer que os n- 1 registros anteriores tambm sejam lidos. Consiste em varrer todos os dados um aps o outro, comparando os VALORES DE PESQUISA com o valor campo CHAVE, at encontrar o registro desejado. Um arquivo sequencial, pode ser ordenado por um campo (chave) ou tambm por ordem de gravao, onde cada gravao nova no arquivo gerar um valor de chave. Para adicionar registros em um arquivo sequencial sem chave, basta incluir o registro no final do arquivo. Quando o arquivo ordenado por uma chave: a nica forma de inserir um registro e manter a ordenao fazer uma cpia do arquivo at o ponto de insero, inserir o novo registro e copiar o restante do arquivo. Devido ao grande overhead gerado por esta insero, geralmente os registros a serem inseridos so agrupados em lotes (ordenado) e depois feito um processamento. Para Remover a mesma coisa. A atualizao de um registro simples no arquivo sem chave: basta ler o registro, alter-lo e grav-lo novamente. Se o valor da chave de ordenao for alterado, todos os registros adjacentes devem ser movidos para manter a classificao do arquivo.

Mtodo de Acesso DIRETO: Aqui existe uma relao direta entre a chave de ordenao e o endereo no dispositivo de armazenamento. Os registros so lidos e atualizados atravs do uso desta relao. Arquivos com acesso direto permite a busca de registros individuais com um tempo de resposta bem melhor, pois na verdade, o ponteiro do arquivo movido para a posio onde o registro est armazenado e ento feita a leitura do registro. O endereo usado para localizar um registro pode ser absoluto ou relativo. O endereo absoluto significa o endereo real do registro no arquivo. Se indicarmos o endereo absoluto 4, isto significa que o quarto registro armazenado no arquivo o que ser processado. O endereo relativo, significa o deslocamento a partir da posio atual do arquivo. Se o ponteiro estiver no registro 4 e indicarmos um endereo +4, o ponteiro ser movido 4 posies adiante e assim o registro 8 ser processado.

Mtodo de Acesso INDEXADO: Esse mtodo atua como o ndice de um livro, onde esto relacionados os tpicos e a pgina informando onde cada tpico est localizado. A ideia do arquivo indexado justamente esta: existe um arquivo auxiliar (ndice) que contm as chaves e o endereo do registro correspondente no arquivo principal (dados). Num banco de dados, para cada arquivo de dados, podemos ter um ou mais ndices, dependendo dos valores de chave para ser utilizados. Um arquivo de clientes poderia ser classificado por ordem alfabtica ou pelo nmero do CPF do cliente. Para satisfazer as duas chaves, seriam criados ento dois arquivos de ndices: um tendo o nome e o outro tendo o CPF como chave de classificao.

O arquivo de ndice pode ser criado de duas formas: ndice denso: existe um registro no arquivo de ndices para cada valor de chave no arquivo principal. ndice esparso: registros de ndice so criados para apenas alguns registros. Outros valores de chave so procurados a partir do registro de ndice mais prximo.TIPOS DE PROCESSAMENTO:A forma de processamento dos dados guardados em arquivo influencia na escolha do modo de acesso.

P/ROCESSAMENTOS DO TIPO ONLINE E TEMPO REAL requerem um tempo de resposta pequeno. Em um sistema de reservas de passagens a informao acerca da disponibilidade de lugares deve ser imediatamente vista e deve refletir a situao naquele exato momento. Um acesso sequencial contraindicado neste tipo de processamento.PROCESSAMENTOS DO TIPO BATCH (EM LOTE), onde os dados so processados em sequencia e no requerem tempo de resposta imediato, geralmente tem uma liberdade maior para estabelecer uma escolha entre os mtodos de acesso. Um relatrio de clientes para mala direta um processamento por natureza sequencial, pois todos os clientes devem ser processados.

MESCLA DE PROCESSAMENTO ONLINE E BATCH. Operaes bancrias so um exemplo. Durante o dia, os clientes movimentam sua conta efetuando depsitos, saques ou pagamentos. Estas transaes so feitas online, o que requer que elas estejam disponveis assim que executadas. O banco pode resolver este problema mantendo dois arquivos: um arquivo mestre contendo os lanamentos da conta e um arquivo de transaes o qual guarda as transaes do dia. O processamento do arquivo de transaes feito online e ao final do dia, as transaes so incorporadas ao arquivo mestre num processamento batch.

ARQUIVO INDEXADO EM RVORE B+

a mais utilizada pelos SGBD, pois no requer indexao constante. A rvore B+ uma rvore de pesquisa e caminhos mtiplos e de crescimento restrito. Todos os registros so armazenados no ltimo nvel da rvore (N Folhas) e a Mtodo de acesso at esse nvel de forma sequencial, utilizando os Ns Internos apenas como Ponteiros.

Uma rvore B+ de ordem N deve satisfazer as propriedades: Todo N tem no mximo N descendentes. Todo N exceto a Raiz e os Terminais, tem no mnimo n/2 ARREDONDANDO PARA O MAIOR. A Raiz tem pelo menos 2 descendentes, caso que seja N terminal. Todos Ns Terminais aprecem no mesmo nvel e no tem nenhuma informao. Um N Interno com N descendentes contm N-1 valores chaves.

Aplicando as propriedades acima, temos que uma rvore B+ de ordem 5 deve ter entre 5/2=3 e 5 descendentes contendo 2, 3 ou 4 valores de chave. A raiz pode conter de 1 a 4 valores de chave. Os valores de chave de um n aparecem ordenados e o nmero de descendentes exatamente maior em uma unidade que o nmero de valores de chave do n.A pesquisa se inicia na raiz e uma busca feita nos seus valores de chave. Se a busca tiver xito, o valor localizado, seno existem dois valores de chave no n entre os quais o valor procurado est. Dessa forma a subrvore entre estes dois valores de chave pesquisada. O processo repetido a cada n e se chegar a um n terminal sem encontrar o valor de chave procurado, a pesquisa no teve xito.

A atualizao na rvore B relativamente simples: cada n terminal corresponde a um lugar onde o novo valor de chave pode ser inserido. Se o n j contiver N valores de chave, ento ele fracionado em dois ns e o valor de chave Kn/2 inserido no n pai. Se o n pai tambm estiver completo, ele dividido e assim sucessivamente at a raiz. Caso a raiz tenha que ser dividida, uma nova raiz criada contendo o valor de chave nico Km/2 . Assim uma rvore B cresce para cima a partir do topo e no para baixo a partir da base.

A retirada de um N. A retirada de um valor de um n pode deix-lo muito vazio (ocorre um underflow). Neste caso o irmo examinado e os valores de chave do irmo movido at os dois ns apresentarem aproximadamente o mesmo nmero de valores de chave. Este movimento no ocorre diretamente entre os irmos, mas o valor de chave anterior do no pai movido para o n em underflow e o valor da chave anterior do irmo movido para o pai.

Exe: Os sistemas de arquivo NTFS, ReiserFS, NSS, XFS, e JFS utilizam este tipo de rvore para indexao

Sistemas de Gerncia de Banco de Dados como IBM DB2, Informix, Microsoft SQL Server, Oracle 8, Sybase ASE, PostgreSQL, Firebird, MySQL e SQLite suportam este tipo de rvore para indexar tabelas.

Outros sistemas de gerncia de dados como o CouchDB, Tokyo Cabinet e Tokyo Tyrant suportam este tipo de rvore para acesso a dados

12. Hashing O princpio que baseia o hashing que embora tenhamos um conjunto grande (talvez infinito) de chaves de pesquisa possveis, o conjunto de chaves armazenadas no banco de dados muito menor, ou seja, apenas uma parte de todas as chaves possveis utilizada. Dessa forma, implementada uma funo de hashing que transforma os valores de chave em endereos. Um determinado endereo no representa um nico registro, mas um conjunto de registros nos quais a aplicao da funo de hash em suas chaves de pesquisa, resultam em um mesmo endereo. Os registros nesta situao (conflitantes) podem ser organizados em uma lista encadeada a partir do endereo obtido. Uma funo de hash ideal coloca um endereo para cada valor de chave. A insero bastante simples, basta aplicar a funo de hash para encontrar o endereo e se houver conflito, acrescenta o registro ao final da lista. A deleo tambm bem simples, bastando remover o registro de onde ele est armazenado. A funo de hash pode ser esttica ou dinmica. A funo esttica deve ser definida na criao do banco de dados e no pode ser alterada medida que dados so acrescentados ou removidos. A funo de hash dinmica muda com o tamanho do banco de dados, mas o seu problema a dificuldade na implementao.