Introdução ao XML - by Loiane

Download Introdução ao XML - by Loiane

Post on 19-Oct-2015

8 views

Category:

Documents

0 download

TRANSCRIPT

  • Introduo ao XML 22/02/2009 | By Loiane | 19 Comments Este post tem como objetivo apresentar as noes bsicas de XML, e tambm o primeiro de uma srie de posts sobre como manipular arquivos XML utilizando a linguagem java. Ao final desta srie de posts, disponibilizarei um tutorial em pdf, com todo o contedo postado aqui, assim como suas respectivas referncias. Afinal, o que XML? Extensible Markup Language (XML) linguagem de marcao de dados (meta-markup language) que prov um formato para descrever dados estruturados. Isso facilita declaraes mais precisas do contedo e resultados mais significativos de busca atravs de mltiplas plataformas. O XML permite a definio de um nmero infinito de tags, que so usadas para criar dados estruturados. Estes dados podem ser os dados de uma pessoa, tais como nome, endereo, telefone, nome dos filhos, etc. XML x HTML HTML e XML so primos. Eles derivam da mesma inspirao, o SGML. Ambos identificam elementos em uma pgina e ambos utilizam sintaxes similares. Se voc familiar com HTML, tambm o ser com o XML. A grande diferena entre HTML e XML que o HTML descreve a aparncia e a aes em uma pgina na rede enquanto o XML no descreve nem aparncia e aes, mas sim o que cada trecho de dados ou representa ! Em outras palavras, o XML descreve o contedo do documento.

    Estrutura de um XML Existem alguns termos que so usados para descrever partes de um XM: tags, elementos e atributos. Uma tag o texto que se encontra entre . Existem tags que indicam o incio () e tags que indicam o fim (). Um elemento a tag de incio, a tag de fim e tudo o que est entre estas tags. No exemplo da figura abaixo, o elemento possui os elementos filhos e . Um atributo o par nome-valor que se encontra dentro da tag de incio de um elemento. No exemplo da figura abaixo, tipo um atributo do elemento . Todo documento XML deve contrar apenas um nico elemento. Este nico elemento chamado de elemento raiz, que contm todos os valores e/ou outros elementos.

  • Estrutura de uma rvore XML Geralmente, uma rvore XML possui um n raiz especial (/) acima do elemento raiz. A figura abaixo representa a rvore XML do documento XML da figura acima.

    Aplicaes do XML Aqui est uma lista completa de aplicaes para o XML. Concluso Por XML deve-se entender meramente uma notao de texto hierarquicamente estruturado. A partir desta breve introduo, voc est apto a criar e configurar arquivos XML. At a prxima!

    XML: como posso usar, vantagens e desvantagens Introduo ao XML: Parte II

  • 26/02/2009 | By Loiane | 7 Comments

    Agora que voc j sabe o que um XML e como ele se parece (que pode ser visto aqui), vamos ao prximo passo: como que posso usar o XML, suas vantagens e desvantagens. Para que devo usar XML? O propsito principal do XML a facilidade de compartilhamento de informaes atravs da Internet. Mas o XML no serve apenas para web. Dentre as vrias aplicaes, pode-se incluir:

    Identificao da informao: voc pode definir suas prprias tags; Armazenamento de informao: XML portvel e no proprietrio, pode ser

    usado para armazenamento de informao em qualquer plataforma, por ter um padro internacional;

    Estruturar informao: XML pode ser usado para identificar qualquer tipo (hierrquico) de estrutura, seja esta longa ou com complexos tipos de dados;

    Publicao: combinando os ltimos trs tpicos (identificao, armazenamento e estruturao) significa que podemos utilizar o XML para public-lo na Web, assim como tambm outros formatos, como PDF, audio, etc, utilizando as folhas e estilos apropriadas para cada um dos casos;

    Mensagens e tranferncia de dados: XML tambm extremamente usado para juntar ou encapsular informao para ser trocada entre diferentes sistemas computacionais que seriam incapazes de se comunicar, sem precisar se preocupar com tipo de dado;

    Simplificao da mudana de plataforma: os dados de um XML so armazenados no formato texto. Isto torna muito mais fcil fazer a expanso ou atualizao de um sistema operacional ou de uma aplicao sem perder informaes;

    Web Services: o XML usado para gesto da informao e transmisso. Por que devo usar XML? Os tpicos abaixo exemplificam algumas razes:

    recomendado pelo W3C (World Wide Web Consortium); padro aberto, voc no precisa pagar nada para usar; Existem vrias ferramentas e editores bons no mercado, e o melhor: free; Simplicidade e Legibilidade, tanto para humanos quanto para computadores; Separao do contedo da formatao; Concentrao na estrutura da informao, e no na sua aparncia; Possibilidade de criar sua prpria sintaxe de dados, ou seja, estruturar os dados

    da forma que achar melhor, atravs da criao ilimitada de tags; Possui suporte a Unicode, permitindo que praticamente qualquer informao

    escrita em lngua humana possa ser transmitida; Permite validao, o que torna os teste unitrios mais efetivos, e a construo de

    aplicaes bem mais fcil; Quando no devo usar XML? Tudo tem um lado positivo e um lado negativo. No poderia ser diferente com o XML. Vamos ver ento alguns pontos negativos:

    A sintaxe do XML redundante ou torna-se grande em relao a representaes de dados semelhantes;

    A redundncia pode afetar a eficincia quando utiliza-se o XML para armazenamento, afetando tambm transmisso e processamento, os custos ficam muito mais elevados;

    Resumindo o que foi dito neste dois pontos: em muitas situaes, o XML pode ser substitudo por documentos com formatos mais simples, como os arquivos properties ou

  • texto. A grande quantidade de informao repetida pode prejudicar a velocidade de transferncia real da informao (se estiver em formato XML). Por exemplo: suponha que exista a necessidade de se transmitir o valor de determinados items, e cada item possui um indentificador. Poderamos criar um XML como o da figura abaixo para transmitir essas informaes:

    Suponha ainda que o XML contenha milhares de itens. A quantidade de informao real (somente dos dados) que est sendo fornecida bem menor comparada quantidade de informaes extras (tags) contidos no arquivo. Observe tambm que as informaes que sero transmitidas pelo arquivo no possuem quase nenhuma complexidade, ou seja, so muito simples. Outro fato a se observar que no h a real necesssidade da informao ser representada de forma hierrquica. As informaes do XML da figura acima poderiam simplesmente ser armazenadas em um arquivo txt simples, como o exemplo da figura abaixo:

    Repare que o tamanho do arquivo a ser transmitido ficou bem menor (quantidade de informaes caracteres; e consequentemente, o tamanho do arquivo em Kbytes). Concluso O uso do XML deve ser analisado antes de ser implementado. Algumas vezes pode ser mais vantajoso, em outras, pode ser necessrio utilizar algum outro padro. importante analisar o objetivo do uso do XML alm do tipo de aplicao e/ou sistema que vai gerar e/ou fazer o consumo do arquivo (se este for usado para armazenamento de informao). O prximo post da srie XML ser sobre como criar documentos bem formados.

    Como criar um documento XML Introduo ao XML: Parte III 02/03/2009 | By Loiane | 15 Comments

  • O objetivo deste post apresentar os elementos/partes de um documento XML. At agora, os XMLs apresentados como exemplos tinham uma estrutura parecida com essa:

    Ol! O XML acima possui apenas uma declarao e os elementos que compem a rvore XML. Porm, um XML tambm pode conter outros elementos. Segue a listagem das partes de um XML:

    Declarao XML Prlogo Instrues de processamento Elementos e atributos Comentrios Entidades Sees CDATA

    Declaraes do XML A maiora dos documentos XML comeam com uma declarao XML que fornece informaes bsicas sobre o documento para o parser. recomendado que um XML comece com uma declarao, mas no obrigatrio. Caso a declarao exista, deve ser a primeira coisa do documento. Eis um exemplo de declarao xml: A declarao XML utiliza o elemento . Se utilizar ter um erro de validao. Existem trs atributos que podem ser usados na declarao:

    Version a verso do XML, que pode ser 1.0 ou 1.1. Este atributo obrigatrio se voc usar a declarao XML;

    Enconding a linguagem de codificao do documento. O padro UTF-8. Este atributo opcional.

    Standalone os valores possveis so yes ou no. Use yes se o documento no faz referncia a documentos externos ou entidades. Use no caso contrrio. Este atributo opcional.

    Comentrios Voc pode incluir comentrios em um documento XML para incluir notas explicatrias e/ou descritivas. Os comentrios so ignorados por um parser, assim como tambm so ignorados por um compilador. possvel incluir um comentrio em qualquer lugar do XML, exceto nas tags (dentro das tags) e antes da declarao XML.

    algum outra pessoa

    abcdefghijk Instrues de Processamento O XML permite que voc utilize instrues especiais para passar informao para os programas que possam ler o documento XML. Uma instruo de processamento comena com . A nica restrio que voc no pode usar ou (que tambm reservado). No exemplo abaixo, a instruo de processamento para o Cocoon, um framework da Apache que focado em publicao XML. Quando o Cocoon est processando um XML, procura por instrues que comecem com cocoon-process, ento processa o

  • XML de acordo com esta instruo. O atributo type=sql indica que o documento XML contm uma instruo SQL. Prlogo O prlogo aparece no incio de um documetno XML, e contm informaes sobre o restante do documento. Um prlogo pode conter uma declarao XML, comentrios (que descreve o documento), instrues de processamento, e declaraes de tipo de documento (DTD). O XML abaixo exemplifica um prlogo contendo uma declarao XML, comentrio, uma instruo de processamento e um DTD (no elemento ).

    mensagem Entidades As entidades so constantes associadas a um valor de texto. So substitudas durante o processamento do documento XML. Por exemplo, se o texto XML legal for aparecer em vrias partes do documento podemos criar uma entidade assim: Aps a criao desta entidade, se quiser usar essa frase no documento XML, basta substituir por &legal. Tambm existem algumas entidades pr-definidas. O XML possui alguns caracteres especiais, que podem at gerar conflito com o contedo do documento. Por exemplo, suponha que voc queria utilizar a frmula x < y. No XML, a frmula ficaria assim: x < y Observe que a leitura no ficou muito legvel. O que est confundindo a leitura o carcter & que corresponde a & " que corresponde a ' que corresponde a

    Alguns documentos XML possuem caracteres no usuais, especialmente os documentos que possuem contedo cientfico ou matemtico. Se quisermos inserir o smbolo (pi), devemos fazer referncia ao seu cdigo no Unicode, como abaixo: CDATA A seo CDATA serve para prevenir o processamento de uma poro de contedo. Tudo o que est nessa seo no ser processado pelo parser. Exemplo:

    Este o contedo do XML de exemplo

    Maria 99999999

    ]]>

  • Se visualizarmos o XML acima, teremos:

    Note que as tags , e no foram reconhecidas como tags do documento, mas sim como contedo da tag . Definindo Tags e Atributos No XML, voc quem define o nome das tags e dos elementos que o documento XML vai ter. A pesar de voc poder escolher o nome que quiser para suas tags, existem algumas regras para a formao dos nomes. A especificao XML bem especfica em relao ao nome das tags. Voc pode comear uma tag com uma letra, underscore (_) ou dois pontos (:). Os prximos caracteres podem ser letras, dgitos, underscore, hfen, e dois pontos. Espao no permitido. Exemplo de tags que so permitidas:

    Algumas tags que so ilegais:

    < 2009> Os nomes de atributos seguem as mesmas regras que as tags. Obs.: Embora seja permitido o uso de dois pontos (:), no aconselhvel usar. O caracter : utilizado por prefixos do namespace (um dos assuntos do prximo post). Concluso Este post abordou as partes de um XML. Sabendo agora o que podemos ter em um XML, vamos falar sobre como criar um documento XML bem formado no prximo post. O assunto de DTD vai ser abordado em um post futuro.

    Documento XML Bem Formado Introduo ao XML: Parte IV 05/03/2009 | By Loiane | 3 Comments J sabemos como escrever um documento XML. Agora falata saber como criar um documento XML bem formado, ou seja, um documento que obedece algumas regras de formao. Antes de apresentar algumas regras bsicas, precisamos saber o que exatamente um documento XML bem formado. Os documentos XML bem formados seguem as regras

  • de sintaxe do XML, mas no possuem um DTD ou Schema, ou seja, no possuem um documento de validao (assunto do prximo post, aguardem!). Algumas regras sero listadas agora. O documento XML deve comear com uma declarao XML A pesar da declarao no ser obrigatria, o W3C recomenda que voc deve ter uma declarao no documento, e que esta deve ser ser a primeira coisa a aparecer no XML (comentrios antes da declarao no so vlidos). Exemplo de XML invlido:

    O Elemento Raiz deve conter todos os outros elementos Um documento XML deve conter apenas um nico elemento raiz. (root), que contm todo o texto e outros elementos do documento. Exemplo de XML bem formado:

    O XML abaixo no contm apenas um nico elemento raiz, portanto, no um documento bem formado:

    O documento XML deve ter pelo menos 1 elemento Para ser um documento vlido, o XML deve conter pelo menos 1 elemento. O primeiro elemento deve ser o elemento raiz. O exemplo abaixo mostra o menor XML bem formado possvel:

    Elementos devem ter tags inicial e final No pode existir um elemento sem a tag final. A tag final indicada por uma barra /, antes do nome da tag. O XML abaixo no bem formado porque o elemento no possui a tag final ().

    Se um elemento no possui informao (n de texto), chamado de elemento vazio. O elemento vazio indicado por ter uma barra / no final da tag inicil, como exemplificado no elemento no XML abaixo:

    As tags so case-sensitive No XML a tag diferente da tag . O XML abaixo mostra um exemplo que no bem formado:

  • Elementos no podem se sobrepor Se a tag inicial est dentro de um elemento, a tag final tambm deve estar dentro do mesmo elemento. Simplificando: os elementos, delimitados pelas tags inicial e final, devem estar aninhados. Exemplo de XML mal formado:

    Exemplo de XML bem formado:

    Os atributos devem estar entre aspas Existem duas regras para atributos nos documentos XML:

    1. Atributos devem ser valorados 2. Os valores devem estar entre aspas

    O XML abaixo um exemplo de XML mal formado:

    Voc pode usar aspas simples ( ) ou aspas duplas ( ). O exemplo abaixo um exemplo de documento bem formado:

    Os atributos devem ser nicos Os atributos no devem aparecer mais de uma vez em uma mesma tag de abertura.

    A pesar de terem a mesma grafia, os atributos abaixo so diferentes (lembre-se que o XML case-sensitive). Mesmo assim, no uma boa prtica.

    Utilize < e & apenas para iniciar uma tag e entidade Os processadores XML sempre assumem que o carcter < inicia uma tag e que o carcter & inicia uma referncia a uma entidade. Por este motivo, utilize as entidades pr-definidas. Se por algum motivo o valor de um atributo ou elemento utilizar algum dos caracteres < > e &, utilize as entidades pr-definidas, pois os processado...

Recommended

View more >