05.sistema decomputação_representação de dados

16
Representação de Caracteres Aula 9

Upload: karen-rafaelle

Post on 16-Dec-2015

212 views

Category:

Documents


0 download

DESCRIPTION

Representação de dados

TRANSCRIPT

Barramentos de expanso

Representao de Caracteres Aula 9RoteiroNmero Decimal (BCD);EBCDIC;ASCII;Unicode

Representao de Caracteres e SmbolosA representao de caracteres e smbolos em computador feita atribuindo-se a cada caractere ou smbolo um cdigo binrio. Desta forma, so construdas tabelas (padres) em que cada cdigo binrio representa, para o computador, um determinado caractere ou smbolo.

BCDBCD, Decimal Codificado em Binrio, que foi criado de forma mais semelhante com o sistema decimal, pois ele combina certas caractersticas dos sistemas binrio e decimal. Ele representa dgitos decimais de 0 at 9 com cdigos binrios de 4 dgitos, bits, para nmeros maiores combina-se 2, 3, ..., n sequencias de 4 bits, exemplos.DECIMAL / BCD0000060110

EBCDICExtended Binary Coded Decimal Interchange Code (EBCDIC) uma codificao de caracteres 8-bit que descende diretamente do cdigo BCD com 6-bit e foi criado pela IBM como um padro no incio dos anos 1960 e usado no ibm 360.Como consequncia daquela descendncia direta o cdigo EBCDIC podia ser truncado para 6 bit dando origem ao cdigo BCD com 6 bit.Representa uma primeira tentativa de normalizao em paralelo com a normalizao ASCII utilizada pelo governo dos Estados Unidos no final dos anos 1960.No EBCDIC so utilizados pela primeira vez 8 bit - 1 byte - para codificar um estado existindo assim a possibilidade de codificar 256 estados diferentes.

ASCIIASCII (acrnimo para American Standard Code for Information Interchange, que em portugus significa "Cdigo Padro Americano para o Intercmbio de Informao", mas comumente utilizamos a sigla em ingls para referencia direta) uma codificao de caracteres de sete bits baseada no alfabeto ingls. Cada sequencia de cdigos na tabela ASCII corresponde a um caractere, comumente representados pelos 8 bits (equivalente a um byte), sendo que o oitavo bit (da direita para a esquerda) serve como um bit de paridade, utilizado para deteco de erro. Os cdigos ASCII representam texto em computadores, equipamentos de comunicao, entre outros dispositivos que trabalham com texto. Desenvolvida a partir de 1960, grande parte das codificaes de caracteres modernas a herdaram como base.A codificao define 128 caracteres, preenchendo completamente os sete bits disponveis em 27=128 sequncias possveis. Desses, 33 no so imprimveis, como caracteres de controle atualmente no utilizveis para edio de texto, porm amplamente utilizados em dispositivos de comunicao, que afetam o processamento do texto.Representao de Caracteres

Esta tabela define os caracteres de 0 a 127 Os caracteres de 128 a 255 so extras Cada pas implementou a sua extenso, para os seus acentos, chamada codepageIsso criou muita confuso e, ento, criaram os padres mundiais UNICODE Os tipos comuns so UTF-8, UTF-16 e UTF-32

Representao de Caracteres

UTF: Unicode Transformation FormatUTF-8: 256 caracteresUTF-16: 65536 caracteresUTF-32: 4 bilhes de caracteresUTF-8 compatvel com ASCII (Apenas os 128 primeiros caracteres do ASCII)UTF-16 compatvel com UTF-8UTF-32 compatvel com UTF-16UnicodeUnicode um padro que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. Publicado no livro The Unicode Standard1 ,2 o padro consiste de pouco mais de 107 mil caracteres3 , um conjunto de diagramas de cdigos para referncia visual, uma metodologia para codificao e um conjunto de codificaes padres de caracteres, uma enumerao de propriedades de caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador com dados de referncia, alm de regras para normalizao, decomposio, ordenao alfabtica e renderizao.

Unicode um alfabeto em 16 bits compatvel com o ASCII e com o conjunto de caracteres Latin-1. Como a codificao bsica do unicode e de 16 bits, ele possui capacidade de codificar a maioria dos caracteres usados em cada linga no mundo, tambm define uma extenso que permite a codificao de um milho de caracteres adicionais.O espao de codifocao Unicode de 5 partes;