teoria e implementação de linguagens computacionais – if688 professor: andré santos home page...

39
Teoria e Implementação de Linguagens Computacionais – IF688 • Professor: André Santos • Home page do curso: http://www.cin.ufpe.br/~if688

Upload: internet

Post on 19-Apr-2015

103 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Teoria e Implementação de Linguagens Computacionais – IF688

• Professor: André Santos

• Home page do curso: http://www.cin.ufpe.br/~if688

Page 2: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Motivação

• Conhecimento das estruturas e algoritmos usados na implementação de linguagens: noções importantes sobre uso de memória, eficiência, etc.

• Aplicabilidade freqüente na solução de problemas que exigem alguma forma de tradução entre linguagens ou notações.

• Implementação de linguagens para um domínio específico.

Page 3: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Integração com outras disciplinas

• A disciplina de implementação de linguagens faz uso de um grande número de conceitos estudados em outras disciplinas do curso:

• Introdução à Programação, Algoritmos e Estruturas de Dados, Infraestrutura de software, Infraestrutura de Hardware, Paradigmas de LP, Informática Teórica,…

Page 4: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Introdução

1. Linguagens de programação:alto nível × baixo nível

2. Processadores de linguagens

3. Especificação da sintaxe e semântica de linguagens de programação

Page 5: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Níveis de Linguagens de Programação

• Linguagens de programação são uma notação formal para expressar algoritmos

• Além de poder expressar e analisar algoritmos, programadores precisam de meios para editar, traduzir e interpretar os programas em um computador: precisam de Processadores de Linguagens de Programação

Page 6: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Linguagem de Máquina

• Computadores entendem código de máquina ou linguagem de máquina: seqüência de instruções primitivas expressas por uma seqüência de bits, que é interpretada para executar uma determinada operação (primitiva): carregar dados, somar registradores, desvios condicionais e incondicionais, etc.

Page 7: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Linguagem de Máquina

• Originalmente se escrevia diretamente em linguagem de máquina:0000 0001 0011 0010

• Problemas: dificuldade em ler, escrever, editar; controle explícito dos endereços de memória para dados e para o próprio programa;

• Limite para entendimento/gerenciamento dos programas: alguns milhares de instruções

Page 8: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Linguagem de Montagem

• Notação simbólica para facilitar a escrita, leitura e edição:LOAD xADD R1 R2JUMPZ h

• Tradução para linguagem de máquina = montagem do programa

• Assembly language• Uso de um programa montador (assembler)• Instruções ainda muito próximas da linguagem de

máquina (relação de 1 para 1)

Page 9: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Linguagem de Montagem

• LOAD R1 a; ADD R1 b; ADD R1 c; DIV R1 #2;LOAD R2 R1; LOAD R3 R1; SUB R3 a; MULT R2 R3; LOAD R3 R1; SUB R3 b; MULT R2 R3; LOAD R3 R1; SUB R3 c; MULT R2 R3; LOAD R0 R2; CALL sqrt;

Page 10: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Linguagens de Programação de alto nível

• Maior nível de abstração:let s = (a+b+c)/2in sqrt (s*(s-a)*(s-b)*(s-c))

Page 11: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Linguagens de alto nível devem suportar os seguintes conceitos:

• uso de expressões, usando notação semelhante à matemática;

• tipos de dados primitivos e compostos;• estruturas de controle como if-then-else, while, for

etc.;• declarações de variáveis, tipos, funções,

procedimentos etc.;• abstração: o que é feito x como é feito;• encapsulamento (ou abstração de dados): classes,

pacotes, módulos (orientação a objetos).

Page 12: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Processadores de Linguagens de Programação

• Sistemas que manipulam programas expressos em alguma linguagem de programação: editores, tradutores, compiladores, interpretadores.

• Ferramentas de software (Unix) x processadores integrados (IDEs: Integrated Development Environments)

• Exemplo: JDK x Eclipse

Page 13: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Especificação de Linguagens de Programação

• Projetista (designer): projeta linguagens de programação;

• Implementador: implementa uma linguagem;• Programador: é usuário da linguagem.

• Todos devem ter o mesmo entendimento da linguagem: ter como referência a especificação da linguagem

Page 14: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Especificação de Linguagens de Programação

• Sintaxe: define a forma do programa: palavras reservadas, organização das frases;

• Restrições contextuais (semântica estática): regras de escopo e regras de tipo;

• Semântica: significado do programa. Podemos ver o significado do programa como uma função mapeando a entrada no resultado (denotacional); ou baseado no seu comportamento (operacional);

Page 15: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Especificação de Linguagens de Programação

• Especificação informal: texto em linguagem natural (inglês ou outra). Riscos: especificação imprecisa, incompleta ou ambígua.

• Especificação formal: consistente, completa, não ambígua. Porém mais difícil de escrever e difícil de ser entendida por pessoas que não conhecem a notação utilizada.

Page 16: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Especificação de Linguagens de Programação

• Na prática: – especificação formal da sintaxe– Especificação informal das restrições

contextuais e da semântica

Page 17: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Sintaxe

• É especificada usando gramáticas livres de contexto (BNF – Backus-Naur Form):– Conjunto finito de símbolos terminais:

‘>=’, ‘while’, ‘;’.– Conjunto finito de símbolos não-terminais:

Programa, Comando, Expressão, Declaração.– Um Símbolo inicial (um dos não-terminais):

Programa– Conjunto finito de regras de produção.

Page 18: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Mini-Triangle: Terminais

• begin const do else endin let then var whileif ; : := ~( ) + - */ < > = \

Page 19: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Mini-Triangle: Não-terminais

• Program Command single-Command Expressionprimary-Expression V-nameDeclaration OperatorSingle-Declaration IdentifierType-denoterInteger-Literal

Page 20: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Mini-Triangle: Produções

• Program ::= single-CommandCommand ::= single-Command | Command ; single-Command

Page 21: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Mini-Triangle: Produções

• single-Command ::= V-name := Expression | Identifier ( Expression ) | if Expression then single-Command else single-Command | while Expression do single-command | let Declaration in single-Command | begin Command end

Page 22: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Mini-Triangle: Produções

• Expression ::= primary-Expression | Expression Operator primary-Expressionprimary-Expression ::= Integer-Literal | V-name | Operator primary-Expression | ( Expression )V-name ::= IdentifierDeclaration ::= single-Declaration | Declaration ; single-Declaration

Page 23: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Mini-Triangle: Produções

• Single-Declaration ::= const Indentifier ~ Expression | var Identifier : Type-denoterType-denoter ::= IdentifierOperator ::= + | - | * | / | < | > | = | \Identifier ::= Letter | Identifier Letter | Identifier DigitInteger-Literal ::= Digit | Integer-Literal Digit

Page 24: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Árvore Sintática

• Cada gramática livre de contexto G gera uma linguagem (seqüência de símbolos terminais).

• Uma árvore sintática de G é uma árvore com labels ordenada em que: – as folhas são símbolos terminais; – os nós são símbolos não-terminais.

Page 25: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Sintaxe

• Sintaxe concreta: – Define a estrutura das frases, a ordem em que

sub-frases devem ser escritas, e os símbolos terminais que as delimitam;

– Define como escrever programas sintaticamente bem formados;

– Não é utilizada para a descrição semântica do programa;

Page 26: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Árvores Sintáticas: Exemplos

• d + 10 * n• while b do begin n := 0; b := false end

Page 27: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Sintaxe Abstrata

• Usada como referência na descrição semântica do programa

• Não gera frases, mas se baseia na estrutura das frases do programa

• Gera árvores sintáticas abstratas (Abstract Syntax Trees – ASTs)

• Nas ASTs cada nó representa uma produção, com uma sub-árvore para cada subfrase

Page 28: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Mini-Triangle: Sintaxe Abstrata: Não-terminais

• Program Command single-Command Expressionprimary-Expression V-nameDeclaration OperatorSingle-Declaration IdentifierType-denoterInteger-Literal

Page 29: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Mini-Triangle: Sintaxe Abstrata: Produções

• Program ::= Command ProgramCommand ::= V-name := Expression AssignmentCommand

| Identifier ( Expression ) CallCommand | Command ; Command SequentialCommand | if Expression IfCommand then Command else Command | while Expression WhileCommand do Command | let Declaration LetCommand in Command

Page 30: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Mini-Triangle: Sintaxe Abstrata: Produções

• Expression ::= Integer-Literal IntegerExpression | V-name VnameExpression | Operator Expression UnaryExpression | Expression Operator Expresion BinaryExpressionV-name ::= Identifier SimpleVnameDeclaration ::= const Indentifier ~ Expression | var Identifier : Type-denoter | Declaration ; DeclarationType-denoter ::= Identifier SimpleTypeDenoter

Page 31: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Árvores Sintáticas Abstratas: Exemplos

• d + 10 * n• while b do begin n := 0; b := false end

Page 32: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Restrições Contextuais

• Necessárias para expressar situações em que a possibilidade de a frase ser bem formada ou não, depende do seu contexto.

• Regras de escopo: ocorrência de ligação (declaração) × ocorrência de uso

• Exemplos: declaração de variáveis, let

Page 33: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Ligação estática x Ligação dinâmica

• Estática = em tempo de compilação, sem rodar o programa;

• Dinâmica: só rodando o programa.

• Exemplo: chamadas de métodos em Java

Page 34: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Regras de Tipos

• Normalmente, valores são classificados em tipos.

• Cada operação na linguagem tem uma regra de tipos, que define os tipos esperados para os operandos e o tipo do resultado (se existir).

• Qualquer operação utilizando um valor com tipo de errado gera um erro de tipos.

Page 35: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Classificação de Linguagens em Relação a Tipos

• Estaticamente tipada: todos os erros de tipos podem ser detectados estaticamente, sem executar o programa.

• Dinamicamente tipada, se (alguns) erros de tipos só podem ser detectados durante a execução do programa.

Page 36: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Regras de tipos: exemplo

• Regra de tipos para o operador ‘>’: se os dois operandos são do tipo int, então o resultado é do tipo bool;

• Regra de tipos para ‘while E do C’:E deve ser do tipo bool;

Page 37: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Em linguagens dinamicamente tipadas

• Uma variável pode assumir diversos valores, de tipos diferentes, durante a execução do programa;

Page 38: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Em linguagens estaticamente tipadas

• Toda expressão bem-formada E tem um tipo único T, que pode ser inferido (descoberto) sem avaliar E;

• Quando E for avaliada, ela vai gerar um valor do tipo T.

Page 39: Teoria e Implementação de Linguagens Computacionais – IF688 Professor: André Santos Home page do curso: if688 if688

Semântica da Linguagem

Ver especificação informal, no livro, para:

• Atribuição;

• Chamada de funções;

• Comando sequencial;

• If;

• While;

• Let;