prova de admissão do programa inter-unidades em ... · para cada uma das afirmações a seguir,...

37
1 Prova de Admissão do Programa Inter-unidades em Bioinformática 02 de Junho de 2017. NOME: _______________________________________________________ A prova contém 30 (trinta) questões divididas em 3 (três) áreas do conhecimento (matemática/estatística, ciência da computação, ciências biológicas). Você deverá responder um total de 10 (dez) questões, sendo obrigatoriamente um mínimo de 7 (sete) de uma única área do conhecimento. Caso deseje, você pode responder as 10 (dez) questões de uma área, se preferir, pode também responder 7 (sete) questões de uma área e 3 (três) de outra(s) área(s). Responda cada questão dentro do quadrado correspondente. Respostas fora do quadrado correspondente não serão consideradas. A prova pode ser feita a lápis. Boa prova! Duração: 3 horas

Upload: vunhu

Post on 28-Nov-2018

212 views

Category:

Documents


0 download

TRANSCRIPT

1

Prova de Admissão do Programa Inter-unidades em Bioinformática

02 de Junho de 2017. NOME: _______________________________________________________ A prova contém 30 (trinta) questões divididas em 3 (três) áreas do conhecimento (matemática/estatística, ciência da computação, ciências biológicas). Você deverá responder um total de 10 (dez) questões, sendo obrigatoriamente um mínimo de 7 (sete) de uma única área do conhecimento. Caso deseje, você pode responder as 10 (dez) questões de uma área, se preferir, pode também responder 7 (sete) questões de uma área e 3 (três) de outra(s) área(s). Responda cada questão dentro do quadrado correspondente. Respostas fora do quadrado correspondente não serão consideradas. A prova pode ser feita a lápis. Boa prova! Duração: 3 horas

2

Questões da Área de Matemática e Estatística 1. Os seguintes resultados foram obtidos dos dados de peso (em kg) de crianças de uma pré-escola: Variável Sexo N Média Mediana Mínimo Máximo Q1 Q3 Peso Masculino 57 18.0 15.0 12.5 22.0 14.5 18.0 Feminino 35 12.2 12.5 10.0 15.0 11.5 13.5 a) Segundo o critério usado no box-plot observações que ocorrem fora do intervalo [Q1-1.5(Q3-Q1) ; Q3+1.5(Q3-Q1)] são consideradas atípicas (outliers). Verifique se há dados outliers em cada grupo de crianças.

b) De acordo com o critério acima, na distribuição normal, qual é a probabilidade de um valor ser considerado outlier? Considere que: 𝑃(𝑍 ≤0.6745) = 0.75 e 𝑃(𝑍 ≤ 2.698) = 0.9965 para Z variável normal padrão.

3

2. De uma população X, com distribuição normal de média µ e variância 9, extraiu-se, aleatoriamente, a seguinte amostra (n=4): 1.2; 3.4; 0.6; 5.6. a) Com base no estimador de máxima verossimilhança de µ, obtenha o intervalo de confiança de 95% para a média. Considere que: 𝑃(𝑍 ≤ 1.645) =0.95 e 𝑃(𝑍 ≤ 1.960) = 0.975, para Z variável normal padrão.

b) Da mesma população, extraiu-se uma amostra 25 vezes maior que a anterior e verificou-se que, para essa nova amostra, a estimativa da média amostral era igual à obtida com a primeira amostra. Obtenha o intervalo de confiança para µ com base na nova amostra. Qual das duas amostras forneceu estimativas mais precisas?

4

3. A tabela abaixo contém as distribuições marginais do genótipo de um marcador molecular para indivíduos fumantes e não fumantes.

Genótipo Tabagismo aa Aa AA Total Fumante Não Fumante 60 Total 50 20 100

a) Na hipótese de inexistência de associação entre genótipo e hábito de fumar, calcule as frequências esperadas de indivíduos fumantes e não fumantes em cada genótipo.

b) O resultado de um teste Qui-Quadrado destes dados foi 𝜒! = 44.44, df = 2, p-value = 2.234e-10. Que conclusão pode ser obtida?

5

4. As tabelas a seguir foram obtidas da análise estatística de um conjunto de dados por meio de um pacote computacional.

Tabela 1: ANOVA Source DF SS MS F p Regression 3 2807.90 935.97 14.42 0.001 Error 10 649.09 64.91 Total 13 3456.99

Tabela 2: Ajuste do Modelo Coefficients Estimates Std. Error t value Pr(> |t|) (Intercept) 13.32 6.93 1.92 0.084 x1 4.37 0.81 5.42 0.000 x2 -22.60 5.46 -4.14 0.002 x3 -7.36 5.46 -1.35 0.208

a) Qual é o número de observações do conjunto de dados?

b) Qual é o desvio padrão da variável resposta?

c) Quais variáveis preditoras são significantes?

6

5. Há interesse em estimar a proporção p de estudantes da USP que utilizam transporte público. a) Qual deve ser o tamanho da amostra necessária para que o erro cometido na estimação de p seja no máximo 0.02 com probabilidade 0.95?

b) Suponha que foi possível entrevistar 800 estudantes, dos quais 630 utilizam transporte público. Construa um intervalo de confiança de 95% para p. As condições do item a) foram atendidas? Nota: Assuma que não há nenhuma informação adicional sobre p. Considere que: 𝑃(𝑍 ≤ 1.645) = 0.95 e 𝑃(𝑍 ≤ 1.960) = 0.975

7

6. Provar que a seguinte série converge: 1𝑛2!

!

!!!

8

7. Construir a equação da reta tangente e da reta normal para a função 𝑓 𝑥 = 0.5𝑥! − 0.5𝑥 + 1 no ponto 𝑥 = 8.

9

8. Calcule: a) 2 lg 0.1 + 3ln (𝑒!); lg: logaritmo na base 10, ln: logaritmo na base e

b)

2 ln 3𝑒 − ln (9)

3 ln 5𝑒 − 32 ln (25)

10

9. Usando aproximação de Taylor de primeira ordem 𝑓(𝑥! + Δ𝑥) ≅ 𝑓(𝑥!)+ 𝑓′(𝑥!)Δ𝑥

calcule aproximadamente 15.8! .

11

10. Determine os autovalores e auto-vetores de matriz simétrica 𝐴 = 𝑎 𝑏

𝑏 𝑎 , com 𝑎 > 0 e 𝑏 real.

12

Questões da Área de Ciência da Computação 1. Dadas duas listas encadeadas (sem cabeça), cada uma delas contendo uma sequência de números inteiros estritamente crescentes, escreva uma função (pseudocódigo) que intercale essas duas listas de tal forma que a lista resultante também seja uma sequência de números estritamente crescente. Sua função não deve alocar novas células na memória, mas reaproveitar as células das duas listas dadas.

13

2. Existem oito sacos sendo que sete delas contêm bolas pesando cinco gramas cada bola e apenas um saco contendo bolas de quatro gramas cada. Você tem a disposição uma balança digital. Descreva uma estratégia para que, com apenas uma pesagem, descubra qual o saco que contém bolas de quatro gramas. Cada saco contém tantas bolas quanto se queira.

14

3. Para cada uma das afirmações a seguir, indique se é “verdadeira” ou “falsa”. Não é necessário justificar, mas a justificativa pode ajudá-lo a conseguir pontos parciais. a) 200𝑛! = Ω(𝑛!)

b) 3!/! = 𝑂(3!)

c) 𝑛! + 𝑛! = 𝑂(𝑛!)

d) 𝑛log 𝑛 + 𝑛! = Θ(𝑛!)

e) 1 2 𝑛! = Θ(𝑛!)

15

4. Para os itens de (a) à (c), considere a seguinte árvore binária:

a) Liste a sequência de vértices visitados usando o algoritmo de percurso em pré-ordem.

b) Liste a sequência de vértices visitados usando o algoritmo de percurso em ordem simétrica.

c) Liste a sequência de vértices visitados usando o algoritmo de percurso em pós-ordem.

d) Qual o número máximo de nós de uma árvore binária de altura 𝑑?

e) Qual a altura mínima de uma árvore binária contendo 𝑛 nós?

A

B

D E

G H I

C

F

J

16

5. Para demonstrar que um problema X é NP-completo, precisamos executar 2 passos: 1) demonstrar que X pertence a classe NP; 2) demonstrar “algo” sobre a complexidade de X. Para (1), explique o que é a classe NP e como podemos demonstrar que X pertence a ela. Para (2), elucide o que é o “algo” do enunciado.

17

6. Apresente um diagrama de estados de um autômato finito determinístico para a seguinte linguagem sobre o alfabeto {0,1}: L = {w| todos os zeros consecutivos de w tem um numero par de zeros}. Exemplos: 1001000011, 001100001, 1 pertencem a L; 0, 101, 101001 não pertencem a L.

18

7. O que o termo trashing significa no contexto de sistemas operacionais?

19

8. No algoritmo de Peterson (pseudo-código abaixo) é viável trocar a ordem das duas primeiras instruções? Explique. // shared variable bool flag[0] = {false}; bool flag[1] = {false}; int turn; //thread 0 P0: flag[0] = true; // first instruction P0_gate: turn = 1; // second instruction while (flag[1]== true && turn == 1) { // busy wait } // critical section ... // end of critical section flag[0] = false; //thread 1 P1: flag[1] = true; // first instruction P1_gate: turn = 0; // second instruction while (flag[0]==true && turn == 0) { // busy wait } // critical section ... // end of critical section flag[1] = false;

20

9. Usando o modelo Entidade-Relacionamento (ER), construa um diagrama de esquema conceitual para o banco de dados de uma empresa locadora de veículos caracterizada a seguir. Indique no diagrama as chaves para as entidades e as restrições de participação e de cardinalidade para os relacionamentos.

Na locadora, um veículo de locação é identificado por sua placa, mas

possui outras informações importantes como número do chassis, cor, modelo e marca. Além disso, todo veículo é classificado de acordo com uma tabela de tipos da locadora. Por exemplo, o tipo A3 corresponde a automóveis pequenos, de quatro portas e com ar-condicionado, enquanto o tipo B1 corresponde a automóveis médios, com quatro portas e câmbio automático. Um tipo de automóvel define o tamanho (pequeno, médio ou grande), o número de portas e os acessórios disponíveis, que podem ser: ar-condicionado, rádio, GPS e câmbio automático. Para alugar um veículo, um cliente primeiro faz uma reserva (por telefone ou no site da locadora) onde define as datas de início e término da locação, o tipo de veículo que deseja alugar, a filial de retirada e a filial de devolução do veículo. E somente na retirada do veículo o cliente é “associado” a um veículo real, disponível na filial de retirada. A locadora tem uma grande rede de filiais. De suas filiais, a locadora registra nome, número de identificação, endereço e telefones de contato. E de seus clientes, a locadora registra nome, data de nascimento, telefones e CPF.

A partir do banco de dados da locadora, deve-se poder obter as seguintes informações: (i) a lista dos veículos disponíveis em cada filial na data corrente; (ii) a lista de reservas de locação ainda não atendidas em cada filial; (iii) os veículos presentemente alugados por cada filial, as suas respectivas filiais de entrega (caso sejam diferentes das de locação) e datas de entrega previstas; (iv) os cliente, as datas e locais de retirada e entrega de todas as locações já feitas na locadora.

21

22

10. Considere o esquema relacional a seguir, pertencente a um banco de dados (simplificado) de estudos clínicos. Os atributos que compõem a chave primária de cada relação aparecem sublinhados. Estudo(idE, nomeE, descricaoE, data_inicio, data_fim, idP_responsavel) → Estudo(idP_responsavel) é uma chave estrangeira para Pessoa(idP) Pessoa(idP, nomeP, data_nascimento, afiliacao, telefone) SujeitoEstudo(idP,idE) → SujeitoEstudo(idP) é uma chave estrangeira para Pessoa(idP) → SujeitoEstudo(idE) é uma chave estrangeira para Estudo(idE) PassoProtocolo(idE, num_sequencia, descricaoPP) → PassoProtocolo(idE) é uma chave estrangeira para Estudo(idE) Coleta(idC, idP, idE, num_sequencia, data_coleta, descricaoC, arquivo_dados) → Coleta(idP, idE) é uma chave estrangeira para SujeitoEstudo(idP,idE) → Coleta(idE, num_sequencia) é uma chave estrangeira para PassoProtocolo(idE, num_sequencia) Nesse banco de dados são armazenados dados dos estudos clínicos realizados em um laboratório de pesquisa em biomedicina de uma universidade. Todo estudo tem um pesquisador responsável por ele. Os sujeitos (“cobaias” humanas) dos estudos são estudantes ou funcionários da própria universidade. Cada estudo segue um protocolo experimental, que é uma sequência de passos que norteiam a execução do estudo. A aplicação de um passo do protocolo experimental de um estudo sobre um sujeito pode resultar em coletas de dados. Usando como base as relações acima, escreva cada uma das seguintes consultas na linguagem SQL:

23

a) Para estudos que possuem a palavra "Memória" no nome, mostrar o nome do estudo e o nome do pesquisador responsável.

b) Para cada estudo, listar os passos de seu protocolo experimental. A lista deve conter tuplas do tipo [nome do estudo, descrição de um passo]. Os passos do protocolo de um mesmo estudo precisam ser listados um em seguida do outro, na sequência correta.

24

c) Para cada pessoa que participou como sujeito de mais de um estudo, mostrar o nome, a data de nascimento e a afiliação.

d) Para cada estudo, mostrar a data de início do estudo e a data da coleta de dados mais antiga realizada no estudo.

25

Questões da Área de Ciências Biológicas 1. a) Indique as semelhanças e diferenças na composição e estrutura entre moléculas de RNA e DNA.

b) Qual a ligação química que conecta os monômeros (nucleotídeos) para manutenção da sequência de bases dessas moléculas?

c) Quais as principais forças que estabilizam a estrutura tridimensional dessas moléculas?

26

2. Explique no que consiste os processos de replicação, transcrição e tradução.

27

3. Qual a diferença entre uma mutação silenciosa e não-silenciosa no DNA?

28

4. Os tamanhos (em pares de base) dos fragmentos de um plasmídeo circular digerido pelas seguintes enzimas de restrição são: EcoRI: 3000 HindIII: 2100, 900 BamHI: 3000 SalI: 2900, 100 BamHI + HindIII: 1100, 1000, 900 EcoRI + SalI: 1700, 1200, 100 EcoRI + BamHI: 2500, 500 Eco RI + HindIII: 1500, 900, 600 SalI + HindIII: 1800, 900, 200, 100 SalI + BamHI: 2200, 700, 100 Esquematize o mapa de restrição deste plasmídeo. No seu mapa, designe o sítio de EcoRI na posição 0 e indique a posição para cada um dos outros sítios.

29

5. Vírus de RNA codificam em seu genoma a enzima transcritase reversa (RT) que tem um papel essencial na replicação do vírus. Explique como esta enzima pode ser utilizada no laboratório em um protocolo para detecção de genes ativos utilizando a técnica de PCR?

30

6. Indique se as afirmações abaixo são verdadeiras ou falsas: a) Cada organismo possui um código genético próprio que o distingue dos demais organismos.

b) Como o código genético é degenerado, para cada um dos códons codificadores dos 20 aminoácidos encontrados nas proteínas existe um RNA transportador diferente.

c) Uma mutação em um trecho de DNA codificador sempre causa alteração na proteína traduzida.

d) Através de splicing alternativo uma mesma molécula de RNA pode codificar proteínas diferentes.

e) RNAs transportadores são as moléculas que levam os RNAs mensageiros do núcleo para o citoplasma.

f) A formação da ligação peptídica durante a síntese proteica é catalisada por uma ribozima localizada nos ribossomos.

31

7. Considere a seguinte sequência de um fragmento de DNA isolado de bactéria: 5' CTGATAAGGGATTTAAATTATGTGTCAATCACGAATGCTAATCGCTTAACACTTC 3' Assumindo que esta sequência corresponde a sequência da fita codificadora, qual seria a sequência de aminoácidos do polipeptídio produzido quando o mRNA transcrito deste gene for traduzido? Considere a primeira base como o início da transcrição. Indique as extremidades amino-terminal e carboxi-terminal do polipeptídio. Dicas: use a tabela do código genético no final da prova para responder essa questão e considere fase aberta de leitura aquela que começa com o códon de iniciação.

32

8. O gráfico abaixo mostra a variação da concentração de glicose e lactose em um meio de cultura de bactérias Escherichia coli ao longo do tempo. Sabe-se que a utilização de lactose como fonte de energia depende de enzimas (beta-galactosidase, lactose permease e transacetilase) codificadas no operon Lac e que a ativação transcricional desse operon ocorre através de um sistema regulatório sofisticado envolvendo proteínas ativadoras e repressoras, além de moléculas sinalizadoras.

a) O que o gráfico sugere sobre o consumo preferencial desses açúcares pela bactéria ao longo do tempo?

b) Considerando os mecanismos de regulação do operon Lac, indique no gráfico os níveis relativos de transcrição dos genes (ex: zero, muito baixo, baixo, alto, muito alto) deste operon nos pontos temporais indicados pelas setas.

1 2 3

% d

a qu

antid

ade

inic

ial Glicose .......

Lactose ____

33

c) Faça um esquema do operon Lac, indicando todos os elementos que compõem e regulam o operon.

d) Qual o papel e quais os níveis de transcrição do repressor lacI ao longo do tempo?

e) Qual o papel do AMP cíclico (cAMP) nesta regulação? Quais os níveis relativos de cAMP ao longo do tempo de cultura?

34

f) Qual o papel da proteína CRP (ou CAP) no mecanismo de repressão pelo catabólito que atua sobre o operon Lac? Por que este mecanismo é importante?

35

9. Qual a diferença entre uma biblioteca genômica e uma biblioteca de cDNA? A presença de íntrons em genes eucarióticos dificulta a produção de produtos proteicos codificados por estes genes quando a expressão é feita em bactéria. Como se pode resolver este problema?

36

10. Considere o seguinte parágrafo: "Na realidade, não há sentido algum em se escrever 'gene da Hemoglobina'. A hemoglobina dos mamíferos adultos é uma molécula complexa, constituída por duas cadeias de globina alfa, duas cadeias de globina beta e um grupo Heme. As globinas são cadeias polipeptídicas, enquanto o grupo Heme resulta da coordenação de um íon ferroso em uma cadeia orgânica heterocíclica, a porfirina. As globinas, como os próprios nomes sugerem têm uma estrutura globular, formada por oito hélices alfa, sem a presença de cadeias beta. As globinas alfa e beta possuem várias diferenças em suas sequências de resíduos de aminoácidos, sendo que as globinas alfa possuem 141 resíduos e as globinas beta 146 resíduos. Assim, há pelo menos dois genes envolvidos na codificação das cadeias polipeptídicas e toda uma via metabólica implicada na síntese da porfirina, com muitos genes responsáveis pela síntese das diferentes enzimas participantes desta via. Finalmente, não se pode dizer que possa haver um gene para o íon ferroso." Transcreva o(s) trecho(s) que referem a: a) estrutura primária

b) estrutura secundária

c) estrutura terciária

37

d) estrutura quaternária

e) grupo prostético