prova de admissão do programa inter-unidades em ... área e 3 (três) de outra(s) área(s)....

31
1 Prova de Admissão do Programa Inter-unidades em Bioinformática 17 de Novembro de 2017. NOME: _______________________________________________________ A prova contém 30 (trinta) questões divididas em 3 (três) áreas do conhecimento (matemática/estatística, ciência da computação, ciências biológicas). Você deverá responder um total de 10 (dez) questões, sendo obrigatoriamente um mínimo de 7 (sete) de uma única área do conhecimento. Caso deseje, você pode responder as 10 (dez) questões de uma área, se preferir, pode também responder 7 (sete) questões de uma área e 3 (três) de outra(s) área(s). Responda cada questão dentro do quadrado correspondente. Respostas fora do quadrado correspondente não serão consideradas. A prova pode ser feita a lápis. Boa prova! Duração: 3 horas

Upload: hoangdung

Post on 09-Dec-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

1

Prova de Admissão do Programa Inter-unidades em Bioinformática

17 de Novembro de 2017. NOME: _______________________________________________________ A prova contém 30 (trinta) questões divididas em 3 (três) áreas do conhecimento (matemática/estatística, ciência da computação, ciências biológicas). Você deverá responder um total de 10 (dez) questões, sendo obrigatoriamente um mínimo de 7 (sete) de uma única área do conhecimento. Caso deseje, você pode responder as 10 (dez) questões de uma área, se preferir, pode também responder 7 (sete) questões de uma área e 3 (três) de outra(s) área(s). Responda cada questão dentro do quadrado correspondente. Respostas fora do quadrado correspondente não serão consideradas. A prova pode ser feita a lápis. Boa prova! Duração: 3 horas

2

Questões da Área de Matemática e Estatística 1. Um pesquisador dispõe de 92 estudantes a serem alocados aleatoriamente aos grupos G1 ou G2. Ele decide lançar uma moeda e, na ocorrência de “cara” o estudante será alocado a G1, caso contrário a G2. Os seguintes resultados foram obtidos:

Número de estudantes

G1 35 G2 57 Total 92

a) Com base nesses dados estime a probabilidade 𝜋 de ocorrência de “cara” da moeda.

b) Obtenha o intervalo de 95% de confiança para 𝜋.

c) Com base nos resultados você diria que a moeda é honesta (𝜋=0,50)? Justifique. Considere que:

𝑃(𝑍 ≤ 1,645) = 0,95 e 𝑃(𝑍 ≤ 1,960) = 0,975, Z variável normal padrão.

𝑋~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙 𝑛,𝜋 ;𝑝𝑎𝑟𝑎 𝑛 𝑔𝑟𝑎𝑛𝑑𝑒: 𝑝 =𝑋𝑛 ~𝑁(𝜋,

𝜋 1− 𝜋𝑛 )

3

2. O intervalo 1,65 ± 0,20 é o intervalo de 95% de confiança construído a partir de uma amostra de tamanho 100, para a média µM da altura (em metros) de mulheres de uma população. a) Com base nesse intervalo, qual seria a decisão do teste da hipótese H0: µM =1,87 versus H1: µM ≠1,87? Justifique.

b) Suponha que nessa população, as alturas, tanto de homens como de mulheres, sigam uma distribuição normal com desvio padrão igual a 0,80m. Considerando que em uma amostra de 80 homens dessa população foi observada uma média de altura de 1,87m, encontre o intervalo de 95% de confiança para a média populacional µH da altura (em metros) de homens.

c) Há evidência amostral de diferença significante entre as médias de alturas de homens e mulheres? Justifique.

Considere que: 𝑃(𝑍 ≤ 1,645) = 0,95 e 𝑃(𝑍 ≤ 1,960) = 0,975, Z variável normal padrão.

4

3. Um pesquisador está investigando variáveis associadas com a expressão de um gene. Com essa finalidade, o seguinte modelo foi adotado:

y = β0 + β1x1 + β2x2 + β3x1x2 + e em que y corresponde à intensidade de expressão do gene, x1 (=0, 1, 2) representa o número de alelos G em um marcador molecular, x2 é uma variável indicadora de hipertensão (0=normotenso e 1=hipertenso) e e é um erro aleatório com média zero e variância constante.

Indique FALSO ou VERDADEIRO, e justifique, as seguintes afirmações:

a) β0 é a intensidade de expressão esperada do gene, independentemente das demais variáveis.

b) β1 indica a variação esperada na intensidade de expressão correspondente à mudança de uma unidade no número de alelos G, independentemente da outra variável.

c) β3=0 indica que retas paralelas explicam o efeito de x1 sobre y para normotensos e hipertensos.

5

4. Em um experimento o pesquisador acompanhou por 30 dias a causa das internações hospitalares (devido à doença A ou à doença B). Ao final desse período o seguinte resultado foi obtido, classificado segundo o gênero do paciente:

Gênero Doença A Doença B Total Masculino 150 92 242 Feminino 90 206 296

Total 240 298 538 a) Com base nos dados, qual é a probabilidade de internação devido à doença A de acordo com o gênero do paciente?

b) Considere π a probabilidade de um evento ocorrer. A chance do evento é definida como π/(1-π). Com base na amostra obtida, calcule a razão de chances de internação devido à Doença A entre masculinos e femininos.

c) Interprete o valor obtido em b).

6

5. Sejam X, Y e Z variáveis aleatórias quaisquer, e a, b, c e d constantes. Responda: a) Quando cor(aX + b, cY + d) = cor(X, Y)? (cor é o operador correlação)

b) Quando var(X + Y) = var(X) + var(Y) ? (var é o operador variância)

c) var(X + MX) é maior, menor ou igual à var(X)? (MX o valor esperado de X)

7

6. Encontre os intervalos de convergência para a representação em série de Taylor de: a) 𝑔 𝑡 = 𝑒!

b) 𝑔 𝑡 = ln (𝑡)

8

7. Interprete a solução e dê um exemplo de aplicação da equação diferencial: f ''(t) = -af(t).

9

8. Calcule: a) 2 lg 0.1 + 3ln (𝑒!); lg: logaritmo na base 10, ln: logaritmo na base e

b)

2 ln 3𝑒 − ln (9)

3 ln 5𝑒 − 32 ln (25)

10

9. Formule o problema tratado em PCA – Principal Component Analysis e sua relação com a teoria espectral de matrizes simétricas.

11

10. Uma matriz simétrica A é positiva definida se, e somente se, 0>ʹAxx , sendo x um vetor não nulo . Neste caso, a forma quadrática associada à matriz A também é positiva definida. a) Determine a matriz A associada à forma quadrática ( ) 21

22

2121 233, xxxxxxf ++= .

b) Verifique se ( )21, xxf é positiva definida.

12

Questões da Área de Ciência da Computação

1. Mostre um autômato finito determinístico que opera sobre o alfabeto Σ = {a,b} e que aceita cadeias do seguinte tipo: um ou mais a’s seguido de zero ou mais b’s. Por exemplo, as cadeias aaa e aab são aceitas pelo autômato, mas as cadeias bb, bbaa,aabba não são.

13

2. Qual é o algoritmo mais eficiente para ordenar n números inteiros, supondo que cada número representa a idade de uma pessoa? Esboce o algoritmo e faça sua análise de complexidade.

14

3. Suponha um grafo orientado e ponderado, com pesos não negativos. Sobre um tal grafo podemos imaginar os dois seguintes problemas: (a) achar o caminho mais curto (ou mais leve) de um vértice u a um vértice v; (b) achar o caminho mais longo (ou mais pesado) (sem repetição de vértices) de um vértice u a um vértice v. O peso de um caminho é a soma dos pesos de suas arestas. Pergunta: os dois problemas podem ser resolvidos de forma eficiente? Justifique sua resposta.

15

4. Qual é a técnica que se usa para a análise da complexidade de algoritmos recursivos? Dê um exemplo (de algoritmo recursivo e de aplicação da técnica a ele).

16

5. Dada uma turma T com n alunos e as relações de amizade entre pares de alunos, queremos determinar quantas panelinhas existem na turma. Um aluno X não pertence a uma panelinha P se X não tem relação de amizade com nenhum aluno que pertence a P; do contrário, X pertence a P. Apresente um algoritmo eficiente para determinar as panelinhas de T. As relações de amizade são simétricas: se X é amigo de Y então Y é amigo de X. Você deve considerar que cada aluno é amigo de si mesmo, portanto panelinhas de um único aluno são possíveis. Note que um membro de uma panelinha P não necessariamente é amigo de todos os demais membros de P; basta um.

17

6. Apresente um pseudo-código da função pop(P,x) para uma pilha P. Se a pilha estiver vazia, pop devolve ‘falso’. Caso contrário ela devolve ‘verdadeiro’, coloca em x o valor do topo da pilha, e atualiza a pilha. Suponha que P é um vetor.

18

7. Apresente uma expressão regular que gera cadeias de 0’s e 1’s em que o número de 0’s consecutivos e o número de 1’s consecutivos é sempre par. Exemplos de cadeias que devem ser geradas: 0011, 11110011, 0000. Exemplos de cadeias que não devem ser geradas: 00011, 11011. Você pode usar apenas os operadores * (repetição de zero ou mais vezes), | (alternação entre caracteres), concatenação de caracteres e os parênteses para agrupar caracteres.

19

8. Existem oito sacos sendo que sete delas contêm bolas pesando cinco gramas cada bola e apenas um saco contendo bolas de quatro gramas cada. Você tem a disposição uma balança digital. Descreva uma estratégia para que, com apenas uma pesagem, descubra qual o saco que contém bolas de quatro gramas. Cada saco contém tantas bolas quanto se queira.

20

9. Dada uma árvore binária de busca de inteiros, mostre a estrutura da árvore após cada um dos valores 5, 2, 4, 7, 8, 1, 3 serem inseridos e depois mostre a mudança no resultado da árvore quando 2 é removido.

21

10. Para cada uma das afirmações a seguir, responda verdadeiro ou falso. a) O algoritmo de Prim usa Union-find como estrutura de dado.

b) No Union-find com compressão de caminho, após realizarmos uma operação de Find-Set(x), a altura da árvore que x está sempre diminui.

c) Na melhor implementação possível da estrutura de dado Union-find, o custo no pior caso para cada operação é O(log n).

d) Na melhor implementação possível do Union-find, o custo no pior caso para a operação de Make-set é O(1).

22

Questões da Área de Ciências Biológicas 1) O fluxo da informação genética envolve os processos denominados replicação, transcrição e tradução. a) Justifique essa afirmação, indicando o papel de cada um desses processos na transmissão de informação em sistemas biológicos.

b) Indique quais as principais moléculas (substratos, produtos e catalizadores) envolvidas em cada um dos processos.

23

2) Como os grupos polares e apolares se distribuem na estrutura terciária de proteínas globulares?

A maioria das proteínas globulares são desnaturadas por uma breve exposição a 65oC, mas algumas delas que possuem resíduos de cisteína em sua cadeia devem ser aquecidas por mais tempo e a temperaturas mais altas para desnaturarem. Qual a base molecular dessa propriedade? Como a desnaturação dessas proteínas com resíduos de cisteína poderia ser facilitada?

24

3) Esquematize a estrutura típica de um gene eucariótico contendo 3 exons. Indique no esquema e explique por escrito a função dos elementos regulatórios mais importantes para: a) o controle da transcrição do DNA b) o processamento do RNA para dar origem ao RNA mensageiro maduro c) o início da tradução da proteína a partir do mRNA maduro

25

4) Explique porque a replicação do DNA é semiconservativa, bidirecional e semidescontínua.

26

5) Os 20 aminoácidos que compõem as proteínas são codificados por 61 códons diferentes. No entanto, apenas 32 RNAs transportadores distintos são suficientes para reconhecer todos os 61 códons e garantir a síntese de proteínas. Explique esse aparente paradoxo utilizando seus conhecimentos sobre o mecanismo de leitura do código genético.

27

6) Qual a diferença entre mutações genéticas e modificações epigenéticas do genoma? Dê um exemplo de um tipo de modificação epigenética frequente e explique o seu papel no controle da expressão gênica.

28

7) A sequência de DNA abaixo contem o gene que codifica para a cadeia A da insulina humana. Os códons de início e fim da região codificadora estão sublinhados e em negrito. 5’AGCCCTCCAGGACAGGCTGCATCAGAAGAGGCCATCAAGCAGATCACTGTCCTTCTGCCATGGCCCTGTGGATGCGCCTCCTGCCCCTGCTGGCGCTGCTGGCCCTCTGGGGACCTGACCCAGCCGCAGCCTTTGTGAACCAACACCTGTGCGGCTCACACCTGGTGGAAGCTCTCTACCTAGTGTGCGGGGAACGAGGCTTCTTCTACACACCCAAGACCCGCCGGGAGGCAGAGGACCTGCAGGTGGGGCAGGTGGAGCTGGGCGGGGGCCCTGGTGCAGGCAGCCTGCAGCCCTTGGCCCTGGAGGGGTCCCTGCAGAAGCGTGGCATTGTGGAACAATGCTGTACCAGCATCTGCTCCCTCTACCAGCTGGAGAACTACTGCAACTAGACGCAGCCCGCAGGCAGCCCCACACCCGCCGCCTCCTGCACCGAGAGAGATGGAATAAAGCCCTTGAACCAGCAAAA3’a) Forneça a sequência de um par de oligonucleotídeos iniciadores apropriados para a amplificação do gene da insulina. Marque na sequência acima o local de anelamento de cada iniciador.

b) Faça um esquema ilustrando a amplificação da região pretendida ao longo do 1º ciclo da PCR. Indique a orientação das fitas de DNA no esquema.

c) quantas vezes a quantidade inicial de DNA seria amplificada após 10 ciclos de PCR?

d) Que procedimento prévio seria necessário para amplificar o gene da insulina por PCR a partir de RNA isolado de uma linhagem celular?

29

8) Nas duas colunas listadas abaixo há uma série de termos relacionados. Faça a ligação entre os nomes constantes da coluna da esquerda com um único termo na coluna da direita. RNA polimerase vetor primase tradução HindIII RNA mensageiro de eucarioto intron holoenzima 5’ cap metilação de RNA mensageiro plasmídeo promotor AUG endonuclease de restrição TATA box splicing Poli A replicação Shine-Dalgarno RNA ribossômico de procarioto

30

9) Compare a expressão gênica em procariotos e eucariotos quanto ao: a) grau de acoplamento da transcrição e da tradução. b) número de produtos gênicos em um transcrito primário. c) número de proteínas resultantes da tradução de um transcrito primário. d) controle por fatores de transcrição protéicos e) organização de genes em operons.

31

10) Quais são os principais elementos necessários para a transcrição de genes presentes na sequência de DNA de eucariotos? Descreva a função desses elementos e o seu papel no controle da expressão gênica durante a diferenciação e desenvolvimento em organismos multicelulares.