quinta-feira, 27 de janeiro de 2011

047-2005

MO640 - Questão para a prova oral 

Número: 047

Enunciado:
Todo "match" retornado pelo BLAST vem acompanhado de uma pontuação (bit score) e de um valor que denota significância estatística (e-value). Com respeito ao e-value, é INCORRETO afirmar que:
  1. É calculado através de método desenvolvido por Karlin e Altschul.
  2. É uma medida de significância estatística do "match", que é independente do BLAST ou de qualquer outro algoritmo.
  3. Quanto maior o e-value, mais significativo é o alinhamento.
  4. É dependente da quantidade total de caracteres das sequências sendo comparadas.
  5. NDA
Ideia original de Karina Zupo de Oliveira

Um comentário:

  1. A resposta dessa questão é a alternativa c, pois é a única falsa. Abaixo seguem as justificativas.

    a) VERDADEIRA.

    O artigo onde o trabalho foi publicado é o "Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes (Proc. Natl. Acad. Sci. USA. Vol. 87, pp. 2264-2268, March 1990)".

    b) VERDADEIRA.

    O cálculo do e-value é obtido diretamente de uma fórmula numérica precisa (item d), construída dentro de uma teoria matemática. Os teoremas e definições dessa teoria encontram-se no artigo de Karlin e Altschul citado no item anterior. Portanto, é realmente independente de qualquer algoritmo.

    Por “significância” leia-se “significativo do ponto de vista biológico”. Em outras palavras, há a chance de dois fragmentos, tomados ao acaso na base de dados, obterem um alto score e ainda sim não possuírem nenhum relacionamento. O e-value ajuda a identificar a ocorrência desse mal entendido.

    Ele de fato pode ser classificado como “uma medida estatística”, pois está relacionado a uma probabilidade (veja explicação no item abaixo).

    c) FALSA

    Seja um par de fragmentos A e B com um score de valor Sab. Imagine que, aleatoriamente, encontremos um fragmento C que, comparado ao A, leve a um score Sac >= Sab, ou seja, igual ou melhor que o anterior.

    O fato de termos encontrado o fragmento C de maneira aleatória e, ainda sim, obtermos um score no mínimo igual, indica que há o risco dos fragmentos A e B não possuírem nenhum relacionamento do ponto de vista biológico.

    O e-value está associado justamente à probabilidade de encontrar o tal fragmento C. Se o e-value é baixo, a chance de encontrarmos um C é baixa e o alinhamento entre A e B é mais confiável.

    Portanto, a relação é inversa, ou seja, quanto MENOR o e-value, MAIS significativo é o alinhamento, tornando essa alternativa falsa.

    d) VERDADEIRA

    A fórmula do e-value é

    E(S) = mnKH exp(-LS),

    onde exp() é a função exponencial. O parâmetro m é o tamanho da sequência associada à consulta (fragmento A do item anterior), e o n é o tamanho das sequências restantes na base de dados.

    Como o e-value depende tanto de m quanto de n, depende da quantidade total de caracteres das sequências sendo comparadas, fazendo com que a afirmação dessa alternativa seja verdadeira.

    ResponderExcluir