Número: 047
Enunciado:
Todo "match" retornado pelo BLAST vem acompanhado de uma pontuação (bit score) e de um valor que denota significância estatística (e-value). Com respeito ao e-value, é INCORRETO afirmar que:
- É calculado através de método desenvolvido por Karlin e Altschul.
- É uma medida de significância estatística do "match", que é independente do BLAST ou de qualquer outro algoritmo.
- Quanto maior o e-value, mais significativo é o alinhamento.
- É dependente da quantidade total de caracteres das sequências sendo comparadas.
- NDA
A resposta dessa questão é a alternativa c, pois é a única falsa. Abaixo seguem as justificativas.
ResponderExcluira) VERDADEIRA.
O artigo onde o trabalho foi publicado é o "Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes (Proc. Natl. Acad. Sci. USA. Vol. 87, pp. 2264-2268, March 1990)".
b) VERDADEIRA.
O cálculo do e-value é obtido diretamente de uma fórmula numérica precisa (item d), construída dentro de uma teoria matemática. Os teoremas e definições dessa teoria encontram-se no artigo de Karlin e Altschul citado no item anterior. Portanto, é realmente independente de qualquer algoritmo.
Por “significância” leia-se “significativo do ponto de vista biológico”. Em outras palavras, há a chance de dois fragmentos, tomados ao acaso na base de dados, obterem um alto score e ainda sim não possuírem nenhum relacionamento. O e-value ajuda a identificar a ocorrência desse mal entendido.
Ele de fato pode ser classificado como “uma medida estatística”, pois está relacionado a uma probabilidade (veja explicação no item abaixo).
c) FALSA
Seja um par de fragmentos A e B com um score de valor Sab. Imagine que, aleatoriamente, encontremos um fragmento C que, comparado ao A, leve a um score Sac >= Sab, ou seja, igual ou melhor que o anterior.
O fato de termos encontrado o fragmento C de maneira aleatória e, ainda sim, obtermos um score no mínimo igual, indica que há o risco dos fragmentos A e B não possuírem nenhum relacionamento do ponto de vista biológico.
O e-value está associado justamente à probabilidade de encontrar o tal fragmento C. Se o e-value é baixo, a chance de encontrarmos um C é baixa e o alinhamento entre A e B é mais confiável.
Portanto, a relação é inversa, ou seja, quanto MENOR o e-value, MAIS significativo é o alinhamento, tornando essa alternativa falsa.
d) VERDADEIRA
A fórmula do e-value é
E(S) = mnKH exp(-LS),
onde exp() é a função exponencial. O parâmetro m é o tamanho da sequência associada à consulta (fragmento A do item anterior), e o n é o tamanho das sequências restantes na base de dados.
Como o e-value depende tanto de m quanto de n, depende da quantidade total de caracteres das sequências sendo comparadas, fazendo com que a afirmação dessa alternativa seja verdadeira.