Número: 054
Enunciado:
Considere as seguintes afirmações relacionadas à ferramenta BLAST:
I - O BLAST procura por similaridades locais entre uma seqüência âncora e uma lista de seqüências.
II - O e-value depende também do tamanho total da lista de seqüências que serão comparadas com a âncora.
III - Em buscas contra a mesma lista de seqüências, quanto menor o e-value, melhor é o alinhamento.
Qual ou quais afirmações são verdadeiras?
- I e II.
- II e III.
- I e III.
- Apenas a I.
- NDA
A opção I é verdadeira pois, o BLAST procura um segmento ou uma âncora, como citado, em um banco de dados ou uma coleção de sequências. A procura é feita em ambas as direções, sendo esta âncora uma subcadeia, buscando um alinhamento local.
ResponderExcluirO e-value, é um parâmetro estatístico, desenvolvido por Karlin e Altschul, que é utilizado no BLAST para dar maior confiabilidade ao score obtido no alinhamento das sequências. Quanto mais próximo de zero for o seu valor, menor a probabilidade de ser encontrada uma outra sequência de mesmo tamanho e composição da região em questão, aumentando assim sua confiabilidade. Para se obter o e-value, são utilizados os parâmetros Kmne^(-λS), onde:
K é uma constante calculada, dependendo da probabilidade de ocorrência e da pontuação entre as combinações das sequências;
m é o tamanho da sequência de consulta;
n é o tamanho das sequências do banco de dados;
λ é uma constante obtida por um método de Newton; e
S é o valor do custo da região de similaridade.
Pela dependência do parâmetro n, a opção II é verdadeira e, o e-value menor, significa um melhor alinhamento, confirmando a veracidade da opção III.
Sendo as três verdadeiras, alternativa correta é a d, NDA.
Caro Alexandre,
ResponderExcluirBom comentário, mas vejo alguns detalhes que poderiam ser melhorados.
No momento em que você fala "em ambas as direções", certamente está pensando em DNA, mas lembre-se que BLAST também é usado com proteínas. Neste caso, não há duas direções.
Quando você fala que o e-value foi desenvolvido por Karlin e Altschul, na verdade sua frase dá a entender que eles criaram a noção de e-value, além de aplicá-la ao BLAST. É realmente verdade que eles resolveram a questão (parcialmente) no caso do BLAST, mas a noção de e-value, que significa "expected value", é muito antiga. Portanto, sua frase pode levar a mal-entendidos.
Quando você explica o que significa um valor de e-value próximo do zero, usa a palavra "composição" para referir-se a regiões de sequencias, mas tenha em mente que esta palavra geralmente significa apenas frequencia de residuos nas sequencias, enquanto que aqui queremos nos referir não só à compição, mas também à ordem em que os residuos aparecem. Seria melhor ter usado "match" ou "alinhamento".
Por fim, você usa "os parâmetros" em vez de "fórmula" para referir-se a Knme^(-lS), o que considerei também uma falha.
Nota 6,0 (seis).