sexta-feira, 28 de janeiro de 2011

054-2005

MO640 - Questão para a prova oral

Número: 054

Enunciado:
Considere as seguintes afirmações relacionadas à ferramenta BLAST:
I - O BLAST procura por similaridades locais entre uma seqüência âncora e uma lista de seqüências.
II - O e-value depende também do tamanho total da lista de seqüências que serão comparadas com a âncora.
III - Em buscas contra a mesma lista de seqüências, quanto menor o e-value, melhor é o alinhamento.

Qual ou quais afirmações são verdadeiras?
  1. I e II.
  2. II e III.
  3. I e III.
  4. Apenas a I.
  5. NDA
Ideia original de Caroline Campos Frossard

2 comentários:

  1. A opção I é verdadeira pois, o BLAST procura um segmento ou uma âncora, como citado, em um banco de dados ou uma coleção de sequências. A procura é feita em ambas as direções, sendo esta âncora uma subcadeia, buscando um alinhamento local.

    O e-value, é um parâmetro estatístico, desenvolvido por Karlin e Altschul, que é utilizado no BLAST para dar maior confiabilidade ao score obtido no alinhamento das sequências. Quanto mais próximo de zero for o seu valor, menor a probabilidade de ser encontrada uma outra sequência de mesmo tamanho e composição da região em questão, aumentando assim sua confiabilidade. Para se obter o e-value, são utilizados os parâmetros Kmne^(-λS), onde:

    K é uma constante calculada, dependendo da probabilidade de ocorrência e da pontuação entre as combinações das sequências;
    m é o tamanho da sequência de consulta;
    n é o tamanho das sequências do banco de dados;
    λ é uma constante obtida por um método de Newton; e
    S é o valor do custo da região de similaridade.

    Pela dependência do parâmetro n, a opção II é verdadeira e, o e-value menor, significa um melhor alinhamento, confirmando a veracidade da opção III.

    Sendo as três verdadeiras, alternativa correta é a d, NDA.

    ResponderExcluir
  2. Caro Alexandre,

    Bom comentário, mas vejo alguns detalhes que poderiam ser melhorados.

    No momento em que você fala "em ambas as direções", certamente está pensando em DNA, mas lembre-se que BLAST também é usado com proteínas. Neste caso, não há duas direções.

    Quando você fala que o e-value foi desenvolvido por Karlin e Altschul, na verdade sua frase dá a entender que eles criaram a noção de e-value, além de aplicá-la ao BLAST. É realmente verdade que eles resolveram a questão (parcialmente) no caso do BLAST, mas a noção de e-value, que significa "expected value", é muito antiga. Portanto, sua frase pode levar a mal-entendidos.

    Quando você explica o que significa um valor de e-value próximo do zero, usa a palavra "composição" para referir-se a regiões de sequencias, mas tenha em mente que esta palavra geralmente significa apenas frequencia de residuos nas sequencias, enquanto que aqui queremos nos referir não só à compição, mas também à ordem em que os residuos aparecem. Seria melhor ter usado "match" ou "alinhamento".

    Por fim, você usa "os parâmetros" em vez de "fórmula" para referir-se a Knme^(-lS), o que considerei também uma falha.

    Nota 6,0 (seis).

    ResponderExcluir