54º Congresso Brasileiro de Genética
Resumos do 54º Congresso Brasileiro de Genética • 16 a 19 de setembro de 2008
Bahia Othon Palace Hotel • Salvador • BA • Brasil
www.sbg.org.br - ISBN 978-85-89109-06-2
Eficiência de índices de similaridade em
diversidade genética para dados moleculares
na presença de perdas de dados
Nascimento, M1; Campana, ACM1; Salgado, CC2, Ferreira, A2, Cruz, CD2
Laboratório de Bioinformática – BIOAGRO, Departamento de Informática – Área de Estatística, Universidade Federal de Viçosa
2
Laboratório de Bioinformática – BIOAGRO, Departamento de Biologia Geral, Universidade Federal de Viçosa
[email protected]
1
Palavras-chave: Correlação cofenética, agrupamento hierárquico, matriz de dissimilaridade
Os recentes avanços na biologia molecular abriram novas perspectivas para a pesquisa em conservação de espécies
e para os estudos de biologia populacional. Com a utilização de marcadores moleculares é possível a detecção da
variabilidade existente diretamente ao nível do DNA (Cruz, 2008). Estudos de diversidade podem atingir um grande
número de informação devido à disponibilidade de elevado número de marcas genéticas, que têm a vantagem de não
serem influenciadas pelo ambiente (Ferreira e Grattapaglia, 1998). Entretanto, na prática, um problema comum é a
perda de dados. Neste contexto, este trabalho teve como objetivo avaliar a eficiência de índices de similaridade em
diferentes níveis de dados perdidos. Foram avaliados os índices não ponderado, ponderado e d 2 de Smouse e Peakall
(d 2) utilizando-se marcadores de natureza co-dominantes multialélica. E o de distância binária de Sokal (DBS), Jaccard
e Dice para marcadores de natureza dominantes. Para a comparação utilizou-se o coeficiente de correlação cofenética
(CCC) e a significância entre estes, foi realizada através da estatística qui-quadrado. Foram simuladas quatro populações,
duas com estrutura genética definida e duas com estrutura genética não definida, sendo uma de natureza co-dominante
e outra de natureza dominante, em relação a estrutura das populações. Destas populações iniciais foram geradas as
populações com níveis de perdas de dados de 0 a 60 %. Considerando as populações de estrutura genética definida com a
utilização de marcadores co-dominante observou-se que os índices ponderado e não ponderado apresentaram diferenças
significativas a um nível de 5% de significância apenas quando o percentual de perdas excede 45%, já o índice d 2 não
apresentou diferenças significativas entre os CCC para os diferentes percentuais de perda. Ainda para as populações de
estrutura genética definida, quando se utilizou marcadores dominantes os índices DBS e Jaccard apresentaram diferenças
significativas em níveis de perdas que excedem 45% e o índice Dice não apresentou diferenças significativas. No caso
onde a população não tem estrutura genética definida com marcadores co-dominantes todos os índices apresentaram
diferenças significativas quando o percentual de perdas excede 30%. Para as populações sem estrutura genética definida
utilizando marcadores dominantes os índices de Jaccard e Dice apresentaram diferenças significativas com o percentual
de perdas acima 45%, e o índice DBS não apresentou diferença entre os CCC. A partir destes resultados percebe-se
que, para níveis de perdas inferiores a 30%, os índices se comportam de forma eficiente e equivalente.
Apoio Financeiro: FAPEMIG.
145
Download

Eficiência de índices de similaridade em diversidade genética para