INCT: Informação Genético-Sanitária da Pecuária Brasileira SÉRIE TÉCNICA: GENÉTICA Publicado on-line em “www.animal.unb.br” em 07/01/2011 Estatísticas para descrever Genética de Populações Concepta McManus1, Samuel Paiva2, Patrícia Spoto Corrêa3, Luiza Seixas3, Cristiano Barros de Melo 3,4 1 Universidade Federal do Rio Grande do Sul, Departamento de Zootecnia, Av. Bento Gonçalves 7712, Porto Alegre, CEP 91.540-000 2 EMBRAPA Recursos Genéticos e Biotecnologia, Final W5 Norte, Brasília, DF, 70-770-900 3 Instituto Nacional de Ciência e Tecnologia – Informação Genético-Sanitária da Pecuária Brasileira, Universidade Federal de Minas Gerais 4 Universidade de Brasília (Unb), Faculdade de Agronomia e Veterinária (FAV), Brasília, DF. 1 Conteúdo Freqüências alélicas Heterozigosidade 4 4 Heterozigosidade Observada .............................................................. 5 Heterozigosidade Esperada (He) ......................................................... 5 Porcentagem de locos polimórficos (P) ................................................ 7 Número médio de alelos por loco (Â) .................................................. 8 Distância genética (D) ...................................................................... 8 Índice de identidade genética (Î) ........................................................ 9 Índice de fixação de WRIGHT (F) Estatística F (Wright, 1951) 10 11 FIT ................................................................................................ 11 FST ................................................................................................ 12 FIS ................................................................................................ 14 Fluxo Gênico (Nm) .......................................................................... 15 Testes de indicação (Assignment Tests): ........................................... 16 Estimativas do fluxo gênico entre as populações 16 Análogos ao FST .............................................................................. 20 Diversidade entre populações (DST) .................................................. 20 Coeficiente de divergência genética entre populações (GST). ................ 20 Índice de Shannon ......................................................................... 21 Definições ..................................................................................... 21 Calculando o índice ......................................................................... 22 Determinando a variabilidade individual e da população ...................... 22 Lei de Hardy-Weinberg ................................................................... 22 Tamanho efetivo (Ne) 26 Conteúdo de Informação Polimórfica (PIC) 31 Probabilidade de exclusão (PE) 31 Teste de Mantel (R) (Mantel, 1976) 33 Coeficiente de consangüinidade (F) .................................................. 34 Exemplo ........................................................................................ 34 2 Consangüinidade 37 Coeficiente de consangüinidade do individuo...................................... 38 Método Tabular de computar relacionamentos aditivos e de dominância entre animais ......................................................................................... 40 Programas de computador 42 Referências 45 3 Freqüências alélicas • Contagem direta dos alelos encontrados. • Assumindo que existe um estado ideal de equilíbrio Hardy-Weinberg (EHW), a variância de uma freqüência alélica: x é a freqüência alélica e n, o número de indivíduos das amostras. Heterozigosidade • Medida de variabilidade genética; • Considera-se um loco polimórfico quando o alelo mais comum tem freqüência inferior a 0,9; • A heterozigosidade de um marcador é a probabilidade de um indivíduo ser heterozigoto no loco marcador e depende do número de alelos e de sua freqüência na população; • A heterozigosidade observada é a proporção de indivíduos heterozigotos nas amostras da população; • A heterozigosidade média esperada ou a diversidade genética de um loco é equivalente à heterozigosidade observada, considerando-se apenas as populações em completo equilíbrio. 4 Heterozigosidade Observada • Determinação da proporção de genes que são heterozigotos e o número de indivíduos que são heterozigotos para cada gene em particular; • Para apenas um loco: Heterozigosidade observada = Nºde Heterozigotos em cada Loco nº total de indivíduos pesquisados Exemplo: 25 Heterozigotos = 0.25 100 indivíduos Sobre todos os locos: Exemplo: 5 locos onde H= Loco 1 25/100= 0.25 Loco 2 0/100 = 0.00 Loco 3 10/100 = 0.10 Loco 4 5/100 = 0.05 Loco 5 25/100 = 0.25 HO = (.25 + 0 + .10 + .05 + .25)/5 = 0.13 Heterozigosidade Esperada (He) • Heterozigose estimada como base NEI (1978): • Sendo Pi – a freqüência estimada do iésimo alelo. 5 A heterozigosidade média esperada foi obtida pela média aritmética de todos os locos estudados. • Definida como uma fração estimada de todos os indivíduos que poderiam ser heterozigóticos de um loco escolhido randomicamente; • He difere de Ho porque ela é uma previsão baseada na freqüência alélica conhecida, oriunda de amostras individuais; • Desvio observado esperado pode ser usado como um importante indicador da dinâmica populacional (ver princípio de Hardy-Weinberg, abaixo); • He é calculado com base na freqüência de alelos; o Por exemplo, para uma simples característica gênica com dois alelos, A e a, cujas freqüências são expressas como p(A) e q(a), onde p + q = 1, as freqüências de três genótipos possíveis são dadas pela seguinte equação: Exemplo: 80 indivíduos amostrados (160 alelos). Número de indivíduos observados com cada genótipo Freqüências de genótipos observados Freqüência de genótipo esperado Nota que: p2 + 2pq+q2 = 1 AA=10 A = ((2*10) + 10)/(2*80) p2=.0352 Aa= 10 =1875 2pq=.3046 aa=60 A=1-.1875 = .8125 q2=.6602 6 Homozigotos = p2 + q2 Heterozigotos = 2pq Heterozigosidade observada (Ho ) para cada loco: • A quantidade de heterozigose de um determinado loco seguiu os procedimentos de BROWN e WEIR (1983): Ho = 1-ΣPii • Sendo: Pii - a freqüência observada de genótipos homozigotos do alelo i; • A heterozigosidade média observada foi obtida pela soma dos valores de cada loco, dividindo-se pelo número total de locos estudados. Diversidade gênica esperada ou heterozigosidade esperada (He) para cada loco segundo Nei (1987) He = 1 – Σpi2 onde pi= freqüência alélica estimada do i-ésimo alelo; Estimativa média sobre os locos de Ho e He • Média aritmética entre todos os locos analisados; Porcentagem de locos polimórficos (P) • Média aritmética do número de locos polimórficos pelo número total de locos; 7 • Considerando-se como loco aquele cuja freqüência do alelo mais comum não ultrapassasse 95%; Número médio de alelos por loco (Â) • Divisão do número total de alelos pelo número total de locos; Distância genética (D) Estimativas de diferenciação genética - interpopulacional • Distância genética entre duas populações segundo NEI (1972): • Sendo (Î) - o índice de identidade genética; • D varia de 0 a infinito; I = Identidade genética (varia de 0 a 1); pix = freqüência do alelo i na população x piy = freqüência do alelo i na população y m = número de alelos por loco 8 estimadas • Se duas populações tem freq de alelos similar (pix ≈ piy); I≈1eD≈0 • Se duas populações não têm alelos em comum; I≈0eD≈1 Freqüência do loco Pgm (isoenzima) em duas pop de D. pulex Alelo Pgm Illinois Indiana F 0,146 0,491 M 0,818 0,106 S 0,036 0,403 I Illinois = 0,173 I Indiana = 0,323 D = 1,13 Índice de identidade genética (Î) • Índice de identidade genética (Î), segundo NEI (1972); • Baseia-se em freqüências alélicas de locos homólogos nas diferentes populações: sendo: 9 • Jxy, Jx e Jy, respectivamente, as médias aritméticas de jxy, jx e jy sobre todos os locos polimórficos e monomórficos; jxy = Σ • Probabilidade de 2 genes escolhidos ao acaso na população x, serem idênticos; jx = Σ • Probabilidade de 2 genes escolhidos ao acaso na população y, serem idênticos; jy = Σxiyi • Probabilidade de identidade de um gene da população x e um gene da população y, ser idênticos. Índice de fixação de WRIGHT (F) • WRIGHT (1965) ou o coeficiente de endogamia; • Estimado com base na heterozigosidade observada (Ho) e esperada (He). 10 Estatística F (Wright, 1951) • Utiliza coeficientes de endocruzamento para descrever a partição da variação genética dentro e entre populações (variabilidade intra e interpopulacional); FIT o Índice de fixação para a população; o Probabilidade total de identidade num determinado indivíduo I; • Medida de heterozigosidade de um indivíduo em relação ao total da população (todas as subpopulações combinadas); FIT = (Het– Ho)/ Het Ho = heterozigosidade observada (do indivíduo); He = heterozigosidade esperada da população total; FIT = FIS + FST 11 • Particionado o FST devido ao efeito Wahlund; o FIS devido a consangüinidade; Considera uma população com uma estrutura em dois níveis: • Do individuo (I) a subpopulação (S); • Da subpopulação ao total (T); O total F (FIT) pode ser dividido em FIS (ou f) e FST (ou θ): 1-FIT = (1-FIS)(1-FST) • Pode ser mais dividido para subestruturas da população; • De acordo com as regras de expansão binomial; • para I partições: • Relação da média da diferença de pares de cromossomos de FST indivíduos diplóides amostrados com a média obtida de uma amostragem aleatória de cromossomos de uma população (excluindo o agrupamento por indivíduo). • Considerar agrupamentos, como uma sub-população, ao invés de individuais. 12 • Geneticistas populacionais têm utilizado a medida do grau de estrutura de uma população; • Diversas definições para Fst, sugerem um fator de confusão na literatura científica; • Abaixo, uma definição mais comum: onde a variância de p é calculada através de sub-populações e p(1 −p) é a freqüência esperada de heterozigotos. • WRIGHT (1965); • Medindo a diversidade genética: o Índice de fixação para alelos por locos; o Probabilidade de que dois genes sejam homólogos; combinados ao acaso na população, originários de um gene na população; 13 ambos • Estimativa de diferenciação genética entre subpopulações - Mede o grau de isolamento das mesmas; • Populações isoladas não cruzam ao acaso, e devem apresentar algum grau de endogamia quando considerada em relação ao total da população; • Medida do grau de endocruzamento dentro de uma subpopulação em relação ao total da população (todas as subpopulações combinadas); FST = (Het – Hes)/ Het • Hes= heterozigosidade esperada se a população está em HWE (da subpopulação); • Het = heterozigosidade esperada da população total; • FST = 0 o As populações têm freqüência de alelos idênticas; • FST = 1 o As populações fixaram alelos diferentes. FIS o Índice de fixação que ocorre dentro de população; o Probabilidade de que dois genes sejam homólogos no indivíduo I, derivado do mesmo gene de um ancestral comum, dentro da população; 14 • Mede o grau de endocruzamento dentro de indivíduos em relação ao resto da sua subpopulação; • Reflete a probabilidade de que dois alelos dentro do mesmo indivíduo sejam idênticos por descendência; FIS = (Hes – Ho)/ Hes o Ho = heterozigosidade observada (do indivíduo); • He = heterozigosidade esperada se a pop. está em HWE (da subpopulação). Fluxo Gênico (Nm) • Nm= 0,5 (1-GST)/GST (McDermott e McDonald, 1993) i) Indireto: Estatística F FST = 1/ (4Nem + 1) Ne = tamanho efetivo da população m = taxa de migração entre populações m = 1/(N) Nem = número de adultos sexualmente maduros migrantes Nem = (1/FST - 1) /4 FST = 0, 009 Nem = (1/FST - 1)/4 15 que são Nem = (1/0,009 – 1)/4 = 27,5 27,5 indivíduos migrantes entre as duas populações por geração FST = 1/(4Nem + 1) Se m = 1/(N) – somente um indivíduo migrante por geração, Nem = 1, Fst = 0,20. Até um pequeno fluxo gênico mantém as populações similares em relação a freqüência de alelos • Muito usado; • Série de críticas; • Premissas improváveis; • No entanto, uma análise de 230 estudos com insetos fitófagos mostrou que os valores estimados de Nem, normalmente concordam com os dados obtidos pela marcação-recaptura. Testes de indicação (Assignment Tests): o Indica a origem de um indivíduo pertencente a uma provável população através da comparação dos seus genótipos com os perfis de várias populações. Estimativas do fluxo gênico entre as populações Nm = [(1/FST)–1] /4a 16 • Proposta por Crow e Aoki (1984); a = [n / (n–1)]2 • Nm o número de migrantes; • n o número de populações; • Variância: Hh = 2pNm. Fst = 1/(4Nem +1) Ne = tamanho efetivo da população; m = taxa de migração entre populações; Nem = número de adultos cruzantes que são migrantes. Numero de indivíduos Freqüência dos genótipos A1A1 A1 A2 A2A2 A1A1 A1 A2 A2A2 Subpopulação 1 352 63 12 0.824 0.148 0.028 Subpopulação 2 312 77 27 0.750 0.185 0.065 • Ho (heterozigosidade observada media) = (0,148 + 0,185)/2 = 0,167 • Hes (heterozigosidade esperada se a subpopulação HWE) – precisamos calcular p e q População 1 p = freqA1 = 0,824 + 0,148/2 = 0,898 q = freqA2 = 0,028 + 0,148/2 = 0,102 freqA1A2 = 2pq = 0,898 X 0,102 = 0,183 17 População 2 p = freqA1 = 0,750 + 0,185/2 = 0,842 q = freqA2 = 0,065 + 0,185/2 = 0,157 freqA1A2 = 2pq = 0,842 X 0,157 = 0,265 Hes = (0,183 + 0,265)/2 = 0,224 Het = heterozigosidade esperada para a população total (p1 +p2)/2 = (0,898 + 0,842)/2 = 0,871 (q1 +q2)/2 = (0,102 + 0,157)/2 = 0,130 HeT= 2pq = 2 (0,871) (0,130) = 0,226 FST = (HeT – Hes)/Het = (0,226 – 0,224)/0,226 = 0,009 Interpretando o FST • FST 0-0,05: indicativo de pouca (baixo nível) diferenciação genética; • FST 0,05-0,25: diferenciação genética moderada; • FST >0,25: nível alto de diferenciação genética; o Mesmo níveis representar muito níveis baixos importantes de FST podem de diferenciação genética; • 0 051 a 0, 150 - nível médio; • 0,151 a 0,250 um alto nível de diferenciação (Yeh 2000). 18 Segundo Wright (1978), o Há casos em que a estimativa de FST pode ser de 0, 050 ou menos, não implicando necessariamente em uma diferenciação genética negligível (Giles & Goudet 1997). • Rápidos ciclos de extinção e colonização afetam a estrutura genética de populações, onde freqüentes eventos de fundação (founder events) durante a colonização podem aumentar o valor de FST (Wright 1940); • Porém, este valor, depende do modo de colonização, isto é, da fonte que se originam os migrantes (Slatkin 1977). Slatkin (1977) desenvolveu duas variações ao modelo de ilha: o “propagule pool” (migrantes originados de uma ou poucas populações); o “migrant pool” (migrantes originados igualmente de amostras de várias populações – metapopulações); o O modelo “propagule pool”; Mais efetivo em aumentar o fluxo gênico entre populações; Diminui os componentes da diversidade genética tanto dentro de populações (HS), como entre populações (FST) - que o modelo “migrant pool”; 19 A probabilidade de identidade por descendência de um propágulo derivado de uma simples população é maior que um derivado de um grande número de populações (metapopulação). Análogos ao FST θ: equivalente ao FST que considera tamanhos desiguais de amostras RST • Desenvolvido para análises de microsatélites; • Assume o modelo SSM (stepwise – perda ou ganho de uma única repetição por vez). Diversidade entre populações (DST) • DST=Het-Hes Coeficiente de divergência genética entre populações (GST). • GST=DST/Het • Equivalente ao FST quando só existem dois alelos em um loco. Genetic evenness (E) • Calculado através da diversidade genética/ln richness individual (ln 27 = 3.296) (Nei, 1973, 1978). 20 Índice de Shannon • Índice Shannon-Weaver; • Índice do Shannon-Wiener; • Mede o grau de certeza em se preve a proximidade genética entre indivíduos; • Quanto menor o valor do índice de Shannon, menor o grau de incerteza e, portanto, a diversidade da amostra é baixa. A diversidade tende a ser mais alta quanto maior o valor do índice; • • Informação entropica da distribuição, tratamento das espécies como símbolos e o tamanho da respectiva população como uma probabilidade. Definições: • ni – O número dos indivíduos em cada espécie; a abundância de cada espécie; • S – O número de espécies. Chamado também de riqueza; • N – O número total de todos os indivíduos: • pi – A abundância relativa de cada espécie, calculada pela proporção dos indivíduos de uma espécie pelo comunidade: 21 número ; total dos indivíduos na Calculando o índice Aplicando o cálculo, que pode ser demonstrado para qualquer dado númerico de espécies, onde há um máximo possível , Hmax = lnS o qual ocorre quando todas as espécies que estão presentes ocorrem em igual número. Determinando a variabilidade individual e da população • Baseada em genética mendeliana; • Possível predizer a probabilidade de aparecimento de um alelo particular em filhos quando se conhece ambos os pais; • Pode se realizado também para populações; • Comparar freqüências esperadas e atuais ou observadas através de fatores externos (consanguinidade ou seleção). Lei de Hardy-Weinberg • Verificada por Hardy e Weinberg, em 1908; • Em uma população grande, com um acasalamento aleatório, sem seleção, mutação ou migração, as freqüências alélicas e genotípicas permanecem 22 constantes de geração a geração, considerando-se uma população em completo equilíbrio; • A constituição genética de uma população é descrita pela especificidade e a proporção dos diferentes alelos em cada loco; • Os desvios do EHW podem originar-se de fatores como: acasalamentos direcionados, subdivisões dentro das populações; coancestrais e antepassados comuns; seleção natural; migração ou fluxo de genes a partir de uma população externa; técnica de amostragem incorreta; e presença de alelos nulos não detectáveis experimentalmente; • Qualquer desvio significativo do EHW indica que a população está subdividida, e que existe uma endogamia significativa ou fluxo de genes de outra população. A Lei de Hardy-Weinberg "Observada em um grande e randômico cruzamento (diploide) populacional, onde a freqüência alélica poderá permanecer a mesma de geração para geração, assumindo que não há mutação, migração gênica, seleção ou deriva genética Quando uma população reúne todas as condições de Hardy- Weinberg, significa estar em equilíbrio de Hardy- Weinberg. • Este equilíbrio pode ser matematicamente demonstrado baseando-se em uma binominal simples (para dois alelos) ou multinominal (alelos multiplos) e na distribuição da freqüência gênica, como descrito a seguir: p2 +2pq + q2 23 Calculando o Equilibrio de Hardy-Weinberg • Populações em seu ambiente natural nunca apresentarão todas as condições necessárias para alcançar o equilíbrio de Hardy-Weinberg. Neste sentido sua freqüência alélica poderá mudar de uma geração para a próxima, podendo a população evoluir; • Uma população pode se desviar de Hardy-Weinberg como um indicador de intensidade de fatores externos, o qual pode ser determinado por uma formula estatística denominada, (qui-quadrado), utilizado para comparar os resultados observados versus o esperado: Onde: O - é o número observado de indivíduos com genótipo específico, e E é o número esperado de indivíduos com base no equilíbrio de Hardy-Weinberg (ex., para AA, o número esperado de indivíduos é: p2*N); K – é o número de genótipos. 24 Abaixo exemplo de calculo do equilibro de Hardy-Weinberg discussion continuação: Numero de indivíduos observados com cada genótipo AA=10 Freqüências genótipos observados Freqüência genótipo esperado Numero esperado de individuos (Total = 80) (O-E) (O-E)2/E A = ((2*10) + 10)/(2*80) = .1875 A=1-.1875 = .8125 p2=.0352 2.816 7.184 18.32736 2pq=.3046 q2=.6602 p2 + 2pq+q2 =1 24.368 52.816 14.386 7.194 8.471743 0.977163 X2 -27.77 Aa= 10 aa=60 Total 80 individuos, 169 alelos X2 • Usado para determinar a probabilidade, ou chance, de um número observado ser diferente do numero esperado; • A padronização de gráficos estatísticos tem sido desenvolvida correlacionando os valores de X2 e o grau de liberdade (o número de variáveis independentes), com valores de probabilidade (p); • No exemplo abaixo, o valor do X2 de 27.77 apresenta a uma chance de ser 99% maior do que a diferença entre o valor observado e o esperado • Esta alta probabilidade indica que alguns fatores externos (ex. migração, seleção, endogamia) influenciaram na freqüência alélica; • Este é um calculo estatístico usado não somente para genética de populações, mas também para associações de dados. 25 comparação de determinadas Tamanho efetivo (Ne) • Baseado na variância das freqüências alélicas dos adultos de uma simples população; Ne = n / 1 + f, • (Vencovsky, 1992). Uma das inúmeras variáveis da dinâmica populacional que pode influenciar na variação da taxa e tamanho da freqüência alélica é o tamanho da população; • A variação genética, o aumento randômico ou a diminuição da freqüência alélica, afetam pequenas populações mais severamente do que as grandes, uma vez que os alelos são oriundos de um pool de genes parentais. • A taxa de variação da freqüência alélica em uma população é determinada pelo tamanho real da mesma; • O tamanho real da população é o número de indivíduos que contribuem uniformemente para o pool de genes; • O número real de indivíduos em uma população raramente é o tamanho efetivo da mesma; • Tal fato se deve pelas seguintes razões: alguns indivíduos possuem uma taxa de reprodução maior do que outras (tem um maior desempenho reprodutivo ou fitness); a distribuição de machos e fêmeas podem resultar na dificuldade de 26 alguns indivíduos se acasalarem, ou devido a endogamia reduzir a sua capacidade individual; • O tamanho da população efetiva é uma medida teórica que compara o comportamento genético de uma população com o comportamento de uma população "ideal". À medida que o tamanho efetivo da população torna-se menor, a chance da freqüência alélica mudar devido ao acaso (deriva), só se torna maior. Existem inúmeras fórmulas para se calcular o tamanho da população efetiva (Ne). Uma delas (abaixo) leva em consideração o número de acasalamentos entre machos e fêmeas e a relação numérica entre eles: A aplicação desta fórmula exige os mesmos pressupostos do equilíbrio de HardyWeinberg. Existem outras versões mais complicadas desta fórmula, que levam em consideração algumas excessões, como a endogamia e fitness 27 Consanguinidade e Parentesco • Um pequeno tamanho populacional efetivo pode resultar em uma alta ocorrência de consanguinidade, ou em acasalamento entre parentes próximos; • A diminuição da heterozigosidade (aumento da homozigotia) da população como um todo; • Maior risco de indivíduos adquirirem doenças com caráter homozigoto recessivo, herdada de uma cópia do mesmo alelo recessivo de ambos os pais; • O impacto do acúmulo de características deletérias homozigóticas é chamado de depressão endogâmica, ou seja, a perda de vigor da população devido à perda de variabilidade ou opções genéticas • Na década de 1950, Sewell Wright desenvolveu um conjunto de parâmetros denominados Estatísticas F; • A mais simples delas é o coeficiente de endogamia, definida como a probabilidade de que dois alelos homólogos (o mesmo) do mesmo indivíduo, sejam idênticos por descendência; • O coeficiente de endogamia (F) é calculado através da comparação da heterozigosidade esperada, com heterozigosidade observada (Ho), e varia de, -1 (sem consangüinidade) para +1 (identidade completa); 28 • Se os valores para heterozigosidade observada e esperada é 0, o F mesmo será zero; • Um valor positivo indica que há um maior número de homozigotos, ou seja, a população pode ser pura. Assim, quanto maior o número, maior o grau de endogamia; • Um valor negativo indica que há mais indivíduos heterozigotos do que o esperado, o que poderia acontecer para as primeiras gerações após duas populações anteriormente isoladas se tornarem somente uma; Como o exemplo X2 abaixo: He - 10 e Ho= 24.368 para o heterozigoto, F = (10 - 24.368) / 10 = -1.43 • Utilizando X2 , a diferença entre o observado e esperado não é devido a chance • No entanto, havendo um aumento no número esperado de heterozigotos, a consanguinidade pode ser descartada como uma possível dinâmica populacional que está influenciando as freqüências genotípicas. 29 Coeficiente de Relacionamento de Wright (RC) • O grau de endogamia que ocorreu pode ser matematicamente calculado a partir de análise de pedigree; • A probabilidade de que alelos homólogos presentes em diferentes indivíduos sejam idênticos por descendência; • Em um organismo diplóide, 50% dos alelos de seus filhos (ou descendentes) são herdados de somente um dos pais. • Assim, seguindo o caminho das relações de pedigree, o RC pode ser determinada a partir da multiplicação de cada da ordem do parentesco. Essas relações são exemplos muito simples e diretos, porém as relações entre os indivíduos, particularmente em espécies domésticas e ameaçadas de extinção, podem ser muito mais complexas, inclusive cruzamentos entre irmãos, e retrocruzamentos entre os filhos-neto e avós. Para pedigrees (raças) complexos, o RC global pode ser calculado com base em um coletivo de um RC individual, através de: 30 Onde: RCxy - é a soma de todas as associações de X e Y, e indica a probabilidade de que qualquer gene é homozigoto por descendência; Nis – é o o número de associações entre X e Y através de cada um ancestral comum; Fa - é o coeficiente de endogamia do ancestral; Fx e Fy – são o coeficiente de endogamia para X e Y. Conteúdo de Informação Polimórfica (PIC) • Botstein et al. (1980); • Indicador da qualidade do marcador em estudos genéticos (segregação, identificação de populações e controle de paternidade); • A probabilidade de identificar qual homólogo de um dado pai, foi transmitido a uma dada prole, como também o outro progenitor ser genotipado; • A probabilidade de que o pai seja heterozigoto X a probabilidade que os seus filhos sejam informativos; • PIC superiores a 0,5 são considerados muito informativos, com valores entre 0,25 e 0,50 mediamente informativos, e com valores inferiores a 0,25, pouco informativos. Probabilidade de exclusão (PE) • PE1 - quando os genótipos de uma mãe, seu filho e o pai são comparados. Calculada por meio da 1ª fórmula: de, e apropriada para quando a matriz é confirmada como mãe no momento do nascimento; 31 • PE2 - quando não está disponível um ou outro genótipo parental, calculada segundo a fórmula simplificada 2ª: com base em: o Os valores por loco de PD, PE1 e PE2 foram combinados para a população por meio da fórmula: P=1-(1-P1)(1-P2)(1-P3)…(1-Pk) o • para k, número de locos. A probabilidade de exclusão (PE) para os pais, quando o DNA genômico de ambos e de um filho esta disponível, é calculada usando a fórmula abaixo, de Jamieson e Taylor (1997): • Após o cálculo da PE, para cada loco individualmente, a PE combinada sobre n marcadores independentes foi calculada utilizando a seguinte fórmula; PE= 1- (1-P1) (1-P2) (1-P3) … (1-Pn) (Jamieson and Taylor, 1997). • A probabilidade de exclusão de paternidade (Q) (Weir, 1996), que corresponde ao poder com o qual um loco exclui um animal erroneamente atribuído de ser a mãe de uma determinada prole, através da seguite fórmula: • Onde p é a freqüência populacional do alelo ith ou jth. A probabilidade de exclusão de paternidade combinada foi calculado utilizando a seguinte fórmula: 32 As etapas para aplicação da probabilidade de exclusão (PE) são a soma de todos os homozigotos e heterozigotos representados dentro de um perfil misto. Para um determinado loco, supondo o equilíbrio de Hardy-Weinberg, PE loco = 1-p2 Ou se não há equilíbrio de Hardy-Weinberg: PE loco = 1-p2 - θp(1-p) A probabilidade de exclusão (PE) é calculada para cada loco homozigoto, repetindo os passos acima, realizando o cálculo equivalente para heterozigotos, e somando os valores calculados. A probabilidade Total de Exclusão excluindo o Theta: PE = 1 - (p1 + p2 + ... + pn)2 PEmix = plocos(1) + plocos(2)+ ... + plocos(n) A Probabilidade total de exclusão utilizando Theta PE = 1 - (p1 + p2 + ... + pn)2 - θ[p1(1-p1) + p2(1-p2) + ... + pn(1-pn)] PEmix = plocos(1) + plocos(2)+ ... + plocos(n) Teste de Mantel (R) (Mantel, 1976) • Realizados para analisar os efeitos da distância geográfica, sobre a distância genética, por meio da seguinte fórmula: 33 os Onde: xey = Localização geográfica e distância genética nas localizações i e j; n = O número de entradas de dados nas matrizes de distância. Sx e Sy = Os desvios-padrão para a variável X e Y. Coeficiente de consangüinidade (F) Probabilidade de que dois genes à qualquer loco de um indivíduo sejam idênticos por descendência Exemplo Quatro populações de Drosophila mantidas com número fixo de adultos, permitindo acasalar aleatoriamente. Todas possuem 10 mães, no entanto 10, 5, 2 ou 1 pais. Calcular o tamanho populacional efetivo de cada população e coeficiente de consangüinidade depois de 10 gerações. Assumir a ausência de Ne = 4N m N f Nm + N f diferenças na fertilidade. ∆F = 1/2Ne Coeficiente de consangüinidade = Ft = 1-(1-∆F)t Número de fêmeas Númeo de machos Ne ∆F F(t=10) 10 10 10 10 10 5 2 1 20 0.025 0.224 13.33 0.0375 0.318 34 6.67 0.075 0.541 3.636 0.1375 0.772 Uma população isolada naturalmente tem um ciclo regular de 5 anos de números: 500, 50, 1 1 1 1 1 1 = + + + ... + N e t N1 N 2 N 3 Nt 100, 200, 400. Qual é o tamanho populacional efetivo e taxa de 1 1 1 1 1 1 1 = + + + + N e 5 500 50 100 200 400 consangüinidade? Ne = 253 ∆F = 1/2Ne = 0.20% Comparar a taxa de consangüinidade de duas variedades de planta: uma autofértil e outra auto- estéril, as duas com propagação por polinização aleatória dentro de 20 plantas individuais. população auto- fértil – população idealizada : N = Ne ∆F = 1/2Ne = 2,5% população auto- estéril - ∆F = 1/(2N + 1) = 2,44% A exclusão de auto-fertilidade faz pouca diferença especialmente quando N é maior. • Planejar e manter uma população de animais com oito pares, cruzando-se as gerações com o mínimo de consangüinidade; • Alguns dos pares não dão duas progênies como planejado; • Em uma geração, os oito cruzamentos deram 0, 1, 1, 2, 2, 3, 3 e 4 progênie; • Qual é o tamanho efetivo da população? 35 k = número de progênie Número de pais (incluindo pais estéreis) = 16 Ne = 4N/(Vk+2) Vk = variância de tamanho de família; Calcular desvios (-2, -1, -1, 0 , 0, 1, 1, 2): − ∑(k − k ) 2 = 12 Vk = 12/8 Ne = 18.3 • O plano de cruzamentos para a linha 6, foi usar 8 pares e duas progênies por par, para a próxima geração; • Se esse plano tivesse sido seguido, qual seria o tamanho efetivo das linhas? • Qual era o tamanho atual? Plano – consangüinidade mínima N= 16 Ne = 2N-1 = 31 F(t =27) = 0.447 Ft = (1-(1-∆F)t 27 (1-∆F) = 1-0.447 = 0.553 27 log(1-∆F) = -0.2573 1-∆F = 0.9783 ∆F = 0.0217 Ne = 1/2∆F = 23 36 Consangüinidade Cruzamentos de indivíduos que são parentes Indivíduos têm réplicas de um dos genes dos ascendentes Pode ter 2 genes no mesmo loco, réplicas do mesmo gene ↓ 2 genes com mesmo 2 genes com mesma efeito fenotípico origem ↓ idênticos por descendência ↓ coeficiente de consangüinidade ↓ F Fo ↓ N indivíduos ↓ 2N gametas ↓ P(gametas unificando = 1/2N = F1 (1 geração) tem genes idênticos) ↓ P(gametas unificando = 1/2N tem genes idênticos) + (1-1/2N)F1 = F2 outros gametas ∴ Ft = 1/2N + (1-1/2N) Ft-1 ∆F = 1/2N Ft = ∆F + (1-∆F)Ft-1 ∆F = Ft - Ft-1 1-Ft-1 taxa de consangüinidade Conhece “pedigree” - calcula F diretamente 37 Coeficiente de consangüinidade do individuo A probabilidade de um par de alelos levados pelos gametas que o produziram ser idênticos por descendência: A1A2 A B C P Q X P(X) = A1A1 = (½)4 = 1/16 P(X) = A2A2 = (½)4 = 1/16 P(X) = A1A2 ou A2A1 = (½)3 = 1/8 A pode ser homozigoto idêntico ∴ P(X) = A1A2 ou A2A1 = (½)3 (2 (½)4) P(A) homozigoto idêntico = FA ∴P(X) ident. homo. via A = (½)3 FA Fx = (½)3 + (½)3FA = (½)3 (1+FA) 3 = número de indivíduos no caminho conectando os pais p.ex. A B ↓ D ↓ P C ↓ . ↓ Q X Fx = (½)6(1+FA) Fx = Σ(½)n(1+FA) 38 A B C D E F G J K H L I M N O P Q X Trilha n PLDAEJNQ PLDBEJNQ PLDBFJNQ PLDBFKNQ PMJEBFKNQ PMJFKNQ PMJNQ 8 8 8 8 9 7 5 F do ancestral em comum 0 0 0 0 0 0 1/8 39 Contrib p/ Fx (½)8 (½)8 (½)8 (½)8 (½)9 (½)7 (½)5 + 9/8 FX = 0,0606 Outro Método F = probabilidade de 2 genes em 1 loco serem idênticos por descendência, quando se faz a média sobre todos os locos. FP = ½ asd app = 1 + ½ asd As AD x BS A aAB = ¼ (aAs Bs + aAs Bd B + aAd BD Bs + aAa Bd ) = ½ (aABs + aABd) dAB = ¼ (aAsBs aAdBd + aAsBd aAdBs) FA = ½ a FB = ½ aBsBd AsAd aAA = 1 + FA = 1 + ( ½ ) (aAsAd) aBB = 1 + FB = 1 + ( ½ ) (aBsBd) Método Tabular de computar relacionamentos aditivos e de dominância entre animais Relacionamentos Aditivos • Fazer lista de todos os animais – do mais velho para o novo; • Estabelecer matriz n x n e nomear colunas e linhas com os animais mais velho até o mais novo; • Caso tenha informação dos pais, colocar acima do número do animal; • Colocar o numeral (1) em toda a diagonal - relacionamento básico aditivo do animal com ele mesmo com consangüinidade; 40 • Começar na primeira linha em cima a esquerda - vai na primeira linha; • Relacionamento do primeiro animal com animal i: a1I = ½ (a1sI + a1dI) Pai do animal i A H D K A 1 0 Mãe do animal i B D 0 1 A D H K B aAH = ½ (aAA + aAD) = ½ (1+0) = ½ A-D H ½ ½ 1 A-D K ½ ½ ½ 1 aAK = ½ (aAA + aAD) = ½ (1+0) = ½ aAB = ½ (aAK ) = ½ ( ½ ) = ¼ aDH = ½ (aDA + aDD) = ½ (0+1) = ½ aDK = ½ (aDA + aDD) = ½ (0+1) = ½ aDB = ½ (aDK) = ½ ( ½ ) = ¼ aHH = ½ (aAD) + 1 = ½ (0) + 1 = 1 aHK = ½ (aHA + aHD) = ½ ( ½ + ½ ) = ½ aHB = ½ (aHK = ½ ( ½ ) = ¼ aKB = ½ aKK = ½ (1) = ½ Matrix simétrica Se consanguinidade na diagonal > 1 aII = 1 + ½ (aSIDI) Relacionamento aditivo entre pais de I Coeficiente de consangüinidade 41 K B ¼ ¼ ¼ ½ 1 Programas de computador (SOMENTE EXEMPLOS – LISTA COMPLETA EM OUTRAS PUBLICAÇÕES DA SÉRIE) Programa FSTAT Estatística Site Número da freqüência alélica estimada de uma ou várias amostras. - Números esperados e observados de cada genótipo por amostra e loco. - Diversidade genética imparcial por amostra e loco. - Número de alelos amostrados por loco, de uma ou várias amostras. - Riqueza alélica de uma ou várias amostras. - Fis por loco e amostra, além de teste de significância positive ou negative (deficit significativo e excess de heterozogotos, respectivamente). - Nei's (1987) Autores da diversidade gênica e de diferenciação. - Weir & Cockerham (1984) Capf (Fit), theta (Fst) and smallf (Fis) Autoresestimated per allele, per loco and overall. FSTAT também calcula Hamilton's (1971) Parentesco relat=2Fst/(1+Fit), calculado usando um estimador restritivo, equivalente ao Queller e Goodnight’s (1989). Esta medida é o parentesco médio de indivíduos dentro de amostras quando comparado aos dados de todo o conjunto. http://www2.unil.ch/popgen/softw Os intervalos de confiança baseado em esquemas de reamostragem são fornecidas para as estatísticas Weir & Cockerham: - Jackknifing por loco de todas as amostras. - Jackknifing por locos. - Bootstrapping por locos. - Estimativa de Estatística R (Slatkin, 1995). - Estimativa de Fst (theta) por par de amostra. - Teste geral para avaliar se cada amostra de cada loco esta em equilíbrio de HW - Teste para avaliar se todo o conjunto de dados esta em equilíbrio de HW. - Teste para avaliar se todas as amostras são diferenciadas. - Teste para avaliar se todas as amostras são diferenciadas assumindo se existe ou não equilíbrio de HW. - Teste para avaliar se cada para de loco de cada amostra estão em equlíbrio genotípico. - Teste para avaliar a existência de amostras diferentes para um grande painel estatístico. - Teste para avaliar se as categorias de indivíduos diferem nas taxas de dispersão (quatro testes diferentes) - Converte do formato FSTAT para o formato GENEPOP e vice-versa 42 ares/fstat.htm ARLEQUIN - Realiza regressão múltipla ou parcial para os testes de Mantel. - Índices Standard: Algumas medidas de diversidade como o número de sítios polimórficos, diversidade genética. - Diversidade Molecular: Calcula vários índices de diversidade, como diversidade nucleotídica, estimadores diferentes para o parâmetro populacional q. - Incompatibilidade de distribuição: A diferença na distribuição do número de pares entre os haplótipos, a partir do qual os parâmetros de uma expansão demográfica ou espacial pode ser estimada - Estimativa da frequencia haplótica: Estima a frequencia da presence de haplótipos presents na população através de métodos máximos de semelhança - Estimativa da fase gamética: Estima a fase gamética de genótipos de multi-loco utilizando uma abordagem pseudo-Bayesiana (algoritmo ELB). - Desequlíbrio de Linkage: teste de associação não-randômica de alelos de diferentes loco. - Equilíbrio de Hardy-Weinberg: Teste de associações não randômicas com indivíduos diplóides. - Teste de neutralidade de Tajima’s. Teste de neutralidade seletiva de uma amostra randômica de sequencias de DNA ou haplótipos RFLP obtidos de modelos de inúmeros sites. - Teste de neutralidade Fu's FS: teste de neutralidade de amostras randomicas ou selecionadas de sequencias de DNA ou haplótipos de RFLP.obtidos de modelos de inúmeros sites.l. - Teste de neutralidade de Ewens-Watterson: Teste de neutralidade seletiva baseado em amostras teóricas de Ewens obtidos de inúmeros modelos alélicos. - Teste de amalgamação de Chakraborty’s: Um teste de neutralidade seletiva e homogeneidade da população. Este teste pode ser usado quando a heterogeneidade da amostra é suspeita. Minimum Spanning Network (MSN):Calcula uma árvore geradora mínima (MST) e Network (MSN) entre os haplótipos. Esta árvore também pode ser utilizada para todos os haplótipos em diferentes populações, se for ativado na seção AMOVA. Métodos Inter-Populacional: - AMOVA: Análises hierárquicas de variância molecular diferentes para avaliar a quantidade de estrutura genética populacional. - DISTÂNCIA GENÉTICA PAIRWISE: A distância genética de FST baseada no tempo de divergência curto. - TESTES PRECISOS DE DIFERENCIAÇÃO ENTRE POPULAÇÕES: Teste de distribuição nãoaleatória de haplótipos em amostras da população sob a hipótese de panmixia. - TESTES DE GENOTIPAGEM ATRIBUÍDA: Atribuição de genótipos individuais para determinadas populações de acordo com a estimativa de freqüências alélicas. - TESTE DE MANTEL: Correlações parciais ou não entre um conjunto de duas ou três 43 http://cmpg.unibe.ch/software/arl equin3/ Cervus Genepop MTDFREML matrizes. Pode ser usado para testar a presença de isolamento por distância. Análise de Freqüência Alélica - Probabilidade de paternidade requer testes usando freqüências alélicas. . - Calcula a freqüência de cada alelo de cada loco na população, juntamente com uma série de estatísticas resumidas, incluindo testes de equilíbrio de Hardy-Weinberg e a presença de alelos nulos. Simulação da Análise de Paternidade A simulação de análise de paternidade é útil por duas razões. Quatro tipos diferentes de testes de paternidade podem ser simulados: análise da maternidade, análise de paternidade, análise de pai par onde os sexos dos pais candidatos são conhecidos e análise de pai-mãe, onde os sexos dos pais candidatos são desconhecidos. Análise de Parestesco (paternidade) Para cada filho (descendente) testado, o parentesco, é tanto atribuído ao pai candidato mais provável com um nível pré-determinado de confiança, ou é deixada sem atribuição. Análise de Identidade Essa análise é utilizada para identificar os indivíduos que tenham sido amostrados, mesmo não sendo os dois genótipos exatamente iguais. Equilíbrio de Hardy Weinberg,Linkage Disequilibrium, Diferenciação de população, Número efetivo de migrants, Fst ou outras correlações. componentes de variância de estimação relação numerador Incluindo matriz e wombat http://www.fieldgenetics.com/pag es/aboutCervus_Using.jsp http://genepop.curtin.edu.au/ http://www.aipl.arsusda.gov/curtv t/mtdfreml.html http://agbu.une.edu.au/~kmeyer/wombat.h tml ENDOG Funções primárias realizadas por ENDOG • consanguinidade individual (F) (Wright, 1931) • coeficiente da relação média (AR) (Gutiérrez et al, 2003;. Goyache et al, 2003). • parâmetros em genética de populações, como a descrita para Biochard et al. (1997). • Para o número de ancestrais explicar a variabilidade genética ou aqueles propostos por Rodrigues (1953) e Vassallo et al. (1996), • estatística F (Wright, 1978) a partir de informações genealógicas propostas por Caballero e Toro (2000, 2002). • tamanho efetivo da população seguindo metodologias diferentes, incluindo abordagens de regressão e, em especial o tamanho da população. Foi realizada recentemente uma proposta efetiva de aumento individual de endogamia (Gutiérrez et al., 2008), que foi modificada a fim de se evitar uma autofertilização (Gutiérrez et al., 2009). 44 http://www.ucm.es/info/prodanim/ html/JP_Web.htm Referências Alderson, L.1992. A system to maximize the maintenance of genetic variability in small populations. In Genetic Conservation of Domestic Livestock II, Eds. Alderson, L. and Bodo, I., CABI, Wallingford, U.K., 1829. Ballou, J.D, Lacy, R.C.1995. Identifying genetically important individuals for management of genetic variation in pedigreed populations. In: Ballou JD, Gilpin M, Foose TJ, editors. Population management for survival and recovery: analytical methods and strategies in small population management. New York: Columbia University Press, 76-111. Banos, G.; Wiggans, G.R. and Powell, R.L. 2001. Impact of paternity errors in cow identification on genetic evaluations and international comparisons. J. Dairy Sci., 84: 2523-2529. Bartolomé, E.; Goyache, F., Molina, A., Cervantes, I., Valera, M., Gutiérrez, J.P. 2010. Pedigree estimation of the (sub) population contribution to the total gene diversity: the horse coat colour case. Animal, 4, 867-875. Boichard, D. 2002. PEDIG: a FORTRAN package for pedigree analysis suited for large populations, in: Proc. 7th World Cong. Genet. Appl. to Livest. Prod., Montpellier, 19_23 August 2002, INRA, Castanet-Tolosan, France, CD-Rom, comm. 28-13. Boichard, D.; Maignel, L.; Verrier, E. 1997. The value of using probabilities of gene origin to measure genetic variability in a population. Genet Sel Evol 29: 5-23. Botstein, D.; White, R.L.; Skolnick, M.H. & Davies, R.W. 1980. Construction of a genetic linkage map in man using restriction fragment length polymorphisms. American Journal of Human Genetics, 32, 314–31. Brinkmann, B.; Pfeiffer, H.; Schtirenkamp, M.; Hohoff, C. 2001.The evidential value of STRs: an analysis of exclusion cases. Internal Journal Legal Medicine 114:173-177 Brown, A.H.D.; and Weir, B.A. 1983. Measuring genetic variability in plant populations. In: Tanksley, S. D. and Orton, T. J. (eds) Isozymes in Plant Genetics and Breeding, Elsevier, Amsterdam, pp. 219–239. Caballero, A.; Toro, M.A. 2000. Interrelations between effective population size and other pedigree tools for the management of conserved populations. Genetics Research Camb 75: 331-343. Caballero, A.; Toro, M.A. 2002. Analysis of genetic diversity for the management of conserved subdivided populations. Conservation Genetics 3: 289-299. Caldwell, J. 1996. DNA and ancestry verification. Proceedings of World Holstein-Friesian Conference, Japan. Cervantes, I.; Goyache, F., Molina, A.; Valera, M.; Gutiérrez, J.P. 2008. Application of individual increase in inbreeding to estimate effective sizes from real pedigrees. Journal of Animal Breeding and. Genetics, 125, 301-310. Cervantes, I.; Goyache, F.; Molina, A.; Valera, M.; Gutiérrez, J.P. 2010. Estimation of effective population size from the rate of coancestry in pedigreed populations. Journal of Animal Breeding and Genetics, Chakraborty, R.; Shaw, M.W.; Schull, W.J. 1974. Exclusion of paternity: the current state of the art. American Journal of Human of Genetics, 26:477--488 45 Chakraborty, R and Stivers, D.N. 1996. Paternity exclusion by DNA markers: effects of paternal mutations. Journal of Forensic Sciences, 41:671-677 Dodds, K.G.; Tate, M.L.; Mcewan, J.C. et al. 1996. Exclusion probabilities for pedigree testing farm animals. Theoretical and Applied Genetics., 92:966-975. Doods, K.G., M.L. Tate and J.A. Sise, 2005. Genetic evaluation using parentage information from genetic markers. Journal of Animal Science, 83: 2271-2279. Eding, H.; Meuwissen, T.H.E. 2001. Marker-based estimates of between and within population kinships for the conservation of genetic diversity. Journal of Animal Breeding and Genetics, 118:141-59. Falconer, D.S.; and Mackay, T.F.C. 1996 Introduction to Quantitative Genetics, Ed 4. Longmans Green, Harlow, Essex, UK. Francisco, L.V.; Langston, A.A.; Mellersh, C.S.; Neal, C.L. & Ostrander, E.A. 1996. A class of highly polymorphic tetranucleotide repeats for canine genetic mapping. Mammalian Genome, 7, 359–62. Garber, R.A.; Morris, J.W. 1983. General equations for the average power of exclusion for genetic systems of n codominant alleles in one-parent and no-parent cases of disputed parentage. In:Walker RH (ed) Inclusion probabilities in parentage testing. American Association of Blood Banks, Arlington, VA, pp 277- 280 Glowatzki-Mullis, M.L.; Gaillard, C.; Wigger, G. et al. 1995. Microsatellitebased parentage control in cattle. Animal of Genetics, 26:7-12. González-Recio, O.; López de Maturana, E.; Gutiérrez, J.P. 2007. Inbreeding depression on female fertility and calving ease in Spanish dairy cattle. Journal of Dairy Science., 90, 5744-5752. Goyache, F.; Gutiérrez, J.P.; Fernández, I.; Gómez, E.; Álvarez, I.; Díez, J.; Royo, L.J; 2003. Using pedigree information to monitor genetic variability of endangered populations: the Xalda sheep breed of Asturias as an example. Journal of Animal Breeding of Genetics, 120: 95-103. Gunn, P.R.; Trueman, K.; Stapleton, P.; Klarkowski, D.B. 1997. DNA analysis in disputed parentage: the occurrence of two apparently false exclusions of paternity, both at short tandem repeat (STR) locos, in the one child. Electrophoresis 18:1650-1652 Gutiérrez, J.P.; Altarriba, J.; Díaz, C.; Quintanilla, A.R.; Cañón J, Piedrafita J, 2003. Genetic analysis of eight Spanish beef cattle breeds. Genet Sel Evol 35:43-64. Gutiérrez, J.P.; Cervantes, I.; Molina, A.; Valera, M.; Goyache, F. 2008. Individual increase in inbreeding allows estimating realized effective sizes from pedigrees. Genetics Selection Evolution, 40, 359-378. Gutiérrez, J.P., Cervantes, I., Goyache, F. 2009. Improving the estimation of realized effective population sizes in farm animals. Journal of Animal Breeding Genetics. Halverson, J.; Dvorak, J. & Stevenson, T. 1995. Microsatellite sequences for canine genotyping. US Patent 05874217. Hansen, C.; Shrestha, J.N.; Parker, R.J.; Crow, G.H.; McAlpine, P.J. and Derr, J.N. 2002. Genetic diversity among canadienne, brown swiss, holstein and jersey cattle of Canada based on 15 bovine microsatellite markers. Genome, 45: 897-904. 46 Henegariu, O.; Neerema, N.A.; Dlouhy, S.R.; Vance, G.H. and Vogt, P.H. 1997. Multiplex PCR: Critical parameters and step-by-step protocol. Biotechniques, 23: 504-511. Heyen, D.W.; Beever, J.E.; Da, Y.; Evert, R.E. and Green, C. et al. 1997. Exclusion probabilities of 22 bovine microsatellite markers in fluorescent multiplexes for semiautomated parentage testing. Animal of Genetics, 28: 21-27. Hill, W.G. 1979. A note on effective population size with overlapping generations. Genetics, 92: 317-322. http://www.nfstc.org/pdi/Subject07/pdi_s07_m02_03.htm Ichikawa, Y.; Tagagi, K.; Tsumagari, S.; Ishima, K. and Morita, M. et al. 2001. Canine parentage testing based on microsatellite polymorphisms. Journal of Veterinary of Medical Science, 63: 1209-1213. Israel, C. and Seller, J.I. 2000. Effect of misidentification on genetic gain and estimation of breeding value in dairy cattle populations. Journal of Dairy Science, 83: 181-187. James, J. 1972. Computation of genetic contributions from pedigrees. Theoretical and Applied. Genetics. 42: 272-273. James, J.W. 1977. A note on selection differentials and generation length when generations overlap. Animal of Prod. 24:109-112. Jamieson, A.; Taylor, S.C.1997. Comparisons of three probability formulae for parentage exclusion. Animal of Genetics, 28:397-400 Jamieson, A. 1965. The genetics of transferrin in cattle. Heredity 20, 419– 41. Kaye, D.H. 1990. DNA paternity probabilities. Faro Law Quart 24:280-303 Lacy, R.C. 1989. Analysis of Founder Representation in Pedigrees: Founder Equivalent and Founder Genome Equivalents. Zoo Biology, 8:111-123. Lacy, R.C.; Alaks, G.; Walsh, A. 1996. Hierarchical analysis of inbreeding depression in Peromyscus polionotus. Evolution 50: 2187–2200. Lee, C.L.; Lebeck, L.; Pothiawala, M. 1980. Exclusion of paternity without testing the mother. American Journal of Clinical Pathology, 74:809-812 Li, C.C.; Sacks, L. 1954. The derivation of joint distribution and correlation between relatives by the use of stochastic matrices. Biometrics, 10:247-260 Liron, J.P.; Ripoli, M.V.; Garcia, P.P. and Giovambattista, G. 2004. Assignment of paternity in a judicial dispute between 2 neighbor holstein dairy farmers. Journal of Forensic Science. 49: 96-98. MacCluer, J.; Boyce, B.; Dyke, L.; Weitzkamp, D.; Pfenning, A.; Parsons, C. 1983. Inbreeding and pedigree structure in Standardbred horses. Journal of Hereditary. 74: 394-399. Maignel, L.; Boichard, D.; Verrier, E.1996. Genetic variability of French dairy breeds estimated from pedigree information. Interbull Bull 14: 4954. Man, W.Y.N.; Nicholas, F.W.; James, J.W. 2007. A pedigree-analysis approach to the descriptive epidemiology of autosomal-recessive disorders. Preventive Veterinary Medicine, 78: 262-273. Maudet, C.; Luikart, G. and Taberlet, P. 2002. Genetic diversity and assignment tests among seven French cattle breeds based on microsatellite DNA analysis. Journal of Animal Science, 80: 942-950. Melvin, J.R.; Kateley, J.R.; Oaks, M.K.; Simson, L.R.; Maldonado, W.E. 1988. Paternity testing. In: Saferstein R (ed) Forensic science handbook, vol II. Prentice-Hall, Englewood Cliffs, NJ, pp 273- 346 47 Meuwissen, T.I.; Luo, Z.1992. Computing inbreeding coefficients in large populations, Genetics Seletion Evolution, 24: 305-313. Mullis, M.L.G.; Gaillard, C.; Wigger, G. and Fries, R. 1995. Microsatellitebased parentage control in cattle. Animal Genetics, 26: 7-12. Neff, B.D.; Repka, J. and Gross, M.R. 2000. Statistical confidence in parentage analysis with incomplete sampling: How many locos and offspring are needed? Molecular Ecology, 9: 529-539. Neff, B.D.; Repka, J. and Gross, M.R. 2001. A bayesian framework for parentage analysis: The value of genetic and other biological data. Theoretical of Population of Biology, 59: 315-331. Nei, M. 1987. Molecular Evolutionary Genetics. Columbia University Press, New York, 512 pp. Ohno, Y.; Sebetan, I.M.; Akaishi, S. 1982. A simple method for calculating the probability of excluding paternity with any number of codominant alleles. Forensic Sci Int 19:93-98 Ostrander, E.A.; Mapa, F.A.; Yee, M. & Rine, J. 1995 One hundred and one simple sequence repeat-based markers for the canine genome. Mammalian Genome 6, 192–5. Ostrander, E.A.; Sprague, G.F.; Jr & Rine J. (1993) Identification and characterization of dinucleotide repeat (CA)n markers for genetic mapping in dog. Genomics 16, 207–13. Pérez-Enciso, M. 1995. Use of the uncertain relationship matrix to compute effective population size, Journal of Animal. Breeding.of Genetics. 112: 333-340. Quaas, R.L. 1976. Computing the diagonal elements of a large numerator relationship matrix. Biometrics 32: 949-953. Raymond M. & Rousset F. 1995. GENEPOP (version 1.2): population genetics software for exact tests and ecumenicism. Journal of Heredity, 86:248-249 Robertson, A. 1953. A numerical description of breed structure. Journal of Agric Science, 43: 334-336. Ron, M., Blanc, Y., Band, M. et al. 1996. Misindetification rate in the Israeli dairy cattle population and its implications for genetic improvment. J. Dairy Sci., 79:676-681. Ron, M.; Yoffe, O.; Ezra, E. et al. 1994. Determination of effects of milk protein genotyping on production traits of Israeli Holstein. Journal of Dairy Science, 77:1106-1113. Rousset, F. 2008. Genepop'007: a complete reimplementation of the Genepop software for Windows and Linux. Molecular Ecology Resources 8: 103-106. Salmon, D.B.; Brocteur, J.1978, Probability of paternity exclusion when relatives are involved. American Journal of Human Genetics, 30:65-75. Savolainen, P.; Zhang, Y.; Luo, J.; Lundeberg, J. & Leitner, T. 2002. Genetic evidence for an East Asian origin of domestic dogs. Science 298, 1610– 13. Shannon, C. E., and W. Weaver. 1949. The Mathematical Theory of Communication. Urbana, University of Illinois Press, 117 pp. Sherman, G.B.; Kachman, S.D.; Hungerford, L.L.; Ropp, G.P. and Fox, C.P. et al. 2004. Impact of candidate sire number and sire relatedness on DNA polymorphisms-based measures of exclusion probability and probability of unambiguous parentage. Animal Genetics, 35: 220-226. 48 Tozaki, T., H. Kakoi, S. Mashima, K. Hirota and T. Hasegawa et al. 2001. Population study and validation of paternity testing for thoroughbred horses by 15 microsatellite locos. Journal of Veterinary Medical Science, 63: 1191-1197. Usha, A.P., Simpson, S.P. and Williams, J.L. 1995. Probability of random sire exclusion using microsatellite markers for parentage verification. Animal Genetics, 26: 155-161. Vankan, D.M. and M.J. Faddy, 1999. Estimations of the efficacy and reliability of paternity assignments from DNA microsatellite analysis of multiple-sire matings. Animal Genetics, 30: 355-361. Vassallo, J.M.; Díaz, C.; García-Medina, J.R, 1986. A note on the population structure of the Avileña breed of cattle in Spain, Livestock Production Science, 15: 285-288. Vila, C.; Savolainen, P.; Maldonado, J.E.; Amorim, I.R. Rice, J.E.; Honeycutt, R.L.; Crandall, J.; Lundeberg, K.A. & Wayne, R.K. 1997, Multiple and ancient origins of the domestic dog. Science 276, 1687–89. Visscher, P.M.; Wooliams, J.A.; Smith, D. and Williams, J.L. 2002. Estimation of pedigree errors in the UK dairy population using microsatellite markers and the impact on selection. Journal of Dairy Science, 85: 2368-2375. Wahlberg, N. 2000. The ecology and evolution of Melitaeine butterflies. Faculty of Science of the University of Helsinki (Academic dissertation). 25p. Weir, B.S. & Cockerham, C.C. 1984. Estimating F-statistics for the analysis of population structure. Evolution 38: 1358-1370. Weir, B.S. 1996. Genetic Data Analysis II: Methods for discrete population genetic data. Sinauer Associates, Sunderland. 445p. WEIR, B.S. 1996. Genetic data analysis: methods for discrete population genetic data. 2.ed. Massachusetts: Sinauer Associates. 445p. Wenk, R.E, Traver, M.; Chiafari, F.A. 1996. Determination of sibship in any two persons. Transfusion 36:259-262. Werner, P.; Mellersh, C.S.; Roducha, M.G.; De Rose S.; Acland, G.M.; Prociuk U., Wiegand, N.; Agurre, G.D.; Henthorn P.S., Patterson D.F. & Ostrander E.A. (1999) Anchoring of canine linkage groups with chromosome-specific markers. Mammalian Genome 10, 814–23. Whitlock, M.C. & MacCauley, D.E. 1990. Some populations genetic consequences of colony formation and extinction: genetic correlations within fouding groups. Evolution 44(7): 1717-1724. Willis, C.F. & Guries, R.P. 1995. Evolution v.48: 791-805. Woolliams JA, Pong-Wong R, Villanueva B, 2002. Strategic optimisation of short and long term gain and inbreeding in MAS and non-MAS schemes, in: Proc. 7thWorld. Wright, S. 1931. Evolution in mendelian populations. Genetics 16: 97-159. Wright, S. 1943. Isolation by distance. Genetics 28: 114-138. Wright, S. 1951. The genetical structure of populations. Annual Eugenics 15: 223-354. Wright, S. 1965. The interpretation of population structure by F-statistics with special regard to systems of mating. Evolution 19: 395-420. Wright, S. 1978. Evolution and the genetics of populations: Vol. 4. Variability within and among natural populations. University of Chicago Press: Chicago. USA 49 Yeh, F.C. 2000. Population genetics. In: Forest conservation genetics: principles and practice. A.Young, D. Boshier & T.Boyle (eds.). pp. 2137. Collingwood: CSIRO Publishing. Zupanik, P.I.; H. Sterlinko, J.; Balaic, R.; Komel, 2001. Parentage testing with 14 STR locos and population data for 5 STRs in the slovenian population. Int. J. Legal Med., 114: 178-180. 50