UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA “LUIZ DE QUEIROZ” ANAIS DEPARTAMENTO DE GENÉTICA 29 o o Encontro Sobre Temas de Genética e Melhoramento Tema: "Genômica Populacional e Genética da Conservação" 8 e 9 de outubro de 2012 http://www.genetica.esalq.usp.br/29temas/ http://twitter.com/lgn_esalq_usp/ ANAIS 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO VOLUME 29 “GENÔMICA POPULACIONAL E GENÉTICA DA CONSERVAÇÃO” 8 E 9 DE OUTUBRO DE 2012 Piracicaba - SP UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA “LUIZ DE QUEIROZ” DEPARTAMENTO DE GENÉTICA 2012 ANAIS 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO VOLUME 29 “GENÔMICA POPULACIONAL E GENÉTICA DA CONSERVAÇÃO” 8 E 9 DE OUTUBRO DE 2012 Piracicaba - SP EDITORES JOSÉ BALDIN PINHEIRO GIANCARLO CONDE XAVIER OLIVEIRA GERHARD BANDEL ELIZABETH ANN VEASEY MARIA LÚCIA CARNEIRO VIEIRA RICARDO ANTUNES DE AZEVEDO Dados Internacionais de Catalogação na Publicação DIVISÃO DE BIBLIOTECA - ESALQ/USP Encontro sobre Temas de Genética e Melhoramento (29: 2012: Piracicaba, SP) “Genômica populacional e genética da conservação” ; anais ... / edição de José Baldin Pinheiro ... [et al.]. - - Piracicaba: ESALQ/LGN, 2012. 57 p. Bibliografia. 1. Genética de populações 2. Melhoramento genético vegetal I. Pinheiro, J. B., ed. II. Oliveira, G. C. X., ed. III. Bandel, G., ed. IV. Veasey E. A., ed. V. Vieira, M. L. C., ed. VI. Azevedo, R. A. de., ed. VII Título CDD 631.522 G335e UNIVERSIDADE DE SÃO PAULO Reitor: Prof. João Grandino Rodas Vice Reitor: Prof. Hélio Nogueira da Cruz ESCOLA SUPERIOR DE AGRICULTURA “LUIZ DE QUEIROZ” DIRETOR: Prof. José Vicente Caixeta Filho VICE-DIRETOR: Profa. Marisa Aparecida Bismara Regitano d’Arce PREFEITURA DO CAMPUS “LUIZ DE QUEIROZ” PREFEITO: Prof. Wilson Roberto Soares Mattos DEPARTAMENTO DE GENÉTICA ESALQ/USP CHEFE: Ricardo Antunes de Azevedo SUPLENTE: Silvia Maria Guerra Molina 2012 AGRADECIMENTOS A Comissão organizadora do 29º Encontro Sobre Temas de Genética e Melhoramento e o Departamento de Genética da ESALQ nesta ocasião agradecem o apoio decisivo recebido das seguintes instituições: Departamento de Genética da ESALQ (LGN), Programa de Pós-graduação em Genética e Melhoramento de Plantas (PPG-GMP-ESALQ/USP), Associação Brasileira de Melhoramento de Plantas (SBMP), Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), Sociedade Brasileira de Genética (SBG), Sociedade Brasileira em Recursos Genéticos (SBRG) e Ministério da Agricultura, Pecuária e Abastecimento (MAPA). Assim como aos Servidores Não Docentes da ESALQ: Antonio de Pádua Gorga Carlos Roberto Macedonio Fernando Leopoldino Maídia Maria Thomaziello Rogério Antonio Marim Silvia Cristina Menuzzo Molina Valdir Próspero ÍNDICE Setores de Pesquisa e Corpo Docente ........................................................................... 1 Apresentação ................................................................................................................. 2 Programa do Evento ....................................................................................................... 3 Análise genética de populações naturais em escala genômica – desafios e perspectivas - Alexandre Siqueira Guedes Coelho, UFG............................... 4 Detecting selection using high-density SNP genotype data Tiago Rodrigues Antão, University of Cambridge, UK ..................................................... 5 Contributions of population genetics to tree conservation: challenges under changing scenarios Andrea Cecília Premoli, Universidad Nacional del Comahue - Argentina ........................ 12 Genômica de populações: aplicações na genética da conservação de plantas e no manejo de insetos-pragas Maria Imaculada Zucchi, APTA-Pólo Centro Sul ............................................................. 17 Distribuição da diversidade genética e conservação de espécies arbóreas em remanescentes de floresta ombrófila mista em Santa Catarina Adelar Mantovani, UDESC.............................................................................................. 24 Medindo o tempo evolutivo a partir de moléculas: Os 50 anos do relógio molecular Carlos Guerra Schrago, IB-UFRJ.................................................................................... 38 Identificação molecular da biodiversidade com vistas à sua conservação Claudio de Oliveira , UNESP-Botucatu ........................................................................... 42 The GAMA approach to the analysis of large germplasm collections: the example of common bean landraces from Brazil Paul Gepts, UCLA-Davis - EUA ...................................................................................... 50 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" DEPARTAMENTO DE GENÉTICA – ESALQ/USP SETORES DE PESQUISA E CORPO DOCENTE LABORATÓRIO DE BIOLOGIA MOLECULAR DE PLANTAS Prof. Dr. Márcio de Castro Silva Filho LABORATÓRIO DE CITOGENÉTICA Prof. Dr. Gerhard Bandel LABORATÓRIO DE CITOGENÉTICA MOLECULAR DE PLANTAS Prof. Dr. Mateus Mondin Docente com Atividades em Conjunto: Profa. Dra. Margarida Lopes Rodrigues de Aguiar-Perecin LABORATÓRIO DE DIVERSIDADE GENÉTICA E MELHORAMENTO Prof. Dr. José Baldin Pinheiro LABORATÓRIO DE ECOGENÉTICA Profa. Dra. Silvia Maria Guerra Molina LABORATÓRIO DE EVOLUÇÃO Prof. Dr. Giancarlo Conde Xavier Oliveira LABORATÓRIO DE GENÉTICA APLICADA À ESPÉCIES AUTÓGAMAS (SOJA) Prof. Dr. Natal Antonio Vello LABORATÓRIO DE GENÉTICA BIOQUÍMICA DE PLANTAS Prof. Dr. Ricardo Antunes de Azevedo LABORATÓRIO DE GENÉTICA ECOLÓGICA DE PLANTAS Profa. Dra. Elizabeth Ann Veasey LABORATÓRIO DE GENÉTICA ESTATÍSTICA Prof. Dr. Antonio Augusto Franco Garcia Docente com Atividades em Conjunto: Prof. Dr. Roland Vencovsky LABORATÓRIO DE GENÉTICA FISIOLÓGICA Prof. Dr. Carlos Alberto Labate LABORATÓRIO DE GENÉTICA DE LEVEDURAS Prof. Dr. Flávio Cesar Almeida Tavares LABORATÓRIO DE GENÉTICA DE MICRORGANISMOS Profa. Dra. Aline Aparecida Pizzirani-Kleiner Docente com Atividades em Conjunto: Prof. Dr. João Lúcio de Azevedo LABORATÓRIO DE GENÉTICA DE MICRORGANISMOS PROF. JOÁO LÚCIO DE AZEVEDO GRUPO DE GENÔMICA Profa. Dra. Cláudia Barros Monteiro Vitorello LABORATÓRIO DE GENÉTICA MOLECULAR DE PLANTAS CULTIVADAS Profa. Dra. Maria Lúcia Carneiro Vieira LABORATÓRIO DE GENÉTICA QUANTITATIVA E MELHORAMENTO DE SOJA Prof. Dr. Isaias Olívio Geraldi LABORATÓRIO DE MELHORAMENTO DE AVES Prof. Dr. Vicente José Maria Savino Prof. Dr. Antonio Augusto Domingos Coelho LABORATÓRIO DE MELHORAMENTO DE MILHO – I Prof. Dr. José Branco de Miranda Filho LABORATÓRIO DE MELHORAMENTO DE MILHO – II Prof. Dr. Cláudio Lopes Souza Junior Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 1 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 2 APRESENTAÇÃO __________________________ A tipagem em nível de um ou poucos genes (“genotipagem’) vem sendo feita com métodos moleculares desde meados do século passado e um ferramental vasto vem-se acumulando, permitindo a detecção de variação em diversas regiões do genoma. O desenvolvimento de técnicas mais sofisticadas nas últimas duas décadas catapultou para níveis inéditos a quantidade de marcadores que podem ser usados para genotipagem simultânea em um indivíduo, de modo que, agora, pode-se fazer a tipagem de genomas (“genomotipagem” ?), saturando-se o mapa genético com locos informativos ou sequenciando-se o genoma todo. A tipagem de genomas inteiros, a princípio, é uma extensão quantitativa de genotipagens mais modestas, mas a enorme quantidade de dados gerados e a utilização de técnicas estatísticas de análise especialmente criadas para tratá-los têm facultado a investigação, com um nível de abrangência sem precedentes, de fenômenos populacionais, como seleção, deriva, fluxo gênico, eventos históricos, demografia, filogenia e outros, estabelecendo as bases teóricas e empíricas do que se convencionou chamar GENÔMICA POPULACIONAL. Este programa de pesquisa baseia-se em dois pontos principais: a história evolutiva e demográfica afeta igualmente certos parâmetros populacionais dos locos neutros, mas a seleção afeta diferencialmente os das regiões não-neutras, que aparecem como outliers identificáveis nos testes estatísticos e deixam assinaturas de seleção dispersas nos genomas de uma população. A Genômica Populacional tem aplicações potenciais imediatas em programas de CONSERVAÇÃO GENÉTICA, como a identificação molecular massiva de táxons, o resgate de populações declinantes com genótipos adaptados e a detecção de focos de biodiversidade intraespecífica, e certamente continuará a irrigar esses programas com dados e diretrizes mais abundantes e confiáveis. ________________________________________________________ Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 3 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO TEMA: "Genômica Populacional e Genética da Conservação" 08 de outubro de 2012 - (segunda-feira) 08:00 - 08:30 - INSCRIÇÕES 08:30 - 09:00 - SESSÃO DE ABERTURA 1a SESSÃO - Manhã Presidente da Sessão: José Baldin Pinheiro, ESALQ/USP 09:00 - 10:00 - Análise genética de populações naturais em escala genômica – desafios e perspectivas - Alexandre Siqueira Guedes Coelho, UFG. 10:00 - 10:30 - Intervalo 10:30 - 11:30 - Detecting selection using high-density SNP genotype data - Tiago Rodrigues Antão, University of Cambridge, UK. 2a SESSÃO - Tarde Presidente da Sessão: Roland Vencovsky, ESALQ/USP 14:00 - 15:00 - Contributions of population genetics to tree conservation: challenges under changing scenarios - Andrea Cecília Premoli, Universidad Nacional del Comahue – Argentina. 15:00 - 15:30 - Intervalo 15:30 - 16:30 - Genômica de populações: aplicações na genética da conservação de plantas e no manejo de insetos-pragas - Maria Imaculada Zucchi, APTA-Pólo Centro Sul. 09 de outubro de 2012 - (terça-feira) 3a SESSÃO - Manhã Presidente da Sessão: Giancarlo Conde Xavier Oliveira, ESALQ/USP 09:00 - 10:00 - Distribuição da diversidade genética e conservação de espécies arbóreas em remanescentes de floresta ombrófila mista em Santa Catarina - Adelar Mantovani, UDESC. 10:00 - 10:30 - Intervalo 10:30 - 11:30 - Medindo o tempo evolutivo a partir de moléculas: Os 50 anos do relógio molecular - Carlos Guerra Schrago, IB-UFRJ. 4a SESSÃO - Tarde Presidente da Sessão: Elizabeth Ann Veasey, ESALQ/USP 14:00 - 15:00 - Identificação molecular da biodiversidade com vistas à sua conservação - Claudio de Oliveira , UNESP-Botucatu. 15:00 - 15:30 - Intervalo 15:30 - 16:30 - The GAMA approach to the analysis of large germplasm collections: the example of common bean landraces from Brazil - Paul Gepts, UCLA-Davis – EUA. 16:40 – Encerramento Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 4 ANÁLISE GENÉTICA DE POPULAÇÕES NATURAIS EM ESCALA GENÔMICA – DESAFIOS E PERSPECTIVAS Alexandre Siqueira Guedes Coelho Escola de Agronomia, Universidade Federal de Goiás Email: [email protected] Palavras-chave: genética de populações, genômica, populações naturais A disponibilidade recente de técnicas de genotipagem de alto desempenho deverá provocar nos próximos anos uma verdadeira revolução nos métodos de análise genética de populações naturais. Estes novos métodos permitem a avaliação de dezenas de milhares de locos em centenas de indivíduos a um custo inferior aos exigidos pelos atuais marcadores genéticos comumente utilizados em estudos de genética de populações. O potencial de utilização destas informações para a análise em escala genômica do polimorfismo presente em populações naturais e suas implicações para a melhor compreensão dos processos microevolutivos serão discutidos. Serão ainda apresentados exemplos de aplicação destas informações em estudos sobre tamanho efetivo, parentesco, identificação de locos sobre seleção e caracteres quantitativos de importância adaptativa. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 5 DETECTING SELECTION USING HIGH-DENSITY SNP GENOTYPE DATA Tiago Rodrigues Antão Department of Biological Anthropology, University of Cambridge, Cambridge CB2 1QH, UK Email: [email protected] Abstract Testing for selection is becoming one of the most important steps in the analysis of genomic datasets. Dense genotyping data might allow the reliable reconstruction of haplotypes and thus the usage of haplotype based methods to detect selection. Here we will consider some methodological guidelines, based on experience with human datasets, to reliably detect selection using phased data. We will discuss basic requirements (e.g. the need for a linkage map for the species being studied), phasing strategies and also the assumptions and limitations of two widely used methods to detect selection. Introduction The advent of next-generation sequencing made possible the use of haplotype based methods of selection detection. The fundamental intuition (Sabeti et al., 2002) behind these approaches relies on the observation that positive selection causes a rapid rise in the allele frequency not only of the causative mutation but also of spatially close mutations. If such a process occurs on a short enough time then recombination will not substantially break down the haplotype carrying the selected mutation. A signature of selection will then be an haplotype that is unusually long. Reliable haplotype phasing (Browning and Browning, 2011) is thus fundamental for the application of any method discussed here, therefore we will start with a presentation of the basic issues regarding phasing. We will then discuss two of the most widely used haplotype based statistics: Integrated Haplotype Score (iHS (iHS Voight et al., 2006)) and Cross Population Extended Haplotype Homozygosity ((XP-EHH Sabeti et al., 2007)). We finalize with some general comments applicable regarding the future of haplotype based methods. Most of the observations made here are based on experience with human datasets. For humans there is generally much more information available than for other species. In some cases the applicability of these approaches might not be feasible due to the lack of a fundamental artifact (e.g. reliable linkage maps or information about ancestral/derived alleles). In this presentation we trade rigour for clarity and simplicity. For precise definitions, readers are directed to the reference list. Phasing In a diploid individual, genotyping data does not directly provide information about the gametic phase (the original allelic combinations than an individual received from each parent), therefore methods to reliably infer the phase are required. Any application of a haplotype based method to detect selection is highly dependent on the quality of the Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 6 phasing. Widely used applications to phase datasets include fastPHASE (Scheet and Stephens, 2006), Beagle (Browning and Browning, 2007) and ShapeIt (Delaneau et al., 2011). Several studies (see, e.g. Andrés et al., 2007; Marchini et al., 2006; Browning, 2008) have been done using simulation or human datasets in order to determine factors influencing the quality of phasing We can use the switch error rate Stephens and Donnelly (2003), i.e., the proportion of heterozygous positions mis-assigned relative to the previous heterozygous position as a measure of accuracy of phasing algorithms. The number of individuals phased is known to be a fundamental variable for phasing accuracy (Marchini et al., 2006) but our (unpublished results) suggest that effective population size (Ne) might be a more important factor: A larger Ne increases the switch error rate (Figure 1). Figure 1: Switch error rate as a function of sample size and Ne. The X-axis is the sample size (i.e., the number of individuals phased together) and the Y-axis is the switch error rate. The blue line depicts a human population know for its high Ne, whereas the green line shows a population with low Ne. Extrapolation of these results to other species should be done with care because elements like recombination rates and marker density can vary substantially, but they can serve as general guidelines for phasing of other species. A decisive factor to choose a phasing algorithm might be the existence of a linkage map for the species being studied as not all phasing algorithms require one (e.g. Beagle). But, published comparisons suggest that ShapeIt (Marchini et al., 2006) (in agreement with our unpublished results) might have the best statistical performance and linkage maps will be needed for most selection tests anyway. There are many other important issues related with phasing, most notably allele imputation and the use of reference populations, which will not be addressed here. The fundamental message regards the sample size being phased: while there are some exceptions phasing more individuals simultaneously lowers the switch error rate. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 7 Haplotype based selection detection The two methods presented here will be based on the concept of Extended Haplotype Homozygosity (EHH) Sabeti et al. (2002): the probability that two randomly chosen chromosomes in a population carry an haplotype of interest. If an haplotype carries a mutation that has been recently selected, it is expected that such haplotype has bigger EHH than haplotypes carrying neutral mutations. Integrated Haplotype Score (iHS) The problem of the above definition is that EHH is also dependent on other factors, notably haplotypes in areas of high recombination will have EHH values lower than haplotypes in other areas (even if under selection). iHS addresses this issue by first computing the decay (i.e. integrating) of EHH from a core SNP of interest until EHH reaches 0.05 for each allele at a SNP position and then making the log-ratio between both alleles. The insight is that the EHH of the selected allele can be compared with the EHH of the non-selected allele as the recombination strength around both alleles is equal. As there will be a score per SNP (with an exception pointed below), the decision on which areas of the genome are under selection will be done using an empirical distribution (as there are typically hundreds of thousands of SNPs, i.e. observations). Typically the top 1% of the absolute iHS values are inspected for genes under selection. As the number of points will still be too high (e.g., with an array with 1 million SNPs there will be 10,000 top 1% observations) a further step is normally taken to reduce the number of areas to analise. A common strategy (Pickrell et al., 2009) involves analyzing the human genome in windows of 200kb (approximately 0.2cM) in size and rank them by the percentage of absolute iHS scores above 2. An implication of this approach is that windows with low marker density (below 20 in Pickrell et al. (2009)) are dropped as the number of samples per window is not enough to produce a meaningful comparison. The first caveat with iHS is that it requires information about which allele is ancestral/derived. This is needed as the distribution of the ratio is sensitive to the frequency of the derived allele (Figure 2) (and the method uses the frequency of the derived allele to calibrate the score). The second caveat is that there have to be enough samples of both alleles to be able to compute EHH per allele: for a sample size of 20 individuals (40 reads), a minimum allele frequency (MAF) of 5% (2 samples of MAF allele) is required. This entails that (i) loci with low MAFs will not have iHS computed and (ii) if they are computed but the sample size is still small there is a possibility of skewing EHH. This effect will probably more important in high Ne populations with a bigger frequency of loci with low MAFs. This will have impact on the statistical power to detect selected loci and iHS typically requires more samples than XPEHH (Figure 3). Most importantly, from the same figure, the power to detect selection with iHS is maximised with the frequency of the selected allele is at intermediate values. Interestingly, from figure 3 it seems that the power of iHS to detect selected loci is quite low… Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 8 Figure 2: Mean and standard deviation of iHS scores as a function of the frequency of the ancestral allele. The standard deviation of this example is quite uncommon as the sample size is 120 individuals: with iHS and more common sample sizes the standard deviation (a good measure of lack of reliability) will increase at the extremes. The mean has the typical behavior with iHS. Cross Population Extended Haplotype Homozygosity (XP-EHH) XP-EHH takes a different approach by comparing, per SNP, the EHH scores between two populations: the log-ratio between the EHH score of population A divided by the EHH score of population B. High positive values suggest that a region is under selection in population A (higher EHH, thus longer haplotypes), whereas the converse is true if the value is negative. As in iHS, outliers from the empirical distribution are potentially indicative of selection (considering extreme positive or negative values – on even both – depends on the research problem). As with iHS, XP-EHH scores can be clustered together in windows of 200kb, but the criteria to evaluate each window is the maximum XP-EHH value of the window (not unlike what is suggested for FST when there many observations (Akey et al., 2004)). XP-EHH requires less individuals than iHS for the same statistical power (Figure 3) – though this is the number of samples per population. Another difference is that XP-EHH has more power when the selected allele tends to fixation. This approach has no need of information about the allele (ancestral/derived) but requires obviously a second population sampled. This reference population should be carefully chosen as signal overlaps between both populations might hide some of the selection areas on the population of interest. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 9 Figure 3: Power of iHS (A) and XP-EHH (B) based on a simulated African demography (Figure taken from Pickrell et al. (2009) supplementary material). iHS has maximum power at intermediate allele frequencies, whereas XP-EHH requires the derived allele frequency to be near fixation. Discussion The successful application of these and other similar methods is dependent on having enough genotyping density and sometimes other data like linkage maps and ancestral/derived allele information. While such information might still not be available for many species, fast developments in sequencing might make such methods feasible somewhere in the near future for a broad spectrum of taxa. Many of the (statistical) performance studies of these methods have been made using computational models of human demography (e.g., the cosi model (Schaffner et al., 2005)). This is unfortunate because there is no research done on the impact of important parameters like effective population size and selection strength on these estimators. There is also no study on the compound effects of demography and phasing. It can be speculated that these estimators (especially iHS) have worse performance with high Ne populations, but it is not known if this is caused by higher switch error rates at phasing or a property of the method itself. Indirectly, and because Pickrell et al. (2009) reports better performance with simulated African human demographies rather than European demographies, we can speculate that iHS might perform better with high Ne, but the switch error rate is a more important factor, effectively inverting the result. On the other hand, with higher percentage of rare alleles in high Ne populations, we could speculate that under-performance is inherent to the method due to the method’s sensitivity to alleles with low frequency. There is arguably a need for more research on the performance of these methods in non-humans. Another field of ongoing research is the precise pinpointing of causative mutations. Most methods do not have spatial precision, i.e., the signals tend to exist in a somewhat large area encompassing the area under selection. For instance the (very strong) signal of lactase tolerance in North-Western Europeans spans around 8 genes for iHS. Several alternatives have been suggested (e.g. CMS Grossman et al. (2010)), but they have so far revealed problematic. For instance CMS requires the creation of a accurate demographic computational model, which is difficult even with many human populations and surely much more complex with the vast majority of other species. A side observation is that while simulations suggest that iHS is more powerful at intermediate frequencies and XP-EHH near fixation of the selected allele, it is impossible to know, by that criteria, which one to choose (there will be many signals around the causative mutation, with varying derived allele frequencies). On the other hand, if the frequency of the phenotype is known in the population, that information might be useful to interpret both statistics. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 10 Finally, it is worth noting that iHS and XP-EHH were designed to detect directional selection and that polygenic adaptation (where multiple genes contribute to a phenotype without a “hard-sweep” signature being generated) is currently an area of intense research (Pritchard et al., 2010). While we might see new methods to detect this kind of adaptation there have been attempts (Metspalu et al., 2011) to use these approaches to detect polygenic adaptation. The strategy is to use gene enrichment analysis on top of iHS/XP-EHH results: the top 1% windows of the genome are tested for enrichment (i.e. if some gene ontology – GO – terms are over-expressed in the selected areas compared to the whole genome). Not only has this approach not been thoroughly evaluated but also it is quite improbable that it can be successfully used outside humans and a handful of other model species for which there is extensive GO annotations. Next generation sequencing presents us with new ways to analyze our data. The datasets generated for human data are normally more dense and better annotated that for other species, but this is mostly a time issue: what is available to analyze human data today will be usable with more and more species in the near future. Hopefully this small introduction will have helped researchers to critically assess the applicability of these or similar methods to their existing or future datasets. References J.M. Akey, M.A. Eberle, M.J. Rieder, C.S. Carlson, M.D. Shriver, D.A. Nickerson, and L. Kruglyak. Population history and natural selection shape patterns of genetic variation in 132 genes. PLoS biology, 2(10):e286, 2004. A.M. Andrés, A.G. Clark, L. Shimmin, E. Boerwinkle, C.F. Sing, and J.E. Hixson. Understanding the accuracy of statistical haplotype inference with sequence data of known phase. Genetic epidemiology, 31(7):659–671, 2007. S.R. Browning. Missing data imputation and haplotype phase inference for genome-wide association studies. Human genetics, 124(5):439–450, 2008. S.R. Browning and B.L. Browning. Rapid and accurate haplotype phasing and missing-data inference for whole-genome association studies by use of localized haplotype clustering. The American Journal of Human Genetics, 81(5):1084–1097, 2007. S.R. Browning and B.L. Browning. Haplotype phasing: existing methods and new developments. Nature Reviews Genetics, 12(10):703–714, 2011. O. Delaneau, J. Marchini, and J.F. Zagury. A linear complexity phasing method for thousands of genomes. Nature Methods, 9(2):179–181, 2011. S.R. Grossman, I. Shylakhter, E.K. Karlsson, E.H. Byrne, S. Morales, G. Frieden, E. Hostetter, E. Angelino, M. Garber, O. Zuk, et al. A composite of multiple signals distinguishes causal variants in regions of positive selection. Science, 327(5967):883– 886, 2010. J. Marchini, D. Cutler, N. Patterson, M. Stephens, E. Eskin, E. Halperin, S. Lin, Z.S. Qin, H.M. Munro, G.R. Abecasis, et al. A comparison of phasing algorithms for trios and unrelated individuals. The American Journal of Human Genetics, 78(3):437–450, 2006. M. Metspalu, I.G. Romero, B. Yunusbayev, G. Chaubey, C.B. Mallick, G. Hudjashov, M. Nelis, R. Mägi, E. Metspalu, M. Remm, et al. Shared and unique components of human population structure and genome-wide signals of positive selection in south asia. The American Journal of Human Genetics, 89(6):731–744, 2011. J.K. Pickrell, G. Coop, J. Novembre, S. Kudaravalli, J.Z. Li, D. Absher, B.S. Srinivasan, G.S. Barsh, R.M. Myers, M.W. Feldman, et al. Signals of recent positive selection in a worldwide sample of human populations. Genome Research, 19(5):826–837, 2009. J.K. Pritchard, J.K. Pickrell, and G. Coop. The genetics of human adaptation: hard sweeps, Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 11 soft sweeps, and polygenic adaptation. Current Biology, 20(4): R208–R215, 2010. P.C. Sabeti, D.E. Reich, J.M. Higgins, H.Z.P. Levine, D.J. Richter, S.F. Schaffner, S.B. Gabriel, J.V. Platko, N.J. Patterson, G.J. McDonald, et al. Detecting recent positive selection in the human genome from haplotype structure. Nature, 419(6909):832–837, 2002. P.C. Sabeti, P. Varilly, B. Fry, J. Lohmueller, E. Hostetter, C. Cotsapas, X. Xie, E.H. Byrne, S.A. McCarroll, R. Gaudet, et al. Genome-wide detection and characterization of positive selection in human populations. Nature, 449(7164):913–918, 2007. S.F. Schaffner, C. Foo, S. Gabriel, D. Reich, M.J. Daly, and D. Altshuler. Calibrating a coalescent simulation of human genome sequence variation. Genome Research, 15(11):1576–1583, 2005. P. Scheet and M. Stephens. A fast and flexible statistical model for large-scale population genotype data: applications to inferring missing genotypes and haplotypic phase. The American Journal of Human Genetics, 78(4):629–644, 2006. M. Stephens and P. Donnelly. A comparison of bayesian methods for haplotype reconstruction from population genotype data. The American Journal of Human Genetics, 73(5):1162–1169, 2003. B.F. Voight, S. Kudaravalli, X. Wen, and J.K. Pritchard. A map of recent positive selection in the human genome. PLoS biology, 4(3):e72, 2006. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 12 CONTRIBUTIONS OF POPULATION GENETICS TO TREE CONSERVATION: CHALLENGES UNDER CHANGING SCENARIOS Andrea C. Premoli 1*, Paula Mathiasen1, M. Cristina Acosta 1,2 1 Laboratorio Ecotono, Universidad Nacional del Comahue-CONICET IMBIV CONICET-Universidad Nacional de Córdoba *Email: [email protected] 2 ABSTRACT The study of multiple populations and species of a given region using molecular markers is a valuable tool to design conservation strategies. These may be guided by the analysis of species of conservation concern such as those under threat or endangered. Some of such species have a restricted range and thus may be genetically depauperate as a result of genetic drift that tends to erode genetic diversity within populations. Nonetheless, genetic analysis of species pairs occurring in sympatric populations show that range alone may not be sufficient to explain genetic patterns. On the other hand, while widespread woody taxa may be relatively common through a region, those occurring as almost pure populations may also be of conservation value given that an entire community depends upon them. This is particularly the case of species that inhabit environments prone to suffer from changes in climate such as altitudinal gradients of temperate regions. Although neutral markers may yield information on patterns of genetic diversity with elevation, quantitative traits including ecophysiological characteristics from experimental trails can be used as a valuable tool to predict species responses under warming. BACKGROUND The application of molecular techniques has greatly contributed to understand the processes involved in shaping the gene pool of tree species relevant in conservation. Such tools provided significant information on the distribution of genetic polymorphisms along species’ ranges. As a result, significant bulk of studies yielded information on the hierarchical distribution of genetic variation in their components within- and among-distinct populations. Also, it is of conservation value the existence of centers of genetic diversity as well as the presence of unique variants. While the former are the raw material for adaptive variation and thus evolutionary change, the latter may provide information on directional selection under novel and/or unique environments. All this genetic information that is necessary for it to be used to design conservation practices. Many conservation genetic studies were developed on species of conservation concern. These are species that are considered rare some of which are at risk. Nonetheless the concept of rarity has been largely discussed in the conservation literature. The most comprehensive classification of distinct forms of rarity in plants was made by Rabinowitz and collaborators (1986) who distinguished sevens such types that arose from the combination of geographic range, habitat specificity, and population size. Therefore taxa may distinctively be rare. While some could be rare because of restricted range, others although widespread may consist of small populations associated to particular habitat types. Thus, different forms of rarity may result in distinct genetic consequences. Early studies have shown that for many plant species the distribution range in combination with the breeding system canbest explain patterns of diversity of natural populations (Hamrick and Godt 1989). In particular, widespread and generally outcross species maintain higher genetic diversity than other taxa Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 13 with distinct traits such as those with small range that may suffer the effects of genetic drift which tend to erode the genetic diversity within populations. Later similar studies considered the comparison among closely related taxa to provide a phylogenetic control and thus to directly test differences in traits of interest such as the range effect (e.g. Gitzendanner and Soltis 2000). The use of molecular markers is a powerful tool to screen multiple populations and species and it has greatly contributed to the development of the conservation genetics discipline. Because they are neutral, additional data from quantitative traits is needed to understand adaptive responses due to environmental influences. Under changing scenarios this information is crucial given that organisms overcome such stressful conditions via dispersal, plastic changes, or populations may undergo evolutionary adaptation (Hoffman and Sgro 2011). In addition, while populations located towards the center of the geographic range may buffer those effects, such modifications may be notorious towards species’ margins because marginal populations must suddenly adapt to ecological conditions that were previously only found outside the range (Bridle and Vines 2007) In a series of case studies at regional geographic scales we tested the hypothesis if geographic range is a good predictor of genetic characteristics to be used in the design of conservation efforts. We also developed studies at the local scale using distinct molecular markers and adaptive traits towards distribution margins to predict potential responses under global change in mountain environments. RESULTS AND DISCUSSION The comparison of woody related taxa endemic to south temperate forests with different latitudinal distribution prompted the question if range extent explains genetic traits. These are conifers within the Cupressaceae that coexist in wet environments. While Fitzroya cupressoides (hereafter Fitzroya) has a more restricted range, Pilgerodendron uviferum (hereafter Pilgerodendron) has the most extended latitudinal distribution of any conifer of the temperate Andes. Both are monotypic genera and are listed as CITES Appendix I which means that they are threatened with extinction and exploitation and international trade is banned. Following similar sampling designs and laboratory protocols we collected fresh leaf tissue along their distributions for genetic analysis. Some populations were sympatric given that both conifers coexist along their distribution range particularly in northern Patagonia. Results from isozyme analysis based yielded higher genetic diversity and lower amongpopulation divergence in the range restricted Fitzroya than Pilgerodendron based on 12 and 14 loci, respectively. While reduced genetic polymorphism in the widespread Pilgerodendron was an unexpected result, other life history traits different than range alone may explain the pattern observed. Despite its smaller total range, Fitzroya usually consists of larger populations which also occupy distinct habitats. Although widespread, Pilgerodendron most often is associated to inundated terrains which are scattered throughout the Patagonian region where it occurs as relatively small and isolated populations. Therefore, range in combination with population size and the degree of population connectivity may better explain genetic traits in this species. Results of those studies also yielded pockets of high genetic diversity throughout their current ranges including southern, i.e. cold, populations (Premoli et al. 2000 conservation Genetics; 2002 Diversity and Distributions). In contrast to scenarios proposed for tree taxa of the Northern Hemisphere during cold phases that resulted in glacial refugia towards southern, i.e. warmer, areas and postglacial colonization to the north after glacial retreat, genetic evidence on the cold tolerant species Fitzroya and Pilgerodendron suggested the hypothesis of local tree survival in multiple refugia during ice ages in Patagonia. Understanding species’ responses under different climates is relevant in long-term conservation given that we might be able to predict potential future responses. In particular, if cold hardy taxa were able to endure the ice ages without major range shifts, they may be prone to suffer from local population extirpation under warmer trends. Conservation Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 14 actions will be probably needed in populations outside protected areas. Total range of Fitzroya in Argentina is only 20,625 ha whereas in Chile attains an order of magnitude greater extent of 264,982 ha. However, while 85% of its area is protected in Argentina only 17% is so in Chile. In addition, Pilgerodendron in Chile occupies an area of 970,326 ha, 70% of which are protected. Meanwhile in Argentina consists of scatter small populations the majority of which are included within protected areas (Rovere et al. 2002 Bosque). Therefore, populations of Fitzroya outside protected areas are threatened and genetic tools can be used to guide conservation actions. Populations towards the southern range in Argentina are reservoirs of genetic diversity and may be used as source populations to restore nearby degraded areas. Distribution patterns of genetic polymorphisms of rare taxa are often used to direct conservation efforts mainly at local spatial scales. Nonetheless widespread taxa may provide valuable information at larger geographic scales. In particular, patterns of genetic diversity within populations and among-population divergence of widespread trees may guide the detection of areas valuable in conservation. However, similarly widespread taxa may show different genetic patterns. The analysis of distribution patterns of genetic polymorphisms of sympatric populations along the latitudinal range of two widespread Nothofagus yielded contrasting results. These are the deciduous cold tolerant species Nothofagus pumilio and Nothofagus antarctica. They are found along the total latitudinal range of the temperate forests of Argentina and Chile. They have different autoecological traits: N. pumilio is the species that characterizes mountain areas and presents clinal variation along altitudinal gradients whereas N. antarctica shows ecotypic variation at different habitat types. Post disturbance regeneration occurs predominantly by seed in N. pumilio and although N. antarctica produces seeds with reduced germination rates, it vigorously resprouts from base trunks. The analysis of 20 sympatric population pairs by isozyme electrophoresis along latitude showed that the sprouter N. antarctica maintains significantly greater average genetic diversity than tah found in N. pumilio. Thus sprouting has favoured the maintenance of similarly diverse genets in relatively large populations along its range that were probably less affected by drift through time (Acosta et al. 2012). In contrast, N. pumilio had increased diversity towards southern, i.e. colder latitudes. Ecological niche modeling provided evidence that in the south N. pumilio has probably persisted in ice free areas towards the steppe (Premoli et al. 2010). In the northern end of the range, i.e. warm, N. pumilio is mostly restricted to mountain habitats where it has been historically affected by changes in climate and reduced availability of niches for persistence. In the south, more stable conditions probably favored long-lasting persistence of genotypes. Similarly to nuclear polymorphisms, non-coding sequences of the chloroplast (cpDNA) along the entire latitudinal range of N. pumilio and N. antarctica yielded greater haplotype diversity in the latter (M.C. Acosta unpublished). However, at any one location, both species shared cpDNA sequences. This was interpreted as chloroplast capture events resulting from recurrent past and contemporaneous hybridizations and introgressions (Acosta and Premoli 2010). Nonetheless, they have maintained species’ identity by ecological selection. In sum, genetically polymorphic populations in combination with plasticity in diverse habitats (Steinke et al. 2008), have resulted in greater resilience of N. antarctica under changing scenarios. On the other hand, climate oscillations may have resulted in the loss of genetic variants due to genetic bottlenecks and increased inbreeding of N. pumilio particularly in northern areas (Mathiasen and Premoli 2010). Therefore, predominantly non sprouter N. pumilio may be prone to suffer population extirpation under warming particularly in the north (Acosta et al. 2012). Altitudinal gradients of northern Patagonia are dominated by N. pumilio where it occurs as almost pure stands along more than 2000 km of the high-elevation Andes. At its northern range, inhabits climates of Mediterranean regime, with wet winters and dry summers. A series of studies on dry forests of N. pumilio at its northern range provided a synthesis on ecophysiological responses under natural conditions in the field, common gardens, and reciprocal transplants. The aim was to analyze if the variation along such gradients had a Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 15 genetic basis and if such genetic differences may affect potential responses under warming. Also those studies evaluated the extent to which ecophysiological and functional traits of N. pumilio result from distinct selection pressures with elevation by means of plasticity or genetically based adaptation. Population genetic studies using isozyme markers and microsatellites showed a decrease in genetic diversity with elevation (Premoli 2003). In addition lower genet diversity was measured at isozyme and microsatellite markers in highelevation populations (P. Mathiasen unpublished). Reduced opportunities for establishment in high elevation populations may erode genetic diversity. Photosynthetic rates were higher in plants from the upper altitudinal limit under field conditions which were also maintained in the common garden (Premoli and Brewer 2007). This suggests a genetic control on net photosynthesis and also that no shortage for carbon assimilation exist at high elevation. Therefore, photosynthetic responses and morphological traits are probably related to nitrogen economy and a shorter growing season at high elevations. In contrast, conductance and stomatal density showed plastic responses which will be advantageous for a deciduous species like N. pumilio given that the growing season coincides with drought. Additionally, plants from contrasting elevations had significant differences in terms of architectural features of individuals, as well as leaf morphology and phenology under the common gardens suggesting strong genetic control (Premoli et al. 2007). Reciprocal transplants between contrasting elevations indicated that plants of low-elevation origin, which in turn were the most genetically diverse by molecular markers, outgrew high-elevation ones. Bioclimatic data showed that drought and high temperatures result in limited growth and more profuse branching (Mathiasen 2010). These results suggest that ecophysiological characteristics in N. pumilio combine genetic and plastic responses. Nevertheless, genetically fixed traits will probably limit adjustments particularly of high-elevation plants under changing conditions. On the other hand, plasticity in combination with greater genetic variation of low-elevation plants may favor their performance and thus they may ascend in elevation under warmer climates. CONCLUSIONS Molecular evidence using distinct types of markers in combination with ecophysiological evidence and ecological niche modeling provide information that can be used as guidelines for forest conservation genetics. Pockets of high genetic diversity throughout species’ ranges call for the design of conservation strategies considering multiple-population approaches which in some cases may involve beyond borders actions. Although not endangered, widespread taxa may suffer from significant range shifts under global change. Genetic information in concert with the location of areas where potential expansions and/or contractions will take place in the near future may assist the development of conservation actions. Therefore, multidisciplinary approaches are needed. This may include information on neutral and adaptive markers such as variation in ecophysiological responses to novel or changing conditions, and ecological niche modeling. Patterns of genetic diversity of widespread taxa such as those yielded by cpDNA polymorphisms may elucidate past vicariant events and cryptic secondary contact areas that could have also shaped biodiversity patterns. Thus, phylogeographic structures in combination with biodiversity hotspots may help to design conservation guidelines at larger geographic scales. The establishment of experimental trials of adaptive traits and monitoring programs of natural populations particularly at species’ distributions margins will greatly contribute to gain information valuable in conservation. The conservation genetics of forest resources poses a significant challenge to managers, conservation practitioners, and scientists whose decisions to be undertaken will not be excepted from controversy. Future physical settings may well be beyond conditions that some taxa have experienced in the past (Millar et al. 2007) which not only may affect within species’ adjustments but also may influence species’ associations. Species populations and communities of conservation value or in restoration need may face new environmental Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 16 settings where previous paradigms on past forest range and variability may not fully apply. Also conservation actions will probably include areas outside protected areas where also different stakeholders will need to get involved. REFERENCES Acosta,M.C. and Premoli,A.C. (2010) Evidence of chloroplast capture in south American Nothofagus (subgenus Nothofagus, Nothofagaceae). Mol. Phyl. Evol., 54, 235-242. Acosta,M.C., Mathiasen,P. and Premoli,A.C. (2012) Predominant regeneration strategy results in species-specific genetic patterns in sympatric Nothofagus s.s. congeners (Nothofagaceae). Aust. J. Bot., 60, 319–327. Bridle,J.R. and Vines,T.H. (2007) Limits to evolution at range margins: when and why does adaptation fail?. TREE, 22, 140-147. Gitzendanner,M.A. and Soltis,P.S. (2000) Patterns of genetic variation in rare and widespread plant congeners. Am. J. Bot., 87, 777-786. Hamrick,J.L. and Godt,M.J. (1989) Allozyme diversity in plant species. In Brown,A.H.D., Clegg,M.T., Kahler,A.L. and Weir,B.S. (eds.), Plant Population Genetics, Breeding and Germplasm Resources. Sinauer, Sunderland, Mass. pp. 43-63. Hoffman,A.A. and Sgro,C.M. (2011) Climate change and evolutionary adaptation. Nature, 470, 479-485. Mathiasen,P. and Premoli,A.C. (2010) Out in the cold: genetic variation of Nothofagus pumilio (Nothofagaceae) provides evidence for latitudinally distinct evolutionary histories in austral South America. Mol. Ecol., 19, 371-385. Millar,C.I., Stephenson,N.L. and Stephens,S.L. (2007) Climate change and forests of the future: managing in the face of uncertainty. Ecol. Appl., 17, 2145–2151. Premoli,A.C. (2003) Isozyme polymorphisms provide evidence of clinal variation with elevation in Nothofagus pumilio. J. Hered., 94, 218-226. Premoli,A.C. and Brewer,C.A. (2007) Environmental vs. genetically driven variation in ecophysiological traits of Nothofagus pumilio from contrasting elevations. Aust. J. Bot., 55, 585-591. Premoli,A.C., Kitzberger,T. and Veblen,T.T. (2000) Conservation genetics of the endangered conifer Fitzroya cupressoides in Chile and Argentina. Cons. Genet., 1¸57-66. Premoli,A.C., Souto,C.P., Rovere,A.E., Allnutt,T.R and Newton,A.C. (2002) Patterns of isozyme variation as indicators of biogeographic history in Pilgerodendron uviferum (D. Don) Florín. Div. Distrib., 8, 57-66. Premoli,A.C., Raffaele,E. and Mathiasen,P. (2007) Morphological and phenological differences in Nothofagus pumilio from contrasting elevations. Aust. Ecol., 32, 515-523. Premoli,A.C., Mathiasen,P. and Kitzberger,T. (2010) Southernmost Nothofagus trees enduring ice ages: genetic evidence and ecological niche retrodiction reveal high latitude (54ºS) glacial refugia. Palaeogeogr. Palaeocl., 298, 247-256. Rabinowitz,D., Cairns,S. and Dillon,T. (1986) Seven forms of rarity and their frequency in the flora of the British Isles. In Soulé,M.E. (ed.). Conservation biology: the science of scarcity and diversity. Sinauer Associates, Sunderland, MA. pp. 182-204. Rovere,A.E., Premoli,A.C. and Newton,A.C. (2002) Estado de conservación del Ciprés de las Guaitecas (Pilgerodendron uviferum D. Don Florin) en la Argentina. Bosque, 23, 1119. Steinke,L., Premoli,A.C., Souto,C.P. and Hedrén,M. (2008) Adaptive and neutral variation of the resprouter Nothofagus antarctica growing in distinct habitats in north-western Patagonia. Silva Fenn., 42, 177-188. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 17 GENÔMICA DE POPULAÇÕES: APLICAÇÕES NA GENÉTICA DA CONSERVAÇÃO DE PLANTAS E NO MANEJO DE INSETOS-PRAGAS Maria Imaculada Zucchi1*, Camila Menezes Trindade. Macrini1, Marcos Vinícius Bohrer 1 2 Monteiro Siqueira e Vitor Antonio Corrêa Pavinato APTA - Agência Paulista de Tecnologia dos Agronegócios - Pólo Centro Sul. 2 Universidade Estadual de Campinas *Email: [email protected] e [email protected] 1 Palavras-chave: genética de populações, AFLP, sequenciamento de nova geração, SNPs, “genome scan”, variação genética adaptativa. Resumo: Atualmente vivemos uma revolução sem precedentes dentro do estudo genético de populações. Com os avanços tecnológicos nas ferramentas moleculares, obtemos dados de variação no DNA em quantidade nunca antes possível. Atento a essa revolução os geneticistas tem aproveitado cada vez das novas tecnologias de seqüenciamento nos trabalhos de pesquisa. Com a utilização de novas plataformas de seqüenciamento, chamadas de “Sequenciamento de Nova Geração” (do inglês “Next Generation Sequencing”) podemos obter uma quantidade enorme de polimorfismo de DNA a um baixo custo por loco. As aplicações vão além do estudo da diversidade genética. A genômica de populações pode ser entendida como o uso de ampla amostragem do genoma para identificar e separar locos sobre efeito específico (não neutros) de locos sobre efeito amplo (neutros) com o objetivo de aumentar nosso entendimento sobre eventos micro evolutivo. Hoje podemos estudar a adaptação de organismos a pressões seletivas impostas pela natureza. Neste contexto, esta palestra irá abordar a aplicação dos conhecimentos da genômica de populações com o objetivo de entender a forma como organismos se adaptam a seus ambientes, frente às mudanças ecológicas que ocorrem na natureza e causadas pelo homem. Estamos desenvolvendo trabalhos buscando entender adaptações ecológicas de uma espécie de inseto, tido como praga agrícola a mudanças na composição do agroecossistema agrícola e trabalhos que buscam entender a diversidade ligada a áreas naturais e em restauração florestal. A ecologia molecular é um ramo da biologia evolutiva que aplica os conhecimentos da genética de populações, evolução molecular e mais as recentes ferramentas genômicas em estudos ecológicos. Como tema de pesquisa, vem ganhando espaço por permitir estudar aspectos ecológicos sob a óptica da biologia evolutiva. As áreas que compõe a genética ecológica vão desde a aplicação de conceitos da genética de populações para acessar a diversidade genética dentro e entre populações, dinâmica de fluxo gênico, a estudos de filogeografia e adaptação molecular. Embora um pouco diversificada, as áreas de pesquisa dentro de ecologia molecular são unidas pelo uso de marcadores moleculares que permitem acessar as informações genéticas e assim compreender a ecologia e a evolução de organismos na natureza (Freeland 2003). Os marcadores moleculares microssatélites são os preferidos e os mais utilizados atualmente para estudos de ecologia molecular. Conhecido como “seqüência de repetição simples em tandem” (SSR “Simple Sequence Repeats”), os marcadores microssatélites são altamente polimórficos e abundantes nos genomas de eucariotos (Goldstein & Schlotterer Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 18 1999; Kalia et al, 2011, Seeb et al, 2011). Suas características inerentes, tais como alto polimorfismo, genotipagem fácil e confiável, além de herança codominante, associada a possibilidade de uso de métodos estatísticos poderosos como Bayesiana e métodos de máxima verossimilhança (Luikart 1999) levou esses marcadores a serem amplamente utilizados pelos geneticistas de populações de insetos e ecologistas (Beadell et al. 2010; Pavinato et al. 2011). Nosso grupo de pesquisa está envolvido em duas linhas de pesquisa: o estudo ecológico evolutivo de insetos e o estudo da dinâmica evolutiva por trás da restauração florestal. Em ambas as frentes, o poder desses marcadores é conhecido em estudos de ecologia molecular. Destacamos alguns exemplos de aplicações em estudos com insetos: estimação de diversidade e estrutura genética para obter informações sobre ecologia básica (Endersby et al. 2007); investigação de possíveis padrões de mudanças na composição genética de populações associada a planta hospedeira (Carletto et al. 2009); e detecção de descontinuidades espaciais (Abila et al. 2008) e temporais (Franck & Timm 2010) e divergência genética determinada por especiação simpátrica (Santos et al. 2010). Já no estudo genético de plantas, os locos microssatélites permitem o entendimento mais refinado de estruturas populacionais (Slatkin 1995) e podem se tornar uma importante ferramenta para o entendimento e caracterização de germoplasma de várias espécies cultiváveis (Siqueira et al 2010). A utilização dos microssatélites pode igualmente fornecer subsídios para o estabelecimento de áreas destinadas à conservação de espécies vegetais ameaçadas (Heywood; Iriondo, 2003; Oliveira et al, 2006). Assim, uma nova área de pesquisa nasce dentro da genética de populações e permite identificar regiões genômicas ligadas a adaptações de espécies ao seu ambiente. Essa é conhecida como Genômica de Populações, pois nos permite estudar em populações naturais, utilizando ferramentas genômicas de nova geração. Essa abordagem pode ser entendida como o uso de ampla varredura do genoma (“genome scan”) para identificar e separar locos sobre efeito específico (sobre seleção, mutação, acasalamentos preferenciais e recombinação) de locos sobre efeito amplo (sobre deriva genética, efeito de gargalho genético, fluxo gênico e endogamia) com o objetivo de aumentar nosso entendimento sobre eventos micro evolutivo (“short term-evolution”) (Black et al. 2001). Com a genômica de populações fazemos um “scan” no genoma buscando locos com padrão de diferenciação “outliers”. Esses locos, que na verdade são regiões genômicas compostas por um número desconhecido de genes, podem nos levar as bases genéticas da adaptação. Para isso necessitamos de numerosos marcadores de DNA e de genotipagem em larga escala, pois assim podemos amostrar grande parte do genoma. Além disso, precisamos de estratégias de amostragem populacional, pois o delineamento experimental permite associar gradientes de pressões seletivas (variação de estresse abiótico/biótico) com a variação genética. Dessa forma é possível identificar regiões genômicas de variação não-neutra e associá-las, por meio de testes estatísticos, com eventos de seleção local/ e ou ecológica que estão sujeitas as populações da espécie estudada (Luikart et al. 2003; Allendorf et al. 2010). Para acessar uma parte maior do genoma, temos que utilizar muitos marcadores moleculares, ou seqüenciar o genoma dos organismos e populações estudadas. A utilização de marcadores microssatélites seria não recomendada para a maioria dos organismos, pois além do custo para se obter uma grande quantidade de locos, leva se muito tempo, sendo inviável, portanto em estudos de curta duração. Para isso, os primeiros marcadores a serem utilizados nos estudos de genômica de populações foram o s marcadores AFLPs do inglês: “Amplified fragment length polymorphism” (Polimorfismo de fragmento amplificado). Alguns exemplos de aplicações em ecologia molecular de insetos podem ser citados. Primeiro, a ampla varredura genômica (“genome scan”) através da genotipagem de aproximadamente 600 indivíduos; com 253 locos AFLP, permitiu detectar locos com distribuição diferencial em amostras de Diabrotica virgifera, uma espécie de besouro considerada praga agrícola, associados a diferentes regimes de rotação de cultura. Apesar Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 19 da baixa correlação encontrada entre polimorfismo (“outliers”) e os regimes de rotação de cultura, foi possível acessar polimorfismo relacionado a pressão seletiva (Miller et al. 2007). Outro trabalho interessante, através da genotipagem de 15 populações de Neochlamisus bebbianae (“leaf beetle”) uma espécie de besouro, coletadas em duas plantas-hospedeiras distintas (duas espécies de coníferas), com 415 locos AFLP permitiu relacionar locos com distribuição “outlier” (15% dos locos) com a planta-hospedeira onde a população do inseto foi coletada. Através desse estudo foi possível refinar as estimativas populacionais com a retirada dos locos “outliers” e detectar regiões genômicas com variação genética não-neutra com potencial para se chegar em genes candidatos relacionados com a adaptação do inseto com a planta-hospedeira (Egan et al. 2008). Outro estudo semelhante, considerando a relação planta-hospedeira e variações ambientais abióticas (não definida), permitiu relacionar marcas AFLP com gradiente de pressões seletivas encontradas na natureza (amostragem em escalas geográficas distintas). Entretanto os autores ressaltam a necessidade de utilizar métodos estatísticos de correlação para relacionar a variação na distribuição das marcas com as variações ambientais sob as quais as populações amostradas se encontram (Manel et al. 2009). Trabalhos desenvolvidos com marcadores AFLP em genômica de populações em plantas começaram a surgir na literatura científica na década de 90. Muluvi et al (1999) usaram 140 indivíduos de uma importante espécie arbórea (Moringa oleifera Lam.) e a partir de 236 marcas de AFLP, permitiu-se concluir que os altos níveis de diferenciação populacional detectados sugeriram que seu centro de origem devia ser preservado e usado como uma importante fonte de recurso genético. Em um trabalho com duas espécies de palmeiras (Howea forsteriana e Howea belmoreana) endêmicas da ilhas “Lord Howe”, situadas na oriental da Australia, permitiu desvendar o processo de especiação simpátrica em plantas. Espera-se que nos eventos de especiação simpátrica a variação genética nãoneutra seja de maior importância, já que a separação das linhagens ocorre em função da adaptação da diferentes condições ecológicas. Com a genotipagem de indivíduos dessas duas espécies com 274 locos AFLPs, foi possível detectar poucos locos (“outliers”) com valores altos de divergência (FST) entre espécies (Savalainen et al 2006). Contudo, hoje podemos acessar os genomas em busca de variação SNPs, que significa: “Single Nucleotide Polymorphism” (Polimorfismo de um único nucleotídeo) de organismos não modelos a baixo custo, utilizando as tecnologias modernas de seqüenciamento. Uma dessas tecnologias é o seqüenciamento de uma parte do genoma que permite a busca e genotipagem de SNPs concomitantemente. Essa técnica é conhecida como RAD-seq (do inglês “Restriction-site Associated Sequencing”). Com o seqüenciamento de pequenos fragmentos de DNA na plataforma Illumina, permite acessar uma grande quantidade de polimorfismo de DNA. Com essa grande quantidade de dados genômicos, os estudos populacionais ficarão mais robustos, pois podemos acessar estimativas genômicas dos parâmetros tais como: variação entre populações - FST, heterozigosidades esperada (HE) e observada (HO), além de podermos acessar praticamente todo o genoma em busca de locos com padrão de distribuição “outlier”(Hohenlohe et al. 2010). A genômica populacional como uma abordagem nova dentro da genética de populações além de permite: identificar e quantificar a variação genética não neutra e refinar as estimativas populacionais demográficas (fluxo gênico, estruturação genética, endogamia, entre outros) com a retirada desses locos de distribuição específica e; pode levar a descoberta de genes candidatos relacionados à características ecológicas e de interesses agronômicos (ex.: à adaptação de organismos ao estresse biótico e abiótico) (Stapley et al. 2010). Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 20 Genômica aplicada a genética de conservação de plantas O nosso grupo de pesquisa está envolvido com a aplicação dos conhecimentos da genômica de populações, no estudo da adaptação de organismos ao seu ambiente, em dois contextos distintos, mas que são intrinsicamente associados, pois ambos se tratam de eventos de evolução recente (“short term evolution”). Uma das aplicações das ferramentas modernas de sequenciamento e obtenção de dados genômicos, com “frame work” da genômica de populações é o estudo da restauração florestal, e da adaptação das plantas a esse ambiente que sofre constantemente com a ação do homem. A prática da restauração florestal no Brasil é recente, e gradativamente têm incorporado novas metodologias para aumentar as chances de sustentabilidade das áreas restauradas. Uma das principais preocupações dos pesquisadores em relação à viabilidade biológica dessas áreas diz respeito à diversidade genética. De forma empírica, sabe-se que a maioria dos projetos de restauração florestal foram implantados a partir de sementes provenientes de um número reduzido de matrizes, ou seja, com baixa diversidade genética, de forma que a sustentabilidade pode estar ameaçada. As análises de diversidade genética e de estrutura de populações serão geradas pelo uso de alguns marcadores moleculares como os microssatélites, AFLP e SNPs, e dessa forma será possível gerar parâmetros populacionais que subsidiarão o manejo e a conservação de importantes espécies de uso florestal e medicinal, além de permitir estudar as bases genéticas da adaptação no processo de restauração florestal. Funk et al 2012 fornecem uma nova estratégias para integrar dados em marcadores neutros e adaptáveis para proteger a biodiversidade. Segundo os autores dados genômicos tem o potencial de revolucionar a delimitação das unidades de conservação (CUs). Dados de marcadores genômicos (neutros e adaptativos) fornecem diferentes tipos de informações que devem, portanto ser combinados para a tomada de decisões na conservação. A detecção de locos “outliers” pode ajudar a definir UES (unidades evolutivamente significativas; Ryder, 1986) , o que pode ser de essencial importância para o manejo de áreas restauradas. O conceito de UES, vem sendo a muito discutido e pode ser definido como uma linhagem que demonstra fluxo gênico altamente reduzido em relação a outras linhagens (Fraser & Bernatchez) e, que possuem diferentes adaptações e pressões seletivas, além de relações ecológicas distintas (Crandall et al, 2000). Como parte de um dos nossos projetos, faremos enriquecimento genético de áreas reflorestada visando maximizar a variação neutra e minimizar a variação adaptativa. Ao se levar em consideração, neste processo, somente a variação neutra, pode-se misturar linhagens com locos adaptativos (“outliers”) diferentes e desta forma, produzir uma depressão exogamica nestes locais (Edmands et al, 2007). Assim, a utilização de marcadores neutros e adaptativos, possibilita o manejo de populações ameaçadas com o menor risco. Genômica aplicada ao manejo de insetos-pragas Outro cenário interessante de estudo é o de manejo de pragas. Neste, o nosso grupo irá utilizar a abordagem genômica para entender e quantificar as mudanças evolutivas que as pragas agrícolas passam durante o processo de manejo de populações e mudanças na paisagem. Escolhemos como modelo de estudo, a broca-da-cana, Diatraea saccharalis, principal praga da cultura da cana-de-açúcar e uma das pragas do milho (Passos & Canechio 1981). Atualmente essa espécie vem se destacando como praga nas culturas do arroz e sorgo. Por ser uma espécie de hábito alimentar polífago/generalista, se torna um importante modelo de estudo para aspectos evolutivos da associação entre inseto e plantahospedeira. O cenário ecológico que a espécie está inserida traz fatores que deixa o estudo da especiação simpátrica ainda mais interessante. O cenário agrícola é um ecossistema que sofre constantes mudanças tanto no aspecto da paisagem (arranjo das culturas no mosaico agrícola) quanto em conseqüência do manejo de pragas. Os conhecimentos sobre aspectos ecológicos/evolutivos por traz da distribuição da variabilidade genética como: fluxo gênico e Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 21 associação entre praga e planta-hospedeira são determinantes para o desenvolvimento de tecnologia de manejo compatíveis e eficazes ao contexto que a espécie se encontra. Os conhecimentos que se tem a respeito de características bioecológicas, obtidos tradicionalmente por estudos ecológicos e da biologia das pragas não são suficientes para conhecer os padrões de dispersão, migração, e associação com as plantas hospedeiras, sendo necessários, portanto, estudos mais refinados utilizando marcadores moleculares e o embasamento teórico da genética de populações (Bourguet et al. 2000, Martinelli et al. 2007; Malausa et al. 2008). Se valendo de tecnologias de genotipagem em larga escala que permite cobrir grande parte do genoma com custo reduzido, o trabalho de pesquisa com insetos-pragas traz uma nova abordagem para estudos evolutivos de organismos não modelos além de contribuir com informações a respeito de aspectos genômicos da evolução inseto-planta Acreditamos que essa abordagem permitirá um estudo molecular sobre a associação evolutiva da praga com plantas hospedeiras além de gerar subsídios para prática de manejo de pragas mais eficientes e sustentáveis. Agradecimentos Os autores agradecem à FAPESP que financia um auxílio à pesquisa Programa Biota: Taxonomia, Sistemática e Filo Geografia projeto intitulado “Biologia da conservação de espécies nativas da Mata Atlântica com potencial fitoterápico: Uma abordagem genética sobre restaurações florestais”, responsável: Maria Imaculada Zucchi, vigência: 08/2013, (processo 2011/50296-8). Agradecemos também a FAPESP pela bolsa de Marcos Vinicius Bohrer Monteiro Siqueira - bolsista de pós-doutorado FAPESP (processo 2011/06756-4) e Camila Menezes Trindade Macrini – bolsista de pós-doutorado FAPESP (processo 2011/21295-3). Ao CNPq pelo projeto Universal Título: Novas abordagens em Genética de Populações de Insetos: Genômica de Populações e Scan Genômico Comparativo no estudo de aspectos evolutivos de pragas agrícolas, CNPq (Edital Universal - processo 484338/2011-0), Responsável: Maria Imaculada Zucchi, Vigência: 12/2013. À CAPES pela bolsa concedida ao aluno Vitor Antonio Correa Pavinato - Doutorando do programa de pós-graduação em Genética e Biologia Molecular da IB/UNICAMP. Referências Bibliográficas Abila PP, Slotman MA, Parmakelis A, Dion KB, Robinson AS, Muwanika VB, Enyaru JCK, Lokedi LM, Aksoy S, Caccone A (2008) High levels of genetic differentiation between Ugandan Glossina fuscipes fuscipes populations separated by Lake Kyoga. PLoS Neglected Tropical Diseases, v. 2, e242. Allendorf FW, Hohenlohe PA, Luikart G (2010) Genomics and the future of conservation genetics. Nature Genetics, v.11, p. 697–709. Beadell JS, Hyseni C, Abila PP, Azabo R, Enyaru JCK, Ouma JO, Mohammed YO, Okedi LM, Aksoy S, Caccone A (2010) Phylogeography and population structure of Glossina fuscipes fuscipes in Uganda: implications for control of tsetse. PLoS Neglected Tropical Diseases, v. 4, e636. Black WC, Baer CF, Antolin MF, Duteau NM (2001) Population genomics: genome-wide sampling of insect populations. Annual Review of Entomology, v. 46, p. 441–469. Bourguet D, Bethenod MT, Trouvé C, Viard F (2000) Host-plant diversity of the European corn borer Ostrinia nubilalis: what value for sustainable transgenic insecticidal Bt maize? Proceedings of the Royal Society B, v. 267, p. 1177-1184. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 22 Carletto J, Lombaert E, Chavigny P, Brévault T, Lapchin L, Vanlerberghe-Masutti F (2009) Ecological specialization of the aphid Aphis gossypii Glover oncultivated host plants. Molecular Ecology, v. 18, p. 2198-212. Crandall, KA et al. (2000) Considering evolutionary processes in conservation biology. Trends Ecol. Evol. v. 15, p. 290–295. Edmands, S. (2007) Between a rock and a hard place: evaluating therelative risks of inbreeding and outbreeding for conservation and management. Mol. Ecol. v. 16, p. 463– 475 Egan SP, Nosil P, Funk DJ (2008) Selection and genomic differentiation during ecological speciation: isolating the contribution of host association via comparative genome scan of Neochlamisus bebbianea leaf beetles. Evolution, v. 62, p. 1162-1181. Endersby NM, Hoffman AA, McKechnie SW, Weeks AR (2007) Is there genetic structure in populations of Helicoverpa armigera from Australia? Entomologia Experimentalis et Applicata, v. 122, p. 253-263. Franck P, Timm AE (2010) Population genetic structure of Cydia pomonella: a review and case study comparing spatiotemporal variation. Journal of Applied Entomology, v. 134, p. 191-200. Fraser, D.J. and Bernatchez, L. (2001) Adaptive evolutionary conservation: towards a unified concept for defining conservation units. Molecular Ecoogy. v. 10, p. 2741–2752. Freeland J (2003) Molecular Ecology. John Wiley & Sons, Ltd. Funk, W.C.; Mckay, J.K.; Hohenlohe P. A.; Allendorf, F.W. (2012) Harnessing genomics for delineating conservation units, Trends in Ecology and Evolution, v.27, n. 9, 489-496. Goldstein D, Schlötterer C ( 1999) Microsatellites: Evolution and Applications. Oxford University Press, Oxford. Heywood, VH; Iriondo, JM (2003) Plant conservation: Old problems, new perspectives. Biological Conservation, 113:321-335. Hohenlohe PA, Bassham S, Etter PD, Stiffler N, Johnson EA, Cresko WA (2010) Population genomics of parallel adaptation in threespine stickleback using sequenced RAD tags. Plos Genetics, v.6, e1000862. Kalia, RK; Rai, MK; Kalia, S; Singh, R; Dhawan, AK (2011) Microsatellite markers: an overview of the recent progress in plants. Euphytica, v.177, p.177:309–334. Luikart G (1999) Statistical analysis of microsatellite data. Trends in Ecology and Evolution, v. 14, p. 253-256. Luikart G, England PR, Talmon D, Jordan S, Taberlet P (2003) The power and promise of population Genomics: from genotyping to genome typing. Nature Reviews Genetics, v. 4, p. 981-994. Malausa, T, Dalecky, A, Ponsard, S, Audiot, P, Streiff, R, Chaval, Y, and Bourguet, D (2007) Genetic structure and gene flow in French populations of two Ostrinia taxa: host races or sibling species?, Molecular Ecology, v. 16,p. 4210-4222. Manel S, Conord C, Després L (2009) Genome scan to assess the respective role of hostplant and environmental constraints on the adaptation of a widespread insect. BMC Evolutionary Biology, v.288. Martinelli S, Clark PL, Zucchi MI, Silva-Filho MC, Foster JE, Omoto C (2007) Genetic structure and molecular variability of Spodoptera frugiperda (Lepidoptera: Noctuidae) collected in maize and cotton fields in Brazil. Bulletin of Entomological Research, v. 97, p. 225-231. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 23 Miller NJ, Ciosi M, Sappington TW, Ratcliffe ST, Spencer JL, Guillemaund T (2007) Genome scan of Diabrotica virgifera virgifera for genetic variation associated with crop rotation tolerance. Journal of Applied Entomology, v. 131, p. 378-385. Oliveira, EJ; Pádua, JG; Zucchi, MI; Vencovsky, R; Vieira, MLC (2006) Origin, evolution and genome distribution of microsatellites. Genetics and Molecular Biology, v.29, n.2, p.294307. Passos SMG, Canéchio Filho V (1981) Principais culturas. Campinas: Instituto Campineiro de Ensino Agrícola, v. 1, 426 p. Pavinato VAC, Bajay MM, Martinelli S, Monteiro M, Pinheiro JB, Zucchi MI, Omoto C (2011) Permanent Genetic Resources added to Molecular Ecology Resources Database 1 August 2010 - 30 September 2010. Molecular Ecology Resources, v. 11, p. 219-222. Ryder, OA (1986) Species conservation and systematics: the dilemma of subspecies. Trends Ecol. Evol. v. 1, p. 9–10 Santos H, Burban C, Rousselet J, Rossi J-P, Branco M, Kerdelhué C (2010) Incipient allochronic speciation in the pine processionary moth (Thaumetopoea pityocampa, Lepidoptera, Notodontidae). Journal of Evolutionary Biology, v. 24, p. 146-158. Seeb, JE, Carvalho G, Hauser L, Naish K, Roberts S and Seeb WL (2011). Single-nucleotide polymorphism (SNP) discovery and applications of SNP genotyping in nonmodel organisms, Molecular Ecology Resources , n. 11, p. 1–8. Slatkin, M.A. (1995) measure of population subdivision based on microsatellite allele frequencies. Genetics, v.139, p.457-462. Siqueira, MVBM; Pinheiro, TT; Borges A; VALLE, TL; Zatarim, M; Veasey, EA (2010) Microsatellites polymorphism in cassava landraces from the Cerrado biome, Mato Grosso do Sul, Brazil. Biochemical Genetics, v.48, p.879-895. Stapley J, Reger J, Feulner PGD, Smadja C, Galindo J, Ekblom R, Bennison C, Ball AD, Beckerman AP, Slate J (2010) Adaptation Genomics: the next generation. Trends in Ecology and Evolution, v. 25, p. 705-712. Savalainen V, Anstett M, Lexer C, Hutton I, Clarkson JJ, Norup MV, Powell MP, Springate D, Salamin N, Baker WJ (2006) Sympatric speciation in palms on an oceanic island. Nature, v. 441, p. 210-213. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 24 DISTRIBUIÇÃO DA DIVERSIDADE GENÉTICA E CONSERVAÇÃO DE ESPÉCIES ARBÓREAS EM REMANESCENTES DE FLORESTA OMBRÓFILA MISTA EM SANTA CATARINA Adelar Mantovani1,2*, Alexandre Mariot2, Juliano Zago da Silva2, Ricardo Bittencourt2 , Felipe Steiner2, Tiago Montagna2 e Maurício Sedrez dos Reis2 1 Departamanto de Eng. Florestal, UDESC-CAV Núcleo de Pesquisas em Florestas Tropicais, UFSC * Email: [email protected] 2 Palavras-chave: genética de populações, estrutura genética, alelos raros, alelos exclusivos. RESUMO Introdução: Durante décadas as formações vegetais catarinenses foram exploradas observando-se apenas critérios econômicos, como resultado desta exploração, estas formações, apresentam hoje uma significativa redução e fragmentação. Os efeitos de redução de tamanho populacional atuam diretamente na redução da variabilidade genética das populações remanescentes, levando a perdas da capacidade adaptativa e declínio populacional. O estudo da estrutura e da diversidade genética permite o conhecimento da organização e distribuição da variabilidade genética entre e dentro de populações naturais. Portanto, o objetivo deste estudo foi avaliar como a diversidade genética de algumas espécies da Floresta Ombrófila Mista (Araucaria angustifolia, Dicksonia sellowiana, Ocotea porosa, Butia eriospatha e Podocarpus lambertii) está distribuída no Estado, visando fundamentar estratégias efetivas de conservação. A variação genética foi caracterizada a partir das estimativas das frequências alélicas e dos principais índices de estrutura e diversidade genética. Resultados: de uma maneira geral os resultados indicam grande variação de diversidade genética potencial em cada uma das espécies e, principalmente entre as populações das mesmas. Contudo, os índices de fixação foram, na sua maioria, elevados, refletindo os efeitos da redução dos tamanhos populacionais nas populações estudadas em decorrência do processo histórico de super-exploração. Na maioria dos os casos a divergência entre as populações foi elevada. Os índices de fixação por microrregião foram, em geral, superiores a média das respectivas populações, refletindo os efeitos da fragmentação florestal existente. Conclusões: a situação de fragmentação das florestas e de redução do tamanho populacional leva a uma perspectiva de perdas ainda maiores de diversidade (elevados índices de fixação de alelos) para as espécies avaliadas. O conjunto de resultados reforça as possibilidades de perda de adaptabilidade e dinamismo populacional, o que traz como consequência, com o passar do tempo (gerações), grande aumento no risco de extinção local. Os resultados obtidos até o momento apontam para a necessidade de políticas públicas que favoreçam a ampliação da conectividade entre fragmentos como principal fator de reversão da situação de fragilidade em que se encontram as espécies e remanescentes florestais. Os resultados indicam também que, apesar das fragilidades, há populações e regiões com reservas de diversidade potencial elevada. * To whom correspondence should be addressed. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 25 1 INTRODUÇÃO O estado de Santa Catarina está inserido no bioma Mata Atlântica e apresenta três formações florestais predominantes, a Floresta Ombrófila Mista (FOM), Floresta Ombrófila Densa (FOD) e a Floresta Estacional Decidual (FED), e uma formação campestre, os Campos de altitude. De acordo com Klein (1978), tais formações cobriam 44,9%, 30,7%, 8% e 14,2% da superfície do estado, respectivamente. Durante décadas as formações vegetais catarinenses foram exploradas observando-se apenas critérios econômicos, especialmente no século passado. Conforme Reitz et al. (1979), o auge da exploração florestal no estado se deu entre as décadas de 1950 e 1970, e como resultado desta exploração, as formações vegetais catarinenses apresentam hoje uma significativa redução e fragmentação. Os efeitos da ação antrópica não produziram apenas uma redução da área de cobertura florestal em todas as formações do estado, mas também uma redução no tamanho populacional (número de indivíduos) das espécies presentes nestes remanescentes, principalmente as de valor madeireiro, devido à exploração madeireira ao longo do século XX. Assim, além da redução da cobertura e fragmentação, a exploração madeireira levou a um empobrecimento em termos populacionais e de riqueza de espécies nos remanescentes. A percepção da situação sintetizada nos parágrafos anteriores (ainda que sem quantificação adequada antes desta publicação) levou à estruturação de legislações/regulamentações cada vez mais restritivas em relação ao uso e conservação das espécies da Mata Atlântica em Santa Catarina, bem como a indicação de espécies ameaçadas em listas cada vez maiores (IBAMA 1992; MMA 2008; II Workshop sobre espécies vegetais ameaçadas de extinção em Santa Catarina, 2011). Os efeitos de redução de tamanho populacional atuam diretamente na redução da variabilidade genética das populações remanescentes, levando a perdas da capacidade adaptativa e declínio populacional, como discutido em Templeton et al. (1990), Bawa & Krugman (1990), Murawsky & Hamrick (1992) e Murawsky (1995), por exemplo. A redução da variabilidade genética ocorre não apenas por perda de diversidade, mas também pela redução das trocas alélicas decorrente da ausência de vetores efetivos do fluxo gênico ou de dificuldades na efetivação das trocas alélicas em decorrência da fragmentação. Direta ou indiretamente, a redução do número de indivíduos de uma dada espécie nos remanescentes e a fragmentação florestal afetam a fauna polinizadora e dispersora de sementes, bem como os mecanismos de movimentação dos alelos entre e dentro de populações, aumentando e retroalimentando os riscos de perda de diversidade genética e de declínio populacional. Os mecanismos envolvidos neste processo são muitas vezes complexos e podem envolver efeitos negativos de deriva genética, cruzamento entre aparentados, depressão por endogamia, expressão de alelos deletérios, redução da adaptabilidade, entre outros (Crow & Kimura 1970; Allard 1971; Mettler & Gregg 1973; Falconer 1981; Bawa & Krugman 1990; Murawsky & Hamrick 1992; Ellstrand & Elam 1993). A manutenção de elevados índices de diversidade, bem como dos mecanismos associados à manutenção desta diversidade, para uma dada espécie, garante as gerações futuras à possibilidade de formarem novos recombinantes, garantindo assim a capacidade de adaptação a novos ambientes e a própria manutenção da dinâmica populacional, conforme discute Reis (1996). O estudo da estrutura e da diversidade genética permite o conhecimento da organização e distribuição da variabilidade genética entre e dentro de populações naturais. Esse entendimento é imprescindível à escolha de estratégias visando à conservação e a exploração das populações em seu habitat, com a perspectiva de manutenção da diversidade e garantia de sustentabilidade (Oyama 1993; Reis 1996). Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 26 Desta forma, a caracterização de aspectos da diversidade genética em populações naturais de espécies endêmicas e ou ameaçadas, além de identificar com eficiência a situação, em termos de diversidade e erosão genética (perda da diversidade genética ao longo das gerações, normalmente acompanhada de redução da capacidade adaptativa) nas populações destas espécies, traz fundamentos importantes para a definição de estratégias no sentido da proteção destas populações e reversão do quadro de risco de extinção. Exemplos para o Estado de Santa Catarina podem ser vistos em Auler et al. (2002), Conte et al. (2003; 2006; 2008), Mantovani et al. (2006), Tarazi et al. (2010), Hmeljevski et al. (2011), Ferreira et al. (2012), Bitencourt et al. (a, b, submetidos), Montagna et al. (a, b, submetidos), entre outros. A diversidade genética é uma medida da quantidade de variação existente em uma dada população (local) de uma espécie, obtida por meio de um conjunto de indicadores/índices a partir de marcadores genéticos. A caracterização da diversidade genética permite estabelecer se uma dada população de uma espécie possui muita ou pouca variação que pode ser transmitida aos seus descendentes, permite avaliar se já ocorreu muita perda desta variação em função do processo de exploração feito no passado ou da fragmentação florestal. Com a avaliação de várias populações de uma dada espécie é possível estabelecer qual a situação para a espécie numa dada abrangência geográfica, o Estado de Santa Catarina ou uma região do Estado, por exemplo. Assim, é possível verificar em que regiões do Estado existe maior ou menor diversidade genética e o que pode ser feito para favorecer a conservação de uma dada espécie. Por exemplo, restabelecer ligações (conectividade) entre populações para facilitar o aumento da diversidade genética nas populações que apresentam baixa diversidade, via possibilidade de cruzamentos entre as populações (fluxo gênico). Portanto, um dos objetivos do Inventário Florístico Florestal de Santa Catarina (IFFSC) foi avaliar como a diversidade genética de algumas espécies da flora nativa ameaçadas, ou potencialmente ameaçadas, de extinção está distribuída no estado, visando fundamentar estratégias efetivas de conservação. 2 RESULTADOS E DISCUSÃO Os resultados obtidos para as cinco espécies escolhidas estão apresentados nas Tabelas de 1 a 5. Em termos gerais, os resultados indicaram comportamentos com uma tendência semelhante em termos de alta perda de diversidade nas populações (índice de fixação elevado). Estes resultados podem ser relacionados aos processos históricos de uso, como a superexploração, expansão das fronteiras agrícolas com redução da área de cobertura florestal e fragmentação dos remanescentes. Tais processos produzem redução dos tamanhos populacionais e redução do fluxo gênico entre populações, causando isolamento e perda de diversidade em nível local. Por outro lado, a exceção de Podocarpus lambertii, todas as demais espécies apresentam populações com diversidade alta, individualmente ou em conjunto, indicando um grande potencial para conservação e recomposição das populações remanescentes. Para Araucaria angustifolia (Tabela 1), o conjunto de populações apresentou um total de 37 alelos nos 13 locos avaliados (Â = 1,77 ± 0,15). As populações apresentaram em média diversidade genética moderada (P99% = 0,45 ± 0,10; Ĥo = 0,094 ± 0,023; Ĥe = 0,124 ± 0,026). O índice de fixação foi elevado ( fˆ = 0,245 ± 0,129), sendo superior a 0,2 em 17 (54,8%) das 31 populações avaliadas, fato que indica um possível histórico de cruzamentos entre aparentados, uma vez que a espécie é dioica, bem como, reflexo dos reduzidos tamanhos populacionais em que se encontram as populações da mesma. Aspecto já ressaltado em Auler et al. (2002). Pode-se observar também (Tabela 1) uma grande quantidade de alelos raros e alelos exclusivos em quatro populações, reforçando a evidência de tamanhos populacionais reduzidos. A divergência genética entre as populações de A. angustifolia também foi relativamente alta ( F̂ st = 0,129) e significativa, indicando diferenças importantes entre as populações, reforçando a necessidade de conservação de grande número de remanescentes. Os Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 27 principais índices de diversidade se mostraram também variáveis entre as populações, refletindo a fragilidade em que se encontram a maior parte das populações, mas também indicando que há populações em situação de menor fragilidade (p. ex., cinco populações com valores de fˆ não diferente de zero e seis populações com Ĥe superior a 0,15, Tabela 1). Estas últimas apresentam grande potencial como fonte de diversidade e áreas para coleta de sementes. Em relação às microrregiões, observa-se também uma variação expressiva para os principais índices de diversidade (Tabela 1, em negrito). Por exemplo, Chapecó e Curitibanos são as duas microrregiões com maior diversidade genética, mas também com grandes diferenças entre as populações amostradas. Estes resultados indicam, novamente, uma grande heterogeneidade, agora entre as microrregiões. Além disso, chama a atenção os valores elevados dos índices de fixação para cada uma das microrregiões, geralmente superiores à média dos valores das populações na respectiva região. Este resultado reflete a existência de diferenças expressivas entre as populações dentro de cada região, possivelmente decorrente de processos históricos (e/ou pré-históricos) que ocorreram nesta escala e reforçam a importância de medidas de conservação em escala regional: criação de Unidades de Conservação associadas a políticas/ações para ampliação de conectividade entre remanescentes. Para a imbuia (Ocotea porosa) (Tabela 2), foram encontrados 51 alelos nos 15 locos avaliados (Â = 2,25 ± 0,19). A diversidade genética média encontrada para o conjunto de populações foi alta (P99% = 0,76 ± 0,08; Ĥo = 0,221 ± 0,058; Ĥe = 0,271 ± 0,045), ˆ entretanto o índice de fixação médio também foi alto ( f = 0,188 ± 0,158), sendo maior que 0,2 para sete (53,8%) das 13 populações avaliadas, fato que pode estar associado à fragmentação e ao reduzido tamanho das populações. Nessas condições, os efeitos de deriva genética são favorecidos, demonstrando uma fragilidade das populações da espécie. A divergência genética entre as populações foi alta ( F̂ st = 0,191) e significativa, reflexo de um aparente reduzido fluxo gênico da espécie (Bittencourt et al. submetido a). Também foram identificados alelos exclusivos em duas populações. Estes resultados refletem a fragilidade em que se encontram a maior parte das populações, mas também indicam que há populações em situação favorável em termos de conservação (p. ex. três populações com alta diversidade e índice de fixação não diferente de zero, Tabela 2). Estas últimas apresentam grande potencial como fonte de diversidade para restauração e áreas de coleta de sementes. Em relação às microrregiões, observam-se diferenças importantes entre a microrregião de Xanxerê e as demais, especialmente em relação ao índice de fixação. Tal resultado está, em grande parte, associado ao fato de duas das três populações amostradas nesta região apresentarem índice de fixação não diferente de zero; ambas estão em Unidades de Conservação (Parque Nacional das Araucárias). Nas demais microrregiões, os resultados obtidos indicam um padrão semelhante ao da araucária, valendo as mesmas considerações. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 28 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" Tabela 1. Índices de diversidade intrapopulacional, índice de fixação, alelos raros e exclusivos para 31 populações de Araucaria angustifolia em suas respectivas microrregiões de ocorrência. n = nº indivíduos; P99% = % locos polimórficos (13 loc.); Â = alelos por loco; Ĥo = heterozigosidade observada; Ĥe = heterozigosidade esperada; fˆ = índice de fixação * (p< 0,05); AR = nº alelos raros (freq. <0,05); AE = nº alelos exclusivos. Microrregião Curitibanos Chapecó São Miguel do Oeste Campos de Lages Canoinhas/São Bento do Sul Xanxerê Joaçaba Estado População n P99% Â Ĥo Ĥe São Cristóvão Curitibanos 1 Campos Novos Curitibanos 2 Microrregião Chapecó 1 Chapecó 2 Campo Erê Microrregião Dionísio Cerqueira Palma Sola 1 Palma Sola 2 Microrregião Campo Belo do Sul São Joaquim Urubici 1 Painel Urupema Urubici 2 Anita Garib. Urubici 3 Microrregião Três Barras Itaiópolis 1 Canoinhas Itaiópolis 2 Mafra Microrregião Ponte Serrada 1 Ponte Serrada 2 Passos Maia São Domingos Faxinal dos Guedes Microrregião Lebon Régis Joaçaba Caçador Microrregião Média 52 55 55 51 212 54 52 58 164 55 54 54 163 52 52 52 51 51 52 54 50 413 50 51 50 55 56 263 49 53 52 51 56 260 56 52 54 162 53 53,8 53,8 69,2 61,5 61,5 53,8 46,2 69,2 61,5 53,8 61,5 53,8 46,2 46,2 30,8 38,5 46,2 38,5 30,8 53,8 53,8 53,8 46,2 46,2 53,8 53,8 53,8 53,8 61,5 53,8 46,2 53,8 53,8 53,8 61,5 38,5 46,2 61,5 45,0 1,92 1,69 2,00 1,92 2,23 1,92 1,69 1,92 2,23 1,69 1,85 1,85 2,08 1,77 1,46 1,62 1,69 1,62 1,38 1,77 1,69 2,08 1,77 1,69 2 1,77 1,92 2,31 1,85 1,69 1,69 1,77 2 2,31 1,92 1,62 1,69 2,08 1,77 0,149 0,089 0,088 0,081 0,100 0,125 0,099 0,058 0,094 0,099 0,107 0,106 0,104 0,087 0,087 0,078 0,091 0,08 0,09 0,098 0,094 0,086 0,074 0,102 0,083 0,088 0,069 0,083 0,130 0,103 0,108 0,077 0,073 0,097 0,165 0,071 0,084 0,108 0,094 0,176 0,133 0,162 0,181 0,173 0,170 0,107 0,135 0,158 0,109 0,148 0,125 0,130 0,125 0,104 0,106 0,111 0,101 0,107 0,146 0,138 0,124 0,110 0,112 0,097 0,095 0,100 0,104 0,153 0,131 0,129 0,116 0,110 0,141 0,166 0,089 0,101 0,143 0,124 fˆ 0,153* 0,329* 0,454* 0,549* 0,422* 0,263* 0,077 0,569* 0,403* 0,086 0,277* 0,153* 0,202* 0,303* 0,157* 0,262* 0,178* 0,211* 0,160* 0,329* 0,317* 0,306* 0,326* 0,089 0,142* 0,079 0,312* 0,201* 0,152* 0,215* 0,162* 0,339* 0,337* 0,313* 0,005 0,201* 0,171* 0,249* 0,245 Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ AR AE 6 5 8 7 7 7 5 8 7 4 7 5 7 5 2 4 5 4 1 5 5 10 5 5 8 5 7 14 5 4 5 6 6 11 7 3 5 8 - 1 1 2 0 0 0 1 2 1 1 0 - 29 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" Tabela 2. Índices de diversidade intrapopulacional, índice de fixação, alelos raros e exclusivos para 13 populações de Ocotea porosa em suas respectivas microrregiões de ocorrência. n = nº indivíduos; P99% = % locos polimórficos (15 loc.); Â = alelos por loco; Ĥo ˆ = heterozigosidade observada; Ĥe = heterozigosidade esperada; f = índice de fixação * (p< 0,05); AR = nº alelos raros (freq. <0,05); AE = nº alelos exclusivos. Microrregião Joaçaba Canoinhas Concórdia Xanxerê Estado População Caçador 1 Caçador 2 Rio das Antas Macieira Microrregião Mafra 1 Itaiópolis 1 Mafra 2 Itaiópolis 2 Canoinhas Microrregião Irani Ponte Serrada Passos Maia 1 Passos Maia 2 Microrregião Média n 51 45 46 53 192 55 53 49 50 49 232 53 62 55 51 168 50 P99% 80,0 73,3 78,6 86,7 86,7 86,7 91,7 85,7 84,6 73,3 100,0 86,7 80,0 85,7 78,6 86,7 76,0 Â 1,87 2,07 2,43 2,40 3,00 2,13 2,75 2,50 2,23 2,47 3,20 2,27 2,07 2,20 2,33 2,60 2,25 Ĥo 0,203 0,334 0,243 0,156 0,226 0,167 0,252 0,195 0,240 0,249 0,206 0,142 0,263 0,302 0,188 0,255 0,221 Ĥe 0,236 0,315 0,299 0,260 0,327 0,219 0,314 0,312 0,357 0,319 0,323 0,204 0,250 0,288 0,266 0,296 0,271 fˆ 0,137* -0,059 0,188* 0,398* 0,310* 0,238* 0,199* 0,375* 0,326* 0,219* 0,365* 0,301* -0,053 -0,049 0,295* 0,141* 0,188 AR 3 3 6 6 13 5 6 8 3 7 16 5 4 7 4 7 - AE 1 2 2 3 - 1 - O conjunto de populações do butiá da serra (Butia eriospatha) (Tabela 3) apresentou 30 alelos no total, considerando os 13 locos avaliados (Â = 1,53 ± 0,20), contudo, apenas nove locos foram polimórficos. A diversidade genética encontrada apresentou um valor intermediário (P99% = 0,37 ± 0,13; Ĥo = 0,102 ± 0,044; Ĥe = 0,111 ± 0,044) e o índice de fixação foi estimado em 0,083 ± 0,132. Chama atenção a grande variação do índice de fixação: cinco populações apresentam excesso de heterozigotos, enquanto outras três populações tiveram índices de fixação maiores que 0,2. A espécie mostrou também poucos locos polimórficos indicando fixação de alelos em muitas populações. A divergência entre populações foi elevada ( F̂ st = 0,363) e significativa, indicando existirem diferenças importantes entre as populações ao longo do Estado. Em grande parte, estes resultados podem ser explicados pela forma como as populações estão estruturadas, formando agrupamentos, mas relativamente isolados. Além disso, a espécie está sob forte pressão de uso (ornamental) e suas populações praticamente não apresentam indivíduos jovens, devido à presença de gado bovino. Estes resultados refletem o grau de ameaça em que se encontram a maior parte das populações da espécie e a relevância de se considerar várias populações em ações para a conservação. Ademais, o fato de o ambiente de ocorrência da espécie não estar protegido no Estado, reforça a ameaça, já ressaltada em Nazareno et al. (submetido). Apesar da predominância de baixo polimorfismo, há populações com percentual de polimorfismos superior a 50% e diversidade genética (Ĥe) superior a 0,15 (Tabela 3), indicando potencial de restauração e estabelecimento de áreas de coleta de sementes. Em termos de microrregiões, observa-se, como nas espécies já discutidas, uma predominância de valores de índice de fixação, por microrregião, superiores às médias das respectivas populações, este resultado indica a existência de diferenças importantes entre as populações dentro das microrregiões. Este resultado decorre, possivelmente, da forma como estão distribuídas as populações, como já mencionado, e reflete o isolamento das populações em escala de microrregião, reforçando a ideia de forte ameaça, mencionada no parágrafo anterior. Para o pinho-bravo (Podocarpus lambertii) (Tabela 4), os 10 sistemas enzimáticos analisados permitiram a avaliação de 12 locos, sendo 10 polimórficos. Foram encontrados 32 alelos no conjunto das populações estudadas (Â = 1,80 ± 0,15). O conjunto de populações apresentou baixa diversidade genética (P99% = 0,48 ± 0,08; Ĥo = 0,049 ± Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 30 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 0,022; Ĥe = 0,078 ± 0,021). As frequências genotípicas das populações apresentaram desvios significativos das frequências esperadas em panmixia, evidenciando um alto índice ˆ de fixação médio ( f = 0,372). Foram também encontrados alelos raros em todas as populações, além de dois alelos exclusivos. Estes resultados refletem a situação preocupante na qual se encontram a maior parte das populações. Tabela 3. Índices de diversidade intrapopulacional, índice de fixação, alelos raros e exclusivos para 14 populações de Butia eriospatha em suas respectivas microrregiões de ocorrência. n = nº indivíduos; P99% = % locos polimórficos (13 loc.); Â = alelos por loco; Ĥo ˆ = heterozigosidade observada; Ĥe = heterozigosidade esperada; f = índice de fixação * (p < 0,05); AR = nº alelos raros (freq. < 0,05); AE = nº alelos exclusivos. Microrregião Joaçaba Curitibanos Campos de Lages Concórdia Estado População Fraiburgo Matos Costa Lebon Régis Microrregião Santa Cecília Curitibanos 1 Curitibanos 2 Curitibanos 3 Monte Carlo Microrregião Otacílio Costa São J. do Cerrito 1 São J. do Cerrito 2 Microrregião Alto Bela Vista Irani 1 Irani 2 Microrregião Média n 56 56 56 168 42 49 52 51 50 243 55 54 55 164 47 52 52 151 52 P99% 53,8 38,5 38,5 53,8 38,5 23,1 38,5 30,8 53,8 46,5 30,8 7,7 30,8 38,5 61,5 38,5 38,5 54,0 37,0 Â 1,77 1,62 1,62 2,00 1,54 1,39 1,54 1,46 1,69 1,85 1,39 1,23 1,31 1,54 2,00 1,39 1,46 2,08 1,53 Ĥo 0,110 0,154 0,143 0,136 0,115 0,064 0,081 0,091 0,074 0,088 0,048 0,037 0,106 0,063 0,172 0,134 0,093 0,130 0,102 Ĥe 0,131 0,187 0,149 0,190 0,113 0,057 0,096 0,079 0,099 0,107 0,060 0,042 0,104 0,079 0,186 0,127 0,120 0,176 0,111 fˆ 0,161* 0,176* 0,040 0,288* -0,023 -0,116 0,155* -0,154* 0,255* 0,182* 0,212* 0,111 -0,018 0,198* 0,077 -0,057 0,230* 0,260* 0,083 AR 5 1 2 5 3 2 2 2 4 6 AE 1 2 1 2 4 5 0 2 7 - 2 - Tabela 4. Índices de diversidade intrapopulacional, índice de fixação, alelos raros e exclusivos para 12 populações de Podocarpus lambertii em suas respectivas microrregiões de ocorrência. n = nº indivíduos; P99% = % locos polimórficos (12 loc.); Â = alelos por loco; ˆ Ĥo = heterozigosidade observada; Ĥe = heterozigosidade esperada; f = índice de fixação * (p < 0,05); AR = nº alelos raros (freq. < 0,05); AE = nº alelos exclusivos. Microrregião Curitibanos Joaçaba Campos de Lages Canoinhas/São Bento do Sul Estado População São Cristóvão Curitibanos 1 Curitibanos 2 Microrregião Lebon Régis 1 Lebon Régis 2 Caçador Microrregião Painel São José Cerrito Capão Alto Microrregião Mafra Bela V. Toldo Campo Alegre Microrregião Média n 52 70 51 173 56 55 61 172 55 53 50 158 53 58 52 164 56 P99% 64,6 54,5 54,5 63,6 63,6 54,5 45,5 63,6 45,5 45,5 60,0 63,6 54,5 45,5 45,5 63,6 48,0 Â 1,82 1,91 1,82 2,46 1,82 1,55 1,73 2,27 1,55 1,73 2,20 2,27 1,82 1,73 1,91 2,18 1,80 Ĥo 0,059 0,091 0,053 0,070 0,050 0,024 0,039 0,038 0,052 0,016 0,042 0,036 0,045 0,036 0,085 0,054 0,049 Ĥe 0,097 0,096 0,071 0,131 0,093 0,059 0,039 0,067 0,092 0,064 0,062 0,070 0,078 0,084 0,110 0,092 0,078 fˆ 0,388* 0,052 0,247* 0,467* 0,457* 0,597* 0,015 0,442* 0,436* 0,744* 0,320* 0,493* 0,431* 0,571* 0,224* 0,413* 0,372 AR 6 8 6 13 6 4 6 12 3 6 10 12 6 7 7 8 - AE 0 0 1 2 1 1 - A divergência entre populações amostradas de P. lambertii foi elevada ( F̂ st = 0,216) e significativa, indicando existirem diferenças importantes entre as populações do Estado e, portanto, a relevância de se considerar várias populações em ações para a conservação. A Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 31 baixa diversidade encontrada é um forte indicativo da necessidade de ações urgentes de conservação, inclusive ex-situ. Em relação às microrregiões, observa-se um comportamento semelhante ao mencionado para as espécies já descritas. Contudo, a baixa diversidade populacional também se reflete nas microrregiões (Tabela 4), reforçando a situação de ameaça desta espécie em todo o Estado. Para Dicksonia sellowiana (Tabela 5), os sete sistemas utilizados revelaram oito locos passíveis de interpretação, todos polimórficos. Foram encontrados 26 alelos para o conjunto das 30 populações (Â = 2,10 ± 0,28). Em todas as populações foram encontrados alelos raros. As populações apresentaram diversidade genética intermediária (P99% = 0,65 ± 0,14; Ĥo = 0,117 ± 0,058; Ĥe = 0,144 ± 0,049) e um índice de fixação bastante variável de 0,184 ± 0,185, entretanto 17 (56,7%) das 30 populações amostradas apresentaram índice de fixação maior que 0,2, fato que pode ser reflexo da fragmentação do ambiente natural da espécie. Por outro lado, seis populações apresentaram índice de fixação negativo e/ou não diferente de zero e nove populações apresentaram Ĥe superior a 0,15. Estes últimos resultados indicam a existência de uma diversidade potencial expressiva e possibilidade de alteração da situação de vulnerabilidade em que se encontra a espécie. Observou-se também uma elevada e significativa divergência genética interpopulacional ( F̂ st = 0,439), evidenciando um baixo fluxo gênico aparente entre as populações. O valor elevado da divergência entre populações indica existirem diferenças importantes entre as populações ao longo do Estado. Esta divergência pode ser explicada, em parte, pela especificidade de ambiente ocupado pela espécie, que pode restringir o seu fluxo gênico. O xaxim apresenta crescimento lento e está muito associado às áreas ciliares, este aspecto demonstra a importância da preservação destas áreas para o estabelecimento de ações de conservação para a espécie. Em termos de microrregiões, os valores de diversidade (Ĥe) média são elevados (> 0,2) em quatro microrregiões (Tabela 5), contudo, os resultados indicam também a existência de fortes divergências entre as populações dentro de cada região. Tais resultados reforçam a importância de medidas de conservação em escala regional: criação de Unidades de Conservação associadas à políticas/ações para ampliação de conectividade entre remanescentes. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 32 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" Tabela 5. Índices de diversidade intrapopulacional, índice de fixação, alelos raros e exclusivos para 30 populações de Dicksonia sellowiana em suas respectivas microrregiões de ocorrência. n = nº indivíduos; P99% = % locos polimórficos (8 loc.); Â = alelos por loco; ˆ Ĥo = heterozigosidade observada; Ĥe = heterozigosidade esperada; f = índice de fixação * (p < 0,05); AR = nº alelos raros (freq. < 0,05); AE = nº alelos exclusivos. Microrregião População São Cristóvão – 453 Curitibanos – 369 Camp. Novos – 321 Curitibanos Curitibanos – 562 Santa Cecília – 623 Ponte Alta – 413 Microrregião Chapecó – 537 Campo Erê – 919 Chapecó São L. D'oeste – 877 Microrregião D. Cerqueira - 1001 Palma Sola – 6003 São Miguel do Oeste Palma Sola – 6001 Microrregião Campo B. do Sul – 727 São Joaquim –92 Urubici – 140 Painel – 211 Campos de Lages Urubici – 167 Anita Garib.– 5000 Urubici – 192 Microrregião Major Vieira – 895 Mafra – 1061 Canoinhas/São Bento do Sul Itaiópolis – 901 Microrregião Passos Maia – 832 São Domingos – 926 Ponte Serrada – 720 Xanxerê Ponte Serrada – 718 Fax. Guedes – 714 Microrregião Macieira – 724 Joaçaba – 1980 Joaçaba Caçador – 729 Microrregião Estado Média n 52 47 44 45 53 56 317 52 55 53 159 56 45 52 152 52 61 51 53 60 49 51 383 53 48 50 149 52 53 55 51 53 259 52 52 96 200 54 P99% 88,9 62,5 75,0 50,0 88,9 77,8 87,5 55,6 50,0 62,5 75,0 77,8 75,0 88,9 87,5 88,9 88,9 88,9 66,7 77,8 100 75,0 87,5 77,8 66,7 66,7 75,0 77,8 44,4 66,7 66,7 77,8 75,0 66,7 77,8 88,9 87,5 65,2 Â 2,2 2,0 2,4 2,1 2,3 2,2 3,25 1,8 1,9 2,0 2,38 1,9 2,5 2,2 3,00 2,0 2,2 2,1 1,7 2,1 3,0 2,3 3,25 2,1 2,1 2,0 2,38 2,1 1,8 1,9 1,9 2,4 2,75 2,0 2,1 2,2 2,75 2,1 Ĥo 0,136 0,069 0,079 0,063 0,145 0,101 0,099 0,096 0,100 0,062 0,086 0,110 0,104 0,124 0,111 0,130 0,103 0,165 0,055 0,176 0,087 0,149 0,123 0,073 0,168 0,157 0,125 0,139 0,113 0,044 0,068 0,131 0,095 0,091 0,123 0,358 0,225 0,117 Ĥe 0,185 0,092 0,110 0,098 0,230 0,130 0,229 0,125 0,121 0,132 0,134 0,125 0,134 0,134 0,134 0,131 0,168 0,217 0,089 0,210 0,117 0,182 0,272 0,144 0,151 0,133 0,138 0,183 0,101 0,069 0,078 0,148 0,311 0,133 0,142 0,295 0,248 0,144 fˆ 0,266* 0,252* 0,280* 0,364* 0,372* 0,224* 0,567* 0,234* 0,171* 0,534* 0,357* 0,119* 0,228* 0,079 0,173* 0,011 0,390* 0,241* 0,383* 0,161* 0,259* 0,183* 0,546* 0,499* -0,118* -0,186* 0,098* 0,239* -0,121* 0,366* 0,127* 0,117* 0,695* 0,318* 0,135* -0,214* 0,092* 0,184 AR 4 5 4 5 4 4 11 2 4 4 6 3 5 4 13 3 4 4 3 8 4 9 3 5 4 8 4 2 2 2 5 6 5 4 5 8 - AE 0 0 0 0 0 0 0 - 3 CONCLUSÕES Os resultados obtidos, de maneira geral, ressaltam a importância de medidas de conservação em escala regional, evidenciando a necessidade e importância de políticas que favoreçam a ampliação de conectividade entre fragmentos florestais, além da criação de Unidades de Conservação. Ações que estimulem a conservação pelo uso, estruturadas em escala regional, apresentam grande potencial para recompor a conectividade entre os remanescentes florestais na área de ocorrência da espécie. Embora tenham sido observados, para todas as espécies, valores elevados dos índices de fixação, bem como alelos exclusivos em algumas populações, que são fortes evidências de estruturação e de limitações de fluxo gênico e, portanto, de redução da performance adaptativa, produtiva e reprodutiva das espécies em questão, os valores observados de diversidade genética indicam que, para o conjunto das populações de quase todas as espécies estudadas, existe grande diversidade passível de ser resgatada. Neste sentido, ações voltadas ao aumento do fluxo gênico/conectividade, como a criação de corredores ecológicos, áreas de coleta e produção de sementes, proteção à fauna e o enriquecimento Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 33 de áreas que apresentam baixa diversidade e/ou alta fixação com sementes originadas em fragmentos próximos com maior diversidade genética, devem ser incentivadas. A identificação de áreas com grande diversidade genética para a criação de áreas públicas de conservação, como Parques e Florestas Nacionais, ou para identificação de áreas privadas com potencial para formação de áreas de coletas de sementes é de fundamental importância. A criação de áreas de coleta de sementes em Unidades de Conservação parece ser atualmente uma ação de grande efetividade para a conservação. Sobretudo pelo fato de que, nestas áreas, informações genéticas que norteiam a captura da maior diversidade genética possível poderiam ser geradas e estarem disponíveis e acessíveis aos coletores de sementes, que serão os principais agentes, além da fauna, a recomporem a diversidade genética que vem continuamente sendo perdida. Por exemplo, a distância entre plantas, dada pela coancestria, para evitar a coleta em uma mesma deme ou, ainda, a incorporação do tamanho efetivo, para diminuir os efeitos da endogamia. Índices que apresentam processos simples de obtenção, porém caros e muito variáveis entre áreas, mas que poderiam estar disponíveis em áreas públicas destinadas a conservação. Os trabalhos de Montagna et al. (submetido a;b) são exemplos onde os autores comparam a diversidade genética de araucária e xaxim encontrada dentro e fora de Unidades de Conservação. Estes trabalhos revelam que as Unidades de Conservação estudadas capturam de maneira efetiva, para estas espécies, a maioria da diversidade genética presente no estado de Santa Catarina. O cálculo das distâncias de coleta entre matrizes e a correção dos tamanhos efetivos poderiam ser gerados para cada área e ações voltadas à recuperação de outros fragmentos ou mesmo a fundação de novas populações apresentariam maior garantia de efetividade, sobretudo pelo fato de que a maioria das espécies amostradas pelo IFFSC tem caracterizado populações com elevados valores de índice de fixação, logo, coletas de sementes realizadas ao acaso ou sem critérios genéticos apresentam riscos de agravarem ainda mais o declínio populacional local. Entre as espécies estudadas, Podocarpus lambertii e Butia eriosphata estão em pior situação em termos de reduzida diversidade atual e risco futuro de ampliação de perdas. Ainda que P. lambertii tenha apresentado os menores índices, o ambiente de ocorrência de B. eriospatha apresenta atualmente grande pressão de uso, aumentando os riscos de perda de populações inteiras para esta espécie. Por outro lado, ainda que com riscos e em situações diferente, Araucaria angustifolia apresenta abrangência e reserva de diversidade, bem como valor de uso como recurso não madeireiro (sementes – pinhões) para ser empregado em programas de restauração e ampliação de conectividade entre fragmentos. Ademais, esta espécie já é empregada em sistemas agroflorestais importantes para a agricultura familiar no Estado. No caso da araucária, sistemas tradicionais como caívas e faxinais já representam um avanço efetivo no sentido da ampliação de conectividade entre fragmentos e aumento da cobertura florestal, além da conservação da espécie, como discutido em Reis et al. (2010). Assim, as informações obtidas sobre diversidade genética, dão suporte a políticas públicas de estímulo a: a) formação de áreas de coleta de sementes de espécies nativas, estruturadas com base genética; b) plantios de restauração ou comerciais com espécies nativas; c) definição de áreas prioritárias para o estabelecimento de ações de conservação e uso; d) definição de ações prioritárias de conservação. Material e mÉtodos No IFFSC a avaliação da diversidade genética foi realizada priorizando espécies que se encontravam na lista de espécies ameaçadas de extinção (IBAMA 1992; MMA 2008) e que apresentam grande demanda econômica e/ou social. Assim, algumas espécies não incluídas nas listas foram também avaliadas visando uma maior representatividade regional. Entre as espécies que aparecem na Lista das Espécies Ameaçadas desde 1992, ocorrem em Santa Catarina e possuem grande demanda econômica e social, portanto, pressão de uso, estão: araucária (Araucaria angustifolia), imbuia (Ocotea porosa), xaxim (Dycksonia Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 34 sellowiana). Mais recentemente também aparece na Lista das Espécies Ameaçadas (MMA 2008) e possue grande demanda sócio econômica o butiá-da-serra (Butia eriospatha). Além das espécies mencionadas no parágrafo anterior, foi escolhido o pinho-bravo (Podocarpus lambertii), de modo a dar uma abrangência geográfica para a FOM e, ao mesmo tempo, permitir a obtenção de resultados que possam ser estendidos para outras situações no Estado. Também foi considerada a importância de uma abordagem com abrangência e representatividade regional no Estado e uma perspectiva maior de integração das diferentes abordagens, para a estruturação do produto final através de um portal (SIG). Assim, decidiuse por uma amostragem que permitisse representatividade por microrregião, buscando-se amostrar ao menos três populações por microrregião, conforme a área de ocorrência de cada espécie. Deste modo, o número de populações amostradas variou conforme a área de abrangência/ocorrência da espécie no Estado, bem como a existência de populações que permitissem uma amostragem consistente. O número de populações amostradas por espécie variou de 12 para 31 (Figura 1). Figura 1. Locais de coleta das cinco espécies avaliadas na Floresta Ombrófila Mista. Além disso, em cada população a amostragem foi de ao menos 50 indivíduos adultos, visando dar consistência aos resultados. O número de plantas amostradas em cada população define a capacidade do método na detecção de alelos mais raros, portanto com maior probabilidade de serem afetados (ter sua frequência alterada, ou até serem eliminados ou fixados) em processos de perda de diversidade. Uma amostra de 50 plantas é capaz de detectar com igual probabilidade desde alelos de alta frequência até alelos com frequência próxima a 1% (Calili-Garcia et al., 2001; 2006). A coleta das amostras foliares foi realizada sempre procurando abranger toda a área do fragmento florestal, respeitando uma distância mínima entre indivíduos coletados de 50 m. A coleta de material vegetal foi efetuada das árvores adultas, procurando coletar folhas e ramos intactos e sadios. Estas amostras foram acondicionadas (sacos plásticos identificados por indivíduo, colocadas em recipientes térmicos com gelo), transportadas para o Laboratório de Fisiologia do Desenvolvimento e Genética Vegetal da Universidade Federal de Santa Catarina (LFDGV-UFSC) e armazenadas a aproximadamente 5 C°. O procedimento amostral priorizou, ainda, fragmentos em melhor estado de conservação, preferindo áreas mais extensas, com árvores de maior porte e florestas com melhor estrutura de dossel e sub-bosque. A extração de enzimas foi realizada macerando aproximadamente 50 mg de material foliar com três gotas de solução de extração n° 1 (Alfenas et al. 1998) e cerca de 10 mg de polivinilpolipirrolidona (PVPP). A eletroforese de isoenzimas foi realizada em gel de penetrose 30 a 13%, submetido à corrente elétrica com sistema tampão-eletrodo e sistemas isoenzimáticos específicos para cada espécie, a partir das recomendações básicas descritas Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 35 em Alfenas et al. (1998) e Kephart (1990). A variação genética foi caracterizada a partir das estimativas das frequências alélicas e dos índices de diversidade (porcentagem de locos polimórficos (P99%), número total de alelos, número médio de alelos por loco (Â), heterozigosidade observada (Ĥo) e esperada (Ĥe), e índice de fixação ( fˆ ), empregando-se o programa Fstat (Goudet 2001) e GDA (Lewis & Zaykin 2001). Foram também avaliados o número de alelos raros e de alelos exclusivos encontrados em cada população com auxílio do Microsoft Excel. As estatísticas F de Wright (Wright 1951) ( F̂ is, F̂ it, F̂ st) foram estimadas com auxílio do programa Fstat (Goudet 2001), que utiliza o método descrito por Weir & Cockerham (1984) para estimar as estatísticas. 5 INFORMAÇÕES SOBRE OS AUTORES Adelar Mantovani – Eng. Agrônomo, doutor em Ciencias Biológicas – Biologia vegetal, professor da Universidade do Estado de Santa Catarina, Lages, SC. [email protected] Alexandre Mariot - Eng. Agrônomo, doutor em Ciências – Recursos Genéticos Vegetais – UFSC. Juliano Zago da Silva - Eng. Agrônomo, doutor em Ciências – Recursos Genéticos Vegetais– UFSC. Ricardo Bittencourt - Eng. Agrônomo, doutor em Ciências – Recursos Genéticos Vegetais– UFSC. Felipe Steiner - Eng. Florestal, mestrando em Ciências – Recursos Genéticos Vegetais– UFSC. Tiago Montagna - Eng. Agrônomo, mestrando em Ciências – Recursos Genéticos Vegetais– UFSC. Maurício Sedrez dos Reis - Eng. Agrônomo, doutor em Agronomia, professor da Universidade Federal de Santa Catarina, Florianópolis, SC. [email protected]. AGRADECIMENTOS Agradecemos todos os integrantes do Núcleo de Pesquisas em Florestas Tropicais –UFSC. Financiamento: Fundação de Amparo à Pesquisa e Inovação do Estado de Santa Catarina (FAPESC). REFERÊNCIAS BIBLIOGRÁFICAS Alfenas, A. C. (Ed.). (1998) Eletroforese de isoenzimas e proteínas afins: fundamentos e aplicações em plantas e microorganismos. Viçosa: Editora Universidade Federal de Viçosa. Allard, R. W. (1971) Princípios do melhoramento genético das plantas. São Paulo, Edgard Blucher. Auler, N. M. F.; Reis, M. S.; Guerra, M.P.; Nodari, R. O. (2002) The genetic and conservation of Araucaria angustifolia I. Genetic structure and diversity of natural populations by means of non-adaptative variation in the state of Santa Catarina, Brazil. Genetics and Molecular Biology 25 (3), 323-327. Bawa, K. S.; Krugman, S. L. (1990) Reprodutive biology and benetics of tropical trees in relation to conservation and manegement. In: Gomes-Pompa, A.; Whitmore, T. C.; Hadley, M. Rain forest regeneration and management. Paris; UNESCO. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 36 Bittencourt, R.; Mariot, A.; Mantovani, A.; Ferreira, D. K.; Silva, J. Z. Reis, M. S. (Submetido a). Genetic diversity in natural populations of Imbuia (Ocotea porosa - Lauraceae) in the Atlantic Rain Forest. Journal of Heredity. Carlini-Garcia, L. A.; Vencovsky, R.; Coelho, A. S. (2006) Factorial analysis of bootstrap variances of population genetic parameter estimates. Genet. Mol. Biol. 29(2), 308-313. Carlini-Garcia, L. A.; Vencovsky, R.; Coelho, A.S. (2001) Métodos booststrap aplicados em níveis de reamostragem na estimação de parâmetros genéticos populacionais. Scientia Agricola 58(4), 785-793. Conte, R.; Reis, M. S.; Vencovsky, R. (2006) Effects of management on the genetic structure of Euterpe edulis Mart. populations based on microsatellites. Scientia Forestalis 72, 8188. Conte, R.; Nodari, R. O.; Vencovsky R.; Reis, M.S. (2003) Genetic diversity and recruitment of the tropical palm, Euterpe edulis Mart., in a natural population from the Brazilian Atlantic Forest. Heredity 91,401–406. Conte, R.; Reis M. S.; Mantovani, A.; Vencovsky, R. (2008) Genetic structure and mating system of Euterpe edulis Mart. populations: a comparative analysis using microsatellite and allozyme markers. J Hered. 99(5), 476–482. Crow, J. F.; Kimura, M.A. (1970) An Introduction to population genetics theory. New York; Harper and Row. Ellstrand, N.; Elam, D. R. (1993) Population genetic consequences of small population size: implications for plant conservation. Annual review on ecological systems 24, 217 -242. Falconer, D. S. (1981) Introduction to Quantitative Genetics, Ed. 2. Longmans Green, London/New York. Ferreira, D. K.; Nazareno, A. G.; Mantovani, A.; Bittencourt, R.; Sebbenn, A. M.; Reis, M. S.; (2012) Genetic analysis of 50-year old Brazilian pine (Araucaria angustifolia) plantations: implications for conservation planning. Conservation Genetics 13, 435 – 442. Goudet, J. (2001) Fstat, a program to estimate and test gene diversities and fixation indices. (version 2.9.3). Hmeljevski, K. V.; Reis, A.; Montagna, T.; Reis, M. S. (2011) Genetic diversity, genetic drift and mixed mating system in small subpopulations of Dyckia ibiramensis, a rare endemic bromeliad from Southern Brazil. Conservation genetics 12, 761 – 769. IBAMA (Instituto Brasileiro do Meio Ambiente e dos Recursos Naturais Renováveis). Lista Oficial das Espécies da Flora Brasileira Ameaçadas de Extinção. Portaria 006/92-N de 15 de janeiro de 1992. Diário Oficial. Kephart, S. R. (1990) Starch gel electrophoresis of plant isozymes: a comparative analysis of techniques. Amer. J. Bot 77(5), 693-712. Klein, R. M . (1978) Flora ilustrada catarinense: mapa fitogeográfico do Estado de Santa Catarina. Itajaí: HerbárioBarbosa Rodrigues, V Parte - mapa fitogeográfico, 24p. Lewis, P. O; Zaykin, D. (2001) Genetic Data Analysis (GDA): Computer program for the analysis of allelic data. Versão 1.0. Mantovani, A.; Morellato, L. P. C.; Reis, M.S. (2006) Internal genetic structure and outcrossing rate in a natural population of Araucaria angustifolia (Bert.) O. Kuntze. J Hered 97, 466–472. Mettler, L. E.; Gregg, T.G. (1973) Genética de populações e evolução. São Paulo: Polígono / EDUSP. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 37 MMA (Ministério do Meio Ambiente). Instrução Normativa n° 6, de 23 de setembro de 2008. Lista oficial das espécies da flora brasileira ameaçadas de extinção. Diário Oficial da República Federativa do Brasil, Brasília, Df, 24 set. 2008. Seção 1, p. 75-83. Montagna, T.; Ferreira, D.K.; Steiner, F.; Fernandes, C. D.; Bittencourt, R.; Silva, J. Z.; Mantovani, A.; Reis, M. S. (Submetido a). A importância das unidades de conservação na manutenção da diversidade genética de xaxim (Dicksonia sellowiana) no estado de Santa Catarina. Biodiversidade brasileira. Montagna, T.; Ferreira, D.K.; Steiner, F.; Loch, F. A. S. S.; Bittencourt, R.; Silva, J. Z.; Mantovani, A.; Reis, M. S. (Submetido b). A importância das unidades de conservação na manutenção da diversidade genética de araucária (Araucaria angustifolia) no estado de Santa Catarina. Biodiversidade brasileira. Murawsky, D. A. (1995) Reproductive biology and genetics of tropical trees from canopy perspective. In: Lowman, M.D.; Nadkarni, N. M.; ed. Forest canopies. New York:Academic Press. Murawsky, D. A.; Hamrick, J. L. (1992) Mating system and phenology of Ceiba pentandra (Bombacaceae) in Central Panama. Journal of heredity 83, 401-404. Nazareno, A. G.; Reis M. S.; (submetido). Linking phenology to mating system: exploring the reproductive biology of the threatened palm species Butia eriospatha. Journal of Heredity. Oyama, K. (1993) Conservation Biology of Tropical Trees: Demographic and Genetic Considerations. Enviroment Update 1, 17-32. Reis, M. S.; Peroni, N.; Mariot, A.; Steenbock, W.; Filippon, S.; Vieira da Silva, C.; Mantovani, A. (2010) Uso sustentável e domesticação de espécies da Floresta Ombrófila Mista. In: Ming, L. C.; Amorozo, M. C. M.; Kffuri, C. W. (Org.). Agrobiodiversidade no Brasil: experiências e caminhos da pesquisa. Recife: NUPEEA, Vol. 1, pp. 183-214. Reis, M. S. Dinâmica da movimentação dos alelos: subsídios para a conservação e manejo de populações naturais de plantas. (1996) Brazilian Journal of Genetics 19(4), 37-47. Reitz, R.; Klein, R. M.; Reis, A. (1979) Projeto Madeira – Santa Catarina. Florianópolis: Lunardelli. Tarazi, R.; Mantovani, A.; Reis, M.S. (2010) Fine-scale spatial genetic structure and allozymic diversity in natural populations of Ocotea catharinensis Mez. (Lauraceae). Conserv. Genet. 11, 965–976. Templeton, A. R.; Shaw, K.; Routman, E.; Davis, S. K. (1990) The genetics consequences of habitat fragmentation. Annual missouri ot gardens 77, 13-27. Weir, B. S.; Cockerham, C. C. (1984) Estimating F-statistics for the analysis of population structure. Evolution, 38, 1358–1370. Wright, S. (1951) The genetical structure of populations. Annals of Eugenics, 15, 395-420. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 38 MEDINDO O TEMPO EVOLUTIVO A PARTIR DE MOLÉCULAS: OS 50 ANOS DO RELÓGIO MOLECULAR Carlos Guerra Schrago, Departamento de Genética, IB-UFRJ Email: [email protected] Palavras-chave: Evolução molecular, taxas evolutivas, taxa de substituição, filogenias, modelo de evolução RESUMO Nesta palestra será fornecido um breve histórico da teoria do relógio molecular e sua importância no estabelecimento da disciplina da evolução molecular e na compreensão da escala cronológica de evolução da vida. Será mostrado os recentes desenvolvimentos da teoria, como a unificação da biogeografia e a filodinâmica de patógenos de evolução 1 A EVOLUÇÃO DOS MODELOS DE RELÓGIO MOLECULAR A evolução dos organismos deve ser interpretada nos eixos temporal e espacial, pois são nestes em que as mudanças genéticas e ecológicas ocorrem. Quando o eixo temporal é considerado, deve-se caracterizar não apenas a idade das linhagens, mas também a taxa de mudança das mesmas entre os eventos de especiação. A biologia evolutiva, portanto, é uma ciência que necessariamente deve ser entendida em quatro dimensões – as três espaciais e o tempo (SIMPSON 1944). Neste sentido, a genética, por estudar a dinâmica da hereditariedade, encontra-se numa posição distinta. Pois são as moléculas informacionais que possibilitam que as características dos organismos sejam mantidas ao longo das gerações. Além disso, todas as modificações evolutivamente significativas também serão gravadas nestas moléculas. Desta forma, esta ciência é capaz de abordar a dimensão temporal de forma única. Entretanto, as primeiras abordagens evolutivas desenvolvidas por geneticistas estava voltada para uma escala de tempo muito reduzida, pois somente fenômenos populacionais eram investigados (MAYR 1985). Foi na década de sessenta do século 20, após o trabalho de Zuckerkandl e Pauling (1965), que estudos macroevolutivos usando moléculas informacionais tiveram início. Esses trabalhos, caracterizados na época como ‘paleogenética química’, eram estudos comparativos de proteínas homólogas em diversas espécies. Um dos fenômenos mais interessantes observados nesta fase foi que taxa de substituição de nucleotídeos e aminoácidos era aproximadamente constante nas diversas linhagens, de forma a caracterizar um ‘relógio molecular’ (KIMURA 1968). Se a taxa de evolução molecular é aproximadamente constante, existe uma relação linear entre o número de substituições acumuladas e o tempo de divergência. Assim, é possível inferir uma escala cronológica para os eventos de especiação a partir das distâncias genéticas por simples proporcionalidade; basta conhecer-se a idade de separação de um par de linhagens, ou seja, um ponto de calibração. Tal informação poderia ser obtida do registro fóssil das mesmas (NEI and KUMAR 2000). Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 39 A hipótese da homogeneidade de taxas evolutivas foi severamente criticada pelos muitos evolucionistas, pois era inconcebível que genes homólogos em linhagens tão diferentes quanto primatas e artiodáctilos apresentassem número aproximado de substituições após a separação do ancestral. Diversos testes foram então propostos para verificar a hipótese do relógio molecular (e.g, FITCH and LANGLEY 1976). Contudo, o conhecimento dos tempos de diversificação das linhagens é tão importante para o entendimento de fenômenos macroevolutivos que, na década de oitenta, o desenvolvimento de metodologias estatísticas para o estudo do relógio molecular foi motivado (KUMAR 2005). Agora, o foco não era mais provar a teoria do relógio, pois, conforme mais dados foram disponibilizados, verificou-se que a constância de taxas era uma exceção. O objetivo era testar a hipótese do relógio de forma que os tempos de divergência inferidos a partir desta resultassem em estimativas razoáveis. Esta linha de ação desdobrou-se em metodologias robustas como a de Felsenstein (1985), Tajima (1993) e Takezaki et al. (1995). Entretanto, estes testes necessitavam que todas linhagens estudadas apresentassem taxas de evolução molecular aproximadamente homogêneas. Quando uma delas violava o relógio, ela deveria ser descartada da análise. Isso consistia numa grande limitação, pois muitas vezes a espécie eliminada era justamente o foco principal do estudo. Além disso, a eliminação de dados não é estatisticamente aconselhável (YANG 2006). No final da década de noventa um grupo de trabalhos abordou o problema da inferência de tempos de divergência de uma forma inovadora. O impedimento central dos métodos anteriores era a incapacidade de decomposição da distância genética entre ancestrais e descendentes numa filogenia, que é dada pelo produto entre a taxa de substituição pelo tempo de divergência. Como somente seu produto é observável, i.e., o número de substituições, era impossível inferir os tempos absolutos sem assumir a constâncias das taxas ao longo da árvore filogenética. A decomposição da distância genética é possível pela adoção de um modelo explícito de evolução das taxas de substituição (THORNE et al. 1998). Esta modelagem, no entanto, inclui um número considerável de parâmetros e métodos estatísticos comumente usados em evolução molecular, como máxima verossimilhança e mínimos quadrados, não possuem um desempenho desejável nestas circunstâncias. Por exemplo, a superfície de máxima verossimilhança pode apresentar múltiplos máximos locais que dificultam a otimização da função (YANG 2006). Nestes casos, a abordagem bayesiana é mais eficiente, pois a inferência paramétrica de modelos complexos pode ser realizada por simulação estocástica (Monte Carlo) via cadeias de Markov (MCMC, Markov Chain Monte Carlo) (GAMERMAN and LOPES 2006). Neste sentido, Thorne et al. (1998) propuseram um método bayesiano de relaxamento do relógio molecular que aplica um modelo auto-correlacionado de evolução das taxas de substituição ao longo da filogenia. O modelo foi posteriormente modificado para possibilitar o uso de múltiplos genes (THORNE and KISHINO 2002). Esta metodologia permite a decomposição da distância genética e, logo, o pesquisador pode inferir os tempos de divergência sem assumir o relógio molecular estrito. O trabalho seminal de Thorne e colaboradores motivou o desenvolvimento de métodos de relógio molecular relaxado. Basicamente, as técnicas posteriores avaliaram o uso de modelos alternativos de evolução de taxas de substituição (ARIS-BROSOU and YANG 2003). Por exemplo, Huelsenbeck et al (2000) usa um modelo de Poisson generalizado, enquanto Rannala e Yang (2007) assumem que as taxas evolutivas não apresentam correlação entre nós ancestrais e descendentes. A flexibilidade estatística da inferência bayesiana permite, inclusive, que não necessitemos de uma topologia fixa para inferir tempos de divergência. Neste caso, a topologia e considerada um parâmetro de distúrbio (nuisance parameter) e o tempo do ancestral comum de um conjunto de sequências é obtido através de integração pelo espaço topológico (DRUMMOND et al. 2006). Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 2 40 CONCLUSÕES A inferência de tempos e taxas evolutivas em árvores filogenéticas ganhou grande importância nos últimos anos por duas razões principais. Primeiramente, o conhecimento do tempo dos eventos macroevolutivos permite que estes sejam correlacionados com eventos geoclimáticos, elucidando o cenário em que a diversificação de uma linhagem ocorreu (SCHRAGO and RUSSO 2003). Em segundo lugar, as estimativas de taxas evolutivas absolutas possibilita que saibamos o modo de evolução de molecular, um problema central em genética evolutiva, pois permite que tenhamos idéia da ação das forças evolutivas. Porém, a aplicação do relógio molecular relaxado é complicada por fatores relacionados à modelagem evolutiva de taxas e tempos de divergência. Ainda não está claro qual modelo de evolução apresenta melhor adequação às diversas situações biológicas de variação de taxas intra e inter-específicas. O mesmo se aplica aos modelos probabilísticos das divergências (LEPAGE et al. 2007). Além disso, os métodos de relaxamento do relógio implementado em diversos programas ainda não foram extensivamente testados. De fato, ainda não tem-se idéia dos limites do relógio molecular relaxado. Afinal, esses modelos têm uma capacidade finita de acomodar a variação de taxas. As perguntas centrais são: quanto de variação é suportada e o que pode aumentar a eficácia do método. REFERÊNCIAS BIBLIOGRÁFICAS ARIS-BROSOU, S., and Z. H. YANG, 2003 Bayesian models of episodic evolution support a late Precambrian explosive diversification of the Metazoa. Molecular Biology and Evolution 20: 1947-1954. DRUMMOND, A. J., S. Y. W. HO, M. J. PHILLIPS and A. RAMBAUT, 2006 Relaxed phylogenetics and dating with confidence. Plos Biology 4: 699-710. FELSENSTEIN, J., 1985 Confidence-Limits on Phylogenies with a Molecular Clock. Systematic Zoology 34: 152-161. FITCH, W. M., and C. H. LANGLEY, 1976 Protein Evolution and Molecular Clock. Federation Proceedings 35: 2092-2097. GAMERMAN, D., and H. F. LOPES, 2006 Markov Chain Monte Carlo: Stochastic simulation for Bayesian inference. Chapman & Hall/CRC. HUELSENBECK, J. P., B. LARGET and D. SWOFFORD, 2000 A compound Poisson process for relaxing the molecular clock. Genetics 154: 1879-1892. KIMURA, M., 1968 Evolutionary Rate at Molecular Level. Nature 217: 624-&. KUMAR, S., 2005 Molecular clocks: four decades of evolution. Nature Reviews Genetics 6: 654-662. LEPAGE, T., D. BRYANT, H. PHILIPPE and N. LARTILLOT, 2007 A general comparison of relaxed molecular clock models. Molecular Biology and Evolution 24: 2669-2680. MAYR, E., 1985 The Growth of biological thought : diversity, evolution and inheritance. Belknap press of Harvard university press, Cambridge. NEI, M., and S. KUMAR, 2000 Molecular evolution and phylogenetics. Oxford University Press. RANNALA, B., and Z. H. YANG, 2007 Inferring speciation times under an episodic molecular clock. Systematic Biology 56: 453-466. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 41 SCHRAGO, C. G., and C. A. M. RUSSO, 2003 Timing the origin of New World monkeys. Molecular Biology and Evolution 20: 1620-1625. SIMPSON, G. G., 1944 Tempo and mode in evolution. Columbia University Press, New York. TAJIMA, F., 1993 Simple Methods for Testing the Molecular Evolutionary Clock Hypothesis. Genetics 135: 599-607. TAKEZAKI, N., A. RZHETSKY and M. NEI, 1995 Phylogenetic Test of the Molecular Clock and Linearized Trees. Molecular Biology and Evolution 12: 823-833. THORNE, J. L., and H. KISHINO, 2002 Divergence time and evolutionary rate estimation with multilocus data. Systematic Biology 51: 689-702. THORNE, J. L., H. KISHINO and I. S. PAINTER, 1998 Estimating the rate of evolution of the rate of molecular evolution. Molecular Biology and Evolution 15: 1647-1657. YANG, Z. H., 2006 Computational molecular evolution. Oxford University Press. ZUCKERKANDL, E., and L. PAULING, 1965 Evolutionary divergence and convergence in proteins, pp. 97 - 166 in Evolving genes and proteins, edited by V. BRYSON and H. VOGEL. Academic Press, New York. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 42 IDENTIFICAÇÃO MOLECULAR DA BIODIVERSIDADE COM VISTAS À SUA CONSERVAÇÃO Claudio Oliveira*, Gláucia Maria Garcia Maia Depto. Morfologia, Instituto de Biociências, UNESP * Email: [email protected] Resumo Hoje a ideia de conservação é, felizmente, uma unanimidade entre todos, particularmente os Biólogos. Ainda que a conservação de ecossistemas deva ser a pedra fundamental dos programas de conservação, em muitos casos o foco se volta às espécies ou populações. Nesse segundo caso as coisas não são tão simples pois há um grande número de conceitos teóricos de 'espécie', muitos bastante divergentes, e, na prática, o reconhecimento das espécies é uma tarefa extremamente difícil, principalmente pela falta de profissionais treinados nessa área. Em decorrência do desenvolvimento das técnicas de sequenciamento de DNA, assim como de novas máquinas cada vez mais eficiente, hoje o acesso à essa tecnologia é quase universal. Apoiados nessa tecnologia, um grupo de pesquisadores se propôs a realizar um estudo diferente: sequenciar um (ou alguns poucos) genes de todas as espécies do planeta! Nasceu assim a técnica conhecida como DNA barcoding que pretende facilitar a identificação das espécies, assim como seus produtos derivados. O desenvolvimento do projeto de DNA barcode tem sido extremamente rápido, de forma que, atualmente, cerca de 1,5 milhões de espécimes representantes de cerca de 145 mil espécies dos mais diferentes grupos de organismos e regiões do planeta já foram sequenciados. Toda essa informação pode ser rapidamente acessada via internet através do sítio www.barcodinglife.com. Desta maneira, ainda que em processo de construção, já temos à nossa disposição, uma ferramenta extremamente poderosa para a identificação de espécies, o que certamente terá um impacto significativo na conservação da biodiversidade de Terra. Identificação molecular da biodiversidade com vistas à sua conservação A espécie é uma unidade de comparação fundamental em todos os campos da Biologia, da Anatomia ao Comportamento, Desenvolvimento, Ecologia, Evolução, Genética, Biologia Molecular, Paleontologia, Fisiologia, Sistemática, etc. (de Queiroz, 2005). Ao longo da história muitos conceitos de espécie foram propostos, incluindo o tipológico, morfológico, biológico, por isolamento reprodutivo, etc. Ainda que extensos debates sejam constantemente travados em relação a esses conceitos de espécie (de Queiroz, 2005; Waugh, 2007), do ponto de vista prático os taxonomistas são os profissionais responsáveis pela caracterização dessas entidades biológicas e sua classificação, tornando-as palpáveis e reconhecíveis pela atribuição de um nome, erigido de acordo com os códigos internacionais de nomenclatura (Köhler, 2007). Essa atribuição de um nome não constitui uma simples aplicação de regras de nomenclatura, mas sim na elaboração de uma hipótese, segundo a qual, um determinado conjunto de caracteres (usualmente morfológicos) é capaz de identificar uma entidade (espécie) com características biológicas próprias e histórias evolutivas independentes de Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 43 outras entidades biológicas similares. Essas hipóteses podem ser testadas de diversas maneiras e, como todas as hipóteses, podem ser refutadas ou não. Adicionalmente, quando as descrições de espécies são baseadas em uma ampla base de dados, elas se tornam hipóteses científicas interessantes permitindo a elaboração de predições explícitas sobre os atributos dos organismos (Lipscomb et al., 2003). Os dados morfológicos foram, historicamente, os primeiros a serem utilizados na identificação de espécies simplesmente pelo fato de que foram os primeiros disponíveis aos pesquisadores que iniciaram a sistematização do conhecimento sobre os seres vivos. Com o desenvolvimento de novos métodos de estudos, novas metodologias foram se tornando disponíveis para o estudo da biodiversidade. Dessa maneira, há mais de 40 anos, a eletroforese de proteínas em géis de amido foi, pela primeira vez, utilizada para identificar espécies (Manwell e Baker, 1963). Há aproximadamente 30 anos, a análise de sequências de genes de DNA ribossômico foi utilizada para investigar as relações evolutivas em níveis superiores (Woese e Fox, 1977) e as pesquisas em DNA mitocondrial dominaram a Sistemática Molecular no final da década de 70 e início da década de 80 (Avise, 1994) e hoje constituem um dos principais sustentadores desse tipo de investigação, com várias revistas dedicadas exclusivamente à esse campo como: Molecular Phylogenetics and Evolution, Molecular Biology and Evolution e Journal of Molecular Evolution. Entre os dados moleculares utilizados em Taxonomia e Sistemática temos as análises citogenéticas, bioquímicas, as isozimas, dados imunológicos e, mais recentemente, as sequências de nucleotídeos (Hillis et al., 1996). Nos estudos taxonômicos essas ‘novas’ categorias de dados têm sido sempre adicionadas aos dados morfológicos, nunca pretendendo substituílos. Exemplos desse tipo de integração são cada vez mais comuns, como na descrição de Gymnotus sylvius (Albert et al., 1999) e a nossa descrição de uma nova espécie de tainha, Mugil rubrioculus (Harrison et al., 2007) e de uma nova espécie de Moenkhausia (Benine et al., 2009). Esses exemplos são particularmente relevantes, pois são referentes a novas espécies de dois gêneros de peixes bastante complexos, que foram descritas após o acumulo de evidências citogenéticas e moleculares que demonstravam a singularidade das amostras em estudo com relação a seus respectivos congêneres. Embora ferramentas moleculares tenham fornecido uma ampla gama de novas oportunidades para estudar questões em Biologia Evolutiva (como nos processos de especiação) e em Sistemática Filogenética, só recentemente foi proposto que um curto segmento de 648 nucleotídeos da extremidade 5’ do gene mitocondrial Citocromo Oxidase I (COI) seria suficiente, em muitos metazoários, para identificá-los a nível de espécie (Hebert et al., 2003a; 2003b). O uso dessa metodologia, denominada DNA barcode, ganhou muita relevância com a criação em 2004 do Consortium for the BarCode of Life (CBOL) cuja meta é a criação de um banco de dados de códigos de barra, sequências parciais de DNA do gene COI, da biodiversidade global, com o objetivo de facilitar o processo de automação da identificação das espécies (ver o sítio www.barcoding.si.edu para maiores detalhes). Como pode ser observado na literatura, outros segmentos gênicos também têm sido sugeridos para esse mesmo fim, como dos genes mitocondriais 16S rRNA e Citocromo B (Vences et al., 2005) ou outros genes (Lahaye et al., 2008), porém, por questões de padronização e pelo seu aparente melhor desempenho, o CBOL adotou como sequência padrão o fragmento citado do gene COI. Paralelamente à proposição de criação do sistema de DNA barcode (Hebert et al., 2003a; 2003b), foi lançada uma discussão sobre a criação de um sistema de taxonomia baseado em sequências de DNA por Tautz et al. (2002, 2003) denominado DNA Taxonomy. Essa proposição foi levantada tendo em vista a extensão da diversidade dos organismos vivos, estimados entre 10 e 100 milhões de espécies (May, 1988; Whitfied, 2003), e, segundo os proponentes dessa metodologia, na dificuldade em nomeá-las com os métodos correntemente em uso, cujo emprego, desde sua criação por Linnaeus em 1758, permitiu a nomeação de cerca de 1,7 milhão de espécies (Stoeckle, 2003). Outro problema levantado dizia respeito ao problema de formação de novos taxonomistas para substituir os especialistas que encerram suas carreiras. O que Tautz et al. (2003) propuseram formalmente era que as sequências de DNA deixassem de ser um elemento auxiliar na Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 44 identificação de espécie e passassem a ocupar uma posição central nesse processo de descrição de espécies. Essa proposição gerou uma grande animosidade entre os taxonomistas e os biologistas moleculares. Várias críticas a esse artigo de Tautz et al. (2003) foram publicadas (ex.: Lipscomb et al., 2003; Ebach e Holdrege, 2005; Carvalho et al., 2007) nas quais os autores invariavelmente mostravam preocupação com a Taxonomia tradicional e seus praticantes. Entretanto, com exceção de uma breve referência ao trabalho de Hebert et al. (2003a), em nenhum ponto do artigo de Tautz et al. (2003) a palavra barcode é mencionada! Assim, fica evidente que o que Tautz et al. (2003) propunham é algo independente do conceito de DNA barcode, ainda que exista uma similaridade em relação ao uso de sequências de DNA, porém com finalidades totalmente diferentes. Essencialmente, o que os usuários da metodologia de DNA barcode pretendem é tornar possível a atribuição de indivíduos a espécies e facilitar a descoberta de novas espécies (Moritz e Cicero, 2004). Os primeiros estudos realizados com essa metodologia foram extremamente satisfatórios com um grau de resolução taxonômica maior que 95% (Hebert et al., 2003a, 2003b). Além disso, a metodologia foi aplicada satisfatoriamente para identificar espécimes imaturos, espécies extintas, indivíduos em diferentes estágios do ciclo de vida de algumas espécies e possíveis espécies crípticas. Porém, com o avanço dos estudos, encontraram-se também grupos que não puderam ser prontamente resolvidos, a nível de espécie, como alguns cnidários bentônicos, dois grupos de anfíbios e algumas espécies de gastrópode, possivelmente porque esses grupos eram formados por espécies com tempo de divergência bastante reduzido (ver revisão em Waugh, 2007). Apesar da metodologia de DNA barcode ser extremamente recente diversas críticas têm sido levantadas a respeito dessa metodologia. Algumas dessas críticas representam simples opiniões pessoais como, por exemplo, a colocação de Ebach e Holdrege (2005) de acordo com a qual o financiamento de projetos de DNA barcode desviaria recursos que poderiam ser destinados a projetos de taxonomia, o que foi elegantemente rebatido por diversos autores como, por exemplo Gregory (2005), que argumentam que esses tipos de projeto não competem por recursos uma vez que usualmente são apresentados em áreas diferentes da Biologia (Genética vs. Zoologia) e, por outro lado, todos projetos de boa qualidade podem ser financiados, independente de sua natureza. Outras realmente discutem aspectos científicos relacionados à metodologia do DNA barcode (Wiemers e Fiedler, 2007) e os principais aspectos são discutidos abaixo. Assim, a princípio, alguns críticos sugeriram que o DNA barcode não seria uma atividade científica porque não visaria testar hipóteses e gerar conhecimento, mas sim simplesmente produzir informações (Lipscomb et al., 2003; Ebach e Holdrege 2005). Entretanto, qualquer experimento gera informações que necessitam ser interpretadas sob a luz de hipóteses e essa é uma atividade científica. Segundo as palavras de Lipscomb et al. (2003) reduzir a taxonomia somente à identificação de espécies a torna uma simples tarefa técnica ao invés de uma ciência baseada em hipóteses. Esse mesmo raciocínio se encaixa perfeitamente nos estudos de DNA barcode uma vez que esses nunca se limitam a relacionar as sequências encontradas para cada indivíduo, mas sim procuram interpretar as semelhanças e diferenças entre essas sequências e suas relações com as espécies reconhecidas por outros métodos. Assim, é forçoso concluir que Taxonomia e DNA barcode são igualmente atividades científicas. Waugh (2007) argumenta também que a aplicação da técnica de DNA barcode serve ainda para testar a hipótese de que as espécies podem ser identificadas utilizando essa técnica e, no futuro, pode ser uma fonte de dados que gerará outras hipóteses, o que é também uma atividade essencialmente científica. Uma crítica mais recente, apresentada por Wiemers e Fiedler (2007), diz respeito ao chamado problema de barcode gap. Os proponentes do uso do DNA barcode sugeriram que a diferença genética interespecífica excede a diferença intra-específica de tal maneira que um claro gap permitiria assinalar um espécime desconhecido à sua espécie com uma taxa de erro insignificante (Hebert et al., 2004a). Os desvios a essa regra seriam atribuídos a um pequeno número de pares de espécies incipientes, com separação incompleta de linhagens (Hebert et al., 2004b). Como consequência, o estabelecimento da quantidade de divergência entre duas amostras acima de um determinado limite (proposto como sendo pelo menos 10 Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 45 vezes maior do que dentro das espécies) iria indicar uma distinção a nível de espécie, enquanto uma diferença abaixo desse limite indicaria uma identidade taxonômica entre as amostras. Além disso, a existência de um barcode gap tornaria possível a identificação de espécies não descritas (Hebert et al., 2004b; Smith et al., 2006). Possíveis erros com essa abordagem incluem falsos positivos e falsos negativos (Wiemers e Fiedler, 2007). Falsos positivos ocorrem se populações dentro de uma espécie são muito distintas geneticamente, i.e., populações distantes com fluxo gênico limitado ou populações alopátricas com fluxo gênico interrompido. No último caso deve ser notado que, dependendo da quantidade de diferenciação morfológica e o conceito de espécie aplicado, tais populações podem ser qualificadas como “espécies crípticas” na visão de alguns cientistas. Falsos negativos, por outro lado, ocorrem quando pouca ou nenhuma variação nas sequências do fragmento de DNA utilizado é encontrada entre diferentes espécies [= grupos de populações reprodutivamente isoladas, sensu Mayr (1969)]. Aqui, falsos negativos são mais críticos para a metodologia de DNA barcode, porque a existência de tais casos revelaria exemplos onde essa metodologia é menos poderosa do que o uso de outras metodologias, mais holísticas, para delimitar as espécies (Wiemers e Fiedler, 2007). Enquanto estudos em peixes (Ward et al., 2005; Hubert et al., 2008; Valdez-Moreno et al., 2009; Ward et al., 2009), aves (Hebert et al., 2004a), artrópodes (Hogg e Hebert, 2004; Barrett e Hebert, 2005; Stahls e Savolainen, 2008) e plantas (Kress et al., 2005) corroboram a existência do barcode gap, outros estudos em gastrópodes (Meyer e Paulay, 2005), moscas (Meier et al., 2006) e borboletas (Brower, 2006; Wiemers e Fiedler, 2007) desafiam sua existência. As razões para essa discrepância não são inteiramente claras. Os estudos disponíveis sugerem que os níveis de divergência nas sequências de COI diferem entre táxons mais antigos e mais recentes, como seria esperado. Assim, por exemplo, uma média excepcionalmente baixa de divergência em sequências de COI, de apenas 1%, foi encontrada entre pares de espécies de cnidária, comparado a 9,6 a 15,7% em outros filos animais. Moluscos com 11,1% de divergência média entre espécies (Meyer e Paulay, 2005) e dípteras com 9,3% (Meier et al., 2006) seriam atípicos com relação a essa propriedade. Meyer e Paulay (2005) sugerem que a amostragem insuficiente a nível interespecífico e intraespecífico poderia criar, artificialmente, um barcode gap. Os proponentes do DNA barcode argumentam, entretanto, que a principal razão para essa sobreposição seria o pouco conhecimento taxonômico disponível para alguns grupos e a necessidade de revisão taxonômica dos mesmos. Deve-se levar também em conta que estudos estatísticos recentes mostram que os testes de monofilia correntemente empregados precisam ser revistos uma vez que podem se apresentar altamente tendenciosos e passíveis de novas interpretações (DeSalle et al., 2005; Rosenberg, 2007). De qualquer maneira taxas excepcionalmente baixas de divergência entre sequências do COI apesar de não permitir a separação das espécies podem indicar a ocorrência de especiação recente, o que é um achado importante para vários grupos de organismos. Uma proposição alternativa e extremamente importante em relação ao estudo das sequências geradas nos projetos de DNA barcode foi apresentada por DeSalle et al. (2005). Segundo esses autores, um dos principais problemas com relação à análise dos dados gerados nos projetos de DNA barcode diz respeito ao uso extensivo da construção de árvores por métodos fenéticos (como Neighbour-Joining). Eles ressaltam que os equívocos do uso dessa metodologia têm levado a conclusões também equivocadas quanto ao uso do DNA barcode. Segundo os autores, a metodologia taxonômica corrente usa a descoberta de caracteres diagnósticos, independentemente de árvores, para estabelecer sistemas taxonômicos e, principalmente para identificar espécies. Assim, concluem que o uso dos caracteres de DNA em um contexto de diagnose seria muito mais compatível com os processos correntemente empregados em taxonomia, superando em muito a abordagem por árvores. Além disso, DeSalle et al. (2005), propõe explicitamente que deve haver uma ponte entre as pesquisas moleculares e morfológicas e que isso deve aprimorar o processo de identificação de espécies. Isso também deve ampliar nosso conhecimento sobre a diversidade de mecanismos envolvidos na origem dessas espécies. Por essa razão, no Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 46 presente estudo, o trabalho será conduzido em conjunto, por especialistas em Biologia Molecular e Taxonomia de peixes. Outra crítica levantada por oponentes do uso da metodologia de DNA barcorde diz respeito ao reduzido número de indivíduos amostrados por espécie. As recomendações em curso sugerem que cinco exemplares deveriam ser amostrados de cada espécie, procedentes, sempre que possível, de diferentes pontos dentro da área estudada. Rosenberg (2007), em um estudo estatístico sobre capacidade de determinação de monofilia em comparações interpares, demonstrou que uma pequena amostra, de apenas dez indivíduos, para cada grupo testado pode ser suficiente para uma discriminação altamente significativa do ponto de vista estatístico. Considerando que existem grandes diferenças biológicas entre grupos de organismos quanto a esse número mínimo, o emprego inicial de cinco indivíduos pode ser uma escolha metodologicamente viável, principalmente se encararmos essa escolha inicial como um 'experimento piloto'. A necessidade desses experimentos pilotos com diferentes números de organismos é sugerida por DeSalle et al. (2005) que afirmam ainda que esse número pode ser orientado pelo conhecimento disponível sobre a história de vida das espécies, sua capacidade de dispersão e padrões de cruzamento. Essa crítica a um número tão reduzido de amostras também pode ser igualmente aplicada a vários trabalhos em Taxonomia em que novas espécies são erigidas com base em um ou muito poucos exemplares. Nos estudos biológicos há um consenso de que havendo disponibilidade de um grande número de amostras essas devem ser analisadas, mas havendo impedimentos, as análises devem ser feitas com o número possível de amostras. Considerando a literatura disponível, pode-se observar claramente que em alguns casos a metodologia de DNA barcode é prontamente aplicável a nível de grupo animais, como as aves (ex. Hebert et al., 2004a) ou a faunas regionais, como no caso dos peixes marinhos da região australiana (Ward et al., 2005) ou de água doce do Canadá (Hubert et al., 2008) e do México e Guatemala (Valez-Moreno et al., 2009). As principais falhas que se têm apontado dizem respeito a estudos feitos com grupos animais ricos em espécies, como no caso das borboletas (Wiemers e Fiedler, 2007), onde os autores utilizaram a abordagem de árvores. Dos estudos disponíveis, que são ainda muito restritos em relação às diferentes formas de vida que habitam o planeta, pode-se concluir que em alguns casos essa metodologia é útil enquanto em outros não. Exatamente pela escassez de estudos não é possível advogar contra nem a favor da metodologia sem isenção de espírito, assim como não é possível saber como os dados se comportarão em determinado grupo animal antes que um estudo detalhado seja executado. Nesse ponto é forçoso concluir, em outras palavras, que a hipótese de existência de um DNA barcode, para um determinado grupo de organismos, tem que ser testada para se concluir, sem isenção se ela pode ser refutada ou não. Segundo Rubinoff (2006), Hajibabaei et al. (2007), Godfray (2007) e Miller (2007) a metodologia de DNA barcode pode contribuir, como vem sendo demonstrado, com a Taxonomia, Sistemática e Genética de Populações. Na Taxonomia o DNA barcode pode ser utilizado para identificar espécimes atípicos e contribuir para revisão da nomenclatura de vários grupos, assim como pode ser utilizado como método de rotina para auxiliar na identificação de espécies. Na Sistemática o DNA barcode pode servir como ponto de partida para a seleção de táxons e as sequências de DNA obtidas nos projetos de DNA barcode podem ser adicionadas ao conjunto de sequências utilizadas para elaboração de filogenias. Na Genética de Populações o DNA barcode pode fornecer um primeiro sinal sobre a extensão e natureza das divergências populacionais o que facilitará os estudos comparativos da diversidade de várias espécies. De acordo com Stoeckle et al. (2005), há pelo menos dez razões para a realização do projeto de Código de Barras dos seres vivos, que são: 1. Trabalho com segmentos. O Código de Barras pode identificar espécies a partir de pequenos pedaços ou fragmentos, incluindo material não utilizado no processamento de plantas e animais, e produtos morfologicamente não facilmente reconhecíveis, derivados de espécies protegidas ou reguladas. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 47 2. Trabalho com todos os estágios do ciclo de vida. O Código de Barras pode identificar uma espécie em suas múltiplas formas, de ovos ou sementes, passando pelos estágios de larva ou mudas, até o estágio de adultos. 3. Identificação de espécies similares. O Código de Barras pode distinguir entre espécies que são morfologicamente muito similares, incluindo organismos perigosos (como os portadores de venenos) similares a outros não perigosos, e assim permitir uma visão mais acurada da biodiversidade. 4. Redução de ambiguidades. Um Código de Barras fornece um meio digital, não ambíguo, para identificação de espécies, não carecendo do uso de descrições subjetivas baseadas em gradações de formas e cores, por exemplo. 5. Possibilidade dos especialistas irem mais longe. Os cientistas podem fazer uso do Código de Barras para uma identificação mais rápida dos organismos e também para facilitar um reconhecimento mais rápido de novas espécies que assim podem ser descritas pelos métodos tradicionais. 6. Democratização do acesso. Uma biblioteca padronizada de Código de Barras aumentará muito o número de pessoas capazes de nomear as espécies. 7. Abertura de caminhos para criação de um dispositivo portátil para identificação de espécies em campo. O Código de Barras liga a identificação biológica às fronteiras avançadas do sequenciamento de DNA, eletrônica e ciência da informação, criando um caminho para criação de dispositivos portáteis para identificação de espécies. 8. Possibilita o posicionamento de novas folhas na árvore da vida. Estabelecer as similaridades e diferenças entre o Código de Barras das estimadas 10 milhões de espécies de plantas e animais ajudará a mostrar onde suas folhas, representando as espécies, devem estar posicionadas na árvore da vida. 9. Demonstração do valor das coleções. A compilação de uma biblioteca de Códigos de Barra começa com os milhões de espécimes em museus, herbários, zoológicos, jardins botânicos e outros repositórios de materiais biológicos, pondo em evidência seus esforços para preservar e entender a biodiversidade da Terra. 10. Compilação mais rápida da enciclopédia da vida. Uma biblioteca de Código de Barras, ligada a espécimes nomeados, ampliará o acesso do público ao conhecimento biológico, auxiliando na criação de uma enciclopédia on-line da vida na Terra. Dessa maneira, ainda que a metodologia de DNA barcode possa não ser suficiente para permitir a identificação de todas as espécies da Terra, avanços nessa metodologia seguramente poderão auxiliar em muito em nossa compreensão da biodiversidade do planeta e auxiliar na identificação mais precisa dessa biodiversidade. REFERÊNCIAS BIBLIOGRÁFICAS Albert, J. S., Fernandes-Matioli, F. M., Almeida-Toledo, L. F. (1999). New species of Gymnotus (Gymnotiformes, Teleostei) from Southeastern Brazil: towards the deconstruction of Gymnotus carapo. Copeia, 1999(2): 410-421. Avise, J. C. (1994). Molecular markers, natural history and evolution. New York: Chapman e Hall. Barrett, R. D. H., Hebert, P. D. (2005). Identifying spiders through DNA barcodes. Can J Zool, 83:481-491. Benine, R.C., Mariguela, T.C., Oliveira, C. (2009). New species of Moenkhausia Eigenmann, 1903 (Characiformes: Characidae) with comments on the Moenkhausia oligolepis species complex. Neotropical Ichthyology, 7(2):161-168. Brower, A.V. Z. (2006). Problems with DNA barcodes for species delimitation: 'ten species' of Astraptes fulgerator reassessed (Lepidoptera: Hesperiidae). Syst Biodiv, 4(2):127-132. Carvalho, M.R., Bockmann, F.A., Amorim, D.S. et al. (2007). Taxonomic Impediment or Impediment to Taxonomy? A Commentary on Systematics and the CybertaxonomicAutomation Paradigm. Evol Biol, 34:140-143. DeQueiroz, K. (2005). Ernst Mayr and the modern concept of species. Proc Natl Acad Sci USA, 102(s1):6600-6607. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 48 DeSalle, R., Egan, M. G., Siddall, M. (2005). The unholy trinity: taxonomy, species delimitation and DNA barcoding. Phil Trans Royal Soc B, 360:1905-1916. Ebach, M. C., Holdrege, C. (2005). DNA barcoding is no substitute for taxonomy. Nature, 434:697. Godfray, H.C.J. (2007). Linnaeus in the information age. Nature, 446:259-260. Goldstein, P. Z., DeSalle, R. (2000). Phylogenetic species, nested hierarchies, and character fixation. Cladistics, 16:364–384. Goldstein, P. Z., DeSalle, R. (2003). Calibrating phylogenetic species formation in a threatened insect using DNA from historical specimens. Mol. Ecol., 12:1993–1998. Goldstein, P. Z., DeSalle, R., Amato, G., Vogler, A. P. (2000). Conservation genetics at the species boundary. Conserv. Biol., 14:120–131. Gregory, T.R. (2005). DNA barcoding does not compete with taxonomy. Nature, 434:10671067. Hajibabaei M., Singer, G. A., Hebert, P. D. N., Hickey, D. A. (2007). DNA barcoding: how it complements taxonomy, molecular phylogenetics and population genetics. Trends in Genetics, 23(4):167-172. Harrison, I. J., Nirchio, M., Oliveira, C., Ron, E., Gavira, J. (2007). A new species of mullet (Teleostei: Mugilidae) from Venezuela, with a discussion on the taxonomy of Mugil gaimardianus. J Fish Biol, 71 (supl. A): 76-97. Hebert, P. D. N., Cywinska, A., Ball, S. L., deWaard, J. R. (2003a). Biological identifications through DNA barcodes. Proc R Soc Lond B, 270:313-322. Hebert, P. D. N., Penton, E.H., Burns, J.M., Janzen, D. H., Hallwachs, W. (2004b). Ten species in one: DNA barcoding reveals cryptic species in the neotropical skipper butterfly Astraptes fulgerator. Proc Natl Acad Sci USA, 101(41):14812-14817. Hebert, P. D. N., Ratnasingham, S., deWaard, J. R. (2003b). Barcoding animal life: cytochrome c oxidase subunit 1 divergences among closely related species. Proc Biol Sci, 270:S96-99. Hebert, P. D. N., Stoeckle, M. Y., Zemlak, T. S., Francis, C. M. (2004a). Identification of birds through DNA Barcodes. PLoS Biol, 2(10):1567-1663. Hillis, D. M., Moritz, C., Mable, B. K. (1996). Molecular Systematics. Massachusetts: Sinauer Associates Incorporation. Hogg, I.D., Hebert, P.D.N. (2004). Biological identification of springtails (Collembola: Hexapoda) from the Canadian Arctic, using mitochondrial DNA barcodes. Can J Zool, 82: 749–754. Hubert, N., Hanner, R., Holm, E., Mandrak, N.E., Taylor, E., Burridge, M., Watkinson, D., Dumont, P., Curry, A., Bentzen, P., Zhang, J., April, J., Bernatchez, L. (2008). Identifying Canadian Freshwater Fishes through DNA Barcodes. Plos One, 3: 2429. Köhler, F. (2007). From DNA taxonomy to barcoding - how a vague idea evolved into a biosystematic tool. Zool Reihe, 83:44-51. Kress, W.J., Wurdack, K.J, Zimmer, E.A., Weigt, L.A., Janzen, D.H. (2005). Use of DNA barcodes to identify flowering plants. Proc Natl Acad Sci USA, 102: 8369-8374. Lahaye, R., Bank, M., Bogarin, D., et al. (2008). DNA barcoding the floras of biodiversity hotspots. Proc Natl Acad Sci USA 105:2923-2928. Lipscomb, D., Platnick, N., Wheeler, Q. (2003). The intellectual content of taxonomy: a comment on DNA taxonomy. Trends Ecol Evol, 18:65-66. Manwell, C., Baker, C.M.A. (1963). A sibling species of seacucumber discovered by starchgel electrophoresis. Comp Biochem Physiol, 10: 39–53. May, R. M. (1988). How many species are there on Earth? Science, 241:1441–1449. Mayr, E. (1969). Principles of systematic zoology. New York , McGraw-Hill. Meier, R., Shiyang, K., Vaidya, G., Ng, P. K. L. (2006). DNA barcoding and taxonomy in Diptera: a tale of high intraspecific variability and low identification success. Syst Biol, 55(5):715-728. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 49 Meyer, C. P., Paulay, G. (2005). DNA barcoding: error rates based on comprehensive sampling. PLoS Biol, 3(12):1-10. Miller, S. E. (2007). DNA barcoding and the renaissance of taxonomy. Proc Natl Acad Sci USA, 104:4775-4776. Moritz, C. and Cicero, C. (2004). DNA barcoding: promise and pitfalls. PLoS Biol, 2(10):1529-1531. Rosenberg, N. A. (2007). Statistical tests for taxonomic distinctiveness from observations of monophyly. Evolution, 61: 317-323. Rubinoff, D. (2006). DNA barcoding evolves into the familiar. Cons Biol, 20:1548-1549. Smith, M. A., Woodley, N. E., Janzen, D. H., Hallwachs, W., Hebert, P. D. N. (2006). DNA barcodes reveal cryptic host-specificity within the presumed polyphagous members of a genus of parasitoid flies (Diptera: Tachinidae). Proc Natl Acad Sci USA, 103(10):36573662. Stahls, G., Savolainen, E. (2008). MtDNA COI barcodes reveal cryptic diversity in the Baetis vernus group (Ephemeroptera, Baetidae). Mol Phylogen Evol, 46:82–87. Stoeckle, M. (2003). Taxonomy, DNA, and the Bar Code of Life. BioScience, 53:2. Stoeckle, M., Waggoner, P.E., Ausubel, J.H. (2005). Barcoding life, illustrated. Goals, rationale, results. www.barcoding.si.edu. Tautz, D., Arctander, P., Minelli, A., Thomas, R. H., Vogler, A. P. (2002). DNA points the way ahead in taxonomy. Nature 418: 479. Tautz, D., Arctander, P., Minelli, A., Thomas, R. H., Vogler, A. P. (2003). A plea for DNA taxonomy. Trends Ecol Evol, 18:70–74. Valdez-Moreno, M., Ivanova, N. V., Elías-Gutiérrez, M., Contreras-Balderas, S., e Hebert, P. D. N. (2009). Probing diversity in freshwater fishes from Mexico and Guatemala with DNA barcodes. J Fish Biol, 74(2): 377-402. Vences, M., Thomas, M., Van der Meijden, A., Chiari, Y., Vieites, D. R. (2005). Comparative performance of the 16S rRNA gene in DNA barcoding of amphibians. Frontiers in Zool, 2: 1-12. Ward, R. D., Zemlak, T. S., Innes, B. H., Last, P. R., Hebert, P. D. N. (2005). DNA barcoding Australia’s fish species. Phil Trans R Soc B, 359:1847-1857. Ward, R.D., Hanner, R., Hebert, P.D.N. (2009). The campaign to DNA barcode all fishes, FISH-BOL. J Fish Biol, 74:329–356. Waugh, J. (2007). DNA barcoding in animal species: progress, potential and pitfalls. BioEssays, 29:188-197. Whitfield, J. (2003). DNA barcodes catalogue animals. Nature. News Service. Available on URL http://www.nature.com/news/2003/030512/full/0305127.html. Acessado em 01/05/2007. Wiemers, M., Fiedler, K. (2007). Does the DNA barcoding gap exist? – a case study in blue butterflies (Lepidoptera: Lycaenidae). Frontiers in Zool., 4(8):1-16. Woese, C.R., Fox, G.E. (1977). Phylogenetic structure of the prokaryotic domain: the primary kingdoms. Proc Natl Acad Sci USA, 97: 8392–8396. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 50 THE GAMA APPROACH TO THE ANALYSIS OF LARGE GERMPLASM COLLECTIONS: THE EXAMPLE OF COMMON BEAN LANDRACES FROM BRAZIL Gepts P1*, Burle ML1,2, Noronha SE2, Fonseca JR3, del Peloso MJ3, Melo LC3, Temple SR1, Kami JA1 1 Department of Plant Sciences, UCLA-Davis,USA EMBRAPA Recursos Genéticos e Biotecnologia 3 EMBRAPA Arroz e Feijão * Email: [email protected] 2 Keywords: adaptation, drought, heat, Phaseolus vulgaris, geographic information systems, SSR markers ABSTRACT Background: The sheer size of some germplasm collection prevents a more thorough evaluation of their agronomic diversity. Here we propose a novel approach combining data of Geographic information systems, Agronomic evaluation, and Molecular analyses (GAMA) to facilitate a preliminary screen of the germplasm and identify genetically distinct groups of accessions with characteristic agronomic traits and putative adaptation to specific environmental conditions. Following this hypothesis-defining phase, a hypothesis-verifying phase should be conducted to verify the adaptation under controlled experimental conditions. Results: We illustrate this approach using a sample of 279 geo-referenced landraces of common bean from the different bean-growing regions in Brazil. This sample was first characterized at the molecular level with 74 markers of known map location and at the phenotypic level for agronomic traits. Subsequently, this bean sample was evaluated for morpho-agronomic traits at UC Davis and Santo Antônio de Goiás. Finally, correlations between coordinates of origin or markers and a broad range of environmental variables, including temperature and rainfall, were determined. Some of the results include: a) There were limited differences in environmental distribution between Andean and Mesoamerican gene pool beans; and b) The ‘mulatinho’ market class originated in regions that were warmer and received less rainfall than those of other market classes, such as the ‘roxo’ class. Correlations between environmental variables and specific markers identified 24 markers associated with rainfall during the growing season, five markers with average annual temperature and a sixth with altitude. Further research will be conducted to verify the heat and drought tolerance of ‘mulatinhos’ and further narrow down those regions of the bean genome that are responsible for drought and heat tolerance. Conclusion: This example illustrates how the GAMA approach can help narrow down a germplasm collection, in this case identify a group of cultivars with potential tolerance to drought or heat tolerance, which can then be analyzed in more detail. 1. BACKGROUND Since the 1930s, there has been a realization and preoccupation that the genetic diversity of our crops is decreasing and even threatened by extinction in agricultural fields (e.g., Harlan and Martini 1936). There are multiple causes for this phenomenon, including the tremendous population growth our planet has witnessed in the 20th century and the ensuing habitat destruction, the development of improved varieties and the corresponding displacement of traditional (heirloom or landrace) varieties, and the increased marketing exigencies, Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 51 especially in a globalized context. Further research on genetic diversity of crops has outlined three major phases of reduction in genetic diversity (Gepts 2004, 2006). In addition to the reduction in the 20th century just mentioned, there was also a reduction in genetic diversity during the process of domestication and initiation of agriculture, which has been documented in numerous crops and with several molecular approaches (e.g., Gepts et al. 1986, Sonnante et al. 1994, Hyten et al. 2006, Kim et al. 2012, Veasey et al. 2011). Subsequent to domestication, the spread of cultivars from the initial domestication centers to other regions of the world also led to reductions in genetic diversity In response to this so-called genetic erosion (van de Wouw et al. 2010) not only of seeds or other planting materials but also of traditional knowledge (Brush and Stabinski 1996; Brush 2004). It should be noted that very few activities have been set in motion to mitigate the causes of genetic diversity losses. Instead, two main approaches have been proposed to conserve crop genetic diversity per se, which are in situ and ex situ conservation (Gepts 2006). The former approach involves conservation in the native habitats, whether agricultural or natural. The latter approach involves a network of gene banks where crop biodiversity can be stored and maintained. The scope and size of these gene banks differ tremendously, with some of the largest containing several tens of thousands of accessions (Qualset and Shands 2005). Paradoxically, the size of the gene banks can limit their impact because it becomes quite difficult to implement a generalized and systematic evaluation of all accessions. To address this issue, the concept of “core collection” has been proposed (Brown 1989; Brown and Spillane 1999). A core collection consists of a sample including 5-10% of the whole collection; individual accessions of the core collection are chosen to represent the diversity of the entire collection. Thus, the purpose of the development of a core collection is to maximize the genetic diversity within the core sample. Because most accessions, however, have not been evaluated, the choice is made based generally on the basis of geographic information, i.e., often by country of origin and some readily available traits such as seed type. A potential weakness of the core collection concept is that the development of a robust core collection actually depends on evaluation data, which are – almost by definition – not available. This situation calls for the search for alternative data to be used in the development of core collection, specifically, and the use of germplasm collection, in general. One type of data is the geographic origin, based on precise coordinates. Based on these coordinates one can then establish correlations between specific phenotypes and environmental variables, such as climate data. Furthermore, landscape genetic approaches can then be applied to determine the existence of correlations between these variables and specific alleles at molecular loci. Both types of correlations are hypothesis-generating in that the associations just mentioned can be verified with additional field experimentation. In the research reported here, we sought to test this approach on a sample of Brazilian landraces of common bean from the germplasm collection at EMBRAPA-CNPAF. We call this approach GAMA (GIS-Agronomic-Molecular Approach) because the germplasm characterization involves an integration of these three types of data. 2. RESULTS AND DISCUSSION 2.1 Bean sample Accessions included in the sample for this study were provided by the Common Bean Gene Bank at the Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA) Arroz e Feijão (CNPAF, Santo Antônio de Goiás, GO). Based on passport data, one randomly chosen accession per Brazilian municipality was included in the study sample to maximize the geographic representation of the sample. To the best of our knowledge, all accessions were Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 52 landraces; special attention was applied to ensure that the most important landraces within each region were represented in the study sample. Thus, a total of 279 geo-referenced landrace accessions of common bean were included (Supplementary (Table 1; Fig. 1). Two other accessions of common bean were included as controls: BAT93 as a breeding line typical of the Mesoamerican gene pool, and Jalo EEP553 as a representative Andean cultivar (and, furthermore, a cultivar in Brazil; Voysest 1983). The two lines are also the parents of the BAT93 x Jalo EEP558 recombinant inbred population, the core mapping populations in P. vulgaris (Freyre et al. 1998; Gepts et al. 2008). To our knowledge, this is one of the broadest surveys of bean diversity in Brazil. 2.2 Main results 2.2.1. Molecular diversity Diversity at the molecular diversity was studied with a sample of 74 molecular markers – mostly microsatellite or SSR markers - distributed over the 11 chromosomes of the commonbean genome (Burle et al. 2010). Both domesticated gene pools – Andean and Mesoamerican – were present in Brazil, confirming earlier observations of Gepts et al. (1988) and Pereira and Souza (1992), but at quite different frequencies. Andean accessions accounted for 20% of the sample, whereas Mesoamerican accessions represented 80% of the sample. Quite strikingly, however, there was limited introgression between the two gene pools (< 5%), in spite of the sympatry of the two gene pools. This observation is consistent with observations by others (e.g., Kwak and Gepts 2009; Blair et al. 2009). Compared to centers of origin in Mesoamerica and the Andes, Brazilian landraces showed less genetic diversity as mean gene diversity was 0.46 (0.63 in a domesticated sample from the primary centers of origin: Kwak and Gepts 2009). In spite of their sympatry, the distinctness of the Andean and Mesoamerican gene pools is maintained. This may be due to the high frequency of hybrid inviability genes in the predominant eco-geographic races present in Brazil, namely race Mesoamerica (in the Mesoamerican gene pool) and race Nueva Granada (in the Andean gene pool). Analyses of SSR genetic diversity within the two major gene pools showed that the Andean gene pool in Brazil is quite homogeneous. In contrast, the Mesoamerican gene pool can be further subdivided into four groups and – intriguingly – a large fraction of accessions that represent hybrids among the four groups. The high frequency (about half of the Mesoamerican accessions) of hybrid accessions, resulting from admixture among the different Mesoamerican groups raises several questions, such as the frequency of hybridizations. Previous studies have shown the importance of gene flow in common bean (although they were primarily focused on wild x domesticated crosses; Papa and Gepts 2003). Nevertheless, it is reasonable to assume that admixture can take place among domesticated types as well (Ibarra-Pérez et al. 1997). An addition question is the consequence of this extensive hybridization for bean breeding. Do hybrid accessions have broader adaptation than their “pure” parents? Are they higher yielding? Further research is needed to answer these questions. Molecular marker analyses also showed extensive multilocus associations, even among markers on different linkage groups. In the entire study sample (combining Andean and Mesoamerican accessions), 80% of the 1,676 locus pairs were in genome-wide linkage disequilibrium (LD). When considering the two gene pools separately, the frequency of locus pairs in LD decreased to 8% in the Andean gene pool and 23% in the Mesoamerican gene pool. The LD data, and earlier information on allozyme data (Koenig and Gepts 1989, Singh et al. 1991), suggest that association analyses should be conducted separately in the Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 53 Andean and Mesoamerican gene pools to avoid confounding effects between gene pool membership and associations due to close linkage. 2.2.2. Morpho-agronomic diversity Field observations showed that the sample included high levels of diversity, particularly for seed types (color, size), growth habit, and susceptibility to rust and common bacterial blight. However, like for molecular diversity, not all diversity observed in the centers of origin was present among Brazilian landraces. A principal component analysis showed a major separation along the first axis (39%) corresponding to the divergence between Andean and Mesoamerican gene pools (Burle et al. 2011). The second axis of the principal component analysis revealed subdivisions within the two gene pools according to growth habit and the number of days to flowering. A canonical discriminant analysis confirmed the principal component analysis. It showed that the main traits separating accessions on the first canonical axis were – in decreasing order of magnitude – seed weight, flower color (wind and standard), pod beak position, and flower standard striping. On the second canonical axis, the main traits were flower wing color, seed coat color pattern, and growth habit (Burle et al. 2011). When combining molecular and morpho-agronomic data, it is possible to identify four groups within the Mesoamerican gene pool (in addition to the Andean group). Each of these groups includes different market types (Table 1). Table 1. Brazilian market types identified in each group of accessions (subpopulations). The groups of accessions were identified in Burle et al. (2010) based on molecular data (74 markers) and presetting Structure to K=5 (table from Burle et al. 2011). Groups of accessions Market types 1 (A)a Manteigão, Preto, Branco, Vermelho, Amendoim, Outros 2 (M) Preto (91%), Pardo 3 (M) Carioca, Mulatinho, Rosinha, Pardo, Preto, Vermelho, Amarelo, Outros 4 (M) Roxo, Rosinha, Amarelo, Pardob, Mulatinhob 5 (M) Preto (70%), Mulatinho, Pardob, Brancob c H Pardo, Roxo, Rosinha, Preto, Mulatinho, Amarelo, Branco, Outros. a A=Andean gene pool; M=Mesoamerican gene pool, according to Burle et al. (2010) Just one single accession of the commercial type was identified in the respective group. c Accessions identified as hybrid among the Mesoamerican groups (accessions with less than 80% of genetic background from a single group were considered as hybrids), according to Burle et al. (2010). b Several market types occurred predominantly in a single group, such as the Carioca, Mulatinho, and Roxo types. The Preto types were members of two different groups. Overall, the morpho-agronomic diversity suggests that two of the six major eco-geographic races are represented in Brazil, namely race Mesoamerica for the Mesoamerican gene pool and race Nueva Granada for the Andean gene pool. 2.2.3 Geographic Information System (GIS) data Collection sites were over- layered with geographic information system data from ecogeographic databases using ARCGIS 9.2. (Table 2) (Burle 2008). Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 54 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" Table 2. Sources of geographic information system (GIS) data (from Burle et al., in preparation) Environmental variables Major biomes Geomorphological Units Soil fertility classes, soil slope classes Mean annual temperature Mean diurnal temperature range (BIO2), annual precipitation (BIO12), and precipitation seasonality (BIO15); precipitation of warmest quarter (BIO18), precipitation of wettest quarter (BIO16), mean temperature of warmest quarter (BIO10), mean temperature of wettest quarter (BIO8) Source Federal Conservation Units of Brazil Mapa de Unidades de Revelo do Brasil Macroecological Delineation of Brazil BIOCLIM Reference IBGE 1994 IBGE 1993 EMBRAPA 1992/1993 IBGE 1978 Hijmans et al. 2005 Common bean in Brazil is grown in a wide range of environments, including the Atlantic Forest, Caatinga, Cerrado, Coastal vegetation, Grasslands, Pantanal, Pine forest, and Semideciduous forest. In the quarter that most likely matches the bean cultivation period, total precipitation ranged from 50 to 900 mm and mean temperature from 28 to 40°C. There was no difference in the geographic or environmental distribution of Andean and Mesoamerican accessions, with the exception of altitude. For the latter variable, there was a significant although small difference (Andean: 622 m; Mesoamerican: 530 m) (Burle 2008). Among market types, there were statistically significant differences between the ‘mulatinho’, types on the one hand, and other market types, on the other. In general, ‘mulatinho’ types were grown at lower altitudes and in areas with higher mean annual temperatures and lower annual precipitation (Burle et al., in preparation). These data suggests that, on average, ‘mulatinho’ varieties may be more tolerant to heat and drought than other market classes. Further research is needed to confirm the overall drought tolerance of the ‘mulatinho’ class, to determine variability within this class, and to identify the actual mechanism involved (Burle 2008). 2.2.4 Molecular linkage mapping Two statistical methods were used to identify molecular markers correlated with climatic variables. The FDIST2 (Beaumont and Nichols 1996) is based on the relationship between differentiation (FST) and heterozygosity. Outliers of this relationship may be under selection or linked to genomic regions under selection. The SAM method (Joost et al. 2007) runs logistic regressions and uses a likelihood ratio test or the Wald test to determine statistical significance. The SAM software identified 24 loci correlated with total precipitation for the cultivation trimester, distributed over 9 of the 11 chromosomes of common bean. In contrast, SAM identified only five loci significantly correlated with mean annual temperature. FDIST2 identified six loci showing a significant departure in the relationship between FST and heterozygosity. A conservative approach is to focus primarily on those markers identified by two or more of the methods (Table 3). Table 3. Number of loci significantly associated with rainfall during the cultivation trimester (P) and mean annual temperature (Temp) as identified by SAM (Joost et al. 2007) and loci with significant divergence as identified by FDIST2 (Beaumont and Nichols 1996) SAM P SAM Temp FDIST2 SAM P 18 SAM Temp 3 2 FDIST2 3 1 Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 55 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" SAM P, temp & FDIST2 2 Two loci were identified by the three analyses, two by FDIST2 and SAM P, and three by SAM P and SAM Temp. These loci (or the regions they mark) are primary targets for further analyses to confirm these results and, eventually, to identify the genes involved. 3 CONCLUSIONS The GAMA (GIS data - Agronomic data – Molecular data) approach described here provides a powerful way to characterize germplasm data, i.e., to identify potential accessions for further testing to identify specific agronomic traits. Combined with a genomic approach, it also provides a means to identify potential genes or genome regions involved in the inheritance of these agronomic traits. Limitations include the need for: a) coordinates of origin; b) GIS data of relevance to the geographic distribution of variables that represent potential selective forces. For abiotic variables, such as climate, the information may be present already. For biotic information, however, the information needs to be developed. There is a substantial need for further research to confirm the main findings. This research involves plant physiology, genetics, and genomics. The ultimate goals are, of course, the more efficient use of germplasm collections and the development of improved cultivars. 4. MATERIALS AND METHODS For more information on the Materials and Methods used in these studies, the reader is referred to Burle (2008) and Burle et al. (2010, 2011). 5. AUTHOR INFORMATION AND CONTRIBUTIONS PG conceived of the study and directed research conducted by MB. He also wrote the present contribution. MB performed most of the field research, molecular analyses, and statistical analyses, as part of her PhD thesis research at the University of California, Davis. SEN contributed to the statistical analyses of GIS-related data. MJP and LCM evaluated the materials in the field at EMBRAPA-CNPAF. SRT helped in the field experiments at UC Davis. JAK assisted in the molecular analyses. ACKNOWLEDGEMENTS We very grateful to the former Curator Jaime Fonsêca, who helped choosing the landrace sample and helped on the classification into market types. Funding: A CAPES (Brazil) fellowship to MLB is gratefully acknowledged. USDA/FAS/ICD/RSED provided funds for the molecular analysis. EMBRAPA Arroz e Feijão provided funds to conduct the field experiment in Brazil. REFERENCES Beaumont MA, Nichols RA. 1996. Evaluating loci for use in genetic analysis of population structure. Proc. R. Soc. London Ser. B, 263: 1619-1626. Blair M, Díaz L, Buendía H, Duque M. 2009. Genetic diversity, seed size associations and population structure of a core collection of common beans (Phaseolus vulgaris L.). Theor Appl Genet, 119: 955-972. Brown AHD, Spillane C. 1999. Implementing core collections-principles, procedures, progress, problems and promise. In: Johnson RC, Hodgkin T eds. Core collections for Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 56 today and tomorrow. Rome, Italy, International Plant Genetic Resources Institute: pp. 1-9. Brown HDA. 1989. Core collections: a practical approach to genetic resources management. Genome, 31: 818-824. Brush SB. 2004. Farmers' bounty, New Haven, CT, Yale University Press. Brush SB, Stabinsky D. 1996. Valuing local knowledge: indigenous people and intellectual property rights. Washington, DC, Island Press. Burle M. 2008. Assessing the genetic diversity of common bean (Phaseolus vulgaris L.) landraces from Brazil: from genetic structure to landscape distribution, PhD, University of California, Davis. Burle ML, Fonseca J, Kami JA, Gepts P. 2010 Microsatellite diversity and genetic structure among common bean (Phaseolus vulgaris L.) landraces in Brazil, a secondary center of diversity. Theor Appl Genet, 121: 801-813. Burle ML, Fonseca JR, José del Peloso M, Melo LC, Temple SR, Gepts P. 2011. Integrating phenotypic evaluations with a molecular diversity assessment of a Brazilian collection of common bean landraces. Crop Science, 51: 2668-2680. Freyre R, Skroch P, Geffroy V, Adam-Blondon A-F, Shirmohamadali A, Johnson W, Llaca V, Nodari R, Pereira P, Tsai S-M, Tohme J, Dron M, Nienhuis J, Vallejos C, Gepts P. 1998. Towards an integrated linkage map of common bean. 4. Development of a core map and alignment of RFLP maps. Theor. Appl. Genet., 97: 847-856. Gepts P. 2004. Domestication as a long-term selection experiment. Plant Breeding Reviews, 24 (Part 2): 1-44. Gepts P. 2006. Plant genetic resources conservation and utilization: The accomplishments and future of a societal insurance policy. Crop Science, 46: 2278-2292. Gepts P, Aragão FJL, Barros Ed, Blair MW, Brondani R, Broughton W, Galasso I, Hernández G, Kami J, Lariguet P, McClean P, Melotto M, Miklas P, Pauls P, Pedrosa-Harand A, Porch T, Sánchez F, Sparvoli F, Yu K. 2008. Genomics of Phaseolus beans, a major source of dietary protein and micronutrients in the Tropics. In: Moore PH, Ming R eds. Genomics of Tropical Crop Plants. Berlin, Springer: pp. 113-143. Gepts P, Kmiecik K, Pereira P, Bliss FA. 1988. Dissemination pathways of common bean (Phaseolus vulgaris, Fabaceae) deduced from phaseolin electrophoretic variability. I. The Americas. Economic Botany, 42: 73-85. Gepts P, Osborn TC, Rashka K, Bliss FA. 1986. Phaseolin-protein variability in wild forms and landraces of the common bean (Phaseolus vulgaris): evidence for multiple centers of domestication. Economic Botany, 40: 451-468. Harlan HV, Martini ML. 1936. Problems and results in barley breeding. Yearbook of agriculture. Washington, DC, USDA. Hyten DL, Song QJ, Zhu YL, Choi IY, Nelson RL, Costa JM, Specht JE, Shoemaker RC, Cregan PB. 2006. Impacts of genetic bottlenecks on soybean genome diversity. Proceedings of the National Academy of Sciences of the United States of America, 103: 16666-16671. Ibarra-Pérez F, Ehdaie B, Waines G. 1997. Estimation of outcrossing rate in common bean. Crop Sci., 37: 60-65. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ 29º ENCONTRO SOBRE TEMAS DE GENÉTICA E MELHORAMENTO "Genômica Populacional e Genética da Conservação" 57 Joost S, Bonin A, Bruford MW, DesprÉS L, Conord C, Erhardt G, Taberlet P. 2007. A spatial analysis method (SAM) to detect candidate loci for selection: towards a landscape genomics approach to adaptation. Molecular Ecology, 16: 3955-3969. Kim MY, Van K, Kang YJ, Kim KH, Lee SH. 2012. Tracing soybean domestication history: From nucleotide to genome. Breeding Science, 61: 445-452. Koenig R, Gepts P. 1989. Allozyme diversity in wild Phaseolus vulgaris: further evidence for two major centers of diversity. Theoretical and Applied Genetics, 78: 809-817. Kwak M, Gepts P. 2009. Structure of genetic diversity in the two major gene pools of common bean (Phaseolus vulgaris L., Fabaceae). Theoretical and Applied Genetics, 118: 979-992. Papa R, Gepts P. 2003. Asymmetry of gene flow and differential geographical structure of molecular diversity in wild and domesticated common bean (Phaseolus vulgaris L.) from Mesoamerica. Theoretical and Applied Genetics, 106: 239-250. Pereira PA, Souza CRB. 1992. Tipos de faseolina em raças “crioulas” de feijão no Brasil. Pesq Agrop Bras, 27: 1219–1221. Qualset CO, Shands HL. 2005. Safeguarding the future of U.S. agriculture: the need to conserve threatened collections of crop diversity worldwide, www.croptrust.org/documents/WebPDF/TrustReportfinal.pdf, University of California, Division of Agriculture and Natural Resources, Genetic Resources Conservation Progam. Singh SP, Nodari R, Gepts P. 1991. Genetic diversity in cultivated common bean. I. Allozymes. Crop Science, 31: 19-23. Sonnante G, Stockton T, Nodari RO, Becerra Velásquez VL, Gepts P. 1994. Evolution of genetic diversity during the domestication of common-bean (Phaseolus vulgaris L.). Theoretical and Applied Genetics, 89: 629-635. van de Wouw M, Kik C, van Hintum T, van Treuren R, Visser B. 2010. Genetic erosion in crops: concept, research results and challenges. Plant Genetic Resources, 8: 1-15. Veasey EA, Piotto FA, do Nascimento WF, Rodrigues JF, Mezette TF, Borges A, Biguzzi FA, dos Santos FRC, Sobierajski GD, Recchia GH, Mistro JC. 2011. Evolutionary processes and the origin of crop plants. Ciencia Rural, 41: 1218-1228. Voysest O. 1983. Variedades de frijol en América Latina y su origen, Cali, Colombia, Centro Internacional de Agricultura Tropical. Departamento de Genética, ESALQ/USP - http://www.genetica.esalq.usp.br/29temas/ UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA “LUIZ DE QUEIROZ” DEPARTAMENTO DE GENÉTICA PPG-GMP Pós-Graduação http://www.genetica.esalq.usp.br/29temas/ UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA “LUIZ DE QUEIROZ” DEPARTAMENTO DE GENÉTICA