Dogma da Biologia Molecular * Com o avanço das descobertas acerca dos Ácidos Nucléicos e das Proteínas surgiu o Dogma da biologia Molecular; * Surgimento dos métodos de sequenciamento desses polímeros; * Investigação das sequências monoméricas constituintes do DNA : desde então mais de 18 milhões de sequências gênicas já estão disponíveis em bancos de dados públicos; Bioinformática Histórico * Segunda metade da década de 90: surgimento dos sequenciadores automáticos de DNA - explosão na quantidade de sequências a serem armazenadas : recursos computacionais eficientes; * Surgimento da necessidade de analisar esses dados : uso de plataformas computacionais eficientes para interpretá-los; * Nascimento da Bioinformática -união da Engenharia de softwares, matemática, estatística, ciÊncia da computação e biologia molecular; Bioinformática Princípios Básicos Sistemas operacionais O sistema operacional (SO) é o principal programa de um computador. Ele é responsável pelo gerenciamento da memória, pelo acesso aos discos e também faz acesso aos componentes físicos da máquina (hardware). * Os SOs mais conhecidos e utilizados são baseados no Windows, Unix e MacOS. * Muitas das aplicações utilizadas em bioinformática são compiladas e distribuídas para a execução em plataformas derivadas do Unix * A preferência por sistemas baseados em Unix deve-se ao fato de que tais sistemas, são: - mais confiáveis; -gerenciam melhor o trabalho com grandes quantidades de dados e que algumas de suas variantes, como o Linux; - possuem código aberto e distribuídos gratuitamente. Bioinformática Princípios Básicos Linguagens de programação As Linguagens de programação foram criadas para facilitar a especificação de tarefas a um computador. * Existem milhares de linguagens de programação e cada uma delas possui um conjunto de comandos específicos; * Linguagens de programação mais utilizadas: basic, pascal, C, C++, java, cobol e fortran. * Entretanto, a linguagem mais utilizada é denominada PERL (Pratical Extract and Report Language); * O PERL é uma linguagem rica, simples, disponível gratuitamente, possui uma série de módulos enriquecedores (bioperl e biographics) e faz interface com bancos de dados; Bioinformática Princípios Básicos Banco de dados Um banco de dados pode ser considerado uma coleção de dados interrelacionados, projetado para suprir as necessidades de um grupo específico de aplicações e usuários. * Possui a função de organizar e estruturar as informações, o que facilita consultas, atualizações e deleções de dados; * SGBD (Sistema de Gerenciamento de Banco de Dados) - utilizado como intermediário dos processos de construção, manipulação e administração do banco de dados Bioinformática Princípios Básicos Banco de dados Principais Sistemas de Gerenciamento de Bancos de dados - MySQLhttp://www.mysql.org Acesso livre para download do gerenciador MySQL, como também a várias Ferramentas de conexão, como: DBI, Java, ODBC e etc. Apresenta documentação completa. - PostgreSQLhttp://www.pgsql.com/ Acesso livre para download do gerenciador PostgreSQL, como também algumas ferramentas. Apresenta documentação completa. - ORACLEhttp://www.oracle.com Informações comerciais sobre o banco de dados. - Microsoft SQL Serverhttp://www.microsoft.com/sql/ Informações comerciais sobre o banco de dados. Bioinformática Princípios Básicos Banco de dados públicos em bioinformática * Projetos Genoma: Projeto Genoma Humano; * Os bancos de dados podem envolver sequências de nucleotídeos, aminoácidos ou estruturas protéicas; * Podem ser divididos em: - 1. Bancos de sequências primário: São formados pela deposição direta de nucleotídeos, aminoácidos ou estruturas proteicas, sem qualquer processamento ou análise (GenBank, EBI, DDBJ e PDB) 2. Bancos de sequências secundário: - São derivados dos primários, foram sendo formados a partir de informações depositadas nos bancos de sequências primárias (SWISS-PROT, PIR) Bioinformática Princípios Básicos Banco de dados públicos em bioinformática * Os bancos de dados ainda podem ser divididos em; - 1. Bancos estruturais: Mantém dados relacionados às estruturas de proteínas 2. Bancos funcionais: - Disponibilizam links para mapas metabólicos de organismos com genoma completamente ou parcialmente sequenciados (KEGG); Bancos de Dados mais utilizados em bioinformática - Genbankhttp://www.ncbi.nlm.nih.gov/ Banco de dados americano de sequências de DNA e proteínas. - EBIhttp://www.ebi.ac.uk/ Banco de dados europeu de sequências de DNA. - DDBJhttp://www.ddbj.nig.ac.jp/ Banco de dados japonês de sequências de DNA. - PDBhttp://www.rcsb.org/pdb Armazena estruturas tridimensionais resolvidas de proteínas. - GDBhttp://gdbwww.gdb.org/ Banco de dados oficial do projeto genoma humano. - TIGR Databaseshttp://www.tigr.org/tdb/ Banco com informações de genomas de vários organismos diferentes. - PIR http://www-nbrf.georgetown.edu/ Banco de proteínas anotadas. - SWISS-PROT http://www.expasy.ch/spro/ Armazena sequências de proteínas e suas respectivas características moleculares, anotado manualmente por uma equipe de especialistas. - INTERPRO http://www.ebi.ac.uk/interpro/ Banco de dados de famílias, domínios e assinaturas de proteínas. - KEGG http://www.genome.ad.jp/kegg/ Banco com dados de sequências de genomas de vários organismos BLAST – FERRAMENTA DE ALINHAMENTO DE BUSCA LOCAL * É um programa instrumental para identificação de genes e de sequências genéticas características. *Uma das ferramentas mais conhecidas *Disponibilizada pelo NCBI (National Center for Biotechnology Information). *Foi desenvolvido para a pesquisa de semelhança entre sequências de nucleótidos. *Seu objetivo é executar pesquisa de sequências contra a base de dados de DNA completa em menos de 15 segundos