Dogma da Biologia Molecular
* Com o avanço das descobertas acerca dos Ácidos Nucléicos e das Proteínas
surgiu o Dogma da biologia Molecular;
* Surgimento dos métodos de sequenciamento desses polímeros;
* Investigação das sequências monoméricas constituintes do DNA : desde então
mais de 18 milhões de sequências gênicas já estão disponíveis em bancos de
dados públicos;
Bioinformática
Histórico
* Segunda metade da década de 90: surgimento dos sequenciadores
automáticos de DNA
- explosão na quantidade de sequências a serem armazenadas : recursos
computacionais eficientes;
* Surgimento da necessidade de analisar esses dados : uso de plataformas
computacionais eficientes para interpretá-los;
* Nascimento da Bioinformática
-união da Engenharia de softwares, matemática, estatística, ciÊncia da
computação e biologia molecular;
Bioinformática
Princípios Básicos
Sistemas operacionais
O sistema operacional (SO) é o principal programa de um computador. Ele é responsável
pelo gerenciamento da memória, pelo acesso aos discos e também faz acesso aos
componentes físicos da máquina (hardware).
* Os SOs mais conhecidos e utilizados são baseados no Windows, Unix e MacOS.
* Muitas das aplicações utilizadas em bioinformática são compiladas e distribuídas para a
execução em plataformas derivadas do Unix
* A preferência por sistemas baseados em Unix deve-se ao fato de que tais sistemas, são:
- mais confiáveis;
-gerenciam melhor o trabalho com grandes quantidades de dados e que
algumas de suas variantes, como o Linux;
- possuem código aberto e distribuídos gratuitamente.
Bioinformática
Princípios Básicos
Linguagens de programação
As Linguagens de programação foram criadas para facilitar a especificação de
tarefas a um computador.
* Existem milhares de linguagens de programação e cada uma delas possui um
conjunto de comandos específicos;
* Linguagens de programação mais utilizadas: basic, pascal, C, C++, java,
cobol e fortran.
* Entretanto, a linguagem mais utilizada é denominada PERL (Pratical Extract
and Report Language);
* O PERL é uma linguagem rica, simples, disponível gratuitamente, possui uma série de
módulos enriquecedores (bioperl e biographics) e faz interface com bancos de dados;
Bioinformática
Princípios Básicos
Banco de dados
Um banco de dados pode ser considerado uma coleção de dados interrelacionados, projetado para suprir as necessidades de um grupo
específico de aplicações e usuários.
* Possui a função de organizar e estruturar as informações, o que facilita consultas,
atualizações e deleções de dados;
* SGBD (Sistema de Gerenciamento de Banco de Dados)
- utilizado como intermediário dos processos de construção,
manipulação e administração do banco de dados
Bioinformática
Princípios Básicos
Banco de dados
Principais Sistemas de Gerenciamento de Bancos de dados
- MySQLhttp://www.mysql.org
Acesso livre para download do gerenciador MySQL, como também a várias
Ferramentas de conexão, como: DBI, Java, ODBC e etc. Apresenta
documentação completa.
- PostgreSQLhttp://www.pgsql.com/
Acesso livre para download do gerenciador PostgreSQL, como também
algumas ferramentas. Apresenta documentação completa.
- ORACLEhttp://www.oracle.com
Informações comerciais sobre o banco de dados.
- Microsoft SQL Serverhttp://www.microsoft.com/sql/
Informações comerciais sobre o banco de dados.
Bioinformática
Princípios Básicos
Banco de dados públicos em bioinformática
* Projetos Genoma: Projeto Genoma Humano;
* Os bancos de dados podem envolver sequências de nucleotídeos,
aminoácidos ou estruturas protéicas;
* Podem ser divididos em:
-
1. Bancos de sequências primário:
São formados pela deposição direta de nucleotídeos, aminoácidos ou
estruturas proteicas, sem qualquer processamento ou análise (GenBank,
EBI, DDBJ e PDB)
2. Bancos de sequências secundário:
- São derivados dos primários, foram sendo formados a partir de informações
depositadas nos bancos de sequências primárias (SWISS-PROT, PIR)
Bioinformática
Princípios Básicos
Banco de dados públicos em bioinformática
* Os bancos de dados ainda podem ser divididos em;
-
1. Bancos estruturais:
Mantém dados relacionados às estruturas de proteínas
2. Bancos funcionais:
- Disponibilizam links para mapas metabólicos de organismos com genoma
completamente ou parcialmente sequenciados (KEGG);
Bancos de Dados mais utilizados em bioinformática
- Genbankhttp://www.ncbi.nlm.nih.gov/
Banco de dados americano de sequências de DNA e proteínas.
- EBIhttp://www.ebi.ac.uk/
Banco de dados europeu de sequências de DNA.
- DDBJhttp://www.ddbj.nig.ac.jp/
Banco de dados japonês de sequências de DNA.
- PDBhttp://www.rcsb.org/pdb
Armazena estruturas tridimensionais resolvidas de proteínas.
- GDBhttp://gdbwww.gdb.org/
Banco de dados oficial do projeto genoma humano.
- TIGR Databaseshttp://www.tigr.org/tdb/
Banco com informações de genomas de vários organismos diferentes.
- PIR http://www-nbrf.georgetown.edu/
Banco de proteínas anotadas.
- SWISS-PROT http://www.expasy.ch/spro/
Armazena sequências de proteínas e suas respectivas características moleculares, anotado
manualmente por uma equipe de especialistas.
- INTERPRO http://www.ebi.ac.uk/interpro/
Banco de dados de famílias, domínios e assinaturas de proteínas.
- KEGG http://www.genome.ad.jp/kegg/
Banco com dados de sequências de genomas de vários organismos
BLAST – FERRAMENTA DE ALINHAMENTO DE BUSCA LOCAL
* É um programa instrumental para identificação de genes e de sequências
genéticas características.
*Uma das ferramentas mais conhecidas
*Disponibilizada pelo NCBI (National Center for Biotechnology
Information).
*Foi desenvolvido para a pesquisa de semelhança entre sequências de
nucleótidos.
*Seu objetivo é executar pesquisa de sequências contra a base de dados de
DNA completa em menos de 15 segundos
Download

Apresentação do PowerPoint