A estatística na pesquisa agrária e biológica O que é a estatística? A estatística é uma ciência que se preocupa com o planejamento de uma pesquisa, envolvendo desde a forma de coleta das observações, obtidas em experimentos ou levantamentos, até a maneira como é feita a organização, a descrição e o resumo dos dados, assim como a avaliação e afirmação sobre características de interesse do pesquisador. Planejamento da pesquisa Análise estatística As análises estatísticas dependem da forma como os dados são coletados, E o planejamento estatístico da pesquisa indica o esquema sob o qual os dados serão obtidos. PORTANTO, o planejamento da pesquisa e análise estatística dos dados estão INTIMAMENTE ligados. IMPORTANTE!!! O pesquisador deve possuir um conhecimento razoável de estatística para desenvolver suas pesquisas ou, então, consultar um estatístico para auxiliá-lo. É IMPORTANTE frisar que esta consulta deve ser feita ANTES do início da pesquisa, ainda durante a elaboração do projeto. Forma de coleta dos dados Observacionais: observa-se o fenômeno na natureza Experimentais Experimentos Determinísticos Aleatórios Variáveis São mensurações, contagens ou atributos avaliados pelos pesquisadores Classificação das variáveis Qualitativas (atributos) Ex: Classe social, sexo, grau de instrução, cidade de procedência Quantitativas (mensuração ou contagem) Ex: altura, peso, dap, no. de insetos mortos, no. de bactérias Qualitativas (atributos) Variáveis qualitativas ordinais Ex: grau de instrução, classe social Variáveis qualitativas nominais Ex: cidade de procedência, sexo Variáveis quantitativas Variáveis quantitativas discretas Ex: No. de insetos mortos, no. de bactérias Variáveis quantitativas contínuas Ex: Peso, altura, dap Análise Exploratória dos dados Depende do tipo de variável considerada. Software R dad1<-rbinom(2000,20,0.6) dad1 table(dad1) sum(table(dad1)) plot(table(dad1)) barplot(table(dad1)) dad2<-round(rnorm(1000,60,8),2) dad2 hist(dad2) hist(dad2,breaks=20) dad3<sample(x,1000,replace=T,prob=c(0.1 ,0.5,0.4)) table(dad3) barplot(table(dad3)) demo() demo(image) demo(graphics) history() Arredondamento Convenções Para exercícios e PROVAS!!! round(2.456789,4) [1] 2.4568 round(2.456749,4) [1] 2.4567 round(2.456759,4) [1] 2.4568 round(2.456659,4) [1] 2.4567 Para facilitar crie o arquivo de dados no EXCEL Salve com extensão csv (MS-DOS) No R mude o diretório no qual o arquivo .csv foi salvo. Se o separador decimal do EXCEL for vírgula utilize para a leitura read.csv2 read.csv2("Dados turma Est Geral 2008.csv", header=TRUE) dados<-read.csv2("Dados turma Est Geral 2008.csv", header=TRUE) names(dados) # Classifique as variáveis Resumo: Variáveis qualitativas Tabela de frequência table(dados$SEXO) Gráfico de colunas barplot(table(dados$SEXO)) Gráfico de semi retas plot(table(dados$SEXO)) Gráfico tipo pizza pie(table(dados$SEXO)) Resumo: Variáveis quantitativas hist(dados$ALTURA) plot(density(dados$ALTURA)) hist(dados$ALTURA,breaks=20) boxplot(dados$ALTURA,dados$PESO) stem(dados$ALTURA,scale=2) Comandos interessantes par(mfrow=c(2,1)) pie(table(dados$GIP)) pie(table(dados$GIM)) par(mfrow=c(1,2)) pie(table(dados$GIM)) pie(table(dados$GIP)) mode(dados) dad1<-dados[which(dados$SEXO=="F"),] dad1 Gráficos para variáveis qualitativas x<-c(12,18,6)> > names(x)<c("Fundamental","Médio","Superior") pie(x) pie(x,main="Figura 01: Gráfico em setores para a variável Grau de instrução" , col=c("red","blue","yellow"), xlab=" Fonte: FMILSA" )