Testes de Hipóteses:
Aderência à Distribuições de
Probabilidade
Profa. Silvia Nassar
[email protected]
População x Amostra:
µ; Οƒ; P
Distribuição de Probabilidade
Profa. Silvia Nassar
[email protected]
π‘₯ ; 𝑠; 𝑝
Distribuição Empírica
Processo de Análise Estatística:
Profa. Silvia Nassar
[email protected]
Testes de Hipóteses:
aderência à distribuições de probabilidade
οƒΌ Teste Qui-quadrado
οƒΌ Teste de Kolmogorov-Smirnov
οƒΌ Teste de Anderson-Darling
Profa. Silvia Nassar
[email protected]
Estrutura dos Testes de Hipóteses:
Conjunto de Hipóteses:
Ho: hipótese de NEGAÇÃO
H1: hipótese AFIRMATIVA
Nível de Significância (Ξ±):
1% ou 5% ou 10%
Estatísticas Amostrais :
π‘₯ ,𝑠 ,𝑝
Tabelas de Frequências
Histograma
Medida Estatística:
específica para cada Teste de
Hipóteses
Decisão Estatística: Regra de
Decisão
Probabilidade de significância
(pvalor):
Aceita Ho
calculada utilizando uma
Distribuição de Referência
Rejeita Ho (Afirma H1)
Cenário Estatístico
Profa. Silvia Nassar
[email protected]
Informação dos Dados
Teste Qui-quadrado:
aderência à uma distribuição de probabilidade
Conjunto de Hipóteses:
Ho: hipótese de NEGAÇÃO
H1: hipótese AFIRMATIVA
Nível de Significância (Ξ±):
1% ou 5% ou 10%
H0: Não há diferença significante entre a distribuição dos
DADOS e a dist. Hipotética com k parâmetros
H1: Sim, há diferença significante
∝= π‘ƒπ‘Ÿπ‘œπ‘ 𝐻1 𝐻0 é π‘£π‘’π‘Ÿπ‘‘π‘Žπ‘‘π‘’π‘–π‘Ÿπ‘œ
Adotando
Decisão Estatística: regra de
decisão
Aceita Ho
Rejeita Ho (Afirma H1)
Profa. Silvia Nassar
[email protected]
∝ = 𝟎, πŸŽπŸ“ 𝒐𝒖 πŸ“%
𝑇𝑒𝑠𝑑𝑒 π‘ˆπ‘›π‘–π‘™π‘Žπ‘‘π‘’π‘Ÿπ‘Žπ‘™:
𝑆𝑒 𝒑𝒗𝒂𝒍𝒐𝒓 > 𝜢 𝑒𝑛𝑑ãπ‘œ 𝐻0
𝑆𝑒 𝒑𝒗𝒂𝒍𝒐𝒓 ≀ 𝜢 𝑒𝑛𝑑ãπ‘œ 𝐻1
Teste Qui-quadrado:
aderência à uma distribuição de probabilidade
Estatísticas Amostrais :
π‘₯ ,𝑠 ,𝑝
Tabela de Frequências Observadas (Oi)
Tabelas de Frequências
para as L classes da Variável QT
Histograma
Distância Qui-quadrado calculada: 2dados
Medida Estatística:
específica para cada Teste de
Hipóteses
πœ’
2
π‘‘π‘Žπ‘‘π‘œπ‘ 
=
1≀𝑖≀𝐿
( 𝑂𝑖 βˆ’ π‘¬π’Š )2
π‘¬π’Š
Probabilidade de significância (pvalor):
calculada utilizando uma
Distribuição de Referência
𝑔𝑙 = (𝐿 βˆ’ 1) - k
Profa. Silvia Nassar
[email protected]
π‘π‘£π‘Žπ‘™π‘œπ‘Ÿ = DIST.QUI (2dados
L=número de linhas da Tabela de Frequências
k = número de parâmetros da dist. Hipotética
;
gl)
Teste Qui-quadrado: Frequências Esperadas Ei
Distância Qui-quadrado calculada: 2dados
Ei calculadas:
Distribuição Hipotética
πœ’
2
π‘‘π‘Žπ‘‘π‘œπ‘ 
=
1≀𝑖≀𝐿
Ei Frequências Esperadas para H0
( 𝑂𝑖 βˆ’ π‘¬π’Š )2
π‘¬π’Š
𝑔𝑙 = (𝐿 βˆ’ 1) - k
H0: Não há diferença significante entre a distribuição dos
DADOS e a distribuição Hipotética
L=número de linhas da Tabela de Frequências
k = número de parâmetros da dist. Hipotética
H1: Sim, há diferença significante
Intervalos da QT
Freq.
Observadas
(Oi)
* Probabilidade
Freq.
Intervalo (P(Inti)) Esperadas (Ei)
x≀a
O1
P(Int1)
= n * P(Int1)
a<x≀b
O2
P(Int2)
= n * P(Int2)
b<x≀c
O3
P(Int3)
= n * P(Int3)
c<x≀d
O4
P(Int4)
= n * P(Int4)
d<x≀e
O5
P(Int5)
= n * P(Int5)
x>e
O6
P(Int6)
Total
n
1
* Calculada com a Distribuição Hipotética em teste
Profa. Silvia Nassar
[email protected]
= n * P(Int6)
-----
Restrição Teste Qui-quadrado:
Todas as freq. Ei β‰₯5
Se Ei<5 então agrupar Intervalos da QT)
Regra de Decisão:
𝑆𝑒 𝒑𝒗𝒂𝒍𝒐𝒓 > 𝜢 𝑒𝑛𝑑ãπ‘œ 𝐻0
𝑆𝑒 𝒑𝒗𝒂𝒍𝒐𝒓 ≀ 𝜢 𝑒𝑛𝑑ãπ‘œ 𝐻1
Teste Kolmogorov-Smirnov:
aderência à uma distribuição de probabilidade
Conjunto de Hipóteses:
Ho: hipótese de NEGAÇÃO
H1: hipótese AFIRMATIVA
Nível de Significância (Ξ±):
1% ou 5% ou 10%
Decisão Estatística : Regra de
Decisão
Aceita Ho
Rejeita Ho (Afirma H1)
Profa. Silvia Nassar
[email protected]
H0: Não há diferença significante entre a distribuição dos
DADOS e a dist. Hipotética com k parâmetros
H1: Sim, há diferença significante
∝= π‘ƒπ‘Ÿπ‘œπ‘ 𝐻1 𝐻0 é π‘£π‘’π‘Ÿπ‘‘π‘Žπ‘‘π‘’π‘–π‘Ÿπ‘œ
Adotando
∝ = 𝟎, πŸŽπŸ“ 𝒐𝒖 πŸ“%
𝑇𝑒𝑠𝑑𝑒 π‘ˆπ‘›π‘–π‘™π‘Žπ‘‘π‘’π‘Ÿπ‘Žπ‘™: Tabela de Valores Críticos
𝑆𝑒 𝑫𝒅𝒂𝒅𝒐𝒔 < 𝑫𝒄𝒓íπ’•π’Šπ’„π’ 𝑒𝑛𝑑ãπ‘œ 𝐻0
𝑆𝑒 𝑫𝒅𝒂𝒅𝒐𝒔 β‰₯ 𝑫𝒄𝒓íπ’•π’Šπ’„π’ 𝑒𝑛𝑑ãπ‘œ 𝐻1
Teste Kolmogorov-Smirnov:
aderência à uma distribuição de probabilidade
Estatísticas Amostrais :
π‘₯ ,𝑠 ,𝑝
Tabelas de Frequências
Tabela de Frequências Acumuladas Observadas (Oi)
para cada valor xi da Variável QT
Histograma
Medida Estatística:
específica para cada Teste de
Hipóteses
Probabilidade de significância (pvalor):
calculada utilizando uma
Distribuição de Referência
Profa. Silvia Nassar
[email protected]
Distância K-S calculada: π·π‘‘π‘Žπ‘‘π‘œπ‘ 
π·π‘‘π‘Žπ‘‘π‘œπ‘  = max 𝐷𝑖 = max [ |𝑃 𝑂𝑖
βˆ’ 𝑃 𝐸𝑖 |]
Distância K-S crítica: π·π‘π‘Ÿíπ‘‘π‘–π‘π‘œ
Tabela de Kolmogorov-Smirnov
Regra de Decisão:
𝑆𝑒 π·π‘‘π‘Žπ‘‘π‘œπ‘  < π·π‘π‘Ÿíπ‘‘π‘–π‘π‘œ 𝑒𝑛𝑑ãπ‘œ 𝐻0
𝑆𝑒 π·π‘‘π‘Žπ‘‘π‘œπ‘  β‰₯ π·π‘π‘Ÿíπ‘‘π‘–π‘π‘œ 𝑒𝑛𝑑ãπ‘œ 𝐻1
Teste Kolmogorov-Smirnov: Frequências Esperadas Ei
Distância K-S calculada: Ddados
Ei calculadas:
Distribuição Hipotética
π·π‘‘π‘Žπ‘‘π‘œπ‘  = max 𝐷𝑖 = max [ 𝑃 𝑂𝑖
Ei Frequências Esperadas para H0
βˆ’ 𝑃 𝐸𝑖 ]
Regra de Decisão:
𝑆𝑒 π·π‘‘π‘Žπ‘‘π‘œπ‘  < π·π‘π‘Ÿíπ‘‘π‘–π‘π‘œ 𝑒𝑛𝑑ãπ‘œ 𝐻0
𝑆𝑒 π·π‘‘π‘Žπ‘‘π‘œπ‘  β‰₯ π·π‘π‘Ÿíπ‘‘π‘–π‘π‘œ 𝑒𝑛𝑑ãπ‘œ 𝐻1
H0: Não há diferença significante entre a distribuição dos
DADOS e a distribuição Hipotética
H1: Sim, há diferença significante
Dados
1
x1
1
Probabilidade
Acumulada
P(Oi)
= 1/n
2
x2
2
3
.....
i
.....
n
x3
....
xi
....
xn
3
.....
Oi
.....
n
Amostra
Profa. Silvia Nassar
[email protected]
Valores da Freq. Acumulada
QT (xi)
(Oi)
Distribuição
Hipotética
Probabilidade
Acumulada P(Ei)
Distância KS
D = P(Oi)-P(Ei)
= P(X ≀ x1)
D1
= 2/n
= P(X ≀ x2)
D2
= 3/n
....
= Oi /n
....
= n/n = 1
= P(X ≀ x3)
....
= P(X ≀ xi)
....
= P(X ≀ xn)
D3
....
Di
....
Dn
Teste Kolmogorov-Smirnov: Tabela Dcrítico
SestatNet:
Material de apoio/Tabelas
Regra de Decisão:
𝑆𝑒 π·π‘‘π‘Žπ‘‘π‘œπ‘  < π·π‘π‘Ÿíπ‘‘π‘–π‘π‘œ 𝑒𝑛𝑑ãπ‘œ 𝐻0
𝑆𝑒 π·π‘‘π‘Žπ‘‘π‘œπ‘  β‰₯ π·π‘π‘Ÿíπ‘‘π‘–π‘π‘œ 𝑒𝑛𝑑ãπ‘œ 𝐻1
Profa. Silvia Nassar
[email protected]
Download

dados - SEstatNet