Teste de Hipótese
Paramétrico
Vamos mostrar como calcular dois testes paramétricos bastante utilizados: o teste t de Student e a Análise de Variância (ANOVA).
Esses testes analisam se as diferenças encontradas entre duas ou mais amostras podem ser consideradas uma ocorrência casual (resultado de um erro amostral) ou se as diferenças são realmente significativas.
Para usar tais testes corretamente, todas as medidas devem ser do tipo intervalar (numérica) e a distribuição dos dados deve seguir a distribuição normal. Você pode verificar isso fazendo um gráfico de barras ou utilizando o teste de Kolmogorov-Smirnov.
Para fazer os testes, entre com os valores medidos para cada um dos grupos.
Grupo 1
N = 1
Medidas
Grupo 2
N = 1
Medidas
Veja como funciona pelos exemplos:
2 grupos, N ≥ 50 | 2 grupos, N < 50, N1 = N2 | 2 grupos, N < 50, N1 ≠ N2 | 3 ou + grupos
Árvore de Decisões
Passo 1. Antes de mais nada, é necessário encontrar a média de cada amostra.
\(\sum X = \)
\( N = \)
\[ \overline{X} = \frac{\sum X}{N}\]
\( \overline{X} = \)
Passo 2. Também é preciso achar o desvio-padrão de cada amostra.
\( \sum X^2 = \)
\( N = \)
\( {\overline{X}^2} = \)
\[s = \sqrt{\frac{\sum X^2}{N} - {\overline{X}}^2}\]
\(s = \)
Passo 3. A próxima etapa é calcular o erro padrão de cada média.
\( s = \)
\( N = \)
\[\sigma_{\,\overline{X}} = \frac{s}{\sqrt{N-1}}\]
\(\sigma_{\,\overline{X}} = \)
Passo 4. A seguir, acha-se o erro padrão da diferença.
\( {\sigma_{\overline{X}_1}} = \)
\( {\sigma_{\overline{X}_2}} = \)
\[\sigma_{\text{dif}} = \sqrt{{\sigma_{\overline{X}_1}}^2 + {\sigma_{\overline{X}_2}}^2 }\]
\(\sigma_{\text{dif}} = \)
Passo 5. Logo após, deve-se traduzir a diferença média amostral em unidades de erro padrão da diferença.
\( \overline{X}_1 = \)
\( \overline{X}_2 = \)
\(\sigma_{\text{dif}} = \)
\[z = \frac{\overline{X}_1 - \overline{X}_2}{\sigma_{\text{dif}}} \]
\(z = \)
Passo 6. Por fim, deve-se comparar o valor de \(z \) com o valor crítico que, para grau de significância igual a 5%, equivale a 1.96.
Passo 1. Antes de mais nada, é necessário encontrar a média de cada amostra.
\( \sum X = \)
\( N = \)
\[ \overline{X} = \frac{\sum X}{N}\]
\( \overline{X} = \)
Passo 2. Também é preciso achar o desvio-padrão de cada amostra.
\( \sum X^2 = \)
\( N = \)
\( \overline{X}^2 = \)
\[s = \sqrt{\frac{\sum X^2}{N} - {\overline{X}}^2}\]
\(s = \)
Passo 3. Em seguida, identifica-se o erro padrão de cada média.
\( s = \)
\( N = \)
\[\sigma_{\,\overline{X}} = \frac{s}{\sqrt{N-1}}\]
\(\sigma_{\,\overline{X}} = \)
Passo 4. Agora, deve-se descobrir o erro padrão da diferença.
\( {\sigma_{\overline{X}_1}} = \)
\( {\sigma_{\overline{X}_2}} = \)
\[\sigma_{\text{dif}} = \sqrt{{\sigma_{\overline{X}_1}}^2 + {\sigma_{\overline{X}_2}}^2 }\]
\(\sigma_{\text{dif}} = \)
Passo 5. A seguir, deve-se traduzir a diferença média amostral em unidades de erro padrão da diferença.
\( \overline{X}_1 = \)
\( \overline{X}_2 = \)
\(\sigma_{\text{dif}} = \)
\[t = \frac{\overline{X}_1 - \overline{X}_2}{\sigma_{\text{dif}}}\]
\(t = \)
Passo 6. Depois, é necessário achar o número de graus de liberdade.
\(N_1 = \)
\(N_2 = \)
\[gl = N_1 + N_2 - 2\]
\(gl = \)
Passo 7. Por fim, compara-se a razão t (calculada) com o t adequado (que consta na tabela).
Devemos fazer a consulta na tabela t de Student para encontrar o valor crítico quando há até dois grupos. As linhas da tabela indicam o grau de liberdade, e as colunas indicam o nível de significância. Nesse recurso, trabalhamos apenas com o nível de significância de 5% - por esse motivo, nossa tabela tem apenas uma coluna.
Exemplo de consulta: se o grau de liberdade é 5, o valor crítico, segundo a tabela, é 2.5706 (para um nível de significância de 5%).
\( gl = \)
\( t_0 = \)
\( t_c = \)
Passo 1. Antes de mais nada, é necessário encontrar a média de cada amostra.
\( \sum X = \)
\( N = \)
\[ \overline{X} = \frac{\sum X}{N}\]
\( \overline{X} = \)
Passo 2. Também é preciso achar o desvio-padrão de cada amostra.
\( \sum X^2 = \)
\( N = \)
\( \overline{X}^2 = \)
\[s = \sqrt{\frac{\sum X^2}{N} - {\overline{X}}^2}\]
\(s = \)
Passo 3. Em seguida, calcula-se o erro padrão da diferença.
\( N_1 = \)
\( N_2 = \)
\( {s_1} = \)
\( {s_2} = \)
\[\sigma_{\text{dif}} = \sqrt{\left(\frac{N_1 \cdot {s_1}^2 + N_2 \cdot {s_2}^2}{N_1 + N_2 - 2}\right)\left(\frac{1}{N_1} + \frac{1}{N_2}\right)}\]
\(\sigma_{\text{dif}} = \)
Passo 4. A seguir, deve-se traduzir a diferença média amostral em unidades de erro padrão da diferença.
\( \overline{X}_1 = \)
\( \overline{X}_2 = \)
\( \sigma_{\text{dif}} = \)
\[t = \frac{\overline{X}_1 - \overline{X}_2}{\sigma_{\text{dif}}}\]
\(t = \)
Passo 5. Depois, é necessário achar o número de graus de liberdade.
\( N_1 = \)
\( N_2 = \)
\[gl = N_1 + N_2 - 2\]
\(gl = \)
Passo 6. Por fim, compara-se a razão t obtida com a razão t tabelada.
Devemos fazer a consulta na tabela t de Student para encontrar o valor crítico quando há até dois grupos. As linhas da tabela indicam o grau de liberdade, e as colunas indicam o nível de significância. Nesse recurso, trabalhamos apenas com o nível de significância de 5% - por esse motivo, nossa tabela tem apenas uma coluna.
Exemplo de consulta: se o grau de liberdade é 5, o valor crítico, segundo a tabela, é 2.5706 (para um nível de significância de 5%).
\( t_{obtido} = \)
\( gl = \)
\( t_{tabelado} = \)
Passo 1. Antes de mais nada, é necessário encontrar a média de cada amostra.
\( \displaystyle\sum X = \)
\( N = \)
\[ \overline{X} = \frac{\displaystyle\sum X}{N}\]
\( \overline{X} = \)
Passo 2. A etapa seguinte é calcular a soma total de quadrados.
\( \sum X^2_{total} = \)
\( (\sum X_{total})^2 = \)
\( N_{total} = \)
\[SS_{total} = \sum X^2_{total} - \frac{(\sum X_{total})^2}{N_{total}}\]
\(SS_{total} = \)
Passo 3. Em seguida, calcula-se a soma de quadrados entre grupos.
\( (\sum X)^2 = \)
\( N = \)
\( (\sum X_{total})^2 = \)
\( N_t = \)
\[SS_e = \left[ \sum \frac{\left(\sum X\right)^2}{N}\right] - \frac{\left(\sum X_t\right)^2}{N_t}\]
\(SS_e = \)
Passo 4. A seguir, calcula-se a soma de quadrados dentro dos grupos.
\( SS_{total} = \)
\( SS_e = \)
\[SS_d = SS_{total} - SS_e\]
\(SS_d = \)
Passo 5. Depois, é necessário calcular os graus de liberdade entre grupos.
\( k = \)
\[gl_e = k-1\]
\(gl_e = \)
Passo 6. E, também, calcular os graus de liberdade dentro dos grupos.
\( N_t = \)
\( k = \)
\[gl_d = N_t - k \]
\(gl_d = \)
Passo 7. Agora, calcula-se o quadrado médio entre grupos.
\( SS_e = \)
\( gl_e = \)
\[MS_e = \frac{SS_e}{gl_e}\]
\(MS_e = \)
Passo 8. Também se calcula o quadrado médio dentro dos grupos.
\( SS_d = \)
\( gl_d = \)
\[MS_d = \frac{SS_d}{gl_d}\]
\(MS_d = \)
Passo 9. Posteriormente, calcula-se a razão F (F observado).
\( MS_e = \)
\( MS_d = \)
\[F = \frac{MS_e}{MS_d}\]
\(F = \)
Passo 10. Por fim, compara-se o F observado com o F crítico, que consta na tabela.
Devemos fazer a consulta na tabela F para encontrar o valor crítico quando há três ou mais amostras e, portanto, é necessário considerar o grau de liberdade dentro dos grupos e também o grau de liberdade entre os grupos.
As linhas da tabela indicam o grau de liberdade dentro dos grupos. As colunas, por sua vez, representam o grau de liberdade entre os grupos.
Exemplo de consulta: se o grau de liberdade dentro dos grupos é 12, e o grau de liberdade entre os grupos corresponde a 2, podemos dizer que o valor crítico equivale a 3.885.
\( f_{observado} = \)
\( gl = \)
\( f_{critico} = \)