Teste T (definição, tipos) - Exemplos de cálculo passo a passo

O que é o T-Test?

Um T-Test é um método usado para derivar uma inferência em estatísticas, que visa descobrir se existe alguma diferença significativa entre duas médias em que os dois grupos considerados podem estar relacionados entre si.

Explicação

  • Destina-se ao teste de hipóteses, que basicamente serve para testar uma hipótese pertencente a uma dada população. Um T-Test considera a estatística T, os valores da distribuição T e os graus de liberdade, que são usados ​​para determinar a probabilidade de diferença entre dois conjuntos de dados.
  • O trabalho básico por trás do T-Test é que ele considera uma amostra de cada um dos dois conjuntos e constrói uma declaração de problema considerando uma hipótese nula onde ambas as médias são declaradas iguais.
  • Com base em fórmulas equacionadas, os valores são desenhados e comparados com os valores padrão, o que leva à aceitação ou rejeição da hipótese nula. A rejeição da hipótese nula indica que o conjunto de dados é bastante preciso e não por acaso.

Tipos de Teste T

Existem basicamente quatro tipos de teste t, que são os seguintes:

# 1 - Teste T de 1 amostra

Destina-se a testar se a média do valor que alguém almejou é igual à média de uma única população, por exemplo, Testando se o peso médio dos alunos da Classe 5 é maior que 45 kg

# 2 - Teste T de 2 amostras

O objetivo é testar se a média do valor que alguém almejou é igual à média de duas populações independentes, por exemplo, Testando se o peso médio dos alunos da turma 5 é diferente do peso das alunas da turma 5.

# 3 - Teste T emparelhado

Destina-se a testar se a média do valor pretendido é igual à média das diferenças entre as observações que são dependentes. por exemplo, comparar as notas dos alunos antes e depois das aulas para cada disciplina nos ajuda a identificar se as notas são significativas o suficiente para melhorar as notas dos alunos.

# 4 - Teste T na Saída de Regressão

Ele leva em consideração o coeficiente na equação de regressão e testa em que grau ele difere do valor zero. por exemplo, se a pontuação no exame de admissão é um fator significativo para determinar se um aluno obterá uma boa pontuação final.

Suposições do T-Test

  • A primeira suposição para um teste t está relacionada à escala de medição. Isso está relacionado ao fato de a escala seguir uma escala contínua ou ordinal
  • A segunda suposição pode ser relativa à natureza aleatória da amostra. Isso significa que os dados coletados devem ser de natureza puramente aleatória.
  • A terceira suposição pode ser que, quando plotamos os dados relacionados à distribuição do teste t, eles devem seguir uma distribuição normal e gerar um gráfico com curva em sino.
  • A quarta suposição pode ser que, para a distribuição t e, especificamente, para obter uma forma da curva em sino, precisamos ter um tamanho de amostra maior.
  • A suposição final pode ser aquela para o teste t. A variação deve ser de natureza homogênea. e. os desvios padrão são quase iguais.

Como calcular?

Funciona em dois cenários diferentes, ou seja, um para a amostra independente e outro para a amostra dependente.

# 1 - Cenário de amostra independente

  • Precisamos calcular a soma, o tamanho da amostra, que é determinado por “N”, e o valor da pontuação da média de cada uma das amostras independentes. Depois disso, o grau de liberdade precisa ser calculado para cada amostra independente.
  • Isso é representado subtraindo a amostra por um, que denotamos como “n-1”. Depois disso, a variância e o desvio padrão precisam ser calculados.
  • Os graus de liberdade das amostras são adicionados, e isso é denominado como "df-total". A seguir, precisamos multiplicar o grau de liberdade de cada amostra pela variância de cada uma. Precisamos adicionar os resultantes e, em seguida, dividir o total por “df-total”. O resultado obtido é chamado de variância combinada.
  • A variância combinada é então dividida pelo n das amostras. O resultado obtido para todas as amostras é então adicionado. A raiz quadrada disso é obtida e isso é denominado como o erro padrão da diferença.
  • Por último, precisamos subtrair a média inferior da amostra da média superior da amostra. A diferença obtida é então dividida pelo erro padrão da diferença, e os resultados obtidos são chamados de valor-T.

# 2 - Cenário de amostra dependente

  • As pontuações obtidas de cada um dos pares do conjunto de dados são anotadas e precisamos subtraí-las. As diferenças obtidas são adicionadas e denominadas como “D”. As diferenças de cada amostra são quadradas e adicionadas para obter uma resultante chamada “D-Quadrada”. Depois disso, precisamos multiplicar o “N” ou número de pontuações emparelhadas com o “D ao quadrado”.
  • A resultante obtida é subtraída do quadrado do “D” total Este resultado é dividido posteriormente com “N-1”. A raiz quadrada da resultante é obtida e é denominada divisor. Por último, precisamos dividir o “D” total pelo divisor, que nos dá o valor t final.

Exemplos de teste T

Consideremos que temos notas para cada disciplina no exame realizado em dois períodos.

Etapa 1: Subtrair a Fase 1 da Fase 2

Etapa 2: some toda a diferença, ou seja, -55

Etapa 3: acertar as diferenças

Etapa 4: some todos os quadrados de diferença, ou seja, 983

Etapa 5: Uso da fórmula para calcular o valor T

T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N
  • = -9,16 / √ (983 - (- 55) 2 /6)) / (1/6) * 6
  • = -9,16 / √15,96
  • = -9,16 / 3,99
  • Valor T = -2,29

O valor T obtido é então comparado com o valor T obtido na tabela usando o valor p e o grau de liberdade. Se o valor t calculado for maior que o valor da tabela em um nível alfa predefinido específico, podemos rejeitar a hipótese nula dizendo que há uma diferença entre as médias.

Quando é usado?

Isso é usado para comparar duas médias ou proporções. Além disso, usamos um teste t quando os parâmetros da população são desconhecidos para o usuário. Existem basicamente três casos de uso de cenário de teste t, que são os seguintes:

  • Um teste t de amostra independente é usado quando queremos comparar a média de dois grupos.
  • Um teste t de amostra emparelhada é usado quando queremos comparar a média do mesmo grupo, mas em diferentes pontos do tempo.
  • Um teste t de amostra é usado quando precisamos verificar a média de um grupo individual em relação a uma média desconhecida.

Uso do T-Test no Excel

  • No Excel, a primeira coisa de que precisamos é a instalação de um add-in chamado Data Analysis. Depois disso, precisamos ir em “Dados” na guia do menu e clicar nele. A opção “Análise de dados” estará visível lá.
  • Para conduzir um teste T, precisamos ter nossos dados em formato colunar. Ao clicar em “Análise de dados”, obteremos uma série de testes estatísticos que podemos realizar e, a partir da lista, precisamos escolher um teste t e clicar em “Ok”.
  • Uma caixa de diálogo é exibida, onde precisamos inserir os dados da trilha 1 na caixa de intervalo de variável 1 e também os dados de teste 2 nas caixas de intervalo de variável 2. Por padrão, o valor de alfa permanece em 0,05, mas isso pode ser alterado com base em nossa preferência. Quando tudo estiver bem, clique em “OK”.
  • Agora podemos ver o resultado do nosso T-Test na planilha do Excel. O valor mais importante a ser observado aqui é o valor P. Com base no que selecionamos nosso valor alfa, se nosso valor P no Excel for menor que o valor alfa, podemos concluir que há uma diferença de material estatístico entre as médias de nossos dois conjuntos de valores.

Conclusão

O T-Test destina-se ao teste de hipóteses, que basicamente serve para testar uma hipótese pertencente a uma determinada população. Diz-nos o nível de significância da diferença entre os grupos, que geralmente são medidos com base na média. Aqui, basicamente descobrimos a diferença entre as médias populacionais e um valor hipotético.

Artigos interessantes...