Sunday 17 September 2017

T testes em stata forex


BREAKING DOWN T-Test Uma forma de teste de hipóteses, o teste t é apenas um dos muitos testes utilizados para esse fim. Os estatísticos devem usar testes diferentes do teste t para examinar mais variáveis, bem como para testar com tamanhos de amostra maiores. Para um grande tamanho de amostra, os estatísticos usam um teste z. Outras opções de teste incluem o teste do qui-quadrado e o teste f. Análise estatística do teste T A fórmula usada para calcular o teste é uma proporção: a parte superior da relação é a porção mais fácil de calcular e entender, pois é simplesmente a diferença entre os meios ou as médias das duas amostras. A metade inferior da relação é uma medida da dispersão, ou variabilidade, das pontuações. A parte inferior desta relação é conhecida como o erro padrão da diferença. Para calcular esta parte da relação, a variância para cada amostra é determinada e é então dividida pelo número de indivíduos que compõem a amostra ou o grupo. Estes dois valores são então adicionados, e uma raiz quadrada é tirada do resultado. Por exemplo, considere que um analista quer estudar a quantidade que os pensilvanos e os californianos gastam, por mês, na roupa. Não seria prático registrar os hábitos de gastos de cada indivíduo (ou família) em ambos os estados, assim, uma amostra de hábitos de gastos é tirada de um grupo selecionado de indivíduos de cada estado. O grupo pode ser de tamanho pequeno a moderado para este exemplo, assumir que o grupo de amostra é de 200 indivíduos. O valor médio para os habitantes da Pensilvânia é de 500, o valor médio para os californianos é de 1.000. O teste t pergunta se os diferentes grupos são representativos de uma verdadeira diferença entre as pessoas na Pensilvânia e as pessoas na Califórnia em geral ou se é provável uma diferença estatística sem sentido. Neste exemplo, se, teoricamente, todos os habitantes da Pensilvânia gastaram 500 por mês em roupas e todos os californianos gastaram 1.000 por mês em roupas, é altamente improvável que 200 indivíduos selecionados aleatoriamente gastassem exatamente esse montante, respectivo ao estado. Assim, se um analista ou estatístico produziu os resultados listados no exemplo acima, é seguro concluir que a diferença entre os grupos de amostra é indicativa de uma diferença significativa entre as populações, como um todo, de cada estado. Testes independentes usando Stata Introduction O teste t independente, também conhecido como teste t de amostras independentes, teste t de medidas independentes ou teste t não pareado, é usado para determinar se a média de uma variável dependente (por exemplo, peso, nível de ansiedade, Salário, tempo de reação, etc.) é o mesmo em dois grupos independentes independentes (por exemplo, homens versus mulheres, empregados versus desempregados, menores de 21 anos versus aqueles com 21 anos ou mais, etc.). Especificamente, você usa uma t-test independente para determinar se a diferença média entre dois grupos é estatisticamente significativamente diferente de zero. Por exemplo, um teste t independente poderia ser usado para testar se o tempo de revisão entre estudantes universitários diferia com base no gênero (ou seja, sua variável dependente seria o tempo de revisão, medido em minutos ou horas e sua variável independente seria gênero, que tem dois Grupos: masculino e feminino). Alternativamente, um teste t independente poderia ser usado para entender se há uma diferença no salário com base no nível educacional (ou seja, sua variável dependente seria salário e sua variável independente seria nível educacional, que tem dois grupos: graduação e pós-graduação ). Nota: No Stata 12, você verá que o teste t independente é referido como o teste de comparação média de dois grupos, enquanto que no Stata 13, é referido como o teste t (teste de comparação média). Neste guia, mostramos como realizar um teste t independente usando o Stata, bem como interpretar e relatar os resultados desse teste. No entanto, antes de apresentarmos este procedimento, você precisa entender os diferentes pressupostos que seus dados devem atender para que uma prova t independente ofereça um resultado válido. Nós discutimos estes pressupostos a seguir. Nota: Se sua variável independente tiver grupos relacionados, você precisará usar um teste t pareado em vez disso. Alternativamente, se você tiver mais de dois grupos não relacionados, você poderia usar uma ANOVA unidirecional. No entanto, se você tiver apenas um grupo e deseja comparar isso com um valor conhecido ou hipotetizado, você pode executar um teste t de uma amostra. Nós também temos um guia sobre como executar um teste t independente com o Minitab aqui. Pressupostos Existem seis pressupostos que sustentam o teste t independente. Se qualquer um desses seis pressupostos não for cumprido, você não pode analisar seus dados usando um teste t independente, porque você não obterá um resultado válido. Uma vez que os pressupostos 1, 2 e 3 referem-se ao design do estudo e à escolha das variáveis, eles não podem ser testados para usar o Stata. No entanto, você deve decidir se seu estudo atende a essas premissas antes de seguir em frente. Suposição 1: sua variável dependente deve ser medida no intervalo ou nível de relação (isto é, eles são contínuos). Exemplos de tais variáveis ​​dependentes incluem altura (medida em pés e polegadas), temperatura (medida em o C), salário (medido em dólares norte-americanos), tempo de revisão (medido em horas), inteligência (medido usando o escore de QI), tempo de reação ( Medido em milissegundos), desempenho do teste (medido de 0 a 100), vendas (medida em número de transações por mês), e assim por diante. Se você não tem certeza se sua variável dependente é contínua (ou seja, medido no intervalo ou nível de relação), consulte o nosso Guia de Tipos de Variáveis. Assunção 2: sua variável independente deve consistir em duas categóricas. Grupos independentes (não relacionados). Exemplos de tais variáveis ​​independentes incluem gênero (2 grupos: masculino ou feminino), tipo de tratamento (2 grupos: medicação ou sem medicação), nível educacional (2 grupos: graduação ou pós-graduação), religiosos (2 grupos: sim ou não) e Assim por diante. Assunção 3: você deve ter independência de observações. O que significa que não há relação entre as observações em cada grupo ou entre os próprios grupos. Por exemplo, deve haver diferentes participantes em cada grupo, sem participante em mais de um grupo. Se você não tem independência de observações, é provável que você tenha grupos relacionados, o que significa que você precisará usar um teste t dependente em vez do teste t independente. Felizmente, você pode verificar os pressupostos 4, 5 e 6 usando o Stata. Ao passar às premissas 4, 5 e 6, sugerimos testá-las nesta ordem porque representa uma ordem em que, se uma violação ao pressuposto não for corrigível, você não poderá mais usar uma prova t independente. Na verdade, não se surpreenda se seus dados falharem em um ou mais desses pressupostos, pois isso é bastante típico quando se trabalha com dados do mundo real, em vez de exemplos de livros didáticos, que geralmente mostram apenas como realizar uma prova t independente quando tudo vai bem. No entanto, não se preocupe, porque mesmo quando seus dados falham em certos pressupostos, muitas vezes há uma solução para superar isso (por exemplo, transformar seus dados ou usar outro teste estatístico em vez disso). Basta lembrar que, se você não verificar se seus dados atendem a essas premissas ou você as testou incorretamente, os resultados obtidos ao executar uma prova de t independentes podem não ser válidos. Assunção 4: Não deve haver valores atípicos significativos. Um outlier é simplesmente um único caso dentro do seu conjunto de dados que não segue o padrão usual (por exemplo, em um estudo de 100 alunos de pontuação do QI, onde o escore médio foi de 108 com apenas uma pequena variação entre os alunos, um aluno teve uma pontuação de 156 , O que é muito incomum, e pode até colocá-la no topo 1 dos escores de QI globalmente). O problema com outliers é que eles podem ter um efeito negativo na prova t independente, reduzindo a precisão de seus resultados. Felizmente, ao usar o Stata para executar um teste t independente em seus dados, você pode detectar facilmente possíveis valores esporádicos. Assunção 5: Sua variável dependente deve ser aproximadamente normalmente distribuída para cada categoria da variável independente. Os seus dados só precisam ser aproximadamente normais para executar um teste t independente porque é bastante robusto para violações da normalidade, o que significa que esse pressuposto pode ser um pouco violado e ainda fornecer resultados válidos. Você pode testar a normalidade usando o teste Shapiro-Wilk de normalidade, que é facilmente testado para usar o Stata. Assunção 6: precisa haver homogeneidade de variâncias. Você pode testar essa suposição em Stata usando o teste de Levenes para homogeneidade de variâncias. O teste de Levenes é muito importante quando se trata de interpretar os resultados de um guia de teste t independente porque a Stata é capaz de produzir diferentes resultados, dependendo se seus dados atendem ou falham nesta suposição. Na prática, verificar as hipóteses 4, 5 e 6 provavelmente levará a maior parte do tempo ao realizar uma prova t independente. No entanto, não é uma tarefa difícil, e a Stata fornece todas as ferramentas que você precisa para fazer isso. Na seção, Procedimento de teste em Stata. Nós ilustramos o procedimento Stata necessário para executar um teste t independente, supondo que nenhum pressuposto tenha sido violado. Em primeiro lugar, definimos o exemplo que usamos para explicar o procedimento independente de teste t em Stata. Com uma grande proporção de fumantes pesados ​​que lutam para sair, o governo quer encontrar maneiras de ajudá-los a reduzir o consumo de cigarro. Um pesquisador quer investigar se o uso de manchas de nicotina reduz o consumo de cigarro e, em caso afirmativo, por quanto. Portanto, o pesquisador recruta uma amostra aleatória de 30 fumantes pesados ​​da população, onde um fumante pesado é definido como uma pessoa que fuma uma média de 40 cigarros ou mais por dia. Esta amostra de 30 participantes foi dividida aleatoriamente em dois grupos independentes com um grupo de controle e um ndash de grupo de tratamento com 15 participantes em cada grupo. Portanto, 15 participantes receberam os remendos de nicotina (o grupo de tratamento) e 15 participantes receberam um placebo, um parto que não contém nicotina (o grupo controle). Como resultado, nenhum dos participantes sabia se eles estavam no grupo de tratamento ou no grupo de controle. Três meses após o início do experimento, o consumo de cigarro dos dois grupos foi medido em termos de número médio de cigarros fumados por dia. Portanto, a variável dependente era o consumo de cigarro (medido em termos de número de cigarros fumados diariamente no final do experimento), enquanto a variável independente era de tipo de tratamento, onde havia dois grupos independentes (grupo de tratamento e grupo controle). Foi utilizado um teste t independente para determinar se houve diferença estatisticamente significativa no consumo de cigarro entre os dois grupos independentes (isto é, o grupo de tratamento e o grupo de controle). Configuração no Stata In Stata, separamos os dois grupos para análise criando uma variável de agrupamento chamada TreatmentType. E deu ao grupo de controle que recebeu o placebo um valor de 1 - Placebo e o grupo de tratamento que recebeu os remendos de nicotina um valor de 2 - remendo de nicotina, como mostrado abaixo. Publicado com permissão por escrito da StataCorp LP. Os escores para a variável dependente, CigaretteConsumption. Foram então inseridos na planilha do Editor de Dados (Editar) na coluna à direita da variável independente, TreatmentType. Como mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Procedimento de teste em Stata Nesta seção, mostramos como analisar seus dados usando um teste t independente em Stata quando os seis pressupostos na seção anterior, Suposições. Não foram violados. Você pode realizar um teste t autônomo usando código ou interface gráfica do usuário do Statas (GUI). Depois de ter realizado sua análise, mostramos como interpretar seus resultados. Primeiro, escolha se deseja usar o código ou a interface gráfica do usuário Statas (GUI). O código para executar um teste t independente em seus dados toma o formulário: ttest DependentVariable, por (IndependentVariable) Publicado com permissão por escrito da StataCorp LP. Usando nosso exemplo onde a variável dependente é CigaretteConsumption e a variável independente é TreatmentType. O código necessário seria: ttest CigaretteConsumption, por (TreatmentType) Nota 1: Você precisa ser preciso ao inserir o código na caixa. O código diferencia maiúsculas de minúsculas. Por exemplo, se você inseriu cigaretteConsumption onde o primeiro c é minúsculo em vez de maiúscula (ou seja, um grande C), o que deveria ser, você receberá uma mensagem de erro como a seguinte: Nota 2: Se você ainda está recebendo a mensagem de erro em Nota 1: acima, vale a pena verificar o nome que você deu suas variáveis ​​dependentes e independentes no Editor de Dados quando você configura seu arquivo (ou seja, veja a tela do Editor de Dados acima). Na caixa do lado direito da tela do Editor de Dados, é a forma como você escreveu suas variáveis ​​na seção, e não a seção que você precisa para entrar no código (veja abaixo nossa variável independente). Isso pode parecer óbvio, mas é um erro que às vezes é feito, resultando no erro na Nota 1 acima. Portanto, digite o código, ttest CigaretteConsumption, por (TreatmentType). E pressione o botão ReturnEnter no seu teclado. Publicado com permissão por escrito da StataCorp LP. Você pode ver a saída da Stata que será produzida aqui. Interface gráfica de usuário (GUI) As três etapas necessárias para executar uma prova t independente no Stata 12 ndash, conhecido como um teste de comparação média de dois grupos em Stata 12 ndash, são mostrados abaixo. O mesmo procedimento requer quatro etapas no Stata 13 e isso é mostrado mais abaixo: Versão 12 No Stata 12, clique em Estatísticas gt Resumos, tabelas e testes gt Testes clássicos de hipóteses gt Teste de comparação média de dois grupos no menu superior, como mostrado abaixo. Publicado com permissão escrita da StataCorp LP. Você será apresentado com a caixa de diálogo ttest - Comparação de comparação média de dois grupos: Publicado com permissão por escrito da StataCorp LP. Selecione a variável dependente, CigaretteConsumption. Dentro da caixa suspensa Nome da variável: e a variável independente, Tipo de tratamento. No menu suspenso Grupo: drop-down, conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Versão 13 Em Stata 13, clique em Estatísticas gt Resumos, tabelas e testes gt Testes clássicos de hipóteses gt t test (teste de comparação média) no menu superior, conforme mostrado abaixo. Publicado com permissão por escrito da StataCorp LP. Você receberá a caixa de diálogo testes t (comparação média), com caixa de diálogo: Publicado com permissão por escrito da StataCorp LP. Selecione a opção Two-sample using groups na área ndasht-testsndash, conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Selecione a variável dependente, CigaretteConsumption. Dentro da caixa suspensa Nome da variável: e a variável independente, Tipo de tratamento. A partir do nome da variável de grupo: drop-down box. Você acabará com uma tela semelhante à que se segue: Publicado com permissão por escrito da StataCorp LP. Clique no botão. O resultado que a Stata produz é mostrado abaixo. Saída do teste t independente em Stata Se o seu dado passou da suposição 4 (ou seja, não houve outliers significativos), a hipótese 5 (ou seja, sua variável dependente foi distribuída aproximadamente normalmente para cada categoria da variável independente) e a suposição 6 (ou seja, houve Homogeneidade das variações), que explicamos anteriormente na seção de Suposições, você só precisará interpretar a seguinte saída do Stata para o teste t independente: Publicado com permissão por escrito da StataCorp LP. Esta saída fornece estatísticas descritivas úteis para os dois grupos que você comparou, incluindo a média e o desvio padrão, bem como os resultados reais da prova t independente. Podemos ver que o grupo significa que são significativamente diferentes, pois o valor-p na linha Pr (Tt) (sob Ha: diff 0) é inferior a 0,05 (isto é, com base em um nível de significância de 2 colas). Olhando para a coluna Média, você pode ver que as pessoas que usaram os remendos de nicotina apresentaram menor consumo de cigarro no final do experimento em comparação com aqueles que receberam o placebo. Nota: Apresentamos a saída do teste t independente acima. No entanto, uma vez que você deveria ter testado seus dados para os pressupostos que explicamos anteriormente na seção Suposições, você também precisará interpretar a saída do Stata que foi produzida quando você testou para eles. Isso inclui: (a) os pontos de caixa que você usou para verificar se houve outliers significativos (b) a saída que a Stata produz para o seu teste de normalidade de Shapiro-Wilk para determinar a normalidade e (c) a saída que a Stata produz para o teste de Levenes para a homogeneidade de Variações. Além disso, lembre-se de que, se seus dados falharam em qualquer um desses pressupostos, a saída que você obtém do procedimento de teste t independente (ou seja, a saída que discutimos acima) não será mais relevante e você precisará interpretar a saída do Stata que é Produzido quando eles falham (isto é, isso inclui resultados diferentes). Relatando a saída do teste t independente. Quando você relata a saída de sua prova t independente, é uma boa prática incluir: (a) uma introdução à análise que você realizou (b) informações sobre sua amostra, incluindo quantos Os participantes estavam em cada grupo de seus dois grupos (NB, isso é particularmente útil se o tamanho do grupo fosse desigual ou se houvesse valores faltantes) (c) a média eo desvio padrão para seus dois grupos independentes e (d) o valor t observado (T), graus de liberdade (graus de liberdade) e nível de significância, ou mais especificamente, o p-valor de 2 colas (Pr (T t)). Com base nos resultados acima, podemos relatar os resultados deste estudo da seguinte maneira: um teste t independente foi executado em uma amostra de 30 fumantes pesados ​​para determinar se houve diferenças no consumo de cigarro com base no tipo de tratamento, consistindo em um placebo ( O grupo de controle) e manchas de nicotina (o grupo de tratamento). Ambos os grupos consistiram de 15 participantes atribuídos aleatoriamente. Os resultados mostraram que os participantes que receberam manchas de nicotina tinham um consumo de cigarro estatisticamente significativamente menor (21,47 177 2,07 cigarros) no final do experimento, em comparação com os participantes com placebo (28,53 177 2,07 cigarros), t (28) 2,410, p 0,023. Além dos relatórios dos resultados acima, um diagrama pode ser usado para apresentar visualmente seus resultados. Por exemplo, você pode fazer isso usando um gráfico de barras com barras de erro (por exemplo, onde as barras de erros podem ser o desvio padrão, erro padrão ou 95 intervalos de confiança). Isso pode tornar mais fácil para os outros entender seus resultados. Além disso, cada vez mais você deve reportar os tamanhos de efeitos além dos resultados independentes do teste t. Os tamanhos de efeitos são importantes porque, enquanto a t-test independente diz se a diferença entre o meio do grupo é real (ou seja, diferente na população), não lhe diz o tamanho da diferença. Enquanto a Stata não produzirá esses tamanhos de efeito para você usando este procedimento, há um procedimento no Stata para fazê-lo.

No comments:

Post a Comment