7.1 Diferença entre médias de dois grupos
Na Seção 5.4, vimos como construir um intervalo de confiança para a média populacional




Quando temos amostras independentes de cada uma de duas populações, podemos sumarizá-las pelas suas médias, desvios padrão e tamanhos amostrais. Denote estas medidas por










Para os dados de alturas dos estudantes da página 13, vamos comparar a altura média dos estudantes do sexo masculino com as dos sexo feminino. Seja os grupo dos homens a amostra um, e o grupo das mulheres a amostra dois. As alturas foram medidas em centímetros e as medidas sumárias foram como segue:








e para nossos dados esta é





7.1.1 Erro padrão - assumindo desvios padrão iguais
Primeiramente, assumimos que os desvios padrão populacionais são os mesmos em cada grupo, i.e.



Para nossos dados temos:

então



Agora podemos calcular o erro padrão das diferenças nas médias como

a qual para nossos dados é

7.1.2 I.C. para a diferença entre médias assumindo desvios padrão iguais
Um intervalo de confiança para

onde t é escolhido apropriadamente. Quando os tamanhos amostrais são grandes um intervalo de confiança aproximado de 95% é obtido usando

Se os tamanhos amostrais não forem tão grandes então un intervalo exato de 95% de confiança deveria de ser calculado selecionando o valor de





Exemplo: Para os dados de altura, temos



Estamos 95% confiantes que, em média, estudantes do sexo masculino são entre 9cm e 21cm mais do que as estudantes do sexo feminino.
7.1.3 Teste para a diferença das médias
Um teste para a diferença entre médias corresponde a um teste de H

Nosso teste estatístico é:

que é a estimativa de

Sob a hipótese nula, este segue uma distribuição




Para os nossos dados, temos


Assumindo que nossas amostras foram amostras aleatórias de todos os estudantes, temos evidências bem fortes de a altura média dos estudantes do sexo masculino é diferente daquela das estudantes do sexo feminino.
7.1.4 I.C. para diferença de médias - desvios padrão diferentes
Uma regra prática é que os desvios padrão populacionais

Se os desvios padrão populacionais não puderem ser assumidos iguais, usamos uma outra fórmula para o erro padrão de


Note que esta abordagem é usada somente para grandes amostras.
A estaística de teste usando este SE não segue uma distribuição t sob a hipótese nula. Contudo, para tamanhos amostrais razoavelmente grandes (digamos ambos maiores do que 30), podemos comparar a estatística de teste acima com uma distribution Normal padrão (última linha da tabela

Em nosso exemplo, calculamos um erro padrão de 2.87 kg sob a suposição de igauldade de desvios padrão populacionais para ambos os grupos. A fórmula alternativa (a qual não assume desvios padrão populacionais iguais) resulta em

que praticamente não defire do valor prévio. Então o intervalo de confiança e o resultado de teste de hipótese seriam virtualmente os mesmos usando este erro padrão.
7.2 Amostras pareadas
Num estudo pareado, temos duas amostras mas cada observação da primeira amostra é pareada com uma observação da segunda amostra. Tal delineamento ocorre, por exemplo, num estudo de medidas feitas antes e depois no mesmo indivíduo ou num estudo de gêmeos (onde cada conjunto de gêmeos forma um dado pareado). Como esperado, as duas observações do mesmo indivíduo (ou de um conjunto de gêmeos) são mais prováveis de serem similares, e portanto não são considerados estatíticamente independentes.Com dados pareados, podemos usar a seguinte notação:

a então escrevemos as diferenças nas medidas de cada par como

Agora temos uma amostra de diferenças

Note que neste caso estamos interessados na diferença média enquanto que quando temos duas amostras independentes, estamos interessados na diferença nas médias. Ainda que numericamente estas quantidades são as mesmas, conceitualmente elas são diferentes.
Exemplo: A mudança nos níveis de um contaminante numa certa área do início ao final de seis meses de observação foram (em


A média e o desvio padrão são





Podemos agora realizar um test-


Note que este valor é negativo (porque a mudança média observada foi a redução na concentração do poluente -- um valor positivo seria um aumento na concentração do poluente). Observamos o valor absoluto da estatística de teste (2.73) na tabela, usando a linha com

A quinta linha da tabela mostra que

Podemos adicionar à nossa conclusão o intervalo de confiança de 95% para a redução média nos níveis do contaminante:



7.3 Comparando proporções
Voltando aos dados da página 38 acerca de um estudo investigando a existência de uma igualdade na proporção de machos de uma certa espécie em dois lagos distintos. As proporções observadas de machos foram 74.4% dentre 43 peixes capturados no primeiro lago e 60% dentre os 50 do segundo. Se construirmos intervalos de confiança para os percentuais correspondentes de machos na população (peixes da mesma espécie naqueles dois lagos), encontraríamos que podemos estar 95% confiantes de que o percentual está entre 61.4% e 87.4% no primeirop lago, e entre 46.4% e 73.6% no segundo.Contudo, nesse tipo de experimento a idéia principal é comparar diretamente os dois lagos. Portanto gostariamos de calcular um intervalo de confiança de 95% para a diferença em proporções. Note contudo que isto é somente apropriado para grandes amostras, e desse modo quando a amostra é pequena devemos ser cautelosos para não super valorizar os resultados.
7.3.1 Intervalo de confiança para a diferença em proporções
Seja


Estimativas de



então uma estimativa da diferença em proporções é

O erro padrão desta diferença é

Com isso podemos construir um intervalo de confiança da forma ususal, ou seja

Então para os nossos dados temos

Portanto um intervalo de confiança aproximado de 95% para a diferença em proporções é dado por


Note que de acordo com este intervalo o valor zero é um valor plausível para as diferenças nos percentuais, e portanto não existem evidências estatísticas de que o percentual de peixes do sexo masculino diferem nos dois lagos.
7.3.2 Teste para a diferença de duas proporções
Podemos testar a hipótese nula H




e comparando este valor com a tabela t com

7.4 Exercícios 6
- Um experimento (hipotético) sobre o efeito do álcool na habilidade perceptual motora é conduzido. 10 indivíduos são testado duas vezes, uma depois de ter tomado dois drinks e uma depois de tomado dois copos de água. Os dois testes foram realizados em dois dias diferentes para evitar influência do efeito do álcool. Metade dos indivíduos tomou a bebida alcoólica primeiro e a outra metade água. Os escores dos 10 indivíduos são mostrados abaixo. Escores mais altos refletem uma melhor performance. Deseja-se testar se a bebida alcoólica teve um efeito singificante. Use um nível de significância de 1%.
------------------------------------ indivíduo 1 2 3 4 5 6 7 8 9 10 ------------------------------------ água 16 15 11 20 19 14 13 15 14 16 álcool 13 13 12 16 16 11 10 15 9 16 ------------------------------------
- Um estudo realizado para comparação entre duas lagunas quanto à salinidade em Bimini, Bahamas, obteve as seguintes observações (em partes por mil):
-------------------- laguna 1 laguna 2 -------------------- 37.54 39.04 37.01 39.21 36.71 39.05 37.03 38.24 37.32 38.53 37.01 38.71 37.03 38.89 37.70 38.66 37.36 38.51 36.75 40.08 37.45 38.85 --------------------
O que você conclui com base nestes dados? - Deseja-se comparar os teores de Sr provenientes de amostras de carbonato obtidos a partir de dois métodos diferentes: I-fotômetro de chama; II-análise espectrográfica.
--------------------------------- Espécimes Método I Método II --------------------------------- 1 0.96 0.94 2 0.96 0.98 3 0.85 0.87 4 0.86 0.84 5 0.86 0.87 6 0.89 0.93 ---------------------------------
- As seguintes amostras aleatórias são medidas da capacidade de produção de calor (em milhões de calorias por tonelada) de especimes de carvão de duas minas:
------------------------------------ mina 1 8400 8230 8380 7860 7930 mina 2 7510 7690 7720 8070 7660 ------------------------------------
Use um teste de 0.05% de significância para testar se a diferença entre as capacidades médias de calor é significante. - Um método de semeadura de nuvens foi bem sucedido em 57 dentre 150 tentativas, enquanto outro método foi eficaz em 33 dentre 100 tentativas. Ao nível de significância de 0.05% podemos concluir que o primeiro método é melhor do o segundo?
Nenhum comentário:
Postar um comentário