SPSS Guia Prático para Pesquisadores
Estimando e Testando Hipóteses • Teoria Elementar da Amostragem• Inferência Estatística e Estimação• Distribuições amostrais e o teorema do limite central• A distribuição normal• Lei dos grandes números
3
Para pensar“O ignorante
afirma, o sábio duvida, o sensato
reflete.”
Teoria elementar da amostragemA teoria elementar da amostragem é constituída pelo estudo dos processos de analise de parte representativa de um todo com o objetivo de generalização.
Quando um pesquisador se depara com a necessidade de traçar o perfil de um conjunto de pessoas, ‘obter os valores totais dependendo do tamanho da amostra pode ser complexo’. Com isso, procura-se extrair uma amostra representativa da população, para ser analisado.
Inferência estatística e estimação• Estimar é a ação de fazer uma suposição generalizada a respeito de um todo
baseado em informação em informação logicas sobre uma amostra.• Ex.: Para calcular a media da idade de todos dos alunos da UFG, ‘isso pode
demorar, mas é possível’. Uma solução simples e rápida envolve a analise de uma amostra. (amostra é uma porcentagem da população).
• Assim, em boa parte das ocasiões, o processo estatístico inicia-se na seleção da amostra. A escolha desta deve ser absolutamente imparcial, para não haver o comprometimento do seu resultado.
• A margem de erro estabelecem e deixam claro o fato de a amostra não ser um reflexo pontual absolutamente fiel da população. Então deve se aceitar o fato de os dados permitirem conclusões possíveis ou até mesmo prováveis, mas não perfeitas.
Inferência estatística e estimação• Parâmetro é uma função conjunta de valores da população, tal como as
estatísticas media aritméticas e variância, desde que calculadas diretamente com os dados obtidos na população.
Parâmetro é uma descrição numérica de uma característica população.
• Estimativa é o valor assumido pelo parâmetro em determinada amostra.
Distribuições amostrais e o teorema do limite central• A estimativa do parâmetro populacional quase sempre é feita de forma
intervalar: um conjunto possível de valores é determinado.• Teorema do limite central: para valores grandes do tamanho da amostra, n
maior ou igual a 30, a distribuição das médias amostrais se comporta como uma distribuição normal, com média igual à média populacional e desvio padrão da variável original dividido pela raiz do tamanho da amostra.
A distribuição normal• Consiste em uma distribuição contínua de probabilidades, em que a
apresentação da distribuição de frequências f(x) de uma variável quantitativa x costuma apresentar-se em forma de sino e simétrica em relação à média.
A distribuição normal• Exemplo: supondo que a altura de indivíduos masculinos adultos seja
normalmente distribuída, com média igual a 1,70, a distribuição das frequências da variável poderia ser feita da seguinte forma:
A distribuição normal• Características:a. A curva é frequentemente descrita como curva em forma de sino ou curva
de Gauss ou de Moivre;b. Distribuição é simétrica em torna da média;c. Não chega a tocar o eixo das abscissas, variando de - a + ;d. Fica delimitada pelo seu desvio padrão e sua média.e. A área sob a curva corresponde à proporção 1 ou à percentagem 100%;f. A curva admite uma única ordenada máxima (pico), situada na média.
A distribuição normal• Para simplificar as operações com cálculos de probabilidades e dispensar a
necessidade de obtenção de integrais definidas, geralmente optamos pelo uso de tabelas. No lugar de trabalhar com médias e desvios padrões distintos, o uso de tabelas requer o cálculo de uma variável padronizada Z.
• • A variável padronizada Z apresenta o afastamento em desvios padrões de um
valor da variável original em relação à média. • Ex.:
Distribuição normal padronizada para valores entre a média e Z.
Usando a distribuição normal para identificar valores extremos (outliers) no SPSS.• Analisar > Estatísticas descritivas > Descritivos
Lei dos grandes números • Lei dos grandes números
estabelece que, com o aumento do tamanha da amostra, a distribuição de frequências relativas da amostra se aproxima da distribuição de frequências da população. À medida que o tamanho da amostra se aproxima da distribuição amostra converge para a média populacional.
Estimação ou inferência da média de uma população• De modo geral, para poder estimar a média populacional a partir de um
conjunto de dados amostrais, deve-se aplicar o fluxograma:
Aplicando Testes Paramétricos de Hipóteses
Alegações sobre parâmetros populacionais versus estimativas amostrais• O teste de hipóteses tem por objetivo verificar a veracidade de determinada
suposição dentro do âmbito amostral para ser aceita dentro do âmbito populacional.
• Testes de hipóteses confrontam estimativas amostrais com parâmetros populacionais.
• Teste de hipótese inicia com a análise da situação e da alegação estabelecida. Posteriormente, formula-se duas hipóteses de trabalho, apresentadas como hipóteses nula ou H˳, e a hipótese alternativa ou H₁.
• Na hipótese nula, supõe-se que a alegação de igualdade seja aceita como verdadeira para a população. Já a hipótese alternativa, oferece uma negação para a hipótese nula.
• Ex.:
Os procedimentos algébricos para os testes de hipóteses sem o SPSS• Passo 1.: formulação da hipótese nula (H˳) e da hipótese alternativa (H₁).• Passo 2.: escolher a distribuição amostral adequada. Os procedimentos
empregados são similares aos utilizados na estimação de intervalos de confiança.
• Passo 3.: devem-se estabelecer o nível de significância e o nível de confiança, marca-los no gráfico da distribuição determinada no passo anterior e calcular os valores críticos. O nível de confiança expressa o percentual da probabilidade de acerto da conclusão (95%). O nível de significância expressa o erro possível de ser cometido (5%)
Os procedimentos algébricos para os testes de hipóteses sem o SPSS• Passo 4.: consiste no cálculo da estatística teste e na comparação dessa
resposta com as áreas particionadas e os seus valores críticos.*Se desvio padrão da população for conhecido:
*Se o desvio padrão populacional for desconhecido:
• Passo 5.: a depender do resultado da estatística teste e de sua posição no gráfico particionado anteriormente no passo 3, aceita-se ou não a hipótese nula.
Testes de hipóteses no SPSS• Quando testes de hipóteses são feitos no SPSS, é importante destacar a
importância da análise dos relatórios de saída, geralmente centrada na observação do nível de significância dos resultados.
Se.: Sig. Maior ou igual a 0.05: aceito a hipótese nula.
Se.: Sig. Menor que 0.05: aceito a hipótese alternativa.
•
Teste de uma amostra para médias• O teste de uma amostra para médias é característico de situações em que se
procura testar alguma afirmação sobre o parâmetro média da população. • Posteriormente, a alegação é confrontada com dados de uma amostra
extraída da população.• Para a amostra, calculam-se a média e o desvio padrão. Com esses dados,
podem-se comparar a média amostral e o erro inferencial tolerável com a média alegada. Busca-se saber se a alegação sobre a população é aceitável ou não.
Teste de uma amostra para médias• Exemplo: Uma grande revista de negócios brasileira afirmou que o
faturamento médio das indústrias de determinada região do sul do país seria igual a $ 820.000,00. Sabe-se que o desvio padrão do faturamento de todas as empresas da região é igual a $ 120.000,00.
Um pesquisador independente analisou os dados de uma amostra formada por 19 empresas, encontrando um faturamento médio igual a $ 780.000,00. Assumindo nível de significância igual a 8%, seria possível seguir os cinco passos...
Teste de uma amostra para médias no SPSS• Analisar > Comparar médias > Teste T de uma amostra
Exercícios• 1- Carregar baseados filmes_infantis usando – analisar> estatísticas descritivas> explorar,
calcule o que se pede a seguir:a) Qual a duração média dos filmes em minutos?b) Qual o desvio padrão da duração dos filmes em minutos?c) Qual o número de elementos nessa amostra?d) Considerando o intervalo de confiança de 95% calcule algebricamente o intervalo de
confiança para a média populacional da duração para isso use uma tabela com distribuição normal padronizada compare seu cálculo com valor no spss O que é possível constatar?
e) E se o nível de significância fosse igual a 10% qual seria o intervalo de confiança angelicalmente usando média e desvio padrão calculados pelo spss?
f) Um expert em cinema afirmou categoricamente que o universo apresentavam uma duração média exatamente igual a 80 minutos. Apresente as hipóteses nula e alternativa em quê permitiria testar esta ligação.
Exercícios2 . Carregar base dados filmes.sav. Usando o menu Analisar> Estatísticas descritivas> Explorar, calcule o que pede a seguir.a) Considerando o intervalo de confiança de 95% calcule o intervalo de
confiança para a média populacional do faturamento. b) Se nível de significância fosse igual a 3% qual seria o intervalo de confiança
calcule com apoio do spss.c) Padronize a variável faturamento do filme usando o menu Analisar>
estatísticas descritivas >descritivos .O que o valor padronizado representa assumindo um nível de confiança de 95%, quais seriam os valores limites para Z e quais seriam os outliers encontrados.