BIOESTATÍSTICA
ESTATÍSTICA.... Num sentido mais lato, Estatística é a ciência
que se ocupa da coleta e tratamento de informação. Tem como objetivo analisar os dados coletados, descrevendo-os e organizando-os para posterior interpretação e eventual utilização na previsão de acontecimentos futuros.
O QUE É “BIOESTATÍSTICA”?
Aplicação dos métodos estatísticos para a solução de problemas biológicos e de saúde
OBJETIVOS
Redução dos Dados poucas variáveis
Verificação da importância dessas variáveis
O estudo da estatística explora:
o planejamento e a coleta;
a organização;
a análise e a interpretação dos dados.
No planejamento, ela auxilia: na escolha das situações experimentais; na determinação da quantidade de indivíduos a serem examinados.
Na análise dos dados indica técnicas pararesumir apresentar as informaçõescomparar as situações experimentais.
CLASSIFICAÇÃO
Estatística Descritiva: Técnicas para organizar e resumir os dados: (i) tabelas (ii) Gráficos
Inferência estatística:Técnicas para se tirar conclusões a partir dos dados amostrados “generalizando” para a população, e tomando assim certas decisões.
FONTES DA VARIAÇÃO Biológicas Condições de medição Método de aferição Erros de aferição
Etapas de uma pesquisa
• Planejamento da pesquisa• Coleta dos dados• Descrição dos dados• Resumo e apresentação dos dados• Análise dos dados• Interpretação dos resultados tomada de decisões ou descobertas de novos conhecimentos
CONCEITOS BÁSICOS
Dados : conjunto de valores de uma ou mais variáveis registrada em um ou mais unidade observacional
Fontes dos dados 1. Registros rotineiramente coletados2. Censo, entrevistas3. Experimentos4. Publicações5. Bancos de dados (internet)
População: um conjunto de indivíduos, objetos ou eventos o qual se tem um interesse num tempo particular.
Amostra: um sub-conjunto da população, selecionada de tal modo que seja representativa da população
Parâmetro: uma constante verdadeira que caracteriza a natureza da população na variável em estudo.
Estimativa: um valor calculado a partir de uma amostra, logo está sujeita a erros.
• condição ou característica estudada em cada unidade da pesquisa;
• assume valores diferentes em cada unidade;
• deve ser registrada;
O que é O que é variávelvariável ??
TIPOS DE VARIÁVEL
1. Qualitativa
Expressam qualidade, são divididas em categorias. Não são mensuráveis, são apenas contáveis. São expressas em percentual.
São classificadas em: • Nominal (Classificatória) - gênero, Estado civil, raça
• Ordinal (Escala natural) - Gravidade de uma doença.
TIPOS DE VARIÁVEL
14
2. Quantitativa Expressam quantidade, são mensuráveis
São classificadas em:
• Discreta - valores inteiros - nº de filhos, nº de hemácias
• Contínua – medidos em escala contínua - pressão sangüínea, peso, altura, idade
Categorizada ou nominal
Ordinal
Numérica
Tipos de variáveis:
Variável categorizada (qualitativa): expressa por palavras.
O A B AB
Variável ordinal:expressa por números (ou
palavras) que indicam ordem. ModeradoModerado
NenhumNenhum
LeveLeve
SeveroSevero
Variável numérica (quantitativa): é expressa por números.
Tabela 1- Distribuição do trabalhador rural segundo a ocupação. MG, 1991 a 2000.
Fonte: DADOS hipotéticos.
Ocupação Técnico Aplicador Serviço GeralTotal
Frequência %
GRÁFICOS
TIPOS DE GRÁFICOSLinhas ou série histórica Barras
GRÁFICOSDispersão Setorial
GRÁFICOSHistograma
• Amplitude (máximo, mínimo)
• Variância• Desvio padrão• Erro padrão
Medidas de posição (tendência central)Medidas de posição (tendência central)• Média• Mediana• Moda
Medidas de variabilidade Medidas de variabilidade (dispersão)(dispersão)
nxx
Média é a soma de todos os dados, dividida pelo número
deles.
Exemplo
São dados os pesos de cinco
pessoas: 50, 65, 76, 70, 70.
Como se calcula a média ?
nxx
x50
65
76
70
70 x =331 A média é
66,2kg.
n = 5
Mediana Mediana tambémtambém é é
medida de tendência central.medida de tendência central.
Para obter a mediana:
1. organize os dados em ordem crescente;
2. tome o valor central.
Em fila!
Se o número de dados é ímpar,
mediana é o valor que ocupa o centro da série ordenada.
7, 9, 0, 2, 2, 5, 0 0, 0, 2, 2, 5, 7, 9
Mediana
Se o número de dados é Se o número de dados é par,par,
7, 9, 0, 2, 2, 5 0, 2, 2, 5, 7, 9
Mediana = 3,5
mediana é a média dos dois valores que ocupam o centro da série ordenada.
ModaModatambémtambém é é
medida de tendência central.medida de tendência central.
Moda é o valor que mais se repete.
A moda é azul...
Medidas de variabilidade
Mínimo e máximo
Variância
Desvio padrão
Erro padrão
Coeficiente de variação
Mínimo e máximo são medidas de variabilidade.
Ache mínimo e máximo de
A diferença (5 – 1 = 4) é a amplitude.
1 2 3 4 5
Conjuntos de dados podem ter a mesma média,
mas variabilidades diferentes.
Três conjuntos de dados
Conjunto Valores A 1 2 3 4 5 B 3 3 3 3 3 C 2 4 3 2 4
Média
Três conjuntos de dados
Conjunto Valores A 1 2 3 4 5 B 3 3 3 3 3 C 2 4 3 2 4
Mínimo
Máximo
Amplitude
Variabilidade em torno da média
Como se mede a variabilidade?
Desvio em relação à média
Desvio positivo
Média
Desvio negativo
Desvio em relação à média
É a diferença entre cada valor e a médiada amostra.
Indica-se por xx
Desvio em relação à média
Dados:
3, 7, 5, 9, 1.
Qual é o desvio de 7 em relação à média?
Exemplo
Desvios em relação à média
A soma dos desviosA soma dos desvios em relação à média em relação à média
é sempre zeroé sempre zero..
x3 -27 25 09 41 -4
0
xx
5x
Como a soma dos desviosComo a soma dos desvios em relação à média em relação à média
é sempre zero,é sempre zero,não se pode calcularnão se pode calculara média dos desviosa média dos desvios..
Variância da amostra
é a soma dos desvios elevados ao quadrado, dividida por n -1.
n –1 graus de liberdade
1)( 2
2
n
xxs
Dados 3, 7, 5, 9, 1,
qual é a variância ?
Variância da amostra
x x - x (x – x )2
3 -2 47 2 45 0 09 4 161 -4 16
0 40
104402 s
Variância da amostra
Uma dificuldade da variância
A unidade de medida da variância é igual ao
quadrado da unidade de medida dos dados.
Desvio padrão
é a raiz quadrada da variância, com sinal positivo.
Dados 3, 7, 5, 9, 1,
qual é o desvio padrão?
Desvio padrão
104
402 s
é a raiz quadrada da variância, com sinal positivo.
16,310 s
Para que serve o desvio padrão?
Desvio padrão
Mede variabilidade em torno da média, com a mesma unidade de medida dos dados.
MARTINEZ, Maria Carmen; PARAGUAY, Ana Isabel Bruzzi Bezerra; LATORRE, Maria do Rosário Dias de Oliveira. Relação entre satisfação com aspectos psicossociais e saúde dos trabalhadores. Rev. Saúde Pública, São Paulo, v. 38, n. 1, Feb. 2004
IntervaloIntervalo
sx Não é a melhor maneira
de construir um intervalo, mas é a
maneira mais conhecida.
Erro padrão
nssEP x
Mede a precisão da estimativa da média ( ) em relação média populacional (μ)
x
EPx 96,195% IC
CORRELAÇÃO DE PEARSONCORRELAÇÃO DE PEARSON
Testa a correlação de variáveis quantitativas. Testa a correlação de variáveis quantitativas.
n de ordem dias de exposição Idade1 20 252 21 323 13 424 14 325 15 426 15 357 15 218 20 259 4 32
10 3 2511 2 4212 2 2813 10 4214 10 3515 15 4516 15 26
CORRELAÇÃO DE PEARSON r = CORRELAÇÃO DE PEARSON r = -0,13578
r de Pearson – variáveis quantitativasr de Spearman – variáveis qualitativas
-1<r<0-1<r<0
0<r<10<r<1
r<=0r<=0