serie tecnica glossario termos estatistica

Upload: jmarcellopereira

Post on 08-Jan-2016

218 views

Category:

Documents


0 download

DESCRIPTION

.

TRANSCRIPT

  • 1

    Publicado on line em www.animal.unb.br em 03/11/2010

    Glossrio de Termos EstatsticosGlossrio de Termos EstatsticosGlossrio de Termos EstatsticosGlossrio de Termos Estatsticos

    Concepta McManus 1,2, Luiza Seixas 1, Cristiano Barros de Melo 1,3

    1 CNPq / INCT / Informao Gentico Sanitria da Pecuria Brasileira, Universidade de Braslia (UnB) /

    Universidade Federal de Minas Gerais (UFMG), Belo Horizonte, MG. 2 Universidade Federal do Rio Grande do Sul (UFRGS), Porto Alegre, RS.

    3 Universidade Braslia (UnB), Braslia, DF.

    Estatstica

    Expresso em Latim statisticum collegium, algum que palestra

    sobre os assuntos do Estado ou conselho de Estado;

    surgiu a palavra em lngua italiana statista;

    significa "homem de estado", estadista ou poltico;

    Palavra alem Statistik;

    o A anlise de dados sobre o Estado;

    o significando a "cincia do Estado"

    o Palavra foi proposta pela primeira vez no sculo XVII, em

    latim, por Schmeitzel na Universidade de Lena e adotada pelo

    acadmico alemo Godofredo Achenwall;

    Aparece como vocabulrio na Enciclopdia Britnica em 1797;

    Adquiriu um significado de coleta e classificao de dados, no incio

    do sculo 19.

    INCT: Informao Gentico-Sanitria da

    Pecuria Brasileira

    SRIE TCNICA:

    GENTICA

  • 2

    (1 - alfa) Nvel de confiana: a probabilidade de que o Intervalo de Confiana contenha o verdadeiro valor do parmetro.

    (alfa): a probabilidade de Rejeitar Ho, quando ela verdadeira. Neste caso, seria a probabilidade de afirmar que as atitudes em relao Matemtica interferem na formao das atitudes em relao Estatstica, quando na realidade no existe nenhuma relao. Este erro controlado pelo pesquisador, e ele que define a margem de erro que est disposto a correr. Existem vrios fatores que influenciam na escolha do nvel de significncia. Em pesquisas, como nas cincias exatas, biolgicas, agronmicas, onde as variveis so mais fceis de mensurar, onde os instrumentos de medida so confiveis, onde o controle de fatores intervenientes razovel, o conhecimento da rea maior, a gravidade das conseqncias do erro menor, entre outros, permitem um maior rigor e, portanto, pode-se ser mais exigente, diminuindo o nvel de significncia. Contudo, em pesquisas, nas cincias humanas, que lida com pessoas, com construtos polmicos, instrumentos ainda no testados, as consequncias do erro no so to graves, entre outros, pode-se ser mais flexvel. Via de regra, usa-se o nvel de 5%.

    Alfa (alpha): a probabilidade de se cometer Erro do Tipo I (rejeitar a hiptese nula quando ela verdadeira) no teste de hipteses.

    Algoritmo(algorithm): Um algoritmo um conjunto definido de operaes e passos ou procedimentos que objetivam levar a um particular resultado. Por exemplo, com algumas excees, os programas computacionais, as frmulas matemticas e (de forma ideal) receitas mdicas e culinrias so algoritmos.

    Amostra: Uma amostra um subconjunto de indivduos da populao alvo. Existem dois tipos de amostras, as probabilsticas, baseadas nas leis de probabilidades, e as amostras no inferncia estatstica. n - tamanho da amostra probabilsticas, que tentam reproduzir o mais fielmente possvel a populao alvo. Entretanto, somente as amostras probabilsticas podem, por definio, originar uma generalizao estatstica, apoiada no clculo de probabilidades.

    Amostra (sample): Uma parte finita e no vazia extrada de uma populao.

    Amostra Amodal: uma amostra que no tem moda.

    Amostra Bimodal: uma amostra que tem duas modas.

    Amostra Imparcial: uma amostra em que todos os elementos

  • 3

    tiveram uma igual oportunidade de fazer parte da mesma.

    Amostra Multimodal: uma amostra que tem mais do que duas modas.

    Amostra Representativa: aquela que deve conter em proporo todas as caractersticas qualitativas e quantitativas da populao.

    Amostra: envolve premissas que dizem respeito s caractersticas do evento estudado, dos fatores que exeram influncia sobre este evento e da anlise que se pretenda fazer. Portanto, antes de definir o tamanho da amostra, o pesquisador dever ocupar-se das definies de um planejamento amostral, cujas caractersticas sero particulares para cada estudo. Em geral, o planejamento do tamanho da amostra leva em considerao os erros do Tipo I e do Tipo II, de forma que as estimativas de interesse tenham preciso suficiente para serem utilizadas. Portanto, para dimensionar a amostra o pesquisador deve fornecer o nvel de significncia e o poder do teste desejado

    Amostragem (sampling): o mtodo de retirada de amostras de uma populao.

    Amostragem Aleatria (random sample): A amostragem dita aleatria, probabilstica ou ao acaso se todos os elementos da populao tiveram probabilidade conhecida e diferente de zero de pertencerem a amostra.

    Amostragem Aleatria Simples: aquela em que qualquer elemento da populao tem a mesma probabilidade de ser escolhido.

    Amostragem aleatria simples (simple random sampling): A amostragem dita aleatria simples se todos os elementos da populao possurem a mesma probabilidade de pertencerem a amostra.

    Amostragem Estratificada: aquela em que a populao est dividida em estratos ou grupos diferenciados.

    Amostragem estratificada (stratified sampling): Mtodo de amostragem na qual os elementos so retirados de subpopulaes agrupadas por algum critrio.

    Amostragem por conglomerados (cluster sampling): Mtodo de amostragem onde o que sorteado o aglomerado e no a unidade individual.

    Amostragem Sistemtica: aquela em que os elementos so

  • 4

    escolhidos a partir de uma regra previamente estabelecida.

    Amostragem sistemtica (systematic sampling): Mtodo de amostragem na qual o primeiro elemento de uma lista da populao selecionado ao acaso e aps cada k-simo elemento selecionado.

    Amostragem: um campo da estatstica que estuda tcnicas de planejamento de pesquisa para possibilitar inferncias sobre um universo a partir do estudo de uma pequena parte de seus componentes, uma amostra.

    Amplitude (range): a diferena entre os extremos de um conjunto, isto , a distncia entre o mximo e o mnimo do conjunto.

    Amplitude de um Conjunto de Dados: a diferena entre o maior valor e o menor valor desse conjunto. Se os dados estiverem agrupados em classes, a amplitude a diferena entre o limite superior da ltima classe e o limite inferior da primeira.

    Anlise de componentes principais (principal component analysis): Transformar um conjunto de variveis originais, intercorrelacionadas, num novo conjunto de variveis no correlacionadas, as componentes principais. O objetivo mais imediato da ACP verificar se existe um pequeno nmero das primeiras componentes principais que seja responsvel por explicar uma proporo elevada da variao total associada ao conjunto original

    Anlise de conglomerados (cluster analysis): O propsito da Anlise de Cluster buscar uma classificao de acordo com as relaes naturais que a amostra apresenta, formando grupos de objetos (individuos, empresas, cidades ou outra unidade experimental) por similaridade

    Anlise de sobrevivncia (survival analysis): o estudo de indivduos (itens observados) onde um evento bem definido (falha) ocorre depois de algum tempo (tempo de falha).

    Anlise discriminante (discriminant analysis): encontrar a melhor funo discriminante linear de um conjunto de variveis que reproduza, tanto quanto possvel, um agrupamento a priori de casos considerados

    Anlise multivariada (multivariate analysis): Trata-se de um conjunto de mtodos que permite a anlise simultnea de medidas mltiplas para cada indivduo ou objecto em anlise, ou seja, qualquer mtodo que permita a anlise simultnea de duas ou mais

  • 5

    variveis pode ser considerado como multivariado.

    Anlise Probit (probit analysis): Em teoria de probabilidade e estatstica, probit a funo inverso funo de distribuio cumulativa (CDF), ou funo do quantile associado com o padro distribuio normal. Tem aplicaes dentro grficos estatsticos exploratrios e especializado modelar da regresso de variveis binrias da resposta.

    ANDEVA (Analise de varincia): tcnica estatstica cujo objetivo testar a igualdade entre trs ou mais mdias. Ela permite testar se a variabilidade dentro dos grupos maior que a existente entre os grupos. A tcnica supe independncia e normalidade das observaes, e igualdade entre as varincias dos grupos.

    ANOVA (Analysis of Variance): Teste de hiptese que objetiva comparar mais de duas mdias. isto mesmo, a anlise de varincia um teste para comparar mdias, que realizado atravs das varincias dentro e entre os conjuntos envolvidos. uma extenso do teste "t" para duas mdias.

    ANOVA: ver Andeva

    Assimetria (skeweness): Se um conjunto de dados for dividido em duas partes a partir da mediana e estas duas partes no forem iguais, ento ele dito assimtrico. Outra maneira de verificar se um conjunto assimtrico calcular o seu coeficiente de assimetria ou o momento de terceira ordem. Se ele for diferente de zero ento o conjunto dito assimtrico.

    Atpico (outlier): um valor de um conjunto de dados que se afasta dos demais. um valor normalmente muito grande ou muito pequeno quando comparado com o restante do conjunto. Pode ter sido resultado de um erro de medida ou, ento, pode ser um indicativo de um comportamento atpico do conjunto sob determinadas condies.

    Atributo (attribute): uma denominao alternativa para os possveis valores assumidos por uma varivel qualitativa.

    Atributos Qualitativos: so atributos que esto relacionados com uma qualidade e apresentam-se com vrias modalidades.

    Atributos Quantitativos: so atributos aos quais possvel atribuir uma medida e apresentam-se com diferentes intensidades ou valores.

    Autocorrelao (autocorrelation): uma medida que informa o

  • 6

    quanto o valor de uma realizao de uma varivel aleatria capaz de influenciar seus vizinhos

    Bootstrapping: um mtodo de reamostragem onde se utiliza para aproximar distribuio na amostra de um levantamento estatstico. Se usa frequentemente para aproximar o vis ou a varincia de um conjunto de dados estatsticos, assim como para construir intervalos de confiana ou realizar contrastes de hipteses sobre parmetros de interesse. Na maior parte dos casos no pode obter-se expresses fechadas para as aproximaes bootstrap e portanto necessrio obter reamostragens em um ordenador para por em prtica o mtodo. A enorme capacidade de clculo dos computadores atuais facilita consideravelmente a aplicabilidade deste mtodo to custoso computacionalmente

    Censo: um estudo estatstico que resulta da observao de todos os indivduos da populao relativamente a diferentes atributos pr-definidos.

    Classe Mediana ( ): a classe, para dados classificados, que contem a Mediana (neste caso considera-se como Mediana o valor da varivel estatstica que corresponde a n/2, quer n seja par, quer n seja mpar).

    Classe Modal: a classe, para dados classificados, que aparece com maior frequncia.

    Coeficiente angular ou inclinao (da reta de regresso: Y = a + b * X): a variao de Y por cada variao de X.

    Coeficiente de confiana: corresponde a 1- (probabilidade de aceitar a hiptese nula quando esta verdadeira) e indica a probabilidade de deciso correta baseada na hiptese nula.

    Coeficiente de correlao de Pearson (Pearson correlation coeficient): uma medida do grau de relao linear entre duas variveis quantitativas. Este coeficiente varia entre os valores -1 e 1. O valor 0 (zero) significa que no h relao linear, o valor 1 indica uma relao linear perfeita e o valor -1 tambm indica uma relao linear perfeita mas inversa, ou seja quando uma das variveis aumenta a outra diminui. Quanto mais prximo estiver de 1 ou -1, mais forte a associao linear entre as duas variveis

    Coeficiente de correlao de Spearman (Spearman rho correlation coeficient): O coeficiente de Spearman mede a intensidade da relao entre variveis ordinais. Usa, em vez do valor observado, apenas a ordem das observaes.

  • 7

    Deste modo, este coeficiente no sensvel a assimetrias na distribuio, nem presena de outliers, no exigindo portanto que os dados provenham de duas populaes normais

    Coeficiente de Correlao Linear ( r ): medida estatstica que permite calcular o valor numrico correspondente ao grau de dependncia entre duas variveis, o qual varia entre -1 e 1.

    Coeficiente de correlao parcial (partial correlation coeficient): O coeficiente de correlao parcial( rAB.C) permite conhecer o valor da correlao entre duas variables A e B, se a variable C tinha permanecido constante para a srie de observaes consideradas. O rAB.C o coeficiente de correlao total entre as variables A e B quando se lhes retirou sua melhor explicao lineal em termo de C. Coeficiente de determinao (coefficient of determination): indica quanto da varincia da varivel resposta explicada pela varincia das variveis explicativas. Seu valor est no intervalo de 0 a 1: Quanto maior, mais explicativo o modelo

    Coeficiente de determinao (R2): o quadrado do coeficiente de correlao de Pearson e expresso em porcentagem. o percentual explicado da variao da varivel dependente pela reta de regresso (modelo). O restante explicado pelo erro, que pode ser devido a ausncia de outras variveis, erros de mensurao das variveis e ao erro aleatrio.

    Coeficiente de variao (coefficient of variation): o quociente entre o desvio padro e a mdia de um conjunto de dados. um percentual e portanto adequado para efetuar comparaes entre diferentes conjuntos de dados.

    Coeficiente gama (gamma coeficient).

    Consistncia (consistency): Propriedade que descreve o comportamento de um estimador quando o tamanho da amostra tende ao infinito.

    Correlao: a relao ou dependncia entre as duas variveis de uma distribuio bidimensional.

    Correlao (correlation): Um termo geral utilizado para descrever o fato de que duas ou mais variveis (conjuntos de dados) esto relacionados. Galton, em 1869, foi provavelmente o primeiro a utilizar o termo com este sentido. O termo utilizado mais precisamente para denominar relacionamento linear entre dois conjuntos de dados ou variveis.

    Correlao amostral (r): Serve para estimar a correlao linear

  • 8

    populacional.

    Correlao cannica (canonical correlation).

    Correlao Fraca ou Nula: quando o Diagrama de Disperso no permite o ajustamento de nenhuma reta, o que significa que r = . Diz-se, ento, que no existe nenhuma relao entre as variveis da Distribuio Bidimensional.

    Correlao Negativa Forte: quando a reta de regresso, obtida a partir do Diagrama de Disperso, tem declive negativo. A correlao negativa quando r varia entre -1 e 0 e ser tanto mais forte quanto r se aproxima de -1.

    Correlao Negativa Perfeita ou Linear: quando a reta de regresso, obtida a partir do Diagrama de Disperso, tem declive negativo com r

    Correlao populacional (r): um valor que mede o grau de relao linear entre duas variveis quantitativas. igual a covarincia dividida pelo desvio padro de cada uma das variveis.

    Correlao Positiva Forte: quando a reta de regresso, obtida a partir do Diagrama de Disperso, tem declive positivo. A correlao positiva quando r varia entre 0 e 1 e ser tanto mais forte quanto r se aproxima de 1.

    Correlao Positiva Perfeita ou Linear: quando a reta de regresso, obtida a partir do Diagrama de Disperso, tem declive positivo com r

    Covarincia populacional C(X,Y): um valor que mede o grau de disperso simultnea de duas variveis quantitativas em relao as suas mdias. a soma dos produtos dos desvios das variveis em relao a sua mdia, dividido pelo nmero de observaes: Soma[(Xi mdiaX)*(Yi mdiaY)]/N. o numerador do coeficiente de correlao.

    Covarivel (covariate or control variable): Uma varivel que apresenta um efeito que no se tem interesse direto. A anlise da varivel de interesse apresentar melhores resultados se a variao da covarivel for controlada.

  • 9

    Curtose (kurtosis): uma medida de um conjunto de dados que informa o quanto este conjunto se desvia do modelo (curva) normal. o grau de achatamento do conjunto. A curva normal teria um coeficiente de curtose igual a trs (alguns autores utilizam zero) e denominada de mesocrtica. Uma medida acima de trs (ou positiva) caracterizaria o conjunto como leptocrtico (mais afinado que a curva normal). Se o coeficiente de curtose for menor do que trs (ou negativo) ento o conjunto denominado de platicrtico (mais achatado do que a curva normal). Foi proposto por Karl Pearson antes de 1905. representado por g2 e calculado por: g2= m4/m22, onde m4 o momento central de quarta ordem e m2 a varincia

    Dado Estatstico: o resultado da observao de um atributo/varivel qualitativa ou quantitativa.

    Dados (data): Os nmeros e atributos que so coletados, analisados e interpretados.

    Dados Classificados: so valores que uma dada varivel pode tomar dentro de certo intervalo. Estes dados so classificados ou agrupados em classes.

    Dados de seo transversal (cross section data): Dados coletados no mesmo ou aproximadamente no mesmo ponto do tempo.

    Dados de srie histrica (data): Dados coletados em perodos de tempo sucessivos.

    Dados Simples: vo valores associados a uma dada varivel e cuja representao feita atravs de uma tabela.

    Definio do Problema: a primeira fase do estudo estatstico e consiste na definio e formulao correcta do problema a ser estudado.

    Densidade da classe (class density): a freqncia da classe dividida pela sua amplitude.

    Descrio das variveis: A varivel constitui um primeiro nvel de operacionalizao de uma construo terica e, para cada uma, se deve dar, em seguida, uma descrio operacional. Para algumas variveis a descrio simples, porm, em outros casos, essa definio mais complexa. Uma varivel contnua, pode ser transformada em discreta e depois em categrica ordinal, por exemplo idade (como diferena entre a data atual e data de nascimento, anos completos, faixas de idade). recomendvel tomar o valor bruto e depois categoriz-lo, isso d mais flexibilidade ao

  • 10

    pesquisador.

    Desvio (deviation): A diferena entre o valor de um conjunto (dado) e a mdia deste conjunto.

    Desvio Mdio (d): a mdia aritmtica do valor absoluto da diferena entre cada valor e a mdia, no caso dos dados no classificados. No caso dos dados classificados, tem que se entrar em conta com a frequncia absoluta de cada observao.

    Desvio Padro (standard deviation): a raiz quadrada da soma dos quadrados dos desvios dividida pelo nmero de elementos, ou dito de outra forma, raiz quadrada da mdia aritmtica dos quadrados dos desvios.

    Desvio Padro (s): a raiz quadrada positiva da varincia.

    Diagrama de Caule-e-Folhas: o mesmo que Separador de Frequncias.

    Diagrama de Disperso: a representao num referencial ortonormado de um conjunto de pares ordenados de valores (x , y), onde cada par ordenado corresponde a uma observao.

    Diagrama de disperso (scattergram).

    Diagrama de Extremos e Quartis: um diagrama que representa os valores extremos e os quartis de uma varivel estatstica.

    Disperso (dispersion): O quanto um conjunto de dados est espalhado. A disperso normalmente avaliada em torno da mdia, atravs da varincia, do desvio padro e do desvio mdio. Mas tambm pode ser definida pela amplitude que a diferena entre o mximo e o mnimo do conjunto ou ainda pela amplitude inter-quartlica, isto , a diferena entre o terceiro e o primeiro quartil.

    Distncia de Mahalanobis (Mahalanobis distance): Uma medida que fornece o quanto um ponto (dado) se afasta da mdia da amostra (ou centride) no espao das variveis independentes utilizadas no ajuste de um modelo de regresso mltipla. Ela fornece uma forma de descobrir pontos que esto mais afastados do que os demais no espao multidimensional.

    Distribuio Bidimensional: a representao de uma varivel bidimensional (xi , xj), com 1 i n e xi e xj duas variveis unidimensionais.

    Distribuio de Frequncias: o mesmo que Tabela de Frequncias.

  • 11

    Epsilon (epsilon): Se for desejado corrigir o teste F univariado utiliza-se o "epsilon" de Huynh-Feldt ou de Greenhouse-Geisser. Lembrando que F a razo entre os quadrados mdios entre grupos e dentro dos grupos e que os graus de liberdade entre os grupos "k - 1", enquanto que o dentro dos grupos "n - k - 1". Para corrigir o valor de F, uma vez que se tenha percebido a falta de esfericidade, deve-se multiplicar o grau de liberdade entre os grupos pelo valor de epsilon. Para violaes mais severas da esfericidade (epsilon < 0,75) o epsilon de Greenhouse-Geisser, mais conservador, deve ser utilizado.

    Erro de estimao: a diferena entre o verdadeiro valor do parmetro e o valor calculado a partir do dados de uma amostra. Este depende diretamente do grau de disperso (variabilidade) da varivel em estudo e inversamente ao tamanho da amostra.

    Erro do tipo I (alpha error): No teste de hipteses consiste em rejeitar a hiptese nula quando ela verdadeira.

    Erro do tipo II (beta error): No teste de hipteses consiste em aceitar a hiptese nula quando ela falsa.

    Erro quadrado mdio (mean square error): a soma dos quadrados dos desvios entre os valores do estimador (varivel) e o parmetro que ele se prope a estimar.

    Erro Tipo-I: rejeitar a hipttese nula quando esta verdadeira. A probabilidade de cometer este erro denotada por e recebe o nome de nvel de significncia do teste.

    Erro Tipo-II: aceitar a hipttese nula quando esta falsa. A probabilidade de cometer este erro denotada por

    Esfericidade (sphericity): Propriedade de que a matriz das varincias/covarincias de um conjunto de dados multivariados um mltiplo escalar da matriz identidade.

    Esfericidade: O teste de esfericidade checa se a matriz de correlao igual a matriz identidade, ou seja, na diagonal formados por uns e zero fora da diagonal.

    ESS (Expert Statistical System): Sistema especialista estatstico.

    Estatstica: o mtodo que ensina a recolher, classificar, apresentar e interpretar um conjunto de dados numricos.

    Estatstica (Statistics): A arte e a Cincia de coletar, analisar, apresentar e interpretar dados.

  • 12

    Estatstica (statistics): Um nmero ou valor. Na teoria da estimao utilizada tambm como sinmino de estimador, isto , uma funo dos elementos da amostra. Este termo foi introduzido por Sir Ronald A. Fisher em 1922.

    Estatstica Descritiva: ramo da Estatstica que tem por finalidade descrever certas propriedades relativas a um conjunto de dados.

    Estatstica Descritiva (descritive statistics): Parte da Estatstica que trata do resumo e da apresentao de conjuntos de dados.

    Estatstica Indutiva: ramo da Estatstica que procura inferir propriedades da populao a partir de propriedades verificadas numa amostra da mesma.

    Estatstica inferencial ou indutiva (inferential or indutive statistic): O processo de tirar concluses sobre a natureza ou o modelo de populaes a partir de amostras aleatrias retiradas destas populaes.

    Estatstica ou estimador: uma funo dos valores da amostra, ou seja uma varivel aleatria, pois seu resultado depende dos elementos selecionados naquela amostra. So utilizados para estimar os parmetros populacionais, para isto preciso conhecer sua distribuio de probabilidades, que via de regra, pressupe normalidade ou amostras grandes. Por exemplo: a mdia amostral, a proporo amostral, a varincia amostral, etc.

    Estatstica robusta (statistics): conjunto de tcnicas utilizadas para atenuar o efeito de outliers e preservar a forma de uma distribuio to aderente quanto possvel aos dados empricos

    Estatstica teste (test statistic): o valor amostral da estatstica utilizada para testar um parmetro no teste de hipteses.

    Estatisticamente significante: dizer que um resultado estatisticamente significante significa que as diferenas encontradas so grandes o suficiente para no serem atribudas ao acaso. Uma diferena " estatisticamente significante" pode no ser " clinicamente importante"; a importncia em termos biolgicos no deve ser julgada pelos estatsticos, mas sim pelos profissionais da rea em que a pesquisa est sendo feita.

    Estimao (estimation): Parte da inferncia estatstica que trata do processo de estimao e das propriedades dos estimadores.

    Estimador (estimator): A eststica (frmula ou expresso) utilizada para avaliar o valor de um parmetro. Um estimador uma varivel

  • 13

    aleatria.

    Estimador de mxima verossimilhana (likehood stimator): usado para determinar valores dos livres parmetros de um modelo estatstico. No sempre desejvel usar estimadores de mxima verosimilhana, pois eles podem estar sujeitos a sobreajuste: para evitar isso, recomenda-se usar regularizao, aonde se adiciona funo objetiva termos que penalizam grandes coeficientes, resultando em estimadores de mxima verosimilhana penalizada. O estimador MV da varincia de uma distribuio Gaussiana enviezado.

    Estimador de mnimos quadrados (least square stimator): uma tcnica de otimizao matemtica que procura encontrar o melhor ajustamento para um conjunto de dados tentando minimizar a soma dos quadrados das diferenas entre o valor estimado e os dados observados (tais diferenas so chamadas resduos).

    Estimativa (estimate): o valor particular de um estimador, isto , o resultado de algum clculo realizado sobre valores amostrais.

    Estimativa (ou Estimativa pontual): o valor que a estatstica ou estimador toma em uma amostra determinada.

    Estimativa por ponto (point estimate): O valor da estatstica amostral que corresponde ao parmetro populacional.

    Estudo caso-controle: comparao entre um grupo de doentes (casos) e um grupo de pessoas no doentes (controles). O objetivo verificar se os casos diferem significativamente dos controles, em relao exposio a um dado fator de risco.

    Estudo de coorte (cohort study): Um estudo longitudinal com o mesmo conjunto (o coorte) de pessoas ao longo de um determinado tempo.

    Estudo de coorte: comparao entre um grupo exposto a um fator de risco e outro grupo no exposto. Visa verificar se indivduos expostos ao fator de risco desenvolvem a doena em questo, em maior ou menor proporo, do que um grupo de indivduos no expostos.

    Eta quadrado (eta-square): uma medida do efeito tamanho que igual ao quociente entre a soma dos quadrados dos grupos entre pela soma dos quadrados somados para todos os efeitos principais, de interao e de erro (os efeitos das covariveis no so computados). Esta medida pode ser interpretada como o percentual da varincia da varivel dependente que so explicadas pelos fatores. Quando existem relaes curvilneas entre a varivel dependente e os fatores o Eta Quadrado ser maior que o

  • 14

    correspondente coeficiente de correlao mltiplo ou R2.

    Fator (fator): Um fator uma denominao alternativa, utilizada na anlise de varincia, para uma varivel. Assim se num determinado experimento consiste em determinar o efeito da dosagem de um remdio, a "dosagem do remdio" um fator. Se neste experimento for levado em conta no apenas a dosagem mas tambm o tempo em que o remdio ser tomado, ento "o tempo" ser um segundo fator. Cada valor que o fator (varivel) assume denominado nvel do fator. Assim se a dosagem testado for de: 100, 110, 115 e 120 mg, este fator ter quatro nveis. Um fator deve ter pelo menos dois nveis.

    Fenmenos Independentes: so fenmenos respeitantes mesma varivel que no tm qualquer ligao um com o outro.

    Frequncia Absoluta (fi): o nmero de vezes que o valor de determinada varivel observado.

    Frequncia Absoluta Acumulada (Fi): a soma das frequncias absolutas anteriores com a frequncia absoluta deste valor.

    Frequncia absoluta acumulada de um valor da varivel: o somatrio da sua frequncia absoluta com todas as anteriores (as dos valores anteriores).

    Frequncia absoluta de um valor da varivel: o nmero de vezes que esse valor aparece na lista de dados.

    Freqncia esperada (expected frequency): Nmero de vezes que um valor da varivel deve se repetir se a hiptese nula for verdadeira ou ainda nmero de vezes que um valor da varivel deve se repetir de acordo com um determinado modelo.

    Freqncia observada (observed frequency): Nmero de vezes que o valor de uma varivel se repete.

    Frequncia Relativa ( fri ): o quociente entre a frequncia absoluta do valor da varivel e o nmero total de observaes.

    Frequncia Relativa Acumulada ( Fri ): a soma das frequncias

  • 15

    relativas anteriores com a frequncia relativa desse valor.

    Frequncia relativa acumulada de um valor da varivel: o somatrio da sua frequncia relativa com todas as anteriores (as dos valores anteriores).

    Frequncia relativa de um valor da varivel: o quociente entre a sua freqncia absoluta e o nmero total de dados.

    Funo Cumulativa: funo que indica para cada valor real x a frequncia absoluta (ou relativa) de observaes com intensidade menor ou igual a x. A representao grfica desta funo em forma de escada.

    Funo de distribuio (cumulative distribuition function): A funo de distribuio acumulada ou simplesmente funo de distribuio de uma varivel aleatria definida em cada valor "x" real como sendo F(x) = P(X x).

    Grfico Circular: representado por um crculo que est dividido em sectores cujas amplitudes so proporcionais frequncia que lhe corresponde.

    Grfico de Barras: constitudo por barras, horizontais ou verticais, de comprimento proporcional frequncia.

    Graus de liberdade (degree of freedon): a quantidade informaes (variveis) livres que sero utilizadas para o clculo de uma estatstica (frmula). O nmero de valores independentes que sero utilizados na estimativa de um parmetro. Em geral, o nmero de graus de liberdade de uma estimativa igual ao nmero de valores utilizados no seu clculo menos o nmero de parmetros estimados no clculo intermedirio para a sua obteno. Assim para calcular a mdia de uma amostra de tamanho "n", so necessrios as "n" observaes fazendo com que esta estatstica tenha "n" graus de liberdade. J a estimativa da varincia atravs de uma amostra de tamanho "n" ter "n - 1" graus de liberdade, pois para a obteno da varincia amostral necessrio antes o clculo da mdia amostral.

    Graus de liberdade: um conceito ligado ao nmero de dados disponveis (livres) para o clculo da estatstica.

    H1: As atitudes em relao Matemtica interferem na formao das atitudes em relao Estatstica. (rxy 0)

    Hiptese alternativa (alternative hipothesis): No teste de hipteses a hiptese que ser provar. geralmente uma desigualdade.

    Hiptese alternativa (H1): As hipteses de uma pesquisa devem

  • 16

    enunciar-se por propostas to claras e especficas quanto possvel, via de regra, o que voc quer mostrar, por exemplo: as atitudes em relao a Matemtica interferem diretamente na formao das

    atitudes em relao Estatstica

    Hiptese alternativa: hiptese que ser considerada como aceitvel, caso a hipttese nula seja rejeitada.

    Hiptese nula (Ho): A hiptese nula a negao da hiptese alternativa, por isso, via de regra, voc sempre torce para que ela seja rejeitada, como no caso seguinte: as atitudes em relao a Matemtica no interferem na formao das atitudes em relao Estatstica. Est a hiptese que esta sendo testada por qualquer teste estatstico. A se tomar uma deciso estatstica, existem duas possibilidades de erro: o Erro de tipo I: rejeitar a hiptese nula (Ho), quando ela verdadeira e, o Erro de tipo II: aceitar a hiptese nula (Ho), quando ela falsa. Infelizmente, quando a probabilidade de cometer um diminui, a probabilidade de cometer o outro aumenta. Assim, os testes estatsticos foram delineados para controlar o erro de tipo I, chamado de nvel de significncia.

    Hiptese nula (null hipothesis): No teste de hipteses a hiptese que representa o que j se conhece e formulada com o objetivo de ser rejeitada.

    Hiptese nula: hiptese que colocada a prova em teste de hiptese. Em geral indica uma igualdade a ser contestada.

    Hiptese: Uma hiptese um enunciado formal das relaes esperadas entre pelo menos uma varivel independente e uma varivel dependente. Nas pesquisas exploratrias, as hipteses podem se tornar questes de pesquisa. Estas questes pela sua especificidade, devem dar testemunho do trabalho conceitual efetuado pelo pesquisador e, pela sua clareza, permitir uma resposta interpretvel.

    Histograma: um grfico de barras em que a rea destas proporcional frequncia, no havendo espao entre as mesmas. S se utiliza em variveis quantitativas contnuas.

    Histograma (histogram): Grfico de colunas justapostas (retngulos) onde a base a amplitude da classe e a altura a densidade ou a densidade relativa da classe. utilizado, normalmente, para representar uma varivel contnua.

    Ho: As atitudes em relao Matemtica no interferem na formao das atitudes em relao Estatstica (rxy = 0)

  • 17

    Homocedasticidade ou igualdade de varincias: Este pressuposto exige que o nvel de disperso da varivel dentro dos grupos seja similar. O SPSS automaticamente testa esta hiptese: Ho: s1 = s2 = s3 = s4, atravs do teste de Levene.

    Independncia (independence): Em teoria de probabilidade, para dizer que dois eventos sejam independentes, significa intuitivamente que a ocorrncia de um evento o faz nem mais nem mais menos o provvel esse outro ocorre.

    Inferncia Estatstica (inferential statistics): A utilizao de amostras de uma populao com o objetivo de tomar decises sobre a populao.

    Interao (interaction): Em estatstica, interao um termo em a

    modelo estatstico adicionado quando o efeito de dois ou mais

    variveis no for simplesmente aditivo. Tal termo reflete que o efeito

    de uma varivel depende dos valores de um ou de mais outras

    variveis. Intercepto (da reta de regresso: Y = a + b * X): o valor de Y, quando X = 0. A maioria das vezes no faz sentido interpretar este valor.

    Intervalo de confiana (confidence interval): A estimativa de um parmetro populacional atravs de um intervalo de valores ao invs de um nico valor.

    Intervalo de confiana: um intervalo centrado na estimava pontual, cuja probabilidade de conter o verdadeiro valor do parmetro igual ao nvel de confiana.a: a probabilidade de erro na estimao por intervalo.

    ISS (Intelligent Statistical Software): Software estatstico inteligente.

    Kruskall-Wallis (Kruskall-Wallis): Ver teste de Kruskall-Wallis.

    Lambda de Wilks (Wilks's lambda): um teste multivariado para verificar diferenas de mdias para os casos de mltiplas variveis dependentes intervalares e mltiplos grupos (mais de dois) formados pelas variveis independentes. O teste t, o T de Hotelling e o teste F so casos especiais deste teste.

    Logit (logit): Se U for uma varivel definida no intervalo [0; 1], ento a transformao que associa a cada valor "u", neste intervalo, um valor "v" no intervalo (-; +) denominada de logit (ou logstica) e definida por: v = logit(u) = ln[u/(1 - u)]. A transformao inversa

  • 18

    executada por: logit-1(v) = ev/(1 + ev).

    Matriz de correlao: uma matriz quadrada, simtrica, cuja diagonal formada pela unidade, pois trata-se da correlao da varivel com ela mesma, e em cada interseo linha (i) coluna (j) a correlao das variveis Xi e Xj.

    Matriz de covarincia: uma matriz quadrada, simtrica, cuja diagonal contm a varincia da varivel e em cada interseo linha (i) coluna (j) a covarincia das variveis Xi e Xj.

    Mximo(maximum): o maior valor de um conjunto de dados.

    Mdia amostral: (X, se l X barra), uma varivel aleatria, funo dos valores da amostra, definida como a soma de todos os valores da amostra dividido pelo nmero de observaes da amostra. Serve para estimar a mdia populacional.

    Mdia aritmtica: o valor que se obtm dividindo a soma dos valores pelo nmero de dados.

    Mediana: o valor que est no centro da sequncia dos dados quando ela est ordenada de forma crescente ou decrescente. Quando o nmero de valores impar, s o valor central, e quando o nmero de valores par, somam-se os dois valores centrais e dividem-se por dois (mdia aritmtica).

    Medida de associao (Measure of association): Um valor que fornece uma idia da fora do relacionamento (e direo) entre duas ou mais variveis.

    Medidas de Disperso: um conjunto de medidas (Amplitude, Varincia e Desvio Padro) utilizadas no estudo da variabilidade de uma determinada distribuio, permitindo obter uma informao mais completa acerca da "forma" da mesma.

    Medidas de Localizao: um conjunto de medidas (Mdia, Mediana, Moda e Quartis) que representam de uma forma global um conjunto de dados.

    Medidas de Tendncia Central: o mesmo que Medidas de Localizao.

    Medidas de tendncia central: Moda, Mediana, Mdia

    Melhor estimador linear no-viciado (best linear unbiased estimator): Um estimador dito estimador linear se ele uma combinao linear das observaes amostrais. dito o melhor estimador linear no-viciado se de todas as combinaes lineares da

  • 19

    amostra ele apresentar a menor varincia.

    Moda ( m ): observao que ocorre com maior frequncia numa amostra.

    Moda: o valor mais freqente da varivel.

    Modelo ARIMA (AutoRegressive Integrated Moving Average): um modelo utilizado em Sries Temporais e que pode representar o comportamento dinmico que muitos conjuntos de dados apresentam.

    Modelo autoregressivo (autoregressive model).

    Modelo log-linear (log-linear model).

    Monitoramento: Observaes contnuas, sem ter uma ao com base no resultado.

    Multicolinearidade: Este um pressuposto importante na anlise regresso mltipla, pois se uma varivel independente for uma combinao linear de outras variveis independentes, coloca em risco toda a anlise. No adianta tentar modelar uma varivel em funo de vrias variveis correlacionadas, essas no incrementam o poder explicativo do modelo. Neste caso, use o modelo de regresso stepwise, backward ou foreward.

    Nvel de confiana (confidence level): a probabilidade de que um intervalo de confiana contenha o valor do parmetro que ele se prope a estimar.

    Nvel de significncia (alfa): definida como a probabilidade de cometer o erro de tipo I, ou seja, rejeitar a hiptese nula (Ho), quando ela verdadeira. Por exemplo:

    Nvel de significncia (alpha level): a probabilidade de se cometer erro do tipo I no teste de hipteses, isto , a probabilidade de se rejeitar a hiptese nula quando ela verdadeira.

    Normal: Uma varivel quantitativa segue uma distribuio normal, se sua distribuio de frequncias tem o formato similar ao de um sino, ou seja a maioria dos valores se concentram em torno da mdia e, a medida que se afasta do centro as observaes so cada vez mais raras. Essa distribuio simtrica. Muitas variveis tm essa distribuio, tais como altura das pessoas adultas do sexo masculino, coeficiente de inteligncia, etc. Para examinar visualmente, voc pode fazer o histograma com a curva ajustada, o SPSS faz isso. O teste que checa a normalidade de uma varivel o teste de Lilliefors, que se encontra no comando EXPLORE do SPSS. A hiptese nula

  • 20

    que a varivel segue uma distribuio normal, por isso voc espera aceitar Ho, e espera que o p-valor seja maior do que o nvel de significncia especificado por voc.

    Normalidade: dizer que h normalidade ou que os dados so normalmente distribudos significa que eles seguem uma distribuio normal, isto , valores concentrados simetricamente em torno da mdia e quanto maior a distncia da mdia, menor a freqncia das observaes.

    Nmero aleatrio (random number): Nmero gerado num computador atravs de um algoritmo recursivo. Na realidade o correto seria dizer nmero pseudo aleatrio uma vez que as seqncias geradas so reprodutveis.

    Nmero de repeties: o nmero de unidades experimentais que recebem o mesmo tratamento.

    Nuvem de Pontos: o mesmo que Diagrama de Disperso.

    Odds ratio: chance de se observar casos expostos ao fator de risco sobre a chance de se observar controles expostos ao fator de risco. Se a exposio ao fator de risco for a mesma para casos e controles o odds ratio vale 1. Tambm chamado de razo de chances (odds ratio).

    Organizao dos Dados: consiste em "resumir" os dados atravs da sua contagem e agrupamento.

    Parmetro: uma medida usada para descrever, de forma resumida, uma caracterstica da populao, Por exemplo, a mdia populacional (m), a proporo populacional (p), a varincia populacional (s), o coeficiente de correlao (r), etc. Os parmetros, via de regra, so valores desconhecidos e desejamos estimar, ou testar, a partir dos dados de uma amostra.

    Pictogramas: so grficos onde se utilizam figuras ou smbolos alusivos ao problema em estudo.

    Planificao do Problema: consiste na determinao de um processo para resolver o problema e, em especial, como obter informaes sobra a varivel em estudo.

  • 21

    Poder do teste (power of a statistical test): Denomina-se poder de um teste estatstico a probabilidade de aceitar a hiptese nula quando ela verdadeira. A probabilidade de se cometer erro do tipo II, isto , aceitar a hiptese nula quando ela falsa representada por b, ento o poder do teste ser 1 - b = P(Aceitar H0 /H0 verdadeira), isto o poder do teste definido como a probabilidade de no se cometer erro do tipo II.

    Poder do teste: corresponde a 1-

    Polgono de Frequncias: so grficos com aspecto de linhas quebradas. Constroem-se unindo por segmentos de recta os pontos mdios das bases superiores dos rectngulos de um histograma.

    Populao: um conjunto de seres com uma dada caracterstica em comum e com interesse para o estudo.

    Populao (population): Conjunto de elementos de interesse com pelo menos uma caracterstica em comum.

    Populao: Toda questo de pesquisa define um universo de objetos aos quais os resultados do estudo devero ser aplicados. A populao alvo, tambm, chamada populao estudada, composta de elementos distintos possuindo um certo nmero de caractersticas comuns (pelo menos uma). Essa caracterstica comum deve delimitar inequivocamente quais os elementos que pertencem populao e quais os que no pertencem. Estes elementos, chamados de unidades populacionais, so as unidades de anlise sobre as quais sero recolhidas informaes.

    Preciso absoluta: a preciso especificada diretamente e na mesma unidade da estimativa que se pretende calcular.

    Preciso relativa: a preciso especificada no diretamente como preciso absoluta, mas sim proporcionalmente como porcentagem em relao ao verdadeiro valor.

    Pressuposto de independncia: chave para a maioria das estatsticas. Isto significa que o resultado de uma observao no interfere no resultado de outra observao. Por exemplo, a nota de um aluno no interfere na nota de um outro aluno. J esse pressuposto quebrado para amostras relacionadas como, por exemplo, passar uma prova antes de uma interveno e a mesma prova (ou outra) depois da interveno; essas duas medidas so correlacionadas, uma vez que os sujeitos so os mesmos. Neste caso, deve-se utilizar o teste para dados emparelhadas, ou ANOVA com medidas repetidas. Logo, cuidado com os estudos longitudinais,

  • 22

    em que se acompanha os mesmos sujeitos em vrios momentos.

    Pressuposto de normalidade: chave para toda a estatstica paramtrica, por essa razo voc sempre deve checar a validade do mesmo. Contudo, quando sua amostra for suficientemente grande (n > 30), dependendo do formato da distribuio, o Teorema Central do Limite garante a convergncia da mdia amostral para a normalidade, veja a pgina 197 do livro de Estatstica Bsica de Moretin e Bussab.

    Probit (probit): Se U for uma varivel definida no intervalo [0; 1], ento a transformao que associa a cada valor "u", neste intervalo, um valor "v" no intervalo (-; +) denominada de probit se v = F-1(u), onde F Funo de Distribuio da Normal Padro.

    Proporo amostral: ( p se l p barra), serve para estimar a proporo populacional.

    Proporo populacional (p): um valor resultante do cociente entre o nmero de casos favorveis e o nmero de casos possveis na populao. Por exemplo: proporo de eleitores que votaro no candidato XYZ nas prximas eleies.

    p-valor: a probabilidade de cometer o erro de tipo I (rejeitar Ho quando ela verdadeira), com os dados de uma amostra especfica. Este valor dado pelo pacote estatstico, assim o comparamos com o nvel de significncia escolhido e tomamos a deciso. Se o p-valor for menor que o nvel de significncia escolhido rejeitamos Ho, caso contrrio, aceitamos Ho.

    P-value: corresponde ao menor nvel de significncia que pode ser assumido para rejeitar a hiptese nula. Dizemos que h significncia estatstica quando o p-value menor que o nvel de significncia adotado. Por exemplo, quando p=0.0001 pode-se dizer que o resultado bastante significativo, pois este valor muito inferior aos nveis de significncia usuais. Por outro lado, se p=0.048 pode haver dvida pois, embora o valor seja inferior, ele est muito prximo ao nvel usual de 5%.

    Quartil (quartil): Valores (so trs) que dividem um conjunto de dados em quatro partes iguais. ( Q1 a Q3 )

    Qui-quadrado (chi-square): teste qui-quadrado

    Razo de chances (odds ratio): a chance a favor dividida pela chance contra, ou seja o nmero de casos favorveis dividido pelo nmero de casos no favorveis.

  • 23

    Recenseamento: o mesmo que Censo.

    Recolha de Dados: a primeira etapa depois de definido o problema em estudo.

    Reta de Regresso: a recta traada sobre uma dada Nvem de Pontos, sendo um modelo matemtico que pretende descrever a relao existente entre duas variveis unidimensionais de uma distribuio bidimensional.

    Reduo de categorias (bracketing, collapsing or grouping): a operao de combinar categorias ou intervalos de valores de uma varivel para produzir um nmero menor de categorias.

    Regio crtica ou de rejeio (critical region or region of rejection): A rea sob a distribuio amostral que determinada de acordo com o nvel de significncia do teste.

    Relaes Estatsticas: so relaes que se podem estabelecer entre determinadas variveis de um problema em estudo.

    Risco relativo: proporo de pessoas expostas ao fator de risco que desenvolveram a doena sobre a proporo de pessoas no expostas que desenvolveram a doena. Vale 1 se as pessoas expostas e no expostas desenvolveram a doena na mesma proporo.

    Separador de Frequncias: um tipo de tabela que permite ter uma percepo imediata do aspecto global dos dados sem perda da informao contida na coleco dos dados inicial.

    Somatrio ( ): representa, de forma abreviada, uma soma.

    Sondagem: o estudo estatstico que se baseia numa parte da populao, isto , numa amostra que deve ser representativa dessa populao.

    Surveillance: Observaes contnuas com um plano de ao com base nos resultados

    Survey: Observao com um objetivo/meta especfica, semelhante a um estudo epidemiolgico transversal.

    T quadrado de Hotteling (Hotelling's t-square): um teste multivariado para verificar diferenas de mdias para casos onde existam mltiplas variveis dependentes intervalares e dois grupos formados por variveis independentes categricas. Para passar do trao de Hotelling ou trao de Lawley-Hotelling para o T quadrado deve-se multiplicar o trao por (n - l), onde "n" o tamanho da amostra considerando todos os grupos e "l" o nmero de

  • 24

    subgrupos.

    Tabela de Frequncias: so tabelas onde se apresentam os dados por classes e as frequncias respectivas.

    Tamanho da Amostra: o nmero de elementos que constituem uma dada amostra.

    Teste bicaudal: teste cujo objetivo testar apenas se as mdias (ou propores) so iguais ou diferentes e no estabelecer qual delas maior ou menor.

    Teste bilateral (two-tailed test): Um teste dito bilateral se a regio crtica estiver dividida meio a meio entre valores superiores e inferiores.

    Teste da soma dos postos de Wilcoxon (Wilcoxon's rank sum test): Um nome alternativo para o teste de Mann-Whitney.

    Teste de esfericidade de Bartlett (Bartlett's sphericity test): Testa a hiptese nula de que a matriz das covarincias das variveis dependentes ortonormalizadas proporcional a uma matriz identidade.

    Teste de esfericidade de Mauchly (Mauchly sphericity test): Testa a hiptese nula de que a matriz populacional de correlaes uma matriz identidade. Se o valor da estatstica qui-quadrado obtido significativo ento a matriz de correlaes a ser analisada no aleatria. Neste caso conveniente utilizar o teste de Humphrey e Ilgen.

    Teste dos sinais de Wilcoxon (Wilcoxon's signed rank test): Um teste no paramtrico ou de distribuio livre para testar a diferena entre duas populaes utilizando amostras emparelhadas. O teste toma por base as diferenas absolutas dos pares de observaes das duas amostras, ordenados de acordo com o seu valor onde cada posto (diferena) recebe o sinal da diferena original. A estatstica teste a soma dos postos positivos.

    Teste exato de Fisher (Fisher's exact test): Um teste de independncia entre duas variveis categricas dicotmicas. Foi introduzido por Sir Ronald A. Fisher em 1935. O teste envolve o uso da distribuio hipergeomtrica para calcular a probabilidade de uma determinada combinao de totais parciais (somas de linhas ou colunas) sob a hiptese nula de independncia.

    Teste monocaudal: teste cuja hiptese alternativa uma desigualdade, ou seja, deseja-se testar se o valor observado maior

  • 25

    ou menor ao valor crtico correspondente hiptese nula.

    Teste no paramtrico (nonparametric test): Um teste no paramtrico testa associaes, dependncia/independncia e modelos ao invs de parmetros.

    Teste Q de Cochran (Cochran's Q test).

    Teste qui-quadrado (chi square test).

    Teste t - de Student (t test or Student t test): Teste paramtrico que utiliza duas amostras independentes. Testa a diferena entre duas mdias populacionais quando os desvios padres populacionais so desconhecidos (o que ocorre na grande maioria dos casos).

    Teste t: teste estatstico cujo objetivo testar a igualdade entre duas mdias. O teste supe independncia e normalidade das observaes. As varincias dos dois grupos podem ser iguais ou diferentes, havendo alternativas de teste para as duas situaes. Neste servio, consideramos apenas o caso em que as varincias so iguais.

    Teste U de Mann-Whitney (Mann-Whitney U test).

    Teste unilateral (one-tailed test): Um teste dito unilateral quando a regio crtica ou regio de rejeio est situada direita

    Teste Z: teste estatstico cujo objetivo testar a igualdade entre uma mdia conhecida (numa populao ) e uma mdia calculada pelo pesquisador (numa amostra). O teste supe normalidade das observaes.

    Unidade Amostral: a menor diviso do material que se mede em separado

    Unidade Estatstica ou Indivduo: cada um dos elementos da populao.

    Unidade Experimental: a menor diviso do material experimental que poderia receber qualquer tratamento.

    Validade externa: refere-se inferncia estatstica, ou seja, a generalizao dos resultados para toda a populao de interesse.

    Validade interna: a validao dos resultados apenas para a amostra considerada, ou seja, a validade das inferncias para os indivduos que participaram do estudo. Os clculos de tamanho de amostra feitos aqui so baseados principalmente nas tcnicas estatsticas a serem utilizadas. Entretanto, importante ressaltar que, o fato do

  • 26

    nmero de observaes ser suficiente no garante a utilizao da tcnica estatstica. Em geral, existem algumas suposies que devem ser satisfeitas como por exemplo, a normalidade das observaes em testes de comparao de mdias.

    Valor crtico (critical value): Valor da distribuio amostral que separa a regio de regio da de no rejeio.

    Varincia ( 2 ): a medida que permite avaliar o grau de disperso dos valores da varivel em relao mdia.

    Varincia (variance): a mdia do quadrado das distncias euclidianos que cada ponto do conjunto est da mdia aritmtica.

    Varincia amostral (s2): Serve para estimar a varincia populacional.

    Varincia populacional (s2): um valor que mede o grau de disperso dos valores da varivel, na populao, em relao mdia populacional. Definida como a soma dos quadrados dos desvios dos valores da varivel em relao a sua mdia, divido pelo nmero de observaes: Soma[(Xi mdia)2]/N

    Varincia relativa (relative variance): o quociente entre a varincia e o quadrado da mdia.

    Variveis Contnuas: so as variveis que podem tomar qualquer valor de um determinado intervalo.

    Variveis Discretas: so as variveis que podem tomar um nmero finito ou uma infinidade numervel de valores.

    Variveis Qualitativas: o mesmo que Atributos Qualitativos.

    Variveis Quantitativas: o mesmo que Atributos Quantitativos.

    Varivel (variable): Uma caracterstica comum a todos os dados.

    Varivel aleatria: uma varivel cujo valor numrico atual determinado por probabilidades. Por exemplo, X: pontuao na escala de atitudes em relao Estatstica, Y: nmero de disciplinas reprovadas em Estatstica, etc. Observe que o resultado depende do aluno selecionado. A varivel aleatria tem uma distribuio de probabilidades associada, o que nos permite calcular a probabilidade de ocorrncia de certos valores.

    Varivel contnua: varivel cujos possveis valores formam um intervalo de nmeros reais e que resultam, normalmente, de uma mensurao, como por exemplo peso, altura e presso arterial.

    Varivel dependente (VD): Mede o fenmeno que se estuda e que se

  • 27

    quer explicar. So aquelas cujos efeitos so esperados de acordo com as causas. Elas se situam, habitualmente, no fim do processo causal e so sempre definidas na hiptese ou na questo de pesquisa. No nosso exemplo: desempenho em estatstica e atitudes em relao Estatstica.

    Varivel dicotmica: varivel em que s existem duas respostas possveis, como por exemplo sim/no, doente/no doente.

    Varivel discreta: varivel quantitativa cujos possveis valores formam um conjunto finito ou enumervel de nmeros e que geralmente resultam de uma contagem, como por exemplo o nmero de filhos.

    Varivel independente (VI): So aquelas variveis candidatas a explicar a(s) varivel(eis) dependente(s), cujos efeitos queremos medir. Aqui devemos ter cuidado, pois mesmo encontrando relao entre as variveis isto, no necessariamente, significa relao causal.

    Varivel qualitativa (ou categrica) nominal: So aquelas cujas respostas podem ser encaixadas em categorias, sendo que cada categoria independente, sem nenhuma relao com as outras: sexo (masculino, feminino), raa (branco, preto, outro), etc.

    Varivel qualitativa (ou categrica) ordinal: So aquelas cujas categorias mantm uma relao de ordem com as outras, que podem ser regulares ou no (existe uma ordem natural nas categorias): classe social (alta, mdia, baixa), auto-percepo de desempenho em Matemtica (pssimo, ruim, regular, bom , timo), etc. A rigor, no tratamento estatstico das variveis categricas, no existe diferena se ela for nominal ou ordinal, a nica observao que quando voc est lidando com uma varivel ordinal, aconselhvel manter a ordem natural das categorias, de menor para maior, na hora da apresentao, seja em tabela ou em grficos.

    Varivel quantitativa contnua: Resultados de mensuraes, podem tomar infinitos valores: pontuao na escala de atitude, nota na prova de matemtica, pontuao no vestibular, etc.

    Varivel quantitativa discreta: So aquelas resultantes de contagens, constituem um conjunto finito de valores: nmero de filhos, nmero de reprovaes em matemtica, idade em anos completos, etc.

    Varivel: uma caracterstica da populao. Toda questo de pesquisa define um nmero de construes tericas que o pesquisador quer associar. O grau de operacionalizao destas construes no faz parte de um consenso. Por essa razo, a seo

  • 28

    que trata das definies das variveis deve permitir ao leitor avaliar a adequao dos instrumentos utilizados, as variveis escolhidas e as construes tericas descritas no quadro conceitual.

    Vcio (bias): Conceito referente a uma estatstica ou estimador. Um estimador dito sem vcio (no-viciado), no- tendencioso ou imparcial se a mdia de sua distribuio amostral coincide com o parmetro a ser estimado.

    Wavelet (Wavelet): uma funo matemtica til para processamento de sinais e compresso de imagens, embora seu uso com estes propsitos seja recente a teoria no nova. Os princpios so semelhantes ao da Anlise de Fourier. Na WWW wavelets tem sido utilizadas para a compresso de imagens com mais sucesso do que o mtodo familiar JPEG.

    Referencias:

    http://www.pucrs.br/famat/statweb/glossarios/gloesta/ge_yz.htm

    http://www2.esec-miguel-torga.rcts.pt/Projectos/estatistica.pdf

    http://www.educ.fc.ul.pt/icm/icm2003/icm24/dicionario.htm

    http://www.unibero.edu.br/glossarios_def.asp

    http://www.socio-estatistica.com.br/Edestatistica/glossario.htm