projeto de experimentos científicos análise de sistemas por usuários marcelo da silva hounsell...

Post on 16-Apr-2015

109 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Projeto de Experimentos CientíficosAnálise de Sistemas por Usuários

Marcelo da Silva Hounsell

Avanilde Kemczinski

Maio/2008

Objetivo de uma Pesquisa

O que ?– Conhecer um fenômeno

Como ?– Através de um experimento

• O que nos interessa observar• Resultado é a expectativa/tendência

Supõe-se que o Tema, Objetivo e Teminologias já tenham sido tratados antes

Estes normalmente aparecem na introdução e fundamentação do trabalho

Qual é o formato de pesquisa mais comum em Ciência da Computação?– Experimental– Exploratória

Quais técnicas são as mais usadas?

Pesquisa Experimental

Manipula variáveis relacionadas com o objeto de estudo com objetivo de identificar causa/efeito procurando evitar a interferência de variáveis intervenientes

Interfere-se na variável independente e observa-se o que acontece com a dependente.

Tendências, Regressão

Pesquisa Exploratória

Visa descobrir a relação existente entre as variáveis de interesse, principalmente quando há pouco conhecimento sobre o problema a ser estudado para, então, aumentar o entendimento sobre este

Associação, Correlação

Roteiro (M&L)

O ProblemaHipótesesVariáveisPúblicoEstratégiaColeta de Dados e TabulaçãoTratamento e Análise de Dados

O Problema

Como comparar o uso de dois sistemas computacionais ?

Uso– Avaliar resultado/performance– Avaliar satisfação

Hipóteses

Muitas vezes estas não ficam explícitas no texto

É uma suposta resposta ao objetivo e que será aceita ou refutada ao final da pesquisa.

Qual a hipótese do seu trabalho ?

Qual a resposta que se supõe será obtida ?

Hipóteses

Exemplos– Uma interface de RA aumenta o

aprendizado da inspeção de focos da dengue

– Uma interface com RA não influencia na avaliação do Controle Motor

– O uso de recursos computacionais aumentam o aprendizado da programação de robôs

Variáveis do Experimento

Características que podem ser observadas/medidas

Variáveis

Tipos– Dependentes– Independentes– Intervenientes

Formas– Quantitativas– Qualitativas

Tipos de Variáveis (CBS: 78)

Independentes (X)– Causa ou fator determinante– Não podem ser controlados

Dependentes (Y)– Fatores a serem observados/coletados– São afetadas pela var. independentes– Resultam da manipulação das v.ind.

Intervenientes (w)– Modificam a v.d. sem que tenha havido modificação

na v.i.

Exemplo (CBS: 78)

– Alunos da escola pública e de particulares (X) têm notas (y) diferentes no vestibular pelo nervosismo de uns ou de outros (w)

Variáveis Independentes (M&L:140)

É preciso avaliar a real importância de ...– Gênero (M/F) (influencia mesmo ?)– Idade (Faixa etária)– Ambiente do Experimento (Univ., Casa, Trab.)– Estado Emocional/Atenção (horário)– Escolaridade– Estilo Cognitivo– Familiaridade com o Computador– Familiaridade ou Conhecimento Específico

• Em RV/RA• Em Dengue• Com Jogos 3D

Formas das Variáveis (B:30)

Quantitativas– Cardinais

• Numéricas• Tempo de Serviço, Altura, ...

Qualitativas– Ordinais

• Quando há uma relação de ordem entre elas• Ex: básico|médio|avançado;

– Categóricas• Sem relação de ordem• Ex: regiões do país, estado civil

Variáveis Dependentes

Quantitativas/Objetivas– Tempo, Altura– Acertos/Erros– Repetições/Re-começos– Paradas/Retornos

Qualitativas/Subjetivas– Conhecimento– Fadiga/stress– Preferência/gosto

Qual usar ?

Selecionando as variáveis (B:30)

Em termos do trabalho que você exerce na empresa, você se sente:– Muito satisfeito,– Pouco satisfeito– Insatisfeito

Dê uma nota de 0 a 10, relativa ao seu nível de satisfação com o trabalho que você exerce na empresa. Nota: ____

“a pesquisa quantitativa tende a ser mais precisa e confiável” (CMC:115)

No caso da comparação de sistemas........

(Hounsell, 2008)

Dados qualitativos são indicativos da satisfação do usuário e devem ser confrontados com dados quantitativos de performance

Idealmente, um sistema deve ser bom para o usuário e promover boa performance

Roteiro (M&L)

O ProblemaHipótesesVariáveisPúblicoEstratégiaColeta de Dados e TabulaçãoTratamento e Análise de Dados

Público: Universo

Universo/Público-alvo– São as pessoas as quais queremos

que os resultados se apliquem (B:27)

– Quem são, quais as características do Universo ?

– Como identifica-lo dentre toda a população do planeta (rever variáveis independentes)

– Quantas são as pessoas que estão relacionadas com este experimento ?

Quem é o Universo do seu experimento ?

Exemplos

Pacientes pós-AVC, com gravidade abaixo de severa.

Crianças de 4a a 8a sériesInteressados em Programação de

Robôs

Público: Amostra

Amostra– Impossível avaliar Todo o Universo (Ideal).– É mesmo representativa do Universo ?– Quais os critérios para selecionar a amostra

do universo ? Porque ?– Quantos indivíduos são necessários para se

obter uma resposta confiável ?

Amostragem

Amostragem Sistemática– Quando se conhece algumas

características da população– Ex: se população=70% mulher, na

amostra isso tem que ocorrer.

Amostragem Aleatória Simples

Tamanho da Amostra

Depende da área também !!!

Análise do Controle Motor Eder = 53 (45 indivíduos pós hemiplégicos, -  8 indivíduos sem deficiência

motora) Dose = 53 (35 pessoas esquizofrênicas (medicadas com calmantes), 18

pessoas saudáveis) Sanches = (28 mulheres com fibromialgia, 3 tarefas com 10 tentativas cada) Subramanian = 23x20x24 (15 pacientes com hemiparesia,  8 sem deficiência

motora, 20 tentativas por alvo, 3 blocos de 24 tentativas cada) Viau = 15x6 (8 indivíduos saudáveis, 7 adultos com hemiparesia, 6

tentativas em cada ambiente (real e virtual) Luo = 3x30 (3 homens com AVC usando sistemas diferentes, Cada um

interagiu com 15 objetos virtuais, seguidos de 15 objetos reais) Tanaka = (8 indivíduos com SNU (Síndrome da Negligência Unilateral) Broeren = (5 indivíduos pós-AVC e hemiparéticos em fase crônica,  Número

pequeno da população não validou o estudo)

Tamanho da Amostra (B:58)

Para populações grandes, o tamanho da amostra é definido pelo Erro Amostral (ea)– na = 1 / ea2

– Assim, 25 pessoas equivale a um ea de 20%

Se a população é pequena, o cálculo é outro.

Público: Amostra

1 indivíduo = estudo de casoAlguns indivíduos = “estimativa”Muitos indivíduos = quase certeza

Por uma questão de probabilidade, para que se tenha confiança, Quanto mais, melhor (CMC:128)

Roteiro (M&L)

O ProblemaHipótesesVariáveisPúblicoEstratégiaColeta de Dados e TabulaçãoTratamento e Análise de Dados

Estratégia de Experimentação

Software 1

Software 2

Grupo de N pessoas

Estratégia de Experimentação

Basicamente são duas:

(1G2S) UM grupo avalia os DOIS softwares

(2g1S) O grupo é DIVIDIDO e avalia UM software em separado

Brainstorm

Quais seriam as vantagens das abordagens 1G2S e 2g1S ?

1G2S:Vantagens

Pode-se fazer a comparação direta e obter “o melhor”

Tamanho do grupo é menorPode-se obter clareza em quais

partes/itens um é melhor que o outro se for feito questionamentos por partes

2g1S: Vantagens

Experimento individual é mais rápido

Cada um avalia o seu sem ser influenciado pela existência do outro

Os dois sistemas podem ser bons – conclui-se que não há diferença

Brainstorm

Quais seriam os problemas das abordagens 1G2S e 2g1S ?

1G2S: Problemas

Qual a seqüência (pode influenciar no resultado final ?)

O usuário aprende com o experimento (isso influencia no resultado ?)

O objetivo real do teste deve ser omitido ?Duração do experimento é maiorPode gerar cansaço/fadiga devido a

repetição ?Faz tudo no mesmo dia, dá intervalo de

descanço, quanto ?

2g1S: Problemas

A comparação é indiretaUma avaliação ótima de um, pode ocorrer

até pela ignorância do quão bom é o outroComo manter o perfil dos dois grupos

parecido ?Precisa de mais indivíduos para se ter dois

grupos de tamanho “aceitável”Variáveis de gênero e idade podem levar a

que o grupo dividido seja menor ainda se elas influenciam no resultado

Análise

Se o objetivo é saber quem é O melhor, 1G2S é direto

Se o objetivo é identificar diferenças, 1G2S

Se os dois podem ser bons, 2g1s parece mais adequado

2o dia....

Roteiro (M&L)

O ProblemaHipótesesVariáveisPúblicoEstratégiaColeta de Dados e TabulaçãoTratamento e Análise de Dados

Coleta de Dados

Coleta é executar o experimento e fazer as anotações individuais conforme o especificado.

É um processo que ocorre antes, durante e depois do experimento propriamente dito.

“a única coisa realmente previsível na coleta de dados é o fato de que ela toma sempre mais tempo do que se espera” (CMC:183)

Coleta de Dados

Idealmente, faz-se primeiro um pré-teste para ter melhor clareza de– como será a coleta, – quanto tempo levará cada indivíduo,– clareza das tarefas e perguntas,– outros problemas de ordem práticas

Tratamento dos Dados

Tratar os dados significa aplicar procedimentos estatísticos para segmentar/agrupar dados (por variável independente)

Tratamento dos Dados

O que se quer saber das variáveis ?

Prevê-las !!!

No mínimo se quer tendência (expectativa) e dispersão (confiança)

Análise dos Dados

Através dos dados, evidencia-se a relação causal entre as variáveis dependentes e independentes para atender as hipóteses (:170)

Interpretar/Percepção– o que se entende pelos números obtidos?

Explicar/Proposição– porque essa relação ocorreu ?

Especificar/Delimitar alcance– até onde esta relação ocorre ?

Análise dos Dados Estatísticos

70% das escolas públicas de ensino médio não têm acesso à web !

Que isso significa ?

Omissões

A) Das 150 mil escolas públicas de EM do país, 80 mil estão em áreas rurais onde só 1% dispõem de Telefone/Web.

B) As escolas rurais têm menos alunos por sala e menos salas que as urbanas, de forma que dos 30 milhões de alunos do EM, 80% estão nas áreas urbanas

Então

A) desprezando o 1% para facilitar os cálculos, tem-se que ... 80 mil, correspondentes a 53,3%, de escolas sem web são da zona rural e os outros 17,7% (para completar os 70%) são da zona urbana.

B) tem-se 24 milhões de alunos na zona urbana e 6 milhões na rural sendo – 6,0 mi na rural não tem acesso a web e – 17,7 % dos 24 mi, ou seja, 4,25 mi na urbana não

tem acesso a web

Concluindo

(4,25 + 6,0) milhões de alunos não tem acesso a web e os demais 19,75 têm!

Resumindo, 66% de alunos das escolas públicas de EM têm acesso a web

70% das escolas públicas de EM não têm acesso à web

Escrita

É a fase final onde se vai colocar todos os itens anteriores em uma ordem lógica, em formatos adequados e atrativos

Acabou !

Rudimentos de Estatística

O quanto de estatística tenho que conhecer para desenvolver uma pesquisa científica ?

“se não é necessário um conhecimento profundo de estatística, ainda assim o pesquisador deve ter a ´visão estatística´ do problema” (CMC:122)

Tratamento Estatístico de Dados(Adaptado de B:109; CMC:126)

Análise Univariada– Qualitativas– Quantitativas

Análise Bivariada– Duas Quantitativas– Uma Quantitativa e Uma Qualitativa– Duas Qualitativas

Tratamento Estatítico de Dados

Análise Univariada– Qualitativas

• Distribuição (tabelas, gráficos)• Percentagens (gráficos de pizza)

– Quantitativas• Distribuição (histograma)• Tendência/Medidas de Posição• Dispersão

– Máximos e Mínimos– Desvio Padrão

Tratamento Estatístico de Dados

Análise Bivariada– Duas Quantitativas

• Correlação• Regressão

– Uma Quantitativa e Uma Qualitativa• Diferença de Médias

– Duas Qualitativas• Categóricas – Tabela de Contingências• Ordinais – Correlação de Ordem

Análise Univariada

Univariada.Distribuição(Tabelas e Gráficos)

Univariada.Distribuição(Histograma)

1 2 3 4 50

5

10

15

20

25

30

35

40

Peso de Recém-nascidos

Fre

qu

ên

cia

Peso (Kg)

freq

1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25

1 2 3 4 50

5

10

15

20

25

30

35

40Peso de Recém-nascidos

freq

Fre

qu

ênci

a

Peso (Kg)

O Problema da Média

Ao longo do dia, a temperatura média no deserto do Saara é agradável (24 C).

– Durante o dia chega a 44 C– Durante a noite cai a 4 C

Qual cálculo consegue definir a expectativa de um valor, a tendência de uma variável ?

Tendência – Expectativa (B:101)

Média – Valor Típico– Muito afetada por valores extremos

Moda– Valor de maior freqüência para variáveis discretas

Mediana– Valor que divide os dados ordenados no meio– Menos sensível a valores muito extremados– Mais adequada que a média quando a distribuição de

valores não é uniforme/simétrica– Diferença grande entre Média e Mediana indica a

distribuição não uniforme dos dados

Cálculo da Média

Média Aritmética

Média Para Dados Agrupados

fX

N

X

N

Média>Mediana>Moda

Média=Mediana=Moda

Desvio Padrão (dp)

É a média de quanto as variáveis observadas se distanciam da média geral– dp =

Para comparar duas variáveis quantitativas (quaisquer) quanto a sua dispersão calcula-se o coeficiente de variação – cv = dp / média * 100%

Influencia na probabilidade de se obter valores próximos a média geral

Distribuição Normal

Médias e desvios padrão

2012 15 1810 11 13 14 16 17 19 21 229

12 15 1810 11 13 14 16 17 19 20

Curvas com médias diferentes e desvios padrão diferentes

Curvas com médias diferentes e o mesmo desvio padrão

Associação (B:227)

Entre variáveis qualitativas (ordinais ou categóricas)

Indica a “probabilidade” de se prever uma variável pelo conhecimento de outra

Obtido pelo teste do qui-quadrado– Ex: clima (quente) -> ir a praia (maior)– Ex: sexo (masculino) -> fumante (sim)

Correlação (B:251)

Indica a associação entre duas variáveis quantitativas pareadas (x,y)

Exemplo– Altura e peso são positivamente

correlacionadas– Número de membros da familia e

renda familiar estão negativamente correlacionados

Regressão (B:267)

Dada uma correlação, a regressão estabelece como é o comportamento da correlação (aumenta, diminui, constante)

Resulta numa reta de relação entre as variáveis

Regressão

Referências

(M&L) Marconi & Lakatos. Fundamentos da Metodologia Científica. 6a. Edição, 2005

(B) Barbetta, P. A. Estatística Aplicada às Ciências Sociais. 6a ed. Editora da UFSC. 2006.

(CBS) Cervo, Bervian e Da Silva, Metodologia Científica, 6a ed, Pearson Prentice Hall, 2007

(CMC) Castro, C de M. A Prática da Pesquisa. 2a ed, Pearson Prentice Hall, 2006.

top related