intenção das pesquisas de intenção de voto carlos alberto de bragança pereira dep estatística...

Intenção dasPesquisas de Intenção

de Voto

Carlos Alberto de Bragança PereiraDep Estatística / IME / USP – TitularNúcleo de BioInformática - Diretor

Requião 805 46%

Dias 787 45%

Indecisos 105 6%

B/N 53 3%

Amostra 1750 1

P(R>O) 67,40% Exato

68,18% Normal

Proporção de votos válidos para Requião: ICredibilidade de 95% [0,48;0,53]

0,4 0,44 0,48 0,52 0,56 0,6

Centralcauda

0,46

0,47

0,48

0,49

0,5

0,51

0,52

0,53

0,47 0,48 0,49 0,5 0,51 0,52 0,53 0,54RR

OD

Pesquisa IBOPE 24/09/06n 2002 Sample

Lula 941 0,47003 48,96%Alkimin 661 0,33017 34,39%

Indecisos 100 0,04995 5,20%B/N 80 0,03996

outros 220 0,10989 11,45%

N 124811798 PopulaçãoLula 46291573 0,370891 48,65%

Alkimin 39564399 0,316992 41,58%Abst 20912362 0,167551 21,98%B/N 8752079 0,070122

outros 9291385 0,074443 9,77%

Verossimilhança•A função de verossimilhança considerando uma amostra de um processo multivariado de Bernoulli é

80100220661941NIOALL

Probabilidade de 2º Turno• Lembrando que a verossimilhança é

uma função do parâmetro, podemos normalizar essa função para que se torne uma densidade de probabilidade Dirichlet de ordem 5 ou dimensão 4. Os parâmetros dessa distribuição são os elementos do seguinte vetor

• (942;662;221;101;81)

Probabilidade de 2º Turno• Usando as propriedades

matemáticas da Dirichlet temos:Parâmetros

Possibilidades Lula ñLula Pr(2o turno)Perfil 1 941 881 8,568%Perfil 2 990 932 9,951%Perfil 3 1041 881 0,015%Perfil 4 941 981 82,860%Perfil 5 988 934 11,605%

População•População = Conjunto de todas as Unidades cujas características desejam-se conhecer.

•{u1, u2,..., uM}

Parâmetro•Parâmetro = Conjunto de

todas as características de interesse associadas as unidades populacionais.

•{v1,v2,...,vM}• De interesse: V= v1+v2+..+vM

Notação• Considerem-se 3 possibili-dades

para os vi´s. •vi=(1,0,0) se i vota em Lula.•vi=(0,1,0) se i vota em Alkimim.•vi=(0,0,1) se i vota em outros.• O interesse: V= v1+v2+..+vM=

(L,A,O) : L (A) [O]= Total de votos de Lula (Alkimim) [outros].

Amostra•Amostra = Conjunto de to-

das de unidades populacio-nais onde os valores de v foram obtidos

•{(Ii,Iivi): i=1,...,N}•Ii=1 (0) se i (não) está na

amostra.

Estatística•Tamanho da Amostra = n = I1+I2+...+IN.

•Total amostral T=I1v1 +...+INvN

•Média amostral = T/n = m, o vetor de proporções amostrais.

Planejamento amostral•Distribuição amostral = P{I1,I2,...,IN}.

•Seja pi = Pr{Ii=1} = E{Ii}•Assim, E{T} = p1v1 +...+pNvN •Se pi = c então, E{T}=cV; isto é

T/c é uma estimativa não viciada de V.

A crítica•A distribuição de seleção, a

distribuição do vetor I’ =

(I1,I2,...,IN) independe do valor do parâmetor de interesse V. A amostragem completamente casual de n elementos produz P{I’}=n/N

A alternativa•(v1,v2,...,vM) parâmetro•(u1,u2,...,uM) rótulo•{(ui,vi): i=1,...,N} que tem a mesma distribuição de {(uk,vi): k,i=1,...,N}

Conseqüência • Existe um parâmetro 0< P =

(pL,pA,pO)<1 com pL+pA+pO=1 tal que qualquer que seja a unidade i, conhecido o valor de P, as variáveis v, sendo iid teriam a seguinte distribuição:

•Pr{vi=(1,0,0)|P} = pL;•Pr{vi=(0,1,0)|P} = pA;•Pr{vi=(0,0,1)|P} = pO;

Modelo alternativo• Como temos permutabilidade,

podemos considerar as primeiras n unidades como nossa amostra e escrever o total amostral como X = v1+v2+...+vn = (l,a,o).

• A verossimilhança é simplesmente

Lik(P|X) PX.

Exemplo 1

•Consideremos o caso onde X=(60,45,45) a função de verossimilhan-ça neste caso seria

•Lik(P|X) (pL)60(pA)45(pO)45

Modelo marginal•Na comparação dos dois

candidatos, teríamos que:•pLA= pL/(pL+pA) ~ B(61,46) (0,57) o que implica que a probabilidade que Lula ganhe de Alkimim é 93%

•[0,4765;0,6625] IC 95%

0

0,05

0,4 0,5 0,6 0,7 0,8

3 extratos•Estado 1 - X1=(90,90,120)•Estado 2 - X2=(100,54,46)•Estado 3 - X3=(60,45,45)

•Pais – X = 0,5X1+0,3X2+0,2X3

LEGENDA DAS FIGURAS

cidade 1: amostra n = 300. Tem 50% da população do país.cidade 2: n = 200. Tem 30% pop do paíscidade 3: n = 150. Tem 20% do país.

X1 ou p1 é LulaX2 ou p2 é AlckiminX0 ou p0 = 1-p1-p2 é outros

exemplo 1:X1 = (X11, X21, X01) = (132, 81, 87)X2 = (X12, X22, X02) = (40, 120, 40)X3 = (X13, X23, X03) = (60, 45, 45)Z = 0.5*p|X1 + 0.3*p|X2 + 0.2*p|X3

F01 - densidade de Z em p1 e p2 e região de 95% de credibilidadeF02 - ampliacao de f01 na região de interesse.F03 - somente p|X1 cidade 1 separada e regiao 95% credibilidade

exemplo 2:

X1 = (90, 90, 120)

X2 = (100, 54, 46)

X3 = (60, 45, 45)

F09 - densidade z de p1 e p2 e regiao 95%

F10 - idem F09 ampliada

F11, F13 e F15 - p|x1, p|X2 e p|X3

F12, F14, F16, F17 são ampliações

Região1 Região2 Região3 prop abs prop abs prop abs Lula p1 0,35 40 0,27 35 0,29 20 Alck p2 0,30 35 0,40 53 0,29 20 Outros 0,35 40 0,33 44 0,43 30 Total 1,00 115 1,00 132 1,00 70

EXEMPLO

Região Proporção Região1 0,20 Região2 0,50 Região3 0,30

Gráficos – Região 1 Dirichlet(41,36,41)

Curvas de nível

Região de Credibilidade

Marginal de p1 Beta(41,77) I.C. = (0.262 ; 0.434)

0.0 0.2 0.4 0.6 0.8 1.0

02

46

8

p1


0.0 0.2 0.4 0.6 0.8 1.0

02

46

8

p2

Curvas de nível

Região de Credibilidade


0.0 0.2 0.4 0.6 0.8 1.0

02

46

810

p1


0.0 0.2 0.4 0.6 0.8 1.0

02

46

8

p2

Curvas de nível

Região de credibilidade


0.0 0.2 0.4 0.6 0.8 1.0

02

46

p1


0.0 0.2 0.4 0.6 0.8 1.0

02

46

p2

Gráficos Geral 0,2*Dirichlet(41,36,41) + 0.5*Dirichlet(36,54,45) + 0.3* Dirichlet(21,21,31)

Curvas de nível

Região de credibilidade

Marginal de p1 0.2*Beta(41,77) + 0.5*Beta(36,99) + 0.3*Beta(21,52) (*) I.C. = (0.193 ; 0.399)

0.0 0.2 0.4 0.6 0.8 1.0

02

46

8

p1

(*) esta parte não sei se está certa

Marginal de p2 0.2*Beta(36,82) + 0.5*Beta(54,81) + 0.3*Beta(21,52) I.C. = (0.215 ; 0.471)

0.0 0.2 0.4 0.6 0.8 1.0

01

23

45

p1

intenção das pesquisas de intenção de voto carlos alberto de bragança pereira dep estatística...

Documents