intenção das pesquisas de intenção de voto carlos alberto de bragança pereira dep estatística...
TRANSCRIPT
Intenção dasPesquisas de Intenção
de Voto
Carlos Alberto de Bragança PereiraDep Estatística / IME / USP – TitularNúcleo de BioInformática - Diretor
Requião 805 46%
Dias 787 45%
Indecisos 105 6%
B/N 53 3%
Amostra 1750 1
P(R>O) 67,40% Exato
68,18% Normal
Proporção de votos válidos para Requião: ICredibilidade de 95% [0,48;0,53]
0,4 0,44 0,48 0,52 0,56 0,6
Centralcauda
0,46
0,47
0,48
0,49
0,5
0,51
0,52
0,53
0,47 0,48 0,49 0,5 0,51 0,52 0,53 0,54RR
OD
Pesquisa IBOPE 24/09/06n 2002 Sample
Lula 941 0,47003 48,96%Alkimin 661 0,33017 34,39%
Indecisos 100 0,04995 5,20%B/N 80 0,03996
outros 220 0,10989 11,45%
N 124811798 PopulaçãoLula 46291573 0,370891 48,65%
Alkimin 39564399 0,316992 41,58%Abst 20912362 0,167551 21,98%B/N 8752079 0,070122
outros 9291385 0,074443 9,77%
Verossimilhança•A função de verossimilhança considerando uma amostra de um processo multivariado de Bernoulli é
80100220661941NIOALL
Probabilidade de 2º Turno• Lembrando que a verossimilhança é
uma função do parâmetro, podemos normalizar essa função para que se torne uma densidade de probabilidade Dirichlet de ordem 5 ou dimensão 4. Os parâmetros dessa distribuição são os elementos do seguinte vetor
• (942;662;221;101;81)
Probabilidade de 2º Turno• Usando as propriedades
matemáticas da Dirichlet temos:Parâmetros
Possibilidades Lula ñLula Pr(2o turno)Perfil 1 941 881 8,568%Perfil 2 990 932 9,951%Perfil 3 1041 881 0,015%Perfil 4 941 981 82,860%Perfil 5 988 934 11,605%
População•População = Conjunto de todas as Unidades cujas características desejam-se conhecer.
•{u1, u2,..., uM}
Parâmetro•Parâmetro = Conjunto de
todas as características de interesse associadas as unidades populacionais.
•{v1,v2,...,vM}• De interesse: V= v1+v2+..+vM
Notação• Considerem-se 3 possibili-dades
para os vi´s. •vi=(1,0,0) se i vota em Lula.•vi=(0,1,0) se i vota em Alkimim.•vi=(0,0,1) se i vota em outros.• O interesse: V= v1+v2+..+vM=
(L,A,O) : L (A) [O]= Total de votos de Lula (Alkimim) [outros].
Amostra•Amostra = Conjunto de to-
das de unidades populacio-nais onde os valores de v foram obtidos
•{(Ii,Iivi): i=1,...,N}•Ii=1 (0) se i (não) está na
amostra.
Estatística•Tamanho da Amostra = n = I1+I2+...+IN.
•Total amostral T=I1v1 +...+INvN
•Média amostral = T/n = m, o vetor de proporções amostrais.
Planejamento amostral•Distribuição amostral = P{I1,I2,...,IN}.
•Seja pi = Pr{Ii=1} = E{Ii}•Assim, E{T} = p1v1 +...+pNvN •Se pi = c então, E{T}=cV; isto é
T/c é uma estimativa não viciada de V.
A crítica•A distribuição de seleção, a
distribuição do vetor I’ =
(I1,I2,...,IN) independe do valor do parâmetor de interesse V. A amostragem completamente casual de n elementos produz P{I’}=n/N
A alternativa•(v1,v2,...,vM) parâmetro•(u1,u2,...,uM) rótulo•{(ui,vi): i=1,...,N} que tem a mesma distribuição de {(uk,vi): k,i=1,...,N}
Conseqüência • Existe um parâmetro 0< P =
(pL,pA,pO)<1 com pL+pA+pO=1 tal que qualquer que seja a unidade i, conhecido o valor de P, as variáveis v, sendo iid teriam a seguinte distribuição:
•Pr{vi=(1,0,0)|P} = pL;•Pr{vi=(0,1,0)|P} = pA;•Pr{vi=(0,0,1)|P} = pO;
Modelo alternativo• Como temos permutabilidade,
podemos considerar as primeiras n unidades como nossa amostra e escrever o total amostral como X = v1+v2+...+vn = (l,a,o).
• A verossimilhança é simplesmente
Lik(P|X) PX.
Exemplo 1
•Consideremos o caso onde X=(60,45,45) a função de verossimilhan-ça neste caso seria
•Lik(P|X) (pL)60(pA)45(pO)45
Modelo marginal•Na comparação dos dois
candidatos, teríamos que:•pLA= pL/(pL+pA) ~ B(61,46) (0,57) o que implica que a probabilidade que Lula ganhe de Alkimim é 93%
•[0,4765;0,6625] IC 95%
0
0,05
0,4 0,5 0,6 0,7 0,8
3 extratos•Estado 1 - X1=(90,90,120)•Estado 2 - X2=(100,54,46)•Estado 3 - X3=(60,45,45)
•Pais – X = 0,5X1+0,3X2+0,2X3
LEGENDA DAS FIGURAS
cidade 1: amostra n = 300. Tem 50% da população do país.cidade 2: n = 200. Tem 30% pop do paíscidade 3: n = 150. Tem 20% do país.
X1 ou p1 é LulaX2 ou p2 é AlckiminX0 ou p0 = 1-p1-p2 é outros
exemplo 1:X1 = (X11, X21, X01) = (132, 81, 87)X2 = (X12, X22, X02) = (40, 120, 40)X3 = (X13, X23, X03) = (60, 45, 45)Z = 0.5*p|X1 + 0.3*p|X2 + 0.2*p|X3
F01 - densidade de Z em p1 e p2 e região de 95% de credibilidadeF02 - ampliacao de f01 na região de interesse.F03 - somente p|X1 cidade 1 separada e regiao 95% credibilidade
F01
F02
F03
exemplo 2:
X1 = (90, 90, 120)
X2 = (100, 54, 46)
X3 = (60, 45, 45)
F09 - densidade z de p1 e p2 e regiao 95%
F10 - idem F09 ampliada
F11, F13 e F15 - p|x1, p|X2 e p|X3
F12, F14, F16, F17 são ampliações
F09
F10
F11
F12
F13
F14
F15
F16
F17
Região1 Região2 Região3 prop abs prop abs prop abs Lula p1 0,35 40 0,27 35 0,29 20 Alck p2 0,30 35 0,40 53 0,29 20 Outros 0,35 40 0,33 44 0,43 30 Total 1,00 115 1,00 132 1,00 70
EXEMPLO
Região Proporção Região1 0,20 Região2 0,50 Região3 0,30
Gráficos – Região 1 Dirichlet(41,36,41)
Curvas de nível
Região de Credibilidade
Marginal de p1 Beta(41,77) I.C. = (0.262 ; 0.434)
0.0 0.2 0.4 0.6 0.8 1.0
02
46
8
p1
Marginal de p2 Beta(36,82) I.C. = (0.224 ; 0.389)
0.0 0.2 0.4 0.6 0.8 1.0
02
46
8
p2
Gráficos – Região 2 Dirichlet(36,54,45)
Curvas de nível
Região de Credibilidade
Marginal de p1 Beta(36,99) I.C. = (0.194 ; 0.342)
0.0 0.2 0.4 0.6 0.8 1.0
02
46
810
p1
Marginal de p2 Beta(54,81) I.C. = (0.318 ; 0.483)
0.0 0.2 0.4 0.6 0.8 1.0
02
46
8
p2
Gráficos – Região 3 Dirichlet(21,21,31)
Curvas de nível
Região de credibilidade
Marginal de p1 Beta(21,52) I.C. = (0.187 ; 0.393)
0.0 0.2 0.4 0.6 0.8 1.0
02
46
p1
Marginal de p1 Beta(21,52) I.C. = (0.187 ; 0.393)
0.0 0.2 0.4 0.6 0.8 1.0
02
46
p2
Gráficos Geral 0,2*Dirichlet(41,36,41) + 0.5*Dirichlet(36,54,45) + 0.3* Dirichlet(21,21,31)
Curvas de nível
Região de credibilidade
Marginal de p1 0.2*Beta(41,77) + 0.5*Beta(36,99) + 0.3*Beta(21,52) (*) I.C. = (0.193 ; 0.399)
0.0 0.2 0.4 0.6 0.8 1.0
02
46
8
p1
(*) esta parte não sei se está certa
Marginal de p2 0.2*Beta(36,82) + 0.5*Beta(54,81) + 0.3*Beta(21,52) I.C. = (0.215 ; 0.471)
0.0 0.2 0.4 0.6 0.8 1.0
01
23
45
p1