o valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · o valor-p do teste dos sinais ana marta...

101
O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática e Aplicações Orientadora: Professora Doutora Isabel Maria Alves Rodrigues Júri de examinação Presidente: Professor Doutor António Manuel Pacheco Pires Orientadora: Professora Doutora Isabel Maria Alves Rodrigues Vogal: Professora Doutora Maria da Conceição Esperança Amado Dezembro 2015

Upload: hathu

Post on 20-Sep-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

O valor-p do teste dos sinais

Ana Marta Lisboa Vila Fernandes

Dissertação para obtenção do Grau de Mestre em

Matemática e Aplicações

Orientadora: Professora Doutora Isabel Maria Alves Rodrigues

Júri de examinação

Presidente: Professor Doutor António Manuel Pacheco PiresOrientadora: Professora Doutora Isabel Maria Alves RodriguesVogal: Professora Doutora Maria da Conceição Esperança Amado

Dezembro 2015

Page 2: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

ii

Page 3: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Para os meus pais, Ana e Joao.

iii

Page 4: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Agradecimentos

Durante estes 5 anos, foi um desafio constante superar todos os obstaculos com que me deparei no

Instituto Superior Tenico. No entanto aqui estou eu, na reta final desta fase da minha vida. E um

privilegio pertencer a esta casa. Obrigada a todos os Lmaquianos ( professores e colegas) que de uma

forma ou de outra me ajudaram a chegar aqui.

Agradeco de coracao a professora Isabel Rodrigues pelo seu apoio, disponibilidade e dedicacao, foi

um prazer trabalhar consigo.

Quero tambem agradecer a minha famılia por ter acreditado em mim e me ter dado forca em todas

as vezes que eu disse que nao ia conseguir. Em particular, quero agradecer a minha mae e aos meus

avos que sao o meu porto de abrigo. Um obrigada ao meu irmao Joao pela paciencia e pela ajuda que

me deu na realizacao desta tese. Por fim, quero agradecer aos meu amigos e prometo que a partir de

hoje nao falto a mais nenhuma festa.

Eu consegui!

iv

Page 5: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Abstract

The sign test is a non-parametrical statistical procedure used to evaluate hypothesis about the q-th

continuous population quantile. Denoted χq, with 0 < q < 1, the q-th continuous population quantile, on

the two-sided sign test the null hypotesis states H0 : χq = χ0 while in the alternative H1 : χq 6= χ0. The

test procedure is based on the sign differences between the sample observations and χ0. Considering

the statistic Sn that accounts the frequency of the sign (+) on the sample of n observations, it is clear

that Sn ∼ Bin(n, p) with p = 1 − q. When the observed value of the statistic sn is not close to [np],

the sample favours to the alternative hypothesis. A decision rule can be conducted based on the p-

value. Nevertheless, the commonly used p-value formula was originally applied on two-sided tests for

statistics with continuous distributions. In the case of discrete or continuous and asymmetric statistics,

the usual p-value formula can lead to incorrect values. For the two-sided sign test incoherent p-values

can be obtained under particular conditions of the binomial statistic. The main goal of this thesis is to

address in which situations the two-sided sign test p-values meaning is not clear. In order to solve this

problem, there are some alternatives proposed in the literature and their advantages and disadvantages

were analyzed. Also, a new p-value formula was introduced and its efficiency was compared with the

alternative methods for the two-sided sign test.

Keywords: Binomial Distribution, P-value methods, Power of the Sign Test, Two-sided Sign

Test.

v

Page 6: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Resumo

O teste dos sinais e um procedimento estatıstico nao parametrico que e utilizado para avaliar hipoteses

sobre o quantil, χq com 0 < q < 1, da populacao em estudo. No caso do teste bilateral, com o confronto

da hipoteseH0 : χq = χ0 versus a alternativaH1 : χq 6= χ0, o teste e conduzido com base nos sinais das

diferencas entre as observacoes amostrais e o valor χ0. Considerando a estatıstica Sn que contabiliza

a frequencia do sinal (+) na amostra de n observacoes, tem-se que Sn ∼ Bin(n, p) com p = 1 − q.

Sempre que o valor observado sn nao e proximo de [np], ha evidencia na amostra a favor da hipotese

alternativa H1. A decisao final pode ser tomada com base no valor-p do teste. Contudo, originalmente

a formula usual de calculo do valor-p foi utilizada em testes bilaterais com estatısticas contınuas. Para

estatısticas discretas ou contınuas assimetricas pode obter-se valores-p inadmissıveis. No teste dos

sinais bilateral, a ocorrencia de valores-p incoerentes apenas e registada em condicoes particulares da

estatıstica binomial. Assim, e objetivo desta tese investigar em que situacoes se podem obter valores-p

inadmissıveis. Para contornar este problema, foram apresentadas as alternativas existentes na literatura

e analisadas as suas vantagens e desvantagens. Alem disso, foi introduzida uma nova formula de

calculo do valor-p para testes bilaterais. A eficacia desta proposta foi confrontada com as alternativas

existentes no teste dos sinais bilateral.

Palavras-chave: Distribuicao binomial, Metodos de calculo do valor-p, Potencia, Teste dos

sinais bilateral.

vi

Page 7: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Conteudo

Agradecimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv

Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v

Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi

Lista de Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x

Lista de Figuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xii

1 Introducao 1

1.1 Motivacao e objetivo da tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 Estrutura da tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 O Valor-p 7

2.1 O Valor-p por Ronald Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 O valor-p na abordagem Neyman-Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.3 Comparacao entre as duas abordagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3 Distribuicao Binomial e o Teste dos Sinais 11

3.1 Distribuicao Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.1.1 Funcao de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.1.2 Funcao de Distribuicao Cumulativa . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3.1.3 Valor Esperado, Variancia, Moda e Mediana . . . . . . . . . . . . . . . . . . . . . . 12

3.2 Teste dos Sinais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.2.1 Hipoteses em teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.2.2 Estatıstica do Teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.2.3 Regiao de Rejeicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.2.4 Potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

4 Valor-p do teste dos sinais bilateral 19

4.1 Teste a Mediana de X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

4.2 Teste ao quantil q de X com q 6= 12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

4.2.1 Teste ao 1oquartil de X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

4.2.2 Teste ao 3oquartil de X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

4.2.3 Teste ao quantil (1− 1m ) de X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

vii

Page 8: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

5 Alternativas de calculo do valor-p 29

5.1 Revisao Bibliografica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

5.2 Metodo de Colocacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

5.3 Metodo do Princıpio da Verossimilhanca Mınima . . . . . . . . . . . . . . . . . . . . . . . 31

5.4 Metodo Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

5.5 Nova Proposta - Metodo da Distancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

5.6 Comparacao e analise dos metodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

6 Estudo de Simulacao 47

6.1 Simulacao do valor-p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

6.1.1 Resultados para uma distribuicao simetrica . . . . . . . . . . . . . . . . . . . . . . 48

6.1.2 Resultados para um distribuicao assimetrica . . . . . . . . . . . . . . . . . . . . . 51

6.1.3 Resultados para uma distribuicao F1−IU[i]≤0.9(F ) . . . . . . . . . . . . . . . . . . . 54

6.2 Simulacao da potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

6.3 Interpretacao dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

6.3.1 Simulacao do valor-p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

6.3.2 Simulacao da potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

7 Conclusoes 75

7.1 Resultados mais relevantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

7.2 Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

Bibliografia 76

A Apendices: Programas 80

A.1 Programas dos metodos de calculo do valor-p do Capıtulo 5 . . . . . . . . . . . . . . . . 80

A.1.1 Metodo USUAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

A.1.2 Metodo COL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

A.1.3 Metodo PVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

A.1.4 Programas auxiliares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

A.1.5 Metodo COND . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

A.1.6 Metodo DIST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

A.1.7 Comparacao dos metodos de calculo do valor-p (Tabelas 5.4 a 5.9) . . . . . . . . 83

A.2 Programas do estudo de simulacao do Capıtulo 6 . . . . . . . . . . . . . . . . . . . . . . 84

A.2.1 Simulacao do valor-p com amostras da distribuicao F = N(0, 1) . . . . . . . . . . 84

A.2.2 Simulacao do valor-p com amostras da distribuicao F = Gama(3, 0.1) . . . . . . . 85

A.2.3 Simulacao do valor-p com amostras da distribuicao F1−IU[i]≤0.9(F ) . . . . . . . . . 86

A.2.4 Programas auxiliares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

A.2.5 Simulacao da potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

viii

Page 9: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Lista de Tabelas

1.1 Tabela de erros do tipo I e tipo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

5.1 Funcao de probabilidade da estatıstica S10 ∼ Bin(10, 0.6). . . . . . . . . . . . . . . . . . 31

5.2 Funcao de probabilidade de S6 ∼ Bin(6, p), com p = 0.1, 0.25, 0.5, 0.75 e 0.9. . . . . . . . 35

5.3 Funcao de probabilidade de S7 ∼ Bin(7, p), com p = 0.1, 0.25, 0.5, 0.75 e 0.9. . . . . . . . 35

5.4 Valores-p da estatıstica S6 ∼ Bin(6, p) do teste H0 : χq = χ0 vs H1 : χq 6= χ0 obtidos

pelos metodos USUAL, COL, PVM, COND e DIST. . . . . . . . . . . . . . . . . . . . . . . . . . 37

5.5 Valores-p da estatıstica S7 ∼ Bin(7, p) do teste H0 : χq = χ0 vs H1 : χq 6= χ0 obtidos

pelos metodos USUAL, COL, PVM, COND e DIST. . . . . . . . . . . . . . . . . . . . . . . . . . 38

5.6 Valores-p da estatıstica S10 ∼ Bin(10, p) do teste H0 : χq = χ0 vs H1 : χq 6= χ0 obtidos

pelos metodos USUAL, COL, PVM, COND e DIST. . . . . . . . . . . . . . . . . . . . . . . . . . 39

5.7 Valores-p da estatıstica S11 ∼ Bin(11, p) do teste H0 : χq = χ0 vs H1 : χq 6= χ0 obtidos

pelos metodos USUAL, COL, PVM, COND e DIST. . . . . . . . . . . . . . . . . . . . . . . . . . 40

5.8 Valores-p da estatıstica S20 ∼ Bin(20, p) do teste H0 : χq = χ0 vs H1 : χq 6= χ0 obtidos

pelos metodos USUAL, COL, PVM, COND e DIST. . . . . . . . . . . . . . . . . . . . . . . . . . 41

5.9 Valores-p da estatıstica S21 ∼ Bin(21, p) do teste H0 : χq = χ0 vs H1 : χq 6= χ0 obtidos

pelos metodos USUAL, COL, PVM, COND e DIST. . . . . . . . . . . . . . . . . . . . . . . . . . 42

6.1 Numero de amostras de dados simulados da distribuicaoN(0, 1) que satisfazem valor-p >

1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.1. . . . . . . . . . . . 48

6.2 Numero de amostras de dados simulados da distribuicaoN(0, 1) que satisfazem valor-p >

1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.25. . . . . . . . . . . 49

6.3 Numero de amostras de dados simulados da distribuicaoN(0, 1) que satisfazem valor-p >

1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.5. . . . . . . . . . . . 49

6.4 Numero de amostras de dados simulados da distribuicaoN(0, 1) que satisfazem valor-p >

1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.75. . . . . . . . . . . 50

6.5 Numero de amostras de dados simulados da distribuicaoN(0, 1) que satisfazem valor-p >

1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.9. . . . . . . . . . . . 50

6.6 Numero de amostras de dados simulados da distribuicao Gama(3, 0.1) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.1. . . . . . 51

ix

Page 10: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

6.7 Numero de amostras de dados simulados da distribuicao Gama(3, 0.1) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.25. . . . . 52

6.8 Numero de amostras de dados simulados da distribuicao Gama(3, 0.1) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.5. . . . . . 52

6.9 Numero de amostras de dados simulados da distribuicao Gama(3, 0.1) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.75. . . . . 53

6.10 Numero de amostras de dados simulados da distribuicao Gama(3, 0.1) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.9. . . . . . 53

6.11 Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.1 da

distribuicao F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

6.12 Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.25 da

distribuicao F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

6.13 Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.5 da

distribuicao F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

6.14 Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.75 da

distribuicao F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

6.15 Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.9 da

distribuicao F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

6.16 Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.1 da

distribuicao F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

6.17 Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.25 da

distribuicao F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

6.18 Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.5 da

distribuicao F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

6.19 Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.75 da

distribuicao F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

6.20 Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.9 da

distribuicao F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

x

Page 11: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Lista de Figuras

4.1 Grafico da funcao de probabilidade de S6 ∼ Bin(6, 12 ) . . . . . . . . . . . . . . . . . . . . 20

4.2 Grafico da funcao de probabilidade de S7 ∼ Bin(7, 12 ) . . . . . . . . . . . . . . . . . . . . 20

4.3 Graficos da funcao de probabilidade de distribuicoes assimetricas a direita . . . . . . . . 22

4.4 Graficos da funcao de probabilidade de distribuicoes assimetricas a esquerda. . . . . . . 24

4.5 Graficos da funcao de probabilidade de distribuicoes assimetricas a esquerda - Sn ∼

Bin(n, 1m ), com n = 14 e 15 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

5.1 Grafico da funcao de probabilidade de S10 ∼ Bin(10, 0.6). . . . . . . . . . . . . . . . . . . 31

5.2 Grafico da funcao de probabilidade de S10 ∼ Bin(10, 0.6) ilustrativo do metodo da distancia. 34

5.3 Graficos das funcoes de probabilidade de S6 ∼ Bin(6, p) e S7 ∼ Bin(7, p), com p = 0.1 e

0.9. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

6.1 Grafico da funcao densidade de probabilidade de X ∼ Gama(3, 0.1) . . . . . . . . . . . . 51

6.2 Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste ao

quantil χ0.1 com H1 : χ0.1 = −1.2816 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3.

Amostras com dimensao n = 6, 7, 10 e 11. . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

6.3 Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste ao

quantil χ0.1 com H1 : χ0.1 = −1.2816 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3.

Amostras com dimensao n = 20, 21, 30 e 31. . . . . . . . . . . . . . . . . . . . . . . . . . . 63

6.4 Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste ao

quantil χ0.25 com H1 : χ0.25 = −0.6745 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3.

Amostras com dimensao n = 6, 7, 10 e 11. . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

6.5 Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste ao

quantil χ0.25 com H1 : χ0.25 = −0.6745 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3.

Amostras com dimensao n = 20, 21, 30 e 31. . . . . . . . . . . . . . . . . . . . . . . . . . . 65

6.6 Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste ao

quantil χ0.5 com H1 : χ0.5 = 0 + ∆i, para ∆i = 0.25, 0.5, 1.5, 2, 2.5 e 3. Amostras com

dimensao n = 6, 7, 10, 11, 20, 21, 30 e 31. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

6.7 Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste ao

quantil χ0.75 com H1 : χ0.75 = 0.6745 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3.

Amostras com dimensao n = 6, 7, 10 e 11. . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

xi

Page 12: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

6.8 Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste ao

quantil χ0.75 com H1 : χ0.75 = 0.6745 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3.

Amostras com dimensao n = 20, 21, 30 e 31. . . . . . . . . . . . . . . . . . . . . . . . . . . 68

6.9 Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste ao

quantil χ0.9 com H1 : χ0.9 = 1.2816 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3.

Amostras com dimensao n = 6, 7, 10 e 11. . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

6.10 Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste ao

quantil χ0.9 com H1 : χ0.9 = 1.2816 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3.

Amostras com dimensao n = 20, 21, 30 e 31. . . . . . . . . . . . . . . . . . . . . . . . . . . 70

xii

Page 13: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Capıtulo 1

Introducao

O teste estatıstico utilizado neste trabalho, o teste dos sinais, esta incluıdo na classe de testes nao pa-

rametricos ou de distribuicao livre. Este teste fornece uma alternativa bastante util para avaliar hipoteses

acerca de valores para os quantis, ou para a media, das distribuicoes. Os testes nao parametricos sao

caraterizados por serem menos exigentes nos pressupostos das populacoes em estudo do que a classe

dos testes intitulados de parametricos. No entanto, a designacao de testes nao parametricos ou de

distribuicao livre nao significa que sao totalmente livres de condicoes. As exigencias de aplicabilidade

destes testes sao apenas mais fracas do que as impostas nos testes parametricos, mas e tambem

necessario assumir-se, por exemplo, que a variavel aleatoria X em estudo tem natureza contınua. Sao

baseados em funcoes de uma amostra aleatoria de X, isto e em estatısticas, cujas distribuicoes nao

dependem da distribuicao da populacao de onde as amostras sao originarias. Tem ainda a vantagem

de serem bastante faceis de aplicar ja que envolvem calculos aritmeticos muito simples na obtencao da

estatıstica de teste, normalmente baseados em dados ordinais ou nominais. As estatısticas resultan-

tes sao muitas das vezes variaveis aleatorias discretas, que tomam valores num conjunto finito e cuja

distribuicao amostral exata pode ser facilmente obtida recorrendo a tecnicas de contagem. Este e o

caso da estatıstica do teste dos sinais que segue uma distribuicao discreta binomial.

Sempre que o objetivo e indicar o cenario mais plausıvel de uma colecao de conjeturas que en-

volvem incerteza acerca de parametros de distribuicoes, os testes de hipoteses sao os procedimentos

estatısticos usualmente aplicados. Os testes de hipoteses estabelecem duas hipoteses que configu-

ram uma particao do espaco parametrico Θ ou de um subespaco de interesse. Estas hipoteses sao

designadas por hipotese nula e por hipotese alternativa e denotam-se por H0 : θ ∈ Θ0 e H1 : θ ∈ Θ1,

respetivamente, onde Θ = Θ0∪Θ1 e Θ0∩Θ1 = ∅, com Θ0 6= ∅ e Θ1 6= ∅, com θ univariado. Mais concre-

tamente, considerando uma amostra aleatoria (X1, . . . , Xn) da populacao X com funcao de distribuicao

na famılia FX(x; θ) e θ ∈ Θ ⊂ R, um teste de hipoteses e uma regra baseada em (X1, . . . , Xn) que

permite decidir a favor ou contra H0. A regiao R de rejeicao ou crıtica de um teste e o conjunto de

pontos de (X1, . . . , Xn) que leva a decisao de rejeitar H0. Admite-se que existe uma particao de Rn

em duas regioes disjuntas Rn = R ∪Rc, onde Rc e designada a regiao de aceitacao do teste. Assim,

quando a concretizacao da amostra (x1, . . . , xn) ∈ R opta-se por rejeitar a hipotese H0 e no caso de

1

Page 14: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

(x1, . . . , xn) ∈ Rc decide-se nao rejeitar H0. Subjacente a decisao existem dois erros que se pode

cometer. Um destes erros e designado de erro do tipo I ou de 1a especie, e resulta de se rejeitar H0

quando H0 e verdadeira. Outro erro, referido por erro tipo II ou de 2a especie, ocorre quando nao se

rejeita H0 e H0 e falsa. A tabela seguinte descreve estas situacoes.

Situacao RealDecisao H0 verdadeira H0 falsaRejeitar H0 Erro do tipo I Sem erroNao rejeitar H0 Sem erro Erro do tipo II

Tabela 1.1: Tabela de erros do tipo I e tipo II

A probabilidade de cometer o erro do tipo I e P [(X1, . . . , Xn) ∈ R|Θ0] = α(θ), enquanto que a

P [Erro do tipo II] = P [(X1, . . . , Xn) ∈ Rc|Θ1] = β(θ). E habitual estabelecer um limite superior para

a probabilidade de ocorrencia de erro do tipo I. Este limite e usualmente designado de nıvel de sig-

nificancia do teste e representado doravante por α, sendo o valor do supremo da probabilidade de

cometer o erro do tipo I. Em muitas aplicacoes estatısticas, o nıvel de significancia e tradicionalmente fi-

xado em 0.05, isto porque nao se quer correr um risco muito grande de incorretamente indicar a hipotese

alternativa como verdadeira. Em alternativa a este procedimento pode calcular-se o valor-p do teste,

ou seja o menor valor de α que conduz a rejeicao da hipotese H0.

E frequente na analise estatıstica questionarmos se a media, µ, de uma populacao X contınua e

igual a um valor µ0. No caso de a distribuicao de X ser tambem simetrica, o ponto µ0 coincide com

a mediana da distribuicao de X. Note-se que, quando uma distribuicao e simetrica existe um valor x0

onde a funcao densidade de probabilidade de X, fX(x), verifica fX(x0 − δ) = fX(x0 + δ),∀δ ∈ R. Um

procedimento estatıstico disponıvel para responder a questao anterior e o teste dos sinais. No entanto,

se X pertencer a uma famılia de distribuicoes mais restrita, a famılia normal, o teste parametrico teste-t

e outra alternativa. Nestas condicoes, qual e o teste mais eficiente, o teste dos sinais ou o teste-t?

Utilizando o conceito de eficiencia relativa assintotica, EF , introduzido por Pitman (1948) e possıvel

comparar o desempenho de dois testes. Efetivamente, no contexto de dados oriundo da distribuicao

normal o teste dos sinais e menos eficiente do que o teste-t. No entanto, para amostras originarias de

distribuicoes com caudas mais pesadas que as da distribuicao normal, como por exemplo a distribuicao

exponencial dupla, o teste dos sinais resulta duas vezes mais eficiente do que o teste-t. Por outras

palavras, nestas situacoes o resultado do teste dos sinais desenvolvido com uma amostra de dimensao

n e tao eficiente quanto o teste-t aplicado a uma amostra de dimensao 2n. Gibbons e Chakraborti

(2004), apresentaram no Capıtulo 13 uma discussao alargada sobre esta questao. Quando a analise

estatıstica e referente a outro quantil da populacao X, diferente da mediana de X, o teste dos sinais e

o procedimento estatıstico mais utilizado. Contudo, ocasionalmente com este teste pode obter-se um

valor-p superior a um.

2

Page 15: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

1.1 Motivacao e objetivo da tese

O grande impulso para a realizacao desta tese foi o facto da utilizacao frequente da formula de calculo

do valor-p do teste dos sinais bilateral poder devolver probabilidades superiores a um. Por esta ocorrencia

so ser registada em condicoes particulares, que dependem de a estatıstica binomial ter ou nao distribuicao

simetrica e da sua concretizacao para a amostra, muitas vezes e ignorada ou ate passa despercebida

aos olhos de quem utiliza este teste. Mais concretamente, tratando-se de testes bilaterais, isto e,

quando se confronta em H0 uma hipotese simples com o seu complementar em H1, e pratica usual

atribuir-se ao valor-p o dobro da probabilidade da cauda com probabilidade mınima tomando como re-

ferencia o valor observado da estatıstica. Problemas podem surgir porque a distribuicao da estatıstica

de teste e discreta e existem probabilidades que nao sao atingıveis. No caso contınuo, todos os pontos

da reta real na distribuicao assumida tem uma probabilidade associada que pode sempre ser obtida.

No caso de dados discretos o cenario e diferente. Isto pode ser constatado considerando n e m = n+ 1

dois pontos consecutivos pertencentes a estatıstica de teste, com pn e pm as probabilidades associ-

ada a cada um dos pontos, respetivamente, tal que pn 6= pm. Neste caso como nao existem pontos

intermedios entre n e m, a probabilidade p, tal que pn < p < pm, nunca e atingıvel. Isto causa dificul-

dades para testes de hipoteses em que, em particular, fixando um nıvel de significancia (por exemplo a

5%) este valor pode nao ser atingıvel.

Para ilustrar a ocorrencia de um valor-p superior a um, tome-se o caso concreto da variavel aleatoria

X ∼ N(10, 2). Com o auxılio do pacote estatıstico R (R Core Team, 2014), geraram-se 6 observacoes

desta distribuicao que conduziram a amostra:

(8.206171, 10.369698, 13.175691, 7.739249, 9.839496, 10.264841).

Admita-se que o objetivo e avaliar se a mediana da distribuicao de onde os dados sao originarios e

igual a 10, isto e:

H0 : χ 12

= 10 versus H1 : χ 126= 10.

Como se apresentara no Capıtulo 3, a estatıstica do teste dos sinais e S6 ∼ Bin(6, 12 ) e e concreti-

zada com esta amostra no valor s6 = 3. Recorrendo a formula usual de calculo do valor-p obtem-se:

valor-p = 2×min{P (S6 ≤ 3), P (S6 ≥ 3)} = 2× 0.6563 = 1.3125 > 1,

ilustrando o problema acima referido.

Para colmatar este problema, foram propostas algumas alternativas na literatura mas que sao pouco

utilizadas por nao fazerem muito sentido. Uma delas consiste em definir o valor-p dos testes bilaterais

da seguinte forma:

valor-p = 2×min{P (Sn < sn), P (Sn > sn)},

que e simplesmente remover um ponto da regiao de rejeicao. Este procedimento e um pouco insensato

uma vez que o ponto removido e o valor observado da estatıstica, o qual nunca e contabilizado no

3

Page 16: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

calculo do valor-p.

Outra alternativa e considerar,

valor-p = 2×min{P (Sn<sn)+P (Sn≤sn)2 , P (Sn>sn)+P (Sn≥sn)

2 },

que apresenta exatamente o mesmo problema, pois P (Sn<sn)+P (Sn≤sn)2 e P (Sn>sn)+P (Sn≥sn)

2 sao pro-

babilidades intermedias entre as probabilidades dos pontos sn−1 e sn ou sn e sn+1 que nao atingem

o valor da probabilidade no ponto sn. No entanto, estes procedimentos garantem que o valor-p nunca

seja superior a um.

Outra forma de garantir que o valor-p nao ultrapasse o valor um e simplesmente definir:

valor-p = 2×min{P (Sn ≤ sn), P (Sn ≥ sn), 0.5}.

Assim, o objetivo desta tese e alertar para as situacoes que produzem valores-p superiores a um

no teste dos sinais bilateral. Alem disso, e tambem introduzida uma nova alternativa para o calculo do

valor-p, a qual conduziu a resultados bastante satisfatorios face as alternativas existentes na literatura.

1.2 Estrutura da tese

Esta tese esta dividida em 7 capıtulos, sendo que o atual capıtulo serve de introducao ao tema em

questao.

O Capıtulo 2 e dedicado apenas ao valor-p, a sua definicao e as ideologias de cada um dos es-

tatısticos Ronald Fisher e Neyman-Pearson sobre a forma como esta probabilidade deve ser analisada

e interpretada. E tambem realizada uma pequena comparacao destas duas abordagens.

No Capıtulo 3 e feita uma revisao da distribuicao binomial e de algumas das suas propriedades.

Alem disso, e descrita a metodologia do teste dos sinais: hipoteses em teste, estatıstica do teste que

segue uma distribuicao binomial, e a regiao de rejeicao tanto no caso unilateral como no caso bilateral.

No entanto, o nosso estudo e focado no caso bilateral porque e esta situacao que pode produzir valores-

p superiores a um.

A analise do valor-p para o teste dos sinais bilateral considerando uma amostra concreta (x1, . . . , xn)

da distribuicao X e feita no Capıtulo 4. Sao realizados testes a varios quantis de X, nomeadamente a

mediana e aos quartis de X para averiguar os casos em que o valor-p produz conclusoes incoerentes.

A analise e feita tendo em conta o valor e as propriedades do valor-p.

No Capıtulo 5 sao descritas algumas alternativas de calculo do valor-p, nomeadamente o metodo

de colocacao, o metodo do princıpio da verossimilhanca mınima e o metodo condicional. Alem destes

metodos, e ainda feita a proposta de um novo metodo que foi apelidado de metodo da distancia. Este

novo metodo tem como principal objetivo devolver valores-p que sejam coerentes com a hipotese nula

e que nao resultem superiores a um. Na ultima secao deste capıtulo e realizada uma comparacao de

todos os metodos anteriormente referidos, de forma a encontrar alguma analogia entre eles. Para tal,

foram construıdas tabelas com os varios valores-p dos testes conduzidos com as estatısticas binomiais

Sn, para alguns valores de n e de p.

4

Page 17: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Com recurso aos metodos estudados anteriormente, e feito um estudo de simulacao do valor-p que

e apresentado no Capıtulo 6. O objetivo e analisar em que metodos existe uma diferenca significativa

no numero de amostras que satisfazem as condicoes impostas sobre o valor-p e que podem conduzir

a alteracao de decisao do teste dos sinais. Para isso, fixaram-se nıveis de significancia, α, nos valores

habituais de 0.01, 0.05, 0.1, e contabilizou-se com os varios metodos de calculo do valor-p a frequencia

do acontecimento valor-p ≤ α em 10000 amostras geradas da populacao X. Este estudo tambem

permitiu identificar quais os metodos que devolvem valores-p superiores a um, analisando a frequencia

do acontecimento valor-p > 1. A simulacao foi conduzida com amostras geradas de distribuicoes

contınuas simetricas e assimetricas e ainda com amostras da misturas de duas distribuicoes. Neste

capıtulo e tambem apresentado um estudo de simulacao da potencia do teste dos sinais aplicado a

amostras com dados gerados da distribuicao normal reduzida. O objetivo e determinar quais sao os

metodos de calculo do valor-p que conduzem a uma maior potencia do teste dos sinais.

Finalmente, no Capıtulo 7 sao apresentadas as conclusoes deste trabalho assim como algumas

propostas de trabalho futuro.

5

Page 18: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

6

Page 19: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Capıtulo 2

O Valor-p

Este capıtulo e reservado a nocao de valor-p, que como foi referido no Capıtulo1 e uma peca funda-

mental do trabalho desenvolvido neste projeto.

Sob a validade da hipotese nula H0, o valor-p e a probabilidade de observar um resultado igual ou

mais extremo do que o valor observado pela estatıstica de teste.

Para calcular um valor-p e necessario conhecer-se pelo menos as tres condicoes: hipotese nula em

teste, o modelo de probabilidade da estatıstica e uma ordenacao possıvel dos dados, de modo que

aqueles que forem superiores ao χ0, sob a validade de H0, possam ser identificados. Esta ordenacao e

convenientemente organizada em termos de uma estatıstica de teste. Normalmente como os valores-p

sao um conceito frequencista, o espaco amostral e definido em termos dos resultados possıveis que

podem ocorrer a partir de uma repeticao infinita da experiencia aleatoria.

2.1 O Valor-p por Ronald Fisher

O estatıstico Ronald Fisher (1920) foi o primeiro a descrever formalmente o valor-p, bem como os

meios para calcula-lo. No contexto da inferencia classica, a abordagem de Fisher foca-se apenas numa

hipotese e como conclusoes possıveis dispoem-se apenas a rejeicao da hipotese especificada ou a

falta de evidencias para tal, ou seja, trabalha-se com um raciocınio indutivo que independentemente

da quantidade de evidencias a favor da hipotese testada, esta nunca e aceite. Segundo Fisher (1935),

“Every experiment may be said to exist only in order to give the facts a chance of disproving the null

hypothesis”.

Nesta abordagem trata-se apenas de uma hipotese que e comumente denominada hipotese nula,

H0, e procura-se especificar tal hipotese de modo que represente o pior caso possıvel.

O valor-p deve ser interpretado como uma medida de evidencia, tal que os testes estatısticos servem

para confrontar a hipotese nula com as observacoes da amostra e, para Fisher, um valor-p indica a

forca da evidencia contra H0. Em termos praticos, tem-se que valores “pequenos” do valor-p indicam

discordancia entre o modelo especificado e os dados, ou seja, pode-se rejeitar a hipotese nula visto ser

improvavel a sua veracidade. Formalmente rejeita-se a hipotese H0 sempre que valor-p ≤ α, com α

7

Page 20: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

pre-fixado pelo analista conforme o argumento de Fisher (1956): “In choosing the grounds upon which

a general hypothesis should be rejected, personal judgement may and should properly be exercised”.

Se um limite de significancia, α, for estabelecido, deve ser flexıvel e deve depender do conhecimento

do problema em questao. Se o resultado e significante entao rejeita-se H0, se o resultado e nao

significante, nenhuma conclusao pode ser estabelecida. O uso de um nıvel de significancia como uma

base para a rejeicao da hipotese nula foi chamado teste de significancia.

A definicao do valor-p segundo Fisher e semelhante a usada atualmente, mas as nocoes de como

deve ser utilizado e interpretado sao um pouco diferentes: em primeiro lugar, e uma medida de evidencias

num unico experimento, utilizado para refletir a credibilidade da hipotese nula a luz dos dados. Em se-

gundo lugar, como uma medida de evidencia, o valor-p deve ser combinado com outras fontes de

informacao do fenomeno em estudo. Resumindo, Fisher definiu o valor-p como um ındice que mede

a forca da evidencia contra a hipotese nula. Defendeu ainda que um valor-p ≤ 0.05 (0.05 × 100% de

significancia) e um nıvel padrao que permite concluir que existe evidencias contra a hipotese testada,

embora nao sendo uma regra absoluta.

Apesar do valor-p ser um instrumento coerente e amplamente utilizado, esta medida possui algumas

caracterısticas indesejaveis, como por exemplo:

• Depende do tamanho da amostra, assim como a sua interpretacao depende da verossimilhanca

assumida;

• Em testes parametricos, a rejeicao de uma hipotese e apenas um indicador de que ha algo de

errado com o modelo utilizado. A origem do problema nao e especificada, esta pode dever-se, por

exemplo, a distribuicao assumida, ou a ausencia de independencia ou de homocedasticidade;

• A falta de coerencia entre a rejeicao de uma hipotese e os seus subconjuntos, uma vez que nao

se trata de uma medida de avaliacao do espaco parametrico mas apenas do subespaco definido

pela hipotese testada.

2.2 O valor-p na abordagem Neyman-Pearson

Os estatısticos Jerzy Neyman e Egon Pearson (Neyman-Pearson) desenvolveram uma estrutura teorica

alternativa. Em 1928, publicaram um documento de referencia sobre o fundamento teorico para um

processo que chamaram de teste de hipoteses. Introduziram a ideia de hipotese alternativa e o erro

do tipo II que lhe e associado. O raciocınio dos autores e desenvolvido considerando a aceitacao

ou rejeicao das hipoteses envolvidas, a partir de um nıvel de significancia pre-especificado. Nesta

abordagem, a taxa de erro deve ser definida antes da recolha de dados, definindo como α a taxa de

erro do tipo I e β a taxa de erro do tipo II.

O facto de se especificar o teste com enfase no valor do erro do tipo I esta relacionado com o

conceito de repetibilidade da amostra, sugerindo que se comete a inapropriada rejeicao de H0 em

α × 100% das decisoes, e por isso atribui-se valores pequenos a α. Adicionalmente, o resultado do

8

Page 21: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

procedimento nao sera uma inferencia numerica, mas sim um comportamento de aceitar ou rejeitar a

hipotese de referencia.

Quando os dados sao recolhidos e o valor-p e calculado uma das seguintes decisoes e tomada:

• Se o valor-p for menor ou igual a α, rejeita-se a hipotese nula em favor da hipotese alternativa,

• Se o valor-p for maior que α, rejeita-se a hipotese alternativa em favor da hipotese nula.

No entanto, um valor-p de 0.001 nao e considerado mais importante do que um valor-p de 0.049, em

ambos os casos a decisao e a mesma se α = 0.05.

Tal como na abordagem anterior existem tambem pontos controversos na analise de Neyman-Pearson,

como por exemplo:

• Adotar valores pre-especificados para o nıvel de significancia. Geralmente toma-se α×100% = 5%

e β × 100% = 20% sem qualquer crıtica quanto a natureza do evento ou modelo assumido, tendo

como unica justificativa a incidencia literaria;

• Dificuldade em especificar a distribuicao amostral, sendo conduta usual recorrer a distribuicoes

assintoticas.

2.3 Comparacao entre as duas abordagens

E interessante notar que estas duas abordagens nao sao concorrentes, uma vez que abordam o

problema segundo uma perspetiva diferente. Nas analises frequencistas usualmente realizam-se os

calculos e adoptam-se as propriedades da metodologia de Neyman-Pearson. A conclusao e dada se-

gundo a perspetiva de Fisher, nao aceitando a hipotese nula e tomando tal decisao de acordo com

a comparacao do nıvel de significancia pre-especificado e o valor-p obtido. E um procedimento con-

fuso uma vez que sao abordagens desenvolvidas segundo princıpios diferentes e visando respostas

distintas, e podem ate resultar em conclusoes antagonicas.

As principais diferencas identificadas nestas duas abordagens sao as hipoteses em teste e as taxas

de erro associadas. O estudo de Fisher concentra-se essencialmente no erro de tipo I, isto e, na proba-

bilidade de rejeitar a hipotese nula quando esta e, de facto, verdadeira. Neyman-Pearson adicionaram

a preocupacao de Fisher o erro do tipo II. Para estes estatısticos, a probabilidade de aceitar a hipotese

nula quando, na realidade, esta e falsa tambem deveria ser controlada.

9

Page 22: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

10

Page 23: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Capıtulo 3

Distribuicao Binomial e o Teste dos

Sinais

Neste capıtulo e feita a apresentacao do teste designado por teste dos sinais. A introducao deste proce-

dimento estatıstico nao parametrico, segundo Conover (1999) e Sprent (1989), surgiu no ano de 1710

no trabalho de John Arbuthnot. O objetivo de Arbuthnot (1710) foi comparar, usando dados recolhidos

em Londres ao longo de 82 anos, o numero de nascimentos do generos feminino com os do genero

masculino. Arbuthnot acreditava que havia uma forte evidencia na conjetura de que a probabilidade de

ser do genero feminino ou masculino nao era a mesma. Testou a sua conjetura com o teste dos sinais.

Este teste e conduzido com uma estatıstica bastante simples, a qual e discreta e com distribuicao

binomial. Daı que neste capıtulo tambem seja feita uma breve apresentacao desta distribuicao de

probabilidade. A distribuicao binomial e essencialmente caracterizada pelas condicoes que abaixo se

indicam.

3.1 Distribuicao Binomial

Definicao: A distribuicao binomial e a distribuicao de probabilidade discreta do numero de sucessos

numa sequencia de n provas (experiencias) de Bernoulli independentes. Cada prova resulta apenas

em duas possibilidades, sucesso ou insucesso, e a probabilidade de sucesso, p, e constante.

Considerando a variavel aleatoria S que indica o numero de tentativas que resultam em sucessos

entao, S segue uma distribuicao binomial com parametros n ≥ 1 e 0 ≤ p ≤ 1 que simbolicamente e

denotado como S ∼ Bin(n, p).

3.1.1 Funcao de Probabilidade

A probabilidade de ter exatamente k sucessos, para 0 ≤ k ≤ n, nas n provas de Bernoulli independentes

e dada pela funcao de probabilidade:

11

Page 24: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

P (S = k) =

(nk

)pk(1− p)n−k , k ∈ RS = {0, . . . , n} , 0 ≤ p ≤ 1 ,

0 , caso contario.(3.1)

3.1.2 Funcao de Distribuicao Cumulativa

O valor desta funcao num ponto x ∈ R, denotado por FS(x), esta tabelado para alguns valores de n e p

e corresponde a P (S ≤ x) =∑xk=0

(nk

)pk(1− p)n−k.

3.1.3 Valor Esperado, Variancia, Moda e Mediana

Proposicao: O valor esperado de S ∼ Bin(n, p) e dado por:

E[S] = np . (3.2)

Demonstracao:

E[S] =

n∑k=0

kP (S = k) =

n∑k=0

k(nk )pk(1− p)n−k =

n∑k=0

kn!

k!(n− k)!pk(1− p)n−k

=

n∑k=1

n!

(k − 1)!(n− k)!pk(1− p)n−k .

Seja y = k − 1 e m = n− 1. Substituindo k = y + 1 e n = m+ 1 no somatorio anterior, tem-se que:

E[S] =

m∑y=0

(m+ 1)!

y!(m− y)!py+1(1− p)m−y = (m+ 1)p

m∑y=0

m!

y!(m− y)!py(1− p)m−y .

Do teorema binomial resulta que, (a+b)m =∑my=0

m!y!(m−y)!a

ybm−y. Fazendo a = p e b = 1−p, obtem-se

m∑y=0

m!

y!(m− y)!py(1− p)m−y = (p+ 1− p)m = 1.

Assim, E[S] = (m+ 1)p = np.

Proposicao: A variancia de S ∼ Bin(n, p) e dada por:

V AR[S] = np(1− p) . (3.3)

Demonstracao: V AR[S] = E[S2]− E[S]2 = E[S[S − 1]] + E[S]− E[S]2

Utilizando o procedimento anterior, mas desta vez com a mudanca de variaveis y = k − 2 e m = n− 2,

12

Page 25: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

resulta que o segundo momento fatorial de S e:

E[S[S − 1]] =

n∑k=0

k(k − 1)P (S = k) =

n∑k=0

k(k − 1)(nk )pk(1− p)n−k

=

n∑k=0

k(k − 1)n!

k!(n− k)!pk(1− p)n−k

=

n∑k=2

n!

(k − 2)!(n− k)!pk(1− p)n−k

= n(n− 1)p2n∑k=2

(n− 2)!

(k − 2)!(n− k)!pk−2(1− p)n−k

= n(n− 1)p2m∑y=0

m!

y!(m− y)!py(1− p)m−y

= n(n− 1)p2(p+ 1− p)m = n(n− 1)p2 .

Logo, V AR[S] = n(n− 1)p2 + np− (np)2 = np(1− p).

Proposicao: A moda, µo, de S ∼ Bin(n, p) e dada pelo(s) inteiro(s) que satisfaz(em):

µo =

b(n+ 1)p)c se, (n+ 1)p e zero ou nao e inteiro,

(n+ 1)p e (n+ 1)p− 1 se, (n+ 1)p ∈ {1, . . . , n},

n se, p = 1 ,

(3.4)

onde b.c denota o chao do numero. Este parametro de localizacao de S e obtido atraves da condicao:

µo = argmaxk

P (S = k). Como e evidente em (3.4), dependendo dos valores de n e de p a distribuicao

de S pode ser unimodal ou bimodal. No caso de ser bimodal, isto e, µo = {k, k + 1} denota-se µ−o = k

e µ+o = k + 1, onde k = (n+ 1)p− 1.

Proposicao: A mediana ou quantil q = 1/2 de S ∼ Bin(n, p), denotada por χ 12

= w, e encontrada

pela expressao:1

2≤ FS(w) ≤ 1

2+ P (S = w) (3.5)

e pode nao ser unica.

Em geral nao ha uma formula simples de apresentar a mediana de S, uma vez que FS(x) nao e

uma funcao contınua. Apenas e possıvel indicar alguns resultados acerca deste parametro de S, como

por exemplo:

• Se E(S) = np e inteiro entao a mediana, a moda e a media de S sao iguais a np (Neumann, 1966

e Lord, 2010),

• A mediana de S pertence ao intervalo [bnpc, dnpe] (Kaas e Buhrman, 1980), onde d.e denota o teto

do numero,

• A mediana de S nao ocorre muito afastada da media: |w−np| ≤ min{ln 2,max{p, 1−p}} (Hamza,

1995),

13

Page 26: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

• A mediana de S e unica e igual a [np] quando p ≤ 1− ln 2 ou p ≥ ln 2 ou |w − np| ≤ min{p, 1− p},

exceto no caso de p = 1/2 e n ser um numero ımpar (Kaas e Buhrman, 1980 e Hamza, 1995),

• Quando p = 1/2 e n e ımpar, qualquer numero no intervalo [(n− 1)/2, (n + 1)/2] e a mediana de

S. Para o mesmo valor de p mas sendo n um numero par, a mediana de S e unica e igual a n/2.

Por ultimo, o quantil de ordem q de S, com q 6= 12 e 0 < q < 1, e denotado por χq e encontrado

substituindo em (3.5) o valor 1/2 por q. Assim, χq de S tem que satisfazer:

q ≤ FS(χq) ≤ q + P (S = χq) , (3.6)

e tambem, em geral, nao ha uma formula simples de ser representado.

3.2 Teste dos Sinais

O teste dos sinais e uma alternativa nao parametrica para avaliar hipoteses acerca dos parametros de

localizacao de distribuicoes. Vamos comecar por ver qual e a definicao de parametro de localizacao

de uma variavel aleatoria X. Para isso, considere-se que a funcao de distribuicao de X e denotada

como FX(x) ou, simplesmente F (x). No caso de X ser uma variavel aleatoria contınua, para eliminar

ambiguidades na escolha de parametros, e usual admitir-se que a funcao F (x) e estritamente crescente

no seu suporte.

Definicao: Seja T (F ) uma funcao definida no espaco das funcoes de distribuicao D com T um

funcional. O parametro θ = T (F ) diz-se de localizacao se satisfaz:

• Se G(x) ≤ H(x),∀x, entao T (G) ≥ T (H), G ∈ D e H ∈ D,

• T (FaX+b) = aT (FX) + b, a 6= 0, b ∈ R, com F ∈ D.

Nestas condicoes, θ = T (F ) e designado um parametro de localizacao de F .

Veja-se, por exemplo, o caso particular do parametro χq, quantil de ordem q da variavel aleatoria X

contınua, com 0 < q < 1. Definindo a funcao inversa de F (x) como F−1(u) = inf{x : F (x) ≥ u}, o

quantil de ordem q de X e χq = T (F ) = F−1(q).

O teste dos sinais pode ser aplicado nas duas situacoes seguintes:

A. Uma amostra

Neste caso e um teste ao quantil χq de uma distribuicao X. A hipotese estipulada em H0 e que

o quantil de ordem q de X, χq, e igual a um determinado valor fixo χ0. A distribuicao de X nao

necessita de ser contınua nem simetrica, como referem Sprent (1989, pagina 62). No entanto, este

teste e frequentemente aplicado quando a populacao X e contınua. Neste trabalho vamos apenas

tratar o caso de amostras oriundas de populacoes contınuas. Assim, vamos admitir que a funcao de

distribuicao da variavel aleatoria X, F (x), e uma funcao contınua e estritamente crescente.

14

Page 27: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

O teste baseia-se no facto de que, se H0 for verdadeira, entao aproximadamente q × 100% dos

valores observados na amostra (x1, . . . , xn) vao ser inferiores a χ0 enquanto que (1 − q) × 100% dos

valores observados sao superiores a χ0. Resulta portanto que P (X ≤ χ0) = q e P (X ≥ χ0) =

1 − q. Assim, considerando as diferencas (xi − χ0), i = 1, . . . , n, nao se rejeita H0 se o numero de

diferencas com sinal positivo for aproximadamente n(1− q). Em alternativa, pode-se calcular o numero

de diferencas com sinal negativo.

B. Duas amostras emparelhadas

Este teste tambem pode ser aplicado quando sao feitas duas observacoes simultaneas (xi, yi) no

mesmo indivıduo ou objeto, Dixon e Mood (1946). Este e o caso, por exemplo, de se querer avaliar

o efeito de determinada medicacao em pacientes. Sao para isso recolhidas duas observacoes no

mesmo paciente, antes (xi) e apos (yi) a toma da medicacao, conduzindo a uma amostra denominada

de emparelhada. Designa-se por (X1, . . . , Xn) e (Y1, . . . , Yn) as duas amostras aleatorias e por Di =

(Yi − Xi), i = 1, . . . , n, a amostra aleatoria das diferencas. O objetivo do teste e avaliar se o quantil q

da distribuicao de D = (Y −X), denotado por χq(D), e igual ao valor χ0. O teste processa-se depois

do mesmo modo que o teste dos sinais para uma amostra.

Neste trabalho apenas sera abordado o teste dos sinais no caso A.

3.2.1 Hipoteses em teste

Considere-se o caso de uma populacao X com funcao de distribuicao F (x) contınua, da qual se reco-

lheu uma amostra concreta (x1, . . . , xn) para efetuar um teste ao parametro χq.

A. Teste Unilateral: Quando as hipoteses sao:

H0 : χq = χ0 versus H1 : χq < χ0, 0 < q < 1,

ou em H1 : χq = χ∗0, com χ∗

0 < χ0, tem-se um teste do tipo unilateral a esquerda.

No caso de as hipoteses serem:

H0 : χq = χ0 versus H1 : χq > χ0, 0 < q < 1,

ou H1 : χq = χ∗0, com χ∗

0 > χ0, o teste e classificado em unilateral a direita.

As hipoteses nulas destes testes tambem podem ser hipoteses compostas. Por exemplo, no caso

do teste unilateral a esquerda as hipoteses em estudo podem escrever-se como:

H0 : χq ≥ χ0 versus H1 : χq < χ0, 0 < q < 1,

B. Teste Bilateral: Por ultimo, no teste bilateral existe o confronto das hipoteses:

H0 : χq = χ0 versus H1 : χq 6= χ0, 0 < q < 1. (3.7)

15

Page 28: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

3.2.2 Estatıstica do Teste

Como se referiu na secao 3.2, sob a validade de H0 e de esperar que nos n valores da amostra

surjam nq valores menores que χ0 e n(1 − q) valores maiores que χ0. Considera-se entao, a variavel

aleatoria Sn que conta o numero de valores maiores que χ0 na amostra de dimensao n. Utilizando a

funcao indicatriz, vem que Sn =∑ni=0 I(xi − χ0) e igual ao numero de sinais positivos na amostra das

diferencas (xi − χ0), onde:

I(xi − χ0) =

1 , se xi > χ0 com probabilidade (1− q)

0 , se xi ≤ χ0 com probabilidade q .

Sob a validade de H0 tem-se que P (X ≤ χ0) = q, resultando a estatıstica do teste dos sinais

Sn ∼ Bin(n, 1− q). Note-se que, a distribuicao de Sn nao depende da distribuicao da populacao, X, de

onde a amostra e originaria.

Para simplificar a notacao vamos denotar (1−q) = p, considerando-se no seguimento deste trabalho

que Sn ∼ Bin(n, p).

Sobre a estatıstica Sn, convem ainda observar que:

Observacao 1: Os valores da amostra que sao iguais ao valor χ0 sao desprezados e retirados da

amostra, ficando-se com uma amostra de dimensao n∗ = n− I(xi = χ0) e Sn∗ ∼ Bin(n∗, p).

Observacao 2: Para n grande (np > 5 e n(1 − p) > 5) pelo teorema de Moivre–Laplace, caso

particular do teorema do limite central, resulta que:

Sn − E[Sn]√V AR[Sn]

D−→ N(0, 1) . (3.8)

onde E[Sn] = np e V AR[Sn] = np(1 − p). A sua prova pode ser consultada em Feller (1968, Capıtulo

VII.3).

Observacao 3: E tambem possıvel considerar, em alternativa, a variavel aleatoria S−n que conta o

numero de valores menores que χ0 na amostra de dimensao n. Neste caso tem-se que S−n ∼ Bin(n, q).

3.2.3 Regiao de Rejeicao

A. Teste Unilateral

Admita-se que na hipotese alternativa H1 se estipula H1 : χq < χ0 ou H1 : χq = χ∗0 < χ0. Quando

na amostra observada o numero de observacoes inferiores a χ0 e consideravelmente maior que nq,

os dados sugerem que o χq de X deve ser um numero inferior a χ0 (evidencia a favor de H1). Como

consequencia, a regiao de rejeicao do teste, tomando um nıvel de significancia α fixo, e da forma:

Rα = {(x1, . . . , xn) : sn ∈ {0, . . . , cα}}. A constante cα representa o maior numero inteiro tal que

16

Page 29: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Σcαi=0(ni )pi(1− p)n−i ≤ α. Neste caso, o valor-p e obtido como:

valor-p = P (Sn ≤ sn) . (3.9)

onde sn e o valor observado da estatıstica Sn.

No caso do teste unilateral a direita comH1 : χq > χ0 ouH1 : χq = χ∗0 > χ0, a regiao de rejeicao para

α fixo e encontrada em funcao de Sn ≥ c∗α, onde c∗α e o menor inteiro tal que Σni=c∗α(ni )pi(1− p)n−i ≤ α.

Nesta situacao, o valor-p e dado por:

valor-p = P (Sn ≥ sn) . (3.10)

As regioes de rejeicao dos testes unilaterais, mas com hipoteses compostas em H0 coıncidem com

as anteriores.

B. Teste Bilateral

O teste bilateral com a hipotese alternada H1 : χq 6= χ0, tem uma regiao de rejeicao que resulta da

uniao de dois conjuntos com valores da estatıstica Sn. Tomando-se um valor de α fixo, a regiao de

rejeicao do teste e da forma Sn ≤ cα/2 ou Sn ≥ c∗α/2. As duas constantes cα/2 e c∗α/2 sao encontradas

exigindo-se em simultaneo que: cα/2 seja o maior numero inteiro tal que Σcα/2i=0 (ni )pi(1 − p)n−i ≤ α/2 e

c∗α/2 o menor numero inteiro que satisfaz Σni=c∗α/2

(ni )pi(1− p)n−i ≤ α/2.

O valor-p e calculado atraves da expressao:

valor-pUSUAL = 2×min{P (Sn ≤ sn), P (Sn ≥ sn)} . (3.11)

Em (3.11) e evidente que tomando o valor sn como referencia, o valor-p do teste bilateral iguala o

dobro da probabilidade cumulativa dos pontos situados na cauda menos pesada da distribuicao de Sn.

No entanto, nao e consensual a utilizacao desta formula para obter um resultado apropriado do valor-p

no teste bilateral (Yates, 1984).

Por ultimo, refere-se que o teste do sinais tambem pode ser conduzido recorrendo as estatısticas

ordinais da amostra aleatoria de X, isto e X(1) < X(2) < · · · < X(n). Em Gibbons and Chakraborti

(2003, Capıtulo 5) sao apresentadas estas regioes de rejeicao com base nas estatısticas ordinais.

3.2.4 Potencia

A potencia do teste, γ, e a probabilidade de obter valores na regiao de rejeicao quando a hipotese H1

e verdadeira. Obviamente, o valor que se obtem para γ depende dos fatores seguintes:

• Discrepancia existente entre as assercoes estabelecidas em H0 e em H1,

• Regiao de rejeicao do teste,

17

Page 30: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

• Nıvel de significancia,

• Dimensao amostral.

A probabilidade γ e usualmente tomada como criterio para avaliar o desempenho do teste, preferindo-se

os testes que apresentem valores de γ elevados. Isto e natural, uma vez que γ e o valor complementar

da probabilidade de cometer o erro do tipo II, isto e γ = 1 − β. Quando em H1 se estabelece uma

hipotese composta, a potencia e uma funcao γ(θ) dos valores estipulados θ ∈ Θ1. Para ser possıvel o

calculo da potencia de um teste, e necessario conhecer-se a distribuicao da estatıstica sob a validade

da hipotese H1. Em contraste com muitos dos outros testes nao parametricos, no teste dos sinais a

potencia e muito simples de determinar. Neste teste existe a vantagem de, sob a validade de H1, Sn|H1

tambem ser uma variavel aleatoria com distribuicao binomial.

Como ilustracao da potencia do teste dos sinais, veja-se o caso do teste unilateral a direita aplicado

a mediana de uma populacao X. Sendo a hipotese alternativa H1 : χ 12> χ0 e θ = P (X > χ0), a

potencia γ(θ) resulta numa funcao de θ monotona nao decrescente, isto e, γ(θ) = P (S∗n ≥ c∗α|H1). E

muito facil de obter valores desta funcao uma vez que S∗n = Sn|H1 ∼ Bin(n, θ). A potencia e obtida

com γ(θ) = Σni=c∗α(ni )θi(1− θ)n−i, onde c∗α e o menor inteiro que satisfaz Σni=c∗α(ni )( 12 )n ≤ α.

No trabalho de Walsh(1946) e feito um estudo da potencia do teste dos sinais. O autor concluiu

que o teste dos sinais a mediana apresenta um desempenho bastante potente quando aplicado a

dados normais, mesmo para amostras de pequena dimensao. Posteriormente, Dixon(1953) obteve as

mesmas conclusoes com dados normais. O efeito da nao normalidade dos dados na potencia do teste

dos sinais foi estudado por Gibbons (1964).

18

Page 31: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Capıtulo 4

Valor-p do teste dos sinais bilateral

A motivacao deste estudo e a formula usual utilizada para calcular o valor-p no teste dos sinais bilateral,

resultado da observacao de uma estatıstica com distribuicao Binomial.

Neste capıtulo, averıgua-se a tıtulo ilustrativo alguns exemplos de como os diferentes valores dos

parametros q e n, isto e, tanto o quantil da distribuicao em estudo como a dimensao amostral, afetam

o calculo do valor-pUSUAL deste teste quando o valor observado da estatıstica coincide com a mediana

ou a moda de Sn. Note-se que, como foi referido no capıtulo anterior os diferentes valores de n e p

conduzem a distribuicoes unimodais ou bimodais com caracterısticas de simetria distintas.

4.1 Teste a Mediana de X

Hipoteses em estudo:

H0 : χ 12

= χ0 vs H1 : χ 126= χ0.

Neste caso, a estatıstica de teste tem uma distribuicao binomial simetrica, uma vez que p = 12 ,

podendo ser unimodal ou bimodal consoante o valor de n e um numero par ou ımpar, respetivamente.

1. Caso Unimodal: n par

Suponha-se, por exemplo, que se tem uma amostra de tamanho n = 6 e seja S6 ∼ Bin(6, 12 ). Obser-

vando, com recurso ao pacote estatıstico R, o grafico da funcao de probabilidade desta distribuicao,

Figura 4.1, verifica-se que o valor 3 e a moda e a mediana da distribuicao de S6. Toma-se como valor

observado da estatıstica o valor s6 = 3.

Recorrendo a Equacao 3.11, o valor-pUSUAL e dado por:

valor-pUSUAL = 2×min{P (S6 ≤ 3), P (S6 ≥ 3)},

onde P (Sn ≤ 3) = 0.6563 e P (Sn ≥ 3) = 0.6563. Assim, tem-se:

valor-pUSUAL = 2×min{0.6563, 0.6563} = 2× 0.65625 = 1.3125 > 1,

19

Page 32: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0 1 2 3 4 5 6

0.05

0.15

0.25

s

f(s)

Figura 4.1: Grafico da funcao de probabilidade de S6 ∼ Bin(6, 12 )

conduzindo a um valor-pUSUAL impossıvel pois obtem-se uma probabilidade maior que 1.

Foram averiguados outros valores de n e obtem-se sempre valor-pUSUAL > 1.

2. Caso Bimodal: n ımpar

Suponha-se agora que n = 7 e seja S7 ∼ Bin(7, 12 ). Observando o grafico da funcao de probabilidade

desta distribuicao, Figura 4.2, esta funcao agora e bimodal µo = {µ−o , µ

+o }, com µ−

o = 3 e µ+o = 4 e

com classe mediana w = [3, 4]. Tome-se para valor observado da estatıstica s7 = 3, o limite inferior da

classe mediana. O valor-pUSUAL e dado por:

0 1 2 3 4 5 6 7

0.00

0.10

0.20

s

f(s)

Figura 4.2: Grafico da funcao de probabilidade de S7 ∼ Bin(7, 12 )

valor-pUSUAL = 2×min{P (S7 ≤ 3), P (S7 ≥ 3)} = 2×min{0.5, 0.7734} = 2× 0.5 = 1.

20

Page 33: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Quando s7 = 4, isto e, quando o valor observado da estatıstica corresponde ao limite superior da classe

mediana o valor-pUSUAL tambem e igual a 1. Assim, para n ımpar com p = 12 , quando sn e um dos limites

da classe mediana resulta um valor-pUSUAL = 1.

4.2 Teste ao quantil q de X com q 6= 12

Hipoteses em teste: H0 : χq = χ0 vs H1 : χq 6= χ0. A estatıstica binomial Sn tem distribuicao assimetrica

uma vez que q 6= 12 . De seguida, apresentam-se alguns valores de q considerados para o estudo do

valor-pUSUAL.

4.2.1 Teste ao 1oquartil de X

Hipoteses em estudo: H0 : χ 14

= χ0 vs H1 : χ 146= χ0, conduzido com a estatıstica Sn ∼ Bin(n, 34 ) com

distribuicao assimetrica a direita.

1. Caso Unimodal: n par

Considere-se novamente o exemplo de n = 6 e seja S6 ∼ Bin(6, 34 ). No grafico da funcao de probabili-

dade desta distribuicao, apresentado na Figura 4.3 (a), observa-se que a moda e mediana sao atingidas

no ponto 5 e por isso tomou-se s6 = 5. O valor-pUSUAL resulta em:

valor-pUSUAL = 2×min{P (S6 ≤ 5), P (S6 ≥ 5)} = 2×min{0.8220, 0.5339} = 1.0679 > 1.

Testando-se mais valores de n conclui-se que qualquer que seja n par com p = 34 e sn = µo = w, resulta

sempre valor-pUSUAL > 1.

2. Caso Unimodal/Bimodal: n ımpar

• Caso Bimodal: n = 7

Observando o grafico da funcao de probabilidade da estatıstica S7 ∼ Bin(7, 34 ), Figura 4.3 (b),

constata-se que µo = {5, 6} e w = 5. Tomando para o valor observado da estatıstica s7 = 6 = µ+o ,

o valor-pUSUAL e dado por:

valor-pUSUAL = 2×min{P (S7 ≤ 6), P (S7 ≥ 6)} = 2×min{0.8967, 0.4450} < 1.

Considerando agora s7 = 5, isto e, o caso de s7 = µ−o = w, tem-se:

valor-pUSUAL = 2×min{P (S7 ≤ 5), P (S7 ≥ 5)} = 2×min{0.5550, 0.7564} > 1.

Portanto, quando o valor observado da estatıstica toma o valor da mediana que e igual a µ−o ,

obtem-se o valor-pUSUAL superior a 1.

21

Page 34: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

• Caso Unimodal: n = 9

Seja S9 ∼ Bin(9, 34 ), verifica-se atraves do grafico da funcao de probabilidade desta distribuicao,

Figura 4.3 (c), que e uma distribuicao unimodal, com µo = w = 7. Tomando s9 = 7, vem:

valor-pUSUAL = 2×min{P (S9 ≤ 7), P (S9 ≥ 7)} = 2×min{0.6997, 0.6007} > 1.

Analisando outros valores de n, obteve-se as seguintes conclusoes:

a) Caso Bimodal: Quando o valor observado da estatıstica toma o valor de µ+o o valor-pUSUAL nao e

superior a 1, mas se for sn = µ−o = w o valor-pUSUAL e superior a 1.

b) Caso Unimodal: Quando o valor observado da estatıstica e igual a mediana e a moda da distribuicao,

o valor-pUSUAL e superior a 1.

0 1 2 3 4 5 6

0.00

0.15

0.30

s

f(s)

(a) S6 ∼ Bin(6, 34)

0 1 2 3 4 5 6 7

0.00

0.10

0.20

0.30

s

f(s)

(b) S7 ∼ Bin(7, 34)

0 2 4 6 8

0.00

0.10

0.20

0.30

s

f(s)

(c) S9 ∼ Bin(9, 34)

Figura 4.3: Graficos da funcao de probabilidade de distribuicoes assimetricas a direita

22

Page 35: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

4.2.2 Teste ao 3oquartil de X

Hipoteses em estudo: H0 : χ 34

= χ0 vs H1 : χ 346= χ0, onde Sn ∼ Bin(n, 14 ) tem uma distribuicao

assimetrica a esquerda.

1. Caso Unimodal: n par

Foram realizados alguns testes com varios valores de n para determinar algum padrao nas situacoes

em que o valor-pUSUAL e maior que 1.

Observe-se, por exemplo, o caso em que n = 6. Analisando S6 ∼ Bin(6, 14 ), o grafico da funcao

de probabilidade desta distribuicao, Figura 4.4 (a), mostra que esta distribuicao tem moda igual a 1 e a

mediana tambem e atingida em 1, por isso tomou-se s6 = 1. O valor-pUSUAL e dado por:

valor-pUSUAL = 2×min{P (S6 ≤ 1), P (S6 ≥ 1)} = 2×min{0.5339, 0.8220} = 1.0679 > 1.

Foram testados outros valores de n e concluiu-se sempre que, para qualquer n par com p = 14 e

sn = µo = w implica valor-pUSUAL > 1.

2. Caso Unimodal / Bimodal: n ımpar

• Caso Bimodal: n = 7

Seja S7 ∼ Bin(7, 14 ), observando o grafico da funcao de probabilidade desta distribuicao, Fi-

gura 4.4 (b), a funcao atinge a moda em µo = {1, 2} e o ponto mediana e o 2. Tomando

s7 = 1 = µ−o , o valor-pUSUAL e dado por:

valor-pUSUAL = 2×min{P (S7 ≤ 1), P (S7 ≥ 1)} = 2×min{0.4450, 0.8967} < 1.

Considerando s7 = 2 = µ+o , valor que iguala a mediana, tem-se:

valor-pUSUAL = 2×min{P (S7 ≤ 2), P (S7 ≥ 2)} = 2×min{0.7564, 0.5550} > 1.

Assim, quando o valor observado da estatıstica coincide com a mediana e µ+o , obtem-se para o

valor-pUSUAL uma probabilidade maior que 1.

• Caso Unimodal: n = 9

Seja S9 ∼ Bin(9, 14 ), verifica-se atraves do grafico da funcao de probabilidade desta distribuicao,

Figura 4.4 (c), que esta e unimodal com moda e mediana no ponto 2. Tomando s9 = 2, o

valor-pUSUAL e dado por:

valor-pUSUAL = 2×min{P (S9 ≤ 2), P (S9 ≥ 2)} = 2×min{0.6007, 0.6997} > 1.

23

Page 36: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Conclui-se assim que, quando o valor observado toma o valor da mediana que e igual a moda, o

valor-pUSUAL resulta num valor maior que 1.

Novamente, foi feita uma analise para outros valores de n, na qual se concluiu que:

a) Caso Bimodal: Quando o valor observado da estatıstica e igual a µ−o , o valor-pUSUAL nao toma valores

superiores a 1. No caso de ser igual a µ+o , valor este que coincide com a mediana da distribuicao,

o valor-pUSUAL e superior a 1.

b) Caso Unimodal: Quando o valor observado da estatıstica coincide com a mediana e a moda da

distribuicao o valor-pUSUAL e superior a 1.

0 1 2 3 4 5 6

0.00

0.15

0.30

s

f(s)

(a) S6 ∼ Bin(6, 14)

0 1 2 3 4 5 6 7

0.00

0.10

0.20

0.30

s

f(s)

(b) S7 ∼ Bin(7, 14)

0 2 4 6 8

0.00

0.10

0.20

0.30

s

f(s)

(c) S9 ∼ Bin(9, 14)

Figura 4.4: Graficos da funcao de probabilidade de distribuicoes assimetricas a esquerda.

4.2.3 Teste ao quantil (1− 1m) de X

Considere-se as hipoteses em teste: H0 : χ1− 1m

= χ0 vs H1 : χ1− 1m6= χ0, com 0 < 1

m < 0.5 e a

estatıstica Sn ∼ Bin(n, 1m ) com distribuicao assimetrica a esquerda, onde m e um divisor de (n + 1) e

diferente de (n+ 1), de modo que n+1m seja um numero inteiro.

24

Page 37: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

A ideia e averiguar o que sucede ao valor-pUSUAL do teste quando sn = n+1m − 1 = µ−

0 ou sn = n+1m =

µ+o .

1. Caso Bimodal: n par

Como exemplo, assuma-se o valor de n = 14 e portanto S14 ∼ Bin(14, 1m ). Note que como (n+ 1) = 15

e os possıveis valores de m sao {3, 5, 15}.

Comecando pelo caso em que m = 3 e S14 ∼ Bin(14, 13 ), verifica-se atraves do grafico da funcao

de probabilidade desta distribuicao, Figura 4.5 (a), que esta e bimodal, com µo = {4, 5} e que w = 5.

Tomando-se s14 = 4 = µ−o , vem:

valor-pUSUAL = 2×min{P (S14 ≤ 4), P (S14 ≥ 4)} = 2×min{0.4755, 0.7388} < 1.

Quando s14 = 5 = µ+o , resulta:

valor-pUSUAL = 2×min{P (S14 ≤ 5), P (S14 ≥ 5)} = 2×min{0.6898, 0.5245} > 1.

Observe-se o caso em que m = 5. Verifica-se atraves do grafico da funcao de probabilidade da

distribuicao de S14 ∼ Bin(14, 15 ), Figura 4.5 (b), que esta e bimodal, com µo = {2, 3} e w = 3. Tomando

s14 = 2, vem:

valor-pUSUAL = 2×min{P (S14 ≤ 2), P (S14 ≥ 2)} = 2× 0.4480 < 1.

Sendo s14 = 3, tem-se:

valor-pUSUAL = 2×min{P (S14 ≤ 3), P (S14 ≥ 3)} = 2×min{0.6982, 0.5519} > 1.

Finalmente, considere-se quem = 15 e S14 ∼ Bin(14, 115 ). Da Figura 4.5 (c), observa-se que esta e uma

distribuicao bimodal, com µo = {0, 1} e w = 1. Quando o valor observado da estatıstica corresponde a

µ−o = 0, o valor-pUSUAL e menor que 1.

Tomando agora s14 = 1, resulta:

valor-pUSUAL = 2×min{P (S14 ≤ 1), P (S14 ≥ 1)} = 2×min{0.7613, 0.6194} > 1.

Foi repetido o mesmo procedimento para outros valores de n e observou-se que quando n e par e

p = 1m , com m um divisor de (n+ 1), entao Sn ∼ Bin(n, 1

m ) e bimodal e assimetrica a esquerda. Neste

caso o valor-pUSUAL e maior que um quando o valor observado da estatıstica e a mediana da distribuicao.

2. Caso Unimodal/ Bimodal: n ımpar

Tome-se agora para n o valor 15 e a estatıstica S15 ∼ Bin(15, 1m ). Neste caso (n + 1) = 16, sendo

{2, 4, 8, 16} os possıveis valores de m.

Comecando por m = 2 e S15 ∼ Bin(15, 12 ). Este e um dos casos ja estudados anteriormente,

corresponde a binomial simetrica e bimodal em que o valor-pUSUAL e sempre menor ou igual a 1, qualquer

25

Page 38: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

que seja o limite escolhido da classe mediana para representar s15. O caso em que m = 4, tal que

S15 ∼ Bin(15, 14 ) e uma distribuicao unimodal, tambem ja foi analisado anteriormente no teste ao

3oquartil.

Tomando m = 8 e S15 ∼ Bin(15, 18 ). Verifica-se atraves do grafico da funcao de probabilidade desta

distribuicao, Figura 4.5 (d), que esta e bimodal, µo = {1, 2}, e a mediana e igual a 2.

Para o caso em que s15 = 1 = µ−o , resulta o valor-pUSUAL ≤ 1. No entanto, se s15 = 2 = µ+

o tem-se:

valor-pUSUAL = 2×min{P (S15 ≤ 2), P (S15 ≥ 2)} = 2×min{0.7132, 0.5759} > 1.

Ou seja, quando o valor observado da estatıstica e igual a mediana e a µ+o o valor-pUSUAL e maior que 1.

Por ultimo, analisando o caso em que m = 16. Atraves da observacao do grafico da funcao de

probabilidade da distribuicao de S15 ∼ Bin(15, 116 ), Figura 4.5 (e), constata-se que e bimodal µo = {0, 1}

e a mediana e igual a 1.

Novamente para o caso em que s15 = 0 = µ−o resulta um valor-pUSUAL ≤ 1, mas no caso em que

s15 = 1 = µ+o tem-se:

valor-pUSUAL = 2×min{P (S15 ≤ 1), P (S15 ≥ 1)} = 2×min{0.7596, 0.6202} > 1.

Repetiu-se o mesmo procedimento para outros valores de n ımpares, verificando-se sempre os

mesmos resultados. Quando p = 1m , com m um divisor de (n + 1), entao Sn ∼ Bin(n, 1

m ) e uma

distribuicao assimetrica a esquerda. Neste caso, resulta que valor-pUSUAL > 1 sempre que sn = w = µ+o

quando Sn e bimodal ou sn = w quando Sn e unimodal.

Por ultimo, foi ainda analisado o caso do teste ao χ 1m

, com 0 < 1m < 0.5, com base na distribuicao

Sn ∼ Bin(n, 1− 1m ). Agora, face a assimetria a direita desta distribuicao tem-se valor-pUSUAL > 1 sempre

que sn = w = µ−o .

26

Page 39: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0 2 4 6 8 10 12 14

0.00

0.10

0.20

s

f(s)

(a) S14 ∼ Bin(14, 13)

0 2 4 6 8 10 12 14

0.00

0.10

0.20

s

f(s)

(b) S14 ∼ Bin(14, 15)

0 2 4 6 8 10 12 14

0.0

0.1

0.2

0.3

s

f(s)

(c) S14 ∼ Bin(14, 115

)

0 5 10 15

0.00

0.10

0.20

0.30

s

f(s)

(d) S15 ∼ Bin(15, 18)

0 5 10 15

0.0

0.1

0.2

0.3

s

f(s)

(e) S15 ∼ Bin(15, 116

)

Figura 4.5: Graficos da funcao de probabilidade de distribuicoes assimetricas a esquerda - Sn ∼Bin(n, 1

m ), com n = 14 e 15

27

Page 40: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

28

Page 41: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Capıtulo 5

Alternativas de calculo do valor-p

O objetivo deste capıtulo e apresentar algumas formulas alternativas para o calculo do valor-p do teste

dos sinais bilateral, indicado em 3.11. Como se referiu anteriormente, nos testes de hipoteses bilaterais

e procedimento habitual definir o valor-p como o dobro do menor dos dois valores-p associados aos

testes unilaterais. Esta duplicacao e particularmente significativa e informativa quando a distribuicao

das estatısticas e simetrica e contınua. Em contrapartida, quando a distribuicao da estatıstica de teste

e discreta como acontece no teste dos sinais, nao existe consenso quanto a formula de calculo do

valor-p em testes bilaterais.

Embora a literatura que aborde esta questao nao seja vasta, alguns autores demostraram preocupacao

com este assunto. Foi o caso dos trabalhos de Gibbons e Pratt (1975) e de Kulinskaya (2008), que in-

dicam formulas alternativas para o calculo do valor-p.

Neste capıtulo, sao apresentadas as alternativas utilizadas em Gibbons e Pratt (1975) e Kulinskaya

(2008). Alem disso e tambem introduzida e aplicada outra formula de calculo do valor-p, referida pela

abreviatura DIST. As formulas consideradas em Gibbons e Pratt (1975) e Kulinskaya (2008) e a nova

alternativa DIST foram confrontadas e comparadas com varias estatısticas binomiais, com distribuicoes

simetricas, assimetricas, unimodais e bimodais, do teste dos sinais bilateral.

5.1 Revisao Bibliografica

De seguida, e apresentada uma breve revisao das propostas de Gibbons e Pratt (1975) e de Kulinskaya

(2008).

Gibbons, J. D. and Pratt, J.W. (1975). P-values: interpretation and methodology

Neste trabalho os autores apresentam duas alternativas para o calculo do valor-p de testes bilaterais,

designadas por colocacao, COL, e por princıpio da verossimilhanca mınima, PVM. A alternativa COL,

quando o valor observado da estatıstica sn se situar na cauda direita da distribuicao de Sn, considera

em ambas as caudas da distribuicao de Sn o mesmo numero de pontos superiores ou iguais a sn.

Os autores alertam para o facto de que esta formula tambem pode conduzir a valores-p superiores a

um. O metodo que os autores designaram como PVM foi inicialmente introduzido por Freeman e Halton

29

Page 42: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

(1951) e resume-se a soma das probabilidades dos pontos cujas probabilidades sao menores ou iguais

que a probabilidade do valor observado da estatıstica. E este metodo que muitos pacotes estatısticos

utilizam, por exemplo o software R.

Kulinskaya, E. (2008). On two-sided p-values for non-symmetric distributions

Kulinskaya (2008) apresenta uma revisao das alternativas propostas na literatura para o calculo do

valor-p, em particular do artigo de Gibbons e Pratt (1975). Alem disso, a forte contribuicao deste artigo

e a introducao de um novo metodo, chamado condicional (COND), para calcular o valor-p em testes

bilaterais.

Em concreto, esta proposta considera a estatıstica de teste X e ν um parametro de localizacao

generico escolhido para separar as caudas da distribuicao FX(x). O parametro ν pode ser, por exemplo,

a media µ = E(X), a moda µo = arg supxf(x) ou a mediana w = χ 1

2= F−1( 1

2 ). Considera ainda que pL

e o peso na cauda da esquerda e pR o peso da cauda da direita ate ao valor ν, isto e, pL = P (X ≤ ν)

e pR = P (X ≥ ν).

O valor-p condicional de uma distribuicao discreta bilateral resulta:

valor-pCOND =P (X ≤ x)

pL|x<ν + 1|x=ν +

P (X ≥ x)

pR|x>ν .

com os pesos pL e pR definidos como anteriormente.

5.2 Metodo de Colocacao

Um dos metodo que pode ser utilizado para obter o valor-p e o metodo de colocacao (COL), em que

dado o valor observado da estatıstica, sn, seleciona um numero igual de valores nas duas caudas da

distribuicao.

No caso da estatıstica ser a binomial, admita-se que o numero observado de sucessos, sn, e um

valor na cauda direita da distribuicao. O valor-p e definido como a soma das probabilidades nos valores

maiores ou iguais a sn e nos (n− sn + 1) valores menores que sn contados a partir da origem, isto e,

valor-pCOL = P (Sn ≥ sn) + P (S ≤ n− sn).

De modo analogo, sendo sn um valor na cauda esquerda da distribuicao vem:

valor-pCOL = P (Sn ≤ sn) + P (Sn ≥ n− sn).

Exemplo de aplicacao: Veja-se o caso da estatıstica binomial com n = 10 e p = 0.6, que permite

conduzir o teste bilateral ao χ0.4 da variavel aleatoria X, e tome-se s10 = 3 para o valor observado da

estatıstica. O grafico funcao de probabilidade de S10 ∼ Bin(10, 0.6) e apresentado na Figura 5.1.

Como se pode constatar esta e uma distribuicao unimodal e ligeiramente assimetrica a direita. Na

Tabela 5.1 encontra-se a funcao de probabilidade de S10.

30

Page 43: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0 2 4 6 8 100.

000.

100.

20

s

f(s)

Figura 5.1: Grafico da funcao de probabilidade de S10 ∼ Bin(10, 0.6).

s10 0 1 2 3 4 5 6 7 8 9 10P (S10 = s10) 0.0001 0.0016 0.0106 0.0425 0.1115 0.2007 0.2508 0.2150 0.1209 0.0403 0.0060

Tabela 5.1: Funcao de probabilidade da estatıstica S10 ∼ Bin(10, 0.6).

Uma vez que o valor s10 = 3 e o quarto maior valor na cauda esquerda da distribuicao, o seu

correspondente na cauda direita em contagem decrescente a partir de 10 e o valor 7. Assim o valor-p e

dado por:

valor-pCOL = P (S10 ≤ 3) + P (S10 ≥ 7) = 0.055 + 0.382 = 0.437.

Repare-se que a P (S10 ≥ 7) e cerca de 7 vezes superior a P (S10 ≤ 3), como consequencia ha

um acrescimo de probabilidade em relacao a valor-pUSUAL = 2 × P (S10 ≤ 3) = 0.11 (cerca de 4 vezes

superior).

5.3 Metodo do Princıpio da Verossimilhanca Mınima

No metodo do princıpio da verossimilhanca mınima, PVM, o valor-p e dado pela soma das probabilidades

em todos os valores de Sn que nao excedam a probabilidade P (Sn = sn), onde sn e o valor observado

da estatıstica. Resulta assim:

valor-pPVM =

n∑i=0

P (Sn = i)|(P (Sn=i)≤P (Sn=sn)) . (5.1)

Exemplo de aplicacao: Considere-se o caso anteriormente tratado, S10 ∼ Bin(10, 0.6) e s10 = 3.

A probabilidade da ocorrencia do valor 3, como e indicado na Tabela 5.1, e P (S10 = 3) = 0.0425.

O conjunto de pontos da estatıstica S10, isto e RS10= {0, . . . , 10}, cujas probabilidades nao excedem

0.0425, e {0, 1, 2, 3}∪{9, 10}. Logo tem-se valor-pPVM = P (S10 ≤ 3)+P (S10 ≥ 9) = 0.055+0.046 = 0.101.

31

Page 44: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

5.4 Metodo Condicional

A formula de calculo do valor-p condicional para uma estatıstica, proposta por Kulinskaya (2008) como

se referiu na seccao 5.1, e dada por:

valor-pCOND =P (Sn ≤ sn)

P (Sn ≤ ν)|sn<ν + 1|sn=ν +

P (Sn ≥ sn)

P (Sn ≥ ν)|sn>ν (5.2)

onde sn e o valor observado da estatıstica e ν e uma medida de localizacao a escolha, como por

exemplo a media, a moda ou a mediana de Sn.

Esta formula e equivalente a:

valor-pCOND = min{P (Sn ≤ sn)

P (Sn ≤ ν),P (Sn ≥ sn)

P (Sn ≥ ν)} , (5.3)

porque produzem ambas os mesmos resultados. A Equacao 5.2 primeiro verifica qual das seguintes

condicoes e satisfeita, sn < ν, sn > ν ou sn = ν, e de seguida calcula a probabilidade condicionada

ou atribui valor-pCOND = 1 se sn = ν. Com a Equacao 5.3 calcula-se a probabilidade condicionada em

ambas as caudas e de seguida considera-se o mınimo desses valores.

Tomou-se para o parametro ν a mediana de Sn, uma vez que esta e uma medida de localizacao

robusta.

Exemplo de aplicacao: Retomando o exemplo da estatıstica S10 ∼ Bin(10, 0.6), onde o ponto

ν = w = 6 e mediana desta distribuicao, com s10 = 3 < w tem-se:

valor-pCOND =P (S10 ≤ 3)

P (S10 ≤ 6)= 0.0887 .

Repare-se que o valor-p produzido com esta formula de calculo e inferior ao obtido com os metodos

COL e PVM. Note-se que considerando o nıvel de significancia α fixo em 0.1, o valor-pCOND conduziria a

rejeicao da hipotese H0 : χ0.4 = χ0 contrariamente a decisao baseada no valor-pCOL e valor-pPVM.

Para avaliar o desempenho desta formula condicional, admita-se que o valor observado da es-

tatıstica e s10 = 8 > w. Resulta que:

valor-pCOND =P (S10 ≥ 8)

P (S10 ≥ 6)= 0.2642 .

Caso o valor observado da estatıstica iguale a mediana, isto e se s10 = w = 6 tem-se valor-pCOND = 1.

Algumas observacoes podem ser tecidas quando este metodo e aplicado ao teste dos sinais. Em

primeira analise, a media e a mediana da distribuicao binomial podem tomar valores que nao pertencem

ao conjunto dos Naturais, N, e nao e feita nenhuma referencia a esta situacao em Kulinskaya (2008).

Quando isto ocorre, o mais sensato e considerar a parte inteira do parametro de localizacao utilizado.

Quando o parametro ν e a moda da distribuicao este problema nao acontece, uma vez que a moda e

sempre um ponto que pertence a N.

Outra observacao pode tambem ser feita no caso do teste dos sinais a mediana de X, com a

32

Page 45: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

estatıstica Sn ∼ Bin(n, 12 ) e n um numero par. Neste caso ocorrendo P (Sn ≤ ν) = P (Sn ≥ ν) = 12 a

Equacao 5.3 ficaria igual a Equacao 3.11 do metodo USUAL:

valor-pCOND = min{P (Sn ≤ sn)

P (Sn ≤ ν),P (Sn ≥ sn)

P (Sn ≥ ν)}

= min{2× P (Sn ≤ sn), 2× P (Sn ≥ sn)}

= 2×min{P (Sn ≤ sn), P (Sn ≥ sn)}

= valor-pUSUAL .

Contudo, apos analisar a funcao de distribuicao de varias estatısticas Sn ∼ Bin(n, 12 ), com n par,

verificou-se que P (Sn ≤ ν) e P (Sn ≥ ν) nao sao exatamente iguais a 0.5. Isto e consequencia da

distribuicao de Sn ser discreta e como foi referido no Capıtulo 1.1 algumas probabilidades nao sao

atingıveis. Com base nos casos analisados quando n e par, o metodo condicional nao e igual ao

metodo usual.

5.5 Nova Proposta - Metodo da Distancia

Tendo presente os metodos estudados, foi feita uma tentativa de elaborar um novo metodo que fosse

coerente com a hipotese H0 e que nao resultasse em valores-p superiores a um.

Considere-se a estatıstica de teste Sn ∼ Bin(n, p) do teste dos sinais e w = χ 12

a mediana de Sn

como a medida de localizacao central. Admita que o valor observado da estatıstica num teste bilateral

ao quantil-q da distribuicao da variavel aleatoria X contınua, e o valor sn e d e a distancia euclidiana

entre sn e w, d = |w − sn|.

A ideia e considerar para o calculo do valor-p a soma das probabilidades nos pontos cuja distancia a

mediana de Sn e maior ou igual a d. Este procedimento e particularmente intuitivo quando se pretende

interpretar o valor-p como o grau de concordancia ou discordancia entre o valor observado da estatıstica

e a mediana.

Exemplo de aplicacao: Novamente considerando a situacao do teste S10 ∼ Bin(10, 0.6), tal que

w = 6 e a mediana da estatıstica de teste, considerando sn = 3 tem-se d = |w − sn| = 3.

Observando a Figura 5.2, tem-se a azul o valor da probabilidade nos pontos com distancia a me-

diana, w, igual ou superior a d e picotado verde o valor da probabilidade nos restantes pontos. O

valor-pDIST e dado pelo somatorio do valor das probabilidades apresentadas a azul, isto e:

valor-pDIST = P (Sn ≤ 3) + P (Sn ≥ 9) = 1−8∑i=4

P (Sn = i) = 0.101.

Para facilitar a implementacao computacional deste novo metodo, somam-se as probabilidades nos

pontos em ambas as caudas que estao a uma distancia de w menor ou igual a (d − 1) e de seguida

subtrai-se a 1 o resultado do somatorio. A formula de calculo do valor-p pelo metodo da distancia e

33

Page 46: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0 2 4 6 8 10

0.00

0.10

0.20

0.30

s

f(s)

Figura 5.2: Grafico da funcao de probabilidade de S10 ∼ Bin(10, 0.6) ilustrativo do metodo da distancia.

dada pela seguinte equacao:

valor-pDIST = 1− (

w+d−1∑i=sn+1

P (Sn = i)|sn<w +

sn−1∑i=w−d+1

P (Sn = i)|sn>w + 0|sn=w). (5.4)

Este metodo e muito semelhante ao metodo da verossimilhanca mınima (PVM) que foi analisado na

Seccao 5.3. Como consequencia, por vezes, ambos os metodos produzem os mesmos resultados.

5.6 Comparacao e analise dos metodos

Nesta secao pretende-se comparar os valores-p obtidos pelos cinco metodos, USUAL, COL, PVM, COND

e DIST, quando a distribuicao da estatıstica Sn e simetrica ou assimetrica. Para realizar este estudo foi

necessaria a implementacao computacional, no software R, de cada um dos metodos. Os programas

desenvolvidos encontram-se no Apendice A.1. No programa do metodo DIST, quando a mediana w e

o intervalo [bnpc, dnpe], foram feitas as seguintes decisoes para a escolha do ponto representativo da

classe mediana:

a) Atribui-se w = dnpe o limite superior da classe mediana quando sn < n−12 ou sn = n+1

2 ,

b) Atribui-se w = bnpc o limite inferior da classe mediana quando sn > n+12 ou sn = n−1

2 .

A escolha destes pontos como representativos da classe mediana foi feita com base na analise dos

valores-p obtidos para varias estatısticas Sn e valores de sn. Foram confrontados os valores-p devol-

vidos considerando para w cada um dos limites da classe mediana com o valor-p obtido pelo metodo

usual. A escolha entre w = dnpe e w = bnpc foi feita de forma a que a diferenca entre valor-pDIST e o

valor-pUSUAL fosse mınima e coerente com a analise. O programa do metodo COND tambem envolve o

valor de w nos seus calculos, portanto considerou-se a mesma escolha feita com o metodo DIST para o

elemento reperesentativo da classe mediana, de modo a que os resultados sejam coerentes.

34

Page 47: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

A analise consiste na obtencao do valor-p pelos diferentes metodos, considerando a estatıstica do

teste dos sinais com parametro n par ou ımpar, dos testes bilaterais: H0 : χq = χ0 vs H1 : χq 6= χ0,

para diferentes valores de q. As estatısticas de teste Sn ∼ Bin(n, p) podem ser distribuicoes simetricas

ou assimetricas a direita e a esquerda. O objetivo e verificar em que metodos se obtem um valor-p

superior a um e em que casos podera haver uma mudanca de decisao do teste dos sinais, isto e, se a

hipotese H0 e ou nao rejeitada dependendo do metodo que se esta a utilizar e do nıvel de significancia

definido a priori.

Neste estudo, para alem dos valores de n analisados no capıtulo anterior, n = 6 e n = 7, foram

considerados tambem outros valores de n superiores, n = 10, 11, 20 e 21, e as probabilidades p =

0.1, 0.25, 0.5, 0.75 e 0.9. Apresentam-se nas Tabelas 5.2 e 5.3 as funcoes de probabilidade de S6 e

S7, respetivamente, para uma melhor interpretacao de cada metodo. Os graficos destas funcoes de

probabilidade podem ser consultados no Capıtulo 4, com a excecao dos graficos para as binomiais

assimetricas bastante acentuadas, com p = 0.1 e p = 0.9, que se encontram na Figura 5.3. Os valores-

p obtidos, considerando todas as possibilidades do valor observado da estatıstica sn, com as cinco

alternativas de calculo encontram-se nas Tabelas 5.4 a 5.9.

P (S6 = s6)

s6 0 1 2 3 4 5 6p = 0.1 0.5314 0.3543 0.0984 0.0146 0.0012 0.0001 0.0000p = 0.25 0.1780 0.3560 0.2966 0.1318 0.0330 0.0044 0.0002p = 0.5 0.0156 0.0937 0.2344 0.3125 0.2344 0.0938 0.0156p = 0.75 0.0002 0.0044 0.0330 0.1318 0.2966 0.3560 0.1780p = 0.9 0.0000 0.0001 0.0012 0.0146 0.0984 0.3543 0.5314

Tabela 5.2: Funcao de probabilidade de S6 ∼ Bin(6, p), com p = 0.1, 0.25, 0.5, 0.75 e 0.9.

P (S7 = s7)

s7 0 1 2 3 4 5 6 7p = 0.1 0.4783 0.3720 0.1240 0.0230 0.0026 0.0002 0.0000 0.0000p = 0.25 0.1335 0.3115 0.3115 0.1730 0.0577 0.0115 0.0013 0.0001p = 0.5 0.0078 0.0547 0.1641 0.2734 0.2734 0.1641 0.0547 0.0078p = 0.75 0.0001 0.0013 0.0115 0.0577 0.1730 0.3115 0.3115 0.1335p = 0.9 0.0000 0.0000 0.0002 0.0026 0.0230 0.1240 0.3720 0.4783

Tabela 5.3: Funcao de probabilidade de S7 ∼ Bin(7, p), com p = 0.1, 0.25, 0.5, 0.75 e 0.9.

35

Page 48: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0 1 2 3 4 5 6

0.0

0.2

0.4

s

f(s)

(a) S6 ∼ Bin(6, 0.1)

0 1 2 3 4 5 6

0.0

0.2

0.4

s

f(s)

(b) S6 ∼ Bin(6, 0.9)

0 1 2 3 4 5 6 7

0.0

0.2

0.4

s

f(s)

(c) S7 ∼ Bin(7, 0.1)

0 1 2 3 4 5 6 7

0.0

0.2

0.4

s

f(s)

(d) S7 ∼ Bin(7, 0.9)

Figura 5.3: Graficos das funcoes de probabilidade de S6 ∼ Bin(6, p) e S7 ∼ Bin(7, p), com p = 0.1 e0.9.

36

Page 49: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Metodosq s6 USUAL COL PVM COND DIST

0.1 0 0.0000 0.5314 0.0000 0.0000 0.00001 0.0001 0.8858 0.0001 0.0001 0.00012 0.0025 0.9854 0.0013 0.0013 0.00133 0.0317 1.0146 0.0158 0.0158 0.01584 0.2285 0.9854 0.1143 0.1143 0.11435 0.9371 0.8858 0.4686 0.4686 0.46866 1.0629 0.5314 1.0000 1.0000 1.0000

0.25 0 0.0005 0.1782 0.0002 0.0003 0.00021 0.0093 0.5386 0.0046 0.0056 0.00462 0.0752 0.8682 0.0376 0.0457 0.03763 0.3389 1.1318 0.1694 0.2061 0.16944 0.9321 0.8682 0.6440 0.5670 0.64405 1.0679 0.5386 1.0000 1.0000 1.00006 0.3560 0.1782 0.3474 0.3333 0.6440

0.5 0 0.0313 0.0312 0.0313 0.0238 0.03121 0.2188 0.2188 0.2188 0.1667 0.21872 0.6875 0.6875 0.6875 0.5238 0.68753 1.3125 1.3125 1.0000 1.0000 1.00004 0.6875 0.6875 0.6875 0.5238 0.68755 0.2188 0.2188 0.2188 0.1667 0.21876 0.0312 0.0312 0.0313 0.0238 0.0312

0.75 0 0.3560 0.1782 0.3474 0.3333 0.64401 1.0679 0.5386 1.0000 1.0000 1.00002 0.9321 0.8682 0.6440 0.5670 0.64403 0.3389 1.1318 0.1694 0.2061 0.16944 0.0752 0.8682 0.0376 0.0457 0.03765 0.0093 0.5386 0.0046 0.0056 0.00466 0.0005 0.1782 0.0002 0.0003 0.0002

0.9 0 1.0629 0.5314 1.0000 1.0000 1.00001 0.9371 0.8858 0.4686 0.4686 0.46862 0.2285 0.9854 0.1143 0.1143 0.11433 0.0317 1.0146 0.0158 0.0158 0.01584 0.0025 0.9854 0.0013 0.0013 0.00135 0.0001 0.8858 0.0001 0.0001 0.00016 0.0000 0.5314 0.0000 0.0000 0.0000

Tabela 5.4: Valores-p da estatıstica S6 ∼ Bin(6, p) do teste H0 : χq = χ0 vs H1 : χq 6= χ0 obtidos pelosmetodos USUAL, COL, PVM, COND e DIST.

37

Page 50: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Metodosq s7 USUAL COL PVM COND DIST

0.1 0 0.0000 0.4783 0.0000 0.0000 0.00001 0.0000 0.8503 0.0000 0.0000 0.00002 0.0004 0.9745 0.0002 0.0003 0.00023 0.0055 1.0000 0.0027 0.0052 0.00274 0.0514 1.0000 0.0257 0.0492 0.02575 0.2994 0.9745 0.1497 0.2869 0.62806 1.0434 0.8503 0.5217 1.0000 1.00007 0.9566 0.4783 1.0000 0.5625 0.6280

0.25 0 0.0001 0.1335 0.0001 0.0001 0.00011 0.0027 0.4463 0.0013 0.0024 0.00132 0.0258 0.7693 0.0129 0.0232 0.01293 0.1411 1.0000 0.0706 0.1271 0.20404 0.4872 1.0000 0.3771 0.4389 0.68855 1.1101 0.7693 1.0000 1.0000 1.00006 0.8899 0.4463 0.6885 0.5882 0.68857 0.2670 0.1335 0.2040 0.1765 0.2040

0.5 0 0.0156 0.0156 0.0156 0.0101 0.00781 0.1250 0.1250 0.1250 0.0808 0.07032 0.4531 0.4531 0.4531 0.2929 0.28913 1.0000 1.0000 1.0000 1.0000 1.00004 1.0000 1.0000 1.0000 1.0000 1.00005 0.4531 0.4531 0.4531 0.2929 0.28916 0.1250 0.1250 0.1250 0.0808 0.07037 0.0156 0.0156 0.0156 0.0101 0.0078

0.75 0 0.2670 0.1335 0.2040 0.1765 0.20401 0.8899 0.4463 0.6885 0.5882 0.68852 1.1101 0.7693 1.0000 1.0000 1.00003 0.4872 1.0000 0.3771 0.4389 0.68854 0.1411 1.0000 0.0706 0.1271 0.20405 0.0258 0.7693 0.0129 0.0232 0.01296 0.0027 0.4463 0.0013 0.0024 0.00137 0.0001 0.1335 0.0001 0.0001 0.0001

0.9 0 0.9566 0.4783 1.0000 0.5625 0.62801 1.0434 0.8503 0.5217 1.0000 1.00002 0.2994 0.9745 0.1497 0.2869 0.62803 0.0514 1.0000 0.0257 0.0492 0.02574 0.0055 1.0000 0.0027 0.0052 0.00275 0.0004 0.9745 0.0002 0.0003 0.00026 0.0000 0.8503 0.0000 0.0000 0.00007 0.0000 0.4783 0.0000 0.0000 0.0000

Tabela 5.5: Valores-p da estatıstica S7 ∼ Bin(7, p) do teste H0 : χq = χ0 vs H1 : χq 6= χ0 obtidos pelosmetodos USUAL, COL, PVM, COND e DIST.

38

Page 51: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Metodosq s10 USUAL COL PVM COND DIST

0.1 0 0.0000 0.3487 0.0000 0.0000 0.00001 0.0000 0.7361 0.0000 0.0000 0.00002 0.0000 0.9298 0.0000 0.0000 0.00003 0.0000 0.9872 0.0000 0.0000 0.00004 0.0003 0.9985 0.0001 0.0002 0.00015 0.0033 1.0015 0.0016 0.0025 0.00166 0.0256 0.9985 0.0128 0.0196 0.01287 0.1404 0.9872 0.0702 0.1078 0.07028 0.5278 0.9298 0.2639 0.4052 0.61269 1.3026 0.7361 1.0000 1.0000 1.000010 0.6974 0.3487 0.6126 0.4737 0.6126

0.25 0 0.0000 0.0563 0.0000 0.0000 0.00001 0.0000 0.2441 0.0000 0.0000 0.00002 0.0008 0.5260 0.0004 0.0006 0.00043 0.0070 0.7794 0.0035 0.0046 0.00354 0.0395 0.9416 0.0197 0.0261 0.01975 0.1563 1.0584 0.1344 0.1033 0.07816 0.4482 0.9416 0.2804 0.2965 0.28047 0.9488 0.7794 0.7184 0.6275 0.71848 1.0512 0.5260 1.0000 1.0000 1.00009 0.4881 0.2441 0.4682 0.4643 0.718410 0.1126 0.0563 0.0760 0.1071 0.2804

0.5 0 0.0020 0.0020 0.0020 0.0016 0.00201 0.0215 0.0215 0.0215 0.0172 0.02152 0.1094 0.1094 0.1094 0.0878 0.10943 0.3438 0.3438 0.3438 0.2759 0.34384 0.7539 0.7539 0.7539 0.6050 0.75395 1.2461 1.2461 1.0000 1.0000 1.00006 0.7539 0.7539 0.7539 0.6050 0.75397 0.3438 0.3438 0.3438 0.2759 0.34388 0.1094 0.1094 0.1094 0.0878 0.10949 0.0215 0.0215 0.0215 0.0172 0.021510 0.0020 0.0020 0.0020 0.0016 0.0020

0.75 0 0.1126 0.0563 0.0760 0.1071 0.28041 0.4881 0.2441 0.4682 0.4643 0.71842 1.0512 0.5260 1.0000 1.0000 1.00003 0.9488 0.7794 0.7184 0.6275 0.71844 0.4482 0.9416 0.2804 0.2965 0.28045 0.1563 1.0584 0.1344 0.1033 0.07816 0.0395 0.9416 0.0197 0.0261 0.01977 0.0070 0.7794 0.0035 0.0046 0.00358 0.0008 0.5260 0.0004 0.0006 0.00049 0.0000 0.2441 0.0000 0.0000 0.000010 0.0000 0.0563 0.0000 0.0000 0.0000

0.9 0 0.6974 0.3487 0.6126 0.4737 0.61261 1.3026 0.7361 1.0000 1.0000 1.00002 0.5278 0.9298 0.2639 0.4052 0.61263 0.1404 0.9872 0.0702 0.1078 0.07024 0.0256 0.9985 0.0128 0.0196 0.01285 0.0033 1.0015 0.0016 0.0025 0.00166 0.0003 0.9985 0.0001 0.0002 0.00017 0.0000 0.9872 0.0000 0.0000 0.00008 0.0000 0.9298 0.0000 0.0000 0.00009 0.0000 0.7361 0.0000 0.0000 0.000010 0.0000 0.3487 0.0000 0.0000 0.0000

Tabela 5.6: Valores-p da estatıstica S10 ∼ Bin(10, p) do teste H0 : χq = χ0 vs H1 : χq 6= χ0 obtidospelos metodos USUAL, COL, PVM, COND e DIST.

39

Page 52: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Metodosq s11 USUAL COL PVM COND DIST

0.1 0 0.0000 0.3138 0.0000 0.0000 0.00001 0.0000 0.6974 0.0000 0.0000 0.00002 0.0000 0.9104 0.0000 0.0000 0.00003 0.0000 0.9815 0.0000 0.0000 0.00004 0.0000 0.9973 0.0000 0.0000 0.00005 0.0006 1.0000 0.0003 0.0004 0.00036 0.0055 1.0000 0.0028 0.0040 0.00287 0.0371 0.9973 0.0185 0.0270 0.01858 0.1791 0.9815 0.0896 0.1305 0.08969 0.6053 0.9104 0.3026 0.4410 0.616510 1.3724 0.6974 1.0000 1.0000 1.000011 0.6276 0.3138 0.6165 0.4500 0.6165

0.25 0 0.0000 0.0422 0.0000 0.0000 0.00001 0.0000 0.1971 0.0000 0.0000 0.00002 0.0003 0.4553 0.0001 0.0002 0.00013 0.0024 0.7145 0.0012 0.0022 0.00124 0.0151 0.8929 0.0076 0.0139 0.00765 0.0687 1.0000 0.0343 0.0630 0.07666 0.2293 1.0000 0.1569 0.2104 0.31177 0.5734 0.8929 0.4838 0.5262 0.74198 1.0896 0.7145 1.0000 1.0000 1.00009 0.9104 0.4553 0.7419 0.6382 0.741910 0.3942 0.1971 0.3117 0.2763 0.311711 0.0845 0.0422 0.0766 0.0592 0.0766

0.5 0 0.0010 0.0010 0.0010 0.0007 0.00051 0.0117 0.0117 0.0117 0.0081 0.00632 0.0654 0.0654 0.0654 0.0451 0.03863 0.2266 0.2266 0.2266 0.1561 0.14604 0.5488 0.5488 0.5488 0.3782 0.38775 1.0000 1.0000 1.0000 1.0000 1.00006 1.0000 1.0000 1.0000 1.0000 1.00007 0.5488 0.5488 0.5488 0.3782 0.38778 0.2266 0.2266 0.2266 0.1561 0.14609 0.0654 0.0654 0.0654 0.0451 0.038610 0.0117 0.0117 0.0117 0.0081 0.006311 0.0010 0.0010 0.0010 0.0007 0.0005

0.75 0 0.0845 0.0422 0.0766 0.0592 0.07661 0.3942 0.1971 0.3117 0.2763 0.31172 0.9104 0.4553 1.0000 0.6382 0.74193 1.0896 0.7145 1.0000 1.0000 1.00004 0.5734 0.8929 0.4838 0.5262 0.74195 0.2293 1.0000 0.1569 0.2104 0.31176 0.0687 1.0000 0.0343 0.0630 0.07667 0.0151 0.8929 0.0076 0.0139 0.00768 0.0024 0.7145 0.0012 0.0022 0.00129 0.0003 0.4553 0.0001 0.0002 0.000110 0.0000 0.1971 0.0000 0.0000 0.000011 0.0000 0.0422 0.0000 0.0000 0.0000

0.9 0 0.6276 0.3138 0.6165 0.4500 0.61651 1.3724 0.6974 1.0000 1.0000 1.00002 0.6053 0.9104 0.3026 0.4410 0.61653 0.1791 0.9815 0.0896 0.1305 0.08964 0.0371 0.9973 0.0185 0.0270 0.01855 0.0055 1.0000 0.0028 0.0040 0.00286 0.0006 1.0000 0.0003 0.0004 0.00037 0.0000 0.9973 0.0000 0.0000 0.00008 0.0000 0.9815 0.0000 0.0000 0.00009 0.0000 0.9104 0.0000 0.0000 0.000010 0.0000 0.6974 0.0000 0.0000 0.000011 0.0000 0.3138 0.0000 0.0000 0.0000

Tabela 5.7: Valores-p da estatıstica S11 ∼ Bin(11, p) do teste H0 : χq = χ0 vs H1 : χq 6= χ0 obtidospelos metodos USUAL, COL, PVM, COND e DIST.

40

Page 53: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Metodos Metodosq s20 USUAL COL PVM COND DIST s20 USUAL COL PVM COND DIST

0.1 0 0.0000 0.1216 0.0000 0.0000 0.0000 11 0.0001 1.0000 0.0001 0.0001 0.00011 0.0000 0.3917 0.0000 0.0000 0.0000 12 0.0008 0.9999 0.0004 0.0007 0.00042 0.0000 0.6769 0.0000 0.0000 0.0000 13 0.0048 0.9996 0.0024 0.0039 0.00243 0.0000 0.8670 0.0000 0.0000 0.0000 14 0.0225 0.9976 0.0113 0.0185 0.01134 0.0000 0.9568 0.0000 0.0000 0.0000 15 0.0863 0.9887 0.0432 0.0710 0.04325 0.0000 0.9887 0.0000 0.0000 0.0000 16 0.2659 0.9568 0.1330 0.2186 0.25456 0.0000 0.9976 0.0000 0.0000 0.0000 17 0.6461 0.8670 0.4446 0.5311 0.71487 0.0000 0.9996 0.0000 0.0000 0.0000 18 1.2165 0.6769 1.0000 1.0000 1.00008 0.0000 0.9999 0.0000 0.0000 0.0000 19 0.7835 0.3917 0.7148 0.5787 0.71489 0.0000 1.0000 0.0000 0.0000 0.0000 20 0.2432 0.1216 0.2545 0.1796 0.254510 0.0000 1.0000 0.0000 0.0000 0.0000

0.25 0 0.0000 0.0032 0.0000 0.0000 0.0000 11 0.0819 0.9901 0.0652 0.0699 0.06521 0.0000 0.0243 0.0000 0.0000 0.0000 12 0.2036 0.9600 0.1261 0.1740 0.19312 0.0000 0.0913 0.0000 0.0000 0.0000 13 0.4284 0.8984 0.3055 0.3661 0.43943 0.0000 0.2252 0.0000 0.0000 0.0000 14 0.7657 0.7858 0.6080 0.6542 0.79774 0.0000 0.4148 0.0000 0.0000 0.0000 15 1.1703 0.6172 1.0000 1.0000 1.00005 0.0000 0.6172 0.0000 0.0000 0.0000 16 0.8297 0.4148 0.7977 0.6722 0.79776 0.0001 0.7858 0.0000 0.0001 0.0000 17 0.4503 0.2252 0.4394 0.3648 0.43947 0.0004 0.8984 0.0002 0.0003 0.0002 18 0.1825 0.0913 0.1931 0.1479 0.19318 0.0019 0.9600 0.0009 0.0016 0.0009 19 0.0486 0.0243 0.0382 0.0394 0.06529 0.0079 0.9901 0.0039 0.0067 0.0039 20 0.0063 0.0032 0.0071 0.0051 0.017010 0.0277 1.0099 0.0170 0.0237 0.0170

0.5 0 0.0000 0.0000 0.0000 0.0000 0.0000 11 0.8238 0.8238 0.8238 0.7004 0.82381 0.0000 0.0000 0.0000 0.0000 0.0000 12 0.5034 0.5034 0.5034 0.4280 0.50342 0.0004 0.0004 0.0004 0.0003 0.0004 13 0.2632 0.2632 0.2632 0.2238 0.26323 0.0026 0.0026 0.0026 0.0022 0.0026 14 0.1153 0.1153 0.1153 0.0980 0.11534 0.0118 0.0118 0.0118 0.0100 0.0118 15 0.0414 0.0414 0.0414 0.0352 0.04145 0.0414 0.0414 0.0414 0.0352 0.0414 16 0.0118 0.0118 0.0118 0.0100 0.01186 0.1153 0.1153 0.1153 0.0980 0.1153 17 0.0026 0.0026 0.0026 0.0022 0.00267 0.2632 0.2632 0.2632 0.2238 0.2632 18 0.0004 0.0004 0.0004 0.0003 0.00048 0.5034 0.5034 0.5034 0.4280 0.5034 19 0.0000 0.0000 0.0000 0.0000 0.00009 0.8238 0.8238 0.8238 0.7004 0.8238 20 0.0000 0.0000 0.0000 0.0000 0.000010 1.1762 1.1762 1.0000 1.0000 1.0000

0.75 0 0.0063 0.0032 0.0071 0.0051 0.0170 11 0.0079 0.9901 0.0039 0.0067 0.00391 0.0486 0.0243 0.0382 0.0394 0.0652 12 0.0019 0.9600 0.0009 0.0016 0.00092 0.1825 0.0913 0.1931 0.1479 0.1931 13 0.0004 0.8984 0.0002 0.0003 0.00023 0.4503 0.2252 0.4394 0.3648 0.4394 14 0.0001 0.7858 0.0000 0.0001 0.00004 0.8297 0.4148 0.7977 0.6722 0.7977 15 0.0000 0.6172 0.0000 0.0000 0.00005 1.1703 0.6172 1.0000 1.0000 1.0000 16 0.0000 0.4148 0.0000 0.0000 0.00006 0.7657 0.7858 0.6080 0.6542 0.7977 17 0.0000 0.2252 0.0000 0.0000 0.00007 0.4284 0.8984 0.3055 0.3661 0.4394 18 0.0000 0.0913 0.0000 0.0000 0.00008 0.2036 0.9600 0.1261 0.1740 0.1931 19 0.0000 0.0243 0.0000 0.0000 0.00009 0.0819 0.9901 0.0652 0.0699 0.0652 20 0.0000 0.0032 0.0000 0.0000 0.000010 0.0277 1.0099 0.0170 0.0237 0.0170

0.9 0 0.2432 0.1216 0.2545 0.1796 0.2545 11 0.0000 1.0000 0.0000 0.0000 0.00001 0.7835 0.3917 0.7148 0.5787 0.7148 12 0.0000 0.9999 0.0000 0.0000 0.00002 1.2165 0.6769 1.0000 1.0000 1.0000 13 0.0000 0.9996 0.0000 0.0000 0.00003 0.6461 0.8670 0.4446 0.5311 0.7148 14 0.0000 0.9976 0.0000 0.0000 0.00004 0.2659 0.9568 0.1330 0.2186 0.2545 15 0.0000 0.9887 0.0000 0.0000 0.00005 0.0863 0.9887 0.0432 0.0710 0.0432 16 0.0000 0.9568 0.0000 0.0000 0.00006 0.0225 0.9976 0.0113 0.0185 0.0113 17 0.0000 0.8670 0.0000 0.0000 0.00007 0.0048 0.9996 0.0024 0.0039 0.0024 18 0.0000 0.6769 0.0000 0.0000 0.00008 0.0008 0.9999 0.0004 0.0007 0.0004 19 0.0000 0.3917 0.0000 0.0000 0.00009 0.0001 1.0000 0.0001 0.0001 0.0001 20 0.0000 0.1216 0.0000 0.0000 0.000010 0.0000 1.0000 0.0000 0.0000 0.0000

Tabela 5.8: Valores-p da estatıstica S20 ∼ Bin(20, p) do teste H0 : χq = χ0 vs H1 : χq 6= χ0 obtidospelos metodos USUAL, COL, PVM, COND e DIST.

41

Page 54: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Metodos Metodosq s21 USUAL COL PVM COND DIST s21 USUAL COL PVM COND DIST

0.1 0 0.0000 0.1094 0.0000 0.0000 0.0000 11 0.0000 1.0000 0.0000 0.0000 0.00001 0.0000 0.3647 0.0000 0.0000 0.0000 12 0.0002 1.0000 0.0001 0.0002 0.00012 0.0000 0.6484 0.0000 0.0000 0.0000 13 0.0012 0.9999 0.0006 0.0001 0.00063 0.0000 0.8480 0.0000 0.0000 0.0000 14 0.0065 0.9994 0.0033 0.0052 0.00334 0.0000 0.9478 0.0000 0.0000 0.0000 15 0.0289 0.9967 0.0144 0.0227 0.01445 0.0000 0.9856 0.0000 0.0000 0.0000 16 0.1043 0.9856 0.0522 0.0821 0.05226 0.0000 0.9967 0.0000 0.0000 0.0000 17 0.3039 0.9478 0.1520 0.2392 0.26147 0.0000 0.9994 0.0000 0.0000 0.0000 18 0.7032 0.8480 0.4610 0.5535 0.71638 0.0000 0.9999 0.0000 0.0000 0.0000 19 1.2705 0.6484 1.0000 1.0000 1.00009 0.0000 1.0000 0.0000 0.0000 0.0000 20 0.7295 0.3647 0.7163 0.5625 0.716310 0.0000 1.0000 0.0000 0.0000 0.0000 21 0.2188 0.1094 0.2614 0.1688 0.2614

0.25 0 0.0000 0.0024 0.0000 0.0000 0.0000 11 0.0413 1.0000 0.0230 0.0326 0.02301 0.0000 0.0190 0.0000 0.0000 0.0000 12 0.1123 0.9811 0.0752 0.0888 0.07522 0.0000 0.0745 0.0000 0.0000 0.0000 13 0.2598 0.9442 0.2044 0.2054 0.20443 0.0000 0.1917 0.0000 0.0000 0.0000 14 0.5127 0.8702 0.4481 0.4053 0.44814 0.0000 0.3674 0.0000 0.0000 0.0000 15 0.8668 0.7436 0.8008 0.6851 0.80085 0.0000 0.5666 0.0000 0.0000 0.0000 16 1.1332 0.5666 1.0000 1.0000 1.00006 0.0000 0.7436 0.0000 0.0000 0.0000 17 0.7348 0.3674 0.6238 0.6485 0.80087 0.0001 0.8702 0.0001 0.0001 0.0001 18 0.3834 0.1917 0.3216 0.3383 0.44818 0.0007 0.9442 0.0004 0.0006 0.0004 19 0.1490 0.0745 0.1307 0.1315 0.20449 0.0034 0.9811 0.0017 0.0027 0.0017 20 0.0381 0.0190 0.0397 0.0336 0.075210 0.0128 1.0000 0.0088 0.0102 0.0064 21 0.0048 0.0024 0.0041 0.0042 0.0230

0.5 0 0.0000 0.0000 0.0000 0.0000 0.0000 11 1.0000 1.0000 1.0000 1.0000 1.00001 0.0000 0.0000 0.0000 0.0000 0.0000 12 0.6636 0.6636 0.6636 0.4966 0.52352 0.0002 0.0002 0.0002 0.0002 0.0001 13 0.3833 0.3833 0.3833 0.2868 0.28633 0.0015 0.0015 0.0015 0.0011 0.0009 14 0.1892 0.1892 0.1892 0.1416 0.13384 0.0072 0.0072 0.0072 0.0054 0.0043 15 0.0784 0.0784 0.0784 0.0586 0.05255 0.0266 0.0266 0.0266 0.0199 0.0169 16 0.0266 0.0266 0.0266 0.0199 0.01696 0.0784 0.0784 0.0784 0.0586 0.0525 17 0.0072 0.0072 0.0072 0.0054 0.00437 0.1892 0.1892 0.1892 0.1416 0.1338 18 0.0015 0.0015 0.0015 0.0011 0.00098 0.3833 0.3833 0.3833 0.2868 0.2863 19 0.0002 0.0002 0.0002 0.0002 0.00019 0.6636 0.6636 0.6636 0.4966 0.5235 20 0.0000 0.0000 0.0000 0.0000 0.000010 1.0000 1.0000 1.0000 1.0000 1.0000 21 0.0000 0.0000 0.0000 0.0000 0.0000

0.75 0 0.0048 0.0024 0.0041 0.0042 0.0230 11 0.0128 1.0000 0.0088 0.0102 0.00641 0.0381 0.0190 0.0397 0.0336 0.0752 12 0.0034 0.9811 0.0017 0.0027 0.00172 0.1490 0.0745 0.1307 0.1315 0.2044 13 0.0007 0.9442 0.0004 0.0006 0.00043 0.3834 0.1917 0.3216 0.3383 0.4481 14 0.0001 0.8702 0.0001 0.0001 0.00014 0.7348 0.3674 0.6238 0.6485 0.8008 15 0.0000 0.7436 0.0000 0.0000 0.00005 1.1332 0.5666 1.0000 1.0000 1.0000 16 0.0000 0.5666 0.0000 0.0000 0.00006 0.8668 0.7436 0.8008 0.6851 0.8008 17 0.0000 0.3674 0.0000 0.0000 0.00007 0.5127 0.8702 0.4481 0.4053 0.4481 18 0.0000 0.1917 0.0000 0.0000 0.00008 0.2598 0.9442 0.2044 0.2054 0.2044 19 0.0000 0.0745 0.0000 0.0000 0.00009 0.1123 0.9811 0.0752 0.0888 0.0752 20 0.0000 0.0190 0.0000 0.0000 0.000010 0.0413 1.0000 0.0230 0.0326 0.0230 21 0.0000 0.0024 0.0000 0.0000 0.0000

0.9 0 0.2188 0.1094 0.2614 0.1688 0.2614 11 0.0000 1.0000 0.0000 0.0000 0.00001 0.7295 0.3647 0.7163 0.5625 0.7163 12 0.0000 1.0000 0.0000 0.0000 0.00002 1.2705 0.6484 1.0000 1.0000 1.0000 13 0.0000 0.9999 0.0000 0.0000 0.00003 0.7032 0.8480 0.4610 0.5535 0.7163 14 0.0000 0.9994 0.0000 0.0000 0.00004 0.3039 0.9478 0.1520 0.2392 0.2614 15 0.0000 0.9967 0.0000 0.0000 0.00005 0.1043 0.9856 0.0522 0.0821 0.0522 16 0.0000 0.9856 0.0000 0.0000 0.00006 0.0289 0.9967 0.0144 0.0227 0.0144 17 0.0000 0.9478 0.0000 0.0000 0.00007 0.0065 0.9994 0.0033 0.0052 0.0033 18 0.0000 0.8480 0.0000 0.0000 0.00008 0.0012 0.9999 0.0006 0.0010 0.0006 19 0.0000 0.6484 0.0000 0.0000 0.00009 0.0002 1.0000 0.0001 0.0002 0.0001 20 0.0000 0.3647 0.0000 0.0000 0.000010 0.0000 1.0000 0.0000 0.0000 0.0000 21 0.0000 0.1094 0.0000 0.0000 0.0000

Tabela 5.9: Valores-p da estatıstica S21 ∼ Bin(21, p) do teste H0 : χq = χ0 vs H1 : χq 6= χ0 obtidospelos metodos USUAL, COL, PVM, COND e DIST.

42

Page 55: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Interpretacao das Tabelas 5.6 a 5.9

Da analise das referidas tabelas podem-se retirar as seguintes conclusoes:

• No caso de n ser um numero ımpar, como foi referido no Capıtulo 4, a mediana da distribuicao de

Sn ∼ Bin(n, 0.5) e uma classe e se sn = bn2 c ou sn = dn2 e todos os metodos devolvem o valor-p

igual a um.

• Quando o valor observado da estatıstica corresponde a mediana da distribuicao de Sn, isto e,

sempre que sn = w, o metodo USUAL retorna um valor-p superior a um, exceto no caso de o teste

ser a mediana de X e conduzido com uma amostra de dimensao n ımpar.

• O metodo COL so devolve valores-p aceitaveis quando q = 0.5, ou seja quando a distribuicao

binomial e simetrica, uma vez que para os restantes quantis os resultados do valor-p sao incon-

sistentes com os obtidos com as outras alternativas. Nota-se ainda que o grau de discordancia

de valor-pCOL aumenta comparativamente com os dos restantes metodos a medida que o grau

de assimetria da distribuicao binomial aumenta. No entanto, o metodo COL so devolve valores-p

superiores a um quando o valor de n e par. Das Tabelas 5.4, 5.6 e 5.8 ressalta que o metodo

COL em todos os quantis analisados retorna o valor-p superior a um quando sn = n2 , isto e, para

sn = 3, 5 e 10, respetivamente. Quando n e um numero ımpar, caso apresentado nas Tabelas 5.5,

5.7 e 5.9, o valor-p e sempre inferior ou igual a um.

• E tambem evidente que, em geral, verifica-se que valor-pCOND < valor-pUSUAL.

• Outro aspeto interessante e o facto de o metodo PVM devolver o valor-p igual a um apenas quando

o valor observado da estatıstica corresponde a moda da distribuicao binomial. Em geral, a moda e

a mediana da distribuicao binomial sao coincidentes, no entanto existem excecoes. Por exemplo,

para S7 ∼ Bin(7, 0.1) a mediana da distribuicao e w = 1 enquanto que a moda e µo = 0, obtendo-

se valor-pPVM = 1 se s7 = 0.

• Note-se que para a maioria dos valores de sn dos testes dos sinais, o metodo da DIST devolve

valores-p iguais aos do metodo PVM. Existem algumas excecoes, por exemplo, no caso de n ser

um numero ımpar e q = 0.5. No entanto, quando n e ımpar e a distribuicao binomial e assimetrica,

existem casos que o valor-pDIST > valor-pPVM. O mesmo acontece para n par, observando-se

casos particulares em que o metodo DIST retorna valores-p mais proximos do valor-pUSUAL.

Tendo em conta o objetivo em mente, analisa-se de seguida em que casos a escolha do metodo

de calculo do valor-p pode alterar a decisao do teste dos sinais. Os valores-p que podem alterar a

decisao do teste, em funcao de determinado valor pre-fixo de α , encontram-se assinalados nas tabelas

a negrito.

1. Distribuicao de Sn simetrica

No caso do teste a mediana de X, nota-se que:

43

Page 56: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

• Para n = 6 e 21 nao existe mudanca de decisao neste teste qualquer que seja o valor observado

da estatıstica sn.

• Quando n = 11, o valor-p dos metodos COND e da DIST conduzem a rejeicao de H0, tendo pre-

fixado α× 100% = 5%, quando a estatıstica assume o valor s11 = 2 ou s11 = 9.

• Nota-se, por vezes, uma mudanca de decisao quando se calcula o valor-p com o metodo COND.

Por exemplo quando n = 20 e s20 = 6 e tendo-se fixado α × 100% = 10%, o valor-pCOND leva a

rejeicao da hipotese H0 contrariamente ao verificado com os restantes metodos.

2. Distribuicao de Sn assimetrica

2.1. Assimetria media

Considere-se agora os testes ao primeiro quartil e ao terceiro quartil de X. E evidente que os valores-

p retornados dos testes com as hipoteses nulas H0 : χq = χ0 e H0 : χp = χ∗0, conduzidos com as

estatısticas binomiais Sn ∼ Bin(n, p) e Sn ∼ Bin(n, q), respetivamente, sao simetricos. Por exemplo,

o valor-p do teste ao χ0.25 de X quando sn = 0 e igual ao valor-p do teste ao χ0.75 se a estatıstica

for concretizada em sn = n. Portanto, se existir mudanca de decisao do teste ao quantil χ0.25 quando

sn = s o mesmo sucede no teste ao quantil χ0.75 mas no caso de sn assumir o valor (n−s). Constata-se

que todos os metodos, consoante o valor de α pre-fixado, podem alterar a decisao do teste dos sinais

como e salientado nos exemplos que se seguem:

• Quando n = 11 e tomando-se α × 100% = 5%, analisando a linha correspondente ao quantil

q = 0.25 e s11 = 5, observa-se que escolhendo o valor-pPVM a hipotese H0 seria rejeitada. O

mesmo sucede quando q = 0.75 e s11 = 6.

• Para n = 6 e q = 0.75, tomando α×100% = 5% e s6 = 4, os valores-p obtidos foram: valor-pUSUAL =

0.0752, valor-pCOL = 0.8682, valor-pPVM = valor-pDIST = 0.0376 e valor-pCOND = 0.0457. Portanto,

selecionando os metodos PVM, COND e DIST a hipoteseH0 e rejeitada. Contrariamente, os metodos

USUAL e COL nao provocam a rejeicao de H0.

2.2. Assimetria muito acentuada

No caso do teste dos sinais aos quantis χ0.1 e χ0.9, por vezes quando se utiliza o metodo PVM ou DIST

regista-se uma mudanca na decisao do teste comparativamente com a decisao obtida pelos restantes

metodos. Por exemplo, considere-se o teste ao quantil q = 0.9 de X com base numa amostra de

tamanho n = 10, pre-fixando α × 100% = 10%, quando a estatıstica S10 ∼ Bin(10, 0.1) e concretizada

no valor s10 = 3. Escolhendo o metodo PVM ou o metodo DIST o valor-p devolvido e valor-p = 0.0702,

no caso de se optar pelo metodo USUAL obtem-se valor-pUSUAL = 0.1404 e com o metodo COND resulta

valor-pCOND = 0.1078. E notorio que o metodo COL produz neste caso um valor bastante discordante,

valor-pCOL = 0.9872, comparativamente com os dos restantes metodos. O resultado do valor-pPVM

e valor-pDIST provocariam a rejeicao de H0, mas com as outras alternativas de calculo do valor-p a

44

Page 57: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

decisao seria nao rejeitar H0. Constatou-se tambem que com n = 6, todos os metodos produzem a

mesma decisao qualquer que seja o valor observado da estatıstica. Quando n = 7 e n = 21 a decisao

e alterada selecionando o metodo USUAL em vez dos restantes metodos. Por exemplo, pre-fixando

α× 100% = 5% ou α× 100% = 10% no teste ao quantil χ0.9, quando s7 = 3 e s21 = 5, respetivamente.

Analise resumo:

1. Metodo COL

• No caso da distribuicao da estatıstica Sn ser bastante assimetrica, o valor-pCOL pode originar

falsas decisoes se sn for um valor com pequena probabilidade de ocorrer.

• Quando a distribuicao de Sn e assimetrica e o valor de sn coincide com a mediana da

distribuicao, entao o valor-p e inferior a um.

• Quando n e um numero par e sn = n2 , obtem-se valor-pCOL > 1.

• Se n e um numero ımpar e o valor observado da estatıstica e sn = bn2 c ou sn = dn2 e, entao o

valor-p e igual a um.

• Este metodo produz resultados aceitaveis quando a estatıstica Sn tem distribuicao simetrica

ou pouco assimetrica.

2. Metodo PVM

• Com amostras de dimensao par ou ımpar e para estatısticas binomiais com distribuicoes

simetricas obtem-se valor-pPVM = valor-pUSUAL. No caso de n ser um numero par o metodo

PVM nunca retorna valores-p superiores a um, contrariamente ao que pode ocorrer com o

metodo USUAL, como foi analisado na Seccao 4.1.

• Caso Sn tenha uma distribuicao assimetrica a direita (esquerda), sempre que todos os pontos

i que satisfazem P (Sn = i) ≤ P (Sn = sn) fiquem a direita (esquerda) de sn verifica-se

valor-pPVM =valor-pUSUAL

2 .

• A concretizacao da estatıstica no valor da moda de Sn produz valor-pPVM = 1.

3. Metodo COND

• Para distribuicoes de Sn simetricas e com n um numero par, o valor-p devolvido pelo metodo

COND nao e igual ao valor-pUSUAL. Isto e consequencia da P (Sn ≥ ν) e da P (Sn ≤ ν) nao

atingirem o valor 0.5.

• Nota-se que em geral este metodo devolve valores-p coerentes, apesar de na maior parte

dos casos produzir valores ligeiramente inferiores aos do metodo USUAL.

45

Page 58: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

4. Metodo DIST

• O metodo DIST produz, por vezes, resultados semelhantes aos do metodo PVM. No entanto,

observa-se que quando a estatıstica tem distribuicao simetrica e n e um numero ımpar o

valor-pDIST 6= valor-pPVM, exceto quando sn corresponde aos limites da classe mediana.

• Caso a distribuicao de Sn seja assimetrica com q > 0.5, sempre que se observa sn < w

e P (Sn = sn) < P (Sn = w + d) ou sn > w e P (Sn = sn) > P (Sn = w − d), entao

valor-pDIST 6= valor-pPVM. O mesmo acontece com q < 0.5, sempre que se observa sn > w e

P (Sn = sn) < P (Sn = w − d) ou sn < w e P (Sn = sn) > P (Sn = w + d).

• Sempre que valor-pDIST 6= valor-pPVM tambem se observa que valor-pDIST e diferente do valor-p

retornado pelos restantes metodos.

• Nota-se que o metodo DIST devolve valores-p coerentes e nunca produz valores-p superiores

a um.

46

Page 59: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Capıtulo 6

Estudo de Simulacao

Neste capıtulo, apresenta-se um estudo de simulacao para avaliar o desempenho dos metodos, anteri-

ormente estudados, no calculo do valor-p e da potencia dos testes aos quantis de X:

H0 : χq = χ0 versus H1 : χq 6= χ0, q = 0.1, 0.25, 0.5, 0.75 e 0.9.

Para efetuar esta simulacao, geraram-seN = 10000 amostras com n dados originarios de uma distribuicao

F (x) simetrica ou assimetrica. Os n dados foram gerados no programa R como originarios da distribuicao

normal reduzida e da distribuicao Gama(3, 0.1) assimetrica. Alem disso, consideraram-se amostras de

dados gerados numa vizinhanca-ε, com 0 < ε < 1, da distribuicao F (x) = F = N(0, 1)

Fε(F ) = {G : G = (1− ε)F + εH} , (6.1)

com H = N(2, 4). As dimensoes das amostras geradas foram n = 6, 7, 10, 11, 20, 21, 30 e 31. Os valores

dos quantis χq foram obtido no programa R e atribuıdos a χ0. De seguida, contabilizou-se nas 10000

amostras de dimensao n, para cada metodo, a frequencia absoluta de valor-p ≤ α com α = 0.01, 0.05

e 0.1. Alem disso, foi tambem registada a frequencia do acontecimento (valor-p > 1) para os metodos

USUAL e COL. Assim, neste estudo observaram-se as frequencias: I(valor-p > 1), I(valor-p ≤ 0.01),

I(valor-p ≤ 0.05) e I(valor-p ≤ 0.1), onde I(.) representa a funcao indicatriz. O objetivo e avaliar se

existem diferencas significativas entre os metodos estudados, isto e, se o numero de amostras em que

o valor-p satisfaz as condicoes referidas e semelhante para os cinco metodos.

Para avaliar o valor das potencias dos testes de H0 : χq = χ0 versus H1 : χq = χ0 + ∆, onde

χ0 refere o quantil de ordem q de X ∼ N(0, 1), foi realizada outra simulacao estabelecendo em H1

hipoteses contıguas a H0. Agora, na validade da hipotese H1 a amostra foi gerada da distribuicao

F ∗1 = N(∆, 1), quando ∆ > 0, ou de F ∗

2 = N(∆, 1) no caso de ∆ < 0. Para cada uma das N = 10000

amostras geradas calculou-se o valor da probabilidade γ(∆) = P (rejeitarH0|H1) com os cinco metodos.

O facto de sob a validade de H1 os dados serem proveniente de uma distribuicao normal, permitiu

obter facilmente o valor de γ(∆). O estudo da potencia de testes aplicados a dados de distribuicoes

assimetricas nao foi realizado, uma vez que neste caso nao e facil alterar o valor de χ0 sem afetar a

variancia da distribuicao. O objetivo desta simulacao foi avaliar quais sao os metodos que conduzem a

47

Page 60: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

um menor valor da probabilidade de cometer o erro do tipo II, sendo isto um bom criterio para confrontar

os cinco metodos.

6.1 Simulacao do valor-p

6.1.1 Resultados para uma distribuicao simetrica

• Geracao de N = 10000 amostras com dimensao n = 6, 7, 10, 11, 20, 21, 30 e 31 de dados da

distribuicao F = N(0, 1).

As Tabelas 6.1 a 6.5 reportam os resultados dos testes bilaterais aos seguintes quantis de ordem

q = 0.1, 0.25, 0.5, 0.75 e 0.9 da distribuicao de X. Para cada valor de n e cada metodo de calculo do

valor-p e apresentado o numero de amostras (de 0 a 10000) que verificam as condicoes sobre o valor-p

referidas na primeira coluna destas tabelas. O codigo implementado no programa R para obter estes

resultados encontra-se no Apendice A.2.1.

H0 : χ0.1=−1.2816

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 5308 157 0 0 0 3664 0 0 0 0≤ 0.01 12 0 12 12 12 28 0 28 28 28≤ 0.05 169 0 169 169 169 28 0 248 248 248≤ 0.1 169 0 169 169 169 248 0 248 248 248

n = 10 n = 11

> 1 3868 15 0 0 0 3809 0 0 0 0≤ 0.01 16 0 16 16 16 28 0 28 28 28≤ 0.05 117 0 117 117 117 182 0 182 182 182≤ 0.1 117 0 684 117 684 182 0 873 182 873

n = 20 n = 21

> 1 2855 0 0 0 0 2855 0 0 0 0≤ 0.01 22 0 22 22 22 33 0 33 33 33≤ 0.05 102 0 437 102 437 139 0 139 139 139≤ 0.1 437 0 437 437 437 139 0 525 525 525

n = 30 n = 31

> 1 2340 0 0 0 0 2355 0 0 0 0≤ 0.01 21 0 81 21 81 28 0 102 28 102≤ 0.05 81 433 239 239 239 102 401 288 288 288≤ 0.1 672 433 672 672 239 689 401 689 689 288

Tabela 6.1: Numero de amostras de dados simulados da distribuicaoN(0, 1) que satisfazem valor-p > 1,valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.1.

48

Page 61: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

H0 : χ0.25=−0.6745

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3525 1365 0 0 0 3035 0 0 0 0≤ 0.01 42 0 42 42 42 10 0 10 10 10≤ 0.05 42 0 403 403 403 135 0 135 135 135≤ 0.1 403 0 403 403 403 135 0 732 135 135

n = 10 n = 11

> 1 2831 615 0 0 0 2547 0 0 0 0≤ 0.01 30 0 30 30 30 11 0 74 11 74≤ 0.05 189 0 189 189 189 74 436 335 74 74≤ 0.1 189 577 766 189 804 771 436 771 771 771

n = 20 n = 21

> 1 2018 99 0 0 0 1981 0 0 0 0≤ 0.01 69 32 69 69 37 37 21 83 37 62≤ 0.05 369 234 369 370 168 381 179 381 381 223≤ 0.1 634 906 634 634 634 381 740 726 726 726

n = 30 n = 31

> 1 1612 20 0 0 0 1626 0 0 0 0≤ 0.01 41 14 41 41 72 48 75 48 48 48≤ 0.05 300 364 300 300 219 175 293 352 393 175≤ 0.1 569 974 873 873 604 570 810 944 570 570

Tabela 6.2: Numero de amostras de dados simulados da distribuicaoN(0, 1) que satisfazem valor-p > 1,valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.25.

H0 : χ0.5=0

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3072 3072 0 0 0 1 1 0 0 0≤ 0.01 0 0 0 0 0 0 0 0 0 168≤ 0.05 339 339 339 339 339 168 168 168 168 168≤ 0.1 339 339 339 339 339 168 168 168 1300 1300

n = 10 n = 11

> 1 2431 2431 0 0 0 0 0 0 0 0≤ 0.01 32 32 32 32 32 13 13 13 130 130≤ 0.05 221 221 221 221 221 130 130 130 665 665≤ 0.1 221 221 221 1102 221 665 665 665 665 665

n = 20 n = 21

> 1 1768 1768 0 0 0 2 2 0 0 0≤ 0.01 26 26 26 118 26 69 69 69 69 69≤ 0.05 389 389 389 389 389 271 271 271 271 271≤ 0.1 389 389 389 1141 389 753 753 753 753 753

n = 30 n = 31

> 1 1415 1415 0 0 0 2 2 0 0 0≤ 0.01 54 54 54 54 54 30 30 30 107 107≤ 0.05 409 409 409 409 409 274 274 274 274 274≤ 0.1 998 998 998 998 998 705 705 705 705 705

Tabela 6.3: Numero de amostras de dados simulados da distribuicaoN(0, 1) que satisfazem valor-p > 1,valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.5.

49

Page 62: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

H0 : χ0.75=0.6745

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3583 1328 0 0 0 3134 1 1 0 0≤ 0.01 35 0 35 35 35 13 0 13 13 13≤ 0.05 35 0 375 375 375 112 0 112 112 112≤ 0.1 375 0 375 375 375 112 0 725 112 112

n = 10 n = 11

> 1 2796 602 0 0 0 2568 0 0 0 0≤ 0.01 42 0 42 42 42 14 0 75 14 75≤ 0.05 191 0 191 191 191 75 391 343 75 75≤ 0.1 191 561 751 191 793 734 392 735 734 734

n = 20 n = 21

> 1 2087 102 0 0 0 2047 0 0 0 0≤ 0.01 73 27 73 73 46 47 25 92 47 67≤ 0.05 373 225 373 373 175 367 169 367 367 223≤ 0.1 616 907 616 616 616 367 737 712 712 712

n = 30 n = 31

> 1 1699 24 0 0 0 1633 0 0 0 0≤ 0.01 61 26 61 61 100 71 84 71 71 71≤ 0.05 339 366 339 339 260 210 292 391 418 210≤ 0.1 601 935 886 886 625 599 788 960 599 599

Tabela 6.4: Numero de amostras de dados simulados da distribuicaoN(0, 1) que satisfazem valor-p > 1,valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.75.

H0 : χ0.9=1.2816

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 5320 137 0 0 0 3703 0 0 0 0≤ 0.01 16 0 16 16 16 36 0 36 36 36≤ 0.05 153 0 153 153 153 36 0 246 246 246≤ 0.1 153 0 153 153 153 246 0 246 246 246

n = 10 n = 11

> 1 3884 12 0 0 0 3853 0 0 0 0≤ 0.01 17 0 17 17 17 26 0 26 26 26≤ 0.05 123 0 123 123 123 199 0 199 199 199≤ 0.1 123 0 721 123 721 199 0 929 199 929

n = 20 n = 21

> 1 2892 0 0 0 0 2870 0 0 0 0≤ 0.01 34 0 34 34 34 41 0 41 41 41≤ 0.05 128 0 434 128 434 151 0 151 151 151≤ 0.1 434 0 434 434 434 151 0 527 527 527

n = 30 n = 31

> 1 2367 0 0 0 0 2401 0 0 0 0≤ 0.01 23 0 100 23 100 33 0 116 33 116≤ 0.05 100 397 288 288 288 116 345 323 323 323≤ 0.1 685 397 685 685 288 668 345 668 668 323

Tabela 6.5: Numero de amostras de dados simulados da distribuicaoN(0, 1) que satisfazem valor-p > 1,valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.9.

50

Page 63: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

6.1.2 Resultados para um distribuicao assimetrica

• Geracao de N = 10000 amostras com dimensao n = 6, 7, 10, 11, 20, 21, 30 e 31 de dados da

distribuicao F = Gama(3, 0.1).

Na Figura 6.1 encontra-se a funcao densidade de probabilidade da variavel aleatoriaX ∼ Gama(3, 0.1),

onde se pode visualizar a assimetria desta distribuicao.

Figura 6.1: Grafico da funcao densidade de probabilidade de X ∼ Gama(3, 0.1)

O numero de amostras que verificam cada uma das condicoes relativas ao valor-p dos testes os

cinco quantis, pode ser consultado nas Tabelas 6.6 a 6.10. O programa R pode ser consultado no

Apendice A.2.2.

H0 : χ0.1=11.0207

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 5332 148 0 0 0 3727 0 0 0 0≤ 0.01 12 0 12 12 12 31 0 31 31 31≤ 0.05 160 0 160 160 160 31 0 242 242 242≤ 0.1 160 0 160 160 160 242 0 242 242 242

n = 10 n = 11

> 1 3914 21 0 0 0 3817 0 0 0 0≤ 0.01 23 0 23 23 23 34 0 34 34 34≤ 0.05 133 0 133 133 133 194 0 194 194 194≤ 0.1 133 0 707 133 707 194 0 925 194 925

n = 20 n = 21

> 1 2861 0 0 0 0 2840 0 0 0 0≤ 0.01 27 0 27 27 27 33 0 33 33 33≤ 0.05 128 0 447 128 447 167 0 167 167 167≤ 0.1 447 0 447 447 447 167 0 531 531 531

n = 30 n = 31

> 1 2379 0 0 0 0 2369 0 0 0 0≤ 0.01 26 0 102 26 102 34 0 118 34 118≤ 0.05 102 395 285 285 285 118 354 328 328 328≤ 0.1 680 395 680 680 285 682 354 682 682 328

Tabela 6.6: Numero de amostras de dados simulados da distribuicao Gama(3, 0.1) que satisfazemvalor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.1.

51

Page 64: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

H0 : χ0.25=17.2730

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3618 1325 0 0 0 3032 0 0 0 0≤ 0.01 38 0 38 38 38 13 0 13 13 13≤ 0.05 38 0 373 373 373 120 0 120 120 120≤ 0.1 373 0 373 373 373 120 0 713 120 120

n = 10 n = 11

> 1 2844 592 0 0 0 2571 0 0 0 0≤ 0.01 46 0 46 46 46 24 0 87 24 87≤ 0.05 205 0 205 205 205 87 433 351 87 87≤ 0.1 205 556 761 205 797 784 433 784 784 784

n = 20 n = 21

> 1 2023 98 0 0 0 2021 0 0 0 0≤ 0.01 72 28 72 72 44 45 23 97 45 74≤ 0.05 381 239 381 381 170 393 181 393 393 235≤ 0.1 658 910 658 658 658 393 730 745 745 745

n = 30 n = 31

> 1 1627 32 0 0 0 1601 0 0 0 0≤ 0.01 60 19 60 60 100 71 79 71 71 71≤ 0.05 314 340 314 314 235 202 295 367 418 202≤ 0.1 556 950 877 877 635 583 797 958 583 583

Tabela 6.7: Numero de amostras de dados simulados da distribuicao Gama(3, 0.1) que satisfazemvalor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.25.

H0 : χ0.5=26.7406

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3072 3072 0 0 0 1 1 0 0 0≤ 0.01 0 0 0 0 0 0 0 0 0 178≤ 0.05 329 329 329 329 329 178 178 178 178 178≤ 0.1 329 329 329 329 329 178 178 178 1301 1301

n = 10 n = 11

> 1 2386 2386 0 0 0 0 0 0 0 0≤ 0.01 32 32 32 32 32 15 15 15 141 141≤ 0.05 231 231 231 231 231 141 141 141 686 686≤ 0.1 231 231 231 1130 231 686 686 686 686 686

n = 20 n = 21

> 1 1751 1751 0 0 0 1 1 0 0 0≤ 0.01 23 23 23 130 23 73 73 73 73 73≤ 0.05 444 444 444 444 444 270 270 270 270 270≤ 0.1 444 444 444 1196 444 831 831 831 831 831

n = 30 n = 31

> 1 1430 1430 0 0 0 0 0 0 0 0≤ 0.01 45 45 45 45 45 32 32 32 92 92≤ 0.05 417 417 417 417 417 277 277 277 277 277≤ 0.1 985 985 985 985 985 731 731 731 731 731

Tabela 6.8: Numero de amostras de dados simulados da distribuicao Gama(3, 0.1) que satisfazemvalor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.5.

52

Page 65: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

H0 : χ0.75=39.2040

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3505 1309 0 0 0 3137 0 0 0 0≤ 0.01 47 0 47 47 47 11 0 11 11 11≤ 0.05 47 0 395 395 395 134 0 134 134 134≤ 0.1 395 0 395 395 395 134 0 701 134 134

n = 10 n = 11

> 1 2725 588 0 0 0 2604 0 0 0 0≤ 0.01 40 0 40 40 40 16 0 80 16 80≤ 0.05 192 0 192 192 192 80 435 322 80 80≤ 0.1 192 586 778 192 780 757 435 757 757 757

n = 20 n = 21

> 1 2027 97 0 0 0 1950 0 0 0 0≤ 0.01 79 35 79 79 44 42 28 101 42 73≤ 0.05 384 243 384 384 176 389 191 389 389 226≤ 0.1 647 954 647 647 647 389 780 736 736 736

n = 30 n = 31

> 1 1646 14 0 0 0 1652 0 0 0 0≤ 0.01 42 19 42 42 82 56 87 56 56 56≤ 0.05 321 398 321 321 223 193 323 366 429 193≤ 0.1 602 1001 891 891 610 602 852 959 602 602

Tabela 6.9: Numero de amostras de dados simulados da distribuicao Gama(3, 0.1) que satisfazemvalor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.75.

H0 : χ0.9=53.2232

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 5325 139 0 0 0 3747 0 0 0 0≤ 0.01 9 0 9 9 9 25 0 25 25 25≤ 0.05 148 0 148 148 148 25 0 261 261 261≤ 0.1 148 0 148 148 148 261 0 261 261 261

n = 10 n = 11

> 1 3849 14 0 0 0 3782 0 0 0 0≤ 0.01 15 0 15 15 15 25 0 25 25 25≤ 0.05 132 0 132 132 132 202 0 202 202 202≤ 0.1 132 0 707 132 707 202 0 895 202 895

n = 20 n = 21

> 1 2861 0 0 0 0 2829 0 0 0 0≤ 0.01 24 0 24 24 24 28 0 28 28 28≤ 0.05 107 0 442 107 442 149 0 149 149 149≤ 0.1 442 0 442 442 442 149 0 554 554 554

n = 30 n = 31

> 1 2388 0 0 0 0 2312 0 0 0 0≤ 0.01 15 0 69 15 69 17 0 89 17 89≤ 0.05 69 429 267 267 267 89 379 317 317 317≤ 0.1 696 429 696 696 267 696 379 696 696 317

Tabela 6.10: Numero de amostras de dados simulados da distribuicao Gama(3, 0.1) que satisfazemvalor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.9.

53

Page 66: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

6.1.3 Resultados para uma distribuicao F1−IU [i]≤0.9(F )

• Geracao de N = 10000 amostras com dimensao n = 6, 7, 10, 11, 20, 21, 30 e 31 de dados da

distribuicao F1−IU[i]≤0.9(F ) = I(U [i]≤0.9)N(0, 1) + (1 − I(U [i]≤0.9))N(2, 4), com U ∼ U(0, 1) e i =

1, . . . , n, maioritariamente originarios da distribuicao N(0, 1) mas com a introducao de algum ruıdo

aleatorio. Estas amostras foram simuladas, com o programa apresentado no Apendice A.2.3,

utilizando o seguinte procedimento:

1. Gerou-se uma amostra da variavel aleatoria U de tamanho n, recorrendo a funcao de geracao

de dados uniformes runif(n) do programa R,

2. Se U [i] ≤ 0.9, com i = 1, . . . , n, entao o i−esimo elemento da amostra e gerado atribuindo

xi = rnorm(1,0,1) e no caso contrario xi = rnorm(1,2,4), sendo rnorm a funcao do pro-

grama R utilizada para a geracao de dados normais.

Nesta simulacao, em vez do procedimento acima, tambem foram utilizadas amostras com 10% dos n

dados gerados de acordo com a distribuicao H = N(2, 4), ou seja, originarias da vizinhanca F0.1(F ) =

0.9N(0, 1) + 0.1N(2, 4). Constatou-se que os valores-p dos testes conduzidos com amostras gera-

das de F0.1(F ) e de F1−IU[i]≤0.9(F ) foram semelhantes. Assim, optou-se por omitir os resultados dos

valores-p dos testes das amostras sujeitas a contaminacao determinıstica. O quantil q da distribuicao

F1−IU[i]≤0.9(F ) foi simulado recorrendo ao procedimento anterior para uma amostra de dimensao 1000000.

Os resultados da simulacao dos valores-p dos testes aos quantis de F estao reportados nas Tabe-

las 6.11 a 6.15. Alem disso, sao tambem apresentados nas Tabelas 6.16 a 6.20 os resultados dos

testes aos quantis de F de forma a averiguar se o teste e influenciado pela presenca de observacoes

discordantes. Em Yohai e Zamar (2004) foi proposta uma robustificacao do teste dos sinais bilateral

para o caso de amostras contaminadas.

54

Page 67: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

A. Testes aos quantis de F obtidos por simulacao

H0 : χ0.1=−1.2521

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 5378 164 0 0 0 3733 0 0 0 0≤ 0.01 14 0 14 14 14 30 0 30 30 30≤ 0.05 178 0 178 178 178 30 0 261 261 261≤ 0.1 178 0 178 178 178 261 0 261 261 261

n = 10 n = 11

> 1 3742 11 0 0 0 3691 0 0 0 0≤ 0.01 13 0 13 13 13 27 0 27 27 27≤ 0.05 126 0 126 126 126 186 0 186 186 186≤ 0.1 126 0 707 126 707 186 0 914 186 914

n = 20 n = 21

> 1 2857 0 0 0 0 2833 0 0 0 0≤ 0.01 17 0 17 17 17 48 0 48 48 48≤ 0.05 111 0 465 111 465 159 0 159 159 159≤ 0.1 465 0 465 465 465 159 0 521 521 521

n = 30 n = 31

> 1 2373 0 0 0 0 2315 0 0 0 0≤ 0.01 23 0 86 23 86 33 0 100 33 100≤ 0.05 86 416 269 269 269 100 381 320 320 320≤ 0.1 685 416 686 685 269 701 381 701 701 320

Tabela 6.11: Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.1 da distribuicao F .

H0 : χ0.25=−0.6212

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3530 1377 0 0 0 3109 0 0 0 0≤ 0.01 58 0 58 58 58 6 0 6 6 6≤ 0.05 58 0 406 406 406 129 0 129 129 129≤ 0.1 406 0 406 406 406 129 0 674 129 129

n = 10 n = 11

> 1 2858 561 0 0 0 2551 0 0 0 0≤ 0.01 35 0 35 35 35 7 0 73 7 73≤ 0.05 206 0 206 206 206 73 443 330 73 73≤ 0.1 206 567 773 206 767 773 443 773 773 773

n = 20 n = 21

> 1 2087 92 0 0 0 1963 0 0 0 0≤ 0.01 70 34 70 70 34 57 33 99 57 66≤ 0.05 365 239 365 365 162 406 197 406 406 242≤ 0.1 647 868 647 647 647 406 761 702 702 702

n = 30 n = 31

> 1 1676 14 0 0 0 1586 0 0 0 0≤ 0.01 46 21 46 46 77 58 79 58 58 57≤ 0.05 312 352 312 312 230 211 309 386 441 211≤ 0.1 561 939 851 851 602 616 813 978 616 616

Tabela 6.12: Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.25 da distribuicao F .

55

Page 68: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

H0 : χ0.5=0.0922

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3049 3049 0 0 0 0 0 0 0 0≤ 0.01 0 0 0 0 0 0 0 0 0 161≤ 0.05 315 315 315 315 315 161 161 161 161 161≤ 0.1 315 315 315 315 315 161 161 161 1300 1300

n = 10 n = 11

> 1 2489 2489 0 0 0 1 1 0 0 0≤ 0.01 17 17 17 17 17 6 6 6 110 110≤ 0.05 230 230 230 230 230 110 110 110 646 646≤ 0.1 230 230 230 1114 230 646 646 646 646 646

n = 20 n = 21

> 1 1736 1736 0 0 0 0 0 0 0 0≤ 0.01 22 22 22 105 22 74 74 74 74 74≤ 0.05 422 422 422 422 422 282 282 282 282 282≤ 0.1 422 422 422 1176 422 773 773 773 774 773

n = 30 n = 31

> 1 1362 1362 0 0 0 0 0 0 0 0≤ 0.01 48 48 48 48 48 33 33 33 111 111≤ 0.05 413 413 413 413 413 292 292 292 292 292≤ 0.1 989 989 989 989 989 710 710 710 710 710

Tabela 6.13: Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.5 da distribuicao F .

H0 : χ0.75=0.8486

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3584 1328 0 0 0 2965 0 0 0 0≤ 0.01 42 0 42 42 42 8 0 8 8 8≤ 0.05 43 0 385 385 385 123 0 123 123 123≤ 0.1 385 0 385 385 385 123 0 732 123 123

n = 10 n = 11

> 1 2745 605 0 0 0 2421 0 0 0 0≤ 0.01 32 0 32 32 32 15 0 98 15 98≤ 0.05 208 0 208 208 208 98 418 364 98 98≤ 0.1 208 574 782 208 813 782 418 782 782 783

n = 20 n = 21

> 1 2010 94 0 0 0 1999 0 0 0 0≤ 0.01 92 40 92 92 52 36 20 85 36 65≤ 0.05 388 243 388 389 186 413 193 413 413 240≤ 0.1 697 875 697 697 697 414 762 759 759 759

n = 30 n = 31

> 1 1617 17 0 0 0 1579 0 0 0 0≤ 0.01 45 20 45 45 73 41 86 41 41 41≤ 0.05 312 365 312 312 227 214 314 405 441 214≤ 0.1 572 993 886 886 626 633 851 980 633 632

Tabela 6.14: Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.75 da distribuicao F .

56

Page 69: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

H0 : χ0.9=1.6642

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 5274 153 0 0 0 3713 0 0 0 0≤ 0.01 9 0 9 9 9 28 0 28 28 28≤ 0.05 162 0 162 162 162 28 0 261 261 261≤ 0.1 162 0 162 162 162 261 0 261 261 261

n = 10 n = 11

> 1 3871 16 0 0 0 3775 0 0 0 0≤ 0.01 19 0 19 19 19 24 0 24 24 24≤ 0.05 146 0 146 146 146 180 0 180 180 180≤ 0.1 146 0 724 146 724 180 0 904 180 904

n = 20 n = 21

> 1 2798 0 0 0 0 2891 0 0 0 0≤ 0.01 32 0 32 32 32 35 0 35 35 35≤ 0.05 125 0 438 125 438 158 0 158 158 158≤ 0.1 438 0 438 438 438 158 0 544 544 544

n = 30 n = 31

> 1 2378 0 0 0 0 2352 0 0 0 0≤ 0.01 22 0 92 22 92 35 0 110 35 110≤ 0.05 92 457 262 262 262 110 395 313 313 313≤ 0.1 719 457 718 718 262 708 395 708 708 313

Tabela 6.15: Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.9 da distribuicao F .

57

Page 70: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

B. Testes aos quantis de F

H0 : χ0.1=−1.2816

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 5543 143 0 0 0 3660 0 0 0 0≤ 0.01 10 0 10 10 10 24 0 24 24 24≤ 0.05 153 0 153 153 153 24 0 224 224 224≤ 0.1 153 0 153 153 153 224 0 224 224 224

n = 10 n = 11

> 1 3751 10 0 0 0 3735 0 0 0 0≤ 0.01 11 0 11 11 11 21 0 21 21 21≤ 0.05 101 0 101 101 101 158 0 158 158 158≤ 0.1 101 0 617 101 617 158 0 808 158 808

n = 20 n = 21

> 1 2857 0 0 0 0 2846 0 0 0 0≤ 0.01 16 0 16 16 16 40 0 40 40 40≤ 0.05 90 0 385 90 385 131 0 131 131 131≤ 0.1 385 0 385 385 385 131 0 445 445 445

n = 30 n = 31

> 1 2386 0 0 0 0 2370 0 0 0 0≤ 0.01 16 0 59 16 59 23 0 84 23 84≤ 0.05 59 504 202 202 202 84 448 253 253 253≤ 0.1 706 504 706 706 202 701 448 701 701 253

Tabela 6.16: Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.1 da distribuicao F .

H0 : χ0.25=−0.6745

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3683 1205 0 0 0 3021 0 0 0 0≤ 0.01 44 0 44 44 44 4 0 4 4 4≤ 0.05 44 0 324 324 324 85 0 85 85 85≤ 0.1 324 0 324 324 324 85 0 556 85 85

n = 10 n = 11

> 1 2986 461 0 0 0 2516 0 0 0 0≤ 0.01 26 0 26 26 26 6 0 49 6 49≤ 0.05 153 0 153 153 153 75 437 332 75 75≤ 0.1 153 703 855 153 614 812 562 812 812 812

n = 20 n = 21

> 1 2009 63 0 0 0 1984 0 0 0 0≤ 0.01 67 47 67 67 20 58 44 88 58 44≤ 0.05 409 326 409 409 130 426 288 426 426 130≤ 0.1 603 1150 603 603 603 426 1030 644 644 644

n = 30 n = 31

> 1 1689 10 0 0 0 1536 0 0 0 0≤ 0.01 48 34 48 48 46 55 133 55 55 55≤ 0.05 275 536 275 275 148 205 479 306 551 205≤ 0.1 650 1360 844 844 469 652 1176 899 652 652

Tabela 6.17: Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.25 da distribuicao F .

58

Page 71: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

H0 : χ0.5=0

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3082 3082 0 0 0 0 0 0 0 0≤ 0.01 0 0 0 0 0 0 0 0 0 173≤ 0.05 346 346 346 346 346 174 174 174 174 174≤ 0.1 346 346 346 346 346 174 174 174 1333 1333

n = 10 n = 11

> 1 2429 2429 0 0 0 0 0 0 0 0≤ 0.01 18 18 18 18 18 8 8 8 144 144≤ 0.05 247 247 247 247 247 144 144 144 728 728≤ 0.1 247 247 247 1194 247 728 728 728 729 728

n = 20 n = 21

> 1 1637 1637 0 0 0 0 0 0 0 0≤ 0.01 38 38 38 157 38 104 104 104 104 104≤ 0.05 536 536 536 537 537 354 354 354 354 354≤ 0.1 537 537 537 1358 537 937 937 937 939 937

n = 30 n = 31

> 1 1334 1334 0 0 0 0 0 0 0 0≤ 0.01 85 85 85 85 85 61 61 61 164 164≤ 0.05 566 566 566 566 566 407 407 407 407 407≤ 0.1 1262 1262 1262 1262 1263 881 881 881 881 881

Tabela 6.18: Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.5 da distribuicao F .

H0 : χ0.75=0.6745

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3054 1844 0 0 0 3082 1 0 0 0≤ 0.01 104 0 104 104 104 34 0 34 34 34≤ 0.05 104 0 721 721 721 282 0 282 282 282≤ 0.1 721 0 721 721 721 282 0 1292 282 282

n = 10 n = 11

> 1 2775 1069 0 0 0 2497 0 0 0 0≤ 0.01 100 0 100 100 100 49 0 216 49 216≤ 0.05 477 0 477 477 477 216 186 761 216 216≤ 0.1 477 303 779 477 1546 947 186 947 947 947

n = 20 n = 21

> 1 1755 334 0 0 0 1612 0 0 0 0≤ 0.01 187 12 187 187 175 102 6 277 102 271≤ 0.05 587 78 587 587 521 743 60 743 743 689≤ 0.1 1227 348 1227 1227 1227 743 270 1574 1574 1574

n = 30 n = 31

> 1 1183 97 0 0 0 1366 0 0 0 0≤ 0.01 152 3 152 152 408 241 17 241 241 242≤ 0.05 873 99 873 873 859 607 77 1123 667 607≤ 0.1 956 303 1706 1706 1624 1183 237 2073 1184 1184

Tabela 6.19: Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.75 da distribuicao F .

59

Page 72: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

H0 : χ0.9=1.2816

n = 6 n = 7

valor-p USUAL COL PVM COND DIST USUAL COL PVM COND DIST

> 1 3674 446 0 0 0 3946 0 0 0 0≤ 0.01 60 0 60 60 60 143 0 143 143 143≤ 0.05 506 0 506 506 506 143 0 815 815 815≤ 0.1 506 0 506 506 506 815 0 815 815 815

n = 10 n = 11

> 1 3382 102 0 0 0 3173 0 0 0 0≤ 0.01 123 0 123 123 123 180 0 180 180 180≤ 0.05 592 0 592 592 592 782 0 782 782 782≤ 0.1 592 0 1874 592 1874 782 0 2324 782 2324

n = 20 n = 21

> 1 2189 0 0 0 0 2063 0 0 0 0≤ 0.01 268 0 268 268 268 336 0 336 336 336≤ 0.05 821 0 1931 821 1931 934 0 934 934 934≤ 0.1 1931 0 1931 1931 1931 934 0 2100 2100 2100

n = 30 n = 31

> 1 1636 0 0 0 0 1491 0 0 0 0≤ 0.01 330 0 814 330 814 417 0 949 417 949≤ 0.05 814 73 1708 1708 1708 949 59 1914 1914 1914≤ 0.1 1781 73 1781 1781 1708 1973 59 1973 1973 1914

Tabela 6.20: Numero de amostras de dados simulados da distribuicao F1−IU[i]≤0.9(F ) que satisfazem

valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 no teste ao quantil 0.9 da distribuicao F .

60

Page 73: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

6.2 Simulacao da potencia

A potencia γ, como se viu na Seccao 3.2.4, e uma medida da capacidade de o teste detetar com

precisao que a hipotese nula e falsa. Contabiliza portanto qual e o valor da probabilidade de nao se

cometer um erro do tipo II, sendo γ = 1 − β. Quando em H1 e estipulada uma hipotese composta,

resulta que γ(θ) e uma funcao de θ ∈ Θ1.

Um teste com potencia elevada ( ≈ 1) permite que a decisao de nao rejeitar H0 seja tomada com

pouco risco de ser falsa, isto e, da seguranca na tomada de decisao. Um teste estatıstico com fraco

poder para detetar que a amostra e concordante com H1 provoca indecisao acerca da validade de H0.

Afim de comparar os valores das potencias dos testes dos sinais produzidos pelos metodos USUAL,

COL, PVM, COND e DIST, consideraram-se os testes:

H0 : χq = χ0 vs H1 : χq = χ0 + ∆i,

onde χ0 indica o quantil de ordem q de X ∼ N(0, 1) e ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3. Sob a

validade de H1, efetuou-se:

• Geracao de N = 10000 amostras com dimensao n = 6, 7, 10, 11, 20, 21, 30 e 31 de dados das

distribuicoes F ∗1 = N(∆i, 1), com ∆i > 0, ou de F ∗

2 = N(∆i, 1) quando ∆i < 0,

e calculou-se com os cinco metodos o valor de γ(∆i) = P (rejeitarH0|H1). Como na validade de H1

se admitiu que os dados provem de F ∗1 ou de F ∗

2 , resultam as duas estatısticas dos testes dos sinais

S∗1n ∼ Bin(n, p∗1), com p∗1 = P (X > χ0|F ∗

1 ), e S∗2n ∼ Bin(n, p∗2) onde p∗2 = P (X > χ0|F ∗

2 ). Note-se que

as funcoes potencias destes testes, com a excecao do teste a mediana de X, nao apresentam qualquer

simetria em torno do valor χ0. Para evidenciar este facto, considere-se como exemplo o teste ao quantil

0.1 de X ∼ N(0, 1) com ∆i = ±0.25:

H0 : χ0.1 = −1.2816 vs H1 : χ0.1 = −1.2816± 0.25.

Neste caso, como p∗1 = 1 − Φ(−1.5316) ≈ 0.937 e p∗2 = 1 − Φ(−1.0316) ≈ 0.849 as distribuicoes

S∗1n ∼ Bin(n, 0.937) e de S∗

2n ∼ Bin(n, 0.849) nao tem qualquer relacao. Tratando-se dos testes a

mediana de X ∼ N(0, 1), com H0 : χ 12

= 0 vs H1 : χ 12

= ±0.25, obtem-se p∗1 = 1 − Φ(−0.25) ≈ 0.599

e p∗2 = 1 − Φ(0.25) ≈ 0.401 e como p∗1 + p∗2 = 1 resulta que S∗2n = n − S∗

1n. Nestes testes, como as

potencias sao simetricas em torno de zero apenas se fixaram os valores de ∆i > 0.

Os valores das potencias representados nas Figuras 6.2 a 6.10 sao as potencias medias obtidas nas

N = 10000 amostras simuladas. Nos metodos USUAL e COL foram retiradas as amostras que conduziram

a γ(∆i) > 1, uma vez que estes dois metodos podem devolver probabilidades superiores a um.

61

Page 74: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0.0

0.2

0.4

0.6

0.8

1.0

n=6

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=6

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=7

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=7

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=10

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=10

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=11

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=11

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

Figura 6.2: Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste aoquantil χ0.1 com H1 : χ0.1 = −1.2816 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3. Amostras comdimensao n = 6, 7, 10 e 11. 62

Page 75: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0.0

0.2

0.4

0.6

0.8

1.0

n=20

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=20

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=21

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=21

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=30

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=30

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=31

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=31

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

Figura 6.3: Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste aoquantil χ0.1 com H1 : χ0.1 = −1.2816 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3. Amostras comdimensao n = 20, 21, 30 e 31. 63

Page 76: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0.0

0.2

0.4

0.6

0.8

1.0

n=6

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=6

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=7

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=7

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=10

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=10

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=11

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=11

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

Figura 6.4: Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste aoquantil χ0.25 com H1 : χ0.25 = −0.6745 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3. Amostras comdimensao n = 6, 7, 10 e 11. 64

Page 77: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0.0

0.2

0.4

0.6

0.8

1.0

n=20

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=20

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=21

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=21

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=30

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=30

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=31

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=31

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

Figura 6.5: Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste aoquantil χ0.25 com H1 : χ0.25 = −0.6745 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3. Amostras comdimensao n = 20, 21, 30 e 31. 65

Page 78: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0.0

0.2

0.4

0.6

0.8

1.0

n=6

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=7

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=10

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=11

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=20

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=21

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=30

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=31

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

Figura 6.6: Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste aoquantil χ0.5 com H1 : χ0.5 = 0 + ∆i, para ∆i = 0.25, 0.5, 1.5, 2, 2.5 e 3. Amostras com dimensaon = 6, 7, 10, 11, 20, 21, 30 e 31. 66

Page 79: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0.0

0.2

0.4

0.6

0.8

1.0

n=6

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=6

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=7

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=7

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=10

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=10

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=11

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=11

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

Figura 6.7: Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste aoquantil χ0.75 com H1 : χ0.75 = 0.6745 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3. Amostras comdimensao n = 6, 7, 10 e 11. 67

Page 80: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0.0

0.2

0.4

0.6

0.8

1.0

n=20

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=20

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=21

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=21

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=30

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=30

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=31

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=31

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

Figura 6.8: Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste aoquantil χ0.75 com H1 : χ0.75 = 0.6745 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3. Amostras comdimensao n = 20, 21, 30 e 31. 68

Page 81: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0.0

0.2

0.4

0.6

0.8

1.0

n=6

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=6

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=7

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=7

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=10

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=10

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=11

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=11

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

Figura 6.9: Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste aoquantil χ0.9 com H1 : χ0.9 = 1.2816 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3. Amostras comdimensao n = 6, 7, 10 e 11. 69

Page 82: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

0.0

0.2

0.4

0.6

0.8

1.0

n=20

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=20

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=21

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=21

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=30

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=30

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

0.0

0.2

0.4

0.6

0.8

1.0

n=31

Pot

ênci

a

−3.0 −2.5 −2.0 −1.5 −1.0 −0.5

USUALCOLPVMCONDDIST 0.

00.

20.

40.

60.

81.

0

n=31

Pot

ênci

a

0.5 1.0 1.5 2.0 2.5 3.0

USUALCOLPVMCONDDIST

Figura 6.10: Graficos das funcoes potencias dos metodos USUAL, COL, PVM, COND e DIST no teste aoquantil χ0.9 com H1 : χ0.9 = 1.2816 + ∆i, para ∆i = ±0.25,±0.5,±1.5,±2,±2.5 e ±3. Amostras comdimensao n = 20, 21, 30 e 31. 70

Page 83: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

6.3 Interpretacao dos Resultados

6.3.1 Simulacao do valor-p

Apos uma analise detalhada das tabelas 6.1 a 6.20, foram observadas algumas semelhancas entre o

numero cardinal de amostras que satisfazem as condicoes impostas ao valor-p nos testes aos quantis

χq e χp, com q = 1−p, implementados com dados gerados das distribuicoes consideradas nas seccoes

6.1.1 a 6.1.3 de X. Posto isto, para nao tornar a interpretacao dos resultados tao exaustiva, tendo em

conta o numero de tabelas produzidas, decidiu-se dividir a analise da simulacao do valor-p pelos testes

aos cinco quantis estudados. Alem disso, uma vez que os resultados mais relevantes do teste ao quantil

χ0.1 sao semelhantes aos do teste ao quantil χ0.9, porque as estatısticas tem a mesma probabilidade

de assumir os valores k ∈ RSn e (n−k) ∈ RSn , respetivamente, decidiu-se fazer a interpretacao destes

dois quantis em conjunto. A interpretacao dos testes aos quantis χ0.25 e χ0.75 tambem foi feita em

simultaneo.

Os resultados obtidos pelo metodo COL para distribuicoes de Sn assimetricas nao sao analisados,

tem-se apenas em conta os seus resultados obtidos nos testes ao quantil χ0.5, pois como foi referido

no capıtulo 5 e o unico caso em que o metodo funciona.

Interpretacao dos valores-p dos testes aos quantis χ0.1 e χ0.9 (Tabelas 6.1 e 6.5, 6.6 e 6.10, 6.11 e

6.15, 6.16 e 6.20)

• Quando o tamanho da amostra em estudo e n = 6, o cardinal de amostras que verificam cada uma

das condicoes acerca do valor-p e igual em todos os metodos de calculo do valor-p. No entanto,

quando n = 7 observa-se uma diferenca no cardinal de amostras que satisfazem valor-p ≤ 0.05

quando se utiliza o metodo USUAL no calculo do valor-p.

• No caso de n = 10 ou n = 11, o cardinal de amostras que satisfazem a condicao valor-p ≤ 0.1

aumenta significativamente quando selecionados os metodos PVM e DIST. Os resultados obtidos

na simulacao do valor-p dos testes a estes quantis estao em concordancia com os resultados

obtidos nas Tabelas 5.6 e 5.7, do Capıtulo 5. Ou seja, analisando os valores-p dos testes aos

quantis χ0.1 e χ0.9 das Tabelas 5.6 e 5.7, existe uma mudanca de decisao do teste dos sinais

quando os metodos PVM e DIST sao empregues no calculo do valor-p. Neste caso, fixando-se

α× 100% = 10% a hipotese H0 e rejeitada, por exemplo quando sn = 3 e q = 0.9, com estes dois

metodos. Da analise das referidas tabelas pode-se inferir que pre-fixando α× 100% = 10%, como

o cardinal das amostras que satisfazem valor-p ≤ α aumenta quando os metodos DIST e PVM sao

utilizados, constata-se que a hipotese H0 e rejeitada mais vezes.

• Quando a amostra gerada tem dimensao n = 20 verifica-se a mesma ocorrencia referida no ponto

anterior mas para a condicao valor-p ≤ 0.05. Analisando a Tabela 5.8 e evidente que existe

alteracao da decisao do teste quando os metodos DIST e PVM sao selecionados e a estatıstica

e concretizada em s20 = 15 ou s20 = 5 no teste ao quantil χ0.1 ou χ0.9, respetivamente. Esta

informacao e concordante com os resultados reportados, pois se existem mais amostras que

71

Page 84: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

satisfazem valor-p ≤ 0.05, com α× 100% = 5% pre-fixado, entao H0 e rejeitada, em geral, 4 vezes

mais do que selecionando os outros metodos. Quando n = 21, a condicao valor-pUSUAL ≤ 0.1

regista um cardinal menor que o dos restantes metodos. Repare-se que este facto e consequencia

do valor-pUSUAL obtido na Tabela 5.9 quando s21 = 16 e s21 = 5, respetivamente, nos testes aos

quantis χ0.1e χ0.9.

• Para amostras geradas com n = 30 e n = 31, mais uma vez utilizando o metodo PVM e DIST

observa-se que o cardinal de amostras que verificam a condicao valor-p ≤ 0.01 e maior que o dos

outros metodos. Verifica-se tambem que o numero de amostras que satisfazem valor-p ≤ 0.05

e menor utilizando o metodo USUAL e que o numero de amostras que verificam valor-p ≤ 0.1 e

menor utilizando o metodo DIST. Isto sugere que, por exemplo fixando α × 100% = 10% existe

uma mudanca na decisao utilizando o metodo DIST comparativamente com os restantes metodos.

Com o metodo DIST a probabilidade para nao rejeitar a hipotese H0 e, em geral, 3 vezes superior

a obtida com os restantes metodos.

Interpretacao dos valores-p dos testes aos quantis χ0.25 e χ0.75 (Tabelas 6.2 e 6.4, 6.7 e 6.9, 6.12

e 6.14, 6.17 e 6.19)

• Quando n = 6 regista-se que o cardinal de amostras que satisfazem valor-pUSUAL ≤ 0.05 e me-

nor relativamente ao dos outros metodos, portanto selecionando este metodo existe uma menor

probabilidade de rejeitar H0 tendo-se pre-fixado α×100% = 5%. No caso da dimensao das amos-

tras ser n = 7 existe uma maior probabilidade de rejeitar a hipotese H0 quando e selecionado o

metodo PVM, uma vez que apresenta um numero cardinal de amostras maior que verificam esta

condicao comparativamente com os restantes metodos.

• Para n = 10, o numero de amostras que satisfazem a condicao valor-p ≤ 0.1 e inferior quando

se utiliza o metodo USUAL e COND (cerca de 200 nas 10000 amostras), sugerindo que quando se

aplica o teste dos sinais com α × 100% = 10%, H0 nao e rejeitada tantas vezes em comparacao

com o que ocorreria se fosse utilizado algum dos restantes metodos. Na Tabela 5.6 constatou-se

esta ocorrencia quando s10 = 5, reforcando o resultado obtido. Amostras com n = 11 conduzem

as mesmas conclusoes fixando-se a condicao valor-p ≤ 0.01. Outra observacao relevante ocorre

com a condicao valor-p ≤ 0.05, em que o numero cardinal de amostras do metodo PVM e relativa-

mente maior ao dos restantes metodos. Estes resultados sao concordantes com os apresentados

na Tabela 5.7.

• Quando n = 20, o cardinal de amostras que satisfazem valor-p ≤ 0.01 ou valor-p ≤ 0.05 e me-

nor quando se utiliza o metodo DIST. Para n = 21 retira-se a mesma conclusao apenas para a

condicao valor-p ≤ 0.05. Alem disso, com este valor de n a condicao valor-pUSUAL ≤ 0.1 foi regis-

tada em menos amostras do que os outros metodos. A condicao valor-p ≤ 0.01 volta a registar-se

em mais amostras quando se utiliza o metodo PVM ou DIST.

• Para as amostras de dimensao superior, n = 30, observa-se que o numero de amostras que

72

Page 85: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

satisfazem valor-p ≤ 0.01 ou valor-p ≤ 0.05 com o metodo DIST e diferente em relacao aos outros

metodos. O numero de amostras que satisfazem valor-p ≤ 0.1 utilizando o metodo PVM ou COND e

superior ao registado com os outros metodos. Esta ultima observacao tambem se verifica quando

n = 31 mas com a condicao valor-p ≤ 0.05.

Interpretacao dos valores-p dos testes ao quantil χ0.5 (Tabelas 6.3, 6.8, 6.13 e 6.18)

• Quando a dimensao da amostra e n = 7, observando a condicao valor-p ≤ 0.01 o metodo DIST e o

unico que satisfaz esta condicao, e portanto e o unico que pode levar a rejeicao de H0 pre-fixando

α× 100% = 1% na aplicacao do teste dos sinais. Na condicao valor-p ≤ 0.1, alem do metodo DIST

tambem o metodo COND apresenta um maior numero de amostras que verificam esta condicao.

• Para n = 10, o caso mais relevante observa-se com a condicao valor-p ≤ 0.1, em que o cardinal de

amostras com o metodo COND e superior ao dos restantes metodos. O mesmo acontece quando

n = 20. Esta observacao e concordante com os resultados obtidos nas Tabelas 5.6 e 5.8, por

exemplo quando a estatıstica e concretizada em s10 = 2 e s10 = 8 ou em s20 = 6 e s20 = 14,

respetivamente.

• Quando n = 11 ou n = 31, verifica-se que mais amostras satisfazem as condicoes valor-p ≤ 0.01

quando se aplicam os metodos COND e DIST.

• No caso de n = 6, 21 e 30 todos os metodos registam o mesmo numero cardinal de amostras em

todas as condicoes acerca do valor-p.

Como resumo dos resultados do estudo de simulacao do valor-p tem-se:

• A dimensao da amostra n influencia a decisao do teste dos sinais, uma vez que neste estudo de

simulacao obtem-se, em geral, decisoes diferentes para os varios valores de n.

• Os resultados dos valores-p dos testes ao χq da distribuicao de X nao sao influenciados pela

forma simetrica ou assimetrica da distribuicao de X. O cardinal de amostras que verificam cada

uma das condicoes acerca do valor-p obtidas num teste ao quantil q foi semelhante nas tres

distribuicoes consideradas para X, o que nos leva a concluir que resultados sao independentes

da assimetria da distribuicao de X.

• Em relacao as condicoes valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1, quanto maior for a

dimensao da amostra n maior e o numero de amostras que as verificam, contrariamente com o

que acontece para a condicao valor-p > 1.

• E notorio que ocorreu mais frequentemente valor-pUSUAL > 1 do que valor-pCOL > 1.

• No caso do teste ao quantil χ0.5, quando n e ımpar, o numero de amostras que verificam a

condicao valor-p > 1 e insignificante nas 10000 amostras simuladas.

73

Page 86: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

• Analisando os resultados da simulacao do valor-p no caso B. da Seccao 6.1.3, isto e, quando

se estabelece em H0 que os quantis da distribuicao F sao iguais aos quantis da distribuicao

F = N(0, 1), observou-se que os resultados dos testes aos quantis q = 0.75 e q = 0.9 sao

obviamente os mais afetados. A contaminacao das amostras com observacoes maiores geradas

da N(2, 4) nao afetam os valores dos quantis mais pequenos de F . Conclui-se que a introducao

de ruıdo nas amostras pode diminuir o desempenho do teste dos sinais.

6.3.2 Simulacao da potencia

Da analise aos Graficos 6.2 a 6.10 referentes ao estudo da funcao potencia do teste dos sinais aos

quantis da distribuicao N(0, 1), podem ser retiradas as conclusoes seguintes:

• Em geral, o metodo USUAL revelou-se um metodo medıocre, conduzindo a uma potencia media

inferior em relacao aos restantes metodos, havendo no entanto algumas excecoes. Quanto maior

e a diferenca das medias da distribuicao estipuladas em H0 e H1 e esperado que a potencia

do teste aumente. Este aumento de γ observou-se com todos os metodos exceto no metodo

USUAL, que cai substancialmente (γ ≈ 0) com o aumento de |∆i|, demonstrando a instabilidade

do mesmo. Uma razao para este facto ocorrer deve-se ao numero de amostras que sao retiradas

do estudo da potencia por apresentarem P (rejeitarH0|H1) > 1. Verificou-se que quanto maior e o

valor fixado para |∆|, o numero de amostras que sao retiradas do estudo aumenta. As amostras

sao geradas de acordo com as distribuicoes de H1 e o numero de observacoes nas amostras

de X superiores a χ0 aumenta quando ∆ > 0 e diminui se ∆ < 0. Como consequencia, o valor

observado da estatıstica sn coincide mais vezes com a mediana de S∗1n ou de S∗

2n, respetivamente

quando ∆ > 0 ou ∆ < 0. O metodo USUAL devolve o valor-p superior a um quando sn = w, portanto

o numero de amostras que satisfazem P (rejeitarH0|H1) > 1 aumenta com o aumento de |∆|. Por

exemplo, quando q = 0.1 com n = 6 e ∆ = 3 o cardinal das amostras que registaram γ > 1

com o metodo USUAL foi 9999. Neste caso a potencia obtida utilizando o metodo usual foi o valor

registado para uma amostra, o que explica os resultados obtidos.

• Bons resultados foram registados com o metodo DIST que, em geral, para valores de |∆i| pe-

quenos revelou ser o metodo que conduz a potencias medias mais elevadas. Alem disso, com

o aumento de ∆i obtiveram-se, em geral, potencias superiores ou iguais as obtidas quando sao

utilizados os restantes metodos.

• Para valores pequenos de |∆i|, a media de γ ∈ [0.55, 0.7]. Com o aumento de |∆i| a media de γ

tambem aumenta ficando muito proxima de um, com a excecao do metodo USUAL.

• Quando o quantil q aumenta, notou-se uma ligeira diminuicao na media de γ quando ∆ > 0 e um

ligeiro aumento se ∆ < 0.

74

Page 87: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Capıtulo 7

Conclusoes

Apos toda a extensiva analise aos cinco metodos de calculo do valor-p nomeiam-se de seguida as

principais caracterısticas de cada um.

Os metodos USUAL e COL sao os unicos metodos estudados que devolvem valores-p superiores a

um. No caso do metodo USUAL, como foi analisado no Capıtulo 4, valor-pUSUAL > 1 quando sn = w.

Sempre que Sn possui uma classe mediana o valor-pUSUAL = 1 quando sn iguala um dos limites dessa

classe. No metodo de COL, analisado no Capıtulo 5, o valor-p e superior a um quando n e par e sn = n2 .

Outra nota sobre este metodo e o facto de so devolver probabilidades aceitaveis para o valor-p quando

a distribuicao de Sn e simetrica ou assimetrica pouco acentuada.

Quanto aos metodos PVM, COND e DIST pode-se inferir que estes nunca produzem valores-p superi-

ores a um.

Relativamente ao metodo PVM, com base na analise feita, observou-se que este devolve valores-p

iguais ao do metodo USUAL quando a estatıstica de teste e simetrica. No caso da Sn ser assimetrica,

existem situacoes em que o valor-pPVM e igual a metade do valor-pUSUAL. Quando o valor observado da

estatıstica corresponde a moda de Sn o valor-pPVM = 1.

Comparando os metodos COND e USUAL observa-se que, em geral, valor-pCOND < valor-pUSUAL. A

concretizacao da estatıstica no valor da mediana de Sn produz valor-pCOND = 1.

O novo metodo introduzido, metodo DIST, em geral produz resultados iguais ou proximos aos do

metodo PVM. O metodo DIST revelou um desempenho bastante positivo, produzindo resultados coeren-

tes.

Com base no estudo da comparacao dos metodos de calculo do valor-p e no estudo de simulacao,

fixando α× 100% nos nıveis de significancia usuais (1%, 5% e 10%), pode-se sumariar que:

• Quando a distribuicao de Sn e simetrica, os metodos COND e DIST podem devolver valores-p rela-

tivamente inferiores aos obtidos pelos restantes metodos. Assim, para os nıveis de significancia

pre-fixados, os metodos COND e DIST rejeitam mais frequentemente a hipotese H0.

• No caso da distribuicao de Sn ser assimetrica, todos os metodos podem alterar a decisao do teste

dos sinais quando selecionados em alternativa ao metodo USUAL. Neste caso, o metodo USUAL

rejeita menos vezes a hipotese H0.

75

Page 88: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

• Em estatısticas de teste com distribuicoes assimetricas bastante acentuadas, a aplicacao dos

metodos USUAL, DIST ou PVM pode originar mudanca de decisao no teste.

7.1 Resultados mais relevantes

Com base no estudo das alternativas COL, PVM, COND e DIST, nao e possıvel decidir a favor de um

metodo uma vez que todos apresentam algumas limitacoes. No entanto, o metodo COL revelou ser um

metodo ımprobo e portanto nao e recomendavel a sua utilizacao.

Os resultados obtidos pelo metodo DIST na simulacao da potencia do teste aos quantis da normal

reduzida foram bastante satisfatorios. Em geral, este metodo produz uma potencia media superior que

os restantes metodos. Pode concluir-se tambem que, tirando alguns casos excecionais, com o metodo

USUAL obtem-se potencias mais baixas, reforcando a inconsistencia do metodo.

Em suma, o estudo realizado nesta tese permitiu evidenciar os pontos fracos do metodo USUAL de

calculo do valor-p. Apesar de o metodo USUAL ser o mais comum aquando a realizacao dos testes

estatısticos, este metodo nao se revelou o mais apropriado para a determinacao do valor-p no teste

bilateral. Em contraste, o metodo DIST revelou ser uma boa opcao para o calculo do valor-p.

7.2 Trabalho Futuro

Como proposta para a realizacao de um trabalho futuro sugere-se a justificacao da escolha da distancia

euclidiana, d = |sn − w|, utilizada no calculo do valor-p do metodo DIST, ou de uma metrica alternativa

que seja apropriada e que otimize o metodo em questao. Propoe-se tambem a realizacao do mesmo

estudo para o teste de Wilcoxon ou outro teste que tenha uma estatıstica de teste com distribuicao

discreta. Este sera um bom desafio, uma vez que a estatıstica de teste de Wilcoxon nao tem uma

distribuicao simples como a estatıstica binomial do teste dos sinais. Alem disso, os casos em que o

valor-p e superior a um observam-se quando sn = w e portanto a determinacao da mediana de Sn do

teste de Wilcoxon sera tambem um obstaculo a superar.

76

Page 89: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Bibliografia

Arbuthnot, J. (1710). An argument for Divine Providence, taken from the constant regularity obser-

ved in the births of both sexes. Phil. Trans. Roy. Soc., 27, 186-90.

Conover, W. J. (1999). Practical Nonparametric Statistics. Wiley, New York, 3aedicao.

Dixon, W. J.(1953). Power Functions of the Sign Test and Power Efficiency for Normal Alternatives.

Annals of Mathematical Statistics, 24, 467-473.

Dixon, W. J. and Mood, A. M.(1946). The Statistical Sign Test. Journal of the American Statistical

Association, 41, 557-566.

Feller, W. (1968). An Introduction to Probability Theory and Its Applications. Wiley, New York,

3aedicao.

Fisher, R. A. (1920). A Mathematical Examination of the Methods of Determining the Accuracy of

an Observation by the Mean Error and by the Mean Square Error. Monthly Notices of the Royal

Astronomical Society, 80, 758–770.

Fisher, R. A. (1935). The Design of Experiments. Hafner Press, New York, 9aedicao.

Fisher, R. A. (1956). Statistical Methods and Scientific Inference. Hafner Press, New York,

3aedicao.

Freeman, G.H. and Halton, J.H. (1951). Note on exact treatment of contingency, goodness of fit

and other problems of significance. Biometrika, 38, 141-149.

Gastwirth, J.L. (1971). On the Sign Test for Symmetry. Journal of the American Statistical Associ-

ation, 66, 821-828.

Gibbons, J. D. and Chakraborti, S. (2003). Nonparametric Statistical Inference. Marcel Dekker,

New York, 4aedicao.

Gibbons, J. D. (1964). Effect on Non-Normality on the Power Function of the Sign Test. Journal of

the American Statistical Association, 59, 142-148.

Gibbons, J. D. and Pratt, J. W. (1975). P-values: Interpretation and Methodology. The American

Statistician, 20, 20-26.

77

Page 90: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Goodman, S. N. (1993). P-values, Hypothesis Tests, and Likelihood: Implications for Epidemiology

of a Neglected Historical Debate. American Journal of Epidemiolog, 137, 485-496.

Hamza, K. (1995). The smallest uniform upper bound on the distance between the mean and the

median of the binomial and Poisson distributions. Statistics and Probability Letters, 23, 21–25.

Kaas, R. and Buhrman, J. M. (1980). Mean, Median and Mode in Binomial Distributions. Statistica

Neerlandica, 34, 13–18.

Kulinskaya, E. (2008). On two-sided p-values for non-symmetric distributions. arXiv:0810.2124.

Lew, M. J. (2013). To P or not to P: on the evidential nature of P-values and their place in scientific

inference. arXiv:1311.0081 [stat.ME].

Lord, N. (2010). Binomial averages when the mean is an integer. The Mathematical Gazette, 94,

331-332.

Moura, N. D. V. (2014). Utilidade para testes de significancia. Dissertacao de mestrado, Instituto

de Matematica e Estatıstica da Universidade de Sao Paulo.

Neumann, P. (1966). Uber den Median der Binomial and Poissonverteilung. Wissenschaftliche

Zeitschrift der Technischen Universitat Dresden, 19, 29–33.

Neyman J. and Pearson, E. S. (1928). On the use and interpretation of certain test criteria for

purposes of statistical inference: part I. Biometrika, 20, 175–240.

Neyman, J. and Pearson, E. S. (1933). On the Problem of the Most Efficient Tests of Statisti-

cal Hypotheses. Philosophical Transactions of the Royal Society A: Mathematical, Physical and

Engineering Sciences. 231, 289–337.

Nuzzo, R. (2014). P-values, the “gold standard”of statistical validity, are not as reliable as many

scientists assume. Statistical Error, 506, 150-152.

Pitman, E. J. G. (1948). Non-parametric statistical inference. Mimeographed Lecture Notes, Uni-

versity of North Carolina Institute of Statistics.

R Core Team (2014). R: A Language and Environment for Statistical Computing. Vienna, Austria:

R Foundation for Statistical Computing.

Senn, S. (2003). P-Values. Encyclopedia of Biopharmaceutical Statistics, 685-695.

Sprent, P. (1989). Applied Nonparametric Statistical Methods. Chapman and Hall Ltd, New York,

2aedicao.

Sterne, J. A. C. and Smith, G. D. (2001). Sifting the evidence - what’s wrong with significance

tests? Education and debate, 31, 226-322.

Stewart, W. M. (1941). A Note on the Power of the Sign Test. Annals of Mathematical Statistics,

12, 236-239.

78

Page 91: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Voraprateep, J. (2013). Robustness of Wilcoxon Signed-Rank Test Against the Assumption of

Symmetry. Dissertacao de mestrado (em ingles), School of Mathematics The University of Bir-

mingham.

Walsh, J. E. (1946). On the Power Function of the Sign Test for Slippage of Means. The Ann.

Math. Statist., 17, 358-362.

Yates, F. (1984). Tests of Significance for 2×2 Contingency Tables. Journal of the Royal Statistical

Society: Series A, 147, 426-463.

Yohai, V. J. and Zamar, R. H. (2004). Robust nonparametric inference for the median. The Annals

of Statistics, 5, 1841–1857.

79

Page 92: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

Apendice A

Apendices: Programas

A.1 Programas dos metodos de calculo do valor-p do Capıtulo 5

A.1.1 Metodo USUAL

Programa que recebe como inputs o valor observado da estatıstica x, a dimensao da amostra n e a

probabilidade p da distribuicao binomial, e devolve como output o valor-pUSUAL.

pusual<-function(x,n,p){

cd<-pbinom(x,n,p)

ce<-(1-pbinom(x-1,n,p))

c<-min(cd,ce)

vp=2*c

return(vp)

}

A.1.2 Metodo COL

Programa que recebe como inputs o valor observado da estatıstica x, a dimensao da amostra n e a

probabilidade p da distribuicao binomial, e devolve como output o valor-pCOL.

pcol<-function(x,n,p){

if(n-x>x){cd<-pbinom(x,n,p)

ci<-(1-pbinom(n-x-1,n,p))}

else{cd<-(1-pbinom(x-1,n,p))

ci<-pbinom(n-x,n,p)}

vp<-cd+ci

return(vp)

}

80

Page 93: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

A.1.3 Metodo PVM

Programa que recebe como inputs o valor observado da estatıstica x, a dimensao da amostra n e a

probabilidade p da distribuicao binomial, e devolve como output o valor-pPVM.

ppvm<-function(x,n, p){

ps<-dbinom(x,n,p)

vp<-0

i<-0

while(i<=n){

if(round(dbinom(i,n,p),5)<=round(ps,5)){vp<-vp+dbinom(i,n,p)}

i<-i+1

}

return(vp)

}

A.1.4 Programas auxiliares

Numero par ou ımpar

Programa que verifica se um dado valor x e numero par ou ımpar. O output e True no caso da condicao

se verificar e False caso contrario.

is.odd <- function(x) x %% 2 != 0

is.even <- function(x) x %% 2 == 0

Numero inteiro

Programa que verifica se um dado valor x e numero inteiro. O output e True no caso da condicao se

verificar e False caso contrario.

check.integer <- function(x) {

x == round(x)

}

Mediana

Funcao que recebe como inputs os parametros da distribuicao binomial, isto e, a dimensao da amostra

n e a probabilidade p e devolve a mediana ou a classe mediana da respetiva distribuicao.

median<-function(n,p){

if(check.integer(n*p)){

m=qbinom(0.5,n,p)}

else if

((round(pbinom(floor(n*p),n,p),4)>=0.5) && (pbinom(ceiling(n*p),n,p)<=(0.5+dbinom(ceiling(n*p),n,p))))

{

m=c(floor(n*p),ceiling(n*p))

81

Page 94: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

}

else{

m=qbinom(0.5,n,p)}

return(m)

}

A.1.5 Metodo COND

Programa que recebe como inputs o valor observado da estatıstica x, a dimensao da amostra n e a

probabilidade p da distribuicao binomial, e devolve como output o valor-pCOND.

pcond<-function(x, n, p){

w<-median(n,p)

if(length(w)==1){

if(x<w){

vp=pbinom(x,n,p)/pbinom(w,n,p)}

if(x>w){

vp=(1-pbinom(x-1,n,p))/(1-pbinom(w-1,n,p))}

if(x==w){

vp=1}

}

if(length(w)!=1){

if(x<((n-1)/2)){me<-w[2]}

if(x>((n+1)/2)){me<-w[1]}

if(x==((n-1)/2)){me<-w[1]}

if(x==((n+1)/2)){me<-w[2]}

if(x<me){

vp=pbinom(x,n,p)/pbinom(me,n,p)}

if(x>me){

vp=(1-pbinom(x-1,n,p))/(1-pbinom(me-1,n,p))}

if(x==me){

vp=1}

}

return(vp)

}

A.1.6 Metodo DIST

Programa que recebe como inputs o valor observado da estatıstica x, a dimensao da amostra n e a

probabilidade p da distribuicao binomial, e devolve como output o valor-pDIST.

pdist<-function(x,n,p){

w<-median(n,p)

if(length(w)==1){

82

Page 95: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

distancia<-abs(w-x)

i<-distancia-1

pe<-0

pd<-0

pm<-dbinom(w,n,p)

while(i>0){

pe<-pe+dbinom(w-i,n,p)

pd<-pd+dbinom(w+i,n,p)

i<-i-1}

if(distancia!=0){valoresmeio<-pe+pd+pm}

if(distancia==0){valoresmeio<-0}

valorp=valorp<- 1-valoresmeio

}

if(length(w)!=1){

if(x<((n-1)/2)){me<-w[2]}

if(x>((n+1)/2)){me<-w[1]}

if(x==((n-1)/2)){me<-w[1]}

if(x==((n+1)/2)){me<-w[2]}

distancia<-abs(me-x)

i<-distancia-1

pe<-0

pd<-0

pm<-dbinom(me,n,p)

while(i>0){

pe<-pe+dbinom(me-i,n,p)

pd<-pd+dbinom(me+i,n,p)

i<-i-1}

if(distancia!=0){valoresmeio<-pe+pd+pm}

if(distancia==0){valoresmeio<-0}

valorp<- 1-valoresmeio

}

return(valorp)

}

A.1.7 Comparacao dos metodos de calculo do valor-p (Tabelas 5.4 a 5.9)

Programa que recebe como inputs a dimensao da amostra, n, e o quantil analisado no teste dos sinais,

q. O output e uma tabela com os valores-p obtidos pelos diferentes metodos.

tabela_vp<-function(n,q){

valorp=matrix(NA,n+1,5)

for (i in 1:(n+1)){

s=i-1

print(s)

83

Page 96: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

p=1-q

pusual=round(pusual(s,n,p),4)

pcol=round(pcol(s,n,p),4)

ppvm=round(ppvm(s,n,p),4)

pcond=round(pcond(s,n,p),4)

pdist=round(pdist(s,n,p),4)

valorp[i,]=c(pusual,pcol,ppvm,pcond,pdist)

print(valorp[i,])

}}

#############################################

Exemplo com n=10 e q=0.5

#############################################

tabela_vp(10, 0.5)

A.2 Programas do estudo de simulacao do Capıtulo 6

A.2.1 Simulacao do valor-p com amostras da distribuicao F = N(0, 1)

Programa que recebe como inputs a dimensao da amostra n, o quantil analisado no teste dos sinais q, a

media e o desvio padrao da distribuicao normal, mu e sig respetivamente, e nrep o numero de amostras

a simular. Devolve como output o numero de amostras que satisfazem valor-p > 1, valor-p ≤ 0.01,

valor-p ≤ 0.05 e valor-p ≤ 0.1 em cada um dos metodos de calculo do valor-p.

simul<-function(n,q,mu,sig,nrep){

dados=matrix(NA,nrep,n)

valorp=matrix(NA,nrep,5)

for (i in 1:nrep){

set.seed(i)

dados[i,]=round(rnorm(n,mu,sig),4)

dados[i,]=round(dados[i,],4)

quantil=round(qnorm(q, mean = mu, sd = sig),4)

s=sum(dados[i,]>quantil)

n1=n-sum(dados[i,]==quantil)

p=1-q

pusual=round(pusual(s,n1,p),4)

pcol=round(pcol(s,n1,p),4)

ppvm=round(ppvm(s,n1,p),4)

pcond=round(pcond(s,n1,p),4)

pdist=round(pdist(s,n1,p),4)

valorp[i,]=c(pusual,pcol,ppvm,pcond,pdist)

outvalor=c(s,valorp[i,])

outdados=dados[i,]

84

Page 97: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

}

a1=c(sum(valorp[,1]>1),sum(valorp[,2]>1),

sum(valorp[,3]>1), sum(valorp[,4]>1), sum(valorp[,5]>1))

a2=c(sum(valorp[,1]<=0.01),sum(valorp[,2]<=0.01),

sum(valorp[,3]<=0.01),sum(valorp[,4]<=0.01),

sum(valorp[,5]<=0.01))

a3=c(sum(valorp[,1]<=0.05),sum(valorp[,2]<=0.05),

sum(valorp[,3]<=0.05),sum(valorp[,4]<=0.05),sum(valorp[,5]<=0.05))

a4=c(sum(valorp[,1]<=0.1),sum(valorp[,2]<=0.1),

sum(valorp[,3]<=0.1),sum(valorp[,4]<=0.1),

sum(valorp[,5]<=0.1))

out=matrix(c(a1,a2,a3,a4),4,5,byrow = TRUE)

print(out)

}

#############################################

Exemplo de simulac~ao do valor-p do teste a mediana da distribuic~ao Normal(0,1)

#############################################

simul(10,0.5,0,1,10000)

A.2.2 Simulacao do valor-p com amostras da distribuicao F = Gama(3, 0.1)

Programa que recebe como inputs a dimensao da amostra n, o quantil analisado no teste dos sinais q

e o numero de amostras nrep a simular da distribuicao Gama(3, 0.1). Devolve como output o numero

de amostras que satisfazem valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 para cada um

dos metodos de calculo do valor-p.

simulgamap<-function(n,q,nrep){

dados=matrix(NA,nrep,n)

valorp=matrix(NA,nrep,5)

for (i in 1:nrep){

set.seed(i)

dados[i,]=round(rgamma(n,3,0.1),4)

dados[i,]=round(dados[i,],4)

quantil=round(qgamma(q,3,0.1),4)

s=sum(dados[i,]>quantil)

n1=n-sum(dados[i,]==quantil)

p=1-q

pusual=round(pusual(s,n1,p),4)

pcol=round(pcol(s,n1,p),4)

ppvm=round(ppvm(s,n1,p),4)

pcond=round(pcond(s,n1,p),4)

pdist=round(pdist(s,n1,p),4)

85

Page 98: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

valorp[i,]=c(pusual,pcol,ppvm,pcond,pdist)

outvalor=c(s,valorp[i,])

outdados=dados[i,]

}

a1=c(sum(valorp[,1]>1),sum(valorp[,2]>1),

sum(valorp[,3]>1), sum(valorp[,4]>1), sum(valorp[,5]>1))

a2=c(sum(valorp[,1]<=0.01),sum(valorp[,2]<=0.01),

sum(valorp[,3]<=0.01),sum(valorp[,4]<=0.01),

sum(valorp[,5]<=0.01))

a3=c(sum(valorp[,1]<=0.05),sum(valorp[,2]<=0.05),

sum(valorp[,3]<=0.05),sum(valorp[,4]<=0.05),sum(valorp[,5]<=0.05))

a4=c(sum(valorp[,1]<=0.1),sum(valorp[,2]<=0.1),

sum(valorp[,3]<=0.1),sum(valorp[,4]<=0.1),

sum(valorp[,5]<=0.1))

out=matrix(c(a1,a2,a3,a4),4,5,byrow = TRUE)

print(out)

}

#############################################

Exemplo de simulac~ao do valor-p do teste a mediana da distribuic~ao Gamma(3,0.1)

#############################################

simulgamap(10,0.5,10000)

A.2.3 Simulacao do valor-p com amostras da distribuicao F1−IU [i]≤0.9(F )

Programa que recebe como inputs a dimensao da amostra n, o quantil q, o peso alpha, as medias e

os desvios padroes de cada uma das distribuicoes normais da mistura, mu1, mu2 e sig1, sig2 respeti-

vamente. O valor nrep e o numero de amostras a simular da distribuicao F . O output e o numero de

amostras que satisfazem valor-p > 1, valor-p ≤ 0.01, valor-p ≤ 0.05 e valor-p ≤ 0.1 para cada um dos

metodos de calculo do valor-p.

simulmix<-function(n,q,alpha,mu1,sig1,mu2,sig2,nrep){

dados=matrix(NA,nrep,n)

valorp=matrix(NA,nrep,5)

for (i in 1:nrep){

set.seed(i)

# mixture distribution

#Sample N random uniforms U

U =runif(n)

#Variable to store the samples from the mixture distribution

#Sampling from the mixture

rand.sample = rep(NA,n)

for(j in 1:n){

if(U[j]<=alpha){

86

Page 99: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

rand.sample[j] = rnorm(1,mu1,sig1)

}else{

rand.sample[j] = rnorm(1,mu2,sig2)}

}

dados[i,]=rand.sample

dados[i,]=round(dados[i,],4)

med=0.0922

#print(dados[i,])

s=sum(dados[i,]>med)

n1=n-sum(dados[i,]==med)

p=1-q

pusual=round(pusual(s,n1,p),4)

pcol=round(pcol(s,n1,p),4)

ppvm=round(ppvm(s,n1,p),4)

pcond=round(pcond(s,n1,p),4)

pdist=round(pdist(s,n1,p),4)

valorp[i,]=c(pusual,pcol,ppvm,pcond,pdist)

outvalor=c(s,valorp[i,])

outdados=dados[i,]

}

a1=c(sum(valorp[,1]>1),sum(valorp[,2]>1),sum(valorp[,3]>1), sum(valorp[,4]>1), sum(valorp[,5]>1))

a2=c(sum(valorp[,1]<=0.01),sum(valorp[,2]<=0.01),

sum(valorp[,3]<=0.01),sum(valorp[,4]<=0.01),sum(valorp[,5]<=0.01))

a3=c(sum(valorp[,1]<=0.05),sum(valorp[,2]<=0.05),

sum(valorp[,3]<=0.05),sum(valorp[,4]<=0.05),

sum(valorp[,5]<=0.05))

a4=c(sum(valorp[,1]<=0.1),sum(valorp[,2]<=0.1),

sum(valorp[,3]<=0.1),sum(valorp[,4]<=0.1),sum(valorp[,5]<=0.1))

out=matrix(c(a1,a2,a3,a4),4,5,byrow = TRUE)

print(out)

}

#############################################

Exemplo de simulac~ao do valor-p do teste a mediana da distribuic~ao mistura

#############################################

simulmix(10,0.5,0.9,0,1,2,2,10000)

A.2.4 Programas auxiliares

Simulacao do quantil q de FO programa que recebe como inputs o quantil q, o peso alpha, as medias e os desvios padroes de

cada uma das distribuicoes normais da mistura, mu1, mu2 e sig1, sig2 respetivamente, e o numero de

amostras nrep a simular da distribuicao F . O output e o valor do quantil q de F .

87

Page 100: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

simulquant<-function(q,alpha,mu1,sig1,mu2,sig2,nrep){

U =runif(nrep)

rand.sample = rep(NA,nrep)

for(j in 1:nrep){

set.seed(j)

if(U[j]<=alpha){

rand.sample[j] = rnorm(1,mu1,sig1)

}else{

rand.sample[j] = rnorm(1,mu2,sig2)}

}

quantil=quantile(rand.sample,q)

return(quantil)

}

#####################################

Exemplo de simulac~ao do quantil 0.5

#####################################

simulquant(0.5,0.9,0,1,2,2,1000000)

A.2.5 Simulacao da potencia

Exemplo do teste a mediana, χ 12, com ∆ = 0.25

Programa que recebe como inputs a dimensao da amostra n, a media mu, o desvio padrao sig

da distribuicao Normal e o numero nrep de amostras a simular. O output e a potencia media de

cada um dos metodos de calculo do valor-p, supondo que a hipotese alternativa do teste dos sinais e

H1 : χ 12

= 0.25.

simulpot025<-function(n,mu,sig,nrep){

dados=matrix(NA,nrep,n)

valorp=matrix(NA,nrep,5)

potencia=matrix(NA,nrep,5)

potenciamod=matrix(NA,nrep,5)

for (i in 1:nrep){

set.seed(i)

#########################

# H1: med=0.25 (ph1)

#########################

dados[i,]=round(rnorm(n,mu,sig),4)

dados[i,]=round(dados[i,],4)

#print(mu)

med=0

s=sum(dados[i,]>med)

n1=n-sum(dados[i,]==med)

88

Page 101: O valor-p do teste dos sinais - fenix.tecnico.ulisboa.pt · O valor-p do teste dos sinais Ana Marta Lisboa Vila Fernandes Dissertação para obtenção do Grau de Mestre em Matemática

ph1=pnorm(0.25,0,1)

###############################

# Potencia

###############################

ptusual=round(pusual(s,n1,ph1),4)

ptcol=round(pcol(s,n1,ph1),4)

ptpvm=round(ppvm(s,n1,ph1),4)

ptcond=round(pcond(s,n1,ph1),4)

ptdist=round(pdist(s,n1,ph1),4)

potencia[i,]=c(ptusual,ptcol,ptpvm,ptcond,ptdist)

}

potenciamedia=c(mean(potencia[,1][potencia[,1]<=1]),

mean(potencia[,2][potencia[,2]<=1]),

mean(potencia[,3]),mean(potencia[,4]),mean(potencia[,5]))

print(round(potenciamedia,4))

}

####################################################################################

Exemplo da potencia media de cada metodo de calculo do valor-p na simulac~ao da N(0,1)

para o teste dos sinais com H0:med=0 vs H1:med=0.25

####################################################################################

simulpot025(10,0.25,1,10000)

89