curso aplicado de estatistica
Post on 30-Dec-2015
179 Views
Preview:
TRANSCRIPT
CURSO APLICADO DE ESTATÍSTICA
Disciplina de Tópicos Especiais para Engenharia Química UFPR
UNIVERSIDADE FEDERAL DO PARANA Dr. GEORGES KASKANTZIS NETO
---- Dr. Georges Kaskantzis Neto ----
~ 1 ~
Em homenagem ao meu tio Nikolas,
irmão da minha mãe, que faleceu
recentemente, tendo findado a sua
missão de bravo paraquedista do
Rei Constantino II da Grécia.
---- Dr. Georges Kaskantzis Neto ----
~ 2 ~
PROLEGÔMENOS
Esta apostila foi elaborada visando a realização da disciplina
de Tópicos Especiais para os alunos da Engenharia Química do Setor
de Tecnologia da Universidade Federal do Paraná.
O objetivo da disciplina é revisar os conceitos básicos da es-
tatística descrita, aplicando-os na investigação de um caso real de
emborcamento naval acontecido no ano de 2011, na Baía da Babi-
tonga de São Francisco do Sul, do Estado de Santa Catarina, BR.
Os objetivos específicos são o aprimoramento da formação
profissional dos graduandos da UFPR e a capacitação destes, na a-
nálise sistemática de questões que envolvam os recursos naturais
O autor da apostila é o professor doutor Georges Kaskantzis
Neto, funcionário público federal lotado no departamento de Enge-
nharia Química da UFPR, desde de o ano de 2001. A apostila foi ela-
borada no período de Janeiro a Fevereiro do ano de 2104.
O conteúdo da apostila a ser descrito contempla os concei-
tos e as técnicas usuais da estatística básica descritiva, os conceitos
de probabilidade, as distribuições teóricas das funções de probabi-
lidade e os testes de hipóteses das médias, das variâncias, das pro-
porções e a técnica ANOVA.
---- Dr. Georges Kaskantzis Neto ----
~ 3 ~
LISTA DE TABELAS
TABELA 1. BALANÇO DE MASSA DOS PRODUTOS DO EMBORCA-
MENTO 11
TABELA 2. COMPOSIÇÃO DA MISTURA DOS ÓLEOS DE PETRÓLEO. 12
TABELA 3. RESULTADOS DA CAMPANHA DE AMOSTRAGEM REALIZADA
PELOS TÉCNICOS 13
TABELA 4. CLASSIFICAÇÃO DAS VARIÁVEIS RELATIVAS AO EMBORCA-
MENTO. 22
TABELA 5. OBSERVAÇÕES COM AS QUAIS OBTIVERAM-SE AS FREQUÊN-
CIAS 26
TABELA 6. ESTATÍSTICAS DA AMOSTRA DE COMPONENTES AMBIENTAIS 27
TABELA 7. ESTATÍSTICAS DOS VALORES DAS SOMAS DAS CONCENTRA-
ÇÕES DOS COMPOSTO CONTAMINANTES EM FUNÇÃO DAS CLASSES
AMBIENTAIS
41
TABELA 8. CONCENTRAÇÕES GLOBAIS DOS GRUPOS DE COMPOSTOS
OBSERVADOS NAS AMOSTRAS DAS CLASSES DE COMPONENTES AM-
BIENTAIS.
42
TABELA 9. DISTRIBUIÇÃO PERCENTUAL DOS VALORES DAS CONCEN-
TRAÇÕES DOS COMPOSTOS HIDROCARBONETOS E METAIS EM FUN-
ÇÃO DAS CLASSES DE COMPONENTES AMBIENTAIS ATINGIDOS PELO
ACIDENTE NAVAL.
42
TABELA 10. TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO P (Z < z). 60
TABELA 11. TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO P (Z < z). 61
TABELA 12. TABELA DA DISTRIBUIÇÃO DE t – STUDENT [WIKIPÉDIA, 2014] 62
TABELA 13. TABELA DA DISTRIBUIÇÃO DE CHI-QUADRADO [WIKIPÉDIA,
2014] 63
TABELA 14. MEDIDAS EXPERIMENTAIS DO pH das soluções 92
TABELA 15. RESULTADO DA PESAGEM DE CONTAMINANTES IDENTIFI-
CADOS NAS FRUTAS IMPORTADAS PELOS AGENTES DE FISCALIZAÇÃO
DO IBAMA.
96
TABELA 16. DIFERENÇAS DAS PESAGENS EXECUTADAS POR TÉCNICOS 96
---- Dr. Georges Kaskantzis Neto ----
~ 4 ~
LISTA DE FIGURAS
FIGURA 1. DETALHE DAS EMBARCAÇÕES ENVOLVIDAS NO ACIDENTE. 10
FIGURA 2. GRUPOS DE COMPOSTOS QUÍMICOS DEFINIDOS EM FUNÇÃO DO
NÚMERO DE SUBSTÂNCIA DE CADA GRUPO E DA CONCENTRAÇÃO MÉDIA. 17
FIGURA 3. NÚMERO DE AMOSTRAS COLETADAS EM FUNÇÃO DOS LOCAIS DE
COLETA E DAS CLASSES DE COMPONENTES 18
FIGURA 4. DISTRIBUIÇÃO DA MASSA E DA FRAÇÃO PERCENTUAL DOS GRUPOS
DE COMPOSTOS QUÍMICOS QUE FORAM DEFINIDOS NO ESTUDO DO DER-
RAME.
19
FIGURA 5. HISTOGRAMA DOS VALORES DO LOGARITMOS DAS CONCENTRA-
ÇÕES DOS GRUPOS DOS COMPOSTOS OBSERVADOS NOS COMPONENTES
AMBIENTAIS ATINGIDOS PELA MISTURA OLEOSA.
27
FIGURA 6. HISTOGRAMA DAS FREQUÊNCIAS DE OCORRÊNCIA DAS CLASSES
DE COMPONENTES AMBIENTAIS NA AMOSTRA DOS VALORES DAS CONCEN-
TRAÇÕES DE COMPOSTOS QUÍMICOS OBSERVADOS NOS TESTES ANALÍTICOS
28
FIGURA 7. MOSAICO DOS HISTOGRAMAS DAS FREQUÊNCIAS DOS VALORES
DO LOGARÍTMO DAS CONCENTRAÇÕES DE BTEX E HEP OBSERVADAS NAS A-
MOSTRAS DE COMPONENTES AMBIENTAIS INVESTIGADOS NA ÉPOCA DOS FA-
TOS
29
FIGURA 8. MOSAICO DOS HISTOGRAMAS DAS FREQUÊNCIAS DOS VALORES
DO LOGARÍTMO DAS CONCENTRAÇÕES DE HPA E DE METAIS OBSERVADAS
NAS AMOSTRAS DE COMPONENTES INVESTIGADOS NA ÉPOCA DOS FATOS.
30
FIGURA 9. ESTATÍSTICAS DOS COMPOSTOS BTEX NA MISTURA OLEOSA 37
FIGURA 10. ESTATÍSTICAS DOS COMPOSTOS HEP NA MISTURA OLEOSA 37
FIGURA 11. ESTATÍSTICAS DOS COMPOSTOS HPA NA MISTURA OLEOSA 38
FIGURA 12. ESTATÍSTICAS DO GRUPO DOS METAIS NA MISTURA OLEOSA 38
FIGURA 13. ESTATÍSTICAS DOS BTEX NOS COMPONENTES AMBIENTAIS 39
FIGURA 14. ESTATÍSTICAS DOS HEP NOS COMPONENTES AMBIENTAIS 39
FIGURA 15. ESTATÍSTICAS DOS HPA NOS COMPONENTES AMBIENTAIS 40
FIGURA 16. ESTATÍSTICAS DOS METAIS NOS COMPONENTES AMBIENTAIS 40
FIGURA 17. FUNÇÃO DISTRIBUIÇÃO DE PROBABILIDADES POR LINHAS 47
FIGURA 18. FUNÇÃO PROBABILIDADE REPRESENTADA POR PONTOS 48
---- Dr. Georges Kaskantzis Neto ----
~ 5 ~
FIGURA 19. FUNÇÃO PROBABILIDADE NORMAL E SUAS ESTATÍSTICAS 48
FIGURA 20. CURVA DA DISTRIBUIÇÃO NORMAL DE PROBABILIDADES. 57
FIGURA 21. PECULIARIDADES DA FUNÇÃO NORMAL DE DISTRIBUIÇÃO DE FRE-
QUÊNCIAS 57
FIGURA 22. MOSAICO DE GRÁFICOS INDICANDO AS CURVA DA DISTRIBUI-
ÇÃO LOGNORMAL E LOGNORMAL ACUMULADA. 58
FIGURA 23. FUNÇÕES DE DISTRIBUIÇÃO DE PROBABILIDADES RESPECTIVA-
MENTE BINOMIAL, t – STUDENT e WEIBUL [WIKIPEDIA, 20013 59
FIGURA 24. MOSAICO DOS GRÁFICOS DAS DISTRIBUIÇÕES DOS VALORES DO
DIÂMETRO DAS PEÇAS DEFEITUOSAS E DA ESTATÍSTICA PONTUAÇÃO Z 69
FIGURA 25. DISTRIBUIÇÃO DAS CLASSES DOS COMPOSTOS QUÍMICOS QUE
FORMARAM A MISTURA OLEOSA EM VIRTUDE DO ACIDENTE NAVAL. 74
FIGURA26. VARIABILIDADE DA CONCENTRAÇÃO DOS GRUPOS DE COMPOS-
TOS QUÍMICOS DA MISTURA OLEOSA DERRAMA NO ACIDENTE. 75
FIGURA 27. CONTRIBUIÇÕES DOS GRUPOS COMBINADOS DOS COMPOSTOS
DA MISTURA OLEOSA DERRAMADA NO ACIDENTE NAVAL 76
FIGURA 28. HISTOGRAMA DA DISTRIBUIÇÃO DE FREQUÊNCIAS DOS COMPO-
NENTES AMBIENTAIS ALTERADOS PELA MISTURA DE ÓLEOS FORMADA 77
FIGURA 29. DISTRIBUIÇÃO DAS CLASSES E COMPONENTES AMBIENTAIS 78
FIGURA 30. VARIABILIDADE DAS CONCENTRAÇÕES DAS CLASSES DE COM-
PONENTES AMBIENTAIS ATINGIDOS NO ACIDENTE NAVAL 79
FIGURA 31. VARIABILIDADE DOS VALORES DAS CONCENTRAÇÕES OBSERVA-
DAS NOS TESTES DE LABORATÓRIO NAS AMOSTRAS DOS COMPONENTES AM-
BIENTAIS COLETADAS NA ÉPOCA DOS FATOS.
79
FIGURA 32. Regiões de rejeição da hipótese nula do primeiro e segundo
caso em função da hipótese alternativa escolhida. Os gráficos estão asso-
ciados as hipóteses alternativas a, b e c.
85
FIGURA 33. DETALHE DA REGIÃO DE REJEIÇÃO DA HIPÓTESE NULA 87
FIGURA 34. DISTRIBUIÇÃO NORMAL DE PROBABILIDADE DO EXEMPLO APRE-
SENTADO 87
---- Dr. Georges Kaskantzis Neto ----
~ 6 ~
SUMÁRIO
- PROLEGÔMENOS
- LISTA DE TABELAS
- LISTA DE FIGURAS
- SUMÁRIO
1. INTRODUÇÃO
2. RESUMO DO ACIDENTE
3. CONCEITOS DE ESTATÍSTICA DESCRITIVA
3.1. CLASSIFICAÇÃO DAS VARIÁVEIS, 21
3.2. DISTRIBUIÇÃO DE FREQUÊNCIAS, 22
3.3. ANÁLISE DAS FREQUÊNCIAS, 24
3.4. MEDIDAS DE TENDÊNCIA CENTRAL, 31
3.5. MEDIDAS DE DISPERSÃO, 32
3.6. MEDIDAS DE DISTRIBUIÇÃO, 33
3.6.1 CURTOSE, 34
3.7. ESTATÍSTICAS DAS AMOSTRAS, 35
3.7.1. ESTATÍSTICAS DOS GRUPOS DE COMPOSTOS, 36
3.7.2. ESTATÍSTICAS DAS CLASSES DE COMPONENTES, 39
4. FUNÇÃO PROBABILIDADE
4.1. CONCEITOS, 44
4.1.2. FUNÇÃO DE PROBABILIDADE DISCRETA, 44
4.1.3. FUNÇÃO DE PROBABILIDADE ACUMULADA, 44
4.1.4. FUNÇÃO DENSIDADE DE PROBABILIDADE, 45
---- Dr. Georges Kaskantzis Neto ----
~ 7 ~
4.1.5. GRÁFICOS DE DISTRIBUIÇÃO DE PROBABILIDADE, 47
4.2 ESTATÍSTICAS BÁSICAS, 48
4.2.1. ESPERANÇA, MÉDIA OU VALOR ESPERADO, 49
4.2.2. VARIÂNCIA OU DISPERSÃO, 49
4.2.3. VARIÁVEIS ALEATÓRIA DISCRETAS, 50
4.2.4. VARIÁVEIS ALEATÓRIAS CONTÍNUAS, 51
5. DISTRIBUIÇÕES TEÓRICAS DE PROBABILIDADES
5.1. DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES, 52
5.2. DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES, 53
5.3. DISTRIBUIÇÕES DE PROBABILIADES DADOS, 64
5.4 DISTRIBUIÇÕES DE PROBABILIDADES DE AMOSTRAS, 72
6. TESTES DE HIPÓTESES
6.1. HIPÓTESES ESTATÍSTICAS, 80
6.2. HIPÓTESE NULA E ALTERNATIVA, 80
6.3. REGIÕES DE REJEIÇÃO DE HIPÓTESES, 81
6.4 ERROS DO TIPO I E DO TIPO II, 81
6.5. NÍVEL DE SIGNIFICÂNCIA, 82
6.6. TESTE UNILATERAL E BILATERAL, 82
6.7. CURVA CARACTERÍSTICA DE OPERAÇÃO, 82
6.8. SISTEMÁTICA DE EXECUÇÃO DO TESTE DE HIPÓTESE, 83
6.9. TESTE PARA A MÉDIA POPULACIONAL, 83
6.10. TESTE DA DIFERENÇA DE MÉDIAS POPULACIONAIS, 89
6.11. TESTES PARA A VARIÂNCIA POPULACIONAL, 97
---- Dr. Georges Kaskantzis Neto ----
~ 8 ~
6.12. TESTE PARA A IGUALDADE DE DUAS VARIÂNCIAS, 100
6.13. TESTE DA IGUALDADE DE K (K>2) VARIÂNCIAS, 101
6.14. TESTE PARA A PROPORÇÃO POPULACIONAL, 103
6.15. TESTE DA DIFERENÇA ENTRE DUAS PROPORÇÕES, 105
7. ANÁLISE DE VARIÂNCIA
7.1. VARIÂNCIA TOTAL, 108
7.2. VARIÂNCIA ENTRE AMOSTRAS, 109
7.3. VARIÂNCIA RESIDUAL, 109
7.4. ROTEIRO DO TESTE, 110
7.5. QUADRO ANOVA, 110
8. TESTE DE HIPÓTESES PARA AS AMOSTRAS
8.1 TESTE PARA AS MÉDIAS, 113
8.2. TESTE PARA A DIFERENÇA ENTRE AS MÉDIAS, 115
---- Dr. Georges Kaskantzis Neto ----
~ 9 ~
1. INTRODUÇÃO
A investigação de acidentes ambientais, em geral, envolve
uma grande quantidade de informações. As técnicas estatísticas,
quando utilizadas de forma correta asseguram a confiabilidade e a
qualidade dos resultados, como, por exemplo, aqueles produzidos
na análise técnica de ecossistemas afetados por contaminações.
Neste texto apresentam-se os conceitos da estatística básica
descritiva que são aplicados no estudo de um acidente ocorrido no
ano de 2011. Trata-se da contaminação de ecossistemas da Baía da
Barbilonga do Estado de Santa Catarina, a qual teria sido, suposta-
mente oriunda do emborcamento de um empurrador e de uma bar-
caça.
O objetivo foi investigar a hipótese da contaminação dos e-
cossistemas da Babitonga decorrente do acidente naval. Com este
propósito realizaram a determinação e comparação das estatísticas
de duas amostras. A primeira amostra é o conjunto dos valores das
concentrações dos compostos químicos derivados de petróleos, os
quais formaram uma mistura oleosa que se dispersou no ambiente.
A segunda amostra é o conjuntos dos valores das concentra-
ções dos compostos na mistura observados, nos testes de laboratório
realizados nas amostras de componentes ambientais atingidos pelos
óleos derramados, no acidente naval.
---- Dr. Georges Kaskantzis Neto ----
~ 10 ~
2. RESUMO DO ACIDENTE
O emborcamento investigado aconteceu no final do mês de
Janeiro do ano de 2008, nas proximidades do porto de São Francisco
do Sul, no Estado de Santa Catarina. Em virtude das condições des-
favoráveis do tempo, no dia dos fatos, o empurrado e a barcaça
emborcaram, tendo sido derramados no mar, cerca de, 124 m3 de
óleos combustíveis, lubrificantes e resíduos de petróleo. Na FIGURA 1
indicam-se as embarcações envolvidas no evento e na TABELA 1a-
presentam-se os compostos de petróleos derramados no mar.
FIGURA 1. DETALHE DAS EMBARCAÇÕES ENVOLVIDAS NO ACIDENTE.
Os óleos derivados de petróleos despejados no mar atingi-
ram: praias; mangues; marismas; costões; cultivos de ostras mariscos
e mexilhões; crustáceos; a ictiofauna e outros recursos naturais.
---- Dr. Georges Kaskantzis Neto ----
~ 11 ~
TABELA 1. BALANÇO DE MASSA DOS PRODUTOS DO EMBORCAMENTO
Produtos Volume (m3) W Dmédia (kg/m3) Massa (kg)
Óleo pesado 90,0 0,7241 967,7 87.097,5
Óleo diesel 13,8 0,1110 850,0 11.730,0
Óleo lubrificante 13,5 0,1086 903,0 12.190,5
Óleos residuais 7,0 0,0563 893,0 6.251,0
Total 124,30 1,0000 943,45 117269,0
Com base nas fichas de segurança dos produtos comerciais
identificaram-se as substâncias químicas que constituem os óleos de
petróleo. Adotando uma base cálculo foi definida a composição da
mistura oleosa, a qual se encontra apresentada na TABELA 2.
Empregando os laudos das análises de laboratório das amos-
tras coletadas na campanha de monitoramento da contaminação,
determinaram-se os de componentes ambientais afetados, os quais
se encontram apresentados na TABELA 3.
Inspecionando os dados das citadas tabelas pode-se notar
que a mistura oleosa originada na ocasião do acidente era formada
por hidrocarbonetos aromáticos (BTEX - 7,76%); hidrocarbonetos pe-
sados (HEP - 80,92%), hidrocarbonetos poliaromáticos (HPA - 3,97%)
e metais pesados (METAIS - 7,34%). A grande quantidade de metais
pesados presentes na mistura oleosa é oriunda dos óleos residuais,
dos óleos pesados e do óleo marítimo (IFO 180), pois estes hidrocar-
bonetos são os resíduos do Da destilação à vácuo dos petróleos.
---- Dr. Georges Kaskantzis Neto ----
~ 12 ~
TABELA 2. COMPOSIÇÃO DA MISTURA DOS ÓLEOS DE PETRÓLEO.
COMPOSTO GRUPO C (mg/g) Fração W
Benzeno BTEX 2,444E-04 2,68E-03
Tolueno BTEX 1,111E-03 1,22E-02
Etilbenzeno BTEX 4,422E-03 4,84E-02
m, p - Xilenos BTEX 5,329E-04 5,84E-03
o-Xileno BTEX 7,812E-04 8,55E-03
C10 HEP 5,400E-03 5,91E-02
C12 HEP 4,800E-03 5,26E-02
C14 HEP 7,100E-03 7,77E-02
C16 HEP 8,000E-03 8,76E-02
C18 HEP 6,000E-03 6,57E-02
C20 HEP 9,600E-03 1,05E-01
C22 HEP 9,700E-03 1,06E-01
C24 HEP 9,800E-03 1,07E-01
C26 HEP 4,900E-03 5,37E-02
C28 HEP 8,600E-03 9,42E-02
Benzo(k)fluoranteno HPA 3,900E-06 4,27E-05
Benzo(b)fluoranteno HPA 1,280E-06 1,40E-05
Benzo(a)pireno HPA 2,170E-06 2,38E-05
Fluoranteno HPA 4,650E-05 5,09E-04
Benzo(a)antraceno HPA 5,080E-05 5,56E-04
Criseno HPA 5,530E-05 6,06E-04
Acenaftileno HPA 5,740E-05 6,29E-04
Antraceno HPA 1,552E-04 1,70E-03
Fluoreno HPA 1,933E-04 2,12E-03
Pireno HPA 2,234E-04 2,45E-03
Acenafteno HPA 2,282E-04 2,50E-03
Naftalenos HPA 6,830E-04 7,48E-03
Fenantreno HPA 6,848E-04 7,50E-03
Indeno(1,2,3-cd) pireno HPA 2,483E-04 2,72E-03
Dibenzo (a, h) antraceno HPA 3,483E-04 3,81E-03
Benzo(ghi)perileno HPA 6,483E-04 7,10E-03
Arsênio METAIS 5,200E-05 5,69E-04
Cadmio METAIS 2,600E-05 2,85E-04
Chumbo METAIS 2,600E-05 2,85E-04
Cobre METAIS 1,600E-04 1,75E-03
Cromo METAIS 2,600E-04 2,85E-03
Mercúrio METAIS 5,200E-05 5,69E-04
Níquel METAIS 1,310E-03 1,43E-02
Zinco METAIS 4,820E-03 5,28E-02
BTEX – Benzeno + Tolueno + Etilbenzeno + Xilenos; HPA – hidrocarbo-
netos poliaromáticos, PHE – hidrocarbonetos extraíveis de petróleo.
---- Dr. Georges Kaskantzis Neto ----
~ 13 ~
TABELA 3. RESULTADOS DA CAMPANHA DE AMOSTRAGEM REALIZADA PELOS TÉCNICOS
ID Tipo de Amostra Ponto de
Amostragem Classe
BTXE
(mg g-1)
HPE
(mg g-1)
HPA
(mg g-1)
Metais
(mg g-1)
1 Raiz de mangue 4 MG 0.00E+00 6.61E-03 2.38E-05 5.19E-03
2 Raiz de mangue 4 MG 0.00E+00 5.18E-03 1.85E-05 1.06E-02
3 Raiz de mangue 8 MG 1.24E-04 1.06E-02 4.00E-05 3.20E-03
4 Raiz de mangue 8 MG 0.00E+00 3.20E-03 2.17E-05 1.94E-03
5 Raiz de mangue 5 MG 0.00E+00 1.94E-03 3.62E-05 2.29E-03
6 Raiz de mangue 5 MG 0.00E+00 2.29E-03 3.79E-05 6.54E-02
7 Marisma folha 3 MR 4.33E-04 6.53E-02 5.16E-05 1.13E-01
8 Marisma folha 3 MR 1.99E-04 1.12E-01 8.27E-05 2.30E-02
9 Marisma folha 8 MR 1.74E-04 2.30E-02 8.09E-05 2.00E-02
10 Marisma folha 8 MR 2.03E-04 2.00E-02 4.24E-05 5.47E-02
11 Marisma folha 5 MR 2.91E-04 5.47E-02 4.30E-05 2.87E-02
12 Marisma folha 5 MR 3.30E-04 2.87E-02 5.04E-05 1.82E-02
13 Marisma folha 4 MR 1.11E-04 1.82E-02 3.64E-05 1.60E-02
14 Marisma folha 4 MR 2.28E-04 1.60E-02 9.46E-05 2.64E-03
15 Marisma raiz 3 MR 5.60E-05 2.64E-03 4.91E-05 3.31E-01
16 Marisma raiz 3 MR 0.00E+00 3.30E-01 6.19E-05 6.84E-01
17 Marisma raiz 8 MR 3.20E-05 6.83E-01 5.84E-05 2.32E-01
18 Marisma raiz 8 MR 5.10E-05 2.32E-01 1.82E-05 1.45E-01
19 Marisma raiz 5 MR 0.00E+00 1.45E-01 2.99E-05 2.14E-01
20 Marisma raiz 5 MR 1.57E-04 2.14E-01 6.37E-05 3.02E-01
21 Marisma raiz 4 MR 0.00E+00 3.01E-01 3.54E-05 1.26E-01
22 Marisma raiz 4 MR 0.00E+00 1.26E-01 9.90E-06 5.16E+00
23 Mangue preto 3 MG 1.42E-04 5.15E+00 5.63E-04 4.04E+00
---- Dr. Georges Kaskantzis Neto ----
~ 14 ~
24 Mangue preto 3 MG 5.10E-05 4.04E+00 8.58E-04 6.34E+00
25 Mangue preto 5 MG 0.00E+00 6.34E+00 1.10E-03 6.90E+00
26 Mangue preto 5 MG 0.00E+00 6.90E+00 1.92E-03 4.87E+00
27 Mangue preto 4 MG 0.00E+00 4.86E+00 7.01E-04 3.09E+00
28 Mangue preto 4 MG 3.10E-05 3.09E+00 8.77E-04 3.16E+00
29 Mangue preto 8 MG 5.23E-03 3.16E+00 1.89E-04 3.30E+00
30 Mangue preto 8 MG 2.44E-02 3.29E+00 5.51E-05 1.98E+00
31 Mangue vermelho 4 MG 2.08E-03 1.98E+00 8.17E-05 1.74E+00
32 Mangue vermelho 4 MG 7.97E-04 1.73E+00 5.32E-05 1.32E+00
33 Mangue branco 5 MG 7.07E-04 1.32E+00 1.01E-04 1.26E+00
34 Mangue branco 5 MG 1.13E-03 1.26E+00 1.13E-04 1.37E+00
35 Mangue branco 8 MG 1.81E-03 1.37E+00 3.76E-05 1.45E+00
36 Mangue branco 8 MG 1.55E-03 1.45E+00 1.05E-04 1.93E+00
37 Mangue branco 3 MG 1.47E-03 1.93E+00 6.49E-05 1.15E+00
38 Mangue branco 3 MG 4.62E-04 1.15E+00 8.03E-05 4.94E-01
39 Alga verde 9 AL 2.18E-04 4.94E-01 2.19E-05 1.45E-01
40 Alga verde 9 AL 2.45E-04 1.45E-01 1.26E-05 1.64E-01
41 Alga parda 9 AL 3.04E-04 1.64E-01 1.28E-05 4.68E-01
42 Alga parda 9 AL 1.83E-04 4.67E-01 2.39E-05 1.12E-03
43 Ostra do mangue 5 OM 0.00E+00 1.12E-03 0.00E+00 1.34E-01
44 Ostra do mangue 5 OM 0.00E+00 1.34E-01 0.00E+00 3.76E-03
45 Ostra do mangue 4 OM 2.10E-03 3.76E-03 0.00E+00 6.01E-04
46 Ostra do mangue 4 OM 7.60E-05 6.00E-04 0.00E+00 7.59E-03
47 Ostra do mangue 8 OM 2.13E-03 7.58E-03 0.00E+00 1.69E-01
48 Ostra do mangue 8 OM 0.00E+00 1.69E-01 0.00E+00 1.95E-01
49 Ostra de cultivo 10 OM 7.30E-03 1.95E-01 0.00E+00 3.10E-03
50 Ostra de cultivo 10 OM 1.10E-02 3.10E-03 0.00E+00 2.23E-03
---- Dr. Georges Kaskantzis Neto ----
~ 15 ~
51 Bacucu 5 IC 0.00E+00 2.23E-03 0.00E+00 3.13E-03
52 Bacucu 5 IC 0.00E+00 3.13E-03 0.00E+00 4.35E-03
53 Bacucu 8 IC 2.87E-03 4.35E-03 0.00E+00 9.31E-04
54 Bacucu 8 IC 3.77E-03 9.30E-04 0.00E+00 2.51E-01
55 Bacucu 5 IC 1.31E-04 2.51E-01 0.00E+00 4.58E-03
56 Bacucu 5 IC 2.50E-04 4.58E-03 0.00E+00 1.61E-01
57 Marisco de costão 9 OM 0.00E+00 1.61E-01 0.00E+00 1.23E-01
58 Marisco de costão 9 OM 0.00E+00 1.23E-01 0.00E+00 1.36E+00
59 Marisco de costão 7 OM 0.00E+00 1.36E+00 0.00E+00 6.26E-01
60 Marisco de costão 7 OM 0.00E+00 6.25E-01 0.00E+00 1.48E-01
61 Marisco de costão AMACOP 3S OM 2.55E-04 1.48E-01 2.96E-05 5.77E-01
62 Marisco de costão AMACOP 2S OM 3.15E-04 5.76E-01 8.59E-05 9.66E-01
63 Marisco de costão AMAPRI 3S OM 2.13E-04 9.65E-01 1.01E-04 1.06E+00
64 Marisco de costão AMAPRI 2S OM 2.85E-04 1.06E+00 8.18E-05 1.05E+00
65 Marisco de costão AMAE 3S OM 2.42E-04 1.05E+00 2.07E-04 5.38E-01
66 Marisco de costão AMARIPE 3S OM 2.89E-04 5.38E-01 1.14E-04 2.89E-01
67 Marisco de costão AABC 1S OM 3.72E-04 2.89E-01 5.20E-04 9.47E-01
68 Marisco de costão AMAPRI 3M OM 3.72E-04 9.46E-01 1.12E-03 2.73E-01
69 Marisco de costão AMAPRI 2M OM 4.12E-04 2.73E-01 2.41E-04 5.91E-01
70 Marisco de costão AMACOP 3F OM 4.58E-04 5.90E-01 5.28E-04 9.88E-02
71 Marisco de costão AMACOP 2F OM 4.73E-04 9.87E-02 0.00E+00 1.10E-01
72 Marisco de costão AMAPRI 3F OM 3.01E-04 1.10E-01 0.00E+00 1.05E-01
73 Marisco de costão AMAPRI 2F OM 3.07E-04 1.05E-01 0.00E+00 8.55E-02
74 Marisco de costão AMACOP 2M OM 3.98E-04 8.54E-02 1.49E-04 6.07E-01
75 Marisco de costão AMACOP 3M OM 3.85E-04 6.07E-01 6.97E-05 8.72E-01
76 BERBIGÃO 4 IC 1.47E-04 8.71E-01 0.00E+00 7.34E+00
77 BERBIGÃO 4 IC 2.06E-04 7.33E+00 0.00E+00 3.92E+00
---- Dr. Georges Kaskantzis Neto ----
~ 16 ~
78 CAMARÃO 1 CR 1.19E-04 3.92E+00 2.83E-05 2.51E+00
79 CAMARÃO 2 CR 7.52E-05 2.51E+00 1.26E-04 7.03E-01
80 SIRI 1 CR 1.17E-04 7.03E-01 0.00E+00 4.09E+00
81 SIRI 2 CR 1.59E-04 4.09E+00 0.00E+00 2.84E-01
82 BAIACU 1 IC 1.18E-04 2.84E-01 0.00E+00 7.61E-04
83 BAIACU 2 IC 1.19E-04 7.60E-04 0.00E+00 1.91E+00
84 FIGADO DE BAIACU 1 VC 2.27E-04 1.91E+00 0.00E+00 4.07E-01
85 FIGADO DE BAIACU 2 VC 3.84E-04 4.07E-01 0.00E+00 5.10E-01
86 CORVINA 1 IC 1.40E-04 5.09E-01 0.00E+00 6.84E-01
87 CORVINA 2 IC 9.83E-05 6.84E-01 0.00E+00 7.76E-01
88 TANHOTA 1 IC 1.61E-04 7.75E-01 0.00E+00 9.74E-01
89 TANHOTA 2 IC 1.93E-04 9.73E-01 0.00E+00 8.11E-01
90 CORCOROCA 1 IC 1.57E-04 8.11E-01 0.00E+00 8.49E-01
91 CORCOROCA 2 IC 1.30E-04 8.48E-01 0.00E+00 7.01E-01
92 CARANGUEIJO 4 CR 0.00E+00 7.00E-01 2.44E-04 6.71E-01
93 CARANGUEIJO 5 CR 0.00E+00 6.70E-01 2.48E-04 3.75E-01
94 CARANGUEIJO 8 CR 0.00E+00 3.75E-01 2.73E-04 3.17E+00
95 CRACA 6 IC 2.09E-04 3.16E+00 1.40E-04 0.00E+00
Nomenclatura. IC – ictiofauna; CR – crustáceo; VC – vísceras; OM – marisco, mexilhão e ostra; AL – algas; MG – mangues; MR – marisma.
---- Dr. Georges Kaskantzis Neto ----
~ 17 ~
Visando a adequação dos dados das amostras investigadas
definiram-se sete classes de componentes ambientais e quatro gru-
pos de compostos químicos.
As sete classes de componentes ambientais definidos foram:
mangues (MG); ictiofauna (IC); crustáceos (CR); ostras, mariscos e
mexilhões (OM); algas (AL) e vísceras (VC). Além destes, os quatro
grupos de compostos definidos foram: BTEX; HEP; HPA e Metais.
Nas FIGURAS 1 – 3, encontram-se apresentados os grupos dos
compostos químicos; as classes dos componentes ambientais atingi-
dos pelo acidente naval e os pontos de amostragem.
FIGURA 2. GRUPOS DE COMPOSTOS QUÍMICOS DEFINIDOS EM FUNÇÃO DO
NÚMERO DE SUBSTÂNCIA DE CADA GRUPO E DA CONCENTRAÇÃO MÉDIA.
---- Dr. Georges Kaskantzis Neto ----
~ 18 ~
FIGURA 3. NÚMERO DE AMOSTRAS COLETADAS EM FUNÇÃO DOS LOCAIS DE COLETA E DAS CLASSES DE COMPONENTES
---- Dr. Georges Kaskantzis Neto ----
~ 19 ~
Estima-se que a quantidade de óleo derramada no acidente
naval tenha sido da ordem de 117.269 kg. Adotando o valor de 943,4
kg m-3 para a densidade da mistura, o volume da mistura derramada
foi aproximadamente 124,3 m3.
Da massa total de óleos derramados, cerca de, 9.100,07 kg
(7,76%) eram os compostos BTEX, 94.905,80 kg (80,93%)eram os com-
postos HEP, 4.655,58 kg (3,97%) correspondiam aos hidrocarbonetos
HPA e o restante da massa derramada, cerca de, 8607,55 kg (7,34%)
eram os metais.
FIGURA 4. DISTRIBUIÇÃO DA MASSA E FRAÇÃO PERCENTUAL DOS GRUPOS DE
COMPOSTOS QUÍMICOS QUE FORAM DEFINIDOS NO ESTUDO DO DERRAME.
---- Dr. Georges Kaskantzis Neto ----
~ 20 ~
Naturalmente que uma parcela dos produtos derramados e-
vaporou nas primeiras horas após o acidente, outra parcela formou
emulsão e o restante dos compostos dispersou no ambiente. Neste
acidente, a massa dos contaminantes que evaporou foi pequena,
porque as condições do tempo no dia do acidente, eram desfavo-
ráveis.
A probabilidade de cada uma das classes de componentes
ambientais ter sido atingida pelos contaminantes químicos dos qua-
tro grupos que formaram a mistura é a mesma, significando que po-
dem ter ocorrido 28 combinações entre os grupos dos compostos e
as classes dos componentes ambientais.
3. CONCEITOS DE ESTATÍSTICA DESCRITIVA
Visando a organização e descrições das observações relati-
vas as amostras da mistura oleosa e das amostragens de campo e-
xecutadas na época do emborcamento, a seguir, apresentam-se os
conceitos e técnicas da estatística básica descritiva, os quais, à me-
dida que forem sendo descritos serão aplicados na investigação do
acidente naval.
TIPOS DE VARIÁVEIS
Na descrição e análise de um conjunto de dados estatísticos,
podem ser definidas distintos tipos de variáveis, pois, o tratamento e
---- Dr. Georges Kaskantzis Neto ----
~ 21 ~
o método estatístico a serem usados dependem da natureza da va-
riável investigada.
Basicamente, as variáveis podem ser de natureza qualitativa
ou quantitativa. Em geral, as variáveis qualitativas estão associadas
a características que denotam qualidade ou atributo, como, por e-
xemplo, a cor dos olhos do entrevistado, desempenho do trabalha-
dor (ótimo, bom, ruim). As variáveis quantitativas, por sua vez, estão
associadas a valores numéricos, podendo ser discretos ou contínuos.
A variável discreta está associada às contagens e, a variável contí-
nua está associada às medições.
3.1. CLASSIFICAÇÃO DAS VARIÁVEIS
Tendo sido definidas as tipologias das variáveis estatísticas, a
seguir, apresentam-se as categorias das variáveis envolvidas no em-
borcamento.
As variáveis relativas ao cenário acidental são as concentra-
ções dos compostos químicos da mistura de óleos e aquelas obser-
vadas nos ensaios de laboratório das amostras dos componentes
ambientais atingidos pelos óleos, as classes de componentes ambi-
entais, os grupos de compostos da mistura oleosa, os pontos de a-
mostragem e os componentes ambientais alterados pelo derrame.
---- Dr. Georges Kaskantzis Neto ----
~ 22 ~
Com base na definição das características das variáveis es-
tatísticas, realizou-se a classificação das variáveis envolvidas no aci-
dente, tendo sido elaborado a TABELA 4, na qual se pode avaliar as
qualificações das variáveis de interesse deste estudo.
TABELA 4. CLASSIFICAÇÃO DAS VARIÁVEIS RELATIVAS AO EMBORCAMENTO.
VARIÁVEL CLASSIFICAÇÃO
Concentração Quantitativa contínua
Fração ponderal Quantitativa contínua
Grupos de compostos Qualitativa nominal
Classes de componentes Qualitativa nominal
Componentes ambientais Qualitativa nominal
Pontos de amostragem Qualitativa ordinária
A seguir, apresenta-se os conceitos e as técnicas de análise
das distribuições de frequências de amostras estatísticas.
3.2. DISTRIBUIÇÃO DE FREQUÊNCIAS
As observações de um fenômeno ou de um evento aciden-
tal devem ser organizadas de maneira adequada para que possam
fornecer as informações de interesse ao pesquisador. Com esse pro-
pósito, as observações são agrupadas empregando tabelas e gráfi-
cos elaborados de modo conveniente. O tipo de gráfico ou de ta-
bela a ser construído é função da variável que representa o fenô-
meno de interesse.
---- Dr. Georges Kaskantzis Neto ----
~ 23 ~
As variáveis discretas, em geral, são representadas por gráfi-
cos de pontos. Outra representação interessante é o gráfico das fre-
quências acumuladas sendo a frequência acumulada de um ponto
igual à frequência desse ponto somada com as frequências de to-
dos os valores menores que o ponto considerado.
As variáveis do tipo contínuas podem ser agrupadas em clas-
ses ou categorias. O critério que pode ser utilizado para definir o nú-
mero de classes k é aquele proposto por STURGES, cuja equação é
k = 1 + 3,32 ∙ log n (1)
Sendo: k – o número de classes; n – o número de observações
A amplitude, h, de cada classe será dada por
h =a
k (2)
Sendo: a – a amplitude total das observações, definida como a di-
ferença entre o maior e o menor valores observados; h – amplitude.
Na construção de tabelas ou gráficos de frequências outro
ponto que deve ser observado é quanto aos limites de classe de fre-
qüências. Em geral, na elaboração da tabela adotam-se os limites
aparentes que não correspondem ao significado real das observa-
ções. Pode-se, também adotar a frequência relativa de uma deter-
minada classe.
---- Dr. Georges Kaskantzis Neto ----
~ 24 ~
A frequência relativa, fi´ corresponde a razão da frequência
de classe fi e o número total de observações, ou frequência total n.
Assim, pode-se escrever,
fi′ =
fi
n (3)
O histograma de frequências é uma representação gráfica,
onde cada classe é representada por um retângulo, cuja base é i-
gual à amplitude de classe correspondente, e, a área é proporcio-
nal à frequência de classe.
O histograma de frequências acumuladas é outra represen-
tação gráfica muito utilizada para analisar as observações. Esse grá-
fico é obtido assinalando no eixo das abscissas os valores da variável
e no eixo ordenado as frequências acumuladas correspondentes.
3.3. ANÁLISE DAS FREQUÊNCIAS
Nesta seção se encontram apresentados os resultados da a-
nálise das classes de frequências dos valores das concentrações dos
grupos de compostos observados no laboratório nas amostras dos
componentes ambientais atingidos pela mistura oleosa.
Levando em consideração o fato dos valores das concentra-
ções observados nas amostras não atenderem a distribuição normal
de frequências, determinaram-se as frequências relativas das classes
de frequências identificadas conforme descrito, a seguir:
---- Dr. Georges Kaskantzis Neto ----
~ 25 ~
Aplicando a função do logaritmo natural ao valores da soma
das concentrações dos grupos BTEX, HEP, HPA e Metais obtiveram-
se os resultados que se encontram apresentados na TABELA 5.
Em seguida foram calculadas as classes de frequências, a sa-
ber:
N° de classes (k): N = 95 pontos
k = 1 + 3,32 × log 95 = 7,57~8 classes
Amplitude total (a)
o Valor máximo = - 11,67
o Valor mínimo = - 40,93
o Amplitude total = 29,26
Amplitude de cada classe (h)
h =a
k=
29,26
8= 3,66
Os resultados indicaram que o intervalo dos valores dos loga-
ritmos naturais das concentrações dos grupos de compostos, encon-
trados nas amostras dos componentes ambientais, com os testes de
laboratório, poderiam ser representados por oito classes de frequên-
cias, cujas amplitudes total e de classe eram respectivamente iguais
a 29,26 e 3,66. Das 95 observações inicialmente analisadas foram re-
movidos do adotadas apenas 58, significando que 37 observações
foram excluídas da amostra dos componentes ambientais.
---- Dr. Georges Kaskantzis Neto ----
~ 26 ~
TABELA 5. OBSERVAÇÕES COM AS QUAIS OBTIVERAM-SE AS FREQUÊNCIAS
ID ESPECIE LN (SOMA) INTERVALO FREQUENCIA LNSOMAPND
1 Raiz de mangue -32.44 1 6 -2.05
3 Raiz de mangue -40.93 1 6 -2.58
4 Raiz de mangue -34.24 1 6 -2.16
5 Raiz de mangue -34.06 1 6 -2.15
7 Marisma folha -34.04 2 10 -3.58
8 Marisma folha -35.4 2 10 -3.73
9 Marisma folha -37.28 2 10 -3.92
10 Marisma folha -36.9 2 10 -3.88
11 Marisma folha -36.17 2 10 -3.81
12 Marisma folha -36.98 2 10 -3.89
13 Marisma folha -38.98 2 10 -4.1
14 Marisma folha -39.24 2 10 -4.13
15 Marisma raiz -38.27 2 10 -4.03
16 Marisma raiz -22.69 2 10 -2.39
17 Marisma raiz -33.45 3 12 -4.23
18 Marisma raiz -35.7 3 12 -4.51
19 Marisma raiz -25.4 3 12 -3.21
20 Marisma raiz -32.67 3 12 -4.13
21 Marisma raiz -25.03 3 12 -3.16
22 Marisma raiz -23.47 3 12 -2.96
32 Mangue vermelho -27.66 4 20 -5.82
33 Mangue branco -27.46 4 20 -5.78
34 Mangue branco -26.84 4 20 -5.65
35 Mangue branco -27.33 4 20 -5.75
38 Mangue branco -29.19 4 20 -6.14
42 Alga parda -38.32 4 20 -8.07
43 Ostra do mangue -20.32 4 20 -4.28
44 Ostra do mangue -19.11 4 20 -4.02
45 Ostra do mangue -30.68 4 20 -6.46 47 Ostra do mangue -24.32 4 20 -5.12
49 Ostra de cultivo -23.84 4 20 -5.02
51 Bacucu -23.39 5 21 -5.17
52 Bacucu -22.72 5 21 -5.02
53 Bacucu -29.78 5 21 -6.58
54 Bacucu -25.46 5 21 -5.63
55 Bacucu -27.22 5 21 -6.02
59 Marisco de costão -11.67 5 21 -2.58
61 Marisco de costão -32.68 5 21 -7.22
62 Marisco de costão -29.52 5 21 -6.53
64 Marisco de costão -28.98 5 21 -6.41
66 Marisco de costão -30.6 5 21 -6.76
67 Marisco de costão -28.27 5 21 -6.25
68 Marisco de costão -27.56 5 21 -6.09
69 Marisco de costão -29.46 5 21 -6.51
70 Marisco de costão -29.59 5 21 -6.54
71 Marisco de costão -23.69 6 16 -3.99
73 Marisco de costão -24.31 6 16 -4.1
74 Marisco de costão -31.11 6 16 -5.24
75 Marisco de costão -29.58 6 16 -4.98
76 BERBIGÃO -18.48 6 16 -3.11
80 SIRI -19.51 6 16 -3.29
82 BAIACU -29 6 16 -4.88
83 BAIACU -27.08 6 16 -4.56
85 FIGADO BAIACU -20.95 6 16 -3.53
86 CORVINA -21.44 6 16 -3.61
87 CORVINA -21.37 7 3 -0.67
90 CORCOROCA -20.65 8 6 -1.3
91 CORCOROCA -20.98 8 6 -1.33
92 CARANGUEIJO -20.59 8 6 -1.3
93 CARANGUEIJO -21.2 8 6 -1.34
94 CARANGUEIJO -19.55 8 6 -1.23
---- Dr. Georges Kaskantzis Neto ----
~ 27 ~
Com as observações escolhidas foram obtidas as estatísticas
da amostra cujos valores e histograma encontram-se apresentados
na TABELA 6 e FIGURA 5, respectivamente
FIGURA 5. HISTOGRAMA DOS VALORES DO LOGARITMOS DAS CONCENTRA-
ÇÕES DOS GRUPOS DOS COMPOSTOS OBSERVADOS NOS COMPONENTES
AMBIENTAIS ATINGIDOS PELA MISTURA OLEOSA.
TABELA 6. ESTATÍSTICAS DA AMOSTRA DE COMPONENTES AMBIENTAIS
ESTATÍSTICAS VALORES
Média e Mediana -4,22 ; -4,10
Desvio padrão e variância -1,72 ; 2,97
Soma e N (observações) - 245 ; 58
IC+95% e IC-95% -3,72 ; -4,07
Skewness e Kurtosis 0,055 ; - 0,57
---- Dr. Georges Kaskantzis Neto ----
~ 28 ~
O histograma das frequências das classes dos componentes
ambientais definidos no estudo se encontra ilustrado na FIGURA 6. E,
nas FIGURAS 7 – 10, apresentam-se os histogramas de frequência dos
grupos de compostos químicos encontrados nas amostras dos com-
ponentes ambientais.
FIGURA 6. HISTOGRAMA DAS FREQUÊNCIAS DE OCORRÊNCIA DAS CLASSES
DE COMPONENTES AMBIENTAIS NA AMOSTRA DOS VALORES DAS CONCEN-
TRAÇÕES DE COMPOSTOS QUÍMICOS OBSERVADOS NOS TESTES ANALÍTICOS
Os dados apresentados na FIGURA 6 indicaram que 28% dos
valores dos logaritmos das somas das concentrações dos compostos
observados nas campanhas de amostragem foram relativos a classe
dos componentes ostras, mexilhões e mariscos. Em seguida, foram os
mangues, depois, marismas e ictiofauna e algas e crustáceos.
---- Dr. Georges Kaskantzis Neto ----
~ 29 ~
FIGURA 7. MOSAICO DOS HISTOGRAMAS DAS FREQUÊNCIAS DOS VALORES
DO LOGARÍTMO DAS CONCENTRAÇÕES DE BTEX E HEP OBSERVADAS NAS
AMOSTRAS DE COMPONENTES AMBIENTAIS INVESTIGADOS NA ÉPOCA DOS
FATOS.
---- Dr. Georges Kaskantzis Neto ----
~ 30 ~
FIGURA 8. MOSAICO DOS HISTOGRAMAS DAS FREQUÊNCIAS DOS VALORES
DO LOGARÍTMO DAS CONCENTRAÇÕES DE HPA E DE METAIS OBSERVADAS
NAS AMOSTRAS DE COMPONENTES INVESTIGADOS NA ÉPOCA DOS FATOS.
---- Dr. Georges Kaskantzis Neto ----
~ 31 ~
3.4. MEDIDAS DE TENDÊNCIA CENTRAL
Tendo sido discutidas a importância da análise das frequên-
cias das ocorrências que atingiram os recursos naturais da Baía da
Babitonga, nesta seção da apostila deverão ser apresentadas e a-
plicadas as variáveis estatísticas de medida da tendência central de
populações e de amostras de observações.
Com o avanço da ciência, notadamente o desenvolvimento
do computador, as métodos matemáticos empregados para a re-
solução de problemas complexos foram aperfeiçoados, possibili-
tando a manipulação de uma grande quantidade de informações.
Uma forma simples de manipular uma grande quantidade de
dados para descrever um evento acidental ou um fenômeno natu-
ral é utilizar um único elemento cujo valor representa todos os dados,
tendendo a se localizar no centro do conjunto de todos os valores.
Esta peculiaridade descoberta pelos pesquisadores é conhe-
cida como “medida de tendência central”. As medidas de tendên-
cia central usuais são a média aritmética, a mediana e a moda. A
seguir, apresentam-se as definições das citadas estatísticas, as quais,
posteriormente serão aplicadas com as amostras do acidente naval.
3.4.1. MÉDIA ARITMÉTICA, MEDIANA E MODA
A média aritmética, x, de um conjunto de n valores x1, x2, ...,
xn, é definida como:
---- Dr. Georges Kaskantzis Neto ----
~ 32 ~
�̅� =∑ xi
ni=1
n=
∑ x
n (4)
Se, x1, x2, ..., xn, ocorrem com as frequências f1, f2, ..., fn, respec-
tivamente, a média aritmética será definida como:
�̅� =∑ fixi
ni=1
∑ f=
∑ f x
∑ f =
∑ f x
n (5)
A mediana, Me, de um conjunto de n valores ordenados, x1,
x2, ..., xn, é representada pelo valor central do conjunto, o elemento
de ordem n/2, para n impar ou pela média de dois valores de ordem
n/2 e (n/2 +1). Observa-se que a mediana é utilizada nos casos nos
quais o conjunto de dados é influenciado por valores extremos,
sendo mais utilizada nestes casos do que a média.
A moda, Mo, de um conjunto de valores de n valores x1, x2, ...,
xn, é determinada pelo elemento do conjunto de dados que apre-
senta o maior valor de frequência significando que dependendo do
caso analisado, pode existir mais do que um valor para a moda.
3.5. MEDIDAS DE DISPERSÃO
As medidas de tendência central, apesar da sua grande uti-
lidade, dependendo do evento a ser analisado, não são capazes o
suficiente de fornecer detalhes o comportamento da amostra ou do
conjuntos de dados a ser analisado, devendo-se usar as variáveis de
medida de dispersão.
---- Dr. Georges Kaskantzis Neto ----
~ 33 ~
As principais variáveis de medida da dispersão são a variân-
cia s2, o desvio padrão, s e coeficiente de variação cv, cujas defini-
ções se encontram indicadas nas equações 6 - 9, respectivamente:
s2 =∑ (xi − x̅)2n
i=1
n (6)
s2 =∑ fi(xi − x̅)2k
i=1
∑ fiki
=∑ fi(xi − x̅)2k
i=1
n (7)
s = √s2 (8)
cv =s
x̅ (9)
3.6. MEDIDAS DE DISTRIBUIÇÃO
As variáveis de medida de distribuição são empregada para
analisar o comportamento da distribuição de frequência dos dados
em relação a função de distribuição normal de probabilidades.
As estatísticas calculadas para este fim são o coeficiente de
assimetria (Skewness), o coeficiente de achatamento (Kurtosis). Ob-
serva-se que os valores esperados para os coeficientes de assimetria
e achatamento são respectivamente zero e um, os quais correspon-
dem aqueles da função de distribuição normal de probabilidades.
A assimetria é definida como o grau de desvio, ou de afasta-
mento da simetria de uma distribuição. Em termos matemáticos essa
---- Dr. Georges Kaskantzis Neto ----
~ 34 ~
estatística pode ser estimada, calculado o coeficiente do momento
de assimetria e o coeficiente de assimetria de Pearson.
O coeficiente do momento de assimetria, ai, é uma medida
adimensional definida pela razão do terceiro momento centrado na
média, m3, e o cubo do desvio padrão, isto é,
a3 =m3
s3 (10)
m3 =∑ (xi − x̅)3n
i=1
n (11)
Casos particulares
a) Para a = 0
A distribuição é simétrica
b) Para a < 0
A distribuição é alongada à esquerda (cauda pesada)
c) Para a > 0
A distribuição é alongada à direita (cauda pesada)
O coeficiente de assimetria de Pearson, A, é uma medida a-
dimensional de assimetria definida como:
A =x̅ − Mo
s (12)
3.6.1. CURTOSE
---- Dr. Georges Kaskantzis Neto ----
~ 35 ~
A curtose é uma medida do grau de achatamento de uma
distribuição em relação aquele da distribuição normal de probabili-
dades, podendo ser de três tipos: normal; platocúrtica; leptocúrtica.
Em termos matemáticos, a curtose de uma distribuição pode
ser determinada pelo coeficiente do momento de curtose, a4, cuja
definição é o quociente do quarto momento centrado da média e
o quadrado da variância, isto é,
a4 =m4
(s2)2=
m4
s4 (13)
m4 =∑ fi(xi − x̅)4
n (14)
Tendo sido apresentados os principais fundamentos da esta-
tística básica descritiva, na sequência deverão ser determinadas as
estatísticas descritivas da amostra constituída pelos valores das con-
centrações dos compostos da mistura oleosa, assim como, da amos-
tra dos valores das concentrações dos compostos identificados nas
amostragens dos componentes ambientais alterados pelo acidente,
as quais foram determinadas nos testes de laboratório.
3.7. ESTATÍSTICAS DAS AMOSTRAS
---- Dr. Georges Kaskantzis Neto ----
~ 36 ~
Com base nas estatísticas da análise descritiva apresentadas
foram analisadas as amostras da mistura oleosa e dos componentes
ambientais definidos neste estudo.
Uma vez que, o escopo da investigação do emborcamento
foi verificar se os compostos identificados nos componentes ambien-
tais afetados eram aqueles mesmos que formaram a mistura oleosa,
a partir dos óleos vazados no incidente, calcularam-se as estatísticas
dos grupos de compostos da mistura oleosa e daqueles observados
nas amostras dos componentes ambientais.
Deve-se observar que os compostos químicos determinados
nas amostras dos componentes ambientais estar relacionados com
as classes dos componentes ambientais, bem com, com os locais de
coleta das amostras, ou com ambos, isto é, com as classes e com os
locais de amostragem dos componentes ambientais.
Tais hipóteses somente poderão ser analisadas com os testes
de hipóteses a serem apresentados nas próximas seções da apostila,
mas, considerando factível essas possibilidades, decidiu-se determi-
nar as estatísticas dos grupos de compostos em função das locais de
amostragem e das classes de componentes ambientais, e, também
de todos os elementos da segunda amostra investigada no estudo.
3.7.1. ESTATÍSTICAS DOS GRUPOS DE COMPOSTOS
---- Dr. Georges Kaskantzis Neto ----
~ 37 ~
Nas FIGURAS 9 e 12, indicam-se as estatísticas dos grupos dos
compostos BTEX, HEP, HPA e Metais, respectivamente, na mistura.
FIGURA 9. ESTATÍSTICAS DOS COMPOSTOS BTEX NA MISTURA OLEOSA
FIGURA 10. ESTATÍSTICAS DOS COMPOSTOS HEP NA MISTURA OLEOSA
---- Dr. Georges Kaskantzis Neto ----
~ 38 ~
FIGURA 11. ESTATÍSTICAS DOS COMPOSTOS HPA NA MISTURA OLEOSA
FIGURA 12. ESTATÍSTICAS DO GRUPO DOS METAIS NA MISTURA OLEOSA
Inspecionando os valores das estatísticas dos grupos de com-
postos da mistura oleosa se pode notar que os HEP são aqueles que
se encontravam mais concentrados (6,55 x 10-3 mg g-1), em seguida
eram os compostos BTEX (5,798 x 10-4), e, os menos concentrados e-
ram os HPA (1,85 x 10-4 mg g -1) e os metais (1,62 x 10 -4 mg g-1).
---- Dr. Georges Kaskantzis Neto ----
~ 39 ~
3.7.2. ESTATÍSTICAS DAS CLASSES DE COMPONENTES
Nas FIGURAS 13 e 16 podem ser observadas as estatísticas dos
grupos BTEX, HEP, HPA e metais nos componentes ambientais
FIGURA 13. ESTATÍSTICAS DOS BTEX NOS COMPONENTES AMBIENTAIS
FIGURA 14. ESTATÍSTICAS DOS HEP NOS COMPONENTES AMBIENTAIS
---- Dr. Georges Kaskantzis Neto ----
~ 40 ~
FIGURA 15. ESTATÍSTICAS DOS HPA NOS COMPONENTES AMBIENTAIS
FIGURA 16. ESTATÍSTICAS DOS METAIS NOS COMPONENTES AMBIENTAIS
Analisando as estatísticas dos grupos de compostos observa-
dos nas amostras dos componentes ambientais afetados, verifica-se
que os compostos HEP são aqueles que estavam mais concentrados
(4,33 x 10 -3 mg g-1), em seguida, os compostos mais concentrados
eram do grupo dos BTEX (2,34 x 10-4 mg g-1).
---- Dr. Georges Kaskantzis Neto ----
~ 41 ~
Os compostos dos grupos metais e HAP, se comportaram do
mesmo modo como observado para a mistura oleosa, sendo aque-
les apresentaram as menores valores de concentrações, respectiva-
mente 4,53 x 10-4 e 9,71 x 10 -5 mg g-1.
Conforme citado na introdução os componentes ambientais
afetados pelo derrame foram categorizados visando a determina-
ção das estatísticas básicas descritivas. Os grupos dos componentes
ambientais definidos foram os mangues; as marismas; as espécies da
ictiofauna; crustáceos; mexilhões, ostras e mariscos; algas e vísceras.
As estatísticas descritivas dos valores das concentrações dos
grupos de compostos em função das categorias dos componentes
ambientais se encontram apresentadas na TABELA 7.
TABELA 7. ESTATÍSTICAS DOS VALORES DAS SOMAS DAS CONCENTRAÇÕES
DOS COMPOSTO CONTAMINANTES EM FUNÇÃO DAS CLASSES AMBIENTAIS
ESTATÍSTICA AL CR IC MG MR OM
Média 6.36E-04 5.45E-02 4.29E-02 2.21E-02 2.40E-02 5.92E-03
Des. Padrão 1.63 5.16 7.61 5.47 1.73 4.76
Erro padrão 1.28 1.86 1.68 1.43 1.15 1.42
IC (+95%) 1.39E-03 2.49E-01 1.31E-01 4.74E-02 3.21E-02 1.23E-02
IC (-95%) 2.92E-04 1.20E-02 1.40E-02 1.05E-02 1.80E-02 2.85E-03
N 4 7 15 22 16 20
Nas TABELAS 8 -9, apresentam-se os valores da soma das con-
centrações e respectivos percentuais de compostos químicos obser-
vados nas campanhas do monitoramento da contaminação.
---- Dr. Georges Kaskantzis Neto ----
~ 42 ~
TABELA 8. CONCENTRAÇÕES GLOBAIS DOS GRUPOS DE COMPOSTOS OB-
SERVADOS NAS AMOSTRAS DAS CLASSES DE COMPONENTES AMBIENTAIS.
CLASSE BTEX HEP HPA METAIS SOMA
AL (mg g-1) 2.33E-04 2.71E-03 1.70E-05 5.95E-05 3.02E-03
CR (mg g-1) 1.14E-04 1.25E-02 1.42E-04 1.07E-03 1.38E-02
IC (mg g-1) 1.54E-04 1.55E-03 1.41E-04 1.94E-04 2.04E-03
MG (mg g-1) 7.17E-04 4.43E-03 1.17E-04 4.44E-04 5.71E-03
MR (mg g-1) 4.31E-04 6.89E-04 4.45E-05 9.05E-05 1.26E-03
OM (mg g-1) 3.29E-04 3.21E-03 1.65E-04 3.71E-04 4.08E-03
Total (mg g-1) 1.98E-03 2.51E-02 6.27E-04 2.23E-03 2.99E-02
TABELA 9. DISTRIBUIÇÃO PERCENTUAL DOS VALORES DAS CONCENTRAÇÕES
DOS COMPOSTOS HIDROCARBONETOS E METAIS EM FUNÇÃO DAS CLASSES
DE COMPONENTES AMBIENTAIS ATINGIDOS PELO ACIDENTE NAVAL.
CLASSE % BTEX % HEP % HPA % METAIS % SOMA
AL 0.78% 9.06% 0.06% 0.20% 10.09%
CR 0.38% 41.77% 0.47% 3.58% 46.21%
IC 0.51% 5.18% 0.47% 0.65% 6.81%
MG 2.40% 14.80% 0.39% 1.48% 19.08%
MR 1.44% 2.30% 0.15% 0.30% 4.19%
OM 1.10% 10.73% 0.55% 1.24% 13.62%
SOMA 6.61% 83.85% 2.09% 7.45% 100.00%
Com base nos resultados apresentados nas TABELAS 8 e 9 se
pode nota que os compostos encontrados nas amostras dos com-
ponentes ambientais, na sua grande maioria, eram HEP (83,85%),
tendo se acumulado, preferencialmente na classe de componentes
---- Dr. Georges Kaskantzis Neto ----
~ 43 ~
crustáceos, provavelmente em razão da maior quantidade de óleos
que se depositou nos mangues.
Os compostos do grupo BTEX, apesar de terem representado
o segundo grupo mais concentrado de composto da mistura oleosa,
nas amostras analisadas ocuparam a terceira posição em termos de
concentração, tendo sido ultrapassados pelo grupo dos metais, fato
que pode ser justificado com base no menor ponto de ebulição nor-
mal dos hidrocarbonetos em relação aos metais.
Neste sentido, observa-se que a concentração dos HPA nas
amostras analisadas estavam, cerca de, sete vezes menos concen-
trado nas amostras do que na mistura dos óleos de petróleo. Os da-
dos descritos nas tabelas também revelam que os compostos BTEX
se depositaram nos mangues, enquanto, os compostos dos grupos
HEP e metais foram encontrados com maior frequências nos crustá-
ceos. Finalmente, observou-se que a distribuição das concentrações
dos compostos do grupo HPA foi praticamente constante nas classes
de todos os componentes ambientais, exceto nas algas e nos culti-
vos de mariscos, mexilhões e ostras.
---- Dr. Georges Kaskantzis Neto ----
~ 44 ~
4. FUNÇÃO PROBABILIDADE
4.1. CONCEITOS
Tendo sido descritos os conceitos básicos da estatísticas des-
critiva, nesta seção do estudo apresentam-se a função de probabi-
lidade e as distribuições teóricas contínuas e discretas de probabili-
dades.
4.1.2. FUNÇÃO DE PROBABILIDADE DISCRETA
Seja X uma variável aleatória discreta. A cada possível resul-
tado ou evento xi associasse um número p(x) = P(X=xi), denominado
como probabilidade de xi. Por consequência, a função p(x) deno-
mina-se como função de probabilidade da variável aleatória X.
Sendo p(x) uma função de probabilidade, tem-se:
a) p(xi) ≥ 0 para q. q. i (15)
b) ∑ p(xi) = 1 (16)
∞
i=1
Assim, o conjunto dos pares (𝑥𝑖, 𝑝(𝑥𝑖)),denomina-se como dis-
tribuição de probabilidades de X.
4.1.3. FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA
---- Dr. Georges Kaskantzis Neto ----
~ 45 ~
Seja X uma variável aleatória. A função de distribuição acu-
mulada de X é definida como:
F(x) = P(X ≤ x) (17)
Se a variável X fora discreta, tem-se
F(x) = ∑ P(xi)
xi< x
(18)
Propriedades
a) 0 ≤ F(x) ≤ 1;
b) limn→−∞
F(x) = 0 ;
c) limn→+∞
F(x) = 1 ;
d) Seja F(x) decrescente, então, p/ todo x1 ≤ x2, F(x1) ≤ F(x2);
e) F(x2) − F(x1) = P(x1 < X ≤ x2), sendo x1 > x2
4.1.4 FUNÇÃO DENSIDADE DE PROBABILIDADE
Seja X uma variável aleatória contínua. Define-se A função
densidade de probabilidade aquela que satisfaz as propriedades, a
saber:
a) f(x) ≥ 0 para todo x ∈ R;
b) ∫ f(x) dx = 1
A segunda condição de verificação da função densidade
de probabilidade representa a área total limitada pela função, cujo
valor é igual a unidade. Essa condição, pode ser escrita como:
---- Dr. Georges Kaskantzis Neto ----
~ 46 ~
P(a ≤ X ≤ b) = ∫ f(x)dx (19)b
a
Como a probabilidade das variáveis contínuas é uma área,
para um único valor de x o seu valor é zero. Em virtude dessa pecu-
liaridade, tem-se:
P(X = xo) = ∫ f(x)dxxo
xo
= 0 (20)
Logo,
P(a ≤ X ≤ b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a < X < b) (21)
Uma vez definida a função de distribuição acumulada F(X),
para a variável X aleatória contínua, pode-se determinar a função
densidade de probabilidade (fdp), cuja expressão matemática tem
a forma:
f(x) = F(x) =dF(x)
dx (22)
RESUMO
a) Probabilidade: p(xi) = P (X = xi);
b) Função probabilidade: conjuntos de variáveis aleatórias
Para variáveis discretas: p(xi) ≥ 0 p/ todo x
Para variáveis contínuas: ∑ p(xi) = 1
c) Função distribuição acumulada de probabilidades F(x)
Para variáveis discretas: F(x) = p (X ≤ xi)
---- Dr. Georges Kaskantzis Neto ----
~ 47 ~
Para variáveis contínuas: F(x) = ∑ p(xi) p/ xi ≤ x
d) Função densidade de probabilidades: 2 condições
(i) f(x) ≥ 0 para todo x Є R
(ii) Integral f(x) = 1 – representa uma área
e) Propriedades
(i) Se xo = a = b - fdp = 0;
(ii) Se xo = k - fdp = 1
(iii) Se F(x) for conhecida, p(x) será F(x)/ dx = p(x)
4.1.5 GRÁFICOS DA DISTRIBUIÇÃO DE PROBABILIDADE
FIGURA 17. Função distribuição de probabilidades por linhas
Nas FIGURAS 17 – 19, apresentam-se as formas de represen-
tar as funções de probabilidades.
---- Dr. Georges Kaskantzis Neto ----
~ 48 ~
FIGURA 18. Função probabilidade representada por pontos
FIGURA 19. Função probabilidade normal e suas estatísticas
4.2. ESTATÍSTICAS BÁSICAS
Nesta seção apresentam-se os conceitos e sistemáticas de
cálculo das estatísticas básicas descritivas.
---- Dr. Georges Kaskantzis Neto ----
~ 49 ~
4.2.1.ESPERANÇA, MÉDIA OU VALOR ESPERADO
Seja X um variável aleatória. A esperança, E(X) média ou va-
lor esperado são definidos como:
E(X) = μX = ∑ xi(p(xi)
∞
i=1
(23)
Quando a variável aleatório for contínua, a esperança é definida
como:
E(X) = µ =∫ 𝑥 𝑓(𝑥) (24)+∞
−∞
PROPRIEDADES
a) E(k) = k p/ todos os valores de F(x) e k = cte.
b) E(k*X) = k * E(X)
c) E (X ± Y) = E(X) ± E(Y)
d) E (k ± X) = E(X) ± k;
e) E (X * Y) = E(X) * E(Y), p/ X e Y independentes e reais
4.2.2. VARIÂNCIA OU DISPERSÃO
Se X é uma variável aleatória, a variância é definida como:
V(X) = Var (X) = s2 = E [X – E(X)] = E [X – E(x)]2 (25)
Reagrupando a equação 22, obtém-se
---- Dr. Georges Kaskantzis Neto ----
~ 50 ~
V(X) = E(X2 − 2XE(X) + (E(X))2) = E(X2) − 2E(X)E(X) + [E(X)]2
= E(X2) − [E(X)]2 (26)
PROPRIEDADES
a) V(k)=0, sendo k = cte;
b) V(kX)= k2 V(X);
c) V (K ± k) = V(X);
d) V(X ± Y) = V(X) + V(Y) ± 2 COV(X, Y).
Sendo, a covariância, COV, definida como:
COV(X, Y) = E{[X − E(X)][Y − E(Y)]} = E(XY) − E(X)E(Y) (27)
Se, as variáveis X e Y foram independentes, então, tem-se
E(XY) = E(X)E(Y) (29)
Observa-se que, embora a COV (X, Y) seja nula sempre que
X e Y forem independentes, a recíproca pode não ser verdadeira,
isto é, o fato da covariância ser nula não é suficiente para afirmar-
se que as variáveis aleatória X e Y sejam necessariamente indepen-
dentes.
4.2.3. VARIÁVEIS ALEATÓRIAS DISCRETAS
Para variável aleatória discreta a variância é definida como:
V(X) = E(X2) − [E(X)]2 = ∑ xi2p(xi) − [∑ xip(xi)
∞
i=1
]
2
(30)
∞
i=1
---- Dr. Georges Kaskantzis Neto ----
~ 51 ~
Observando a eq. 26 verifica-se que o valor da variância é
igual a média das diferenças ao quadrado das observações e das
suas médias
4.2.4. VARIÁVEIS ALEATÓRIAS CONTÍNUAS
Seja X uma variável aleatória contínua no intervalo [a, b]. A va-
riância dessa variável é definida como:
V(X) = E(X2) − [E(X)]2 = ∫ x2f(x)dx − [∫ x ∙ f(x)dx
b
a
]
2b
a
(31)
CONSIDERAÇÕES
Conforme apresentado, o cálculo da esperança matemá-
tica e variância estatísticas deverá ser realizado de maneira particu-
lar para as variáveis aleatórias discretas e contínuas. Estas variáveis
quando determinadas com base na probabilidade são estimativas
obtidos a partir dos valores observados.
Considerando o fato da esperança matemática e da variân-
cia dependerem da probabilidade é necessário assegurar o nível de
confiança dos valores estimados. Para tanto, deverão ser apresen-
tadas as funções de distribuição de probabilidades.
---- Dr. Georges Kaskantzis Neto ----
~ 52 ~
5. DISTRIBUIÇÕES TÉORICAS DE PROBABILIDADES
Considerando os conhecimentos adquiridos nas seções anteri-
ores, apresentam-se as distribuições teóricas de probabilidades para
as variáveis aleatórias contínuas a discretas.
Para variáveis aleatórias discretas as distribuições usualmente
empregadas são a distribuição Binomial e a distribuição de Poisson.
Quanto as distribuições para as variáveis aleatórias contínuas deve-
rão ser apresentadas as distribuições de: Uniforme ou Retangular; Ex-
ponencial; Normal; t de Student; F de Snedecor, as quais são aquelas
de maior interesse da área da engenharia.
5.1. DISTRIBUIÇÕES TEÓRICAS DISCRETAS DE PROBABILIDADES
A) Distribuição Binomial
Seja p a probabilidade de um evento E acontecer em uma
única tentativa (denomina como sucesso, sendo q a probabilidade
do evento não acontecer nessa única tentativa. Então, a probabili-
dade do evento E ocorrer exatamente x vezes em n tentativa é de-
finida pela função de probabilidade denominada distribuição Bino-
mial, cuja equação tem a forma:
P(X = x) = (n
x) pxqn−x =
n!
x! (n − x)!pxqn−x (32)
Na distribuição Binomial a média e a variância são respecti-
vamente definidas como:
---- Dr. Georges Kaskantzis Neto ----
~ 53 ~
μ = n ∙ p (33)
σ2 = n ∙ p ∙ q (34)
Como a variável X aleatória representa o número de suces-
sos, os possíveis valores que podem ser atribuídos para X são 0, ..., n.
B) Distribuição de Poisson
Partindo da expressão da distribuição Binomial, isto é, da eq.
28, fazendo n tender ao infinito e mantendo constante o produto n
x p, o qual corresponde ao valor da média da distribuição de X, ob-
tém-se a função da distribuição de probabilidades de Poisson, cuja
a equação é definida como:
P(X = x) =𝜇𝑥𝑒−𝑥
𝑥! (35)
Observa-se que a distribuição de Poisson á adequada para
investigar evento cuja probabilidade de ocorrência é pequena, em
razão das hipóteses adaptadas para a sua derivação. Na prática, a
distribuição de Poisson é aplicada aos caso cujos valores de n ≥ 50
e n x p < 5, como µ = n x p.
Na distribuição de Poisson, a média coincide com a variân-
cia, isto é, 2 = µ = n x p.
5.2. DISTRIBUIÇÕES TEÓRICAS CONTÍNUAS DE PROBABILIDADES
C) Distribuição uniforme ou retangular
---- Dr. Georges Kaskantzis Neto ----
~ 54 ~
Para uma variável aleatória contínua contida no intervalo [a,
b], a função densidade de probabilidades é definida como:
f(x) =1
b − a {
se a ≤ xi ≤ b
se x ≠ xi f(x) = 0 (36)
A esperança matemática e a variância da distribuição uni-
forme de probabilidades são definidas como:
E(X) =a + b
2 (37)
V(X) =(b − a)2
12 (38)
D) Distribuição exponencial
A função de densidade de probabilidade exponencial para
uma variável aleatória contínua X é definida como:
f(x) = k ∙ e−kx { para x ≥ 0
= 0, 𝑝𝑎𝑟𝑎 𝑥 < 0 (39)
A esperança matemática e a variância da distribuição exponen-
cial de probabilidades são definidas como:
E(X) = μ =1
𝑘 (40)
V(X) = 𝜎2 =1
𝑘2 (41)
E) Distribuição normal (Gauss)
Seja X uma variável aleatória continua. A função densidade
de probabilidade normal da variável X é definida como:
---- Dr. Georges Kaskantzis Neto ----
~ 55 ~
f(x) =1
σ√2πe−
12
(x−μ
σ)
2
(42)
Essa função apresenta dois parâmetros, a média e o desvio
padrão. A representação formal da distribuição normal de probabi-
lidades da variável aleatória contínua X se encontra na eq. 43.
X~N(μ, σ2) (43)
PROPRIEDADES
a) A distribuição normal é simétrica em relação à média;
b) A função apresenta um máximo em x = µ;
c) A função é assintótica ao eixo das abscissas;
d) A função admite dois ponto de inflexão, para x = µ ±;
e) A função de distribuição acumulada é definida como
F(x) =1
σ√2π∫ e−
12
(x−μ
σ)
2dx
x
−∞
(44)
A estatística z, isto é, o valor da pontuação padrão, também
conhecida como pontuações-Z é o número direcionado de desvio
padrão com base na média na qual o valor é definido pela eq. 45.
z =x − μ
σ (45)
Diferenciando a equação 14 em relação a variável x, obtém-
se,
dz =dx
σ (46)
Logo,
---- Dr. Georges Kaskantzis Neto ----
~ 56 ~
dx = σ dz (47)
Substituindo a equação (47) na eq. (44) e fazendo as opera-
ção algébricas necessárias obtém-se a equação (48).
G(z) = 1
√2π∫ e−
z2
2dz
z
−∞
(48)
A equação (44) é a distribuição acumulada da variável nor-
mal reduzida z, cujas média e a variância são zero e um, respectiva-
mente.
Logo, a equação (48) pode ser escrita como,
g(z) =1
√2πe−
z2
2 − ∞ < z < +∞ (49)
A forma da função padrão densidade de probabilidade da
variável aleatória contínua X tem a forma sinodal, sendo conhecida
como função de Gauss, cuja média é igual a zero e o desvio padrão
é igual a unidade. A seguir, encontram-se apresentadas as curvas
de distribuição de probabilidades mais utilizadas.
---- Dr. Georges Kaskantzis Neto ----
~ 57 ~
FIGURA 20. CURVA DA DISTRIBUIÇÃO NORMAL DE PROBABILIDADES.
FIGURA 21. PECULIARIDADES DA FUNÇÃO NORMAL DE DISTRIBUIÇÃO
---- Dr. Georges Kaskantzis Neto ----
~ 58 ~
FIGURA 22. MOSAICO DE GRÁFICOS INDICANDO AS CURVA DA DIS-
TRIBUIÇÃO LOGNORMAL E LOGNORMAL ACUMULADA.
---- Dr. Georges Kaskantzis Neto ----
~ 59 ~
FIGURA 23. FUNÇÕES DE DISTRIBUIÇÃO DE PROBABILIDADES RESPECTI-
VAMENTE BINOMIAL, t – STUDENT e WEIBUL [WIKIPEDIA, 20013]
---- Dr. Georges Kaskantzis Neto ----
~ 60 ~
TABELA 10. TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO P (Z < z).
Z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
---- Dr. Georges Kaskantzis Neto ----
~ 61 ~
TABELA 11. TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO P (Z < z). Z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
---- Dr. Georges Kaskantzis Neto ----
~ 62 ~
TABELA 12. TABELA DA DISTRIBUIÇÃO DE t – STUDENT [WIKIPÉDIA, 2014]
---- Dr. Georges Kaskantzis Neto ----
~ 63 ~
TABELA 13. TABELA DA DISTRIBUIÇÃO DE CHI-QUADRADO [WIKIPÉDIA, 2014]
---- Dr. Georges Kaskantzis Neto ----
~ 64 ~
5.3. DISTRIBUIÇÕES DE PROBABILIDADE DE OBSERVAÇÕES
Para utilizar de maneira correta as funções de distribuição de
probabilidades pode-se adotar dois métodos para investigar a hipó-
tese de interesse. Observa-se que o conteúdo relativo aos testes es-
tatístico de hipótese deverá ser apresentado nas próximas seções,
mas, é fundamente entender a sistema do emprego das tabelas de
distribuições estatísticas nessa etapa do estudo.
Basicamente, existem dois métodos para investigar eventos,
com base nas distribuições de probabilidades. O primeiro método, o
qual deverá ser descrito nessa seção, chama-se método tradicional.
Neste método, predetermina-se o nível de significância, alfa,
para compará-lo com o valor da função fornecida pela distribuição
adota. Os níveis de significância, em geral, empregados são 0,01 (99
% de confiança); 0,05 (95% de confiança) e 0,10 (90% de confiança).
O segundo método de investigação de hipóteses, o método
do valor-p, a estatística do teste é calculada usando-se o dado a-
mostral, então a distribuição de probabilidade adequada é usada
para encontrar a probabilidade de se observar uma estatísticas a-
mostral que seja pelo menos um pouco diferente do valor da hipó-
tese nula para o parâmetro populacional (o valor da probabilidade
ou valor-p), quanto menor for o valor-p, melhor é a prova para rejei-
tar a hipótese nula (Ho).
---- Dr. Georges Kaskantzis Neto ----
~ 65 ~
O valor-p também representa o menor nível de significância
ao qual a hipótese nula (Ho) pode ser rejeitada. Portanto, os resulta-
dos dos valores-p podem ser usados com nível de significância fixo,
rejeitando a Ho se o valor-p for menor ou igual a alfa (valor p ≤α).
Geralmente, quanto maior for o valor da estatística do teste,
isto é, mais distanciado de zero, positivo ou negativo, menor o valor-
p, o que fornece uma prova melhor contra a hipótese nula a favor
da hipótese alternativa.
EXERCÍCIO DE FIXAÇÃO DOS CONTEÚDOS
Uma indústria mecânica fabrica tubulações industriais cujos
diâmetros externos são normalmente distribuído, apresentando mé-
dia e desvio padrão da ordem de 40 e 2,0mm, respectivamente.
Calcular a percentagem de peças defeituosas, com base nos da-
dos registrados pelo departamento de qualidade da indústria. Os
dados indicam os fatos, a saber.
a) Existem peças com diâmetro menor que 37,0 mm;
b) Existem peças com diâmetro maior que 44,0 mm;
c) Existem peças com desvio maior do que 2mm da média
d) Estimar os limites de 40 ± h, visando diminuir o percentual
de refugos para 12,6%
---- Dr. Georges Kaskantzis Neto ----
~ 66 ~
INTRODUÇÃO E DISCUSÃO DO EXERCÍCIO
Inicialmente, observa-se que o comportamento da ocorrên-
cia de peças defeituosa segue uma distribuição normal de frequên-
cias, significando que pode-se usar a equações da pontuação-z.
Uma vez escolhida a distribuição a ser empregada para o
cálculo das probabilidades, pode-se iniciar a solução do problema,
adotando a sistemática apresentada, a seguir. Conforme citado
nesta seção, o método escolhido para obter as estimativas foi o mé-
todo tradicional.
Neste método, costuma-se definir o nível de significância, em
seguida, calcula a estatística, e compara-se o resultado como o va-
lores tabelados da distribuição escolhida. Existem diferentes casos a
serem enfrentados, dependo da resposta que se procura.
Para tanto, recomenda-se a elaboração de dois diagramas
os quais facilitam a identificação da solução almejada. Além da e-
laboração dos dois diagramas, podem ser utilizadas os valores tabe-
lados das funções de distribuição, assim como, as equações das dis-
tribuições para obter as probabilidades.
A escolha da função adequada é fundamental, pois existem
quatro formas de expressar as funções de distribuição normal de pro-
babilidades. As equações da distribuição normal podem ser escritas
em função da média ou da variáveis de pontuação-z.
---- Dr. Georges Kaskantzis Neto ----
~ 67 ~
As equação de distribuição que utilizam a média são aque-
las aplicáveis as variáveis contínuas e as variáveis discretas. As equa-
ções de distribuição que adotam o valor da pontuação-z são aque-
las da função acumulada de probabilidade e da função densidade
de probabilidades.
As supracitadas equações da distribuição normal de proba-
bilidades são as seguintes:
As função densidade de probabilidades que adota a média,
a equação (38),
f(x) =1
σ√2πe−
12
(x−μ
σ)
2
(38)
A função da distribuição acumulada de probabilidades que
adota a média e o desvio padrão como parâmetros de referência,
a equação (40),
F(x) =1
σ√2π∫ e−
12
(x−μ
σ)
2dx
x
−∞
(40)
A função densidade de probabilidades que adota a variável
reduzida ou de pontuação-z, a equação (45)
g(z) =1
√2πe−
z2
2 (45)
---- Dr. Georges Kaskantzis Neto ----
~ 68 ~
A equação da distribuição acumulada norma, a qual adota
a variável reduzida para determinar o valor da probabilidade, cuja
expressão está indica na equação (44).
G(z) = 1
√2π∫ e−
z2
2dz
z
−∞
(44)
RESOLUÇÃO DO EXERCÍCIO
1º Passo: Elaboração dos diagramas.
Primeiro deve-se identificar a natureza da variável aleatória
a ser investigada. No presente caso, a medida do diâmetros da tu-
bulação defeituosa é uma contínua, porque existe um número finito,
isto é, que pode ser contado de tubos.
a) Natureza da variáveis: Contínua
Tendo sido identificada a natureza da variável aleatória, em
seguida deve-se definir a função da distribuição densidade de pro-
babilidades que deverá ser utilizada na solução do problema.
Com base na natureza da variável aleatória, decidiu-se usar
a função densidade de probabilidade da variável pontuação-z. A
equação (45)
g(z) =1
√2πe−
z2
2 (45)
---- Dr. Georges Kaskantzis Neto ----
~ 69 ~
2º Passo: Elaboração dos diagramas da função de distribuição escolhida
A primeira tarefa do segundo passo da sistemática adotada é a
elaboração dos gráficos que encontram-se indicado na FIGURA 24. Neste
diagrama, pode-se observar os aspectos, seguintes:
FIGURA 24. MOSAICO DOS GRÁFICOS DAS DISTRIBUIÇÕES DOS VALORES DO
DIÂMETRO DAS PEÇAS DEFEITUOSAS E DA ESTATÍSTICA PONTUAÇÃO Z
Probabili-
dade
---- Dr. Georges Kaskantzis Neto ----
~ 70 ~
O valor da estatística pontuação-z que encontra indicado
no segundo gráfico da FIGURA 7 foi calculado com a equação 41.
z =x − μ
σ=
37 − 40
2= −1,5
O valor calculado de z foi – 1,5. Na FIGURA 8, pode-se obser-
var a localização do valor da estatística em relação ao valor da mé-
dia dos diâmetros das tubulações que são fabricas na indústria.
Antes de seguir para o próximo passo da sistema empregada
neste trabalho, apresentam-se as considerações a respeito do gráfi-
cos apresentados nas figuras.
CONSIDERAÇÕES A RESPEITO DOS DIAGRAMAS
A média dos valores dos diâmetros das peças com defeito se
encontra posicionado no centro da distribuição (µ = 40 mm);
O valor do diâmetro que se deseja avaliar é 37mm, estando
localizado no lado esquerdo da figura;
Os valores dos diâmetros, para os quais se quer calcular a pro-
babilidade são iguais ou menores do que 37mm;
A área destacada com a cor azul e delimitada pela curva de
distribuição é o local onde se encontram os valores dos diâ-
metros menores do que 37mm, portanto a área que inclui estes
pontos é equivalente a chance de o diâmetro das peças (tu-
bos) fabricadas serem menores do que 37mm;
---- Dr. Georges Kaskantzis Neto ----
~ 71 ~
A área complementar, desde o ponto da coordenada x = 37,
até o centro da curva, onde o valor de x é 40 é igual a metade
da probabilidade total menos aquela da área de cor azul,
Isso significa que a diferença das áreas corresponde ao valor
da probabilidade dos tubos fabricados na indústria não apre-
sentarem defeito, isto é, valor do diâmetro menor que 37mm;
A área delimita pela curva da distribuição representa a soma
de todas as peças defeituosas;
3º Passo. Cálculo da probabilidade
No terceiro passo da sistema, determina-se o valor da proba-
bilidade relativo ao item (a) do exercício proposto.
Partindo da definição de probabilidade, têm-se:
P (X < 37,0mm) =?
z =x − μ
σ=
37 − 40
2= −1,5
Para z = -1,5 --- área delimitada pela curva = 0,4332
P (X < 37,0mm) = P (z < 1,5) = 0,5000 – 0,4332 = 0,0668
P = 0,0668 = 6,68%
Assim, pode-se verificar que a probabilidade da peças fabrica-
das apresentarem o diâmetro menor do que 37mm é da ordem de
6,68%. Os demais itens do exercício podem ser resolvidos adotando
a mesma sistemática descrita. Respostas: b) 2,28%; c) 31,74%
---- Dr. Georges Kaskantzis Neto ----
~ 72 ~
5.4. DISTRIBUIÇÕES DE PROBABILIDADES DAS AMOSTRAS
Com base no conhecimento adquirido dos conteúdos apre-
sentados nas seções anteriores, nesta etapa do estudo apresentam-
se os resultados do ajuste e da análise das distribuições de frequên-
cias dos dados que constituem as suas amostras investigadas no en-
corbamento acontecido na Baía da Babitonga, em Santa Catarina.
Na etapa de determinação das estatísticas básicas descritas
das amostras do acidente, isto é, a mistura dos óleos derivados dos
petróleos e o conjuntos dos resultados dos testes de laboratórios das
amostras do componentes ambientais afetados no acidente naval,
elaboraram-se os histogramas das ocorrências dos grupos dos com-
postos químicos que formaram a mistura oleosa e das classes definas
com base na natureza dos componentes ambientais da 2ª amostra.
Os resultados da etapa preliminar de avaliação do compor-
tamentos das frequências de ocorrências dos valores de concentra-
ção indicaram que as amostras não atendiam a função distribuição
normal de frequências ou probabilidades, tendo sido aplicada aos
elementos das amostras a função logaritmo natural visando a corre-
ção do comportamento não ideal.
Nesta etapa do estudo, as distribuições de frequências foram
determinado incluindo os efeitos das variáveis que exercem influên-
cia nos resultados, como, por exemplo, as frequências.
---- Dr. Georges Kaskantzis Neto ----
~ 73 ~
Visando aumentar a qualidade do ajustamento das amostras
as curvas de distribuição de frequências, incialmente, identificaram-
se os dados das amostras cujos valores das concentrações são anô-
malos em relação aos demais dados amostrais. No âmbito da esta-
tística estes valores denominam-se como “outlier”.
Além da identificação e exclusão dos “outlier” encontrados
nas amostras, realizou-se a análise da variabilidade dos valores das
concentração dos elementos das amostras empregando a Técnica
da Variabilidade Gráfica Calibrada – R&R (reprodutibilidade e repe-
titividade).
Em razão da análise o número de registros das amostras dimi-
nuiu, mas, a quantidade de dados utilizados, posteriormente foi sufi-
ciente para assegurar o nível de significância adotado no estudo.
Visando a determinação da distribuição de frequências mais
adequada ao perfil de concentração da mistura de óleos derrama-
dos no dia dos fatos, os trinta e novo compostos químicos presentes
da composição da mistura oleosa foram agrupados em quatro gru-
pos: BTEX; HEP; HPA; METAIS.
Na FIGURA 25 pode-se observar a distribuição de frequências
dos quatro grupos de compostos químicos que constituem a mistura.
---- Dr. Georges Kaskantzis Neto ----
~ 74 ~
FIGURA 25. DISTRIBUIÇÃO DAS CLASSES DOS COMPOSTOS QUÍMICOS
QUE FORMARAM A MISTURA OLEOSA EM VIRTUDE DO ACIDENTE NAVAL.
O histograma da frequência de ocorrências dos grupos dos
compostos químicos que formaram a mistura dos óleos indica que o
grupo HAP é aquela que apresenta a maior frequência, significando
que ele o grupo que tem o maior número de compostos, denomina-
dos Hidrocarbonetos poliaromáticos, em relação aos outros grupos.
O BTEX inclui cinco compostos, o HEP apresenta dez compos-
tos e os METAIS incluem oito representantes. É importante citar a exis-
tência de um erro sistemático nesta abordagem, uma vez que, cer-
tos compostos dos grupos estão repetidos, isto é, se encontram pre-
sentes em mais de um grupo de compostos químicos. Assim, as pro-
babilidades associadas a esta distribuição não podem ser conside-
---- Dr. Georges Kaskantzis Neto ----
~ 75 ~
ras como adequadas, devendo utilizadas somente a título de exem-
plo. Quanto a variabilidade das concentrações dos compostos, no-
tadamente aqueles misturados em cada grupo, apresenta-se na FI-
GURA 26 as parcelas dos valores das concentrações dos grupos.
FIGURA26. VARIABILIDADE DA CONCENTRAÇÃO DOS GRUPOS DE COM-
POSTOS QUÍMICOS DA MISTURA OLEOSA DERRAMA NO ACIDENTE.
Os dados da FIGURA 9 indicam que a parcela de contribui-
ção do grupo dos compostos HPA na concentração total da mistura
é a maior de todas, confirmando, deste modo, o resultado anterior,
isto é, a maior número de compostos do grupo HPA na mistura.
Os dados indicam que a concentração média da mistura o-
leosa era da ordem de 1,35 x 10-3 mg g-1. Os dados também indicam
que variabilidade do desvio-padrão é pequena.
---- Dr. Georges Kaskantzis Neto ----
~ 76 ~
Após ter sido analisados os valores das concentrações dos
componentes de cada grupo, realizou-se a concatenação dos gru-
pos, tendo sido obtido o resultado seguinte
FIGURA 27. CONTRIBUIÇÕES DOS GRUPOS COMBINADOS DOS COMPOSTOS
DA MISTURA OLEOSA DERRAMADA NO ACIDENTE NAVAL
O resultado apresentado na FIGURA 27 indicam que o efeito
cruzado dos grupos de compostos não exerce grande influência nos
resultados, pois a ordem, isto é, a contribuição das concentrações
dos grupos concatenados manteve-se semelhante a anterior, tendo
sido obtidos o resultado esperado.
---- Dr. Georges Kaskantzis Neto ----
~ 77 ~
Conforme sabido, os componentes ambientais atingidos pe-
los óleos derramados no acidente foram agrupados em classes. As
classes de componentes definidas foram: mangue, marisma, ictio-
fauna; crustáceos; ostras, mexilhões e mariscos; algas; vísceras.
Na FIGURA 28, apresenta-se o histograma das frequências de
ocorrência dos componentes atingidos pelo acidente naval. A dis-
tribuição de frequências das classes de componentes ambientais se
encontra ilustrada na FIGURA 29.
FIGURA 28. HISTOGRAMA DA DISTRIBUIÇÃO DE FREQUÊNCIAS DOS COMPO-
NENTES AMBIENTAIS ALTERADOS PELA MISTURA DE ÓLEOS FORMADA
---- Dr. Georges Kaskantzis Neto ----
~ 78 ~
FIGURA 29. DISTRIBUIÇÃO DAS CLASSES E COMPONENTES AMBIENTAIS.
Observando os histogramas apresentados nas citadas figuras
se pode verificar que as marismas e a ictiofauna são os componen-
tes ambientais que apresentam o maior valor de frequências, prova-
velmente devido a readequação dos valores das concentrações,
isto é a desconsiderações dos pontos considerados como anômalos.
Nas FIGURAS 30 – 31, apresentam-se os gráficos das variabili-
dades da primeira amostra investigada, isto é, os componentes am-
bientais individuais e categorizados.
Inspecionando a variabilidade da contaminação dos com-
ponentes ambientais constata-se que a classe ictiofauna era aquela
que apresentava a maior variação das concentrações e as classes
marisma, ostras, mariscos e mexilhões apresentavam a menor em re-
lação a primeira.
---- Dr. Georges Kaskantzis Neto ----
~ 79 ~
FIGURA 30. VARIABILIDADE DAS CONCENTRAÇÕES DAS CLASSES DE COM-
PONENTES AMBIENTAIS ATINGIDOS NO ACIDENTE NAVAL.
FIGURA 31. VARIABILIDADE DOS VALORES DAS CONCENTRAÇÕES OBSERVA-
DAS NOS TESTES DE LABORATÓRIO NAS AMOSTRAS DOS COMPONENTES AM-
BIENTAIS COLETADAS NA ÉPOCA DOS FATOS.
---- Dr. Georges Kaskantzis Neto ----
~ 80 ~
A grande variabilidade registrada nas amostras coletadas na
época dos fatos dificulta a determinação da distribuição de proba-
bilidades adequada aos valores das concentrações da amostra.
Para verificar essa hipótese devem ser realizados os testes da
hipótese empregado diferentes métodos. Com este fim, a seguir, a-
presentam-se a teoria dos principais Testes de Hipóteses.
6. TESTES DE HIPÓTESES
6.1. HIPÓTESES ESTATÍSTICAS
Basicamente, as hipóteses são suposições que se faz, acerca
dos parâmetros estatísticos de uma população, visando a tomada
de decisão. Tais suposições são verificadas ou não, dependendo do
resultado do teste estatístico realizado, como, por exemplo, aqueles
de comparação dos valores absolutos ou das diferenças dos valores
das médias, das medianas ou das variâncias de duas ou mais popu-
lações.
6.2. HIPÓTESE NULA E ALTERNATIVA
A hipótese nula (Ho) é qualquer hipótese a ser investigada.
A hipótese alternativa (H1), por sua vez, é qualquer hipótese dife-
rente da hipótese nula.
---- Dr. Georges Kaskantzis Neto ----
~ 81 ~
O teste da hipótese coloca a hipótese nula em contraposi-
ção a hipótese alternativa, podendo ser enunciado, para um deter-
minado parâmetro estatístico () como:
a) Ho: = o em contraposição com H1: < o
b) Ho: = o em contraposição com H1: > o
c) Ho: = o em contraposição com H1: ≠ o
6.3. REGIÕES DE REJEIÇÃO DE HIPÓTESES
A região de verificação ou de aceite (R.A) é a região na qual
se verifica a hipótese nula. A região de rejeição ou crítica é a região,
na qual rejeita-se a hipótese nula, sendo complementar a primeira.
Em geral, a região de verificação ou rejeição da hipótese é aquele
região associada a área delimitada pela função de distribuição de
probabilidade adequada ao dados.
6.4. ERROS DO TIPO I E DO TIPO II
Na execução de um teste estatístico podem acontecer dois
erros: - o erro do tipo I; - o erro do tipo II. O erro tipo I é aquele come-
tido quando rejeita-se a hipótese nula, sendo ela verdadeira. O erro
tipo II é aquele cometido quando se aceita a hipótese nula, sendo
ela falsa.
---- Dr. Georges Kaskantzis Neto ----
~ 82 ~
6.5. NÍVEL DE SIGNIFICÂNCIA
O nível de significância estatística é igual a máxima probabi-
lidade, com qual se estaria disposto a correr o risco de acontecer o
erro tipo I. A representação formal dessa probabilidade é a seguinte
α = P(rejeitar H0 H0 verdadeira⁄ ) (46)
Na prática, os valores do nível de significância adotados são
0,05 (5%) e 0,01(1%).
A probabilidade de se cometer o erro tipo II é definida como
β = P(aceitar H0 Ho falsa⁄ ) (47)
6.6. TESTES UNILATERAL E BILATERAL
O teste unilateral é aquele no qual a região de rejeição, R.R.,
se encontra localizada em um dos extremos do intervalo de varia-
ção da variável de interesse. O teste bilateral, por sua vez, é aquele
no qual a R.R., encontra-se localizada em ambos os extremos do in-
tervalo de variação da variável.
6.7. CURVA CARACTERÍSTICA DE OPERAÇÃO (C.C.O.)
A curva característica de operação (C.C.O.) é a representa-
ção gráfica da função de probabilidade β. Na construção da curva,
os valores dos parâmetros a serem testados são colocados no eixo
---- Dr. Georges Kaskantzis Neto ----
~ 83 ~
das abscissas (eixo x), e no eixo das ordenadas se encontram os va-
lores da probabilidade de aceitar a hipótese nula, quando ela for
falsa. Para cada teste estatístico de hipótese realizado existe uma
C.C.O., que assume as condições necessárias e fundamentais de o-
peração do teste. Embora, a curva não seja obrigatória, a sua cons-
trução é útil para a compreensão do teste a ser executado.
6.8. SISTEMÁTICA DE EXECUÇÃO DO TESTE DE HIPÓTESE
A sistemática recomendada para a realização do teste de
hipótese contempla as etapas, a saber:
1. Enunciar a hipótese nula, Ho;
2. Enunciar a hipótese alternativa, H1;
3. Definir o nível de significância, alfa;
4. Definir a função de distribuição de probabilidades;
5. Extrair a amostra aleatória e calcular a estatística;
6. Conclusão.
Com base no valor da estatística calculada, rejeitar a hipó-
tese nula, Ho, se o valor calculado estiver situado na R.R., ou aceitar
a Ho, caso o valor da estatística calculado estiver localizado na R.A.
6.9. TESTE PARA A MÉDIA POPULACIONAL
Ho: µ = µo
H1: três possibilidades
---- Dr. Georges Kaskantzis Neto ----
~ 84 ~
a) µ < µo
b) µ > µo
c) µ ≠ µo
Definir o nível de significância (α)
Determinar a região de rejeição da hipótese (R.R.)
Se o desvio padrão for conhecido adota-se a pontua-
ção z, se o desvio padrão for desconhecido, adota-se a
estatística definida pela distribuição de t-Student.
Regiões de rejeição do primeiro e segundo caso
(a)
(b)
R.R. –zα
ou -tα
R.R. zα
ou tα
R.A
R.A
---- Dr. Georges Kaskantzis Neto ----
~ 85 ~
FIGURA 32. Regiões de rejeição da hipótese nula do primeiro e segundo
caso em função da hipótese alternativa escolhida. Os gráficos estão
associados as hipóteses alternativas a, b e c.
Calcular a estatística do teste
o 1º caso
z =x̅ − μo
σ
√n
(48)
o 2º caso
t =�̅� − 𝜇𝑜
𝑠
√𝑛
(49)
Conclusão
a) Se z < − zα ou t < −tα, rejeitar Ho
b) Se z > zα ou t > tα, rejeitar Ho
c) Se |z| > zα/2 ou |t| > tα/2, rejeitar Ho
Exemplo
Uma população apresenta um desvio padrão igual a 5mm.
Se uma amostra de 50 elementos obtida dessa população tem mé-
dia igual a 46mm, testar a hipótese de que essa população tem mé-
dia maior do que 43mm, ao nível de significância de 1%.
(c)
R.R. –zα/2
ou -tα/2
R.R. zα/2
ou tα/2
R.A
---- Dr. Georges Kaskantzis Neto ----
~ 86 ~
Solução
(1) Ho: µ=43 mm
(2) H1: µ>43 mm
(3) Alfa = 0,01
(4) Região de rejeição
Para obter o valor da estatística zα ou zcrítico, primeiro deter-
mina-se a área correspondente a diferença da área total sob a
curva, cujo valor é 1,0 e a aquela correspondente ao nível de signi-
ficância adotado, ou seja, α=0,01
𝐴𝑡𝑜𝑡𝑎𝑙 − 𝐴𝛼=0,01 = 1,0 − 0,01 = 0,990 → 𝑍𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 2,33
Com o resultado obtido, consultam-se as TABELAS 13 e 14,
para obter o valor da estatística desejada, a qual no presente caso
é igual a 2,33. Na FIGURA 19, apresenta-se a região de rejeição.
(5) Cálculo da estatística
𝑧 =46 − 43
5
√50
= 4,24
R.R. α=0,01 R.A.
---- Dr. Georges Kaskantzis Neto ----
~ 87 ~
FIGURA 33. DETALHE DA REGIÃO DE REJEIÇÃO DA HIPÓTESE NULA
(6) Conclusão
Como z (calculado) > z (alfa) = 2,33, rejeita-se a hipótese nula, ou
seja, o resultado amostral é suficiente para afirmar que a média é superior
a 43mm, no nível de significância adotado (α=0,01). Na FIGURA 34, pode-
se observar a curva de distribuição normal do presente caso e a pro-
babilidade de verificação da hipótese alternativa, cujo valor é da
ordem de 72,57%
FIGURA 34. DISTRIBUIÇÃO NORMAL DE PROBABILIDADE DO EXEMPLO APRESENTADO
R.R. α=0,01
zα = 2,33
R.A
---- Dr. Georges Kaskantzis Neto ----
~ 88 ~
CÁLCULO DO ERRO TIPO II
Neste item, apresenta-se o cálculo do erro tipo II do presente
caso para as seguintes hipóteses alternativas:
H1: µ=40mm;
H1: µ=47mm.
Conforme citado, o erro tipo II é aquele cometido ao aceitar
a hipótese nula, sendo ela falsa. A probabilidade máxima de correr
o risco de se cometer o erro do tipo II é definida como:
β = P(aceitar H0 Ho falsa⁄ )
Para a primeira hipótese alternativa, tem-se: H1: 40mm e zα =
2,33, então, pode-se escrever
2,33 =�̅� − 43
5
√50
Isolando x, obtém-se
�̅� = 44,6𝑚𝑚
Logo, a hipótese nula é aceita quando, x̅ ≤ 44,6mm, então, a
probabilidade do erro tipo II pode ser escrita como:
β = P(aceitar H0 Ho falsa⁄ ) = P(x̅ ≤ 44,6mm | μ = 40mm)
z =44,6 − 40
5
√50
= 6,51 → β = P(z ≤ 6,52) = 1
Para a segunda hipótese alternativa, tem-se:
---- Dr. Georges Kaskantzis Neto ----
~ 89 ~
β = P(aceitar H0 Ho falsa⁄ ) = P(x̅ ≤ 44,6mm | μ = 47mm)
z =44,6 − 47
5
√50
= −3,39 → β = P(z ≤ 3,39) = 0,0003
Assim, o risco de se cometer o erro tipo II quando se a hipó-
tese nula em contraposição com a hipótese alternativa cujo valor é
40mm é igual a 100%, e a probabilidade de se cometer o erro tipo II
ao aceitar a hipótese nula em contraposição a hipótese alternativa,
cujo valor e 47mm é igual a 0,03%.
6.10 TESTE PARA A DIFERENÇA DE MÉDIAS POPULACIONAIS
1º Caso. Se os desvios padrões forem conhecidos
1) Ho: µ1 - µ2 = do
2) H1: três possibilidades
a. µ1-µ2<do;
b. µ1-µ2>do;
c. µ1-µ2≠do.
3) Fixar o nível de significância α
4) Determinar a região de rejeição (R.R.), conforme a FIGURA 18
5) Calcular a estatística do teste, definida como
---- Dr. Georges Kaskantzis Neto ----
~ 90 ~
z =(x̅1 − x̅2) − do
√σ1
2
n1+
σ22
n2
(50)
6) Conclusões
a) Se z < − zα, rejeitar Ho
b) Se z > zα, rejeitar Ho
c) Se |z| > zα/2, rejeitar Ho
Exemplo
Uma amostra de 100 válvulas da companhia A tem duração
média de 1530 horas, sendo o desvio padrão dessa amostra igual a
100h. Uma outra amostra de 70 válvulas da companhia B tem dura-
ção de 1420 horam, com desvio padrão de 80h. Testar a hipótese
de que as válvulas da companhia A em reação a B tem duração
média superior a 100H, com nível de significância de 1%.
Solução
1) Ho: µ1 - µ2 = 100 horas
2) H1: µ1- µ2 > 100 horas
3) Alfa =0,01
4) Região de rejeição
Para alfa = 0,01 e H1, tem-se
Área sob a curva cujo z crítico se deseja determinar é igual
(ATotal – 0,01) (área correspondente a R.R.) = 0,99. Consultando a Ta-
bela 13, obtém-se: zα = 2,33.
---- Dr. Georges Kaskantzis Neto ----
~ 91 ~
5) Cálculo da estatística
z =(1530 − 1420) − 100
√1002
100+
802
70
= 0,72
6) Conclusão
Como z < zα = 2,33, aceita-se Ho, ou seja, a diferença do
tempo de duração das válvulas das companhias A e B não é
maior do que 100h, para o nível de significância usado no teste.
2º Caso. Se os desvios padrões forem desconhecidos
1) Ho: µ1 - µ2 = do
2) H1: três possibilidades
a. µ1 - µ2 < do;
b. µ1 - µ2 > do;
c. µ1 - µ2 ≠ do.
3) Fixar o nível de significância α
4) Determinar a região de rejeição (R.R.), conforme a FIGURA 18
5) Calcular a estatística do teste, definida como
R.R. α=0,01
R.A.
---- Dr. Georges Kaskantzis Neto ----
~ 92 ~
t =(x̅1 − x̅2) − do
√𝑠𝑝2 (
1𝑛1
+1𝑛2
) (51)
Onde: sp2 – é a variância definida como:
sp2 =
(n1 − 1)s12 + (n2 − 1)s2
2
n1 + n2 − 2 (52)
s12 =
∑(xi − x̅1)2
n1 − 1 (53)
6) Conclusões
a) Se t < − tα, rejeitar Ho
b) Se t > tα, rejeitar Ho
c) Se |t| > tα/2, rejeitar Ho
Exemplo
O pH de duas soluções de contaminantes foi medido, tendo
sido obtidos os valores, a saber:
TABELA 14. MEDIDAS EXPERIMENTAIS DO pH das soluções
Valor pH P1 P2 P3 P4 P5 P6
Solução A 7,50 7,54 7,51 7,53 7,50 ---
Solução B 7,49 7,50 7,51 7,52 7,50 7,51
Testar a hipótese de que não existe diferença entre os valores
do pH medidos das duas soluções, adotando que os desvios pa-
drões populacionais são iguais, ao nível de 5% de significância.
Solução do exercício
---- Dr. Georges Kaskantzis Neto ----
~ 93 ~
1) Ho: µA = µB ou µA - µB = 0
2) H1: µA ≠ µB ou µA - µB ≠ 0
3) Alfa = 0,05
4) Determinação da região de rejeição de Ho
Para alfa = 0,025, = n1 + n2 – 2 graus de liberdade, isto é, =
5 + 6 – 2 = 9 graus de liberdade, obtém-se tα = 2,26.
5) Cálculo da estatística
x̅A =37,58
5= 7,516 x̅B =
45,03
6= 7,505
sA2 =
0,00132
5 − 1= 0,0003 𝑠𝐵
2 =0,00055
6 − 1= 0,0001
sp2 =
(5 − 1)0,0003 + (6 − 1)0,0001
5 + 6 − 2= 0,0002
t =(7,516 − 7,505) − 0
√0,0002 (15 +
16)
= 1,28
6) Conclusão
R.R. α/2 = 0,025 R.R. α/2 = 0,025
R.A.
---- Dr. Georges Kaskantzis Neto ----
~ 94 ~
Como |t| < tα/2 = 2,26, aceita-se a hipótese nula – Ho, ou seja,
não existe diferença significativa, ao nível de 5% de significância, en-
tre os valores do pH das solução de contaminantes analisadas.
3º Caso. Os desvios padrões populacionais são desconhecidos e
supostamente diferentes.
1) Ho: µ1 - µ2 = do
2) H1: três possibilidades
a. µ1 - µ2 < do;
b. µ1 - µ2 > do;
c. µ1 - µ2 ≠ do.
3) Fixar o nível de significância α
4) Determinar a região de rejeição (R.R.), conforme a FIGURA 18
5) Calcular a estatística do teste, definida como
t =(x̅1 − x̅2) − do
√s1
2
n1+
s22
n2
(54)
6) Conclusão
a) Se t < − tα, rejeitar Ho
b) Se t > tα, rejeitar Ho
c) Se |t| > tα/2, rejeitar Ho
4º Caso. Se os dados são emparelhados
---- Dr. Georges Kaskantzis Neto ----
~ 95 ~
Este teste deverá ser empregado quando os dados estão re-
lacionados, dois a dois, de acordo com algum critério definido.
1) Ho: µ1 - µ2 = do
2) H1: três possibilidades
a) µ1 - µ2 < do;
b) µ1 - µ2 > do;
c) µ1 - µ2 ≠ do.
3) Fixar o nível de significância alfa
4) Determinar a região de rejeição, com = n -1
5) Calcular a estatística
t =d̅ − do
s
√n
(55)
𝑠 = √∑(𝑑𝑖 − 𝑑̅)
2
𝑛 − 1 (56)
d̅ =∑ di
n (57)
di = x1,i − x2,i (58)
6) Conclusões
a) Se t < − tα, rejeitar Ho
b) Se t > tα, rejeitar Ho
c) Se |t| > tα/2, rejeitar Ho
Exemplo
---- Dr. Georges Kaskantzis Neto ----
~ 96 ~
Dois técnicos do órgão de controle e fiscalização ambiental
determinaram os pesos de contaminantes encontradas em amos-
tras de frutas estocadas em 6 containers, tendo obtido os dados in-
dicados na TABELA 15
TABELA 15. RESULTADO DA PESAGEM DE CONTAMINANTES IDENTIFICADOS
NAS FRUTAS IMPORTADAS PELOS AGENTES DE FISCALIZAÇÃO DO IBAMA.
Amostra (g) P1 P2 P3 P4 P5 P6
Técnico A 10,1 10,4 10,2 10,5 9,9 10,0
Técnico B 9,8 10,0 10,1 10,0 10,1 9,5
Determinar se existe diferença entre as pesagens realizadas
pelos técnicos, ao nível de significância de 1%. As diferenças entre
as pesagens encontram-se indicadas na TABELA 16.
TABELA 16. DIFERENÇAS DAS PESAGENS EXECUTADAS POR TÉCNICOS
Amostra (g) D1 D2 D3 D4 D5 D6
Diferença (g) 0,3 0,4 0,1 0,5 - 0,2 0,5
d̅ =1,6
6= 0,270 g
s = √0,3734
6 − 1= 0,273 g
1) Ho: µA - µB = 0 ou µA = µB
2) H1: µ1 - µ2 ≠ 0 ou µA ≠ µB
3) Alfa = 0,01
4) Determinação da R.R.
---- Dr. Georges Kaskantzis Neto ----
~ 97 ~
Para α/2 = 0,005 e =n-1= 5; consultando a TABELA da distri-
buição t-Student, obtém-se tα/2 = 4,03.
5) Cálculo da estatística do teste
t =0,27̅̅ ̅̅ ̅̅ − 0
0,273
√6
= 2,42
6) Conclusão
Como |t|< tα/2 = 4,03, aceita-se a hipótese nula, isto é, não
existe diferença entre as pesagens de contaminantes realizadas pe-
los técnicos do IBAMA.
6.11. TESTES PARA A VARIÂNCIA POPULACIONAL
Conforme sabido, o teste para a variância populacional é
uma generalização do teste das média, no qual se empregam os
valores das variância para a tomada de decisão.
R.R. α/2 = 0,005 R.R. α/2 = 0,005 R.A.
---- Dr. Georges Kaskantzis Neto ----
~ 98 ~
Nos testes de hipóteses cujas estatísticas adotadas são as va-
riâncias, em geral, adotam-se as distribuições de probabilidades de
Qui-quadrado e de Snedecor (distribuição F).
1. TESTE PARA A VARIÂNCIA POPULACIONAL
O roteiro empregado neste teste de hipótese é igual aquele
descrito para a média populacional.
(1) Ho: 2 = o2
(2) H1: três casos possíveis
a. 2 = o2
b. 2 > o2
c. 2 < o2
(3) Fixar o nível de significância (alfa)
(4) Determinar a região de rejeição
(a)
---- Dr. Georges Kaskantzis Neto ----
~ 99 ~
(5) Calcular a estatística do teste
χ2 =(n − 1)s2
σo2
(59)
(6) Conclusões
a) Se 𝜒2 < − χ1−𝛼2 , rejeitar Ho
a) Se 𝜒2 > 𝜒𝛼2 , rejeitar Ho
b) Se 𝜒2 < 𝜒1−𝛼/22 , ou 𝜒2 > 𝜒𝛼/2
2 , rejeitar Ho
(b)
(c)
---- Dr. Georges Kaskantzis Neto ----
~ 100 ~
6.12. TESTE PARA A IGUALDADE DE DUAS VARIÂNCIAS
(1) Ho: 12 = 2
2
(2) H1: três casos possíveis
a. 12 = 2
2
b. 12 > 2
2
c. 12 ≠ 2
2
(3) Fixar o nível de significância (alfa)
(4) Obter a região de rejeição para =n-1 graus de liberdade
---- Dr. Georges Kaskantzis Neto ----
~ 101 ~
(5) Calcular a estatística do teste
F =s1
2
s22 (60)
(6) Conclusões
a) Se F < F1−𝛼, rejeitar Ho
b) Se F > Fα, rejeitar Ho
c) Se F < F1−α/2, ou F > Fα/2, rejeitar Ho
6.13. TESTE PARA IGUALDADE DE K (k>2) VARIÂNCIAS
Quando se deseja analisar a variâncias de mais de duas a-
mostras, pode-se empregar o teste a ser descrito. Se as amostras a-
presentam tamanhos diferentes, adota-se o teste de Bartlett.
(1) Ho: 𝜎12 = 𝜎2
2 = ⋯ = 𝜎𝑘2
(2) H1: no mínimo uma das variâncias é diferentes das demais
(3) Fixar o nível de significância (alfa)
(4) Determinar R.R
---- Dr. Georges Kaskantzis Neto ----
~ 102 ~
A estatística adequada segue uma distribuição do tipo Qui-
quadrado com v=k-1 graus de liberdade.
(5) Calcular a estatística do teste
χν2 =
2,3026
C∙ [(n − k) × log
∑ νisi2k
i=1
n − k− ∑ νi logsi
k
k
i=1
] (61)
Onde: n = ∑ niki=1 , νi = ni − 1, ν = k − 1, C = 1 +
1
3(k−1)(∑
1
νi
ki=1 −
1
n−k)
(6) Conclusões
Se χν2 > χα
2 , rejeitar Ho
Para amostras de mesmo tamanho n, a hipótese de igual-
dade das variâncias pode ser investigada utilizando o teste de Co-
chran, cuja estatística é definida como
g =max si
2
∑ si2 (62)
---- Dr. Georges Kaskantzis Neto ----
~ 103 ~
6.14. TESTE PARA A PROPORÇÃO POPULACIONAL
O teste da proporção populacional p é um teste de grande
interesse e aplicabilidade na investigação de eventos naturais ou in-
tencionais associados as questões do meio ambiente.
Em geral, o comportamento de compostos químicos envolvi-
dos em questões ambientais, como, por exemplo, o nível de conta-
minação, modifica no espaço e com o tempo, aumentando a com-
plexidade da representação dos fenômenos dessa natureza.
Neste sentido, a utilização das proporções ou razões das va-
riáveis estatísticas é útil para o entendimento de fenômenos a serem
analisados. Conforme citado, os valores da concentração se man-
tém, praticamente proporcionais, à medida que a diluição da con-
taminação acontece, podendo ser comparados aos teores iniciais.
O teste da proporção populacional é realizado executando
os seguintes procedimentos:
(1) Ho: p = po
(2) H1: pode ser de três tipos
a) p < po;
b) p > po;
c) p ≠ po.
(3) Fixar o nível de significância alfa
(4) Determinar R.R.
---- Dr. Georges Kaskantzis Neto ----
~ 104 ~
(5) Calcular a estatística do teste
z =P − po
√po(1 − po)n
(63)
(6) Conclusões
a. Se z < - zα rejeitar Ho
b. Se z > zα rejeitar Ho
c. Se |z| > zα/2 rejeitar Ho
EXEMPLO
Visando a determinação da eficiência de um novo produto
comercial desenvolvido para minimizar a corrosão foram ensaiados
90 peças, sendo que 45 do total de 50 peças apresentaram um bom
resultado. O produto é considerado eficiente se pelo menos 95% das
peças ensaiadas apresentarem resultado satisfatório. Qual a conclu-
são, ao nível de significância de 5%.
SOLUÇÃO
(1) Ho: p = 0,95 (eficiente)
(2) H1: p < 0,95 (ineficiente)
(3) Alfa = 0,05
(4) Determinação da região crítica ou de rejeição
Para alfa = 0,05, adotando a distribuição Z, obtém-se o –
zα/2, cujo valor tabelado é -1,64
---- Dr. Georges Kaskantzis Neto ----
~ 105 ~
(5) Cálculo da estatística do teste
P =45
50= 0,9
𝑧 =0,90 − 0,95
√0,95(1 − 0,95)50
= −1,62
(6) Conclusão
Como z > - zα = -1,64, aceita-se Ho, ou seja, o produto anti-
corrosivo é eficiente no nível de significância de 5%.
6.15. TESTE PARA A DIFERENÇA ENTRE DUAS PROPORÇÕES
(1) Ho: p1 – p2 = do
(2) H1: pode ser de três tipos
a) p1 - p2 < do
b) p1 – p2 > do
---- Dr. Georges Kaskantzis Neto ----
~ 106 ~
c) p1 – p2 ≠ do
(3) Fixar o nível de significância alfa
(4) Determinar R.R.
(5) Calcular a estatística do teste
Para do = 0
z =(P1 − P2)
√p̂(1 − p̂) (1n1
+1
n2)
(64)
Para do ≠ 0
z =(P1 − P2) − do
√p̂1(1 − p̂1)
n1+ (
p̂2(1 − p̂2)n2
)
(65)
p̂1 = P1 ∙ p̂2 = P2 (66)
p̂ =n1P1 + n2P2
n1 + n2 (67)
(6) Conclusões
a) Se z < -zα, rejeitar Ho;
b) Se z > zα, rejeitar Ho;
c) Se |z| > zα/2, rejeitar Ho.
EXEMPLO
Uma indústria de automóveis anunciou que os veículos do
modelo A superaram em venda os do modelo B. Obtidas duas a-
---- Dr. Georges Kaskantzis Neto ----
~ 107 ~
mostras aleatórias independentes, encontrou-se que 56 de 200 con-
sumidores preferem o modelo A e 29 de 150 preferem o modelo B.
Testar a hipótese ao nível de significância de 6% de que o modelo A
supera o modelo B em 10% contra a alternativa de que esta dife-
rença é menor que 10%.
(1) Ho: pA - pB = 0,10
(2) H1: pA - pB < 0,10
(3) Alfa = 0,06
(4) Determinar R.R.
Para alfa = 0,06, consultando a distribuição z, obtém-se o va-
lor de -zα = -1,55
(5) Cálculo da estatística do teste
p̂A = PA =56
200= 0,280
p̂B = PB =29
150= 0,193
---- Dr. Georges Kaskantzis Neto ----
~ 108 ~
z =(0,280 − 0,193) − 0,10
√0,28 × 0,72200 +
0,807 × 0,193150
= −0,29
(6) Conclusão
Como –z > -zα = -1,55, aceita-se a Ho, ou seja, o modelo A
supera em vendas o modelo B em pelo menos 10%.
7. ANÁLISE DA VARIÂNCIA
A técnica da análise da variância, também chamada como
ANOVA, como sabido, consiste de uma generalização do teste para
a igualdade de duas médias populacionais. Enquanto no teste da
igualdade de duas médias adotam-se as estatísticas z ou t, con-
forme os desvios padrão são conhecidos ou não, na análise da va-
riância, investigam-se k (k>2) médias populacionais com base na es-
tatística F, significando que a ANOVA é um teste para igualdade das
médias que utiliza as variâncias.
7.1. VARIÂNCIA TOTAL
Consiste em estimar a variância 2, considerando todas as
amostras reunidas em uma única amostra. Essa suposição é factível
em razão da hipótese inicial adota, isto é, de que todas as variân-
cias populacionais são iguais a 2.
Assim, a variância total é definida como:
---- Dr. Georges Kaskantzis Neto ----
~ 109 ~
st2 =
∑ ∑ (xi,j − X̅)2n
i=1kj=1
N − 1 (68)
7.2. VARIÂNCIA ENTRE AMOSTRAS
Sendo verdadeira a hipótese Ho, pode-se estimar a variância
2, através das médias das k amostras, ou seja, como se fosse uma
única amostra de k valores, definida como:
σX2 =
σ2
n (69)
Associando a estatística 𝑠�̅�2 a estimativa de, então, a estima-
tiva se2 de 2 será
se2 = n ∙ sX̅
2 =∑ ∑ (x̅j − X̅)
2ni=1
kj=1
k − 1 (70)
O denominador da equação denomina-se “soma de qua-
drados entre amostras” (SQE).
7.3. VARIÂNCIA RESIDUAL
Consiste em estimar a variância dentro de cada amostra, e,
posteriormente, estimar o valor único para 2, através da combina-
ção da k variâncias.
Para uma amostra qualquer, têm-se:
sj2 =
∑ (xi,j − x̅j)2n
i=1
n − 1 (71)
Combinando as k variâncias, obtém-se como estimativa de
2, a estatística em questão, definida como:
---- Dr. Georges Kaskantzis Neto ----
~ 110 ~
sr2 =
∑ sj2k
j=1
k=
∑ ∑ (xi,j − x̅j)2n
i=1kj=1
N − k (72)
7.4. ROTEIRO DO TESTE
(1) Ho: µ1 = µ2 = ... = µk = µ
(2) H1: pelo menos uma das médias µj é diferente das demais
(3) Fixar o nível de significância
(4) Determinar a R.R para 1 = k – 1 e 2 = N – k
(5) Calcular a estatística do teste
- Soma de quadrados
SQE = ∑ ∑(x̅j − X̿)2
= ∑ [(∑ xi,j
nj
i=1)
2
nj] −
(∑ xi,jkj=1 )
2
N (73)
k
j=1
n
i=1
k
j=1
SQR = ∑ ∑(xi,j − x̅j)2
= ∑ ∑ xi,j2 − ∑ [
(∑ xi,jnj
i=1)
2
nj] (74)
k
j=1
n
i=1
k
j=1
n
i=1
k
j=1
SQT = ∑ ∑(xi,j − X̅)2
= ∑ ∑ xi,j2 −
(∑ ∑ xi,jni=1
kj=1 )
2
N (75)
n
i=1
k
j=1
n
i=1
k
j=1
SQT = SQE + SQR (76)
7.5. QUADRO ANOVA
Fonte de
Variação
Soma de
quadrados
Graus de li-
berdade
Quadrado
Médio (s2)
Estatística
F
Entre a-
mostras SQE K-1
Se2 = QME =
SQE/(k-1)
F = Se2 / Sr
2 =
QME / QMR
Residual SQR N – k Sr
2 = QMR =
SQR/ (N-k)
Total SQT N - 1
---- Dr. Georges Kaskantzis Neto ----
~ 111 ~
(6) Conclusão
Se F > F k-1, N-k, rejeita-se a Ho, caso contrário aceita-se a Ho.
EXEMPLO
A análise de um componente contaminado foi realizada por
quatro fiscais. Os advogados das partes da lide alegaram que existe
uma diferença significativa entre os resultados obtidos pelos fiscais.
Verificar se a diferença das amostragens realizadas pelos fiscais é
significativa ao nível de 5%.
Os resultados das análises encontram-se indicados, a seguir
QUADRO. RESULTADOS DAS AMOSTRAGENS REALIZADAS PELOS FISCAIS
Fiscal Amostra1 Amostra2 Amostra3 Amostra4 Amostra5
1 8,1 8,3 8,0 8,1 8,5
2 8,4 8,4 8,5 8,3 ---
3 8,8 8,7 8,9 --- ---
4 8,3 8,4 8,2 8,3 8,4
SOLUÇÃO
(1) Ho: µ1 = µ2 = µ3 = µ4 = µ
(2) H1: pelo menos uma das médias é diferente das demais
(3) Fixar o nível de significância: alfa = 0,05
(4) Determinar a R.R para 1 = 4 – 1=3 e 2 = 18 – 4 = 14
---- Dr. Georges Kaskantzis Neto ----
~ 112 ~
(5) Cálculo da estatística do teste
SQE = 1264,10 – 1263,37 = 0,73
SQR = 1264,34 – 1264,10 = 0,24
SQT = 1264,34 – 1263,37 = 0,97
QUADRO ANOVA
Fonte de
Variação
Soma de
Quadrados
Graus de
Liberdade
Quadrado
Médio (s2)
Estatística
F
Entre amostras 0,73 4 – 1 = 3 0,243 0,243/0,017 =
14,29
Residual 0,24 18 – 4 = 14 0,017
Total 0,97 18 – 1 = 17
(6) Conclusão
Como F > F 3, 14 = 3,34, rejeita-se a Ho, isto é, existe pelo menos
uma amostragem cujo resultado é significativamente diferente dos
demais.
---- Dr. Georges Kaskantzis Neto ----
~ 113 ~
8. TESTES DE HIPÓTESES PARA AS AMOSTRAS
Adotando factível aplicação dos testes de hipóteses as amos-
tras do acidente investigado, apresentam-se nesta seção os resulta-
dos obtidos na citada atividades. Incialmente, realizaram os testa
para a médias dos grupos de componentes que se encontram pre-
sentes na mistura dos óleos que derramaram no emborcamento e
os grupos de compostos determinados com testes de laboratórios
nas amostras dos componentes ambientais alterados pelo acidente
naval.
8.1. TESTES PARA AS MÉDIAS
Os valores das médias dos logaritmos das concentrações dos
grupos BTEX, HEP, HPA e Metais e, os seus respectivos desvios padrões
e graus de liberdade se encontram apresentados na TABELA
TABELA 17. VALORES DAS ESTATÍSTICAS DOS BTEX, HEP, HPA, METAIS.
ESTATÍSTICA BTEX HEP HPA METAIS
Média -8,36 - 5,44 -9,24 -7,70
Desvio padrão 0,64 1,56 1,28 1,59
Graus de liberdade 47 63 43 62
(1) Ho: µ = µo
(2) H1: µ > µo
(3) Nível de significância: 0,05 (5%)
(4) Região de rejeição
---- Dr. Georges Kaskantzis Neto ----
~ 114 ~
Para o nível de significância de 0,05 e 47 graus
de liberdade consultando a tabela da distribuição de t-Stu-
dent, obtém-se os valores:
tαlfa = -1,67
(5) Cálculo da estatística
t =x̅ − μo
σ
√n
=−8,36 − 0
0,638
√48
=−8,36
9,21 × 10−2= −90,78
(6) Conclusões
Como t < talfa = -1,67, rejeita-se a hipótese nula, ou seja, a con-
centração dos compostos do grupo BTEX observadas nas amostras
do componentes ambientais é maior do que zero com 95% de con-
fiança.
Para os demais grupos de compostos que constituíam a mis-
tura oleosa, o valor da estatística t é praticamente o mesmo. Os va-
lores calculados da estatística t dos demais grupos são os seguintes:
---- Dr. Georges Kaskantzis Neto ----
~ 115 ~
t =x̅ − μo
σ
√n
=−5,44
1,556
√64
= − 27,97
Para os compostos do grupo HPA, tem-se:
t =x̅ − μo
σ
√n
=−9,23
1,279
√46
= −48,95
Para os compostos do grupo metais, tem-se:
t =x̅ − μo
σ
√n
=−7,70
1,589
√63
= −38,46
Como, todos os valores calculados de t < talfa rejeita-se Ho, sig-
nificando que as concentrações dos compostos derramados no em-
borcamento nas amostras analisadas eram maiores do que zero.
8.2 TESTES PARA A DIFERENÇA ENTRE AS MÉDIAIS
Neste teste, adotou-se a hipótese nula de que as diferenças
entre os valores dos logaritmos das concentrações dos compostos
químicos da mistura oleosa e aqueles observados nas amostras dos
componentes ambientais são iguais a zero, ou seja, não existe dife-
rença significativa entre as concentrações.
Para o grupo dos compostos BTEX, obtiveram os resultados, a
saber. O valor da média dos compostos BTEX observados nas amos-
tras foi definido como x1 e o outro, como x2.
---- Dr. Georges Kaskantzis Neto ----
~ 116 ~
Componente x1
o Média x1 = - 8,3645
o Variância s21 = 0,4073
o N1 = 48
Componente x2
o Média x2 = -7,4527
o Variância s22 = 0,4217
o N2 = 4
TESTE DA HIPÓTESE
(1) Ho: x1- x2 = do ou x1 = x2
(2) H1: x1 – x2 ≠ do ou x1 ≠ x2
(3) Alfa = 0,05
(4) Determinação da R.R.
Para o teste bilateral, adotando o nível de significância da
ordem de α/2 = 0,025, e ν=48+4-2 = 50 graus de liberdade, obtém-se
o valor de tα/2 = -1,96.
(5) Cálculo da estatística
𝑠𝑝2 =
(48 − 1) × 0,4073 + (4 − 1) × 0,4217
48 + 4 − 2= 0,4000
t =(−8,36 + 7,45) − 0
√0,4 × (1
48 +14)
= −2,76
(6) Conclusões
---- Dr. Georges Kaskantzis Neto ----
~ 117 ~
Como |t|> tα/2 = -1,96, rejeita-se a hipótese nula, ou seja, e-
xiste diferença significativa, ao nível de 5% entre os valores das con-
centrações investigadas.
Os resultados dos testes das diferenças entre os valores das
médias do logaritmos das concentrações dos compostos presentes
na mistura oleosa e observados nas amostras dos componentes am-
biental pode ser avaliados na TABELA 18.
TABELA 18. RESULTADOS DOS TESTES DA DIFERENÇA DAS MÉDIAS
Estatística HEP HPA METAIS
X1 -5,44 -9,24 -7,01
S12 1,56 1,64 2,53
N1 64 46 63
X2 -5,03 -8,59 -8,73
S22 0,03 0,99 3,63
N2 4 13 8
Valor t-crítico ± 2,01 ± 2,06 ±2,29
Valor t cal. 1,92 1,95 1,47
Sig. (Valor-p) 0,061 0,063 0,1786
Resultado Aceitar Ho Aceitar Ho Aceitar Ho
Os resultados dos testes das diferenças entre as médias dos
valores do logaritmo das concentrações dos compostos constituin-
tes da mistura oleosa e identificados nas amostragem indicam que
os HEP, HPA e Metais verificam o teste, significando que a contami-
nação dos ecossistemas da Babitonga foi oriunda do acidente.
top related