análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25
25º Congresso Brasileiro de Engenharia Sanitária e Ambiental ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 1 V-069 – ANÁLISE EXPLORATÓRIA DOS INDICADORES DO SNIS – SISTEMA NACIONAL DE INFORMAÇÕES SOBRE SANEAMENTO Marcos Ubirajara (1) Mestre em Tecnologia Nuclear pelo IPEN/USP e Bacharel em Física pela PUC-SP. Consultor Especializado em Geoprocessamento e Tecnologias Correlatas Aplicadas ao Saneamento Básico e Ambiental. Jucélia Cabral Mendonça Engenheira Civil pela Escola de Engenharia da Universidade Federal de Goiânia (UFG-GO). Especialização em Educação Ambiental (CREA/SHS/EESC/USP). Mestre em Ciências da Engenharia Ambiental (EESC/USP). Engenheira do Ministério das Cidades. Cynthia Regina Araújo Melo Economista - Universidade Católica de Brasília - UCB - Especialização em Matemática para economia e administração - Universidade de Brasília - UnB - Economista do Ministério das Cidades. Endereço (1) : Av. João Samaha, 702 - Apto 202 - São João Batista - Belo Horizonte - MG - CEP: 31520-100 - Brasil – Telefone: (31) 34357-3944 - e-mail: [email protected] RESUMO O presente trabalho apresenta uma metodologia para a elaboração de um diagnóstico da abrangência e qualidade dos serviços de saneamento básico brasileiro a partir da análise exploratória multivariada dos indicadores do SNIS - Sistema Nacional de Informações sobre Saneamento. O método utilizado para a consecução do trabalho apresentado foi o da Análise Fatorial dos Componentes Principais tendo como principais objetivos a redução dos dados, a verificação da consistência interna dos indicadores do SNIS e a sua correlação com variáveis exógenas afetas ao saneamento básico e, por fim, traçar um quadro que expresse os profundos diferenciais existentes quanto à qualidade e abrangência dos serviços básicos de saneamento prestados no Brasil. PALAVRAS-CHAVE: Análise Fatorial e Exploratória, Indicadores do SNIS, Serviços de Saneamento Básico, Qualidade dos Serviços, Universalização. INTRODUÇÃO A análise fatorial é um dos métodos muito utilizado da análise exploratória multivariada, nos mais diversos campos do conhecimento, para a elaboração de estudos visando, principalmente, a redução de dados e a simplificação de casos envolvendo muitas variáveis e respondentes. No caso do Sistema Nacional de Informações sobre Saneamento, o SNIS, são mais de 4.000 (quatro mil) municípios respondentes, centenas de informações primárias e dezenas de indicadores calculados para formar a base de dados de informações. Com tantas informações, o desafio que se coloca é como utilizá-las na produção de um diagnóstico global que exiba os diferenciais que sabemos existir quanto à qualidade e abrangência dos serviços prestados pelo setor do saneamento, mas que também revele que outras dimensões latentes estariam associadas às dificuldades para a melhoria da qualidade e para a universalização dos serviços de saneamento no país. Com isso a proposta é traçar um quadro do saneamento brasileiro a partir de um conjunto mínimo de indicadores que, a priori, não sabemos quais são. O que se coloca como pré-condição para validação desse estudo, é que esse conjunto mínimo seja representativo do ponto de vista da grande quantidade de informações e indicadores disponíveis no SNIS; e que expresse os profundos diferenciais existentes quanto à qualidade e abrangência dos serviços básicos de saneamento prestados no Brasil. Isto quer dizer que um dos focos principais do trabalho a ser apresentado está na redução de dados e, por essa razão, apresenta-se a análise fatorial como um método eficaz para isso.

Upload: marcos-camargo

Post on 04-Jul-2015

2.384 views

Category:

News & Politics


5 download

DESCRIPTION

Metodologia para a elaboração de um diagnóstico da abrangência e qualidade dos serviços de saneamento básico brasileiros a partir da análise exploratória multivariada dos indicadores do SNIS - Sistema Nacional de Informações sobre Saneamento.

TRANSCRIPT

Page 1: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 1

V-069 – ANÁLISE EXPLORATÓRIA DOS INDICADORES DO SNIS – SISTEMA NACIONAL DE INFORMAÇÕES SOBRE SANEAMENTO

Marcos Ubirajara(1) Mestre em Tecnologia Nuclear pelo IPEN/USP e Bacharel em Física pela PUC-SP. Consultor Especializado em Geoprocessamento e Tecnologias Correlatas Aplicadas ao Saneamento Básico e Ambiental. Jucélia Cabral Mendonça Engenheira Civil pela Escola de Engenharia da Universidade Federal de Goiânia (UFG-GO). Especialização em Educação Ambiental (CREA/SHS/EESC/USP). Mestre em Ciências da Engenharia Ambiental (EESC/USP). Engenheira do Ministério das Cidades. Cynthia Regina Araújo Melo Economista - Universidade Católica de Brasília - UCB - Especialização em Matemática para economia e administração - Universidade de Brasília - UnB - Economista do Ministério das Cidades. Endereço(1): Av. João Samaha, 702 - Apto 202 - São João Batista - Belo Horizonte - MG - CEP: 31520-100 - Brasil – Telefone: (31) 34357-3944 - e-mail: [email protected] RESUMO

O presente trabalho apresenta uma metodologia para a elaboração de um diagnóstico da abrangência e qualidade dos serviços de saneamento básico brasileiro a partir da análise exploratória multivariada dos indicadores do SNIS - Sistema Nacional de Informações sobre Saneamento. O método utilizado para a consecução do trabalho apresentado foi o da Análise Fatorial dos Componentes Principais tendo como principais objetivos a redução dos dados, a verificação da consistência interna dos indicadores do SNIS e a sua correlação com variáveis exógenas afetas ao saneamento básico e, por fim, traçar um quadro que expresse os profundos diferenciais existentes quanto à qualidade e abrangência dos serviços básicos de saneamento prestados no Brasil. PALAVRAS-CHAVE: Análise Fatorial e Exploratória, Indicadores do SNIS, Serviços de Saneamento Básico, Qualidade dos Serviços, Universalização. INTRODUÇÃO

A análise fatorial é um dos métodos muito utilizado da análise exploratória multivariada, nos mais diversos campos do conhecimento, para a elaboração de estudos visando, principalmente, a redução de dados e a simplificação de casos envolvendo muitas variáveis e respondentes. No caso do Sistema Nacional de Informações sobre Saneamento, o SNIS, são mais de 4.000 (quatro mil) municípios respondentes, centenas de informações primárias e dezenas de indicadores calculados para formar a base de dados de informações. Com tantas informações, o desafio que se coloca é como utilizá-las na produção de um diagnóstico global que exiba os diferenciais que sabemos existir quanto à qualidade e abrangência dos serviços prestados pelo setor do saneamento, mas que também revele que outras dimensões latentes estariam associadas às dificuldades para a melhoria da qualidade e para a universalização dos serviços de saneamento no país. Com isso a proposta é traçar um quadro do saneamento brasileiro a partir de um conjunto mínimo de indicadores que, a priori, não sabemos quais são. O que se coloca como pré-condição para validação desse estudo, é que esse conjunto mínimo seja representativo do ponto de vista da grande quantidade de informações e indicadores disponíveis no SNIS; e que expresse os profundos diferenciais existentes quanto à qualidade e abrangência dos serviços básicos de saneamento prestados no Brasil. Isto quer dizer que um dos focos principais do trabalho a ser apresentado está na redução de dados e, por essa razão, apresenta-se a análise fatorial como um método eficaz para isso.

Page 2: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 2

Como hipóteses iniciais, as quais estão respaldadas na vasta experiência adquirida para a construção da longa série histórica do SNIS, tem-se que fatores sociais e geopolíticos potencialmente estariam acoplados naquelas dimensões latentes que desejamos revelar. Todavia, tais informações sobre variáveis e indicadores sociais e da geopolítica não integram a base de dados do SNIS. Por essa razão, também colocou-se uma hipótese inicial a possível correlação entre as variáveis e indicadores do SNIS, e aquelas do IDHM – Índice de Desenvolvimento Humano Municipal e da MI – Mortalidade Infantil Estimada para os municípios brasileiros. O passo inicial para a comprovação dessas hipóteses, e que no futuro poderá ser feita através de modelagens matemáticas mais sofisticadas, é uma análise exploratória das informações disponíveis visando à depuração de conceitos e à redução de dados. Este trabalho está comprometido com a consecução desse passo inicial. Então, e antes de mais nada, procedeu-se uma análise exploratória das informações que hoje formam uma série histórica de mais de 10 (dez) anos, no sentido de encontrar um subconjunto de dados e indicadores que, em primeiro lugar, estejam correlacionados entre si e que, em segundo lugar, sejam passíveis de se correlacionarem com variáveis exógenas indispensáveis para a formação de um modelo de conhecimento que contemple as dimensões sociais e geopolíticas, tão fundamentais para a compreensão do quadro que está para emergir desse estudo. Tendo sido realizada em várias etapas, a análise exploratória, realizada primeiramente com dados do Diagnóstico dos Serviços de Água e Esgoto - Ano de Referência 2005 do SNIS, demonstrou ser a análise fatorial um método adequado para a redução dos dados e para o posterior cruzamento e estabelecimento de correlações entre os indicadores do saneamento básico e as variáveis exógenas em estudo. A partir da comprovação da adequação do método da análise fatorial, procedeu-se a Análise dos Componentes Principais (ACP) com o objetivo de revelar dimensões latentes emergentes das correlações entre variáveis ou grupos de variáveis e, a partir da análise dessas correlações, revelar as estruturas dessas grandezas latentes não evidentes através das variáveis manifestas em estudo. Com isso, o presente trabalho tem como objetivo principal promover uma análise exploratória envolvendo os indicadores da série histórica do SNIS – Sistema Nacional de Informações Sobre Saneamento, e outros indicadores amplamente aceitos e utilizados no Planejamento Integrado e no desenvolvimento de Políticas Setoriais afetas ao Saneamento Básico, como é o caso do IDHM - Índice de Desenvolvimento Humano Municipal do PNUD e o MI – Indicador da Mortalidade Infantil Estimada da FIOCRUZ para os municípios brasileiros. Enquanto desenvolvimento metodológico objetiva-se especificamente validar a metodologia da análise exploratória baseada na Análise Fatorial dos Componentes Principais na criação de um modelo respaldado nas técnicas apresentadas, e que reflita os aspectos multidisciplinares da complexa rede de inter-relações formada pelo saneamento básico e seus interferentes. Como conseqüência da validação da citada metodologia utilizada, apresenta-se como um subproduto a consistência dos dados do SNIS utilizados neste trabalho ante as variáveis exógenas pesquisadas e integradas ao modelo. DESENVOLVIMENTO

A análise fatorial é um método muito utilizado e considerado eficaz na elaboração de estudos visando, principalmente, a redução de dados e a simplificação de casos envolvendo muitas variáveis e respondentes. Procedendo a Análise dos Componentes Principais (ACP), objetiva-se revelar correlações entre variáveis e grupos das variáveis em estudo e, a partir dessas correlações, identificar as estruturas das grandezas latentes não evidentes através das variáveis manifestas. Por que a análise fatorial?

Determinados conceitos, como a exclusão social e urbana, não são bem definidos em razão até da diversidade de cenários apresentados pelas cidades. Não sendo diretamente observáveis, esses conceitos são freqüentemente chamados de variáveis latentes e espera-se que seus efeitos se revelem através das variáveis manifestas. O método mais conhecido para investigar a dependência de um conjunto de variáveis manifestas em relação a um número menor de variáveis latentes é a chamada análise fatorial. A análise fatorial pode identificar a estrutura subjacente de um conjunto de uma matriz de dados, bem como fornecer um processo para a redução dos dados. No nosso caso, o principal objetivo é, de fato, a redução dos dados e isso pressupõe que exista alguma ordem latente nos dados em análise. A redução aos fatores principais favorece muito a

Page 3: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 3

retroação aos períodos anteriores, reduzindo sobremaneira a necessidade de dados para as análises de evolução dos indicadores no tempo. Os tópicos que seguem têm como principal objetivo introduzir os conceitos e outros elementos teóricos da análise fatorial, visando à sua aplicação e posterior avaliação dos resultados como uma medida da adequação do método. Sabe-se que a estatística em si, qualquer que seja o método utilizado, não assegura bons resultados. Por essa razão, alguns cuidados devem ser tomados nos passos iniciais, sob pena de perda do potencial de generalização dos resultados obtidos ou mesmo da confiabilidade dos mesmos. Esse potencial de generalização coloca-se também como uma pré-condição para a validação do estudo que segue, à semelhança da necessidade de estarmos trabalhando com um conjunto mínimo de informações. FASE I – ELEMENTOS DA ANÁLISE FATORIAL

O objetivo desta fase foi introduzir conceitos e outros elementos teóricos da Análise Fatorial, culminando com a recomendação do método para promover a análise exploratória apresentada neste trabalho. A principal recomendação resultante desta fase inicial foi à realização de um estudo mais detalhado envolvendo apenas as variáveis operacionais de água e de esgoto do SNIS, no sentido de apurar aquelas que, ao longo da série histórica, guardassem correlações entre si. Com isto, além da busca das possíveis correlações, visava-se também à redução dos dados, uma vez que muitos indicadores, embora indispensáveis para a compreensão do quadro do saneamento brasileiro, possuem uma estrutura de cálculo semelhante, o que acaba por se revelar através da Análise Fatorial. Então, somente após o estudo recomendado, partir para o estudo da possível e esperada correlação de um grupo já reduzido de variáveis com as variáveis exógenas. Sabendo-se também que um grande número de variáveis não iria assegurar a obtenção de resultados consistentes, partiu-se para segunda fase. Como objetivo secundário, buscou-se validar a metodologia da análise exploratória baseada na Análise Fatorial dos Componentes Principais, bem como envolver a equipe de especialistas do SNIS na criação de um modelo respaldado nas técnicas apresentadas, e que reflita os aspectos multidisciplinares da complexa rede de inter-relações formada pelo saneamento básico e seus interferentes. Como conseqüência da validação da metodologia utilizada, torna-se um importante objetivo a verificação da consistência dos dados do SNIS utilizados neste trabalho, o qual se pretende aferir a partir da medida da adequação da amostra utilizada (MSA), que decorre naturalmente da aplicação da Análise Fatorial. A Seleção de Variáveis

Na fase de seleção das variáveis, sendo este um passo crucial, algumas recomendações para a adequação do método da análise fatorial aos objetivos do trabalho devem ser seguidas: O pesquisador deve saber como as variáveis estão inter-relacionadas para melhor interpretar os resultados. Sendo assim, esse pesquisador deverá estar em permanente contato com os especialistas para assegurar a qualidade e a confiabilidade dos resultados. Hoje a base de dados do SNIS corresponde a mais de 4.500 (quatro mil e quinhentos) municípios respondentes, centenas de informações primárias e dezenas de indicadores calculados para formar a base de dados de informações sobre saneamento. Dentre esses muitos respondentes, alguns respondem parcialmente aos questionários, significando que alguns critérios devam ser estabelecidos para inclusão na amostra em estudo. Sendo assim, procedeu-se uma análise exploratória dessas informações que hoje formam uma série histórica de mais de 10 (dez) anos, no sentido de encontrar um subconjunto de dados e indicadores que, em primeiro lugar, estejam correlacionados entre si e, em segundo lugar, sejam passíveis de se correlacionarem com variáveis exógenas indispensáveis para a formação de um modelo de conhecimento que contemple as dimensões sociais e geopolíticas; A qualidade e o significado dos fatores determinados refletem as estruturas conceituais das variáveis incluídas na análise. Isto deixa claro que a seleção de variáveis é uma tarefa para especialistas. Quando feita por um analista, deverá ser assistida pelos especialistas. No nosso caso, a seleção foi assistida pelos especialistas da equipe de técnicos e consultores da UGP/PMSS;

Page 4: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 4

Deve-se desenvolver um modelo conceitual que evite a omissão de uma variável preditora crítica, bem como a inserção indiscriminada de variáveis esperando que a técnica “revele” as variáveis relevantes. Em primeiro lugar porque as variáveis irrelevantes podem aumentar o ajuste dos dados da amostra, mas torná-los menos generalizáveis. Em segundo lugar, as variáveis irrelevantes, embora não afetem as estimativas das variáveis relevantes, podem mascarar os verdadeiros efeitos em razão da multicolinearidade. Assim, incluir indiscriminadamente variáveis conceitualmente irrelevantes pode provocar vários efeitos indesejáveis, ainda que essas variáveis adicionais não influenciem diretamente os resultados do modelo. Após discussões preliminares com a equipe técnica, decidiu-se iniciar o estudo explorando apenas o sub-conjunto de indicadores e variáveis operacionais de água e de esgoto, que são os mais antigos e completos integrantes da base de dados do SNIS; Os resultados obtidos serão tão bons e confiáveis quanto os dados introduzidos na análise. Bons conjuntos de dados premiam o pesquisador com bons resultados. A qualidade e a confiabilidade dos indicadores e dados do SNIS, de fato, é uma das teses deste estudo, cujos resultados trazem uma confirmação da mesma.

A Captura das Informações

O Banco de Dados do SNIS – Sistema Nacional de Informações sobre Saneamento mantém em sua série histórica indicadores municipais calculados somente quando da suficiência de dados primários necessários para a sua consecução. Por essa razão, a captura das informações para o presente estudo obedece ao critério de seleção dos respondentes (municípios) com suficiência de dados. Após várias simulações foram selecionadas para o estudo as variáveis apresentadas na Tabela 01, tendo como referência a base de dados do SNIS do ano de 2005.

Tabela 1: Variáveis Selecionadas. Ordem Variável Descrição Origem

1 I10 Índice de Micro-medição Relativo ao Volume Disponibilizado

SNIS

2 I13 Índice de Perdas de Faturamento SNIS 3 I25 Volume de Água Disponibilizado por Economia SNIS 4 I49 Índice de Perdas na Distribuição SNIS 5 I15 Índice de Coleta de Esgotos SNIS 6 I24 Índice de Atendimento Urbano de Esgoto SNIS 7 I56 Índice de Atendimento Total de Esgoto SNIS 8 MI Mortalidade Infantil Estimada FIOCRUZ 9 IDHM_RENDA Componente de Renda do IDHM IDHM_2000

10 IDHM_LOGEVIDADE Componente de Longevidade do IDHM IDHM_2000 11 IDHM_EDUCACAO Componente de Educação do IDHM IDHM_2000

Fonte: SNIS, 2006; IBGE; FIOCRUZ. Ao analisar a Tabela 1, percebe-se o foco em três dimensões principais, a saber: desempenho dos serviços de abastecimento de água, cobertura e desempenho dos serviços de esgotamento sanitário e, como indicadores da dimensão social, o índice de desenvolvimento humano e da mortalidade infantil das populações atendidas. Conforme o critério apresentado, a coleção de dados foi feita a partir de uma consulta ao banco de dados do SNIS, a qual filtrou todos os municípios com valores não nulos para as variáveis em estudo. A tabela obtida foi exportada para o Excel, servindo então como dados de entrada para o software de estatística avançada. Neste estudo foi utilizado o programa SPSS. A Análise Fatorial

Na análise fatorial as variáveis que não carregam significativamente em nenhum fator ou que apresentem comunalidades muito baixas devem ser ignoradas ou eliminadas. Ignorar uma variável pode ser apropriado se o objetivo for apenas a redução dos dados. Eliminar a variável pode ser apropriado quando esta é de menor importância para o objetivo do estudo ou quando apresenta valor de comunalidade muito baixo. Quando

Page 5: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 5

eliminada uma ou mais variáveis, o conjunto de dados deve ser processado novamente. Significância das Cargas Fatoriais

Significância Prática: Considera-se que os valores das cargas fatoriais possuem as significâncias práticas apresentadas na Tabela 2.

Tabela 2: Cargas Fatoriais e Significâncias Práticas. Valor da Carga Significância Prática

> +- 0.30 Nível Mínimo > +- 0.40 Importantes > +- 0.50 Possuem Significância Prática

O quadrado das cargas fatoriais representa a quantia da variância total da variável explicada pelo fator. Significância Estatística: Em termos da significância estatística, podemos trabalhar em duas dimensões: o tamanho da amostra e o número de variáveis. Assim, considera-se a seguinte tabela de significância das cargas em função do tamanho da amostra, conforme apresentado na Tabela 3.

Tabela 3: Valor da Carga e Tamanho da Amostra Valor da Carga Tamanho da Amostra

(respondentes) 0.30 350 0.35 250 0.40 200 0.45 150 0.50 120 0.55 100 0.60 85 0.65 70 0.70 60 0.75 50

No nosso estudo, estamos trabalhando com uma amostra maior que 350 respondentes, sugerindo que valores das cargas fatoriais < 0.30 têm significância estatística (1). O número de variáveis em análise também é importante na significância das cargas, guardando a seguinte relação:

���� número de variáveis < o valor das cargas significantes

Sobre as Comunalidades

A comunalidade mostra a quantia da variância em uma variável que é explicada pelos fatores extraídos juntos. Em outras palavras, significa o quanto da variância de uma dada variável é explicada pela solução fatorial. Análise de Componentes

A matriz geral de correlação é transformada por meio de estimação de um modelo fatorial para obtenção de uma matriz fatorial. As cargas fatoriais de cada variável nos fatores são interpretadas para identificar a estrutura latente das variáveis. De forma geral, quanto maior o número de fatores extraídos, melhor será o ajuste e maior será a porcentagem da variância do dado explicado pela solução fatorial. Todavia, quanto maior o número de fatores extraídos, menor a parcimônia da solução. Evidentemente, isto pressupõe a existência de critérios para a limitação do número ideal de fatores. No nosso estudo adotamos o critério da raiz latente.

Page 6: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 6

Raiz Latente: Pelo critério da raiz latente, somente autovalores > 1.0 são considerados na seleção de componentes para análise posterior. Teste de Scree: Este teste poderá indicar outros fatores com valores próximos de 1.0 como sendo apropriados. A Interpretação dos Fatores

Quando variáveis são muito diferentes, ou seja, não guardam correlações consideráveis entre si, o índice obtido pela soma dos traços será baixo. Do contrário, se as variáveis recaírem em um ou mais grupos altamente relacionados, esse índice se aproximará de 100%. Todavia, o aprofundamento dessa discussão impõe a necessidade de se proceder uma análise da importância e da consistência interna dos fatores. A importância de um fator (ou um conjunto de fatores) é avaliada pela proporção da variância representada pelo fator após a rotação. Se for uma rotação ortogonal, a importância do fator estará relacionada com o tamanho dos seus SSLs (Soma das Cargas Quadráticas da Matriz de Componentes Após a Rotação). Essa somas (SSLs) são convertidas para uma grandeza da proporção de variância para um fator, dividindo-as pelo número de variáveis (2). Sobre a Rotação da Matriz de Componentes

A importância de um fator é avaliada pela proporção da variância representada pelo fator após a rotação. A rotação favorece a análise dos componentes na medida em que revela as dimensões subjacentes da solução fatorial apresentada. A partir da rotação, poderemos inclusive dar nomes aos fatores até então identificados por números. Esses fatores, evidentemente, estarão associados àquelas dimensões latentes que buscamos medir. FASE II – ANÁLISE DA MATRIZ DE CORRELAÇÃO DOS INDICADORES OPERACIONAIS DE ÁGUA E ESGOTO DO SNIS ANO 2005

Conforme ficou recomendado na FASE I, passamos a estudar o conjunto de indicadores do SNIS objetivando verificar a sua consistência interna e completude. Para esse efeito, escolhemos começar pelo conjunto de indicadores operacionais de água e esgoto, uma vez que acreditamos ser o desempenho operacional um dos fatores responsáveis pelo registro de grandes perdas nos sistemas e pela dificuldade de universalizar os serviços no país. Foram processados 30 (trinta) indicadores operacionais do SNIS, do ano de referência de 2005, para uma amostra de 721 (municípios) respondentes. Procedeu-se a análise obtendo-se a matriz de correlação apresentada na Tabela 4. A Análise das Comunalidades entre os Indicadores Operacionais de Água e Esgoto do SNIS

O quadro que segue faz uma análise das comunalidades. Consideramos neste estudo que os níveis de explicação aceitáveis estariam acima de 50%. Sendo assim, todas as variáveis com comunalidades iguais ou menores a 0.50 são consideradas como tendo um nível de explicação insuficiente. Se há variáveis com comunalidades consideradas baixas, há duas opções possíveis: (1) interpretar a solução ignorando essas variáveis, ou (2) eliminar a variável, o que exigirá um novo processamento do conjunto reduzido [1]. Considerando sempre a contribuição de cada variável para os objetivos do estudo, optamos pela eliminação quando apropriada, pois, um dos nossos objetivos principais está na redução dos dados. A Tabela 5 apresenta a análise das comunalidades.

Page 7: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 7

Page 8: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 8

Tabela 5: Análise das Comunalidades

Indicadores Inicia

l Comunalidade Correlação

I01-Densidade de Economias de Água por Ligação

1,000 ,601

Esta variável apresenta baixa comunalidade, confirmando a pouca correlação que mantém com os demais fatores em estudo. Apresenta uma correlação, ainda pouco significativa, com a variável I51-Índice de Perdas por Ligação. Tornou-se uma candidata a sair da amostra.

I09-Índice de Hidrometração

1,000 ,840

A alta comunalidade já recomenda. Essa variável apresenta cargas fatoriais bastante significativas para os fatores I44-Índice de Micromedição Relativo ao Consumo e I10-Índice de Micromedição Relativo ao Volume Disponibilizado. Apresenta também uma carga considerável para o fator I57-Índice de Fluoretação da Água.

I10- Índice de Micromedição Relativo ao Volume Disponibilizado

1,000 ,910

A comunalidade está dizendo. Esta variável apresenta as maiores cargas para os fatores I13-Índice de Perdas de Faturamento (observar o sinal trocado, significando que quando um aumenta, o outro diminui) e com o I28-Índice de Faturamento de Água (notar que apresentam a mesma carga fatorial, significando que são grandezas da mesma natureza e muito próximas na definição). Apresenta também forte correlação inversa com I51-Índice de Perdas por Ligação, e direta com I52-Índice de Consumo de Água. Apresenta ainda considerável relação inversa com I25-Volume de Água Disponibilizado por Economia, e direta com I09-Índice de Hidrometração e I44-Índice de Micromedição Relativo ao Consumo. É forte candidata a permanecer na análise.

I11-Índice de Macromedição 1,000 ,527

Notar como essa variável não mantém correlação significativa com nenhuma das outras. É candidata a sair da análise.

I13-Índice de Perdas de Faturamento

1,000 ,905

Essa variável também vem com uma forte comunalidade. Apresenta as maiores cargas para os fatores I49-Índice de Perdas na Distribuição e I52-Índice de Consumo de Água (inversa). Apresenta também fortes correlações com I10- Índice de Micromedição Relativo ao Volume Disponibilizado (inversa) e com I51-Índice de Perdas por ligação. Uma curiosidade: a matriz de correlação está dizendo que essa grandeza é perfeitamente explicada pelo inverso da grandeza em I28-Índice de Faturamento de Água. Em outras palavras, significa que são medidas complementares de uma mesma grandeza. É forte candidata a permanecer na análise, mas I28-Índice de Faturamento de Água pode sair. Embora algumas coisas pareçam óbvias, é bom

lembrar que essas relações surgiram da análise

estatística dos dados do SNIS, o que mostra a

consistência desses dados.

Page 9: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 9

Tabela 5: Análise das Comunalidades. (continuação)

Indicadores Inicia

l Comunalidade Correlação

I14-Consumo Micromedido por Economia

1,000 ,753

Com uma comunalidade menor, essa variável apresenta a maior carga fatorial para o fator I53-Consumo Médio de Água por Economia, seguida pelo fator I17-Consumo de Água Faturado por Economia e por I22-Consumo Médio per Capta de Água.

I17-Consumo de Água Faturado por Economia

1,000 ,823

Apresentando um perfil muito parecido com o do I14-Consumo Micromedido por Economia, essa variável tem a maior carga fatorial para o fator I53-Consumo Médio de Água por Economia, seguida pelo fator I14- Consumo Micromedido por Economia e por I22-Consumo Médio per Capta de Água; deve-se observar que essa variável apresenta maior comunalidade do que I14, significando que ela pode ser melhor explicada pela solução fatorial. É candidata a sair em favor de I53. Se permanecer, será em detrimento de I14- Consumo Micromedido por Economia, evidentemente.

I20-Extensão de Rede de Água por Ligação

1,000 ,505

Com comunalidade muito baixa, essa variável não apresenta correlação significativa com nenhuma das outras. É forte candidata a ficar fora da análise.

I22-Consumo Médio per Capta de Água

1,000 ,786

Comunalidade razoável. Em comparação com outras variáveis, apresenta cargas apenas razoáveis para os fatores I53-Consumo Médio de Água por Economia, I17-Consumo de Água Faturado por Economia e I14- Consumo Micromedido por Economia, respectivamente. Como sugerimos ficar com I17 em detrimento de I14, o argumento para a manutenção dessa variável fica enfraquecido. Candidata a sair da análise.

I23-Índice de Atendimento Urbano de Água

1,000 ,767

Comunalidade apenas razoável. Essa variável apresenta correlação significativa apenas com o fator I55-Índice de Atendimento Total de Água. É candidata a ficar fora da análise.

I25-Volume de Água Disponibilizado por Economia

1,000 ,913

Com uma comunalidade alta, apresenta a maior carga para o fator I51-Índice de Perdas por ligação. Essa forte correlação, em si, é uma tese dos nossos estudos. A seguir, apresenta altas cargas para I13-Índice de Perdas de Faturamento e para I28-Índice de Faturamento de Água (inversa), as quais demonstraram ser redundantes nesta análise. Segue-se a correlação razoável com I49-Índice de Perdas na Distribuição e I52-Índice de Consumo de Água (inversa). Deve permanecer na análise em defesa da tese citada acima.

I43-Partcipação das Economias Residenciais de

1,000 ,565 Comunalidade muito baixa. Não mantém correlação significativa com nenhuma das outras

Page 10: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 10

Água no Total de Economias de Água

variáveis. É candidata a ficar fora da análise.

Tabela 5: Análise das Comunalidades. (continuação)

Indicadores Inicia

l Comunalidade Correlação

I44-Índice de Micromedição Relativo ao Consumo

1,000 ,882

Apresentando alta comunalidade, essa variável apresenta cargas fatoriais bastante significativas para os fatores I09- Índice de Hidrometração e I10-Índice de Micromedição Relativo ao Volume Disponibilizado. Apresenta também uma carga considerável para o fator I57-Índice de Fluoretação da Água. Mas, observe-se que essa variável poderia estar bem representada por I09 ou I10.

I49-Índice de Perdas na Distribuição

1,000 ,956

Com alta comunalidade, essa variável apresenta as maiores cargas nos fatores I13 e I28 (em relação inversa), a qual se recomenda sair da amostra. Apresenta ainda forte correlação com I51-Índice de Perdas por ligação e uma relação inversa com I10-Índice de Micromedição Relativo ao Volume Disponibilizado. A análise mostra uma redundância numa relação inversa com a variável I52-Índice de Consumo de Água. São, de fato, grandezas complementares. Pode permanecer na Amostra em detrimento de I52.

I50-Índice Bruto de Perdas Lineares

1,000 ,269

Apresenta a comunalidade mais baixa dessa amostra. Consequentemente, não mantém correlação significativa com nenhuma das outras variáveis. Deve ficar fora da análise.

I51-Índice de Perdas por Ligação

1,000 ,860

Com a maior carga fatorial em I25-Volume de Água Disponibilizado por Economia, observar como ela reproduz as correlações daquela variável, mas com uma comunalidade menor. Poderia estar representada por I25. Candidata a sair da análise.

I52-Índice de Consumo de Água

1,000 ,956

A matriz de correlação está dizendo que esses indicadores são “idênticos”. De fato, ao observar a composição de ambos, vemos que I49 = 1 – I52; isto é, como eles são expressos em percentagem, então são complementares. Sugere-se excluí-lo da amostra.

I53-Consumo Médio de Água por Economia

1,000 ,922

Com alta comunalidade, essa variável apresenta a mesma composição de I17-Consumo de Água Faturado por Economia, mas com uma comunalidade muito maior. Sugere-se mantê-la em detrimento de I17 e em detrimento de I14- Consumo Micromedido por Economia.

I55-Índice de Atendimento Total de Água

1,000 ,790

Comunalidade razoável. Apresenta a maior carga no fator I23-Índice de Atendimento Urbano de Água, que é uma candidata a ficar fora. Apresenta uma carga razoável no fator I56-Índice

Page 11: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 11

de Atendimento Total de Esgoto Referido aos Municípios Atendidos com Água. Perde, porém, em comunalidade para I-56. Candidata a ficar fora, em favor de I-56.

I57-Índice de Fluoretação da Água

1,000 ,611 Comunalidade baixa, justificando as baixas cargas dos demais fatores. Candidata a ficar fora.

I58-Índice de Consumo de Energia Elétrica em Sistemas de Abastecimento de Água

1,000 ,856 Apresenta baixas cargas para os fatores em estudo. Candidata a ficar fora.

Tabela 5: Análise das Comunalidades. (continuação)

Indicadores Inicia

l Comunalidade Correlação

I15- Índice de Coleta de Esgoto

1,000 ,907

Com comunalidade alta, apresenta cargas bastante significativas para os fatores I24-Índice de Atendimento Urbano de Esgoto Referido aos Municípios Atendidos com Água e I47- Índice de Atendimento Urbano de Esgoto Referido aos Municípios Atendidos com Esgoto. Apresenta também uma carga bastante alta para o fator I56-Índice de Atendimento Total de Esgoto Referido aos Municípios Atendidos com Água. Deve permanecer na amostra.

I28-Índice de Faturamento de Água

1,000 ,905 Recomendada sair pela semelhança com I13- Índice de Perdas de Faturamento

I16-Índice de Tratamento de Esgoto 1,000 ,933

Apresenta uma carga razoável apenas no fator I46-Índice de Esgoto Tratado Referido a Água Consumida. Candidata a ficar fora.

I21-Extensão da Rede de Esgoto por Ligação

1,000 ,932

Com comunalidade alta, apresenta uma carga alta apenas no fator I59-Índice de Consumo de Energia Elétrica em Sistemas de Esgotamento Sanitário. Candidata a sair.

I24- Índice de Atendimento Urbano de Esgoto Referido aos Municípios Atendidos com Água

1,000 ,957

Com comunalidade alta, observar como a composição de I24 e I47 são idênticas em termos das cargas fatoriais, sendo que uma explica totalmente a outra.

I46-Índice de Esgoto Tratado Referido a Água Consumida 1,000 ,957

Apresenta carga fatorial razoável apenas para a variável I16, que é candidata a ficar fora. Deve sair.

I47-Índice de Atendimento Urbano de Esgoto Referido aos Municípios Atendidos com Esgoto

1,000 ,957

Pela sua própria definição, deve sair em favor de I-24.

I56-Índice de Atendimento Total de Esgoto Referido aos Municípios Atendidos com Água

1,000 ,946

Apresenta elevadas cargas para os fatores I24 e I47, as quais, por sua vez, são intercambiáveis. Apresenta carga elevada também para o fator I15- Índice de Coleta de Esgoto, que deve permanecer na amostra.

I59-Índice de Consumo de Energia Elétrica em Sistemas de Esgotamento Sanitário

1,000 ,929 Com comunalidade alta, apresenta uma carga alta apenas no fator I21-Extensão da Rede de Esgoto por Ligação. Deve sair.

Método de Extração: Análise do Componente Principal

Page 12: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 12

FASE III – ANÁLISE DA MATRIZ DE CORRELAÇÃO DO CONJUNTO REDUZIDO DOS INDICADORES DO SNIS

Conforme as recomendações da FASE II, passamos a estudar um subconjunto dos indicadores operacionais de água e esgoto que seja representativo dos demais, e que apresente uma consistência interna, antes de uma nova tentativa de estabelecer as suas correlações com variáveis exógenas. Sendo assim, procedeu-se um novo processamento dos dados, mantendo-se os mesmos 721 (municípios) respondentes para um conjunto de 8 (oito) indicadores selecionados da fase anterior para o ano de referência de 2005. Como poderá ser verificado doravante, esse subconjunto já está muito próximo de ser o mais representativo do conjunto de indicadores operacionais de água e esgoto analisado na Fase II. Devemos sempre lembrar que um dos nossos objetivos, de fato, é a redução de dados. A primeira razão para a busca de uma redução dos dados parece óbvia: a grande quantidade de informações que são coletadas, consistidas e sistematizadas pelo SNIS. A segunda forte razão é mais sutil: conforme verificado nas análises anteriores, muitos indicadores possuem estruturas semelhantes (como é o caso de grandezas complementares), sendo recomendável a sua exclusão da análise; mas isso não invalida a sua presença na série histórica do SNIS por uma questão conceitual. Sendo assim, devemos prosseguir com as análises tendo em mente que algumas restrições aqui colocadas aos indicadores pré-existentes no SNIS, o são em função de necessidades do tipo de análise que está sendo feita. Não se pode afirmar, a partir dessa análise exploratória, que determinado indicador seja dispensável, quer seja pela sua semelhança com outros indicadores, quer seja pela sua baixa correlação com o conjunto explorado. O que, de fato, justifica a existência de um indicador é o próprio conceito que ele encerra. Isto posto, como na fase anterior, passamos a analisar a matriz de correlação e as comunalidades do subconjunto dos indicadores operacionais de água e de esgoto resultante das discussões da Fase II. A Análise Fatorial e a Matriz de Correlação do Conjunto Reduzido

A Tabela 6 apresenta os resultados da Matriz de correlação e a Tabela 7 os resultados da análise de comunalidades do conjunto reduzido de indicadores do SNIS.

Tabela 6: Matriz de Correlação(a).

I10 I13 I25 I49 I53 I15 I24 I56 Correlação I10 1,000 -,795 -,686 -,773 -,122 ,160 ,221 ,160 I13 -,795 1,000 ,730 ,848 ,130 -,063 -,150 -,031 I25 -,686 ,730 1,000 ,606 ,567 -,037 -,104 ,001 I49 -,773 ,848 ,606 1,000 -,184 -,081 -,159 -,093 I53 -,122 ,130 ,567 -,184 1,000 ,093 ,103 ,180 I15 ,160 -,063 -,037 -,081 ,093 1,000 ,890 ,873 I24 ,221 -,150 -,104 -,159 ,103 ,890 1,000 ,932 I56 ,160 -,031 ,001 -,093 ,180 ,873 ,932 1,000

a Determinant = ,000 Tabela 7: Análise das Comunalidades do Conjunto Reduzido de Indicadores do SNIS.

Indicadores Inicia

l Comunalidad

e Correlação

I10- Índice de Micromedição Relativo ao Volume Disponibilizado

1,000 ,831

Com a comunalidade menor do que na fase anterior, mas ainda alta, esta variável apresenta as maiores cargas para os fatores I13-Índice de Perdas de Faturamento, I49-Índice de Perdas na Distribuição e I25-Volume de Água Disponibilizado por Economia (observar o sinal trocado em todos os componentes, significando que quando I10 aumenta, os fatores acima diminuem). Isto, em hipótese, significa que a micromedição reduz as perdas e inibe o

Page 13: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 13

desperdício. Deve-se atentar para o fato de que neste estudo, isto não é uma questão conceitual ou um postulado, mas sim aquilo que a amostra do SNIS está traduzindo através de um construto, um ente estatístico. A compreensão disto é fundamental para qualquer discussão posterior.

I13-Índice de Perdas de Faturamento

1,000 ,895

A variável I13-Índice de Perdas de Faturamento apresenta a maior carga para o fator I49-Índice de Perdas na Distribuição. Pelos mesmos motivos acima, pode-se inferir que, ainda em hipótese, a maior componente das perdas de faturamento é a perda na distribuição. Também apresenta cargas significativas para os fatores I10- Índice de Micromedição Relativo ao Volume Disponibilizado (agora com o sinal trocado) e I25-Volume de Água Disponibilizado por Economia.

Tabela 7: Análise das Comunalidades do Conjunto Reduzido de Indicadores do SNIS (continuação).

Indicadores Inicia

l Comunalidad

e Correlação

I25-Volume de Água Disponibilizado por Economia

1,000 ,918

O que essa variável I25-Volume de Água Disponibilizado por Economia apresenta de diferente é uma carga significativa no fator I53-Consumo Médio de Água por Economia. Como essa carga tem sinal positivo, podemos inferir que o aumento da disponibilização de água aumenta o consumo. Embutido neste aumento de consumo, devemos considerar, encontra-se uma parcela devida à demanda reprimida; mas também, uma parcela devida ao desperdício. São hipóteses da mais alta relevância para o nosso estudo, e que não emergem da erudição, mas sim dos dados contidos na amostra.

I49-Índice de Perdas na Distribuição 1,000 ,943

Como não poderia deixar de ser, a maior carga para essa variável está no fator I13-Índice de Perdas de Faturamento.

I53-Consumo Médio de Água por Economia

1,000 ,979

Por sua vez, a maior carga para essa variável está no fator I25-Volume de Água Disponibilizado por Economia. Sobre isso, são importantes as considerações anteriores em I25.

I15- Índice de Coleta de Esgoto

1,000 ,911

Da análise anterior do conjunto completo, o I15- Índice de Coleta de Esgoto demonstra estar fortemente correlacionado com o Atendimento Referido aos Municípios Atendidos com Água expresso pelos fatores I24 e I56. Esses indicadores, por definição, surgem de uma relação entre as populações atendidas por esgotamento sanitário e as atendidas por abastecimento de água. A amostra em estudo demonstra não haver uma correlação considerável entre os indicadores de esgoto e aqueles da água. Isto é sintomático e revela uma quadro preocupante para o saneamento brasileiro.

Page 14: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 14

I24- Índice de Atendimento Urbano de Esgoto Referido aos Municípios Atendidos com Água

1,000 ,952

Possivelmente, essa variável estaria bem representada por I15.

I56-Índice de Atendimento Total de Esgoto Referido aos Municípios Atendidos com Água

1,000 ,943

Possivelmente, essa variável estaria bem representada por I15.

Método de Extração: Análise do Componente Principal Partindo de um conjunto de 30 (trinta) indicadores operacionais de água e esgoto na FASE II, reduzimos aquele conjunto para 8 (oito) indicadores nesta FASE III, cuja solução fatorial revela 3(três) componentes capazes de explicar 92,14% da variância total do conjunto. Em vista das constatações da FASE I, esse resultado se mostra bastante animador, uma vez que sugere termos encontrado um conjunto mínimo de indicadores muito representativo da totalidade dos indicadores operacionais de água e esgoto do SNIS. Na próxima fase, voltaremos a estudar a matriz de correlação com as variáveis exógenas, mas agora seguros de termos um conjunto de indicadores consistentes entre si e representativos do conjunto maior.

Tabela 8: Variância Total Explicada

Comp Autovalores Iniciais Extração das SSL Rotação das SSL

Total

% da Variânci

a Cumulativ

o % Total

% da Variânci

a Cumulativ

o % Total

% da Variânci

a Cumulativ

o % 1 3,451 43,139 43,139 3,451 43,139 43,139 3,150 39,373 39,373 2 2,677 33,464 76,602 2,677 33,464 76,602 2,810 35,126 74,499 3 1,243 15,543 92,145 1,243 15,543 92,145 1,412 17,647 92,145 4 ,229 2,867 95,012 5 ,156 1,949 96,961 6 ,129 1,613 98,575 7 ,061 ,762 99,337 8 ,053 ,663 100,000

Método de Extração: Análise do Componente Principal FASE IV – ANÁLISE DA MATRIZ DE CORRELAÇÃO ENTRE OS INDICADORES DO SNIS, DO IDHM E DO MI

Antes de partir para um conjunto mais amplo de variáveis exógenas, uma vez que já temos um conjunto reduzido de indicadores do SNIS, daremos um passo intermediário que é proceder a análise de correlação com 2 (dois) dos mais importantes indicadores municipais utilizados no Brasil, a saber: IDHM – Índice de Desenvolvimento Humano Municipal do PNUD, e o MI – Indicador de Mortalidade Infantil Estimada dos Municípios Brasileiros – do Sistema de Monitoramento dos Indicadores de Mortalidade Infantil da Fiocruz. Nesta fase, trabalhamos com uma amostra de 860 municípios, ou seja, todos aqueles municípios para os quais há suficiência de dados primários para o cálculo dos indicadores selecionados para este estudo, e relativos ao ano de referência de 2005. Como se trata de uma análise exploratória, o objetivo deste passo é estabelecer referências para a comparação dos efeitos dos fatores nas variáveis em função de tamanho e adequação da amostra. Não nos detemos na análise dos componentes desta fase em favor de um aprofundamento das discussões a partir de uma amostra otimizada estudada na Fase V. Com relação às variáveis exógenas introduzidas na análise, temos a considerar que:

Page 15: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 15

O Índice de Desenvolvimento Humano foi criado originalmente para medir o nível de desenvolvimento humano dos países a partir de indicadores de educação (alfabetização e taxa de matrícula), longevidade (esperança de vida ao nascer) e renda (PIB per capita). O índice varia de 0 (nenhum desenvolvimento humano) a 1 (desenvolvimento humano total). Países com IDH até 0,499 têm desenvolvimento humano considerado baixo; os países com índices entre 0,500 e 0,799 são considerados de médio desenvolvimento humano; países com IDH maior que 0,800 têm desenvolvimento humano considerado alto. No caso da MI – Estimativa da Mortalidade Infantil dos Municípios Brasileiros, os indicadores foram classificados em cinco grandes dimensões: I. Contextuais, que estabelece o contexto em que ocorrem os óbitos infantis, sendo representada por características sócio-demográficas da população; II. Mortalidade Proporcional, que é composta por indicadores relativos à estrutura de causas de morte e à distribuição etária dos óbitos entre os menores de um ano; III. Relacionados ao Nascimento, para caracterizar as condições do nascimento e da assistência à gestação e ao parto; IV. Indicadores de adequação das informações vitais, que tem o propósito de estabelecer a adequação das informações vitais no nível municipal com vistas ao cálculo direto da mortalidade infantil; V. Indicadores de completitude e consistência das variáveis constantes nas declarações de óbito infantil e de nascimento, que visa monitorar a qualidade de preenchimento dos campos das declarações de óbito infantil e de nascimento. A Análise Fatorial e a Matriz de Correlação da Fase IV

A Tabela 9 apresenta a Matriz de Correlação referente à Fase IV e a Tabela 10 a variância total explicada.

Tabela 9: Matriz de Correlação(a)

I10 I13 I25 I49 I15 I24 I56 IDHM

RENDA IDHM

LONGE IDHM

EDUCA MI

1000 Corr. I10 1,000 -,790 -,578 -,730 ,214 ,287 ,223 ,057 ,116 -,014 -,148

I13 -,790 1,000 ,599 ,824 -,117 -,212 -,106 ,127 ,048 ,191 ,015

I25 -,578 ,599 1,000 ,522 -,076 -,136 -,071 ,072 ,006 ,121 ,082

I49 -,730 ,824 ,522 1,000 -,135 -,220 -,161 ,060 -,002 ,123 ,027

I15 ,214 -,117 -,076 -,135 1,000 ,886 ,871 ,400 ,325 ,254 -,236

I24 ,287 -,212 -,136 -,220 ,886 1,000 ,939 ,352 ,333 ,197 -,262

I56 ,223 -,106 -,071 -,161 ,871 ,939 1,000 ,480 ,404 ,338 -,309

IDHM_RENDA ,057 ,127 ,072 ,060 ,400 ,352 ,480 1,000 ,626 ,843 -,530

IDHM_LONGE ,116 ,048 ,006 -,002 ,325 ,333 ,404 ,626 1,000 ,599 -,462

IDHM_EDUCA -,014 ,191 ,121 ,123 ,254 ,197 ,338 ,843 ,599 1,000 -,542

MI_1000 -,148 ,015 ,082 ,027 -,236 -,262 -,309 -,530 -,462 -,542 1,000

a Determinant = 8,34E-005

Tabela 10: Variância Total Explicada Comp. Autovalores Iniciais Extração das SSL Rotação das SSL

Total

% da Variânci

a Cumulativ

o % Total

% da Variânci

a Cumulativ

o % Total

% da Variânci

a Cumulativ

o % 1 4,082 37,107 37,107 4,082 37,107 37,107 3,075 27,955 27,955 2 3,107 28,249 65,356 3,107 28,249 65,356 2,862 26,019 53,974 3 1,550 14,089 79,445 1,550 14,089 79,445 2,802 25,470 79,445 4 ,584 5,310 84,755 5 ,501 4,554 89,309 6 ,446 4,052 93,362 7 ,255 2,317 95,679

Page 16: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 16

8 ,156 1,418 97,097 9 ,141 1,283 98,380 10 ,135 1,230 99,610 11 ,043 ,390 100,000

Extraction Method: Principal Component Analysis. FASE V – REFINAMENTO DA AMOSTRA E ANÁLISE DOS COMPONENTES

O Tamanho e Dimensões da Amostra

Entre os pesquisadores há muita discussão sobre o tamanho ideal da amostra. Alguns defendem que a amostra deve ter um número de respondentes no mínimo de 10(dez) vezes o número de variáveis em análise. Outros defendem que esse número deverá ser de 20(vinte) vezes, ou até mais em alguns casos. De qualquer forma, uma coisa é certa: amostras grandes em número de variáveis poderão produzir o que se chama de um “super ajuste” que irá aparecer através da multicolinearidade. Quando isso ocorre, ou quando o número de respondentes é muito grande, cargas fatoriais menores passam a ter significância, podendo ocorrer o mascaramento de efeitos que desejamos medir. A nossa amostra, usada na Fase IV, com 860 respondentes, mostra-se muito grande segundo as recomendações. Esses 860 municípios são aqueles que apresentam suficiência de informações na base de dados do SNIS para efeito do cálculo dos indicadores selecionados para este estudo, não representando, todavia, a totalidade da base do SNIS. Sendo assim, ainda como uma medida exploratória, procuramos reduzi-la utilizando vários critérios, e o que se mostrou mais adequado ao problema em estudo foi o “corte” pela população. Ao filtrar os municípios com populações acima de 50.000 habitantes, reduzimos a amostra para 316 respondentes, um tamanho bem mais adequado se consideradas as argumentações teóricas. Todavia, devemos salientar que essa medida não pode implicar em perda do potencial de generalização dos resultados para o conjunto dos municípios brasileiros. Na realidade, isto se coloca como uma condição indispensável para o uso continuado desta metodologia na exploração dos dados da série histórica do SNIS.

Tabela 11: Matriz de Correlação Antes da Redução(a)

I10 I13 I25 I49 I15 I24 I56 IDHM

RENDA IDHM

LONGE IDHM

EDUCA MI

1000 I10 1,000 -,790 -,578 -,730 ,214 ,287 ,223 ,057 ,116 -,014 -,148

I13 -,790 1,000 ,599 ,824 -,117 -,212 -,106 ,127 ,048 ,191 ,015

I25 -,578 ,599 1,000 ,522 -,076 -,136 -,071 ,072 ,006 ,121 ,082

I49 -,730 ,824 ,522 1,000 -,135 -,220 -,161 ,060 -,002 ,123 ,027

I15 ,214 -,117 -,076 -,135 1,000 ,886 ,871 ,400 ,325 ,254 -,236

I24 ,287 -,212 -,136 -,220 ,886 1,000 ,939 ,352 ,333 ,197 -,262

I56 ,223 -,106 -,071 -,161 ,871 ,939 1,000 ,480 ,404 ,338 -,309

IDHM_RENDA ,057 ,127 ,072 ,060 ,400 ,352 ,480 1,000 ,626 ,843 -,530

IDHM_LONGE ,116 ,048 ,006 -,002 ,325 ,333 ,404 ,626 1,000 ,599 -,462

IDHM_EDUCA -,014 ,191 ,121 ,123 ,254 ,197 ,338 ,843 ,599 1,000 -,542

MI_1000 -,148 ,015 ,082 ,027 -,236 -,262 -,309 -,530 -,462 -,542 1,000

a Determinant = 8,34E-005

Tabela 12: Matriz de Correlação Depois da Redução(a)

I13 I10 I25 I49 I15 I24 I56 IDHM

RENDA IDHM

LONGE IDHM

EDUCA MI

1000 I13 1,000 -,813 ,616 ,801 -,137 -,271 -,252 -,039 -,033 ,054 ,035

I10 -,813 1,000 -,648 -,776 ,241 ,373 ,375 ,193 ,181 ,095 -,173

I25 ,616 -,648 1,000 ,534 -,067 -,148 -,138 ,003 -,089 ,096 ,071

I49 ,801 -,776 ,534 1,000 -,122 -,246 -,234 -,055 -,034 ,020 ,023

Page 17: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 17

I15 -,137 ,241 -,067 -,122 1,000 ,869 ,875 ,529 ,362 ,385 -,336

I24 -,271 ,373 -,148 -,246 ,869 1,000 ,985 ,519 ,410 ,369 -,367

I56 -,252 ,375 -,138 -,234 ,875 ,985 1,000 ,564 ,437 ,422 -,403

IDHM_RENDA -,039 ,193 ,003 -,055 ,529 ,519 ,564 1,000 ,601 ,843 -,631

IDHM_LONGE -,033 ,181 -,089 -,034 ,362 ,410 ,437 ,601 1,000 ,608 -,632

IDHM_EDUCA ,054 ,095 ,096 ,020 ,385 ,369 ,422 ,843 ,608 1,000 -,676

MI_1000 ,035 -,173 ,071 ,023 -,336 -,367 -,403 -,631 -,632 -,676 1,000

a Determinant = 1,29E-005 A partir de uma análise visual, considerando apenas o padrão de cor, percebe-se que a redução da amostra resultou num sensível aumento das cargas fatoriais dos componentes. Como havíamos afirmado antes, de fato, um super ajuste provocado pelo tamanho da amostra pode mascarar os efeitos dos fatores sobre as variáveis em estudo. A Medida da Adequação da Amostra

Uma medida para quantificar o grau de inter-correlações entre as variáveis e da adequação da análise fatorial é a medida de adequação da amostra (MSA). Esse índice varia de 0 a 1, alcançando 1 quando cada variável é perfeitamente prevista sem erro pelas outras variáveis. Nesse estudo, o valor para a MSA pode ser observado pela Tabela 13, antes da redução, e Tabela 14, após a redução.

Tabela 13: Testes de KMO e Bartlett (antes da redução) Medida da Adequação da Amostra de Kaiser-

Meyer-Olkin - KMO ,802

Approx. Chi-Square 8024,909 df 55

Sig. ,000

Tabela 14: Testes de KMO e Bartlett (após a redução)

Medida da Adequação da Amostra de Kaiser-Meyer-Olkin - KMO ,822

Approx. Chi-Square 3494,851 df 55

Sig. ,000

Comparadas as medidas de adequação da amostra (MSA), vê-se que, após a redução da amostra deste estudo, essa medida aumenta, acusando uma melhora do KMO de 0.802 para 0.822, o que vem reforçar a idéia de ser bastante adequado o emprego da análise fatorial no caso em estudo. Já o teste de esfericidade de Bartlett fornece um nível de significância (Sig.=0,000), que é inferior a 0,05, concluindo-se que as variáveis são correlacionáveis (rejeitando-se a hipótese nula). Com o MSA = 0.822, acreditamos que podemos prosseguir as análises dos resultados obtidos, com a segurança de que estamos com uma boa medida de adequação da amostra (ver quadro abaixo). A medida pode ser interpretada com as orientações apresentadas na Tabela 15.

Tabela 15: Valores de MSA Valor Adequação >= 0.80 admirável

Page 18: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 18

>= 0.70 < 0.80 mediano >= 0.60 < 0.70 medíocre >= 0.50 < 0.60 ruim < 0.50 inaceitável

Considerando as estreitas faixas da medida da adequação da amostra indicadas na tabela, mostra-se bastante relevante o salto qualitativo da amostra reduzida; bem como, no sentido contrário, revela-se ser a amostra abrangente (com maior número de municípios), um importante indicador da qualidade e consistência da base de dados do SNIS utilizada neste estudo. O Método da Análise dos Componentes Principais (ACP)

É importante observar que o principal objetivo da análise fatorial é reduzir o número de variáveis para explicar o fenômeno de interesse, além de gerar hipóteses por meio da análise exploratória dos dados. A análise fatorial não comprova, necessariamente, hipóteses. O que se busca é, em primeiro lugar, a recomendação ou não da aplicação do método em si; e, em segundo lugar, se o mesmo corresponde às predições possíveis a partir de um profundo conhecimento das questões em análise. Um trabalho inicial de prospecção como este deve ser submetido ao exame de especialistas com diferentes inserções no campo de conhecimento explorado aqui. CONSIDERAÇÕES GERAIS

1. A técnica da Análise Fatorial produz coeficientes de regressão (cargas fatoriais) que indicam a relação entre o fator e cada variável original. Adotamos as cores: verde para indicar as cargas mais significativas (>= 0.60); amarelo para aquelas importantes (>= 0.40 < 0.60); e ocre para aquelas ainda relevantes (>= 0.30 < 0.4), considerando o tamanho da amostra inicial de 860 municípios para os quais existem informações para cálculo dos indicadores selecionados na base de dados do SNIS, ano de referência 2005; e 316 municípios com mais de 50.000 habitantes na amostra reduzida. A partir disto, o primeiro passo da análise é um exame visual da matriz de correlação, quando se pode observar a significância das cargas de cada fator nas variáveis correspondentes. 2. Como já evidenciado na FASE III, a solução fatorial está indicando não haver uma correlação muito significativa entre os indicadores operacionais da água e os demais envolvidos na análise, quais sejam os de esgoto e as variáveis IDHM_RENDA, IDHM_LONGEVIDADE, IDHM_EDUCAÇÃO e MI_1000. Todavia, esse grupo de indicadores da água demonstra existir uma dimensão latente bem definida, com ênfase para a oposição que se revela nesta dimensão entre a micromedição (I10 – Índice de Micromedição Relativo ao Volume Disponibilizado) e o complexo de perdas (I13 – Índice de Perdas de Faturamento, I25 – Volume de Água Disponibilizado por Economia e I49 – Índice de Perdas na Distribuição). 3. Do exame visual da matriz de acima se pode ainda verificar que existe uma correlação significativa entre o grupo de indicadores operacionais de esgoto e o grupo de variáveis estrangeiras. Mas não deixa de ser notada uma curiosidade: o atendimento total de esgoto está relacionado com fatores representativos do IDHM, com ênfase para a componente IDHM_RENDA, com carga = 0.56, seguida pela componente IDHM_LONGE, com carga = 0.43, evidenciando a hipótese de carência de serviços pela população mais pobre, relacionando-a com a longevidade/salubridade. Encontra-se, todavia, em oposição, ou inversamente proporcional, à mortalidade infantil, como era de se esperar, com a significativa carga = - 0.40. 4. Observar como o grupo de indicadores operacionais de esgoto encontra-se em oposição ao complexo de perdas. Isto também é sintomático. Isto, em hipótese, poderia indicar a falta de capacidade de investimento decorrente do mal desempenho operacional? 5. Dentre as componentes do IDHM, a variável IDHM_RENDA é a que apresenta as maiores cargas para os fatores correspondentes aos indicadores de esgotamento sanitário do SNIS. Todavia, no conjunto das variáveis estudadas, seu fator mais importante é o representado pela componente IDHM_EDUCA, como era de se esperar.

Page 19: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 19

6. A longevidade, que pode estar relacionada com as condições de salubridade também, apresenta como principais fatores a renda, a educação, a mortalidade infantil (em oposição), e significativas cargas nos fatores correspondentes aos indicadores de esgotamento sanitário do SNIS. 7. A mortalidade infantil, por sua vez, apresenta-se em oposição às dimensões do IDHM e dos fatores correspondentes às condições de esgotamento sanitário do SNIS. Apresenta como seus principais fatores a educação e a renda, respectivamente, com implicância na longevidade, e com relevantes cargas dos fatores correspondentes aos indicadores de esgotamento sanitário do SNIS. 8. Mesmo no grupo de indicadores da água, que já apresentavam uma forte correlação, percebe-se um sensível aumento das cargas fatoriais quando da redução da amostra. 9. O atendimento total de esgoto mostra-se mais fortemente relacionado com os fatores representativos do IDHM e da MI – Mortalidade Infantil, para os municípios respondentes com mais de 50.000 habitantes. Para a componente IDHM_RENDA, a carga fatorial passa de 0.48 para 0.56; seguida pela componente IDHM_LONGE, que passa de 0.40 para 0.43; pela componente IDHM_EDUCA, que passa de 0.33 para 0.42; e pela componente MI_1000, que passa de -0.30 para -0.40. Observe-se que as maiores variações estão nos fatores da mortalidade, educação e renda respectivamente. Comunalidades da Amostra Reduzida

A soma em linha das cargas fatoriais ao quadrado resulta num número chamado comunalidade. A comunalidade mostra a quantia da variância em uma variável que é explicada pelos fatores extraídos juntos; isto é, o quanto da variância em uma dada variável é explicada pela solução fatorial. Quanto a isso, a variável que apresenta o maior salto na sua comunalidade após a redução da amostra, de 0.577 para 0.740, é a MI - mortalidade infantil; isto é, essa variável é melhor explicada pelos fatores em estudo nas cidades com mais de 50.000 habitantes, como pode ser observado na Tabela 16.

Tabela 16: Comunalidades

Inicial Extração I13 1,000 ,852 I10 1,000 ,869 I25 1,000 ,632 I49 1,000 ,786 I15 1,000 ,897 I24 1,000 ,962 I56 1,000 ,967 IDHM_RENDA 1,000 ,803 IDHM_LONGE 1,000 ,669 IDHM_EDUCA 1,000 ,829 MI_1000 1,000 ,740

Método de Extração: Análise do Componente Principal. Variância Total Explicada

Segundo o critério da raiz latente, somente autovalores > 1.0 são considerados na seleção de componentes para análise posterior. Assim, na solução fatorial apresentada abaixo, somente três componentes devem ser considerados. Na nossa matriz vemos que esses componentes explicam 82% da variância total do conjunto de variáveis, o que torna um dos nossos principais objetivos, que é a redução de dados, bastante plausível graças ao método escolhido. A Tabela 17 apresenta a variância total explicada e a Tabela 18 a matriz de componentes.

Page 20: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 20

Tabela 17: Variância Total Explicada Comp. Autovalores Iniciais Extração das SSL Rotação das SSL

Total

% da Variânci

a Cumulativ

o % Total

% da Variânci

a Cumulativ

o % Total

% da Variânci

a Cumulativ

o % 1 4,721 42,921 42,921 4,721 42,921 42,921 3,135 28,497 28,497 2 2,930 26,634 69,555 2,930 26,634 69,555 3,035 27,586 56,083 3 1,356 12,326 81,881 1,356 12,326 81,881 2,838 25,798 81,881 4 ,574 5,219 87,101 5 ,409 3,718 90,818 6 ,352 3,203 94,021 7 ,197 1,793 95,814 8 ,168 1,530 97,345 9 ,145 1,321 98,666 10 ,134 1,217 99,883 11 ,013 ,117 100,000

Extraction Method: Principal Component Analysis.

Tabela 18: Matriz de Componentes(a) Componentes

1 2 3 I13 -,427 ,813 ,100 I10 ,576 -,719 -,147 I25 -,320 ,698 ,207 I49 -,411 ,777 ,115 I15 ,773 ,165 ,522 I24 ,847 ,047 ,492 I56 ,868 ,079 ,454 IDHM_RENDA ,764 ,400 -,242 IDHM_LONGE ,655 ,325 -,367 IDHM_EDUCA ,658 ,489 -,395 MI_1000 -,648 -,349 ,446 Traço 42,921 26,634 12,326

Método de Extração: Análise do Componente Principal. 3 componentes extraídos.

Como já visto anteriormente, a importância de um fator é avaliada pela proporção da variância representada pelo fator após a rotação. A rotação favorece a análise dos componentes na medida em que revela as dimensões subjacentes da solução fatorial apresentada. Se nos permitimos anteriormente identificar essas dimensões, agora, com muito mais razão e propriedade, poderemos inclusive dar nomes aos fatores até aqui identificados por números. Esses fatores, evidentemente, estarão associados àquelas dimensões latentes que buscamos medir (3), como pode ser visto na Tabela 19.

Tabela 19: Matriz de Componentes Rotacionada (a)

Componentes

1 2 3 I13 ,914 ,038 -,124 I10 -,902 ,129 ,197 I25 ,795 -,014 ,015

Page 21: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 21

I49 ,880 ,021 -,106 I15 -,043 ,239 ,916 I24 -,185 ,251 ,930 I56 -,173 ,303 ,919 IDHM_RENDA -,011 ,818 ,366 IDHM_LONGE -,063 ,792 ,192 IDHM_EDUCA ,074 ,887 ,191 MI_1000 ,058 -,848 -,131

SSLs 3,135 3,035 2,838 % da Variância

28,497 27,586 25,798

Método de Extração: Análise do Componente Principal. Método de Rotação: Varimax com Normalização de Kaiser.

Rotação convergiu em 5 iterações.

A Análise dos Componentes

Da matriz de componentes rotacionada depreende-se um grande equilíbrio na proporção da variância representada por cada um dos três fatores em análise. Isto significa que esses fatores adquirem praticamente a mesma importância e juntos, parcimoniosamente, explicam aproximadamente 82% da variância total do conjunto de variáveis originais Essa parcimônia é de fundamental importância em nosso estudo, demonstrando equilíbrio dos fatores analisados. O Componente 1

Como tem sido observado desde os estudos preliminares, o componente 1 revela uma dimensão relativa ao abastecimento de água tratada, que poucas correlações tem demonstrado ter com as demais variáveis em estudo. Todavia, nessa dimensão, aparece uma forte correlação (inversa) entre I13 – Índice de Perdas de Faturamento e I10 – Índice de Micromedição Relativo ao Volume Disponibilizado. A hipótese que se levanta é a de que o aumento do Índice de Micromedição pode reduzir o Índice de Perdas de Faturamento. O Componente 2

O componente 2 revela-se claramente estar na dimensão social, alinhando, em oposição, o IDHM – Índice de Desenvolvimento Humano Municipal e MI – Mortalidade Infantil Estimada para os municípios. Todavia, diferente da dimensão da água, a dimensão social apresenta um entrelaçamento com a dimensão do esgoto, aqui representada pelo componente 3, com ênfase para o I56 – Índice de Atendimento Total de Esgoto Referido aos Municípios Atendidos com Água. O Componente 3

Na dimensão das condições de esgotamento sanitário, o componente 3, reciprocamente apresenta entrelaçamento com a dimensão social, com um evidente destaque para o fator renda. É importante observar que a análise fatorial não testa hipóteses, mas, permite formulá-las. Com isso, a Tabela 20 apresenta a matriz de transformação dos componentes.

Tabela 20: Matriz de Transformação dos Componentes Componente 1 2 3

1 -,404 ,634 ,660 2 ,884 ,456 ,103 3 ,235 -,625 ,744

Método de Extração: Análise do Componente Principal. Método de Rotação: Varimax com Normalização de Kaiser.

Page 22: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 22

FASE VI – ANÁLISE DOS ESCORES FATORIAIS PARA O ANO DE 2005

Procedemos a análise dos escores resultantes dos fatores principais. Para a obtenção dos estratos, utilizou-se a técnica chamada análise hierárquica de agrupamento, a qual agrupa casos relativamente homogêneos de uma determinada variável, no caso, os escores relativos aos fatores principais. Essa amostra de 316 municípios com mais de 50.000 habitantes, inclui 24(vinte e quatro) capitais, abrangendo uma população de 75.205.434 hab. A seguir uma análise sucinta do Fator 1. FATOR 1 – Dimensão do Desempenho dos Sistemas de Abastecimento de Água

Deve-se lembrar que, neste estudo, esse desempenho é medido ponderando apenas os Indicadores de Perdas de Faturamento, Perda na Distribuição, o Índice de Micromedição do Volume Disponibilizado e o Volume Disponibilizado por Economia. Péssimo: com relação às variáveis que compõem o Fator 1, e dentro da amostra reduzida para 316 municípios com mais de 50.000 hab, o Cluster 3 revela uma situação extrema: Índices de Perdas de Faturamento e de Perdas na Distribuição altíssimos; Índice de Micromedição do Volume Disponibilizado baixo; e um altíssimo Volume Disponibilizado por Economia. Realmente, sugere uma situação extrema de mal desempenho para um serviço tão essencial como é o abastecimento de água tratada. Naquele agrupamento a situação do baixo desempenho dos serviços de saneamento básico é agravada por índices muito baixos de coleta de esgotos, atendimento urbano de esgoto e atendimento total de esgoto. Como resultado, verificamos um alto índice de mortalidade infantil para cada 1.000 nascidos vivos. Ruim: na seqüência, e sempre lembrando que estamos trabalhando com uma amostra de 316 municípios com mais de 50.000 habitantes, aparece o Cluster 1. É bastante surpreendente que nesse agrupamento apareçam 3(três) capitais. Ali os indicadores de perdas de faturamento (I13) e na distribuição (I49) são altíssimos, comparáveis ao do caso extremo. Mas, como pode ser verificado, não se trata mais de pequenos municípios, mas de três capitais totalizando 870.130 hab. Observe-se os baixíssimos índices de micromedição sempre associados com altos índices de volume disponibilizado. Essa associação, hipoteticamente, aponta para um quadro de desperdício. Os indicadores de esgotamento sanitário neste grupo são muito baixos e assim, como não poderia deixar de ser, os indicadores de mortalidade infantil estão muito acima do desejável. Mediano: no caso do desempenho dos sistemas de abastecimento de água para a amostra em estudo, o Cluster 2 mostra um quadro bastante preocupante do saneamento brasileiro. Numa amostra de 316 municípios, são 133 neste agrupamento, correspondendo a 42% dos municípios em número; mas contendo 14(quatorze) das 24(vinte e quatro) capitais da amostra (58%); e 38.944.847 de habitantes, correspondendo a 52% da amostra em população. Esse agrupamento é maior que a soma de todos os outros, recebendo uma classificação apenas mediana. Os índices de perdas são muito elevados, os volumes micromedidos muito baixos para altos volumes disponibilizados. Bom: no Cluster 4 aparecem os municípios com desempenho de mediano para bom. É maior em termos do número de municípios em relação à amostra: 174 municípios, correspondendo a 55% da amostra. O Cluster 4, juntamente com o Cluster 2, é bastante representativo da situação do saneamento brasileiro. Sete grandes capitais estão ai incluídas. Neste agrupamento temos um total de 34.750.943 de habitantes, correspondendo a 46% da amostra. A passagem por esses agrupamentos mostra uma queda acentuada no indicador de mortalidade infantil, e um avanço bastante significativo dos indicadores de esgotamento sanitário. Dos piores desempenhos do Cluster 2 para os melhores do Cluster 4, deve-se notar, além da brutal melhora dos indicadores de perdas, esse grande salto qualitativo e quantitativo dos indicadores de esgotamento sanitário e da mortalidade infantil. Isto, inegavelmente, coloca a universalização do abastecimento de água tratada como uma condição indispensável para a consecução dos objetivos do milênio. Ótimo: de fato, neste Cluster 5 encontram-se situações bastante atípicas, infelizmente. Sabemos que índices de perdas negativos não existem, salvo como um efeito contábil. Tampouco, em sistemas reais, podem esses índices cair para números de 1(um) dígito, ou seja, menores que 10%. Mas, vale a pena observar neste grupo o alto índice de micromedição e o baixo volume disponibilizado por economia. A despeito disso, todavia,

Page 23: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 23

nota-se uma grande variância, ou mesmo disparidade, entre os indicadores de esgoto e de mortalidade infantil dentro do grupo. Por essa razão, consideramo-lo atípico. FATOR 2 - A Dimensão Social

Ao analisar o Fator 2, percebe-se uma clara associação entre pobreza (renda, longevidade e educação em baixa), altas taxas de mortalidade infantil e mal desempenho dos serviços de saneamento básico na maioria dos casos em análise. Devemos, todavia, lembrar que estamos trabalhando com uma amostra de 316 municípios. Péssimo: extremo do extremo, para nesse Cluster só aparece um município. Essa cidade se caracteriza em relação a extremos: extremo da pobreza, baixa expectativa de vida, pouca educação, mal desempenho dos serviços de saneamento básico, alto índice de mortalidade infantil. Não sendo uma cidade tão pequena, com seus 110.761 hab, torna-se uma má referência com relação aos indicadores analisados. Ruim: ainda como um reflexo das condições precárias nas três dimensões em análise, o Cluster 3, com 7(sete) cidades, é pequeno deveras. Entretanto, vem evidenciar os profundos diferenciais existentes no Brasil. Não podemos esquecer também que os municípios que fornecem informações para o SNIS – Sistema Nacional de Informações sobre Saneamento, o fazem por já terem esclarecimento sobre a importância desse diagnóstico. Inúmeros são os casos onde a falta desse esclarecimento acaba por ocultar situações ainda piores do que os casos dessa amostra. Esse Cluster totaliza 630.335 hab, correspondendo a 0.8% da população da amostra. Mediano: com 50 cidades, o Cluster 2 é o primeiro agrupamento representativo da amostra, com 16% do número de cidades e 6.579.271 hab, correspondendo a 8,7% da população da amostra. Neste grupo aparecem duas capitais. As cidades desse agrupamento, no geral, estão ainda muito longe das metas do milênio. Nessa dimensão social, mediano fica melhor traduzido como medíocre; pois, o diferencial a ser superado no caso da mortalidade infantil, só como exemplo, requer muito investimento e tempo para a consecução das metas. Deve-se observar que 47 dessas cidades, ou seja, 94% se encontram na região Norte-Nordeste do país. As cidades do Cluster 3 e Cluster 4 estão todas naquela região também. Bom: incomparavelmente maior que os outros, com 224 cidades, correspondendo a 71% da amostra em número, e com 58.792.771 hab, correspondendo a 78% da população da amostra, o Cluster 1 pode ser considerado como o perfil das cidades que fornecem informações para o SNIS. São cidades com um considerável grau de desenvolvimento humano, cidades que apresentam condições de saneamento básico de mediana para melhor, muitas das quais já se encontram próximas, ou até já atingiram, as metas do milênio nos setores em estudo. Uns totais de 24 capitais da amostra encontram-se neste Cluster. Ótimo: a dimensão social, das três dimensões em análise, é a única que apresenta um agrupamento consistente de cidades na condição de excelência. De fato, ao examinar o quadro, verificamos que ali estão cidades já muito conhecidas pela excelência de alguns indicadores. Mas, o que desejamos de fato enfatizar é que essas cidades, em relação à amostra em estudo, no geral, apresentam melhores desempenhos nas dimensões do saneamento básico e, consequentemente, baixos índices de mortalidade infantil, alta renda, alta expectativa de vida e alto grau de educação. O Cluster 5 tem 34 cidades, ou 10,7% da amostra em número, e 9.092.296 hab, correspondendo a 12% da amostra em população. FATOR 3 – Dimensão da Cobertura e Atendimento por Esgotamento Sanitário

Péssimo: a dimensão do esgotamento sanitário, neste estudo, exibe toda a sua complexidade. O Cluster 3, que apresenta os maiores déficits de coleta e atendimento por esgoto sanitário, agrupa cidades que vão de um extremo ao outro no que tange às outras dimensões em estudo, quais sejam as dimensões sociais e do atendimento com água tratada. O grupo abrange ainda tanto cidades pequenas, com pouco mais de 50.000 habitantes, quanto grandes cidades e aglomerações urbanas, incluindo uma capital do Norte e outra do Nordeste. Ao todo, são 73 cidades numa amostra de 316, 23% em número, e 13.433.254 hab, correspondendo a 18% da amostra. Nada desprezível considerando os péssimos dados sobre cobertura e atendimento. Ruim: O Cluster 1, que agrupa cidades em condições consideradas ruins de atendimento de esgoto,

Page 24: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 24

surpreende pelo grande contingente populacional ali. São 14.445.900 hab, correspondendo a 19% da amostra, que somados aos 18% encontrados em péssimas condições, perfazem nada mais nada menos que 37% da população da amostra. Neste agrupamento aparecem 5(cinco) capitais do Norte, 2(duas) do Nordeste, 1(uma do sul e 1(uma) do sudeste. Em que pese o bom desempenho de algumas cidades nas outras dimensões em análise, como é o caso da capital do sul e do sudeste; o fato é que o atendimento por esgotamento sanitário parece estar desatrelado das outras políticas concernentes à busca da universalização do atendimento com água tratada e de outras metas sociais como renda, educação e saúde pública. Mediano: Em condições medianas, ou até razoáveis, aparecem 5(cinco) capitais, 4(quatro) do nordeste e e uma do Centro-oeste. São apenas 48 cidades no Cluster 4, correspondendo a 15% da amostra em número, mas 13.188.701 hab, correspondendo a 17,5% da amostra em população. Bom: Muito representativo, o Cluster 2 traz as capitais 9 capitais, tendo pelo menos uma de cada região, além de muitas outras grandes cidades. São 113 cidades, ou 35,7% da amostra em número, totalizando 33.890.682 hab, ou 45% da amostra em população. Essas boas condições encontradas em parte significativa da amostra, deixa um grande desafio para as demais cidades brasileiras, demonstrando ser possível combinar o bom desempenho das dimensões em análise. Ótimo: Realmente, a situação apresentada por esta única cidade no Cluster 5, com apenas um município, é bastante atípíca. Apresenta-se abaixo um quadro resumo dos escores fatoriais atingidos pelos municípios na amostra. Essa amostra representa 316 municípios com suficiência de informações na base de dados do SNIS para o cálculo dos indicadores em análise, abrangendo uma população de 75.205.434 hab. para o ano de referência de 2005.

Tabela 21: Quadro Resumo dos Escores Fatoriais para o ano de 2005 FATOR 1

Dimensão Da Água

FATOR 2 Dimensão

Social

FATOR 3 Dimensão do Esgoto

População % População % População % Péssimo 80.169 0,1066 110.761 0,147278 13.433.254 17,86208 Ruim 870.130 1,157004 630.335 0,838151 14.445.900 19,20859 Mediano 38.944.847 51,78462 6.579.271 8,748398 13.188.701 17,5369 Bom 34.750.943 46,20802 58.792.771 78,17623 33.890.682 45,06414 Ótimo 559.345 0,743756 9.092.296 12,08995 246.897 0,328297

Totais 75.205.434 100,000 75.205.434 100,000 75.205.434 100,000 Municípios na Amostra

316

Alguns comentários serão tecidos aqui no sentido de reafirmar algumas teses já muito propaladas no âmbito do setor de saneamento brasileiro. Vejamos: 1. Quando consideradas as populações, há um viés da amostra para os municípios que apresentam condições sociais de medianas para cima, de acordo com as componentes do IDHM municipal, a MI – Mortalidade Infantil Estimada e cobertura dos serviços de Coleta de Lixo. Essas faixas, como pode ser visto em destaque no quadro resumo, correspondem a nada menos que 99,01 % da amostra em população. Essa dimensão não apresenta indicadores que possamos considerar atípicos. 2. Na dimensão do abastecimento de água tratada vemos um quadro não muito alentador se considerarmos que a amostra é formada por 316 municípios dom mais de 50.000 hab. Nesse caso 98,00 % da amostra em população apresenta condições medianas para boas, mas, observe-se, com viés para baixo. Evidentemente, isto diz respeito às variáveis aqui utilizadas para medida do desempenho dos serviços de abastecimento de água tratada. Nessa dimensão, quando olhamos o extremo oposto dos melhores desempenho, o que vemos é um quadro de desperdício denotado por baixos volumes micromedidos (I10), altíssimos índices de perdas de faturamento e na distribuição (I13 e I49), e altos volumes disponibilizados por economia (I25). Essa constatação pode ser verificada na tabela completa dos escores fatoriais.

Page 25: Análise exploratória dos indicadores do snis - sistema nacional de informações sobre saneamento

25º Congresso Brasileiro de Engenharia Sanitária e Ambiental

ABES – Associação Brasileira de Engenharia Sanitária e Ambiental 25

3. Temos falado reiteradamente, desde os primeiros estudos, sobre a complexidade da questão do esgotamento sanitário, já verificada para os dados do ano de 2000, 2005. Os dados confirmam haver descompasso das políticas de abastecimento de água tratada e de coleta, afastamento, tratamento e destinação dos esgotos sanitários. Embora as variáveis em estudo reflitam apenas a fase de coleta dos esgotos, consideramos pertinentes as análises feitas, uma vez que as demais fases dependem desta. Como vemos, 54,60% da amostra em população tem um atendimento entre mediano e péssimo, com uma incrível concentração de 37,07% entre ruim e péssimo. Considerando tratar-se de uma amostra de 316 municípios totalizando mais de 75 milhões de habitantes com base no censo do IBGE 2000, configura-se aqui um quadro bastante preocupante. BIBLIOGRAFIA

1. HAIR; Anderson; Tatham e Black - Análise Multivariada de Dados – Bookman – 2006 – 5ª. Edição. 2. TABACHNICK, B; Fidell, L.S. – Using Multivariate Statistics – Allyn and Bacon – 2001 – 4ª.

Edition. 3. URB-AL R9-A6-04 – Instrumentos de Articulação entre Planejamento Territorial e Orçamento

Participativo – Manual Metodológico – Março/2007.