(anexo 1 contribuições light ap 052 - 2007 - estudo f. gomide) · condição de sua nulidade, o...

19
Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná 1 GMD Organização Industrial e Engenharia COMENTÁRIOS SOBRE METODOLOGIA DE TRATAMENTO REGULATÓRIO PERDAS NÃO TÉCNICAS DE ENERGIA ELÉTRICA EXPOSTA NA NOTA TÉCNICA 348/2007-SER/ANEEL, DE 12 DE DEZEMBRO DE 2007 SEGUNDA VERSÃO FRANCISCO LUIZ SIBUT GOMIDE ABRIL DE 2008

Upload: others

Post on 17-Jun-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

1

GMD

Organização Industrial e Engenharia

COMENTÁRIOS SOBRE METODOLOGIA DE TRATAMENTO REGULATÓRIO

PERDAS NÃO TÉCNICAS DE ENERGIA ELÉTRICA

EXPOSTA NA NOTA TÉCNICA 348/2007-SER/ANEEL,

DE 12 DE DEZEMBRO DE 2007

SEGUNDA VERSÃO

FRANCISCO LUIZ SIBUT GOMIDE

ABRIL DE 2008

Page 2: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

2

GMD

Organização Industrial e Engenharia

RESUMO EXECUTIVO O estudo de regressão linear múltipla descrito no documento analisado merece críticas por pelo menos três razões: i) escolha da variável dependente “perdas globais” em vez de “perdas não técnicas”; ii) inclusão de variáveis pouco relevantes entre as variáveis “independentes”; e iii) desrespeito à modelagem conceitual subjacente ao estudo, seja pela adoção de hipóteses simplificadoras, seja pela imposição de condições específicas durante o processo de estimação dos coeficientes de regressão. A escolha inadequada da variável dependente levou à inclusão das chamadas “variáveis de controle” entre as variáveis “independentes”, o que por sua vez pode mascarar os efeitos das variáveis relevantes e, em particular, do termo independente da equação de regressão. Mudar a variável dependente para “perdas não técnicas” e abandonar pelo menos três variáveis irrelevantes (entre elas as “variáveis de controle”) podem melhorar os resultados, mas não muito. Isso porque falta entre as variáveis relevantes uma tal que, ao lado da relacionada ao conceito de violência, expresse o nível de desarranjo social decorrente da erosão de padrões e valores que ocorre na ampla maioria das áreas de concessão do país, de forma particularmente intensa em algumas delas. Também faz falta alguma variável que reflita características do consumo de energia elétrica, particularmente importante para explicar diferenças de empresa para empresa. Quanto ao processo de estimação dos coeficientes de regressão, independentemente dos problemas já apontados na especificação do modelo, é curioso – mas não surpreendente – que os resultados menos sofríveis correspondem ao método mais simples (Método dos Mínimos Quadrados Ordinário). O processo ao final adotado para a estimação dos coeficientes de regressão – Método dos Mínimos Quadrados Generalizado – opera uma transformação linear nos dados observados, com o objetivo de diagonalizar a matriz de covariância dos resíduos. Essa transformação – subtrair, de todos os dados, uma conveniente fração das respectivas médias temporais – depende de premissas referentes à estrutura de correlação entre as sucessivas observações efetuadas em uma mesma empresa. Além disso, assume-se a estacionariedade de todos os processos estocásticos intervenientes. Adicionalmente, a análise da Nota Técnica foi prejudicada pela imprecisão da linguagem utilizada no texto, pelas inconsistências na notação algébrica e pela omissão de informações importantes, onde poucos detalhes foram fornecidos. Por exemplo, não foi explicitado o valor estimado do termo independente da equação de regressão (que é negativo), dando a impressão de que, durante o processo de estimação dos coeficientes, teria sido imposta a condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de 2008, cerca de três meses depois da publicação da Nota Técnica, a ANEEL divulgou Nota de Esclarecimento, em que foram fornecidos detalhes e informações importantes quanto aos cálculos efetuados. Através da análise dos esclarecimentos disponibilizados, foi possível constatar enganos na base de dados utilizada ,

Page 3: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

3

GMD

Organização Industrial e Engenharia

além do fato de que os erros foram submetidos a um modelo auto-regressivo de primeira ordem, em desacordo com a descrição do modelo utilizado (Anexo II). INTRODUÇÃO O objetivo da Nota Técnica 348-SRE/ANEEL (de 12 de dezembro de 2007), é apresentar “a metodologia e os critérios a serem adotados pela ANEEL no cálculo do nível máximo de perdas não técnicas a serem admitidos para cada concessionária quando do reconhecimento, na revisão tarifária periódica, da quantidade de energia elétrica para o atendimento do seu mercado”. A criação de um estimador para “comparar as empresas de distribuição em relação ao nível de perdas não técnicas” é a essência da contribuição dessa Nota Técnica, cuja análise nos foi encomendada. Para a aplicação de Regressão Linear Múltipla, a Nota Técnica postula um modelo em que as perdas elétricas em cada área de concessão são função de uma combinação linear de “variáveis de controle” e de variáveis sócio-econômicas. A parcela dessa combinação linear que envolve apenas as variáveis sócio-econômicas é adotada como um “índice que possibilita comparar as empresas”. As “variáveis de controle” são duas, e têm a ver com proporções que expressam o peso dos mercados de baixa tensão e de consumidores livres, em cada área de concessão. As variáveis sócio-econômicas são cinco, e refletem, também para cada área de concessão, os níveis de violência, escolaridade, inadequação da infra-estrutura de abastecimento de água, pobreza, e concentração em regiões metropolitanas. As estimativas dos sete coeficientes de regressão estão apresentadas na Tabela 2 do texto da Nota Técnica. Na seqüência, a Tabela 3 mostra o “Índice Estimado por Área de Concessão”, obtido pela multiplicação dos cinco valores das variáveis sócio-econômicas, observados em cada empresa, no ano de 2005, pelos respectivos coeficientes. RESSALVAS IMPORTANTES A leitura dessa Nota Técnica não é fácil, pois à complexidade do tema somam-se a imprecisão da linguagem utilizada no texto e uma certa inconsistência na notação algébrica. A finalidade inicial dessa observação era justificar a possibilidade de que algo tivesse escapado à atenção do leitor, ou não tivesse sido compreendido, pois o fato desagradável é que não foi possível reproduzir, com as informações ambíguas da Nota Técnica, os 7 coeficientes de regressão apresentados na Tabela 2 do seu texto principal. Como exemplos de imprecisão e/ou inconsistência, vale listar: i) depois de algum tempo, percebe-se que “mercado cativo”, “mercado de venda” e “mercado total” são tratados como sinônimos; ii) mais algum tempo e percebe-se que “perdas de energia na distribuição” e “perdas globais” também são tratadas como sinônimos; iii) as equações 6 (do texto) e 1 (do Anexo II) pretendem representar o mesmíssimo modelo matemático; iv) no Anexo II há um grande número de erros tipográficos; v) a letra “i” é utilizada para identificar as empresas nas seis primeiras equações do texto, e a mesma letra “i” é aplicada, na sétima e última equação do texto, para indexar os estimadores dos coeficientes de regressão; vi) na utilização de notação matricial, nem sempre ficam claras as dimensões dos vetores e das matrizes.

Page 4: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

4

GMD

Organização Industrial e Engenharia

A análise dessa Nota Técnica também foi sobremaneira dificultada pelo fato de as linhas da última tabela do Anexo III estarem desordenadas em relação às linhas das demais tabelas de dados desse mesmo Anexo. A errata só foi produzida em fins de janeiro de 2008 e o desconforto com o tempo perdido na tentativa de reprodução da classificação final das empresas (apresentada na Tabela 3 do texto) só foi compensado pela impressão – graças a essa, enfim, reprodução – de que não haveria outros enganos nas demais tabelas. O MODELO A equação 6 do texto e a equação 1 do Anexo II, que expressam o modelo matemático adotado, podem ser re-escritas como segue (vamos chamá-la, daqui para a frente neste relatório, de “equação básica”): y(i,t)=�0(i)+ [x1(i,t)* �1]+ [x2(i,t)* �2]+...+ [x6(i,t)* �6]+ [x7(i,t)* �7]+ u(i,t)+ a(i) E aqui começam os problemas: para compatibilizar as equações – e a própria modelagem conceitual subjacente a elas – foi necessário substituir � (da equação 1 do Anexo II) por �0(i)= �0+�(i). A substituição de � por �0(i) implica em que um dos coeficientes de regressão passe a depender da empresa “i”. Os valores da variável dependente y e das variáveis, digamos, explicativas x1 a x7 estão nas oito tabelas do Anexo III, para cada empresa “i” (i variando de 1 a 58) e cada ano “t” (t variando de 1 a 5, correspondendo aos anos de 2001 a 2005). Os nomes dados pela Nota Técnica estão na tabulação seguinte, juntamente com as siglas aplicadas neste relatório. Ressalte-se que a variável x5, na verdade, corresponde ao complemento do valor tabelado. y Perdas Sobre Mercado de Venda ( %) PTMV x1 Proporção do Mercado de Baixa Tensão em Relação ao Mercado Total (%) BTMT x2 Proporção do Mercado Livre em Relação à Energia Injetada (%) MLEI x3 Óbitos por Agressão (por ano, por 100 mil habitantes) OBPA x4 Analfabetismo (%) ANLF x5 Domicílios sem Cobertura de Abastecimento de Água (%) SH2O x6 Proporção de Pobres (%) POBR x7 Proporção da População Residente em Região Metropolitana REVA A variável x7 era inicialmente chamada de PRRM, e teve seu nome mudado para REVA depois da revisão informada pelos autores referente à última tabela do Anexo III. Uma maneira de comparar a “equação básica” acima com a equação 6 do texto, seria entender que y = PG(i), e também que �0(i) = PT(i)+IG(i)+C(i), além de identificar u(i,t) e a(i) como ruídos (erros), que, aliás, não são explícitos na equação 6. Em palavras, para cada empresa “i”, o termo �0(i) estaria englobando as perdas técnicas PT(i) e parcelas das perdas não técnicas imputáveis à ineficiência gerencial IG(i) e a outros fatores não considerados na análise C(i). Outra interpretação seria que parte das peculiaridades de cada empresa – PT(i)

Page 5: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

5

GMD

Organização Industrial e Engenharia

em particular – estaria sendo “explicada” pelas variáveis de controle x1 e x2 e que outra parte dessas peculiaridades – na forma de desvio em relação a um valor �0, constante e universal - estaria sendo expressa pelo ruído (erro) a(i). Nesse caso, contribuindo para a falta de clareza da redação da Nota Técnica, as matrizes teriam tamanhos diferentes nas duas equações (equação 6 do texto e a equação 1 do Anexo II). De qualquer forma, �0 deveria ser positivo, para representar, no mínimo, o valor médio de IG(i)+C(i). O PROCESSO DE ESTIMAÇÃO DOS COEFICIENTES DE REGRESSÃO Para facilitar a nossa análise, e também para minimizar a chance de erros na manipulação dos dados, preferimos preencher as falhas de observação nas tabelas do Anexo III da Nota Técnica, de forma a trabalhar sempre com matrizes passíveis de partições em submatrizes de exatamente 5 linhas. É que, sem o preenchimento das falhas de observação, algumas submatrizes teriam 4, 3, 2 ou até mesmo apenas uma linha, demandando tempo, atenção e precisão sensivelmente maiores. Antes da divulgação da Nota de Esclarecimento, em 11/03/08, foram detalhadamente testadas seis abordagens diferentes para o processo de estimação dos coeficientes de regressão. As duas primeiras abordagens aplicavam o Método dos Mínimos Quadrados Ordinário - MQO, primeiro à totalidade das 260 conjuntos de observações (5 anos de perdas globais, de 2001 a 2005, observadas em 52 concessionárias) e, a seguir, às perdas médias no período de 2001 a 2005 (52 valores médios temporais, das perdas das 52 concessionárias). As outras quatro abordagens aplicavam o Método dos Mínimos Quadrados Generalizado - MQG, combinando duas formas diferentes de obter exatamente o mesmo resultado (aplicação direta das equações gerais ou aplicação do MQO a uma transformação dos dados observados, obtida pela subtração de uma conveniente fração das respectivas médias temporais) com duas premissas referentes ao termo independente da equação de regressão (conforme fosse impondo ou não a condição de sua nulidade). A razão para tantas abordagens era, além de ilustrar a sensibilidade dos resultados, tentar reproduzir os valores das estimativas dos sete coeficientes de regressão apresentados na Tabela 2 do texto da Nota Técnica. É que o Anexo II – Descrição do Modelo Econométrico Utilizado dava a impressão – errada - de que a aplicação das suas equações 6 e 7 teriam produzido essas estimativas. A Tabela abaixo apresenta o resumo comparativo dos resultados. O valor em vermelho destaca que o termo independente da equação de regressão da Nota Técnica só foi informado depois da divulgação pela ANEEL da Nota de Esclarecimento. É importante também informar que i) na aplicação do MQG, foi estimado em 95,82% o valor do coeficiente de correlação �, que definiria completamente a matriz da equação 7 do Anexo II (ver justificativa no Anexo “Memória” deste relatório); e que ii) na aplicação do MQOT – que vem a ser o equivalente do MQG baseado nos dados transformados pela subtração de parcela conveniente das respectivas médias temporais – o valor de � =0,90704 foi obtido mediante aplicação da fórmula apresentada no próprio Anexo 2 da Nota Técnica; e também que iii) na abordagem VI , o termo independente é, como tinha de ser, igual ao

Page 6: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

6

GMD

Organização Industrial e Engenharia

produto de (1-�) pelo termo independente obtido anteriormente, na abordagem III: 1,1551 = (1-0,90704) * 12,4184.

MÉTODO NT MQO MQO MQG MQOT MQG MQOT n (7+0) (7+1) (7+1) (7+1) (7+0) (7+0) (7+1) N 233? 260 52 260 260 260 260

Abordagem NT I II III IV V VI R 73,43% 76,68% 43,54% 31,51% 56,67% 35,05%

R^2 53,92% 58,80% 18,96% 9,93% 32,11 12,29% �0 -3,8253 -10,6175 -11,6062 12,4184 1,1551

BTMT �1 0,1310 0,1166 0,1129 -0,0305 0,1098 0,1098 -0,0305 MLEI �2 0,1260 0,1783 0,1777 0,1916 0,1370 0,1370 0,1916 OBPA �3 0,0850 0,2177 0,2340 0,0162 0,0368 0,0368 0,0162 ANLF �4 0,2470 -0,3162 -0,5297 -0,0973 0,0024 0,0024 -0,0973 SH2O �5 0,2170 0,2751 0,2637 0,1702 0,1935 0,1935 0,1702 POBR �6 0,0750 0,4178 0,5287 0,0624 0,0787 0,0787 0,0624 REVA �7 0,0770 0,0139 0,0094 0,0367 0,0860 0,0860 0,0367

Como já foi dito, para facilitar a nossa análise, preenchemos as falhas de observação dos dados publicados, antes de qualquer outra providência. Assumindo que os autores da Nota Técnica não preencheram as falhas de observação, alguma diferença nos resultados seria de se esperar. Os resultados mais próximos dos valores publicados na Nota Técnica correspondem às abordagens IV e V (que, aliás, são idênticas). No entanto, as diferenças entre as estimativas dos coeficientes de regressão que afetam as variáveis explicativas OBPA (violência é o conceito subjacente) e, principalmente, ANLF (baixa escolaridade), em que a diferença é enorme, são muito grandes, dificilmente explicáveis pela diferença de tamanho das amostras (260 com falhas preenchidas ou 233 sem preenchimento de falhas). É claro que é muito difícil justificar a imposição de nulidade do termo independente, adotada nas abordagens IV e V, uma vez que o desenvolvimento conceitual do modelo reserva para ele uma interpretação mais do que relevante: englobar senão também as perdas técnicas, pelo menos a média das parcelas das perdas não técnicas imputáveis à ineficiência gerencial e a “outros fatores não considerados na análise”. Além do mais, a decisão de anular o termo independente muda dramaticamente as estimativas dos coeficientes (comparar abordagens IV ou V com VI ou III). O fato é que com a divulgação da Nota Explicativa, verificou-se que a matriz X da equação 6 do Anexo II (fls 40 da Nota Técnica) tem, de fato, 8 colunas e não apenas 7. Há, portanto, sim, um termo independente. E ele é negativo. Cerca de -3,83%, registrado em vermelho na tabela acima. Verificou-se também que não foi aplicada a matriz da equação 7, pois que ela não incorpora a auto-regressividade dos erros. Por isso, nossas tentativas de reprodução dos resultados da Nota Técnica não poderiam mesmo ser bem sucedidas.

Page 7: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

7

GMD

Organização Industrial e Engenharia

Evidentemente, a estimação dos coeficientes da nossa equação básica pelo MQO (Abordagem I) não leva em consideração a correlação das observações de uma mesma empresa, ano após ano. Mesmo assim, confiantes na robustez do procedimento estatístico, apresentamos na figura abaixo, apenas para ilustração, os valores ajustados pela regressão, comparados com os valores observados das “perdas globais”.

A figura a seguir apresenta os resíduos em papel probabilístico normal.

As figuras e os resultados numéricos indicam que a especificação adotada não é adequada para os objetivos visados. A suspeita de inadequação decorre principalmente do fato de a estimativa de �0 ser negativa (-10,6175). Ora, segundo o modelo, �0 engloba, senão também as perdas técnicas, no mínimo o valor médio daquelas parcelas não explicadas das perdas não técnicas, e não poderia ser nem negativo nem nulo.

Page 8: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

8

GMD

Organização Industrial e Engenharia

Por oportuno, calculamos para todas as 52 empresas e todos os cinco anos, duas estatísticas: [x3(i,t)* �3]+ [x4(i,t)* �4]+ [x5(i,t)* �5]+ [x6(i,t)* �6]+ [x7(i,t)* �7] , que é precisamente a expressão da Nota Técnica para o “índice que possibilita comparar as empresas” e [x1(i,t)* �1]+ [x2(i,t)* �2]+ [x3(i,t)* �3]+ [x4(i,t)* �4]+ [x5(i,t)* �5]+ [x6(i,t)* �6]+ [x7(i,t)* �7] que é simplesmente a diferença entre o valor ajustado e a estimativa de �0. Neste relatório, essas estatísticas serão denominadas de “parcela critério” e “parcela do valor ajustado”, respectivamente. Assim, lembraremos que a primeira delas é o critério de classificação que a Nota Técnica sugere. E lembraremos também que a segunda delas, por ser chamada de parcela, deveria ser menor que o valor ajustado. Os resultados foram armazenados em tabelas cujas colunas mostram, respectivamente, os valores observados, os valores ajustados, os resíduos, as “parcelas do valor ajustado” e as “parcelas-critério”. As linhas foram organizadas em 52 conjuntos de 5 anos, um conjunto para cada empresa, na ordem das tabelas do Anexo III da Nota Técnica. Com o conjunto de valores dos sete coeficientes de regressão apresentados na Tabela 2 do texto da Nota Técnica, calculamos também a estatística “parcela do valor ajustado”, para comparar com as obtidas por MQO na abordagem I. Isso é mostrado na figura a seguir, que completa um conjunto de três gráficos ilustrativos para essa abordagem. Os mesmos três gráficos poderiam ser apresentados para cada uma das demais abordagens.

Ressalte-se que o gráfico comparativo de resultados mostra que, nos dois casos, a “parcela” é quase sempre maior que o “todo”. No primeiro caso, como já foi apontado, o termo independente é visível e embaraçosamente negativo, sugerindo fortemente a possibilidade de inadequação do modelo. No segundo caso, que corresponde aos resultados da Nota Técnica, chega-se à mesma conclusão, apesar de ser menos óbvia. Como já foi dito, os resultados mais próximos dos valores publicados na Nota Técnica correspondiam às abordagens IV e V (que, aliás, são idênticas) da primeira versão deste relatório. A abordagem IV trabalhou com uma transformação dos dados observados, obtida mediante a subtração de uma conveniente parcela das respectivas médias amostrais (parcela

Page 9: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

9

GMD

Organização Industrial e Engenharia

de 90,704%, uma vez que, como já foi dito, � =0,90704). Essa transformação, na verdade, diagonaliza a matriz de covariância dos resíduos, e autoriza a aplicação do MQO aos dados transformados (aqui chamado de MQOT). O Anexo “Memória’ deste relatório ilustra essa diagonalização, e enfatiza a impossibilidade de que � seja igual à unidade. A figura final apenas ilustra a nossa assertiva de que os resultados obtidos com a Abordagem IV são muito parecidos com os obtidos com os coeficientes de regressão publicados na Nota Técnica.

MODELO CONCEITUAL, ESPECIFICAÇÃO E PARCIMÔNIA Generalidades Antes da aplicação de técnicas estatísticas “multivariadas”, é importante que se postulem modelos conceitualmente consistentes e que, na seqüência, as características principais do modelo sejam respeitadas. Também é muito importante a análise prévia dos dados, inclusive selecionando métodos gráficos para examinar as características dos dados e das relações entre eles. É importante também que os dados sejam “trabalhados”, testando-se as hipóteses subjacentes às técnicas “multivariadas” que se pretende utilizar, inclusive para detectar a eventual necessidade de transformação (logarítmica, por exemplo) dos dados originais. Escolhido o modelo conceitual, o assunto mais problemático passa a ser a chamada “especificação”, sendo entendido por “erro de especificação” tanto a inclusão de variáveis irrelevantes para explicar o comportamento da variável dependente, como a não inclusão de variáveis relevantes. A não inclusão de variáveis relevantes limita a aplicabilidade dos resultados, na medida em que não se consegue explicar parte substancial da variância da variável dependente. A inclusão de variáveis irrelevantes introduz ruídos desnecessários na análise, e pode mascarar seriamente os efeitos das variáveis relevantes. O Princípio da Parcimônia sugere, como o próprio nome diz, que não se devem incluir muitas variáveis, pois isso aumenta o risco de variáveis irrelevantes serem consideradas. A inclusão

Page 10: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

10

GMD

Organização Industrial e Engenharia

de variáveis irrelevantes (ou marginalmente significantes) aumenta apenas aparentemente a qualidade do ajustamento à amostra, às expensas de tornar os resultados menos generalizáveis para o universo do qual a amostra foi obtida. Além disso, a inclusão de variáveis inconvenientes mascara os efeitos verdadeiros devido à “multicolinearidade”, ou seja, a existência de correlações entre cada par das variáveis explicativas. Análise dos Dados Utilizados A tabulação seguinte mostra os valores mínimos, máximos e médios de um conjunto de 260 observações (5 anos em cada uma das 52 empresas) de cada uma das oito variáveis (lembrando que as falhas de observação nas tabelas do Anexo III da Nota Técnica foram preenchidas, pelas razões já mencionadas). Os desvios-padrão também são mostrados. Y X1 X2 X3 X4 X5 X6 X7 Nome PTMV BTMT MLEI OBPA ANLF SH2O POBR REVA Mínimo 2,8 21 0 4 4 1 12 0 Máximo 57,3 80 42 61 31 53 69 100 Média 16,3877 55,7154 2,65 21,5885 11,3115 19,1654 32,0654 17,7419 Desv Pa 10,3515 12,4403 5,8670 13,1277 7,1178 10,0892 15,6863 26,7892 É interessante notar que os dados médios não satisfazem o modelo com os coeficientes estimados na Nota Técnica, isto é, 55,7154*0,131 + 2,65*0,126 + 21,5885*0,085 + 11,3115*0,247 + 19,1654*0,217 + 32,0654*0,075 +17,7419* 0,077 = 20,1915 é diferente de 16,3877. A diferença (-3,8038) já indicava a existência, omitida na Nota Técnica, de termo independente na equação de regressão. A tabulação seguinte mostra, para os mesmos dados, a matriz de correlação. É interessante notar, na primeira linha, que as perdas são razoavelmente correlacionadas com as variáveis correspondentes aos conceitos de “pobreza”, “deficiência de infra-estrutura”, “baixa escolaridade”, ficando a correlação com “violência” em um patamar inferior. As “variáveis de controle” e a variável “proporção da população residente em região metropolitana” apresentam correlações muito baixas com as perdas. Examinando a coluna X6, nota-se que a correlação entre “pobreza” e “baixa escolaridade” é muito alta, e que a correlação entre “pobreza” e “violência” é muito baixa. Em palavras, isso significa que, em um modelo de regressão linear que estabelecesse apenas duas variáveis explicativas, “violência” seria melhor candidata que “baixa escolaridade” para ser a segunda variável, ao lado de “pobreza”. É que “baixa escolaridade”, por ser altamente correlacionada com “pobreza”, traria pouca informação adicional (à já trazida por “pobreza”) sobre as perdas.

Page 11: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

11

GMD

Organização Industrial e Engenharia

Y X1 X2 X3 X4 X5 X6 X7 PTMV BTMT MLEI OBPA ANLF SH2O POBR REVA Y PTMV 1,0000 0,2105 -0,0055 0,3109 0,5150 0,5286 0,6162 0,1253 X1 BTMT 1,0000 -0,2211 -0,1442 0,0891 0,2444 0,1514 -0,2614 X2 MLEI 1,0000 0,1922 -0,1316 -0,2406 -0,1569 0,1839 X3 OBPA 1,0000 -0,0277 -0,0611 0,0436 0,5086 X4 ANLF 1,0000 0,5893 0,9236 -0,0529 X5 SH2O 1,0000 0,6277 -0,0513 X6 POBR 1,0000 -0,0487 X7 REVA 1,0000

Manipulando as informações aqui transcritas, é possível detectar (ver detalhes no Anexo “Memória” deste relatório) a contribuição adicional da “melhor terceira” variável explicativa, da “melhor quarta”, etc. O critério para medir essas contribuições adicionais é ligado ao conceito de “percentagem da variância explicada pela regressão”, que é a definição de “coeficiente de determinação” (D), também conhecido como o quadrado do coeficiente de correlação múltipla (R). A tabulação seguinte resume os resultados. R^2 Ganho Variáveis R 37,97% POBR 61,62% 8,08% 46,05% POBR & OBPA 67,86% 4,66% 50,71% POBR,OBPA & SH2O 71,21% 1,62% 52,33% POBR,OBPA,SH2O &BTMT 72,34% 0,87% 53,20% POBR,OBPA,SH2O,BTMT & MLEI 72,94% 0,63% 53,83% Todas menos REVA 73,37% 0,09% 53,92% Todas 73,43% Principais Objeções ao Estudo A utilização da “perda global” como variável dependente introduz desnecessariamente ruídos na análise. Não há razão para desconsiderar que as perdas técnicas podem ser calculadas pelas equações da Física, produzindo estimativas menos imprecisas que as desse estudo. O argumento de que os cálculos das perdas técnicas efetuados pelas empresas divergem dos da ANEEL é inaceitável, até porque a própria Nota Técnica informa que utilizará, sim, os seus cálculos, no tratamento regulatório subseqüente. Além disso, a ANEEL possui os dados informados pelas empresas para perdas técnicas.

Page 12: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

12

GMD

Organização Industrial e Engenharia

A escolha da variável dependente inadequada (soma das perdas técnicas e não técnicas, em vez de apenas perdas não técnicas) trouxe para dentro do modelo as inconvenientes “variáveis de controle”, no mínimo por serem elas correlacionadas com as perdas técnicas que estão embutidas nas perdas globais. Claramente, a existência de um “Mercado Livre” (energia para consumidores livres que é transportada pela rede da distribuidora) acarreta em perdas técnicas em MWh, mas não altera as perdas não técnicas em MWh. Em números adimensionais, quando se dividem as grandezas pelo tamanho do mercado cativo, em MWh, o raciocínio fica confuso porque o mercado livre pode, na maior parte dos casos, estar diminuindo o tamanho do mercado cativo. Assim, afeta-se o denominador das perdas percentuais, sem alterar-se absolutamente nada nas perdas não técnicas absolutas. As perdas não técnicas normalmente estão concentradas no mercado de baixa tensão, cuja fiscalização e controle é sempre mais difícil que nos demais mercados. Por outro lado, perdas técnicas sempre existem, em todos os mercados. Portanto, é de se esperar uma certa correlação entre perdas globais (em MWh) e o tamanho do mercado de baixa tensão (também em MWh). Dividir as duas grandezas pelo tamanho do mercado cativo, em MWh, para tornar os números adimensionais, não ajuda a aumentar a clareza da relação.. Cabe também registrar que o conceito de região metropolitana é vago demais para que se adote uma variável explicativa associada a ele. A propósito, a matriz de correlação indica que a variável x7 explica apenas cerca de 1,6 % da variância de Y. E marginalmente, como sétima variável incluída, x7 explica menos de 0,09%.da variância . A análise cuidadosa da matriz de correlação revela que i) “perdas” dependem de “pobreza” (62%), de “deficiência de infra-estrutura” (53%) e de “baixa escolaridade” (52%); ii) “perdas” dependem, mas não muito, de “violência” (31%); iii) “violência” não depende de “pobreza” (4%), de “deficiência de infra-estrutura” (6%) e de “baixa escolaridade” (3%); e iv) “pobreza” e “analfabetismo” são fortemente correlacionados. Na verdade, está faltando uma variável extremamente importante, que seja relacionada ao conceito de “anomia”. Definamos “anomia” (que vem do grego “ilegalidade”) como “desarranjo social causado pela erosão de padrões e valores”. Então, poderíamos dizer que i) “perdas” dependem de “pobreza”, de “deficiência de infra-estrutura”, de “baixa escolaridade” e de “anomia”; ii) “violência” não depende de “pobreza”, de “deficiência de infra-estrutura” e de “baixa escolaridade” mas depende de “anomia”. Assim, a correlação entre “perdas” e “violência” decorre da dependência que ambas têm de uma terceira variável, “anomia”. O desafio é encontrar a variável que expresse o conceito de “anomia”, da mesma forma que a variável x3 (“Óbitos por Agressão”) expressa o conceito de “violência”. As objeções relacionadas acima têm a ver, basicamente, com problemas de especificação e parcimônia: há variáveis demais, três são pouco relevantes, e falta uma variável claramente relevante. As demais objeções têm a ver com modelagem conceitual e métodos de estimação, e já foram comentadas exaustivamente em item anterior. Resumindo os comentários anteriores, postula-se um modelo conceitual como o da nossa equação básica, em que o termo independente tem uma interpretação sólida no mundo real:

Page 13: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

13

GMD

Organização Industrial e Engenharia

ele representa parcelas desconhecidas, porém reais, das perdas não técnicas específicas da empresa “i, talvez somadas às perdas técnicas também específicas da empresa “i”. Logo em seguida, trabalha-se com o valor médio desse termo independente, não mais específico da empresa “i”. Mais tarde, no processo de estimação dos coeficientes, não se impõe a condição de esse termo independente ser positivo. Além disso, o processo de estimação, que poderia ser baseado simplesmente nas médias temporais das variáveis observadas (teríamos matrizes de 52 linhas), pretende valorizar as 5 observações de cada empresa, uma para cada ano (passamos a ter matrizes de 260 linhas, digamos). Ocorre que o aumento do tamanho da amostra é ilusório, na medida em que a correlação entre as observações de uma mesma empresa é alta. O processo de estimação leva esse fato em consideração. Mas assim fazendo, altera dramaticamente o ajustamento do modelo aos dados observados. CONCLUSÕES E RECOMENDAÇÕES A parte inicial deste relatório analisou a sensibilidade dos estimadores em relação ao processo de estimação: foi aplicado duas vezes o método dos Mínimos Quadrados Ordinário (MQO) (com todos os dados: 260 óctuplas e apenas com as médias temporais: 52 óctuplas), e outras duas vezes foi aplicado o método dos Mínimos Quadrados Generalizado (MQG) (impondo ou não a condição de nulidade do termo independente). Os resultados obtidos com MQG foram replicados em abordagens que trabalham com os dados originais transformados pela subtração de conveniente parcela das respectivas médias temporais. Não foi possível reproduzir os valores dos 7 coeficientes de regressão apresentados na Nota Técnica. Hoje se sabe que, ao contrário do exposto na Nota Técnica, os coeficientes de regressão lá obtidos não resultaram da aplicação das equações 6 e 7. Hoje se sabe também que, ao contrário do que foi dito nas linhas seguintes à equação 1 do Anexo II, o processo de estimação utilizou o modelo auto-regressivo de primeira ordem (AR-1). Vale a pena repetir as linhas seguintes à equação 1 do Anexo II: “ ... A variável a(i) captura os fatores não observados. Note que seu valor difere entre os indivíduos, porém para uma determinada unidade de corte transversal, seu valor é fixo. O termo u(i,t) é chamado de erro idiossincrático em função de variar tanto em t quanto em i, e de possuir propriedades usuais (média zero, não auto-correlacionado, não correlacionado com x(i,t) e a(i)).” (Grifo nosso) No Anexo “Memória” deste relatório mostra-se quão diferente da equação 7 é a matriz de covariância realmente utilizada, para deixar bem claro que não é apenas uma questão de mais alguns erros tipográficos. Adicionalmente, é possível que os resultados da Nota Técnica tenham sido obtidos a partir de uma base de dados diferente da publicada no Anexo III da Nota Técnica. No Anexo “Dados” deste relatório comparam-se os dados do Anexo III (já implantada a primeira errata, de fins de janeiro de 2008, referente aos dados de Região Metropolitana) com os dados fornecidos através da Nota de Esclarecimento (quando várias outras informações e detalhes foram também revelados). Da relação de discrepâncias, pode-se notar que o percentual dos dados que apresentam algum tipo de erro é altíssimo: 6,75 %.

Page 14: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

14

GMD

Organização Industrial e Engenharia

A segunda parte deste relatório focou o modelo conceitual e seus problemas de especificação e de parcimônia, com vistas a sugerir alterações. Sugere-se que a variável dependente seja apenas “perdas técnicas” e não “perdas globais”. Quanto à especificação, recomenda-se um modelo mais parcimonioso, excluindo as “variáveis de controle”, a variável relacionada a “Região Metropolitana” e, talvez, até mesmo a variável relacionada a “baixa escolaridade”, por causa da sua alta correlação com “pobreza”. Idealmente, além das três variáveis relevantes remanescentes, deveríamos incluir uma ou duas novas variáveis explicativas, relacionadas ao conceito de “anomia”. “Favelização” e “honestidade” são candidatas óbvias. Variável adicional que reflita características do consumo de energia elétrica pode ser particularmente interessante para explicar diferenças importantes de empresa para empresa. É da maior importância que se esclareça que, apesar de o processo de estimação ter consumido a maior parte do tempo de análise dessa Nota Técnica (e o maior número de páginas deste relatório), nossas mais veementes objeções não estão nesse tópico, e sim, na questão da especificação. O processo de estimação foi mal explicado no texto, os procedimentos adotados são diferentes dos descritos, os dados foram manipulados de forma pouco cuidadosa, etc. Mas os erros de especificação foram muito mais graves e prejudicam o modelo preconizado de forma irreversível. É interessante ressaltar que qualquer ordenamento das empresas que resulte muito diferente do ordenamento que se obtém pelo critério óbvio de valor das perdas não técnicas realmente observadas será passível de questionamento, e indicativo de inadequação do modelo, seja ele qual for. Em outras palavras, o modelo ideal tem apenas “perdas não técnicas” à esquerda do sinal de igualdade, e variáveis tão relevantes à direita, explicando tamanha percentagem da variância da variável dependente, que o ordenamento só poderia resultar muito parecido com o que foi realmente observado. Evidentemente, se a esse modelo ideal fossem somadas, à esquerda, as “perdas técnicas”, e à direita, as “variáveis de controle” e outras variáveis irrelevantes ou marginalmente significantes, os resultados seriam empobrecidos. Curitiba, Abril de 2008 Francisco Luiz Sibut Gomide

Page 15: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

15

GMD

Organização Industrial e Engenharia

ANEXO: “MEMÓRIA” Nota sobre a matriz � (da equação geral do MQG) : inv(X´.inv�.X)(X´.inv�.Y) Listagem das 25 primeiras linhas e colunas da matriz �, de tamanho (260x260) 1 � � � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � 1 � � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � 1 � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � � 1 � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � � � 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 � � � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � 1 � � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � 1 � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � � 1 � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � � � 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 � � � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � 1 � � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � 1 � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � � 1 � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � � � 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 � � � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � 1 � � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � 1 � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � � 1 � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � � � 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 � � � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � 1 � � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � 1 � � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � � 1 � 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 � � � � 1 Nota sobre a variância da média de variáveis eqüi-correlacionadas Var (Ymed) / Var Y = [1/n ... 1/n]*[ (1- �) * I + � * J]* [1/n ... 1/n]´ = ( 1/n + � (n-1)/n) (na expressão acima, I é a matriz identidade e J, uma matriz formada apenas por unidades) Para Var(Ymed) = 103,57 e Var Y = 107,15 >>>103,57/107,15 = 0,2 + 0,8. � >>>� = 0,9582 (Com estimativas enviesadas para as variâncias amostrais, o resultado seria � = 0,9395) Nota sobre as propriedades da matriz M = (a-b)* I + b* J de tamanho (k por k), sendo I a matriz identidade e J uma matriz formada apenas por unidades

Page 16: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

16

GMD

Organização Industrial e Engenharia

A sua inversa é dada por invM = c * I + d * J , onde d = - b / [(a-b).(a+(k-1)b)] e onde c = 1/(a-b). Claramente, a inversa só existe se a � b e também se a � – (k-1).b. Aplicação: A subtração de fração da média temporal dos valores observados neste estudo equivale a multiplicar os vetores correspondentes por M, onde a = (1- � /k) e b = - � /k. A matriz de covariância dos dados transformados será M *�* M´, que terá a mesma estrutura que M. Para � =1, a = (1- 1/k) = (k-1)/k = - (k-1).(-1/k)= - (k-1).b e as matrizes não podem ser invertidas Para � � 1, as matrizes podem ser invertidas. Como � é arbitrário, é conveniente calcular o seu valor de forma a anular os termos fora da diagonal de M *�* M´, facilitando a inversão da matriz. Exemplo numérico: As matrizes apresentadas abaixo são, respectivamente: M (para � = 1 e k = 5), � (para � = 0,9582) e M *�* M´ 0,8 -0,2 -0,2 -0,2 -0,2 -0,2 0,8 -0,2 -0,2 -0,2 -0,2 -0,2 0,8 -0,2 -0,2 -0,2 -0,2 -0,2 0,8 -0,2 -0,2 -0,2 -0,2 -0,2 0,8 1 0,9582 0,9582 0,9582 0,9582 0,9582 1 0,9582 0,9582 0,9582 0,9582 0,9582 1 0,9582 0,9582 0,9582 0,9582 0,9582 1 0,9582 0,9582 0,9582 0,9582 0,9582 1 0,03344 -0,00836 -0,00836 -0,00836 -0,00836 -0,00836 0,03344 -0,00836 -0,00836 -0,00836 -0,00836 -0,00836 0,03344 -0,00836 -0,00836 -0,00836 -0,00836 -0,00836 0,03344 -0,00836 -0,00836 -0,00836 -0,00836 -0,00836 0,03344 A matriz acima não pode ser invertida, pois a = -(k-1).b, ou seja, 0,03344 = - 4.(0,00836). Ela é exatamente proporcional à Matriz M, em que 0,8 = -4.(-0,2). Na seqüência, as matrizes são uma nova M (para � = 0,90704 e k = 5), a mesma � (para � = 0,9582) e o produto M *�* M´ : 0,8186 -0,1814 -0,1814 -0,1814 -0,1814 -0,1814 0,8186 -0,1814 -0,1814 -0,1814

Page 17: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

17

GMD

Organização Industrial e Engenharia

-0,1814 -0,1814 0,8186 -0,1814 -0,1814 -0,1814 -0,1814 -0,1814 0,8186 -0,1814 -0,1814 -0,1814 -0,1814 -0,1814 0,8186 1 0,9582 0,9582 0,9582 0,9582 0,9582 1 0,9582 0,9582 0,9582 0,9582 0,9582 1 0,9582 0,9582 0,9582 0,9582 0,9582 1 0,9582 0,9582 0,9582 0,9582 0,9582 1 0,0418 0 0 0 0 0 0,0418 0 0 0 0 0 0,0418 0 0 0 0 0 0,0418 0 0 0 0 0 0,0418 Evidentemente, a matriz acima pode ser invertida. Nota sobre a Matriz de Covariância em distribuições probabilística condicionais Lembrete: Considerando a partição de um vetor aleatório (com variância V) em dois subvetores (com variâncias V11 e V22), sabe-se que a distribuição condicional da primeira partição do vetor, dados os valores do segundo, tem variância [V11-V12*invV22*V21] (expressão útil para selecionar a ordem de inclusão das variáveis no modelo, e também para investigar correlações condicionadas como na aplicação apresentada a seguir). Aplicação: Para a matriz de correlação V Y X4 X3 X5 X6 PTMV ANLF OBPA SH2O POBR Y PTMV 1,0000 0,5150 0,3109 0,5286 0,6162 X4 ANLF 0,5150 1,0000 -0,0277 0,5893 0,9236 X3 OBPA 0,3109 -0,0277 1,0000 -0,0611 0,0436 X5 SH2O 0,5286 0,5893 -0,0611 1,0000 0,6277 X6 POBR 0,6162 0,9236 0,0436 0,6277 1,0000 Identificando em amarelo as matrizes V11 (2x2) e V22 (3x3) e em cinza as matrizes V12(2x3) e V21(3x2), calcula-se a matriz de tamanho (2x2) [V11 – V12*invV22*V21]:

0,4929 -0,0358 -0,0358 0,1423

Verifica-se que a correlação entre “perdas” e “baixa escolaridade”, condicionada ao conhecimento dos valores dos níveis de “violência”, “deficiências de infra-estrutura” e “pobreza” é negativa, e igual a -13,5%: (-0,0358)/(0,4929*0,1423)^(1/2) = -0,1350.

Page 18: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

18

GMD

Organização Industrial e Engenharia

Nota sobre a Matriz de Covariância da Equação 7 do Anexo II Definindo a matriz auxiliar M, de tamanho (5x6) como um vetor coluna de tamanho 5 justaposto à esquerda da matriz identidade de tamanho 5, como segue... 1 1 0 0 0 0 1 0 1 0 0 0 1 0 0 1 0 0 1 0 0 0 1 0 1 0 0 0 0 1 ...então a matriz de covariância do vetor [a(i)+u(i,t)], de tamanho 5, é dada pela matriz de tamanho (5x5) M*V*M´, onde V é uma matriz de tamanho (6x6) cuja primeira linha e primeira coluna é formada por zeros, com exceção de V(1,1) (que é a variância de a(i)) e cujas demais linhas e colunas formam a matriz de covariância de resíduos auto-regressivos de primeira ordem. A seguir representa-se a matriz V, onde V(u,u) é a variância de u(i,t) e r é o coeficiente de auto-correlação: V(a,a) 0 0 0 0 0 0 V(u,u) V(u,u)*r V(u,u)*r^2 V(u,u)*r^3 V(u,u)*r^4 0 V(u,u)*r V(u,u) V(u,u)*r V(u,u)*r^2 V(u,u)*r^3 0 V(u,u)*r^2 V(u,u)*r V(u,u) V(u,u)*r V(u,u)*r^2 0 V(u,u)*r^3 V(u,u)*r^2 V(u,u)*r V(u,u) V(u,u)*r 0 V(u,u)*r^4 V(u,u)*r^3 V(u,u)*r^2 V(u,u)*r V(u,u) A seguir representa-se a matriz M*V*M´:

V(a,a)+V(u,u) V(a,a)+V(u,u)*r V(a,a)+V(u,u)*r^2 V(a,a)+V(u,u)*r^3 V(a,a)+V(u,u)*r^4 V(a,a)+V(u,u)*r V(a,a)+V(u,u) V(a,a)+V(u,u)*r V(a,a)+V(u,u)*r^2 V(a,a)+V(u,u)*r^3 V(a,a)+V(u,u)*r^2 V(a,a)+V(u,u)*r V(a,a)+V(u,u) V(a,a)+V(u,u)*r V(a,a)+V(u,u)*r^2 V(a,a)+V(u,u)*r^3 V(a,a)+V(u,u)*r^2 V(a,a)+V(u,u)*r V(a,a)+V(u,u) V(a,a)+V(u,u)*r V(a,a)+V(u,u)*r^4 V(a,a)+V(u,u)*r^3 V(a,a)+V(u,u)*r^2 V(a,a)+V(u,u)*r V(a,a)+V(u,u)

Evidentemente, apenas para o caso r = o a matriz seria igual à da Equação 7 do Anexo II: V(a,a)+V(u,u) V(a,a) V(a,a) V(a,a) V(a,a) V(a,a) V(a,a)+V(u,u) V(a,a) V(a,a) V(a,a) V(a,a) V(a,a) V(a,a)+V(u,u) V(a,a) V(a,a) V(a,a) V(a,a) V(a,a) V(a,a)+V(u,u) V(a,a) V(a,a) V(a,a) V(a,a) V(a,a) V(a,a)+V(u,u)

Page 19: (ANEXO 1 Contribuições Light AP 052 - 2007 - Estudo F. Gomide) · condição de sua nulidade, o que contradiria a arquitetura do modelo conceitual. Finalmente, em 12 de março de

Rua XV de Novembro, 556 – Cj 404 CEP 80.020-924 – Curitiba – Paraná

19

GMD

Organização Industrial e Engenharia

ANEXO: “DADOS” Empresa número... Empresa número... Divergências Variável Afetada

(Anexo III) (Dados em Painel)

07 07 5 RM 11 11 5 RM 12 12 5 RM 13 13 5 RM 16 16 5 RM 17 17 1 MLEI 18 ? 40 Todas 22 20 1 MLEI 23 21 40 Todas 24 26 5 RM 28 29 6 PTMV & RM 34 37 5 RM 41 43 3 PTMV 49 48 4 PTMV & OBPA 51 49 5 RM

Foram encontradas 135 divergências em cerca de 2000 valores, ou seja, em 6,75% dos dados utilizados. Não se consideram divergências, por exemplo, o fato de todos os dados de “SH2O” de 2002 e 2003 serem idênticos. Também não foram consideradas na contagem as divergências que motivaram a primeira errata, anunciada em fins de Janeiro de 2008.