matriz de covariâncias dos erros de previsão aplicada ao ... · niente do sistema de...

14
Matriz de Covariâncias dos Erros de Previsão Aplicada ao Sistema de Assimilação de Dados Global do CPTEC: Experimentos com Observação Única Carlos Frederico Bastarz 1 , Dirceu Luis Herdies 1 , Luiz Fernando Sapucci 1 1 Divisão de Modelagem e Desenvolvimento, Centro de Previsão de Tempo e Estudos Climáticos, Instituto Nacional de Pesquisas Espaciais, São José dos Campos, SP, Brasil Recebido em 22 de Setembro de 2016 – Aceito em 17 de Abril de 2017 Resumo A matriz de covariâncias dos erros de previsão representa uma importante componente de um sistema de assimilação de dados. Pode-se mostrar matematicamente que os incrementos de análise são diretamente proporcionais à matriz de covariâncias. Considerando-se este resultado, é correto afirmar que a habilidade de um sistema de assimilação de dados está diretamente relacionada às características da matriz de covariâncias, sejam elas representadas por comprimentos de escala horizontais e verticais e amplitudes (desvios-padrão e variâncias). Se o sistema de assimilação de dados utiliza as observações para corrigir as previsões do modelo, ponderando-se os erros das observações e previsões, então o uso de uma matriz de covariâncias não ajustada pode impactar de forma significativa o processo de assimilação de dados. No CPTEC, tem-se investido esforços para o ajuste da matriz de covariâncias utilizada na assimilação de dados. Neste trabalho é feita, portanto, uma discussão conceitual da matriz de covariâncias, expressando a sua importância e a forma como é aplicada em um sistema operacional. Além disso, é apresentada uma caracterização quantitativa e qualitativa dessa matriz para o modelo de circulação geral da atmosfera do CPTEC, e quais são as características resultantes dos incrementos de análise produzidos no sistema GSI utilizado pelo centro. Palavras-chave: matriz de covariâncias dos erros de previsão, assimilação de dados, previsão numérica do tempo. Background Error Covariance Matrix Applied to the Global Data Assimilation System at CPTEC: Single Observation Experiments Abstract The background error covariance matrix represents a key component of a data assimilation system. It can be shown mathematically that the analysis increments are directly proportional to the covariance matrix. As a result it is correct to state that the performance of a data assimilation system is related to the characteristics of the covariance matrix, in terms of: horizontal and vertical length scales, standard deviations and variances. Considering the information that the data as- similation system uses the observations to correct the model forecasts weighting the model and observations errors, thus the use of an unadjusted covariance matrix can impact the resulting analysis at a great level. At CPTEC efforts has been made in order to adjust the covariance matrix for its application at the operations. In this work it is presented a conceptual overview on the subject, enlightening the importance of the background error covariance matrix and how it is treated in an operational data assimilation system. Furthermore, it is also made a quantitative and qualitative characterization of the background error covariance matrix calculated using the CPTEC global forecast model and the differences in the re- sulting analysis increments. Keywords: background error covariance matrix, data assimilation, numerical weather prediction. 1. Introdução Assimilação de Dados é uma técnica fundamentada em métodos de estimação e otimização. Estes métodos são utilizados para realizar a tarefa de controlar um sistema dinâmico (como um modelo numérico da atmosfera terres- tre) na presença de incertezas Stengel, (1994). Muitas vezes tais incertezas não podem ser diretamente inferidas e é Revista Brasileira de Meteorologia, v. 32, n. 3, 459-472, 2017 rbmet.org.br DOI: http://dx.doi.org/10.1590/0102-77863230012 Artigo Autor de correspondência: Carlos Frederico Bastarz, [email protected].

Upload: dotuyen

Post on 16-Dec-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

Matriz de Covariâncias dos Erros de Previsão Aplicadaao Sistema de Assimilação de Dados Global do CPTEC:

Experimentos com Observação Única

Carlos Frederico Bastarz1, Dirceu Luis Herdies1, Luiz Fernando Sapucci1

1Divisão de Modelagem e Desenvolvimento, Centro de Previsão de Tempo e Estudos

Climáticos, Instituto Nacional de Pesquisas Espaciais, São José dos Campos, SP, Brasil

Recebido em 22 de Setembro de 2016 – Aceito em 17 de Abril de 2017

Resumo

A matriz de covariâncias dos erros de previsão representa uma importante componente de um sistema de assimilação dedados. Pode-se mostrar matematicamente que os incrementos de análise são diretamente proporcionais à matriz decovariâncias. Considerando-se este resultado, é correto afirmar que a habilidade de um sistema de assimilação de dadosestá diretamente relacionada às características da matriz de covariâncias, sejam elas representadas por comprimentos deescala horizontais e verticais e amplitudes (desvios-padrão e variâncias). Se o sistema de assimilação de dados utiliza asobservações para corrigir as previsões do modelo, ponderando-se os erros das observações e previsões, então o uso deuma matriz de covariâncias não ajustada pode impactar de forma significativa o processo de assimilação de dados. NoCPTEC, tem-se investido esforços para o ajuste da matriz de covariâncias utilizada na assimilação de dados. Nestetrabalho é feita, portanto, uma discussão conceitual da matriz de covariâncias, expressando a sua importância e a formacomo é aplicada em um sistema operacional. Além disso, é apresentada uma caracterização quantitativa e qualitativadessa matriz para o modelo de circulação geral da atmosfera do CPTEC, e quais são as características resultantes dosincrementos de análise produzidos no sistema GSI utilizado pelo centro.Palavras-chave: matriz de covariâncias dos erros de previsão, assimilação de dados, previsão numérica do tempo.

Background Error Covariance Matrix Applied to the Global DataAssimilation System at CPTEC: Single Observation Experiments

Abstract

The background error covariance matrix represents a key component of a data assimilation system. It can be shownmathematically that the analysis increments are directly proportional to the covariance matrix. As a result it is correct tostate that the performance of a data assimilation system is related to the characteristics of the covariance matrix, in termsof: horizontal and vertical length scales, standard deviations and variances. Considering the information that the data as-similation system uses the observations to correct the model forecasts weighting the model and observations errors, thusthe use of an unadjusted covariance matrix can impact the resulting analysis at a great level. At CPTEC efforts has beenmade in order to adjust the covariance matrix for its application at the operations. In this work it is presented a conceptualoverview on the subject, enlightening the importance of the background error covariance matrix and how it is treated inan operational data assimilation system. Furthermore, it is also made a quantitative and qualitative characterization ofthe background error covariance matrix calculated using the CPTEC global forecast model and the differences in the re-sulting analysis increments.Keywords: background error covariance matrix, data assimilation, numerical weather prediction.

1. Introdução

Assimilação de Dados é uma técnica fundamentadaem métodos de estimação e otimização. Estes métodos são

utilizados para realizar a tarefa de controlar um sistemadinâmico (como um modelo numérico da atmosfera terres-tre) na presença de incertezas Stengel, (1994). Muitas vezestais incertezas não podem ser diretamente inferidas e é

Revista Brasileira de Meteorologia, v. 32, n. 3, 459-472, 2017 rbmet.org.brDOI: http://dx.doi.org/10.1590/0102-77863230012

Artigo

Autor de correspondência: Carlos Frederico Bastarz, [email protected].

comum assumir uma determinada distribuição estatísticapara os erros (eg., Gaussiana) para a sua aplicação nos maisvariados problemas que podem ser tratados utilizando essesmétodos. Nesse processo, estão presentes duas principaisfontes de incertezas: a confiança atribuída para as obser-vações na correção das previsões de um modelo; e a parceladas informações fornecidas por esse modelo e que devemser preservadas na solução final. A primeira fonte de incer-tezas é tratada no que convencionalmente chama-se dematriz de covariância dos erros das observações (geral-mente referenciada como matriz R, e.g., Ide et al. (1997). Aincerteza do modelo é tratada, portanto, na matriz de cova-riância dos erros de previsão ou modelagem (geralmentereferenciada como matriz B) e é uma das principais - se nãodizer, a mais importante componente de um sistema deassimilação de dados. Em sistemas variacionais e sequen-ciais, estas duas componentes são relacionadas por umaequação matemática onde são ponderadas as contribuiçõesdas observações e do modelo no cálculo das inovaçõestrazidas pelas observações e dos incrementos de análisecalculados.

Sistemas de assimilação de dados utilizam obser-vações que são distribuídas de forma irregular no tempo eno espaço para corrigir/atualizar um estado da atmosferapreviamente simulado por um modelo de Previsão Numé-rica de Tempo (PNT). Este estado atmosférico é tambémchamado de previsão de curto prazo e além de ser utilizadonesse processo de atualização com as observações, eleserve também para complementar parte das informaçõesque são trazidas pelas observações. Então, para que sejapossível realizar algum tipo de operação matemática entre aprevisão do modelo e as observações, ambas as infor-mações devem estar sob o mesmo domínio, de forma que ainovação (i.e., a contribuição trazida pelas observações aocampo representado pela previsão de curto prazo) possa sercalculada. Desta forma, a previsão de curto prazo é umaimportante fonte de informações quando observações indi-retas da atmosfera são utilizadas, pois este tipo de infor-mação requer a construção de operadores não lineares osquais dependem da informação representada pela previsãode curto prazo (Daley, 1993; Bannister, 2008).

Técnicas variacionais de assimilação de dados sãobastante populares nos centros operacionais de PNT. Em-bora estes centros estejam migrando suas suítes operacio-nais para sistemas que utilizam algum tipo de técnica porconjunto (eg., um conjunto de realizações dos sistemas3DVar ou 4DVar; um conjunto de realizações do sistemaFiltro de Kalman ou uma combinação de ambos), os siste-mas variacionais apresentam a vantagem do fácil tratamen-to das observações e dos seus operadores, além de permitiro controle de soluções numéricas artificiais como a umida-de negativa (proveniente do modelo de previsão, eg., Rasche Williamson, 1991) e a umidade supersaturada (prove-niente do sistema de assimilação de dados, eg., Dee e daSilva, 2003). Além disso, para que seja possível o adequado

tratamento do uso das informações da previsão de curtoprazo e das observações, é necessário o uso de matrizes decovariâncias de erros associadas à representação dessasquantidades. Este artigo trata do problema da representaçãodos erros associados à modelagem, através da matriz decovariâncias dos erros de previsão (matriz B).

Covariâncias dos erros de previsão representados namatriz B, tem a importante propriedade de contabilizar acontribuição das quantidades observadas correspondentesao modelo interpoladas no ponto das observações, e comoelas serão transformadas em incrementos de análise e espa-lhadas nas direções horizontal e vertical. Estas proprie-dades são atingidas através de estruturas específicas quemodulam a forma como o incremento de análise é aplicado.Nesse contexto, montar uma matriz e covariâncias com-pleta considerando todas as variáveis de estado e todos osgraus de liberdade associados (eg., número de pontos degrade, níveis verticais etc), resultaria em uma matriz im-possível de ser armazenada. Consequentemente, há anecessidade de se modelar ou parametrizar as quantidadesde interesse de forma que a representação e a aplicação dascovariâncias da matriz B possam ser feitas. Uma formabastante comum de se parametrizar as covariâncias é expri-mi-las por meio de variâncias e correlações. No caso es-calar, a correlação representa a razão entre a covariância deduas quantidades escalares e as variâncias de cada umadessas quantidades. Com efeito, sendo a matriz B umamatriz de covariâncias, ela pode ser representada em ter-mos destas quantidades. Esta decomposição é um tipo deparametrização e ajuda a amenizar o problema da repre-sentação de uma matriz muito grande, permitindo tambémque termos extras sejam inclusos com o objetivo de querelações físicas desejáveis como o balanço geostrófico se-jam respeitadas e as variações diárias do fluxo atmosféricoou os “erros do dia” Kalnay et al. (1997), sejam - em algumgrau, representadas.

No CPTEC, desde o início das operações em assimi-lação de dados com o sistema Gridpoint Statistical Interpo-

lation (GSI, Wu et al., 2002; Kleist et al., 2009) utilizandoo 3DVar como esquema de assimilação de dados, foi utili-zada uma matriz de covariâncias calculada com base nomodelo Global Forecast System (GFS), e um esforço temsido feito para a obtenção de uma nova matriz de cova-riâncias específica para o Brazilian Atmospheric ModelCPTEC/INPE (BAM-CPTEC/INPE, Figueroa et al.,2016). Com o objetivo de verificar quais as principais dife-renças entre as duas matrizes (a matriz original calculadacom base no modelo GFS e aquela calculada com base nomodelo BAM-CPTEC/INPE), este artigo apresenta a meto-dologia empregada no cálculo, as estruturas da matriz cal-culada, as diferenças principais e o incremento de análiseresultante através da assimilação de uma única observação.

O artigo está organizado da seguinte forma: na Se-ção 2 são apresentados os materiais e métodos utilizados na

460 Bastarz et al.

pesquisa. Na Seção 3, os resultados e a discussão e naSeção 4, as conclusões.

2. Materiais e Métodos

2.1. Sistema G3DVAR

G3DVAR é o nome dado ao acoplamento entre aversão tridimensional do sistema de assimilação de dadosGSI (Wu et al., 2002; Kleist et al., 2009) e o modeloatmosférico BAM-CPTEC/INPE (Figueroa et al., 2016).Este sistema esteve em operação no CPTEC entre Janeirode 2013 e Dezembro de 2015. As análises do sistema eramgeradas em uma grade tridimensional de 900 x 450 x 64pontos e depois eram pré-processadas onde as quantidadesanalisadas eram decompostas em coeficientes espectraiscom truncamento na onda zonal de número 299 e 64 níveissigma na vertical (TQ0299L064, com ~45 km de resoluçãohorizontal próximo à linha do Equador). Apesar das aná-lises serem escritas em uma grade correspondente à gradeda previsão pós-processada do modelo, a matriz de cova-riâncias utilizada proveniente do modelo GFS do NCEP,era discretizada em uma grade de 768 x 386 pontos e 64níveis na vertical. Esta foi uma limitação imposta ao siste-ma e que impedia alteração da resolução horizontal e limi-tava as análises em 64 níveis verticais. Um dos requeri-mentos do GSI é que a análise seja calculada com asmesmas dimensões de grade que a matriz de covariâncias.Isso se faz necessário porque o cálculo do incremento deanálise depende da matriz de covariâncias, como será mos-trado mais adiante. A solução para esta limitação é o cál-culo de uma matriz de covariâncias utilizando os pares deprevisões do modelo de interesse e com as dimensõescorretas para a grade na qual as análises serão calculadas.

Nas seções a seguir, são apresentados os detalhes dascomponentes do sistema G3DVAR.

2.2. Modelo atmosférico brasileiro do CPTEC/INPE

O Modelo Atmosférico Brasileiro do CPTEC/INPE(o Brazilian Atmospheric Model - BAM-CPTEC/INPE)utilizado neste trabalho é a inicial de lançamento em Ja-neiro de 2016 (versão 0.0). Embora esta não seja umaversão mais atualizada do modelo, alguns detalhes sobre ascaracterísticas principais podem ser obtidos em Kubota

(2012) e mais recentemente em Figueroa et al. (2016), ondeestão descritos com mais detalhes as opções de dinâmica efísica do modelo. Esta versão, embora não tenha sido parteintegrante da versão 1.1.3 do sistema G3DVAR, asseme-lha-se a versão operacional utilizada no G3DVAR pelasopções escolhidas em sua configuração. As principaisopções dos pacotes de dinâmica e física do modelo numé-rico utilizado, estão sumarizadas na Tabela 1.

2.3. Gridpoint Statistical Interpolation - GSI

Na assimilação tridimensional variacional (3DVar),assume-se que a distribuição dos erros de modelagem éGaussiana, ou seja, assume-se que média da distribuiçãodos erros das variáveis de estado seja zero e que o desviopadrão é característico do erro da observação analisada.Esta é a suposição mais largamente utilizada a sua especi-ficação é fundamental para o sucesso do processo de assi-milação de dados variacional (Lorenc, 1986).

No sistema 3DVar do GSI, a função custo repre-sentada (de forma simplificada) pela Eq. (1):

J x x x x x

y x y x

b b( ) ( ) ( )

( ) ( )

� � �

� � �

1

21

2

1

1

T

T

B

H R H

(1)

onde x é o vetor de estado a ser analisado (dimensão: n x 1);xb é o vetor de estado previsto (n x 1); x - xb é o vetorincremento de análise (n x 1); B é a matriz de covariânciasdos erros de previsão (n x n); y é o vetor de estado obser-vado (p x 1); y - Hx é o vetor inovação ou incremento deobservação (p x n); H é o operador observação (responsávelpor interpolar as variáveis de estado para os respectivospontos de observação); R é a matriz de covariâncias doserros de observação (p x p).

A função custo representada pela Eq. (1) é quadráticae o resultado da sua minimização iterativa pode ser inter-pretada como uma medida da redução da distância geomé-trica entre a posição da variável de controle (i.e., a variávelem torno da qual é realizada a minimização da funçãocusto) e o ponto de mínimo global da função.

A análise 3DVar calculada pelo GSI está represen-tada na Eq. (2). A análise é calculada a partir do mínimo da

Matriz de Covariâncias dos Erros de Previsão Aplicada ao Sistema de Assimilação de Dados Global do CPTEC 461

Tabela 1 - Principais opções e configurações do BAM-CPTEC/INPE utilizado nos experimentos propostos.

Dinâmica Física

Resolução TQ0299L064 Radiação de Onda Longa Harshvardhan

Passo de Integração 200 segundos Radiação de Onda Curta Clirad

Transporte (vento) Euleriano Convec. Prof./Fech. Grell

Transporte (massa) Semi-Lagrangeano Convecção Rasa Tiedke

Inicialização Diabática Topo da Camada Limite Holstlag e Boville

Restart Superfície Base da Camada Limite Mellor e Yamada

Conservação de Massa ln(p) Modelo de Superfície SSiB

função custo representada pela Eq. (1), quando �J = 0implicando em x = xa.

x x y Hxa b b� � � �� � � �( ) [( )( )]B H R H H R1 1 1 1T T (2)

Na Eq. (2) tem-se que o estado da análise xa é igual aoestado da previsão de curto prazo (doravante denominadobackground para indicar que esta previsão não é apenas um“chute inicial”, mas também a informação do fluxo atmos-férico utilizada na correção cíclica com as observações) xb

mais a contribuição da inovação trazida pelas observações(y - Hxb), ponderado pela razão entre as matrizes de cova-riâncias dos erros de observação (R) e modelagem (B). Apresença da matriz HT aplicada em R, indica que as ope-rações com as matrizes são realizadas em ponto de grade,i.e., R-1 é interpolada para o espaço do modelo.

Tipicamente, em aplicações globais, o GSI analisa asseguintes variáveis: a função de corrente, a parte desbalan-ceada da velocidade potencial, a parte desbalanceada datemperatura virtual, a parte desbalanceada da pressão emsuperfície e a umidade relativa normalizada.

2.4. Matriz de covariâncias dos erros de previsão (B)

A Matriz de Covariâncias dos erros de Previsão (B)tem o papel de filtrar e propagar espacialmente a informa-ção das observações (Berre et al., 2013), contribuindo paraa transformação de parte das inovações (y - Hx) em incre-mentos de análise x - xb). Segundo Fisher (2003), paraapenas uma observação convencional em ponto de grade, ooperador observação linear da Eq. (1), pode ser escritocomo:

H � [ ,... , , , ,... , ]0 010 0 (3)

O gradiente da função custo, é então calculado apli-cando-se o operador gradiente (�J) diretamente na Eq. (1) eigualando-se a expressão resultante a zero para se determi-nar o mínimo da função (Eq. (4)). Observe que neste caso,não se está considerando a hipótese de linearização dooperador observação (i.e., y - Hx + H(x - xb)), o que acarre-taria no peso obtido na expressão do lado direito da Eq. (2).Resolvendo a equação resultante para o incremento deanálise x - xb (Eq. (6)), obtemos:

� � � � � �� �J x x x y xb( ) ( ) ( )B H R H1 1 0T (4)

x x y xb� � ��BH R HT 1 ( ) (5)

Como temos apenas uma única observação a ser ana-lisada, logo o termo R-1(y - Hx) é apenas um escalar, pois R

será um escalar e y e x também. Além disso, H irá apenasinterpolar x para o ponto de grade onde y se situa de formaque seja possível realizar a diferença y - Hx. Portanto:

�x � BHT (6)

ou seja, o incremento de análise �x é proporcional às colu-nas da matriz de covariâncias B.

Na prática, os sistemas operacionais de assimilaçãode dados são implementados com diferentes técnicas queminimizam o custo computacional envolvido e facilitam otratamento das matrizes. No caso da matriz de covariânciasdos erros de previsão, a minimização da função custo en-volve a inversão das matrizes B e R. Devido às dimensõesde B, esta operação pode tornar-se muito custosa ou prati-camente impossível, dependendo do número de graus deliberdade do sistema. Por esta razão, algumas implemen-tações permitem o pré-condicionamento da função custo deforma que a sua minimização seja feita com base em umamudança de variáveis (por exemplo, z = B-1�x, onde �x é oincremento de análise x - xb (Derber e Rosati, 1989). Esteprocedimento permite, por exemplo, que a minimização dafunção custo seja atingida mais rapidamente e sem a neces-sidade de inversão da matriz B, mas com o custo extra de secalcular �zJ além de ��xJ. Além disso, as informaçõesarmazenadas na matriz de covariâncias não representamsimplesmente apenas as informações de variância e cova-riância de cada variável. Ao invés disso, são armazenadasinformações que são utilizadas durante o procedimento deminimização da função custo, tais como, comprimentos deescala e relações de balanço entre as variáveis de controle.

O cálculo da matriz de covariâncias para o sistemaG3DVAR, incluiu a utilização de 1460 pares de previsõesde 48 h e 24 h válidos para 1 ano, no formato espectral doBAM-CPTEC/INPE na resolução TQ0299L064. Os paresde previsões foram organizados na forma a seguir: consi-derando-se o dia 2014010100, o primeiro par de previsõesválido foi gerado com as análises dos dias 2013123100(válido para uma previsão de 24 h) e 2013123000 (válidopara uma previsão de 48 h). A metodologia para se calcularas amplitudes (representando as variâncias e as covariân-cias) utilizando-se pares de previsão é baseada no métododenominado National Modeling Center (NMC) de Parrishe Derber (1992). Este método preconiza que a correlaçãoespacial dos erros do modelo de previsão são semelhantes àcorrelação espacial das diferenças entre as previsões de48 h e 24 h.

Este método foi empregado para o cálculo da matrizde covariâncias pela conveniência de já se ter os pares deprevisões prontos (obtidos a patir das realizações operacio-nais do G3DVAR). Apesar disto, pode-se discutir sobre ahipótese de que os pares de previsões de 48 h e 24 h sãomais adequados ou não. Em tese, se o objetivo de se obteruma medida da variância do erro associado à modelagem -e principalmente, como a dinâmica e a física podem serrepresentadas neste contexto, é plausível que ao invés de seutilizar dois pares de previsão, se utilize uma análise e umaprevisão. Outro aspecto que também pode ser discutido, é otempo necessário para o cálculo das covariâncias. A princí-pio, o tempo mínimo para que estas covariâncias repre-sentem qualitativamente as estruturas calculadas a partir dautilização de um ano completo de pares de previsões podedepender de cada variável.

462 Bastarz et al.

O algorítmo para o cálculo da matriz de covariâncias,possui as seguintes etapas:• Leitura e organização dos pares de previsões de 48 h e

24 h;• Remoção de viés (em toda a coluna vertical);• Cálculo das matrizes de balanço que permitirão as trans-

formações entre função de corrente (�) e as componen-tes desbalanceadas de velocidade potencial (), pressãoem superfície (p) e temperatura (T);

• Cálculo das variâncias dos erros de cada uma das variá-veis de controle (�, , q, oz, cw, p);

• Cálculo dos comprimentos de correlação verticais (emunidades inversas em ponto de grade);

• Cálculo dos comprimentos de correlação horizontais(em km).

Se todas as amplitudes das variáveis de estado pudes-sem ser estimadas, então a matriz de covariâncias dos errosde previsão poderia ser caracterizada de forma ideal, comosendo uma matriz do tipo bloco onde estão organizadas asestruturas de variâncias na diagonal principal e as estrutu-ras de covariâncias fora da diagonal principal (Fig. 1). Amatriz de covariâncias descreve, portanto, as relações uni-variadas e multivariadas (no tempo e no espaço) entre asdiferentes variáveis do sistema (Petrie, 2012). Ao contrárioda matriz R que é diagonal (i.e., podem apenas ser defi-nidos as variâncias dos erros das observações), em B são oselementos fora da diagonal principal quem tem o papel deespalhar as informações da variância para fora da diagonalprincipal e entre as diferentes variáveis envolvidas na assi-milação de dados.

Na prática, a matriz de covariâncias do GSI possui asseguintes estruturas: amplitudes (representadas pelos des-vios-padrão, variâncias e covariâncias), distâncias (repre-

sentadas pelos comprimentos de escalas horizontais e verti-cais) e matrizes de projeção de balanço (representadas porcoeficientes de regressão). Nesta versão da matriz de cova-riâncias utilizada pelo G3DVAR as amplitudes são repre-sentadas por médias zonais (as quais podem ser ponderadasdurante o processo de minimização da função custo),variando apenas nas latitudes e na vertical. As partes desba-lanceadas das variáveis velocidade potencial, temperaturavirtual e pressão em superfície, possuem matrizes de pro-jeção (G e W nas Eqs. (7) e (8), respectivamente) que sãoresponsáveis por projetar o incremento de análise da funçãode corrente no perfil vertical da parte balanceada do incre-mento de cada uma destas variáveis. Para a velocidadepotencial, uma matriz de correlação (C na Eq. (9)) é utili-zada para contabilizar a correlação positiva entre diver-gência e vorticidade.

Tb � G (7)

Pb � W (8)

b � C (9)

Esta é a forma utilizada pelo GSI para aplicar os in-crementos de análise de forma filtrada, i.e., decompõe-se asvariáveis de controle em uma parte balanceada (referente àparte lenta do fluxo atmosférico) e em uma parte nãobalanceada (referente à parte rápida e ruidosa do fluxoatmosférico) e então os incrementos de análise são realiza-dos apenas na parte não balanceada (a qual deve ser ajus-tada).

No GSI, a matriz de covariância não é explicitamenteconstruída (como mostrado na Fig. 1) e, ao invés disso,filtros recursivos (Purser et al., 2003a, 2003a; Purser et al.

(2003b) são utilizados para realizar a aplicação das cova-riâncias. Segundo Wu et al. (2002), a matriz B é entãodecomposta da seguinte forma:

B B B B B B B B B B B� �z x y y x x y y x zV V V V( )1 1 1 1 1 1 2 2 2 2 2 2 (10)

onde V1 e V2 são os desvios-padrão de cada variável decontrole (obtidos a partir da própria matriz de covariânciascalculada); Bx, By e Bz representam a aplicação dos filtrosrecursivos nas direções x (direção Oeste-Leste), y (direçãoSul-Norte) e z (na vertical); B1 e B2 representam a aplicaçãodo filtro recursivo nas escalas horizontais indicadas (dire-ções x e y).

O filtro recursivo utilizado para a aplicação das cova-riâncias no GSI tem também a importante propriedade deajustar as amplitudes calculadas de forma que seu aspectopossua algum grau de anisotropia (i.e., variação do aspectorepresentado em todas as direções) permitindo que as cova-riâncias se adaptem ao fluxo representado pelo back-

ground. Os parâmetros de escala horizontais utilizados pelofiltro recursivo neste processo, são tabelados e uma discus-são sobre a sua determinação pode ser encontrada em Wu et

al. (2002).

Matriz de Covariâncias dos Erros de Previsão Aplicada ao Sistema de Assimilação de Dados Global do CPTEC 463

Figura 1 - Representação idealizada da matriz B: na diagonal principal(quadrados pretos), estão os elementos de variâncias de cada variável deestado; em cinza escuro, estão os elementos de autocovariância (i.e.,variância da mesma variável em pontos de grade diferentes) e em cinzaclaro, os elementos de covariância multivariados (Adaptado de Petrie,2012).

Um outro aspecto tratado durante o cálculo da matrizde covariância é o viés do modelo numérico. O viés (�t) éuma medida do erro sistemático do modelo de PNT e podeser representada pelo modelo (�f) subtraído do erro real(�t) e de um erro aleatório, cuja esperança é zero, i.e.,< t> = 0 (Chepurin et al., 2005). A remoção de viés (Eq. 11)é realizada com a finalidade de se eliminar os erros maisgrosseiros, e é aplicada em toda a coluna vertical do mo-delo. Este procedimento é realizado para as seguintes variá-veis: parte balanceada da função de corrente, parte desba-lanceada da velocidade potencial, temperatura virtual,umidade relativa normalizada, razão de mistura de ozônio,razão de mistura de condensação de água em nuvens epressão em superfície.

� � � t f t t� � � (11)

Os comprimentos de escala horizontais são impor-tantes estruturas da matriz B e são dependentes dos valoresde variâncias calculados - Eq. (12), onde V� e V�, repre-sentam as variâncias da função de corrente e da vorticidade,respectivamente. Os comprimentos de escala verticais po-dem ser estimados através da correlação vertical de cadavariável de controle (Wu et al., 2002).

LV

V�

���

���

814

(12)

Os comprimentos de escala descrevem o quão dis-tantes as covariâncias entre os erros das variáveis de con-trole podem ser relacionadas espacialmente. É através delesque os elementos da diagonal principal da matriz B sãotransportados até uma determinada distância para fora dadiagonal principal de B. Portanto, a variação do compri-mento de escala descreve o modo como a covariância variacom a distância. Além disso, é através dos comprimentosde escala que os filtros recursivos são aplicados para amodelagem das matrizes de correlação do GSI. Panne-koucke et al. (2008) apresentam uma revisão sobre esteassunto comparando diversas formulações para os compri-mentos de escala e quais os seus impactos em situaçõesidealizadas.

2.5. Ciclo de assimilação de dados global

O ciclo de assimilação de dados do sistema G3DVARé realizado nos quatro horários sinóticos padrão (00, 06, 12e 18Z). O sistema de assimilação de dados GSI utiliza atécnica First Guess at Appropriate Time (FGAT) em que otermo de inovação y - Hx é calculado utilizando-se o horá-rio das observações como referência (Lee e Barker, 2005).Dessa forma, o GSI é capaz de utilizar as observações nacorreção do background em horários mais próximos doshorários de coleta das observações, ao invés de considerarque todas as observações são válidas para o horário centralna janela de assimilação de dados. Para a parte atmosférica,

o GSI calcula os incrementos de análise das variáveis decontrole com base no incremento da função de corrente.Para a parte da superfície, embora a temperatura da super-fície continental seja atualizada, na implementação atual dociclo de assimilação de dados, esta parte não é consideradaquando o modelo atmosférico é integrado no tempo e asvariáveis de estado da superfície são lidas dos arquivos derestart do modelo. Dentro do ciclo de assimilação de dados,os coeficientes espectrais representando as quantidadescorrespondentes dos campos prognósticos do modelo sãorecompostas para ponto de grade, de forma que a assi-milação de dados seja feita no espaço das observações. Aofinal deste processo, as quantidades atualizadas da análisesão decompostas novamente em coeficientes espectrais.

2.6. Experimentos

Para se verificar as características principais da novamatriz calculada com base no histórico de previsões doBAM-CPTEC/INPE, foi feita uma descrição comparativada nova matriz e esta foi comparada com a matriz doGFS/NCEP. Além disso foram realizados dois experimen-tos com a assimilação de uma única observação sintética(vento horizontal e temperatura do ar). Nestes experimen-tos, os seguintes parâmetros puderam ser controlados: amagnitude do erro da observação, a magnitude da ino-vação, a posição horizontal (lat X lon) e vertical (nível depressão). Os experimentos com observação única permitemque se obtenha uma visão geral de como o incremento deanálise é espalhado na horizontal e na vertical de acordocom os diferentes parâmetros disponíveis e como ele seadapta ao fluxo atmosférico representado pelo background.

3. Resultados e Discussão

Nesta seção são apresentadas as características prin-cipais da matriz de covariâncias calculada, comparando-acom a matriz de referência do GFS/NCEP. As estruturasdas amplitudes das variáveis de controle bem como osvalores máximos e mínimos são apresentados e discutidos.Finalmente, a aplicação da matriz calculada é testada atra-vés de um experimento com observação única com o obje-tivo de se avaliar o aspecto dos incrementos de análisesproduzidos.

3.1. Caracterização da matriz de covariâncias

calculada

Para se verificar o aspecto das amplitudes e distânciascalculadas a partir dos pares de previsões do BAM-CPTEC/INPE, a matriz de covariâncias calculada consi-dera todos os horários sinóticos padrão (00, 06, 12 e 18Z)para o período de 1 ano, totalizando 1460 pares de pre-visões. As matrizes comparadas (“B NCEP” e “B CPTEC”)foram utilizadas nos experimentos descritos na Seção 2.6 eos valores máximos e mínimos de suas amplitudes e com-primentos de escala das variáveis função de corrente, velo-

464 Bastarz et al.

cidade potencial, temperatura, umidade, pressão emsuperfície, encontram-se nas Tabelas 2 e 3.

As dimensões horizontais das matrizes calculadascom base nos pares de previsões do BAM-CPTEC/INPE,possuem as mesmas dimensões que a matriz do NCEP, i.e.,768 x 386. Isso foi feito para que fosse possível realizar acomparação com a matriz operacional utilizada. Além dis-so, uma limitação na representação da razão de mistura doozônio pelo BAM-CPTEC/INPE, impedia que as ampli-tudes e comprimentos calculados pudessem ser efetiva-mente utilizados pelo GSI. Como forma de contornar esteproblema, foram especificados os mesmos valores de am-plitudes e comprimentos para a matriz do CPTEC.

Em uma comparação quantitativa, as amplitudes (Ta-bela 2) resultantes das variáveis função de corrente e velo-cidade potencial, mostram que os valores máximos repre-sentados na matriz “B CPTEC” excedem em 1 a ordem demagnitude das mesmas quantidades representadas na ma-triz “B NCEP”. Sendo a amplitude uma representação davariância destas variáveis, a interpretação que se faz é quena matriz “B CPTEC” existe maior variação temporal dafunção de corrente e da velocidade potencial possivelmentedevido à quantidade de pares de previsões utilizado. Para asdemais variáveis, as quantidades representadas são direta-mente comparáveis. Para as variáveis razão de mistura deozônio, estas quantidades possuem ordem de magnitude de-7 (máximo e mínimo, respectivamente) para ambas asmatrizes e para a razão de mistura de água líquida emnuvens, possuem ordem de magnitude de -4 e -7 (máximo emínimo, respectivamente), para ambas as matrizes. Para atemperatura da superfície do mar, estes valores possuemordem de magnitude de -1 (máximo e mínimo, respecti-vamente) para ambas as matrizes, indicando uma variaçãomuito pequena entre os dois extremos.

Os valores máximos e mínimos dos comprimentos deescala horizontais (Tabela 2) da matriz “B CPTEC” cal-culada, indicam maior variação espacial da variância daumidade, em relação à matriz “B NCEP”. Esta diferençacorresponde a uma ordem de magnitude em relação aosvalores máximos de ambas as matrizes. Para as demaisvariáveis apresentadas, os valores máximos e mínimos sãocompatíveis. Para as variáveis razão de mistura de ozônio e

razão de mistura de água líquida em nuvens, a ordem demagnitude dos valores máximos e mínimos nas matrizes éde 6 e 0, respectivamente. A escala horizontal da tempe-ratura da superfície do mar possui ordem de magnitudemáxima e mínima igual a 2.

As escalas verticais de variação das amplitudes (Ta-bela 3) é maior na função de corrente representada para amatriz “B CPTEC” calculada, sendo uma ordem de magni-tude maior do que está representado no valor máximo dafunção de corrente da matriz “B NCEP”. Para as demaisvariáveis, as variações e os valores máximos e mínimospossuem a mesma ordem de magnitude.

Para comparação qualitativa das matrizes conside-radas, foi utilizada a matriz pré-calculada de covariânciasdo NCEP, utilizada na versão operacional do sistemaG3DVAR no CPTEC. Em todos os casos, a grade utilizadapossui dimensões 768 x 386 (lat X lon) na horizontal e 64níveis sigma na vertical.

A Fig. 2 mostra a distribuição vertical e latitudinal dasamplitudes (variâncias) da função de corrente, velocidadepotencial, temperatura do ar e umidade específica prove-nientes das matrizes de covariâncias do NCEP (“BNCEP”), da matriz de covariâncias do CPTEC (“BCPTEC”).

Comparando-se “B NCEP” e “B CPTEC” (as duasmatrizes contendo os pares de previsões de todos os horá-rios sinóticos padrão), observa-se que na matriz “BCPTEC” as amplitudes das variâncias dos erros da partenão divergente do fluxo atmosférico (representadas atravésda função de corrente, primeira coluna da Fig. 2) são mais

Matriz de Covariâncias dos Erros de Previsão Aplicada ao Sistema de Assimilação de Dados Global do CPTEC 465

Tabela 2 - Valores máximos e mínimos das amplitudes e dos comprimentos de escala horizontais das matrizes de covariâncias “B CPTEC” e “B NCEP”.

Amplitudes Comprimentos de Escala Horizontais

B NCEP B CPTEC B NCEP B CPTEC

Mín Máx Mín Máx Mín Máx Mín Máx

� 4,3 x 105 7,99 x 106 4,6 x 105 2,8 x 107 2,2 x 105 1,3 x 106 4,55 x 105 1,75 x 106

� 0 3,77 x 106 0 1,07 x 107 0 1,1 x 106 0 1,82 x 106

t 0 2,23 0 4,04 0 3,1 x 105 0 5,9 x 105

q -4,06 x 10-7 0,41 -2,15 x 10-7 0,29 0 7,9 x 106 0 2,22 x 107

ps 4,88 x 10-2 1,01 x 10-1 6,35 x 10-2 1,48 x 10-1 1,19 x 105 1,89 x 105 1,83 x 105 4,18 x 105

Tabela 3 - Valores máximos e mínimos dos comprimentos de escalaverticais das versões das matrizes de covariâncias “B CPTEC” e “BNCEP”.

B NCEP B CPTEC

Mín Máx Mín Máx

� 8,3 x 10-2 9,1 x 10-1 8,41 x 10-2 1,27

� 0 1,22 0 1,5

t 0 1,75 0 1,67

q 0 1,3 x 106 0 1,75 x 106

concentradas e menos suaves do que as amplitudes obser-vadas na matriz “B NCEP” e espacialmente assimétricas.Esta característica mostra que entre os níveis sigma 1 e 0,7(aproximadamente entre 1024 e 716,8 hPa) na matriz “BNCEP” a distribuição das amplitudes estende-se mais apartir da região tropical e sobre o Hemisfério Norte. Ocontrário é observado na matriz “B CPTEC”, porém commenor extensão e intensidade, sobretudo entre os níveissigma 1 e 0,9 (aproximadamente entre 1024 e 921,6 hPa).Estas diferenças podem estar relacionadas à forma como ospares de previsões foram gerados: para o cálculo da matrizde covariâncias “B CPTEC”, foram utilizados pares deprevisões de 48 h e 24 h provenientes do ciclo de assimi-lação de dados do G3DVAR. Consequentemente, a variân-cia do erro sobre o Hemisfério Sul, sobretudo sobre aAmérica do Sul (entre 0 e 60 S) pode ser diferente, sobre-tudo dependendo da forma como o controle de qualidadedas observações é realizado. Um outro fator que podecontribuir para as diferenças entre a distribuição verticaldas amplitudes, é a diferença entre as topografias dos mo-

delos que foram utilizadas para o cálculo das matrizes decovariâncias. A matriz “B NCEP”, embora com uma gradehorizontal de dimensões menores do que 900 x 450 (refe-rente ao TQ0299L064), especula-se que as quantidades alirepresentadas tenham sido truncadas de uma resoluçãoespectral maior (eg., TQ0574L64, cuja grade tridimension-al possui dimensões de 1760 x 880 x 64). Este truncamentopara uma representação dos coeficientes espectrais da topo-grafia com menos ondas, pode gerar diferenças na repre-sentação da topografia em ponto de grade. Uma compa-ração entre as topografias das análises do NCEP e dosistema G3DVAR, mostra que as diferenças podem variarde alguns poucos metros até dois quilômetros (figura nãomostrada).

A distribuição das amplitudes da parte divergente dofluxo atmosférico (representada através da velocidade po-tencial, segunda coluna da Fig. 2), assim como para afunção de corrente, mostram que sobre a região tropical(entre 30 S e 30 N), a variância do erro representada namatriz “B CPTEC” é mais suave abrangendo uma área

466 Bastarz et al.

Figura 2 - Distribuição das amplitudes da Função de Corrente (�, x 106), Velocidade Potencial (, x 106), Temperatura do Ar (T) e Umidade Específica(q) ao longo das latitudes (em x) e níveis sigma (em y), calculadas utilizando-se o método NMC, para as matrizes B do NCEP (primeira linha) e do CPTEC(segunda linha).

maior do que é representado na matriz “B NCEP”, so-bretudo entre os níveis mais baixos do modelo até o nívelsigma 0,5 (aproximadamente 512 hPa). Esta diferença podeser refletida na divergência do vento horizontal em níveismais próximos à superfície, ocasionando com que os cam-pos de vento horizontal derivados da análise do sistemaG3DVAR com a matriz “B CPTEC” sejam mais intensos.Uma das implicações desta diferença, é a produção de maischuva nas vizinhanças das regiões de maior divergência.

Para a temperatura (terceira coluna da Fig. 2), a ma-triz “B CPTEC”, a maior parte da variância dos errosencontra-se concentrada sobre o Hemisfério Norte a partirde 30 N. Na matriz “B NCEP”, uma característica interes-sante pode ser assinalada sobre a latitude de 60 N, próximoao nível sigma 1 (1024 hPa). O padrão da variância do erroda temperatura apresenta uma distribuição simétrica, comamplitude se estendendo até o nível sigma 0,9 (aproxi-madamente 921,6 hPa). Esta estrutura não é representadapela matriz de covariâncias do CPTEC; porém, a isolinhade valor 0,75 é observada aproximadamente na mesmaregião com a diferença de que na matriz “B CPTEC”, estaestrutura é fechada e situa-se entre as latitudes 60 S e 30 S eentre os níveis sigma 1 e 0,7 (aproximadamente entre 1024e 716,8 hPa). Especula-se, entretanto, que tais diferençaspossam estar relacionadas às diferenças de representaçãodos fluxos de calor mais próximos à superfície, entre osmodelos globais do CPTEC e do NCEP. Tal como asdiferenças encontradas nas amplitudes da velocidadepotencial (as quais, por sua vez, podem estar relacionadascom a precipitação), estas diferenças também podem serdevidas à forma como os modelos prognosticam a tem-peratura virtual e sensível.

As amplitudes da umidade (quarta coluna da Fig. 2)representadas na matriz “B CPTEC”, não diferem muito emdistribuição ao longo das latitudes, mas a amplitude davariância na região subtropical em ambos os hemisférios émais definida e menos intensa do que aquela representadana matriz “B NCEP”. Neste caso, a variância do erro daumidade em ambos os hemisférios é simétrica, o que podeser um indicativo da necessidade de se remover o viés no

modelo do CPTEC. Outra característica que pode ser assi-nalada também, é a concentração das amplitudes no nívelsigma 0,1 da matriz “B NCEP” sobre a região Equatorial.Apesar de se ter utilizado a quantidade umidade relativanormalizada como componente úmida no GSI (esta opçãoem contraste à pseudo umidade relativa, permite que aumidade varie de acordo com as variações na pressão emsuperfície), Wu et al. (2002) mostram que a mesma seçãopara a quantidade pseudo umidade relativa também apre-senta concentrações na mesma região. Além disso, as iso-linhas mais próximas à superfície (até o nível sigma 0,8,aproximadamente 819,2 hPa), apresentam valores comquase o dobro de amplitude, se comparados com a mesmaregião na matriz “B NCEP”. De outra forma, pode indicartambém alguma característica da física do modelo numé-rico na representação dos processos úmidos, como porexemplo, a forma da representação da precipitação con-vectiva e de larga escala, a representação da radiação deonda curta ou mesmo a difusão horizontal e vertical.

A Fig. 3 apresenta a distribuição latitudinal das mé-dias zonais da variância do erro da pressão em superfície.As amplitudes da matriz “B NCEP” apresentam uma dis-tribuição simétrica, com dois picos sobre as latitudes de60 S e 60 N. Na matriz do CPTEC, a distribuição das ampli-tudes é assimétrica, sendo que os picos das variâncias doserros são maiores sobre a latitude de 60 N do que sobre alatitude de 60 S. A mesma amplitude apresentada em Wu et

al. (2002), mostra que os picos da variância dos errossituam-se em torno destas latitudes, especialmente sobre oHemisfério Norte, onde o pico local situa-se entre as lati-tudes de 30 N e 60 N.

O sistema G3DVAR experimentado não foi configu-rado para assimilar observações de ozônio e a represen-tação desta quantidade com as configurações utilizadas noBAM-CPTEC/INPE, é feita por meio de uma climatologia.As amplitudes originais calculadas para esta quantidadeutilizando-se a climatologia são bastante discrepantes da-quelas apresentadas pela matriz “B NCEP”. A razão demistura de ozônio, a razão de mistura de água condensadaem nuvem e a umidade são três tipos de traçadores utili-

Matriz de Covariâncias dos Erros de Previsão Aplicada ao Sistema de Assimilação de Dados Global do CPTEC 467

Figura 3 - Distribuição das amplitudes da Pressão em Superfície (ps) ao longo das latitudes (em x) e níveis sigma (em y), calculadas utilizando-se ométodo NMC. A comparação é feita com o NCEP.

zados pelo modelo de transferência radiativa do GSI para ocálculo dos perfis de temperatura de brilho e dos perfis deradiâncias simulados (perfis referentes ao modelo).

Outro fator que também deve ser apontado nas com-parações é que, apesar da matriz de covariâncias “B NCEP”ser calculada utilizando-se pares de previsões válidos para1 ano, não se pode dizer ao certo como estes pares deprevisões foram distribuídos ao longo desse período. Wu et

al. (2002) mencionam que foram utilizados 49 pares deprevisões distribuídos ao longo de um período de 1 ano parao cálculo da matriz de covariâncias do NCEP, enquanto quepara a matriz de covariâncias do CPTEC calculada, foramutilizados 1460 pares de previsão, o que ajuda a explicar ograu de suavização encontrado nas estruturas verticais dasamplitudes da matriz e também na magnitudes dos valores

máximos e mínimos das amplitudes e comprimentos deescala verificados.

3.2. Experimentos com assimilação de observação

única

Como forma prática de se verificar como a novamatriz de covariâncias do CPTEC aplica o incremento deanálise no sistema G3DVAR, foi feita a inclusão de umaúnica observação sintética no sistema e avaliado qual oresultado obtido com o incremento de análise calculado.Esta observação sintética representa a simulação de umaobservação real em que podem ser controlados dois impor-tantes parâmetros: a magnitude do erro da observação e amagnitude do termo de inovação da função custo (i.e.,y - Hx). A fim de que seja possível caracterizar o aspecto doincremento de análise resultante, as Figs. 3 e 4 apresentam

468 Bastarz et al.

Figura 4 - Incrementos da análise (sombreado) do campo do vento horizontal (isolinhas) em 250 hPa, produzidos pelas matrizes de covariâncias doCPTEC e NCEP, respectivamente, onde estão destacadas seções latitudinal, longitudinal e vertical. À esquerda, incremento isotrópico; à direitaincremento anisotrópico.

uma comparação entre os incrementos de vento e tempera-tura produzidos pelas matrizes de covariâncias do CPTEC edo NCEP. Neste caso, foi utilizado o mesmo background

do campo de vento e de temperatura nos testes com asmatrizes, de forma que as diferenças apresentadas sejadevidas apenas à matriz de covariâncias. Para isso, foramconsiderados os mesmos parâmetros de configuração que osistema GSI dispõe para a aplicação da matriz de cova-riâncias. Como o objetivo deste artigo não é buscar quaissão os valores ótimos destes parâmetros, mas apresentar ediscutir a nova matriz de covariâncias, os testes empíricosrelacionados ao ajuste do incremento de análise serão feitosem um estudo à parte. A Tabela 4 apresenta, portanto, osvalores dos parâmetros principais utilizados para produziros incrementos apresentados nas figuras desta seção.

A Fig. 4, mostra o incremento de análise (previsãosubtraída da análise, ou AMF) produzido pela assimilaçãode uma observação sintética da componente zonal do ventohorizontal no nível de pressão 1000 hPa na posição decoordenadas 45 N e 180 (lat X lon, respectivamente). Alémdisso, ajustou-se o erro da observação para 1 m s-1, bemcomo a magnitude da inovação trazida pela observação(previsão subtraída da observação, ou OMF). Na Fig. 4, sãoapresentados dois painéis: o painel da esquerda apresentaas seções lat X lon, lat X lev e lon X lev dos incrementos deanálise produzidos por uma observação sintética do ventohorizontal utilizando a matriz “B CPTEC”. O painel dadireita, apresenta os resultados obtidos com a matriz “BNCEP”. Em ambos os painéis são apresentados também osresultados obtidos com a aplicação do filtro recursivo iso-trópico e anisotrópico, mostrando como os incrementos deanálise podem ser ajustados aos gradientes representadosno campo de background (opção “bkg_flowdep”, indicadona Tabela 4). Esta opção é uma importante funcionalidadedo sistema GSI, pois ela permite que a matriz de cova-riâncias seja ajustada com base na tendência temporal im-

pressa nos campos de background utilizados para o cálculoda análise.

As linhas tracejadas na horizontal e na vertical nasfiguras de ambos os painéis estão destacadas para auxiliarna identificação do ponto em que a observação sintética foiposicionada, além de indicar as seções latitudinais, longi-tudinais e verticais feitas para mostrar os diferentes as-pectos do incremento de análise produzido. As isolinhaspretas indicam o background da componente zonal do ven-to (indicado em ms-1) e na região sombreada do incrementode análise, estão destacadas isolinhas brancas represen-tando a análise, como sendo o resultado do ajuste/correçãorealizada pela observação no campo de vento do back-

ground. Por inspeção visual, as diferenças principais entreos incrementos produzidos pelas matrizes, mostra que oincremento da matriz “B CPTEC” é mais largo na horizon-tal e também mais alto na vertical. A seção lon X lev dospainéis da esquerda e da direita, mostra como o incrementoanisotrópico das matriz se ajustaram à isolinha de 20 ms-1, apartir do nível sigma 0,6 (aproximadamente 600 hPa).

A Fig. 5 apresenta o incremento de análise produzidopelas matrizes de covariâncias testadas no sistemaG3DVAR, assimilando uma observação sintética de tem-peratura do ar, posicionada no nível de 1000 hPa e com amagnitude de erro e inovação iguais a 1 °C, respecti-vamente. A observação foi também posicionada no pontode coordenadas 45 N e 180 (lat X lon, respectivamente). Deforma geral, para ambos os casos (isotrópico e anisotró-pico), o incremento de análise calculado pela matriz decovariâncias do CPTEC (matriz “B CPTEC”), produz tam-bém um incremento mais largo, i.e., abrangendo uma áreade vários graus de latitude e longitude e também na vertical.Isso significa, que o incremento de análise calculado, éespalhado sobre uma região maior ao redor da vizinhançada observação e que a sua influência pode ser transportadapara mais longe. Em uma situação física real em que, porexemplo, há a incursão de um sistema frontal e, consi-derando o caso anisotrópico, a assimilação de dados utili-zando uma matriz de covariância com estas característicaspode trazer um benefício importante para a previsãogerada, porque a análise utilizada poderá possuir um balan-ço melhor entre observações e background. Isso mostratambém a importância da seleção das observações, do con-trole de qualidade e do thinning (procedimento realizado noconjunto de dados observacionais com o objetivo de redu-zir o custo computacional através da eliminação de dadosde observações redundantes ou não confiáveis) utilizadosno sistema. Além disso, a intensidade do incremento deanálise produzido pela matriz de covariâncias do CPTEC émais suave (porque se espalha sobre uma região maior),embora seja menos concentrado. Em contraste, a matriz decovariâncias do NCEP, apresenta incrementos muito maisconcentrados e consequentemente mais localizados.

As diferenças entre os incrementos de análises produ-zidos pelas matrizes B do CPTEC e do NCEP utilizando os

Matriz de Covariâncias dos Erros de Previsão Aplicada ao Sistema de Assimilação de Dados Global do CPTEC 469

Tabela 4 - Parâmetros de configuração utilizados no sistema GSI para aaplicação das matrizes de covariâncias do CPTEC e do NCEP.

Parâmetro Valor Descrição

vs 0,7 Fator de escala do comprimento decorrelação vertical

hzscl 1,7;0,8;0,5 Fator de suavização para as 3 escalashorizontais

hswgt 0,45;0,3;0,25 Pesos aplicados a cada escala horizon-tal

bw 0 Fator no cálculo da covariância do erro

norsp 4 Ordem de suavização horizontal dascovariâncias do erro de background

bkg_flowdep True/False Flag para usar (True = anisotrópico) ounão (False = isotrópico) a dependênciadas variâncias do erro do background

bkg_rewgtfct 1,5 Fator usado para reponderar as cova-riâncias do erro do background

parâmetros indicados na Tabela 4, mostram dois aspectosimportantes das matrizes de covariâncias: a localizaçãoespacial e a intensidade do incremento de análise. A matriz“B NCEP” apresentou incrementos mais concentrados,indicando que o incremento de análise foi restrito à área emque a inovação trazida pelas observações foi calculada,sendo esta mais restrita também à área em que as obser-vações sintéticas (da componente zonal do vento horizontale da temperatura) foram posicionadas.

No GSI, o campo de vento (componentes zonal e me-ridional) da análise é calculado a partir dos incrementos dadivergência (D) e da vorticidade (�). As observações utili-zadas para o cálculo desta análise, são dadas em termos dascomponentes zonal (u) e meridional (v) do vento. O BAM-CPTEC/INPE fornece como campo de background para ocálculo da análise do vento horizontal, também a diver-gência e a vorticidade. Como na matriz de covariânciasestão representadas as quantidades função de corrente (�) evelocidade potencial (), para o cálculo do incremento deanálise do campo de vento, são então calculadas - através daEq. (9) (para a parte divergente), o incremento da veloci-dade potencial. No final, a análise é escrita novamente emtermos da divergência.

As características observadas de localização e inten-sidade do incremento de análise podem ser, portanto, expli-cadas através da verificação da ordem de magnitude dovalor máximo da amplitude da função de corrente repre-sentado na matriz “B NCEP”, em comparação com “BCPTEC” (vide Tabela 2). Sendo o incremento de análise dafunção de corrente projetado na parte balanceada das variá-veis de controle (parte balanceada da temperatura, pressãoem superfície e velocidade potencial), maiores inovaçõesdesta variável (através das observações do vento) podemacarretar em incrementos de análise mais ou menos inten-sos de divergência e vorticidade. Então, quando o incre-mento de análise é calculado, de acordo com a Eq. (9), econsiderando a relação entre o Laplaciano da velocidadepotencial e a divergência (e função de corrente e vorti-cidade) na Equação de Poisson �2 = D, �2� = �, maisintenso poderá ser o incremento de análise no campo devento.

4. Comentários Finais e Conclusões

A matriz de covariâncias dos erros de previsão é umadas mais importantes componentes de um sistema de assi-

470 Bastarz et al.

Figura 5 - Incrementos da análise (sombreado) do campo de temperatura do ar (isolinhas) em 1000 hPa, produzidos pelas matrizes de covariâncias doCPTEC e NCEP, respectivamente, onde estão destacadas seções latitudinal, longitudinal e vertical. À esquerda, incremento isotrópico; à direitaincremento anisotrópico.

milação de dados. Os desenvolvimentos realizados nestaárea mostram uma crescente preocupação na forma comoestes erros são especificados e aplicados pelos sistemas deassimilação de dados. Novas técnicas tem surgido, possi-bilitando que uma matriz estática estacionária seja combi-nada com uma matriz dinâmica (i.e., que possa ser atuali-zada no tempo), de forma que ambas as informações secomplementem e que as variações diárias do fluxo atmos-férico representado pelo background possam ser incorpo-radas aos sistemas de assimilação de dados ao se calcular aanálise dos modelos.

Neste trabalho foi calculada e testada uma nova ma-triz de covariâncias dos erros de previsão, aplicada aosistema de assimilação de dados G3DVAR do CPTEC. Amatriz em uso vigente no sistema G3DVAR, foi especi-ficada com base em um outro modelo de PNT (modeloGFS/NCEP), tendo sido aplicada na operação do sistema.Foi mostrada a importância da matriz de covariâncias den-tro da estrutura variacional tridimensional, além de umacomparação quantitativa e qualitativa, e quais as principaisdiferenças entre essa matriz e a nova matriz calculada.Qualitativamente, a matriz do CPTEC apresenta estruturasmais suavizadas devido à quantidade de pares de previsõesutilizados (1460 pares da matriz do CPTEC x 49 pares damatriz do NCEP). As diferenças apresentadas nas estru-turas podem nos levar a compreender de que maneira a am-plitude e as escalas espaciais dos erros de previsão podeminfluenciar o espalhamento do incremento de análise. Alémdisso, a matriz de covariâncias traz informações das ano-malias do fluxo atmosférico representadas através devariâncias espaciais e temporais. Esta é uma característicaque a torna estacionária, evidenciando a necessidade de suaatualização à medida em que os sistemas meteorológicosevoluem no tempo.

Nos experimentos com observação única realizados,verificou-se o aspecto do incremento de análise da novamatriz de covariâncias. Este tipo de experimento é impor-tante e deve ser realizado sempre que algum parâmetro ouconfiguração é modificado dentro do sistema. Esta é umadas únicas formas de se aferir o impacto direto na reali-zação do sistema de assimilação de dados, frente à quanti-dade de observações rotineiramente assimiladas. Alémdisso, foi feita também uma caracterização das estruturasde comprimentos de escala, variâncias da nova matriz, e foimostrado - em comparação com o uso da matriz atual, queas estruturas associadas à variação do erro da previsão estãodistribuídas de formas distintas nas matrizes comparadas(“B NCEP” e “B CPTEC”), principalmente com relação àvariável de controle função de corrente. Tal fato podeconduzir ao melhor entendimento de como a assimilação dedados pode ser ajustada para as diferentes regiões do globo,principalmente sobre o Hemisfério Sul, onde é notável amenor quantidade de observações de superfície e a quanti-dade de observações de radiâncias sobre os oceanos édeterminante. Também, como forma de verificação, este

diagnóstico será útil para trabalhos futuros, em que umajuste fino deve ser realizado buscando-se a calibração doaspecto do incremento de análise e o melhor aproveita-mento das amplitudes das covariâncias. A verificação dosimpactos da nova matriz de covariâncias dos erros de pre-visão, bem como a sua comparação com diferentes versõesdo modelo de circulação geral da atmosfera do CPTEC,deverão ser realizadas em um estudo separado.

Sendo a matriz de covariâncias uma representação davariabilidade espaço-temporal das estruturas de erro asso-ciadas a um modelo de previsão, a descrição desta represen-tação - mediante o uso de um grande número de previsões,pode ser aplicada em estudos envolvendo outras escalastemporais. Neste estudo, foi dado enfoque aos efeitos dire-tos da atualização da matriz de covariâncias no contexto dadeterminação da análise de um modelo de previsão numé-rica de tempo. Por outro lado, modelos ajustados para aprevisão de tempo estendido (isto é, até 15 dias) ou mesmodo clima nas escalas sazonal e intrasazonal, podem tambémser utilizados com o objetivo de se melhorar a previsibi-lidade de fenômenos e oscilações (e.g., Madden-Julian)dentro desta escala de tempo.

Agradecimentos

Os autores agradecem ao Dr. Ricardo Todling doGMAO/NASA pelo apoio e suporte no desenvolvimentodeste trabalho, ao Dr. Daryl Kleist pelas informações sobreestrutura da matriz de covariâncias, ao Dr. João Gerd Zellde Mattos e Msc. Fábio Rodrigues Diniz do CPTEC/INPEpelo auxílio nos testes iniciais com a matriz de covariânciase aos revisores do manuscrito, cujas contribuições aju-daram a melhorar a qualidade do texto. À CAPES pelaconcessão da bolsa do programa PDSE processo númeroBEX 99999.008036/2014-04.

Referências

BANNISTER, R.N. A Review of Forecast Error Covariance Sta-tistics in Atmospheric Variational Data Assimilation I: Cha-racteristics and Measurements of Forecast Error Covarian-ces. Quarterly Journal of the Royal Meteorological

Society, v. 134, n. 637, p. 1951-1970, 2008.

BERRE, L.; MONTEIRO, M.; PIRES, C. An Impact Study of Up-dating Background Error Covariances in the ALADIN-France Data Assimilation System. Journal of Geophysical

Research: Atmospheres, v. 118, n. 19, p. 11,075-11,086,2013.

CHEPURIN, G.A.; CARTON, J.A.; DEE, D. Forecast ModelBias Correction in Ocean Data Assimilation. Monthly

Weather Review, v. 133, n. 5, p. 1328-1342, 2005.

DALEY, R. Atmospheric Data Analysis. Cambridge UniversityPress, 1993.

DEE, D.P.; SILVA, A.M. da. The Choice of Variable for Atmo-spheric Moisture Analysis. Monthly Weather Review,v. 131, n. 1, p. 155-171, 2003.

Matriz de Covariâncias dos Erros de Previsão Aplicada ao Sistema de Assimilação de Dados Global do CPTEC 471

DERBER, J.; ROSATI, A. A Global Oceanic Data AssimilationSystem. Journal of Physical Oceanography, v. 19, n. 9,p. 1333-1347, 1989.

FIGUEROA, S.N.; BONATTI, J.P.; KUBOTA, P.Y.; GRELL,G.A.; MORRISON, H. et al. The Brazilian Global Atmo-spheric Model (BAM): Performance for Tropical RainfallForecasting and Sensitivity to Convective Scheme and Hori-zontal Resolution. Weather and Forecasting, v. 31, n. 5,p. 1547-1572, 2016.

FISHER, M. Background Error Covariance Modelling. In: Semi-

nar on Recent Development in Data Assimilation for At-

mosphere and Ocean. [S.l.: s.n.], 2003. p. 45-63.

IDE, K.; COURTIER, P.; GHIL, M.; LORENC, A.C. Unified No-tation for Data Assimilation: Operational, Sequential andVariational (Special Issue Data Assimilation in Metereo-

logy and Oceanography: Theory and Practice). Journalof the Meteorological Society of Japan. Ser. II, v. 75, n. 1B,p. 181-189, 1997.

KALNAY, E.; ANDERSON, D.L.T.; BENNETT, A.F.; BUSA-LACCHI, A.J.; COHN, S.E. et al. Data Assimilation in theOcean and in the Atmosphere: What Should be Next? Jour-

nal of the Meteorological Society of Japan. Ser. II, v. 75,n. 1B, p. 489-496, 1997.

KLEIST, D.T.; PARRISH, D.F.; DERBER, J.C.; TREADON, R.;WU, W.-S.; LORD, S. Introduction of the GSI into theNCEP Global Data Assimilation System. Weather and

Forecasting, v. 24, n. 6, p. 1691-1705, 2009.

KUBOTA, P.Y. Variabilidade da Energia Armazenada na

Superfície e o seu Impacto na Definição do Padrão de

Precipitação na América do Sul. 309 p. Tese de Douto-rado, Instituto Nacional de Pesquisas Espaciais (INPE), SãoJosé dos Campos, 2012-08-06 2012.

LEE, M.-S.; BARKER, D. Preliminary Tests of First Guess at Ap-propriate Time (FGAT) with WRF 3DVar and WRF Model.Journal of the Korean Meteorological Society, n. 41,p. 495-505, 2005.

LORENC, A. C. Analysis Methods for Numerical Weather Pre-diction. Quarterly Journal of the Royal Meteorological

Society, v. 112, n. 474, p. 1177-1194, 1986.PANNEKOUCKE, O.; BERRE, L.; DESROZIERS, G. Back-

ground-Error Correlation Length-Scale Estimates and theirSampling Statistics. Quarterly Journal of the Royal Mete-

orological Society, v. 134, n. 631, p. 497-508, 2008.PARRISH, D.F.; DERBER, J.C. The National Meteorological

Center’s Spectral Statistical-Interpolation Analysis System.Monthly Weather Review, American Meteorological So-ciety, v. 120, n. 8, p. 1747-1763, 1992.

PETRIE, R.E. Background Error Covariance Modelling for

Convective-Scale Variational Data Assimilation. Ph.D.Thesis, The University of Reading, United Kingdom, 2012.

PURSER, R.J.; WU, W.-S.; PARRISH, D.F.; ROBERTS, N.M.Numerical Aspects of the Application of Recursive Filters toVariational Statistical Analysis. Part II: Spatially Inhomo-geneous and Anisotropic General Covariances. Monthly

Weather Review, v. 131, n. 8, p. 1536-1548,2003.PURSER, R.J.; WU, W.-S.; PARRISH, D.F.; ROBERTS, N.M.

Numerical Aspects of the Application of Recursive Filters toVariational Statistical Analysis. Part II: Spatially Inhomo-geneous and Anisotropic General Covariances. Monthly

Weather Review, American Meteorological Society,v. 131, n. 8, p. 1536-1548, 2003.

RASCH, P.J.; WILLIAMSON, D.L. The Sensitivity of a GeneralCirculation Model Climate to the Moisture Transport For-mulation. Journal of Geophysical Research: Atmo-

spheres, v. 96, n. D7, p. 13123-13137, 1991.STENGEL, R. Optimal Control and Estimation. Dover Publi-

cations, 1994.WU, W.-S.; PURSER, R.J.; PARRISH, D.F. Three-Dimensional

Variational Analysis with Spatially InhomogeneousCovariances. Monthly Weather Review, v. 130, n. 12,p. 2905-2916, 2002.

This is an Open Access article distributed under the terms of the Creative Commons AttributionNon-Commercial License which permits unrestricted non-commercial use, distribution, andreproduction in any medium provided the original work is properly cited.

472 Bastarz et al.