sociedaddeestadísticaeeio.usc.es/eipc1/base/basemaster/formularios-php...vez, de un data warehouse...

31

Upload: others

Post on 14-May-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Sociedad de Estadística eInvestigación Operativa

Boletín de la SEIOVolumen 22, número 3

JULIO 2006

REDACCIÓNEditor: Jesús López [email protected] de Castilla-La Mancha

Editores Asociados:

Estadística:Miguel Angel Gómez [email protected] Complutense de Madrid

Investigación Operativa:Justo Puerto [email protected] de Sevilla

Aplicaciones:Manuel Molina Ferná[email protected] de Extremadura

Estadística pública:Montserrat Herrador [email protected] Nacional de Estadística

Editor Técnico:Fco. Javier Toledo [email protected] Miguel Hernández de Elche

SEIO:Facultad de CC. Matemáticas, Despacho 502Universidad Complutense de MadridPlaza de Ciencias, 328040 Madrid (Ciudad Universitaria)[email protected], http://www.seio.esTel: (+34) 91 544 91 02

Imprime SEROTELPo de la Castellana, 87.Dep. Legal: M-13647-1995ISSN: 1699-8871Copyright c© 2005 SEIO

Normas para los envíos de colaboracio-nes:

Los artículos se enviarán por correo electró-nico al editor asociado correspondiente o aleditor del Boletín. No deberán tener una lon-gitud superior a 5 páginas. El formato ha deser LATEX, sin macros. En www.seio.es puededescargarse un modelo de artículo.

Las cartas al editor se dirigirán por correo elec-trónico al editor. La limitación será de 200 pa-labras.

El resto de colaboraciones y noticias se diri-girán al corresponsal más cercano o directa-mente al editor. Las referencias bibliográficasy de software se acompañarán de los datos ne-cesarios para su localización y una reseña nosuperior a 120 palabras. Los resúmenes de te-sis se limitarán a 200 palabras y contendrán:título, autor, directores, departamento, uni-versidad y la fecha de lectura. Con relacióna congresos y cursos bastará una breve rese-ña semejante a las publicadas en el Boletín. Elformato preferible para estas colaboraciones esMS–Word.

ÍNDICE

Índice

Editorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1. Artículos de Estadística 6Estadística no paramétrica: pasado, presente y futuro, Wenceslao González Manteiga y RosaMaría Crujeiras Casais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2. Artículos de Investigación Operativa 12Estabilidad en programación semi-infinita lineal: un enfoque cuantitativo, María JosefaCánovas Cánovas y Juan Parra López . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3. Artículos de Aplicación 18Análisis del funcionamiento de una oficina de correos, Olga Costa Estirado y David ConesaGuillén . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

4. Estadística Oficial 24Encuesta sobre las personas sin hogar (EPSH-2005), Pedro Ruíz Salvador . . . . . . . . . 24

5. Estudios monográficos y opiniones sobre la profesión 28En memoria de Lázaro Cánovas Martínez, Alfredo Marín Pérez . . . . . . . . . . . . . . . 28

EDITORIAL

Carmen Alcaide GuindoPresidenta del Instituto Nacional de Estadística

La primera referencia a la estadística oficial es-pañola data de la creación de la Comisión Estadís-tica del Reino, creada el 3 de noviembre de 1856 porNarváez en tiempos de Isabel II, aunque con ante-rioridad existen trabajos tan importantes como elCenso de Floridablanca del año 1787.

La Comisión Estadística del Reino pasó a lla-marse unos meses más tarde Junta de Estadística,encomendándosele como primer trabajo la elabora-ción de un censo de población, que tomó como fechade referencia el 21 de mayo de 1857. En este mismoaño se establece que la Estadística sea una discipli-na académica.

En 1870 se crea el Instituto Geográfico, el cual,a partir de 1873 pasa a denominarse Instituto Geo-gráfico y Estadístico, asumiendo las tareas estadís-ticas.

A partir de esa fecha, los servicios oficiales deestadística fueron formando parte de distintos mi-nisterios. Así, en sus principios la estadística estuvoadscrita al Ministerio de Fomento, posteriormente

al Ministerio de Trabajo y Previsión Social, y mástarde al Ministerio de la Presidencia. Finalmente secrea el Instituto Nacional de Estadística (INE) porLey de 31 de diciembre de 1945, con la misión de laelaboración y perfeccionamiento de las estadísticasdemográficas, económicas y sociales ya existentes, yla creación de otras nuevas, así como la coordinacióncon los servicios estadísticos de las áreas provincia-les y municipales.

Un cambio sustancial en el INE se produjo conla promulgación de la Ley de la Función Estadísti-ca Pública de mayo de 1989, que hizo del InstitutoNacional de Estadística un organismo autónomo,potenciando las nuevas tecnologías, la coordinacióncon las comunidades autónomas, la necesidad de laelaboración del Plan Estadístico Nacional y las rela-ciones con la Unión Europea en materia estadística.

Evidentemente, la demanda de información es-tadística por parte de la sociedad ha cambiado mu-cho a lo largo de los años. Al principio la estadísticase dedicaba principalmente al análisis de la pobla-

2

EDITORIAL

ción y su movimiento natural. También se elabora-ban censos agrarios y ganaderos, estadísticas indus-triales e índices del coste de la vida. Por citar algunafecha, en 1964 el INE se hace cargo plenamente de laelaboración de la contabilidad nacional, que va in-corporando la metodología que sigue la ComunidadEconómica Europea.

La entrada en la UE y la evolución de la socie-dad ha conllevado la necesidad de más informacióny con más frecuencia. La investigación estadísticade todas las actividades económicas ha ido comple-tándose a lo largo de todos estos años. Así, camposcomo el turismo, el comercio y los servicios en ge-neral, el I+D, el medio ambiente y todos aquellossectores relacionados con la Sociedad de la Infor-mación han precisado en la última década de unintenso desarrollo estadístico. En el campo social,especialmente en los últimos años, la demanda deinformación se ha incrementado considerablementeen el conocimiento de la población inmigrante, elmercado laboral y los sectores de sanidad y educa-ción entre otros. Esto se ha traducido en una mul-tiplicación de encuestas dirigidas a los hogares y ala población.

Es evidente que este fuerte incremento de la pro-ducción no hubiera podido abordarse sin las nue-vas tecnologías ni la capacidad de procesamiento yalmacenamiento de información de que dispone elINE hoy día, unas posibilidades que hace unos añosse habrían considerado ilusorias. Asimismo, esta ca-pacidad ha hecho posible la modernización de lossistemas de trabajo y su aplicación a los proyectosestadísticos.

Sólo por nombrar un ejemplo, mencionaría queen el año 2001 se elaboró el censo utilizando cuader-nos de recorrido preimpresos y con el nombre de losresidentes en España y las variables básicas (fechade nacimiento, sexo, país de nacionalidad) preim-preso en el cuestionario. Este aspecto, que para mu-chos pasa desapercibido, permitió que la operacióncensal no fuera, como en censos anteriores, una ope-ración aislada, sino intrínsecamente relacionada conla base padronal, siendo éstos los dos grandes mar-cos de población existentes.

En el caso del Censo posibilitó, además, simpli-ficar el proceso de cumplimentación de los cuestio-narios (la tabla de composición del hogar iba preim-presa), la mejora de la cobertura y la imputación dela información de los hogares ubicados en viviendas

que se conocía que eran principales por la operacióncensal, pero en la que no fue posible establecer con-tacto durante la misma, algo que no se había hechoen operaciones censales anteriores. Otro ejemplo deaplicación de nuevas tecnologías también relaciona-do con el censo 2001 es la utilización, por primeravez, de un Data Warehouse para difundir los re-sultados del mismo que ha tenido una excepcionalacogida entre los usuarios.

Por todo ello, considero que hay un acuerdo uná-nime en que la componente tecnológica es vital parala Estadística y hay que seguir impulsándola pues,además de favorecer el procesamiento y difusión dela información, puede simplificar la carga de tra-bajo a los informantes facilitando las respuestas acuestionarios por Internet o, incluso, permitiendoel transvase directo de información de las bases degestión de las empresas a bases estadísticas. En es-ta línea, el INE es miembro de la Asociación XBRLEspaña, la cual promueve el uso de un estándar deintercambio de información (el XBRL -eXtensibleBusiness Reporting Language-), inicialmente finan-ciera, extraída directamente de las bases de las em-presas de acuerdo con unas taxonomías determina-das. De hecho el INE participa en una prueba pilotoimpulsada por la Oficina de Estadística de la UniónEuropea (Eurostat).

En lo referente al uso de Internet para facilitarla colaboración de las empresas, el Instituto Nacio-nal de Estadística diseñó en el último trimestre de2005 un plan para ofrecer a las empresas la posi-bilidad de respuesta mediante ese medio. Se inicióel proyecto con la Encuesta de Índice de Comercioal por Menor, siendo en la actualidad 11 encuestaslas que se pueden cumplimentar por Internet. A lolargo de estos meses, el porcentaje de empresas quehan utilizado esta vía ha ido creciendo progresiva-mente, aunque el mismo depende en gran medidade la actividad económica a estudiar y de la propiaencuesta, variando el uso de Internet en las distintasencuestas entre el 17% y el 6% en los casos menosfavorables.

A pesar de estos resultados iniciales, el INE se-guirá trabajando en esta línea, ya que supone unafacilidad para reducir o, al menos, facilitar la cargade trabajo a las unidades informantes, por un lado,y mejorar la calidad de los resultados eliminando in-tervenciones humanas en el proceso de tratamientode los datos y contribuyendo a la reducción de los

3

EDITORIAL

plazos de elaboración de las estadísticas.Otro ejemplo del uso de la tecnología para fines

estadísticos ha sido la implantación del CATI (Cap-ture Automathique Telephone Interviening) el cualestá siendo utilizando con gran éxito en la EPA yen otras encuestas a hogares ya que, además de fa-cilitar la respuesta a los informantes, ha mejoradola homogeneidad de la información.

Como se desprende de estos ejemplos, ante elgran incremento de demandas de información y gra-cias al apoyo de las tecnologías, el INE respondeinvestigando nuevas vías de captación de datos quegaranticen la calidad de los mismos.

Centrándonos en la producción estadística en sí,hay que señalar que la estadística oficial de interésnacional se planifica a través de planes cuatrienalespromulgados por medio de Reales Decretos, mate-rializados en programas anuales (también aproba-dos por Real Decreto) que recogen las operacionesestadísticas que van a ser objeto de producción alaño siguiente.

La entrada de España en la Unión Europea hasupuesto que la estadística oficial española en gene-ral, y el INE en particular, se hayan visto obligadosa producir más cantidad de información, con másfrecuencia y con unos patrones de calidad más exi-gentes.

Es fundamental que, para que un país sea valo-rado en el contexto internacional, proporcione unainformación estadística creíble, veraz y comparable.Por lo tanto, la sociedad no requiere solamente quese produzcan más datos; también exige que esos da-tos sean de calidad en el sentido más amplio de lapalabra. De hecho, la definición de calidad en lasestadísticas oficiales ha sido motivo de reflexión yanálisis en los últimos años.

En relación con el tema de la Calidad Estadísti-ca, creo conveniente señalar dos fechas fundamenta-les: los años 1994 y 2005. En 1994 Naciones Unidasadoptó los principios fundamentales de las estadís-ticas oficiales, entre los cuales se pueden destacardos, la imparcialidad que deben tener los produc-tores de la estadística oficial y la fiabilidad de losdatos producidos.

La otra fecha señalada en la definición del con-cepto de calidad en estadística oficial fue febrero de2005, fecha en que la Unión Europea aprobó a travésEurostat las recomendaciones de la Comisión conte-nidas en el documento “Código de buenas prácticas

de las estadísticas europeas”, el cual recoge en 15principios los principales aspectos a considerar enlas estadísticas europeas.

Es conveniente resaltar que estos 15 principiosse agrupan en tres grandes bloques:

- El primer bloque está relacionado con el en-torno institucional y recoge los factores insti-tucionales y organizativos que tienen una in-fluencia considerable en la eficacia y credibili-dad de la autoridad estadística que los elaboray difunde.

En este caso, los principios recogidos sobreel entorno institucional son la independenciaprofesional de los responsables de la elabora-ción de la estadística oficial; el mandato de re-cogida de los datos por el que debe existir unaexigencia jurídica clara para que las empre-sas, hogares y el público en general, colaborenen las encuestas; la adecuación de recursos; elcompromiso de calidad de las instituciones; lanecesidad de garantizar la confidencialidad dela información que proporcionen los informan-tes a la oficina de estadística, y la imparciali-dad y objetividad de las personas que debenelaborar esa información.

- Un segundo bloque hace referencia a los pro-cesos estadísticos, entendiendo por los mismoslas normas, orientaciones y buenas prácticasque deben cumplirse en los procesos que llevana cabo los que elaboran las estadísticas ofi-ciales, necesarios para organizar, recoger, ela-borar y difundir la información obtenida. Losprincipios descritos exigen la necesidad de uti-lizar una metodología sólida y unos pro-cedimientos estadísticos adecuados queno supongan una carga excesiva para los en-cuestados y que tengan una adecuada relacióncoste-eficacia.

Respecto a lo anterior conviene señalar quelas exigencias de información de la Unión Eu-ropea junto a las mayores demandas de lasComunidades Autónomas, necesarias para de-finir sus políticas, han llevado a aumentar lacarga estadística, principalmente en las em-presas, detectándose una necesidad de un ma-yor aprovechamiento de las fuentes adminis-trativas que pueda facilitar al menos una mo-deración de esa carga estadística.

4

EDITORIAL

- El tercer bloque tiene que ver con la produc-ción estadística y la necesidad de satisfacerlas necesidades de los usuarios, entre los quese pueden señalar instituciones europeas, go-biernos, equipos de investigación, empresas yel público en general. Los principios determi-nados para evaluar la producción estadísticason la pertinencia de la información, la pre-cisión y fiabilidad (necesidad de documen-tar sistemáticamente los errores de muestreoy los ajenos al muestreo), la oportunidady puntualidad, la coherencia y compara-bilidad de la información a nivel interno alo largo del tiempo, o entre regiones o paí-ses y, por último, la accesibilidad y clari-dad de las estadísticas oficiales, difundiendolas mismas de forma imparcial, con metadatosy orientación de apoyo.

Lo fundamental de estos principios es que no selimitan exclusivamente al ámbito de recomendacio-nes sino que las instituciones responsables de pro-ducir estadísticas para la Unión Europea van a serevaluadas, siguiendo estos principios, por personasindependientes de otras instituciones o países euro-peos.

Por lo tanto, tal y como se deduce de lo anterior,los elementos a considerar en la estadística oficialson muchos y de muy diversa índole, mereciendoser destacado el uso de metodologías apropiadas,que nos permitan obtener información más fiable ycon menos carga para los informantes.

Así, existen temas en los que debemos poner es-pecial interés en su investigación, como por ejemplo,el de las estimaciones en áreas o dominios pequeños,el aprovechamiento de las fuentes administrativas,la resolución sistemática de los problemas asociadosa la confidencialidad de la información, la mecani-zación de los procesos de imputación y depuraciónpara cualquier encuesta tanto en sus variables cuan-titativas como en las cualitativas, la utilización deestimadores asistidos o basados en modelos.

Aunque se podría señalar otras áreas de investi-

gación, solo con las ya mencionadas queda patenteque la colaboración entre el INE y la comunidadcientífica no sólo es necesaria sino imprescindible.

El beneficio de esta colaboración será mutuo.Para el INE, porque ayudará a resolver problemasplanteados en la actualidad y asumir nuevos retos,y para la Universidad, porque se le brinda la opor-tunidad de acceder a una gran variedad de datosdel mundo real y poder tomar contacto con proble-mas desconocidos para ellos, pudiendo contrastar lavalidez práctica de sus investigaciones teóricas. Así,si bien los lazos entre la Universidad y el InstitutoNacional de Estadística son cada vez mayores, seconsidera indispensable no descuidar esta coopera-ción y, si es posible, impulsarla en beneficio de laestadística.

Como prueba de estas relaciones se encuentra laparticipación del INE como miembro de la SEIO, laasistencia cada vez mayor de los expertos del mundoacadémico y científico a los foros que el INE tienecon los usuarios de la información, o los conveniosde colaboración que se firman entre el INE y de-terminadas universidades con el objeto de investi-gar problemas concretos que se han planteado enel proceso de producción de las estadísticas oficia-les. También quisiera recordar, que el INE brindaa todas las personas interesadas la posibilidad detrabajar en esta institución, pues de forma regularse incluye en la oferta pública de empleo un nú-mero significativo de plazas tanto para el CuerpoSuperior de Estadísticos del Estado, como para elCuerpo de Diplomados en Estadística del Estado,que les permitirá desarrollar la carrera profesionaldentro del INE.

Para finalizar, quiero agradecer a la SEIO laoportunidad que me ha brindado de participar enesta revista a través del editorial y manifestar unavez más mi deseo e ilusión en que nuestras insti-tuciones colaboren estrechamente para mejorar laestadística, y en especial la estadística oficial.

Madrid, 21 de junio de 2006.

5

ARTÍCULOS DE ESTADÍSTICA

1. ARTÍCULOS DE ESTADÍSTICA

ESTADÍSTICA NO PARAMÉTRICA: PASADO, PRESENTE Y FUTURO

Wenceslao González Manteiga y Rosa María Crujeiras CasaisDepartamento de Estatística e Investigación Operativa

Universidade de Santiago de Compostela

Resumen

La estadística no paramétrica engloba una seriede técnicas de inferencia cuya característica prin-cipal es la ausencia de un modelo paramétrico dedistribución subyacente.

Sin pretender revisar todos y cada uno de losconceptos e ideas que conforman este planteamien-to, es nuestro objetivo que el lector se familiaricecon términos como técnicas de suavizado, Boots-trap, verosimilitud empírica o datos funcionales, suporqué, su utilidad, su relevancia en la estadísticaactual y la posible proyección hacia el futuro.

1. De la distribución empírica a las técnicasde suavizado.

Gran parte de la inferencia estadística paramé-trica (Bayesiana o no) trabaja bajo el supuesto dedisponer de una muestra aleatoria simple (m.a.s.)~X = (X1, . . . , Xn) de una variable poblacional X.A esta variable poblacional se le supone una distri-bución Fθ con θ un parámetro desconocido finitodimensional. Los diversos métodos de estimaciónpuntual de θ, la construcción de regiones de con-fianza o los contrastes de hipótesis para dicho pará-metro, fueron abordados a lo largo del siglo XX, yresumidos en su parte esencial, en textos como losLehmann ([14] y [15], en sus ediciones revisadas)o los más recientes [24] y [27], entre otros. Estostextos se utilizan además como referencia en cursosde estadística matemática.

En este contexto, la especificación errónea dela distribución poblacional Fθ, o incluso, su to-tal desconocimiento, propiciaron el desarrollo de lainferencia estadística no paramétrica. No se presu-pone un modelo paramétrico para la distribuciónpoblacional y simplemente se actúa con la filoso-fía de dejar hablar a los datos. En el enfoque no

paramétrico, la distribución F de la variable po-blaciónal no está caracterizada por un parámetrofinito dimensional.

Sin la suposición precisa de un modelo paramé-trico de distribución poblacional para la variablede interés, nos encontramos en una encrucijada enla que el problema de inferencia puede ser abor-dado desde dos vertientes: (a) considerar, como yase comentó, que el espacio de posibles distribucio-nes F no se puede parametrizar de forma finitodimensional, o bien (b) examinar alguna distanciad(F, Fθ) entre la distribución poblacional descono-cida y una posible distribución paramétrica para elmodelo poblacional.

La vía (a) dio origen a varios procedimientos deestimación, como los M-estimadores, L-estimadoreso R-estimadores. Estos estimadores conforman laextensión de los métodos de estimación de máximaverosimilitud, en el caso de los M-estimadores; delos estadísticos de orden, para los L-estimadores; yde los estadísticos de rango, para los R-estimadores.El objetivo en este caso es hacer inferencia sobreuna cierta característica T (F ), donde F es la distri-bución poblacional y T un funcional definido sobreel espacio de distribuciones. Por ejemplo, el librode Serfling, [22], recoge un resumen didácticamenteordenado del material elaborado en las décadas delos sesenta y setenta. Otros textos coetáneos, como[11] o [13] estudiaron el llamado análisis de la ro-bustez que permitía estudiar la sensibilidad de losdiversos estimadores a la desviación de un modelopoblacional.

Por otro lado, los llamados tests de bondad deajuste nacen del enfoque (b) y han evolucionadodesde sus inicios con el más básico Kolmogorov-Smirnov, donde d(F , Fθ) = sup |F (x) − Fθ(x)|, F

es un estimador no paramétrico de la función de dis-

6

ARTÍCULOS DE ESTADÍSTICA

tribución y θ un estimador para θ, a distintos testsalternativos a este (ver, por ejemplo [8]); como lostests del tipo Cramer Von Mises o de tipo χ2, porejemplo. Aunque con diferentes planteamientos, elobjetivo es siempre ubicar el modelo de distribuciónF en una determinada familia paramétrica.

En la mayoría de los procedimientos de estima-ción o contrastes antes descritos interviene con fre-cuencia un estimador piloto no paramétrico. En elcaso del test de Kolmogorov-Smirnov, este estima-dor es la la distribución empírica:

F (x) = Fn(x) =1n

n∑

i=1

1{Xi≤x}. (1)

Este mismo estimador Fn aparece, por ejem-plo, en los métodos de M-estimación, donde un M-estimador es la solución a una ecuación del tipo:

∫Ψ(x, t)dFn(x) = 0, (2)

siendo Ψ una función elegida de antemano para elestimador correspondiente.

Una de las principales dificultades en la inferen-cia no paramétrica surge cuando se pretende esti-mar cantidades T (F ) que dependen de la derivadade F , sin ir más lejos:

T (F ) = F ′(x) = f(x) = lımh→0

F (x + h)− F (x− h)2h

,

(3)la función de densidad asociada a la variable pobla-cional. La estimación de la densidad dio lugar a lasdenominadas técnicas de suavizado. Es así que unestimador natural de (3) es el que viene dado por

fh(x) =Fn(x + h)− Fn(x− h)

2h, con h → 0 (4)

el llamado estimador de Rosenblatt [21], generali-zado por Parzen en [18] a los populares estimadorestipo núcleo:

fh(x) =1

nh

n∑

i=1

K

(x−Xi

h

), (5)

donde la función núcleo o kernel K es una funciónde densidad y h se denomina parámetro ventana.El estimador de Rosenblatt se corresponde con laelección de un núcleo uniforme. Una revisión de las

técnicas no paramétricas para la estimación de ladensidad puede verse en [23], que representa unode los primeros textos, de una larga lista, dedica-dos a las técnicas de suavización publicados en losúltimos veinte años.

Las técnicas de suavización no paramétrica,que surgen en el contexto de la estimación dela densidad, rápidamente se extendieron al pro-blema de estimación de otras funciones estadís-ticas notables, como la función de razón de fa-

llo en fiabilidad r(x) =f(x)

1− F (x), la función

de regresión m(x) = E(Y |X = x) ligada a unvector (X, Y ) ∈ Rq+1 ó la varianza condicionalσ2(x) = V ar(Y |X = x).

Para el caso de la función de regresión, dondela selección de un modelo paramétrico no adecuadopuede llevarnos a conclusiones incorrectas, el primerestimador tipo núcleo es el de Nadaraya-Watson (in-troducido en [16] y [26]), que viene dado por:

m(x) =∑n

i=1 K(

x−Xi

h

)Yi∑n

i=1 K(

x−Xi

h

) , (6)

donde la concentración local de datos propia delestimador de la densidad (5) se sustituye por elpromedio local de la variable respuesta.

También existen otros estimadores tipo núcleo,como el de Priestley-Chao o el de Gasser-Muller(véase [12]). Una excelente revisión de estas técni-cas de suavización, tanto para el caso de la densidadcomo para la regresión, puede verse en [25]. En estetexto también se incluyen diversos capítulos dedi-cados al problema de la selección del parámetro h

de suavizado.

Los procedimientos de suavización también seabordaron desde espacios funcionales alternativosal de las funciones derivables.

Si la función de regresión puede escribirse comom =

∑∞k=1 ck(m)φk, donde {φk}∞k=1 es un sistema

ortogonal completo de L2 y ck(m), k = 1, 2, . . . loscoeficientes de Fourier de m, un estimador suaviza-do natural viene dado por:

mO =M∑

k=1

ckφk (7)

7

ARTÍCULOS DE ESTADÍSTICA

siendo ck los estimadores de los coeficientes de Fou-rier y M el número de coeficientes estimados (ver[2]).

Otra alternativa es la suavización spline mS ,donde dicho estimador viene dado por el argumentoque minimiza

mınm

1n

n∑

i=1

(Yi −m(Xi))2 + λ

∫ 1

0

(m(p)(x))2dx,

y cuya solución es una función del espacio de Sobo-lev W p

2 [0, 1] (ver [10]). El caso particular de p = 2se corresponden con el conocido spline cúbico. Tam-bién de forma alternativa a los estimadores clásicostipo núcleo, tuvieron éxito los estimadores de tipolineal local [6] y más recientemente, de manera al-ternativa a los estimadores basados en desarrollosortogonales, los estimadores wavelet [2].

2. El Bootstrap. Todavía actualidad.

En un artículo de Annals of Statistics en 1979,[3], Efron introdujo una metodología que alcanzaríasu mayor explendor años después, con el desarrollocomputacional: nos referimos al Bootstrap.

El Bootstrap es una metodología de inferenciaestadística basada en el remuestreo de los datos ycuyo principal inconveniente (aunque no tanto hoyen día) es la necesidad de computación intensiva.Dada una m.a.s. ~X de una variable aleatoria X,denotaremos por ~X∗ a las distintas remuestras quese puedan obtener a partir de una estimación dela distribución poblacional. Si estas remuestras segeneran a partir de la distribución empírica Fn, elprocedimiento se denomina Bootstrap Naive; si lageneración de datos se hace a partir de un estimadornúcleo

Fh(x0) =∫ x0

−∞fh(x)dx

tendremos un Bootstrap Suavizado; también exis-ten las alternativas de Bootstrap Paramétrico, Si-metrizado, Bootstrap Bayesiano, entre otras opcio-nes.

Consideremos R( ~X, F ) = T ( ~X) − T (F ), sien-do T ( ~X) un estimador de T (F ). Si se tiene comoobjetivo estimar la distribución de R( ~X,F ) dadapor G(t) = PF {R( ~X, F ) ≤ t}, el estimador natural

Bootstrap es GBoot = PF {R( ~X∗, F ) ≤ t}. El esti-mador Bootstrap GBoot raramente tiene expresiónexplícita y debe ser aproximado por Monte Carlo:

GBoot(t) =1B

B∑

j=1

1{R( ~X∗j ,F )≤t}, (8)

siendo ~X∗j , con j = 1, . . . , B, remuestras artificalesde la distribución F , estimador de F .

La elección que hemos hecho de R es la mássencilla y permitiría inferir sobre la distribución deT ( ~X) como estimador de T (F ), pudiendo así cons-truirse regiones de confianza o plantear contras-tes de hipótesis. La adaptación de la metodologíaBootstrap a otros problemas notables, como pue-den ser el cálculo de la probabilidad de clasificaciónincorrecta en el análisis discriminante o la cons-trucción de bandas de confianza para una funciónde distribución, nos llevarían a distintas eleccionesde R, que conforman la literatura dedicada a estemétodo en las dos últimas décadas.

Igual que el Barón de Munchausen salió dellago tirando de los cordones de sus botas (en in-glés bootstraps), del mismo modo Efron presentauna metodología que se apoya en los datos de lamuestra observada, para sobre esas observaciones,construir nuevas muestras.

En los últimos quince años han aparecido diver-sas publicaciones dedicadas a la metodología Boots-trap, como [1] y [5], aunque ya más recientemente,el Bootstrap representa uno o varios capítulos delos textos sobre estadística matemática ([24] o [28])en los cursos de licenciatura y doctorado.

3. La verosimilitud empírica: la verosimi-litud de finales del siglo XX.

Volviendo al planteamiento inicial de conside-rar una m.a.s. ~X de una variable aletoria X condistribución Fθ y densidad o masa de probabilidadasociada fθ, si planteamos la función de verosimi-litud ψ(θ) =

∏ni=1 fθ(Xi), el estimador máximo

verosímil θ para el parámetro θ, se obtiene comoel argumento que maximiza ψ(θ). Este método fueestudiado a lo largo del siglo pasado y el principiode verosimilitud sigue presente en textos actuales,

8

ARTÍCULOS DE ESTADÍSTICA

como [19], entre otros muchos.

Nuevamente nos encontramos ante el supues-to de una distribución paramétrica para la varia-ble de interés y una vez más, desde el enfoqueno paramétrico, se aborda este planteamiento demáxima verosimilitud sin presuponer un modelopoblacional para X. De este modo, cuando no sesabe nada sobre el modelo poblacional, uno puedeconsiderar una verosimilitud de tipo no paramé-trico: Ψ(F ) =

∏ni=1(F (Xi) − F (X−

i )) =∏n

i=1 ωi,~ω = (ω1, . . . , ωn). De forma natural, se deduce queel estimador de máxima verosimilitud no paramé-trico se alcanza en F = Fn, dada por (1).

La idea de la verosimilitud empírica (o verosimi-litud no paramétrica) es reciente, introducida porOwen a finales de los ochenta. Gran parte de susdesarrollos en la década de los noventa se recogenen [17]. La clave del éxito de esta técnica y su cre-ciente desarrollo en los últimos años radica en suflexibilidad y versatilidad para incorporar en la ve-rosimilitud las restricciones que impone el modelo.Así, como ejemplos notables:

1) Si sabemos que µ0 =∫

xdF (x) es la media(conocida) de X, el estimador máximo verosí-mil para F bajo esta restricción, se obtendríacomo el argumento que maximiza:

max~ω

(nY

i=1

ωi :X

ωiXi = µ0, ωi ≥ 0,X

ωi = 1

).

2) Si suponemos además que la varianza de X esσ2

0 =∫

(x− µ0)2dF (x); el estimador de máxi-ma verosimilitud vendría dado por:

max~ω

(nY

i=1

ωi :X

ωXi = µ0,X

ωi(Xi − µ0)2 = σ2,

ωi ≥ 0,X

ωi = 1o

.

De la misma forma que, para el contraste deH0 : θ ∈ Θ0 vs. Ha : θ /∈ Θ0, con Θ0 ⊂ Θ, liga-do a la clásica razón de verosimilitudes

λ =supθ∈Θ0

∏ni=1 fθ(Xi)

supθ∈Θ

∏ni=1 fθ(Xi)

(9)

tenemos el test de razón de verosimilitudes, con re-gión crítica {−2 log λ > c}, lo mismo se puede con-siderar para la verosimilitud empírica. Supongamos

que se pretende contrastar H0 : µ0 =∫

xdF (x).El test de razón de verosimilitudes no paramétricovendría dado por:

R =max{Qn

i=1 ωi :P

ωiXi = µ0, ωi ≥ 0,P

ωi = 1}max{Qn

i=1 ωi : ωi ≥ 0, ωi = 1}

= max

(nY

i=1

nωi :X

ωiXi = µ0, ωi ≥ 0,X

ωi = 1

)

Igual que para la razón de verosimilitudes pa-ramétrica, resultados del tipo −2 log R →d χ2

m

también se obtienen en este contexto, y en el casoparticular anterior resulta m = 1.

En el reciente libro de Owen antes citado, [17],se presenta la metodología de verosimilitud empí-rica en su conjunto para el contexto de regresión,para datos incompletos o con censura, entre otrassituaciones notables de la inferencia estadística.

4. La estadística con datos funcionales. Laera de los datos de alta dimensión.

La explosión del llamado data mining (tam-bién conocido como KDD: Knowledge-Discovery inDatabases), está produciendo una variedad de si-tuaciones, en diferentes contextos, en que los datosmedidos son realmente curvas. Por ejemplo, el nivelde ozono medido durante un día o un indicador dealta frecuencia de un activo financiero en la bolsaa lo largo de una hora. De esta forma, el dato ob-servado es ahora χ = {X(t) : t ∈ (tmin, tmax)} ypodríamos considerar una muestra de datos funcio-nales χ1, . . . , χn que tuviese la misma distribuciónque χ.

De modo más genérico, una variable aleatoria χ

se dice que es una variable funcional si toma valoresen un espacio de dimensión infinita. Con este tipode planteamiento entramos en la era actual y futurade la estadística no paramétrica con datos funcio-nales. Por ejemplo, supongamos que el soporte dela variable funcional es L2(0, 1) y consideremos unmodelo de regresión del tipo: Y = m(X ) + ε, en elque Y ∈ R y ε es una v.a. real de media cero. Elobjetivo podría ser estimar no paramétricamente elfuncional m(·) : L2(0, 1) → R.

Las técnicas estadísticas para datos reales ovectoriales no se extienden de forma trivial al con-

9

ARTÍCULOS DE ESTADÍSTICA

texto de datos funcionales. Si tenemos un modelode regresión no paramétrico Y = m(X) + ε y con-sideramos un estimador no paramétrico del tipoNadaraya-Watson, como en (6) nos puede interesarcontrastar la hipótesis nula de que el modelo eslineal m(X) = βT X. Esto se podría hacer a tra-vés de cualquier estadístico del tipo d(m(X),βT X),que establece una distancia entre el estimador noparamétrico y el paramétrico, por ejemplo, una dis-tancia de tipo L2 (ver [9]).

En el supuesto de datos funcionales el mode-lo lineal es ahora del tipo m(X ) =

∫ 1

0β(t)X (t)dt

y por tanto también de dimensión infinita, ya quelo desconocido β es también una función. Podemosconstruir un estimador no paramétrico del funcio-nal m, análogo al de Nadaraya-Watson del contextode regresión, que vendría dado por:

m(χ) =

∑ni=1 K

(d(χ,χi)

h

)Yi

∑ni=1 K

(d(χ,χi)

h

) (10)

donde d es una semimétrica asociada al espacio defunciones y K es una función núcleo asimétrica.

En un contexto finito dimensional, en la distri-bución del estadístico d(m(X), βT X), la estimaciónparamétrica puede tener menos peso que la de m,ya que sus tasas de convergencia hacia la funciónteórica son más rápidas. Pero ¿qué ocurre si la dis-tancia se mide en el contexto de datos funcionales?Ambos parámetros, m y β son de dimensión infini-ta. Problemas similares a este merecen sin duda elinterés de la futura metodología estadística.

Siguiendo esta línea de extensión de las técnicasde regresión no paramétrica a los datos funcionales,[7] es una buena referencia. Un planteamiento al-ternativo para el estudio de datos funcionales, muypróximo a la metodología de la estimación spline,se recoge en [20].

5. Algunas aplicaciones.

Sin tratar de ser exhaustivos, finalizamos estanota comentando algunas aplicaciones donde la in-ferencia no paramétrica juega un papel importante.

Para aproximar la fórmula de Black-Scholes al

comportamiento del mercado, se hace necesario mo-delizar la volatilidad de manera heterocedástica ypor tanto, se requiere la estimación no paramétricade la varianza.

En los modelos de predicción kriging de la es-tadística espacial, la suposición de estacionariedadpuede resultar restrictiva para llevar a cabo pre-dicciones en problemas de medio-ambiente. Losmodelos de predicción han de adaptarse de formalocal, y esta adaptación requiere de técnicas de sua-vización no paramétricas.

Dentro de la estimación de conjuntos, puedeplantearse como objetivo estimar el soporte de unacierta variable X, con distribuciónn F desconoci-da. Una estimación del soporte vendría dada poraquellos puntos donde una estimación no paramé-trica de la densidad tomase valores positivos. Esteplanteamiento podría tener aplicación directa en elreconocimiento de imágenes, entre otras situacio-nes.

En estos ejemplos, junto con los ya comentadosen el apartado dedicado a la estadística con datosfuncionales, ¿tendría sentido el suponer un modeloparamétrico? La respuesta no es evidente. Pero loque sí queda claro es que el planteamiento no para-métrico puede aportar una solución.

6. Conclusiones.

Como se deduce de este recorrido por la inferen-cia no paramétrica, las razones del porqué de estemodo de hacer inferencia son claras. La metodolo-gía no paramétrica es, ante todo, flexible, capaz demodelizar sin suposiciones paramétricas restrictivasy sobre todo, rica y elegante desde el punto de vistamatemático. Es esta flexibilidad, junto con el desa-rrollo computacional, lo que ha permitido el éxitode muchas de estas técnicas en los últimos años.Como ejemplo más claro, no sólo la multitud deartículos y referencias en la literatura, sino tambiénsus numerosas aplicaciones en modelos de interés.

Efron, [4], hace una reflexión sobre los dos mo-dos de hacer estadística, todavía enfrentados. Laestadística bayesiana dominó el siglo XIX, mientrasque la estadística del siglo XX fue más frecuentis-ta. ¿Hacia dónde va la estadística del siglo XXI?

10

ARTÍCULOS DE ESTADÍSTICA

Como Efron sugiere, los nuevos problemas a los quese enfrenta la estadística, sólo podrán ser resueltoscombinando ambas filosofías. Desde nuestra posi-ción no creemos osado afirmar que uno de los nexosde unión entre estos enfoques podría ser la estadís-tica no paramétrica.

Referencias

[1] Davison, A. C. and Hinkley, D.V. (1997). Boots-trap Methods and their Application. CambridgeUniversity Press.

[2] Efromovich, S. (1999). Nonparametric CurveEstimation. Methods, Theory and Applications,Springer.

[3] Efron, B. (1979). Bootstrap methods: anotherlook at the jackniffe. Ann. Stat., 7, 1-26.

[4] Efron, B. (2004). Bayesians, frequentists andscientists. Text of the 164th ASA presidentialaddress.

[5] Efron, B. and Tibshirani, R.J. (1993). An Intro-duction to the Bootstrap. Chapman Hall.

[6] Fan, J. and Gijbels, I. (1996). Local PolynomialModelling and its Applications, Chapman Hall.

[7] Ferraty, F. and Vieu, P. (2006). NonparametricModelling for Functional Data. Springer.

[8] Gibbons, J.D. and Chakraborti, Sl. (1992). Non-parametric Statistical Inference. Third Edition,Revised and Extended, Marcel Dekker.

[9] González-Manteiga, W. and Cao, R. (1993).Testing the hypothesis of a general linear mo-del using non parametric regression estimation.Test, 2, 161-188.

[10] Gu, C. (2002). Smoothing Spline Anova Mo-dels, Springer.

[11] Hampel, F.R., Ronchetti, E.M., Rousseeuw,P.J. and Stahel, W.A. (1986). Robust Statistics:the Approach Based on Influence Functions, Wi-ley.

[12] Härdle,W. (1990). Applied Nonparametric Re-gression. Cambridge.

[13] Huber, P.J. (1981). Robust Statistics, Wiley.

[14] Lehmann, E.L. (1991). Theory of Point Esti-mation, The Wadsworth & Brooks.

[15] Lehmann, E.L. (1991). Testing Statistical Hy-pothesis, The Wadsworth & Brooks (2nd edi-tion).

[16] Nadaraya, E.A. (1964). On estimating regres-sion. Theor. Prob. Appl., 10, 186-190.

[17] Owen, A.B. (2001). Empirical Likelihood.Chapman & Hall.

[18] Parzen, E. (1962). On the estimation of a pro-bability density function and the mode. Ann.Math. Stat., 33, 1065-1076.

[19] Pawtan, Y. (2001). In all Likelihood: StatisticalModelling and Inference Using Likelihood. Ox-ford Science Publications.

[20] Ramsay, J.O. and Silverman, B.W. (2005).Functional Data Analysis. Springer, 2nd edition.

[21] Rosenblatt, M. (1956). Remarks on some non-parametric esitmates of a density function. Ann.Math. Stat., 27, 832-837.

[22] Serfling, R.J. (1980). Approximation Theoremsof Mathematical Statistics, Wiley.

[23] Silverman, B. (1985). Density Estimation forStatistics and Data Analysis, Chapman & Hall.

[24] Shao, J. (2003).Mathematical Statistics, Sprin-ger (2nd edition).

[25] Wand, M. P. and Jones, M.C. (1995). KernelSmoothing, Chapman & Hall.

[26] Watson, G.S. (1964). Smooth regression analy-sis. Sankhya, Ser. A, 26, 101-116.

[27] Wasserman, L. (2004). All of Statistics. A Con-cise Course in Statistical Inference, Springer.

[28] Wasserman, L. (2006). All of NonparametricStatistics, Springer.

11

ARTÍCULOS DE INVESTIGACIÓN OPERATIVA

2. ARTÍCULOS DE INVESTIGACIÓN OPERATIVA

ESTABILIDAD EN PROGRAMACIÓN SEMI-INFINITA LINEAL: UNENFOQUE CUANTITATIVO

María Josefa Cánovas Cánovas y Juan Parra LópezDpto. de Estadística, Matemáticas e Informática

Centro de Investigación OperativaUniversidad Miguel Hernández de Elche

1. Introducción

El objetivo de este artículo es ofrecer al lectoruna breve incursión en el campo de la programa-ción lineal con infinitas restricciones, resaltando lasdiferencias con la programación lineal ordinaria, yadentrándonos fundamentalmente en cuestiones deestabilidad y su cuantificación.

El término Programación Semi-Infinita (PSI) seaplica a problemas de optimización en los que bienel número de variables o bien el de restricciones esfinito. Se insiste así en que este concepto abarcacomo caso particular a los problemas con n variablesy m restricciones. Prestaremos especial atención alos problemas de PSI lineal (PSIL). Si llamamos pri-mal a un problema con n variables y (posiblemente)infinitas restricciones, entonces su dual tendrá (po-siblemente) infinitas variables y n restricciones.

Los problemas de programación semi-infinita li-neal surgen de manera natural al modelar situa-ciones, o reformular modelos, en diferentes camposde aplicación, como la aproximación funcional, esti-mación de parámetros, reconocimiento de patrones,políticas medioambientales, etc. El lector interesa-do no debería perderse la monografía de Miguel A.Goberna y Marco A. López [12] sobre PSIL. Asi-mismo recomendamos la lectura del reciente artícu-lo de revisión de Marco A. López y Georg Still [15]sobre PSI, en el que se describen fundamentos teóri-cos (incluyendo condiciones de optimalidad), méto-dos numéricos (como los de discretización), diversasaplicaciones y una revisión histórica del tema. Enconcreto se presentan aplicaciones de la PSI a laaproximación de Chebyshev, física matemática, ro-bótica, geometría, optimización bajo incertidumbre(optimización robusta) y economía. En [15] se citanademás ciertas aplicaciones a la estadística (diseñode experimentos, regresión, estimación por máximaverosimilitud con restricciones, robustez en estadís-

tica bayesiana, estadística actuarial, etc.). Véanse,p.e., [8] y [12].

A modo de ilustración, describiremos muy bre-vemente un par de aplicaciones de la PSIL: la apro-ximación de Chebyshev (uniforme) por funcionespolinómicas y la optimización robusta aplicada alproblema de la cartera.

Imaginemos que buscamos un polinomio de gra-do menor o igual que n en la variable t, pongamosp (t) = x0 + x1t + ... + xntn, que constituya unamejor aproximación uniforme de una función da-da f en [a, b] . En principio no requerimos ningu-na propiedad a f . Dicho problema es equivalen-te al siguiente problema de PSIL en las variablesx0, x1, ..., xn, xn+1 (donde escribimos Inf en vez deMin):

Inf xn+1

s. a ± (x0 + tx1 + ... + tnxn)− xn+1

≤ ±f (t) ∀t ∈ [a, b] .

Consideremos ahora el problema de la carte-ra: Queremos invertir un capital k > 0 por unperiodo de un año en n bienes cuyo rendimiento(por unidad monetaria invertida) al cabo del ci-tado año denotamos por t1, ..., tn, respectivamente.Ciertamente existe incertidumbre sobre el valor det = (t1, ..., tn) . De no ser así, nuestra decisión óp-tima consistiría en invertir todo el capital en unode los bienes (si hay varios) con rendimiento máxi-mo. Supongamos que, basándonos en la experien-cia y ciertos modelos económicos podemos predecir(con un cierto margen de confianza) que t varia-rá en un subconjunto T ⊂ Rn; entonces el enfoquepesimista de la situación nos llevará a buscar el be-neficio máximo en el peor de los casos, lo que con-duce al problema de PSIL (llamado de optimización

12

ARTÍCULOS DE INVESTIGACIÓN OPERATIVA

robusta):

Sup v

s. a t1x1 + ... + tnxn − v ≥ 0 ∀ (t1, ..., tn) ∈ T

x1 + ... + xn = k, x1 ≥ 0, ..., xn ≥ 0.

La PSI ha despertado el interés de diferentesgrupos de investigación desde su inicio, a principiosde los años 60, con una serie de artículos (sobrePSIL) de Charnes, Cooper y Kortanek, tanto porlos atractivos desarrollos teóricos a los que da lu-gar como por la variedad de sus aplicaciones. Loscitados autores acuñaron el término semi-infinita.Desde entonces se han escrito más de mil artículosy diez libros sobre teoría, métodos numéricos y apli-caciones de la PSI. Los antecedentes de esta disci-plina se encuentran, entre otros, en la aproximaciónde Chebyshev, el trabajo de Haar sobre sistemas(semi-infinitos) lineales (1924) y las condiciones deoptimalidad de Fritz John (1948). Cabe destacarque la PSI constituye un campo de investigación alque se puede acceder desde diferentes áreas mate-máticas, como el análisis, la geometría diferencial,la topología, el cálculo numérico, y por supuesto lainvestigación operativa.

Son numerosos los investigadores internaciona-les que han dedicado parte de sus esfuerzos a la PSI(lineal y no lineal). Entre ellos citaremos a Brosows-ki, Fischer, Jongen y Stein en Alemania, Klatte enSuiza, Still en Holanda, Jiménez, Rückmann y To-dorov en México, Vera de Serio en Argentina, Rubi-nov en Australia, Weber en Turquía, Vaz y Fernan-des en Portugal, etc. A nivel nacional, y pidiendodisculpas por adelantado por las involuntarias omi-siones, el tema tuvo un desarrollo inicial con Mar-co A. López y sus entonces doctorandos Miguel A.Goberna, Jesús T. Pastor y poco después Enrique-ta Vercher. Esta última ha liderado un grupo enValencia (Teresa León y Susana Sanmatías) que haavanzado, entre otros, en el campo de los algorit-mos y las aplicaciones. Miguel A. Goberna y Mar-co A. López lideran el grupo de Alicante (ValentínJornet, Margarita Rodríguez, Mariola Molina y Ma

Dolores Fajardo), mientras que los arriba firmantes,de la mano de Marco A. López, encabezan el grupode Elche (junto con Fco. Javier Toledo, Francisco J.Gómez-Senent y colaboraciones puntuales de EvaMa Ortega). Entre las aproximaciones al tema des-de áreas afines citaremos a Juan E. Martínez Legazy Albert Ferrer en Barcelona, Beatriz Hernández

en Huelva, y Natividad Llorca y Joaquín SánchezSoriano en Elche.

Tras la imprescindible dosis de notación, empe-zaremos resaltando algunas diferencias notables conel campo de la programación lineal (PL) ordinaria.Un problema típico de PSIL puede formularse como

π : Inf c′xs. a a′tx ≥ bt, t ∈ T,

(1)

donde x ∈ Rn es el vector de variables de deci-sión, considerado como matriz columna, y′ denotael traspuesto de y ∈ Rn, T es un conjunto de índicescompletamente arbitrario (posiblemente infinito), yla función T 3 t 7→ (

at

bt

) ∈ Rn × R es igualmentearbitraria. Denotamos por σ al sistema de restric-ciones de π, esto es,

σ := {a′tx ≥ bt, t ∈ T} . (2)

El problema π puede identificarse con el par (c, σ)perteneciente al espacio paramétrico Π = Rn × Θ,

donde Θ ≡ (Rn × R)T es el espacio paramétricode los sistemas del tipo (2), identificando σ con(at

bt

)t∈T

. Asociados a π = (c, σ) consideramos lossiguientes elementos:

F := {x ∈ Rn : a′tx ≥ bt para todo t ∈ T}, elconjunto factible de π (o de σ);

v := inf {c′x : x ∈ F} ∈ [−∞, +∞], el valor óp-timo de π (v = +∞ si F = ∅);

F ∗ := {x ∈ F : c′x = v}, el conjunto óptimo deπ.Asimismo, denotaremos por F ,F∗ : Π ⇒ Rn alas multifunciones (correspondencias) conjunto fac-tible y conjunto óptimo, respectivamente, y porϑ : Π −→ [−∞, +∞] a la función valor óptimo.

Cuando consideremos diferentes problemas, és-tos y sus elementos asociados se distinguiránpor medio de sub(super)índices. Así, si π1 ∈Π escribiremos π1 =

(c1, σ1

), donde σ1 :={(

a1t

)′x ≥ b1

t , t ∈ T}

, y el conjunto factible, valoróptimo y conjunto óptimo de π1 se representaránrespectivamente por F1, v1 y F ∗1 .

Consideramos los siguientes subconjuntos rele-vantes de Π y de Θ:

Πc := {π = (c, σ) ∈ Π : σ ∈ Θc}, donde Θc :={σ ∈ Θ : F 6= ∅};

Πb := {π = (c, σ) ∈ Π : v es finito};Πs := {π = (c, σ) ∈ Π : F ∗ 6= ∅};Πd

c :={π = (c, σ) ∈ Π : πd es consistente

}.

13

ARTÍCULOS DE INVESTIGACIÓN OPERATIVA

Obviamente Πs ⊂ Πb ⊂ Πc. Aquí los subíndices c,

b y s significan respectivamente consistente, acota-do y resoluble, mientras que el superíndice d hacereferencia al problema dual de π (en el sentido deHaar), que viene dado por

πd : Sup∑t∈T

λtbt

s.a∑t∈T

λtat = c,

λ ∈ R(T )+ ,

(3)

donde R(T )+ es el cono convexo de todas las funcio-

nes λ : T → R+ (:= [0,+∞[) que toman valores po-sitivos solamente en una cantidad finita de índices.El hecho de considerar un espacio tan restrictivo(cuando T es infinito) para las variables duales obe-dece a la necesidad de garantizar la finitud de lassumas cuando las funciones de coeficientes t 7→ (

at

bt

)

son arbitrarias. Si se imponen condiciones adecua-das a dichas funciones de coeficientes, puede am-pliarse el espacio de las variables duales.

Como anunciábamos hace una líneas, empezare-mos reseñando algunas diferencias notables entre laPSIL y la PL ordinaria. En concreto: en PL ordina-ria el conjunto factible es poliéderico, un problemaes acotado si y sólo si es resoluble, lo que ocurre si ysólo si es primal-dual consistente, y no existen sal-tos de dualidad. En PSIL, con T infinito, el conjun-to factible puede ser cualquier subconjunto convexoy cerrado de Rn, los conjuntos Πb, Πs y Πc ∩ Πd

c

son distintos dos a dos y pueden existir saltos dedualidad aún cuando π y πd sean consistentes. Lossiguientes ejemplos ilustran estos comentarios:

Ejemplo 1.1. π ∈ Πs\Πdc . Consideremos el pro-

blema, en R2,

π : Inf x1

s.a x1 + t x2 ≥ 0, t ∈ ]0, +∞[ .

Se tiene F = [0,+∞[2 y F ∗ = {0} × [0, +∞[ ; enparticular π ∈ Πs. Sin embargo, el cono convexogenerado por {at, t ∈ T} es ]0, +∞[2 ∪ {

(0, 0)′}

,

que no contiene a c = (1, 0)′ (véase (3)). Por tantoπ /∈ Πd

c .Ejemplo 1.2. π ∈ (

Πb ∩Πdc

) \Πs y hay salto dedualidad . Consideremos el problema, en R2,

π : Inf x1

s.a t x1 +1tx2 ≥ 2, t ∈ ]0, +∞[ ,

x1 ≥ −1, t = 0.

Puede comprobarse fácilmente que

F ={(x1, x2)

′ ∈ R2 | x2 ≥ x−11 , x1 > 0

},

y por tanto π es acotado (v = 0) pero no resolu-ble. También se comprueba fácilmente que la únicasolución factible del problema dual viene dada porλ0 = 1, λt = 0 si t > 0. Por lo tanto, el valor delproblema dual es vd = λ0b0 = −1.

Nótese que es incluso posible tener salto de dua-lidad cuando π ∈ Πs. Basta añadir al Ejemplo 1.1la última restricción del Ejemplo 1.2.

2. Estabilidad

En la literatura encontramos diferentes criteriosde estabilidad para problemas de optimización o sussistemas de restricciones que, en el caso concreto dela PSIL, resultan ser equivalentes a las condicionesde interioridad π ∈ int (Πc) o π ∈ int (Πs) . Véanse,por ejemplo, [3], [11], [13], [18] y [21]. La topologíaconsiderada en Π es la de la convergencia uniformede los vectores de coeficientes, que viene dada a tra-vés de la distancia extendida δ : Π×Π −→ [0, +∞]definida por

δ (π1, π) := max{∥∥c1 − c

∥∥ , supt∈T

∥∥∥∥(

a1t

b1t

)−

(at

bt

)∥∥∥∥}

,

(4)donde las normas consideradas en Rn y en Rn+1 soncualesquiera previamente fijadas. En este contextose engloban, por ejemplo, aquellas situaciones en lasque los datos sólo se conocen aproximadamente, oestán sujetos a errores de cálculo, en cuyo caso cual-quier perturbación uniformemente pequeña de todoslos coeficientes es admisible. Es evidente que la es-tabilidad de un problema depende y mucho de latopología considerada. El siguiente ejemplo muestraun problema que es muy estable en nuestro contex-to (4) y sin embargo resulta muy inestable cuandose considera inmerso en un contexto paramétrico,en el cual las perturbaciones no recaen directamen-te sobre los coeficientes, sino sobre el parámetro θ

del que dependen.Ejemplo 2.1. Consideremos la familia paramé-

trica de problemas {πθ : θ ∈ R}, en R2, dada por

πθ : Inf x1 + x2

s.a (t + 1) x1 +(t−1 + 1

)x2 ≥

− 1 +θ2t2

1 + θ2t, t ∈ ]0,+∞[ .

Puede comprobarse fácilmente que, para todoθ 6= 0, se tiene F (πθ) = [1, +∞[×[0,+∞[ , ϑ (πθ) =

14

ARTÍCULOS DE INVESTIGACIÓN OPERATIVA

1 y F∗ (πθ) ={(1, 0)′

}; mientras que F (π0) =

[0, +∞[×[0,+∞[ , ϑ (π0) = 0 y F∗ (π0) ={(0, 0)′

}.

De hecho, respecto del conjunto factible, las inclu-siones ‘⊃’ son inmediatas y las inclusiones inversasse siguen del Lema de Farkas (generalizado): divída-se cada inecuación por el correspondiente t y hágaset → +∞; del mismo modo, multiplíquense las des-igualdades por t y tómese t → 0. Así pues, una per-turbación arbitrariamente pequeña de θ = 0 produ-ce una reducción drástica del conjunto factible (entérminos formales, la multifunción conjunto factibleno es semicontinua inferiormente en el parámetroθ = 0), y un alejamiento drástico tanto del valoróptimo como del conjunto óptimo (en ambos ca-sos fallan la semicontinuidad inferior y la superior).Sin embargo, el problema π0, visto ahora en nuestrocontexto (4), goza localmente de gran estabilidad,dado que F (π) = F (π0) y F∗ (π) = F∗ (π0) paratodo π ∈ Π tal que δ (π, π0) < 1 (con respecto de lanorma del supremo en Rn y en Rn+1).

3. Cuantificación de la estabilidad: Dis-tancia al mal planteamiento y regularidadmétrica.

Dado que las condiciones de interioridad π ∈int (Πc) y π ∈ int (Πs) constituyen en sí crite-rios de estabilidad, una forma de cuantificar di-cha estabilidad viene dada por la determinaciónde δ (π, bd (Πc)) y δ (π, bd (Πs)) , donde bd signifi-ca frontera. Convendremos que un problema estámal planteado (ill-posed) respecto de una propiedad(p.e., consistencia primal y/o dual, carácter acota-do o resolubilidad) cuando perturbaciones arbitra-riamente pequeñas del problema puedan originartanto problemas verificando dicha propiedad, comootros no haciéndolo; esto es, un problema se dicemal planteado respecto de una propiedad cuandopertenece a la frontera del conjunto de los proble-mas que gozan de la propiedad en cuestión. En estesentido las expresiones δ (π, bd (Πc)) , δ (π, bd (Πb)) ,

δ (π, bd (Πs)) , δ(π, bd

(Πd

c

))y δ

(π, bd

(Πc ∩Πd

c

))

representan diferentes nociones de distancia al malplanteamiento en PSIL. Dicha distancia es el obje-to de estudio de [20], y allí se prueba que bd (Πb) =bd (Πs) = bd

(Πc ∩Πd

c

)(véanse los comentarios pre-

vios al Ejemplo 1.1). Por tanto, las cinco nocionesanteriores de distancia al mal planteamiento se re-ducen a tres.

El concepto de distancia al mal planteamien-

to fue introducido por Renegar en [16] en relacióncon la propiedad de consistencia (tanto primal comodual) en el contexto de la programación lineal cóni-ca (la relación de orden viene definida por un cono)en espacios de Banach, y resulta ser un ingredien-te básico en la generalización del número de condi-ción a este contexto, siendo a su vez dicho númerode condición un ingrediente importante en el estu-dio de la complejidad de ciertos algoritmos (véanse,p.e., [10] y [17]).

En nuestro contexto de la PSIL (4), los distin-tos tipos de distancia al mal planteamiento referidosanteriormente han sido determinados (o en algunoscasos acotados inferior y superiormente) en [4] y[5] en términos de los coeficientes del problema (1).Destacamos el hecho de que, en las fórmulas quese indican a continuación, el problema de hallar lacorrespondiente distancia al mal planteamiento (enel espacio Π, infinito-dimensional si T es infinito)se traduce en el problema de hallar la distancia, enRn y/o Rn+1, del origen a la frontera de un con-junto convexo determinado por los coeficientes deπ. En el siguiente teorema nos referimos al espacioΠ∞ := {π ∈ Π : δ (π, bd (Πc)) = +∞} , formado ex-clusivamente por problemas inconsistentes y carac-terizado en [4]. Por conv (X) denotamos a la envol-tura convexa del conjunto X, y cl significa clausura.

Teorema 3.1. (i) [4, Teoremas 5 y 6] Si π ∈Π\Π∞, entonces

δ (π, bd (Πc)) = d (0n+1, bd (H)) ,

donde

H := conv

({(at

bt

), t ∈ T

})+ R+

(0n

−1

).

(ii) [5, Teorema 6] Para todo π ∈ Π, se tiene

δ(π, bd

(Πd

c

))= d (0n, bd (Z)) ,

dondeZ := conv ({at , t ∈ T ; −c}) .

(iii) [5, Teorema 2] Si π ∈ cl (Πs), entonces

δ (π, bd (Πs))

= mın {d (0n+1, bd (H)) , d (0n, bd (Z))} .

Comentamos asimismo que las expresiones an-teriores permiten, dado un problema π ∈ int (Πs) ,

y dado 0 < ε < δ (π, bd (Πs)) , hallar explícitamente

15

ARTÍCULOS DE INVESTIGACIÓN OPERATIVA

una constante de Lipschitz para la función valor óp-timo en la bola cerrada de centro π y radio ε; estoes, un L > 0 tal que

|v1 − v2| ≤ Lδ (π1, π2)

para cualesquiera π1 y π2 en dicha bola. Véase [6].Otro paso hacia la cuantificación de la estabili-

dad lo constituye el estudio de diferentes propieda-des de tipo Lipschitz para las multifunciones con-junto factible y conjunto óptimo. Informalmente ha-blando, se trata de medir la tasa de reducción o ex-pansión de dichos conjuntos respecto de la distanciaentre los problemas considerados, todo ello en tornoa un problema dado.

Una de las propiedades más explotadas, debidoa la generalidad y a la vez simplicidad del concep-to, es la de pseudo-Lipschitz o propiedad de Aubin.Vistas desde el enfoque de la multifunción inversa,las propiedades de tipo Lipschitz se traducen en pro-piedades de regularidad (véase, por ejemplo, [14]), yen concreto la propiedad de Aubin se traduce en laregularidad métrica. Para concretar, consideremosuna ecuación generalizada del tipo

G (x) 3 y,

donde x es la variable, y es el parámetro y G : X ⇒Y es una multifunción entre los espacios métricos X

e Y (denotando por d ambas distancias asociadas).Esta ecuación generalizada puede ser, por ejemplo,un sistema de ecuaciones del tipo {a′tx ≥ bt, t ∈ T}si

G (x) = (a′tx)t∈T − RT+ ⊂ RT . (5)

En este caso el parámetro sería únicamente la fun-ción b ≡ (bt)t∈T del miembro derecho de las res-tricciones y G−1 (b) es el conjunto factible asociado,suponiendo (at)t∈T prefijado.

Decimos que una multifunción genérica G es mé-tricamente regular en x para y ∈ G (x) si existensendos entornos U de x y V de y y un k > 0 talesque

d(x,G−1 (y)

) ≤ kd (y,G (x)) si (x, y) ∈ U × V,

(6)donde G−1 (y) = {x ∈ X | y ∈ G (x)} .

Para ilustrar cómo funciona este concepto ima-ginemos que x es una solución de la ecuación G (x) 3y, que xp ∈ U e yp ∈ V son aproximaciones de x ey respectivamente, y que k > k. Entonces la ecua-ción generalizada G (x) 3 yp tiene una solución que

dista de xp no más de k veces d (yp,G (xp)) , que enel caso de (5) para yp = (bp,t)t∈T , es el residuo

supt∈T

(bp,t − a′txp)+ ,

en general mucho más fácil de calcular o estimarque d

(xp,G−1 (bp)

). Así, si conocemos la rapidez

de convergencia de los residuos a cero, podremosestimar la rapidez de convergencia de las solucionesaproximadas a una solución exacta.

El ínfimo de los k > 0 para los que (6) se verifica(para algunos entornos U y V ) se denomina módulode regularidad métrica, y es una medida cuantitati-va de la estabilidad de G alrededor de (x, y) que re-sulta de gran importancia en trabajos tanto teóricoscomo aplicados. Otra medida importante es el radiode regularidad métrica, que informalmente podemosinterpretar como el tamaño de la mínima perturba-ción que ha de realizarse sobre la multifunción paraque pierda la propiedad de regularidad métrica enel punto correspondiente (véanse [9] y [19]). Ya ennuestro contexto de la PSIL, la regularidad métricade sistemas de restricciones (ecuaciones e inecuacio-nes) se ha analizado en [1], donde se proporcionanfórmulas para el módulo y el radio, mientras que elestudio de la regularidad métrica asociada a solucio-nes óptimas de problemas semi-infinitos convexos esel objetivo de [2].

No quisiéramos terminar sin hacer una sincerainvitación a los lectores interesados en este temaapasionante a contactar con nosotros para ampliarinformación (suya o nuestra) o cotejar puntos devista. A día de hoy nos hallamos inmersos en ladeterminación del módulo de regularidad métricarelativo al conjunto óptimo en PSIL (véase [7]), don-de se plantean desafiantes problemas abiertos, queestán por resolver incluso en el contexto de la pro-gramación lineal ordinaria.

Referencias

[1] Cánovas M.J., Dontchev A.L., López M.A.,and Parra J. (2005). Metric regularity of semi-infinite constraint systems. Math. Program.,104B, 329-346.

[2] Cánovas M.J., Klatte D., López M.A., andParra J. (2006). Metric regularity in convexsemi-infinite optimization under canonical per-turbations. Preprint.

16

ARTÍCULOS DE INVESTIGACIÓN OPERATIVA

[3] Cánovas M.J., López M.A., Parra J., and To-dorov M.I. (1999). Stability and well-posednessin linear semi-infinite programming. SIAM J.Optim., 10, 82-98.

[4] Cánovas M.J., López M.A., Parra J., and To-ledo F.J. (2005). Distance to ill-posedness andthe consistency value of linear semi-infinite ine-quality systems. Math. Program., 103A, 95-126.

[5] Cánovas M.J., López M.A., Parra J., andToledo F.J. (2006). Distance to solvabi-lity/unsolvability in linear optimization. SIAMJ. Optim. 16, 629-649.

[6] Cánovas M.J., López M.A., Parra J., and Tole-do F.J. (2006). Lipschitz continuity of the op-timal value via bounds on the optimal set inlinear semi-infinite optimization. Math. Oper.Res, to appear.

[7] Cánovas M.J., Gómez-Senent F.J., and ParraJ. (2006). On the modulus of metric regularityof the optimal set in linear semi-infinite opti-mization. Preprint.

[8] Dall’Aglio M. (2001), On some applications ofLSIP to Probability and Statistics, in M.A Go-berna, M.A. López (Eds.), Semi-Infinite Pro-gramming. Recent advances, Nonconvez Opti-mization and Its Applications 57, pp. 237-254,Kluwer Academic Publ., Dordrecht (NL).

[9] Dontchev A.L., Lewis A.S., and RockafellarR.T. (2003). The radius of metric regularity.Trans. Amer. Math. Society, 355, 493-517.

[10] Freund R.M. and Vera J.R. (1999). Some cha-racterizations and properties of the “distanceto ill-posedness” and the condition measure ofa conic linear system.Math. Program., 86, 225-260.

[11] Goberna M.A., López M.A., and Todorov M.I.(1996). Stability theory for linear inequalitysystems. SIAM J. Matrix Anal. Appl., 17, 730-743.

[12] Goberna M.A. and López M.A. (1998). Li-near Semi-Infinite Optimization, John Wiley& Sons, Chichester (UK).

[13] Jongen H.Th., Twilt F., and Weber G.-W.(1992). Semi-infinte optimization: structureand stability of the feasible set. J. Optim.Theory Appl., 72, 529-552.

[14] Klatte D. and Kummer B. (2002). NonsmoothEquations in Optimization: Regularity, Calcu-lus, Methods and Applications, Kluwer Acade-mic Publ., Dordrecht (NL).

[15] López M.A. and Still G. (2005). Semi-infiniteprogramming, Eur. J. Oper. Res, to appear.

[16] Renegar J. (1994). Some perturbation theoryfor linear programming. Math. Program. 65A,73-91.

[17] Renegar J. (1995). Linear programming, com-plexity theory and elementary functionalanalysis. Math. Program., 70, 279-351.

[18] Robinson S.M. (1975): Stability theory for sys-tems of inequalities. Part I: linear systems.SIAM J. Numer. Anal., 12, 754-769.

[19] Rockafellar R.T. and Wets R.J.-B. (1998). Va-riational Analysis, Springer, Berlín.

[20] Toledo F.J. (2003), Distancia al mal plante-amiento en optimización lineal. Tesis doctoral.Universidad Miguel Hernández de Elche.

[21] Tuy H. (1977). Stability property of a systemof inequalities.Math. Oper. Statist. Series Opt.8, 27-39.

17

ARTÍCULOS DE APLICACIÓN

3. ARTÍCULOS DE APLICACIÓN

ANÁLISIS DEL FUNCIONAMIENTO DE UNA OFICINA DE CORREOS

Olga Costa Estirado1 y David Conesa Guillén2

1 Licenciada en Matemáticas y en Ciencias y Técnicas Estadísticas2 Grup d’Estadística espacial i temporal en Epidemiologia i medi ambient

Departament d’Estadística i I.O., Universitat de València

1. Introducción

El objetivo de este trabajo es aplicar la teoríade colas a las líneas de espera originadas en la ofici-na principal de Correos de la ciudad de Valencia ysurge como resultado de la realización de las prác-ticas profesionales en dicha oficina por parte de laprimera autora. El trabajo se estructura en 7 Seccio-nes, siendo esta primera de carácter introductorio.En la Sección 2, comenzamos detallando cómo fun-ciona la oficina, para a continuación, en la Sección3, introducir los modelos de colas que mejor apro-ximan dicho funcionamiento. En las Secciones 4 y5, presentamos los datos y estimamos los paráme-tros que describen el comportamiento de la oficina,a partir de los cuales obtenemos, en la Sección 6,las primeras conclusiones del estudio a través de lasllamadas medidas de eficiencia (tamaño de la cola,tiempo de permanencia en la cola o en la oficina yutilización de los servidores). Para finalizar, en laúltima Sección comentamos posibles futuras líneasde trabajo.

2. Funcionamiento de la oficina

De lunes a viernes, la oficina de correos perma-nece abierta de 08:30 a 20:30 con un horario ininte-rrumpido de atención al público. Cuando un clientellega a la oficina, se encuentra en la entrada con dosordenadores en los que debe seleccionar el servicioque desea realizar. Una vez seleccionado, el ordena-dor le asigna un ticket con una letra y un número:la letra se refiere al servicio solicitado y el númeroal orden de llegada (para ese servicio).

Los clientes son atendidos en las distintas ven-

tanillas cuando su número de ticket aparece en lapantalla de alguna de ellas. Para establecer el or-den y la forma de atención, los responsables de laoficina los clasifican según el servicio que solicitanen los cuatro tipos siguientes:

Enviar: Incluye a los clientes que solicitan ser-vicios referentes al envío de correspondencia(envío de cartas, giros y telegramas, etc.).

Recoger: Son aquellos que acuden a la oficinaa recoger cartas y giros postales y también losque requieren gestiones relacionadas con losapartados de correos.

Filatelia: Agrupa a los clientes que desean ad-quirir productos de Filatelia (sellos, sobres,etc.).

Banco: Son los clientes que acuden a la oficinaa realizar gestiones bancarias.

En concreto, los clientes son atendidos en ordende llegada, independientemente de la letra del ti-cket pero sí dependiendo del tipo al que perteneceny, una vez atendidos, abandonan la oficina.

Respecto a los mostradores, en la oficina hay 15que atienden a los 4 tipos de clientes. Hay uno es-pecífico para los clientes tipo Filatelia y otro paralos clientes tipo Banco, y el resto, 13, se empleanunos para atender al tipo Recoger y otros para eltipo Enviar. La política actual de la oficina para laasignación de estos mostradores es la que muestrael Cuadro 1.

18

ARTÍCULOS DE APLICACIÓN

HORARIO No DE SERVIDORES08:30-09:30 3 mostradores que atienden conjuntamente Enviar y Recoger09:30-14:30 2 para Recoger y 11 para Enviar14:30-18:00 1 para Recoger y 3 para Enviar18:00-20:30 1 para Recoger y 6 para Enviar

Cuadro 1: Asignación actual de ventanillas.

3. Los modelos de colas

Una vez presentado el funcionamiento de la ofi-cina, pasamos a describir nuestra primera aproxi-mación al problema, que se basa en la utilizaciónde modelos básicos de Teoría de Colas. En concre-to, hemos considerado 4 colas independientes quehacen referencia a los 4 tipos de clientes.

Cada una de estas colas se puede aproximar se-gún un modelo M |M |k de acuerdo con la notaciónde Kendall (1951) [2], donde la primera letra hacereferencia a la distribución de los tiempos entre lle-gadas, la segunda a la distribución de los tiemposde servicio y la k al número de mostradores asig-nados a cada línea de espera. En particular, la M

indica que tanto los tiempos entre llegadas comolos de atención siguen una distribución exponencial(ver Medhi (2002) [4] para una descripción más de-tallada de estos modelos).

Conviene destacar que, a priori, se puede intuirque las llegadas a la oficina se producirán según unproceso de Poisson de parámetro desconocido λ, ta-sa media de llegadas de clientes a la oficina, lo quegarantizaría la exponencialidad de los tiempos entrellegadas. Lo que no está tan claro es que los tiemposde atención o de servicio sigan también una distri-bución exponencial con media 1

µ , ya que parece máslógico pensar que estos tiempos se mantendrán máso menos constantes a lo largo del día. La justifica-ción del uso de los modelos M |M |k la veremos enla Sección 5.

A continuación describimos el resto de elemen-tos que determinan cada una de las colas:

Clientes: Consideramos como clientes a los indi-viduos/usuarios que acuden a la oficina pararealizar alguno de los servicios ofrecidos.

Servidores: Son los empleados de la oficina que es-tán detrás de cada uno de los mostradores deatención al público. De acuerdo con la políti-

ca de la oficina, los clientes del tipo Filateliay Banco son atendidos por un único servidor(k = 1) mientras que los de Enviar y Recogerson atendidos por k servidores (con k varia-ble).

Disciplina de la cola: Cada una de las colas sigueuna disciplina FIFO (First In First Out), esdecir, el primero que llega es el primero quees atendido.

Tras introducir los modelos de colas que apro-ximan el funcionamiento de la oficina, pasamos acomprobar, en las dos secciones siguientes, que real-mente tanto las llegadas como los servicios son pro-cesos de Poisson y a estimar los parámetros de di-chos procesos.

4. Los datos.

La manera habitual de estimar los parámetrosde los modelos de colas es a través de tiempos en-tre llegadas consecutivas y de tiempos de servicio(Bath et al. (1997) [1] presentan de manera detalla-da cómo realizar inferencia estadística en modelosde colas).

En nuestro caso, y debido a que la oficina es-tá totalmente informatizada, nos es posible conoceren cualquier momento del día cual es su situación,es decir, conocer el estado de cada mostrador (ce-rrado, atendiendo o pausado), el número de ticketal que están atendiendo y también, entre otras co-sas, el número de clientes por servicio esperando aser atendidos. Así pues, aunque no tenemos infor-mación directa sobre los tiempos entre llegadas nisobre los tiempos de servicio, sí que disponemos dedatos sobre los tickets expedidos, en concreto, so-bre su hora de expedición, su letra, su número y lostiempos de inicio y fin de atención.

Para utilizar esta información, hemos considera-do que un ticket expedido equivale a una llegada a laoficina. ¿Motivo? Generalmente, en los ordenadores

19

ARTÍCULOS DE APLICACIÓN

de la entrada no se acumulan los clientes, por lo tan-to, cuando un cliente llega a la oficina saca el ticketinstantáneamente y en este caso la hora de expedi-ción del ticket coincide con la hora de llegada delcliente. De esta manera, el tiempo entre expedicio-nes de dos tickets consecutivos puede considerarsecomo el tiempo entre dos llegadas consecutivas.

Respecto a los tiempos de servicio, contamos condatos de los instantes de inicio y finalización de laatención. Como hora de inicio de atención consta lahora en la que el ticket ha sido llamado al mostra-dor correspondiente y como hora de fin de atenciónla hora en la que, en ese mismo mostrador, se hallamado al siguiente número. Por tanto, hemos cal-culado el tiempo de servicio (o de atención) como eltiempo que transcurre desde que un cliente es lla-mado al mostrador hasta que se llama al siguiente(en el mismo mostrador).

Para concluir, conviene destacar que dispone-mos de una base de datos con 130.000 registroscorrespondientes a los tickets expedidos desde el día03-01-2005 hasta el día 03-05-2005, ambos inclusive.Como el rango de fechas es muy amplio y deseamosencontrar un modelo que represente un día están-dar en la oficina de correos, hemos eliminado losregistros con fechas conflictivas.

5. Inferencia sobre los parámetros del mo-delo

En apartados anteriores ya hemos avanzado quetanto los tiempos entre llegadas consecutivas comolos tiempos de servicio siguen una distribución ex-ponencial. En este apartado, presentaremos el aná-lisis de los datos que justifica dicha afirmación.

Como las llegadas a la oficina dependen en granmedida de la hora, como primera aproximaciónal problema consideraremos franjas horarias don-de tengamos valores constantes de los parámetros aestimar: λ, tasa media de llegadas de clientes a laoficina, y µ, tasa media de servicio por mostrador,para cada uno de los modelos.

Analizaremos de forma distinta los datos detiempos entre llegadas y los de tiempos de servi-cio. Los primeros nos servirán para encontrar lasfranjas horarias donde la afluencia de llegadas a laoficina es similar y en cada una de ellas obtendremosuna estimación del parámetro λ. Con los tiempos deservicio nos limitaremos a estimar µ en las franjasobtenidas a partir del análisis anterior.

Insistimos en que este procedimiento nos da unaprimera aproximación al problema real. Habitual-mente, el parámetro λ no es constante sino que varíaa lo largo del tiempo (procesos de Poisson no esta-cionarios). Considerar parámetros variables λ(t) yλ(t) en lugar de parámetros constantes supondría,sin duda, una mejor aproximación al funcionamien-to de la oficina, pero no es el objetivo de este traba-jo, aunque sí que lo consideramos como su extensiónnatural.

5.1. Tiempos entre llegadas

Tal y como hemos comentado anteriormente, he-mos calculado los tiempos entre llegadas como ladiferencia entre la hora de llegada de un cliente y lahora de llegada del cliente anterior.

El procedimiento que hemos seguido para de-tectar las franjas horarias se basa en una técnicapropuesta por Law y Kelton (2000) [3]. En primerlugar hemos dividido el tiempo en intervalos hora-rios de 30 minutos desde las 08:30 hasta las 20:30.En cada uno de los intervalos hemos analizado, uti-lizando el programa SPSS (2001) [5], los datos decada cola, separándolos además por día de la sema-na (L, M, X, J, V) para comprobar si influye el díaen los tiempos entre llegadas.

Así, para cada uno de estos intervalos hemos re-presentado los datos en un histograma y hemos rea-lizado el test de bondad de ajuste de Kolgomorovy Smirnov al nivel α =0.05 contrastando la hipóte-sis nula de que los datos de cada intervalo son ex-ponenciales. Conviene destacar que todos los testsno muestran evidencia en contra de dicha hipótesis,por lo que asumimos que los datos de cada grupoprovienen de una distribución exponencial. Ademásobservamos que no existen diferencias significativasentre los días de la semana.

Como estimador del parámetro λ de la expo-nencial, utilizamos el estimador máximo verosímil,cuya expresión en este caso es la inversa de la me-dia muestral. Agrupando los datos de los intervaloscon medias muestrales similares, conseguimos redu-cir el número de parámetros. Confirmamos la ex-ponencialidad de los datos aplicando de nuevo eltest de bondad de ajuste en cada uno de los gru-pos resultantes. Siguiendo con este procedimiento,obtenemos grupos con medias muestrales bastantediferenciadas que son los que finalmente nos danlas franjas horarias que buscábamos y que hemosrepresentado en el Cuadro 2.

20

ARTÍCULOS DE APLICACIÓN

HORA ENVIAR RECOGER FILATELIA BANCO

08:3009:0009:3010:0010:3011:0011:3012:0012:3013:0013:3014:0014:3015:0015:3016:0016:3017:0017:3018:0018:3019:0019:3020:00

Horas bajas:Horas de menor afluencia de clientes

Horas medias/bajas:Horas de intensidad media/baja de llegadas

Horas medias:Horas de intensidad media de llegadas

Horas medias/altas:Horas de intensidad media/alta de llegadas

Horas punta:Horas de máxima afluencia de clientes

Cuadro 2: Franjas horarias para las 4 colas.

Para no extender innecesariamente este traba-jo, en la siguiente tabla mostramos únicamente lasestimaciones del modelo de colas Enviar (u. t. =minuto).

Parámetro λH.bajas λH.medias λH.punta

Estimación 0.739 1.264 1.962

Podemos observar que realmente hay diferenciasimportantes en las llegadas diarias a la oficina, enlas horas bajas hay 0.7 llegadas por minuto mien-tras que en las horas punta esta tasa es superior,aproximadamente 2 clientes por minuto.

5.2. Tiempos de servicio

Como hemos comentado anteriormente, lostiempos de servicio los analizamos en las franjas ho-rarias obtenidas a partir del análisis de los tiemposentre llegadas. Conviene señalar que hemos elimi-nado los tiempos superiores a 20 minutos ya que,según los responsables de la oficina, estos tiemposse deben a un error en la toma de los datos (unaposible causa podría ser que algún servidor hubie-ra abandonado momentáneamente un mostrador sindejarlo pausado).

Hemos representado los datos mediante histo-gramas y realizado el test de bondad de ajuste deKolgomorov y Smirnov a un nivel α =0.05, encon-trando que no podemos rechazar la hipótesis de que

los datos provengan de distribuciones exponencia-les.

Al igual que antes, en la tabla siguiente presen-tamos sólo las estimaciones de los parámetros de lacola Enviar (u. t. = minuto).

Parámetro λH.bajas λH.medias λH.punta

Estimación 0.234 0.254 0.254

En ella observamos que la tasa de servicio esprácticamente idéntica durante toda la jornada la-boral siendo sensiblemente menor durante las horasbajas (esto implica que, en estas horas, los servi-dores tardan más tiempo en atender a los clientes).Podríamos haber considerado únicamente una fran-ja para los tiempos de servicio, pero hemos decididomantener las originales por coherencia con la estruc-tura de las llegadas.

6. Cálculo de las medidas de eficiencia

Tal y como hemos visto, los parámetros nos danuna visión de cómo funciona el sistema. De todasmaneras, en Teoría de Colas, cuando el sistema seencuentra en equilibrio (es decir, cuando su com-portamiento se hace independiente del tiempo), esmucho más habitual el utilizar las llamadas medi-das de eficiencia (tales como el tiempo de espera oel número de clientes en cola) para describir de una

21

ARTÍCULOS DE APLICACIÓN

manera mucho más intuitiva cuál es su comporta-miento. Estas medidas nos pueden ser de utilidad,por ejemplo, para decidir aumentar el número deventanillas abiertas en ciertas horas del día y a quétipo de clientes asignárselas.

En nuestro caso, comprobamos qué colas se en-cuentran en esa situación verificando para ello quese cumple la condición de equilibrio, que, en estetipo de modelos, viene determinada por el hechode que la intensidad de tráfico debe ser menor quela unidad. Si alguna de las colas analizadas no ve-rifica dicha condición significa que, con el tiempo,puede llegar a congestionarse. En particular, paralos modelos M |M |1 (Filatelia y Banco) y M |M |kcon k > 1 (Enviar y Recoger) esta condición viene

expresada respectivamente por:

ρ =λ

µ< 1 y ρ =

λ

kµ< 1

donde ρ es la intensidad de tráfico (tasa media dellegadas/tasa media de servicio por servidor ocupa-do).

Tal y como podemos observar en el Cuadro 3, essuficiente un servidor para la cola Filatelia y otropara la cola Banco para atender a los clientes deestos servicios sin que estas colas lleguen a conges-tionarse de manera excesiva. En otras palabras, severifica la condición de equilibrio en todas las situa-ciones.

FILATELIA BANCOH. bajas H. medias H. punta Mañana Tarde

Tasa de llegadas (λ) 0.057 0.115 0.229 0.028 0.015Tasa de servicio (µ) 0.379 0.290 0.290 0.359 0.399

Intensidad de tráfico (ρ) 0.151 0.396 0.792 0.078 0.037

Cuadro 3: Valores de λ, µ y ρ para los modelos Filatelia y Banco (u. t. = minuto).

En el Cuadro 4 presentamos algunas medidasde eficiencia para estos dos modelos. Los resultadosobtenidos confirman que efectivamente una venta-nilla para cada cola es suficiente para garantizar unbuen servicio. Además, observamos que el mostra-dor de la cola Banco está la mayor parte del tiempodesocupado, mientras que el de Filatelia funciona

bastante bien durante todo el día excepto en lashoras punta donde el tiempo esperado en la cola esaproximadamente de 13 minutos. Los responsablesde la oficina podrían plantearse en este caso desti-nar un mostrador más para esta cola si consideraranque este tiempo de espera es excesivo.

FILATELIA BANCOH. bajas H. medias H. punta Mañana Tarde

Utilización 15.09% 39.56% 79.18% 7.76% 3.70%Probabilidad de que el sistema esté vacío 0.849 0.604 0.208 0.922 0.963

Longitud esperada de la cola 0.027 0.259 3.011 0.007 0.001Número esperado en el sistema 0.178 0.655 3.802 0.084 0.038Tiempo esperado en la cola 0.469 2.258 13.118 0.234 0.096

Tiempo total esperado en el sistema 3.108 5.708 16.568 3.022 2.600Probabilidad de que un cliente espere 0.151 0.396 0.792 0.078 0.037

Cuadro 4: Medidas de eficiencia para las colas Filatelia y Banco.

22

ARTÍCULOS DE APLICACIÓN

Para finalizar, analizamos la condición de equi-librio en los modelos de las colas Enviar y Recoger.Por cuestiones de espacio, no vamos a mostrar to-das las comprobaciones, pero son varios los casos enlos que no se cumple esta condición. Como en estoscasos el sistema no alcanza el equilibrio, se hace ne-cesaria la utilización de herramientas de simulaciónpara describir las medidas de eficiencia del sistema.La simulación de la oficina es una futura línea detrabajo y no se encuentra recogida en nuestra pri-mera aproximación al funcionamiento de la oficina.

7. Posibles extensiones

A partir de ahora, nuestro trabajo se centra enla validación de la modelización planteada, para locual necesitaremos herramientas de simulación. Deesta manera comprobaremos si los modelos que he-mos elegido se ajustan al funcionamiento actual dela oficina, a la vez que nos ayudarán a predecir sucomportamiento.

Otra de las futuras líneas de trabajo que nosplanteamos es la aproximación del funcionamientode la oficina mediante modelos M(t)|M(t)|k, queconstituyen la extensión natural de los modelos con-siderados en este trabajo.

Agradecimientos

Los autores agradecen a Manuel Molina Fernán-dez la cuidadosa lectura de este trabajo y los comen-tarios realizados que han llevado a esta versión final.Los autores también agradecen a la oficina princi-pal de Correos de la ciudad de Valencia la colabo-ración prestada en la realización de este trabajo. Elsegundo autor agradece la financiación del proyec-to de investigación MTM 2004-03290 cofinanciadopor el Ministerio de Educación y Ciencia y fondosFEDER.

Referencias

[1] Bhat U. N., Miller G. K. and Rao S. S. (1997).Statistical Analysis of Queueing Systems. Fron-tiers in Queueing, editado por J. H. Dshalalow.

[2] Kendall D. G. (1951). Some problems in thetheory of queues. DJ. Roy. Statist. Soc. Ser. B,13, 151-185.

[3] Law M. and Kelton W. D. (2000). Simulationmodeling and analysis, Mc Graw Hill, 3a edi-ción.

[4] Medhi J. (2002). Stochastic Models in QueueingTheory, Academic Press, 2a edición.

[5] SPSS for Windows, Rel. 11.0.1 (2001). Chicago:SPSS Inc.

23

ESTADÍSTICA OFICIAL

4. ESTADÍSTICA OFICIAL

ENCUESTA SOBRE LAS PERSONAS SIN HOGAR (EPSH-2005)

Pedro Ruíz SalvadorInstituto Nacional de Estadística

Resumen

Actualmente no se dispone de estadísticas oficia-les sobre las personas sin hogar ya que los principa-les estudios han sido realizados desde el ámbito nooficial. Sin embargo, en los últimos años, la preocu-pación sobre la exclusión social desde los gobiernosy la propia sociedad civil, tanto a nivel nacionalcomo a nivel europeo, ha ocasionado la activaciónde programas específicos que requieren la elabora-ción de la información estadística necesaria para latoma de decisiones. En este contexto, el InstitutoNacional de Estadística (INE) ha realizado una en-cuesta dirigida a las personas sin hogar durante elmes de febrero de 2005 cuya metodología y resulta-dos son la base de este artículo.

1. Antecedentes

En los últimos años, tanto desde instancias gu-bernamentales como desde la propia sociedad civilha aumentado el grado de sensibilidad y preocupa-ción por la cohesión de nuestras sociedades, espe-cialmente por aquellos procesos de exclusión socialque generan una segregación creciente en las mis-mas.

Así, el propio Tratado de Amsterdam estableciócomo uno de los seis objetivos de la Política SocialEuropea el de combatir la exclusión social (art.136).El Programa de Acción para la Inclusión Social dela Unión Europea (2001-2005) y el homónimo es-pañol que es parte integrante, alientan a la elabo-ración de la información estadística necesaria parapoderlo llevar a cabo. Ello exige la elaboración deindicadores y estadísticas sobre la exclusión socialy, en particular, sobre las personas sin hogar comomanifestación extrema de la misma.

En este contexto, Eurostat constituyó en octu-bre de 2001 un Grupo de Trabajo con el fin de esta-blecer un marco metodológico para la investigaciónsobre las personas sin hogar en el ámbito de la UE.De acuerdo con las reflexiones realizadas, los obje-tivos ideales a alcanzar serían:

a) La medición periódica de la carencia de alo-jamiento.

b) El estudio de las características de las perso-nas carentes de alojamiento mediante encues-tas directas.

Con esta finalidad, se considera conveniente lle-var a cabo diferentes tipos de investigaciones, entrelas que podemos señalar:

- Operaciones para mejorar el conocimiento delos centros de alojamiento.

- Encuestar mediante entrevista directa a losusuarios de los centros de alojamiento.

2. Objetivos

En el invierno del 2004 el INE llevó a cabo laEncuesta a las Personas sin Hogar (Centros) queestaba dirigida a los centros que prestan servicio alas personas sin hogar y que permitió conocer las ca-racterísticas de los mismos (prestaciones ofrecidas,población atendida, orientación, fuentes de finan-ciación, recursos humanos y financieros, período deactividad habitual, capacidad y ocupación) ademásde proporcionar una estimación del número mediode usuarios de la red de centros en 2002 y a 5 denoviembre de 2003.

Con el fin de seguir profundizando en el conoci-miento de las personas sin hogar, considerando lasreflexiones realizadas en el seno de la Unión Euro-pea, y que en nuestro sistema estadístico no existeinformación al respecto, el INE ha realizado una en-cuesta para estudiar las características de los usua-rios de los centros que prestan servicios de aloja-miento y/o de restauración denominada Encuesta alas Personas sin Hogar – Personas (EPSH-2005).

La encuesta tiene por finalidad conocer el perfilsociodemográfico, las condiciones de vida y las di-ficultades de acceso al alojamiento de las personasdel colectivo a nivel nacional y, si fuera posible, tam-bién por comunidades autónomas para las variablesmás relevantes.

24

ESTADÍSTICA OFICIAL

3. Características generales objeto de es-tudio

Las características objeto de estudio son las si-guientes:

- Características sociodemográficas (sexo, edad,lugar de nacimiento, tiempo de residencia enEspaña, empadronamiento y nacionalidad).

- Frecuentación de servicios (tipo de alojamien-to usado, frecuencia de uso y hábitos en el usodel mismo).

- Condiciones de vida ( comportamiento res-pecto al alojamiento de las distintas personas:uso de teléfono, internet, ...).

- Alojamiento: Antecedentes y búsqueda (causaspor las que se está sin alojamiento y desdecuando, disponibilidad de las personas paracambiar su situación de alojamiento y bús-queda de alojamiento).

- Actividad, empleo y paro (relación con la acti-vidad tanto desde una perspectiva retrospec-tiva como en la actualidad).

- Situación económica (diferentes fuentes de in-gresos, cuantía, principales gastos y endeuda-miento).

- Formación (nivel de estudios terminados,edad de abandono de los mismos, dificultadesde lectoescritura y cálculo).

- Salud (valoración subjetiva del estado de sa-lud, sueño, relación de la persona con el siste-ma de salud, aproximación objetiva al estadode salud, adicción a medicamentos, alcohol ydrogas).

- Familia (vínculos y antecedentes).

- Utilización de los servicios sociales (utiliza-ción de los centros de día, relaciones con tra-bajadores sociales,valoración de los serviciossociales, percepción de la renta mínima de in-serción).

- Relación con la justicia (haber sido víctimade un delito o agresión, haber sido denuncia-do o detenido, asistencia jurídica recibida, yen su caso, si fueron condenados).

4. Ámbito de la encuesta

El ámbito abarcado por la encuesta se desglosaen los tres apartados siguientes:

4.1. Ámbito poblacional

La encuesta va dirigida a las personas sin ho-gar, de 18 y más años, que viven en municipios demás de 20.000 habitantes. Aceptamos como defini-ción de persona sin hogar la establecida como basede trabajo provisionalmente en el Grupo de traba-jo de Eurostat, con ligeras modificaciones para suadaptación a la realidad española.

En general podemos decir que se incluye las per-sonas que duermen temporalmente en la calle, enedificios no habitables, en alojamientos de emergen-cia o colectivos proporcionados por la ayuda públicao privada, en pensiones o casas de huéspedes o encasas ocupadas. Y se excluyen aquellas cuyos alo-jamientos son los hospitales o similares, las prisio-nes, las residencias de estudiantes, los orfelinatos,los cuarteles, los barcos amarrados, las casas rodan-tes u hoteles.

Sin embargo, aunque la población teórica es laindicada (a falta de un acuerdo sobre la definiciónde persona sin hogar en el contexto de la UniónEuropea), la población que efectivamente va a serinvestigada es aquella que acude a los centros queofrecen servicios de alojamiento y/o de restaura-ción.

4.2. Ámbito territorial

La encuesta se realiza en los municipios mayoresde 20.000 habitantes en toda España (excepto en elPaís Vasco en donde se extiende a todos los munici-pios al realizarse la investigación mediante conveniocon el Instituto Vasco de Estadística).

4.3. Ámbito temporal

A semejanza de otras experiencias internaciona-les recientes, se ha optado por extender las entre-vistas a lo largo de un mes y, teniendo en cuentala naturaleza de nuestro estudio, se ha consideradoque dicho período debe ser en invierno, habiendoestablecido que fuera en el mes de febrero de 2005.

5. Diseño muestral

Como marco de unidades primarias se ha em-pleado el directorio de centros, que se deriva de laEncuesta sobre Personas sin Hogar(Centros) reali-zada previamente por el INE.

Se ha utilizado un muestreo en dos etapas, es-tratificado en las unidades de primera etapa.

25

ESTADÍSTICA OFICIAL

Las unidades de primera etapa la constituyen loscentros ubicados en municipios mayores de 20.000h. que prestan sus servicios a la población objeto deestudio. Los centros se estratifican de acuerdo a lasvariables más significativas recogidas en el marcocomo son: tipo de servicios que prestan y númerode servicios.

Las unidades de segunda etapa la constituyenlos servicios prestados por los centros de atención,tanto de alojamiento como de restauración, que seofrecen a este tipo de población. A través de la de-manda de estos servicios se va a estimar el númerototal de personas usuarias de los centros como apro-ximación al concepto de persona sin hogar.

De acuerdo con la experiencia internacional y te-niendo en cuenta la elevada falta de respuesta quese podía presentar, así como la imposibilidad de es-tablecer un criterio uniforme para la selección delas personas en los centros que reciben los serviciosprestados, se optó por establecer el tamaño de éstaen 4.000 servicios.

Para determinar el tamaño muestral de unidadesde primera etapa (centros) se han tenido en cuentalos siguientes aspectos:

• El número de entrevistas diario se fijó en tres,teniendo en cuenta que el tiempo medio decumplimentación del cuestionario es de 30 mi-nutos.

• De acuerdo con la estructura de los centros(hay pocos centros grandes y muchos muy pe-queños), se visitarán 1, 2, 3, 4 y 5 días, distri-buyendo las visitas en una o varias semanas alo largo de cuatro semanasdel mes de febrero.

La distribución de la muestra de servicios en-tre estratos ha sido proporcional al tamaño de cadauno de ellos según el número de servicios y, dentrode los estratos, se ha utilizado el mismo criterio paradistribuir la muestra entre los distintos centros.

La selección de las unidades de primera etapa(centros) se ha realizado con probabilidad propor-cional al número de servicios que prestan y paraello, previamente en cada estrato, los centros se hanordenado según la provincia a la que pertenecen ex-cluyendo aquellos centros que prestaron menos decuatro servicios.

Dentro de cada centro seleccionado, la muestrade servicios se ha seleccionado con igual probabili-

dad. De acuerdo a las distintas situaciones, y tenien-do en cuenta que las personas son las unidades deinvestigación seleccionadas a través de los serviciosque demandan, la forma de actuar en la selecciónde la muestra de servicios ha sido la siguiente:

• En aquellos centros que dispensan el serviciode alojamiento y en el supuesto de que se pu-diera disponer de una lista de las personas queson acogidas en una noche, el entrevistador se-lecciona la muestra de servicios a partir de lamisma mediante un muestreo sistemático.

En el caso en el que el centro, por cualquiercircunstancia, no facilite o no disponga de tallista, se elegirán los individuos según su ordende llegada o de salida, según el momento dela entrevista. Si la llegada o el abandono delcentro de los allí acogidos se produce de for-ma simultánea por varios de ellos impidiendoponer en práctica los mecanismos anteriores,el entrevistador seleccionará de la forma queconsidere aleatoria los individuos a entrevis-tar, por ejemplo seleccionando a uno en cadagrupo de los que entran o salen simultánea-mente hasta completar el tamaño muestral.

• En los centros que se ofrecen servicio de res-tauración la elección de los entrevistados sehizo por orden de llegada al mismo para reci-bir dicha prestación.

Si la afluencia masiva de personas al centroimpide llevar a cabo tal mecanismo de se-lección, el entrevistador recurrirá también aelegir de la forma más aleatoria posible a losentrevistados. Por ejemplo, seleccionando du-rante la comida y procurando que esperen alfinal para realizar la entrevista o haciendo laselección según llegada en el momento en queel entrevistador esté disponible.

6. Recogida y tratamiento de la informa-ción

Considerando el ámbito temporal y el tamaño dela muestra, se ha estimado más eficiente la divisióndel territorio en 18 zonas de recogida, tomando enconsideración para la agrupación de provincias lacarga de trabajo de las mismas y su proximidad.De esta forma los trabajos de campo (recogida dela información, depuración de los datos e inspección

26

ESTADÍSTICA OFICIAL

y control del trabajo) se centralizarón en la delega-ción cabecera de zona.

En primer lugar, se remitió una carta de pre-sentación de la encuesta a los centros solicitando sucolaboración. A continuación, el Inspector de la en-cuesta se puso en contacto, a través de entrevistapersonal, con cada uno de los centros seleccionadospara informar del objetivo de la encuesta y cono-cer de antemano si disponían de alguna lista de laspersonas que asisten a diario al centro, para poderhacer una selección previa de los informantes. Tam-bién aprovechó para concertar una cita para el en-trevistador y un lugar (despacho o similar) donde sepudiera llevar a cabo la entrevista con las menoresmolestias posibles para el centro y sus usuarios.

Los entrevistadores, en su primera visita al cen-tro, fueron acompañados por el Inspector de la en-cuesta o por el Inspector de entrevistadores, paraproceder a su presentación. Asi también el Inspec-tor se aseguró de la disponibilidad de un lugar apro-piado para celebrar las entrevistas, de la selecciónaleatoria de los entrevistados y de que durante larealización de las entrevistas no estuviera presenteel asistente social o cualquier otra persona pertene-ciente al centro que pudiera influir en las respuestas.

De acuerdo con las conclusiones de la experien-cia piloto realizada previamente, el personal queparticipó en la encuesta, tanto en calidad de entre-vistadores como de inspectores de entrevistadores,fueron trabajadores sociales con experiencia en eltrato con personas en riesgo de exclusión social y,en la medida de lo posible, con conocimientos deidiomas (francés, inglés, árabe, ruso).

La grabación de datos de los cuestionarios reco-gidos se ha realizado mediante técnicas de escanea-do y reconocimiento óptico de caracteres. El ficherode grabación generado ha sido objeto de un proce-so de depuración con el fin de detectar las posiblesinconsistencias en la información primaria para darlugar al fichero base de explotación que ha sido tra-tado mediante la aplicación estadística SPSS parael análisis de datos y la elaboración de las tablasprevistas en el plan de explotación de la encuesta.

7. Algunos resultados

La población sin hogar atendida en los centrosse estima en 21.900 personas en todo el territorioy está compuesta por el 82,7% de varones frenteal 17,3% de mujeres, lo que muestra una notablemasculinización del fenómeno, en contraste con la

distribución por sexo de la población en general.El colectivo en cuestión es relativamente joven

ya que el 72,7% tiene menos de 45 años, siendo laedad media de las personas sin hogar de 37,9 años.El 79,1% de esta población está empadronada enalgún municipio.

Atendiendo a la nacionalidad, el 51,8% son es-pañoles y el 48,2% extranjeros. Entre los extran-jeros, el grupo mayoritario es el de los africanos,seguido por los europeos y los americanos.

De acuerdo con las categorías consideradas pa-ra estudiar la situación familiar, sólo el 17,4% delas personas mantiene una unión estable (casado opareja de hecho) y, en cuanto a la descendencia, el46% de la población sin hogar tiene hijos aunquesolamente una décima parte vive con ellos.

El 70,2% de las personas sin hogar pernocta to-das las noches en el mismo lugar, lo que podría indi-car la existencia de referencias en el alojamiento. El45,6% de la población sin hogar se aloja al margende la red asistencial existente (en pisos ocupados,espacios públicos o alojamientos de fortuna). Segúnel tiempo transcurrido sin alojamiento, el 37,5% de-clara llevar más de tres años sin alojamiento propio.

El ingreso medio de las personas sin hogar seestima en 302 euros al mes. En cuanto a la prin-cipal fuente de ingresos, el 19,9% de las personassin hogar vive de su salario, el 7,4% de la venta deobjetos y la prestación de servicios, el 14,2% vivedel dinero de gente de la calle y otro 16,4% de lafamilia y los amigos. El 17,5% vive de prestacionespúblicas y el resto no tiene ingresos o no sabe/nocontesta.

En lo relativo a los estudios terminados, el64,8% de la población ha alcanzado un nivel deeducación secundaria, el 15,3% estudios primarioso inferiores y el 13,2% estudios superiores (univer-sitarios o no), mientras que el 6,7% de las personasse declara sin estudios.

En lo que concierne a la apreciación subjetivade su estado de salud, el 15,6% declara tener malao muy mala salud, mientras que el 52,7% dice tenerbuena o muy buena salud. El 30% de la poblaciónsin hogar es abstemia y nunca ha consumido drogas.

El 60,6% del colectivo opina que los serviciossociales le ayudaron poco o nada en su situación.

Una información más detallada es pro-porcionada en la página web del INEhttp://www.ine.es/inebase/.

27

ESTUDIOS MONOGRÁFICOS Y OPINIONES SOBRE LA PROFESIÓN

5. ESTUDIOS MONOGRÁFICOS Y OPINIONES SOBRE LAPROFESIÓN

EN MEMORIA DE LÁZARO CÁNOVAS MARTÍNEZ

Alfredo Marín PérezDepartamento de Estadística e Investigación Operativa

Universidad de Murcia

Lázaro Cánovas Martínez, profesor titular y di-rector del Departamento de Estadística e Investiga-ción Operativa de la Universidad de Murcia, falleciórepentinamente en la madrugada del día 15 de ma-yo. Tenía 38 años, y deja esposa y dos hijas de 11 y 8años. A nadie que lo conociera bien le pudo extrañarque en ese momento estuviera sentado frente a suordenador, trabajando en una aplicación informá-tica para las Pruebas de Acceso a la Universidad,de cuyo tribunal iba a ser secretario. A Lázaro leapasionaba la programación, y necesitaba poco es-tímulo externo para sentarse a desarrollar una ideapara el departamento, para su investigación, paralas pruebas de acceso o para quien se lo pidiera. Enestos días que han transcurrido desde su muerte he-mos añorado al compañero, al amigo, al director,y nos hemos sentido huérfanos cuando hemos teni-do dificultades con un programa, con una máquina,con linux, cuando hemos necesitado esa ayuda queél nunca negaba a nadie.

Lázaro estudió Matemáticas en Murcia (1990)y se incorporó rápidamente al Departamento. De-fendió su tesis doctoral “El problema del k-centroen Rn con normas lpb estrictas” en 1995. En su re-lativamente breve carrera investigadora trabajó eneste tema y en Programación Entera, métodos parala triangulación de poliedros, sistemas de votacióny otros. Ha publicado unos 20 artículos, presentado

unas 50 ponencias en congresos y codirigido dos te-sis doctorales. Sé que si le hubiéramos pedido quenos relatara sus mejores momentos profesionales ha-bría citado la muy reciente defensa de la tesis docto-ral de Sergio García, su colaboración -truncada enlos albores- con Martine Labbé, el inolvidable añoen que nos unimos a un fantástico grupo de amigose investigadores en el proyecto Saderyl, el momentode la creación de nuestro propio grupo de investiga-ción, al que nos gustaba llamar Z3 en la intimidad yfuera de ella, los días vividos en el EURO SummerInstitute de 1995, la publicación en MathematicalProgramming de aquel artículo del que tan orgu-lloso se sentía, o incluso reviviría los momentos denervios sufridos en el curso de nuestra gran aven-tura práctica, cuando las fuerzas vivas de Caravacaintroducían las claves para el sistema de votaciónque habíamos desarrollado con otros dos formida-bles amigos y que servía para decidir el concurso delos Caballos del Vino.

Como profesor, Lázaro era muy querido por losalumnos, fiel cumplidor de sus obligaciones y de-fensor a ultranza de las prácticas. Tampoco hizoascos a la gestión. Además de la dirección del de-partamento y de la colaboración en las pruebas deacceso, era actualmente miembro del Claustro y fueen su momento miembro del Consejo Académico deInvestigación Operativa de la SEIO. En todos losforos era enemigo de enfrentamientos personales, ylos pocos, poquísimos, que alguna vez pudieron ene-mistarse con él, no consta que oyeran de su bocauna mala palabra. Le recordamos todos sonriente,afable. En las relaciones sociales, Lázaro se sentíacomo pez en el agua. Gustaba de divulgar sus últi-mos conocimientos en materia de dispositivos infor-máticos, de vino y exquisiteces gastronómicas. Sieras su invitado en Murcia no dudaba en llevarteal lugar óptimo en el que pudieras adquirir ese pro-ducto estrella de la gastronomía murciana, por lejos

28

ESTUDIOS MONOGRÁFICOS Y OPINIONES SOBRE LA PROFESIÓN

que estuviera, y ya puestos en camino te llevaría aese restaurante con vistas al mar o a la huerta queél sabía que no decepcionaba.

Con todos estos datos, ¿es de dudar que dejaraun sinnúmero de amigos y un descomunal vacío enla vida de todos? Tendrá que pasar mucho tiempo

antes de que, al recorrer el pasillo del departamen-to, dejemos de buscar con los ojos la luz provenien-te de su despacho que nos daba la opción de entrara compartir un momento de alegría o disolver unapreocupación.

29

CORRESPONSALES

Corresponsales

Luz Braña [email protected] Nacional de Estadística

Francisco Callealta [email protected] de Alcalá de Henares

Fernando Reche [email protected] de Almería

Ana [email protected] Autónoma deMadrid

Jordi Ocañ[email protected] de Barcelona

Luis Antonio Sarabia [email protected] de Burgos

Juan Luis González [email protected] de Cádiz

Araceli [email protected] de Cantabria

Isabel Molina [email protected] Carlos III de Madrid

Licesio Rodríguez Aragó[email protected] de Castilla-LaMancha

Susana Muñoz Ló[email protected] Complutense deMadrid

José María Caridad y Ocerí[email protected] de Córdoba

José Antonio Vilar Ferná[email protected] da Coruña

Miguel González [email protected] de Extremadura

Vera [email protected] de Girona

Rocío Raya [email protected] de Granada

Beatriz Hernández Jimé[email protected] de Huelva

Emilio Lozano [email protected] de Jaén

David Alcaide López de [email protected] de la Laguna

María Eva Vallejo [email protected] de León

Carles Capdevila [email protected] de Lleida

Carmen Morcillo Aixelá[email protected] de Málaga

Marc Almiñana [email protected] Miguel Hernandez

Lázaro Cá[email protected] de Murcia

Susana Montes Rodrí[email protected] de Oviedo

Dolores Romero [email protected] of Oxford

Maria del Pilar Moreno [email protected] Pablo de Olavide

Pilar Muñ[email protected] Politécnica deCatalunya

Javier Alcaraz [email protected] Politécnica deValencia

Ana Fernández [email protected] Pública de Navarra

Antonio Alonso [email protected] Rey Juan Carlos

Juan Carlos Fillat [email protected] de la Rioja

María Teresa SantosMartín [email protected] de Salamanca

María José Lombardía Cortiñ[email protected] de Santiago deCompostela

Antonio Beato [email protected] de Sevilla

José Domingo Bermúdez [email protected] de Valencia

María Cruz Valsero [email protected] de Valladolid

Alberto Rodríguez [email protected] de Vigo

Fernando [email protected] de Zaragoza

30