técnicas de análisis estadístico multivariado basadas en ... - m… · proyectando (y...

37
ecnicas de An ´ alisis Estad´ ıstico Multivariado Basadas en Estad´ ısticos de Orden Superior Tratamiento Avanzado de Se˜ nal en Comunicaciones Curso 2009-2010

Upload: others

Post on 15-Aug-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Tecnicas de Analisis Estadıstico MultivariadoBasadas en Estadısticos de Orden Superior

Tratamiento Avanzado de Senal en Comunicaciones

Curso 2009-2010

Page 2: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Contenido

1 Introduccion

2 Separacion Ciega de Fuentes - Caso DeterminadoAnalisis de Componentes Independientes (ICA)

3 Separacion Ciega de Fuentes - Caso IndeterminadoCompressive Sensing

4 Metodos Kernel

5 Resumen

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 3: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Contenido

1 Introduccion

2 Separacion Ciega de Fuentes - Caso DeterminadoAnalisis de Componentes Independientes (ICA)

3 Separacion Ciega de Fuentes - Caso IndeterminadoCompressive Sensing

4 Metodos Kernel

5 Resumen

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 4: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Introduccion

MotivacionCocktail Party Problem

Varias personas hablan de manera simultaneaUn conjunto de microfonos recoge mezclas de todas las voces

Separacion Ciega de FuentesNo conocemos las fuentes (s) ni la matriz de mezcla (A)

Nuestro objetivo consiste en extraer las voces de los hablantes

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 5: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Introduccion

Separacion Ciega de FuentesTipos de Mezclas:

Mezclas Instantaneas:

x|{z}n×1

= A|{z}n×p

s|{z}p×1

Mezclas Convolutivas:

x(ω)| {z }n×1

= A(ω)| {z }n×p

s(ω)|{z}p×1

x[n]|{z}n×1

=

∞Xk=0

A[n− k]| {z }n×p

s[n− k]| {z }p×1

Segun el numero de sensores:Caso Determinado: n ≥ pCaso Indeterminado: n < p

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 6: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Contenido

1 Introduccion

2 Separacion Ciega de Fuentes - Caso DeterminadoAnalisis de Componentes Independientes (ICA)

3 Separacion Ciega de Fuentes - Caso IndeterminadoCompressive Sensing

4 Metodos Kernel

5 Resumen

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 7: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Separacion Ciega de Fuentes - Caso Determinado

Separacion Ciega de Fuentes

Consideramos Mezclas Instantaneas con n ≥ p

x|{z}n×1

= A|{z}n×p

s|{z}p×1

Buscamos una matriz W ∈ Rp×n tal que

u = WT x ' s

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 8: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Separacion Ciega de Fuentes - Caso Determinado

¿Como encontrar W?

En principio, existe una ambiguedad:

x = As = AB−1︸ ︷︷ ︸A

Bs︸︷︷︸s

¿Que informacion podemos explotar?Fuentes Independientes (ICA)Conocimiento (total o parcial) de la fdp de las fuentes

Fuentes con Alfabeto Finito (CMA, ACMA)Fuentes Dispersas

Estructura Temporal de las fuentes (Ej: Voz)Suposiciones sobre la Matriz de Mezcla A

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 9: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Analisis de Componentes Independientes (ICA)

Analisis de Componentes IndependientesDada la Mezcla x = As, se busca la transformacion

u = WT x

tal que los elementos de u sean independientes

Si los elementos de u son independientes,a habremos conseguido

u = PΣs

con:P: Matriz de permutacionΣ: Matriz diagonal (escalado de las fuentes originales)

Por lo tanto, asumiremos

Rs,s = EhssT

i= I

aAdemas se requiere que no mas de un elemento de s sea Gaussiano

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 10: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Analisis de Componentes Independientes (ICA)

¿Como conseguir que los elementos de u sean independientes?

Condicion Necesaria:

Independencia ⇒: Incorrelacion

En una primera etapa (preblanqueo) se forzara la incorrelacion de las salidas

Ru,u = EhuuT

i= I

proyectando (y reescalando) sobre las p direcciones principales (PCA)

y = Λ−12 VT x ⇒ Ry,y = I

V: p autovectores principales de Rx,x

Λ: Matriz diagonal con los p autovalores

Ambiguedad residual: Tras el preblanqueo, el problema se reduce a

u = Qy = QΛ−12 VT| {z }

WT

x con QT Q = QQT = I

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 11: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Analisis de Componentes Independientes (ICA)

Preblanqueo - Ejemplo con datos bidimensionales

x =

»1 22 1

–| {z }

A

s s1 ∼ N (0, 1) s2 ∼ U(−√

3,√

3)

−4 −3 −2 −1 0 1 2 3 4−4

−3

−2

−1

0

1

2

3

4

s1

s 2Fuentes

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 12: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Analisis de Componentes Independientes (ICA)

Preblanqueo - Ejemplo con datos bidimensionales

x =

»1 22 1

–| {z }

A

s s1 ∼ N (0, 1) s2 ∼ U(−√

3,√

3)

−10 −5 0 5 10−10

−8

−6

−4

−2

0

2

4

6

8

10

x1

x 2Mezclas

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 13: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Analisis de Componentes Independientes (ICA)

Preblanqueo - Ejemplo con datos bidimensionales

x =

»1 22 1

–| {z }

A

s s1 ∼ N (0, 1) s2 ∼ U(−√

3,√

3)

−10 −5 0 5 10−10

−8

−6

−4

−2

0

2

4

6

8

10

x1

x 2Mezclas y Direcciones Principales

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 14: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Analisis de Componentes Independientes (ICA)

Preblanqueo - Ejemplo con datos bidimensionales

x =

»1 22 1

–| {z }

A

s s1 ∼ N (0, 1) s2 ∼ U(−√

3,√

3)

−4 −3 −2 −1 0 1 2 3 4−4

−3

−2

−1

0

1

2

3

4

y1

y 2Efecto del Preblanqueo

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 15: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Analisis de Componentes Independientes (ICA)

Preblanqueo - Ejemplo con datos bidimensionales

x =

»1 22 1

–| {z }

A

s s1 ∼ N (0, 1) s2 ∼ U(−√

3,√

3)

Ambiguedad consistente en una rotacion (matriz Q unitaria)

−5 0 5−5

0

5

y 2

−5 0 5−5

0

5

−5 0 5−5

0

5

y1

y 2

−5 0 5−5

0

5

y1

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 16: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Analisis de Componentes Independientes (ICA)

Analisis de Componentes Independientes

Tras el preblanqueo, el problema se reduce a

arg mınQ

f(y[0], . . . ,y[N − 1],Q) sujeto a QT Q = I

Q es una matriz unitaria (recordar que W = VΛ−12 QT )

f(·) es una funcion de coste (contraste) que proporciona unamedida de la dependencia entre los elementos de u = Qy

f(·) se puede basar en diferentes ideas:Medida de la Informacion Mutua (Divergencia Kullback-Leibler)Medida de la No-Gaussianidad (Negentropıa)Medida de la Correlacion de Transformaciones No-Lineales

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 17: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Analisis de Componentes Independientes (ICA)

Analisis de Componentes Independientes

Toolbox para Matlab: ICALaba

aA. Cichocki, S. Amari, K. Siwek, T. Tanaka , Anh Huy Phan et al., ICALABToolboxes, http://www.bsp.brain.riken.jp/ICALAB.

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 18: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Analisis de Componentes Independientes (ICA)

Separacion Ciega de Fuentes

Extension a Mezclas Convolutivas con n ≥ p

Una primera aproximacion consiste en trabajar en el dominio de lafrecuencia

x(ω) = A(ω)s(ω)

Tratando cada frecuencia de manera independiente se obtiene unconjunto de problemas de separacion ciega de fuentes de mezclasinstantaneasProblema: Permutaciones y Escalados

Si en cada frecuencia se obtiene una permutacion y escaladodiferente, las senales de salida estaran compuestas porcontribuciones de todas las fuentesPara resolver las permutaciones y escalados deberemos recurrir apropiedades adicionales de las fuentes o la matriz de mezclas

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 19: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Contenido

1 Introduccion

2 Separacion Ciega de Fuentes - Caso DeterminadoAnalisis de Componentes Independientes (ICA)

3 Separacion Ciega de Fuentes - Caso IndeterminadoCompressive Sensing

4 Metodos Kernel

5 Resumen

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 20: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Separacion Ciega de Fuentes - Caso Indeterminado

Separacion Ciega de Fuentes

¿Como resolver el problema cuando tenemos mas fuentes quesensores (n < p)?Deberemos recurrir a propiedades adicionales de las fuentes ode la matriz de mezclasUna de las suposiciones mas frecuentes consiste en asumir quelas fuentes son dispersas

Una fuente es dispersa cuando la probabilidad de que este activaes relativamente baja

P (s 6= 0)� 1

Ejemplos:Senales Audio en el dominio de la frecuenciaRepresentaciones de Imagenes mediante Wavelets

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 21: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Separacion Ciega de Fuentes - Caso Indeterminado

Ejemplo: Problema Indeterminado

x =

»1 2 −12 1 1

–s P (s1 6= 0) = P (s2 6= 0) = P (s3 6= 0) = 0.2

−2−1

01

2

−2

−1

0

1

2−2

−1

0

1

2

s1

Fuentes

s2

s 3

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 22: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Separacion Ciega de Fuentes - Caso Indeterminado

Ejemplo: Problema Indeterminado

x =

»1 2 −12 1 1

–s P (s1 6= 0) = P (s2 6= 0) = P (s3 6= 0) = 0.2

−6 −4 −2 0 2 4 6−6

−4

−2

0

2

4

6

x1

x 2Mezclas

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 23: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Separacion Ciega de Fuentes - Caso Indeterminado

Ejemplo: Problema Indeterminado

x =

»1 2 −12 1 1

–s P (s1 6= 0) = P (s2 6= 0) = P (s3 6= 0) = 0.2

−3 −2 −1 0 1 2 30

50

100

150

200

250

300

350Histograma de los ángulos

Ángulo (radianes)

Ocu

rren

cias

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 24: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Separacion Ciega de Fuentes - Caso Indeterminado

Separacion Ciega de Fuentes

¿Como recuperar las fuentes una vez conocida la matriz A?

x = As A ∈ Rn×p p > n

−6 −4 −2 0 2 4 6−6

−4

−2

0

2

4

6

x1

x 2Mezclas

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 25: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Compressive Sensing

Separacion de Mezclas Indeterminadas y Compressive Sensing

¿Como recuperar las fuentes una vez conocida la matriz A?

x = As A ∈ Rn×p p > n

Un problema relacionado: Compressive Sensinga

Dados A ∈ Rn×p y x ∈ Rn×1, se trata de recuperar el vector ssabiendo que es q-dispersoUn vector es q-disperso si no tiene mas de q componentes no nulas

La solucion al problema se puede obtener de manera sencilla(programacion lineal) si

n = O„

q log

„p

q

««

Compressive sensing se puede interpretar como unageneralizacion del Teorema de Muestreo de Nyquist

ahttp://www.dsp.ece.rice.edu/cs/

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 26: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Contenido

1 Introduccion

2 Separacion Ciega de Fuentes - Caso DeterminadoAnalisis de Componentes Independientes (ICA)

3 Separacion Ciega de Fuentes - Caso IndeterminadoCompressive Sensing

4 Metodos Kernel

5 Resumen

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 27: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Metodos Kernel

Metodos Kernel

Los Metodos Kernel proporcionan una extension no-linealelegante de un gran numero de tecnicas lineales

Supongamos que transformamos nuestro datos x ∈ Rn×1 a unespacio de dimension mayor (incluso infinita)

x ∈ Rn×1 x = Φ(x)

donde Φ(x) representa un mapeo no-lineal, por ejemplo

Φ(x) = [x1, x2, . . . , xn, x21, x

22, . . . , x

2n, x3

1, x32, . . . , x

3n]T| {z }

3n×1

Una vez que tenemos los datos en el espacio de caracterısticas,podremos aplicar cualquier tecnica lineal a los datos transformados

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 28: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Metodos Kernel

Kernel TrickProblema: El mapeo Φ(x) puede resultar computacionalmente muycostoso, sobre todo si n � n

Solucion: Los productos escalares en el espacio de caracterısticas sepueden calcular mediante una funcion (Kernel) en el espacio de entrada

xT y = κ(x,y)

De esta manera, no necesitamos calcular x explıcitamenteEl mapeo Φ(x) quedara definido por la funcion KernelseleccionadaAlgunos ejemplos de funciones Kernel son

Kernel lineal: κ(x,y) = xT y (tecnicas lineales originales)Kernel polinomico: κ(x,y) = (xT y + 1)p

Kernel Gaussiano: κ(x,y) = 1√2πσ

e‖x−y‖2

2σ2

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 29: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Metodos Kernel

Representer TheoremEl representer theorem es uno de los resultados basicos relacionadoscon metodos kernel

Asegura que las transformaciones lineales (w) optimas en el espacio decaracterısticas se pueden representar como

w =

NXn=1

αnx[n],

es decir, w es una combinacion lineal de los datos transformados

Teniendo esto en cuenta, las proyecciones de los datos son

u[m] = wT x[m] =N∑

n=1

αnxT [n]x[m] =N∑

n=1

αnκ(x[n],x[m])

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 30: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Metodos Kernel

Ejemplo

Kernel-PCA (KPCA)Proyeccion de los datos (κm,n = κ(x[m],x[n])) u[1]

. . .u[N ]

︸ ︷︷ ︸

u

=

κ1,1 · · · κ1,N

.... . .

...κN,1 · · · κN,N

︸ ︷︷ ︸

K

α1

...αN

︸ ︷︷ ︸

α

Energıa de la proyeccion:

uT u = αT K2α

Proyeccion (α) de maxima energıa: Autovector principal de K

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 31: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Metodos Kernel

Ejemplo KPCA

Datos Bidimensionales

−30 −20 −10 0 10 20 30−30

−20

−10

0

10

20

30Datos Originales

x 2

x1

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 32: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Metodos Kernel

Ejemplo KPCA

Datos Bidimensionales y PCA Lineal

−30 −20 −10 0 10 20 30−30

−20

−10

0

10

20

30Datos Originales y Proyector PCA

x 2

x1

DatosProyector PCA

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 33: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Metodos Kernel

Ejemplo KPCA

Datos Bidimensionales y PCA Lineal

Proyecciones PCA

x1

x 2

−20 −15 −10 −5 0 5 10 15 20−20

−15

−10

−5

0

5

10

15

20

100

200

300

400

500

600

700

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 34: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Metodos Kernel

Ejemplo KPCA

Kernel-PCA con Kernel Gaussiano (σ = 2)

0 100 200 300 400 500 600 700−5

0

5

10

15

20

25

30

35

40Distribución de los Autovalores K−PCA

Índice

Val

or

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 35: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Metodos Kernel

Ejemplo KPCA

Kernel Gaussiano (σ = 2) y p = 50 Autovectores Principales

Proyecciones KPCA

x1

x 2

−20 −15 −10 −5 0 5 10 15 20−20

−15

−10

−5

0

5

10

15

20

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 36: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Contenido

1 Introduccion

2 Separacion Ciega de Fuentes - Caso DeterminadoAnalisis de Componentes Independientes (ICA)

3 Separacion Ciega de Fuentes - Caso IndeterminadoCompressive Sensing

4 Metodos Kernel

5 Resumen

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones

Page 37: Técnicas de Análisis Estadístico Multivariado Basadas en ... - M… · proyectando (y reescalando) sobre las p direcciones principales (PCA) y = Λ− 1 2 VT x ⇒ R y, = I V:

Introduccion BSS Determinado - ICA BSS Indeterminado Metodos Kernel Resumen

Resumen

ResumenUn gran numero de problemas requiere mas informacion que laproporcionada por los estadısticos de segundo orden (SOS)

Ejemplo: Separacion Ciega de FuentesCaso Determinado:

Idea: Tendremos en cuenta que las fuentes son independientesAnalisis de Componentes Independientes (ICA)

Caso Indeterminado:Idea: Tendremos en cuenta que las fuentes son dispersasUna vez estimada la matriz de mezclas aun hay que recuperar lasfuentesProblema analogo a Compressed Sensing

Mas Ejemplos: Estimacion, Clustering, Clasificacion, Deteccion, . . .

Extensiones No-Lineales de Tecnicas Lineales: Metodos KernelEjemplos: KPCA, KPLS, KMLR, KCCAAplicacion en ICA, Clustering, Clasificacion, . . .

Tecnicas de Analisis Estadıstico Multivariado Basadas en Estadısticos de Orden Superior Tratamiento Avanzado de Senal en Comunicaciones