NICASP

nuevas aproximaciones conexionistas integradas para procesado de señal


Datos del proyecto

Grupo de Investigación: SigMAT, Signal Processing, Multimedia Transmission and Speech/Audio Technologies Group

Financiación:  Programa Estatal de Fomento de la Investigación, Científica y Técnica de Excelencia (Subprograma Estatal de Generación de Conocimiento Proyectos de Excelencia), Ministerio de Economía y Competitividad.

Código del Proyecto:  TEC2016-80141-P

Investigadores principales: Victoria E. Sánchez Calle (E-mail: victoria [at] ugr [dot] es) y Ángel M. Gómez García (E-mail: amgg [at] ugr [dot] es)

Departamento: Teoría de la Señal, Telemática y Comunicaciones (TSTC)

 


Resumen

En los últimos años hemos asistido en el ámbito del procesado de señal al auge de las aproximaciones basadas en aprendizaje automático y, en particular, de las técnicas basadas en redes neuronales. Este desarrollo se ha fundamentado principalmente en la existencia de nuevos métodos de entrenamiento, especialmente para redes profundas, así como de potentes recursos de computación que han permitido superar los problemas que durante años han generado un razonable escepticismo respecto a la utilidad de este tipo de aproximaciones. Sin embargo, el creciente optimismo generado en torno a las aproximaciones conexionistas ha provocado un uso extendido de las redes neuronales como cajas negras capaces de realizar un procesado de señal íntegro, desde la señal hasta la respuesta deseada, desperdiciando de esta forma el conocimiento que se pueda tener del problema a resolver. Por el contrario, las aproximaciones tradicionales basadas en modelos y algoritmos hacen uso exclusivo del conocimiento a priori del problema, aunque requieren frecuentemente de aproximaciones que las hacen viables pero que reducen su rendimiento. Mediante el presente proyecto se pretende integrar y fusionar ambas visiones tomando lo mejor de cada una de ellas y aprovechando la experiencia del equipo investigador en el uso de modelos. En concreto, contemplamos dos tipos de soluciones. 

  • En primer lugar, consideraremos la inclusión de redes neuronales profundas como un elemento más del sistema de procesado, aplicándolas a aquellas tareas que no puedan ser realizadas de forma satisfactoria por métodos tradicionales.
  • En segundo lugar, centraremos nuestra atención en la aplicación y desarrollo de nuevas arquitecturas de red resultantes de la fusión del modelado clásico con el aprendizaje profundo.

Ambas soluciones serán investigadas en diversos problemas de estimación y clasificación relacionados con aplicaciones en las que el equipo investigador tiene experiencia tales como reconocimiento robusto y realce de voz, clasificación de proteínas o reconstrucción/interpolación de imágenes/video y voz.


Palabras clave:

Aprendizaje Automático, Redes Neuronales, Reconocimiento Robusto de Voz, Realce de Voz, Plegamiento de Proteínas.