UTN Facultad Regional Bahía Blanca

ASECBB0010143TC – Compresión de imágenes usando votación de modelos auto-supervisados eficientes y arquitecturas computacionales estándar

Grupo/UCT: SITIC

Director: IPARRAGUIRRE,JAVIER
Co-Director: FRIEDRICH Guillermo

Fecha de Inicio: 01/04/2024 Fecha de Finalización: 31/3/2027

Tipo de proyecto: PID equipos en consolidación CON incentivos

Integrantes del Proyecto
TECNICO DE APOYO: Airasca Ariel
INVESTIGADOR FORMADO: Pellegrino Sergio;
INVESTIGADORES DE APOYO: Aggio Santiago; Rostagno Adrián
BECARIO ALUMNO UTN SAE : Crisol Tomás
BECARIO ALUMNO UTN SCYT: Ermantrau Joel; Foissac Segundo; Tobio Lucas
BECARIOs ALUMNO I+D: Foissac Segundo; Tobio Lucas

Recientemente, la sociedad en general y la comunidad científica en particular han atestiguado el resurgimiento de la inteligencia artificial. El auge se debe al entrenamiento de modelos de redes profundas (deep learning) con grandes cantidades de datos (big data). En particular los grandes modelos de lenguaje han mostrado un avance significativo. La misma arquitectura ha inspirado innovaciones en el procesamiento de imágenes. Aunque fue exitoso el desarrollo, las arquitecturas actuales demandan grandes cantidades de anotaciones y supercomputadores que puedan ejecutar el entrenamiento e inferencia. Esto ha producido una explosiva demanda de recursos necesarios para seguir aportando en la temática.

Los modelos auto-supervisados son capaces de aprender sin necesidad de anotaciones. Además existe evidencia que es posible inferir a través de mecanismos de votación de expertos. Este proyecto propone el estudio de modelos auto-supervisados que ejecuten sobre computadoras estándar y hagan uso de mecanismos de votación. En particular, se espera contribuir en el área de entendimiento de imágenes.

Se espera contribuir a los avances en modelos Vision Transformers (ViTs) auto-supervisados que ejecuten en hardware estándar. Además se espera aportar en mecanismos de inferencia a partir de votación de expertos. Finalmente, se espera aplicar el conocimiento a problemas de visión de computadoras que usen sistemas embebidos como solución a requerimientos específicos.

Scroll al inicio