Nombre: ANÁLISIS DE IMAGEN Y VISIÓN ARTIFICIAL
Código: 525104007
Carácter: Optativa
ECTS: 4.5
Unidad Temporal: Cuatrimestral
Despliegue Temporal: Curso 4º - Primer cuatrimestre
Menciones/Especialidades:
Lengua en la que se imparte: Castellano
Carácter: Presencial
Nombre y apellidos: NAVARRO LORENTE, PEDRO JAVIER
Área de conocimiento: Lenguajes y Sistemas Informáticos
Departamento: Tecnologías de la Información y las Comunicaciones
Teléfono: 968326546
Correo electrónico: pedroj.navarro@upct.es
Horario de atención y ubicación durante las tutorias:
Titulaciones:
Categoría profesional: Profesor Titular de Universidad
Nº de quinquenios: 4
Nº de sexenios: 3 de investigación
Curriculum Vitae: Perfil Completo
Responsable de los grupos: G1
[CB1 ]. Que los estudiantes hayan demostrado poseer y comprender conocimientos en un área de estudio que parte de la base de la educación secundaria general, y se suele encontrar a un nivel que, si bien se apoya en libros de texto avanzados, incluye también algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio
[CB4 ]. Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado
[CG2 ]. Conocer y aplicar los fundamentos de ingeniería y tecnologías informáticas actuales para diseñar e implementar nuevas aplicaciones de análisis de datos.
[CE1 ]. Usar de forma efectiva una variedad de técnicas de análisis de datos, tales como aprendizaje computacional (incluyendo aprendizaje supervisado, no supervisado y semi-supervisado), minería de datos, analítica prescriptiva y predictiva, para abordar el análisis de datos complejo en todo el ciclo de vida de los datos.
[CE32 ]. Conocer las técnicas fundamentales de procesado y análisis de imágenes y saber analizar e interpretar los resultados obtenidos.
Utilizar, evaluar y adaptar herramientas para la extracción de información a partir de imágenes que posibiliten la realización tareas de cierta complejidad, como el reconocimiento de objetos y la extracción de estructura tridimensional a partir de las mismas (LODA.03 L1, L2, L3).
Definir, desarrollar y diseñar los elementos y mecanismos de procesamiento adecuados para poder implementar tareas específicas de reconstrucción tridimensional, realidad aumentada y visión industrial (LODA.05 L1, L2, L3).
Adquirir conocimientos sobre arquitecturas de aprendizaje profundo y redes neuronales convolucionales, para ser capaces de diseñar, adaptar y optimizar soluciones basadas en las mismas en el ámbito de las aplicaciones de visión por computador (LOENG.02 L1, L2, L3).
Identificar, examinar y evaluar las principales librerías computacionales estándar en el ámbito de la visión por computador (LOENG.03 L1, L2, L3).
Transformada wavelet y multi-resolución.<br>Análisis de texturas y descriptores de imagen.<br>Reconocimiento automático de objetos.<br>Flujo óptico y geometría de múltiples vistas.<br>Aplicaciones en reconstrucción 3D, realidad aumentada y visión industrial.<br>Arquitecturas de deep-learning para visión por computador.<br>Librerías computacionales aplicadas a visión por computador.<br><br><br><br>
Tema 1: Análisis de imágenes y la visión artificial
1.1. Historia, dispositivos, aplicaciones de la visión artificial.
1.2. Procesamiento de imágenes
1.3. Extracción de características.
Tema 2. Geometría proyectiva para visión artificial
2.1. Modelo de camara lineal
2.2. Homografía planares
2.3. Geometría equipolar
Tema 3. Técnicas de matching entre imágenes. Flujo óptico denso y disperso.
3.1. Descriptores frecuenciales y multirresolución.
3.2. Reconocimiento basado en puntos de interés
3.3. Aplicaciones de reconocimiento de objetos.
Tema 4. Deep learning para visión artificial.
4.1. Modelos detección y clasificación de objetos.
4.2. Arquitecturas neuronales profundas para visión artificial.
4.3. Transfering learning
Práctica 1: Ejercicios de geometría visual
Calibración de cámaras. Rectificación de planos. Construcción de panoramas. Geometría 3D. Relacionado con Tema 1 y Tema 2
Práctica 2: Ejercicios prácticos de reconocimiento de objetos
Se aplicarán las técnicas clásicas para reconocimiento de objetos. Relacionado con Tema 3
Práctica 3: Uso de modelos de deep learning en aplicaciones de visión
Implementación y puesta en marcha de modelos de reconocimento/clasificación de objetos basados en arquitecturas del estado del arte de deep learning para visión. Transfering Learning. Relacionado con Tema 4
La Universidad Politécnica de Cartagena considera como uno de sus principios básicos y objetivos fundamentales la promoción de la mejora continua de las condiciones de trabajo y estudio de toda la Comunidad Universitaria. Este compromiso con la prevención y las responsabilidades que se derivan atañe a todos los niveles que integran la Universidad: órganos de gobierno, equipo de dirección, personal docente e investigador, personal de administración y servicios y estudiantes. El Servicio de Prevención de Riesgos Laborales de la UPCT ha elaborado un "Manual de acogida al estudiante en materia de prevención de riesgos" que puedes encontrar en el Aula Virtual, y en el que encontraras instrucciones y recomendaciones acerca de cómo actuar de forma correcta, desde el punto de vista de la prevención (seguridad, ergonomía, etc.), cuando desarrolles cualquier tipo de actividad en la Universidad. También encontrarás recomendaciones sobre cómo proceder en caso de emergencia o que se produzca algún incidente. En especial, cuando realices prácticas docentes en laboratorios, talleres o trabajo de campo, debes seguir todas las instrucciones del profesorado, que es la persona responsable de tu seguridad y salud durante su realización. Consúltale todas las dudas que te surjan y no pongas en riesgo tu seguridad ni la de tus compañeros.
Topic 1: Image Analysis and Computer Vision
1.1. History, devices, and applications of computer vision.
1.2. Image processing
1.3. Feature extraction.
Topic 2: Projective Geometry for Computer Vision
2.1. Camera model.
2.2. Planar homographies
2.3. Epipolar geometry.
Topic 3: Image Matching Techniques. Dense and Sparse Optical Flow
3.1. Frequency and multiresolution descriptors.
3.2. Recognition based on interest points.
3.3. Object recognition applications.
Topic 4: Deep Learning for Computer Vision
4.1. Object detection and classification models.
4.2. Deep neural architectures for computer vision.
4.3. Transfer-learning
Exposición teórica: Exposición de los contenidos teóricos de la asignatura por parte del profesor. También se contemplan las sesiones informativas sobre el desarrollo del trabajo de fin de grado o prácticas externas.
Sesiones presenciales donde el profesorado presenta los fundamentos teóricos del procesado digital de imágenes y los principios de la visión artificial, incluyendo algoritmos, transformaciones y técnicas de análisis.
28
100
Prácticas de laboratorio: Ejercicios y resolución de problemas, aprendizaje orientado a proyectos, estudio de casos, exposición y discusión de trabajos, simulaciones y/o prácticas con ordenadores, generalmente desarrolladas en grupos reducidos.
Actividades prácticas en laboratorio donde los estudiantes implementan algoritmos de procesado de imagen y visión artificial, utilizando herramientas como OpenCV, y resuelven casos reales en grupos reducidos.
14
100
Trabajo autónomo del alumno: Estudio y preparación de contenidos teórico-prácticos, trabajo individual consistente en lecturas, búsquedas de información, sistematización de contenidos, elaboración de informes o estudio para la elaboración de casos entre otras actividades.
Tiempo dedicado por el estudiante al estudio individual, lectura de artículos científicos, desarrollo de proyectos, búsqueda de información técnica y elaboración de informes relacionados con la asignatura.
67.5
0
Tutorías formativas y resolución de dudas: Asistencia individualizada -tutorías individuales- o en grupo -tutorías colectivas- a los estudiantes por parte del profesor.
Sesiones personalizadas o en grupo para resolver dudas específicas sobre teoría, prácticas o proyectos, y para orientar el aprendizaje autónomo del estudiante.
1
100
Evaluación: Pruebas individuales, ya sean escritas, orales o con medios informáticos, donde el estudiante demostrará los conocimientos teóricos y prácticos adquiridos durante las actividades formativas asociadas a la enseñanza de la materia.
Pruebas escritas o prácticas donde el estudiante demuestra su comprensión de los conceptos teóricos y su capacidad para aplicar técnicas de visión artificial y procesado de imágenes.
2
100
Exámenes individuales: Pruebas objetivas, de desarrollo, de respuesta corta, de ejecución de tareas o de escala de actitudes, realizadas por los estudiantes para mostrar los conocimientos teóricos y prácticos adquiridos ya sea de forma oral, escrita o utilizando un ordenador.
Pruebas objetivas, de desarrollo, de respuesta corta, de ejecución de tareas o de escala de actitudes, realizadas por los estudiantes para mostrar los conocimientos teóricos y prácticos adquiridos ya sea de forma oral, escrita o utilizando un ordenador.
65 %
Procedimientos de observación del trabajo del estudiante: Registros de participación, de realización de actividades, cumplimiento de plazos, participación en foros, informes de seguimiento del trabajo fin de grado y registros sobre el desarrollo de las prácticas externas.
Registros de participación, de realización de actividades, cumplimiento de plazos, participación en foros, informes de seguimiento del trabajo fin de grado y registros sobre el desarrollo de las prácticas externas.
0 %
Informe técnico. En este instrumento incluimos los resultados de actividades prácticas, o de laboratorio, junto con sus memorias descriptivas y posibles resúmenes del estado del arte sobre temas concretos. La opción de realizar entrevistas personales o presentaciones de los trabajos realizados también entran en esta categoría.
En este instrumento incluimos los resultados de actividades prácticas, o de laboratorio, junto con sus memorias descriptivas y posibles resúmenes del estado del arte sobre temas concretos. La opción de realizar entrevistas personales o presentaciones de los trabajos realizados también entran en esta categoría.
35 %
Exámenes individuales: Pruebas objetivas, de desarrollo, de respuesta corta, de ejecución de tareas o de escala de actitudes, realizadas por los estudiantes para mostrar los conocimientos teóricos y prácticos adquiridos ya sea de forma oral, escrita o utilizando un ordenador.
Pruebas objetivas, de desarrollo, de respuesta corta, de ejecución de tareas o de escala de actitudes, realizadas por los estudiantes para mostrar los conocimientos teóricos y prácticos adquiridos ya sea de forma oral, escrita o utilizando un ordenador.
65 %
Informe técnico. En este instrumento incluimos los resultados de actividades prácticas, o de laboratorio, junto con sus memorias descriptivas y posibles resúmenes del estado del arte sobre temas concretos. La opción de realizar entrevistas personales o presentaciones de los trabajos realizados también entran en esta categoría.
En este instrumento incluimos los resultados de actividades prácticas, o de laboratorio, junto con sus memorias descriptivas y posibles resúmenes del estado del arte sobre temas concretos. La opción de realizar entrevistas personales o presentaciones de los trabajos realizados también entran en esta categoría.
35 %
Autor: Hartley, Richard. Zisserman, Andrew
Título: Multiple view geometry in computer vision 2nd Ed.
Editorial: Cambridge University Press
Fecha Publicación: 2006
ISBN: 0-521-54051-8
Autor: Szeliski, Richard
Título: Computer vision : algorithms and applications 2nd ed
Editorial: Springer.
Fecha Publicación: 2022
ISBN: 9783030343712
Autor: Valliappa Lakshmanan
Título: Practical Machine Learning for computer vision.
Editorial: O'REILLY
Fecha Publicación: 2021
ISBN: 9781098102364