ANTROPOMETRIA FACIAL A PARTIR DE MULTIPLES VISTAS: UNA PROPUESTA METODOLOGICA

Página creada Aarón Enric
 
SEGUIR LEYENDO
ANTROPOMETRIA FACIAL A PARTIR DE MULTIPLES VISTAS: UNA PROPUESTA METODOLOGICA
Universidad Nacional de Colombia
                Sede Manizales
    Departamento de Ingeniería Eléctrica, Electrónica y Computación
                Facultad de Ingeniería y Arquitectura

ANTROPOMETRIA FACIAL A PARTIR
      DE MULTIPLES VISTAS:
 UNA PROPUESTA METODOLOGICA

                       Flavio Prieto

Trabajo presentado para optar a la categoría de
               Profesor Titular
   de la Universidad Nacional de Colombia

                   Manizales, Colombia
                            Enero de 2008
ANTROPOMETRIA FACIAL A PARTIR DE MULTIPLES VISTAS: UNA PROPUESTA METODOLOGICA
ANTROPOMETRIA FACIAL A PARTIR DE MULTIPLES VISTAS: UNA PROPUESTA METODOLOGICA
Tabla de Contenido

Tabla de Contenido                                                                                                                       I

Lista de Figuras                                                                                                                       III

Lista de Tablas                                                                                                                         V

Introducción                                                                                                                            1

1. Antropometría Médica Facial                                                                                                        5
   1.1. Antropometría Facial . . . . . . . . . . . . . . . . . . . . . . . .   .   .   .   .   .   .   .   .   .   .   .   .   .   . 5
        1.1.1. Puntos característicos faciales . . . . . . . . . . . . . . .   .   .   .   .   .   .   .   .   .   .   .   .   .   . 6
        1.1.2. Medidas de superficie . . . . . . . . . . . . . . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   . 6
   1.2. Técnicas para el Estudio Antropométrico Facial . . . . . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   . 7
        1.2.1. Antropometría directa . . . . . . . . . . . . . . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   . 7
        1.2.2. Fotogrametría 2D . . . . . . . . . . . . . . . . . . . . . .    .   .   .   .   .   .   .   .   .   .   .   .   .   . 8
        1.2.3. Antropometría facial con imágenes tridimensionales (3D)         .   .   .   .   .   .   .   .   .   .   .   .   .   . 9
   1.3. Análisis Antropométrico Facial . . . . . . . . . . . . . . . . . . .   .   .   .   .   .   .   .   .   .   .   .   .   .   . 10

2. Calibración de Cámara                                                                                                               13
   2.1. Modelo de Cámara . . . . . . . . . . . . . . . . . . . . . . . . . . . .           .   .   .   .   .   .   .   .   .   .   .   13
   2.2. Métodos de Calibración . . . . . . . . . . . . . . . . . . . . . . . . . .         .   .   .   .   .   .   .   .   .   .   .   15
        2.2.1. Método 1: algoritmo Tsai . . . . . . . . . . . . . . . . . . . .            .   .   .   .   .   .   .   .   .   .   .   15
        2.2.2. Método 2: algoritmo The Gold Standard . . . . . . . . . . . . .             .   .   .   .   .   .   .   .   .   .   .   15
        2.2.3. Método 3: calibración de cámara basado en elipses . . . . . . .             .   .   .   .   .   .   .   .   .   .   .   17
        2.2.4. Modelo de cámara con distorsiones . . . . . . . . . . . . . . .             .   .   .   .   .   .   .   .   .   .   .   18
        2.2.5. Corrección de la distorsión radial: algoritmo The Gold Standard             .   .   .   .   .   .   .   .   .   .   .   19
   2.3. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .       .   .   .   .   .   .   .   .   .   .   .   20
        2.3.1. Método 1: algoritmo Tsai . . . . . . . . . . . . . . . . . . . .            .   .   .   .   .   .   .   .   .   .   .   21
        2.3.2. Método 2: algoritmo The Gold Standard . . . . . . . . . . . . .             .   .   .   .   .   .   .   .   .   .   .   22
        2.3.3. Método 3: calibración de cámara basado en elipses . . . . . . .             .   .   .   .   .   .   .   .   .   .   .   23
        2.3.4. Métricas de desempeño . . . . . . . . . . . . . . . . . . . . . .           .   .   .   .   .   .   .   .   .   .   .   23

3. Extracción de Características Faciales                                                                                              25
   3.1. Detección facial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                     .   .   .   .   25
        3.1.1. Aproximación de clases . . . . . . . . . . . . . . . . . . . . . . . . . . . .                          .   .   .   .   26
        3.1.2. Técnica de compensación de iluminación y transformación de color no lineal                              .   .   .   .   26
        3.1.3. Segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                        .   .   .   .   29
   3.2. Detección de los ojos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                      .   .   .   .   29

                                                      I
ANTROPOMETRIA FACIAL A PARTIR DE MULTIPLES VISTAS: UNA PROPUESTA METODOLOGICA
TABLA DE CONTENIDO

   3.3. Técnicas para la detección y extracción de caracterísitcas de la boca                       .   .   .   .   .   .   .   .   .   .   .   .   .   30
        3.3.1. Filtrado del Tono . . . . . . . . . . . . . . . . . . . . . . .                      .   .   .   .   .   .   .   .   .   .   .   .   .   31
        3.3.2. Escala de grises . . . . . . . . . . . . . . . . . . . . . . . .                     .   .   .   .   .   .   .   .   .   .   .   .   .   31
        3.3.3. Bordes horizontales . . . . . . . . . . . . . . . . . . . . . .                      .   .   .   .   .   .   .   .   .   .   .   .   .   32
        3.3.4. Ajuste de curvas . . . . . . . . . . . . . . . . . . . . . . .                       .   .   .   .   .   .   .   .   .   .   .   .   .   32
   3.4. Metodología para la extracción de características de la boca . . . . .                      .   .   .   .   .   .   .   .   .   .   .   .   .   35
        3.4.1. Ubicación de la boca . . . . . . . . . . . . . . . . . . . . .                       .   .   .   .   .   .   .   .   .   .   .   .   .   35
        3.4.2. Extracción de los vértices . . . . . . . . . . . . . . . . . .                       .   .   .   .   .   .   .   .   .   .   .   .   .   36
        3.4.3. Extracción del contorno exterior de los labios . . . . . . . .                       .   .   .   .   .   .   .   .   .   .   .   .   .   38
        3.4.4. Plantilla de la boca basada en contornos activos . . . . . . .                       .   .   .   .   .   .   .   .   .   .   .   .   .   38
   3.5. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                    .   .   .   .   .   .   .   .   .   .   .   .   .   42
        3.5.1. Localización de la boca . . . . . . . . . . . . . . . . . . . .                      .   .   .   .   .   .   .   .   .   .   .   .   .   42
        3.5.2. Detección de vértices . . . . . . . . . . . . . . . . . . . . .                      .   .   .   .   .   .   .   .   .   .   .   .   .   42
        3.5.3. Extracción del contorno exterior de los labios . . . . . . . .                       .   .   .   .   .   .   .   .   .   .   .   .   .   43

4. Geometría de Dos Vistas                                                                                                                              47
   4.1. Geometría de dos vistas . . . . . . . . . . . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   48
   4.2. Modelo de Cámara, Imágenes Sintéticas y Estimación          .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   48
   4.3. El sistema de adquisición 3D . . . . . . . . . . . . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   50
        4.3.1. Calibración . . . . . . . . . . . . . . . . . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   51
        4.3.2. Adquisición y procesamiento de las imágenes          .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   52
        4.3.3. Estimación de las correspondencias . . . . .         .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   52
        4.3.4. Reconstrucción . . . . . . . . . . . . . . . .       .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   54
   4.4. Resultados . . . . . . . . . . . . . . . . . . . . . . .    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   57

5. Resultados                                                                                                                                           61
   5.1. Antropometría directa . . . . . . . . . . . . . . . .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   61
   5.2. Fotogrametría 2D . . . . . . . . . . . . . . . . . .    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   62
        5.2.1. Calibración de la imagen . . . . . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   62
        5.2.2. Resultados . . . . . . . . . . . . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   63
   5.3. Antropometría con imágenes tridimensionales (3D)        .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   64
        5.3.1. Selección de puntos . . . . . . . . . . . . .    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   64
        5.3.2. Resultados . . . . . . . . . . . . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   66

Conclusiones Generales                                                                                                                                  69

Bibliografía                                                                                                                                            71

                                                       II
ANTROPOMETRIA FACIAL A PARTIR DE MULTIPLES VISTAS: UNA PROPUESTA METODOLOGICA
Lista de Figuras

1.1.   Puntos característicos del complejo facial para una vista frontal. . . . . . . . . . .                                                     .   .   .   .   . 6
1.2.   Puntos característicos del complejo facial. . . . . . . . . . . . . . . . . . . . . . .                                                    .   .   .   .   . 7
1.3.   Sliding Caliper, Spreading Caliper, Coordinated Caliper, y Attachable Goniometer.                                                          .   .   .   .   . 8
1.4.   Características consideradas para el análisis antropométrico de la región de la boca.                                                      .   .   .   .   . 11

2.1.   Modelo de Cámara. . . . . . . . . . . .      .   .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   14
2.2.   Proyección de una cónica en el espacio.      .   .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   18
2.3.   Patrones de calibración. . . . . . . . . .   .   .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   21
2.4.   Corrección de la distorsión radial. . . .    .   .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   23

3.1. Compensación de iluminación empleando la técnica “blanco de referencia”. (a) Imagen sin
      compensación. (b) Imagen con compensación. . . . . . . . . . . . . . . . . . . . . . . . .                                                                  . 27
3.2. Color de la piel en el espacio de color Y Cb Cr . Los puntos azules representan el color repro-
      ducible en un monitor y los rojos representan las muestras del color de piel. . . . . . . . .                                                               . 28
3.3. Imagen en el espacio de color Y Cb Cr . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                              . 28
3.4. Proyección en Cb Cr del espacio de color transformado, en el cual el modelo elíptico del
      color de piel está sobrecargado en su cluster (los puntos rojos indican el cluster de la piel).                                                             . 29
3.5. Detección facial. (a) Imagen de color. (b) Imagen en el espacio de color Y Cb Cr . (c) Imagen
      segmentada en base al modelo elíptico. (d) Imagen después del análisis de regiones. . . . .                                                                 .   29
3.6. Rostro detectado y ubicación de los ojos. . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                              .   30
3.7. Distribución tonal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                              .   31
3.8. Filtrado del tono. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                             .   31
3.9. Análisis en escala de grises. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                            .   32
3.10. Bordes horizontales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                              .   32
3.11. Ubicación de la boca. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                             .   37
3.12. Detección de vértices: gradiente vertical. . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                            .   37
3.13. Detección de vértices: REBPS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                               .   37
3.14. Extracción del controno. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                              .   40
3.15. Primera aproximación al controno exterior de la boca. . . . . . . . . . . . . . . . . . . . .                                                               .   41
3.16. Ajuste del labio inferior por medio de una función polinómica. . . . . . . . . . . . . . . .                                                                .   41
3.17. Ajuste del labio superior por medio de funciones polinómicas. . . . . . . . . . . . . . . .                                                                 .   41
3.18. Ajuste de los labios usando funciones polinómicas. . . . . . . . . . . . . . . . . . . . . .                                                                .   42
3.19. Resultados de la extracción del contorno exterior. . . . . . . . . . . . . . . . . . . . . . .                                                              .   45

4.1. Sistemas de coordenadas de la cámara y el mundo. . . . . . . . . . . . . . . . . . . . . . . 49
4.2. Configuración espacial de la cámara e imágenes resultantes. . . . . . . . . . . . . . . . . . 50
4.3. Sistema de adquisición. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

                                                        III
ANTROPOMETRIA FACIAL A PARTIR DE MULTIPLES VISTAS: UNA PROPUESTA METODOLOGICA
LISTA DE FIGURAS

4.4. Patrón de calibración. . . . . . . . . . . . . . . . . . . . . . . .                    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   52
4.5. Parámetros para la extracción de esquinas. . . . . . . . . . . . .                      .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   53
4.6. Esquinas reconstruidas a partir de las imágenes del patrón. . . .                       .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   54
4.7. Geometría para la estimación de correspondencias. . . . . . . .                         .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   55
4.8. Correspondencias extraídas de dos vistas calibradas. . . . . . . .                      .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   55
4.9. Nube de puntos para estimación lineal y posterior optimización.                         .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   56
4.10. Densidad de probabilidad condicional fcond (Xn|xn1 , xn2 ). . .                        .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   57
4.11. Puntos medidos de una línea de barrido para un plano. . . . . .                        .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   58
4.12. Imagen 3D de un rostro humano. . . . . . . . . . . . . . . . . .                       .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   59

5.1.   Sistema de adquisición de imágenes. . . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   63
5.2.   Patrón de calibración 2D. . . . . . . . . . . . . .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   63
5.3.   Nube de puntos de un rostro. . . . . . . . . . . .    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   65
5.4.   Contornos extraidos sobre los labios de un sujeto.    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   65
5.5.   Reconstrucción 3D del contorno de los labios. . .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   67

                                                    IV
ANTROPOMETRIA FACIAL A PARTIR DE MULTIPLES VISTAS: UNA PROPUESTA METODOLOGICA
Lista de Tablas

1.1. Medidas básicas propuestas en seis regiones del complejo craneofacial. . . . . . . . . . . .                                                     7
1.2. Medidas de acuerdo a la línea de referencia vertical. . . . . . . . . . . . . . . . . . . . . . .                                                8
1.3. Medidas de acuerdo a la línea de referencia horizontal. . . . . . . . . . . . . . . . . . . . .                                                  9

2.1.   Características de la cámara Canon EOS Digital Rebel EF-S 18-55. . . . . . .                                  . .     .   .   .   .   .   .   21
2.2.   Características de la cámara Genius VideoCam Messenger. . . . . . . . . . .                                   . .     .   .   .   .   .   .   21
2.3.   Resultados con el Método Tsai. . . . . . . . . . . . . . . . . . . . . . . . . .                              . .     .   .   .   .   .   .   22
2.4.   Resultados con el método Tsai + Optimización. . . . . . . . . . . . . . . . .                                 . .     .   .   .   .   .   .   22
2.5.   Resultados con el Método The Gold Standard. . . . . . . . . . . . . . . . . .                                 . .     .   .   .   .   .   .   22
2.6.   Resultados con el Método The Gold Standard + Corrección Distorsión Radial.                                      .     .   .   .   .   .   .   23
2.7.   Resultados con el Método de Calibración Basado en Elipses. . . . . . . . . .                                  . .     .   .   .   .   .   .   24
2.8.   Métricas de Desempeño. . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                . .     .   .   .   .   .   .   24

3.1.   Desempeño del algoritmo DARP. . . . . . . . . . . .       .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   42
3.2.   Error en la detección automática de vértices. . . . . .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   43
3.3.   Tiempos de proceso para la detección de los vértices.     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   43
3.4.   Matriz de confusión. . . . . . . . . . . . . . . . . .    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   44
3.5.   Matriz de confusión. . . . . . . . . . . . . . . . . .    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   44

5.1.   Medidas utilizadas. ∗ Se toman para la izquierda y la derecha de forma separada. . . .                                        .   .   .   .   61
5.2.   Medidas obtenidas por antropometría directa. Valores en milímetros. NA: No Aplica.                                            .   .   .   .   62
5.3.   Medidas antropométricas por medio de la fotogrametría 2D. Valores en milímetros. .                                            .   .   .   .   64
5.4.   Fotogrametría 2D vs. Antropometría directa. . . . . . . . . . . . . . . . . . . . . . .                                       .   .   .   .   64
5.5.   Medidas antropométricas con imágenes tridimensionales (3D). Valores en milímetros.                                            .   .   .   .   68
5.6.   Antropometría con imágenes tridimensionales vs. Antropometría directa. . . . . . .                                            .   .   .   .   68

                                                   V
ANTROPOMETRIA FACIAL A PARTIR DE MULTIPLES VISTAS: UNA PROPUESTA METODOLOGICA
LISTA DE TABLAS

                  VI
ANTROPOMETRIA FACIAL A PARTIR DE MULTIPLES VISTAS: UNA PROPUESTA METODOLOGICA
Introducción

El procesamiento de imágenes faciales es una de las áreas de mayor desarrollo dentro de los sistemas de
visión artificial [1–4]. Las medidas faciales han sido variables fundamentales para determinar las caracterís-
ticas específicas de cierta raza, el establecimiento de reglas para dibujar el rostro y la cabeza, aplicaciones de
carácter médico en general; de manera más reciente, se han desarrollado aplicaciones en interfaces hombre-
máquina a través del reconocimiento automático de rostros y en seguridad. Por ejemplo, en aplicaciones
médicas, el estudio de anomalías faciales en niños se realiza comparando sus medidas con datos promedio
obtenidos dentro de la población a la cual pertenece el sujeto. Las medidas de esta población deben mostrar
unos intervalos de normalidad que permitan ubicar las medidas faciales del paciente dentro de un rango,
estableciendo la existencia de alteración o no dentro de ella [5].

La determinación de las medidas faciales, hecha de manera manual, es una tarea que toma mucho tiempo y
en muchos casos es imprecisa, debido a la valoración subjetiva de quien realiza las medidas. En búsqueda
de mejorar la eficiencia y precisión del proceso de obtención de dichas medidas, desde inicios de los años
80 se ha venido sistematizando este proceso bajo el nombre de fotogrametría del rostro [6, 7]. Sin embargo,
estos trabajos se han basado tradicionalmente en medidas bidimensionales, lo que conlleva a la introducción
de un error debido a la forma tridimensional del rostro. Lo anterior, junto con la evolución de los sistemas de
adquisición de imágenes tridimensionales [8], que ya han alcanzado un alto grado de precisión, permite que
en la actualidad se puedan realizar análisis de imágenes faciales utilizando este tipo de tecnología [9]. No
obstante, la gran mayoría de los trabajos actuales de análisis facial utilizando información 3D, están orienta-
dos a la identificación de rostros [1–3, 10], esto debido, posiblemente, al importante número de aplicaciones
comerciales y de seguridad, dejando un vacío en aplicaciones de antropometría para cirugía reconstructiva
facial [11, 12].

Por lo anterior, en este trabajo se presenta una propuesta metodológica, para lo que podría ser un sistema
médico de antropometría facial utilizando imágenes tridimensionales, reconstruidas a partir de múltiples
vistas 2D. Las imágenes tridimensionales suministran información que puede permitir determinar de ma-
nera precisa la morfología facial, facilitando la planificación de un tratamiento y la definición de cambios, a
medida que las estructuras anatómicas (óseas y tejidos blandos) del paciente se desarrollan o el tratamiento
evoluciona. Adicionalmente, estas imágenes son tan fáciles de capturar como las imágenes de fotogrametría.
Este tipo de sistemas además permiten la evaluación de un mayor número de imágenes en un menor tiempo,
y reducen de manera significativa las variaciones indeseadas que se presentan en la evaluación del experto,
al tener criterios de medida claramente definidos y automatizados.

Este trabajo se centra en la medición automática de algunas caracteristicas de la boca. Pero siguiendo una
metodología similar el sistema se puede ampliar para que realice un análisis antropométrico facial completo.
El sistema de adquisición propuesto es un sistema estéreo activo, que combina dos cámaras CCD y una fuen-
te de luz estructurada. Las imágenes adquiridas por las cámaras CCD son imágenes bidimensionales y, sobre

                                                        1
ANTROPOMETRIA FACIAL A PARTIR DE MULTIPLES VISTAS: UNA PROPUESTA METODOLOGICA
Introducción

ellas se realiza todo el procesamiento para extraer las caracterísiticas faciales de interés. Poste-riormente,
utilizando una técnica de reconstrucción a partir de dos vistas, estos puntos característicos son llevados al
espacio tridimensional, donde se realizan las medidas antropométricas.

Este documento está compuesto, además de esta introducción y de las conclusiones generales, por cinco
capítulos así: Capítulo 1: Antropometría Médica Facial, Capítulo 2: Calibración de Cámara, Capítulo 3:
Extracción de Características Faciales, Capítulo 4: Geometría de Dos Vistas y, Capítulo 5: Resultados. A
continuación se describe brevemente cada uno de estos Capítulos.

En el Capítulo 1 se presentan algunos conceptos básicos de la antropometría médica facial. Se enuncian
los diferentes puntos característicos del rostro, los cuales son utilizados para realizar las diferentes medidas
antropométricas faciales. Es de anotar que en la literatura se han descrito más de 159 medidas. También
se enumeran las medidas básicas para las seis regiones del complejo craneofacial, como son: cabeza, ca-
ra, ojos, nariz, labios y boca, y orejas. Posteriormente se presentan las técnicas utililizadas para realizar
el estudio antropométrico facial. La técnica directa o manual, que es tal vez la técnica más utilizada en
la actualidad, es sin embargo una tarea que implica mucho tiempo de trabajo e imprecisión generada por
la valoración subjetiva de la persona que realiza las medidas. Luego es introducida la técnica de fotogra-
metría, como una técnica que busca mayor eficiencia y precisión en el proceso de adquisición de dichas
medidas. Esta técnica utiliza fotografías o imágenes bidimensionales del sujeto. Sin embargo, y aunque se
hacen algunas correcciones, tiene el problema de que las medidas son tomadas de las proyecciones de los
puntos característicos en el plano de imagen, perdiendo la información tridimensional del rostro. La última
técnica presentada es la realizada con imágenes tridimensionales. Más que una tecnología consolidada, ella
está en pleno desarrollo, como se deduce por la revisión bibliográfica que se realiza. El capítulo termina de-
finiendo las características sobre las que se concentra este trabajo, que están enfocadas a la región de la boca.

En el Capítulo 2 se introduce lo relacionado con el proceso de calibración de cámara. La información tridi-
mensional utilizada en este trabajo, para realizar las medidas de antropometría facial, es obtenida mediante
el uso de sistema activo compuesto por dos cámaras CCD (dos vistas), y un patrón de luz proyectada. Como
la antropometría requiere medidas de buena calidad, una etapa de calibración del sistema es necesaria para
garantizar la calidad de las medidas 3D. Después de definir la geometría o el modelo de cámara utilizado,
se introducen algunos de los algoritmos de calibración comúnmente utilizados. Finalmente, se muestra la
evaluación de la calibración del sistema empleando los diferentes métodos y se selecciona el método The
Gold Standard con corrección radial de lo lentes, por ser el que arroja menor error en las medidas.

Se expone en el Capítulo 3 todo lo relacionado con el proceso de extracción de características faciales. La
metodología utilizada inicia con la detección del rostro en la imagen, seguida por la detección de los ojos
y de la boca. Esta última es la región de interés, donde se hace una búsqueda refinada de las características
seleccionadas para este trabajo. La detección del rostro en la imagen es fundamental ya que al permitir ais-
larlo del resto de la imagen, disminuye el costo computacional y aumenta el desempeño de los algoritmos
posteriores. Por lo tanto, se presentan algunas técnicas para la detección de la posición exacta del rostro en la
imagen. Si bien el trabajo está orientado a la extracción de características de la boca, se presenta un apartado
sobre la detección de los ojos, ya que la ubicación de ellos se utiliza para la detección de la boca, también
como una posible extensión del trabajo a otras medidas antropométricas. Se utilizan técnicas basadas en
imagen-píxel, las cuales presentan un buen desempeño en la detección y extracción de características de la
boca, cuando se tienen condiciones de iluminación controladas, como fue el caso de este trabajo. Posterior-
mente, se presentan los algoritmos implementados para la detección de la boca, extracción de los vértices
(comisuras de los labios) y extracción y aproximación del contorno exterior de los labios, superior e inferior,

                                                         2
Introducción

separadamente. El Capítulo concluye con la evaluación del desempeño de los algortimos implementados,
que fueron evaluados sobre una base de datos de imágenes faciales, recogida para un estudio antropométrico
dirigido a la población infantil de la ciudad de Manizales.

Hasta aquí, la información que se ha procesado es sobre imágenes bidimensionales, pero como se busca
hacer un análisis antropométrico tridimensional, en el Capítulo 4 se presenta el sistema estéreo activo (com-
binación entre dos cámaras CCD: estéreo, y una fuente de luz estructurada: línea de barrido), que permite
obtener la imagen tridimensional, a partir de dos vistas 2D. El capítulo inicia presentando los fundamentos
matemáticos de la geometría de dos vistas y el modelo de cámara. Posteriormente, se discute el sistema
de adquisición y, en particular, los algoritmos que se requieren para obtener las imágenes 3D. Ellos son:
calibración de las cámaras, procesamiento de las imágenes, estimación de las correspondencias entre las dos
vistas (imágenes) y reconstrucción de la imagen 3D. El capítulo concluye presentando algunos resultados
de reconstrucción de imágenes u obtención de imágenes 3D.

Los resultados globales de trabajo se presentan en el Capítulo 5. Allí se muestra que la antropometría facial
con imágenes tridimensionales arroja resultados prometedores como metodología con baja dispersión para
realizar este tipo de medidas antropométricas.

                                                    3
Introducción

               4
Capítulo 1
                                                Antropometría Médica Facial

Del griego ανθρωτ τ oς: hombre, y µτ ρoν: medida, medir; lo que significa medidas del hombre, ciencia
que estudia las medidas del hombre. Se refiere al estudio de las dimensiones y proporciones de las partes
del cuerpo humano, con el propósito de comprender los cambios físicos del hombre y las diferencias entre
sus razas y sub-razas [13].

En el siglo XIX y comienzos del XX, la antropometría fue una pseudo-ciencia empleada principalmente
para clasificar criminales potenciales a través de sus características faciales. La Antropología Criminal de
Cesare Lombroso (1895), por ejemplo, establecía que los asesinos tenían mandíbulas prominentes y los la-
drones manos largas y barbas escasas. El trabajo de Eugène Vidoqc, el cual identifica criminales por medio
de sus características faciales, es empleado aún, casi un siglo después de su introducción [14].

El uso de la antropometría ha sido potencializado en las diferentes áreas del desempeño humano [15]. En
medicina, la comparación cuantitativa de los datos antropométricos con la medida de los pacientes antes y
después, fomenta la planeación y evaluación de la cirugía plástica y reconstructiva. En antropología forense,
conjeturas como las medidas aproximadas, derivadas de la antropometría, figuran en la determinación de
la apariencia de los individuos a partir de sus recuerdos, y en la búsqueda de niños perdidos, envejeciendo
su apariencia a través de fotografías anteriores. Actualmente, la antropometría es usada para la evaluación
del estado nutricional, para monitorear el crecimiento de la población infantil, para el diseño de muebles de
oficina y para el establecimiento de medidas estándares para el diseño de ropa, entre otras [14].

1.1.    Antropometría Facial
Antropometría facial es la medida de la superficie de la cabeza y de la cara. Originada durante el rena-
cimiento y definidos sus métodos por las reglas de expresión del neoclasicismo, expresa la calidad de las
relaciones entre varias partes del cuerpo humano [16]. La introducción de medidas individuales de la cabeza
y de la cara, desarrolladas principalmente para la medida del cráneo, data de la segunda mitad del siglo
XIX. La antropometría experimentó un renacimiento hace 3 décadas, cuando los médicos comenzaron a
usar las medidas de la superficie de pacientes con deformidades craneofaciales congénitas o adquiridas [17].
Gra-dualmente, ganó reconocimiento como un método objetivo para determinar cambios en la morfología
de los tejidos blandos de la cara, permitiendo el establecimiento de los rasgos característicos del ser humano
de acuerdo a su raza y sexo, y las diferentes anomalías faciales dentro de una población determinada [7].

La evaluación antropométrica facial está basada en la determinación de locaciones particulares del sujeto,
para el caso más concreto, los puntos característicos del rostro, definidos en términos de las características
visibles o palpables del complejo facial. Un conjunto de medidas entre dichos puntos es obtenido empleando

                                                      5
Capítulo 1. Antropometría Médica Facial

procedimientos e instrumentos de medida exactos [15].

1.1.1.   Puntos característicos faciales
La anatomía del cráneo incluye puntos externos e internos, que describen de manera general su estructura.
La cefalometría del rostro está conformada por planos y puntos característicos, estos últimos clasificados de
acuerdo a su naturaleza de blandos o duros.

Vista frontal del rostro.
Visto de frente, el rostro humano posee puntos característicos distribuidos a lo largo de las 6 regiones del
complejo facial, las cuales permiten establecer las diferentes medidas para el estudio antropométrico. Algu-
nos de los puntos característicos faciales de acuerdo a la vista frontal se pueden observar en la Figura 1.1,
y se listan a continuación [7]: Eurión (eu), Cigión (zy), Nasión (n), Gnatión (gn), Subnasal (sn), Alar (al),
Queilión (ch), Estomión (sto), Endocanto (en), Exocanto (ex), Labiale Superius (ls) y Labiale Inferius (li).

                Figura 1.1: Puntos característicos del complejo facial para una vista frontal.

Vista lateral del rostro.
Para el complejo Facial, visto lateralmente, se tienen los puntos característicos de las Figuras 1.2(a) y 1.2(b),
los cuales son: Glabela (g), Opistocráneo (op), Vértex (v), Preaural (pra), Postaural (pa), Supraauricular (sa),
Subauricular (sba), Punta Nasal (prn), Sellión (m) y Pogonión (pg) [7].

1.1.2.   Medidas de superficie
En las seis regiones del complejo facial (cabeza, cara, ojos, nariz, labios y boca, y orejas), se han descrito
150 medidas lineales y angulares [18], y 155 índices de proporción [19]. El índice de proporción indica la
relación entre dos medidas o más. Las medidas básicas de cada región ayudan a determinar las proporciones
generales de una región en particular (Tabla 1.1).

Para el establecimiento de las medidas faciales se tienen las líneas de referencia vertical y las líneas de
referencia horizontal, algunas de las cuales pueden ser observadas en la Tablas 1.2 y 1.3.

                                                         6
Capítulo 1. Antropometría Médica Facial

                          (a) Vista lateral.                           (b) Región de la oreja.

                          Figura 1.2: Puntos característicos del complejo facial.

          Región                           Nombre de la Medida y Abreviatura
                       Anchura de la cabeza (eu-eu), longitud de la cabeza (g-op), altura de la cabeza
          Cabeza
                       (v-n).
           Cara        Anchura facial (zy-zy), altura facial (n-gn).
                       Anchura Intercantal (en-en), anchura biocular (ex-ex), longitud de las fisuras
           Ojos
                       palpebrales derecha e izquierda (ex-en).
                       Anchura de la nariz (al-al), altura de la nariz (n-sn), protrusión de la punta
           Nariz
                       nasal (sn-prn).
                       Altura del labio superior (ls-sto), altura del labio inferior (sto-li), anchura de la
       Labios y Boca
                       boca (ch-ch).
                       Anchura de las orejas izquierda y derecha (pra-pra), longitud de las orejas
          Orejas
                       izquierda y derecha (sa-sba).

             Tabla 1.1: Medidas básicas propuestas en seis regiones del complejo craneofacial.

1.2.     Técnicas para el Estudio Antropométrico Facial
1.2.1.   Antropometría directa
En la antropometría directa, las medidas se toman directamente en la superficie de la cabeza y la cara.
La compleja superficie de la cara requiere un gran número de medidas incluyendo la determinación de la
proyección y las distancias lineales tangenciales (medidas en milímetros), las inclinaciones y los ángulos
(medidos en grados) [7].

Instrumentos antropométricos.
Las medidas antropométricas pueden ser obtenidas utilizando instrumentos como los presentados en la Fi-
gura 1.3, ellos son: Sliding caliper, Spreading caliper, Coordinate Caliper (Paralelómetro) y Attachable
Goniometer. Para realizar las medidas, ciertas precauciones deben ser tenidas en cuenta, por ejemplo, la
cabeza a ser medida debe conservarse en el plano horizontal Frankfurt (HF) [20]. Los puntos de medida
deben ser marcados antes de ser medidos.

                                                     7
Capítulo 1. Antropometría Médica Facial

                                                    Tabla I

   Altura Facial Total: Distancia existente entre la línea del pelo y
   el mentón.

   Altura de la Frente: Distancia existente entre la línea del pelo y
   la glabela.

                        Tabla 1.2: Medidas de acuerdo a la línea de referencia vertical.

         Figura 1.3: Sliding Caliper, Spreading Caliper, Coordinated Caliper, y Attachable Goniometer.

1.2.2.     Fotogrametría 2D
Esta técnica se basa en la realización de las medidas a partir de las imágenes o fotografías bidimensionales
(2D) de los pacientes. En cirugía plástica reconstructiva, la documentación fotográfica es tan importante
como los datos cuantitativos obtenidos de las medidas del esqueleto o de los tejidos blandos del complejo
craneofacial [7]. Con estas técnicas de fotografía, las siguientes medidas han cobrado importancia:

Angulos. Seis ángulos del perfil facial pueden medirse con fiabilidad si las fotografías proporcionan con-
     tornos claros de las líneas de perfil facial.

Inclinaciones. Las medidas pueden tomarse de la frente, cara superior, cara inferior, mandíbula y línea de
      perfil general de la cara.

Algunas distancias de proyección lineal se pueden obtener de la siguiente forma:

   1. Cara: Vista frontal, altura de la cara superior (n-sto).

   2. Ojos: Vista frontal, anchura intercantal (en-en); vista lateral, altura de la fisura palpebral (ps-pi) y
      altura ojo-ceja combinada (or-sci).

   3. Nariz: Vista frontal, altura nasal (n-sn); vista lateral, longitud de la columnella (sn-c).

                                                         8
Capítulo 1. Antropometría Médica Facial

   Distancia Interpupilar (DIP): Distancia entre los centros de am-
   bas pupilas con los ojos mirando directamente hacia adelante.

   Anchura de la Abertura Palpebral: Distancia existente entre la
   comisura interna y externa de cada ojo.
   Distancia entre Comisuras Externas - Distancia Biocular:
   Distancia existente entre las comisuras externas de ambos ojos.
   Distancia entre comisuras Internas - Distancia Intercantal:
   Distancia existente entre las comisuras internas de ambos ojos.

   Ancho de la Boca (En Reposo): Distancia entre uno y otro quei-
   lión.
   Arco de Cupido: Distancia entre las columnelas del philtrum a
   nivel del labio superior.

                     Tabla 1.3: Medidas de acuerdo a la línea de referencia horizontal.

   4. Boca y Labios: Vista frontal, anchura bucal (ch-ch), anchura del filtro (cph-cph), altura vertical lateral
      derecha e izquierda del labio superior (sbal-ls); vista lateral, altura del labio superior (sn-sto) y altura
      del bermellón inferior (sto-li) [6].

1.2.3.   Antropometría facial con imágenes tridimensionales (3D)
Durante los últimos años, el uso de imágenes tridimensionales en aplicaciones relativas con el rostro humano
se ha incrementado, especialmente por la disponibilidad de estas tecnologías después de más de 20 años de
investigación [8]. Sin embargo, el mayor número de estos trabajos se ha orientado a la identificación de
rostros [1–3], posiblemente por el gran número de aplicaciones comerciales y en seguridad. A continuación,
presentaremos una revisión bibliográfica de los trabajos que están relacionados, de una u otra forma, con la
antropometría facial mediante el uso de datos 3D.

En [11] se evaluó el potencial de los sensores 3D con luz estructurada para la realización de medidas de la
geometría del rostro humano. El objetivo era crear modelos virtuales del rostro humano, a partir de datos 3D
obtenidos al numerizar el rostro de los sujetos, y caracterizar la precisión de tales medidas. Se concluyó que
la calidad de los datos 3D es suficiente para la realización de medidas con propósitos antropométricos. Sin
embargo, las medidas que se realizaron estaban orientadas hacia la geometría del rostro. Adicionalmente,
los puntos en los datos 3D utilizados para las medidas, se seccionaban manualmente y no de forma auto-
mática. Otro trabajo cuyo objetivo fue el estudio de la precisión de los captores 3D, que utilizan tecnología
laser, para aplicaciones en antropometría, es el presentado en [12]. Este trabajo también concluyó que esta
tecnología tiene un alto potencial para el desarrollo de aplicaciones en antropometría facial.

                                                      9
Capítulo 1. Antropometría Médica Facial

Tal vez el único trabajo, a nuestro conocimiento, directamente relacionado con la antropometría facial, es
el presentado por Ghoddousi et al [9]. El objetivo del trabajo fue comparar tres métodos diferentes de rea-
lizar medidas faciales: antropometría manual, fotogrametría 2D y estereofotogrametría 3D. Los resultados
obtenidos con el método utilizando estereofotogrametría, mostraron ser comparables con los obtenidos por
el método de antropometría manual. Esto no sucedió con el método de fotogrametría 2D, que arrojó medi-
das más alejadas. En este trabajo, se pusieron marcas en los rostros de los sujetos numerizados, para poder
obtener las medidas por el tercer método. El sistema para las medidas tridimensionales utilizó dos conjuntos
de tres camaras CCD sincronizadas, para la captura de la imagen. Sin embargo, como ya se mencionó, los
sistemas que utilizan luz estructurada o tecnología laser, para obtener la información 3D, pueden arrojar re-
sultados más precisos que los obtenidos en este trabajo, que obtiene la información 3D a partir de múltiples
imágenes 2D.

En [21] se presenta un estudio que examina y compara las superficies faciales de niños con y sin labio y/o
paladar endido. Las superficies son obtenidas mediante un sistema de adquisición que utiliza tecnología
laser. Las medidas utilizadas para la comparación se obtienen seleccionando, manualmente, puntos sobre
las superficies digitales. En el trabajo presentado en [22], se propone un algoritmo que, si bien es utilizado
para el reconocimiento de rostros, hace un análisis interesante de ciertas medidas alrededor de la nariz y
los ojos. Los puntos utilizados para estas medidas son obtenidos automáticamente, a partir de los datos 3D.
Un trabajo que hace un análisis biométrico de las orejas es presentado en [23, 24], pero las medidas son
utilizadas para identificación de rostros y no para análisis antropométrico. La obtención de las medidas es
realizado de manera automática, utilizando la forma 3D de las orejas.

1.3.    Análisis Antropométrico Facial
Siendo el objetivo de este trabajo hacer una propuesta metodológica para realizar un análisis antropométrico
facial, utilizando imágenes tridimensionales, nos concentraremos en el estudio antropométrico de la región
de la boca. Es importante anotar que se ha seleccionado esta región del rostro, por la importancia e impacto
social que tiene la reconstrucción quirúrgica de los labios y su posterior control, en niños con labio y/o
paladar hendido corregido.

En la reconstrucción quirúrgica de los labios, uno de los factores más importantes para evaluar los resulta-
dos de la intervención, es la estética [25]. Desafortunadamente, existe un gran número de características que
deben ser consideradas para lograr una evaluación objetiva [6, 7, 25–27]. En este trabajo nos centraremos en
el análisis del contorno externo de los labios, mediante la obtención de un conjunto de características que
son consideradas como buenas descriptoras de la morfología de la boca (ver la Figura 1.4). Adicionalmente,
consideraremos la característica conocida como concavidad del arco de Cupido. Las medidas serán obteni-
das proporcionalmente al ancho de la boca.

Este conjunto de características está orientado a establecer asimetría en las medidas, debido a la relevancia
de esta asimetría, para establecer la calidad de la reconstrucción quirúrgica [28].

                                                       10
Capítulo 1. Antropometría Médica Facial

                                                                 Característica
                                                         F tml   Ancho del Philtrum
                                                         Cba     Arco de Cupido
                                                          Ls     Contorno del labio superior
                                                          Vx     Vértices
                                                          Ml     Ancho de la boca
                                                          Mh     Alto de la boca
                                                          Li     Controno del labio inferior

Figura 1.4: Características consideradas para el análisis antropométrico de la región de la boca.

                                             11
Capítulo 1. Antropometría Médica Facial

                                          12
Capítulo 2
                                                               Calibración de Cámara

La antropometría facial en este trabajo se desarrolla empleando múltiples imágenes 2D para obtener, me-
diante el método de triangulación, la información 3D. Por tal razón, la adquisión de imágenes será bá-
sicamente bidimensional. La adquisición de imágenes faciales es, dentro del procesamiento digital de la
imagen, una etapa que requiere mucho cuidado, ya que de sus condiciones y resultados depende el costo
computacional y la eficiencia de las etapas subsiguientes, y en particular de una buena extracción de carac-
terísticas faciales.

La cámara es la herramienta principal para conseguir la información 3D en la visión por computador. La
visión basada en los sistemas con cámara deben determinar los parámetros de esta, mediante el proceso de
calibración. La calibración de cámara es especialmente crucial para los usos que implican métricas cuan-
titativas a partir de una imagen, tales como medidas dimensionales, profundidad, antropometría facial o
movimiento de las mismas. El proceso busca determinar las características geométricas y ópticas, junto con
la posición y orientación en el mundo, para establecer la conexión entre la posición del píxel de la imagen y
un punto de la escena. Presentaremos a continuación el modelo de cámara pinhole (Sección 2.1). Además,
se estudian dos métodos de calibración de cámara a partir de correspondencias R3 → R2 y un método
que utiliza propiedades geométricas (Sección 2.2). Finalmente, presenta la implementación y los resultados
(Sección 2.3).

2.1.    Modelo de Cámara
Una cámara realiza una transformación R3 hacia R2 , donde un conjunto de puntos en el espacio (x) es
mapeado a un punto en un plano (X). El modelo de cámara más utilizado para estimar la transformación
es el modelo pinhole (Figura 2.1). Donde (xw , yw , zw ) es el sistema 3D coordenado del mundo, (x, y, z) es
el sistema 3D coordenado de la cámara, C es el centro de proyección llamado centro de cámara o centro
óptico y el plano de la imagen es el plano focal donde la componente de profundidad z es igual a la distancia
focal f . Esta transformación de espacios R3 → R2 está determinada por los parámetros, tanto extrínsecos
como intrínsecos, de la cámara. Los parámetros extrínsecos determinan la transformación de cuerpo rígido
del espacio coordenado del mundo al espacio de la cámara (Ecuación 2.1).

                                             x            xw
                                                            
                                           y  = R  yw  + T                                          (2.1)
                                             z            zw
donde, R (θx , θy , θz ) es la matriz de rotación y T (tx , ty , tz ) es el vector de traslación. La transformación
desde el sistema 3D coordenado de la cámara (x, y, z) a la imagen (X, Y ), se rige por los parámetros
intrínsecos de la cámara. Una primera aproximación se presenta con una transformación de perspectiva,

                                                        13
Capítulo 2. Calibración de Cámara

                                        Figura 2.1: Modelo de Cámara.

establecida por la distancia focal (Ecuación 2.2).

                                                 X = f x/z
                                                                                                     (2.2)
                                                 Y = f y/z

Sin embargo, una cámara CCD sugiere la utilización de un modelo más completo, que reúna información
de la fabricación de la cámara y del sensor CCD. De esta forma, la transformación está determinada por la
Ecuación 2.3.

                                                              x
                                                                
                                     X     f mx   0  mx px 0  
                                       
                                    Y = 0                     y 
                                                f my my py 0  
                                                                z                                  (2.3)
                                     1       0    0   1    0
                                                                 1

donde,

      f : es la distancia focal.

      mx , my : son el número de píxeles por unidad de distancia.

      px , py : las coordenadas del punto principal en la imagen.

No obstante, cada método de calibración presenta su propio acercamiento de los parámetros intrínsecos; por
esta razón, serán tratados más a fondo en la Sección 2.2.

                                                       14
Capítulo 2. Calibración de Cámara

2.2.       Métodos de Calibración
Existen diferentes métodos para realizar el cálculo de los parámetros de la cámara. Las técnicas más comu-
nes usan un conjunto de puntos correspondientes entre la imagen y el mundo real, mientras otras utilizan las
propiedades geométricas de los elementos proyectados en la imagen.

2.2.1.     Método 1: algoritmo Tsai
El método fue presentado por Tsai [29,30], su mayor ventaja es que tiene en cuenta la información de la dis-
torsión radial. Sin embargo, la principal desventaja es que utiliza datos propios de manufactura de la cámara
que normalmente no vienen especificados por el fabricante. Estos datos los utiliza para hallar la distancia
focal f , y el factor de incertidumbre de escala sx .

El acercamiento de los parámetros intrínsecos de la cámara y la transformación desde el sistema 3D coor-
denado de la cámara (x, y, z) a la imagen (X, Y ), está descrito por la transformación de perspectiva (Ecua-
ción 2.2), seguido de la distorsión radial (Ecuación 2.12, Ecuación 2.15). Finalmente, tiene en cuenta los
parámetros de fabricación de la cámara, como lo muestra la Ecuación 2.4.

                                         X f = sx (Nf x /dx Ncx )X d + Cx
                                                                                                            (2.4)
                                         Y f = (1/dy )Y d + Cy
donde,
         (Cx , Cy ): son el número de filas y columnas del centro de la imagen.
         (dx , dy ): es la distancia, de centro a centro, entre elementos adyacentes del sensor en la dirección X
         y Y respectivamente.
         Nc x: es el número de elementos del sensor en la dirección X.
         Nf x: es el número de píxeles de la imagen en la dirección X.
         sx : es el factor de incertidumbre en la escala de la imagen.

2.2.2.     Método 2: algoritmo The Gold Standard
Este algoritmo es una mejora del algoritmo DLT (Trasformación Lineal Directa), desarrollado por Abdel-
Aziz y Karara [31]. Este método supone que la óptica de la cámara es perfecta y no tiene en cuenta ningún
tipo de la distorsión. Para estimar el modelo de la cámara, sólo basta con calcular la matrix P que mapea el
espacio 3D x, a la imagen 2D X (Ecuación 2.5).

                                                     X = Px                                                 (2.5)
La matriz P para una cámara finita está representada por:
                                               h           i h        i
                     P = K R | T = K R | −RC              e = M | −MC
                                        
                                                                    e                                       (2.6)

donde, K es la matriz de calibración de la cámara,          la cual define los parámetros internos de la misma
(Ecuación 2.7).

                                              αx            s X0
                                                                  

                                       K=     0            α y Y0                                         (2.7)
                                               0            0   1

                                                       15
Capítulo 2. Calibración de Cámara

donde,

      αx y αy : es el factor de escala en la dirección de la coordenada X y Y respectivamente.

      s: es el skew, inclinación del sensor (normalmente 0).

      (X0 , Y0 )T : son las coordenadas del punto principal.

Las matrices K y R son halladas a través de la descomposición matricial RQ de la matriz M. La des-
composición RQ, encuentra dos matrices, tal que R sea una matriz triangular superior y Q sea un matriz
normalizada. Además, es posible inferir el centro de cámara C = [Cx , Cy , Cz , Ct ]0 , el cual está dado por:

                                 Cx = det([p2 |p3 |p4 ]) Cy = − det([p1 |p3 |p4 ])
                                 Cz = det([p1 |p2 |p4 ]) Ct = − det([p1 |p2 |p3 ])

C̃ es obtenido a partir de C homogéneo como C̃ = [x/t, y/t, z/t].

El cálculo de la matriz P (Algoritmo 1), se realiza seleccionando el mayor número de puntos correspon-
dientes (mínimo 6), entre la imagen planar y el espacio tridimensional. Por este motivo, y por facilidad de
cálculo, se utilizó un patrón de calibración para establecer dichas correspondencias.

Algoritmo 1 The Gold Standard [32].
Requiere: n > 6 de correspondencia entre Xi . → xi
Salida: Matriz P .
  Paso 1 Normalización: hallar las matrices de normalización T y Q, de cada uno de los n puntos X y x,
  respectivamente. Normalizar las coordenadas en cada uno de los espacios de forma independiente y hallar
  X y x.
  Paso 2 DLT: para cada correspondencia Xi → xi , construir la matriz Ai . Construir la matriz A de
  (2n × 12) a partir de las n matrices Ai . Obtener la descomposición en valores singulares de A. El vector
  singular asociado al menor valor singular, será la solución p. La matriz P se determina a partir de p por
  filas.

                                                                      P
                                                                     1 
                                          0             yi XiT
                                        T
                                               −xTi
                                                               
                                Ai =                             =    P2 
                                          xTi   0T −xi XiT
                                                                    
                                                                      P3
  Paso 3. Minimización del error geométrico: usando la estimación lineal como punto inicial, se minimiza
                                   2
  el error geométrico: d Xi , Pxi , sobre P. Se utiliza un algoritmo iterativo.
                      P
                          i
  Paso 4. Desnormalización: P = T−1 PQ.

Matrices de normalización.

Para este caso en particular, cabe aclarar que√la normalización para√las coordenadas espaciales debe ser tal
que: la mayor distancia en el espacio (x) sea 3 y en el plano (X) 2. Esta normalización es realizada para
evitar el problema computacional de las matrices dispersas (Algoritmo 2).

                                                         16
Capítulo 2. Calibración de Cámara

Algoritmo 2 Cálculo de las matrices normalización (T y Q).
Requiere: Nube de puntos x o X.
Salida: Matrices de Normalización T y Q.
  Paso 1. Sea en x o X se calcula la media de cada una de la componentes.
  Paso 2. Hallar la máxima distancia euclídea entre la media y toda la nube de puntos.
  Paso 3. Calcular la matriz de normalización:
                                                                       
               "                  #                  1 0 0 −xmean
           1      1   0 −X  mean
                                              1  0 1 0 −ymean 
   T=             0 1 −Zmean          Q=
         dmáx 0 0                          dmáx 0 0 1 −zmean
                                                                       
                            1
                                                             0   0   0        1

2.2.3.   Método 3: calibración de cámara basado en elipses
Este método de calibración utiliza las propiedades geométricas que presenta una cónica o una cuádrica en
el espacio, proyectada sobre la imagen, donde la cónica a estudiar será una elipse. Un primer acercamiento
lo realiza Tarel [33] y Daucher [34]. Una de las ventajas de este método es que los contornos de las elipses
pueden encontrarse con mayor precisión a comparación de los puntos correspondientes.

El acercamiento de los parámetros intrínsecos de la cámara y la transformación desde el sistema 3D coor-
denado de la cámara (x, y, z) a la imagen (X, Y ), está descrita por las Ecuaciones 2.3 y 2.1.

Caracterización de la elipse.
De manera general, toda cónica puede ser representada por una ecuación implícita, como la mostrada en la
Ecuación 2.8.

                                 AX 2 + 2BXY + CY 2 + 2DX + 2EY + F = 0                                          (2.8)

De igual forma, la ecuación implícita (Ecuación 2.8) se puede representar de forma matricial (Ecuación 2.9),
con el fin de tenerla en coordenadas homogéneas.

                                                 A B D     X
                                                          

                             X Y      1         B C E   Y  = [X]T [C] [X] = 0
                                          
                                                                                                                 (2.9)
                                                 D E F     1
Sobre cada elipse se determina el borde, utilizando alguna técnica de contorno. Para cada píxel que pertenece
al borde, se normaliza con una matriz T (Xb = TX ) y se genera el vector A b i (Ecuación 2.10). Por último, se
soluciona la matriz A, compuesta por vectores Ai , utilizando descomposición de valores singulares (SVD).
                    b                            b

                                                                         A
                                                                             
                                                                          b
                                                                   
                                                                        Bb   
                                                                              
                                                                  i     C
                             h                                                
                                                                               = Ai [X] = 0
                                                                          b
                                 X
                                 b2 X
                                    bi Ybi Yb 2 X
                                                bi Ybi           1                                             (2.10)
                                                                             
                                  i          i                          Db   
                                                                         E
                                                                             
                                                                         b   
                                                                         Fb
Al utilizar la solución por SVD, se asegura la mejor elipse que minimiza el error cuadrático medio. A
continuación, se desnomarliza la solución, utilizando la Ecuación 2.11.

                                                        17
Capítulo 2. Calibración de Cámara

                                                           
                                     A B D            A
                                                      b B
                                                        b D
                                                        b
                                    B C E  = |T|T 
                                                     B
                                                      b C
                                                        b E  |T|
                                                          b                                         (2.11)
                                     D E F            D E F
                                                      b b b

La proyección de la cónica C de la imagen en el espacio, a partir de una matriz de cámara P, da como
resultado una cónica en un plano infinito, comúnmente llamada cónica absoluta o cuádrica cónica Qco (Fi-
gura 2.2).

El cálculo de los parámetros de cámara se determina utilizando el Algoritmo 3, utilizando la caracterización
de cada elipse.

                                                                  PCPT = Qco

                               Figura 2.2: Proyección de una cónica en el espacio.

2.2.4.     Modelo de cámara con distorsiones
El modelo presentado en la Sección 2.1, supone que la óptica de los lentes de la cámara es perfecta. Sin
embargo, en general los lentes presentan defectos de dos tipos: cromáticos y geométricos [35]. Los defectos
geométricos describen la divergencia entre las posiciones observadas e ideales de la imagen de un punto del
espacio y están representados por la Ecuación 2.12.

                                                X d = X + δX (X, Y )
                                                                                                     (2.12)
                                                Y d = Y + δY (X, Y )
donde,

         X d , Y d : son las coordenadas correspondientes actuales, con distorsión.

         X , Y : son las coordenadas ideales.

         δ (X, Y ): es la función de distorsión.

En general se consideran tres tipos de distorsiones geométricas [36]. Estas distorsiones son representadas
por series numéricas, las cuales deben ser acotadas para su posible implementación y estabilidad. La primera
distorsión es el descentrado de los lentes con relación al eje principal, descrita por la Ecuación 2.13.

                                                          18
Capítulo 2. Calibración de Cámara

Algoritmo 3 Calibración basado en elipses.
Requiere: Imagen Segmentada
  Para i = 1 hasta NElipses Haga
    Paso 1. Cálculo de la cónica en el espacio Qa bs

                                        1      0    0
                                                                             
                                                           −xi
                                    0         1    0       −yi
                         Qi = |R|                                             R
                                                                               T
                                    0         0    0       −zi               
                                       −xi −yi −zi x2i + yi2 + zi2 − r2

     donde, R es una matriz de rotación del patrón de calibración.
     Paso 2. Caracterización de las elipsesi .

                                                      A B D
                                                                

                                               Ci =  B C E 
                                                      D E F
     Paso 3. Calcule P tal que:
                                             mı́n PCi PT − Qi
                                                 

  Fin Para

                                                             h         i
                            δXd = p1 3X 2 + Y 2 + 2p2 XY + O (X, Y )4
                                               
                                                             h         i                             (2.13)
                            δY d = 2p1 XY + p2 X 2 + 3Y 2 + O (X, Y )4
                                                         

La distorsión provocada por pequeñas desviaciones entre el paralelismo de los lentes, producida en la manu-
facturación de la cámara, se debe tener en cuenta. Este tipo de distorsión se puede modelar adecuadamente
por la adición de un prisma fino al sistema óptico, causando cantidades adicionales de distorsiones radiales
y tangenciales, descritas por la Ecuación 2.14.
                                                               h         i
                                    δXp = s1 X 2 + Y 2 + O (X, Y )4
                                                        
                                                              h          i                            (2.14)
                                    δY p = s2 X 2 + Y 2 + O (X, Y )4
                                                        

El tercer tipo de distorsión, es la distorsión radial (Ecuación 2.15), causada por la propiedades ópticas de
los lentes. Este tipo de distorsión es, generalmente, más importante que las distorsiones anteriores y más
significativa en cuanto a magnitud.
                                                                 h        i
                                   δXr = k1 X X 2 + Y 2 + O (X, Y )5
                                                           
                                                                 h        i                           (2.15)
                                    δY r = k2 Y X 2 + Y 2 + O (X, Y )5
                                                          

2.2.5.   Corrección de la distorsión radial: algoritmo The Gold Standard
Aunque este método no tiene en cuenta la distorsión radial de los lentes, como el método de Tsai (Sección
2.2.1), en este trabajo se presenta una etapa adicional para la corrección de dicha distorsión al inicio del
algoritmo ya presentado. La corrección se realiza sobre cada uno de los puntos de la imagen, con una
valor de κ determinado, utilizando el Algoritmo 4, el cual se presenta a continuación. Además, es necesario

                                                   19
Capítulo 2. Calibración de Cámara

conocer el tamaño del sensor y la resolución de la imagen a corregir, para realizar la transformación de
coordenadas de la imagen al sensor y visceversa.

Algoritmo 4 Corrección radial.
Requiere: Nube de puntos Xd , Yd y Coeficiente de Distorsión κ.
Salida: Nube de puntos Xu , Yu .
  Variable Xu , Xu {n puntos corregidos}
  Para i = 1 hasta n Haga
    Pasar a Coordenadas del Sensor (Xd , Yd ) → (Xd∗ , Yd∗ )
    Si (Xd∗ = 0 y Yd∗ = 0) o κ = 0 Entonces
       Xu∗ = Xd∗ , Yu∗ = Yd∗
    Si no q
       Ru = Xd∗2 + Yd∗2 , c = 1/κ, d = −c ∗ Ru Q = c/3, R = −d/2, D = Q3 + R2
       Si D >= 0 Entonces
          {Solo tiene una Raíz}      √              √
          Hacer D = sqrt(D), S = 3 R + D , T = 3 R − D , Rd = S + T
          Si Rd < 0 Entonces
             Este punto está fuera del sensor
          Fin Si
       Si no
          {Selección de la Raíz positiva√
                                        más pequeña}                              √
          Hacer D = sqrt(−D), S = 6 R2 + D2 , T = atan(D/R)/3 Rd = −S ∗ cos(T ) + 3 3 ∗ s +
          sen(T )
       Fin Si
    Fin Si
    Pasar a Coordenadas de la Imagen (Xu∗ , Yd∗ ) → (Xu , Yu )
  Fin Para

2.3.     Resultados

El patrón de calibración (Figura 2.3) consiste en dos láminas unidas formando un ángulo de 90 entre ellas.
El fondo de la lámina es de color blanco para lograr un alto contraste entre las figuras y el fondo. El Patrón 1
(Figura 2.3(a)), contiene una serie de cuadrados negros de 2 × 2 cm, separados entre ellos 2cm. El Patrón 2
(Figura 2.3(b)), contiene una serie de círculos negros de diámetro 3cm, separados 4cm entre centro y centro.
El Patrón 1 se utilizó para el método Tsai y The Gold Standard, mientras que el Patrón 2 se utilizó para el
método basado en elipses.

Las cámaras CCD a calibrar son: Canon EOS Digital Rebel EF-S 18-55 cuyas características se observan en
la Tabla 2.1 y la cámara Web Genius VideoCam Messenger cuyas características se observan en la Tabla 2.2.
Las imágenes fueron adquiridas con la mayor resolución disponible, en formato RAW y un nivel de calidad
muy fino para la cámara Canon, y para la cámara Genius en formato JPEG nivel de calidad estándar.

                                                              20
También puede leer