Personal tools

EntomologicalColletion:FullProject

From hpcwiki

Revision as of 12:20, 23 October 2013 by Jvictorinog (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search

Contents

Título de proyecto

Diseño e implementación de un sistema prototipo para la consulta en-línea de una colección entomológica virtual

Información general del proyecto

  1. Lugar de ejecución del proyecto, duración y modalidad: El proyecto se desarrollará en la Universidad Central, además de la colaboración y reuniones con los expertos asesores de la UJTL. Los datos serán provistos por el grupo de Biosistemas de la UJTL
  2. Personal
    1. Hugo Franco, PhD
    2. Jorge Victorino, MSc
    3. Darwin Martínez, PhD (c)
    4. Angélica Ramírez, PhD
    5. Manuel Mejía, MSc
    6. Rodrigo Gil, MSc (Asesor Externo, UJTL) 80158942
    7. Asistente de investigación 1
    8. Asistente de investigación 2
    9. Conformación y trayectoria del(os) grupo(s) de investigación (máximo 500 palabras)

      • Complexus (U. Central). Clasificación Colciencias: Reconocido Código GrupLac: COL0081307
        • En el año 2013...
      • Centro de Biosistemas:
        • El Centro de Biosistemas -nueva denominación del Centro de Investigaciones y Asesorías Agroindustriales (CIAA) desde 2010- ha sido reconocido a nivel nacional e internacional, principalmente, por sus aportes en el desarrollo e implementación de modelos agroproductivos hortícolas intensivos y sostenibles bajo cubierta; esquemas de producción y comercialización que innovaron la forma de presentar y vender productos hortícolas en los mercados nacionales (a través de la marca registrada EUROFRESH); y por la prestación de servicios tecnológicos confiables y oportunos para el subsector productivo y académico (plantulación de especies hortícolas, laboratorios de suelos, aguas, entomología y fitopatología y asesoría y capacitación). Participa en este proyecto en el papel de entidad asesora externa, por medio del profesor Rodrigo Gil, PhD (c)

      Resumen costos del proyecto

      [Revisar presupuesto] Ámbito de la Convocatoria en la que se inscribe el proyecto INNOVACIÓN Y CREACIÓN Líneas de investigación de los grupos de investigación Computación paralela y distribuida Computaciòn en la nube Visión por computador Líneas de profundización de programas académicos en los que se inscribe el proyecto Ingeniería de Sistemas Computación de Alto Desempeño Visión por Computador

      Maestría en Modelado y Simulación Aprendizaje de Máquina Recuperación de información Visión por computador

      Resumen del proyecto (máximo 500 palabras)

      Los volúmenes de información que son susceptibles de ser representados (digitalizados, almacenados, accedidos) de manera digital en sistemas computacionales, vienen creciendo de manera vertiginosa, tanto por la disponibilidad de herramientas para la adquisición mediante digitalización de contenidos multimedia (texto, imágenes, audio y señales en general, secuencias de vídeo, etc.) como por la capacidad de almacenamiento de los medios digitales a disposición de los sistemas de cómputo encargados de proveer y procesar dicha información.

      Esto ofrece un sinnúmero de posibilidades para la mejora en el acceso (rapidez, disponibilidad, generalidad/completitud, independencia de la localización) a la información de interés para usuarios finales de la información, si bien implica retos técnicos de complejidad creciente en términos de los servicios prestados para la búsqueda, navegación y extracción de información relevante en conjuntos de datos cada vez más grandes y complejos (tamaño de las representaciones, almacenamiento en bodegas de datos, heterogeneidad de la información). La convergencia de los avances en telecomunicaciones digitales aplicadas al desarrollo de la Internet y los sistemas multimediales en línea y campos de reciente desarrollo como el Aprendizaje de Máquina y la Recuperación de Información, han permitido la implementación de herramientas y soluciones tecnológicas que abordan de forma satisfactoria tales retos y complejidades.

      Este proyecto aborda un problema particular de alto interés en términos de su aplicación: la construcción y diseño de la funcionalidad del acceso eficiente a una Colección Entomológica Virtual (en etapa de prototipo para una primera fase, condensada en esta propuesta), generada mediante la digitalización 3D de ejemplares, a partir de la Colección Entomológica (física) del Centro de Biosistemas de la U. Jorge Tadeo Lozano y su representación multimodal mediante la clasificación taxonómica de los ejemplares seleccionados y las correspondientes anotaciones en texto de sus características morfológicas diferenciales, apuntando a una navegación semi-asistida eficiente, con técnicas de navegación fundamentadas en aprendizaje de máquina y Recuperación de Información (IR).

      La implementación de una herramienta con dichas características representa un impacto significativo en el contexto del soporte del control de plagas aplicado a la producción agrícola de Bogotá/Región (dado el énfasis geográfico de la colección y el interés práctico para el Centro de Biosistemas) mediante la visualización y detección de las especies que afectan a los cultivos por comparación in-situ con la información multimodal (modelos 3D, anotaciones y clasificación) del contenido de la Colección Virtual. Esta propuesta constituye, además, la continuidad el proyecto “Diseño e implementación de un sistema de cómputo de alto desempeño para el procesamiento, almacenamiento y recuperación de grandes volúmenes de información multimodal sobre una arquitectura tipo clúster” mediante el uso de la arquitectura en desarrollo para la solución de un problema aplicado de alto impacto.

      Planteamiento del problema (2800 palabras)

      Problema de Investigación (50 palabras)

      Descripción precisa del problema (200 palabras)

      Marco Teórico y Estado del Arte (1100 palabras)

      Visualización 3D por computador.

      La formación de una imagen como resultado de la interacción de fotones con un ambiente 3D puede ser simulado por computador. El ambiente es reemplazado por un modelo geométrico 3D y la interacción de las luces con este modelo puede ser simulada por medio de una gran cantidad de algoritmos que hay disponibles. Una de las técnicas más sencillas es el modelo de sombreado (shading model) de Gouraud [1], esta calcula por medio de una interpolación lineal la intensidad de color que tienen los puntos de un polígono renderizado los cuales son proyectados al observador. Un modelo más preciso, llamado modelo de Phong [2] introduce un componente especular de la luz. Este modelo introduce el proceso de interpolación de los vectores normales a la superficie junto con la intensidad de los puntos del polígono. Modificaciones al modelos de Phong buscando mayor rendimiento en los cálculos han sido propuestos en [3] y [4], todos estos modelos son locales y no reproducen efectos globales de la iluminación como lo es la reflexión. Un estudio comparativo de métodos locales de iluminacion en términos de desempeño y calidad visual se puede ver en [5]. De tal forma, que modelos globales de iluminación que son aplicados a escenas poligonales pueden simular efectos de reflexión entre superficies. Métodos de radiosidad [6] y reflexiones especulares son simuladas con algoritmos de trazado de rayos [7]. Efectos más avanzados en técnicas globales de iluminación son presentados en [8]. Sin embargo, todos estos métodos son demasiado complejos para ser aplicados en tiempo real.

      Image based rendering

      Para evitar el complejo y costoso modelamiento de la escena, en ocasiones resulta más conveniente capturar fotografías de la escena desde diferentes puntos de vista. En este método la escena se representa por una colección de imágenes de entrada y un modelo geométrico simple [9], con lo cual la apariencia del renderizado es más real y es posible explotar la coherencia para generar nuevos puntos de vista. El renderizado no depende de la complejidad del modelo que puede ser de millones de polígonos y en vez de simular los fotones se aplican algoritmos de procesamiento de imágenes. Para representar este modelo existen 3 categorías:

      Rendering with no geometry.

      En esta representación el modelo geométrico es desconocido y la precisión depende de la cantidad de las imágenes de entrada y la caracterización la función plenóptica 7D [10]. Un enfoque conocido como campo de luz (lightfield) es la función de densidad de radiancia que describe el flujo de energía emitido por todos los rayos en el espacio 3D [11], una vez el campo de luz es creado nuevas vistas de la escena pueden ser construidas en tiempo real generando una vista 2D a partir del campo que es generado en 4D. Gran variedad de técnicas han sido desarrolladas para representar la radiancia en 2D[11], [12].

      Rendering with implicit geometry.

      Estas técnicas están basadas en la correspondencia de puntos en las imágenes capturadas, entre las que se encuentran interpolación de vistas y morphing. La interpolación de vistas usa el flujo óptico para generar directamente vistas intermedias, con el problema de que la vista generada puede que no sea geométricamente correcta [14]. El morphing es una versión especial de la interpolación de vistas con la diferencia que son geométricamente correctas [15].

      Rendering with explicit geometry. Para este enfoque las cámaras deben estar calibradas y todas las proyecciones están caracterizadas, las técnicas usadas anteriormente pueden ser aplicadas con mayor precisión.

      Digitalización de objetos y reconstrucción. En los métodos activos las luces son especialmente controladas como parte de la estrategia para alcanzar la información en 3D, la activación de la luz incorpora algunas formas de temporal o espacial modulación de la luz. Esta característica simplifica y mejora la precisión de algunos de los pasos en el proceso de captura 3D. Las técnicas pasivas no hacen control de las condiciones de la luz para obtener información. En los métodos pasivos existen condiciones controladas de iluminación sólo para mejorar la calidad de la visualización.

      Una segunda distinción es el uso de uno o múltiples puntos de vista desde donde la escena es observada. Algunas técnicas utilizadas en los métodos pasivos que usan múltiples puntos de vista son: Estéreo pasivo, estructura desde el movimiento y forma desde las siluetas. Para sistemas activos se tienen, Iluminación estructurada, estéreo activo, fotometría estéreo. Enfoques con múltiples puntos de vista usan el principio de triangulación para extraer información de profundidad, que es un concepto clave en los métodos de autocalibración y estructura desde el movimiento.

      Método de estéreo pasivo: se supone que se tienen imágenes tomadas al mismo tiempo desde diferentes puntos de vista. dadas dos proyecciones del mismo punto sobre las dos imágenes, su posición es encontrada como la intersección de las dos proyecciones. Repitiendo este proceso para diferentes puntos produce la forma 3D del objeto en la escena. Para lograr esto se debe conocer la configuración completa de la cámara como lo es su posición relativa, la orientación y los parámetros de calibración de la cámara. El problema de la triangulación consiste en extraer los puntos suficientes para obtener la forma del objeto en la primera imagen y encontrar sus correspondientes en la segunda imagen. Este problema resulta ser el más complejo de resolver en el enfoque estéreo y usualmente se encuentra correspondencias de aquellos puntos del objeto que son más fáciles de extraer dadas unas características bien discriminantes.

      Estructura desde el movimiento: En este enfoque uno puede tomar dos o más fotos del objeto mientras este se mueve, o alternativamente mover la cámara... si las tomas son en un intervalo de tiempo corto, será fácil encontrar las correspondencias. Teniendo más puntos de vista producirá un modelo más completo del objeto. Si múltiples vistas están disponibles las cámaras no necesitan ser calibradas de antemano y un procedimiento de auto-calibración puede ser aplicado en su lugar.

      El proceso de auto calibración significa que los parámetros internos y externos de la cámara son obtenidos desde las imágenes de inmodificable escenas en sí mismas. Triangulación Activa: técnicas de estructuras de luz

      Una forma sencilla de triangular un punto es usar un apuntador láser, el cual incide sobre la superficie y fácilmente detectado por ambas cámaras. El problema es que en la mayoría de las aplicaciones un solo punto no es suficiente, de tal forma que láser debería ser dirigido a diferentes puntos en la superficie y en un tiempo diferente. Este proceso requiere aparatos electrónicos muy precisos que aumentan considerablemente el costo. Para remediar este problema se reemplaza el láser por un patrón complejo, haciendo que el rayo se extienda a un plano con un lente cilíndrico, que se ubica frente a el láser, la intersección del plano con la superficie formarán una curva y las coordenadas 3D de la curva son obtenidas mediante triangulación. Una alternativa mucho más económica es proyectar líneas paralelas de luz simultáneamente en movimiento con un determinado patrón de amplitud (como un código de barras) para no perder la referencia de cada línea. Las líneas paralelas pueden usar los patrones de desplazamiento de fase que varían la intensidad sinusoidalmente en una dirección y constante en la perpendicular con una fase entre ellas de 120 grados. Patrones mucho más complejos pueden ser diseñados con códigos espaciales locales que identifican fácilmente partes de la proyección del patrón. Al final se proyecta sobre la superficie un patrón de textura y el problema se convierte en encontrar los puntos para emparejar la misma.

      Otra técnica llamada tiempo de vuelo usa sensores que miden la duración de una señal modulada, usualmente una luz láser, teniendo en cuenta que el tiempo de vuelo es proporcional a la distancia del objeto. Dependiendo de las ondas utilizadas estos dispositivos se pueden llamar radar, sonar o radar óptico.

      Shape from shading and photometric stereo Se usa una luz direccional con dirección e intensidad conocidas de tal forma que los niveles de gris obtenidos en la imagen conllevan a información de la orientación de parches en la superficie. Este proceso necesita características de reflexión de diferentes superficies obtenidas experimentalmente para poder caracterizar los patrones que se están registrando. La información de diferentes parches es combinada a través de suposiciones de suavidad de la superficie. esta técnica es muy sensible a las condiciones de iluminación estimar las condiciones de luz generalmente hacen parte del problema. Con la ayuda de múltiples luces con ubicación y dirección conocidas se mejora la aproximación de las normales a la superficie

      Shape from texture and shape from contour Al igual que la anterior, esta técnica produce solo orientación de la superficies, se asume que la superficie está cubierta por un patrón homogéneo de tal forma que distorsiones locales son el resultado de la proyección. La textura debe ser isotrópica y periódica. El algoritmo usa la regularidad del patrón para la estimación local de la orientación.

      Shape from defocus Aprovechando que cada cámara tiene un campo de profundidad limitado y solo algunos puntos que están en una particular distancia son enfocados, se hacen varias tomas desde el mismo punto de vista con diferentes niveles de enfoque, el nivel de desenfoque se usa para crear mapas de profundidad

      Shape from silhouettes Las imágenes del objeto son tomadas a diferentes intervalos dados pon un ángulo de rotación. En cada una de las imágenes la silueta del objeto forma un cono de rayos de proyección 3D que es interceptada con una masa virtual de arcilla la cual va cortando a medida que se hace la intersección con cada proyección de cada imagen. El resultado de todas las intersecciones produce una figura aproximada


      5.4. Estado del arte (1100 palabras)

      5.5. Aporte de la investigación a la generación de nuevo conocimiento (350 palabras

      La computación de alto desempeño es a día de hoy un campo de intenso trabajo académico tanto en investigación (algoritmos óptimos paralelos y distribuidos, metodologías de procesamiento distribuido en clusters y grids, compresión, métodos de encriptación y seguridad, etc.) como en desarrollo tecnológico (herramientas de hardware y software para la implementación de marcos de trabajo eficientes, conectividad, protocolos de transmisión de información, modos de representación, interfaces).

      Este proyecto pretende dotar a la Universidad Central y a la comunidad académica local , nacional e internacional, de una propuesta metodológica completa y consistente para el procesamiento, almacenamiento y recuperación de información de grandes volúmenes de datos de carácter multimodal en el contexto de la digitalización de una colección entomológica para su navegación en línea como herramienta de soporte técnico a la producción agrícola desde la perspectiva del control de plagas.

      Para ello, se adaptarán y extenderán, para aplicaciones académicas y de interés en el sector productivo, las herramientas y métodos del Estado del Arte para la programación paralela de marcos de trabajo para desarrollo de aplicaciones paralelas y distribuidas y almacenamiento distribuido de grandes volúmenes de información, modelos de representación de información multimodal mediante vectores de características, métodos de clarificación mediante análisis de semántica latente para recuperación de información relevante y herramientas para el acceso remoto de los resultados mediante el diseño de interfaces orientadas a una arquitectura basada en servicios sobre la web. 6. Pertinencia de la investigación (200 palabras)

      La Recuperación de Información y el manejo eficiente de información multimodal (desde aplicaciones para usuarios finales hasta el descubrimiento de conocimiento en investigación) hacen uso tanto de las técnicas del Aprendizaje de Máquina (para representación y caracterización de grandes volúmenes de información) y de las prestaciones ofrecidas por las estrategias y métodos del Cómputo de Alto Desempeño (los cuales hacen posible la ejecución de dichas técnicas en tiempos de procesamiento razonables, de acuerdo a las necesidades de los usuarios finales y la utilidad de la aplicación resultante). Dichos temas coinciden con las áreas de investigación GRIDUC, de la Facultad de Ingeniería de la Universidad Central.

      La aplicación específica, construcción de una Colección Entomológica Virtual para acceso en-línea implica, además, la aplicación de conceptos de cómputo en-la-nube, Visión por Computador y visualización (reconstrucción 3D de especímenes mediante técnicas de proyección multivista) que, igualmente, hacen parte fundamental de las actividades futuras de investigación de GRIDUC a corto y mediano plazo.

      El prototipo propuesto (ubicado en el ámbito de Bogotá/Región) ofrece una alternativa para el soporte al control de plagas en la producción agrícola -mediante visualización en-línea de ejemplares y sus características-, lo que fortalecería, desde la complementariedad, la colaboración con la Unversidad Jorge Tadeo Lozano a través del Centro de Biosistemas . 6.1. Concordancia con las líneas de profundización y de énfasis de los programas académicos de pregrado y posgrado (100 palabras) Las actividades relacionadas en este proyecto de investigación se enmarcan dentro de la línea estratégica de Innovación y Creación de la Universidad Central, específicamente en el campo de Tecnologías de la Información y las Comunicaciones, dado su objetivo de brindar, mediante una arquitectura orientada a servicios en la nube, una solución apropiada a un problema aplicado en el ámbito de navegación de grandes conjuntos de datos multimodales.

      Los campos de visualización de datos y visión por computador están enmarcados en el programa de Maestría en Modelado y Simulación, tal como figura en la propuesta. 6.2. Articulación con la extensión (100 palabras) El prototipo ofrecido se presenta como la primera aplicación que haría uso de los recursos de cómputo de alto desempeño para la navegación y visualización en-línea de grandes conjuntos de datos multimodales en la U. Central. En fase de producción, tendría amplia aplicación en el soporte al diagnóstico de fitopatologías debidas a la presencia de plagas en cultivos.

      El esquema de búsqueda y navegación asistida y de visualización de objetos 3D puede ser usando en diversas aplicaciones análogas en contextos diferentes, sentando las bases de un esquema de prestación de servicios para acceso a grandes volúmenes de datos multimodales 7. Objetivos del proyecto 7.1. Objetivo general (máximo 500 palabras) Diseñar e implementar un sistema prototipo para la navegación y acceso eficientes y desde la web a una colección entomológica virtual de tipo multimodal (texto y modelos 3D) de plagas en cultivos de la región Bogotá/Sabana 7.2. Objetivos específicos (máximo 500 palabras) Proponer y validar un protocolo para la adquisición de múltiples vistas de insectos en un ambiente controlado Diseñar e implementar el prototipo de un método para la reconstrucción volumétrica (3D) de objetos a partir de múltiples vistas Diseñar e Implementar un método para la recuperación de información multimodal apoyada en metadatos y navegación asistida de colecciones de modelos 3D Diseñar (adaptar) un sistema de almacenamiento y acceso distribuidos para la representación y navegación de una colección entomológica multimodal Integrar y validar la usabilidad del prototipo 8. Metodología propuesta (3000 palabras) 8.1 Elaboración del estado del arte Se revisarán los trabajos fundacionales y las técnicas y métodos más recientes para: La reconstrucción digital de superficies de objetos 3D La reconstrucción volumétrica de objetos 3D a partir de múltiples vistas La representación y el acceso eficiente a datos multimodales para almacenamiento de grandes conjuntos de datos mediante aproximaciones No-SQL La optimización de búsquedas, navegación y extracción de información mediante semántica latente y bolsas de características en conjuntos de datos heterogéneos El acceso eficiente a grandes volúmenes de datos en-línea mediante servicios web. 8.2. Proponer y validar un protocolo para la adquisición de múltiples vistas de insectos en un ambiente controlado Diseñar un procedimiento que permita la adquisición y registro de cada uno de los especímenes que se encuentran ó que ingresan al laboratorio entomológico. El protocolo se conforma de diferentes etapas que se describen a continuación: Solicitud, acceso, manipulación y montaje del espécimen. Establece un procedimiento dispuesto por los expertos del laboratorio entomológico, para solicitar, acceder y manipular a cada uno de los ejemplares de manera segura, en las condiciones ambientales necesarias y en el tiempo y cuidados requeridos para tal fin. El resultado de esta etapa es la ubicación del ejemplar en el ambiente de adquisición. Configuración del ambiente de adquisición. Establece los procedimientos técnicos necesarios, que se requieren para la instalación y configuración del ambiente de captura una vez el ejemplar ya esta listo. El procedimiento incluye labores de calibración de cámaras y demás aparatos de captura, los cuales permitirán en todo momento, realizar la auto-calibración de las cámaras con un sistema de marcas que independiza los montajes de captura y adquisición. Establecer el proceso de alistamiento y verificación de las condiciones de iluminación que permita el control del ambiente para cubrir la mayor cantidad de ángulos y tratar que todas las superficies se encuentren uniformemente iluminadas, esto para facilitar y mejorar la precisión de los procesos posteriores. Protocolo de adquisición. Establece todas las acciones que realizará el sistema de captura de manera automática para adquirir toda la información visual del ejemplar y almacenarla en un medio físico para su posterior procesamiento. Registrar la información del espécimen. Se define el procedimiento para el registro de toda la información que pudieran requerir los usuarios (agrónomos) para encontrar y describir a cada uno de los ejemplares. Desmontaje y devolución del ejemplar. Finalmente se establecen los procedimientos para retirar al espécimen con todos los cuidados requeridos por los expertos para regresarlo a su ambiente de conservación. Mantenimiento. Definir los procesos para realizar mantenimiento preventivo y correctivo del ambiente de adquisición y todos sus componentes, con el fin de realizar constantemente capturas de calidad y así aprovechar la disponibilidad valiosa del ejemplar.

      8.3. Diseñar e implementar el prototipo de un método para la reconstrucción volumétrica (3D) de objetos a partir de múltiples vistas Fuera de línea, se tiene toda la información que se ha capturado de cada uno de los ejemplares como son: Calibración de cámaras, imágenes de alta resolución que cubren diversos ángulos de los especímenes y metadatos que describen al ejemplar con la información que necesita el usuario del prototipo. Con esta información un programa realiza el proceso de caracterización 3D de cada ejemplar y genera una representación que permita la recuperación y visualización eficiente en un ambiente virtual 3D. El ambiente virtual se ejecutará en un cliente liviano, en el que el usuario interactúa con éste para observar al ejemplar desde cualquier punto de vista. De esta etapa surgen las siguientes actividades: Diseñar una estructura que permita el montaje de: Marcas 3D para la calibración de las cámaras en todo momento Soporte para ubicar el espécimen Soportes para los elementos de iluminación Soporte para las cámaras, que permita la rotación alrededor del ejemplar Soporte del laser para ayudar a la inicialización de los métodos de reconstrucción 3D Generar una representación geométrica de las vistas capturadas de los ejemplares a partir de las imágenes obtenidas, datos de calibración de cámaras y marcas sobre la superficies a detectar. 8.4. Diseñar e Implementar un método para la recuperación de información multimodal apoyada en metadatos y navegación asistida de colecciones de modelos 3D Diseñar métodos de búsqueda de información multimodal que involucran la estructura de los metadatos y la caracterización geométrica de los ejemplares, con el fin de hacer la búsqueda más eficiente y efectiva orientada a las necesidades de los usuarios. Por medio de métodos de agrupamiento los ejemplares pueden ser consultados por similitud visual y por similitud en la estructura de los datos. La información de las consultas que hacen los usuarios del prototipo permitirán relacionar a los ejemplares y caracterizar el uso del prototipo para mejorar la eficiencia en la interacción. De esta etapa se realizarán las siguientes actividades: Diseñar métodos de agrupamiento para los datos geométricos Diseñar métodos de agrupamiento multimodal para la estructura de metadatos. Diseñar métodos de agrupamiento para caracterizar la navegación de los usuarios. Implementar métricas que permitan la recuperación de la información por contenido en la estructura geométrica, metadatos y caracterización de consultas de usuario. Diseñar métodos de consulta que involucran las técnicas de recuperación de información mencionadas. 8.6 Integrar y validar la usabilidad del prototipo Integrar el sistema en sus diferentes componentes de representación, almacenamiento, bùsqueda y extracción de información de ejemplares y aplicar criterios de desempeño de relevancia y exactitud de la información recuperada y del tiempo de respuesta del sistema en un escenario de ejecución en la red. Establecer los requerimientos del sistema de generación de vistas de los modelos 3D reconstruidos según ancho de banda disponible, tiempo de respuesta del servidor y fluidez de la bùsqueda y la visualizaciòn. Adaptar el sistema de procesamiento y almacenamiento distribuidos disponible en GRIDUC para la representación de datos multimodales asociados a la colección entomológica virtual (reconstrucción 3D volumétrica, taxonomía, anotaciones morfológicas diferenciales) Selección de un conjunto representativo de ejemplares de la colección física para su digitalización 3D mediante reconstrucción volumétrica multivista Diseño de un protocolo experimental para la evaluación del desempeño de los procedimentos de búsqueda y navegación basados en medidas de aprendizaje de máquina (precision/recall) así como en criterios de velocidad de la comunicación con el servidor (tiempos de respuesta y latencias) 9. Resultados / Productos esperados (ver convocatoria) Método para la reconstrucción 3D de objetos a partir de múltiples vistas (conferencia + articulo) Método para la recuperación de información multimodal en colecciones entomológicas usando metadatos + soporte del usuario (artículo) Protocolo para la digitalización de objetos (registro/patente) Sistema distribuido para proveer servicios de acceso y navegación en-la-nube a colecciones multimodales usando técnicas avanzadas de visualización (Registro de Software)

      10. Identificación y caracterización de la innovación propuesta (Si es pertinente) (Máximo 500 palabras) La ejecución exitosa del proyecto objeto de esta propuesta permitiría brindar a la comunidad académica del país (dadas sus características de computación en la nube y arquitectura orientada a servicios sobre la web) una serie de herramientas y métodos para la navegación eficiente y visualización de grandes volúmenes de datos, susceptibles de ser trasladados de manera directa hacia aplicaciones útiles para el sector productivo, particularmente en lo referido a producción agrícola y el soporte técnico implícito en dicha actividad.

      El impacto que se conseguiría con esta implementación es inmediato en las labores de investigación desarrolladas en varios frentes dentro de la Facultad de Ingeniería de la Universidad Central, fortaleciendo de manera sensible los trabajos de desarrollo y pruebas de desempeño de herramientas de software para reconstrucción de objetos en 3D para visualización, de formulación de métodos de búsqueda y navegación eficientes en grandes volúmenes de datos y prestación de servicios en-línea para aplicaciones de altas exigencias de recursos de cómputo.

      Al ser implementado bajo una aproximación basada en servicios web y con la previsión de la mejora de las capacidades de almacenamiento fundadas en sistemas de archivos distribuidos, el sistema daría a investigadores y potenciales actividades de emprendimiento basadas en spin off, brindando a potenciales usuarios finales la capacidad de hacer uso de aplicativos con características de alto rendimiento, alta disponibilidad y flexibilidad en la localización del usuario. 11. Evaluación de necesidades del entorno (máximo 500 palabras) El acceso a recursos de cómputo avanzado para procesamiento de grandes volúmenes de datos en Colombia es restringido por razones que van desde el elevado costo de equipos de cómputo pasando por el uso escaso de dichos recursos en actividades productivas y de investigación, hasta el alto grado de desconocimiento de las ventajas de usar los conceptos y las herramientas metodológicas provistas por el modelado y la simulación en la optimización de procesos, el diseño de dispositivos, materiales y de productos finales para la mejora de la productividad y eficiencia en la generación de soluciones tecnológicas.

      Este problema se presenta igualmente en la falta de planificación en la inversión en infraestructura a escala nacional y regional, lo cual es más evidente si se observa bajo la óptica de la escasa penetración de las tecnologías de la información y las comunicaciones en el sector productivo y de servicios. En el ámbito de este proyecto, el soporte técnico a la mejora de la producción agrícola (caso: control de plagas), la aportación de herramientas de alta disponibilidad y flexibilidad de la localización de los clientes permitiría una mejora sustancial en el acceso a la asesoría requerida por los productores de materias primas, el que tiene un grado de desarrollo bajo, incluso en el contexto de Bogotá/Región

      12. Impactos esperados y propiedad intelectual (Máximo 500 palabras) Este proyecto ofrece una alternativa viable, accesible y de costo reducido en su implementación para fortalecer las herramientas informáticas a disposición de la comunidad académica regional y nacional y, potencialmente, ofrecer servicios al sector agrícola para la asesoría en el control de plagas en cultivos de Bogotá/Región.

      Se generarán, además de publicaciones académicas, herramientas tecnológicas y propuestas metodológicas susceptibles de ser generalizadas para otro tipo de aplicaciones análogas y, a su vez, capitalizadas como registros de software y, potencialmente, patentes enmarcadas en la actividad de investigación de la U. Central. 13. Descripción de actividades 13.1 Elaboración del estado del arte La reconstrucción digital de superficies de objetos 3D La reconstrucción volumétrica de objetos 3D a partir de múltiples vistas La representación y el acceso eficiente a datos multimodales para almacenamiento de grandes conjuntos de datos mediante aproximaciones No-SQL La optimización de búsquedas, navegación y extracción de información mediante semántica latente y bolsas de características en conjuntos de datos heterogéneos El acceso eficiente a grandes volúmenes de datos en-línea mediante servicios web. 13.2. Proponer y validar un protocolo para la adquisición de múltiples vistas de insectos en un ambiente controlado Establecer el proceso para la solicitud, acceso, manipulación y montaje del espécimen en el ambiente controlado de captura de información visual. Establecer los procedimientos para la configuración del ambiente de adquisición. Definir el protocolo de adquisición. Diseñar la interfaz para el registro del espécimen en la base de datos. Desmontaje y devolución del ejemplar. Definir procedimientos de mantenimiento.

      13.3. Diseñar e implementar el prototipo de un método para la reconstrucción volumétrica (3D) de objetos a partir de múltiples vistas Diseño de la estructura de captura Generar una representación geométrica de las vistas capturadas de los ejemplares. 13.4. Diseñar e Implementar un método para la recuperación de información multimodal apoyada en metadatos y navegación asistida de colecciones de modelos 3D Diseñar métodos de agrupamiento para los datos geométricos Diseñar métodos de agrupamiento multimodal para la estructura de metadatos. Diseñar métodos de agrupamiento para caracterizar la navegación de los usuarios. Implementar métricas que permitan la recuperación de la información por contenido en la estructura geométrica, metadatos y caracterización de consultas de usuario. Diseñar métodos de consulta que involucran las técnicas de recuperación de información mencionadas. 13.5 Integrar y validar la usabilidad del prototipo Establecer los requerimientos del sistema de generación de vistas de los modelos 3D reconstruidos según ancho de banda disponible, tiempo de respuesta del servidor y fluidez de la búsqueda y la visualización. Adaptar el sistema de procesamiento y almacenamiento distribuidos disponible en GRIDUC para la representación de datos multimodales Selección de un conjunto representativo de ejemplares de la colección física para su digitalización 3D mediante reconstrucción volumétrica multivista Diseño de un protocolo experimental para la evaluación del desempeño de los procedimentos de búsqueda y navegación basados en medidas de aprendizaje de máquina 13.6 Otras actividades Administración del proyecto Reuniones de seguimiento de las actividades Desarrollo de artículo y reporte técnico del método de representación, método de visualización, técnicas de recuperación de información, navegación y usabilidad del prototipo. 14. Cronograma de actividades Para ver las actividades adicionadas, por favor primero guarde


      15. Bibliografía (Máximo 500 palabras)

      [1] H. Gouraud. “Continuous Shading of Curved Surfaces.” IEEE Transactions on Computers, C-20(6):623–629, June 1971.

      [2] B.T. Phong. “Illumination for Computer Generated Pictures.” Communications of the ACM, 18(6):311–317, June 1975.

      [3] Chandan Singh, Ekta Walia, "Shading by Fast Bi-Quadratic Normal Vector Interpolation", ICGST International Journal on Graphics, Vision and Image Processing, Vol. 5. Issue 9, pp. 49-54, 2005.

      [4] Chandan Singh, Ekta Walia, "Fast Hybrid Shading: An Application of Finite Element Methods in 3D Rendering", International Journal of Image and Graphics, Vol. 5, No. 4, pp-789-810, 2005.

      [5] Ekta Walia, Chandan Singh. “An Analysis of Linear and Non-Linear Interpolation Techniques for Three-Dimensional Rendering.” IEEE Proceedings of the Geometric Modeling and Imaging― New Trends (GMAI'06). 2006.

      [6] Cohen, Greenberg, Immel, and Brock. “An efficient radiosity approach for realistic image synthesis.” IEEE Computer Graphics and Applications 6, pages 23–35, 1986.

      [7] Turner Whitted. “An improved illumination model for shaded display.” Communications of the ACM, 23(6):343–349, June 1980.

      [8] P. Dutre, P. Bekaert, and K. Bala. “Advanced Global Illumination.” AK Peters, Natick, MA, 2003.

      [9] H.Y. Shum, S.B. Kang, and S.C. Chan. "Survey of image-based representations and compression techniques." IEEE Trans. On Circuits and Systems for Video Technology, vol. 13, no. 11, pp. 1020-1037. Nov. 2003.

      [10] E. H. Adelson, and J. R. Bergen, “The plenoptic function and the elements of early vision”, Computational Models of Visual Processing, Edited by Michael Landy and J. Anthony Movshon. The MIT Press, Cambridge, Mass. Chapter 1. 1991.

      [11] M. Levoy and P. Hanrahan, “Light field rendering”, Computer Graphics (SIGGRAPH’96), pp. 31-42. August 1996.

      [12] S. J. Gortler, R. Grzeszczuk, R. Szeliski and M. F. Cohen, “The Lumigraph”, Computer Graphics (SIGGRAPH’96), pp. 43-54. August 1996.

      [13] Vishal Verma and Ekta Walia. “3D rendering - techniques and challenges”. International Journal of Engineering and Technology. Vol 2 (2), Pag 29-33. 2010

      [14] S. E. Chen and L. Williams, “View interpolation for image synthesis”, Computer Graphics (SIGGRAPH’93), pp. 279-288. August 1993.

      [15] S. M. Seitz and C. M. Dyer, “View morphing”, Computer Graphics (SIGGRAPH’96), pp. 21-30. August 1996.

      [16] MapReduce: Simplified Data Processing on Large Clusters Jeffrey Dean and Sanjay Ghemawat. In proceedings of OSDI'04: Sixth Symposium on Operating System Design and Implementation, San Francisco, CA, December, 2004

      [17] Csurka, Gabriella and Dance, Christopher R. and Fan, Lixin and Willamowski, Jutta and Bray, C\'edric. Visual categorizationwith bags of keypoints. , 2004.

      [18] Dimitris K. Iakovidis and Nikos Pelekis and Evangelos E. Kotsifakos and Ioannis Kopanakis and Haralampos Karanikas and Yannis Theodoridis. A Pattern Similarity Scheme for Medical Image Retrieval. , 2008.

      [19] Anna Bosch, Xavier Munoz, Robert Marti. Which is the best way to organize/classify images by content?. , 2007.

      [20] ByoungChul Ko and Hyeran Byun. Integrated region-based image retrieval using region's spatial relationships. , 2002.

      [21] F. Florea and E. Barbu and A. Rogozan and A. Bensrhair and V. Buzuloiu. Medical Image Categorization using a Texture Based Symbolic Description, 2006.


      16. Presupuesto 16.1 Presupuesto general


      Personal



      0%


      100% $59,976,000 62.58%


      2 Servicios técnicos



      0%


      0% $0 .00% 3 Equipos



      16%


      84% $19,000,000 19.83% 4 Transporte (no de trabajo de campo) , Fletes y Acarreos. Taxis y Buses.



      0%


      0% $0 .00% 5 Salidas de campo Transporte


      0%


      0% $0 .00%



      Viáticos


      0%


      0% $0 .00% 6 Materiales, insumos



      100%


      0% $200,000 .21% 7 Material bibliográfico



      100%


      0% $600,000 .63% 8 Interventoría / control



      0%


      0% $0 .00% 9 Seguros



      0%


      0% $0 .00% 10 Construcciones



      0%


      0% $0 .00% 11 Mantenimiento



      0%


      0% $0 .00% 12 Costos indirectos (usos de espacios académicos de la U. Central, aulas, auditorios, salas de computo) (10% del costo total del personal)





      $5,997,600

      13 Capacitación



      0%


      0% $0 .00% 14 Divulgación



      100%


      0% $3,500,000 3.65% 15 Administración (10% del costo total del personal)





      $5,997,600

      16 Imprevistos (5% sobre el total del proyecto)





      $4,563,680

      17 Publicación - Patente *



      100%


      0% $2,000,000 2.09%

      Total Presupuesto (SIN Imprevistos)






      $91,273,600


      Total Presupuesto






      $95,837,280


      16.2. Presupuesto de trabajo de campo

      16.3. Presupuesto de personal