Personal tools

BotanyDataCharacterizaction-State of the Art

From hpcwiki

Jump to: navigation, search

Contents

Estado del Arte

ANTECEDENTES

Los expertos desarrollaron diferentes métodos para la identificación de fitopatologías que son el método directo e indirecto, el método directo como su nombre lo dice requiere la toma de una muestra de la afección para su estudio, en el método indirecto se hacen análisis que se basan en la observación de características sin requerir el contacto con la zona afectada, algunos métodos directos son [1] método serológicos(es la extracción de proteínas utilizadas como antígeno) y el método molecular(es el análisis que pretende determinar la causa de la enfermedad analizando su ADN), los métodos serológicos incluyen: citometría, inmunofluorescencia y ensayo por inmunoabsorción ligados a enzimas(ELISA). El método molecular incluye Hibridación Fluorescente in situ, reacción en cadena de la polimerasa y vector de ADN. Aunque presenta dos grandes desventajas, la primera es el tiempo ya que es un proceso largo que puede tomar varias horas para obtener el resultado del tratamiento, la segunda es el alto costo de implementar y mantener los laboratorios dotados con recurso humano especializado para la realización de las pruebas. Los métodos indirectos corresponden al uso de herramientas computacionales que permiten realizar un procesamiento automático de una imagen tomada con una cámara digital que representa el contenido de la planta, o tomar una imagen de un microscopio. Varios trabajos en la literatura han abordado el problema de la identificación automática o semiautomática de fitopatologías. Por ejemplo, en [2] se comprobaron el uso de varias técnicas para la detección de patologías en hojas utilizando una técnica de segmentación de Otsu y una técnica de wavelets para extraer las características que permiten detectar la presencia de una patología como entrada para reconocimiento de patrones mediante redes neuronales, máquina de soporte de vectores(SVM) y K-means.También se ha usado otra técnica que se menciona en [3] son las imágenes hiperespectrales que tiene gran utilidad debido a que algunas características de los objetos dejan un marca espectral diferente que se puede distinguir del objeto de estudio y utilizan el SVM para el reconocimiento de patrones de dichas imágenes, en [4] se menciona la utilidad de las imágenes multiespectrales para la identificación de fitopatologías en pepino y usando una propagación hacia atrás de una red neuronal para el reconocimiento. Con estos métodos mencionados se puede resaltar que el uso del análisis de fotografías digitales, es una opción para la identificación de patologías por que se detectan mediante el análisis visual, aunque algunos de estos métodos se comportan mejor en ambientes controlados como lo es la segmentación, y otros son muy costos debido a que usan sensores especial para detectar los diferentes espectros. Aunque se han encontrado nuevas técnicas para la identificación de objetos. una de estas técnicas se le conoce con el nombre de descriptor local, este tipo de descriptor es más robustos debido a que tiene propiedades que permiten que sea invariante ante las distintas transformaciones lineales unos ejemplos son SIFT[5], SURF[6], BRIEF[7], DAISY[8] y Color-SIFT[9] entre otros. Aunque los descriptores locales tienen una característica que no permite usar un método de clasificación supervisada como por ejemplo K-NN (K nearest neighbors), una red neuronal o un SVM, ya que cuando se extraen estos descriptores en cada imagen se obtendrá un número n de puntos salientes, para resolver esto se utilizará un método que se ha vuelto popular en visión por computadora debido a que maneja una métrica con la cual se puede agrupar los diferentes puntos salientes que se extraen y poder generar una clasificación, se le conoce como la bolsa de características(Bag-of-features)[10] la cual utiliza un método de aprendizaje no supervisado conocido como el K-means clustering[11] el cual nos permitirá agrupar los distintos puntos y poder generar un lenguaje visual. Ya con esto poder clasificar los distintas patologías que se planean estudiar. Otro tipo de descriptores que se vuelven importantes en este tipo de problema son los descriptores de color. Debido a que las patologías bajo estudio producen cambios de color en las hojas de los cultivos, resulta adecuado utilizar descriptores de color para la recuperación de información propia de las tareas de clasificación mediante bolsas de características. Según se presenta en [12], el estándar MPEG-7 posee descriptores que permiten extraer características de interés de acuerdo a la tonalidad de regiones de interés en las imágenes, tales como:

  • Color Structure Descriptor (CSD)
  • Scalable Color Descriptor (SCD)
  • Color Layout Descriptor (CLD)
  • Dominant Color Descriptor (DCD)

Estado del arte sobre Bolsas de Características

La Bolsa de características fue una técnica que se desarrollo para interpretación y normalización de las características que representan los descriptores, en especial de descriptores locales que por su variabilidad en las imágenes generan n cantidad de puntos los cuales son representativos de cada imágenes, esta técnica usan un método de agrupamiento mediante K-Means que se basa en encontrar Centroides que mejor representan las características e ir iterando hasta encontrar el centroide optimo que represente la "palabra visual".

En la literatura este método se ha usado para la identificación en células malignas, análisis de cerebro, detección de objetos entre otros estudios, debido a su buen nivel discriminativo lo cual permite obtener una mayor certeza en el apoyo de los diagnósticos.

thumbs


El anterior esquema muestra los pasos con los cuales se realiza para crear una bolsa de características los pasos que se deben tomar en cuenta son:

Construir un dataset representativo

La construcción de dataset es una tarea de gran relevancia debido a que los datos(Imagenes) deben contener un buen detalle del objeto de estudio que permita resaltarlo de toda la imagen.

En algunos casos se requiere la caracterización de un experto debido a que el puede determinar con mayor claridad que objetos se consideran como importantes, el experto señala las región que contenga el objeto de interés para ir resaltando estas estructuras.

Extraer las características usando un descriptores

En la literatura se han encontrado distintos descriptores que permiten caracterizar la información extrayendo la información relevante, esto descriptores describen las características mas elementales como lo son la forma, la textura, el color, movimiento entre otros, debido al aumento de contenido multimedia en gran parte de los campos de investigación el uso de visión por computador se ha vuelto común en algunas áreas como la medicina, la seguridad, el entretenimiento, Etc.

Estos descriptores pueden describir la información general de la imagen o la información mas especifica, los descriptores que describen esta información general utilizan distintos estandares por ejemplo los histogramas de diferentes espacios de color, en algunos estudios se ha buscado encontrar puntos que se invariantes ante cualquier transformación lineal o no lineal, estas técnicas se conocen como descriptores locales, en la literatura se encuentra mucho de ellos debido a su alta complejidad matemática y a su alto nivel de invarianza en los puntos que se encuentra en una imagen determinada, estas técnicas se han vuelto muy populares y han tomado gran importancia en el campo de visión por computador

Aplicar el algoritmo de K-means para agrupar los descriptores en palabras visuales

Este método conocido como K-means clustering se usa mucho en la segmentación de objetos aunque también se le encontró otra utilidad a este método estadístico el poder agrupar grupos y normalizar descriptores con n puntos. Algunos autores como[2] mencionan el uso de este método para agrupar los puntos en los distintos centros

\underset{\mathbf{S}} {\operatorname{arg\,min}} 
\sum_{i=1}^{k} \sum_{\mathbf x_j \in S_i} \left\| \mathbf x_j - 
\boldsymbol\mu_i \right\|^2

Realizar la extracción y determinar la mínima distancia entre los palabras visuales y los descriptores

Para crear los datos de entrenamiento, básicamente se realiza el proceso de clustering con K-means sobre los descriptores y se obtiene una métrica con la cual compara pero esta vez contra los descriptores sin agrupamiento determinando los que mejor representan los puntos extraídos y con esto obtenemos los datos de entrenamiento.

Estado del arte en el campo de la agronómico

Referencias

  1. Van Zyl, S. A. (2009). The use of adjuvants to improve fungicide spray deposition on grapevine foliage (Doctoral dissertation, Stellenbosch: Stellenbosch University).
  2. Moosmann, F., & Nowak, E. (2008). Randomized Clustering Forests for Image Classification. IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 30(9).
  3. Rocha, A., Hauagge, D. C., Wainer, J., & Goldenstein, S. (2010). Automatic fruit and vegetable classification from images. Computers and Electronics in Agriculture, 70, 96-104.
  4. Kitamura, K., Yamasaki, T., & Aizawa, K. (2009, October). FoodLog: capture, analysis and retrieval of personal food images via web. In Proceedings of the ACM multimedia 2009 workshop on Multimedia for cooking and eating activities (pp. 23-30). ACM.
  5. Maruyama, Y., de Silva, G. C., Yamasaki, T., & Aizawa, K. Personalization of Food Image Analysis.
  6. Heijmans, H. J., & Roerdink, J. B. (Eds.). (1998). Mathematical morphology and its applications to image and signal processing (Vol. 12). Springer.