Ayuda
Ir al contenido

Dialnet


Diseño de chips programables de señal mixta con bajo consumo de potencia para sistemas de visión en tiempo real

  • Autores: Gustavo Liñán Cembrano
  • Directores de la Tesis: Ángel Benito Rodríguez Vázquez (dir. tes.)
  • Lectura: En la Universidad de Sevilla ( España ) en 2002
  • Idioma: español
  • Número de páginas: 570
  • Tribunal Calificador de la Tesis: José Luis Huertas Díaz (presid.), Rafael Domínguez Castro (secret.), Josep Samitier Martí (voc.), Tamás Roska (voc.), Diego Cabello Ferrer (voc.)
  • Materias:
  • Enlaces
    • Tesis en acceso abierto en: Idus
  • Resumen
    • Las Tecnologías de la información y de las Comunicaciones han progresado de forma vertiginosa durante los últimos años. �Los �laptop� actuales tienen prestaciones similares o superiores a las de las estaciones de trabajo de hace 5 años; las redes locales han dejado de ser una exclusividad de oficinas y centros de investigación para convertirse en una cosa común en muchos hogares; el acceso de datos a alta velocidad ha abierto posibilidades insospechadas para la documentación, el teletrabajo o el ocio; y un largo etcétera.

      Este progreso ha estado propiciado y soportado por los avances logrados en distintas tecnologías base, entre ellas las microelectrónica de Silicio. En particular, las altísimas densidades de integración alcanzadas por las tecnologías CMOS VLSI han hecho posible el desarrollo de sistemas electrónicos cada vez más potentes y compactos. Por ejemplo, las CPUs de última generación contienen alrededor de 42 millones de transistores. También, la posibilidad de integrar circuitería analógica y digital CMOS dentro del mismo substrato semiconductor ha permitido la realización de Sistemas cuasi-completos (entrefase analógica más procesamiento digital) �cn� Chip (SoC), desplazando así a la forma tradicional de realizar sistemas electrónicos sobre PCBs. Y aunque se están realizando esfuerzos importantes encaminados hacia el desarrollo de tecnologías de soporte alternativas, todo parece indicar que las tecnologías CMOS seguirán siendo las principales protagonistas durante, al menos, dos décadas más. [Seab99] [Mein01].

      En un reciente artículo, Paul Saffo del �Institute for the Future� con sede en el �Silicon Valley� (Menlo Park-California) repasa las innovaciones que han producido en relación con las Tecnologías de la información durante las dos últimas décadas, y anticipa cuál será la ola innovadora para la siguiente [Saffo97]. En su análisis, compartido por muchos, considera que la década de los 80´s estuvo marcada por la disponibilidad del microprocesador digital, y dominada por el procesamiento. Al final de la década de los 80´s se desarrolló otra tecnología que producirá a la postre un cierto desplazamiento de foco � la optoelectrónica. Así, durante la década de los 90´s se produjo un cierto desplazamiento del énfasis, del procesamiento al acceso. En sentido metafórico, mientras que en la década anterior nos habíamos dedicado a crear �inteligencias�, en ésta nos dedicamos a interconectarlas. Claro que esto no supuso la obsolescencia del procesamiento. Más bien el contrario, produjo su potenciación. Por ejemplo, se desarrollaron nuevas generaciones de procesadores específicamente concebidos para facilitar el acceso.

      El análisis de Paul Saffo anticipaba que la década del 200 estaría marcada por el desarrollo de las tecnologías de sensores, un hecho que los tres años transcurridos desde dicho análisis nos están permitiendo confirmar. Así pues, la década del 2000 se caracterizará por un desplazamiento del foco desde el acceso a la Interacción. Globalmente, pues, mientras que en la década de los 80�s nos dedicamos a crear �inteligencias�, y en la de los 90�s a interconectarlas, en la primera década de este siglo nos concentraremos en dotar a estas inteligencias de órganos sensoriales.

      Las contribuciones de esta Tesis se ajustan a este perfil. La actividad se centra en desarrollar chips CMOS que incluyan ópticos y procesadores realizados dentro del mismo substrato semiconductor. Chips que sean capaces por tanto de �captar� imágenes enfocadas ópticamente sobre su superficie (sensado), de procesarlas de forma concurrente a su adquisición (procesamiento) en tiempo real, e incluso de tomar decisiones (actuación) en base al resultado de procesamiento. Esta actividad explota las buenas propiedades exhibidas por distintas estructuras compatibles con tecnologías CMOS para el sensado de luz visible, lo que unido a sus ya demostradas propiedades para la implementación de circuíos tanto digitales como analógicos, posibilita la realización de estos chips usando tecnologías CMOS standard.

      Los objetivos de la Tesis van muchos más allá de la mera demostración académica de esta posibilidad de combinar sensado y procesamiento; pretendemos dar un paso importante hacia el desarrollo de verdaderos VSoCs (Sistemas de Visión en Chip) con las prestaciones y la flexibilidad necesarias para que puedan ser utilizados en aplicaciones industriales. De hecho, algunos de los chips desarrollados en esta Tesis cumplen prácticamente ya estos requisitos.

      La actividad de diseño de chips de visión ha sido también abordad por otros equipos. Este problema ha despertado un elevado interés en numerosos ámbitos y zonas geográficas, con predominio inicia de los sectores académicos de los países más desarrollados, y con un progresivo incremento del interés de los sectores industriales. Hay muchos equipos diseñando entes que responde al nombre genérico de chips de visión, aunque con distintos apellidos: retinas artificiales, sensores computacionales, procesadores de plano focal, etc. algunos de los resultados más significativos pueden encontrarse en [Moini00]. La mayoría de estos chips de visión están concebidos para realizar una tarea fija y unívoca: por ejemplo, extraer los bordes de una imagen, ajustar la sensibilidad de los sensores en base a la imagen, etc. Hasta donde llega nuestro conocimiento sólo un chip, diseñado por Mitsubishi y comercializado bajo el nombre Artificial Retina IC M64283FP, ofrece cierta programabilidad. Programabilidad que soporta justamente sus aplicaciones industriales.

      Los chips diseñados en esta Tesis están concebidos como VSoCs de propósito general, y están dotados por tanto de los atributos de flexibilidad y programabilidad propios de los microprecesadores. Esto se consigue mediante la incorporación �on-chip� de las siguientes estructuras funcionales:

      - �Array� bi-dimensional de sensores ópticos con capacidad para adaptar su respuesta en función de las condiciones locales y globales de iliuminación.

      - �Array� de procesadores analógicos interactuantes reconfigurables local y globalmente mediante programación (�software�), y con parámetros ajustables también mediante programación.

      - Memorias analógicas RAM bi-dimensionales para almacenamiento de datos (imágenes) intermedias.

      - Memorias RAM para almacenamiento de instrucciones de programación; para controlar la reconfiguración local y global de �array�, los valores de los parámetros de los procesadores, la transferencia de datos entre memorias, etc. �ver por ejemplo cualquiera de los apéndices de guías de usuario de chis anexados a esta Memoria.

      - Circuitería de toma de decisiones en base al contenido de las imágenes.

      - Circuitería de direccionamiento, control y temporización.

      - Circuitería para la entrefase de instrucciones de control y de datos con el exterior, a alta velocidad y en formato digital.

      La aproximación escogida en esta Tesis para el diseño de tales VSoCs supone una revolución (o una involución en el sentido estrictamente cronológico, y no peyorativo, del término) respecto a la aproximación común al uso. Esta aproximación común usa circuitería analógica sólo en las entrefases, incorpora convertidores analógico/digitales lo más cerca posible de las señales físicas, y emplea básicamente circuitos digitales para el procesamiento. Se busca con esto simplificar el diseño y sacar ventaja de la mayor robustez y versatilidad de los circuitos digitales en comparación con los analógicos.

      En esta Tesis, sin embargo, desplazamos la frontera de separación entre la parte analógica y la parte digital. De hecho lo que hacemos es no descartar a priori el uso de procesamiento analógico, sino más bien sacar partido de la hibridación óptima entre procesamiento analógico y digital. De hecho el �array� de procesadores funciona básicamente en modo analógico, aunque emplea masivamente técnicas digitales para la reconfiguración y la programación de parámetros, así como para la corrección de errores mediante calibración. Esta incorporación de procesamiento analógico está soportada por tres pilare. Por una parte, si queremos procesar básicamente en paralelo para máxima velocidad, sería necesario un convertidor A/D por sensor, lo que obligaría a reducir significativamente la resolución espacial. Por otra, para una función dada los circuitos analógicos requieren mucha menos área y consumen mucha menos potencia que los digitales, lo que incide de nuevo en la posibilidad de incrementar la resolución espacial. Finalmente, el problema de la imprecisión inherente a los circuitos analógicos, no es determinante para visión; en estas aplicaciones no es importante la precisión local de los operadores, sino el comportamiento global, cooperativo, del sistema. De hecho, los sistemas de visión naturales utilizan también procesamiento del tipo analógico, con entidades cuyas presiones locales están en el rango de los 6bits [Werblin96].

      Sobre la superficie de un chip (de hecho se trata del chip ACE4K diseñado dentro de esta Tesis y descrito en los Apéndices anexados a esta Memoria) se enfoca una imagen de entrada. Programando los parámetros del chip, se obtienen, en tiempo real, distintas imágenes de salida. Si el chip contiene memoria de datos, cosa que ocurre en los chips diseñados en esta Tesis, estas imágenes de salida se pueden almacenar temporalmente dentro del chip. Por otra parte, si el chip tiene la capacidad de ejecutar un programa almacenado en su memoria de instrucciones, como también ocurre para los diseñados en esta Tesis, es posible combinar estas imágenes para implementar funciones de visión complejas. De hecho, los estudios realizados por el eminente neuro-biológo Prof. Frank Werblin [Werblin96], de la Universidad de California en Berkeley muestran que al cerebro trabaja básicamente con entre 10 y 12 �imágenes� que resultan de hacer procesamientos elementales sobre la imagen enfocada en la retina por el cristalino.

      La línea de investigación sobre VSoCs seguida en esta Tesis pretende pues sacar partido también del conocimiento existente sobre los sistemas de visión natural que, en última instancia, son los más eficientes de entre los conocidos hasta ahora. No se pretende la realización artificial de sistemas biológicos, ni siquiera su emulación fidedigna; entre otras razones porque el funcionamiento de estos sistemas dista mucho de conocerse al detalle. Sin embargo, nuestros trabajos explotan las ventajas inherentes de algunos conceptos arquitecturales de los sistemas biológicos en la realización de sistemas artificiales con mejores prestaciones para visión. Desde una perspectiva más general, hemos pretendido desde el principio, y seguimos pretendiendo, sacar partido a la hibridación óptima de varios pares de conceptos contrapuestos:

      - Arquitecturas que combinen aspectos naturo-mórficos combinados con otros que son propios de procesadores artificiales.

      - Procesamiento analógico combinado con digital (aproximación de señal mixta9.

      - Técnicas de sensado-procesamiento-almacenamiento concurrente en combinación con técnicas basadas en la concentración espacial de funciones.

      - Procesamiento altamente paralelo y cooperativo a nivel global, combinado con procesamiento serial localizado.

      - Programabilidad/versatilidad de los operadores combinado con minimización/especificidad.

      - Fiabilidad y velocidad basadas en el paralelismo de un elevado número de elementos con precisión y velocidad moderadas combinadas con soluciones basadas en pocos elementos de alta velocidad y precisión.

      Para finalizar decir que esta Tesis abre grandes perspectivas futuras, tanto desde el punto de vista académico/tecnológico como desde el punto de vista de la aplicación real en sectores industriales y de consumo. Sin otro propósito que centrar conceptos, podemos citar los siguientes ejemplos de aplicación en los que pueden obtenerse ventajas significativas.

      - Electrónica de consumo: compresión de video (telefonía móvil, internet, video doméstico, sistemas de teleconferencia), juguetería (juguetes inteligentes, etc.).

      - Sistemas de vigilancia y seguridad: detección de movimiento, localización de la actividad, etc., orientación automática de cámaras, selección e indicación automática de los puntos de atención preferente.

      - Control de calidad en procesos industriales: sistemas de inspección de procesos de producción de láminas de alta velocidad (papel, textil, acero, etc.), sistemas de control de calidad de piezas industriales (examen de formas, detección visual de fisuras y defectos, etc), control de calidad de producción agroalimentaria (huevos, frutas y hortalizas, etc.).

      - Sistemas de control avanzados: posicionamiento por visión, navegación visual.

      - Sistemas de producción: guiado autónomo de vehículos en entornos restringidos.

      - Robótica: visión artificial (percepción). Mejora del lazo de realimentación en el proceso de movimiento mecánico mediante observación por parte del robot de sus propios brazos. Navegación visual en entornos desconocidos. Realización de tareas guiadas por visión en entornos hostiles.

      - Sistemas militares (armas): detección, clasificación, identificación, y seguimiento de objetos (uno o varios simultáneamente) a alta velocidad. Guiado visual de misiles, sistemas de disparo automático, cañones antiaéreos.

      - Sistemas militares (observación): sistemas de alerta basados en información visual. Análisis en tiempo real de estructuras artificiales en imágenes aéreas de aeronaves no tripulados. Detección, clasificación, selección automática de objetos relevantes para ser transmitidos, compresión de video. Fusión rápida de imágenes y/o otros procedimientos de percepción (infrarrojo, visual, sonar, radar). Sistemas de navegación artificial.

      - Aplicaciones médicas: procesamiento de imágenes médicas en tiempo real, detección de contornos difusos, detección de texturas y características patológicas, análisis y detección de tejidos y células mediante procesamiento visual a alta velocidad. Detección y clasificación de células en fluidos.

      - Automoción: sistemas de seguridad activas (disparo inteligente de �airbags�, aviso de peligro de colisión), guiado semi-automático.

      - Sistemas de comunicaciones: compresión de video, toma de decisiones en multiplexores de canales a alta velocidad mediante análisis gráfico (e.g. ATM).


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno