Robustez en reconocimiento fonético de voz para aplicaciones telefónicas

Puertas Terá, José Ignacio (2000). Robustez en reconocimiento fonético de voz para aplicaciones telefónicas. Tesis (Doctoral), E.T.S.I. Telecomunicación (UPM). https://doi.org/10.20868/UPM.thesis.657.

Descripción

Título: Robustez en reconocimiento fonético de voz para aplicaciones telefónicas
Autor/es:
  • Puertas Terá, José Ignacio
Director/es:
  • García Gómez, Ramón
Tipo de Documento: Tesis (Doctoral)
Fecha de lectura: 2000
Materias:
Palabras Clave Informales: DISEÑO Y COMPONENTES DE SISTEMAS DE INFORMACION; RECONOCIMIENTO Y SINTETIZACION DE HABLA; TELEFONO; CIENCIA DE LOS ORDENADORES; MATEMATICAS; TECNOLOGIA DE LOS ORDENADORES; CIENCIAS TECNOLOGICAS; TECNOLOGIA DE LAS TELECOMUNICACIONES;
Escuela: E.T.S.I. Telecomunicación (UPM)
Departamento: Señales, Sistemas y Radiocomunicaciones
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of JOSE_IGNACIO_PUERTAS_TERA.pdf]
Vista Previa
PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (1MB) | Vista Previa

Resumen

La tesis estudia diferentes técnicas orientadas a combatir las principales fuentes o causas de error en los sistemas de Reconocimiento Automático de Habla que operan en aplicaciones Telefónicas. Los trabajos comienzan con la presentación de los aspectos básicos de diseño de un reconocedor de habla basado en Modelos Ocultos de Markov. Se consideran, estudian y evalúan técnicas de robustez orientadas, principalmente, a la diferente forma de hablar de locutores diferentes, a las variaciones del canal, y a la posible presencia de ruidos, distorisiones y palabras fuera del vocabulario que emplee el usuario del sistema. Concretamente se estudian técnicas como las sutracción de la media cepstral (CMN), y la técnica conocida como RASTA. Se discute también la utilización del procedimientos para el rechazo de pronunciaciones incorrectas. La evolución de resultados se realiza sobre una base de datos telefónica capturada dentro de los trabajos de la Tesis, y que contiene un vocabulario reducido de dígitos, comandos y 100 nombres.

Más información

ID de Registro: 657
Identificador DC: https://oa.upm.es/657/
Identificador OAI: oai:oa.upm.es:657
Identificador DOI: 10.20868/UPM.thesis.657
Depositado por: Archivo Digital UPM
Depositado el: 06 Nov 2007
Ultima Modificación: 10 Oct 2022 12:23
  • Logo InvestigaM (UPM)
  • Logo Sherpa/Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Logo Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Logo del Portal Científico UPM
  • Logo de REBIUN Sexenios Logo de la ANECA
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo de Recolecta
  • Logo de OpenCourseWare UPM