Ayuda
Ir al contenido

Dialnet


Data cleaning and preprocessing techniques for manufacturing processes

  • Autores: Ana González Marcos, Manuel Castejón Limas, Joaquín Bienvenido Ordieres Meré, Alpha Verónica Pernía Espinoza
  • Localización: VIII Congreso Internacional de Ingeniería de Proyectos: Bilbao 6-8 de octubre de 2004. Actas, 2005, ISBN 84-95809-22-2
  • Idioma: inglés
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • español

      A pesar de que hoy en día siguen sin utilizarse a gran escala las técnicas de minería de datos (Data Mining) como herramientas que permiten extraer conocimiento previamente desconocido y potencialmente útil a partir de grandes conjuntos de datos, pueden llegar a ser extremadamente importantes.

      Para que la extracción del conocimiento a partir de los datos sea satisfactoria, es fundamental conocer el proceso productivo del que provienen. De esta forma, por ejemplo, es posible entender la importancia de cada variable. Del mismo modo, es necesario que los datos empleados sean válidos y adecuados. Es decir, todas aquellas muestras que, por su naturaleza, pueden perturbar los resultados finales y conducir a conclusiones erróneas, deben ser detectadas y tratadas antes de comenzar con el análisis e interpretación de los datos.

      El presente trabajo se centra en estas técnicas de limpieza y preprocesado. En él se muestran los resultados obtenidos al aplicar estas técnicas a un caso real particular:

      una línea de fabricación de hojalata. Los resultados obtenidos muestran las ventajas derivadas de la metodología basada en datos del proceso.

    • English

      In spite of the fact that data mining methodologies are still infrequently used on a large scale, the may become extremely important to extract previously unknown and potentially useful knowledge from large data sets.

      The success of the knowledge discovery process, it is not possible without knowing the manufacturing process to which the data mining is applied. For example, this knowledge allows us to understand the importance of each variable. Also, as a previous step of the analysis and interpretation stage, it is necessary to detect and correct the corrupted data in order to make it easier to build precise and reliable models. Data preparation is a diverse and difficult issue.

      In this paper, we present data cleaning and pre-processing techniques applied to the particular case of a tinplate production line. The obtained results show the advantages of these methodologies based on data.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno