Expert knowledge-guided feature selection for data-based industrial process monitoring

Cesar Uribe; Claudia Isaza

doi:10.17533/udea.redin.14223

Autores/as

Cesar Uribe Universidad de Antioquia
Claudia Isaza Universidad de Antioquia

DOI:

https://doi.org/10.17533/udea.redin.14223

Palabras clave:

monitoreo de procesos, detección de fallos, agrupamiento difuso, selección de variables

Resumen

Los procesos industriales se caracterizan por estar en entornos abiertos con incertidumbre, imprevisibilidad y comportamiento no lineal. Se requiere una medición y un seguimiento rigurosos para luchar por la calidad, la seguridad y las finanzas del producto. Por lo tanto, los sistemas de monitoreo basados en datos han ganado interés en la academia y la industria (por ejemplo, agrupación). Sin embargo, los procesos industriales tienen altos volúmenes de datos complejos y de gran dimensión disponibles, con dominios mal definidos y, a veces, medidas redundantes, ruidosas o inexactas con parámetros desconocidos. Cuando un modelo mecanicista o estructural no está disponible o no es adecuado, la selección de variables relevantes e informativas (reduciendo la alta dimensionalidad) facilita el reconocimiento de patrones para identificar estados funcionales del proceso. En este artículo, abordamos el problema de selección de características en el monitoreo de procesos industriales basados en datos donde un modelo matemático o estructural no está disponible o no es adecuado. La orientación de conocimientos expertos se utiliza dentro de una selección de características de envoltura basada en la agrupación en clústeres. El conjunto reducido de características es capaz de representar la estructura intrínseca de datos históricos integrando el conocimiento experto sobre el proceso. Se propone y prueba un sistema de monitorización en un reactor de intesificación (OPR)', sobre el tiosulfato y la reacción de esterificación. Los resultados muestran que se necesitan menos variables para identificar correctamente los estados funcionales del proceso.

|Resumen

= 126 veces | PDF

= 69 veces|

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Cesar Uribe, Universidad de Antioquia

Departamento de Ingeniería Electrónica.

Claudia Isaza, Universidad de Antioquia

Departamento de Ingeniería Electrónica.

Citas

F. Akbaryan, P. Bishnoi. “Fault diagnosis of multivariate systems using pattern recognition and multisensor data analysis technique”. Computers & Chemical Engineering. Vol. 25. 2001. pp. 1313-1339. DOI: https://doi.org/10.1016/S0098-1354(01)00701-3

I. Guyon, S. Gunn, M. Nikravesh, L. Zadeh. “Feature Extraction: Foundations and Applications” Studies in Fuzziness and Soft Computing. Vol. 207. pp. 1-22.

D. Aha, R. Bankert. A comparative evaluation of sequential feature selection algorithms. In Proceedings of the Fifth International Workshop on Artificial Intelligence and Statistics. Springer-Verlag. 1995. Fort Lauderdale. USA. pp. 1-7.

K. Muske, C. Georgakis. A methodology for optimal sensor selection in chemical processes. Proc. American Control Conference the 2002. Villanova, Pennsylvania, USA. 2002. pp. 4274-4278. DOI: https://doi.org/10.1109/ACC.2002.1024603

R. Sikora, S. Piramuthu. “Efficient genetic algorithm based data mining using feature selection with hausdorff distance”. Inf. Tech. and Management. Vol. 6. 2005. pp. 315-331. DOI: https://doi.org/10.1007/s10799-005-3898-3

L. Fraleigh, M. Guay, J. Forbes. “Sensor selection for model-based real-time optimization: relating design of experiments and design cost”. Journal of Process Control. Vol. 13. 2003. pp. 667-678. DOI: https://doi.org/10.1016/S0959-1524(02)00122-1

S. Verron, T. Tiplica, A. Kobi. “Fault detection and identification with a new feature selection based on mutual information”. Journal of Process Control. Vol. 18. 2008. pp. 479-490. DOI: https://doi.org/10.1016/j.jprocont.2007.08.003

M. Bensch, M. Schroder, M. Bogdan, W. Rosenstiel. Feature selection for high-dimensional industrial data. Proceeding of the European Symposium of Artificial Neural Networks. 2005. Brugues, Belgium.pp. 375-380.

T. Kourti. “Process analysis and abnormal situation detection: from theory to practice”. Control Systems Magazine IEEE. Vol. 22. pp. 10-25. DOI: https://doi.org/10.1109/MCS.2002.1035214

T. Kempowsky. Surveillance de procédées à base de méthodes de classification. Ph.D. dissertation. INSA Toulouse. 2004. pp. 16-20.

P. Domingos. “The role of occam’s razor in knowledge discovery”. Data Mining and Knowledge Discovery. Vol. 3. 1999. pp. 409-425. DOI: https://doi.org/10.1023/A:1009868929893

T. Cheng, C. Wei, V. Tseng. “Feature selection for medical data mining: Comparisons of expert judgment and automatic approaches”. Computer-Based Medical Systems. 2006. pp. 165-170.

B. Burns, A. Danyluk. “Feature selection vs theory reformulation: A study of genetic refinement of knowledge-based neural networks”. Mach. Learn. Vol. 38. 2000. pp. 89-107. DOI: https://doi.org/10.1023/A:1007634023329

C. Isaza. Diagnostic par techniques d’apprentissage floues: Conception d’une méthode de validation et d’optimisation des partitions”. Ph.D. dissertation. Laboratoire d’Analyse et d’Architecture des Systèmes du CNRS. Toulouse, France. 2007. pp. 5-23.

L. Prat, A. Devatine, P. Cognet, M. Cabassud, C. Gourdon, S. Elgue, F. Chopard. “Performance evaluation of a novel concept “open plate reactor” applied to highly exothermic reactions”. Chemical Engineering and Technology. Vol. 28. 2005. pp. 1028- 1034. DOI: https://doi.org/10.1002/ceat.200500120

A. Orantes, T. Kempowsky, M. Lann, L. Prat, S. Elgue, C. Gourdon, M. Cabassud. “Selection of sensors by a new methodology coupling a classification technique and entropy criteria”. Chemical Engineering Research and Design. Vol. 85. 2007. pp. 825-838. DOI: https://doi.org/10.1205/cherd06072

C. Uribe, C. Isaza, O. Gualdron, C. Duran, A. Carvajal, A wrapper approach based on clustering for sensors selection of industrial monitoring systems. Proceedings of the 2010 International Conference on Broadband. Wireless Computing, Communication and Applications. Japan. 2010. pp. 428-487. DOI: https://doi.org/10.1109/BWCCA.2010.118

I. Guyon, A. Elisseeff. “An introduction to variable and feature selection”. J. Mach. Learn. Res. Vol. 3. 2003. pp. 1157-1182.

S. Guerif, Y. Bennani. “Selection of clusters number and features subset during a two-levels clustering task”. Artificial Intelligence and Soft Computing. 2006. pp. 28-33.

C. Isaza, A. Orantes, T. Kempowsky, M. Le Lann. Contribution of fuzzy classification for the diagnosis of complex systems. The 7th IFAC International Symposium of Fault Detection. Supervision and Safety of Technical Processes. 2009. Barcelona, España. pp. 1132-1137. DOI: https://doi.org/10.3182/20090630-4-ES-2003.00186

T. Kmepowsky, A. Subias, J. Aguilar-Martin. “Process situation assessment: From a fuzzy partition to a finite state machine”. Engineering Applications of Artificial Intelligence. Vol. 19. 2006. pp. 461-477. DOI: https://doi.org/10.1016/j.engappai.2005.12.012

J. Aguilar, C. Isaza, E. Diez, M. LeLann, J. Waissman. “Process Monitoring Using Residuals and Fuzzy Classification with Learning Capabilities”. Advances in Soft Computing. Vol. 42. 2007. pp. 275-284

C. Isaza, M. Lann, J. Aguilar, Diagnosis of chemical processes by fuzzy clustering methods: New optimization method of partitions. 18th European Symposium on Computer Aided Process Engineering (ESCAPE 10). 2008. pp. 1-6.

A. Orantes. Methodologie pour le placement des capteurs a base de methodes de classification en vue du diagnostic. Ph.D. dissertation. Laboratoire d’Analyse et d’Architecture des Systemes du CNRS. 2005. pp. 29-39.

J. Aguilar, R. de Mantaras. The process of classification and learning the meaning of linguistic descriptors of concepts. Approximate Reasoning in Decision Analysis. 1982. M.M. Gupta et E. Sanchez (eds.) North Holland. pp. 165-175.

J. Aguado, J. Aguilar. A mixed qualitative-quantitative selflearning classification techniques applied to diagnosis. QR’99 The Thirteenth International Workshop on Qualitative Reasoning. 1999. Loch Awe. pp. 124-128.

X. Nguyen, J. Epps, J. Bailey. Information theoretic measures for clustering comparison: is a correction for chance necessary? ICML. New York, USA. 2009. pp. 135.

R. Mantaras. “A distance-based attribute selection measure for decision tree induction”. Mach. Learn. Vol. 6. 1991. pp. 81-92. DOI: https://doi.org/10.1007/BF00153761

R. Mantaras. Autoapprentissage d’une partition: application au classement iteratif de donnees multidimensionelles. Ph.D. dissertation. Univ. Paul Sabatier. Toulouse. 1979. pp. 20-37.

C. Uribe, C. Isaza. Unsupervised feature selection based on fuzzy partition optimization for industrial processes monitoring. Proccedings of the 2011 IEEE International Conference on Computational Intelligence for Measurement Systems and Applications, 2011. Ottawa. pp. 1-5. DOI: https://doi.org/10.1109/CIMSA.2011.6059934