Mobile QR Code QR CODE : Journal of the Korean Institute of Illuminating and Electrical Installation Engineers

Journal of the Korean Institute of Illuminating and Electrical Installation Engineers

ISO Journal TitleJ Korean Inst. IIIum. Electr. Install. Eng.




AI modeling, Machine learning, Ranked-FBD, Visualization method

1. 서 론

1.1 연구의 배경

사출성형은 냉각장치, 핵심공정 자동화 장치 및 현장 관리 시스템, 배관 장치 등을 종합적으로 고려해야 하는 아주 복잡한 분야로 금형, 사출성형기, 사용재료가 가장 중요하며 금형, 설비, 원료의 특성을 잘 조화시켰을 때 품질 및 효율성을 이룰 수 있다[1].

특히 동일한 사양의 사출 장비라도 현장에서 운영방법에 따라서 발생하는 현상들이 다양한 형태로 표출되므로 현장에서 맞춤형으로 최적화하는 방안이 필요하다[2].

전문가의 암묵적 지식을 기반으로 하는 AI 기술 즉, ① 다양한 형태로 수집되는 데이터로부터 학습이 가능한「학습데이터셋 생성」, ② 전문가 경험과 머신러닝 결과를 비교할 수 있는「Ranked-FBD 기반 시각화」, ③ 현장 필요 정보를 적재 적시에 제공하기 위한「운영자 맞춤형 솔루션」관련 기술이 중요하다[3, 4].

1.2 연구의 목적 및 방법

본 연구는 ‘사출성형기 운전상태/사출성형품 작업조건 및 환경데이터’ 와 ‘사출성형품 검사 결과 데이터’를 기반으로 사출성형기 이상탐지를 위한 방안을 제시한다[5].

아래 Fig. 1의 경우 AI 모델 학습을 위한 데이터 생성부터 딥러닝 모델 학습까지 흐름도이다.

Fig. 1. Research basic concepts

../../Resources/kiiee/JIEIE.2022.36.7.009/fig1.png

머신러닝 서비스(개발, 배포, 테스트 및 운영) 과정에서 발생하는 비효율적인 요소를 제거하고 관리 체계를 통합/적용하기 위해 등장한 개념인 MLOps (Machine Learning Operations)를 현장에 적용하여 중소 부품 제조 기업들이 현실적으로 도입할 수 있는 제조 AI 모범 사례를 제시하는 것으로 다음과 같은 프로세스를 가진다[6].

1. 도입목적 정의 및 현장 전문가가 R-FBD(가중형 원인-결과도, Ranked-Fish Bone Diagram) 작성한다.

2. 현장의 ‘전력품질 측정기’와 ‘컨트롤러’로부터 원시데이터 수집한다.

3. 전처리/결과 데이터 매핑을 통하여 라벨링 데이터셋 작성한다.

4. 베이지안 계층구조 모델 기반 학습 및 현장 전문가가 AI 추론 결과를 R-FBD 형태로 검증한다.

5. 검증된 결과를 기준으로 현장 적용을 위한 룰을 작성 후 시각화 서비스한다.

아래 Fig. 2의 경우 AI 기반 훈련 모델을 통해 시뮬레이터와 UI가 사용자에게 제공되는 프로세스이다.

Fig. 2. MLOps pipe line based service concept

../../Resources/kiiee/JIEIE.2022.36.7.009/fig2.png

2. 실험장치 및 방법

2.1 “시공간” 기반 “인과관계” 탐색을 통한 「학습 데이터 셋 생성」

2.1.1 품질 ↔ 환경 ↔ 작업 조건 사이의 상관관계 분석을 위한 데이터 생성

아래 Fig. 3의 경우 “작업장” 에서 발생되는 품질 데이터 및 작업 환경 데이터를 수집하여 AI 모델에 사용되는 교육 데이터를 생성한다.

Fig. 3. Correlation analysis structure between quality ↔ environment ↔ working conditions

../../Resources/kiiee/JIEIE.2022.36.7.009/fig3.png

2.1.2 “결과 Yj”, “측정치{Xi}” 매핑 구조 생성 방법

Yj는 집합 Xi = {X1, X2, X3 ... X35, X36, ... X99, X100}로 구성, 그리고 시간의 흐름 (제품이 각 작업장(또는 설비)을 통과하고 체공 시간)을 적용하면 ΔY19 → ΔY20 동안 “원인”들이 연관된 것으로 이런 현상이 반복되면 중첩 되는 것으로 보인다.

아래 Fig. 4의 경우 영향(Y) 해당 하는 원인(X) 데이터 패턴 분석이다.

Fig. 4. “Result Yj”, “Measurement {Xi}” mapping structure

../../Resources/kiiee/JIEIE.2022.36.7.009/fig4.png

2.2 전문가의 경험 및 머신러닝 결과를 비교할 수 있는 Ranked-FBD 기반 시각화

2.2.1 측정변수로 잠재요인을 찾는 방법

각각의 조건부 사건이 독립이라고 가정 원인 및 결과 발생확률은 이산확률(Multinomial)로 가정 원인의 발생횟수 및 결과확률의 적용으로 알고리즘을 개선한다.

아래 Fig. 5의 경우 결과에 따른 인과관계 데이터 패턴 분석이다.

Fig. 5. How to find latent factors from measurement variables

../../Resources/kiiee/JIEIE.2022.36.7.009/fig5.png

2.2.2 ∆X$_{(i,t)}$ ↔ ∆Y$_{(j,t)}$ 간의 관계

자연계 현상은 항상 경우의 수가 많은 방향으로 반응(이동)합니다. 현장에서 원인들의 변화는 항상 가능성이 높은 방향으로 나타난다고 해석한다.

상기 개념을 원칙으로 “동일한 시공간 인과모델”을 수립 → 현장 데이터 부터 “Pattern추출”→ Pattern 기반으로 “이상발생 예측” ∆Ci 발생(안정된 상태에서 교란 발생)→제품(P)의 반응을 일으킨다.

제품(P)의 반응 결과는 ∆Ej로 나타난다.

즉 ∆Ci로 인해 ∆Ej가 이상이 되는 Ci를 찾는것입니다.

Entropy 법칙을 적용하면 [∆S_p =k lnωf/ωi>0 ]이 되는 ∆Ci를 찾는다.

[∆Sp =k lnωf/ω >0 ]은 [ ωf/ωi>1 ]을 의미한다.

[ωf/ωi(microstate change)]는 시점 t에서의 Ci 변화량 ∆Ci = ∆X(i, t)로 나타난다.

[∆Sp = k lnωf/ωi〗>0 ]∝(비례) Count(∆Y(j,t)), [∆SEnvironment = k lnωf/ωi >0 ]∝(비례)Count(∆X(i, t)) 이므로 환경변화와 및 제품상태변화는 Function {Count(∆Y(j,t)), Count(∆X(i, t))} 으로 해석한다.

2.2.4 현장 필요 정보를 적재 적시에 제공하기 위한「운영자 맞춤형 솔루션」

아래 Fig. 6의 경우 “Fish Bone의 원인 → 결과”를 기반으로 발생 원인들을 시각화 탐색 결과를 기반으로 확정된 “프로세스 이상 KPI”를 Display “정상상태”↔ “불량발생”을 비교하여 Display 생산 Lead Time을 기반으로 “생산 문제 발생”을 시뮬레이션 한다.

Fig. 6. Application MLS based on expert knowledge

../../Resources/kiiee/JIEIE.2022.36.7.009/fig6.png

아래 Fig. 7의 경우 현재 데이터를 기반으로 제품 품질/설비 이상/설비 가동 상태를 예측하는 UI 프로그램이다.

Fig. 7. Operator customized solution UI

../../Resources/kiiee/JIEIE.2022.36.7.009/fig7.png

3. 본 론

3.1 AI 솔루션 도입을 위한 데이터 분석 및 적용

작업현장에서 수집되는 각각의 데이터를 분석하여 해당 공정에 적합한 데이터 전처리 수행 작업을 통해 데이터 조합을 가질 수 있다. 데이터 전처리 전 수집되는 raw 데이터를 통해 1차적으로 데이터의 특성을 확인한다. 다음으로 데이터간의 관계를 확인하는 상관계수를 통해 데이터간의 상관관계를 수치화하여 확인한다. 아래 Fig. 8의 경우 하나의 데이터를 여러 각도로 분해하여 분석하였다.

Fig. 8. Data decomposition analysis result

../../Resources/kiiee/JIEIE.2022.36.7.009/fig8.png

데이터 분해 작업을 수행하면 모두 비슷한 패턴을 보이는 데이터가 존재하고 일정한 추세(상승, 하락)을 보이며 데이터 크기에 비해 잡음(노이즈)가 매우 작아진 것을 확인할 수 있다.데이터의 잡음이 매우 작다는 것은 raw 데이터 자체의 품질이 좋다는 것이며 이는 데이터 전처리 작업이 필요 없음을 의미한다. 데이터 전처리 작업의 경우 raw 데이터에 필터 작업을 통해 순수한 데이터를 가공하는 형태로 데이터의 노이즈가 매우 강하다. 즉, 데이터의 품질이 낮은 경우 효과적이지만 raw 데이터 자체의 품질이 좋은 경우 오히려 데이터의 정보 손실이 발생할 수 있다.

아래 Fig. 9의 경우 품질 결과는 AI 알고리즘을 통해 정상, 이상으로 예측 되었으며, 정상일 경우 100%, 이상일 경우 90%로 예측 되었다.

Fig. 9. The quality results

../../Resources/kiiee/JIEIE.2022.36.7.009/fig9.png

아래 Fig. 10의 경우 AI 알고리즘을 통해 시계열 데이터의 미래 가치를 예측한 결과이다.

Fig. 10. The result of predicting the future value of time series data through AI algorithm

../../Resources/kiiee/JIEIE.2022.36.7.009/fig10.png

3.2 AI 솔루션 도입 및 적용

작업현장에서 수집되는 데이터를 기준으로 하여 라벨링 된 데이터 및 라벨링 되지 않은 데이터를 구분하며 분석 라벨링 되지 않은 데이터의 경우 지도학습 기반의 알고리즘인 SVM (Support Vector Machine) 과 Clustering을 통하여 각각의 데이터별 군집화 및 다변량 데이터 군집화를 통해 데이터의 그룹을 나눠 각 그룹의 경향성을 분석 데이터의 특성에 맞게 데이터를 분해하여 데이터의 패턴, 추세, 잡음 등을 확인 및 분석한다. 이를 통해 필요한 데이터 전처리 기법 적용하며, 데이터 전처리 기법의 경우 총 5가지(Regression Tree Series Denoising, Time Series Prediction Deep Learning, LPF, Outline Del, Autoencoder Denoising)의 데이터 전처리 기법을 사용한다. 그에 따른 총 32($2^{5}$)가지 조합 중 가장 최적의 조합을 적용한다.

라벨링이 된 데이터의 경우 raw데이터를 통해 결과를 예측할 수 있는 인공지능 기법 중 MLP, Random forest 등 데이터 특성에 맞는 인공지능 기법을 사용하여 알고리즘을 학습하고 그에 따른 결과를 도출한다.

시계열 데이터 처리에 효율적인 LSTM과 ARIMA 등의 알고리즘을 통해 데이터를 예지 예측하고 사전에 대응하는 기술을 적용한다.

AI 모델의 경우 총 데이터의 80%~90%의 데이터를 트레이닝 및 검증 데이터셋으로 사용한다. 나머지 10%~20%의 데이터로 테스트 과정을 수행하며 하이퍼 파라미터를 튜닝하고 목표로 하는 성능 지표에 도달 한다.

목표 성능 미도달 시 데이터 전처리, AI 모델 하이퍼 파라미터 튜닝, 데이터 셋 분류 작업을 재수행하며 목표로 하는 성능 지표에 도달한다.

위와 같은 AI 알고리즘(Random Forest)을 통해 품질 향상 및 설비의 이상 상태를 추론하는 AI 솔루션을 적용한다.

아래 Fig. 11의 경우 Fish-Bone Diagram, 데이터 간 상관계수, 데이터 중요도 순위 분석 프로그램이다.

Fig. 11. Data set analysis result

../../Resources/kiiee/JIEIE.2022.36.7.009/fig11.png

3.3 룰 관리 시스템 도입 및 적용

전문가의 경험에 의한 내용을 데이터 사용자가 자신의 요구에 따라 시스템의 동작 조건을 설정한다. 작성된 룰이 언제 실행될지를 결정하는 ‘방아쇠 속성’과 룰이 수행하는 ‘루틴들’로 구성 루틴은 수행하는 동작에 따라서 ‘변수 루틴’, ‘동작 루틴’, ‘흐름 루틴’ 3가지로 분류 루틴을 통해 사용자가 원하는 조건을 구성하고 센서의 알람 상태나 가공된 값을 생성처리현장 전문가의 Fish-Bone Diagram or Fault Tree Analysis Diagram 생성 인공지능 알고리즘의 결과를 기반으로 공정 데이터의 이상 징후를 사전에 파악하고 각각의 패턴을 추출 및 분석하여 해당 결과를 룰 관리 시스템에 적용한다.

아래 Fig. 12의 경우 데이터 분석 결과를 기반으로 규칙을 만들고 관리하는 시스템이다.

Fig. 12. Rule management system

../../Resources/kiiee/JIEIE.2022.36.7.009/fig12.png

4. 결 론

본 연구는 수집된 Big Data를 노이즈 제거, 이상치 제거, 상관관계 분석, ECV(Effective Classification Value)기법을 통한 효율적인 특징값 그룹 추출 등 데이터를 가공하고 효율적인 데이터 셋을 기반으로 데이터 시각화, AI 알고리즘(Random Forest)을 구현한다. 가공된 데이터를 통해 AI 알고리즘(Random Forest)을 학습하고 성능을 검증하여 이를 적용하고 해당 결과를 관리자가 보기 편한 유의미한 형태로 시각화를 적용한다. 시각화된 인공지능 기법을 통해 장비 및 설비의 상태를 사전에 예지 예측 하여 보다 빠른 대응 및 설비의 상태를 최적화하며 생산 효율성 또한 높일 수 있다.

설비의 상태를 추론함으로써 전문가 이외에 비전문가도 장비 및 설비의 상태를 확인하고 제어를 할 수 있는 시스템 적용을 통해 공장의 운영 상태를 보다 쉽게 최적화한다.

References

1 
Chou Zi-hwa , 2020, Machine Learning, Jpub, pp. 119-139Google Search
2 
Richard S. Sutton , Andrew G. BartO , 2020, Reinforcement Learning, Jpub, pp. 237-285Google Search
3 
Park Sung-soo , 2021, Reinforcement Learning Principles and Algorithms for Mathematics, Wikibooks, pp. 80-90Google Search
4 
Arthur Juliani , 2017, Simple Reinforcement Learning with Tensorflow, Hanbit Media, pp. 100-120Google Search
5 
Yu Young-sik , Yoon Jong-hee , Lee Jang Kyu , 2008, Easy-to-understand Injection Molding Mold, Gijeon Researcher, pp. 20-30Google Search
6 
Jung Young-Deuk , Koo Bon-heung , 2005, Product and Mold Design by Injection Molding Analysis, Intervision, pp. 300-320Google Search

Biography

Jong-Hwal Lee
../../Resources/kiiee/JIEIE.2022.36.7.009/au1.png

He received M.S. degree in mechatronics engineering from Kyungil University, Gyeongsangbuk-do, South Korea, in 2020. From 1995 to 2006, he was a manager of Information System with the Orion Electric Co., Ltd. From 2007 to 2014, he was a technology engineer in the PDP division, Changhong Group, China. Since 2015, he has been with Hanjun NCS, Gyeongsangbuk-do, where he is currently a team leader of Information System. His research interests design of injection device using AI and anomaly detection using Deep Learning of sound characteristics.