김복한
(Bok Han Kim)
1
최승연
(Seung Yeon Choi)
2
김선혜
(Sean Hay Kim)
2†
-
서울과학기술대학교 에너지환경대학원
(Graduate School of Energy and Environment, Seoul National University of Science and
Technology, Seoul, 01811, Korea)
-
서울과학기술대학교 건축학부
(School of Architecture, Seoul National University of Science and Technology, Seoul,
01811, Korea)
Copyright © 2016, Society of Air-Conditioning and Refrigeration Engineers of Korea
Key words
기계학습(Machine learning), 냉동고(Freezer), 운영 오류(Operation fault), 진단(Diagnosis), 예측(Prediction)
1. 연구배경 및 목적
식품안전을 위해 냉장․냉동식품은 유통 및 판매 과정 중 저온유통체계를 갖추는 등 온도관리가 매우 중요하다. 그러나 실생활에서는 냉동고 운영 시 장시간
문 열림 같은 사용자 부주의, 냉매누설, 냉장․냉동기기의 갑작스러운 정지 등 예기치 못하게 작동오류가 발생하여 상품 손실 및 경제적 손실이 발생되고
있다. 대형 저온식품 운영업체에서는 식품의 안전을 위하여 담당 관리자들이 24시간 순찰을 돌며 작업자 실수와 기기 작동오류, 기기고장 등을 감시하고
있지만, 소기업의 경우는 이러한 문제에 전혀 대응할 수 없는 것이 현실이다.
본 연구는 이러한 문제를 해결하기 위해 냉동고의 상태를 모니터링 하여 고장 및 작동오류가 감지될 경우 이를 사용자에게 실시간으로 알려주는 시스템을
개발하였다(
Fig. 1 참조). 대표적인 냉동고의 작동오류 및 고장은 크게 세 가지로 분류할 수 있다. ① 컴프레서의 정지, ② 사용자 부주의 즉, 냉동고 문이 실수로
열려 있거나 냉동고에 너무 많은 양의 내용물을 넣어 냉동 효율을 떨어뜨리는 경우, ③ 초기에는 완충된 냉매가 시간이 지남에 따라 누설되어 냉동고의
문이 닫혀 있어도 내용물이 온전하게 냉동되지 않는 경우가 있다.
Fig. 1. System diagram of the Freezer Keeper.
일반적으로 냉동고의 기본제어 알고리즘은 냉동고내 온도가 설정온도에 도달 시 컴프레서가 정지하며, 반대로 설정온도보다 1~2도 상승하면 컴프레서가 기동한다.
즉, 반도체접점 또는 릴레이접점의 전기적 신호에 의해 컴프레서가 반응하는 것이다.
장시간의 문열림 상태는 릴레이접점에 의해 알람(소리)발생을 하는 기종도 있으나, 문열림 상태와 컴프레서가 알고리즘 내에서 서로 연결되어 있지는 않기
때문에, 문이 열려 냉동고 온도가 상승하면 컴프레서가 기동하게 되고 계속하여 운행하게 된다. 문이 닫히고 데드밴드를 고려한 설정온도에 이르렀을 때
컴프레서는 정지하게 된다. 따라서 컴프레서가 작동하고 있어도 고내 온도가 상승한다면 문이 열려 있을 가능성이 크다고 봐야 한다.
냉매 부족이나 냉매배관이 막힐 경우, 컴프레서 보호를 목적으로 냉동고 제어 알고리즘 내에서 저압스위치가 작동하여 컴프레서를 정지 시키며, 이때 컴프레서를
보호하기 위한 최소한의 냉매량이 유지된다. 따라서 냉매가 충분하지 않더라도 냉동이 어느 정도 유지는 가능하다. 그러나 냉매는 장시간에 걸쳐 조금씩
유출되고 일반 냉동고는 냉매량을 모니터링하지 않기 때문에 어느 시점에서 냉매를 보충해 주어야 하는 것이 확실하지 않다. 따라서 본 연구에서는 냉매를
보충해 주어야 하는 시점을 진단을 하는 것이 목적이다.
냉동고 컴프레서가 정지하면 전력 사용량이 0이 되기 때문에 냉동고 모니터링 시스템에서 고장을 바로 감지할 수 있지만, 사용자의 부주의와 더불어 냉매
누설의 경우 즉각적인 감지가 어렵다. 작동 오류 감지가 모호한 상황에서 비교적 정확하게 진단하여 사용자에게 빨리 알려준다면 막대한 손실을 미리 예방할
수 있다. 따라서 본 연구에서는 ②와 ③의 경우에 해당하는 작동오류를 진단하고 감지하는 알고리즘으로 기계학습 (Machine Learning)을 이용하면
적은 비용으로도 기기의 작동오류를 비교적 정확히 검출, 예측, 추정할 수 있다는 가설에서 시작하였다.
(1)
2. 원시데이터 취득
2.1 실험방법
기계학습은 원시데이터를 취득하여 일부는 기계학습 모델을 학습하는데 사용하고, 나머지는 학습된 모델을 검증하는데 사용하기 때문에,
(2) 실제 냉동고 운영 시 발생할 수 있는 작동 오류의 다양한 케이스를 포함하는 충분한 원시데이터를 취득하는 것이 중요하다. 따라서 냉동고의 작동상태를
Table 1과 같이 정의하였으며,
Fig. 2는 각 상태를 도식적으로 묘사하고 있다.
Table 1. State Parameters
Parameters
|
Description
|
Door State
|
Refrigerant Mass
|
Freezer Temperature
|
Door_open
|
Regardless of refrigerant mass, the door leaves open
|
Open door
|
Ignored
|
Ignored
|
Lack_rfg
|
Insufficient refrigerant, and the door is closed
|
Closed door
|
30g, 40g, 50g, 60g
|
Tries to reach at -20℃
|
Normal
|
Sufficient refrigerant with the door closed
|
Closed door
|
70g, 80g, 90g
|
Tries to reach at -20℃
|
Steady state
|
Sufficient refrigerant with the door closed
|
Closed door
|
70g, 80g, 90g
|
Already reached at -20℃
|
Steady_lack_rfg
|
Less refrigerant, and the door is closed
|
Closed door
|
30g, 40g, 50g, 60g
|
Already reached at -20℃
|
Fig. 2. Schematic definition of state parameters.
Table 1의 상태 분류 중 Normal 및 Steady state는 냉동고가 정상 작동하는 상황이지만, 나머지 3개의 상태는 1절에서 정의하였던 냉동고 작동오류를
의미한다. 작동상태를 구현하기 위하여 냉매량 30 g에서 90 g까지의 각 10 g씩(냉동고의 냉매를 진공에 노출시켜 전부 방출 후 실험 조건에 맞게
냉매량을 정밀 측정 후 다시 컴프레서에 주입하여 냉매량을 조정하였다.(
Fig. 3의 오른쪽 사진)) 7조건, 냉동고 내용물의 열용량을 구현하기 위한 벽돌은 0개에서 28개까지 각 7개씩 4조건, 냉동고 문이 닫힌 상태에서 1~2시간
문을 10 mm 열어 놓은 뒤(
Fig. 3의 왼쪽 사진) 다시 닫는 2조건을 전수 구현하여 (7×4×2 = 56조건) 각 조건마다 온도와 소비전력 원시데이터를 10초 마다 측정하여 약 190,000개의
원시데이터를 수집하였으며 각 Timestep마다 수집 변수는
Table 2와 같다. 반면 상업용 냉동고의 경우 사용자가 설정온도를 -20℃로 지정하여도 실제 컴프레서 정지는 고내온도 -20℃~-21℃ 사이에서 정지하기 때문에
본 실험에서는 컴프레서 정지를 정상상태로 정의하였다. 위 가정들을 이용하여 상업용 냉동고를 실험실에 설치하여 2017년 6월부터 9월까지 원시데이터를
수집하였다.
Fig. 3. Experiment setting(Left : place 10 mm spacer to leave the door open; Right : refrigerant measurement).
Table 2. Monitoring Variables
Variables
|
Description
|
Variables
|
Description
|
A[A]
|
Current
|
T1[℃]
|
Freezer inside temperature
|
P[W]
|
Active Power
|
T2[℃]
|
Laboratory ambient temperature
|
Q[Var]
|
Reactive Power
|
T3[℃]
|
Evaporator entering refrigerant temperature
|
S[VA]
|
Apparent Power
|
T4[℃]
|
Evaporator leaving refrigerant temperature
|
PF
|
Power factor
|
T5[℃]
|
Freezer inside surface temperature
|
2.2 조건 변화에 따른 냉동고의 온도 변화
2.2.1 벽돌수량에 따른 냉동고의 온도 변화
냉동고의 고장 중 하나인 냉동고 내의 과다 물건이 있는 상황을 재현하기 위하여 냉동고안의 냉매량을 일정하게 유지시킨 후 벽돌수량을 변화시키면서, 동시에
냉동고 문을 열고 1~2시간 방치한 후 냉동고 문을 닫으면서 냉동고 내부 온도(T1)를 측정하는 실험을 반복하였다.
Fig. 4와 같이 벽돌 수량이 많을수록 냉동고 온도가 설정온도까지 도달하는데 더 오랜 시간이 걸린 다는 것을 확인할 수 있었다. 또한 적정 냉매량의 70%
정도로도 오랜 시간 냉동고 운영하기만 한다면 정상상태인 냉장고 온도 -20℃ 전후에 도달하는 것을 확인 할 수 있었다.
Fig. 4. Freezer inside temperature(T1) profile under varied number of bricks at the fixed refrigerant mass.
2.2.2 냉매량 변화에 대한 실험데이터
냉동고 내의 냉매누설 상황을 재현하기 위하여 냉동고 안의 물건의 양 즉, 벽돌수량을 일정하게 한 결과,
Fig. 5와 같이 냉매량이 많을수록 냉동고 온도가 설정온도까지 도달하는데 더 짧은 시간이 걸린 다는 것을 확인할 수 있었다.
Fig. 5. Freezer inside temperature(T1) profile under varied refrigerant mass at the fixed brick number.
3. 기계학습(Machine Learning)
본 연구에서 기계학습 알고리즘 중 지도학습(Supervised Learning) 알고리즘인
(3) KNN(K Nearest Neighbors)
(4), SVM(Support Vector Machine)
(4), Decision Tree
(4), ANN(Artificial Neural Network)
(4), and Naive Bayes Classification
(4)을 선택하였다.
3.1 변수 선정(Variable Pruning)
기계학습에 사용할 적정한 변수를 선택하기 위하여 13개의 변수 중 중복되는 변수를 제거하거나 혹은 유의미한 변수를 선택하기 위하여 1차 및 2차 상관분석을
시행하였으며 이를 통해 8개의 변수를 선정하였다. 또한 8개의 변수들 중 보다 필수적인 변수들만을 선택하기 위하여 다시 회귀분석을 실시하였으며(회귀분석에서
‘*’의 개수가 많은 경우 통계적으로 유의하지 않을 확률이 낮다는 의미이기에 그만큼 중요한 변수라고 할 수 있다. 또한 P-value의 절대치가 크면
클수록 통계적으로 유의하지 않은 범위가 점점 적아진다. 따라서 회귀분석 결과에서는 ‘*’의 개수가 많고 P-value의 절대값이 큰 변수가 좀 더
통계적으로 유의미하다고 볼 수 있다.
(5))(
Fig. 6과
Fig. 7), 그 결과로 변수 2개를(PF, T3) 더 제외시켜 최종적으로 P, T2, T5, M, D, RFG 총 6개의 변수를 기계학습의 학습 및 검증변수로
선정하였다. PF는 ‘*’의 개수도 적었을 뿐만 아니라 P-value가 높아 정확성이 떨어져 유의미한 변수가 아니었기 때문에 제외하였다(
Fig. 6 참조). 그러나 T3(증발기입구 온도)은 ‘*’의 개수를 확인하였을 때는 중요한 변수로 판단되었으나, 상업용 냉동고에서는 일반적으로 증발기 입구
온도를 모니터링 하지 않기 때문에 모니터링 변수에서 제외시켰다(
Fig. 7 참조).
Fig. 6. Regression analysis when door opening(D) is used as the control variable.
Fig. 7. Regression analysis when refrigerant mass(RFG) is used as the control variable.
3.2 기계학습의 정확도
제 2절에서 수집한 원시데이터의 75%를 사용하여 기계학습 모델을 학습시키고, 나머지 25%의 데이터로 학습된 모델을 검증하였다. 5개의 기계학습
알고리즘 중 냉동고의 작동 상태를 예측한 결과가 실제 작동 상태와 같은지를 비교하여 이를 정확도(Accuracy)로 정의하였다(
Equation 1). 다시 말해 정확도란 기계학습을 통해 옳게 분류된 사례들을 전체 사례 개수로 나눈 비율을 의미하며, 기계학습 알고리즘 모델들 중 정확도가 높을수록
학습과 예측 성능이 뛰어나다고 볼 수 있다.
TP(True Positive) : 참긍정 데이터 개수
TN(True Negative) : 참부정 데이터 개수
FP(False Positive) : 거짓긍정 데이터 개수
FN(False Negative) : 거짓부정 데이터 개수
예를 들어
Table 3은 KNN 알고리즘을 이용하여 냉동고의 5개 상태를 예측한 결과와 실제 작동 상태를 비교하여 정확도를 계산한 방법을 설명하고 있으며, 냉장고 작동
상태 진단에 대한 5가지 알고리즘의 정확도를 계산한 결과는
Table 4와 같았다.
Table 3. Comparisons between actual state and predicted state when KNN algorithm is applied
|
Actual state
|
Door_open
|
Lack_rfg
|
Normal
|
Steady state
|
Steady_lack_rfg
|
Predicted
state
|
Door_open
|
2,916
|
37
|
6
|
0
|
0
|
Lack_rfg
|
38
|
15,024
|
2
|
28
|
7
|
Normal
|
15
|
2
|
3,038
|
22
|
3
|
Steady state
|
7
|
9
|
29
|
24,887
|
111
|
Steady_lack_rfg
|
0
|
2
|
0
|
54
|
2,847
|
Table 4. Prediction accuracy of ML algorithms
Machine Learning Algorithms
|
Accuracy
|
Rank
|
KNN(K-Nearest Neighbor)
|
99.24%
|
1
|
SVM(Support Vector Machine)
|
96.21%
|
2
|
DT(Decision Tree)
|
92.79%
|
3
|
Naive Bayesian
|
85.54%
|
4
|
ANN(Artificial Neural network)
|
75.43%
|
5
|
4. 토 의
KNN은 초기에 K개의 데이터를 선택 후 그 주변에서 가까운 각각의 데이터를 다수결의 원칙을 적용하여 그룹으로 분류한다. SVM은 KNN처럼 데이터를
흩뿌린 후 흩뿌린 데이터를 구분할 수 있는 초평면을 만들어서 초평면을 경계로 데이터를 분류한다. 즉 KNN과 SVM과 같은 커널(Kernel) 형태의
분류 체계를 가진 알고리즘의 정확도가 더 높은 것으로 나타났다.
반면 ANN은 사람의 신경처럼 많은 변수를 이용하여 데이터를 예측하는 방법이기 때문에, 직접 변수 이외에도 직접 변수들을 연결해주는 간접 변수의 역할이
중요하다. 그러나 본 연구에서는 주로 냉동고의 상태를 직접적으로 설명할 수 있는 직접 변수만을 대상으로 하였기 때문에, 직접 변수 그룹간의 공백을
메워 줄 수 있는 다양한 데이터 조합이 부족하여 예측의 정확도가 가장 낮게 나타난 것으로 사료된다.
Naive Bayesian 알고리즘은 각 변수들이 서로 독립적이라는 가정을 사용하는 조건부 방법론이지만, 본 실험에서는 명백하게 변수간의 독립성이
보장되지 못 했다. 또한 DT의 경우 데이터를 특정 기준을 이용하여 분리하는 방법론이지만, 구분이 불가능한 경우 실제적으로 엉뚱한 기준을 이용하여
구분하기도 한다. 예를 들어 DT가 분류 기준으로(Criteria) 사용한 T2, T5의 경우 온도가 연속적으로 변하기 때문에 실제적으로 이산적인
(Discrete) 두 부류로 나누기 불가능하였기에 정확성이 떨어진 것으로 보였다.
5. 결 론
본 연구에서는 냉동고의 운영 시 발생할 수 있는 장시간 문 열림 같은 사용자 부주의와 냉매누설 등의 작동 오류에 대하여 기계학습 알고리즘을 이용하여
작동오류를 진단할 수 있다는 가정을 세우고, 이를 증명하기 위하여 상용 냉동고를 대상으로 작동상태를 정의하고 각 상태를 실험실에서 구현하여 수집한
약 190,000개의 원시데이터를 토대로 기계학습 알고리즘 5종류에 적용하여 학습과 예측을 수행하였고 그 결과 다음과 같은 결론을 얻었다.
(1) 적용되는 대상과 기계학습을 하는 목적, 타켓 데이터, 데이터의 전처리, 독립변수 선택 등에 따라 진단결과에 많은 영향을 미칠 수 있으며, 다양한
원리를 가진 기계학습 알고리즘이 많기 때문에 가장 적합한 알고리즘을 선정하는 것이 중요하였다.
(2) 본 연구에서는 기계학습에서 일반적으로 정확도가 높고 가장 많이 활용되고 있는 5개의 기계학습 알고리즘을 활용하여 실험을 하였고, 각각의 알고리즘에
따라 냉동고 작동 오류 진단에 대한 정확도 차이를 확인 할 수 있었다.
(3) 소비전력(P), 냉동고 외부 실험실 온도(T2), 냉동고 내부 표면 온도(T5)를 모니터링 변수로 하고, 냉동고 내용물의 열용량(M), 냉매량(RFG),
냉동고 문의 열림과 닫힘(D)을 변화시켜, 문 열림과 냉매량 부족을 진단한 결과 KNN(99.26%)
SVM(96.21%)
DT(92.79%)
Naive Bayesian(85.54%)
ANN(75.43%) 순으로 정확도를 확인 할 수 있었다. 따라서 커널(Kernel) 형태의 분류 체계를 가진 알고리즘이 냉동고 작동오류의 진단과
예측에 가장 효과적인 것으로 나타났다.
(4) 모든 실험을 온도 21~ 25℃사이의 실험실 내에서 진행하였기 때문에, 만약 실험실 온도가 이러한 범위를 벗어난 다면 예측정확도가 낮아질 가능성이
있음을 추정해 볼 수 있다. 따라서 예측정확도를 더욱 높이기 위해서는 실제 발생할 수 있는 여러 상황에 대한 더 많은 원시데이터가 필요하고, 데이터가
많이 수집되어 기계학습 모델을 학습시킨다면 기계학습을 사용한 작동 오류 진단은 더욱 정교해 질 것이다.
후 기
This study was supported by the Research Program funded by the Seoul National University
of Science and Technology.
References
Sanila S., Subramanian D. V., Sathyalakshmi S., 2017, Real-Time Mining Techniques
: A Big Data Perspective for a Smart Future, Indian Journal of Science and Technology,
Vol. 10, No. 42, pp. 1-7
Clarke B., Fokoue E., Zhang H., 2009, Principles and Theory for Data Mining and Machine
Learning, Springer, https://doi.org/10.1007/978-0-387-98135-2
Delen D., 2014, Real-world Data Mining: Applied Business Analytics and Decision Making,
Pearson Education Limited, ISBN 9780133551150
Mitchell T. M., 1997, Machine Learning, McGraw-Hill Science/Engineering/Math
Reghav B., Dipanjan S., 2016, R Machine Learning By Example, PACKT