1. 서 론
수로교는 인류 문명의 발전에 따른 여러 교량형식 중 하나로서 고대 로마시대의 제1호 수로교인 아쿠아 아피아(Aqua Appia)가 BC 312년에
축조된 이래 현재까지 많은 수로교가 유럽 등지에 문화유산으로 남아 있으며, 산업혁명 이후에는 공학기술의 발달로 다양한 재료와 형태의 수로교가 건설되어
왔다. 국내의 수로교는 쌀문화를 상징하는 농업기반시설의 하나로서 현재 농업용수 공급용으로만 유지되고 있는데 이는 동절기에는 용수 공급이 중단되어 동결을
피할 수 있기 때문이며, 상수도관은 동결을 피하기 위해 지하에 매설되어 지상에 노출되는 수로교가 이용되고 있지 않다.
수로교는 용수공급 목적의 수로가 도중에 하천, 계곡, 도로, 농지와 산지 등을 통과할 때 건너지 못하거나 장거리 우회를 피하기 위해 설치되는 교량이다(Fig.
1).
수로교는 전국에 산재되어 있고 과반수이상이 30년 이상 경과로 노후화되어 수리시설 개보수사업을 통해 보수․보강되거나 교체되고 있다. 수로교는 일반적으로
통수의 기능을 하는 상부구조의 수로부와 수로부를 받치는 하부구조의 교각과 교대 및 기초 등으로 구성된다.
|
Fig. 1. Photo of Typical Aqueduct for Irrigation
|
수로부의 단면형태는 개방형(Open Type)과 폐쇄형(Closed Type)으로 분류되고 국내의 교각형식은 T형과 라멘형으로 되어 있다. 구조재료는
철근콘크리트, PS콘크리트, 강재와 강관 등이 있으나 현재 상․하부구조 모두 철근콘크리트가 거의 대부분을 차지하고 있다.
전국 농업용수로는 총연장이 약 66,650 km(지구둘레의 약 1.7배)에 달하며, 그 중 한국농어촌공사(Korea Rural Community Corporation,
KRC)가 관리하는 수로교는 약 230 km에 이르는 것으로 알려져 있다(RRI, 2012)
수로교를 포함하는 수리시설은 노후화되거나 기능 개선이 필요한 경우 「농어촌정비법」에 따라 개보수 되며, 안전진단을 거쳐 개보수 대상지구로 선정되면
실시설계를 통하여 개보수하게 된다.
개보수 대상과 수준을 효과적으로 의사결정하기 위해서는 기본설계를 통해 그 방법과 비용을 파악하여야 하지만 현재는 생략되고 있는 실정이므로 실시설계
이전 단계에 개보수의 기본방향을 결정하기 위해서는 개략공사비를 산정할 필요가 있다.
수로교 개보수 공사비는 노후상태에 따라 보수․보강 공사비와 교체 공사비로 크게 구분할 수 있다. 보수․보강 공사비는 대상 물량이 안전진단 결과에서
제시되지 않고 있으며 다양한 개보수 대상물량과 공법에 따른 공사비를 선정하는 것이 불가능하다. 반면 교체 공사비는 안전진단 결과에서 교체 대상이 이미
결정되어 그 규모와 물량이 정해져 있으므로 유사한 교체 사례를 이용하여 개략공사비를 산정하는 것이 가능하다.
따라서 이 연구에서는 수로교를 교체할 경우 소요되는 개략공사비를 간단한 기본 정보만을 이용하여 산정할 수 있는 방법을 개발하고자 하였다. 수로교에
대한 개략공사비 산정 모델은 지금까지 보고되고 있지 않아 사용이 쉽고 사례가 많은 통계적 기법인 회귀분석(Regression Analysis, RA)
모델을 개발하였고, 또한 도로교 등에서 많이 적용되고 있는 사례기반추론(Case-Based Reasoning, CBR)을 기반으로 한 모델을 개발함으로써
현장여건과 사용 편의성을 고려하여 적합한 모델을 비교해서 사용할 수 있도록 하였으며 개보수 특성에 적합한 공사비 산정방법은 Fig. 2와 같다.
|
|
|
|
RA
Model
|
Selection of
4 Influence
Factors
|
|
Screening of
RA Models
|
|
Comparison of
Error Rate
(SRA:MRA)
|
|
Decision of
RA Model
|
|
|
|
|
|
|
|
|
|
Identification
of structures
to be replaced
|
|
Analysis of
11 Influence
Factors
|
|
|
|
|
|
|
|
|
|
|
|
Comparison
and
Application
|
|
|
|
|
|
|
|
CBR
Model
|
Selection of
5 Influence
Factors
|
|
Process of
CBR Model
(5 Phases )
|
|
Minization of
Error Rate
|
|
Decision of
CRR Model
|
|
|
|
|
|
|
|
|
Fig. 2. Schematic Diagram of Approximate Cost Estimate Model for Aqueduct Bridges
Restoration
|
개략공사비 모델에서는 영향요인의 파악이 중요하므로 회귀분석을 통해 상관성이 높은 영향요인을 도출하였고 또한 상관성은 낮으나 수로교의 체적과 밀접한
관련 있는 영향요인들을 조합하여 새로운 영향요인으로 추가하였다. 또한 영향요인들을 표준화하지 않은 경우와 단위 영향을 제거하기 위해 표준화 (Standardization)한
경우를 비교하였다.
RA 모델에서는 회귀진단을 통해 다중공선성이 있는 영향요인 변수를 제거한 후, 확정된 영향요인을 독립변수로 하는 단순회귀분석(Simple Regression
Analysis, SRA) 모델과 다중회귀분석(Multiple Regression Analysis, MRA) 모델을 대상으로 일정조건을 만족하는 상관성이
높은 후보 모델을 선정하였다. 후보 모델에 대한 예측공사비와 실적공사비 사이의 오차율을 산출하고, 이 오차율을 통계분석하여 오차율과 표준편차가 작은
모델을 RA 모델로 선정하였다.
CBR 기법은 해결하고자 하는 사례를 유사한 기존사례로부터 추출하여 최선 해를 얻는 방법이다. 한편 선행의 많은 개략공사비 산정모델 연구에서는 예측공사비
오차를 최소화하기 위하여 공사비 영향요인에 대한 가중치를 최적화하는 방법 중 하나로 유전 알고리즘(Genetic Algorithm, GA)을 이용하고
있다. GA란 해 집단(Solution Population)을 진화시켜 마지막까지 생존한 해 집단에서 가장 좋은 해를 찾아내는 방법으로 이 연구에서도
이를 적용하였다.
기존의 도로교 개략공사비 산정방법 연구에서는 오차율을 낮추기 위하여 유사도 편차기준과 순위기준을 일정한 값으로 두고 영향요인의 가중치를 최적화변수로
하는 것이 일반적이나 이 연구에서는 영향요인의 가중치 외에 편차기준과 순위기준도 최적화변수에 포함하였으며 특히 영향요인의 가중치를 제한하는 방법을
도입하여 탐색효율과 예측오차를 개선하였다. CBR 모델은 편차기준의 범위를 달리하여 도출되는 오차율이 최저인 경우로 하였다.
본 논문은 수로교를 교체 개보수 하는데 소요되는 개략사업비를 간단한 기본정보만을 이용하여 산정할 수 있도록 함으로써 개보수 사업시행에 따른 신속한
의사결정을 하는데 도움을 줄 것으로 기대된다.
2. 예비적 고찰
수로교 교체 개보수를 위한 개략 공사비 산정 모델을 개발하기 위하여 RA 모델과 CBR 모델에 대한 최근의 연구 동향과 RA, CBR, GA에 대한
이론적 배경은 다음과 같다.
RA를 이용한 교량의 개략공사비 산정 연구에는 RC 라멘교에 대하여 대표공종물량, 회귀방정식, 합성단가, 공사비지수 등을 조합한 모델(Kim, B.
S. and Kwon, S. H., 2009)이 발표되어 있고, PSC Box교에 대하여 차로수, 총연장, 폭원, 형고, 경간비, 경간수, 경간장을
독립변수로 한 다중회귀분석 모델(Cho, J. H., 2009) 등이 있다.
CBR 이용한 연구에는 건축물의 초기 공사비를 추정하기 위하여 스프레드시트 기반의 GA-augmented CBR 모델이 제안되었고(Doğan, S.
Z. et. al., 2006), 도로교에 대해서는 국내의 PSC Beam교를 대상으로 사업의 기획단계에서 연장, 상부면적, 폭원, 차로수를 영향요인으로
하는 모델(Kim, S. G., 2010)이 개발되었으며, 강박스교에 대한 연장, 폭원, 상부면적, 차로수를 영향요인으로 하는 모델(CBR I)과
여기에 가설위치, 지역, 최대경간장, 경간수, 가설형태, 기초형식을 추가한 모델(CBR II)이 개발되어 있다(Kang, S. H., 2010).
RA와 CBR을 비교한 연구로는 공동주택에 대한 초기 직접공사비를 예측하면서 CBR 시스템의 에러율이 MRA 모델의 에러율보다 낮게 나타났다고 발표한
논문 등이 있다(Kim, G. H. and Kang, K. I., 2004; Koo, C. W., 2007). 경량전철 정거장에 대한 개략공사비 산정
모델 연구에서도 CBR 모델의 오차율이 낮은 것으로 분석하였다(Cho, N. H. et al., 2011). 한편 CBR 모델의 예측정확도를 향상시키기
위해 결과값에 대한 보정식을 개발한 CBR-Revision Model(Ji, C. Y., 2008)과 CBR의 수정(Revise)단계에서 RA 모델을
통해 보정을 하는 CBR 기반 MRA 보정모델이 있다(Kim, Y. S., 2010).
2.1 회귀분석
회귀분석은 변수들 사이의 함수관계를 규명하는 통계적 방법으로, 독립변수(Independent Variable)가 1개인 단순회귀분석과 2개 이상인
다중회귀분석으로 구분된다. 회귀분석에서는 회귀모형의 유의성을 검정하고 각 독립변수에 대한 회귀계수의 추정 및 유의성 검정을 실시하며, 모형의 적정성을
확보하기 위해 이상치(outlier)에 대한 판단을 하고 다중회귀분석의 경우에는 다중공선성(Multi-collinearity)의 존재여부를 검토한다.
이상치의 판별방법에는 Hat Diagonal(Leverage), Cook’s Dis-tance, 공분산비율(Covariance Ratio), DFFITS
(Difference of Fits) 등이 있으며, Cook’s Distance가 일반적으로 이용되며 1을 초과하면 이상치로 판정한다.
다중공선성이란 다중회귀분석에서 독립변수 사이에 서로 상관이 높은 것이 포함되어 있을 때는 종속변수에 미치는 독립변수 각각의 영향을 구분하기 어려워
회귀계수의 추정 정밀도가 크게 저하되는 현상을 말한다. 일반적으로 결정계수가 80 이상이 되면 다중공성성이 있음을 의심해 보아야 한다고 알려져 있으며
이 판별방법에는 분산팽창인자(Variation Index Factor, VIF), 고유치(Eigenvalue), 상태지수(Condition Index),
분산비율(Proportion of Variation) 등이 있다. VIF의 경우 다중공선성이 없으면 1에 근접하고 10을 초과하면 다중공선성이 있다고
하며, 상태지수는 10을 초과하면 약한 정도, 100을 초과하면 강한 다중공선성이 있다고 판정한다(Kwon, S. H., 2008).
MRA의 선택법에는 변수추가법(전진법, Forward Selection), 변수제거법(후진법, Backward Elimination), 변수증감법(단계선택법,
Stepwise Selection), 모든 가능한 회귀(All Possible Regres-sion) 등이 있다.
2.2 사례기반추론
사례기반추론이란 ‘과거 문제해결에 대한 경험을 새로운 문제에 적용하여 그 해결책을 제시하는 시스템’으로 정의된다(Riesbeck and Schank,
1989). CBR이 다른 인공지능 기법과 구별되는 점은 과거 사례로부터 구체적 지식을 이용하며, 해결된 새로운 문제는 과거 사례로 저장되어 미래의
예상되는 문제를 해결하는데 이용할 수 있게 된다는 점이다. CBR의 단계는 추출(Retrieve), 재사용(Reuse), 수정(Revise), 유지(Retain)의
싸이클로 이루어진다(Aamodt and Plaza, 1994). 새로운 문제가 발생하면 우선 사례기반(Case-base)으로부터 유사사례를 추출(Retrieve)하고
추출된 사례는 문제의 해답(Proposed Solution)으로 제안된다. 이 때 추출된 사례는 그대로 적용(Reuse)되거나 수정될 수 있다. 이렇게
확정된 해답(Confirmed Solution)이 최종 해답이 되며 이 해답에 대한 보존 가치가 있다고 판단되어 수정(Review)되면 저장(Retain)되고
새로운 문제해결에 활용된다.
CBR 과정에서 사례의 추출은 그 성과에 큰 영향을 끼친다(Brown, C. E. and Gupta, U. G., 1994). 따라서 추출(또는 조회)에서
제일 중요한 요소가 사례 간의 유사도를 측정하는 것이다. 유사사례를 추출하는 방법에는 여러 방법이 있으나 최근이웃 추출방법(Nearest Neighbor
Retrieval)이 널리 사용되고 있으며, 유사성의 정도를 나타내는 척도로는 상대적 거리(Distance)를 사용하는데 거리가 가까울수록 유사도가
커지는 비유사성 척도(Dissimilarity Measure)를 사용한다.
거리의 개념은 다양하며 유클리디안 거리(Euclidean Distance)가 가장 대표적이고 식 (1)로 표기된다.
(1)
여기서,는 2-norm 이고 와 는 벡터 와 의 번째 원소
사례는 여러 속성(Attribute)을 가지고 있으며 속성의 중요도에 따라 추출의 정확도가 달라지게 된다(Doğan et al, 2006). 속성의
상대적 중요도를 나타내기 위하여 가중치를 사용하고 있으며, CBR에서 사용되고 있는 속성가중치(Attribute Weight) 산정방법에는 동일가중치(Feature
Counting), 회귀분석법, 계층분석과정(Analytic Hierarchy Process, AHP), 유전 알고리즘 등이 있다.
CBR은 MRA를 비롯한 GA, ANN(Artificial Neural Network), MCS(Monte Carlo Simulation) 등 다양한
방법과 결합되어 Hybrid 모델이 개발되는 등 발전되고 있다.
2.3 유전 알고리즘
유전 알고리즘은 CBR의 속성가중치를 최적화하기 위하여 사용된다. 유전 알고리즘은 진화와 적자생존의 원리를 모방한 최적화 방법 또는 의사결정을 위한
해법으로 이용되며 1975년 미국 미시간대학 컴퓨터 분야 John Holland 교수의 저서 「Adaption in Natural and Artificial
Systems」를 통해 발표되었다. GA는 결정론적 방법으로 최적해를 구하지 못하는 경우에 최선의 해를 구할 수 있는 발견적 기법이다(Moon, B.
R., 2008). 즉 해의 집합인 모집단을 여러 세대에 걸쳐 진화시키면서 목적함수로 표현되는 적합도에 반응하는 해를 찾는 방법이다.
장점으로는 목적함수가 비선형이거나 불연속이거나 문제가 되지 않으며 부적합한 해가 지역최적(Local Optima)에 빠지는 것을 돌연변이를 통해서
방지할 수 있다.
단점으로는 제약조건이 많은 모형에서는 해 찾기가 쉽지 않으며 도출된 해가 최적임을 증명할 수 없다는 점과 또한 개체수(Popu-lation), 변이율(Mutation
Rate) 등에 따라 해의 차이가 크지만 이를 결정하는 규칙이 없다는 점도 있다(Park, C. K. and Seo, J. Y., 2009).
3. 수로교 현황 및 분석
3.1 제원 및 실적공사비
조사분석 대상은 KRC가 2003년~2012년까지 교체한 수로교 중 전국 61개소의 사례이며 지역별 표본수, 제원 및 공사비 현황은 각각 Table
1~2와 같다. 수로교 규모를 분석한 결과, 평균(최소~최대)으로 통수단면폭은 1.21 m(0.3~3.0 m), 통수단면높이는 0.94 m(0.5~1.7
m), 교각높이는 4.02 m(1.4~9.5 m)이고, 개보수공사 특성상 교각이나 교대를 교체하지 않는 경우가 많으며 공사종류는 레미콘, 철근, 거푸집,
강관동바리, 비계 등 20여종이 사용되었다.
Table 1. Samples of Aqueduct Bridges by Provinces
|
Total
|
Gyeonggi
|
Gangwon
|
Chungbuk
|
Chungnam
|
Jeonbuk
|
Gyeongbuk
|
Gyeongnam
|
61
|
7
|
4
|
5
|
27
|
5
|
10
|
3
|
3.2 영향요인의 선정
공사비 영향요인(Influence Factor, IF)은 재료량, 단가 등과 같은 정량적 요인과 설치지역 등과 같은 정성적 요인으로 구분되나 수로교의
입지여건이 거의 같아 정량적 요인만을 비율척도(Ratio Scale)로 분석하였다.
Table 2. Basic information of Aqueduct Bridges for Estimating Construction Cost
|
Aqueducts
|
Flume
|
Span
|
Pier
|
Abut
|
Construction Cost(106 KRW)
|
Width
|
Height
|
Length
|
Number
|
Height
|
Number
|
Height
|
Number
|
Flume
|
Pier
|
Abut
|
Total
|
OD1
|
1.5
|
1.20
|
107.2
|
11
|
7.0
|
10
|
1.5
|
2
|
118.0
|
17.5
|
2.5
|
137.92
|
OD7
|
1.4
|
1.10
|
106
|
11
|
4.8
|
9
|
1.5
|
2
|
95.2
|
9.7
|
1.3
|
106.22
|
OD11
|
1.2
|
0.90
|
50
|
5
|
3.1
|
3
|
1.5
|
2
|
32.9
|
2.2
|
1.3
|
36.32
|
DG1
|
3.0
|
1.70
|
157
|
19
|
4.1
|
18
|
|
|
262.7
|
25.8
|
|
288.52
|
YA1
|
0.9
|
0.85
|
48
|
8
|
2.0
|
7
|
|
|
20.7
|
6.4
|
|
27.02
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
:
|
MC11
|
1.8
|
1.40
|
72
|
6
|
|
|
|
|
46.9
|
|
|
46.92
|
SH2
|
0.7
|
0.65
|
27
|
3
|
|
|
|
|
10.6
|
|
|
10.6
|
MJ51
|
1.0
|
0.70
|
90
|
9
|
9.5
|
8
|
1.5
|
|
63.9
|
20.8
|
0.6
|
85.3
|
*Unit of Width, Height, Length : m, KRW : Korean Rate Won
|
수로교는 수로부(Flume), 교각(Pier), 교대(Abut)의 구조로 구성되므로 공사비도 이들 구조별로 구분하였다. 공사비 영향요인은 Table
2와 같이 이들 구조의 재료량과 비례관계가 있는 수로부의 통수단면폭()과 높이(), 교체연장(), 경간수(), 교각의 평균높이()와 교각수(), 교대의 평균높이()와 교대수()를 선정하였다.
기타, 재료단가는 건설기술연구원의 연도별 건설공사비지수(Construction Cost Indices)를 적용하였고, 공사비는 순공사비를, 기본단위는
m를 사용하였으며 각종 통계분석은 신뢰수준 95%를 적용하였다.
3.3 영향요인의 회귀분석
회귀분석에 앞서 총 61개 사례 중 이상치로 판단되는 5개 사례를 배제하였으며, 모델 검증용 5개 사례를 제외한 51개 사례를 분석대상으로 하였다.
모델의 검증은 사용된 전체 자료의 10%를 사용하는 것이 일반적이다(Doğan et al, 2006).
Table 2를 포함하는 51개 사례의 상․하구조별 공사비 합계금액의 비율은 수로부 89.2%, 교각 9.7%, 교대 1.1%로 분석되었다.
영향요인과 공사비의 상관성을 판단하기 위해 영향요인을 독립변수, 총공사비를 종속변수로 하여 신뢰도 95%의 회귀분석을 하였다. 결정계수(R2)가 매우
낮은 영향요인을 제외하고, R2가 0.65이상 되는 교체연장(), 경간수(), 교각수()를 선정하였다. 이 결과는 Table 3 및 Fig. 3~Fig. 5와 같다.
공사비는 보통 상․하구조의 체적에 비례하므로 체적과 관계있는 영향요인의 변수조합을 새로운 공사비 영향요인으로 구성하여 제안하였다. 조합변수(Combination
Variable, CV)로서 수로부는 , 교각은 , 교대는 를 사용하였으며, 조합변수의 공사비에 대한 상관관계를 분석한 결과는 Table 4 및 Fig. 6과 같다.
Table 3. Results of Regression Analysis of IF
|
Influence Factor
|
Intercept
|
Regression Coefficient
|
R square
|
W. of Flume ()
|
-35,995,460
|
61,690,663
|
0.277
|
H. of Flume ()
|
-22,171,895
|
62,868,707
|
0.118
|
L. of Restoration ()
|
-10,370,482
|
892,404
|
0.657
|
No. of Span ()
|
0.1178058
|
8,919,190
|
0.711
|
H. of Peir ()
|
8,150,120
|
10,424,191
|
0.101
|
No. of Pier ()
|
-9,970,415
|
11,262,477
|
0.683
|
H. of Abut ()
|
74,645,239
|
-23,869,347
|
0.053
|
No. of Abut ()
|
-9,865,920
|
23,032,588
|
0.024
|
|
|
Fig. 3. Length() vs. Total Cost
|
Table 4와 같이 수로부의 변수조합은 상관성이 높으나 교각과 교대의 변수조합은 낮은 것으로 나타났다. 따라서 수로부, 교각, 교대 각각의 공사비를
합하여 총공사비를 예측하는 방법은 부적합한 것으로 판단되었다. 다만 교각공사비가 총공사비의 약 10%를 차지하고 있으므로 를 공사비 영향요인에 포함하였다.
|
|
|
Fig. 4. No. of Span() vs. Total Cost
|
|
Fig. 5. No. of Pier() vs. Total Cost
|
Table 4. Results of Regression Analysis of CV
|
Classification
|
Variables
|
Intercept
|
Regression Coefficient
|
R square
|
Cost of
Super/Sub
structure
|
|
-10,758,039
|
246,005
|
0.896
|
|
42,747,739
|
49,585
|
0.286
|
|
1,216,092
|
53,941
|
0.005
|
Total
Cost
|
|
-10,650,130
|
268,393
|
0.898
|
|
39,278,510
|
190,075
|
0.070
|
|
36,232,196
|
-296,225
|
0.0002
|
|
|
Fig. 6. vs. Flume Cost
|
따라서 수로교 개략공사비 산정을 위한 영향요인으로 교체연장(), 경간수(), 교각수(), , 의 5개를 선정하였으며 이에 대한 회귀진단을 실시하였다.
4. 개략공사비 산정 모델
4.1 회귀분석 모델
4.1.1 회귀진단
회귀진단은 다중회귀분석의 변수제거법을 이용하여 이상치와 다중공선성을 분석하였다. 이 분석은 EXCEL 기반의 KESS(Korean Educational
Statistics Software, stat.snu.ac.kr/time)를 이용하였으며 그 결과가 범용프로그램인 SPSS와 동일함을 확인하였다.
회귀진단 결과, Table 2의 DG1사례가 이상치(Cook’s Distance =9.2884≫1, Leverage=0.8259≫2(p+1)/n=2(5+10)/51=
0.235, p=독립변수의 수, n=표본수)로 판단되어 이를 제외함으로써 50개 사례(5개 검증사례 별도)를 회귀분석대상으로 하였다. 5개 독립변수
사이의 다중공선성은 교체연장()의 VIF가 81.1745로 10을 크게 초과하여 다중공선성이 있는 것으로 판단되어 독립변수에서 제외하였으며 이에 따라 회귀분석의 독립변수를 경간수(), 교각수(), , 의 4개로 최종 결정하였다.
4.1.2 회귀분석 모델의 오차율
Table 5. IF and Construction Cost of Cases for Verification
|
Aqueducts
|
|
|
|
|
Total Cost
|
YA2
|
4
|
3
|
98.80
|
6
|
18,625,870
|
BD7-2
|
9
|
8
|
324.00
|
15
|
61,686,042
|
GD47
|
28
|
0
|
467.50
|
0
|
105,234,192
|
CG4
|
3
|
0
|
64.80
|
0
|
12,726,126
|
MJ134
|
3
|
2
|
72.00
|
10
|
11,390,220
|
회귀분석 모델(RA)의 적합성을 분석하기 위해서 RA 모델의 예측공사비를 Table 5의 검증사례 실적공사비와 비교하였다. RA 모델의 경우 수는
영향요인 즉 독립변수의 개수가 4개이므로 이들의 조합은 15개가 가능하나 이 중 ① 독립변수의 개수가 1, 2, 3, 4인 조합에서 1개씩은 포함하고
② 수로부를 나타내는 을 포함하며 ③ 상기 두 조건을 모두 만족하는 것 중 결정계수가 큰 5개를 선정하였다. 회귀분석은 신뢰수준 95%로 회귀식에 대한 F검증과 회귀계수(절편과
기울기)에 대한 t검증을 하여 유의성을 확인하였다. RA 모델의 적합성은 절대값으로 한 오차율의 크기와 분포를 비교하여 분석하였다.
Table 6. Standardized IF and Cost of Cases for Verification
|
Aqueduct
|
|
|
|
|
Total Cost
|
YA2
|
-0.374
|
-0.494
|
-0.564
|
-0.714
|
-0.477
|
BD7-2
|
0.766
|
0.998
|
1.113
|
-0.201
|
0.733
|
GD47
|
5.096
|
-1.389
|
2.181
|
-1.056
|
1.956
|
CG4
|
-0.602
|
-1.389
|
-0.817
|
-1.056
|
-0.642
|
MJ134
|
-0.602
|
-0.792
|
-0.764
|
-0.486
|
-0.680
|
또한 영향요인의 자료값을 원 값 그대로 사용한 경우와 단위 영향을 제거하기 위해 Table 6과 같이 자료값을 (자료값-평균)/표준편차로 하는 표준화한
경우를 비교하였으며 그 결과는 각각 Table 7, Table 8과 같다.
Table 7. Error Rate of Linear Regressin Models
|
Model
|
Variable
|
Regression Coefficient
|
Aqueduct
|
Estimated Cost (KRW)
|
Actual Cost (KRW)
|
Error Rate (%)
|
1
:
0.920
|
Constant
|
-6.74E+06
|
YA2
|
13,290,789
|
18,625,870
|
28.6
|
BD7-2
|
46,237,021
|
61,686,042
|
25.0
|
|
3.74E+06
|
GD47
|
152,560,465
|
105,234,192
|
45.0
|
|
-4.66E+06
|
CG4
|
12,039,083
|
12,726,126
|
5.4
|
|
1.16E+05
|
MJ134
|
16,092,201
|
11,390,220
|
41.3
|
|
1.25E+06
|
Average
|
|
|
29.1
|
2
:
0.886
|
Constant
|
-5.22E+06
|
YA2
|
11,905,604
|
18,625,870
|
36.1
|
BD7-2
|
53,456,466
|
61,686,042
|
13.3
|
|
-4.00E+06
|
GD47
|
103,256,066
|
105,234,192
|
1.9
|
CG4
|
9,817,201
|
12,726,126
|
22.9
|
|
2.32E+05
|
MJ134
|
13,829,289
|
11,390,220
|
21.4
|
|
1.03E+06
|
Average
|
|
|
19.1
|
3
:
0.866
|
Constant
|
-7.93E+06
|
YA2
|
19,018,575
|
18,625,870
|
2.1
|
BD7-2
|
66,334,941
|
61,686,042
|
7.5
|
|
2.91E+06
|
GD47
|
133,128,788
|
105,234,192
|
26.5
|
CG4
|
9,053,471
|
12,726,126
|
28.9
|
|
1.27E+05
|
MJ134
|
14,510,873
|
11,390,220
|
27.4
|
|
4.54E+05
|
Average
|
|
|
18.5
|
4
:
0.845
|
Constant
|
-6.58E+06
|
YA2
|
17,261,117
|
18,625,870
|
7.3
|
BD7-2
|
69,866,445
|
61,686,042
|
13.3
|
|
2.19E+05
|
GD47
|
95,734,836
|
105,234,192
|
9.0
|
CG4
|
7,606,065
|
12,726,126
|
40.2
|
|
3.69E+05
|
MJ134
|
12,872,299
|
11,390,220
|
13.0
|
Average
|
|
|
16.6
|
5
:
0.823
|
Constant
|
-6.40E+06
|
YA2
|
17,366,799
|
18,625,870
|
6.8
|
BD7-2
|
71,535,475
|
61,686,042
|
16.0
|
GD47
|
106,052,371
|
105,234,192
|
0.8
|
|
2.41E+05
|
CG4
|
9,188,580
|
12,726,126
|
27.8
|
MJ134
|
10,920,438
|
11,390,220
|
4.1
|
Average
|
|
|
11.1
|
4.1.3 회귀분석 모델 분석
Table 7의 5가지 RA 모델을 비교해 보면, 독립변수가 1개인 경우(SRA)의 결정계수(R2)는 0.823으로 여러 개인 경우(MRA)의 결정계수
0.845~0.920에 비해 작아 독립변수가 종속변수에 미치는 전체 영향력이 작으나, 오차율은 평균 20.8%에서 11.1%로 감소되었고 표준편차도
12.6~15.7에서 10.9로 감소되었다.
SRA와 MRA 그룹으로 나누어 각 사례(표본 5개와 표본 20개)에 대한 분산분석을 한 결과 차이를 인정할 수 없는 것으로 나타났다. 그러나 Table
8의 표준화한 경우를 포함하여 SRA 그룹(표본 10개)과 MRA 그룹(표본 40개)에 대한 분산분석을 한 결과, 평균은 11.1과 26.7, 표준편차는
10.29와 19.45로 나타남으로써 두 그룹 사이에 차이(유의확률 p = 0.039)가 있는 것으로 나타났다.
이러한 결과는 수로부의 공사비가 평균 90% 정도를 차지하고 있어 공사비 비중이 낮은 교각이 포함된 경우 오차율이 커지기 때문인 것으로 판단된다.
Table 8. Error Rate of Standardized Linear Regressin Models
|
Model
|
Variable
|
Regression Coefficient
|
Aqueduct
|
Estimated Cost (KRW)
|
Actual Cost (KRW)
|
Error Rate (%)
|
1S
:
0.919
|
Constant
|
0.0
|
YA2
|
12,671,083
|
18,625,870
|
32.0
|
BD7-2
|
45,777,476
|
61,686,042
|
25.8
|
|
0.45117
|
GD47
|
151,861,366
|
105,234,192
|
44.3
|
|
-0.445540
|
CG4
|
11,619,966
|
12,726,126
|
8.7
|
|
0.45660
|
MJ134
|
15,475,732
|
11,390,220
|
35.9
|
|
0.61278
|
Average
|
|
|
29.6
|
2S
:
0.887
|
Constant
|
0.0
|
YA2
|
11,199,022
|
18,625,870
|
39.9
|
BD7-2
|
53,992,720
|
61,686,042
|
12.5
|
|
-0.33490
|
GD47
|
99,418,402
|
105,234,192
|
5.5
|
CG4
|
7,882,128
|
12,726,126
|
38.1
|
|
0.85748
|
MJ134
|
12,836,665
|
11,390,220
|
12.7
|
|
0.51364
|
Average
|
|
|
21.7
|
3S
:
0.879
|
Constant
|
0.0
|
YA2
|
13,180,429
|
18,625,870
|
29.2
|
BD7-2
|
61,897,073
|
61,686,042
|
0.3
|
|
0.31169
|
GD47
|
119,534,713
|
105,234,192
|
13.6
|
CG4
|
2,208,254
|
12,726,126
|
82.6
|
|
0.50692
|
MJ134
|
9,633,818
|
11,390,220
|
15.4
|
|
0.31799
|
Average
|
|
|
28.2
|
4S
:
0.862
|
Constant
|
0.0
|
YA2
|
11,984,415
|
18,625,870
|
35.7
|
BD7-2
|
65,051,709
|
61,686,042
|
5.5
|
|
0.79753
|
GD47
|
86,295,552
|
105,234,192
|
18.0
|
CG4
|
1,158,589
|
12,726,126
|
90.9
|
|
0.29853
|
MJ134
|
8,743,620
|
11,390,220
|
23.2
|
Average
|
|
|
34.6
|
5S
:
0.823
|
Constant
|
0.0
|
YA2
|
17,366,799
|
18,625,870
|
6.8
|
BD7-2
|
71,535,475
|
61,686,042
|
16.0
|
GD47
|
106,052,371
|
105,234,192
|
0.8
|
|
0.90738
|
CG4
|
9,188,580
|
12,726,126
|
27.8
|
MJ134
|
10,920,438
|
11,390,220
|
4.1
|
Average
|
|
|
11.1
|
따라서 개략공사비 산정을 위한 RA 모델은 독립변수를 의 1개로 하는 SRA 모델이 이 적합한 것으로 판단되었으며 그 식은 , (단위:m, 원) 이다. 이 모델은 간단한 산출식이지만 교각공사비를 반영할 수 없는 단점이 있다.
한편 표준화한 경우와 원 값을 그대로 사용하는 경우(비표준화 경우) 사이의 오차율 차이를 비교하기 위해 모델별 평균오차율에 대해 분산분석을 한 결과
차이가 없는 것으로 분석되었다.
4.2 사례기반추론 모델
4.2.1 사례기반추론(CBR) 기법 프로세스
수로교 사례기반의 기본구성은 교체연장(), 경간수(), 교각수(), , 의 5개 영향요인과 총공사비의 6개 속성값으로 된 식 (2)로 표현되며, 총공사비는 해당 공사시기에 따라 공사비지수를 반영하여 보정하였다.
본 논문에서는 사례기반을 기존사례 50개소와 검증사례 5개소로 구성하였다.
번째 사례 (2)
여기서, :번째 사례의 번째 영향요인의 값, =1~5
:번째 사례의 총공사비
수로교의 개략공사비 산정을 위한 CBR 기법 프로세스는 Fig. 7과 같다
|
Fig. 7. Process of CBR for Approximate Cost Estimate
|
첫째, 기존사례 속성값(Attribute) 정보와 신규사례 정보를 입력한다.
둘째, 유클리디안 거리를 이용한 영향요인별 유사도(Attribute Similarity)는 식 (3), (4)와 같이 산정된다.
번째 사례의 번째 속성유사도
일 때, (3)
일 때, 0 (4)
여기서, : 기존사례 번째의 번째 영향요인의 값
: 신규사례 번째 영향요인의 값
: 번째 영향요인의 편차기준
신규사례와 편차가 있는 기존사례를 어느 범위까지 선택할 것인가가 매우 중요하며, 도로교의 경우에서는 보통 영향요인의 편차기준 를 고정된 값을 사용하였으나, 이 연구에서는 편차기준을 최적화 대상으로 삼아 GA를 이용하여 최적값을 찾아내는 방법을 적용하였다.
셋째, 사례유사도(Case Similarity)는 식 (5)와 같이 계산된다.
번째 사례의 사례유사도 (5)
여기서, : 번째 영향요인의 가중치
영향요인의 가중치 는 GA를 이용한 최적화 과정에서 구해지며 그 총합은 1이 된다.
예측공사비는 유사한 사례를 찾은 후 유사도 순위에 따라 일정 개수의 유사사례를 선정하여 적정하게 계산하게 되는데 이 연구에서는 유사사례수(순위기준)도
최적화 대상에 포함하였다. 즉, 실적공사비와 예측공사비의 오차가 최소가 되도록 유사사례 순위기준을 최적화하였다.
네째, 사례가중치(Case Weight)는 식 (6)과 같이 계산된다.
번째 사례의 사례가중치 (6)
여기서, : 유사도 순위
: 유사사례 순위기준 내의 사례유사도의 총합
: 유사사례 순위기준
다섯째, 예측공사비는 유사사례 순위기준 내의 유사사례 공사비 에 사례가중치를 곱한 값을 합산하여 식 (7)과 같이 계산된다.
예측공사비 (7)
4.2.2 유전 알고리즘(GA) 이용 최적화
CBR 기법 프로세스에서 예측공사비의 오차가 최소가 되도록 GA를 이용한 최적화방법을 도입하였으며 그 대상은 영향요인의 가중치 , 영향요인의 편차기준 , 유사사례 순위기준 이다.
또한 최선 해의 탐색효율을 높이고 오차를 줄이기 위하여 영향요인별 가중치의 제한범위를 설정하였다. 영향요인 중 는 수로부공사비와, 는 교각공사비와 밀접한 관계가 있으므로 이들 공사비가 차지하는 비율을 영향요인의 가중치 범위가 되도록 하였다. 즉, 각 사례의 실적공사비에 대한 수로부공사비와
교각공사비의 비율로부터 신뢰도 99.74% 이상이 되는 최소 수로부공사비와 최대 교각공사비 비율을 구하여 이 비율을 영향요인의 가중치의 범위를 설정하는데
적용하였다. 이에 따라 는 58% 이상, 는 38% 이하가 되도록 제한되었다.
|
Fig. 8. Process of Optimization using GA
|
GA의 최적화 과정은 Fig. 8과 같으며, 50개 사례 중 45개를 사례기반으로 하고 5개를 학습사례로 하여 예측공사비와 실적공사비의 오차율이 최소로
되도록 하였다.
한편, GA를 이용한 최적화 프로그램으로 EXCEL 2010을 사용하였으며, 제한조건(Option)으로 해집단 수는 150, 변이율은 0.075로
하였고(Hiller, F. S. and Hiller, M. S., 2004) 그 외의 GA의 옵션은 수렴도 0.0001, 개선을 포함하지 않는 시간은
300초로 하였다.
4.2.3 사례기반추론 모델의 오차율
CBR 모델의 분석방법은 최적화의 대상과 제한조건, 표준화 여부 등에 따라 많은 경우가 있을 수 있다. GA를 이용한 PSC Beam교에서는 유사도
편차기준을 5, 10, 15, 20%의 범위로, 순위기준을 1~5순위까지로 설정하고 최적의 편차와 순위를 선정하였으며(Kim, G. J. et al.,
2011), 강박스교에서는 편차 10%, 순위 3%를 적용하였다(Kang, S. H., 2010). 이 연구에서는 선행 연구결과와 수로교에 대한 예비분석을
통해 다음과 같은 방법으로 수행하였다.
첫째, 수로교에서는 영향요인의 가중치 외에 편차기준 및 순위기준을 최적화 대상으로 하였으며 특히 편차기준은 영향요인 값들 간의 비율이 최소 27.5배(교체연장)~최대
52.5배[]로 매우 커서 유사도 20% 이하를 만족하는 사례가 거의 없으므로 편차기준을 100%(비교대상 간 2배 차이) 이하로 넓혀서 설정하는 방법을 적용하였다.
둘째, 영향요인의 가중치 범위를 제한하는 방법을 적용하였으며 편차기준은 Table 9와 같이 0~10%, 0~20%, 같은 방법으로 30, 40,
50, 60, 100%와 최소 오차율 상하 ± 5%인 두 조건을 합쳐 9개 조건의 오차율을 구하였다.
검증사례는 RA 모델과 동일 대상으로 하였다. 최적화를 수행하여 구한 영향요인 가중치, 편차기준, 순위기준과 그에 따른 공사비 오차율 결과를 Fig.
9에 일례로 나타내었다.
|
Fig. 9. An Example of Optimized Output
|
CBR 모델의 공사비 오차율은 Table 9와 같이 편차기준 40%인 조건에서 가장 낮았으며 Fig. 9와 같이 5개 검증사례에 대한 오차율은 평균
7.19%이었다.
셋째, 영향요인의 가중치 범위를 제한하지 않은 방법에 대한 오차율은 Table 10과 같이 편차기준 40% 일 때 평균 9.12%로 나타났다. 가중치
범위를 제한하는 방법과 비교해 보면 40% 이외의 경우에도 오차율이 크게 나타났으며 이는 가중치 범위를 제한한 결과로 판단된다.
넷째, 영향요인의 단위 영향을 제거하기 위해 자료값을 표준화하여 구한 오차율은 Table 11과 같으며 편차기준 50%인 조건에서 평균 7.12%로
최소가 되었다.
최소 오차율만을 비교하면 표준화한 방법의 7.12%가 표준화하지 않은 방법의 7.19%에 비해 작으나, 편차기준 20%~100%의 8가지 전체를 대상으로
오차율의 차이를 비교해 보기 위해 분산분석을 한 결과 95% 신뢰 수준에서 유의성이 없는 것으로 나타났으며, 또한 최소 오차율의 상하 5개 편차 기준에
대한 평균 오차율을 두 방법 간 비교해 보아도 유의성이 없는 것으로 나타났다. 따라서 표준화여부에 따른 오차율 차이는 없는 것으로 판단된다.
Table 9. Error Rate by of Construction Cost Estimate by Maximum Deviation
|
Stat
|
Maximum Deviation
|
10%
|
20%
|
30%
|
35%
|
40%
|
45%
|
50%
|
60%
|
100%
|
Aver (Training)
|
5.21
|
4.67
|
4.85
|
4.54
|
4.12
|
3.00
|
2.12
|
2.11
|
2.50
|
Aver (Testing)
|
27.46
|
9.23
|
13.88
|
13.06
|
7.19
|
9.13
|
11.96
|
12.01
|
11.58
|
Min. Error
|
1.97
|
3.23
|
9.18
|
9.86
|
0.96
|
3.62
|
1.32
|
1.58
|
0.27
|
Max. Error
|
74.46
|
15.11
|
20.20
|
16.44
|
21.36
|
16.16
|
18.45
|
18.56
|
19.46
|
Rank
|
2
|
8
|
5
|
5
|
6
|
5
|
6
|
6
|
6
|
*20% : 0% ~ 20%, 30% : 0% ~ 30%
*Rank : number of similar cases
|
|
Table 10. Comparison of Error Rates by Optimization Conditions
|
Statistics
|
Maximum Deviation under Limitation of Weight
|
Maximum Deviation under Unlimitedness of Weight
|
30%
|
40%
|
50%
|
30%
|
40%
|
50%
|
Average
|
13.88
|
7.19
|
11.96
|
25.73
|
9.12
|
14.45
|
Minimum
|
9.18
|
0.96
|
1.32
|
0.43
|
0.05
|
0.81
|
Maximum
|
20.20
|
21.36
|
18.45
|
64.40
|
22.33
|
31.07
|
|
Table 11. Error Rates of Estimated Cost by Standardized CBR Model
|
Statistics
|
Maximum Deviation
|
10%
|
20%
|
30%
|
40%
|
45%
|
50%
|
55%
|
60%
|
100%
|
Average(Training)
|
Unsolved
|
5.88
|
6.54
|
12.82
|
7.00
|
8.32
|
6.30
|
6.45
|
6.29
|
Average(Testing)
|
31.98
|
16.93
|
12.22
|
15.80
|
7.12
|
10.38
|
11.97
|
9.28
|
Minimum
|
8.53
|
10.71
|
2.78
|
4.07
|
1.38
|
0.73
|
8.73
|
0.78
|
Maximum
|
90.52
|
30.13
|
30.10
|
30.04
|
17.59
|
16.10
|
16.10
|
14.81
|
Rank
|
8
|
8
|
4
|
5
|
5
|
5
|
5
|
5
|
이상의 결과로부터 CBR 모델에서는 영양요인의 값을 원 값 그대로 사용하고, 영향요인 가중치의 제한범위를 설정하여 영향요인의 가중치와 편차기준, 유사사례
순위기준을 최적화하는 방법이 간단하면서도 오차율을 최소화할 수 있는 것으로 분석되었다.
4.3 회귀분석 모델과 사례기반추론 모델의 비교
회귀분석(RA) 모델과 사례기반추론 모델의 원 자료값 그대로 사용한 모델 (CBR)과 표준화한 자료를 사용한 모델(CBRST)을 비교한 결과, 최소
평균오차율은 각각 11.1%, 7.19%, 7.12% 이고, 표준편차는 10.9%, 8.4%, 6.5% 로 분석되었으며 이를 5개 검증사례별로 도시하면
Fig. 10과 같다.
3개 모델을 비교하기 위해 5개 사례의 오차율을 분산분석한 결과, 오차율의 차이가 없는 것으로 나타났다. 따라서 CBR 모델이 RA 모델보다 오차율이
낮다고 판단하기에는 무리가 따른다. 한편 두 모델에 대한 장단점을 비교해 보면 CBR 모델의 경우 전술한 예비적 고찰에서 공동주택과 경량전철 정거장에서
오차율이 RA 모델보다 낮게 나타난 연구결과가 있다. 반면, RA 모델은 상대적으로 분석이 용이하나 수로부 만의 변수로 구성되어 있어 교각과 교대의
공사비를 반영할 수 없다는 약점을 갖고 있다. 그러므로 두 모델을 사용할 경우에는 교체대상으로 교각 포함여부와 사용의 편의성 등을 고려하여야 좋을
것으로 판단된다.
|
Fig. 10. Comparison of Error Rates between RA Model and CBR Models
|
5. 결 론
본 논문은 수로교가 노후화되거나 기능 개선이 필요하여 교체할 경우 개략공사비를 산정하는 방법을 제시하였다. 이를 위해 2003년 이후 교체한 수로교
총 61개 사례의 실적공사비 자료를 분석하고 순공사비와 연도별 건설공사비지수를 적용하여 단순한 기본정보의 입력만으로 개략공사비를 산출하는 회귀분석(RA)
모델과 사례기반추론(CBR) 모델을 개발하여 비교하였으며 주요 연구 결과는 다음과 같다.
(1) 수로교의 공사비 영향요인으로 통수단면폭()과 높이(), 교체연장(), 경간수(), 교각높이()와 교각수(), 교대높이()와 교대수()를 대상으로 회귀분석을 하여 교체연장, 경간수, 교각수를 선정하였고 상․하구조의 체적과 관계있는 변수조합을 새로운 영향요인으로 제안하여 와 를 추가하였다.
(2) RA 모델에 대한 회귀진단을 하여 독립변수로 경간수, 교각수, , 의 4개를 선정하였다. 회귀분석 모델의 오차율을 비교하기 위해 15개 다중회귀 모델 중 결정계수가 높은 조건 등을 만족하는 5개를 선정하여 오차율의
크기와 분포를 비교하였고 또한 변수의 단위 영향을 제거하기 위해 영향요인 자료를 표준화한 모델과도 비교하였다.
(3) RA 모델에서는 독립변수를 의 1개로 하는 경우(SRA)의 평균 오차율이 11.1%를 나타내었고 여러 개인 경우(MRA)는 20.8%를 나타내었다. SRA와 MRA의 통계적인
차이를 진단하기 위해 원 값을 그대로 사용한 경우와 표준화한 경우의 전체를 대상으로 오차율을 분산분석한 결과, 차이가 있는 것으로 분석되었다. 한편
표준화한 경우는 원 값을 그대로 사용한 경우와 차이가 없는 것으로 분석되었다. RA 모델은 원 값을 사용하는 단순회귀분석 모델이 적합한 것으로 판단된다.
(4) CBR 모델에서는 유전 알고리즘(GA)의 최적화 변수로 선행연구의 영향요인별 가중치 외에 편차기준과 순위기준을 포함하였으며 특히 영향요인별
가중치가 상․하부구조별 공사비 비율을 만족하도록 하여 는 총공사비의 수로부공사비의 비율 이상, 는 총공사비의 교각공사비의 비율 이하가 되도록 제한하는 방법을 도입하여 오차율과 탐색효율을 개선하였다.
(5) CBR 모델에서는 상기의 5개 영향요인을 사용하였으며, 영향요인의 가중치를 제한하는 방법의 오차율은 평균 7.19%이었으며, 표준화한 경우는
평균 7.12%이었다. 두 방법에 따른 조건별 오차를 분산분석해보면 차이가 없는 것으로 나타났다.
(6) RA 모델과 CBR 모델의 오차율을 비교한 결과 두 모델 사이에는 차이가 없는 것으로 나타났다. 따라서 두 모델을 사용하여 수로교 교체 개략공사비를
산정할 경우에는 교체대상과 편의성 등을 고려할 필요가 있는 것으로 판단된다.