-
1. 서 론
-
1.1 연구의 배경 및 목적
-
1.2 연구의 범위 및 내용
-
2. 선행 연구 검토
-
3. 자료 수집 및 정리
-
3.1 교통사고 자료
-
3.2 도로 및 토지이용 변수
-
3.3 사회경제변수
-
3.4 교통안전시설 및 정책변수
-
4. 도시교통사고 예측 모형 추정
-
4.1 모형추정을 위한 종속변수 선정
-
4.2 독립변수의 선정
-
4.3 모형의 추정
-
4.4 모형의 해석
-
4.4.1 사고노출환경변수
-
4.4.2 교통안전시설 및 정책변수
-
5. 결론 및 향후 연구과제
1. 서 론
1.1 연구의 배경 및 목적
우리나라는 교통안전법에 의해 지난 1980년부터 5년마다 중장기 종합계획으로 국가교통안전기본계획을 수립하여 현재 7차(2012~2016) 기본계획이
시행되고 있다. 이에 따라 지방자치단체 역시 주민의 생명과 재산을 보호하기 위해 지역교통안전기본계획을 수립·시행하고 있으며 이는 맞춤형 교통안전시책
수립과 교통안전 향상을 위한 기초자치단체 차원의 대책 수립 및 역할분담이 강조되고 있는 것을 의미한다. 다시 말해서 기초자치단체가 지역실정에 맞은
내실 있는 지역교통안전 정책을 실질적으로 주도하여 추진하는 것을 의미한다(Park, 2011a). 이를 위해서는 보다 작은 지역단위를 대상으로 그
지역특성을 고려한 교통사고 발생요인 분석이 선행되어야 하나 이에 대한 연구는 자료수집의 한계로 미흡한 수준 이라고 할 수 있다.
지역을 기반으로 하는 거시적인 관점에서의 교통사고 예측 및 사고발생 영향 요인을 분석한 기존 연구들은 자료수집이 한계로 대부분 국가 또는 시(市)
단위로 교통사고와 인구나 자동차 등록대수 등 사회경제변수들을 활용한 연구가 대부분이었다. 이러한 모형들을 실제 지역의 교통사고 감소를 위해 활용되기에는
한계를 보여 왔다. 이는 인구나 자동차 등록대수, 도로연장 등의 사회경제변수들은 교통사고 감소를 위해 국가나 지자체에서 정책적으로 조절할 수 없는
사고노출환경과 관련된 변수이기 때문이다. 또한, 거시적인 관점에서 시(市)단위로 개발된 교통사고 예측 모형에서 인구나 자동차 등록대수가 많을수록 교통사고
발생에 큰 영향을 미치고 있다는 것을 보다 작은 행정단위에 적용을 해보면 꼭 그렇지 않다는 것을 알 수 있다. 서울시를 예를 들어 보면, 도심지역의
종로구나 중구에 소속된 행정동들은 주거지역인 도봉구나 서대문구에 소속된 행정동들에 비해 인구 및 자동차 등록대수는 적지만 교통사고 빈도가 훨씬 높게
나타나고 있는 것을 알 수 있다.
교통사고 예측모형을 개발하는 이유는 교통사고 발생특성을 파악하여 교통사고를 줄일 수 있는 효율적인 대책을 발굴하는 것이 주요 목적이다. 이에 본 연구에서는
기존 연구에서 다루지 못한 보다 작은 지역 단위인 행정동을 분석의 단위로 하는 소규모 지역단위 교통사고 예측모형을 개발하였으며, 사고노출환경과 관련된
사회경제변수외 지자체가 제어할 수 있는 교통안전시설 및 정책 변수를 모형에 반영하여 지역교통안전 정책 수립시 활용할 수 있는 방향을 제시하고자 하였다.
1.2 연구의 범위 및 방법
본 연구의 시간적 범위는 2010년으로 한정하였고, 공간적 범위는 서울특별시 전역이며, 분석단위로는 사회경제지표를 비롯하여 가장 작은 지역단위로 자료획득이
가능한 개별 행정동1)을 대상으로 하였다. 시간적 범위를 1년으로 제한한 것은 사회경제지표를 비롯한 자료들이 1년을 기준으로 생성되기 때문이며, 다양한 형태의 자료 수집이
가능했던 2010년을 대상으로 하였다. 수집하는 자료는 경찰청 교통사고 자료 및 도로교통법 위반 단속실적, 서울시 인구통계, 서울시 GIS 기반의
교통안전시설물 자료(횡단보도, 과속 방지턱, 버스전용차로, 음향신호기 수 등), 도로명 주소관리시스템 자료(건축물 용도별 연상면적 등) 등이다.
일반적으로 지역단위의 거시적 교통사고 예측모형 개발에 가장 많이 적용되는 방법론은 다중선형회귀모형으로 본 연구에서도 이를 적용하였다.
2. 선행 연구 검토
초창기의 지역단위 교통사고 예측모형은 대부분 국가단위로 개발되었다. Smeed (1949)는 특정년도의 한 나라의 사망자수는 그 나라의 등록된 자동차의
등록대수와 인구수와 관련되어 있다고 하였다. 영국의 Adams (1987)는 세계 62개국의 1978~1980년도 교통사고 자료를 사용하여 자동차
1천대당 사망자수와 인구당 자동차보유대수의 관계를 일부 조정함으로써 Smeed 모형을 개선한 모형을 개발하였다. 한국에서는 Kim (1987)이 공업국가
중심의 19개국 1980년 교통사고 통계자료를 이용해 다중회귀분석을 수행하였으며, 인구수 하나만으로도 결정계수 0.9357을 얻어 사망자수의 94%를
설명하고 다른 변수들(자동차 보유대수, 도로연장거리, 국민총생산, 연간주행거리, 국토면적, 이륜차를 제외한 차량보유수, 정부예산 중 도로교통부문이
차지하는 비율)은 중복변수임을 밝혔다.
Kwon (1993)은 서울시를 대상으로 자동차 1대 1일 평균주행거리, 도로율, 운전면허 취득 후 5년 미만인 운전자의 구성비와 도로연장당 안전표지수를
독립변수로 하고, 자동차 1만대당 교통사고건수, 1만대당 사망자수와 1만대당 부상자수를 종속변수로 하여 회귀분석방법 중 단계별 회귀방법을 이용한 모형을
정립하였다.
최근 국내에서 연구된 지역단위의 거시적 교통사고 분석모형으로는 Park (2011b)의 연구가 있다. 그는 전국 226개의 기초자치단체를 대상으로
사망사고 발생의 지역적 특성을 알아보고자 하였으며, 절단 음이항 모형을 가장 적합한 모형으로 선정하고, 유류판매량, 교통사고관련 투자비용, 외국인
인구, 도로연장, 고속도로 구성비, 내부통행량, 여성운전자 비율이 유의한 독립변수임을 제시하였다.
Wedagama et al. (2006)과 Wier et al. (2009)의 연구에서는 토지 이용과 교통사고와의 관계 규명을 시도하였다. 먼저 Wedagama
et al. (2006)은 토지이용은 통행발생을 유발시키고 통행발생은 도로에 교통량으로 나타나 교통사고 발생에 영향을 미친다는 개념을 정립하였다.
또한 토지이용의 변화에 따른 도로교통사고가 시계열적으로 관련성이 있음을 제시하였다. Wier et al. (2009)은 California의 보행자사고를
토지이용과 교통계획에 따라 발생 양상이 다름을 제시하였다. 도로특성, 토지이용, 인구특성, 통근 수단(도보, 대중교통)에 따른 차량대보행자 상해충돌
사고모형을 로그선형 회귀분석을 통해서 구축하였다. 이를 통해 교통량이 차량대보행자의 충돌 사고의 주요한 원인임을 확인하였으며, 토지이용 측면에서 주거,
상업, 근린주거지역에서 차량 대 보행자 사고가 많이 발생함을 분석하였다.
영국의 Smeed (1949)에서 시작된 초창기 지역단위 교통사고예측 모형은 주로 교통사고와 사회경제지표를 이용한 예측모형을 개발하였다. 이러한 모형들은
국가단위(또는 도시 단위)의 예측모형으로 특정독립변수가 사고에 미치는 영향이 모든 국가(또는 도시)에 동일하게 적용되어 개별 국가(또는 도시)들의
지역 특성을 고려하지 못하고 있다는 태생적인 한계가 있다. 이러한 한계로 인하여 모형을 통한 예측값이 매우 부정확하다는 문제가 있다. 또한, 초기의
모형들은 모형의 유의성을 주로 결정계수()만으로 판단하였다. 그러나 결정계수는 변수의 증가와 더불어 증가하는 경향이 있어 유의한 모형 판정기준이라 할 수 없다. 따라서 결정계수를 비롯한
계수의 유의성검증(t-test)과 다중공선성 검증(VIF : Variance Inflation Factor) 등의 모형진단을 통해 통한 독립변수의
유의성을 진단하고 중복되는 독립변수를 제거한 후 예측모형을 결정해야 할 것이다.
선행 연구들을 통해 교통사고 발생 영향 요인을 크게 도로 및 토지이용 등과 같은 환경 요인, 사회경제적 요인, 교통안전시설 요인으로 구분할 수 있었다.
도로 및 토지이용 등의 환경 요인으로는 도로연장이나 도로율, 도로 유형이나 토지이용 유형 등이 있다. 사회경제적인 요인으로는 지역의 인구 및 구성원
분포, 세대수, 차량보유대수, 고용자 수 등이 있다. 교통안전시설 요인으로는 횡단보도 예고표시 설치율이나 신호등 잔여시간 표시기 설치율 등이 있다.
또한 Park (2011a)에 의하면 이러한 변수의 경우 기초자치 단체마다 상이할 수 있으며 교통안전 예산반영을 대체할 수 있는 변수로 활용이 가능하다
하였다. 도시교통사고 예측모형 개발을 위해서는 이들 영향요인들을 적절하게 고려하는 것이 필요하며, 예측력을 향상시킬 수 있도록 사회경제적 요인이나
교통안전시설 수준 등에 대한 부분은 상대적 비중(LQ : Location Quotient)2)으로 변환하여 변수를 포함하는 것도 필요하다고 판단된다.
3. 자료 수집 및 정리
본 연구에서는 경찰청(교통사고 통계자료, 경찰인력에 의한 도로교통법 위반 단속실적), 서울통계(도로연장, 인구, 세대수, 종사자수, 고용자수, 수용학생수,
자동차 등록대수 등), 서울 GIS포탈(교차로, 횡단보도, 횡단보고 예고표시, 음향신호기, 잔여시간 표시기, 과속방지턱, 버스전용차로 설치 현황,
일방통행로 설치 현황 등), 수도권교통본부(수단별 OD), 도로명주소관리시스템(건축물 용도별 연면적)으로부터 관련 자료를 수집하였으며, 모든 자료는
서울시 행정동 단위로 수집하였다. 행정동별 단위로 자료를 수집함에 있어 인구 및 세대수와 같이 행정동별 통계자료로 제공되는 경우는 그대로 활용할 수
있었으나, 횡단보도 개소수나 과속방지턱 개소수, 도로연장 등과 같이 행정동 단위로 제공되지 않는 자료의 경우 GIS의 중첩분석을 활용하여 행정동별
자료를 구축하였다.
3.1 교통사고 자료
본 연구에서 종속변수로 활용될 자료는 행정동 단위로 개별 교통사고 자료를 집계한 교통사고 발생빈도(건)이다. 공식적으로 집계된 서울시 관내에서 발생한
2010년 교통사고건수는 41,662건3)이나 본 연구에서 활용된 사고건수는 40,046건이다. 이는 사고 자료를 행정동 단위로 정리함에 있어 다음의 두 가지 과정을 거쳐 자료가 일부 제거되었기
때문이다.
먼저, 사고마다 가지고 있는 위치정보를 서울시 행정동 및 도로 GIS 자료에 매칭하여 서울시 경계를 벗어나 있거나 한강 위에 위치한 것으로 나타난
자료를 1차 제거하였다. 2차 제거 대상은 도시고속도로4)상에서 발생한 사고이다. 본 연구의 핵심은 행정동 단위의 사회경제적인 특성, 도로 및 토지이용 특성, 교통안전시설 및 정책 특성이 교통사고 발생에
어떤 영향을 미치는지에 대해 지역단위의 교통사고건수를 예측하는 것이다. 따라서 도시고속도로에서의 사고는 도로구간별 특성에 따라 연구되어져야 할 것이므로,
본 연구의 대상에서 제외하였다.
|
Fig. 3. Spot of Traffic Accident Occurrence (2010)
|
Table 1. Basic Analysis of Traffic Accident Frequency
|
Category
|
Total
|
Car to Person
|
Car to Car
|
Car Only
|
Traffic
Accident
Frequency
|
# of accidents
|
40,046
|
10,710
|
28,173
|
1,163
|
Avg.
|
95.58
|
25.81
|
67.89
|
2.80
|
Max.
|
578
|
168
|
432
|
27
|
Min.
|
8
|
0
|
1
|
0
|
분석대상인 서울시 415개 행정동의 교통사고 발생빈도(건)의 기초분석 결과 행정동별 1년간 평균 교통사고 발생건수5)는 95.58건이며, 가장 사고가 많이 발생한 행정동은 역삼1동으로 578건이며, 가장 사고가 적게 발생한 행정동은 사당5동과 신원동, 남현·인헌
통합동으로 각각 8건의 사고가 발생하였다.
|
Fig. 4. Traffic Accident Frequency by Administrative Zone
|
3.2 도로 및 토지이용 변수
도로 및 토지이용 변수는 도시개발 특성을 설명하는 변수이다. 도시개발이 많이 본 연구에서는 각 행정동마다 여건이 상이한 도로 및 토지이용 행태에 따라
교통사고가 어떻게 반응하는지를 알아보기 위하여 모형개발을 위한 변수로 선택하였다.
서울통계에서 제공하는 2010년 기준 전체 도로 연장은 8,142km이며, 도로면적은 82.47km2, 도로율6)은 22.02%이다. 도로 연장은 서울시에서 제공하는 도로에 대한 GIS기반 데이터로부터 행정동 경계면을 기준으로 잘려진 부분의 합으로 산출하였다.
그러나 해당 도로 자료는 line형태의 자료로 도로면적을 계산할 수 없으며, 도로율 역시 동별 시가화 면적을 정확하게 산출할 수 없어 본 연구에서는
도로연장만을 활용하기로 하였다.
서울시 교통안전시설정보에서 제공하는 교차로는 총 5,959개소이며, 행정동마다 평균 14.36개소의 교차로가 있으며, 교차로 개소수가 가장 많은 동은
여의도동이다. 서울시 버스전용차로의 총 연장은 190.557km이며, 이는 서울시 도로연장의 2%에 해당된다. 서울시 일방통행로 지정 연장은 590.245km이고,
이는 서울시 도로연장의 7%에 해당된다. 버스전용차로가 설치되어 있는 동은 45.8%에 해당하는 190개 동이며, 일방통행로는 79.8%에 해당하는
331개동에 지정되어 있다. 버스전용차로 설치비율과 일방통행로 설치비율은 행정동별 도로연장에 대한 버스전용차로 및 일방통행로 설치 연장이다.
서울시의 총 면적은 605.22km2이며, 가장 면적이 큰 동은 내곡동으로 12.69km2이며, 가장 면적이 작은 동은 숭인1동으로 0.23㎢이다. 본 연구에서는 행정동별 총 면적에서 녹지지역 면적을 제외한 면적을 개발지역 면적으로 정의하였다.
행정동별 개발지역 면적이 가장 넓은 동은 여의도동으로 2.87km2이며 개발면적이 가장 작은 동은 숭인1동이다. 지역의 토지이용에 따른 교통사고 예측 모형의 국외사례7)를 검토하면 가장 대표적인 변수로 토지이용형태별 대지면적(square miles)을 이용하고 있다. Park (2011a)는 수도권과 같이 개발이
지속적으로 이루어지는 지역의 경우 토지이용 변수를 고려하는 것은 매우 중요하다고 하였으며, 동일한 대지면적에서도 택지개발, 재건축 등을 통해 건축물의
높이, 너비 등에 따라 연상면적이 다양하게 변할 수 있는 특성이 있기 때문에 과세대장자료 DB화 사업에서 제시하고 있는 행정구역별 연상면적을 토지이용변수로
활용하여 교통사고와의 관계를 설명하고자 하였다.
Table 2. Basic Analysis of Road and Land Use Variables
|
Category
|
Total
|
Avg.
|
Max.
|
Min.
|
Road
|
Length of Road (km)
|
8,142
|
19.62
|
78.28
|
2.10
|
Road Area (km2)
|
82.47
|
-
|
-
|
-
|
Ratio of Road (%)
|
22.02
|
-
|
-
|
-
|
# of Intersection
|
5,959
|
14.36
|
92.00
|
-
|
Density of Intersection (#/km)
|
0.73
|
-
|
5.55
|
0
|
Exclusive Bus Lane Length (m)
|
190,577
|
459
|
3,713
|
0
|
Ratio of Bus Lane Installation (%)
|
0.02
|
-
|
0.36
|
-
|
One-way Street Length (m)
|
590,245
|
1,422
|
10,885
|
0
|
Ratio of One-way Street (%)
|
0.07
|
-
|
0.92
|
-
|
Land Use
|
Area (km2)
|
605.22
|
1.46
|
12.69
|
0.23
|
A Development Area (km2)
|
367.55
|
0.89
|
2.87
|
0.23
|
Total Building Floor Area (km2)
|
476.06
|
1.15
|
7.78
|
0.0002
|
본 연구에서는 보다 정확한 행정동별 연상면적을 고려하기 위하여 Jin et al. (2012)의 연구에서 활용한 건축물 용도별 총연면적을 토지이용
변수로 채택하였다. 이 자료는 도로명주소 관리시스템(KLIS-rn)의 건축물 데이터로부터 수집되었다.8) 도로명주소 관리시스템(KLIS-rn) 데이터는 건축물의 주용도, 지상층수, 지하층 수 등이 99%이상 명시되어 있어 분석의 정확성을 높이는데 유용하다(Jin
et al., 2012). 행정동별 건축물 총 연상면적이 가장 넓은 동 역시 여의도동으로 7.78km2이며, 가장 작은 동은 상계9동으로 0.0002km2이다.
|
Fig. 5. Road and Land Use Variables
|
3.3 사회경제변수
사회경제변수는 거시적 교통사고예측 모형 개발시 필수적으로 활용하는 변수로서, 기존의 많은 연구에서 사회․경제의 전반적인 변화는 교통사고와 관련이 있는
것으로 제시하였다. 지역 특성에 따라 사회․경제 규모가 상이할 것이고 이는 통행패턴에 영향을 미치며 다시 교통사고에 영향을 주기 때문에 지역특성을
설명할 수 있는 사회경제변수를 모형에 반영하여야 한다. 인구 및 종사자는 지역 특성을 나타내는 가장 기본적이면서도 중요한 요소이다. 이들 규모는 교통발생량과
밀접한 관련을 가지고 있다. 또한 교통발생량에 직접적으로 영향을 주는 요인은 경제적 측면이다. 지역의 경제적인 상태에 따라 활동성이 변화할 수 있고
이는 다시 교통발생량에 영향을 주기 때문이다.
본 연구에서는 인구, 종사자수 및 취업자수, 수용학생수와 승용차 등록 대수를 사회경제적 변수로 구성하였으며, 수도권교통본부에서 배포한 2010년 수단
OD에서 각 행정동별 공로(승용차, 버스, 택시) 통행 유입량과 유출량을 산출하여 변수로 구성하였다. 행정동별 통계값을 제공하는 인구를 제외한 사회경제변수는
2006년 가구통행실태조사 자료를 바탕으로 전수화된 자료이며 2010년 기준년도로 환산하여 산출하였다.
Table 3. Basic Analysis of Socioeconomic Variables
|
Category
|
Total
|
Avg.
|
Max.
|
Min.
|
# of Residents (#)
|
10,575,447
|
25,483
|
92,527
|
1,658
|
Population Density (#/km2)
|
17,474
|
-
|
65,311
|
508
|
# of Employees (#)
|
5,051,673
|
12,173
|
42,855
|
465
|
# of workers (#)
|
4,138,416
|
9,972
|
143,055
|
914
|
# of Registered Car (#)
|
2,695,142
|
6,494
|
22,221
|
304
|
# of Traffic Volume (trip/day)
|
26,756,769
|
64,474
|
465,679
|
8,733
|
|
Fig. 6. Socioeconomic Variables
|
2010년 기준 서울시 주민등록인구는 10,575,447명으로 가장 인구가 많은 동은 화곡1동으로 53,298명이 등록되어 있다. 또한, 본 연구에서
분석을 위한 자료 정리과정 중 일부 동의 통합에 따라 월계 1,2,3 통합동의 규모가 커져 인구와 취업자수, 승용차등록대수가 가장 많은 것으로 나타났다.
반면, 인구와 취업자수, 승용차 대수 모두 가장 작은 동은 소공동이다. 한편 종사자수는 역삼1동이 가장 많은 42,855명으로 서울시 평균 종사자수에
비해 3.5배나 많으며, 가장 적은 동은 숭인1동으로 나타났다. 공로통행량 기준으로는 여의도동의 공로통행량이 가장 많으며, 이촌2동의 공로통행량이
가장 적은 것으로 나타났다.
3.4 교통안전시설 및 정책변수
교통안전시설 및 정책 변수는 각 행정동마다 교통안전시설 및 정책 등의 여건이 상이함이 교통사고와 반응하는지 알아보기 위해 구성된 변수이다. 이러한
변수를 모형개발에 활용하기 위해서는 정량적인 규모산정이 필요하다. Markowitz et al. (2006)과 Pulugurtha and Pasupuleti
(2010)는 잔여시간표시기 설치 이후 교통사고가 감소한 것을 확인하였으며, Park (2011a)는 잔여시간표시기 설치율이 교통사고 빈도 감소영향으로
작용함을 거시적으로 판단하였다. 본 연구에서는 잔여시간표시기 설치율9)을 포함하여 음향신호기 설치율,10) 횡단보도예고표시 설치율,11) 과속방지턱 개소수, 어린이보호구역 개소수, 도로교통법 위반 단속건수를 교통안전시설 및 정책변수로 구성 하였다.
서울시 전역에 설치된 횡단보도는 2010년 말 기준 425,440개이며, 횡단보도 예고표시는 전체 횡단보도의 16.34%에 해당하는 69,521개가
서울시 전역에 설치되어 있다. 음향신호기는 2.42%인 10,292개, 잔여시간 표시기 역시 전체 횡단보도의 2.35%인 10,010개가 설치되어
있다. 어린이보호구역은 2010년 말 기준 동별 평균 4개소씩 지정되어 있고 서울시 전체 1,721개소가 설치되어 있으며, 중계 2.3동이 19개소로
가장 많이 설치되어 있다. 과속방지턱은 동별 평균 67개, 전체 27,705개가 설치되어 있다.
경찰에 의한 단속실적은 도로교통법 위반 단속 내용 중에서 직접적인 차량 운행과 관련된 단속유형12)만을 적용하였으며, 2010년 기준 자료를 활용한 다른 자료들과 달리 2007~2009년 3년간의 실적자료를 활용하였다. 경찰의 단속은 운전자들로
하여금 경각심을 유발시켜 운전행태에 변화를 주게 된다. 과거의 해당지역 단속실적을 통해 당해연도 운전자들의 행태를 간접적으로나마 모형에 반영하고자
과거 단속 자료를 활용하였다. 다만, 단속 실적 자료는 관할경찰서 단위로만 자료 취득이 가능하였다. 이를 행정동 전체에 반영하고자 상대적 비중(LQ
: Location Quotient)의 개념을 적용하여 서울시 평균보다 높은 지역은 1, 서울시 평균보다 낮은 동은 0으로 코딩하였다.
Table 4. Basic Analysis of Traffic Safety Facility & Policy Variables
|
Category
|
Total
|
Avg.
|
Max.
|
Min.
|
# of Crosswalks
|
425,440
|
1,025
|
15,175
|
17
|
# of Advance Crosswalk Warning Sign
|
69,521
|
168
|
1,277
|
3
|
# of Crosswalk Acoustic Signals
|
10,292
|
27
|
205
|
0
|
# of Remaining Time Signs on Crosswalk
|
10,010
|
26
|
134
|
0
|
# of School Zones
|
1,721
|
4
|
19
|
0
|
# of Speed Humps
|
27,705
|
67
|
574
|
0
|
Police Force
|
# of Clampdown
|
1,101,812
|
44,072
|
84,601
|
24,114
|
Relative Weight
|
High Relative Weight "Dong" : 261
Low Relative Weight "Dong" : 209
|
|
Fig. 7. Traffic Safety Facility & Policy Variable (Continue)
|
4. 도시교통사고 예측 모형 추정
4.1 모형추정을 위한 종속변수 선정
종속변수인 교통사고 발생빈도의 정규성 여부를 파악하여 선형 및 비선형 중 어떠한 특징을 갖는지 분석을 하기 위해 자료의 정규성을 파악할 수 있는 Kolmogorov-Smirnov검정을
수행하였다. 검정 결과 p-value가 0.05를 초과하지 못하는 것으로 나타나 95%의 신뢰수준에서 영가설을 기각함에 따라 사고발생빈도(건)는 정규분포를
따른다고 볼 수 없다.
: 모든 y에 대하여 F(y) = F정규분포(y)
: 적어도 한 y에 대하여 F(y) ≠ F정규분포(y)
이에 따라 교통사고 발생빈도에 대수를 취하여 변수변환(variable transformation)13)한 ln (교통사고 발생빈도)에 대해 Kolmogorov- Smirnov14) 검증을 수행하였다. 대수를 취한 교통사고 발생빈도는 p-value가 0.05를 초과한 것으로 나타나 95% 신뢰수준에서 영가설을 기각할 수 없으므로
ln (사고 발생빈도)는 정규분포를 따른다고 할 수 있다.
따라서 본 연구에서는 사고발생빈도의 대수변환값인 ln (사고발생빈도)를 종속변수로 하여 다중선형회귀분석을 적용하여 도시교통사고 예측모형을 개발하였다.
Table 5. Kolmogorov-Smirnov Test of # of Traffic Accidents
|
Classification
|
# of Traffic Accidents
|
ln (# of Traffic Accidents)
|
Normal Parameters
|
Mean
|
96.50
|
4.319
|
Most Extreme Differences
|
Absolute
|
0.128
|
0.053
|
Positive
|
0.128
|
0.035
|
Negative
|
-0.117
|
-0.053
|
Kolmogorov-Smirnov Z
|
2.615
|
1.084
|
Asymp. Sig.(2-tailed)
|
0.000
|
0.190
|
|
Fig. 8. Histogramm of ln (# of Traffic Accidents)
|
4.2 독립변수의 선정
상관은 두 변수가 어떻게 변해 가는지를 나타내는 것이며, 상관분석은 두 변수간에 상관관계가 존재하는지를 파악하고 상관관계의 정도를 측정하는 것이다(Sung,
2011). 즉, 하나의 변수가 다른 변수와 어느 정도 밀접한 관련성을 갖고 변화하는지를 알아보기 위하여 사용된다. 일반적으로 상관 분석에서는 다음과
같은 기준을 바탕으로 상관성을 판단하고 있다.
Table 6. Interpretation Standard of Correlation Coefficient
|
Range
|
Interpretation
|
±0.0~0.2
|
This correlation is very low.
|
±0.2~0.4
|
This correlation is low.
|
±0.4~0.6
|
There is a correlation.
|
±0.6~0.8
|
This correlation is high.
|
±0.8~1.0
|
This correlation is very high.
|
SUNG, T. J. , Easy Statistical Analysis Using SPS/AMOS, Hakjisa corp., 2011
|
본 연구에서는 사고발생에 영향을 미치는 변수를 선정하기 위하여 상관분석을 이용하였으며, 종속변수인 ln (교통사고 발생빈도(건))에 대한 각 독립변수와의
상관분석 결과는 다음과 같다. 사회경제적 지표인 종사자수과 공로통행량, 토지이용지표인 건축물의 총 연상면적, 교차로의 개소수 등 주로 사고의 노출(exposure)과
관련된 변수들이 가장 많은 영향을 미치는 것으로 나타났다. 또한, 횡단보도 설치율, 버스정류장수, 버스전용차로제 유무 등의 변수가 사고발생과 상관이
있는 것으로 나타났다.
본 연구에서는 0.2이상의 상관관계를 가지는 변수와 교통안전시설 및 정책적 변수를 교통사고의 특성규명 및 모형개발에 적용하고자 하였다. 그러나 횡단보도
예고표시 설치율과 경찰인력에 의한 단속실적과 같이 상관계수값은 다소 낮은 편이나 상관관계의 99%의 유의확률이 확보된 변수는 모형 개발에 포함하여
단계 선택법을 적용한 다중선형회귀분석을 수행하면서 다시한번 검토하였다.
한편, 상관계수를 바탕으로 다중 공선성을 검토해 본 결과 각 변수들 간의 다중공선성은 비슷한 개념의 변수들 사이에서 다중공선선 문제가 발생하였다.
예를 들어 인구와 세대, 65세 이상 고령자인구, 취업자수, 수용학생수, 종사자수 등은 공로 통행량과 선형의 관계가 있는 것으로 나타나 이들 변수를
한꺼번에 모형에 활용할 경우 정확한 추정이 되지 못한다.
다중공선성에 문제가 있다고 판단하는 경우는 회귀방정식의 설명계수가 높지만 통계적으로 유의미하지 않은 경우, 독립변수들의 회귀방정식에 추가로 투입되거나
제거될 때 회귀계수들의 수치가 매우 크게 변동되는 경우, 회귀계수들의 크기나 부호에 의심이 가는 경우 등이다. 그러나 이러한 특징은 다중공선성의 문제를
시사해줄 뿐 확인을 할 수는 없다. 이를 확인하기 위한 방법 중 하나가 앞서 실시한 상관분석 중 독립변수 간의 상관관계가 0.4 이상인지와 분산팽창인자(Variance
inflater)와 공차한계(Toletance)를 확인하였다.15) 분석 결과 독립변수가 각각 분산팽창인자는 10이하이고 공차한계는 0.1이상인 변수만을 취하여 모형의 독립변수로 활용하였다.
Table 7. Correlation Analysis Between ln (# of Traffic Accidents) and Independent
Variables
|
Independent variables
|
Pearson' correlation coefficient
|
p-value
|
X1
|
Generation(#)
|
0.326
|
0.000**
|
X2
|
# of Residents(#)
|
0.288
|
0.000**
|
X3
|
The aged(65+)(#)
|
0.235
|
0.000**
|
X4
|
Area(km2)
|
0.144
|
0.003**
|
X5
|
# of Registered Car(#)
|
0.293
|
0.000**
|
X6
|
# of workers(#)
|
0.257
|
0.000**
|
X7
|
# of Students in School(#)
|
0.167
|
0.001**
|
X8
|
# of Employees(#)
|
0.474
|
0.000**
|
X9
|
# of Traffic Volume(trip/day)
|
0.484
|
0.000**
|
X10
|
Length of Road(km)
|
0.443
|
0.000**
|
X11
|
Ratio of One-way Street(%)
|
0.117
|
0.017*
|
X12
|
Ratio of Bus Lane Installation(%)
|
0.305
|
0.000**
|
X13
|
A Development Area(km2)
|
0.471
|
0.000**
|
X14
|
Total Building Floor Area(km2)
|
0.481
|
0.000**
|
X15
|
# of Intersections (#)
|
0.620
|
0.000**
|
X16
|
Density of Intersections(#/km)
|
0.169
|
0.001**
|
X17
|
# of Crosswalks (#)
|
0.481
|
0.000**
|
X18
|
Density of Intersections(#/km)
|
0.264
|
0.000**
|
X19
|
Ratio of Advance Crosswalk Warning Signs (%)
|
-0.198
|
0.000**
|
X20
|
Ratio of Crosswalk Acoustic Signals(%)
|
0.071
|
0.146
|
X21
|
Ratio of Remaining Time Signs on Crosswalk(%)
|
0.058
|
0.236
|
X22
|
# of safety island(#)
|
0.308
|
0.000**
|
X23
|
# of School Zones(#)
|
0.207
|
0.000**
|
X24
|
# of bus stops(#)
|
0.531
|
0.000**
|
X25
|
# of Speed Humps(#)
|
0.191
|
0.000**
|
X26
|
Relative Weight of Clampdown by police force
|
-0.142
|
0.004**
|
Table 8. Traffic Accident Prediction Model by Multiple Linear Regression
|
Variable
|
Non-Standardized-
|
Standardized-
|
t-statistic
|
P-value
|
Collinearity statistics
|
Regression coefficient
|
Standard error
|
Tolerance
|
VIF
|
Constant
|
3.505***
|
0.083
|
|
42.470
|
0.000
|
|
|
Total Length of Roads
|
0.015***
|
0.003
|
0.217
|
5.593
|
0.000
|
0.702
|
1.424
|
Ratio of Exclusive Bus Lane (%)
|
4.878***
|
0.606
|
0.274
|
8.051
|
0.000
|
0.914
|
1.095
|
Total Building Floor Area (km2)
|
1.6E-7***
|
0.003
|
0.181
|
4.746
|
0.000
|
0.729
|
1.372
|
# of Intersections (#)
|
0.030***
|
0.004
|
0.385
|
8.353
|
0.000
|
0.496
|
2.016
|
# of Crosswalks (#)
|
7.7E-5***
|
0.000
|
0.136
|
3.063
|
0.002
|
0.533
|
1.878
|
Ratio of Advance Crosswalk Warning Signs (%)
|
-0.540**
|
0.222
|
-0.084
|
-2.428
|
0.016
|
0.871
|
1.147
|
# of Speed Humps (#)
|
-0.002***
|
0.000
|
-0.158
|
-4.056
|
0.000
|
0.697
|
1.435
|
# of clampdowns by police force
|
-0.153***
|
0.050
|
-0.101
|
-3.054
|
0.002
|
0.964
|
1.037
|
R2
|
0.572
|
Adjusted R2
|
0.563
|
*** p<.01, ** p<0.05
|
4.3 모형의 추정
ln (교통사고 발생빈도)를 종속변수로 하여 부분 F통계량 0.05를 기준으로 하는 단계 선택법을 적용하여 다중선형회귀분석을 수행한 결과 최종적으로
선택된 모형은 다음과 같다. 개발된 모형의 결정계수()는 0.572이며, 수정된 결정계수는 0.563으로 어느 정도 추정력을 확보하고 있다고 할 수 있다. 모형 개발에 앞서 수행한 상관분석에서 상관계수가
다소 낮았던 횡단보도 예고표시 설치율과 경찰인력에 의한 단속실적, 과속방지턱 개소수 등이 최종 모형에 포함되었다.
ln (교통사고 발생빈도) = 3.5050+0.015도로연장
+ 4.878버스전용차로설치비율
+ 1.6E-7건축물 총 연상면적
+ 0.030교차로개소수
+ 7.7E-5횡단보도개소수
- 0.540횡단보도예고표시설치율
- 0.002과속방지턱개소수
- 0.153경찰인력단속실적
(R2 : 0572, 수정된 R2 : 0.563)
표준화계수 추정결과를 살펴보면, 모형 전체에서 교차로 개소수가 ln (교통사고 발생건수)를 설명하는 영향력이 가장 크고, 과속방지턱 개소수는 사고감소에
미치는 영향력이 가장 큰 것을 알 수 있다. 8개의 변수 모두 t-통계량이 1.96이상으로, 유의수준 5%에서 각 변수가 종속변수를 추정하는데 통계적으로
유의한 것으로 볼 수 있다. 또한 다중공선성을 여부를 판별하기 위한 통계량인 분산팽창인자(VIF) 값도 모두 10이하로 1에 가까운 값을 나타내고
있으며, 공차한계 역시 0.1이상으로 다중공선성이 발생할 가능성이 크지 않음을 알 수 있다.
추정된 모형식에서 (+)의 회귀계수값을 갖는 변수인 도로연장, 교차로 개소수, 횡단보도 개소수, 건축물 총 연상면적 및 버스전용차로설치비율은 사고가
유발될 수 있는 환경 즉, 노출과 관련되어 있다. 또한, 음(-)의 회귀계수값을 갖는 변수는 횡단보도예고표시설치율과 과속방지턱 개소수, 경찰인력에
의한 도로교통법 단속실적의 상대적 비중도로 교통사고 발생빈도를 감소시키는 교통안전시설 및 정책 변수이다.
4.4 모형의 해석
4.4.1 사고노출환경변수
문헌고찰에서 살펴보았듯이 교통사고발생은 사고노출(Exposure)과 관계된 함수로 정의된다. 교통량, 도로연장, 인구, 주행거리 및 자동차 등록대수,
토지이용 등이 교통사고 발생과 연관이 높다는 것은 많은 선행 연구들을 통해 알려져 있다.
본 연구에서도 사고노출환경에 대해 인구, 공로통행량, 도로연장 등을 비롯하여 다양한 독립변수들을 고려하였으나 변수간 다중공선성 검토에 의해 최종적으로
채택된 변수들은 도로연장, 교차로 개소수, 횡단보도 개소수, 건축물 총 연상면적 및 버스전용차로설치비율이다. 개발된 모형에서 이들 변수들은 모두 양(+)의
회귀계수값을 가진다. 이러한 도로연장, 교차로 및 횡단보도 개소수, 건축물 총 연상면적과 버스전용차로 설치비율 등은 교통안전 정책가가 제어 할 수
없는 외생변수16)이다.
4.4.2 교통안전시설 및 정책변수
본 연구에서는 다양한 교통안전시설물 및 정책과 교통사고 발생빈도와의 관계를 살펴보고자 하였으나, 횡단보도예고표시 설치율과 과속방지턱 개소수, 경찰인력에
의한 도로교통법 단속실적의 상대적 비중 변수만이 모형에서 유의한 변수로 채택되었다.
횡단보도 예고표시는 횡단보도를 사전에 운전자가 인지함으로써 속도를 줄이고 횡단보도 앞에서 서행을 유도함으로써 보행자를 보호하기 위한 교통안전표지이다.
횡단보도 예고표시의 설치로 차량과 보행자와의 상충 가능성이 낮아지며, 사고 감소에 기여할 것으로 판단된다. 이러한 결과는 모형에서 횡단보도 예고표시
설치율의 회귀계수값이 음(-)의 값으로 나타났다.
과속방지턱은 속도저감을 유도하는 시설물로 교통사고 발생빈도의 감소요인으로 작용하는 변수인 것으로 나타났다. 과속방지턱이 설치되어 있으면 운전자가 감속을
하게 되고 유사시 신속한 대처가 가능함에 따라 교통사고 발생빈도를 낮출 수 있을 것으로 판단된다.
마지막으로, 경찰인력에 의한 단속실적은 서울시 평균 대비 높은 지역은 교통사고 발생빈도가 낮고, 낮은 지역은 교통사고 발생빈도가 높은 것으로 분석되었다.
이는 경찰에 의한 이러한 단속이 운전자들로 하여금 경각심을 유발시켜 운전행태에 변화를 주게 되며, 사고를 유발할 수 있는 원인을 감소시킬 수 있기
때문인 것으로 판단된다. 다만, 본 연구에서는 서울시 평균 대비 높으면 1, 낮으면 0으로 더미 변수화하여 모형에 반영함에 따라 다소 평균치에 근사한
단속실적을 지닌 지역들은 근소한 실적차이로 단속실적인 높은 지역이 될 수도 있고 낮은 지역이 될 수도 있음에 따라 이에 대한 세부적인 고려가 필요할
것이다.
5. 결론 및 향후 과제
본 연구에서는 서울시 행정동 단위의 소규모 지역 교통사고 예측모형을 개발하였으며, 모형 개발 결과 도로 및 토지이용 변수는 사고와 양(+)의 관계를
나타내는 사고노출환경에 해당되는 변수로 교통안전정책가가 제어 할 수 없는 외생 변수이나, 교통안전시설물 및 정책 변수는 교통안전 정책가에 의해 제어가
가능한 변수이며, 본 연구에서는 사고와 음(-)의 관계에 있는 것으로 추정되었다. 개발된 모형을 활용하여 횡단보도상에서 보행자 사고가 많이 나는 지역에
횡단보도 예고표시는 설치함으로써 기대할 수 있는 사고감소 효과와 생활도로 등 과속으로 인한 사고가 많은 지역에 과속방지턱을 설치함으로써 기대할 수
있는 사고감소 효과 등을 예측하여 지역특성에 맞게 교통사고를 줄일 수 있는 효율적인 대책을 발굴할 수 있을 것이다.
그러나 개발된 모형에서 채택된 설명변수들 중 교통안전시설물 및 정책 변수는 사고와 상관관계가 높지 않으며, 모형 자체가 제한된 설명변수로 사고 예측을
하고 있어 타 지역에 그대로 적용하기에는 한계가 있다. 따라서 타 지역에 적용시 해당 지역의 교통안전시설 물 및 정책 변수와 사고와의 상관관계를 살펴
모형개발 및 적용을 할 필요가 있다.
본 연구는 자료집계의 어려움으로 기존 연구에서 다루지 못했던 행정동이라는 소규모 지역을 분석단위로 하였다는 점과 미흡하기는 하나 교통안전 정책가가
제어할 수 있는 교통안전정책 변수를 모형에 추가 반영하여, 소규모 행정동 단위의 교통사고를 예측하는 방법과 이를 해석하여 정책적인 활용방안을 제시할
수 있다는 점에서 연구의 의의를 부여할 수 있다.
본 연구에서는 도시교통사고 예측모형 개발을 통해 소규모 지역단위의 교통사고 발생특성을 파악하고, 교통사고 영향인자를 찾아내어 안전한 도시환경 조성에
도움이 되는 정보를 발견하고자 하였다. 하지만 행정동 단위의 자료수집의 제약으로 본 연구에서 반영하지 못한 다음과 같은 사항을 향후 연구로 제안하고자
한다.
첫째, 모형의 적용성과 활용성 측면에서 변수의 추가반영이 필요하다. 전방신호등, 무단횡단방지시설, 중앙분리대 등과 같은 다양한 교통안전시설 및 정책변수와
도로폭원, 차로수, 도로의 기능별 연장 등의 도로시설 변수를 추가 반영할 필요가 있다.
둘째, 정책제어가능 변수에 대한 미시적인 분석을 수행하여야 할 것이다. 본 연구에서는 과속방지턱이 사고감소요인으로 작용함을 알아보았으나, 어느 정도
규모의 설치가 적정한 것인지 부적절한 위치의 과속방지턱이 오히려 사고증가요인으로 작용한 사례는 없는지에 관해서는 살펴보지 못하였다. 이러한 미시적인
부분에 대해서는 심도 깊은 연구가 필요한 것으로 판단된다.
1)2010년 기준 서울시 행정동은 424개이나, 다른 자료들과의 통합과정에서 최종 415개의 행정동으로 매칭하였다. 통합되어 조정된 행정동 내역은
다음과 같다.
2)LQ (Location Quotient)는 원래는 지역경제학에서 사용되는 입지계수로 어떤 지역의 산업에 대해 전국의 동일산업에 대한 상대적인 중요도를
측정하는 방법으로서 그 산업의 상대적인 특화정도를 나타내는 지수이다. 이 계수를 이용하면 한지역의 특화산업을 쉽게 분석할 수 있다.
Kim et al. (2010)는 이러한 LQ개념을 변수의 상대적 비중도로 해석하여 사회경제지표에 대해 비중도가 1보다 크면 1, 1보다 작으면 0으로
더미변수화하여 통행발생모형을 개발하였다.
비중도=, , : 사회경제지표(계층 및 전체),
: 해당지역, : 전체지역
Park (2011a) 역시 이 개념을 응용하여 CHAID (Chi-squared Automatic Interaction Detection) 분석을
통한 토지이용-사고빈도 유형분류를 위해 상대적 비중도를 계산하였다. 서울시 평균 교통사고빈도보다 높은 경우는 1, 평균보다 낮은 경우 0으로 유형을
구분하는 방식을 적용하였다.
3)2010년 지역별교통사고분석, 도로교통공단, 2011
4)올림픽대로, 강변북로, 내부순환로, 동부간선도로, 서부간선도로, 북부간선도로, 경인고속도로 시내구간, 경부고속도로 시내구간 등의 본선구간과 램프구간
5)교통사고 원 자료의 위치정보가 갖는 정확성의 한계로 동별 사고건수를 합산함에 있어 다소 오차가 존재할 수 있다.
6)도로율은 도로면적/시가화면적[=행정구역면적-(공원, 하천, 녹지…)]으로 행정구역면적에서 도로면적이 차지하는 비율이 아니므로 활용시 주의하여야
한다.
7)Wier (2009)의 연구에서는 상업, 공업, 주거의 면적으로 대지면적을 활용하였다.
8)도로명주소 관리시스템(KLS-rn)의 건축물 데이터는 지상층수, 지하층수의 구축률이 99%로 매우 높으나 주요 항목에 건축물 연면적은 제외되어
있어, 연면적 산정을 위해 연면적 = 건폐면적×(지상층수+지하층수)의 식을 도입하여 계산하였다.
9)잔여시간 표시기 설치율=잔여시간 표시기 설치대수/횡단보도 개소수
10)음향신호기 설치율=음향신호기 설치대수/횡단보도 개소수
11)횡단보도 예고표시 설치율=횡단보도 예고표시 개소수/횡단보도 개소수
12)본 연구에서 정의한 도로교통법 위반 단속 유형
- 제5조 신호 또는 지시 위반
- 제6조 통행의 금지 및 제한 위반
- 제13조1항 보.차도 구분 도로에서 차도통행위반
- 제13조2항 보도횡단전 일시정지 등 보도횡단방법위반
- 제13조3항 통행구분 위반
- 제13조5항 안전지대 진입금지위반
- 제14조2항 지정차로 위반
- 제14조4항 진로변경 위반
- 제15조3항 일반도로 전용차로 통행위반
- 제16조 통행 우선순위 위반
- 제17조 속도위반
- 제18조 유턴,횡단,후진등 금지위반
- 제23조 끼어들기 금지위반
- 제27조1항 횡단보도 통행 보행자 보호 위반(일시정지위반)
- 제28조2항 보행자전용도로통행금지위반
- 제28조3항 보행자전용도로통행방법위반
- 제48조 안전운전의무위반
- 제49조1항10호 운전 중 휴대용 전화 사용금지 위반
- 주취운전 중 44조1항 0.1이하
- 주취운전 중 44조1항 0.1이상
- 주취상태측정불응 44조2항
13)변수변환이란 변수를 적절히 변형하여 고유의 정보를 잃지 않는 범위에서 변형하는 작업을 말한다. 분포가 좌우로 치우쳐 있거나 높낮이가 다르다면
정규성을 가정하는 통계분석을 적용하기는 매우 위험하기 때문에, 이를 극복하기 위해 이러한 변수변환은 매우 필요하다. 대부분의 변수 변환은 고르게 분포(smoothing)하도록
만드는 역할을 한다(Ko, 2011). Jung and Hwang (2010)은 살인범죄의 원인에 대한 거시적 분석을 함에 있어 살인율의 정규성(normality)을
확인한 결과 그 분포가 비대칭(skewed, 편포)을 형성하는 것으로 나타나 대수변환(logarithmic transformation)을 실시하여
선형회귀식의 형태로 모형을 추정하였다. Lee et al. (2007)은 회귀분석에서 종속변수와 독립변수(들) 간의 관계가 선형이 아니라 비선형일
때 종속변수의 변환 필요성을 논의하였다. 이들은 종속변수가 정규적 혹은 대칭적으로 분포되지 않았을 때, 연구자는 Box and Cox (1964)의
역변환 공식을 이용하여 종속변수가 대칭적인 분포를 갖도록 변환시킬 필요가 있다고 하였다.
14)Kolmogorov-Smirnov 검증은 관측치들의 분포가 특정한 이론적 분포(예 :정규분포, 포아송분포)를 따르는지 조사하는 방법임. 많은
모수통계기법은 주어진 자료가 정규분포를 따른 다는 것을 가정으로 하며, Kolmogorov-Smirnov 검증은 이러한 가정을 검증하는데 유용하게
이용될 수 있음(Lee, 2010)
15)본 연구에서는 변수간 상관관계 정도를 Kang and Kim (2001)가 정의한 0.4이상의 기준을 적용하였으며 통계학자들은 분산팽창인자와
공차한계가 각각 10이상, 0.1이하인 경우 다중공선성에 문제가 있다고 판단하였다.
16)외생변수란 “어떤 경제 모델을 연립방정식 체계로 나타낼 수 있을 때 그 경제체계 외부에서 결정되는 변수(출처: 두산백과)”로 교통에서는 수요추정이나
교통현상을 모형화시키는 과정에서 교통체계내에서 도출되어 모형의 변수로 이용할 수 있는 변수, 반면에 교통체계 외에서 변수가 설정되어 수치가 외생적으로
주어지는 변수로 해석할 수 있다.