-
1. 연구배경 및 목적
-
2. 선행연구 고찰
-
2.1 적정 프로브 차량 비율
-
2.2 프로브 차량과 일반 차량 위치의 확률구조
-
3. 방법론
-
3.1 변수 간 물리적 제약식 및 교통량의 포아송 분포 가정
-
3.2 로그우도함수(Log Likelihood Function) 구성
-
4. 사례연구
-
4.1 연구 범위
-
4.2 분석 결과
-
5. 결 론
1. 연구배경 및 목적
정보통신기술이 발달함에 따라 지점 검지기 이외의 교통정보를 수집하는 다양한 방법이 적용되고 있다. 특히 프로브 차량은 공간상 제약이 없으며 실시간
위치좌표와 속도를 수집한다는 점에서 교통류 분석에 널리 활용되고 있다. 근거리 전용 통신(Dedicated Short-Range Communication,
DSRC) 데이터(Chang and Yoon, 2017; Jeong and Jung, 2014a; Kim and Jang, 2013; Shin et al., 2014) 또는 버스정보시스템(Bus Information System, BIS) 데이터로부터(Jeong and Jung, 2014b; Lee, 2013) 통행속도를 산출하는 방법론들이 제시되었으며, 프로브 차량의 GPS 데이터를 활용하여 통행시간과(Chung and Choi, 1999; Quiroga and Bullock, 1998; Sim and Choi, 2006) 거시교통류 지표를(Kwon et al., 2019; Lee et al., 2020) 분석할 수 있었다. 그밖에 실시간 프로브 차량 데이터를 활용하여 보다 효율적으로 신호교차로를 운영하는 방법이 연구되었다(Feng et al., 2015; Guler et al., 2014).
프로브 차량 데이터로부터 전수화 된 교통량 및 밀도를 추정하는 것도 중요하게 다루어졌다(Ambühl and Menendez, 2016; Lu et al., 2013; Nagle and Gayah, 2013). 이때 프로브 차량 비율이 필요하게 되며, 이를 위해 기존 연구는 프로브 차량 비율을 지점 검지기를 통과한 프로브 차량 수와 지점 검지기에서 수집된
교통량의 비로 산정하였다(Geroliminis and Daganzo, 2008; Lu et al., 2013). 이러한 방법은 링크 내 지점 검지기 설치 여부와 무관하게 프로브 차량 모비율이 동질하다는 가정을 전제로 한다는 한계가 있었다(Du et al., 2016; Zheng and Liu, 2017). 따라서 지점 검지기 없이 프로브 차량 비율을 추정하는 방법의 필요성이 대두되었다.
대기행렬 내 프로브 차량과 일반 차량의 위치에 대한 확률구조를 활용하여 지점 검지기 없이 프로브 차량 비율을 추정하는 방법론이 제시되기 시작했다.
마지막 프로브 차량의 위치가 음이항 분포를 따른다는 점을 활용하여 프로브 차량 비율을 추정할 수 있었으며(Comert, 2016; Wong et al., 2019), 확률구조를 대기행렬 길이 추정에 적용한 뒤 방정식의 형태로 프로브 차량 비율을 도출하는 방법도 있었다(Zhao et al., 2019a; Zhao et al., 2019b). 그러나 다차로 접근로에서 서로 다른 차로에 위치하는 프로브 차량과 일반 차량의 선후는 정의할 수 없으므로 기존 연구의 방법론은 다차로 접근로에
적용할 수 없었다. 따라서 본 연구는 각 차로의 대기행렬 길이에 확률분포를 도입하고 다차로 접근로에서 프로브 차량과 일반 차량의 위치에 대한 확률구조를
기술하여 프로브 차량 비율을 추정하고자 한다.
2. 선행연구 고찰
2.1 적정 프로브 차량 비율
프로브 차량 비율에 관한 연구는 주로 적정 프로브 차량 비율을 제시하는 데 집중되었다. Kho(2002)는 적정 프로브 차량 대수 산정의 기준(criteria)으로 링크 별 필요 자료 수, 링크 별 허용 프로브 차량 비율, 링크에 프로브 차량이 없을
허용 확률의 세 가지를 제시하였다. 적정 프로브 차량 대수를 결정하는 방법으로는 링크 별 통행시간의 정규분포 적합 여부를 고려한 휴리스틱(heuristic)
방법론과(Chen and Chien, 2000) 적정 프로브 차량 비율을 혼잡상태, 신호운영, 데이터 수집 주기, 지표의 산포도에 관한 함수로 나타낸 방법론이 제시되었다(Argote-Cabañero et al., 2015). 또한, 프로브 차량과 일반 차량 통행시간의 차이 검정을 이용하여 적정 프로브 차량 비율을 결정할 수 있었다(Na et al., 2018).
이후, 다양한 교통변수와 도로구간에 대해 적정 프로브 차량 비율이 제시되었다. Lee and Lee(2002)는 단일 교차로 구간의 통행시간이 쌍봉분포(bimodal)임을 고려하여 적정 프로브 차량 대수를 제시하였고, Cheu et al.(2002)는 GPS 좌표 데이터의 오차를 고려하여 간선도로 통행시간 가공에 필요한 프로브 차량 대수를 산출하였다. 거시교통류 지표의 경우에도 프로브 차량 비율에
따른 해당 지표의 오차 분석을 통해 적정 프로브 차량 비율이 제시되었다(Dixit and Geroliminis, 2015; Shim et al., 2010). 또한, 유고상황시 통행시간 산출을 위해 25~45 %의 프로브 차량 비율이 필요한 것으로 분석되었다(Kim et al., 2019). 위 연구들은 적정 프로브 차량 비율을 산정하는 기준과 방법론을 제시하였고, 산출하고자 하는 교통변수와 도로조건에 따라 적정 프로브 차량 비율을
제시하였다. 그러나 현장에 설치된 검지체계로부터 프로브 차량 비율을 산출하고 그 값이 적정수준인지 확인하는 부분은 다루지 못하였다.
2.2 프로브 차량과 일반 차량 위치의 확률구조
프로브 차량과 일반 차량 위치의 확률구조는 대기행렬 길이 추정 연구에 먼저 적용되었다. Comert and Cetin(2009)은 주어진 프로브 차량 수와 대기행렬 길이에 대하여 마지막 프로브의 위치는 음이항 분포를 따른다는 점을 이용하여, 마지막 프로브의 위치가 주어졌을
때 대기행렬 길이의 조건부 기댓값을 유도하였다. 해당 방법론은 다양한 도착 교통량 확률분포를 수용할 수 있었다. Comert(2013)는 마지막 프로브 차량이 대기행렬에 도착한 시각을 추가로 활용하여 대기행렬 길이를 추정하였다. 도착 교통량의 확률분포와 프로브 차량 수의 확률분포를
포아송 분포로 가정하고, 마지막 프로브 차량이 도착한 시점에서 관측시간이 종료되기까지 프로브 차량이 도착하지 않았음을 이용하여 대기행렬 길이의 조건부
기댓값을 유도하였다.
이들은 대기행렬 이론(Queueing Theory) 또는 충격파 이론에 기반하지 않고, 프로브 차량과 일반 차량의 위치에 관한 확률구조를 활용하여
대기행렬 길이를 추정하였다. 이 과정에서 프로브 차량 비율이 선험적으로 필요함이 지적됨에 따라 프로브 차량 비율을 추정하는 연구가 수행되기 시작하였다.
Comert(2016)는 프로브 차량 대수, 마지막 프로브 차량 위치, 마지막 프로브 차량 도착시각의 세 가지 데이터 속성의 조합에 따라 프로브 차량 비율과 차량 도착류율을
추정하였다. Wong et al.(2019)은 프로브 차량의 마지막 위치가 음이항 분포이며, 프로브 차량 비율 추정량이 조건부로 베르누이 분포를 따른다는 점을 이용하여 불편성(unbiasedness)을
만족하는 추정 방법을 제시하였다. 프로브 차량과 일반 차량 위치의 확률구조로부터 대기행렬 길이 추정량을 유도한 뒤, 이를 활용한 방정식으로부터 프로브
차량 비율을 산출한 연구도 있었다(Zhao et al., 2019a; Zhao et al., 2019b).
위 연구들은 지점 검지기 없이 프로브 차량 데이터만으로 프로브 차량 비율을 추정하였으나, 다차로 접근로에서는 서로 다른 차로에 위치하는 프로브 차량과
일반 차량의 선후를 정의할 수 없으므로 음이항 분포를 비롯한 기존 연구의 확률구조는 다차로 접근로에서 적용될 수 없는 한계점이 있었다. 따라서 기존
연구와 다른 방법으로 다차로 접근로에 대한 확률구조를 기술하여 프로브 차량 비율을 추정할 필요가 있다.
3. 방법론
3.1 변수 간 물리적 제약식 및 교통량의 포아송 분포 가정
프로브 차량 데이터는 차로 식별이 쉽지 않지만, 프로브 차량의 정지선으로부터 위치는 파악할 수 있다.
번째 위치에 존재하는 프로브 차량의 대수를
라고 하고, 이를 행벡터로 나타낸 것을
라고 하자.
(
: 접근로 길이,
: 0 이상의 정수 집합)
대기행렬 내 프로브 차량의 위치를 행렬
로 나타내자.
의 원소
는
차로
번째 위치에 프로브 차량이 존재하면 1, 그렇지 않으면 0의 값을 나타낸다.
(
: 접근로 차로 수)
주어진 관측
에 대해 존재할 수 있는 모든
를 모두 고려하고자 한다(Eq. (3)).
(
: 원소가 모두 1인 열벡터)
예를 들어 Fig. 1과 같이
,
,
로 주어졌을 때 가능한
는
,
,
, …,
으로 9가지이다.
Fig. 1.
Probe Location in Queue
차로 대기행렬 길이를
라 하고, 이를 열벡터로 나타낸 것을
라고 하자.
차로
번째 위치에 프로브 차량이 존재한다고 가정하는 경우 해당 차로의 대기행렬
는 적어도
번째 위치의 해당 프로브 차량을 포함하여야 한다. 예를 들어 Fig. 1은 2차로 두 번째 칸에 프로브 차량의 존재를 가정하므로(
),
인 것은 논리적 모순이다. 따라서 제약식 Eq. (5)가 성립한다.
대기행렬 내 차량 대수를
이라 하자.
은 차로별 대기행렬 길이의 합이다.
교통량의 집계시간을 신호주기와 일치시키는 경우 교통량을 포아송 분포로 가정할 수 있고(Gerlough and Huber, 1975), 기존 연구도 교통량의 포아송 분포를 가정하였다(Comert, 2013; Comert, 2016; Zheng and Liu, 2017). 따라서 본 연구도
을 포아송 분포로 가정하였다.
(
: 도착교통류율(Arrival Flow Rate),
: 적색신호(Red Time Interval))
대기행렬 내 프로브 차량 대수를
이라 하자.
은
의 모든 원소의 합이며 동시에
의 모든 원소의 합이다.
3.2 로그우도함수(Log Likelihood Function) 구성
우도함수를 도출하기 위해 주어진
가 관측될 확률을 모수
와
에 대한 함수로 나타내야 한다. 특정
를 관측할 확률은 모든 가능한
의 확률의 합과 같다.
전확률의 법칙(Law of Total Probability)에 따라
는 Eq. (10)으로 전개된다.
는 Eq. (5)를 만족해야 한다.
은 Eq. (8a)에 의해
에 종속이다.
은 Eq. (6)에 의해
에 종속이다. 따라서 Eq. (10)을 Eq. (11)로 정리할 수 있다.
조건부확률의 정의에 따라 Eq. (12)가 성립한다.
대기차량
대 중에서 프로브 차량
대를 선택하는 경우의 수는
이며, 주어진
에 대해 선택의 결과는 하나의
를 나타낸다.
의 각 경우가 나타날 확률은 동등하다고 볼 수 있으므로 Eq. (13)이 성립한다.
가 Eq. (5)를 만족한다는 전제하에서,
은 대기차량
대 중에서 프로브 차량이
대 존재할 확률을 의미한다. 이 확률은
에 무관하며, 이항분포에 해당한다.
은 대기차량대수
이 주어졌을 때 각 차로의 대기행렬 길이의 확률분포를 의미한다. 개별 차량이 각 차로를 선택하는 확률이
로 동일하고 독립이라 가정하면
를 다항분포로 나타낼 수 있다. 다항분포의 도입을 통해, 가령
일 때,
일 확률이 희박하고
일 확률이 높음을 표현할 수 있다.
Eqs. (13), (14), (15) and (7b)에 의해
는 Eq. (16)으로 전개된다.
따라서
회 관측에 대한 우도함수
와 로그우도함수
는 Eq. (17)로 구성된다.
최우추정법은 주어진 표본에 대해 로그우도함수를 최대화시키는
와
를 최우추정량으로 제시한다.
(
: 포화교통류율, Saturation Flow Rate)
4. 사례연구
4.1 연구 범위
본 연구는 Fig. 2와 같이 서울특별시 강남구 대치역 서향 접근로의 직진 이동류를 공간적 범위로 설정하였다. 해당 구간은 간선도로인 남부순환로이며, 직진 이동류에는 4개
차로가 할당되어 있다. 이곳은 버스정류장이나 택시정류장이 없고, 유출입부가 적으며, 보도에 가드레일이 설치되어있어 노변마찰이 적다. 시간적 범위는
2018년 11월 22일 목요일과 23일 금요일 오전첨두를 포함하는 07:00~10:30으로 정하였다.
Fig. 2.
Spatial Scope (Daechi Subway Station Intersection, Seoul)
대기행렬 내 정지한 프로브 차량의 위치를 얻기 위해 서울시 택시 디지털 운행기록계(Digital TachoGraph, DTG) 데이터를 활용하였다.
택시 DTG 데이터는 택시 ID, 경위도 좌표, 일시, 순간 속도, 승객탑승여부 등으로 구성되며, 합리적인 운전 행태를 반영하기 위해 승객이 탑승한
상태의 데이터만을 필터링하여 총 362대의 데이터를 분석에 활용하였다. 기존 연구들은 정지선으로부터 프로브 차량까지 거리를 대(Vehicle) 단위로
변환할 때 주로 유효차량길이(Effective Vehicle Length)를 적용하였다. 본 연구는 유효차량길이를 산정하기 위해 최대 대기행렬 길이와
해당 차로의 차량 대수가 같이 기록된 현장조사 자료를 구득하였다. 프로브 차량 비율의 관측값은 수집된 프로브 차량 대수와 관측된 일반 차량의 대수로부터
산출할 수 있으며, 이를 위해 교차로 통과교통량 현장조사 자료를 구득하였다.
4.2 분석 결과
최대 대기행렬 자료에서 이상치를 제거한 후 이를 회귀분석하여 유효차량길이를 7.67 m로 산정하였다(Fig. 3). 이 값을 기준으로 프로브 차량의 위치를 대 단위로 나타내었다. 접근로의 길이의 대 단위는
(대)로 산정하였다.
Fig. 3.
Maximum Queue Length and the Number of Vehicles in the Queue
3.2절에서 구성된 로그우도함수의 전형적인 형태는 Fig. 4와 같다. 해당 예시에서는
근방에서 최적해가 얻어질 것으로 보인다. 최우추정량을 도출하기 위해 격자 탐색(Grid Search) 방법을 활용하여 로그우도함수의 최적해를 도출하였다.
Fig. 4.
Contour of Log Likelihood Function
현장조사 데이터를 통해 산출한 프로브 차량 비율 관측치와 최우추정법을 통해 얻은 추정치를 Figs. 5 and 6에 도시하였다. 주기마다 프로브 차량 비율 관측치가 심하게 변동함에도 불구하고 추정치는 관측치의 경향을 따라가는 것으로 나타났다. 분석시간 10분
및 30분 단위에서 추정치가 관측치보다 과소추정되는 경향이 있었으나, 관측치의 변동이 비교적 평활화되고 추정치와 관측치의 증감 패턴이 거의 일치하게
나타났다.
Fig. 5.
Probe Vehicle Penetration Rate Estimation Results (2018/11/22 07:00-10:30)
Fig. 6.
Probe Vehicle Penetration Rate Estimation Results (2018/11/23 07:00~10:30)
추정의 정확도를 수치로 확인하기 위해 Table 1에 평균절대오차(Mean Absolute Error, MAE), 평균절대백분율오차(Mean Absolute Percentage Error, MAPE),
평균제곱근오차(Root Mean Square Error, RMSE), 등가계수(Equality Coefficient)의 네 가지 지표를 산출하였다.
여기서 등가계수는 Eq. (19)로 정의되며(Jang and Kim, 2011; Punzo and Simonelli, 2005; Theil, 1958), 관측치와 추정치 간 패턴의 유사성을 확인하는 데 주로 활용되고 1에 가까울수록 두 패턴이 일치함을 의미한다.
(
: 추정치,
: 관측치,
: 자료의 개수)
Table 1.
Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE), Root Mean Square
Error (RMSE), and Equality Coefficients
Date
|
Time Period
|
MAE (%p)
|
MAPE (%)
|
RMSE (%p)
|
Equality Coefficient
|
2018/11/22
|
Cycle length
|
0.99
|
-
|
1.50
|
0.828
|
10 min
|
1.05
|
26.93
|
1.20
|
0.942
|
30 min
|
1.18
|
30.38
|
1.27
|
0.811
|
2018/11/23
|
Cycle length
|
1.07
|
-
|
1.55
|
0.813
|
10 min
|
1.02
|
26.74
|
1.19
|
0.823
|
30 min
|
1.08
|
29.71
|
1.16
|
0.815
|
2018/11/22
-11/23
|
Cycle length
|
1.03
|
-
|
1.52
|
0.821
|
10 min
|
1.03
|
26.83
|
1.19
|
0.826
|
30 min
|
1.13
|
30.04
|
1.21
|
0.813
|
11월 22일과 23일의 추정 정확도는 비슷한 수준인 것으로 나타났다. 세 가지 분석시간 중 신호주기 단위 추정에서 RMSE가 가장 크게 산출되었으며,
이는 관측치가 갑자기 증가하여 추정치와 큰 차이가 발생한 부분에 의해 RMSE가 특히 증가하였기 때문이다. 30분 단위 추정에서는 관측치와 추정치
사이에 일정한 이격이 있어서 MAE와 MAPE가 비교적 크게 산출되었다. 모든 경우에서 등가계수가 기존 연구와 비슷한 수준인 0.8~0.9 내외로
도출되었으므로(Han, 2016; Kim, 2011; Park and Park, 2013), 비록 추정치와 관측치 사이 이격은 있으나 추정치가 관측치의 경향을 따라가는 것으로 보인다. 향후 보정계수를 도입하는 등의 방법으로 오차를 개선할
여지가 있다.
5. 결 론
프로브 차량 데이터로부터 전수화 된 교통량 및 밀도를 추정할 때 프로브 차량 비율이 필요함에 따라 지점 검지기 없이 프로브 차량 비율을 산출하는 방법의
필요성이 대두되었다. 이를 위해 프로브 차량과 일반 차량의 위치에 대한 확률구조를 활용하여 프로브 차량 비율을 추정하는 방법론이 연구되었다. 그러나
기존 연구의 방법론은 프로브 차량과 일반 차량의 순서에 기반하여 확률구조가 기술되기 때문에 다차로 접근로에는 적용할 수 없다는 한계점이 있었다. 이에
본 연구는 각 차로의 대기행렬 길이가 다항분포를 따른다는 가정을 도입하고 다차로 접근로에서 프로브 차량과 일반 차량의 위치에 대한 확률구조를 표현하여
프로브 차량 비율을 추정하고자 하였다. 사례연구 결과 추정치와 관측치 사이에 이격이 존재하였으나, 추정치와 관측치의 경향이 유사한 것으로 분석되었다.
본 방법론은 최우추정법에 기반하므로 분포 가정을 교체하여도 동일한 방법론을 적용할 수 있다. 기존 연구처럼 도착 교통량의 분포를 기하분포와 음이항분포
등으로 교체하여 분석할 수 있으며, 차로 별 대기행렬 길이의 분포도 다항분포 가정 대신 보다 현실적인 분포 가정을 도입하는 것도 가능하다.
사례연구 결과에서 추정치가 관측치보다 과소추정되는 경향이 있으므로 향후 과소추정의 원인을 파악하고 오차를 감소시킬 필요가 있다. 과소추정은 계통 오차(systematic
error)이므로 임의 오차(random error)에 비해 개선이 용이하다. 현장조사를 통해 보다 정확한 유효차량길이, 접근로 길이, 유효녹색시간
및 적색시간을 적용하거나, 보정계수를 도입하여 오차를 개선할 여지가 있다. 또한, 사례연구에서 측정된 프로브 차량 비율이 기존 연구에서 통상적으로
제시하였던 적정 프로브 비율에 비해 낮았으므로, 향후 본 방법론의 추정 정확도가 낮은 프로브 차량 비율에서도 강건(robust)한지 확인할 필요가
있다.
본 연구는 다차로 접근로에서 지점 검지기 없이 프로브 차량 비율을 추정하였음에 의의가 있다. 본 연구가 제시한 방법론은 전수화 된 교통변수를 산출하는
데 유용하며, 지점 검지기가 부족한 도시부 도로망에서 시각과 링크에 따른 프로브 차량 비율의 동질성을 검증하는 데 활용될 수 있을 것으로 기대된다.