2.2.1 ์ด์ฐจ์ ๊ทผ ์์ ์ทจ๋
AI ์์๋ถ์ ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋ฐํ๊ธฐ ์ํด์๋ ์ด์ฐจ ์ ๋ก์์์ ์ดฌ์ํ ์ด์ฐจ์ ๊ทผ ์์์ด ํ์ํ๋ค. ์ ๋ก์ ์ด์ฐจ์ ๊ทผ ์์ ์ดฌ์์ ์ํด ๋จผ ๊ฑฐ๋ฆฌ์ ์ด์ฐจ ๊ฒ์ถ์ด
์ฉ์ดํ๋๋ก ๋ง์๋ ์ฆ๋ฅผ ํ์ฉํ์ฌ ์ถํ์ ์ฌ์ฉํ๊ฒ ๋ ๋ฌผ์ฒด ๊ฒ์ถ ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ์ ํ๋ จ๋ฐ์ดํฐ๋ฅผ ์ง๋ ์ด๋ฏธ์ง์์์์ ์ด์ฐจ ํฌ๊ธฐ์ ์ ์ฌํ ํฌ๊ธฐ๋ก ์ดฌ์๋๋๋ก
๊ดํ ์์คํ
์ ๊ตฌ์ฑํ์๋ค. Microsoft Common Objects in Context(MSCOCO)[6]๋ ๋ฌผ์ฒด ๊ฒ์ถ ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ์ ํ๋ จ์ ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ์
์ผ๋ก ์ฝ 20,000์ฅ์ ๋ค์ํ ์ด์ฐจ ๋ฐ์ดํฐ๋ฅผ ๋ณด์ ํ๋ค. ์ด์ฐจ์ ์ด๋ฏธ์ง ํฌ๊ธฐ๋ ํ๊ท ์ ์ผ๋ก
341x201์ด๋ฉฐ ์ด์ฐจ ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ ํ๊ท ์ด๋ฏธ์ง ํฌ๊ธฐ๋ 577x484๋ก ์ด๋ฏธ์ง์์ ์ฝ 60%์ ํญ๊ณผ 40% ๋์ด๋ฅผ ์ง๋
๋ค. ๋ณธ ์ฐ๊ตฌ์์์ ์ด์ฐจ ๊ฒ์ถ์
๋จผ ๊ฑฐ๋ฆฌ์ ์๋ ์ด์ฐจ๋ฅผ ๊ฒ์ถํ๋ ๊ฒ์ด ์ค์ํ๊ธฐ์ ์ด๋ฏธ์ง์์์ ์ด์ฐจ์ ํฌ๊ธฐ๊ฐ ํฌ๊ฒ ์ดฌ์๋์ด์ผ ํ๋ค.
๊ทธ๋ฆผ 3. ์์ ๋ ์ฆ์ ๋ํ ๊ธฐํ๊ดํ
Fig. 3. Geometrical Optics of Thin Lenses
์ (1)์ ๋ ์ฆ ๋ฐฉ์ ์ ์์ด๊ณ ์ (2)๋ ์ด๋ฏธ์ง ํ๋ฉด์์์ ๋ฌผ์ฒด ๋์ด ์์ด๋ค. do๋ ๋ฌผ์ฒด์ ๋ ์ฆ ์ฌ์ด์ ๊ฑฐ๋ฆฌ, di๋ ์ด๋ฏธ์ง์ ๋ ์ฆ ๊ฐ์ ๊ฑฐ๋ฆฌ, f๋ ๋ ์ฆ์ ์ด์ ๊ฑฐ๋ฆฌ,
hi๋ ์ด๋ฏธ์ง์์์์ ๋ฌผ์ฒด์ ๋์ด, ho๋ ๋ฌผ์ฒด์ ๋์ด์ด๋ค. ์๋ฒ ๋๋ ์์คํ
์์ ์ฃผ๋ก ์ฌ์ฉํ๋ 3ฮผm ํฝ์
ํฌ๊ธฐ์ธ CMOS
์ผ์์ ํ์ฌ ์ฌ์ฉ๋๋ ์ด์ ๊ฑฐ๋ฆฌ 3mm๋ฅผ ๊ฐ๋ ๋ ์ฆ๋ฅผ ์ฌ์ฉํ์๋ค. ๊ฑฐ๋ฆฌ๊ฐ 300m ๋จ์ด์ ธ ์๋ ํญ 2.9m, ๋์ด 4.1m์ธ KTX ์ฐจ๋์ ์ ๋ฉด ์ดฌ์์
do๋ 300m, di๋ 0.003m, ho๋ 4.1m๋ฅผ ์ (2)์ ๋์
์ hi๋ 41ฮผm์ด๋ฉฐ, ์ด๋ฅผ ํตํด ์ด๋ฏธ์ง์์์ ํญ 29ฮผm/3ฮผm = 10pixel, ๋์ด 41ฮผm/3ฮผm = 14pixel์ ์ฌ์ด์ฆ๋ก ์ด๋ฏธ์ง์์ ๋ณด์ด๊ฒ ๋๋ค. 1280x720 ์ด๋ฏธ์ง ํฌ๊ธฐ์์ ํญ 1%, ๋์ด 2%๋ฐ์ ์ฐจ์งํ์ง ์๊ธฐ์
๋งค์ฐ ์์ ์ด์ฐจ๋ฅผ ๊ฒ์ถํ๋๋ฐ ๋ถ๋ฆฌํ๋ค. ์ด์ ๊ฑฐ๋ฆฌ๊ฐ 100mm์ธ ๋ ์ฆ๋ฅผ ์ฌ์ฉํ๋ฉด 455pixel์ ๋์ด๋ฅผ ์ง๋๊ฒ ๋์ด ์ด๋ฏธ์ง ์์์ ์ฝ 63%์ ๋์ด๊ฐ
๋ํ๋๊ฒ ๋๊ณ , ์ด์ ๊ฑฐ๋ฆฌ๊ฐ 75mm์ธ ๋ ์ฆ๋ฅผ ์ฌ์ฉํ๋ฉด 341pixel ๋์ด๋ก ์ฝ 47.3%์ ๋์ด๋ก ์ ๊ทผํ๋ ์ด์ฐจ๊ฐ ์ด๋ฏธ์ง์์์ ๋ํ๋๋ค. ์ด์ ๊ฑฐ๋ฆฌ๊ฐ
50mm์ธ ๋ ์ฆ๋ฅผ ์ฌ์ฉ ์ 227pixel, 31.6% ๋์ด๊ฐ ๋๋ค. ๋ณธ ์ฐ๊ตฌ์์๋ 1/3 inches CMOS์ผ์์ ์ด์ ๊ฑฐ๋ฆฌ๊ฐ 50mm์ธ ๋ ์ฆ๋ฅผ
์ฌ์ฉํ์ฌ ๊ฑฐ๋ฆฌ๊ฐ ์ฝ 300m๊ฐ ๋๋ ๊ณณ์์ ์ดฌ์๋ ์ด์ฐจ์ ์ ๋ฉด ๋์ด ๋น์จ์ด ํด์๋๊ฐ HD์์ ์ฝ 31%๊ฐ ๋๋๋ก ํ์ฌ MSCOCO ๋ฐ์ดํฐ์
์ ์ด์ฐจ
๋์ด ๋น์จ์ด 40%์ ๋น์ทํ๊ฒ ๋๋๋ก ์ค์ ํ์๋ค. 75mm๋ 100mm ๋ ์ฆ๋ฅผ ์ฌ์ฉํ ์ ์ด์ฐจ๊ฐ ์ ๊ทผํ์์ ๋ ์ด์ฐจ๊ฐ ๋ถ๋ถ์ ์ผ๋ก ํ๋๋์ด ๊ฒ์ถ ์ฑ๋ฅ์ด
๋ฎ์์ง ์ ์๊ณ , ์๊ด ๋ฅ๋ ฅ์ด ์ ํํ์ฌ ์ผ๊ฐ์์ ๋ฐ๊ธฐ๊ฐ ๊ฐ์ํ๊ธฐ์ ์ ์ธํ์๋ค.
2.2.2 AI ์์๋ถ์ ๊ธฐ๋ฐ ๊ฐ์ฒด ์ธ์ ์๊ณ ๋ฆฌ์ฆ
๋ฌผ์ฒด ๊ฒ์ถ์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ ์ด์ฐจ์ ๊ทผ ๊ฒ์ถ ์๊ณ ๋ฆฌ์ฆ์ ๊ฒฝ์ฐ ์ด๋ฏธ์ง์์์ ์ด์ฐจ๊ฐ ๊ฒ์ถ๋์ง ์์ ์ ๊ฒ์ถ์จ์ด ๊ธ๊ฒฉํ ํ๋ฝํ๊ฒ ๋๋ ๋ฌธ์ ๊ฐ ์๊ณ , ํนํ ์ผ๊ฐ์
๊ฒฝ์ฐ ์ด์ฐจ์ ์ ์กฐ๋ฑ๊ณผ ์กฐ๋ ๋ถ์กฑ์ ์ํด ์ด์ฐจ ๊ฒ์ถ์ ํ์ํ ํน์ง์ ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ์ด ์ถ์ถํ๊ธฐ ์ด๋ ค์ ๋ฌผ์ฒด๋ฅผ ๊ฒ์ถํ๋ ์ฑ๋ฅ์ด ๋์ฑ ํ๋ฝํ๋ค. MSCOCO
๋ฐ์ดํฐ์
์ ๋์ ์ฑ๋ฅ์ ์ง๋ ์ค์๊ฐ ๋ฌผ์ฒด ๊ฒ์ถ์ด ๊ฐ๋ฅํ ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ์ ํ๊ท ์ ๋ฐ๋๋ 60% ๋ฏธ๋ง์ด๋ฏ๋ก, ๋ฌผ์ฒด๊ฐ ๊ฒ์ถ๋์ง ์๋ ์๊ฐ๋ค์ด ๋ค์ ์กด์ฌํ๋ฏ๋ก
๋ฌผ์ฒด๊ฐ ๊ฒ์ถ๋์ง ์๋๋ผ๋ ๋ฌผ์ฒด ์ ๊ทผ ๊ฒ์ถ์ด ๊ฐ๋ฅํ ์ด์ฐจ ๊ฒ์ถ ์๊ณ ๋ฆฌ์ฆ์ด ํ์ํ๋ค. ๊ทธ๋ฆผ 4๋ ๊ณ ๋ํ ์ฐ๊ตฌ๋ฅผ ํตํด ๊ฐ๋ฐ๋ ์ด์ฐจ์ ๊ทผ ๊ฒ์ถ AI ์์๋ถ์ ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋
์ ๋ํ๋ธ ๊ฒ์ผ๋ก ์๊ฐ์ฐจ๋ฅผ ๋๊ณ ์ดฌ์ํ ๊ณผ๊ฑฐ ์ ํ์ฌ ์ด๋ฏธ์ง๋ฅผ ์ด์ฉํ์ฌ ์ธ๊ณต์ง๋ฅ์
ํตํด ๊ดํ ํ๋ฆ์ ์ถ์ ํ๋ค. ํ์ฌ ์ด๋ฏธ์ง์์ ๋ฌผ์ฒด ๊ฒ์ถ ์ธ๊ณต์ง๋ฅ์ผ๋ก ์ด์ฐจ๋ฅผ ๊ฒ์ถ ๋ฐ ๋ ์ด๋๋ฅผ ์ด์ฉํ์ฌ ๋ณด์์ ์ผ๋ก ์์ง์ด๋ ๋ฌผ์ฒด ์ ๋ณด๋ฅผ ์ทจ๋ ํ ์ธ
๊ฐ์ง ์ ๋ณด๋ฅผ ์กฐํฉํด ์ด์ฐจ ์ ๊ทผ์ ํ๋จํ๋ค.
๊ทธ๋ฆผ 4. ์ด์ฐจ์ ๊ทผ ๊ฒ์ถ AI ์์๋ถ์ ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋
๋
Fig. 4. Concept Diagram of AI-Based Video Analysis Algorithm for Train Approach Detection
๊ดํ ํ๋ฆ(optical flow)์ ๋ ์ด๋ฏธ์ง์์ ๋์ผํ ๋ฌผ์ฒด ํน์ ํฝ์
์ ์์ง์์ ์ด๋ฏธ์ง์์์ ๋ํ๋ด๋ฉฐ, ์ด๋ฏธ์ง์ ๊ฐ ํฝ์
์์ ์์ง, ์ํ ๋ฐฉํฅ
๋ณํ๋์ ๊ฐ์ผ๋ก ๊ฐ์ง๋ค. ๊ทธ๋ฆผ 5๋ ๋ ์ด๋ฏธ์ง์์ ๋์ผํ ๋ฌผ์ฒด A์ ๋ํ ๊ดํ ํ๋ฆ์ ๋ํ๋ด๋ ์์๋ก, Frame 1์์ A๋ (x1, y1)์, Frame 2์์๋ (x2, y2)์
์์นํ๋ค. ๋ ์ด๋ฏธ์ง์์์ A์ ์์น ๋ณํ๋ Frame 1์ ๊ธฐ์ค์ผ๋ก (x2-x1, y2-y1)์ด๋ฉฐ, Frame 1์ A ์์น์ธ (x1, y1)์์
ํด๋น ๊ฐ์ ๊ฐ๋๋ก ๊ดํ ํ๋ฆ ๋ฐ์ดํฐ๊ฐ ๊ตฌ์ฑํ๋ค. ๊ทธ๋ฆผ 6์ ์์์์ ์งง์ ์๊ฐ ์ฐจ๋ก ์ถ์ถํ ๋ ์ด๋ฏธ์ง๋ฅผ ํ์ฉํด ๊ดํ ํ๋ฆ ์ถ์ ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋ธ ๊ฒ์ด๋ค. ์ค์ ๊ดํ ํ๋ฆ ๋ฐ์ดํฐ๋ 2์ฑ๋๋ก ๊ตฌ์ฑ๋์ด ์์ด 8-bit๋ณด๋ค
ํฐ ๊ฐ์ ์ง๋ ์ ์๊ธฐ ๋๋ฌธ์ ์ง์ ์ ์ผ๋ก ์๊ฐํํ ์ ์์ง๋ง ์ ๊ทํ ๋ฑ ๊ณผ์ ์ ๊ฑฐ์น ๋ค ์ด๋ ๋ฐฉํฅ๊ณผ ํฌ๊ธฐ์ ๋ฐ๋ผ ์์ ์ ์ฉํด ๊ฐ์ ์ ์ผ๋ก ๋ํ๋ธ๋ค.
๊ทธ๋ฆผ 7์ ์ดฌ์๋ ์ด์ฐจ์ ๊ทผ ์์์ ์ด์ฉํด ๊ดํ ํ๋ฆ์ ์ถ์ ํ ๊ฒฐ๊ณผ๋ก ์ ๊ทผ ์ด์ฐจ ์์ ์ ๋ ์ด๋ฏธ์ง ์ฌ์ด ๋ณํ๊ฐ ๊ฑฐ์ ์กด์ฌํ์ง ์์ ๋
ธ์ด์ฆ์ฒ๋ผ ๋ํ๋ฌ์ผ๋ฉฐ ์ด์ฐจ๊ฐ
์ ๊ทผ ์ ์ถ์ ๋ ๊ดํ ํ๋ฆ์ผ๋ก ์ด์ฐจ๊ฐ ์กด์ฌํ๊ณ ์์ง์ธ ์์น์ ๊ดํ ํ๋ฆ์ด ๋ช
ํํ ๊ตฌ๋ถ๋์ด ๋ํ๋ฌ๋ค.
๊ทธ๋ฆผ 5. ๊ดํ ํ๋ฆ ์์
Fig. 5. Example of Optical Flow
๊ทธ๋ฆผ 6. ์ค์ ์ด๋ฏธ์ง์ ๋ํ ๊ดํ ํ๋ฆ ์ถ์ ๊ฒฐ๊ณผ
Fig. 6. Optical Flow Estimation Results on Actual Images
๊ทธ๋ฆผ 7. ์ด์ฐจ ์ ๊ทผ ์ ๋ฌด์ ๋ฐ๋ฅธ ๊ดํ ํ๋ฆ ์ฐจ์ด
Fig. 7. Optical Flow Differences Depending on Train Approach
์ฌ์ธต ํ์ต ์ด์ ์ ๊ดํ ํ๋ฆ ์ถ์ ์ Lucas-Kanade ๋ฐฉ๋ฒ์ ์ด์ฉํด ์งํ๋์๋ค. Lucas-Kanade ๋ฐฉ๋ฒ์ ๋ ์ด๋ฏธ์ง ๊ฐ์ ํ๋ฆ์ด ๊ธฐ๋ณธ์ ์ผ๋ก
์ผ์ ํ๋ค๋ ๊ฐ์ ์ผ๋ก ์ฌ์ธต ํ์ต ์ด์ ์ ๊ดํ ํ๋ฆ์ ์ถ์ ํ์๋ค. ๋ ์ด๋ฏธ์ง ๊ฐ ๋ฐ๊ธฐ๊ฐ ๋ณํ์ง ์๊ณ , ์ด๋ค ํฝ์
์ฃผ๋ณ์ ์ ์ฌ ๋์์ ๊ฐ์ ํ ๊ฐ ์ด๋ฏธ์ง์
๋ชจ์๋ฆฌ, ๊ผญ์ง์ ๊ณผ ๊ฐ์ ๋๋๋ฌ์ง ํน์ง์ ์ถ์ถ ํ ๋ ์ด๋ฏธ์ง ๊ฐ ๋์ผ ์ ์ฌ๊ฒจ์ง๋ ํน์ง์ ์ง์ง์ด ์์น ์ฐจ์ด๋ฅผ ์ด์ฉํด ํ๋ฆ์ ์ถ์ ํ์๋ค. ๊ฐ ์ด๋ฏธ์ง์
๋ํ ์๋์ฐ๋ฅผ ์ ์ฉํด ์ฐ์ฐ์ ์งํํ๊ธฐ์ ์๋์ฐ ํฌ๊ธฐ๋ณด๋ค ํฐ ์์ง์์ ์ถ์ ํ๋ ๋ฐ ์คํจํ๊ณ , ์๋์ฐ ํฌ๊ธฐ๊ฐ ์ปค์ง ์ ์ฐ์ฐ๋์ด ์ฆ๊ฐํ๊ฒ ๋๋ค. ํน์ง์ ์
ํตํด ์ถ์ ํด ์ต๊ทผ ์ด๋ฏธ์ง ์ ์ญ์ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ ๋นํด ์ ํ๋๊ฐ ๋ฎ๋ค. ์ฌ์ธต ํ์ต ์ดํ, FlowNet[7]์ดํ ์๋ง์ ์ฐ๊ตฌ๊ฐ ์งํ๋๊ณ ์๋ค. FlowNet์ ์ฒ์์ผ๋ก ๊ดํ ํ๋ฆ ์ถ์ ์ ์ฌ์ธต ํ์ต์ ์ด์ฉํด ํด๊ฒฐํ ์ฑ๊ณต์ ์ธ ์ฐ๊ตฌ๋ก FlowNet 2.0[8]์ผ๋ก ๋ฐ์ ํ์๋ค. ๊ทธ๋ฆผ 8์ FlowNet์ ๋ ๊ฐ์ง ๊ตฌ์กฐ๋ฅผ ๋ํ๋ธ ๊ฒ์ด๋ค. FlowNetSimple์ FlowNetCorr์ ๋นํด ๊ฐ์ํ๋ ๊ตฌ์กฐ๋ก ๋ ์ด๋ฏธ์ง๋ฅผ ์ฑ๋ ๋ฐฉํฅ์ผ๋ก
ํฉ์ณ ๋ชจ๋ธ์ ์
๋ ฅ ํ, ํ๋์ convolutional block์์ ํน์ง์ ์ถ์ถํ๋ค. FlowNetCorr์ ๋ ์ด๋ฏธ์ง๋ฅผ ๋ ๊ฐ์ ๋
๋ฆฝ๋ convolutional
block์ ์
๋ ฅํด ํน์ง ์ถ์ถ ํ correlation layer๋ฅผ ํตํด ์ ๋ณด๋ฅผ ํตํฉํ๋ค. FlowNetSimple ๊ตฌ์กฐ์ ๊ฒฝ์ฐ ๋ชจ๋ธ์ ๊ฐ์ค์น๊ฐ ์๋์ ์ผ๋ก
์๊ธฐ์ ๋น ๋ฅธ ์๋๋ก ์ถ๋ก ํ ์ ์์ง๋ง ์
๋ ฅ ์ด๋ฏธ์ง ๊ฐ์ ์์ง์์ด ํด ๊ฒฝ์ฐ ๊ดํ ํ๋ฆ ์ถ์ ์ค์ฐจ๊ฐ ์ฆ๊ฐํ ์ ์๋ค. FlowNet 2.0์ FlowNetSimple๊ณผ
FlowNetCorr์ ํฉ์ณ ๋ชจ๋ ๋ณ์์ ์ต์ ํ๋ ๊ตฌ์กฐ๋ฅผ ๊ตฌ์ฑํ๋ค. ๊ทธ๋ฆผ 9๋ FlowNet2.0์ ๊ตฌ์กฐ๋ฅผ ๋ณด์ฌ์ค๋ค. ํฐ ๋ณ์ ๊ดํ ํ๋ฆ์ ๊ณ์ฐํ๊ธฐ ์ํด ์
๋ ฅ ์ด๋ฏธ์ง๋ฅผ FlowNetC์์ ์ฒ๋ฆฌ ํ ๋ค์ ์
๋ ฅ ์ด๋ฏธ์ง์ ์ํ
๋ ์ด๋ฏธ์ง, ๊ดํ ํ๋ฆ, ๋ฐ๊ธฐ ์๋ฌ๋ฅผ ํตํฉํด FlowNetS์ ์
๋ ฅํ๋ค. ์์ ๋ณ์ ๊ดํ ํ๋ฆ์ FlowNet-SD๋ฅผ ์ ์ฉ ํ ํฐ ๋ณ์, ์์ ๋ณ์
์ตํฉํด ์ต์ข
๊ดํ ํ๋ฆ์ ์ถ๋ ฅํ๋ค. ์ฌ๋ฌ FlowNet์ ์กฐํฉํด ํ๋์ ๋ชจ๋ธ๋ก ๊ตฌ์ฑํ๊ธฐ์ ์ฐ์ฐ์๋๋ ์ฝ 8๋ฐฐ๊ฐ ์ฆ๊ฐํ๋ฉฐ ๊ทธ๋ฆผ 10์ FlowNet๊ณผ FlowNet2.0 ๋น๊ต์ FlowNet2.0์ด ํจ์ฌ ๋ ๋์ ํ์ง์ ๋ณด์ฌ์ฃผ๋ ๊ฒ์ ํ์ธํ ์ ์๋ค.
๊ทธ๋ฆผ 8. FlowNetSimple(์๋ถ), FlowNetCorr(ํ๋ถ)[7]
Fig. 8. FlowNetSimple(Upper), FlowNetCorr(Lower)[7]
๊ทธ๋ฆผ 9. FlowNet 2.0 ๊ตฌ์กฐ[8]
Fig. 9. FlowNet 2.0 Structure[8]
๊ทธ๋ฆผ 10. FlowNet๊ณผ FlowNet 2.0 ๋น๊ต
Fig. 10. Comparison of FlowNet and FlowNet 2.0
์ฑ๋ฅ ์ ์ง ๋ฐ ํฅ์, ์ถ๋ก ์๋ ๊ฐ์์ ์ํด PWC-Net[9], LiteFlow[10] ๋ฑ ์ฐ๊ตฌ๊ฐ ์งํ ์ค์ด๋ค. PWC-Net์ ์ด๋ฏธ์ง ํผ๋ผ๋ฏธ๋์ ํน์ง ํผ๋ผ๋ฏธ๋๋ฅผ ์ด์ฉํด ์ฐ์ฐ๋์ ๊ฐ์์์ผฐ์ผ๋ฉฐ, LiteFlowNet์ ํน์ง ํผ๋ผ๋ฏธ๋์
๋ถ๋ฆฌ๋ ํ๋ฆ ์ถ๋ก ๋ฐ ํ๋ฆ ์ ๊ทํ๋ฅผ ๋์
ํ๋ค. ๊ทธ๋ฆผ 11๊ณผ ๊ทธ๋ฆผ 12๋ ๊ฐ๊ฐ PWC-Net์ ๋์ ๊ตฌ์กฐ์ LiteFlowNet์ ๋์ ๊ฐ๋
์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค.
๊ทธ๋ฆผ 11. PWC-Net[9]
Fig. 11. PWC-Net[9]
๊ทธ๋ฆผ 12. LiteFlowNet[10]
Fig. 12. LiteFlowNet[10]
๋ณธ ์ฐ๊ตฌ์์๋ ์ถ๋ก ์๋๊ฐ ๋น ๋ฅธ ๋ชจ๋ธ ์ค ์ต๊ทผ ๋ฐํํ FastFlowNet[11]์ ์ด์ฉํด ๊ดํ ํ๋ฆ์ ์ถ์ ํ์๋ค, FastFlowNet์ ์ด๋ฏธ์ง ํผ๋ผ๋ฏธ๋ ์ถ์ถ์ ์ํด head enhanced pooling pyramid(HEPP),
๊ฐ๋ฒผ์ด compact volume์ ๊ฑด์คํ๊ธฐ ์ํด center dense dilated correlation(CDDC) layer, ํ๋ฆ ์ถ์ ๊ฐ์์
ํจ์จ์ ์ธ shuffle block decoder(SBD)๋ฅผ ๊ฐ๊ฐ์ ํผ๋ผ๋ฏธ๋ ๋ ๋ฒจ์ ์ ์ฉํ์ฌ ์ ํ๋๋ฅผ ์ ์ง, ๋น ๋ฅธ ์ถ๋ก ์๋๋ฅผ ๋ฌ์ฑํ์๋ค. ํ 1์ ๋ค๋ฅธ ์ฐ๊ตฌ์ ๋น๊ตํ์ด๋ฉฐ, FastFlowNet์ ๊ฐ์ค์น ์์ ์ฐ์ฐ๋, ์ถ๋ก ์๊ฐ์ด ๊ฐ์ฅ ์์ ๊ฒ์ ํ์ธํ ์ ์๋ค.
๊ทธ๋ฆผ 13. FastFlowNet ๊ตฌ์กฐ[11]
Fig. 13. FastFlowNet Structure[11]
ํ 1 FastFlowNet ์ฑ๋ฅ ๋น๊ต[6]
Table 1 FastFlowNet Performance Comparison[6]
|
|
Sintel Clean Test (AEPE)
|
KITTI 2015 Test (Fl-all)
|
Params (M)
|
FLOPs (G)
|
Time (ms) 1080Ti
|
Time (ms) TX2
|
|
FlowNet2
|
4.16
|
11.48%
|
162.52
|
24836.4
|
116
|
1547
|
|
SPyNet
|
6.64
|
35.07%
|
1.20
|
149.8
|
50
|
918
|
|
PWC-Net
|
4.39
|
9.60%
|
8.75
|
90.8
|
34
|
485
|
|
LiteFlowNet
|
4.54
|
9.38%
|
5.37
|
163.5
|
55
|
907
|
|
FastFlowNet
|
4.89
|
11.22%
|
1.37
|
12.2
|
11
|
176
|
๋ฌผ์ฒด ๊ฒ์ถ AI ๋ชจ๋ธ์ธ YOLOv7[12]์ ๋งค์ฐ ๋์ ์ฑ๋ฅ, ์ถ๋ก ์๋๋ฅผ ๊ฐ์ง ๋ฌผ์ฒด ๊ฒ์ถ ๋ชจ๋ธ๋ก TensorRT์ ๊ฐ์ GPU ๊ฐ์ํ ์ง์ํ์ฌ ์๋ฒ ๋๋ ์์คํ
์์ ๋น ๋ฅธ ์ถ๋ก ์๋๋ฅผ ํ๋ณดํ
์ ์๋ค. ๋ณธ ์ฐ๊ตฌ์์๋ MSCOCO ๋ฐ์ดํฐ์
์ผ๋ก ํ๋ จ๋ YOLOv7 ๋ชจ๋ธ์ ์ฌ์ฉํ์๊ณ , YOLOv7์ ์ฝ 104 GFLOPs์ ์ฐ์ฐ๋์ด ์๊ตฌ๋๋ฉฐ,
MSCOCO val ๋ฐ์ดํฐ์ ๋ํด 51.2%์ ํ๊ท ์ ๋ฐ๋๋ฅผ ๋ํ๋ธ๋ค. ์ด์ ๋น์ทํ ์ฐ์ฐ๋์ ์ง๋ YOLOv7-L[8]์ ๊ฒฝ์ฐ 49%, PPTOLOE-L[9]์ 50.9%, YOLOR-CSP[10]๋ 50.8%๋ก YOLOv7์ ์ฑ๋ฅ์ด ์๋์ ์ผ๋ก ๋๋ค. YOLOv7-tiny-SiLU ๋ชจ๋ธ์ ๊ฒฝ์ฐ 13.8 GFLOPs์ ์ฐ์ฐ๋์ผ๋ก ๋งค์ฐ ๋น ๋ฅธ ์ถ๋ก
์๋๋ฅผ ๋ํ๋ด์ง๋ง 38.7%์ ํ๊ท ์ ๋ฐ๋๋ก ์ฑ๋ฅ์ ํ๊ฐ ๋ํ๋๋ค. ๊ทธ๋ฆผ 14์์๋ YOLOv7๊ณผ ๋ค๋ฅธ ๋ฌผ์ฒด ๊ฒ์ถ ๋ชจ๋ธ๊ณผ์ ์ฑ๋ฅ ๋ฐ ์๋๋ฅผ ๋์ํํ์ฌ ๋น๊ตํ๊ณ ์๋ค.
2.2.3 ๊ดํ ํ๋ฆ ์ถ์ AI ๋ชจ๋ธ ๊ธฐ๋ฐ ์ด์ฐจ ์ ๊ทผ ํ๋จ ์๊ณ ๋ฆฌ์ฆ
๊ทธ๋ฆผ 15๋ ์ด์ฐจ์ ๊ทผ ํ๋จ ์๊ณ ๋ฆฌ์ฆ ์์๋๋ก ์ด์ฐจ์ ๊ทผ ํ๋จ์ ์ํด ๊ดํ ํ๋ฆ(OF) ์ ๋ณด, ๋ฌผ์ฒด ๊ฒ์ถ ์ ๋ณด, ๋ ์ด๋ ์ ๋ณด๋ฅผ ์ด์ฉํ ์๊ณ ๋ฆฌ์ฆ์ ์์๋๋ฅผ ๋ํ๋ธ๋ค.
๊ณผ๊ฑฐ, ํ์ฌ ์ด๋ฏธ์ง๋ฅผ ์ฌ์ฉํด ์ถ์ ๋ ๊ดํ ํ๋ฆ์ ์ ๋๊ฐ์ด ๋ฌธํฑ๊ฐ T๋ฅผ ์ด๊ณผํ๊ณ , ์ด๋ ๊ฒ ์ด๊ณผํ ๊ดํ ํ๋ฆ์ ๋์ด๊ฐ A๋ฅผ ์ด๊ณผ ์ ์ด์ฐจ๊ฐ ์ ๊ทผ ์ค์ธ
๊ฒ์ผ๋ก ํ๋จํ๋ค. ๊ณผ๊ฑฐ, ํ์ฌ ์ด๋ฏธ์ง๋ ์ฝ 1์ด ์ฐจ์ด๋ฅผ ๋๊ณ ์์์์ ์ถ์ถ๋์๋ค. ๋ ์ด๋ฏธ์ง ๊ฐ ์ฐจ์ด๊ฐ ๊ฑฐ์ ์๋ ๊ฒฝ์ฐ ๋ฐ์ํ๋ ๊ดํ ํ๋ฆ ๋
ธ์ด์ฆ์
ํ๊ท ์ 0~2 ์ฌ์ด์ ์ ๋๊ฐ์ผ๋ก ๋ํ๋๋ฉฐ, ์ด์ฐจ๊ฐ ์ ๊ทผํ ๊ฒฝ์ฐ ๊ดํ ํ๋ฆ์ 20~200 ์ฌ์ด ์ ๋๊ฐ์ ๋ํ๋ด๊ธฐ์ ๊ดํ ํ๋ฆ ์ ๋๊ฐ์ ๋ํ ๋ฌธํฑ๊ฐ T๋
10์ผ๋ก ์ค์ , ๊ดํ ํ๋ฆ์ ๋์ด์ ๋ํ ๋ฌธํฑ๊ฐ A๋ฅผ 200์ผ๋ก ์ค์ ํ์ฌ ์์ ๋ฌผ์ฒด๋ ๋
ธ์ด์ฆ์ ๋ํ ์ํฅ์ ์ ์ธํ๋ค. ๋ฌผ์ฒด ๊ฒ์ถ ๋ชจ๋ธ์ ๊ดํ ํ๋ฆ์์
๊ฒ์ถ๋ ์์ง์์ด ์ด์ฐจ์ ์ํ ๊ฒ์ธ์ง ํ๋จํ๋ ๋ฐ ์ฌ์ฉ๋์๋ค. ์ด์ฐจ๊ฐ ์๋ ๋ค๋ฅธ ๋ฌผ์ฒด๊ฐ ๊ฒ์ถ๋ ๊ฒฝ์ฐ ํด๋น ๋ฌผ์ฒด์ ์์น์ ๋ํ ๊ดํ ํ๋ฆ ๊ฐ์ ์ ๊ฑฐํ
๋ค ๊ดํ ํ๋ฆ์ ์ฒ๋ฆฌํ์ฌ ๋ค๋ฅธ ๋ฌผ์ฒด์ ์ํฅ์ ์ ์ธํ๋ค. ์ด์ฐจ๊ฐ ๊ฒ์ถ๋ ์ ์ด์ฐจ์ ๊ทผ ์ต์ข
ํ๋จ์ ์ ์ฉํ์๊ณ , ๋ง์๋ ์ฆ๋ฅผ ์ฌ์ฉํ๊ฒ ๋๋ฉด์ ๋ ์ด๋ ์์ผ๋
์นด๋ฉ๋ผ๋ณด๋ค ๋์ด์ง๊ฒ ๋์์ง๋ง ์นด๋ฉ๋ผ ์ธ๋ถ ๋ฌผ์ฒด๊น์ง ๋ ์ด๋์ ๊ฒ์ถ๋๊ธฐ์ ๋ ์ด๋ ์์ผ๋ฅผ ์นด๋ฉ๋ผ ์์ผ์ ๋ง์ถฐ ์ ํํด์ผ ํ๋ค. ์์ ์ดฌ์์ ์ฌ์ฉํ ๊ดํ ์์คํ
์
50mm ๋ ์ฆ์ 1/3 inches ์ผ์๋ก ์ฝ 5.5ยฐ์ ์ํ ์์ผ๋ฅผ ์ง๋๊ณ ์ฌ๊ธฐ์ ๋ง์ถฐ ๋ ์ด๋์ ๊ฒ์ถ๋ ๋ฌผ์ฒด์ ์์น๊ฐ ์ข์ฐ 2.75ยฐ ์ด๊ณผ์ ์ด์ฐจ์ ๊ทผ
ํ๋จ์ ์ฌ์ฉํ์ง ์์๋ค.
๊ทธ๋ฆผ 14. YOLOv7๊ณผ ๋ค๋ฅธ ๋ชจ๋ธ๋ค์ ์ฑ๋ฅ ๋ฐ ์๋ ๋น๊ต[8]
Fig. 14. Comparison of YOLOv7 and Other Models in Terms of Performance and Speed[8]
๊ทธ๋ฆผ 15. ์ด์ฐจ ์ ๊ทผ ํ๋จ ์๊ณ ๋ฆฌ์ฆ ์์๋
Fig. 15. Flowchart of the Train Approach Detection Algorithm