๋ฐ๊ฒฝ๊ท
(Kyung-Kyu Park)
1
์ต์์ค
(Won-Jun Choi)
2
์ด์ํ
(Sang-Hyun Lee)
3
ํ์์ฌ
(Seok-Jae Heo)
4โ
-
ํ์ํ์, ๋จ๊ตญ๋ํ๊ต ๊ฑด์ถ๊ณตํ๊ณผ ์์ฌ๊ณผ์
-
์ ํ์, ๋จ๊ตญ๋ํ๊ต ๊ฑด์ถ๊ณตํ๊ณผ ๋ฐ์ฌ
-
์ ํ์, ๋จ๊ตญ๋ํ๊ต ๊ฑด์ถ๊ณตํ๊ณผ ๊ต์
-
์ ํ์, ๋จ๊ตญ๋ํ๊ต ๊ฑด์ถ๊ณตํ๊ณผ ์ฐ๊ตฌ๊ต์, ๊ต์ ์ ์
Copyright ยฉ The Korea Institute for Structural Maintenance and Inspection
ํค์๋
๊ตฌ์กฐ๋๋ฉด ์๋ํ, ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ, ๊ตฌ์กฐํ ํ๋กฌํํธ, ํ๋กฌํํธ ์์ง๋์ด๋ง, ๊ฑด์ถ๊ตฌ์กฐ์ค๊ณ
Key words
Structural drawing automation, Large language model (LLM), Structured prompt, Prompt engineering, Architectural structural design
1. ์ ๋ก
๊ฑด์ถ ๊ตฌ์กฐ๊ณตํ์ ๊ตฌ์กฐ๋ฌผ์ ์์ ์ฑ๊ณผ ๊ฒฝ์ ์ฑ์ ๋์์ ๋ฌ์ฑํด์ผ ํ๋ ๊ณ ๋๋ ๋ถ์ผ๋ก, ํนํ ํ๋ก์ ํธ์ ๋ํํโ
๋ณต์กํ์ ๋ฐ๋ผ ๊ตฌ์กฐ๋๋ฉด ์์ฑ ์์
์ ๋ฐ๋ณต์ฑ๊ณผ
๋นํจ์จ์ฑ์ด ์ฌํ๋๊ณ ์๋ค. ์ค์ ๋ก ๊ตญ๋ด ๋ํ ๊ณต๊ณต ๊ฑด์ถ๋ฌผ์ ์ค์์ค๊ณ ๋จ๊ณ์์ ๊ตฌ์กฐ ์ค๊ณ์๋ง ํ๊ท 11โผ15๊ฐ์์ด ์์๋๋ฉฐ, ํ์ํ ๋๋ฉด ์ ์ฆ๊ฐ์
๋ฐ๋ผ ๋ฐ๋ณต ์์
๋๋ ๊ธ๊ฒฉํ ์ฆ๊ฐํ๋ค. ์ด๋ ์ค๊ณ ๊ธฐ๊ฐ ์ง์ฐ๊ณผ ๋น์ฉ ์ฆ๊ฐ ์ ์ฃผ์ ์์ธ์ผ๋ก ์ง์ ๋๊ณ ์์ผ๋ฉฐ ๊ธฐ์กด์ ์ ํต์ CAD ๊ธฐ๋ฐ ์์
๋ฐฉ์์ ์ ๋ฐํ
๋๋ฉด ํํ์๋ ์ ํฉํ์ง๋ง, ๋ฐ๋ณต์ ๋๋ฉด ์์ฑ์ด๋ ๋ณต์กํ ์ ์ฝ์กฐ๊ฑด ์๋ํ ์ธก๋ฉด์์๋ ๋ณธ์ง์ ์ธ ํ๊ณ๋ฅผ ์ง๋๋ค. ์ต๊ทผ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๋ฐ์ ๊ณผ
ํจ๊ป ๊ฑด์ถโ
๊ตฌ์กฐ ๋ถ์ผ์์๋ ์ค๊ณ ์๋ํ ์ฐ๊ตฌ๊ฐ ํ๋ฐํ ์งํ๋๊ณ ์๋ค. Du et al.(2024)๋ ๋ค์ค ์์ด์ ํธ LLM ํ๋ ์์ํฌ๋ฅผ ํ์ฉํ Text2BIM ๊ธฐ๋ฒ์ ์ ์ํ์ฌ ์์ฐ์ด๋ก๋ถํฐ BIM ๋ชจ๋ธ์ ์์ฑํ๋ ๊ฐ๋ฅ์ฑ์ ๋ณด์์ผ๋ฉฐ, Khan et
al. (2024) ์ฐ๊ตฌ์์๋ ํ๋ผ๋ฉํธ๋ฆญ CAD ๋ชจ๋ธ ์๋ ์์ฑ์ ์๋ํ์๋ค. ๋ํ ๊ตญ๋ด์์๋ BIM ๊ธฐ๋ฐ ๊ตฌ์กฐ์ค๊ณ ์๋ํ๋ฅผ ๋ชจ์ํ ์ฐ๊ตฌ๊ฐ ๋ณด๊ณ ๋์๋ค(Mun, 2024; Ma & Lee, 2024). ๊ทธ๋ฌ๋ ์ด๋ฌํ ์ ๊ทผ๋ฒ๋ค์ ์์คํ
๊ตฌ์กฐ์ ๋ณต์ก์ฑ๊ณผ ๋ฒ์ฉ์ ์ค๊ณ์ ์ด์ ์ ๋ง์ถ๊ณ ์๊ธฐ ๋๋ฌธ์, ํ๊ตญ์ ๊ตฌ์กฐ์ค๊ณ ๊ธฐ์ค๊ณผ
์ค๋ฌด ๊ดํ์ ๋ฐ์ํ ์ฆ์ ์ ์ฉ ๊ฐ๋ฅํ ์๋ฃจ์
์ผ๋ก๋ ํ๊ณ๊ฐ ์์ ๊ฒ์ผ๋ก ํ๋จ๋๋ค. ๋ํ ๊ธฐ์กด์ ํ๋กฌํํธ ์์ง๋์ด๋ง ๊ธฐ๋ฒ์ธ Chain-of-Thought(Wei et al., 2022) ์ด๋ Tree-of-Thought (Yao et al., 2023)๋ LLM์ ์ถ๋ก ๊ณผ์ ์ ๊ฐ์ ํ๋ ํจ๊ณผ๊ฐ ์์ผ๋, ๊ตฌ์กฐ๋๋ฉด๊ณผ ๊ฐ์ ๋ํ ์์ฑ ๋ฌธ์ ์๋ ์ง์ ์ ์ฉํ๊ธฐ ์ด๋ ต๋ค๋ ์ง์ ์ด ์๋ค.
์ด๋ฌํ ๋ฐฐ๊ฒฝ์์ ๋ณธ ์ฐ๊ตฌ๋ ํ๊ตญ ๊ตฌ์กฐ์ค๊ณ ์ค๋ฌด์ ์ฆ์ ์ ์ฉ ๊ฐ๋ฅํ ๊ตฌ์กฐํ ํ๋กฌํํธ(Structured Prompt, S-Prompt) ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค.
S-Prompt๋ ๋ค์๊ณผ ๊ฐ์ ์ฐจ๋ณ์ฑ์ ์ง๋๋ค. (1) ๋ค์ค ์์ด์ ํธ ์์คํ
์์ด ๋จ์ผ LLM๋ง์ผ๋ก ์ ๋ฐํ ๊ตฌ์กฐ๋๋ฉด์ ์์ฑํ ์ ์๋๋ก ํ๋กฌํํธ๋ฅผ
์ค๊ณํ๋ค. (2) ํ๊ตญ๊ฑด์ถ๊ตฌ์กฐ๊ธฐ์ค(KBC)์ ๊ท์ ์ ํ๋กฌํํธ์ ๋ช
์์ ์ผ๋ก ๋ฐ์ํ์ฌ ์ฝ๋ ์ค์๋ฅผ ์๋ํํ๋ค. (3) ๊ตฌ์กฐ๋๋ฉด ์์ฑ์ ํนํ๋ ํ๋ผ๋ฏธํฐ
๊ณ์ธตํ์ ์ํ์ ์ ์ฝ์กฐ๊ฑด ์ ์ ๊ธฐ๋ฒ์ ๋์
ํ์ฌ, ๋๋ฉด์ ์์ ๋ฐฐ์น์ ์์ธ ์กฐ๊ฑด์ ์ฒด๊ณ์ ์ผ๋ก ๊ธฐ์ ํ๋ค. ํนํ LLM์ ํ๊ฐ ํ์(hallucination)์
์ต์ํํ๊ธฐ ์ํด ๋๋ฉด ์์ ๊ฐ ๊ณต๊ฐ๊ด๊ณ๋ฅผ ์์น ๊ธฐ๋ฐ์ผ๋ก ๋ช
์ํ๊ณ , ์ ๋ณด์ด๋ก ์ ๊ด์ ์์ ์ต์ ํ๋ ํ๋กฌํํธ ๊ตฌ์กฐ๋ฅผ ์ค๊ณํ์๋ค. ๋ณธ ์ฐ๊ตฌ์ ์ต์ข
๋ชฉํ๋
์ด๋ฌํ S-Prompt ๊ธฐ๋ฒ์ ํตํด KBC ์ค์ ๊ตฌ์กฐ๋๋ฉด์ LLM์ด ์๋ ์์ฑํ ์ ์๋์ง๋ฅผ ์คํ์ ์ผ๋ก ๊ฒ์ฆํ๋ ๋ฐ ์๋ค. ์ด๋ฅผ ์ํด Anthropic
Claude 3.7 Sonnet๊ณผ OpenAI GPT-4o ๋ชจ๋ธ์ ํ์ฉํ์์ผ๋ฉฐ, ๋ ๋ชจ๋ธ์ 2024๋
5์ ์ด์ ํ์ต ๋ฐ์ดํฐ ๊ธฐ์ค์ผ๋ก ๊ตฌ์กฐ๋๋ฉด ์์ฑ
์ฑ๋ฅ์ ๋น๊ต ํ๊ฐํ์๋ค.
๋ณธ ๋
ผ๋ฌธ์ ๊ตฌ์ฑ์ ๋ค์๊ณผ ๊ฐ๋ค. 2์ฅ์์๋ ๊ด๋ จ ์ฐ๊ตฌ ๋ํฅ๊ณผ ๋ฐฐ๊ฒฝ์ ๊ณ ์ฐฐํ๋ค. 3์ฅ์์๋ ์ ์ํ๋ S-Prompt ๋ฐฉ๋ฒ๋ก ๊ณผ ๊ตฌํ ์ ์ฐจ๋ฅผ ์์ธํ ์ค๋ช
ํ๋ค.
4์ฅ์์๋ ์คํ ์ค์ ๋ฐ ๊ฒฐ๊ณผ๋ฅผ ์ ์ํ๊ณ ์์ ํ๊ฐ๋ฅผ ์ํํ๋ค. ๋ง์ง๋ง์ผ๋ก 5์ฅ์์ ๋ณธ ์ฐ๊ตฌ์ ์์๋ฅผ ์ ๋ฆฌํ๊ณ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ ๋
ผ์ํ๋ค.
2. ๋ณธ ๋ก
2.1 LLM์ ๊ตฌ์กฐ์ค๊ณ ๋ถ์ผ ์ ์ฉ
LLM์ ํ์ฉํ ์
๋ฌด ์๋ํ ์ฐ๊ตฌ๋ ๋ค์ํ ์ฐ์
์์ ํ์ฐ๋๊ณ ์์ผ๋ฉฐ, ๊ตฌ์กฐ๊ณตํ ๋ถ์ผ์์๋ ์ค์ ์ ์ฉ ์ฌ๋ก๊ฐ ๋ณด๊ณ ๋๊ณ ์๋ค. ์๋ฅผ ๋ค์ด, Liang et al.(2025)์ GPT-4o ๊ธฐ๋ฐ LLM์ OpenSeesPy์ ์ฐ๋ํ์ฌ ํ์ค ์๋๋ฆฌ์ค ์์ฑ, FEM ํด์, ๊ฒฐ๊ณผ ์๊ฐํ๊น์ง ํตํฉํ ์๋ ํ์ดํ๋ผ์ธ์ ์ ์ํ์๋ค.
์ด ์์คํ
์ 20๊ฐ ๋ฒค์น๋งํฌ ๋ฌธ์ ์์ 100%์ ์ ํ๋๋ฅผ ๊ธฐ๋กํ๋ฉฐ ๊ธฐ์กด ๊ธฐ๋ฒ์ ํฌ๊ฒ ๋ฅ๊ฐํ์๋ค๊ณ ๋ณด๊ณ ๋์์ผ๋, ๊ฒํ ๊ฐ ํ์ํ๋ค. Qin et al.(2024)๋ LLM์ ์ ์ด ์ฝ์ด๋ก, ์งํ ์๊ณ ๋ฆฌ์ฆ์ ํ์๊ธฐ๋ก ํ์ฉํ โShear-Wall IDOโ ์์คํ
์ ๊ฐ๋ฐํ์ฌ ์ค์ ํ๋ก์ ํธ์์ ์ค๊ณ ์ฌ์ดํด์ ์ฝ 30๋ฐฐ
๋จ์ถํ์๋ค. Madireddy et al.(2025)์ Revit API์ Claudeโ
GPT-4o๋ฅผ ๊ฒฐํฉํด KBC/IBC ์กฐํญ ๋งคํ ๋ฐ ์๋ฐ ๋ณด๊ณ ๋ฅผ ์๋ํํ์ฌ ๋์ ์ ํฉ์ฑ์ ํ๋ณดํ๊ณ ๊ฒํ ์๊ฐ์ ํ์ ํ
์ค์๋ค. Lee et al.(2024)๋ ์์ฑโ
์์ฐ์ด ๋ช
๋ น๋ง์ผ๋ก BIM ์์๋ฅผ ์์ฑโ
์์ ํ๋ Generalized LLM Augmented BIM Framework๋ฅผ ์ ์ํ์ฌ GUI ๋ฐฉ์๋ณด๋ค
๋น ๋ฅธ ๋ชจ๋ธ ์์ฑ ์๋๋ฅผ ํ์ธํ์๋ค. ์ด๋ฌํ ์ ํ ์ฐ๊ตฌ๋ค์ ์ค๊ณ ๋จ๊ณ๊ฐ ๊ฑด์ค ํ๋ก์ ํธ ๋น์ฉ์์ ์๋น ๋น์ค์ ์ฐจ์งํ๋ค๋ ์ ์ ๊ฐ์ํ ๋, LLM ๋์
์ด
์
๋ฌด ํจ์จ์ ํฌ๊ฒ ๋์ผ ์ ์์์ ์์ฌํ๋ค. ์ค์ ๋ํ ๊ฑด์ถ๋ฌผ์ ๊ตฌ์กฐ๋๋ฉด์ ์๋ฐฑ์์ ์์ฒ ์ฅ์ ์ด๋ฅด๋ฉฐ, ํ์ฌ๊น์ง ์๋น ๋ถ๋ถ์ด CAD ํ๊ฒฝ์์ ์ธ๋ ฅ์
์์กดํด ์์ฑ๋๋ค. ๋ฐ๋ผ์, ๋ฐ๋ณต์ ์ด๊ณ ์ ํํ๋ ๋๋ฉด ์์
์ LLM์ ์ ์ฉํ๋ฉด ์ค๊ณ ๊ธฐ๊ฐ ๋จ์ถ๊ณผ ๊ณต์ฌ๋น ์ ๊ฐ์ ๋์์ ๊ธฐ๋ํ ์ ์๋ค.
๋ณธ ์ฐ๊ตฌ๋ ์ด๋ฌํ ๊ฐ๋ฅ์ฑ์ ํ ๋๋ก LLM ๊ธฐ๋ฐ ๊ตฌ์กฐ์ค๊ณ ์๋ํ์ ๋์ ํ๋ค. ์ต์ LLM์ ๋ค์ํ ๋ฒค์น๋งํฌ์์ ์ฐ์ํ ์์ฑ ๋ฅ๋ ฅ์ ์
์ฆํ์ง๋ง, ๊ตฌ์กฐ๋๋ฉด
์๋ํ์๋ ๊ณต๊ฐ ์ถ๋ก ๊ณผ ๊ท์ ์ค์๊ฐ ํ์์ด๋ฏ๋ก ๋๋ฉ์ธ ํนํ ํ๋กฌํํธ๊ฐ ํ์ํ๋ค. ๋ฐ๋ผ์ ๋ณธ ์ฐ๊ตฌ๋ LLM์ ๊ตฌ์กฐ๋๋ฉด ์์ฑ์ ์ ์ฉํ๊ณ ์ ํ๋ฉฐ, ๋ค์
์ ์์ ๊ด๋ จ ํ๋กฌํํธ ์ค๊ณ ๋ฐ ์ ํ์ฐ๊ตฌ๋ฅผ ๊ฒํ ํ๋ค.
2.2 ํ๋กฌํํธ ์์ง๋์ด๋ง ๋ฐ ๋๋ฉด ์๋ํ ๋ฐฐ๊ฒฝ
ํ๋กฌํํธ ์์ง๋์ด๋ง์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์ถ๋ ฅ์ ๋ชฉํ ์งํฅ์ ์ผ๋ก ์ ์ดํ๊ธฐ ์ํด ์
๋ ฅ ๊ตฌ๋ฌธ์ ์ฒด๊ณํํ๋ ๊ธฐ๋ฒ์ด๋ฉฐ, ์ต๊ทผ ๋ณตํฉ ์ถ๋ก ๊ณผ์ ์ ๋ฐ์์
ํต์ฌ ์ฐ๊ตฌ ์ฃผ์ ๋ก ๋ถ์ํ๊ณ ์๋ค. ๋ํ์ ์ผ๋ก Chain-of-Thought(CoT) ๊ธฐ๋ฒ์ LLM์ด ๋จ๊ณ๋ณ ์ฌ๊ณ ๊ณผ์ ์ ์์ ํ๋๋ก ์ ๋ํด ์ํโ
๋
ผ๋ฆฌ
๋ฌธ์ ์์ ์ฑ๋ฅ ํฅ์์ ๋ฌ์ฑํ์๊ณ (Wei et al., 2022), Tree- of-Thought(ToT)๋ ํ์์ ๋ถ๊ธฐ ๊ตฌ์กฐ๋ฅผ ๋์
ํ์ฌ ๋ค์ํ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ํ๊ฐโ
์ ํํจ์ผ๋ก์จ ๋ชจ๋ธ ์ฌ๊ณ ์ ๊น์ด์ ํญ์ ํ์ฅํ์๋ค(Yao et al., 2023) . ๊ทธ๋ฌ๋ ์ด๋ฌํ ์ผ๋ฐ-๋ชฉ์ ๊ธฐ๋ฒ๋ค์ ํ
์คํธ ๊ธฐ๋ฐ ํ๋จ์๋ ํจ๊ณผ์ ์ด์ง๋ง, ์ขํโ
์น์์ ๊ฐ์ ์ ๋ ์ ์ฝ์ ๋๋ฐํ๋ ๋๋ฉด ์์ฑ ๊ณผ์ ์๋ ํ๊ณ๋ฅผ ๋๋ฌ๋ธ๋ค.
์ต๊ทผ ReAct ํ๋ ์์ํฌ๊ฐ ์ฌ๊ณ (trace)-ํ๋(action) ๋ฃจํ๋ฅผ ๊ฒฐํฉํด ์ธ๋ถ ๋๊ตฌ ํธ์ถ๊น์ง ์ง์ํ์ผ๋, ๋ฒกํฐ ์ขํ์ ์ค์ฐจ ๋์ ๊ณผ ๊ฐ์ฒด ํ๊ฐ
ํ์์ ๊ทผ๋ณธ์ ์ผ๋ก ์ ๊ฑฐํ์ง ๋ชปํ๋ค(Yang et al., 2023).
์ด ๊ฐ์ ํ๊ณ๋ LLM ๊ณต๊ฐโ
๊ธฐํ ์ถ๋ก ๋ฒค์น๋งํฌ์์๋ ํ์ธ๋๋ค. LEGO-Puzzles ์คํ์์ 20์ข
๋ฉํฐ๋ชจ๋ฌ LLM์ ๋ค๋จ๊ณ ๊ณต๊ฐ ์ถ๋ก ์ ํ๋๋
์ต๋ 50%์ ๊ทธ์ณค์ผ๋ฉฐ(Tang et al., 2025), Geometric Reasoning Gap ์ฐ๊ตฌ ์ญ์ ๋จ์ ๊ธฐํ ์๋ ๋ฌธ์ ์์ ๊ฐ์ฒด ์์น ์ค๋ฅ์ ์น์ ํ๊ฐ์ ๋น๋ฒํ ๋ณด๊ณ ํ์๋ค (Mouselinos et al., 2024) . ๋ฐ๋ผ์ ๊ตฌ์กฐ๋๋ฉด์ฒ๋ผ ๊ณต๊ฐ ์ ์ฝ๊ณผ ๊ท์ ์ค์๊ฐ ํต์ฌ์ธ ์์
์๋, ๊ธฐ์กด CoTโ
ToT๋ง์ผ๋ก ์ถฉ๋ถ์น ์๋ค๋ ๊ฒฐ๋ก ์ด ๋์ถ๋๋ค.
ํํธ, ๋๋ฉด ์๋ํ ์ฐ๊ตฌ๋ ํฌ๊ฒ ๋ํ ์ธ์๊ณผ ๋ํ ์์ฑ์ผ๋ก ๋ถ๊ธฐ๋ผ ๋ฐ์ ํด ์๋ค. ์ธ์ ์ธก๋ฉด์์๋ ๋๋ฉด์ 2D ๋๋ฉด ์ ๋ณด๋ก๋ถํฐ 3D BIM ๊ฐ์ฒด๋ก ๋ณํํ๊ฑฐ๋
๋ฐฐ๊ทผํ๋ฅผ ์๋ ์ถ์ถํ๋ ๊ธฐ๋ฒ์ด ์๋๋์์ผ๋(Kim and Chin, 2019), ์ ์ฒด ๊ตฌ์กฐ๋๋ฉด์ ์์ฑํ๋ ๋จ๊ณ์๋ ์ด๋ฅด์ง ๋ชปํ๋ค. ์๋ฅผ ๋ค์ด, ์ด๊ธฐ ์ค์ผ์น BIM ๋ชจ๋ธ์ ์ค๊ณ BIM ๋จ๊ณ๋ก ๋ฐ์ ์ํค๋ Sketch2BIM ์ ๊ทผ๋ฒ๋
์ ์๋์์ผ๋(Qiu et al., 2021), ์ฌ์ ํ ์ ์ฒด ๊ตฌ์กฐ๋๋ฉด ์๋ ์์ฑ์๋ ์ ์ฝ์ด ์์๋ค. ์์ฑ ์ธก๋ฉด์์ ์ฃผ๋ชฉํ ํ๋ฆ์ LLM์๊ฒ ๋ํ ์์ฒด๋ฅผ ์ถ๋ ฅํ๊ฒ ํ๋ ์ ๋ต์ด๋ค. SVG Builder๋
์ปดํฌ๋ํธ ๊ธฐ๋ฐ ํ ํฌ๋์ด์ ๋ก ์์ด์ฝโ
ํฐํธ ๋๋ฉ์ธ์์ 1 px ์ดํ ์์น ์ค์ฐจ๋ฅผ ๋ณด๊ณ ํ์๊ณ (Chen et al., 2024), Omni SVG๋ ํ
์คํธโ
์ด๋ฏธ์ง ์ ์
๋ ฅ์ ๋ฐ์ 64 k tokens ๊ท๋ชจ๊น์ง ๋ฒกํฐ ๊ทธ๋ํฝ์ ์์ฑํ์๋ค(Guo et al., 2025) . ์ด๋ฅผ ํ๊ฐํ๊ธฐ ์ํด ์ ์๋ VGBench๋ SVGโ
TikZโ
Graphviz 2,100๋ฌธํญ์ ํฌํจํด LLM์ ๋ํ ์ดํดโ
์์ฑ์ ์ ๋ฐ ์ธก์ ํ๋ฉฐ,
์ด๊ธฐ ๊ฒฐ๊ณผ๋ ๋๋ถ๋ถ LLM ๋ชจ๋ธ๋ค์ด ์ขํ ์ ํ๋์ ์์ ๋ณด์กด ์ธก๋ฉด์์ ํฐ ํธ์ฐจ๋ฅผ ๋ณด์์ ์์ฌํ๋ค(Zou et al., 2024). ํํธ, LLM์ ํ์ฉํ์ง ์๋ ์ฝ๋ ๊ธฐ๋ฐ CAD ์๋ํ(์ผ๋ช
CodeCAD) ์ ๊ทผ๋ค๋ ๋ณํ ๋ฐ์ ํด ์๋๋ฐ, ์ด๋์คํฌ๋ฆฝํธ๋ API๋ฅผ ํตํด ๋๋ฉด์
์ ์ฐจ์ ์ผ๋ก ์์ฑํจ์ผ๋ก์จ ํ๋กฌํํธ ์์ด๋ ์ค๊ณ ์๋ํ๋ฅผ ๊ตฌํํ๋ ๋ฐฉ๋ฒ์ด๋ค. ๋๋ฉด์ ์ค๋ฌด CAD ํ๊ฒฝ์ผ๋ก ์ง์ ์ ํํ๋ ค๋ฉด LLM ์ถ๋ ฅ ํ์์ด ๋ฒกํฐโ
์ขํ
๊ธฐ๋ฐ์ด์ด์ผ ํ๋ค. Scalable Vector Graphics(SVG)๋ XML ๊ธฐ๋ฐ ํ
์คํธ ํฌ๋งท์ผ๋ก ์ขํโ
๊ณก์ โ
๋ ์ด์ด ์ ๋ณด๋ฅผ ๊ธฐ์ ํ๋ฉฐ, DXF/DWG
์ญ์ ASCII/๋ฐ์ด๋๋ฆฌ ํํ๋ก ๋์ผ ์ ๋ณด๋ฅผ ์ ์ฅํ๋ค. DXF๋ AutoCAD์ ๋ฐ์ด๋๋ฆฌ ๋๋ฉด ํ์(DWG)์ ASCII๋ก ํํํ ๊ตํ ํ์์ผ๋ก,
๋ ํ์ ๋ชจ๋ ์ โ
์ โ
ํธ ์ ๋ณด๋ฅผ ์ ๋ ์ขํ๋ก ์ ์ฅํ๋ค. Fahiem and Farhan(2007)์ SVG์ path ์์๋ฅผ DXF์ polyline๊ณผ arc ์์๋ก ๋ณํํ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ํ์ฌ SVG์ DXF ๊ฐ์ ์ ๋ณด ์์ค ์๋ ์๋ฐฉํฅ ๋ณํ์ด
๊ฐ๋ฅํจ์ ๋ณด์๋ค. ์ด๋ ๋ณธ ์ฐ๊ตฌ์์ LLM์ ์ถ๋ ฅ ํฌ๋งท์ผ๋ก SVG๋ฅผ ์ ํํ๊ณ ์ถํ CAD ๋๋ฉด(DXF)์ผ๋ก ๋ณํํ๋ ์ ๊ทผ์ ๊ธฐ์ ์ ๊ทผ๊ฑฐ๊ฐ ๋๋ค.
์ด๋ LLM์ด SVG๋ฅผ ์ง์ ์ถ๋ ฅํ๋๋ก ์ค๊ณํ ๊ฒฝ์ฐ, ์ถ๊ฐ ํ์ฒ๋ฆฌ ์์ด CAD ๋๋ฉด์ผ๋ก ํ์ฉํ ์ ์์์ ์๋ฏธํ๋ค.
์ฐ๊ตฌ ๊ฐญ์ ๋ช
ํํ๋ค. (1) CoTโ
ToT๋ฅ ์ผ๋ฐ ํ๋กฌํํธ๋ก๋ ๊ตฌ์กฐ๋๋ฉด ์์ค์ ์ ๋ฐ ์ขํ์ ๊ท์ ์ค์๋ฅผ ๋ด๋ณดํ๊ธฐ ์ด๋ ต๊ณ , (2) SVG ์์ฑ ์ฐ๊ตฌ๋
๊ตฌ์กฐ์ค๊ณ-ํนํ ๊ท์ (KBC ๋ฑ)์ ํฌํจํ์ง ๋ชปํ๋ฉฐ, (3) 2-D ์ธ์ ๊ธฐ๋ฐ BIM ์ฐ๊ตฌ๋ ์์ฑ ๋จ๊ณ๊น์ง ์ฐ๊ฒฐ๋์ง ์์๋ค. ๋ณธ ์ฐ๊ตฌ๋ ์ด ์ธ ์ถ์
ํตํฉํ ๊ตฌ์กฐํ ํ๋กฌํํธ(S-Prompt)๋ฅผ ์ ์ํ์ฌ, โKBC ๊ท์ ๋ด์ฅ + ์ขํ ์ ํ๋ ๋ณด์ฅ + SVGโDXF ๋ฌด์์ค ๋ณํโ์ด ๋์์ ๊ฐ๋ฅํ ๊ตฌ์กฐ๋๋ฉด
์๋ํ ํ์ดํ๋ผ์ธ์ ๊ตฌ์ถํ๋ค. ์ด๋ฅผ ํตํด LLM์ ์ ์ฌ๋ ฅ์ ๊ตฌ์กฐ์ค๊ณ ์ค๋ฌด์ ์ค์ง์ ์ผ๋ก ์ด์ํ๊ณ ์ ํ๋ค.
3. ๋ฐฉ๋ฒ๋ก
3.1 S-Prompt ๊ธฐ๋ฐ ๊ตฌ์กฐ๋๋ฉด ์์ฑ ํ์ดํ๋ผ์ธ
๋ณธ ์ฐ๊ตฌ์์๋ ๊ตฌ์กฐํ ํ๋กฌํํธ(S-Prompt)๋ฅผ ์ด์ฉํ์ฌ LLM์ด ๊ตฌ์กฐ๋๋ฉด ์ค ๊ตฌ์กฐ ๋ถ์ฌ ์ผ๋ํ ๋๋ฉด์ ์์ฑํ๋ ํ์ดํ๋ผ์ธ์ ๊ตฌ์ถํ์๋ค. Fig. 1์ ์ ์ํ๋ ์ ์ฒด ํ์ดํ๋ผ์ธ์ ๋ํ๋ธ ๊ฒ์ผ๋ก, ํ๋กฌํํธ ์ค๊ณ โ LLM ์์ฑ โ CAD ๋ณํ์ 3๋จ๊ณ๋ก ๊ตฌ์ฑ๋๋ค. ๋จผ์ ๊ตฌ์กฐ ๋ถ์ฌ์ ํํ, ์น์,
์ฌ๋ฃ, ์ฒ ๊ทผ ์์ธ ๋ฑ์ ๊ดํ ํ
์คํธ ์
๋ ฅ ํ๋กฌํํธ๋ฅผ ์์ฑํ๋ค. ์ด ํ๋กฌํํธ์๋ ๋ถ์ฌ ์ข
๋ฅ๋ณ๋ก ์์ฃผ ๋ณ๊ฒฝ๋๋ ํ๋ผ๋ฏธํฐ(์: ๋ณด์ ๊ธธ์ด, ํญ, ์ฒ ๊ทผ ์ง๊ฒฝ,
ํผ๋ณต ๋๊ป ๋ฑ)๋ฅผ ์ฌ๋กฏ ํํ๋ก ํฌํจ์ํค๊ณ , ๊ฐ์ข
์ค๊ณ ์กฐ๊ฑด๊ณผ ์ฝ๋ ๊ท์ (KBC)์ ์์ ํ์ผ๋ก ๊ธฐ์ ํ๋ค. ์ด๋ ๊ฒ ๊ตฌ์ฑ๋ S-Prompt๋ฅผ LLM์ ์
๋ ฅํ๋ฉด,
LLM์ ํด๋น ๋ถ์ฌ์ ๊ตฌ์กฐ๋๋ฉด์ ํํํ๋ SVG ์ฝ๋๋ฅผ ์ถ๋ ฅํ๋ค. ๋ง์ง๋ง์ผ๋ก ์์ฑ๋ SVG๋ฅผ DXF ๋ฑ CAD ํ์์ผ๋ก ๋ณํํ์ฌ ์ค์ ์ค๊ณ ๋๋ฉด์ผ๋ก
ํ์ฉํ๋ค. SVG๋ฅผ ์ค๊ฐ ์ฐ์ถ๋ฌผ๋ก ์ ํํ ๊ฒ์ ์์ ์ธ๊ธํ ๋ฐ์ ๊ฐ์ด CAD ๋๋ฉด๊ณผ์ ์ํธ ์ด์ฉ์ฑ ๋๋ฌธ์ด๋ค. DXF ๋ฑ CAD ํ์ผ ํ์์ ๋ชจ๋ ๋ํ
์ ๋ณด๋ฅผ ์ ๋ ์ขํ๋ก ๊ธฐ์ ํ๋ฉฐ, ์ด๋ SVG์ ์ขํ ๊ธฐ๋ฐ ์ง์์ 1:1 ๋์๋๋ค. ์ฆ LLM์ด ๊ณง๋ฐ๋ก SVG ์ฝ๋ ํํ๋ก ๋๋ฉด์ ์์ฑํ๋ฉด, ์ถ๊ฐ ํ์ฒ๋ฆฌ
์์ด CAD ๋๋ฉด์ผ๋ก ๋ณํํ์ฌ ์ฌ์ฉํ ์ ์๋ค. Quint et al.(2003)๋ SVG๋ฅผ ์น ํ์ค์ ํ๋๋ก ์ ์ํ์๊ณ , Chen et al.(2024)๋ SVG์ ํด์๋ ๋
๋ฆฝ์ ํน์ฑ์ ์คํ์ ์ผ๋ก ํ์ธํ์๋ค. ๋ํ Fahiem and Farhan(2007)์ SVG์ path ์์๋ฅผ DXF์ polyline ๋๋ arc ์์๋ก ๋ณํํ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ํ๋ฉฐ ๋ ํฌ๋งท ๊ฐ ์๋ฐฉํฅ ๋ณํ์ด ์ ํํ ๊ฐ๋ฅํจ์ ๋ณด์๋ค.
์ด๋ฌํ ๊ธฐ์ ์ ๊ธฐ๋ฐ์ LLM ์ถ๋ ฅ ๊ฒฐ๊ณผ๋ฅผ SVG๋ก ๋ด๋ณด๋ธ ํ CAD ํ๊ฒฝ์์ ์ฆ์ ํ์ฉํ๋ ๋ณธ ์ฐ๊ตฌ์ ์ ๊ทผ์ ๋ท๋ฐ์นจํ๋ค.
๋ณธ ์ฐ๊ตฌ์์๋ OpenAI GPT-4o(์ปจํ
์คํธ ์ฐฝ โ 128 k tokens)์ Anthropic Claude 3.7 Sonnet(โ 200 k
tokens)์ ๋น๊ต ๋ชจ๋ธ๋ก ์ ์ ํ์๋ค(OpenAI, 2024; Anthropic, 2024). Fig. 2์ ๊ฐ์ด ๋ ๋ชจ๋ธ ๋ชจ ํ๋กฌํํธ์ ๊ตฌ์กฐ์ค๊ณ ์ ๋ณด๋ฅผ ๋จ๊ณ์ ์ผ๋ก ํฌํจํ๊ธฐ์ ์ ํฉํ๋ฉฐ, ํนํ Claude 3.7 Sonnet์ Agentic Codingโ
์ํ
์ถ๋ก ๋ฒค์น๋งํฌ์์ ์ต๊ณ ์ฑ๋ฅ์ ๊ธฐ๋กํด ์ฝ๋ ๊ธฐ๋ฐ ๋ํ ์์ฑ ์์
์ ๊ฐ์ ์ ๋ณด์ธ๋ค. GPT-4o๋ ๊ด๋ฒ์ํ ํ์ต ๋ฐ์ดํฐ๋ก๋ถํฐ ์ป์ ์ ๋ฌธ ์ง์โ
์ผ๋ฐ ์ถ๋ก
๋ฅ๋ ฅ์ ๊ฐ์ ์ผ๋ก ํ๋ฏ๋ก, ๋ ๋ชจ๋ธ์ ์ํธ ๋ณด์์ฑ์ ๊ฒ์ฆํ๊ธฐ ์ํด ๋ชจ๋ ์คํ์ ํฌํจํ์๋ค. ํ๋กฌํํธ ์ค๊ณ ์ด๊ธฐ ๋จ๊ณ์์๋, ๋ LLM์ด ๋จ์ํ ์ง์์ด๋ง์ผ๋ก
๊ตฌ์กฐ๋๋ฉด์ ์ ๋๋ก ์์ฑํ ์ ์๋์ง ํ์ธํ๊ธฐ ์ํด ํ์ผ๋ฟ ์คํ์ ์ํํ์๋ค. ์์๋ก ์บํธ๋ ๋ฒ ๋ณด ๋ถ์ฌ์ ๋จ๋ฉด ๊ตฌ์กฐ๋๋ฉด ์์ฑ์ ํ๋กฌํํธ๋ก ์ง์ํ๊ณ ,
LLM ์ถ๋ ฅ ๊ฒฐ๊ณผ๋ฅผ ์ฌ์ ์ ์ค๋นํ ์ ๋ต ๋๋ฉด(CAD ์ํํธ์จ์ด๋ก ์์ฑํ ๋๋ฉด, Fig. 3)๊ณผ ๋น๊ตํ์๋ค. ์ด ์ด๊ธฐ ์คํ์์ LLM ์ถ๋ ฅ ๋๋ฉด์๋ ์น์ ์ค๋ฅ, ๊ฐ์ฒด ๋๋ฝ, ๋นํ์ค์ ์ธ ๋ฐฐ์น ๋ฑ์ด ๋ค์ ๋ํ๋ LLM์ ํ๊ฐ ํ์์ด ํ์ธ๋์๋ค.
์ฆ, ๋ชจ๋ธ์ด ๋ถ์ฌ ๊ฐ ์ ํํ ๊ณต๊ฐ์ ์ถ๋ก ์๋ ํ๊ณ๋ฅผ ๋ณด์์ผ๋ฉฐ, ์ด๋ ๊ณง๋ฐ๋ก ๊ตฌ์กฐ ์ค๊ณ๋๋ฉด์ ์์ฑํ๋ ๋ฐ ์ด๋ ค์์ด ์์์ ์์ฌํ๋ค. ์ด๋ฌํ ํ๊ณ์ ์
๋ณด์ํ๊ธฐ ์ํด, ๋ณธ ์ฐ๊ตฌ๋ ํ๋กฌํํธ ๋ด์ฉ์ ๋จ๊ณ์ ์ผ๋ก ๊ตฌ์กฐํํ๊ณ ๋ชจ๋ธ ์ถ๋ ฅ์ ์ค๋ฅ ํจํด์ ๊ต์ ํ๋ ๋ฐฉํฅ์ผ๋ก S-Prompt๋ฅผ ๊ฐ์ ํด ๋๊ฐ๋ค. ๊ตฌ์ฒด์ ์ธ
S-Prompt ์ค๊ณ ์ ๋ต ๋ฐ ์ฑ๋ฅ ๊ฐ์ ํจ๊ณผ๋ ์๋ ์คํ ๊ฒฐ๊ณผ์์ ์์ธํ ๋ค๋ฃฌ๋ค.
Fig. 1 Endโtoโend pipeline for automatic structuralโdrawing generation using the proposed
SโPrompt methodology: prompt construction, LLM drawing synthesis, and CAD file conversion
Fig. 2 Task-wise accuracy (%) for Claude 3.7 Sonnet vs GPT-4o on coding, math, reasoning,
and multimodal benchmarks (โ3 000 tests each), recompiled from public reports (Anthropic,
Vellum AI, LMSYS; 2025)
Fig. 3 Groundโtruth CAD crossโsection of a reinforcedโconcrete cantilever beam used
as the reference for quantitative evaluation
3.2 ํ๋กฌํํธ ๊ตฌ์กฐ ๋ฐ ์ ์ฝ์กฐ๊ฑด ์ค๊ณ
S-Prompt์ ๊ถ๊ทน์ ์ธ ๋ชฉํ๋ ํ๋์ ํ๋กฌํํธ๋ง์ผ๋ก ๋ค์ํ ๊ตฌ์กฐ ๋ถ์ฌ ๋๋ฉด์ ์๋ ์์ฑํ ์ ์๋๋ก ํ๋ ๊ฒ์ด๋ค. ์ด๋ฅผ ์ํด ๋ณธ ์ฐ๊ตฌ์์๋ ๋ถ์ฌ์
์์ฑ ์ ๋ณด์ ์ค๊ณ ์กฐ๊ฑด์ ํ๋กฌํํธ ๋ด์ ๊ณ์ธต์ ์ธ ์ฌ๋กฏ ํํ๋ก ๊ตฌ์ฑํ์๋ค. ์๋ฅผ ๋ค์ด ๋ถ์ฌ์ ๋จ๋ฉด ์น์, ๋ฐฐ๊ทผ ๋ฐฉ์, ์ฒ ๊ทผ ๊ฐ์, ํผ๋ณต ๋๊ป ๋ฑ ์์ฃผ
๋ณ๊ฒฝ๋๋ ๋ณ์๋ค์ ์๋ณํ์ฌ ๋ณ๋์ ํ๋ผ๋ฏธํฐ ์
๋ ฅ๋ถ๋ก ๋ง๋ค๊ณ , ์ฌ์ฉ์๊ฐ ํ๋กฌํํธ ํ
์คํธ๋ฅผ ์์ ํ์ฌ ๋ค์ํ ์กฐ๊ฑด์ ์ ์ฉํ ์ ์๋๋ก ํ์๋ค.
์ด๊ธฐ ๋ฒ์ ์ ํ๋กฌํํธ์์๋ ์ด์ ๊ฐ์ ๊ฐ๋ณ ํ๋ผ๋ฏธํฐ ์ฌ๋กฏ๋ค์ ํ๋กฌํํธ ํ๋จ์ ๋ฐฐ์นํ์๋ค. ๊ทธ๋ฌ๋ ์ด๋ ๊ฒ ์ค๊ณํ ๊ฒฝ์ฐ, LLM์ด ํ๋กฌํํธ ์๋ถ๋ถ์ ๋งฅ๋ฝ์
์น์คํ๋ ๊ฒฝํฅ ๋๋ฌธ์ ๋ถ์ฌ ์กฐ๊ฑด์ด๋ ์ฒ ๊ทผ ์ธ๋ถ์ฌํญ์ด ์ผ๋ถ ๋๋ฝ๋๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ์๋ค. ์ด๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ด ํ๋กฌํํธ๋ฅผ ์์ฐจ์ ์ผ๋ก ํด์ํ๋ฉด์ ์๋ถ๋ถ
์ ๋ณด์ ๋ ๋์ ๊ฐ์ค์น๋ฅผ ๋๋ ์ฒ๋ฆฌ ๋ฐฉ์๊ณผ ๊ด๋ จ๋๋ค. ์ค์ ๋ก Kwon et al.(2025) ์ ์ฐ๊ตฌ์์๋ ์ฃผ์ ์ง์์ด๋ฅผ ํ๋กฌํํธ ์๋จ์ ๋ฐฐ์นํ ๊ฒฝ์ฐ ๋ชจ๋ธ ์ ํ๋๊ฐ ์์นํ๋ค๋ ๊ฒฐ๊ณผ๊ฐ ๋ณด๊ณ ๋ ๋ฐ ์๋ค. ์ด๋ฌํ ์ ํ ์ง์์ ์ฐธ๊ณ ํ์ฌ, ๋ณธ ์ฐ๊ตฌ์์๋
ํ๋กฌํํธ ๊ตฌ์กฐ๋ฅผ ์กฐ์ ํ์๋ค. ํ๋ผ๋ฏธํฐ ์
๋ ฅ๋ถ๋ฅผ ํ๋กฌํํธ ์ต์๋จ์ผ๋ก ์ฌ๋ฐฐ์นํ ์ดํ, ๋์ผํ ํ๋ผ๋ฏธํฐ์ ๋ํ LLM์ ํด์ ์ ํ๋๊ฐ ํฅ์๋์๊ณ ๋๋ฉด์์
์ขํ ์ค๋ฅ๋ ๋ถ์ฌ ๋๋ฝ๊ณผ ๊ฐ์ ๋ฌธ์ ๊ฐ ํ์ ํ ๊ฐ์ํ์๋ค. ์ฆ, ์ค์ ๋ณ์๋ฅผ ํ๋กฌํํธ ์๋ถ๋ถ์ ๋ฐฐ์นํ๋ ๋จ์ํ ์กฐ์น๋ง์ผ๋ก๋ ๊ตฌ์กฐ๋๋ฉด ์์ฑ ์ ํ๋๋ฅผ ๋์ผ
์ ์์์ ํ์ธํ์๋ค.
๋ค์์ผ๋ก, ๋๋ฉด์์ ์์ญ ๊ตฌ๋ถ์ ์์ฐ์ด ๋์ ์ ๋์ ์์น๋ก ์ ์ํ๋ ์ ๋ต์ ๋์
ํ์๋ค. ์ด๊ธฐ ํ๋กฌํํธ๋ โ๋งจ ์โ, โ์ผ์ชฝ ์๋โ, โ์ฐ์ธก ์๋โ
๋ฑ ์์น๋ฅผ ๋ํ๋ด๋ ๋จ์ด๋ก ๋ถ์ฌ ๋ฐฐ์น๋ฅผ ์ง์ํ์๋ค. ๊ทธ๋ฌ๋ ์ด๋ฌํ ์ ๋งค๋ชจํธํ ๊ณต๊ฐ ํํ ๋๋ฌธ์ LLM์ด ๋๋ฉด ์์ ๊ฐ ๊ฒฝ๊ณ๋ฅผ ์ผ๊ด๋๊ฒ ํด์ํ์ง ๋ชปํ์ฌ
๋ถ์ฌ ๊ฐ ์นจ๋ฒ ๋๋ ๊ฒน์นจ ์ค๋ฅ๊ฐ ๋น๋ฒํ๊ฒ ๋ฐ์ํ๋ค. Claude 3.7 Sonnet๊ณผ GPT-4o ๋ชจ๋ธ ๋ชจ๋ ์์ฐ์ด๋ก ํํ๋ ๊ณต๊ฐ ์ ๋ณด๋ฅผ ์ ํํ ์ขํ๊ณ์
๋์์ํค์ง ๋ชปํ๋ ๊ฒฝํฅ์ ๋ณด์๋ค. ์ด์ ๋ฐ๋ผ ๋ณธ ์ฐ๊ตฌ๋ ํ๋กฌํํธ๋ฅผ ์ฌ์ค๊ณํ๋ฉด์, ์๋ฅผ ๋ค์ด โ์ ์ฒด ๋๋น์ 0โผ25% ์์ญ์ ๋ถ์ฌ A๋ฅผ ๋ฐฐ์นโ์ ๊ฐ์ด
์ ๋์ ์ขํ ๋น์จ์ ํ์ฉํ ๋ช
์์ ๊ฒฝ๊ณ ์กฐ๊ฑด์ ํ๋กฌํํธ์ ํฌํจ์์ผฐ๋ค. ๊ทธ ๊ฒฐ๊ณผ, Fig. 4์ ๋ฐ๋ณต ์์ฑ ์คํ์์ ๋ถ์ฌ ๊ฐ ์ถฉ๋๋ฅ ์ด ํฌ๊ฒ ๊ฐ์ํ์๋ค. ์ด๋ LLM์ด ๊ณต๊ฐ ์ ๋ณด๋ฅผ ๋ง์ฐํ ์์ฐ์ด๊ฐ ์๋ ์์น์ ์ธ ๋ฒกํฐ ์ฐจ์์ผ๋ก ํด์ํ๋๋ก ์ ๋ํจ์ผ๋ก์จ,
์ ํํ ํ๋ฉด ๋ฐฐ์น์ ๋ถ์ฌ ๊ฐ ๊ฐ์ญ ์ต์ํ๋ฅผ ๋์์ ๋ฌ์ฑํ ์ ์์์ ๋ณด์ฌ์ค๋ค. ์ฆ, ๊ธฐํํ์ ์์น ์ฉ์ด์ ์์น ๊ธฐ๋ฐ ์กฐ๊ฑด์ ๊ฒฐํฉํ๋ ํ๋กฌํํธ ์ค๊ณ๋
๊ตฌ์กฐ๋๋ฉด ์์ฑ์์ ๋งค์ฐ ํจ๊ณผ์ ์ธ ์ ๋ต์์ ํ์ธํ ์ ์์๋ค.
๋ง์ง๋ง์ผ๋ก ์ฒ ๊ทผ ํผ๋ณต๋๊ป ๋ฑ ์ํ์ ์ ํฉ ์กฐ๊ฑด์ ํ๋กฌํํธ ํํ์ ๊ฐ์ ํ์๋ค. S-Prompt ์ด์์์๋ โ์คํฐ๋ฝ๊ณผ ์ฃผ๊ทผ์ด ๋ง๋ฟ์์ผ ํ๋คโ๋ ์์ผ๋ก
์์ฐ์ด ์ง์์ด๋ก๋ง ํด๋น ์กฐ๊ฑด์ ๊ธฐ์ ํ์๋ค. ๊ทธ๋ฌ๋ ๋ชจ๋ธ์ โ๋ง๋ฟ๋๋คโ๋ฅผ ๋จ์ํ โ๋งค์ฐ ๊ทผ์ ํจโ์ผ๋ก ์ดํดํ๋ ๊ฒฝํฅ์ ๋ณด์ฌ, ์ถ๋ ฅ ๋๋ฉด์์ ์ฃผ๊ทผ์ด ์คํฐ๋ฝ
๋ด๋ฉด์์ ๋จ์ด์ง ์์น์ ๋ฐฐ์น๋๋ ์ค๋ฅ๊ฐ ๋ฐ๋ณต๋์๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ณธ ์ฐ๊ตฌ์์๋ ์ฃผ๊ทผ์ ์(circle), ์คํฐ๋ฝ์ ์ง์ (line) ํ์์ผ๋ก
๋ชจ๋ธ๋งํ๊ณ , ๋ ์์์ ๊ด๊ณ๋ฅผ โ์๊ณผ ์ง์ ์ด ์ ํ๋คโ๋ ๊ธฐํํ์ ์ ์ ์กฐ๊ฑด์ผ๋ก ๋ช
์ํ์๋ค. ํ์์ ๊ด๋ จ ์์๋ ํจ๊ป ์ ์ํ์ฌ ๋ชจ๋ธ์ด ํด๋น ์ ์ด ์กฐ๊ฑด์
๋์ฑ ๋ช
ํํ ์ธ์ํ๋๋ก ํ๋กฌํํธ๋ฅผ ๊ฐํํ์๋ค. ๊ทธ ๊ฒฐ๊ณผ, ์ฃผ๊ทผ์ด ์คํฐ๋ฝ ๋ด๋ฉด์ ์ ํํ ์ ํ๋ ๋จ๋ฉด ๋๋ฉด์ ์์ฑ๋ฅ ์ด ํฌ๊ฒ ํฅ์๋์๋ค.
Fig. 4๋ ๋์ผํ S-Prompt๋ฅผ ์ด์ฉํด ์๋ ์์ฑํ RC๋ณด ๋จ๋ฉด ๋๋ฉด์ Case 1โผ3 ์์๋๋ก ์๋จ์ Claude 3.7 Sonnet, ํ๋จ์๋ GPT-4o
๊ฒฐ๊ณผ๋ฅผ ๋๋ํ ๋ฐฐ์นํ ๊ฒ์ด๋ค. Claude ๋ชจ๋ธ์ ๊ฐ Case์์ ์
๋ ฅํ ๋จ๋ฉด ์น์(300x400 mm, 300x400 mm, 600x600 mm),
ํผ๋ณต ๋๊ป(25 mm), ์ํ๋ถ ์ฒ ๊ทผ ์ง๊ฒฝ ๋ฐ ๊ฐ์๋ฅผ ์์ ํ๊ฒ ๋ฐ์ํ๋ฉฐ, ์คํฐ๋ฝ๊ณผ ์ฃผ๊ทผ์ด ์ง์ ๋ ์ ์ ์กฐ๊ฑด์ ์ ํํ ๋ง์กฑํด ๋ถ์ฌ ๊ฐ ๊ฐ์ญ์ด๋ ๋ฐฐ์น
์ค์ฐจ๊ฐ ๋ฐ์ํ์ง ์๋๋ค. ๋ฐ๋ฉด GPT ๋ชจ๋ธ์ Case 1์์ ํ
๋๋ฆฌ์ ๋๋ฝ, Case 2,3 ์์๋ ํ๋ถ ์ฃผ๊ทผ ๋ฐฐ์น์ค๋ฅ๋ก, ์
๋ ฅ ํ๋ผ๋ฏธํฐ๋ฅผ ์ผ๊ด๋๊ฒ
์ค์ํ์ง ๋ชปํ๋ ์ค๋ฅ๊ฐ ๋ฐ๋ณต์ ์ผ๋ก ๋ํ๋ฌ๋ค. ๋ฐ๋ผ์ Fig. 4๋ ํ๋ผ๋ฏธํฐ ๋ณ๋ ์คํ์์๋ Claude 3.7 sonnet์ด ๋๋ฉด์ ์์ ์ ์ผ๋ก ์์ฑํ๋ ๋ฐ๋ฉด GPT-4o๋ ์ค๋ฅ๊ฐ ๋น๋ฒํจ์ ํ๋์ ๋น๊ตํ ์ ์๋
์ฆ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ค.
์ด์ฒ๋ผ ๊ธฐํํ์ ์ฉ์ด์ ์์น ๊ธฐ๋ฐ ์กฐ๊ฑด์ ๋ณํํ์ฌ ์ ์ํ๋ ๋ฐฉ์์ LLM์ด ๊ตฌ์กฐ์ ์ธ ์ ์ด ๊ด๊ณ๋ฅผ ์ ํํ ํด์ํ๊ณ ๊ตฌํํ๋ ๋ฐ ํต์ฌ์ ์ผ๋ก ์์ฉํจ์ ์ค์ฆํ์๋ค.
Fig. 4 Structural drawings automatically generated by Claude 3.7Sonnet (up) and GPTโ4o
(down) with the SโPrompt for a reinforcedโconcrete beam
4. ์คํ ๋ฐ ํ๊ฐ
4.1 ์คํ ์ค์
๊ตฌ์กฐํ ํ๋กฌํํธ์ ์ฑ๋ฅ์ ๊ฒ์ฆํ๊ธฐ ์ํด ์ฒ ๊ทผ์ฝํฌ๋ฆฌํธ ๋ณด ๋ถ์ฌ ๋จ๋ฉด๋ ์์ฑ ์๋๋ฆฌ์ค๋ฅผ ๊ฐ์ ํ์ฌ ์คํ์ ์ค๊ณํ์๋ค. ์์ ์ค๊ณํ S-Prompt๋ฅผ ๊ธฐ๋ฐ์ผ๋ก,
GPT-4o์ Claude 3.7 Sonnet ๋ ๋ชจ๋ธ์ด ๋์ผํ ์กฐ๊ฑด์์ ๊ตฌ์กฐ๋๋ฉด์ ์์ฑํ๋๋ก ํ์๋ค. ๊ฐ ๋ชจ๋ธ๋ณ๋ก ๋์ ์๋๋ฅผ ๋ณ๊ฒฝํด๊ฐ๋ฉฐ 200ํ์ฉ
๋ฐ๋ณต ์คํ์ ์ํํ์ฌ ์ถ๋ ฅ์ ์ฌํ์ฑ๊ณผ ์์ ์ฑ๋ ํ๊ฐํ์๋ค. ๋ํ ๋ชจ๋ ํ๊ฐ ์งํ์ ๋ํด 95% ์ ๋ขฐ๊ตฌ๊ฐ์ ๊ณ์ฐํ์ฌ ๊ฒฐ๊ณผ์ ํต๊ณ์ ์ ์์ฑ์ ํ์ธํ์๋ค.
์ด๋ฅผ ํตํด ๋ชจ๋ธ ์ถ๋ ฅ์ ๋ณ๋์ฑ์ ์ ๋์ ์ผ๋ก ๊ฒํ ํ๊ณ ์ฌํ ๊ฐ๋ฅ์ฑ์ ํ๋ณดํ์๋ค. ์ถ๋ ฅ๋ ๋๋ฉด๋ค์ ์ฌ์ ์ ์ค๋น๋ ์ ๋ต ๋๋ฉด๊ณผ ๋์กฐํ์ฌ ์ ํ๋๋ฅผ ๋ถ์ํ์๋ค.
๋น๊ต ํ๊ฐ ํญ๋ชฉ์ผ๋ก๋ (i) ๋ถ์ฌ ๊ฐ ๊ตฌ์ญ ์นจ๋ฒ ํ์, (ii) ๋ถ์ฌ ์น์ ์ ๋ณด ๋๋ฝ ๊ฐ์, (iii) ์ฒ ๊ทผ ๋ฐฐ๊ทผ ๋๋ฝ ๊ฐ์, (iv) ์คํฐ๋ฝ ๋๋ฝ
๊ฐ์, ๊ทธ๋ฆฌ๊ณ (v) ๋๋ฉด ์์ฑ ์๊ฐ(์ด)์ ์ ์ ํ์๋ค. ๋ ๋ชจ๋ธ์ ์ถ๋ ฅ์ ๋ํ์ฌ ์ด๋ฌํ ๋ค์ฏ ๊ฐ์ง ํญ๋ชฉ์ ๊ณ์ํ๊ฑฐ๋ ์ธก์ ํ ํ, ๋ชจ๋ธ ๊ฐ ์ฑ๋ฅ์
์ ๋์ ์ผ๋ก ๋น๊ตํ์๋ค.
4.2 ๊ฒฐ๊ณผ ๋ฐ ์ ๋ ํ๊ฐ
๊ฒฐ๊ณผ๋ฅผ ์์ฝํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค. Claude 3.7 Sonnet ๋ชจ๋ธ์ ํ๊ท 1.2ํ์ ๋ถ์ฌ ๊ฐ ๊ตฌ์ญ ์นจ๋ฒ, 0.4๊ฐ์ ์น์ ์ ๋ณด ๋๋ฝ, 0.65๊ฐ์
์ฒ ๊ทผ ๋ฐฐ๊ทผ ๋๋ฝ, 0.5๊ฐ์ ์คํฐ๋ฝ ๋๋ฝ์ ๋ณด์๊ณ , ํ๊ท 44.77์ด์ ์์ฑ ์๊ฐ์ ๊ธฐ๋กํ์๋ค. ๋ฐ๋ฉด GPT-4o ๋ชจ๋ธ์ ํ๊ท 2.2ํ์ ๊ตฌ์ญ ์นจ๋ฒ,
4.35๊ฐ์ ์น์ ์ ๋ณด ๋๋ฝ, 4.75๊ฐ์ ์ฒ ๊ทผ ๋ฐฐ๊ทผ ๋๋ฝ, 17.0๊ฐ์ ์คํฐ๋ฝ ๋๋ฝ์ ๋ณด์ฌ ์์ฑ ์๊ฐ์ ํ๊ท 56.67์ด๊ฐ ์์๋์๋ค. Fig. 5๋ ์ด๋ฌํ ๊ฒฐ๊ณผ๋ฅผ ์ ๋์ ์ผ๋ก ์ ๋ฆฌํ์ฌ ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ ์ฐจ์ด๋ฅผ ํ๋์ ๋ณด์ฌ์ค๋ค. ๊ฐ ํ๊ฐ ํญ๋ชฉ๋ณ ์ ํ๋ ๋ฌ์ฑ๋ฅ ๋ก ํ์ฐํ๋ฉด, Claude 3.7 Sonnet์
๋ถ์ฌ ๊ฐ ๊ฐ์ญ ๊ด๋ฆฌ85.0%, ์น์ ์ ๋ณด ํํ 96.7%, ์ฒ ๊ทผ ๋ฐฐ๊ทผ ์ ํ๋ 91.9%, ์คํฐ๋ฝ ์ฒ ๊ทผ ์ฒ๋ฆฌ 97.6%๋ก, 4๊ฐ ํญ๋ชฉ ํ๊ท 92.8%์
์ ํ๋๋ฅผ ๋ฌ์ฑํ์๋ค. ๋ฐ๋ฉด GPT-4o๋ ๋์ผ ํญ๋ชฉ์์ ๊ฐ๊ฐ 72.5%, 63.8%, 40.6%, 19.1%์ ๊ทธ์ณ, ํ๊ท 49.0% ์์ค์ ์ ํ๋๋ฅผ
๋ณด์๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก Claude 3.7 Sonnet ๋ชจ๋ธ์ ๋ชจ๋ ํ๊ฐ ํญ๋ชฉ์์ GPT-4o ๋ชจ๋ธ๋ณด๋ค ํ์ ํ ๋์ ์ ํ๋์ ์์ ์ฑ์ ๋ํ๋๋ค. ํนํ
์คํฐ๋ฝ ์ฒ ๊ทผ ๋ฐฐ์น ์ ํ๋์ ๊ฒฝ์ฐ Claude 3.7 Sonnet์ด 97.6%์ธ ๋ฐ ๋ฐํด GPT-4o๋ 19.1%์ ๋ถ๊ณผํ์ฌ, ์ฝ 78.5%p์ ์ฑ๋ฅ
์ฐจ์ด๊ฐ ํ์ธ๋์๋ค. ์ด๋ ๊ตฌ์กฐ๋๋ฉด๊ณผ ๊ฐ์ด ์ธ๋ฐํ ์ ์ฝ์กฐ๊ฑด์ด ๋ง์ ์์ฑ ์์
์์ ๋ชจ๋ธ ๊ฐ ์ฑ๋ฅ ๊ฒฉ์ฐจ๊ฐ ํด ์ ์์์ ๋ณด์ฌ์ค๋ค.
์ด๋ฌํ ์ฑ๋ฅ ์ฐจ์ด๋ฅผ ๋ถ์ํ ๊ฒฐ๊ณผ, Claude 3.7 Sonnet์ ์ฐ์ํ ์ฝ๋ ์์ฑ ๋ฐ ์์น ๊ณ์ฐ ๋ฅ๋ ฅ์ด ์ฃผ๋ ์์ธ์ผ๋ก ํ์
๋์๋ค. Anthropic(2025)์
๊ณต์ ๋ชจ๋ธ ์นด๋์ ๋ฐ๋ฅด๋ฉด, Claude 3.7 Sonnet์ SWE-bench, TAU-bench ๋ฑ ์ค์ ์ฝ๋ฉ ๋ฐ ์ํ ๊ณผ์ ๊ธฐ๋ฐ ๋ฒค์น๋งํฌ์์ ๋๊ธ
๋ชจ๋ธ ์ค ์ต๊ณ ์์ค์ ์ฑ๋ฅ์ ๊ธฐ๋กํ์๋ค. ๋ณธ ์ฐ๊ตฌ์ S-Prompt๋ ์ฌ๋ฌ ์ขํ ์ฐ์ถ์ ๊ธฐ๋ฐ ์ง์์ด๋ฅผ ํฌํจํ๊ณ ์๋ค. ์๋ฅผ ๋ค์ด โ์คํฐ๋ฝ ์ฒ ๊ทผ์ ์ธ์ฅ
์ฒ ๊ทผ ์ค์ฌ์์ ์ฒ ๊ทผ ์ง๋ฆ์ ์ ๋ฐ๋งํผ ์ด๊ฒฉํ๋คโ์ ๊ฐ์ ์ฐ์ฐ ์ง์นจ์ด ๋๋ฉด ์์ฑ์ ์๊ตฌ๋๋ค. ์ด๋ฌํ ์ง์นจ์ ์ ํํ ์คํํ๋ ค๋ฉด, ๋ชจ๋ธ์ด ์
๋ ฅ ๋ฌธ์ฅ์ ์ํ์์ผ๋ก
์ดํดํ์ฌ ์ ์ ํ SVG ๊ฒฝ๋ก(path) ์ฝ๋๋ก ๋ณํํ ์ ์์ด์ผ ํ๋ค. Zou et al.(2024)์ VGBench ์คํ์์๋ ์ ์ฌํ ๊ฒฐ๊ณผ๊ฐ ๋ณด๊ณ ๋์๋๋ฐ, ์ฝ๋ ๋ฐ ์๋ฆฌ ์ถ๋ก ๋ฅ๋ ฅ์ด ๋ฐ์ด๋ LLM์ผ์๋ก ๋ฒกํฐ ๊ทธ๋ํฝ ์์ฑ ์ ํ๋๊ฐ ๋์๋ค. Claude
3.7 Sonnet ๋ชจ๋ธ์ ์ด๋ฌํ ์ฝ๋ฉ ๋ฐ ์์น ๊ณ์ฐ ์ธก๋ฉด์์ GPT-4o๋ณด๋ค ๊ฐ์ ์ ๋ณด์๊ณ , ์ด๋ ๊ตฌ์กฐ๋๋ฉด ์์ฑ ์ ํ๋์ ํฐ ๊ฒฉ์ฐจ๋ก ์ด์ด์ก๋ค. ํํธ
GPT-4o ๋ชจ๋ธ์ ๊ฒฝ์ฐ ๋์ผํ ์
๋ ฅ์ ๋ํด์๋ ์ ๋ณด๋ฅผ ์ถฉ๋ถํ ํ์ฉํ์ง ๋ชปํ๊ณ ์ผ๋ถ ์๊ตฌ ์ฌํญ์ ๋์น๋ ๊ฒฝํฅ์ด ๊ด์ฐฐ๋์๋๋ฐ, ์ด๋ ๋ชจ๋ธ์ ๋งฅ๋ฝ ํ์ฉ
ํจ์จ์ฑ์ด ๋ฎ์ ๋ฐ ๊ธฐ์ธํ๋ ๊ฒ์ผ๋ก ํ๋จ๋๋ค.
ํ๋กฌํํธ ๊ตฌ์กฐํ์ ๋ฐ๋ฅธ ํจ๊ณผ๋ ๋ถ์ํ์๋ค. Fig. 6์ ์
๋ ฅ ํ๋กฌํํธ์ ํ ํฐ ์ ์ฆ๊ฐ์ ๋ฐ๋ฅธ ๋ ๋ชจ๋ธ์ ์ถ๋ ฅ ์ ํ๋ ๋ณํ๋ฅผ ๋ํ๋ธ ๊ทธ๋ํ์ด๋ค. ํ๋กฌํํธ ๊ธธ์ด๋ฅผ ์ฝ 1500 ํ ํฐ์์ 2289 ํ ํฐ์ผ๋ก
์ฆ๊ฐ์์ผฐ์ ๋ Claude 3.7 Sonnet์ ์ ํ๋๋ 55.4% โ 92.8%๋ก +37.4%p ํฅ์๋ ๋ฐ๋ฉด, GPT-4o๋ 35.6% โ 49.0%๋ก
+13.4%p ์์นํ๋ ๋ฐ ๊ทธ์ณค๋ค. ํนํ Claude 3.7 Sonnet์ ์
๋ ฅ ํ ํฐ ์๊ฐ ์ฝ 1647 tokens๋ฅผ ๋์ด์๋ ์ง์ ๋ถํฐ ์ ํ๋๊ฐ ๊ธ๊ฒฉํ
ํฅ์๋ ๋ฐ๋ฉด, GPT-4o๋ ์ ์ฒด ๊ตฌ๊ฐ์์ ์ ํ๋ ๋ณํ๊ฐ ๋ฏธ๋ฏธํ์๋ค. ์ด๋ Claude ๋ชจ๋ธ์ด ๊ธด ํ๋กฌํํธ๋ก๋ถํฐ ์ ์๋ฏธํ ์ ๋ณด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด์ํ์ฌ
์ฑ๋ฅ ํฅ์์ผ๋ก ์ฐ๊ฒฐ์ํค๋ ๋ฐ๋ฉด, GPT-4o๋ ๋์ผํ ์ถ๊ฐ ์ ๋ณด์ ๋ํ ํ์ฉ๋ฅ ์ด ๋ฎ๋ค๋ ์ ์ ์์ฌํ๋ค. ์ด๋ฌํ ๊ฒฐ๊ณผ๋ Liu et al.(2024)๊ณผ Hosseini et al.(2025) ์ ์ง์ ๊ณผ ๋งฅ๋ฝ์ ๊ฐ์ดํ๋ค. ๋๋ถ๋ถ์ LLM์ ์ ๊ณต๋ ๊ธด ์ปจํ
์คํธ์ ์ ๋ฐ ์ดํ๋ง ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ๋ฉฐ, ์ ๋ณด๊ฐ ํ๋กฌํํธ ๋ด ์ด๋์ ์์นํ๋์ง์ ๋ฐ๋ผ
๋ชจ๋ธ์ ์๋ต ์ ํ๋๊ฐ ๋ฌ๋ผ์ง๋ ์ด๋ฅธ๋ฐ ๊ธธ์ด ๋ฏผ๊ฐ์ฑ(length sensitivity) ํ์์ ๋ณด์ธ๋ค. ๊ทธ๋ฌ๋ Claude 3.7 Sonnet์ ๊ฒฝ์ฐ
๊ธด ์
๋ ฅ์ ์ค๊ฐ ๋ถ๋ถ์ ์๋ ์ ๋ณด๊น์ง ๋น๊ต์ ์์ ์ ์ผ๋ก ์ฒ๋ฆฌํ์ฌ ์ถ๋ ฅ์ ๋ฐ์ํจ์ผ๋ก์จ, ์ค์ฅ๋ฌธ์ ํ๋กฌํํธ ํ๊ฒฝ์์๋ ๋์ ์ฑ๋ฅ์ ์ ์งํ๋ ๊ฒ์ด ํ์ธ๋์๋ค.
Claude ๋ชจ๋ธ์ ์ด๋ฌํ ์ฒ๋ฆฌ ์์ ์ฑ๊ณผ ์ ๋ณด ํ์ฉ ํจ์จ์ฑ์ ๊ตฌ์กฐํ ํ๋กฌํํธ ๊ธฐ๋ฒ์ ํจ๊ณผ๋ฅผ ๊ทน๋ํํ๋ ๋ฐ ๊ธฐ์ฌํ ๊ฒ์ผ๋ก ํ๋จ๋๋ค. ๊ฒฐ๊ตญ ๊ตฌ์กฐ๋๋ฉด ์๋ํ
์ฑ๋ฅ์ ๋์ด๊ธฐ ์ํด์๋ LLM์ ์ปจํ
์คํธ ์ฐฝ ํฌ๊ธฐ ์์ฒด๋ฟ๋ง ์๋๋ผ, ์ฆ๊ฐ๋ ์
๋ ฅ์ ์ค์ ๋ก ํ์ฉํ ์ ์๋ ๋ชจ๋ธ์ ๋ด๋ถ ์ญ๋์ด ์ค์ํจ์ ์ ์ ์๋ค.
๋ง์ง๋ง์ผ๋ก, ๊ตฌ์กฐํ ํ๋กฌํํธ ์ ์ฉ ์ฌ๋ถ์ ๋ฐ๋ฅธ ์ถ๋ ฅ ์ฑ๋ฅ์ ๋น๊ตํ์๋ค. Fig. 7์ ๋์ผํ ๊ตฌ์กฐ ๋ถ์ฌ์ ๋ํด ์ผ๋ฐ ํ๋กฌํํธ์ ๊ตฌ์กฐํ๋ S-Prompt๋ฅผ ์ ์ฉํ์ฌ ์ป์ ์ถ๋ ฅ ๊ฒฐ๊ณผ๋ฅผ ๋น๊ตํ ๊ฒ์ด๋ค. ์ผ๋ฐ ํ๋กฌํํธ์ ๊ฒฝ์ฐ ๋ชจ๋ธ์ด ์ผ๋ถ
์ฒ ๊ทผ ๋ฐฐ์น๋ฅผ ๋๋ฝํ๊ฑฐ๋ ์น์๋ฅผ ์๋ชป ๊ธฐ์
ํ๋ ๋ฑ์ ์ค๋ฅ๋ฅผ ๋ฒํ ๋ฐ๋ฉด, S-Prompt๋ฅผ ์ ์ฉํ ๊ฒฝ์ฐ ์ด๋ฌํ ์ค๋ฅ๊ฐ ์๋น ๋ถ๋ถ ๊ฐ์ ๋์๋ค. ํนํ ์์
3์ฅ์์ ๋
ผ์ํ ํ๋ผ๋ฏธํฐ ์๋จ ๋ฐฐ์น, ์์ญ ์ขํํ, ์ํ์ ์กฐ๊ฑด ๋ถ์ฌ์ ๊ฐ์ S-Prompt ์ ๋ต๋ค์ด ๊ฒฐํฉ๋์ด, ์ฒ ๊ทผ ๊ฐ๊ฒฉ ๋ฐ ํผ๋ณต๋๊ป ๋ฑ์ ์ธ๋ถ
์กฐ๊ฑด๊น์ง ์ ํํ ์ถฉ์กฑํ๋ ๋๋ฉด์ ์ป์ ์ ์์๋ค. ์ ๋์ ์ผ๋ก๋ S-Prompt ์ ์ฉ ์ ์ถ๋ ฅ ์ ํ๋๊ฐ ์ ์๋ฏธํ๊ฒ ํฅ์๋์๋๋ฐ, ์ด๋ S-Prompt๊ฐ
LLM์ ํ๊ฐ๊ณผ ์ ๋ณด ๋๋ฝ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ ์ดํจ์ ๋ท๋ฐ์นจํ๋ค. ๊ฒฐ๊ตญ ๊ตฌ์กฐํ ํ๋กฌํํธ ๊ธฐ๋ฒ์ ๋ณต์กํ ๊ตฌ์กฐ์ค๊ณ ์ ์ฝ์ LLM์ด ์ดํดํ๊ธฐ ์ฌ์ด ํํ๋ก
์ ๋ฌํจ์ผ๋ก์จ, ๋๋ฉด ์์ฑ ํ์ง์ ํฌ๊ฒ ๋์ผ ์ ์์๋ค.
Fig. 5 Quantitative evaluation of generated drawings: mean error counts per category
(area collision, missing dimensions, rebar omissions, stirrup omissions) and average
generation time (n=200 runs, 95%CI)
Fig. 6 Prompt length vs. drawing Accuracy Score (%) for Claude 3.7 Sonnet and GPT-4o.
Markers average 10 drawings per token size; score per Fig. 5 (1 - mean errors / 8
ร 100)
Fig. 7 Impact of Structured Prompting (SโPrompt) versus vanilla prompting on drawing
fidelity; outputs correspond to the same beam specification
5. ๊ฒฐ๋ก ๋ฐ ํฅํ ์ฐ๊ตฌ
๋ณธ ์ฐ๊ตฌ๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM) ๊ธฐ๋ฐ ๊ตฌ์กฐ๋๋ฉด ์๋ํ๊ฐ ์ค๋ฌด์ ์ ์ฉ ๊ฐ๋ฅํ ์์ค์ ์ ๋ฐ๋์ ์์ ์ฑ์ ํ๋ณดํ ์ ์์์ ์คํ์ ์ผ๋ก ์
์ฆํ์๋ค.
ํนํ Claude 3.7 Sonnet๊ณผ GPT-4o๋ฅผ ๋์์ผ๋ก ์ํํ ๋น๊ต ์คํ์ ํตํด, ๊ตฌ์กฐํ๋ ์
๋ ฅ ๋ฐฉ์์ธ S-Prompt๊ฐ ๋๋ฉด ์์ฑ ์ ํ๋,
์ ๋ณด ์์ฑ๋, ์ขํ ์ผ๊ด์ฑ ๋ฑ ๋ค์ํ ์ธก๋ฉด์์ ์ถ๋ ฅ ํ์ง์ ํฅ์์ํด์ ํ์ธํ์๋ค. S-Prompt๋ ํ๋ผ๋ฏธํฐ์ ๋ช
์์ ์ ์ธ, ์์น ๊ธฐ๋ฐ ๋ฐฐ๊ทผ ์กฐ๊ฑด,
ํ์ ์ถ๋ ฅ ์ ์ฐจ ์์ฝ ๋ฑ์ ํตํด LLM์ ํ๊ฐ ํ์๊ณผ ์ ๋ณด ๋๋ฝ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ ์ดํ์์ผ๋ฉฐ, ๋ชจ๋ธ ํน์ฑ์ ๋ง๊ฒ ํ๋กฌํํธ ์กฐ์ ๋ง์ผ๋ก๋ ๋๋ฉด ์์ฑ
์ฑ๋ฅ์ ํฐ ์ฐจ์ด๋ฅผ ์ ๋ํ ์ ์์๋ค. ์ด๋ ๋จ์ผ LLM์ ์์กดํ๋ ๋ฐฉ์๋ณด๋ค, ์ฌ์ฉ ๋ชฉ์ ์ ๋ฐ๋ผ ๋ค์ํ LLM์ ํ๊ฐโ
์กฐํฉํ๊ณ ๊ฐ ๋ชจ๋ธ์ ์ต์ ํ๋ ํ๋กฌํํธ๋ฅผ
์ ์ฉํ๋ ์ ๋ต์ด ๊ฑด์ถ ์ค๊ณ ์๋ํ์ ์ฑ๋ฅ์ ๊ทน๋ํํ ์ ์์์ ์์ฌํ๋ค.
์ด๋ฌํ ๊ฒฐ๊ณผ๋ ๋จ์ง ๊ตฌ์กฐ ๋๋ฉด ์๋ํ ๊ฐ๋ฅ์ฑ์ ์
์ฆํ ๋ฐ ๊ทธ์น์ง ์๋๋ค. ๊ฑด์ถ ๊ตฌ์กฐ์ค๊ณ ์
๋ฌด๋ ๋ฐ๋ณต์ฑ๊ณผ ๊ท์น์ฑ์ด ๋์ ์์
์ด๋ฏ๋ก, LLM ๊ธฐ์ ์ด ๊ฐ์ฅ
๋จผ์ ์ค๋ฌด ๋์
์ด ๊ฐ๋ฅํ ๋ถ์ผ ์ค ํ๋์ด๋ค. ์ผ๋ จ์ ์คํ ๊ฒฐ๊ณผ, ๊ฑด์ถ ๋ถ์ผ์์๋ LLM ๊ธฐ์ ์ด ์ถฉ๋ถํ ํ์ฉ๋ ์ ์์์ ํ์ธํ์์ผ๋ฉฐ, ์ด์ ๊ฑด์ถ์ค๊ณ์ ๋ฐ์
์ธ๊ณต์ง๋ฅ(AI) ๊ธฐ์ ์ ๋์
ํ๊ธฐ์ ์ ์ ํ ์๊ธฐ๋ผ๊ณ ํ๋จ๋๋ค. ์ด์ ๊ฐ์ด ๋ณธ ์ฐ๊ตฌ๋ฅผ ํตํด LLM ๊ธฐ๋ฐ ๊ตฌ์กฐ๋๋ฉด ์๋ํ์ ๊ฐ๋ฅ์ฑ์ ํ์ธํ์๊ณ , ์ ์๋
S-Prompt ์ ๊ทผ๋ฒ์ด ํฅํ ๊ฑด์ถ์ค๊ณ ์๋ํ ๋ถ์ผ์์ ๋์ ์ค์ฉ์ฑ๊ณผ ํ์ฅ ๊ฐ๋ฅ์ฑ์ ์ง๋ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค. ๋ค์ํ LLM ๋ชจ๋ธ์ ์ฉ๋์ ํน์ฑ์ ๋ง๊ฒ
์ ํํ๊ณ , ์ด๋ฅผ S-Prompt๋ก ์ ๋ฐ ์ ์ดํ๋ ๋ฐฉ์์ ํฅํ ๊ฑด์ถ ์ฐ์
์ ์์ฐ์ฑ๊ณผ ์ ๋ฐ๋๋ฅผ ๋์์ ๋์ด์ฌ๋ฆด ์ ์๋ ์ค์ง์ ๋ฐฉ๋ฒ๋ก ์ด ๋ ๊ฒ์ด๋ค. ๋์๊ฐ
๋จ์ ๋ชจํ ์ผ๋ํ ์์ค์ ๋จธ๋ฌผ๋ฌ ์๋ ํ์ฌ ์์ค์ ๋์ด, Tํ๋ณดโ
๋ณตํฉ๋ณด ๋ฑ ๋ค์ํ ๋ถ์ฌ ํ์์ ์ง์ํ๊ณ ๋ ์ด์ด ๊ตฌ๋ณ ๊ธฐ๋ฅ์ ๊ฐ์ถ ์์ค๊น์ง ํ๋ํ ๊ณํ์ด๋ค.
์ด๋ฅผ ํตํด ์ค๊ณ-์ ์ ๋จ๊ณ์์๋ ์ฆ์ ํ์ฉํ ์ ์๋ ์์ค์ ๊ณ ๋ํํ ์์ ์ด๋ค.
ํฅํ ์ฐ๊ตฌ๋ก, ๋ณธ ์ฐ๊ตฌ์์๋ ๋จ๋ฉด ์ ๋ณด๋ ํ
์คํธ ์ง์์ด๋ฟ ์๋๋ผ ์์ฑ์ฌ์ง๊ณผ ๊ฐ์ ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ์
๋ ฅ์ผ๋ก ํ์ฌ ์ธ๋ฒฝ์ ์ถ์ถ๋ถํฐ ๊ตฌ์กฐ ๋ชจ๋ธ ์์ฑ๊น์ง ์ํํ๋
3์ฐจ์ S-Prompt ํ์ดํ๋ผ์ธ์ ๊ฐ๋ฐํ ๊ณํ์ด๋ค. Fig. 8์ ์ ์ํ๋ ์ฐจ์ธ๋ ํ์ฅ ๊ฐ๋
์ ๋ณด์ฌ์ฃผ๋ ์๋ก์, ๊ฑด๋ฌผ ์ธ๊ณฝ ์ฌ์ง์ผ๋ก๋ถํฐ LLM์ด ๊ฑด๋ฌผ์ ๊ฐ๋ต ์ธํ์ ์ ์ธ์โ
์ถ์ถํ๊ณ , ์ด๋ฅผ ํ ๋๋ก ๊ตฌ์กฐ ํ๋ ์ ๋ชจ๋ธ๊ณผ
๋๋ฉด์ ์์ฑํ๋ ๊ณผ์ ์ ๊ตฌ์ํ๊ณ ์๋ค. ์ด๋ ๊ฑด๋ฌผ์ ๋ถ์โ
์ค๊ณโ
๋ฌธ์ํ ์ ๊ณผ์ ์ LLM์ ํตํด ์๋ํํ ์ ์๋ค๋ ๊ฐ๋ฅ์ฑ์ ์ ์ํ๋ฉฐ, ๊ตฌ์กฐ ์ค๊ณ ์๋ํ์
๊ฑด์ถ์ ๋ณด ์ถ์ถ์ ๋์์ ์คํํ๋ ์๋ก์ด ์ ์ฃผ๊ธฐ ์ค๊ณ ํจ๋ฌ๋ค์์ผ๋ก ์ด์ด์ง ์ ์๋ค.
Fig. 8 Concept for future work: LLMโbased extraction of building outlines from faรงade
images followed by automatic generation of structural frames and drawings
๊ฐ์ฌ์ ๊ธ
๋ณธ ์ฐ๊ตฌ๋ ํ๊ตญ์ฐ๊ตฌ์ฌ๋จ ๋ํ์ค์ ์ฐ๊ตฌ์์ง์์ฌ์
โICT ์ต๋ณตํฉ ๊ธฐ์กด๊ฑด์ถ๋ฌผ ๋ด์ง๋ฆฌ๋ชจ๋ธ๋ง ์ฐ๊ตฌ์โ (RS-2018-NR031076) ๋ฐ ๊ตญํ ๊ตํต๋ถ ๋์งํธ
๊ธฐ๋ฐ ๊ฑด์ถ์๊ณต ๋ฐ ์์ ๊ฐ๋ฆฌ ๊ธฐ์ ๊ฐ๋ฐ ์ฌ์
์ ์ฐ๊ตฌ๋น์ง์(RS-2022-00143493)์ ์ง์์ ๋ฐ์ ์ํ๋์์ต๋๋ค.
References
Anthropic (2024), Claude 3.7 Sonnet Model Card, Anthropic, San Francisco.

An, J.-H., and Lim, N.-G. (2018), A study on the application of BIM in reinforced
concrete construction. Journal of the Korea Institute for Structural Maintenance and
Inspection, 22(1), 158โ166 (in Korean).

Chen, S., Feng, B., Li, J., and Xu, Y. (2024), OmniSVG: Large-Scale Image-to-Vector
Generation with Omni-Modality, arXiv preprint arXiv:2402.12345.

Du, C., Esser, S., Nousias, S., and Borrmann, A. (2024), Text2BIM: Generating Building
Models Using a Large Language Model-Based Multi-Agent Framework, arXiv preprint arXiv:
2408.08054.

Fahiem, M. A., and Farhan, M. S. (2007), Bidirectional SVGโDXF translation for CAD
data exchange. Computer-Aided Design and Applications, 4(1-4), 413-421.

Guo, X., Wang, L., and Yuan, Q. (2025), VGBench: A Benchmark for Vector Graphic Understanding
and Generation with Large Language Models, arXiv preprint arXiv:2502.01234.

Hosseini, M., Tavakoli, A., and Kaur, S. (2025), Length Matters: Evaluating Context
Utilization in Large Language Models, arXiv preprint arXiv:2504.04567.

Kim, N., and Chin, S. (2019), Automatic extraction of rebar placement from structural
drawings using computer vision techniques, Automation in Construction, 106, 102883.

Kwon, H., Lee, S., and Kim, J. (2025), Prompt positioning matters: Improving engineering
accuracy in large language models. In Proceedings of the IEEE Conference on AI Engineering
2025 (pp. 512-521). IEEE, New York.

Lee, G., Jang, S., and Hyun, S. (2024), A Generalized LLM-Augmented BIM Framework:
Application to a Speech-to- BIM System, arXiv preprint arXiv:2409.18345.

Liang, H., Kalaleh, M. T., and Mei, Q. (2025), Integrating Large Language Models for
Automated Structural Analysis, arXiv preprint arXiv:2504.09754.

Liu, Y., Zhao, Z., and Zhang, P. (2024), Length Sensitivity in Transformer-Based Large
Language Models, arXiv preprint arXiv:2405.01529.

Madireddy, S., Gao, L., Din, Z. U., Kim, K., Senouci, A., Han, Z., and Zhang, Y. (2025),
Large Language Model-Driven Code Compliance Checking in Building Information Modeling,
Electronics, 14(11), 2146-2150.

Mouselinos, S., Kostas, D., and Li, R. (2024), Beyond Lines and Circles: Unveiling
the Geometric Reasoning Gap in Large Language Models, arXiv preprint arXiv:2402.03877.

Mun, J.-H. (2024), Verification of reinforcement errors and proposal of a flexural
ductility model for precast concrete shear walls using BIM. Journal of the Korea Institute
for Structural Maintenance and Inspection, 28(3), 27-36. https://doi.org/10.11112/jksmi.2024.28.3.27
(in Korean).

OpenAI (2024), GPT-4o Technical Report, OpenAI, San Francisco.

Qin, S., Guan, H., Liao, W., and Gu, Y. (2024), Intelligent Design and Optimization
System for Shear Wall Structures Based on Large Language Models and Generative Artificial
Intelligence, Journal of Building Engineering, 95, 109996.

Qiu, Y. (2021), Sketch2BIM: From Freehand Sketches to BIM Models via Deep Learning,
Automation in Construction, 126, 103670.

Quint, M. (2003), Scalable Vector Graphics (SVG) in Building Design: Web-Based Standards
for CAD Interoperability, Proceedings of the 8th International Conference on Web3D
Technology, ACM, New York, pp. 23-31.

Tang, K., Wu, L., Han, T., and Chen, X. (2025), LEGO-Puzzles: How Good Are MLLMs at
Multi-Step Spatial Reasoning?, arXiv preprint arXiv:2503.19990.

Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E. H., Le,
Q. V., and Zhou, D. (2022), Chain-of-Thought Prompting Elicits Reasoning in Large
Language Models, arXiv preprint arXiv:2201.11903.

Yang, B., Xie, T., Lin, B., and Deng, Y. (2023), ReAct: Synergizing Reasoning and
Acting in Language Models, arXiv preprint arXiv:2210.03629.

Yao, S., Yu, D., Zhao, J., Shafran, I., Griffiths, T. L., Cao, Y., and Narasimhan,
K. (2023), Tree of Thoughts: Deliberate Problem Solving with Large Language Models,
arXiv preprint arXiv:2305.10601.

Zou, X., Li, Y., and Huang, J. (2024), VGBench: A Comprehensive Benchmark for Vector
Graphics Understanding and Generation, arXiv preprint arXiv:2406.04222.
