'논문 일기'시리즈는 본격적으로 논문을 작성하기 시작한 5학기에 겪었던 주제를 선택하는 방법부터 최종적으로 논문을 제출하기까지의 과정을 다시 돌아보며 글로 남기고, 이제 애증이 깃든 논문을 떠나보내려 한다. 이 글이 대학원을 준비하고 있거나 이미 석사 과정을 밟고 있는 분들께 조금이라도 도움이 되길 바란다.
논문 일기 1편 - 주제 선정
들어가며
'주제 탐색' 과정에서 논문의 방향을 설정했다면, 본격적으로 뚜렷한 그림을 그릴 단계이다. 논문은 투고 직전에 주제를 변경하는 사례도 있으므로 여러 경우의 수를 열어놓는 것이 좋다. 내 논문의 경우 주제를 탐색하고 원래 '고속도로 속도 예측'을 주제로 설정했으나 기존 연구들과의 차별성 부분에서 부족하다는 생각이 들어 '고속도로에서 발생하는 Event 예측'으로 주제를 변경했다. 따라서 변경된 주제에 대해 어떤 내용을 작성할 수 있는지, 학술적 의의가 있는지, 개연성이 있는지를 검증하는 과정을 소개한다.
고속도로 이벤트 예측 모델 연구
먼저 논문의 주제는 '고속도로 이벤트 예측 모델 연구'로써 히트맵 시각화와 CNN을 활용하여 모델을 개발한다. 여기서 말하는 이벤트는 고속도로를 통행할 때 정체나 혼잡에 영향을 주는 작업, 고장, 장애물, 사고, 악천후 등을 말한다. 논문에서 활용할 데이터는 고속도로에 약 1km 간격으로 설치된 차량검지기로 수집한 속도, 교통량, 점유율이다. 이 데이터를 활용하여 각 변수의 변화를 히트맵으로 시각화하여 분석 후 예측 모델의 기반이 되는 근거를 제시한다.
연구의 배경 및 목적
고속도로는 한정된 자원으로 무분별한 설치가 불가능하다. 따라서 우리는 고속도로 관리 시스템으로 자원을 효율적으로관리하여 통행 효율을 최대화해야 한다. 또한 고속도로에서 사고가 발생하면 정체로 인한 2차 사고의 우려가 있다. 따라서 예측을 통한 즉각적인 대응으로 도로의 안전을 향상시킨다. 이와 같이 교통 안전과 교통 관리 측면에서 고속도로에서 발생하는 이벤트를 예측하는 것은 원활한 교통 흐름을 유지하기 위해 필수적이다.
연구 방법론 테스트
모델을 개발하기 위한 데이터셋은 많은 학습 데이터가 필요하지만, 먼저 1일치 데이터를 활용하여 이 연구의 가능성에 대해 먼저 탐구한다. 1일치 데이터로 학습 이미지와 라벨을 생성하여 학습 후, 정확도를 통하여 정말 이 예측이 가능한 것인지에 대해 확인하는 과정을 거쳐야 한다. 다음은 첫 번째 시나리오에 대한 조건이다.
첫 번째, 예측 이벤트의 종류는 차량증가/정체, 고장, 장애물, 사고, 작업, 강우, 강풍, 안개, 노면습기로 총 9가지나 되기 때문에 분류가 필요하다고 생각했다. 따라서 9가지의 이벤트를 3가지로 분류했다. Type1은 차량증가/정체, Type2는 강우, 강풍, 안개, 노면습기, Type3은 고장, 사고, 작업, 장애물로 구분했다.
두 번째는 데이터셋의 범위이다. 데이터셋의 공간적 범위는 경부고속도로 서울 방향으로 설정하고, 시간적 범위는 2024년 3월 7일로 설정했다.
세 번째는 속도, 교통량, 점유율 3가지 변수 중 도로의 상황을 가장 잘 나타내는 변수라고 생각했기에 히트맵을 생성하기 위한 변수로 '속도'를 선택했다.
위와 같은 조건으로 생성한 히트맵은 위와 같다. 왼쪽부터 차례대로Type1, 2, 3에 대한 결과 중 1개씩 선택한 이미지이다. 정확도는 93%로 생각보다 결과가 잘 나왔지만, 이벤트를 분류함에 있어 개연성이 부족하다는 결론을 내렸다. 하지만, 테스트로 1일치를 분석했음에도 유의미한 결과가 나와 조금 더 구체적으로 범위를 설정하여 분석을 진행하기로 했다.
'Etc' 카테고리의 다른 글
논문 일기 1편 - 주제 탐색 (0) | 2025.02.06 |
---|---|
[모니터링] 파이썬을 활용한 메모리 사용량 확인 - psutil, sys (2) | 2025.01.07 |
[KoNLPy] Mac에서 KoNLPy 설치 - OpenJDK부터 Java 설정까지 (0) | 2025.01.01 |
[도커] Docker 명령어 아카이브 (0) | 2024.12.16 |
[Oracle SQL] 날짜 데이터 필터링하는 4가지 방법 (5) | 2024.12.02 |