Annual Conference of KIPS (한국정보처리학회:학술대회논문집)
Korea Information Processing Society
- Semi Annual
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
Domain
- Information/Communication > Information Processing Theory
2024.10a
-
WordNet, Freebase, Wikidata와 같은 대규모 지식베이스에 대한 딥러닝 연구가 활발히 진행되고 있으나 이에 관한 온톨로지 매칭 연구는 거의 연구가 미비한 상태이다. 본 연구에서는 효율적인 온톨로지 매칭 방법을 개발하기 위해 데이터 수집 및 전처리, 텍스트 유사도 계산, 그리고 텍스트 유사도에 따른 결과 매칭의 세 가지 순차적 단계로 구성된 하나의 새로운 방법을 제안한다. 성능평가는 정보검색 분야에서 널리 활용되고 있는 재현율, 정밀도, F-측정값을 사용하였는데 제안한 방법이 기존의 모든 방법들보다 성능이 우수함을 보였다.
-
전통적으로 컴퓨팅 자원을 많이 필요로 하는 기초과학 분야 뿐만 아니라 최근 딥러닝, ChatGPT와 같은 인공 지능 분야에서도 대규모의 컴퓨팅 자원에 대한 요구가 지속적으로 증가하고 있다. 그러나 스케줄러 기반으로 운영되는 기존의 HPC 클러스터의 경우 성능 최적화를 위해 구성된 소프트웨어 스택의 경직성으로 인해 새로운 서비스 도입에 어려움이 있다. 이러한 어려움을 해결하기 위해 본 논문에서는 컨테이너 기반의 가상화 기술로 개발된 MyKSC 서비스를 소개한다. MyKSC 는 기존의 HPC 클러스터와 쿠버네티스 클러스터가 공존하는 약 결합 아키텍쳐를 기반으로 설계되어 슈퍼컴퓨터 운영 센터에서는 기존의 소프트웨어 스택 변경 없이 손쉽게 적용할 수 있다. 또한 컨테이너 가상화 기술이 적용되어 사용자 맞춤형 서비스가 가능하며 웹 기반의 그래픽 사용자 인터페이스를 통해 슈퍼컴퓨터를 처음 사용하는 사용자도 쉽게 슈퍼컴퓨터를 활용할 수 있다.
-
최근 고성능 컴퓨팅(HPC) 환경에서는 이기종 컴퓨팅 자원의 보편화로 인해 다양한 하드웨어 아키텍처에서의 프로그램 최적화가 필수적이다. 이에 따라 수작업 없이도 하드웨어에 맞춤형 최적화를 자동으로 수행할 수 있는 오토튜닝 기술의 중요성이 커지고 있다. 본 연구에서는 Apache TVM을 활용하여 HPC 워크로드에서의 성능 최적화 가능성을 탐구하였다. 밀집 행렬 연산(GEMM)과 희소 행렬 연산(SpMM)을 주요 워크로드로 설정하고, 국가슈퍼컴퓨터센터의 5호기 누리온에서 실험을 진행하였다. GEMM 연산에서는 누리온 KNL과 Skylake 노드에서 각각 209배, 87배의 성능 향상을 확인하였고, SpMM 연산에서는 BCSR 포맷 기준으로 최대 117배, 10배의 성능 향상이 이루어졌다. 본 연구는 Apache TVM이 인공지능 분야를 넘어 HPC 워크로드에서도 성능 최적화에 유효한 도구임을 시사하며, 향후 다양한 이기종 컴퓨팅 환경에의 적용 가능성을 제시한다.
-
KISTI 슈퍼컴퓨팅인프라센터에서는 AI 연구자들을 위해 GPU기반의 클러스터 시스템인 뉴론을 구축하여 서비스하고 있다. 뉴론은 기본적으로 작업 배치 스케줄러인 SLURM을 통해 자원 분배 서비스를 제공하고 있다. 최근 컨테이너 이미지 기반의 클라우드 서비스에 대한 요구가 많아지면서 뉴론에서도 컨테이너 오케스트레이션 툴을 활용한 서비스인 웹 기반의 MyKSC를 제공하고 있다. 본 논문에서는 작업 배치 스케줄러와 컨테이너 오케스트레이션 툴을 활용한 이중 클러스터 서비스 환경을 구현하는 기법에 대해서 소개한다.
-
Eun-Seo Jung;Yu-Min Roh;Do-Ye Lim;Hui-Su Ki;Keun-Chang Kawk;Chan-Uk Yeom 16
본 연구는 간경화 예측을 위한 다양한 머신러닝 모델의 성능을 비교하여 최적의 예측 모델을 찾는 것을 목표로 한다. Kaggle의 "Cirrhosis Prediction Dataset"을 활용해 Random Forest 알고리즘으로 중요한 변수 4개(N_Days, Platelets, Prothrombin, Albumin)를 선정하고, grid-ANFIS(grid partitioning-Adaptive Neuro Fuzzy Inference System), subtractive-ANFIS(subtractive-Adaptive Neuro Fuzzy Inference System), FCM(Fuzzy Cluster means) 모델을 평가하였다. 평가 지표로RMSE를 사용하였으며, grid-ANFIS 모델이 가장 우수한 성능을 보였다. 본 연구는 간경화 예측 및 진단의 정확성을 높이는 데 기여할 수 있을 것으로 기대된다. -
다양한 AI 서비스들이 보급되면서 고성능 계산 자원에 대한 요구가 증대하고 있으며 이를 위해 여러 이기종 계산 자원들을 수용할 수 있는 시스템 아키텍쳐 기술들이 발표되고 있다. 특히 계산 자원들의 수용을 위한 시스템 버스 기술에 대한 관심이 높아지고 있다. 본 연구는 여러 새로운 시스템 버스들 속에서도 표준 시스템 버스라 할 수 있는 PCIe 버스를 대상으로 하고 있는데 PCIe 서브시스템의 상태를 실시간으로 모니터링하기 위한 도구를 제안하고 그 구현 결과를 소개한다.
-
다양한 AI 서비스들의 확산으로 특수 목적형 고성능 시스템에 대한 관심이 증가하면서, PCIe 버스를 인터커넥션 네트워크로 사용하는 사례가 늘고 있다. 본 연구에서는 NTB를 활용한 PCIe 네트워크의 통신 성능을 TCP를 사용하는 방법과 NTB 모듈에 직접 접근하는 방법으로 나누어 측정하고 그 결과와 의미를 분석하였다. 두 가지 방법들이 성능에서 상이한 패턴을 보이기 때문에 PCIe 네트워크를 사용할 시스템의 성능 요구 사항에 따라 그에 부합하는 통신 방법을 선택해야 할 것으로 예상된다.
-
본 논문에서는 LiDAR 데이터와 스테레오 이미지를 융합하여 고품질 3D 표현을 생성하는 새로운 접근 방식을 제안한다. 제안하는 방법은 LiDAR 포인트 클라우드와 스테레오 비전을 통해 3D 포인트를 추출하는 것에서 시작하며, 이후 스테레오 비전 포인트 클라우드의 스케일을 LiDAR 스케일에 맞추는 조정 과정을 거친다. 스케일이 조정된 스테레오 포인트와 LiDAR 데이터를 초기 융합하여 두 가지 모달리티의 장점을 모두 활용한 포괄적인 포인트 클라우드를 생성한다. 융합된 포인트 클라우드를 정제하기 위해, DBSCAN과 같은 클러스터링을 통한 노이즈 제거와 포인트 그룹화, 그리고 LiDAR 데이터를 기준으로 스테레오에서 추출한 포인트들을 정밀하게 맞추기 위한 회귀 모델을 결합한 하이브리드 기법을 도입한다. 정제된 포인트 클라우드는 3D Gaussian Splatting 초기화를 위한 기초로 사용되며, 각 포인트를 초기 가우시안 값으로 설정하고 다양한 뷰포인트에서의 렌더링 결과를 바탕으로 가우시안 파라미터를 최적화한다. 최적화된 3D 가우시안을 활용하여 다양한 시점에서 장면을 렌더링하고, 이를 통해 연속적이고 풍부한 3D 장면 표현을 생성한다. 본 연구는 일반적인 새로운 뷰 합성(general novel view synthesis) 문제에 대한 중요한 개선을 달성하여, 컴퓨터 비전, 자율주행, 가상현실과 같은 분야에서의 응용 가능성을 보여준다.
-
객체 분할은 컴퓨터 비전의 핵심 과제이나 정확한 경계 검출은 여전히 도전과제로 남아있다. 이를 해결하기 위해, 최근 몇 년 동안, 경계 기반의 평가 지표가 제안되었으나, 대부분의 경계 기반 지표들은 경계만을 고려하고 내부 영역은 간과하며, 경계의 범위 및 강도를 설정하는 파라미터가 휴리스틱하다는 문제점이 존재한다. 본 논문에서는 경계에 강건한 객체 분할을 위한 Adaptive wIoU를 제안한다. 이 방법은 wIoU의 개념을 확장하여 다중 알파 값을 도입하고, 동적 가중치 조정 메커니즘을 통해 이러한 알파 값에 대한 가중치를 학습 과정에서 자동으로 최적화한다. Adaptive wIoU는 다양한 경계 복잡성에 적응적으로 대응하여 기존 IoU와 wIoU의 한계를 극복한다. 실험을 통해 Adaptive wIoU가 COCO 데이터셋에서 우수한 성능을 보이는 것을 입증하였다. 이 연구는 객체 분할에 대한 새로운 통찰을 제시하며, 객체 분할 작업에서 경계 검출을 개선하기 위한 방향을 제시한다.
-
온디바이스 환경에서 딥러닝 모델 최적화는 필수적이지만, 제한된 자원으로 고성능 모델을 직접 적용하는 데에는 한계가 있다. 본 논문에서는 이를 극복하기 위한 주요 기법인 가지치기, 양자화, 지식 증류, 신경망 아키텍처 탐색 및 이들의 결합 기법을 소개하고 분석한다. 각 기법의 정의와 특징, 적용 사례를 통해 성능 향상과 자원 효율성을 극대화하는 방법을 제시하며, 이를 바탕으로 최근 연구 동향을 소개한다.
-
본 논문에서는 데이터 집약적 연산의 효율성 향상을 위한 새로운 프로세서 아키텍처 접근법인 Near-Data Processing(NDP) 기술의 최근 동향을 살펴본다. AI 모델 학습과 빅데이터 분석 등에서 NDP 기술의 적용 사례를 분석하고, Processing-In-Memory(PIM)와 In-Storage Processing(ISP)를 중심으로 한 최신 연구를 소개한다. 또한, 실제 하드웨어 구현 사례로 Xilinx FPGA 개발보드의 HBM 통합 사례를 다룬다.
-
Min-Jae Kim;Jin-Sung Kim;Chung-Yung Kim;Jung-su Park;Min-Seong Cho;Hyunyoung Oh 36
RISC-V 구조는 오픈 소스 기반의 명령어 집합 아키텍처(ISA)로, 그 개방성과 확장성으로 인해 다양한 분야에서 주목받고 있다. 이러한 특징은 우주공학, 인공지능, IoT, 보안 등 광범위한 영역에서의 활용을 가능케 한다. 본 논문에서는 RISC-V 아키텍처가 최근 활용되는 주요 분야를 소개하고, 각 분야에서 이 아키텍처가 적용되는 구체적인 설계 방식과 그 장점을 분석한다.. -
브랜치 예측은 CPU 파이프라인 성능 최적화의 핵심이다. 본 논문은 퍼셉트론, CNN, SRNN, 그리고 강화학습을 이용한 AI 기반 브랜치 예측 기법의 최신 동향을 조사한다. 이러한 기법들은 제어 해저드에 대한 예측 정확도를 향상시켜 파이프라인 성능을 개선한다. 특히 SRNN 기반 예측기는 초기 학습 단계에서 높은 정확도와 낮은 지연 시간을 보이며, 강화학습 접근법은 복잡한 브랜치 패턴에서 효과적인 성능을 보여준다. 본 연구는 이러한 AI 기반 방법들이 파이프라인 최적화에 미치는 영향을 분석한다.
-
Sun-Ah Son;Ji-Eun Kang;So-Yeon Kim;Ha-Neul Kim;Hyun-Jeong Kim;Hyunyoung Oh 40
최근 딥러닝 연산의 고도화에 따라 희소성(Sparsity)을 효율적으로 처리할 수 있는 유연한 구조의 DNN 가속기가 중요해지고 있다. 그러나 기존의 가속기들은 유연성과 효율성 면에서 한계가 존재한다. 본 논문에서는 DNN 가속기의 기존 모델들과 최신 연구 동향에 대해 살펴본다. 특히 unstructured sparsity, structured sparsity, 그리고 최근 제안된 Hierarchical Structured Sparsity (HSS)를 적용한 가속기들을 분석하며, 각 접근 방식의 장단점을 비교한다. -
Junwoo Jin;Chanwoo Kim;HeeJin Kim;Miso Lee;Yongwan Joo;Hyunyoung Oh 42
현대 컴퓨터 시스템에서 메모리 접근의 효율성을 극대화하는 것은 필수적이다. 기존의 캐시 교체 및 프리페칭 기법은 고정된 규칙에 기반해 설계되어 동적 접근 패턴에 제대로 적응하지 못한다. 이 논문에서는 이러한 한계를 극복하기 위해 RL 기반 기술을 통해 동적 환경에 적응하는 효율적인 기법들을 소개한다. 이러한 방식은 기존의 캐시 교체와 프리페칭이 지닌 문제를 해결하고, 효율적인 메모리 관리 방안을 제안한다. -
Seo-hyeon Yang;Na-hyeon Kim;Ye-jin Kim;Ji-hun Kim;Hyeon-ji Kim;Hyunyoung Oh 44
최근 이기종 메모리 및 캐시 구조가 컴퓨터 시스템에서 자주 활용되고 있다. 그러나 이기종 환경에서 기존의 균일한 캐시 관리 방식을 사용하여 성능을 향상하는 데에는 한계가 있으며, 이기종 시스템의 캐시 구조를 고려한 최적화 방법이 필요하다. 본 논문에서는 이기종 시스템에서의 캐시 최적화 방법 동향에 대해 살펴본다. 특히, 데이터 배치 최적화, 동적 캐시 할당, 그리고 에너지 효율적인 메모리 아키텍처에 초점을 맞춘 최신 연구들을 분석한다. -
Wonjib Kim;Hayoon Kim;HyeopGeon Lee;Young-Woon Kim 46
하둡은 대용량 데이터 처리를 위한 대표적인 오픈소스 프레임워크이다. 특히 하둡의 맵리듀스 프로그래밍 모델은 분산 환경에서 병렬 처리를 가능하게 한다. 데이터를 처리하기 위한 환경에서는 데이터의 양의 방대해짐에 따라 저장 공간의 한계와 데이터의 전송 속도의 병목현상이 발생이 빈번하다. 이를 해결하기 위한 방법 중 하나는 데이터 압축 기술의 활용이다. 대표적으로 Gzip, Bzip2, Zstd 등이 있으며, 각 방식은 압축률, CPU 사용량, 메모리 사용 측면에서 상이한 특성을 보인다. 이에 본 논문은 하둡의 맵리듀스 프로그래밍 모델에서 대표적인 압축 방식을 구분하여 압축 방식에 따른 성능 평가를 수행한다. 수행 결과는 빅데이터 개발자들에게 맵리듀스 환경의 압축의 효율적 선택을 위한 가이드라인을 제시할 수 있다. -
최근 병렬컴퓨팅 연구는 슈퍼컴퓨터의 성능 향상에 직접 큰 영향을 끼치는 고성능 GPU를 활용한 대형 데이터셋 고속 병렬화를 중점적으로 진행되고 있다. 이를 해결하기 위해 Sandia 연구소에서 개발한 Kokkos 프로그래밍 모델이 등장했다. 이 논문에서는 CUDA 기반의 병렬 숄레스키 분해 구현을 해당 환경에 이식했을 때 어떤 성능을 보이는지 실험을 통해 확인했다. 1000×1000 크기의 양의 정부호 에르미트 행렬에 대해서 직렬 숄레스키 분해 프로그램 대비 498.16 배의 성능 향상을 보였으며, 이를 통해 자동으로 메모리를 관리하는 Kokkos 프로그래밍 모델이 추후 대형 데이터셋을 대상으로 하는 병렬화 프로그램 구현 시, 더욱 편리하고 좋은 성능 향상을 보일 것임을 기대한다.
-
Se-Hyeon Jeong;Gi-won Kang;Yun-Seo Lee;Bon-Wook Gu;Jeong-Min Hwang;Hyunyoung Oh 50
본 연구는 자원 제약적 임베디드 시스템에서 신경망 연산의 효율성을 극대화하기 위해 SIMD(Single Instruction Multiple Data) 기술을 활용한 최적화 기법을 제안한다. 기존 연구들이 주로 합성곱 연산에 집중된 것과 달리, 본 연구는 신경망의 전체 연산 구간에 SIMD 최적화를 적용하고, 범용 DNN 프레임워크인 Darknet 을 기반으로 다양한 모델에 적용 가능한 방법론을 적용하였다. Raspberry Pi 3B+를 테스트베드로 활용하여 다양한 CNN 모델에 대한 성능 평가를 수행하였으며, 최대 55.2%의 성능 향상을 달성하였다. 또한, SIMD 레지스터 활용도와 연산 속도 간의 상관관계를 분석하여 최적의 구현 전략을 도출하였다. -
프로세서 성능 향상이 둔화되고 네트워크 성능과의 차이가 커짐에 따라 하이퍼스케일러를 중심으로 SmartNIC이라는 기술이 주목을 받고 있다. SmartNIC은 이기종 도메인 프로세서와 범용 코어를 결합하여 인프라 작업을 오프로딩하는 혁신적인 기술로 볼 수 있으며 연산 가속, 데이터 가속, 네트워크 가속 등 오프로딩 되는 기능에 따라서 다양한 형태로 활용될 수 있다. 본 논문에서는 ARM 서버 기반으로 엔비디아의 SmartNIC인 BlueField DPU 테스트베드를 구축한 사례를 제시하고 시사점을 도출하였다.
-
증가하는 클라우드 서비스에 대한 보안 위협에 대응하기 위해 데이터를 암호화한 상태로 연산을 수행하는 동형암호에 대한 연구가 활발히 진행되고 있다. 동형암호는 암호화된 상태로 처리를 진행하기에 데이터 유출 위협으로부터 자유로우나, 210 차 이상의 다항식에 대해 연산을 수행해야 되기에 많은 양의 연산 자원과 메모리 자원을 필요로 한다. 본 논문에서는 이러한 동형암호 연산의 특성과 이를 실용적으로 사용하기 위한 가속기 개발 연구들에 대해 서술하였다.
-
For many decades, memory corruption attacks have posed a significant threat to computer systems, particularly those written in unsafe programming languages such as C/C++. In response, a 'safe' programming language, Rust, was recently developed to prevent memory bugs by using compile-time and runtime checks. Rust's security and efficiency has lead its adoption from multiple popular applications such as Firefox and Tor. Due to the large code base and complexity of legacy software, the adoption generally takes a form of a gradual deployment, where security-critical portion of the program is replaced with Rust, resulting in a mixed-language application. Unfortunately, such adoption strategy introduced a new attack vector that propagates the vulnerabilities residing in the unsafe languages to Rust, undermining the security guarantees provided by Rust. In this paper, we shed light on strategies designed to defend against attacks that target multi-lingual applications to compromise the security of Rust. We study underlying rationale of various defense mechanisms and design decisions taken to improve their performance and effectiveness. Furthermore, we explore the limitations of existing defenses and argue that additional methods are necessary for Rust to fully benefit from its security promises in multi-language environments.
-
SYCL은 크로노스 그룹(Khronos Group)이 개발한 C++ 기반의 이기종 아키텍처를 위한 공개 표준 언어이다. SYCL은 벤더에 종속되지 않는 개방형 표준이며, 특히 인텔이 이기종 아키텍처의 주력언어로 채택하고 있다는 장점이 있다. 그러나 SYCL의 템플릿, 람다 함수 등 C++의 복잡한 기능들과 태스크 그래프 기반 수행 방식 등의 여러 특징은 개발자들에게 높은 진입 장벽으로 작용하고 있다. 본 논문에서는 이러한 문제를 해결하기 위해 파이썬 기반 래퍼인 ezSYCL의 설계를 제안한다. ezSYCL은 SYCL보다 간결한 표현을 제공하여 개발자들이 보다 빠르게 프로토타입을 개발할 수 있을 것으로 기대된다.
-
최근 스팸 문자 메시지의 급증은 사용자들에게 심각한 불편을 초래할 뿐만 아니라, 불법 도박 및 금융 사기와 같은 중대한 사회적 문제로 이어지고 있다. 본 연구는 이러한 스팸 문자 메시지의 패턴과 텍스트를 심층적으로 분석하여, 스팸 메시지의 경향을 파악하고 청소년 도박 문제에 대한 교육적 대처 방안을 도출하는 것을 목표로 한다. 2022년 8월부터 2024년 3월까지 약 1년 7개월 동안 신고된 스팸 문자 데이터를 바탕으로, 스팸 메시지의 신고량 추이와 키워드 군집 분포를 분석하였다. 분석 결과, 스팸 메시지는 주로 주중 방과 후 시간대인 12시에서 18시 사이에 집중되었으며, 도박 관련 스팸 메시지가 전체의 62.7%로 가장 큰 비중을 차지하였다. 텍스트 분석을 통해 도출된 주요 키워드는 신규 가입 유도 및 금전적 유인과 관련된 것으로, 청소년들이 도박에 유인될 가능성이 높은 요소들이 포함된 것으로 분석되었다. 본 연구는 스팸 문자 데이터의 인공지능 분석을 통해 청소년 도박 문제에 대한 중요한 시사점을 제공한다.
-
멀티 클라우드 및 하이브리드 클라우드 환경의 확산은 클라우드 인프라의 복잡성을 증가시키는 만큼, 보안 관리의 중요성 역시 높아지고 있다. 특히, 여러 가지 보안 설정 중에서, 본 논문은 GCP(Google Cloud Platform)에서 서비스 계정의 가장(impersonate)을 통한 프로젝트 마비 공격의 위험성을 분석한다. 공격자는 IAM 정책을 변경하거나 삭제하여 프로젝트의 정상적인 기능을 마비시킬 수 있으며, 이러한 상황이 발생하면 서비스 복구에는 상당한 시간이 소요될 수 있다. 이러한 공격을 방지하기 위해 다단계 인증(Multi-Factor Authentication, MFA) 등과 같은 보안 대책도 제시한다.
-
서버리스 컴퓨팅의 급속한 확산과 더불어 보안 위협도 증가하고 있다. AWS 서버리스에서 제공하는 여러 보안 방법 중, IAM 정책을 설정하여 함수와 자원 간 접근 권한을 설정할 수 있지만, 정적 보안메커니즘 한계로 동적 우회 공격은 막기 어렵다는 한계를 가진다. 본 연구에서 제안하는 Bambda는 플러그인 방식의 Lambda와 CloudWatch를 통해 실시간 동적 검증을 수행하여 이러한 우회 공격 방어의 한계를 극복한다.
-
최근 많은 기업들이 시스템의 유연성과 확장성을 고려하여 컨테이너 기술과 API 호출을 기반으로 하는 마이크로서비스 아키텍처를 도입하고 있다. 그러나 마이크로서비스의 수가 증가하고 시스템의 복잡성이 커짐에 따라 디버깅과 모니터링의 어려움이 함께 증대되고 있다. 특히, 분산된 서비스 구조에서는 API 요청이 어떤 경로로 처리되는지 추적하는 과정이 매우 복잡해져, 이는 전체 시스템의 운영과 유지 관리에 부정적인 영향을 미칠 수 있다. 이러한 문제를 해결하기 위해, 본 논문에서는 Envoy, WebAssembly(WASM), 그리고 Traffic Control BPF (TC-BPF)를 결합한 API 관측 가능성을 향상시키기 위한 시스템을 제안한다. 이 시스템은 세 가지 구성요소인 설정, 수집, 통합 엔진으로 이루어져 있으며, 패킷 처리 과정 중 각 엔진을 통해 API 호출에 대한 추적 가능한 데이터를 추출하고 이를 통합한다. 제안된 시스템은 기존 도구들이 겪는 성능 저하 및 인증 정보 수집의 한계를 극복하여, 분산된 마이크로서비스 환경에서 API 관측 가능성을 효과적으로 향상시킬 수 있다.
-
Seung Gyu Han;Hyun Ah Lee;Se Jong Jeong;Soo Yeon Woo;Jin ho Lee 82
본 논문은 하이브리드 클라우드 환경에서 컨테이너 인프라의 자원 사용량을 통합적으로 모니터링하는 애플리케이션을 개발한 내용을 다룬다. 컨테이너 기반의 CaaS(Containers-as-a-Service) 시스템을 모니터링하기 위해 Docker API 와 오픈소스 시각화 도구 Grafana 를 활용하였으며, 서버-에이전트 구조로 확장 가능성을 고려한 설계를 수행하였다. 이를 통해 다양한 클라우드 환경에서의 자원 관리 효율성을 높이고, 사용자는 단일 대시보드를 통해 시스템 전반의 상태를 직관적으로 파악할 수 있다. -
쿠버네티스의 HPA(Horizontal Pod Autoscaling) 기법은 워크로드의 규모에 따라 동적으로 컨테이너 리소스를 조정하여 시스템 성능을 최적화하고 자원 활용 효율성을 높이는 역할을 한다. 그러나 HPA의 주요 문제점인 pod flapping을 해결하기 위해 CDT(Cool Down Time)가 도입되었다. 본 논문은 다르게 설정한 CDT 값에 따라 각 CPU 자원 할당량 별 지연 시간과 자원 사용량을 분석했다. 실험 결과 CDT 설정값이 성능과 자원 사용량에 영향을 미치는 것을 파악했고, 이를 바탕으로 자원 사용량과 SLO(Service-level Objective) 만족률을 모두 고려한 최적의 CDT 설정의 필요성을 제고한다.
-
클라우드 서비스는 자원 효율성을 위해 서로 다른 애플리케이션들이 같은 물리적 자원을 공유하며 제공되고 이로 인해 자원 경쟁이 발생할 수 있다. CPU 자원 경쟁이 발생하는 경우 병목 현상과 캐시 상태 변화로 사용자는 느린 응답속도를 겪게 된다. 본 논문에서는 쿠버네티스 환경에서 CPU 자원 경쟁에 따른 타깃 애플리케이션의 성능을 측정하여 그 영향을 분석한다. 실험 결과 애플리케이션의 응답시간은 노드의 CPU 사용량이 늘어날수록 평균 361%, 최대 855% 증가하고, 작업 수가 많아질수록 최대 19.4% 증가한다. 이 결과를 바탕으로 자원 효율성과 파드 성능을 고려한 가이드라인을 제공하는 것이 목적이다.
-
최근 클라우드 컴퓨팅의 발전에 따라 서비스 품질 보장과 자원 사용의 효율성을 위해 쿠버네티스의 HPA(Horizontal Pod Autoscaling) 기술이 범용적으로 사용되고 있다. HPA 는 자원에 대해 필요한 리소스만큼 동적으로 조정하기 때문에 파드의 자원을 세분화하면 자원 효율성이 높아지지만, 반대로 느린 응답 속도를 유발한다. 본 논문은 쿠버네티스 환경에서 파드의 기본 자원량을 다양하게 조정하여 동일한 작업 요청에 따른 레이턴시와 자원 사용량을 분석한다. 실험 결과 자원의 세분성이 높아질수록 컨테이너 오버헤드의 증가로 인해 자원 사용률과 서비스 레이턴시가 증가하였다.
-
This study compares CPU-based and custom metric-based scaling methods in Kubernetes, showing that custom metrics tailored to application needs can enhance scalability and efficiency. Findings reveal that, at certain scaling thresholds under dynamic network traffic, custom metrics reduce average latency by 85% to 87% compared to CPU-based scaling.
-
서버리스 컴퓨팅은 클라우드 컴퓨팅 패러다임의 한 종류로, 마이크로서비스가 부상하며 함께 큰 주목을 받고 있다. 서버리스 컴퓨팅에서 가장 큰 문제점 중 하나는 콜드 스타트 문제를 해결하는 것으로, 함수를 실행할 컨테이너가 생성될 때 이미지를 풀링하는 데 걸리는 지연 시간은 콜드 스타트에 큰 비중을 차지한다. 본 논문은 컨테이너의 이미지 사이즈를 최적화하기 위해 Docker 멀티 스테이지 기법을 사용하였으며, 컨테이너 이미지 풀링 시간에 미치는 영향을 분석하였다. 이를 통해 컨테이너 이미지 크기가 풀링 시간에 미치는 영향을 알아보고, 멀티 스테이지 빌드 기법의 유용성을 검증한다.
-
Jinhyeok Jeon;Sumin Jeong;Joonseok Park;Keunhyuk Yeom 96
멀티 클라우드 서비스 제공을 위해 가상머신 환경 구축 시 서비스의 성능, 비용 등을 최적화하면서 가상머신의 적절한 배치 위치를 결정하는 것은 중요한 연구 이슈 중 하나이다. 따라서 본 논문에서는 가상머신 배포 시 비용과 성능에 기반한 가상머신 배치 위치 최적화 및 추천 기법을 제시한다. 제안하는 방법은 NSGA-II(Non dominated Sorting Genetic Algorithm-II)를 활용한 다목적 최적화를 수행하고, 가중합 기반 점수 산출을 통해 최적 배치 위치를 추천한다. 멀티 클라우드의 14개 리전에서 4개의 가상머신 배치 실험을 수행한 결과, 총 1,716개의 배치 경우의 수 중 2개의 최적화 된 배치 방법을 획득하였다. 본 논문의 방법은 멀티 클라우드 환경에서 효율적인 가상머신 배치 및 마이그레이션을 통한 재배치 기법의 기반 기술로 활용될 수 있을 것이다. -
본 연구는 딥러닝 기반 추천 모델 중 하나인 DLRM(Deep Learning Recommendation Model)의 학습 시간을 CPU 단일 환경과 GPU-가속 환경에서 비교한다. GPU를 사용하는 경우 일반적으로 더 빠른 학습이 기대되나, 배치 크기가 작아 GPU의 병렬 연산을 효율적으로 활용하지 못하는 경우 CPU만 사용하는 학습이 오히려 빠를 수도 있음을 실험을 통해 확인하였다. 학습 시간 외에 배치 크기는 자원 활용률에도 영향을 미치며, 이는 딥러닝 기반 모델의 학습과 추론에 도입 환경과 워크로드를 고려하여 실행 하드웨어를 선택할 필요가 있음을 시사한다.
-
Ki-Hyeon Kim;Dongkyun Kim;Booseung Cho;Kiwook Kim 101
과학 기술 분야에서 최근 대용량의 데이터를 활용하여 인공지능 및 빅데이터 연구를 수행하고 있는 연구소 및 기업들이 많아지고 있다. 빅데이터 연구를 위해 스토리지에 대용량의 데이터를 저장하고 이를 연구자들에게 제공할 수 있는 편리한 시스템을 요구하는 요청이 증가하고 있다. 이를 위해 스토리지를 구매하는 방법과 클라우드 스토리지를 이용하는 방법이 존재한다. 하지만 두 방법 모두 막대한 비용적인 부분이 존재한다. 또한 데이터 공유 및 외부 스토리지 이용 제공에 대한 기관의 정책적인 부분들이 문제가 된다. 이 문제를 해결하기 위해 KISTI에서는 SDN 네트워크 기반의 분산 스토리지 관리 시스템을 개발하였다. 이 시스템의 경우 SDN 네트워크에 스토리지를 연결하여 보안적으로 안전한 전용의 회선을 이용하여 기관 데이터 정책에 위배되지 않는 환경을 구성한다. 또한 기관의 연구자들에게 데이터를 제공 시 관리자의 허가를 받은 사용자들에게만 데이터를 제공하는 기능을 이용하여 안전하고 쉽게 데이터를 다운로드 받을 수 있는 협업 플랫폼을 개발하였다. 본 논문을 통해 플랫폼을 개발 및 구축에 대해 자세하게 설명하고자 한다. -
Google에서 제안된 BBR(Bottlenek Bandwidth and RTT) 혼잡제어 알고리즘은 최대 대역폭과 최소 RTT를 추구하는 Network path 모델을 기반으로 동작하고 현재까지 BBRv3가 발표되어 활용 및 검증되고 있다. 본 논문에서는 원거리 네트워크 환경을 위한 BBRv3 에뮬레이션 테스트베드 환경을 구축하고 RTT, 패킷 손실률의 변화에 따른 처리율을 측정하여 기존 손실기반 혼잡제어 알고리즘과의 성능 비교를 수행한다. 이를 통해 과학응용을 위한 고성능 네트워크 환경을 지향하는 과학기술연구망 분야에서 기존 손실기반 혼잡제어 알고리즘들을 대체할 수 있는 또 다른 선택지로서의 BBRv3 활용 가능성을 확인한다.
-
Seokwon Oh;Subin Song;Jungbum Lee;Gyeongheon Jeong;Hyunsoo Kim;Chang-gun Lee;Taekyoung (Ted) Kwon 108
DT(Digital Twin)는 물리적 현실 세계 데이터를 실시간으로 수집하여 디지털 세계에서 동일하게 구현하는 기술이다. DT 활용하여 현실 세계의 위험상황을 예측하고 방지할 수 있다. 본 연구는 DT 가 디지털 디바이스의 현실 세계 현재 위치 데이터를 실시간으로 수집하고 디지털 세계에서 동일하게 구현하여 GPS(Global Positioning System) 스푸핑(Spoofing) 공격을 탐지하는 기법을 제시한다. 추가로 현실 세계 도심 항공 교통(Urban Air Mobility)과 사용자 디지털 디바이스에 적용 가능하다는 점을 제시한다. 도심 항공 교통의 경우 DT 서버는 모든 비행체의 GPS 위치 정보와 각 비행체의 인접 비행체 거리 정보를 실시간으로 수집한다. 두 가지 종류의 위치 정보 비교를 통해 비행체 위치 정보의 이상 상황을 탐지한다. 사용자 디지털 디바이스의 경우 DT 서버는 모든 디바이스의 GPS 위치 정보와 각 디바이스의 인접 디바이스 거리 정보를 실시간으로 수집한다. 두 가지 종류의 위치 정보 비교를 통해 디바이스 위치 정보 이상 상황을 탐지한다. -
Geonmin Kim;Eunseong Lee;Hyeonji Jang;Seojun Lee;Kyungbaek Kim 112
본 논문은 IoT(Internet of Things) 환경에서 CoAP(Constrained Application Protocol)의 보안을 강화하기 위해 해시 함수와 스테가노그래피를 활용하는 접근법을 제안한다. IoT 장치의 자원 제약을 고려하여, 패킷에 솔팅을 이용한 해시 함수와 스테가노그래피를 사용하여 해시 알고리즘과 솔트 값을 은닉하는 방법을 사용한다. 이 접근법은 자원 소모를 최소화하며 데이터 무결성을 검증한다. -
클라우드 컴퓨팅의 발전으로 IaaS는 네트워크 가상화 기술을 통해 물리적 자원을 안전하고 효율적으로 공유할 수 있는 멀티 테넌시 환경을 지원한다. 그러나 현재의 네트워크 가상화 기술은 테넌트별 서비스 접근성만 제공하며, 네트워크 구성의 유연성과 세세한 네트워크 격리 측면에서 여전히 한계를 보이고 있다. 본 연구는 이러한 문제를 해결하기 위해 안전하고 재구성 가능한 동적 가상 네트워크 구축 시스템을 제안하며, 실시간으로 유연한 네트워크 구성을 가능하게 하고자 한다.
-
본 연구는 브라우저 기반 P2P 파일 전송 시스템인 Throw 를 개발하고, 기존 클라우드 스토리지 서비스와의 성능을 비교하였다. Throw 는 WAN 환경에서 평균 2 배 빠른 전송 속도를 보였으며, 다양한 운영체제에서 사용 가능한 장점이 있음을 확인하였다. Throw 는 브라우저 기반 P2P 파일 전송 기술의 가능성을 보여주었으며, 향후 성능 최적화와 사용자 편의성 증대를 통해 더욱 완성도 높은 시스템을 구축할 수 있을 것으로 기대된다.
-
Integrated Sensing and Communication(ISAC)은 통신과 센싱을 하나의 인프라에서 통합해 수행할 수 있는 기술이다. LoRa 는 저전력, 장거리 통신을 가능하게 하여, 이를 이용해 넓은 범위에서 ISAC를 가능하게 하기 위한 연구가 진행되고 있다. 그러나 LoRa의 상위 계층을 정의하는 LoRaWAN 에서는 듀티 사이클로 인해 실제 통신에서는 센싱에 필요한 샘플링 속도보다 낮은 패킷 전송 속도를 보인다. 이로 인해 센싱에 필요한 신호를 충분히 수집하지 못해 센싱 성능이 저하되는 문제가 발생할 수 있다. 본 연구는 LoRaWAN 기반 네트워크에서 ISAC 시스템을 구축하기 위해 실제 패킷 전송 속도와 샘플링 속도 간의 차이를 분석하고 이를 해결하기 위한 인자 조절 방안을 제시한다. 이러한 접근은 패킷의 채널 점유 시간을 최적화함으로써, 센싱 성능을 향상시킬 수 있다.
-
Minseo Kim;Minjae Kim;Minseong Cho;Jungsu Park;Jinsung Kim;Hong Min 121
컴퓨터 비전 기술은 이미지를 분석하여 객체를 인식하고 추적할 수 있으므로 객체를 감지하고 분석하는데 유용하다. 이러한 객체를 감지하고 분석하는 기술 덕분에 컴퓨터 비전 기술이 다양한 응용 분야에 적용되고 있으며 성능과 관련하여 다양한 연구가 활발하게 진행되고 있다. 기존의 연구는 대규모 학습 데이터 사용, 모델 복잡성 증가, 전이 학습을 통한 성능 향상 연구가 주를 이루었다. 본 논문에서는 학습 데이터에 실제 촬영된 이미지의 비율이 객체 인식 정확도에 미치는 영향을 분석하였다. 실험을 통해 학습 데이터 중 실제 촬영된 이미지가 포함되면 예측 정확도가 증가한다는 결과를 확인하였다. -
Hyun-Woo Nam;Jong-Hoon Yoon;Joon-Seok Eum;Keun-Young Kim;;Chan-Young Choi;Hyung-Bong Lee 123
QR 코드 인식으로 신분을 확인하거나 출입 카드를 직접 태그하여 요금 정산이나 출입 허용 여부를 판단하는 출입 시스템들은 어플을 실행해야 하는 번거로움과 태그 동작에 따른 불편함이 있다. 이 연구에서는 UWB 기술을 적용하여 어플을 실행해야 하는 번거로움이나 직접 태그해야 하는 불편함이 없이 신분을 인증할 수 있는 출입문 통제 시스템을 구현한다. -
Minseo Kim;Jinsung Kim;Minjae Kim;Jungsu Park;Jung Taek Seo;Hong Min 125
타국 어선에 의한 무허가 조업으로 인해 자국 어민들이 생존권을 위협받고 있다. 기존의 경우 항공 전탐사가 확인하였으나, 항공 전탐사가 확인하는데 과도한 노동력이 소요되어 이를 무인 항공기(UAV)를 통해 해결하려 한다. 그러나 상업용 무인 항공기의 경우 통신 거리가 5km에서 10km라는 한계가 존재한다. 이를 해결하기 위해 다중 계층 메시 네트워크 구조와 주파수 분할 및 MIMO기술을 활용한 선종 식별 시스템의 설계와 기술의 적용 방안을 제시한다. -
본 연구에서는 라즈베리파이를 이용한 도어 모니터링 시스템을 제안하였다. 이 시스템은 1인 가구의 증가와 함께 높아지는 범죄 위험에 대응하기 위해 설계되었다. 적외선 센서를 사용하여 문 앞의 움직임을 감지하고, 특정 조건이 충족되면 사용자의 스마트폰으로 알림을 전송하는 방식으로 구현되었다. 시스템의 설계 및 구현 과정에서는 UML(Unified Modeling Language)을 활용하여 요구사항을 분석하고 시스템을 구조화하였다. 본 연구를 통해 1인 가구의 방범 시스템 구축에 기여할 수 있는 효과적인 도어 모니터링 솔루션이 개발되었다.
-
해당 논문은 라즈베리파이를 기반으로 한 보안 시스템의 중요성과 응용 가능성을 탐구한다. 라즈베리파이와 OpenCV를 활용하여 얼굴 인식 기능을 통합한 보안 시스템을 제안한다. 이 시스템은 문 앞에서의 활동을 실시간으로 모니터링하고, 얼굴 인식 기술을 통해 방문자의 신원을 식별하며 경고를 발송한다. 이러한 기능은 가정이나 사무실에서의 보안을 강화하는 데 유용하며, 보안 시스템이 실시간 정보 제공과 상황 관리의 핵심 요소로 자리매김하고 있음을 강조한다. 본 논문에서는 얼굴 인식 기술과 라즈베리파이 기반 시스템의 통합을 통해 보안 효과를 극대화하고 실제 응용 가능성을 평가한다.
-
Jungjin Lee;Minki Kim;Eunji Lim;Jaegyun Park;Taein Lee;Jungheon Lee;Doosan Cho 131
가파른 경제 성장과 인구 증가로 인해 대한민국은 주차 공간이나 도로 상황에 비하여 개인용 자가용의 증가 추이가 급속하게 진행되었다. 그리고 낮은 운전면허 난이도, 적은 취득 비용 등에 의해 2022년 기준 총 자동차 등록수는 약 2,550만대를, 운전면허 소지자는 3410만명을 넘어섰다 [1, 2]. 빈약한 인프라에 비해 넘쳐나는 차량으로 출퇴근 시간 잦은 정체가 발생하고 교통사고도 잇따라 증가하였다. 산악 지형에 따라 곡선 형태의 도로가 많고, 교차로가 많이 생기는데 이러한 교차로에서 가장 사고가 많이 발생한다. 교차로에서 일어난 교통사고의 원인으로는 차선 침범, 불법 주정차로 인한 보행자와의 충돌 등이 있다 [3, 4]. 본 연구는 혼잡한 교통상황에 기인하여 발생하는 사고를 방지하기 위하여, 교차로에서 차선 침범 방지를 목적으로 LED 조명 유도를 구성하고, 주야간 운전에 불편함이 없도록 LED 밝기 자동조절 기능을 구성하였다. 이러한 기능으로 교차로 접촉 사고를 줄일 수 있다고 기대하며, 정지선 침범으로 인한 보행자 횡단의 불편함, 우회전시 보행자 충돌 등 빈번한 사고를 막는 수단이 될 수 있을 것이다. -
Changhan Lee;Jaehoon Yang;Minwook Lee;Seokmun Heo;Junsoo Park;Dong Kun Noh 133
지속가능한 AIoT의 필요성과 에너지 수집 기술의 발달, 그리고 온디바이스 학습이 가능한 IoT 기기들의 등장으로 인해, 최근 에너지 수집형 AIoT(AI-enabled IoT) 기술이 주목받고 있다.[1] 본 연구에서는 에너지 수집형 엣지 AIoT를 대상으로 기기의 안정적인 동작을 보장하며 동시에 연합학습 성능 수준을 높일 수 있는 시스템 수준의 에너지 적응형 동작을 제안한다. 기본적으로 각 기기에서는 학습성능과 에너지 소비량이 비례관계에 있으므로, 기기의 안정적 동작 확보를 위해 학습 성능의 감소가 필요할 때도 있다. 제안 기법에서는 에너지와 학습 성능 사이의 이러한 상충관계를 최소화하기 위해, 태양에너지 수집 모델을 기반으로 주어진 에너지 예산 내에서 각 기기의 학습 데이터양과 연합학습을 위한 파라미터 교환양을 최적화한다. 이러한 각 기기들의 정전시간 최소화(안정성증가)는 결과적으로 전체 AIoT의 연합학습 정확도 향상으로 이어질 수 있는데, 실험 결과 기존 기법에 비해 정전시간의 감소와 연합학습의 정확도가 각각 최대 53%, 35% 향상됨을 확인할 수 있었다. -
현대 사회는 네트워크의 규모가 증가하고 있으며 이러한 대규모의 트래픽을 보다 편하게 관리하고자 SDN이 등장했다. 허나, 대규모 트래픽의 등장으로 인해 DoS 공격의 규모 또한 더욱 커지고 있다. 이러한 공격을 완화하기 위한 다양한 연구가 진행되었으나, SDN에서 기계학습을 활용하여 DoS 공격을 탐지하는 기존의 연구는 제어평면 측에 상당한 부담을 주거나 공격에 대한 대처 부족 등의 문제점이 있다. SDN에서 기계학습과 P4를 결합한 DoS 공격 탐지는 이러한 문제를 해결하기 위해 등장했다. 이 논문에서는 SDN 환경에서 기존의 기계학습 기반의 DoS 공격 탐지에 대한 문제점과 한계에 대해 언급한 이후 기계학습과 P4를 결합한 DoS 공격 탐지에 대한 필요성을 언급한다. 이후, 기계학습 및 P4 기반의 DoS 공격 탐지와 관련된 연구를 살펴보고, 향후 연구 방향을 제시함으로써 네트워크 보안 분야에 새로운 가능성을 제시한다.
-
과학기술정보통신부와 한국지능정보사회진흥원은 2022년부터 인공지능 학습용 데이터를 구하기 힘든 의료 분야의 AI 학습용 합성데이터를 구축하여 제공하고 있다. 하지만 구축한 합성데이터에 대해 안전성 측면의 검증을 수행하지 않아 다운로드가 불가능한 AI허브의 온라인 안심존을 통해서만 제공하였다. 데이터 활용성의 향상을 위해 합성데이터는 자유로운 활용이 가능한 형태로 개방 되어야 한다. 본 연구에서는 개인정보위원회에서 발간한 합성데이터 생성 참조모델(2024.5)에 따라 검증한 2개 데이터 사례를 제시하여 검증 내용에 대한 구체적인 정보를 제공하고 다른 합성데이터 생성과 검증에 대한 가이드를 제시하였다.
-
네트워크 트래픽이 최근 급격히 증가하면서, 전통적인 CPU 기반의 패킷 처리 방식은 성능의 한계에 직면하고 있다. 이러한 문제를 해결하기 위해 SmartNIC은 네트워크 처리를 CPU로부터 오프로드하여 시스템 전체의 성능을 향상시키는 데 중요한 역할을 한다. 그리하여 네트워크 서비스를 SmartNIC로 오프로드 하여 CPU 점유율을 줄이고 시스템의 효율성을 높이는 데 큰 이점을 제공한다. 본 논문에서는 NVIDIA의 DOCA와 AMD의 SSDK를 소개하며, SmartNIC에서 구현된 다양한 보안 서비스들을 살펴보고자 한다.
-
본 논문에서는 오펜시브 보안 관점에서 ANTLR4 를 이용한 모바일 앱 정적 분석 자동화를 통해 API 서버에서 제공하는 엔드포인트와 파라미터 정보를 알아낸다. 이를 통해 API 서버에 잔존하는 레거시 엔드포인트를 식별할 뿐만 아니라 API 서버를 대상으로 퍼징 및 블랙 박스 테스팅과 같은 취약점 점검의 초석을 마련한다.
-
분산 서비스 거부(DDoS) 공격은 대규모 네트워크 운용 환경에서 탐지 및 대응이 지연될 경우 심각한 피해를 초래할 수 있는 중대한 보안 위협이다. 이러한 위협을 효과적으로 방어하기 위해 규칙기반 탐지, 머신러닝, 딥러닝 등을 활용한 다양한 탐지 기법들이 활발히 연구되고 있다. 본 연구에서는 기존 공개된 실험망 데이터 기반의 DDoS 탐지 연구 한계를 극복하기 위해 상용망에서 수집된 실제 데이터를 활용하여 연구하였다. 또한, 다양한 머신러닝 알고리즘을 활용하여 DDoS 탐지 성능을 비교·분석하고, 이를 통해 상용망 환경에 최적화된 머신러닝 기반 DDoS 탐지 시스템을 제안한다.
-
디지털화의 가속화는 사이버 공간에 대한 의존도를 크게 증가시키고 있다. 군사, 금융, 의료, 통신 등 주요 인프라는 네트워크를 통해 상호 연결되면서 효율성을 극대화하고 있지만, 동시에 사이버 공간의 중단이 가져오는 영향성에 취약해지는 구조가 형성되어 지고 있다. 대표적으로, 2022년 발발한 러시아-우크라이나 전쟁에서 러시아는 사이버 공간과 물리적 공간을 활용한 공격 수단을 통해 우크라이나의 주요 인프라를 마비시키려는 시도를 하였다. 그러나 우크라이나는 높은 사이버 복원력(Cyber Resilience)을 바탕으로 이러한 공격에 능동적으로 대응할 수 있었고, 인프라 마비를 효과적으로 방어하였다. 이에 따라, 러시아의 일방적인 승리로 끝날 것이라는 초기 예측과 달리, 우크라이나는 물리적 전투뿐만 아니라 사이버 공격 속에서도 지속적으로 저항하며 전쟁을 이어가고 있다. 본 연구에서는 IT 환경 변화에 따른 안보 위협과 이를 극복하기 위한 국가 사이버 복원력 제고를 위한 고려사항을 분석하기 위해 우크라이나-러시아 전쟁에서의 사이버 복원력이 발휘된 사례를 분석하고, 그로부터 도출되는 시사점과 향후 연구 방향을 제시한다.
-
Ka-Hyun Lee;Yu-been Jeong;Gi-Hun Lee;Jong-Uk Hou 156
차량의 증가와 함께 교통 안전에 대한 관심이 높아지면서, 운전자 프로파일링에 대한 필요성이 증대되고 있다. 또한, 자율주행 기술의 발전과 자동차 보안 문제의 증가로 운전자 식별 연구의 중요성도 커지고 있다. 이에 본 연구는 차량의 CAN-bus 데이터와 스마트폰 센서 데이터를 직접 수집하여 운전자를 식별하는 새로운 방법을 제안한다. 기존의 생체 인식 정보나 운전자의 이미지를 활용하는 방법과 달리, 본 연구는 주행 중 수집된 정량적 데이터를 이용해 프라이버시 위험을 최소화하였다. 특히, 다양한 주행 상황에서 직접 수집한 CAN-bus 및 센서 데이터를 기반으로 한 멀티모달 퓨전 기법을 통해 운전자의 행동 및 반응을 정밀하게 분석하였다. 실험 결과, 제안된 방법이 기존 방법보다 정확하게 운전 습관을 식별하였으며, 운전자 식별의 정확성을 높여 미래의 운전자 프로파일링 연구에 기여할 수 있을 것으로 기대된다. -
Seo-Yeon Lee;Ho-Sim Jeong;Seung-Chan Lee;Jin Yang;Se-Hyeon Kim;Hyuk-Jae Yang 160
현재 국내에서 클라우드를 사용하는 기업들은 고도화된 정보기술과 보안체계를 구축하여 다양한 서비스를 제공하고 있지만, 중요한 데이터의 노출을 막기 위한 데이터 보안 기술을 갖추고 있는 경우는 드물다. 이로 인해 데이터 유출 사고 발생 시 원인만을 파악할 뿐 실질적인 대안을 갖추지 않은 상황이다. 본 연구에서는 국내 클라우드 환경에서 데이터 노출을 최소화하기 위한 데이터 보안 관리체계인 DSPM 모델의 초안을 제안한다. -
북한의 사이버 위협은 점점 정교해지고 있으며, 이러한 상황 속 산업시설을 겨냥한 악성코드 공격은 국가 안보에 치명적인 영향을 미칠 수 있다. 본 논문은 스턱스 넷, 에칸스 랜섬웨어, 콜로니얼 파이프라인 랜섬웨어를 분석하고 산업시설 보안 강화 방안을 제시한다. 스턱스 넷은 이란 핵 시설의 PLC 를 조작해 공격을 시도했고, 에칸스는 랜섬웨어 공격을 통해 혼다의 자동차 생산 공장을 마비시켰으며, 콜로니얼 파이프라인 랜섬웨어 또한 감염을 통해 시설을 마비시켰다. 위 공격사례를 분석하고, 이에 대응하기 위한 6 가지 대응 전략을 소개한다.
-
동적 패치는 은행 시스템, 산업 제어 시스템 등 24시간 가동되는 프로그램에서 중요하며, 제어 흐름 정보를 최소화해 동적 패치의 효율성을 높일 수 있다. 논문에서는 제어 흐름 정보 없이 x86_64 바이너리를 재작성할 수 있는 도구인 E9patch를 기반으로, Dyne9patch라는 동적 패치 도구를 구현했다. 피보나치 수열을 출력하는 프로그램을 통해 Dyne9patch의 동적 패치 적용 가능성을 확인했으며, 후속 연구로는 자동화된 패치 적용 도구 개발을 제안하고 있다.
-
랜섬웨어는 등장 이후 지속적으로 진화하여, 현재는 RaaS(Ransomware-as-a-Service) 형태로 배포되고 있으며, PC뿐만 아니라 모바일 기기까지 공격 대상으로 삼고 있다. 이와 같이 고도화된 랜섬웨어에 대응하기 위해 탐지, 차단, 복구 기술 또한 발전해 왔다. 특히 복구와 관련해서는 메모리 덤프를 통해 복호화 키를 추출하거나, 취약한 암호 알고리즘을 이용해 키를 추출하는 연구가 활발히 진행되고 있다. 그러나 여전히 랜섬웨어 복호화는 어려운 과제로 남아 있다. 메모리 덤프나 공격자의 실수로 키를 추출할 수 있는 경우도 있지만, 기기 재부팅이나 강력한 암호화 알고리즘이 사용되면 복호화가 어렵다. 본 논문에서는 안드로이드 랜섬웨어를 대상으로 프로그램 변조를 통해 복호화하는 방법을 제안한다. 우리는 두 가지의 실험을 통해 안드로이드 랜섬웨어의 내부 로직을 수정하였고, 복호화가 가능함을 확인하였다.
-
CPU의 결함은 보안적인 측면뿐만 아니라 경제적인 측면에서도 큰 손해를 발생시킨다. 최신 연구로 Differential Fuzzing을 이용하여 CPU RTL의 버그를 탐지하는 방법이 소개되었지만 전반적인 CPU 코어의 모듈을 탐색하기에 패치 테스트, 버그 재생산 및 새로운 모듈만을 검사하기에는 시스템 자원이 많이 낭비될 수 있다. 이에 본 연구에서는 Differential Fuzzer의 ISA 시뮬레이터에 Directed Greybox Fuzzer를 적용하여 그 결과를 분석하고 시스템 자원을 효율적으로 사용할 수 있는 Directed Differential Fuzzing 방법을 제안한다.
-
프롬프트 인젝션 공격은 입력 프롬프트의 조작을 통해 대형언어모델(LLM)로 하여금 AI 모델의 의도된 동작을 벗어나 공격자로 하여금 허가되지 않은 동작을 수행하게끔 하거나 민감한 정보를 탈취하도록 하는 방식의 공격유형으로, LLM 의 무결성과 신뢰성에 심각한 위협이 될 수 있다. 본 논문에서는 LLM 에 대한 프롬프트 인젝션 공격을 직접 프롬프트 인젝션 공격과 간접 프롬프트 인젝션 공격으로 분류하고, 특히 현재 다양하게 연구되고 있는 직접 프롬프트 인젝션 공격의 다양한 유형을 간단한 예시를 통해 개괄적으로 소개하고자 한다. 또, 이러한 프롬프트 인젝션 공격의 잠재적인 영향과 이에 대한 대응 전략을 제안한다.
-
정보기술 분야의 발전으로 인해 정보의 중요성, 보안성, 기밀성, 개인 정보에 대한 보호가 더욱 강조되고 있다. 여러 정보보호 기술 중 스테가노그래피는 이미지, 텍스트, 오디오, 비디오 파일과 같은 적절한 멀티미디어 매체에 비밀 데이터를 숨기는 기술이다. 하지만 최근 악성코드는 탐지를 회피하기 위한 기술로 스테가노그래피를 사용하고 있다. 또한 인공지능의 발전으로 인해 인공지능을 활용한 스테가노그래피 공격 기법과 연구들이 점차 증가하고 있다. 본 논문에서는 스테가노그래피를 이용한 공격 기법과 해당 기술이 적용된 악성코드들의 사례에 대해 분석하고, 스테가노그래피를 활용한 악성코드의 대응 방법에 대한 향후 연구를 소개한다.
-
최근 피싱 키트의 고도화와 LLM의 등장, 그리고 다양한 통신 매체의 사용으로 인해 피싱 공격이 증가하고 있다. 이러한 피싱은 인간이 정상적인 상호작용인지 아닌지 구분하기 어렵게 하며 다양한 방식을 통해 탐지를 우회한다. 특히, 이와 같은 피싱으로 인해 개인 또는 단체 등 민감한 정보의 탈취가 발생하며, 정보 탈취 이후 추가적인 피해가 일어나므로 사용자의 정보가 탈취당하기 전에 피싱인지 아닌지 탐지를 수행해야 한다. 따라서 피싱으로부터 사용자를 보호하기 위해 다양한 매체들로 부터 피싱 이메일, 메시지 등의 콘텐츠 수신과 피해자의 링크 클릭, 피해자 스스로 자격증명을 입력하는 과정에서 탐지하는 것이 중요하다. 본 논문에서는 피싱 방식별 위협 모델 소개와 탐지기법을 분류하고 각각의 피싱 탐지기법이 보유한 도전과제에 대해 소개한다.
-
We introduce a novel method to defend against model inversion attacks in Federated Learning (FL). FL enables the training of a global model by sharing local gradients without sharing clients' private data. However, model inversion attacks can reconstruct the data from the shared gradients. Traditional defense mechanisms, such as Differential Privacy (DP) and Homomorphic Encryption (HE), have limitations in balancing privacy and model accuracy. Our approach selectively encrypts more important gradients, which contain more information about the training data, to balance between privacy and computational efficiency. Additionally, optional DP noise is applied to unencrypted gradients for enhanced security. Comprehensive evaluations demonstrate that our method significantly improves both privacy and model accuracy compared to existing defenses.
-
LibOS는 전통적인 운영체제의 커널을 응용 프로그램 수준의 라이브러리로 재구성한 시스템이다. 애플리케이션이 운영체제의 다양한 기능을 호출할 때 기존 운영체제처럼 무겁고 복잡한 커널과 직접 상호작용하는 대신, 가벼운 라이브러리 형태로 제공하여 시스템의 메모리 사용량을 줄이고 성능을 향상시킨다. 또한 각 애플리케이션이 독립적인 프로세스처럼 동작할 수 있도록 지원하여 보안 격리를 유지한다. 대표적으로 LibOS는 Intel SGX와 결합되어 시스템 호출을 줄이고, Enclave 내에서 대부분의 작업을 수행하여 공격 표면을 줄인다. 본 논문에서는 LibOS가 Intel SGX와 같은 보안 기술을 사용한 연구에 대해 소개한다.
-
클라우드 컴퓨팅은 적은 초기 비용만으로도 효율적인 자원 관리와 서비스를 이용할 수 있는 기술이다. 이러한 장점으로 인해 클라우드 서비스를 이용하는 개인과 기업의 비율이 갈수록 증가하고 있지만 이에 따른 보안 사고도 비례하여 증가하고 있다. 클라우드 내에서 보안 사고가 발생하면 클라우드 포렌식을 통한 조사가 신속하게 이루어져야 하는데 다양한 사용자의 자원이 공유되고 있는 멀티-테넌트 환경이 증거 수집을 지연시킨다. 또한 위치에 상관없이 접근하여 수정이 가능하다는 클라우드의 특성이 증거 변조의 위협성을 높여 클라우드 포렌식을 어렵게 한다. 따라서 본 논문에서는 클라우드 포렌식의 한계를 완화하기 위해 클라우드 서비스를 이용하기 전에 맺는 SLA(Service Level Agreement)의 한계에 대해 분석하고 그에 따른 개선 방안을 제안하고자 한다.
-
WebAssembly(WASM)은 다양한 환경에서 높은 성능을 제공하는 바이트코드 형식의 언어이다. 본 논문에서는 WASM 바이너리 보안을 강화하기 위한 동적 분석 기법인 Fuzzm, Wasabi, Taint Assembly를 분석하며, 각 기법의 장점과 한계점을 다룬다. 또한, 동적 분석과 정적 분석을 융합한 새로운 기법의 필요성을 기반으로 향후 진행되어야 할 연구 방향에 대해 살펴본다.
-
ARM MTE(Memory Tagging Extension)는 안전하지 않은 언어로 작성된 코드에 존재할 수 있는 메모리 취약점을 탐지하는 것을 목표로, ARMv8.5-A 아키텍처에 도입된 새로운 하드웨어 기능이다. MTE는 메모리 포인터에 대해 추가 메타데이터로 각 메모리 할당/해제 시에 태그를 지정한다. 런타임 시에 포인터와 메타데이터의 태그를 확인하는 절차를 거치게 되며, 이를 통해 가장 일반적인 메모리 버그의 원인이 되는 Use-After-Free, Buffer Overflow와 같은 취약점을 탐지할 수 있다. 본 논문에서는 MTE를 이용한 메모리 보호 기술 연구들의 동향을 분석하고, 해당 연구의 지속적인 필요성을 제시한다.
-
Yunseong Hwang;Kibong Kang;Junseung You;Yunheung Paek 199
신뢰 실행 환경(TEE)은 클라우드 컴퓨팅에서 작업의 기밀성과 무결성을 보장하는 기술이다. 신뢰 실행 환경 기술들은 기밀성을 위해 암호화된 메모리를 사용해 외부의 공격자가 실제 값을 알지 못하도록 사용자의 데이터를 보호한다. 암호화 과정에서 AES 암호화를 사용하여 메모리를 암호화하며, 그 중에서 XEX와 XTS 방식을 사용한다. 그러나 이런 암호화 방식은 고정된 물리 주소의 메모리 블록에 대해 결정적으로 암호화되어 공격자가 암호문에 대한 평문을 유추하는 암호문 부채널 공격에 취약할 수 있습니다. 본 논문에서는 신뢰 실행 환경에서 발생할 수 있는 암호문 부채널 공격이란 무엇인지 분석하고, 그에 대한 대응 방안과 그 한계점을 제시한다. -
현대 사이버 위협의 복잡성이 증가함에 따라 이상행위 및 위협징후 탐지를 위한 AI 기반 기술 사용이 크게 증가하고 있다. 본 논문은 AI 기반 이상행위 및 위협징후 탐지의 최신 동향을 분석하여 AI 기반 이상행위 탐지 시스템의 탐지 정확도를 높이는 메커니즘과 위협징후 탐지 속도를 가속화하는 기술에 대해 논의한다. 연구 결과에 따르면, AI 기반 모델은 기계 학습 알고리즘의 발전, 보다 다양한 학습 데이터셋, 최적화 기술 덕분에 정확도와 속도 모두에서 개선을 보이고 있다. 본 논문은 현재의 동향과 이들이 AI 기반 보안 시스템의 미래에 미치는 영향을 종합적으로 다루고자 한다.
-
본 연구는 호스트기반 침입탐지시스템(HIDS)에서 윈도우 크기와 임계치 설정이 성능에 미치는 영향을 분석하였다. 그 결과, 윈도우 크기와 임계치에 따라 성능 변동이 크게 나타났으며, 고정된 최적값 대신 각 시스템의 환경과 위험 허용도에 맞춰 윈도우 크기와 임계치를 조정하는 방안을 제안한다.
-
오류 주입 공격(Fault Injection Attack)은 시스템에 의도적으로 오류를 주입하여 취약점을 드러내는 강력한 공격 기법으로, 공격에 사용되는 매개변수 탐색 최적화는 제한된 시간 내 성공적인 공격을 위해 필수적인 기술이다. 본 논문에서는 인공지능(Artificial Intelligence) 기반 알고리즘, 특히 유전 알고리즘(Genetic Algorithm, GA)과 미메틱 알고리즘(Memetic Algorithm, MA)이 오류 주입 매개변수 탐색 최적화에 어떻게 적용되었는지 사례를 통해 살펴보고, 이러한 기법들이 기존의 무작위 탐색(Random Search, RS) 방법에 비해 높은 탐색 효율성과 성공률을 어떻게 달성했는지 분석한다. 또한, 각 알고리즘의 장단점을 비교하여 평가하고, 오류 주입 공격의 정밀도와 효율성을 더욱 향상시키기 위한 추가 연구 방향을 제안한다.
-
본 논문은 소스 코드에 내재된 취약점을 탐색하기 위해 대형 언어 모델을 취약점 탐색 태스크에 맞게 파인튜닝하여 사용하는 최신 연구들을 소개한다. 각 연구에서 대형 언어 모델을 활용하여 중점적으로 해결하려는 문제와 솔루션을 설명하고, 향후 연구 방향을 조망하려 한다.
-
Binary Code Similarity Detection (BCSD) plays a critical role in software security applications like vulnerability detection and malware analysis. This review surveys both traditional and machine-learning-based approaches to BCSD. Traditional methods, such as control flow graph matching and symbolic execution, have demonstrated effectiveness but suffer from scalability issues, particularly with obfuscated code. Modern machine learning techniques, including graph neural networks and deep learning models, offer improved adaptability across architectures and scalability. Despite these advancements, challenges remain in cross-platform detection, handling obfuscation, and deploying BCSD tools in real-world security scenarios. The review highlights recent innovations and outlines potential future directions for enhancing the robustness and efficiency of BCSD systems.
-
클라우드 도입이 확산됨에 따라 보안 위협 역시 지속적으로 증가하고 있다. 특히, 클라우드 시스템에서 데이터를 안전하게 관리하기 위해 TLS 프로토콜을 사용해 네트워크 연결을 암호화하지만, 관리자의 잘못된 설정으로 인해 데이터 유출의 위험이 존재할 수 있다. 본 연구에서는 TLS 프로토콜을 통해 암호화된 통신에서 사용되는 설정 정보를 확인하고, Traffic Control BPF (TC-BPF) 기술을 적용하여 현 클라우드 시스템 내 TLS 구성 정보를 수집하는 방법을 제안한다. 또한, 이를 바탕으로 수집된 정보를 기반으로 취약한 설정을 분석하고 로그를 생성하는 시스템을 구현하였다. 그 결과, 네트워크 지연 시간에 약 1.3%의 성능 저하만을 발생시켰으며, 수집된 로그를 기반으로 암호화 알고리즘의 취약성을 효과적으로 분류할 수 있었다.
-
Nam-Jung Heo;Se-Han Lee;Sang-Hoon Choi;Ki-Woong Park 222
최근 인간의 인지 능력을 모방한 지능형 MTD 연구가 주목받고 있다. 지능형 MTD는 기존 전략에 성능 오버헤드를 줄이고 더 강력한 보안 시스템을 제공한다는 점에서 향후 미래 보안 기술로 예상된다. 본 논문에서는 지능형 시스템과 MTD 전략에 관한 연구들을 검토한다. 연구 논문에서는 지능형 MTD를 위한 관점 분류 연구에 초점을 맞춘다. 그 후, 해당 관점에 일치하는 추가적인 연구논문을 조사하여 향후 지능형 MTD의 연구 방향을 제시한다. 지능형 MTD는 동적 방어 체계의 효율성을높이고 공격자의 공격에 적응하여 최적의 전략을 선택할 수 있는 방어 체계로서 미래 보안의 중요한 역할을 수행할 것이다. -
본 연구는 네트워크 프로그램의 취약점을 신속하게 탐지하기 위해 Directed Fuzzing 기법을 적용한 ProtoGo를 제안한다. Directed Fuzzing은 특정 목표 지점을 집중하여 탐색하는 데 효과적이지만, 기존 기법들은 네트워크 프로토콜의 복잡한 상태 전이를 충분히 고려하지 못하는 한계가 있다. 이를 해결하기 위해, 본 연구에서는 정적 분석을 통해 프로토콜의 상태 기계를 생성하고, 각 상태와 함수 호출 간의 관계를 추적하여 효율적인 탐색 경로를 제공하는 도구를 설계하였다. 향후 연구를 통해 ProtoGo의 프로토타입을 구현하고, 성능을 검증할 예정이다.
-
커널은 운영 체제의 핵심 요소로 시스템 자원과 하드웨어를 관리하고 주요 시스템 서비스를 실행한다. 현대 프로세서의 대부분을 차지하는 모놀리식 커널은 모든 커널 기능이 동일한 메모리 공간과 동일한 높은 권한으로 실행되어 하나의 취약점이 시스템 전체를 위협할 수 있다. 이를 해결하기 위해 내부 커널 격리를 이용한 연구가 진행되어 왔다. 본 논문에서는 내부 커널 격리를 이용해 커널 보안을 강화한 최근 연구들에 대해 알아보았다.
-
현대 인터넷 인프라의 핵심 요소 중 하나인 DNS 는 도메인 이름을 IP 주소로 변환하여 사용자가 원하는 웹사이트에 접근할 수 있게 한다. 이 과정에서 다양한 레코드 형식이 사용되는데, 그중 TXT 레코드는 이메일 인증 및 도메인 소유권 검증과 같은 중요한 역할을 수행한다. 그러나 최근 TXT 레코드의 사용이 증가하면서 무분별한 남용 사례가 발생하고 있으며, 이는 성능 저하 및 보안 위협을 초래할 수 있다. 본 논문은 국내 인터넷 환경에서 DNS TXT 레코드의 사용 현황을 최초로 조사 및 분석한 연구로, 84,005 개 도메인에서 57,680 개의 TXT 레코드를 수집하여 TXT 레코드의 분포 및 오남용 사례를 파악하였다. 이를 통해 TXT 레코드 남용이 시스템 성능 및 보안에 미치는 영향을 규명하고, 향후 효과적인 관리 방안을 제시하고자 한다.
-
본 논문은 ROS2 환경에서 사용 가능한 다양한 퍼징 도구들을 조사함으로써, 이 분야의 연구 동향을 분석하고자 한다. 최근 로보틱스의 활용 범위가 확대됨에 따라 ROS 보안 취약점에 대한 우려 또한 증가하고 있다. 이에 따라, ROS2 환경에 특화된 다양한 퍼징 테스트 도구들의 기능, 효율성 및 적용 사례를 비교 분석하여 ROS2 의 보안 강화에 기여할 수 있는 방안을 모색한다. 또한, 현존하는 퍼징 도구들의 한계를 진단하고, 이를 개선한 새로운 퍼징 도구 개발의 필요성에 대해 논의한다.
-
본 논문은 자동차 보안에서 Secure Timing 의 중요성과 다양한 시간 동기화 방법들을 분석한다. 기존의 일반적인 Secure Timing 방법들과 자동차 환경에서의 차이점을 설명하고, 실시간성 및 보안 요구사항을 충족하기 위한 자동차 보안에 특화된 방법들을 소개한다.
-
본 연구는 현대 자동차 산업에서 급증하는 사이버 보안 위협에 대응하기 위한 하드웨어 기반 보호기법들을 종합적으로 분석한다. 특히 하드웨어 보안 모듈(HSM), 신뢰 플랫폼 모듈(TPM), 그리고 ARM TrustZone 기술에 초점을 맞추어, 이들의 기본 개념, 특징, 그리고 자동차 보안 시스템에서의 적용 사례를 살펴본다.
-
Ki-bong Kang;Yun-seong Hwang;Jun-seung You;Yun-heung Paek 245
RISC-V 는 Open-source ISA 로 2010 년 제안된 이후 상용화를 위해 많은 연구가 진행되고 있다. 다양한 하드웨어적 보안 기법과 최적화가 이루어지고 있지만, 오픈소스 RISC-V 코어에 부채널 공격에 대한 방어 기법이 부족한 것을 확인하였기에 상용화할 RISC-V 코어에 부채널 공격 방어 기법이 적용되어야 더욱 안전한 사용이 가능하다. 또한 기존에 개발된 코어에 대한 통일된 환경에서의 성능 비교 및 분석은 따로 진행되지 않아 상용화할 코어를 선정할 근거 역시 부족한 상황이다. 따라서 본 논문에서는 부채널 공격 방어 기법을 구현할 RISC-V 코어를 선정하기 위해 각 코어에 대한 성능 분석 및 비교를 진행한다. 이를 통해 기존 시스템의 보안 코어를 대체할 수 있는 코어를 선별하여 추후 방어 기법 구현에 활용한다. -
Ji-Min Lee;Seung-Yeol Cho;Jae-Hyeok Park;Kyoung-Hoon Jeon;Sang-Hui Park;Hyunyoung Oh 248
스마트카드 기술은 현대 사회의 다양한 영역에서 광범위하게 활용되고 있으며, 그 중 보안은 가장 중요한 고려 사항으로 인식되고 있다. 본 연구에서는 스마트카드에 적용된 다양한 보안 기술의 구현 방식과 실제 상용화된 카드에서의 적용 사례를 분석한다. 이를 통해 스마트카드 보안 기술의 최신 연구 동향을 파악하고, 향후 기술 발전 방향에 대한 전망을 제공하고자 한다. -
동형암호는 암호화된 상태에서도 연산을 수행할 수 있는 암호이다. 양자컴퓨터 시대가 눈앞에 도래한 지금 양자컴퓨터에도 안전한 격자 문제에 기반을 둔 동형암호가 적용될 수 있는 분야는 무궁무진하다. 하지만 동형암호만으로는 프라이버시 즉 기밀성은 보장하지만 무결성이 보장되지 않는다. 따라서 기밀성과 무결성 모두를 보장하라는 요구를 만족시킬 수 있는 개념의 암호체계가 등장했는데 바로 동형 인증 암호이다. 이 논문에서는 동형 인증 암호와 이를 적용할 수 있는 응용 분야 중 하나인 동형 제어 기술에 대해 소개하고, 무선통신을 사용하는 사이버 물리 시스템을 안전하게 제어하기 위해 기존에 적용된 보안 기술과 비교하여 동형 인증 암호를 적용한 사례는 어떤 기대효과를 누릴 수 있는지 살펴본다. 이를 통해 제어기가 해킹되지 않도록 하는 안전성에 중점을 둔 '보안 비용'과 하드웨어 가속, 알고리즘 최적화로 '실시간 제어'가 가능하게 하는 기술의 최적화가 적절한 조화를 이룰 수 있도록 설계하는 연구의 상업적 효과에 대해 탐구한다.
-
Han-Gyeol Seo;Sung-Woo Lee;Jae-Yong Lee;Bo-Hyeon Hwang;Yong-Geun Jang;Hyunyoung Oh 254
대용량 데이터 처리 시 발생하는 CPU-메모리 간 성능 격차(performance gap)로 인한 병목 현상은 현대 컴퓨팅 시스템의 주요 과제이다. 본 논문에서는 이를 극복하기 위한 새로운 아키텍처인 PIM(Processing-In-Memory)을 소개하고, PQC(Post-Quantum Cryptography) 및 FHE(Fully Homomorphic Encryption)와 같은 암호학 분야에서 PIM 을 적용하여 처리 지연(latency)을 완화하고 성능 향상을 보인 사례를 분석한다. 각 구현 사례에 대해 기존 아키텍처 대비 구체적인 성능 향상 결과를 제시하며, 최신 연구 동향을 정량적으로 평가한다. -
본 연구는 자동차 데이터 보안을 위한 키 관리 기법의 최신 동향을 분석한다. 중앙집중형, 분산형, 그리고 블록체인 기반의 키 관리 방식을 비교 분석하며, 각 방식의 기술적 특징과 장단점을 심도 있게 고찰한다. 특히 차량 내부 통신과 차량 간 통신 보안을 통합적으로 고려하는 접근 방식의 필요성을 강조한다.
-
기존 경계형 보안 모델의 한계로 인해 제로 트러스트 아키텍처의 도입이 기업의 필수 과제로 부상하고 있다. 그러나 제로 트러스트 아키텍처로의 전환은 장기적인 과제이며, 빅뱅 방식으로 접근할 경우 큰 리스크와 높은 비용이 발생할 수 있다. 본 논문에서는 신뢰점수(Trust Score)기반 클라이언트 접근제어 기법을 제안함으로서 기존 구축된 인프라와 제로트러스트 아키텍처 간의 가교가 되는 점진적인 전환을 시도하고자 한다. 제안된 기법이 제로트러스트 패러다임에 적합하며 적용 후 제로트러스트 성숙도 수준이 향상되는 것을 확인하였다.
-
고성능 컴퓨팅을 위한 기술로 병렬 컴퓨팅의 중요성이 대두되고 있다. 이에 이 논문에서는 널리 사용되고 있는 아키텍처인 x86 아키텍처와, 오픈 소스와 전력 효율의 장점을 가지고 최근 각광 받는 RISC-V 아키텍처에서 병렬 연산을 이용한 4x4 행렬 곱셈의 성능을 비교 분석하였다. 그 결과 RISC-V 의 최적화가 추가적으로 필요함을 확인하였다. 본 연구는 RISC-V 의 벡터 연산 성능을 향상시키기 위해 향후 연구 방향을 제시한다.
-
오픈 소스 소프트웨어 공급망의 성장과 함께 악성 패키지 탐지가 중요한 과제가 되고 있다. 기존의 정적 분석과 동적 분석은 시간이 많이 소요되기 때문에, 본 연구에서는 이를 해결하기 위해 메타데이터 분석을 도입했다. 또한, 외부 메타데이터에 의존하는 기존 탐지 모델의 한계를 극복하고자, 내부 메타데이터만을 활용하여 배포 초기에도 RubyGems 에서 악성 패키지를 신속하게 탐지할 수 있는 모델을 제안한다. 실험 결과, 제안한 모델은 평균 97.63%의 정확도로 우수한 성능과 빠른 탐지 속도를 보여, 내부 메타데이터 기반의 탐지 방식의 가능성을 확인하였다.
-
이번 글로벌 IT 대란에서 국내 금융 및 공공 분야는 '망 분리' 규제 덕분에 피해가 미미했으나, 클라우드 확산이 가속화되면서 향후 이러한 보호가 약화 될 가능성이 있다. 클라우드 도입이 불가피한 상황에서 서비스 제공자와 고객 간의 분쟁 예방 및 해결 방안 마련이 필수적이다. 이번 사태는 규제 강화보다는 사이버 공급망 위협에 대한 선제적 대응과 IT 역량 강화를 위한 기회로 삼아야 한다.
-
본 논문은 자동차에서의 안전한 데이터 저장 및 공유 기술에 대한 최근 동향을 조사한다. 블록체인 기술을 이용한 데이터 관리 방식을 중점적으로 살펴보며, 비동기식 연합학습, 컨소시엄 블록체인, 엣지 컴퓨팅 결합 등의 접근법을 분석한다. 이러한 기술들이 데이터 무결성, 프라이버시 보호, 시스템 효율성 향상에 기여함을 확인하고, 향후 연구 방향과 과제를 제시한다.
-
Se-Ok Jeon;Hyeonji Jang;Min-Soo Jeung;SeoJun Lee;Da-Young Oh;Kwang-hoon Choi;Seokhwi Kim;Sungwoo Cho;Jwongmi Kim 273
오픈소스 코드 재사용은 비용 절감과 생산성을 높이지만, 관리의 복잡성으로 인해 취약점이 발생할 수 있다. 본 논문은 전기차 충전 인프라에서 사용되는 오픈소스 소프트웨어의 취약한 코드 복제를 탐지하는 방법을 제안한다. VUDDY 와 IoTCube 를 활용해 분석한 결과, open-ocpp 에서 zlib 복제로 인한 취약한 코드 클론 사례가 발견되었으며, 이는 CVE-2016-9840 및 CVE-2016-9841 과 관련이 있었다. 연구는 코드 복제 취약점 탐지를 통한 전기차 충전 인프라 보안 강화 가능성을 보여주었다. -
Yun-Gi Cho;Woo-Rim Han;Mi-Seon Yu;Yun-Heung Paek 277
Collaborative inference combines diverse features contributed by various agents to improve prediction accuracy. However, it is vulnerable to adversarial attacks, where attackers manipulate the model's predictions through non-consensual inputs. Since each participant operates within their unique feature space, defending against these attacks becomes particularly challenging. A recent study demonstrated that using an auto-encoder based on the underlying manifold can reduce the impact of malicious participants. However, our experiments observed that the recently proposed attack, in which malicious influences close to the manifold, may still pose a threat. To address this issue, we introduce a novel approach that leverages implicit redundancy across participants' feature spaces during the inference stage via participant-wise anomaly detection. We evaluate this approach on CIFAR10, CINIC10, Imagenette, Give-Me-Some-Credit, and Bank Marketing datasets. Extensive experiments and ablation studies show that RIP effectively mitigates adversarial attacks in the collaborative inference stage. -
ROS(Robot Operating System)은 복잡하고 분산된 로봇 애플리케이션 개발을 위해 유연한 프레임워크다. ROS 는 다양한 소프트웨어 컴포넌트 간의 통신을 가능하게 하는 미들웨어로, 로봇 제어 시스템 구축에 필요한 도구와 라이브러리를 제공한다. 본 논문에서는 ROS2 에 대한 소개 및 ROS2 대상 보안 기능을 제공하는 SROS2 에 대한 소개를 하고자 한다. 최근 SROS 를 대상으로 하는 취약점 연구들이 제안되고 있는데 이러한 취약점은 접근 정책을 우회하거나 시스템의 설정에 관한 정보를 탈취할 수 있는 위험이 있다. 본 논문은 이러한 취약점이 시스템의 보안성에 미치는 영향을 설명하고 최근 ROS 을 대상으로 하는 취약점들을 알아보고자 한다.
-
스마트 계약은 다양한 형태의 계약을 체결하고 이행할 수 있게 해주는 오늘날 가장 인기있는 기술 중 하나이다. 그러나 적절히 구현되지 않은 스마트 계약은 공격 대상이 될 수 있으므로 버그 탐지 기법의 개발과 적용이 중요하다. 본 논문에서는 스마트 계약에서 발생하는 주요 버그 유형과, 이를 탐지하기 위한 최신 연구 동향을 조사한다. 이를 통해 스마트 계약의 안전한 구현과 블록체인 네트워크의 지속 가능한 발전에 기여하고자 한다.
-
본 논문에서는 악성코드 탐지를 위한 정적 분석 기반의 새로운 기법을 제안한다. 본 연구는 악성코드 파일에서 Opcode와 Call Graph를 각각 추출하고, 이를 바탕으로 두 가지 머신러닝 모델을 학습한 후 앙상블 기법을 사용하여 최종적으로 악성코드를 분류하는 방법론을 제시한다. Opcode 기반 분석에서는 어셈블리어를 추출하여 정규표현식을 이용해 명령어를 추출했고 N-gram 기법을 활용해 명령어의 흐름을 분석한다. Call Graph 분석에서는 함수 호출 관계를 추출하고 Diffpool 기법을 통해 그래프를 벡터화한다. 제안된 시스템은 개별 모델의 장점을 결합하였고 적은 데이터에 비해 높은 정확도와 탐지율을 달성한다. 특히, 신종 악성코드나 변종 악성코드를 탐지하는 데 있어서 기존 서명 기반 기법에 비해 더 높은 성능을 보일 가능성이 높다. 실험 결과, 91%의 정확도와 88%의 재현율을 보여주어 높은 결과를 나타냈다. 본 연구는 악성코드 탐지 분야에서 정적 분석 기법의 가능성을 제안한다.
-
Software vulnerabilities impose a significant burden on developers, particularly in debugging and maintenance. Automated Software Vulnerability Repair has emerged as a promising solution to mitigate these challenges. Recent advances have introduced learning-based approaches that take vulnerable functions and their Common Weakness Enumeration (CWE) types as input and generate repaired functions as output. These approaches typically fine-tune large pre-trained language models to produce vulnerability patches, with performance evaluated using Exact Match (EM) and CodeBLEU metrics to assess similarity to ground-truth patches. However, current methods rely on teacher forcing during fine-tuning, where the model is trained with ground-truth inputs, but during inference, inputs are generated by the model itself, leading to exposure bias. Additionally, while models are trained using the cross-entropy loss function, they are evaluated using discrete, non-differentiable metrics, resulting in a mismatch between the training objective and the test objective. This mismatch can yield inconsistent results, as the model is not directly optimized to improve test-time performance metrics. To address these discrepancies, we propose the use of reinforcement learning (RL) to optimize patch generation. By directly using the CodeBLEU score as a reward signal during training, our approach encourages the generation of higher-quality patches that align more closely with evaluation metrics, thereby improving overall performance.
-
이 연구는 웹 애플리케이션 보안에서 흔히 발생하는 CWE-79(XSS) 취약점을 탐지하기 위해 정적 분석 도구와 동적 분석 도구의 이론적 비교를 수행하였다. SonarQube와 OWASP ZAP을 중심으로, 두 도구의 탐지 메커니즘과 장단점을 분석하고, 이들이 보안 점검에 미치는 영향을 논의하였다. 연구 결과, 정적 분석 도구와 동적 분석 도구는 상호 보완적인 관계에 있으며, 두 도구를 결합하여 사용할 때 취약점 탐지의 효율성과 정확도가 크게 향상될 수 있음을 확인하였다. 또한, 이 연구는 AI 기반 탐지 기법을 도입하기 위한 기초 자료를 제공하며, 향후 연구에서 AI를 활용한 보다 정교한 보안 분석 기법을 개발할 가능성을 제시하였다. 이번 연구는 실질적인 실험 데이터를 포함하지 않았지만, 이론적 분석을 통해 정적 및 동적 분석 도구의 보안성 강화 방안을 모색하고, 보안 분석 기법의 발전을 위한 기초 데이터를 마련하였다.
-
임베디드 시스템이 급속도로 고도화됨에 따라 임베디드 기기에서의 어플리케이션 또한 공격자에게 넓은 공격 표면으로 작용하게 되었다. 임베디드 기기의 역할이 이전보다 다양해짐에 따라 공격자가 민감한 개인정보를 탈취하거나 온디바이스 AI 모델을 탈취하는 등 임베디드 기기에 대한 공격 가치가 올라가고 있고, 그에 따라 임베디드 기기에 대한 보안 중요도 또한 이전보다 증가하고 있다. 본 연구에서는 임베디드 기기에서의 소프트웨어 보안 기법 연구 동향을 종합적으로 조사하고 분석하여 이들에 유효성을 평가하고 향후 새로운 임베디드 기기에서의 소프트웨어 보안 기법 연구 전략에 대한 제언을 제시하고자 한다.
-
Nam-Hyun Kim;Jee-Hyun Koo;Minji Son;Ha-won Kim;Kwang-Man Ko 302
디지털 헬스케어에서 의료기기 소프트웨어의 보안은 환자 데이터 보호와 기기 기능 유지에 있어 매우 중요하다. 현재 많은 의료기기 소프트웨어는 보안 취약점에 노출되어 있으며, 특히 CWE-94(코드 삽입)와 Hollowing Process 같은 공격 기법이 문제로 대두되고 있다. 이러한 취약점은 보안 솔루션의 우회를 가능하게 하며, 의료 기기의 무결성과 환자 안전을 위협할 수 있다. 본 논문에서는 동적/정적 리버싱 도구를 활용하여 이러한 취약점을 탐지하고 분석하는 방법을 제시 및 진행중이며 이를 통해 의료 기기 소프트웨어의 보안을 강화하는 데 기여할 수 있다. -
Jin-Wook Kim;Sang-Woo Park;Byung-Jin Song;Ji-eun Kim;Gwan-bin Kim;Jun-Seop Lim;Kwang-Man Ko 304
Use After Free(UAF) 취약점은 의료 소프트웨어, 의료 시스템, 임베디드 시스템 등 다양한 분야에서 널리 사용되고 있는 보안 취약점이다. C/C++는 메모리를 직접 할당하고 해제하는 작업을 프로그래머가 수동으로 수행하기 때문에 UAF의 발생 가능성이 높다. UAF는 과거로부터 현재까지 해결되지 않은 버그로써 존재하고 있으며, [1]2023년CWE 제일 위험한 취약점 Top25중에 4위를 차지하고 있다. 본 논문에서는 C/C++가 널리 사용되는 만큼 UAF를 빠르고 정확하게 탐지하기 위한 연구내용과 성능 결과를 소개한다. -
So-hee Ha;Sang-yeob Kim;Bo-gyung Park;Seong-soo Han 307
BLE 기술은 저전력과 효율적인 데이터 전송을 제공하지만, 통신 프로토콜의 결함을 악용한 키스트로크 주입 공격과 같은 보안 위협이 존재한다. 본 논문에서는 리눅스 커널의 BlueZ 패키지에서 발생한 CVE-2023-45866 취약점을 중심으로, 해당 공격의 원리와 심각성, 그리고 이를 해결하기 위한 패치를 분석한다. BLE 네트워크의 보안을 강화하기 위해서는 지속적인 연구와 대응이 필요하며, 보안 위협에 대한 대응 방안을 개발하고, 사용자의 보안 의식을 높이는 교육이 필수적임을 강조한다. -
동형암호는 MLaaS (Machine Learning as a Service)가 만연한 이 시대에 각광받고 있는 프라이버시 보호 기술 중 하나이다. 하지만 동형암호를 적용하게되면 데이터 크기가 굉장히 커지고, 비싼 연산으로 인하여 큰 overhead 가 발생한다. 따라서 더 효율적인 스케줄링을 통하여 이 overhead 를 최소화하였으며, 실험결과 총 latency 의 18%를 감소할 수 있었다.
-
추측 최적화의 적절하지 못한 구현으로 인해 발생하는 취약점에 대한 연구는 Spectre, Meltdown 등 주로 CPU에서 발생하는 취약점에 초점을 맞추어 활발히 이루어지고 있으나, 브라우저 엔진 및 프로그래밍 언어 구현체 등의 소프트웨어 수준에서 추측 최적화의 적절하지 않은 구현으로 인해 발생하는 Type confusion을 검출하려는 연구는 없었다. 본 연구에서는 소프트웨어 내 추측 최적화의 적절하지 않은 구현으로 인해 발생할 수 있는 취약점으로 Type confusion을 제시하고, 이를 Type check 미흡에 의한 Type confusion, 적합하지 못한 추측에 의한 Type confusion 2개로 분류해 정의하였다. 이 중 적절하지 못한 추측에 의한 Type confusion을 검출할 수 있는 방법론을 설계하였다.
-
AI 기술의 발달과 생성형 AI의 등장은 기업의 생산성을 높이는데 기여하며, 비즈니스 모델에 새로운 패러다임을 일으켰다. 그러나 생성형 AI는 중요 데이터와 일반 데이터를 구분할 수 없어 기업의 핵심 정보와 같은 치명적인 정보가 외부에 유출될 수 있는 문제가 발생한다. 이러한 이유로 많은 기업이 생성형 AI 사용을 제한하고 있으나, 생성형 AI로 얻을 수 있는 경제적 이점을 포기하기 어려운 상황이다. 따라서, 본 연구는 안전한 데이터 관리 및 유출 방지를 위해 보안 위협과 이를 해결할 기술을 분석한다.
-
양자내성암호(PQC, Post Quantum Cryptography)는 기존 컴퓨터 시스템과 양자 컴퓨터 시스템에서 모두 보안성을 보장하는 암호체계이다. NIST 에서 표준화로 선정된 네 가지 알고리즘을 보면, 그 중 세 가지의 알고리즘이 모두 격자기반 알고리즘임을 알 수 있다. 이에 따라 격자기반 알고리즘에서 공통되는 연산을 통합하여 효과적으로 구현하려는 연구들이 진행되고 있으며, 그 중에는 RISC-V 를 통한 하드웨어/소프트웨어 통합 설계 연구 그리고 FPGA 혹은 ASIC 을 이용한 하드웨어 통합 모듈 가속 연구들이 있다. 본 논문에서는 효과적인 하드웨어 설계를 위해 세 종류의 격자기반 양자내성암호 연산을 분석하고, 이를 하드웨어에서 효과적으로 구현한 기존 연구 사례를 분석한다. 이를 통해 통합 모듈 가속 기법 연구를 위해 고려되는 면적 대비 연산성능 그리고 면적 대비 소비전력 등의 수치를 높이는 과정에서 발생하는 문제점과 이를 효과적으로 극복하는 방법들을 소개한다.
-
악성코드에 의한 공격은 연평균 수억 건 이상 발생하고 있으며, 큰 폭으로 증가하는 악성코드 개수에 비해 악성코드 분석가가 각 악성코드를 분석하고 대응하기에는 한계가 있다. 이와 같은 한계를 극복하기 위한 방법으로 악성코드 자동 분석 시스템을 사용하는 방법이 있다. 그러나 악성코드에 Anti-VM 기술들이 포함된 경우 자동 분석 시스템에서는 제대로 탐지하기 어렵다는 단점이 있다. 본 논문에서 Anti-VM 기술에 활용되는 API 와 API 의 파라미터 정보를 분석하여 API 후킹 모듈을 기반으로 Anti-VM 탐지 우회 방법을 제안한다. Anti-VM 기술은 Virtual Box 기반의 가상 환경을 탐지하는 기술을 기준으로 연구를 진행하였고 API 및 파라미터 또한 Virtual Box 기반의 가상 환경을 탐지할 때 활용되는 API 및 파라미터를 분석하였다. 분석한 데이터를 기반으로 Anti-VM 기술을 우회하기 위한 API 및 후킹 프로그램을 제작해서 연구를 진행하였다. 연구 결과 Virtual Box 기반의 가상 환경을 탐지하는 기술 중 시간 딜레이, 마우스 이벤트 등의 행위 기반 탐지 기술은 명확한 지표를 측정하기 어려워 우회가 어려웠으나 가상 환경 특성 탐지, 파일 아티팩트 탐지, 레지스트리 및 시스템 설정 탐지 기술은 식별 및 우회에 뛰어난 성능을 보였다.
-
Recently, automotive security is gerning significant attention due to the gradual surge in cyberattacks on automotive systems experienced by the industry over the past few years. These cyberattacks stem from the widened attack surface especially caused by increased connectivity and architectural complexity in modern automotive systems. Hardware Trust Anchors (HTAs), a known security technology in the cyber space, have been suggested as a candidate means to prevent automotive cyberattacks. In this paper, we analyze the effectiveness of HTAs in preventing automotive cyberattacks, and the current challenges adopting existing HTAs for automotive security. Simultaneously, we shed a light on complementary cyber defenses that may accompany HTAs to further enhance automotive security.
-
침해사고 대응팀의 성숙도를 진단하는 대표적인 모델인 SIM3와 SOC-CMM는 침해사고 대응팀의 설립 또는 운영 초기단계의 조직에 적용시 제한된 기술과 역량으로 인해 성숙도 진단 및 평가에 오판을 유발한다. 본 연구는 이러한 한계를 보완하는 개선된 성숙도 진단모델을 제시한다.
-
본 연구에서는 FlowSpectrum을 활용하여 암호화된 트래픽 분류의 성능을 개선하기 위한 양자화 기법을 제안한다. 통신 기술의 발전으로 인해 암호화된 트래픽의 양이 증가하고 있으며, 이는 네트워크 관리 및 보안 모니터링에 어려움을 초래하고 있다. FlowSpectrum은 오토인코더를 통해 암호화된 트래픽에서 추출된 데이터를 1차원 표준 좌표계에 다양한 간격의 스펙트럼 선으로 표현하는 새로운 특징으로, 복호화 없이도 데이터 추출이 가능하다. 본 연구에서는 FlowSpectrum 기반 암호화된 트래픽 분류에서 양자화 수준에 따른 분류 성능의 변화를 분석하였으며, 실험 결과 3자리 양자화에서 가장 높은 성능을 보였다. 이는 양자화가 FlowSpectrum의 특성을 효과적으로 활용할 수 있는 방법임을 시사하며, 향후 다양한 데이터셋에 대한 적용 가능성을 탐색하고 양자화 기법의 최적화를 통해 성능 향상을 도모할 예정이다.
-
데이터 프라이버시에 대한 관심이 높아지면서 여러가지 프라이버시 보호 기술에 대한 연구가 활발히 이루어지고 있다. 대표적인 프라이버시 보호 기술로는 동형암호, 다자간연산, 신뢰실행환경, 차등 프라이버시 등이 있다. 본 논문은 다자간 연산의 대표적인 기술인 가블드 회로를 외부 서버에 안전하게 위탁하여 연산할 수 있는 기술에 대해 소개한다.
-
동형암호는 프라이버시 보존형 신경망 연산을 가능캐한다. 하지만 동형암호는 비산술연산을 직접 연산하지 못해 근사식을 활용하는데, 신경망 정확도 하락을 일으킨다. 이를 극복하기 위해 재학습, Neural Architecture Search 등 방법들이 등장했지만, 큰 소요시간을 필요로 한다. 본 연구는 이 둘보다 빠르면서도 정확도 하락을 적게 일으키는 중간값 유도 근사식 생성 기술을 제안한다.
-
동형암호 기반 클라우드 서비스는 평문대비 큰 동형암호문의 크기로 인해 통신부하가 발생한다. 본 논문은 이러한 통신부하를 줄이기 위한 방법으로 신뢰실행환경(Trusted Execution Environment, TEE) 기반 프록시 암호화를 활용하는 방법을 제안하고, 실험을 통해 큰 동형암호 파라미터에서의 유용성과 성능이 뛰어남을 보여주고자 한다.
-
Hyun-Jin Kim;Ji-Eun Kim;Hyun-Ju Park;Dae-Hwan Kim;Keun-Chang Kwak;Chan-Uk Yeom 346
본 연구는 ECG(Electrocardiogram)를 활용한 질병 분류 기술 개발을 목표로 1D CNN을 설계하여 ECG 데이터를 분석하였다. MIT-BIH Arrhythmia Database를 사용해 전처리 후 1D CNN 모델로 시계열 데이터에서 질병 분류에 유효한 특징을 추출하였다. 훈련 데이터에서는 약 81.91%의 정확도를 기록했으나, 검증 데이터에서는 57.5%로 성능 편차가 확인되었다. 이는 데이터 불균형의 영향으로 보이며, ECG가 비침습적이면서도 보안성이 높은 생체 신호로서 질병 분류에 유망하다는 것을 시사한다. 향후 연구에서는 다양한 데이터셋과 모델 고도화를 통해 성능을 개선할 계획이다. -
광고 및 트래커 차단기를 사용하는 웹 사용자의 비율이 증가함과 동시에, 트래커 구현 기법 또한 빠르게 발전하고 있다. 최근 트래커 개발자는 다양한 단위 (granularity)에서 웹 사이트의 핵심 기능과 트래커를 묶어 기존 이분법적 분류 및 차단 방식을 제한하고 있다. 정밀한 트래커 탐지 및디블로팅 필요성이 대두되는 가운데, 트래커의 문장 (statement) 단위 식별과 트래커의 모든 소스 (source)를 고려한 분석 기술의 부재를 확인하였다. 따라서 본 연구는 실행 컨텍스트 (execution context) 기반의 동적 분석 도구 설계를 통해 트래커와 웹 사이트 기능의 리소스 상관관계를 분별함과 동시에, dynamically executed script를 최대한 호출하여 트래커를 문장 단위에서 정밀하게 탐지 및 디블로팅하는, Mixed Script Guard를 설계하였다.
-
합성데이터는 통계적 특성이 유사한 가상의 데이터로, 개인정보 보호 및 데이터 부족 문제를 해결하는 데 기여한다. 이를 관계형 데이터베이스로 확장한 관계형 테이블 합성데이터는 금융, 통신 등 다양한 응용 분야에서 사용되고 있으며 이에 대한 유용성과 안전성을 평가하는 다양한 지표들이 개발되어왔다. 그러나 현재 사용되는 평가지표는 단일 테이블이나 여러 테이블을 하나로 결합한 후 평가하는 경우가 많아 관계형 데이터의 복잡한 구조를 충분히 반영하지 못한다는 한계가 있다. 따라서 본 논문은 관계형 테이블 합성데이터 평가 시 기존 지표에 대한 한계를 분석하고, 데이터 간 관계 보존을 효과적으로 평가할 수 있는 포괄적 평가 지표의 필요성을 강조하며, 이를 위한 향후 지표 개발 방향성을 논의한다. 본 연구는 관계형 테이블 합성데이터의 신뢰성과 품질을 높이는 데 중요한 기여를 할 것으로 기대된다.
-
Jun-Yong Yoon;Tea-Hwan Yoon;Su-Bin Choi;Jae-Heon Kim;Bong-Jun Choi 356
현대 사회에서 큰 문제중 하나인 보이스 피싱은 다양한 기술을 사용하여 많은 사람에게 피해를 주고 있다. 이러한 문제를 해결하고자 많은 시도가 있었고 그 중 한 방법이 인공지능을 활용하여 보이스 피싱을 탐지하는 방법이다. 하지만 인공지능을 활용하는 과정에서 데이터 프라이버시 보장이 이루어지지 않는 문제가 발생한다. 본 논문에서는 이러한 문제를 해결하고자 연합학습을 사용한 개인정보 보호에 특화된 보이스 피싱 탐지 기술을 제안한다. 연합학습은 사용자의 데이터를 중앙 서버로 전송하지 않고 로컬 디바이스에서 학습한 모델만을 서버로 전송하여 개인정보 유출을 방지하는 인공지능 학습 방법이다. 또한 스노클을 활용한 오토 데이터 라벨링 기법을 적용하여 피싱 여부를 자동으로 분류하고 탐지 성능을 향상시킨다. 본 기술은 일반적인 인공지능 학습 기술과 비교하여 좋은 성능을 보이며 특히 피싱 탐지에서 중요한 부분인 긍정 클래스 예측 부분에서 높은 성능을 보이고 있다. -
본 논문에서는 TFHE(Fast Homomorphic Encryption over the Torus)의 가속화를 위한 다양한 CUDA 기반 라이브러리인 cuFHE, nuFHE, (RED)cuFHE의 성능을 비교 분석하였다. 각 라이브러리의 최적화 기법과 GPU 자원 활용 방식이 동형암호 연산의 처리 속도에 어떻게 영향을 미치는지 실험을 통해 확인하였으며, 이를 통해 상황에 맞는 라이브러리 선택의 중요성을 강조하였다. 특히, 본 연구는 각 라이브러리의 특징과 차이점을 상세히 분석함으로써, 효율적이고 실용적인 TFHE 가속화 방법에 대한 가이드라인을 제공한다. 이러한 연구 결과는 동형암호 기술의 실용성을 높이고, 고속화된 암호 연산이 필요한 다양한 분야에서 활용될 수 있는 기반을 마련할 것으로 기대된다.
-
2023 년 개정된 개인정보보호법(PIPA)의 요구사항을 기반으로 표준화된 로그 형식을 활용하여, 관계형 데이터베이스(RDB)에서 리스크(risk) 기반의 모델을 적용함으로써 최근 증가하고 있는 대내외 개인정보 유출을 범용적으로 탐지할 수 있도록 하였다. 이를 통해, 중소기업도 대기업과 유사한 수준의 보안 대응 능력을 갖출 수 있도록 지원하고, 로그 데이터를 활용하여 비정상적인 접근 패턴을 식별할 수 있도록 하며, 최소한의 리소스로도 효율적인 모니터링 체계를 구축할 수 있는 방법론을 구현하고자 한다. 이러한 접근 방식은 중소기업이 법적 요구를 충족할 뿐만 아니라, 비용 효율적인 보안을 통해 대기업 수준의 보안 강화 효과를 얻을 수 있도록 모델을 제시한다.
-
Sun-Ah Kil;Na-Yun Lee;Yoon-Ju Jang;Eun-Joo Choi;Sung-Wook Kim 369
기존 중앙 집중형 게임의 주요 문제로 아이템 현금거래 사기 범죄가 대두된다. 블록체인의 탈중앙화와 투명성, 불변성을 기반으로 게임이 운영된다면 문제를 해결할 수 있을 것이다. 본 논문에서는 블록체인 기술을 사용한 NFT(Non-Fungible Token) 게임을 제안한다. 인게임 재화는 모두 ERC-20 토큰으로, 아이템은 모두 ERC-721 토큰으로 생성하여 고유한 아이템을 이용자가 소유한다. 이러한 블록체인 기반 아이템 소유권은 안전한 아이템 거래 기능을 제공한다. -
Mahboubeh Bagheri;Seong-Hwan Park;Dong-Hyeon Kwon 371
Solana, a high-performance blockchain platform, is known for its fast transaction speeds and low operational costs, making it a popular choice for decentralized applications. However, its architecture introduces unique security vulnerabilities in smart contracts. This paper presents an analysis of six key vulnerabilities in Solana smart contracts-missing ownership checks, missing signer checks, arithmetic overflow/underflow, cross-program invocation (CPI) vulnerabilities, account confusion, and missing key checks. We further evaluate how automated verification tools like VRust and fuzzing techniques detect these vulnerabilities. Through case studies of widely-used Solana programs like Mango Markets and the Solana Program Library (SPL), we illustrate the effectiveness of these tools in real-world scenarios. -
블록체인은 네트워크 참여 노드 간 합의를 통해 동일한 원장을 분산 저장하여, 원장에 저장된 데이터의 신뢰성을 보장할 수 있다. 하지만 원장 데이터가 모든 노드에 중복 저장되는 문제가 있고, 이를 해결하기 위해 Reed-Solomon 코드를 적용하여 저장 효율성을 높일 수 있다. 이 논문에서는 허가형 블록체인 하이퍼레저 패브릭에서 Reed-Solomon 코드를 적용하여 원장을 저장 저장하는 경우, 분산 저장된 부호화 블록 파일의 비동기적 복구과정으로 인한 문제를 다루고, 동기화 제어 방안을 설계하여 해결 방안을 제시한다.
-
Deungwon Kang;Sumin Jeong;Joonseok Park;Keunhyuk Yeom 375
하이브리드 블록체인은 퍼블릭, 프라이빗 각 플랫폼의 특성을 활용한 비즈니스 거래를 지원할 수 있는 블록체인 기술이다. 현재 하이브리드 블록체인은 트랜잭션 데이터의 특징에 기반하여 운영을 지원하는 방법이 부족하여 원활한 비즈니스 거래 지원을 수행하기 어렵다. 따라서, 본 논문에서는 비즈니스 거래를 지원하는 방안을 하이브리드 블록체인 트랜잭션 추적 지원 아키텍처를 통해 제시한다. 제안하는 방법은 사례 시스템을 구성하여 아키텍처의 적용 가능성을 보이고 시각화 결과를 나타내었다. 또한 트랜잭션 추적 시 평균 0.599초의 실행 시간이 소요됨을 실험을 통해 확인하였다. 본 논문에서 제시하는 아키텍처는 하이브리드 블록체인 운영의 기반으로 적용할 수 있을 것으로 기대된다. -
저궤도 위성통신과 AI 기반 정보처리 시스템이 융합되면 향후 우리 사회의 핵심 인프라가 될 것으로 전망된다. 본 연구에서는 이와 관련된 국제 논문들로부터 새로운 지식 발견 및 새로운 응용과 정책을 발굴하고자 다양한 텍스트 마이닝 방법을 적용한다. 단어 통계, ngram, 단어 임베딩, 두문어 추출, 토픽모델링 등의 텍스트 마이닝을 적용하여 텍스트 데이터로부터 핵심 기술 정보를 추출하여 분류하고, 새로운 지식을 발견하여 이 분야의 기술에 관련한 지식을 효율적으로 파악할 수 있었다.
-
혀의 동작과 떨림은 건강 상태를 평가하는 중요한 지표로, 혀의 움직임을 정확히 추적하려면 영상분석 기술을 사용하여 물체의 움직임을 추적해야 합니다. 이 연구에서는 표면 특징이 불명확한 혀의 미세한 움직임을 명확히 보기 위해 광류(optical flow) 기술을 사용해 움직임을 확대했습니다. 이를 위해 이미지 확대(upsampling) 알고리즘과 광류 벡터 확대 알고리즘 두 가지 방법을 비교하여, 혀 움직임을 더 정밀하게 추적할 수 있는 방법을 찾고자 했다. 연구 결과, 벡터 확대 알고리즘이 더 정확한 광류를 생성하는 것으로 나타났다. 이는 이미지 확대에서 발생할 수 있는 aliasing 효과를 줄이고, 움직임의 방향과 속도를 더 정확히 표현하기 때문이다. 이러한 방법은 혀뿐만 아니라 초음파 영상을 통한 위장관이나 심장의 움직임을 정밀하게 추적하는 데도 유용할 수 있다. 이 연구는 광류 기반 움직임 분석이 다양한 의료 영상에서 유용하게 사용될 수 있는 가능성을 보여주며, 향후 진단과 치료모니터링에 중요한 도구가 될 수 있음을 시사한다.
-
질병은 인간의 삶과 사회에 큰 영향을 미치며, 천식은 주변 사람들이 쉽게 그 심각성을 인지할 수 있는 질환이다. 천식의 유병률에도 불구하고 광범위한 데이터를 사용하여 천식 발병을 예측하는 연구가 부족하다. 그리하여 본 연구는 딥러닝 모델을 활용하여 기상데이터, 대기 오염 물질 수준, 천식 환자 수를 딥러닝 모델로 학습하고자 한다. 날짜, 위도, 경도 좌표를 기준으로 데이터가 병합되며 생성된 통합 데이터세트에서는 천식 환자 수를 결과변수로 사용하고, DNN과 LSTM 모델을 사용해 지도학습을 수행하며 모델의 성능은 MSE 및 MAE를 지표로 사용하여 평가한다. 본 연구는 질병 발생을 사전에 예측함으로써 잠재적인 질병 발생에 대한 사전 정보를 제공하고 의료인력 배치를 최적화하며 의료 서비스의 전반적인 효율성을 향상시켜 사회적 이익을 향상시키고자 한다.
-
Quwon Lee;Minji Kim;Seongjae Lee;Yonghyun Kwon;Byeongseok Ryu;YoungGyun Kim 389
수목의 품종을 연구하고 특성을 규명하기 위해 특성조사요령에 따라 특성 분석이 시행된다. 특성조사요령은 신품종 개발 및 품종 보호 출원을 위한 재배심사에 필요한 특성별 조사 방법을 규정하고 있다. 하지만 수목의 특성 분석 과정에서 연구자의 주관이 개입될 가능성이 있으며, 특성 분석의 신뢰성에 부정적인 영향을 미칠 수 있다. 본 연구에서는 딥러닝 모델을 활용하여 영상 속에서 수목을 검출하고, 특성조사요령에 규정된 특성들의 '표현 형태'를 출력하는 시스템을 구현함으로써 수목 특성 분석의 신뢰도를 높이고자 한다. -
Jaewon Kim;Gyeongmin Kim;Sumin Lee;Jaeyong Lee;Byeongseok Ryu;Yonghyun Kwon;YoungGyun Kim 393
본 논문에서는 자연·인적재해로 인한 건물, 도로 붕괴 시, 신속하고 안전한 이동을 위해 위성 이미지를 U-Net 딥러닝 학습모델과 A* 알고리즘을 활용하여 위험지역을 우회한 경로 제안 시스템을 구현하였다. 이를 실제 재해 상황에 도입하면 안전이 확보된 최단 거리를 제공함에 따라 신속한 대피와 구호 등 재난 관리에 효율성을 제공하여 인명 및 물적 피해를 줄일 수 있을 것으로 예상한다. -
국가연구개발 사업의 성과관리는 국가의 연구개발 결과물에 지대한 영향을 미치기 때문에 매우 중요하다. 하지만 많은 참여기관이 동시에 사업을 수행하는 과정에서 연구개발 성과를 사람이 관리하는 것에는 한계가 존재한다. 특히 1년 이상의 추적이 필요한 성과관리의 경우 사전에 성과달성 여부를 판단하기가 어렵다. 따라서 이러한 성과관리의 일정관리 및 사전 성공예측을 위해서는 AI 기반의 알고리즘을 적용하여 성과관리를 할 수 있는 SW 기본 설계방안이 필요하며, 본 연구는 이를 구현하기 위한 성과관리의 이슈 분석을 통해 AI 기반의 성과관리 방안을 제시하고자 한다.
-
Useong Choe;Hyoengoh Son;Byeongseok Ryu;YoungGyun Kim 401
정보기술의 발전으로 여러 분야에 머신러닝 기법이 적용되고 있는 중, 금융·경제 분야는 낮은 신호 대 잡음 비, 머신러닝의 낮은 설명 가능성으로 인하여 머신러닝 활용의 확산이 더디게 일어나고 있다. 이러한 문제점을 해결하고자 웨이블릿 변환을 이용하여 금융데이터의 노이즈를 제거하고 설명 가능성을 높인 딥러닝 모델인 Temporal Fusion Transformer를 활용하여 금융·경제 분야 내 머신러닝 적용의 한계를 극복하는데 기여하고자 한다. -
Junseok Oh;DaGyeong Kwak;HyeonSeung Jeong;Yonghyun Kwon;Byeongseok Ryu;YoungGyun Kim 405
NCM 양극재는 높은 에너지 밀도로 인해 전기차 배터리에 널리 사용되며, 더 큰 용량과 긴 수명을 제공한다. 그러나 충방전 과정에서 발생하는 성능 저하는 양극재의 열화와 관련이 있다. 이를 억제하기 위해 고종횡비의 긴 막대 형태의 일차 입자를 설계하여 미세 균열과 화학적 열화를 방지하는 것이 중요하다. 본 연구는 OpenCV를 활용해 양극재 단면의 전자현미경 이미지를 분석하고 양극재 일차 입자의 배향성과 종횡비를 정량적으로 분석하여, 배터리 소재 연구에서 더 객관적이고 신뢰성 있는 데이터를 제공하고자 한다. -
Gun-Mu Lee;Yun-jae Kwon;Jung-Eun Oh ;Da-hyun Ryu;Jun-Hyuk Jang 409
본 연구는 Capital Market 에서 LLM 기반의 포트폴리오 자산운용 중 ETF, MMF, TD, 자산배분형 상품, 채권형펀드 등 고객에게 제공하는 자산운용 보고서를 자동으로 생성하는 시스템을 개발하고 평가했다. GPT-4, M2M-100, KoBART 모델을 결합해 번역, 요약, 보고서 작성 과정을 자동화했으며, 생성된 보고서와 원문 자산운용 보고서 간 평균 코사인 유사도는 90% 이상을 기록했다. 이 AI 시스템은 기존 방식 대비 효율성을 향상시켰으며, 금융 분야에서의 실용적 가치를 확인하였다. -
본 논문은 기상, 기후, 농업, 환경 등 자연현상을 대상으로 가까운 미래를 예측하는 다양한 모델들의 상호 연계에 필요한 컨테이너 플랫폼 기술을 제시하고자 한다. 컨테이너 기반의 클라우드 플랫폼에서 과학적 예측을 위한 요소 모델들을 마이크로서비스 형태의 컨테이너로 구성하고, 이러한 컨테이너들이 서비스메시 형태로 구성하는 플랫폼 모델을 제시하고 분석하고자 한다.
-
Ae-Eun Son;Hye-Won Ji;Hae-Eun Ahn;Dong-Wan Lee;Bon-gen Gu 414
전동휠체어 등 소형 이동체에서의 자율 주행 기능 구현을 위해 노면 상태에 따른 이동 방향의 의도치 않은 변경을 감소시켜 이동체가 안정적으로 직진하는 방법이 필요하다. 본 논문에서는 ROS에서 제공하는 IMU 센서값을 이용하여 소형 이동체가 안정적으로 직진하는 방법을 제안한다. 본 논문에서 제안한 방법이 ROS 기반 소형 이동체의 직진 안정성 향상에 효과가 있음을 보이기 위해 다양한 노면 환경에서 ROS2 기반 터틀봇3를 직진 이동시키는 실험을 하였다. 실험 결과는 본 논문에서 제안한 방법이 ROS2 기반 소형 이동체의 직진 안정성 향상에 효과가 있음을 보였다. -
Jane Park;Youngseob Lim;Minhee Kang;Injun Kim;Yongju Cho 416
본 연구에서는 YOLOv8 모델을 활용해 다양한 회의 종류를 인식할 수 있는 모바일 애플리케이션을 개발하였다. 완성된 애플리케이션은 사용자가 모둠회 사진을 촬영하면, 학습된 딥러닝 모델이 이미지를 처리하여 해당 회의 종류를 인식한다. 본 논문에서는 애플리케이션의 시스템 설계와 구현 과정, 성능 평가 결과를 제시하며, 사용자가 실시간으로 인식 결과를 확인할 수 있는 기능을 중점적으로 다룬다. -
Seo-Jin Lee;Ji-Woong Choi;Seung-Hyeon Hong;Nam-Jae Kim;Jong-wan Kim 418
본 논문은 도박중독 수준에 따라 중독자를 선별하는 선형회귀 기반의 기계학습 모델을 제안한다. 도박인구는 점차 증가하고, 청소년들도 도박을 경험하며 문제가 심각하다. 도박중독 유병률을 조사하는 것은 향후 발생할 도박으로 인한 문제를 해결하는 것에 도움이 된다. 제안 모델은 한국판 도박 문제 선별척도(K-Canadian Problem Gambling Index) 데이터를 기반으로 학습하였고, 개인의 중독 수준에 따라 도박중독자를 분류한다. 본 모델은 도박중독 수준에 따라 신속하고 정확하게 도박중독자를 구분함으로써 도박중독 치료 연계와 함께 도박중독률을 낮추는 데 기여할 것이다. -
Seung-Hyeon Hong;Ki-Hyuk Kwon;Seo-Jin Lee;Nam Jae Kim;Jongwan Kim 420
본 논문은 기계학습을 활용하여 성인 스마트미디어 중독의 잠재적 위험성을 분류한다. 스마트미디어와 매체는 계속해서 증가하고 발전하고 있다. 스마트미디어 중독에 대한 위기의식은 최근에야 형성되었고 현재 스마트미디어 중독 치료프로그램은 미비한 상황이다. 일반인이 쉽게 센터에 접근할 수 없으며, 센터에 방문해 심리검사를 받더라도 척도 해석과정이 존재한다. 이를 성인 스마트미디어 중독 경향성 예측척도와 기계학습을 활용하여 보완할 수 있다. 본 논문에서 제안하는 모델은 기계학습을 활용해 검사 채점 절차가 간소화되어 시간 비용을 절감할 수 있다. 또한 스마트미디어 사용과 관련된 문제에 대한 보다 효과적인 대응 전략을 마련하는 데 효과적이며, 스마트미디어 중독의 위험을 줄이고, 건강한 사용 습관을 장려하는 데 기여한다. -
본 연구에서는 NIR 근적외선 LED를 활용한 비접촉 무구속 방식의 정맥 검출 카메라를 제작하고 촬영된 영상을 신호처리 알고리즘을 통해서 처리하여 비접촉 방식의 정맥 검출기를 개발하였다.
-
인공지능 기술이 급속도로 발전하고 있음에도 암환자의 방사선 치료 계획시 종양 경계를 임상의가 여전히 수동으로 설정하고 있다. 본 연구에서는 2 차원 및 3 차원 의료영상에서 종양 및 정상 조직을 자동으로 분할하고 시각화 해주는 소프트웨어 도구를 소개하고자 한다. 개발된 소프트웨어는 사용자의 개입을 최소화하고, 분할하고자 하는 관심 영역에 따라 파라미터 설정을 달리할 수 있다. 오픈 소프트웨어 3DSlicer 와 종양의 활성, 괴사, 부종 영역에 대한 분할 정확성을 DSC(Dice similarity coefficient)로 평가했으며, 비슷하거나 더 우수한 결과를 보였다. 특히, 초기 컨투어 설정부터 최종 분할 마스크 획득까지 처리 시간이 약 36.3% 더 빠른 결과를 보였다. 개발된 의료영상 분할 소프트웨어는 종양 및 정상 조직 분할을 용이하게 하여, 인공지능 지도 학습에 필요로 하는 라벨링 작업을 지원할 수 있을 것으로 사료된다.
-
최근 사이버 공격의 지능화와 다양화로 인해 네트워크 보안의 중요성이 더욱 부각되고 있다. 특히, 악성코드를 포함한 악성 패킷은 시스템 감염 및 정보 유출과 같은 심각한 피해를 초래할 수 있으므로 이를 효과적으로 탐지하고 차단할 수 있는 기술 개발이 필수적이다. 기존의 인공지능 기반 침입 탐지 시스템은 다양한 성능 지표(정확도, 정밀도, 재현율 등)의 균형을 맞추기 위해 단일 분류 모델을 기반으로 구축되어 왔다. 본 연구에서는 모든 악성 패킷을 놓치지 않고 탐지하기 위해, 특히 리콜(Recall) 지표를 극대화하는 것을 목표로 하여 오버샘플링 기법을 적용하였다. 이를 통해 기존 시스템의 한계를 보완하고, 모든 사이버 공격에도 효과적으로 대응할 수 있는 새로운 성능 평가 기준의 필요성을 제시하고자 한다.
-
Otsu 알고리즘은 픽셀 값의 분포를 분석해 이미지를 두 개의 클래스로 나누는 최적의 임계값을 산출하는 기법으로, 주로 의료 영상 처리, 산업 자동화 등 다양한 분야에서 객체를 구분 지을 때 활용되고 있다. 이미지마다 적합한 임계값을 계산하는 Otsu 알고리즘을 통해 객체 구분에 널리 활용되는 엣지 검출 가속기의 정확도 또한 향상시킬 수 있다. 그러나 Otsu 알고리즘은 복잡한 연산으로 인해 하드웨어 사용량이 제한된 조건에서 구현하기 위해서는 효율적인 설계가 필요하다. 이에 본 논문에서는 Otsu 알고리즘 연산을 하드웨어에 효율적인 방식으로 구현한 히스토그램 기반 연산을 활용한 엣지 검출 하드웨어 가속기를 제안한다.
-
Sohee Yoon;Seokyoon Kim;Han Kyu Lim;Hyun Seung Son 433
양식장에서 넙치의 감염성 질병으로 인한 폐사율이 높아 넙치의 행동을 모니터링하고 질병을 조기에 진단할 수 있는 기술 개발이 중요해졌다. 이 문제를 해결을 위해, 본 논문에서는 딥러닝 기반의 DeepLabCut 모델을 활용하여 넙치의 위치를 추적을 실험한다. 실험 결과, 학습된 모델은 3마리의 넙치가 포함된 제한된 환경에서 안정적인 추적 성능을 보였으나, 다수의 넙치가 있는 복잡한 환경에서는 위치 추적 성능이 저하되었다. 특히, 움직이는 넙치보다는 정지된 넙치의 위치를 더 잘 인식하는 경향이 있었고, 위치를 잘못 인식하거나 추적이 중단되는 문제도 발생하였다. DeepLabCut는 제한된 환경에서 효과적이나 실제 양식 환경에서 다수의 넙치를 정확하게 추적하기 위해서는 모델의 성능 향상과 더 다양한 데이터 확보가 필요하다. -
Jaehwa Yun;Hye Won Yun;Yeong Jin Kim;Jang Hoo Lee;Guen Jin Ahn;Sungbum Park;Byung Seong Bae 435
반도체 장비는 여러 가지 요인(화재, 부품 고장 및 노후화 등)에 의해 가동이 중지되거나 더 이상 운용할 수 없는 경우가 자주 발생한다. 반도체 생산 중 장비의 고장은 전체 제조공정을 중단시켜 기업의 생산 원가 비율을 상승시키는 원인이 된다. 이를 해결하기 위해 장비에 온도, 진동, 전력 센서를 부착하고, 각각의 센서에서 실시간으로 수집되는 데이터를 Auto-Encoder 모델로 분석하여 반도체 장비의 고장의 사전 예측 정확도를 향상시켰다. -
본 논문은 비순환 방향 그래프(directed acyclic graph) 로 파이썬 함수들을 호출하는 방법을 다룬다. 이전에 개발하였던 함수 실행 스케줄러에서 동일 함수 별칭으로 다시 호출하면 발생하는 순환 참조 문제를 해결하기 위한 추가적인 연구 개발을 진행한다. 함수를 실행하는 순서를 사전에 파악하여 순환을 탐지하도록 파이썬 3.9 버전부터 지원하는 비순환 방향 그래프 기반 위상정렬 패키지로 각 그래프 정점에 함수를 할당하여 그래프가 하나의 시나리오로 동작할 수 있도록 한다.
-
Youngsun Heo;Eunjin Park;Siyoon Park;Min Gyo Chung 441
본 연구는 신경망 모델을 사용하여 얼굴형을 분류한 후, 미디어파이프를 활용한 사용자의 손치수 측정에 근거해 골격 유형 분석을 통해 맞춤형 스타일을 추천하는 애플리케이션을 개발한다. 이를 통해 기존 진단 방식의 시간과 비용 문제를 해결하고, 개인의 신체 특징에 맞는 객관적 스타일링 서비스 제공을 목표로 한다. -
Ye Eun Soh;Nam Eui Oh;Jeonghee Han;Min Gyo Chung 443
ClothesMe 는 시각장애인을 위한 인공지능 기반 의류 도우미 서비스이다. VGG16, MobileNetV2의 Pre-training 모델을 의류 데이터 셋으로 전이학습 시킨 두 개의 의류 종류 및 패턴 분류 신경망 모델과 색상 추출 라이브러리로 의류 이미지를 인식한 후 의류 종류 및 패턴 그리고 색상을 음성으로 안내한다. -
인공지능과 자연어 처리 기술 발전으로 ChatGPT는 프로그래밍 분야에서도 활용될 수 있다. ChatGPT로 생성한 문제를 학습 도구로 사용하기 위해 테스트 케이스의 정확성을 검증하는 것은 필수적이다. 본 연구는 ChatGPT를 통해 프로그래밍 문제, 정답 코드, 테스트 케이스를 생성하고 이들의 정확성을 평가하고자 한다. 생성된 테스트 케이스의 정확성을 높이기 위해, 본 연구에서는 5번의 반복적인 테스트 케이스 생성 및 검증 과정을 거쳐 최종적으로 87.8%의 정확성을 달성했다. 이는 ChatGPT를 통한 프로그래밍 학습의 신뢰도를 높일 수 있음을 보여준다.
-
궤도상 서비싱(On-Orbit Servicing)이란, 우주 공간의 궤도에서 비행하는 인공 물체를 대상으로 상태를 점검 및 수리하거나 궤도 수정 또는 궤도 내 자세 유지, 연료 재급유, 부품 교체, 우주 쓰레기 제거 등을 제공하는 서비스이다. 이는 위성 수명 연장 및 재사용성 증대를 통한 인적, 시간적 비용절감 결과를 가져온다. 이러한 임무를 수행하기 위해서는 대상이 되는 객체를 안전하게 고정하고 유지하는 캡처 및 도킹 과정이 필요하며 데이터는 실시간 모니터링으로 감지한다. 이때, GNC(유도, 항법, 제어) 시스템의 프레임워크는 항공우주 분야에서 우주 비행체가 임무를 수행할 때 필수적인 기능을 통합하고 관리하며 수행하는 구조적 틀을 제공한다. 센서, 알고리즘, 제어기, 항법 장치 등 연관된 하드웨어와 소프트웨어가 유기적으로 작동하도록 구성되어 있으며 비행체가 목표를 정확히 수행하도록 돕는 핵심적인 역할을 한다. 본 논문에서는 기존 궤도상 서비싱의 해외 연구 현황을 파악하여 임무 사례를 통한 GNC 시스템 프레임워크의 분석을 토대로 추후 국내 궤도상 서비싱 GNC 서브시스템 프레임워크 설계 시 적용 방안에는 어떤 것이 있을지에 대하여 연구한 내용을 서술하고자 한다.
-
마이크로서비스 아키텍처는 마이크로서비스 간 약결합을 통한 높은 확장성과, 개별 배포를 통한 유지보수성을 제공하는 애플리케이션 구축 방법이다. 그러나, 마이크로서비스 아키텍처는 표준적인 배치방식이나 연결 방법이 부족하여, 마이크로서비스 아키텍처의 전문적인 지식 없이 마이크로서비스 단위를 구분하고 약결합 구조를 배치하기에는 어려움이 있다. 따라서, 본 논문에서는 마이크로서비스 아키텍처의 BCE 패턴 기반 배치 방안으로 마이크로서비스의 기능 및 약결합 구조를 생성형 AI로 학습하는 방법을 제시한다. 제안하는 방법에 따라 생성형 AI 모델인 GPT-3.5-turbo를 바탕으로 파인튜닝 한 결과 파인튜닝 모델을 활용한 배치 정답률이 14% 향상되는 것을 확인하였다. 또한, 파인튜닝 학습 요소의 반영률을 조절하여 모델의 비교 평가를 수행한 결과로 f1-score가 0.019 증가한 것을 통해 파인튜닝 요소가 정답을 결정하는 데 필요한 요소임을 확인하였다.
-
Current State & Improvement of Temporary Operation Permit System based on data for Automated VehicleHak-Sun Kim;Kyong-chan Min;Min-Seok Kim;Jae-Young Kim;Si-Woo Kim 456
시험·연구목적의 자율주행자동차의 일반도로 주행을 위한 임시운행 허가제도는 2016년 최초 시행되었다. 시행 이후 허가 대수는 매년 급증하고 다양한 형태의 자율주행자동차 약 460여대가 전국에서 시험운행 중에 있다. 따라서, 자율주행자동차의 임시운행허가제도는 민간기술개발을 지원하기 위한 제도로는 정착이 되었다고 본다. 본 논문에서는 임시운행 허가 차량의 데이터기반의 현황과 이러한 임시운행 허가 차량의 정보처리에 대한 부분을 연구하고자 한다. 자율주행차의 운행 활성화를 위한 다양한 제도 중 임시운행허가 기간 도래로 인한 해결방안, 무인 자율주행차의 운행 요구 등 환경변화에 적합한 제도적인 개선 방향을 고찰하고자 한다. -
In pediatric healthcare, early detection of cardiovascular diseases in newborns is crucial. Analyzing heart sounds using stethoscopes can be subjective and reliant on physician expertise, potentially leading to delayed diagnosis. There is a need for a simple method that can help even inexperienced doctors detect heart abnormalities without an electrocardiogram or ultrasound. Automated heart sound diagnosis systems can aid clinicians by providing accurate and early detection of abnormal heartbeats. To address this, we developed an intelligent deep-learning model incorporating CNN and LSTM to detect heart abnormalities based on artificial intelligence using heart sound data from stethoscope recordings. Our research achieved a high accuracy rate of 97.8%. Using audio data to introduce advanced models for cardiac abnormalities in children is essential for enhancing early detection and intervention in pediatric cardiovascular healthcare.
-
최근 Digital Twin 과 Cyber-Physical-System 을 융합하여 시스템을 설계·예측·분석·최적화하기 위한 노력이 증가하고 있다. Unmanned Ground Vehicle 은 이런 방법론이 적용 중인 대표 예시이다. 본 논문에서는 Digital Twin 과 Cyber-Physical-System 을 융합하고 유지보수와 관리, 데이터 수집이 쉬운 시스템 설계 구조 Control-Infra-Product(CIP)을 제안한다. 시스템 계층을 사용자 관점에 따라 정의하며, 유저, 서비스 제공자, 제품(Physical, Virtual) 총 3 개로 분리된다. 각 관점은 Control Layer, Infra Layer, Product Layer 로 정의한다. 시스템의 사용 주체로 서버에 제어 명령 전달 및 전체적인 관제와 시각화를 담당하는 Control Layer 로 정의한다. Product Layer 는 Product 들을 묶어 정의되며, Product 는 현실과 가상에서 mirroring 이 될 두 개체 (Camera, Lidar, Car 등)를 하나의 쌍을 지칭한다. Infra Layer는 서비스를 관리하는 주체로, 양단에서 Physical 과 Virtual 을 엮고 유저의 제어를 Product 까지 전달 및 전처리의 책임을 진다. 본 논문에서는 CIP 개념 구조의 적용과 Kubernetes 오케스트레이션을 활용한 시스템 구현을 통해 시스템 확장에 유연한 구조와 유지보수에 유용한 indoor 자율 주행 시스템을 개발하였다.
-
RSE (Road Side Equipments) 데이터를 활용하여 파편적으로 차량들의 경로를 유추해볼 수 있다. 이 데이터는 대략적인 경로를 파악할 수 있지만 전체적인 이동 경로를 정확히 추적하는 데에는 한계가 있다. 따라서 본 연구에서는 RSE 데이터를 시간을 기준으로 연결하여 각 차량의 이동경로를 보다 사실적으로 생성하고, 이렇게 생성한 경로 데이터 이용하여 차량이 출발한 지점과 도착한 지점을 추정하는 방법을 제안한다. 이를 통해 얻은 O/D(Origin/Destination) 정보는 도시 교통 흐름 분석 등 다양한 응용에 활용할 수 있다.
-
본 논문에서는 다차원 혈당지표를 역전된 정점 스카이라인 질의(Inverted Pinnacle Skyline Query)에 적용하여 당뇨병 전증(前症)에 해당하는 환자 중 당뇨병 수치에 가장 근접한 환자를 식별하는 기법을 제안한다. 당뇨병 전증을 겪는 환자는 수치에 따른 적절한 조치가 취해지지 않으면 당뇨병으로 진행될 가능성이 높아진다. 환자의 치료에서 의료자원의 한정성과 환자의 위험도에 따른 우선순위 분류는 중요한 고려 요소이다. IPS 기법은 기존 Skyline 알고리즘의 지배관계를 반대로 정의하여, 당뇨병 전증 환자 중 가장 높은 수치를 지닌 즉, 당뇨병으로 진행될 가능성이 가장 높은 고위험군 데이터들을 식별을 목표로 한다. IPS 는 우선적 치료가 필요한 고위험군 환자들에게 당뇨병 수치 관리를 위한 조기개입을 가능하게 하며, 당뇨병 예방에 기여할 수 있을 것이다.
-
본 연구는 유튜브 Shorts 시장에서 특정 Shorts 영상이 급격히 인기를 얻는 반면 유사한 주제의 영상이 관심을 받지 못하는 현상을 문제로 제시한다. 이에 인기 급상승 Shorts 의 주요 요소를 분석하여 성공 요인을 파악하고, 제작자들이 트렌드를 효과적으로 반영할 수 있는 가이드라인을 제공하고자 한다. 유튜브 API 를 통해 영상 제목, 조회수, 좋아요 수, 썸네일 이미지 등의 데이터를 수집하고 텍스트 네트워크 및 감정 분석을 통해 영상 제목과 썸네일 속 요소가 인기와의 연관성을 조사하였다. 이를 바탕으로 제작자들이 활용할 수 있는 웹사이트를 제작하였다.
-
Hyeon-Ji Park;Ji-Young Jeong;Hyun-Soo Park;Yewon Yoo;Jehyeok Rew 473
사회에서 발생하는 범죄는 다양한 원인이 복합적으로 연관되어 발생하기 때문에, 유형별 범죄에 중요영향을 주는 요인을 파악하는 것이 시급하다. 본 연구는 대학 자취촌 지역에서 집중적으로 발생하는 범죄 유형을 대상으로 하여, 범죄에 영향을 줄 수 있는 환경요인을 선별하고, 공간더빈모형을 활용하여 주요 발생 요인을 분석했다. 대표적 대학가를 포함하는 강북구, 도봉구, 관악구를 50x50m2 공간 그리드로 분할하고, 범죄, 폭력, 절도 등에 영향을 줄 수 있는 41개의 환경 변수를 다양한 공간통계모형들을 활용하여 상세 분석했다. 이 중, 공간 더빈 모형이 가장 효과적인 통계적 설명력을 가지는 것을 다양한 비교 실험을 통해 검증했으며, 범죄 주요 요인들에 대한 분석적 고찰을 수행했다. -
온라인 쇼핑의 증가로 인해 상품평(리뷰)의 중요성이 높아지고 있다. 본 연구에서는 리뷰 데이터를 수집하고 이를 분석하여 상품의 판매 전략 개선 모델을 개발하였다. 이를 위해 웹 크롤링과 OCR 기술을 활용하여 댓글을 텍스트로 변환하고, Chat GPT 4o model를 사용해 댓글을 분석하였다. 모델을 통해 얻은 결과 데이터는 상품의 품질, 가격, 배송 등의 측면에서 주요한 피드백 요소들을 도출하는데 사용되었다. 본 연구는 IT 기술과 심리학적 요소를 결합하여 소비자 행동을 분석하는 새로운 접근 방식을 제시하며, 이를 통해 보다 효과적인 마케팅 전략을 수립할 수 있음을 보여준다.
-
본 논문에서는 다양한 심전도 패치 장치에서 발생하는 데이터 스트림을 수집하고 이를 FHIR의 표준 포맷으로 변환하여 의료 클라우드에 업로드하는 과정을 구현한다. FHIR 자원으로 변환하는 과정에서 클라우드에서 요구하는 기본 필드를 정확히 채워 무결성을 유지하며 각각의 Observation 자원에 스트림 데이터를 포함시켜 Bundle로 생성한다. 이후 Cloud shell에서 CURL 명령을 수행시켜 수백 개의 심전도 스트림 자원이 JSON으로 표준화된 포맷으로 클라우드에 고속으로 저장된다.
-
문서의 내용을 쉽게 이해하기 위해서는 문서의 핵심 단어, 또는 핵심 문장을 빠르게 파악하는 것이 중요하다. 또한 유사한 문서를 참고하여 같이 읽는다면 해당 문서 내용을 파악하는 시간을 단축시켜주거나 해당 문서에 대한 이해도를 증가시킬 수 있다. 이를 위해서 wordcloud, textrank, Doc2Vec, softmax regression, cosine similarity과 같은 기법을 활용한다. 최종적으로 어떠한 문서를 입력받으면 문서의 명사를 기반으로 한 워드클라우드 시각화 및 핵심 문장 추출, 같은 카테고리를 가지는 유사한 문서를 추천해 주는 연구를 수행하였다.
-
Je-Won Seo;Yong-Sok Ji;Mi-Gyoung Jung;Ju-Han Kim;Kyung-Baek Kim 482
본 연구는 의료 연구에서 다양한 형태의 멀티모달 데이터를 통합적으로 관리하고 분석할 수 있는 통합 데이터 플랫폼을 구현하는 것을 목표로 한다. 이 플랫폼은 정형 데이터와 비정형 데이터를 일원화하여 연구자들이 쉽고 빠르게 접근할 수 있도록 설계되었으며, 데이터의 효율적 수집, 처리, 저장, 분석을 지원한다. 또한, 정형 데이터와 비정형 데이터 간 통합 검색 기능, 질환별 데이터 추출, 비식별화 기능 등을 구현하여 연구자들이 안전하고 신뢰성 있는 환경에서 데이터를 활용할 수 있도록 하였다. 이 플랫폼은 기존의 CDW 시스템의 한계를 극복하며, 의학 연구의 다양한 요구를 충족시킬 것으로 기대한다. -
본 연구는 병원, 종합병원 등 유형에 따른 의료장비 수요를 분석하고 최적화하는 시스템 개발을 목표로 함. 병원 유형별 장비 재고를 분석하여 수요를 예측하고, 유지보수 일정 및 장비 교체주기를 추천하는 기능을 포함함. 예비 연구 결과, 이 시스템은 중복 장비 구매를 줄이고 자원 할당을 최적화하여 비용 절감 효과를 보였으며, 예측 유지보수를 통해 가동 시간 증가와 고장 감소 등 병원 운영 효율성을 향상시키는 것으로 나타남. 이 시스템을 구현함으로써 병원은 의료 장비의 더 나은 계획 및 관리를 통해 효율성을 향상시킬 수 있음.
-
최근 정부는 비만의 위험성을 인지해 비만을 질병으로 규정하고 있지만, 단독 질병코드로는 진료 및 급여 수급이 어려운 실정이다. 이에 본 연구는 '건강보험심사평가원_시군구별 비만 진료 통계' 데이터를 분석한 후, 소아·청소년 비만율과 비교하여 상관관계를 조사해 통계자료를 근거로 비만 진료의 현황을 파악해보았다. 이는 향후 소아·청소년 비만 지원 방안 개선과 정책적 방향을 위한 근거자료로 활용될 수 있다. 본 논문은 공공 데이터를 활용해 소아·청소년 비만과 치료 현황을 분석하며, 소아·청소년 비만 관련 효과적인 개입 전략 개발을 목표로 한다.
-
Sungsik Park;yong ui kim;Dongyi Song;Jaeho Lee;ji am park;Minji Son;Byung Jin Song 490
본 연구는 스트레스는 현대사회에서 중요한 건강 문제로 대두되고 있으며, 이는 개인의 정신적, 신체적 건강에 심각한 영향을 미칠 수 있습니다. 본 논문에서는 스트레스와 우울의 상관관계를 분석한 후, 질병관리청의 '2023 지역건강통계 한눈에 보기'와 HIRA 빅데이터 개방포털의 '지역별 정신질환_우울증 진료현황(2019~2023 년)' 데이터를 비교·분석하여 스트레스를 줄일 수 있는 연구를 제안하고자 합니다. 이 연구의 목적은 스트레스가 증가함에 따라 사람들의 심리, 신체 건강에 영향을 미치며 더 나아가 우울증의 주요 원인이 될 수 있음을 인지하고 지역별 스트레스 및 우울감 인지율과 실제 우울증 진료 통계를 비교·분석하는 데 목적이 있습니다. 이를 바탕으로 스트레스 관리의 중요성을 제시하며, 여러가지 해결책을 통해 사람들 간 소통을 촉진하고 스트레스를 완화할 방법을 제안하고자 합니다. 특히, 우리나라의 통계와 지표를 활용해 스트레스 및 우울감이 높은 지역을 선정하고, 그에 따른 해결 방안을 마련하는 것이 목표입니다. -
빅데이터 시대가 오면서 정형화된 데이터뿐만 아니라 비정형 데이터들도 즐비하게 되었다. 데이터의 많은 비율을 비정형 데이터가 차지하게 됨으로써 관계형 데이터베이스로는 여러 이유로 인해 한계에 봉착하게 되었고 NoSQL 계열의 데이터베이스를 채택하기 시작했다. 본 연구에서는 그래프 데이터베이스는 노드와 관계를 이용하여 데이터를 조회하고 분석한다. 관계형 DB 인 MySQL 과 그래프 DB 인 Neo4j 를 사용하여 CRUD 및 분석 성능을 비교한다.
-
건강과 웰빙에 대한 관심이 현대사회에서 높게 대두됨에 따라, 피트니스 시설을 이용하는 소비자수는 꾸준히 증가하고 있다. 피트니스 시설에서 체감하는 서비스 경험은 단순한 물리적 공간으로서 뿐만 아니라, 환경적 요소 등 다양한 요소들이 작동하고 있다. 이에 이런 세부 요소들을 KANO 모형과, Timko 의 고객만족개수를 활용해 분석하여, 관리의 효율성은 물론 한정된 제원으로 높은 고객 만족도를 이끌어 내기 위한 전략 수립에 도움이 되고자 한다.
-
아파트 커뮤니티 시설은 지속적인 발전과 더불어 입주민들의 건강, 교육, 여가활동을 지원하는 중요한 공간으로서 자리매김 되고 있다. 이에 따라 커뮤니티 시설을 관리하는 커뮤니티 시설 관리자의 역할 또한 중요해지고 있으며, 커뮤니티는 단순한 공간 제공을 넘어서, 관리의 질과 운영 효율성에 따라 입주민의 만족도에 직접적인 영향을 미치고 있다. 이에 본 연구는 델파이 기법을 활용하여 커뮤니티 시설 관리자의 직무와 역량을 명확히 규명하고, 이를 기반으로 체계적인 관리 방안을 제시하고자 한다.
-
본 논문은 스파이킹 신경회로망(Spiking Neural Networks)에서 BP(Back Propagation)학습알고리즘에 대한 일반화 형태인 기존의 구간연산 학습알고리즘을 개선하여 스파이킹 뉴론(Spiking Neuron)들의 반응영역 범위를 학습 진행에 따라 조절이 가능한 단계적 구간학습 방안을 제안한다.또한, 간단한 컴퓨터 시뮬레이션을 통하여 쿨롱에너지 포텐셜(Coulomb Energy Potential)을 가지는 스파이킹 신경회 로망에서 범위(Lower bound & Upper bound)의 값을 가지는 구간데이터(Interval data)와 하나의 값을 가지는 포인트데이터(Point data)가 혼재된 학습데이터에서의 제안한 학습방안의 타당성과 전문가시스템(expert system)에서의"don't care attributes"적용가능성을 보인다.
-
Gayun Suh;Su-Yeon Park;Hyeong-Hwan Shin;Jun-Su Cho;Sei Kang;Jae-Joon Jeong;Bo-Gyeong Seo;Seung-Won Kim 505
본 연구는 음악 가사와 배경 이미지를 매칭하는 시스템을 개발하는 데 초점을 맞추고 있다. GPT-4o를 활용하여 배경 이미지에 어울리는 음악 가사를 생성해 데이터셋을 구축하였으며, Long-CLIP 모델을 미세 조정하여 음악 가사와 배경 이미지의 임베딩 벡터를 비교함으로써 가장 적합한 배경 이미지를 추천하는 시스템을 구현하였다. -
Dhivyaa S P;Hyung-Jeong Yang;Sae-Ryung Kang;Soo-Hyung Kim 507
Alzheimer's Disease (AD) is a neurodegenerative disorder characterized by a progressive decline in cognitive function. Accurate and early diagnosis of AD is crucial for effective management and treatment. Traditional machine learning models, though commonly applied, often fall short in capturing the intricate relationships between diverse tabular data. Furthermore, the missing data issue, typically addressed using conventional imputation techniques, leads to reduced accuracy and generalizability of AD classification models. This paper introduces ADxClass, a novel deep learning framework that enhances AD classification by leveraging multi-domain attention fusion and data type-based imputation techniques for handling missing heterogeneous tabular data. ADxClass integrates data from various domains, including demographic, cognitive, genetic, and biomarkers obtained from neuroimaging measurements, to improve the robustness and accuracy of AD classification models. The model's efficiency is validated via a 5-fold cross-validation on the Alzheimer's Disease Neuroimaging Initiative (ADNI) dataset, showing significant improvements in classification performance compared to traditional machine learning approaches. -
Anjitha Divakaran;Hyung-Jeong Yang;Seung-won Kim;Ji-eun Shin;Soo-Hyung Kim 511
Empathy plays a crucial role in effective mental health support, particularly on text-based platforms where individuals seek understanding and compassion. Building on previous work that predicted empathy in separate models, we propose a multi-task learning approach that jointly models three empathy communication mechanisms: emotional reactions, interpretations, and explorations. By integrating RoBERTa with GRU layers, our model improves the accuracy and efficiency of empathy detection. Additionally, we address class imbalance by incorporating focal loss, which helps the model focus on underrepresented strong empathy signals. Our experiments show that the multi-task model, combined with focal loss, significantly improves performance across all empathy dimensions, making it a promising tool for enhancing real-time empathy feedback in online mental health support systems. -
So-Young Lee;Min-Gyeong Kim;Seung-Jae Yoo;Oh-Yeong Lee;Kyoeng-Jeong Choi;Woo-Sin Lee 515
본 연구에서는 복잡하고 방대하여 분석과 요약에 많은 시간이 소요되는 전장 상황의 시계열 로그 수치 데이터를 효율적으로 분석하는 방법론을 제시한다. 생성형 AI 인 ChatGPT API 를 사용해 데이터를 전처리 및 분석하는 모듈을 포함한 웹 애플리케이션 형태을 구현한다. 주요 기능은 데이터 업로드, 전처리, 분석, 분석 로그 조회 등으로, 이를 통해 사용자가 전장 데이터를 효율적으로 분석하고 유의미한 결과를 도출할 수 있도록 지원한다. -
본 논문에서는 오픈소스(Open Source) LLM(Large Language Model)인 Llama3을 이용하여 음성으로 동작하는 맞춤형 로컬 챗봇을 구현하고자 한다 이를 위해 PEFT(Parameter Efficient Fine-Tuning) 방식과 RAG(Retrival Augmented Generation) 방식을 혼합하는 하이브리드 방식을 사용해 Llama3을 파인 튜닝하고, Ollama을 이용하여 로컬 컴퓨터에서 동작하는 챗봇을 구현하였다. 챗봇의 배포를 위해 서버 부분은 LangServe와 Ngrok을 사용하였고 클라이언트 부분은 모바일 환경에서 원활히 동작하는지 확인하기 위해 교육용 임베디드 시스템인 Raspberry Pi 5를 사용하여 구현하였다. 또한 사용자의 편의성을 위해 음성인식 기능을 추가하였다. 또한 구현한 챗봇에 성능평가를 진행하였다. 성능 측정 방식은 정확도를 사용하였고, 데이터 셋은 총 18개로 각 쿼리마다 5번씩 총 90개의쿼리로 성능 평가를 진행하였다. 성능 평가 결과 하이브리드 방식이 가장 우수한 성능을 보여주었다.
-
본 논문은 오픈소스 LLM(Large Language Model)인 Llama3를 기반으로 음성 인터페이스를 갖춘 맞춤형 로컬 챗봇 시스템을 개발하였다. 이 시스템은 PEFT(Parameter Efficient Fine-Tuning)와 AutoRAG(Auto Retrieval-Augmented Generation)로 최적화된 RAG(Retrieval-Augmented Generation) 방식을 결합한 하이브리드 접근법을 통해 Llama3를 전이학습 하였다. Ollama를 사용하여 로컬 환경에서 챗봇을 구현하였으며, LangServe와 Ngrok을 활용해 배포하였다. Raspberry Pi 5에 구현하여 모바일 환경으로 동작 가능하게 하였고 음성인식 기능을 추가하여 사용자 편의성을 높였다. 연구한 모델의 성능 평가는 총 18 종류의 데이터셋에 대해 각 질문당 5회씩, 총 90회의 질문으로 정확도를 측정하였다. 실험결과, PEFT 학습 모델과 Advanced RAG를 결합한 시스템이 가장 우수한 성능을 나타냈다.
-
대규모 언어 모델(LLM)은 많은 영역에서 우수한 성능을 발휘한다. 하지만 오래된 지식, 환각, 불투명한 추론 프로세스 등의 문제가 존재한다. 이러한 문제의 해결책으로 외부 데이터베이스의 지식을 통합하는 Retrieval-Augmented Generation(RAG)시스템이 떠오르고 있다. 그러나 RAG 시스템을 구현하기 위한 파이프라인의 구성은 복잡하며 각 시나리오에 대한 실험과 평가는 시간이 걸리고 번거롭다. 이 논문에서는 일련의 실험과 평가를 한 번에 실험하고 각 단계별 평가 점수를 측정할 수 있는 AutoRAG라는 프레임워크를 사용하여 금융 문서에 가장 최적화된 RAG 파이프라인을 탐색하여, Naive RAG와 Advanced RAG 시스템을 비교하였다. 두 경우 모두 F1점수, NDCG점수, mAP점수를 사용하여 평가하였다. 최종 성능지표의 결과로 Advanced RAG 시스템이 F1, NDCG, mAP에서 각각 0.062, 0.168, 0.106 만큼 우수한 것으로 나타났다.
-
Van-Thien Phan;Hyung-Jeong Yang;Seung-Won Kim;Ji-Eun Shin;Soo-Hyung Kim 523
Recent progress in audio-driven talking face generation has focused on achieving more realistic and emotionally expressive lip movements, enhancing the quality of virtual avatars and animated characters for applications in entertainment, education, healthcare, and more. Despite these advances, challenges remain in creating natural and emotionally nuanced lip synchronization efficiently and accurately. To address these issues, we introduce a novel method for audio-driven lip-sync that offers precise control over emotional expressions, outperforming current techniques. Our method utilizes Conditional Deep Variational Autoencoder to produce lifelike lip movements that align seamlessly with audio inputs while dynamically adjusting for various emotional states. Experimental results highlight the advantages of our approach, showing significant improvements in emotional accuracy and the overall quality of the generated facial animations, video sequences on the Crema-D dataset [1]. -
부정맥은 심각한 합병증을 초래할 수 있는 심장 질환으로, 조기 진단이 중요하다. 본 연구는 부정맥 진단의 자동화를 위해 Wavelet 변환과 합성곱 신경망(CNN)을 결합한 새로운 접근 방법을 제안한다. MIT-BIH Arrhythmia Database 와 P-Wave Annotations 를 사용하여 ECG 신호에서 QRS complex 와 P-wave 를 동시에 검출하는 전처리 방법을 개발하였다. Wavelet 변환 기반 전처리와 다양한 ECG 특징 추출 기법 결합한 1 차원 CNN 모델을 적용한 결과, 93%의 전체 정확도와 평균 0.9906 의 AUC 점수를 달성하였으며, 특히 심실 부정맥에 대해 96.8%의 높은 재현율을 보였다. 이는 현재 임상에서 사용되는 많은 자동화된 ECG 분석 시스템들의 miss reading 확률(10-15%)보다 낮은 7%의 miss reading 확률을 나타낸다. 본 연구는 ECG 데이터의 효율적인 해석과 부정맥의 조기 진단 가능성을 입증하였으며, 임상 현장에서의 적용 가능성을 제시한다. 향후 연구에서는 다양한 데이터셋 검증과 실시간 처리 능력 평가를 통해 실제 임상 환경에서의 적용성을 높일 계획이다.
-
최근 불법적인 정보 탈취을 목적으로 드론의 사용이 증가하고 있으며, 이를 대응하기 위해 다양한 기술적 해결책이 개발되고 있다. 특히, 드론의 정확한 자세 추정이 필요하지만, 드론의 자유로운 움직임과 회전 때문에 기술적 구현이 어렵다. 따라서 본 논문은 트랜스포머의 인코더 구조를 사용한 키포인트 추출 방법을 제안해 기존 문제를 해결한다. 이 방법은 로컬과 글로벌 특징을 결합하는 게이트 메커니즘을 도입하여, 다양한 각도에서도 일관된 키포인트 추정을 가능하게 하고, 드론의 움직임과 상태를 보다 정확하게 분석할 수 있다. 논문은 드론 2차원 키포인트 데이터셋을 제공하고, End-to-end 방법론을 제안하여 드론의 키포인트를 정확히 추정하며, 이를 통해 불법 드론 활동을 실시간으로 탐지하고 대응할 수 있는 기술적 기반을 마련한다.
-
운전지원은 원자력 분야에서 인공지능 기술의 현장 적용 가능성이 가장 높은 기능 중에 하나이다. 원전 시설을 감시, 비정상 탐지, 사고 예측, 조치 지원과 같은 다양한 세부 기능에서 인공지능기술을 적용하기 위한 연구가 수행되고 있다. 원전은 안전상의 이유로 규제기관의 신뢰성 검토를 통한 허가를 받은 기능만 현장에서 운용 가능하다. 그러나, 인공지능 기술은 전통적인 소프트웨어와는 다른 특성들 때문에 기존 방식으로는 신뢰성을 평가하기 어렵고 이것은 현장 적용을 더디게 하는 요소가 된다. 이 논문은 국내외 문헌조사를 통해 원전분야에서 인공지능 모델의 신뢰성을 평가하기 위한 항목들을 검증 요건으로 제안한다. 이러한 검증 요건에 대한 정성적, 정량적 평가는 원전 인공지능 모델의 신뢰성을 평가하는데 도움이 될 것으로 기대된다.
-
뉴스 내용과 증시의 상관관계에 대해서는 다양한 연구가 활발히 진행되었다. 이러한 연구들은 뉴스 제목에 담긴 정보와 증시 변동 사이의 관계를 분석하여 유의미한 결과를 도출하였다. 그에 반해, 직접적으로 드러나는 대중의 반응과 증시의 상관관계에 대해서는 상대적으로 연구가 부족한 실정이다. 본 연구에서는 여러 시간 단위에서 대중들의 반응을 온라인 커뮤니티에서 추출하고, 감정 분석을 통해 수치화 하여 분석한다. 이렇게 수치화 된 감정 데이터가 가상화폐 변동성과 관련이 있는지에 대해 시간 단위 별 상관관계 분석을 통해 알아보고자 한다. 이를 통해 대중의 반응이 가상화폐 시장에 미치는 영향을 실증적으로 분석하고, 가상화폐 시장에 대한 이해도를 높이는 데 기여할 수 있을 것으로 기대한다.
-
Obstructive sleep apnea (OSA) is a common sleep disorder, causing disrupted sleep and reduced oxygen levels in the blood. Full-night polysomnography (PSG) and home sleep apnea tests (HSAT) may offer acceptable diagnosis results but have shown some limitations. In recent years, deep learning and data analysis methods are progressively employed on electronic health records, and various methods have been developed for OSA event detection. Self-supervised learning has shown some advantages over supervised training methods, by learning more generalized feature representation of data. Unlike text or image processing, the high information density in multivariate time-series data makes it more challenging to utilize self-supervised learning. In this research, based on the characteristics of sleep dataset, we propose a self-supervised approach with Masked Autoencoder, which masks portions of the input and attempting to reconstruct them. This enables the model to learn more generalized features from unlabeled data. We evaluate our proposed framework with three independent sleep datasets, which have shown significant improvement compared to supervised learning models.
-
컴퓨터 비전 및 영상 처리 분야에서 정확하고 신뢰할 수 있는 분할을 달성하는 것은 중요하다. 특히 의료 분야에서는 분할의 부정확성이 부적절한 특징의 추출과 분류를 야기한다. 이 논문에서는 이중 어텐션 메커니즘을 U-Net 아키텍처에 통합하여 이진 영상 분할을 개선하는 방법을 제안한다. 인코더와 디코더 사이의 중요 접합점에 위치 및 채널 어텐션 모듈을 배치하여 기능 표현을 향상시켜, 벤치마크 실험에서 기존 방법보다 우수한 성능을 확인하였다. 접근 방식은 의료 영상에서의 이진 분할 작업에 대한 잠재력을 보여주며, 자동 분할을 통해 의료 전문가의 효율성을 높일 수 있다.
-
Kim Ngan Phan;Hyung-Jeong Yang;Jieun Shin;Seungwon Kim;Soo-Hyung Kim 545
Empathetic response generation is a challenging concern in the field of natural language processing. Recent studies are trying to generate empathic responses to humans in dialogues. The published EmpatheticDialogues dataset is a solid foundation for the task of generating empathic responses. Many researchers have experimented with the EmpatheticDialogues dataset, which has many potential variations of transformer architectures. In this paper, we survey several previous approaches to the task of generating empathic responses with the aim of indicating the potential of future deep-learning models. -
Ngumimi Karen Iyortsuun;Soonja Yeom;Soo-Hyung Kim;Aera Kim 549
Mental health conditions such as Major Depressive Disorder (MDD) undoubtedly pose severe life-threatening effects if not properly diagnosed and treated promptly. In this paper, we aim to differentiate depressed patients from healthy controls by determining the level of co-functionality relationships between brain regions using the Multi-modal Open Dataset for Mental Disorder Analysis (MODMA) 128-channel resting-state Electroencephalography (EEG) data. By proposing a method that adopts the combination of Phase Locking Value (PLV) functional connectivity analysis with a Contrastive Siamese Network model, we extract PLV-based features and employ the proposed Contrastive Siamese Network to learn discriminative features from the PLV matrices. Our proposed approach achieved an accuracy of 0.88, surpassing prior research works on the same dataset. The results suggest that PLV can serve as a reliable biomarker for depression detection, effectively distinguishing between both classes and leading to robust classification outcomes. -
Son Thanh-Hoang Vo;Quang-Vinh Nguyen;Hyung-Jeong Yang;Jieun Shin;Seungwon Kim;Soo-Huyng Kim 553
Talking Head Generation is a highly practical task that is closely tied to current technology and has a wide range of applications in everyday life. This technology will be of great help in the fields of photography, online conversation as well as in education and medicine. In this paper, the authors proposed a novel approach for Individual Audio-Driven Talking Head Generation by leveraging a sequence of landmarks and employing a diffusion model for image reconstruction. Building upon previous landmark-based methods and advancements in generative models, the authors introduce an optimized noise addition technique designed to enhance the model's ability to learn temporal information from input data. The proposed method outperforms recent approaches in metrics such as Landmark Distance (LD) and Structural Similarity Index Measure (SSIM), demonstrating the effectiveness of the diffusion model in this domain. However, there are still challenges in optimization. The paper conducts ablation studies to identify these issues and outlines directions for future development. -
엔진을 정확하게 분류하는 것은 엔진의 수리 및 유지보수에 있어 중요한 과제 중 하나이다. 하지만 청음훈련을 통해 이를 숙달하는데는 오랜 시간이 걸리고, 엔지니어의 주관적 요인에 큰 영향을 받는다. 이를 해결하기 위해, 엔진의 음향적 특성을 이용한 머신러닝을 통해 엔진을 구분하는 시스템을 제안한다.
-
Won-Jin Park;Kyung-Woo Kim;Ye-Eun Oh;Su-Min Lee;Ho-Joon Kim 559
본 논문에서는 X-ray 영상에서 산란선 보정과 아티팩트 억제 및 선명도 개선을 위한 딥러닝 기법을 제시한다. 학습에 사용되는 흉부 X-ray 영상에서 배경영역 등 ROI가 아닌 영역의 특성으로부터 학습효과가 저하되는 현상을 보완하기 위하여 좌우 폐영역 등 조직구조를 분할하고 영역별로 학습하는 기법을 고려한다. 이를 위하여 BRAU-Net 기반의 조직구조 분할 기법을 제시하며, 흉부 X-ray 영상의 산란선 보정 문제에 대하여 DEA-Net, MB-TaylorFormer 모델을 사용한 방법을 제안하였다. 총 290개의 흉부 X-ray 영상을 사용한 실험을 통하여 제안된 이론의 타당성을 평가하였다. -
SemiVL(Semi-Supervised Semantic Segmentation with Vision-Language Guidance) 모델은 자원이 제한된 환경에서도 높은 이미지 분할 성능을 발휘하는 준지도 학습 기반의 시맨틱 세그멘테이션 모델이다. 본 논문은 PyTorch 프레임워크에서 TorchScript 프레임워크로 변환된 SemiVL 모델을 임베디드 시스템 환경(Google Pixel 2)에 적용하여 온디바이스 AI를 구현한 연구이다. 목표는 데스크톱 GPU 환경과 유사한 추론 성능을 달성하는 것이었다. 성능 평가는 Pascal VOC 데이터셋을 사용하였으며, mIoU(mean Intersection over Union)와 추론 시간을 주요 지표로 측정하였다. 실험 결과, TorchScript로 변환된 SemiVL 모델은 데스크톱 PC에서 77.5%의 mIoU와 6438.99ms의 추론 시간을 기록하였고, Google Pixel 2에서는 62.8%의 mIoU와 6658.45ms의 추론 시간을 달성하였다. 이 결과는 임베디드 시스템 환경에서 SemiVL 모델이 온디바이스 AI 솔루션으로 활용될 수 있음을 보여준다.
-
본 연구는 YOLOv9의 세그멘테이션 전용 모델인 YOLOv9c-seg을 교육용 임베디드 시스템인 라즈베리 파이 5와 Google Coral Edge TPU 환경에서 실시간 객체 분할 성능을 평가하였다. YOLOv9-seg모델을 커스텀 데이터셋(Customized Dataset)으로 파인튜닝(Full Fine Tuning)하여 TF Edge TPU 포맷으로 변환하여 추론 속도와 메모리 사용량을 크게 개선하였다. 실험 결과, 변환된 모델은 PT(Pytorch)형식의 기존 모델과 유사한 성능을 유지하면서도 평균 추론 시간이 80.14ms 단축되고, FPS가 21.12프레임 증가하여 실시간 성능이 향상되었다. 이는 Edge TPU가 정수 양자화된 모델에 최적화되어 처리 속도와 효율성을 극대화할 수 있음을 보여준다. 본 연구는 엣지 컴퓨팅(Edge Computing) 환경에서 실시간 객체 분할의 가능성을 제시하였다.
-
Parkinson's disease (PD) is a progressive disorder. In this study, we proposed a deep learning model that utilized participants' baseline clinical features and deformation-based morphometry (DBM) to predict long-term cognitive trajectory over four years. A total of 216 participants from the PPMI (Parkinson's Progression Markers Initiative) dataset were included, with 157 being PD patients and 59 healthy controls. We identified brain connectivity patterns associated with long-term cognitive decline using DBM and independent component analysis (ICA) techniques. Results of the cognitive prediction indicated that using only clinical features, DBM features, and multimodal features yielded average accuracies of 76 ± 4%, 70 ± 6%, and 78 ± 2%, and average AUC (Area Under the Curve) of 0.71 ± 0.06, 0.62 ± 0.04, and 0.76 ± 0.06, respectively. Our study demonstrated that the potential of using DBM features to better predict disease progression.
-
Chang-Hyun Jung;Sung-Joong Seol;Jae-Hyuk Lee;Ji-Hoo Lim;Keun-Chang Kwak 569
본 연구는 감정 분류에 중점을 둔 AI 모델을 개발하는 것을 목표로 한다. KoBERT(Korean Bidirectional Encoder Representations from Transformer) 모델을 활용하여 사용자가 입력한 텍스트를 분석하고 감정 상태를 분류한다. 특히 우울증과 같은 특정 감정을 분류하며, 필요 시 관련 정보를 제공하는 데 중점을 두고 있다. 테스트 결과, Test Accuracy는 0.67, F1-Score는 0.69로 기존 연구보다 향상된 성능을 보였다. 이 모델은 내담자의 감정 분석을 통해 정신건강의학과 전문의의 우울증 진단을 보조하는데 기여한다. -
Sung-Rae Kim;Sang-In Park;In-Ho Shin;Ik-Jin Jun;Geun-Eui Choi 571
본 연구에서는 딥러닝 기술을 활용하여 LA 갈비 이미지에서 살코기 부분을 검출하는 방안을 제안한다. 검출에는 이미지 픽셀을 미리 정의된 클래스로 분류하는 딥러닝 기술인 세그먼테이션을 활용한다. 세그먼테이션은 이미지 내 객체를 정교하게 탐지할 수 있는 특성을 가진다. 각 이미지에는 한 개의 손질 전 LA 갈비 이미지를 포함한다. 학습된 모델은 높은 정확도와 정밀도로 살코기 부분을 검출하였으며, 이는 육류 가공 과정에 추후 딥러닝 기술 활용이 유용할 수 있음을 시사한다. -
Battulga Ulziisaikhan;Nguyen Trong Nghia ;Soo-Hyung Kim 573
Electroencephalography (EEG) signals are often contaminated with artifacts, particularly those from eye movements, recorded as electrooculography (EOG). Effective denoising methods are essential for accurate EEG analysis. In this paper, we compare different denoising approaches, focusing on both convolutional neural networks (CNNs) and recurrent neural networks (RNNs) for artifact removal. Through experiments, we found that CNNs excel in capturing spatial features, particularly in high-frequency EEG bands like Alpha and Beta, while RNNs are more effective at modeling temporal dependencies, particularly in lower-frequency bands like Delta and Theta. To leverage the strengths of both models, we propose a hybrid CNN-LSTM architecture. Our results show that the hybrid model achieves superior performance in denoising across all EEG frequency bands, with significant improvements in the Alpha and Beta bands. This approach provides a robust solution for denoising EEG signals contaminated with EOG artifacts, offering improved accuracy over standalone CNN or RNN models. -
Duy-Phuong Dao;Hyung-Jeong Yang;Hye-Won Jung;Roger Davies 577
Due to the advancement of deep learning techniques, the medical field is undergoing significant upheaval. One of the prominent applications is generating an imaging modality from another imaging modality. This application helps reduce the cost of taking multiple types of medical images for diagnostic imaging. Although many methods have been proposed for generating medical images, only a few studies focus on three-dimensional (3D) images. Therefore, in this paper, we propose a deep generative adversarial network (GAN) for generating a 3D target image from a 3D source image. The results have shown that our proposed approach can generate high-quality images and holds promise for practical use. -
서비스 고도화와 퍼블릭 클라우드 확산으로 인해 시스템 복잡성과 규모가 증가하면서 시계열 로그 데이터의 양과 유형이 증가하고 있다. 안정적인 시스템 운영을 위해 시계열 로그 모니터링은 필수적이며 이상 탐지에는 높은 정확도가 요구된다. 본 연구에서는 트랜스포머 구조와 칼만 필터를 결합해 시스템 장애와 무관한 로그 데이터의 노이즈를 제거하고, 시계열 데이터의 패턴을 주기적으로 학습하여 임계치를 자동으로 조정함으로써 이상 탐지의 정확도를 높이고자 한다. 제안된 방법의 성능을 검증하기 위해 운영 중인 클라우드 환경에서 발생된 시계열 로그를 기반으로 실험을 수행한 결과, 연구에 사용된 다른 4 가지 딥러닝 기반 이상 탐지 모델보다 우수한 성능을 보였다.
-
Hyunjun Kwon;Sang-Hyun Park;Seongjun Hong;Jungeun Jeong;Min-Hyun Kim 584
본 연구에서는 모빌리티 환경에서 비접촉 방식으로 도로 표면을 파악하여 운전자의 주행 안전성에 기여할 수 있는 음파 센서 기반의 노면 추정 기법을 제안한다. 본 연구에서 제안된 시스템은 Continuous-transmit (C-transmit) 방식으로 주행 중 노면의 임피던스 정보를 실시간으로 획득하고, 전처리된 음파 데이터를 AI 모델로 분석하여 노면의 미끄럼 정도에 따라 몇 가지 노면 패턴으로 분류한다. 제안된 기법의 검증 실험에서는 아스팔트, 시멘트, 흙 플레이트 노면을 구성하고, 6 종 기상조건 (dry, humid, wet, iced, snow, slush)을 재현하여, 총 18 가지 조합 조건에서 실험 데이터를 확보하였다. AI 모델 성능은 노면 미끄럼도에 따른 6 종 상태 분류에서 96.8 %의 분류 정확도를 보였다. -
Hyeong-Seok Lee;Hui-Seok Yang;Ge n-Hi Park;Man-Je Kim 588
최근 인공지능은 게임 분야에서 적극적으로 활용되고 있는데, 움직임, 패턴, 데이터 처리 등 대부분 과정에서 빠짐없이 사용되고 있다. 그러나 일반적으로 인공지능은 다루기 어렵다는 인식과 개발 비용이 많이 든다는 문제로 인해 중소 게임사에서는 이를 활용하기 어렵다. 이에 본 연구에서는 게임사에서 손쉽게 데이터를 생성하여 게임 내 밸런스 등을 고려할 수 있는 강화학습 기반 데이터 생성 환경을 제안하여 중소규모의 게임사의 게임개발 능률 향상에 도움을 주고자 한다. -
본 연구에서는 대규모 언어 모델(LLM)에서 GeLU 와 SiLU 활성화 함수의 높은 연산 비용을 해결하기 위해 룩업 테이블(LUT) 기반 최적화 기법을 제안하였다. BERT, GPT2, OLMo 모델을 대상으로 실험을 수행하였으며, 특히 OpenAI GeLU 를 사용하는 GPT2 모델에서 최대 9 배의 성능 개선을 확인하였다. 또한, 배치 크기 변화에 따른 성능 분석 결과, GPT2 는 배치 크기가 클수록 더 큰 성능 향상을 보였고, BERT 와 OLMo 는 상대적으로 낮은 개선율을 나타냈다. 최적화 기법을 통해 각 활성화 함수의 연산 시간을 크게 줄이면서도 오차율을 낮게 유지할 수 있었다.
-
지식 증류 기법에서 학생 모델은 Label Smoothing을 거친 교사 모델의 결괏값을 통해 일반 라벨 데이터로는 학습할 수 없는 정보를 학습한다. 이때, Label Smoothing은 학생 모델의 분포가 교사 모델의 분포에 수렴하지 못하게 하거나 교사로부터 옳지 않은 정보를 학생에게 학습시키는 악영향도 존재한다. 이에 본 연구에서는 학생 모델의 분포가 교사 모델의 원래 분포에 잘 수렴하도록 하기 위한 두 가지 기법과 데이터의 신뢰성을 향상시키기 위한 기법 총 세 가지 기법을 제안한다. 세 가지 기법을 각각 적용했을 때, CIFAR-100 데이터셋에서 최대 0.64%의 Top-1 Accuracy 향상을 보였다.
-
Seung-Su Han;Jun-Hyeong Kim;Yun-Ju Park;Yun-A Oh;Tae-Yang Choi;Hyun Seung Son 598
최근 한국 아동 및 청소년의 문해력이 크게 하락하고 있으며, 이는 학습에 큰 영향을 미치고 있다. 특히, 디지털 기기와 스마트폰 사용이 증가하면서 독서를 기피하는 경향이 어휘력 저하와 문맥 이해 능력 감소의 주요 원인으로 보고되고 있다. 본 논문에서는 이 문제를 해결하기 위해, 어린이들이 독서에 흥미를 가질 수 있도록 자신만의 동화책을 만드는 경험을 제공하는 방안을 제안한다. 사용자가 원하는 키워드나 주제를 입력하면, 그에 맞는 내용의 동화책과 그림을 자동으로 생성하는 시스템을 개발하여 독서에 대한 재미와 흥미를 유도한다. 자동으로 동화책을 생성해 어린이들이 독서에 흥미를 갖게 되고, 이를 통해 독서 습관을 형성하며 어휘력과 문해력을 개선할 수 있다. -
피삭성(machinability)를 향상시킨 스테인리스(stainless) 강의 제조공정에서 공정의 후반부 인발(drawing) 공정에서 재료가 끊기는 단선 현상이 발생한다. 본 연구에서는 데이터의 가치를 이용하는 것이 중요해진 제조 산업의 트렌드에서 공정에서 공정 변수를 활용하여, 이에 대한 머신 러닝 예측모델을 생성하고, 단선에 미치는 공정 변수의 영향력을 확인하는 과정을 적용하는 것을 목표로 했다. 데이터 개수에 비해 변수 종류가 많으므로, 금속학적 지식과 통계적 지식을 활용하여 변수를 조정한 후에 XGboost 모델을 활용하여 예측 모델을 생성하였다. 추가적으로 데이터 개수 부족과 비선형모델의 단점을 보완하기 위해 데이터 증폭 방법인 SMOTE 기법을 채택하였으며, 설명 가능한 AI 기법인 LIME 적용을 통해, 최종적으로 공정 변수를 활용하고, 단선 불량 예측력과 금속학적 지식이 유의미한 모델을 생성하였다.
-
본 연구는 Retrieval-Augmented Generation (RAG) 시스템에서 검색 연산의 실행 성능을 관측/분석하고, 추가적인 실행 성능 최적화 가능성을 탐구한다. RAG 는 대규모 언어 모델(LLM)의 한계를 보완하기 위해 외부 데이터베이스에서 관련 정보를 검색하여 모델의 답변 품질을 향상시키는 기술이며, RAG 시스템에서 가장 많이 사용되는 연산은 검색 연산이다. 본 연구에서는 대표적인 벡터 데이터베이스 중 FAISS 와 Chroma 두 개를 선택하여, 여러 실행 조건들의 변화에 따른 지연 시간 변화를 분석하였다. 두 벡터 데이터베이스의 다른 최적화 방식이 대규모 벡터 데이터베이스에서 각각 다른 특성을 가지는데, FAISS 의 경우 데이터베이스의 크기 변화에 덜 민감하고, Chroma 는 특정 구간 안에서는 지연 시간이 증가하다 임계치를 넘어가면 감소하고 다시 증가하는 패턴을 보인다. 본 연구에서는 이에 대한 원인을 분석하여 RAG 시스템의 검색 연산의 더 세밀한 최적화 가능성을 제시한다.
-
A robust and efficient communication network is crucial for ensuring the smooth operation, efficiency, and utmost safety of various maritime activities. Throughout the vast expanse of history, the highly significant maritime industry has heavily relied upon an extensive range of diverse communication methods. Accurate network performance is critical in maritime environments, where data loss due to signal interruptions, equipment failures, and other domain-specific factors frequently occur. This paper evaluates traditional and advanced data imputation techniques to assess their impact on the predictive accuracy of machine learning models used for network switching decisions in maritime settings. Results show that advanced deep learning techniques, like Autoencoder-based imputation can improve performance over traditional methods.
-
Retrieval Augmented Generation(RAG)는 Large Language Models(LLM)에서 발생하는 환각 현상, 민감 정보 노출과 같은 한계들을 극복하기 위해 제안된 기술이다. 새로운 정보가 지속적으로 업데이트되는 외부 데이터베이스로 인해 RAG는 최신 정보에 기반한 정교한 답변 생성을 할 수 있어 질의응답이나 대화문과 같은 텍스트 데이터를 다루는 작업에서 강점을 발휘한다. 반면, 테이블 데이터는 행과 열로 구성된 정형화된 데이터로 각 속성 간에 복잡한 관계를 가지고 있어 충분한 문맥 정보를 추출하는데 어려움을 겪으므로 성능 저하 문제가 발생한다. 본 논문에서는 이러한 문제를 해결하기 위해 테이블 데이터를 분석하기 위한 질의 유형을 정보 검색, 특성 분석, 상관관계 분석, 결과 예측, 추세 분석과 같이 5가지로 분류하고, 각 유형에서 모델이 보이는 성능을 평가한다. 특히, 다양한 질의 유형 데이터를 통해 실험을 진행하고 분석하여 질의 유형의 특징과 RAG 성능 간의 관계성을 연구하고자 하며, 이를 통해 테이블 데이터에서의 RAG 성능 개선 방향을 제시하고자 한다.
-
So-Jung Lee;Ji-Woong Choi;Chae-Rin Lee;Nam Jae Kim;Jongwan Kim 615
본 연구는 당뇨병 예측의 정확도를 높이기 위해 AdaBoostClassifier 기법을 제안한다. 기존 연구에서는 당뇨병 초기 단계를 개인이 인지하기 어렵고, 예측 모델의 정보 부족으로 인해 정확도가낮았다. 이를 개선하기 위해, 질병관리청의 2022 국민건강영양조사 데이터를 활용하여 당뇨병과 추가 속성들 간의 상관관계를 분석하였다. 본 연구는 기존에 알려진 당뇨병 관련 지표 외에도 만나이, 체질량지수, 요당, A형간염항체 양성여부, 결혼여부를 포함해 다양한 속성을 통합적으로 분석했다. 제안된 모델은 새로운 요인을 효과적으로 통합하여 정교한 예측을 가능하게 하고, 개인 맞춤형 건강관리와 조기 치료에 기여할 수 있다. 이를 통해 당뇨병 관리에 대한 새로운 인사이트를 제공하고 임상적 의사결정에도 도움이 될 것으로 기대된다. -
Jinwoo Kim;Hyeongjoon Seo;Jaemyung Lee;Farkhodov Khurshedjon;Rak Young Choi;Ki-Ryong Kwon 617
본 연구는 AI 기술을 이용해 클라이밍 홀드를 추출하고, 사용자가 선택한 홀드에 맞는 경로를 추천하여 시각적으로 렌더링하는 시스템을 개발하는 것을 목표로 한다. YOLOv8 모델을 활용해 홀드를 인식하고, 서버에서 경로를 분석하여 사용자에게 제공한다. 이를 통해 클라이밍 초보자와 숙련자 모두에게 안전하고 효율적인 등반 경로를 제시한다. -
본 연구에서는 Complex Order Position Embedding (COPE)을 Vision Transformer (ViT)에 적용하여 컴퓨터 비전 태스크에서의 효과성을 검증하였다. COPE는 복소수 연산을 활용하여 위치 정보를 인코딩하는 방법으로, 기존에 자연어 처리 분야에서 성공적으로 적용된 바 있다. ImageNet-Tiny 데이터셋을 사용한 실험에서, COPE를 적용한 ViT-Tiny 모델은 기존 모델 대비 1.8%p 높은 34.0%의 정확도를 달성하였다. 이는 파라미터 수의 미미한 증가(약 37,000개)만으로 이루어진 성능 향상이다. 본 연구 결과는COPE가 컴퓨터 비전 분야에서도 효과적임을 입증하며, 특히 객체 검출이나 의미론적 분할과 같이 위치 정보가 중요한 고난도 비전 태스크에서의 잠재적 성능 향상 가능성을 제시한다. 이는 복소수 위치 임베딩의 응용 범위를 확장하고, 트랜스포머 기반 비전 모델의 성능 개선을 위한 새로운 방향을 제시한다는 점에서 의의가 있다.
-
최근 멀티모달 딥러닝은 모델의 높은 정확도를 보장하면서도 풍부한 지식을 학습할 수 있어 큰 관심을 받고 있다. 특히, 대조 학습을 기반으로 한 연구들이 멀티모달 딥러닝의 성능을 개선하고 있다. 그러나 멀티모달 딥러닝에서 사용하는 다중 데이터 소스가 서로 결합하여 민감한 정보를 추론하는데 활용될 수 있으므로, 모델의 학습과정에서 프라이버시 침해의 위험성이 단일 모달 딥러닝에서보다 증가한다. 이러한 위험성은 기존 단일 모달 딥러닝에서의 프라이버시 보호 기법으로는 효과적으로 다뤄질 수 없는 까닭에 중요도가 높다. 본 논문에서는 이러한 문제를 해결하기 위해 멀티모달 대조 학습의 데이터 준비 과정에서 double randomized response 알고리즘을 활용해 라벨 차등 프라이버시를 보장하였다. 이를 통해 이미지-테이블 매칭 및 분류와 같은 주요 멀티모달 작업에서 프라이버시를 보호하면서도 80.14의 정확도를 기록하였다. 이는 데이터 보안을 고려한 멀티모달 딥러닝 모델의 성능을 처음으로 실증한 연구라는 점에서 의의가 있다.
-
Ugur Ercelik;HaoYu Chen;Longfei Li;Kyungbaek Kim 626
AI-based image detection technology offers a promising solution for identifying defects in car doors, significantly improving efficiency compared to traditional human inspections. This paper introduces an advanced automatic defect detection system utilizing camera-recorded datasets and trained models to identify defects in aluminum car doors. Unlike previous models focused on aluminum castings, this is the first application specifically targeting car doors. Despite progress in defect detection research, challenges such as data imbalance, complex defect characteristics, and limited research on aluminum car doors persist. To address these issues, we propose the LKADenseNet201 model, enhancing the DenseNet201 architecture with a large kernel attention mechanism.While doing this, we focus on 3 important issues: image augmentation, channel attention and model evaluation.Our image processing process mainly include image augmentation. With image augmentation, we aimed to make data diversity suitable for the real world by obtaining data from different angles and to eliminate the imbalance between defect and normal images. This improvement boosts the model's ability to perceive contextual features and increases computational efficiency, essential for detailed spatial understanding and time-critical tasks. Our approach not only enhances operator efficiency but also moves towards automating the inspection process. -
최근 에너지 소비량의 상승과 함께 효율적으로 에너지를 관리하는 것에 대한 중요성이 높아지고 있다. 이러한 관점에서 볼 때, 전 세계 에너지 소비량의 약 40%를 차지하는 건물 에너지의 수요와 공급을 예측하는 것은 매우 중요한 과제이며 딥러닝 모델을 기반으로 에너지 소비량을 예측하는 연구가 수행되고 있다. 그러나 기존 예측 모델은 여러 구역의 에너지 소비량을 예측하기 위해 필요한 시공간 상관 관계를 온전히 포착하기 어렵거나 에너지 사용량에 영향을 미치는 요인들을 활용하기 위해 복잡한 구조를 활용해야 한다는 한계가 있다. 본 논문에서는 이러한 한계를 극복하기 위해 데이터를 비디오 데이터 형식으로 변환하고 시공간 예측 모델을 사용하여 건물 에너지 예측을 수행하고, 비교 실험을 통해 적용 가능성에 대해 검토하고 가능성을 제시한다.
-
최근 Scene Graph Generation(SGG)이 시각적 이해와 상호작용 시스템에서 중요한 연구 분야로 떠오르고 있으며, 이는 정적 이미지에서의 객체와 객체 간 관계를 분석하는데 주로 사용되었다. 하지만 동적인 환경에서의 장면 그래프 생성은 시간에 따라 변화하는 객체의 상태와 그 사이의 관계를 정확히 파악하고 모델링하는 데 있어 훨씬 더 큰 도전이다. 본 논문에서는 비디오 시퀀스로부터 Dynamic Scene Graph(DSG)를 생성하는 새로운 방법을 제안한다. 이는 동적 환경에서의 객체 변화와 그 사이의 상호작용을 실시간으로 추적하고 이해하는 데 필수적인 기능을 제공한다. 본 논문에선 CNN 백본 네트워크와 인코더를 사용하여 각 프레임에서 시각적 표현을 추출하고, attention 메커니즘을 적용하여 시간적 정보를 통합한다. 또한, 디코더 내부에서 학습 가능한 쿼리를 이용해 복잡한 객체 간 관계를 인식하며, 헝가리안 알고리즘 매칭 로스를 사용하여 각 쿼리는 쌍별 인스턴스 특징을 학습하게되고, 디코더의 각 attention layer에서는 객체 간의 복잡한 관계를 추출하고, 이를 통해 각 관계에 적합한 predicate를 예측한다.
-
Time series forecasting can be enhanced by integrating various data modalities beyond the past observations of the target time series. This paper introduces the Multimodal Block Transformer, a novel architecture that incorporates multivariate time series data alongside multimodal static information, which remains invariant over time, to improve forecasting accuracy. The core feature of this architecture is the Block Attention mechanism, designed to efficiently capture dependencies within multivariate time series by condensing multiple time series variables into a single unified sequence. This unified temporal representation is then fused with other modality embeddings to generate a non-autoregressive multi-horizon forecast. The model was evaluated on a dataset containing daily movie gross revenues and corresponding multimodal information about movies. Experimental results demonstrate that the Multimodal Block Transformer outperforms state-of-the-art models in both multivariate and multimodal time series forecasting.
-
Agriculture and the plants and crops that are the results of it are essential to our everyday lives. Without agriculture our current society can not function and as such it is extremely important to make sure that we can assure that farms and farmers can continuously and steadily harvest enough produce. One big challenge that keep hindering the farming process are plant diseases that account for a large number of dead crops. They spread fast and can be troublesome to detect, especially manually. Datasets are also sparce and often lacking. To ease the detection process and speed it up, in an effort to aid farmers, we propose a pretrained MobileNet CNN deep learning AI model that can automatically detect maize/corn diseases from images. However, since data is rather sparce, not all diseases can be accounted for. This is why we have trained the model with one set of diseases (leaf spot and leaf blight) and healthy plant leaves, but tested it with a set of images of maize leaves that are infected with a disease the model has never seen before (leaf rust). The model has managed to not only learn and master the test set, but also managed to generalize to the before unseen rust infected leaf images. This promises to help future models learn robust and effective models that can generalize to diseases that can even classify diseases new to the model, which can be important in a field with limited data.
-
Flexibility is crucial in applications where users or systems require precise control over the appearance of text in images, particularly in scene text editing tasks. However, previous methods have primarily focused on altering text content, often neglecting the important aspect of controlling text formatting. In this paper, we propose a text editing model that not only edits content but also provides control over the format, utilizing a diffusion model with denoising and text-aware losses. By integrating these mechanisms, the model is capable of generating high-quality scene text images based on user-specified inputs such as text, size, and font, ensuring that both the content and appearance align with user preferences. We evaluate the model's performance using OCR accuracy on the ICDAR FST dataset, and the results demonstrate that our approach is highly competitive and effective when compared to existing methods in the field.
-
최근 몇 년의 3D, 텍스트의 멀티 모달 연구의 방향성을 파악하고, 3D 포인트 클라우드 데이터와 텍스트 사이의 연관성을 파악할 수 있는 새로운 방법론을 제시한다.
-
본 논문은 Vision-Language Model(VLM)의 성능을 향상시키고, 구성적 추론 문제를 해결하는 새로운 접근을 제시한다. VLM 은 시각적 정보와 언어적 정보를 결합하여 다양한 다운스트림 작업에서 뛰어난 성능을 보였지만, 여전히 이미지와 텍스트 간의 복잡한 관계를 완전히 이해하지 못하는 문제를 안고 있다. 특히, VLM 이 텍스트와 이미지의 구조적 차이를 인식하고 올바르게 매칭하는 데 한계가 있으며, 이는 주로 학습 데이터의 불균형과 손실 함수의 한계로 인해 발생한다. 이 문제를 해결하기 위해 다양한 연구들이 데이터셋과 손실 함수의 개선에 집중해 왔다. 본 논문에서는 제안하는 아키텍처는 두 가지 주요 구성 요소를 통해 문제를 해결한다. 첫 번째는 노이즈가 많은 Raw 데이터를 전처리하는 모델로, 잘못된 이미지-텍스트 쌍이나 단일 데이터를 처리하여 정제된 데이터를 출력한다. 두 번째는 하드 네거티브 데이터를 생성하여 VLM 의 구성적 추론 능력을 향상시키는 모델이다. 이를 통해 이미지와 텍스트 간의 구조적 차이를 더욱 명확히 구별할 수 있으며, 대조 학습을 통해 모델의 성능을 최적화한다.
-
Lung cancer is a leading cause of death worldwide, highlighting the critical need for early diagnosis. Lung image analysis and segmentation are essential steps in this process, but manual segmentation of medical images is extremely time-consuming for radiation oncologists. The complexity of this task is heightened by the significant variability in lung tumors, which can differ greatly in size, shape, and texture due to factors like tumor subtype, stage, and patient-specific characteristics. Traditional segmentation methods often struggle to accurately capture this diversity. To address these challenges, we propose a lung cancer diagnosis system based on Mask2Former, utilizing CT (Computed Tomography) and PET (Positron Emission Tomography) images. This system excels in generating high-quality instance segmentation masks, enabling it to better adapt to the heterogeneous nature of lung tumors compared to traditional methods. Additionally, our system classifies the segmented output as either benign or malignant, leveraging a self-supervised network. The proposed approach offers a powerful tool for early diagnosis and effective management of lung cancer using CT and PET data. Extensive experiments demonstrate its effectiveness in achieving improved segmentation and classification results.
-
With the widespread application of 5G technology, network traffic has increased unprecedentedly, which has a significant impact on network traffic management. Traditional network traffic prediction methods rely on time series analysis of seasonal patterns, ignoring the inherent spatial correlation of network traffic. Graph convolutional networks (GCN) learn spatial correlations. By combining GCN with time series models, spatiotemporal features can be captured simultaneously, thereby improving prediction accuracy. This paper introduces a new network traffic prediction model TSA-NTP based on the attention mechanism, which aims to more effectively capture spatiotemporal features in complex network environments.
-
Influenced by societal trends, cultural standards, and individual personalitiees, fashion is a potent means of self-expression. Many industries have benefited from the advancement of Artificial Intelligence(AI), with the fashion industry emerging as one of the most notable. AI has assisted the fashion industry in a number of areas, including product design and marketing. Online buying has proliferated as the fashion business has expanded into a multibillion-dollar industry, offering customers easy, stress-free shopping experiences. By advising customers on what to buy there could be potential increase in the sales of such and other products. The goal of this study is to investigate qualitatively mutimodal foundation models for fashion critics and advice. In this paper, we adapted a Gemini 1.5 flash on our dataset for compatibility prediction and complementary commentary on clothing. Qualitatively, the model provided very indepth review with varying images while also criticing fashion combination that are not compabible. The study alludes to the robotuness of mutimodal models with reommendation on quantitative evaluation in future studies.
-
제주어 보존과 활성화를 위해, 본 연구에서는 교차 언어 언어 모델을 활용하여 저자원 언어인 제주어의 기계 번역 성능을 개선하고자 한다. 특히, SOV 구조를 가진 언어를 사전 학습에 사용하여 구조적으로 유사한 언어를 통해 한국어→제주어 번역의 성능을 평가했다.
-
이슈 리포트 자동 레이블링은 효율적인 소프트웨어 유지보수를 위해 필수적인 작업이다. 그러나 이슈 리포트 데이터 셋은 롱테일 레이블 분포를 가지고 있어, 성능 저하를 초래할 수 있는 불균형 문제가 존재한다. 본 연구에서는 Easy Data Augmentation을 적용하여 롱테일 레이블의 성능을 개선할 수 있는지 실증적으로 검토하였다. 그 결과, 가장 희소한 "good-first-issue" 레이블에서 성능이 크게 개선된 것을 확인하였다.
-
Geun-Bin Eom;Do-Kyeong Kim;Gun-Hee Lim;Kyeong-Hwan Lee;Joo-Seon Oh 668
본 연구는 쇼핑 결제의 효율성을 높이기 위한 스마트 결제 시스템을 제안한다. 기존 결제 시스템의 대기 시간과 위생 문제, 첨단 무인 매장의 높은 설치 비용을 해결하기 위해 카메라 한 대로 제스처, 얼굴, 객체를 인식하는 방식을 도입하였다. 이러한 연구는 소매업뿐만 아니라 다양한 분야에서의 활용 가능성을 열어줄 것으로 기대된다. -
Dae-Kyoung Na;Jin-Young Lee;Yeong-Hu Mok;Keun-Chang Kwak 670
본 연구는 ECG 기반 사용자 인식 시스템에서 MobileNet-V2, SqueezeNet과 기존 전이 학습 모델들의 성능을 비교하였다. PTB-ECG 데이터베이스를 사용하여 각 모델의 계산 효율성과 인식 정확도를 분석하였다. MobileNet-V2는 98.88% 의 검증 정확도와 8분 59초로 빠른 훈련 속도를 기록하였으며, SqueezeNet은 95.75%의 검증 정확도를 보이며 3분 12초의 훈련 속도로 메모리 효율성 면에서 뛰어난 성능을 나타냈다. 실험 결과, 두 모델은 ECG 신호 분석에 적합한 경량화 모델임을 확인할 수 있었다. -
교차로 신호 제어는 스마트 교통 시스템에서 중요한 역할을 하며, 강화학습(RL)을 기반으로 한 연구가 많이 진행되고 있다. 그러나 RL에서 보상 함수 내 요소 간 가중치를 적절하게 설계하는 것은 매우 어려운 과제이다. 최근 LLM을 활용해 데이터를 분석하고 의사 결정을 보완하는 연구가 주목받고 있으며, 이를 RL에 적용해 이러한 문제를 해결하려는 시도도 진행 중이다. 본 논문에서는 실시간으로 변화하는 교차로 내 효율적인 교통 제어를 위해 LLM을 이용하여 RL 보상 함수의 가중치를 실시간으로 조절함으로써 교통신호를 효율적으로 제어하는 알고리즘을 제안한다. 그리고 초기 가중치 설정과 가중치 조절 주기에 대한 실험 결과를 비교함으로써 제안 기법의 성능을 분석한다.
-
최근 자연어 처리(Natural Language Processing , NLP) 모델의 규모가 급격히 증가함에 따라, 하드웨어가 처리해야 할 파라미터 수가 기하급수적으로 늘어나고 있다. 이로 인해 대규모 모델의 효율적인 학습을 위해 다양한 병렬화 및 분산 학습 기법이 도입되었다. 이러한 기법은 데이터셋의 크기와 모델의 구조에 따라 학습 성능에 상당한 차이를 보인다. 본 연구에서는 IMDB (Internet Movie Database) 감정 분류 작업을 대상으로, Bert 와 ALBERT 모델을 활용하여 두 가지 병렬화 방식이 학습 시간에 미치는 영향을 분석하였다. 이를 통해 모델의 크기에 따라 최적의 병렬화 기법을 선택하는 것이 성능 향상에 필수적임을 밝히고, 분산 학습 환경에서 자원의 효율적 활용 및 성능 최적화를 위한 지침을 제시하고자 한다.
-
Fine-tuning is critical to enhance the model's ability to operate effectively in resource-constrained environments by incorporating domain-specific data, improving reliability, fairness, and accuracy. Large language models (LLMs) traditionally prefer centralized training due to the ease of managing vast computational resources and having direct access to large, aggregated datasets, which simplifies the optimization process. However, centralized training presents significant drawbacks, including significant delay, substantial communication costs, and slow convergence, particularly when deploying models to devices with limited resources. Our proposed framework addresses these challenges by employing a federated fine-tuning strategy with Whisper-tiny model for keyword recognition system (KWR). Federated learning allows edge devices to perform local updates without the need for constant data transmission to a central server. By selecting a cluster of clients and aggregating their updates each round based on federated averaging, this strategy accelerates convergence, reduces communication overhead, and achieves higher accuracy in comparatively less time, making it more suitable than centralized approach. By the tenth round of federated updates, the fine-tuned model demonstrates notable improvements, achieving over 95.48% test accuracy. We compare the FL-finetuning method with and centralized strategy. Our framework shows significant improvement in accuracy in fewer training rounds.
-
본 연구는 이차전지 산업의 원가 경쟁력 확보를 위한 원자재 가격 예측 자동화 파이프라인을 제안한다. XGBoost 모델을 기반으로 한 이 파이프라인은 데이터 전처리, 모델 학습 및 예측, 결과 시각화까지의 전 과정을 자동화하여 사용자의 개입을 최소화하고 실시간 의사결정을 지원한다. 본 연구에서는 단변량 및 다변량 예측을 동시에 수행하였으며, 이를 위해 니켈 원자재 가격 데이터와 유가, CPI, PPI, CRB 등 9 개 변수를 활용하였다. 획득한 데이터를 개발한 파이프라인에 적용하여 차분 횟수, 최적 변수 조합, 하이퍼파라미터 결정을 자동 수행하였고, 최종적으로 평균 절대 백분율 오차(MAPE) 0.2%, 결정계수(R2) 0.99 라는 높은 성능을 달성했다.
-
Chaeeun Cho;Soyeon Moon;Yeogyeong Song;Jiwoo Jang 686
This study aims to predict MMSE scores in Alzheimer's disease (AD) patients using a CNN-LSTM model that processes MRI images and metadata. The OASIS-2 dataset was used, with MRI slices (central, ±10mm, and ±15mm) and metadata. Two datasets were created: one with central and ±10mm slices (10mm dataset), and another with central, ±10mm, and ±15mm slices (combined dataset). The CNN-LSTM model extracted features using VGG16 and combined them with metadata to predict MMSE scores. The 10mm model outperformed the combined model, achieving an MSE of 0.527 and MAE of 0.509. This study highlights the potential of predicting MMSE scores using MRI and metadata for early diagnosis of AD. -
급속한 도시화와 교통량의 증가로 인해 보행자 안전이 중요한 사회적 문제로 부각되고 있다. 이에 따라 보행자의 횡단 여부를 예측하는 다양한 연구가 활발히 진행 중이다. 본 연구에서는 보행자 행동 예측에 대표적으로 활용되는 JAAD 데이터셋을 기반으로 QA 셋을 제작하고, 이를 최신의 오픈소스 MLLM에 해당하는 VideoLLaMA2 모델에서 미세조정을 진행하였다. 이 모델을 기반으로 과거 16 프레임 동안의 보행자 움직임을 관찰한 후, 30프레임 이후 시점에서 보행자의 횡단 의도(crossing/not-crossing)를 예측하고 그 정확도를 비교·분석한다. 그 결과, 미세조정을 진행한 모델에서 더 높은 예측 정확도를 나타내었으며. 향후 복잡하고 새로운 도로 환경에서도 보행자의 미래 횡단 의도를 예측하여 보행자의 안전성을 높일 수 있다.
-
Hyeon-Ji Yang;Seung-Jun Lee;Hyun-Seo Oh;Myungeun Lee;Hyung-Jeong Yang;Hyung-Chae Yang 692
폐쇄성 수면 무호흡증(Obstructive Sleep Apnea, OSA)은 수면 중 상기도의 폐쇄로 호흡 저하 및 중단이 발생하는 질환이다. 약물 유도 수면내시경(Drug-induced sleep endoscopy, DISE)은 이러한 상기도의 폐쇄 위치를 파악하는 데 사용되며, VOTE(Velum, Oropharynx, Tongue base, Epiglottis) scoring을 통해 DISE 결과를 판독한다. 하지만 VOTE scoring은 의료진이 주관적으로 각 해부학적 위치의 폐쇄 정도를 판단하기 때문에, 의료진의 해석에 따라 진단 결과가 달라질 수 있으며, 이로 인한 판독자간 판독 불일치가 상당하다. 따라서 본 연구는 딥러닝 모델을 활용하여 DISE 영상에서 VOTE 영역을 자동으로 분류하고 상기도의 완전폐쇄 여부를 예측하고자 한다. 연구개(V), 연구개 완전폐쇄(V degree 2), 구인두-혀 기저부-후두덮개(OTE), 구인두-혀 기저부-후두덮개 완전폐쇄(OTE degree 2), 왜곡(X) 총 5가지 클래스로 분류하였다. 이러한 분류 체계는 상기도의 부위별 폐쇄를 더 정확하고 체계적으로 예측할 수 있게 해 준다. 이를위해 13명의 환자로부터 수집된 DISE 영상 데이터셋과 임상 정보를 기반으로 ResNet, DenseNet, VGG, EfficientNet과 같은 딥러닝 모델을 구현하고 성능을 비교했다. 그 결과 EfficientNet 모델이 80%의 정확도로 가장 뛰어난 성능을 보였다. 향후 연구에서는 DISE 영상에서 상기도 폐쇄 양상을 더욱 세분화하여 분석하고자 한다. -
Chae-rin Lee;Ki-hyuk Kwon;So-jung Lee;Nam Jae Kim;Jongwan Kim 696
수면 장애는 성인의 약 30%가 경험하는 흔한 질환으로 수면 단계마다 다른 양상을 보인다. 현재 수면 단계 분류에 관한 연구는 활발하지만 기존 모델은 임상에서 사용할 만큼 예측 정확도가 높지 않다. 본 논문에서는 비렘수면 단계를 LS(Light Sleep)와 DS(Deep Sleep)로 분류하여 정확도를 높인 뇌파 단일 채널 기반 수면 단계 분류 모델을 제안한다. 해당 모델은 수면 단계 단순화를 통해 모델의 성능을 향상하였으므로 향후 직관적인 수면 질 파악 및 실시간 수면 모니터링 등 임상 환경에서 수면의 질 평가, 장애 진단, 치료 계획 수립에 기여할 것이다. -
생성형 인공지능의 발전으로 AI기자가 작성한 기사가 점차 증가될 것으로 전망되고 있다. 시간 절약, 경제성 등의 장점에도 불구하고 인공지능이 작성한 뉴스 내 허위정보 등으로 혼란이 사회적 문제로 제기되고, 이를 악용한 가짜뉴스 생성의 우려에 따라 구축모델의 필요성이 제기되고 있다. 이에 따라 실제 기사와 AI 작성 기사를 KoBART, KoELECTRA 모델과 두 모델을 앙상블한 모델에 적용시켰고, 그 결과 KoBART 모델의 Accuracy가 0.9995로 가장 높은 지표를 보였다.
-
연합학습은 분산된 환경에서 데이터의 공유 없이 모델을 학습시킬 수 있는 방법이다. 그 중에서도 Fed-Avg 는 분산된 클라이언트의 파라미터의 평균으로 모델을 수집하고 반영한다. 이 방법을 통해 연합학습의 모델의 연구가 발전되었으며, 모델성능을 향상시키기 위한 연구들이 꾸준히 진행되어왔다. 기존의 연합학습은 데이터를 공유하지 않고 모델 파라미터만을 서버로 전송하는 방식을 채택하여 데이터의 노출을 최소화하였다. 그러나 지역학습을 위해 서버가 클라이언트들에게 모델을 공유해야 하기 때문에 모델의 노출은 불가피할 수밖에 없다. 특정 분야에서는 데이터 노출 뿐만 아니라 모델의 노출을 보호하는 것 또한 중요한 분야도 있다. 본 논문에서는 이런 문제를 해결하기 위해 서브모델을 활용한 연합학습 보간 방법을 제시하였다. 이 방법은 지식증류 방법 기반에서의 새로운 모델 학습 방법을 제시한다. 실험에서 기존의 모델이 노출되지 않으면서 노이즈에도 강건하게 모델을 학습시킬 수 있음을 보여주었다.
-
본 논문에서는 장기 비디오 이해를 위한 새로운 메모리 메커니즘을 제안하였다. 제안된 메모리 메커니즘은 메모리 구성에 사용되는 시각 토큰을 압축하여, 메모리 사용량과 연산 비용을 줄이면서도 효율적인 비디오 처리를 목표로 한다. 다양한 시각 토큰 압축 방법을 적용 및 비교하였으며, MSVD-QA 데이터셋을 활용한 실험 결과, 제안된 메커니즘이 기존 방법에 비해 효율성과 성능 면에서 모두 우수함을 확인하였다. 본 연구는 장기 비디오 이해의 효율성을 높일 수 있는 새로운 접근 방식을 제시한다.
-
크라우드소싱 기반 연합학습에서 글로벌 모델은 모델 제작 의뢰자의 중요한 자산이다. 하지만, 연합학습 플랫폼 운영 주체는 모델 학습을 위해 글로벌 모델의 파라미터를 클라이언트에게 공유해야 한다. 이 과정에서 악의적인 클라이언트로부터 모델 탈취 공격이 발생할 수 있다. 본 연구는 모델의 파라미터에 노이즈를 추가함으로써, 공유되는 모델의 정확도를 낮은 수준으로 유지하는 동시에 취합된 로컬 모델로부터 만들어진 글로벌 모델의 높은 정확도는 보장하고자 하는 데 목적이 있다.
-
Jo Vianto;Hyung-Jeong Yang;Seung-won Kim;Ji-eun Shin;Soo-Hyung Kim 711
Facial emotion recognition (FER) is becoming crucial in fields like human-computer interaction and surveillance. Traditional FER systems rely on two-stage models with face alignment preprocessing, which increases complexity and inference time. In this research, we propose a single-stage approach using YOLOv6 combined with weighted class loss to address these inefficiencies. Our method improves computational efficiency while enhancing the detection of minority classes in imbalanced emotion datasets. The experiments demonstrate that although the weighted loss function helps with class detection, it slightly reduces overall accuracy. Nevertheless, the model shows promise for real-time FER applications, balancing accuracy and speed. This work not only introduces a more efficient approach but also highlights the potential of single-stage models in advancing emotion recognition tasks. -
본 연구는 In-context learning 을 적용한 LMM 을 이용하여 감시 카메라 비디오 데이터를 기반으로 이상 상황을 탐지하고 이에 대한 범죄 클래스를 분류하는 방법을 제안한다. 특히 VTimeLLM[1] 모델을 사용하여 비디오 데이터를 분석하고, '정상' 및 '비정상' 이벤트를 분류한다. 추가적으로 '비정상' 이벤트는 13 개의 범죄 클래스 중 하나로 분류된다. 본 연구에서 zero-shot 과 few-shot 학습 기법을 적용하여 기존 방법들과 정량적으로 비교 실험을 수행했다. 실험 결과 LMM 과 In-context learning 을 결합한 방식이 기존 방법들과 비교해 이상 상황 탐지 성능이 개선되었다.
-
뇌 연령은 신경퇴행성 질환과 인지 저하를 예측하는 중요한 바이오마커로 주목받고 있으며, 이를 통해 개인의 뇌 건강 상태를 보다 정밀하게 확인할 수 있다. 특히, 회백질과 백질은 뇌 구조와 기능을 평가하는 데 핵심적인 역할을 하며, 뇌 구조적 변화를 분석함으로써 뇌 연령 예측의 정확도를 높일 수 있다. 또한, 특정 데이터셋만 활용될 경우 일반화된 성능을 기대하기 어려워 뇌 연령 예측에 다양한 데이터셋을 활용한 연구가 필요하다. 따라서, 본 연구에서는 다중 모달 MRI 데이터를 결합한 3D CNN 기반 뇌 연령 예측 모델을 제안한다. 제안된 모델은 회백질과 백질의 특징을 전처리된 T1 이미지에 결합하여 더욱 풍부한 뇌 구조 정보를 학습할 수 있도록 설계하여, 뇌 연령 예측의 정확성을 향상시켰다. 실험 결과 회백질과 백질 정보를 추가로 활용한 모델이 T1 이미지만을 사용한 기존 CNN 및 ResNet 모델보다 MAE(Mean Absolute Error) 평가지표에서 더 우수한 성능을 보였으며, 이를 통해 회백질과 백질 정보가 뇌 연령 예측에 중요한 기여를 한다는 사실을 확인하였다.
-
암 환자의 유전체 변이 데이터는 샘플 수가 적으나 많은 특성 정보를 가지는 의료 데이터로, 이러한 특성은 ML 모델의 성능 향상에 상당한 장벽으로 작용한다. 따라서 본 연구는 제한된 의료 데이터의 한계를 해결할 수 있는 적절한 모델 선택을 돕고자, 유전체 데이터를 이용하여 암종을 예측하는 다중 클래스 분류 문제에서 성능향상기법과 다중 클래스 분류 모델에 따른 성능을 분석하였다.
-
본 연구는 상세 페이지 이미지의 도용을 방지하기 위한 이미지 유사도 확인 기술을 개발하는 것을 목표로 한다. 이를 위해 이미지 검색 모델 Unicom을 사용하여 제품 이미지 간의 유사도를 측정하고, 도용 가능성이 높은 상위 10개의 이미지를 반환하는 시스템을 설계한다. 학습에는 Stanford Online Products(SOP) 데이터셋과 In-Shop 데이터셋을 사용하였으며, 테스트는 국내 온라인 쇼핑몰에서 수집된 제품 이미지와 상세 이미지 데이터를 통해 이루어졌다. 성능 평가는 Rank-k accuracy를 사용하여 측정하였으며, Rank-10 기준으로 높은 정확도를 기록하였다. 본 연구는 이미지 검색 모델을 활용하여 온라인 쇼핑몰에서 발생할 수 있는 이미지 도용 문제를 효과적으로 탐지하고, 지적재산권 보호를 강화할 수 있는 도구를 제안한다.
-
Du-Eon Kim;Ki-hyeok Kwon;Nam Jae Kim;Dong-Hak Lee;Jongwan Kim 730
본 연구는 알코올 사용 장애 식별 도구인 AUDIT-K를 기반으로 위험 음주자를 식별하는 인공지능 모델을 제안한다. 음주로 인한 사고는 점차 줄어들었지만, 재범의 수는 과거에 비해 큰 폭으로 증가했다. 위험 음주자가 자신의 음주 상태를 알 수 있게 해준다면, 음주 수준에 따라 대상자를 신속하게 분류하는 인공지능 모델을 통해 위험 음주자나 알코올 중독자에 대한 개입이나 치료를 더 신속히 하여 위험 음주로 인한 문제 발생을 예방하는 것에 도움이 된다. 이 모델은 사용자의 점수에 따라 위험 음주자를 분류하는 목적으로 제작되었다. 본 모델은 위험 음주자를 구분함으로써 자신의 음주 습관 위험성을 인지하고 알코올 중독 예방에 도움이 될 것이다. -
본 연구에서는 GPT-4 기반의 자연어 처리를 활용하여 뉴스 기사 제목의 감성 분석을 통해 주식 가격 예측 성능을 개선하는 방법을 제안한다. Python을 이용한 웹 크롤링으로 주식 관련 뉴스 기사 제목을 수집하고, GPT API로 긍정도를 분석하여 이를 주식 데이터와 결합한 후 머신러닝 모델에 적용하였다. 여러 회귀 모델을 통해 예측 성능을 비교한 결과, 감성 분석을 포함한 모델에서 예측 성능이 올라감을 확인하였다. 이 연구를 통해 뉴스 감성이 주식 시장 예측에 미치는 영향을 확인할 수 있다.
-
Large Language Model(LLM) 사용이 증가하면서, LLM의 성별 및 인종에 대한 편향성은 사회적 불평등을 심화시킬 수 있는 중요한 문제로 대두되고 있다. 이에 LLM의 편향을 정확하고 신뢰성 있게 측정하는 도구가 필요하다. 본 논문은 LLM의 편향을 평가하는 방법론을 워드 임베딩 분석과 텍스트 생성 편향 분석으로 나누어 검토한다. 워드 임베딩 분석 방법은 단어 벡터 간 거리를 측정해 편향을 정량적으로 평가하는 방식으로, 간호사나 군인과 같은 단어들이 성별이나 인종과 같은 특정 집단과 얼마나 가깝게 매핑되는지를 분석하는 방식이다. 그러나 이 방법은 단어의 문맥적 의미 변화를 충분히 반영하지 못하는 한계가 있다. 반면, 텍스트 생성 편향 분석 방법은 LLM이 실제로 생성한 텍스트에서 나타나는 편향을 직접 평가하는 방식이다. 이를 위해 연구자는 성별이나 인종과 관련된 편향이 드러날 수 있는 문장들로 데이터셋을 구성하고, LLM이 이를 어떻게 처리하는지 분석한다. 이방법은 문맥을 반영해 모델이 생성한 텍스트에서 편향을 평가할 수 있다는 장점이 있지만, 연구자가 데이터셋을 구축하는 과정에서 주관적 판단이나 편향이 개입될 가능성이 있으며, 평가할 수 있는 시나리오가 제한적이라는 한계가 있다. 본 논문은 이러한 한계를 극복하기 위한 향후 연구로, 합성 데이터를 활용하여 데이터셋을 구축하고, 이를 통해 텍스트 생성 편향을 분석하는 방법을 제안한다. 합성 데이터는 다양한 시나리오를 기반으로 무한히 생성할 수 있어, 특정 시나리오에 제한되지 않고 LLM의 편향을 폭넓게 평가할 수 있다. 또한 연구자의 개입을 줄여 데이터셋 구축 시 발생할 수 있는 편향을 최소화하고, 더 공정하고 신뢰성 있는 평가를 가능하게 한다. 이에 따라 합성 데이터를 이용한 텍스트 생성 편향 분석 방법은 LLM의 성별 및 인종 편향을 보다 객관적으로 평가하는 도구로서 중요한 역할을 할 것으로 기대한다.
-
최근 몇 년간 대규모 언어 모델(LLM)은 자연어 처리(NLP) 분야에서 인간의 언어를 이해하고 생성하는 능력으로 큰 주목을 받아왔다. 초기에는 텍스트 생성, 번역, 질의응답 시스템과 같은 작업에 주로 사용되었으나, 최근에는 코드 생성과 같은 복잡한 기술 작업에도 응용되고 있다. 그러나 LLM 이 생성한 코드는 문법적 오류, 논리적 결함, 실행 불가능한 문제 등 다양한 문제점을 포함할 수 있다. 이러한 문제를 해결하기 위해 LLM 이 스스로 코드를 검증하고 개선할 수 있는 자동화 피드백 시스템이 주목받고 있다. 본 논문에서는 코드 생성 LLM 의 성능을 향상시키기 위한 주요 자동화 피드백 메커니즘들을 분석한다. 이러한 자동화 피드백 시스템은 소프트웨어 개발 과정을 자동화하고 최적화하는 데 중요한 역할을 할 수 있으며, 향후 연구에서는 이 시스템의 정교화 및 코드 생성 분야에서의 확장 가능성에 대한 탐구가 필요할 것이다.
-
이 연구는 딥러닝을 사용하여 당뇨병성 망막증을 탐지한다. ImageNet 에서 사전 학습된 Swin Transformer 모델을 IDRiD 데이터셋으로 미세 조정하여, 병변 분할 및 당뇨병성 망막증 분류에서 강건한 모델을 개발하였다. 이 모델은 93.2%의 높은 정확도를 기록하며 질병 진단에서의 효율성을 입증한다. 데이터 전처리와 최적 임계값 설정을 통해 모델의 정확성과 신뢰성을 더욱 향상시킨다.
-
Honggu Kang;Dahyun Mok;Huigyu Yang;Hyunseung Choo 744
고령화로 인해 실명을 유발하는 안질환의 발병률이 지속적으로 증가하고 있다. 이에 본 연구는 딥러닝 기반의 안저사진 분석을 통해 다중 안질환 분류 모델의 적용성을 향상시키고자 한다. Ocular Disease Intelligent Recognition (ODIR) dataset과 같은 다양한 공용 데이터셋에 순환학습과 regularization 기법을 적용하여 녹내장, 백내장, 황반변성 등의 질환을 효과적으로 분류를 돕는 기법을 제안한다. 이를 통해 안질환 진단의 정확성을 높이고, 임상에서 활용가능한 신뢰성 있는 안질환 진단 모델을 구축하고자 한다. -
Alzheimer's disease (AD) is a progressive neurodegenerative disorder characterized by gradual cognitive decline and memory loss, with subtle changes in brain structure that make accurate classification particularly challenging. This study presents SMOTE-ADNet, an innovative Convolutional Neural Network (CNN) model designed to enhance classification performance for Alzheimer's disease by integrating advanced CNN techniques with the Synthetic Minority Over-sampling Technique (SMOTE). The SMOTE-ADNet architecture includes multiple convolutional layers, dropout regularization, and a final dense layer optimized for multi-class classification, aimed at differentiating between five stages of Alzheimer's disease: Alzheimer's disease (AD), Cognitive Normal (CN), Early Mild Cognitive Impairment (EMCI), Late Mild Cognitive Impairment (LMCI), and Mild Cognitive Impairment (MCI). Given the challenge of distinguishing between subtle variations in brain structure during these stages, SMOTE-ADNet effectively balances the dataset using SMOTE and leverages advanced CNN layers to achieve a remarkable accuracy of 98%. This result demonstrates the model's capability to manage the inherent difficulty of classifying subtle structural differences and its potential for improving diagnostic precision and aiding early intervention in Alzheimer's disease.
-
의류 추천 과정에서 유사 이미지 검색 기능의 역할과 그 효과를 분석하는 데 목적을 두고 있다. 의류 추천 기능은 기존의 유사한 상품 검색 기능의 한계를 보완하며, 의류 플랫폼에서 맞춤형 검색 결과를 제공하는 데 기여한다. 이미지 인식 기술과 딥러닝 알고리즘을 활용하여 사용자의 의도를 파악하고, 상의와 하의를 개별적으로 인식하여 추천하는 방식으로 기존 의류 추천 시스템과 차별화되며, 사용자에게 최적화된 스타일 조합이 될 것으로 기대된다.
-
This paper presents a comparative study of five deep learning models-ResNet50, DenseNet121, Vision Transformer (ViT), Swin Transformer (SwinT), and CoatNet-on the task of multi-label classification of fundus images for ocular diseases. The models were trained on the Ocular Disease Recognition (ODIR) dataset and validated on the Retinal Fundus Multi-disease Image Dataset (RFMiD), with a focus on five disease classes: diabetic retinopathy, glaucoma, cataract, age-related macular degeneration, and myopia. The performance was evaluated using the area under the receiver operating characteristic curve (AUC-ROC) score for each class. CoatNet achieved the best AUC-ROC scores for diabetic retinopathy, glaucoma, cataract, and myopia, while ViT outperformed CoatNet for age-related macular degeneration. Overall, CoatNet exhibited the highest average performance across all classes, highlighting the effectiveness of hybrid architectures in medical image classification. These findings suggest that CoatNet may be a promising model for multi-label classification of fundus images in cross-dataset scenarios.
-
In this study, we propose a self-supervised learning framework for fundus image processing, utilizing both contrastive and generative learning techniques for pre-training. Our contrastive learning approach integrates both image and text modalities through cross-attention mechanisms, allowing the model to learn more informative and semantically rich representations. After pre-training, the model is fine-tuned for downstream tasks, including zero-shot, few-shot, and full fine-tuning. Experimental results show that our method significantly outperforms existing approaches, achieving 15% higher performance in zero-shot, 4.5% in few-shot, and 10.1% in fine-tuning scenarios. The proposed method demonstrates its potential in the medical imaging field, where access to large annotated datasets is often limited. By efficiently leveraging both image and textual information, our approach contributes to improving the accuracy and generalizability of models in fundus image analysis, highlighting its broader applicability in medical diagnostics and healthcare.
-
Detecting vulnerabilities in source code is essential for maintaining software security, but traditional methods like static and dynamic analysis often struggle with the complexity of modern software systems. Large Language Models (LLMs), such as GPT-4, have emerged as promising tools due to their ability to learn programming language patterns from extensive datasets. However, their application in vulnerability detection faces significant hurdles. This paper explores the key challenges limiting the effectiveness of LLMs in this domain, including limited understanding of code context, scarcity of high-quality training data, accuracy and reliability issues, constrained context windows, and lack of interpretability. We analyze how these factors impede the models' ability to detect complex vulnerabilities and discuss their implications for security-critical applications. To address these challenges, we propose several directions for improvement: developing specialized and diverse datasets, integrating LLMs with traditional static analysis tools, enhancing model architectures for better code comprehension, fostering collaboration between AI systems and human experts, and improving the interpretability of model outputs. By pursuing these strategies, we aim to enhance the capabilities of LLMs in vulnerability detection, contributing to the development of more secure and robust software systems.
-
Byeong-Hoon Park;Ji-Yun Min;Ye-Ji Kim;Yeong-Jun Hwang;Jong-Ho Lee;Ki-Hwan Kim 764
문서의 디지털화 수요가 급증함에 따라, 정보 추출 및 구조화 연구의 중요성이 커지고 있다. 본 연구는 병합 셀이 포함된 테이블 이미지를 HTML 코드로 변환하기 위해 Vision Language Model의 파인튜닝 학습과 실험을 지휘통제 지능정보 플랫폼 기반에서 진행하였다. 베이스 모델은 MiniCPM-V 2.6을 사용하였으며, 학습 데이터는 TNCR과 PubTables-1M 데이터셋 일부를 수정하여 표 이미지-HTML 코드 쌍으로 구성하였다. 성능 평가는 TEDS 지표를 사용하였으며, 파인튜닝 모델은 100개의 테스트 데이터에 대해 93.15%의 TEDS 점수를 기록하여 베이스 모델(78.63%)보다 향상된 성능을 보였다. 본 연구는 병합 셀이 포함된 테이블 구조 인식 분야 연구에서 파인튜닝을 통해 Vision-LLM의 성능을 향상시킬 수 있음을 보여주는 사례로, 다양한 문서 디지털화 작업에 실제적인 기여를 할 수 있을 것으로 기대된다. -
Byeong-Hoon Park;Beom-Seok Seo;Myeong-Gyu Lee;Yeong-Jun Hwang;Ki-Hwan Kim 768
본 연구는 국방 AI 플랫폼 기반 변화 탐지 서비스를 제안한다. 국방 AI 플랫폼의 특성을 반영하여 객체의 출현, 소실, 이동을 정량화하고, 이를 통해 장면의 동적 변화를 평가하는 변화율을 정의한 후, 해당 변화율을 적용한 서비스를 설계하였다. 변화 탐지 서비스는 학습 없이 다양한 환경에서 실시간 적용이 가능하며, 사건의 중요도를 효율적으로 분석할 수 있다. YOLOv10 탐지 모델과 추적 모델을 사용한 실험을 통해 변화율 기반 변화 탐지 서비스의 실시간 처리 가능성을 검증하였으며, 복잡한 상황에서도 효과적인 변화 탐지가 가능함을 확인하였다. -
본 논문은 디지털 콘텐츠의 무단 사용을 방지하기 위해 GAN과 FGSM을 결합한 적대적 워터마킹 기법을 제안하는 것을 목표로 한다. 이 기법은 GAN을 사용해 시각적으로 인지하기 어려운 워터마크를 생성하고, FGSM을 통해 AI 모델이 이 워터마크를 학습하지 못하도록 방해한다. 제안된 기법의 효과를 SSIM과 Probability Shift & MAX Probability Shift 지표를 통해 분석하여, 디지털 콘텐츠 보호에 대한 새로운 접근 방식을 제시하고자 한다.
-
게임의 난이도는 게임 디자인에서 중요한 요소로, 사용자의 몰입과 만족도를 크게 좌우한다. 전통적인 게임 난이도 조절은 일반적으로 기획자의 경험과 판단에 의해 이루어진다. 그러나 기존의 난이도 조절 방식은 다양한 사용자의 개별 실력 수준을 정밀하게 반영하는 데 한계가 있다. 본 연구에서는 GPT 를 활용하여 게임의 난이도를 동적으로 조절하는 방법을 제안한다. 사용자의 게임 플레이 정보를 수집하고 GPT 로 사용자의 게임 실력을 분석하고 평가한다. 평가를 바탕으로 게임의 난이도와 관련된 요소들을 조절한다. 이를 통해 GPT 가 게임 디자인 도구로서 가지는 잠재력을 탐구한다.
-
본 연구에서는 CIFAR-10 데이터셋을 활용해 세 개의 합성곱 레이어와 완전 연결 레이어로 구성된 CNN 모델을 학습하고 평가하였다. Adam 옵티마이저와 교차 엔트로피 손실 함수로 학습된 결과, 약 75%의 테스트 정확도를 달성하였다. 간단한 CNN 아키텍처도 소규모 데이터셋에서 효과적인 이미지 분류가 가능함을 확인하였으며, 향후 더 복잡한 모델과 기법을 통해 성능을 개선할 수 있음을 제안한다.
-
본 연구는 이미지 복원에서 국소적인 블러 영역을 감지하고 효과적으로 복원하기 위한 방법을 제안한다. 기존 DeblurGANv2가 전체 이미지를 대상으로 복원하는 데 반해, 본 연구에서는 Laplacian 변환을 활용한 블러 감지 모듈을 도입하여 블러 영역을 정확히 탐지하고 복원한다. 제안한 방법은 블러 감지 과정을 통해 생성된 Blur Mask를 활용하여 복원 모듈에 입력하고, 이로써 불필요한 연산을 줄이고 복원의 정확도를 높인다. 향후 연구에서는 다양한 블러 유형에 대한 적용 및 모델 최적화를 통해 제안한 방법의 범용성과 성능을 향상시킬 계획이다.
-
연합 학습은 최근 기계 학습 분야에서 발생할 수 있는 다양한 문제들을 해결했지만, 학습의 주체가 서버에서 클라이언트로 이동함에 따라 클라이언트 장치의 컴퓨팅 자원의 한계가 새로운 문제로 부각되었다. 클라이언트의 장치는 중앙 집중적 서버와 비교하여 상대적으로 적은 컴퓨팅 자원을 보유하고 있으며, 특히 엣지 디바이스와 같은 클라이언트의 장치는 현저히 적은 컴퓨팅 자원으로 인해 일반적인 연합 학습 절차에 효과적으로 참여하기 어렵다. 본 연구는 클래스 계층 구조와 계층적 전문가 혼합을 통해 엣지 디바이스가 연합학습에 효과적으로 참여할 수 있도록 하였다. 이 기법은 CIFAR-100 과 Tiny ImageNet 데이터셋을 통해 효용성을 입증하였으며, 기존 기법과 비교해 라운드당 학습 시간과 메모리 사용량이 낮음을 보인다.
-
광학 투과형 헤드 마운트 디스플레이(OST-HMD) 환경에서 제한된 시야각 문제를 해결하기 위한 새로운 접근 방식인 구형 레이어 비주얼 가이드(SLSV Guide: Sphere Layer Spatial Visual Guide)를 제안한다. SLSV 가이드는 Montello의 공간 스케일 이론을 기반으로 하여, 사용자 중심의 3차원 공간 구조화를 통해 증강현실(AR) 콘텐츠를 효과적으로 전달하는 방식을 제시한다. SLSV 가이드의 주요 특징으로는 중심 시야 활용, 동적 정보 제공, 다중 감각 활용, 단계적 정보 제공, 그리고 컨텍스트 인식적 접근이 있다. 이러한 특징들은 OST-HMD의 기기적 한계를 극복하면서도 AR 환경의 3차원적 특성을 충분히 활용할 수 있도록 한다. 본 연구는 기존의 Level-of-Detail 개념과 공간 UI 전환 메커니즘 연구를 확장 적용하였으며, 웹 개발에서의 반응형 디자인 원칙을 AR 환경에 적용하였다. 이를 통해 공간 인식 향상, 정보 과부하 방지, 다양한 환경에 대한 적응성, 그리고 직관적인 내비게이션 제공 등의 장점을 가진 새로운 AR 가이드 방식을 제시한다.
-
Subeen Cho;Sungjin Park ;Bum-Jae You;Jung-Min Park 792
이 논문은 혼합현실공간을 통해 원격의 로봇을 제어할 수 있도록 원격작업로봇이 놓인 원격 작업장과 동일한 XR 공간 환경을 구축하고, 구축한 XR 공간을 통해 작업자가 원격으로 로봇을 제어할 수 있도록 원격조작 작업 명령을 생성하고 원격 제어 작업 수행의 결과를 실시간으로 확인하도록 하기 위한 인터페이스를 구현하였다. -
본 논문은 고령화로 인해 급증하는 치매 환자 수에 대응하기 위한 웹 기반 화상채팅을 통한 치매 조기 진단 및 예방 서비스를 제안한다. 이 서비스는 WebRTC 를 이용해 노인과 돌봄 제공자 간의 영상 데이터를 수집하고, AI 기반 분석 모델로 치매 초기 징후를 감지한다. 이를 통해 제안하는 서비스는 치매를 조기에 발견함으로써 관리 비용 절감을 목표로 하며, 생성형 AI 를 활용한 예방 퀴즈와 관련 정보를 제공하여 치매 예방에도 기여한다. 서비스는 데이터 수집, 저장, 분석, 시각화의 4단계로 구성되며 최신 기술을 활용해 효율적이고 정확한 치매 진단을 지원한다. 제안하는 서비스는 향후 서비스의 확장성과 모델의 정확성을 높이기 위한 추가적인 연구와 개선이 필요하다.
-
현대 사회에서 지적 장애인을 위한 맞춤형 기술의 필요성이 점점 더 강조되고 있다. 본 논문에서는 경도 및 중등도 지적 장애인을 대상으로 한 AI 기반 프롬프트 엔지니어링 방법을 제안한다. GPT 와 같은 대규모 언어 모델(LLM)을 활용하여 사용자에게 쉽게 이해할 수 있는 맞춤형 응답을 제공하며, 프롬프트 엔지니어링 과정에서 다양한 패턴을 적용하여 지적 장애인이 위험 상황에서 적절한 결정을 내릴 수 있도록 돕는다. 본 연구는 이러한 기술의 효과를 논의하며, 프롬프트 엔지니어링이 지적 장애인의 일상생활에 실질적인 도움을 줄 수 있음을 제시한다.
-
본 연구는 기존 키오스크의 사용자 접근성의 한계를 극복하고 사용자에게 직관적이고 개선된 경험을 제공하는 음성 대화형 키오스크 애플리케이션 개발에 중점을 둔다. 음성 인식을 통해 사용자와 상호작용하고, 대화 내용을 텍스트로 표시해 재확인할 수 있도록 하는 인터페이스를 제공하여 키오스크 이용자의 접근성과 사용성을 향상시켰다. 특히 키오스크 사용에 어려움을 겪는 고령층의 편의를 증진하여, 소비자층을 원활히 확대하는 데 기여할 것으로 기대한다. 사용자는 대화를 통해 주문과 조작을 할 수 있도록 하여, 기존에 복잡한 인터페이스를 단순화하고, 메뉴 추천, 재료 조회 등의 기능을 통해 사용자의 접근성을 높인다. 또한, 가게 운영 측면에서도 효율성을 높일 수 있다. 혼잡 시간대에 대한 추가 인력 소요비용을 절감할 수 있을 것이다.
-
Se-Jin Jeong;Min-Gyu Kim;Ji-Ho Seon;Sang-Hoon Kim 803
본 논문에서는 '편심 메커니즘'이라는 독창적인 로봇 기구설계 구조를 선보이고, 실제 구현을 바탕으로 그 효과를 검증한다. 비평탄한 지형에서 평형을 유지하고 주파할 수 있는 소형 바퀴형 지능 로봇을 제안하여, 바퀴형 로봇의 구조적 한계를 뛰어넘을 수 있는 유연성을 제시하고자 한다. -
Mira Mauleshova;Milan Houska;Shivani Kolekar;Kyungbaek Kim 805
This paper is dedicated to automated Knowledge Unit extraction by employing Prompt Engineering within the Generative AI models. The experiment is conducted analyzing the ability of GPT-4 to extract Knowledge Units' elements in an automated manner by the created prompts. Verification is proceeded by comparison among results from GPT-4 and the elements of Knowledge Units coming from the original methodology of knowledge-structured texts' creation. The results of the research prove that thanks to the created prompts, Knowledge Units are successfully extracted from unstructured text. -
Hye-Chang Hong;Sang-Woo Jeon;Eun-Seo Choi;Mi-Hwa Song 809
본 연구는 AI 기술을 활용하여 언어적, 비언어적 커뮤니케이션을 종합적으로 분석하는 혁신적인 면접 준비 시스템을 제안한다. 비언어적 행동 분석 기능을 통합하여 면접자에게 다양한 질문에 대한 답변 연습, 즉각적인 피드백, 그리고 객관적인 행동 분석을 제공한다. -
웹3.0 시대의 다양한 응용 분야에서 활용되는 행렬 곱셈 연산에 대하여 최신 웹 표준 기술인 WebAssembly 및 WebGPU 표준을 적용하여 알고리즘을 구현하고 실행 성능을 평가한다. 실험 결과 작업의 크기가 커질수록 병렬화 효과로 인해 WebGPU 코드가 JS에 비해 최대 30배 빨라졌다. 또한 JS 코드에 비해서 WASM 코드의 실행 속도가 빠르며, 일부 작업의 크기가 작은 경우에는 WASM 및 WebGPU에서 초기 로딩 타임과 데이터 복사 작업에 따른 오버헤드가 있음을 확인하였다.
-
Ji-Su Jeon;Jun-Seo Park;Yun-Chang Choi;Youn-Jeong Lee 815
본 연구는 대학생들의 학사 정보 접근성을 향상시키기 위해 학교 챗봇을 개발하는 것을 목표로 하였다. 기존 RAG 방식의 정확도 한계를 극복하고자, HyDE 기법을 공지사항 데이터셋 특성에 맞게 확장하였다. 각 문서의 핵심 내용을 요약한 제목이 포함된 데이터셋의 구조를 활용해, 사용자의 질문에 대한 가상의 답변과 가상의 제목까지 함께 생성하는 확장된 접근법을 제안했다. 이는 기존의 Raw Query 방식 대비 약 90.45% 검색 정확도 향상을 이루었다. 본 연구의 확장된 HyDE 기법은 학교 챗봇을 비롯한 다양한 시스템에 적용할 수 있어 정보 접근성을 크게 개선할 것으로 기대할 수 있다. -
Cheol-Hyeon Park;Ram-Un Kim;Jong-Geun Moon;Woo-jin Jeong 817
모아뷰는 기존 PowerPoint 기능을 유연하게 활용하면서, 혁신적인 3D 모델링 기술을 통합한 프레젠테이션 플랫폼이다. 이 플랫폼은 2D 와 3D 자료를 자연스럽게 결합하여 콘텐츠를 더욱 포괄적이고 시각적으로 제시할 수 있다. 사용자들은 다양한 3D 오브젝트를 손쉽게 삽입하고 편집할 수 있으며, 3D 오브젝트 생성에 어려움을 겪는 이들을 위해 AI 를 통해 텍스트와 이미지 입력만으로도 다양한 3D 오브젝트를 자동으로 생성할 수 있는 기능을 제공한다. -
Sim Woo-jin;Ahn Je-hoon;Moon Byeong-hyeon;Oh Dong-hyeon 819
스마트 미터링 기술은 전력 소비를 실시간으로 모니터링하고 분석하여 에너지 효율성을 극대화하며 전력망의 안정성을 강화하는 중요한 역할을 한다. 최근 정보통신기술(ICT)의 발전으로 인해 스마트 미터링 시스템의 성능이 크게 향상되었으며, 이를 통해 보다 정교한 전력 관리가 가능해졌다. 그러나 이러한 기술이 제공하는 이점에도 불구하고 대규모 데이터 처리, 보안성, 데이터 활용의 효율성 문제는 여전히 해결해야 할 주요 과제로 남아 있다. 데이터 처리와 저장의 효율성을 높인다. -
Jongwon Cheon;Junseop Go;Seong-Yeoup Jeong;Jaehyun Moon 821
This paper describes an automated fruit sorting system using Raspberry Pi and Arduino to classify apples and oranges by freshness, using EfficientNet-B0 for detection. It offers expandability and addresses labor shortages in agriculture through automation. -
Mi-Hyeon Kim;Ji-Woo Ryu;Seo-Young Byun;Joung-Min Kim 823
본 시스템은 개인 맞춤형 스마트 미러로, 날씨와 일정 등 기본적인 기능만 제공하는 스마트 미러와 달리 전신을 촬영하여 신체 치수를 측정하고 체형을 분석한다. 또한 그 체형에 어울리는 의류를 도출하여 색배합 알고리즘과 날씨를 고려한 코디를 생성하고 추천한다. 이때 사용자는 웹사이트를 이용하여 스마트폰으로 본인의 의류 데이터를 스마트 미러에 직접 등록할 수 있다. -
Ga-Eun Kim;Yu-Jin Kim;Eun-Ji Shin;Seung-Min Shin 825
본 연구는 TFLite 경량화 AI 모델을 활용한 자동 쓰레기 분리수거 시스템을 제안한다. 라즈베리파이 환경에서 아두이노를 통해 두 개의 로봇팔을 제어하여, 기존 방식보다 작업 효율성을 높였다. 쓰레기 종류별 데이터 분포를 일정하게 맞추고, 고품질의 데이터를 사용함으로써 모델의 인식 성능을 크게 개선하였다. 실시간 객체 인식 테스트 결과 평균 정확도는 90% 이상에 달했다. 이러한 과정을 통해 자동 분리수거 시스템의 정확성과 효율성을 한층 더 높일 수 있을 것으로 기대된다. -
Yun-Ji Yun;Gyu-ri Park;Ji-Won Han;Hyeon-Joo Lee;Sang-Oh Yoo 827
본 논문은 에너지 자원에 대한 소비 부담 문제를 해결하기 위해 IoT 기반의 스마트홈 플랫폼 '엣지(E-dge)'를 제안한다. 엣지(E-dge)는 아두이노와 ChatGPT API를 활용해 사용자의 환경과 에너지 사용 패턴을 분석하고, 맞춤형 절약 솔루션을 제공하며 원격으로 가전 기기를 제어한다. 더불어 새싹 레벨 시스템으로 사용자의 에너지 절감을 유도한다. -
본 논문은 IoT 통신의 안전성을 확보하기 위해 IoT 통신 기능의 중추 기능인 MQTT 프로토콜을 중심으로 안정성 체크 시뮬레이션 프로그램을 개발하는 것으로, 고가용성 IoT 네트워크에서 MQTT 핵심 요소를 진단하고 대처하는 프로그램을 적용하여 안전한 운영을 도모하는 것을 목표로 한다. 개발 과정에서 통합 테스트와 기능 검증을 통해 문제점을 보완하고, 이를 통해 IoT 네트워크의 안정성을 시뮬레이션하여 애플리케이션과 서비스를 구축하고자 한다.
-
In-seok Kang;Bo-song Kim;Sol-bin Park;Geon-woo Yoon;Jun-hyeong Cho;Hyuck-jun Suh 831
이 연구는 LLVM IR 을 활용한 보안 취약점 탐지의 새로운 접근 방식을 제시합니다. Juliet Test Suite 의 CWE-121 Stack-based Buffer Overflow 데이터를 사용하여 Word2Vec 으로 코드를 벡터화하고 LSTM 모델로 학습했습니다. 모델 성능은 정확도 90%, 정밀도 87%, 재현율 93%, F1 스코어 90%로 평가되었습니다. 향후 다양한 보안 취약점을 다룰 수 있는 다중 분류 모델로 확장 가능성을 제안합니다. -
Seo Ji-Yun;Oh Seung-Jun;Jang Hwi-Young;Lim Jeong-Rak 833
최근 사이버 공격의 급증으로 기존 보안 솔루션의 한계가 드러나고 있다. 본 논문에서는 Suricata, iptables, OSSEC를 통합하여 사이버 공격을 실시간으로 탐지하고 적시에 차단하는 효율적인 보안 솔루션을 제안한다. 또한 Elastic Stack을 활용하여 로그 데이터를 분석 및 시각화하여 보안 상황을 직관적으로 파악하고 신속한 대응을 가능하게 한다. 모의 공격 시나리오를 통해 시스템의 성능을 평가하였으며, 그 결과 본 솔루션이 네트워크와 시스템의 보안을 강화하고 운영 효율성을 향상시킴을 확인하였다. -
Da-Bin Kang;Min-Jin Kang;Han-Na Kim;Hye-Won Kim;Yun-Ji Lee;Sung-Wook Kim 835
개인정보 보호의 중요성이 증가함에 따라 기업의 개인정보 처리방침을 효과적으로 분석하고 개선하기 위한 방법을 제시하고자 한다. 개인정보 처리방침 평가 관련 데이터를 기반으로 RAG(검색 증강 생성, Retrieval-Augmented Generation) 기술과 LLM을 접목해 개인정보 처리방침 평가를 보조할 수 있는 AI 서비스를 개발한다. 이로서 평가위원들은 반복적인 노동에서 벗어나 전략적인 작업에 집중할 수 있으며, 각 기업은 개인정보 처리방침을 점검할 수 있으므로 전반적인 수준 향상이 기대된다. -
Juyoung Lim;Hanul Kim;Jimin Hwang;Seoyeon Kang;Juah Ryu 837
본 연구는 대학생 러너들을 위한 NFT 기반 러닝 커뮤니티 플랫폼 UniRun의 설계와 구현을 다룬다. 블록체인 기술을 활용하여 사용자가 ERC-20 토큰으로 보상받고, ERC-721 NFT로 대학별 마스코트를 소유할 수 있다. 본 연구는 설문조사와 인터뷰를 통해 사용자 요구사항을 분석하고, 개인 목표 설정, NFT 보상 구조, 대학 간 협업 등 플랫폼의 주요 기능을 제시하여 차별화된 러닝 문화를 검증한다. 또한, 단순한 러닝 기록 플랫폼을 넘어, 대학생들이 소통하고 함께 성장하는 혁신적인 커뮤니티 플랫폼으로서 새로운 모델을 제시한다. -
Jong-Hee Son;Jong-Won Baek;Yoon-Ho Shin;Chae-Min Hwang;Yun-Seok Nam 839
위성측위시스템(GNSS, Global Navigation Satellite System)은 지구 궤도 상에 위치한 위성군을 이용하여 전 지구상에서 사용자의 위치를 제공해 주고 있다. 실외 자율주행로봇 또는 자율주행차량의 경우 기존에 알고 있지 않은 환경에서 대상의 절대 위치 확보 시 용이하고 효율적인 주행을 가능하게 하므로, 이러한 영역에서 GNSS의 활용이 많은 도움을 줄 것으로 기대된다. 본 논문에서는 RTK(Real-time Kinematic Positioning) 기술을 이용하여 얻은 보정된 GNSS 위치 정보를 획득하고, 이 정보를 근간으로 자율주행로봇의 경로계획에 사용하는 방법을 제시한다. 그리고 이 방법을 기반으로 제작된 자율주행로봇으로 실시한 실험을 통해 제안한 방법의 적합성을 확인한다. -
YeaJin Lee;Sang-yeop Lee;Jae-hyeong Byun;Cha Dong-hyuk 841
본 연구는 Rocker-Bogie 메커니즘과 PID 제어를 적용한 험지 주행 로봇을 개발하였다. 로봇은 불규칙한 지형에서도 안정적인 주행과 최대 50kg의 물품 운송이 가능하다. 이 기술은 산업 물류와 재난 구조 작업에서 활용될 수 있다. -
Su-Young Jung;Sung-hyun Park;Chae-eun Lim;Ga-yeong Lee;Jaehyun Moon 843
본 논문은 일상생활 속에서 카메라를 통해 사용자의 표정을 분석하여 감정을 인식한다. 분석한 감정을 바탕으로 맞춤형 힐링 콘텐츠를 제공한다. 이 시스템은 인공지능. 딥러닝, H/W, 애플리케이션 등 여러 기술을 활용하여 사용자에게 모바일 앱 형태로 서비스를 제공한다. 바쁘게 돌아가는 현대 사회에서 자신의 감정을 감추고 살아가는 사람들이 많다. 그런 사람들이 자신의 공간에서라도 정확한 감정을 인식하고, 힐링을 받는 것을 목표로 한다. -
Min-Ji Kim;Hyun-Ji Kim;So-Hee Lim;You-Jeong Jang;In-Sang Park 845
최근 기업 및 기관은 온-프레미스에서 클라우드로 전환이 급증하였다. 이에 따라 기존의 경계보안장비 방식이 아닌 제로 트러스트 시스템 구축이 확대되고 있다. 제로 트러스트 시스템은 MFA 인증을 통해 접근 인증이 된 사용자만 리소스 접근이 가능해져 보안 강화를 더 용이하게 할 수 있다. 각 기업에서 관리자는 대시보드를 통해 실시간으로 시스템을 모니터링 할 수 있으며, 사용자들은 자동화된 시스템을 통해 리소스를 편리하게 사용할 수 있도록 구성했다. -
Song-Hyeon Lee;Joo-Hee Hwang;Ye-Jin Kim;Yong-Man Lyu 847
가정에서 측정되는 신장은 사용자의 부정확한 자세로 인해 오차가 발생할 가능성이 크며, 이에 따라 정확한 신장 측정이 어렵다. 본 논문에서는 IMU(Inertial Measurement Unit)센서를 활용하여 사용자의 자세를 실시간으로 모니터링하고, 음성 피드백을 제공하여 올바른 자세를 유지하게 함으로써 신장 측정의 오차를 줄였다. 실험 결과, 개발된 기기를 사용한 신장 측정이 기존 측정 방식보다 높은 정확성을 보임을 확인하였다. 이 시스템은 향후 가정 및 의료 환경에서 신장 측정의 신뢰성을 높일 수 있을 것으로 기대된다. -
본 프로젝트에서는 하나의 모터로 두 개의 너트가 반대 방향으로 움직이는 이중 나사선 구조를 '3D 프린팅'을 이용하여 설계하였다. 또한, 이 과정에서 필라멘트 특성상 너트가 헛도는 문제를 해결하기 위해, 너트에 금속 원기둥을 삽입하였다. 이를 통해 수직으로 고정하는 보강 구조를 추가하여 신뢰성을 크게 향상시킨 제어 메커니즘을 구현하였다.
-
Su-Hyeon Kim;Jiyoon Kim;Dayon Hong;Gwangil Jeon;Young J. Rho 851
본 논문에서는 포스트 코로나 이후 해외여행 수요의 증가와 함께 여행 앱 사용자의 수요가 늘어난 상황에서, 여행 준비 과정의 복잡성을 해결하기 위한 통합 여행 서비스를 개발하였다. GPT 4o를 이용하여 사용자 맞춤형 여행 계획을 생성해주고, 아마데우스 API를 활용해 실시간 항공권 검색 기능을 제공하며, 여행 중에는 OCR 기술을 활용해 영수증 경비 관리, 여행지의 실시간 날씨와 환율 정보 등을 제공한다. 또한, 여행 후 방문한 장소와 지출 내역을 쉽게 확인할 수 있도록 시각화하였다. 이를 통해 복잡한 여행 준비 과정을 간소화하고, 사용자 맞춤형 여행 계획을 지원하며 여행 전반에 걸쳐 하나의 앱으로 사용할 수 있도록 하는 사용자 편의성을 제공하고자 하였다. -
본 프로젝트는 효율적인 일정 조을 돕는 AI 봇인 한끝봇을 개발해 사용자의 피로도를 줄이는 것을 목표로 한다. AI 챗봇이 일정 조율을 대신 처리한다. 이를 통해 기존 일정 조율 방식의 단점을 보완하고, 간편하고 스마트한 일정 관리 솔루션을 개발하고자 한다.
-
Chae-won Lee;Min-Ha Kim;Ji-Yun Han;Su-Been Hong;Soo-Kyung Shin 855
본 연구는 FPGA 가속기를 활용하여 실시간으로 차선을 검출하고, 이를 유지하는 시스템을 개발한다. 차선 검출에는 Sobel Filter 와 Hough 변환을 이용하며 실시간을 위한 데이터 처리 속도 개선에는 FPGA 의 PL Logic 과 메모리 최적화 기법을 사용한다. 이로써 설치가 용이한 부착형 방식의 LDWS 를 통해 낮은 수준의 자율 주행을 가능케 한다. -
본 논문에서는 메카넘휠을 활용한 강화학습 기반 자동주차 시스템을 제안한다. Q-learning 알고리즘을 사용하여 다양한 주차 환경에서의 주차 경로를 최적화하였으며, 실시간으로 로봇이 목표 주차 구역까지 정확하게 이동할 수 있도록 설계하였다. 본 연구는 강화학습이 적용된 주차 시스템의 실효성을 보여주며, 향후 실제 환경에서의 적용 가능성을 제시한다.
-
Minjin Cho;Minji Kim;Yu-Jin Kim;Da-Yeon Chung;Myeong-ju Son;Gi-Young Baek 859
최근 자율주행 기술에 대한 관심과 함께 고가의 하드웨어와 소프트웨어의 복잡성이 자율주행 자동차의 상용화를 가로막고 있다. 이에 본 연구에서는 해당 문제점들을 보완하기 위해 FPGA의 유연성과 고성능이라는 이점으로 자율주행 자동차 시스템을 최적화하였다. -
Min-Han Lee;Ki-Woong Nam;Su-Bin Kim;Jun-Hwan Woo 861
응급상황, 도로 정체 시 자동으로 중앙분리대가 이동하는 시스템이다. 현재 가변차로의 차선 시 인성 문제점을 AI 기술과 Jetson TX2 를 활용해 교통량을 분석하고, 모터를 이용해 중앙분리대를 이동시키는 가변차로 시스템으로 해결하고자 한다. -
유동 인구가 많고 다양한 서비스를 필요로 하는 병원에서는 여러 기능을 통합적으로 수행할 수 있는 토탈 서비스 로봇이 필요하다. 자율주행, 얼굴인식, 음성 처리기술 등을 적용한 AI 자율주행 토탈 서비스 로봇을 도입함으로써 의료진의 업무 부담을 줄이고, 병원의 운영 효율성을 높이며, 전반적인 서비스의 질을 향상할 수 있다.
-
Ye-Jin Kim;So-Hyun Son;Su-Hyun Oh;Hyeon-Jin Lee;Ye-Ji Jang 865
본 연구는 콘텐츠 플랫폼에서 제작자와 소비자 간의 건설적인 소통 촉진을 위해 악플을 순화하여 유의미한 피드백으로 전환하고, 댓글을 카테고리화하여 다양한 의견 교환을 가능하게 한다. 이를 통해 악플로 인한 부정적 영향을 최소화하고, 생산적인 콘텐츠 제작 및 소통 문화를 형성하고자 한다. -
도로의 노후화로 포트홀 발생 빈도가 늘어나고 그로 인해 발생하는 사고와 피해액 또한 수억 원대에 이르고 있다. 포트홀 문제를 해결하기 위해 AI 기술, 특히 Image Processing을 이용한 기술이 많이 사용되고 있다. 하지만 실시간으로 영상을 촬영하면서 포트홀을 감지하는 방식은 많은 데이터 처리량과 비용 문제로 인해 일반 운전자들이 쉽게 사용할 수 없다. 본 연구에서는 이러한 문제를 해결하기 위해 두 단계로 나누어 포트홀을 감지하는 방법을 제시한다. 첫 번째 단계에서는 도로 주행 시의 3축 기울기 변화량 값을 분석하여 포트홀임을 구분하고 해당 위치의 사진을 GPS 좌표와 함께 촬영 및 저장한다. 두 번째 단계에서는 촬영한 사진으로부터 OpenCV의 Yolov5를 이용하여 딥러닝을 통한 포트홀을 감지한다. 제안한 시스템으로 데이터 처리량을 줄이고 비용을 절감해 많은 운전자들에게 포트홀 안전 시스템을 보급화 할 수 있다.
-
Tae-San An;Yong-Woo Jeong;Jae-Won Park;Jae-Hyeok Cho 869
2030년까지 재생 에너지 비율이 30% 이상으로 높아질 것으로 예측되고, 태양광은 그중 주요 에너지원으로 적극 확대되고 있다. 따라서 기존의 고정형 태양광 발전 대신 양축 추적식 태양광 발전기를 통해 에너지 효율을 높이며 기후 변화에 따른 태양광 발전기의 안정성을 위해 다양한 Mode를 구현하고, AI 기술을 접목한 발전량 예측 서비스와 전력거래 시장을 구축한다. -
Woo-Je Kim;Jin-Mo Lee;Yu-Seong An;Gyu-bin Jung; Hyung-hoon Kim;Seong Tak Woo 871
언어장애에 있어 구음 운동 촉진은 구강내 혀를 비롯하여 입 주변 근육 등 다양한 운동 요소가 요구된다. 기존의 구음 운동 촉진 기구들은 단순히 입에 넣어 운동하는 것이 국한되어 있다. 본 연구에서는 기존의 촉진 기구들이 가지는 한계를 극복하고 사용자의 자기 주도적인 운동과 훈련의 척도를 실시간으로 피드백 받을 수 있는 기기를 실험에 적용하였다. 특히, 개개인의 구음 운동 가동범위를 지정하기 위하여 simple moving average filter기반의 개인화 calibration 기능을 구현하였다. 4명의 피험자들의 실험결과를 통해, calibration단계에서의 오차율을 최소화할 수 있는 filter window size와 moving point의 parameter를 도출하였다. -
Mo-Se Park;Dong-Hun Kim;Seo-Yeon Kwak;Seo-Eun Seo;Chae-Min Jin 873
AI는 콘텐츠 제작에서 유용한 도구지만, 감정적 깊이와 창의성이 미흡하다. 본 논문은 AI 프롬프트튜닝을 활용해 AI와 작가가 협력하는 시나리오 창작 시스템을 개발한다. AI는 시나리오를 생성하고, 반복적 작업과 데이터 분석을 하며 작가는 감정적, 창의적 요소를 융합해 상호작용한다. 이 협력은 콘텐츠의 완성도를 높이고 장기적으로 성공 가능성을 높인다. -
Kyulee Sim;Ye-eun Yang;Ha-eun Yoo;Seung-eun Lee;Soyoon Jeong 875
코로나 펜데믹을 겪으면서 사회적 거리두기와 같은 제약으로 인해 일생상활의 지장이 생기면서 사람들은 가상공간에서의 만남에 대해 주목하기 시작했고, 상담에 대한 수요가 증가하였다. 따라서 기존 대면의 상담 서비스를 대체할 효율적인 기술로 AI 기술기반 아바타 비대면 심리상담 메타버스 플랫폼을 연구하였다. -
Jun-Young Ok;Jung-Hwan Yu;Jong-Wan Won;Dong-Sung Jung 878
물류 창고 운영에서 효율적인 재고 관리, 공간 관리 및 비용 절감은 주요 과제이다. 본 논문은 위와 같은 기존의 창고 방식의 주요 문제점을 해결하여 물류 창고의 운영 효율성을 향상시킬 수 있는 스택형 격자 물류창고 로봇 시스템을 소개한다. 로봇이 상부 레일을 통해 물류 박스를 이동시키는 방식을 도입하여 기존의 비효율적인 공간 낭비와 인건비 문제를 해결하였으며, 이를 통해 더 효율적인 창고 운영이 가능해진다. 이 시스템을 도입하여 국내 물류 기업들의 경쟁력을 높이는 데 기여할 수 있을 것으로 예상된다. -
Gyu-Min Lee;Gean-Tae Kim;Young-Wook Lee;Hyun-Seo Kim;Gyu-Min Park 880
물류 자동화 과정에 핵심기술증 하나인 AMR 자동화 이동로봇을 Tractor-Trailer Type 으로 제작해 기존 물류창고에 있는 다양한 트레일러들을 이동화는 자동화 과정을 개발하였다. Aruco Marker 를 이용한 Trailer 결합과 Tractor-Trailer 의 주행 안정성을 강화하였다. -
미국 중앙은행 커뮤니케이션은 경제 정책과 시장 기대에 영향을 미치는 중요한 도구이다. 본 연구는 대형 언어 모델(LMM)과 인공지능(AI)을 결합하여 Jerome Powell 연방준비은행 의장의 연설이 이후 미국 금리 및 소비자 행동에 미치는 영향을 분석하는 새로운 접근 방식을 제시하고자 한다. 자연어 처리(NLP) 기술을 적용하고 이를 머신 러닝 모델과 통합함으로써 Powell 의 공개 성명에 따른 시장 반응과 소비자 인플레이션 기대를 예측하고자 한다. 본 연구 결과는 AI 기반 정서 분석이 거시 경제 동향에 대한 귀중한 통찰력을 제공하고 중앙은행 관찰자, 정책 입안자 및 시장 분석가를 위한 강력한 도구 역할을 할 수 있음을 보여주고자 한다.
-
최근 배드민턴 동호인의 증가와 함께 경기 후 셔틀콕 수집 작업의 번거로움이 문제로 제기되고 있다. 본 논문에서는 이러한 문제를 해결하기 위해 AI 기반의 셔틀콕 자동 수집 로봇 시스템을 제안한다. 효과적인 작동을 위해 YOLOv8 모델을 이용해 셔틀콕을 빠르게 인식하고, Turtlebot3 를 활용해 자동으로 셔틀콕을 수집하는 하드웨어 시스템을 구축하였다. 모델 학습에는 1295 장의 데이터를 사용하여 mAP50-95 0.963 수준의 셔틀콕 인식 성능을 달성했으며, 실제 테스트에서 셔틀콕을 정확하게 인식하고 수집하는 결과를 얻었다.
-
Si-Won Kim;Jong-Won Shin;Bo-Seok Kim;Yu-Jung Jeon;Jin-Ho Shin 886
본 논문에서는 물류 로봇에 활용할 수 있는 자율 주행 이동 매니퓰레이터 시스템을 개발하였다. 본 로봇 시스템은 자율 주행 이동 로봇 베이스에 로봇 매니퓰레이터를 탑재하여 스테레오 카메라로 객체 인식 및 좌표 추정을 수행하였으며, ROS 기반으로 통합 로봇 시스템을 구축하였다. -
Seok-Young Chang;Do-Hyun Kang;In-Seok Park;Jeong-Pung Kim 888
주차 관리 서비스의 개발은 제한된 주차 자원을 효율적으로 활용하고, 실시간 주차 수요를 파악하며, 사용자에게 편리한 서비스를 제공하는 데 중요한 역할을 한다. 본 논문에서는 AI 기반의 딥러닝 모델과 영상 처리 기술을 결합하여 빌라의 주차 공간을 효율적으로 관리하는 시스템을 제안한다. 이 시스템은 YOLOv8를 활용하여 차량 객체를 실시간으로 감지하고, OpenCV를 사용하여 주차 공간의 빈자리를 인식한다. 또한, 예상 출차 시간을 강화학습 기반의 알고리즘을 이용하여 사용자에게 제공하며, 이를 통해 주차 공간의 효율적 이용을 극대화한다. 서버는 주차장 내 주차 현황과 출차 시간을 실시간으로 갱신하며, 관리자는 웹 플랫폼을 통해 데이터를 모니터링 및 관리하고, 사용자는 웹 또는 모바일 애플리케이션을 통해 주차 공간 조회와 차량 예상 출차 시간을 제공받을 수 있다. 다양한 실험을 통해 제안된 시스템의 성능과 정확성을 확인하였으며, 이를 통해 주차 관리의 자동화와 편리성 향상에 기여할 수 있을 것으로 예상된다. -
Jeong-Ho Ahn;Mong-Keun Chung;Hyun-Il Ahn;Hyun-Seo Kim;Dae-Gyeom Lee 890
틸트로터형 VTOL 기체의 천이 안정성 확보 방안으로 전후방 틸트 메커니즘과 Flap 시스템을 적용하였다. 경량화를 위해 세미모노코크 구조의 기체 설계와 해석을 진행하였다. -
본 연구는 시각장애인을 위한 스마트 악보 기기를 개발하여 이들이 음악을 보다 쉽게 접하고 이해할 수 있도록 하는 데 목적을 두고 있다. 해당 프로젝트는 시각장애인들이 악기를 연주할 때 악보를 진동 점자로 실시간 확인할 수 있게 설계되었다. 이를 위해 Music XML 파일 및 PDF 파일을 인식하여 계이름과 악상 기호를 텍스트로 추출한 후, 이를 진동 신호로 변환하여 출력하도록 하였다. 또한 웨어러블 형태의 조끼에 여섯 개의 진동 모듈을 장착하여 다양한 악보 정보를 효과적으로 전달할 수 있도록 하였다. 그 결과, 진동 점자를 활용한 스마트 악보 기기를 성공적으로 개발하였다. 이 기기는 시각장애인들이 음악을 보다 직관적으로 배우고 연주할 수 있는 환경을 제공하며, 연주 중 다양한 음악적 표현을 지원함으로써 예술적 잠재력을 극대화하는 데에 기여할 것으로 기대된다.
-
Hyo-Won An;Ye-ji Han;Seo-Yeong Shin;Yoon-je Jeong;Song-hee Lee;Yong-Man Lyu 894
비대면 진료 서비스의 필요성은 금년도 의사 파업과 코로나19 재확산으로 인해 더욱 부각되었다. 본 논문에서는 열화상 카메라로 수집한 데이터를 AI 기반 알고리즘으로 보정하였으며, P2P 통신 프로토콜인 WebRTC 기술을 적용하여 환자와 의료진 간 원활한 소통을 지원하였다. 아울러, 다양한 환경에서 안정적으로 활용 가능한 클라우드 기반 시스템을 구현함으로써 비대면 진료의 효율성을 극대화하였다. -
Shin Woo Lee;Jeong Hyeong Seo;Dong hyeon Kim;Soo Young Shin 896
고층 건물의 화재는 많은 위험 상황을 야기하는 재난이다. 이런 화재의 경우 고가사다리 차량을 이용한 화재 진압 시스템이 사용된다. 하지만, 고가 사다리 차량은 크기가 매우 커 진입 가능한 장소가 한정되며, 우리나라와 같이 높은 건물이 집약된 곳에서는 이런 사다리 차량을 활용하는 것이 어려운 실정이다. 이런 문제점을 해결하기 위하여 소화탄 발사 드론을 제안하였으며, 본 논문에서는 소화탄 드론의 효율적인 운용을 위한 유리 감지 기법을 실험하였다. -
Tae-In Han;Jong-Hak Kim;Sung-Gyu Lee;Seung-Hwan Lee 898
본 시스템은 객체인식용 인공지능을 사용하여 건설현장의 현장 안전 관리자의 업무를 지원하는 목적으로 연구되었다. CCTV 를 통해 제공된 화면으로 노동자의 안전 장비 및 건설 기기에 대한 객체 인식을 행하는 AI 와 안전이 확보되지 않은 구역의 출입을 제한하는 센서로 구성된다. 그 결과, 안전 장비 착용 미흡, 건설 기기 출입을 파악하여 그에 따른 조치를 통해 사고 예방을 지원한다. -
Kyung-Min Ryu;Ji-Won Kim;Il-Jun Choi;Jeong-Il Lee 900
본 연구는 CCTV, 가로등과 같은 안전 인프라를 전이 학습된 객체 인식 모델로 식별하고, 이를 자치구별 범죄 발생 건 수와 비교하여 상관관계를 분석한다. 이를 통해 안전 인프라 배치가 범죄 예방에 중요한 역할을 한다는 점을 입증하는 것이 목표이며, 인구 수 대비 CCTV 설치 수가 많을수록 범죄 발생률이 낮다는 결과가 도출되었다. -
So-Pyeong Kim;Jeong-In Kwak;Chan-Ho Yun;Ye-Jin Choo;il-jun Choe;Jeong-il Lee 902
본 연구는 보행자의 안전을 강화하기 위해 차량과 사람, 장애물 등의 식별을 목적으로 카메라로 획득한 2차원 영상 데이터에서 객체 간 거리 정보를 추정하기 위해 레이저 센서를 활용하여 단일 객체에 대한 실제 거리를 측정하고 측정된 단일 객체에 대한 기준 픽셀값과 거리 정보를 이용하여 주변 객체에 대한 픽셀 비율을 연산하여 상대 거리를 효율적으로 추정하는 기법을 제안한다. -
-
Min-Chol Kim;Jun-Yeong Lee;Min-Seok Park;Han-Jun Jeong;Hyeon-Seok Jo 906
본 연구는 전력 계통의 불안정성을 해결하기 위한 저비용 PMU의 설계 및 구현에 관한 것이다. 본 논문에서는 단상 전압을 하드웨어적으로 변환하여 Stm32 보드에서 처리한 후, DFT 및 THD 분석을 수행하고, 이를 실시간으로 PDC에 전송하는 시스템을 제안한다. 이 연구의 주요 목표는 기존의 고비용 PMU가 지닌 경제적 한계를 극복하고, 저비용 솔루션을 통해 높은 샘플링 주파수와 정확한 실시간 전압 데이터를 제공하는 것이다. -
한국의 주요 농산물인 양파 도매가격을 예측하기 위해 12가지 모델(SARIMA, ARIMA, Lasso Regression, Linear Regression, Ridge Regression, ElasticNet, LSTM, LightGBM, XGBoost, Random Forest, Gradient Boosting, Prophet)의 예측 성능을 비교 분석하며, 다섯 개 지역(광주, 대구, 대전, 부산, 서울)에서 모델의 성능을 평가한다. ARIMA와 SARIMA는 특히 대구와 부산에서 우수한 성과를 보였으며, Prophet과 LightGBM 모델은 상대적으로 낮은 정확도를 나타냄을 발견하였다. 다양한 모델의 성능 차이를 분석하고, 지역별 데이터 특성에 따른 맞춤형 예측 접근의 필요성을 강조한다.
-
So-Yeon Kim;Ji-Won Lee;Tae-Seung Kim;So-Young Kim;Jun-Su Han 910
에듀테크는 4 차 산업혁명 시대에 교육과 기술의 결합을 통해 새로운 학습 환경을 제시하고 있다. 다양한 디지털 기술을 학습 도구로 활용함으로써 새로운 교육 환경을 제공한다. 그러나 현재의 에듀테크 플랫폼은 아동 발달 데이터를 충분히 반영하지 못해 학부모가 자녀의 발달 상황을 효과적으로 파악하기 어려운 점이 있다. 제안하는 플랫폼은 6 세 이하 아동을 대상으로 음성 인식, 모션 캡처, 행동 인식 기술을 이용한 퀴즈를 제공하며, 보호자는 이를 통해 아동의 발달 상태를 평가할 수 있다. 이 플랫폼은 학부모의 부담을 줄이고 아동의 발달 상태를 파악하는 도구를 제공하며, 교육의 질을 향상시키는 데 기여할 것이다. -
Won-Kyo Choi;Eun-Jun Choi;Hye-Won Yang;Se-Ryeong Kim 912
본 논문은 'AI 튜터와 함께하는 매칭 플랫폼' 개발 과정에서의 데이터 수집 및 정제에 대해 다룬다. 이 플랫폼은 사용자에게 개인화된 멘토 매칭 및 강의 추천 서비스를 제공하며, 이를 위해 웹크롤링을 통해 데이터를 수집하고, 그 데이터를 정제하는 과정을 거쳤다. 특히, 요리 레시피 데이터를 기반으로 한 취미 레벨 테스트 기능이 포함되어 있으며, 정제된 데이터를 통해 딥러닝 기반의 추천 알고리즘과 AI 튜터링 시스템을 구축했다. 본 연구는 이러한 시스템이 사용자 맞춤형 학습 경험을 제공하는 데 어떻게 기여하는지 논의한다. -
Ji-Hun Gwak;Seong-Hyun Ryu;Hee-Soo Kim;Yong-Il Jo 914
이 연구는 딥러닝을 활용하여 반려동물 얼굴을 인식하는 알고리즘을 개발하고, MobileNet, ResNet, DenseNet 등의 딥러닝 모델을 사용해 그 성능을 평가한다. 다양한 반려동물 이미지를 통해 각 모델의 학습 성능을 분석하고, 실종 반려동물 찾기 시스템에서 활용할 수 있는 최적의 모델을 제안하는 데 중점을 둔다. 연구 결과, MobileNet이 높은 정확도와 실시간 성능을 보여 반려동물 얼굴 인식 시스템에 적합한 모델로 평가되었다. -
Bongjun Jeong;YeongUk Kim;Sungtak Do;JaeHyun Park;Chansu Kim 916
전자 상거래의 확산에 따라서 물류 산업의 발전도 함께 이루어지고 있다. 물류창고는 물류 산업의 주요 요소로, 전통적인 물품 보관이나 반출과 관련된 재고관리 이외에도 빠른 배송과 주문처리, 물류네트워크 등 다양한 기능이 요구되고 있다. 이러한 요구를 만족하기 위하여, 인공지능 기반의 기술을 이용한 물류창고 운영 자동화 시스템의 도입이 증가하고 있으며, 대표적으로 무인 창고 시스템이 있다. 객체 검지는 모니터링, 안전, 보안 등 다양한 기능을 제공할 수 있는 기반 기술이며, 무인 창고 시스템을 위해 필수적이다. 본 논문에서는 객체 검지를 활용한 물류창고 운영 자동화에 적용할 수 있는 스마트 물류창고 시스템을 제안하고, 이를 구현한 결과에 대해 분석한다. -
Jun-Hui Kim;Ji-Hui Kim;Chae-One Kim;Hyun-Su Lee;Seo-Yeon Shin 918
현재 환경 문제는 인류의 생존을 위협할 정도로 매우 심각하다. 올바른 분리수거는 매립 및 소각하는 폐기물 양을 줄이고 자원을 재활용하여 자원 절약에 기여할 수 있다. 그러나 생활 폐기물의 올바른 분리수거가 이루어지고 있다고 보기 어렵다. 이러한 문제를 해결하기 위해, 폐기물의 이미지를 통해 분리수거 방법을 안내하는 AI 기반 시스템을 개발했다. 본 연구에서는 폐기물 객체를 정확하게 탐지하기 위해 YOLO 기반의 객체 탐지 알고리즘을 사용하였으며, 이미지 인식의 정확도를 높이기 위해 학습 데이터셋으로 직접 라벨링한 커스텀 데이터셋을 활용하였다. 본 연구를 통해 올바른 분리수거 실천률을 향상시키고, 환경 보호와 지속 가능한 사회를 만드는 데 기여할 수 있다. -
본 논문은 스마트 리테일 환경에서 객체 검지 기술의 적용에 관한 방법을 제안한다. 스마트 리테일은 자영업자나 소상공인 사업장의 전반적인 운영과 고객의 요구를 충족하기 위하여 첨단 기술을 활용하는 분야이다. 객체 검지 기술은 영상에서 사람, 물체 등 다양한 객체를 실시간으로 검지하여 객체 종류, 위치와 크기 정보 등을 제공하며, 이러한 정보는 재고관리, 고객 행동 분석, 무인 결제 시스템 등에서 유용하게 활용될 수 있다. 최근에는 딥러닝 기반의 객체 검지 기술이 우수한 성능을 보이고 다양한 분야에서 활용되고 있지만, 고성능의 객체 검지 기술을 운용하기 위해 고가의 하드웨어가 필요하다는 문제가 존재한다. 본 논문에서는 웹기반의 스마트 리테일 서비스 모델과 소규모사업장환경의 저가 하드웨어에서 객체 검지 기술을 적용하는 방법을 제안하고, 스마트 리테일에서 가장 중요한 객체인 사람 검지에 관한 성능을 분석한다.
-
반려견의 비만도는 건강에 중대한 영향을 미치지만, 기존의 비만도 평가 방식은 전문가의 평가나 자가검진에 의존하여 접근성이 떨어지거나 정확도가 떨어지는 한계가 있었다. 본 연구는 AI 기반의 딥러닝 모델을 통해 강아지의 비만도를 보다 쉽게 평가할 수 있는 방법을 제안한다. 특히, 클래스 불균형 문제를 데이터 증강 기법으로 해결하여 모델의 성능을 향상시키고, 실시간으로 결과를 제공하는 앱 기반 솔루션을 구현하였다. 이 연구는 기존 모델과 달리 사용자가 촬영한 한 장의 이미지로 비만도를 예측하며, 사용자 친화적인 접근성을 강조한다.
-
본 논문는 통합 데이터 분석 플랫폼인 Microsoft Fabric을 통해 기상청 데이터를 활용하여 한국의 지역별 기후 요소인 강수량, 기온을 예측하고자 한다. 앙상블 모델과 시계열 모델을 적용해 평균 제곱오차(MSE)를 기준으로 최적의 모델을 선정하였으며, 2024년부터 5년간의 기후 변화를 예측하였다. 연구 결과, 한국의 시간당 평균 최대 강수량과 평균 최고 기온이 지속적으로 상승함을 확인했다. 이는 기후 변화에 대응하기 위한 정책과 대비책 마련이 필요함을 시사한다.
-
Sang-Un Baek;Seok-Hyeon Baek;Hyen-Chang Woo;Ji-Sang You;Joo-Ron Lim 926
최근 개인형 이동장치(PM, Personal Mobility) 사용 증가에 따라 전동 킥보드 사고 발생 빈도가 높아지면서, 전동 킥보드 사용자의 인식과 안전성 확보가 대두되었다. 본 시스템은 해당 문제를 해결책으로 CNN(Convolutional Neural Network)과 CNN-LSTM(Long Short Term Memory) 기반의 인공 지능 모델로 다인승 탑승, 인도 및 차도 주행, 헬멧 착용 여부를 실시간으로 감지, 안전 기준을 충족하지 않는 경우 자동으로 출력 제한을 적용함으로써 사용자에게는 안전 인식을 각인시키며 큰 사고의 발생 위험을 줄이는 데 기여할 수 있다. 즉, 전동 킥보드의 안전성을 높이고, 인명 사고를 예방하는 데 기여할 것으로 기대된다. -
Ye-Song Yu;Chae-Yoon Kim;Hye-Ryeong Park;Chae-Won Ahn 928
데이터의 규모가 방대해지고 AI 모델의 구조적 복잡성이 증가함에 따라 AI 하드웨어 가속기의 성능이 더욱 중요해졌다. 특히 LLM 의 핵심을 이루는 Transformer 모델이 주목받고 있으나, Transformer 의 하드웨어 가속기 연구는 타 모델에 비해 상대적으로 늦게 진행되었다. 그 이유에는 최적화가 어려운 복잡한 연산과 메모리 접근패턴이 있다. Transformer 는 Self-Attention 메커니즘을 사용해 입력 시퀀스 내 모든 요소 간의 관계를 계산하는 구조로[1], 매우 많은 양의 연산과 메모리 사용을 요구한다. NLP 기술이 생활 곳곳에서 대체될 수 없는 도구로 자리 잡은 만큼 Transformer Accelerator 가 더 많이 연구, 개발될 필요가 있다.[2] 본 연구는 Verilog HDL 로 하드웨어에 최적화된 Transformer Encoder 를 구현한 후 합성/실행하여 FPGA 칩에 업로드한다. transformer 의 encoder 에 알맞은 accelerator 를 제작하여 다양한 NLP 모델의 등장과 개발을 촉진하고자 한다. 또 각 모델에 따라 특화 연산기를 제작하는 연구 파이프라인을 구축한다. -
인건비 상승과 비대면 서비스 수요 증가로 인해 소매업계에서 무인 판매 시스템의 도입 필요성이 커지고 있다. 이를 해결하고자 본 프로젝트에서는 인공지능 객체 인식 기술을 활용한 도넛 분류 및 무인 판매 시스템 "InoDonut"을 개발하였다. NVIDIA Jetson Nano를 기반으로 도넛을 실시간으로 인식하고 자동으로 결제하며, LLM API를 활용한 추천 시스템을 통해 고객 맞춤형 도넛 추천 서비스를 제공한다. 또한, 판매대는 AWS 서버와 연동되어 매장의 운영을 효율적으로 관리할 수 있다.
-
Ji-Yun Kim;Yoon-Seo Kim;Kang-Eun Go;Jaehyun Moon 932
AI 로보어드바이저를 활용한 금융 추천 서비스 'PURE'는 사용자의 투자 성향과 관심 분야를 분석하여 맞춤형 종목을 추천하고, ChatGPT API로 트렌드 및 감성 분석을 통해 기사 요약 기능을 제공한다. 최신 AI 기술과 빅데이터를 활용해 개인화된 투자 조언과 리스크 관리를 지원하며, 실시간 데이터 분석을 통해 투자 전략을 강화하고 비용 절감 및 시장 변화에 유연하게 대응한다. -
Yun-Ji Park;Ji-Su Min;Ryn Park;Jin Yang;Gyu-young Lee 934
적대적 공격은 영상에 사람의 육안으로는 구분할 수 없는 섭동을 넣어 딥러닝 모델의 오판을 유도한다. 이러한 기술은 의료 분야에서 보험사기 등으로 악용될 수 있고, 이를 해결하기 위해서는 적대적 공격의 원리와 방어기법을 상시 연구하는 노력이 필요하다. 본 논문에서는 다양한 적대적 공격을 코드로 구현하고, 이를 활용하여 의료 CT 영상에 공격을 가하는 실험을 수행하였으며, 그 결과 공격유형 별 원리와 특장점 및 성능 등을 종합적으로 평가하여 방어연구를 촉진하였다. -
본 논문은 FPGA 기반의 Petalinux SDK와 PYNQ 프레임워크의 이미지 처리 속도를 비교한다. 연구에서는 YOLO v3 Tiny와 Darknet-19 알고리즘을 사용하여 FPGA에서 자체 제작한 CNN 가속기로 실험을 진행하였다. Petalinux SDK는 이미지 처리에 약 233.13ms가 소요된 반면, PYNQ 프레임워크는 약 2.55ms가 소요되어 더 빠른 속도를 보였다. 이를 통해 PYNQ의 잠재력과 활용 가능성을 강조하며, 추가 연구의 필요성을 제기한다.
-
Seon-Ae Park;Hyo-Jin Ahn;Yu-Bin Ji;Hong-Min Park 938
항공 여행객 수의 증가로 인해 공항 보안 검색대에서의 처리 시간이 길어지고 있으며, 반입 금지 물품에 대한 인식 부족이 시간 지연을 초래하고 있다. 본 논문은 YOLOv5 객체 탐지 모델을 활용해 항공기 반입 금지 물품을 자동 식별하는 AI 시스템을 제안하며, 사용자가 사전에 기내 반입 물품을 확인함으로써 보안 검색 과정에서의 시간 지연을 최소화하고, 처리 속도를 개선할 수 있음을 목표로 한다. -
Do-Hyun Kim;Sang-Hyun Yoon;Tae-Rim Kim;Ki-Young Jang 940
4족 보행 동물 중 말(馬)은 다리 관절 부위에 부상과 질병이 잦은 편이나, 적시에 질병을 발견하지 못해 질병의 악화로 발생하는 문제점이 있다. 본 논문은 이를 극복하기 위한 기술 개발에 필요한 동물의 보행 이상 상태 진단을 위한 AI 학습용 데이터 구축하는 구체적인 방법론을 제안한다. -
Yoona Chung;Yeong-Soo Kim;Tae-Hee Kim;Ye-Young Sin;Ye-Rin Jung 942
언어 장애는 여러 장애인에게 흔히 동반되는 문제로, 이로 인해 의사소통에 어려움을 겪는다. 본 연구에서는 이러한 문제를 해결하기 위해 언어 장애인의 음성 데이터를 기반으로 한 음성 번역 모델을 구현하였다. 이 모델은 부정확한 음성을 정확한 텍스트와 음성으로 변환하여, 보다 원활한 의사소통을 가능하게 한다. 이를 통해 언어 장애를 가진 장애인들이 현대 사회에서 보다 독립적이고 효과적으로 소통할 수 있을 것으로 기대된다. -
Seung-woo Park;Young-jin Park;Hye-won Choi;Seung-heon Ha;Yu-seong Do 944
본 연구는 라즈베리파이4와 같은 저전력, 저비용 임베디드 시스템에서 효과적으로 작동할 수 있는 실시간 객체 탐지 모델을 제안한다. 우리는 대중적으로 유명한 YOLO를 사용하지 않고 MobileNetV1-SSDLite를 기반으로 한 경량화된 모델을 설계하고, 이를 라즈베리파이4에 최적화하여 구현하였다. 실험 결과, 제안된 모델은 평균 5 FPS의 처리 속도로 mAP 0.68을 달성하여, 기존의 모델들과 비교했을 때 라즈베리파이4에서 더 효율적인 성능을 보여주었다. 또한, Jetson Nano와의 비교를 통해 각 플랫폼의 특성을 분석하여 라즈베리파이4에 경량화된 모델이 충분하다라는 것을 소개한다. -
Min-Hyeok Kim;Jae-Kyun Kim;Seon-Woo Park;Jun-Hyeong Byun;Ha-Rin Lee;Sang-Oh Yoo 946
어두운 밤이나 비가 올 때 포트홀 인식률이 저하되는 문제점을 보완하여 기존 카메라를 이용하여 포트홀을 인식하는 시스템에서 라이더를 추가해 포트홀 인식률을 높였다. 또한 사용자에게 실시간으로 업데이트된 포트홀 정보를 보여준다. 추가적으로 모든 정보는 DB에 저장되기에 추후 언제든 관공서에게 제공가능하다. -
바지 구매에 있어 소비자들의 불편함을 해소하기 위해 직접 매장에서 피팅을 해 보지 않고도 본인 체형에 맞는 맞춤형 핏을 제공하는 서비스를 개발하였다. 'MyFit'은 인공지능으로 생성된 아바타를 기반으로 사용자의 신체 치수에 맞춰 바지 핏을 시각화하는 시스템이다. 특히 바지의 핏에 중점을 두어 소비자들이 온라인