Annual Conference of KIPS (한국정보처리학회:학술대회논문집)
Korea Information Processing Society
- Semi Annual
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
Domain
- Information/Communication > Information Processing Theory
2024.10a
-
WordNet, Freebase, Wikidata와 같은 대규모 지식베이스에 대한 딥러닝 연구가 활발히 진행되고 있으나 이에 관한 온톨로지 매칭 연구는 거의 연구가 미비한 상태이다. 본 연구에서는 효율적인 온톨로지 매칭 방법을 개발하기 위해 데이터 수집 및 전처리, 텍스트 유사도 계산, 그리고 텍스트 유사도에 따른 결과 매칭의 세 가지 순차적 단계로 구성된 하나의 새로운 방법을 제안한다. 성능평가는 정보검색 분야에서 널리 활용되고 있는 재현율, 정밀도, F-측정값을 사용하였는데 제안한 방법이 기존의 모든 방법들보다 성능이 우수함을 보였다.
-
전통적으로 컴퓨팅 자원을 많이 필요로 하는 기초과학 분야 뿐만 아니라 최근 딥러닝, ChatGPT와 같은 인공 지능 분야에서도 대규모의 컴퓨팅 자원에 대한 요구가 지속적으로 증가하고 있다. 그러나 스케줄러 기반으로 운영되는 기존의 HPC 클러스터의 경우 성능 최적화를 위해 구성된 소프트웨어 스택의 경직성으로 인해 새로운 서비스 도입에 어려움이 있다. 이러한 어려움을 해결하기 위해 본 논문에서는 컨테이너 기반의 가상화 기술로 개발된 MyKSC 서비스를 소개한다. MyKSC 는 기존의 HPC 클러스터와 쿠버네티스 클러스터가 공존하는 약 결합 아키텍쳐를 기반으로 설계되어 슈퍼컴퓨터 운영 센터에서는 기존의 소프트웨어 스택 변경 없이 손쉽게 적용할 수 있다. 또한 컨테이너 가상화 기술이 적용되어 사용자 맞춤형 서비스가 가능하며 웹 기반의 그래픽 사용자 인터페이스를 통해 슈퍼컴퓨터를 처음 사용하는 사용자도 쉽게 슈퍼컴퓨터를 활용할 수 있다.
-
최근 고성능 컴퓨팅(HPC) 환경에서는 이기종 컴퓨팅 자원의 보편화로 인해 다양한 하드웨어 아키텍처에서의 프로그램 최적화가 필수적이다. 이에 따라 수작업 없이도 하드웨어에 맞춤형 최적화를 자동으로 수행할 수 있는 오토튜닝 기술의 중요성이 커지고 있다. 본 연구에서는 Apache TVM을 활용하여 HPC 워크로드에서의 성능 최적화 가능성을 탐구하였다. 밀집 행렬 연산(GEMM)과 희소 행렬 연산(SpMM)을 주요 워크로드로 설정하고, 국가슈퍼컴퓨터센터의 5호기 누리온에서 실험을 진행하였다. GEMM 연산에서는 누리온 KNL과 Skylake 노드에서 각각 209배, 87배의 성능 향상을 확인하였고, SpMM 연산에서는 BCSR 포맷 기준으로 최대 117배, 10배의 성능 향상이 이루어졌다. 본 연구는 Apache TVM이 인공지능 분야를 넘어 HPC 워크로드에서도 성능 최적화에 유효한 도구임을 시사하며, 향후 다양한 이기종 컴퓨팅 환경에의 적용 가능성을 제시한다.
-
KISTI 슈퍼컴퓨팅인프라센터에서는 AI 연구자들을 위해 GPU기반의 클러스터 시스템인 뉴론을 구축하여 서비스하고 있다. 뉴론은 기본적으로 작업 배치 스케줄러인 SLURM을 통해 자원 분배 서비스를 제공하고 있다. 최근 컨테이너 이미지 기반의 클라우드 서비스에 대한 요구가 많아지면서 뉴론에서도 컨테이너 오케스트레이션 툴을 활용한 서비스인 웹 기반의 MyKSC를 제공하고 있다. 본 논문에서는 작업 배치 스케줄러와 컨테이너 오케스트레이션 툴을 활용한 이중 클러스터 서비스 환경을 구현하는 기법에 대해서 소개한다.
-
본 연구는 간경화 예측을 위한 다양한 머신러닝 모델의 성능을 비교하여 최적의 예측 모델을 찾는 것을 목표로 한다. Kaggle의 "Cirrhosis Prediction Dataset"을 활용해 Random Forest 알고리즘으로 중요한 변수 4개(N_Days, Platelets, Prothrombin, Albumin)를 선정하고, grid-ANFIS(grid partitioning-Adaptive Neuro Fuzzy Inference System), subtractive-ANFIS(subtractive-Adaptive Neuro Fuzzy Inference System), FCM(Fuzzy Cluster means) 모델을 평가하였다. 평가 지표로RMSE를 사용하였으며, grid-ANFIS 모델이 가장 우수한 성능을 보였다. 본 연구는 간경화 예측 및 진단의 정확성을 높이는 데 기여할 수 있을 것으로 기대된다.
-
다양한 AI 서비스들이 보급되면서 고성능 계산 자원에 대한 요구가 증대하고 있으며 이를 위해 여러 이기종 계산 자원들을 수용할 수 있는 시스템 아키텍쳐 기술들이 발표되고 있다. 특히 계산 자원들의 수용을 위한 시스템 버스 기술에 대한 관심이 높아지고 있다. 본 연구는 여러 새로운 시스템 버스들 속에서도 표준 시스템 버스라 할 수 있는 PCIe 버스를 대상으로 하고 있는데 PCIe 서브시스템의 상태를 실시간으로 모니터링하기 위한 도구를 제안하고 그 구현 결과를 소개한다.
-
다양한 AI 서비스들의 확산으로 특수 목적형 고성능 시스템에 대한 관심이 증가하면서, PCIe 버스를 인터커넥션 네트워크로 사용하는 사례가 늘고 있다. 본 연구에서는 NTB를 활용한 PCIe 네트워크의 통신 성능을 TCP를 사용하는 방법과 NTB 모듈에 직접 접근하는 방법으로 나누어 측정하고 그 결과와 의미를 분석하였다. 두 가지 방법들이 성능에서 상이한 패턴을 보이기 때문에 PCIe 네트워크를 사용할 시스템의 성능 요구 사항에 따라 그에 부합하는 통신 방법을 선택해야 할 것으로 예상된다.
-
본 논문에서는 LiDAR 데이터와 스테레오 이미지를 융합하여 고품질 3D 표현을 생성하는 새로운 접근 방식을 제안한다. 제안하는 방법은 LiDAR 포인트 클라우드와 스테레오 비전을 통해 3D 포인트를 추출하는 것에서 시작하며, 이후 스테레오 비전 포인트 클라우드의 스케일을 LiDAR 스케일에 맞추는 조정 과정을 거친다. 스케일이 조정된 스테레오 포인트와 LiDAR 데이터를 초기 융합하여 두 가지 모달리티의 장점을 모두 활용한 포괄적인 포인트 클라우드를 생성한다. 융합된 포인트 클라우드를 정제하기 위해, DBSCAN과 같은 클러스터링을 통한 노이즈 제거와 포인트 그룹화, 그리고 LiDAR 데이터를 기준으로 스테레오에서 추출한 포인트들을 정밀하게 맞추기 위한 회귀 모델을 결합한 하이브리드 기법을 도입한다. 정제된 포인트 클라우드는 3D Gaussian Splatting 초기화를 위한 기초로 사용되며, 각 포인트를 초기 가우시안 값으로 설정하고 다양한 뷰포인트에서의 렌더링 결과를 바탕으로 가우시안 파라미터를 최적화한다. 최적화된 3D 가우시안을 활용하여 다양한 시점에서 장면을 렌더링하고, 이를 통해 연속적이고 풍부한 3D 장면 표현을 생성한다. 본 연구는 일반적인 새로운 뷰 합성(general novel view synthesis) 문제에 대한 중요한 개선을 달성하여, 컴퓨터 비전, 자율주행, 가상현실과 같은 분야에서의 응용 가능성을 보여준다.
-
객체 분할은 컴퓨터 비전의 핵심 과제이나 정확한 경계 검출은 여전히 도전과제로 남아있다. 이를 해결하기 위해, 최근 몇 년 동안, 경계 기반의 평가 지표가 제안되었으나, 대부분의 경계 기반 지표들은 경계만을 고려하고 내부 영역은 간과하며, 경계의 범위 및 강도를 설정하는 파라미터가 휴리스틱하다는 문제점이 존재한다. 본 논문에서는 경계에 강건한 객체 분할을 위한 Adaptive wIoU를 제안한다. 이 방법은 wIoU의 개념을 확장하여 다중 알파 값을 도입하고, 동적 가중치 조정 메커니즘을 통해 이러한 알파 값에 대한 가중치를 학습 과정에서 자동으로 최적화한다. Adaptive wIoU는 다양한 경계 복잡성에 적응적으로 대응하여 기존 IoU와 wIoU의 한계를 극복한다. 실험을 통해 Adaptive wIoU가 COCO 데이터셋에서 우수한 성능을 보이는 것을 입증하였다. 이 연구는 객체 분할에 대한 새로운 통찰을 제시하며, 객체 분할 작업에서 경계 검출을 개선하기 위한 방향을 제시한다.
-
온디바이스 환경에서 딥러닝 모델 최적화는 필수적이지만, 제한된 자원으로 고성능 모델을 직접 적용하는 데에는 한계가 있다. 본 논문에서는 이를 극복하기 위한 주요 기법인 가지치기, 양자화, 지식 증류, 신경망 아키텍처 탐색 및 이들의 결합 기법을 소개하고 분석한다. 각 기법의 정의와 특징, 적용 사례를 통해 성능 향상과 자원 효율성을 극대화하는 방법을 제시하며, 이를 바탕으로 최근 연구 동향을 소개한다.
-
본 논문에서는 데이터 집약적 연산의 효율성 향상을 위한 새로운 프로세서 아키텍처 접근법인 Near-Data Processing(NDP) 기술의 최근 동향을 살펴본다. AI 모델 학습과 빅데이터 분석 등에서 NDP 기술의 적용 사례를 분석하고, Processing-In-Memory(PIM)와 In-Storage Processing(ISP)를 중심으로 한 최신 연구를 소개한다. 또한, 실제 하드웨어 구현 사례로 Xilinx FPGA 개발보드의 HBM 통합 사례를 다룬다.
-
RISC-V 구조는 오픈 소스 기반의 명령어 집합 아키텍처(ISA)로, 그 개방성과 확장성으로 인해 다양한 분야에서 주목받고 있다. 이러한 특징은 우주공학, 인공지능, IoT, 보안 등 광범위한 영역에서의 활용을 가능케 한다. 본 논문에서는 RISC-V 아키텍처가 최근 활용되는 주요 분야를 소개하고, 각 분야에서 이 아키텍처가 적용되는 구체적인 설계 방식과 그 장점을 분석한다..
-
브랜치 예측은 CPU 파이프라인 성능 최적화의 핵심이다. 본 논문은 퍼셉트론, CNN, SRNN, 그리고 강화학습을 이용한 AI 기반 브랜치 예측 기법의 최신 동향을 조사한다. 이러한 기법들은 제어 해저드에 대한 예측 정확도를 향상시켜 파이프라인 성능을 개선한다. 특히 SRNN 기반 예측기는 초기 학습 단계에서 높은 정확도와 낮은 지연 시간을 보이며, 강화학습 접근법은 복잡한 브랜치 패턴에서 효과적인 성능을 보여준다. 본 연구는 이러한 AI 기반 방법들이 파이프라인 최적화에 미치는 영향을 분석한다.
-
최근 딥러닝 연산의 고도화에 따라 희소성(Sparsity)을 효율적으로 처리할 수 있는 유연한 구조의 DNN 가속기가 중요해지고 있다. 그러나 기존의 가속기들은 유연성과 효율성 면에서 한계가 존재한다. 본 논문에서는 DNN 가속기의 기존 모델들과 최신 연구 동향에 대해 살펴본다. 특히 unstructured sparsity, structured sparsity, 그리고 최근 제안된 Hierarchical Structured Sparsity (HSS)를 적용한 가속기들을 분석하며, 각 접근 방식의 장단점을 비교한다.
-
현대 컴퓨터 시스템에서 메모리 접근의 효율성을 극대화하는 것은 필수적이다. 기존의 캐시 교체 및 프리페칭 기법은 고정된 규칙에 기반해 설계되어 동적 접근 패턴에 제대로 적응하지 못한다. 이 논문에서는 이러한 한계를 극복하기 위해 RL 기반 기술을 통해 동적 환경에 적응하는 효율적인 기법들을 소개한다. 이러한 방식은 기존의 캐시 교체와 프리페칭이 지닌 문제를 해결하고, 효율적인 메모리 관리 방안을 제안한다.
-
최근 이기종 메모리 및 캐시 구조가 컴퓨터 시스템에서 자주 활용되고 있다. 그러나 이기종 환경에서 기존의 균일한 캐시 관리 방식을 사용하여 성능을 향상하는 데에는 한계가 있으며, 이기종 시스템의 캐시 구조를 고려한 최적화 방법이 필요하다. 본 논문에서는 이기종 시스템에서의 캐시 최적화 방법 동향에 대해 살펴본다. 특히, 데이터 배치 최적화, 동적 캐시 할당, 그리고 에너지 효율적인 메모리 아키텍처에 초점을 맞춘 최신 연구들을 분석한다.
-
하둡은 대용량 데이터 처리를 위한 대표적인 오픈소스 프레임워크이다. 특히 하둡의 맵리듀스 프로그래밍 모델은 분산 환경에서 병렬 처리를 가능하게 한다. 데이터를 처리하기 위한 환경에서는 데이터의 양의 방대해짐에 따라 저장 공간의 한계와 데이터의 전송 속도의 병목현상이 발생이 빈번하다. 이를 해결하기 위한 방법 중 하나는 데이터 압축 기술의 활용이다. 대표적으로 Gzip, Bzip2, Zstd 등이 있으며, 각 방식은 압축률, CPU 사용량, 메모리 사용 측면에서 상이한 특성을 보인다. 이에 본 논문은 하둡의 맵리듀스 프로그래밍 모델에서 대표적인 압축 방식을 구분하여 압축 방식에 따른 성능 평가를 수행한다. 수행 결과는 빅데이터 개발자들에게 맵리듀스 환경의 압축의 효율적 선택을 위한 가이드라인을 제시할 수 있다.
-
최근 병렬컴퓨팅 연구는 슈퍼컴퓨터의 성능 향상에 직접 큰 영향을 끼치는 고성능 GPU를 활용한 대형 데이터셋 고속 병렬화를 중점적으로 진행되고 있다. 이를 해결하기 위해 Sandia 연구소에서 개발한 Kokkos 프로그래밍 모델이 등장했다. 이 논문에서는 CUDA 기반의 병렬 숄레스키 분해 구현을 해당 환경에 이식했을 때 어떤 성능을 보이는지 실험을 통해 확인했다. 1000×1000 크기의 양의 정부호 에르미트 행렬에 대해서 직렬 숄레스키 분해 프로그램 대비 498.16 배의 성능 향상을 보였으며, 이를 통해 자동으로 메모리를 관리하는 Kokkos 프로그래밍 모델이 추후 대형 데이터셋을 대상으로 하는 병렬화 프로그램 구현 시, 더욱 편리하고 좋은 성능 향상을 보일 것임을 기대한다.
-
본 연구는 자원 제약적 임베디드 시스템에서 신경망 연산의 효율성을 극대화하기 위해 SIMD(Single Instruction Multiple Data) 기술을 활용한 최적화 기법을 제안한다. 기존 연구들이 주로 합성곱 연산에 집중된 것과 달리, 본 연구는 신경망의 전체 연산 구간에 SIMD 최적화를 적용하고, 범용 DNN 프레임워크인 Darknet 을 기반으로 다양한 모델에 적용 가능한 방법론을 적용하였다. Raspberry Pi 3B+를 테스트베드로 활용하여 다양한 CNN 모델에 대한 성능 평가를 수행하였으며, 최대 55.2%의 성능 향상을 달성하였다. 또한, SIMD 레지스터 활용도와 연산 속도 간의 상관관계를 분석하여 최적의 구현 전략을 도출하였다.
-
프로세서 성능 향상이 둔화되고 네트워크 성능과의 차이가 커짐에 따라 하이퍼스케일러를 중심으로 SmartNIC이라는 기술이 주목을 받고 있다. SmartNIC은 이기종 도메인 프로세서와 범용 코어를 결합하여 인프라 작업을 오프로딩하는 혁신적인 기술로 볼 수 있으며 연산 가속, 데이터 가속, 네트워크 가속 등 오프로딩 되는 기능에 따라서 다양한 형태로 활용될 수 있다. 본 논문에서는 ARM 서버 기반으로 엔비디아의 SmartNIC인 BlueField DPU 테스트베드를 구축한 사례를 제시하고 시사점을 도출하였다.
-
증가하는 클라우드 서비스에 대한 보안 위협에 대응하기 위해 데이터를 암호화한 상태로 연산을 수행하는 동형암호에 대한 연구가 활발히 진행되고 있다. 동형암호는 암호화된 상태로 처리를 진행하기에 데이터 유출 위협으로부터 자유로우나, 210 차 이상의 다항식에 대해 연산을 수행해야 되기에 많은 양의 연산 자원과 메모리 자원을 필요로 한다. 본 논문에서는 이러한 동형암호 연산의 특성과 이를 실용적으로 사용하기 위한 가속기 개발 연구들에 대해 서술하였다.
-
For many decades, memory corruption attacks have posed a significant threat to computer systems, particularly those written in unsafe programming languages such as C/C++. In response, a 'safe' programming language, Rust, was recently developed to prevent memory bugs by using compile-time and runtime checks. Rust's security and efficiency has lead its adoption from multiple popular applications such as Firefox and Tor. Due to the large code base and complexity of legacy software, the adoption generally takes a form of a gradual deployment, where security-critical portion of the program is replaced with Rust, resulting in a mixed-language application. Unfortunately, such adoption strategy introduced a new attack vector that propagates the vulnerabilities residing in the unsafe languages to Rust, undermining the security guarantees provided by Rust. In this paper, we shed light on strategies designed to defend against attacks that target multi-lingual applications to compromise the security of Rust. We study underlying rationale of various defense mechanisms and design decisions taken to improve their performance and effectiveness. Furthermore, we explore the limitations of existing defenses and argue that additional methods are necessary for Rust to fully benefit from its security promises in multi-language environments.
-
SYCL은 크로노스 그룹(Khronos Group)이 개발한 C++ 기반의 이기종 아키텍처를 위한 공개 표준 언어이다. SYCL은 벤더에 종속되지 않는 개방형 표준이며, 특히 인텔이 이기종 아키텍처의 주력언어로 채택하고 있다는 장점이 있다. 그러나 SYCL의 템플릿, 람다 함수 등 C++의 복잡한 기능들과 태스크 그래프 기반 수행 방식 등의 여러 특징은 개발자들에게 높은 진입 장벽으로 작용하고 있다. 본 논문에서는 이러한 문제를 해결하기 위해 파이썬 기반 래퍼인 ezSYCL의 설계를 제안한다. ezSYCL은 SYCL보다 간결한 표현을 제공하여 개발자들이 보다 빠르게 프로토타입을 개발할 수 있을 것으로 기대된다.
-
최근 스팸 문자 메시지의 급증은 사용자들에게 심각한 불편을 초래할 뿐만 아니라, 불법 도박 및 금융 사기와 같은 중대한 사회적 문제로 이어지고 있다. 본 연구는 이러한 스팸 문자 메시지의 패턴과 텍스트를 심층적으로 분석하여, 스팸 메시지의 경향을 파악하고 청소년 도박 문제에 대한 교육적 대처 방안을 도출하는 것을 목표로 한다. 2022년 8월부터 2024년 3월까지 약 1년 7개월 동안 신고된 스팸 문자 데이터를 바탕으로, 스팸 메시지의 신고량 추이와 키워드 군집 분포를 분석하였다. 분석 결과, 스팸 메시지는 주로 주중 방과 후 시간대인 12시에서 18시 사이에 집중되었으며, 도박 관련 스팸 메시지가 전체의 62.7%로 가장 큰 비중을 차지하였다. 텍스트 분석을 통해 도출된 주요 키워드는 신규 가입 유도 및 금전적 유인과 관련된 것으로, 청소년들이 도박에 유인될 가능성이 높은 요소들이 포함된 것으로 분석되었다. 본 연구는 스팸 문자 데이터의 인공지능 분석을 통해 청소년 도박 문제에 대한 중요한 시사점을 제공한다.
-
멀티 클라우드 및 하이브리드 클라우드 환경의 확산은 클라우드 인프라의 복잡성을 증가시키는 만큼, 보안 관리의 중요성 역시 높아지고 있다. 특히, 여러 가지 보안 설정 중에서, 본 논문은 GCP(Google Cloud Platform)에서 서비스 계정의 가장(impersonate)을 통한 프로젝트 마비 공격의 위험성을 분석한다. 공격자는 IAM 정책을 변경하거나 삭제하여 프로젝트의 정상적인 기능을 마비시킬 수 있으며, 이러한 상황이 발생하면 서비스 복구에는 상당한 시간이 소요될 수 있다. 이러한 공격을 방지하기 위해 다단계 인증(Multi-Factor Authentication, MFA) 등과 같은 보안 대책도 제시한다.
-
서버리스 컴퓨팅의 급속한 확산과 더불어 보안 위협도 증가하고 있다. AWS 서버리스에서 제공하는 여러 보안 방법 중, IAM 정책을 설정하여 함수와 자원 간 접근 권한을 설정할 수 있지만, 정적 보안메커니즘 한계로 동적 우회 공격은 막기 어렵다는 한계를 가진다. 본 연구에서 제안하는 Bambda는 플러그인 방식의 Lambda와 CloudWatch를 통해 실시간 동적 검증을 수행하여 이러한 우회 공격 방어의 한계를 극복한다.
-
최근 많은 기업들이 시스템의 유연성과 확장성을 고려하여 컨테이너 기술과 API 호출을 기반으로 하는 마이크로서비스 아키텍처를 도입하고 있다. 그러나 마이크로서비스의 수가 증가하고 시스템의 복잡성이 커짐에 따라 디버깅과 모니터링의 어려움이 함께 증대되고 있다. 특히, 분산된 서비스 구조에서는 API 요청이 어떤 경로로 처리되는지 추적하는 과정이 매우 복잡해져, 이는 전체 시스템의 운영과 유지 관리에 부정적인 영향을 미칠 수 있다. 이러한 문제를 해결하기 위해, 본 논문에서는 Envoy, WebAssembly(WASM), 그리고 Traffic Control BPF (TC-BPF)를 결합한 API 관측 가능성을 향상시키기 위한 시스템을 제안한다. 이 시스템은 세 가지 구성요소인 설정, 수집, 통합 엔진으로 이루어져 있으며, 패킷 처리 과정 중 각 엔진을 통해 API 호출에 대한 추적 가능한 데이터를 추출하고 이를 통합한다. 제안된 시스템은 기존 도구들이 겪는 성능 저하 및 인증 정보 수집의 한계를 극복하여, 분산된 마이크로서비스 환경에서 API 관측 가능성을 효과적으로 향상시킬 수 있다.
-
본 논문은 하이브리드 클라우드 환경에서 컨테이너 인프라의 자원 사용량을 통합적으로 모니터링하는 애플리케이션을 개발한 내용을 다룬다. 컨테이너 기반의 CaaS(Containers-as-a-Service) 시스템을 모니터링하기 위해 Docker API 와 오픈소스 시각화 도구 Grafana 를 활용하였으며, 서버-에이전트 구조로 확장 가능성을 고려한 설계를 수행하였다. 이를 통해 다양한 클라우드 환경에서의 자원 관리 효율성을 높이고, 사용자는 단일 대시보드를 통해 시스템 전반의 상태를 직관적으로 파악할 수 있다.
-
쿠버네티스의 HPA(Horizontal Pod Autoscaling) 기법은 워크로드의 규모에 따라 동적으로 컨테이너 리소스를 조정하여 시스템 성능을 최적화하고 자원 활용 효율성을 높이는 역할을 한다. 그러나 HPA의 주요 문제점인 pod flapping을 해결하기 위해 CDT(Cool Down Time)가 도입되었다. 본 논문은 다르게 설정한 CDT 값에 따라 각 CPU 자원 할당량 별 지연 시간과 자원 사용량을 분석했다. 실험 결과 CDT 설정값이 성능과 자원 사용량에 영향을 미치는 것을 파악했고, 이를 바탕으로 자원 사용량과 SLO(Service-level Objective) 만족률을 모두 고려한 최적의 CDT 설정의 필요성을 제고한다.
-
클라우드 서비스는 자원 효율성을 위해 서로 다른 애플리케이션들이 같은 물리적 자원을 공유하며 제공되고 이로 인해 자원 경쟁이 발생할 수 있다. CPU 자원 경쟁이 발생하는 경우 병목 현상과 캐시 상태 변화로 사용자는 느린 응답속도를 겪게 된다. 본 논문에서는 쿠버네티스 환경에서 CPU 자원 경쟁에 따른 타깃 애플리케이션의 성능을 측정하여 그 영향을 분석한다. 실험 결과 애플리케이션의 응답시간은 노드의 CPU 사용량이 늘어날수록 평균 361%, 최대 855% 증가하고, 작업 수가 많아질수록 최대 19.4% 증가한다. 이 결과를 바탕으로 자원 효율성과 파드 성능을 고려한 가이드라인을 제공하는 것이 목적이다.
-
최근 클라우드 컴퓨팅의 발전에 따라 서비스 품질 보장과 자원 사용의 효율성을 위해 쿠버네티스의 HPA(Horizontal Pod Autoscaling) 기술이 범용적으로 사용되고 있다. HPA 는 자원에 대해 필요한 리소스만큼 동적으로 조정하기 때문에 파드의 자원을 세분화하면 자원 효율성이 높아지지만, 반대로 느린 응답 속도를 유발한다. 본 논문은 쿠버네티스 환경에서 파드의 기본 자원량을 다양하게 조정하여 동일한 작업 요청에 따른 레이턴시와 자원 사용량을 분석한다. 실험 결과 자원의 세분성이 높아질수록 컨테이너 오버헤드의 증가로 인해 자원 사용률과 서비스 레이턴시가 증가하였다.
-
This study compares CPU-based and custom metric-based scaling methods in Kubernetes, showing that custom metrics tailored to application needs can enhance scalability and efficiency. Findings reveal that, at certain scaling thresholds under dynamic network traffic, custom metrics reduce average latency by 85% to 87% compared to CPU-based scaling.
-
서버리스 컴퓨팅은 클라우드 컴퓨팅 패러다임의 한 종류로, 마이크로서비스가 부상하며 함께 큰 주목을 받고 있다. 서버리스 컴퓨팅에서 가장 큰 문제점 중 하나는 콜드 스타트 문제를 해결하는 것으로, 함수를 실행할 컨테이너가 생성될 때 이미지를 풀링하는 데 걸리는 지연 시간은 콜드 스타트에 큰 비중을 차지한다. 본 논문은 컨테이너의 이미지 사이즈를 최적화하기 위해 Docker 멀티 스테이지 기법을 사용하였으며, 컨테이너 이미지 풀링 시간에 미치는 영향을 분석하였다. 이를 통해 컨테이너 이미지 크기가 풀링 시간에 미치는 영향을 알아보고, 멀티 스테이지 빌드 기법의 유용성을 검증한다.
-
멀티 클라우드 서비스 제공을 위해 가상머신 환경 구축 시 서비스의 성능, 비용 등을 최적화하면서 가상머신의 적절한 배치 위치를 결정하는 것은 중요한 연구 이슈 중 하나이다. 따라서 본 논문에서는 가상머신 배포 시 비용과 성능에 기반한 가상머신 배치 위치 최적화 및 추천 기법을 제시한다. 제안하는 방법은 NSGA-II(Non dominated Sorting Genetic Algorithm-II)를 활용한 다목적 최적화를 수행하고, 가중합 기반 점수 산출을 통해 최적 배치 위치를 추천한다. 멀티 클라우드의 14개 리전에서 4개의 가상머신 배치 실험을 수행한 결과, 총 1,716개의 배치 경우의 수 중 2개의 최적화 된 배치 방법을 획득하였다. 본 논문의 방법은 멀티 클라우드 환경에서 효율적인 가상머신 배치 및 마이그레이션을 통한 재배치 기법의 기반 기술로 활용될 수 있을 것이다.
-
본 연구는 딥러닝 기반 추천 모델 중 하나인 DLRM(Deep Learning Recommendation Model)의 학습 시간을 CPU 단일 환경과 GPU-가속 환경에서 비교한다. GPU를 사용하는 경우 일반적으로 더 빠른 학습이 기대되나, 배치 크기가 작아 GPU의 병렬 연산을 효율적으로 활용하지 못하는 경우 CPU만 사용하는 학습이 오히려 빠를 수도 있음을 실험을 통해 확인하였다. 학습 시간 외에 배치 크기는 자원 활용률에도 영향을 미치며, 이는 딥러닝 기반 모델의 학습과 추론에 도입 환경과 워크로드를 고려하여 실행 하드웨어를 선택할 필요가 있음을 시사한다.
-
과학 기술 분야에서 최근 대용량의 데이터를 활용하여 인공지능 및 빅데이터 연구를 수행하고 있는 연구소 및 기업들이 많아지고 있다. 빅데이터 연구를 위해 스토리지에 대용량의 데이터를 저장하고 이를 연구자들에게 제공할 수 있는 편리한 시스템을 요구하는 요청이 증가하고 있다. 이를 위해 스토리지를 구매하는 방법과 클라우드 스토리지를 이용하는 방법이 존재한다. 하지만 두 방법 모두 막대한 비용적인 부분이 존재한다. 또한 데이터 공유 및 외부 스토리지 이용 제공에 대한 기관의 정책적인 부분들이 문제가 된다. 이 문제를 해결하기 위해 KISTI에서는 SDN 네트워크 기반의 분산 스토리지 관리 시스템을 개발하였다. 이 시스템의 경우 SDN 네트워크에 스토리지를 연결하여 보안적으로 안전한 전용의 회선을 이용하여 기관 데이터 정책에 위배되지 않는 환경을 구성한다. 또한 기관의 연구자들에게 데이터를 제공 시 관리자의 허가를 받은 사용자들에게만 데이터를 제공하는 기능을 이용하여 안전하고 쉽게 데이터를 다운로드 받을 수 있는 협업 플랫폼을 개발하였다. 본 논문을 통해 플랫폼을 개발 및 구축에 대해 자세하게 설명하고자 한다.
-
Google에서 제안된 BBR(Bottlenek Bandwidth and RTT) 혼잡제어 알고리즘은 최대 대역폭과 최소 RTT를 추구하는 Network path 모델을 기반으로 동작하고 현재까지 BBRv3가 발표되어 활용 및 검증되고 있다. 본 논문에서는 원거리 네트워크 환경을 위한 BBRv3 에뮬레이션 테스트베드 환경을 구축하고 RTT, 패킷 손실률의 변화에 따른 처리율을 측정하여 기존 손실기반 혼잡제어 알고리즘과의 성능 비교를 수행한다. 이를 통해 과학응용을 위한 고성능 네트워크 환경을 지향하는 과학기술연구망 분야에서 기존 손실기반 혼잡제어 알고리즘들을 대체할 수 있는 또 다른 선택지로서의 BBRv3 활용 가능성을 확인한다.
-
Seokwon Oh;Subin Song;Jungbum Lee;Gyeongheon Jeong;Hyunsoo Kim;Chang-gun Lee;Taekyoung (Ted) Kwon 108
DT(Digital Twin)는 물리적 현실 세계 데이터를 실시간으로 수집하여 디지털 세계에서 동일하게 구현하는 기술이다. DT 활용하여 현실 세계의 위험상황을 예측하고 방지할 수 있다. 본 연구는 DT 가 디지털 디바이스의 현실 세계 현재 위치 데이터를 실시간으로 수집하고 디지털 세계에서 동일하게 구현하여 GPS(Global Positioning System) 스푸핑(Spoofing) 공격을 탐지하는 기법을 제시한다. 추가로 현실 세계 도심 항공 교통(Urban Air Mobility)과 사용자 디지털 디바이스에 적용 가능하다는 점을 제시한다. 도심 항공 교통의 경우 DT 서버는 모든 비행체의 GPS 위치 정보와 각 비행체의 인접 비행체 거리 정보를 실시간으로 수집한다. 두 가지 종류의 위치 정보 비교를 통해 비행체 위치 정보의 이상 상황을 탐지한다. 사용자 디지털 디바이스의 경우 DT 서버는 모든 디바이스의 GPS 위치 정보와 각 디바이스의 인접 디바이스 거리 정보를 실시간으로 수집한다. 두 가지 종류의 위치 정보 비교를 통해 디바이스 위치 정보 이상 상황을 탐지한다. -
본 논문은 IoT(Internet of Things) 환경에서 CoAP(Constrained Application Protocol)의 보안을 강화하기 위해 해시 함수와 스테가노그래피를 활용하는 접근법을 제안한다. IoT 장치의 자원 제약을 고려하여, 패킷에 솔팅을 이용한 해시 함수와 스테가노그래피를 사용하여 해시 알고리즘과 솔트 값을 은닉하는 방법을 사용한다. 이 접근법은 자원 소모를 최소화하며 데이터 무결성을 검증한다.
-
클라우드 컴퓨팅의 발전으로 IaaS는 네트워크 가상화 기술을 통해 물리적 자원을 안전하고 효율적으로 공유할 수 있는 멀티 테넌시 환경을 지원한다. 그러나 현재의 네트워크 가상화 기술은 테넌트별 서비스 접근성만 제공하며, 네트워크 구성의 유연성과 세세한 네트워크 격리 측면에서 여전히 한계를 보이고 있다. 본 연구는 이러한 문제를 해결하기 위해 안전하고 재구성 가능한 동적 가상 네트워크 구축 시스템을 제안하며, 실시간으로 유연한 네트워크 구성을 가능하게 하고자 한다.
-
본 연구는 브라우저 기반 P2P 파일 전송 시스템인 Throw 를 개발하고, 기존 클라우드 스토리지 서비스와의 성능을 비교하였다. Throw 는 WAN 환경에서 평균 2 배 빠른 전송 속도를 보였으며, 다양한 운영체제에서 사용 가능한 장점이 있음을 확인하였다. Throw 는 브라우저 기반 P2P 파일 전송 기술의 가능성을 보여주었으며, 향후 성능 최적화와 사용자 편의성 증대를 통해 더욱 완성도 높은 시스템을 구축할 수 있을 것으로 기대된다.
-
Integrated Sensing and Communication(ISAC)은 통신과 센싱을 하나의 인프라에서 통합해 수행할 수 있는 기술이다. LoRa 는 저전력, 장거리 통신을 가능하게 하여, 이를 이용해 넓은 범위에서 ISAC를 가능하게 하기 위한 연구가 진행되고 있다. 그러나 LoRa의 상위 계층을 정의하는 LoRaWAN 에서는 듀티 사이클로 인해 실제 통신에서는 센싱에 필요한 샘플링 속도보다 낮은 패킷 전송 속도를 보인다. 이로 인해 센싱에 필요한 신호를 충분히 수집하지 못해 센싱 성능이 저하되는 문제가 발생할 수 있다. 본 연구는 LoRaWAN 기반 네트워크에서 ISAC 시스템을 구축하기 위해 실제 패킷 전송 속도와 샘플링 속도 간의 차이를 분석하고 이를 해결하기 위한 인자 조절 방안을 제시한다. 이러한 접근은 패킷의 채널 점유 시간을 최적화함으로써, 센싱 성능을 향상시킬 수 있다.
-
컴퓨터 비전 기술은 이미지를 분석하여 객체를 인식하고 추적할 수 있으므로 객체를 감지하고 분석하는데 유용하다. 이러한 객체를 감지하고 분석하는 기술 덕분에 컴퓨터 비전 기술이 다양한 응용 분야에 적용되고 있으며 성능과 관련하여 다양한 연구가 활발하게 진행되고 있다. 기존의 연구는 대규모 학습 데이터 사용, 모델 복잡성 증가, 전이 학습을 통한 성능 향상 연구가 주를 이루었다. 본 논문에서는 학습 데이터에 실제 촬영된 이미지의 비율이 객체 인식 정확도에 미치는 영향을 분석하였다. 실험을 통해 학습 데이터 중 실제 촬영된 이미지가 포함되면 예측 정확도가 증가한다는 결과를 확인하였다.
-
QR 코드 인식으로 신분을 확인하거나 출입 카드를 직접 태그하여 요금 정산이나 출입 허용 여부를 판단하는 출입 시스템들은 어플을 실행해야 하는 번거로움과 태그 동작에 따른 불편함이 있다. 이 연구에서는 UWB 기술을 적용하여 어플을 실행해야 하는 번거로움이나 직접 태그해야 하는 불편함이 없이 신분을 인증할 수 있는 출입문 통제 시스템을 구현한다.
-
타국 어선에 의한 무허가 조업으로 인해 자국 어민들이 생존권을 위협받고 있다. 기존의 경우 항공 전탐사가 확인하였으나, 항공 전탐사가 확인하는데 과도한 노동력이 소요되어 이를 무인 항공기(UAV)를 통해 해결하려 한다. 그러나 상업용 무인 항공기의 경우 통신 거리가 5km에서 10km라는 한계가 존재한다. 이를 해결하기 위해 다중 계층 메시 네트워크 구조와 주파수 분할 및 MIMO기술을 활용한 선종 식별 시스템의 설계와 기술의 적용 방안을 제시한다.
-
본 연구에서는 라즈베리파이를 이용한 도어 모니터링 시스템을 제안하였다. 이 시스템은 1인 가구의 증가와 함께 높아지는 범죄 위험에 대응하기 위해 설계되었다. 적외선 센서를 사용하여 문 앞의 움직임을 감지하고, 특정 조건이 충족되면 사용자의 스마트폰으로 알림을 전송하는 방식으로 구현되었다. 시스템의 설계 및 구현 과정에서는 UML(Unified Modeling Language)을 활용하여 요구사항을 분석하고 시스템을 구조화하였다. 본 연구를 통해 1인 가구의 방범 시스템 구축에 기여할 수 있는 효과적인 도어 모니터링 솔루션이 개발되었다.
-
해당 논문은 라즈베리파이를 기반으로 한 보안 시스템의 중요성과 응용 가능성을 탐구한다. 라즈베리파이와 OpenCV를 활용하여 얼굴 인식 기능을 통합한 보안 시스템을 제안한다. 이 시스템은 문 앞에서의 활동을 실시간으로 모니터링하고, 얼굴 인식 기술을 통해 방문자의 신원을 식별하며 경고를 발송한다. 이러한 기능은 가정이나 사무실에서의 보안을 강화하는 데 유용하며, 보안 시스템이 실시간 정보 제공과 상황 관리의 핵심 요소로 자리매김하고 있음을 강조한다. 본 논문에서는 얼굴 인식 기술과 라즈베리파이 기반 시스템의 통합을 통해 보안 효과를 극대화하고 실제 응용 가능성을 평가한다.
-
가파른 경제 성장과 인구 증가로 인해 대한민국은 주차 공간이나 도로 상황에 비하여 개인용 자가용의 증가 추이가 급속하게 진행되었다. 그리고 낮은 운전면허 난이도, 적은 취득 비용 등에 의해 2022년 기준 총 자동차 등록수는 약 2,550만대를, 운전면허 소지자는 3410만명을 넘어섰다 [1, 2]. 빈약한 인프라에 비해 넘쳐나는 차량으로 출퇴근 시간 잦은 정체가 발생하고 교통사고도 잇따라 증가하였다. 산악 지형에 따라 곡선 형태의 도로가 많고, 교차로가 많이 생기는데 이러한 교차로에서 가장 사고가 많이 발생한다. 교차로에서 일어난 교통사고의 원인으로는 차선 침범, 불법 주정차로 인한 보행자와의 충돌 등이 있다 [3, 4]. 본 연구는 혼잡한 교통상황에 기인하여 발생하는 사고를 방지하기 위하여, 교차로에서 차선 침범 방지를 목적으로 LED 조명 유도를 구성하고, 주야간 운전에 불편함이 없도록 LED 밝기 자동조절 기능을 구성하였다. 이러한 기능으로 교차로 접촉 사고를 줄일 수 있다고 기대하며, 정지선 침범으로 인한 보행자 횡단의 불편함, 우회전시 보행자 충돌 등 빈번한 사고를 막는 수단이 될 수 있을 것이다.
-
지속가능한 AIoT의 필요성과 에너지 수집 기술의 발달, 그리고 온디바이스 학습이 가능한 IoT 기기들의 등장으로 인해, 최근 에너지 수집형 AIoT(AI-enabled IoT) 기술이 주목받고 있다.[1] 본 연구에서는 에너지 수집형 엣지 AIoT를 대상으로 기기의 안정적인 동작을 보장하며 동시에 연합학습 성능 수준을 높일 수 있는 시스템 수준의 에너지 적응형 동작을 제안한다. 기본적으로 각 기기에서는 학습성능과 에너지 소비량이 비례관계에 있으므로, 기기의 안정적 동작 확보를 위해 학습 성능의 감소가 필요할 때도 있다. 제안 기법에서는 에너지와 학습 성능 사이의 이러한 상충관계를 최소화하기 위해, 태양에너지 수집 모델을 기반으로 주어진 에너지 예산 내에서 각 기기의 학습 데이터양과 연합학습을 위한 파라미터 교환양을 최적화한다. 이러한 각 기기들의 정전시간 최소화(안정성증가)는 결과적으로 전체 AIoT의 연합학습 정확도 향상으로 이어질 수 있는데, 실험 결과 기존 기법에 비해 정전시간의 감소와 연합학습의 정확도가 각각 최대 53%, 35% 향상됨을 확인할 수 있었다.
-
현대 사회는 네트워크의 규모가 증가하고 있으며 이러한 대규모의 트래픽을 보다 편하게 관리하고자 SDN이 등장했다. 허나, 대규모 트래픽의 등장으로 인해 DoS 공격의 규모 또한 더욱 커지고 있다. 이러한 공격을 완화하기 위한 다양한 연구가 진행되었으나, SDN에서 기계학습을 활용하여 DoS 공격을 탐지하는 기존의 연구는 제어평면 측에 상당한 부담을 주거나 공격에 대한 대처 부족 등의 문제점이 있다. SDN에서 기계학습과 P4를 결합한 DoS 공격 탐지는 이러한 문제를 해결하기 위해 등장했다. 이 논문에서는 SDN 환경에서 기존의 기계학습 기반의 DoS 공격 탐지에 대한 문제점과 한계에 대해 언급한 이후 기계학습과 P4를 결합한 DoS 공격 탐지에 대한 필요성을 언급한다. 이후, 기계학습 및 P4 기반의 DoS 공격 탐지와 관련된 연구를 살펴보고, 향후 연구 방향을 제시함으로써 네트워크 보안 분야에 새로운 가능성을 제시한다.
-
과학기술정보통신부와 한국지능정보사회진흥원은 2022년부터 인공지능 학습용 데이터를 구하기 힘든 의료 분야의 AI 학습용 합성데이터를 구축하여 제공하고 있다. 하지만 구축한 합성데이터에 대해 안전성 측면의 검증을 수행하지 않아 다운로드가 불가능한 AI허브의 온라인 안심존을 통해서만 제공하였다. 데이터 활용성의 향상을 위해 합성데이터는 자유로운 활용이 가능한 형태로 개방 되어야 한다. 본 연구에서는 개인정보위원회에서 발간한 합성데이터 생성 참조모델(2024.5)에 따라 검증한 2개 데이터 사례를 제시하여 검증 내용에 대한 구체적인 정보를 제공하고 다른 합성데이터 생성과 검증에 대한 가이드를 제시하였다.
-
네트워크 트래픽이 최근 급격히 증가하면서, 전통적인 CPU 기반의 패킷 처리 방식은 성능의 한계에 직면하고 있다. 이러한 문제를 해결하기 위해 SmartNIC은 네트워크 처리를 CPU로부터 오프로드하여 시스템 전체의 성능을 향상시키는 데 중요한 역할을 한다. 그리하여 네트워크 서비스를 SmartNIC로 오프로드 하여 CPU 점유율을 줄이고 시스템의 효율성을 높이는 데 큰 이점을 제공한다. 본 논문에서는 NVIDIA의 DOCA와 AMD의 SSDK를 소개하며, SmartNIC에서 구현된 다양한 보안 서비스들을 살펴보고자 한다.
-
본 논문에서는 오펜시브 보안 관점에서 ANTLR4 를 이용한 모바일 앱 정적 분석 자동화를 통해 API 서버에서 제공하는 엔드포인트와 파라미터 정보를 알아낸다. 이를 통해 API 서버에 잔존하는 레거시 엔드포인트를 식별할 뿐만 아니라 API 서버를 대상으로 퍼징 및 블랙 박스 테스팅과 같은 취약점 점검의 초석을 마련한다.
-
분산 서비스 거부(DDoS) 공격은 대규모 네트워크 운용 환경에서 탐지 및 대응이 지연될 경우 심각한 피해를 초래할 수 있는 중대한 보안 위협이다. 이러한 위협을 효과적으로 방어하기 위해 규칙기반 탐지, 머신러닝, 딥러닝 등을 활용한 다양한 탐지 기법들이 활발히 연구되고 있다. 본 연구에서는 기존 공개된 실험망 데이터 기반의 DDoS 탐지 연구 한계를 극복하기 위해 상용망에서 수집된 실제 데이터를 활용하여 연구하였다. 또한, 다양한 머신러닝 알고리즘을 활용하여 DDoS 탐지 성능을 비교·분석하고, 이를 통해 상용망 환경에 최적화된 머신러닝 기반 DDoS 탐지 시스템을 제안한다.
-
디지털화의 가속화는 사이버 공간에 대한 의존도를 크게 증가시키고 있다. 군사, 금융, 의료, 통신 등 주요 인프라는 네트워크를 통해 상호 연결되면서 효율성을 극대화하고 있지만, 동시에 사이버 공간의 중단이 가져오는 영향성에 취약해지는 구조가 형성되어 지고 있다. 대표적으로, 2022년 발발한 러시아-우크라이나 전쟁에서 러시아는 사이버 공간과 물리적 공간을 활용한 공격 수단을 통해 우크라이나의 주요 인프라를 마비시키려는 시도를 하였다. 그러나 우크라이나는 높은 사이버 복원력(Cyber Resilience)을 바탕으로 이러한 공격에 능동적으로 대응할 수 있었고, 인프라 마비를 효과적으로 방어하였다. 이에 따라, 러시아의 일방적인 승리로 끝날 것이라는 초기 예측과 달리, 우크라이나는 물리적 전투뿐만 아니라 사이버 공격 속에서도 지속적으로 저항하며 전쟁을 이어가고 있다. 본 연구에서는 IT 환경 변화에 따른 안보 위협과 이를 극복하기 위한 국가 사이버 복원력 제고를 위한 고려사항을 분석하기 위해 우크라이나-러시아 전쟁에서의 사이버 복원력이 발휘된 사례를 분석하고, 그로부터 도출되는 시사점과 향후 연구 방향을 제시한다.
-
차량의 증가와 함께 교통 안전에 대한 관심이 높아지면서, 운전자 프로파일링에 대한 필요성이 증대되고 있다. 또한, 자율주행 기술의 발전과 자동차 보안 문제의 증가로 운전자 식별 연구의 중요성도 커지고 있다. 이에 본 연구는 차량의 CAN-bus 데이터와 스마트폰 센서 데이터를 직접 수집하여 운전자를 식별하는 새로운 방법을 제안한다. 기존의 생체 인식 정보나 운전자의 이미지를 활용하는 방법과 달리, 본 연구는 주행 중 수집된 정량적 데이터를 이용해 프라이버시 위험을 최소화하였다. 특히, 다양한 주행 상황에서 직접 수집한 CAN-bus 및 센서 데이터를 기반으로 한 멀티모달 퓨전 기법을 통해 운전자의 행동 및 반응을 정밀하게 분석하였다. 실험 결과, 제안된 방법이 기존 방법보다 정확하게 운전 습관을 식별하였으며, 운전자 식별의 정확성을 높여 미래의 운전자 프로파일링 연구에 기여할 수 있을 것으로 기대된다.
-
현재 국내에서 클라우드를 사용하는 기업들은 고도화된 정보기술과 보안체계를 구축하여 다양한 서비스를 제공하고 있지만, 중요한 데이터의 노출을 막기 위한 데이터 보안 기술을 갖추고 있는 경우는 드물다. 이로 인해 데이터 유출 사고 발생 시 원인만을 파악할 뿐 실질적인 대안을 갖추지 않은 상황이다. 본 연구에서는 국내 클라우드 환경에서 데이터 노출을 최소화하기 위한 데이터 보안 관리체계인 DSPM 모델의 초안을 제안한다.
-
북한의 사이버 위협은 점점 정교해지고 있으며, 이러한 상황 속 산업시설을 겨냥한 악성코드 공격은 국가 안보에 치명적인 영향을 미칠 수 있다. 본 논문은 스턱스 넷, 에칸스 랜섬웨어, 콜로니얼 파이프라인 랜섬웨어를 분석하고 산업시설 보안 강화 방안을 제시한다. 스턱스 넷은 이란 핵 시설의 PLC 를 조작해 공격을 시도했고, 에칸스는 랜섬웨어 공격을 통해 혼다의 자동차 생산 공장을 마비시켰으며, 콜로니얼 파이프라인 랜섬웨어 또한 감염을 통해 시설을 마비시켰다. 위 공격사례를 분석하고, 이에 대응하기 위한 6 가지 대응 전략을 소개한다.
-
동적 패치는 은행 시스템, 산업 제어 시스템 등 24시간 가동되는 프로그램에서 중요하며, 제어 흐름 정보를 최소화해 동적 패치의 효율성을 높일 수 있다. 논문에서는 제어 흐름 정보 없이 x86_64 바이너리를 재작성할 수 있는 도구인 E9patch를 기반으로, Dyne9patch라는 동적 패치 도구를 구현했다. 피보나치 수열을 출력하는 프로그램을 통해 Dyne9patch의 동적 패치 적용 가능성을 확인했으며, 후속 연구로는 자동화된 패치 적용 도구 개발을 제안하고 있다.
-
랜섬웨어는 등장 이후 지속적으로 진화하여, 현재는 RaaS(Ransomware-as-a-Service) 형태로 배포되고 있으며, PC뿐만 아니라 모바일 기기까지 공격 대상으로 삼고 있다. 이와 같이 고도화된 랜섬웨어에 대응하기 위해 탐지, 차단, 복구 기술 또한 발전해 왔다. 특히 복구와 관련해서는 메모리 덤프를 통해 복호화 키를 추출하거나, 취약한 암호 알고리즘을 이용해 키를 추출하는 연구가 활발히 진행되고 있다. 그러나 여전히 랜섬웨어 복호화는 어려운 과제로 남아 있다. 메모리 덤프나 공격자의 실수로 키를 추출할 수 있는 경우도 있지만, 기기 재부팅이나 강력한 암호화 알고리즘이 사용되면 복호화가 어렵다. 본 논문에서는 안드로이드 랜섬웨어를 대상으로 프로그램 변조를 통해 복호화하는 방법을 제안한다. 우리는 두 가지의 실험을 통해 안드로이드 랜섬웨어의 내부 로직을 수정하였고, 복호화가 가능함을 확인하였다.
-
CPU의 결함은 보안적인 측면뿐만 아니라 경제적인 측면에서도 큰 손해를 발생시킨다. 최신 연구로 Differential Fuzzing을 이용하여 CPU RTL의 버그를 탐지하는 방법이 소개되었지만 전반적인 CPU 코어의 모듈을 탐색하기에 패치 테스트, 버그 재생산 및 새로운 모듈만을 검사하기에는 시스템 자원이 많이 낭비될 수 있다. 이에 본 연구에서는 Differential Fuzzer의 ISA 시뮬레이터에 Directed Greybox Fuzzer를 적용하여 그 결과를 분석하고 시스템 자원을 효율적으로 사용할 수 있는 Directed Differential Fuzzing 방법을 제안한다.
-
프롬프트 인젝션 공격은 입력 프롬프트의 조작을 통해 대형언어모델(LLM)로 하여금 AI 모델의 의도된 동작을 벗어나 공격자로 하여금 허가되지 않은 동작을 수행하게끔 하거나 민감한 정보를 탈취하도록 하는 방식의 공격유형으로, LLM 의 무결성과 신뢰성에 심각한 위협이 될 수 있다. 본 논문에서는 LLM 에 대한 프롬프트 인젝션 공격을 직접 프롬프트 인젝션 공격과 간접 프롬프트 인젝션 공격으로 분류하고, 특히 현재 다양하게 연구되고 있는 직접 프롬프트 인젝션 공격의 다양한 유형을 간단한 예시를 통해 개괄적으로 소개하고자 한다. 또, 이러한 프롬프트 인젝션 공격의 잠재적인 영향과 이에 대한 대응 전략을 제안한다.
-
정보기술 분야의 발전으로 인해 정보의 중요성, 보안성, 기밀성, 개인 정보에 대한 보호가 더욱 강조되고 있다. 여러 정보보호 기술 중 스테가노그래피는 이미지, 텍스트, 오디오, 비디오 파일과 같은 적절한 멀티미디어 매체에 비밀 데이터를 숨기는 기술이다. 하지만 최근 악성코드는 탐지를 회피하기 위한 기술로 스테가노그래피를 사용하고 있다. 또한 인공지능의 발전으로 인해 인공지능을 활용한 스테가노그래피 공격 기법과 연구들이 점차 증가하고 있다. 본 논문에서는 스테가노그래피를 이용한 공격 기법과 해당 기술이 적용된 악성코드들의 사례에 대해 분석하고, 스테가노그래피를 활용한 악성코드의 대응 방법에 대한 향후 연구를 소개한다.
-
최근 피싱 키트의 고도화와 LLM의 등장, 그리고 다양한 통신 매체의 사용으로 인해 피싱 공격이 증가하고 있다. 이러한 피싱은 인간이 정상적인 상호작용인지 아닌지 구분하기 어렵게 하며 다양한 방식을 통해 탐지를 우회한다. 특히, 이와 같은 피싱으로 인해 개인 또는 단체 등 민감한 정보의 탈취가 발생하며, 정보 탈취 이후 추가적인 피해가 일어나므로 사용자의 정보가 탈취당하기 전에 피싱인지 아닌지 탐지를 수행해야 한다. 따라서 피싱으로부터 사용자를 보호하기 위해 다양한 매체들로 부터 피싱 이메일, 메시지 등의 콘텐츠 수신과 피해자의 링크 클릭, 피해자 스스로 자격증명을 입력하는 과정에서 탐지하는 것이 중요하다. 본 논문에서는 피싱 방식별 위협 모델 소개와 탐지기법을 분류하고 각각의 피싱 탐지기법이 보유한 도전과제에 대해 소개한다.
-
We introduce a novel method to defend against model inversion attacks in Federated Learning (FL). FL enables the training of a global model by sharing local gradients without sharing clients' private data. However, model inversion attacks can reconstruct the data from the shared gradients. Traditional defense mechanisms, such as Differential Privacy (DP) and Homomorphic Encryption (HE), have limitations in balancing privacy and model accuracy. Our approach selectively encrypts more important gradients, which contain more information about the training data, to balance between privacy and computational efficiency. Additionally, optional DP noise is applied to unencrypted gradients for enhanced security. Comprehensive evaluations demonstrate that our method significantly improves both privacy and model accuracy compared to existing defenses.
-
LibOS는 전통적인 운영체제의 커널을 응용 프로그램 수준의 라이브러리로 재구성한 시스템이다. 애플리케이션이 운영체제의 다양한 기능을 호출할 때 기존 운영체제처럼 무겁고 복잡한 커널과 직접 상호작용하는 대신, 가벼운 라이브러리 형태로 제공하여 시스템의 메모리 사용량을 줄이고 성능을 향상시킨다. 또한 각 애플리케이션이 독립적인 프로세스처럼 동작할 수 있도록 지원하여 보안 격리를 유지한다. 대표적으로 LibOS는 Intel SGX와 결합되어 시스템 호출을 줄이고, Enclave 내에서 대부분의 작업을 수행하여 공격 표면을 줄인다. 본 논문에서는 LibOS가 Intel SGX와 같은 보안 기술을 사용한 연구에 대해 소개한다.
-
클라우드 컴퓨팅은 적은 초기 비용만으로도 효율적인 자원 관리와 서비스를 이용할 수 있는 기술이다. 이러한 장점으로 인해 클라우드 서비스를 이용하는 개인과 기업의 비율이 갈수록 증가하고 있지만 이에 따른 보안 사고도 비례하여 증가하고 있다. 클라우드 내에서 보안 사고가 발생하면 클라우드 포렌식을 통한 조사가 신속하게 이루어져야 하는데 다양한 사용자의 자원이 공유되고 있는 멀티-테넌트 환경이 증거 수집을 지연시킨다. 또한 위치에 상관없이 접근하여 수정이 가능하다는 클라우드의 특성이 증거 변조의 위협성을 높여 클라우드 포렌식을 어렵게 한다. 따라서 본 논문에서는 클라우드 포렌식의 한계를 완화하기 위해 클라우드 서비스를 이용하기 전에 맺는 SLA(Service Level Agreement)의 한계에 대해 분석하고 그에 따른 개선 방안을 제안하고자 한다.
-
WebAssembly(WASM)은 다양한 환경에서 높은 성능을 제공하는 바이트코드 형식의 언어이다. 본 논문에서는 WASM 바이너리 보안을 강화하기 위한 동적 분석 기법인 Fuzzm, Wasabi, Taint Assembly를 분석하며, 각 기법의 장점과 한계점을 다룬다. 또한, 동적 분석과 정적 분석을 융합한 새로운 기법의 필요성을 기반으로 향후 진행되어야 할 연구 방향에 대해 살펴본다.
-
ARM MTE(Memory Tagging Extension)는 안전하지 않은 언어로 작성된 코드에 존재할 수 있는 메모리 취약점을 탐지하는 것을 목표로, ARMv8.5-A 아키텍처에 도입된 새로운 하드웨어 기능이다. MTE는 메모리 포인터에 대해 추가 메타데이터로 각 메모리 할당/해제 시에 태그를 지정한다. 런타임 시에 포인터와 메타데이터의 태그를 확인하는 절차를 거치게 되며, 이를 통해 가장 일반적인 메모리 버그의 원인이 되는 Use-After-Free, Buffer Overflow와 같은 취약점을 탐지할 수 있다. 본 논문에서는 MTE를 이용한 메모리 보호 기술 연구들의 동향을 분석하고, 해당 연구의 지속적인 필요성을 제시한다.
-
신뢰 실행 환경(TEE)은 클라우드 컴퓨팅에서 작업의 기밀성과 무결성을 보장하는 기술이다. 신뢰 실행 환경 기술들은 기밀성을 위해 암호화된 메모리를 사용해 외부의 공격자가 실제 값을 알지 못하도록 사용자의 데이터를 보호한다. 암호화 과정에서 AES 암호화를 사용하여 메모리를 암호화하며, 그 중에서 XEX와 XTS 방식을 사용한다. 그러나 이런 암호화 방식은 고정된 물리 주소의 메모리 블록에 대해 결정적으로 암호화되어 공격자가 암호문에 대한 평문을 유추하는 암호문 부채널 공격에 취약할 수 있습니다. 본 논문에서는 신뢰 실행 환경에서 발생할 수 있는 암호문 부채널 공격이란 무엇인지 분석하고, 그에 대한 대응 방안과 그 한계점을 제시한다.
-
현대 사이버 위협의 복잡성이 증가함에 따라 이상행위 및 위협징후 탐지를 위한 AI 기반 기술 사용이 크게 증가하고 있다. 본 논문은 AI 기반 이상행위 및 위협징후 탐지의 최신 동향을 분석하여 AI 기반 이상행위 탐지 시스템의 탐지 정확도를 높이는 메커니즘과 위협징후 탐지 속도를 가속화하는 기술에 대해 논의한다. 연구 결과에 따르면, AI 기반 모델은 기계 학습 알고리즘의 발전, 보다 다양한 학습 데이터셋, 최적화 기술 덕분에 정확도와 속도 모두에서 개선을 보이고 있다. 본 논문은 현재의 동향과 이들이 AI 기반 보안 시스템의 미래에 미치는 영향을 종합적으로 다루고자 한다.
-
본 연구는 호스트기반 침입탐지시스템(HIDS)에서 윈도우 크기와 임계치 설정이 성능에 미치는 영향을 분석하였다. 그 결과, 윈도우 크기와 임계치에 따라 성능 변동이 크게 나타났으며, 고정된 최적값 대신 각 시스템의 환경과 위험 허용도에 맞춰 윈도우 크기와 임계치를 조정하는 방안을 제안한다.
-
오류 주입 공격(Fault Injection Attack)은 시스템에 의도적으로 오류를 주입하여 취약점을 드러내는 강력한 공격 기법으로, 공격에 사용되는 매개변수 탐색 최적화는 제한된 시간 내 성공적인 공격을 위해 필수적인 기술이다. 본 논문에서는 인공지능(Artificial Intelligence) 기반 알고리즘, 특히 유전 알고리즘(Genetic Algorithm, GA)과 미메틱 알고리즘(Memetic Algorithm, MA)이 오류 주입 매개변수 탐색 최적화에 어떻게 적용되었는지 사례를 통해 살펴보고, 이러한 기법들이 기존의 무작위 탐색(Random Search, RS) 방법에 비해 높은 탐색 효율성과 성공률을 어떻게 달성했는지 분석한다. 또한, 각 알고리즘의 장단점을 비교하여 평가하고, 오류 주입 공격의 정밀도와 효율성을 더욱 향상시키기 위한 추가 연구 방향을 제안한다.
-
본 논문은 소스 코드에 내재된 취약점을 탐색하기 위해 대형 언어 모델을 취약점 탐색 태스크에 맞게 파인튜닝하여 사용하는 최신 연구들을 소개한다. 각 연구에서 대형 언어 모델을 활용하여 중점적으로 해결하려는 문제와 솔루션을 설명하고, 향후 연구 방향을 조망하려 한다.
-
Binary Code Similarity Detection (BCSD) plays a critical role in software security applications like vulnerability detection and malware analysis. This review surveys both traditional and machine-learning-based approaches to BCSD. Traditional methods, such as control flow graph matching and symbolic execution, have demonstrated effectiveness but suffer from scalability issues, particularly with obfuscated code. Modern machine learning techniques, including graph neural networks and deep learning models, offer improved adaptability across architectures and scalability. Despite these advancements, challenges remain in cross-platform detection, handling obfuscation, and deploying BCSD tools in real-world security scenarios. The review highlights recent innovations and outlines potential future directions for enhancing the robustness and efficiency of BCSD systems.
-
클라우드 도입이 확산됨에 따라 보안 위협 역시 지속적으로 증가하고 있다. 특히, 클라우드 시스템에서 데이터를 안전하게 관리하기 위해 TLS 프로토콜을 사용해 네트워크 연결을 암호화하지만, 관리자의 잘못된 설정으로 인해 데이터 유출의 위험이 존재할 수 있다. 본 연구에서는 TLS 프로토콜을 통해 암호화된 통신에서 사용되는 설정 정보를 확인하고, Traffic Control BPF (TC-BPF) 기술을 적용하여 현 클라우드 시스템 내 TLS 구성 정보를 수집하는 방법을 제안한다. 또한, 이를 바탕으로 수집된 정보를 기반으로 취약한 설정을 분석하고 로그를 생성하는 시스템을 구현하였다. 그 결과, 네트워크 지연 시간에 약 1.3%의 성능 저하만을 발생시켰으며, 수집된 로그를 기반으로 암호화 알고리즘의 취약성을 효과적으로 분류할 수 있었다.
-
최근 인간의 인지 능력을 모방한 지능형 MTD 연구가 주목받고 있다. 지능형 MTD는 기존 전략에 성능 오버헤드를 줄이고 더 강력한 보안 시스템을 제공한다는 점에서 향후 미래 보안 기술로 예상된다. 본 논문에서는 지능형 시스템과 MTD 전략에 관한 연구들을 검토한다. 연구 논문에서는 지능형 MTD를 위한 관점 분류 연구에 초점을 맞춘다. 그 후, 해당 관점에 일치하는 추가적인 연구논문을 조사하여 향후 지능형 MTD의 연구 방향을 제시한다. 지능형 MTD는 동적 방어 체계의 효율성을높이고 공격자의 공격에 적응하여 최적의 전략을 선택할 수 있는 방어 체계로서 미래 보안의 중요한 역할을 수행할 것이다.
-
본 연구는 네트워크 프로그램의 취약점을 신속하게 탐지하기 위해 Directed Fuzzing 기법을 적용한 ProtoGo를 제안한다. Directed Fuzzing은 특정 목표 지점을 집중하여 탐색하는 데 효과적이지만, 기존 기법들은 네트워크 프로토콜의 복잡한 상태 전이를 충분히 고려하지 못하는 한계가 있다. 이를 해결하기 위해, 본 연구에서는 정적 분석을 통해 프로토콜의 상태 기계를 생성하고, 각 상태와 함수 호출 간의 관계를 추적하여 효율적인 탐색 경로를 제공하는 도구를 설계하였다. 향후 연구를 통해 ProtoGo의 프로토타입을 구현하고, 성능을 검증할 예정이다.
-
커널은 운영 체제의 핵심 요소로 시스템 자원과 하드웨어를 관리하고 주요 시스템 서비스를 실행한다. 현대 프로세서의 대부분을 차지하는 모놀리식 커널은 모든 커널 기능이 동일한 메모리 공간과 동일한 높은 권한으로 실행되어 하나의 취약점이 시스템 전체를 위협할 수 있다. 이를 해결하기 위해 내부 커널 격리를 이용한 연구가 진행되어 왔다. 본 논문에서는 내부 커널 격리를 이용해 커널 보안을 강화한 최근 연구들에 대해 알아보았다.
-
현대 인터넷 인프라의 핵심 요소 중 하나인 DNS 는 도메인 이름을 IP 주소로 변환하여 사용자가 원하는 웹사이트에 접근할 수 있게 한다. 이 과정에서 다양한 레코드 형식이 사용되는데, 그중 TXT 레코드는 이메일 인증 및 도메인 소유권 검증과 같은 중요한 역할을 수행한다. 그러나 최근 TXT 레코드의 사용이 증가하면서 무분별한 남용 사례가 발생하고 있으며, 이는 성능 저하 및 보안 위협을 초래할 수 있다. 본 논문은 국내 인터넷 환경에서 DNS TXT 레코드의 사용 현황을 최초로 조사 및 분석한 연구로, 84,005 개 도메인에서 57,680 개의 TXT 레코드를 수집하여 TXT 레코드의 분포 및 오남용 사례를 파악하였다. 이를 통해 TXT 레코드 남용이 시스템 성능 및 보안에 미치는 영향을 규명하고, 향후 효과적인 관리 방안을 제시하고자 한다.
-
본 논문은 ROS2 환경에서 사용 가능한 다양한 퍼징 도구들을 조사함으로써, 이 분야의 연구 동향을 분석하고자 한다. 최근 로보틱스의 활용 범위가 확대됨에 따라 ROS 보안 취약점에 대한 우려 또한 증가하고 있다. 이에 따라, ROS2 환경에 특화된 다양한 퍼징 테스트 도구들의 기능, 효율성 및 적용 사례를 비교 분석하여 ROS2 의 보안 강화에 기여할 수 있는 방안을 모색한다. 또한, 현존하는 퍼징 도구들의 한계를 진단하고, 이를 개선한 새로운 퍼징 도구 개발의 필요성에 대해 논의한다.
-
본 논문은 자동차 보안에서 Secure Timing 의 중요성과 다양한 시간 동기화 방법들을 분석한다. 기존의 일반적인 Secure Timing 방법들과 자동차 환경에서의 차이점을 설명하고, 실시간성 및 보안 요구사항을 충족하기 위한 자동차 보안에 특화된 방법들을 소개한다.
-
본 연구는 현대 자동차 산업에서 급증하는 사이버 보안 위협에 대응하기 위한 하드웨어 기반 보호기법들을 종합적으로 분석한다. 특히 하드웨어 보안 모듈(HSM), 신뢰 플랫폼 모듈(TPM), 그리고 ARM TrustZone 기술에 초점을 맞추어, 이들의 기본 개념, 특징, 그리고 자동차 보안 시스템에서의 적용 사례를 살펴본다.
-
RISC-V 는 Open-source ISA 로 2010 년 제안된 이후 상용화를 위해 많은 연구가 진행되고 있다. 다양한 하드웨어적 보안 기법과 최적화가 이루어지고 있지만, 오픈소스 RISC-V 코어에 부채널 공격에 대한 방어 기법이 부족한 것을 확인하였기에 상용화할 RISC-V 코어에 부채널 공격 방어 기법이 적용되어야 더욱 안전한 사용이 가능하다. 또한 기존에 개발된 코어에 대한 통일된 환경에서의 성능 비교 및 분석은 따로 진행되지 않아 상용화할 코어를 선정할 근거 역시 부족한 상황이다. 따라서 본 논문에서는 부채널 공격 방어 기법을 구현할 RISC-V 코어를 선정하기 위해 각 코어에 대한 성능 분석 및 비교를 진행한다. 이를 통해 기존 시스템의 보안 코어를 대체할 수 있는 코어를 선별하여 추후 방어 기법 구현에 활용한다.
-
스마트카드 기술은 현대 사회의 다양한 영역에서 광범위하게 활용되고 있으며, 그 중 보안은 가장 중요한 고려 사항으로 인식되고 있다. 본 연구에서는 스마트카드에 적용된 다양한 보안 기술의 구현 방식과 실제 상용화된 카드에서의 적용 사례를 분석한다. 이를 통해 스마트카드 보안 기술의 최신 연구 동향을 파악하고, 향후 기술 발전 방향에 대한 전망을 제공하고자 한다.
-
동형암호는 암호화된 상태에서도 연산을 수행할 수 있는 암호이다. 양자컴퓨터 시대가 눈앞에 도래한 지금 양자컴퓨터에도 안전한 격자 문제에 기반을 둔 동형암호가 적용될 수 있는 분야는 무궁무진하다. 하지만 동형암호만으로는 프라이버시 즉 기밀성은 보장하지만 무결성이 보장되지 않는다. 따라서 기밀성과 무결성 모두를 보장하라는 요구를 만족시킬 수 있는 개념의 암호체계가 등장했는데 바로 동형 인증 암호이다. 이 논문에서는 동형 인증 암호와 이를 적용할 수 있는 응용 분야 중 하나인 동형 제어 기술에 대해 소개하고, 무선통신을 사용하는 사이버 물리 시스템을 안전하게 제어하기 위해 기존에 적용된 보안 기술과 비교하여 동형 인증 암호를 적용한 사례는 어떤 기대효과를 누릴 수 있는지 살펴본다. 이를 통해 제어기가 해킹되지 않도록 하는 안전성에 중점을 둔 '보안 비용'과 하드웨어 가속, 알고리즘 최적화로 '실시간 제어'가 가능하게 하는 기술의 최적화가 적절한 조화를 이룰 수 있도록 설계하는 연구의 상업적 효과에 대해 탐구한다.
-
대용량 데이터 처리 시 발생하는 CPU-메모리 간 성능 격차(performance gap)로 인한 병목 현상은 현대 컴퓨팅 시스템의 주요 과제이다. 본 논문에서는 이를 극복하기 위한 새로운 아키텍처인 PIM(Processing-In-Memory)을 소개하고, PQC(Post-Quantum Cryptography) 및 FHE(Fully Homomorphic Encryption)와 같은 암호학 분야에서 PIM 을 적용하여 처리 지연(latency)을 완화하고 성능 향상을 보인 사례를 분석한다. 각 구현 사례에 대해 기존 아키텍처 대비 구체적인 성능 향상 결과를 제시하며, 최신 연구 동향을 정량적으로 평가한다.
-
본 연구는 자동차 데이터 보안을 위한 키 관리 기법의 최신 동향을 분석한다. 중앙집중형, 분산형, 그리고 블록체인 기반의 키 관리 방식을 비교 분석하며, 각 방식의 기술적 특징과 장단점을 심도 있게 고찰한다. 특히 차량 내부 통신과 차량 간 통신 보안을 통합적으로 고려하는 접근 방식의 필요성을 강조한다.
-
기존 경계형 보안 모델의 한계로 인해 제로 트러스트 아키텍처의 도입이 기업의 필수 과제로 부상하고 있다. 그러나 제로 트러스트 아키텍처로의 전환은 장기적인 과제이며, 빅뱅 방식으로 접근할 경우 큰 리스크와 높은 비용이 발생할 수 있다. 본 논문에서는 신뢰점수(Trust Score)기반 클라이언트 접근제어 기법을 제안함으로서 기존 구축된 인프라와 제로트러스트 아키텍처 간의 가교가 되는 점진적인 전환을 시도하고자 한다. 제안된 기법이 제로트러스트 패러다임에 적합하며 적용 후 제로트러스트 성숙도 수준이 향상되는 것을 확인하였다.
-
고성능 컴퓨팅을 위한 기술로 병렬 컴퓨팅의 중요성이 대두되고 있다. 이에 이 논문에서는 널리 사용되고 있는 아키텍처인 x86 아키텍처와, 오픈 소스와 전력 효율의 장점을 가지고 최근 각광 받는 RISC-V 아키텍처에서 병렬 연산을 이용한 4x4 행렬 곱셈의 성능을 비교 분석하였다. 그 결과 RISC-V 의 최적화가 추가적으로 필요함을 확인하였다. 본 연구는 RISC-V 의 벡터 연산 성능을 향상시키기 위해 향후 연구 방향을 제시한다.
-
오픈 소스 소프트웨어 공급망의 성장과 함께 악성 패키지 탐지가 중요한 과제가 되고 있다. 기존의 정적 분석과 동적 분석은 시간이 많이 소요되기 때문에, 본 연구에서는 이를 해결하기 위해 메타데이터 분석을 도입했다. 또한, 외부 메타데이터에 의존하는 기존 탐지 모델의 한계를 극복하고자, 내부 메타데이터만을 활용하여 배포 초기에도 RubyGems 에서 악성 패키지를 신속하게 탐지할 수 있는 모델을 제안한다. 실험 결과, 제안한 모델은 평균 97.63%의 정확도로 우수한 성능과 빠른 탐지 속도를 보여, 내부 메타데이터 기반의 탐지 방식의 가능성을 확인하였다.
-
이번 글로벌 IT 대란에서 국내 금융 및 공공 분야는 '망 분리' 규제 덕분에 피해가 미미했으나, 클라우드 확산이 가속화되면서 향후 이러한 보호가 약화 될 가능성이 있다. 클라우드 도입이 불가피한 상황에서 서비스 제공자와 고객 간의 분쟁 예방 및 해결 방안 마련이 필수적이다. 이번 사태는 규제 강화보다는 사이버 공급망 위협에 대한 선제적 대응과 IT 역량 강화를 위한 기회로 삼아야 한다.
-
본 논문은 자동차에서의 안전한 데이터 저장 및 공유 기술에 대한 최근 동향을 조사한다. 블록체인 기술을 이용한 데이터 관리 방식을 중점적으로 살펴보며, 비동기식 연합학습, 컨소시엄 블록체인, 엣지 컴퓨팅 결합 등의 접근법을 분석한다. 이러한 기술들이 데이터 무결성, 프라이버시 보호, 시스템 효율성 향상에 기여함을 확인하고, 향후 연구 방향과 과제를 제시한다.
-
Se-Ok Jeon;Hyeonji Jang;Min-Soo Jeung;SeoJun Lee;Da-Young Oh;Kwang-hoon Choi;Seokhwi Kim;Sungwoo Cho;Jwongmi Kim 273
오픈소스 코드 재사용은 비용 절감과 생산성을 높이지만, 관리의 복잡성으로 인해 취약점이 발생할 수 있다. 본 논문은 전기차 충전 인프라에서 사용되는 오픈소스 소프트웨어의 취약한 코드 복제를 탐지하는 방법을 제안한다. VUDDY 와 IoTCube 를 활용해 분석한 결과, open-ocpp 에서 zlib 복제로 인한 취약한 코드 클론 사례가 발견되었으며, 이는 CVE-2016-9840 및 CVE-2016-9841 과 관련이 있었다. 연구는 코드 복제 취약점 탐지를 통한 전기차 충전 인프라 보안 강화 가능성을 보여주었다. -
Collaborative inference combines diverse features contributed by various agents to improve prediction accuracy. However, it is vulnerable to adversarial attacks, where attackers manipulate the model's predictions through non-consensual inputs. Since each participant operates within their unique feature space, defending against these attacks becomes particularly challenging. A recent study demonstrated that using an auto-encoder based on the underlying manifold can reduce the impact of malicious participants. However, our experiments observed that the recently proposed attack, in which malicious influences close to the manifold, may still pose a threat. To address this issue, we introduce a novel approach that leverages implicit redundancy across participants' feature spaces during the inference stage via participant-wise anomaly detection. We evaluate this approach on CIFAR10, CINIC10, Imagenette, Give-Me-Some-Credit, and Bank Marketing datasets. Extensive experiments and ablation studies show that RIP effectively mitigates adversarial attacks in the collaborative inference stage.
-
ROS(Robot Operating System)은 복잡하고 분산된 로봇 애플리케이션 개발을 위해 유연한 프레임워크다. ROS 는 다양한 소프트웨어 컴포넌트 간의 통신을 가능하게 하는 미들웨어로, 로봇 제어 시스템 구축에 필요한 도구와 라이브러리를 제공한다. 본 논문에서는 ROS2 에 대한 소개 및 ROS2 대상 보안 기능을 제공하는 SROS2 에 대한 소개를 하고자 한다. 최근 SROS 를 대상으로 하는 취약점 연구들이 제안되고 있는데 이러한 취약점은 접근 정책을 우회하거나 시스템의 설정에 관한 정보를 탈취할 수 있는 위험이 있다. 본 논문은 이러한 취약점이 시스템의 보안성에 미치는 영향을 설명하고 최근 ROS 을 대상으로 하는 취약점들을 알아보고자 한다.
-
스마트 계약은 다양한 형태의 계약을 체결하고 이행할 수 있게 해주는 오늘날 가장 인기있는 기술 중 하나이다. 그러나 적절히 구현되지 않은 스마트 계약은 공격 대상이 될 수 있으므로 버그 탐지 기법의 개발과 적용이 중요하다. 본 논문에서는 스마트 계약에서 발생하는 주요 버그 유형과, 이를 탐지하기 위한 최신 연구 동향을 조사한다. 이를 통해 스마트 계약의 안전한 구현과 블록체인 네트워크의 지속 가능한 발전에 기여하고자 한다.
-
본 논문에서는 악성코드 탐지를 위한 정적 분석 기반의 새로운 기법을 제안한다. 본 연구는 악성코드 파일에서 Opcode와 Call Graph를 각각 추출하고, 이를 바탕으로 두 가지 머신러닝 모델을 학습한 후 앙상블 기법을 사용하여 최종적으로 악성코드를 분류하는 방법론을 제시한다. Opcode 기반 분석에서는 어셈블리어를 추출하여 정규표현식을 이용해 명령어를 추출했고 N-gram 기법을 활용해 명령어의 흐름을 분석한다. Call Graph 분석에서는 함수 호출 관계를 추출하고 Diffpool 기법을 통해 그래프를 벡터화한다. 제안된 시스템은 개별 모델의 장점을 결합하였고 적은 데이터에 비해 높은 정확도와 탐지율을 달성한다. 특히, 신종 악성코드나 변종 악성코드를 탐지하는 데 있어서 기존 서명 기반 기법에 비해 더 높은 성능을 보일 가능성이 높다. 실험 결과, 91%의 정확도와 88%의 재현율을 보여주어 높은 결과를 나타냈다. 본 연구는 악성코드 탐지 분야에서 정적 분석 기법의 가능성을 제안한다.
-
Software vulnerabilities impose a significant burden on developers, particularly in debugging and maintenance. Automated Software Vulnerability Repair has emerged as a promising solution to mitigate these challenges. Recent advances have introduced learning-based approaches that take vulnerable functions and their Common Weakness Enumeration (CWE) types as input and generate repaired functions as output. These approaches typically fine-tune large pre-trained language models to produce vulnerability patches, with performance evaluated using Exact Match (EM) and CodeBLEU metrics to assess similarity to ground-truth patches. However, current methods rely on teacher forcing during fine-tuning, where the model is trained with ground-truth inputs, but during inference, inputs are generated by the model itself, leading to exposure bias. Additionally, while models are trained using the cross-entropy loss function, they are evaluated using discrete, non-differentiable metrics, resulting in a mismatch between the training objective and the test objective. This mismatch can yield inconsistent results, as the model is not directly optimized to improve test-time performance metrics. To address these discrepancies, we propose the use of reinforcement learning (RL) to optimize patch generation. By directly using the CodeBLEU score as a reward signal during training, our approach encourages the generation of higher-quality patches that align more closely with evaluation metrics, thereby improving overall performance.
-
이 연구는 웹 애플리케이션 보안에서 흔히 발생하는 CWE-79(XSS) 취약점을 탐지하기 위해 정적 분석 도구와 동적 분석 도구의 이론적 비교를 수행하였다. SonarQube와 OWASP ZAP을 중심으로, 두 도구의 탐지 메커니즘과 장단점을 분석하고, 이들이 보안 점검에 미치는 영향을 논의하였다. 연구 결과, 정적 분석 도구와 동적 분석 도구는 상호 보완적인 관계에 있으며, 두 도구를 결합하여 사용할 때 취약점 탐지의 효율성과 정확도가 크게 향상될 수 있음을 확인하였다. 또한, 이 연구는 AI 기반 탐지 기법을 도입하기 위한 기초 자료를 제공하며, 향후 연구에서 AI를 활용한 보다 정교한 보안 분석 기법을 개발할 가능성을 제시하였다. 이번 연구는 실질적인 실험 데이터를 포함하지 않았지만, 이론적 분석을 통해 정적 및 동적 분석 도구의 보안성 강화 방안을 모색하고, 보안 분석 기법의 발전을 위한 기초 데이터를 마련하였다.
-
임베디드 시스템이 급속도로 고도화됨에 따라 임베디드 기기에서의 어플리케이션 또한 공격자에게 넓은 공격 표면으로 작용하게 되었다. 임베디드 기기의 역할이 이전보다 다양해짐에 따라 공격자가 민감한 개인정보를 탈취하거나 온디바이스 AI 모델을 탈취하는 등 임베디드 기기에 대한 공격 가치가 올라가고 있고, 그에 따라 임베디드 기기에 대한 보안 중요도 또한 이전보다 증가하고 있다. 본 연구에서는 임베디드 기기에서의 소프트웨어 보안 기법 연구 동향을 종합적으로 조사하고 분석하여 이들에 유효성을 평가하고 향후 새로운 임베디드 기기에서의 소프트웨어 보안 기법 연구 전략에 대한 제언을 제시하고자 한다.
-
디지털 헬스케어에서 의료기기 소프트웨어의 보안은 환자 데이터 보호와 기기 기능 유지에 있어 매우 중요하다. 현재 많은 의료기기 소프트웨어는 보안 취약점에 노출되어 있으며, 특히 CWE-94(코드 삽입)와 Hollowing Process 같은 공격 기법이 문제로 대두되고 있다. 이러한 취약점은 보안 솔루션의 우회를 가능하게 하며, 의료 기기의 무결성과 환자 안전을 위협할 수 있다. 본 논문에서는 동적/정적 리버싱 도구를 활용하여 이러한 취약점을 탐지하고 분석하는 방법을 제시 및 진행중이며 이를 통해 의료 기기 소프트웨어의 보안을 강화하는 데 기여할 수 있다.
-
Use After Free(UAF) 취약점은 의료 소프트웨어, 의료 시스템, 임베디드 시스템 등 다양한 분야에서 널리 사용되고 있는 보안 취약점이다. C/C++는 메모리를 직접 할당하고 해제하는 작업을 프로그래머가 수동으로 수행하기 때문에 UAF의 발생 가능성이 높다. UAF는 과거로부터 현재까지 해결되지 않은 버그로써 존재하고 있으며, [1]2023년CWE 제일 위험한 취약점 Top25중에 4위를 차지하고 있다. 본 논문에서는 C/C++가 널리 사용되는 만큼 UAF를 빠르고 정확하게 탐지하기 위한 연구내용과 성능 결과를 소개한다.
-
BLE 기술은 저전력과 효율적인 데이터 전송을 제공하지만, 통신 프로토콜의 결함을 악용한 키스트로크 주입 공격과 같은 보안 위협이 존재한다. 본 논문에서는 리눅스 커널의 BlueZ 패키지에서 발생한 CVE-2023-45866 취약점을 중심으로, 해당 공격의 원리와 심각성, 그리고 이를 해결하기 위한 패치를 분석한다. BLE 네트워크의 보안을 강화하기 위해서는 지속적인 연구와 대응이 필요하며, 보안 위협에 대한 대응 방안을 개발하고, 사용자의 보안 의식을 높이는 교육이 필수적임을 강조한다.
-
동형암호는 MLaaS (Machine Learning as a Service)가 만연한 이 시대에 각광받고 있는 프라이버시 보호 기술 중 하나이다. 하지만 동형암호를 적용하게되면 데이터 크기가 굉장히 커지고, 비싼 연산으로 인하여 큰 overhead 가 발생한다. 따라서 더 효율적인 스케줄링을 통하여 이 overhead 를 최소화하였으며, 실험결과 총 latency 의 18%를 감소할 수 있었다.
-
추측 최적화의 적절하지 못한 구현으로 인해 발생하는 취약점에 대한 연구는 Spectre, Meltdown 등 주로 CPU에서 발생하는 취약점에 초점을 맞추어 활발히 이루어지고 있으나, 브라우저 엔진 및 프로그래밍 언어 구현체 등의 소프트웨어 수준에서 추측 최적화의 적절하지 않은 구현으로 인해 발생하는 Type confusion을 검출하려는 연구는 없었다. 본 연구에서는 소프트웨어 내 추측 최적화의 적절하지 않은 구현으로 인해 발생할 수 있는 취약점으로 Type confusion을 제시하고, 이를 Type check 미흡에 의한 Type confusion, 적합하지 못한 추측에 의한 Type confusion 2개로 분류해 정의하였다. 이 중 적절하지 못한 추측에 의한 Type confusion을 검출할 수 있는 방법론을 설계하였다.
-
AI 기술의 발달과 생성형 AI의 등장은 기업의 생산성을 높이는데 기여하며, 비즈니스 모델에 새로운 패러다임을 일으켰다. 그러나 생성형 AI는 중요 데이터와 일반 데이터를 구분할 수 없어 기업의 핵심 정보와 같은 치명적인 정보가 외부에 유출될 수 있는 문제가 발생한다. 이러한 이유로 많은 기업이 생성형 AI 사용을 제한하고 있으나, 생성형 AI로 얻을 수 있는 경제적 이점을 포기하기 어려운 상황이다. 따라서, 본 연구는 안전한 데이터 관리 및 유출 방지를 위해 보안 위협과 이를 해결할 기술을 분석한다.
-
양자내성암호(PQC, Post Quantum Cryptography)는 기존 컴퓨터 시스템과 양자 컴퓨터 시스템에서 모두 보안성을 보장하는 암호체계이다. NIST 에서 표준화로 선정된 네 가지 알고리즘을 보면, 그 중 세 가지의 알고리즘이 모두 격자기반 알고리즘임을 알 수 있다. 이에 따라 격자기반 알고리즘에서 공통되는 연산을 통합하여 효과적으로 구현하려는 연구들이 진행되고 있으며, 그 중에는 RISC-V 를 통한 하드웨어/소프트웨어 통합 설계 연구 그리고 FPGA 혹은 ASIC 을 이용한 하드웨어 통합 모듈 가속 연구들이 있다. 본 논문에서는 효과적인 하드웨어 설계를 위해 세 종류의 격자기반 양자내성암호 연산을 분석하고, 이를 하드웨어에서 효과적으로 구현한 기존 연구 사례를 분석한다. 이를 통해 통합 모듈 가속 기법 연구를 위해 고려되는 면적 대비 연산성능 그리고 면적 대비 소비전력 등의 수치를 높이는 과정에서 발생하는 문제점과 이를 효과적으로 극복하는 방법들을 소개한다.
-
악성코드에 의한 공격은 연평균 수억 건 이상 발생하고 있으며, 큰 폭으로 증가하는 악성코드 개수에 비해 악성코드 분석가가 각 악성코드를 분석하고 대응하기에는 한계가 있다. 이와 같은 한계를 극복하기 위한 방법으로 악성코드 자동 분석 시스템을 사용하는 방법이 있다. 그러나 악성코드에 Anti-VM 기술들이 포함된 경우 자동 분석 시스템에서는 제대로 탐지하기 어렵다는 단점이 있다. 본 논문에서 Anti-VM 기술에 활용되는 API 와 API 의 파라미터 정보를 분석하여 API 후킹 모듈을 기반으로 Anti-VM 탐지 우회 방법을 제안한다. Anti-VM 기술은 Virtual Box 기반의 가상 환경을 탐지하는 기술을 기준으로 연구를 진행하였고 API 및 파라미터 또한 Virtual Box 기반의 가상 환경을 탐지할 때 활용되는 API 및 파라미터를 분석하였다. 분석한 데이터를 기반으로 Anti-VM 기술을 우회하기 위한 API 및 후킹 프로그램을 제작해서 연구를 진행하였다. 연구 결과 Virtual Box 기반의 가상 환경을 탐지하는 기술 중 시간 딜레이, 마우스 이벤트 등의 행위 기반 탐지 기술은 명확한 지표를 측정하기 어려워 우회가 어려웠으나 가상 환경 특성 탐지, 파일 아티팩트 탐지, 레지스트리 및 시스템 설정 탐지 기술은 식별 및 우회에 뛰어난 성능을 보였다.
-
Recently, automotive security is gerning significant attention due to the gradual surge in cyberattacks on automotive systems experienced by the industry over the past few years. These cyberattacks stem from the widened attack surface especially caused by increased connectivity and architectural complexity in modern automotive systems. Hardware Trust Anchors (HTAs), a known security technology in the cyber space, have been suggested as a candidate means to prevent automotive cyberattacks. In this paper, we analyze the effectiveness of HTAs in preventing automotive cyberattacks, and the current challenges adopting existing HTAs for automotive security. Simultaneously, we shed a light on complementary cyber defenses that may accompany HTAs to further enhance automotive security.
-
침해사고 대응팀의 성숙도를 진단하는 대표적인 모델인 SIM3와 SOC-CMM는 침해사고 대응팀의 설립 또는 운영 초기단계의 조직에 적용시 제한된 기술과 역량으로 인해 성숙도 진단 및 평가에 오판을 유발한다. 본 연구는 이러한 한계를 보완하는 개선된 성숙도 진단모델을 제시한다.
-
본 연구에서는 FlowSpectrum을 활용하여 암호화된 트래픽 분류의 성능을 개선하기 위한 양자화 기법을 제안한다. 통신 기술의 발전으로 인해 암호화된 트래픽의 양이 증가하고 있으며, 이는 네트워크 관리 및 보안 모니터링에 어려움을 초래하고 있다. FlowSpectrum은 오토인코더를 통해 암호화된 트래픽에서 추출된 데이터를 1차원 표준 좌표계에 다양한 간격의 스펙트럼 선으로 표현하는 새로운 특징으로, 복호화 없이도 데이터 추출이 가능하다. 본 연구에서는 FlowSpectrum 기반 암호화된 트래픽 분류에서 양자화 수준에 따른 분류 성능의 변화를 분석하였으며, 실험 결과 3자리 양자화에서 가장 높은 성능을 보였다. 이는 양자화가 FlowSpectrum의 특성을 효과적으로 활용할 수 있는 방법임을 시사하며, 향후 다양한 데이터셋에 대한 적용 가능성을 탐색하고 양자화 기법의 최적화를 통해 성능 향상을 도모할 예정이다.
-
데이터 프라이버시에 대한 관심이 높아지면서 여러가지 프라이버시 보호 기술에 대한 연구가 활발히 이루어지고 있다. 대표적인 프라이버시 보호 기술로는 동형암호, 다자간연산, 신뢰실행환경, 차등 프라이버시 등이 있다. 본 논문은 다자간 연산의 대표적인 기술인 가블드 회로를 외부 서버에 안전하게 위탁하여 연산할 수 있는 기술에 대해 소개한다.
-
동형암호는 프라이버시 보존형 신경망 연산을 가능캐한다. 하지만 동형암호는 비산술연산을 직접 연산하지 못해 근사식을 활용하는데, 신경망 정확도 하락을 일으킨다. 이를 극복하기 위해 재학습, Neural Architecture Search 등 방법들이 등장했지만, 큰 소요시간을 필요로 한다. 본 연구는 이 둘보다 빠르면서도 정확도 하락을 적게 일으키는 중간값 유도 근사식 생성 기술을 제안한다.
-
동형암호 기반 클라우드 서비스는 평문대비 큰 동형암호문의 크기로 인해 통신부하가 발생한다. 본 논문은 이러한 통신부하를 줄이기 위한 방법으로 신뢰실행환경(Trusted Execution Environment, TEE) 기반 프록시 암호화를 활용하는 방법을 제안하고, 실험을 통해 큰 동형암호 파라미터에서의 유용성과 성능이 뛰어남을 보여주고자 한다.
-
본 연구는 ECG(Electrocardiogram)를 활용한 질병 분류 기술 개발을 목표로 1D CNN을 설계하여 ECG 데이터를 분석하였다. MIT-BIH Arrhythmia Database를 사용해 전처리 후 1D CNN 모델로 시계열 데이터에서 질병 분류에 유효한 특징을 추출하였다. 훈련 데이터에서는 약 81.91%의 정확도를 기록했으나, 검증 데이터에서는 57.5%로 성능 편차가 확인되었다. 이는 데이터 불균형의 영향으로 보이며, ECG가 비침습적이면서도 보안성이 높은 생체 신호로서 질병 분류에 유망하다는 것을 시사한다. 향후 연구에서는 다양한 데이터셋과 모델 고도화를 통해 성능을 개선할 계획이다.
-
광고 및 트래커 차단기를 사용하는 웹 사용자의 비율이 증가함과 동시에, 트래커 구현 기법 또한 빠르게 발전하고 있다. 최근 트래커 개발자는 다양한 단위 (granularity)에서 웹 사이트의 핵심 기능과 트래커를 묶어 기존 이분법적 분류 및 차단 방식을 제한하고 있다. 정밀한 트래커 탐지 및디블로팅 필요성이 대두되는 가운데, 트래커의 문장 (statement) 단위 식별과 트래커의 모든 소스 (source)를 고려한 분석 기술의 부재를 확인하였다. 따라서 본 연구는 실행 컨텍스트 (execution context) 기반의 동적 분석 도구 설계를 통해 트래커와 웹 사이트 기능의 리소스 상관관계를 분별함과 동시에, dynamically executed script를 최대한 호출하여 트래커를 문장 단위에서 정밀하게 탐지 및 디블로팅하는, Mixed Script Guard를 설계하였다.
-
합성데이터는 통계적 특성이 유사한 가상의 데이터로, 개인정보 보호 및 데이터 부족 문제를 해결하는 데 기여한다. 이를 관계형 데이터베이스로 확장한 관계형 테이블 합성데이터는 금융, 통신 등 다양한 응용 분야에서 사용되고 있으며 이에 대한 유용성과 안전성을 평가하는 다양한 지표들이 개발되어왔다. 그러나 현재 사용되는 평가지표는 단일 테이블이나 여러 테이블을 하나로 결합한 후 평가하는 경우가 많아 관계형 데이터의 복잡한 구조를 충분히 반영하지 못한다는 한계가 있다. 따라서 본 논문은 관계형 테이블 합성데이터 평가 시 기존 지표에 대한 한계를 분석하고, 데이터 간 관계 보존을 효과적으로 평가할 수 있는 포괄적 평가 지표의 필요성을 강조하며, 이를 위한 향후 지표 개발 방향성을 논의한다. 본 연구는 관계형 테이블 합성데이터의 신뢰성과 품질을 높이는 데 중요한 기여를 할 것으로 기대된다.
-
현대 사회에서 큰 문제중 하나인 보이스 피싱은 다양한 기술을 사용하여 많은 사람에게 피해를 주고 있다. 이러한 문제를 해결하고자 많은 시도가 있었고 그 중 한 방법이 인공지능을 활용하여 보이스 피싱을 탐지하는 방법이다. 하지만 인공지능을 활용하는 과정에서 데이터 프라이버시 보장이 이루어지지 않는 문제가 발생한다. 본 논문에서는 이러한 문제를 해결하고자 연합학습을 사용한 개인정보 보호에 특화된 보이스 피싱 탐지 기술을 제안한다. 연합학습은 사용자의 데이터를 중앙 서버로 전송하지 않고 로컬 디바이스에서 학습한 모델만을 서버로 전송하여 개인정보 유출을 방지하는 인공지능 학습 방법이다. 또한 스노클을 활용한 오토 데이터 라벨링 기법을 적용하여 피싱 여부를 자동으로 분류하고 탐지 성능을 향상시킨다. 본 기술은 일반적인 인공지능 학습 기술과 비교하여 좋은 성능을 보이며 특히 피싱 탐지에서 중요한 부분인 긍정 클래스 예측 부분에서 높은 성능을 보이고 있다.
-
본 논문에서는 TFHE(Fast Homomorphic Encryption over the Torus)의 가속화를 위한 다양한 CUDA 기반 라이브러리인 cuFHE, nuFHE, (RED)cuFHE의 성능을 비교 분석하였다. 각 라이브러리의 최적화 기법과 GPU 자원 활용 방식이 동형암호 연산의 처리 속도에 어떻게 영향을 미치는지 실험을 통해 확인하였으며, 이를 통해 상황에 맞는 라이브러리 선택의 중요성을 강조하였다. 특히, 본 연구는 각 라이브러리의 특징과 차이점을 상세히 분석함으로써, 효율적이고 실용적인 TFHE 가속화 방법에 대한 가이드라인을 제공한다. 이러한 연구 결과는 동형암호 기술의 실용성을 높이고, 고속화된 암호 연산이 필요한 다양한 분야에서 활용될 수 있는 기반을 마련할 것으로 기대된다.
-
2023 년 개정된 개인정보보호법(PIPA)의 요구사항을 기반으로 표준화된 로그 형식을 활용하여, 관계형 데이터베이스(RDB)에서 리스크(risk) 기반의 모델을 적용함으로써 최근 증가하고 있는 대내외 개인정보 유출을 범용적으로 탐지할 수 있도록 하였다. 이를 통해, 중소기업도 대기업과 유사한 수준의 보안 대응 능력을 갖출 수 있도록 지원하고, 로그 데이터를 활용하여 비정상적인 접근 패턴을 식별할 수 있도록 하며, 최소한의 리소스로도 효율적인 모니터링 체계를 구축할 수 있는 방법론을 구현하고자 한다. 이러한 접근 방식은 중소기업이 법적 요구를 충족할 뿐만 아니라, 비용 효율적인 보안을 통해 대기업 수준의 보안 강화 효과를 얻을 수 있도록 모델을 제시한다.
-
기존 중앙 집중형 게임의 주요 문제로 아이템 현금거래 사기 범죄가 대두된다. 블록체인의 탈중앙화와 투명성, 불변성을 기반으로 게임이 운영된다면 문제를 해결할 수 있을 것이다. 본 논문에서는 블록체인 기술을 사용한 NFT(Non-Fungible Token) 게임을 제안한다. 인게임 재화는 모두 ERC-20 토큰으로, 아이템은 모두 ERC-721 토큰으로 생성하여 고유한 아이템을 이용자가 소유한다. 이러한 블록체인 기반 아이템 소유권은 안전한 아이템 거래 기능을 제공한다.
-
Solana, a high-performance blockchain platform, is known for its fast transaction speeds and low operational costs, making it a popular choice for decentralized applications. However, its architecture introduces unique security vulnerabilities in smart contracts. This paper presents an analysis of six key vulnerabilities in Solana smart contracts-missing ownership checks, missing signer checks, arithmetic overflow/underflow, cross-program invocation (CPI) vulnerabilities, account confusion, and missing key checks. We further evaluate how automated verification tools like VRust and fuzzing techniques detect these vulnerabilities. Through case studies of widely-used Solana programs like Mango Markets and the Solana Program Library (SPL), we illustrate the effectiveness of these tools in real-world scenarios.
-
블록체인은 네트워크 참여 노드 간 합의를 통해 동일한 원장을 분산 저장하여, 원장에 저장된 데이터의 신뢰성을 보장할 수 있다. 하지만 원장 데이터가 모든 노드에 중복 저장되는 문제가 있고, 이를 해결하기 위해 Reed-Solomon 코드를 적용하여 저장 효율성을 높일 수 있다. 이 논문에서는 허가형 블록체인 하이퍼레저 패브릭에서 Reed-Solomon 코드를 적용하여 원장을 저장 저장하는 경우, 분산 저장된 부호화 블록 파일의 비동기적 복구과정으로 인한 문제를 다루고, 동기화 제어 방안을 설계하여 해결 방안을 제시한다.
-
하이브리드 블록체인은 퍼블릭, 프라이빗 각 플랫폼의 특성을 활용한 비즈니스 거래를 지원할 수 있는 블록체인 기술이다. 현재 하이브리드 블록체인은 트랜잭션 데이터의 특징에 기반하여 운영을 지원하는 방법이 부족하여 원활한 비즈니스 거래 지원을 수행하기 어렵다. 따라서, 본 논문에서는 비즈니스 거래를 지원하는 방안을 하이브리드 블록체인 트랜잭션 추적 지원 아키텍처를 통해 제시한다. 제안하는 방법은 사례 시스템을 구성하여 아키텍처의 적용 가능성을 보이고 시각화 결과를 나타내었다. 또한 트랜잭션 추적 시 평균 0.599초의 실행 시간이 소요됨을 실험을 통해 확인하였다. 본 논문에서 제시하는 아키텍처는 하이브리드 블록체인 운영의 기반으로 적용할 수 있을 것으로 기대된다.
-
저궤도 위성통신과 AI 기반 정보처리 시스템이 융합되면 향후 우리 사회의 핵심 인프라가 될 것으로 전망된다. 본 연구에서는 이와 관련된 국제 논문들로부터 새로운 지식 발견 및 새로운 응용과 정책을 발굴하고자 다양한 텍스트 마이닝 방법을 적용한다. 단어 통계, ngram, 단어 임베딩, 두문어 추출, 토픽모델링 등의 텍스트 마이닝을 적용하여 텍스트 데이터로부터 핵심 기술 정보를 추출하여 분류하고, 새로운 지식을 발견하여 이 분야의 기술에 관련한 지식을 효율적으로 파악할 수 있었다.
-
혀의 동작과 떨림은 건강 상태를 평가하는 중요한 지표로, 혀의 움직임을 정확히 추적하려면 영상분석 기술을 사용하여 물체의 움직임을 추적해야 합니다. 이 연구에서는 표면 특징이 불명확한 혀의 미세한 움직임을 명확히 보기 위해 광류(optical flow) 기술을 사용해 움직임을 확대했습니다. 이를 위해 이미지 확대(upsampling) 알고리즘과 광류 벡터 확대 알고리즘 두 가지 방법을 비교하여, 혀 움직임을 더 정밀하게 추적할 수 있는 방법을 찾고자 했다. 연구 결과, 벡터 확대 알고리즘이 더 정확한 광류를 생성하는 것으로 나타났다. 이는 이미지 확대에서 발생할 수 있는 aliasing 효과를 줄이고, 움직임의 방향과 속도를 더 정확히 표현하기 때문이다. 이러한 방법은 혀뿐만 아니라 초음파 영상을 통한 위장관이나 심장의 움직임을 정밀하게 추적하는 데도 유용할 수 있다. 이 연구는 광류 기반 움직임 분석이 다양한 의료 영상에서 유용하게 사용될 수 있는 가능성을 보여주며, 향후 진단과 치료모니터링에 중요한 도구가 될 수 있음을 시사한다.
-
질병은 인간의 삶과 사회에 큰 영향을 미치며, 천식은 주변 사람들이 쉽게 그 심각성을 인지할 수 있는 질환이다. 천식의 유병률에도 불구하고 광범위한 데이터를 사용하여 천식 발병을 예측하는 연구가 부족하다. 그리하여 본 연구는 딥러닝 모델을 활용하여 기상데이터, 대기 오염 물질 수준, 천식 환자 수를 딥러닝 모델로 학습하고자 한다. 날짜, 위도, 경도 좌표를 기준으로 데이터가 병합되며 생성된 통합 데이터세트에서는 천식 환자 수를 결과변수로 사용하고, DNN과 LSTM 모델을 사용해 지도학습을 수행하며 모델의 성능은 MSE 및 MAE를 지표로 사용하여 평가한다. 본 연구는 질병 발생을 사전에 예측함으로써 잠재적인 질병 발생에 대한 사전 정보를 제공하고 의료인력 배치를 최적화하며 의료 서비스의 전반적인 효율성을 향상시켜 사회적 이익을 향상시키고자 한다.
-
수목의 품종을 연구하고 특성을 규명하기 위해 특성조사요령에 따라 특성 분석이 시행된다. 특성조사요령은 신품종 개발 및 품종 보호 출원을 위한 재배심사에 필요한 특성별 조사 방법을 규정하고 있다. 하지만 수목의 특성 분석 과정에서 연구자의 주관이 개입될 가능성이 있으며, 특성 분석의 신뢰성에 부정적인 영향을 미칠 수 있다. 본 연구에서는 딥러닝 모델을 활용하여 영상 속에서 수목을 검출하고, 특성조사요령에 규정된 특성들의 '표현 형태'를 출력하는 시스템을 구현함으로써 수목 특성 분석의 신뢰도를 높이고자 한다.
-
본 논문에서는 자연·인적재해로 인한 건물, 도로 붕괴 시, 신속하고 안전한 이동을 위해 위성 이미지를 U-Net 딥러닝 학습모델과 A* 알고리즘을 활용하여 위험지역을 우회한 경로 제안 시스템을 구현하였다. 이를 실제 재해 상황에 도입하면 안전이 확보된 최단 거리를 제공함에 따라 신속한 대피와 구호 등 재난 관리에 효율성을 제공하여 인명 및 물적 피해를 줄일 수 있을 것으로 예상한다.
-
국가연구개발 사업의 성과관리는 국가의 연구개발 결과물에 지대한 영향을 미치기 때문에 매우 중요하다. 하지만 많은 참여기관이 동시에 사업을 수행하는 과정에서 연구개발 성과를 사람이 관리하는 것에는 한계가 존재한다. 특히 1년 이상의 추적이 필요한 성과관리의 경우 사전에 성과달성 여부를 판단하기가 어렵다. 따라서 이러한 성과관리의 일정관리 및 사전 성공예측을 위해서는 AI 기반의 알고리즘을 적용하여 성과관리를 할 수 있는 SW 기본 설계방안이 필요하며, 본 연구는 이를 구현하기 위한 성과관리의 이슈 분석을 통해 AI 기반의 성과관리 방안을 제시하고자 한다.
-
정보기술의 발전으로 여러 분야에 머신러닝 기법이 적용되고 있는 중, 금융·경제 분야는 낮은 신호 대 잡음 비, 머신러닝의 낮은 설명 가능성으로 인하여 머신러닝 활용의 확산이 더디게 일어나고 있다. 이러한 문제점을 해결하고자 웨이블릿 변환을 이용하여 금융데이터의 노이즈를 제거하고 설명 가능성을 높인 딥러닝 모델인 Temporal Fusion Transformer를 활용하여 금융·경제 분야 내 머신러닝 적용의 한계를 극복하는데 기여하고자 한다.
-
NCM 양극재는 높은 에너지 밀도로 인해 전기차 배터리에 널리 사용되며, 더 큰 용량과 긴 수명을 제공한다. 그러나 충방전 과정에서 발생하는 성능 저하는 양극재의 열화와 관련이 있다. 이를 억제하기 위해 고종횡비의 긴 막대 형태의 일차 입자를 설계하여 미세 균열과 화학적 열화를 방지하는 것이 중요하다. 본 연구는 OpenCV를 활용해 양극재 단면의 전자현미경 이미지를 분석하고 양극재 일차 입자의 배향성과 종횡비를 정량적으로 분석하여, 배터리 소재 연구에서 더 객관적이고 신뢰성 있는 데이터를 제공하고자 한다.
-
본 연구는 Capital Market 에서 LLM 기반의 포트폴리오 자산운용 중 ETF, MMF, TD, 자산배분형 상품, 채권형펀드 등 고객에게 제공하는 자산운용 보고서를 자동으로 생성하는 시스템을 개발하고 평가했다. GPT-4, M2M-100, KoBART 모델을 결합해 번역, 요약, 보고서 작성 과정을 자동화했으며, 생성된 보고서와 원문 자산운용 보고서 간 평균 코사인 유사도는 90% 이상을 기록했다. 이 AI 시스템은 기존 방식 대비 효율성을 향상시켰으며, 금융 분야에서의 실용적 가치를 확인하였다.
-
본 논문은 기상, 기후, 농업, 환경 등 자연현상을 대상으로 가까운 미래를 예측하는 다양한 모델들의 상호 연계에 필요한 컨테이너 플랫폼 기술을 제시하고자 한다. 컨테이너 기반의 클라우드 플랫폼에서 과학적 예측을 위한 요소 모델들을 마이크로서비스 형태의 컨테이너로 구성하고, 이러한 컨테이너들이 서비스메시 형태로 구성하는 플랫폼 모델을 제시하고 분석하고자 한다.
-
전동휠체어 등 소형 이동체에서의 자율 주행 기능 구현을 위해 노면 상태에 따른 이동 방향의 의도치 않은 변경을 감소시켜 이동체가 안정적으로 직진하는 방법이 필요하다. 본 논문에서는 ROS에서 제공하는 IMU 센서값을 이용하여 소형 이동체가 안정적으로 직진하는 방법을 제안한다. 본 논문에서 제안한 방법이 ROS 기반 소형 이동체의 직진 안정성 향상에 효과가 있음을 보이기 위해 다양한 노면 환경에서 ROS2 기반 터틀봇3를 직진 이동시키는 실험을 하였다. 실험 결과는 본 논문에서 제안한 방법이 ROS2 기반 소형 이동체의 직진 안정성 향상에 효과가 있음을 보였다.
-
본 연구에서는 YOLOv8 모델을 활용해 다양한 회의 종류를 인식할 수 있는 모바일 애플리케이션을 개발하였다. 완성된 애플리케이션은 사용자가 모둠회 사진을 촬영하면, 학습된 딥러닝 모델이 이미지를 처리하여 해당 회의 종류를 인식한다. 본 논문에서는 애플리케이션의 시스템 설계와 구현 과정, 성능 평가 결과를 제시하며, 사용자가 실시간으로 인식 결과를 확인할 수 있는 기능을 중점적으로 다룬다.
-
본 논문은 도박중독 수준에 따라 중독자를 선별하는 선형회귀 기반의 기계학습 모델을 제안한다. 도박인구는 점차 증가하고, 청소년들도 도박을 경험하며 문제가 심각하다. 도박중독 유병률을 조사하는 것은 향후 발생할 도박으로 인한 문제를 해결하는 것에 도움이 된다. 제안 모델은 한국판 도박 문제 선별척도(K-Canadian Problem Gambling Index) 데이터를 기반으로 학습하였고, 개인의 중독 수준에 따라 도박중독자를 분류한다. 본 모델은 도박중독 수준에 따라 신속하고 정확하게 도박중독자를 구분함으로써 도박중독 치료 연계와 함께 도박중독률을 낮추는 데 기여할 것이다.
-
본 논문은 기계학습을 활용하여 성인 스마트미디어 중독의 잠재적 위험성을 분류한다. 스마트미디어와 매체는 계속해서 증가하고 발전하고 있다. 스마트미디어 중독에 대한 위기의식은 최근에야 형성되었고 현재 스마트미디어 중독 치료프로그램은 미비한 상황이다. 일반인이 쉽게 센터에 접근할 수 없으며, 센터에 방문해 심리검사를 받더라도 척도 해석과정이 존재한다. 이를 성인 스마트미디어 중독 경향성 예측척도와 기계학습을 활용하여 보완할 수 있다. 본 논문에서 제안하는 모델은 기계학습을 활용해 검사 채점 절차가 간소화되어 시간 비용을 절감할 수 있다. 또한 스마트미디어 사용과 관련된 문제에 대한 보다 효과적인 대응 전략을 마련하는 데 효과적이며, 스마트미디어 중독의 위험을 줄이고, 건강한 사용 습관을 장려하는 데 기여한다.
-
본 연구에서는 NIR 근적외선 LED를 활용한 비접촉 무구속 방식의 정맥 검출 카메라를 제작하고 촬영된 영상을 신호처리 알고리즘을 통해서 처리하여 비접촉 방식의 정맥 검출기를 개발하였다.
-
인공지능 기술이 급속도로 발전하고 있음에도 암환자의 방사선 치료 계획시 종양 경계를 임상의가 여전히 수동으로 설정하고 있다. 본 연구에서는 2 차원 및 3 차원 의료영상에서 종양 및 정상 조직을 자동으로 분할하고 시각화 해주는 소프트웨어 도구를 소개하고자 한다. 개발된 소프트웨어는 사용자의 개입을 최소화하고, 분할하고자 하는 관심 영역에 따라 파라미터 설정을 달리할 수 있다. 오픈 소프트웨어 3DSlicer 와 종양의 활성, 괴사, 부종 영역에 대한 분할 정확성을 DSC(Dice similarity coefficient)로 평가했으며, 비슷하거나 더 우수한 결과를 보였다. 특히, 초기 컨투어 설정부터 최종 분할 마스크 획득까지 처리 시간이 약 36.3% 더 빠른 결과를 보였다. 개발된 의료영상 분할 소프트웨어는 종양 및 정상 조직 분할을 용이하게 하여, 인공지능 지도 학습에 필요로 하는 라벨링 작업을 지원할 수 있을 것으로 사료된다.
-
최근 사이버 공격의 지능화와 다양화로 인해 네트워크 보안의 중요성이 더욱 부각되고 있다. 특히, 악성코드를 포함한 악성 패킷은 시스템 감염 및 정보 유출과 같은 심각한 피해를 초래할 수 있으므로 이를 효과적으로 탐지하고 차단할 수 있는 기술 개발이 필수적이다. 기존의 인공지능 기반 침입 탐지 시스템은 다양한 성능 지표(정확도, 정밀도, 재현율 등)의 균형을 맞추기 위해 단일 분류 모델을 기반으로 구축되어 왔다. 본 연구에서는 모든 악성 패킷을 놓치지 않고 탐지하기 위해, 특히 리콜(Recall) 지표를 극대화하는 것을 목표로 하여 오버샘플링 기법을 적용하였다. 이를 통해 기존 시스템의 한계를 보완하고, 모든 사이버 공격에도 효과적으로 대응할 수 있는 새로운 성능 평가 기준의 필요성을 제시하고자 한다.
-
Otsu 알고리즘은 픽셀 값의 분포를 분석해 이미지를 두 개의 클래스로 나누는 최적의 임계값을 산출하는 기법으로, 주로 의료 영상 처리, 산업 자동화 등 다양한 분야에서 객체를 구분 지을 때 활용되고 있다. 이미지마다 적합한 임계값을 계산하는 Otsu 알고리즘을 통해 객체 구분에 널리 활용되는 엣지 검출 가속기의 정확도 또한 향상시킬 수 있다. 그러나 Otsu 알고리즘은 복잡한 연산으로 인해 하드웨어 사용량이 제한된 조건에서 구현하기 위해서는 효율적인 설계가 필요하다. 이에 본 논문에서는 Otsu 알고리즘 연산을 하드웨어에 효율적인 방식으로 구현한 히스토그램 기반 연산을 활용한 엣지 검출 하드웨어 가속기를 제안한다.
-
양식장에서 넙치의 감염성 질병으로 인한 폐사율이 높아 넙치의 행동을 모니터링하고 질병을 조기에 진단할 수 있는 기술 개발이 중요해졌다. 이 문제를 해결을 위해, 본 논문에서는 딥러닝 기반의 DeepLabCut 모델을 활용하여 넙치의 위치를 추적을 실험한다. 실험 결과, 학습된 모델은 3마리의 넙치가 포함된 제한된 환경에서 안정적인 추적 성능을 보였으나, 다수의 넙치가 있는 복잡한 환경에서는 위치 추적 성능이 저하되었다. 특히, 움직이는 넙치보다는 정지된 넙치의 위치를 더 잘 인식하는 경향이 있었고, 위치를 잘못 인식하거나 추적이 중단되는 문제도 발생하였다. DeepLabCut는 제한된 환경에서 효과적이나 실제 양식 환경에서 다수의 넙치를 정확하게 추적하기 위해서는 모델의 성능 향상과 더 다양한 데이터 확보가 필요하다.
-
반도체 장비는 여러 가지 요인(화재, 부품 고장 및 노후화 등)에 의해 가동이 중지되거나 더 이상 운용할 수 없는 경우가 자주 발생한다. 반도체 생산 중 장비의 고장은 전체 제조공정을 중단시켜 기업의 생산 원가 비율을 상승시키는 원인이 된다. 이를 해결하기 위해 장비에 온도, 진동, 전력 센서를 부착하고, 각각의 센서에서 실시간으로 수집되는 데이터를 Auto-Encoder 모델로 분석하여 반도체 장비의 고장의 사전 예측 정확도를 향상시켰다.
-
본 논문은 비순환 방향 그래프(directed acyclic graph) 로 파이썬 함수들을 호출하는 방법을 다룬다. 이전에 개발하였던 함수 실행 스케줄러에서 동일 함수 별칭으로 다시 호출하면 발생하는 순환 참조 문제를 해결하기 위한 추가적인 연구 개발을 진행한다. 함수를 실행하는 순서를 사전에 파악하여 순환을 탐지하도록 파이썬 3.9 버전부터 지원하는 비순환 방향 그래프 기반 위상정렬 패키지로 각 그래프 정점에 함수를 할당하여 그래프가 하나의 시나리오로 동작할 수 있도록 한다.
-
본 연구는 신경망 모델을 사용하여 얼굴형을 분류한 후, 미디어파이프를 활용한 사용자의 손치수 측정에 근거해 골격 유형 분석을 통해 맞춤형 스타일을 추천하는 애플리케이션을 개발한다. 이를 통해 기존 진단 방식의 시간과 비용 문제를 해결하고, 개인의 신체 특징에 맞는 객관적 스타일링 서비스 제공을 목표로 한다.
-
ClothesMe 는 시각장애인을 위한 인공지능 기반 의류 도우미 서비스이다. VGG16, MobileNetV2의 Pre-training 모델을 의류 데이터 셋으로 전이학습 시킨 두 개의 의류 종류 및 패턴 분류 신경망 모델과 색상 추출 라이브러리로 의류 이미지를 인식한 후 의류 종류 및 패턴 그리고 색상을 음성으로 안내한다.
-
인공지능과 자연어 처리 기술 발전으로 ChatGPT는 프로그래밍 분야에서도 활용될 수 있다. ChatGPT로 생성한 문제를 학습 도구로 사용하기 위해 테스트 케이스의 정확성을 검증하는 것은 필수적이다. 본 연구는 ChatGPT를 통해 프로그래밍 문제, 정답 코드, 테스트 케이스를 생성하고 이들의 정확성을 평가하고자 한다. 생성된 테스트 케이스의 정확성을 높이기 위해, 본 연구에서는 5번의 반복적인 테스트 케이스 생성 및 검증 과정을 거쳐 최종적으로 87.8%의 정확성을 달성했다. 이는 ChatGPT를 통한 프로그래밍 학습의 신뢰도를 높일 수 있음을 보여준다.
-
궤도상 서비싱(On-Orbit Servicing)이란, 우주 공간의 궤도에서 비행하는 인공 물체를 대상으로 상태를 점검 및 수리하거나 궤도 수정 또는 궤도 내 자세 유지, 연료 재급유, 부품 교체, 우주 쓰레기 제거 등을 제공하는 서비스이다. 이는 위성 수명 연장 및 재사용성 증대를 통한 인적, 시간적 비용절감 결과를 가져온다. 이러한 임무를 수행하기 위해서는 대상이 되는 객체를 안전하게 고정하고 유지하는 캡처 및 도킹 과정이 필요하며 데이터는 실시간 모니터링으로 감지한다. 이때, GNC(유도, 항법, 제어) 시스템의 프레임워크는 항공우주 분야에서 우주 비행체가 임무를 수행할 때 필수적인 기능을 통합하고 관리하며 수행하는 구조적 틀을 제공한다. 센서, 알고리즘, 제어기, 항법 장치 등 연관된 하드웨어와 소프트웨어가 유기적으로 작동하도록 구성되어 있으며 비행체가 목표를 정확히 수행하도록 돕는 핵심적인 역할을 한다. 본 논문에서는 기존 궤도상 서비싱의 해외 연구 현황을 파악하여 임무 사례를 통한 GNC 시스템 프레임워크의 분석을 토대로 추후 국내 궤도상 서비싱 GNC 서브시스템 프레임워크 설계 시 적용 방안에는 어떤 것이 있을지에 대하여 연구한 내용을 서술하고자 한다.
-
마이크로서비스 아키텍처는 마이크로서비스 간 약결합을 통한 높은 확장성과, 개별 배포를 통한 유지보수성을 제공하는 애플리케이션 구축 방법이다. 그러나, 마이크로서비스 아키텍처는 표준적인 배치방식이나 연결 방법이 부족하여, 마이크로서비스 아키텍처의 전문적인 지식 없이 마이크로서비스 단위를 구분하고 약결합 구조를 배치하기에는 어려움이 있다. 따라서, 본 논문에서는 마이크로서비스 아키텍처의 BCE 패턴 기반 배치 방안으로 마이크로서비스의 기능 및 약결합 구조를 생성형 AI로 학습하는 방법을 제시한다. 제안하는 방법에 따라 생성형 AI 모델인 GPT-3.5-turbo를 바탕으로 파인튜닝 한 결과 파인튜닝 모델을 활용한 배치 정답률이 14% 향상되는 것을 확인하였다. 또한, 파인튜닝 학습 요소의 반영률을 조절하여 모델의 비교 평가를 수행한 결과로 f1-score가 0.019 증가한 것을 통해 파인튜닝 요소가 정답을 결정하는 데 필요한 요소임을 확인하였다.
-
Current State & Improvement of Temporary Operation Permit System based on data for Automated Vehicle시험·연구목적의 자율주행자동차의 일반도로 주행을 위한 임시운행 허가제도는 2016년 최초 시행되었다. 시행 이후 허가 대수는 매년 급증하고 다양한 형태의 자율주행자동차 약 460여대가 전국에서 시험운행 중에 있다. 따라서, 자율주행자동차의 임시운행허가제도는 민간기술개발을 지원하기 위한 제도로는 정착이 되었다고 본다. 본 논문에서는 임시운행 허가 차량의 데이터기반의 현황과 이러한 임시운행 허가 차량의 정보처리에 대한 부분을 연구하고자 한다. 자율주행차의 운행 활성화를 위한 다양한 제도 중 임시운행허가 기간 도래로 인한 해결방안, 무인 자율주행차의 운행 요구 등 환경변화에 적합한 제도적인 개선 방향을 고찰하고자 한다.
-
In pediatric healthcare, early detection of cardiovascular diseases in newborns is crucial. Analyzing heart sounds using stethoscopes can be subjective and reliant on physician expertise, potentially leading to delayed diagnosis. There is a need for a simple method that can help even inexperienced doctors detect heart abnormalities without an electrocardiogram or ultrasound. Automated heart sound diagnosis systems can aid clinicians by providing accurate and early detection of abnormal heartbeats. To address this, we developed an intelligent deep-learning model incorporating CNN and LSTM to detect heart abnormalities based on artificial intelligence using heart sound data from stethoscope recordings. Our research achieved a high accuracy rate of 97.8%. Using audio data to introduce advanced models for cardiac abnormalities in children is essential for enhancing early detection and intervention in pediatric cardiovascular healthcare.
-
최근 Digital Twin 과 Cyber-Physical-System 을 융합하여 시스템을 설계·예측·분석·최적화하기 위한 노력이 증가하고 있다. Unmanned Ground Vehicle 은 이런 방법론이 적용 중인 대표 예시이다. 본 논문에서는 Digital Twin 과 Cyber-Physical-System 을 융합하고 유지보수와 관리, 데이터 수집이 쉬운 시스템 설계 구조 Control-Infra-Product(CIP)을 제안한다. 시스템 계층을 사용자 관점에 따라 정의하며, 유저, 서비스 제공자, 제품(Physical, Virtual) 총 3 개로 분리된다. 각 관점은 Control Layer, Infra Layer, Product Layer 로 정의한다. 시스템의 사용 주체로 서버에 제어 명령 전달 및 전체적인 관제와 시각화를 담당하는 Control Layer 로 정의한다. Product Layer 는 Product 들을 묶어 정의되며, Product 는 현실과 가상에서 mirroring 이 될 두 개체 (Camera, Lidar, Car 등)를 하나의 쌍을 지칭한다. Infra Layer는 서비스를 관리하는 주체로, 양단에서 Physical 과 Virtual 을 엮고 유저의 제어를 Product 까지 전달 및 전처리의 책임을 진다. 본 논문에서는 CIP 개념 구조의 적용과 Kubernetes 오케스트레이션을 활용한 시스템 구현을 통해 시스템 확장에 유연한 구조와 유지보수에 유용한 indoor 자율 주행 시스템을 개발하였다.
-
RSE (Road Side Equipments) 데이터를 활용하여 파편적으로 차량들의 경로를 유추해볼 수 있다. 이 데이터는 대략적인 경로를 파악할 수 있지만 전체적인 이동 경로를 정확히 추적하는 데에는 한계가 있다. 따라서 본 연구에서는 RSE 데이터를 시간을 기준으로 연결하여 각 차량의 이동경로를 보다 사실적으로 생성하고, 이렇게 생성한 경로 데이터 이용하여 차량이 출발한 지점과 도착한 지점을 추정하는 방법을 제안한다. 이를 통해 얻은 O/D(Origin/Destination) 정보는 도시 교통 흐름 분석 등 다양한 응용에 활용할 수 있다.
-
본 논문에서는 다차원 혈당지표를 역전된 정점 스카이라인 질의(Inverted Pinnacle Skyline Query)에 적용하여 당뇨병 전증(前症)에 해당하는 환자 중 당뇨병 수치에 가장 근접한 환자를 식별하는 기법을 제안한다. 당뇨병 전증을 겪는 환자는 수치에 따른 적절한 조치가 취해지지 않으면 당뇨병으로 진행될 가능성이 높아진다. 환자의 치료에서 의료자원의 한정성과 환자의 위험도에 따른 우선순위 분류는 중요한 고려 요소이다. IPS 기법은 기존 Skyline 알고리즘의 지배관계를 반대로 정의하여, 당뇨병 전증 환자 중 가장 높은 수치를 지닌 즉, 당뇨병으로 진행될 가능성이 가장 높은 고위험군 데이터들을 식별을 목표로 한다. IPS 는 우선적 치료가 필요한 고위험군 환자들에게 당뇨병 수치 관리를 위한 조기개입을 가능하게 하며, 당뇨병 예방에 기여할 수 있을 것이다.
-
본 연구는 유튜브 Shorts 시장에서 특정 Shorts 영상이 급격히 인기를 얻는 반면 유사한 주제의 영상이 관심을 받지 못하는 현상을 문제로 제시한다. 이에 인기 급상승 Shorts 의 주요 요소를 분석하여 성공 요인을 파악하고, 제작자들이 트렌드를 효과적으로 반영할 수 있는 가이드라인을 제공하고자 한다. 유튜브 API 를 통해 영상 제목, 조회수, 좋아요 수, 썸네일 이미지 등의 데이터를 수집하고 텍스트 네트워크 및 감정 분석을 통해 영상 제목과 썸네일 속 요소가 인기와의 연관성을 조사하였다. 이를 바탕으로 제작자들이 활용할 수 있는 웹사이트를 제작하였다.
-
사회에서 발생하는 범죄는 다양한 원인이 복합적으로 연관되어 발생하기 때문에, 유형별 범죄에 중요영향을 주는 요인을 파악하는 것이 시급하다. 본 연구는 대학 자취촌 지역에서 집중적으로 발생하는 범죄 유형을 대상으로 하여, 범죄에 영향을 줄 수 있는 환경요인을 선별하고, 공간더빈모형을 활용하여 주요 발생 요인을 분석했다. 대표적 대학가를 포함하는 강북구, 도봉구, 관악구를 50x50m2 공간 그리드로 분할하고, 범죄, 폭력, 절도 등에 영향을 줄 수 있는 41개의 환경 변수를 다양한 공간통계모형들을 활용하여 상세 분석했다. 이 중, 공간 더빈 모형이 가장 효과적인 통계적 설명력을 가지는 것을 다양한 비교 실험을 통해 검증했으며, 범죄 주요 요인들에 대한 분석적 고찰을 수행했다.
-
온라인 쇼핑의 증가로 인해 상품평(리뷰)의 중요성이 높아지고 있다. 본 연구에서는 리뷰 데이터를 수집하고 이를 분석하여 상품의 판매 전략 개선 모델을 개발하였다. 이를 위해 웹 크롤링과 OCR 기술을 활용하여 댓글을 텍스트로 변환하고, Chat GPT 4o model를 사용해 댓글을 분석하였다. 모델을 통해 얻은 결과 데이터는 상품의 품질, 가격, 배송 등의 측면에서 주요한 피드백 요소들을 도출하는데 사용되었다. 본 연구는 IT 기술과 심리학적 요소를 결합하여 소비자 행동을 분석하는 새로운 접근 방식을 제시하며, 이를 통해 보다 효과적인 마케팅 전략을 수립할 수 있음을 보여준다.
-
본 논문에서는 다양한 심전도 패치 장치에서 발생하는 데이터 스트림을 수집하고 이를 FHIR의 표준 포맷으로 변환하여 의료 클라우드에 업로드하는 과정을 구현한다. FHIR 자원으로 변환하는 과정에서 클라우드에서 요구하는 기본 필드를 정확히 채워 무결성을 유지하며 각각의 Observation 자원에 스트림 데이터를 포함시켜 Bundle로 생성한다. 이후 Cloud shell에서 CURL 명령을 수행시켜 수백 개의 심전도 스트림 자원이 JSON으로 표준화된 포맷으로 클라우드에 고속으로 저장된다.
-
문서의 내용을 쉽게 이해하기 위해서는 문서의 핵심 단어, 또는 핵심 문장을 빠르게 파악하는 것이 중요하다. 또한 유사한 문서를 참고하여 같이 읽는다면 해당 문서 내용을 파악하는 시간을 단축시켜주거나 해당 문서에 대한 이해도를 증가시킬 수 있다. 이를 위해서 wordcloud, textrank, Doc2Vec, softmax regression, cosine similarity과 같은 기법을 활용한다. 최종적으로 어떠한 문서를 입력받으면 문서의 명사를 기반으로 한 워드클라우드 시각화 및 핵심 문장 추출, 같은 카테고리를 가지는 유사한 문서를 추천해 주는 연구를 수행하였다.
-
본 연구는 의료 연구에서 다양한 형태의 멀티모달 데이터를 통합적으로 관리하고 분석할 수 있는 통합 데이터 플랫폼을 구현하는 것을 목표로 한다. 이 플랫폼은 정형 데이터와 비정형 데이터를 일원화하여 연구자들이 쉽고 빠르게 접근할 수 있도록 설계되었으며, 데이터의 효율적 수집, 처리, 저장, 분석을 지원한다. 또한, 정형 데이터와 비정형 데이터 간 통합 검색 기능, 질환별 데이터 추출, 비식별화 기능 등을 구현하여 연구자들이 안전하고 신뢰성 있는 환경에서 데이터를 활용할 수 있도록 하였다. 이 플랫폼은 기존의 CDW 시스템의 한계를 극복하며, 의학 연구의 다양한 요구를 충족시킬 것으로 기대한다.
-
본 연구는 병원, 종합병원 등 유형에 따른 의료장비 수요를 분석하고 최적화하는 시스템 개발을 목표로 함. 병원 유형별 장비 재고를 분석하여 수요를 예측하고, 유지보수 일정 및 장비 교체주기를 추천하는 기능을 포함함. 예비 연구 결과, 이 시스템은 중복 장비 구매를 줄이고 자원 할당을 최적화하여 비용 절감 효과를 보였으며, 예측 유지보수를 통해 가동 시간 증가와 고장 감소 등 병원 운영 효율성을 향상시키는 것으로 나타남. 이 시스템을 구현함으로써 병원은 의료 장비의 더 나은 계획 및 관리를 통해 효율성을 향상시킬 수 있음.
-
최근 정부는 비만의 위험성을 인지해 비만을 질병으로 규정하고 있지만, 단독 질병코드로는 진료 및 급여 수급이 어려운 실정이다. 이에 본 연구는 '건강보험심사평가원_시군구별 비만 진료 통계' 데이터를 분석한 후, 소아·청소년 비만율과 비교하여 상관관계를 조사해 통계자료를 근거로 비만 진료의 현황을 파악해보았다. 이는 향후 소아·청소년 비만 지원 방안 개선과 정책적 방향을 위한 근거자료로 활용될 수 있다. 본 논문은 공공 데이터를 활용해 소아·청소년 비만과 치료 현황을 분석하며, 소아·청소년 비만 관련 효과적인 개입 전략 개발을 목표로 한다.
-
본 연구는 스트레스는 현대사회에서 중요한 건강 문제로 대두되고 있으며, 이는 개인의 정신적, 신체적 건강에 심각한 영향을 미칠 수 있습니다. 본 논문에서는 스트레스와 우울의 상관관계를 분석한 후, 질병관리청의 '2023 지역건강통계 한눈에 보기'와 HIRA 빅데이터 개방포털의 '지역별 정신질환_우울증 진료현황(2019~2023 년)' 데이터를 비교·분석하여 스트레스를 줄일 수 있는 연구를 제안하고자 합니다. 이 연구의 목적은 스트레스가 증가함에 따라 사람들의 심리, 신체 건강에 영향을 미치며 더 나아가 우울증의 주요 원인이 될 수 있음을 인지하고 지역별 스트레스 및 우울감 인지율과 실제 우울증 진료 통계를 비교·분석하는 데 목적이 있습니다. 이를 바탕으로 스트레스 관리의 중요성을 제시하며, 여러가지 해결책을 통해 사람들 간 소통을 촉진하고 스트레스를 완화할 방법을 제안하고자 합니다. 특히, 우리나라의 통계와 지표를 활용해 스트레스 및 우울감이 높은 지역을 선정하고, 그에 따른 해결 방안을 마련하는 것이 목표입니다.
-
빅데이터 시대가 오면서 정형화된 데이터뿐만 아니라 비정형 데이터들도 즐비하게 되었다. 데이터의 많은 비율을 비정형 데이터가 차지하게 됨으로써 관계형 데이터베이스로는 여러 이유로 인해 한계에 봉착하게 되었고 NoSQL 계열의 데이터베이스를 채택하기 시작했다. 본 연구에서는 그래프 데이터베이스는 노드와 관계를 이용하여 데이터를 조회하고 분석한다. 관계형 DB 인 MySQL 과 그래프 DB 인 Neo4j 를 사용하여 CRUD 및 분석 성능을 비교한다.
-
건강과 웰빙에 대한 관심이 현대사회에서 높게 대두됨에 따라, 피트니스 시설을 이용하는 소비자수는 꾸준히 증가하고 있다. 피트니스 시설에서 체감하는 서비스 경험은 단순한 물리적 공간으로서 뿐만 아니라, 환경적 요소 등 다양한 요소들이 작동하고 있다. 이에 이런 세부 요소들을 KANO 모형과, Timko 의 고객만족개수를 활용해 분석하여, 관리의 효율성은 물론 한정된 제원으로 높은 고객 만족도를 이끌어 내기 위한 전략 수립에 도움이 되고자 한다.
-
아파트 커뮤니티 시설은 지속적인 발전과 더불어 입주민들의 건강, 교육, 여가활동을 지원하는 중요한 공간으로서 자리매김 되고 있다. 이에 따라 커뮤니티 시설을 관리하는 커뮤니티 시설 관리자의 역할 또한 중요해지고 있으며, 커뮤니티는 단순한 공간 제공을 넘어서, 관리의 질과 운영 효율성에 따라 입주민의 만족도에 직접적인 영향을 미치고 있다. 이에 본 연구는 델파이 기법을 활용하여 커뮤니티 시설 관리자의 직무와 역량을 명확히 규명하고, 이를 기반으로 체계적인 관리 방안을 제시하고자 한다.
-
본 논문은 스파이킹 신경회로망(Spiking Neural Networks)에서 BP(Back Propagation)학습알고리즘에 대한 일반화 형태인 기존의 구간연산 학습알고리즘을 개선하여 스파이킹 뉴론(Spiking Neuron)들의 반응영역 범위를 학습 진행에 따라 조절이 가능한 단계적 구간학습 방안을 제안한다.또한, 간단한 컴퓨터 시뮬레이션을 통하여 쿨롱에너지 포텐셜(Coulomb Energy Potential)을 가지는 스파이킹 신경회 로망에서 범위(Lower bound & Upper bound)의 값을 가지는 구간데이터(Interval data)와 하나의 값을 가지는 포인트데이터(Point data)가 혼재된 학습데이터에서의 제안한 학습방안의 타당성과 전문가시스템(expert system)에서의"don't care attributes"적용가능성을 보인다.
-
Gayun Suh;Su-Yeon Park;Hyeong-Hwan Shin;Jun-Su Cho;Sei Kang;Jae-Joon Jeong;Bo-Gyeong Seo;Seung-Won Kim 505
본 연구는 음악 가사와 배경 이미지를 매칭하는 시스템을 개발하는 데 초점을 맞추고 있다. GPT-4o를 활용하여 배경 이미지에 어울리는 음악 가사를 생성해 데이터셋을 구축하였으며, Long-CLIP 모델을 미세 조정하여 음악 가사와 배경 이미지의 임베딩 벡터를 비교함으로써 가장 적합한 배경 이미지를 추천하는 시스템을 구현하였다. -
Alzheimer's Disease (AD) is a neurodegenerative disorder characterized by a progressive decline in cognitive function. Accurate and early diagnosis of AD is crucial for effective management and treatment. Traditional machine learning models, though commonly applied, often fall short in capturing the intricate relationships between diverse tabular data. Furthermore, the missing data issue, typically addressed using conventional imputation techniques, leads to reduced accuracy and generalizability of AD classification models. This paper introduces ADxClass, a novel deep learning framework that enhances AD classification by leveraging multi-domain attention fusion and data type-based imputation techniques for handling missing heterogeneous tabular data. ADxClass integrates data from various domains, including demographic, cognitive, genetic, and biomarkers obtained from neuroimaging measurements, to improve the robustness and accuracy of AD classification models. The model's efficiency is validated via a 5-fold cross-validation on the Alzheimer's Disease Neuroimaging Initiative (ADNI) dataset, showing significant improvements in classification performance compared to traditional machine learning approaches.
-
Empathy plays a crucial role in effective mental health support, particularly on text-based platforms where individuals seek understanding and compassion. Building on previous work that predicted empathy in separate models, we propose a multi-task learning approach that jointly models three empathy communication mechanisms: emotional reactions, interpretations, and explorations. By integrating RoBERTa with GRU layers, our model improves the accuracy and efficiency of empathy detection. Additionally, we address class imbalance by incorporating focal loss, which helps the model focus on underrepresented strong empathy signals. Our experiments show that the multi-task model, combined with focal loss, significantly improves performance across all empathy dimensions, making it a promising tool for enhancing real-time empathy feedback in online mental health support systems.
-
본 연구에서는 복잡하고 방대하여 분석과 요약에 많은 시간이 소요되는 전장 상황의 시계열 로그 수치 데이터를 효율적으로 분석하는 방법론을 제시한다. 생성형 AI 인 ChatGPT API 를 사용해 데이터를 전처리 및 분석하는 모듈을 포함한 웹 애플리케이션 형태을 구현한다. 주요 기능은 데이터 업로드, 전처리, 분석, 분석 로그 조회 등으로, 이를 통해 사용자가 전장 데이터를 효율적으로 분석하고 유의미한 결과를 도출할 수 있도록 지원한다.
-
본 논문에서는 오픈소스(Open Source) LLM(Large Language Model)인 Llama3을 이용하여 음성으로 동작하는 맞춤형 로컬 챗봇을 구현하고자 한다 이를 위해 PEFT(Parameter Efficient Fine-Tuning) 방식과 RAG(Retrival Augmented Generation) 방식을 혼합하는 하이브리드 방식을 사용해 Llama3을 파인 튜닝하고, Ollama을 이용하여 로컬 컴퓨터에서 동작하는 챗봇을 구현하였다. 챗봇의 배포를 위해 서버 부분은 LangServe와 Ngrok을 사용하였고 클라이언트 부분은 모바일 환경에서 원활히 동작하는지 확인하기 위해 교육용 임베디드 시스템인 Raspberry Pi 5를 사용하여 구현하였다. 또한 사용자의 편의성을 위해 음성인식 기능을 추가하였다. 또한 구현한 챗봇에 성능평가를 진행하였다. 성능 측정 방식은 정확도를 사용하였고, 데이터 셋은 총 18개로 각 쿼리마다 5번씩 총 90개의쿼리로 성능 평가를 진행하였다. 성능 평가 결과 하이브리드 방식이 가장 우수한 성능을 보여주었다.
-
본 논문은 오픈소스 LLM(Large Language Model)인 Llama3를 기반으로 음성 인터페이스를 갖춘 맞춤형 로컬 챗봇 시스템을 개발하였다. 이 시스템은 PEFT(Parameter Efficient Fine-Tuning)와 AutoRAG(Auto Retrieval-Augmented Generation)로 최적화된 RAG(Retrieval-Augmented Generation) 방식을 결합한 하이브리드 접근법을 통해 Llama3를 전이학습 하였다. Ollama를 사용하여 로컬 환경에서 챗봇을 구현하였으며, LangServe와 Ngrok을 활용해 배포하였다. Raspberry Pi 5에 구현하여 모바일 환경으로 동작 가능하게 하였고 음성인식 기능을 추가하여 사용자 편의성을 높였다. 연구한 모델의 성능 평가는 총 18 종류의 데이터셋에 대해 각 질문당 5회씩, 총 90회의 질문으로 정확도를 측정하였다. 실험결과, PEFT 학습 모델과 Advanced RAG를 결합한 시스템이 가장 우수한 성능을 나타냈다.
-
대규모 언어 모델(LLM)은 많은 영역에서 우수한 성능을 발휘한다. 하지만 오래된 지식, 환각, 불투명한 추론 프로세스 등의 문제가 존재한다. 이러한 문제의 해결책으로 외부 데이터베이스의 지식을 통합하는 Retrieval-Augmented Generation(RAG)시스템이 떠오르고 있다. 그러나 RAG 시스템을 구현하기 위한 파이프라인의 구성은 복잡하며 각 시나리오에 대한 실험과 평가는 시간이 걸리고 번거롭다. 이 논문에서는 일련의 실험과 평가를 한 번에 실험하고 각 단계별 평가 점수를 측정할 수 있는 AutoRAG라는 프레임워크를 사용하여 금융 문서에 가장 최적화된 RAG 파이프라인을 탐색하여, Naive RAG와 Advanced RAG 시스템을 비교하였다. 두 경우 모두 F1점수, NDCG점수, mAP점수를 사용하여 평가하였다. 최종 성능지표의 결과로 Advanced RAG 시스템이 F1, NDCG, mAP에서 각각 0.062, 0.168, 0.106 만큼 우수한 것으로 나타났다.
-
Recent progress in audio-driven talking face generation has focused on achieving more realistic and emotionally expressive lip movements, enhancing the quality of virtual avatars and animated characters for applications in entertainment, education, healthcare, and more. Despite these advances, challenges remain in creating natural and emotionally nuanced lip synchronization efficiently and accurately. To address these issues, we introduce a novel method for audio-driven lip-sync that offers precise control over emotional expressions, outperforming current techniques. Our method utilizes Conditional Deep Variational Autoencoder to produce lifelike lip movements that align seamlessly with audio inputs while dynamically adjusting for various emotional states. Experimental results highlight the advantages of our approach, showing significant improvements in emotional accuracy and the overall quality of the generated facial animations, video sequences on the Crema-D dataset [1].
-
부정맥은 심각한 합병증을 초래할 수 있는 심장 질환으로, 조기 진단이 중요하다. 본 연구는 부정맥 진단의 자동화를 위해 Wavelet 변환과 합성곱 신경망(CNN)을 결합한 새로운 접근 방법을 제안한다. MIT-BIH Arrhythmia Database 와 P-Wave Annotations 를 사용하여 ECG 신호에서 QRS complex 와 P-wave 를 동시에 검출하는 전처리 방법을 개발하였다. Wavelet 변환 기반 전처리와 다양한 ECG 특징 추출 기법 결합한 1 차원 CNN 모델을 적용한 결과, 93%의 전체 정확도와 평균 0.9906 의 AUC 점수를 달성하였으며, 특히 심실 부정맥에 대해 96.8%의 높은 재현율을 보였다. 이는 현재 임상에서 사용되는 많은 자동화된 ECG 분석 시스템들의 miss reading 확률(10-15%)보다 낮은 7%의 miss reading 확률을 나타낸다. 본 연구는 ECG 데이터의 효율적인 해석과 부정맥의 조기 진단 가능성을 입증하였으며, 임상 현장에서의 적용 가능성을 제시한다. 향후 연구에서는 다양한 데이터셋 검증과 실시간 처리 능력 평가를 통해 실제 임상 환경에서의 적용성을 높일 계획이다.
-
최근 불법적인 정보 탈취을 목적으로 드론의 사용이 증가하고 있으며, 이를 대응하기 위해 다양한 기술적 해결책이 개발되고 있다. 특히, 드론의 정확한 자세 추정이 필요하지만, 드론의 자유로운 움직임과 회전 때문에 기술적 구현이 어렵다. 따라서 본 논문은 트랜스포머의 인코더 구조를 사용한 키포인트 추출 방법을 제안해 기존 문제를 해결한다. 이 방법은 로컬과 글로벌 특징을 결합하는 게이트 메커니즘을 도입하여, 다양한 각도에서도 일관된 키포인트 추정을 가능하게 하고, 드론의 움직임과 상태를 보다 정확하게 분석할 수 있다. 논문은 드론 2차원 키포인트 데이터셋을 제공하고, End-to-end 방법론을 제안하여 드론의 키포인트를 정확히 추정하며, 이를 통해 불법 드론 활동을 실시간으로 탐지하고 대응할 수 있는 기술적 기반을 마련한다.
-
운전지원은 원자력 분야에서 인공지능 기술의 현장 적용 가능성이 가장 높은 기능 중에 하나이다. 원전 시설을 감시, 비정상 탐지, 사고 예측, 조치 지원과 같은 다양한 세부 기능에서 인공지능기술을 적용하기 위한 연구가 수행되고 있다. 원전은 안전상의 이유로 규제기관의 신뢰성 검토를 통한 허가를 받은 기능만 현장에서 운용 가능하다. 그러나, 인공지능 기술은 전통적인 소프트웨어와는 다른 특성들 때문에 기존 방식으로는 신뢰성을 평가하기 어렵고 이것은 현장 적용을 더디게 하는 요소가 된다. 이 논문은 국내외 문헌조사를 통해 원전분야에서 인공지능 모델의 신뢰성을 평가하기 위한 항목들을 검증 요건으로 제안한다. 이러한 검증 요건에 대한 정성적, 정량적 평가는 원전 인공지능 모델의 신뢰성을 평가하는데 도움이 될 것으로 기대된다.
-
뉴스 내용과 증시의 상관관계에 대해서는 다양한 연구가 활발히 진행되었다. 이러한 연구들은 뉴스 제목에 담긴 정보와 증시 변동 사이의 관계를 분석하여 유의미한 결과를 도출하였다. 그에 반해, 직접적으로 드러나는 대중의 반응과 증시의 상관관계에 대해서는 상대적으로 연구가 부족한 실정이다. 본 연구에서는 여러 시간 단위에서 대중들의 반응을 온라인 커뮤니티에서 추출하고, 감정 분석을 통해 수치화 하여 분석한다. 이렇게 수치화 된 감정 데이터가 가상화폐 변동성과 관련이 있는지에 대해 시간 단위 별 상관관계 분석을 통해 알아보고자 한다. 이를 통해 대중의 반응이 가상화폐 시장에 미치는 영향을 실증적으로 분석하고, 가상화폐 시장에 대한 이해도를 높이는 데 기여할 수 있을 것으로 기대한다.
-
Obstructive sleep apnea (OSA) is a common sleep disorder, causing disrupted sleep and reduced oxygen levels in the blood. Full-night polysomnography (PSG) and home sleep apnea tests (HSAT) may offer acceptable diagnosis results but have shown some limitations. In recent years, deep learning and data analysis methods are progressively employed on electronic health records, and various methods have been developed for OSA event detection. Self-supervised learning has shown some advantages over supervised training methods, by learning more generalized feature representation of data. Unlike text or image processing, the high information density in multivariate time-series data makes it more challenging to utilize self-supervised learning. In this research, based on the characteristics of sleep dataset, we propose a self-supervised approach with Masked Autoencoder, which masks portions of the input and attempting to reconstruct them. This enables the model to learn more generalized features from unlabeled data. We evaluate our proposed framework with three independent sleep datasets, which have shown significant improvement compared to supervised learning models.
-
컴퓨터 비전 및 영상 처리 분야에서 정확하고 신뢰할 수 있는 분할을 달성하는 것은 중요하다. 특히 의료 분야에서는 분할의 부정확성이 부적절한 특징의 추출과 분류를 야기한다. 이 논문에서는 이중 어텐션 메커니즘을 U-Net 아키텍처에 통합하여 이진 영상 분할을 개선하는 방법을 제안한다. 인코더와 디코더 사이의 중요 접합점에 위치 및 채널 어텐션 모듈을 배치하여 기능 표현을 향상시켜, 벤치마크 실험에서 기존 방법보다 우수한 성능을 확인하였다. 접근 방식은 의료 영상에서의 이진 분할 작업에 대한 잠재력을 보여주며, 자동 분할을 통해 의료 전문가의 효율성을 높일 수 있다.
-
Empathetic response generation is a challenging concern in the field of natural language processing. Recent studies are trying to generate empathic responses to humans in dialogues. The published EmpatheticDialogues dataset is a solid foundation for the task of generating empathic responses. Many researchers have experimented with the EmpatheticDialogues dataset, which has many potential variations of transformer architectures. In this paper, we survey several previous approaches to the task of generating empathic responses with the aim of indicating the potential of future deep-learning models.
-
Mental health conditions such as Major Depressive Disorder (MDD) undoubtedly pose severe life-threatening effects if not properly diagnosed and treated promptly. In this paper, we aim to differentiate depressed patients from healthy controls by determining the level of co-functionality relationships between brain regions using the Multi-modal Open Dataset for Mental Disorder Analysis (MODMA) 128-channel resting-state Electroencephalography (EEG) data. By proposing a method that adopts the combination of Phase Locking Value (PLV) functional connectivity analysis with a Contrastive Siamese Network model, we extract PLV-based features and employ the proposed Contrastive Siamese Network to learn discriminative features from the PLV matrices. Our proposed approach achieved an accuracy of 0.88, surpassing prior research works on the same dataset. The results suggest that PLV can serve as a reliable biomarker for depression detection, effectively distinguishing between both classes and leading to robust classification outcomes.
-
Talking Head Generation is a highly practical task that is closely tied to current technology and has a wide range of applications in everyday life. This technology will be of great help in the fields of photography, online conversation as well as in education and medicine. In this paper, the authors proposed a novel approach for Individual Audio-Driven Talking Head Generation by leveraging a sequence of landmarks and employing a diffusion model for image reconstruction. Building upon previous landmark-based methods and advancements in generative models, the authors introduce an optimized noise addition technique designed to enhance the model's ability to learn temporal information from input data. The proposed method outperforms recent approaches in metrics such as Landmark Distance (LD) and Structural Similarity Index Measure (SSIM), demonstrating the effectiveness of the diffusion model in this domain. However, there are still challenges in optimization. The paper conducts ablation studies to identify these issues and outlines directions for future development.
-
엔진을 정확하게 분류하는 것은 엔진의 수리 및 유지보수에 있어 중요한 과제 중 하나이다. 하지만 청음훈련을 통해 이를 숙달하는데는 오랜 시간이 걸리고, 엔지니어의 주관적 요인에 큰 영향을 받는다. 이를 해결하기 위해, 엔진의 음향적 특성을 이용한 머신러닝을 통해 엔진을 구분하는 시스템을 제안한다.
-
본 논문에서는 X-ray 영상에서 산란선 보정과 아티팩트 억제 및 선명도 개선을 위한 딥러닝 기법을 제시한다. 학습에 사용되는 흉부 X-ray 영상에서 배경영역 등 ROI가 아닌 영역의 특성으로부터 학습효과가 저하되는 현상을 보완하기 위하여 좌우 폐영역 등 조직구조를 분할하고 영역별로 학습하는 기법을 고려한다. 이를 위하여 BRAU-Net 기반의 조직구조 분할 기법을 제시하며, 흉부 X-ray 영상의 산란선 보정 문제에 대하여 DEA-Net, MB-TaylorFormer 모델을 사용한 방법을 제안하였다. 총 290개의 흉부 X-ray 영상을 사용한 실험을 통하여 제안된 이론의 타당성을 평가하였다.
-
SemiVL(Semi-Supervised Semantic Segmentation with Vision-Language Guidance) 모델은 자원이 제한된 환경에서도 높은 이미지 분할 성능을 발휘하는 준지도 학습 기반의 시맨틱 세그멘테이션 모델이다. 본 논문은 PyTorch 프레임워크에서 TorchScript 프레임워크로 변환된 SemiVL 모델을 임베디드 시스템 환경(Google Pixel 2)에 적용하여 온디바이스 AI를 구현한 연구이다. 목표는 데스크톱 GPU 환경과 유사한 추론 성능을 달성하는 것이었다. 성능 평가는 Pascal VOC 데이터셋을 사용하였으며, mIoU(mean Intersection over Union)와 추론 시간을 주요 지표로 측정하였다. 실험 결과, TorchScript로 변환된 SemiVL 모델은 데스크톱 PC에서 77.5%의 mIoU와 6438.99ms의 추론 시간을 기록하였고, Google Pixel 2에서는 62.8%의 mIoU와 6658.45ms의 추론 시간을 달성하였다. 이 결과는 임베디드 시스템 환경에서 SemiVL 모델이 온디바이스 AI 솔루션으로 활용될 수 있음을 보여준다.
-
본 연구는 YOLOv9의 세그멘테이션 전용 모델인 YOLOv9c-seg을 교육용 임베디드 시스템인 라즈베리 파이 5와 Google Coral Edge TPU 환경에서 실시간 객체 분할 성능을 평가하였다. YOLOv9-seg모델을 커스텀 데이터셋(Customized Dataset)으로 파인튜닝(Full Fine Tuning)하여 TF Edge TPU 포맷으로 변환하여 추론 속도와 메모리 사용량을 크게 개선하였다. 실험 결과, 변환된 모델은 PT(Pytorch)형식의 기존 모델과 유사한 성능을 유지하면서도 평균 추론 시간이 80.14ms 단축되고, FPS가 21.12프레임 증가하여 실시간 성능이 향상되었다. 이는 Edge TPU가 정수 양자화된 모델에 최적화되어 처리 속도와 효율성을 극대화할 수 있음을 보여준다. 본 연구는 엣지 컴퓨팅(Edge Computing) 환경에서 실시간 객체 분할의 가능성을 제시하였다.
-
Parkinson's disease (PD) is a progressive disorder. In this study, we proposed a deep learning model that utilized participants' baseline clinical features and deformation-based morphometry (DBM) to predict long-term cognitive trajectory over four years. A total of 216 participants from the PPMI (Parkinson's Progression Markers Initiative) dataset were included, with 157 being PD patients and 59 healthy controls. We identified brain connectivity patterns associated with long-term cognitive decline using DBM and independent component analysis (ICA) techniques. Results of the cognitive prediction indicated that using only clinical features, DBM features, and multimodal features yielded average accuracies of 76 ± 4%, 70 ± 6%, and 78 ± 2%, and average AUC (Area Under the Curve) of 0.71 ± 0.06, 0.62 ± 0.04, and 0.76 ± 0.06, respectively. Our study demonstrated that the potential of using DBM features to better predict disease progression.
-
본 연구는 감정 분류에 중점을 둔 AI 모델을 개발하는 것을 목표로 한다. KoBERT(Korean Bidirectional Encoder Representations from Transformer) 모델을 활용하여 사용자가 입력한 텍스트를 분석하고 감정 상태를 분류한다. 특히 우울증과 같은 특정 감정을 분류하며, 필요 시 관련 정보를 제공하는 데 중점을 두고 있다. 테스트 결과, Test Accuracy는 0.67, F1-Score는 0.69로 기존 연구보다 향상된 성능을 보였다. 이 모델은 내담자의 감정 분석을 통해 정신건강의학과 전문의의 우울증 진단을 보조하는데 기여한다.
-
본 연구에서는 딥러닝 기술을 활용하여 LA 갈비 이미지에서 살코기 부분을 검출하는 방안을 제안한다. 검출에는 이미지 픽셀을 미리 정의된 클래스로 분류하는 딥러닝 기술인 세그먼테이션을 활용한다. 세그먼테이션은 이미지 내 객체를 정교하게 탐지할 수 있는 특성을 가진다. 각 이미지에는 한 개의 손질 전 LA 갈비 이미지를 포함한다. 학습된 모델은 높은 정확도와 정밀도로 살코기 부분을 검출하였으며, 이는 육류 가공 과정에 추후 딥러닝 기술 활용이 유용할 수 있음을 시사한다.
-
Electroencephalography (EEG) signals are often contaminated with artifacts, particularly those from eye movements, recorded as electrooculography (EOG). Effective denoising methods are essential for accurate EEG analysis. In this paper, we compare different denoising approaches, focusing on both convolutional neural networks (CNNs) and recurrent neural networks (RNNs) for artifact removal. Through experiments, we found that CNNs excel in capturing spatial features, particularly in high-frequency EEG bands like Alpha and Beta, while RNNs are more effective at modeling temporal dependencies, particularly in lower-frequency bands like Delta and Theta. To leverage the strengths of both models, we propose a hybrid CNN-LSTM architecture. Our results show that the hybrid model achieves superior performance in denoising across all EEG frequency bands, with significant improvements in the Alpha and Beta bands. This approach provides a robust solution for denoising EEG signals contaminated with EOG artifacts, offering improved accuracy over standalone CNN or RNN models.
-
Due to the advancement of deep learning techniques, the medical field is undergoing significant upheaval. One of the prominent applications is generating an imaging modality from another imaging modality. This application helps reduce the cost of taking multiple types of medical images for diagnostic imaging. Although many methods have been proposed for generating medical images, only a few studies focus on three-dimensional (3D) images. Therefore, in this paper, we propose a deep generative adversarial network (GAN) for generating a 3D target image from a 3D source image. The results have shown that our proposed approach can generate high-quality images and holds promise for practical use.
-
서비스 고도화와 퍼블릭 클라우드 확산으로 인해 시스템 복잡성과 규모가 증가하면서 시계열 로그 데이터의 양과 유형이 증가하고 있다. 안정적인 시스템 운영을 위해 시계열 로그 모니터링은 필수적이며 이상 탐지에는 높은 정확도가 요구된다. 본 연구에서는 트랜스포머 구조와 칼만 필터를 결합해 시스템 장애와 무관한 로그 데이터의 노이즈를 제거하고, 시계열 데이터의 패턴을 주기적으로 학습하여 임계치를 자동으로 조정함으로써 이상 탐지의 정확도를 높이고자 한다. 제안된 방법의 성능을 검증하기 위해 운영 중인 클라우드 환경에서 발생된 시계열 로그를 기반으로 실험을 수행한 결과, 연구에 사용된 다른 4 가지 딥러닝 기반 이상 탐지 모델보다 우수한 성능을 보였다.
-
본 연구에서는 모빌리티 환경에서 비접촉 방식으로 도로 표면을 파악하여 운전자의 주행 안전성에 기여할 수 있는 음파 센서 기반의 노면 추정 기법을 제안한다. 본 연구에서 제안된 시스템은 Continuous-transmit (C-transmit) 방식으로 주행 중 노면의 임피던스 정보를 실시간으로 획득하고, 전처리된 음파 데이터를 AI 모델로 분석하여 노면의 미끄럼 정도에 따라 몇 가지 노면 패턴으로 분류한다. 제안된 기법의 검증 실험에서는 아스팔트, 시멘트, 흙 플레이트 노면을 구성하고, 6 종 기상조건 (dry, humid, wet, iced, snow, slush)을 재현하여, 총 18 가지 조합 조건에서 실험 데이터를 확보하였다. AI 모델 성능은 노면 미끄럼도에 따른 6 종 상태 분류에서 96.8 %의 분류 정확도를 보였다.
-
최근 인공지능은 게임 분야에서 적극적으로 활용되고 있는데, 움직임, 패턴, 데이터 처리 등 대부분 과정에서 빠짐없이 사용되고 있다. 그러나 일반적으로 인공지능은 다루기 어렵다는 인식과 개발 비용이 많이 든다는 문제로 인해 중소 게임사에서는 이를 활용하기 어렵다. 이에 본 연구에서는 게임사에서 손쉽게 데이터를 생성하여 게임 내 밸런스 등을 고려할 수 있는 강화학습 기반 데이터 생성 환경을 제안하여 중소규모의 게임사의 게임개발 능률 향상에 도움을 주고자 한다.
-
본 연구에서는 대규모 언어 모델(LLM)에서 GeLU 와 SiLU 활성화 함수의 높은 연산 비용을 해결하기 위해 룩업 테이블(LUT) 기반 최적화 기법을 제안하였다. BERT, GPT2, OLMo 모델을 대상으로 실험을 수행하였으며, 특히 OpenAI GeLU 를 사용하는 GPT2 모델에서 최대 9 배의 성능 개선을 확인하였다. 또한, 배치 크기 변화에 따른 성능 분석 결과, GPT2 는 배치 크기가 클수록 더 큰 성능 향상을 보였고, BERT 와 OLMo 는 상대적으로 낮은 개선율을 나타냈다. 최적화 기법을 통해 각 활성화 함수의 연산 시간을 크게 줄이면서도 오차율을 낮게 유지할 수 있었다.
-
지식 증류 기법에서 학생 모델은 Label Smoothing을 거친 교사 모델의 결괏값을 통해 일반 라벨 데이터로는 학습할 수 없는 정보를 학습한다. 이때, Label Smoothing은 학생 모델의 분포가 교사 모델의 분포에 수렴하지 못하게 하거나 교사로부터 옳지 않은 정보를 학생에게 학습시키는 악영향도 존재한다. 이에 본 연구에서는 학생 모델의 분포가 교사 모델의 원래 분포에 잘 수렴하도록 하기 위한 두 가지 기법과 데이터의 신뢰성을 향상시키기 위한 기법 총 세 가지 기법을 제안한다. 세 가지 기법을 각각 적용했을 때, CIFAR-100 데이터셋에서 최대 0.64%의 Top-1 Accuracy 향상을 보였다.
-
최근 한국 아동 및 청소년의 문해력이 크게 하락하고 있으며, 이는 학습에 큰 영향을 미치고 있다. 특히, 디지털 기기와 스마트폰 사용이 증가하면서 독서를 기피하는 경향이 어휘력 저하와 문맥 이해 능력 감소의 주요 원인으로 보고되고 있다. 본 논문에서는 이 문제를 해결하기 위해, 어린이들이 독서에 흥미를 가질 수 있도록 자신만의 동화책을 만드는 경험을 제공하는 방안을 제안한다. 사용자가 원하는 키워드나 주제를 입력하면, 그에 맞는 내용의 동화책과 그림을 자동으로 생성하는 시스템을 개발하여 독서에 대한 재미와 흥미를 유도한다. 자동으로 동화책을 생성해 어린이들이 독서에 흥미를 갖게 되고, 이를 통해 독서 습관을 형성하며 어휘력과 문해력을 개선할 수 있다.
-
피삭성(machinability)를 향상시킨 스테인리스(stainless) 강의 제조공정에서 공정의 후반부 인발(drawing) 공정에서 재료가 끊기는 단선 현상이 발생한다. 본 연구에서는 데이터의 가치를 이용하는 것이 중요해진 제조 산업의 트렌드에서 공정에서 공정 변수를 활용하여, 이에 대한 머신 러닝 예측모델을 생성하고, 단선에 미치는 공정 변수의 영향력을 확인하는 과정을 적용하는 것을 목표로 했다. 데이터 개수에 비해 변수 종류가 많으므로, 금속학적 지식과 통계적 지식을 활용하여 변수를 조정한 후에 XGboost 모델을 활용하여 예측 모델을 생성하였다. 추가적으로 데이터 개수 부족과 비선형모델의 단점을 보완하기 위해 데이터 증폭 방법인 SMOTE 기법을 채택하였으며, 설명 가능한 AI 기법인 LIME 적용을 통해, 최종적으로 공정 변수를 활용하고, 단선 불량 예측력과 금속학적 지식이 유의미한 모델을 생성하였다.
-
본 연구는 Retrieval-Augmented Generation (RAG) 시스템에서 검색 연산의 실행 성능을 관측/분석하고, 추가적인 실행 성능 최적화 가능성을 탐구한다. RAG 는 대규모 언어 모델(LLM)의 한계를 보완하기 위해 외부 데이터베이스에서 관련 정보를 검색하여 모델의 답변 품질을 향상시키는 기술이며, RAG 시스템에서 가장 많이 사용되는 연산은 검색 연산이다. 본 연구에서는 대표적인 벡터 데이터베이스 중 FAISS 와 Chroma 두 개를 선택하여, 여러 실행 조건들의 변화에 따른 지연 시간 변화를 분석하였다. 두 벡터 데이터베이스의 다른 최적화 방식이 대규모 벡터 데이터베이스에서 각각 다른 특성을 가지는데, FAISS 의 경우 데이터베이스의 크기 변화에 덜 민감하고, Chroma 는 특정 구간 안에서는 지연 시간이 증가하다 임계치를 넘어가면 감소하고 다시 증가하는 패턴을 보인다. 본 연구에서는 이에 대한 원인을 분석하여 RAG 시스템의 검색 연산의 더 세밀한 최적화 가능성을 제시한다.
-
A robust and efficient communication network is crucial for ensuring the smooth operation, efficiency, and utmost safety of various maritime activities. Throughout the vast expanse of history, the highly significant maritime industry has heavily relied upon an extensive range of diverse communication methods. Accurate network performance is critical in maritime environments, where data loss due to signal interruptions, equipment failures, and other domain-specific factors frequently occur. This paper evaluates traditional and advanced data imputation techniques to assess their impact on the predictive accuracy of machine learning models used for network switching decisions in maritime settings. Results show that advanced deep learning techniques, like Autoencoder-based imputation can improve performance over traditional methods.
-
Retrieval Augmented Generation(RAG)는 Large Language Models(LLM)에서 발생하는 환각 현상, 민감 정보 노출과 같은 한계들을 극복하기 위해 제안된 기술이다. 새로운 정보가 지속적으로 업데이트되는 외부 데이터베이스로 인해 RAG는 최신 정보에 기반한 정교한 답변 생성을 할 수 있어 질의응답이나 대화문과 같은 텍스트 데이터를 다루는 작업에서 강점을 발휘한다. 반면, 테이블 데이터는 행과 열로 구성된 정형화된 데이터로 각 속성 간에 복잡한 관계를 가지고 있어 충분한 문맥 정보를 추출하는데 어려움을 겪으므로 성능 저하 문제가 발생한다. 본 논문에서는 이러한 문제를 해결하기 위해 테이블 데이터를 분석하기 위한 질의 유형을 정보 검색, 특성 분석, 상관관계 분석, 결과 예측, 추세 분석과 같이 5가지로 분류하고, 각 유형에서 모델이 보이는 성능을 평가한다. 특히, 다양한 질의 유형 데이터를 통해 실험을 진행하고 분석하여 질의 유형의 특징과 RAG 성능 간의 관계성을 연구하고자 하며, 이를 통해 테이블 데이터에서의 RAG 성능 개선 방향을 제시하고자 한다.
-
본 연구는 당뇨병 예측의 정확도를 높이기 위해 AdaBoostClassifier 기법을 제안한다. 기존 연구에서는 당뇨병 초기 단계를 개인이 인지하기 어렵고, 예측 모델의 정보 부족으로 인해 정확도가낮았다. 이를 개선하기 위해, 질병관리청의 2022 국민건강영양조사 데이터를 활용하여 당뇨병과 추가 속성들 간의 상관관계를 분석하였다. 본 연구는 기존에 알려진 당뇨병 관련 지표 외에도 만나이, 체질량지수, 요당, A형간염항체 양성여부, 결혼여부를 포함해 다양한 속성을 통합적으로 분석했다. 제안된 모델은 새로운 요인을 효과적으로 통합하여 정교한 예측을 가능하게 하고, 개인 맞춤형 건강관리와 조기 치료에 기여할 수 있다. 이를 통해 당뇨병 관리에 대한 새로운 인사이트를 제공하고 임상적 의사결정에도 도움이 될 것으로 기대된다.
-
본 연구는 AI 기술을 이용해 클라이밍 홀드를 추출하고, 사용자가 선택한 홀드에 맞는 경로를 추천하여 시각적으로 렌더링하는 시스템을 개발하는 것을 목표로 한다. YOLOv8 모델을 활용해 홀드를 인식하고, 서버에서 경로를 분석하여 사용자에게 제공한다. 이를 통해 클라이밍 초보자와 숙련자 모두에게 안전하고 효율적인 등반 경로를 제시한다.
-
본 연구에서는 Complex Order Position Embedding (COPE)을 Vision Transformer (ViT)에 적용하여 컴퓨터 비전 태스크에서의 효과성을 검증하였다. COPE는 복소수 연산을 활용하여 위치 정보를 인코딩하는 방법으로, 기존에 자연어 처리 분야에서 성공적으로 적용된 바 있다. ImageNet-Tiny 데이터셋을 사용한 실험에서, COPE를 적용한 ViT-Tiny 모델은 기존 모델 대비 1.8%p 높은 34.0%의 정확도를 달성하였다. 이는 파라미터 수의 미미한 증가(약 37,000개)만으로 이루어진 성능 향상이다. 본 연구 결과는COPE가 컴퓨터 비전 분야에서도 효과적임을 입증하며, 특히 객체 검출이나 의미론적 분할과 같이 위치 정보가 중요한 고난도 비전 태스크에서의 잠재적 성능 향상 가능성을 제시한다. 이는 복소수 위치 임베딩의 응용 범위를 확장하고, 트랜스포머 기반 비전 모델의 성능 개선을 위한 새로운 방향을 제시한다는 점에서 의의가 있다.
-
최근 멀티모달 딥러닝은 모델의 높은 정확도를 보장하면서도 풍부한 지식을 학습할 수 있어 큰 관심을 받고 있다. 특히, 대조 학습을 기반으로 한 연구들이 멀티모달 딥러닝의 성능을 개선하고 있다. 그러나 멀티모달 딥러닝에서 사용하는 다중 데이터 소스가 서로 결합하여 민감한 정보를 추론하는데 활용될 수 있으므로, 모델의 학습과정에서 프라이버시 침해의 위험성이 단일 모달 딥러닝에서보다 증가한다. 이러한 위험성은 기존 단일 모달 딥러닝에서의 프라이버시 보호 기법으로는 효과적으로 다뤄질 수 없는 까닭에 중요도가 높다. 본 논문에서는 이러한 문제를 해결하기 위해 멀티모달 대조 학습의 데이터 준비 과정에서 double randomized response 알고리즘을 활용해 라벨 차등 프라이버시를 보장하였다. 이를 통해 이미지-테이블 매칭 및 분류와 같은 주요 멀티모달 작업에서 프라이버시를 보호하면서도 80.14의 정확도를 기록하였다. 이는 데이터 보안을 고려한 멀티모달 딥러닝 모델의 성능을 처음으로 실증한 연구라는 점에서 의의가 있다.
-
AI-based image detection technology offers a promising solution for identifying defects in car doors, significantly improving efficiency compared to traditional human inspections. This paper introduces an advanced automatic defect detection system utilizing camera-recorded datasets and trained models to identify defects in aluminum car doors. Unlike previous models focused on aluminum castings, this is the first application specifically targeting car doors. Despite progress in defect detection research, challenges such as data imbalance, complex defect characteristics, and limited research on aluminum car doors persist. To address these issues, we propose the LKADenseNet201 model, enhancing the DenseNet201 architecture with a large kernel attention mechanism.While doing this, we focus on 3 important issues: image augmentation, channel attention and model evaluation.Our image processing process mainly include image augmentation. With image augmentation, we aimed to make data diversity suitable for the real world by obtaining data from different angles and to eliminate the imbalance between defect and normal images. This improvement boosts the model's ability to perceive contextual features and increases computational efficiency, essential for detailed spatial understanding and time-critical tasks. Our approach not only enhances operator efficiency but also moves towards automating the inspection process.
-
최근 에너지 소비량의 상승과 함께 효율적으로 에너지를 관리하는 것에 대한 중요성이 높아지고 있다. 이러한 관점에서 볼 때, 전 세계 에너지 소비량의 약 40%를 차지하는 건물 에너지의 수요와 공급을 예측하는 것은 매우 중요한 과제이며 딥러닝 모델을 기반으로 에너지 소비량을 예측하는 연구가 수행되고 있다. 그러나 기존 예측 모델은 여러 구역의 에너지 소비량을 예측하기 위해 필요한 시공간 상관 관계를 온전히 포착하기 어렵거나 에너지 사용량에 영향을 미치는 요인들을 활용하기 위해 복잡한 구조를 활용해야 한다는 한계가 있다. 본 논문에서는 이러한 한계를 극복하기 위해 데이터를 비디오 데이터 형식으로 변환하고 시공간 예측 모델을 사용하여 건물 에너지 예측을 수행하고, 비교 실험을 통해 적용 가능성에 대해 검토하고 가능성을 제시한다.
-
최근 Scene Graph Generation(SGG)이 시각적 이해와 상호작용 시스템에서 중요한 연구 분야로 떠오르고 있으며, 이는 정적 이미지에서의 객체와 객체 간 관계를 분석하는데 주로 사용되었다. 하지만 동적인 환경에서의 장면 그래프 생성은 시간에 따라 변화하는 객체의 상태와 그 사이의 관계를 정확히 파악하고 모델링하는 데 있어 훨씬 더 큰 도전이다. 본 논문에서는 비디오 시퀀스로부터 Dynamic Scene Graph(DSG)를 생성하는 새로운 방법을 제안한다. 이는 동적 환경에서의 객체 변화와 그 사이의 상호작용을 실시간으로 추적하고 이해하는 데 필수적인 기능을 제공한다. 본 논문에선 CNN 백본 네트워크와 인코더를 사용하여 각 프레임에서 시각적 표현을 추출하고, attention 메커니즘을 적용하여 시간적 정보를 통합한다. 또한, 디코더 내부에서 학습 가능한 쿼리를 이용해 복잡한 객체 간 관계를 인식하며, 헝가리안 알고리즘 매칭 로스를 사용하여 각 쿼리는 쌍별 인스턴스 특징을 학습하게되고, 디코더의 각 attention layer에서는 객체 간의 복잡한 관계를 추출하고, 이를 통해 각 관계에 적합한 predicate를 예측한다.
-
Time series forecasting can be enhanced by integrating various data modalities beyond the past observations of the target time series. This paper introduces the Multimodal Block Transformer, a novel architecture that incorporates multivariate time series data alongside multimodal static information, which remains invariant over time, to improve forecasting accuracy. The core feature of this architecture is the Block Attention mechanism, designed to efficiently capture dependencies within multivariate time series by condensing multiple time series variables into a single unified sequence. This unified temporal representation is then fused with other modality embeddings to generate a non-autoregressive multi-horizon forecast. The model was evaluated on a dataset containing daily movie gross revenues and corresponding multimodal information about movies. Experimental results demonstrate that the Multimodal Block Transformer outperforms state-of-the-art models in both multivariate and multimodal time series forecasting.
-
Agriculture and the plants and crops that are the results of it are essential to our everyday lives. Without agriculture our current society can not function and as such it is extremely important to make sure that we can assure that farms and farmers can continuously and steadily harvest enough produce. One big challenge that keep hindering the farming process are plant diseases that account for a large number of dead crops. They spread fast and can be troublesome to detect, especially manually. Datasets are also sparce and often lacking. To ease the detection process and speed it up, in an effort to aid farmers, we propose a pretrained MobileNet CNN deep learning AI model that can automatically detect maize/corn diseases from images. However, since data is rather sparce, not all diseases can be accounted for. This is why we have trained the model with one set of diseases (leaf spot and leaf blight) and healthy plant leaves, but tested it with a set of images of maize leaves that are infected with a disease the model has never seen before (leaf rust). The model has managed to not only learn and master the test set, but also managed to generalize to the before unseen rust infected leaf images. This promises to help future models learn robust and effective models that can generalize to diseases that can even classify diseases new to the model, which can be important in a field with limited data.
-
Flexibility is crucial in applications where users or systems require precise control over the appearance of text in images, particularly in scene text editing tasks. However, previous methods have primarily focused on altering text content, often neglecting the important aspect of controlling text formatting. In this paper, we propose a text editing model that not only edits content but also provides control over the format, utilizing a diffusion model with denoising and text-aware losses. By integrating these mechanisms, the model is capable of generating high-quality scene text images based on user-specified inputs such as text, size, and font, ensuring that both the content and appearance align with user preferences. We evaluate the model's performance using OCR accuracy on the ICDAR FST dataset, and the results demonstrate that our approach is highly competitive and effective when compared to existing methods in the field.
-
최근 몇 년의 3D, 텍스트의 멀티 모달 연구의 방향성을 파악하고, 3D 포인트 클라우드 데이터와 텍스트 사이의 연관성을 파악할 수 있는 새로운 방법론을 제시한다.
-
본 논문은 Vision-Language Model(VLM)의 성능을 향상시키고, 구성적 추론 문제를 해결하는 새로운 접근을 제시한다. VLM 은 시각적 정보와 언어적 정보를 결합하여 다양한 다운스트림 작업에서 뛰어난 성능을 보였지만, 여전히 이미지와 텍스트 간의 복잡한 관계를 완전히 이해하지 못하는 문제를 안고 있다. 특히, VLM 이 텍스트와 이미지의 구조적 차이를 인식하고 올바르게 매칭하는 데 한계가 있으며, 이는 주로 학습 데이터의 불균형과 손실 함수의 한계로 인해 발생한다. 이 문제를 해결하기 위해 다양한 연구들이 데이터셋과 손실 함수의 개선에 집중해 왔다. 본 논문에서는 제안하는 아키텍처는 두 가지 주요 구성 요소를 통해 문제를 해결한다. 첫 번째는 노이즈가 많은 Raw 데이터를 전처리하는 모델로, 잘못된 이미지-텍스트 쌍이나 단일 데이터를 처리하여 정제된 데이터를 출력한다. 두 번째는 하드 네거티브 데이터를 생성하여 VLM 의 구성적 추론 능력을 향상시키는 모델이다. 이를 통해 이미지와 텍스트 간의 구조적 차이를 더욱 명확히 구별할 수 있으며, 대조 학습을 통해 모델의 성능을 최적화한다.
-
Lung cancer is a leading cause of death worldwide, highlighting the critical need for early diagnosis. Lung image analysis and segmentation are essential steps in this process, but manual segmentation of medical images is extremely time-consuming for radiation oncologists. The complexity of this task is heightened by the significant variability in lung tumors, which can differ greatly in size, shape, and texture due to factors like tumor subtype, stage, and patient-specific characteristics. Traditional segmentation methods often struggle to accurately capture this diversity. To address these challenges, we propose a lung cancer diagnosis system based on Mask2Former, utilizing CT (Computed Tomography) and PET (Positron Emission Tomography) images. This system excels in generating high-quality instance segmentation masks, enabling it to better adapt to the heterogeneous nature of lung tumors compared to traditional methods. Additionally, our system classifies the segmented output as either benign or malignant, leveraging a self-supervised network. The proposed approach offers a powerful tool for early diagnosis and effective management of lung cancer using CT and PET data. Extensive experiments demonstrate its effectiveness in achieving improved segmentation and classification results.
-
With the widespread application of 5G technology, network traffic has increased unprecedentedly, which has a significant impact on network traffic management. Traditional network traffic prediction methods rely on time series analysis of seasonal patterns, ignoring the inherent spatial correlation of network traffic. Graph convolutional networks (GCN) learn spatial correlations. By combining GCN with time series models, spatiotemporal features can be captured simultaneously, thereby improving prediction accuracy. This paper introduces a new network traffic prediction model TSA-NTP based on the attention mechanism, which aims to more effectively capture spatiotemporal features in complex network environments.
-
Influenced by societal trends, cultural standards, and individual personalitiees, fashion is a potent means of self-expression. Many industries have benefited from the advancement of Artificial Intelligence(AI), with the fashion industry emerging as one of the most notable. AI has assisted the fashion industry in a number of areas, including product design and marketing. Online buying has proliferated as the fashion business has expanded into a multibillion-dollar industry, offering customers easy, stress-free shopping experiences. By advising customers on what to buy there could be potential increase in the sales of such and other products. The goal of this study is to investigate qualitatively mutimodal foundation models for fashion critics and advice. In this paper, we adapted a Gemini 1.5 flash on our dataset for compatibility prediction and complementary commentary on clothing. Qualitatively, the model provided very indepth review with varying images while also criticing fashion combination that are not compabible. The study alludes to the robotuness of mutimodal models with reommendation on quantitative evaluation in future studies.
-
제주어 보존과 활성화를 위해, 본 연구에서는 교차 언어 언어 모델을 활용하여 저자원 언어인 제주어의 기계 번역 성능을 개선하고자 한다. 특히, SOV 구조를 가진 언어를 사전 학습에 사용하여 구조적으로 유사한 언어를 통해 한국어→제주어 번역의 성능을 평가했다.
-
이슈 리포트 자동 레이블링은 효율적인 소프트웨어 유지보수를 위해 필수적인 작업이다. 그러나 이슈 리포트 데이터 셋은 롱테일 레이블 분포를 가지고 있어, 성능 저하를 초래할 수 있는 불균형 문제가 존재한다. 본 연구에서는 Easy Data Augmentation을 적용하여 롱테일 레이블의 성능을 개선할 수 있는지 실증적으로 검토하였다. 그 결과, 가장 희소한 "good-first-issue" 레이블에서 성능이 크게 개선된 것을 확인하였다.
-
본 연구는 쇼핑 결제의 효율성을 높이기 위한 스마트 결제 시스템을 제안한다. 기존 결제 시스템의 대기 시간과 위생 문제, 첨단 무인 매장의 높은 설치 비용을 해결하기 위해 카메라 한 대로 제스처, 얼굴, 객체를 인식하는 방식을 도입하였다. 이러한 연구는 소매업뿐만 아니라 다양한 분야에서의 활용 가능성을 열어줄 것으로 기대된다.
-
본 연구는 ECG 기반 사용자 인식 시스템에서 MobileNet-V2, SqueezeNet과 기존 전이 학습 모델들의 성능을 비교하였다. PTB-ECG 데이터베이스를 사용하여 각 모델의 계산 효율성과 인식 정확도를 분석하였다. MobileNet-V2는 98.88% 의 검증 정확도와 8분 59초로 빠른 훈련 속도를 기록하였으며, SqueezeNet은 95.75%의 검증 정확도를 보이며 3분 12초의 훈련 속도로 메모리 효율성 면에서 뛰어난 성능을 나타냈다. 실험 결과, 두 모델은 ECG 신호 분석에 적합한 경량화 모델임을 확인할 수 있었다.
-
교차로 신호 제어는 스마트 교통 시스템에서 중요한 역할을 하며, 강화학습(RL)을 기반으로 한 연구가 많이 진행되고 있다. 그러나 RL에서 보상 함수 내 요소 간 가중치를 적절하게 설계하는 것은 매우 어려운 과제이다. 최근 LLM을 활용해 데이터를 분석하고 의사 결정을 보완하는 연구가 주목받고 있으며, 이를 RL에 적용해 이러한 문제를 해결하려는 시도도 진행 중이다. 본 논문에서는 실시간으로 변화하는 교차로 내 효율적인 교통 제어를 위해 LLM을 이용하여 RL 보상 함수의 가중치를 실시간으로 조절함으로써 교통신호를 효율적으로 제어하는 알고리즘을 제안한다. 그리고 초기 가중치 설정과 가중치 조절 주기에 대한 실험 결과를 비교함으로써 제안 기법의 성능을 분석한다.
-
최근 자연어 처리(Natural Language Processing , NLP) 모델의 규모가 급격히 증가함에 따라, 하드웨어가 처리해야 할 파라미터 수가 기하급수적으로 늘어나고 있다. 이로 인해 대규모 모델의 효율적인 학습을 위해 다양한 병렬화 및 분산 학습 기법이 도입되었다. 이러한 기법은 데이터셋의 크기와 모델의 구조에 따라 학습 성능에 상당한 차이를 보인다. 본 연구에서는 IMDB (Internet Movie Database) 감정 분류 작업을 대상으로, Bert 와 ALBERT 모델을 활용하여 두 가지 병렬화 방식이 학습 시간에 미치는 영향을 분석하였다. 이를 통해 모델의 크기에 따라 최적의 병렬화 기법을 선택하는 것이 성능 향상에 필수적임을 밝히고, 분산 학습 환경에서 자원의 효율적 활용 및 성능 최적화를 위한 지침을 제시하고자 한다.
-
Fine-tuning is critical to enhance the model's ability to operate effectively in resource-constrained environments by incorporating domain-specific data, improving reliability, fairness, and accuracy. Large language models (LLMs) traditionally prefer centralized training due to the ease of managing vast computational resources and having direct access to large, aggregated datasets, which simplifies the optimization process. However, centralized training presents significant drawbacks, including significant delay, substantial communication costs, and slow convergence, particularly when deploying models to devices with limited resources. Our proposed framework addresses these challenges by employing a federated fine-tuning strategy with Whisper-tiny model for keyword recognition system (KWR). Federated learning allows edge devices to perform local updates without the need for constant data transmission to a central server. By selecting a cluster of clients and aggregating their updates each round based on federated averaging, this strategy accelerates convergence, reduces communication overhead, and achieves higher accuracy in comparatively less time, making it more suitable than centralized approach. By the tenth round of federated updates, the fine-tuned model demonstrates notable improvements, achieving over 95.48% test accuracy. We compare the FL-finetuning method with and centralized strategy. Our framework shows significant improvement in accuracy in fewer training rounds.
-
본 연구는 이차전지 산업의 원가 경쟁력 확보를 위한 원자재 가격 예측 자동화 파이프라인을 제안한다. XGBoost 모델을 기반으로 한 이 파이프라인은 데이터 전처리, 모델 학습 및 예측, 결과 시각화까지의 전 과정을 자동화하여 사용자의 개입을 최소화하고 실시간 의사결정을 지원한다. 본 연구에서는 단변량 및 다변량 예측을 동시에 수행하였으며, 이를 위해 니켈 원자재 가격 데이터와 유가, CPI, PPI, CRB 등 9 개 변수를 활용하였다. 획득한 데이터를 개발한 파이프라인에 적용하여 차분 횟수, 최적 변수 조합, 하이퍼파라미터 결정을 자동 수행하였고, 최종적으로 평균 절대 백분율 오차(MAPE) 0.2%, 결정계수(R2) 0.99 라는 높은 성능을 달성했다.
-
This study aims to predict MMSE scores in Alzheimer's disease (AD) patients using a CNN-LSTM model that processes MRI images and metadata. The OASIS-2 dataset was used, with MRI slices (central, ±10mm, and ±15mm) and metadata. Two datasets were created: one with central and ±10mm slices (10mm dataset), and another with central, ±10mm, and ±15mm slices (combined dataset). The CNN-LSTM model extracted features using VGG16 and combined them with metadata to predict MMSE scores. The 10mm model outperformed the combined model, achieving an MSE of 0.527 and MAE of 0.509. This study highlights the potential of predicting MMSE scores using MRI and metadata for early diagnosis of AD.
-
급속한 도시화와 교통량의 증가로 인해 보행자 안전이 중요한 사회적 문제로 부각되고 있다. 이에 따라 보행자의 횡단 여부를 예측하는 다양한 연구가 활발히 진행 중이다. 본 연구에서는 보행자 행동 예측에 대표적으로 활용되는 JAAD 데이터셋을 기반으로 QA 셋을 제작하고, 이를 최신의 오픈소스 MLLM에 해당하는 VideoLLaMA2 모델에서 미세조정을 진행하였다. 이 모델을 기반으로 과거 16 프레임 동안의 보행자 움직임을 관찰한 후, 30프레임 이후 시점에서 보행자의 횡단 의도(crossing/not-crossing)를 예측하고 그 정확도를 비교·분석한다. 그 결과, 미세조정을 진행한 모델에서 더 높은 예측 정확도를 나타내었으며. 향후 복잡하고 새로운 도로 환경에서도 보행자의 미래 횡단 의도를 예측하여 보행자의 안전성을 높일 수 있다.
-
폐쇄성 수면 무호흡증(Obstructive Sleep Apnea, OSA)은 수면 중 상기도의 폐쇄로 호흡 저하 및 중단이 발생하는 질환이다. 약물 유도 수면내시경(Drug-induced sleep endoscopy, DISE)은 이러한 상기도의 폐쇄 위치를 파악하는 데 사용되며, VOTE(Velum, Oropharynx, Tongue base, Epiglottis) scoring을 통해 DISE 결과를 판독한다. 하지만 VOTE scoring은 의료진이 주관적으로 각 해부학적 위치의 폐쇄 정도를 판단하기 때문에, 의료진의 해석에 따라 진단 결과가 달라질 수 있으며, 이로 인한 판독자간 판독 불일치가 상당하다. 따라서 본 연구는 딥러닝 모델을 활용하여 DISE 영상에서 VOTE 영역을 자동으로 분류하고 상기도의 완전폐쇄 여부를 예측하고자 한다. 연구개(V), 연구개 완전폐쇄(V degree 2), 구인두-혀 기저부-후두덮개(OTE), 구인두-혀 기저부-후두덮개 완전폐쇄(OTE degree 2), 왜곡(X) 총 5가지 클래스로 분류하였다. 이러한 분류 체계는 상기도의 부위별 폐쇄를 더 정확하고 체계적으로 예측할 수 있게 해 준다. 이를위해 13명의 환자로부터 수집된 DISE 영상 데이터셋과 임상 정보를 기반으로 ResNet, DenseNet, VGG, EfficientNet과 같은 딥러닝 모델을 구현하고 성능을 비교했다. 그 결과 EfficientNet 모델이 80%의 정확도로 가장 뛰어난 성능을 보였다. 향후 연구에서는 DISE 영상에서 상기도 폐쇄 양상을 더욱 세분화하여 분석하고자 한다.
-
수면 장애는 성인의 약 30%가 경험하는 흔한 질환으로 수면 단계마다 다른 양상을 보인다. 현재 수면 단계 분류에 관한 연구는 활발하지만 기존 모델은 임상에서 사용할 만큼 예측 정확도가 높지 않다. 본 논문에서는 비렘수면 단계를 LS(Light Sleep)와 DS(Deep Sleep)로 분류하여 정확도를 높인 뇌파 단일 채널 기반 수면 단계 분류 모델을 제안한다. 해당 모델은 수면 단계 단순화를 통해 모델의 성능을 향상하였으므로 향후 직관적인 수면 질 파악 및 실시간 수면 모니터링 등 임상 환경에서 수면의 질 평가, 장애 진단, 치료 계획 수립에 기여할 것이다.
-
생성형 인공지능의 발전으로 AI기자가 작성한 기사가 점차 증가될 것으로 전망되고 있다. 시간 절약, 경제성 등의 장점에도 불구하고 인공지능이 작성한 뉴스 내 허위정보 등으로 혼란이 사회적 문제로 제기되고, 이를 악용한 가짜뉴스 생성의 우려에 따라 구축모델의 필요성이 제기되고 있다. 이에 따라 실제 기사와 AI 작성 기사를 KoBART, KoELECTRA 모델과 두 모델을 앙상블한 모델에 적용시켰고, 그 결과 KoBART 모델의 Accuracy가 0.9995로 가장 높은 지표를 보였다.
-
연합학습은 분산된 환경에서 데이터의 공유 없이 모델을 학습시킬 수 있는 방법이다. 그 중에서도 Fed-Avg 는 분산된 클라이언트의 파라미터의 평균으로 모델을 수집하고 반영한다. 이 방법을 통해 연합학습의 모델의 연구가 발전되었으며, 모델성능을 향상시키기 위한 연구들이 꾸준히 진행되어왔다. 기존의 연합학습은 데이터를 공유하지 않고 모델 파라미터만을 서버로 전송하는 방식을 채택하여 데이터의 노출을 최소화하였다. 그러나 지역학습을 위해 서버가 클라이언트들에게 모델을 공유해야 하기 때문에 모델의 노출은 불가피할 수밖에 없다. 특정 분야에서는 데이터 노출 뿐만 아니라 모델의 노출을 보호하는 것 또한 중요한 분야도 있다. 본 논문에서는 이런 문제를 해결하기 위해 서브모델을 활용한 연합학습 보간 방법을 제시하였다. 이 방법은 지식증류 방법 기반에서의 새로운 모델 학습 방법을 제시한다. 실험에서 기존의 모델이 노출되지 않으면서 노이즈에도 강건하게 모델을 학습시킬 수 있음을 보여주었다.
-
본 논문에서는 장기 비디오 이해를 위한 새로운 메모리 메커니즘을 제안하였다. 제안된 메모리 메커니즘은 메모리 구성에 사용되는 시각 토큰을 압축하여, 메모리 사용량과 연산 비용을 줄이면서도 효율적인 비디오 처리를 목표로 한다. 다양한 시각 토큰 압축 방법을 적용 및 비교하였으며, MSVD-QA 데이터셋을 활용한 실험 결과, 제안된 메커니즘이 기존 방법에 비해 효율성과 성능 면에서 모두 우수함을 확인하였다. 본 연구는 장기 비디오 이해의 효율성을 높일 수 있는 새로운 접근 방식을 제시한다.
-
크라우드소싱 기반 연합학습에서 글로벌 모델은 모델 제작 의뢰자의 중요한 자산이다. 하지만, 연합학습 플랫폼 운영 주체는 모델 학습을 위해 글로벌 모델의 파라미터를 클라이언트에게 공유해야 한다. 이 과정에서 악의적인 클라이언트로부터 모델 탈취 공격이 발생할 수 있다. 본 연구는 모델의 파라미터에 노이즈를 추가함으로써, 공유되는 모델의 정확도를 낮은 수준으로 유지하는 동시에 취합된 로컬 모델로부터 만들어진 글로벌 모델의 높은 정확도는 보장하고자 하는 데 목적이 있다.
-
Facial emotion recognition (FER) is becoming crucial in fields like human-computer interaction and surveillance. Traditional FER systems rely on two-stage models with face alignment preprocessing, which increases complexity and inference time. In this research, we propose a single-stage approach using YOLOv6 combined with weighted class loss to address these inefficiencies. Our method improves computational efficiency while enhancing the detection of minority classes in imbalanced emotion datasets. The experiments demonstrate that although the weighted loss function helps with class detection, it slightly reduces overall accuracy. Nevertheless, the model shows promise for real-time FER applications, balancing accuracy and speed. This work not only introduces a more efficient approach but also highlights the potential of single-stage models in advancing emotion recognition tasks.
-
본 연구는 In-context learning 을 적용한 LMM 을 이용하여 감시 카메라 비디오 데이터를 기반으로 이상 상황을 탐지하고 이에 대한 범죄 클래스를 분류하는 방법을 제안한다. 특히 VTimeLLM[1] 모델을 사용하여 비디오 데이터를 분석하고, '정상' 및 '비정상' 이벤트를 분류한다. 추가적으로 '비정상' 이벤트는 13 개의 범죄 클래스 중 하나로 분류된다. 본 연구에서 zero-shot 과 few-shot 학습 기법을 적용하여 기존 방법들과 정량적으로 비교 실험을 수행했다. 실험 결과 LMM 과 In-context learning 을 결합한 방식이 기존 방법들과 비교해 이상 상황 탐지 성능이 개선되었다.
-
뇌 연령은 신경퇴행성 질환과 인지 저하를 예측하는 중요한 바이오마커로 주목받고 있으며, 이를 통해 개인의 뇌 건강 상태를 보다 정밀하게 확인할 수 있다. 특히, 회백질과 백질은 뇌 구조와 기능을 평가하는 데 핵심적인 역할을 하며, 뇌 구조적 변화를 분석함으로써 뇌 연령 예측의 정확도를 높일 수 있다. 또한, 특정 데이터셋만 활용될 경우 일반화된 성능을 기대하기 어려워 뇌 연령 예측에 다양한 데이터셋을 활용한 연구가 필요하다. 따라서, 본 연구에서는 다중 모달 MRI 데이터를 결합한 3D CNN 기반 뇌 연령 예측 모델을 제안한다. 제안된 모델은 회백질과 백질의 특징을 전처리된 T1 이미지에 결합하여 더욱 풍부한 뇌 구조 정보를 학습할 수 있도록 설계하여, 뇌 연령 예측의 정확성을 향상시켰다. 실험 결과 회백질과 백질 정보를 추가로 활용한 모델이 T1 이미지만을 사용한 기존 CNN 및 ResNet 모델보다 MAE(Mean Absolute Error) 평가지표에서 더 우수한 성능을 보였으며, 이를 통해 회백질과 백질 정보가 뇌 연령 예측에 중요한 기여를 한다는 사실을 확인하였다.
-
암 환자의 유전체 변이 데이터는 샘플 수가 적으나 많은 특성 정보를 가지는 의료 데이터로, 이러한 특성은 ML 모델의 성능 향상에 상당한 장벽으로 작용한다. 따라서 본 연구는 제한된 의료 데이터의 한계를 해결할 수 있는 적절한 모델 선택을 돕고자, 유전체 데이터를 이용하여 암종을 예측하는 다중 클래스 분류 문제에서 성능향상기법과 다중 클래스 분류 모델에 따른 성능을 분석하였다.
-
본 연구는 상세 페이지 이미지의 도용을 방지하기 위한 이미지 유사도 확인 기술을 개발하는 것을 목표로 한다. 이를 위해 이미지 검색 모델 Unicom을 사용하여 제품 이미지 간의 유사도를 측정하고, 도용 가능성이 높은 상위 10개의 이미지를 반환하는 시스템을 설계한다. 학습에는 Stanford Online Products(SOP) 데이터셋과 In-Shop 데이터셋을 사용하였으며, 테스트는 국내 온라인 쇼핑몰에서 수집된 제품 이미지와 상세 이미지 데이터를 통해 이루어졌다. 성능 평가는 Rank-k accuracy를 사용하여 측정하였으며, Rank-10 기준으로 높은 정확도를 기록하였다. 본 연구는 이미지 검색 모델을 활용하여 온라인 쇼핑몰에서 발생할 수 있는 이미지 도용 문제를 효과적으로 탐지하고, 지적재산권 보호를 강화할 수 있는 도구를 제안한다.
-
본 연구는 알코올 사용 장애 식별 도구인 AUDIT-K를 기반으로 위험 음주자를 식별하는 인공지능 모델을 제안한다. 음주로 인한 사고는 점차 줄어들었지만, 재범의 수는 과거에 비해 큰 폭으로 증가했다. 위험 음주자가 자신의 음주 상태를 알 수 있게 해준다면, 음주 수준에 따라 대상자를 신속하게 분류하는 인공지능 모델을 통해 위험 음주자나 알코올 중독자에 대한 개입이나 치료를 더 신속히 하여 위험 음주로 인한 문제 발생을 예방하는 것에 도움이 된다. 이 모델은 사용자의 점수에 따라 위험 음주자를 분류하는 목적으로 제작되었다. 본 모델은 위험 음주자를 구분함으로써 자신의 음주 습관 위험성을 인지하고 알코올 중독 예방에 도움이 될 것이다.
-
본 연구에서는 GPT-4 기반의 자연어 처리를 활용하여 뉴스 기사 제목의 감성 분석을 통해 주식 가격 예측 성능을 개선하는 방법을 제안한다. Python을 이용한 웹 크롤링으로 주식 관련 뉴스 기사 제목을 수집하고, GPT API로 긍정도를 분석하여 이를 주식 데이터와 결합한 후 머신러닝 모델에 적용하였다. 여러 회귀 모델을 통해 예측 성능을 비교한 결과, 감성 분석을 포함한 모델에서 예측 성능이 올라감을 확인하였다. 이 연구를 통해 뉴스 감성이 주식 시장 예측에 미치는 영향을 확인할 수 있다.
-
Large Language Model(LLM) 사용이 증가하면서, LLM의 성별 및 인종에 대한 편향성은 사회적 불평등을 심화시킬 수 있는 중요한 문제로 대두되고 있다. 이에 LLM의 편향을 정확하고 신뢰성 있게 측정하는 도구가 필요하다. 본 논문은 LLM의 편향을 평가하는 방법론을 워드 임베딩 분석과 텍스트 생성 편향 분석으로 나누어 검토한다. 워드 임베딩 분석 방법은 단어 벡터 간 거리를 측정해 편향을 정량적으로 평가하는 방식으로, 간호사나 군인과 같은 단어들이 성별이나 인종과 같은 특정 집단과 얼마나 가깝게 매핑되는지를 분석하는 방식이다. 그러나 이 방법은 단어의 문맥적 의미 변화를 충분히 반영하지 못하는 한계가 있다. 반면, 텍스트 생성 편향 분석 방법은 LLM이 실제로 생성한 텍스트에서 나타나는 편향을 직접 평가하는 방식이다. 이를 위해 연구자는 성별이나 인종과 관련된 편향이 드러날 수 있는 문장들로 데이터셋을 구성하고, LLM이 이를 어떻게 처리하는지 분석한다. 이방법은 문맥을 반영해 모델이 생성한 텍스트에서 편향을 평가할 수 있다는 장점이 있지만, 연구자가 데이터셋을 구축하는 과정에서 주관적 판단이나 편향이 개입될 가능성이 있으며, 평가할 수 있는 시나리오가 제한적이라는 한계가 있다. 본 논문은 이러한 한계를 극복하기 위한 향후 연구로, 합성 데이터를 활용하여 데이터셋을 구축하고, 이를 통해 텍스트 생성 편향을 분석하는 방법을 제안한다. 합성 데이터는 다양한 시나리오를 기반으로 무한히 생성할 수 있어, 특정 시나리오에 제한되지 않고 LLM의 편향을 폭넓게 평가할 수 있다. 또한 연구자의 개입을 줄여 데이터셋 구축 시 발생할 수 있는 편향을 최소화하고, 더 공정하고 신뢰성 있는 평가를 가능하게 한다. 이에 따라 합성 데이터를 이용한 텍스트 생성 편향 분석 방법은 LLM의 성별 및 인종 편향을 보다 객관적으로 평가하는 도구로서 중요한 역할을 할 것으로 기대한다.
-
최근 몇 년간 대규모 언어 모델(LLM)은 자연어 처리(NLP) 분야에서 인간의 언어를 이해하고 생성하는 능력으로 큰 주목을 받아왔다. 초기에는 텍스트 생성, 번역, 질의응답 시스템과 같은 작업에 주로 사용되었으나, 최근에는 코드 생성과 같은 복잡한 기술 작업에도 응용되고 있다. 그러나 LLM 이 생성한 코드는 문법적 오류, 논리적 결함, 실행 불가능한 문제 등 다양한 문제점을 포함할 수 있다. 이러한 문제를 해결하기 위해 LLM 이 스스로 코드를 검증하고 개선할 수 있는 자동화 피드백 시스템이 주목받고 있다. 본 논문에서는 코드 생성 LLM 의 성능을 향상시키기 위한 주요 자동화 피드백 메커니즘들을 분석한다. 이러한 자동화 피드백 시스템은 소프트웨어 개발 과정을 자동화하고 최적화하는 데 중요한 역할을 할 수 있으며, 향후 연구에서는 이 시스템의 정교화 및 코드 생성 분야에서의 확장 가능성에 대한 탐구가 필요할 것이다.
-
이 연구는 딥러닝을 사용하여 당뇨병성 망막증을 탐지한다. ImageNet 에서 사전 학습된 Swin Transformer 모델을 IDRiD 데이터셋으로 미세 조정하여, 병변 분할 및 당뇨병성 망막증 분류에서 강건한 모델을 개발하였다. 이 모델은 93.2%의 높은 정확도를 기록하며 질병 진단에서의 효율성을 입증한다. 데이터 전처리와 최적 임계값 설정을 통해 모델의 정확성과 신뢰성을 더욱 향상시킨다.
-
고령화로 인해 실명을 유발하는 안질환의 발병률이 지속적으로 증가하고 있다. 이에 본 연구는 딥러닝 기반의 안저사진 분석을 통해 다중 안질환 분류 모델의 적용성을 향상시키고자 한다. Ocular Disease Intelligent Recognition (ODIR) dataset과 같은 다양한 공용 데이터셋에 순환학습과 regularization 기법을 적용하여 녹내장, 백내장, 황반변성 등의 질환을 효과적으로 분류를 돕는 기법을 제안한다. 이를 통해 안질환 진단의 정확성을 높이고, 임상에서 활용가능한 신뢰성 있는 안질환 진단 모델을 구축하고자 한다.
-
Alzheimer's disease (AD) is a progressive neurodegenerative disorder characterized by gradual cognitive decline and memory loss, with subtle changes in brain structure that make accurate classification particularly challenging. This study presents SMOTE-ADNet, an innovative Convolutional Neural Network (CNN) model designed to enhance classification performance for Alzheimer's disease by integrating advanced CNN techniques with the Synthetic Minority Over-sampling Technique (SMOTE). The SMOTE-ADNet architecture includes multiple convolutional layers, dropout regularization, and a final dense layer optimized for multi-class classification, aimed at differentiating between five stages of Alzheimer's disease: Alzheimer's disease (AD), Cognitive Normal (CN), Early Mild Cognitive Impairment (EMCI), Late Mild Cognitive Impairment (LMCI), and Mild Cognitive Impairment (MCI). Given the challenge of distinguishing between subtle variations in brain structure during these stages, SMOTE-ADNet effectively balances the dataset using SMOTE and leverages advanced CNN layers to achieve a remarkable accuracy of 98%. This result demonstrates the model's capability to manage the inherent difficulty of classifying subtle structural differences and its potential for improving diagnostic precision and aiding early intervention in Alzheimer's disease.
-
의류 추천 과정에서 유사 이미지 검색 기능의 역할과 그 효과를 분석하는 데 목적을 두고 있다. 의류 추천 기능은 기존의 유사한 상품 검색 기능의 한계를 보완하며, 의류 플랫폼에서 맞춤형 검색 결과를 제공하는 데 기여한다. 이미지 인식 기술과 딥러닝 알고리즘을 활용하여 사용자의 의도를 파악하고, 상의와 하의를 개별적으로 인식하여 추천하는 방식으로 기존 의류 추천 시스템과 차별화되며, 사용자에게 최적화된 스타일 조합이 될 것으로 기대된다.
-
This paper presents a comparative study of five deep learning models-ResNet50, DenseNet121, Vision Transformer (ViT), Swin Transformer (SwinT), and CoatNet-on the task of multi-label classification of fundus images for ocular diseases. The models were trained on the Ocular Disease Recognition (ODIR) dataset and validated on the Retinal Fundus Multi-disease Image Dataset (RFMiD), with a focus on five disease classes: diabetic retinopathy, glaucoma, cataract, age-related macular degeneration, and myopia. The performance was evaluated using the area under the receiver operating characteristic curve (AUC-ROC) score for each class. CoatNet achieved the best AUC-ROC scores for diabetic retinopathy, glaucoma, cataract, and myopia, while ViT outperformed CoatNet for age-related macular degeneration. Overall, CoatNet exhibited the highest average performance across all classes, highlighting the effectiveness of hybrid architectures in medical image classification. These findings suggest that CoatNet may be a promising model for multi-label classification of fundus images in cross-dataset scenarios.
-
In this study, we propose a self-supervised learning framework for fundus image processing, utilizing both contrastive and generative learning techniques for pre-training. Our contrastive learning approach integrates both image and text modalities through cross-attention mechanisms, allowing the model to learn more informative and semantically rich representations. After pre-training, the model is fine-tuned for downstream tasks, including zero-shot, few-shot, and full fine-tuning. Experimental results show that our method significantly outperforms existing approaches, achieving 15% higher performance in zero-shot, 4.5% in few-shot, and 10.1% in fine-tuning scenarios. The proposed method demonstrates its potential in the medical imaging field, where access to large annotated datasets is often limited. By efficiently leveraging both image and textual information, our approach contributes to improving the accuracy and generalizability of models in fundus image analysis, highlighting its broader applicability in medical diagnostics and healthcare.
-
Detecting vulnerabilities in source code is essential for maintaining software security, but traditional methods like static and dynamic analysis often struggle with the complexity of modern software systems. Large Language Models (LLMs), such as GPT-4, have emerged as promising tools due to their ability to learn programming language patterns from extensive datasets. However, their application in vulnerability detection faces significant hurdles. This paper explores the key challenges limiting the effectiveness of LLMs in this domain, including limited understanding of code context, scarcity of high-quality training data, accuracy and reliability issues, constrained context windows, and lack of interpretability. We analyze how these factors impede the models' ability to detect complex vulnerabilities and discuss their implications for security-critical applications. To address these challenges, we propose several directions for improvement: developing specialized and diverse datasets, integrating LLMs with traditional static analysis tools, enhancing model architectures for better code comprehension, fostering collaboration between AI systems and human experts, and improving the interpretability of model outputs. By pursuing these strategies, we aim to enhance the capabilities of LLMs in vulnerability detection, contributing to the development of more secure and robust software systems.
-
문서의 디지털화 수요가 급증함에 따라, 정보 추출 및 구조화 연구의 중요성이 커지고 있다. 본 연구는 병합 셀이 포함된 테이블 이미지를 HTML 코드로 변환하기 위해 Vision Language Model의 파인튜닝 학습과 실험을 지휘통제 지능정보 플랫폼 기반에서 진행하였다. 베이스 모델은 MiniCPM-V 2.6을 사용하였으며, 학습 데이터는 TNCR과 PubTables-1M 데이터셋 일부를 수정하여 표 이미지-HTML 코드 쌍으로 구성하였다. 성능 평가는 TEDS 지표를 사용하였으며, 파인튜닝 모델은 100개의 테스트 데이터에 대해 93.15%의 TEDS 점수를 기록하여 베이스 모델(78.63%)보다 향상된 성능을 보였다. 본 연구는 병합 셀이 포함된 테이블 구조 인식 분야 연구에서 파인튜닝을 통해 Vision-LLM의 성능을 향상시킬 수 있음을 보여주는 사례로, 다양한 문서 디지털화 작업에 실제적인 기여를 할 수 있을 것으로 기대된다.
-
본 연구는 국방 AI 플랫폼 기반 변화 탐지 서비스를 제안한다. 국방 AI 플랫폼의 특성을 반영하여 객체의 출현, 소실, 이동을 정량화하고, 이를 통해 장면의 동적 변화를 평가하는 변화율을 정의한 후, 해당 변화율을 적용한 서비스를 설계하였다. 변화 탐지 서비스는 학습 없이 다양한 환경에서 실시간 적용이 가능하며, 사건의 중요도를 효율적으로 분석할 수 있다. YOLOv10 탐지 모델과 추적 모델을 사용한 실험을 통해 변화율 기반 변화 탐지 서비스의 실시간 처리 가능성을 검증하였으며, 복잡한 상황에서도 효과적인 변화 탐지가 가능함을 확인하였다.
-
본 논문은 디지털 콘텐츠의 무단 사용을 방지하기 위해 GAN과 FGSM을 결합한 적대적 워터마킹 기법을 제안하는 것을 목표로 한다. 이 기법은 GAN을 사용해 시각적으로 인지하기 어려운 워터마크를 생성하고, FGSM을 통해 AI 모델이 이 워터마크를 학습하지 못하도록 방해한다. 제안된 기법의 효과를 SSIM과 Probability Shift & MAX Probability Shift 지표를 통해 분석하여, 디지털 콘텐츠 보호에 대한 새로운 접근 방식을 제시하고자 한다.
-
게임의 난이도는 게임 디자인에서 중요한 요소로, 사용자의 몰입과 만족도를 크게 좌우한다. 전통적인 게임 난이도 조절은 일반적으로 기획자의 경험과 판단에 의해 이루어진다. 그러나 기존의 난이도 조절 방식은 다양한 사용자의 개별 실력 수준을 정밀하게 반영하는 데 한계가 있다. 본 연구에서는 GPT 를 활용하여 게임의 난이도를 동적으로 조절하는 방법을 제안한다. 사용자의 게임 플레이 정보를 수집하고 GPT 로 사용자의 게임 실력을 분석하고 평가한다. 평가를 바탕으로 게임의 난이도와 관련된 요소들을 조절한다. 이를 통해 GPT 가 게임 디자인 도구로서 가지는 잠재력을 탐구한다.
-
본 연구에서는 CIFAR-10 데이터셋을 활용해 세 개의 합성곱 레이어와 완전 연결 레이어로 구성된 CNN 모델을 학습하고 평가하였다. Adam 옵티마이저와 교차 엔트로피 손실 함수로 학습된 결과, 약 75%의 테스트 정확도를 달성하였다. 간단한 CNN 아키텍처도 소규모 데이터셋에서 효과적인 이미지 분류가 가능함을 확인하였으며, 향후 더 복잡한 모델과 기법을 통해 성능을 개선할 수 있음을 제안한다.
-
본 연구는 이미지 복원에서 국소적인 블러 영역을 감지하고 효과적으로 복원하기 위한 방법을 제안한다. 기존 DeblurGANv2가 전체 이미지를 대상으로 복원하는 데 반해, 본 연구에서는 Laplacian 변환을 활용한 블러 감지 모듈을 도입하여 블러 영역을 정확히 탐지하고 복원한다. 제안한 방법은 블러 감지 과정을 통해 생성된 Blur Mask를 활용하여 복원 모듈에 입력하고, 이로써 불필요한 연산을 줄이고 복원의 정확도를 높인다. 향후 연구에서는 다양한 블러 유형에 대한 적용 및 모델 최적화를 통해 제안한 방법의 범용성과 성능을 향상시킬 계획이다.
-
연합 학습은 최근 기계 학습 분야에서 발생할 수 있는 다양한 문제들을 해결했지만, 학습의 주체가 서버에서 클라이언트로 이동함에 따라 클라이언트 장치의 컴퓨팅 자원의 한계가 새로운 문제로 부각되었다. 클라이언트의 장치는 중앙 집중적 서버와 비교하여 상대적으로 적은 컴퓨팅 자원을 보유하고 있으며, 특히 엣지 디바이스와 같은 클라이언트의 장치는 현저히 적은 컴퓨팅 자원으로 인해 일반적인 연합 학습 절차에 효과적으로 참여하기 어렵다. 본 연구는 클래스 계층 구조와 계층적 전문가 혼합을 통해 엣지 디바이스가 연합학습에 효과적으로 참여할 수 있도록 하였다. 이 기법은 CIFAR-100 과 Tiny ImageNet 데이터셋을 통해 효용성을 입증하였으며, 기존 기법과 비교해 라운드당 학습 시간과 메모리 사용량이 낮음을 보인다.
-
광학 투과형 헤드 마운트 디스플레이(OST-HMD) 환경에서 제한된 시야각 문제를 해결하기 위한 새로운 접근 방식인 구형 레이어 비주얼 가이드(SLSV Guide: Sphere Layer Spatial Visual Guide)를 제안한다. SLSV 가이드는 Montello의 공간 스케일 이론을 기반으로 하여, 사용자 중심의 3차원 공간 구조화를 통해 증강현실(AR) 콘텐츠를 효과적으로 전달하는 방식을 제시한다. SLSV 가이드의 주요 특징으로는 중심 시야 활용, 동적 정보 제공, 다중 감각 활용, 단계적 정보 제공, 그리고 컨텍스트 인식적 접근이 있다. 이러한 특징들은 OST-HMD의 기기적 한계를 극복하면서도 AR 환경의 3차원적 특성을 충분히 활용할 수 있도록 한다. 본 연구는 기존의 Level-of-Detail 개념과 공간 UI 전환 메커니즘 연구를 확장 적용하였으며, 웹 개발에서의 반응형 디자인 원칙을 AR 환경에 적용하였다. 이를 통해 공간 인식 향상, 정보 과부하 방지, 다양한 환경에 대한 적응성, 그리고 직관적인 내비게이션 제공 등의 장점을 가진 새로운 AR 가이드 방식을 제시한다.
-
이 논문은 혼합현실공간을 통해 원격의 로봇을 제어할 수 있도록 원격작업로봇이 놓인 원격 작업장과 동일한 XR 공간 환경을 구축하고, 구축한 XR 공간을 통해 작업자가 원격으로 로봇을 제어할 수 있도록 원격조작 작업 명령을 생성하고 원격 제어 작업 수행의 결과를 실시간으로 확인하도록 하기 위한 인터페이스를 구현하였다.
-
본 논문은 고령화로 인해 급증하는 치매 환자 수에 대응하기 위한 웹 기반 화상채팅을 통한 치매 조기 진단 및 예방 서비스를 제안한다. 이 서비스는 WebRTC 를 이용해 노인과 돌봄 제공자 간의 영상 데이터를 수집하고, AI 기반 분석 모델로 치매 초기 징후를 감지한다. 이를 통해 제안하는 서비스는 치매를 조기에 발견함으로써 관리 비용 절감을 목표로 하며, 생성형 AI 를 활용한 예방 퀴즈와 관련 정보를 제공하여 치매 예방에도 기여한다. 서비스는 데이터 수집, 저장, 분석, 시각화의 4단계로 구성되며 최신 기술을 활용해 효율적이고 정확한 치매 진단을 지원한다. 제안하는 서비스는 향후 서비스의 확장성과 모델의 정확성을 높이기 위한 추가적인 연구와 개선이 필요하다.
-
현대 사회에서 지적 장애인을 위한 맞춤형 기술의 필요성이 점점 더 강조되고 있다. 본 논문에서는 경도 및 중등도 지적 장애인을 대상으로 한 AI 기반 프롬프트 엔지니어링 방법을 제안한다. GPT 와 같은 대규모 언어 모델(LLM)을 활용하여 사용자에게 쉽게 이해할 수 있는 맞춤형 응답을 제공하며, 프롬프트 엔지니어링 과정에서 다양한 패턴을 적용하여 지적 장애인이 위험 상황에서 적절한 결정을 내릴 수 있도록 돕는다. 본 연구는 이러한 기술의 효과를 논의하며, 프롬프트 엔지니어링이 지적 장애인의 일상생활에 실질적인 도움을 줄 수 있음을 제시한다.
-
본 연구는 기존 키오스크의 사용자 접근성의 한계를 극복하고 사용자에게 직관적이고 개선된 경험을 제공하는 음성 대화형 키오스크 애플리케이션 개발에 중점을 둔다. 음성 인식을 통해 사용자와 상호작용하고, 대화 내용을 텍스트로 표시해 재확인할 수 있도록 하는 인터페이스를 제공하여 키오스크 이용자의 접근성과 사용성을 향상시켰다. 특히 키오스크 사용에 어려움을 겪는 고령층의 편의를 증진하여, 소비자층을 원활히 확대하는 데 기여할 것으로 기대한다. 사용자는 대화를 통해 주문과 조작을 할 수 있도록 하여, 기존에 복잡한 인터페이스를 단순화하고, 메뉴 추천, 재료 조회 등의 기능을 통해 사용자의 접근성을 높인다. 또한, 가게 운영 측면에서도 효율성을 높일 수 있다. 혼잡 시간대에 대한 추가 인력 소요비용을 절감할 수 있을 것이다.
-
본 논문에서는 '편심 메커니즘'이라는 독창적인 로봇 기구설계 구조를 선보이고, 실제 구현을 바탕으로 그 효과를 검증한다. 비평탄한 지형에서 평형을 유지하고 주파할 수 있는 소형 바퀴형 지능 로봇을 제안하여, 바퀴형 로봇의 구조적 한계를 뛰어넘을 수 있는 유연성을 제시하고자 한다.
-
This paper is dedicated to automated Knowledge Unit extraction by employing Prompt Engineering within the Generative AI models. The experiment is conducted analyzing the ability of GPT-4 to extract Knowledge Units' elements in an automated manner by the created prompts. Verification is proceeded by comparison among results from GPT-4 and the elements of Knowledge Units coming from the original methodology of knowledge-structured texts' creation. The results of the research prove that thanks to the created prompts, Knowledge Units are successfully extracted from unstructured text.
-
본 연구는 AI 기술을 활용하여 언어적, 비언어적 커뮤니케이션을 종합적으로 분석하는 혁신적인 면접 준비 시스템을 제안한다. 비언어적 행동 분석 기능을 통합하여 면접자에게 다양한 질문에 대한 답변 연습, 즉각적인 피드백, 그리고 객관적인 행동 분석을 제공한다.
-
웹3.0 시대의 다양한 응용 분야에서 활용되는 행렬 곱셈 연산에 대하여 최신 웹 표준 기술인 WebAssembly 및 WebGPU 표준을 적용하여 알고리즘을 구현하고 실행 성능을 평가한다. 실험 결과 작업의 크기가 커질수록 병렬화 효과로 인해 WebGPU 코드가 JS에 비해 최대 30배 빨라졌다. 또한 JS 코드에 비해서 WASM 코드의 실행 속도가 빠르며, 일부 작업의 크기가 작은 경우에는 WASM 및 WebGPU에서 초기 로딩 타임과 데이터 복사 작업에 따른 오버헤드가 있음을 확인하였다.
-
본 연구는 대학생들의 학사 정보 접근성을 향상시키기 위해 학교 챗봇을 개발하는 것을 목표로 하였다. 기존 RAG 방식의 정확도 한계를 극복하고자, HyDE 기법을 공지사항 데이터셋 특성에 맞게 확장하였다. 각 문서의 핵심 내용을 요약한 제목이 포함된 데이터셋의 구조를 활용해, 사용자의 질문에 대한 가상의 답변과 가상의 제목까지 함께 생성하는 확장된 접근법을 제안했다. 이는 기존의 Raw Query 방식 대비 약 90.45% 검색 정확도 향상을 이루었다. 본 연구의 확장된 HyDE 기법은 학교 챗봇을 비롯한 다양한 시스템에 적용할 수 있어 정보 접근성을 크게 개선할 것으로 기대할 수 있다.
-
모아뷰는 기존 PowerPoint 기능을 유연하게 활용하면서, 혁신적인 3D 모델링 기술을 통합한 프레젠테이션 플랫폼이다. 이 플랫폼은 2D 와 3D 자료를 자연스럽게 결합하여 콘텐츠를 더욱 포괄적이고 시각적으로 제시할 수 있다. 사용자들은 다양한 3D 오브젝트를 손쉽게 삽입하고 편집할 수 있으며, 3D 오브젝트 생성에 어려움을 겪는 이들을 위해 AI 를 통해 텍스트와 이미지 입력만으로도 다양한 3D 오브젝트를 자동으로 생성할 수 있는 기능을 제공한다.
-
스마트 미터링 기술은 전력 소비를 실시간으로 모니터링하고 분석하여 에너지 효율성을 극대화하며 전력망의 안정성을 강화하는 중요한 역할을 한다. 최근 정보통신기술(ICT)의 발전으로 인해 스마트 미터링 시스템의 성능이 크게 향상되었으며, 이를 통해 보다 정교한 전력 관리가 가능해졌다. 그러나 이러한 기술이 제공하는 이점에도 불구하고 대규모 데이터 처리, 보안성, 데이터 활용의 효율성 문제는 여전히 해결해야 할 주요 과제로 남아 있다. 데이터 처리와 저장의 효율성을 높인다.
-
This paper describes an automated fruit sorting system using Raspberry Pi and Arduino to classify apples and oranges by freshness, using EfficientNet-B0 for detection. It offers expandability and addresses labor shortages in agriculture through automation.
-
본 시스템은 개인 맞춤형 스마트 미러로, 날씨와 일정 등 기본적인 기능만 제공하는 스마트 미러와 달리 전신을 촬영하여 신체 치수를 측정하고 체형을 분석한다. 또한 그 체형에 어울리는 의류를 도출하여 색배합 알고리즘과 날씨를 고려한 코디를 생성하고 추천한다. 이때 사용자는 웹사이트를 이용하여 스마트폰으로 본인의 의류 데이터를 스마트 미러에 직접 등록할 수 있다.
-
본 연구는 TFLite 경량화 AI 모델을 활용한 자동 쓰레기 분리수거 시스템을 제안한다. 라즈베리파이 환경에서 아두이노를 통해 두 개의 로봇팔을 제어하여, 기존 방식보다 작업 효율성을 높였다. 쓰레기 종류별 데이터 분포를 일정하게 맞추고, 고품질의 데이터를 사용함으로써 모델의 인식 성능을 크게 개선하였다. 실시간 객체 인식 테스트 결과 평균 정확도는 90% 이상에 달했다. 이러한 과정을 통해 자동 분리수거 시스템의 정확성과 효율성을 한층 더 높일 수 있을 것으로 기대된다.
-
본 논문은 에너지 자원에 대한 소비 부담 문제를 해결하기 위해 IoT 기반의 스마트홈 플랫폼 '엣지(E-dge)'를 제안한다. 엣지(E-dge)는 아두이노와 ChatGPT API를 활용해 사용자의 환경과 에너지 사용 패턴을 분석하고, 맞춤형 절약 솔루션을 제공하며 원격으로 가전 기기를 제어한다. 더불어 새싹 레벨 시스템으로 사용자의 에너지 절감을 유도한다.
-
본 논문은 IoT 통신의 안전성을 확보하기 위해 IoT 통신 기능의 중추 기능인 MQTT 프로토콜을 중심으로 안정성 체크 시뮬레이션 프로그램을 개발하는 것으로, 고가용성 IoT 네트워크에서 MQTT 핵심 요소를 진단하고 대처하는 프로그램을 적용하여 안전한 운영을 도모하는 것을 목표로 한다. 개발 과정에서 통합 테스트와 기능 검증을 통해 문제점을 보완하고, 이를 통해 IoT 네트워크의 안정성을 시뮬레이션하여 애플리케이션과 서비스를 구축하고자 한다.
-
이 연구는 LLVM IR 을 활용한 보안 취약점 탐지의 새로운 접근 방식을 제시합니다. Juliet Test Suite 의 CWE-121 Stack-based Buffer Overflow 데이터를 사용하여 Word2Vec 으로 코드를 벡터화하고 LSTM 모델로 학습했습니다. 모델 성능은 정확도 90%, 정밀도 87%, 재현율 93%, F1 스코어 90%로 평가되었습니다. 향후 다양한 보안 취약점을 다룰 수 있는 다중 분류 모델로 확장 가능성을 제안합니다.
-
최근 사이버 공격의 급증으로 기존 보안 솔루션의 한계가 드러나고 있다. 본 논문에서는 Suricata, iptables, OSSEC를 통합하여 사이버 공격을 실시간으로 탐지하고 적시에 차단하는 효율적인 보안 솔루션을 제안한다. 또한 Elastic Stack을 활용하여 로그 데이터를 분석 및 시각화하여 보안 상황을 직관적으로 파악하고 신속한 대응을 가능하게 한다. 모의 공격 시나리오를 통해 시스템의 성능을 평가하였으며, 그 결과 본 솔루션이 네트워크와 시스템의 보안을 강화하고 운영 효율성을 향상시킴을 확인하였다.
-
개인정보 보호의 중요성이 증가함에 따라 기업의 개인정보 처리방침을 효과적으로 분석하고 개선하기 위한 방법을 제시하고자 한다. 개인정보 처리방침 평가 관련 데이터를 기반으로 RAG(검색 증강 생성, Retrieval-Augmented Generation) 기술과 LLM을 접목해 개인정보 처리방침 평가를 보조할 수 있는 AI 서비스를 개발한다. 이로서 평가위원들은 반복적인 노동에서 벗어나 전략적인 작업에 집중할 수 있으며, 각 기업은 개인정보 처리방침을 점검할 수 있으므로 전반적인 수준 향상이 기대된다.
-
본 연구는 대학생 러너들을 위한 NFT 기반 러닝 커뮤니티 플랫폼 UniRun의 설계와 구현을 다룬다. 블록체인 기술을 활용하여 사용자가 ERC-20 토큰으로 보상받고, ERC-721 NFT로 대학별 마스코트를 소유할 수 있다. 본 연구는 설문조사와 인터뷰를 통해 사용자 요구사항을 분석하고, 개인 목표 설정, NFT 보상 구조, 대학 간 협업 등 플랫폼의 주요 기능을 제시하여 차별화된 러닝 문화를 검증한다. 또한, 단순한 러닝 기록 플랫폼을 넘어, 대학생들이 소통하고 함께 성장하는 혁신적인 커뮤니티 플랫폼으로서 새로운 모델을 제시한다.
-
위성측위시스템(GNSS, Global Navigation Satellite System)은 지구 궤도 상에 위치한 위성군을 이용하여 전 지구상에서 사용자의 위치를 제공해 주고 있다. 실외 자율주행로봇 또는 자율주행차량의 경우 기존에 알고 있지 않은 환경에서 대상의 절대 위치 확보 시 용이하고 효율적인 주행을 가능하게 하므로, 이러한 영역에서 GNSS의 활용이 많은 도움을 줄 것으로 기대된다. 본 논문에서는 RTK(Real-time Kinematic Positioning) 기술을 이용하여 얻은 보정된 GNSS 위치 정보를 획득하고, 이 정보를 근간으로 자율주행로봇의 경로계획에 사용하는 방법을 제시한다. 그리고 이 방법을 기반으로 제작된 자율주행로봇으로 실시한 실험을 통해 제안한 방법의 적합성을 확인한다.
-
본 연구는 Rocker-Bogie 메커니즘과 PID 제어를 적용한 험지 주행 로봇을 개발하였다. 로봇은 불규칙한 지형에서도 안정적인 주행과 최대 50kg의 물품 운송이 가능하다. 이 기술은 산업 물류와 재난 구조 작업에서 활용될 수 있다.
-
본 논문은 일상생활 속에서 카메라를 통해 사용자의 표정을 분석하여 감정을 인식한다. 분석한 감정을 바탕으로 맞춤형 힐링 콘텐츠를 제공한다. 이 시스템은 인공지능. 딥러닝, H/W, 애플리케이션 등 여러 기술을 활용하여 사용자에게 모바일 앱 형태로 서비스를 제공한다. 바쁘게 돌아가는 현대 사회에서 자신의 감정을 감추고 살아가는 사람들이 많다. 그런 사람들이 자신의 공간에서라도 정확한 감정을 인식하고, 힐링을 받는 것을 목표로 한다.
-
최근 기업 및 기관은 온-프레미스에서 클라우드로 전환이 급증하였다. 이에 따라 기존의 경계보안장비 방식이 아닌 제로 트러스트 시스템 구축이 확대되고 있다. 제로 트러스트 시스템은 MFA 인증을 통해 접근 인증이 된 사용자만 리소스 접근이 가능해져 보안 강화를 더 용이하게 할 수 있다. 각 기업에서 관리자는 대시보드를 통해 실시간으로 시스템을 모니터링 할 수 있으며, 사용자들은 자동화된 시스템을 통해 리소스를 편리하게 사용할 수 있도록 구성했다.
-
가정에서 측정되는 신장은 사용자의 부정확한 자세로 인해 오차가 발생할 가능성이 크며, 이에 따라 정확한 신장 측정이 어렵다. 본 논문에서는 IMU(Inertial Measurement Unit)센서를 활용하여 사용자의 자세를 실시간으로 모니터링하고, 음성 피드백을 제공하여 올바른 자세를 유지하게 함으로써 신장 측정의 오차를 줄였다. 실험 결과, 개발된 기기를 사용한 신장 측정이 기존 측정 방식보다 높은 정확성을 보임을 확인하였다. 이 시스템은 향후 가정 및 의료 환경에서 신장 측정의 신뢰성을 높일 수 있을 것으로 기대된다.
-
본 프로젝트에서는 하나의 모터로 두 개의 너트가 반대 방향으로 움직이는 이중 나사선 구조를 '3D 프린팅'을 이용하여 설계하였다. 또한, 이 과정에서 필라멘트 특성상 너트가 헛도는 문제를 해결하기 위해, 너트에 금속 원기둥을 삽입하였다. 이를 통해 수직으로 고정하는 보강 구조를 추가하여 신뢰성을 크게 향상시킨 제어 메커니즘을 구현하였다.
-
본 논문에서는 포스트 코로나 이후 해외여행 수요의 증가와 함께 여행 앱 사용자의 수요가 늘어난 상황에서, 여행 준비 과정의 복잡성을 해결하기 위한 통합 여행 서비스를 개발하였다. GPT 4o를 이용하여 사용자 맞춤형 여행 계획을 생성해주고, 아마데우스 API를 활용해 실시간 항공권 검색 기능을 제공하며, 여행 중에는 OCR 기술을 활용해 영수증 경비 관리, 여행지의 실시간 날씨와 환율 정보 등을 제공한다. 또한, 여행 후 방문한 장소와 지출 내역을 쉽게 확인할 수 있도록 시각화하였다. 이를 통해 복잡한 여행 준비 과정을 간소화하고, 사용자 맞춤형 여행 계획을 지원하며 여행 전반에 걸쳐 하나의 앱으로 사용할 수 있도록 하는 사용자 편의성을 제공하고자 하였다.
-
본 프로젝트는 효율적인 일정 조을 돕는 AI 봇인 한끝봇을 개발해 사용자의 피로도를 줄이는 것을 목표로 한다. AI 챗봇이 일정 조율을 대신 처리한다. 이를 통해 기존 일정 조율 방식의 단점을 보완하고, 간편하고 스마트한 일정 관리 솔루션을 개발하고자 한다.
-
본 연구는 FPGA 가속기를 활용하여 실시간으로 차선을 검출하고, 이를 유지하는 시스템을 개발한다. 차선 검출에는 Sobel Filter 와 Hough 변환을 이용하며 실시간을 위한 데이터 처리 속도 개선에는 FPGA 의 PL Logic 과 메모리 최적화 기법을 사용한다. 이로써 설치가 용이한 부착형 방식의 LDWS 를 통해 낮은 수준의 자율 주행을 가능케 한다.
-
본 논문에서는 메카넘휠을 활용한 강화학습 기반 자동주차 시스템을 제안한다. Q-learning 알고리즘을 사용하여 다양한 주차 환경에서의 주차 경로를 최적화하였으며, 실시간으로 로봇이 목표 주차 구역까지 정확하게 이동할 수 있도록 설계하였다. 본 연구는 강화학습이 적용된 주차 시스템의 실효성을 보여주며, 향후 실제 환경에서의 적용 가능성을 제시한다.
-
최근 자율주행 기술에 대한 관심과 함께 고가의 하드웨어와 소프트웨어의 복잡성이 자율주행 자동차의 상용화를 가로막고 있다. 이에 본 연구에서는 해당 문제점들을 보완하기 위해 FPGA의 유연성과 고성능이라는 이점으로 자율주행 자동차 시스템을 최적화하였다.
-
응급상황, 도로 정체 시 자동으로 중앙분리대가 이동하는 시스템이다. 현재 가변차로의 차선 시 인성 문제점을 AI 기술과 Jetson TX2 를 활용해 교통량을 분석하고, 모터를 이용해 중앙분리대를 이동시키는 가변차로 시스템으로 해결하고자 한다.
-
유동 인구가 많고 다양한 서비스를 필요로 하는 병원에서는 여러 기능을 통합적으로 수행할 수 있는 토탈 서비스 로봇이 필요하다. 자율주행, 얼굴인식, 음성 처리기술 등을 적용한 AI 자율주행 토탈 서비스 로봇을 도입함으로써 의료진의 업무 부담을 줄이고, 병원의 운영 효율성을 높이며, 전반적인 서비스의 질을 향상할 수 있다.
-
본 연구는 콘텐츠 플랫폼에서 제작자와 소비자 간의 건설적인 소통 촉진을 위해 악플을 순화하여 유의미한 피드백으로 전환하고, 댓글을 카테고리화하여 다양한 의견 교환을 가능하게 한다. 이를 통해 악플로 인한 부정적 영향을 최소화하고, 생산적인 콘텐츠 제작 및 소통 문화를 형성하고자 한다.
-
도로의 노후화로 포트홀 발생 빈도가 늘어나고 그로 인해 발생하는 사고와 피해액 또한 수억 원대에 이르고 있다. 포트홀 문제를 해결하기 위해 AI 기술, 특히 Image Processing을 이용한 기술이 많이 사용되고 있다. 하지만 실시간으로 영상을 촬영하면서 포트홀을 감지하는 방식은 많은 데이터 처리량과 비용 문제로 인해 일반 운전자들이 쉽게 사용할 수 없다. 본 연구에서는 이러한 문제를 해결하기 위해 두 단계로 나누어 포트홀을 감지하는 방법을 제시한다. 첫 번째 단계에서는 도로 주행 시의 3축 기울기 변화량 값을 분석하여 포트홀임을 구분하고 해당 위치의 사진을 GPS 좌표와 함께 촬영 및 저장한다. 두 번째 단계에서는 촬영한 사진으로부터 OpenCV의 Yolov5를 이용하여 딥러닝을 통한 포트홀을 감지한다. 제안한 시스템으로 데이터 처리량을 줄이고 비용을 절감해 많은 운전자들에게 포트홀 안전 시스템을 보급화 할 수 있다.
-
2030년까지 재생 에너지 비율이 30% 이상으로 높아질 것으로 예측되고, 태양광은 그중 주요 에너지원으로 적극 확대되고 있다. 따라서 기존의 고정형 태양광 발전 대신 양축 추적식 태양광 발전기를 통해 에너지 효율을 높이며 기후 변화에 따른 태양광 발전기의 안정성을 위해 다양한 Mode를 구현하고, AI 기술을 접목한 발전량 예측 서비스와 전력거래 시장을 구축한다.
-
언어장애에 있어 구음 운동 촉진은 구강내 혀를 비롯하여 입 주변 근육 등 다양한 운동 요소가 요구된다. 기존의 구음 운동 촉진 기구들은 단순히 입에 넣어 운동하는 것이 국한되어 있다. 본 연구에서는 기존의 촉진 기구들이 가지는 한계를 극복하고 사용자의 자기 주도적인 운동과 훈련의 척도를 실시간으로 피드백 받을 수 있는 기기를 실험에 적용하였다. 특히, 개개인의 구음 운동 가동범위를 지정하기 위하여 simple moving average filter기반의 개인화 calibration 기능을 구현하였다. 4명의 피험자들의 실험결과를 통해, calibration단계에서의 오차율을 최소화할 수 있는 filter window size와 moving point의 parameter를 도출하였다.
-
AI는 콘텐츠 제작에서 유용한 도구지만, 감정적 깊이와 창의성이 미흡하다. 본 논문은 AI 프롬프트튜닝을 활용해 AI와 작가가 협력하는 시나리오 창작 시스템을 개발한다. AI는 시나리오를 생성하고, 반복적 작업과 데이터 분석을 하며 작가는 감정적, 창의적 요소를 융합해 상호작용한다. 이 협력은 콘텐츠의 완성도를 높이고 장기적으로 성공 가능성을 높인다.
-
코로나 펜데믹을 겪으면서 사회적 거리두기와 같은 제약으로 인해 일생상활의 지장이 생기면서 사람들은 가상공간에서의 만남에 대해 주목하기 시작했고, 상담에 대한 수요가 증가하였다. 따라서 기존 대면의 상담 서비스를 대체할 효율적인 기술로 AI 기술기반 아바타 비대면 심리상담 메타버스 플랫폼을 연구하였다.
-
물류 창고 운영에서 효율적인 재고 관리, 공간 관리 및 비용 절감은 주요 과제이다. 본 논문은 위와 같은 기존의 창고 방식의 주요 문제점을 해결하여 물류 창고의 운영 효율성을 향상시킬 수 있는 스택형 격자 물류창고 로봇 시스템을 소개한다. 로봇이 상부 레일을 통해 물류 박스를 이동시키는 방식을 도입하여 기존의 비효율적인 공간 낭비와 인건비 문제를 해결하였으며, 이를 통해 더 효율적인 창고 운영이 가능해진다. 이 시스템을 도입하여 국내 물류 기업들의 경쟁력을 높이는 데 기여할 수 있을 것으로 예상된다.
-
물류 자동화 과정에 핵심기술증 하나인 AMR 자동화 이동로봇을 Tractor-Trailer Type 으로 제작해 기존 물류창고에 있는 다양한 트레일러들을 이동화는 자동화 과정을 개발하였다. Aruco Marker 를 이용한 Trailer 결합과 Tractor-Trailer 의 주행 안정성을 강화하였다.
-
미국 중앙은행 커뮤니케이션은 경제 정책과 시장 기대에 영향을 미치는 중요한 도구이다. 본 연구는 대형 언어 모델(LMM)과 인공지능(AI)을 결합하여 Jerome Powell 연방준비은행 의장의 연설이 이후 미국 금리 및 소비자 행동에 미치는 영향을 분석하는 새로운 접근 방식을 제시하고자 한다. 자연어 처리(NLP) 기술을 적용하고 이를 머신 러닝 모델과 통합함으로써 Powell 의 공개 성명에 따른 시장 반응과 소비자 인플레이션 기대를 예측하고자 한다. 본 연구 결과는 AI 기반 정서 분석이 거시 경제 동향에 대한 귀중한 통찰력을 제공하고 중앙은행 관찰자, 정책 입안자 및 시장 분석가를 위한 강력한 도구 역할을 할 수 있음을 보여주고자 한다.
-
최근 배드민턴 동호인의 증가와 함께 경기 후 셔틀콕 수집 작업의 번거로움이 문제로 제기되고 있다. 본 논문에서는 이러한 문제를 해결하기 위해 AI 기반의 셔틀콕 자동 수집 로봇 시스템을 제안한다. 효과적인 작동을 위해 YOLOv8 모델을 이용해 셔틀콕을 빠르게 인식하고, Turtlebot3 를 활용해 자동으로 셔틀콕을 수집하는 하드웨어 시스템을 구축하였다. 모델 학습에는 1295 장의 데이터를 사용하여 mAP50-95 0.963 수준의 셔틀콕 인식 성능을 달성했으며, 실제 테스트에서 셔틀콕을 정확하게 인식하고 수집하는 결과를 얻었다.
-
본 논문에서는 물류 로봇에 활용할 수 있는 자율 주행 이동 매니퓰레이터 시스템을 개발하였다. 본 로봇 시스템은 자율 주행 이동 로봇 베이스에 로봇 매니퓰레이터를 탑재하여 스테레오 카메라로 객체 인식 및 좌표 추정을 수행하였으며, ROS 기반으로 통합 로봇 시스템을 구축하였다.
-
주차 관리 서비스의 개발은 제한된 주차 자원을 효율적으로 활용하고, 실시간 주차 수요를 파악하며, 사용자에게 편리한 서비스를 제공하는 데 중요한 역할을 한다. 본 논문에서는 AI 기반의 딥러닝 모델과 영상 처리 기술을 결합하여 빌라의 주차 공간을 효율적으로 관리하는 시스템을 제안한다. 이 시스템은 YOLOv8를 활용하여 차량 객체를 실시간으로 감지하고, OpenCV를 사용하여 주차 공간의 빈자리를 인식한다. 또한, 예상 출차 시간을 강화학습 기반의 알고리즘을 이용하여 사용자에게 제공하며, 이를 통해 주차 공간의 효율적 이용을 극대화한다. 서버는 주차장 내 주차 현황과 출차 시간을 실시간으로 갱신하며, 관리자는 웹 플랫폼을 통해 데이터를 모니터링 및 관리하고, 사용자는 웹 또는 모바일 애플리케이션을 통해 주차 공간 조회와 차량 예상 출차 시간을 제공받을 수 있다. 다양한 실험을 통해 제안된 시스템의 성능과 정확성을 확인하였으며, 이를 통해 주차 관리의 자동화와 편리성 향상에 기여할 수 있을 것으로 예상된다.
-
틸트로터형 VTOL 기체의 천이 안정성 확보 방안으로 전후방 틸트 메커니즘과 Flap 시스템을 적용하였다. 경량화를 위해 세미모노코크 구조의 기체 설계와 해석을 진행하였다.
-
본 연구는 시각장애인을 위한 스마트 악보 기기를 개발하여 이들이 음악을 보다 쉽게 접하고 이해할 수 있도록 하는 데 목적을 두고 있다. 해당 프로젝트는 시각장애인들이 악기를 연주할 때 악보를 진동 점자로 실시간 확인할 수 있게 설계되었다. 이를 위해 Music XML 파일 및 PDF 파일을 인식하여 계이름과 악상 기호를 텍스트로 추출한 후, 이를 진동 신호로 변환하여 출력하도록 하였다. 또한 웨어러블 형태의 조끼에 여섯 개의 진동 모듈을 장착하여 다양한 악보 정보를 효과적으로 전달할 수 있도록 하였다. 그 결과, 진동 점자를 활용한 스마트 악보 기기를 성공적으로 개발하였다. 이 기기는 시각장애인들이 음악을 보다 직관적으로 배우고 연주할 수 있는 환경을 제공하며, 연주 중 다양한 음악적 표현을 지원함으로써 예술적 잠재력을 극대화하는 데에 기여할 것으로 기대된다.
-
비대면 진료 서비스의 필요성은 금년도 의사 파업과 코로나19 재확산으로 인해 더욱 부각되었다. 본 논문에서는 열화상 카메라로 수집한 데이터를 AI 기반 알고리즘으로 보정하였으며, P2P 통신 프로토콜인 WebRTC 기술을 적용하여 환자와 의료진 간 원활한 소통을 지원하였다. 아울러, 다양한 환경에서 안정적으로 활용 가능한 클라우드 기반 시스템을 구현함으로써 비대면 진료의 효율성을 극대화하였다.
-
고층 건물의 화재는 많은 위험 상황을 야기하는 재난이다. 이런 화재의 경우 고가사다리 차량을 이용한 화재 진압 시스템이 사용된다. 하지만, 고가 사다리 차량은 크기가 매우 커 진입 가능한 장소가 한정되며, 우리나라와 같이 높은 건물이 집약된 곳에서는 이런 사다리 차량을 활용하는 것이 어려운 실정이다. 이런 문제점을 해결하기 위하여 소화탄 발사 드론을 제안하였으며, 본 논문에서는 소화탄 드론의 효율적인 운용을 위한 유리 감지 기법을 실험하였다.
-
본 시스템은 객체인식용 인공지능을 사용하여 건설현장의 현장 안전 관리자의 업무를 지원하는 목적으로 연구되었다. CCTV 를 통해 제공된 화면으로 노동자의 안전 장비 및 건설 기기에 대한 객체 인식을 행하는 AI 와 안전이 확보되지 않은 구역의 출입을 제한하는 센서로 구성된다. 그 결과, 안전 장비 착용 미흡, 건설 기기 출입을 파악하여 그에 따른 조치를 통해 사고 예방을 지원한다.
-
본 연구는 CCTV, 가로등과 같은 안전 인프라를 전이 학습된 객체 인식 모델로 식별하고, 이를 자치구별 범죄 발생 건 수와 비교하여 상관관계를 분석한다. 이를 통해 안전 인프라 배치가 범죄 예방에 중요한 역할을 한다는 점을 입증하는 것이 목표이며, 인구 수 대비 CCTV 설치 수가 많을수록 범죄 발생률이 낮다는 결과가 도출되었다.
-
본 연구는 보행자의 안전을 강화하기 위해 차량과 사람, 장애물 등의 식별을 목적으로 카메라로 획득한 2차원 영상 데이터에서 객체 간 거리 정보를 추정하기 위해 레이저 센서를 활용하여 단일 객체에 대한 실제 거리를 측정하고 측정된 단일 객체에 대한 기준 픽셀값과 거리 정보를 이용하여 주변 객체에 대한 픽셀 비율을 연산하여 상대 거리를 효율적으로 추정하는 기법을 제안한다.
-
-
본 연구는 전력 계통의 불안정성을 해결하기 위한 저비용 PMU의 설계 및 구현에 관한 것이다. 본 논문에서는 단상 전압을 하드웨어적으로 변환하여 Stm32 보드에서 처리한 후, DFT 및 THD 분석을 수행하고, 이를 실시간으로 PDC에 전송하는 시스템을 제안한다. 이 연구의 주요 목표는 기존의 고비용 PMU가 지닌 경제적 한계를 극복하고, 저비용 솔루션을 통해 높은 샘플링 주파수와 정확한 실시간 전압 데이터를 제공하는 것이다.
-
한국의 주요 농산물인 양파 도매가격을 예측하기 위해 12가지 모델(SARIMA, ARIMA, Lasso Regression, Linear Regression, Ridge Regression, ElasticNet, LSTM, LightGBM, XGBoost, Random Forest, Gradient Boosting, Prophet)의 예측 성능을 비교 분석하며, 다섯 개 지역(광주, 대구, 대전, 부산, 서울)에서 모델의 성능을 평가한다. ARIMA와 SARIMA는 특히 대구와 부산에서 우수한 성과를 보였으며, Prophet과 LightGBM 모델은 상대적으로 낮은 정확도를 나타냄을 발견하였다. 다양한 모델의 성능 차이를 분석하고, 지역별 데이터 특성에 따른 맞춤형 예측 접근의 필요성을 강조한다.
-
에듀테크는 4 차 산업혁명 시대에 교육과 기술의 결합을 통해 새로운 학습 환경을 제시하고 있다. 다양한 디지털 기술을 학습 도구로 활용함으로써 새로운 교육 환경을 제공한다. 그러나 현재의 에듀테크 플랫폼은 아동 발달 데이터를 충분히 반영하지 못해 학부모가 자녀의 발달 상황을 효과적으로 파악하기 어려운 점이 있다. 제안하는 플랫폼은 6 세 이하 아동을 대상으로 음성 인식, 모션 캡처, 행동 인식 기술을 이용한 퀴즈를 제공하며, 보호자는 이를 통해 아동의 발달 상태를 평가할 수 있다. 이 플랫폼은 학부모의 부담을 줄이고 아동의 발달 상태를 파악하는 도구를 제공하며, 교육의 질을 향상시키는 데 기여할 것이다.
-
본 논문은 'AI 튜터와 함께하는 매칭 플랫폼' 개발 과정에서의 데이터 수집 및 정제에 대해 다룬다. 이 플랫폼은 사용자에게 개인화된 멘토 매칭 및 강의 추천 서비스를 제공하며, 이를 위해 웹크롤링을 통해 데이터를 수집하고, 그 데이터를 정제하는 과정을 거쳤다. 특히, 요리 레시피 데이터를 기반으로 한 취미 레벨 테스트 기능이 포함되어 있으며, 정제된 데이터를 통해 딥러닝 기반의 추천 알고리즘과 AI 튜터링 시스템을 구축했다. 본 연구는 이러한 시스템이 사용자 맞춤형 학습 경험을 제공하는 데 어떻게 기여하는지 논의한다.
-
이 연구는 딥러닝을 활용하여 반려동물 얼굴을 인식하는 알고리즘을 개발하고, MobileNet, ResNet, DenseNet 등의 딥러닝 모델을 사용해 그 성능을 평가한다. 다양한 반려동물 이미지를 통해 각 모델의 학습 성능을 분석하고, 실종 반려동물 찾기 시스템에서 활용할 수 있는 최적의 모델을 제안하는 데 중점을 둔다. 연구 결과, MobileNet이 높은 정확도와 실시간 성능을 보여 반려동물 얼굴 인식 시스템에 적합한 모델로 평가되었다.
-
전자 상거래의 확산에 따라서 물류 산업의 발전도 함께 이루어지고 있다. 물류창고는 물류 산업의 주요 요소로, 전통적인 물품 보관이나 반출과 관련된 재고관리 이외에도 빠른 배송과 주문처리, 물류네트워크 등 다양한 기능이 요구되고 있다. 이러한 요구를 만족하기 위하여, 인공지능 기반의 기술을 이용한 물류창고 운영 자동화 시스템의 도입이 증가하고 있으며, 대표적으로 무인 창고 시스템이 있다. 객체 검지는 모니터링, 안전, 보안 등 다양한 기능을 제공할 수 있는 기반 기술이며, 무인 창고 시스템을 위해 필수적이다. 본 논문에서는 객체 검지를 활용한 물류창고 운영 자동화에 적용할 수 있는 스마트 물류창고 시스템을 제안하고, 이를 구현한 결과에 대해 분석한다.
-
현재 환경 문제는 인류의 생존을 위협할 정도로 매우 심각하다. 올바른 분리수거는 매립 및 소각하는 폐기물 양을 줄이고 자원을 재활용하여 자원 절약에 기여할 수 있다. 그러나 생활 폐기물의 올바른 분리수거가 이루어지고 있다고 보기 어렵다. 이러한 문제를 해결하기 위해, 폐기물의 이미지를 통해 분리수거 방법을 안내하는 AI 기반 시스템을 개발했다. 본 연구에서는 폐기물 객체를 정확하게 탐지하기 위해 YOLO 기반의 객체 탐지 알고리즘을 사용하였으며, 이미지 인식의 정확도를 높이기 위해 학습 데이터셋으로 직접 라벨링한 커스텀 데이터셋을 활용하였다. 본 연구를 통해 올바른 분리수거 실천률을 향상시키고, 환경 보호와 지속 가능한 사회를 만드는 데 기여할 수 있다.
-
본 논문은 스마트 리테일 환경에서 객체 검지 기술의 적용에 관한 방법을 제안한다. 스마트 리테일은 자영업자나 소상공인 사업장의 전반적인 운영과 고객의 요구를 충족하기 위하여 첨단 기술을 활용하는 분야이다. 객체 검지 기술은 영상에서 사람, 물체 등 다양한 객체를 실시간으로 검지하여 객체 종류, 위치와 크기 정보 등을 제공하며, 이러한 정보는 재고관리, 고객 행동 분석, 무인 결제 시스템 등에서 유용하게 활용될 수 있다. 최근에는 딥러닝 기반의 객체 검지 기술이 우수한 성능을 보이고 다양한 분야에서 활용되고 있지만, 고성능의 객체 검지 기술을 운용하기 위해 고가의 하드웨어가 필요하다는 문제가 존재한다. 본 논문에서는 웹기반의 스마트 리테일 서비스 모델과 소규모사업장환경의 저가 하드웨어에서 객체 검지 기술을 적용하는 방법을 제안하고, 스마트 리테일에서 가장 중요한 객체인 사람 검지에 관한 성능을 분석한다.
-
반려견의 비만도는 건강에 중대한 영향을 미치지만, 기존의 비만도 평가 방식은 전문가의 평가나 자가검진에 의존하여 접근성이 떨어지거나 정확도가 떨어지는 한계가 있었다. 본 연구는 AI 기반의 딥러닝 모델을 통해 강아지의 비만도를 보다 쉽게 평가할 수 있는 방법을 제안한다. 특히, 클래스 불균형 문제를 데이터 증강 기법으로 해결하여 모델의 성능을 향상시키고, 실시간으로 결과를 제공하는 앱 기반 솔루션을 구현하였다. 이 연구는 기존 모델과 달리 사용자가 촬영한 한 장의 이미지로 비만도를 예측하며, 사용자 친화적인 접근성을 강조한다.
-
본 논문는 통합 데이터 분석 플랫폼인 Microsoft Fabric을 통해 기상청 데이터를 활용하여 한국의 지역별 기후 요소인 강수량, 기온을 예측하고자 한다. 앙상블 모델과 시계열 모델을 적용해 평균 제곱오차(MSE)를 기준으로 최적의 모델을 선정하였으며, 2024년부터 5년간의 기후 변화를 예측하였다. 연구 결과, 한국의 시간당 평균 최대 강수량과 평균 최고 기온이 지속적으로 상승함을 확인했다. 이는 기후 변화에 대응하기 위한 정책과 대비책 마련이 필요함을 시사한다.
-
최근 개인형 이동장치(PM, Personal Mobility) 사용 증가에 따라 전동 킥보드 사고 발생 빈도가 높아지면서, 전동 킥보드 사용자의 인식과 안전성 확보가 대두되었다. 본 시스템은 해당 문제를 해결책으로 CNN(Convolutional Neural Network)과 CNN-LSTM(Long Short Term Memory) 기반의 인공 지능 모델로 다인승 탑승, 인도 및 차도 주행, 헬멧 착용 여부를 실시간으로 감지, 안전 기준을 충족하지 않는 경우 자동으로 출력 제한을 적용함으로써 사용자에게는 안전 인식을 각인시키며 큰 사고의 발생 위험을 줄이는 데 기여할 수 있다. 즉, 전동 킥보드의 안전성을 높이고, 인명 사고를 예방하는 데 기여할 것으로 기대된다.
-
데이터의 규모가 방대해지고 AI 모델의 구조적 복잡성이 증가함에 따라 AI 하드웨어 가속기의 성능이 더욱 중요해졌다. 특히 LLM 의 핵심을 이루는 Transformer 모델이 주목받고 있으나, Transformer 의 하드웨어 가속기 연구는 타 모델에 비해 상대적으로 늦게 진행되었다. 그 이유에는 최적화가 어려운 복잡한 연산과 메모리 접근패턴이 있다. Transformer 는 Self-Attention 메커니즘을 사용해 입력 시퀀스 내 모든 요소 간의 관계를 계산하는 구조로[1], 매우 많은 양의 연산과 메모리 사용을 요구한다. NLP 기술이 생활 곳곳에서 대체될 수 없는 도구로 자리 잡은 만큼 Transformer Accelerator 가 더 많이 연구, 개발될 필요가 있다.[2] 본 연구는 Verilog HDL 로 하드웨어에 최적화된 Transformer Encoder 를 구현한 후 합성/실행하여 FPGA 칩에 업로드한다. transformer 의 encoder 에 알맞은 accelerator 를 제작하여 다양한 NLP 모델의 등장과 개발을 촉진하고자 한다. 또 각 모델에 따라 특화 연산기를 제작하는 연구 파이프라인을 구축한다.
-
인건비 상승과 비대면 서비스 수요 증가로 인해 소매업계에서 무인 판매 시스템의 도입 필요성이 커지고 있다. 이를 해결하고자 본 프로젝트에서는 인공지능 객체 인식 기술을 활용한 도넛 분류 및 무인 판매 시스템 "InoDonut"을 개발하였다. NVIDIA Jetson Nano를 기반으로 도넛을 실시간으로 인식하고 자동으로 결제하며, LLM API를 활용한 추천 시스템을 통해 고객 맞춤형 도넛 추천 서비스를 제공한다. 또한, 판매대는 AWS 서버와 연동되어 매장의 운영을 효율적으로 관리할 수 있다.
-
AI 로보어드바이저를 활용한 금융 추천 서비스 'PURE'는 사용자의 투자 성향과 관심 분야를 분석하여 맞춤형 종목을 추천하고, ChatGPT API로 트렌드 및 감성 분석을 통해 기사 요약 기능을 제공한다. 최신 AI 기술과 빅데이터를 활용해 개인화된 투자 조언과 리스크 관리를 지원하며, 실시간 데이터 분석을 통해 투자 전략을 강화하고 비용 절감 및 시장 변화에 유연하게 대응한다.
-
적대적 공격은 영상에 사람의 육안으로는 구분할 수 없는 섭동을 넣어 딥러닝 모델의 오판을 유도한다. 이러한 기술은 의료 분야에서 보험사기 등으로 악용될 수 있고, 이를 해결하기 위해서는 적대적 공격의 원리와 방어기법을 상시 연구하는 노력이 필요하다. 본 논문에서는 다양한 적대적 공격을 코드로 구현하고, 이를 활용하여 의료 CT 영상에 공격을 가하는 실험을 수행하였으며, 그 결과 공격유형 별 원리와 특장점 및 성능 등을 종합적으로 평가하여 방어연구를 촉진하였다.
-
본 논문은 FPGA 기반의 Petalinux SDK와 PYNQ 프레임워크의 이미지 처리 속도를 비교한다. 연구에서는 YOLO v3 Tiny와 Darknet-19 알고리즘을 사용하여 FPGA에서 자체 제작한 CNN 가속기로 실험을 진행하였다. Petalinux SDK는 이미지 처리에 약 233.13ms가 소요된 반면, PYNQ 프레임워크는 약 2.55ms가 소요되어 더 빠른 속도를 보였다. 이를 통해 PYNQ의 잠재력과 활용 가능성을 강조하며, 추가 연구의 필요성을 제기한다.
-
항공 여행객 수의 증가로 인해 공항 보안 검색대에서의 처리 시간이 길어지고 있으며, 반입 금지 물품에 대한 인식 부족이 시간 지연을 초래하고 있다. 본 논문은 YOLOv5 객체 탐지 모델을 활용해 항공기 반입 금지 물품을 자동 식별하는 AI 시스템을 제안하며, 사용자가 사전에 기내 반입 물품을 확인함으로써 보안 검색 과정에서의 시간 지연을 최소화하고, 처리 속도를 개선할 수 있음을 목표로 한다.
-
4족 보행 동물 중 말(馬)은 다리 관절 부위에 부상과 질병이 잦은 편이나, 적시에 질병을 발견하지 못해 질병의 악화로 발생하는 문제점이 있다. 본 논문은 이를 극복하기 위한 기술 개발에 필요한 동물의 보행 이상 상태 진단을 위한 AI 학습용 데이터 구축하는 구체적인 방법론을 제안한다.
-
언어 장애는 여러 장애인에게 흔히 동반되는 문제로, 이로 인해 의사소통에 어려움을 겪는다. 본 연구에서는 이러한 문제를 해결하기 위해 언어 장애인의 음성 데이터를 기반으로 한 음성 번역 모델을 구현하였다. 이 모델은 부정확한 음성을 정확한 텍스트와 음성으로 변환하여, 보다 원활한 의사소통을 가능하게 한다. 이를 통해 언어 장애를 가진 장애인들이 현대 사회에서 보다 독립적이고 효과적으로 소통할 수 있을 것으로 기대된다.
-
본 연구는 라즈베리파이4와 같은 저전력, 저비용 임베디드 시스템에서 효과적으로 작동할 수 있는 실시간 객체 탐지 모델을 제안한다. 우리는 대중적으로 유명한 YOLO를 사용하지 않고 MobileNetV1-SSDLite를 기반으로 한 경량화된 모델을 설계하고, 이를 라즈베리파이4에 최적화하여 구현하였다. 실험 결과, 제안된 모델은 평균 5 FPS의 처리 속도로 mAP 0.68을 달성하여, 기존의 모델들과 비교했을 때 라즈베리파이4에서 더 효율적인 성능을 보여주었다. 또한, Jetson Nano와의 비교를 통해 각 플랫폼의 특성을 분석하여 라즈베리파이4에 경량화된 모델이 충분하다라는 것을 소개한다.
-
어두운 밤이나 비가 올 때 포트홀 인식률이 저하되는 문제점을 보완하여 기존 카메라를 이용하여 포트홀을 인식하는 시스템에서 라이더를 추가해 포트홀 인식률을 높였다. 또한 사용자에게 실시간으로 업데이트된 포트홀 정보를 보여준다. 추가적으로 모든 정보는 DB에 저장되기에 추후 언제든 관공서에게 제공가능하다.
-
바지 구매에 있어 소비자들의 불편함을 해소하기 위해 직접 매장에서 피팅을 해 보지 않고도 본인 체형에 맞는 맞춤형 핏을 제공하는 서비스를 개발하였다. 'MyFit'은 인공지능으로 생성된 아바타를 기반으로 사용자의 신체 치수에 맞춰 바지 핏을 시각화하는 시스템이다. 특히 바지의 핏에 중점을 두어 소비자들이 온라인 쇼핑에서 겪는 사이즈 문제를 해결하고자 하였다. 본 논문에서는 MyFit의 기술적 구성과 기존의 가상피팅 서비스 사용자 설문조사 결과를 바탕으로 웹에서 쉽게 접할 수 있는 맞춤형 가상피팅이 되도록 하는 서비스의 차별성을 가지고 구현하였다. 해당 서비스를 통해 소비자들의 편리하고 현명한 소비를 도울 수 있을 것으로 기대한다.
-
최근 금융업에서는 기계학습의 활용범위가 빠르게 확대되고 있다. 본 논문에서는 심층강화학습(DRL)을 활용한 A3C 알고리즘 기반 자동 주식거래시스템을 구현하고, 이를 적용한 결과 저점과 고점에서 우수한 의사결정 판단을 수행하여 높은 수익을 달성하는 것을 실험을 통해 입증하였다.
-
본 연구는 구직자의 정보 부족 문제를 해결하기 위해 검색 증강 생성(RAG) 기술을 활용한 대화형 채용공고 추천 시스템을 제안한다. 이 시스템은 웹 크롤링, multi-modal 데이터 처리, ETL 과정을 통해 최신 채용 정보를 수집 및 정제하고, 사용자 의도를 정확히 파악하기 위해 경량화된 LLM(Large Language Model)과 GPT-4 를 결합한 다단계 접근 방식을 채택한다. RAG(Retrieval Augmented Generation)를 통해 개인화된 채용 정보를 추천하며, Next.js, Spring, FastAPI 를 활용한 통합 아키텍처로 구현되어 사용자에게 실시간으로 맞춤형 취업 정보를 제공한다.
-
최근, 해외뿐만 아니라 국내에서도 딥페이크 기술을 악용한 피해 사례는 가파르게 증가하는 추세를 보이고 있다. 딥페이크 기술은 엔터테인먼트, 예술, 교육 등에서 창의적 사용이 가능하지만, 동시에 법적, 사회적, 윤리적으로 큰 우려를 일으키고 있다. 본 논문에서 제안하는 딥페이크 이미지 판별 웹 서비스는 딥페이크 기술을 이용한 위조 이미지를 탐지할 수 있어, 사전적 예방 효과를 기대할 수 있다. Xception 모델을 기반으로 한국인 KoDF 데이터 셋을 학습시켜 다양한 위조 이미지 감지 성능을 평가하였으며, 이를 웹 애플리케이션 형태로 구현하여 사용성 높은 서비스를 제공할 수 있다.
-
기존 ADAS 연구는 고속도로나 단순한 도로 환경에 최적화되어 있어 복잡한 교차로 상황에서 적용하기에는 한계가 존재한다. 특히나, 최근 국내의 우회전 법 개정으로 인해 보행자 감지의 중요성이 증가함에 따라 개선된 ADAS 기능이 요구된다. 본 논문에서는 비전 기술 기반의 ADAS 알고리즘을 개발하여 교차로 사고를 예방하고 운전자의 안전과 편의를 향상시키고자 한다.
-
본 연구의 목적은 Oriented Bounding Box(OBB)를 활용하여 위성 영상에서의 소형 객체 탐지 및 추적 성능을 향상시키고자 한다. 기존 연구에서는 Horizontal Bounding Box(HBB)를 주로 사용하였으며 이는 객체에 대해 부정확한 마진을 많이 남기는 한계가 있었다. 이러한 방식은 객체 탐지에서 낮은 정확도 결과로 이어진다. 본 연구는 SAT-MTB dataset의 Oriented Bounding Box(OBB)를 활용하여 객체의 회전 및 기울기를 정확하게 반영하였다. 본 연구에서 OBB를 반영한 YOLOv8, YOLOv10, LSKNet을 비교한 결과 가장 좋은 성능을 보인 모델은 YOLOv10이었고, Airplane class에서 좋은 성능을 보였다. 이처럼 각 모델의 탐지 정확도를 분석함으로써, 소형 객체 탐지 및 추적 성능 향상에 기여하고자 한다.
-
금융 데이터의 민감성으로 인해 합성 데이터가 주목받고 있으며, 본 연구는 유사성이 낮은 열에서0 근처 값을 0으로 치환하는 SVS(Single-Value Substitution) 후처리 기법을 제안한다. 기존 방식과 비교해 SVS와 DSF(Dynamic Sample Filtering)를 결합하여 합성 데이터의 품질을 크게 향상시켰다. 특히, DSF와 SVS를 함께 적용했을 때 Column Shapes와 Overall 성능에서 가장 높은 결과를 얻었다. 이 연구는 후처리 기법의 결합이 합성 데이터의 신뢰성과 성능을 극대화하는 데 효과적임을 보여준다.
-
본 연구에서는 아파트, 농작물에 발생하는 유해조류로 인한 피해를 효과적으로 해결하기 위해 그 방안을 제시하고자 한다. 이를 위해 인공지능 기반의 YOLOv10 모델을 활용하여 유해조류(참새, 비둘기, 까마귀, 까치)를 실시간으로 탐지하고, 발견 시 천적의 울음소리와 레이저를 이용하여 유해조류를 퇴치하는 시스템을 개발하였다.
-
본 연구는 전력 공급이 어려운 지역에서 사용하기 위한 저전력 AI 객체 인식 감시 시스템 A.RM.I 를 개발하여 군사 경계 시스템의 효율성을 높이고자 하였다. 태양광 패널을 통한 에너지 하베스팅, ARM 의 Standby 모드, 저전력 설계를 통해 전력 소모를 최소화하였다. 기존 장비 대비 디바이스당 연간 전력 소비량을 약 8.43Wh 로 크게 줄였다. STM32 에는 온디바이스로 저용량, 고감도 CNN 기반 객체 인식 모델을 탑재하여 사람을 감지한다. 엣지 디바이스의 한계를 보완하기 위해 서버 PC 와 RF 통신을 활용한 분산형 AI 시스템을 도입하여 정확도를 향상시켰다. 또한, 유지보수 비용이 저렴하고 휴대성이 뛰어나 군사 및 상업 보안 시스템 등 다양한 분야에 활용할 수 있다. 본 시스템은 군사 인력 부족 문제를 해결하고 경계 근무의 효율성을 극대화할 것으로 기대된다.
-
개인의 건강 관리와 맞춤형 식단 제공의 중요성이 강조되며, 특히 1인 가구와 초개인화 소비 성향에 따른 맞춤형 식단 수요가 급증하고 있다. 본 논문에서는 이러한 요구를 충족시키기 위해, 인공지능과 증강 현실 기술을 결합하여 사용자 데이터를 기반으로 맞춤형 음식 추천을 제공하는 서비스를 제안한다.
-
증강현실(AR)은 다양한 산업에서 영향력을 확대하고 있지만, 실생활에서의 활용은 아직 미흡하다. 본 논문에서는 위치기반 서비스와 AR 기술을 결합한 디지털 타임캡슐 애플리케이션 'ARchive'를 제안한다. ARchive는 FusedLocationProviderClient를 이용해 정확한 위치 정보를 기반으로 디지털 캡슐을 생성하고, Animated Drawing 기술을 적용해 모션 효과를 추가할 수 있도록 설계되었다. 이를 통해 AR 기술의 실생활 적용 가능성을 확대하고, 사용자 경험을 혁신하는 플랫폼을 제시한다.
-
본 논문은 해충을 직접 대면하지 않고 시각적인 두려움 해소와 해충 처리 편의성 개선을 위해 피스톤 형태로 된 판을 이용하는 방법을 제안한다. 본 논문의 보행 해충 제거 및 처리 기기 시스템은 개발 과정에서 필요한 가상 시뮬레이션, 트랩 설계 및 동작, 적외선 센서를 이용한 해충 인식 결과를 사용자의 어플리케이션을 통하여 실시간 확인 기능을 구현하였다.
-
본 논문에서는 단차 극복, 주행 자세 변경, 몸체 평형 유지가 동시에 가능한 편심 메커니즘을 제안하였으며, 이 메커니즘을 채용한 로봇의 평형 제어 방식을 개선하고 관련 성능을 평가하였다. 제안한 방식을 기존의 방식과 비교 실험하여 처리 시간, 메모리 사용량 등 주요 성능에 있어서의 변화와 효율성을 검토하였다. 이를 통해 로봇이 채용한 제한된 임베디드 S/W 환경에서도 실시간으로 몸체의 기울기 보정이 효율적으로 이루어짐을 확인하였으며, 편심 메커니즘을 채용한 로봇에 적합한 알고리즘임을 보여주었다
-
현재까지 개발되어온 가정용 로봇은 사용자와의 상호작용과 시각 정보 전달의 한계가 존재한다. 따라서 기존 가정용 로봇에 빔 프로젝터를 탑재하고, AI 자율주행 및 챗봇 기능을 추가하여 가정에서 편리함을 더욱 제공하고자 하였다. 사용자는 어플리케이션 및 음성 명령으로 로봇의 이동과 빔 프로젝터 등 장치를 제어할 수 있으며 모드를 선택하여 원하는 기능을 제공받을 수 있다.
-
최근 항만 작업의 자동화와 물류 시스템 최적화를 목표로 스마트항만이 발전하고 있다. 그러나 크레인 조작 교육을 위한 훈련에는 여러 가지 제약이 따르기 때문에 현실을 최대한 반영한 가상 크레인 조종 훈련 프로그램을 개발하였다. 본 논문은 가상훈련 환경을 구현함에 있어 현실성을 높이기 위해 적용한 주요 개발 요소와 방법론을 설명한다.
-
드론에 장착된 다양한 Sensor 및 무선통신 (카메라, Smoke Detector 등)의 데이터를 융합하여 대기 환경의 유해유해 가스 (NOx, SOx 등)의 정보를 실시간으로 수집하여 정확하게 분석하고 모니터링할 수 있다. 해당 센서 및 무선통신 시스템들로 수집한 데이터를 Arduino를 활용하여 구축한 Web Server 의 Database 에 실시간으로 수집 및 기록하여 선박 이용자 등들이 쉽게 대기 환경을 확인할 수 있는 시스템을 개발했다.
-
본 논문은 테트라포드의 침입자 확인 및 신고, 추락/사망사고 예방과 작업구역에서 일어나는 화재/가스누출사고를 감지하고 기상특보를 빠르게 전파하여 신속한 대응을 목표로 "항만구역 안전사고 방지 위한 순찰 로봇"을 제안한다. 주요 특징은 다음과 같다. 첫째, 앱 및 웹을 통해 순찰 구역·경로와 시간을 지정할 수 있다. 또한, 이상 상황 발생 시 로봇에서 앱 및 웹을 통해 관리자에게 정보를 전달한다. 둘째, Mmwave센서와카메라를 통해 침입자를 감지하고, 열감지 센서와 가스감지 센서를 통해 화재와 가스누출 상황에 대해 초동조치를 취할 수 있다. 셋째, 기상청 API를 이용해 기상 특보에 대한 알림을 발생해 대피할 수 있도록 한다.
-
본 논문은 항만 작업자와 같이 전문적인 의료 지식이 없는 일반인도 심정지와 같은 응급상황 발생 시 효과적으로 사용할 수 있는 자동화된 심폐소생술 시스템인 Smart CPR Machine을 제안한다. 이 시스템의 주요 특징은 다음과 같다. 첫째, 리니어 레일과 리니어 액추에이터를 이용해 자동으로 정확한 흉부 압박 위치로 이동하며, 색상 인식 카메라와 압박 센서를 통해 정확한 압박 지점을 식별할 수 있다. 둘째, 심박수 센서와 연동하여, 사람의 개입 없이도 심박수에 맞춰 자동으로 심폐소생술을 수행한다. 셋째, 애플리케이션을 통해 실시간으로 심박수를 모니터링하며, 위급 상황 시 119 신고 및 위치 추적 기능을 제공하여 신속한 대응이 가능하다.
-
자율운항 선박에 대한 기술 연구가 많은 관심을 받고 있지만, 그 근간을 이루는 인공지능 기술은 보안공격에 매우 취약하다. 본 논문에서는 선박이미지를 학습한 CNN AI 모델에 FGSM 및 BIM 공격을 가한 후 그 영향도를 비교하여 분석하였다. 그 결과 Adversarial Training 방어기법이 적대적 AI 공격을 효율적으로 차단할 수 있음을 실험을 통해 입증하였다.
-
본 연구는 해양·선박 산업의 디지털화에 따른 사이버 보안 위협, 특히 VSAT 및 위성 통신 시스템의 취약점을 분석한다. STRIDE 위협 모델링, 공격 트리 분석, 그리고 실제 위협 인텔리전스 데이터를 활용하여 체계적으로 위험 평가를 수행하였다. 분석 결과, 1,627개의 VSAT 관련 장치가 사이버 위협에 노출되어 있음을 확인하였으며, 주요 취약점으로 CVE-2022-22707, CVE-2019-11072, CVE-2018-19052 등이 발견되었다. STRIDE 및 DREAD 분석을 바탕으로 10개 항목의 강화된 보안 체크리스트를 개발하였으며, 각 항목의 중요도를 정량적으로 평가하였다. 본 연구는 선박 운영자들에게 실효성 있는 사이버 보안 가이드라인을 제공하며, 향후 글로벌 해운산업의 사이버 보안 향상에 기여할 것으로 기대된다.
-
스마트 해운 항만에서 탄소 배출량과 전력 소비량 계산 시스템을 React와 Spring Boot로 개발하며, 디지털 트윈 설계, 화면 정의서 및 피그마 디자인을 통해 자율운항선박, 기중기 등의 운송 과정을 모델링하고, 탄소 배출량 및 전력 소비량 알고리즘을 구현하는 프로젝트
-
이 시스템은 UWB(Ultra Wide-Band) 기술을 활용한 실시간 컨테이너 추적 시스템을 제안한다. 본 시스템은 컨테이너의 위치를 실내 환경에서 정밀하게 모니터링하며, 온도와 습도와 같은 환경 데이터를 수집하고, 설정된 범위를 벗어나는 경우 즉시 알림을 제공한다. 이는 기존 GPS 기반 시스템의 실내 정확도 문제와 환경 요인 관리의 한계를 극복하기 위해 설계되었으며, 물류 프로세스의 효율성을 향상시키고 화물의 품질을 유지하는 데 중점을 둔다. 모든 데이터는 Firebase에 저장되어 모바일 애플리케이션을 통해 실시간 모니터링이 가능하다.
-
항만은 넓은 범위와 복잡한 구조로 인해 효율적인 관리와 안전사고 대응이 어려운 장소이다. 이를 보완하기 위해 CCTV 가 존재하지만 기존에 항만 내에 설치된 CCTV 는 고정된 시스템으로 인한 이동성의 부족, 낮은 화질 등의 문제점이 존재하여 광범위한 항만을 실시간으로 관리하기에는 대응 능력이 제한적이다. 이처럼 사고가 발생해도 현장을 제대로 발견하기 어려운 상황 속에서 종사자들의 안전 보호구 미착용과 같은 부주의는 더 큰 화를 불러 일으킨다. 이러한 한계와 문제를 극복하고자 원격 조종으로 어디든 이동하며 캠을 통해 실시간으로 위험 상황을 모니터링하여 관리 및 대응하고, 객체 인식을 이용하여 규율 상의 안전 복장이 미흡한 종사자에 대해 인식하고 경고 시스템을 작동시킴으로써 사고를 미연에 방지하는 로봇을 개발하였다. 이를 통해 항만 종사자의 안전을 강화하고 항만 운영의 효율성을 향상시키고자 한다.
-
본 논문은 항만·선박 내 중장비 작업 시 사고로 인한 인명 피해 방지를 위해서 UWB 통신 통해 실내외 작업자의 실시간 위치 측위와 웹·앱 기반 정보 및 경보를 제공하는 'UWB 기반 스마트 안전시스템'을 제안한다. 본 논문이 제안하는 특징은 다음과 같다. 첫째, UWB 통신을 이용해 작업자들의 위치를 실시간으로 정밀하게 측정한다. 둘째, 웹을 통해 관리자는 작업자의 상태와 상황을 신속하게 파악하고 관리한다. 셋째, 디스플레이 앱을 통해 중장비 사용자에게 작업자 위치와 경고 서비스를 제공한다. 이를 통해 항만·선박 내 인명 피해를 최소화하고 관리자의 작업 관리 편의성 증대를 목표로 한다.
-
기존 자율운항선박 연구에는 전통적인 AI 기술들이 사용되어 왔다. 그러나 이러한 기술들은 특정 조건에 맞춘 규칙과 추론 방식으로 작동하기 때문에, 다양한 변수가 있는 환경에서 최적의 성능을 발휘하기는 어렵다. 이에 본 연구는 자율운항선박에서 가장 중요한 경로최적화와 충돌회피 과제 해결에 강화학습이 효과적인 실험을 통해 입증하고 최적의 강화학습 알고리즘을 제시한다.
-
본 연구는 라즈베리파이와 ROS2를 기반으로 SLAM 알고리즘을 통해 자율 주행을 구현하고, Yolov8 모델을 사용해 실시간으로 쓰레기를 인식하고 분류한다. 또한, 로봇이 수집한 데이터를MQTT 프로토콜로 클라우드에 저장하고, AWS 기반 웹 서비스를 통해 원격 모니터링과 데이터 분석을 지원한다. 이를 통해 해변 청소 및 통합 관리와 쓰레기 발생 패턴 분석이 가능하며, 해양 생태계 보호와 상업적 활용 가능성을 제시한다.
-
본 연구에서는 수중 촬영 이미지를 활용하여 해양 침적 쓰레기의 자동 인식 및 분류를 위한 딥러닝 기반 객체 탐지 분석을 수행하였다. 타이어, 로프, 나무, 통발류, 어망류 등 9 종의 침적 쓰레기에 대해 YOLOv5(You Only Look Once version 5) 모델을 적용하여 학습 및 추론을 진행하였다. 총 111,890 장의 수중 촬영 이미지를 활용하였으며, 해당 데이터는 해양 환경에서 YOLO v5 의 YOLOv5x, YOLOv5l, YOLOv5m, YOLOv5s, YOLOv5n 모델로 실험하였다. 성능 평가를 위해 mAP(mean Average Precision) 지표를 사용하였으며, 실험 결과 YOLOv5x 모델이 가장 높은 성능을 보여주었고 YOLOv5l, YOLOv5m, YOLOv5s, YOLOv5n 순서 로 높은 성능을 보여주었다. 본 연구는 딥러닝 모델을 활용한 해양 쓰레기 자동 검출 및 분류의 가능성을 입증하며, 해양 환경 보호를 위한 모니터링 및 정책 수립에 유용한 도구로 기여할 수 있을 것이다.
-
This paper is a study on optimization of port container loading using digital twin technologies. It simulated and evaluated the performance of port container loading optimization using ML-agent's PPO (Proximal Policy Optimization) reinforcement learning algorithm. Through this, the study was conducted to help realize time and cost savings and energy optimization through efficient operation of containers in ports. In this algorithm, optimization was performed through the reinforcement learning process at 375,000 times.
-
본 논문은 피킹 최적화 알고리즘을 개발 및 적용해, CFS(Container Freight Station)에서 작업이 완료된 컨테이너를 트랜스퍼 크레인 하부까지 자동으로 운송하는 로봇 및 관리시스템을 제안한다.
-
항만은 대규모 화물 처리와 물류 이동의 중심지로, 복잡한 작업 절차와 다수의 인력 및 장비가 투입되기 때문에 높은 수준의 안전 관리가 필요하다. 기존 항만 안전 시스템은 보안 인력과 고정형 CCTV 를 통해 감시가 이루어지나, 고정된 시야와 높은 인력 비용으로 인한 한계가 존재한다. 본 연구는 군집 드론을 활용하여 작업자의 안전 준수 여부를 실시간으로 식별·감지하는 시스템을 개발하고, 항만과 유사한 환경을 시뮬레이션을 구축하여 교차 검증 및 적용 가능성을 평가한다. 이를 통해 항만 안전 관리의 효율성을 극대화하고 작업자의 안전을 강화하는 새로운 방안을 제시한다.
-
본 연구는 글로벌 위기 상황에서 해상 운송 산업이 겪은 변동성과 그로 인한 소규모 화주들의 경제적 부담을 분석하고, 이를 해결하기 위한 해상 운임 비교 플랫폼의 개발과 그 효과를 제시한다. COVID-19와 홍해 사태로 인한 운임 급등 상황에서, 웹 스크래핑, 머신러닝, RPA 기술을 활용한 플랫폼을 통해 실시간 운임 정보와 적정 운임을 제공함으로써 정보 비대칭성 문제를 해결하고자 하였다. 소규모 화주들의 경쟁력 향상과 해운 시장 전체의 효율성 증대에 긍정적인 영향을 미칠 것이다.
-
글로벌 물류 대란으로 인해 해상 운임이 급격히 증가하면서 해양 사고의 발생 가능성도 높아지고 있다. 신호체계가 존재하는 도로와 달리, 해상에서는 교통 관리가 어려워 선박의 안전한 항로 예측이 중요한 과제가 되고 있다. 이에 본 연구는 울산항 AIS 데이터의 MMSI 정보를 활용하여 각선박의 GPS 데이터를 기반으로 위치를 예측하고, 빠른 학습 속도를 지닌 GRU 딥러닝 모듈을 개발하는 것을 목표로 한다.
-
우리나라는 수출입 화물의 대부분이 항만 및 해상을 통해 운송되기 때문에 항만 경쟁력 강화를 위한 물동량 예측은 필수적이다. 본 연구에서는 시계열 데이터에 뛰어난 성능을 보이는 LSTM 과 Transformer 모델을 이용하여 물동량과 경제지수를 입력변수로 하는 항만 물동량 예측 모델을 구현하였다. 결론적으로 LSTM 기반 예측모델의 성능이 가장 우수함을 실험적으로 확인하였다.
-
본 연구는 생성형 AI와 검색 증강 생성(Retrieval-Augmented Generation, RAG) 기술을 결합하여 환각(Hallucination)을 방지하고 항만공사 환경에 특화된 챗봇 서비스를 제안한다. 주요 특징은 첫째, KMS 저장소, 벡터 데이터베이스, 검색 및 재조정 처리, LLM을 이용한 프롬프트 처리 등을 통해 사용자 질의에 최적화된 응답을 생성한다. 둘째, '챗봇 One-Step-Service'은 사용자에게 업무 처리용 Form을 제공해 업무 처리의 편의성을 향상시킨다. 해당 시스템을 항만공사에 적용하여 한정된 상담 인력 문제를 해결하고 다양한 내부 업무에 적용하여 업무 효율성이 향상될 것으로 기대된다.
-
본 연구에서는 해양 선박의 보안 강화를 위해, 다양한 적대적 공격에 대응할 수 있는 방어 전략을 제안한다. FGSM, BIM, PGD, DeepFool, JSMA 등 주요한 적대적 공격 기법을 구현하여 실험한 결과, 적대적 훈련을 적용한 모델이 공격 후에도 높은 정확도를 유지하는 것을 확인하였으며, 따라서 향후 자율운항을 위한 안전성 확보에 중요한 역할을 할 것으로 기대한다.
-
해운산업에 인공지능 기술이 결합됨에 따라 자율 항해 기술이 급격히 발전하고 있다. 선박 운항의 안정성과 효율성을 높이기 위해 강화학습을 이용한 충돌 방지 및 경로 생성 연구가 활발히 이루어지고 있으나, 인공지능은 적대적 공격에 취약하다는 한계점이 있다. 이에 본 논문에서는 선박의 안전 운항을 위협하는 적대적 공격기법을 비교 분석하고, 강화학습 기술을 평가하여 가장 적합한 기법을 제안함으로써, 향후 선박운항을 위한 연구 방향을 제시하고자 한다.
-
전 세계적으로 항만 화재 사고는 매년 30만 건 이상 발생하고 있으며, 한 번의 사고 발생 시 손해액은 수백만 달러에서 수억까지 발생한다. 본 연구는 항만 및 산업 현장에서 발생할 수 있는 화재와 연기를 조기에 감지하기 위해, 기존의 관제 방식과 공공 CCTV에 딥러닝 기반 컴퓨터 비전 기술을 접목한 모델을 제안하고 구현하였다. 이 모델을 적용함으로써 항만 근로자들의 안전을 강화하고 경제적, 환경적 손실을 최소화할 수 있을 것으로 기대된다.
-
강화학습은 다양한 환경에서 최적의 의사결정을 내릴 수 있도록 지원하는 인공지능기술로서, 이를 자율운항 선박에 적용하면 복잡한 해상 상황에서도 안전하게 항해할 수 있다. 본 논문에서는 다양한 강화학습 알고리즘에 대해 운항 성능을 비교 및 분석한 결과, DQN 알고리즘이 자율운항선박의 경로최적화와 충돌회피 성능 측면에서 가장 우수하였다.
-
본 연구는 Port MIS 보조 민원 상담 서비스로서 인공지능 모델을 제시한다. RAG 와 파인튜닝을 결합한 모델(RAG + Llama-3-PortMIS-Ko-8B)을 개발함으로써 기존의 FAQ 게시판으로 이루어졌던 민원 상담을 대체할 서비스를 소개한다. 또한, 정확도와 BLUE score 를 통해 Base Model 보다 향상된 답변을 확인할 수 있다.
-
본 연구는 급발진 의심 상황 사고를 줄이기 위한 딥러닝 기반의 실시간 대응 서비스 개발을 다룬다. 급발진 의심 상황일 때 운전자의 잘못된 인지나 실제 발생한 급발진 사고에 신속히 대응할 수 있는 시스템을 제공함으로써 운전자의 생명을 보호하는 것을 목표로 한다. 제안하는 시스템은 액셀과 브레이크위에 설치된 카메라를 통해 운전자의 발 위치, 페달의 밟힘 정도를 실시간으로 분석하고 급발진 의심상황일 때 실시간으로 적절한 대처를 음성으로 안내한다.
-
항만 물동량 예측은 해운사 및 국가 경쟁력 향상을 위한 중요한 요소이다. 이 중에서 컨테이너 물동량은 최근 국내 총 항만 물동량을 견인하고 있어 정확한 예측 및 관리가 필요하다. 그러나 기존의 예측모형은 전통적인 시계열 모형을 활용해 실효적인 예측력 확보에 어려움이 있었다. 이에 대한 해결책으로 본 연구에서는 시계열 자료로 다양한 비선형 AI 모델을 활용해 항만 물동량을 예측하고 비교평가 하였다. 그 결과 DeepAR 모델을 활용한 모형의 예측력이 가장 우수한 것으로 판명되었다.
-
본 논문은 언어 발달 지체 및 의사소통 장애를 겪는 아동을 위해 개발된 AI 기반 맞춤형 언어 치료 애플리케이션의 개념과 그 기대 효과를 논의한다. 본 애플리케이션은 시공간적 제약 없이 접근할 수 있는 비대면 언어 치료 도구로서, 조음 훈련, 호흡 훈련, 유창성 훈련을 포함한다. 또한, 사용자 맞춤형 피드백과 실시간 상호작용 기능을 통해 아동의 의사소통 능력 향상에 이바지할 것으로 기대된다.
-
본 연구에서는 RFID 기술을 활용하여 시각장애인을 위한 실내 내비게이션 시스템을 설계했습니다. RFID 태그를 점자블록에 설치하고, RFID 리더기를 시각장애인 지팡이에 장착하여 사용자가 점자블록을 따라 이동하면서 스마트폰 앱을 통해 실시간 길 안내를 받을 수 있도록 했습니다. 이 시스템은 시각장애인의 이동 안전성과 효율적인 이동을 향상시키며, 독립적인 활동을 지원합니다.
-
AI 기술이 발전함에 따라 개인정보 유출 및 딥페이크 등의 프라이버시 침해가 심각한 사회적 문제로 대두되고 있다. 본 연구는 프라이버시 보호를 위해 FGSM, One-Pixel, Deepfool, JSMA 등 적대적 공격기법을 소프트웨어로 구현하고, 이를 활용하여 얼굴인식 AI 시스템을 공격하는 실험을 수행하였으며, 그 결과 정보 보호를 위한 최적의 적대적 공격 방안을 도출하였다.
-
본 연구는 마스킹, 가우시안 블러, 모자이크 비식별화 기법의 성능을 평가했다. 인간/AI 비식별률, 객체 탐지 정확도, 이미지 품질을 분석한 결과, 마스킹은 높은 비식별화 성능을 보였으나 데이터 유용성이 낮았다. 가우시안 블러와 모자이크는 강도에 따라 비식별화와 데이터 유용성 간 균형을 제공했다. AI 비식별률이 인간 비식별률보다 높아, 현재 기법들이 AI 기반 인식에 더 효과적임을 확인했다. 이는 자율주행차 학습 등 AI 응용 분야에서의 활용 가능성을 시사한다.
-
소설, 웹툰이 영상물로 재탄생하는 사례는 신선한 소재와 검증된 지식재산권(IP)에 기인한다. 본 연구에서는 Confusion Resolution과 CSS 정보를 활용하여 소설을 대본으로 변환하고, Stable Diffusion 모델을 통해 스토리보드를 제작하는 알고리즘을 제안한다. 이 알고리즘은 대본과 스토리보드 생성을 자동화하여 시간과 인건비를 절감함으로써 영상물 제작 과정의 초기 단계의 효율성을 높이며, 게임 개발, 교육 자료 개발, 마케팅 콘텐츠 제작 등 다양한 분야에서 활용될 것으로 기대된다.
-
교통사고분석 시스템(TAAS, 도로교통공단) 통계에 따르면 PM(Personal Mobility) 관련 교통사고는 2023년 2389건으로, 2019년 447건 대비 5배 이상 증가하였다. 증가하는 교통사고를 예방하기 위해 본 논문에서는 AI 기술을 이용한 스마트 전동 킥보드 안전 시스템을 제시한다. AI 딥러닝 기반 모델을 적용해 무면허, 헬멧 미착용, 2인 이상 탑승, 횡단보도 주행, 교통안전에 위배되는 무단 주차를 제한한다. 본 시스템을 통해 전동 킥보드 이용자들의 도로교통법 준수와 공공의 안전 강화를 기대한다.
-
최근 대한민국의 포트홀의 발생 빈도가 증가함에 따라 이를 예방하기 위한 효과적인 대책이 요구되고 있다. 이에 본 연구에서는 딥러닝 알고리즘을 활용한 포트홀 탐지 시스템을 개발하였다. YOLO v8n 모델을 기반으로 설계된 본 시스템은 다양한 도로 및 기상 조건에서 포트홀을 실시간으로 탐지할 수 있으며, 탐지 정확도를 향상하기 위해 Canny, Sobel, Laplacian 에지 검출 기법을 비교해 분석한 후 적용하였다.
-
본 프로젝트는 한국인 학습자들의 영어 듣기와 말하기 능력을 향상시키기 위해 개발된 인공지능 기반 영어 회화 학습 서비스 개발을 목표로 한다. 주요 기능으로는 음성 인식 기술을 활용한 딕테이션 및 쉐도잉 기능이 포함되어 있다. 학습자의 영어 실력에 맞춘 레벨별 콘텐츠를 제공하며, 자연어 처리 기술을 통해 정교한 피드백을 제공한다. 완성된 서비스는 학습자의 영어 실력 향상과 자신감 증진을 목표로 개인 학습자부터 교육 기관 및 기업 등 다양한 분야에서 활용될 수 있다.
-
최근 패션 소비자들의 지속 가능한 소비와 환경 보호에 대한 관심이 높아지면서, 기존 AI 의류 추천 시스템의 과소비 촉진 문제가 부각되고 있다. 본 논문에서는 사용자가 소유한 의류를 기반으로 스타일을 제안하는 패션 큐레이션 시스템을 제안하며, AWS Rekognition을 통해 의류의 시각적 특징을 분석하고 날씨와 TPO 정보를 반영한 맞춤형 추천을 제공한다. 또한, 타 서비스와 차별화된 '시밀러룩' 추천 기능을 도입하여, 주변인과 자연스럽게 어울리는 스타일을 추구할 수 있도록 돕는다. 이는 환경 보호와 윤리적 소비를 촉진하며, 패션 산업의 과소비 문제 해결에 기여할 것으로 기대된다.
-
코로나19 이후 비대면 커뮤니케이션의 확산과 메신저의 발달로 인해 말하기 공포가 증가하여, 진단 및 치료를 위한 임상적 대화 훈련 해결책의 필요성이 높아지고 있다. 인공지능(AI)과의 말하기 시뮬레이션을 통해 사회불안장애 진단 및 솔루션 제공이 가능한 플랫폼 개발을 목표로 한다.
-
본 논문에서는 대규모언어모델(LLM)을 활용한 질환 예측 방법을 연구하고, 프롬프트 엔지니어링을 최적화하여 진단 정확도를 향상시키는 방법을 모색하였다. 사용자 프롬프트에 제공되는 정보 유형(예: 통증 위치, 통증 유발 행동)이 진단 성능에 미치는 영향과 프롬프트 기법이 모델의 일관성 및 신뢰성을 개선하는 효과를 분석하였다. 실험 결과, 특정 정보 유형이 포함될 시 진단 정확도가 높은것을 밝혀냈으며, 프롬프트 기법을 통해 4.83점(5점 만점)의 진단 정확도와 93.3% 이상의 일관된 결과를 도출할 수 있었다. 이 연구는 LLM의 의료 진단 활용 가능성을 제시하며 향후 연구 방향에 대한 기초를 제공한다.
-
현대 사회에서 디지털 기기의 장시간 사용으로 눈 건강 문제가 심각해지고 있지만, 많은 사람들이 초기 눈 건강 문제를 인식하지 못해 안질환이 악화된 후에야 치료를 받는 경우가 많다. 이를 해결하기 위해 본 연구는 예방적 관리를 가능하게 하는 눈 운동 디지털 헬스케어 솔루션을 제안한다. XR(eXtended Reality) 기술을 활용하여 사용자가 눈 건강의 중요성을 인식하며 눈 운동을 실천할 수 있도록 유도하는 시스템을 구축하며, 자가 관리를 촉진한다. 향후 사용자 배포를 통해 눈 건강 관리에 있어 실질적인 효과와 발전 가능성을 평가할 계획이다. 이를 통해 디지털 헬스케어가 눈 건강에 긍정적인 영향을 미칠 수 있음을 입증하고자 한다.
-
본 연구는 본인 인증 및 객체 탐지 알고리즘 기반의 보안 기능을 탑재한 배달 로봇을 제안한다. 기존 배달 로봇의 물품 도난 위험성 해결을 위한 보안 시스템 도입과 장애물 대처 및 강화학습 기반 경로계획 주행으로 보안성과 주행 안정성을 갖춘 배달 로봇을 고안하였다.
-
본 논문은 청각장애인들이 음성 언어 중심의 사회에서 겪는 의사소통 제한을 해소하기 위해 제안되었다. 이를 위해 수어 인식, 입모양 탐지, 음성 인식 모델을 통해 추출된 데이터를 텍스트로 변환하여 접근성을 향상시키는 시스템을 개발하였다. 이 시스템은 청각장애인의 원활한 의사소통을 지원하고 사회적 참여를 증진하는 것을 목표로 한다.
-
지적장애 학생들은 시각적 자극에 민감하게 반응하기 때문에, 시각적 자료를 활용한 학습이 효과적이다. 마음말 서비스는 텍스트 기반 학습의 한계를 극복하고, 학생의 흥미를 유도하며 맞춤형 학습자료와 실시간 피드백을 제공한다. GPT 기반 문제 생성과 DALL-E 3을 활용한 이미지 생성을 통해 교사는 쉽게 문제를 제작할 수 있고, 학생은 학습 후 AI의 피드백을 받을 수 있다. 본 논문은 지적장애 학생들의 언어 학습을 지원하기 위해 NLP와 이미지 생성 기술을 결합한 AI 기반 학습 플랫폼 '마음말 서비스'를 제안한다.
-
본 논문은 시각장애인 부모의 육아 환경에서 영아의 수면 중 발생할 수 있는 위험 상황에 대한 즉각적인 조치와 수면 환경 케어를 위해 "시각장애인 부모의 육아 지원을 위한 Vision AI 기반 스마트 침대"를 제안한다. Vision AI 객체인식 기술과 센서를 활용하여 영아의 수면 상태를 실시간으로 모니터링하고 위험 상황을 판단한다. 침대에 설치된 액추에이터 및 모터를 제어하여 영아의 식후 역류 방지, 침대 스윙, 돌연사 방지를 위한 뒤집기 기능을 제공한다. 이러한 기능을 통해 영아의 위험을 완화시키고 부모의 육아 보조를 목표로 한다. 또한 기술 특성상 육아 외 실버 케어, 펫 케어 등 다른 다양한 분야에 적용되어 시장을 넓힐 것으로 기대된다.
-
본 논문은 장애인을 위한 뷰티 도우미 플랫폼을 제안하고 있다. 이 플랫폼은 시각장애인을 위한 음성 명령 기반의 화장품 추천 및 구매 기능을 제공하는 키오스크 시스템을 중심으로 구성된다. 사용자에게 피부 측정과 AR 체험을 통해 맞춤형 화장품을 선택할 수 있는 옵션을 제공하며, 시각장애인에게는 음성으로 소통하고 안내한다. 또한 장바구니 로봇은 주문 정보를 기반으로 QR코드를 인식해 제품을 자동으로 수집하고, 장애물을 감지하여 안전하게 이동하며 사용자에게 물품을 전달하는 기능을 갖추고 있다. 피부 측정 알고리즘을 통해 사용자의 피부 톤을 분석하고 여드름을 감지하여 개인에게 적합한 화장품을 추천하는 기능도 포함된다. 이 플랫폼은 장애인의 뷰티 경험을 개선하고, 화장품 선택과 구매 과정을 보다 편리하게 만들어 주는 것을 목표로 한다.
-
장애인은 일반인보다 비만율과 체형 불균형 비율이 높다. 정상적인 체형을 유지하기 위해서는 운동이 필수적이지만 경제적·환경적인 이유로 운동을 하지 못하는 경우가 많다. 이러한 문제점을 해결하기 위해 본 논문에서는 편한 장소에서 혼자 운동을 할 수 있는 AI 기반 피트니스 시스템을 제안한다. 제안하는 시스템의 주요 기능은 첫째, 정확한 체형측정을 위해 액추에이터 기반 카메라 높이 조절 기능. 둘째, 체형 불균형을 개선하기 위해 일대일로 코칭하는 올바른 운동자세 교정 기능. 셋째, 운동 일정을 관리하여 체형교정 비율과 비만율을 관리하는 기능. 넷째, 자신의 기록을 타인의 기록과 비교하는 랭킹 시스템을 도입하여 목표와 경쟁 심리를 자극하여 지속해서 운동하기 위한 동기를 부여한다.
-
본 연구는 농어촌 지역 고령층의 의료 접근성 문제를 해결하기 위해 비대면 의료 서비스의 필요성과 효과를 분석한다. 농어촌 지역은 의료 인프라가 부족하여 고령층이 적시에 의료 서비스를 받기 어려우며, 이는 건강 불평등을 심화시킨다. 비대면 의료는 이러한 문제를 해결할 수 있는 혁신적 대안으로, 의료 접근성을 향상시키고, 만성 질환 관리를 지원하며, 의료 격차를 줄이는 데 기여할 수 있다. 이 연구는 이러한 서비스의 국내 적용 가능성과 정책적 지원의 필요성도 강조한다.
-
본 연구는 사회적 약자를 위한 다기능 감정케어 로봇 시스템의 설계 및 개발에 관한 것이다. 이 로봇 시스템은 자세 인식, 표정 분석, 대화 생성, 그리고 환경 모니터링 기능을 통합하여 사용자의 신체적, 정서적 웰빙을 지원하는 것을 목표로 한다.
-
본 논문은 청각 약자를 위한 청각 보조 애플리케이션 개발에 초점을 맞추고, 딥러닝을 활용한 오디오 분석과 감정 분석 기능을 포함한 시스템 설계를 다룹니다. 본 연구는 청각 약자들이 외출 시 혹은 실내에서 중요한 소리를 인식하고 경고를 받을 수 있도록 지원하는 애플리케이션을 개발하는 데 중점을 둡니다. 청각 보조 기능은 특정 소리를 학습한 모델을 이용해 위험 신호를 제공하며, 감정 분석 음성 번역 기능은 일상대화에서 텍스트와 감정 분석을 제공해 소통을 개선합니다. 이 애플리케이션은 사용자의 편리성을 높이기 위해 온디바이스 기술을 사용하여, 서버 없이도 실시간 분석이 가능하도록 설계되었습니다. 또한, 저비용으로 청각 보조를 가능하게 하여 더 많은 사용자에게 접근성을 제공합니다. 이를 통해 사회적 약자들의 안전을 보호하고, 감정 분석 기능을 통해 원활한 소통을 돕는다는 점에서 큰 기대효과를 보이고 있습니다.
-
본 연구에서는 시각장애인이 더 자유롭고 편리하게 물품을 구매할 수 있도록 자율주행 로봇과 쇼핑 카트를 결합한 혁신적인 시스템을 설계하고 구현하였다. 이 시스템은 시각장애인이 자율주행 로봇에 탑승한 상태에서 로봇이 쇼핑 카트를 이동시키는 방식으로, 쇼핑 과정의 부담을 최소화하고 이동의 자유를 제공한다. 또한, 사용자의 음성 인식을 통해 구매할 물품을 선택하고, 그에 대한 정보를 실시간으로 음성 출력하여 직관적인 구매 경험을 가능하게 하였다. 개발 결과, 본 시스템은 높은 음성 인식 정확도와 실시간 명령 처리 성능을 보여주었으며, 시각장애인의 쇼핑 효율성을 크게 향상시킬 수 있음을 확인하였다.
-
본 연구에서는 LED를 활용한 비전 인식 인공지능 기반 고령 보행자 사고 예방 시스템을 설계하고 구현한다. 이 시스템은 보행자의 속도와 잔여 거리를 분석하여 횡단보도 내 보행 신호를 동적으로 제어하고, LED를 통해 이를 시각화함으로써 보행자와 운전자 모두의 안전을 강화할 수 있다. 또한, 객체 추적의 정확도를 높이기 위해 칼만 필터를 활용하여 보행자의 움직임을 더욱 정밀하게 추적함으로써 시스템의 효율성을 극대화한다.
-
급속한 고령화와 노인 우울증 문제에 대응하기 위해 인공지능 기반 음성 인식 및 생성 기술을 활용한 시니어 생활 편의 애플리케이션을 제안한다. 제안된 애플리케이션은 Google Cloud STT/TTS AI를 사용하여 노년층의 접근성을 높이고, WebRTC 기술을 통해 화상 채팅으로 '밥 친구'를 찾을 수 있는 기능을 제공한다. 또한 한국노인인력개발원의 API를 활용하여 노인 구인 정보를 제공한다. 이 애플리케이션은 노년층의 사회 참여를 촉진하고 우울증 예방에 기여한다.
-
무인 편의점이나 키오스크와 같은 기술이 급속히 발달하며 자립적인 쇼핑을 원하는 시각장애인들에게 실질적인 시스템의 필요성이 대두되고 있다. 기존 애플리케이션은 유통기한 등의 상품의 부가 정보를 얻을 수 없고, 매장 전체의 위치 정보를 알고 이동하기에는 한계가 있다. 본 논문에서는 라즈베리파이와 아두이노를 활용하여 음성인식을 통한 목적지 설정 기능, 라인트래킹을 통한 카트 이동 및 장애물 감지에 의한 카트 제어 기능, 상품명과 유통기한 및 칼로리와 알레르기 유발성분 같은 부가 정보를 읽어주는 기능을 개발한다. 이 연구로 도출된 방법을 통해 시각장애인의 안전한 오프라인 쇼핑 보조기기 및 상품 정보를 알려주는 애플리케이션을 제작한다.
-
시각장애인들은 오프라인 매장에서 물건을 구매할 때 주로 점원의 도움을 받거나 화면 낭독기 애플리케이션을 사용하지만, 이러한 방식은 불필요한 정보 제공, 점자의 제한적 사용, 점원의 비협조등으로 인해 비효율적이고 불편함을 초래한다. 본 논문에서는 Beacon 기술을 통해 상품 구역을 식별하고, NFC 태그 스캔을 통해 제품 정보를 음성으로 제공하는 플랫폼을 개발하였다. 이 플랫폼은 시각장애인들이 매장에서 보다 독립적이고 편리하게 상품을 탐색하고 구매할 수 있도록 돕는다. 본 연구는 시각장애인의 쇼핑 경험을 크게 향상시키는 새로운 접근 방안을 제시하며, 실생활에서의 적용 가능성 또한 기대된다.
-
디지털 기기가 필수적인 현대 사회에서, 절단 환자와 손 떨림 환자는 디지털 기기 조작에 어려움을 겪어 정보 접근에 제약이 있다. 본 논문은 이러한 사용자들을 위해 IMU 센서를 활용한 에어 마우스를 개발했다. 에어 마우스는 IMU 센서를 기반으로 공중에서의 직관적인 조작을 지원하며 주파수 영역의 필터링으로 손 떨림 보정 기능을 제공한다. 이를 통해 장애인의 디지털 접근성을 개선하고, Visual Display Terminal(VDT) 증후군 예방에도 기여할 수 있다.
-
본 연구는 농인의 언어권 보장을 위한 한국어-한국수어 번역 프로그램의 필요성을 제기하고 있다. 이를 위해 KoBART 모델을 활용하여 한국어 텍스트를 한국수어로 효과적으로 변환한다. ControlNet을 통해 수어 영상에서 손의 위치와 제스처를 정밀하게 추출하여 Stable Diffusion 모델을 제공함으로써 고해상도의 아바타 영상을 생성한다. 이러한 기술을 바탕으로 개발된 애플리케이션은 사용자가 음성을 입력하면 이를 텍스트로 변환하고, 변환된 텍스트에 대응하는 수어 영상을 순차적으로 재생하여 농인의 의사소통을 보다 원활하게 지원한다.
-
전 세계적으로 고령화가 진행됨에 따라 휠체어 수요가 증가하고 있다. 이로 인해 개인용 이동수단으로서 자율주행 휠체어 시장이 빠른 속도로 성장중이다. 이에 따라 ROS 환경에서 SLAM & Navigation 을 통해 수동 휠체어를 자율주행 휠체어로 변환하는 과정을 개발하였다.
-
본 논문에서 구현한 앱은 치매환자의 현재 위치 예측 기능을 제공하여 실시간 위치 추적이 불가한 경우에 수색시간을 단축시킬 수 있도록 하였다. 또한, 실시간 위치 추적, 위치 기록 조회, 안심구역, 긴급 도움 기능을 통해 보호자가 치매환자와 떨어져 있더라도 안심하고 생활할 수 있도록하였다.
-
본 연구는 독거노인의 식사 관리 문제를 해결하기 위해 공공데이터를 활용한 식사 지원 챗봇의 기능을 고도화하는 것을 목표로 합니다. 소비기한 및 영양소 데이터를 활용해 독거노인들이 안전하고 균형 잡힌 식사를 할 수 있도록 돕는 시스템을 개발하고, 그 성능을 평가합니다. 이 연구는 공공데이터의 실질적 활용 가능성을 극대화하며, 독거노인의 건강 증진과 삶의 질 향상에 기여할 수 있음을 확인하였습니다.
-
본 연구는 경계선 지능인 등을 대상으로 한 사기 및 부당 계약 문제를 해결하기 위해, 대규모 언어 모델(LLM)을 활용한 쉬운 말(이지리드) 변환 성능을 평가하였다. 이를 위해 Gunning Fog Index, 문장 복잡도, KoBERTScore 등의 지표로 가독성과 의미 유사도를 분석하는 평가 방법론을 제안하였으며, 여섯 종류의 LLM 을 평가한 결과 Claude-3.5-Sonnet 모델에서 우수한 성능을 확인하였다.
-
본 논문은 자립준비청년(보호종료아동)을 대상으로, BERT와 대규모 언어 모델(LLM)을 이용한 감정 분석 일기 서비스를 제안한다. 사용자가 자신의 감정을 기록하고 분석하여 심리 상태를 지속 관리할 수 있도록 하며, 공감 메시지와 공유 기능을 통해 정서적 지지를 제공한다.
-
저시력자와 노약자와 같은 교통약자들이 실시간으로 버스 번호를 인식할 수 있도록 딥러닝 모델(MobileNet, SSD)을 활용한 시스템을 개발하였다. 이 시스템은 MobileNet과 SSD 모델을 적용하여 모바일 환경에서도 실시간 객체 인식이 가능하며, 사용자는 인식된 정보를 음성으로 안내받는다. 성능 테스트에서 80% 이상의 인식 정확도를 기록했으며, 교통약자 대상 사용자 테스트 결과 긍정적인 피드백을 얻었다.
-
언리얼 엔진을 이용해 자동 맵 생성이 되는 로그라이크 RPG 게임을 개발한다. 맵 생성에는Quattuorpus 알고리즘이 사용되며 이는 절차적 생성 알고리즘을 우리의 방식으로 발전시킨 것이다. 기존의 2D 로그라이크에서 벗어나 3D 그래픽으로 유저들에게 새로운 경험을 선사하고자 한다.
-
온라인에서의 비격식적적 소통은 다양한 언어 문제를 발생시킨다. 사용자의 언어를 분석하여 교정해주는 프로그램을 통해 언어생활의 문제를 완화할 수 있다. 이 논문에서는 트렌스포머(Transformer)를 이용한 거대 언어 모델(LLM)을 통하여 잘못된 맞춤법을 검사하는 방법을 살피고자 한다. 기존의 방법과 달리, 언어 모델의 자체적인 사고력을 바탕으로, 학습되지 않은 분야에서의 맞춤법도 보다 효과적으로 검사할 수 있다. 적절한 사전 학습 모델을 선택하고, 정교한 프롬프트를 구성함으로써 프롬프트가 있기 전 0.09에서 0.27로 약 3배 가량의 정확도 향상을 얻을 수 있다. 이러한 결과를 바탕으로 보다 신뢰성 있는 언어 사용 교정 애플리케이션을 개발 할 수 있다.
-
4차 산업혁명 시대에 AI 기술의 발전과 함께, 고속 데이터 전송을 위한 6G의 필요성이 대두되고 있으며, 이는 다양한 산업 분야에 큰 영향을 미칠 것으로 기대된다. 그러나 현재의 채널 디코딩 방식인 LDPC 및 BCH 코드 알고리즘은 복잡한 연산으로 인해 실시간 통신에 지연을 초래할 수 있다. GNN은 노드 간의 복잡한 관계를 효과적으로 학습할 수 있어, 통신 채널 특성을 이해하고 예측하는데 유리하다. 본 연구에서는 6G 통신 기술에 접목하기 위해, 기존 디코딩 방식보다 처리속도가 빠르고 비트 오류율이 낮은 그래프 신경망 기반 채널 디코딩 모델 개발을 목표로 한다.
-
Chi-Hyeok Min;Hye-Jin Song;Bo-Min Lyu;Jang-An Lee;Ho-Seong Jeong;Hong-Sik Cho;Seok-Bong Yoo 1109
이 연구는 KoGPT2(Korean Generative Pre-trained Transformer)를 활용해 아동 및 청소년의 의사소통을 지원하는 공감형 대화 모델을 개발하는 것을 목표로 한다. 이를 위해 소아청소년심리 데이터를 기반으로 KoGPT2를 파인튜닝하고, 향후 음성 및 이미지 데이터를 포함한 멀티모달 모델로확장할 계획이다. 이로써 아이들의 정서와 의사소통 능력을 다각도로 지원하는 AI(Artificial Intelligence) 시스템을 구축하고자 한다. -
-
본 프로젝트는 AI를 활용하여 사용자가 손쉽게 음악을 생성할 수 있는 플랫폼을 개발하는 것을 목표로 한다. 이를 통해 음악 창작의 진입 장벽을 낮추고, 누구나 창의적인 활동을 할 수 있는 기회를 제공하고자 한다.
-
우울증은 전 세계적으로 심각한 정신 건강 문제로 자리 잡고 있다. 개선을 위해서는 적절한 관리와 치료가 필요하지만, 경제적, 사회적 이유로 정신건강 의학과를 이용하지 못하는 비율이 높다. 따라서 본 논문에서는 LLM을 활용하여 우울증의 조기 진단 및 관리 서비스를 개발하고자 한다. 기존 우울증 자가 진단의 정량적 설문 방식을 개선하여, AI를 활용한 서술형 분석을 통해 사용자가 자신의 감정을 더욱 세밀하게 표현하고 진단받을 수 있도록 지원한다. 또한 사용자의 감정 상태를 추적하고, 운동 및 명상 등의 활동을 추천함으로써 우울감 및 우울증 증상을 완화하는 데 도움을 줄 수 있는 맞춤형 서비스를 제공한다.
-
본 논문에서는 강화학습을 활용하여 MITRE ATT&CK 프레임워크를 기반으로 한 사이버 공방시뮬레이션 환경을 개발하였다. 본 논문의 목적은 실제와 유사한 네트워크 환경에서 방어자의 존재여부가 공격 시퀀스의 복잡성과 학습 효율성에 미치는 영향을 분석하는 것이다. 본 논문에서 개발된 방어 전략은 공격 테크닉의 사전 및 사후 조건을 기반으로 하여 공격의 조건 및 결과와 반대되는 효과를 생성하였다. 이를 통해 공격자 및 방어자 간의 상호작용을 실시간으로 동기화하고, 네트워크 보안의 동적인 적응을 가능하게 한다. 이를 위해 Deep Q-Network (DQN), Proximal Policy Optimization (PPO), 그리고 Soft Actor-Critic (SAC) 등 다양한 강화학습 알고리즘을 사용하였다. 실험결과, 방어자가 없는 시나리오에서는 알고리즘들이 간단한 시퀀스로 빠르게 수렴하는 경향을 보였다. 이와 달리, 방어자가 포함된 시나리오에서는 DQN 과 PPO 가 반복적 행동으로, SAC 는 보다 다양한 행동 패턴으로 최대 스텝 수에 이르렀다. 이러한 결과는 방어자의 존재가 사이버 공격 전략의 복잡성을 크게 증가시키며, 강화학습 기반의 사이버 보안 전략 개발에 중요한 역할을 한다.
-
응용 트래픽이 점점 복잡해지고 방대해짐에 따라, 정확하고 효율적인 트래픽 분류에 대한 수요가 커지고 있습니다. 일반적으로 분류 모델의 크기와 분류 속도는 트레이드오프 관계이므로 두 개의 성능 목표를 달성하기는 어려우나 실제 환경에 분류 모델을 배포하기 위해선 더 빠르면서도 정확한 분류기법이 필요합니다. 우리는 딥러닝 기반의 모델 선택기와 Gumbel-Softmax를 활용한 종단 간 앙상블 학습 방법을 제안합니다. 제안된 방법은 두 개의 공개 데이터셋을 사용하여 평가되었으며, 7개의 기준 모델들과 비교한 결과, 다른 방법에 비해 평균 4%의 정확도 향상을 보이면서도 합리적인 분류 속도를 유지했습니다.
-
이 논문에서는 네트워크 관리와 보안에서 중요한 응용 트래픽 분류 기술의 한계를 해결하기 위해 섀넌 엔트로피를 활용한 암호화 여부 판단 방법을 제안한다. 기존의 포트 기반 및 페이로드 기반 분류방식은 암호화된 트래픽 증가로 인해 정확도가 떨어지며, 머신러닝/딥러닝 기법 또한 암호화된 데이터 학습에 어려움을 겪고 있다. 이러한 문제를 극복하기 위해 섀넌 엔트로피를 활용한 암호화 판단방법을 제안하였고, 프로토콜 분석 없이도 암호화 구간을 95%의 높은 정확도로 식별하였다.
-
본 연구는 스마트 안전모의 설계 및 구현을 통해 작업자의 안전을 강화하는 것을 목표로 한다. 이를 위해 관성 센서, 압력 센서, GPS 모듈, 영상 인식 기술을 통합하여 실시간으로 작업자의 상태를 모니터링하고, 추락 위험이 높은 구역을 감지하여 경고하는 시스템을 개발한다. 연구의 주요 목표는 추락 사고 예방, 안전모 착용 여부 확인, 위험 구역 실시간 경고 및 위치 추적을 포함한다. 기대되는 결과로는 사고 예방, 안전모 착용률 향상, 효과적인 경고 시스템 운영과 전력 효율성 극대화가 있으며, 이 연구는 스마트 안전모의 상용화와 산업 안전 관리에 기여할 것으로 예상된다.
-
광주시내 외국인 유학생 및 근로자들의 수가 증가하고 있다. 하지만 여전히 행정과 실생활에 필요한 자국어 설명 등의 제공 서비스는 제공되고 있지 않다. 외국인들의 좀 더 안정된 정착을 위해서는 생활하는데 반드시 필요한 행정 등의 자국어 설명이 실시간으로 제공되는 것이 필요하다. 이에 본 연구에서는 외국인들에게 도움이 되는 통역 어플리케이션을 개발하고 그 성능을 검증하는 것을 목적으로 하였다. 시스템은 자발성, 자율성, 사회성, 반응성을 갖는 독립된 프로그램인 에이전트를 조합하여 구성되는 시스템으로 일반 사용자에게 편리하고 자연스러운 메타포를 제공한다. 외국인 학생들을 통한 정적인 평가 결과 뿐만 아니라 센서 기반 측정 데이터를 통한 정량적인 평가 결과를 통하여 개발한 어플리케이션의 유효성을 확인할 수 있었다.
-
본 논문에서는 자연어 처리 기반의 팀 내 참여도 및 기여도 분석 시스템을 활용한 협업 보조 Slack Bot을 제안한다. 이 시스템은 회의 중 발생한 발언을 STT(Speech-to-Text) 기술로 텍스트화한 데이터와 Slack 채팅 데이터를 함께 분석하여, 팀원들의 참여도와 기여도를 평가한다. 토픽 모델링과 BERT 임베딩을 통해 회의 주제와 발언 간의 유사도를 계산하며, 감정 분석을 추가하여 긍정적 피드백을 받은 의견에 더 높은 기여도를 부여하는 알고리즘을 적용한다. 이를 통해 팀 프로젝트에서 발생하는 참여 불균형 문제를 해결하고, 공정한 평가와 피드백을 제공하여 협업의 효율성을 높인다. 본 시스템은 Slack과 같은 협업 도구에서 발생한 회의 및 채팅 기록을 분석하고, 시각화된 결과를 통해 각 팀원의 참여도 및 기여도를 직관적으로 확인할 수 있게 한다. 또한, 회의 일정 자동 설정, 팀장 추천 기능, 상/벌 피드백 시스템 등 다양한 협업 보조 기능을 제공하여 팀 내 원활한 의사소통과 효율적인 협력을 지원한다. 이를 통해 팀 프로젝트의 참여도 향상과 팀워크 강화를 목표로 한다.
-
본 연구는 한국어 텍스트를 기반으로 정신 질환 예측 AI 모델을 개발하고, 이를 일기 분석 플랫폼에 적용하여 장기적인 정신 건강 모니터링 시스템을 제안한다. 현재 한국은 정신 건강 문제의 심각성에도 불구하고, 정신 건강 서비스 이용률이 매우 낮다. 이러한 문제를 해결하기 위해 우울증, 불안, 조울증 등의 정신 질환 발생 가능성을 예측하는 모델을 구축한다. 이 모델은 사용자가 일기를 통해 감정 변화를 기록하고, 정신 건강 문제를 조기에 진단하도록 돕는다. 연구 결과는 정신 질환의 조기 발견 및 예방에 기여하고, 한국어 기반 정신 건강 관리 서비스에 중요한 기초 자료를 제공할 것이다.
-
본 연구는 이동 로봇을 활용하여 대형 쇼핑몰 및 유통 환경에서 고객 경험을 향상시키는 쇼핑 길 안내 시스템 개발을 제안한다. 대형 쇼핑몰의 복잡한 구조로 인해 고객들은 특정 상품이나 매장을 찾는 데 어려움을 겪는 경우가 많다. 이를 해결하기 위해, 이동 로봇을 통해 실시간으로 경로를 안내하고 장애물을 회피하는 실내 내비게이션 기술을 적용한 시스템을 설계하였다. 고객은 로봇과의 직관적인 상호작용을 통해 목적지를 선택하고, LiDAR, 카메라, 초음파 센서를 이용한 안전하고 정확한 경로 안내를 받는다. 또한, 로봇은 고객의 경로에 따라 프로모션 정보와 추천 상품을 제공하여 쇼핑편의성과 만족도를 높인다. 본 시스템은 고객의 쇼핑 경험을 개선하는 것뿐만 아니라, 쇼핑몰 운영자의 입장에서 고객 흐름을 관리하고 실시간 프로모션 정보를 제공하는 데 기여할 수 있다. 연구 결과는 이동 로봇이 소매 부문에서 고객 서비스 개선 및 운영 효율성 증대에 중요한 역할을 할 수 있음을 보여준다.
-
본 논문은 소상공인을 지원하기 위한 마감 세일 중계 플랫폼 개발에 대해 다루고 있다. 소상공인은 고용 창출과 경제 성장에 중요한 역할을 하지만, 최근의 경제 불황으로 인해 소상공인들이 재고 처리 및 손실 문제를 겪고 있다. 이를 해결하기 위해 제안된 플랫폼은 소상공인들이 남은 재고를 할인된 가격으로 판매할 수 있도록 하여, 재정적 손실을 줄이고 더 많은 고객을 유치하는 데 도움을 준다.
-
본 논문은 자영업자들의 창업과 폐업 과정에서 발생하는 중고 기자재 거래 문제를 해결하기 위한 웹 플랫폼을 개발한 경험을 바탕으로 한다. 최근 자영업자들이 폐업하는 빈도가 증가함에 따라 중고 기자재의 공급이 늘어나고 있으며, 기존의 오프라인 기반 거래 방식은 이러한 문제를 효과적으로 해결하지 못하고 있다. 따라서 중고 기자재를 온라인에서 효율적으로 거래할 수 있는 웹 플랫폼을 제안하였다. 제안한 플랫폼은 경매와 시세 조회 기능을 제공하여 거래의 효율성을 높이고 사용자들이 적정한 가격으로 물품을 거래할 수 있도록 돕는다. 그리고 제안한 플랫폼은 중고 기자재 거래를 통해 자원의 순환을 촉진하며, 지역 경제 활성화에도 기여할 수 있는 기능을 제공한다.
-
본 연구는 개인 맞춤형 요가 동작 추천 시스템을 개발하여 사용자의 요가 경험과 목표에 맞는 동작을 추천하고 실시간 자세 교정을 지원하는 것을 목표로 한다. 미디어 파이프와 서포트 벡터 머신(SVM) 알고리즘을 활용하여 사용자의 신체 관절 포인트를 실시간으로 추적하고, 이를 통해 정확한 자세 분석과 피드백을 제공한다. 해당 웹서비스의 데이터베이스는 Supabase를 통해 운영되어 사용자의 정보와 설문 조사 결과를 저장하며, Python Flask를 기반으로 한 백엔드 시스템으로 효율적인 데이터 처리와 API 연동이 가능하다. HTML, CSS, JavaScript를 사용한 프론트엔드 개발로 사용자에게 직관적인 인터페이스를 제공하였다.
-
최근 채팅 서비스에서 파일 공유의 증가와 함께 디지털 콘텐츠의 무단 공유 사례가 급증하고 있다. 기존 채팅 서비스에서는 무단 공유 발생 시 모든 트랜잭션 이력을 확인해야 하며, 이는 상당한 시간이 소요되는 문제점이 존재한다. 본 논문에서는 시그니처 각인을 활용하여 파일 송수신 이력을 효율적으로 관리하고, 웹 채팅 서비스 내에서 신뢰할 수 있는 파일 공유 서비스를 제안한다. 제안된 서비스에서는 채팅방에서 공유된 파일에 송신자의 시그니처 정보를 포함하여 전송함으로써, 데이터베이스에서 해당 파일의 트랜잭션 이력을 신속하게 확인할 수 있고, 이를 통해 책임자를 명확히 식별할 수 있다. 시그니처가 각인된 파일은 원본과 외관상 구별이 불가능할 정도로 유사하게 처리되며, 유사도 검사 기능을 통해 파일 수정 시 시그니처 손실을 방지하고 트랜잭션의 무결성을 유지하여 경로 훼손을 방지한다. 본 논문에서 제안하는 서비스는 디지털 콘텐츠의 안전한 공유와 저작권 보호를 목표로 하며, 학습 자료나 창작물의 무단 배포로 인한 법적 분쟁과 경제적 손실을 줄일 수 있다. 또한, 파일 유포의 책임자를 명확히 하여 범죄 수사에 기여할 수 있을 것으로 기대된다.
-
대한민국 의료공백에 의해 영상의학 진단이 지체됨에 따라 많은 환자들이 치료 시기를 놓치고 있다. 본 연구에서는 진단 가속을 위해 흉부 X-ray 이미지와 임상 노트 텍스트로 구성된 데이터를 멀티모달 학습시키고, 흉부 X-ray 이미지에 대한 임상 기록을 생성하는 모델을 제안하였다. 이미지 임베딩 생성에는 PubMed 텍스트/이미지 쌍을 학습한 BiomedCLIP을 사용하고, 이미지 임베딩을 텍스트화하고 최종 텍스트 생성하는 과정에는 PLM 모델 T5를 사용한다. T5는 경량화된 모델이므로 컴퓨팅 자원이 부족한 의료 실무 환경에서도 충분히 임상 노트를 생성을 수행할 수 있으며, 이를 통한 정밀의학의 실용화를 기대할 수 있다.
-
외국인 관광객은 증가하고 있지만 관광 수지는 감소하고 있다. 본 연구에서는 관광객을 군집화하여 관광객별 유형을 분석하고, 뉴스 기사 분석을 통해 한국 관광 관심사를 분석하여 인바운드 관광 산업에 도움이 되고자 하였다. 연구 결과 한국을 방문하는 외국인 관광객은 업무수행, 문화체험, 쇼핑 유형으로 나눠지고, 이들의 관심사는 한국 문화체험이라는 공통점을 지니고 있지만 상세한 수요 내용에 차이가 있는 특성을 확인할 수 있었다.
-
본 연구는 생성형 인공지능 기술을 활용해 가상 면접관을 생성하고, 면접자가 업로드한 자기소개서를 바탕으로 인터뷰 문항을 생성하여 제시하며, 면접자의 답변을 분석하여 실시간 피드백을 제공하는 AI 기반 모의 면접 시스템을 개발하였다. 제안하는 시스템은 자기 소개서 텍스트 분석을 통해 연관성 있는 질문을 자동 생성하며, 면접관의 표정 변화까지 시물레이션하여 실제 면접과 유사한 환경을 제공한다. 또한 사용자의 면접 중 표정, 시선 추척, 음성 톤 등 비언어적인 행동 데이터를 분석하여 적절한 피드백을 제공한다. 인공지능 면접이 일반화 되고 있는 이 즈음에 면접자들이 인터뷰 준비를 하는데 도움을 줄 수 있는 시스템으로 기대된다.
-
최근 다양한 사회적 요인으로 인해 증간하는 성범죄는 심각한 사회 문제로 대두되고 있다. 이에 본 연구는 서울시 성범죄 발생 건수를 다중회귀분석을 통해 예측하고 예측값과 실제 발생 건수 간의 차이를 분석하여 서울시 행정구역별 맞춤형 치안 강화 방안을 제안한다. 이는 이는 성범죄 발생 이전에 통제가능한 환경 요인을 제어하는 데 기여할 수 있는 기초 자료를 제공하는 데 의의가 있다.
-
초고령사회에 진입하고 있는 대한민국에게 노인 일자리 사업은 중요한 복지정책이다. 늘어나는 노인 일자리 수요에 따라 적절한 일자리 공급을 위해 노인 일자리 사업 참여자 수를 예측하는 것이 필요하다. 따라서 본 연구에서는 인구학적 특성을 반영한 성별 및 연령별 노인일자리 참여자 예측 모델을 제안하고, 강서구의 높은 노인 인구와 복지 수요를 반영하여 기존 복지기관에 기반한 통합 일자리센터 입지 선정을 진행하고자 한다. 예측 모델을 활용하여 일자리 센터가 위치하기에 적합한 행정동을 선별 후 교통 접근성을 지표로 분석해 최적의 일자리 센터를 제시했다. 본 예측모델을 활용하여 입지선정뿐만이 아니라 노인사업의 기획 및 운영에 도움이 될 것이라 기대된다.
-
인공지능(AI) 기술의 발달과 함께 챗봇은 다양한 산업 분야의 필수 서비스 요소이다. 그러나 국내 챗봇의 언어가 대부분 한국어 서비스에 국한돼 글로벌 확장성에 한계가 있다. 본 연구는 다양한 나라의 언어로 실시간 번역을 하는 외국인 학생을 위한 대학교 입학안내 챗봇 제작을 제안하는 것을 목표로 한다. 이를 위해 사용자 관점에서 기존 입학안내 챗봇을 분석하였으며, 분석 결과를 바탕으로 외국어 사용자 친화적인 챗봇 제작을 제안한다.
-
본 논문에서는 대학교의 외국인 유학생들을 위한 챗봇 시스템 개발을 다룬다. 글로벌화된 현대 사회에서 많은 유학생들이 한국의 대학으로 진학하고 있으나, 이들이 학교 생활과 문화에 적응하는 과정에서 정보 부족이 큰 문제로 대두되고 있다. 기존에 영어로 제공되는 대학 정보만으로는 외국인 유학생들이 학교에 대한 세부 정보를 충분히 얻기 어려운 것이다. 이에 본 연구는 외국인 유학생을 위한 대학 소개 챗봇을 개발을 제안하였다. 해당 챗봇은 룰 기반 시나리오 방식과 자연어 이해 기술을 혼합하여, 유학생들이 학교 소개, 설립 정신, 핵심 가치, 다국어 지원 웹사이트 등에 대한 정보를 쉽게 탐색할 수 있도록 설계되었다.
-
국내 외국인 유학생의 수는 점점 증가하는 추세이나 국내 대학 공식 홈페이지의 외국어 서비스의 제공은 미비하다. 외국인 유학생들을 위한 외국어 서비스를 지원하는 교내 홈페이지, 어플리케이션, 챗봇이 부실하여 외국인 유학생들은 신뢰성있는 정보 습득에 어려움을 겪고 있는 것이다. 이에 본 연구에서는 외국인 유학생을 위한 국내 대학교 입학안내 챗봇 개발을 제안한다. 닫힌 구조 대화를 이용하여 대학교 입학안내 페이지의 챗봇 플로우차트를 제시하여 현재 제공하고 있는 정보의 챗봇화 가능성을 살펴보고, 외국인 유학생을 위한 챗봇 도입 방법을 제안한다.
-
본 연구에서는 색채 심리학 기반 음악 추천 시스템을 제안한다. 제안하는 시스템에서는 먼저, 사용자에게 원하는 색상을 선택하도록 요청하며 사용자가 선택한 색상 정보로부터 사용자의 감정상태를 예측한다. 그다음 양방향 장단기 메모리 모델을 통해 현재 음원 서비스의 상위권 음악들의 앨범 설명으로부터, 각 음악을 들었을 때 불러일으킬 감정을 예측해 음악들을 분류한다. 그리고 앞서 색상 정보로부터 예측한 감정 상태에 대응되는 음악들을 사용자에게 추천한다. 또한 음악 내 사용자가 선호하는 BPM(Beats Per Minute) 구간을 고려해, 보다 사용자 맞춤형으로 음악을 추천할 수 있는 방법을 제안한다. 파이썬(Python)을 활용해 제안하는 시스템을 구현했으며, 음원 서비스 멜론(Melon)에서 음악 장르별 상위 50 곡의 데이터를 수집 및 활용해 구현한 시스템을 검증했다.