통합 검색 | Korea Science

ChatGPT 기반 한국어 Vision-Language Pre-training을 위한 고품질 멀티모달 데이터셋 구축 방법론 (High-Quality Multimodal Dataset Construction Methodology for ChatGPT-Based Korean Vision-Language Pre-training)

성진;한승헌;신종훈;임수종;권오욱
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
- /
- pp.603-608
- /
- 2023
본 연구는 한국어 Vision-Language Pre-training 모델 학습을 위한 대규모 시각-언어 멀티모달 데이터셋 구축에 대한 필요성을 연구한다. 현재, 한국어 시각-언어 멀티모달 데이터셋은 부족하며, 양질의 데이터 획득이 어려운 상황이다. 따라서, 본 연구에서는 기계 번역을 활용하여 외국어(영문) 시각-언어 데이터를 한국어로 번역하고 이를 기반으로 생성형 AI를 활용한 데이터셋 구축 방법론을 제안한다. 우리는 다양한 캡션 생성 방법 중, ChatGPT를 활용하여 자연스럽고 고품질의 한국어 캡션을 자동으로 생성하기 위한 새로운 방법을 제안한다. 이를 통해 기존의 기계 번역 방법보다 더 나은 캡션 품질을 보장할 수 있으며, 여러가지 번역 결과를 앙상블하여 멀티모달 데이터셋을 효과적으로 구축하는데 활용한다. 뿐만 아니라, 본 연구에서는 의미론적 유사도 기반 평가 방식인 캡션 투영 일치도(Caption Projection Consistency) 소개하고, 다양한 번역 시스템 간의 영-한 캡션 투영 성능을 비교하며 이를 평가하는 기준을 제시한다. 최종적으로, 본 연구는 ChatGPT를 이용한 한국어 멀티모달 이미지-텍스트 멀티모달 데이터셋 구축을 위한 새로운 방법론을 제시하며, 대표적인 기계 번역기들보다 우수한 영한 캡션 투영 성능을 증명한다. 이를 통해, 우리의 연구는 부족한 High-Quality 한국어 데이터 셋을 자동으로 대량 구축할 수 있는 방향을 보여주며, 이 방법을 통해 딥러닝 기반 한국어 Vision-Language Pre-training 모델의 성능 향상에 기여할 것으로 기대한다.
PDF

프로세스 마이닝과 리엔지니어링을 위한 제어경로 기반 프로세스 그룹 발견 프레임워크와 실험적 검증 (Control-Path Driven Process-Group Discovery Framework and its Experimental Validation for Process Mining and Reengineering)

응웬 탄 하이;김광훈
- 인터넷정보학회논문지
- /
- 제24권5호
- /
- pp.51-66
- /
- 2023
본 논문에서는 비즈니스 프로세스 모델의 생명주기관리를 지원하는 대표적인 지식발견기술인 프로세스 마이닝과 지식개선기술인 프로세스 리엔지니어링 접근방법을 기반으로 하는 새로운 유형의 프로세스 발견 프레임워크를 제안한다. 또한, 제안된 프레임워크를 기반으로 하는 프로세스 마이닝 시스템을 개발하고, 이를 통한 실험적 검증을 수행한다. 실험적 효과검증에 적용된 프로세스 실행 이벤트 로그를 특별히 프로세스 빅-로그(Process BIG-Logs)라고 정의하고, 분산 비즈니스 프로세스 관리 시스템의 로깅메커니즘과 연계된 조각-실행로그이력들을 클러스터링하는 전처리과정을 거친 마이닝의 입력데이터세트로 활용한다. 결과적으로, 본 논문에서는 구조적 정보제어넷기반 프로세스 마이닝 알고리즘인 ρ-알고리즘을 개선한 제어경로기반 프로세스 그룹 발견 알고리즘과 프레임워크를 설계 및 구현하고, 구현된 시스템을 이용하여 제안한 알고리즘과 프레임워크의 정확성을 실험적으로 검증한다.
https://doi.org/10.7472/jksii.2023.24.5.51 인용 PDF

지능형 교량 안전성 예측 엣지 시스템 (Intelligent Bridge Safety Prediction Edge System)

박진효;이태진;홍용근;윤주상
- 정보처리학회논문지:컴퓨터 및 통신 시스템
- /
- 제12권12호
- /
- pp.357-362
- /
- 2023
교량은 중요한 교통 인프라지만 다양한 환경적 요인과 지속적인 교통 부하로 손상 및 균열을 겪게 되며, 이러한 요인들은 교량의 노후화를 가속화시킨다. 현재 건설한 지 오래된 교량이 많아지면서 안전성을 보장하고 노후화를 진단하기 위한 시스템의 필요성이 대두되고 있다. 이미 교량에서는 실시간 또는 주기적으로 교량의 상태를 모니터링하기 위해 구조물 건전도 모니터링(SHM) 기술이 활용되고 있다. 이 기술과 함께 인공지능과 사물인터넷 기술을 활용한 지능형 교량 모니터링 기술 개발이 진행 중이다. 본 논문에서는 노후화된 교량의 유지관리를 위해 고속 푸리에 변환과 차원 축소 알고리즘을 활용한 교량 안전성을 예측 엣지 시스템 기법을 연구한다. 특히, 기존 연구와는 다르게 실제 교량에서 수집된 센서 데이터를 이용하여 데이터셋을 형성하고 교량의 안전성을 확인할 수 있는지 알아본다.
https://doi.org/10.3745/KTCCS.2023.12.12.357 인용 PDF

머신러닝을 이용한 지하철 고장 탐지 및 예측 (Detection and Prediction of Subway Failure using Machine Learning)

성국경
- 산업과 과학
- /
- 제2권4호
- /
- pp.11-16
- /
- 2023
지하철은 현대 도시의 교통 체계에서 중요한 역할을 하는 대중 교통 수단이다. 하지만, 갑작스런 고장 및 시스템 불통 등의 이유로 혼잡을 야기시키는 경우가 종종 발생하여 불편을 초래하고 있다. 따라서, 본 논문에서는 지하철 시스템의 효율적 운영을 위해 머신러닝을 활용한 고장 예측 및 예방 연구를 진행하였다. UC Irvine의 MetroPT-3 데이터셋을 활용하고, 로지스틱 회귀를 이용하여 지하철 고장 예측 모델을 구축하였다. 모델은 0.991의 높은 정확도로 비고장 상태를 예측하나, 정밀도와 재현율은 상대적으로 낮아 고장 예측에 있어 오류 가능성을 시사하고 있다. ROC_AUC 값이 0.901로, 모델이 무작위 추측보다 뛰어난 분류를 할 수 있다. 구축한 모델은 지하철 시스템의 안정적인 운영 운영에 유용하나, 성능 개선을 위한 추가 연구가 필요하다고 생각한다. 따라서 학습 데이터가 많고 데이터의 정제가 잘 이루어진다면 고장 예측을 통해 사전 점검을 하여 예방할 수 있다.
https://doi.org/10.23153/AI-Science.2023.2.4.011 인용 PDF

멀티모달 방식을 통한 가스 종류 인식 딥러닝 모델 개발 (Development of Gas Type Identification Deep-learning Model through Multimodal Method)

안서희;김경영;김동주
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제12권12호
- /
- pp.525-534
- /
- 2023
가스 누출 감지 시스템은 가스의 폭발성과 독성으로 인한 인명 피해를 최소화할 핵심적인 장치이다. 누출 감지 시스템은 대부분 단일 센서를 활용한 방식으로, 가스 센서나 열화상 카메라를 통한 검출 방식으로 진행되고 있다. 이러한 단일 센서 활용의 가스 누출감지 시스템 성능을 고도화하기 위하여, 본 연구에서는 가스 센서와 열화상 이미지 데이터에 멀티모달형 딥러닝을 적용한 연구를 소개한다. 멀티모달 공인 데이터셋인 MultimodalGasData를 통해 기존 논문과의 성능을 비교하였고, 가스 센서와 열화상 카메라의 단일모달 모델을 기반하여 네 가지 멀티모달 모델을 설계 및 학습하였다. 이를 통해 가스 센서와 열화상 카메라는 각각 1D CNN, GasNet 모델이 96.3%와 96.4%의 가장 높은 성능을 보였다. 앞선 두 단일모달 모델을 기반한 Early Fusion 형식의 멀티모달 모델 성능은 99.3%로 가장 높았으며, 또한 기존 논문의 멀티모달 모델 대비 3.3% 높았다. 본 연구의 높은 신뢰성을 갖춘 가스 누출 감지 시스템을 통해 가스 누출로 인한 추가적인 피해가 최소화되길 기대한다.
https://doi.org/10.3745/KTSDE.2023.12.12.525 인용 PDF

개선된 Deep Feature Reconstruction : 다중 스케일 특징의 보존을 통한 텍스쳐 결함 감지 및 분할 (Enhanced Deep Feature Reconstruction : Texture Defect Detection and Segmentation through Preservation of Multi-scale Features)

시종욱;김성영
- 한국정보전자통신기술학회논문지
- /
- 제16권6호
- /
- pp.369-377
- /
- 2023
산업 제조 분야에서 품질 관리는 불량률을 최소화하는 핵심 요소로, 미흡한 관리는 추가적인 비용 발생과 생산 지연을 야기할 수 있다. 본 연구는 제조품의 텍스쳐 결함 감지의 중요성을 중심으로, 보다 정밀한 결함 감지 방법을 제시한다. DFR(Deep Feature Reconstruction) 모델은 특징맵의 조합 및 재구성을 통한 접근법을 채택하였지만, 그 방식에는 한계가 있었다. 이에 따라, 우리는 제한점을 극복하기 위해 통계적 방법론을 활용한 새로운 손실 함수와 스킵 연결구조를 통합하고 파라미터 튜닝을 진행하였다. 이 개선된 모델을 MVTec-AD 데이터세트의 텍스쳐 카테고리에 적용한 결과, 기존 방식보다 2.3% 높은 결함 분할 AUC를 기록하였고, 전체적인 결함 감지 성능도 향상되었다. 이 결과는 제안하는 방법이 특징맵 조합의 재건축을 통한 결함 탐지에 있어서 중요한 기여함을 입증한다.
https://doi.org/10.17661/jkiiect.2023.16.6.369 인용 PDF HTML

코드패치 및 하이브리드 분석 환경을 활용한 악성코드 데이터셋 추출 프레임워크 설계 (Framework Design for Malware Dataset Extraction Using Code Patches in a Hybrid Analysis Environment)

최기상;최상훈;박기웅
- 정보보호학회논문지
- /
- 제34권3호
- /
- pp.403-416
- /
- 2024
악성코드는 금전적인 목적에 의하여 서비스의 한 형태로 블랙마켓에 판매되고 있다. 판매에 따른 수요가 증가함에 따라 악성코드를 통한 공격이 확장되었다. 이에 대응하기 위해 인공지능을 활용한 탐지 및 분류 연구들이 등장하였지만, 공격자들은 분석을 방지하고자 다양한 안티 분석기술을 악성코드에 적용하고 있다. 본 논문에서는 안티 분석 기술이 적용된 악성코드들로부터 데이터셋을 확보하기 위해 하이브리드형 바이너리 분석 프레임워크 Malware Analysis with Dynamic Extraction(MADE)을 제안한다. MADE 프레임워크는 Anti-VM, Anti-Debugging이 적재된 바이너리를 포함하여 자동화된 동적 분석을 수행할 수 있다. MADE 프레임워크는 Anti-Analysis 기술이 적용된 다양한 악성코드들에 대해 90% 이상 우회가 가능하며, API 호출 정보를 포함한 데이터셋 추출이 가능함을 실험을 통해 검증하였다.
https://doi.org/10.13089/JKIISC.2024.34.3.403 인용 PDF HTML

Edge Computing Model based on Federated Learning for COVID-19 Clinical Outcome Prediction in the 5G Era

Ruochen Huang;Zhiyuan Wei;Wei Feng;Yong Li;Changwei Zhang;Chen Qiu;Mingkai Chen
- KSII Transactions on Internet and Information Systems (TIIS)
- /
- 제18권4호
- /
- pp.826-842
- /
- 2024
As 5G and AI continue to develop, there has been a significant surge in the healthcare industry. The COVID-19 pandemic has posed immense challenges to the global health system. This study proposes an FL-supported edge computing model based on federated learning (FL) for predicting clinical outcomes of COVID-19 patients during hospitalization. The model aims to address the challenges posed by the pandemic, such as the need for sophisticated predictive models, privacy concerns, and the non-IID nature of COVID-19 data. The model utilizes the FATE framework, known for its privacy-preserving technologies, to enhance predictive precision while ensuring data privacy and effectively managing data heterogeneity. The model's ability to generalize across diverse datasets and its adaptability in real-world clinical settings are highlighted by the use of SHAP values, which streamline the training process by identifying influential features, thus reducing computational overhead without compromising predictive precision. The study demonstrates that the proposed model achieves comparable precision to specific machine learning models when dataset sizes are identical and surpasses traditional models when larger training data volumes are employed. The model's performance is further improved when trained on datasets from diverse nodes, leading to superior generalization and overall performance, especially in scenarios with insufficient node features. The integration of FL with edge computing contributes significantly to the reliable prediction of COVID-19 patient outcomes with greater privacy. The research contributes to healthcare technology by providing a practical solution for early intervention and personalized treatment plans, leading to improved patient outcomes and efficient resource allocation during public health crises.
https://doi.org/10.3837/tiis.2024.04.001 인용 PDF HTML

소프트 보팅을 이용한 합성곱 오토인코더 기반 스트레스 탐지 (Convolutional Autoencoder based Stress Detection using Soft Voting)

최은빈;김수형
- 스마트미디어저널
- /
- 제12권11호
- /
- pp.1-9
- /
- 2023
스트레스는 감당하기 어려운 외부 또는 내부 요인으로부터 유발되는 것으로 현대 사회의 주요한 문제 중 하나이다. 높은 스트레스가 장기적으로 지속되면 만성적으로 발전할 수 있으며, 건강 및 생활 전반에 큰 악영향을 초래할 수 있다. 그러나 만성적인 스트레스를 겪는 사람들은 자신이 스트레스를 받고 있는지 알아차리기 어렵기 때문에 사전에 스트레스를 인지하고 관리하는 것이 중요하다. 웨어러블 기기로부터 측정된 생체 신호를 이용하여 스트레스를 탐지한다면, 스트레스를 효율적으로 관리할 수 있을 것이다. 그러나 생체 신호를 이용하는 데에는 두 가지 문제점이 있다. 첫째로 생체 신호에서 수작업 특징을 추출하는 것은 바이어스를 발생시킬 수 있으며, 두 번째는 실험 주체에 따라 분류 모델 성능의 변이가 클 수 있다는 것이다. 본 논문에서는 데이터의 핵심적인 특징을 표현할 수 있는 합성곱 오토인코더를 이용해 바이어스를 줄이고 앙상블 학습 중 하나인 소프트 보팅을 이용해 일반화 능력을 높여 성능의 변이를 줄이는 모델을 제안한다. 모델의 일반화 성능을 확인하기 위하여 LOSO 교차 검증 방법을 이용하여 성능을 평가한다. 본 논문에서 제안한 모델은 WESAD 데이터셋을 이용하여 높은 성능을 보여주었던 기존의 연구들보다 우수한 정확도를 보임을 확인하였다.
PDF

3D 프린팅 소재 화학물질의 독성 예측을 위한 Data-centric XAI 기반 분자 구조 Data Imputation과 QSAR 모델 개발 (Data-centric XAI-driven Data Imputation of Molecular Structure and QSAR Model for Toxicity Prediction of 3D Printing Chemicals)

정찬혁;김상윤;허성구;;신민혁;유창규
- Korean Chemical Engineering Research
- /
- 제61권4호
- /
- pp.523-541
- /
- 2023
3D 프린터의 활용이 높아짐에 따라 발생하는 화학물질에 대한 노출 빈도가 증가하고 있다. 그러나 3D 프린팅 발생 화학물질의 독성 및 유해성에 대한 연구는 미비하며, 분자 구조 데이터의 결측치로 인해 in silico 기법을 사용한 독성예측 연구는 저조한 실정이다. 본 연구에서는 화학물질의 분자구조 정보를 나타내는 주요 분자표현자의 결측치를 보간하여 3D 프린팅의 독성 및 유해성을 예측한 Data-centric QSAR 모델을 개발하였다. 먼저 MissForest 알고리즘을 사용해 3D 프린팅으로 발생되는 유해물질의 분자표현자 결측치를 보완하였으며, 서로 다른 4가지 기계학습 모델(결정트리, 랜덤포레스트, XGBoost, SVM)을 기반으로 Data-centric QSAR 모델을 개발하여 생물 농축 계수(Log BCF)와 옥탄올-공기분배계수(Log Koa), 분배계수(Log P)를 예측하였다. 또한, 설명 가능한 인공지능(XAI) 방법론 중 TreeSHAP (SHapley Additive exPlanations) 기법을 활용하여 Data-centric QSAR 모델의 신뢰성을 입증하였다. MissForest 알고리즘 기반 결측지 보간 기법은, 기존 분자구조 데이터에 비하여 약 2.5배 많은 분자구조 데이터를 확보할 수 있었다. 이를 바탕으로 개발된 Data-centric QSAR 모델의 성능은 Log BCF, Log Koa와 Log P를 각각 73%, 76%, 92% 의 예측 성능으로 예측할 수 있었다. 마지막으로 Tree-SHAP 분석결과 개발된 Data-centric QSAR 모델은 각 독성치와 물리적으로 상관성이 높은 분자표현자를 통하여 선택함을 설명할 수 있었고 독성 정보에 대한 높은 예측 성능을 확보할 수 있었다. 본 연구에서 개발한 방법론은 다른 프린팅 소재나 화학공정, 그리고 반도체/디스플레이 공정에서 발생 가능한 오염물질의 독성 및 인체 위해성 평가에 활용될 수 있을 것으로 사료된다.
https://doi.org/10.9713/kcer.2023.61.4.523 인용 PDF

검색결과 237건 처리시간 0.021초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)