통합 검색 | Korea Science

결측값 대체를 위한 데이터 재현 기법 비교 (Comparison of Data Reconstruction Methods for Missing Value Imputation)

김청호;강기훈
- 문화기술의 융합
- /
- 제10권1호
- /
- pp.603-608
- /
- 2024
무응답 및 결측값은 표본 탈락, 설문조사에 대한 답변 회피 등으로 발생하며 정보의 손실 및 편향된 추론의 가능성이 있는 문제가 발생하게 되며, 이 경우 결측값을 적절한 값으로 바꾸는 대체가 필요하게 된다. 본 논문에서는 결측값에 대한 대체 방법으로 제안되었던 평균 대체, 다중회귀 대체, 랜덤 포레스트 대체, K-최근접 이웃 대체, 그리고 딥러닝을 기본으로 한 오토인코더 대체와 잡음제거 오토인코더 대체 방법을 비교한다. 결측값을 대체하는 이러한 방법들에 대해 설명하고, 연속형의 모의실험 데이터와 실제 데이터에 접목시켜 각 방법들을 비교하였다. 비교 결과 대부분의 경우에서 다중 대체 방법인 랜덤 포레스트 대체 방법과 잡음제거 오토인코더 대체 방법의 성능이 좋았음을 확인하였다.
https://doi.org/10.17703/JCCT.2024.10.1.603 인용 PDF

CAPTCHA에 사용되는 숫자데이터를 자동으로 판독하기 위한 Autoencoder 모델들의 특성 연구 (A Study on the Characteristics of a series of Autoencoder for Recognizing Numbers used in CAPTCHA)

전재승;문종섭
- 인터넷정보학회논문지
- /
- 제18권6호
- /
- pp.25-34
- /
- 2017
오토인코더(Autoencoder)는 입력 계층과 출력 계층이 동일한 딥러닝의 일종으로 은닉 계층의 제약 조건을 이용하여 입력 벡터의 특징을 효과적으로 추출하고 복원한다. 본 논문에서는 CAPTCHA 이미지 중 하나의 숫자와 자연배경이 혼재된 영역을 대상으로 일련의 다양한 오토인코더 모델들을 적용하여 잡음인 자연배경을 제거하고 숫자 이미지만을 복원하는 방법들을 제시한다. 제시하는 복원 이미지의 적합성은 오토인코더의 출력을 입력으로 하는 소프트맥스 함수를 활성화 함수로 사용하여 검증하고, CAPTCHA 정보를 자동으로 획득하는 다른 방법들과 비교하여, 본 논문에서 제시하는 방법의 우수함을 검증하였다.
https://doi.org/10.7472/jksii.2017.18.6.25 인용 PDF KSCI

비지도 학습 기반의 임베딩과 오토인코더를 사용한 침입 탐지 방법 (Intrusion Detection Method Using Unsupervised Learning-Based Embedding and Autoencoder)

이준우;김강석
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제12권8호
- /
- pp.355-364
- /
- 2023
최근 지능화된 사이버 위협이 지속적으로 증가함에 따라 기존의 패턴 혹은 시그니처 기반의 침입 탐지 방식은 새로운 유형의 사이버 공격을 탐지하는데 어려움이 있다. 따라서 데이터 학습 기반 인공지능 기술을 적용한 이상 징후 탐지 방법에 관한 연구가 증가하고 있다. 또한 지도학습 기반 이상 탐지 방식은 학습을 위해 레이블 된 이용 가능한 충분한 데이터를 필요로 하기 때문에 실제 환경에서 사용하기에는 어려움이 있다. 최근에는 정상 데이터로 학습하고 데이터 자체에서 패턴을 찾아 이상 징후를 탐지하는 비지도 학습 기반의 방법에 대한 연구가 활발히 진행되고 있다. 그러므로 본 연구는 시퀀스 로그 데이터로부터 유용한 시퀀스 정보를 보존하는 잠재 벡터(Latent Vector)를 추출하고, 추출된 잠재 벡터를 사용하여 이상 탐지 학습 모델을 개발하는데 있다. 각 시퀀스의 특성들에 대응하는 밀집 벡터 표현을 생성하기 위하여 Word2Vec을 사용하였으며, 밀집 벡터로 표현된 시퀀스 데이터로부터 잠재 벡터를 추출하기 위하여 비지도 방식의 오토인코더(Autoencoder)를 사용하였다. 개발된 오토인코더 모델은 시퀀스 데이터에 적합한 순환신경망 GRU(Gated Recurrent Unit) 기반의 잡음 제거 오토인코더, GRU 네트워크의 제한적인 단기 기억문제를 해결하기 위한 1차원 합성곱 신경망 기반의 오토인코더 및 GRU와 1차원 합성곱을 결합한 오토인코더를 사용하였다. 실험에 사용된 데이터는 시계열 기반의 NGIDS(Next Generation IDS Dataset) 데이터이며, 실험 결과 GRU 기반의 오토인코더나, 1차원 합성곱 기반의 오토인코더를 사용한 모델보다 GRU와 1차원 합성곱을 결합한 오토인코더가 훈련 데이터로부터 유용한 잠재 패턴을 추출하기 위한 학습 시간적 측면에서 효율적이었고 이상 탐지 성능 변동의 폭이 더 작은 안정된 성능을 보였다.
https://doi.org/10.3745/KTSDE.2023.12.8.355 인용 PDF

비프로파일링 기반 전력 분석의 성능 향상을 위한 오토인코더 기반 잡음 제거 기술 (Improving Non-Profiled Side-Channel Analysis Using Auto-Encoder Based Noise Reduction Preprocessing)

권동근;진성현;김희석;홍석희
- 정보보호학회논문지
- /
- 제29권3호
- /
- pp.491-501
- /
- 2019
최근 보안 디바이스의 물리적 취약성을 찾을 수 있는 부채널 분석 분야에서 딥러닝을 활용한 연구가 활발히 진행되고 있다. 하지만, 최신 딥러닝 기반 부채널 분석 기술 연구는 템플릿 공격 등과 같은 프로파일링 기반 부채널 분석 환경에서 파형을 옳게 분류하기 위한 연구에 집중되어 있다. 본 논문에서는 이전 연구들과 다르게 딥러닝을 신호 전처리 기법으로 활용하여 차분 전력 분석, 상관 전력 분석 등과 같은 논프로파일링 기반 부채널 분석의 성능을 고도화할 수 있는 방법을 제안한다. 제안기법은 오토인코더를 부채널 분석 환경에 적합하게 변경하여 부채널 정보의 노이즈를 제거하는 전처리 기법으로, 기존 노이즈 제거 오토인코더는 임의로 추가한 노이즈에 대한 학습을 하였다면 제안하는 기법은 노이즈가 제거된 라벨을 사용하여 실제 데이터의 노이즈를 학습한다. 제안기법은 논프로파일링 환경에서 수행 가능한 전처리 기법이며 하나의 뉴런 네트워크의 학습만을 통해 수행할 수 있다. 본 논문에서는 실험을 통해 제안기법의 노이즈 제거 성능을 입증하였으며, 주성분분석 및 선형판별분석과 같은 기존 전처리 기법들과 비교하여 우수하다는 것을 보인다.
https://doi.org/10.13089/JKIISC.2019.29.3.491 인용 PDF KSCI HTML

심층 학습을 이용한 물리탐사 자료 잡음 제거 기술 소개 (Introduction to Geophysical Exploration Data Denoising using Deep Learning)

;조아현;유희은;정인석;송서영;조성오;김빛나래;남명진
- 지구물리와물리탐사
- /
- 제23권3호
- /
- pp.117-130
- /
- 2020
지구물리탐사 자료의 잡음은 물리탐사 자료를 왜곡시켜 잘못된 결과 해석을 유도한다. 잡음을 만들어내는 원인으로는 인간의 활동으로 인하며 만들어지는 잡음과 자연 현상 및 기기 소음 등이 있으며 이러한 잡음을 제거하기 위한 다양한 연구들이 진행되고 있다. 하지만, 전통적인 잡음제거 방법들은 요소파 변환이나 필터링 과정에서 개인의 주관과 높은 계산 비용 그리고 많은 시간이 소모된다는 단점이 있으며 이런 문제를 해결하기 위해 영상 전처리 및 잡음제거를 위한 개선된 신경망을 구현하고자 하였다. 이 연구는 인공신경망, 합성곱 신경망, 오토인코더, 잔차 및 파형신경망의 다양한 유형의 신경망과 탄성파, 시간영역 전자탐사, 지표투과레이더 및 자기지전류의 잡음을 분석하고, 훈련 과정에 실제로 이용한 인공 신경망과 제시된 핵심 해결책을 분석 정리하였다. 이러한 분석을 통해 개선된 신경망이 지구물리탐사 자료의 잡음제거에 유용한 기법임을 알 수 있었다.
https://doi.org/10.7582/GGE.2020.23.3.00117 인용 PDF KSCI

웨이블릿 변환과 기계 학습 접근법을 이용한 수위 데이터의 노이즈 제거 비교 분석 (Comparative analysis of wavelet transform and machine learning approaches for noise reduction in water level data)

황유관;임경재;김종건;신민환;박윤식;신용철;지봉준
- 한국수자원학회논문집
- /
- 제57권3호
- /
- pp.209-223
- /
- 2024
4차 산업혁명 시대에 접어들어 데이터 기반의 의사결정이 보편화되고 있다. 하지만 데이터 품질이 확보되지 않은 채 수행되는 데이터 분석은 왜곡된 결과를 낳을 가능성이 존재한다. 수자원 관리의 기초가 되는 수위 데이터도 마찬가지로 결측, 스파이크, 잡음 등 다양한 품질 문제를 가진다. 본 연구에서는 잡음으로 인해 발생하는 데이터 품질 문제를 해결하고자 하였다. 잡음은 데이터의 트렌드 분석을 어렵게 하고 비정상적인 이상치를 생성할 가능성이 있다. 본 연구는 이러한 문제를 해결하기 위해 Wavelet Transform을 이용한 잡음 제거 접근 방안을 제안한다. Wavelet Transform은 신호처리에 주로 사용되는 방법으로 잡음 제거에 효과적인 것으로 알려져 있으며 수집된 데이터의 정답 데이터(True value) 수집을 요구하지 않으므로 시간과 비용을 줄일 수 있다는 점에서 적용이 용이한 편이다. 본 연구는 Wavelet Transform의 성능 평가를 위해 대표적인 머신러닝 기반 잡음 제거 방법인 Denoising Autoencoder와 성능 비교를 수행하였다. 그 결과 Wavelet Transform 중 Coiflets 함수는, Denoising Autoencoder에 비해 Mean Absolute Error, Mean Absolute Percentage Error, Mean Squared Error 등 모든 측면에서 우수한 성능을 보이는 것으로 나타났다. 이러한 결과는 환경에 맞는 적절한 웨이블릿 함수의 선택을 통한 잡음 문제를 효과적으로 해결할 수 있음을 시사한다. 본 연구는 수위 데이터의 품질을 향상시켜 수자원 관리 결정의 신뢰성에 기여하는 강력한 도구로서 Wavelet Transform의 잠재력을 확인한 의의가 있다.
https://doi.org/10.3741/JKWRA.2024.57.3.209 인용 PDF

스마트팜 개별 전기기기의 비간섭적 부하 식별 데이터 처리 및 분석 (Data Processing and Analysis of Non-Intrusive Electrical Appliances Load Monitoring in Smart Farm)

김홍수;김호찬;강민제;좌정우
- 전기전자학회논문지
- /
- 제24권2호
- /
- pp.632-637
- /
- 2020
비간섭적 개별 전기 기기 부하 식별(NILM)은 단일 미터기에서 측정한 총 소비 전력을 사용하여 가정이나 회사에서 개별 전기 기기의 소비 전력과 사용 시간을 효율적으로 모니터링할 수 있는 방법이다. 본 논문에서는 스마트팜의 소비 전력 데이터 취득 시스템에서 LTE 모뎀을 통해 서버로 수집된 총 소비 전력량, 개별 전기 기기의 전력량을 HDF5 형태로 변환하고 NILM 분석을 수행하였다. NILM 분석은 오픈소스를 사용하여 잡음제거 오토인코더(Denoising Autoencoder), 장단기 메모리(Long Short-Term Memory), 게이트 순환 유닛(Gated Recurrent Unit), 시퀀스-투-포인트(sequence-to-point) 학습 방법을 사용하였다.
https://doi.org/10.7471/ikeee.2020.24.2.632 인용 PDF KSCI

돌연변이 연산 기반 효율적 심층 신경망 모델 (A Deep Neural Network Model Based on a Mutation Operator)

전승호;문종섭
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제6권12호
- /
- pp.573-580
- /
- 2017
심층 신경망은 많은 노드의 층을 쌓아 만든 거대한 신경망이다. 심층 신경망으로 대표되는 딥 러닝은 오늘날 많은 응용 분야에서 괄목할만한 성과를 거두고 있다. 하지만 다년간의 연구를 통해 심층 신경망에 대한 다양한 문제점이 식별되고 있다. 이 중 일반화는 가장 널리 알려진 문제점들 중 하나이며, 최근 연구 결과인 드롭아웃은 이러한 문제를 어느 정도 성공적으로 해결하였다. 드롭아웃은 노이즈와 같은 역할을 하여 신경망이 노이즈에 강건한 데이터 표현형을 학습할 수 있도록 하는데, 오토인코더와 관련된 연구에서 이러한 효과가 입증되었다. 하지만 드롭아웃은 빈번한 난수 연산과 확률연산으로 인해 신경망의 학습 시간이 길어지고, 신경망 각 계층의 데이터 분포가 크게 변화하여 작은 학습율을 사용해야하는 단점이 있다. 본 논문에서는 돌연변이 연산을 사용하여 비교적 적은 횟수의 연산으로 드롭아웃과 동등 이상의 성능을 나타내는 모델을 제시하고, 실험을 통하여 논문에서 제시한 방법이 드롭아웃 방식과 동등한 성능을 보임과 동시에 학습 시간 문제를 개선함을 보인다.
https://doi.org/10.3745/KTSDE.2017.6.12.573 인용 PDF KSCI

검색결과 8건 처리시간 0.022초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)