• 제목/요약/키워드: 오버 샘플링

검색결과 47건 처리시간 0.02초

딥러닝을 이용한 광학적 프린지 패턴의 생성 (Generation of optical fringe patterns using deep learning)

  • 강지원;김동욱;서영호
    • 한국정보통신학회논문지
    • /
    • 제24권12호
    • /
    • pp.1588-1594
    • /
    • 2020
  • 본 논문에서는 심층신경망(deep neural network, DNN)을 이용하여 디지털 홀로그램을 생성하는 신경망의 학습을 위한 데이터 균형 조정 방법에 대하여 논의 한다. 심층신경망은 딥러닝(deep learning, DL) 기술에 기반을 두고 있고, 생성형 적대적 네트워크(generative adversarial network, GAN)계열을 이용한다. 심층 신경망을 통하여 생성 하고자하는 홀로그램의 기본 단위인 프린지 패턴은 홀로그램 평면과 객체의 위치에 따라 데이터의 형태가 매우 다르다. 하지만 데이터의 분류 기준이 명확하지 않기 때문에 학습 데이터의 불균형이 생길 수 있다. 학습 데이터의 불균형은 곧 학습의 불안정 요소로 작용한다. 따라서 분류 기준이 명확하지 않은 데이터를 분류하고 균형을 맞추는 방법을 제시한다. 그리고 이를 통하여 학습이 안정화됨을 보인다.

검증데이터 기반의 차별화된 이상데이터 처리를 통한 데이터 불균형 해소 방법 (Resolving data imbalance through differentiated anomaly data processing based on verification data)

  • 황철현
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.179-190
    • /
    • 2022
  • 데이터 불균형은 한 분류의 데이터 수가 다른 분류에 비해 지나치게 크거나 작은 현상을 의미하며. 이로 인해 분류 알고리즘을 활용하는 기계학습에서 성능을 저하시키는 주요 요인으로 제기되고 있다. 데이터 불균형 문제 해결을 위해서 소수 분포 데이터를 증폭하는 다양한 오버 샘플링(Over Sampling) 방법들이 제안되고 있다. 이 가운데 SMOTE는 가장 대표적인 방법으로 소수 분포 데이터의 증폭 효과를 극대화하기 위해 데이터에 포함된 잡음을 제거(SMOTE-IPF)하거나, 경계선만을 강화(Borderline SMOTE) 시키는 다양한 방법들이 출현하였다. 이 논문은 소수분류 데이터를 증폭하는 전통적인 SMOTE 방법에서 이상데이터(Anomaly Data)에 대한 처리방법개선을 통해 궁극적으로 분류성능을 높이는 방법을 제안한다. 제안 방법은 실험을 통해 기존 방법에 비해 상대적으로 높은 분류성능을 일관성 있게 제시하였다.

Zinc 함수 여기신호를 이용한 분석-합성 구조의 초 저속 음성 부호화기 (A Very Low-Bit-Rate Analysis-by-Synthesis Speech Coder Using Zinc Function Excitation)

  • 서상원;김종학;이창환;정규혁;이인성
    • 한국음향학회지
    • /
    • 제25권6호
    • /
    • pp.282-290
    • /
    • 2006
  • 본 논문에서는 1.2 kbps 의 전송률을 가지는 초 저속 음성 부호화기를 위한 방법과 구조를 제안한다. ZFE-CELP (Zinc Function Excitation-Code Excited Linear Prediction) 음성 부호화기는 선형예측 분석 후, 추출된 잔여 신호가 유성음일 경우 Zinc Function을 이용하여 부호화하고, 무성음일 경우에는 CELP 구조를 이용하여 부호화한다. 또한 Super-frame (40ms) 의 영향으로 발생하는 하모닉의 불연속 문제를 해결하기 위해 오버 샘플링을 이용한 선형 위상 합성 기법을 이용하고 Zinc 함수의 정확한 표준파형을 추출하기 위하여 분석-합성 구조를 제안한다. 제안된 초 저속음성 부호화기의 성능을 2.4 kbps의 MELP (Multi Pulse Linear Prediction) 부호화기 및 1.9kbps의 ZFE-PWI (Zinc Function Excitation-Prototype Waveform Interpolation) 음성 부호화기와 비교하였다 제안된 부호화 방법은 19kbps ZFE-PWI 부호화기와 유사한 성능을 보이는 것을 확인하였다.

머신러닝 기법을 활용한 수입 수산물 통관검사결과 분류 모델 (A Classification Model for Customs Clearance Inspection Results of Imported Aquatic Products Using Machine Learning Techniques)

  • 엄지성;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제8권1호
    • /
    • pp.157-165
    • /
    • 2023
  • 수산물은 많은 국가의 주요한 단백질 공급원이며 소비가 증가하고 있다. 우리나라도 수산물 소비는 증가하는 반면 자급률은 낮아지고 있으며, 수산물의 수입량이 증가함에 따라 안전관리의 중요성이 높아지고 있다. 국내로 수입되는 수산물은 110여 개 국가로부터 수백 종에 이르며, 수입 수산물의 안전관리를 검사관의 경험에만 의존하는 것은 한계가 있다. 데이터를 기반으로 수입 수산물 통관검사 결과를 예측할 수 있는 모델을 개발하여 수입신고서가 제출되었을 때 수산물의 부적합 가능성을 판단하는 머신러닝 분류 모델을 생성한다. 수입수산물 통관검사 결과 부적합율은 1% 미만으로 매우 낮은 불균형 데이터이므로 이러한 특성을 보완할 수 있는 샘플링 방법을 비교 연구하였고, 분류결과를 해석할 수 있는 전처리 방법을 적용하였다. 여러 가지 머신러닝 기반의 분류모델 중에서 랜덤포레스트와 XGBoost가 좋은 성능을 보였다. 통관검사 결과 적합과 부적합을 모두 잘 예측하는 모델은 ADASYN과 원-핫 인코딩을 적용한 랜덤포레스트 기본 모델이며 정확도 99.88%, 정밀도 99.87%, 재현율 99.89%, AUC 99.88%이다. XGBoost는 오버샘플링과 인코딩 종류에 상관없이 모든 지표가 90%를 넘겨 가장 안정적인 모델이다.

DCT 계수 분포를 이용해 추출한 edge 방향성에 기반한 새로운 적응적 보간 기법 (New Adaptive Interpolation Based on Edge Direction extracted from the DCT Coefficient Distribution)

  • 김재훈;김기백;전광길;정제창
    • 방송공학회논문지
    • /
    • 제18권1호
    • /
    • pp.10-20
    • /
    • 2013
  • 현재 멀티미디어 장치와 사용자의 요구가 다양해짐에 따라 이를 충족시키기 위하여 이미지 크기는 장치에서 지원하는 해상도나 사용자의 요구에 맞게 조정되어야 한다. 이미지 보간 기법은 크게 공간 도메인과 주파수 도메인에서 수행 될 수 있다. 일반적으로 공간 도메인에서의 보간 방법은 주파수 도메인의 보간 기법에 비해 상대적으로 주관적인 화질 측면에서 좋은 성능을 나타내지만 오버 스무딩 현상으로 인해 객관적인 성능이 낮다. 반대로 주파수 도메인에서의 업샘플링 방법은 객관적인 화질 측면에서 좋은 성능을 나타내지만 블록 열화 현상이 나타나 주관적인 화질 측면 성능이 낮다. 주파수 도메인에서의 보간 기법은 블록 열화 현상 외에도 모든 블록에 대해 동일한 방법으로 고주파 성분을 채워 넣기 때문에 영상의 edge가 많은 부분에서 주관적인 화질 성능을 떨어뜨린다. 본 논문에서는 DCT 계수 분포를 이용해 분류된 edge 방향에 따라 공간 도메인과 주파수 도메인에서의 보간 기법을 적응적으로 사용하는 알고리듬을 제안한다. 제안하는 알고리듬은 두 도메인의 장점을 모두 가지고 있다. 실험 결과를 통해 제안하는 알고리듬이 주관적인 화질 측면의 성능 향상과 함께 객관적인 화질도 향상됨을 알 수 있다.

1/4-레이트 기법을 이용한 클록 데이터 복원 회로 (A Clock and Data Recovery Circuit using Quarter-Rate Technique)

  • 정일도;정항근
    • 대한전자공학회논문지SD
    • /
    • 제45권2호
    • /
    • pp.130-134
    • /
    • 2008
  • 본 논문에서는 1/4-레이트 기법을 사용한 클록 데이터 복원회로를 제안하였다. 제안한 클록 데이터 복원회로를 사용함에 따라 VCO의 발진 주파수를 낮추므로 고속 동작에 유리하다. 제안된 클록 데이터 복원회로는 기존 클록 데이터 복원회로 보다 낮은 지터 특성과 넓은 풀인(pull-in) 범위를 갖는다. 제안된 클록 데이터 복원회로는 1/4-레이트 뱅-뱅 형태의 오버샘플링 위상 검출기, 1/4-레이트 주파수 검출기, 2개의 전하펌프 회로와 저역 통과 필터 그리고 링 VCO회로로 구성되어 있다. 제안된 클록 데이터 복원회로는 $0.18{\mu}m$ 1P6M CMOS 공정으로 설계되었고, 칩 면적과 전력 소모는 $1{\times}1mm^2$, 98 mW 이다.

마이터 어택과 머신러닝을 이용한 UNSW-NB15 데이터셋 기반 유해 트래픽 분류 (Malicious Traffic Classification Using Mitre ATT&CK and Machine Learning Based on UNSW-NB15 Dataset)

  • 윤동현;구자환;원동호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권2호
    • /
    • pp.99-110
    • /
    • 2023
  • 본 연구는 현 보안 관제 시스템이 직면한 실시간 트래픽 탐지 문제를 해결하기 위해 사이버 위협 프레임워크인 마이터 어택과 머신러닝을 이용하여 유해 네트워크 트래픽을 분류하는 방안을 제안하였다. 마이터 어택 프레임워크에 네트워크 트래픽 데이터셋인 UNSW-NB15를 적용하여 라벨을 변환 후 희소 클래스 처리를 통해 최종 데이터셋을 생성하였다. 생성된 최종 데이터셋을 사용하여 부스팅 기반의 앙상블 모델을 학습시킨 후 이러한 앙상블 모델들이 다양한 성능 측정 지표로 어떻게 네트워크 트래픽을 분류하는지 평가하였다. 그 결과 F-1 스코어를 기준으로 평가하였을 때 희소 클래스 미처리한 XGBoost가 멀티 클래스 트래픽 환경에서 가장 우수함을 보였다. 학습하기 어려운 소수의 공격클래스까지 포함하여 마이터 어택라벨 변환 및 오버샘플링처리를 통한 머신러닝은 기존 연구 대비 차별점을 가지고 있으나, 기존 데이터셋과 마이터 어택 라벨 간의 변환 시 완벽하게 일치할 수 없는 점과 지나친 희소 클래스 존재로 인한 한계가 있음을 인지하였다. 그럼에도 불구하고 B-SMOTE를 적용한 Catboost는 0.9526의 분류 정확도를 달성하였고 이는 정상/비정상 네트워크 트래픽을 자동으로 탐지할 수 있을 것으로 보인다.