• 제목/요약/키워드: 데이터 샘플링

검색결과 511건 처리시간 0.027초

클래스 불균형 문제를 해결하기 위한 개선된 집중 샘플링 (Improved Focused Sampling for Class Imbalance Problem)

  • 김만선;양형정;김수형;챠위핑
    • 정보처리학회논문지B
    • /
    • 제14B권4호
    • /
    • pp.287-294
    • /
    • 2007
  • 실세계의 문제에서 많은 기계학습의 알고리즘들은 데이터의 클래스 불균형 문제에 어려움을 겪는다. 이러한 클래스 불균형 문제를 해결하기 위하여 데이터의 비율을 변경하거나 좀 더 나은 샘플링 전략으로 극복하려는 연구들이 제안되었다. 그러나 데이터의 비율을 변경하는 연구에서는 전체 데이터 분포의 특성을 고려하지 못하고, 샘플링 전략을 제안하는 연구에서는 여러 가지 제한 조건을 고려해야만 한다. 본 논문에서는 위의 두가지 방법의 장점을 모두 포함하는 개선된 집중 샘플링 방법을 제안한다. 제안된 방법에서는 클래스 불균형 문제를 해결하기 위해 학습에 유용한 데이터들을 샘플링하는데 스코어링에 기반한 데이터 분할 방법을 이용한다. 즉, 입력 데이터들에 대해 SOM(Self Organizing Map)의 학습 결과로 얻은 BMU(Best Matching Unit)와의 거리를 계산하고, 이 거리론 스코어라 한다. 측정된 스코어는 오름차순으로 정렬되며, 이 과정에서 입력 데이터의 분포가 재 표현되고, 재 표현된 분포는 전체 데이터의 특성을 대표하게 된다. 그 결과로 얻은 데이터들 중에서 유용하지 못한 데이터들에 대해 제거하는 과정을 수행하여 새로운 학습 데이터 셋을 얻는다. 새로운 학습 데이터 생성 과정에서는 재 표현된 분포의 결과를 두 구간(upper, lower)으로 분할하는데, 두 추간 사이의 데이터들은 유용하지 못한 패턴들로 간주되어 학습에 이용되지 않는다. 본 논문에서 제안한 방법은 클래스 불균형의 비율 감수 훈련 데이터의 크기 감소, 과적합의 방지 등 몇 가지 장점을 보인다. 제안한 방법으로 샘플링된 데이터에 kNN 을 적용하여, 분류 실험한 결과 심한 불균형이 있는 ecoli 데이터의 분류 성능이 최대 2.27배 향상되었다.

디지털 빔포밍을 위한 다차 샘플링 방법의 실험적 고찰 (Experimental Considration of Multi-order Sampling for Digital Beamforming)

  • 나병윤;정목근
    • 대한의용생체공학회:의공학회지
    • /
    • 제19권2호
    • /
    • pp.105-112
    • /
    • 1998
  • 본 논문에서는 RF초음파 신호의 포락선 검출을 위하여 제안된 다차 샘플링 방법의 성능을 실험데이터를 이용하여 Quadrature 샘플링 및 2차 샘플링 방법과 비교하였다. Quadrature 샘플링의 결과 영상과 비교해볼 때 2차 샘플링의 결과 영상은 많은 오차를 보이고 있다. 그러나 다차 샘플링 결과, 특히 5차 샘플링 결과는 매우 우수한 포락선 검출 결과를 보여주고 있다. 이러한 다차 샘플링 방법을 사용하면 보다 경제적이고 우수한 성능의 디지털 빔포밍 시스템의 구현이 가능하다.

  • PDF

대기 오염 감시 시스템에서의 센서 샘플링 주기 조정 기법 (The Sampling Interval Adjustment Technique of the Air Pollution Monitoring System)

  • 정영진;이양구;이동규;조금원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.892-895
    • /
    • 2010
  • 무선 기기의 소형화와 무선 통신 기술의 발달, 그리고 센서의 환경 정보 측정 기술 및 센서 네트워크의 확산으로 홍수, 태풍, 지진, 환경 오염, 등 재난의 피해를 줄이고자 재해 방지 시스템에 대한 연구가 활발하게 진행되고 있다. 그리고 이러한 재해는 특정한 시간에 특정 지점에만 발생하는 특징이 있으며, 이 발생 시간을 제외한 나머지 시간대에서는 정상적인 상황을 유지한다. 이와 같은 특성은 센서 네트워크 응용에서 센서의 배터리 전력 유지 및 환경 정보 획득 방법을 설계할 때, 주요한 사안으로 고려되고 있다. 이 논문에서는 센서의 전력소비를 줄이고 대기 오염에 대한 정보를 오염 발생 시간에 따라 적절히 획득하기 위하여, 대기 오염 방지 시스템에서의 센서 샘플링 주기 조정 기법을 제안한다. 제안된 기법은 대기 오염의 현재와 가까운 미래의 상태를 기반으로 센서의 샘플링 주기가 변화하는 규칙과 경계, 가중치를 설정한다. 그리고 매 샘플링 주기마다 센서 데이터 값과 이전에 저장된 오염 레벨을 고려하여 다음 샘플링 주기를 갱신한다. 이렇게 변화하는 샘플링 주기로 인해 대기 오염 감지 시스템은 측정 데이터의 정확도와 센서의 배터리 전력 소비의 균현을 적절히 유지할 수 있다. 제안된 샘플링 주기 기법은 다양한 환경 감시 응용에 활용될 수 있다.

DMT 기반의 xDSL 모뎀의 비동기식 샘플링 방식 (Non-synchronized Sampling Techniques for DMT-based xDSL Modems)

  • 이미현;김재권;백종호;유영환;조진웅;조용수
    • 한국통신학회논문지
    • /
    • 제25권12B호
    • /
    • pp.2141-2153
    • /
    • 2000
  • 본 논문에서는 DMT 기반의 xDSL 시스템의 수신단에서 발생하는 샘플링 위상 옵셋과 샘플링 주파수 옵셋에 의한 타이밍 오류를 분석한 후, 디지털 수신기에서 이를 보상하기 위한 비동기식 샘플링(full digital PLL) 방식을 제안한다. 기존의 논문에서는 DMT 방식의 xDSL 시스템에서 샘플링 위상 옵셋을 delay-rotor 특성을 이용한 주파수영역 위상 회전기로 보상하는 비동기식 샘플링 방식을 제안한 바 있다. 그러나 수신단에서 샘플링 시 존재하는 타이밍 오류로 인해 저역통과 필터링된 수신신호는 더 이상 delay-rotor 특성이 성립하지 않아 성능이 크게 저하된다. 본 논문에서는 샘플링 위상 옵셋을 완벽하게 보상할 수 있는 데이터 구간의 환형 컨벌루션화(circular convolution) 방식을 제안한다. 또한 샘플링 위상 옵셋과 샘플링 주파수 옵셋이 동시에 존재하는 경우 이를 보상할 수 있는 개선된 시간/주파수 혼성영역 보상방식을 제안한다. 또한 추가의 오버헤드를 사용하지 않고 샘플링 위상 옵셋과 샘플링 주파수 옵셋을 보상할 수 있는 시간영역 보상방식을 제안한다. 마지막으로 DMT 방식의 ADSL 시스템에 본 논문에서 제안된 비동기식 샘플링 방식들을 적용하여 모의실험을 통해 성능을 분석하고 기존의 방식과 비교하여 성능의 우수성을 확인한다.

  • PDF

가변 데이터 샘플링과 잡음을 고려한 주파수 추적 알고리즘 (Frequency Detection Algorithm related Variable Data Sampling and Noise)

  • 임영빈;함성식;신철호;김영근
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.223-224
    • /
    • 2015
  • 배전 계통 산업 현장에서는 스위칭 소자 및 제어장치, 전 자기기들이 한 대 맞물려 증가하고 있다. 또한, 스마트 그리드(Smart Grid) 및 마이크로 그리드(Micro Grid)의 개념이 도입되면서 분산 전원 이 널리 보급되고 있다. 이로 인해 현장에서는 많은 전기전자기기들이 설치되어 운영 중에 있고, 이것은 noise 및 고조파와 같은 왜란이 발생 되는 원인을 초래하고 있다. 왜란은 여러 전기 전자 장비들의 데이터 취득 왜곡 현상을 발생시키고, 이러한 데이터 손실로 인해 기기들의 오동작 및 사고를 발생시킨다. 대표적인 왜란으로는 common mode noise 같은 대지(大地) 등의 기준점과 각 신호선 사이에 나타나는 노이즈가 있으며, 선로 및 장비 특성에 따라 기수 및 우수 고조파가 있다. 이러한 왜란들은 전자기기들의 오동작 및 신호의 부 정확성으로 제품 신뢰성에 문제를 초래한다. 특히 데이터 계측 실패 및 Serial 통신을 함에 있어서 신호 손실을 발생시켜 데이터 변형을 초래한다. 이로 인해 배전선로에 위치한 전자기기들이 왜곡된 데이터로 동작을 하게 되고 이는 곧 선로의 사고를 발생시키게 된다. 따라서 왜란들을 사전에 방지하여 기기 오동작 및 부동작을 예방하기 위해서 산업계에서는 왜란에 대한 인식을 지속적으로 증가시키고 있다. 실제 현장에서도 이와 같은 왜란으로 인해 기기 오동작을 하는 경우가 많으며 이를 해결하기 위한 여러 신호처리 기법을 적용하고 있다. 이에 본 논문에서는 여러 종류의 샘플링 데이터 량을 생성할 수 있도록 샘플링 속도를 다변환(Multi-interchange)하고 각 샘플링 속도에 맞게 계측된 샘플링 데이터를 DFT 신호 처리하여 왜란으로부터 강건한 계통 주파수를 계측한다. 또한, 주파수 별 DFT 값을 Table화 하여 계통 주파수를 찾아낸다.

  • PDF

wav2vec2.0을 활용한 한국어 음성 감정 분류를 위한 데이터 샘플링 전략 (Data Sampling Strategy for Korean Speech Emotion Classification using wav2vec2.0)

  • 신미르;신유현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.493-494
    • /
    • 2023
  • 음성 기반의 감정 분석은 인간의 감정을 정확하게 파악하는 데 중요한 연구 분야로 자리잡고 있다. 최근에는 wav2vec2.0과 같은 트랜스포머 기반의 모델이 음성 인식 분야에서 뛰어난 성능을 보이며 주목받고 있다. 본 연구에서는 wav2vec2.0 모델을 활용하여 한국어 감성 발화 데이터에 대한 감정 분류를 위한 데이터 샘플링 전략을 제안한다. 실험을 통해 한국어 음성 감성분석을 위해 학습 데이터를 활용할 때 감정별로 샘플링하여 데이터의 개수를 유사하게 하는 것이 성능 향상에 도움이 되며, 긴 음성 데이터부터 이용하는 것이 성능 향상에 도움이 됨을 보인다.

멀티셋의 크기 추정 기법에서 샘플링의 효과 (Effect of Sampling for Multi-set Cardinality Estimation)

  • ;양대헌;이경희
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권1호
    • /
    • pp.15-22
    • /
    • 2015
  • 멀티셋에서 중복을 제외한 서로 다른 원소의 수를 추정하는 것은 네트워크 트래픽 측정 분야에서 매우 잘 알려진 문제이며, 많은 알고리즘들이 제안되었다. 최근에는 선형 카운팅 기법(Linear Counting)에 기반해서 매우 작은 메모리만을 이용해서 멀티셋의 크기를 추정하는 알고리즘이 개발되었다. 너무 많은 데이터를 처리하기 어려운 경우 전체 데이터를 처리하지 않고, 패킷의 일부를 샘플링해서 사용하는데, 이 샘플링은 일반적으로 정확도에 부정적인 영향을 주는 것으로 알려져있다. 하지만, 이 논문에서는 멀티셋의 크기를 추정하는데 있어서 CSE를 이용하는 경우 샘플링이 정확도와 측정 범위의 측면에서 오히려 전수조사를 하는 MCSE보다 더 좋은 결과를 낼 수 있음을 보였다. 이를 입증하기 위해 수학적 분석, 실제 데이터를 이용한 실험을 수행하고, CSE, MCSE 그리고 CSES를 비교하였다.

3D 파노라믹 가상 환경 생성을 위한 투영기반 메쉬 모델 생성 기법 (Projection-based Mesh Generation for 3D Panoramic Virtual Environment Creation)

  • 이원우;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.493-498
    • /
    • 2006
  • 본 논문에서는 3D 파노라믹 가상 환경 생성을 위한 투영기반 메쉬 모델 생성 기법을 제안한다. 제안된 메쉬 모델 생성 기법은 멀티뷰 카메라를 이용해 다수의 시점에서 얻은 실내 환경의 3D 데이터로부터 메쉬 모델을 생성한다. 먼저 미리 보정된 카메라 파라미터를 이용해 입력된 임의의 3D점 데이터를 여러 개의 하위 점군으로 분할한다. 적응적 샘플링을 통해 각 하위 점군으로부터 중복되는 점 데이터를 없애고 새로운 점군을 생성한다. 각각의 하위 점군을 Delaunay삼각화 방법을 통해 메쉬 모델링하고, 인접한 하위 점군의 메쉬들을 통합하여 하나의 메쉬 모델을 생성한다. 제안된 메쉬 모델링 방법은 점군의 분할을 통해 각 부분의 메쉬 모델을 독립적으로 생성하므로 실내 환경과 같은 넓은 영역의 모델링에 알맞다. 또한, 적응적 샘플링을 통해 3D 데이터가 갖는 깊이 정보의 특징을 보존하면서 메쉬 데이터의 크기를 줄인다. 생성된 가상 환경 모델은 가상/증강현실 응용 어플리케이션 등에 적용이 가능하다.

  • PDF

가우시안 저역 통과 필터와 적분기를 결합시킨 간단한 GMSK 변조기 (A Simple GMSK Modulator Using the Combined Gaussian Lowpass Filter and Integrator)

  • 오성근;황병대
    • 한국통신학회논문지
    • /
    • 제25권12B호
    • /
    • pp.2039-2045
    • /
    • 2000
  • 본 논문에서는 계산이 간단한 두 가지의 GMSK (Gaussian minimum shift-keying) 변조기들을 제안한다. 제안된 방법들에서는 필터링과 적분과정의 순차적인 처리 대신에, 필터링되는 데이터 계열들에 따른 적분기 출력에서의 위상 성분들을 미리 구하고, ROM (read only memory)에 저장함으로써 계산량을 크게 줄일 수 있다. 첫 번째 방법에서는 필터링되는 심벌들에 따른 각 샘플시점에서의 위상 변화량들이 미리 계산되며, 위상 샘플 값은 필터에 입력되는 데이터 계열에 의한 샘플시점에서의 총 위상 변화량을 구하여 누적함으로써 얻어진다. 두 번째 방법에서는 입력되는 모든 가능한 데이터 계열들에 따른 모든 샘플시점에서의 총 위상 변화량들을 미리 구하여 ROM에 저장하며, 위상 샘플 값은 입력되는 데이터 계열에 따라 샘플시점에 해당하는 총 위상 변화량을 선택하여 누적함으로써 얻어진다. 또한, 두 번째 방법에서는 데이터 계열의 패턴에 따른 총 위상 변화량들의 대칭적인 성질을 이용함으로써 필요한 메모리량을 줄일 수 있다.

  • PDF

축방향 서브 나이퀴스트 샘플링 기반의 횡탄성 영상 기법 (Shear-wave elasticity imaging with axial sub-Nyquist sampling)

  • 오우진;윤희철
    • 한국음향학회지
    • /
    • 제42권5호
    • /
    • pp.403-411
    • /
    • 2023
  • 탄성 영상과 미세 혈류 도플러 영상과 같은 기능성 초음파 영상은 조직의 기계적, 기능적 정보를 제공함으로써 진단 성능을 향상시킨다. 그러나 기능성 초음파 영상의 구현은 데이터 획득 및 처리 시 대용량 데이터 저장과 같은 한계를 야기한다. 본 논문에서는 효율적인 횡탄성 영상 기법을 위해 데이터 획득 양을 절감시키는 서브 나이퀴스트 접근법을 제안한다. 제안하는 방법은 기존 나이퀴스트 샘플링 속도보다 1/3배 낮은 샘플링 속도로 데이터를 획득하고, 주파수 스펙트럼의 주기성을 이용하여 대역 통과 필터링 기반의 보간을 통해 재구성된 Radio Frequency(RF) 신호를 사용하여 횡파 신호를 추적한다. 이때 RF 신호는 67 % 미만의 비대역폭으로 제한된다. 제안하는 접근법을 검증하기 위해 기존 샘플링 속도로 획득한 횡파 추적 데이터를 이용하여 서브 나이퀴스트 샘플링된 RF 신호를 재현하고, 기존 접근법과 횡파 속도 영상을 재구성한다. 정량적 평가를 위해 재구성한 횡파 속도 영상의 군속도, 대조도 잡음 비, 그리고 구조적 유사성 지수를 비교하였다. 우리는 서브 나이퀴스트 샘플링 기반 횡탄성 영상의 가능성을 정성적, 정량적으로 입증하였고, 향후 실시간 3차원 횡탄성 영상 기술에 유용하게 적용 가능할 것으로 기대된다.