• 제목/요약/키워드: 중요 샘플링

검색결과 450건 처리시간 0.048초

클래스 불균형 문제를 해결하기 위한 개선된 집중 샘플링 (Improved Focused Sampling for Class Imbalance Problem)

  • 김만선;양형정;김수형;챠위핑
    • 정보처리학회논문지B
    • /
    • 제14B권4호
    • /
    • pp.287-294
    • /
    • 2007
  • 실세계의 문제에서 많은 기계학습의 알고리즘들은 데이터의 클래스 불균형 문제에 어려움을 겪는다. 이러한 클래스 불균형 문제를 해결하기 위하여 데이터의 비율을 변경하거나 좀 더 나은 샘플링 전략으로 극복하려는 연구들이 제안되었다. 그러나 데이터의 비율을 변경하는 연구에서는 전체 데이터 분포의 특성을 고려하지 못하고, 샘플링 전략을 제안하는 연구에서는 여러 가지 제한 조건을 고려해야만 한다. 본 논문에서는 위의 두가지 방법의 장점을 모두 포함하는 개선된 집중 샘플링 방법을 제안한다. 제안된 방법에서는 클래스 불균형 문제를 해결하기 위해 학습에 유용한 데이터들을 샘플링하는데 스코어링에 기반한 데이터 분할 방법을 이용한다. 즉, 입력 데이터들에 대해 SOM(Self Organizing Map)의 학습 결과로 얻은 BMU(Best Matching Unit)와의 거리를 계산하고, 이 거리론 스코어라 한다. 측정된 스코어는 오름차순으로 정렬되며, 이 과정에서 입력 데이터의 분포가 재 표현되고, 재 표현된 분포는 전체 데이터의 특성을 대표하게 된다. 그 결과로 얻은 데이터들 중에서 유용하지 못한 데이터들에 대해 제거하는 과정을 수행하여 새로운 학습 데이터 셋을 얻는다. 새로운 학습 데이터 생성 과정에서는 재 표현된 분포의 결과를 두 구간(upper, lower)으로 분할하는데, 두 추간 사이의 데이터들은 유용하지 못한 패턴들로 간주되어 학습에 이용되지 않는다. 본 논문에서 제안한 방법은 클래스 불균형의 비율 감수 훈련 데이터의 크기 감소, 과적합의 방지 등 몇 가지 장점을 보인다. 제안한 방법으로 샘플링된 데이터에 kNN 을 적용하여, 분류 실험한 결과 심한 불균형이 있는 ecoli 데이터의 분류 성능이 최대 2.27배 향상되었다.

고속 초음파 태아영상 볼륨 가시화를 위한 공간도약 거리변환 비교 (Comparison of Distance Transforms in Space-leaping for High Speed Fetal Ultrasound Volume Visualization)

  • 박혜진;송수민;김명희
    • 한국시뮬레이션학회논문지
    • /
    • 제16권3호
    • /
    • pp.57-63
    • /
    • 2007
  • 초음파 태아 영상의 실시간 입체 가시화를 위한 볼륨 렌더링 가속화 방법은 결과영상에 영향을 끼치지 않는 관심객체영역외 빈공간을 샘플링 연산에서 제외시키는 공간도약 알고리즘이 일반적이다. 공간도약시 전처리과정에서 각 복셀에서 가장 가까이에 있는 객체의 경계복셀까지의 거리를 미리 계산 저장한 거리지도를 이용하면, 반복적 샘플링 연산을 줄임으로써 렌더링 속도 효율을 높일 수 있다. 거리지도 생성에 사용되는 여러 거리계산변환법 중 거리계산이 정교할수록 실수계산으로 인한 전처리시간이 소요되는 반면, 근사계산법을 이용하면 거리값 연산의 오차로 인한 샘플링의 횟수가 증가하는 단점이 있다. 본 논문에서는 전처리시간의 지연과 샘플링 횟수의 증가를 비교하여 초음파 태아 영상의 볼륨 렌더링에 가장 적합한 거리지도를 선택한다.

  • PDF

임계값 적용에 기반한 저 복잡도 그래프 신호 샘플링 알고리즘 (Low-Complexity Graph Sampling Algorithm Based on Thresholding)

  • 김윤학
    • 한국전자통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.895-900
    • /
    • 2023
  • 그래프에서 전체 노드중 일부 노드를 선택하고 선택된 노드에서 발생하는 신호로부터 원 신호를 복원하는 저 복잡도를 갖는 샘플링 기술에 대해 연구한다. 이를 위해, 매 단계에서 한 개의 노드를 선택하는 탐욕 알고리즘을 기반으로, 기존의 방식인 최소 비용값을 갖는 노드를 찾기 위해 전체노드를 탐색 및 계산하는 방식을 취하지 않고 임계값을 설정하여 임계값 이하의 값을 갖는 노드를 선택하도록 하여 탐색 및 비용함수 계산비용을 줄이는 방식을 제안한다. 복원성능 저하를 막기 위해 정확한 임계값 설정이 요구되며, 이를 위해 임계값을 구하기 위한 매 단계에서 샘플링 집합 크기와의 관계식을 정립한다. 다양한 그래프상에서 복원성능 및 복잡도 (실행시간) 평가를 수행하여, 기존 방식 대비 복원성능을 유지하면서 평균 1.3배 이상 빠른 실행시간이 보임을 확인했다.

위상이 다른 4개의 클럭을 이용한 시추공 레이다 수신기용 ETS 샘플러 설계 (ETS Sampler design for borehole radar receiver using 4 different clock phases)

  • 유영재;오재곤
    • 한국산학기술학회논문지
    • /
    • 제19권1호
    • /
    • pp.680-687
    • /
    • 2018
  • 시추공 레이다는 지하자원 및 지질탐사 목적으로 사용되는 레이다로서 수 ns의 펄스폭을 갖는 전자파를 송신하고 탐사 대상으로부터 반사되어 입력되는 수십에서 수백MHz의 반사파를 수신하기 위하여 고속 샘플러가 반드시 필요하다. 수십MHz의 샘플링 클럭 주파수로도 수GHz급의 샘플링 성능을 낼 수 있는 ETS(Equivalent-Time Sampling)는 시추공 레이다용 수신기의 샘플러로 사용이 적합하다. ETS 샘플러 설계에 있어 가장 중요한 요소인 샘플링 클럭 지연을 제어하는 방법으로 본 연구에서는 하나의 클럭 소스에 대해 각 $90^{\circ}$씩 위상 차이를 가지는 4개의 클럭을 이용한 방법을 제시하였다. 제안하는 방법은 기존의 지연 발생기를 이용하는 방법보다 설정한 구간 내에서 데이터를 획득하는 시간이 1/23로 단축 가능하다. 구현된 샘플러를 기존 시추공 레이다의 수신기에 적용하면 단축된 샘플링 시간으로 인해 추가로 64회 누적이 가능해져 지하 터널 탐사를 위한 수신신호 품질 개선 효과를 얻을 수 있다. 또한, 목표 샘플링 범위를 만족하기 위해서 여러 개의 샘플링 클럭 지연제어 로직을 사용하는 기존 방식에 비하여 하나의 지연제어 로직을 사용함으로써 그간 반드시 필요하였던 보정 과정의 생략이 가능하다. 그 결과 시스템의 구조를 단순화할 수 있었으며 균일한 샘플러의 구현이 가능하였다.

다운스케일링 기법과 서브샘플링 기법을 활용한 컬러 이미지 압축에 관한 연구 (A study on color image compression using downscaling method and subsampling method)

  • 이완범
    • 한국산학기술학회논문지
    • /
    • 제20권2호
    • /
    • pp.20-25
    • /
    • 2019
  • 멀티미디어 신호의 대부분은 이미지 데이터가 차지하고 있어 이미지 데이터를 효율적으로 처리하고 전송하는 문제가 정보화 사회의 중요 과제라 할 수 있다. 따라서 본 논문에서는 이미지 데이터를 압축하는 여러 방식 중에 YUV색 공간을 이용하여 중요도에 따라 색상 비트를 줄이는 압축 알고리즘을 제안한다. 4:2:2 서브샘플링은 영상 분야에서 표준으로 사용되고 있다. 색 정보와 사람의 망막이 가지는 특성을 이용하여 4:2:2 서브 샘플링으로 YUV의 색상 데이터를 줄였다. YUV 이미지와 RGB 이미지는 변환 행렬을 통해 서로의 색 영역으로 변환하여 사용할 수 있다. 이미지 데이터를 YUV로 색 공간으로 변환하여 상대적으로 낮은 U, V 비트를 다운 스케일작업을 수행 한 후 4:2:2 서브 샘플링을 통하여 데이터를 압축한다. 기존의 방식들과의 비교를 통하여 제안한 알고리즘의 성능을 비교하고 분석하였다. 분석한 결과 중요도가 낮은 색상 요소의 정보를 줄인 제안된 방식의 결과와 원본과 비교했을 때 품질의 큰 저하 없이 이미지를 압축 할 수 있었다.

부트스트랩 샘플링 최적화를 통한 앙상블 모형의 성능 개선 (Improving an Ensemble Model by Optimizing Bootstrap Sampling)

  • 민성환
    • 인터넷정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.49-57
    • /
    • 2016
  • 앙상블 학습 기법은 개별 모형보다 더 좋은 예측 성과를 얻기 위해 다수의 분류기를 결합하는 것으로 예측 성과를 향상시키는데에 매우 유용한 것으로 알려져 있다. 배깅은 단일 분류기의 예측 성과를 향상시키는 대표적인 앙상블 기법중의 하나이다. 배깅은 원 학습 데이터로부터 부트스트랩 샘플링 방법을 통해 서로 다른 학습 데이터를 추출하고, 각각의 부트스트랩 샘플에 대해 학습 알고리즘을 적용하여 서로 다른 다수의 기저 분류기들을 생성시키게 되며, 최종적으로 서로 다른 분류기로부터 나온 결과를 결합하게 된다. 배깅에서 부트스트랩 샘플은 원 학습 데이터로부터 램덤하게 추출한 샘플로 각각의 부트스트랩 샘플이 동일한 정보를 가지고 있지는 않으며 이로 인해 배깅 모형의 성과는 편차가 발생하게 된다. 본 논문에서는 이와 같은 부트스트랩 샘플을 최적화함으로써 표준 배깅 앙상블의 성과를 개선시키는 새로운 방법을 제안하였다. 제안한 모형에서는 앙상블 모형의 성과를 개선시키기 위해 부트스트랩 샘플링을 최적화하였으며 이를 위해 유전자 알고리즘이 활용되었다. 본 논문에서는 제안한 모형을 국내 부도 예측 문제에 적용해 보았으며, 실험 결과 제안한 모형이 우수한 성과를 보였다.

제주도 고산에서의 $PM_{2.5}$ 중 중금속성분 특성 분석 (Characteristics of Heavy Metal Components in $PM_{2.5}$ at Gosan in Jeju-do ; March in 2002)

  • 문광주;한진석;공부주;홍유덕;김정은;김영준;최덕일
    • 한국대기환경학회:학술대회논문집
    • /
    • 한국대기환경학회 2002년도 추계학술대회 논문집
    • /
    • pp.145-146
    • /
    • 2002
  • 대기중의 유해 에어로솔의 장거리 이동에 대한 과학적인 자료를 마련하기 위해 2002년 3월 29일부터 4월 11일까지 제주도 서쪽 끝에 위치한 고산사이트에서 Filter Pack을 사용한 PM$_{2.5}$ 에어로솔의 샘플링을 수행하였다. 이로부터 제주도 고산지역 대기 중 PM$_{2.5}$ 중 중금속 성분을 측정하여, 오염물질의 배출원 추정 및 장거리 이동가능성을 검토하고자 하였다. (중략)(중략)

  • PDF

다중 GPU 기반의 고속 다시점 깊이맵 생성 방법 (Multi-GPU based Fast Multi-view Depth Map Generation Method)

  • 고은상;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.236-239
    • /
    • 2014
  • 3차원 영상을 제작하기 위해서는 여러 시점의 색상 영상과 함께 깊이 정보를 필요로 한다. 하지만 깊이 정보를 얻을 때 사용하는 ToF 카메라는 해상도가 낮으며 적외선 신호의 주파수 문제 때문에 최대 3대까지 사용할 수 있다. 따라서 깊이 정보를 색상 영상과 함께 사용하기 위해서 깊이 정보의 업샘플링이 필수적이다. 업샘플링은 깊이 정보를 색상 카메라 위치로 3차원 워핑하고 결합형 양방향 필터(joint bilateral filter, JBF)를 사용하여 빈 영역을 채우는 방법으로 진행된다. 업샘플링은 오랜 시간이 소요되지만 그래픽스 프로세싱 유닛(graphics processing units, GPU)를 이용하여 빠르게 수행될 수 있다. 본 논문에서는 다중 GPU의 병렬 수행을 통하여 빠르게 다시점 깊이맵을 생성할 수 있는 방법을 제안한다. 다중 GPU 병렬 수행은 범용 목적 GPU(general purpose computing on GPU, GPGPU) 중의 하나인 CUDA를 이용하였으며, 본 논문에서 제안된 방법을 이용하여 3개의 GPU 사용한 실험 결과 초당 35 프레임의 다시점 깊이맵을 생성했다.

  • PDF

입자상물질(PM) 실시간 모니터링을 위한 코로나 입자하전기의 실험적 연구 (Experimental Study on a Corona Charger for Real-time Monitoring of Particulate Matter (PM))

  • 권순박;정정선;이규원
    • 한국대기환경학회:학술대회논문집
    • /
    • 한국대기환경학회 2002년도 춘계학술대회 논문집
    • /
    • pp.227-228
    • /
    • 2002
  • 대기오염물질 중 입자상물질(particulate matter, PM)의 크기분포 측정은 주로 다단임팩터(cascade impactor)에 의해 이루어지고 있다. 임팩터 각 단에 포집된 입자의 무게를 측정하여 입자상물질의 크기 분포로 환산하는 다단임팩터는 입자의 샘플링에 많은 시간이 소모되며 필터의 전처리 및 무게측정과정이 번거롭고, 시간에 따른 농도분포의 추이를 파악할 수 없는 단점이 있다. (중략)

  • PDF

스마트폰 적용을 위한 휴먼 바디 추적 방법에 대한 연구 (A Study on Human Body Tracking Method for Application of Smartphones)

  • 김범영;최유진;장성욱;김윤상
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.465-469
    • /
    • 2017
  • 본 논문에서는 스마트폰 적용을 위한 휴먼 바디 추적 방법을 제안한다. 기존 휴먼 바디 추적 방법은 크게 센서 기반 방법과 비전 기반 방법으로 구분된다. 센서 기반 방법은 위치 정보의 누적 오차로 인해 추적 성능이 떨어지는 단점이 있다. 비전 기반 방법은 누적 오차가 없지만 스마트폰 적용을 위한 연산량 감소가 요구되고 있다. 본 논문에서는 스마트폰 적용을 위한 휴먼 바디 추적 방법으로 개선된 HOG 알고리즘을 이용한다. 개선된 HOG 알고리즘은 다운샘플링과 프레임 샘플링을 통해 구현된다. 다운샘플링에는 가우시안 피라미드가 적용되고, 프레임 샘플링에는 uniform sampling이 적용된다. 제안한 알고리즘을 2개 기기, 4개 해상도, 4개 프레임에서 측정하였고, 실시간으로 적용이 가능한 다운샘플링과 프레임 샘플링 파라미터 중에서 가장 검출률이 좋은 값을 도출하였다.

  • PDF