• 제목/요약/키워드: 중요 샘플링

검색결과 451건 처리시간 0.037초

공간 슬라이딩 윈도우 집계질의의 정확도 향상을 위한 그리드 해쉬 기반의 부하제한 기법 (Load Shedding Method based on Grid Hash to Improve Accuracy of Spatial Sliding Window Aggregate Queries)

  • 백성하;이동욱;김경배;정원일;배해영
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권2호
    • /
    • pp.89-98
    • /
    • 2009
  • 데이터 스트림은 다양한 입력속도로 끊임없이 입력되고 데이터 스트림을 저장하는 메모리상의 저장공간은 유한하기 때문에 때때로 저장공간을 초과하는 데이터가 입력되는 경우가 발생한다. 이 문제를 해결하기 위해 초과되는 데이터의 일부를 버려 메모리 초과를 방지하는 부하제한 기법이 연구되었다. 기존의 부하제한 기법은 데이터의 편차에 따른 최적의 샘플링 비율을 갖는 랜덤 샘플링을 사용한다. 그러나 이 기법은 공간적 특성을 고려하지 않기 때문에 공간 질의에 사용되는 데이터와 사용되지 않는 데이터를 구분하지 않고 샘플링 한다. 그래서 공간 질의가 포함되는 u-GIS 환경에서는 질의 정확도가 감소하는 문제가 발생하였다. 본 논문에서는 공간 질의와 비공간 질의가 동시에 발생하는 u-GIS 환경에서 질의 정확도를 보다 향상 시키는 부하제한 기법을 연구하였다. 이 기법은 동시에 실행되는 공간 질의의 공간적 이용도에 따라 차등적으로 샘플링을 하여, 질의에 이용될 확률이 낮은 데이터를 샘플링을 한다. 제안된 부하제한 기법은 공간질의가 존재하는 경우 질의 정확도를 크게 향상 시켰고, 샘플링 중 공간 필터링 연산을 적용하여 질의처리 속도도 일부 향상 시켰다.

  • PDF

MF sampler: 동영상 기반 패션 검색 모델의 성능 향상을 위한 샘플링 방법 (MF sampler: Sampling method for improving the performance of a video based fashion retrieval model)

  • 백상훈;박종혁
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.329-346
    • /
    • 2022
  • 최근 소셜 미디어의 숏폼(Short form) 동영상(인스타그램, 틱톡, 유튜브) 시장이 점차 증가하면서 인공지능 영역에서는 이를 활용한 연구가 활발히 진행되고 있다. 대표적인 연구분야로 동영상 내의 패션 상품을 탐지하고 상품 이미지를 검색하는 Video to shop 을 들 수 있다. 이와 같은 동영상 기반 인공지능 모델에서는 Convolution 연산을 사용하여 상품의 특징을 추출한다. 하지만 연산 자원의 제한으로 인해, 동영상의 모든 프레임을 사용하여 특징을 추출하는 것은 현실적으로 불가능하다. 이로 인해, 기존 연구에서는 전체 프레임 중 일부만 샘플링해서 사용하거나, 주제의 특성을 활용한 샘플링 방법을 개발하여 이를 통해 위 문제점을 개선하고, 모델의 성능도 향상시켰다. 기존의 Video to shop 연구에서는 프레임을 샘플링 할 때, 무작위로 일부분의 프레임을 샘플링하거나 균등한 간격으로 샘플링 한다. 하지만 이러한 샘플링 방법은 상품이 존재하지 않는 노이즈 프레임을 샘플링 하면서 패션 상품 검색 모델의 성능을 저하시킨다. 이에 본 연구는 노이즈 프레임을 제거하고 검색 모델의 성능을 향상시키는 샘플링 방법 MF(Missing Fashion items on frame) sampler를 제안한다. MF sampler는 키 프레임 메커니즘(Mechanism)을 발전시켜 자원 한계의 문제점을 개선했다. 또한, 노이즈 탐지 모델을 활용한 노이즈 프레임 제거를 통해 검색 모델의 성능을 향상시켰다. 이와 같은 결과는 실험을 통해 확인되었고, Video to shop 패션 상품 검색에 있어 성능 향상과 효과적인 학습이 가능하다는 것을 확인할 수 있었다.

컬러 모폴로지를 이용한 컬러 화상의 특징 추출에 관한 연구

  • 남태희
    • 한국컴퓨터정보학회지
    • /
    • 제8권2호
    • /
    • pp.9-14
    • /
    • 2001
  • 본 논문에서는 새로운 칼라 모폴로지 피라미드를 제안하고. 제안된 칼라 모폴로지의 유용성 평가를 위해 이미지에서 중요한 에지를 검출하고자 한다. 여기서 이미지 피라미드 구조는 최초 컬러 이미지의 반복적인 필터링과 샘플링의 순차적인 실험 과정의 단계를 본 논문에서 제안한 CMP를 이용하여 연속적인 필터링 처리로 불필요한 크기의 물체 및 잡음을 제거하여. 효율적인 특징 추출의 유효성을 검증하고자 한다.

  • PDF

분류 복잡도를 활용한 오버 샘플링 비율 산출 알고리즘 개발 (A Study on Calculating Over-sampling Ratio using Classification Complexity)

  • 이도현;김경옥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.591-594
    • /
    • 2020
  • 불균형 데이터는 범주에 따른 데이터의 분포가 불균형한 데이터를 의미한다. 이런 데이터를 활용해 기존 분류 알고리즘으로 분류기를 학습하면 성능이 저하되는 문제가 발생한다. 오버 샘플링은 이를 해결하기 위한 기법 중 하나로 수가 적은 범주[이하 소수 범주]에 속한 데이터 수를 임의로 증가시킨다. 기존 연구들에서는 수가 많은 범주[이하 다수 범주]에 속한 데이터 수와 동일한 크기만큼 증가시키는 경우가 많다. 이는 증가시키는 샘플의 수를 결정할 때 범주 간 데이터 수 비율만 고려한 것이다. 그런데 데이터가 동일한 수준의 불균형 정도를 갖더라도 범주별 데이터 분포에 따라서 분류 복잡도가 다르며, 경우에 따라 데이터 분포에서 존재하는 불균형 정도를 완전히 해소하지 않아도 된다. 이에 본 논문은 분류 복잡도를 활용해 데이터 셋 별 적정 오버 샘플링 비율을 산출하는 알고리즘을 제안한다.

Random Forest 기법을 이용한 산사태 취약성 평가 시 훈련 데이터 선택이 결과 정확도에 미치는 영향 (Study on the Effect of Training Data Sampling Strategy on the Accuracy of the Landslide Susceptibility Analysis Using Random Forest Method)

  • 강경희;박혁진
    • 자원환경지질
    • /
    • 제52권2호
    • /
    • pp.199-212
    • /
    • 2019
  • 머신러닝 기법을 활용한 분석에서 훈련 데이터의 샘플링 전략은 예측 정확도 뿐 만 아니라 일반화 능력에도 많은 영향을 미친다. 특히, 산사태 취약성 분석의 경우, 산사태 발생부에 대한 정보에 비해 산사태 미발생부에 대한 정보가 과도하게 많은 데이터 불균형 현상이 발생하며, 이에 따라 분석 모델의 훈련 데이터 설계 시 데이터 샘플링 과정이 필수적이다. 그러나 기존의 연구들은 대부분 산사태 미발생부 선택 시 발생부 데이터와 1:1의 비율을 갖도록 무작위로 선택하는 방법을 적용하였을 뿐, 특정한 선택 기준에 따라 분석을 수행하지 않았다. 따라서 본 연구에서는 훈련 데이터의 샘플링 전략이 모델의 예측 성능에 미치는 결과를 확인하기 위하여 산사태 발생부와 미발생부의 샘플링 전략기준에 따라 서로 다른 6개의 시나리오를 만들어 Random Forest 모델의 훈련에 사용하였다. 또한 Random Forest의 결과 중 하나인 변수 중요도를 각 산사태 유발인자들에 가중치로 곱하여 줌으로써 산사태 취약지수 값을 산정하였으며, 취약지수 값을 이용해 산사태 취약성도를 제작하고 각 결과 지도의 정확도를 비교 분석하였다. 분석 결과, 훈련데이터의 샘플링 방법에 상관없이 두 지역의 산사태 취약성 분석 결과는 모두 70~80%의 정확도를 보였다. 이를 통해 Random Forest 기법의 산사태 취약성 분석기법으로서의 적용 가능성을 확인하였으며, Random Forest 모델이 제공하는 입력변수의 중요도를 산사태 유발인자 가중치로 활용할 수 있음을 확인하였다. 또한 훈련 시나리오 간의 정확도를 비교한 결과, 특정한 기준에 의해 훈련 데이터를 설계하는 것이 기존의 랜덤 선택 방법보다 높은 예측 정확도를 기대할 수 있음을 확인하였다.

지능형 디지털 재설계 기법의 안정화 가능성에 대하여 (On the Stabilizability by the Intelligent Digital Redesign)

  • 이호재
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.7-10
    • /
    • 2006
  • 지능형 디지털 재설계 기법의 중요한 가정은 퍼지 IF-THEN 규칙의 발화도가 샘플링 구간에서 샘플링 순간의 값으로 근사화 된다는 점이다. 본 논문은 퍼지 IF-THEN 규칙 발화도의 근사화 가정을 배제한 경우에 대하여 기존의 지능형 디지털 재설계 기법에 의하여 재설계된 디지털 제어기의 안정화 가능성을 조사한다.

  • PDF

리턴 스택 버퍼를 이용한 마이크로아키텍처 데이터 샘플링 공격

  • 김태현;신영주
    • 정보보호학회지
    • /
    • 제31권1호
    • /
    • pp.25-39
    • /
    • 2021
  • 마이크로아키텍처 데이터 샘플링 공격 중 하나인 Zombieload 공격은 마이크로코드 어시스트를 이용하여 물리 코어를 공유하는 다른 논리 코어가 접근하는 데이터를 읽는 공격이다. 마이크로코드 어시스트는 페이지 폴트 과정에서 로드 명령어를 수행할 때 발생하므로, Zombieload 공격은 시그널 핸들러 또는 TSX로 페이지 폴트를 처리 또는 억제한다. 그러나 시그널 핸들러에서 발생하는 잡음과 TSX를 지원하는 프로세서 수의 부족이 Zombieload 공격의 효율을 감소시킨다. 본 논문에서는 페이지 폴트를 RSB를 이용한 잘못된 추측 실행으로 처리하여, 기존의 한계점을 개선한 새로운 Zombieload 공격을 제안한다. 제안한 공격의 성능을 평가하기 위해, 실험을 통해 기존의 Zombieload 공격과 성능을 비교한다. 끝으로 제안한 공격을 막기 위해 여러 가지 방어 기법을 제시한다.

타이밍 옵셋 보상 기법을 이용한 DTV 수신성능 개선 (Timing-offset compensation techniques in ATSC DTV receivers)

  • 김용철;김대진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 I
    • /
    • pp.15-18
    • /
    • 2003
  • ATSC 방식을 사용하는 DTV 수신기는 심볼 타이밍 동기를 맞추기 위해 77.3㎲마다 존재하는 세그먼트 싱크를 이용한 방법 또는 가드너 알고리즘을 사용한다. 이 중 가드너 알고리즘을 사용하는 방법은 다중 경로 채널 환경으로 인해 타이밍 옵셋이 발생한다. DTV 수신 채널 환경이 많은 수의 다중 경로 신호를 포함하고 있기 때문에 가드너 알고리즘을 사용한 DTV 수신기는 타이밍 옵셋이 발생한다. 이 타이밍 옵셋은 샘플링 순간을 잘못된 시점으로 옮기기 때문에 등화기의 성능이 열화된다. 다중 경로 채널 환경에서 등화기의 성능을 최적화하는 샘플링 순간은 주 경로 신호의 크기가 최대가 되는 점이다. 본 논문에서는 타이밍 옵셋 보상기를 사용하여 샘플링 순간을 주 경로 신호의 최대점으로 옮겨 타이밍 옵셋을 보상하고 등화기로 입력되도록 하여 DTV 수신 성능을 개선하였다. 타이밍 옵셋 보상기는 채널 상관기, 최대점 탐색기, 타이밍 보상용 보간 필터로 구성되어 있다. 타이밍 옵셋 보상기와 등화기를 연계 실험하여 성능 향상을 분석하였다.

  • PDF

wav2vec2.0을 활용한 한국어 음성 감정 분류를 위한 데이터 샘플링 전략 (Data Sampling Strategy for Korean Speech Emotion Classification using wav2vec2.0)

  • 신미르;신유현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.493-494
    • /
    • 2023
  • 음성 기반의 감정 분석은 인간의 감정을 정확하게 파악하는 데 중요한 연구 분야로 자리잡고 있다. 최근에는 wav2vec2.0과 같은 트랜스포머 기반의 모델이 음성 인식 분야에서 뛰어난 성능을 보이며 주목받고 있다. 본 연구에서는 wav2vec2.0 모델을 활용하여 한국어 감성 발화 데이터에 대한 감정 분류를 위한 데이터 샘플링 전략을 제안한다. 실험을 통해 한국어 음성 감성분석을 위해 학습 데이터를 활용할 때 감정별로 샘플링하여 데이터의 개수를 유사하게 하는 것이 성능 향상에 도움이 되며, 긴 음성 데이터부터 이용하는 것이 성능 향상에 도움이 됨을 보인다.