• 제목/요약/키워드: 유사도 샘플링

검색결과 103건 처리시간 0.029초

Top-${\kappa}$ 유사도 조인을 위한 샘플링 기반 알고리즘 (A Sampling-based Algorithm for Top-${\kappa}$ Similarity Joins)

  • 박종수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제41권4호
    • /
    • pp.256-261
    • /
    • 2014
  • Top-${\kappa}$ 유사도 조인 문제는 두 개의 입력 레코드 집합들에서 유사도를 기준한 상위 ${\kappa}$ 개의 레코드 쌍을 찾는 것이다. 샘플링 기법을 이용하여 상위 ${\kappa}$ 개의 유사도 조인 쌍을 반환하는 효율적인 알고리즘을 제안한다. 입력 레코드들의 표본에서 집합 유사도 조인들의 히스토그램을 구성하고, 상위 ${\kappa}$ 개의 조인 쌍을 위한 추정 유사도 한계치를 통계 추론으로 95% 신뢰 구간의 오차 한계 내에서 계산한다. 상위 ${\kappa}$ 개의 유사도 조인을 얻기 위하여 최소-히프 구조를 사용하는 일반 유사도 조인 알고리즘에 이 추정 한계치를 적용한다. 대 용량의 실제 데이터집합에서의 실험결과는 제안된 알고리즘의 좋은 성능을 보여준다.

RF 주파수대 고주파 신호검출을 위한 고속계측기 개발 (Development of High-Speed Measuring Instrument for RF Frequency High Frequency Signal Detection)

  • 박성미;송광석;박성준
    • 전력전자학회:학술대회논문집
    • /
    • 전력전자학회 2017년도 전력전자학술대회
    • /
    • pp.469-470
    • /
    • 2017
  • 디지털 계측기는 전압 또는 전류 한주기에 대하여 여러 번 샘플링 하여 실효치를 구하고 위상은 전압영점에서 카운터를 시작하여 전류 영점에서 그 카운터의 값에 의해 전력을 구하는 것이 일반적이다. 그러나 계측대상 주파수가 샘플링 주파수와 유사한 경우 사실상 전력 계측이 불가능하게 되는 취약점을 안고 있다. 따라서 본 논문에서는 계측대상 주파수가 샘플링 주파수와 유사한 경우 샘플링 시프트 기능을 사용하여 계측하는 정규화 기법과 이를 이용하여 DFT를 사용하여 각 차수의 고조파 성분을 분석할 수 있는 알고리즘을 제안한다. 또한 제안된 방식을 Psim을 이용한 시뮬레이션을 통하여 그 타당성을 검증하였다.

  • PDF

3차원 수치모형을 이용한 저수지 퇴사분포 해석 (Analysis of Reservoir Sedimentation Using 3-D Numerical Model)

  • 김기철;김현식;이동훈;이용택;김동훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.302-307
    • /
    • 2017
  • 본 연구에서 퇴사량조사 실적 및 유량-유사량 관측 자료, 상 하류 수위-유량 자료를 보유하고 있는 B 저수지를 대상으로 3차원 수치모형을 이용하여 저수지 퇴사분포를 분석해 보았다. 또한 수치모형의 검증을 위하여 저수지내 6개 지점에 대한 시추 샘플링을 통해 퇴적토의 깊이를 측정하였다. 퇴적토 샘플링시 시료의 교란을 방지하기 위하여 동일지점에서 2회 샘플링 작업을 수행하였다. 샘플링 시료는 원지반과 퇴적지반의 구분을 위하여 시료분석 이전에 각 단면별 깊이를 측정하였으며, 시료는 각 단면별로 물리적 특성시험을 통해 압밀도를 측정하여 퇴적토의 깊이를 산정하고 수치모형시 검증 자료로 사용하였다. 본 연구에서는 3차원 수리해석과 함께 유사의 이송, 침식, 퇴적현상을 연동하여 모의 가능한 Delft3D 모형을 이용하여 B 저수지에 대한 유사 이송모의를 수행하였다. 모의 결과 저수지의 하폭이 넓어지는 지형 및 만곡부 인근에서 퇴적이 진행되는 결과를 보였으며, 퇴적토 시료와 비교한 결과 퇴적토 깊이는 일부 차이가 있었으나, 퇴적분포 양상은 유사한 결과를 보였다.

  • PDF

저비율 샘플링 음향 센서네트워크에서 DTW-Cosine 알고리즘을 이용한 목표물 식별기법 (Target Classification in Sparse Sampling Acoustic Sensor Networks using DTW-Cosine Algorithm)

  • 김영수;강종구;김대영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권2호
    • /
    • pp.221-225
    • /
    • 2008
  • 센서네트워크에서 목표물 탐지하는데 있어 높은 샘플링이 수반되어야 하는 주파수 분석을 피하기 위하여, 낮은 샘플링 데이타를 이용하더라도 목표물 식별이 가능한 시계열(Time-series) 분석 기법으로서 시간 정합 유사도 측정 알고리즘을 소개하고 그 중에 가장 우수한 DTW-Cosine 알고리즘을 제안한다. 시계열 분석 기법을 이용하여 패턴을 비교하기 위해서는 지역 시간 이동 문제와 공간 신호 변이 문제를 극복해야 하는데 DTW-Cosine 알고리즘은 이를 효과적으로 극복함과 동시에 Smoothing 기법을 통하여 다른 시간 정합 유사도 측정 알고리즘들에 비해 전체적으로 최소 10.31% 이상의 우수한 성능을 보였다.

효율적인 헤어 시뮬레이션을 위한 굽힘 기반 적응형 샘플링 (Bending-based Adaptive Sampling for Efficient Hair Simulations)

  • 윤주영;김동희;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.353-355
    • /
    • 2022
  • 본 논문에서는 외력에 의해 헤어가 움직일 때, 전체가 아닌 변형률이 큰 부분에 입자 제어점을 추가하여 베지에 곡선을 그리는 적응형 헤어 시뮬레이션 기법을 제안한다. 일반적인 정규화 샘플링을 통한 물리 시뮬레이션은 헤어의 움직임에 대한 정확도가 높은 반면, 계산량이 증가하고 메모리를 많이 차지하기 때문에 비효율적이다. 이 문제는 굽힘이 일어나는 특정 부분만 활용한 적응형 샘플링을 통해 해결할 수 있으며, 메모리뿐만 아니라 속도 측면에서도 모두 우수한 성능을 보인다. 본 논문에서 제안하는 방법을 이용한 굽힘 샘플링 기법은 헤어의 굽힘 패턴에 따라 실시간으로 표현되며 자연스럽고 부드러운 실제 헤어와 유사한 결과를 보여준다.

  • PDF

스트림 환경에서 높은 균일신뢰도를 지원하는 가변 크기 샘플링 (Variable Size Sampling to Support Uniformity Confidence in Stream Environments)

  • 김하진;이상훈;길명선;문양세
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.675-678
    • /
    • 2017
  • 본 논문에서는 스트림 환경에서의 샘플링 기법 중 랜덤 샘플링과 유사한 특성을 갖는 KSample의 균일신뢰도 향상에 초점을 맞춘다. 이를 위해, 먼저 KSample의 균일신뢰도 문제점을 분석하여 KSample의 균일신뢰도가 초기에 많이 감소하는 현상을 초기 균일신뢰도 저하 문제로, KSample의 균일신뢰도가 지속적으로 감소하는 현상을 지속 균일신뢰도 저하 문제라 정의한다. 그리고 초기 균일신뢰도 저하 문제를 발생시키는 성질을 과거 샘플 불변으로, 지속 균일신뢰도 저하 문제를 발생시키는 성질을 샘플 추출 범위 증가로 정의하고 이를 해결하여 균일신뢰도를 향상시킨 UC KSample을 제안한다. 실험 결과, 샘플링 비율 p=0.01, 균일신뢰도 하한 ${\varepsilon}=0.7$일 때, UC KSample의 균일신뢰도가 기존 KSample 보다 약 2.2배 증가하였고, 균일신뢰도는 항상 하한 이상으로 유지되었다. 본 연구는 스트림 환경에서 중요한 척도인 균일신뢰도를 KSample에 결합시킨 최초의 시도로서, 샘플링 비율을 유지하며 동적으로 샘플링하는 KSample의 장점은 유지하면서도 균일신뢰도를 증가시킨 우수한 연구라 사료된다.

DPR의 효과적인 하드 네거티브 샘플링을 통한 효율적인 대조학습 방법 (Efficient contrastive learning method through the effective hard negative sampling from DPR)

  • 박성흠;김홍진;황금하;권오욱;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.348-353
    • /
    • 2022
  • 최근 신경망 기반의 언어모델이 발전함에 따라 대부분의 검색 모델에서는 Bi-encoder를 기반으로한 Dense retrieval 모델에 대한 연구가 진행되고 있다. 특히 DPR은 BM25를 통해 정답 문서와 유사한 정보를 가진 하드 네거티브를 사용하여 대조학습을 통해 성능을 더욱 끌어올린다. 그러나 BM25로 검색된 하드 네거티브는 term-base의 유사도를 통해 뽑히기 때문에, 의미적으로 비슷한 내용을 갖는 하드 네거티브의 역할을 제대로 수행하지 못하고 대조학습의 효율성을 낮출 가능성이 있다. 따라서 DRP의 대조학습에서 하드 네거티브의 역할을 본질적으로 수행할 수 있는 문서를 샘플링 하는 방법을 제시하고, 이때 얻은 하드 네거티브의 집합을 주기적으로 업데이트 하여 효과적으로 대조학습을 진행하는 방법을 제안한다. 지식 기반 대화 데이터셋인 MultiDoc2Dial을 통해 평가를 수행하였으며, 실험 결과 기존 방식보다 더 높은 성능을 나타낸다.

  • PDF

젖은 머리카락의 효율적인 표현을 위한 적응형 샘플링 방식 (Adaptive Sampling Approach for Efficient Representation of Wet Hairs)

  • 윤주영;김동희;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.559-562
    • /
    • 2022
  • 본 논문에서는 젖은 머리카락의 응집력을 효율적으로 표현할 수 있는 적응형 샘플링 기법을 제안한다. 젖은 헤어는 인접 머리카락과 달라붙어 머리카락 하단으로 뭉치는 응집력 형태를 지닌다. 헤어 동역학은 수많은 입자 구조로 연결되어있으며 머리카락의 상호작용을 고려하는 젖은 헤어의 경우 응집력 계산이 개별적인 머리카락 단위로 표현되기 때문에, 이를 위한 계산과정을 효율적으로 풀어내는 것은 중요하다. 본 논문에서는 젖은 헤어의 시뮬레이션을 효율적으로 계산하기 위해 밀도와 각도, 그리고 포화도를 고려한 적응형 샘플링 기법을 제안한다. 이는 속도와 메모리 측면에서 최적화가 가능하며 헤어 입자의 추가와 삭제를 통해 사실적인 젖은 머리카락의 응집력 표현을 실시간으로 표현할 수 있다. 본 논문에서 제안하는 방법은 실제 젖은 헤어와 유사한 결과를 보여주며, 실시간 프로그램에서 사람의 젖은 모발 또는 동물의 젖은 털의 특징 등을 표현하는데 응용할 수 있다.

  • PDF

표면정보 기반 영상정합에서의 대표점 추출기법 비교 연구 (Comparison of Representative Point Sampling Methods in Surface Based Image Registration)

  • 박지영;최유주;김명희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.347-350
    • /
    • 2003
  • 표면정보 기반 영상정합기법은 대상기관에서 추출된 표면정보를 기반으로 변환을 추정하여 서로 다른 영상의 전체적 형태의 유사성 정도를 최대화함으로써 정합을 수행하는 방법이다. 정합 수행에 있어 전체 객체를 가장 잘 대표하는 특정 개수의 표면점을 추출하고, 이 대표점으로부터 변환 값을 계산하는 것이 영상정합의 합리적인 최적화 단계를 위해 필수적이다. 대표점 추출결과에 따라 전체 정합의 결과가 달라지게 되므로 정합의 변환요소 값을 정확하게 구해낼 수 있는 대표점을 추출하기 위해 적절한 샘플링 기법의 선택이 요구된다. 본 연구에서는 효율적인 표면정보 기반 다중 모달리티 영상정합을 위해 계통추출법 기반 샘플링 기법과 특징점 탐지 기법 기반 샘플링 기법의 성능을 비교 분석하였다.

  • PDF

wav2vec2.0을 활용한 한국어 음성 감정 분류를 위한 데이터 샘플링 전략 (Data Sampling Strategy for Korean Speech Emotion Classification using wav2vec2.0)

  • 신미르;신유현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.493-494
    • /
    • 2023
  • 음성 기반의 감정 분석은 인간의 감정을 정확하게 파악하는 데 중요한 연구 분야로 자리잡고 있다. 최근에는 wav2vec2.0과 같은 트랜스포머 기반의 모델이 음성 인식 분야에서 뛰어난 성능을 보이며 주목받고 있다. 본 연구에서는 wav2vec2.0 모델을 활용하여 한국어 감성 발화 데이터에 대한 감정 분류를 위한 데이터 샘플링 전략을 제안한다. 실험을 통해 한국어 음성 감성분석을 위해 학습 데이터를 활용할 때 감정별로 샘플링하여 데이터의 개수를 유사하게 하는 것이 성능 향상에 도움이 되며, 긴 음성 데이터부터 이용하는 것이 성능 향상에 도움이 됨을 보인다.