• Title/Summary/Keyword: 유사도 샘플링

Search Result 102, Processing Time 0.032 seconds

A Sampling-based Algorithm for Top-${\kappa}$ Similarity Joins (Top-${\kappa}$ 유사도 조인을 위한 샘플링 기반 알고리즘)

  • Park, Jong Soo
    • Journal of KIISE:Databases
    • /
    • v.41 no.4
    • /
    • pp.256-261
    • /
    • 2014
  • The problem of top-${\kappa}$ set similarity joins finds the top-${\kappa}$ pairs of records ranked by their similarities between two sets of input records. We propose an efficient algorithm to return top-${\kappa}$ similarity join pairs using a sampling technique. From a sample of the input records, we construct a histogram of set similarity joins, and then compute an estimated similarity threshold in the histogram for top-${\kappa}$ join pairs within the error bound of 95% confidence level based on statistical inference. Finally, the estimated threshold is applied to the traditional similarity join algorithm which uses the min-heap structure to get top-${\kappa}$ similarity joins. The experimental results show the good performance of the proposed algorithm on large real datasets.

Development of High-Speed Measuring Instrument for RF Frequency High Frequency Signal Detection (RF 주파수대 고주파 신호검출을 위한 고속계측기 개발)

  • Park, Seong-Mi;Song, kwang-Suk;Park, Sung-Jun
    • Proceedings of the KIPE Conference
    • /
    • 2017.07a
    • /
    • pp.469-470
    • /
    • 2017
  • 디지털 계측기는 전압 또는 전류 한주기에 대하여 여러 번 샘플링 하여 실효치를 구하고 위상은 전압영점에서 카운터를 시작하여 전류 영점에서 그 카운터의 값에 의해 전력을 구하는 것이 일반적이다. 그러나 계측대상 주파수가 샘플링 주파수와 유사한 경우 사실상 전력 계측이 불가능하게 되는 취약점을 안고 있다. 따라서 본 논문에서는 계측대상 주파수가 샘플링 주파수와 유사한 경우 샘플링 시프트 기능을 사용하여 계측하는 정규화 기법과 이를 이용하여 DFT를 사용하여 각 차수의 고조파 성분을 분석할 수 있는 알고리즘을 제안한다. 또한 제안된 방식을 Psim을 이용한 시뮬레이션을 통하여 그 타당성을 검증하였다.

  • PDF

Analysis of Reservoir Sedimentation Using 3-D Numerical Model (3차원 수치모형을 이용한 저수지 퇴사분포 해석)

  • Kim, Ki Chul;Kim, Hyeon Sik;Lee, Dong Hun;Lee, Yong Taek;Kim, Dong Hun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.302-307
    • /
    • 2017
  • 본 연구에서 퇴사량조사 실적 및 유량-유사량 관측 자료, 상 하류 수위-유량 자료를 보유하고 있는 B 저수지를 대상으로 3차원 수치모형을 이용하여 저수지 퇴사분포를 분석해 보았다. 또한 수치모형의 검증을 위하여 저수지내 6개 지점에 대한 시추 샘플링을 통해 퇴적토의 깊이를 측정하였다. 퇴적토 샘플링시 시료의 교란을 방지하기 위하여 동일지점에서 2회 샘플링 작업을 수행하였다. 샘플링 시료는 원지반과 퇴적지반의 구분을 위하여 시료분석 이전에 각 단면별 깊이를 측정하였으며, 시료는 각 단면별로 물리적 특성시험을 통해 압밀도를 측정하여 퇴적토의 깊이를 산정하고 수치모형시 검증 자료로 사용하였다. 본 연구에서는 3차원 수리해석과 함께 유사의 이송, 침식, 퇴적현상을 연동하여 모의 가능한 Delft3D 모형을 이용하여 B 저수지에 대한 유사 이송모의를 수행하였다. 모의 결과 저수지의 하폭이 넓어지는 지형 및 만곡부 인근에서 퇴적이 진행되는 결과를 보였으며, 퇴적토 시료와 비교한 결과 퇴적토 깊이는 일부 차이가 있었으나, 퇴적분포 양상은 유사한 결과를 보였다.

  • PDF

Target Classification in Sparse Sampling Acoustic Sensor Networks using DTW-Cosine Algorithm (저비율 샘플링 음향 센서네트워크에서 DTW-Cosine 알고리즘을 이용한 목표물 식별기법)

  • Kim, Young-Soo;Kang, Jong-Gu;Kim, Dae-Young
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.14 no.2
    • /
    • pp.221-225
    • /
    • 2008
  • In this paper, to avoid the frequency analysis requiring a high sampling rate, time-warped similarity measure algorithms, which are able to classify objects even with a low-rate sampling rate as time- series methods, are presented and proposed the DTW-Cosine algorithm, as the best classifier among them in wireless sensor networks. Two problems, local time shifting and spatial signal variation, should be solved to apply the time-warped similarity measure algorithms to wireless sensor networks. We find that our proposed algorithm can overcome those problems very efficiently and outperforms the other algorithms by at least 10.3% accuracy.

Bending-based Adaptive Sampling for Efficient Hair Simulations (효율적인 헤어 시뮬레이션을 위한 굽힘 기반 적응형 샘플링)

  • Yun, Ju-Young;Kim, Donghui;Kim, Jong-Hyun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.01a
    • /
    • pp.353-355
    • /
    • 2022
  • 본 논문에서는 외력에 의해 헤어가 움직일 때, 전체가 아닌 변형률이 큰 부분에 입자 제어점을 추가하여 베지에 곡선을 그리는 적응형 헤어 시뮬레이션 기법을 제안한다. 일반적인 정규화 샘플링을 통한 물리 시뮬레이션은 헤어의 움직임에 대한 정확도가 높은 반면, 계산량이 증가하고 메모리를 많이 차지하기 때문에 비효율적이다. 이 문제는 굽힘이 일어나는 특정 부분만 활용한 적응형 샘플링을 통해 해결할 수 있으며, 메모리뿐만 아니라 속도 측면에서도 모두 우수한 성능을 보인다. 본 논문에서 제안하는 방법을 이용한 굽힘 샘플링 기법은 헤어의 굽힘 패턴에 따라 실시간으로 표현되며 자연스럽고 부드러운 실제 헤어와 유사한 결과를 보여준다.

  • PDF

Variable Size Sampling to Support Uniformity Confidence in Stream Environments (스트림 환경에서 높은 균일신뢰도를 지원하는 가변 크기 샘플링)

  • Kim, Hajin;Lee, Sanghun;Gil, Myeong-Seon;Moon, Yang-Sae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.675-678
    • /
    • 2017
  • 본 논문에서는 스트림 환경에서의 샘플링 기법 중 랜덤 샘플링과 유사한 특성을 갖는 KSample의 균일신뢰도 향상에 초점을 맞춘다. 이를 위해, 먼저 KSample의 균일신뢰도 문제점을 분석하여 KSample의 균일신뢰도가 초기에 많이 감소하는 현상을 초기 균일신뢰도 저하 문제로, KSample의 균일신뢰도가 지속적으로 감소하는 현상을 지속 균일신뢰도 저하 문제라 정의한다. 그리고 초기 균일신뢰도 저하 문제를 발생시키는 성질을 과거 샘플 불변으로, 지속 균일신뢰도 저하 문제를 발생시키는 성질을 샘플 추출 범위 증가로 정의하고 이를 해결하여 균일신뢰도를 향상시킨 UC KSample을 제안한다. 실험 결과, 샘플링 비율 p=0.01, 균일신뢰도 하한 ${\varepsilon}=0.7$일 때, UC KSample의 균일신뢰도가 기존 KSample 보다 약 2.2배 증가하였고, 균일신뢰도는 항상 하한 이상으로 유지되었다. 본 연구는 스트림 환경에서 중요한 척도인 균일신뢰도를 KSample에 결합시킨 최초의 시도로서, 샘플링 비율을 유지하며 동적으로 샘플링하는 KSample의 장점은 유지하면서도 균일신뢰도를 증가시킨 우수한 연구라 사료된다.

Efficient contrastive learning method through the effective hard negative sampling from DPR (DPR의 효과적인 하드 네거티브 샘플링을 통한 효율적인 대조학습 방법)

  • Seong-Heum Park;Hongjin Kim;Jin-Xia Huang;Oh-Woog Kwon;Harksoo Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.348-353
    • /
    • 2022
  • 최근 신경망 기반의 언어모델이 발전함에 따라 대부분의 검색 모델에서는 Bi-encoder를 기반으로한 Dense retrieval 모델에 대한 연구가 진행되고 있다. 특히 DPR은 BM25를 통해 정답 문서와 유사한 정보를 가진 하드 네거티브를 사용하여 대조학습을 통해 성능을 더욱 끌어올린다. 그러나 BM25로 검색된 하드 네거티브는 term-base의 유사도를 통해 뽑히기 때문에, 의미적으로 비슷한 내용을 갖는 하드 네거티브의 역할을 제대로 수행하지 못하고 대조학습의 효율성을 낮출 가능성이 있다. 따라서 DRP의 대조학습에서 하드 네거티브의 역할을 본질적으로 수행할 수 있는 문서를 샘플링 하는 방법을 제시하고, 이때 얻은 하드 네거티브의 집합을 주기적으로 업데이트 하여 효과적으로 대조학습을 진행하는 방법을 제안한다. 지식 기반 대화 데이터셋인 MultiDoc2Dial을 통해 평가를 수행하였으며, 실험 결과 기존 방식보다 더 높은 성능을 나타낸다.

  • PDF

Adaptive Sampling Approach for Efficient Representation of Wet Hairs (젖은 머리카락의 효율적인 표현을 위한 적응형 샘플링 방식)

  • Yun, Ju-Young;Kim, Donghui;Kim, Jong-Hyun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.559-562
    • /
    • 2022
  • 본 논문에서는 젖은 머리카락의 응집력을 효율적으로 표현할 수 있는 적응형 샘플링 기법을 제안한다. 젖은 헤어는 인접 머리카락과 달라붙어 머리카락 하단으로 뭉치는 응집력 형태를 지닌다. 헤어 동역학은 수많은 입자 구조로 연결되어있으며 머리카락의 상호작용을 고려하는 젖은 헤어의 경우 응집력 계산이 개별적인 머리카락 단위로 표현되기 때문에, 이를 위한 계산과정을 효율적으로 풀어내는 것은 중요하다. 본 논문에서는 젖은 헤어의 시뮬레이션을 효율적으로 계산하기 위해 밀도와 각도, 그리고 포화도를 고려한 적응형 샘플링 기법을 제안한다. 이는 속도와 메모리 측면에서 최적화가 가능하며 헤어 입자의 추가와 삭제를 통해 사실적인 젖은 머리카락의 응집력 표현을 실시간으로 표현할 수 있다. 본 논문에서 제안하는 방법은 실제 젖은 헤어와 유사한 결과를 보여주며, 실시간 프로그램에서 사람의 젖은 모발 또는 동물의 젖은 털의 특징 등을 표현하는데 응용할 수 있다.

  • PDF

Comparison of Representative Point Sampling Methods in Surface Based Image Registration (표면정보 기반 영상정합에서의 대표점 추출기법 비교 연구)

  • Park, Ji-Young;Choi, Yoo-Joo;Kim, Myoung-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11a
    • /
    • pp.347-350
    • /
    • 2003
  • 표면정보 기반 영상정합기법은 대상기관에서 추출된 표면정보를 기반으로 변환을 추정하여 서로 다른 영상의 전체적 형태의 유사성 정도를 최대화함으로써 정합을 수행하는 방법이다. 정합 수행에 있어 전체 객체를 가장 잘 대표하는 특정 개수의 표면점을 추출하고, 이 대표점으로부터 변환 값을 계산하는 것이 영상정합의 합리적인 최적화 단계를 위해 필수적이다. 대표점 추출결과에 따라 전체 정합의 결과가 달라지게 되므로 정합의 변환요소 값을 정확하게 구해낼 수 있는 대표점을 추출하기 위해 적절한 샘플링 기법의 선택이 요구된다. 본 연구에서는 효율적인 표면정보 기반 다중 모달리티 영상정합을 위해 계통추출법 기반 샘플링 기법과 특징점 탐지 기법 기반 샘플링 기법의 성능을 비교 분석하였다.

  • PDF

Data Sampling Strategy for Korean Speech Emotion Classification using wav2vec2.0 (wav2vec2.0을 활용한 한국어 음성 감정 분류를 위한 데이터 샘플링 전략)

  • Mirr-Shin;Youhyun Shin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.493-494
    • /
    • 2023
  • 음성 기반의 감정 분석은 인간의 감정을 정확하게 파악하는 데 중요한 연구 분야로 자리잡고 있다. 최근에는 wav2vec2.0과 같은 트랜스포머 기반의 모델이 음성 인식 분야에서 뛰어난 성능을 보이며 주목받고 있다. 본 연구에서는 wav2vec2.0 모델을 활용하여 한국어 감성 발화 데이터에 대한 감정 분류를 위한 데이터 샘플링 전략을 제안한다. 실험을 통해 한국어 음성 감성분석을 위해 학습 데이터를 활용할 때 감정별로 샘플링하여 데이터의 개수를 유사하게 하는 것이 성능 향상에 도움이 되며, 긴 음성 데이터부터 이용하는 것이 성능 향상에 도움이 됨을 보인다.