• 제목/요약/키워드: 유사도함수

검색결과 254건 처리시간 0.028초

데이터베이스에서 유사도 질의 처리 비용 감소 방법 (A Method of Reducing the Processing Cost of Similarity Queries in Databases)

  • 김선경;박지수;손진곤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권4호
    • /
    • pp.157-162
    • /
    • 2022
  • 오늘날 대부분의 데이터는 데이터베이스(database: DB)에 저장된다. 이러한 DB 환경에서 사용자는 자신이 원하는 데이터를 찾아줄 것을 DB에게 요청하게 된다. DB 질의 중 유사도 질의는 DB 사용자가 원하는 조건으로 유사도가 포함되어 있는 것을 말한다. 그러나 유사도 질의를 처리하기 위한 과정은 처리 레코드의 범위를 줄일 수 있는 색인을 이용하기 힘들어 테이블의 전체 레코드에 대해서 매번 유사도를 계산하는 비용이 높다. 본 논문은 이러한 문제점을 해결하기 위하여 경량 유사도 함수를 정의한다. 경량 유사도 함수는 유사도 함수에 비해 데이터를 여과하는 정확도는 떨어지지만 비용이 유사도 함수에 비하여 적게 소모되는 특징이 있다. 이러한 경량 유사도 함수의 특징을 이용하여 유사도 질의 처리 비용 감소 방법을 제시한다. 그리고 유클리드 거리 함수에 경량 유사도 함수로 체비쇼프 거리를 제시하고 기존의 유사도 함수를 이용하는 질의와 경량 유사도 함수를 이용하는 질의의 처리 비용을 비교한다. 그리고 실험을 통하여 유클리드 유사도에 대한 경량 유사도 함수로 체비쇼프 거리를 적용하였을 때 유사도 질의 처리 비용이 감소하는 것을 확인한다.

도로 네트워크에서의 유사 궤적 클러스터링 (Similar Trajectory Clustering on Road Networks)

  • 백지행;원정임;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.256-260
    • /
    • 2006
  • 본 논문에서는 도로 네트워크내의 이동 객체들을 대상으로 하는 효과적인 유사 궤적 검색 및 클러스터링 기법에 대하여 논한다. 이동 객체들 간의 유사도 측정을 위한 기존의 기법들은 대부분 유클리디안 공간 상의 궤적들을 대상으로 한다. 그러나 실제 응용에서 대부분의 이동 객체들은 도로 네트워크 공간 상에 존재하므로, 이러한 실제 상황을 반영하는 유사도 측정 방식이 요구된다. 본 논문에서는 각 이동 객체가 시간에 따라 지나간 도로 세그먼트들의 리스트를 궤적이라 정의하고, 이렇게 정의된 궤적들을 대상으로 하는 새로운 유사도 측정 함수를 제안한다. 제안된 유사도 측정 함수는 궤적을 이루는 도로 세그먼트의 길이와 식별자 정보를 이용한다. 제안된 유사도 측정 함수에 의하여 측정된 각 궤적 쌍 간의 유사도를 기반으로 전체 궤적들을 FastMap을 이용하여 k차원 공간상의 점들로 사상하고, 이들을 k-medoids 방식을 이용하여 클러스터링 한다. 구성된 클러스터와 연관된 사용자 정보, 도로 정보 등을 함께 사용자에게 제공하는 활용 예를 제시함으로써 제안된 기법이 실제 응용에 유용하게 사용될 수 있음을 보인다.

  • PDF

크로마 레벨 표현, 동적 시간 왜곡, 꺾인 거리함수에 기반한 멜로디 사이의 유사도 개발 (Development of melody similarity based on chroma representation, dynamic time warping, and hinge distance)

  • 장달원;박성주;장세진;이석필
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.258-260
    • /
    • 2011
  • 이 논문에서는 쿼리-바이-싱잉/허밍 (Query-by-singing/humming, QbSH) 시스템 또는 커버 노래 인식 (cover song identification) 시스템에서 사용 가능한 멜로디 유사도를 제안한다. QbSH 또는 커버 노래 인식은 디지털 음악의 사용이 보편화되면서 음악 검색의 방법으로 많은 연구가 진행되어 오고 있다. 멜로디 유사도는 이런 시스템을 구현하는데 필수적인 요소이며, 두 개의 음악에서 멜로디가 추출되었다고 가정하고, 추출된 멜로디 사이의 유사한 정도를 수치로 표현한다. QbSh 시스템이나 커버 노래 인식 시스템은 멜로디 유사도에 기반하여 입력 노래와 유사한 노래를 데이터베이스에서 검색하는 작업을 수행한다. 이 논문에서 제안하는 멜로디 유사도 방식은 기존의 많이 연구되던 동적 시간 왜곡 (dynamic time warping, DTW) 방법과 크로마 표현 방법 (chroma representation)을 사용하였다. DTW방법은 비대칭적으로 사용하고 미디 노트 영역에서 표현된 멜로디 특징은 0이상 12 미만의 크로마 레벨로 표현하였다. 기존의 방법에서는 정수값을 많이 사용하였으나 이 논문에서는 실수값을 사용한다. DTW 에 사용하는 거리 함수를 기존에 사용하던 차이의 절대값 대신 꺾인 함수 형태를 사용함으로써 성능을 높였다. QbSH 시스템에서의 실험을 통해서 성능을 검증하였다. 본 논문에서는 10-12초 길이의 1000번의 쿼리(Query)에 대해서 28시간 정도의 데이터베이스에서 실험한 결과, 순위 역의 평균 (Mean reciprocal rank, MRR) 값이 0.713을 보였다.

  • PDF

유사도 통합에 관한 연구 (A Study on Integrating Similarities)

  • 김선경;박지수;손진곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.53-56
    • /
    • 2020
  • 유사도는 두 객체의 비슷한 정도를 실수로 나타낸 것이며 반대 개념인 다른 정도를 나타내는 것을 거리라 한다. 실세계에서 정확히 같은 것은 존재하기 힘들기 때문에 많은 응용 분야에서 유사도나 거리를 이용한다. 거리 중 대표적인 것으로 유클리드 공간에서 두 점 사이의 직선거리이다. 이 거리를 유클리드 거리라고 한다. 코사인 유사도는 벡터 공간에서 두 벡터 사이각의 코사인 값이다. 이외에도 용도에 따라 다양한 거리 또는 유사도가 연구되고 있다. 수학적으로 유사도는 이변수 함수로 나타낸다. 앞선 연구에서 민코프스키는 맨하탄 거리, 유클리드 거리 등을 매개변수 p를 이용하여 하나의 식으로 통합하였다. 이러한 유사도 통합은 유사도에 대한 새로운 통찰력을 제공하고 또 다른 응용을 제공한다. 본 논문은 기존 유사도의 의미를 개관하고 추가적인 매개변수를 도입하여 민코프스키 거리와 코사인 유사도를 통합한 식을 제시한다.

서로 다른 버전의 동일 오픈소스 함수 간 효율적인 유사도 분석 기법 (Efficient Similarity Analysis Methods for Same Open Source Functions in Different Versions)

  • 김영철;조은선
    • 정보과학회 논문지
    • /
    • 제44권10호
    • /
    • pp.1019-1025
    • /
    • 2017
  • 바이너리 유사도 분석은 취약점 분석, 악성코드 분석, 표절 탐지 등에서 사용되고 있는데, 분석대상 함수가 알려진 안전한 함수와 동일하다는 것을 증명해주면 바이너리 코드의 악성행위 분석, 취약점 분석 등의 효율성을 높이는 데에 도움이 될 수 있다. 하지만 기존에는 동일 함수의 서로 다른 버전에 대한 유사도 분석에 대해서 별도로 이루어진 연구가 거의 없었다. 본 논문에서는 바이너리로부터 추출 가능한 함수 정보들을 바탕으로 다양한 방법을 통해 함수 단위의 유사도를 분석하고 적은 시간으로 효율적으로 분석할 수 있는 방안을 모색한다. 특히 OpenSSL 라이브러리의 서로 다른 버전을 대상으로 분석을 수행하여 버전이 다른 경우에도 유사한 함수를 탐지하는 것을 확인한다.

커버곡 검색 정확도 향상을 위한 적합도 기반 크로마그램 쌍별 유사도 (A relevance-based pairwise chromagram similarity for improving cover song retrieval accuracy)

  • 서진수
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.200-206
    • /
    • 2024
  • 음악 유사도 계산은 음악 검색 서비스 구현에서 중요한 구성 요소 중 하나이다. 본 논문은 커버곡 검색 성능을 제고하기 위해서, 크로마그램 벡터 별로 커버곡 검색 적합도를 구하여 음악 유사도 계산 시 가중치로 활용한다. 커버곡 검색 적합도는 확률 적합도 모델을 이용하여 구한다. 커버곡 검색에 도움이 될 수 있는 분별도가 높은 벡터에 높은 가중치를 부여하고, 흔하게 존재하여 분별도가 떨어지는 벡터에 낮은 가중치를 부여하는 방식으로 음악 유사도 함수를 유도한다. 두 가지 커버곡 실험 데이터셋에서 성능 비교를 수행하여 제안한 음악 유사도 함수가 커버곡 검색 성능을 개선시킬 수 있음을 보였다.

지면과 하천망의 상호작용에 따른 재조정된 폭 함수의 거동해석 (Behavioral Analysis of Re-scaled Width Function by Interaction between Overland and Stream network)

  • 김주철;김정곤;이상진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.296-296
    • /
    • 2011
  • 유역의 폭 함수는 출구를 기준으로 동일한 거리에 위치한 link의 개수로 정의된다. 하천망을 구성하는 기본 성분 중의 하나인 link는 동일한 유역의 경우 유사한 평균길이와 직접배수면적을 갖는 것으로 알려져 있다. 이는 폭 함수가 흐름방향 축을 따라 정의되는 지점별 배수면적의 기여도와 동일함을 의미하는 것으로 유역의 형태학적 특성에 따라 조직되는 초기유량분포함수로 해석할 수 있다. 따라서 DEM을 기반으로 원점으로부터 동일한 거리에 위치한 pixel의 수를 계량할 경우 비교적 쉽게 유역의 폭 함수를 유도할 수 있게 된다. 또한 물 입자의 동적특성에 따라 폭 함수의 흐름방향 축을 시간 축으로 재조정할 경우 대상 유역에 대한 수문학적 응답함수로의 변환이 가능해 진다. 본 연구에서는 보청천 시험유역의 탄부수위표 지점을 출구로 하여 DEM으로부터 폭 함수를 작성하고 지면과 하천유속의 차에 따른 운동학적 확산효과만을 고려하여 재조정된 폭 함수를 다음 그림과 같이 유도하여 보았다. Figs 1, 2에서 주목되는 사항은 왜곡도의 반전으로 부왜도의 형태를 갖던 폭 함수가 정왜도의 형태를 갖는 수문학적 응답함수(순간단위도)로 변환되어 가는 과정을 시각적으로 확인할 수 있다. 이는 Mod-Clark 방법에 따른 준분포형 순간단위도의 유도과정과 유사한 것으로 이에 따라 선형저수지의 저류효과는 지면과 하천유속의 차에 따른 운동학적 확산효과와 동일한 거동을 보일 수 있음이 추론된다.

  • PDF

저니키 모멘트 서술자를 이용한 M:N 면 객체 쌍의 형상 유사도 측정 (Shape similarity measure for M:N areal object pairs using the Zernike moment descriptor)

  • 허용;유기윤
    • 한국측량학회지
    • /
    • 제30권2호
    • /
    • pp.153-162
    • /
    • 2012
  • 본 연구는 저니키 모멘트 서술자를 이용하여 객체 쌍의 기수성에 영향을 받지 않고 M:N 면 객체 쌍의 형상 유사도를 측정할 수 있는 방법을 제안한다. 제안된 형상 유사도는 저니키 기저함수에 객체 집합의 공간적 분포 영역을 투영하여 얻어지는 모멘트를 이용하기 때문에 형상을 구성하는 객체들의 기수성에 영향을 받지 않는다. 또한 낮은 차수의 기저함수에 대응되는 모멘트는 전역적인 형상을 표현하고, 높은 차수의 기저함수에 대응되는 모멘트는 지역적인 형상을 표현하기 때문에 원형상과 유사한 수준으로 형상을 복원할 수 있는 차수까지의 모멘트를 이용함으로써 효과적으로 형상을 서술하고 비교하는 것이 가능하다. 제안된 방법은 서울시 지역의 도로명주소 지도와 차량용 항법 지도의 건물 객체를 대상으로 적용 및 평가하였다. 기존 중첩면적비를 이용한 유사도에 비하여 제안된 유사도는 기수성의 변화에 강건함을 확인할 수 있었다.

거리측도를 이용한 유사도의 구성과 퍼지 넘버를 이용한 유사도와의 비교연구 (Comparison Study for similarities based on Distance Measure and Fuzzy Number)

  • 이상혁
    • 한국지능시스템학회논문지
    • /
    • 제17권1호
    • /
    • pp.1-6
    • /
    • 2007
  • 거리측도를 이용한 유사도를 구성하였고 제안된 유사도의 유용성을 증명을 통하여 확인 하였다. 퍼지 넘버와 무게 중심 법을 이용한 기존의 유사도 구성에 대한 결과를 소개하였고 두 가지의 유사도를 다양한 형태의 소속 함수에 대하여 유사도 계산을 통하여 비교하였다.

이미지 상관관계함수를 이용한 디지털 영상의 유사도 비교에 관한 연구 (Study on the Correlation between Digital Images using ICOR)

  • 양형규;최종호
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.75-82
    • /
    • 2009
  • 영상의 비교는 PSNR을 이용하는 것이 일반적이다. PSNR이 35이상일 경우 육안으로 품질 차이를 구분하기 어렵다고 판단한다. 2006년 Lee 등은 원본 이미지 대신 원본 이미지의 MSB 비트열을 공개함으로써 소유권을 증명할 수 있는 프로토콜을 제안하면서, 두 이미지의 MSB 비트열의 유사도를 측정하기 위한 새로운 함수를 사용하였다. 이때의 유사도는 품질을 측정하기 위한 PSNR과는 그 의미가 조금 다른 측면이 있다. 즉, 원본 이미지로부터 생성된 대상 이미지가 현저히 떨어질 경우, PSNR은 매우 낮은 값을 보이지만 품질이 떨어지더라도 유사도 측면에서 본다면 두 영상의 상관관계는 매우 높게 나와야 할 것이다. 본 논문에서는 Lee 등이 제안한 MSB 비교 함수를 수정한 후, ICOR함수를 제안하였으며, 이 함수를 이용하여 두 이미지의 상관관계 판단에 적용할 수 있는지 분석하였다.