• 제목/요약/키워드: 유사도 함수

검색결과 1,079건 처리시간 0.036초

데이터베이스에서 유사도 질의 처리 비용 감소 방법 (A Method of Reducing the Processing Cost of Similarity Queries in Databases)

  • 김선경;박지수;손진곤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권4호
    • /
    • pp.157-162
    • /
    • 2022
  • 오늘날 대부분의 데이터는 데이터베이스(database: DB)에 저장된다. 이러한 DB 환경에서 사용자는 자신이 원하는 데이터를 찾아줄 것을 DB에게 요청하게 된다. DB 질의 중 유사도 질의는 DB 사용자가 원하는 조건으로 유사도가 포함되어 있는 것을 말한다. 그러나 유사도 질의를 처리하기 위한 과정은 처리 레코드의 범위를 줄일 수 있는 색인을 이용하기 힘들어 테이블의 전체 레코드에 대해서 매번 유사도를 계산하는 비용이 높다. 본 논문은 이러한 문제점을 해결하기 위하여 경량 유사도 함수를 정의한다. 경량 유사도 함수는 유사도 함수에 비해 데이터를 여과하는 정확도는 떨어지지만 비용이 유사도 함수에 비하여 적게 소모되는 특징이 있다. 이러한 경량 유사도 함수의 특징을 이용하여 유사도 질의 처리 비용 감소 방법을 제시한다. 그리고 유클리드 거리 함수에 경량 유사도 함수로 체비쇼프 거리를 제시하고 기존의 유사도 함수를 이용하는 질의와 경량 유사도 함수를 이용하는 질의의 처리 비용을 비교한다. 그리고 실험을 통하여 유클리드 유사도에 대한 경량 유사도 함수로 체비쇼프 거리를 적용하였을 때 유사도 질의 처리 비용이 감소하는 것을 확인한다.

한글의 미적 평가를 위한 특징 추출 및 유사도 함수 정의 (Feature Extraction and Similarity Measure Function Define For Beauty Evaluation of Korean Character)

  • 한군희;오명관;이형우;전병민
    • 한국콘텐츠학회논문지
    • /
    • 제2권1호
    • /
    • pp.59-67
    • /
    • 2002
  • 본 논문에서는 입력의 자동화 및 교육을 위한 문자 익히기 시스템을 위하여 자소의 특징 추출과 유사도 함수를 정의하여 한글에 대한 미적평가를 수행하였다. 이를 위해 한글 문자의 자소에 대한 특징 추출 및 유사도 함수를 정의 한 후 표준 문자와 입력 문자가 얼마나 유사한지를 평가하는 방법을 제안하였다. 표준 문자와 입력 문자의 획에 대한 특징 추출 및 유사도 함수를 정의하였으며, 다양한 입력 문자 패턴에 대해 표준 문자 패턴과 얼마나 유사한지를 실험한 결과 예상한 값과 유사하게 일치하는 실험 결과를 얻을 수 있었다. 또한 일반 사람들의 미적 평가 결과와 제안한 방법의 실험 결과가 유사하게 일치한다는 결과도 얻을 수 있었다.

  • PDF

서로 다른 버전의 동일 오픈소스 함수 간 효율적인 유사도 분석 기법 (Efficient Similarity Analysis Methods for Same Open Source Functions in Different Versions)

  • 김영철;조은선
    • 정보과학회 논문지
    • /
    • 제44권10호
    • /
    • pp.1019-1025
    • /
    • 2017
  • 바이너리 유사도 분석은 취약점 분석, 악성코드 분석, 표절 탐지 등에서 사용되고 있는데, 분석대상 함수가 알려진 안전한 함수와 동일하다는 것을 증명해주면 바이너리 코드의 악성행위 분석, 취약점 분석 등의 효율성을 높이는 데에 도움이 될 수 있다. 하지만 기존에는 동일 함수의 서로 다른 버전에 대한 유사도 분석에 대해서 별도로 이루어진 연구가 거의 없었다. 본 논문에서는 바이너리로부터 추출 가능한 함수 정보들을 바탕으로 다양한 방법을 통해 함수 단위의 유사도를 분석하고 적은 시간으로 효율적으로 분석할 수 있는 방안을 모색한다. 특히 OpenSSL 라이브러리의 서로 다른 버전을 대상으로 분석을 수행하여 버전이 다른 경우에도 유사한 함수를 탐지하는 것을 확인한다.

함수에 의한 정규화를 이용한 local alignment 알고리즘 (A Local Alignment Algorithm using Normalization by Functions)

  • 이선호;박근수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권5_6호
    • /
    • pp.187-194
    • /
    • 2007
  • Local alignment 알고리즘은 두 문자열을 비교하여 크기가 l, 유사도 점수가 s인 부분 문자열쌍을 찾는다. 크기가 충분히 크고 유사도 점수도 높은 부분 문자열 쌍을 찾기 위해 단위 길이당 유사도 점수 s/l을 최대화하는 정규화 방법이 제안되어있다. 본 논문에서는 증가함수 f, g를 도입하여 f(s)/g(l)을 최대화하는, 함수에 의한 정규화 방법을 제시한다. 여기서 함수 f, g는 DNA 서열을 비교하는 실험을 통해 정한다. 이러한 실험에서 함수에 의한 정규화 방법이 좋은 local alignment를 찾는다. 또한 유사도 점수의 기준으로 longest common subsequence를 채택한 경우, 기존의 정규화 알고리즘을 이용하면 별다른 시간 손실 없이 함수에 의해 정규화된 점수 f(s)/g(l)을 최대화 할 수 있음을 보인다.

SUC의 확장 및 범용 유사 벤트 함수에 대한 고찰 (A study on suc and generalized semi-bent functions)

  • 박상우;지성택;김광조
    • 정보보호학회지
    • /
    • 제6권3호
    • /
    • pp.49-56
    • /
    • 1996
  • 본 논문에서는 컴퓨터 조사를 통하여, 참고 문헌[15]에서 제안된 범용 유사 벤트 함수 설계 방법이 범용 유사 벤트 함수 모두를 설계하지 못함을 보인다. 다음으로, 본 논문의 주요 결과로서 기존 SUC[7,16]의 정의에 대해, 고려되는 부울 함수의 개수와 PC 차수를 확장시킨, 확장된 SUC 을 새로이 정의하고 확장된 SUC을 만족하는 5차 범용 유사 벤트 함수들의 예를 제시한다.

  • PDF

하천에서 유사의 침전 위치에 대한 확률밀도함수 분석 (Analysis of Probability Density Function of Deposition Spot in Open Channel Flow)

  • 오정선;최성욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.50-50
    • /
    • 2016
  • 하천에서 유사 및 오염물질의 이동을 예측하기 위하여 초점을 두는 것에는 두 가지 요소가 있다. 입자의 농도로 나타낼 수 있는 양의 개념과 입자의 위치로 나타낼 수 있는 공간의 개념이 그것이다. 유사 입자와 같이 그 비중이 물보다 큰 경우, 흐름 내에서 침전과 부상의 메커니즘을 반복하게 되는데 최종적으로 바닥에 침적하는 위치는 하상변동, 서식처 등 하천관리의 다양한 측면에서 매우 중요하다. 유사 입자가 바닥에 침적하는 위치를 예측하는 데에는 난류와 지형 같은 많은 불확실한 요소가 내포되어 있어, 같은 크기의 유사 입자라 하여도 하나의 exact point로 도달하지 않는다. 이러한 불확실한 요소를 고려하여 침전 위치를 산정하는 방법에 대한 연구가 필요하다. 따라서 본 연구에서는 침전 위치를 확률밀도함수로 나타내어 분석하고자 한다. 입자의 침전 위치를 확률밀도함수로 나타내기 위하여 입자 기반의 추적 모형을 사용하여 위치 데이터를 얻었으며, 이를 실험데이터와 비교하여 검증 후 확률밀도함수로 나타내었다. 그 결과 입자의 침적 위치에 대한 확률밀도함수는 로그정규분포를 띠고 있음을 확인하였으며, 확률밀도함수를 나타내는 매개변수를 물리 기반 회귀모형식으로 일반화 하여 나타낼 수 있었다.

  • PDF

온톨로지 계층관계를 이용한 서비스 발견 알고리즘

  • 최원종;양재영;최중민;조현규;조현성;김경일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.28-30
    • /
    • 2003
  • 인터넷망의 지속적인 발달과 더불어 웹서비스가 차지하는 비중은 매우 커지고 있다. 이와 관련해 서비스 발견을 위한 다양한 노력들이 진행되었으며. 그 중에서도 DAML-S문서로 기술된 매치메이커에서 제시한 알고리즘은 서비스 발견자와 서비스 제공자사이의 서비스 발견에 대한 유사도 측정의 한 방법을 제시하고 있다. 하지만 온톨로지상의 관계표현에 있어 네 가지 규칙만을 적용하여 정밀한 유사도 측정이 불가능하다는 단점이 있다. 따라서 본 논문에서는 기존의 알고리즘의 개선을 위해 두 가지 유사도 측정함수 1) 계층구조함수 2) 계층계수함수를 정의하고, 이에 기반한 새로운 서비스 발견 알고리즘을 제시하고자 한다.

  • PDF

도로 네트워크에서의 유사 궤적 클러스터링 (Similar Trajectory Clustering on Road Networks)

  • 백지행;원정임;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.256-260
    • /
    • 2006
  • 본 논문에서는 도로 네트워크내의 이동 객체들을 대상으로 하는 효과적인 유사 궤적 검색 및 클러스터링 기법에 대하여 논한다. 이동 객체들 간의 유사도 측정을 위한 기존의 기법들은 대부분 유클리디안 공간 상의 궤적들을 대상으로 한다. 그러나 실제 응용에서 대부분의 이동 객체들은 도로 네트워크 공간 상에 존재하므로, 이러한 실제 상황을 반영하는 유사도 측정 방식이 요구된다. 본 논문에서는 각 이동 객체가 시간에 따라 지나간 도로 세그먼트들의 리스트를 궤적이라 정의하고, 이렇게 정의된 궤적들을 대상으로 하는 새로운 유사도 측정 함수를 제안한다. 제안된 유사도 측정 함수는 궤적을 이루는 도로 세그먼트의 길이와 식별자 정보를 이용한다. 제안된 유사도 측정 함수에 의하여 측정된 각 궤적 쌍 간의 유사도를 기반으로 전체 궤적들을 FastMap을 이용하여 k차원 공간상의 점들로 사상하고, 이들을 k-medoids 방식을 이용하여 클러스터링 한다. 구성된 클러스터와 연관된 사용자 정보, 도로 정보 등을 함께 사용자에게 제공하는 활용 예를 제시함으로써 제안된 기법이 실제 응용에 유용하게 사용될 수 있음을 보인다.

  • PDF

2차 텐서 기반 유사도 함수를 이용한 영상 데이터 분류 (Image Data Classification using a Similarity Function based on Second Order Tensor)

  • 윤동우;이관용;박혜영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권8호
    • /
    • pp.664-672
    • /
    • 2009
  • 최근 영상 데이터의 효율적인 표현 및 처리를 위해 텐서를 사용하는 연구가 관심을 모으고 있다. 본 연구에서는 2차 텐서로 표현된 데이터를 효과적으로 분류하기 위한 시스템을 개발하는 것을 목적으로 한다. 이를 위해 먼저 일반적인 벡터 데이터에 대해 개발되어진 클래스 요인과 환경 요인으로 이루어진 데이터 생성 모델을 확장하여 2차 텐서로 표현된 영상에 적합한 데이터 생성 모델을 정의하고, 이에 적합한 유사도 함수를 제안하였다. 제안하는 유사도 함수는 행렬정규분포를 이용하여 환경 요인의 확률분포를 추정함으로써 얻을 수 있다. 여러 벤치마크 데이터들을 이용하여 실험한 결과 2차 텐서를 사용함으로써 벡터 형태의 표현방식을 사용하는 것에 비해 분류율이 향상되었음을 확인하였다. 또한 제안하는 유사도 함수가 다른 기존의 유사도 함수에 비해 영상 데이터에 적합함을 확인할 수 있었다.