• 제목/요약/키워드: 유사도 측정 함수

검색결과 212건 처리시간 0.027초

도로 네트워크에서의 유사 궤적 클러스터링 (Similar Trajectory Clustering on Road Networks)

  • 백지행;원정임;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.256-260
    • /
    • 2006
  • 본 논문에서는 도로 네트워크내의 이동 객체들을 대상으로 하는 효과적인 유사 궤적 검색 및 클러스터링 기법에 대하여 논한다. 이동 객체들 간의 유사도 측정을 위한 기존의 기법들은 대부분 유클리디안 공간 상의 궤적들을 대상으로 한다. 그러나 실제 응용에서 대부분의 이동 객체들은 도로 네트워크 공간 상에 존재하므로, 이러한 실제 상황을 반영하는 유사도 측정 방식이 요구된다. 본 논문에서는 각 이동 객체가 시간에 따라 지나간 도로 세그먼트들의 리스트를 궤적이라 정의하고, 이렇게 정의된 궤적들을 대상으로 하는 새로운 유사도 측정 함수를 제안한다. 제안된 유사도 측정 함수는 궤적을 이루는 도로 세그먼트의 길이와 식별자 정보를 이용한다. 제안된 유사도 측정 함수에 의하여 측정된 각 궤적 쌍 간의 유사도를 기반으로 전체 궤적들을 FastMap을 이용하여 k차원 공간상의 점들로 사상하고, 이들을 k-medoids 방식을 이용하여 클러스터링 한다. 구성된 클러스터와 연관된 사용자 정보, 도로 정보 등을 함께 사용자에게 제공하는 활용 예를 제시함으로써 제안된 기법이 실제 응용에 유용하게 사용될 수 있음을 보인다.

  • PDF

온톨로지 계층관계를 이용한 서비스 발견 알고리즘

  • 최원종;양재영;최중민;조현규;조현성;김경일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.28-30
    • /
    • 2003
  • 인터넷망의 지속적인 발달과 더불어 웹서비스가 차지하는 비중은 매우 커지고 있다. 이와 관련해 서비스 발견을 위한 다양한 노력들이 진행되었으며. 그 중에서도 DAML-S문서로 기술된 매치메이커에서 제시한 알고리즘은 서비스 발견자와 서비스 제공자사이의 서비스 발견에 대한 유사도 측정의 한 방법을 제시하고 있다. 하지만 온톨로지상의 관계표현에 있어 네 가지 규칙만을 적용하여 정밀한 유사도 측정이 불가능하다는 단점이 있다. 따라서 본 논문에서는 기존의 알고리즘의 개선을 위해 두 가지 유사도 측정함수 1) 계층구조함수 2) 계층계수함수를 정의하고, 이에 기반한 새로운 서비스 발견 알고리즘을 제시하고자 한다.

  • PDF

이변량 반복측정자료에서 가중일치상관계수의 추정

  • 강보경;김규성
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.261-266
    • /
    • 2000
  • 이변량 반복측정자료에서 Chinchilli 등(1996)이 제안한 가중일치상관계수는 두 변수의 일치성을 나타내는 측도이다. 기존에 제안된 가중일치상관계수 추정법은 변동효과 및 측정오차의 분산성분을 각각 최소제곱법으로 비편향 추정하여 구하는 것이다. 본 연구에서는 반복측정자료의 주변 우도함수를 설정한 후, 우도함수에 기초한 분산성분을 구하여 가중일치상관계수를 추정하는 방법을 제안한다. 이때, 각 분산성분은 유사/의사 우도함수 및 사후 분포에서 반복시행을 통하여 구해진다.

  • PDF

웹상의 이질적 이미지 데이터베이스를 선택하기 위한 복합 추정 방법 (Hybrid Estimation Method for Selecting Heterogeneous Image Databases on the Web)

  • 김덕환;이석룡;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.464-475
    • /
    • 2003
  • 웹상의 이미지 데이타베이스들은 자치성과 이질성이라는 두 가지 다른 특성을 갖고 있다. 즉 독립적으로 만들어지고 유지되며 질의 처리 방법이 서로 다르다. 분산된 이미지 데이타베이스들에 대한 내용기반 검색에서, 메타 서버의 유사성 측정함수에 대하여 서로 다른 지역 유사성 측정 함수를 갖는 데이터베이스들로부터 주어진 질의 객체와 유사한 객체들을 찾는 능력을 갖는 것은 중요하다. 현재까지, 동일한 유사성 측정 함수들을 사용하는 이미지 데이타베이스들을 선택하는 방법에 대하여 많은 연구가 진행되었으나 이미지 데이타베이스들이 다른 유사성 측정함수를 사용하는 경우에 대한 연구는 없었다. 본 논문에서는 웹상의 많은 이질적인 이미지 데이타베이스들 중 질의에 유사한 객체들을 보다 많이 가지고 있는 데이타베이스들을 찾는 문제를 다룬다. 데이타베이스들의 순위는 이미지 데이타베이스들의 압축된 히스토그램 정보와 적은 수의 표본 객체들을 사용하는 복합 추정에 기반을 두고 있다. 구형 영역 질의에 대한 선택률을 추정하기 위하여 히스토그램 정보를 사용하며, 유사성 측정 함수의 차이로 인한 선택률 오차를 보정하기 위하여 표본 객체들을 이용한다. 많은 수의 이미지 데이타에 대한 상세한 실험은 제안된 방법이 이질적인 분산 환경에서 효율적임을 보여준다.

대수적 특성을 고려한 벡터 유사도 측정 함수의 고찰 (Survey on Vector Similarity Measures : Focusing on Algebraic Characteristics)

  • 이동주;심준호
    • 한국전자거래학회지
    • /
    • 제17권4호
    • /
    • pp.209-219
    • /
    • 2012
  • 전자 상거래 시스템 환경에서 상품, 상품평, 사용자 특성 등은 주요한 정보 객체이다. 벡터는 객체의 표현기법으로 널리 사용되고 있다. 전자 상거래 데이터 객체들은 벡터로서 모델되어 각 특질에 해당하는 차원의 숫자 값으로 표현될 수 있다. 전자 상거래의 특성상 이러한 객체들은 방대한 분량이 되고 있고, 이중 여러 객체들은 실제로 같거나 유사한 객체일 수 있다. 따라서 객체간 유사도 측정은 전자상거래 시스템에서 중요한 역할을 한다. 본 논문에서는 벡터 객체에서 사용되는 대표적인 유사도 측정 함수들을 고찰한다. 유사 함수들은 각각의 대수적 특성을 가지고 있고 서로 연결된 특성을 보인다. 이러한 특성을 분석하고 또한 유사 함수들을 분류해 본다. 이러한 과정은 표준 벡터 유사도 함수가 가져야 할 대수적 특성을 제시해준다.

이미지 상관관계함수를 이용한 디지털 영상의 유사도 비교에 관한 연구 (Study on the Correlation between Digital Images using ICOR)

  • 양형규;최종호
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.75-82
    • /
    • 2009
  • 영상의 비교는 PSNR을 이용하는 것이 일반적이다. PSNR이 35이상일 경우 육안으로 품질 차이를 구분하기 어렵다고 판단한다. 2006년 Lee 등은 원본 이미지 대신 원본 이미지의 MSB 비트열을 공개함으로써 소유권을 증명할 수 있는 프로토콜을 제안하면서, 두 이미지의 MSB 비트열의 유사도를 측정하기 위한 새로운 함수를 사용하였다. 이때의 유사도는 품질을 측정하기 위한 PSNR과는 그 의미가 조금 다른 측면이 있다. 즉, 원본 이미지로부터 생성된 대상 이미지가 현저히 떨어질 경우, PSNR은 매우 낮은 값을 보이지만 품질이 떨어지더라도 유사도 측면에서 본다면 두 영상의 상관관계는 매우 높게 나와야 할 것이다. 본 논문에서는 Lee 등이 제안한 MSB 비교 함수를 수정한 후, ICOR함수를 제안하였으며, 이 함수를 이용하여 두 이미지의 상관관계 판단에 적용할 수 있는지 분석하였다.

영역 모델과 객체후보군의 유사도 측정에 관한 연구 (A Study on the Degree of Signature Similarity between Domain Model and Object Candidate Groups)

  • 박성옥;노경주;이문근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.522-524
    • /
    • 1999
  • 절차지향 소프트웨어를 객체지향 소프트웨어로 변환하는 여러 가지 방법이 존재한다. 프로그램을 변환하기 위하여 일반적으로 함수, 변수와 자료형들 간의 관계를 이용한다. 이들간의 관계성을 이용하면 결과로서 객체 후보가 생성된다. 생성된 객체 후보와 영역 전문가에 의하여 생성된 영역 모델을 비교하여 두 모델간의 유사성을 측정하여야 한다. 본 논문에서는 클래스의 시그너처(클래스 이름, 속성의 이름, 속성의 자료형, 메소드 이름, 메소드의 리턴형, 메소드 파라미터의 자료형)을 이용하여 클래스와 객체 후보의 유사도를 측정하고, 측정된 유사도의 평균값을 이용하여 객체 후보군의 유사도를 측정한다. 기존의 연구 방법과는 다르게 n개의 클래스와 m개의 객체 후보사이의 구문적 측면의 유사도 측정뿐만이 아니라 의미적 측면의 유사도를 측정하는 방법을 제시하여 최적합 객체 후보군을 추출하도록 하였다.

  • PDF

프로그램 코드 분석을 위한 유사도 측정 및 가시화 기법 (A Similarity Measurement and Visualization Method for the Analysis of Program Code)

  • 이영주;이정진
    • 한국멀티미디어학회논문지
    • /
    • 제16권7호
    • /
    • pp.802-809
    • /
    • 2013
  • 본 논문에서는 프로그래밍 언어에 정의되는 지정자와 키워드가 프로그램 코드 상에서 연속적인 패턴으로 나타나게 될 때, 해당 연속 패턴들의 빈도와 길이를 측정하여 두 코드 사이의 유사성을 측정하는 기법을 제안한다. 또한, 이러한 분석 결과를 정형적 개념 분석 기법을 이용하여 가시화하는 기법을 제안한다. 제안 기법은 기존의 유사도 측정 기법에서는 고려하지 않았던 단어 인접성을 유사도 측정에 반영한다. 함수 단위로 지정자와 키워드 패턴을 이용하여 함수의 호출 순서나 수행 순서에 상관없이 표절을 탐지할 수 있다. 또한, 유사도 측정 결과는 정형적 개념 분석 기법을 이용하여 격자(lattice)로 시각화되어 사용자의 이해도를 높일 수 있다. 실험 결과 제안 기법은 96%의 표절 탐지 성공률을 보여주었다. 제안 기법은 프로그램 코드 뿐만 아니라 일반 문서의 분석에도 적용될 수 있다.

에너지와 물수지 연계방법과 TDR로부터 얻어진 매일 토양 함수량의 비교 (Comparison of Daily Soil Water Contents between Energy BalanceWater Budget Approach and TDR)

  • 임창수
    • 물과 미래
    • /
    • 제29권4호
    • /
    • pp.119-129
    • /
    • 1996
  • 여름기간 동안 두 다른 준건조 기지역에 위치한 소유역들(Lucky Hills 그리고 Kendall)로부터 eddy 상관을 기초로 한 에너지 수지와 물수지 방법 그리고 TDR 방법을 이용하여 매일의 토양 함수량이 측정되어졌으며, 그 두 다른 방법들로부터 측정되어지고 계산되어진 매일의 토양 함수량에 대한 비교가 있었다. 그 비교는 유역을 대상으로 하는 경우에 있어서 eddy상관을 이용한 에너지 수지와 물수지 방법 그리고 TDR 방법을 사용한 토양 함수량 특정 방법에 대한 정확돌알아보는데 유용하다. 토양 함수량을 측정하는 이 두 방법들로부터 구해진 회귀 사이의 유사도는 이 방법들 사이의 상관 정도를 알아보는 것에 의해서 설명되어졌다. 단순선형상관분석은 Lucky Hills 유역에서는 TDR 방법에 의해서 측정된 토양 함수량이 에너지와 물수지 방법에 의해서 측정된 토양 함수량의 58% 정도임을 나타냈고, 그리고 Kendall 유역에서는 63% 정도임을 나타내었다. 분포도와 상관분석 결과는, 소유역에서 토양 함수량 측정을 위한 두 방법들에 있어서 유의한 차이를 나타내지 않았다.

  • PDF

2006년 유사량 측정 성과 분석 (Sediment Measurement Characteristics Analysis in 2006)

  • 한명선;권동석;송인열;이연길;강규상;정성원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.1689-1695
    • /
    • 2007
  • 본 연구는 2006년 전국 4대 권역, 6개 지점에 대한 유사량 측정성과에 대한 분석을 실시하였다. 6개 지점에 대해 살펴보면 한강권역은 적성(임진강수계) 및 여주 지점, 낙동강 권역은 왜관 및 낙동 지점, 금강 권역은 공주 지점, 영산강 권역은 구례(섬진강수계) 지점이다. 이들 지점에 대해 유사량 측정 실시하였고, 그 결과를 바탕으로 현장에 적합한 유사량 측정 기준, 부유사 및 하상토 입경 분포 곡선 분석, 부유사량 산정, 향후 개선사항에 대해 정리하였다. 유사량 분석 결과는 다음과 같다. 전반적으로 측선별 농도의 편차는 크지 않는 것으로 나타났으며, 6개지점의 모두 유량 및 유사량 관계를 기존의 단순 지수함수로 표현하기에는 측정성과의 분산이 너무 큰 것으로 나타났다. 이는 기존 보고서에도 알려진 바와 같이 수위 상승시와 하강시의 유사량 특성이 너무 상이하기 때문이다. 향후 정밀한 측정 및 분석으로 유량 및 유사량 관계를 적절히 표현하는 방식이 필요하다고 판단된다. 그리고, 향후 전문인력에 의한 정밀 유사량 관측과 장기관측을 통해 보다 신뢰성 있는 유사량 특성을 분석할 수 있을 것이며, 홍수 방재를 위한 기반을 마련할 수 있을 것이다.

  • PDF