• 제목/요약/키워드: 유사도 함수

검색결과 1,079건 처리시간 0.033초

계층적 클러스터링과 문장 적합성 피드백을 이용한 상담사례 검색 시스템 (Counseling Case Retrieval System Using Hierarchical Clustering and Sentence Relevance Feedback)

  • 김승일;곽희규;김수형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.172-174
    • /
    • 1999
  • 본 논문에서는 카운셀링을 원하는 사용자가 카운셀러와 전자메일을 통해 상담을 원할 때 사용자의 상담 내용에 근거하여 유사한 사례를 검색해 주는 시스템을 제안한다. 제안방법은 문서의 계층적 클러스터링과 용어 적합성 피드백을 상담 사례 검색 시스템에 적용시켜, 상담사례에 나타나는 단어의 출현 빈도와 유사도를 통해 트리 구조를 형성하고, 이 트리 구조를 통한 하향 탐색을 수행한다. 하향 탐색을 하는 도중 노드의 매칭함수의 값이 서로 유사하여 노드 선택이 어려울 경우, 사용자에게 질의를 통해 용어를 제시하고, 사용자의 피드백을 통해 입력된 사연 내용의 가중치를 개선하여 내용에 가장 부합되는 문서를 탐색한다.

  • PDF

이진 영상 인식을 위한 효과적인 퍼지 기반 거리 인식기의 설계 (Designing of an Efficient Fuzzy-induced Distance Classifier for the Recognition of Binary Images)

  • 송영기;강환일
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.469-474
    • /
    • 2000
  • 본 논문에서는 두 이진 영상의 비교시 그 유사도를 결정하는 새로운 방법을 제안한다. 이는 두 영상사이의 최소거리에 기반한 방법이며, 제안된 방법에서는 구해진 거리 그 자체보다는 이 거리의 분포로부터 최적 거리를 계산한다. 구해진 거리 분포 함수로부터 최종적인 두 영상의 유사도는 비퍼지화 추론을 이용하여 계산되어진다. 제안한 방법을 실제 문제에 적용하여 그 우수성을 검증하였다.

  • PDF

회귀분석을 위한 로버스트 신경망

  • 황창하;김상민;박희주
    • Communications for Statistical Applications and Methods
    • /
    • 제4권2호
    • /
    • pp.327-332
    • /
    • 1997
  • 다층 신경망은 비모수 회귀함수 추정의 한 방법이다. 다충 신경망을 학습시키기 위해 역전파 알고리즘이 널리 사용되고 있다. 그러나 이 알고리즘은 이상치에 매우 민감하여 이상치를 포함하고 있는 자료에 대하여 원하지 않는 회귀함수를 추정한다. 본 논문에서는 통계물리에서 자주 사용하는 방법을 이용하여 로버스트 역전파 알고리즘을 제안하고 수학적으로 신경망과 매우 유사한 PRP(projection pursuit regression) 방법, 일반적인 역전파 알고리즘과 모의실험을 통해 비교 분석한다.

  • PDF

적합도 함수를 이용한 최적의 추천자 그룹 생성 및 유지 알고리즘 (Globally Optimal Recommender Group Formation and Maintenance Algorithm using the Fitness Function)

  • 김용구;이민호;박수홍;황철주
    • 한국정보과학회논문지:정보통신
    • /
    • 제36권1호
    • /
    • pp.50-56
    • /
    • 2009
  • 본 논문에서는 P2P 네트워크 환경에서 유사한 특성을 가진 다른 노드(node)를 찾아 추천자(recommender) 그룹을 형성하고 유지하는 새로운 알고리즘을 제안한다. 두 노드의 유사한 특성을 비교하기 위해 본 논문에서는 두 노드의 특성값(characteristic value. 이하 CV)을 이용한 적합도 검사(fitness evaluation)를 사용하여 유사도(similarity)를 확인한다. 유사도의 크기가 작을수록 두 노드는 매우 유사한 특성을 가지게 된다. 또한, 본 논문에서 제안하는 GORGFM(Globally Optimal Recommender Group Formation and Maintenance) 알고리즘은 최단 기간 내에 최적의 추천자 그룹을 형성하고 사용자의 선호도 변화에 대응할 수 있는 알고리즘이다. GORGFM 알고리즘을 평가하기 위해 본 논문에서는 매칭율(matching rate)과 얼마나 빠르고 정확하게 추천자 그룹을 형성하는가에 대해 시뮬레이션 한다. GORGFM 알고리즘은 네트워크에서뿐만 아니라 인터넷상에서 컨텐츠(contents) 검색 등과 같이 적합도 함수(fitness function)를 이용할 수 있는 모든 시스템에 적용할 수 있다.

신뢰성 높은 동적 API 시퀀스를 이용한 소프트웨어 유사성 검사 (Software Similarity Detection Using Highly Credible Dynamic API Sequences)

  • 박성수;한환수
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1067-1072
    • /
    • 2016
  • 실행코드만으로 소프트웨어 간의 유사성을 비교하거나 표절을 검사하기 위해 소프트웨어만의 고유한 특징인 소프트웨어 버스마크를 이용한다. 일반적으로 소프트웨어 버스마크는 추출 방법에 따라 정적 버스마크와 동적 버스마크로 구분되고, 추출된 방법에 따라 장단점이 뚜렷하게 나타난다. 본 논문에서는 동적 분석을 이용하여 API 시퀀스 버스마크를 추출하고 실행코드 간의 유사성 검사에 이용하는 방법을 제안한다. 제안하는 동적 시퀀스 버스마크는 프로그램이 실행되는 과정에서 호출되는 모든 API 함수 및 시스템 호출을 포함하는 기존의 방법과는 다르게 실행코드 내에 정의되어 있는 API 함수만으로 구성된 API 시퀀스를 이용한다. 추출된 동적 버스마크는 프로그램의 시작에서 종료까지 호출되는 API 시퀀스이며 이를 효율적으로 비교하기 위해 서열정렬 알고리즘을 활용한 유사성 척도를 사용한다. 여러 오픈소스 소프트웨어를 비교하여 버스마크의 신뢰성과 강인성을 검증하였다. 제안하는 동적 API 시퀀스 버스마크는 실행코드의 유사성 검사에 용이하게 활용될 수 있을 것으로 기대된다.

이종의 공간 데이터 셋의 면 객체 자동 매칭 방법 (Automated Areal Feature Matching in Different Spatial Data-sets)

  • 김지영;이재빈
    • 대한공간정보학회지
    • /
    • 제24권1호
    • /
    • pp.89-98
    • /
    • 2016
  • 본 연구에서는 축척과 갱신 주기가 상이한 이종의 공간 데이터 셋을 융합하기 위하여 사용자의 개입을 최소화하면서 다대다 관계에도 적용이 가능한 기하학적 방법론 기반의 면 객체 자동 매칭 방법을 제안하였다. 이를 위하여 첫째, 포함함수가 0.4 이상인 객체(노드)는 인접행렬에서 에지로 연결되었고, 이들 인접행렬의 곱을 반복적으로 수행하여 다대다 관계를 포함하는 후보 매칭 쌍을 선정하였다. 다대다 관계인 면 객체들은 알고리즘으로 생성된 convex hull로 단일 면 객체로 변환하였다. 기하학적 매칭을 위하여, 매칭 기준을 설정하고, 이들을 유사도 함수를 이용하여 유사도를 계산하였다. 다음으로 변환된 유사도와 CRITIC 방법으로 도출된 가중치를 선형 조합하여 형상 유사도를 계산하였다. 마지막으로 훈련자료에서 모든 가중치에 대한 정확도와 재현율을 나타낸 PR 곡선의 교차점인 EER로 임계값을 선정하고, 이 임계값을 기준으로 매칭 유무를 판별하였다. 제안된 방법을 수치지도와 도로명 주소기본도에 적용한 결과, 일부 다대다 관계에서 잘못 매칭되는 경우를 시각적으로 확인할 수 있었으나, 통계적 평가에서 정확도, 재현율, F-measure가 각각 0.951, 0.906, 0.928로 높게 나타났다. 이는 제안된 방법으로 이종의 공간 데이터 셋을 자동으로 매칭하는데 그 정확도가 높음을 의미한다. 그러나 일부 오류가 발생한 다대다 관계인 후보 매칭 쌍을 정확하게 정량화하기 위해서 포함함수나 매칭 기준에 대한 연구가 진행되어야 할 것이다.

화자 정규화를 위한 비정형 워핑함수 도출에 관한 실험 (Experiments on Extraction of Non-Parametric Warping Functions for Speaker Normalization)

  • 신옥근
    • 한국음향학회지
    • /
    • 제24권5호
    • /
    • pp.255-261
    • /
    • 2005
  • 화자들 사이의 워핑특성을 알아보기 위해 비정형 워핑함수를 도출하는 실험을 수행하였다. 이를 위해 모음의 MFCC와 LP 스펙트럼을 이용하여 화자별, 음소별 대표 스펙트럼을 선정한 다음 음소별 기준 스펙트럼을 선택하였다. 기준 스펙트럼과 대표 스펙트럼을 스펙트럼의 전체대역에서 DTW로 비교하여 화자별 워핑함수를 구한 다음, 이들을 clustering함으로써 비정형 워핑함수의 집합을 도출하였다. 이 함수집합에서 남성화자와 여성화자의 함수들이 각각 구간선형함수와 파워함수와 유사함을 관찰할 수 있었으며, 이를 근거로 이 함수들을 조합한 하이브리드 워핑함수집합을 정의하였다. 음소단위의 인식 실험을 통하여 새로 정의된 함수들의 인식률을 시험하였으며 두 함수집합 모두에서 개선된 인식률을 얻을 수 있었다.

메타분석에서 그룹화 임의효과 모형의 베이지안 해석

  • 정윤식;정호진
    • 응용통계연구
    • /
    • 제13권1호
    • /
    • pp.81-96
    • /
    • 2000
  • 본 논문은 의학분야에서 주로 사용되는 메타분석 중 그룹화 임의효과 모형(grouped random effects model)을 프라빗 연결함수(probit link function)를 이용하여 베이즈적 관점에서 연구하였다. 이때 프라빗 함수를 강요하기 위해 잠재변수를 정의하였고, 사전 분포를 달리한 세가지 모형을 고려하였다. 주어진 세가지 모형들에게서 적합한 모형 선택을 위하여 베이즈 인자(Bayes factor, BF)와 유사베이즈 인자(pseudo-Bayes factor, PsBF)를 이용하였다. 깁스샘플러와 메트로폴리스 알고리즘을 이용하여 베이지안 계산상의 어려움을 해결하였다. 예로써, 새로운 간질약에 대한 효과를 조사하기 위하여 앞에서 제시된 방법으로 해석하였다.

  • PDF

RBFN을 이용한 음소인식에 관한 연구 (A Study on the Phoneme Recognition using RBFN)

  • 안종영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.88-91
    • /
    • 1995
  • 개층형 신경망은 교사신호들의 학습으로 원하는 입출력간의 매핑을 할 수 있으므로 패턴분류를 위해 사용되어왔다. 본 논문은 계층형 신경망의 일종인 RBFN 중 GPFN 과 PNN으로 한국어 음소인식을 수행하였다. RBFN 의 구조는 계층형 신경망과 유사하나 차이점으로는 은닉층에서 시그모이드 함수, 참조벡터 및 학습알고리듬의 선택이 다르다. 특히 PNN 의 시그모이드 함수는 지수를 포함한 함수들로 대체되며 학습없이 패턴을 분류하므로 계산시간이 빠르게 수행된다. 본 실험에서는 한국어 단음절에서 모음과 자음을 추출하여 음소인식을 수행하였다. 실험 결과 학습과 평가데이타에 의한 인식률은 계층형 신경망과 비교하여 향상 되었으며, Hybrid 구성에 의한 실험에서도 항상된 인식률을 얻을 수 있었다.

  • PDF