• 제목/요약/키워드: 유사 척도

검색결과 526건 처리시간 0.03초

OWL 속성을 이용한 온톨로지 간 의미 유사도 측정 방법 (Similarity Measure between Ontologies using OWL Properties)

  • 안우식;박정은;오경환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.169-171
    • /
    • 2006
  • 인터넷이 보다 대중화되고 광범위해지면서 의미적 관계에 따라 정보를 저장하는 온톨로지 시스템이 미래의 지능적인 컴퓨터를 위한 적절한 수단으로 각광받고 있다. 하지만 온톨로지와 같은 메타 데이터를 사용한 방법은 그 사용 목적 또는 작성자의 개인적인 관점에 따라 다양한 이질적인(heterogeneous) 형태를 띠게 된다. 이러한 이질적인 정보들은 데이터가 다른 시스템에서 처리되는 것을 어렵게 한다. 정보의 상호운용성을 보장하기 위해서는 서로 다른 온톨로지 시스템간의 개체에 대한 유사도를 평가할 수 있어야 한다. 따라서 두 개의 다른 OWL 언어로 정의된 온톨로지 사이에서 두 개의 엔티티의 유사도를 측정하기 위한 새로운 유사도 척도(similarity measure)를 제안하였다. 이는 온톨로지 상의 이질적인 정보를 통합하는데 사용되며, 온톨로지 비교(comparison), 정렬(alignment), 매칭(matching) 그리고 병합(merging)의 기반이 되는 중요한 기법이다. 새로운 유사도 척도는 특정한 매핑 정보를 사용하지 않고 온톨로지 언어의 속성을 기반으로 하므로 OWL을 사용한 온톨로지 간의 유사도 검색에 곧바로 적용될 수 있는 장점을 지닌다.

  • PDF

의미 정보를 이용한 다차원 데이터 시퀀스의 유사성 척도 연구 (A Study of Similarity Measures on Multidimensional Data Sequences Using Semantic Information)

  • 이석룡;이주홍;전석주
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.283-292
    • /
    • 2003
  • 연속된 일차원 실수로 이루어진 시계열 데이터는 데이터 마이닝이나 데이터 웨어하우징과 같은 다양한 데이터베이스 응용 분야에서 연구되어져 왔다. 그러나 최근의 복잡한 비즈니스 환경에서, 다차원 데이터 시퀀스(multidimensional data sequence : MDS)는 일차원 시계열 데이터와 더불어 그 중요성이 더해가고 있다. 다차원 데이터 시퀀스의 예로써, 비디오 스트림은 색상과 질감 등의 속성들로 이루어진 다차원 공간상에서 MDS로 나타낼 수 있다. 본 논문에서는 패턴 유사성 검색에서 사용되는 효과적인 유사성 척도를 제시한다. 하나의 MDS는 여러 개의 세그먼트(segment)로 나누어지며, 각 세그먼트는 다양한 의미적인 특징들로 표현된다. 유사성 척도는 이러한 세그먼트에 대해서 정의되는데 이 척도를 사용하여 어떤 주어진 질의 시퀀스에 대하여 무관한 세그먼트들은 검색 대상에서 일차적으로 제외된다. 데이터 시퀀스와 질의 시퀀스 모두 세그먼트 단위로 분할되며, 질의 처리는 전체 시퀀스의 모든 데이터를 검색하지 않고 데이터 세그먼트와 질의 세그먼트의 특징을 비교하는 것을 기초로 하여 수행된다.

지역적 밝기 변화에 강인한 물체 인식을 위한 지역 서술자와 엔트로피 기반 유사도 척도에 관한 연구 (A study on a local descriptor and entropy-based similarity measure for object recognition system being robust to local illumination change)

  • 양정은;양승용;홍석근;조석제
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제38권9호
    • /
    • pp.1112-1118
    • /
    • 2014
  • 본 논문에서는 지역적인 밝기 변화에 강인한 지역 서술자와 유사도 척도를 제안한다. 제안한 지역 서술자는 Haar 웨이블렛 필터를 이용하여 특징점과 주변의 주파수 특성을 포함한 지역 서술자를 정의하여 지역적으로 불균일한 조명의 영향에도 특징점을 명확히 서술할 수 있다. 제안한 유사도 척도는 기존의 엔트로피 기반의 유사도에 지역 서술자로 계산한 유사도를 결합한 형태이다. 이는 지역적인 조명의 변화가 발생한 영역의 유사도를 정확히 반영할 수 있다. 실험을 통해 제안한 방법의 성능을 검증하였다.

다차원척도법과 거리분석을 활용한 그룹화된 비유사성에 대한 비모수적 접근법 (Non-parametric approach for the grouped dissimilarities using the multidimensional scaling and analysis of distance)

  • 남승찬;최용석
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.567-578
    • /
    • 2017
  • 일반적으로 그룹화된 다변량자료는 다변량 분산분석(multivariate analysis of variance; MANOVA)을 사용하여 그룹 간 차이를 검정할 수 있다. 그러나 만약 다변량 분산분석의 기본적인 가정이 위배되면 이 방법은 적절하지 못하다. 이 경우 다양한 거리로부터 그룹화된 비유사성을 계산한 후 다차원척도법(multidimensional scaling; MDS), 거리분석(analysis of distance; AOD) 그리고 비모수적 기법인 순열검정(permutation test)을 적용하여 문제를 해결할 수 있다. 다차원척도법은 비유사성으로부터 개체들의 좌표를 계산해주며 거리분석은 이 좌표를 활용하여 그룹구조를 파악하는데 유용하다. 특히 비유사성의 측도로 유클리드 거리를 사용하면 거리분석은 다변량 분산분석과 수리적으로 매우 밀접한 연관관계를 맺는다. 따라서 본 연구에서는 그룹화된 비유사성에 다차원척도법과 거리분석을 적용하여 그룹 내와 그룹 간의 구조를 파악하고 순열검정을 위한 새로운 검정통계량을 제안하려 한다. 덧붙여 유클리드 거리를 활용한 비유사성을 통해 거리분석과 다변량 분산분석과의 수리적 연관성을 고찰하고자 한다.

한국어 번역 메모리 시스템의 실현성 분석 및 설계 (Feasibility Test and Design of Korean Translation Memory System)

  • 류철;노윤형;이기영;최승권;박상규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.281-287
    • /
    • 2001
  • 번역 메모리(Translation Memory) 시스템이란 기존에 번역된 결과를 담고 있는 대용량의 번역 메모리에서 사용자가 제시한 입력문과 가장 유사한 문장을 검색한 후, 유사도 순으로 결과를 제시하여 이후의 번역 작업을 보다 효율적으로 할 수 있도록 도와주는 시스템을 말한다. 이는 기계 번역 시스템과 비교해 볼때, 보다 실현 가능성이 높은 자연어 처리의 응용 분야라고 할 수 있다. 일반적으로 번역 메모리 시스템에서 핵심이 되는 요소는 번역메모리의 구성과 유사성 척도에 대한 정의라고 할 수 있다. 국외의 경우, 이미 많은 상용 시스템들이 개발되어 번역 작업의 시간 및 비용을 줄이는데 많은 도움을 주고 있지만, 국내의 경우 한국어 번역 메모리의 구성 및 한국어 문장간 유사성 척도 등에 대한 연구가 미흡한 실정이다. 따라서 본 논문에서는 한국어를 대상으로 번역 메모리의 효율적인 구성 방법 및 문장간 유사성 척도에 대한 정의를 내리며, 한국어를 대상으로한 번역 메모리 시스템에 대한 실현 가능성을 논한다.

  • PDF

다차원 척도법을 이용한 의류소재 이미지의 평가 (Evaluation of Textile Images by Multidimensional Scaling Method)

  • 이정순;신혜원
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2002년도 춘계학술대회 논문집
    • /
    • pp.295-299
    • /
    • 2002
  • 본 연구에서는 피륙의 물리화학적 특성에 의해 결정되는 촉감, 태 이외에도 색채, 무의 등 여러 요소들의 영향을 받아 복합적으로 표현되는 의류소재의 총체적인 개념인 의류소재 이미지는 어떤 것들이 있으며 이러한 이미지들은 어떻게 분류될 수 있는지를 알아보기 위하여 의류소재 이미지의 평가를 위한 축을 개발해 보았다. 1995년부터 2000년까지의 Texjournal과 인터패션플래닝에서 발간되는 98/99FW부터 0255까지 트렌드 북에서 소재를 설명하는 형용사를 조사하여 유사한 형용사를 통합 처리하여 87개의 형용사를 최종 추출하여 형용사쌍을 만들고 소재 자극 없이 형용사쌍이 주는 소재이미지만을 가지고 쌍비교법을 통해 유사성을 7점 척도로 표시하도록 하였다. 얻어진 결과를 다차원척도법을 이용하여 분석하여 87개의 형용사의 평가차원을 살펴보았다. 의류소재 이미지를 평가하는 축을 다차원 척도법을 이용하여 개발한 결과 '남성적-여성적', '새로운-낡은 듯한', '캐주얼-클래식', '모호한-정돈된'의 4가지 차원의 8개축이 개발되었다.

  • PDF

분할법을 활용한 범주형자료의 다차원척도법 (Multidimensional scaling of categorical data using the partition method)

  • 신상민;천선경;최용석
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.67-75
    • /
    • 2018
  • 다차원척도법은 개체간의 비유사성을 저차원 공간에 기하적으로 표현하기 위한 다변량 자료의 탐색적 분석기법이다. 그러나 일반적인 다차원척도그림에서는 개체들의 유사성 정보만이 표현될 뿐 변수와 관련된 정보가 나타나지 않기 때문에 그림의 해석 상에 한계점이 존재한다. 본 연구에서는 범주형 자료를 다중표시행렬로 변환하고 Torgerson (1958)의 알고리즘에 의한 다차원척도법을 적용하여 개체들의 군집화 성향과 군집들의 상대적 크기를 다차원척도그림으로 시각화하였다. 그리고 Shin 등 (2015)의 분할법을 적용하여 범주형변수의 범주수준별 정보를 다차원척도그림 상에 투영하여 추가적인 정보를 표현하였다. 따라서 본 연구에서 제안하고자 하는 다차원척도그림을 이용하면 개체들의 유사성 정보와 함께 범주형변수들 사이의 연관성도 탐색할 수 있는 장점이 있다.

사례기반추론을 이용한 열연제품 품질설계지원시스템 (A Hot Coil Quality Design Su, pp.rt System using Case Based Reasoning)

  • 고영관;박상혁;서민수;임여종
    • 지능정보연구
    • /
    • 제3권1호
    • /
    • pp.101-109
    • /
    • 1997
  • 철강제품의 품질설계란 제품의 주문요구조건을 만족시키기 위해 제품의 성분 및 생산공정을 결정하는 과정을 의미한다. 본 연구에서는 품질설계업무를 지원하기 위한 시스템을 개발하였다. 설계업무의 특성을 고려하여 과거사례를 설계에 이용하기 위해, 사례기반추론(Case-based Reasoning)접근방법을 이용하였다. 본 연구에서는 또한 유사사례의 효율적 검색을 위해 품질설계 문제에 적합한 유사성척도를 제안하고 있으며, 문제에 적합한 유사성척도를 제안하고 있으며, 문제에 적합한 지식관리 방법 및 설계조정 방법을 개발하였다.

  • PDF

유ㆍ무성음 척도를 포함한 재구성 특징 파라미터의 음성 인식 성능평가 (Performance Evaluation of Speech Recognition Using the Reconstructed Feature Parameter with Voiced-Unvoiced Measure)

  • 이광석;한학용;고시영;허강인
    • 한국정보통신학회논문지
    • /
    • 제7권2호
    • /
    • pp.177-182
    • /
    • 2003
  • 본 연구는 유사음에 강인한 음성인식을 위하여 음성의 유ㆍ무성음 척도를 특징 파라미터에 추가 구성하여 음절과 음소단위의 음성인식을 행하였다. 이를 위하여 피치검출에 이용되는 알고리듬인 HPS(Harmonic Product Spectrum)의 스펙트럼 정보를 이용하여 유ㆍ무성음의 정도를 나타내는 척도를 제안한다. 제안된 척도는 HPS의 첨도와 피크의 개수 그리고 높이척도이다. 이들 척도 값을 포함하여 특징 파라미터를 재구성하고 제안된 특징의 유효성을 검증하기 위하여 CVC형 유사 음절 DB하에서 기존 특징 파라미터와 비교하여 음성인식 실험을 행하였다.

향상된 균일 스케일링을 이용한 유사 음악 검색시스템 (A Similar Music Retrieval System using Improved Uniform Scaling)

  • 이혜환;심규석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.183-188
    • /
    • 2006
  • 허밍을 통한 유사 검색 질의가 주어질 때 효과적으로 음악 데이터베이스를 검색하는 시스템에 대한 연구는 다양한 방향으로 진행되어 왔다. 최근에는 음악 데이터와 허밍 질의를 시계열 데이터로 보고 시계열 데이터 유사 검색과 관련하여 제안되어 왔던 여러 가지 거리 척도(distance measure)나 인덱싱 기법등을 적용하여 효과적으로 질의를 처리하려는 시도가 계속 되고 있다. 허밍 질의의 특성을 고려한 균일 스케일링(Uniform Scaling)을 사용하여 효과적인 유사 검색을 하는 방법은 가장 최근 제시된 방법 중 하나이다. 본 논문에서는 허밍을 통한 유사 검색 시스템인 Humming BIRD(Humming Based similaR miDi music retrieval system)를 제안하고 구현하였다. 슬라이딩 윈도우를 사용하여 음악의 임의의 부분에 대한 허밍 질의를 처리할 수 있도록 하였으며 효율적인 검색을 위해 중심을 일치시킨(center-aligned) 균일 스케일링을 제안하고 이 거리의 하한을 계산하는 하계 함수를 사용하여 탐색 공간(search space)을 효과적으로 줄여 더 빠르고 효과적인 유사 검색을 가능하도록 하였으며 실험을 통해 중심을 일치시킨된 균일 스케일링이 이전과 같은 검색 결과를 얻으면서도 효과적으로 검색함을 탐색 공간을 줄이는 가지치기 성능을 비교함으로써 보였다.

  • PDF