• 제목/요약/키워드: Semantic matching

검색결과 148건 처리시간 0.026초

유사도 알고리즘을 활용한 시맨틱 프로세스 검색방안 (Semantic Process Retrieval with Similarity Algorithms)

  • 이홍주
    • Asia pacific journal of information systems
    • /
    • 제18권1호
    • /
    • pp.79-96
    • /
    • 2008
  • One of the roles of the Semantic Web services is to execute dynamic intra-organizational services including the integration and interoperation of business processes. Since different organizations design their processes differently, the retrieval of similar semantic business processes is necessary in order to support inter-organizational collaborations. Most approaches for finding services that have certain features and support certain business processes have relied on some type of logical reasoning and exact matching. This paper presents our approach of using imprecise matching for expanding results from an exact matching engine to query the OWL(Web Ontology Language) MIT Process Handbook. MIT Process Handbook is an electronic repository of best-practice business processes. The Handbook is intended to help people: (1) redesigning organizational processes, (2) inventing new processes, and (3) sharing ideas about organizational practices. In order to use the MIT Process Handbook for process retrieval experiments, we had to export it into an OWL-based format. We model the Process Handbook meta-model in OWL and export the processes in the Handbook as instances of the meta-model. Next, we need to find a sizable number of queries and their corresponding correct answers in the Process Handbook. Many previous studies devised artificial dataset composed of randomly generated numbers without real meaning and used subjective ratings for correct answers and similarity values between processes. To generate a semantic-preserving test data set, we create 20 variants for each target process that are syntactically different but semantically equivalent using mutation operators. These variants represent the correct answers of the target process. We devise diverse similarity algorithms based on values of process attributes and structures of business processes. We use simple similarity algorithms for text retrieval such as TF-IDF and Levenshtein edit distance to devise our approaches, and utilize tree edit distance measure because semantic processes are appeared to have a graph structure. Also, we design similarity algorithms considering similarity of process structure such as part process, goal, and exception. Since we can identify relationships between semantic process and its subcomponents, this information can be utilized for calculating similarities between processes. Dice's coefficient and Jaccard similarity measures are utilized to calculate portion of overlaps between processes in diverse ways. We perform retrieval experiments to compare the performance of the devised similarity algorithms. We measure the retrieval performance in terms of precision, recall and F measure? the harmonic mean of precision and recall. The tree edit distance shows the poorest performance in terms of all measures. TF-IDF and the method incorporating TF-IDF measure and Levenshtein edit distance show better performances than other devised methods. These two measures are focused on similarity between name and descriptions of process. In addition, we calculate rank correlation coefficient, Kendall's tau b, between the number of process mutations and ranking of similarity values among the mutation sets. In this experiment, similarity measures based on process structure, such as Dice's, Jaccard, and derivatives of these measures, show greater coefficient than measures based on values of process attributes. However, the Lev-TFIDF-JaccardAll measure considering process structure and attributes' values together shows reasonably better performances in these two experiments. For retrieving semantic process, we can think that it's better to consider diverse aspects of process similarity such as process structure and values of process attributes. We generate semantic process data and its dataset for retrieval experiment from MIT Process Handbook repository. We suggest imprecise query algorithms that expand retrieval results from exact matching engine such as SPARQL, and compare the retrieval performances of the similarity algorithms. For the limitations and future work, we need to perform experiments with other dataset from other domain. And, since there are many similarity values from diverse measures, we may find better ways to identify relevant processes by applying these values simultaneously.

온톨로지 의미 매핑 기반 CAD 및 PDM 시스템 정보 통합 (Ontology Semantic Mapping based Data Integration of CAD and PDM System)

  • 이민정;정원철;이재현;서효원
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2005년도 춘계학술대회 논문집
    • /
    • pp.181-186
    • /
    • 2005
  • In collaborative environment, it is necessary that the participants in collaboration should share the same understanding about the semantics of terms. For example, they should know that 'Part' and 'Item' are different word-expressions for the same meaning. In this paper, we consider sharing between CAD and PDM data. In order to handle such problems in information sharing, an information system needs to automatically recognize that the terms have the same semantics. Serving this purpose, the semantic mapping logic and the ontology based mapper system is described in this paper. In the semantic mapping logic topic, we introduce our logic that consists of four modules: Character Matching, Instance Reasoning, definition comparing and Similarity Checking. In the ontology based mapper, we introduce the system architecture and the mapping procedure.

  • PDF

Analysis of the Empirical Effects of Contextual Matching Advertising for Online News

  • Oh, Hyo-Jung;Lee, Chang-Ki;Lee, Chung-Hee
    • ETRI Journal
    • /
    • 제34권2호
    • /
    • pp.292-295
    • /
    • 2012
  • Beyond the simple keyword matching methods in contextual advertising, we propose a rich contextual matching (CM) model adopting a classification method for topic targeting and a query expansion method for semantic ad matching. This letter reports on an investigation into the empirical effects of the CM model by comparing the click-through rates (CTRs) of two practical online news advertising systems. Based on the evaluation results from over 100 million impressions, we prove that the average CTR of our proposed model outperforms that of a traditional model.

OSGi기반 시맨틱 사용자 프로파일 관리자 (Semantic User Profiles Manager based on OSGi)

  • 송창우;김종훈;정경용;임기욱;이정현
    • 한국콘텐츠학회논문지
    • /
    • 제8권8호
    • /
    • pp.9-18
    • /
    • 2008
  • 개인화된 데이터와 함께 콘텐츠 제공 등의 서비스를 사용자가 쉽게 이용할 수 있는 연구가 활발히 진행되고 있다. 다양한 디바이스와 단말기에서의 정보 이용 및 서비스의 융합은 수많은 콘텐츠에서 양질의 콘텐츠를 사용자가 원하는 시간과 장소에서 어떠한 개인화 메커니즘을 이용해서 제공하는지에 대한 필요성을 제시한다. 기존 메커니즘은 각 서비스 제공자별로 분리된 선호도와 개인 정보를 가지고 있어 다른 서비스 제공자가 다루기 힘들며 서비스 사용자들이 직접 설정하고 관리해야 하기 때문에 매우 불편하다. 본 논문에서는 사용자의 프로파일을 서비스 제공자에 상관 없이 동적으로 통합 관리하기 위해 시맨틱 서비스 제공 및 확장성을 위한 미들웨어인 OSGi기반 시맨틱 사용자 프로파일 관리자를 제안한다. 또한 사용자 프로파일링, 온톨로지 도메인 모델, 시맨틱 추론이 가능한 개인화된 시맨틱 프로파일 모델을 정의한다. 논문의 타당성을 검증하기 위해 시맨틱 프로파일은 OSGi기반에서 동작하도록 번들로 구현한다. 사용자가 서비스 지역에 들어오면 다양한 디바이스 및 단말기의 시맨틱 사용자 프로파일에 시맨틱 서비스를 대응하여 매치한다. 제안한 시스템은 사용자 프로파일에 대한 서비스의 매칭과 사용자 프로파일에 대한 사용자 프로파일 또는 다른 서비스에 대한 매칭을 쉽게 확장시킬 수 있다.

단안 카메라와 저정밀 GPS-IMU 신호를 융합한 맵매칭 방법 (High accuracy map matching method using monocular cameras and low-end GPS-IMU systems)

  • 김용균;구형일;강석원;김준원;김재관
    • 한국산학기술학회논문지
    • /
    • 제19권4호
    • /
    • pp.34-40
    • /
    • 2018
  • 본 논문에서는 단안 카메라와 비교적 오차가 큰 GPS-IMU 센서를 이용하여 이동체의 정확한 포즈를 예측하는 고정밀 맵매칭 방법을 제안한다. 제안하는 방법은 카메라로부터 입력 받은 영상을 딥뉴럴 네트워크를 이용하여 의미상으로 분할한 결과와 시맨틱 지도 정보를 비교함으로써 달성된다. 카메라로부터 입력 받은 주행 영상은 시맨틱 분할 알고리즘을 통해서 두 개의 클래스로 분할되며, 시맨틱 지도 정보와 가능한 레이블 페어에 대해 설정된 가중치에 따라 비교 정렬함으로써 현재 이동체의 정확한 포즈를 예측할 수 있도록 한다. 이 과정에서 비교적 오차가 큰 GPS-IMU 센서의 신호는 해 공간의 범위를 효과적으로 줄여준다. 본 논문은 비교적 저렴한 센서를 이용하여 증강현실 및 자율주행 등에 필요한 고정밀 맵매칭이 가능함을 보여준다. 보정 전후의 차량 경로를 지도에 비교 도시하고 시맨틱 지도를 현재 입력 영상에 오버레이 하여 제안한 방법의 효과를 입증하였다. 또한 non-open-sky 환경과 같은 GPS-IMU 수신이 어려운 환경에서도 성능 개선이 있음을 확인하였다.

A Knowledge-based Model for Semantic Oriented Contextual Advertising

  • Maree, Mohammed;Hodrob, Rami;Belkhatir, Mohammed;Alhashmi, Saadat M.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권5호
    • /
    • pp.2122-2140
    • /
    • 2020
  • Proper and precise embedding of commercial ads within Webpages requires Ad-hoc analysis and understanding of their content. By the successful implementation of this step, both publishers and advertisers gain mutual benefits through increasing their revenues on the one hand, and improving user experience on the other. In this research work, we propose a novel multi-level context-based ads serving approach through which ads will be served at generic publisher websites based on their contextual relevance. In the proposed approach, knowledge encoded in domain-specific and generic semantic repositories is exploited in order to analyze and segment Webpages into sets of contextually-relevant segments. Semantically-enhanced indexes are also constructed to index ads based on their textual descriptions provided by advertisers. A modified cosine similarity matching algorithm is employed to embed each ad from the Ads repository into one or more contextually-relevant segments. In order to validate our proposal, we have implemented a prototype of an ad serving system with two datasets that consist of (11429 ads and 93 documents) and (11000 documents and 15 ads), respectively. To demonstrate the effectiveness of the proposed techniques, we experimentally tested the proposed method and compared the produced results against five baseline metrics that can be used in the context of ad serving systems. In addition, we compared the results produced by our system with other state-of-the-art models. Findings demonstrate that the accuracy of conventional ad matching techniques has improved by exploiting the proposed semantically-enhanced context-based ad serving model.

사용자 질의 의미 해석을 위한 선호도 기반 검색 기술 (Preference-based search technology for the user query semantic interpretation)

  • 정훈;이무훈;도하나;최의인
    • 디지털융복합연구
    • /
    • 제11권2호
    • /
    • pp.271-277
    • /
    • 2013
  • 질의 의미 해석에 대한 대표적인 시맨틱 검색은 논리적으로 표현된 지식 베이스를 사용하여 현재의 키워드 기반 검색보다 더 정확한 결과를 제공할 수 있다. 기존의 키워드 기반 검색 시스템은 사용자 키워드의 의미가 상호 연결이 되어 있지 않아서 사용자의 질의 의미 해석을 위한 선호도 검색을 할 수가 없다. 본 논문에서는 사용자의 검색 의도에 부합하는 정확한 검색 결과를 제공할 수 있는 사용자 검색 선호도 기반으로 평가하여 랭킹하는 기법을 제안한다. 제안한 기법은 온톨로지 기반으로 구축된 지식 베이스의 정형화된 구조에 의미 해석 과정이 통합된 온톨로지 지식 베이스 기반 검색 시스템이다.

Ontology Matching Method Based on Word Embedding and Structural Similarity

  • Hongzhou Duan;Yuxiang Sun;Yongju Lee
    • International journal of advanced smart convergence
    • /
    • 제12권3호
    • /
    • pp.75-88
    • /
    • 2023
  • In a specific domain, experts have different understanding of domain knowledge or different purpose of constructing ontology. These will lead to multiple different ontologies in the domain. This phenomenon is called the ontology heterogeneity. For research fields that require cross-ontology operations such as knowledge fusion and knowledge reasoning, the ontology heterogeneity has caused certain difficulties for research. In this paper, we propose a novel ontology matching model that combines word embedding and a concatenated continuous bag-of-words model. Our goal is to improve word vectors and distinguish the semantic similarity and descriptive associations. Moreover, we make the most of textual and structural information from the ontology and external resources. We represent the ontology as a graph and use the SimRank algorithm to calculate the structural similarity. Our approach employs a similarity queue to achieve one-to-many matching results which provide a wider range of insights for subsequent mining and analysis. This enhances and refines the methodology used in ontology matching.

토픽 분할에 의한 토픽맵 매칭 및 통합 기법 (Topic maps Matching and Merging Techniques based on Partitioning of Topics)

  • 김정민;정현숙
    • 정보처리학회논문지D
    • /
    • 제14D권7호
    • /
    • pp.819-828
    • /
    • 2007
  • 본 논문에서는 토픽맵의 모델 특성을 고려한 토픽맵 매칭 및 통합 기법을 제안한다. 이전까지의 대부분의 스키마 매칭 연구들은 계산 시간의 효율성을 고려하지 않고 매칭 기법의 범용성 및 정확성을 높이기 위한 목적으로 개발되어 왔다. 그러나 현재 표준적인 온톨로지 언어로 RDF/OWL과 토픽맵이 사용되고 있으며 앞으로 많은 온톨로지들이 이들 언어로 구현될 것이다. 따라서 본 논문에서는 토픽맵 데이터 모델의 구조적 특성 및 제약조건을 고려하여 토픽 분할, 토픽명기반 매칭연산, 속성기반 매칭연산, 계층구조기반 매칭연산, 연관관계기반 매칭연산 및 통합 알고리즘을 개발함으로써 효과적이면서 효율적인 토픽맵 매칭 및 통합이 가능함을 보인다.

문화재 정보의 온톨로지 기반 검색시스템 (Ontology-Based Information Retrieval for Cultural Assets Information)

  • 백승재;천현재;이홍철
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.229-236
    • /
    • 2005
  • 시맨틱 웹(Semantic Web)은 정보자원의 효율적 검색, 통합, 재사용을 가능하게 한다. 현재의 웹 환경에서 사용되고 있는 키워드 검색방법은 단순한 문자열 일치 방법으로 인하여 정확한 검색결과에 한계가 있다. 이에 본 연구에서는 전통적인 키워드 검색에서의 나타난 문제점들을 해결할 방안으로 의미적인 연관성을 통한 온톨로지(Ontology) 검색방법을 제안하여 더욱 정확한 검색결과를 유도해 본다. 국내 문화재를 중심으로 하여 OWL기반의 온톨로지를 구축하였고 질의, 검색 방법으로는 RDQL 질의어와 Jena API를 사용하였다. 이와 더불어 온톨로지 속성(property)데이터를 데이터베이스에 저장하여 처리하는 방안을 제시한다.

  • PDF