• 제목/요약/키워드: Ontology matching

검색결과 82건 처리시간 0.03초

ISO/IEC 11179 기반의 온톨로지 매칭 방법 (An Ontology Matching Method based on ISO/IEC 11179)

  • 이지윤;이석훈;김장원;정동원;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.95-97
    • /
    • 2012
  • 다양한 온톨로지들이 구축되고 이를 적용한 시스템들이 늘어가면서 시스템 간 상호운용성에 문제가 발생하게 되었다. 이러한 문제점을 해결하기 위해 공통 개념이라 볼 수 있는 온톨로지를 메타데이터 레지스트리에 등록하고, 이를 기반으로 한 시스템들이 개발되면서 시스템 간 상호운용성이 향상되었다. 하지만 서로 다른 메타데이터 레지스트리를 기반으로 한 시스템 간에는 상호운용성 문제가 여전히 존재하므로, 메타데이터 레지스트리에 등록된 온톨로지 간 매칭 방법에 대한 필요성이 대두되었다. 기존의 온톨로지 매칭 방법들은 온톨로지의 규모가 작을 경우 정확한 매칭 결과를 제공하지 못하는 문제점을 가진다. 따라서 이 논문에서는 메타데이터에 레지스트리에 등록된 온톨로지들을 매칭하기 위하여 메타데이터 레지스트리의 구조상의 특징을 반영하여 온톨로지를 확장한다. 그리고 확장된 온톨로지를 이용하여 온톨로지를 매칭 함으로써 정확한 매칭이 이루어지는 온톨로지 매칭 방법을 제안한다. 또한 제안 방법의 장점을 보이기 위해 기존 온톨로지 매칭 방법들과의 비교평가를 수행한다. 제안 방법은 매칭의 정확성을 보장하고 효율성을 높이며 메타데이터 레지스트리간 상호운용성을 높인다.

Improving Web Service Recommendation using Clustering with K-NN and SVD Algorithms

  • Weerasinghe, Amith M.;Rupasingha, Rupasingha A.H.M.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권5호
    • /
    • pp.1708-1727
    • /
    • 2021
  • In the advent of the twenty-first century, human beings began to closely interact with technology. Today, technology is developing, and as a result, the world wide web (www) has a very important place on the Internet and the significant task is fulfilled by Web services. A lot of Web services are available on the Internet and, therefore, it is difficult to find matching Web services among the available Web services. The recommendation systems can help in fixing this problem. In this paper, our observation was based on the recommended method such as the collaborative filtering (CF) technique which faces some failure from the data sparsity and the cold-start problems. To overcome these problems, we first applied an ontology-based clustering and then the k-nearest neighbor (KNN) algorithm for each separate cluster group that effectively increased the data density using the past user interests. Then, user ratings were predicted based on the model-based approach, such as singular value decomposition (SVD) and the predictions used for the recommendation. The evaluation results showed that our proposed approach has a less prediction error rate with high accuracy after analyzing the existing recommendation methods.

토픽맵 기반의 기록정보 검색시스템 구축에 관한 연구 (Construction of Record Retrieval System based on Topic Map)

  • 권창호
    • 기록학연구
    • /
    • 제19호
    • /
    • pp.57-102
    • /
    • 2009
  • 최근, 웹을 이용한 기록정보의 유통과 이용이 증가하고, 정보적 활용 가치가 제고되어 웹사이트를 이용한 기록정보서비스가 기록관의 중요업무로 부각되고 있다. 웹을 이용한 기록정보서 비스의 핵심은 이용자가 원하는 기록정보의 검색을 용이하게 하는데 있다. 검색을 용이하게 하기 위해서는 검색시스템의 기본 메커니즘인 이용자질의와 기록정보표현의 매칭의 정확성이 요구된다. 이를 위해 기록정보 관리자들은 다양한 정보표현 도구를 이용하고 있지만, 이용자들은 여전히 정보검색 과정에서 어려움을 겪고 있다. 이를 개선하기 위해 본 연구에는 기록물의 기술정보 메타데이타를 중심으로 정보자원을 구조화하여 이용자 질의의 접근점을 확장하고, 의미있는 매칭을 통해 지식자원화된 검색결과값을 제공하기 위해 토픽맵 기반의 기록정보 검색시스템을 구축하고자 한다. 구축대상은 웹사이트를 이용하는 불특정 이용자이며, 구축범위는 국가기록포탈의 기록자원 중 대통령 기록물로 선정하였다. 구축단계는 다음과 같다. 1)기록물의 기술정보 메타데이타를 중심으로 토픽맵 기반의 기록정보서비스를 위한 온톨로지 모델을 설계한다. 2)설계한 온톨로지 모델을 바탕으로 국가기록포탈에서 추출한 정보자원목록을 에디터를 이용해 토픽맵으로 반입하여 검색시스템으로 구현한다. 3)구축된 검색시스템의 사용자 인터페이스에서 테스트질의를 통해 토픽맵기반 검색시스템의 특징을 확인하고 그 의미를 평가한다. 최종적으로, 의미적 추론에 의한 연관 네비게이션검색을 확인하고, 분산된 기록정보자원 간의 연계된 결과값을 통해 지식자원화의 가능성도 제시한다.

사용자 선호도를 고려한 의미기반 비디오 검색 (Semantic Video Retrieval Based On User Preference)

  • 정민영;박성한
    • 전자공학회논문지CI
    • /
    • 제46권4호
    • /
    • pp.127-133
    • /
    • 2009
  • 최근 멀티미디어 정보의 양이 빠른 속도로 증가함에 따라 비디오 자료에 대한 효율적 관리는 더욱 중요한 의미를 가지게 되었다. 특히 비디오는 대용량적인 특성과 비정형적인 특성을 가지고 있어 신속하고 효율적으로 비디오 검색을 하기 위해서는 정확한 특징 정보를 추출하여 비디오 색인 구조를 구축해야 한다. 그리고 비디오 색인 구조는 사용자의 선호도가 반영되어 관심있는 콘텐츠를 효과적으로 검색할 수 있도록 지원되어야 한다. 이를 위해 본 논문에서는 사용자 선호도를 고려한 의미기반 비디오 검색 방법을 제안한다. 기존의 방법의 사용자 선호도를 고려하지 않는 단점이 있고, 사용자의 질의에 대하여 단순히 텍스트 매칭한 결과를 보여주기 때문에 의미적 검색을 지원하지 못한다. 이러한 한계를 극복하기 위해 본 논문에서는 사용자 선호도 분석 방법을 개발하고, 의미적 검색을 위한 비디오 온톨로지 구성 방법을 제시한다. 실험 결과 사용자 선호도를 정확히 분석하고, 장면에 포함된 객체와 움직임 단위의 의미적 인덱싱 구조를 구성하므로, 기존의 방법 보다 더 나은 검색 성능을 보인다.

PSR : 효율적인 웹 서비스 컴포지션 검색을 위한 RDBMS 기반의 선 계산 기법 (PSR: Pre-Computing Solutions in RDBMS for Efficient Web Services Composition Search)

  • 권준호;박규호;이대욱;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권4호
    • /
    • pp.333-344
    • /
    • 2008
  • 최근 웹 서비스 컴포지션이 많은 관심을 받고 있다. 웹 서비스 컴포지션을 통해서, 현재 존재하는 웹 서비스를 이용하여 저장소에 존재하지 않는 새로운 웹 서비스를 제공할 수 있다. 이 논문에서는 웹 서비스 컴포지션 검색을 구성하기 위해서 관계형 데이타베이스(RDBMS)를 사용한 PSR 시스템을 제안한다. 웹 서비스 컴포지션을 선 계산하기 위한 조인과 인덱스를 사용하는 알고리즘을 제안한다. 또한 웹 서비스에서 추출한 온톨로지 정보도 테이블로 저장하고, PSR 시스템이 이를 사용하여 온톨로지 매칭 정도에 따라 사용자 질의와의 유사도를 통한 결과를 반환하도록 하였다. 실험을 통하여 RDBMS 상에서 웹 서비스 컴포지션을 선 계산하는 접근 방법이 많은 수의 웹 서비스와 사용자 질의를 처리할 때 빠른 실행 시간과 좋은 확장성을 가지고 있음을 보였다.

전자상거래의 지능형 RSS 도입을 위한 이슈 분석과 지능형 RSS 프레임워크의 제안 (Issues of Applying Intelligent RSS Framework to Electronic Commerce)

  • 박상언;강주영;김우주
    • 한국전자거래학회지
    • /
    • 제12권2호
    • /
    • pp.269-290
    • /
    • 2007
  • RSS는 향후 IT와 관련된 전 분야의 변화를 주도할 것으로 기대되는 웹 2.0의 핵심적인 요소이다. 뉴스, 블로그, 멀티미디어, 의학, 학술 등 다양한 분야에서 웹 콘텐츠의 지속적인 배포를 위해 활발히 사용되고 있으며, 전자상거래에서도 향후 효과적인 마케팅 수단이 될 것으로 예측되고 있다. 본 논문에서는 현재 국내 쇼핑몰에서 활용되고 있는 RSS의 문제점들을 분석하고, 이로부터 RSS의 효과적인 전자상거래 적용을 위한 요구사항들을 제안하였다. 그리고, 요구사항의 구현과 관련된 다양한 이슈들과 해결책을 제시한 후, 이를 기반으로 전자상거래를 위한 지능형 RSS 프레임워크를 제안하였다. 제시된 프레임워크에서 RSS 정보의 의미 해석을 위해서는 RSS 기반의 정보 제공자와 RSS 리더기 사이에 형식적 상호운용성과 의미적 상호운용성이 보장되어야 한다. 본 논문에서는 시맨틱 웹을 이용해 이와 같은 상호운용성을 구현하는 방안을 제시하였다.

  • PDF

수학교과에서 자동문항생성 기반의 디지털 평가 활용 방안: CAFA 시스템을 중심으로 (The utility of digital evaluation based on automatic item generation in mathematics: Focusing on the CAFA system)

  • 김성연
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제61권4호
    • /
    • pp.581-595
    • /
    • 2022
  • 본 연구의 목적은 수학 교과에서 자동문항생성을 활용하여 지식의 핵심 구조인 온톨로지모형 기반의 문항모형을 CAFA 시스템을 통해 제작하는 절차를 명세하고, 생성된 문항 사례들을 탐색하는 데 있다. 이를 위한 사례로 수학 3의 대푯값과 산포도 단원의 평가준거 성취기준을 바탕으로 개념과 계산을 포함한 내용적 특성과 적용을 포함한 과정적 특성을 바탕으로 형성평가에 적합한 문항모형을 제작하였다. 하나의 문항모형에서 생성된 문항 유형은 최선답형, 정답형, 합답형, 미완성문장형, 부정형, 진위형, 배합형 등이었으며, 매체로는 Google Chart, HTML, TTS, 그림, 비디오 등을 활용할 수 있는 것으로 나타났다. 이를 바탕으로 자동문항생성 기반의 디지털 평가 활용방안에 대한 시사점을 학생, 예비교사, 일반교사 그리고 특수교육 측면에서 논의하고, 본 연구의 한계점과 향후 연구방향을 제시하였다.

유사도 알고리즘을 활용한 시맨틱 프로세스 검색방안 (Semantic Process Retrieval with Similarity Algorithms)

  • 이홍주
    • Asia pacific journal of information systems
    • /
    • 제18권1호
    • /
    • pp.79-96
    • /
    • 2008
  • One of the roles of the Semantic Web services is to execute dynamic intra-organizational services including the integration and interoperation of business processes. Since different organizations design their processes differently, the retrieval of similar semantic business processes is necessary in order to support inter-organizational collaborations. Most approaches for finding services that have certain features and support certain business processes have relied on some type of logical reasoning and exact matching. This paper presents our approach of using imprecise matching for expanding results from an exact matching engine to query the OWL(Web Ontology Language) MIT Process Handbook. MIT Process Handbook is an electronic repository of best-practice business processes. The Handbook is intended to help people: (1) redesigning organizational processes, (2) inventing new processes, and (3) sharing ideas about organizational practices. In order to use the MIT Process Handbook for process retrieval experiments, we had to export it into an OWL-based format. We model the Process Handbook meta-model in OWL and export the processes in the Handbook as instances of the meta-model. Next, we need to find a sizable number of queries and their corresponding correct answers in the Process Handbook. Many previous studies devised artificial dataset composed of randomly generated numbers without real meaning and used subjective ratings for correct answers and similarity values between processes. To generate a semantic-preserving test data set, we create 20 variants for each target process that are syntactically different but semantically equivalent using mutation operators. These variants represent the correct answers of the target process. We devise diverse similarity algorithms based on values of process attributes and structures of business processes. We use simple similarity algorithms for text retrieval such as TF-IDF and Levenshtein edit distance to devise our approaches, and utilize tree edit distance measure because semantic processes are appeared to have a graph structure. Also, we design similarity algorithms considering similarity of process structure such as part process, goal, and exception. Since we can identify relationships between semantic process and its subcomponents, this information can be utilized for calculating similarities between processes. Dice's coefficient and Jaccard similarity measures are utilized to calculate portion of overlaps between processes in diverse ways. We perform retrieval experiments to compare the performance of the devised similarity algorithms. We measure the retrieval performance in terms of precision, recall and F measure? the harmonic mean of precision and recall. The tree edit distance shows the poorest performance in terms of all measures. TF-IDF and the method incorporating TF-IDF measure and Levenshtein edit distance show better performances than other devised methods. These two measures are focused on similarity between name and descriptions of process. In addition, we calculate rank correlation coefficient, Kendall's tau b, between the number of process mutations and ranking of similarity values among the mutation sets. In this experiment, similarity measures based on process structure, such as Dice's, Jaccard, and derivatives of these measures, show greater coefficient than measures based on values of process attributes. However, the Lev-TFIDF-JaccardAll measure considering process structure and attributes' values together shows reasonably better performances in these two experiments. For retrieving semantic process, we can think that it's better to consider diverse aspects of process similarity such as process structure and values of process attributes. We generate semantic process data and its dataset for retrieval experiment from MIT Process Handbook repository. We suggest imprecise query algorithms that expand retrieval results from exact matching engine such as SPARQL, and compare the retrieval performances of the similarity algorithms. For the limitations and future work, we need to perform experiments with other dataset from other domain. And, since there are many similarity values from diverse measures, we may find better ways to identify relevant processes by applying these values simultaneously.

다양한 Open API 타입들을 지원하는 시맨틱 기반 매쉬업 개발 툴 (A Semantic-Based Mashup Development Tool Supporting Various Open API Types)

  • 이용주
    • 인터넷정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.115-126
    • /
    • 2012
  • 최근에 매쉬업은 미래 IT 융합 서비스의 효과적인 구현 방법으로써 그 관심도가 점점 높아지고 있으며 그들의 활용도 매우 다양하다. 그렇지만 이러한 높은 관심에도 불구하고 Open API들을 매쉬업 속으로 결합할 때 여러 가지 이슈들이 있을 수 있다. 첫째, 포털사이트들은 매쉬업에서 사용 가능한 수많은 API들을 제공하고 있는데, 이들에 대한 적합한 API들을 수동으로 탐색하고 발견하는 것은 매우 힘들고 많은 시간이 소비되는 작업이다. 둘째, 현존하는 어떠한 매쉬업 포털 사이트들도 전통적인 SOAP 기반 웹 서비스 분야에서 보였던 것처럼 API들을 찾고 통합하는데 시맨틱 기법을 활용하는 사이트는 없다. 세째, 적합한 API들을 발견하였더라도 특별한 기술적 훈련 없이 값어치 있는 매쉬업을 생성하기란 현실적으로 어려운 일이다. 본 논문에서는 위와 같은 이슈들을 해결하기 위해 먼저 기존의 SOAP 기반 웹 서비스 분야에서 사용된 시맨틱 기반 기술 및 알고리즘들을 최소의 수정만으로 재사용할 수 있음을 보인다. 다음으로, 조합 가능한 API들을 발견하기 위해 어떻게 API 특성들이 신택틱하게 정의되고 시맨틱하게 묘사될 수 있는지 보인다. 그러고 이러한 신택틱/시맨틱 정보들이 어떻게 Open API들의 발견과 조합에 도움을 줄 수 있는지 보인다. 마지막으로, 동적 Open API 조합을 위한 대화형 목표 지향 접근 방법을 제안한다. 여기서 최종 매쉬업은 API들의 순차적 접근 방법에 의해 점차적으로 각 단계에서 하나씩 새로운 API가 조합에 첨가된다.

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론 (Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System)

  • 김지현;이종서;이명진;김우주;홍준석
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.137-152
    • /
    • 2012
  • 인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.