• 제목/요약/키워드: semantic links

검색결과 39건 처리시간 0.03초

Operational Experience in DB "TERMIN"

  • Shaburova, Natalya N.
    • Journal of Information Science Theory and Practice
    • /
    • 제7권3호
    • /
    • pp.21-30
    • /
    • 2019
  • Information about the formation and filling (in 2014 to 2016) of a terminological dictionary on electronics and radioengineering and collective work (in 2017 to 2018) with a data bank "TERMIN" is presented in this article. In purpose of creating an instrument of navigating the modern scientific-technical space a net of terms with set semantic links is described. This set is based on the analysis of terms' definitions (each term is checked for inclusion in the definitions of all other terms; the definitions were borrowed from reputable reference editions: encyclopedias, dictionaries, reference books). The created model of a system that consists of different information sources, in which it (information) is indexed by the terminology of Russian State Rubricator of Scientific and Technical Information rubrics and/or keywords, is described. There is an access for the search in all these sources in the system. Searching inquiries are referred to in the language of these rubrics or formulated by arbitrary terms. The system is to refer to information sources and give out relevant information. In accordance with this model, semantic links of various types, which allow expanding a search at different modalities of query, should be set among data bank terms. Obtained links will have to increase semantic matching, i.e., they can provide actual understanding of the meaning of the information that is being sought.

Artificial intelligence approach for linking competences in nuclear field

  • Vincent Kuo;Gunther H. Filz;Jussi Leveinen
    • Nuclear Engineering and Technology
    • /
    • 제56권1호
    • /
    • pp.340-356
    • /
    • 2024
  • Bridging traditional experts' disciplinary boundaries is important for nuclear knowledge management systems. However, expert competences are often described in unstructured texts and require substantial human effort to link related competences across disciplines. The purpose of this research is to develop and evaluate a natural language processing approach, based on Latent Semantic Analysis, to enable the automatic linking of related competences across different disciplines and communities of practice. With datasets of unstructured texts as input training data, our results show that the algorithm can readily identify nuclear domain-specific semantic links between words and concepts. We discuss how our results can be utilized to generate a quantitative network of links between competences across disciplines, thus acting as an enabler for identifying and bridging communities of practice, in nuclear and beyond.

웹 서비스 메타데이타 관리를 위한 RDF 설계에 관한 연구 (A Study on Designing with RDF for manage of Web Service Metadata)

  • 최호찬;유동석;이명구;김차종
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.623-625
    • /
    • 2003
  • 최근 차세대 웹으로 시맨틱 웹 (Semantic Web)이 부각되고 있다. 기존 웹 서비스와는 달리 시맨틱 웹상에서는 정보 리소스들의 의미가 정의되어 있고, 이들간의 의미적 연결을 지원한다. 시맨틱 웹에서는 이런 의미적 연결성을 지원하기 위해 RDF를 사용한다. RDF (Resource Description Framework)는 웹 리소스들의 메타데이타를 표현하기 위한 데이터 모델로서, 개념상 RDF는 웹 서비스 메타데이타인 WSDL (Web Se.vice Desc.iption Language)과 매우 유사하다. 본 논문에서는 RDF 데이터를 WSDL과 통합하여 효율적인 검색 방법과 성능을 향상시킬 수 있는 RDF 설계 방법을 제안하고 있다. 제안한 설계 방법은 기존 방법보다 나은 성능을 보여준다.

  • PDF

연결정책을 이용한 개방형 연결 데이터 클라우드에서의 연결성 확충 (Linkage Expansion in Linked Open Data Cloud using Link Policy)

  • 김광민;손용락
    • 정보과학회 논문지
    • /
    • 제44권10호
    • /
    • pp.1045-1061
    • /
    • 2017
  • 본 논문은 시멘틱 웹의 실제적인 구현 결과인 개방형 연결 데이터(Linked Open Data(LOD)) 클라우드에서의 연결성을 확충하는 방안을 제시하였다. 현재의 LOD 클라우드는 최초 기대와는 달리 LOD들간의 연결성 부족으로 인하여 활발한 활용을 이끌어 내지 못하고 있다. 를 적용한 명시적연결들을 LOD에 직접 첨부하여 공개하는 현재의 연결방식은 연결대상 LOD들의 변경상황을 실시간으로 검색결과에 반영하지 못하며 별도의 작업을 통하여 이러한 명시적연결들을 생성하고 주기적으로 갱신하여야 한다는 제약을 가진다. 이에 본 논문은 명시적연결들을 첨부하는 대신 LOD마다 연결정책을 마련하고 이를 LOD와 함께 공개하는 방안을 제안하였다. 연결정책에는 타겟LOD들을 선정하고 연결판단에 필요한 술어 쌍들과 유사도를 명세하도록 하였다. 이러한 연결정책에 기반하여 여러 LOD들에 거쳐 진행하는 심층검색 기능을 API로 구현하고 이를 Github를 통하여 공개하였다. 구현한 심층검색을 유사도 1.0~0.8, 깊이 4까지에서 실험한 결과 신뢰적인 연결들을 91%~98% 수준으로 포함하고 170% 정도 규모의 적정한 확장성을 제공하는 것으로 평가되었다.

한의학 임상소견 표현을 위한 개념적 프레임워크 개발 연구 (Developing a Health Informatics Conceptual Framework for Representing Clinical Findings in Traditional East Asian Medicine)

  • 김선호;박경모
    • 대한한의학회지
    • /
    • 제32권1호
    • /
    • pp.121-129
    • /
    • 2011
  • Objective: The propose of this study is to build a conceptual framework for representing clinical findings in Traditional East Asian Medicine(TEAM). As the existing standard models have been developed without considering features of Traditional Medicine, in this study we introduced unique characteristics for the TEAM. Method: This study was composed of three steps. First, we analyzed whether the existing clinical information models are suitable for representing clinical findings. Second, we analyzed ISO/TS 22789 model which is a ISO medical informatics standard, to find out the problem by applying clinical findings of TEAM into the model. Finally, we defined semantic links and a concept hierarchy in our model based on the analyzed results. The model includes the concepts for clinical findings and terms, and the semantic links can be regarded as relations between concepts, so that the representating clinical findings are completed by connecting concepts with other concepts. Results: Our framework was developed by removing unnecessary semantic links, and adding some necessary ones based on ISO/TS 22789 model. The ISO/TS 22789 model has a simple concept hierarchy, but in this study we subdivided the hierarchy and also considered interoperability with other terminological systems and standard models. Conclusions: This research needs more discussions, but is meaningful as proposing a way how to develop Traditional Medicine terminological systems. This study shows the limitations of existing models in describing clinical findings for TEAM, and what should be considered to represent Traditional Medicine knowledge, and propose a solution to improve the problem.

산업지식의 공유를 위한 시맨틱 웹 포탈의 설계 및 구축 (Development of a Semantic Web Portal for Industry Knowledge Sharing)

  • 박상언
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.195-214
    • /
    • 2009
  • 시맨틱 웹 포탈은 시맨틱 웹 기술들을 이용하여 기존의 웹 포탈의 단점을 극복함으로써 보다 정확하고 효과적인 지식공유의 수단이 될 것으로 기대되고 있다. 시맨틱 웹 포탈은 각 분야의 지식을 표현하는 온톨로지를 구축하고 이를 연결함으로써 검색을 통해 상호 연결된 지식을 검색하도록 지원하여 그와 같은 목표를 달성하는데 기여할 수 있을 것이다. 본 연구는 디스플레이 산업을 모델로 하여 이상과 같은 요구조건을 만족시키는 시맨틱 웹 포탈을 설계하고, 그 과정에서 각기 다른 분야의 지식을 상호 연결하는 온톨로지를 구축하고자 한다. 그리고 온톨로지에 대한 효과적이고 자동화된 검색 및 탐색 방안을 제안함으로써 온톨로지의 구조에 대해 잘 모르는 사용자가 보다 쉽게 원하는 결과를 얻을 수 있도록 지원하고자 한다.

  • PDF

시맨틱 웹 자원의 랭킹을 위한 알고리즘: 클래스중심 접근방법 (A Ranking Algorithm for Semantic Web Resources: A Class-oriented Approach)

  • 노상규;박현정;박진수
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.31-59
    • /
    • 2007
  • We frequently use search engines to find relevant information in the Web but still end up with too much information. In order to solve this problem of information overload, ranking algorithms have been applied to various domains. As more information will be available in the future, effectively and efficiently ranking search results will become more critical. In this paper, we propose a ranking algorithm for the Semantic Web resources, specifically RDF resources. Traditionally, the importance of a particular Web page is estimated based on the number of key words found in the page, which is subject to manipulation. In contrast, link analysis methods such as Google's PageRank capitalize on the information which is inherent in the link structure of the Web graph. PageRank considers a certain page highly important if it is referred to by many other pages. The degree of the importance also increases if the importance of the referring pages is high. Kleinberg's algorithm is another link-structure based ranking algorithm for Web pages. Unlike PageRank, Kleinberg's algorithm utilizes two kinds of scores: the authority score and the hub score. If a page has a high authority score, it is an authority on a given topic and many pages refer to it. A page with a high hub score links to many authoritative pages. As mentioned above, the link-structure based ranking method has been playing an essential role in World Wide Web(WWW), and nowadays, many people recognize the effectiveness and efficiency of it. On the other hand, as Resource Description Framework(RDF) data model forms the foundation of the Semantic Web, any information in the Semantic Web can be expressed with RDF graph, making the ranking algorithm for RDF knowledge bases greatly important. The RDF graph consists of nodes and directional links similar to the Web graph. As a result, the link-structure based ranking method seems to be highly applicable to ranking the Semantic Web resources. However, the information space of the Semantic Web is more complex than that of WWW. For instance, WWW can be considered as one huge class, i.e., a collection of Web pages, which has only a recursive property, i.e., a 'refers to' property corresponding to the hyperlinks. However, the Semantic Web encompasses various kinds of classes and properties, and consequently, ranking methods used in WWW should be modified to reflect the complexity of the information space in the Semantic Web. Previous research addressed the ranking problem of query results retrieved from RDF knowledge bases. Mukherjea and Bamba modified Kleinberg's algorithm in order to apply their algorithm to rank the Semantic Web resources. They defined the objectivity score and the subjectivity score of a resource, which correspond to the authority score and the hub score of Kleinberg's, respectively. They concentrated on the diversity of properties and introduced property weights to control the influence of a resource on another resource depending on the characteristic of the property linking the two resources. A node with a high objectivity score becomes the object of many RDF triples, and a node with a high subjectivity score becomes the subject of many RDF triples. They developed several kinds of Semantic Web systems in order to validate their technique and showed some experimental results verifying the applicability of their method to the Semantic Web. Despite their efforts, however, there remained some limitations which they reported in their paper. First, their algorithm is useful only when a Semantic Web system represents most of the knowledge pertaining to a certain domain. In other words, the ratio of links to nodes should be high, or overall resources should be described in detail, to a certain degree for their algorithm to properly work. Second, a Tightly-Knit Community(TKC) effect, the phenomenon that pages which are less important but yet densely connected have higher scores than the ones that are more important but sparsely connected, remains as problematic. Third, a resource may have a high score, not because it is actually important, but simply because it is very common and as a consequence it has many links pointing to it. In this paper, we examine such ranking problems from a novel perspective and propose a new algorithm which can solve the problems under the previous studies. Our proposed method is based on a class-oriented approach. In contrast to the predicate-oriented approach entertained by the previous research, a user, under our approach, determines the weights of a property by comparing its relative significance to the other properties when evaluating the importance of resources in a specific class. This approach stems from the idea that most queries are supposed to find resources belonging to the same class in the Semantic Web, which consists of many heterogeneous classes in RDF Schema. This approach closely reflects the way that people, in the real world, evaluate something, and will turn out to be superior to the predicate-oriented approach for the Semantic Web. Our proposed algorithm can resolve the TKC(Tightly Knit Community) effect, and further can shed lights on other limitations posed by the previous research. In addition, we propose two ways to incorporate data-type properties which have not been employed even in the case when they have some significance on the resource importance. We designed an experiment to show the effectiveness of our proposed algorithm and the validity of ranking results, which was not tried ever in previous research. We also conducted a comprehensive mathematical analysis, which was overlooked in previous research. The mathematical analysis enabled us to simplify the calculation procedure. Finally, we summarize our experimental results and discuss further research issues.

집단지성을 활용한 시소러스 갱신에 관한 연구: 위키피디아를 중심으로 (Thesaurus Updating Using Collective Intelligence: Based on Wikipedia Encyclopedia)

  • 한승희
    • 정보관리학회지
    • /
    • 제26권3호
    • /
    • pp.25-43
    • /
    • 2009
  • 이 연구에서는 위키피디아를 활용하여 시소러스를 갱신하고, 그 결과를 평가함으로써 시소러스 갱신에 있어 집단지성의 활용가능성에 대해 확인하고자 하였다. ASIS&T 시소러스를 대상으로 시소러스를 갱신한 결과, 용어 포괄성의 측면에서 ASIS&T 시소러스에 비해 위키 시소러스가 우수한 것으로 나타났다. 또한, 갱신된 시소러스를 평가한 결과, 위키피디아가 시소러스 갱신에 활용될 수 있음이 증명되었다. 특히, 리디렉션, 카테고리, 상호 링크로 요약되는 위키피디아의 구조적 특성은 시소러스의 의미관계를 추출하는 데 있어 적합하다는 것을 확인하였다. 이 연구의 결과를 일반화하기 위해 다국어 시소러스를 포함한 다양한 시소러스를 대상으로 적용해 볼 필요가 있다.

온톨로지 기반 웹 항해 안내 시스템 (The Ontology-based Web Navigation Guidance System)

  • 정효숙;김희진;민경실;박성빈
    • 컴퓨터교육학회논문지
    • /
    • 제12권5호
    • /
    • pp.95-103
    • /
    • 2009
  • 본 논문에서는 온톨로지를 기반으로 사용자에게 의미적으로 관련된 링크를 자동적으로 제공하는 웹 항해 안내 시스템을 제안한다. 본 시스템은 각각의 웹 페이지를 온톨로지에 존재하는 특정 개념과 관련시키고, 온톨로지에 정의된 개념들 간의 관계를 고려하여 웹 페이지들 간의 새로운 링크를 생성한다. 본 시스템은 온톨로지를 기반으로 의미적 링크를 제공함으로써 웹 항해 안내를 향상시키는데 초점을 두고 있다. 본 노문에서 제안한 시스템을 이용하여 초등학교 5학년 학생들에게 웹 페이지를 탐색하면서 과제를 수행하는 실험을 한 결과 실험 집단에 속한 학생들의 방향 상실 정도, 웹 페이지의 재 방문율, 그리고 과제 수행에 소비된 시간이 통제 집단에 속한 학생들의 경우보다 작았고 과제 수행율은 실험 집단의 학생들이 통제 집단의 학생들보다 높았다. 본 논문에서 제안하는 시스템은 웹 기반 교육에서 중요한 항해 가능한 웹 사이트를 설계하는 데 도움이 되리라 기대된다.

  • PDF

효과적인 지식확장을 위한 LOD 클라우드에서의 변화수용적 심층검색 (Change Acceptable In-Depth Searching in LOD Cloud for Efficient Knowledge Expansion)

  • 김광민;손용락
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.171-193
    • /
    • 2018
  • 본 연구는 시멘틱 웹의 실질적 구현체인 LOD 클라우드에서 연결정책을 활용함으로써 LOD들간 연결을 효과적으로 제공하고 LOD의 변경된 내용을 검색결과에 빠짐없이 반영할 수 있는 방안을 제시한다. 현재 LOD 클라우드에서는 개체간 연결은 를 이용하여 개체들이 동일함을 명시적으로 기술하는 방식으로 이루어져 있다. 하지만, 이러한 명시적 연결방식은 LOD 클라우드 규모의 방대함에도 불구하고 개체간 동일성을 개체단위에서 파악하여야 하는 어려움이 있으며 주기적으로 LOD에 추가하여야 함에 따라 검색 시 개체들이 누락되는 한계가 있다. 이를 극복하기 위하여 본 연구에서는 명시적 연결을 생성하는 대신 LOD별로 연결하고자 하는 LOD와의 연결정책을 수립하여 LOD와 함께 공개하는 방식을 제안한다. 연결정책을 활용함으로써 연결하여야 할 동일개체를 검색시점에서 파악할 수 있으므로 추가되었던 개체들을 누락됨 없이 검색결과에 포함시킬 수 있고 LOD 클라우드에서의 연결성도 효과적으로 확충할 수 있다. 확충된 연결성은 정보의 지능적 처리의 선행과정인 지식확장의 근간이 된다. 연결정책은 연결하고자 하는 소스와 타겟 LOD의 주어 개체들간의 동일성을 평가하는데 도움이 되는 술어 쌍을 명세하는 방식으로 수립하며 검색 시 이러한 술어쌍에 대응하는 RDF 트리플을 검색하고 이들의 목적어들이 충분히 동일한 것인가를 평가하여 주어개체들의 동일수준을 판단한다. 본 연구에서는 이러한 연결정책을 이용하여 여러 LOD들을 심층적으로 검색하는 시스템을 구현하였다. 검색과정에서는 기존 명시적 연결들도 함께 활용하도록 구현하였다. 검색시스템에 대한 실험은 DBpedia의 주요 LOD들을 대상으로 진행하였다. 실험결과 연결대상 개체들의 목적어들이 0.8 ~ 0.9의 유사수준을 가지는 경우 적정한 확장성을 가지고 충분히 신뢰적인 개체들을 적절하게 포함하는 것으로 확인하였다. 또한, 개체들은 8개 이상의 동일연결을 제공하여야 검색결과가 신뢰적으로 활용될 수 있을 것으로 파악되었다.