• 제목/요약/키워드: Data Query

검색결과 1,555건 처리시간 0.022초

연관지식의 효율적인 표현 및 추론이 가능한 지식그래프 기반 지식지도 (Knowledge graph-based knowledge map for efficient expression and inference of associated knowledge)

  • 유기동
    • 지능정보연구
    • /
    • 제27권4호
    • /
    • pp.49-71
    • /
    • 2021
  • 문제해결을 위해 지식을 활용하는 사용자는 내용 면에서 관련된 또 다른 지식, 즉 연관지식에 대한 교차적이고 순차적인 탐색을 진행한다. 지식지도는 관리하는 지식의 현황을 보여주는 도식이자 지식저장소의 분류체계로서, 지식 간 연관성에 기반한 사용자의 지식 탐색을 지원하는 도구이다. 따라서 지식지도는 지식 간 연관성에 의한 네트워크 형식으로 표현되며, 이를 정의 및 추론하는 데에 최적화된 기술을 접목하여 구현되어야 한다. 이를 위해 본 연구는 관리하는 개체와 개체 간 관계를 표현 및 추론하는 데에 최적화된 기능성을 발휘하는 것으로 알려진 그래프DB를 이용하여 지식그래프 기반 지식지도를 개발하는 방법론을 제시한다. 제시된 방법론의 유효성을 확인하기 위하여, 선행 연구의 온톨로지 기반 지식지도 구축 사례 데이터를 그래프DB에 적용하여 지식그래프 기반 지식지도를 구현하고, 구현된 지식 네트워크의 유효성과 Class 자동 구성 능력을 선행 연구의 결과와 비교하는 성능 테스트를 진행한다. 성능 테스트 결과, 본 연구의 지식그래프 기반 지식지도는 선행 연구의 온톨로지 기반 지식지도와 동일한 수준의 성능을 나타냈으며, 지식 및 지식 간 관계 정의 및 추론을 더욱 효율적으로 진행할 수 있음을 확인하였다. 본 연구의 결과는 연관지식에 대한 사용자의 인지과정을 반영한 지식 탐색 기능의 구현에 활용될 수 있으며, 추론에 의한 새로운 연관지식의 발견을 통해 자율적으로 확장되는 지능적 지식베이스의 개발에 응용될 수 있다.

배추의 조직 특이적 발현유전자 데이터베이스 (The Brassica rapa Tissue-specific EST Database)

  • 유희주;박신기;오미진;황현주;김남신;정희;손성한;박범석;문정환
    • 원예과학기술지
    • /
    • 제29권6호
    • /
    • pp.633-640
    • /
    • 2011
  • 배추는 배추속 식물의 A genome을 대표하는 모델로서 다양한 배추과 작물의 유전학 및 유전체학과 육종연구의 기반이 되는 중요한 작물이다. 최근 들어 배추 유전체 해독이 완료됨에 따라 유전체의 기능 연구가 보다 활발히 진행될 것으로 기대된다. 유전체 정보로부터 유전자의 구조를 예측하고, 기능을 분석하여 프로모터를 포함한 유용 유전자를 개발하기 위한 필수 재료로 이용되는 것이 다양한 조직 또는 실험 처리로부터 생성된 발현 유전자 데이터이다. 2011년 7월 현재 공공 데이터베이스에는 39개의 cDNA library로부터 분석된 147,217개의 배추 발현유전자가 보고되어 있다. 그러나 이들 발현 유전자들은 체계적으로 분석되거나 데이터베이스 형태로 정리되어 있지 않기 때문에 연구자들이 유전자 서열로부터 유용한 정보를 추출하여 사용하기 어려운 문제점이 있다. 따라서 해독 완료된 배추 유전체와 함께 발현 유전자 정보를 보다 잘 활용하기 위하여 배추의 조직 특이적 발현유전자 데이터베이스인 BrTED를 개발하였다. 데이터베이스는 EST 서열 처리-정보 검색 단위와 조직특이성 발현 특성 분석 단위로 이루어져 있으며, 각 정보들은 상호 연결되어 유기적인 검색 환경을 제공하게 하였다. BrTED는 23,962개의 단일 조합 유전자서열을 포함하고 있으며, 각 서열들의 유전자 주석과 암호화하고 있는 단백질의 기능을 동시에 제공한다. 또한 각 단일 조합 유전자서열들의 조직별 발현 특이성을 통계 분석을 통해 조사하여 연구자의 검색 기준에 따라 제공한다. BrTED의 실효성을 검증하기 위하여 데이터베이스를 통해 조직 특이적 발현 유전자 29개를 선발하고, 이들의 발현 특성을 RT-PCR로 확인한 결과, 선발한 유전자 모두 목표한 조직에서 특이적이거나 강한 발현을 보였다. BrTED는 조직 특이적 발현유전자를 신속하게 선발할 수 있는 공공 데이터베이스로서 배추의 기능 유전체 연구뿐만 아니라 근연 배추속 작물의 유전학과 유전체학 연구에 유용한 공공 연구 자원으로 이용될 수 있을 것이다.

사용자 만족도 향상을 위한 지능형 서비스 선정 방안에 관한 연구 : 클라우드 컴퓨팅 서비스에의 적용 (A Study on the Intelligent Service Selection Reasoning for Enhanced User Satisfaction : Appliance to Cloud Computing Service)

  • 신동천
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.35-51
    • /
    • 2012
  • 클라우드 컴퓨팅은 컴퓨팅 자원에 대해 확장 가능한 요구중심의 서비스를 인터넷상에서 제공하는 인터넷 기반의 컴퓨팅이라 할 수 있다. 이러한 환경에서 서비스 사용자가 만족하는 서비스를 선정하여 제공하는 문제는 인터넷과 모바일 기술의 발전에 따라 향후에 다양하고 수많은 클라우드 서비스가 제공되는 경우 매우 중요한 이슈중의 하나가 된다. 과거 연구의 대부분은 요구사항과 연관된 개념의 유사성을 기반으로 하거나 사용자 요구사항의 다양성이 결여되어 있어 사용자의 만족도 향상에 한계를 보이고 있다. 본 논문에서 제안하는 방안은 서비스 만족도 향상을 위해 속성의 개념 유사성 대신에 서비스 속성의 기능적 포함 관계와 규격 등을 기반으로 구성되는 서비스 속성 그래프(Service Attribute Graph : SAG)를 도입하여 사용한다. 뿐만 아니라, 다양한 사용자 선호도를 반영하고 문자, 숫자, 부울린 등 여러 가지 속성 값 유형들을 고려함으로서 서비스 속성의 다양성을 지원한다. 본 논문의 가장 큰 의미는 다른 연구들과 달리 여러 가지 사용자 선호도를 통합적으로 고려하면서 그래프 기반의 선정 방안을 처음으로 제시하고 있다는 점이다.

시맨틱 웹 자원의 랭킹을 위한 알고리즘: 클래스중심 접근방법 (A Ranking Algorithm for Semantic Web Resources: A Class-oriented Approach)

  • 노상규;박현정;박진수
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.31-59
    • /
    • 2007
  • We frequently use search engines to find relevant information in the Web but still end up with too much information. In order to solve this problem of information overload, ranking algorithms have been applied to various domains. As more information will be available in the future, effectively and efficiently ranking search results will become more critical. In this paper, we propose a ranking algorithm for the Semantic Web resources, specifically RDF resources. Traditionally, the importance of a particular Web page is estimated based on the number of key words found in the page, which is subject to manipulation. In contrast, link analysis methods such as Google's PageRank capitalize on the information which is inherent in the link structure of the Web graph. PageRank considers a certain page highly important if it is referred to by many other pages. The degree of the importance also increases if the importance of the referring pages is high. Kleinberg's algorithm is another link-structure based ranking algorithm for Web pages. Unlike PageRank, Kleinberg's algorithm utilizes two kinds of scores: the authority score and the hub score. If a page has a high authority score, it is an authority on a given topic and many pages refer to it. A page with a high hub score links to many authoritative pages. As mentioned above, the link-structure based ranking method has been playing an essential role in World Wide Web(WWW), and nowadays, many people recognize the effectiveness and efficiency of it. On the other hand, as Resource Description Framework(RDF) data model forms the foundation of the Semantic Web, any information in the Semantic Web can be expressed with RDF graph, making the ranking algorithm for RDF knowledge bases greatly important. The RDF graph consists of nodes and directional links similar to the Web graph. As a result, the link-structure based ranking method seems to be highly applicable to ranking the Semantic Web resources. However, the information space of the Semantic Web is more complex than that of WWW. For instance, WWW can be considered as one huge class, i.e., a collection of Web pages, which has only a recursive property, i.e., a 'refers to' property corresponding to the hyperlinks. However, the Semantic Web encompasses various kinds of classes and properties, and consequently, ranking methods used in WWW should be modified to reflect the complexity of the information space in the Semantic Web. Previous research addressed the ranking problem of query results retrieved from RDF knowledge bases. Mukherjea and Bamba modified Kleinberg's algorithm in order to apply their algorithm to rank the Semantic Web resources. They defined the objectivity score and the subjectivity score of a resource, which correspond to the authority score and the hub score of Kleinberg's, respectively. They concentrated on the diversity of properties and introduced property weights to control the influence of a resource on another resource depending on the characteristic of the property linking the two resources. A node with a high objectivity score becomes the object of many RDF triples, and a node with a high subjectivity score becomes the subject of many RDF triples. They developed several kinds of Semantic Web systems in order to validate their technique and showed some experimental results verifying the applicability of their method to the Semantic Web. Despite their efforts, however, there remained some limitations which they reported in their paper. First, their algorithm is useful only when a Semantic Web system represents most of the knowledge pertaining to a certain domain. In other words, the ratio of links to nodes should be high, or overall resources should be described in detail, to a certain degree for their algorithm to properly work. Second, a Tightly-Knit Community(TKC) effect, the phenomenon that pages which are less important but yet densely connected have higher scores than the ones that are more important but sparsely connected, remains as problematic. Third, a resource may have a high score, not because it is actually important, but simply because it is very common and as a consequence it has many links pointing to it. In this paper, we examine such ranking problems from a novel perspective and propose a new algorithm which can solve the problems under the previous studies. Our proposed method is based on a class-oriented approach. In contrast to the predicate-oriented approach entertained by the previous research, a user, under our approach, determines the weights of a property by comparing its relative significance to the other properties when evaluating the importance of resources in a specific class. This approach stems from the idea that most queries are supposed to find resources belonging to the same class in the Semantic Web, which consists of many heterogeneous classes in RDF Schema. This approach closely reflects the way that people, in the real world, evaluate something, and will turn out to be superior to the predicate-oriented approach for the Semantic Web. Our proposed algorithm can resolve the TKC(Tightly Knit Community) effect, and further can shed lights on other limitations posed by the previous research. In addition, we propose two ways to incorporate data-type properties which have not been employed even in the case when they have some significance on the resource importance. We designed an experiment to show the effectiveness of our proposed algorithm and the validity of ranking results, which was not tried ever in previous research. We also conducted a comprehensive mathematical analysis, which was overlooked in previous research. The mathematical analysis enabled us to simplify the calculation procedure. Finally, we summarize our experimental results and discuss further research issues.

온톨로지 기반 영화 메타데이터간 연관성을 활용한 영화 추천 기법 (The Ontology Based, the Movie Contents Recommendation Scheme, Using Relations of Movie Metadata)

  • 김재영;이석원
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.25-44
    • /
    • 2013
  • 최근 IPTV와 스마트 TV 등의 등장과 영상 콘텐츠를 시청하고 검색할 수 있는 웹 서비스의 등장으로 영상 콘텐츠의 접근이 용이해져 사용자들은 자신이 원하는 콘텐츠를 찾고자 하는 요구가 증가하고 있다. 하지만 서비스되는 콘텐츠의 양이 방대하여 영상 콘텐츠를 검색할 때 사용하는 키워드 기반의 검색은 많은 양의 결과를 가져오며 사용자가 필요로 하지 않은 결과가 검색된다. 따라서 사용자가 원하는 콘텐츠의 검색 시간과 노력이 증가 하게 되었다. 이를 극복 하기 위해 콘텐츠 추천 및 검색에 대한 연구가 수행되어 왔다. 기존의 연구에는 사용자의 선호도 분석을 통하여 영상 콘텐츠를 추천하거나 비슷한 성향을 가지는 사용자들을 분류하여 콘텐츠를 추천하는 기법들이 연구되어 왔다. 본 논문에서는 영상 콘텐츠 중 영화의 추천을 위해 사용자 개인의 영화 메타데이터의 선호도를 분석하고, 영화의 메타데이터와 영화의 유사성을 도출하여 이를 기반으로 영화 추천 기법을 제안한다. 영화의 특징을 담고 있고, 사용자의 영화 선호도에 영향을 끼치는 장르, 줄거리, 배우, 키워드 등의 영화 메타데이터를 기반으로 온톨로지를 구축하고, 확률 기법을 통한 메타 데이터간의 유사성을 분석하여 유사 메타데이터를 연결한다. 또한 사용자의 선호도와 그룹을 정의하고, 사용자 정보를 활용하기 위한 사용자 모델을 정의한다. 제안하는 추천 기법은 1) 사용자 정보기반의 후보 영화 검색 컴포넌트, 2) 사용자 선호기반의 후보 영화 검색 컴포넌트, 3) 1)과 2)의 결과를 통합하고 가중치를 부여하는 컴포넌트, 4) 최종결과의 분석을 통한 개인화된 영화 추천 컴포넌트 등 총 4가지 컴포넌트로 구성된다. 제안하는 추천 기법의 실험을 위하여 20대 남/녀 10명씩 20명을 대상으로 실험을 진행하였으며, 실험결과 평균 Top-5에서 2.1개 Top-10에서 3.35개 Top-20에서 6.35의 영화가 보고 싶은 영화로 선택되었다. 본 논문에서는 영화 메타데이터간의 연관성 도출을 통하여 영화간의 유사성을 도출하고 이를 기반으로 사용자의 기본적인 정보를 활용한 추천뿐만 아니라 사용자가 예상하지 못한 영화의 추천이 가능하다.