• 제목/요약/키워드: Web knowledge base

검색결과 117건 처리시간 0.022초

시맨틱 웹 온톨로지에서의 OWL sameAs 적용 (Applying OWL SameAs to an Ontology in the Semantic Web)

  • 강인수;정한민;이승우;김평;이미경;성원경
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권4호
    • /
    • pp.359-367
    • /
    • 2007
  • 차세대 시맨틱 기술 적용의 비전인 시맨틱 웹의 성공을 위해서는 그 기반 지식이 되는 온툴로지의 생산, 공유 및 연계가 전제되어야 함과 동시에 온툴로지를 구성하는 개체들의 정합성이 보장되어야 한다 온툴로지 개체 정합성 측면에서 두 개의 서로 다른 온툴로지 개체가 실세계에서 동일한 개체임을 표현하기 위한 방편으로 OWL에서는 sameAs가 사용될 수 있다. 그러나, 최근까지의 시맨틱 웹 응용 연구에 있어서 sameAs 적용과 관련된 문제점과 고려사항들이 충분히 고찰되지 못했다. 이 연구는 과학기술 연구분야 온툴로지에서의 sameAs 적용 사례를 소개함으로써 sameAs와 관련된 이해의 폭을 공유하고자 한다.

추론엔진을 활용한 웹서비스 기반 추천 시스템 (Web Service based Recommendation System using Inference Engine)

  • 김성태;박수민;양정진
    • 지능정보연구
    • /
    • 제10권3호
    • /
    • pp.59-72
    • /
    • 2004
  • 인터넷의 활용범위는 정보의 검색 및 수집을 넘어서 여러 범위로 확대되고 있고 정보의 양 또한 방대해졌다. 그러나 필요한 정보를 찾기는 더욱 어려워지고 있고, 그에 따라 개인에게 맞는 정보를 제공해주는 시스템이 절실해지고 있다. 본 연구에서는 웹 서비스 기반위에 추론엔진을 사용하여 사용자에게 가장 적합한 상품을 검색하여 추천해주는 추천 시스템의 모델을 제시하고 있다. 현재의 웹 애플리케이션이 사용자에게 필요한 서비스를 제공하는데 비하여 애플리케이션마다 상이한 플랫폼의 구조와 분산된 환경에서 객체간의 통신을 쉽게 하고 통일된 개발을 위해 표준이 필요하게 되었다. 웹 서비스는 프로그램 언어에 독립적이고 상호 운용적 환경을 제공하기 위한 것으로 네트워크를 통해 기술하고 배포하여 실행시킬 수 있는 모듈화된 애플리케이션을 의미한다. 본 논문은 웹 서비스 기반위에 시스템을 구축함으로써 표준 웹 서비스의 실현 가능성을 가늠하고, 추론엔진과 결합하여 사용자의 정보와 변화하는 성향을 토대로 필요한 정보를 예측하여 추천하는 추천시스템 개발에 중점을 둔다.

  • PDF

웹 사용자 누적 사용정보 기반의 키워드 검색 모델 (A Keyword Search Model based on the Collected Information of Web Users)

  • 윤성희
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.777-782
    • /
    • 2012
  • 본 논문은 웹 검색 시스템의 사용자 질의에 대한 키워드 색인 기반의 검색 과정에서 적합 문서를 선별하기 위해 검색 키워드의 의미정보와 사용자의 누적 사용정보를 사용하여 검색 성능을 향상시키는 방법을 소개한다. 검색 키워드 의미 정보를 이용하는 검색 방법은 검색 결과로서 의미적으로 무관한 많은 문서들을 배제할 수 있고, 사용자의 누적된 사용정보는 관심사에 중심을 둔 검색문서들을 상위에 제시할 수 있다. 검색 키워드의 의미정보 지식베이스를 구축하고, 검색 문서들을 색인어와 해당 의미범주로 분류하며, 사용자의 정답 문서 참조 행위에 대한 누적 정보를 순위 결정에 반영하여 검색 성능을 향상시킬 수 있다.

동물 영역 지식 기반의 지능형 정보 에이전트 (A Knowledge-Based Intelligent Information Agent for Animal Domain)

  • 이용현;오정욱;변영태
    • 인지과학
    • /
    • 제10권1호
    • /
    • pp.67-78
    • /
    • 1999
  • 네트워크의 기술 발달로 웹상의 정보 제공자가 증가함에 따라 정보 사용자가 필요한 정보를 신속하고 정확하게 획득하기는 것이 더욱 어려워졌다. 이를 위해서 키워드 정합 방식의 검색 엔진이 많이 개발 보급되고 있으나 여전히 많은 부담이 사용자에게 주어지고 있는 상황이다. 이러한 문제를 해결하기 위해서 본 논문에서는 특정 영역인 동문 분야에 대한 지식 베이스를 기반으로 사용자의 의도에 보다 적합하고 해당 영역에 적절한 형태로 사용자 질이를 가공하고, 대용량의 다양한 정보로부터 사용자가 필요로 하는 정보를 제공하는 일을 해주는 지능적인 정보검색 대리자, 정보 에이전트(HIIA-la : Hongik Information Agent)를 제안한다. HIIA-la는 온톨로지 형태에 접근한 동물 관련 지식 베이스를 가지고 있으며, 이를 기반으로 사용자 또는 다른 에이전트 시스템의 정보 요청에 대해 필요한 정보를 제공할 뿐만 아니라, 관련 웹 문서 정보도 제공된다. 효율적인 웹 문서의 제공을 위하여 방대한 양의 웹 문서를 대상으로 동물 영역에 관련된 문서를 저장·색인하는 웹DB를 가지고 있다. 또한 사용자의 의도를 좀더 명확하게 표현할 수 있도록 유연한 연사자로의 질의 확장을 하였으며, 축적된 처리 결과와 사용자의 피드백 정보를 통해 학습을 하게 된다. 본 논문에서는 이와 같이 요소들을 포함하는 HIIA-la를 구현하고, 실험을 통해 시스템의 효율성을 보인다.

  • PDF

태그 기반 토픽맵 생성 시스템의 설계 및 구현 (Design and Implementation of Topic Map Generation System based Tag)

  • 이시화;이만형;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제13권5호
    • /
    • pp.730-739
    • /
    • 2010
  • 웹2.0환경에서의 핵심적인 기술은 태깅이며, 현재 블로그와 같은 웹 문서에서부터 이미지, 동영상 등과 같은 멀티미디어 데이터에 이르기까지 폭넓게 적용되고 있다. 그러나 태깅에 사용된 태그가 정보 검색에 재사용되어 검색의 효율성을 극대화 시킬 것이라는 기대와는 달리 실제로는 태그가 가지는 근본적인 한계들로 인해 만족스럽지 못한 검색결과가 나타나고 있다. 이에 본 연구에서는 태그 클러스터링을 통한 이미지 검색에 대한 선행연구를 기반으로 의미론적 지식체계인 토픽맵 생성 시스템을 설계 및 구현하였다. 구현 결과 클러스터 내의 태그 정보들은 토픽맵에서의 토픽으로 자동 생성되었으며, 생성된 토픽맵의 토픽들 간에는 WordNet을 적용하여 의미연관관계를 부여하였다. 또한 토픽 쌍에 적합한 어커런스 정보들을 추출하여 토픽들에 부여함으로서 의미론적 지식체계인 토픽맵을 생성하였다. 이와 같이 생성된 토픽맵은 사용자의 정보검색 요구에 대한 시맨틱 내비게이션의 제공을 가능하게 할 뿐만 아니라 풍부한 정보제공이 가능하다.

웹기반 전문가시스템의 구조 분류 (Classification of the Architectures of Web based Expert Systems)

  • 임규건
    • 지능정보연구
    • /
    • 제13권4호
    • /
    • pp.1-16
    • /
    • 2007
  • 인터넷의 대중화와 e-비즈니스의 활성화에 따라 향후 인터넷과 유비쿼터스 환경에 대비한 지능형시스템 연구가 가속화 되고 있다. 전문가시스템도 기존의 Stand Alone방식에서 웹기반의 클라이언트-서버방식으로 발전되고 있으며, 다양한 인터넷 환경에서 활용되고 있다. 본 논문에서는 인터넷 웹 환경에서의 전문가시스템 개발환경과 고려사항들을 살펴 보고 웹 기반 전문가시스템들을 유형별로 분류하고, 분석하여 이를 통해 웹 기반 전문가 시스템의 일반적인 유형 모델과 구조를 제시한다. 본 논문에서는 첫 번째 클라이언트와 서버 간의 Load Balancing 측면에 따라 서버중심의 Server Oriented, 클라이언트 중심의 Client Oriented의 두 가지 모델을 구분 하였다. 그리고, 두 번째 지식 및 추론 공유 정도에 따라 지식과 추론에 대한 공유가 전혀 이루어 지지 않는 No Sharing, 서버들 간에 지식 및 추론의 공유가 이루어지는 경우인 Server Sharing, 클라이언트 간의 공유가 이루어 지는 경우인 Client Sharing, 클라이언트, 서버 모두에서 공유가 이루어 지는 경우인 Client-Server Sharing의 네 가지 모델을 분류하였다. 이들의 조합을 통해 총 8가지의 유형을 도출하였다. 또한 각 모델 별로 유형별 구조와 장단점, 인터넷상에서의 지식베이스, Fact Base, 추론엔진 등의 위치 문제와 사용기술, 고려사항, 서비스 유형들을 구분, 분석하였다. 본 논문을 통해서 제시된 프레임워크를 활용하여 새로운 환경에 좀더 능동적으로 대처할 수 있는 효율적인 전문가시스템의 다양한 개발이 기대된다.

  • PDF

시맨틱 웹 자원의 랭킹을 위한 알고리즘: 클래스중심 접근방법 (A Ranking Algorithm for Semantic Web Resources: A Class-oriented Approach)

  • 노상규;박현정;박진수
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.31-59
    • /
    • 2007
  • We frequently use search engines to find relevant information in the Web but still end up with too much information. In order to solve this problem of information overload, ranking algorithms have been applied to various domains. As more information will be available in the future, effectively and efficiently ranking search results will become more critical. In this paper, we propose a ranking algorithm for the Semantic Web resources, specifically RDF resources. Traditionally, the importance of a particular Web page is estimated based on the number of key words found in the page, which is subject to manipulation. In contrast, link analysis methods such as Google's PageRank capitalize on the information which is inherent in the link structure of the Web graph. PageRank considers a certain page highly important if it is referred to by many other pages. The degree of the importance also increases if the importance of the referring pages is high. Kleinberg's algorithm is another link-structure based ranking algorithm for Web pages. Unlike PageRank, Kleinberg's algorithm utilizes two kinds of scores: the authority score and the hub score. If a page has a high authority score, it is an authority on a given topic and many pages refer to it. A page with a high hub score links to many authoritative pages. As mentioned above, the link-structure based ranking method has been playing an essential role in World Wide Web(WWW), and nowadays, many people recognize the effectiveness and efficiency of it. On the other hand, as Resource Description Framework(RDF) data model forms the foundation of the Semantic Web, any information in the Semantic Web can be expressed with RDF graph, making the ranking algorithm for RDF knowledge bases greatly important. The RDF graph consists of nodes and directional links similar to the Web graph. As a result, the link-structure based ranking method seems to be highly applicable to ranking the Semantic Web resources. However, the information space of the Semantic Web is more complex than that of WWW. For instance, WWW can be considered as one huge class, i.e., a collection of Web pages, which has only a recursive property, i.e., a 'refers to' property corresponding to the hyperlinks. However, the Semantic Web encompasses various kinds of classes and properties, and consequently, ranking methods used in WWW should be modified to reflect the complexity of the information space in the Semantic Web. Previous research addressed the ranking problem of query results retrieved from RDF knowledge bases. Mukherjea and Bamba modified Kleinberg's algorithm in order to apply their algorithm to rank the Semantic Web resources. They defined the objectivity score and the subjectivity score of a resource, which correspond to the authority score and the hub score of Kleinberg's, respectively. They concentrated on the diversity of properties and introduced property weights to control the influence of a resource on another resource depending on the characteristic of the property linking the two resources. A node with a high objectivity score becomes the object of many RDF triples, and a node with a high subjectivity score becomes the subject of many RDF triples. They developed several kinds of Semantic Web systems in order to validate their technique and showed some experimental results verifying the applicability of their method to the Semantic Web. Despite their efforts, however, there remained some limitations which they reported in their paper. First, their algorithm is useful only when a Semantic Web system represents most of the knowledge pertaining to a certain domain. In other words, the ratio of links to nodes should be high, or overall resources should be described in detail, to a certain degree for their algorithm to properly work. Second, a Tightly-Knit Community(TKC) effect, the phenomenon that pages which are less important but yet densely connected have higher scores than the ones that are more important but sparsely connected, remains as problematic. Third, a resource may have a high score, not because it is actually important, but simply because it is very common and as a consequence it has many links pointing to it. In this paper, we examine such ranking problems from a novel perspective and propose a new algorithm which can solve the problems under the previous studies. Our proposed method is based on a class-oriented approach. In contrast to the predicate-oriented approach entertained by the previous research, a user, under our approach, determines the weights of a property by comparing its relative significance to the other properties when evaluating the importance of resources in a specific class. This approach stems from the idea that most queries are supposed to find resources belonging to the same class in the Semantic Web, which consists of many heterogeneous classes in RDF Schema. This approach closely reflects the way that people, in the real world, evaluate something, and will turn out to be superior to the predicate-oriented approach for the Semantic Web. Our proposed algorithm can resolve the TKC(Tightly Knit Community) effect, and further can shed lights on other limitations posed by the previous research. In addition, we propose two ways to incorporate data-type properties which have not been employed even in the case when they have some significance on the resource importance. We designed an experiment to show the effectiveness of our proposed algorithm and the validity of ranking results, which was not tried ever in previous research. We also conducted a comprehensive mathematical analysis, which was overlooked in previous research. The mathematical analysis enabled us to simplify the calculation procedure. Finally, we summarize our experimental results and discuss further research issues.

개체명 인식 코퍼스 생성을 위한 지식베이스 활용 기법 (Automatic Training Corpus Generation Method of Named Entity Recognition Using Knowledge-Bases)

  • 박영민;김예진;강상우;서정연
    • 인지과학
    • /
    • 제27권1호
    • /
    • pp.27-41
    • /
    • 2016
  • 개체명 인식은 미리 정의된 개체 범주로 텍스트의 요소를 분류하는 과정을 의미하며 최근 주목 받고 있는 음성 비서 서비스 등 다양한 응용 분야에 널리 활용되고 있다. 본 논문에서는 지식베이스를 사용하여 개체명 인식 코퍼스를 자동으로 생성하는 방법을 제안한다. 지식베이스의 종류에 따라 두 가지 방법을 적용하며 그 중 첫 번째 방법은 위키피디아를 기반으로 위키피디아 본문의 문장에 개체명 표지를 부착하여 학습 코퍼스를 생성하는 방법이다. 두 번째 방법은 인터넷으로부터 다양한 형태의 문장을 수집하고 다양한 개체들 간의 관계를 데이터베이스에 보유 중인 프리베이스를 이용하여 개체명 표지를 부착하는 방법으로 학습 코퍼스를 생성한다. 자동 생성된 학습 코퍼스의 질과 본 논문에서 제안하는 학습 코퍼스 자동 생성 기법을 평가하기 위해 두 가지로 실험했다. 첫 번째, 다른 형태의 지식베이스인 위키피디아와 프리베이스(Freebase)를 기반으로 생성된 학습 코퍼스의 표지 부착 성능을 수동으로 측정하여 코퍼스의 질을 평가하였다. 두 번째, 각 코퍼스로 학습된 개체명 인식 모델의 성능을 통해 제안하는 학습 코퍼스 자동 생성 기법의 실용성을 평가하였다. 실험을 통해 본 방법이 타당함을 증명하였으며 특히 실제 응용에서 많이 사용되는 웹 데이터 환경에서 의미 있는 성능 향상을 보여주었다.

  • PDF

국내 사이버대학교 웹사이트 평가 및 개선방안 연구 (A Study on the Website Evaluation and Improvement of Korean Cyber University Websites)

  • 문태은;문형남
    • 지능정보연구
    • /
    • 제14권2호
    • /
    • pp.137-156
    • /
    • 2008
  • 본 연구의 목적은 국내 사이버대학의 웹사이트 평가를 실시하여 웹 사용성(Web Usability)과 웹 접근성(Web Accessibility)을 분석하고, 사이버대가 웹사이트 상에서 이용자들에게 얼마만큼의 다양한 개인화 서비스와 양질의 콘텐츠들을 제공하는가를 분석하고 개선방안을 제시함으로써 웹사이트의 질적 향상을 도모하고 원격교육의 신뢰성에 기여 하고자 하는데 있다. 이를 위해 문형남(2001)의 SM-ABCDE 평가모델을 적용하여 원격대학에 알맞은 44항목의 체크리스트를 개발하고, 17개 사이버대학교 웹사이트에 대하여 고객흡인력(Attraction : A), 비즈니스(Business : B), 콘텐츠(Content : C), 디자인 및 사이트구성(Design : D), 기술평가(Engineering : E)의 다섯 분야에 대하여 웹사이트 평가를 실시하였다. 평가결과 Attraction 부분에서는 부산디지털대학, Business 부분에서는 공동으로 경희사이버대학과 사이버외국어대학이 가장 우수하게 평가 되었으며, Content 부분에서는 경희사이버대학, 디자인부분에서는 한양사이버대학이 가장 우수하게 평가 되었다. 종합적으로 경희사이버대학교, 부산사이버대학교, 한양사이버대학교 순으로 우수하게 평가 되었다. 그러나 Engineering 부분에서는 모든 사이트가 웹 접근성 준수 수칙을 제대로 지키고 있지 않은 것으로 나타났다. 이번 연구 결과를 토대로 하여 국내 사이버대학들이 장기적인 안목으로 웹 접근성을 잘 준수해 나간다면 웹 사용성이 높아지므로 비장애인뿐만 아니라 장애인 등 기타 다양한 계층의 이용 고객을 확보하게 됨으로써 사이버대학의 발전과 나아가서는 지식정보사회에서 앞선 교육 방식을 지향하는 명실상부한 교육기관으로 자리 잡을 수 있을 것이다.

  • PDF

온톨로지 Open World 추론과 규칙 Closed World 추론의 통합 (Integration of Ontology Open-World and Rule Closed-World Reasoning)

  • 최정화;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권4호
    • /
    • pp.282-296
    • /
    • 2010
  • OWL 온톨로지는 실세계의 도메인 지식을 모델링 하는데 적합하다. 또한 명백하게 정의된 지식으로부터 암시적인 새로운 지식을 추론할 수 있다. 하지만 이 모델링된 지식은 완전할 수 없다. 사람이 가지고 있는 모든 상식을 모델링 할 수 없기 때문이다. 온톨로지는 완전한 지식표현을 위한 무결성 제약조건과 예외 처리와 같은 비단조 추론을 지원할 방법이 없다. 디폴트 규칙은 온톨로지 안의 특정 클래스에 대한 예외를 처리할 수 있다. 또한 무결성 제약은 온톨로지에 정의된 클래스의 제한조건(restriction)에 인스턴스가 일관되게 할 수 있다. 본 논문에서는 Open World Assumption(OWA) 기반의 온톨로지와 Closed World Assumption(CWA) 기반의 비단조 추론을 지원하는 규칙의 지식베이스를 통합하여 Open World 와 Closed World 추론을 모두 지원하는 실질적인 추론 시스템을 제안한다. 이 시스템은 온톨로지에 정의된 불완전한 개념을 다룰 때 OWA기반이라서 발생하는 문제점을 ASP(Answer Set Programming)를 사용하여 해결방안을 제안한다. ASP는 논리 프로그래밍 언어로써 비단조 추론을 허용하며, 서술 논리 지식베이스에 CWA 기반의 질의를 가능하게 한다. 제안하는 시스템은 Protege에서 제공하는 Pizza 온톨로지를 예로써 비단조 추론이 필요한 경우를 보이고, 잘 알려진 온톨로지들로 성능 평가하여 본 시스템의 정당(sound)하고 완전(complete)함을 증명한다.