• 제목/요약/키워드: 온톨로지 스키마

검색결과 98건 처리시간 0.021초

온톨로지와 텍스트 마이닝 기반 지능형 역사인물 검색 서비스 (Ontology and Text Mining-based Advanced Historical People Finding Service)

  • 정도헌;황명권;조민희;정한민;윤소영;김경선;김평
    • 인터넷정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.33-43
    • /
    • 2012
  • 시맨틱 웹 기술은 특정 개체를 중심으로 의미적 연관 관계를 생성하고 연관 관계를 이용해서 다양한 지능형 정보 서비스를 구축하는데 활용되며, 텍스트 마이닝 기술은 비정형 데이터를 대상으로 의미 분석을 통해서 의미적 연관 관계를 생성하는데 활용될 수 있다. 본 연구에서는 역사인물을 중심으로 온톨로지 스키마, 인스턴스를 생성하는 가이드라인, 인스턴스 생성, 동명이인 해소를 위한 텍스트 마이닝, 추론을 활용한 지능화된 역사인물 검색서비스를 제안한다. 역사분야 전문가들이 생성한 역사적 사건, 기관, 인물 중심의 연관 관계와 국사편찬위원회에서 보유한 다양한 문헌들 간의 연계를 통해, 사용자들의 정보접근성을 향상시킴과 동시에 관계 정보에 기반한 새로운 역사인물 검색 서비스를 제안하였다. 새로운 역사인물 검색 서비스는 인물간의 소셜 네트워크를 사용하여 역사문헌에 나타난 동명이인을 해소함으로써 보다 정확한 검색서비스를 제공하는 것은 물론, 역사 인물 시소러스를 포함한 다양한 외부 정보와의 연계를 통해서 역사인물에 대한 고부가 정보를 제공하고 있다.

사용자 상호작용에 기반한 그래프질의 생성 및 처리 (User Interaction-based Graph Query Formulation and Processing)

  • 정성재;김태홍;이승우;이화식;정한민
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제41권4호
    • /
    • pp.242-248
    • /
    • 2014
  • RDF 데이터가 급속히 증가함에 따라 RDF데이터로부터 정보를 효율적으로 추출하는 기술의 중요성도 점차 커지고 있다. RDF데이터 질의를 위해 가장 많이 사용하는 질의언어인 SPARQL은 문법이 간단하고 그래프 패턴을 손쉽게 질의로 표현할 수 있는 장점이 있다. 그러나 사용자가 적절한 SPARQL을 작성하려면 데이터 셋에 대한 온톨로지 구조와 용어를 사전에 파악해야 한다. 이 연구에서는 데이터 셋으로부터 사전에 추출된 스키마정보를 이용한 그래프 질의 생성 및 처리방법을 제안한다. 제안된 방법에서 사용자는 RDF 데이터 셋에 대한 온톨로지 구조 사전파악 없이 화면상에서 동적으로 질의를 작성하여 정보를 조회할 수 있다. 사용자가 생성한 질의는 관계형데이터베이스에 저장된 트리플 데이터에 대해 그래프 탐색을 수행할 때 탐색공간 제약조건으로 활용된다. LUBM(10,0) 데이터 셋에 대하여 LUBM 질의 2, 8, 9번을 이용하여 질의 처리 성능과 완전성을 확인하였다.

서비스 태스크를 위한 5W1H를 이용한 시멘틱 로봇 메모리 저장소 (Semantic Robot Memory Store using 5W1H for Service Tasks)

  • 이동훈;김학수;손진현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.435-438
    • /
    • 2010
  • 오늘날 많은 연구자들은 자율적 인간형 로봇 (Autonomous symbiotic human-robot)을 보조하기 위한 지식체계로 온톨로지의 개념을 사용한다. 이러한 연구는 룰 기반의 추론시스템을 지원하기 위해 온톨로지를 저장하는 데이터베이스 스키마를 설계하는데 초점을 맞추고 있다. 이러한 연구 뿐만 아니라 온톨로지 개념을 사용하는 가장 중요한 목적 중에 하나는 상황 추론이다. 이러한 관점에서 본 논문은 로봇이라는 환경에서 좀 더 지능적인 상황 추론 서비스를 제공하기 위해, 5W1H 기반의 로봇 지능 저장소라 불리는 로봇 메모리 저장소를 설계하는데 초점을 두고 있다. 기존 연구는 체계적이고 의미론적 5W1H를 고려하지 않거나 5W1H와 다른 개념 사이의 연광성의 결여에 많은 문제점을 가지고 있으며 이를 해결하기 위해 본 논문에서는 상황, 목적, 공간, 특징, 인간 그리고 5W1H의 온톨로지 지식을 저장할 수 있는 개념적인 모델인 로봇 메모리 모델을 설계한다. 또한 본 논문에서는 상황 추론을 지원하기 위해 로봇의 인스턴스 정보라고 불리는 자전적 기억 (Episodic Memory)를 효과적으로 저장하기 위한 5W1H 모델을 정의하며 이러한 모델을 물리적으로 저장하기 위한 관계형 데이터베이스 기반의 EventsEpisodicRBS를 설계한다. 결과적으로 이러한 연구를 통해서 자율적 인간형 로봇 환경에서 로봇이 지능적 서비스 제공의 핵심 모듈인 상황 추론을 지원하는데 큰 기여를 할 수 있는 하부 시스템으로서의 의미를 가질 수 있다.

  • PDF

분산 메모리 환경에서의 ABox 실체화 추론 (ABox Realization Reasoning in Distributed In-Memory System)

  • 이완곤;박영택
    • 정보과학회 논문지
    • /
    • 제42권7호
    • /
    • pp.852-859
    • /
    • 2015
  • 최근 지식 정보의 양이 방대해지면서, 대용량 온톨로지를 효과적으로 추론하는 연구가 활발히 진행되고 있다. 이러한 추론 방법들은 TBox 분류와 ABox 실체화로 나누어진다. TBox 추론은 스키마의 무결성과 종속성을 주로 다룬다면, ABox 추론은 인스턴스 위주의 다양한 문제를 다루어서 실제 응용에서의 중요성이 매우 크다. 따라서 본 논문은 클래스의 제약 조건을 분석하고, 이를 통해 인스턴스가 속하는 클래스를 추론할 수 있는 방법을 제안한다. 객체 지향 언어 기반의 분산 파일 시스템을 활용했던 기존 방법과 달리 함수형 프로그래밍 기반의 인 메모리 시스템인 스파크를 통해 대용량 온톨로지 실체화 방법에 대해서 설명한다. 제안하는 기법의 효율성을 검증하기 위해 W3C의 Wine 온톨로지를 이용해 인스턴스를 생성(1억 2천만~6억개의 트리플)하고 실험을 수행하였다. 6억개의 트리플을 대상으로 진행한 실험의 경우 전체 추론 시간이 51분(696 K Triple/sec)이 소요되었다.

온톨로지 기반의 사용자 의도를 고려한 맞춤형 검색 서비스 (Ontology-based User Customized Search Service Considering User Intention)

  • 김수경;김건우
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.129-143
    • /
    • 2012
  • 웹 기술의 급속한 발전은 기업들이 관리해야 하는 정보량의 폭발적인 증가를 초래하였다. 이와 더불어 보다 정확한 정보를 찾기 위한 검색 엔진 솔루션 시장의 규모도 더불어 크게 증가하였다. 하지만 대부분의 검색엔진들은 사용자의 검색 의도를 고려하지 않고 사용자가 입력한 특정 키워드를 포함하는 문서들을 반환하는 방법을 채택하고 있어, 실제 사용자가 원하는 정보를 찾는데 까지는 부가적인 시간과 노력이 요구된다. 본 연구에서는 이러한 문제를 해결 하기 위한 중요 기술인 적합성을 만족시키기 위해 재현율과 정확율을 높일 수 있는 방법을 제안하였다. 우선 검색어의 재현율을 높일 수 있도록 유사어 관계 확장을 위한 온톨로지 스키마 모델을 제안하고 이를 기반으로 한 추론을 통해 검색어의 확장을 제시하였다. 확장된 검색어들을 이용하여 문서 검색을 하기 위한 다단계 유사도 검색 순위화 알고리즘을 제안하였다. 설계된 온톨로지 스키마와 온톨로지 저장소의 데이터를 기반으로 추론과 유사도 검색 순위화 엔진이 포함된 웹사이트 형식의 사용자 의도 적응형 검색 솔루션을 구현하였다. 구현된 검색 솔루션을 통해 다양한 검색어를 입력하여 제안 방법의 타당성을 입증하였고 사용자 의도를 고려한 맞춤형 검색 솔루션의 필요성을 설명하였다.

시맨틱 콘텐츠 검색을 위한 질의 확장 시스템 (Query Expansion System for Semantic Contents Retrieval)

  • 이무훈;최의인
    • 디지털융복합연구
    • /
    • 제10권10호
    • /
    • pp.307-312
    • /
    • 2012
  • 최근 논리적으로 표현된 지식 베이스를 사용하는 키워드 기반 검색에서 보다 더 정확한 결과를 제공하기 위해 시맨틱 검색 방법에 대한 연구가 진행되고 있다. 대부분의 사용자는 정형화된 질의어와 스키마를 사용하는 것 보다 사용자 키워드의 의미를 해석해서 사용한다. 본 논문에서는 시맨틱 검색을 위한 사용자 질의 확장을 제안한다. 제안 시스템에서는 지식 베이스와 연관 검색어를 활용한 사용자 질의 확장 콤포넌트와 사용자 질의 해석 결과를 조정하기 위한 콤포넌트를 제공한다. 마지막으로 논문에서 제안한 사용자 질의 의미 해석 기법의 검증을 위해 프로토타입 시스템의 실험 결과를 설명한다.

Onto Think-$K^{(R)}$: DBMS 기반 추론 서비스 (OntoThink-$K^{(R)}$: An Inference Service Based on DBMS)

  • 정한민;강인수;이미경;이승우;성원경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.200-204
    • /
    • 2006
  • 본 논문은 지식 기반 정보유통 플랫폼 OntoFrame-K$^{(R)}$ 상에서 추론을 이용하여 연구자 간 협업 서비스를 제공할 수 있도록 하는 DBMS 기반 추론 서비스 OntoThink-K$^{(R)}$에 대해 기술한다. 본 추론 서비스는 URI 서버를 이용하여 RDF 트리플을 생성하고 추론 규칙에 의해 해당 트리플을 확장하며 SPARQL을 통해 질의 결과를 생성해낸다. 특히 이 모든 과정은 DBMS 기반으로 설계 구현되었는데 URI 서버와 성과 비성과 등록 인터페이스를 통해 별도의 추론 엔진을 사용하지 않고도 정합성이 보장되는 지식을 생성 관리할 수 있도록 하며, 불안정한 성능을 보이는 추론 엔진을 이용하지 않기 때문에 안정적인 성능을 보장할 수 있다는 데 그 특징이 있다. OntoThink-K$^{(R)}$는 온톨로지 스키마 트리플, 인스턴스 트리플, 그리고 전방 추론을 통해 획득한 추가 트리플을 포함하는 확장 트리플을 기반 지식으로 하는데, 최종 사용되는 RDF 트리플의 크기는 지식 확장 이전 631,158개, 지식 확장 이후 1,112,100개이다.

  • PDF

국가과학기술 R&D 기반정보 온톨로지와 추론 모델링 (Semantic Web Ontology and Inference for Research Community)

  • 강인수;정한민;이승우;김평;성원경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.13-15
    • /
    • 2006
  • 과학기술 연구분야에서 인력, 기관 등의 연구 주체와 논문, 과제, 지적재산권 등의 성과에 대한 온톨로지는, 시맨틱 웹 환경에서 이질적 과학기술 연구정보의 의미적 통합과 자동화된 유통, 그리고 암묵적 지식의 추론을 가능케 할 것이다. 이 논문에서는 현재 한국과학기술정보연구원에서 개발 중인 국가과학기술 R&D 기반정보 은톨로지를 소개하고, 그의 응용으로써 은톨로지에 내재된 암묵적 지식들을 규칙을 사용하여 추론하는 과정의 기술에 중점을 둔다. 상기 은톨로지는 인스턴스의 유일성 확보를 위해 URI(Uniform Resource identifier)서버에 기반하여 온톨로지 인스턴스에 고유한 URI를 할당하는 데 중점을 두고 설계되었으며, 논문의 특정순위저자를 모델링한 저작자정보 클래스를 은톨로지 스키마 상에 명시적으로 표현한다는 특징이 있다.

  • PDF

한의 온톨로지 처방의 용량 단위 가공과 데이터베이스 스키마 설계 (Processing of dosage units and design of database schema for formulas in Korean medicine ontology)

  • 김상균;오용택;이명구
    • 대한한의학방제학회지
    • /
    • 제30권4호
    • /
    • pp.233-240
    • /
    • 2022
  • Objectives : This study aims to propose a processing method for dosage units of medicinal materials and the database schema to manage formula data in Korean medicine ontology. Methods : All dosage units of medicinal materials are collected from the seven textbooks that contain formula data of Korea medicine ontology. Dosages are converted to Arabic numerals and units that are frequently used are converted to representative units. Database schema is designed for processing and managing the formulas and medicinal materials with dosage units. Results : Seven representative units are selected out of 77 units. They will be used in the addition or subtraction of medicinal materials in a formula support system. The remaining units will be made available for references. Conclusions : EMR or chart programs used in clinical hospitals contain formula data that is already standardized. However, the formula data in Korean medicine literature and textbook is not refined, so it is necessary to process the dosages and units of medicinal materials to use in the formula support system. This result is a processing method to utilize the formula data of Korean medicine textbooks and it will be implemented this method in the established formula support system in the future.

지능형 OMDR 기반의 자동 문서 공유 에이전트를 이용한 지식서비스 (A Knowledge Service Using Automatic Document Sharing based on Intelligent OMDR)

  • 김수경;최호진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.747-750
    • /
    • 2008
  • 본 연구는 온톨로지, 자연어 처리, 메타데이터 등의 시맨틱 웹 기반 기술들을 이용하여 시맨틱 웹 응용을 위한 전체적인 기술 적용과 그의 활용에 목적을 두고 있다. 이를 위해 OWL을 기반으로 조직이나 기관의 지식 주제별 도메인 온톨로지와, 기존 워드넷(WordNet)이나 더브린 코어 메타데이터(Dublin Core Meta Data)와 조직에 정의된 데이터베이스의 스키마를 MDR로 구축하여 상호 연결하여 온톨로지가 갖는 지능적 추론과 규칙 서비스와 표준화된 메타데이터의 결합 방법을 제공한다. 이는 기존에 온톨로지와 메타데이터의 재활용과 연결(Alignment)에 있어 연구적으로 높은 가치가 있다. 그리고 조직의 사용자가 문서를 작성할 때 문서의 내용에 대해 자연어 처리 기술과 온톨로지의 기술을 이용해 적합한 용어나 메타데이터를 자동으로 제공하여 작성된 문서의 공유와 재사용성을 높이고, 작성된 문서를 XML 형식으로 구성되는 XML 기반 지능 문서 데이터베이스(XMB Based Intelligent Document Database)에 저장하여 유사한 문서를 작성하거나 사용할 필요가 있는 사용자에게 문서 등록과 검색 에이전트(Document Registry and Retrieval Agent)를 통해 이러한 제공하여 문서 지식의 사유화를 최소화 하고, 유사 문서의 재작성과 또는 특정 문서의 작성에 필요한 시간이나 경비를 줄이게 된다. 또한 웹상이나 PDA 같은 개인 휴대장치를 통해서도 서 등록과 검색 에이전트를 통해 문서를 검색하고 사용할 수 있게 한다면 언제 어디서나 해당 서비스를 활용하는 유비쿼터스와 시맨틱 웹의 실질적 응용을 거둘 수도 있으리라 사료된다.