• 제목/요약/키워드: 개념기반 정보검색

검색결과 368건 처리시간 0.027초

OWL 온톨로지 사용을 위한 SPARQL 쿼리 툴 (SPARQL Query Tool for Using OWL Ontology)

  • 조대웅;최지웅;김명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권11호
    • /
    • pp.21-30
    • /
    • 2009
  • 시맨틱 웹에서는 RDF, RDFS, OWL과 같은 온톨로지 구축 언어를 이용하여 웹 리소스의 메타데이터를 정의한다. 이러한 시맨틱 웹 기술을 이용한 연구는 에이전트를 기반으로 한 온톨로지의 개념에 대한 관계 및 트리플을 추출하기 위한 목적으로 진행되고 있다. 하지만 에이전트 기반의 온톨로지의 개념에 대한 관계 및 트리플의 추출은 에이전트의 특성상 한정된 쿼리 문을 작성하게 된다. 이는 온톨로지 안의 다른 개념에 대한 관계 및 트리플을 추출하고자 할 때는 유연성이 떨어진다. 온톨로지 정보 자체에 대한 유연성 있는 정보 검색을 하기 위해서는 표준 온톨로지 언어에 접근 및 표준 쿼리 언어의 이용이 가능한 쿼리 툴이 필요 하다. 본 논문에서는 OWL 온톨로지에 HTTP 프로토콜을 이용하여 접근이 가능하고, 쿼리를 할 수 있는 SPARQL 쿼리 툴을 제안한다. 툴에 의해 생성되는 쿼리 결과는 SOAP 메시지 형태로 변환 출력함으로써 웹 서비스를 이용한 접근도 가능하다.

브리지 XMDR 기반의 여행정보 검색 시스템 (Traveal Information Retrieval System based on Bridge XMDR)

  • 김익한;국윤규;엄영현;정계동;최영근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.103-105
    • /
    • 2006
  • 최근 기업들은 분산된 조직과 각 조직의 목적에 따라 데이터베이스도 분산되어 있기 때문에 이들 간의 공유 및 협업을 통한 상호 운용성을 지원하기 어려우므로 일관적인 형태로 연동하기 위해서 메타데이터 수준의 표준이 필요하다. 또한 협업적인 거래환경에서의 EAI시스템은 다양한 정보 시스템에서 관리되는 지식들을 유기적으로 통합하고 공유함으로서 효율적인 검색 및 비용절감 등 많은 효과를 기대할 수 있다. 그러나 기존의 시스템은 특정 목적에 따라 관리되고 공유되므로 사실상 통합 외 공유에는 상당한 어려움이 있다. 따라서 본 논문에서 제시하는 XMDR은 온톨로지와 메타데이터 결합된 형태로 각종 표준들을 일관적인 형태로 온톨로지와 시소러스 개념을 도입함으로서 데이터수준의 정보를 통합 하기위한 메타데이터 공유 및 정보 시스템 통합의 일관성을 유지 할 수 있다. 본 논문에서 제시되는 브리지 XMDR 검색시스템은 원시데이터 계층, XMDR 계층. 브리지 XMDR 계층으로 3계층으로 구성된다. XMDR 계층은 분산된 데이터베이스의 속성표현의 표준과 관계성을 정의한 표준 온톨로지, 카테고리 분류 온틀로지, 사이트의 정보를 제공하는 로케이션 온톨로지로 구성되는 XMDR을 정의한다. 브리지 XMDR 계층은 XMDR간의 정보를 공유하기 위한 공유 도메인 속성을 추출한 하이브리드 통합방식으로 업무간의 의미적 통합이 가능하다.

  • PDF

시맨틱웹 기술과 활용방안 (The SemanticWeb Technology and its Applications)

  • 오삼균
    • 정보관리학회지
    • /
    • 제19권4호
    • /
    • pp.298-319
    • /
    • 2002
  • 시맨틱웹은 기계가독형 정의에 기반한 정보의 연계를 통해 웹 자원을 지식화함으로써 정보의 효율적 검색, 통합, 재사용을 도모하는 새로운 기술이다. 시맨틱웹의 구축은 자원에 불변 고유식별자를 부과하는 URI 체제, 각 정보기관에서 생성되는 요소와 속성의 의미 충돌을 방지하는 XML 네임스페이스, 메타데이터 스키마를 활용한 호환적 자원기술을 가능하게 하는 RDF, 메타 데이터 요소 및 이와 연관된 클래스와 속성 관계 정의의 기반이 되는 RDF 스키마, 그리고 RDF 스키마 위에 논리적 추론과 표현력을 강화한 웹 온톨로지 언어 DAML+OIL 및 그 건조자 (constructors)를 삭제 또는 수정 보완한 OWL (Web Ontology Language) 등의 여러 핵심 개념과 기술을 필요로 하는 작업이다. 이 논문은 이러한 개념과 기술의 점진적 발전 양상을 개괄 설명하고, XML/RDF 스키마를 기반으로 메타데이터 요소들을 정의할 경우 도출할 수 있는 상호운용성과 온톨로지의 다양한 활용 방안 등을 고찰한다.

자동 음차표기를 이용한 영-한 음차표기 대역쌍의 자동 추출 (An Algorithm for extracting English-Korean Transliteration pairs using Automatic I-K Transliteration)

  • 오종훈;배선미;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.928-930
    • /
    • 2004
  • 지금까지 기계번역과 교차언어 정보검색 등과 같은 자연언어응용에서 사용되는 번역지식을 자동으로 구축하는 연구가 활발히 진행되어 왔다. 번역지식을 자동으로 구축하는 연구는 대역사전에 등재되어 있지 않은 미등록어에 대한 대역정보를 문서에서 자동으로 획득하는 것을 목표로 한다. 최근에는 이러한 미등록어 중 음차표기 번역지식에 대한 연구가 활발히 진행되고 있다. 음차표기는 주로 영어 단어를 발음에 기반하여 비영어권의 언어로 표기하는 것을 의미한다. 음차표기된 단어들은 새로운 개념을 나타내는 신조어가 많기 때문에 사전에 등재되어 있지 않온 경우가 많다. 따라서 효과적인 번역지식 구축을 위해서는 이러한 음차표기 번역지식을 자동으로 획득하는 것은 매우 중요하다. 본 논문에서는 영-한 음차표기 대역쌍을 문서에서 자동으로 추출하는 알고리즘을 제안한다. 본 논문의 기법은 한국어 음차표기의 인식, 영-한 자동음차표기, 한국어 음차표기와 자동음차표기된 영어단어간의 음성적 유사도 비교를 통하여 음차표기 대역쌍을 추출한다. 본 논문의 기법은 약 93%의 정확률과 68%의 재현율을 나타내었다.

  • PDF

하이브리드 데이터베이스 기반의 4단계 레이어 계층구조에서 메타규칙을 적용한 질의어 수행 모델에 관한 연구 (A Study of Query Processing Model to applied Meta Rule in 4-Level Layer based on Hybrid Databases)

  • 오염덕
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.125-134
    • /
    • 2009
  • 웹을 통한 생물 데이터 접근 방식은 많은 과학자들에게 대화식으로 서로 다른 형식의 생물 데이터베이스 내용을 검색할 뿐만 아니라, 한 데이터베이스에서 다른 분자생물 데이터베이스로의 연결을 위한 강력한 도구를 제공한다. 본 논문에서의 생물 개념 모델은 생물 데이터 제어를 위한 4가지 통합 레이어를 기반으로 각 생물 데이터 소스 간의 연관성에 따른 규칙 속성을 적용하고 데이터 소스 중에 관심 대상이 되는 개체를 표현하여 하이브리드 생물 데이터 모델을 구성하였다. 특정 사용자의 응용 서비스 요구가 발생하면 해당 생물 데이터베이스와 웹 서비스를 통한 데이터 소스로부터 정보를 획득한다. 본 논문에서는 통합 레이어를 기반으로 웹 데이터 소스 상에서 정보를 탐색하기 위해 메타 규칙을 적용한 질의어 처리 모형과 수행구조를 정형화하였다.

전자정부내 의미기반 기술 도입에 따른 기능 및 정책 연구 (Research on Function and Policy for e-Government System using Semantic Technology)

  • 장영철
    • 한국산업정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.22-28
    • /
    • 2008
  • 본 논문에서는 전자정부 시스템의 대 국민 사용성과 효율성을 증진시키기 위한 의미기반 문서 분류 방법(CoWDC)을 제시한다. 기존 의미기반 문서분류 방법에서 많은 양의 키워드들의 계층적 컨셉들을 이용하는 것을 지양하고 사용자들이 사용하는 키워드들 간의 관계를 중심으로 문서를 분류한다. 즉, 문서의 컨텍스트(context)에 근거하여 깊고 정확한 의미를 키워드 간 관계를 분석하여 적은 양의 정보로 효율적인 문서분류를 하게 된다. 이를 위해 제안한 CoWDC(Concept Wright Document Classification) 시스템은 기존의 시소러스/온톨로지의 의존도를 줄이고 키워드 관계, 관계의 경중 고려, 상하위 개념으로 변환 등을 통한 실험과 평가가 이루어졌다. 전자정부 시스템의 구조 및 특징 분석을 통해 CoWDC 실험 결과는 대국민 서비스 향상을 위해 매우 필요함을 인지하고 이를 접목하기 위한 기술적, 정책적 제언을 제시하였다. CoWDC를 통해 의미기반 검색기술의 우수함을 입증하였고 이는 전자정부 시스템의 지식베이스 구축, 운영체제의 운용, 시소러스의 구성 등의 과정에서 체계적으로 통합 운영되어야 한다.

  • PDF

데이터 마이닝 기법을 이용한 XML 문서의 온톨로지 반자동 생성 (Semi-Automatic Ontology Generation about XML Documents using Data Mining Method)

  • 구미숙;황정희;류근호;홍장의
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.299-308
    • /
    • 2006
  • 최근 웹 문서를 비롯한 공공 문서 등에 대한 문서 교환을 위해 XML 데이터를 이용한 표준화 작업이 진행 중이므로 XML 문서가 증가하고 있다. 이와 같은 XML 문서에 대한 정보 검색의 효율을 높이기 위해 의미적 요소를 추가한 온톨로지를 기반으로 하는 시맨틱 웹이 등장하였다. 그러나 기존의 수동적인 온톨로지 구축 방식은 비용과 시간이 많이 소모되는 단점이 있으므로 이 논문에서는 유사한 도메인의 XML문서 집합으로부터 데이터 마이닝 기법의 연관규칙 알고리즘을 이용하여 반자동으로 온톨로지를 구축하는 방법을 제안한다. 제안한 방법은 특정한 도메인에 대한 온톨로지를 구축하기 위해서 필요한 데이터의 형태 및 개념 레벨, 그리고 얼마나 많은 개념을 사용할 것인가 하는 도메인 범위의 자동 설정을 온톨로지 자동 생성을 위한 온톨로지 도메인 레벨을 결정하기 위해서 데이터 마이닝 알고리즘을 이용한다. XML 문서의 태그에 대해 연관규칙을 적용하여 빈발하게 발생하는 빈발 패턴을 찾아내고, 서로 관련 있는 개념의 쌍을 추출하여 온톨로지 자동 생성을 위한 도메인 범위를 설정한다. 온톨로지 구축은 온톨로지 언어중의 하나인 XML Topic Maps와 공개 소스인 토픽법 엔진인 TM4J를 이용하여 온톨로지 기반의 시맨틱 웹 엔진을 구현하였다.

시소러스 국제표준 기반 기본 범주의 확장에 관한 연구 (A Study on the Expansion of Fundamental Categories Based on Thesaurus International Standards)

  • 장인호
    • 한국도서관정보학회지
    • /
    • 제50권1호
    • /
    • pp.273-291
    • /
    • 2019
  • 본 연구는 시소러스 국제표준(ISO 25964-1) 제11절 "패싯 분석"과 제5절의 "시소러스에 있어서의 개념 및 그들의 범위"를 분석하여, 제11절에 예시된 기본 범주(대상, 물질, 에이전트, 행위, 장소, 시간 등)를 확장하는 데에 목적이 있다. 이를 위해 온톨로지의 최상위 개념(구구리일랑(溝口理一郞)의 상위 온톨로지인 YAMATO)과 기존의 기본 범주들(Ranganathan의 PMEST, FRBR 제3집단, CRG 13 범주 등)을 참조하여, 기본 범주에 정신적 실체를 명시적으로 추가하고, 일부를 조정하여 기본 범주를 확립했다. 또한, 확립된 기본 범주를 Ranganathan의 PMEST의 구체성/추상성과 구구리일랑(溝口理一郞)의 YAMATO의 독립성/종속성을 기반으로 재편성 및 구조화하였다. 최상위 범주를 독립 실체와 종속 실체로 이분하고 하위 구분으로 전자는 28범주, 후자는 2범주를 두었다. 본 연구의 결과는 기본 범주의 활용이 기대되는 분류, 택소노미, 시소러스 등의 제어 어휘 및 정보검색용 온톨로지를 생성할 때 최상위 개념으로서 재활용되고 참조할 수 있을 것으로 기대된다.

디지털 방송에서 자동공지 기능을 지원하는 개인화 EPG 구현 모델 연구 (A Study on Establishing Personalized EPG Model to support Automatic Notify fuction in the Digital Broadcasting)

  • 황하연;윤용익;이창훈
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2002년도 하계학술대회 및 세미나
    • /
    • pp.156-167
    • /
    • 2002
  • 디지털방송의 주요 특징은 고품질, 데이터방송, 다채널로 요약할 수 있다. 다채널화는 현재보다 채널수, 프로그램수의 급격한 증가로 이어지며 채널수 프로그램수의 증가는 시청자가 지금보다 원하는 프로그램을 찾는데 보다 많은 시간이 소요됨을 의미한다. 디지털 방송에서는 시청자의 프로그램 탐색을 돕는 전자프로그램 가이드(EPG : Electric Program Guide) 서비스를 제공하고 있으나 현재 EPG는 기존의 신문에서 제공하는 채널별 프로그램 가이드와 크게 기능이 다르지 않다. 이에 따라 최근 EPG는 주제별, 시간대별 방송프로그램 검색 외에 Agent의 개념을 도입하여 개인의 취향을 분석하는 EPG를 개인화에 대한 연구가 이루어 지고 있으며 더 나아가 정보를 자동으로 공지하는 방법에 대한 연구도 요구되어 진다. 본 연구에서는 사용자 취향에 적합한 프로그램 정보가 취득 되는 대로 별도 조작 없이 공지될 수 있는 ${\ulcorner}$자동공지 기반의 AP-EPG${\lrcorner}$ 에 대하여 제안하고자 한다.

  • PDF

객체관계형 데이터베이스 시스템에서의 시간 확장 (A Temporal Extension on Object Relational Database System)

  • 윤성현;신예호;오광진;이지영;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.343-345
    • /
    • 1999
  • 데이터베이스 시스템은 실세계에서의 객체들이 다양한 모델링을 통하여 구축된 데이터베이스에 대해 검색, 갱신, 분석 출력 및 논리적인 일관성 제어 등을 할 수 있는 소프트웨어 시스템이다. 그러나 전통적인 데이터베이스 시스템은 시간에 따라 변화하는 데이터의 이력을 관리 할 수 없다. 따라서 이력정보(Historical Informations)를 관리할 수 있게 하기 위해서는 시간차원의 확장이 필요하다. 즉, 기존의 데이터베이스 시스템이 제공하지 못하였던 각 정보들의 이력관리와 이력을 이용한 다양한 서비스를 가능하게 하도록 시간차원을 지원할 수 있는 데이터베이스 시스템을 시간 데이터베이스 시스템이라 하며, 이를 위하여 이 논문에서는 객체관계형 데이터베이스 시스템을 기반으로 객체관계형의 특징과 레이어 개념을 이용하여 새로운 시간차원을 확장함으로써, 기존의 시스템을 현 상태로도 유지할 수 있는 시간 데이터베이스 시스템을 말한다.

  • PDF