• 제목/요약/키워드: 개념기반 정보검색

검색결과 369건 처리시간 0.028초

지식 문서에서 도메인 온톨로지를 이용한 개념 추출 기법 (Concept Extraction Technique from Documents Using Domain Ontology)

  • 문현정;우용태
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.309-316
    • /
    • 2006
  • 본 논문에서는 도메인 온톨로지를 이용하여 XML 형식의 지식 문서를 분류하고 대표 개념을 효과적으로 추출하기 위한 기법을 제시하였다. 먼저, 도메인 온톨로지는 텍스트마이닝 기법과 통계적 기법을 이용하여 생성하였다. 이를 위해 XML 문서의 구조적인 특징을 이용하여 도메인 대표용어 집합을 구성하였다. 그리고 XML 문서를 효과적으로 분류하기 위한 DScore 기법과 지식 문서로부터 개념을 추출하기 위한 TScore 기법을 제시하였다. 본 논문에서 제안한 기법의 효율성을 검증하기 위하여 295편의 컴퓨터 관련 논문을 대상으로 실험하였다. 실험 결과, 본 연구에서 제안한 도메인 대표 용어 집합을 이용한 분류 결과가 기존의 방법보다 우수한 성능을 보였다. 특히 TScore기법에서는 문서에서 출현한 용어의 빈도수는 낮더라도 문서의 개념을 대표할 수 있는 용어를 효과적으로 추출할 수 있음을 보였다. 본 연구는 개념 기반의 검색 기법을 통하여 대량의 지식 문서를 효과적으로 관리하기 위한 지식 관리 모델에 적용할 수 있다.

WebDBs: 사용자 중심의 웹 검색 엔진 (WebDBs : A User oriented Web Search Engine)

  • 김홍일;임해철
    • 한국통신학회논문지
    • /
    • 제24권7B호
    • /
    • pp.1331-1341
    • /
    • 1999
  • 본 연구에서는 SQL과 유사한 질의어를 사용하여 웹에 등록된 정보를 검색하는 시스템인 WebDBs(Web DataBase system)를 제안한다. 제안된 시스템에서는 웹에 산재되어 있는 HTML 문서로부터 검색에 필요한 정보들을 자동으로 추출한다. 추출된 자료에 대하여 SQL 기반의 질의 처리가 가능하도록 하였다. 웹 데이터베이스 시스템에서는 대부분의 질의 수행 시간이 통신 회선을 통한 문서 획득에 소요된다. 따라서, 웹 검색의 경우 웹 지역성에 많이 의존한다는 점에 착안하여, 사용자 검색 결과를 캐쉬에 저장하고 유사한 응용에서 이를 재사용 하고자 한다. 이때 캐쉬에 저장된 정보들을 검색된 질의와 연관하여 저장함으로써 좀더 사용자 응용을 고려한 캐쉬 관리기법을 제안하였다. 또한 위와 같은 개념에 입각한 웹 검색엔진을 구하였다.

  • PDF

EXSO/XKMS 서비스 플랫폼 구조 (EXSO/XKMS Service Platform Infrastructure)

  • 박남제;문기영
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 2003년도 하계학술대회논문집
    • /
    • pp.212-216
    • /
    • 2003
  • 최근 XML(extensible Markup Language)이 인터넷 전자거래와 데이터 전송 및 검색 부문에서 광범위하게 이용됨에 따라 중요한 거래들의 온라인 인증을 위한 암호키 관리가 요구되므로 XML기반의 키 관리에 대한 연구 개발이 필요하다. 그러나 현재 여러 나라에서 이러한 XML키 관리 기술에 대한 연구와 함께 XML 키 관리 시스템들이 시범 모델로 개발되고 있는 것에 반해 국내에서는 연구 및 개발이 미흡한 실정이다. 본 논문에서는 XML 키 관리의 개념에 대하여 살펴보고, 이를 바탕으로 설계한 EXSO/XKMS 서비스 플랫폼에 대해 설명하고자 한다. EXSO/XKMS에 대해서는 기반 플랫폼 구조 및 구현한 EXSO /XKMS 서비스 컴포넌트에 대해 기술하고, 개발 중인 서비스 시스템의 기능 및 특징에 관하여 기술한다.

  • PDF

온톨로지 기반의 기록물 검색 시스템을 위한 인터페이스 제안 (A Suggestion of Interface for Ontology-Based Record Retrieval System)

  • 이유빈;이해영
    • 한국기록관리학회지
    • /
    • 제17권1호
    • /
    • pp.217-244
    • /
    • 2017
  • 정보기술의 발달로 이용자들은 아키비스트의 개입 없이 자유롭게 기록을 검색할 수 있게 되었지만, 기존의 기록물 검색 시스템은 이용자의 의도를 파악하지 못하는 단편적인 결과를 제공하고 있다. 이런 문제를 극복하기 위해 시맨틱 웹 기술이 발전하고 있으며, ICA에서는 이를 반영하여 새로운 기록물 기술 표준인 RIC(Record In Context)을 개발하고 있다. RIC의 개념모델과 온톨로지는 시맨틱 검색을 구현하는 기반이 되기 때문에, 이것이 실제로 어떻게 이용자들에게 서비스될 수 있을지 고민해볼 필요가 있다. 따라서 본 연구에서는 온톨로지를 기반으로 하는 기록물 검색 시스템이 어떤 인터페이스를 통해 구현될 수 있을지 제안해보았다. 시맨틱웹 기술을 기반으로 한 검색 시스템의 사례 3가지를 선정해 이용자들의 인터뷰를 통한 사용경험 평가를 진행하였고, 여기에서 얻은 시사점을 기반으로 하여 기록물 검색 시스템의 인터페이스를 4가지 측면으로 구성하여 제안하였다.

의미정보기반 검색시스템의 설계 및 구현 (Design and Implemantation of Information Retrieval System based on Semantic Information)

  • 박창근;양기철
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.265-268
    • /
    • 2004
  • 현재 대부분의 정보검색시스템에서 사용되고 있는 키워드 매칭기법은 기하급수적으로 늘어나는 정보를 효과적으로 처리하기에는 부적합하다. 이러한 문제는 의미정보를 활용하여 해결할 수 있으며, 본 논문에서는 의미정보를 효과적으로 활용할 수 있는 한 방법을 제시한다. 본 논문에서 제안한 기법은 의미정보를 개념그래프를 이용하여 표현하고, 이를 정보검색에 활용한다. 구현된 시스템은 완전 매칭과 부분 매칭이 가능한 시스템이다. 부분 매칭은 구문적 부분 매칭과 의미적 부분 매칭 두 가지가 있다. 의미적 유사도는 온톨로지 내의 서브클래스 관계로 계산된다. 이러한 기법은 정보검색 뿐만 아니라 동적 하이퍼링크의 구현 등 다양한 분야에서 적용될 수 있다.

  • PDF

혼합형 이미지 메타데이타를 이용한 지능적 이미지 검색 시스템 설계 및 구현 (A Design and Implementation of Intelligent Image Retrieval System using Hybrid Image Metadata)

  • 홍성용;나연묵
    • 한국멀티미디어학회논문지
    • /
    • 제3권3호
    • /
    • pp.209-223
    • /
    • 2000
  • 멀티미디어 데이타의 중요성과 활용도가 증가됨에 따라 데이타베이스에서 멀티미디어 데이타를 표현하고 관리하기 위한 연구가 필요하게 되었다. 따라서, 본 논문은 혼합형 이미지 메타데이타를 이용하여 이미지 데이타베이스에서 이미지 데이타에 대한 검색 기법을 지능화하고 시스템을 효율적으로 관리할 수 있는 시스템을 제시한다. 개념 계층을 기반으로 이미지 정보를 지능적인 형태로 저장, 검색하고, 이미지 마이닝을 하기위해 사용자의 정보와 사용자가 이용한 질의 정보 그리고 이 미지정보를 통합하여 검색한다. 즉, 사용자 메타데이타와 이미지 메타데이타를 추출하고 통합하여 사용자에게 좀더 많은 부가 정보를 제공할 수 있는 지능적 이미지검색 시스템을 제공한다.

  • PDF

MPEG-4/7 기술과 대화형 방송

  • 김진웅
    • 정보와 통신
    • /
    • 제18권10호
    • /
    • pp.75-87
    • /
    • 2001
  • 방송 서비스는 이제 디지털 시대를 맞이하여 일대 패러다임의 변화를 겪고 있다. 전 세계는 본격적인 디지털 방송 시대를 맞이하고 있으며, 새로운 반송 환경에서는 기존의 서비스와는 비교할 수 없을 정도로 향상된 품질의 오디오비쥬얼 데이터를 제공할 뿐만 아니라, 시청자의 요구에 적절히 대응하는 대화형 멀티미디어 방송 서비스 제공이 가능해 진다. 이러한 방송 분야의 눈부신 발전에는 국제 표준화 기구인 ISO/IEC 산하의 동영상 전문가 그룹인 MPEG의 표준기술 개발이 큰 원동력이 되고 있다. 본 고에서는 대화형 방송의 개념과 기술을 중심으로 현재 진행되고 있는 방송 기술의 변화를 살펴보고, 객체 지반의 데이터 압축, 처리, 전송을 가능하게 하는 MPEG-4 및 내용 기반 검색 및 필터링을 가능하게 하는 MPEG-7 기술의 개념 및 방송 서비스 적용에 대해 검토해보기로 한다.

  • PDF

Development of a Method for Analyzing and Visualizing Concept Hierarchies based on Relational Attributes and its Application on Public Open Datasets

  • Hwang, Suk-Hyung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권9호
    • /
    • pp.13-25
    • /
    • 2021
  • 인터넷과 정보통신, 인공지능기술을 기반으로 하는 디지털 혁신 시대를 맞이하면서 거대한 규모의 데이터집합이 발생, 수집, 축적되어, 다양한 공공기관에서 온라인에 오픈하여 유용한 공공정보를 제공하고 있다. 데이터를 분석하여 유용한 통찰력과 정보를 얻기 위하여, 데이터집합에 내재되어 있는 객체와 속성 사이의 이진 관계를 기반으로 데이터를 분석, 분류, 군집화 및 시각화하는 형식개념분석기법이 성공적으로 사용되어 왔다. 본 논문에서는 형식개념분석기법을 확장하여, 객체의 속성뿐만 아니라 객체들 사이의 관련 관계를 기반으로 데이터집합을 분류하고 개념화하여 가시화하기 위한 기법과 지원도구를 제안한다. 일부 공공 오픈 데이터집합을 대상으로 본 논문의 제안기법을 적용하여 몇 가지 실험을 수행한 결과, 데이터집합으로부터 개념 계층구조를 생성하고 시각화하여 보다 유용한 지식을 추출함으로써 제안기법의 타당성과 유용성을 실증하였다. 본 논문에서 제안한 분석기법은 효과적인 데이터분석, 분류, 군집화, 시각화, 정보검색 등을 위한 유용한 도구로 사용될 수 있다.

헬름홀츠머신 학습 기반의 의미 커널을 이용한 문서 유사도 측정 (Estimation of Document Similarity using Semantic Kernel Derived from Helmholtz Machines)

  • 장정호;김유섭;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.440-442
    • /
    • 2003
  • 문서 집합 내의 개념 또는 의미 관계의 자동 분석은 보다 효율적인 정보 획득과 단어수준 이상의 개념 수준에서의 운서 비교를 가능하게 한다. 본 논문에서는 은닉변수모델을 이용하여 문서 집합으로부터 단어들 간의 의미관계를 자동적으로 추출하고 이를 통해 문서간 유사도 측정을 효과적으로 하기 위한 방안을 제시한다. 은닉변수 모델로는 다중요인모델의 학습이 용이한 헬름홀츠 머신을 활용하묘 이의 학습 결과에 기반하여, 문서간 비교를 한 의미 커널(semantic kernel)을 구축한다. 2개의 문서 집합 HEDLINE과 CACM 데이터에 대한 검색 실험에서, 제안된 기법을 적응함으로써 기본 VSM(Vector Space Model) 에 비해 20% 이상의 평균 정확도 향상을 이를 수 있었다.

  • PDF

시각정보의 구문적 서술 이질성 극복을 위한 서술 변환 (The Conversion of Descriptions for Solving the Heterogeneity of Syntactic Descriptions in Visual Data)

  • 김원필;정관호;공현장;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.824-826
    • /
    • 2003
  • 지능형 개념기반 검색시스템(Intelligent Concept Based Retrieval System)은 구문적 서술(Syntactic Description)과 의미적 서술(Semantic Description)과 의한 상호 융합으로 이뤄질 수 있는데 컬러 히스토그램, Curvanature 히스토그램등과 같은 구운적 서술(Syntactic Description) 내용의 추출은 현재의 기술들로 잘 이를 수 있다. 또한 특정 응용 분야에서뿐만 아니라 미디어 타입에 따라서도 쉽게 사용될 수 있다. 이미 MPEG-7에서 표준화된 Description Scheme을 제공하고 있다. 그러나 기술 구조 레벨과 개요 레벨등과 같은 다양한 기술 레벨들에 의해 구문적 서술(Syntactic Description) 이질성은 발생한다. 따라서 본 연구에서는 Polygonal mesh 기반 미디어 객체 표현방법을 제시하고 이를 통해 간접적 서술 변환을 할 수 있는 방안을 제시하여 구문적 서술(Syntactic Description)에서의 이질성 문제를 해결하였다.

  • PDF