• 제목/요약/키워드: 확장검색어

검색결과 200건 처리시간 0.025초

문서 자동요약 기술을 적용한 클라우드 스토리지 기반 지능적 아카이빙 시스템 (Cloud storage-based intelligent archiving system applying automatic document summarization)

  • 유기동
    • 한국산업정보학회논문지
    • /
    • 제17권3호
    • /
    • pp.59-68
    • /
    • 2012
  • 제로 클라이언트 체제는 기업의 문서 중앙화를 위해 제시된 최신의 방법이며, 이를 기업의 현실에 보다 적합하도록 토착화시키는 작업은 필수적이다. 본 연구는 제로 클라이언트 체제의 잘 알려진 보안 및 프라이버시 상의 문제점을 제외한, 사용 상의 문제점을 보완하고자 고안되었다. 즉, 작업자가 작업한 문서를 기업 클라우드 스토리지에 저장하고자 저장 카테고리를 검색하는 과정의 부담과 정확성을 향상시키기 위하여, 작업 문서의 주제어를 자동으로 파악하고, 이를 바탕으로 해당 문서가 저장되어야 하는 카테고리를 자동으로 검색하여 작업자의 확인을 통해 자동 저장되도록 하는, 지능적 아카이빙 방식을 제시한다. 본 연구에서 제시하는 주제어 자동 파악 및 자동 아카이빙을 위한 방법론과 프로토타입 시스템은 기업 환경에 적용이 가능할 정도로 정확성과 확장성을 갖추고 있다.

KNetIRS : 키워드망을 이용한 정보검색 시스템 (KNetIRS : Information Retrieval System using Keyword Network)

  • 우선미;유춘식;이종득;김용성
    • 한국정보처리학회논문지
    • /
    • 제4권9호
    • /
    • pp.2185-2196
    • /
    • 1997
  • 기존의 정보검색 시스템들은 질의가 정확하지 않더라도 원하는 정보를 검색할 수 있도록 하기 위해 시소리스 (thesaurus)를 사용했다. 그러나 시소러스를 구축하고 유지하는데 드는 비용이 매우 높고 검색에 있어서도 완전하다고 볼 수 없다. 그래서 본 논문에서는 이러한 문제점들을 해결하기 위하여 키워드망을 이용한 정보검색 시스템인 KNetIRS를 설계 및 구현한다. 키워드망은 문서로부터 직접 추출한 키워드들로 구성된다. KNetIRS는 역파일 (Iinverted file)의 개념에 기반을 둔 키워드망을 이용하여 데이터베이스에서 적합한 문서만을 탐색한다. 그리고 KNetIRS는 역파일 (Iinverted file)의 개념에 기반을 둔 키워드망을 이용하여 데이터베이스에서 적합한 문서만을 탐색한다. 그리고 KNetIRS는 키워드망 브라우저(Keyword Network Browser)를 사용하여 질의를 확장하고, 분할 연산(spilt function)을 정의하여 "정보 검색", "정보", 그리고 "검색"과 같은 복합어에 관한 처리를 한다.

  • PDF

국가R&D정보활용을 위한 전문용어사전 구축 (Construction of the Terminology Dictionary for National R&D Information Utilization)

  • 김태현;양명석;최광남
    • 한국콘텐츠학회논문지
    • /
    • 제19권10호
    • /
    • pp.217-225
    • /
    • 2019
  • 국가연구개발(R&D, Research and Development) 정보는 정부부처로부터 발주되는 사업 과제를 수행하는 과정에서 발생되는 다양한 연구분야의 정보들이 포함되어 있다. 따라서 효율적인 R&D정보 검색을 위해서는 이러한 국가R&D정보의 특성을 반영할 수 있는 국가R&D 전문용어사전 구축이 필요하다. 본 연구에서는 국가R&D정보에서 연구분야를 명시하기 위해 활용되는 국가과학기술표준분류를 적용하여 국가R&D용어사전을 구축하기 위한 방안을 제안한다. 국가R&D 과제정보의 구조적 특성과 그에 따른 과제 키워드의 유용성에 대해 언급하고, 국가과학기술표준분류별 국가R&D정보 현황과 국가R&D 용어의 특성에 대해 살펴보고자 한다. 그리고 이를 바탕으로 국가R&D용어사전을 구축하기 위한 방법을 용어사전의 유형과 구조, 사전구축 절차, 정제규칙의 관점에서 정의한다. 본 연구를 기반으로 구축되는 국가R&D용어사전은 국가R&D정보 검색 시 한 영 대역어, 동의어 등을 활용한 검색어 확장과 국가과학기술표준분류를 활용한 검색 범위 명확화, 용어설명 정보를 활용한 이용자 편의기능 제공 등에 다양하게 활용될 수 있다.

관계형 테이블을 이용한 W3C XQuery 변경 기능의 지원 (W3C XQuery Update facility on SQL hosts)

  • 홍동권
    • 한국지능시스템학회논문지
    • /
    • 제18권3호
    • /
    • pp.306-310
    • /
    • 2008
  • XML 질의어의 표준으로 인정받고 있는 XQuery의 검색 기능의 확장으로 새로운 XML의 삽입, 삭제 기능에 대한 표준화가 진행되고 있다. XML 데이터베이스가 단순한 문서 관리의 기능에서 벗어나 기존 데이터베이스의 장점인 OLTP 기능까지 지원하려는 노력을 하고 있다. 본 논문은 XQuery 검색 기능을 관계형 환경에서 지원하기 위한 선행 연구의 결과에 XQuery 변경 기능을 추가하기 위한 연구의 결과로 1) XML을 저장하기 위한 테이블 구조, 2) 계층 구조를 저장하기 위한 번호 부여 방식, 3) 효율적인 검색 기능을 지원하기 위한 경로 사용의 장.단점, 4) XQuery 변경 구문의 SQL 변환 과정을 제시한다.

검색 키워드 확장을 이용한 온톨로지 자동 생성 시스템 개발 (The Development of Automatic Ontology Generation System Using Extended Search Keywords)

  • 심준;이홍철
    • 한국산학기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.1220-1228
    • /
    • 2009
  • 시맨틱 웹의 핵심인 온톨로지는 주로 특정 도메인에 한정되거나 휴리스틱에 의존해 의미와 관계를 정의하여 생성하고 있다. 하지만 온톨로지의 생성은 매우 어려울 뿐만 아니라 많은 시간이 소요되는 작업이다. 특정 분야에서 사용되는 온톨로지와 달리 웹에서 사용되는 온톨로지는 지식 및 정보 표현의 범위가 한정적이지 않기 때문에 기존의 온톨로지 생성 방식으로는 정보를 표현하기가 어렵다. 따라서 온톨로지의 자동 생성은 시맨틱 웹의 구현에 있어서 매우 중요한 부분을 차지하게 된다. 본 논문에서는 웹 온톨로지를 자동으로 생성하기 위해서 형태소 분석을 이용하여 검색엔진에서 사용자들이 입력하는 검색 키워드로부터 색인어를 추출하고, 이와 관련된 키워드를 확장시켜 온톨로지를 생성하고 갱신하는 방법에 대하여 제안한다.

링크 질의를 통한 XML 문서의 검색 기법 (Retrieval Scheme of XML Documents Using Link Queries)

  • 문찬호;강현철
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.313-326
    • /
    • 2001
  • Web 문서를 기술하기 위해 차세대 표준으로 제안된 XML은 Web 기반의 여러 응용 분야에서 널리 사용되고 있으며, Web 상의 XML 문서들은 서로 하이퍼링크를 통해 연결되어 있다. 현재까지 대부분의 XML 관련 연구들은 XML 문서의 효율적인 저장, 관리 및 검색을 위한 XML 저장 시스템을 대상으로 하고 있으며, XML 링크를 지원하는 질의어의 개발이나 링크를 활용한 XML 검색 시스템의 개발에 대한 연구는 미흡하다. 본 논문에서는, XML 링크 질의 표현을 위한 XML 질의어의 확장과 링크 질의 처리 기법을 제시한다. 링크 질의는 하나의 XML 문서(질의 문서)와 질의 문서 내의 링크로 참조되는 XML 문서(참조 문서)들의 내용을 검색하는 것이다. 참조 문서의 검색을 위해서 현재는, 참조 문서에 대한 질의를 수작업으로 생성, 처리, 그리고 그 결과의 리턴을 반복적으로 수행하는 방법이 사용되고 있다. 본 논문의 링크 질의 처리 목적은 한번의 질의 입력을 통해 추가적인 수작업 없이 참조 문서(들)에 대한 검색 결과까지 얻을 수 있는 기능을 제공하는 것이다. 기존 수작업 기반과 본 논문의 링크 질의 처리의 성능을 비교, 분석한 결과, 참조 문서로의 링크가 많을수록 수작업 기반에 비하여 질의 처리 시간이 줄어들고, 질의 문서가 저장된 사이트에 참조 문서가 많이 있을수록, 질의 처리 시간이 줄어들었다.

  • PDF

2단계 퍼지 지식베이스를 이용한 질의 처리 모델 (Query Processing Model Using Two-level Fuzzy Knowledge Base)

  • 이기영;김영운
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.1-16
    • /
    • 2005
  • 웹 기반의 학술분야 전문 검색 시스템은 사용자의 정보 요구 표현을 극히 제한적으로 허용함으로써 검색된 정보의 내용 분석과 정보 습득의 과정이 일관되지 못해 무분별한 정보 제공이 이루어진다. 따라서 본 논문에서는 문서 지식 구조를 파악하여 사용자 질의 용어와 색인어 사이의 내용 기반 유사도를 반영한 순위 재조정 모델을 제안한다. 이를 위해 전자는 시소러스 및 유사관계 행렬을 구축하여 주제 분석 메커니즘을 제공하고, 후자는 사용자 요구를 분석하기 위해 질의 확장 등의 탐색 모형을 수립하는 알고리즘을 제안한다. 따라서 본 논문에서 제안한 알고리즘은 검색 시스템의 정보 구조를 활용한 검색으로 재현율을 유지하면서 동시에 기존 퍼지 검색 모델의 단점인 정확률을 향상시키는 2단계 탐색모형을 수립하는 내용 기반검색 기법이라 할 수 있다.

  • PDF

디지털 콘텐츠의 효율적 검색과 관리를 위한 UCI 식별체계의 온톨로지 적용 (Applying Ontologies to UCI for the Efficient Search and Management of Digital Contents)

  • 하은옥;김윤호
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.215-228
    • /
    • 2009
  • 디지털 콘텐츠 식별체계인 UCI(Universal Content Identifier)는 디지털 콘텐츠의 투명한 유통과정과 효율적 검색과 관리를 위해서 만든 URN(Uniform Resource Name)에 기반을 둔 식별체계이다. UCI 식별자를 부여받은 디지털콘텐츠는 사용자가 원하는 콘텐츠를 정확하게 전달하기 위해서는 다양한 메타데이터 정보를 필요로 한다. 그러나 UCI에서 제공하는 식별 메타데이터만으로는 콘텐츠에 대한 다양한 정보를 표현하기에는 부족하며, 정보의 보다 정확한 표현과 효율적 검색 및 관리를 위해서는 UCI에서 제공하는 메타데이터와 함께 메타데이터 내에 표현된 개념과 그 의미 관계를 정형화하고 명시적인 방법으로 정의하는 온톨로지를 필요로 한다. 본 논문에서는 UCI 식별체계의 메타데이터간 개념관계를 온톨로지로 확장하고 도메인 온톨로지를 설계함으로써 구축된 UCI 메타데이터 정보를 효율적으로 이용하여 의미 기반의 검색과 관리를 가능하게 하였으며, 다양한 질의어를 통하여 메타데이터만을 이용하는 UCI식별체계에 비하여 효율적인 검색과 관리가 가능함을 보였다.

  • PDF

자율 학습에 의한 실질 형태소와 형식 형태소의 분리 (A Korean Language Stemmer based on Unsupervised Learning)

  • 조세형
    • 정보처리학회논문지B
    • /
    • 제8B권6호
    • /
    • pp.675-684
    • /
    • 2001
  • 본 논문은 태그가 없는 단순 말뭉치만을 가지고 자율학습을 이용하여 정보 검색을 위한 색인어의 추출 등에 이용될 수 있도록 한국어의 실질 형태소와 형식 형태소를 분리해내는 기법에 대하여 기술한다. 본 기법은 사전 등의 언어 관련 지식을 요구하지 않으며 오직 단순 말뭉치만을 필요로 한다. 또한 자율학습을 이용함으로써 사람의 간섭이 필요하지 않아 학습에 필요한 시간과 노력이 거의 들지 않는다. 본 방식은 잘 확립된 통계적 방법론을 이용하기 때문에 일반적인 휴리스틱과는 달리 이론적인 기반이 확고하여 확장 및 발전이 용이하다. 본 결과는 한국어에 우선 적용되었으나 한국어에 종속적인 방법이 아니어서 다른 교착어에도 쉽게 적용될 수 있을 것이다.

  • PDF

시간 관계성을 기반으로 한 비디오 데이터 모델의 설계 및 구현 (Design and Implementation of the Video Data Model Based on Temporal Relationship)

  • 최지희;용환승
    • 한국멀티미디어학회논문지
    • /
    • 제2권3호
    • /
    • pp.252-264
    • /
    • 1999
  • 비디오 데이터 자체가 시간적 구조와 공간적 구조로 이루어져 있기 때문에 비디오 데이터에 대한 내용 기반 검색은 두 관계를 중섬으로 이루어 질 수 있다. 본 논문에서는 비디오 데이터 구조가 시간의 흐름에 따라 논리적 계충 구조로 표현 가능하며, 각각의 계층은 각기 시간의 흐름에 따라 시간 관계성을 지닌다는 특성을 반영한 검색 기능을 설계하였다 그리고 비디오 데이터의 시간적 관계를 계승, 캡슐화, 함수 중복 등의 객체 지향 특성을 이용하여 객체 관계 DBMS로 구현하였다 기존의 제한적인 시간 함수가 아닌 본 논문에서 제시한 다양한 비디오 데이터의 시간 관계성에 따른 좀 더 확장되고 다양한 시간 함수를 제공함으로 써, 사용하기 편리한 인터페이스와, 여러 가지 시간 질의어를 제공한다.

  • PDF