• 제목/요약/키워드: 구조적 질의어

검색결과 120건 처리시간 0.031초

시소러스를 이용한 XML 태그 검색 시스템 (An XML Tag Search System By Using Thesaurus)

  • 양승원;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.145-147
    • /
    • 2000
  • 현재 웹 기술은 HTML에서 정보를 표현하는 외형과 내용을 분리하여 정보를 구조화할 수 있는 XML을 사용하고 있다. 구조적으로 구성된 XML은 새로운 정보 검색의 방법을 제시하였다. 즉, 태그를 이용한 정보검색으로 검색어에 의미를 부여함으로써 정보 검색자에게 좀더 효율적인 검색을 가능하게 하였다. 그러나 이러한 구조화 문서 검색 기법은 정확한 태그를 입력하였을 경우에만 결과를 얻을수 있는 단점을 지니고 있다. 따라서 본 논문에서는 XML문서의 태그 검색에 있어 정확한 태그 검색을 확장한 유사 태그 검색기법을 설계하고 구현하였다. 유사한 태그를 검색하기 위하여 시소러스를 구성하였으며, 작성된 시소러스를 이용하여 유사한 태그에 대한 검색을 수행하였다. 기존의 XML문서 검색 시스템은 정한 태그에 대한 검색만을 수행할 수 있는 반면, 본 시스템은 태그검색에 있어 시소러스를 활용함으로써 질의에 입력되어진 태그와 유사한 태그에 대한 검색 결과를 보여줌으로써 사용자에게 질의어 선정의 불편함을 감소시켰다.

  • PDF

지식 생산 방식에 따른 집단지성 구조 분석 -네이버 지식IN과 위키피디아를 중심으로- ('Collective intelligence Structure' Analysis)

  • 한창진
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.1363-1373
    • /
    • 2009
  • 본 연구는 두 집단지성의 가장 대표적인 서비스인 네이버 지식iN과 위키피디아의 구조적, 경험적 차이를 바탕으로 생산의 차원에서 생산 주기, 생산 참여자, 생산물의 모델을 설정하고, 새롭게 탄생하는 지식을 중심으로 검증함으로써 최종 지식 소비 행위를 반영한 각각의 종합모델을 도출하였다. 우리는 웹에서 집단지성의 일상화를 확인할 수 있다. 지식 획득 매체가 매스미디어에서 인터넷으로 변화하는 과정에서 등장한 포털 및 검색사이트는 지식의 생산이 전문가패러다임에서 소비자 중심으로 재편될 수 있는 가능성을 열어주었다. 그리고 이러한 생산 방식의 변화는 '지식'의 개념 역시 변화시키고 있다. 즉, 집단지성이라는 새로운 웹2.0의 현상이 지식생산방식을 변화시키고 변화된 지식생산방식은 '지식'자체를 변화시킨다는 이론적 가설을 도출할 수 있는 것이다. 본 연구는 이러한 새로운 현상들을 분석하기 위해서는 먼저 보다 엄밀하게 집단지성의 개념을 규정할 필요성에 출발하였다. 현재 집단지성이라는 이름으로 불리면서 급격히 성장하고 있는 위키 방식의 인터넷 서비스와 지식검색 방식의 인터넷 서비스를 비교함으로써 보다 정교한 집단지성의 모델을 구축하고자 하였다. 위키형 집단지성과 지식검색형 집단지성의 차이점은 경험적으로도 뚜렷하게 확인할 수 있다. 본 연구는 이러한 경험적 차이와 기존의 문헌에서 밝혀진 사실들을 바탕으로 두 서비스의 지식생산 방식을 생산플로우, 생산참여자 성향, 생산물(지식)의 성향과 같이 세 영역으로 나누어 각각의 가설 모델을 설정하고 이 모델을 선정된 질의어를 바탕으로 검증한 뒤에 최종적인 모델을 도출하는 방식으로 진행되었다. 지식검색형 집단지성은 '질문-답변-채택'의 구조이고, 그 구조 속에서 '질문기-답변기-순서화기'를 거쳐 하나의 지식 덩어리인 'K-let'을 생산한다. 생산된 'K-let'들은 지식검색서비스의 데이터베이스에 축적되고, 이는 공통된 질의어를 기준으로 소비자들에 의해서 검색되어 소비된다. 하나의 질문에 대해 여러 개의 답변들이 존재하고, 답변자의 성향은 크게 전문성과 체계성을 바탕으로 한 전문가형 답변자와 경험적이고 의견지향적인 대화형 답변자로 나눠진다. 다수의 네티즌들의 참여에 의해서 지식의 생산이 진행되므로 질문의 성향 역시 사실, 의견, 경험 등 다양한 스펙트럼을 가지는 모델로 설정하였다. 반면에 위키형 집단지성은 개방형 플랫폼을 바탕으로 한 백과사전의 형식이며, 이러한 형식 속에서 최초의 개념어 등록과 다수의 편집활동을 거치면서 완성되지 않는 하나의 아티클인 'W-let'을 생산한다. 이러한 'W-let'은 생성 초기에 소수에 의한 활발한 내용 입력 활동으로 어느 정도의 안정화를 거친 후에는 꾸준한 다수의 수정활동을 통해서 'W-let'의 생명력을 유지함으로써 지식의 실제적인 변화를 반영한다. 생산된 'W-let'들은 위키형 집단지성 서비스의 데이터베이스에 축적되고, 이것들은 내부링크를 통해서 모두 연결되어 있다. 백과사전 형식으로 하나의 개념어를 설명하는 하나의 아티클은 오로지 사실적인 지식들로만 구성되나 내부링크와 외부링크를 통해서 다양한 스펙트럼을 가지는 모델로 설정하였다. 위와 같이 설정된 모델을 바탕으로 공통된 질의어 및 개념어를 선정하여 각각의 서비스에 노출시켰다. 이를 통해서 얻어진 각 서비스의 데이터베이스에 축적된 모든 데이터들 중에서 일정한 기간을 기준으로 각각의 모델 검증에 필요한 데이터를 추출하여 분석하는 방식으로 진행되었다. 그 결과 지식검색형 집단지성에서는 '질문-답변-채택'의 생산 구조 속에 다수가 참여하여 질문-채택답변-기타답변으로 배열되어 있는 완성된 형태의 K-let들을 지속적으로 생산하며 비슷한 성향을 가진 K-let들이 반복적으로 생산되어 지식검색 데이터베이스에 누적된다. 지식 소비자들은 질의어 검색을 통해서 다양한 K-let들을 선택하여 비교, 검토한 후에 선택된 K-let들의 배열은 해체되어 소비자들에 의해서 재배열됨을 발견할 수 있었다. 이에 지식검색형 집단지성이란 다수의 의해서 생산되고 누적된 지식들이 소비자의 검색과 선택에 의해 해체되어 재배열되는 지식의 맞춤화 과정이라고 정의내릴 수 있었다. 반면에 위키형 집단지성에서는 '내용입력-미세수정' 구조 속에서 생명력 있는 W-let을 생성한다. W-let은 백과사전처럼 정리되어 내부링크를 통해서 서로 연결되고, 외부링크를 통해 확장되고, 지식소비자들은 검색을 통해 최초의 W-let에 도달한 후에 링크를 선택함으로써 지식을 확장시킴을 검증할 수 있었다. 따라서 위키형 집단지성이란 다수의 의해서 생산되고 정리된 지식들이 소비자의 검색과 링크에 의해 무한히 확장되는 지식의 확대 재생산되는 과정이라고 정의 내릴 수 있다. 결국, 현재의 집단지성이란 지식이 다수의 참여로 생산됨으로써 개인에게 맞춤화되고, 끊임없이 확대 재생산되는 과정을 의미한다. 그리고 이러한 집단지성의 방식은 지식이라는 현재의 차원을 넘어서 정치, 경제를 비롯한 사회의 전 영역으로 점차적으로 확대되어갈 것이다. 앞으로 연구들은 두 가지 모델이 혼재되어 있는 현재의 집단지성이 어떠한 새로운 모델을 만들면서 다른 영역으로 확장되어갈 것인지에 대해서 초점을 맞춰 나가야할 것이다.

  • PDF

웹 문서의 구조적 정보 활용 사례에 관한 고찰 (A Survey on Example using Structural Information of Web documents)

  • 김철수;김양범
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.1011-1014
    • /
    • 2003
  • 브라우저를 통해서 보는 웹 문서는 보이는 문서 내용 이외에 많은 풍부한 정보들을 원시 문서에 포함하고 있다. 웹 문서 색인 및 분류 과정에서 이런 관련 정보를 효율적으로 사용한다면 색인어에 가중치를 부여하거나 문헌 분류과정에서 밀접하게 관련된 문헌들끼리 분류가 가능하다. 잘 색인된 색이어 집합 및 잘 분류된 문헌 집합은 검색자의 질의어에 대한 검색 견과의 문헌집합들에 대한 문헌 순위화를 효율적으로 수행하여 사용자로 하여금 검색 시간을 줄여줄 수 있다. 본 논문에서는 웹 문서를 대상으로 한 검색 시스템에서 검색 효율을 향상시키기 위하여 웹 문서의 구조적인 정보들을 이용한 방법들에 대하여 고찰해 본다. 색인 과정, 문헌 분류과정 순위화 과정에서 활용한 방법들에 대하여 중점적으로 살펴본다.

  • PDF

정보에이전트를 위한 지식 기반(동물) 질의 처리 시스템 (A Knowledge-Based Query Processing System for an Information Agent)

  • 오정옥;변영태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.102-104
    • /
    • 1998
  • 본 시스템은 현재 연구 개발중인 정보에이전트 시스템의 일부로서 특정분야에 대한 사용자의 관심 주제에 관련된 정보와 함께 적절한 문서를 제공하는 지식 기반 시스템이다. 이러한 목적을 위해서 본 시스템의 지식베이스는 구조적인 방식으로 표현된 BKB(Biology Knowledge Base)와 DIC(DICtionary)로 구성된다. DIC는 특정분야에서 일반적으로 사람들이 사용하는 용어와 학명을 기준으로 하는 시스템에서 사용하는 용어와의 관계와 그러한 용어들간의 동의어 관계를 갖고 있다. 또한 BKB는 동물에 관련된 지식베이스로써 상위.하위 개념과 함께 사용자가 원하는 정보를 제공하기 위해 객체의 속성과 이에 관계된 값들을 포함한다. 본 시스템은 문서를 검색할 때 사용자 초기 질의를 상위.하위 개념 그리고 동의어로 확장할 뿐만 아니라 사용자 의도의 정확한 표현을 위해서 제공하는 다양한 질의 형식에 따른 질의 처리 결과로도 확장하므로 효과적인 문서 검색 결과를 보인다.

  • PDF

정보 검색 시스템의 성능 향상을 위한 구문 분석과 검색어 확장 (Syntactic Analysis and Keyword Expansion for Performance Enhancement of Information Retrieval System)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제5권4호
    • /
    • pp.303-308
    • /
    • 2004
  • 자연어 질의문장을 입력하는 방법은 정보 검색 시스템 사용자에게 가장 이상적인 인터페이스이다. 본 논문은 자연어 질의문장을 입력하는 검색 시스템을 위해 자연어 처리 기술에 기반 하여 사용자의 입력 질의 문장을 분석하고 검색어를 확장하는 다중검색 기법을 제안한다. 질의 문에 대한 형태소 분석 및 구문 분석을 수행하고, 구문 트리를 순회하여 구조적으로 연관된 복합명사를 조합하거나 분할하고, 이형표기 용어와 축약표기 용어들을 확장하여 다중 검색함으로써 재현율을 11.3%, 정확도를 4.7% 높였다.

  • PDF

분산 환경에서 통합 XQuery 질의 처리를 위한 조인과 통신비용에 대한 연구 (A Study of Join and Communication Cost for processing Integrated XQuery queries over Distributed Environment)

  • 최성일;박종현;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.59-63
    • /
    • 2007
  • XML은 웹 상에서 정보교환의 표준이며, 이종의 데이터를 보유하고 있는 지역 시스템들은 XML View를 이용하여 정보를 공개한다. 사용자는 XML을 위한 표준 질의어인 XQuery를 사용하여 분산된 XML View들을 대상으로 통합 XQuery질의를 생성할 수 있다. 이렇게 생성된 통합 XQuery질의는 자연스럽게 다른 지역시스템들 사이의 조인을 포함 할 수 있다. 조인은 비용이 많이 드는 연산자이므로 조인을 효율적으로 처리하는 것은 전체 질의의 성능에 큰 영향을 준다. 그러므로 조인을 효율적으로 처리하기 위한 비용을 결정하는 연구가 중요하다고 할 수 있다. SQL에서는 이와 같은 연구들이 많이 존재하며, 분산 환경에서의 조인을 효율적으로 처리하기 위해 크게 두 가지 비용을 고려한다. 그 중 하나는 지역시스템 내에서 조인을 처리하는 조인비용이며, 나머지 하나는 조인을 수행하기 위하여 다른 지역시스템으로 데이터를 전송하는 통신비용이다. 이 두 비용은 분산 조인을 처리하기 위한 중요한 요소이므로[6,7,8] 이를 측정하는 것은 통합 질의 처리를 위해서 필요한 연구라 할 수 있다. 그러나 테이블 구조의 데이터를 검색하기 위한 SQL 의 방법들을 구조적인 XML 데이터를 검색하기 위한 XQuery질의를 위해서 그대로 사용하는 것은 어려운 일이다. 본 논문에서는 분산 환경에서 통합 XQuery질의의 조인을 효율적으로 처리하기 위해 조인비용과 통신비용을 측정하는 방법을 제안한다. 본 논문의 기여는 앞서 기술한 문제점을 해결하여, XQuery 질의의 조인을 효율적으로 처리하기 위한 비용을 측정할 수 있도록 한다.

  • PDF

XML 문서의 검색을 위한 효율적인 색인 기법과 질의 언어(TQL)의 설계 (Efficient Indexing Technique for Retrieval of an XML Document and Design of Query Language (TQL))

  • 이계준;신동욱;권택근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.57-59
    • /
    • 1999
  • 현재 WWW(World Wide Web), 사무 자동화 시스템(Office Information System), 전자 도서관(Digital Library) 등의 빠른 발전으로 인하여 정보가 기하급수적으로 증가하였다. 이러한 방대한 양의 정보를 처리하기 위하여 많은 인터넷 기반의 문서 표준들이 출현하였고, 대표적으로 XML(eXtensible Markup Language)이 차세대 인터넷 전자 문서의 표준으로 많은 곳에 응용되고 있다. 이에 따라 XML 문서의 정보들을 효율적이고 정확하게 저장하고 이용, 검색 할 수 있는 기능을 요구되어졌다. 현재 대부분의 연구들은 XML 문서에 대한 구조적인 정보만을 저장하고 검색하는 기능만을 지원 할 뿐 검색된 결과에 대한 재사용이나 재구성에 대한 기능의 제공은 미흡한 실정이다. 본 논문에서는 현재 검색기들이 제공하는 XML 문서에 대한 구조적인 검색 기능을 확장하여 XML 문서를 보다 효율적으로 검색하기 위하여 새로운 색인 기법을 제안하고, 데이터베이스 내에 저장된 XML문서에 대해 구조적인 검색과 이것을 바탕으로 문서를 재구성하고 재사용하는 기능을 수행할 수 있도록 새로운 질의어(TQL)을 설계하였다.

  • PDF

질의 완화를 이용한 지능적인 질의 응답 시스템 (Intelligent Query Answering System using Query Relaxation)

  • 황혜정;김교정;윤용익;윤석환
    • 한국정보처리학회논문지
    • /
    • 제7권1호
    • /
    • pp.88-98
    • /
    • 2000
  • 협력적 질의 응답은 질의와 데이터에 관한 지식을 이용해서 초기의 질의에 적절한 인접한 정보나 연관된 정보를 제공한다. 본 논문에서는 제시된 질의에 대한 정확한 검색 결과를 보여주지 못하는 경우에 협력적 질의 응답을 지원하기 위하여 지능적인 질의 응답 시스템을 제안한다. 본 논문에서 제안한 지능적인 질의 응답 시스템은 하이브리드 지식베이스(Hybrid Knowledge Base)를 이용하여 질의 완화 과정을 수행한다. 질의 완화에 사용되는 하이브리드 지식베이스는 구조적인 접근을 위하여 시멘틱 리스트와 규칙 기반의 지식베이스로 구성된다. 또한, 본 논문은 하이브리드 지식베이스를 기반으로 초기의 질의어를 이용하여 질의 재형성을 하기 위하여 질의 완화 알고리즘을 제안한다.

  • PDF

시그니처를 이용한 XML 질의 최적화 (XML Query Optimization based on Signature)

  • 박상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권1호
    • /
    • pp.104-114
    • /
    • 2001
  • XML은 웹에서 데이터를 주고받는 표준으로 새로이 등장하고 있다. 이러한 데이터를 잘 처리하기 위하여 데이터베이스의 도움은 필연적이다. XML을 처리하는 데이터베이스에서 데이터는 트리 형태로 저장되며 질의어는 정규 경로식(regular path expression)의 특징을 가지고 있다. 이때 질의 처리는 트리의 각 노드 탐색을 통하여 수행된다. 본 논문에서는 시그니처를 이용한 저장 방법 및 질의 처리를 통하여 질의 수행 시 각 노드의 탐색 횟수를 줄여 질의 수행을 빠르게 할 수 있게 한다. 뿐만 아니라 반 구조적 데이터에 대한 인덱스도 데이터베이스 내에서 반구조적 데이터로 표현된다. 그러므로 본 논문에서 제안한 방법을 인덱스 노드에도 적용할 수 있다. 이와 같이 본 논문에서 제안한 방법은 데이터 객체와 인덱스 객체의 탐색을 줄임으로서 XML 질의를 빠르게 처리할 수 있게 한다.

  • PDF

관계형 데이타베이스에서 지식관리에 의한 질의 최적화 (Query Optimization with Knowledge Management in Relational Database)

  • 남인길;이두한
    • 한국정보처리학회논문지
    • /
    • 제2권5호
    • /
    • pp.634-644
    • /
    • 1995
  • 본 논문에서는 세 가지 종류의 지식을 적절하게 표현하여 데이타베이스 시스템에 저장하고 이를 사용하여 질의를 의미적으로 등가이며 보다 처리 효율이 뛰어난 질의로 변환하는 기법을 제시하였다. 또한 제안된 지식을 사용하여 필수적인 성분이나 연산이 부분적으로 생략된 단순화된 질의를 완전한 질의로 변환할 수 있는 기법을 제시하여 사용자로 하여금 보다 단순화된 질의를 사용할 수 있는 환경을 제공하였다. 단순화된 질의로부터 변환과 최적화를 위해 다루는 지식은 크게 세 가지로 대별되는데, 의미적 무결성 규정과 도메인 무결성 규정을 포함하는 의미적 지식과 관계형 데이타베이스 에서의 릴레이션간의 물리적 관계를 표현하는 구조적 지식 그리고 속성의 도메인 정보 를 유지하는 도메인 정의이다. 제안된 시스템에서는 이들 지식을 사용하여 질의어의 조건 절에 있는 불필요하거나 중복적인 제한연산(restrictions)이나 조인연산(join) 을 제거하거나 다른 효율적인 연산으로의 대체, 혹은 보다 나은 효율을 위해 부가적인 제한연산이나 조인연산을 추가하여 질의 최적화를 이루게 된다.

  • PDF