• 제목/요약/키워드: 다중어 질의어 처리

검색결과 15건 처리시간 0.034초

콘도르 정보 검색 시스템 (Information Retrieval System : Condor)

  • 박순철;안동언
    • 한국산업정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.31-37
    • /
    • 2003
  • 본 연구는 다중어 질의어를 제공하는 대용량 정보검색 시스템, 콘도르에 대한 고찰이다. 이 시스템은 전북대학교, (주)서치라인, 그리고 카네기멜론 대학교가 컨소시엄 형태로 개발하였다. 이 시스템의 질의처리는 확률 모델을 기반하고 있으며 최근 정보검색 시스템에서 제공하는 문서 클러스터링 기능을 제공하고 있다. 특히 시스템의 특징은 다중어 질의어를 처리하고 질의를 중심으로 온라인으로 문서를 클러스터링하고 요약하는 것이다. 본 시스템은 이미 국내의 3,000만개 웹페이지에 대한 테스트를 마쳤으며 그 안정성을 확보하고 있다.

  • PDF

다중 무선 방송채널에서의 상호관련 데이터들을 위한 효율적인 데이터할당 방법 (Efficient data allocation scheme for dependent items over multiple wireless broadcast channels)

  • 박성욱;정성원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.219-222
    • /
    • 2007
  • 무선방송환경은 모바일 클라이언트의 수에 상관없이 다수의 클라이언트에게 데이터를 보낼 수 있다는 특징으로 인하여 많은 관심을 받아왔다. 그러나 기존 대부분의 연구는 한 개의 독립적인 데이터를 최단시간에 획득하는 것을 목표로 하였고, 질의어와 같이 상호 관련된 여러 데이터를 동시에 획득해야 하는 경우에 대한 연구는 미비했다. 또한 그러한 논문들에서도 질의어 내의 데이터들이 다른 채널상의 동일시간에 나타나지 않도록 할당하는 문제에 대해서만 연구되어 왔고 각 데이터의 요청빈도에 따른 데이터의 접근확률은 반영되지 않았다. 우리는 본 논문에서 이러한 데이터들을 채널에 할당하는 문제뿐만 아니라 여러 질의어에 포함되어 상대적으로 요청빈도가 높은 데이터들을 한 방송 사이클 동안 다중 채널상에 여러 번 할당되게 하여 해당 질의어에 속한 데이터들을 모두 획득하는데 요구되는 평균응답시간을 줄이는 새로운 방법을 제안한다.

다중 문서에서 구조 정보를 이용한 XML 조인 질의 처리 (XML Join Query Processing using Structured Information from Multiple Documents)

  • 정성호;김병곤;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.100-102
    • /
    • 2002
  • XML 문서에 대한 다양한 질의를 위해서 W3C에서는 XQL, XML-QL, XML-GL, XQUERY와 같은 질의어를 제안하였다. 이들 질의어는 다양한 질의 유형의 분류와 표현은 가능하나, 조인 질의의 경우 단순 조인 질의만을 지원할 뿐, XML 문서의 구조나 텍스트 정보의 유사성을 이용한 보다 다양한 조인 질의에 대한 연구가 미비하였다. 본 논문에서는 다중 문서에 대한 조인 질의를 체계적이고 효과적으로 표현하기 위해, 문서에 대한 조인 질의를 여러 타입으로 분류하였다. 또한 효율적인 질의처리를 위하여 다양한 일반 조인 질의 및 정보검색 기능을 지원하는 유사성 조인 연산자(similarity join operator), 순수 구조 기반 조인을 지원하는 구조 조인 연산자(structured join operator)를 지원하도록 XML 질의어인 QUILT를 확장하였다. 특히, 구조 정보만을 이용한 질의시 구조의 깊이(depth)정보를 이용하여 사용자의 요구에 맞게 질의 검색 범위를 설정하고, XML 문서에 대한 질의 문을 좀더 간결하게 표현할 수 있도록 설계하였다.

  • PDF

웹 문서 검색을 위한 검색어 추출과 확장에 관한 연구 (A Study on Keyword Extraction and Expansion for Web Text Retrieval)

  • 윤성희
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권9호
    • /
    • pp.1111-1118
    • /
    • 2004
  • 웹 문서 검색 시스템 사용자에게 자연어 질의를 입력하는 방법은 가장 이상적인 인터페이스이다. 본 논문은 자연어 질의를 입력하는 웹 문서 검색 시스템을 위해 자연어 처리 기술에 기반하여 사용자의 입력 질의 문장을 구문 분석한 후 검색어를 추출하고 확장하는 다중검색 기법을 제안한다. 질의문에 대한 형태소 분석 및 구문 분석을 수행하고, 구문 트리를 순회하여 구조적으로 연관된 복합명사를 조합하거나 분할하며, 검색어가 되는 음역어와 축약어들을 확장하여 다중 검색함으로써 재현율과 정확도를 향상시킬수 있음을 보였다.

  • PDF

RFID 다중 태그 인식을 위한 STACK Bit-by-Bit 알고리즘 (A Stack Bit-by-Bit Algorithm for RFID Multi-Tag identification)

  • 이재구;유대석;최재원;최승식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.795-798
    • /
    • 2007
  • RFID 리더기가 영역내의 다수의 태그를 인식하기 위해선 충돌방지 알고리즘이 필수적으로 요구된다. 본 논문은 Auto ID Class 0에서 정의한 충돌방지 알고리즘인 Bit-by-Bit 이진트리 알고리즘(BBB)의 충돌 위치를 스택에 저장하고 이를 통해 다음 질의어를 결정함으로써 성능이 크게 개선된 Stack-bit-by-bit(SBBB) 알고리즘을 제안한다. 시뮬레이션을 통한 검증결과 질의-응답 횟수, 질의어의 크기, 응답어의 크기의 모든 면에서 성능이 개선된 것을 확인할 수 있었다.

시각 요소와 시각 변수를 통한 시각 객체 질의어(VOQL)의 개선 (Improving Visual Object Query language (VOQL) by Introducing Visual Elements and visual Variables)

  • 이석균
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1447-1457
    • /
    • 1999
  • 최근 제안된 시각 객체 질의어(VOQL)는 시각 질의어로 스키마 정보가 시각적으로 질의 표현에 포함되므로 복잡한 구조의 데이터에 대한 질의를 효과적으로 표현할 수 있는 객체 지향 데이터베이스 질의어이다. VOQL은 귀납적으로 정의된 시맨턱을 갖는 그래프 기반 언어로 다양한 텍스트 경로식들을 그래프로 간결하게 표현 할 뿐 아니라 복잡한 경로식의 시맨틱을 명확하게 전달한다. 그러나 기존의 VOQL은 모든 속성을 다중 값으로 가정하고 있고, 객체변수의 바인딩 개념을 시각화하고 있지 못하고 있다. 이로 인해 VOQL 질의문의 표현이 직관적이지 못할 뿐 아니라 이론적 확장이 쉽지 않다. 본 논문에서는 이러한 문제를 해결하도록 VOQL을 개선하고 한다. 단일 값과 다중 값을 갖는 속성의 결과를 각각 시각 요소와 서브 블랍을 통해 시각화하고, 시각변수를 도입하여 객체 변수의 바인딩을 명시화하여 질의문의 시맨틱을 직관적이고, 명확하게 하고 있다.

  • PDF

정보 검색 시스템의 성능 향상을 위한 구문 분석과 검색어 확장 (Syntactic Analysis and Keyword Expansion for Performance Enhancement of Information Retrieval System)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제5권4호
    • /
    • pp.303-308
    • /
    • 2004
  • 자연어 질의문장을 입력하는 방법은 정보 검색 시스템 사용자에게 가장 이상적인 인터페이스이다. 본 논문은 자연어 질의문장을 입력하는 검색 시스템을 위해 자연어 처리 기술에 기반 하여 사용자의 입력 질의 문장을 분석하고 검색어를 확장하는 다중검색 기법을 제안한다. 질의 문에 대한 형태소 분석 및 구문 분석을 수행하고, 구문 트리를 순회하여 구조적으로 연관된 복합명사를 조합하거나 분할하고, 이형표기 용어와 축약표기 용어들을 확장하여 다중 검색함으로써 재현율을 11.3%, 정확도를 4.7% 높였다.

  • PDF

시맨틱 웹 서비스 환경에서 시맨틱 질의 어댑터의 설계 및 구현 (Design and Implementation of the Semantic Query Adapter(SQA) in the Semantic Web Service Environment)

  • 조명현;손진현
    • 정보처리학회논문지B
    • /
    • 제12B권2호
    • /
    • pp.191-202
    • /
    • 2005
  • 시맨틱 웹 서비스는 최근에 많은 연구가 수행되고 있는 시맨틱 웹 기술을 기반으로 웹 서비스를 지원하는 웹 기술이다. 지금까지 시맨틱 웹 서비스와 관련된 연구는 시맨틱 웹 문서 저장 기법과 시맨틱 질의 처리를 위한 추론 엔진 개발 둥에 많이 집중되어 왔다. 그러나 근본적으로 시맨틱 웹 서비스 환경을 지원하기 위해서는 사용자 혹은 에이전트가 시맨틱 정보를 질의할 수 있는 효과적인 질의 인터페이스의 제공이 필수적이다. 이에 관하여, 본 논문에서는 복잡한 시맨틱 정보에 대해 일반 사용자의 높은 질의 투명성을 제공하기 위한 시맨틱 질의 어댑터(SQA)를 제안한다. 먼저 BAML-S Profile의 요소를 분석하여 그래픽 기반의 절차적 사용자 질의 인터페이스를 설계한다. 그리고 사용자 인터페이스로 입력된 질의는 시맨틱 질의어인 RDQL로 변환하도록 구현하였다. 이때 RDQL 술어의 결합(disjunctive) 질의 문제를 해결하기 위한 시맨틱 질의어 다중 생성 프로세서를 제시한다.

다중 개체 중심적 통합 방식의 버티컬 검색 - 학술 연구 정보 분석 서비스에의 적용 사례를 중심으로 - (Vertical Search Based on Multiple Entity-centric Unification)

  • 정한민;이미경;성원경;류범종
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.253-256
    • /
    • 2009
  • 본 논문은 기존의 단일 분야를 대상으로 서비스되고 있는 버티컬 검색의 한계를 지적하고 사용자의 검색 욕구를 보다 충실히 만족시키기 위해, 여러 분야 (개체 유형)들을 포함하는 실체 (개체)들이나 단일 분야 내의 실체들을 포함하는 질의어를 처리할 수 있는 다중 개체 중심적 통합 방식의 버티컬 검색을 제시한다. 이를 위해, 질의어를 분석하여 개체 유형 간 결합이 필요한 지를 판단한 후 동적으로 상황에 맞는 서비스 컴포넌트들을 결합하는 기술과 개체 유형 별 필드들을 구축하고 필드 별 검색을 수행하는 기술을 도입하였다. 버티컬 검색 서비스 분야로서 학술 연구 정보를 대상으로 하여 약 453,000 편의 해외 학술 저널 논문을 메타데이터 기반으로 등록하였으며, 개체 유형으로는 연구 주제와 연구자를 다루고 있다.

  • PDF

XML문서에서의 다중 스키마 추출에 관한 연구 (The Study on Multi-level Schema Extraction for XML documents)

  • 김성림;윤용익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.11-14
    • /
    • 2001
  • XML이 인터넷상에서 데이터를 표현하고 교환하는 새로운 표준으로 등장하고 있다. XML은 미리 정의된 스키마가 없고, 문서 자체에 데이터와 데이터 구조를 갖고 있기 때문에 기존의 관계형 데이터베이스나 객체 지향 데이터베이스에서 사용되는 SQL이나 OQL을 바로 적용하기가 어렵다. 따라서 이러한 XML에 대해 새로운 질의어와 질의 처리를 위한 스키마 추출에 대한 많은 연구가 이루어지고 있다. 본 논문에서는 XML 문서에 대한 스키마 추출 방법과 그래프 프로젝션을 통한 질의 처리 방법을 제안하였다. 여러 단계의 스키마 추출을 가능하게 함으로써 사용자의 질의에 대해 보다 효율적인 질의 결과를 제공해 줄 수 있다.

  • PDF