• Title/Summary/Keyword: 검색 형태 분석

Search Result 532, Processing Time 0.027 seconds

Implementation of an Address Correction System for Standard Address (표준 주소 검색을 위한 주소 보정 시스템 구현)

  • 이상윤;박병준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10c
    • /
    • pp.715-717
    • /
    • 2003
  • 본 논문은 형태소 분석 기법과 전문가 시스템 제작 도구를 이용하여 표준 주소를 검색하기 위한 주소 보정 시스템의 구현에 대해 기술 한다. 즉, 주소가 가지는 특성을 고려하여 표준 주소에 대한 다양한 형태의 주소들을 각각 지역 단위의 의미를 가지는 형태소로 분리하고 전문가 시스템에서 정의된 규칙에 의해 주소 요소의 원형으로 변환하게 한다. 따라서, 각각 주소 요소의 원형으로 이루어진 보정된 주소는 데이터 베이스 상에 존재하는 표준 주소가 될 것이고 정확한 검색이 이루어진다. 이는 데이터 베이스에 축적된 해당 주소에 대한 새로운 정보를 참조하는데 활용될 수 있다.

  • PDF

The Efficient Schema Conversion to map the XML Document into the RDB (XML의 RDB로의 맵핑을 위한 효율적인 스키마 변환)

  • 김태희;김선경
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2003.11a
    • /
    • pp.429-433
    • /
    • 2003
  • 웹상의 문서는 데이터 중심의 표준 언어인 XML 문서로 표현된다. XML 데이터를 범용적이고 우수한 성능의 관계형 데이터베이스와 연동하여 이용하기 위해서는 두 구조 사이의 맵핑 과정이 필요하다. 계층적 구조의 XML 문서와 데이터베이스의 평면적인 구조의 차이를 고려한 구조 맵핑을 위해서 검색 시스템에 적합한 가상분할 방식으로 엘리먼트를 분석하여 관계 스키마를 정의한 후 XML 문서를 저장한다. 이를 위해 스키마는 DTD 에 독립적인 형태로 변환하고, 엘리먼트의 추가와 삭제, 검색의 효율성을 위해 노드간의 위치 정보와 함께 독립적인 ID를 부여하여 구조적 검색을 수행할 수 있게 하였다.

  • PDF

A Study for Weight Assignments of Keyfacts (키팩트의 가중치 부여에 관한 연구)

  • 김수희;남효돈;정경택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.192-194
    • /
    • 1999
  • 정보검색에서 궁극적으로 지향하는 바는 질의에 대한 정확률과 재현률을 동시에 높이는 것이다. 본 논문에서는 [중심어, 종속어]로 이루어지는 키팩트를 그 유형에 따라 9가지 형태로 분류하였으며, 이 유형들의 주요도를 반영하여 키팩트의 가중치를 계산하는 방법을 개발하였다. 키팩트 유형들에 주요도 값들을 할당한 방법을 검정하기 위한 실험은 질의문들을 이용하여 평균 정확률와 평균 재현률을 계산함으로써 수행되었다. 9개의 키팩트 타입에 6가지의 주요도 값을 할당하는 방법을 실험하였고 그 결과를 분석하였다. 본 논문의 결과는 기존의 키워드 기반 정보검색에서 문제시되고 있는 정확률을 키팩트 기반 정보 검색에서 향상할 수 있는 가능성을 시사하고 있다.

  • PDF

Improving the Performance of Web Search using Query Types (질의유형에 기반한 웹 검색의 성능 향상)

  • Kang, In-Ho;An, Dong-Un
    • The KIPS Transactions:PartB
    • /
    • v.11B no.5
    • /
    • pp.537-544
    • /
    • 2004
  • The Web is rich with various sources of information. Due to the massive and heterogeneous web document collections, users want to find various types of target pages. Each type of information for Web search has designated queries. If a user query is not a designated query, then we cannot have good result documents. Different strategies are needed to utilize the goodness of each type of information for a search engine. If we know the property of information, then we can refine candidate pages and rank them delicately. Various experiments are conducted to show the properties of each type of information. Therefore, we show an appropriate combining formula to utilize the properties of each type of information. In addition, for a service finding task, we propose Service Link Information that utilizes the existence of mechanisms for a user interaction.

Query Analysis of Color-Term for Image Retrieval (이미지검색을 위한 색상어 질의 분석)

  • Hur, Jeong;Kim, Hyun-Jin;Park, Sung-Hee;Choi, Jae-Hun;Jang, Myung-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.48-53
    • /
    • 2001
  • 인터넷 환경의 급속한 성장과 더불어 기존의 텍스트 정보들이 다양한 형태의 멀티미디어 정보(소리, 이미지, 동영상 등)로 대체되었다. 이로 인해 멀티미디어 정보검색의 필요성이 대두되기 시작했다. 멀티미디어 정보검색 중 이미지검색은 크게 주석기반과 특징기반 (color, shape, texture 등) 검색으로 나눌 수 있다. 본 고는 이미지 검색 중 전처리에 해당하는 색상어 질의처리의 한 방법을 제안한다. 즉, 사용자에게 익숙한 자연어 질의로부터 이미지의 특징에 해당하는 색상 정보와 주석에 해당하는 키워드 정보를 중심어 후위원칙기반으로 파싱트리를 구성한 후, 후위순회방식에 의해 불리언 검색을 수행하는 방법을 제안한다.

  • PDF

A Question Answering System Using the Information of the Category Information of Thesaurus (시소러스범주정보를 이용한 질의응답시스템)

  • Kim, Su-Min;Baek, Dae-Ho;Kim, Sang-Beom;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.179-183
    • /
    • 2000
  • 정보검색시스템은 사용자의 질의를 입력받아 사용자가 원하는 정보를 검색해주는 시스템을 의미한다. 그러나, 대부분의 정보검색시스템은 단어와 연산자의 조합으로 이루어진 질의를 입력받아 문서를 검색해 주고, 사용자는 그 문서들 중에서 원하는 정보를 다시 찾아내야 한다. 본 논문에서는 영어 자연어질의를 입력받아 사용자가 원하는 정보에 좀 더 근접한 형태의 답으로서 제한된 길이의 짧은 답을 제시하는 시스템을 구현한다. 시스템은 크게 질의분석단계, 문서검색 및 분석단계, 정보추출단계의 세 단계로 나눌 수 있다. 사용자 질의분석단계에서는 의문사 정보와 오토마타, 시소러스 범주정보를 이용하여 질의에 대한 정답이 될 수 있는 단어의 속성을 예측하였다. 문서분석단계에서는 정답이 될 수 있는 단어의 후보를 선정하기 위해서 시소러스의 범주정보를 사용하였고, 선정된 정답후보 중에서 정답을 추출하기 위해 각 후보단어의 질의어단어와의 평균거리가중치, 범주간유사도, 공기질의어비율을 사용하였다. 실험을 통해 평균거리가중치만을 이용하는 것 보다 범주간유사도와 공기질의어비율을 함께 이용한 것이 성능의 향상을 보였다.

  • PDF

A Study on the Search Functions of Internet Patent Information Databases (인터넷 특허정보 데이터베이스의 탐색기능에 관한 연구)

  • 최경화;이란주
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1998.08a
    • /
    • pp.15-18
    • /
    • 1998
  • 본 연구의 목적은 4개의 인터넷 특허정보 데이터베이스의 탐색기능을 비교분석 함으로서 각 데이터베이스의 활용도를 제시하고 더 나아가 인터넷 상의 특허정보 데이터베이스의 이용자 우호적인 인터페이스 설계를 위한 기초 자료로 사용하려고 한다. 연구방법으로는 비교적 인지도가 높은 국내의 Patrom과 국외의 USPTO, QPAT-US, IBM을 선택하여 데이터베이스의 수록항목, 주요항목, 검색방법, 멀티미디어 검색기능, 웹으로 지원 가능한 정보자원의 형태를 중심으로 비교 분석한다.

  • PDF

Middleware System Architecture for Bio-data Integration (바이오데이타통합 미들웨어시스템 구조)

  • 나도균;이필현;이서우;이도헌;이광형;배명남
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.745-747
    • /
    • 2003
  • 다양한 바이오 정보 데이터베이스와 분석 도구들을 효율적으로 검색하고, 개별 데이터베이스에서는 얻을 수 없는 새로운 지식을 생성하기 위해서는 통합된 형태의 정보 검색 시스템이 필수적으로 요청된다. 여기서 우리는 바이오 정보 시스템 통합을 어렵게 하는 요소들을 살펴보고, 다중 질의 수행과 확장성 등을 기준으로, 현재 서비스되고 있는 바이오 정보 통합 시스템들의 특성을 분석 비교하였다. 또한 이를 기반으로 바이오 정보 통합 시스템의 구조를 제시하였다.

  • PDF

WSBAT: Web Services based Biodata Analysis Tool (웹 서비스 기반 바이오 정보 통합 분석 도구)

  • 최요한;유성준;김민경;박현석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.289-291
    • /
    • 2004
  • 최근 웹 서비스 기술을 이용하여 바이오 데이터 및 데이터 메소드를 제공하는 것과 관련된 연구들이 진행되고 있다. 웹 서비스 기반 바이오 데이터 서비스에 대한 연구 자료는 시스템 구조 및 API 등을 중심으로 보고되고 있으나 이를 기반으로 한 통합 응용 도구 개발 관련 연구는 미미한 실정이다. 이에 따라 이 논문에서는 웹 서비스 API 등을 이용하여 바이오인포매틱스 연구자들이 이용할 수 있는 데이터 통합, 검색, 브라우징 기능을 제공하는 분석 도구를 개발하였다 사용자는 이 도구를 이용하여 바이오 데이터 간의 상호연관성을 보다 쉽게 발견할 수 있으며 보다 다양한 검색 결과를 여러 가지 형태로 볼 수 있게 될 것이다.

  • PDF

Korean Morphology Analysis Implementation for Information Retrieval (정보검색용 한국어 형태소분석기 구현)

  • Son, So-Hyun;Yu, Byung-Sun;Lee, Tak-Hyun;Moon, Byung-Ju;Hong, Gi-Che;Jung, Hyun-Su
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.379-382
    • /
    • 2000
  • 본 논문은 정보검색을 위한 형태소분석기를 소개한다. 검색엔진의 속도향상을 지향한다면 형태소분석 알고리즘과 참조하는 사전의 구조를 어떻게 구성하는가에 따라 처리속도에 상당한 변화를 기대할 수 있으며, 본 논문에서는 알고리즘으로 최장일치법을 이용하고, 사전내부구조로 AVL+Trie 구조를 이용하여 사전참조의 속도향상을 기대하였다.

  • PDF