• 제목/요약/키워드: 사전검색

검색결과 530건 처리시간 0.025초

BTI 사전 색인을 이용한 유사단어 검색 (A method for similar-word retrival based on BTI dictionary indexing mechanism)

  • 정연수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.291-296
    • /
    • 1994
  • 유사단어의 추정에 있어서 사전 검색에 드는 비용, 즉 사전탐색 횟수는 효율성의 문제와 직결된다. 본 논문에서는 BTI 사전 색인을 이용하여 한 글자의 변형요소가 있는 유사단어들을 효율적으로 거색하는 방법을 제안한다. BTI 방식은 정방향, 역방향 표제어를 모두 저장하는 방법이다. BTI 방식으로 사전 표제어를 색인하여 표제어에 대한 사전 탐색 도중에 사전에 존재하는 prefix와 postifix를 모두 검색할 수 있다. 이러한 정보를 이용하면 유사 단어에 대한 정확한 변형 위치를 결정할 수 있다. BTI 사전 색인은 사전 표제어에 대한 정보없이 유사단어를 추정한 후에 사전 검색을 통하여 확인하는 방법보다 사전 검색에 드는 비용이 적다. 추가적으로 유사단어 후보들에 대한 우선 순위를 정하기 위하여 corpus에서 추출한 각 표제어의 발견 빈도를 이용하였다.

  • PDF

남북한 언어 비교 사전 검색 시스템의 설계 및 구현 (Design and Implementation of South-North Korean Dictionary Retrieval System)

  • 김금영;조시성;안동언;정성종;두길수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(3)
    • /
    • pp.91-94
    • /
    • 2002
  • 본 논문은 세종계획의 일환으로 개발되었던 '남북한 언어 비교 사전 검색 시스템'을 개선한 것이다. '남북한 비교 사전 검색 프로그램'은 남북한의 언어 격차를 해소하고자 일반인에게 남북한의 언어정보를 검색할 수 있도록 개발된 시스템이다. 본 논문은 또한 일반인들이 남북한이 이질성을 가진 단어에 관심을 가지고 있는 점에 착안하여 이질성을 가진 단어를 검색할 수 있도록 별도로 '남북한 이질화된 언어 검색 시스템'을 개발하였다. '남북한 언어 비교 사전 검색 시스템'은 Microsoft Visual C++로 개발되었으며 Database는 Microsoft Access를 사용하였다.

  • PDF

XML 기반 웹 사전 프레임워크 (The XML-based Web Dictionary Framework)

  • 유응구;구자룡;김고운;이금석;김병구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1025-1028
    • /
    • 2002
  • 인터넷이 널리 사용되면서 인터넷 사용자들의 웹 사전 사용 빈도가 크게 증가하였다. 현재 다양한 형태의 웹 사전들이 다양한 서비스를 제공하고 있지만, 대부분의 웹 사전들은 검색엔진 형태의 단순질의 검색과 인덱스를 이용한 검색 기능을 제공하고, 고정된 표현 형식만을 제공한다. 또한 사전내용, 인덱스, 참조 및 관련 사이트 정보를 관리하기 위한 도구의 부재로 관리가 어렵고, 저장형식으로 HTML 을 사용하기 때문에 사전 데이터의 재사용에 문제가 있다. 따라서 본 논문에서는 기존의 웹 사전들을 사용자-관리자 측면에서 분석하여 문제점을 제시하고, 이를 해결할 수 있도록 카테고리 검색 및 히스토리 검색 서비스를 지원하고, 데이터를 XML 문서로 저장하며, 전용의 사전 관리 도구를 제공하는 XML 기반 웹 사전 프레임워크를 제안하고 구현하였다.

  • PDF

사용자 입력오류를 고려한 사전 검색 방법 (A Method of Dictionary Search for Typographical Error)

  • 정형일;선충녕;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.183-185
    • /
    • 2010
  • 디지털 기기들의 발전은 사전 검색 수요의 증가와 함께 강건한 검색 기법의 필요성도 증가시키고 있다. 기존의 사전 검색 기법들은 사용자의 입력 오류를 고려하지 않고, 검색 최적화만을 위해 설계되었다. 본 논문에서는 언어 모델 키워드와 자소 범주 키워드를 이용하여 오타에 강건한 사전 검색 방법을 제안한다. 제안된 방법은 오류가 포함된 사용자의 입력 단어에 대하여 활용 가능한 수준의 높은 성능과 검색 속도를 보여주었다.

  • PDF

코퍼스를 이용한 정보검색용 전자사전구축에 관한 연구

  • 남영준
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.430-440
    • /
    • 1996
  • 지능형 정보검색시스템이 효율적으로 운용되기 위해서는 여러개의 서브시스템이 필요하다. 특히, 시소러스와 색인 및 검색시스템용 전자사전은 중요한 지식베이스이다. 본 연구에서는 한글전자사전의 개발에 필요한 이론과 구축기술에 대해 조사하였다. 그 내용은 1)전자사전의 의미, 2)전자사전의 형태, 3) 전자사전개발을 위한 코퍼스 구축기술 및 방법이라는 이론적인 부분과 실제 과기원코퍼스2를 이용한 균형코퍼스를 설계하였다. 한편, 균형코퍼스를 이용한 기본적인 명사사전과 공기사전, 전문용어사전구축방법도 제시하였다.

  • PDF

포털 사이트의 학술정보 검색 개선 방안 연구 - 사전 서비스와의 연계를 중심으로 - (Study on Improvement of Research Information Search in Portal Site)

  • 양창진
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2010년도 제17회 학술대회 논문집
    • /
    • pp.33-40
    • /
    • 2010
  • 인터넷 포털 사이트는 단순한 검색엔진을 넘어 네티즌들이 항해하는 사이버스페이스 그 자체를 의미할 정도로 영역과 개념이 확대되었다. 일반인들뿐만 아니라 전문 연구자도 필요로 하는 학술정보를 포털 사이트에서 서비스하기 때문에 포털 사이트를 많이 이용한다. 그 동안 포털의 검색은 얼마나 많은 정보를 검색 결과로 제시해 줄 것인가 하는 양적인 면에 관심을 두었다. 그러나 최근에는 검색의 질적인 측면에 보다 많은 관심이 주어지고 있다. 이 논문은 포털에서 제공하는 전문 학술정보 검색의 문제점을 제시하고, 주제어 사전 서비스와 연계하여 보다 신뢰성 높은 학술정보를 검색할 수 있게 하기 위한 시범적인 시도이다. 즉, 검증되고 압축적으로 정리된 사전의 표제어와, 해당 표제어를 키워드로 하는 권위있는 연구 성과를 같이 연계시킴으로써, 사전을 검색할 때 연구 성과까지 검색할 수 있게 하여, 검색의 효율성과 정보의 신뢰성을 높일 수 있는 방안을 제시하고자 하였다.

  • PDF

포털사이트의 사전과 학술정보 연계 검색 방안 연구 (A Study on Service Integration of Research Information and Dictionary in Portal Site)

  • 양창진
    • 정보관리학회지
    • /
    • 제28권1호
    • /
    • pp.7-22
    • /
    • 2011
  • 포털사이트는 검색엔진을 넘어 사이버스페이스 자체를 의미할 정도로 개념과 영역이 확대되었다. 일반인들뿐만 아니라, 필요로 하는 학술정보가 서비스되기 때문에 연구자도 포털사이트를 많이 이용한다. 그동안 포털의 검색은 얼마나 많은 정보를 검색하게 해 줄 것인가 하는 양적인 면에 관심을 두었다. 그러나 최근에는 검색의 질에 보다 관심이 많아지고 있다. 이 논문은 포털이 제공하는 학술정보검색의 문제점을 분석하고, 비교적 신뢰성을 인정받는 사전 서비스와 학술정보를 연계함으로써 학술정보검색의 질을 향상하기 위한 시범적인 시도이다. 즉, 검증되고 압축적으로 정리된 사전의 표제어와 해당 표제어를 키워드로 하는 권위 있는 연구 성과를 연계시킴으로써, 사전을 검색할 때 주제어 관련 연구 성과까지 검색할 수 있게 하는 방안을 제시하고자 한다.

양방향 검색을 지원하는 전자사전 구조의 설계 및 구현 (A Design and Implementation of Electronic Dictionary for support bidirectional searching)

  • 김철수;박인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.367-370
    • /
    • 2000
  • 본 논문에서는 빠른 검색 시간을 가지면서 단어의 역문자열도 검색할 수 있는 사전 구조를 설계하고 구현한다. 빠른 검색 시간을 지원하고, 역문자열 검색을 효율적으로 하기 위해 트라이 구조를 이용하였으며 트라이 성질 잘 표현하는 배열을 이용한 구현 방법을 사용하였다. 이 사전 구조는 형태소분석, 정보검색, 음성인식 및 문자 인식 과정 등 다양한 분야에서 유용하게 이용할 수 있다.

  • PDF

관광 정보 검색을 위한 자연언어 질의 해석 시스템 구현 (A design and implementation of query processor for travel information retrieval system)

  • 김명철;서광준;전경헌;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.449-458
    • /
    • 1992
  • 본 논문은 관광정보검색용 한국어 자연언어 질의 해석 시스템의 모델 정립 및 구현에 대한 것이다. 본 자연언어 질의 해석 시스템은 질의로 부터 정보 검색 시스템의 검색어들을 추출한다. 이를 위하여 1만 단어 수준의 중형사전을 구축하였으며, 불용어 사전, 전거어 사전, 유사어 사전, 복합명사 사전을 구축하였다. 사전의 어휘를 추출하기 위해서 한국어 대화체 문장에 대한 자료수집과 분석을 하였으며, 관광 정보 검색 시스템의 텍스트를 분석하였다. 200여 자연언어 질의 문장으로 실험한 결과는 비교적 좋았다.

  • PDF

KT114 상호/업종 검색 시스템에서의 사전 기반 통상명 검색 모듈의 설계 및 구현 (Design and Implementation of Dictionary Based Alias Search Modules on KT114 Business Search System)

  • 신봉근;정희정;김종수;김명호;유병규;유광일;홍희경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.327-329
    • /
    • 1998
  • KT114 상호/업종 검색 서비스에서는 데이터베이스 내의 동일한 개체에 대하여, 사용자가 입력한 상호명과 실제 데이터베이스에 저장된 상호명이 서로 다른 '통상명 검색 문자'가 존재한다. 이는 사용자가 인지하고 있는 상호명이 실제 상호명이 아니라 해당 상호의 대표적인 상표 혹은 상품명 등인 경우 발생한다. 본 논문에서는 이러한 '통상명 검색 문제'의 해결을 위하여 실제 상호와 사용자 인지 상호 간의 관계를 정의한 사전에 기반을 둔 해결 방안을 제안한다. 대용량의 자료에 대한 빠른 검색을 요구하는 시스템 특성상 사전의 구축 방식은 매우 중요한 문제이다. 본 논문에서는 사전을 구축하는 두 가지 서로 다른 접근 방법으로, 'DBMS 내부 구축 방식'과 '외부 사전 구축 방식'에 대하여 설명하고, 시스템 환경을 고려하여 두 접근 방법을 비교 및 분석한다.