• Title/Summary/Keyword: 한글 검색

Search Result 504, Processing Time 0.033 seconds

Character Region Detection Using Hangul Character Structure and Class Feature in Natural Images (자연영상에서 한글 자소 구조 및 유형 특징을 이용한 문자 영역 검출)

  • Bak, Jong-Cheon;Gwon, Gyo-Hyeon;Jeon, Byeong-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2011.05a
    • /
    • pp.396-399
    • /
    • 2011
  • 모바일 기기의 보급이 확대됨으로서 모바일 기기에 내장된 카메라로 획득한 영상을 처리하는 다양한 종류의 응용프로그램이 개발되어 사용되고 있다. 대표적인 응용프로그램은 카메라로 찍은 영상의 사물 검색결과를 인터넷 검색엔진과 연계함으로서 키워드 입력 없이 검색할 수 있도록 하는 것이다. 본 연구는 그 중에서 한글 문자가 포함된 영상을 대상으로 영상검색 수행하는 연구로서 영상에서 한글 문자 영역을 검출하는 방법을 제안하였다. 한글 문자 구조 특징으로 한글 자소를 병합하여 후보 문자 영역을 추출하고 병합된 후보 문자 영역을 한글 6가지 문자 유형 특징을 기반으로 문자 영역을 여부를 판별함으로서 최종적인 문자 영역을 검출한다. 실험결과 문자영역 재현률이 향상됨을 알 수 있었다.

  • PDF

다차원 이진트리를 기반으로 하는 한글 전자사전의 성능 분석

  • 김희철;이창식
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.3 no.1
    • /
    • pp.165-174
    • /
    • 1998
  • 본 연구는 기존의 한글 전자사전의 단점들인 과다한 검색 횟수, 비효율적인 주 기억장치 사용, 이미 구축된 사전에 새로운 단어에 대한 추가·삭제의 난이성 등을 해결할 수 있는 다차원 이진트리 구조 기반의 한글 전자사전의 설계 및 구현을 그 내용으로 하고 있다. 본 논문에서 구현된 한글 전자사전의 검색시간 성능평가를 위해 입력 키워드의 종류에 따라 실험1, 실험2 의 두가지 성능평가를 수행하였다. 실험1에서는 구현된 사전의 단어를 입력 키워드로 사용하여 실험하였으며 그 결과로서 제안한 사전구조가 검색 속도 면에서 기존의 트라이 사전구조보다 약 1.5배의 성능향상을 부여주고 있음을 보았다. 실험 2는 다차원 이진트리 구조의 한글 전자사전이 트라이 구조의 한글 전자사전보다 약 2.3배의 성능향상을 이루고 있음을 보여주고 있다. 한편, 사전 구축시 필요한 주기억장치 용량에 대한 성능평가 결과는 트라이구조사전은 1.987Kbyte를 가지는 반면 제안한 다차원 이진트리 구조의 한글 전자사전은 1.136Kbyte를 가지므로 약 1.8배의 성능향상을 보여주고 있다.

다차원 이진트리 기반의 한글 전자사전 구축기법

  • 김희철;신정훈;이용두;김영순
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 1998.03a
    • /
    • pp.221-227
    • /
    • 1998
  • 본 연구에서는 지금까지 한글 전자사전이 가지고 있는 과다한 검색 횟수, 비효율적인 주기억 장치 사용, 이미 구축된 사전에 새로운 단어에 대한 추가·삭제의 어려움에 대한 단점들을 개선하기 위하여 다차원 이진트리 구조의 한글 전자사전을 구현한다. 본 논문에서 구현된 한글 전자사전의 검색시간 성능평가를 위해 입력 키워드의 종류에 따라 실험1, 실험2로 나누어 성능평가를 한 결과, 실험 1에서는 구현된 사전의 단어를 입력 키워드로 사용하여 실험한 결과 제안한 사전구조가 검색 속도면에서 기존의 트라이 사전구조 보다 약 1.5배 성능향상을 보여주고 있으며 실험 2 결과도 다차원 이진트리 구조의 한글 전자사전이 트라이 구조의 한글 전자사전보다 약 2.3배의 성능향상을 보여주고 있다. 한편 사전 구축 시 필요한 주 기억 장치 용량에 대한 성능평가 결과는 트라이구조사전은 1.987Kbyte를 가지는 반면 제안한 다차원 이진트리 구조의 한글 전자사전은 1.136Kbyte를 가지므로 1.8배의 성능 향상을 보여주고 있다.

Implementation of Very Large Hangul Text Retrieval Engine HMG (대용량 한글 텍스트 검색 엔진 HMG의 구현)

  • 박미란;나연묵
    • Journal of Korea Multimedia Society
    • /
    • v.1 no.2
    • /
    • pp.162-172
    • /
    • 1998
  • In this paper, we implement a gigabyte Hangul text retrieval engine HMG(Hangul MG) which is based on the English text retrieval engine MG(Managing Gigabytes) and the Hangul lexical analyzer HAM(Hangul Analysis Module). To support Hangul information, we use the KSC 5601 code in the database construction and query processing stages. The lexical analyzer, parser, and index construction module of the MG system are modified to support Hangul information. To show the usefulness of HMG system, we implemented a NOD(Novel On Demand) system supporting the retrieval of Hangul novels on the WWW. The proposed system HMG can be utilized in the construction of massive full-text information retrieval systems supporting Hangul.

  • PDF

Analyzing of Hangul Search Query Spelling Error Patterns and Developing Query Spelling Correction System Based on User Logs (한글 검색 질의어 오타 패턴 분석과 사용자 로그를 이용한 질의어 오타 교정 시스템 구축)

  • Jeon, Hee-Won;Huang, Daniel;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.15-21
    • /
    • 2010
  • 본 논문은 검색 서비스 기능 중에 빼놓을 수 없는 기능인 한글 검색 질의어(query) 교정 시스템을 '야후!'에서 구축하며 분석한 한글 오타 패턴 그리고 사용자 로그를 기반으로 설계한 질의어 교정 서비스에 대한 설명을 하고 있다. 이 교정 서비스는 현재 '야후! 코리아'에 적용되어 있으며, 한글을 고려한 키스트 로크를 기반으로 한 설계 방식 그리고 동적으로 에러모델을 구축하는 방법을 소개하고 있으며 또한 구축된 모델의 성능을 다른 검색 서비스와 비교한 결과를 소개한다.

  • PDF

A Study on a Multilingual name Retrieval (다중 언어 인명 검색에 관한 연구)

  • Cho, Young-Hwa;Song, Jae-Yong;Ryu, Keun-Ho
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.9
    • /
    • pp.2271-2280
    • /
    • 1998
  • In this paper, we propose a method to retneve english written korcan names efficientl, and design a multilingual name retrieval system, It is very difficult to retrieve english-written korean names in typical IR sytems. For example, "홍길동" is written in english as vanous forms such like "Hong, gildong", "Gildong Hong", "Hong kil dong", "Hong kil dong" and so on, We not only propose a rule-based querv expansion method to retrieve english-written korean names efficiently but also design a multiligual name retneval system which is consisted of query classifier, exception handler, query expander, query executor, exception list and rulebase, Finally we will try to show that english-written korean names could be efficiently retrieved with rule based name generator.

  • PDF

Keyword Spotting on Hangul Document Images Using Image-to-Image Matching (영상 대 영상 매칭을 이용한 한글 문서 영상에서의 단어 검색)

  • Park Sang Cheol;Son Hwa Jeong;Kim Soo Hyung
    • The KIPS Transactions:PartB
    • /
    • v.12B no.3 s.99
    • /
    • pp.357-364
    • /
    • 2005
  • In this paper, we propose an accurate and fast keyword spotting system for searching user-specified keyword in Hangul document images by using two-level image-to-image matching. The system is composed of character segmentation, creating a query image, feature extraction, and matching procedure. Two different feature vectors are used in the matching procedure. An experiment using 1600 Hangul word images from 8 document images, downloaded from the website of Korea Information Science Society, demonstrates that the proposed system is superior to conventional image-based document retrieval systems.

Design of Hangul Document Retrieval System Using Signature File Methods (요약화일 기법을 이용한 한글 문서 검색 시스템의 설계)

  • Lee, Jeong-Ki;Kim, Chul-Wan;Chang, Jae-Woo
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.47-57
    • /
    • 1993
  • 현재 국내에서 한국형 정보 검색 시스템의 중요성을 인식하고, 이를 국내 기술로 구축하려는 여러 시도들이 진행중에 있다. 이 가운데 정보 검색 시스템 구축에 기반이 되는 정보 저장 하부 구조로서, 한글 문서를 위한 효율적인 문서 검색 기법에 대한 연구는 필수적이다. 본 논문에서는 이를 위해 파일 기법을 이용한 한글 문서 검색 기법을 설계한다. 아울러, 제안된 기법을 토대로 실제 시스템을 구현하여 성능을 분석하였다.

  • PDF

A Study of Personalized Retrieval System Evaluation (개인화 검색시스템 평가에 관한 연구)

  • Kim, Kwang-Young;Choe, Ho-Seop;Jin, Du-Suk;Kim, Jin-Suk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06b
    • /
    • pp.39-42
    • /
    • 2010
  • 본 논문에서는 주제별 분류기반의 개인화 검색시스템의 평가를 위해서 기존의 한글 정보 검색시스템 평가를 위해서 사용하는 한글 테스트 컬렉션(HANTEC v2.0)을 사용하였다. 주제별 분류기반의 개인화 검색 시스템의 평가를 위해서 첫째, 한글 테스트 컬렉션을 한국일보-40075 문서분류 테스트 컬렉션을 이용하여 주제별 분류를 수행 하였다. 둘째, 한국일보-40075 문서분류 테스트 컬렉션의 분류 체계에 다라 한글 테스트 컬렉션의 문서들을 kNN 분류기를 이용하여 분류를 수행하였다. 마지막으로 구축된 컬렉션을 이용하여 주제별 분류기반의 개인화 검색시스템의 성능 평가를 수행하였다.

  • PDF

An Empirical Study of Base Pivot Choosing Method for Approximate Word Searching (근사 단어 검색 효율성 개선을 위한 기준 Pivot 선택방법 실험적 연구)

  • Yoon, Tai-Jin;Chung, Woo-Keun;Cho, Hwan-Gue
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.271-274
    • /
    • 2010
  • 한글 근사 단어 검색 시스템은 사용자의 오류를 포함한 검색 질의에 효과적으로 대응할 수 있는 방법이나 검색 속도가 매우 느려서 실제 사용에 큰 어려움이 있다. 일반적으로 DNA 검색에 사용하는 서열 정렬 기법을 사용할 경우 데이터 베이스의 모든 문자열과 비교가 이루어져야 하기 때문에 많은 검색 시간이 걸리게 된다. 이것을 해결하기 위해 우리는 편집거리가 metric space를 만족하는 성질을 이용한 한글 근사단어 검색 시스템을 사용하여 실제 서열정렬을 사용하여 비교가 필요한 후보 단어를 거르게 된다. 이 한글 근사 단어 검색 시스템에서 가장 중요한 것은 기준축의 역할을 하는 Base-Pivot의 선택 방법이다. 본 논문에서는 이 Base-Pivot의 효율적인 선택방법을 실험을 통해서 분석하도록 한다.

  • PDF