• Title/Summary/Keyword: 한글 검색

Search Result 504, Processing Time 0.023 seconds

Automatic generation of Hangul Johap typeface using small character set (제한된 글자 디자인에 의한 한글 조합형 글꼴의 자동생성)

  • Kang, Sang-Soo;Cho, Hwan-Gue
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.217-222
    • /
    • 1994
  • 한글 글꼴을 새롭게 만들려면 지금까지는 기본 글자인 자소를 디자인하든지 아니면 완성된 글자 전체를 디자인해야 했다. 조합형의 글자디자인의 경우, 전체 글자가 아니라 부분적인 한글 전자사전은 많은 양의 데이타를 저장할 수 있어야 하며, 빠른 검색 속도를 제공해야 한다. 기존의 트라이는 공통접두사만을 압축하기 때문에 사전의 크기가 방대하다는 단점이 있다. 본 논문에서는 DAWG(Directed Acyclic Word Graph)를 이용하여 공통접미사까지 압축하였고, 검색과 기억장소의 효율을 위하여, 링크드리스트 구조의 DAWG를 유형별 배열 구조로 바꾸었다. 전국의 각 학교 이름들을 대상으로 실험한 결과, 본 논문에서 제안한 DAWG를 이용한 배열 구조의 사전은 트라이와 비교하여 볼 때, 검색 연산의 성능은 동일하게 유지하면서 기억 장소의 효율과 압축율에서 효과적이었다. 또한, 트라이보다 주기억장치와 보조기억장치와의 블록 입출력횟수를 줄임으로써 전체 검색 시간을 낮출 수 있었다.소를 디자인하기 때문에 전체 글자의 모양이 좋지 않다는 단점이 있었고 완성형의 경우 완성된 글자 전체를 모두 디자인해야하는 단점이 있었다. 본 논문에서는 한글 글꼴 개발의 한 방법으로 제한된 글자의 디자인에 의한 전체 글꼴 생성에 관한 한 방법을 제시한다. 이 방법은 표준으로 설정된 몇 글자를 디자인하면 그 글자를 분석하여 자소들을 위한 글꼴 화일이 만들어지고 자소 글꼴 화일로부터 다른 모든 글자를 만들어 낸다.

  • PDF

Improving the performance of natural language information retrieval system by using non-keyword search methods. (자연어 질의 정보 검색 시스템의 비주제어 탐색 방법을 통한 성능 개선)

  • Lee, Seung-Ryul;Kang, Hyun-Kyu;Park, Se-Young;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.374-377
    • /
    • 1994
  • 본 논문에서는 한글 문서 검색 시스템에서 자연어 질의어로 검색할경우, 질의어를 주제어와 참조어로 나누어 재구성하여 검색하는 방법을 제시하였다. 먼저 주제어로 전문검색을 하여 후보 카드들을 추출한 후 비주제어로 다시 본문 탐색을 하여 추출된 카드의 가중치를 재조정함으로써 카드추출의 정확성을 높였다. 이 논문에 제시된 방법의 실험은 한국전자통신연구소 언어정보연구실에서 개발한 멀티미디어 전자 백과 사전의 자연어 검색모듈에서 행하여 졌다. 이 방법으로 별다른 검색속도의 저하나, 저장공간의 추가가 없이 기존의 검색 방법에서보다 약 58%정도의 검색의 정확성이 올라갔다. 본 논문에서 제시한 검색의 방법은 여러가지 응용의 자연어 인터페이스에서 데이타를 검색하는 정보검색의 분야에 적용되어 정확성을 높일 수 있을 것이다.

  • PDF

A User-Centered Evaluation of Naver and Korea AltaVista (이용자 중심의 국내 탐색엔진의 평가에 관한 연구)

  • 박희진;오삼균
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1999.08a
    • /
    • pp.109-112
    • /
    • 1999
  • 본 연구는 이용자의 정보요구를 최대한 충족시키고 보다 사용하기 편한 이용자 지향의 탐색엔진을 개발하기 위해서 이용자 관점에서 국내 탐색엔진 한글알타비스타와 네이버를 평가하고자 한다. 이용자 중심의 탐색엔진 평가를 위해, 본 연구는 이용자가 자신의 검색질의로 탐색엔진을 통해 직접 검색을 하게 한 후 검색결과에 대해 이용자 스스로 평가하도록 한다. 평가기준은 수와 첸의 탐색엔진의 평가기준을 바탕으로 하여 탐색시간 및 노력, 탐색결과의 정확율, 연결성, 중복률, 유용성, 이용자의 만족도로 한글알타비스타와 네이버의 검색효율성 출 비교·평가하고자 한다.

  • PDF

Personal Information Searching System using Dynamic Indexing and Korean Contents Based Search (동적 색인과 한국어 내용 기반 검색을 이용한 개인용 검색 시스템)

  • Kim, Yun-Tae;Kim, Ji-Won;Son, Su-Jeong;Lee, Hyun-Ah
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.639-641
    • /
    • 2018
  • 고전적으로 이용되던 디렉터리 분류로는 원하는 정보를 빠르게 찾기 어려워지면서, 키워드 기반 검색 시스템이 정보 처리의 중심이 되고 있다. 본 논문에서는 개인용 컴퓨터에서의 빠른 자료 검색을 위한 키워드 기반 정보검색 시스템을 제안한다. 시스템에서는 동적 색인을 통하여 기존 시스템들보다 빠른 시간 내에 검색 결과를 제공한다. 내용 기반 검색과 다양한 포맷에 대한 문서 검색 기능을 포함하여 사용자에게 편리한 환경을 제공할 뿐만 아니라, 한글 문장이 포함된 문서에 대해서 원활한 검색을 제공하고자 한다. 성능 비교 검증을 수행한 결과 기존 시스템에 비해 보다 빠른 시간 내에 많은 문서를 탐지할 수 있음을 확인하였다.

  • PDF

A Korean Input Method in Platform_free Environment (플랫폼독립적 환경에서 한글 입력 방법)

  • Shin, Gab-Jae;Lee, Hyoung-Jick;Byun, Jeong-Yong
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.77-82
    • /
    • 2002
  • 현행 한글 입력방법은 운영체제 의존적 문자입력 방법을 채택하고 있다. 즉 운영체제가 채택하는 문자입력방식에 의존적이다. 특히 인터넷의 발전으로 세계 어느 곳에서나 인터넷을 통한 정보 검색이나 전자상거래와 같은 일을 할 수 있게 되었다. 정보검색이나 전자상거래와 같은 각종 한글 인터넷 응용은 전 세계 어느 곳에서나 이용 요구가 있다. 여기서 한글의 출력은 대부분 가능하지만 입력은 운영체제의 입력기(IME, AMI)에 의존적이어서 입력을 하려면 한글 입력기를 설치해야 한다. 또한 대부분 일반 이용자는 이를 설치하기 어렵고, 국외에서 이용하려면 플랫폼은 개인 휴대 시스템이 아닐 경우 입력기를 설치할 수 없을 것이다. 이를 편리하게 가능하도록 하기 위하여 해당 한글 웹 응용이 직접 한글 입력기능을 제공하여 플랫폼에 의존하지 않고 독립적으로 한글 입력이 가능한 방안을 제시하고 이를 구현하여 가능함을 보였다. 본 논문은 플랫폼 독립적인 환경에서 인터넷을 통한 한글의 입력방법의 필요성과 그것이 가지는 한계점을 검토하고 응용프로그램과의 연동하는 한글 입력방법을 제안하고 구현하였다.

  • PDF

Automatic Foreign Word Transliteration Model for Information Retrieval (정보검색을 위한 외래어 자동표기 모델)

  • 이재성;최기선
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1997.08a
    • /
    • pp.17-24
    • /
    • 1997
  • 조사에 따르면 한글 문서에서 사용되는 단어 중 외래어 또는 영어가 포함된 단어가 약 26%정도를 차지하고 있으며, 이는 정보검색의 중요 색인어로 사용된다(권윤형 1996). 그러나 이들 단어들은 서로 같은 단어인데도 영어로 표기되기도 하고 이형의 외래어들로 표기되기도 하여, 정보검색의 효율을 떨어뜨리고 있다. 본 논문에서는 영어 단어와 그에 대응되어 표기되는 외래어들을 찾기 위한 한 단계로서, 영어를 한글로 음차(transliteration)하여 자동표기하는 통계적 모델을 제안하고 실험한다. 제안된 모델은 통계적 기계번역 방식과 그의 한 방법인 문서 정렬(text alignment) 방식에 근거하고 있다. 특히 이 모델에서는 효과적으로 발음의 단위를 분리한 다음 정렬을 하여. 전체적인 계산량을 줄이고 성능도 향상시켰다. 음차표기는 피봇방식과 직접방식의 두가지로 구현하였다. 피봇방식은 영어에서 발음을 생성한 후, 그 발음을 다시 한글로 표기하는 방식이고, 직접방식은 직접 영어 단어에서 한글 표기로 포기하는 방식이다. 두 방식을 제안된 모델을 이용하여 비교 테스트한 결과 직접방식이 보다 정확하게 표준 외래어로 표기하였다.

  • PDF

An Implementation of Web-Based Korean Language Information Retrieval System (웹기반 한글정보검색시스템의 구현)

  • Hong, G.C.;Chung, H.S.
    • Electronics and Telecommunications Trends
    • /
    • v.14 no.6 s.60
    • /
    • pp.9-21
    • /
    • 1999
  • 최근 인터넷상에는 매일 방대한 양의 정보가 창출되어 유포되고 있으며, 수많은 정보 제공 사이트들이 늘고 있다. 이용자들은 필요한 정보를 찾고 활용하기 위해 야후(Yahoo), 알타비스타(AltaVista) 등 국외 검색엔진(search engine)들과 심마니, 미스 다찾니 등 국내 검색엔진 등 인터넷상에 운용되고 있는 이들 시스템들을 이용하고 있지만, 대부분의 시스템들은 자체 정보 제공보다는 로봇 에이전트를 이용하여 인터넷 사이트에 등록되어 있는 다양한 분야의 홈페이지 정보들을 수집/분석하여 관련 사이트를 연결해주는 방식의 메타 검색엔진들로서 불필요한 정보들까지 제공함에 따라 이용자들이 필요로 하는 정보를 찾기에는 너무 많은 노력과 시간을 소모하게 되는 문제점을 안고 있다. 이에 본 고에서는 형태소 분석 및 시소러스 사전을 이용하여 검색의 정확성 및 재현율 향상을 고려하고, 주제어 중심의 불리언 검색뿐만 아니라 하이퍼텍스트 기반의 주제어 카탈로그 검색, 각기 다른 사이트의 검색엔진들로부터 질의한 결과를 통합하여 제공하는 지능형 통합검색, 이용자 프로파일에 근거하여 최신 업데이트된 정보를 주기적으로 제공해주는 맞춤정보서비스(Selective Dissemination of Information Service: SDI) 등을 통합한 인터넷 기반의 한글 정보검색시스템의 구현에 대한 내용을 기술하고자 한다.

A User-centered Evaluation of Korean Alta Viasta and Naver (국내 인터넷 탐색엔진에 대한 이용자 중심의 평가에 관한 연구 - 한글알타비스타와 네이버를 중심으로 -)

  • Oh, Sam-Gyun;Park, Hee-Jin
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.34 no.2
    • /
    • pp.117-133
    • /
    • 2000
  • This study evaluated two Korean search engines, Korean AltaVista and Naver, using user-based measures by Su(1998). Measures are based on four evaluation criteria: efficiency, precision, validity of the links, user satisfaction. For this study, users conducted searches on two engines with their own search queries and performed relevance judgement. Study results indicate that efficiency, validity of the links, and user' s satisfaction ratios of system features are significantly different between two search engines, although there is no significant difference of precision. This study can be used as a framework for usercentered evaluation and utilized to enhance Korean search engines.

  • PDF

A Benchmark Test for Korean Spelling-Checking Programs (국어 철자검색 프로그램 키재기)

  • No, Yong-Kyoon;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.505-517
    • /
    • 1994
  • 국어 철자 검색 프로그램 세 개의 검색 능력을 비교하였다. 오류가 없는 파일, 타자시의 전형적인 오류를 포함하는 파일(자소별 오류율 1%), 그리고 광학적 문자인식 프로그램의 전형적인 오류를 포함하는 파일(자소별 오류율 $2.7{\sim}2.9%$) 등에 대하여 한글과 컴퓨터, 한국 마이크로소프트, 핸디 소프트의 워드프로세서에 도구로 포함된 철자검색 프로그램을 수행하였다. 이 세 프로그램 중에서 한글과 컴퓨터의 제품은 정방향 오판율과 오류율 낮은 파일에 대한 역방향 오판율이 낮았고 핸디 소프트의 제품은 오류율이 높은 파일에 대한 역방향 오판율이 낮았다. 세 프로그램 모두 역방향 오판율이 자소별 오류율의 10배 이상이라는 점에 있어서 심각한 문제를 안고 있는 것으로 판단된다.

  • PDF

Implementation and Exprimentation for Hangul Word Dictionary via DAWG (DAWG에 의한 한글단어사전의 구성 및 실험)

  • Shin, Seong-Hyo;Kim, Sang-Woon
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.207-210
    • /
    • 1994
  • 한글 전자사전은 많은 양의 데이타를 저장할 수 있어야 하며, 빠른 검색 속도를 제공해야 한다. 기존의 트라이는 공통접두사만을 압축하기 때문에 사전의 크기가 방대하다는 단점이 있다. 본 논문에서는 DAWG(Directed Acyclic Word Graph)를 이용하여 공통접미사까지 압축하였고, 검색과 기억장소의 효율을 위하여, 링크드리스트 구조의 DAWG를 유형별 배열 구조로 바꾸었다. 전국의 각 학교 이름들을 대상으로 실험한 결과, 본 논문에서 제안한 DAWG를 이용한 배열 구조의 사전은 트라이와 비교하여 볼 때, 검색 연산의 성능은 동일하게 유지하면서 기억 장소의 효율과 압축율에서 효과적이었다. 또한, 트라이보다 주기억장치와 보조기억장치와의 블록 입출력횟수를 줄임으로써 전체 검색 시간을 낮출 수 있었다.

  • PDF