• 제목/요약/키워드: Korean Dictionary

검색결과 736건 처리시간 0.027초

Computerized Sound Dictionary of Korean and English

  • Kim, Jong-Mi
    • 음성과학
    • /
    • 제8권1호
    • /
    • pp.33-52
    • /
    • 2001
  • A bilingual sound dictionary in Korean and English has been created for a broad range of sound reference to cross-linguistic, dialectal, native language (L1)-transferred biological and allophonic variations. The paper demonstrates that the pronunciation dictionary of the lexicon is inadequate for sound reference due to the preponderance of unmarked sounds. The audio registry consists of the three-way comparison of 1) English speech from native English speakers, 2) Korean speech from Korean speakers, and 3) English speech from Korean speakers. Several sub-dictionaries have been created as the foundation research for independent development. They are 1) a pronunciation dictionary of the Korean lexicon in a keyboard-compatible phonetic transcription, 2) a sound dictionary of L1-interfered language, and 3) an audible dictionary of Korean sounds. The dictionary was designed to facilitate the exchange of the speech signal and its corresponding text data on various media particularly on CD-ROM. The methodology and findings of the construction are discussed.

  • PDF

대용량 전자사전 구축을 위한 국어 대사전의 통계 정보 (Statistical Information of Korean Dictionary to Construct an Enormous Electronic Dictionary)

  • 김철수;김양범
    • 한국콘텐츠학회논문지
    • /
    • 제7권6호
    • /
    • pp.60-68
    • /
    • 2007
  • 언어 정보 처리 응용 분야는 정보검색, 형태소분석, 철자검색, 음성인식, 문자 인식 등 다양하다. 이러한 정보처리 과정은 전자 사전이 필수적이다. 본 논문에서는 국어대사전에 대한 기본적인 통계 정보들을 살펴보고, 전자사전 구축에 대하여 알아보았다. 대상 정보는 고어 및 불완전음절을 포함하는 단어를 제외한 표제어들에 대하여, 대사전의 표제어수, 전자사전의 엔트리수, 사용된 전체음절수, 서로 다른 음절수, 엔트리들의 평균 길이, 품사별 분포, 전자사전을 트라이로 구축할 때 사용되는 노드 수 등 이다. 전자사전의 전체 엔트리 수는 361,980개, 사용된 음절수는 1,289,659개로 엔트리들의 평균 길이는 3.56이었으며 서로 다른 음절수는 2,463개였다. 이러한 통계 정보들은 전자사전 구축 및 한국어 정보처리에 도움이 될 것이다.

한글문장-수화 번역기를 위한 사전구성 (A construction of dictionary for Korean Text to Sign Language Translation)

  • 권경혁;민홍기
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.841-844
    • /
    • 1998
  • Korean Text to Sign Language Traslator could be applied to learn letters for both the deaf and hard-of-hearing people, and to have a conversation with normal people. This paper describes some useful dictionaries for developing korean text to sign language translator; Base sign language dictionary, Compound sign language dictionary, and Resemble sign language dictionary. As korean sign language is composed entirely of about 6,000 words, the additional dictionaries are required for matching them to korean written language. We design base sign language dictionary which was composed of basic symbols and moving picture of korean sign language, and propose the definition of compound isng language dictionary which was composed of symbols of base sing language. In addition, resemble sign language dictionary offer sign symbols and letters which is used same meaning in conversation. By using these methods, we could search quickly sign language during korean text to sign language translating process, and save storage space. We could also solve the lack of sign language words by using them, which are appeared on translating process.

  • PDF

단어, 어원 Dictionary에 의한 Text 압축 (Text Compression by Word and Etymology Dictionary)

  • 이재영;성굉모;이종각
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1988년도 전기.전자공학 학술대회 논문집
    • /
    • pp.607-611
    • /
    • 1988
  • In this paper, a text compression method is proposed which is capable of reducing mean bits per character by word and etymology dictionary. This dictionary consists of 256 words and 512 etymologies with 10 bits length codes. Using this dictionary, a mean rate of 3.44 bits per character is achieved.

  • PDF

"표준국어대사전"을 이용한 시소러스 구축 (Construction of Thesaurus Using "The Korean Standard Dictionary")

  • 한상길
    • 한국도서관정보학회지
    • /
    • 제44권4호
    • /
    • pp.233-254
    • /
    • 2013
  • 시소러스 작성에 있어서 가장 현실적인 어려움은 용어의 수집에 있다. 용어사전 뿐만 아니라 어휘사전도 시소러스의 중요한 용어 수집원으로 사용될 수 있다. "표준국어대사전"은 어문 규정을 충실히 반영한 우리나라의 대표사전이다. 또한 "표준국어대사전"은 단순히 표제어에 대한 용어 정의뿐만 아니라 해당 용어에 대한 다양한 정보를 체계적으로 담고 있기 때문에, 이를 시소러스 사전 구축에 활용할 수 있을 것이다. 본 연구는 "표준국어대사전"이 갖고 있는 다양한 용어관계 정보를 시소러스 용어관계로 정의하는 방안을 모색하였다. 또한 용어의 분리, 동등관계와 계층관계의 설정, 한정어의 사용, 북한어 관계 등 시소러스 구축에서의 문제점과 해결 방안을 제시한다.

발음 사전에 기반한 영.한 음차 표기 사전의 구축 (Building English-to-Korean Transliteration Dictionary Based on Pronouncing Dictionary)

  • 이도길
    • 말소리와 음성과학
    • /
    • 제1권3호
    • /
    • pp.103-108
    • /
    • 2009
  • This paper proposes a method for building a transliteration dictionary, which is based on pronouncing information extracted from two kinds of existing dictionaries. Also, it proposes a method for transforming the pronouncing information into Korean translitered words. To express the pronouncing information, we define Phoman code system. In order to avoid phonetic estimation process of English words which is the most important problem, the proposed method uses the pronouncing information extracted from the existing dictionaries. Therefore, unlike previous approaches, the proposed method does not need any incomplete phonetic estimation process so that it can produce accurate transliteration results. The proposed method has been fully implemented.

  • PDF

A New Approach of Domain Dictionary Generation

  • Xi, Su Mei;Cho, Young-Im;Gao, Qian
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제12권1호
    • /
    • pp.15-19
    • /
    • 2012
  • A Domain Dictionary generation algorithm based on pseudo feedback model is presented in this paper. This algorithm can increase the precision of domain dictionary generation algorithm. The generation of Domain Dictionary is regarded as a domain term retrieval process: Assume that top N strings in the original retrieval result set are relevant to C, append these strings into the dictionary, retrieval again. Iterate the process until a predefined number of domain terms have been generated. Experiments upon corpus show that the precision of pseudo feedback model based algorithm is much higher than existing algorithms.

Dictionary Attacks against Password-Based Authenticated Three-Party Key Exchange Protocols

  • Nam, Junghyun;Choo, Kim-Kwang Raymond;Kim, Moonseong;Paik, Juryon;Won, Dongho
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권12호
    • /
    • pp.3244-3260
    • /
    • 2013
  • A three-party password-based authenticated key exchange (PAKE) protocol allows two clients registered with a trusted server to generate a common cryptographic key from their individual passwords shared only with the server. A key requirement for three-party PAKE protocols is to prevent an adversary from mounting a dictionary attack. This requirement must be met even when the adversary is a malicious (registered) client who can set up normal protocol sessions with other clients. This work revisits three existing three-party PAKE protocols, namely, Guo et al.'s (2008) protocol, Huang's (2009) protocol, and Lee and Hwang's (2010) protocol, and demonstrates that these protocols are not secure against offline and/or (undetectable) online dictionary attacks in the presence of a malicious client. The offline dictionary attack we present against Guo et al.'s protocol also applies to other similar protocols including Lee and Hwang's protocol. We conclude with some suggestions on how to design a three-party PAKE protocol that is resistant against dictionary attacks.

영한 기계번역 시스템의 영한 변환사전 확장 도구 (English-Korean Transfer Dictionary Extension Tool in English-Korean Machine Translation System)

  • 김성동
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권1호
    • /
    • pp.35-42
    • /
    • 2013
  • 영한 기계번역 시스템을 개발하기 위해서는 언어에 대한 다양한 정보를 필요로 하며, 특히 영어 단어에 대한 의미 정보를 포함하는 영한 변환사전의 풍부한 정보량은 번역품질에 중요한 요소이다. 지속적으로 생성되는 새로운 단어들은 사전에 등록되어 있지 않아 번역문에 영어 단어가 그대로 출력되어 번역품질을 저하시킨다. 또한 복합명사는 어휘분석, 구문분석을 복잡하게 하고 사전에 의미가 등록되지 않은 경우가 많아 올바르게 번역하기 어렵다. 따라서 영한 기계번역의 번역품질 향상을 위해서는 사전에 등록되어 있지 않은 단어들과 자주 사용되는 복합명사들을 수집하고 의미 정보를 추가하여 영한 변환사전을 지속적으로 확장하는 것이 필요하다. 본 논문에서는 인터넷 신문기사로부터 말뭉치를 추출하고, 사전 미등록 단어와 자주 나타나는 복합명사를 찾은 후, 이들에 대해 의미를 부착하여 영한 변환사전에 추가하는 일련의 과정으로 구성되는 영한 변환사전의 확장 방안을 제안하고 이를 지원하는 도구를 개발하였다. 사전 정보의 확대는 많은 사람의 노력을 필요로 하는 일이지만, 영한 기계번역 시스템의 개선을 위해서는 필수적이다. 본 논문에서 개발한 도구는 사람의 노력을 최소화 하면서, 영한 변환사전의 정보량 지속적인 확대를 위해 유용하게 활용되어 영한 기계번역 시스템의 번역품질 개선에 기여할 것으로 기대된다.

과학용어에 대한 '포털 사전', '표준국어대사전', '과학교과서' 설명의 비교 분석 (Comparison of the Explanation Texts for Science Terminology in Portal Dictionary, Pyojun Korean Dictionary and Science Textbooks)

  • 윤은정;박윤배
    • 한국과학교육학회지
    • /
    • 제37권1호
    • /
    • pp.1-8
    • /
    • 2017
  • 학생들의 과학 학습 및 일반 대중의 과학적 소양 함양 측면에서 과학용어에 대한 이해도는 매우 중요하다. 본 연구에서는 학교 교육을 통한 과학용어 교육 이외에 학생들이나 일반 대중이 직접 과학용어의 의미를 찾아보고 학습할 수 있는 보조 자료가 필요하다는 전제에서 출발하여, 학생이나 일반인들이 스스로 과학용어를 학습하기 위한 보조 자료들인 포털사전, 표준국어대사전, 과학교과서에서 과학용어를 설명하는 글의 텍스트적 특성이 학생들이 읽고 이해하기에 얼마나 용이한지, 그리고 실제 학생들은 어떻게 인식하고 있는지를 살펴보았다. 그 결과 포털사전이나 표준국어대사전에 비해 과학교과서가 상대적으로 학생들이 읽고 이해하기에 쉬운 자료로 나타나기는 했으나, 세 자료 모두 학생들의 수준에 비해 이독성이 낮은 편에 속하며 이독성을 높이기 위해 개선해야 할 사항이 있는 것으로 나타났다.