• Title/Summary/Keyword: word dictionary

Search Result 277, Processing Time 0.026 seconds

Design of an on-line morphological analyzer for a japanese-to-korean translation system (일한 기계번역을 위한 on-line 형태소 해석기 설계)

  • 강석훈;최병욱
    • Journal of the Korean Institute of Telematics and Electronics B
    • /
    • v.33B no.5
    • /
    • pp.127-137
    • /
    • 1996
  • In this paper, an algorithm for on-line rightward japanese parsing is proposed. The ambiguity in on-line parsing is accumulated until the input is completely finished, since there is not a space between words in the japanese sentence. Thus the algorithm for morphological analysis, based on modified chart, is used in solving it. And the number of searching a word in dirctionary for morphological analysis is also a puzzling problem. The japanese sentence, consist of N characters, has logically its maximum number of N(N+1)/2 searches in the ordinary on-line analysis, which is nearly twice as many as normal off-line. In this paper, the matter is settled through the modification of dictionary format. In experiment, we can accomplish the rate of analysis which is nearly equal to that of off-line parsing. And it becomes clear that the longer a sentence is, the better an analysis efficiency is.

  • PDF

Design and Implementation of Web Mail Document Generator using Dictionary DB (사전 DB를 이용한 웹 메일 문서 생성기)

  • Choi, Ji-Yeon;Min, Su-Hong;Cho, Dong-Sub
    • Annual Conference of KIPS
    • /
    • 2003.11a
    • /
    • pp.451-454
    • /
    • 2003
  • WWW(Word Wide Web)은 인터넷 상에서 광범위하게 분산된 다양한 형식의 데이터를 손쉽게 검색할 수 있도록 하며, 모든 응용의 사용자 환경을 손쉽게 포함시킴으로서 새로운 미디어 타입의 통합을 위한 가장 성공적인 기술로 평가받고 있다. E-Mail 서비스는 WWW 시스템의 가장 기본적인 기능으로, 인터넷 기술이 발전하고 사용자가 기하급수적으로 증가함에 따라 E-Mail 사용자도 늘고있다. 그러나 기존의 서비스는 HTML의 텍스트 기반 구조를 통한 비동기적인 형태의 서비스를 계속 유지하고 있어, 최근 인터넷상의 상당수를 차지하는 오디오, 비디오와 같은 실시간 환경의 멀티미디어 데이터들을 통합하는 좀더 동기적인 표현방법이 요구되고 있다. 본 논문에서는 E-Mail 서비스에 대한 동기적 방법론을 제안하고 구현하고자 한다.

  • PDF

Usage analysis of vocabulary in Korean high school English textbooks using multiple corpora (코퍼스를 통한 고등학교 영어교과서의 어휘 분석)

  • Kim, Young-Mi;Suh, Jin-Hee
    • English Language & Literature Teaching
    • /
    • v.12 no.4
    • /
    • pp.139-157
    • /
    • 2006
  • As the Communicative Approach has become the norm in foreign language teaching, the objectives of teaching English in school have changed radically in Korea. The focus in high school English textbooks has shifted from mere mastery of structures to communicative proficiency. This paper will study five polysemous words which appear in twelve high school English textbooks used in Korea. The twelve text books are incorporated into a single corpus and analyzed to classify the usage of the selected words. Then the usage of each word was compared with that of three other corpora based sources: the BNC(British National Corpus) Sampler, ICE Singapore(International Corpus of English for Singapore) and Collins COBUILD learner's dictionary which is based on the corpus, "The Bank of English". The comparisons carried out as part of this study will demonstrate that Korean text books do not always supply the full range of meanings of polysemous words.

  • PDF

The origin of the word of sunflower (해바라기(향일규(向日葵), 향일화(向日花))의 어원(語源)에 대하여)

  • Kim, Jong Dug;Koh, Byung Hee
    • The Journal of Korean Medical History
    • /
    • v.14 no.1
    • /
    • pp.31-47
    • /
    • 2001
  • According to the customary, naming is done after the subject is in existence. But the name "Haebaragi"(Hyangilgyu, Hyangilhwa) has been used as an alias of Hibiscus manihot L, long before Helianthus annuus L was brought in to Korea, and now the usage of the name has been conversed since then. Since the incorrect record of Gyugwak and Gyuhwa as Haebaragi in "Chosunesajun"(Dictionary of Chosun language) published under Chosunchongdokbu in 1920, the mistake has been carried on and this must be corrected from now on. Incorrect record of hollyhock(Chokgyuwha) as Haebaragi in "Mong-u" (1810) took a role in this incorrect trend.

  • PDF

A Study of N-Insertion Preferences in Korean (선호도 조사를 통한 ㄴ첨가 현상의 실현 양상 연구)

  • Kook, Kyungnk-A;Kim, Ju-Won;Lee, Ho-Young
    • MALSORI
    • /
    • no.53
    • /
    • pp.37-60
    • /
    • 2005
  • A Study of N-Insertion Preferences in KoreanKyung-A Kook, Ju-Won Kim, Ho-Young LeeSince n-insertion is not an obligatory process in Korean, it is necessary to investigate what factors influence n-insertion preferences and whether n-insertion preferences have been changed over time. To find answers to these questions, an n-insertion preference test using a questionnaire was conducted. 183 words were selected for this test and 167 subjects participated in the test. The results of this test show that the n-insertion preferences were influenced by the speakers' age, the number and structure of the syllable, word class, phonetic environments, and familiarity. It is suggested that the results of this test should be incorporated into the Principles of Standard Pronunciation and in the Grand Dictionary of Standard Korean.

  • PDF

Corpus Based Unrestricted vocabulary Mandarin TTS (코퍼스 기반 무제한 단어 중국어 TTS)

  • Yu Zheng;Ha Ju-Hong;Kim Byeongchang;Lee Gary Geunbae
    • Proceedings of the KSPS conference
    • /
    • 2003.10a
    • /
    • pp.175-179
    • /
    • 2003
  • In order to produce a high quality (intelligibility and naturalness) synthesized speech, it is very important to get an accurate grapheme-to-phoneme conversion and prosody model. In this paper, we analyzed Chinese texts using a segmentation, POS tagging and unknown word recognition. We present a grapheme-to-phoneme conversion using a dictionary-based and rule-based method. We constructed a prosody model using a probabilistic method and a decision tree-based error correction method. According to the result from the above analysis, we can successfully select and concatenate exact synthesis unit of syllables from the Chinese Synthesis DB.

  • PDF

A Study of Terminology Describing Subjective Hand of Fabrics (의류소재의 주관적인 태 평가 용어 선정에 관한 연구)

  • 김의경;이미식
    • Journal of the Korean Society of Clothing and Textiles
    • /
    • v.27 no.11
    • /
    • pp.1279-1290
    • /
    • 2003
  • The purpose of this study was to make a scale for measuring the subjective hand of fabrics. For this purpose subjective hand expressions which were published in the journals were reviewed. 11 pairs(9 biopolar-pairs, 2 unipolar-pairs) were selected after searching the definitions in a dictionary followed by focus group interview and survey. To find out if these terminological biopolar pairs are agreed with the biopolar pairs in human sensation, a survey of fabric hand was undertaken using a scale consisted of 20 words(18 words from biopolar-pairs, 2 words from unipolar pairs). Among 11 pairs, 10 pairs except [taktakhada-poksinhada] were accepted as biopolar pair of word terminologically and sensuously. [taktakhada-poksinhada] was recognized as a biopolar pair terminologically but not sensuously. These 20 words were classified as 5 factors-surface contour, density, flexibility, dampness, and extensibility

moHANA: Morphological Hangul Analyzer using Multi-Dimensional Analysis Dictionary (moHANA: 다차원 해석 사전을 기반으로 한 한국어 형태소 분석기)

  • Seo, SeungHyeon;Kang, In-Ho;Kim, JaeDong
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.99-106
    • /
    • 2007
  • 본 연구는 국어의 모든 언어적 특성을 기술하고 이를 실제 형태소 분석에 적용할 수 있도록 다차원 해석 사전을 이용하는 형태소 분석 시스템인 moHANA(Morphological Hangul Analyzer)에 관한 연구이다. moHANA의 해석 사전은 태그정보 사전, 어휘 사전 그리고 문법 사전으로 구성된다. 태그정보 사전은 기존 형태소 해석기의 일차원적인 품사 정보와 달리 어류 태그정보, 형태적 정보, 통사적 정보, 의미적 정보 및 화용 정보의 5 차원 벡터 정보로 작성된다. 어휘 사전은 어휘와 그 어휘가 가질 수 있는 태그정보를 우선 순위에 기반하여 순서열로 가지며, 문법 사전은 특수 문법 연산자를 이용하여 태그정보 사전에 정의된 각각의 태그가 연결 가능한지 여부를 규정하는 문법이 구축되어 있다. 형태소가 가지는 태그정보를 다차원으로 정의하고 이에 따른 문법 규칙의 표현을 통해 보다 자세한 형태소 분석 및 새로운 형태소 태그의 삽입과 삭제의 용이함을 얻을 수 있다.

  • PDF

Knowledge Representation of Concept Word Using Cognitive Information in Dictionary (사전에 나타난 인지정보를 이용한 단어 개념의 지식표현)

  • Yun, Duck-Han;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.118-125
    • /
    • 2004
  • 인간의 언어지식은 다양한 개념 관계를 가지며 서로 망(network)의 모습으로 연결되어 있다. 인간의 언어지식의 산물 중에서 가장 체계적이며 구조적으로 언어의 모습을 드러내고 있는 결과물이 사전이라고 할 수 있다. 본 논문에서는 이러한 사전 뜻풀이 말에서 개념 어휘와 자동적인 지식획득을 통하여 의미 정보를 구조적으로 추출한다. 이러한 의미 정보가 추출되면서 동시에 자동적으로 개념 어휘의 의미 참조 모형이 구축된다. 이러한 것은 사전이 표제어 리스트와 표제어를 기술하는 뜻풀이말로 이루어진 구조의 특성상 가능하다. 먼저 172,000여 개의 사전 뜻풀이말을 대상으로 품사 태그와 의미 태그가 부여된 코퍼스에서 의미 정보를 추출하는데, 의미분별이 처리 된 결과물을 대상으로 하기 때문에 의미 중의성은 고려하지 않아도 된다. 추출된 의미 정보를 대상으로 정제 작업을 거쳐 정보이론의 상호 정보량(Ml)을 이용하여 개념 어휘와 의미 정보간에 연관도를 측정한 후, 개념 어휘간의 유사도(SMC)를 구하여 지식표현의 하나로 연관망을 구축한다.

  • PDF

Automatic Mapping of Korean Wordnet "KorLex" to Semantic Classes of Sejong Dictionary (세종 의미 부류와 KorLex 명사 어휘 의미망 자동 맵핑)

  • So, Gilja;Yoon, Aesun;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.92-96
    • /
    • 2009
  • 인간이 가진 개념을 지식베이스화하려는 시도 중 하나로 의미망이 구축되고 있다. 한국어를 대상으로 한 어휘 의미망 중 프린스턴 대학의 WordNet을 대역한 KorLex는 1,2단계에서 한국어 어휘의미의 특성을 반영하여 개념 및 의미구조를 재구조화하고 있다. 그러나 현재 KorLex의 동의어 집합을 구성하는 어휘 의미에는 논항정보를 따로 구성할 수 없었다. 본 연구는 세종 전자 사전 격틀정보내의 선택제약조건(selectional restriction)으로 사용되고 있는 의미 부류와 KorLex의 명사 어휘 의미망을 자동 맵핑하는 방안을 제안함으로써 KorLex에서 세종 전자 사전 격틀정보를 활용할 수 있는 가능성을 제공한다.

  • PDF