• Title/Summary/Keyword: Josa

Search Result 20, Processing Time 0.041 seconds

A Method of Function-word Recognition by Relative Frequency (상대빈도를 이용한 문법형태소의 인식 방법)

  • 강승식
    • Korean Journal of Cognitive Science
    • /
    • v.10 no.2
    • /
    • pp.11-16
    • /
    • 1999
  • It is expected that some Josa/Eomi's are frequently used and others are not in the Korean documents. In this paper. we confirm it through the experiment and show that such information is very useful for Korean language processing. In case of Josa. most frequent 9 Josa's occupied 70% of total Josa's and 20. 32. 69 Josa's occupied 90%. 95%. and 99% respectively. Similarly, most frequent 10 numbers of Eomi's occupied 70% of total Eomi's and 33. 54. 117 Eomi's occupied 90%. 95%. and 99% respectively. We propose a dictionary construction method for Josa/Eomi dictionary that is classified by the frequency information. Furthermore. Josa/Eomi frequency results are very useful for the identification of unregistered morphemes and the disambiguation of lexical ambiguities.

  • PDF

SEARCH FOR DIETARY CONSTITUENTS WHICH PROTECT TOWARDS HETEROCYCLIC AROMATIC AMINES (HAs)

  • Knasmuller, Siegfried;Steinkellner, Hans;Zsivkovits, Markus;Uhl, Maria;Loste, Evelyn;Kassie, Fekadu
    • Proceedings of the Korean Society of Toxicology Conference
    • /
    • 2001.10a
    • /
    • pp.43-44
    • /
    • 2001
  • The increasing evidence for the involvement of food borne HAs in the aetiology of human cancer has stimulated intense efforts to identify dietary constituents which protect against these compounds. About 280 articles on this topic have been published in the last 20 years, most of them were antimutagenicity studies with indicator cells that require addition of exogenous activation mix. The experimental models do not adequately reflect protective mechanisms that are active in vivo and may give misleading results.(omitted)

  • PDF

A comparison between Korean and Mongolian eomi and josa for Korean to Mongolian machine translation system

  • Enkhsaruul, A.;Song, Chang Geun;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.228-232
    • /
    • 2007
  • In this paper we propose comparison of both verb and noun endings between Korean and Mongolian languages. It is based on the similarity between two languages which have the same sentence structures and their eomi and josa structure. Korean verb and noun endings match into those of corresponding Mongolian endings. Josa and eomi are classified as a one-to-one, a one-to-many, and a many-to-many cases as well as some abnormal cases. In order to encourage development of Korean to Mongolian machine translation system, this paper would introduce one of the significant units in grammar.

  • PDF

A Design of Korean Language Parsing based on Subcategorization (하위범주화에 의한 한국어 파싱 설계)

  • Lee, Ho-Suk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.242-247
    • /
    • 2008
  • This paper discusses a design for Korean language parsing based on subcategorization. First, we discuss some important Korean grammar elements such as syntax category, josa, omi-conjugation, syntactic affix, dependent noun and also discuss subcategorization and expression patterns. Then, we show the basic structure of Korean language parsing process. The first stage scans the input sentence and processes article, noun phrase, numeral, josa, affix, dependent noun, adjective, omi-conjugation, adverb, auxiliary verb. The second stage deals with subcategorization patterns and expression patterns. The third stage processes the clauses and the fourth stage deals with SEA(Sentence Ending+Auxiliary).

  • PDF

Plan-based Ellipsis Resolution for Utterances in Noun-Phrase-Form in Restricted Domain Dialogues (제한된 영역의 대화에서 체언구 형태의 발화 이해를 위한 계획기반 생략 처리)

  • 윤철진;서정연
    • Korean Journal of Cognitive Science
    • /
    • v.11 no.1
    • /
    • pp.81-92
    • /
    • 2000
  • Elliptical fragments are common in natural language dialogues between humans. Since most elliptical fragments should be interpeted within the context. it is not easy for computers to recognize the speaker's intention from the elliptical fragments. In t this paper we propose a model to recognize speaker's intention from elliptical fragments 1 in Korean by expanding the tripartite plan-based model proposed by Lambert. We add new discourse recipes to define user's discourse actions through elliptical fragments. In order to use plan inference process. we must represent utterances as actions. e. g .. r e elliptical fragments are represented as surface speech acts. In surface speech act representation. we include the information of 'Josa' (case markers in Korean), because t the information of 'Josa' plays a very important role in analysing speakers' intention in Korean. Finally. by using an object and discourse focus theory, the system can recognize the intention that a user is trying to compare between two plans by uttering elliptical fragments

  • PDF

The Study of Josa Dictionary Construction for Korean-English Machine Translation (한영 기계 번역을 위한 조사 사전 구성에 관한 연구)

  • Choi, Jae-Hyuk;Kim, Kweon-Yang;Park, Sang-Gyu;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.219-224
    • /
    • 1989
  • 본 연구는 한영 기계 번역을 위한 사전 중에서 한국어 조사 사전에 대한 모델을 제시하였다. 특히 정확한 역어 선택을 위한 제약정보를 수집하는데 중점을 두었다. 지금까지의 한국어 조사에 대한 역어 선택 방법은 체언의 속성 정보에 의한 역어 선택과 default 역어의 선택이었다. 그러나 한국어의 한 조사에 대응하는 영어의 전치사의 수가 너무 많음으로 인하여 이러한 기존의 방법을 사용할 경우 고질의 변역은 기대할 수 없다. 따라서 본 논문에서는 정확한 역어의 선택을 위하여 조사의 격 분류와 체언의 속성 정보를 더욱 세분화 시키고, 이를 이용한 용언의 기본 구문 패턴을 재정립하였다. 또한 한 두개의 default 역어로 인한 번역의 부 정확성을 탈피하기 위하여 default 역어 및 체언의 속성 정보에 의한 역어를 용언의 의미적 분류에 의해 더욱 세분화시킴으로써 정확한 역어를 선택하는 방법을 제시하였다.

  • PDF

Automatic Word Spacing for Korean Using CRFs with Korean Features (한국어 특성과 CRFs를 이용한 자동 띄어쓰기 시스템)

  • Lee, Hyun-Woo;Cha, Jeong-Won
    • MALSORI
    • /
    • no.65
    • /
    • pp.125-141
    • /
    • 2008
  • In this work, we propose an automatic word spacing system for Korean using conditional random fields (CRFs) with Korean features. We map a word spacing problem into a classification problem in our work. We build a basic system which uses CRFs and Eumjeol bigram. After then, we analyze the result of inner-test. We extend a basic system added by some Korean features which are Josa, Eomi and two head Eumjeols of word extracting from lexicon. From the results of experiment, we can see that the proposed method is better than previous methods. Additionally the proposed method will be able to use mobile and speech applications because of very small size of model.

  • PDF

A Trainable Hangul Josa (particle) Generation Method for English Words (학습가능한 영어단어의 한글조사 생성방법)

  • Lee, Jae-Sung;Lee, Woon-Jae;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.31-35
    • /
    • 1998
  • 한국어에서 많이 사용되는 조사는 앞 명사의 종성에 따라 그 형태가 다르게 표기된다. 그런데 앞의 단어가 한글이 아닌 영어나 특수기호 등일 경우, 그 단어의 종성을 알아내는 일은 단순하지 않다. 본 논문에서는 영어가 명사로 쓰였을 경우, 그 단어 종성의 종류를 파악하여 적합한 형태의 조사를 자동으로 붙이는 방법을 제안하고, 실험한다. 제안된 방법은 기본적으로 결정트리(decision tree)와 같은 방법으로 영어 단어의 뒷글자부터 차례로 결정의 단서로 사용하였고, 분야에 맞도록 학습가능하다. 1,500단어로 학습한 후, 미학습 데이터에 대해 실험한 결과, 약 96%의 정확도를 보였고, 학습 데이터가 많아지면 정확도가 더 증가할 것으로 보인다.

  • PDF

A Josa-Errors Detection and Correction from Korea-English Mixed Sentences (한.영 혼용 문에서 조사오류 검출 및 교정)

  • Jung, Kyu-Chol;Jung, Min-Su;Cho, Won-Hong
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.36-40
    • /
    • 1998
  • 전문 분야의 세분화로 인한 신조어 발생이 늘어나고 있다. 또한, 이러한 단어를 우리말로 표현이 불가능한 경우 우리 발음으로 풀어 기록하지 않고 그대로 적는 경우도 늘어나고 있는 추세이다. 특히 전문 서적일수록 두드러진다. 그러나 한글과 영어를 혼용하여 기록할 경우 부적절한 조사의 쓰임으로 인하여 매끄럽지 못함을 가끔 볼 수 있다. 본 논문에서는 영단어의 발음특성정보를 이용하여 한글 조사의 오류를 정확하게 검출하고 교정을 할 수 있다.

  • PDF

Part-Of-Speech Tagging System Using Grammatical Function of Josa & Eomi (조사와 어미의 문법 기능을 활용한 품사 태깅 시스템)

  • An, Young-Min;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.97-100
    • /
    • 2001
  • 본 논문은 규칙과 통계 정보를 모두 적용하는 혼합형 품사 태깅 시스템에서 통계 정보를 이용하여 품사 태깅을 수행할 때 조사와 어미를 문법 기능에 따라 구분하여 사용하는 품사 태깅 시스템을 기술한파. 품사 태깅은 주로 주변의 품사열을 이용하게 되는데 품사 정보를 추출할 때 조사와 어미의 문법 기능인 조사의 격 정보와 어미의 활용형 정보에 따라 몇 가지로 분류하고 정보를 추출하여 품사 태깅에 적용하면 조사와 어미를 분류하지 않은 품사열 만을 사용한 태깅 방법 보다 더 나은 성능을 얻을 수 있다.

  • PDF