• Title/Summary/Keyword: English Word

Search Result 576, Processing Time 0.024 seconds

A hierarchical Korean Word-order Generation in English-Korean Machine Translation (영한기계번역에서 계층적 한국어 어순 생성)

  • 서진원;이신원;정성종;안동언
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.303-308
    • /
    • 2000
  • 본 논문에서는 영한기계번역 시스템에서 한국어 문장을 생성할 때 올바른 한국어 어순 규칙을 제안한다. 한국어 생성은 영한기계번역의 최종 단계로서 이전단계에서 얻어진 정보를 가지고 목적 언어인 한국어 문장을 만드는 곳이다. 본 논문에서 제안하는 계층적 어순 생성 규칙은 한국어 의존구조를 기본으로 하며 규칙 적용은 4가지 함수를 단계적으로 적용시킨다. 인터넷의 발들은 언어 장벽이라는 새로운 문제를 부각시켰으며 이를 위해서 기계번역은 활발히 연구가 진행되고 있는 분야이다. 한국어 문장에 대하 올바른 어순 생성 규칙은 번역 결과의 품질을 증가시키며, 기계 번역뿐만 아니라 한국어 생성을 필요로 하는 모든 시스템에 적용할 수 있다.

  • PDF

Global Feature Analysis in On-Line Unconstrained Handwritten English Word Recognition (온라인 무제약 영어 필기 단어 인식을 위한 전역적 특성 분석)

  • 김재륜;하진영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.393-395
    • /
    • 1998
  • 온라인 문자인식에 대한 연구는 지난 30여년에 걸쳐 수행되었지만, 무제약 필기 단어 인식에 대한 연구는 활성화 된지가 오래되지 않은 실정이다. 필기자에 따른 다양한 서체의 변이와 방대한 탐색공간, 그리고 PDA(personal digital assistant)등의 제약된 계산 능력으로 인해 학문적으로는 좋은 연구결과가 나오고 있지만 실용화에는 아직도 해결해야 할 문제가 많다. 대부분의 온라인 문자 인식 시스템에서는 인식 시스템에서는 인식 시스템 자체의 성능만으로는 인식 성능의 한계가 있기 때문에 여러 가지 외부 지식을 사용한다. 그 중 대표적인 것이 단어 사전을 이용하는 것인데, 단어 사전의 크기를 미리 줄일 수 있다면 인식기의 성능이 좋아질 수 있다. 본 연구에서는 온라인 무제약 영어 필기 단어 인식을 위한 필기 데이터의 전역적 특성을 분석하고, 각각의 특성에 따른 사전 감축 비율과 오류에 대해 연구하고자 한다.

  • PDF

Gradient Reduction of $C_1$ in /pk/ Sequences

  • Son, Min-Jung
    • Speech Sciences
    • /
    • v.15 no.4
    • /
    • pp.43-60
    • /
    • 2008
  • Instrumental studies (e.g., aerodynamic, EPG, and EMMA) have shown that the first of two stops in sequence can be articulatorily reduced in time and space sometimes; either gradient or categorical. The current EMMA study aims to examine possible factors_linguistic (e.g., speech rate, word boundary, and prosodic boundary) and paralinguistic (e.g., natural context and repetition)_to induce gradient reduction of $C_1$ in /pk/ cluster sequences. EMMA data are collected from five Seoul-Korean speakers. The results show that gradient reduction of lip aperture seldom occurs, being quite restricted both in speaker frequency and in token frequency. The results also suggest that the place assimilation is not a lexical process, implying that speakers have not fully developed this process to be phonologized in the abstract level.

  • PDF

New Interpretation on Intensification (된소리 현상의 새 분석)

  • Lee Mi-Jae
    • MALSORI
    • /
    • no.25_26
    • /
    • pp.27-37
    • /
    • 1993
  • This paper deals with the nature and function of intensification in Korean in a wider scope of context which was not paid proper attention. Unobserved new areas of intensification are paid more attention like sound split of polysemy e.g. [s'eda], [kyongk'i] by n of intensification and north Korean application of intensification on [wonsu] and intensification of borrowed English. The recent phenomenon of 'gwua' intensification is experimented on two groups of people, young students and old people beyond 65 years old by means of sociolinguistic analysis. The result shows that its intensification is a form of student violent power and a mark of extreme solidarity among activist students. In conclusion, the nature of so called saisiot[t] e.g. intensification is voiceless tensed pause and its functions are the polarization of the original meaning of the word, sound split of polysemy and attachment of social values by intensification.

  • PDF

A Study of the 1668 Deungrok, Records of Celestial Phenomena from the Joseon Dynasty

  • Nha, Il-Seong;Hong, Yoon;Ahn, Na-Mi
    • Journal of Astronomy and Space Sciences
    • /
    • v.29 no.2
    • /
    • pp.209-220
    • /
    • 2012
  • This paper will introduce and overview in general the $Seongbyeon$ $Deungrok$ issued by the Gwansang-gam, the Astronomical Board in the Joseon Dynasty of Korea. All the Chinese characters in the 1668 $Seongbyeon$ $Deungrok$ was deciphered at first and these were translated into Korean and English. With these translations and the word 'white vapor' in particular we discuss the nature of the main object in this $Deungrok$. Lastly, names of observers who engaged in the observations of this 1668 celestial, which are made as a by-product of this research, are introduced.

Effects of Word Recall on English Vocabulary Learning (단어회상이 영어어휘 학습에 미치는 영향)

  • Baik, Yeonji;Choi, Jiyoun;Chung, Taewon;Nam, Kichun
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.247-250
    • /
    • 2009
  • 본 실험에서는 단어회상이 영어어휘 학습에 미치는 영향을 살펴보기 위해 160개 단어 쌍에 대해 어휘학습을 실시하였다. 세 종류의 어휘 학습 방법(교대학습, 반복검사, 반복학습)을 채택하여 학습을 실시하였으며 학습 1주일 후 160개 단어 쌍에 대해 지연회상검사를 실행하였다. 그 결과 세 종류의 어휘 학습 방법 중 단어회상을 강조한 두 개의 어휘 학습 방법에서 그렇지 않은 조건에 비해 유의미하게 좋은 지연회상률을 보였다. 또한 실험 참가자를 대상으로 선호하는 학습 방법에 대해 설문조사를 실시한 결과 63.5%의 설문 응답자가 한 번 학습한 것에 대해 스스로 시행하는 회상 검사를 선호하였다. 그러나 자가검증을 통한 회상 검사 자체가 효과적인 학습 방법이라고는 생각하지 않는 것으로 나타났다.

  • PDF

A Postprocessing method for Statistical English-Korean Word Alignment Reflecting Alignment Tendency Between Parts-of-Speeches (품사간 정렬 경향을 반영한 통계 기반 영한 단어 정렬 후처리 방법)

  • Lee, Jae-Hee;Lee, Seung-Wook;Hwang, Young-Sook;Kim, Sang-Bum;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.242-246
    • /
    • 2009
  • 병렬 말뭉치 내에서 서로 대응되는 단어를 찾아내는 단어 정렬 작업은 기계 번역에서 가장 기본적으로 수행되는 작업이고 다양한 분야에서 유용하게 사용된다. 본 논문에서는 영한 단어 정렬에서 기존의 통계 기반 정렬 모델의 문제점을 파악하고 이를 해결하기 위해 영한의 품사간 정렬 경향을 단어 정렬에 반영하는 방법을 제안한다. 실험을 통해서 기존 통계 기반 영한 단어 정렬 결과와 비교하여 제안된 방법이 정확률, 재현율, F-measure 측면에서 모두 향상시키는 것을 보였다.

  • PDF

A Hidden Markov Model Imbedding Multiword Units for Part-of-Speech Tagging

  • Kim, Jae-Hoon;Jungyun Seo
    • Journal of Electrical Engineering and information Science
    • /
    • v.2 no.6
    • /
    • pp.7-13
    • /
    • 1997
  • Morphological Analysis of Korean has known to be a very complicated problem. Especially, the degree of part-of-speech(POS) ambiguity is much higher than English. Many researchers have tried to use a hidden Markov model(HMM) to solve the POS tagging problem and showed arround 95% correctness ratio. However, the lack of lexical information involves a hidden Markov model for POS tagging in lots of difficulties in improving the performance. To alleviate the burden, this paper proposes a method for combining multiword units, which are types of lexical information, into a hidden Markov model for POS tagging. This paper also proposes a method for extracting multiword units from POS tagged corpus. In this paper, a multiword unit is defined as a unit which consists of more than one word. We found that these multiword units are the major source of POS tagging errors. Our experiment shows that the error reduction rate of the proposed method is about 13%.

  • PDF

The Basic Study on making mono-phone for Korean Speech Recognition (한국어 음성 인식을 위한 mono-phone 구성의 기초 연구)

  • Hwang YoungSoo;Song Minsuck
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.45-48
    • /
    • 2000
  • In the case of making large vocabulary speech recognition system, it is better to use the segment than the syllable or the word as the recognition unit. In this paper, we study on the basis of making mono-phone for Korean speech recognition. For experiments, we use the speech toolkit of OGI in U.S.A. The result shows that the recognition rate of :he case in which the diphthong is established as a single unit is superior to that of the case in which the diphthong is established as two units, i.e. a glide plus a vowel. And also, the recognition rate by the number of consonants is a little different.

  • PDF

A Hierarchical Korean Word-order Generation in English-Korean Machine Translation (영한기계번역에서 계층적 한국어 어순 생성)

  • Seo, Jin-Won;Lee, Shin-Won;Chung, Sung-Jong;An, Dong-Un
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.303-308
    • /
    • 2000
  • 본 논문에서는 영한기계번역 시스템에서 한국어 문장을 생성할 때 올바른 한국어 어순 규칙을 제안한다. 한국어 생성은 영한기계번역의 최종 단계로서 이전단계에서 얻어진 정보를 가지고 목적 언어인 한국어 문장을 만드는 곳이다. 본 논문에서 제안하는 계층적 어순 생성 규칙은 한국어 의존구조를 기본으로 하며 규칙 적용은 4가지 함수를 단계적으로 적용시킨다. 인터넷의 발달은 언어 장벽이라는 새로운 문제를 부각시켰으며 이를 위해서 기계번역은 활발히 연구가 진행되고 있는 분야이다. 한국어 문장에 대한 올바른 어순 생성 규칙은 번역 결과의 품질을 증가시키며, 기계 번역뿐만 아니라 한국어 생성을 필요로 하는 모든 시스템에 적용할 수 있다.

  • PDF