• Title/Summary/Keyword: 영어어휘

Search Result 201, Processing Time 0.025 seconds

Automatic WordNet mapping using word sense disambiguation (의미 애매성 해소를 이용한 WordNet 자동 매핑)

  • 이창기;이근배
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.262-268
    • /
    • 2000
  • 본 논문에서는 어휘 의미 애매성 해소와 영어 대역어 사전 그리고 외국언어에 존재하는 개념체계를 이용하여 한국어 개념체계를 자동으로 구축하는 방법을 기술한다. 본 논문에서 사용하는 방법은 기존의 개념체계 구축 방법들에 비해 적은 노력과 시간을 필요로 한다. 또한 상기한 자동 구축 방법에서 사용하는 어휘 의미 애매성 해소를 위한 6가지 feature도 함께 설명한다.

  • PDF

Identifying Sentiment Polarity of Korean Vocabulary Using PMI (PMI를 이용한 우리말 어휘의 의미 극성 판단)

  • Song, Sang-Il;Lee, Dong-Joo;Lee, Sang-Goo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.260-265
    • /
    • 2010
  • 웹 2.0시대의 도래에 따라 많은 소비자들은 상품에 대한 다양한 의견을 표현할 수 있게 되었다. 이러한 의견들을 활용하여 상품평 요약 시스템 등이 개발되었다. 어휘의 의미 극성은 이러한 시스템에서 활용될 여지가 많은 요소이다. 영어의 경우 어휘의 의미 극성을 판단하는 연구가 많이 진행되어 어느 정도 결실을 맺었지만, 우리말의 경우 어휘의 의미 극성을 판단하는 연구는 아직 미흡하다. 본 논문에서는 우리말 어휘의 의미 극성을 PMI를 사용하여 판단한다. 또한 PMI를 우리말 어휘에 적용할 때 문제가 되는 이슈를 살펴보고 이에 대한 해결 방법들을 제시한다. 나아가 실제 상품 평에서 많이 쓰이는 형용사에 대하여, 제시한 의미 극성 판단 방법의 성능을 검증해 본다. 제시한 방법은 어휘의 의미 극성을 81%의 정확도로 판단해 주었다.

  • PDF

Automatic Recognition of Korean Broadcast News Using Flexible Vocabulary Recognition Models (가변 어휘 인식 모델을 이용한 한국어 방송 뉴스 음성의 인식)

  • 유하진
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.70-73
    • /
    • 1998
  • 본 논문에서는 한국어 방송 뉴스 인식 시스템에 관하여 기술한다. 인식 실험 과정에서는 실제로 방송된 음성을 인식하였으나, 인식을 위한 음향 모델은 본 연구소에서 갭라한 고립단어 인식용 가변 어휘 인식모델을 이용하였다. 가변 어휘 인식기는 방송 음성의 연속 문장을 이용하지 않고, 음향학적으로 고르게 분포된 고립 단어를 이용하여 학습되었다. 본 연구에서는 한국어의 특성상 문장이 영어권과 같이 단어 단위가 아닌 어절로 나누어 지는 점을 고려하여, 다양한 형태의 사전 표제어를 대상으로 실험하였다. 또한 탐색과정의 초기단계에 장거리 언어모델을 사용함으로써 인식 오류를 줄일 수 있었다.

  • PDF

Lexical Access in the Bilinguals and the Category-specific Semantic System (이중언어의 어휘접근과 범주 특수적 의미체계)

  • Lee, Seung-Bok;Jung, Hyo-Sun;Jo, Seong-Woo
    • Korean Journal of Cognitive Science
    • /
    • v.21 no.4
    • /
    • pp.505-534
    • /
    • 2010
  • The purpose of this study was aimed to compare the lexical access and representation of semantic system in the bilinguals. The participants(late Korean-English bilinguals) performed the word-picture matching task. The task was to decide whether the pictures presented after the words(basic-level categories) represent the Korean(L1) or English(L2) words' meaning or not. The stimuli were consisted of common object belonged to four different categories(animal, part of body, clothes, tool). To control the translation strategies, the SOA(stimulus onset asynchrony) were manipulated as 650ms(Exp. 1) and 200ms(Exp. 2). In both experiment, the RTs were faster in L1 condition. The decision time of the part of body categories were shorter than the animal in L1 condition. In L2 condition, clothes were responded faster than the tools. The differences of the lexical access time implied that the bilingual semantic system seemed to be structured by more sub-level categories than the super-level, living or non-living things, and the ways to access the bilingual lexicon might be differentiated according to the languages.

  • PDF

A Model of English Part-Of-Speech Determination for English-Korean Machine Translation (영한 기계번역에서의 영어 품사결정 모델)

  • Kim, Sung-Dong;Park, Sung-Hoon
    • Journal of Intelligence and Information Systems
    • /
    • v.15 no.3
    • /
    • pp.53-65
    • /
    • 2009
  • The part-of-speech determination is necessary for resolving the part-of-speech ambiguity in English-Korean machine translation. The part-of-speech ambiguity causes high parsing complexity and makes the accurate translation difficult. In order to solve the problem, the resolution of the part-of-speech ambiguity must be performed after the lexical analysis and before the parsing. This paper proposes the CatAmRes model, which resolves the part-of-speech ambiguity, and compares the performance with that of other part-of-speech tagging methods. CatAmRes model determines the part-of-speech using the probability distribution from Bayesian network training and the statistical information, which are based on the Penn Treebank corpus. The proposed CatAmRes model consists of Calculator and POSDeterminer. Calculator calculates the degree of appropriateness of the partof-speech, and POSDeterminer determines the part-of-speech of the word based on the calculated values. In the experiment, we measure the performance using sentences from WSJ, Brown, IBM corpus.

  • PDF

A Study on the Automatic Lexical Acquisition for Multi-lingustic Speech Recognition (다국어 음성 인식을 위한 자동 어휘모델의 생성에 대한 연구)

  • 지원우;윤춘덕;김우성;김석동
    • The Journal of the Acoustical Society of Korea
    • /
    • v.22 no.6
    • /
    • pp.434-442
    • /
    • 2003
  • Software internationalization, the process of making software easier to localize for specific languages, has deep implications when applied to speech technology, where the goal of the task lies in the very essence of the particular language. A greatdeal of work and fine-tuning has gone into language processing software based on ASCII or a single language, say English, thus making a port to different languages difficult. The inherent identity of a language manifests itself in its lexicon, where its character set, phoneme set, pronunciation rules are revealed. We propose a decomposition of the lexicon building process, into four discrete and sequential steps. For preprocessing to build a lexical model, we translate from specific language code to unicode. (step 1) Transliterating code points from Unicode. (step 2) Phonetically standardizing rules. (step 3) Implementing grapheme to phoneme rules. (step 4) Implementing phonological processes.

A Compilation of Maritime English Corpus for English for Specific Purposes Education (특수목적영어 교육을 위한 해사영어코퍼스 구축)

  • Lee, Sung-Min;Kim, Jae-Hoon;Jhang, Se-Eun
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.163-164
    • /
    • 2015
  • 본 연구는 특수목적영어분인 해사영어코퍼스의 구축을 목적으로 한다. 구축과정에서 코퍼스 구축에 필요한 대표성과 균형성을 고려하여 네 가지 장르인 학술, 뉴스, 법, 책으로 나누고 각 하위코퍼스를 백만 단어씩 구축하였다. 코퍼스 구축과정에서 웹사이트와 PDF형태의 자료에서 텍스트만을 수집하고 정제하기 위하여 파이썬(Python) 프로그래밍 코딩을 하였고 무료 공개 프로그램도 병행하였다. 앞으로 해사영어코퍼스는 해사영어어휘교육에 필요한 단어목록제공이나 예문 검색 등을 통한 자료중심학습법에 활용될 수 있을 것이다. 또한 본 연구의 코퍼스구축 과정은 다른 분야의 ESP코퍼스 구축에도 응용 될 수 있을 것이다.

  • PDF

A System for Learning English Words Using Relations between Words (단어간의 관계를 이용한 영어 단어 학습 시스템)

  • Siyeong Bae;Sangchul Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.1154-1157
    • /
    • 2008
  • 오늘날은 실용성 있는 생활 영어교육이 절실히 필요한 시대로서 영어 교육은 무엇보다도 의사소통 능력 개발에 중점을 두고 있다. 영어 학습을 시작하는 초기 학습자 단계에서 가장 우선적으로 직면하게 되는 것이 바로 어휘 학습이다. 기존 영어 단어 학습 시스템은 학습자에게 지나치게 많은 단어들을 단순한 방법을 통해서 학습하게 함으로써 심리적 부담을 주고 있다. 심리언어학에서는 언어 이해의 과정이 단순히 제시된 것을 그대로 받아들이는 수용의 과정이 아니라 학습자가 이미 보유한 경험과 개념을 근거로 활성망의 확산을 통해 적절한 관계를 찾는 역동적·능동적 과정이라는 이론이 있다. 본 논문에서는 언어 학습 이론을 바탕으로 단어들 사이의 관계를 부각시킴으로써 추론과 기억에 도움을 주는 영어 단어 학습 시스템을 제안한다. 본 시스템은 단어들 간의 관계를 정의한 단어 관계 망을 중심으로 단어 학습 순서를 결정할 수 있고, 이미지 및 게임 기능을 지원하여 단어학습의 흥미를 유발하는 특징이 있다. 본 학습시스템을 실제 단어 학습에 적용해 본 결과 학습자들의 만족도가 높았다.

Improving Clustered Sense Labels for Word Sense Disambiguation (단어 의미 모호성 해소를 위한 군집화된 의미 어휘의 품질 향상)

  • Jeongyeon Park;Hyeong Jin Shin;Jae Sung Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.268-271
    • /
    • 2022
  • 단어 의미 모호성 해소는 동형이의어의 의미를 문맥에 맞게 결정하는 일이다. 최근 연구에서는 희소 데이터 처리를 위해 시소러스를 사용해 의미 어휘를 압축하고 사용하는 방법이 좋은 성능을 보였다[1]. 본 연구에서는 시소러스 없이 군집화 알고리즘으로 의미 어휘를 압축하는 방법의 성능 향상을 위해 두 가지 방법을 제안한다. 첫째, 의미적으로 유사한 의미 어휘 집합인 범주(category) 정보를 군집화를 위한 초기 군집 생성에 사용한다. 둘째, 다양하고 많은 문맥 정보를 학습해 만들어진 품질 좋은 벡터를 군집화에 사용한다. 영어데이터인 SemCor 데이터를 학습하고 Senseval, Semeval 5개 데이터로 평가한 결과, 제안한 방법의 평균 성능이 기존 연구보다 1.5%p 높은 F1 70.6%를 달성했다.

  • PDF

The Processing System of English for Korean: Focused on the Interaction with Native Language Processing (한국인의 영어처리의 기제: 모국어처리와의 상호작용을 중심으로)

  • 이창환;강봉경
    • Korean Journal of Cognitive Science
    • /
    • v.15 no.2
    • /
    • pp.43-53
    • /
    • 2004
  • The purpose of this study was to investigate the role of phonology in lexical access of bilingual processing for Korean-English bilinguals. Four experiments have been conducted in order to adjudicate the nonselective lexical access hypothesis, which argues simultaneous phonological activation of two bilingual languages, and the selective lexical access hypothesis. which argues phonological activation of only one bilingual language. The results showed that the Korean target word processing was significantly affected by the phonological manipulation of the English target word(Exp. 2). Similarly, the English target word processing showed the tendencies that it is affected by the phonological manipulation of the Korean prime word(Exp. 2). This results indicates that the phonological information of another bilingual language is automatically activated when we process one of bilingual languages, and the process of English which is the second language for most Korean, is phonologically activated.

  • PDF