• Title/Summary/Keyword: 단어

Search Result 3,781, Processing Time 0.031 seconds

English visual word recognition of Korean: lexical access and word length effect (한국인의 영어단어 재인과정:어휘접근과 단어길이효과)

  • 이윤형;최원일;정유진;남기춘
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.05a
    • /
    • pp.279-284
    • /
    • 2000
  • 시각적으로 제시된 영어 단어 재인시에 주로 단어빈도와 단어길이가 영향을 준다고 알려져 있다. 그러나, 단어빈도와 관련된 연구는 체계적으로 이루어져 왔지만 단어길이와 관련된 연구는 체계적으로 이루어지지 않은 편이다. 또한, 단어빈도와 단이길이에 따라 단어가 성 어휘집(mental lexicon)에 어떻게 표상되어 있으며, 상호간에 어떠한 관계가 있는 것인지에 대해서는 아직 구체적으로 알려져 있지 않다. 본 연구의 목적은 첫째, 단어길이와 빈도가 시각적으로 제시된 영어단어 어휘접근에 어떠한 영향을 미치는지 알아보아 단어길이효과가 어휘접근단계에서 영향을 미치는지 알아보고자 하며 둘째, 단어길이와 빈도가 미국인과 한국인의 어휘접근시 어떤 차이를 보이는지 알아보아 한국인과 미국인의 영어단어 정보처리의 차이를 살펴보고자 하는 것이다. 단어 명명과제와 어휘판단과제를 사용한 실험결과 한국인과 미국인에게 모두 단어 길이와 빈도가 어휘접근에 영향을 주었다. 그러나, 한국인의 경우는 상대적으로 어휘판단과제에서 보다는 단어명명과제에서 어려움을 겪는다는 결과를 보여주었다. 이와 같은 결과를 볼 때 한국인이 영어단어 어휘에 접근할 때에도 미국인과 유사한 방식으로 처리를 하는 것으로 보인다. 그러나, 한국인의 경우는 미국인보다 조음과정에 상대적으로 더 어려움을 느끼는 것으로 보이며, 이것은 영어교육시 단순한 어휘암기보다 음운부호를 산출하고 단어를 말하는 능력을 향상시키는 방법을 좀 더 강조해야 한다는 것을 시사한다.

  • PDF

Word Sense Disambiguation Using Word Link and Word Cooccurrence (단어링크와 공기 단어를 이용한 의미중의성 해소)

  • 구영석;나동렬
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2002.05a
    • /
    • pp.21-27
    • /
    • 2002
  • 본 논문은 문장 안에서 의미 중의성을 갖는 단어가 출현했을 때 그 단어가 어떤 의미로 사용되고 있는지 판별해 주는 방법을 제시하고자 한다. 이를 위해서 먼저 중의적 의미를 가지는 단어의 각 의미 (sense) 마다에 대하여 이 의미를 나타내는 주요단어 즉 종자단어와 연관성이 있는 단어들로 벡터를 구성하여 이 의미를 나타내고자 한다. 종자단어와 말뭉치의 문장을 통하여 연결된 경로를 가진 단어는 이 종자단어에 해당하는 의미를 나타내는 데 기여하는 정보로 본 것이다. 경로는 동일 문장에서 나타나는 두 단어 사이는 링크가 있다고 보고 이러한 링크를 통하여 이루어 질 수 있는 연결 관계를 나타낸다. 이 기법의 장점은 데이터 부족으로 야기되는 문제를 경감시킬 수 있다는 점이다. 실험을 위해 Hantec 품사 부착된 말뭉치를 이용하여 의미정보벡터를 구축하였으며 ETRI 품사 부착된 말뭉치에서 중의적 단어가 포함된 문장을 추출하여 실시하였다. 실험 결과 기존의 방법보다 나은 성능을 보임이 밝혀졌다.

  • PDF

A Word Embedding used Word Sense and Feature Mirror Model (단어 의미와 자질 거울 모델을 이용한 단어 임베딩)

  • Lee, JuSang;Shin, JoonChoul;Ock, CheolYoung
    • KIISE Transactions on Computing Practices
    • /
    • v.23 no.4
    • /
    • pp.226-231
    • /
    • 2017
  • Word representation, an important area in natural language processing(NLP) used machine learning, is a method that represents a word not by text but by distinguishable symbol. Existing word embedding employed a large number of corpora to ensure that words are positioned nearby within text. However corpus-based word embedding needs several corpora because of the frequency of word occurrence and increased number of words. In this paper word embedding is done using dictionary definitions and semantic relationship information(hypernyms and antonyms). Words are trained using the feature mirror model(FMM), a modified Skip-Gram(Word2Vec). Sense similar words have similar vector. Furthermore, it was possible to distinguish vectors of antonym words.

Extracting Collocations Using Entropy in Korean (엔트로피를 이용한 한국어 연어 추출)

  • 박경미;송만석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.451-453
    • /
    • 2002
  • 연어는 습관적으로 같이 자주 나타나는 단어열로 각 단어로 분리하기보다 통합해 처리하는 것이 효율적이기 때문에 기계 번역과 음성 인식등에서 유용만 정보로 사용된다. 이러한 연어를 추출하기 위해 본 논문에서는 2가지 경우를 고려했는데, 첫 번째로 인어를 말뭉치에 자주 나타나는 단어열이라고 했을 때 단어열들의 엔트로피가 일정값 이상이면 연어로 추출했다 두 번째로 통사적 제약이 있는 연어를 주술하기 위해 앞 또는 뒤에 올 단어를 제약하는 단어의 엔트로피를 구해 일정값 미만이면 그 단어를 포함한 단어열을 연어로 추출했다. 실험은 품사 부착된 HANTCE 말뭉치를 가지고 수행했고, 젓 번째 방법으로 실험했을 때 엔드로피가 2이상인 단어열을 가지고 분리된 연어도 유도해냈다.

  • PDF

The exploration of the effects of word frequency and word length on Korean word recognition (한국어 단어재인에 있어서 빈도와 길이 효과 탐색)

  • Lee, Changhwan;Lee, Yoonhyoung;Kim, Tae Hoon
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.17 no.1
    • /
    • pp.54-61
    • /
    • 2016
  • Because a word is the basic unit of language processing, studies of the word recognition processing and the variables that contribute to word recognition processing are very important. Word frequency and word length are recognized as important factors on word recognition. This study examined the effects of those two variables on the Korean word recognition processing. In Experiment 1, two types of Hangul words, pure Hangul words and Hangul words with Hanja counterparts, were used to explore the frequency effects. A frequency effect was not observed for Hangul words with Hanja counterparts. In Experiment 2, the word length was manipulated to determine if the word length effect appears in Hangul words. Contrary to the expectation, one syllable words were processed more slowly than two syllable words. The possible explanations for these results and future research directions are discussed.

Effects of Orthographic Knowledge and Phonological Awareness on Visual Word Decoding and Encoding in Children Aged 5-8 Years (5~8세 아동의 철자지식과 음운인식이 시각적 단어 해독과 부호화에 미치는 영향)

  • Na, Ye-Ju;Ha, Ji-Wan
    • Journal of Digital Convergence
    • /
    • v.14 no.6
    • /
    • pp.535-546
    • /
    • 2016
  • This study examined the relation among orthographic knowledge, phonological awareness, and visual word decoding and encoding abilities. Children aged 5 to 8 years took letter knowledge test, phoneme-grapheme correspondence test, orthographic representation test(regular word and irregular word representation), phonological awareness test(word, syllable and phoneme awareness), word decoding test(regular word and irregular word reading) and word encoding test(regular word and irregular word dictation). The performances of all tasks were significantly different among groups, and there were positive correlations among the tasks. In the word decoding and encoding tests, the variables with the most predictive power were the letter knowledge ability and the orthographic representation ability. It was found that orthographic knowledge more influenced visual word decoding and encoding skills than phonological awareness at these ages.

A Study on the Familiarity and Appropriateness of Korean Interpersonal Words (한국어 대인관계 단어의 친숙성과 적절성에 관한 연구)

  • Jang, Hyejin;Kim, Youngkeun
    • Science of Emotion and Sensibility
    • /
    • v.24 no.3
    • /
    • pp.91-114
    • /
    • 2021
  • The first step of this study is to collect appropriate words from the list of words in the relationship. All vocabularies that are unfamiliar-but capable of guessing the meaning and expressing interpersonal relationships-were collected from three Korean dictionaries. Consequently, a compilation of 2,725 words was created; overlapping words were selected; and 910 words were chosen. Only grammatical forms were found; however, words with similar meanings-or identical meanings-were also found, and a reclassification process was required to reflect this. These procedures were repeated seven times, resulting in a total of 249 words being screened. However, due to the characteristics of this study, the number of words needs to be reduced because the meaning of words is more specific and summarized, and the overall interpersonal aspect is well expressed. Therefore, the process of reclassifying 249 words by their familiarity and appropriateness was subsequently undertaken, and the word with the highest level of familiarity and appropriateness was finally selected.

Performance Improvement of Vocabulary Independent Speech Recognizer using Back-Off Method on Subword Model (음소 모델의 Back-Off 기법을 이용한 어휘독립 음성인식기의 성능개선)

  • Koo Dong-Ook;choi Joon Ju;Oh Yung-Hwan
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.19-22
    • /
    • 2000
  • 어휘독립 음성인식이란 음향학적 모델 훈련에 사용하지 않은 어휘들을 인식하는 것이다. 단어모델을 이용한 어휘독립 음성인식 시스템은 발음표기로 변환된 인식대상어휘에 대하여 문맥 종속형 부단어(context dependent subword) 단위로 훈련된 모델을 연결하여 단어 모델을 만들고 이 단어 모델로 인식을 수행한다. 이러한 시스템의 경우 훈련과정에서 나타나지 않는 문맥 종속형 부단어가 인식대상어휘에서 나타나게 되고, 따라서 정확한 단어모델을 구성할 수 없다는 문제점이 있다 본 논문에서는 문맥 종속형 부단어 구분의 계층화를 통한 back-off 선택 방법을 이용하여 새롭게 나타난 문맥 종속형 부단어 대신 연결될 부단어 모델을 찾아내는 방법을 제안한다 제안된 선택 방법은 새롭게 나타난 문맥 종속형 부단어를 포함하는 상위의 부단어를 찾아내는 방법이다. 실험 결과 10단어 세트에서 $97.5\%$ 50단어 세트에서$90.16\%$ 100 단어 세트에서 $82.08\%$의 인식률을 얻었다.

  • PDF

A System for Learning English Words Using Relations between Words (단어간의 관계를 이용한 영어 단어 학습 시스템)

  • Siyeong Bae;Sangchul Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.1154-1157
    • /
    • 2008
  • 오늘날은 실용성 있는 생활 영어교육이 절실히 필요한 시대로서 영어 교육은 무엇보다도 의사소통 능력 개발에 중점을 두고 있다. 영어 학습을 시작하는 초기 학습자 단계에서 가장 우선적으로 직면하게 되는 것이 바로 어휘 학습이다. 기존 영어 단어 학습 시스템은 학습자에게 지나치게 많은 단어들을 단순한 방법을 통해서 학습하게 함으로써 심리적 부담을 주고 있다. 심리언어학에서는 언어 이해의 과정이 단순히 제시된 것을 그대로 받아들이는 수용의 과정이 아니라 학습자가 이미 보유한 경험과 개념을 근거로 활성망의 확산을 통해 적절한 관계를 찾는 역동적·능동적 과정이라는 이론이 있다. 본 논문에서는 언어 학습 이론을 바탕으로 단어들 사이의 관계를 부각시킴으로써 추론과 기억에 도움을 주는 영어 단어 학습 시스템을 제안한다. 본 시스템은 단어들 간의 관계를 정의한 단어 관계 망을 중심으로 단어 학습 순서를 결정할 수 있고, 이미지 및 게임 기능을 지원하여 단어학습의 흥미를 유발하는 특징이 있다. 본 학습시스템을 실제 단어 학습에 적용해 본 결과 학습자들의 만족도가 높았다.

An Iterative Approach to Graph-based Word Sense Disambiguation Using Word2Vec (Word2Vec을 이용한 반복적 접근 방식의 그래프 기반 단어 중의성 해소)

  • O, Dongsuk;Kang, Sangwoo;Seo, Jungyun
    • Korean Journal of Cognitive Science
    • /
    • v.27 no.1
    • /
    • pp.43-60
    • /
    • 2016
  • Recently, Unsupervised Word Sense Disambiguation research has focused on Graph based disambiguation. Graph-based disambiguation has built a semantic graph based on words collocated in context or sentence. However, building such a graph over all ambiguous word lead to unnecessary addition of edges and nodes (and hence increasing the error). In contrast, our work uses Word2Vec to consider the most similar words to an ambiguous word in the context or sentences, to rebuild a graph of the matched words. As a result, we show a higher F1-Measure value than the previous methods by using Word2Vec.

  • PDF