• Title/Summary/Keyword: 어휘다양성

Search Result 187, Processing Time 0.032 seconds

Vocabulary Recognition Performance Improvement using k-means Algorithm for GMM Support (GMM 지원을 위해 k-means 알고리즘을 이용한 어휘 인식 성능 개선)

  • Lee, Jong-Sub
    • Journal of Digital Convergence
    • /
    • v.13 no.2
    • /
    • pp.135-140
    • /
    • 2015
  • General CHMM vocabulary recognition system is model observation probability for vocabulary recognition of recognition rate's low. Used as the limiting unit is applied only to some problem in the phoneme model. Also, they have a problem that does not conform to the needs of the search range to meaning of the words in the vocabulary. Performs a phoneme recognition using GMM to improve these problems. We solve the problem according to the limited search words characterized by an improved k-means algorithm. Measure the effectiveness represented by the accuracy and reproducibility as compared to conventional system performance experiments. Performance test results accuracy is 83%p, and recall is 67%p.

Query Translation for Resolving the Difference between User Query Words and Ontology Resources (온톨로지 검색에 있어서 사용자 질의어와 온톨로지 리소스와의 상이성 해소를 위한 질의어 변환)

  • Kim, Tae-Wan
    • Journal of the Korea Society of Computer and Information
    • /
    • v.16 no.3
    • /
    • pp.35-44
    • /
    • 2011
  • Ontologies are playing an important role in semantic web which is emerging as a next stage of the web revolution because various kinds of metadata are described in ontologies. Correspondingly, many query languages like SPARQL, RDQL etc. have been proposed for querying these ontologies. But users have to know the structures and resource names of ontologies completely to get search results even if they have expertise on complex formal logic and syntax of the query languages. Especially, casual users do not know the resource names and may use different words from resource names when they write their query language. This vocabulary gap problem have to be solved to raise the success rate. In this paper, an approach for translating user's search words to corresponding resource names has been proposed. This approach uses semantic similarity between user created search words and ontology resource names.

Word Sense Disambiguation Considering Words Relations and Its Application to Sign Language Generation System (어휘 간의 관계를 고려한 중의성 해소 방법 및 수화 생성 시스템에의 응용)

  • Kim, Sangchul;Park, Kwang-Hyun;Bien, Zeungnam
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.124-128
    • /
    • 2008
  • 어휘 중의성 해소는 다양한 분야에서 중요한 위치를 차지하고 있는 자연어처리 관련 문제이다. 본 논문에서는 어휘 중의성 해소의 실제 응용과 관련하여 문헌 내에 여러 개의 중의어가 존재할 때의 중의성 해소 문제를 다룬다. 기존의 연구에서는 다루지 않았던 다수의 중의어가 존재할 때의 중의성 해소 문제에 대하여 고찰한 후, 중의어 간의 연관성을 이용한 중의성 해소 개념을 제시한다. 또한 이를 이용한 구체적인 해소 방안 제안 및 본 연구의 한국어-한국수화 번역 시스템에의 응용 예를 소개한다. 결론 및 향후 과제에서는 본 논문에서 언급된 방법의 향후 개선 방안에 관하여 언급한다.

  • PDF

The Effect of Sensibility on Motion (움직임에서의 감성 효과)

  • 임은영;한광희
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2002.05a
    • /
    • pp.236-240
    • /
    • 2002
  • 기존의 감성 연구들은 주회 배색이나 형태등과 관련된 정적인 장면 위주로 수행되었다. 기술의 발달로 역동적인 디스플레이가 가능해지면서 동적인 장면을 대상으로 한 감성연구의 필요성이 요구된다. 본 연구에서는 움직임과 관련된 감성어휘를 추출하여 감성 차원을 밝히고 움직임과 관련된 속성을 살펴보았다. 다양한 방법을 통해 수집된 감성어휘를 적절성 평가를 통해 70개로 정리한 뒤 요인분석을 통해 각 요인을 대표하는 19개의 기본 감성 어휘를 추출하였다. 움직임 패턴을 제시하면서 19개의 감성어휘를 기초로 움직임에서 의 감성을 평정하도록 하였다. 다차원 척도법을 이용하여 분석한 결과 움직임에 대한 감성 차원은 '적극적이다-소극적이다'의 차원과 ‘밝다-어둡다’의 두 차원으로 대부분 설명 될 수 있음을 확인하였다. 움직이는 속도와 진행 경로를 변화시키면서 두 가지 감성 차원에 따라 움직임에서의 감성을 평가하도록 하였다. 움직이는 속도와 곡선 경로의 진폭이 움직임에서의 감성 차원을 결정하는 중요한 요소로 작용하는 경향을 보였다.

  • PDF

Generation and Recognition Language Model for Spoken Language Parser (구어파서를 위한 생성 인식 언어모델)

  • Jeong, Hong;Hwang, Kwang-Il
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.167-172
    • /
    • 1999
  • 구어는 프로그래밍 언어와는 달리 주어진 문장 내에서의 해당 어휘의 뜻(semantic information)을 알고 다른 어휘들과의 연관성 (grammatical information)을 알아야만 적절한 형태소분석이 가능하다. 또한 구어는 방대한 양의 어휘들로 구성되어 있으며 사용하는 사람마다의 다양한 응용과 공식화되기 어려운 수많은 예외들로 운용되기 때문에 단순히 찾아보기표와 오토마타만으로는 형태소분석에 한계가 있다. 이에 본 논문에서는 주어진 어휘집과 그 어휘들로 만들어진 다양한 문장들로부터 구어운용의 근본기제를 스스로 학습해나가는 강화학습중심의 언어모델을 제안하고 실제로 한국어 형태소분석에 적용하여 그 성능과 특성을 파악해보았다. 구어파서의 입력은 음절단위의 발음이며 인간이 문장을 듣거나 보는 것과 동일하게 시간에 따라 순차적으로 입력된다. 파서의 출력 또한 시간에 따라 변화되면서 나타나며 입력된 연속음절을 형태소단위로 분리(segmentation)하고 분류(labeling)한 결과를 나타낸다. 생성인식 언어모델이 기존의 언어모델과 다른 점은 구어 파싱에 있어서 필수적인 미등륵어에 대한 유연성과 앞단의 음성인식기 오류에 적절한 반응(fault tolerance)을 나타내는 것이다.

  • PDF

The result of hanminjokeoneojeongbohwa project (한민족언어정보화 사업의 성과)

  • Lee, Tae-Yeong
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.332-339
    • /
    • 2007
  • 이 논문은 21세기 세종계획 중 1998년부터 2007년까지 한민족언어정보화 분과 사업의 성과와 그 활용을 제시한 것이다. 이 사업에서는 국어 어문규정 검색 프로그램, 남북한 언어 비교사전, 한국 방언 검색 프로그램, 국어의 어휘 역사 검색 프로그램, 문학작품에 나타난 방언 검색 프로그램, 한국 전통문화 어휘 검색 프로그램, 남북한 정서법 변환 프로그램 등을 만들어 활용하였다. 국어 어휘와 관련된 정보화 작업을 시행하여, 국어를 다양하게 정보화하는 인력을 양성하고, 국어 어휘의 종합적 연구와 국어 발전에 크게 기여하였고, 국민들이 어문규정을 손쉽게 검색하여 국어생활에 큰 도움이 되도록 하였다. 특히 남북한 어휘 연구를 통하여 언어 통일 문제를 다루었고, 국어의 역사적 연구, 각 지역 방언 및 문학작품에 나타난 방언의 연구 및 이해에 큰 도움이 되도록 하였다.

  • PDF

Emotion Analysis Using a Bidirectional LSTM for Word Sense Disambiguation (양방향 LSTM을 적용한 단어의미 중의성 해소 감정분석)

  • Ki, Ho-Yeon;Shin, Kyung-shik
    • The Journal of Bigdata
    • /
    • v.5 no.1
    • /
    • pp.197-208
    • /
    • 2020
  • Lexical ambiguity means that a word can be interpreted as two or more meanings, such as homonym and polysemy, and there are many cases of word sense ambiguation in words expressing emotions. In terms of projecting human psychology, these words convey specific and rich contexts, resulting in lexical ambiguity. In this study, we propose an emotional classification model that disambiguate word sense using bidirectional LSTM. It is based on the assumption that if the information of the surrounding context is fully reflected, the problem of lexical ambiguity can be solved and the emotions that the sentence wants to express can be expressed as one. Bidirectional LSTM is an algorithm that is frequently used in the field of natural language processing research requiring contextual information and is also intended to be used in this study to learn context. GloVe embedding is used as the embedding layer of this research model, and the performance of this model was verified compared to the model applied with LSTM and RNN algorithms. Such a framework could contribute to various fields, including marketing, which could connect the emotions of SNS users to their desire for consumption.

A Diachronic Lexical Analysis of the North Korean English Textbooks (북한 영어 교과서 어휘의 통시적 분석)

  • Kim, Jiyoung;Lee, Je-Young;Kim, Jeong-ryeol
    • The Journal of the Korea Contents Association
    • /
    • v.17 no.4
    • /
    • pp.331-341
    • /
    • 2017
  • This paper aims to analyze English vocabulary of the North Korean textbooks diachronically using the constructed English textbook corpus. The North Korea English textbooks attained from Information Center on North Korea of the Ministry of Unification are divided into before and after Kim Jong-Il era for the year of 1996 in which the curriculum revision has been conducted. They are stored as text files to analyse vocabularies using WordSmith Tools 7.0. The vocabulary size of the revised textbooks increased after the curriculum reorganization, but the number of vocabulary types and vocabulary diversity decreased. After the curriculum revision, it was found that lots of vocabulary related to the establishment of the Kim Jong-Il system appeared as the keyword. It was also found that some vocabularies reflected the economic and social life of North Korea. In addition, through comparison of the 100 high-frequency word list and keywords, it can be concluded that the vocabulary of the English textbooks of North Korea is gradually changing into communicative contents from contents related with written language.

Extraction of Representative Emotions to Measure Emotions Expressed by Traditional Korean Clothes (Hanbok) (한복에서 표출되는 감성을 측정하기 위한 대표감성 추출)

  • Park, Eunjung;Seo, Jonghwan;Jeong, Sanghoon
    • Science of Emotion and Sensibility
    • /
    • v.21 no.2
    • /
    • pp.61-72
    • /
    • 2018
  • Different types of traditional Korean clothes (Hanbok) are appearing in the market with the increasing interest of culture consumers. In order to turn traditional Korean clothes into everyday clothes that adequately reflect various demands of culture consumers, it is important to satisfy both functional and emotional aspects of clothing. However, there is lack of existing studies on emotions of culture consumers while wearing traditional Korean clothes. In this study, 28 emotional words regarding traditional Korean clothes were extracted by applying the Delphi method and conformity rating survey to 182 emotional words reported in existing studies and references from areas such as psychology, linguistics, and sensibility engineering. The 28 selected emotional words can be used to express emotions felt by culture consumers about traditional Korean clothes. Also, words were grouped based on the correlation according to factor analysis. Based on common characteristics, the emotional words were classified into 6 categories of 'pleasure,' 'aesthetic sense,' 'harmony,' 'novelty,' 'likability,' and 'stability.' These 6 emotional categories were concluded to represent emotions of consumers about traditional Korean clothes. The 28 emotional words and 6 representative emotions noted in this study can be used as basic data for measuring emotions of culture consumers of traditional Korean clothes. A future study task is to design a detailed assessment scale to measure emotions of culture consumers about traditional Korean clothes using representative emotions.

Effectiveness of Multimedia Program in Computer-assisted Vocabulary Learning (컴퓨터 보조 학습을 통한 멀티미디어 어휘교육의 효율성)

  • Choi, Michelle Mi-Hee
    • Journal of Digital Contents Society
    • /
    • v.12 no.1
    • /
    • pp.123-131
    • /
    • 2011
  • The purpose of this study is to discover if the use of computer technologies in computer-assisted language learning, in the aspect of vocabulary learning, is both effective and useful. The technique of using multimedia lessons, using the computer, offers a variety of language learning tasks in relation to the four basic language learning skills. Korean students have been accustomed to a cramming style of education, and they utilize rote memorization for learning vocabulary. This study consisted of surveys and experiments, using specific multimedia language learning courseware exercises on three different age groups. The study explores the issues and problems that followed, and how teachers could effectively apply or enhance their vocabulary teaching through computer-assisted multimedia which is suited for a variety of levels versus the classroom off-line vocabulary learning application which is suited to one level.