• Title/Summary/Keyword: 어휘분류

Search Result 309, Processing Time 0.023 seconds

Efficient Vocabulary Optimization Management using VCOR (VCOR를 이용한 효율적인 어휘 최적화 관리)

  • Oh, Sang-Yeob
    • Journal of Korea Multimedia Society
    • /
    • v.13 no.10
    • /
    • pp.1436-1443
    • /
    • 2010
  • In vocabulary recognition system has it's bad points of processing vocabulary unseen triphone and then no got distribution of confidence measure by cannot normalization. According to this problem to improve suggested VCOR(Version Control for Out-of Rejection) system by out-of vocabulary rejection algorithm use vocabulary management optimization and then phone data search support. In VCOR system to provide vocabulary information efficiently offering for user's vocabulary information using extend facet classification that improved for vocabulary measure management function offering accuracy of recognition for vocabulary. In this paper proposed system performance as a result of represent vocabulary dependence recognition rate of 97.56%, vocabulary independence recognition rate of 96.23%.

Linguistic Features Discrimination for Social Issue Risk Classification (사회적 이슈 리스크 유형 분류를 위한 어휘 자질 선별)

  • Oh, Hyo-Jung;Yun, Bo-Hyun;Kim, Chan-Young
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.11
    • /
    • pp.541-548
    • /
    • 2016
  • The use of social media is already essential as a source of information for listening user's various opinions and monitoring. We define social 'risks' that issues effect negative influences for public opinion in social media. This paper aims to discriminate various linguistic features and reveal their effects for building an automatic classification model of social risks. Expecially we adopt a word embedding technique for representation of linguistic clues in risk sentences. As a preliminary experiment to analyze characteristics of individual features, we revise errors in automatic linguistic analysis. At the result, the most important feature is NE (Named Entity) information and the best condition is when combine basic linguistic features. word embedding, and word clusters within core predicates. Experimental results under the real situation in social bigdata - including linguistic analysis errors - show 92.08% and 85.84% in precision respectively for frequent risk categories set and full test set.

Construct ion of Keyword Index and Improved Search Methods for e-Catalogs Eased on Semantic Relationship (의미적 연결 관계에 기반한 전자 카탈로그에서의 확장된 어휘 인덱스 구축 및 이를 이용한 검색 성능 향상 기법)

  • Lee Dongjoo;Lee Taehee;Lee Sang-goo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.67-69
    • /
    • 2005
  • 본 논문에서는 기 구축된 전자 카탈로그를 의미적 연결 관계에 기초한 확장된 전자 카탈로그로 변환하는 방법을 제안한다. 이를 통해 구축된 확장된 전자 카탈로그에서 의미적 태깅에 의한 확장된 어휘 인덱스 구축 방안과, 이를 이용한 검색 성능 향상 기법을 제안한다. 기존의 전자 카탈로그는 상품 정보가 분류별로 생성된 테이블에 저장되고 저장된 테이블로부터 생성된 키워드 인덱스로부터 검색이 이루어 졌다. 이러한 검색은 상품이 가지는 정보를 데이터베이스에 구축된 테이블에만 한정하게 되어 전자 카탈로그에 포함된 상품이나 분류간의 의미적 연결 관계들을 충분히 이용하지 못하였다 전자 카탈로그에 내재된 의미적 요소를 충분히 활용하기 위해서는 전자 카탈로그를 의미적 연결 관계에 기초한 모델로 구성할 필요가 있다. 본 논문에서는 의미적 모델 기반 전자 카탈로그 시스템으로의 전환 과정을 XML형태의 명세를 이용해 반자동적으로 전환할 수 있는 툴을 구현하며, 단순 키워드 어휘 인덱스 구축이 아닌, 어휘 인덱스의 의미적 확장을 제안하고, 이를 위한 태그 요소로써 어휘에 대한 형태소 분석 결과, 수치 환산 및 확장 요소, 속성간의 도메인 정보 등을 제시하였다. 이를 기반으로 최적의 검색 결과를 얻어 내도록 하는 인접도 평가 함수에 적용하는 방법을 제시한다.

  • PDF

Courseware Classification using Conceptual Distance and Density based on Ontology (개념적 거리와 밀도를 고려한 온톨로지 기반의 코스웨어 분류)

  • Cho, Mi-Young;Choi, Chang;Kim, Pan-Koo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.314-318
    • /
    • 2006
  • 인터넷의 비약적인 발전으로 많은 강의 자료가 존재하게 되었으며, 어느 누구나 손쉽게 강의 자료를 구할 수 있게 되었다. 하지만 사용자는 단순히 많은 정보만을 원하는 것이 아니라 정확한 정보를 얻기를 원한다. 이에 본 논문에서는 기존의 단어 빈도수 기반의 분류 방식이 아닌 개념적 분류 방식으로 온톨로지를 이용하여 코스웨어를 분류해보고자 한다. 온톨로지로는 어휘적 온톨로지의 일종인 WordNet의 과목에 대한 계층적 구조를 활용하였다. 실험 데이터로는 강의 자료 중 파워포인트로 작성된 코스웨어를 이용하였으며, 코스웨어의 메타데이터들과 과목들간의 개념적 거리 및 밀도를 측정하여 코스웨어를 분류하였다. 또한 WordNet상의 어휘 확장을 통하여 분류과목 확장이 가능함을 보였다.

  • PDF

Korean Word Learning System Using Automatic Question Generation Technique (자동 문제 생성 기술을 이용한 한국어 어휘학습시스템)

  • Choe, Su-Il;Im, Ji-Hui;Choe, Ho-Seop;Ock, Cheol-Young
    • Korean Journal of Cognitive Science
    • /
    • v.17 no.4
    • /
    • pp.271-286
    • /
    • 2006
  • In this paper, we introduce automatic question generation technique using the language resources like User-Word Intelligent Network(U-WIN) and Korean dictionary including quite a for of information. And we present Korean word learning system with this technique. The item pool method which almost learning-system are using makes some problems. As a solution of the problems, we classified into 8 question type and implemented the Korean word learning system which is making the Korean question automatically by using the morphological and semantic information according to the automatic question generation pattern of each type.

  • PDF

A Sentiment Classification Method Using Context Information in Product Review Summarization (상품 리뷰 요약에서의 문맥 정보를 이용한 의견 분류 방법)

  • Yang, Jung-Yeon;Myung, Jae-Seok;Lee, Sang-Goo
    • Journal of KIISE:Databases
    • /
    • v.36 no.4
    • /
    • pp.254-262
    • /
    • 2009
  • As the trend of e-business activities develop, customers come into contact with products through on-line shopping sites and lots of customers refer product reviews before the purchasing on-line. However, as the volume of product reviews grow, it takes a great deal of time and effort for customers to read and evaluate voluminous product reviews. Lately, attention is being paid to Opinion Mining(OM) as one of the effective solutions to this problem. In this paper, we propose an efficient method for opinion sentiment classification of product reviews using product specific context information of words occurred in the reviews. We define the context information of words and propose the application of context for sentiment classification and we show the performance of our method through the experiments. Additionally, in case of word corpus construction, we propose the method to construct word corpus automatically using the review texts and review scores in order to prevent traditional manual process. In consequence, we can easily get exact sentiment polarities of opinion words in product reviews.

A Development of Retrieval Program for Korean Vocabulary History (국어 어휘의 역사 검색 프로그램 개발)

  • 두길수;황호천;김법균;안동언;정성종;이신원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.504-506
    • /
    • 2003
  • “국어 어휘의 역사 검색 프로그램 개발”은 국민들에게 국어 어휘에 대한 역사 정보를 제공하여 국어에 대한 지식과 이해의 폭을 넓힘으로써 국어 생활을 더욱 윤택하게 하고, 국어의 정확한 사용을 통하여 국민들의 의사소통의 정확성과 신속성을 제고함을 그 목적으로 한다. 아울러 이러한 국어 어휘 역사에 대한 정보를 컴퓨터 프로그램을 통하여 국민들에게 제공함으로써, 국민들의 국어 정보화에 기여함은 물론, 잊혀져만 가는 국어에 대한 역사적 사실을 밝혀 줌으로써, 국어의 보존에도 크게 기여하게 될 것이다. 따라서 이 연구는 거시적으로는 한민족 언어의 정보화를 확충시켜 나아가고, 미시적으로는 국민들의 국어에 대한 자긍심을 갖게 함으로써, 국어 발전의 기틀을 마련하는 데에 그 목적이 있다. 본 논문에서는 국어 어휘의 역사 검색 프로그램에 대한 개발 개요와 어휘의 시대별 분류 방식에 대해서 논한다.

  • PDF

Identifying emotion states of users and the related situations under computer environment (컴퓨터 사용자의 감성상태 및 감성유발상황에 관한 연구)

  • 박흥국;임좌상;황민철;이재광
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 1999.11a
    • /
    • pp.67-71
    • /
    • 1999
  • 본 연구는 감성의 객관적 분류기술을 기반으로 인간의 감성을 이해하고 감성의 변화에 능동적으로 반응하는 사용자 중심의 감성컴퓨터를 개발하기 위한 목적으로 진행되었으며, 컴퓨터 사용자를 대상으로 컴퓨터 사용 시에 자주 경험하는 감성상태를 나타내는 어휘와 감성유발상황을 브레인 스토밍과 설문을 통하여 조사하고 분석 및 분류하였다. 컴퓨터 사용자가 컴퓨터를 사용할 때 느끼는 감성상태를 표현하는 어휘는 쾌.불쾌 및 각성.이완의 2 차원적으로 분류하였으며, 컴퓨터 작업환경에서 감성상태를 유발하는 상황도 결과적으로 2 차원적으로 분류되었다. 이는 2 차원적 감성분류알고리즘의 개발과, 특히 부정적 감성을 경감시킬 수 있는 사용자 인터페이스 개발을 위한 기초연구에 활용될 수 있다.

  • PDF

Investigating Vocabulary Learning Strategies Instruction in Korean Elementary School English Textbooks (초등학교 5학년 영어 교과서 분석: 어휘학습전략 중심으로)

  • Kim, Keumsun;Im, Hee-Joo
    • The Journal of the Korea Contents Association
    • /
    • v.14 no.4
    • /
    • pp.435-444
    • /
    • 2014
  • As vocabulary acquisition has become one of the emerging key issues in the foreign language education field, interest in vocabulary learning strategies (VLS) has also increased. However, little has been done to investigate the vocabulary learning strategies of young learners. Therefore, this study attempts to investigate VLS use in elementary school English language textbooks. A total of three fifth grade English textbooks and teachers' guidebooks were chosen and analyzed with the vocabulary learning strategies taxonomy suggested by Scbmitt (1997). The researcher identified there were only a limited number of vocabulary learning strategies in the textbooks and most of them were consolidation strategies. It was concluded that a variety of VLS should be introduced in multiple ways in consideration of learner preference, styles, culture and level of English proficiency. Some implications for the teaching and learning of vocabulary for EFL instruction amongst young learners are discussed.

Lexicon of Semantic-Polarity of Korean Adjectives for the Classification of On-line Opinion Documents (온라인 오피니언 문서 분류를 위한 한국어 형용사 의미 극성 사전)

  • Ahn, Ae-Lim;Shim, Seung-Hye;Nam, Jee-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.166-171
    • /
    • 2010
  • 본 논문은 한국어 온라인 리뷰 문서의 오피니언 분류(Opinion Classification)에 있어 그 핵심 키워드가 형용사 (Adjective) 범주라는 점을 고려하여, 한국어 형용사를 <문맥에 의존하지 않는 절대 극성>과, <문맥에 의존하여 극성이 바뀌는 상대극성>으로 대분류한 뒤 그 각각의 의미 극성을 하위 분류하는 작업을 수행하였다. 기존의 연구에서 특징적인 오피니언 어휘 수십개에 의존하여 자동 분류를 시도하고자 하였던 문제점을 극복하기 위해서는 한국어 형용사 전체 범주에 대한 체계적인 극성 분류가 이루어져야 할 필요가 있으며, 여기서 특히 상세히 주목받지 못했던 상대 극성 어휘에 대한 본격적인 의미 분류가 요구된다. 본 연구에서 제시하는 형용사의 극성 분류는 기존의 이론 언어학적 형용사 의미 분류와 달리 온라인 오피니언 문서에서 도메인에 따라 나타나는 특징적 의미 유형을 결정하고, 이를 기준으로 온라인 오피니언 문서의 극성 판별에 효과적으로 적용할 수 있는 사전을 구축하였다는 점에서 의의를 가진다.

  • PDF