• Title/Summary/Keyword: 표현어휘

Search Result 363, Processing Time 0.024 seconds

일상어휘를 기반으로 한 선물 가격 예측모형의 계발

  • 김광용;이승용
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.291-300
    • /
    • 1999
  • 본 논문은 인공신경망과 귀납적 학습방법 등의 인공지능 방법과 선물가격결정에 대한 기존 재무이론을 사용하여 일상어취로 표현되는 파생상품 가격예측 모형을 개발하는데 있다. 모형의 개발은 1단계로 인공신경망이나 기존의 선물가격결정이론(평균보 유비용모형이나 일반균형모형)을 이용하여 선물 가격을 예측한 후, 서로 비교 분석하여 인공신경망 모형의 우수성을 확인하였다. 귀납적 학습방법중 CART 알고리듬을 사용하여 If-Then 규칙을 생성하였다. 특히 실용적 측면에서 선물가격의 일상어휘화를 통한 모형개발을 여러 가지 방법으로 시도하였다. 이러한 선물가격 예측모형의 유용성은 일단 If-Then 규칙으로 표현되어 전문가의 판단에 확실한 이론적인 근거를 제시할 수 있는 장점이 있으며, 특히 의사결정지원시스템으로 활용화 될 경우 매우 유용한 근거자료로 활용될 수 있다. 이러한 선물가격 예측모형의 정확성은 분석표본과 검증표본으로 나누어 검증표본에서 세가지 기본모형(평균보유 비용모형, 일반균형모형, 인공신경망 모형)과 각 모형의 귀납적 학습방법 모형의 다른 3가지 어휘표현방법 3가지를 모형별로 비교 분석하였다. 분석결과 인공신경망모형은 상당한 예측력을 갖고 있는 것으로 판명되었으며, 특히 CART를 기반으로 한 일상어취 기반의 선물가격예측 모형은 예측력이 높은 것으로 나타났다.

  • PDF

Word Embedding using Semantic Restriction of Predicate (용언의 의미 제약을 이용한 단어 임베딩)

  • Lee, Ju-Sang;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.181-183
    • /
    • 2015
  • 최근 자연어 처리 분야에서 딥 러닝이 많이 사용되고 있다. 자연어 처리에서 딥 러닝의 성능 향상을 위해 단어의 표현이 중요하다. 단어 임베딩은 단어 표현을 인공 신경망을 이용해 다차원 벡터로 표현한다. 본 논문에서는 word2vec의 Skip-gram과 negative-sampling을 이용하여 단어 임베딩 학습을 한다. 단어 임베딩 학습 데이터로 한국어 어휘지도 UWordMap의 용언의 필수논항 의미 제약 정보를 이용하여 구성했으며 250,183개의 단어 사전을 구축해 학습한다. 실험 결과로는 의미 제약 정보를 이용한 단어 임베딩이 유사성을 가진 단어들이 인접해 있음을 보인다.

  • PDF

A English Composition Level Assessment System Using Machine Learning Techniques (기계학습기법을 이용한 영어작문 문장 수준평가 시스템)

  • Eom, Jin-Hee;Kwak, Dong-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1290-1293
    • /
    • 2013
  • 본 논문은 문장 내에서 나타나는 어휘간의 관계를 통해 표현 수준을 자동으로 평가할 수 있는 시스템을 제안한다. 제안하는 방법은 영어에세이 코퍼스 내의 문장에서 발생하는 철자 및 문법의 오류와 함께 어휘와 문법 패턴에 따른 표현난이도를 평가할 수 있는 자질을 생성하고 다양한 기계학습기법을 사용하여 문장의 수준을 평가하고자 하였다. 또한 기존에 연구되어온 규칙기반의 문장 평가시스템을 구현하고 기계학습기법을 이용한 문장 평가시스템과 비교하였다. 이를 통해 철자 및 문법의 오류율뿐만 아니라 표현난이도를 평가할 수 있는 자질들이 유용함을 확인할 수 있었다. 영어작문 문장의 수준평가를 위해서 국내 학생들의 토플 에세이 코퍼스를 수집하여 2,000문장을 추출하였고, 4명의 전문평가자들을 통해 6단계로 평가하여 학습 및 테스트 세트를 구성하였다. 성능척도로는 정확률과 재현율을 사용하였으며, 제안하는 방법으로 67.3%의 정확률과 67.1%의 재현율을 보였다.

Question Classification Based on Word Association for Question and Answer Archives (질문대답 아카이브에서 어휘 연관성을 이용한 질문 분류)

  • Jin, Xueying;Lee, Kyung-Soon
    • The KIPS Transactions:PartB
    • /
    • v.17B no.4
    • /
    • pp.327-332
    • /
    • 2010
  • Word mismatch is the most significant problem that causes low performance in question classification, whose questions consist of only two or three words that expressed in many different ways. So, it is necessary to apply word association in question classification. In this paper, we propose question classification method using translation-based language model, which use word translation probabilities for question-question pair that is learned in the same category. In the experiment, we prove that translation probabilities of question-question pairs in the same category is more effective than question-answer pairs in total collection.

A study on Analysis of Human Sensibility Word in Water Bodies (수공간의 감성 어휘 분석에 관한 연구)

  • Kim, Jong-Pyo;Kim, Yong-Soo;Lim, Won-Hyeon
    • Science of Emotion and Sensibility
    • /
    • v.10 no.2
    • /
    • pp.209-220
    • /
    • 2007
  • The purpose of this study is to investigate the words that represent the human sensibility for the water space. The selection of certain words for human sensibility valuation is very important things because of make standard for human sensibility valuation in water bodies. At the first step of the research, 129 words were collected from the subjects by imagination in group of specialist, studies on water space, studies on landscape valuation and studies on human sensibility valuation in out door environmental. At the second step, the suitability test was done and 39 words collected over an average 3.5 point. This words test was 5 point measure to similarity water bodies. At the third step, the factor analysis, cluster analysis, Multi Dimensional Scaling was performed on data, and 9 words were selected from the analysis. Finally, selected comfortable words for human sensibility valuation in water space is hands-on experience, natural, sensibility, harmony, clear, good-feeling, dynamic, free-heart, romantic. The significance of the present study is that it contributes the progress of uncovering the axis of the human sensibility by carefully selecting the words that represent the human sensibility.

  • PDF

Descriptor Profiling for Research Domain Analysis (연구영역분석을 위한 디스크립터 프로파일링에 관한 연구)

  • Kim, Pan-Jun;Lee, Jae-Yun
    • Journal of the Korean Society for information Management
    • /
    • v.24 no.4
    • /
    • pp.285-303
    • /
    • 2007
  • This study aims to explore a new technique making complementary linkage between controlled vocabularies and uncontrolled vocabularies for analyzing a research domain. Co-word analysis can be largely divided into two based on the types of vocabulary used: controlled and uncontrolled. In the case of using controlled vocabulary, data sparseness and indexer effect are inherent drawbacks. On the other case, word selection by the author's perspective and word ambiguity. To complement each other, we suggest a descriptor profiling that represents descriptors(controlled vocabulary) as the co-occurrence with words from the text(uncontrolled vocabulary). Applying the profiling to the domain of information science implies that this method can complement each other by reducing the inherent shortcoming of the controlled and uncontrolled vocabulary.

A Sentence Sentiment Classification reflecting Formal and Informal Vocabulary Information (형식적 및 비형식적 어휘 정보를 반영한 문장 감정 분류)

  • Cho, Sang-Hyun;Kang, Hang-Bong
    • The KIPS Transactions:PartB
    • /
    • v.18B no.5
    • /
    • pp.325-332
    • /
    • 2011
  • Social Network Services(SNS) such as Twitter, Facebook and Myspace have gained popularity worldwide. Especially, sentiment analysis of SNS users' sentence is very important since it is very useful in the opinion mining. In this paper, we propose a new sentiment classification method of sentences which contains formal and informal vocabulary such as emoticons, and newly coined words. Previous methods used only formal vocabulary to classify sentiments of sentences. However, these methods are not quite effective because internet users use sentences that contain informal vocabulary. In addition, we construct suggest to construct domain sentiment vocabulary because the same word may represent different sentiments in different domains. Feature vectors are extracted from the sentiment vocabulary information and classified by Support Vector Machine(SVM). Our proposed method shows good performance in classification accuracy.

A Study on the Extraction of Emotional Words for Media Facade (내용분석 및 자유연상을 통한 미디어 파사드의 감성어휘 추출)

  • Lee, Seung-min;Bang, Kee-chun
    • Journal of Digital Contents Society
    • /
    • v.16 no.5
    • /
    • pp.741-748
    • /
    • 2015
  • The aim of this paper is to select a distinct vocabulary for understanding the media facade of user and to lay the foundation for a media facade emotional scale. Firstly, we assembled a set of emotional words that were sufficient to represent a general overview of korean emotions, collected from various literature studies. Secondly, we found emotional words from collecting user opinion on the Youtube website. Finally the emotional words were collected from phrase by using non-structural survey. The collected words were integrated according to standards and they were organized 39 pieces that can be used in the survey. As a result, we extracted 21 emotional words for measuring user's emotions expressed while watching media facade, such as 'novel', 'cool', 'awesome', 'gorgeous', 'exciting', 'amazing', 'wonderful,', 'showy', 'great,', 'intense', 'good', 'grand', 'colorful', 'unique', 'variety', 'new', 'fun', 'beautiful', 'luxurious,', 'mysterious', 'satisfactory'. And we categorized the 21 words to form 5 elements by using factor analysis such as 'surprise', 'attention', 'variety', 'aesthetics', 'interest'.

A Treebank-Based Approach to Preferred Nominal Words in Grammatical Relations and their Semantic Types (구문분석 말뭉치를 이용한 문법 관계의 선호 체언 어휘와 의미 유형 연구)

  • Hong, Jungha
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.35-41
    • /
    • 2008
  • 이 논문은 각 문법 관계(grammatical relation)에서 선호되는 체언 어휘를 파악하고, 이 어휘들의 의미적 유형 및 그 위계를 파악하는 것이 목적이다. 이를 위해 80만 어절의 21세기 세종계획 구문분석 말뭉치에서 그 분포를 추출하고, 통계적 검증을 통해 각 문법 관계에서 선호되는 체언 어휘를 선별한다. 이 연구에서 관찰하는 문법 관계는 주어, 목적어, 용언수식어로 하며, 이들 문법 관계에서 선호되는 어휘 추출 대상 품사는 대명사, 고유명사, 일반명사로 한다. 한정성의 강도에 따라 주어 분포 경향이 나타나며, 이에 따라 대명사 > 고유명사 > 일반명사 순으로 주어 분포 경향이 나타난다. 그러나 일반적 예측과 다르게 한정성의 강도가 더 강한 것으로 알려진 대명사가 고유명사보다 목적어와 용언수식어에서 분포 경향이 더 강하여, 일반명사 > 대명사 > 고유명사의 순으로 분포 경향이 나타난다. 대명사, 고유명사, 일반명사는 공통적으로 주어에서는 사람 지시어, 목적어에서는 사물과 장소 지시어, 그리고 용언수식어에서는 시공간 표현이 선호되어 분포한다. 특히 대명사는 각 문법기능에서 인칭대명사의 경우 인칭에 따라, 그리고 지시대명사의 경우 원근칭에 따라 선호도의 차이를 보인다. 이러한 체언 어휘의 의미적 분포 특성은 문법 관계에 통사적 기능 외에도 의미적 경향이 반영된 것으로 고려될 수 있다.

  • PDF

Dimension of the Emotion Structure through the Analysis of Emotion related terms in Korean Language (정서관련 어휘 분석을 통한 내적 상태의 차원 연구)

  • 김영아;김진관;박수경;오경자;정찬섭
    • Science of Emotion and Sensibility
    • /
    • v.1 no.1
    • /
    • pp.145-152
    • /
    • 1998
  • 본 연구에서는 한국어의 정서관련 어휘분석을 통하여 내적체계의 차원을 알아보고자 하였다. 이를 위해 연구1에서는 내적경험을 표현하는 데 자주 쓰이는 어휘들을 자유연상을 통해 100개를 선정하고 유사성과 빈도평가 자료를 다차원분석한 결과, 1차원(63%)은 불쾌, 2차원(25%)은 각성수준으로 해석될 수 있었고, 이는 기존의 차원모형의 주장과 거의 유사한 결과였다. 다른 이휘목록을 사용하였을 때의 결과와 비교하기 위해, 연구 2에서는 표정을 보고 정서를 추론하는 실험을 통해 자주 언급된 단어를 빈도순으로 22개 선정하였다. 이를 이용하여 같은 방법으로 다차원 분석한 결과 역시 같은 차원들이 얻어졌으나, 1차원의 비중이 훨씬 커서(89%)각성수준의 설명력은 (6%)상대적으로 작았다. 연구 3에서는 연구 1,2의 이휘목록이 전체 재적체계의 차원 공간에서 차지하는 상대적인 위치를 비교하기 위해, 두 어휘목록을 포함한 83개 내적체계의 단어를 차원평정시켜 분석하였고, 연구결과가 차원모형에서 갖는 시사점이 논의되었다.

  • PDF