• Title/Summary/Keyword: 상호정보량

Search Result 608, Processing Time 0.039 seconds

A Study on Relative Mutual Information Coefficients (상호정보량의 정규화에 대한 연구)

  • Lee, Jae-Yun
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.37 no.4
    • /
    • pp.178-198
    • /
    • 2003
  • Mutual information as an association measure, has been used for various purposes as well as for calculating term similarity. There we, however, some limits in mutual information. It tends to emphasize low frequency terms extremely because the marginal value of mutual information changes inversely to frequency of terms. To compensate for this limit this study suggests relative mutual information(RMI) coefficients which normalize mutual information, and examines their characteristics in some details. The RMI coefficients also improve effectiveness of global query expansion when they are adapted to three different collections.

Homonym Disambiguation based on Average Mutual Information (평균 상호정보량에 기반한 동음이의어 중의성 해소)

  • Hur, Jeong;Jang, Myung-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.159-166
    • /
    • 2005
  • 자연언어처리의 목적은 컴퓨터가 자연어를 이해할 수 있도록 하여, 인간에게 다양한 정보를 정확하고 빠르게 전달할 수 있도록 하고자 하는 것이다. 이를 위해서는 언어의 의미를 정확히 파악하여야 하는데, 어휘 의미 중의성 해소가 필수적인 기술이다. 본 연구에서는 평균 상호정보량에 기반한 동음이의어 의미 중의성 해소 기술을 소개한다. 사전 뜻풀이를 이용하는 기존 연구들은 어휘들간의 정확한 매칭에 의존하기 때문에 자료부족 현상이 심각하였다. 그러나, 본 연구에서는 어휘들간의 연관계수인 상호정보량을 이용함으로써 이 문제를 완화시켰다. 또한, 상호정보량을 가지는 어휘 쌍의 비율, 의미 별 빈도 정보와 뜻풀이의 길이를 가중치로 반영하였다. 본 시스템의 평가를 위해 질의응답 평가셋의 500여 개의 질의와 정답단락을 대상으로 동음이의어 의미 중의성 해소 평가셋을 구축하였다. 평가셋에 기반하여 두 가지 유형의 실험을 수행하였다. 실험 결과는 평균 상호정보량만을 이용하였을 때 62.04%의 정확률을 보였고, 가중치를 활용하였을 때 83.42%의 정확률을 보였다.

  • PDF

Mutual information analysis of EEG during odor stimulation classified with occupations (향 자극에 따른 직업별 뇌파의 상호 정보량 분석)

  • 민병찬;강인형;진승현;전광진
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2002.11a
    • /
    • pp.205-208
    • /
    • 2002
  • 본 연구에서는 단순노무직, 판매직, 전문직에 종사하는 피험자를 대상으로 100%의 basil oil, lavender oil, lemon oil, jasmine oil, ylang-ylang oil (KIMEX co. Ltd, Korea), skatole (TAKASAGO co. Ltd, Japan)등 총 6가지 종류의 천연향에 대한 두뇌의 정보량 흐름을 파악하기 위해 상호 정보량을 검토하였다. 그 결과, 전문직에서는 상호 정보량의 유의한 변화가 전두엽 사이(F3F4)에서 나타난 반면, 단순노무직과 판매직에서는 전두엽(F3F4), 두정엽(P3P4), 측두엽(T5T6) 사이에서 모두 나타났다. 두 직종과 비교하여 전문직이 주로 외부 자극에 대한 고차원적 기능을 담당하는 전두엽영역의 정보량에서 유의한 변화를 보인 것은 향을 전문적으로 구분하고, 확인하는 그들의 직업적 특성을 반영한 결과라 추측된다. 또한, 단순노무직과 달리, 전문직과 판매직은 선호도가 낮은 향에서 상호 정보량이 증가하는 경향을 보여, 향 관련 종사자들의 선호도와 상호 정보량간의 관련성을 시사하였다.

  • PDF

Mutual information analysis of EEG in stimuli of odors (향 자극에 대한 뇌파의 상호 정보량 분석)

  • 민병찬;강인형;진승형;전광진;김태은;김수용;성은정;김철중
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2002.05a
    • /
    • pp.135-138
    • /
    • 2002
  • 판매직에 종사하는 여성을 대상으로 100%의 Basil oil, Lavender oil, Lemon oil, Jasmin oil, Ylangylang oil (KIMEX co. Ltd), Skatole의 총 6가지 종류의 천연향을 사용하여 자극하였을 때의 상호 정보량을 분석, 비교하였다. 그 결과, 선호도가 낮은 Basil과 Skatole을 자극할 때 무향에 비해 상호 정보량이 많고, 향 간의 비교에서도 선호도가 낮은 향에 대한 상호 정보량이 선호도가 높은 향에 비해 더 많음을 보여주었다. 이는 뇌에서 상호 정보량이 향에 대한 선호도와 관련이 있고, 특히 선호도가 낮은 향의 경우, 정보량의 증가 경향이 확인되었다.

  • PDF

Performance Evaluation of a Naive Bayesian Classifier using various Feature Selection Methods (자질선정에 따른 Naive Bayesian 분류기의 성능 비교)

  • 국민상;정영미
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2000.08a
    • /
    • pp.33-36
    • /
    • 2000
  • 베이즈 확률을 이용한 분류기는 자동분류 초기부터 사용되어 아직까지 이 분야에서 가장 많이 사용되는 분류기 중 하나이다. 본 논문에서는 KTSET 문서에서 임의로 추출한 198건의 정보과학회 관련 논문의 제목 및 초록을 대상으로 베이즈 확률을 이용한 문서의 자동분류 실험을 수행하였으며, 더불어 Naive Bayesian 분류기에 가장 적합한 자질선정 방법을 찾고자 카이제곱 통계량, 상호정보량 및 기대상호정보량, 정보획득량, 역문헌빈도, 역카테고리빈도 등 6가지의 자질선정 기준을 실험하였다. 실험 결과는 카이제곱 통계량을 이용한 분류 실험의 성능이 가장 좋았고, 기대상호정보량과 정보획득량, 역카테고리빈도 또한 자질수에 큰 영향을 받지 않고 비교적 안정적인 성능을 보였다.

  • PDF

Mutual information analysis of EEG in stimuli of odors (향 자극에 대한 뇌파의 상호 정보량 분석)

  • 민병찬;강인형;최지연;정순철;김철중
    • Science of Emotion and Sensibility
    • /
    • v.6 no.2
    • /
    • pp.17-20
    • /
    • 2003
  • The present study analyzed and compared the mutual information obtained by stimulating saleswomen with 6 natural fragrances 100% basil oil, Lavender oil, lemon oil, jasmine oil, ylang-ylang oil (KIMEX Co., Ltd.), and skatole. When stimulated with basil and skatole, which were less favored fragrances, the women produced a greater amount of mutual information than when not stimulated with any fragrance. In addition, a comparison among the effects of the fragrances revealed that the subjects tended to produce more mutual information regarding less favored fragrances than regarding more favored ones. This is because the amount of mutual information in the cerebrum is linked to the women's preference regarding fragrances. Consequently, less favored fragrances have been demonstrated clearly to produce more mutual information among the subjects.

  • PDF

Dependency relation analysis and mutual information technique for ASR rescoring (음성인식 리스코링을 위한 의존관계분석과 상호정보량 접근방법의 비교)

  • Chung, Euisok;Jeon, Hyung-Bae;Park, Jeon-Gue
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.164-166
    • /
    • 2014
  • 음성인식 결과는 다수의 후보를 생성할 수 있다. 해당 후보들은 각각 음향모델 값과 언어모델 값을 결합한 형태의 통합 정보를 갖고 있다. 여기서 언어모델 값을 다시 계산하여 성능을 향상하는 접근 방법이 일반적인 음성인식 성능개선 방법 중 하나이며 n-gram 기반 리스코링 접근 방법이 사용되어 왔다. 본 논문은 적절한 성능 개선을 위하여, 대용량 n-gram 모델의 활용 문제점을 고려한 문장 구성 어휘의 의존 관계 분석 접근 방법 및 일정 거리 어휘쌍들의 상호정보량 값을 이용한 접근 방법을 검토한다.

  • PDF

Application on Prediction of Stream Flow using Artificial Neural Network with Mutual Information and Wavelet Transform (상호정보량기법과 웨이블렛변환을 적용한 인공신경망의 하천유량 예측 활용)

  • Ryu, Yong-Jun;Jung, Yong-Hun;Shin, Ju-Young;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.116-116
    • /
    • 2012
  • 하천유역 내의 인자를 이용하여 댐의 하천유량(stream flow)을 예측하는 일은 수문특성의 연구와 자연재해에 대한 대비 및 수공구조물과 방재시설의 설계 시 중요한 역할을 한다. 이러한 연구는 과거부터 활발히 이루어졌으며, 아직도 보다 높은 정확도의 결과를 얻기 위해 많은 연구들이 이루어지고 있다. 특히 기존의 유역 내 자료를 통해 비선형적 모델인 인공신경망(artificial neural network)을 이용한 하천유량을 예측하는 연구 역시 활발히 이루어지고 있다. 본 연구의 목적은 여러 유역인자들 중 하천유량에 가장 영향을 미치는 변수를 추출하고 보다 정확한 예측모델을 구축하는 것이다. 기존의 입력자료 선정기법중의 하나인 상호정보량(mutual information)과 수문기상자료의 비선형 동역학적 성분을 추출하는 웨이블렛 변환(wavelet transform)을 사용하여 인공신경망에 적용시켰다. 인공신경망을 적용하는 경우, 수문자료에 있어서 변수의 선택과 자료의 상태가 강우예측의 결과에 큰 영향을 미친다. 이러한 변수의 선택에 있어서 상호정보량을 바탕으로 한 인공신경망 입력변수 선택기법이 많이 사용되고 있다. 일반적으로 시계열자료는 경향성(trend), 주기성(periodicity) 및 추계학적 성분(stochastic component)의 선형조합으로 가정될 수 있으며, 특히 경향성과 주기성은 시계열 모형을 위해 제거되어야 할 결정론적 성분으로 취급한다. 즉. 수문 기상자료에 포함되어 있는 경향성과 주기성과 같은 비선형 동역학적 잡음(nonlinear dynamical noise)을 제거하고 입력자료의 카오스적 거동을 보이는 성분을 분리하기 위해 웨이블렛 변환을 사용하였다. 대상유역은 한강 유역에 포함되어 있는 충주댐으로 선택하였다. 유역 내 다양한 인자들과 하천유량사이의 상호정보량을 구해 영향력이 가장 큰 변수를 추출하고, 그 자료를 웨이블렛 변환을 적용하여 인공신경망의 입력자료로 사용하였다. 본 논문에서는 위와 같은 과정을 이용해 추정한 하천유량 결과와 기존의 방법인 상호정보량을 이용해 인공신경망을 적용한 결과를 실제자료와 비교하였다.

  • PDF

Refinement of Semantic-Information for WSD Using Mutual Information (상호정보량을 이용한 동형이의어 분별용 의미정보의 정제)

  • 김준수;이왕우;김창환;옥철영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.460-463
    • /
    • 2002
  • 사전 뜻풀이에서 추출된 기존의 의미정보는 동형이의어가 포함된 뜻풀이에서 명사, 용언을 모두 추출하는 방법을 이용하여 단어 중의성 해소에 부적절만 정보를 상당수 포함하게 되었다. 이러만 부적절한 정보 때문에 오분석이나 과분석이 발생하게 된다. 그러므로 기존의 의미정보에서 동형이의어 분별에 유용한 정보만을 선택하는 기준이 필요하게 되었다. 본 논문에서는 사전 뜻풀이에서 동형이의어와 의미정보 사이의 상호정보량을 계산하고 임계치를 선정하여 의미정보를 선택제약하는 방법을 이용하였다. 임계치에 의해 제한된 의미정보의 효율성을 실험하기 위한 다양만 동형이의어 분별 실험들을 수행하였다.

  • PDF

Homonym Disambiguation using Sense-Tagged Compound Noun Dictionary (복합명사 의미사전을 이용한 동음이의어 중의성 해소)

  • Hur Jeong;Jang Myung-Gil
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.538-540
    • /
    • 2005
  • 본 논문에서는 평균 상호정보량에 기반하고 복합명사 의미사전을 이용한 동음이의어 중의성 해소 기술에 대해서 소개한다. 평균 상호정보량을 이용한 방법은 사전의 뜻풀이를 이용하는 기존 방법의 자료부족문제를 완화시킨다. 복합명사 의미사전은 복합명사를 구성하는 단일영사들의 의미제약 관계를 이용하여 구축된다. 기 구축된 복합명사 의미사전은 어휘 의미 중의성의 정확률을 향상시키고, 연산 시간을 줄여 시스템의 효율성을 극대화시킨다. 평균 상호정보량을 이용한 실험에서는 $62.04\%$의 정확률로 LESK의 방법에 비해 $6.06\%$의 향상이 있었고, 복합명사 의미사전을 이용하였을 때는 $68.13\%$의 정확률로 $12.76\%$의 정확률 향상이 있었다.

  • PDF