• Title/Summary/Keyword: 평균상호정보량

Search Result 45, Processing Time 0.039 seconds

Homonym Disambiguation based on Average Mutual Information (평균 상호정보량에 기반한 동음이의어 중의성 해소)

  • Hur, Jeong;Jang, Myung-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.159-166
    • /
    • 2005
  • 자연언어처리의 목적은 컴퓨터가 자연어를 이해할 수 있도록 하여, 인간에게 다양한 정보를 정확하고 빠르게 전달할 수 있도록 하고자 하는 것이다. 이를 위해서는 언어의 의미를 정확히 파악하여야 하는데, 어휘 의미 중의성 해소가 필수적인 기술이다. 본 연구에서는 평균 상호정보량에 기반한 동음이의어 의미 중의성 해소 기술을 소개한다. 사전 뜻풀이를 이용하는 기존 연구들은 어휘들간의 정확한 매칭에 의존하기 때문에 자료부족 현상이 심각하였다. 그러나, 본 연구에서는 어휘들간의 연관계수인 상호정보량을 이용함으로써 이 문제를 완화시켰다. 또한, 상호정보량을 가지는 어휘 쌍의 비율, 의미 별 빈도 정보와 뜻풀이의 길이를 가중치로 반영하였다. 본 시스템의 평가를 위해 질의응답 평가셋의 500여 개의 질의와 정답단락을 대상으로 동음이의어 의미 중의성 해소 평가셋을 구축하였다. 평가셋에 기반하여 두 가지 유형의 실험을 수행하였다. 실험 결과는 평균 상호정보량만을 이용하였을 때 62.04%의 정확률을 보였고, 가중치를 활용하였을 때 83.42%의 정확률을 보였다.

  • PDF

Homonym Disambiguation using Sense-Tagged Compound Noun Dictionary (복합명사 의미사전을 이용한 동음이의어 중의성 해소)

  • Hur Jeong;Jang Myung-Gil
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.538-540
    • /
    • 2005
  • 본 논문에서는 평균 상호정보량에 기반하고 복합명사 의미사전을 이용한 동음이의어 중의성 해소 기술에 대해서 소개한다. 평균 상호정보량을 이용한 방법은 사전의 뜻풀이를 이용하는 기존 방법의 자료부족문제를 완화시킨다. 복합명사 의미사전은 복합명사를 구성하는 단일영사들의 의미제약 관계를 이용하여 구축된다. 기 구축된 복합명사 의미사전은 어휘 의미 중의성의 정확률을 향상시키고, 연산 시간을 줄여 시스템의 효율성을 극대화시킨다. 평균 상호정보량을 이용한 실험에서는 $62.04\%$의 정확률로 LESK의 방법에 비해 $6.06\%$의 향상이 있었고, 복합명사 의미사전을 이용하였을 때는 $68.13\%$의 정확률로 $12.76\%$의 정확률 향상이 있었다.

  • PDF

Input Variables Selection of Artificial Neural Network Using Mutual Information (상호정보량 기법을 적용한 인공신경망 입력자료의 선정)

  • Han, Kwang-Hee;Ryu, Yong-Jun;Kim, Tae-Soon;Heo, Jun-Haeng
    • Journal of Korea Water Resources Association
    • /
    • v.43 no.1
    • /
    • pp.81-94
    • /
    • 2010
  • Input variable selection is one of the various techniques for improving the performance of artificial neural network. In this study, mutual information is applied for input variable selection technique instead of correlation coefficient that is widely used. Among 152 variables of RDAPS (Regional Data Assimilation and Prediction System) output results, input variables for artificial neural network are chosen by computing mutual information between rainfall records and RDAPS' variables. At first the rainfall forecast variable of RDAPS result, namely APCP, is included as input variable and the other input variables are selected according to the rank of mutual information and correlation coefficient. The input variables using mutual information are usually those variables about wind velocity such as D300, U925, etc. Several statistical error estimates show that the result from mutual information is generally more accurate than those from the previous research and correlation coefficient. In addition, the artificial neural network using input variables computed by mutual information can effectively reduce the relative errors corresponding to the high rainfall events.

Automatic Construction of a Named Entity Dictionary for Named Entity Recognition (개체명 인식을 위한 개체명 사전 자동 구축)

  • Jeon, Wonpyo;Song, Yeongkil;Choi, Maengsik;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.82-85
    • /
    • 2013
  • 개체명 인식기에 대한 연구에서 개체명 사전은 필수적으로 필요하다. 그러나 공개된 개체명 사전은 거의 없기 때문에, 본 논문에서는 디비피디아의 데이터로부터 개체명을 효과적으로 추출하여 자동으로 구축할 수 있는 방법을 제안한다. 제안 방법은 엔트리의 '이름'과 '분류' 정보를 사용한다. 엔트리의 '이름'은 개체명으로 사용하고, 엔트리의 '분류'는 각 개체명 클래스와의 상호정보량을 계산하여 엔트리와 개체명 클래스 사이의 점수를 계산한다. 이렇게 계산된 점수를 이용하여 개체명과 개체명 클래스를 매핑한다. 그 결과 76.7%의 평균 정확률을 보였다.

  • PDF

내연기관 연소 및 pollutant modeling

  • 허강열
    • 한국가시화정보학회:학술대회논문집
    • /
    • 2005.04a
    • /
    • pp.3-57
    • /
    • 2005
  • 왕복동 내연기관에서의 연소 및 배기가스 생성은 복잡한 3차원 영역 내에서 난류 유동, 분무, 화학반응, 열전달, 경계층 현상이 상호 연계되어 있는 매우 복합적인 과정이다. 특히 난류 연소 현상은 기관의 효율을 결정하는 연소 속도와 pollutant의 배출 농도를 결정하는 핵심 요소로서 관련 모델과 수치 해법에 대해 학술적, 공학적 측면에서 세계적으로 활발한 연구가 이루어지고 있다. 이를 위해 수행되는 다양한 실험 측정과 수치 해법을 통해 얻어지는 3차원 과도 상태의 방대한 스칼라량과 벡터량에 대한 정보를 효율적으로 처리하기 위해서는 적절한 가시화 과정이 필수적이다. 여기서는 최근 다양한 엔진 타입들에 대한 응용 사례와 함께 난류 연소 모델링을 위한 새로운 접근법으로서 조건평균법(conditional averaging)에 대해 간략히 소개하고자 한다. 난류예혼합연소에서의 난류화염속도에 대한 DNS와 영역조건평균에 기초한 예측식의 검증, 천연가스 jet의 자발화 지연기간, n-heptane jet의 자발화 진행 과정, HSDI 엔진, HCCI 엔진, CNG 엔진, LPG 분무 및 엔진, GDI 엔진 등에 대한 연구 결과들은 정보 가시화의 한 사례가 될 수 있을 것으로 생각된다.

  • PDF

Encounter of Lattice-type coding with Wiener's MMSE and Shannon's Information-Theoretic Capacity Limits in Quantity and Quality of Signal Transmission (신호 전송의 양과 질에서 위너의 MMSE와 샤논의 정보 이론적 정보량 극한 과 격자 코드 와의 만남)

  • Park, Daechul;Lee, Moon Ho
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.50 no.8
    • /
    • pp.83-93
    • /
    • 2013
  • By comparing Wiener's MMSE on stochastic signal transmission with Shannon's mutual information first proved by C.E. Shannon in terms of information theory, connections between two approaches were investigated. What Wiener wanted to see in signal transmission in noisy channel is to try to capture fundamental limits for signal quality in signal estimation. On the other hands, Shannon was interested in finding fundamental limits of signal quantity that maximize the uncertainty in mutual information using the entropy concept in noisy channel. First concern of this paper is to show that in deriving limits of Shannon's point to point fundamental channel capacity, Shannon's mutual information obtained by exploiting MMSE combiner and Wiener filter's MMSE are interelated by integro-differential equantion. Then, At the meeting point of Wiener's MMSE and Shannon's mutual information the upper bound of spectral efficiency and the lower bound of energy efficiency were computed. Choosing a proper lattice-type code of a mod-${\Lambda}$AWGN channel model and MMSE estimation of ${\alpha}$ confirmed to lead to the fundamental Shannon capacity limits.

Integrated calibration weighting using complex auxiliary information (통합 칼리브레이션 가중치 산출 비교연구)

  • Park, Inho;Kim, Sujin
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.3
    • /
    • pp.427-438
    • /
    • 2021
  • Two-stage sampling allows us to estimate population characteristics by both unit and cluster level together. Given a complex auxiliary information, integrated calibration weighting would better reflect the level-wise characteristics as well as multivariate characteristics between levels. This paper explored the integrated calibration weighting methods by Estevao and Särndal (2006) and Kim (2019) through a simulation study, where the efficiency of those weighting methods was compared using an artificial population data. Two weighting methods among others are shown efficient: single step calibration at the unit level with stacked individualized auxiliary information and iterative integrated calibration at each level. Under both methods, cluster calibrated weights are defined as the average of the calibrated weights of the unit(s) within cluster. Both were very good in terms of the goodness-of-fit of estimating the population totals of mutual auxiliary information between clusters and units, and showed small relative bias and relative mean square root errors for estimating the population totals of survey variables that are not included in calibration adjustments.

Content-Based Image Retrieval using 3rd Order Color Object Relation (3차 칼라 오브젝트 관계에 의한 내용 기반 영상 검색)

  • 권희용;최재우;이인행;조동섭;황희융
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.500-502
    • /
    • 1998
  • 최근 정보 사회에서 중요한 기술로 자리잡은 멀티미디어 정보 검색에 대한 다양한연구가 진행 중에 있다. 본 논문은 정지 화상에 대한 CBIR(Content-Based Image Retrieval)방법 중 칼라 정보를 이용한 방법에서 공간 정보를 충분하게 표현할 수 있는 알고리즘을 제안한다. 일반적으로 칼라 정보를 이용한 CBIR에서는 공간정보를 표현하기 위하여 인위적으로 영상을 여러 개로 분할하는 방법이나 영상의 히스토그램 내에서 영상의 위치 정보를 이용하는 방법 등이 연구되었다. 본 논문에서는 기존의 방법을 칼라 오브젝트의 추출 방법에 따라 1차와 2차 관계에 의한 방법으로 분류하고, 이동, 회전 특히 크기 변화(축소, 확대)에 탁월한 성능을 보이는 3차 칼라 오브젝트 관계를 이용한 방법을 소개한다. 제안된 알고리즘은 주어진 영상으로부터 양자화 된 24개의 버킷(bucket)을 생성해서 각 버킷 내의 칼라에 대한 색의 표준 편차로 색의 분산 정도를 나타내고, 빈도수가 높은 3개 버킷의 평균 칼라 위치를 계산해서 그들의 상호 각도를 추출하여 영상의 특징 벡터로 사용하였다. 실험결과 기존 방법보다 특히 영상의 크기 변화에 대해 좋은 결과를 얻을 수 있었으며, 계산량도 적어 효율적임을 보여 주었다.

  • PDF

Estimation of streamflow depletion due to groundwater pumping using analytical and numerical models (해석적 모형과 수치적 모형을 이용한 지하수 양수로 인한 하천수 감소량 산정)

  • Lee, Jeongwoo;Chung, Il-Moon;Kim, Nam Won;Hong, Sung Hun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.294-294
    • /
    • 2018
  • 복잡한 수문 수리지질학적 조건을 고려할 수 있는 SWAT-MODFLOW 지표수-지하수 통합모형과 대수층-하천-양수정 시스템을 단순화한 Hunt (1999) 해석해를 죽산천 인근 지역에 각각 적용하여 지하수 양수로 인한 하천수 감소량을 모의하고 그 결과를 비교하였다. 하천으로부터 약 1 km 이내에 위치한 천부 지하수 관정들 중에서 취수계획량이 $100m^3$/일을 초과하는 18개의 관정을 선별하고 지하수 양수량 대비 하천수 감소량(하천수 감소비)을 산정한 결과 대부분의 관정에서 해석해와 모델링 결과의 차이가 0.2 미만으로 매우 작은 것으로 나타났다. 따라서 해석해가 하천-대수층 시스템을 단순화한 조건에 대해 유도되었음에도 불구하고 정밀한 모델링에 준하는 결과를 나타낼 수 있는 것으로 분석되었다. 그러나, 양수기간이 장기화되거나 하천과 관정간의 이격거리가 증가함에 따라 해석해와 모의결과의 차이가 다소 증가하는 경향을 나타내었다. 해석해가 대수층 저류량의 감소와 하천수량의 감소가 장기적으로 균형을 이루는 동적 평형 상태를 구현할 수 없고 하천수위의 급격한 변화에 따른 하천수와 지하수간의 상호 교환량의 불규칙한 패턴 또한 모사할 수 없는 한계가 있지만 양수기간 5년 이내의 하천수 감소량의 평균적인 거동은 수치모의 결과와 유사한 것으로 평가되었다.

  • PDF

Fault Diagnosis of Ball Bearing using Correlation Dimension (상관차원에 의한 볼베어링 고장진단)

  • 김진수;최연선
    • Proceedings of the Korean Society for Noise and Vibration Engineering Conference
    • /
    • 2004.05a
    • /
    • pp.979-984
    • /
    • 2004
  • The ball bearing having faults generally shows, nonlinear vibration characteristics. For the effective method of fault diagnosis on bail bearing, non-linear diagnostic methods can be used. In this paper, the correlation dimension analysis based on nonlinear timeseries was applied to diagnose the faults of ball bearing. The correlation dimension analysis shows some Intrinsic information of underlying dynamical systems, and clear the classification of the fault of ball bearing.

  • PDF