• Title/Summary/Keyword: 평균상호정보량

검색결과 45건 처리시간 0.072초

평균 상호정보량에 기반한 동음이의어 중의성 해소 (Homonym Disambiguation based on Average Mutual Information)

  • 허정;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.159-166
    • /
    • 2005
  • 자연언어처리의 목적은 컴퓨터가 자연어를 이해할 수 있도록 하여, 인간에게 다양한 정보를 정확하고 빠르게 전달할 수 있도록 하고자 하는 것이다. 이를 위해서는 언어의 의미를 정확히 파악하여야 하는데, 어휘 의미 중의성 해소가 필수적인 기술이다. 본 연구에서는 평균 상호정보량에 기반한 동음이의어 의미 중의성 해소 기술을 소개한다. 사전 뜻풀이를 이용하는 기존 연구들은 어휘들간의 정확한 매칭에 의존하기 때문에 자료부족 현상이 심각하였다. 그러나, 본 연구에서는 어휘들간의 연관계수인 상호정보량을 이용함으로써 이 문제를 완화시켰다. 또한, 상호정보량을 가지는 어휘 쌍의 비율, 의미 별 빈도 정보와 뜻풀이의 길이를 가중치로 반영하였다. 본 시스템의 평가를 위해 질의응답 평가셋의 500여 개의 질의와 정답단락을 대상으로 동음이의어 의미 중의성 해소 평가셋을 구축하였다. 평가셋에 기반하여 두 가지 유형의 실험을 수행하였다. 실험 결과는 평균 상호정보량만을 이용하였을 때 62.04%의 정확률을 보였고, 가중치를 활용하였을 때 83.42%의 정확률을 보였다.

  • PDF

복합명사 의미사전을 이용한 동음이의어 중의성 해소 (Homonym Disambiguation using Sense-Tagged Compound Noun Dictionary)

  • 허정;장명길
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.538-540
    • /
    • 2005
  • 본 논문에서는 평균 상호정보량에 기반하고 복합명사 의미사전을 이용한 동음이의어 중의성 해소 기술에 대해서 소개한다. 평균 상호정보량을 이용한 방법은 사전의 뜻풀이를 이용하는 기존 방법의 자료부족문제를 완화시킨다. 복합명사 의미사전은 복합명사를 구성하는 단일영사들의 의미제약 관계를 이용하여 구축된다. 기 구축된 복합명사 의미사전은 어휘 의미 중의성의 정확률을 향상시키고, 연산 시간을 줄여 시스템의 효율성을 극대화시킨다. 평균 상호정보량을 이용한 실험에서는 $62.04\%$의 정확률로 LESK의 방법에 비해 $6.06\%$의 향상이 있었고, 복합명사 의미사전을 이용하였을 때는 $68.13\%$의 정확률로 $12.76\%$의 정확률 향상이 있었다.

  • PDF

상호정보량 기법을 적용한 인공신경망 입력자료의 선정 (Input Variables Selection of Artificial Neural Network Using Mutual Information)

  • 한광희;류용준;김태순;허준행
    • 한국수자원학회논문집
    • /
    • 제43권1호
    • /
    • pp.81-94
    • /
    • 2010
  • 본 연구는 인공신경망의 성능을 향상시키기 위한 여러 가지 방법들 중의 하나인 입력변수 선정기법에 관한 연구로서, 일반적으로 널리 사용되고 있는 상관계수를 이용한 입력변수 선정기법 외에 상호정보량을 활용한 방법을 적용하여 인공신경망의 성능을 향상시키고자 하였다. 대상자료는 기상청에서 제공하는 RDAPS자료의 152개 출력값으로 지상강우량의 예측값인 APCP를 포함하고 있으며, 강우관측값간의 상호정보량을 구해 가장 영향력이 큰 변수를 입력변수로 사용하였다. 기존연구결과, 그리고 상관계수만을 이용해서 입력변수를 선정한 결과와 비교해볼 때, 상호정보량을 적용한 경우 입력변수는 주로 바람과 관련된 변수들이 선정되었으며, 평균제곱근오차, 평균제곱근상대오차, 그룹별로 구분한 경우의 절대오차, 그리고 구간별로 구분한 경우의 상대오차를 비교한 경과 상호정보량을 이용한 입력변수 선정방법의 정확도가 전반적으로 높은 것으로 나타났으며, 특히 강우량이 상대적으로 큰 경우의 오차를 많이 감소시킬 수 있는 것으로 나타났다.

개체명 인식을 위한 개체명 사전 자동 구축 (Automatic Construction of a Named Entity Dictionary for Named Entity Recognition)

  • 전원표;송영길;최맹식;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.82-85
    • /
    • 2013
  • 개체명 인식기에 대한 연구에서 개체명 사전은 필수적으로 필요하다. 그러나 공개된 개체명 사전은 거의 없기 때문에, 본 논문에서는 디비피디아의 데이터로부터 개체명을 효과적으로 추출하여 자동으로 구축할 수 있는 방법을 제안한다. 제안 방법은 엔트리의 '이름'과 '분류' 정보를 사용한다. 엔트리의 '이름'은 개체명으로 사용하고, 엔트리의 '분류'는 각 개체명 클래스와의 상호정보량을 계산하여 엔트리와 개체명 클래스 사이의 점수를 계산한다. 이렇게 계산된 점수를 이용하여 개체명과 개체명 클래스를 매핑한다. 그 결과 76.7%의 평균 정확률을 보였다.

  • PDF

내연기관 연소 및 pollutant modeling

  • 허강열
    • 한국가시화정보학회:학술대회논문집
    • /
    • 한국가시화정보학회 2005년도 한국가시화정보학회 연소/내연기관 부문 학술강연회
    • /
    • pp.3-57
    • /
    • 2005
  • 왕복동 내연기관에서의 연소 및 배기가스 생성은 복잡한 3차원 영역 내에서 난류 유동, 분무, 화학반응, 열전달, 경계층 현상이 상호 연계되어 있는 매우 복합적인 과정이다. 특히 난류 연소 현상은 기관의 효율을 결정하는 연소 속도와 pollutant의 배출 농도를 결정하는 핵심 요소로서 관련 모델과 수치 해법에 대해 학술적, 공학적 측면에서 세계적으로 활발한 연구가 이루어지고 있다. 이를 위해 수행되는 다양한 실험 측정과 수치 해법을 통해 얻어지는 3차원 과도 상태의 방대한 스칼라량과 벡터량에 대한 정보를 효율적으로 처리하기 위해서는 적절한 가시화 과정이 필수적이다. 여기서는 최근 다양한 엔진 타입들에 대한 응용 사례와 함께 난류 연소 모델링을 위한 새로운 접근법으로서 조건평균법(conditional averaging)에 대해 간략히 소개하고자 한다. 난류예혼합연소에서의 난류화염속도에 대한 DNS와 영역조건평균에 기초한 예측식의 검증, 천연가스 jet의 자발화 지연기간, n-heptane jet의 자발화 진행 과정, HSDI 엔진, HCCI 엔진, CNG 엔진, LPG 분무 및 엔진, GDI 엔진 등에 대한 연구 결과들은 정보 가시화의 한 사례가 될 수 있을 것으로 생각된다.

  • PDF

신호 전송의 양과 질에서 위너의 MMSE와 샤논의 정보 이론적 정보량 극한 과 격자 코드 와의 만남 (Encounter of Lattice-type coding with Wiener's MMSE and Shannon's Information-Theoretic Capacity Limits in Quantity and Quality of Signal Transmission)

  • 박대철;이문호
    • 전자공학회논문지
    • /
    • 제50권8호
    • /
    • pp.83-93
    • /
    • 2013
  • 통계적 신호 전송에 관한 위너의 MMSE와 정보이론 관점에서 처음으로 증명한 샤논의 상호 정보량을 비교함으로서 둘 사이의 관련성을 연구하였다. 위너가 신호 전송에서 보려했던 것은 잡음이 존재하는 채널에서 복원하려는 신호의 전송 품질의 근본적 극한(limit)를 계산해내려는 것이라 해석할 수 있다. 반면, 샤논은 엔트로피 개념을 적용하여 상호 정보에 대한 불확실성의 차를 최대화로 하는 전송 정보량의 근본적 상한(upper bound)의 극한(limits)을 계산을 계산하려는 것이라 해석할 수 있다. 본 논문의 관심은 샤논의 점 대 점 채널 용량의 근본적 극한을 계산하는 샤논의 공식을 유도함에 있어 위너의 최소 평균 자승 오차(MMSE) 컴바이너에 의한 최적 위너 필터를 사용했을 때 위너의 MMSE와 샤논의 상호 정보량이 미적분관계로 연결되어 있음을 확인하는 것이며, 위너 필터의 MMSE 와 샤논의 상호 정보량이 만나는 점에서 대역 효율성의 상한과 에너지 효율성의 하한을 계산하였다. mod-${\Lambda}$ AWGN 채널 모델에 의한 적절한 성형 격자 ${\Lambda}$의 선택과 ${\alpha}$의 MMSE 추정에 의해 격자형 부호 방식이 샤논의 원래 채널 용량 극한에 미치게 됨을 확인하였다.

통합 칼리브레이션 가중치 산출 비교연구 (Integrated calibration weighting using complex auxiliary information)

  • 박인호;김수진
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.427-438
    • /
    • 2021
  • 이단추출은 개체와 집락 단수준별 모집단 특성을 함께 추정할 수 있게 해준다. 단위수준별 보조정보가 함께 주어질 때, 단위수준별 정보 및 가중치 구성을 통합적으로 고려한 칼리브레이션 가중치를 산출한다면 단위수준별 특성은 물론 수준간의 다변량적 특성도 적절히 반영할 수 있을 것이다. 본 연구는 Estevao와 Särndal (2006)과 Kim (2019)이 고려한 통합 칼리브레이션 가중치 산출 방법에 대해 살펴보았다. 간단한 모의실험을 통해 기존의 통합 칼리브레이션 가중치 산출방법의 효율성을 비교하였다. 이 중 복합보조정보를 개체화한 후 단일단계의 칼리브리이션 조정으로 가중치를 산출하되 집락가중치가 집락 내 개체가중치 평균이 되도록 정의하는 방법과 단위수준별 보조정보를 이용한 수준별 칼리브레이션 조정을 상호 반복적으로 수행하되 집락가중치가 집락 내 개체가중도치 평균이 되도록 하는 방법이 조정전 가중치의 변동량을 크게 늘리지 않고도 수준간 다변량적 특성을 잘 반영할 수 있음을 확인할 수 있었다. 집락과 개체의 상호간 보조정보에 대한 총합추정의 적합도 측면에서 매우 양호하였고, 칼리브레이션 조정에 포함되지 않는 조사특성들의 총합추정에 대한 상대편향 및 상대 평균 제곱근 오차가 작게 나타났다.

3차 칼라 오브젝트 관계에 의한 내용 기반 영상 검색 (Content-Based Image Retrieval using 3rd Order Color Object Relation)

  • 권희용;최재우;이인행;조동섭;황희융
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.500-502
    • /
    • 1998
  • 최근 정보 사회에서 중요한 기술로 자리잡은 멀티미디어 정보 검색에 대한 다양한연구가 진행 중에 있다. 본 논문은 정지 화상에 대한 CBIR(Content-Based Image Retrieval)방법 중 칼라 정보를 이용한 방법에서 공간 정보를 충분하게 표현할 수 있는 알고리즘을 제안한다. 일반적으로 칼라 정보를 이용한 CBIR에서는 공간정보를 표현하기 위하여 인위적으로 영상을 여러 개로 분할하는 방법이나 영상의 히스토그램 내에서 영상의 위치 정보를 이용하는 방법 등이 연구되었다. 본 논문에서는 기존의 방법을 칼라 오브젝트의 추출 방법에 따라 1차와 2차 관계에 의한 방법으로 분류하고, 이동, 회전 특히 크기 변화(축소, 확대)에 탁월한 성능을 보이는 3차 칼라 오브젝트 관계를 이용한 방법을 소개한다. 제안된 알고리즘은 주어진 영상으로부터 양자화 된 24개의 버킷(bucket)을 생성해서 각 버킷 내의 칼라에 대한 색의 표준 편차로 색의 분산 정도를 나타내고, 빈도수가 높은 3개 버킷의 평균 칼라 위치를 계산해서 그들의 상호 각도를 추출하여 영상의 특징 벡터로 사용하였다. 실험결과 기존 방법보다 특히 영상의 크기 변화에 대해 좋은 결과를 얻을 수 있었으며, 계산량도 적어 효율적임을 보여 주었다.

  • PDF

해석적 모형과 수치적 모형을 이용한 지하수 양수로 인한 하천수 감소량 산정 (Estimation of streamflow depletion due to groundwater pumping using analytical and numerical models)

  • 이정우;정일문;김남원;홍성훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.294-294
    • /
    • 2018
  • 복잡한 수문 수리지질학적 조건을 고려할 수 있는 SWAT-MODFLOW 지표수-지하수 통합모형과 대수층-하천-양수정 시스템을 단순화한 Hunt (1999) 해석해를 죽산천 인근 지역에 각각 적용하여 지하수 양수로 인한 하천수 감소량을 모의하고 그 결과를 비교하였다. 하천으로부터 약 1 km 이내에 위치한 천부 지하수 관정들 중에서 취수계획량이 $100m^3$/일을 초과하는 18개의 관정을 선별하고 지하수 양수량 대비 하천수 감소량(하천수 감소비)을 산정한 결과 대부분의 관정에서 해석해와 모델링 결과의 차이가 0.2 미만으로 매우 작은 것으로 나타났다. 따라서 해석해가 하천-대수층 시스템을 단순화한 조건에 대해 유도되었음에도 불구하고 정밀한 모델링에 준하는 결과를 나타낼 수 있는 것으로 분석되었다. 그러나, 양수기간이 장기화되거나 하천과 관정간의 이격거리가 증가함에 따라 해석해와 모의결과의 차이가 다소 증가하는 경향을 나타내었다. 해석해가 대수층 저류량의 감소와 하천수량의 감소가 장기적으로 균형을 이루는 동적 평형 상태를 구현할 수 없고 하천수위의 급격한 변화에 따른 하천수와 지하수간의 상호 교환량의 불규칙한 패턴 또한 모사할 수 없는 한계가 있지만 양수기간 5년 이내의 하천수 감소량의 평균적인 거동은 수치모의 결과와 유사한 것으로 평가되었다.

  • PDF

상관차원에 의한 볼베어링 고장진단 (Fault Diagnosis of Ball Bearing using Correlation Dimension)

  • 김진수;최연선
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2004년도 춘계학술대회논문집
    • /
    • pp.979-984
    • /
    • 2004
  • The ball bearing having faults generally shows, nonlinear vibration characteristics. For the effective method of fault diagnosis on bail bearing, non-linear diagnostic methods can be used. In this paper, the correlation dimension analysis based on nonlinear timeseries was applied to diagnose the faults of ball bearing. The correlation dimension analysis shows some Intrinsic information of underlying dynamical systems, and clear the classification of the fault of ball bearing.

  • PDF