• 제목/요약/키워드: 최대 엔트로피 모형

검색결과 10건 처리시간 0.03초

패널회귀모형에서 최대엔트로피 추정량에 관한 연구 (A Study of Generalized Maximum Entropy Estimator for the Panel Regression Model)

  • 송석헌;전수영
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.521-534
    • /
    • 2006
  • 횡단면 자료와 시계열 자료가 병합된 패널회귀모형을 다루는 대부분의 연구들에서 사용되고 있는 자료는 완전한 자료를 고려하고 있다. 그러나, 실제적으로 완전한 자료보다는 불완전한 자료가 많다. 이러한 상황을 고려하지 않고 통계적인 추론을 하게 되면 잘못된 결론이 도출될 수 있다. 따라서, 자료의 형태를 충분히 고려한 추정량을 바탕으로 자료를 분석해야 한다. 본 연구는 패널회귀모형에서 자료가 불완전 상태인 경우 최대 엔트로피 형식을 이용한 일반화최대엔트로피 추정량을 제안하고, 추정량들의 효율성을 모의실험을 통하여 비교하였다. 모의실험 결과, 일반화 최대엔트로피 추정량이 가장 안정적이고 효율적인 추정량임을 보여주었다.

엔트로피 이론을 이용한 사전 확률 분포함수의 추정 (Prior distributions using the entropy principles)

  • Lee, Jung-Jin;Shin, Wan-Seon
    • 응용통계연구
    • /
    • 제3권2호
    • /
    • pp.91-105
    • /
    • 1990
  • 베이시안 결정론에서 사전 확률 분포함수는 표본을 추출하기 이전에 추정하여야 한다. 대개 는 분포함수군을 먼저 선택한 후, 그 중 하나를 결정자의 경험을 통하여 선택한다. 이러한 주관적인 사전 확률 분포함수의 선택방법이 베이시안 결정론에 대한 주요비판이 항상 되어 왔다. 본 논문에서는 최대 엔트로피 이론을 이용하여 우리 주변의 의사결정에 많이 이용되 는 정보들에 관한 객관적인 사전 확률 분포함수들을 구하였다. 그 결과는 히스토그램 형태 의 분포함수가 된다. 그러나 사전 정보가 많은 경우에는 최대 엔트로피 모형의 해를 구하기 위하여 복잡한 비선형 연립방정식을 풀어야 하는데, 구체적인 형태의 함수를 구하지 못하는 경우가 대부분이다. 이 때에는 초소의 크로스 엔트로피 모형을 이용하여 사전확률 분포함수 를 구하는 것이 편리하다. 그밖에 엔트로피 이론으로 구한 사전확률 분포함수의 확률적 수 렴성을 증명하였다.

  • PDF

오차항이 SAR(1)을 따르는 공간선형회귀모형에서 일반화 최대엔트로피 추정량에 관한 연구 (Generalized Maximum Entropy Estimator for the Linear Regression Model with a Spatial Autoregressive Disturbance)

  • 전수영;임성섭
    • Communications for Statistical Applications and Methods
    • /
    • 제16권2호
    • /
    • pp.265-275
    • /
    • 2009
  • 지역적 공간의 특성을 고려한 공간선형회귀모형을 다루는 대부분의 연구들에서 사용되고 있는 자료는 완전한 상태임을 고려하고 있다. 하지만 공간선형회귀모형을 정확히 추론함에 있어서 완전한 자료가 사용 가능한 경우는 그다지 많지가 않은 것이 현실이다. 만약 이러한 상황을 고려하지 않고 통계적 추론을 할 경우 잘못된 결론이 도출될 수 있다. 본 연구에서는 오차항이 일차 공간자기상관을 따르는 공간선형회귀모형에서 자료가 불완전한 상태 일 경우 일반화 최대엔트로피 형식을 이용하여 미지의 모수를 추정하는 방법을 제안하였고 몬테카를로 모의실험을 통하여 여러 전통적인 추정량들과 효율성을 비교하였다. 그 결과, 자료가 불완전한 상태에서 일반화 최대엔트로피 추정량이 다른 추정방법들에 비해 효율적인 추정치를 제공하였다.

용어간 종속성을 이용한 문서 순위 매기기에 의한 확률적 정보 검색 (A probabilistic information retrieval model by document ranking using term dependencies)

  • 유현조;이정진
    • 응용통계연구
    • /
    • 제32권5호
    • /
    • pp.763-782
    • /
    • 2019
  • 텍스트 문서 집합에 대한 정보검색에서는 주어진 질의에 부합하는 각 문서의 적합도 확률을 계산하고 이 확률이 높은 것부터 낮은 순으로 문서 순위를 정하여 사용자에게 제공한다, 각 문서의 적합도 확률 계산에 많이 사용되는 모형은 단어들이 확률적으로 독립이라는 가정 하에 확률을 추정한다. 이 모형은 단어들의 결합 확률을 계산하는 것이 현실적으로 어렵다는 점에서 많이 이용되고 있지만 질의에 사용되는 단어들이 대개 서로 관련성을 가지고 있다는 사실을 고려하고 있지 않다. 본 논문에서는 단어 자질들의 의존 구조를 고려하여 문서의 적합도 확률을 계산하기 위하여 단어들의 결합 패턴의 확률을 다항분포 모형으로 가정하고, 최대 엔트로피 방법으로 확률을 추정하여 문서 순위를 매기는 정보검색 모형을 제안한다. 여러 가지 다항분포 상황에서 시뮬레이션 실험을 한 결과 변수들의 독립을 가정한 모형보다 더 우수한 추정 결과를 보여 준다. 실제 LETOR OHSUMED 데이터 이용한 문서 순위 매기기 실험의 결과도 더 나은 검색 결과를 보여 준다.

HLLL 근사 Riemann 해법을 이용한 천수방정식의 수치해석 (A Numerical Analysis of the Shallow Water Equations Using the HLLL Approximate Riemann Solver)

  • 황승용;이삼희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.148-148
    • /
    • 2011
  • Riemann 문제는 천수방정식과 같은 쌍곡선형 방정식과 단일한 도약에 의해 불연속인 어떤 점의 좌 우에서 상수인 자료로 구성되는 초기치 문제로서 그 해법은 Godunov 방법과 같이 정확해에 의하면 정확 Riemann 해법, 근사 기법에 의하면 근사 Riemann 해법으로 불린다. 지금까지 이용되는 근사 Riemann 해법으로는 1981년에 P. L. Roe가 제안한 Roe의 선형화 기법과 1983년에 A. Harten, P. D. Lax, 그리고 B. van Leer가 제안한 HLL 기법의 수정 기법들이다. 최대 및 최소 파속만 고려하는 것으로 알려진 HLL 기법은 1988년에 B. Einfeldt의 제안에 의해 두 파속의 결정에서 Roe의 선형화 기법에 따른 고유치와 비교하는 것으로 수정되었다(HLLE 기법). 또한, 1994년에 E. F. Toro 등은 접촉파를 고려하기 위해 선형화된 지배방정식의 정확해로부터 중앙 파속을 고려하는 기법을 제안하였고, 이를 HLLC 기법으로 불렀다. 2002년에 T. Linde는 중앙 파속을 평가하기 위해 일반화된(수학적) 엔트로피 함수를 도입하였으며, van Leer는 이를 HLLL 기법으로 불렀다. 이 기법에서는 접촉파의 평가를 위해 보존변수에 대한 일반화된 엔트로피 함수로부터 중앙 파속이 유도되며, 이것과 특성 속도의 비교를 통해 최대 및 최소 파속이 결정된다. 따라서 이 기법에서는 모든 파속이 초기치로부터 결정되므로 HLLE 기법과 달리 Roe의 선형화 기법과 완전히 결별되고 HLLC 기법과 달리 정확해에 의존되지 않는 점에서 HLLL 기법은 모태인 HLL 기법의 온전한 계승으로 볼 수 있다. HLLL 기법은 여러 분야에 적용된 바 있으나, 수공학 분야에 적용된 사례는 알려진 바 없다. 이는 천수방정식에 대한 (물리적) 엔트로피 함수가 명확하지 않기 때문인 것으로 보인다. 이 연구에서는 보존변수로부터 정의되는 총 에너지를 일반화된 엔트로피 함수로 간주하여 모형을 구성하고, 정확해가 알려진 1차원 문제에 대해 적용성을 검토하였다. 정확해가 알려진 경우에 대해 모의한 결과, 1차 정도 수치해의 한계에도 불구하고, HLLL 기법의 결과는 대체로 정확해와 잘 일치하였으며 그 외의 HLL-형 기법의 그것에 비해 우수한 것으로 나타났다. 특히, 물이 빠져 바닥이 드러나는 상태에 대한 접촉 파속의 추정에서 Riemann 불변량을 이용하는 HLLC 기법에 비해 물이 빠지는 전선을 더 정확하게 포착하는 HLLL 기법의 결과는 매우 고무적이었다.

  • PDF

결정적 어닐링 EM 알고리즘을 이요한 칼라 영상의 분할 (Segmentation of Color Image using the Deterministic Annealing EM Algorithm)

  • 조완현;박종현;박순영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.324-333
    • /
    • 2001
  • 본 논문에서는 가우시안 혼합모형을 이용한 새로운 칼라 영상의 분할 알고리즘을 제안한다. 기존의 EM 알고리즘의 문제점인 국부적 최대값의 문제를 해결하기 위하여 최대 엔트로피의 원리를 이용하는 결정적 어닐링 EM 알고리즘을 소개하였고, 여러 색상들로 구성된 영상에 대하여 가우시안 혼합모형을 가정하였으며, 결정적 어닐링 EM 알고리즘을 사용하여 이들의 모수를 추정하는 방법을 알아보았다. 또한 혼합모형에 성분의 수를 자동으로 결정할 수 있는 방법을 제시하였으며 선택된 최적의 혼합모형을 사용하여 각 화소에 대한 사후확률을 계산하고 이들의 최대값을 이용하여 영상분할을 실시하였다. 결정적 어닐링 EM 알고리즘이 기존의 EM 알고리즘보다 혼합모형의 모수를 더 정확하게 추정한다는 것과 혼합모형의 성분의 수를 결정하는 제안된 방법의 성능을 실험결과를 통하여 고찰하였고, 또한 두 가지 실제 영상을 통하여 제안된 알고리즘이 기존의 알고리즘 보다 영상을 더 효율적으로 분할 할 수 있음을 보였다.

  • PDF

절 경계와 트리 거리를 사용한 2단계 부분 의미 분석 시스템 (A Two-Phase Shallow Semantic Parsing System Using Clause Boundary Information and Tree Distance)

  • 박경미;황규백
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.531-540
    • /
    • 2010
  • 본 논문은 최대 엔트로피 모형에 기반한 두 단계 부분 의미 분석 방법을 제안한다. 먼저, 의미 논항의 경계를 인식하고, 그 다음 단계에서 확인된 논항에 적절한 의미역을 할당한다. 두 단계 부분 의미 분석에서는 두 번째 단계인 논항 분류가 논항 확인 단계의 결과에 기반하여 수행되기 때문에 논항 확인의 성능이 매우 중요하다. 본 논문은 논항 확인의 성능을 향상시키기 위하여 논항 확인의 전처리 단계에 구문 지식을 통합한다. 구체적으로, 절 인식 결과로부터 술어의 인접절 및 상위절들을 확인하고, 구문 분석 결과로부터 술어의 부모 노드로부터 구문 구성 요소의 부모 노드까지의 트리 거리를 추출하여 전처리 단계에서 활용한다. 실험을 통해, 구문 지식을 활용하는 것이 부분 의미 분석 성능에 기여함과 제안하는 두 단계 방법이 한 단계 방법보다 우수한 성능을 낼 수 있음을 보인다.

하수관망 내 모니터링 지점 선정 기법 (Method to Determinate Monitoring Points in Sewer Networks)

  • 이정호;전환돈;박무종
    • 한국방재학회 논문집
    • /
    • 제11권3호
    • /
    • pp.229-235
    • /
    • 2011
  • 하수관거시스템(sewer system)의 효율적인 관리를 위해서는 관거 내의 유량, 수질, 불명수 및 CSOs (Combined Sewer Overflows) 등에 대한 지속적인 모니터링이 필요하며, 따라서 하수관망에서의 모니터링은 하천 방재 측면에서 매우 중요한 요소이다. 그런데, 하나의 유역 하수관거시스템에서 모든 지점에 대한 모니터링은 예산의 제약으로 인하여 불가능하다. 따라서 모니터링 지점들은 주어진 예산 내에서 최대의 효율적인 자료의 획득이 가능한 지점들로서 선정되어야 한다. 그럼에도 불구하고 모니터링 지점의 선정에 대한 명확한 기준 및 선정된 모니터링 지점에서 획득된 자료에 대한 정량화된 평가 방법에 관한 연구는 미흡한 실정이다. 본 연구에서는 이러한 문제점을 해결하고 수질 자료의 효율적인 모니터링을 위하여 하수관거시스템 내에서 수질 측정지점의 선정에 대하여 유전자알고리즘을 이용한 최적화 방법을 제시하였다. 제시된 수질측정지점 선정 모형은 엔트로피 방법을 이용하여 지점별 획득 자료에 대하여 정량적으로 평가하며, 수질측정지점의 선정에 따른 수집 자료에 대한 총 엔트로피의 최대화를 목적함수로 한다. 여기서 수집 자료들에 대한 엔트로피 평가는 자료의 변동 특성을 반영하며, 자료의 획득 가능한 범위를 의미한다. 이때 수질의 측정은 유량의 관측과 동일한 지점에서 이루어져야 하므로, 수질측정지점 선정에 대한 제약 조건은 주어진 예산에 따른 유량계 설치 가능 개수로서 이루어졌다.

대화시스템의 로그를 이용한 대화예제의 자동 확충에 관한 연구 (A Study on Automatic Expansion of Dialogue Examples Using Logs of a Dialogue System)

  • 홍금원;이정훈;신중휘;이도길;임해창
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.257-262
    • /
    • 2009
  • 본 논문은 예제기반 대화시스템의 대화 로그를 분석하여 새로운 대화예제를 자동으로 확충하는 방법에 대해서 논한다. 전통적인 예제기반 대화 시스템에서는 사용자와 챗봇(chatbot)간의 대화예제를 수작업으로 구축 하기 때문에 많은 시간과 비용이 소요되는 단점을 가지고 있다. 대화 로그는 대화 시스템의 서비스가 지속되는 한 끊임없이 생성이 되며, 시간이 지날수록 풍부하고 다양한 대화예제를 획득할 수 있다는 장점을 갖는다. 본 논문은 대화로그로부터 자연스러운 발화쌍을 분류하고, 분류된 발화쌍을 대화예제로 추가하는 방법을 제안한다. 최대 엔트로피모형을 사용한 실험의 결과, 자연스러운 발화를 결정하기 위해서는 발화의 어휘, 품사, 양태와 같은 자질이 유용하게 사용될 수 있음을 관찰하였고, 수작업 구축에만 의존하던 대화예제가 대화 로그를 사용하여 자동으로 확충될 수 있음을 확인하였다.

  • PDF

뉴트리아(Myocastor coypus) 분포밀도 및 잠재적 서식가능지역 예측에 따른 관리방향 (A Management Plan According to the Estimation of Nutria (Myocastorcoypus) Distribution Density and Potential Suitable Habitat)

  • 김아름;김영채;이도훈
    • 환경영향평가
    • /
    • 제27권2호
    • /
    • pp.203-214
    • /
    • 2018
  • 본 연구는 국내에 서식하는 뉴트리아의 집중분포지역과 잠재적인 서식가능지역을 예측하여 효과적인 관리방향 설정에 유용한 자료를 제공하고자 하였다. 뉴트리아의 전국 분포 자료를 토대로 CVh(가능도 교차타당성)값을 띠폭(bandwidth)에 적용하여 분포밀도를 분석한 결과, 부산광역시, 대구광역시, 경상남도 소재 11개 시 군, 경상북도 소재 1개 군 등 낙동강수계에 위치한 14개 행정구역 내에서 우선적인 제거가 필요한 집중분포지역이 확인되었다. MaxEnt 모델을 이용한 잠재적인 서식가능지역 예측에서는 낙동강 중 하류 일대와 섬진강 하류, 가화천 일대에서 출현 가능성이 나타났다. 모형의 변수별 기여도는 고도, 건조한 달의 강수량, 가장 추운달의 최저온도, 수계로부터의 거리 순으로 높은 기여도를 보였으며, 출현확률과의 관계를 살펴보면, 고도 34m 이하의 저지대, 가장 추운달의 최저온도가 $-5.7^{\circ}C$이상 $-0.6^{\circ}C$ 이하인 지역, 가장 건조한 달의 강수량이 15-30mm, 수계로부터 1,373m 이하인 지역에서 임계값보다 높은 출현확률을 보였다. 뉴트리아의 생태적 특성과 본 연구결과를 종합하면, 고도, 물과의 접근성 및 이용성, 겨울철 낮은 기온이 뉴트리아의 정착과 확산에 영향을 주는 주요 요인으로 판단되므로 향후 서식가능지역의 검출과 확산 예측 모델링에 있어 중요한 변수로 검토될 수 있다. 뉴트리아와 같은 침입외래생물의 집중분포지역과 관리대상지역을 구분하고 그에 적합한 관리전략을 수립하여 관리현장에 적용하는 것은 영구적인 제어 목적의 관리에 있어 필수적인 사항이다. 본 연구에서 제시된 결과는 우선관리대상지역의 신속한 관리와 확산가능지역에 대한 사전 예방적 관리 등 전략적인 관리의 실행에 있어 유용한 자료로 활용될 수 있다.