• 제목/요약/키워드: 확률과정모델

검색결과 317건 처리시간 0.037초

텍스트 구성요소 판별 기법과 자질을 이용한 문서 요약 시스템의 개발 및 평가 (Development and Evaluation of a Document Summarization System using Features and a Text Component Identification Method)

  • 장동현;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.678-689
    • /
    • 2000
  • 논 본문은 문서의 주요 내용을 나타내는 문장을 추출함으로써 요약문을 작성하는 자동 요약 기법에 대해 기술하고 있다. 개발한 시스템은 문서 집합으로부터 추출한 어휘적, 통계적 정보를 고려하여 요약 문장을 작성하는 모델이다. 시스템은 크게 두 부분, 학습과정과 요약과정으로 구성이 된다. 학습 과정은 수동으로 작성한 요약문장으로부터 다양한 통계적인 정보를 추출하는 단계이며, 요약 과정은 학습 과정에서 추출한 정보를 이용하여 각 문장이 요약문장에 포함될 가능성을 계산하는 과정이다. 본 연구는 크게 세 가지 의의를 갖는다. 첫째, 개발된 시스템은 각 문장을 텍스트 구성 요소의 하나로 분류하는 텍스트 구성 요소 판별 모델을 사용한다. 이 과정을 통해 요약 문장에 포함될 가능성이 없는 문장을 미리 제거하는 효과를 얻게 된다. 둘째, 개발한 시스템이 영어 기반의 시스템을 발전시킨 것이지만, 각각의 자질을 독립적으로 요약에 적용시켰으며, Dempster-Shafer 규칙을 사용해서 다양한 자질의 확률 값을 혼합함으로써 문장이 요약문에 포함될 최종 확률을 계산하게 된다. 셋째, 기존의 시스템에서 사용하지 않은 새로운 자질 (feature)을 사용하였으며, 실험을 통하여 각각의 자질이 요약 시스템의 성능에 미치는 효과를 알아보았다.

  • PDF

넓은 유역에 있어서의 토양 수분 동력학의 모델링과 분석 (Modeling and Analysis of Soil Moisture Dynamics in the Large River Basin)

  • 이재수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 1994년도 수공학연구발표회논문집
    • /
    • pp.449-456
    • /
    • 1994
  • 넓은 지역(Arkansas River Basin)에 대하여 토양 수분을 기본으로한 물 수지 모델이 계절별 년별 시간단위로 연구되었다. 지표면과 대기 수분사이의 상호 작용과 재순환 효과에 대한 연구가 유역의 매개 변수화 과정에서 수행되었으며 대규모의 지표면과 대기사이의 상호 작용에 의하여 넓은 지역의 지표 수문은 장기간의 확률분포함수에 있어서 두가지 즉 건조와 습한 안정상태의 영향을 받는다. 토양수분 균형 방정식에서 추계학적 변동은 주위환경 변동에 의하여 야기되는 안정상태 사이의 변이와 함께 분리된 선호하는 통계학적 안정상태를 초래한다. 과거의 자료를 바탕으로 비선형 물수지 모델이 Arkansas강 유역에 대하여 검정되었다. 모델에서 안정상태 사이의 평균 변이시간이 물리과정의 추계학적 표현과 검정된 모델변수들로부터 계산되었다. 본 연구는 안정상태 사이의 변이시간 혹은 거주시간, 즉 시스템이 주어진 안정상태에 머무는 시간(가뭄이나 홍수상태의 지속기간)의 예측과 밀접한 관계가 있다.

  • PDF

효율적 영한기계번역을 위한 확률적 품사결정 (Probabilistic Part-Of-Speech Determination for Efficient English-Korean Machine Translation)

  • 김성동;김일민
    • 정보처리학회논문지B
    • /
    • 제17B권6호
    • /
    • pp.459-466
    • /
    • 2010
  • 자연언어처리는 여러 가지 모호성 문제를 가지는데, 특히 영한기계번역은 번역 과정의 각 단계마다 해결해야 할 모호성 문제를 가진다. 본 논문에서는 실용적인 영한기계번역 시스템의 개발을 목적으로 영어 분석의 효율성을 높이기 위해 영어 단어의 품사 모호성 해소 문제에 초점을 두었다. 기계번역의 효율성 제고를 위해 영한기계번역 시스템에 통합하기 위한 품사결정 모듈은 빠른 시간에 정확한 품사결정을 하면서도 오류를 최소화 하여야 한다. 본 논문에서는 확률적 품사결정 방법을 제안하고 3가지 품사결정 확률 모델을 제시하였다. Penn Treebank 말뭉치로부터의 통계 정보를 이용하여 확률 모델을 구축하였으며 실험을 통해 제안한 품사결정 방법의 정확성과 품사결정에 의한 기계번역 시스템의 효율 향상 정도를 제시하였다.

항목 내용물의 클러스터 정보를 고려한 협력필터링 방법의 확률적 재해석 (Probabilistic Reinterpretation of Collaborative Filtering Approaches Considering Cluster Information of Item Contents)

  • 김병만;이경금;오상엽
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권9호
    • /
    • pp.901-911
    • /
    • 2005
  • 인터넷의 상업적 이용이 증가하고 인터넷에서 쉽게 얻을 수 있는 정보의 양이 풍성해지면서 정보 필터링 (information filtering) 기법은 대량의 정보 공간에서 사용자의 요구와 기호에 맞는 항목을 찾는 과정에 널리 사용되고 있다. 많은 협력필터링 (collaborative filtering) 시스템이 사용자 평가를 기반으로 사용자나 항목들 사이의 유사성을 찾아내고 이를 바탕으로 추천을 해왔지만 사용자 편향 (user bias), 비전이 연관 (non-transitive association), cold start 문제와 같이 성능을 높이기 위해 해결해야 할 문제들이 남아있다. 이 세 가지 문제는 사용자나 항목들 사이에 더 정확한 유사도를 찾아내는 과정에 장애가 된다. 본 논문에서는 이러한 문제들을 해결하기 위해 제안된 UCHM 및 ICHM 방법을 확률적으로 재해석하였다. 이 확률적 모델은 객체 (사용자 또는 품목)들을 그룹들로 구분하고 각 그룹 내에서 사용자 평가가 가우시안 분포를 따른다는 가정 하에 사용자들이 무엇을 선호할 것인지 예측한다. 실세계 자료에 대한 실험 결과, 제안된 방식이 다른 방식들과 비교할 만한 성능을 보인다는 것을 확인할 수 있었다.

확률적 위험도 분석 모형을 이용한 아파트 재건축사업의 수익성예측모델 개발 (Development of Profitability-forecasting Model for Apartment Reconstruction Projects using the Probabilistic Risk Analysis)

  • 우광민;이학기
    • 한국건설관리학회:학술대회논문집
    • /
    • 한국건설관리학회 2007년도 정기학술발표대회 논문집
    • /
    • pp.54-59
    • /
    • 2007
  • 현재까지 아파트 재건축사업은 추진 의사결정과 관련한 확정된 지표나 기준이 없이 막연한 수익성에 대한 기대를 토대로 시행되어 왔으며, 사업시행과정에서 직면하게 되는 제반 위험에 대해 경험적으로 대응하여 왔다. 재건축조합이나 시공예정회사들이 관리처분계획을 통해 수익성을 비롯한 사업추진 의사결정과 관련한 정보를 제공하고 있으나, 결정론적 분석을 통한 단순한 예측에 불과하여 재건축시행 과정상의 유동적인 상황에서 예측결과가 자주 변경됨에 따라 결과를 신뢰하기 어려운 한계를 갖고 있다. 따라서 본 연구는 재건축사업의 수익성에 영향을 미치는 변수들을 확률적으로 평가하여 수익과 위험을 동시에 분석하는 수익성예측모델을 개발하고, 사례연구를 통해 개발모델의 적합성을 검증하여 기존의 결정론적 접근방식이 갖는 한계를 극복하고자 한다.

  • PDF

아파트 재건축사업의 수익성평가에 대한 확률적 위험도 분석 모형 적용방안 (Application of Probabilistic Risk Analysis for Profitability-Evaluation of Apartment Reconstruction Projects)

  • 우광민;이학기
    • 한국건설관리학회논문집
    • /
    • 제7권5호
    • /
    • pp.167-176
    • /
    • 2006
  • 현재 재건축사업은 추진 의사결정과 관련한 확정된 지표나 기준이 없이 막연한 수익성에 대한 기대를 토대로 시행되고 있으며, 사업시행과정 에서 직면하게 되는 제반 위험 에 대해 경험 적으로 대응하고 있는 실정이다. 또한 재건축조합이나 시공예정 회사들이 제공하는 관리처분계획에 포함된 수익성에 관한 정보는 결정론적 분석을 통한 단순한 예측에 불과하여 재건축을 시행하는 과정에서 결과가 수정되는 것이 일반적이다. 즉 수익성에 대한 예측이 재건축시행 과정상의 유동적인 상황에서 변경됨에 따라 예측결과에 대한 신뢰도는 근본적으로 내 외적인 한계를 갖고 있다. 본 연구는 재건축사업의 수익성에 영향을 미치는 변수들을 확률적으로 평가하여 수익과 위험을 동시에 분석하는 수익성예측모델을 개발하고, 사례연구를 통해 개발모델의 적합성을 검증하여 기존의 결정론적 접근방식이 갖는 한계를 극복하고자 한다.

Chirp 신호를 이용한 해저퇴적층의 음향학적 특성 역산 (Inversion of Acoustical Properties of Sedimentary Layers from Chirp Sonar Signals)

  • 박철수;성우제
    • 한국음향학회지
    • /
    • 제18권8호
    • /
    • pp.32-41
    • /
    • 1999
  • 본 논문은 chirp신호와 두 개의 근거리 청음기를 이용한 해저퇴적층의 음향학적 특성치 역산기법을 제시한다. 역산문제를 확률론적 모델로 정식화하고, 역산의 해를 역산인자의 a priori분포와 유사도함수의 곱으로 표현되는a posteriori 확률분포로 정의하였다. 퇴적층의 음속과 층두께의 a priori정보를 파형 매칭 기법으로 추정한 후 다수의 퇴적층이 존재하는 환경모델을 부분퇴적층모델로 치환하고, 계측신호와 모의신호의 L₂노음을 이용하여 정의된 목적함수에 대해 반복적인 유전자알고리즘 탐색을 수행하여 탐색공간의 축소로 인한 탐색효율과 결과의 향상을 얻었다. A posteriori 확률분포의 다중적분의 형태로 정의되는 인자의 주변확률분포와 평균의 추정은 유전자알고리즘의 탐색과정에서 선택된 탐색점들을 이용하여 수행되었다. 제시된 역산기법의 검증을 위해 두 가지 퇴적층 환경모델을 설정하고 잡음을 첨가한 합성신호에 대해 역산기법을 적용하여 역산해를 추정하였고 역산결과로부터 본 역산기법의 유용성을 확인하였다.

  • PDF

PCMM 기반 특징 보상 기법에서 변별력 향상을 위한 Minimum Classification Error 훈련의 적용 (Minimum Classification Error Training to Improve Discriminability of PCMM-Based Feature Compensation)

  • 김우일;고한석
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.58-68
    • /
    • 2005
  • 본 논문에서는 잡음 환경에서 강인한 음성 인식을 위하여 특징 보상 기법의 성능을 향상시킬 수 있는 방법을 제안한다. 기존의 음성 모델 기반의 특징 보상 기법에서 이용되는 오염 음성 모델 추정 방식은 입력 음성에 대한 변별력 있는 사후 확률 예측을 보장하지 못하며, 부정확하게 계산된 사후 확률은 복구된 음성에서 명료도 하락의 문제를 일으킨다. 제안하는 기법에서는 오염 음성 모델 추정 과정에 분별적 훈련 방식의 하나인 최소 분류 오류 (MCE) 훈련 기법을 도입한다. MCE 훈련 기법을 적용하기 위해 변별력 하락의 가능성을 가지는 '경쟁 요소' 를 결정하는 기법을 제안한다. 병렬결합된 혼합 모델 (PCMM) 기반의 특징 보상에 MCE 훈련 기법을 적용하는 과정을 제안하고 변별력 향상의 영향을 관찰한다. Aurora 2.0 데이터베이스와 실제 자동차 주행 환경에서 수집된 음성 데이터베이스에 대한 성능 평가를 실시한다. 실험 결과는 제안한 기법이 음성 인식 성능 향상에 도움이 되는 것을 입증한다.

사용자 의도 정보를 사용한 웹문서 분류

  • 장영철
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2008년도 추계 공동 국제학술대회
    • /
    • pp.292-297
    • /
    • 2008
  • 복잡한 시맨틱을 포함한 웹 문서를 정확히 범주화하고 이 과정을 자동화하기 위해서는 인간의 지식체계를 수용할 수 있는 표준화, 지능화, 자동화된 문서표현 및 분류기술이 필요하다. 이를 위해 키워드 빈도수, 문서내 키워드들의 관련성, 시소러스의 활용, 확률기법 적용 등에 사용자의도(intention) 정보를 활용한 범주화와 조정 프로세스를 도입하였다. 웹 문서 분류과정에서 시소러스 등을 사용하는 지식베이스 문서분류와 비 감독 학습을 하는 사전 지식체계(a priori)가 없는 유사성 문서분류 방법에 의도정보를 사용할 수 있도록 기반체계를 설계하였고 다시 이 두 방법의 차이는 Hybrid조정프로세스에서 조정하였다. 본 연구에서 설계된 HDCI(Hybrid Document Classification with Intention) 모델은 위의 웹 문서 분류과정과 이를 제어 및 보조하는 사용자 의도 분석과정으로 구성되어 있다. 의도분석과정에 키워드와 함께 제공된 사용자 의도는 도메인 지식(domain Knowledge)을 이용하여 의도간 계층트리(intention hierarchy tree)를 구성하고 이는 문서 분류시 제약(constraint) 또는 가이드의 역할로 사용자 의도 프로파일(profile) 또는 문서 특성 대표 키워드를 추출하게 된다. HDCI는 문서간 유사성에 근거한 상향식(bottom-up)의 확률적인 접근에서 통제 및 안내의 역할을 수행하고 지식베이스(시소러스) 접근 방식에서 다양성에 한계가 있는 키워들 간 관계설정의 정확도를 높인다.

  • PDF

모델변환에 의한 시뮬레이션 모델의 타당성 검사 (A Validation Check of Simulation Model with the Model Transformation)

  • 정영식
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1992년도 제2회 정기총회 및 추계학술 발표회 발표논문 초록
    • /
    • pp.9-9
    • /
    • 1992
  • 시뮬레이션(simulation)은 실 시스템(real system)의 효과적이고 효율적인 운영을 도모하기 위하여 실 시스템의 동작을 이해하고 분석, 예측, 평가하는 과학적인 문제해결 접근방법이다. 시뮬레이션 수행단계는 실 시스템의 행위를 정확히 반영하도록 타당한 모델을 구축하는 모델링 단계와 모델에 의도하는 명령어들을 컴퓨터 프로그램으로 작성하는 구현단계로 나누어진다. 시뮬레이션 모델은 시간, 상태, 확률변수, 상호규칙 등의 여러 관점에 따라 다양하게 존재하는데, DEVS(Descrete EVent system Specification) 모델은 연속적인 시간상에서 이산적으로 발생하는 사건에 따라 시스템의 상태를 분석할 수 있고 모델링 및 시뮬레이션 방법론의 형식화를 위한 견고한 이론적 기반을 제공하고 있다. 또한, DEVS 모델은 모듈적, 계층적 특성을 제공하고 집합론에 근거한 수학적 형식구조를 제공하여 실 시스템에 대한 체계적인 분석과정을 수행하게 되어 보다 현실적인 모델링을 가능하게 한다. 그러나 타당하지 못한 DEVS 모델이 구축되면 시뮬레이션을 통한 분석결과의 신뢰성이 떨어져 아무런 효과가 없고 경제적인 손실만이 따른다. DEVS 모델에 대한 기존의 타당성 검사가 많은 시간과 노력이 요구되고, 반복적인 DEVS 모델링 과정으로 인한 전문적이고 경험적인 지식을 요구한다. 또한, 모델설계자에 의해 설정된 실험 프레임하에서 DEVS 모델의 구성요소에 속하는 상태전이함수, 시간진행함수 및 출력함수에 대하여 commutative 성질의 보전성 검사가 어렵다는 문제점을 가지고 있다. 본 연구에서는 이와 같은 문제점을 해결하기 위하여, DEVS 모델에 대한 타당성 검사를 SPN(Stochastic Petri Net) 모델로 변환하여 SPN 모델을 이용하는 간단하고 효과적인 타당성 검사 방법을 제안한다. 먼저, DEVs 모델에 대한 개념과 기존의 DEVS 모델에 대한 타당성 검사 방법을 고찰하고 그 문제점에 대하여 자세히 설명한다. DEVS 모델의 타당성 검사에 이용하는 SPN 모델에 대한 개념과 DEVS 모델과 행위적으로 동등한 SNP 모델로 변환을 위한 관점을 제조명하다. 동일한 관점에서 두 모델의 상태표현이 같도록 DEVS 모델이 SPN 모델로 표현됨을 보이는 변환이론을 제시하고 변환이론을 바탕으로 모델 변환과정을 제시한다. 모델 변환이론과 변환고정을 기본으로 타당성 검사를 위한 새로운 동질함수(homogeneous function)를 정의하고 이와 함께 SPN 모델의 특성을 이용하여 DEVS 모델에 대한 타당성 검사 방법을 새롭게 제안한다.

  • PDF