• Title/Summary/Keyword: 확률 모델

Search Result 2,130, Processing Time 0.044 seconds

Confusion Model Selection Criterion for On-Line Handwritten Numeral Recognition (온라인 필기 숫자 인식을 위한 혼동 모델 선택 기준)

  • Park, Mi-Na;Ha, Jin-Young
    • Journal of KIISE:Software and Applications
    • /
    • v.34 no.11
    • /
    • pp.1001-1010
    • /
    • 2007
  • HMM tends to output high probability for not only the proper class data but confusable class data, since the modeling power increases as the number of parameters increases. Thus it may not be helpful for discrimination to simply increase the number of parameters of HMM. We proposed two methods in this paper. One is a CMC(Confusion Likelihood Model Selection Criterion) using confusion class data probability, the other is a new recognition method, RCM(Recognition Using Confusion Models). In the proposed recognition method, confusion models are constructed using confusable class data, then confusion models are used to depress misrecognition by confusion likelihood is subtracted from the corresponding standard model probability. We found that CMC showed better results using fewer number of parameters compared with ML, ALC2, and BIC. RCM recorded 93.08% recognition rate, which is 1.5% higher result by reducing 17.4% of errors than using standard model only.

Efficient Relay Node Selection in Stochastic DTN Model (확률적 DTN 모델에서 효율적인 중계 노드 선택 방법)

  • Dho, Yoon-Hyng;Lee, Kang-Whan
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.05a
    • /
    • pp.367-370
    • /
    • 2017
  • This paper proposes a method for selecting efficient relay nodes in stochastic DTN model. Delay Tolerant Network (DTN) uses the Carry and Forward method, which creates a bundle layer for efficient communication, selects relay nodes between different networks and heterogeneous networks, and forwards messages. DTN is basically composed of mobile nodes so DTN has no fixed routing route and it has long latency due to intermittent connection. Therefore, the nodes constituting the DTN necessarily have the characteristics to store the messages, and the capacity of the stored messages and nodes affects the performance of the network. Stochastic DTN model proposed a Markov model that changes randomly over time to analyze the performance of DTN. In this paper, we use stochastic message distribution and node contact probabilities using contact time analyzed through message generation and extinction in order to select efficient relay nodes in stochastic DTN model.

  • PDF

Modeling Scheme for Calculating Encounter Probability Versus Minefleld Density (지뢰지대 밀도별 접촉확률 산정 모델링 방안)

  • Baek, Doo-Hyeon;Lee, Sang-Heon
    • Journal of the military operations research society of Korea
    • /
    • v.35 no.2
    • /
    • pp.77-86
    • /
    • 2009
  • The encounter probability graph is measured by the chance(in percent) that a vehicle, blindly moving through a minefield, will detonate a mine. The encounter probability graph versus minefield density is presented in ROK and US Army field manual but this graph is baseless because these data had not been presented as those of live mobility or wargame. In this paper, we verified this graph building procedure model as using computer program. The result values of program are almost like those of graph. Therefore this model for our to suggest have validation, verification that a modeling demand and we convince that this model will be useful for calculating encounter probability of multiple vehicles.

Retrieval Model Based on Word Translation Probabilities and the Degree of Association of Query Concept (어휘 번역확률과 질의개념연관도를 반영한 검색 모델)

  • Kim, Jun-Gil;Lee, Kyung-Soon
    • The KIPS Transactions:PartB
    • /
    • v.19B no.3
    • /
    • pp.183-188
    • /
    • 2012
  • One of the major challenge for retrieval performance is the word mismatch between user's queries and documents in information retrieval. To solve the word mismatch problem, we propose a retrieval model based on the degree of association of query concept and word translation probabilities in translation-based model. The word translation probabilities are calculated based on the set of a sentence and its succeeding sentence pair. To validate the proposed method, we experimented on TREC AP test collection. The experimental results show that the proposed model achieved significant improvement over the language model and outperformed translation-based language model.

Development of POS Tagging System Independent to Word Spacing (띄어쓰기 비종속 품사 태깅 시스템 개발)

  • Lee, Kyung-Il;Ahn, Tae-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.69-72
    • /
    • 2003
  • 본 논문에서는 입력된 한국어 문자열로부터 형태소를 분석하고, 품사를 태깅하는 방법에 있어 개선된 통계적 모델을 제안하고, 이에 기반한 띄어쓰기 비종속 형태소 분석 및 태깅 시스템의 개발과 성능 평가에 대한 결과를 소개하고 있다. 제안된 통계 기반품사 태깅 시스템은 입력된 문자열로부터 음절의 띄어쓰기 확률값을 계산하여 유사어절을 생성하고, 유사어절 단위로 사용자 띄어쓰기와 상관없이 형태소 후보 리스트를 생성하며, 인접한 후보 형태소들의 접속 확률 계산에 있어 어절 간 접속 확률과 어절 내 접속 확률을 모두 사용함으로, 최적의 형태소 리스트를 결정하는 모델을 사용하고 있다. 특히, 형태소들의 접속 확률 계산 시 어절 간 접속 확률과 어절 내 접속 확률의 결합 비율이 음절의 띄어쓰기 확률 값과 사용자의 띄어쓰기 여부에 따라 자동으로 조절되는 특징을 가지고 있으며, 이를 통해 극단적으로 띄어 쓰거나 붙여 쓴 문장에 대해서도 평균 90%수준의 품사 태깅 성능을 달성할 수 있었다.

  • PDF

Dimension-Reduced Model for Word Co-occurrence Probability Estimation (단어 공기 확률 추정을 위한 차원 축소 모델)

  • 김길연;최기선
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.05a
    • /
    • pp.137-142
    • /
    • 2000
  • 본 논문에서는 확률적 자연언어 처리에서 중요한 문제인 자료 희귀(data sparseness)의 어려움을 해결하는 새로운 방법으로 차원 축소 모델을 제시한다. 세 가지의 세부 방법이 제안되었으며 Katz의 back-off 방법의 성능을 최저로 했을 때에 비해 약 60%정도의 성능이 향상되었다. 현재까지 최고의 성능을 보이고 있는 유사도 기반의 방법에 비해서도 약 5∼20%의 성능이 향상되었다. 따라서 차원 축소 모델은 확률 추정의 새로운 방법으로 쓰일 수 있다.

  • PDF

Automatic Text Categorization by Term Weighting and Inverted Category Frequency (용어 가중치와 역범주 빈도에 의한 자동문서 범주화)

  • Lee, Kyung-Chan;Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.14-17
    • /
    • 2003
  • 문서의 확률을 이용하여 자동으로 문서를 분류하는 문서 범주화 기법의 대표적인 방법이 나이브 베이지언 확률 모델이다. 이 방법의 기본 형식은 출현 용어의 확률 계산 방법이다. 하지만 실제 문서 범주화 과정에서 출현하지 않는 용어들도 성능에 많은 영향을 줄 수 있으며, 출현 용어들에 대한 빈도 이외의 역범주 빈도나 용어가중치를 적용하여 문서 범주화 시스템의 성능을 향상시킬 수 있다. 본 논문에서는 나이브 베이지언 확률 모델에 출현 용어와 출현하지 않는 용어들에 대한 smoothing 기법을 적용하여 실험하였다. 성능 평가를 위해 뉴스그룹 문서들을 이용하였으며, 역범주 빈도와 가중치를 적용했을 때 나이브 베이지언 확률 모델에 비해 약 7% 정도 성능 개선 효과가 있었다.

  • PDF

Dynamic Adaptive Model for WebMedia Educational Systems based on Discrete Probability Techniques (이산 확률 기법에 기반한 웹미디어 교육 시스템을 위한 동적 적응 모델)

  • Lee, Yoon-Soo
    • Journal of the Korea Computer Industry Society
    • /
    • v.5 no.9
    • /
    • pp.921-928
    • /
    • 2004
  • This paper proposed dynamic adaptive model based on discrete probability distribution function and user profile in web based HyperMedia educational systems. This modelsrepresents application domain to weighted direction graph of dynamic adaptive objects andmodeling user actions using dynamically approach method structured on discrete probability function. Proposed probabilitic analysis can use that presenting potential attribute to useractions that are tracing search actions of user in WebMedia structure. This approach methodscan allocate dynamically appropriate profiles to user.

  • PDF

기상예보기반 실화발생 확률 추정

  • Ryu, Jeong-U;Kim, Eun-Ju;Choe, Jeong-U
    • Proceedings of the Korea Institute of Fire Science and Engineering Conference
    • /
    • 2013.11a
    • /
    • pp.109-110
    • /
    • 2013
  • 본 논문에서는 기상조건에 따라 실화발생 확률을 추정할 수 있는 방법을 제안한다. 제안한 방법에서는 화재조사데이터와 기상데이터간의 관계를 데이터마이닝 기법인 의사결정트리로 모델링한 후, 생성된 모델을 가지고 기상조건에 따라 실화발생 확률을 추정한다. 16개 시도별로 5년동안 발생된 화재조사데이터와 매시간 관측된 기상데이터를 가지고 각각 시도별로 모델을 생성하였다. 생성된 16개 모델들 모두는 기상조건을 고려하지 않고 확률을 추정한 경우보다 오차가 작았으며, 모델들로부터 생성된 IF~THEN 형태의 규칙들을 통해 실화가 습도와 관련성이 높다는 현업에서의 가정에 부합되는 것을 확인하였다.

  • PDF

Analysis of Subsampling Effects in Pattern Completion by Hypernetwork Learning Based on Probabilistic Library Model (확률라이브러리모델 기반의 Hypernetwork 학습에 의한 패턴완성시의 Subsampling 효과 분석)

  • Kim Joo-Kyung;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.352-354
    • /
    • 2006
  • 패턴완성(Pattern Completion)은 사용되는 패턴 성분들 사이의 higher-order correlation 정보가 중요한 의미를 가질 수 있는 기계학습 문제 중 하나이다. higher-order correlation은 확률라이브러리모델(Probabilistic Library Model)로 구현되는 hypernetwork 개념을 도입해서 나타낼 수 있다. 하지만 확률라이브러리모델을 사용하여 higher-order 정보를 나타내려할 때 초기라이브러리가 모든 가능한 조합의 원소들을 가지도록 구성하기는 쉽지 않다. 그 대안으로 초기라이브러리 구성 시 학습패턴들을 subsampling하여 적은 숫자의 원소들만으로 higher-order correlation의 근사치를 나타내게 할 수 있다. 본 논문에서는 이와 같이 subsampling이 사용되어 구성된 확률라이브러리모델을 이용한 패턴완성시의 correlation의 order에 따른 효과를 분석하여 본다.

  • PDF