• 제목/요약/키워드: 확률 모델

검색결과 2,130건 처리시간 0.035초

온라인 필기 숫자 인식을 위한 혼동 모델 선택 기준 (Confusion Model Selection Criterion for On-Line Handwritten Numeral Recognition)

  • 박미나;하진영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권11호
    • /
    • pp.1001-1010
    • /
    • 2007
  • HMM은 파라미터의 수가 많을수록 모델링 성능이 향상되어 해당 클래스 데이타는 뿐만 아니라 혼동되는 다른 클래스 데이타에 대해서도 높은 확률을 출력하는 경향이 있다. 그러므로 단순히 파라미터 수를 증가 시키는 것은 변별력 향상에 도움이 되지 않는다. 본 논문에서는 혼동되는 클래스 데이터의 확률을 이용한 혼동 확률 선택 기준CMC(Confusion Model Selection Criterion)과 혼동 클래스 데이터를 구성하여 혼동 모델을 만들고 이것을 이용한 새로운 인식 방법인 RCM(Recognition using Confusion Models)을 제안하였다. 제안한 인식 방법은 혼동되는 클래스 데이타의 구성으로 혼동 데이타 집합을 만들고 이것을 이용하여 별도의 혼동 모델을 훈련한 후, 혼동 모델의 확률을 해당 표준 모델의 확률에서 차감하여 해당 클래스 데이타의 오인식 가능성을 억제한다. 모델 선택 기준 CMC를 온라인 필기 숫자 데이타를 대상으로 실험하여 기존 모델 선택 기준인 ML, ALC2, BIC와 비교 분석한 결과, 제안한 방법인 CMC가 적은 파라미터로 좋은 결과를 보였으며, 제안한 혼동 모델 인식 방법인 RCM은 93.08%의 인식률을 보여 표준 모델만을 사용한 인식한 방법보다 정인식률이 약 1.5%향상되었고, 이는 오류의 17.4%가 감소된 결과이다.

확률적 DTN 모델에서 효율적인 중계 노드 선택 방법 (Efficient Relay Node Selection in Stochastic DTN Model)

  • 도윤형;이강환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.367-370
    • /
    • 2017
  • 본 논문은 확률적 DTN 모델 내에서 효율적인 중계 노드를 선택하기 위한 방법을 제안한다. Delay Tolerant Network(DTN)은 효율적인 통신을 위해 묶음 계층(bundle layer)를 생성해 서로 다른 네트워크 및 이기종간의 네트워크 간 중계 노드를 선택하고 메시지를 전달하는 Carry and forward 방식을 사용한다. DTN은 기본적으로 유동적인 노드로 구성되어 고정된 라우팅 루트가 없으며 간헐적인 연결로 인해 긴 지연시간을 가진다. 따라서 DTN을 구성하는 노드들은 필수적으로 메시지를 저장하기 위한 특성을 가지며 저장된 메시지와 노드의 용량은 네트워크의 성능에 영향을 주게 된다. 확률적 DTN 모델은 이러한 DTN의 성능을 분석하기 위해 시간에 따라 무작위적으로 변화하는 Markov 모델을 제안하였다. 하지만 제안된 확률적 DTN 모델에서는 네트워크의 성능을 향상시키기 위한 방법에 대한 연구가 미비하였다. 본 논문은 네트워크의 성능을 향상시키기 위해 확률적 DTN 모델에서 메시지의 생성과 소멸을 통해 분석된 확률적 메시지 분포와 상호 접촉 시간을 이용해 효율적인 중계 노드를 선택하는 알고리즘을 제안한다.

  • PDF

지뢰지대 밀도별 접촉확률 산정 모델링 방안 (Modeling Scheme for Calculating Encounter Probability Versus Minefleld Density)

  • 백두현;이상헌
    • 한국국방경영분석학회지
    • /
    • 제35권2호
    • /
    • pp.77-86
    • /
    • 2009
  • 접촉확률그래프는 한 대의 차량이 지뢰지대를 임의로 통과할 때 한 발의 지뢰가 폭발될 수 있는 확률을 측정한 그래프이다. 이 지뢰지대 밀도별 접촉확률 그래프는 한국 및 미(美) 육군의 야전교범에 제시되어 있으나 실 기동에 의한 데이터인지 워게임에 의한 결과치 인지 근거가 없는 실정이다. 본 논문에서는 신뢰할 만한 자료로서 근거가 없는 접촉확률 그래프를 컴퓨터 프로그램으로 절차식 모델을 구축하여 증명한다. 구축한 프로그램으로 산출된 결과치는 접촉확률그래프에 제시된 값과 거의 유사하게 나타낸다. 따라서 본 연구에서 제시한 절차식 모델은 모델링이 요구하는 타당성 및 모델자체의 검증에 있어 충분한 조건을 갖추었으며 다수 차량의 접촉확률을 계산하는데 있어서 매우 유용하다.

어휘 번역확률과 질의개념연관도를 반영한 검색 모델 (Retrieval Model Based on Word Translation Probabilities and the Degree of Association of Query Concept)

  • 김준길;이경순
    • 정보처리학회논문지B
    • /
    • 제19B권3호
    • /
    • pp.183-188
    • /
    • 2012
  • 정보 검색에서 성능 저하의 주요 요인은 사용자의 질의와 검색 문서 사이에서의 어휘 불일치 때문이다. 어휘 불일치 문제를 해결하기 위해 본 논문에서는 어휘 번역확률을 이용한 번역기반 언어모델에 질의개념연관도를 반영한 검색 모델을 제안한다. 어휘관계 정보를 획득하기 위하여 문장-다음문장 쌍을 이용하여 어휘 번역확률을 계산하였다. 제안모델의 유효성을 검증하기 위해 TREC AP 컬렉션에 대해 실험하였다. 실험결과에서 제안모델이 언어모델에 비해 아주 우수한 성능향상을 보였고, 번역기반 언어모델에 비해서도 높은 성능을 나타냈다.

띄어쓰기 비종속 품사 태깅 시스템 개발 (Development of POS Tagging System Independent to Word Spacing)

  • 이경일;안태성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.69-72
    • /
    • 2003
  • 본 논문에서는 입력된 한국어 문자열로부터 형태소를 분석하고, 품사를 태깅하는 방법에 있어 개선된 통계적 모델을 제안하고, 이에 기반한 띄어쓰기 비종속 형태소 분석 및 태깅 시스템의 개발과 성능 평가에 대한 결과를 소개하고 있다. 제안된 통계 기반품사 태깅 시스템은 입력된 문자열로부터 음절의 띄어쓰기 확률값을 계산하여 유사어절을 생성하고, 유사어절 단위로 사용자 띄어쓰기와 상관없이 형태소 후보 리스트를 생성하며, 인접한 후보 형태소들의 접속 확률 계산에 있어 어절 간 접속 확률과 어절 내 접속 확률을 모두 사용함으로, 최적의 형태소 리스트를 결정하는 모델을 사용하고 있다. 특히, 형태소들의 접속 확률 계산 시 어절 간 접속 확률과 어절 내 접속 확률의 결합 비율이 음절의 띄어쓰기 확률 값과 사용자의 띄어쓰기 여부에 따라 자동으로 조절되는 특징을 가지고 있으며, 이를 통해 극단적으로 띄어 쓰거나 붙여 쓴 문장에 대해서도 평균 90%수준의 품사 태깅 성능을 달성할 수 있었다.

  • PDF

단어 공기 확률 추정을 위한 차원 축소 모델 (Dimension-Reduced Model for Word Co-occurrence Probability Estimation)

  • 김길연;최기선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.137-142
    • /
    • 2000
  • 본 논문에서는 확률적 자연언어 처리에서 중요한 문제인 자료 희귀(data sparseness)의 어려움을 해결하는 새로운 방법으로 차원 축소 모델을 제시한다. 세 가지의 세부 방법이 제안되었으며 Katz의 back-off 방법의 성능을 최저로 했을 때에 비해 약 60%정도의 성능이 향상되었다. 현재까지 최고의 성능을 보이고 있는 유사도 기반의 방법에 비해서도 약 5∼20%의 성능이 향상되었다. 따라서 차원 축소 모델은 확률 추정의 새로운 방법으로 쓰일 수 있다.

  • PDF

용어 가중치와 역범주 빈도에 의한 자동문서 범주화 (Automatic Text Categorization by Term Weighting and Inverted Category Frequency)

  • 이경찬;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.14-17
    • /
    • 2003
  • 문서의 확률을 이용하여 자동으로 문서를 분류하는 문서 범주화 기법의 대표적인 방법이 나이브 베이지언 확률 모델이다. 이 방법의 기본 형식은 출현 용어의 확률 계산 방법이다. 하지만 실제 문서 범주화 과정에서 출현하지 않는 용어들도 성능에 많은 영향을 줄 수 있으며, 출현 용어들에 대한 빈도 이외의 역범주 빈도나 용어가중치를 적용하여 문서 범주화 시스템의 성능을 향상시킬 수 있다. 본 논문에서는 나이브 베이지언 확률 모델에 출현 용어와 출현하지 않는 용어들에 대한 smoothing 기법을 적용하여 실험하였다. 성능 평가를 위해 뉴스그룹 문서들을 이용하였으며, 역범주 빈도와 가중치를 적용했을 때 나이브 베이지언 확률 모델에 비해 약 7% 정도 성능 개선 효과가 있었다.

  • PDF

이산 확률 기법에 기반한 웹미디어 교육 시스템을 위한 동적 적응 모델 (Dynamic Adaptive Model for WebMedia Educational Systems based on Discrete Probability Techniques)

  • 이윤수
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권9호
    • /
    • pp.921-928
    • /
    • 2004
  • 이 논문에서는 웹 기반의 하이퍼미디어 교육시스템에서 이산 확률 분포 함수와 사용자 프로파일 기반의 동적 적응 모델을 제안하였다. 이 모델은 응용 영역을 동적 적응 객체의 가중치 방향성 그래프로 표현하며, 사용자 행위를 이산 확률 함수를 동적으로 구축하는 접관 방식을 이용하여 모델링한다. 제안한 확률적 해석은 웹 미디어 구조에서 사용자의 탐색 행위를 추적하여 사용자 행위에 대한 잠재적 속성을 나타내는데 사용될 수 있다. 이러한 접근 방식은 사용자에게 가장 알맞은 프로파일을 동적으로 할당할 수 있다.

  • PDF

기상예보기반 실화발생 확률 추정

  • 류정우;김은주;최정우
    • 한국화재소방학회:학술대회논문집
    • /
    • 한국화재소방학회 2013년도 추계학술대회 초록집
    • /
    • pp.109-110
    • /
    • 2013
  • 본 논문에서는 기상조건에 따라 실화발생 확률을 추정할 수 있는 방법을 제안한다. 제안한 방법에서는 화재조사데이터와 기상데이터간의 관계를 데이터마이닝 기법인 의사결정트리로 모델링한 후, 생성된 모델을 가지고 기상조건에 따라 실화발생 확률을 추정한다. 16개 시도별로 5년동안 발생된 화재조사데이터와 매시간 관측된 기상데이터를 가지고 각각 시도별로 모델을 생성하였다. 생성된 16개 모델들 모두는 기상조건을 고려하지 않고 확률을 추정한 경우보다 오차가 작았으며, 모델들로부터 생성된 IF~THEN 형태의 규칙들을 통해 실화가 습도와 관련성이 높다는 현업에서의 가정에 부합되는 것을 확인하였다.

  • PDF

확률라이브러리모델 기반의 Hypernetwork 학습에 의한 패턴완성시의 Subsampling 효과 분석 (Analysis of Subsampling Effects in Pattern Completion by Hypernetwork Learning Based on Probabilistic Library Model)

  • 김주경;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.352-354
    • /
    • 2006
  • 패턴완성(Pattern Completion)은 사용되는 패턴 성분들 사이의 higher-order correlation 정보가 중요한 의미를 가질 수 있는 기계학습 문제 중 하나이다. higher-order correlation은 확률라이브러리모델(Probabilistic Library Model)로 구현되는 hypernetwork 개념을 도입해서 나타낼 수 있다. 하지만 확률라이브러리모델을 사용하여 higher-order 정보를 나타내려할 때 초기라이브러리가 모든 가능한 조합의 원소들을 가지도록 구성하기는 쉽지 않다. 그 대안으로 초기라이브러리 구성 시 학습패턴들을 subsampling하여 적은 숫자의 원소들만으로 higher-order correlation의 근사치를 나타내게 할 수 있다. 본 논문에서는 이와 같이 subsampling이 사용되어 구성된 확률라이브러리모델을 이용한 패턴완성시의 correlation의 order에 따른 효과를 분석하여 본다.

  • PDF