• Title/Summary/Keyword: 사전확률

Search Result 416, Processing Time 0.023 seconds

Prediction of Marine Accident Frequency Using Markov Chain Process (마코프 체인 프로세스를 적용한 해양사고 발생 예측)

  • Jang, Eun-Jin;Yim, Jeong-Bin
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2019.11a
    • /
    • pp.266-266
    • /
    • 2019
  • Marine accidents are increasing year by year, and various accidents occur such as engine failure, collision, stranding, and fire. These marine accidents present a risk of large casualties. It is important to prevent accidents beforehand. In this study, we propose a modeling to predict the occurrence of marine accidents by applying the Markov Chain Process that can predict the future based on past data. Applying the proposed modeling, the probability of future marine accidents was calculated and compared with the actual frequency. Through this, a probabilistic model was proposed to prepare a prediction system for marine accidents, and it is expected to contribute to predicting various marine accidents.

  • PDF

The post processing method to reduce the misrecognition of on-line handwritten letters by using an occurrence probability of dictionary words (사전 단어 발생 확률을 통해 온라인 필기체 문자의 오인식을 보정하는 후처리 기법)

  • Lee, Do-Gon;Han, Jeong-Hoon;Kim, Woosaeng
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.723-726
    • /
    • 2004
  • 문자들 중에는 매우 비슷한 모양을 갖고 있는 문자가 존재하기 때문에 오인식은 이러한 유사한 문자들 사이에서 일어날 경우가 많다고 볼 수 있다. 즉, 입력된 문자가 유사한 다른 문자에 대응하는 모델에서 발생 확률이 가장 높게 나와 오인식이 되었다고 할지라도, 해당 모델에서는 입력된 문자의 발생 확률도 여전히 높다고 볼 수 있다. 본 논문에서는 사전을 통한 후처리 시, 오인식 된 단어에서 사용된 모델들을 통해 오인식을 보정하는 방법을 제안한다.

  • PDF

Bayesian Testing for the Equality of K-Lognormal Populations (부분 베이즈요인을 이용한 K개로 로그정규분포의 상등에 관한 베이지안 다중검정)

  • 문경애;김달호
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.449-462
    • /
    • 2001
  • 베이지안 다중 검정방법(multiple hypothesis test)은 여러 통계모형에서 성공적인 결과를 주는 것으로 알려져있다. 일반적으로, 베이지안 가설검정은 고려중인 모형에 대한 사후확률을 계산하여 가장 높은 확률은 갖는 모형을 선택하기 때문에 귀무가설의 기각여부에만 관심을 가지는 고전적인 분산분석 검정과는 달리 좀 더 구체적인 모형을 선택할 수 있는 장점이 있다. 이 논문에서는 독립이면서 로그정규분포를 따르는 K($\geq$3)개 모집단의 모수에 대한 가설 검정방법으로 O’Hagan(1995)이 제안한 부분 베이즈 요인을 이용한 베이지안 방법을 제안한다. 이 때 모수에 대한 사전분포로는 무정보적 사전분포를 사용한다. 제안한 검정 방법의 유용성을 알아보기 위하여 실제 자료의 분석과 모의 실험을 이용하여 고전적인 검정방법과 그 결과를 비교한다.

  • PDF

Bayesian Method for the Multiple Test of an Autoregressive Parameter in Stationary AR(L) Model (AR(1)모형에서 자기회귀계수의 다중검정을 위한 베이지안방법)

  • 김경숙;손영숙
    • The Korean Journal of Applied Statistics
    • /
    • v.16 no.1
    • /
    • pp.141-150
    • /
    • 2003
  • This paper presents the multiple testing method of an autoregressive parameter in stationary AR(1) model using the usual Bayes factor. As prior distributions of parameters in each model, uniform prior and noninformative improper priors are assumed. Posterior probabilities through the usual Bayes factors are used for the model selection. Finally, to check whether these theoretical results are correct, simulated data and real data are analyzed.

Automatic Construction of a Transliteration Dictionary from Bilingual Corpus (이중언어 코퍼스로부터 외래어 표기 사전의 자동구축)

  • Lee, Jae-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.142-149
    • /
    • 1999
  • 외국문명의 영향으로 많은 외래어가 한국어 문서 내에서 사용되고 있으며, 이러한 단어는 주로 전문용어, 고유명사, 신조어 등으로 사전에 등록되지 않는 것이 많다. 본 논문에서는 이중언어 코퍼스로부터 자동으로 외래어 사전을 추출해 내는 확률적 정렬 방법과 실험결과를 소개한다. 확률적 정렬 방법은 통계적 음차 표기 모델에서 사용된 방법을 변형하여 적용한 것이며, 문서단위로 정렬된 두 종류의 영-한 이중언어 코퍼스에 대해 실험하여 재현률과 정확률을 측정하였다 성능은 전처리단계인 한국어 미등록어 추정에 영향을 많이 받았는데, 미등록어 추정을 대략하였을 경우, 재현률은 평균 58%였고, 정확률은 평균74%이었으며, 수동으로 미등록어 명사를 분리했을 경우, 재현률 평균86%, 정확률 평균91%로 외래어와 대응되는 원어를 추출해 냈다.

  • PDF

Automatic Generation of Domain-Dependent Pronunciation Lexicon with Data-Driven Rules and Rule Adaptation (학습을 통한 발음 변이 규칙 유도 및 적응을 이용한 영역 의존 발음 사전 자동 생성)

  • Jeon, Je-Hun;Chung, Min-Hwa
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2005.05a
    • /
    • pp.233-238
    • /
    • 2005
  • 본 논문에서는 학습을 이용한 발음 변이 모델링을 통해 특정 영역에 최적화된 발음 사전 자동 생성의 방법을 제시하였다. 학습 방법을 이용한 발음 변이 모델링의 오류를 최소화 하기 위하여 본 논문에서는 발음 변이 규칙의 적응 기법을 도입하였다. 발음 변이 규칙의 적응은 대용량 음성 말뭉치에서 발음 변이 규칙을 유도한 후, 상대적으로 작은 용량의 음성 말뭉치에서 유도한 규칙과의 결합을 통해 이루어 진다. 본 논문에서 사용된 발음 사전은 해당 형태소의 앞 뒤 음소 문맥의 음운 현상을 반영한 발음 사전이며, 학습 방법으로 얻어진 발음 변이 규칙을 대용량 문자 말뭉치에 적용하여 해당 형태소의 발음을 자동 생성하였다. 발음 사전의 평균 발음의 수는 적용된 발음 변이 규칙의 확률 값들의 한계 값 조정에 의해 이루어졌다. 기존의 지식 기반의 발음 사전과 비교 할 때, 본 방법론으로 작성된 발음 사전을 이용한 대화체 음성 인식 실험에서 0.8%의 단어 오류율(WER)이 감소하였다. 또한 사전에 포함된 형태소의 평균 발음 변이 수에서도 기존의 방법론에서 보다 5.6% 적은 수에서 최상의 성능을 보였다.

  • PDF

A Statistical Method for Predicting Recurrent Congestion Time in Urban Freeway (도시고속도로 반복정체 시점의 통계학적 분석방법)

  • Han, Yeong-Jun;Son, Bong-Su;Kim, Won-Gil
    • Journal of Korean Society of Transportation
    • /
    • v.24 no.3 s.89
    • /
    • pp.29-37
    • /
    • 2006
  • As a recurrent congestion of urban freeway occurs in almost same time and section, it is possible to manage the congestion effectively by the expectation and advance correspondence. In the existing traffic management system. we have used pattern data to manage a recurrent congestion. But it is not applicable to an urban freeway which kas various traffic circumstance. In this study, the probability by travel speed using a statistical distribution method will be used to predict the probability of recurrent congestion. It is expected that we can get the point of time and the duration of recurrent congestion, and we can devise an effective advance correspondence and a transportation operation.

A Korean Corpus Analysis Tool for Language Information Acquisition (언어 정보 획득을 위한 한국어 코퍼스 분석 도구)

  • Lee, Ho;Kim, Jin-Dong;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.297-304
    • /
    • 1994
  • 코퍼스는 기계 가독형으로 개장되어 있는 실제 사용 언어의 집합으로 자연어 처리에 필요한 여러 가지 언어 정보를 내재하고 있다. 이들 정보는 코퍼스 분석기를 이용하여 획득할 수 있으며 용례와 각종 통계 정보 및 확률 정보, 연어 목록 등은 코퍼스에서 추출할 수 있는 대표적인 언어 정보들이다. 그러나 기존의 한국어 코퍼스 분석 도구들은 용례 추출 기능만을 보유하여 활용 범위가 제한되어 있었다. 이에 본 논문에서는 대량의 한국어 코퍼스를 분석하여 용례뿐만 아니라 자연어 처리의 제분야에서 필요한 언어 정보들을 추출하는 방법에 대해 연구하였으며 이의 검증을 위해 KCAT(Korean Corpus Analysis Tool)를 구현하였다. KCAT는 코퍼스 색인, 용례 추출, 통계 정보 추출, 연어 추출 부분으로 구성되어 있다. 용례 색인을 위해서는 여러 가지 사전과 용례 색인 구조가 필요한데 KCAT에서는 가변 차수 B-Tree 구조를 이용하여 사전을 구성하며 용례 색인을 위해 버킷 단위의 역 화일 구조를 이용한다. 질 좋은 용례의 추출을 위해 KCAT는 다양한 용례 연산 및 정렬 기능을 제공한다. 또한 통계적 방법의 자연어 처리 분야를 위해 어휘 확률, 상태 전이 확률, 관측 심볼 확률, 상호 정보, T-score 등을 제공하며, 기계 번역 분야에서 필요한 연어를 추출한다.

  • PDF

Acquisition of Direct-Sequence Cellular Communication System for Code Division Mutlipie Access (부호 분할 다원 접속을 위한 직접 확산 셀룰라 통신 시스팀의 동기)

  • 전정식;한영열
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.18 no.2
    • /
    • pp.207-217
    • /
    • 1993
  • In this paper, knowing a priori probability of phase offset between transmitted codes and reference codes in the receiver, we construct the state diagram of acquisition process of the direct sequence spread-spectrum communication system using the expanding window search. The scannings are performed from the cell with higher probability code epoch synchronization to that with lower one. We expand window size from initial value by r times of its previous size in each search, construct the corresponding the state diagrams, and derive average synchronization time using the Markov process and Mason's gain formula. Average synchronization times versus number of search n and detection probability $P_d$ are calculated.

  • PDF

Probabilistic Applications for Estimating and Managing Project Contingency (확률이론을 이용한 프로젝트 예비비 산정 및 관리)

  • Lee Man-Hee;Yoo Wi-Sung;Lee Hak-ki
    • Proceedings of the Korean Institute Of Construction Engineering and Management
    • /
    • 2004.11a
    • /
    • pp.224-227
    • /
    • 2004
  • As a project progresses, it is well known that construction manager has to define the contingency for the expected project cost, which is used as a buffer for uncertainty. In this study, we mention uncertainty as the amount of likelihood that is difficult or impossible to predict project cost. From the completed work package, we obtain the true cost value, and this information is technically good data for estimating the realistic contingency of work packages to be accomplished. Based upon this historical information, construction manager recomputes the contingency for the remaining works. Conditional probability theory is often useful for re-estimating one of the remaining project progress as the true cost of the completed works can be different from the planned cost. As a project is progressing, true value is really important to predict the realistic project budget and to decrease the uncertainty. In this study, we gave applied conditional probability theory to estimating project contingency supposing a project that consists of fire work packages, provide the fundamental framework for setting and controlling project contingency.

  • PDF