• 제목/요약/키워드: 사전확률

검색결과 416건 처리시간 0.027초

마코프 체인 프로세스를 적용한 해양사고 발생 예측 (Prediction of Marine Accident Frequency Using Markov Chain Process)

  • 장은진;임정빈
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2019년도 추계학술대회
    • /
    • pp.266-266
    • /
    • 2019
  • 해마다 증가하고 있는 해양사고는 기관고장, 충돌, 좌초, 화재 등 다양하게 발생하고 있다. 이러한 해양사고는 대형 인명사고의 위험이 있어 사전에 사고를 예방 하는 게 무엇보다 중요하다. 이를 위해서는 해양사고 발생을 사전에 예측하고 이에 대응할 수 있는 예측 체계가 요구된다. 본 연구에서는 과거에 발생한 데이터를 근거로 미래를 예측할 수 있는 마코프 체인 프로세스(Markov Chain Process)를 적용하여 해양사고 발생을 사전에 예측하기 위한 모델링을 제안한다. 제시된 모델링을 적용하여 미래 발생 가능한 해양사고 발생 확률을 산출하고 실제 발생한 빈도와 비교하였다. 또한 많이 사용되는 다른 예측 분석 방법과 비교하여 예측의 정확성을 측정하였다. 이를 통해 해양사고 발생에 관한 예측 체계를 마련하는데 하나의 확률 모형을 제안하였으며, 나아가 다양한 해양사고의 문제를 예측하는데 기여할 것으로 기대된다.

  • PDF

사전 단어 발생 확률을 통해 온라인 필기체 문자의 오인식을 보정하는 후처리 기법 (The post processing method to reduce the misrecognition of on-line handwritten letters by using an occurrence probability of dictionary words)

  • 이도곤;한정훈;김우생
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.723-726
    • /
    • 2004
  • 문자들 중에는 매우 비슷한 모양을 갖고 있는 문자가 존재하기 때문에 오인식은 이러한 유사한 문자들 사이에서 일어날 경우가 많다고 볼 수 있다. 즉, 입력된 문자가 유사한 다른 문자에 대응하는 모델에서 발생 확률이 가장 높게 나와 오인식이 되었다고 할지라도, 해당 모델에서는 입력된 문자의 발생 확률도 여전히 높다고 볼 수 있다. 본 논문에서는 사전을 통한 후처리 시, 오인식 된 단어에서 사용된 모델들을 통해 오인식을 보정하는 방법을 제안한다.

  • PDF

부분 베이즈요인을 이용한 K개로 로그정규분포의 상등에 관한 베이지안 다중검정 (Bayesian Testing for the Equality of K-Lognormal Populations)

  • 문경애;김달호
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.449-462
    • /
    • 2001
  • 베이지안 다중 검정방법(multiple hypothesis test)은 여러 통계모형에서 성공적인 결과를 주는 것으로 알려져있다. 일반적으로, 베이지안 가설검정은 고려중인 모형에 대한 사후확률을 계산하여 가장 높은 확률은 갖는 모형을 선택하기 때문에 귀무가설의 기각여부에만 관심을 가지는 고전적인 분산분석 검정과는 달리 좀 더 구체적인 모형을 선택할 수 있는 장점이 있다. 이 논문에서는 독립이면서 로그정규분포를 따르는 K($\geq$3)개 모집단의 모수에 대한 가설 검정방법으로 O’Hagan(1995)이 제안한 부분 베이즈 요인을 이용한 베이지안 방법을 제안한다. 이 때 모수에 대한 사전분포로는 무정보적 사전분포를 사용한다. 제안한 검정 방법의 유용성을 알아보기 위하여 실제 자료의 분석과 모의 실험을 이용하여 고전적인 검정방법과 그 결과를 비교한다.

  • PDF

AR(1)모형에서 자기회귀계수의 다중검정을 위한 베이지안방법 (Bayesian Method for the Multiple Test of an Autoregressive Parameter in Stationary AR(L) Model)

  • 김경숙;손영숙
    • 응용통계연구
    • /
    • 제16권1호
    • /
    • pp.141-150
    • /
    • 2003
  • 본 논문은 베이즈인자(Bayes factor)를 이용하여 정상(stationary) AR(1)모형의 자기회귀계수에 대해 다중검정하는 방법을 제시한다. 모수들에 대한 사전분포로는 무정보 사전분포(noninformative prior distribution)를 가정한다. 이러한 경우에 통상적으로 사용되는 베이즈인자를 근사없이 정확히 계산하여 각 모형에 대한 사후확률(posterior probability)을 얻는다. 최종적으로 모의실험 자료 및 실제 자료에 적용하여 이론의 결과가 잘 부합되는지를 검토한다.

이중언어 코퍼스로부터 외래어 표기 사전의 자동구축 (Automatic Construction of a Transliteration Dictionary from Bilingual Corpus)

  • 이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.142-149
    • /
    • 1999
  • 외국문명의 영향으로 많은 외래어가 한국어 문서 내에서 사용되고 있으며, 이러한 단어는 주로 전문용어, 고유명사, 신조어 등으로 사전에 등록되지 않는 것이 많다. 본 논문에서는 이중언어 코퍼스로부터 자동으로 외래어 사전을 추출해 내는 확률적 정렬 방법과 실험결과를 소개한다. 확률적 정렬 방법은 통계적 음차 표기 모델에서 사용된 방법을 변형하여 적용한 것이며, 문서단위로 정렬된 두 종류의 영-한 이중언어 코퍼스에 대해 실험하여 재현률과 정확률을 측정하였다 성능은 전처리단계인 한국어 미등록어 추정에 영향을 많이 받았는데, 미등록어 추정을 대략하였을 경우, 재현률은 평균 58%였고, 정확률은 평균74%이었으며, 수동으로 미등록어 명사를 분리했을 경우, 재현률 평균86%, 정확률 평균91%로 외래어와 대응되는 원어를 추출해 냈다.

  • PDF

학습을 통한 발음 변이 규칙 유도 및 적응을 이용한 영역 의존 발음 사전 자동 생성 (Automatic Generation of Domain-Dependent Pronunciation Lexicon with Data-Driven Rules and Rule Adaptation)

  • 전재훈;정민화
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.233-238
    • /
    • 2005
  • 본 논문에서는 학습을 이용한 발음 변이 모델링을 통해 특정 영역에 최적화된 발음 사전 자동 생성의 방법을 제시하였다. 학습 방법을 이용한 발음 변이 모델링의 오류를 최소화 하기 위하여 본 논문에서는 발음 변이 규칙의 적응 기법을 도입하였다. 발음 변이 규칙의 적응은 대용량 음성 말뭉치에서 발음 변이 규칙을 유도한 후, 상대적으로 작은 용량의 음성 말뭉치에서 유도한 규칙과의 결합을 통해 이루어 진다. 본 논문에서 사용된 발음 사전은 해당 형태소의 앞 뒤 음소 문맥의 음운 현상을 반영한 발음 사전이며, 학습 방법으로 얻어진 발음 변이 규칙을 대용량 문자 말뭉치에 적용하여 해당 형태소의 발음을 자동 생성하였다. 발음 사전의 평균 발음의 수는 적용된 발음 변이 규칙의 확률 값들의 한계 값 조정에 의해 이루어졌다. 기존의 지식 기반의 발음 사전과 비교 할 때, 본 방법론으로 작성된 발음 사전을 이용한 대화체 음성 인식 실험에서 0.8%의 단어 오류율(WER)이 감소하였다. 또한 사전에 포함된 형태소의 평균 발음 변이 수에서도 기존의 방법론에서 보다 5.6% 적은 수에서 최상의 성능을 보였다.

  • PDF

도시고속도로 반복정체 시점의 통계학적 분석방법 (A Statistical Method for Predicting Recurrent Congestion Time in Urban Freeway)

  • 한영준;손봉수;김원길
    • 대한교통학회지
    • /
    • 제24권3호
    • /
    • pp.29-37
    • /
    • 2006
  • 도시고속도로의 반복정체는 발생시점과 지점이 거의 일정하므로 정체발생 예상 및 사전대응을 통한 효과적인 관리가 가능하다. 기존의 교통관리시스템에서는 패턴데이터를 이용하여 반복정체를 관리하고자하였으나 다변하는 도시 부교통에서는 적용하기 어려운 경우가 많았다. 본 논문에서는 반복정체 발생확률을 통계적 분포를 적용한 통행속도별 발생확률을 이용하여 구하고자 하였다. 반복정체 발생확률 추정을 통해 반복정체 발생시점 및 지속시간을 파악하고, 효과적인 사전대응 수립과 교통운영이 가능할 것으로 기대된다

언어 정보 획득을 위한 한국어 코퍼스 분석 도구 (A Korean Corpus Analysis Tool for Language Information Acquisition)

  • 이호;김진동;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.297-304
    • /
    • 1994
  • 코퍼스는 기계 가독형으로 개장되어 있는 실제 사용 언어의 집합으로 자연어 처리에 필요한 여러 가지 언어 정보를 내재하고 있다. 이들 정보는 코퍼스 분석기를 이용하여 획득할 수 있으며 용례와 각종 통계 정보 및 확률 정보, 연어 목록 등은 코퍼스에서 추출할 수 있는 대표적인 언어 정보들이다. 그러나 기존의 한국어 코퍼스 분석 도구들은 용례 추출 기능만을 보유하여 활용 범위가 제한되어 있었다. 이에 본 논문에서는 대량의 한국어 코퍼스를 분석하여 용례뿐만 아니라 자연어 처리의 제분야에서 필요한 언어 정보들을 추출하는 방법에 대해 연구하였으며 이의 검증을 위해 KCAT(Korean Corpus Analysis Tool)를 구현하였다. KCAT는 코퍼스 색인, 용례 추출, 통계 정보 추출, 연어 추출 부분으로 구성되어 있다. 용례 색인을 위해서는 여러 가지 사전과 용례 색인 구조가 필요한데 KCAT에서는 가변 차수 B-Tree 구조를 이용하여 사전을 구성하며 용례 색인을 위해 버킷 단위의 역 화일 구조를 이용한다. 질 좋은 용례의 추출을 위해 KCAT는 다양한 용례 연산 및 정렬 기능을 제공한다. 또한 통계적 방법의 자연어 처리 분야를 위해 어휘 확률, 상태 전이 확률, 관측 심볼 확률, 상호 정보, T-score 등을 제공하며, 기계 번역 분야에서 필요한 연어를 추출한다.

  • PDF

부호 분할 다원 접속을 위한 직접 확산 셀룰라 통신 시스팀의 동기 (Acquisition of Direct-Sequence Cellular Communication System for Code Division Mutlipie Access)

  • 전정식;한영열
    • 한국통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.207-217
    • /
    • 1993
  • 본 논문에서는 송신된 확산부호와 수신기 내의 기준 확산부호 사이의 위상차에 대한 사전 확률을 알고 있을 때, 동기가 맞을 확률이 높은 셀부터 낮은 셀의 순서로 검사하는 Expanding Window Search 방법을 이용하여 직접확산(Direct Sequence) 통신 시스팀의 초기동기 과정의 상태도를 구성한다. 각 검색에서 앞선 검색 때보다 증가하는 윈도우를 초항이 a고 공비가 r인 등비 수열의 형태로 증가하도록 하였으며, 마코프처리(Markov process)와 메이슨 이득공식(Mason’s gain formula)을 이용하여 상태도를 해석하고 평균 시간을 구한다. 그리고 검색 횟수 n과 검출 확률 $P_d$의 변화에 따른 평균동기 시간의 증감을 사전 확률이 없을 때의 평균등기 시간과 비교한다.

  • PDF

확률이론을 이용한 프로젝트 예비비 산정 및 관리 (Probabilistic Applications for Estimating and Managing Project Contingency)

  • 이만희;유위성;이학기
    • 한국건설관리학회:학술대회논문집
    • /
    • 한국건설관리학회 2004년도 제5회 정기학술발표대회 논문집
    • /
    • pp.224-227
    • /
    • 2004
  • 건설사업관리자는 사업을 진행하기 전에 예측하지 못한 위험 발생 가능성에 대비한 예비비를 항상 고려해야 한다. 예비비를 충분히 고려하지 않고 사업을 수행하게 되면 리스크로 인한 총사업비에서의 초과 비용이 누적되어 향후 사업진행에 지장을 줄 수도 있기 때문이다. 과거의 실적자료를 바탕으로 적정한 예비비를 산정하기 위해 확률적 평가가 필요하며, 조건부 확률(conditional probability)을 사용함으로써 공정이 진행되면서 완료된 work package의 실제 공사비를 정보로 하여 잔여 공정에 대해 공사비와 예비비를 재산 정할 수 있다. 즉, 증가된 정보로 공사의 불확실성을 감소시키고 좀더 현실적인 총사업비를 예측할 수 있게 된다. 본 연구에서는 예비비 산정 및 관리 프로세스를 제시하기 위한 기초적인 연구로써 가상 프로젝트의 5개 work package를 대상으로 확률이론의 적용 가능성을 제시하였다.

  • PDF