• 제목/요약/키워드: 사전확률

검색결과 417건 처리시간 0.034초

약어 생성 유형을 고려한 한국어 약어 사전 자동 구축 (Construction of Korean acronym dictionary by considering ways of making acronym from definition)

  • 윤여찬;송영인;이주영;임해창
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2006년도 춘계학술대회
    • /
    • pp.81-85
    • /
    • 2006
  • 본 논문에서는 한국어 고유명사 약어 사전을 자동으로 구축하기 위한 방법론을 제안한다. 본 논문은 원어로부터 약어가 생성되는 방식을 네 가지 유형으로 분류 한 후 각 유형에 따라 가능한 약어의 후보들을 생성하여 원어, 약어 후보 쌍을 수집하고, 수집 된 각 쌍에 대하여 확률적모형에 근거, 실제 사용되는 원어, 약어 쌍을 선별하여 사전에 등재함으로써 자동으로 사전을 구축 할 수 있도록 한다.

  • PDF

코퍼스로부터 형태소 분석을 위한 사전 구성 (A Dictionay Composition for Morphological Analyzer from Corpus)

  • 정민수;정규철;조원홍
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.316-320
    • /
    • 1998
  • 한국어나 일본어처럼 문법형태소의 기능에 의해 단어의 통사적, 의미적 역할이 결정되는 교착어에서는 형태소 분석이 통사 분석과 의미 분석에 미치는 영향이 크기 때문에 한국어의 분석에 있어서 형태소 분석은 아주 중요하다. 관형적 표현이 많은 한글은 문법 규칙만으론 분석하기가 쉽지 않고, 분기가 많이 생성되므로 오류가 발생할 확률도 높다. 이러한 문제점을 해결하기 위해 본 논문에선 사전을 중심으로 해결하고자 한다. 그러기 위해선 방대한 용량의 사전이 필요로 하게 되고 이를 구축하기 위한 시간과 노력이 요구되므로 이미 구성된 코퍼스를 이용해 사전을 구성하여 많은 시간과 노력을 줄일 수 있도록 한다. 그리고 생성되는 많은 분기 가운데 올바른 경로를 찾아 가기 위해 코퍼스내의 각 태그 결합정보를 추출하고 추출한 결합정보의 통계정보-코퍼스내에서 사용된 빈도수-포함하여 우선순위를 정하도록 한다.

  • PDF

의사 형태소 단위의 연속 음성 인식 (Pseudo-Morpheme-Based Continuous Speech Recognition)

  • 이경님
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.309-314
    • /
    • 1998
  • 언어학적 단위인 형태소의 특성을 유지하면서 음성인식 과정에 적합한 분리 기준의 새로운 디코딩 단위인 의사형태소를 정의하였다. 이러한 필요성을 확인하기 위해 새로이 정의된 37개의 품사 태그를 갖는 의사 형태소를 표제어 단위로 삼아 발음사전 생성과 형태소 해석에 초점을 두고 한국어 연속음성 인식 시스템을 구성하였다. 각 음성신호 구간에 해당되는 의사 형태소가 인식되면 언어모델을 사용하여 구성된 의사 형태소 단위의 상위 5개 문장을 기반으로 시작 시점과 끝 시점, 그리고 확률 값을 가진 의사 형태소 격자를 생성하고, 음성 사전으로부터 태그 정보를 격자에 추가하였다. Tree-trellis 탐색 알고리즘 기반에 의사 형태소 접속정보를 사용하여 음성언어 형태소 해석을 수행하였다. 본 논문에서 제안한 의사 형태소를 문장의디코딩 단위로 사용하였을 경우, 사전의 크기면에서 어절 기반의 사전 entry 수를 현저히 줄일 수 있었으며, 문장 인식률면에서 문자기반 형태소 단위보다 약 20% 이상의 인식률 향상을 얻을 수있었다. 뿐만 아니라 형태소 해석을 수행하기 위해 별도의 분석과정 없이 입력값으로 사용되며, 전반적으로 문자을 구성하는 디코딩 수를 안정화 시킬 수 있었다. 이 결과값은 상위레벨 언어처리를 위한 입력?으로 사용될 뿐만 아니라, 언어 정보를 이용한 후처리 과정을 거쳐 더 나은 인식률 향상을 꾀할 수 있다.

  • PDF

어절패턴 사전을 이용한 새로운 한국어 형태소 분석기 (A New Korean Morphological Analyzer using Eojeol Pattern Dictionary)

  • 홍진표;차정원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.279-284
    • /
    • 2008
  • 본 연구에서는 어절패턴을 이용하는 새로운 방식의 한국어 형태소 분석기 KGuru-MA에 대해서 설명한다. KGuru-MA는 품사 부착 말뭉치에서 개방어를 생략하여 어절 패턴을 반자동으로 학습하여 어절 패턴 사전과 형태소 확률 정보 사전을 구성한 후, 이 사전을 이용하여 형태소를 분석한다. 본 형태소 분석기는 어절패턴을 사용하여 형태소 분석하기 때문에 기존 형태소 분석기에 존재하는 접속검사 과정이 생략된다. 또한, 형태소 분석 과정이 기존의 형태소 분석기에 비해 단순하여 기초 자연언어 처리 시스템이 가지는 강건성을 보장한다. 본 연구는 "21세기 세종기획 3차년도 말뭉치"를 이용한 실험 결과, 기존 형태소 분석기 못지 않은 성능을 보였다.

  • PDF

구간변화율을 고려한 기본확률배정함수 결정 (A Novel Method of Basic Probability Assignment Calculation with Signal Variation Rate)

  • 서동혁;박찬봉
    • 한국전자통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.465-470
    • /
    • 2013
  • Dempster-Shafe 증거이론은 다중센서 데이터융합을 위한 좋은 계산방법을 제공해준다. 이때 기본확률배정 함수가 절대적으로 필요하다. 본 논문에서는 신호를 평가하여 기본확률배정함수를 계산하고 결정하는 방법을 제안한다. 센서들이 보내온 신호를 구간별로 변화율을 평가하고 이 평가를 기초로 기본확률배정함수를 정하도록 한다. 센서들이 감지하여 보고한 신호들은 상황발생 요인과 관련 있는데, 시간간격에 따라서 변화하는 신호값의 추이를 평가하였다. 센서가 감지한 신호의 변화는 상황구성 및 병화와 밀접한 관련이 있으므로 신호값의 변화를 평가하는 것은 상황추론에 도움이 되는 것이었다. 이것을 기본확률배정함수 결정에 포함함으로써 사전정보가 없는 경우에 대해서도 상황추론이 가능할 수 있음을 보였다.

로지스틱 회귀모형을 이용한 수관화확산확률식의 개발 (Development of Crown Fire Propagation Probability Equation Using Logistic Regression Model)

  • 유계선;이병두;원명수;김경하
    • 한국지리정보학회지
    • /
    • 제17권1호
    • /
    • pp.1-12
    • /
    • 2014
  • 수관화는 대형산불의 주된 확산유형으로 빠른 확산속도와 높은 산불강도의 특성을 보이며 많은 피해를 입힌다. 이 연구에서는 수관화 피해를 사전에 예측하기 위해서 수관전소 피해를 입은 지역의 지형 임상 기상 특성을 분석하여 수관화확산확률식을 개발하였다. 영덕 울진 고령 예천에서 일어난 4개의 산불피해지를 대상으로 하였으며, 총 18개의 공간 변수를 구축한 뒤 기타연소지에 대한 수관전소지의 비를 이용하여 각 변수별 구간 가중치를 구하고 로지스틱 회귀모형을 이용하여 변수와의 상관계수를 산출하였다. 그 결과, 수관화확산확률은 임상이 침엽수림일 때, 250m 이상에서 고도가 높아질수록, 기복이 심할수록, 사면향은 남서 또는 남동사면일 경우, 능선일수록, 일사량이 많아질수록 높게 나타났다. 고도와 경사가 낮은 곳에서는 교란현상이 많이 나타나 일정한 패턴을 보이지 않았다. 이 확률식을 통해 수관화 위험지를 사전에 분석할 수 있고, 산불방지 숲가꾸기 지역 선정 및 진화 우선 지역 선정 등에 효과적으로 활용할 수 있을 것이다.

베이지안 기법을 적용한 우주발사체의 발사 성공률 추정에 관한 연구 (A Study on the Estimation of Launch Success Probability for Space Launch Vehicles Using Bayesian Method)

  • 유승우;김인걸
    • 한국항공우주학회지
    • /
    • 제48권7호
    • /
    • pp.537-546
    • /
    • 2020
  • 우주발사체 개발과정에서 설계와 프로세스의 성능지표로 활용되는 신뢰도는 발사 성공률로 유효성이 확인되고, 반복된 발사를 통해 수집된 데이터는 신뢰도 관리를 위하여 피드백 되어야 한다. 본 논문에서는 전 세계 우주발사체의 발사 이력을 조사하여 발사체 모델이나 발사 운용을 통한 기술 성숙도에 따른 발사 성공률을 비교 분석하였고, 사전정보를 반영한 사전확률분포에 발사를 통해 관측된 데이터를 업데이트하는 베이지안 기법을 적용하여 다음 발사에서 예상되는 성공률을 추정하였다. 여러 유형의 사전확률분포를 사용하여 추정한 발사 성공률과 전통적인 통계 기법을 통해 산출한 성공률을 비교 분석하여 적절한 사전분포를 설정하는 방안을 검토하였고, 베이지안 기법을 적용하여 미래의 발사 성공률을 예측하기 위해 고려할 사항들을 제시하였다.

MIMO 수신기에서 사전 Maximum Likelihood 검파 검증기 설계 (Prior Maximum Likelihood Detection Verifier Design in MIMO Receivers)

  • 전형구;배진호;이동훈
    • 한국통신학회논문지
    • /
    • 제33권11A호
    • /
    • pp.1063-1071
    • /
    • 2008
  • 본 논문에서는 multiple input multiple output (MIMO) 시스템에서 Zero Forcing (ZF) 검파 결과가 Maximum Likelihood (ML) 검파 결과와 일치하는지 여부를 사전에 검증할 수 있는 사전 검증기를 제안하였다. MIMO 수신기에서 ZF 검파 결과는 신호 대 잡음 환경이 양호한 경우 약 90% 이상이 ML 검파 결과와 일치하기 때문에 제안된 검증기를 사용하여 MIMO 신호를 검파하면 10% 정도만 계산량이 복잡한 ML 검파 방식을 사용하고 나머지는 간단히 ZF 검파만 수행하면 된다. 제안된 검증기는 ZP 검파 결과를 이용하여 MIMO 신호를 single input multiple output (SIMO) 신호로 변환한 후 검파를 수행하면 안테나 다이버시티 이득을 얻을 수 있고 잡음 분산이 줄어드는 효과를 이용하여 설계되었다. 컴퓨터 시뮬레이션 결과 사전 검증기는 신호 대 잡음이 양호한 경우 80% 이상의 정확한 true 판정 확률을 얻었으며 이때 false 판정 확률은 $10^{-4}$ 정도를 보였다.

해상 연약지반의 저치환율 개량에 대한 확률론적 최적화 (Probabilistic Optimization for Improving Soft Marine Ground using a Low Replacement Ratio)

  • 한상현;김홍연;여규권
    • 지질공학
    • /
    • 제26권4호
    • /
    • pp.485-495
    • /
    • 2016
  • 본 연구에서는 방파제 하부지반을 저치환율 재료로 보강 및 개량하기 위한 치환율과 재하중 방치기간을 확률론적 최적화 기법을 이용하여 분석하였다. 해석에 필요한 확률변수의 불확실성을 최소화하기 위하여 사전자료를 활용한 베이지안 갱신결과 최대 39.8% 포인트까지 불확실성이 감소하였고, 특히 사전함수의 표본수가 더 많은 구간의 감소폭이 컸다. 치환율 결정을 위하여 저치환율 단면 중 15~40% 범위에서 일계신뢰도법 및 몬테카를로 시뮬레이션 방법에 의해 해석한 결과 목표파괴확률을 만족하는 치환율은 심층고결처리 및 쇄석다짐말뚝 구간에서 각각 20% 및 25% 이상으로 나타났다. 치환율에 대한 최적화를 위하여 생애주기비용 분석을 실시한 결과 목표파괴확률을 만족하는 범위 내에서 최적 치환율이 산정되었으며, 두 구간에서 각각 20% 및 30%가 가장 경제적인 것으로 결정되었다. 재하중의 방치기간에 대한 확률론적 해석결과 3개월 이상인 경우 모두 목표파괴확률을 만족하는 것으로 나타났다.

토지 피복 분류에서 분광 영상정보와 시간 문맥 정보의 결합을 위한 베이지안 확률 규칙의 적용 (Application of Bayesian Probability Rule to the Combination of Spectral and Temporal Contextual Information in Land-cover Classification)

  • 이상원;박노욱
    • 대한원격탐사학회지
    • /
    • 제27권4호
    • /
    • pp.445-455
    • /
    • 2011
  • 이 논문은 분광 영상정보만으로 구분력이 상대적으로 떨어지는 분류 항목들의 분류 정확도 향상을 목적으로 기 존재하는 토지피복도로부터 계산된 시간 문맥 정보를 결합하는 확률론적 분류 방법론을 제안하였다. 기 존재하는 토지피복도와 고려하고 있는 시기의 훈련 집단으로부터 분류 항목간 전이 확률을 계산하여 이를 사전 확률로 간주하였다. 분광 영상정보로부터 얻어지는 조건부 확률을 사전 확률과 결합하여 최종적인 사후 확률을 계산하여 분류 항목을 결정하였다. 제안 기법은 기존 시간 문맥 정보를 결합할 때 많은 계산량을 요구하는 방법론들과 달리 확률론적 분류 방법에 쉽게 적용이 가능한 장점이 있다. 시계열 MODIS 자료를 이용한 농작물 분류 사례 연구를 수행하여, 제안 기법의 적용가능성을 검증하였다. MODIS 자료의 낮은 공간 해상도로 인한 혼재 효과로 분광 영상정보만으로 구분력이 떨어지는 분류 항목들은 시간 문맥 정보를 고려함으로써 상대적인 구분력이 향상되어 최종적으로 향상된 분류 정확도를 나타내었다. 따라서 제안 기법은 분류 정확도의 향상과 더불어 기제작된 토지피복도의 갱신에도 효과적으로 이용될 수 있을 것으로 기대된다.