• Title/Summary/Keyword: 확률 모델

검색결과 2,138건 처리시간 0.027초

중심어간의 공기 정보와 구문 규칙을 기반으로 한 확률적 한국어 구문 분석 (Probabilistic Parsing of Korean Sentences Based on Lexical Co-occurrence and Syntactic Rules)

  • 이공주;김재훈;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.332-338
    • /
    • 1997
  • 어휘 정보는 구문 구조의 중의성을 해결하는데 중요한 정보원으로서 작용할 수 있다. 본 논문에서는 입력 문장에 대한 구조적 중의성을 해결하는데 확률 구문 규칙뿐만 아니라, 어휘간에 발생할 수 있는 공기 정보를 사용할 수 있는 확률 모델을 제안한다. 제안된 확률 모델에 대하여 실험 데이타에 대해 평가한 결과 약 84%정도의 구문 분석 정확도를 얻을 수 있었다.

  • PDF

성능 모멘트 적분법을 이용한 설계 변수의 불확실성에 기인한 스피커 모델의 성능 변동 예측 (Performance Moment Integration (PMI) for Prediction Performance Changes of a Loudspeaker Model Due to the Uncertainty of Design Variables)

  • 강병수;이상균;김동욱;김동훈
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.766-767
    • /
    • 2015
  • 전자기 관련 제품에서 제작공차에 의한 성능변동의 확률론적 분포특성을 효율적으로 예측하기 위해 성능 모멘트 적분법을 도입하였다. 제안된 기법을 검증하기 위해 간단한 수학예제와 스피커 모델의 폴피스 사이 공극의 평균자속 밀도에 대한 확률론적 분포특성 예측을 수행하고, 이를 기존 확률론적 분포특성 예측 기법과 비교하였다. 또한 몬테카를로 수치모사법을 이용하여 도출된 성능의 확률론적 분포특성 예측 값을 재계산 후 비교함으로써 제안된 기법의 정밀도를 검증하였다.

  • PDF

최대 엔트로피 모델을 이용한 한국어 명사구 추출 (Korean Noun Phrase Identification Using Maximum Entropy Method)

  • 강인호;전수영;김길창
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.127-132
    • /
    • 2000
  • 본 논문에서는 격조사의 구문적인 특성을 이용하여, 수식어까지 포함한 명사구 추출 방법을 연구한다. 명사구 판정을 위해 연속적인 형태소열을 문맥정보로 사용하던 기존의 방법과 달리, 명사구의 처음과 끝 그리고 명사구 주변의 형태소를 이용하여 명사구의 수식 부분과 중심 명사를 문맥정보로 사용한다. 다양한 형태의 문맥 정보들은 최대 엔트로피 원리(Maximum Entropy Principle)에 의해 하나의 확률 분포로 결합된다. 본 논문에서 제안하는 명사구 추출 방법은 먼저 구문 트리 태깅된 코퍼스에서 품사열로 표현되는 명사구 문법 규칙을 얻어낸다. 이렇게 얻어낸 명사구 규칙을 이용하여 격조사와 인접한 명사구 후보들을 추출한다. 추출된 각 명사구 후보는 학습 코퍼스에서 얻어낸 확률 분포에 기반하여 명사구로 해석될 확률값을 부여받는다. 이 중 제일 확률값이 높은 것을 선택하는 형태로 각 격조사와 관계있는 명사구를 추출한다. 본 연구에서 제시하는 모델로 시험을 한 결과 평균 4.5개의 구를 포함하는 명사구를 추출할 수 있었다.

  • PDF

음성인식을 위한 HMM의 파라메터 확장에 관한 연구 (A Study on the Rtension of HMM Parameters for Speech Recognition)

  • 박창호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.152-156
    • /
    • 1994
  • 본 논문에서는 연속출력 확률분포 HMM 모델의 단점을 보완하기 위해 1) 지속시간 확률분포를 갖는 HMM, 2) 동적특징 파라메터를 부여한 HMM, 3) 혼합연속출력 확률분포 HMM을 구성하여 한국어 단음절에 대한 인식실험을 하였다. 실험결과 화자 종속에서는 연속출력 확률분포 HMM 보다 지속시간 확률분포를 갖는 HMM의 경우 0.70%, 동적특징 파라메터를 부여한 HMM의 경우 1.06%, 혼합연속출력 확률분포 HMM의 경우 1.64%의 인식류리 향상되었다. 화자 독립에서는 연속출력 확률분포 HMM보다 동적특징 파라메터를 부여한 HMM의 경우 1.4%, 혼합연속 출력 확률분포 HMM의 경우 2.36%, 지속시간 확률분포를 갖는 HMM의 경우 2.78%의 인식률이 향상되었다.

  • PDF

변동진폭하중 하에서 균열성장예지를 위한 베이지안 모델변수 추정법 (Bayesian Parameter Estimation for Prognosis of Crack Growth under Variable Amplitude Loading)

  • 임상혁;안다운;최주호
    • 대한기계학회논문집A
    • /
    • 제35권10호
    • /
    • pp.1299-1306
    • /
    • 2011
  • 본 연구에서는 측정된 균열 데이터를 토대로 변동하중 하에서의 균열성장모델 변수들을 베이지안 모델변수 추정 방법을 통해서 확률적인 분포로 구하는 방법을 제시하였다. 모델변수의 확률분포를 구하기 위해 Markov Chain Monte Carlo (MCMC) 샘플링 방법을 이용하였다. 변동하중 하에서는 균열성장 모델이 더욱 복잡해 짐에 따라 기존의 MCMC 기법으로는 확률분포를 잘 구하지 못하므로 주변확률밀도분포를 제안함수로 사용하는 MCMC 기법을 새롭게 제안하였다. 모델변수의 추정을 위해 여러 크기의 일정 진폭 하중 하에서 시편시험을 수행하여 얻은 균열성장 데이터를 이용하였다. 추정된 변수들을 사용하여 변동하중 하에서의 시편에 대해 균열성장 예측을 수행하였고, 이를 실제 시험 데이터를 통해서 검증하였다.

지반특성의 불확실성과 신뢰성 기법을 고려한 압밀해석 (Analysis of Consolidation considering Uncertainties of Geotechnical Parameters and Reliability method)

  • 이규환
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제11권4호
    • /
    • pp.138-146
    • /
    • 2007
  • 연약지반에 시공된 지반구조물의 거동은 구조물 하부의 연약지반이나 인접 지반의 특성에 크게 영향을 받는다. 지반 구조물 설계시 사용되는 지반 특성치는 결정론적인 모델이나 확률론적인 모델을 이용하여 나타낼 수 있다. 일반적인 지반구조물 설계시 사용되는 결정론적인 모델은 설계 파라메타로 단 하나의 대표값을 사용하는 반면, 확률론적인 모델은 이산통계나 확률 밀도함수를 이용한다. 연약지반의 압밀도나 침하량등의 산정 결과는 간극비, 압밀계수, 연직 및 수평방향 투수계수등의 불확실성 요소에 영향을 받는다. 본 연구에서는 연직 드레인을 이용한 개량지반에 대한 침하해석시 사용되는 불확실성 인자들에 대한 영향을 분석하여 보았다. 또한, 변동계수가 침하량에 미치는 영향을 분석하였으며 이들 파라메타들이 압밀도나 침하계산시 미치는 영향에 대한 민감도 분석을 실시하였다.

가우시안 혼합 모델을 이용한 하드 디스크 결함 분포의 패턴 분류 (Pattern Classification of Hard Disk Defect Distribution Using Gaussian Mixture Model)

  • 전재영;김정헌;문운철;최광남
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.482-486
    • /
    • 2008
  • 본 논문에서는 하드 디스크 드라이브(Hard Disk Drive, HDD) 생산 공정 과정에서 발생할 수 있는 불량 HDD의 결함 분포에 대해서 패턴을 자동으로 분류해주는 기법을 제시한다. 이를 위해서 표준 패턴 클래스로 분류되어 있는 불량 HDD의 각 클래스의 확률 모델을 GMM(Gaussian Mixture Model)로 가정한다. 실험은 전문가에 의해 분류된 실제 HDD 결함 분포로부터 5가지의 특징 값들을 추출한 후, 결함 분포의 클래스를 표현할 수 있는 GMM의 파라미터(Parameter)를 학습한다. 각 모델의 파라미터를 추정하기 위해 EM(Expectation Maximization) 알고리즘을 사용한다. 학습된 GMM의 분류 테스트는 학습에 사용되지 않은 HDD 결함 분포에서 5가지의 특징 값을 입력 값으로 추정된 모델들의 파라미터 값에 의해 사후 확률을 구한다. 계산된 확률 값 중 가장 큰 값을 갖는 모델의 클래스를 표준 패턴 클래스로 분류한다. 그 결과 제시된 GMM을 이용한 HDD의 패턴 분류의 결과 96.1%의 정답률을 보여준다.

  • PDF

Copula 함수를 이용한 호우사상의 빈도해석 산정 (Estimation of storm events frequency analysis using copula function)

  • 안희진;이문영;김시연;전설;안영민;정동화;박대룡
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.200-200
    • /
    • 2022
  • 본 연구에서는 총 강우량과 강우강도을 고려한 이변수 분석으로 연최대 호우사상을 선별하고, 두 변수를 Copula 함수로 결합하여 최적의 모델조합을 찾는 확률호우사상 산정 방법론을 제시하였다. 국내 69개 관측소의 2020년까지의 관측 자료를 대상으로 1mm 이하의 강우는 제거한 뒤, IETD(Inter-Event Time Definition) 12시간을 기준으로 강우자료를 독립적인 호우사상으로 분리하였다. 호우사상의 여러 특성 중 양의 상관관계를 갖는 총 강우량과 강우강도를 변수로 선택해 이변수 지수분포에 대입하였고, 각 지점의 연최대 호우사상 시계열을 생성하였다. 2변수 지수분포의 매개변수는 전체 기간과 연도별로 나누어 추정해 본 결과 연도별 변동성이 큰 것을 확인해 연도별 추정 방식을 선택하였다. 연최대 강우사상 시계열의 총 강우량과 강우강도는 극한 강우에 적용하는 확률분포형 중 Lognarmal, Gamma, Gumbel, GEV(Generalized Extreme Value), GPD(Generalized Pareto Distribution) 5가지를 사용하여 각각 CDF(Cumulative distribution Function) 값을 추정하였다. 계산된 CDF 값은 3가지 Copula 모형으로 결합해 joint CDF 값을 산출하였다. 총 75개의 모델조합 중 최적 모델을 찾기 위해 CVM(Cramer-von-Mises) 적합도 검정을 시행하였다. CVM의 통계량 Sn 값이 가장 작은 모델조합을 해당 지점의 최적 모델조합으로 선정하였다.

  • PDF

다중 파괴모드를 고려한 단순 사면의 최적 설계 (Optimum Design of a Simple Slope considering Multi Failure Mode)

  • 김현기;신민호;최찬용
    • 한국방재학회 논문집
    • /
    • 제10권6호
    • /
    • pp.73-80
    • /
    • 2010
  • 최저 안전율 또는 최대 파괴확률을 기반으로 하는 기존의 사면안정해석에 대하여, 지반물성과 해석모델이 갖는 고유 불확실성을 최소화하고, 사면안정해석에서 다양한 안정해석모델과 그에 따른 파괴형상을 반영할 수 있도록, 다중 파괴모드를 고려한 사면의 신뢰성해석기법을 제안하였다. 파괴확률의 산정에는 체계 신뢰성해석분야에서 최근 도입된 선형계획법에 의한 최적화를 이용하였다. 이를 통하여 여러 가지 해석모델을 신뢰성 기반으로 동시에 고려하여 해석할 수 있다. 선형계획법에 의한 다중 파괴 모드를 고려한 파괴확률 산정기법을 이용하여 단순 사면의 경사도 결정을 위한 최적 설계를 검토하였다. 그 결과, 동시 파괴확률을 이용하면, 대상으로 하는 사면안정해석모델과 파괴형상 및 파괴확률을 복합적으로 고려할 수 있기 때문에 개선된 안전성을 확보할 수 있을 것으로 판단된다.

포화(飽和)된 사질토(砂質土)내로의 오염물(汚染物) 이동에 대한 시스템 신뢰성(信賴性) 모델의 응용(應用) (Reliability Analysis to Contaminant Migration in Saturated Sandy Soils : System Reliability Approach)

  • 장연수
    • 대한토목학회논문집
    • /
    • 제12권2호
    • /
    • pp.229-237
    • /
    • 1992
  • 2차원 수평흐름에서의 비반응성 오염물 이동에 대한 연속시스템(series system) 신뢰성해석을 농도와 노출시간의 두 극한상태 함수에 대해 시행하였다. 시간에 따라 변화하는 오염원에서의 오염이동모델을 시스템 신뢰해석 모델과 결합하여 오염이 예상되는 지점의 최대농도가 주어진 기간동안에 특정농도를 초과하거나 또는 오염예상 지점이 보통의 농도에 노출되어질 시간이 특정 한계를 초과할 확률을 구하였다. 본 신뢰성 해석의 결과 상기의 두조건을 초과할 확률은 각각의 조건을 초과할 확률보다 큰 것은 확인하였으며 보다 큰 초과확률을 갖는 요소에 의하여 지배되는 것을 발견하였다. 예민도 해석은 투수계수 외에도 횡단 분산계수(transverse dispersivity)도 이차원 오염이동 신뢰성 모델의 중요한 매개 변수임을 보여주었다. 시스템 예민도는 두 요소의 예민도를 동시에 반영하고 있으며 큰 초과확률을 갖는 요소가 해(解)에 보다 큰 영향을 미치는 것을 알게 되었다.

  • PDF