• Title/Summary/Keyword: 확률추출

Search Result 847, Processing Time 0.026 seconds

Intra-Sentence Segmentation using Maximum Entropy Model for Efficient Parsing of English Sentences (효율적인 영어 구문 분석을 위한 최대 엔트로피 모델에 의한 문장 분할)

  • Kim Sung-Dong
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.5
    • /
    • pp.385-395
    • /
    • 2005
  • Long sentence analysis has been a critical problem in machine translation because of high complexity. The methods of intra-sentence segmentation have been proposed to reduce parsing complexity. This paper presents the intra-sentence segmentation method based on maximum entropy probability model to increase the coverage and accuracy of the segmentation. We construct the rules for choosing candidate segmentation positions by a teaming method using the lexical context of the words tagged as segmentation position. We also generate the model that gives probability value to each candidate segmentation positions. The lexical contexts are extracted from the corpus tagged with segmentation positions and are incorporated into the probability model. We construct training data using the sentences from Wall Street Journal and experiment the intra-sentence segmentation on the sentences from four different domains. The experiments show about $88\%$ accuracy and about $98\%$ coverage of the segmentation. Also, the proposed method results in parsing efficiency improvement by 4.8 times in speed and 3.6 times in space.

Prediction of Rear-end Crash Potential using Vehicle Trajectory Data (차량 주행궤적을 이용한 후미추돌 가능성 예측 모형)

  • Kim, Tae-Jin;O, Cheol;Gang, Gyeong-Pyo
    • Journal of Korean Society of Transportation
    • /
    • v.29 no.3
    • /
    • pp.73-82
    • /
    • 2011
  • Recent advancement in traffic surveillance systems has allowed the researchers to obtain more detailed vehicular movement such as individual vehicle trajectory data. Understanding the characteristics of interactions between leading and following vehicles in the traffic flow stream is a backbone for designing and evaluating more sophisticated traffic and vehicle control strategies. This study proposes a methodology for estimating rear-end crash potential, as a probabilistic measure, in real-time based on the analysis of vehicular movements. The methodology presented in this study consists of three components. The first predicts vehicle position and speed every second using a Kalman filtering technique. The second estimates the probability for the vehicle's trajectory to belong to either 'changing lane' or 'going straight'. A binary logistic regression (BLR) is used to model the lane-changing decision of the subject vehicle. The other component calculates crash probability by employing an exponential decay function that uses time-to-collision (TTC) between the subject vehicle and the front vehicle. The result of this study is expected to be adapted in developing traffic control and information systems, in particular, for crash prevention.

Probabilistic based Web Contents Mining (확률 기반 웹 콘텐츠 마이닝)

  • Yun, Bo-Hyun;Cho, Kwang-Moon
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2006.11a
    • /
    • pp.16-20
    • /
    • 2006
  • In Web contents mining, it is important to recognize the unlabeled entities and to integrate the sub-linked information and the extracted results. This paper presents the probabilistic based method which can recognize the unlabeled entity by using the Baysien model. Moreover, we propose the method that can use the information of the sub-linked web pages and integrate the extracted results. In the experimental results, we can see that the probabilistic based entity and information integration show the most significant precision.

  • PDF

A Stratified Randomized Response Technique (층화 확률화 응답 기법)

  • Ki Hak Hong;Jun Keun Yum;Hwa Young Lee
    • The Korean Journal of Applied Statistics
    • /
    • v.7 no.1
    • /
    • pp.141-147
    • /
    • 1994
  • In the present paper an attempt has been made to develop a stratified ramdomized response technique when the respondents are selected using simple random sampling without replacement (SRSWOR) as well as simple random sampling with replacement (SRSWR). The conditions under which the proposed technique will be more efficient than the corresponding Warner's technique have been obtained.

  • PDF

A Modified Horvitz-Thompson Estimator by Transformation of Variables (변수변환에 의한 수정 HORVITZ-THOMPSON 추정량)

  • 류제복
    • The Korean Journal of Applied Statistics
    • /
    • v.17 no.1
    • /
    • pp.27-34
    • /
    • 2004
  • The Horvitz-Thompson(H-T) estimator is less efficient than PPS estimators in some cases. We use the two-stage variable transformation in order to remove the drawbacks and increase the efficiency of H-T estimator. We transform the auxiliary variable to use the Midzuno-Sen sampling scheme at the first stage. And the next stage, we also transform the study variable to reduce the variance of H-T estimator using the inclusion probability obtained from the first transformation. We compare the efficiency between a suggested modified H-T estimator and PPS estimators.

A Gesture-based Game Interface using HMM (HMM을 이용한 제스처 기반의 게임 인터페이스)

  • 장상수;박혜선;김상호;김항준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.496-498
    • /
    • 2004
  • 본 논문에서는 컴퓨터 액션 게임 중에 하나인, 퀘이크 II 게임을 위한 제스처 기반의 인터페이스를 제안한다. 제안된 인터페이스는 연속된 입력 영상열로부터 재스처를 검출하고 인식하기 위해 HMM 올 사용한다. 먼저 재스처를 검출하기 위해 입력 영상열로부터 포즈 심볼열을 추출하여 사용한다. 인식하기 위해 사용된 HMM은 추출된 포즈 심볼을 입력받아, 상태 확률값을 계산하여 계속적으로 갱신한다 이때 갱신되는 상태 확률값 중에 각 제스처에 속하는 특정상태의 확률값이, 미리 정의된 임계간과 비교하여 초과하면 검출되고 인식된다. 현재 제안된 시스템은 실제 퀘이크 II 게임에서 키보드버튼과 마우스를 통해 입력되는 명령어들 중에서 게임을 진행하기 위해 먼저 필요한 움지임과 시점 변환에 관계되는 명령어들을 13 개의 제스처로 표현하고 이 제스처 명령어를 검출하고 인식한다.

  • PDF

Approximate Variance of Least Square Estimators for Regression Coefficient under Inclusion Probability Proportional to Size Sampling (포함확률비례추출에서 회귀계수 최소제곱추정량의 근사분산)

  • Kim, Kyu-Seong
    • Communications for Statistical Applications and Methods
    • /
    • v.19 no.1
    • /
    • pp.23-32
    • /
    • 2012
  • This paper deals with the bias and variance of regression coefficient estimators in a finite population. We derive approximate formulas for the bias, variance and mean square error of two estimators when we select a fixed-size inclusion probability proportional to the size sample and then estimate regression coefficients by the ordinary least square estimator as well as the weighted least square estimator based on the selected sample data. Necessary and sufficient conditions for the comparison of the two estimators in terms of variance and mean square error are suggested. In addition, a simple example is introduced to numerically compare the variance and mean square error of the two estimators.

Comparative Analysis on Probability Precipitation of Typhoon and Downpour (태풍 및 집중호우 확률강우량 특성 분석)

  • Son, Chan-Young;Oh, Tae-Suk;Moon, Young-Il;Song, Hyun-Sub
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.935-935
    • /
    • 2012
  • 우리나라에 많은 강수를 유발시키는 호우원인에는 크게 태풍, 집중호우를 들 수 있으며 태풍과 집중호우는 우리나라에 막대한 홍수피해를 야기하고 있다. 그러므로 태풍과 집중호우의 발생으로 인한 홍수 피해를 저감시킬 필요성이 있으며, 이러한 문제는 해결해 나가야하는 필수 과제 중 하나라 할 수 있다. 그리하여 본 연구에서는 우리나라를 비교적 잘 표현해주는 지점 21개 관측소를 선정하였으며 1979년~2009년까지의 태풍과 집중호우를 구분하여 지속시간 24시간 연초과치자료를 구축하였고 매개변수적 지점 빈도해석을 통해 재현기간별 확률 강우량을 추출하여 전기간에 대한 확률강우량과 비교, 분석을 하고자 하였다. 분석결과 태풍, 집중호우 모두 저빈도의 경우는 전기간에 대한 확률강우량이 대부분 컸으나 고빈도의 확률 강우량의 경우 전기간 강우사상에 의한 확률강수량 보다 집중호우, 태풍에 의한 확률 강우량이 큰 지점이 발생 함을 알 수 있었다. 그러므로 태풍 및 집중호우의 영향을 받는 주요지점들의 경우 태풍, 집중호우만을 고려하여 확률 강우량을 산정하는 것이 방재 및 치수적인 면에서 필요하다고 판단되며, 고빈도에 대한 확률 강우량 산정시 태풍, 집중호우에 의한 확률강우량을 산정하여 비교 및 검토가 필요하다고 판단된다.

  • PDF

ESTIMATION OF THE CONGESTION PROBABLITY ON A TREE-TYPE TRANSPORATATION NETWORK BY IMPORTANCE SAMPLING (중요표본유출 기법 이용한 교통망 구간의 혼잡확률 추정)

  • 음성직;박영도
    • Journal of Korean Society of Transportation
    • /
    • v.9 no.2
    • /
    • pp.127-134
    • /
    • 1991
  • 본 논문의 목적은 교통망 분석에 있어서 중요한 그러나 흔희 발생하지 않는 사건의 발생확률을 추정하는 방법론 개발에 있다. 예를 들어, 안정적(stable) 교통망에서 일시적인 혼잡현상이 발생할 확률을 씨뮬레이숀을 통해 추정하는 방법에 관한 것이다. 이 분야에서 활발한 연구([3], [12]) 가 있어 왔으나 개괄적(Heuristic) 방법에 제한되어 있었다. 본 논문은 위 문제에 대하여 포괄적(unified)이며 이론적인 방법론을 제시하였다. 이를 위해 대 분산이론(Large Deviation Theory)과 중요표본추출(Importance Sampling)기법이 이용되었으며 예로서 사용된 망은 두개의 구간이 이어진 교통망이다. 부수적으로 혼잡현상의 가장 대표적 형태를 구하는 방법이 제시되었다.

  • PDF

패턴인식법에 의한 압축기의 이상진단에 관한 연구

  • 김태구;김광일
    • Proceedings of the Korean Institute of Industrial Safety Conference
    • /
    • 2001.11a
    • /
    • pp.25-30
    • /
    • 2001
  • 엔진이나 콤프레셔 등과 같은 기기 진동의 동특성은 불규칙적으로 변동하는 성분을 갖는 랜덤 프로세스로 그것을 수학적으로 명확히 기술하는 것은 어렵다/sup 1)/. 하지만 통계학적인 입장에서 시계열 데이터를 보면 시계열 데이터가 확률변수로서 각각의 모집단에 속한다. 따라서 이 점에 주목하여 시계열의 확률적인 특징을 추출하는 것으로, 각각의 시계열 데이터를 확률공간으로 구별하는 것이 가능하다면 시계열 데이터에 의해 표현되어진 상태의 식별가능하다는 이론이 성립된다/sup 2)/.(중략)

  • PDF