• Title/Summary/Keyword: 통계 처리

Search Result 3,140, Processing Time 0.038 seconds

Shallow parser using Korean information (한국어 통사 및 의미 정보를 활용한 명사구 인식)

  • Han, Kyou-Youl;Ahn, Kwang-Mo;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.129-134
    • /
    • 2008
  • 본 논문에서는 한국어 문장의 통사적 특성과 제한된 통계정보를 이용한 명사구의 패턴에 의한 명사구 인식에 대해 기술한다. 본 논문의 명사구 인식기는 관형사와 관형격 조사, 관형형 어미에 관련된 패턴의 명사구 인식을 수행하고, 시간과 장소를 나타내는 특정한 명사에 의해 유도되는 명사구를 인식한다. 또한 복합명사 결합의 문제를 의미쌍 간의 결합도의 문제로 분류하고 해결방법을 제시한다. 실험 결과는 본 논문에서 제안하는 통사적으로 확실한 정보와 제한된 통계정보를 이용한 명사구 인식기가 높은 수준의 명사구 인식을 수행한다는 것을 보여준다.

  • PDF

Uncertainty Analysis for Parameter Estimation in Rainfall Frequency Analysis using Bootstrap (Bootstrap을 이용한 강우빈도해석에서의 매개변수 추정에 대한 불확실성 해석)

  • Seo, Young-Min;Jee, Hong-Kee;Lee, Soon-Tak
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.1406-1411
    • /
    • 2009
  • Bootstrap 기법은 통계학적 추정치의 정확도 또는 불확실성을 평가하기 위한 컴퓨터 기반 리샘플링 기법으로서 플러그인 원칙을 이용하여 요약통계치의 표준오차 및 신뢰구간을 추정하며, Bootstrap 기법 중 BCa 기법은 다른 Bootstrap 기법들에 비해 적합도 기준면에서 훨씬 우수한 결과를 나타내는 것으로 알려져 있다. 본 논문에서는 강우빈도해석에서 확률분포의 매개변수 추정에 대한 불확실성 고려한 확률강우량의 산정 및 불확실성의 영향을 평가하기 위하여 Bootstrap 기법 중 비매개변수적 BCa 기법에 기반한 불확실성을 고려한 강우빈도해석모델 구축 및 적용을 통해 홍수위험평가 및 수자원 계획 등에 있어서 불확실성 표현 및 처리기법을 제시하였다.

  • PDF

Performance Improvement of Extracting Bilingual Term from Phrase Table using Sentence Length Reduction (문장 길이 축소를 이용한 구 번역 테이블에서의 병렬어휘 추출 성능 향상)

  • Jeong, Seon-Yi;Lee, Kong-Joo
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.120-125
    • /
    • 2013
  • 본 연구는 대량의 특정 도메인 한영 병렬 말뭉치에서 통계 기반 기계 번역 시스템을 이용하여 병렬어휘를 효과적으로 추출해 낼 수 있는 방법에 관한 것이다. 통계 번역 시스템에서 어족이 다른 한국어와 영어간의 문장은 길이 및 어순의 차이로 인해 용어 번역 시 구절 번역 정확도가 떨어지는 문제점이 발생할 수 있다. 또한 문장 길이가 길어짐에 따라 이러한 문제는 더욱 커질 수 있다. 본 연구는 이러한 조건에서 문장의 길이가 축소된 코퍼스를 통해 한정된 코퍼스 자원 내 구 번역 테이블의 병렬어휘 추출 성능이 향상될 수 있도록 하였다.

  • PDF

A Topic Classification System in cQA Services Based on Semi-Automatic Learning Using Wikipedia (위키피디아를 이용한 반자동 학습 기반의 cQA 서비스 주제 분류 시스템)

  • Kim, Taehyun
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.139-141
    • /
    • 2015
  • 본 논문은 커뮤니티 기반의 질의-응답 서비스에서 사용자 질의의 주제를 분류하는 시스템을 소개한다. 커뮤니티 기반의 질의-응답 서비스는 분야에 따라 다양한 주제를 가질 수 있으며 오늘 날 사용자 질의의 주제 분류에는 통계 기반의 분류 방법이 많이 이용되고 있다. 통계 기반의 분류 방법으로 사용자 질의를 분류하기 위해서는 주제에 적합한 대량의 학습 말뭉치가 필요하다. 주제에 적합한 대량의 학습 말뭉치를 사람이 직접 구축하는 것은 많은 시간과 비용이 든다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 위키피디아 문서를 Supervised K-means Clustering 기법으로 주제별로 분류함으로써 학습 말뭉치를 반자동으로 구축하는 방법을 제안한다. 그 다음, 생성된 학습 말뭉치로 지지 벡터 기계를 학습하여 사용자 질의의 주제를 분류하게 된다. 위키피디아 문서와 사용자 질의는 다른 도메인의 문서임에도 불구하고 본 논문의 시스템으로 사용자 질의의 주제를 분류한 결과 77.33%의 정확도를 보였다.

  • PDF

Verbal Collocation Extraction from Sejong Tagged Corpus (세종 말뭉치로부터 용언연어 추출)

  • Lee, Jeong-Tae;Cheon, Min-Ah;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.121-123
    • /
    • 2015
  • 연어는 둘 이상의 단어로 구성된 표현으로 연어에 속하는 개개의 단어의 의미로써 연어의 의미를 유추할 수 없다. 따라서 연어의 의미를 분석하거나 번역할 경우 개개의 단어보다는 연어 그 자체를 하나의 분석 단위로 간주하는 것이 훨씬 더 효과적이다. 이를 위해 본 논문에서는 통계기법을 활용하여 세종 말뭉치로 부터 용언연어의 추출 방법을 제시하고 그 성능을 평가한다. 연어 패턴과 통계 정보를 이용해서 연어를 추출한다. 평가를 위해서 연어 사전과 전문가의 주관적 평가를 동시에 수행했다.

  • PDF

단위근(單位根)과 공적분(共積分)의 경제학적(經濟學的) 의미(意味)와 그 검정법(檢定法)에 대한 개요(槪要)

  • Choe, Beom-Su
    • KDI Journal of Economic Policy
    • /
    • v.11 no.2
    • /
    • pp.119-141
    • /
    • 1989
  • 최근에 거시계량경제학(巨視計量經濟學)의 실증분석(實證分析)은 불안정적(不安定的) 시계열(時系列)(non-stationary time series)에 대한 인식과 그 통계적(統計的) 처리기법(處理技法)에 있어서 현저한 진전을 보였다. 주요한 거시경제변수(巨視經濟變數)들이 단위근(單位根)(unit root)을 가지기 때문에 계량경제학(計量經濟學)의 방법론(方法論) 단순적용할 수 없다는 주장이 대두되고 있는 한편 이러한 문제점을 극복하는 동시에 변수 상호간 장기균형관계(長期均衡關係)를 설명할 수 있는 공적분(共積分)(cointegration)이론(理論)이 개발되어 경제학(經濟學) 여러 분야에서 응용되고 있다. 본(本) 연구(硏究)에서는 단위근(單位根)과 공적분(共積分)의 개념과 그 통계학적(統計學的) 및 경제학적(經濟學的) 의미를 설명하고 여태까지 개발된 검정통계량(檢定統計量) 중 비교적 우수하다고 평가되는 몇가지의 검정력(檢定力)을 비교평가(比較評價)함으로써 이들을 이용한 실증분석(實證分析)의 지침을 제공하고자 하였다.

  • PDF

Some orthogonal factorial row-column designs (직교 요인 행-열 계획)

  • 박동권
    • The Korean Journal of Applied Statistics
    • /
    • v.5 no.2
    • /
    • pp.169-179
    • /
    • 1992
  • It is shown that a structurally complete row-column design has orthogonal factorial structure if each of its component designs has orthogonal factorial structure. It implies that such designs are most easily constructed via the amalgamating of one-dimensional block designs which have orthogonal factorial structure. However, this does not always hold for structurally incomplete row-column designs. A structurally incomplete row-column design is derived from the design with adjusted orthogonality, by simply interchanging row and treatment numbers.

  • PDF

Nonparametric method in one-way layout based on joint placement (일원배치법에서 결합위치를 이용한 비모수 검정법)

  • Jeon, Kyoung-Ah;Kim, Dongjae
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.4
    • /
    • pp.729-739
    • /
    • 2016
  • Kruskal and Wallis (1952) proposed a nonparametric method to test the differences between more than three independent treatments. This procedure uses rank in mixed sample combined with more than three unlike populations. This paper proposes a the new procedure based on joint placements for a one-way layout as extension of the joint placements described in Chung and Kim (2007). A Monte Carlo simulation study is adapted to compare the power of the proposed method with previous methods.

Instability in nonlinear regression model (비선형회귀모형에서의 불안정성)

  • Bark, Pyeng-Mu;Kim, Youngil;Jang, Dae-Heung
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.1
    • /
    • pp.195-202
    • /
    • 2017
  • We can sometimes find instability against numerical solutions in nonlinear regression. All iterative procedures in nonlinear regression require initial parameter values to be selected. Poor starting values may result in convergence to an unwanted stationary point of the error sum of squares surface. Starting values can sometimes cause the chaos effect in the nonlinear regression model. We can find the chaos phenomena with the convergence plot of starting values in the parameter space.

Statistical Analysis of Marathon Course Measurements (마라톤 코스 측정치의 통계적 분석)

  • 조규전;이영진
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.4 no.2
    • /
    • pp.1-9
    • /
    • 1986
  • The marathon course on road surfaces varies frequently in alignment horizontally and /or vertically. This fact compelled use to use a calibrated bicycle method for the course measurement, and to be required statistical approaches for data processing. This paper deals with the computation of the Seoul Olympic Marathon course lengths measured on May 18, 1986. The concept of safety factor against short course is analyzed for certification, and statistical methods are presented to compute an appropriate safety factor. The results of computation show that the best (lowest) actual measurement provides about 99.95% confidence that the combined lengths of all intervals will not be found short upon an equally accurate remeasurement.

  • PDF