• Title/Summary/Keyword: 통계 계산

Search Result 1,310, Processing Time 0.027 seconds

Applications of R package for statistical engineering (통계공학을 위한 R 패키지 응용)

  • Jang, Dae-Heung
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.1
    • /
    • pp.87-105
    • /
    • 2020
  • Statistical engineering contains the design of experiments, quality control/management, and reliability engineering. R is a free software environment for statistical computing and graphics that is supported by the R Foundation for Statistical Computing. R package has many functions and libraries for statistical engineering. We can use R package as a useful tool for statistical engineering. This paper shows the applications of R package for statistical engineering and suggests a R Task View for statistical engineering.

한국증권시장에서의 증권가격의 불연속성과 매도매수 가격의 차이로 인한 통계추정치의 편의에 관한 연구

  • Choi, Jong-Yeon
    • The Korean Journal of Financial Management
    • /
    • v.12 no.2
    • /
    • pp.73-93
    • /
    • 1995
  • 본 연구는 주식시장에서의 체결가격을 균형가격으로 가정하여 계산된 수익률에 관한 통계추정치의 편의에 관하여 분석하고 있다. 주식수익률의 통계적모멘트를 추정하는 것은 주식가격의 행태를 분석하는 연구 및 사건연구등에서 많은 학자들에 의하여 수행되어 왔다. 기존의 대부분의 연구들은 시장에서 체결된 가격이 그 시점의 진정한 균형가격이라는 가정하에 수익률을 계산하고 이 수익률 자료로부터 수익률의 평균, 표준편차, 외도(skewness), 침도(kurtosis) 등의 통계적모멘트를 추정하였다. 그러나 체결가격은 시장의 규칙에 의해 일정한 호가단위로만 거래될 뿐 아니라 매도 또는 매수호가에 거래됨으로써 진정한 균형가격과의 괴리가 있을 수 있게 된다. 본 연구는 주식호가단위의 불연속성과 매도매수호가의 차이로 연한 통계추정치의 편의에 관한 모형을 도출하여 편의의 크기와 특징을 분석하고, 이를 수정하는 간편식을 도출하여 그 유효성을 검증하고 있다. Gottlieb and Kalay(1985), Ball(1988), Cho and frees(1988)등은 1/8 달러의 최소호가단위로 인하여 발생하는 기존의 분산추정치의 편의를 계산하고 이를 수정하는 간편식을 제시하였다. French and Roll(1986)은 휴일이 포함된 기간의 수익률 분산과 평일 분산추정치의 비율이 기간과 비례하지 않는 원인중 하나는 매도매수호가차이로 인한 분산추정치의 편의라는 점을 설명한 바 있다. Choi and Shastri(1989)는 Black and Scholes 옵션가격 결정모형 이 주식 분산값의 크기에 따라 일정한 편의를 보이는 주요한 원인은 퍼센티지 매도매수호가차이와 옵션가격이 모두 진정한 분산치의 정의 함수이기 때문이라는 점을 보였다. Harris(1988)와 최종연(1994)는 주가의 불연속성 및 매도매수호가차이를 동시에 고려하여 기존의 분산추정치가 어떠한 편의를 보이는지에 관하여 분석한 바 있다. 본 연구에서는 최종연(1994)의 연구에서 도출된 모형을 연장하여 국내 주식시장과 같이 주가 수준에 따라 최소호가단위가 변화할 때의 변형모형을 도출하였다. 또한 이 모형에 따라 통계추정치의 편의를 수익률의 표준편차를 중심으로 계산하여 그 정도를 미국시장의 경우와 비교하였고, 그 추정치의 수정 방법에 대하여 호가단위가 변화하는 주가금액이 10,000원 주변일 경우를 중심으로 분석하였다.

  • PDF

A new method for calculating quantiles of grouped data based on the frequency polygon (집단화된 통계자료의 도수다각형에 근거한 새로운 분위수 계산법)

  • Kim, Hyuk Joo
    • Journal of the Korean Data and Information Science Society
    • /
    • v.28 no.2
    • /
    • pp.383-393
    • /
    • 2017
  • When we deal with grouped statistical data, it is desirable to use a calculation method that gives as close value to the true value of a statistic as possible. In this paper, we suggested a new method to calculate the quantiles of grouped data. The main idea of the suggested method is calculating the data values by partitioning the pentagons, that correspond to the class intervals in the frequency polygon drawn according to the histogram, into parts with equal area. We compared this method with existing methods through simulations using some datasets from introductory statistics textbooks. In the simulation study, we simulated as many data values as given in each class interval using the inverse transform method, on the basis of the distribution that has the shape given by the frequency polygon. Using the sum of squares of differences from quantiles of the simulated data as a criterion, the suggested method was found to have better performance than existing methods for almost all quartiles and deciles.

표준품질지수

  • 한근식
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2004.11a
    • /
    • pp.41-48
    • /
    • 2004
  • 2002년 10월 유럽통계협회는 품질지수개발을 위해 협회소속국가들이 연합하여 특별연구팀을 발족시켰다. 이 팀의 주목적은 유럽통계협회에서 생산되는 자료의 품질을 측정하기 위해 대표성이 있으며, 계산하기 쉽고, 이해하기 쉬운 지수를 개발하는 것이었다. 유럽 통계협회는 연구팀에서 개발한 지수를 이용하여 내부품질보고서를 작성하도록 결정하였다. 개발된 풀질지수들은 유럽 통계협회 소속 국가에 의해 생산된 통계에 적용하기 적합해야하며 유럽전체를 위해 Eurostat 이 보유하고 있는 통계에도 적합해야한다. 그러므로 지수들은 각 국이 합의한 용어, 공식, 변수, 도메인, 분석의 정도를 고려하여 개발되도록 하였다. 이러한 지수는 정기적으로 생산되도록 규정하고 있으며 이 규정이 지켜지기 위해서는 동일한 변수, 공식 통이 적용되어야함은 물론이고 시계열의 유지를 위해 관련된 메타데이터가 제공되어야한다. 서로 다른 조사결과로부터 관련된 통계량의 측정과 개념들간의 차이를 확인하기 위해서 메타데이터는 반드시 필요하며 품질보고서가 있는 경우 많은 도움이 릴 것이다. 본 연구에서는 동계생산자의 관점에서 본 각각의 품질 요소에 따라서 생산된 다양한 통계의 풀질을 평가하기 위해서 개발된 일련의 표준화된 품질지수를 제시할 것이다. 각 지수들의 정의와 가장 대표적인 지수산출을 제안하고 지수산출을 위해 필요한 메타데이터를 선명한 것이다.

  • PDF

시군구 실업자 추정에서 분산 추정

  • Lee, Gye-O;Kim, Gyu-Yeong
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2002.05a
    • /
    • pp.7-12
    • /
    • 2002
  • 경제활동인구조사에서 시군구의 실업자를 추정하는데 소지역 추정법을 이용하는 방안에 대한 연구는 관심의 대상이 되고 있다. 본 연구에서는 합성 추정법과 복합 추정법을 이용한 시군구 실업통계 작성법을 소개하였고 추정량이 편향이므로 잭나이프 방법을 이용한 추정량의 정도를 계산하는 절차를 설명하였으며, 광주광역시의 구별 실업통계작성을 사례로 제시하였다.

  • PDF

A Computer Intensive Method for Modern Statistical Data Analysis I ; Bootststrap Method and Its Applications (통계적 데이터 분석방법을 위한 컴퓨터의 활용 I : 붓스트랩 이론과 응용+)

  • 전명식
    • The Korean Journal of Applied Statistics
    • /
    • v.3 no.1
    • /
    • pp.121-141
    • /
    • 1990
  • Computer intensive bootstrap methods are studied as a tool of statistics. Practical calculation and theoretical justification problem of the methods in estimating the sampling distribution and construction confidence region of parameters are discussed through several examples. Statistical meaning of the methods are also considered.

  • PDF

History and Future of Bayesian Statistics (베이지안 통계의 역사와 미래에 대한 조망)

  • Lee, Jaeyong;Lee, Kyoungjae;Leea, Youngseon
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.6
    • /
    • pp.855-863
    • /
    • 2014
  • The recent computational revolution of Bayesian statistics has expanded use of the Bayesian statistics significantly; however, Bayesian statistics face a new set of challenges in the era of information technology. We survey the history of Bayesian statistics briefly and its expansion in the modern times. We then take a prospective future view of statistics and list challenges that the statistics community faces.

A Dynamic Link Model for Korean POS-Tagging (한국어 품사 태깅을 위한 다이내믹 링크 모델)

  • Hwang, Myeong-Jin;Kang, Mi-Young;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.282-289
    • /
    • 2007
  • 통계를 이용한 품사 태깅에서는 자료부족 문제가 이슈가 된다. 한국어나 터키어와 같은 교착어는 어절(word)이 다수 형태소로 구성되어 있어서 자료부족 문제가 더 심각하다. 이러한 문제를 극복하고자 교착어 문장을 어절 열이 아니라 형태소의 열이라 가정한 연구도 있었으나, 어절 특성이 사라지기 때문에 파생에 의한 어절의 문법 범주 변화 등의 통계정보와 어절 간의 통계정보를 구하기 어렵다. 본 논문은 효율적인 어절 간 전이확률 계산 방법론을 고안함으로써 어절 단위의 정보를 유지하면서도 자료부족문제를 해결할 수 있는 확률 모델을 제안한다. 즉, 한국어의 형태통사적인 특성을 고려하면 앞 어절의 마지막 형태소와 함께 뒤 어절의 처음 혹은 끝 형태소-즉 두 개의 어절 간 전이 링크만으로도 어절 간 전이확률 계산 시 필요한 대부분 정보를 얻을 수 있고, 문맥에 따라 두 링크 중 하나만 필요하다는 관찰을 토대로 규칙을 이용해 두전이링크 중 하나를 선택해 전이확률 계산에 사용하는 '다이내믹 링크 모델'을 제안한다. 형태소 품사 bi-gram만을 사용하는 이 모델은 실험 말뭉치에 대해 96.60%의 정확도를 보인다. 이는 같은 말뭉치에 대해 형태소 품사 tri-gram 등의 더 많은 문맥 정보를 사용하는 다른 모델을 평가했을 때와 대등한 성능이다.

  • PDF