• 제목/요약/키워드: categorical time series

검색결과 7건 처리시간 0.022초

연속형-GARCH 시계열의 범주형화(Clipping)를 통한 분석 (An Analysis of Categorical Time Series Driven by Clipping GARCH Processes)

  • 최문선;백지선;황선영
    • 응용통계연구
    • /
    • 제23권4호
    • /
    • pp.683-692
    • /
    • 2010
  • 본 논문에서는 연속형-GARCH 시계열 자료인 금융 시계열 자료에 대해서 클리핑(clipping)을 통해 얻은 이항(binary) 범주형 시계열을 분석하고 응용하는 방안에 대해 연구하고 있다. 모수추정 방법을 소개하고 있으며 이를 이용하여 이분산 시계열과 연관된 확률을 추정하는 방법을 예시하였다.

범주형 시계열 자료의 군집화: 프로야구 자료의 사례 연구 (Categorical time series clustering: Case study of Korean pro-baseball data)

  • 박노진
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.621-627
    • /
    • 2016
  • 범주형 시계열 자료의 군집화에 대하여 정리해 보았다. 시계열 자료의 군집화는 일반적인 군집화에 시간을 고려해야하는 측면이 있다. 한편, 범주형 시계열 자료의 군집화에 대한 연구가 진행되었으나 현재 정리 요약된 국내외 논문을 찾기 어렵다. 본 논문에서는 범주형 시계열을 군집화 하는 몇 가지 방법들을 제시하고 그 방법들을 비교하기 위해 프로야구 데이터를 이용하였다. 프로야구 팀들 간에 어떤 팀이 특정 팀에 유독 약한 경기력을 보이는 경우가 있다. 국내 최강이라는 S팀이 유독 H팀에게 그런 경우가 그렇다. 2015년 S팀의 상대전적의 군집화를 통해 S팀과 H팀의 관계가 유별난 지를 밝히려 한다. 통계적으로 말하자면, 승/패로 이루어진 시계열 자료의 군집화를 수행하려는 것이다. 분석결과 S팀과 H팀과의 관계가 다른 팀들과의 관계에 비해 눈에 띠는 차이가 있음을 알 수 있었다.

An Analysis of Panel Count Data from Multiple random processes

  • 박유성;김희영
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.265-272
    • /
    • 2002
  • An Integer-valued autoregressive integrated (INARI) model is introduced to eliminate stochastic trend and seasonality from time series of count data. This INARI extends the previous integer-valued ARMA model. We show that it is stationary and ergodic to establish asymptotic normality for conditional least squares estimator. Optimal estimating equations are used to reflect categorical and serial correlations arising from panel count data and variations arising from three random processes for obtaining observation into estimation. Under regularity conditions for martingale sequence, we show asymptotic normality for estimators from the estimating equations. Using cancer mortality data provided by the U.S. National Center for Health Statistics (NCHS), we apply our results to estimate the probability of cells classified by 4 causes of death and 6 age groups and to forecast death count of each cell. We also investigate impact of three random processes on estimation.

  • PDF

국내 주요 10대 기업에 대한 국민 감성 분석: 다범주 감성사전을 활용한 빅 데이터 접근법 (Public Sentiment Analysis of Korean Top-10 Companies: Big Data Approach Using Multi-categorical Sentiment Lexicon)

  • 김서인;김동성;김종우
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.45-69
    • /
    • 2016
  • 최근에 빅 데이터를 활용하여 감성을 측정하는 시도가 활발히 이루어지고 있다. 통신 매체와 SNS의 발달로 기업은 국민의 감성을 파악하고 즉시 대응해야할 필요성이 생겼다. 우리나라의 경제는 대기업에 대한 의존도가 높기 때문에 10대 기업에 대한 감성분석은 의미가 있다고 할 수 있다. 이러한 측면에서 본 연구는 다 범주를 기준으로 구축한 감성사전을 활용하여 우리나라 10대 기업에 대한 감성을 분석하였다. 빅 데이터를 이용하여 감성을 분석한 기존의 선행연구는 감성을 차원으로 분류하는 경향이 있다. 차원적 감성으로 감성을 분류하는 것은 분류의 기준이 학술적으로 증명되었기에 감성 분석에 주로 사용되어 왔지만 전문가 정도의 지식이 있어야 분류할 수 있어 보편적인 감성을 대변하는 데 비효과적이기에 보완이 필요하다고 할 수 있다. 개별 범주적 감성은 이 점을 보완할 수 있는 분류 방식으로 일정 수준의 주관성이 개입되지만 보편적으로 느낄 수 있는 감성을 측정하는데 효과적이다. 따라서 본 연구는 보편적인 감성의 측정을 위해 감성을 차원으로 분류하지 않고 개별 범주로 분류하여 9가지 영역으로 나누었다. 선행 연구에서 추출한 9가지 범주에 해당하는 감성 단어에 기초하여 감성사전을 구축하였으며 감성 단어가 검출된 빈도를 기준으로 감성을 분석했다. 대상 데이터는 2014년 1월부터 2016년 1월까지 우리나라 10대 기업에 대하여 축적된 뉴스 데이터이다. 대상 데이터에서 검출된 감성 단어의 빈도를 기준으로 각 기업에 대한 감성 순위를 나누고 분포를 확인하였다. 기업에 따라서 감성이 다를 수 있는지, 특정 사건이 각 기업에 대한 감성에 영향을 줄 수 있는지 가설을 세우고 검정하였다. 결론적으로, 다 범주 감성 사전을 활용한 감성 분석은 기업 간 비교와 시점 간 비교에 유의한 것으로 나타났다. 본 연구는 빅 데이터에 산재해있는 감성을 국민의 시각으로 측정하는 하나의 대안으로서 의의가 있다.

구글어스를 이용한 연변지역의 문화.역사유적 지도화와 분포의 특징에 관한 연구 (A Study on the Mapping and Characteristics of Distributions in Cultural-Historic Sites of Yanbian Area using Google Earth)

  • 김석주;김남신
    • 한국지역지리학회지
    • /
    • 제17권1호
    • /
    • pp.122-139
    • /
    • 2011
  • 연변지역은 문화 역사적으로 한국뿐만 아니라 중국에 있어서도 관심 지역이다. 연변지역에 대한 문화 역사적 연구는 많지만 유적 지도화에 대한 연구는 찾아보기 힘들다. 본 연구에서는 구글어스 영상을 이용하여 연변지역의 문화 역사 유적을 지도화하고 공간적 특징을 분석하고자 하였다. 석기시대부터 청나라까지 시기별로 문화 역사 유적 분포도를 제작하였다. 지도화 기호체계는 사기별로 색상기호와 유형별 기호를 제작하였다. 지도화 결과 연변지역에는 다른 시기와 비교해 발해와 요 금나라의 유적이 많은 비중을 차지하였다. 특히 고구려, 발해, 요 금나라의 유적은 시 공간적 누층구조를 보였다. 분포특정은 초기에 분지지역과 하천지역에 위치해 있었고, 역사시기 이후에는 구릉과 산지지역으로 이동하였다. 연구결과는 문화 역사 유적 관련 후속연구에 정보를 제공해 줄 수 있을 것으로 기대된다.

  • PDF

한국인 기대여명의 한계추정에 관한 연구 (A Study on the Estimation of Limits to Life Expectancy)

  • 천성수;김정근
    • 한국인구학
    • /
    • 제16권2호
    • /
    • pp.65-83
    • /
    • 1993
  • The purpose of this study is estimate limits of Korean life expectancy at birth by 'Gompertz growth curse Model', 'Cause-Elimination Model' and Multidimensional models of Senescencee and Mortality'. Data used in Gompertz curve were obtained from all life tables published from 1905 to 1990 in Korea, and life expectancies at birth of eighteen groups were selected at five-year interval in consideration of time-series changes. Data used in Cause-Elimination Model are 'Cause of Death statistics in 1991' published in 1992 by National Bureau of Statistics of Korea and 'life table of 1989' published in 1990 by National Bureau of Statistics, Economic Planning Board of Korea. The materials are all classifiable death data, 119, 253 cases of male and 82, 420 cases of female, which is from 1991 Causes of Death statistics. The cases of death analyzed belong to one of 8 categories; i.e., Infectious and Parasitic Diseases(001-139; with notation of Infectious Diseases), Malignant Neoplasms(140-208), Hypertensive Diseases(401-405), Ischemic Heart Dieases and Diseases of Pulmonary Circulation and Other Forms of Heart Diseases(410-429;with notation of Heart Disease), Cerebrovascular Diseases(430-438), Chronic Liver Diseases and Cirrhosis(571; with notation of Liver Diseases), Injury and Poisoning(800-999) and all other disease. Data used in 'Multidimensional models of senescence and mortality' were life table of 1989 published by National Bureau of statistics, Economic Planning Board of Korea and life table of 1970, 1978-79, 1983, 1985 and 1987. The major findings may be summarised as follows: 1. Estimate equations of Gompertz growth curve using life expectancy at birth during the 1905-1990 period are as the following. Male : y = 88.047697 $\times$ $0.199690^{0.903381x}$ Female : y = 95.632828 $\times$ $0.199690^{0.903381x}$ Limits of life expectancy at birth, which were estimated by Gompertz growth curve, are 88.05 for male and 95.63 for female. 2. The effect on life expectancy at birth eliminationg all causes death is 14.04 years(for male) and 10.86 years(for female). Astonishingly, eliminating the malignant neoplasms increase life expectancy at birth by 2.85 years for male 2.03 years for female in 1991. In table 8 we show the effect on life expectancy at birth of separately eliminating each of the 8 categorical causes of death. The theoretical limit to life expectancy by Cause-Elimination Model is 80.96 for male and 85.82 for female. 3. If the same rate of delay [0.376 year(male), 0.435 year(femable) per calendar year] continued, then life expectancy at birth would reach 74.82(male) years and 84, 10(female) years in 2010. With 14.04-years(male) and 10.86-years(female) effect attributable in 2010 would be 88.86 years(male) and 94.96(femable) years. 4. 'Multidimensional models of senescence and death' permits calculations of the value of the attribution coefficient (B), percent of loss per year of physiologic function. The results of Ro and B during the 1970-1989 period are listed in table 9. Estimate of limit to Korean life expectancy at birth by 'Multidimensional models of senescence and death' is 99.47 years for male and 104.74 years for female in 1989.

  • PDF