• 제목/요약/키워드: 시계열 데이터 분석

검색결과 740건 처리시간 0.027초

용어 활용주기 모델링을 이용한 기술용어 트렌드 분석 (Trend Analysis of Technical Terms Using Term Life Cycle Modeling)

  • 황미녕;조민희;황명권;정도헌
    • 정보처리학회논문지D
    • /
    • 제18D권6호
    • /
    • pp.493-500
    • /
    • 2011
  • 기술용어 트렌드는 특정 연구 분야의 세부적인 주제가 시간의 흐름에 따라 변화하는 양상을 표현한다. 그런데 학술 문헌이나 특허의 경우에는 그 데이터가 방대하여 인적 자원을 활용하여 트렌드를 분석하는 것이 용이하지 않다. 본 논문은 용어의 활용주기를 모델링하고, 이를 통해 학술 논문에 나타나는 기술용어 트렌드를 탐지하고 분석할 수 있는 방법을 제안한다. 제안된 기법은 다음과 같은 과정으로 구성된다. 먼저 논문 데이터에서 추출된 기술용어를 대상으로 일정 주기별 용어지배값을 측정한다. 용어지배값 획득되면 이를 기반으로 용어 활용주기를 모델링한다. 이 모델링 과정에서 활용주기의 시계열 패턴이 유사한 기술용어들은 동일 트렌드 범주로 분류한다. 본 논문의 기술용어 트렌드 분석 실험을 위해 한국과학기술정보연구원이 운영 중인 국가과학기술정보센터(NDSL) 학술 논문 데이터를 활용하였다.

RNN 알고리즘을 이용한 온천천의 하천수질 인자 예측 (Prediction of river water quality factor at Oncheoncheon Basin using RNN algorithm)

  • 임희성;안현욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.39-39
    • /
    • 2019
  • 인구의 도시 집중화로 인하여 다량의 생활용수의 사용에 따라 하천의 자정능력을 초과하여 오염을 유발시키고 있다. 이에 도시하천들의 오염은 점점 심해져 경제적으로 많은 문제를 유발하고 있다. 이러한 하천오염 문제를 과학적으로 대응하기 위해서는 오염물질의 농도 측정 및 데이터 축척을 통한 오염예측이 필수적이라 할 수 있으며, 부산광역시 보건환경정보 공개시스템에서는 하천수질 자동측정망을 설치하여 시간 단위로 오염물질을 측정하고 있다. 그러나 온천천의 하천수질 데이터는 계속 쌓여가고 있는데 이 데이터를 활용해서 하천수질 인자 예측이 거의 이뤄지지 않고 있다. 본 연구에서는 순환신경망 알고리즘을 활용하여 일 단위의 하천수질 인자 예측을 시도하였다. 순환신경망은 인공신경망의 발전된 형태인 시계열 학습에 강한 RNN, LSTM 알고리즘을 활용한 일단위 하천수질 인자 예측을 하고자 하였다. 연구에 앞서 시간 단위로 쌓여있는 데이터를 평균 내어 일 단위로 변경하였고 이 데이터를 가지고 일 단위 하천수질 인자 예측을 진행하였다. 연구에는 Google에서 개발한 딥러닝 오픈소스 라이브러리인 텐서플로우를 활용하여 DO, 탁도 등 항목을 예측하였다. 하천오염의 학습과 예측을 위해 대상지로는 부산지역 온천천의 부곡교, 세병교, 이섭교 관측소를 선택하였다. 연구를 위해 DO, 탁도 등 자료 수집은 부산광역시 보건환경정보 공개시스템의 자료를 활용하였다. 모형의 학습을 위해 입력자료로는 하천수질 인자 자료를 이용하였고, 자료의 학습에는 2014년~2017년 4년간의 자료를 학습자료로 사용하였고, 2018년 1년간의 자료는 모형의 검증을 위해 사용하였다. RNN, LSTM 알고리즘을 활용하여 분석 시 은닉층의 개수, 반복시행횟수, sequence length 등의 값을 조절하여 하천수질 인자 예측을 하였다. 모형의 검증을 위해 $R^2$(r square)와 RMSE(root mean square error)을 이용하여 통계분석을 실시하였다.

  • PDF

가중 F 척도를 이용한 Trace-Driven 시뮬레이션 모델의 검증 방법 (Validation Technique of Trace-Driven Simulation Model Using Weighted F-measure)

  • 황보훈;천현재;이홍철
    • 한국시뮬레이션학회논문지
    • /
    • 제18권4호
    • /
    • pp.185-195
    • /
    • 2009
  • 최근 시스템들이 복잡해지면서 시뮬레이션을 통한 시스템의 분석이 주목을 받고 있다. 시뮬레이션 분석에서 가장 핵심적인 부분 중의 하나가 시뮬레이션 모델의 검증이며, 이 과정을 통하여 시뮬레이션 모델이 얼마나 실제 시스템을 대변할 수 있는지를 판단한다. 모델의 검증에서 시뮬레이션 모델과 실제시스템의 데이터를 비교할 때 발생하는 차이는 입력 데이터의 차이에 의한 영향도 있으며, 이를 통한 모델의 검증 결과는 높은 신뢰성을 보장하지 못한다. 따라서 이 논문에서는 실제와 동일한 입력 데이터를 바탕으로 하는 Trace-Driven 시뮬레이션을 기반으로 모델을 설계하였다. 한편, 출력데이터들을 하나의 통계량을 통한 검증이 아닌 클래스 별 검증을 하기 위해 데이터마이닝 분야에서 분류기의 성능을 판단하는 F 척도를 응용하여 시뮬레이션 모델의 검증을 수행하였다. 그 결과, 제안된 검증 방법은 정밀한 모델의 검증을 가능하게 하고, 검증 시에 피드백을 제공함으로써 용이한 수정 작업을 가능하게 한다.

특수일 분리와 예측요소 확장을 이용한 전력수요 예측 딥 러닝 모델 (Deep Learning Model for Electric Power Demand Prediction Using Special Day Separation and Prediction Elements Extention)

  • 박준호;신동하;김창복
    • 한국항행학회논문지
    • /
    • 제21권4호
    • /
    • pp.365-370
    • /
    • 2017
  • 본 연구는 전력수요 패턴이 다른 평일과 특수일 데이터가 가지는 상관관계를 분석하여, 별도의 데이터 셋을 구축하고, 각 데이터 셋에 적합한 딥 러닝 네트워크를 이용하여, 전력수요예측 오차를 감소하는 방안을 제시하였다. 또한, 기본적인 전력수요 예측요소인 기상요소에 환경요소, 구분요소 등 다양한 예측요소를 추가하여 예측율을 향상하는 방안을 제시하였다. 전체데이터는 시계열 데이터 학습에 적합한 LSTM을 이용하여 전력수요예측을 하였으며, 특수일 데이터는 DNN을 이용하여 전력수요예측을 하였다. 실험결과 기상요소 이외의 예측요소 추가를 통해 예측율이 향상되었다. 전체 데이터 셋의 평균 RMSE는 LSTM이 0.2597이며, DNN이 0.5474로 LSTM이 우수한 예측율을 보였다. 특수일 데이터 셋의 평균 RMSE는 0.2201로 DNN이 LSTM보다 우수한 예측율을 보였다. 또한, 전체 데이터 셋의 LSTM의 MAPE는 2.74 %이며, 특수 일의 MAPE는 3.07 %를 나타냈다.

지하공동구 관리를 위한 고속 검색 데이터 생성 및 사용자 맞춤형 서비스 방안 설계 (Design of Data Generating for Fast Searching and Customized Service for Underground Utility Facilities)

  • 박종화;전지혜;박구만
    • 방송공학회논문지
    • /
    • 제26권4호
    • /
    • pp.390-397
    • /
    • 2021
  • 디지털 트윈 기술을 다양한 산업 분야에 응용함에 따라 대용량 데이터를 효과적으로 처리하기 위한 기술들이 필요하다. 본 논문에서는 지하 공동구 관리를 위한 대용량 데이터를 고속 검색하고 효과적인 전달을 위한 맞춤형 서비스 방안에 대해 논한다. 제안하는 방안은 크게 두 가지로 방대한 데이터를 효율적으로 검색하고 축약해서 보여주기 위한 고속 검색 데이터 생성 방법과 맞춤형 정보 서비스 분할 방법에 대해 제안한다. 고속 검색 데이터 생성에서는 지하 공동구 내 센서들에 의해 수집되는 시계열 분석을 위한 동기화 과정에 대해 구성과 데이터 축약에 따른 부가정보 방안에 대해서 논한다. 사용자 맞춤형 서비스 방법에서는 평상시와 재난 시의 사용자 유형을 정의하고 그에 따른 서비스하는 방법에 대해 논한다. 본 연구를 통해 재난 상황에서 대용량 데이터를 효과적으로 검색하고 서비스 받을 수 있는 지하 공동구 관리를 위한 데이터 생성과 서비스 모델에 대한 체계성을 갖출 수 있을 것으로 예상된다.

딥러닝 기반 무역 수출 가격 예측 모델 (Predicting the Future Price of Export Items in Trade Using a Deep Regression Model)

  • 김지훈;이지항
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권10호
    • /
    • pp.427-436
    • /
    • 2022
  • 산업통상자원부에서 제공하는 KOTRA 무역 데이터는 해당 품목과 해당 국가에 대하여 GDP, 관세율, 비즈니스 점수, 과/차년도 수출금액 등을 제공한다. 그러나 무역 수출품목은 수없이 많을뿐더러 그에 따른 대량의 데이터를 매년 수작업 기반 분석을 통해 유의미한 결과를 이끌어내는 것은 상당히 큰 시간과 비용을 요구한다. 따라서 이번 연구에선 대량의 데이터를 학습하여 단기간에 저비용으로 결과 예측이 가능한 다층 퍼셉트론 모델을 구현하고 성능을 평가하였다. 먼저 딥러닝 기반 무역 수출 가격 예측 모델을 일반적 다변량 회귀 모델과 비교하였을 때, 예측 오류와 학습 시간 측면에서 통계적으로 우수한 성능을 보였다. 수출 가격 데이터는 시계열 속성이 있을 것으로 예상하는 바, 은닉 노드들이 모두 연결된 다층 퍼셉트론과 순환 신경망을 이용하여 수출 가격 데이터를 예측하였다. 그 결과 새로운 데이터에 대해 수출 가격 예측을 위한 일반화 능력은 순환 신경망이 우수한 성능을 보였으나, 다층 퍼셉트론이 무역 수출 가격 예측에서 더 뛰어난 성능을 보였다. 추후 장기간 데이터를 확보한다면, 순환 신경망 혹은 트랜스포머 기반 딥러닝 모델을 이용하여 더 뛰어난 수출 가격 예측이 가능할 것으로 사료된다.

빅데이터를 활용한 도시공원 이용행태 특성의 시계열 분석 (A Time Series Analysis of Urban Park Behavior Using Big Data)

  • 우경숙;서주환
    • 한국조경학회지
    • /
    • 제48권1호
    • /
    • pp.35-45
    • /
    • 2020
  • 본 연구는 현대사회에서 도시민의 행태를 지원하는 공간으로 공원에 주목하였다. 현대의 도시공원은 특정한 역할을 하는 공간으로 국한되지 않으며, 공공의 성격을 가지고 있어 이용자의 이용행태에 따라 그 기능·의미가 변화할 수 있다. 또한, 현재 온라인상의 데이터는 방문할 공원의 선택 혹은 공원 이용행태의 결정을 지원하는 단계로 접어들었다. 이에 본 연구는 빅데이터의 자료 기반의 특징인 시계열 분석이 가능하도록 데이터를 수집할 수 있는 최초 년도인 2000년부터 2018년까지 여의도공원·여의도 한강공원과 양재 시민의 숲의 행태 변화를 빅데이터 기법인 텍스트마이닝(Text Mining)과 소셜 네트워크(Social Network;사회연결망)분석을 활용하여 분석하였다. 연구결과의 요약은 다음과 같다. 먼저 시간의 흐름에 따라 주요 이용행태와 행태에 영향을 미치는 요소에 변화가 있었다. 여의도공원·여의도 한강공원의 이용행태는 제 I시기는 '타다'(동적행태), 제 II시기는 '찍다'(정보통신서비스 행태), 제 III시기는 '걷다'(동적행태), 제 IV시기는 '먹다'(에너지원 행태)로 시간의 흐름에 따라 주요 행태가 다양하게 변화하는 모습이고, 양재 시민의 숲은 제 I시기는 '걷다'(동적행태), 제 II시기는 '걷다'(동적행태), 제 III시기는 '걷다'(동적행태), 제 IV시기는 '놀다'(동적행태)로 주로 동적행태 위주의 행태가 나타나는 것으로 나타났다. 주요 행태에 영향을 미치는 요소로 여의도공원·여의도 한강공원은 스포츠 및 레저, 문화·예술, 여가와 관련된 요소가 도출되었고, 양재 시민의 숲은 자연자원 요소가 도출되어 주요 이용행태에 영향을 미치는 요소에 차이가 있었다. 다음으로 대상지의 행태는 시기별로 특정 행태에 집중화되어 있으며, 차후 발생하는 행태를 선택하거나 제약하는 역할을 하는 것으로 나타났다. 이러한 결과는 대상지에 다양한 행태가 일어나지 않을 뿐만 아니라, 공간, 시설 등이 골고루 활용되지 않고 있다는 것을 알 수 있다. 연구결과의 흥미로운 점은 두 공원에서 공통적으로 눈에 띄게 급증한 행태는 에너지원 행태(먹다, 마시다)와 소비행태(사다, 대여하다)이다. 에너지원 행태는 두 공원에서 모두 제 III시기에서 제 IV시기 사이에 10배 이상으로 치솟았으며, 다른 행태와 빈도에서 큰 차이를 보이며 월등히 높았다. 또한, 공원에 방문하는 시민들은 식음료비, 자전거 등의 대여비, 이밖에 행사 참여 등과 관련된 소비의사가 있으며, 공원이 도심 내 휴식공간에서 지역경제 활성화라는 측면에서 본다면 긍정적으로 평가할 수 있을 것이다. 본 연구는 데이터 기법을 활용하여 도시공원 이용행태를 분석하였다는 점과 오늘날 도시공원은 휴식, 산책 등의 역할을 넘어서 시대적인 트렌드를 반영하며, 소비 성향이 나타나는 놀이공간으로 성향이 변화하였다는 결과를 도출하였다는 점에서 큰 의의가 있다. 현대 도시공원에서 일어나는 행태는 양과 내용이 과거와 다르게 변화하고 있다. 그러므로 빅데이터를 통해 수집되는 대규모 집단의 행태를 유형화하고, 이러한 결과를 바탕으로 이루어지는 다학제적인 논의를 통해 오늘날 도시공원을 시민들이 어떻게 이용하고 있는지를 보다 명확하게 이해할 수 있을 것이다.

체내 심전도 데이터의 신경학적 분석 및 다형성 판별을 통한 심실세동 예측에 관한 연구 및 시뮬레이터 구현 (A Study on Ventricular Fibrillation Prediction through neurologic and multi-morphic analyze of intra-cardiac database and Implementation of Simulator)

  • 신광수;김진권;박현철;이충근;이명호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.489-490
    • /
    • 2008
  • 본 고에서는 체내 심실신호를 농하여 신경학적 분석 및 다형성의 측면에서 심실세동이 일어나는 것을 예측하는 분석 알고리즘을 설계하였다. 신경학적 측면에서는 시계열 신호의 Peak to Peak Interval을 예측법과 0.15Hz를 기준으로 HRV 신호의 AR Burg 모델링을 통하여 고주파성과 저주파성을 나누어 교감신경과 부교감신경의 활동성 통한 신경학적 예측법을 제시하였으며 또한 체내 심실신호의 비선형적 특성을 고려한 Fractal Dimension을 생성시킴으로서 주기성의 특성과 다형성 통한 예측법을 제시하였다. 체내 심전도를 기반으로 Simulation 하였으며 각 분석별 조합을 통하여 최적의 예측 구조를 찾고자 하였다. 의학적 의미가 있는 민감도와 특이도를 판별하였으며 예측을 위한 수행시간을 실험하였다. 이를 통하여 자율신경 활성도와 다형성 판별을 조합한 방법이 심실세동 예측을 위한 민감도의 측면에서 가장 우수함을 나타내었고 시뮬레이션을 위만 시뮬레이터(Simulator) UI(User Interface)를 제시하였다.

  • PDF

소봉제품의 시장생산 모형 구축에 관한 연구 (A study on market-production model building for small bar steels)

  • 김수홍;유정빈
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1996년도 추계학술대회발표논문집; 고려대학교, 서울; 26 Oct. 1996
    • /
    • pp.139-145
    • /
    • 1996
  • 소봉제품에 대한 시장생산 모형을 만들기 위하여 과거 자료에서 마련된 수량화된 기초 자료를 통계적으로 분석하고 미래의 생산량을 예측하였다. 출고량에 의한 기초 자료의 통계분석 결과에서 여러 가지 계량적 시계열 분석 방법들 중 STEPAR 방법에 의한 예측 방법이 가장 우수한 것으로 나타났다. 통계분석의 결과로 나타난 출고량에 대한 예측값은 생산량을 결정하는 데 있어서 매우 중요한 정보이다. 각 소봉제품들에 대해서 미래의 생산량에 대한 예측값을 STEPAR 방법에 의하여 얻었다. 이 예측값들의 95% 신뢰 구간의 폭이 상당히 넓게 나왔다. 이를 개선하기 위하여 체계적인 데이터 베이스 시스템을 구축하고, 수요-생산-재고의 종합적인 관리를 하며, 이를 뒷받침하기 위한 통합 전산 시스템을 구축해야 할것이다.

  • PDF

중국 대 한국OFDI 결정요인의 실증분석 (A Study on Determinants of Chinese OFDI to Korea)

  • 대운해
    • 한국융합학회논문지
    • /
    • 제11권5호
    • /
    • pp.191-197
    • /
    • 2020
  • OFDI는 전 세계 국가의 경제 발전에 있어 주요한 이슈 중의 하나이다. 2013년 중국 국가주석 시진핑은 아시아-아프리카 국제회의를 참석하여 일대일로를 제안하였다. 그중에서 OFDI (Outward Foreign Direct Investment)는 일대일로의 핵심적 정책이다. 중국 일대일로 정책의 발전, 한중FTA의 심화 및 양국 긴밀한 경제관계의 급속한 발전에 따라서 중국은 한국에 대한 OFDI를 확대해야 할것이다. 본 연구에서는 중국이 한국에 대한 OFDI를 바탕으로 시계열과 횡단면 두 가지 차원을 결합한PANEL의 데이터를 사용하여 OFDI의 결정적 요인을 확인하고자 한다. 실증분석 결과GRDP, HV, YNTL, FWYS, XFZS 등은 중국이 한국에 대한 OFDI의 결정적 요인으로 입증하였다. 또한 실증분석 결과를 바탕으로 한국이 중국의 OFDI를 유치에 대한 시사점을 제공하였다.