• 제목/요약/키워드: 시계열 주제분석

검색결과 57건 처리시간 0.025초

시계열 데이터베이스에서의 분해법을 이용한 유사 검색 기법 (Similarity Search in Time-Series Databases Using Decomposition Method)

  • 박신유;문봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.110-112
    • /
    • 2000
  • 최근 몇 년간 시계열 데이터의 저장 및 분석에 대한 연구가 활발히 진행되고 있으며, 시계열 데이터베이스에서 유사패턴(similarity pattern)을 탐색하는 기법이 광범위한 응용분야에서 중요한 연구주제로 자리잡고 있다. 본 논문에서는 회귀분석방법을 바탕으로 한 분해 시계열 방법을 이용함으로써 기존의 유사성의 개념을 확장시켰다. 즉, 시계열 데이터가 가지고 있는 패턴을 여러 성분으로 분해하여 각기 다른 저장 공간에 저장하고, 이를 이용하여 유사성을 탐색할 때에도 분리된 각 성분 중 특정 변동특성이 유사한 데이터를 추가적으로 요구되는 시간없이 검색할 수 있다. 이는 전체 시계열 데이터를 이해하는데 뿐만 아니라 데이터를 예측하는 방법에도 유용하게 사용될 수 있다.

  • PDF

Temporal Fusion Transformers와 심층 학습 방법을 사용한 다층 수평 시계열 데이터 분석 (Temporal Fusion Transformers and Deep Learning Methods for Multi-Horizon Time Series Forecasting)

  • 김인경;김대희;이재구
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권2호
    • /
    • pp.81-86
    • /
    • 2022
  • 시계열 데이터는 주식, IoT, 공장 자동화와 같은 다양한 실생활에서 수집되고 활용되고 있으며, 정확한 시계열 예측은 해당 분야에서 운영 효율성을 높일 수 있어서 전통적으로 중요한 연구 주제이다. 전반적인 시계열 데이터의 향상된 특징을 추출할 수 있는 대표적인 시계열 데이터 분석 방법인 다층 수평 예측은 최근 부가적 정보를 포함하는 시계열 데이터에 내재한 이질성(heterogeneity)까지 포괄적으로 분석에 활용하여 향상된 시계열 예측한다. 하지만 대부분의 심층 학습 기반 시계열 분석 모델들은 시계열 데이터의 이질성을 반영하지 못했다. 따라서 우리는 잘 알려진 temporal fusion transformers 방법을 사용하여 실생활과 밀접한 실제 데이터를 이질성을 고려한 다층 수평 예측에 적용하였다. 결과적으로 주식, 미세먼지, 전기 소비량과 같은 실생활 시계열 데이터에 적용한 방법이 기존 예측 모델보다 향상된 정확도를 가짐을 확인할 수 있었다.

Comparison of Stock Price Prediction Using Time Series and Non-Time Series Data

  • Min-Seob Song;Junghye Min
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.67-75
    • /
    • 2023
  • 주가 예측은 금융시장에서 중요하게 다뤄지고 있는 주제이지만 영향을 미칠 수 있는 다수의 요소들로 인해 어려운 주제로 고려되고 있다. 본 논문에서는 시계열 예측 모델 (LSTM, GRU)과 데이터의 시간적 의존성을 고려하지 않는 비 시계열 예측 모델 (RF, SVR, KNN, LGBM)을 주가 예측에 적용하여 성능을 비교하고 분석하였다. 또한 주가 데이터와 기술적 분석 보조지표, 재무제표 지표, 매수매도 지표, 공매도, 외국인 지표 등 다양한 데이터를 조합 및 활용하여 최적의 예측 요소를 찾아내고 업종별로 주가 예측에 영향을 미치는 주요 요소들을 분석했다. 하이퍼파라미터 최적화 과정을 통해 알고리즘별 예측 성능을 향상 시키는 과정도 진행하여 성능에 영향을 주는 요인을 분석하였다. 변수 선택과 하이퍼 파라미터 최적화 과정을 거친 결과, 시계열 예측 알고리즘인 GRU, 그리고 LSTM+GRU의 예측 정확도가 가장 높은 것으로 나타났다.

체계적 문헌고찰을 통한 국내 보건복지 분야의 시계열 분석 연구 동향 (A systematic review of studies using time series analysis of health and welfare in Korea)

  • 우경숙;신영전
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권3호
    • /
    • pp.579-599
    • /
    • 2014
  • 이 연구는 국내 보건복지 분야에서 시계열 분석을 실시한 논문의 현황을 파악하고, 비뚤림 위험평가를 시행함으로써 향후 보건복지 분야에서의 시계열 분석 방법을 적용하는 데 기초자료를 제공하는 것이 목적이다. 국내 외 전자 데이터베이스를 이용하여, 논문명, 키워드, 초록에 '시계열 분석'을 포함한 6,543건 문헌 중에서 보건복지 분야 91건의 논문을 대상으로 체계적 문헌고찰을 수행하였다. 1987년부터 2013년까지 시계열 분석을 활용한 논문은 점차 증가하고 있는 추세이다. 시계열 분석 연구는 의학과 보건학관련 학회에서의 활용이 높았고, 요인분석과 추세분석을 주요 분석 목적으로 하고 있었다. 세부주제는 국민건강과 의료서비스이용을 주로 다루고 있었고, 분석 기법은 ARIMA 모형, 시계열 회귀모형 순으로 활용되었다. 자료의 대부분은 통계청과 정부기관에서 생산하는 통계자료를 이용하였다. 문헌의 비뚤림 평가 결과, 상당수의 논문들이 표본수가 부족한 자료를 이용하거나, 시계열 도표와 플롯 작성을 간과하였다. 보건복지 영역에서 시계열 분석의 활용이 늘고 있고 향후 이용 가능성도 커지고 있으나, 기존 연구에서는 분석 과정과 결과를 도출하는 과정에서 분석 절차와 기준을 준수하지 않거나 주요 항목을 간과한 논문들이 일부 확인되었다. 향후 시계열 분석의 적극적인 활용뿐만 아니라 통계적 방법과 절차를 준수하고 신뢰성 있는 결과를 도출함으로써 질적 수준을 향상시키는 추가적인 노력이 필요하다.

다이나믹 토픽모델링 및 네트워크 분석 기법을 통한 블록체인 관련 국내 연구 동향 분석 (Analyzing Research Trends in Blockchain Studies in South Korea Using Dynamic Topic Modeling and Network Analysis)

  • 김동훈;오찬희;주영준
    • 정보관리학회지
    • /
    • 제38권3호
    • /
    • pp.23-39
    • /
    • 2021
  • 본 연구에서는 국내 블록체인 연구의 전반적인 동향 및 시간에 따른 주제를 파악하기 위해 대학 및 기관 협력 네트워크 분석, 키워드 동시출현 네트워크 분석, 다이나믹 토픽모델링 기법을 활용한 시계열 주제 분석을 실시하였다. 대학 및 기관 협력 네트워크 분석 결과, 숭실대학교, 순천향대학교, 고려대학교, 한국과학기술원 등이 블록체인 연구의 주요 대학으로 나타났으며 대학 이외의 기관으로는 국방부, 한국철도기술연구원, 삼일회계법인, 한국전자통신연구원 등이 주요 연구기관으로 나타났다. 키워드 동시출현 네트워크 분석 결과, 가상자산(암호화폐, 비트코인, 이더리움, 가상화폐), 블록체인 기술(분산원장, 분산원장기술), 금융(스마트계약), 정보보안(보안, 프라이버시, 개인정보) 등에 대한 키워드들이 주요하게 나타났으며, 모든 네트워크 중심성 지표에서 스마트계약이 가장 높은 수치를 나타내어 주요한 주제임을 확인할 수 있었다. 마지막으로 시계열 주제분석 결과, 블록체인기술, 블록체인생태계, 블록체인 적용분야1(무역, 온라인투표, 부동산), 블록체인 적용분야2(식품, 관광, 유통, 미디어), 블록체인 적용분야3(경제, 금융) 등 다섯 개의 주요 주제들을 도출하였으며, 각 주제별 대표 키워드들의 비율변화를 통해 주제별 변화를 관찰할 수 있었다. 본 연구는 기존의 국내 블록체인 연구동향 연구들과 크게 세 가지 관점(데이터, 방법론, 해석)에서 차이점을 나타내고 있다. 1) 최근 2년 사이 급증한 블록체인 연구를 포함하였고, 2) 대학 및 기관 네트워크 분석과 시계열 주제분석이라는 새로운 분석기법 및 연구방법을 활용하였으며, 3) 이를 통해 블록체인 연구를 주도하는 대학 및 기관을 식별하고 국내 블록체인 연구 트렌드를 파악하였다. 끝으로, 연구결과가 블록체인 관련 연구 협력 및 정책 수립과 관련 기술 개발 계획에 활용될 수 있다는 점에서 실질적인 함의를 시사한다.

시계열 네트워크분석을 통한 데이터품질 연구경향 및 산업연관 분석 (Trend of Research and Industry-Related Analysis in Data Quality Using Time Series Network Analysis)

  • 장경애;이광석;김우제
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권6호
    • /
    • pp.295-306
    • /
    • 2016
  • 본 연구는 데이터품질과 관련된 선행연구의 메타정보를 활용하여 연구경향을 분석하고 이를 통해서 산업계의 흐름을 예측하기 위한 목적의 연구이다. 다양한 분야에서 연구경향을 분석하려는 시도는 이어져 왔으나, 데이터품질 영역은 그 범위가 방대하여 선행 연구자료에 대한 분석을 수행하기 어려웠다. 본 연구는 Web of Science 색인DB에 수록된 최근 10년간의 연구 메타데이터를 수집하여 텍스트 마이닝, 사회연결망 분석기법을 활용한 시계열 네트워크 분석을 수행하였다. 연구주제 분석 결과, 수학 및 전산 생물학, 화학, 건강관리 과학 및 서비스, 생화학 및 분자 생물학, 운영 연구 및 경영 과학, 의료정보학은 연구비율이 감소하고 있었고, 환경, 수자원, 지질학, 계측기 및 계측의 연구비율은 증가하고 있었다. 또한 사회연결망 분석 결과 데이터품질 연구에서는 분석, 알고리즘, 네트워크의 주제가 중앙성이 높은 중요한 주제로 나타났으며, 이미지와 모델, 센서, 최적화가 데이터품질에서 중요한 주제로 등장하는 추세를 보였다. 데이터품질의 산업과 연관관계 분석 결과는 기술, 산업, 건강, 유틸리티, 고객서비스가 연관성이 높은 산업으로 나타났다. 본 연구의 결과는 데이터품질 연구의 패턴을 분석하고 산업과 연관관계를 찾는 데이터품질 관련 연구자 뿐아니라 산업계에도 유용한 자료로 활용되리라 판단된다.

뉴스 빅데이터를 이용한 우리나라 언론의 기록관리 분야 보도 특성 분석: 1999~2018 뉴스를 중심으로 (An Analysis of News Report Characteristics on Archives & Records Management for the Press in Korea: Based on 1999~2018 News Big Data)

  • 한승희
    • 정보관리학회지
    • /
    • 제35권3호
    • /
    • pp.41-75
    • /
    • 2018
  • 이 연구에서는 1999년 1월부터 2018년 6월 현재까지 약 20년 간의 기록관리를 주제로 한 뉴스 빅데이터 4,680 건을 '빅카인즈'에서 추출하여, 이를 대상으로 우리나라 언론의 기록관리 주제에 대해 시계열 기반으로 보도 특성을 분석하고자 하였다. 먼저, 기록관리에 대한 언론 보도량의 차이를 살펴보기 위해 시기별, 주제별, 언론사 유형별 보도량을 분석하였다. 또한 기록관리 주제에 대한 언론 보도 내용의 차이에 대한 특성을 분석하기 위해 단어빈도 기반 내용 분석과 언어 네트워크 분석을 수행하여 언론 보도 내용의 시기별, 주제별, 언론사 유형별 차이를 분석하였다. 분석 결과, 기록관리 분야 뉴스 보도는 보도량과 보도 내용에 있어 시기별, 주제별, 언론사별로 차이가 있는 것으로 나타났다. 뉴스 보도량은 2007년 대통령기록물관리법이 제정된 이후부터 증가하기 시작하여 2013년에 가장 많은 뉴스가 보도된 것으로 나타났으며, 정치와 사회 주제를 중심으로 중앙지와 경제지가 가장 많은 양의 뉴스를 보도한 것으로 나타났다. 또한 뉴스 보도 내용의 분석결과, 기록관리가 도입된 처음 10년 동안은 기록관리의 현장 적용과 확산 과정에서 발생하는 이슈들을 중심으로 뉴스 주제가 형성되다가, 대통령기록물관리법 제정 이후로 기록관리가 정치적, 사회적 이슈의 주요 요인이 되면서 정치, 사회분야의 뉴스가 많이 보도된 것으로 나타났다.

트위터 오피니언 마이닝을 통한 코로나19 기간 대학 비대면 수업에 대한 의견 고찰 (Exploring Opinions on University Online Classes During the COVID-19 Pandemic Through Twitter Opinion Mining)

  • 김동훈;강정;주영준
    • 한국문헌정보학회지
    • /
    • 제55권4호
    • /
    • pp.5-22
    • /
    • 2021
  • 본 연구는 코로나바이러스감염증-19 (이하 코로나19) 확산 이후 대학의 부분 또는 전면 비대면 수업으로의 전환에 대해 소셜 미디어 플랫폼 중 하나인 트위터에서 이를 어떻게 생각하고 논의하고 있는지를 파악하기 위해 진행되었다. 이를 위해 트위터에서 비대면 수업 관련 트윗을 수집한 후 감성분석 및 시계열 주제 분석을 실시하였다. 감성분석결과, 전반적으로 긍정적인 여론보다 부정적인 여론이 많았지만 시간이 지남에 따라 점차 부정적인 여론이 줄어드는 경향이 나타남을 확인하였다. 또한 월별 감성점수분포를 통해 학기 중이 방학기간보다 감성점수 분포의 폭이 넓음을 확인하였고, 이를 통해 학기 중일 때가 방학 때보다 비대면 수업에 대해 더 다양한 감정과 의견을 교환한다는 사실을 확인할 수 있었다. 다음으로 긍정트윗과 부정트윗을 구분하여 시계열 주제 분석을 실시한 결과, 긍정트윗에서는 수업환경 및 장비, 긍정적인 감정 표현, 강의시청장소, 언어수업, 시험 및 과제와 같은 다섯 가지 주요한 주제가 나타났으며, 부정트윗에서는 시간(수업시간, 쉬는시간), 시험 및 과제, 부정적인 감정 표현, 수업환경 및 장비와 같은 네 가지 주요한 주제가 나타남을 확인하였다. 또한 각 주제별 대표 키워드들의 비율을 통해 시간에 따른 주제의 변화를 파악함으로써 비대면 수업에 대한 여론의 트렌드를 살펴 보고자 하였다. 본 연구는 기존 비대면 수업 관련 연구들과는 달리 소셜 미디어 중 하나인 트위터를 활용하여 국내 대학의 비대면 수업에 대한 전반적인 의견을 파악하고자 하였으며, 감성분석과 시계열 주제 분석을 활용하여 비대면 수업에 대한 긍부정 여론을 나누어 식별 및 시간의 흐름에 따른 트렌드의 변화를 파악하였다는 점에서 학문적 함의를 지닌다. 또한 연구결과는 국내 대학에서의 비대면 수업에 대한 구성 및 개선방안 등에 활용될 수 있으며, 비대면 수업을 설계하는 대학 및 교수자들에게 도움이 될 수 있다는 점에서 실질적인 함의를 지닌다.

텍스트 마이닝을 이용한 암반공학분야 SCI논문의 주제어 분석 (Keyword Analysis of Two SCI Journals on Rock Engineering by using Text Mining)

  • 정용복;박의섭
    • 터널과지하공간
    • /
    • 제25권4호
    • /
    • pp.303-319
    • /
    • 2015
  • 텍스트 형태의 자료에서 유용한 정보를 추출하는 텍스트 마이닝 기법은 데이터 마이닝의 한 분야이다. 본 연구에서는 암반공학 분야의 대표적인 국제 학술지인 IJRMMS과 RMRE에 2001년 이후 게재된 논문의 제목과 주요어를 대상으로 텍스트 마이닝 기법을 적용하여 주요 연구 동향과 시계열 트렌드, 연구 분야 상관관계 등을 파악하였으며 이를 이해하기 쉽도록 가시화하였다. 분석 결과 주요 연구 분야는 두 학술지 모두 유사하였으나 연관관계 분석 결과 IJRMMS의 경우 'rock'을 기반으로 1개의 큰 그룹과 소규모 그룹이 형성된 반면 RMRE는 중규모의 그룹이 형성되고 이 그룹 간에 연결이 형성되는 구조가 나타났다. 또한 시계열 자료로 변환하여 군집 분석과 각 주제어의 기울기 자료로 분석한 결과 일부 하강 주제어들이 있었으나 양적인 측면에서 차이가 있을 뿐 대부분 논문 수가 증가하는 것으로 나타났다.

불변성 지표물을 이용한 시계열 MODIS 지표 반사율 자료의 검증 (Validation of multi-temporal MODIS surface reflectance product using invariant target)

  • 강성진;김선화;윤정숙;이규성
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2009년도 춘계학술대회 논문집
    • /
    • pp.105-110
    • /
    • 2009
  • 현재 NASA에서 제공되는 MODIS 지표반사율자료(MOD09)는 MODIS영상을 이용한 각종 주제자료들의 중요한 입력 자료로 사용되고 있으며, MODIS 지표반사율 자료에 대한 객관적인 검증연구가 필요한 실정이다. 따라서 본 연구에서는 MOD09의 검증관련 초기 연구로서, 남한에 분포하는 불변성 타겟(invariant target)을 대상으로 2006년 일별 250m MODIS 지표반사율자료(MOD09GQK)자료의 객관적 검증을 시도하였다. 우선, MOD09 QA(Quality Assurance)자료를 이용하여 구름의 영향을 받은 화소를 제거한 후, 수치지도와 토지피복도를 이용하여 정의한 불변성 타겟에 해당되는 MOD09영상의 화소값을 추출하였다. 이와 같이 추출된 시계열 MOD09GHK영상의 화소값에 1차 회귀분석을 적용하여 이상 반사율 값을 탐지하고, 그 원인을 분석하였다. 검증 결과 나지지역에 대해서 0.0186의 RMSE값이 나타났으며, 인공물의 경우 0.2891의 RMSE값을 보였다. 발생된 이상 화소를 살펴보면, 구름, 그림자, 눈에 영향에 의해 발생한 것도 있으며, 원인을 알 수 없는 이상 화소들도 분포하였다. 향후 연구에서는 한반도 전역의 MODIS 시계열 반사율영상을 대상으로 MODIS 대기보정알고리즘과 입력인자의 적합성을 판단하기 위한 연구를 진행할 예정이다.

  • PDF