• 제목/요약/키워드: 시계열 데이터 마이닝

검색결과 70건 처리시간 0.035초

데이터 마이닝을 이용한 단기 부하 예측 시스템 연구 (A Study of Short-Term Load Forecasting System Using Data Mining)

  • 주영훈;정근호;김도완;박진배
    • 한국지능시스템학회논문지
    • /
    • 제14권2호
    • /
    • pp.130-135
    • /
    • 2004
  • 본 논문에서는 데이터 마이닝을 이용한 단기 전력 부하 예측 시스템의 새로운 설계 기법을 제안한다. 제안된 단기 부하 예측시스템은 Takagj-Sugeno (T-S) 퍼지 모델 기반 예측기와 분류기로 구성된다. 또한, 제안된 T-S 퍼지 모델 기반 분류기는 전반부 가우시안 집합과 후반부 선형화된 베이지안 분류기로 구성된다 분류기의 파라미터들은 주어진 훈련 집합의 통계적 수치로 쉽게 얻어진다. 제안된 T-S 퍼지 모델 기반 예측기는 한 가지 입력에 대한 선형 시계열 예측기의 볼록 조합 형태를 가진다. 후반부 파라미터 추정 문제는 실제 전력 부하와 예측 전력 부하의 놈(norm)을 최소화하는 볼록 최적화 문제로 간주한다. 그 문제는 선형 행렬 부등식으로 설정됨으로써 후반부 파라미터는 추정된다. 전반부 파라미터 추정문제는 선형 시계열 예측기들이 모여진 전체 T-S 퍼지 시스템의 출력과 실제 전력 부하 사이의 에러를 최소화하는 문제이다. 이 문제는 경사치 하향 기법이 적용하여 해결되었다 제안된 기법의 유용성을 검증하기 위해 본 논문은 하루 후 24시간 전력 부하 예측과 하루 후 최고 전력부하를 예측 실험을 제공한다.

의미 정보를 이용한 다차원 데이터 시퀀스의 유사성 척도 연구 (A Study of Similarity Measures on Multidimensional Data Sequences Using Semantic Information)

  • 이석룡;이주홍;전석주
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.283-292
    • /
    • 2003
  • 연속된 일차원 실수로 이루어진 시계열 데이터는 데이터 마이닝이나 데이터 웨어하우징과 같은 다양한 데이터베이스 응용 분야에서 연구되어져 왔다. 그러나 최근의 복잡한 비즈니스 환경에서, 다차원 데이터 시퀀스(multidimensional data sequence : MDS)는 일차원 시계열 데이터와 더불어 그 중요성이 더해가고 있다. 다차원 데이터 시퀀스의 예로써, 비디오 스트림은 색상과 질감 등의 속성들로 이루어진 다차원 공간상에서 MDS로 나타낼 수 있다. 본 논문에서는 패턴 유사성 검색에서 사용되는 효과적인 유사성 척도를 제시한다. 하나의 MDS는 여러 개의 세그먼트(segment)로 나누어지며, 각 세그먼트는 다양한 의미적인 특징들로 표현된다. 유사성 척도는 이러한 세그먼트에 대해서 정의되는데 이 척도를 사용하여 어떤 주어진 질의 시퀀스에 대하여 무관한 세그먼트들은 검색 대상에서 일차적으로 제외된다. 데이터 시퀀스와 질의 시퀀스 모두 세그먼트 단위로 분할되며, 질의 처리는 전체 시퀀스의 모든 데이터를 검색하지 않고 데이터 세그먼트와 질의 세그먼트의 특징을 비교하는 것을 기초로 하여 수행된다.

텍스트 마이닝 기법을 활용한 환경공간정보 연구 동향 분석 (Analysis of the Research Trends by Environmental Spatial-Information Using Text-Mining Technology)

  • 오관영;이명진;박보영;이정호;윤정호
    • 한국지리정보학회지
    • /
    • 제20권1호
    • /
    • pp.113-126
    • /
    • 2017
  • 본 연구의 목적은 빅데이터 분석 기법 중 하나인 텍스트 마이닝 기법을 활용하여 환경 분야의 환경공간정보 활용 연구 동향을 정량적으로 분석하는 것이다. 분석에 활용된 자료는 NDSL (National Digital Science Library)을 통하여 획득한 국내 논문으로 총 869편을 대상으로 하였다. 논문에서 추출된 단어들은 "환경일반", "기후", "대기", 등 환경 분야 10개, "위성영상", "수치지도", "재난재해" 등 환경공간정보 20개로 설정된 분류체계에 따라 재분류 되었다. 재분류된 분류 키워드를 통해, 논문에서 해당 키워드의 출현 빈도 및 시계열 변화를 파악하였으며, 상호 간 연관분석을 수행하였다. 첫째, 빈도 분석 결과 환경 분야에서는 "환경일반"(40.85%)이 환경공간정보에서는 "위성영상" (24.87%)이 가장 높은 활용 빈도를 나타냈다. 둘째, 환경 분야에 대한 시계열 분석 결과 1996년부터 2000년까지는 "기후"에 대한 연구 비중이 높았으나, 2001년부터는 "환경일반"에 대한 연구가 증가하였다. 환경공간정보에서는 "위성영상"에 대한 수요가 전 기간에 걸쳐 가장 높았으며, 활용 비율 또한 점차적으로 증가하고 있었다. 셋째, 환경 분야와 환경공간정보에 대한 연관분석 결과 총 80개의 연관 규칙이 생성되었으며, 환경 분야 중 "환경일반"이 "위성영상", "전자지도" 등 총 17개의 환경공간정보와 가장 많은 수의 연관 규칙을 생성하였다.

빅데이터 기법을 활용한 항해 중 준해양사고 발생원인 분석에 관한 연구 (An Analysis of Causes of Marine Incidents at sea Using Big Data Technique)

  • 강석용;김기선;김홍범;노범석
    • 해양환경안전학회지
    • /
    • 제24권4호
    • /
    • pp.408-414
    • /
    • 2018
  • 해양사고 감소를 위해 다양한 연구들이 수행되어 왔다. 그에 비해 준해양사고에 대한 연구는 미미한 수준에 그치고 있다. 준해양사고는 건수가 많은 대신 내용이 정성적이기 때문에 분석하기에는 현실적인 어려움이 있었다. 하지만 해양사고 감소를 위해서는 준해양사고의 정량적인 분석이 필요하다. 이번 논문의 목적은 준해양사고 경향을 예측하고 해양사고를 감소시키기 위해 빅데이터 기법을 적용하여 준해양사고 데이터를 정량적으로 분석하는 것이다. 이를 위해 10,000여건의 준해양사고 보고서를 전처리 작업을 통해 통일된 양식으로 정리하였다. 전처리된 데이터에 대해서 1차적으로, 텍스트마이닝 기법을 적용하여 항해 중 준해양사고 발생원인에 대한 주요 키워드를 도출하였다. 주요 키워드에 대해 2차로 시계열 및 클러스터 분석을 통해 발생할 수 있는 준해양사고 상황에 대한 경향 예측을 도출하였다. 이번 연구에서는 정성적 자료인 준해양사고 보고서를 빅데이터 기법을 활용하여 정량화된 데이터로 전환할 수 있고, 이를 통해 통계적 분석이 가능함을 확인하였다. 또한 빅데이터 기법을 통해 차 후 발생할 수 있는 준해양사고에 대한 객관적인 경향을 파악함으로써 예방 대책에 대한 정보 제공이 가능함을 확인할 수 있었다.

시계열 이동평균 변환을 이용한 노이즈 제어 윤곽선 이미지 매칭 (Noise Control Boundary Image Matching Using Time-Series Moving Average Transform)

  • 김범수;문양세;김진호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.327-340
    • /
    • 2009
  • 본 논문에서는 윤곽선 이미지 매칭에서 노이즈 제거 정도를 제어하기 위해 시계열 매칭의 이동평균 변환을 이용한다. 이동평균 변환을 윤곽선 이미지 매칭에 적용하게 된 동기는 이동평균 변환이 시계열의 노이즈를 감소시키므로, 이를 사용하면 윤곽선 이미지 매칭에서도 노이즈 제어 효과를 얻을 수 있을 것이라는 직관에 기반한다. 본 논문에서는 우선 윤곽선 이미지 매칭에 이동평균 변환을 적용한 $\kappa$-계수 이미지 매칭($\kappa$-order image matching)을 제안한다. 제안한 $\kappa$-계수 이미지 매칭은 윤곽선 이미지가 변환된 시계열에 $\kappa$-이동평균 변환을 적용하여 시계열(이미지) 간의 유사성을 판단한다. 다음으로, 대용량 이미지 데이터베이스를 대상으로 $\kappa$-계수 이미지 매칭을 수행하기 위한 인덱스 기반 매칭 방법을 제안하고, 그 정확성을 정형적으로 증명한다. 또한, 계수 $\kappa$와 매칭 결과와의 관계를 정형적으로 분석하고, 이에 기반하여 계수 $\kappa$를 변화시키면서 노이즈 제거 정도를 제어하는 방안을 제시한다. 실험 결과, $\kappa$-계수 이미지 매칭이 노이즈 제거 효과를 가짐을 확인하였으며, 제안한 인덱스 기반 매칭 방법은 순차 스캔에 비해 수 배 에서 수십 배 빠른 성능을 보이는 것으로 나타났다.

시계열 데이터베이스에서 선형 추세 제거 서브시퀀스 매칭 (Linear Detrending Subsequence Matching in Time-Series Databases)

  • 길명선;김범수;문양세;김진호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.586-590
    • /
    • 2010
  • 본 논문에서는 선형 추세 제거 서브시퀀스 매칭을 정의하고, 이를 효율적으로 수행하기 위한 인덱스 기반 해결책을 제안한다. 이를 위해, 먼저 윈도우 자체의 선형 추세가 아닌 해당 윈도우를 포함하는 서브시퀀스의 선형 추세를 제거하여 얻은 새로운 윈도우인 LD-윈도우 개념을 제시한다. 다음으로, LD-윈도우를 이용하여 제안하는 인덱스 기반 해결책의 이론적 근거인 하한 조건을 제시하고, 이를 정형적으로 증명한다. 이러한 하한 조건에 기반하여, 본 논문에서는 또한 인덱스 구성 및 서브시퀀스 매칭 알고리즘을 각각 제안한다. 마지막으로, 실험을 통해 제안하는 인덱스 기반 해결책의 우수성을 입증한다.

트래픽 데이터의 시계열 분석을 위한 데이터 마이닝 기법 (Data Mining Technique for Time Series Analysis of Traffic Data)

  • 김철;이도헌
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(3)
    • /
    • pp.59-62
    • /
    • 2001
  • This paper discusses a data mining technique for time series analysis of traffic data, which provides useful knowledge for network configuration management. Commonly, a network designer must employ a combination of heuristic algorithms and analysis in an interactive manner until satisfactory solutions are obtained. The problem of heuristic algorithms is that it is difficult to deal with large networks and simplification or assumptions have to be made to make them solvable. Various data mining techniques are studied to gain valuable knowledge in large and complex telecommunication networks. In this paper, we propose a traffic pattern association technique among network nodes, which produces association rules of traffic fluctuation patterns among network nodes. Discovered rules can be utilized for improving network topologies and dynamic routing performance.

  • PDF

SNS 비정형 데이터의 한국어 다중감성 분석 기법 (Korean Multiple Sensibility Analysis Technique of SNS Unstructured Data)

  • 김소연;유헌창
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2018년도 하계학술대회
    • /
    • pp.147-149
    • /
    • 2018
  • 음성인식, 행동패턴인식, 텍스트마이닝 등 사람의 자연스러운 사회적인 활동을 통해 감성을 분석하려는 연구는 지속적으로 증가하고 있다. 특히 SNS는 현대사회에서 없어서는 안 될 소통의 도구로 자리 잡았기 때문에 SNS의 비정형데이터를 이용한 감성분석은 마케팅 분야에서 중요한 활용도구로 사용되고 있다. 이러한 추세에 따라 한국어에 대한 감성인식 역시 다방면으로 분석, 활용되고 있고 한국어의 어순과 표현방식, 중의성, 방언 등의 몇 가지 특징으로 인해 영어와는 다른 방식으로의 접근방식에 대한 필요성이 많은 연구에서 논의되고 있다. 따라서, 이 연구에서는 이러한 한국어의 특징을 수용하여 분석할 수 있도록 시계열 분석에 유용한 LSTM과 중복단어에 대한 가중치를 적용하여 한국어 감성분석을 진행해보고자 한다.

  • PDF

LSTM과 증시 뉴스를 활용한 텍스트 마이닝 기법 기반 주가 예측시스템 연구 (A study on stock price prediction system based on text mining method using LSTM and stock market news)

  • 홍성혁
    • 디지털융복합연구
    • /
    • 제18권7호
    • /
    • pp.223-228
    • /
    • 2020
  • 주가는 사람들의 심리를 반영하고 있으며, 주식시장 전체에 영향을 미치는 요인으로는 경제성장률, 경제지료, 이자율, 무역수지, 환율, 통화량 등이 있다. 국내 주식시장은 전날 미국 및 주변 국가들의 주가지수에 영향을 많이 받고 있으며 대표적인 주가지수가 다우지수, 나스닥, S&P500이다. 최근 주가뉴스를 이용한 주가분석 연구가 활발히 진행되고 있으며, 인공지능 기반한 분석을 통하여 과거 시계열 데이터를 기반으로 미래를 예측하는 연구가 진행 중에 있다. 하지만, 주식시장은 예측시스템에 의해서 단기간 적중이 되더라도, 시장은 더 이상의 단기 전략대로 움직여지지 않고, 새롭게 변할 수밖에 없다. 따라서, 본 모델을 삼성전자 주식데이터와 뉴스 정보를 텍스트 마이닝으로 모니터링하여 분석한 결과를 나타내어 예측이 가능한 모델을 제시하였으며, 향후 종목별 예측을 통하여 실제 예측이 정확한지 확인하여 발전시켜 나갈 예정임.

리뷰-피드백 프로세스를 통한 고객 이탈률 추정: 텍스트 마이닝, 계량경제학, 준실험설계 방법론을 활용한 실증적 연구 (Estimate Customer Churn Rate with the Review-Feedback Process: Empirical Study with Text Mining, Econometrics, and Quai-Experiment Methodologies)

  • 김초이;김재민;정가현;박재홍
    • 경영정보학연구
    • /
    • 제23권3호
    • /
    • pp.159-176
    • /
    • 2021
  • 기존 연구들은 주로 사용자의 게임 참여 동기나 사회적 욕구에 따른 이탈 요인을 연구하였다. 하지만, 기존 연구들은 게임 참여 동기 관점에서 집중하다 보니, 사용자 불만 사항 개선에 따른 사용자 이탈에 관한 분석은 비교적 적게 이루어져왔다. 게임에 대한 사용자 불만 사항과 그에 따른 게임 품질 개선은 사용자가 게임에 참여하는 요인 중 하나이다. 따라서, 본 연구는 사용자 불만 요인이 사용자 이탈에 미치는 영향을 실증적으로 분석하여 그 관계를 살펴보고자 한다. 본 연구는 최근 유행했던 "PUBG - 배틀그라운드 게임"을 분석하여 제품 품질에 대한 불만 사항 피드백이 얼마나 사용자 이탈에 영향을 주는지 실증적으로 분석 한다. 텍스트 마이닝(Text Mining) 분석을 통해, 사용자들의 품질에 대한 불만요인을 도출하였고, 콕스모델(Cox Model)을 통해 불만 요인에 따른 사용자의 이탈률을 추정하였다. 또한 준실험설계 방법을 통해 실제 불만사항 개선 패치에 따라 사용자 수가 어떻게 변화하는지 살펴봄으로 본 연구 결과를 검증하였다. 분석 결과, 불만 사항 중 게임의 재미와 관련된 요인들이 사용자 이탈에 가장 큰 영향을 주었고, 반면 게임 사용 편의성과 관련된 불만 사항들은 비교적 사용자 이탈에 적은 영향을 준다는 것을 실증적으로 보였다. 본 연구결과에 따르면, 게임 불만 요인 개선에 따라 사용자들의 이탈 정도가 달라질 수 있으며, 이에 따라 게임 사용자 관리를 할 수 있다는 것을 밝혀냈다. 본 연구는 게임 개발 및 운영사 입장에서 사용자들의 불만 사항 개선에 대한 우선 순위를 제공해 줌으로서 실증적인 공헌을 제시한다.