• 제목/요약/키워드: 시계열 데이터 마이닝

검색결과 70건 처리시간 0.031초

정박 중 준해양사고 원인에 대한 빅데이터 분석 연구

  • 노범석;김태훈;강석용
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2018년도 춘계학술대회
    • /
    • pp.144-146
    • /
    • 2018
  • 준해상사고를 줄이기 위하여 준해양사고 등을 분석하여 사고 예방에 활용하였다. 하지만 준해양사고 건수가 많은 대신 주내용이 정성적이기 때문에 다양한 정량적 데이터로 분석하기에는 현실적 어려움이 있었다. 이러 장단점을 고려하여 준해양사고에 대해서 그동안 단순한 내용 검토 방식에서 통계적 분석과 이를 통한 객관적 결과 토출이 가능한 빅데이터 기법를 적용한 연구가 필요하다. 이를 위해 10,000여건의 준해양사고 보고서를 전처리 작업을 통해 통일된 양식으로 정리하였다. 이 데이터를 기반으로 1차로 텍스트마이닝 분석을 통해 정박 중 준해양사고 발생 원인에 대한 주요 키워드를 도출하였다. 주요 키워드에 대해 2차로 시계열 및 클러스터 분석을 통해 발생할 수 있는 준해양 사고 상황에 대한 경향 예측을 도출하였다. 이번 연구에서는 정성적 자료인 준해양사고 보고서를 빅데이터 기법을 활용하여 정량화된 데이터로 전환할 수 있고 이를 통해 통계적 분석이 가능함을 확인하였다. 또한 빅데이터 기법을 통해 차 후 발생할 수 있는 준해양사고 객관적인 경향을 파악함으로써 예방 대책에 대한 정보 제공이 가능함을 확인할 수 있었다.

  • PDF

시계열 데이터 예측을 위한 점진적인 회귀분석 모델 (An Incremental Regression Model for Time Series Data Prediction)

  • 김성현;이용미;김룡;서성보;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.23-26
    • /
    • 2006
  • 기존의 데이터 마이닝 예측 기법 중 회귀분석은 학습 단계에서 생성된 모델을 변경 없이 새로운 데이터에 적용하였다. 그러나 시계열 데이터에 모델 변경 없이 동일하게 적용하면 시간이 지남에 따라 정확도가 낮아지는 단점이 있다. 따라서 이 논문에서는 시간에 따라 변화하는 시계열데이터의 특성을 고려하여 점진적으로 회귀 모델을 갱신하는 기법을 제안한다. 이 기법은 입력되는 모든 데이터를 회귀 모델에 적용하여 점진적으로 모델을 갱신한다. 제안된 기법의 타당성은 RME(Relative Mean Error)와 RMSE(Root Mean Square Error)를 이용하여 측정하였다. 정확도 측정 실험 결과 제안 기법인 IMQR(Incremental Multiple Quadratic Regression) 기법이 MLR(Multiple Linear Regression), MQR(Multiple Quadratic Regression), SVR(Support Vector Regression) 기법에 비해 RME 가 평균 2%, RMSE 가 평균 0.02 정도 우수한 결과를 얻었다.

  • PDF

데이터 마이닝을 이용한 패트리어트 수리부속의 간헐적 수요 예측에 관한 연구 (A Study on Intermittent Demand Forecasting of Patriot Spare Parts Using Data Mining)

  • 박천규;마정목
    • 한국산학기술학회논문지
    • /
    • 제22권3호
    • /
    • pp.234-241
    • /
    • 2021
  • 군에서는 수요예측에 대한 중요성을 인식하여 수리부속에 대해 예측 정확도 향상을 위한 많은 연구가 이루어지고 있다. 수리부속 수요예측은 예산 운영과 장비 가동률 측면에서 매우 중요한 요소가 되고 있다. 그러나 현재 군에서 적용중인 시계열 모형으로는 수요량의 변동과 발생주기가 일정하지 않은 간헐적 수요에 대해서는 예측에 한계가 있는 실정이다. 따라서, 본 연구는 공군 패트리어트 수리부속의 간헐적 수요에 대한 예측 정확도를 제고하는 방법을 제시하고자 하였다. 이를 위해서 2013년부터 2019년까지의 701개의 수리부속 소모개수를 토대로 수요 유형을 구분하여 수리부속의 간헐적 수요 자료를 수집하였다. 또한, 장비 고장에 영향을 줄 수 있는 외부 요인으로는 기온, 장비운영시간을 식별하여 입력변수로 선정하였다. 그 후, 소모개수와 외부 요인을 통해 군에서 적용하는 시계열 모형과 제안하는 데이터 마이닝 모형으로 예측을 실시하여 모형별 예측 정확도를 판단했다. 예측 결과로 기존의 시계열 모형과 비교하여 데이터 마이닝 모형의 예측 정확도가 높았으며, 그 중 다층 퍼셉트론 모형이 가장 우수한 성능을 보였다.

데이터 마이닝 기반의 수리부속 수요예측 연구 (A Study on Forecasting Spare Parts Demand based on Data-Mining)

  • 김재동;이한준
    • 인터넷정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.121-129
    • /
    • 2017
  • 수리부속 수요예측은 장비가동률 향상과 국방 운영 예산 효율화 제고를 위한 국방 군수 분야의 핵심 과제 중 하나이다. 현재 우리군은 수리부속 소요 데이터를 활용한 시계열 기법으로 과거 데이터 분석을 통해 수리부속 수요예측에 활용하고 있으나 정확도 제고에 지속적인 노력이 요구되고 있는 실정이다. 이에 본 연구에서는 지난 5개년의 수리부속 18,476개 품목의 수요데이터를 수집하고 데이터마이닝 기법을 활용한 수리부속 수요예측 모델을 제안하였다. 제안한 모델에 따른 실험 결과는 기존 시계열 기법에 비해 개선된 수요예측 정확도를 보였다.

텍스트 마이닝을 이용한 암반공학분야 SCI논문의 주제어 분석 (Keyword Analysis of Two SCI Journals on Rock Engineering by using Text Mining)

  • 정용복;박의섭
    • 터널과지하공간
    • /
    • 제25권4호
    • /
    • pp.303-319
    • /
    • 2015
  • 텍스트 형태의 자료에서 유용한 정보를 추출하는 텍스트 마이닝 기법은 데이터 마이닝의 한 분야이다. 본 연구에서는 암반공학 분야의 대표적인 국제 학술지인 IJRMMS과 RMRE에 2001년 이후 게재된 논문의 제목과 주요어를 대상으로 텍스트 마이닝 기법을 적용하여 주요 연구 동향과 시계열 트렌드, 연구 분야 상관관계 등을 파악하였으며 이를 이해하기 쉽도록 가시화하였다. 분석 결과 주요 연구 분야는 두 학술지 모두 유사하였으나 연관관계 분석 결과 IJRMMS의 경우 'rock'을 기반으로 1개의 큰 그룹과 소규모 그룹이 형성된 반면 RMRE는 중규모의 그룹이 형성되고 이 그룹 간에 연결이 형성되는 구조가 나타났다. 또한 시계열 자료로 변환하여 군집 분석과 각 주제어의 기울기 자료로 분석한 결과 일부 하강 주제어들이 있었으나 양적인 측면에서 차이가 있을 뿐 대부분 논문 수가 증가하는 것으로 나타났다.

양식장 어류 생육 데이터 분석 및 마이닝 (Data Analysis and Mining for Fish Growth Data in Fish-Farms)

  • 예성빈;박정선;한순희;정희택
    • 한국전자통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.127-142
    • /
    • 2023
  • 양식장에서 양식어의 생육 정보인 크기 및 무게의 관리는 가장 기본적인 목표이다. 본 연구에서는 육상 양식장에서 입식 또는 분조 시점부터 출하 시점까지를 epoch로 정의하고, 총 3 epoch에 대하여 생육데이터를 시계열 관점에서 분석하고자 한다. 양식장에서 시간 흐름에 따라 발생하는 양식어의 크기 및 무게 등의 생육 정보를 수질 환경 정보, 급이 정보와 비교 분석하고, 분석 결과를 이용하여 모델을 제시한다. 본 연구에서는 현장에서 획득된 데이터를 이용하여 크기 및 무게에 대하여 Box-Jenkins 방법을 이용하여 선형, 지수, 로그 회귀분석 모델을 제시한다.

시계열 예측에 대한 의사결정자의 인지 유형과 생리적 반응 특성의 상관분석을 위한 데이터 마이닝 접근방법 (Data Mining Approach to Analyzing the Effect of Cognitive Style and Physiological Phenomena in Judgemental Time Series Forecasting)

  • 송병호;박흥국
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1999년도 추계학술대회 논문집
    • /
    • pp.47-52
    • /
    • 1999
  • 데이타 마이닝이란 축적된 방대한 양의 실제 데이타로부터 이전에는 알지 못했던, 숨겨진 임의의 규칙성들을 비전통적인 방식으로 발견해 내는 작업을 말한다. 많은 데이타로부터 무엇인가 흥미로운 경향이나 패턴을 발굴해 내는 것이 데이타 마이닝의 목적이다. 본 연구에서는 다양한 측정값으로 표현되는 \circled1 인지 유형 데이타와, \circled2 생리적 반응 특성 데이터가 \circled3 직관적 예측의 성과에 미치는 영향을 데이타 마이닝 기술을 이용하여 분석함으로써 존재하는 규칙적인 관련성을 탐사하였다. 현재까지 분석한 바로는 첫째, 분석적인 사람이 직관적인 사람보다 예측이 더 정확한 경향이 있었다. 둘째, 실험 전과 실험중 간의 뇌파증가율이 높거나 뇌파량이 적으면 분석적인 사람일 가능성이 많았다. 셋째, 분석적인 사람은 실험 전에 뇌파량이 적을수록 더 정확해지며, 직관적인 사람은 실험전에 뇌파량이 많을수록 더 정확해지는 것으로 관측되었다.

  • PDF

R프로그래밍을 활용한 공유경제의 한국인 집단지성: 텍스트 마이닝 및 시계열 분석 (Korean Collective Intelligence in Sharing Economy Using R Programming: A Text Mining and Time Series Analysis Approach)

  • 김재원;윤유동;정유진;김기연
    • 인터넷정보학회논문지
    • /
    • 제17권5호
    • /
    • pp.151-160
    • /
    • 2016
  • 본 연구의 목적은 최근 창조경제 또는 사회적 경제 관점에서 주목받고 있는 공유경제라는 키워드에 관해 현대 한국인들이 가지고 있는 대중적인 문화 및 사회적 인식, 즉 집단지성의 변화 추세를 조사하는 것이다. 이를 위해, 본 연구는 빅데이터 분석 관점의 텍스트 마이닝 기법을 적용하여 최근 5년 간 사회 문화적 집단지성의 객관적이고 가시적인 연간 변화 및 패턴들을 발견하고 이해하고자 한다. 월드 와이드 웹에서 크롤링(crawling) 기법과 구글링(googling)을 통해 분석에 필요한 2010년부터 2014년까지 축적된 상당한 양의 공유경제를 주제로 한 기존 문헌들의 시계열 웹 메타 데이터를 수집하였다. 결과적으로, 많은 양의 가공되지 않은 공유경제 키워드 관련 원 자료들은 R프로그래밍 분석을 통해 보다 의미 있는 가치 있는 '워드 클라우딩' 형태의 그래프나 그림으로 분석처리 되었다. 아직까지 시기적으로 공유경제에 관해 축적된 자료나 집단지성이 양적으로 미비함에도 불구하고, 본 연구는 지식처리 관점에서 시계열 빅데이터 분석을 수행한 선행연구라는 점에서 의미가 있다. 따라서 본 연구의 결과는 향후 산학 분야에서 공유경제 관련 시장분석과 소비자 행동학 관련 후속 연구들을 위해 1차 자료로서 학문적 시사점을 제공할 수 있다.

추가전용 데이터베이스에 대한 연속 마이닝 (Continuous Mining Over Append-Only Databases)

  • 김룡;이준욱;이양우;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.10-12
    • /
    • 2002
  • 최근에 많은 새로운 타입의 어플리케이션에서 정보 시스템들에 대한 사용의 증가로 인해 연속 질의들은 여러 연구 프로젝트들에서 초점이 되고 있으며 연구가 활발히 진행되고 있다. 특히 시계열에 대해서 미래의 값에 대한 예측 모델과 FFT(Fast Fourier Transform)을 이용하여 새로운 값이 입력될 때마다 신속하게 응답할 수 있는 이웃에 관한 연속 질의에 대해 이미 연구되었다. 그러나 이것은 이웃에 관한 질의이며 또한 방대한 데이터를 처리함에 있어서 매우 효율적이지 못하다. 이 논문에서는 시계열에 있어서 예측 모델을 이용하여 미래의 값을 예측한다. 다음 DFT(Discrete Fourier Transform)을 이용하여 변환한 후 R*-tree를 구성하고, 새로운 값이 입력될 때마다 신속하게 유사성 시계열들을 찾아서 응답하는 연속 범위 질의 과정과 시스템 구조에 대해 제안한다.

  • PDF