• Title/Summary/Keyword: 시간 마이닝

검색결과 401건 처리시간 0.029초

시계열분석과 인공신경망을 이용한 실시간검색어 변화 예측 (Predicting changes of realtime search words using time series analysis and artificial neural networks)

  • 정민영
    • 디지털융복합연구
    • /
    • 제15권12호
    • /
    • pp.333-340
    • /
    • 2017
  • 실시간검색어는 지금 바로 이슈가 되는 검색어의 검색 증가율이 단기간에 급상승하는 것을 중심으로 하기 때문에 일정기간 지속적으로 관심도를 유지하고 있는 이슈를 나타내지 못하고 이들이 가까운 미래에 어떤 변화를 보이는지에 대한 것도 알 수 없는 한계를 가지고 있다. 본 논문에서는 이러한 한계를 극복할 수 있도록 일정기간 동안 상위 10위 안에 속한 적이 있는 실시간검색어에 대해 일자별, 시간별 지속성을 평가하여 꾸준히 관심을 받는 검색어를 추출한다. 그런 다음, 이들 중 상위에 속하는 검색어의 관심도가 어떻게 변화하는지를 알 수 있게 하는 시계열 분석과 신경망을 이용하는 방법을 제시하고 이를 통해 도출한 실제 예를 통해 가까운 미래의 변화량을 예측한 결과를 보인다. 일자별로는 시계열 분석을, 시간별로는 인공신경망의 학습을 통해 예측하는 것이 좋은 결과를 보인다는 것을 알 수 있다.

유사한 인기도 추세를 갖는 웹 객체들의 클러스터링 (Clustering of Web Objects with Similar Popularity Trends)

  • 노웅기
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.485-494
    • /
    • 2008
  • 인터넷이 광범위하게 활용됨에 따라 검색 키워드, 멀티미디어 객체, 웹 페이지, 블로그 등의 다양한 웹 객체들이 크게 증가하고 있다. 이러한 웹 객체들의 인기도는 시간에 따라 변화하며, 그러한 웹 객체 인기도의 시간적 패턴에 대한 마이닝이 여러 가지 웹 응용에 필요한 중요한 연구 과제가 되고 있다. 예를 들어, 검색 키워드에 대한 인기도 패턴의 분석은 앞으로 인기가 높아질 키워드를 미리 예측할 수 있게 하여 광고주들에게 키워드를 판매하기 위한 가격을 결정하는 데에 중요한 자료가 될 수 있다. 하지만, 웹 객체 인기도가 시간에 따라 변화하고 웹 객체의 개수가 매우 방대하다는 특성으로 인하여 웹 객체 인기도에 대한 분석은 매우 어려운 문제이다. 본 논문에서는 웹 객체 인기도의 시간적 패턴을 마이닝하기 위한 효율적인 알고리즘을 제안한다. 본 논문은 웹 객체 인기도를 시계열로 표현하고, 두 웹 객체 인기도 간의 유사성을 측정하기 위하여 gap 척도를 제안한다. gap 척도의 효율적인 계산을 위하여 FFT를 활용한 알고리즘을 제안하고, 밀도기반 클러스터링 알고리즘을 이용하여 유사한 인기도 추세를 갖는 웹 객체들의 클러스터를 생성한다. 본 논문에서는 웹 객체 인기도가 특정 분포를 따르거나 주기적이라고 가정하지 않는다. Google Trends 웹 사이트로부터 구한 검색 키워드 인기도를 이용한 실험을 통하여, 제안된 알고리즘이 실세계 응용에서 유용함을 보인다.

시계열 데이터 예측을 위한 점진적인 회귀분석 모델 (An Incremental Regression Model for Time Series Data Prediction)

  • 김성현;이용미;김룡;서성보;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.23-26
    • /
    • 2006
  • 기존의 데이터 마이닝 예측 기법 중 회귀분석은 학습 단계에서 생성된 모델을 변경 없이 새로운 데이터에 적용하였다. 그러나 시계열 데이터에 모델 변경 없이 동일하게 적용하면 시간이 지남에 따라 정확도가 낮아지는 단점이 있다. 따라서 이 논문에서는 시간에 따라 변화하는 시계열데이터의 특성을 고려하여 점진적으로 회귀 모델을 갱신하는 기법을 제안한다. 이 기법은 입력되는 모든 데이터를 회귀 모델에 적용하여 점진적으로 모델을 갱신한다. 제안된 기법의 타당성은 RME(Relative Mean Error)와 RMSE(Root Mean Square Error)를 이용하여 측정하였다. 정확도 측정 실험 결과 제안 기법인 IMQR(Incremental Multiple Quadratic Regression) 기법이 MLR(Multiple Linear Regression), MQR(Multiple Quadratic Regression), SVR(Support Vector Regression) 기법에 비해 RME 가 평균 2%, RMSE 가 평균 0.02 정도 우수한 결과를 얻었다.

  • PDF

균등 격자를 이용한 공간 클러스터링 기법의 성능 평가 (Performance Evaluation of Spatial Clustering Method using Regular Grid)

  • 문상호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.468-471
    • /
    • 2003
  • 본 논문에서는 기존 연구에서 제시된 균등 격자를 이용한 공간 클러스터링 기법의 효율성을 검증하기 위한 성능 평가를 수행한다. 세부적으로 다양한 분포 형태를 가지는 실험데이타들을 대상으로 먼저 객체 수의 변화에 따른 수행 시간을 비교한다. 그리고 동일한 실험데이타를 대상으로 임계값의 변화에 따른 실험 평가를 수행한다. 또한, 각 실험 결과에 대하여 전체 수행 시간을 기준으로 클러스터 생성 알고리즘과 클러스터 합병 알고리즘에 대한 상대적인 비교를 평가한다.

  • PDF

점진적 학습 기반 모아 콘텐츠 큐레이션 서비스 시스템 설계 (Design of Moa Contents Curation Service System Based on Incremental Learning Technology)

  • 이정원;민병원;오용선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.401-402
    • /
    • 2018
  • 콘텐츠 큐레이션 서비스를 위해서 대용량 데이터를 학습하는 과정에서 발생하는 메모리부족 문제, 학습소요시간 문제 등을 해결하기 위한 "대용량 문서학습을 위한 동적학습 파이프라인 생성기술 중 빅데이터 마이닝을 위한 점진적 학습 모델" 기술이 필요하며, 본 논문에서 제안한 콘텐츠 큐레이션 서비스는 온라인상의 수많은 콘텐츠들 중 개인의 주관이나 관점에 따라 관련 콘텐츠들을 수집, 정리하고 편집하여 이용자와 관련이 있거나 좋아할 만한 콘텐츠를 제공하는 서비스이다. 본 논문에서 설계된 모아 큐레이션 서비스는 대용량의 문서를 학습함에 있어서 메모리 부족 문제, 학습 소요시간 문제 등을 해결하기 위해 학습데이터의 용량 제한이 없는 문서를 자유롭게 학습하고 부분적인 자질추가/변경 시에 변경요소만을 추가 반영할 수 있는 범용적이고 일반적인 분류기의 구조설계 방법 등을 제시하였다.

  • PDF

데이터마이닝을 이용한 축류팬 성능예측 시스템 (Performance Prediction System For Axial Fan using Data Mining)

  • 김명일;이승민;김연호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.1047-1050
    • /
    • 2010
  • 축류팬(axial fan)은 냉장고, 에어컨 등 가전제품 뿐 아니라, 자동차, 중장비 등에 가장 널리 사용되는 팬의 형태로 제품의 성능과 소음에 많은 영향을 미치는 요소이다. 그러나 설계, 목업(mock-up)개발, 풍동실험 등의 시간과 비용적인 면에서 비효율적인 방법을 통해 개발이 이루어지고 있다. 따라서 범용으로 사용가능한 팬 설계 프로그램과 설계 인자의 입력만으로도 성능을 예측하여 개발에 소요되는 시간과 비용을 줄일 수 있는 시스템의 개발이 필요하다. 본 연구에서는 슈퍼컴퓨터를 활용하여 축류팬 형상변수의 변화에 대한 성능과 소음을 미리 해석한 후 그 결과를 지식형 데이터베이스로 저장하고, 팬 자동설계 시스템과 결합한다. 즉, 축류팬 설계 변수를 입력하면 팬의 형상을 CAD 파일로 자동 생성할 뿐 아니라, 지식형 데이터베이스을 기반으로 하는 데이터 마이닝 기법을 이용하여 해당 모델의 성능과 소음을 예측한다.

위치에 따른 연령대별 유용한 행동패턴 추출 기법 (Efficient Mining of User Behavior patterns by classification of age based on location information)

  • 김혜란;이승철;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.250-253
    • /
    • 2007
  • 통신기술의 발달로 무선단말기의 보급이 급증하고 무선 네트워크 사용이 일반화됨으로써, 최근 유비쿼터스 컴퓨팅 기술이 중요한 이슈가 되고 있다. 유비쿼터스 컴퓨팅은 시간과 장소의 한계를 넘어 사용자가 하고자 하는 일을 컴퓨팅 환경이 상황을 인지하여 돕는 것을 가능하게 한다. 상황인지를 위해 순차패턴과 시간 연관규칙 탐사를 이용하여 사용자의 행동패턴을 추출하는 연구가 활발히 진행되고 있다. 이러한 연구를 통한 행동패턴은 사용자의 특성을 간과하게 되며, 각 사용자에게 더욱 유용한 서비스를 제공하기 위해서는 사용자를 분류하는 것이 필요하다. 그러나 기존의 연구는 단지 통계적인 사용자의 빈발 행동패턴만을 추출하여 각 사용자의 관심사와는 무관한 서비스 제공이 이루어질 수 있다. 성별, 나이, 직업 등의 개인정보와 위치를 고려하여 사용자에게 더욱 더 효율적이고 유용한 서비스를 제공할 수 있도록 행동패턴을 유형별로 분류할 필요가 있다. 본 논문에서는 각 위치에 따른 사용자의 연령대별 유용한 행동패턴을 추출하여 정확한 서비스를 제공할 수 있는 마이닝 기법을 제안한다.

클러스터링 기법을 활용한 출발 여객 체류 시간 분석 (Analysis of Departing Passengers' Dwell Time using Clustering Techniques)

  • 안덕배;김휘양;백호종
    • 한국항행학회논문지
    • /
    • 제23권5호
    • /
    • pp.380-385
    • /
    • 2019
  • 본 연구는 실제 공항에서 수집되는 여객 데이터를 활용하여 공항 내 여객의 체류 시간을 분석한 연구이다. 여객의 체류 시간은 공항 터미널 설계, 공항의 수익성에 영향을 주어 중요한 여객 특성으로 간주되어 왔지만 실제 여객 데이터 수집의 어려움으로 그에 대한 분석이나 실시간 공항 운영에 활용하기가 어려웠다. 하지만 스마트 공항의 일환으로 세계 유수의 공항에서 방대한 양의 여객 데이터를 수집하고 있고, 축적된 데이터를 활용하여 공항 내 여객 체류 시간 분석이 가능해졌다. 본 연구에서는 인천 국제 공항에서 수집된 여객 데이터를 활용하여 여객 체류 시간 분석을 수행하였으며, 방대한 양의 자료를 효율적으로 처리하기 위해 데이터 마이닝 기법인 클러스터링을 활용하여 여객을 체류 시간에 따라 구분하였다. 분석 결과 인천 국제 공항 출발 여객은 체류 시간에 따라 1) 체류 시간이 짧고 대부분의 시간을 에어사이드에서 보내는 여객, 2) 평균 3 시간 정도의 체류 시간을 갖는 여객, 3) 총 체류 시간이 압도적으로 긴 여객 등 크게 3 개의 클러스터로 구분할 수 있는 것으로 나타났다.

최적 경로 서비스 지원을 위한 이동 객체의 이동 패턴 탐사 알고리즘 (Moving Pattern Mining Algorithm of Moving Object for Support of Optimal Path Service)

  • 고현;김광종;이연식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.413-416
    • /
    • 2006
  • 최근 위치 측위 기술의 발달 및 GPS 기술의 상용화로 인해 무선 통신 기기의 보급이 증가하면서 다양한 위치 기반 서비스 개발을 위한 노력이 활발히 진행되고 있다. 사용자들의 특성에 맞게 개인화되고 세분화된 위치 기반 서비스를 제공하기 위해서는 방대한 이동 객체의 위치 이동 데이터로부터 의미있는 지식인 유용한 패턴을 추출하기 위한 시간 패턴 탐사가 필요하다. 기존의 시간 패턴 탐사 기법들 중 일부는 이동 객체의 시간에 따른 공간 속성들의 변화를 충분히 고려하지 못하거나 또는 시공간 속성을 동시에 고려한 패턴 탐사는 가능하나 전체 이동 패턴들 중 추출하고자 하는 패턴에 반드시 포함되어야 하는 공간 정보에 대한 제약이 없어 특정 지점들 사이의 최적 이동 경로 탐색 문제나 단위기간 동안 이동 객체가 순회해야 지점들에 대한 스케줄링 경로 예측 문제 등에 적용하기 어렵다. 따라서 본 논문에서는 이동 객체의 위치 이력 데이터들에 대한 시공간 속성들을 고려하여 다양한 이동 패턴들 중 객체의 최적 이동 경로에 해당하는 패턴을 탐색하기 위한 새로운 시간 패턴 마이닝 알고리즘을 제안한다. 제안된 알고리즘은 특정한 지점들 사이를 이동한 객체의 위치 데이터들 중 객체가 가장 빈번하게 이동한 경로를 탐색하여 최적 경로를 결정하는 알고리즘으로, 공간 추상 계층의 각 계층별 영역 내 포함여부를 고려한 위치 일반화를 수행하여 보다 효과적으로 이동 패턴을 탐색할 수 있다.

  • PDF

데이터베이스에서 빈발패턴의 추출을 위한 메모리 향상기법 (Memory Improvement Method for Extraction of Frequent Patterns in DataBase)

  • 박인규
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.127-133
    • /
    • 2019
  • 지금까지의 빈발 항목 추출에서는 FP-Tree에 대한 순회와 패턴의 탐색이 필수적인 과정이기 때문에 마이닝 데이터를 트리에 저장하는데 공간이 필요하고 탐색하는데 CPU시간이 필요하기 마련이다. 이러한 단점을 극복하기 위하여 본 논문에서는 조건부 FP-Tree의 의존하지 않고 트랜잭션 데이터의 각 항목들의 위치 정보를 부여하여 트랜잭션 데이터를 2차원의 위치정보 Look-Up테이블로 변환하여 시간과 공간적인 접근성을 용이하게 한다. 또한 항목과 항목의 위치에 대한 매핑배열을 병행하여 시간 복잡도를 줄이는 방법을 고려하는 알고리즘을 제안한다. 실험 결과를 통하여 제안된 방법은 FIMI 저장소 웹 사이트에서 얻은 데이터 세트를 기반으로 많은 실행 시간과 메모리 사용을 줄일 수 있음을 보였다.