• Title/Summary/Keyword: 시간 마이닝

Search Result 401, Processing Time 0.031 seconds

Design and Implementation of a Generic Classification System Based on Incremental Learning Technology (점진적 학습 기술 기반 범용적인 분류기 구조설계 방법의 설계 및 구현)

  • Min, Byung-Won;Oh, Yong-Sun
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.425-426
    • /
    • 2019
  • 전통적인 마이닝 기법은 다양한 디지털 매체와 센서 등에서 생산되는 빅데이터를 처리하기 어려울 뿐 아니라 신규 데이터 누적시 전체 데이터를 재분석 해야하는 비효율성과 대용량의 문서를 학습함에 있어 메모리부족 문제, 학습 소요시간 문제 등이 있다. 이러한 문제를 해결하기 위하여 본 논문에서는 자질축소 기법에 의존하지 않고 대량의 문서를 자유롭게 학습하고 부분적인 자질 추가 변경 시에 변경요소만을 추가 반영할 수 있는 범용적이고 일반적인 분류기의 구조설계 방법을 설계 및 구현하였다. 점진적 학습 모듈은 일반적인 학습 방법이 데이터의 추가 및 변동시마다 모든 데이터를 재학습하는 데 반해, 기존의 학습 결과에 증분된 데이터만 재처리 없이 추가적으로 학습한다. 재학습을 위해 사용자는 작업 수행 중 자원 관리를 통해 기존에 처리된 데이터를 자유롭게 가져와서 새로운 데이터와 병합이 가능하다. 이러한 점직적 학습 효율성은 빅데이터 기반 데이터 처리에 주요한 특성인 데이터 생산 속도를 극복하기 위한 좋은 대안이 될 수 있음을 확인하였다.

  • PDF

Restaurant Review Analysis and Summary using Opinion Mining Techniques (오피니언 마이닝을 이용한 음식점 리뷰 분석과 요약)

  • Kim, Sang-wook;Kim, Won-young;Kim, Ung-mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.735-736
    • /
    • 2009
  • 사용자의 참여를 강조하는 Web2.0 시대를 맞이하여 개인의 블로그나 까페에 올라오는 무수히 많은 리뷰들이 실제 소비자의 마음을 움직이는 데에 많은 영향을 미치고 있다. 하지만 많은 리뷰들이 상당히 길게 작성되어 있기 때문에 원하는 정보만을 찾아내는 것은 어려운 일이다. 본 논문에서는 다양한 종류의 리뷰들 중에서도 많은 부분을 차지하고 있는 음식점에 관한 리뷰들을 분석하여 사용자가 원하는 정보를 요약하여 제공하는 방법을 제안한다. 이러한 방법을 통해서 사용자는 객관적인 판단을 내릴 수 있고, 시간적인 측면에서의 효율성을 획득할 수 있을 것이다.

User Preference survey by FP-tree : Apply to fitness club (FP-tree를 이용한 사용자 선호도 조사 : 헬스클럽에 적용)

  • Hong, Ue-Chan;Kim, Won-Young;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.753-754
    • /
    • 2009
  • 오늘날 산업 전반에 걸쳐 데이터베이스 시스템이 사용되고 있다. 이에 따라 데이터베이스의 양은 점차 증가하고 방대한 양의 데이터에서 유용한 정보를 얻는 데이터 마이닝 기법이 중요한 기술로 발전해 나가고 있다. 최근 헬스클럽과 같은 개인의 취미와 여가를 위한 공간의 중요성이 대두되고 있는데 반해 사용자의 증가로 인한 불편이 문제가 되고 있다. 본 논문에서는 헬스클럽을 통해 사용자들의 선호도를 조사하여 불편을 줄이고 나아가 효율적인 시간 분배 방법을 제시해 보고자 한다.

Design of Document Suggestion System based on TF-IDF Algorithm for Efficient Organization of Documentation (효율적인 문서 구성을 위한 TF-IDF 알고리즘 기반 문서 제안 시스템의 설계)

  • Kim, Young-Hoon;Park, Seung-Min;Cho, Dae-Soo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.527-528
    • /
    • 2022
  • 빠르게 변하는 환경에 맞춰 평생 교육이 일반화되고 개인에게 요구되는 학습량은 많아지고 있으며 높아진 학습량에 맞게 학습 시간 단축과 효율적인 학습을 위한 학습 방법을 선택하는 것이 중요해지고 있다. 본 논문에서는 학습 정리를 위해 작성한 문서를 분석하여 해당 문서와 관련된 문서를 제안하고 본 문서와 엮어 학습을 위한 문서 묶음을 만들 수 있는 시스템을 제안한다. 문서의 유사도, 중요도를 구할 수 있는 TF-IDF를 이용하여 문서를 분석해 키워드를 추출한 다음 그와 관련된 문서를 제안하고 문서 묶음을 만들어 조회할 수 있도록 한다. 이 시스템은 학습 정리 시 관련 문서를 함께 볼 수 있도록 하고, 필요하다면 묶음으로 만들어 효과적인 학습을 위한 도구로 이용할 수 있다.

  • PDF

Suggestion of development for domestic game market through big data analysis of global game trend (글로벌 게임 트렌드의 빅데이터 분석을 통한 국내 게임 시장의 발전 방향성 제시)

  • Song, Junhyup;Lim, Minwoo;Kim, Hansoo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.161-164
    • /
    • 2022
  • 게임 산업은 기술의 발전과 비대면 서비스 수요 증가로 해마다 발전하고 있다. 본 연구는 사용자들의 수요를 조사하기 위하여 대중성이 가장 높은 온라인 게임 플랫폼에서 이용 시간이 많은 게임 정보를 확인하였다. HTML 파싱(parsing) 라이브러리를 통해 해당 게임들의 리뷰를 크롤링하여 엑셀 파일로 데이터베이스화하였고, 자연어 처리 라이브러리를 활용하여 데이터를 정제하였다. 총 5개 장르에 대하여 분석한 결과 각 장르에 해당하는 대표적인 키워드를 확인할 수 있었다. 취득한 키워드는 범용 시각화 패키지를 활용하여 워드 클라우드 형태로 한눈에 알아볼 수 있도록 시각화하였다.

  • PDF

Related domain service by effective categorization (효율적인 카테고리 분류기법에 의한 연관 도메인 추천 서비스)

  • Hyung Wook Heo;Eun Ju Lee;Ung-Mo Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.702-705
    • /
    • 2008
  • 인터넷 사용자 증가에 따라 검색 엔진의 사용 또한 급격히 늘어나고 있는 추세이다. 국내외 다양한 검색 엔진들이 존재하지만 대부분의 자료들이 기본적인 카테고리별로 링크 횟수나 키워드 빈발 횟수에 따라 정렬이 되어 있다. 그러므로 사용자들은 수동적으로 정렬된 도메인들을 따라 가는 실정이다. 본 논문에서는 수동적인 서비스가 아닌 능동적인 서비스에 중점을 둔다. 특정 카테고리 내에서 접속한 사용자에게 최근 시점을 기준으로 가장 빈번하게 접속된 도메인 정보를 제공하여 시간의 단축과 유용한 서비스를 받도록 한다. 본 논문의 서비스 모델은 인터넷 사용자의 로그 데이터베이스와 도메인 데이터베이스를 기반으로 한다. 본 논문에서 제안하는 카테고리 분류 기법으로 두 데이터베이스를 통합하고 정제한다. 정제된 데이터들은 최종적으로 순차 패턴 마이닝 기법에 의해 최종 빈발 패턴을 추출 하게 되고 특정 카테고리에 접속한 사용자에게 도메인 형태로 변환 되어 서비스 하게 된다.

Concept-Drifting Data Streams classification using Adapted IOLIN System (적응적 IOLIN시스템을 사용한 Concept Drift가 있는 데이터 스트림의 분류)

  • Kim, Jae-Woo;Lee, Ju-Hong;Hong, Jun-Sik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.485-488
    • /
    • 2007
  • 스트림 데이터를 분류하는 문제는 데이터 스트림 마이닝 분야에서 가장 넓게 연구되고 있는 항목이다. 실세계에서의 데이터 스트림을 분류하는데 있어서 본질적인 문제점들이 있다 : 1)많은 양의 데이터가 불규칙적으로 빠르게 입력되는 것과, 2)유동적 컨셉트로 알려진, 데이터의 분류가 시간에 따라서 유동적으로 변하는 문제이다. 본 논문에서는 위와 같은 문제를 해결하기 위해서 적응적 OLIN시스템을 제안한다. 제안된 시스템은 지역적인 유동적 컨셉트뿐만 아니라 전역적인 유동적 컨셉트 문제까지 고려하여, 기존의 시스템보다 향상된 성능을 보였다.

A Study on Selective Sampling using SOM (SOM을 적용한 선택적 샘플링에 관한 연구)

  • Kim, Man-Sun;Yang, Hyung-Jeong;Kim, Jeong-Sik;Kim, Sun-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.38-41
    • /
    • 2007
  • 데이타 마이닝을 위하여 수집된 대용량의 데이타를 여과 없이 기계학습에 적용하는 것은 많은 시간과 비용이 요구될 뿐만 아니라 저장 공간면에서도 비효율적이다. 선별적 샘플링은 이러한 상황에서 매우 효율적으로 적용할 수 있도록 원본 데이타의 특성을 가능한 반영하여 새로운 훈련 데이타를 생성하는 방법이다. 본 연구에서는 신경망의 하나인 SOM을 적용한 선별적 샘플링을 수행하는데 있어서 여러 가지 선택 문제를 효과적으로 해결하기 위한 실험을 수행한다. 실험 결과로는 두 가지 결과를 얻었다. 1) 충분한 맵 사이즈를 선택해야 학습 데이타의 함축적인 특성을 잘 반영한다, 2) 선택적 샘플링을 위한 유닛선택 방법에서는 의미없는 유닛을 제거함으로서 분류 성능향상을 얻을 수 있다.

Roadmap of an application for attending the lecture by FP-tree (FP-tree를 이용한 효율적인 수강신청 로드맵 제시 기법)

  • Park, YoungWook;Lee, SeungCheol;Kim, Ung Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.243-246
    • /
    • 2007
  • 데이터베이스 시스템 사용이 거의 모든 분야에 걸쳐서 필수적인 요소가 되어가고 있다. 따라서 데이터베이스 내에 축적된 정보들의 양과 더불어 정보와 정보 사이의 연관성이 중요한 관심사로 대두되고 있다. 이를 충족하기 위한 구체적인 방안으로 데이터마이닝 기법이 개발되고 발전해나가고 있다. 현재 수강신청시 많은 학생들이 필수 로드맵이라는 단편적인 정보를 가지고 수업 시간표를 구성함으로써 개개인이 많은 시간을 허비하고 있다. 이에 본 논문에서는 관련성 있는 정보 추출에 용이한 FP-Growth 마이닝 기법을 이용하여 수강신청시 도움이 되는 수강신천 로드맵 기법을 제안한다.

An Algorithm for reducing the search time of Frequent Items (빈발 항목의 탐색 시간을 단축하기 위한 알고리즘)

  • Yun, So-Young;Youn, Sung-Dae
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.15 no.1
    • /
    • pp.147-156
    • /
    • 2011
  • With the increasing utility of the recent information system, the methods to pick up necessary products rapidly by using a lot of data has been studied. Association rule search methods to find hidden patterns has been drawing much attention, and the Apriori algorithm is a major method. However, the Apriori algorithm increases search time due to its repeated scans. This paper proposes an algorithm to reduce searching time of frequent items. The proposed algorithm creates matrix using transaction database and search for frequent items using the mean number of items of transactions at matrix and a defined minimum support. The mean number of items of transactions is used to reduce the number of transactions, and the minimum support to cut down on items. The performance of the proposed algorithm is assessed by the comparison of search time and precision with existing algorithms. The findings from this study indicated that the proposed algorithm has been searched more quickly and efficiently when extracting final frequent items, compared to existing Apriori and Matrix algorithm.