• Title/Summary/Keyword: 탐색적 데이터 분석

Search Result 894, Processing Time 0.026 seconds

An Approach to Navigating Data Cubes with a Hierarchical Visualization Technique (계층적 시각화 기법을 활용한 데이터 큐브의 탐색 방안)

  • Oh, Mi-Hwa;Hwang, Man-Mo;Choi, Jung-Woo;Choi, In-Soo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.16 no.2
    • /
    • pp.289-305
    • /
    • 2011
  • To efficiently analyze complex and voluminous data, OLAP systems increasingly provide functionalities for visual exploration of the data allowing end-users to navigate the desired view of the data cube. This paper only deals with data cubes whose schemas represented like the exclusive symmetric hierarchy which is not addressed by current OLAP implementations. This paper presents a conceptual classification of abstraction hierarchies, and an approach to navigating data cubes with a hierarchical visualization technique. The hierarchical visualization technique is developed by using the transitive closure of a binary relation. The approach is exemplified using a real-world study from the domain of national license administration.

A Study on the Metadata based on the Semantic Structure of the Korean Studies Research Articles (한국학 연구 논문의 의미 구조 기반 메타데이터 연구)

  • Song, Min-Sun;Ko, Young Man
    • Journal of Korean Library and Information Science Society
    • /
    • v.46 no.3
    • /
    • pp.277-299
    • /
    • 2015
  • The purpose of this study is to build a metadata set based on the semantic structure of the Korean studies research articles. For this purpose, we analyzed the related researches which suggested the semantic structure of the research articles, categorized the concepts of author keywords of the Korean studies research articles, and drew the metadata set of 16 elements from the results of the analysis and the categorization. The significance of this study is that it propose a semantic metadata configuration methodology which can reflect the scholarly sense-making of researchers in Korean studies. Especially, this study is significant because it reflects the keywords which was given by the actual researchers to examine the content characteristics of the Korean studies research articles.

Text Assocation Pattern Extraction using NFP-tree Algorithm (NFP-Algorithm 알고리즘을 기반한 텍스트 연관 패턴 추출)

  • Yu, Soo-Kung;Kim, Kio-chung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.97-100
    • /
    • 2004
  • 인터넷상에서 존재하는 많은 데이터베이스들 중 현실적으로 유용한 정보를 가지고 있는 것은 텍스트 데이타베이스이다. 텍스트 마이닝 기법에서 비구조적인 특징을 가진 텍스트 데이타로부터 유용한 정보를 분석하고 추출하여 연관된 패턴을 탐색하는 과정은 중요한 연구과제이다. 이에 본 논문은 인터넷에서 저장된 텍스트 데이터를 가지고 기존 텍스트 마이닝 기법 중 연관탐색 기법을 적용하여 사용자 중심의 연관된 패턴을 찾아서 의미있는 정보를 얻고자 한다. 탐색하기 위해 먼저 전처리 작업으로 용어의 객체를 추출하고. 추출된 각 객체들은 대용량 데이터에서 시간적, 공간적면에서 효율적인 연관탐색 기법인 NFP-Algorithm(N-most interesting k-itemsets Using FP-tree and FP-Growth)을 적용시켜서 의미있는 정보를 추출했다. 또한 Apriori계 Algorithm, FP-Algorithm, NFP-Algorithm을 비교하여 NFP-Algorithm이 시간적면에서 효율적임을 보여주었다.

  • PDF

The Development of Prediction Models for the Number of People for Meal at University Cafeteria (대학교 교내식당을 위한 식사 인원 예측 모델 개발)

  • Kwangwon Jung;Taegeun Jo;Keewon Kim
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.535-536
    • /
    • 2023
  • 본 논문에서는 대학교 교내 식당의 실제 데이터를 사용해 식사 인원 예측 모델을 개발하여 교내식당에서 발생하는 적자, 음식 품절, 대량 잔반 발생을 경감 시키고자 한다. 모델 개발에 사용되는 데이터는 2018년도, 2019년도 학기 중 식당 데이터와 기상청 날씨 데이터를 사용하였다. 2018년도, 2019년도 데이터를 이용해 EDA 분석 및 전처리를 통해 필요한 변수를 추출하였다. 전체 데이터의 70%를 기반으로 GridSearch와 XGBoostRegressor를 사용해 평일과 주말에 대한 식사 인원 예측 모델을 생성하였다. 그리고 나머지 데이터의 30%를 사용해 생성한 두 모델의 성능을 평가한다. 평일 식사 인원 예측 모델에 대한 MAE값이 조식 16명, 중식 23명, 석식 25명으로 준수한 결과를 보였고 주말 식사 인원 예측 모델에 대한 MAE값은 조식 16명, 중식 23명, 석식 25명으로 좋은 성능을 보였다.

  • PDF

A Technique for Detecting Companion Groups from Trajectory Data Streams (궤적 데이터 스트림에서 동반 그룹 탐색 기법)

  • Kang, Suhyun;Lee, Ki Yong
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.8 no.12
    • /
    • pp.473-482
    • /
    • 2019
  • There have already been studies analyzing the trajectories of objects from data streams of moving objects. Among those studies, there are also studies to discover groups of objects that move together, called companion groups. Most studies to discover companion groups use existing clustering techniques to find groups of objects close to each other. However, these clustering-based methods are often difficult to find the right companion groups because the number of clusters is unpredictable in advance or the shape or size of clusters is hard to control. In this study, we propose a new method that discovers companion groups based on the distance specified by the user. The proposed method does not apply the existing clustering techniques but periodically determines the groups of objects close to each other, by using a technique that efficiently finds the groups of objects that exist within the user-specified distance. Furthermore, unlike the existing methods that return only companion groups and their trajectories, the proposed method also returns their appearance and disappearance time. Through various experiments, we show that the proposed method can detect companion groups correctly and very efficiently.

The Development and the Application of Product Design Database for Product Opportunity Analysis (제품기회탐색을 위한 제품디자인 데이터베이스 구축과 이의 활용)

  • 박정순;이건표
    • Archives of design research
    • /
    • v.12 no.4
    • /
    • pp.119-128
    • /
    • 1999
  • Product opportunity analysis in product planning is to analyze the feasibility for success over the detail product concept, and to grasp the new possible market based on exploring the trends of market and product itself. Therefore, the correct analysis and insight with various data of product and market is needed for product opportunity analysis. As product environment changes rapidly, it is especially important to collect more plentiful informations, and to put these information to practical use pertinently. It is consequently indispensible to clarify the types of information to be needed and to construct product database. However, there has no meaning to gather simple information which is lying here and there. Product database has to be systematically organized and each product information is to be transformed into contextual one. This study clarifies a conceptual framework of product design database based on product attributes and develops prototype of product database for product planning. Case study of camera is exemplified for analyzing the product trends and exploring product opportunity with developed product database.

  • PDF

데이터 기반 유사연구영역 효율성 제고 방안 및 과제 우선순위 도출에 대한 탐색적 연구 -출연연 사례 및 AHP분석을 중심으로

  • Jeong, Jae-Yeon;Choe, San;Gang, In-Je;Jeong, Jae-Ung;Han, Yu-Ri;Jeon, Seung-Pyo
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 2017.05a
    • /
    • pp.537-547
    • /
    • 2017
  • 현재 우리나라의 GDP 대비 R&D 투자 규모는 세계최고의 수준에 이르렀다. 이러한 연구개발 예산의 양적인 확대 및 성장과 함께 상대적으로 연구개발 예산의 효율적 활용이 중요한 과학기술정책 이슈로 부각되고 있다. 본 연구는 정부 R&D사업 유사영역의 효율성 제고를 위한 정책, 전략의 수립 및 실행의 의사결정을 돕는 데이터 기반의 객관적인 지표들을 제시하였다. 그 후 본 연구에서 제시한 효율성 지표들을 NTIS에서 추출한 2015년 정부출연연구기관 R&D 사업 데이터와 연계하여 실질적으로 측정과 사용이 가능한 정량적 지표들만을 따로 선별하였다. 또한 정부 R&D사업 효율성 지표들의 가중치를 측정하기 위하여 계층분석기법(analytic hierarchy process)을 수행하였으며 계층분석기법의 결과로 나온 가중치를 효율성 지표들에 적용하여 과제 우선순위를 도출하였다. 이를 통해 정책의 수립, 실행 및 조정 시 고려해야 할 지표의 우선순위를 설정하여 유사연구영역 관련 정부 R&D 정책수립에서 실행까지의 연계를 강화시키고 국가적으로 한정된 자원의 효율적 사용을 위한 방안을 제시하였다.

  • PDF

Visual Exploration based Approach for Extracting the Interesting Association Rules (유용한 연관 규칙 추출을 위한 시각적 탐색 기반 접근법)

  • Kim, Jun-Woo;Kang, Hyun-Kyung
    • Journal of the Korea Society of Computer and Information
    • /
    • v.18 no.9
    • /
    • pp.177-187
    • /
    • 2013
  • Association rule mining is a popular data mining technique with a wide range of application domains, and aims to extract the cause-and-effect relations between the discrete items included in transaction data. However, analysts sometimes have trouble in interpreting and using the plethora of association rules extracted from a large amount of data. To address this problem, this paper aims to propose a novel approach called HTM for extracting the interesting association rules from given transaction data. The HTM approach consists of three main steps, hierarchical clustering, table-view, and mosaic plot, and each step provides the analysts with appropriate visual representation. For illustration, we applied our approach for analyzing the mass health examination data, and the result of this experiment reveals that the HTM approach help the analysts to find the interesting association rules in more effective way.

An Exploratory Analysis of Korean News Topics of Chinese Students in Pandemic (팬데믹 상황의 중국인 유학생 뉴스 토픽에 대한 탐색적 분석)

  • Choi, Sook;JIN, XIANMEI
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.6
    • /
    • pp.218-227
    • /
    • 2021
  • The purpose was to examine what kind of discourse about foreigners in the media in a situation where hatred toward foreigners prevailed in a pandemic situation. News data related to Chinese international students(CIS) was collected for 2020, The 11 optimal topics were selected derived through LDA analysis. They were analyzed in an exploratory level, focusing on the relationship with major events per year. The news about CIS in 2020 was intensively linked to reports on the COVID19 situation. There was a tendency to report in response to the presupposes CIS as potential confirmed patients.

An Exploratory Study on the development of Information Security Index (정보보안 지표 개발에 관한 탐색적 연구)

  • 김현수;정해철
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.10a
    • /
    • pp.119-127
    • /
    • 1999
  • 본 연구는 정보보안 수준을 효과적이고 효율적으로 측정할 수 있는 간편한 지표를 개발하는 목적으로 수행되었다. 기존 관련연구 및 지표를 분석하여 문제점을 도출하고 개선 방향을 설정한 후, 관련전문가들에게 예비조사를 실시하여 후보지표 항목을 선정하였다. 선정된 후보지표 항목에 대한 타당성 검증을 위해 보안 전문가 집단에게 설문조사를 실시하였다. 요소로서의 타당성, 상대적 중요성, 항목 결여시 보안사고 발생확률, 사고의 심각성 등 4가지 기준에 의한 설문조사 결과를 분석하여 각 후보 지표 항목에 대한 요소로서의 타당성을 도출하였다. 대부분의 후보 항목이 바람직한 항목인 것으로 나타났다. 향후 요인 분석과 상관 분석 등을 추가로 수행하고, 보안 수준을 계량화하는 연구로 발전시킬 필요가 있다.

  • PDF