• Title/Summary/Keyword: 데이터 집계

Search Result 215, Processing Time 0.028 seconds

A Similarity Analysis on National R&D Programs and Paper Outputs using Network Analysis (국가연구개발사업과 논문성과간 네트웍 분석을 통한 사업별 유사성 분석)

  • CHANG, Hansoo;HONG, HONG;CHOI, CHOI
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 2017.11a
    • /
    • pp.1263-1269
    • /
    • 2017
  • 정부의 연구개발투자로 수행되는 국가연구개발사업은 세부과제 단위로 매년 도출되는 6대 성과(논문, 특허, 기술료, 사업화, 인력양성 지원, 연수 지원)를 집계한다. 성과 중 하나인 SCI급 논문은 한 논문을 다른 연구과제의 성과로 제출하는 경우도 많아서 동일 논문성과를 다수의 과제에서 공유하게 된다. 본 논문에서는 국가연구개발사업과 그 성과로 도출된 SCI급 논문간의 네트워크 관계를 분석하고자 한다. 대상 데이터는 2015년도에 수행된 연구개발과제의 성과로 제출된 11,179편의 SCI급 논문 중 2개 이상의 과제 결과로 도출된 논문이다. 또한 국가연구개발사업의 SCI급 논문 성과는 세부과제 단위로 집계되므로 SCI급 논문-세부과제간 네트워크는 정보량이 과다하다. 따라서 SCI급 논문에 대한 네트웍 분석은 세부과제를 포함하는 국가연구개발사업간의 네트워크로 한 단계 높여 분석하였다. 구체적으로 논문-사업간 2모드 네트워크를 1모드 네트워크로 전환하여 네트워크 분석을 시도하였다.

  • PDF

Finding the Time Sensitive Frequent Itemsets in Data Streams (데이터 스트림에서 시간을 고려한 상대적인 빈발항목 탐색)

  • Park Tae-Su;Chun Seok-Ju;Lee Ju-Hong;Park Sang-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.145-147
    • /
    • 2005
  • 최근 들어 저장장치의 발전과 네트워크의 발달로 인하여 대용량의 데이터가 매우 빠르게 증가되고 있다. 또한, 대용량의 데이터에 내재되어 있는 정보를 빠른 시간 내에 처리하여 새로운 지식을 창출하려는 요구가 증가하고 있다. 연속적이고 빠르게 증가하는 데이터를 지칭하는 데이터 스트림에서 데이터 마이닝 기법을 이용하여 시간이 흐름에 따라 변하고, 무한적으로 증가하는 데이터 스트림에서의 빈발항목을 찾는 연구가 활발하게 진행되고 있다. 하지만 기존의 연구들은 시간의 흐름에 따른 빈발항목 탐색방법을 적절히 제시하지 못하고 있으며 단지 집계를 이용하여 빈발항목을 탐색하고 있다. 본 논문에서는 데이터 스트림에서 시간적 측면을 고려하여 상대적인 빈발항목을 탐색하기 위한 새로운 알고리즘을 제안한다. 논문에서 제안하는 알고리즘의 성능은 다양한 실험을 통해서 검증된다.

  • PDF

The Extended Cube Tree for Distribution Area Query Processing in Spatial Data Warehouses (공간 데이터 웨어하우스에서 분포 지역 질의 처리를 위한 확장된 큐브 트리 기법)

  • 최준호;유병섭;박순영;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.76-78
    • /
    • 2004
  • 최근 원격 탐사 시스템 등이 발전함에 따라 축적된 공간 데이터의 양이 증가했고 이를 공간 데이터 웨어하우스 분야에서 의사 결정에 활용하는 방안이 중요한 이슈가 되고 있다. 기존의 활용 방법은 주어진 영역을 기준으로 공간 범위-집계를 검색하는 형태였지만, 최근 특정 성향 분석을 위해 분포 질의를 요청하고 그 결과 지역에 대한 공간 분석을 통한 의사결정의 필요성이 대두되었다. 하지만 기존의 처리 방법으로 비공간 질의를 처리하기 위해서는 모든 데이터를 검색해야 하므로 분포 질의를 처리하기 위한 비용이 증가하게 된다. 본 논문에서는 분포 지역 질의 처리를 위한 확장된 큐브 트리 기법을 제안한다. 제안하는 기법은 분석하고자 하는 사실 테이블의 비공간 속성을 큐브 트리의 키로 사용하고, 이 속성과 관련된 공간 데이터의 포인터 집합을 관리한다. 본 논문의 제안 기법을 공간 데이터 웨어하우스에 적용함으로써 비공간 속성 질의를 통해 공간 객체를 결과로 요청하는 형태의 질의를 지원할 수 있게 되며 사실 컬럼을 계층화시킴으로서 사용자에게 좀 더 다각적인 분석을 지원할 수 있다.

  • PDF

Locally adaptive intelligent interpolation for population distribution modeling using pre-classified land cover data and geographically weighted regression (지표피복 데이터와 지리가중회귀모형을 이용한 인구분포 추정에 관한 연구)

  • Kim, Hwahwan
    • Journal of the Korean association of regional geographers
    • /
    • v.22 no.1
    • /
    • pp.251-266
    • /
    • 2016
  • Intelligent interpolation methods such as dasymetric mapping are considered to be the best way to disaggregate zone-based population data by observing and utilizing the internal variation within each source zone. This research reviews the advantages and problems of the dasymetric mapping method, and presents a geographically weighted regression (GWR) based method to take into consideration the spatial heterogeneity of population density - land cover relationship. The locally adaptive intelligent interpolation method is able to make use of readily available ancillary information in the public domain without the need for additional data processing. In the case study, we use the preclassified National Land Cover Dataset 2011 to test the performance of the proposed method (i.e. the GWR-based multi-class dasymetric method) compared to four other popular population estimation methods (i.e. areal weighting interpolation, pycnophylactic interpolation, binary dasymetric method, and globally fitted ordinary least squares (OLS) based multi-class dasymetric method). The GWR-based multi-class dasymetric method outperforms all other methods. It is attributed to the fact that spatial heterogeneity is accounted for in the process of determining density parameters for land cover classes.

  • PDF

Development of Structured/Unstructured data-based Industry Evaluation Information Analysis and Visualization Service (정형/비정형 데이터 기반 산업 평가 정보 분석 및 시각화 서비스 구현)

  • Kim, Kyungwon;Chung, Seunggyeong;Cho, Daekeun;Yoon, Kyoungro
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.11a
    • /
    • pp.177-179
    • /
    • 2018
  • 기존 산업평가 방법은 산업별로 분류된 기업의 재무, 비재무 관련 정형 데이터를 기반으로 통계적 기법을 이용하여 각 산업을 평가하고 있다. 이러한 정형 데이터 기반의 산업 평가 방법은 산업별 재무 정보의 집계 및 통계에 오랜 시간이 소요된다. 따라서, 현재 시장 상황을 반영하기 어려운 현실이다. 최근에는 빠르게 변화하는 산업 환경을 반영하기 위해 뉴스 기사와 같은 비정형 데이터를 통해 산업 트랜드를 분석하기 위한 연구가 이루어 지고 있다. 이에, 본 논문에서는 실시간으로 변화하는 산업 트렌드를 반영하여 적시에 산업 분석 정보를 제공하기 위해 정형/비정형 데이터 기반의 산업평가 정보 분석 엔진을 구현하고, 산업별로 분석된 산업평가 정보를 활용하여 사용자가 직관적인 판단을 할 수 있도록 산업평가 정보 시각화 서비스를 제안한다.

  • PDF

Efficient Creation of Data Cube Using Hash Table in Data Warehouse (데이터 웨어하우스에서 해쉬 테이블을 이용한 효율적인 데이터 큐브 생성 기법)

  • Kim Hyungsun;You Byeongseob;Lee JaeDong;Bae Haeyoung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.211-213
    • /
    • 2005
  • 데이터 웨어하우스는 축적된 대량의 데이터를 분석하여 의사결정을 지원하는 시스템이다. 의사결정을 위한 대량의 데이터 분석은 많은 비용을 요구하므로, 질의 처리 성능을 높이고 의사 결정자에게 빠른 응답을 제공하는 효율적인 데이터 큐브 생성 기법이 연구되었다. 기존 기법으로는 Multiway Array 기법과 H-Cubing 기법이 있다. Multiway Array 기법은 다차원 집계 연산에 필요한 모든 데이터를 배열로 저장하는 것으로 데이터의 양이 많아질수록 메모리 사용이 증가한다. H-Cubing 기법은 Hyper-Tree를 기반으로 튜플을 트리로 구축하므로 모든 튜플을 트리로 구축해야 하는 비용이 증가한다. 본 논문에서는 데이터 웨어하우스에서 해쉬 테이블을 이용한 효율적인 데이터 큐브 생성 기법을 제안한다. 제안 기법은 데이터 큐브 생성 시 필드 해쉬 테이블과 레코드 해쉬 테이블을 사용한다. 필드 해쉬 테이블은 저장될 레코드 순서 계산을 위하여 각 필드에 대해 레벨 값을 해쉬 테이블로 관리한다. 레코드 해쉬 테이블은 데이터 큐브 테이블에 저장될 레코드의 순서와 데이터 큐브 테이블에 저장하기 위한 임시 레코드의 위치를 관리한다. 필드 해쉬 테이블을 이용하여 다차원 데이터의 저장될 레코드 순서를 빠르게 찾아 저장함으로서 데이터 큐브의 생성속도가 향상된다. 또한 해쉬 테이블 만을 유지하면 되므로 메모리 사용량이 감소한다. 따라서 해쉬 테이블의 사용으로 데이터의 빠른 검색과 데이터 큐브 생성 요청에 빠른 응답이 가능하다.

  • PDF

Adaptive Range Aggregation Index Method for Efficient Spatial Range Query in Ubiquitous Sensor Networks (USN환경에서 효율적인 공간영역질의를 위한 적응형 영역 집계 인덱스 기법)

  • Li, Yan;Eo, Sang-Hun;Cho, Sook-Kyoung;Lee, Soon-Jo;Bae, Hae-Yeong
    • Journal of Korea Spatial Information System Society
    • /
    • v.9 no.2
    • /
    • pp.93-107
    • /
    • 2007
  • In this paper, an adaptive range aggregation spatial index method is proposed for spatial range query in ubiquitous sensor networks. As the ubiquitous sensor networks are the new information-oriented paradigm, many energy efficient spatial range query methods in ubiquitous sensor networks environment are studied vigorously. In sensor networks, users can monitor environment scalar data such as temperature and humidity during user defined time and spatial ranges. In order to execute spatial range query efficiently, rectangle based index methods are proposed, such as SPIX. But they define the return path as the opposite of its query transmit path. However, the sensor nodes in queried ranges are closed to each other, they can't aggregate the sensed value in a queried range because their query transmission paths are different. As a result, the previous methods waste energy unnecessarily to aggregate sensing data out of the queried range. In this paper, an adaptive aggregation index method is proposed that can aggregate values in a user defined range adaptively by using its neighbor information. It is shown that sensor power is saved efficiently by using the proposed method over the performance evaluation.

  • PDF

The Approximate Query Answering Method in Multi-dimensional Data Cube (다차원 데이터큐브의 근사 질의응답 기법)

  • Lee, Sun-Young;Kim, Yeong-Ju;Bae, Woo-Sik;Lee, Jong-Yun
    • Proceedings of the KAIS Fall Conference
    • /
    • 2009.12a
    • /
    • pp.445-448
    • /
    • 2009
  • DSS 응용들의 대용량 집계 데이터 집중 시스템에서는 효율적이고 즉각적인 의사결정 지원을 위한 근사 질의응답의 연구가 필요하다. 따라서 본 연구에서는 FCM 클러스터링 기법과 ANFIS을 이용한 기법을 제안한다. 제안된 기법은 다차원 데이터 큐브의 데이터 특성을 가지며 질의에 대한 근사적인 응답을 제공할 수 있는 모델을 생성한다. 제안된 기법을 통해 학습된 모델은 기존의 기법보다 근사 질의응답의 정확성이 향상되었음을 비교 실험을 통하여 확인한다. 따라서 제안된 기법은 기존의 기법보다 저장 공간과 시간을 줄일 수 있으며 또한 근사 응답의 정확도를 향상시킬 수 있다.

  • PDF

Search Method of the time sensitive frequent itemsets (시간에 따른 가변성을 고려한 상대적인 빈발항목 탐색방법)

  • Park, Tae-Su;Lee, Ju-Hong;Park, Sun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.97-100
    • /
    • 2005
  • 최근 유비쿼터스 컴퓨팅 및 인터넷 서비스에 대한 관심이 증대되면서, 대용량의 데이터에 내재되어 있는 정보를 빠른 시간 내에 처리하여 새로운 지식을 창출하려는 요구가 증가하고 있다. 데이터 마이닝 기법을 이용하여 데이터 스트림에서 빈발항목을 탐색하는 기존의 연구는 시간을 고려하지 않고 단순히 집계를 통하여 빈발항목을 탐색하기 때문에 정확성을 보장하지 못한다. 따라서 본 논문에서는 데이터 스트림에서 시간적 측면을 고려하여 상대적인 빈발항목을 탐색하기 위한 새로운 알고리즘을 제안하고자 한다. 논문에서 제안하는 알고리즘의 성능은 다양한 실험을 통해서 검증된다.

  • PDF

A Study on the Analysis of Spatial Characteristics with Respect to Regional Mobility Using Clustering Technique Based on Origin-Destination Mobility Data (기종점 모빌리티 데이터 기반 클러스터링 기법을 활용한 지역 모빌리티의 공간적 특성 분석 연구)

  • Donghoun Lee;Yongjun Ahn
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.22 no.1
    • /
    • pp.219-232
    • /
    • 2023
  • Mobility services need to change according to the regional characteristics of the target service area. Accordingly, analysis of mobility patterns and characteristics based on Origin-Destination (OD) data that reflect travel behaviors in the target service area is required. However, since conventional methods construct the OD data obtained from the administrative district-based zone system, it is hard to ensure spatial homogeneity. Hence, there are limitations in analyzing the inherent travel patterns of each mobility service, particularly for new mobility service like Demand Responsive Transit (DRT). Unlike the conventional approach, this study applies a data-driven clustering technique to conduct spatial analyses on OD travel patterns of regional mobility services based on reconstructed OD data derived from re-aggregation for original OD distributions. Based on the reconstructed OD data that contains information on the inherent feature vectors of the original OD data, the proposed method enables analysis of the spatial characteristics of regional mobility services, including public transit bus, taxi and DRT.