• Title/Summary/Keyword: 지역 데이터 처리

Search Result 834, Processing Time 0.029 seconds

Incremental Generation of A Decision Tree Using Global Discretization For Large Data (대용량 데이터를 위한 전역적 범주화를 이용한 결정 트리의 순차적 생성)

  • Han, Kyong-Sik;Lee, Soo-Won
    • The KIPS Transactions:PartB
    • /
    • v.12B no.4 s.100
    • /
    • pp.487-498
    • /
    • 2005
  • Recently, It has focused on decision tree algorithm that can handle large dataset. However, because most of these algorithms for large datasets process data in a batch mode, if new data is added, they have to rebuild the tree from scratch. h more efficient approach to reducing the cost problem of rebuilding is an approach that builds a tree incrementally. Representative algorithms for incremental tree construction methods are BOAT and ITI and most of these algorithms use a local discretization method to handle the numeric data type. However, because a discretization requires sorted numeric data in situation of processing large data sets, a global discretization method that sorts all data only once is more suitable than a local discretization method that sorts in every node. This paper proposes an incremental tree construction method that efficiently rebuilds a tree using a global discretization method to handle the numeric data type. When new data is added, new categories influenced by the data should be recreated, and then the tree structure should be changed in accordance with category changes. This paper proposes a method that extracts sample points and performs discretiration from these sample points to recreate categories efficiently and uses confidence intervals and a tree restructuring method to adjust tree structure to category changes. In this study, an experiment using people database was made to compare the proposed method with the existing one that uses a local discretization.

Analysis of the relationship between regional economic growth and obesity by using Lasso Regression (Lasso Regression을 이용한 지역 경제 성장과 비만율의 상관관계 분석)

  • Kil, Eungyu;OH, Sujin;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.565-568
    • /
    • 2018
  • 본 연구에서는 Lasso Regression을 기반으로 하여 지역 경제 성장과 비만율을 예측한다. 연구는 3단계로 나누어 진행된다. 우선 지역성장을 대변할 수 있는 가상의 GDP 수치를 구한다. 그 다음 가상의 GDP 수치와 비만율 데이터를 이용하여 학습모델을 만든다. 마지막으로 이전의 데이터를 이용하여 앞으로의 성장을 예측하고 학습모델에 적용하여 비만율을 예측한다. 본 연구의 데이터는 학습데이터와 실험데이터를 구성된다. 학습데이터로는 국내의 8도 중 하나인 강원도의 데이터를 이용하며 실험데이터로는 강릉과 원주의 데이터를 이용한다. 평가 비교 대상으로는 과거의 흐름을 반영하는 최소자승법 예측기법을 선정하여 비교한다. 연구 결과 강릉의 경우 비교 데이터와의 오차율 평균은 1.22%로 큰 차이가 없음을 알 수 있다. 따라서 본 연구에서 제안하는 방법이 과거의 흐름을 기반으로 작성됨을 알 수 있다. 하지만 단순히 과거의 흐름만을 통해 예측하는 것은 여러 요소가 복합적으로 작용하는 비만율 예측에 알맞지 않기 때문에 본 연구 방법이 유의미하다고 여겨진다.

Scalable Data Provisioning Scheme on Large-Scale Distributed Computing Environment (대규모 분산 컴퓨팅 환경에서 확장성을 고려한 실시간 데이터 공급 기법)

  • Kim, Byungs-Sang;Youn, Chan-Hyun
    • The KIPS Transactions:PartA
    • /
    • v.18A no.4
    • /
    • pp.123-128
    • /
    • 2011
  • As the global grid has grown in size, large-scale distributed data analysis schemes have gained momentum. Over the last few years, a number of methods have been introduced for allocating data intensive tasks across distributed and heterogeneous computing platforms. However, these approaches have a limited potential for scaling up computing nodes so that they can serve more tasks simultaneously. This paper tackles the scalability and communication delay for computing nodes. We propose a distributed data node for storing and allocating the data. This paper also provides data provisioning method based on the steady states for minimizing the communication delay between the data source and the computing nodes. The experimental results show that scalability and communication delay can be achieved in our system.

A Data Forwarding by Virtual Mobility Agent in Mobile Environment (이동환경에서 가상의 이동성 에이전트를 이용한 데이터 전달)

  • Cho, Eun-Jung;Shin, Yong-Tae;Ko, Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.639-642
    • /
    • 2000
  • 컴퓨터 통신을 이용한 작업이나 화상회의 등과 같은 멀티미디어 데이터 전송의 사용이 최근에 많이 사용하고 있다. 그에 비해 현재의 네트워크 환경은 많은 데이터 손실을 가져오며, 데이터 전송 속도 또한 느리다. 게다가 데이터 수신을 원하는 호스트가 이동 중일 때, 이동하는 동안에 많은 데이터 손실을 가오게 된다. 본 연구는 이동환경에서의 단점인 빠르고 끊김이 없는 전송을 위해서 지역적인 핸드오프 기법을 제안하기 위해서 가상의 이동성 에이전트를(Virtual Mobility Agent)를 두어서 이동노드가 인근지역으로 이동했을 때 홈에이전트에게 자신의 위치정보를 전송하지 않음으로써 이로 인해 발생되는 데이터 지연을 줄이고자 한다.

  • PDF

Performance Improvement of A Processor with Independent Media Cache (독립적인 미디어 캐시를 채용한 프로세서의 성능향상)

  • Ju, Young-Kwan;Jeon, Joong-Nam;Kim, Suk-Il
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11a
    • /
    • pp.143-146
    • /
    • 2003
  • 본 논문에서는 미디어 프로세서에서 메모리 참조시 평균 메모리 참조 지연시간을 줄이기 위하여 지역성이 높으나 재사용성이 떨어지는 미디어 데이터를 지역성과 재사용성이 높은 일반 데이터로부터 분리하여 별도의 캐시에 저장하도록 하는 캐시 구조를 제안하였다. 또한, 미디어 데이터의 선인출 기법을 캐시 운영 전략으로 채택하도록 하여 평균 메모리 지연시간을 단축하였다. EPIC, JPEG 벤치마크에 대한 실험결과, 미디어 데이터를 일반 데이터 캐시와 구분한 이중캐시 구조가 하나의 캐시에 모든 데이터를 저장하는 단일캐시구조에 비하여 캐시미스횟수가 감소하였음을 확인할 수 있었다.

  • PDF

Design of Efficient Query Language to support Local information administration environment (지역정보 관리 환경을 지원하기 위한 효율적인 질의 언어의 설계)

  • Kang, Sung-Kwan;Rhee, Phill-Kyu
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.36-40
    • /
    • 2008
  • SIMS manages data for various spatial and non-spatial as integral management system to support space information administration environment and support several application works. Without being limited to spatial data that existent spatial Data Mining question language advances handling in this paper, did so that can find useful information from various data connected with automatically data collection, artificial satellite side upside service, remote sensing, GPS. Mobile Computing and data about Spatio-Temporal. Also, we designed spatial Data Mining query language that support a spatial Data Mining exclusive use system based on SIMS.

  • PDF

Analysis of LiDAR data processing algorithms for wooded areas (LiDAR 데이터 처리에서의 수목 제거 및 모델링에 관한 알고리즘 분석)

  • Kim Hye-In;Park Eun-Jin;Park Kwan-Dong
    • Proceedings of the KSRS Conference
    • /
    • 2006.03a
    • /
    • pp.131-134
    • /
    • 2006
  • LiDAR(Light Detection And Ranging) 데이터 처리에 있어서 건물, 자동차, 수목 등의 비지면 객체와 지면을 분류하는 필터링 과정은 DEM(Digital Elevation Model) 구축을 위해서 중요하다. 도심지역의 건물추출 등의 필터링에 관한 연구는 활발히 진행되고 있으나 국내의 경우 수목에 대한 필터링은 비교적 연구가 미흡하였다. 따라서 이 연구에서는 기존에 다루어진 몇 가지 알고리즘을 분석하고 산림지역에 활용해 봄으로써 각 필터링에 관한 장단점을 비교하였다.

  • PDF

An Efficient Clustering using the Genetic Algorithm (진화 알고리즘을 적용한 효율적 군집화 기법)

  • Lee, Soo-Jung;Kwon, Hye-Ryun;Kim, Eun-Ju;Lee, Yill-Byung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04b
    • /
    • pp.1017-1020
    • /
    • 2001
  • 최근 들어 관심의 대상이 되고 있는 CRM, eCRM은 비즈니스 분야에 중요한 역할을 담당하고 있다. 이를 위해 여러 방법들이 사용되고 있으나, 그 중 데이터 마이닝은 핵심 기술이라 할 수 있다. 다양한 데이터 마이닝 기법가운데 군집화 기법은, 데이터 집합을 유사한 데이터 개체들의 군집들로 분할하여 데이터 속에 존재하는 의미 있는 정보를 얻는 과정이다. 그런데 기존의 군집화 알고리즘들은 사전에 군집의 개수를 미리 결정해져야 하며, 지역적 최적해(local minima)에 수렴할 수 있다는 문제점을 가지고 있다. 본 논문에서는 진화 알고리즘을 사용하여 자동적으로 적절한 군집의 개수를 결정하여 군집화 될 수 있도록 하고, 병렬 탐색을 통해 지역적 최적해에 수렴되는 문제점을 개선한 알고리즘과 적합도 함수를 제안한다.

  • PDF

A Efficient Query Delivery Method for Wireless Sensor Networks (무선 센서 네트워크를 위한 효율적인 쿼리 전달 방법)

  • Son, Jae-Min;Jin, Jung-Woo;Han, Ki-Jun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.1613-1616
    • /
    • 2005
  • 센서 네트워크에서는 응용에 따라 데이터 전송 방식을 몇 가지로 나눌 수 있다. 일반적으로 쿼리 기반의 데이터 전송방식에서는 싱크가 쿼리를 네트워크 전체에 플러딩하고 그 쿼리를 수신한 노드가 그 쿼리에 해당하면 감지한 데이터를 싱크까지 보고하는 방식을 취하고 있다. 하지만 특정 지역의 정보를 요구하는 쿼리일 경우에는 그 쿼리가 네트워크 전체에 플러딩된다면 불필요한 에너지 소모가 많이 발생하게 된다. 이를 해결하기 위하여 우리는 쿼리를 네트워크 전체에 플러딩하지 않고 특정지역으로만 쿼리를 전달하는 방법을 제안한다. 또한 실험을 통해서 쿼리를 플러딩하는 방법과 특정지역으로만 전달하는 방법을 비교하여 남아 있는 노드수와 평균 소비되는 에너지를 측정하여 제안한 방법이 센서 네트워크에서 중요시되는 생존시간 측면에서 더 우수함을 보였다.

  • PDF

Suggestion of Corona Virus Infection Data-based Simulation Model Update Method (코로나 바이러스 확진자 데이터 기반 시뮬레이션 모델 학습 방법 제안)

  • Jang, Mi;Lee, Bok-Ju;Kang, Bong-Gu;Seo, Kyung-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.334-337
    • /
    • 2020
  • 코로나감염-19, 사스, 메르스 등 바이러스성 질병이 전세계적으로 확산되어 많은 인구가 감염되어 왔다. 바이러스성 질병의 확산 예측 및 종결을 위해 실제 감염자 데이터를 기반으로 한 시뮬레이션 연구는 반드시 필요하다. 본 연구는 지역 내 클러스터 감염 시뮬레이션을 위한 바이러스 감염모델을 제안한다. 제안하는 모델은 여러 개의 셀로 구성되어 있으며, 각 셀은 군집을 표현하고 있다. 본 논문에서 제안한 모델은 실제 데이터를 기반으로 하여 정확도가 높으며, 이를 바탕으로 향후 지역의 특성을 반영한 전파 시뮬레이션 혹은 지역 간의 전파를 예상하는 시뮬레이션의 기초로 사용될 수 있다.