• Title/Summary/Keyword: 데이터밀도

Search Result 506, Processing Time 0.026 seconds

Privacy Preserving Clustering (프라이버시를 보존하는 군집화)

  • Yoo Hyun-Jin;Kim Min-Ho;Ramakrishna R.S.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.473-476
    • /
    • 2004
  • 본 논문에서는 프라이버시를 침해 하지 않는 데이터 마이닝에 대해 다룬다. 방대한 데이터에서 유용한 정보를 추출하는 데이터 마이닝분야에서 데이터로부터 프라이버시 보존의 중요성이 부각되고 있다. 그래서 프라이버시의 침해를 막기 위한 방법으로 실제 데이터를 사용하지 않고 잡음이 들어간 데이터를 사용한다. 그리고 프라이버시를 침해하지 않기 위해 잡음이 들어간 데이터로부터 데이터의 확률 밀도 함수(PDF)만을 복원한다. 이렇게 복원된 확률 밀도 함수만을 이용하여 데이터 마이닝기술, 예를 들면 분류화에 곧바로 적용함으로써 프라이버시를 보존하는 것이다. 하지만 분류화에 사용되는 데이터의 1차원적인 확률 밀도 함수만 가지고는 군집화에 사용하기가 부적절하다. 따라서 본 논문에서는 군집화를 하기 위해 잡음이 들어간 데이터로부터 결합 확률 밀도 함수(Joint PDF)를 복원하고, 복원된 결합 확률 밀도 함수만 가지고 군집화를 할 수 있는 방법을 다룬다.

  • PDF

A study of the Health Data Application (보건 데이터 활용에 관한 연구(II))

  • Lim, Gi-Young;Cho, Eun-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10b
    • /
    • pp.1213-1216
    • /
    • 2001
  • 정규분포 등의 가정이 곤란한 복잡한 밀도 분포에 대해 데이터의 선험적인 지식 없이 해석하기 위해 다수의 항목이 되고 복잡한 밀도 분포를 가진 데이터를 보다 소수의 단순한 밀도 분포가 되는 그룹으로 분류하는 방법을 나타내었고 데이터를 그룹으로 분류하는데 표본에 의한 분류와 항목에 의한 분류를 할 수 있다. 선험지식을 사용하지 않고 데이터를 분류하면 Parzen의 창함수에 의한 추정과 대수우도에 의한 평가함수를 사용하는 것으로 복잡한 형상을 가진 밀도분포도 선험지식 없이 해석이 가능하다. 표본의 밀도 분포와 항목의 밀도분포를 나타내기 위하여 다수의 밀도 분포의 합과 곱의 형으로 전개하는 방법을 보였고 제안하는 방법을 의도적으로 생성한 데이터에 적용하여 원래의 밀도분포에 따라 분류결과를 얻을 수 있었다.

  • PDF

Data Scrambling Scheme that Controls Code Density with Data Occurrence Frequency (데이터 출현 빈도를 이용하여 코드 밀도를 조절하는 데이터 스크램블링 기법)

  • Hyun, Choulseung;Jeong, Gwanil;You, Soowon;Lee, Donghee
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.10 no.9
    • /
    • pp.235-242
    • /
    • 2021
  • Most data scrambling schemes generate pure random codes. Unlike these schemes, we propose a variable density scrambling scheme (VDSC) that differentiates densities of generated codes. First, we describe conditions and methods to translate plain codes to cipher codes with different densities. Then we apply the VDSC to flash memory such that preferred cell states occur more than others. To restrain error rate, specifically, the VDSC controls code densities so as to increase the ratio of center state among all possible cell states in flash memory. Scrambling experiments of data in Windows and Linux systems show that the VDSC increases the ratio of cells having near-center states in flash memory.

Flow-density Relations Satisfying Stationary Conditions using Statistical Analysis (통계적 분석에 의한 정상상태조건을 만족하는 교통량-밀도 관계 도출)

  • Kim, Yeong-Ho
    • Journal of Korean Society of Transportation
    • /
    • v.24 no.5 s.91
    • /
    • pp.135-142
    • /
    • 2006
  • The flow-density relations represent equilibrium relations between flow and density in the stationary state. Using individual vehicle data this paper proposed a method to 131ter traffic data in the stationary state and showed flow-density relations produced by the traffic data in the stationary state. The Proposed method is based on the idea that free flow and congested flow show totally different traffic behaviors and time series of the traffic data observed at detection stations. The traffic data collected from the stationary state in the free flow using this filtering method consist in the left branch of the flow-density relation and the traffic data collected from the stationary state in the congested flow consist in the right branch of the flow-density relation. The traffic data in the stationary state skew reproducible flow-density relation in the almost whole range of the traffic flow.

A Case Study on Text Analysis Using Meal Kit Product Review Data (밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구)

  • Choi, Hyeseon;Yeon, Kyupil
    • The Journal of the Korea Contents Association
    • /
    • v.22 no.5
    • /
    • pp.1-15
    • /
    • 2022
  • In this study, text analysis was performed on the mealkit product review data to identify factors affecting the evaluation of the mealkit product. The data used for the analysis were collected by scraping 334,498 reviews of mealkit products in Naver shopping site. After preprocessing the text data, wordclouds and sentiment analyses based on word frequency and normalized TF-IDF were performed. Logistic regression model was applied to predict the polarity of reviews on mealkit products. From the logistic regression models derived for each product category, the main factors that caused positive and negative emotions were identified. As a result, it was verified that text analysis can be a useful tool that provides a basis for maximizing positive factors for a specific category, menu, and material and removing negative risk factors when developing a mealkit product.

Analysis of Rendering Techniques for High-precision 3D Data (고정밀 3차원 데이터의 렌더링 기술 연구)

  • Kounlaxay, Kalaphath;Chang, Jinwook;Kim, Soo Kyun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.59-60
    • /
    • 2020
  • 본 논문에서는 고정밀 3차원 데이터의 획득, 복원 및 랜더링과 그에 따르는 고속처리에 필요한 효율적인 기술 소개 및 이에 따른 문제점에 대해 소개한다. 또한 3차원 데이터를 획득하기 위한 하드웨어에 대한 소개와 그에 필요한 SDK 등의 차이점 및 특징에 대해 소개하고, 이를 복원 및 랜더링 할 때의 이슈에 대해 소개한다. 특히 렌더링에서는 대용량의 고정밀 3차원 데이터에 대한 실시간 처리 문제에 대해 소개하고, 이러한 이슈들을 해결하는 이론에 대해 간단히 소개한다. 본 논문에서는 기존에 소개되었던 기술과 그에 따른 문제점에 대해 소개하고, 이와 관련된 사항에 대해 해결하는 방법에 대해 소개한다.

  • PDF

A Burst-mode Automatic Power Control Circuit Robust io Mark Density Variations (마크 밀도 변화에 강한 버스트 모드 자동 전력 제어 회로)

  • 기현철
    • Journal of the Institute of Electronics Engineers of Korea SD
    • /
    • v.41 no.4
    • /
    • pp.67-74
    • /
    • 2004
  • As data rate was increased, the conventional burst-mode automatic power control circuit caused errors due to the effort of the mark density variation. To solve this problem we invented a new structured peak-comparator which could eliminate the effect of the mark density variation even in high date rate, and revised the conventional one using it. We proposed a burst-mode automatic power control circuit robust to mark density variations. We found that the peak-comparator in the proposed automatic power control circuit was very robust to mark density variations because it affected very little by the mark density variation in high date rate and in the wide variation range of the reference current and the difference current.

A Proposal of Privacy Protection Method for Location Information to Utilize 5G-Based High-Precision Positioning Big Data (5G 기반 고정밀 측위 빅데이터 활용을 위한 위치정보 프라이버시 보호 기법 제안)

  • Lee, Donghyeok;Park, Namje
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.30 no.4
    • /
    • pp.679-691
    • /
    • 2020
  • In the future, 5G technology will become the core infrastructure driving the 4th industrial era. For intelligent super-convergence service, it will be necessary to collect various personal information such as location data. If a person's high-precision location information is exposed by a malicious person, it can be a serious privacy risk. In the past, various approaches have been researched through encryption and obfuscation to protect location information privacy. In this paper, we proposed a new technique that enables statistical query and data analysis without exposing location information. The proposed method does not allow the original to be re-identified through polynomial-based transform processing. In addition, since the quality of the original data is not compromised, the usability of positioning big data can be maximized.

Design and development of communication protocol for a portable vibration data collection system using high precision acceleration sensors (고정밀 가속도 센서를 이용한 휴대용 진동 데이터 수집 시스템을 위한 통신 프로토콜 설계 및 개발)

  • Woo, Kyungmin;Lee, Hyunjun;Kim, Suhee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.260-263
    • /
    • 2014
  • 고정밀 가속도 센서를 이용한 휴대용 진동 데이터 수집 시스템은, 매우 고가이며 취급에 어려움이 존재하는 기존의 시스템과는 달리, 상대적으로 휴대가 용이하여 언제 어디서나 진동 데이터의 측정이 가능한 시스템으로, 향후 기능의 향상을 통해 기존의 시스템으로 측정이 불가능한 상황에서도 측정이 가능할 것으로 기대하는 시스템이다. 본 시스템은 데이터 수집기와 모바일 어플리케이션으로 구성되며, 이들 사이는 클래스1을 지원하는 고성능 블루투스 모듈을 통해 무선 통신한다. 본 논문에서는 개발한 진동 데이터 수집 시스템의 통신 시스템을 소개하고, 이 통신 시스템에서 사용하기 위한 프로토콜을 설계하고 개발한다. 4개의 채널에서 400Hz 속도로 발생하는 대량의 측정 데이터를 무선으로 전송하기 위해 패킷 구조를 사용하고, 데이터의 무결성을 위해 에러 검출 알고리즘을 사용한다. 이에 발생하는 문제해결을 위해 투과처리 및 역 투과처리 알고리즘을 사용한다.

Cluster Merging Using Density based Fuzzy C-Means algorithm (밀도 기반의 퍼지 C-Means 알고리즘을 이용한 클러스터 합병)

  • 한진우;전성해;오경환
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.05a
    • /
    • pp.235-238
    • /
    • 2003
  • Fuzzy C-Means(FCM) 알고리즘은 초기 군집 중심의 개수와 위치에 따라 군집 결과의 성능차이가 많이 나타난다. 하지만 일반적인 경우에 군집 중심의 개수는 분석가의 주관에 의해 결정되고, 임의적으로 결정되기 때문에 원래 데이터의 구조와는 무관하게 수행되어 최적화된 군집화 수행을 실행하지 못하는 경우가 발생하게 된다. 따라서 본 논문에서는 원래의 데이터의 구조에 좀더 근접한 퍼지 군집화를 수행하기 위하여 격자를 바탕으로 한 데이터의 밀도를 이용한 FCM을 제안하고, 이러한 밀도 기반 FCM에 의해 결정된 군집의 합병 기법을 제안하였다. N-차원의 데이터 공간을 N-차원의 격자로 나누고, 초기 군집 중심의 개수와 위치는 각 격자의 밀도를 바탕으로 결정된다. 초기화 이후에 각 격자 내부에서 FCM을 이용하여 군집화를 수행하고, 계속해서 이웃 격자의 군집결과에 대하여 군집간의 유사도 측도를 이용하여 군집 합병을 수행함으로써 데이터의 자연적인 구조에 근접한 군집화를 수행하였다. 제안된 군집화 합병 기법의 향상된 성능은 UCI Machine Learning Repository 데이터를 이용하여 확인하였다.

  • PDF