• Title/Summary/Keyword: 데이터유효화

Search Result 248, Processing Time 0.024 seconds

Clustering Performance Analysis for Time Series Data: Wavelet vs. Autoencoder (시계열 데이터에 대한 클러스터링 성능 분석: Wavelet과 Autoencoder 비교)

  • Hwang, Woosung;Lim, Hyo-Sang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.585-588
    • /
    • 2018
  • 시계열 데이터의 특징을 추출하여 분석하는 과정에서 시게열 데이터가 가지는 고차원성은 차원의 저주(Course of Dimensionality)로 인해 데이터내의 유효한 정보를 찾는데 어려움을 만든다. 이러한 문제를 해결하기 위해 차원 축소 기법(dimensionality reduction)이 널리 사용되고 있지만, 축소 과정에서 발생하는 정보의 희석으로 인하여 시계열 데이터에 대한 군집화(clustering)등을 수행하는데 있어서 성능의 변화를 가져온다. 본 논문은 이러한 현상을 관찰하기 위해 이산 웨이블릿 변환(Discrete Wavelet Transform:DWT)과 오토 인코더(AutoEncoder)를 차원 축소 기법으로 활용하여 시계열 데이터의 차원을 압축 한 뒤, 압축된 데이터를 K-평균(K-means) 알고리즘에 적용하여 군집화의 효율성을 비교하였다. 성능 비교 결과, DWT는 압축된 차원수 그리고 오토인코더는 시계열 데이터에 대한 충분한 학습이 각각 보장된다면 좋은 군집화 성능을 보이는 것을 확인하였다.

Optimization of the Validation Region for Target Tracking Using an Adaptive Detection Threshold (탐지문턱값 적응기법을 이용한 표적추적 유효화 영역의 최적화)

  • Choe, Seong-Rin;Kim, Yong-Sik;Hong, Geum-Sik
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.30 no.2
    • /
    • pp.75-82
    • /
    • 2002
  • It is useful to detect the tracking error with an optimal view in the presence of measurement origin uncertainty. In this paper, after the investigation of the targer error dependent on the detection threshold as well as the detection and false alarm probabilities in a clutter environment, a new algorothm that optimizes the threshold of validation region for target trackinf is proposed. The performance of the algorithm is demonstrated through computer simulations.

디지털 포토시장 진출 늦지 않았나?

  • Jo, Gap-Jun
    • 프린팅코리아
    • /
    • v.13 no.11
    • /
    • pp.60-65
    • /
    • 2014
  • 2000년대 중반 디지털 인쇄가 화려하게 대두되면서 개인화 인쇄를 중심으로 하는 디지털 포토시장은 1:1 마케팅을 활용한 가변데이터 인쇄와 함께 가장 빠른 피드백을 보여줬다. 기본 물량이 많고 고정된 데이터의 인쇄만 할 수 있는 전통 방식으론 할 수 없는 부분을 정확히 파고들었기 때문이다. 그렇다면 10여년이 지난 지금도 디지털 포토시장은 여전히 매력적일까? 응용을 차별화하고 다양한 상업인쇄 분야와 조화를 이루면서 자연스럽게 운신의 폭을 넓힌다면 아직도 성장가능성이 유효하다고 할 수 있다.

  • PDF

Quantitative Annotation of Edges in Bayesian Networks with Condition-Specific Data (베이지안 망 연결 구조에 대한 데이터 군집별 기여도의 정량화 방법에 대한 연구)

  • Jeong, Seong-Won;Lee, Do-Heon;Lee, Gwang-Hyeong
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.04a
    • /
    • pp.85-88
    • /
    • 2007
  • 본 연구에서는 베이지안 망 구조 학습에서, 학습 데이터의 특정 부분집합이 학습된 망의 각연결 구조(edge)의 형성에 기여하는 정도를 정량화하는 방법을 제안한다. 생물학 정보의 분석 등에 베이지안 망 학습을 이용하는 경우, 제안된 방법은 망의 각 연결 구조의 형성에 특정 군집 데이터가 기여하는 정도의 정량화가 가능하다. 제안된 방법의 유효성을 보이기 위해, 벤치마크 베이지안 망을 이용하여 제안된 방법이 망 연결 구조에 대한 데이터 군집별 기여도를 효과적으로 정량화 할 수 있음을 보인다.

  • PDF

Wavelet Image Compression Using Improved Morphology and Adaptive Quantization (개선된 모폴로지와 적응양자화를 이용한 웨이브릿 영상압축)

  • 류태경;강경원;정태일;권기룡;문광식
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.291-294
    • /
    • 2000
  • 본 논문에서는 웨이브릿 변환영역에서 개선된 모폴로지와 적응양자화를 이용한 영상부호화 방법을 제안한다 제안한 방법은 제로트리를 기반으로 한 기존의 방법들과 유사한 코딩성능을 가지면서 EZW, SFQ 등에서 나타나는 복잡성을 모폴로지를 사용하여 유효정보를 클러스터링 함으로써 복잡성을 줄일 수 있다. 그러나 클러스터의 개수가 많아지면 클러스터를 나타내는 부가정보의 양도 많아진다. 이러한 부가정보의 비율이 실제데이터에서 많은 비중을 차지하기 때문에 개선된 모폴로지를 적용하여 효율적으로 부호화 함으로써 영상의 화질을 개선하였다. 또한 고주파 대역에서의 유효계수를 효율적으로 코딩하기 위해 적응양자화를 적용하여 양자화 시 오차범위를 줄일 수 있다. 따라서 제안한 방법은 양자화 시 발생하는 많은 비교연산을 줄일 수 있으며, 기존의 방법에 비해 화질을 개선하였다.

  • PDF

Machine Learning Model for Predicting the Residual Useful Lifetime of the CNC Milling Insert (공작기계의 절삭용 인서트의 잔여 유효 수명 예측 모형)

  • Won-Gun Choi;Heungseob Kim;Bong Jin Ko
    • Journal of Advanced Navigation Technology
    • /
    • v.27 no.1
    • /
    • pp.111-118
    • /
    • 2023
  • For the implementation of a smart factory, it is necessary to collect data by connecting various sensors and devices in the manufacturing environment and to diagnose or predict failures in production facilities through data analysis. In this paper, to predict the residual useful lifetime of milling insert used for machining products in CNC machine, weight k-NN algorithm, Decision Tree, SVR, XGBoost, Random forest, 1D-CNN, and frequency spectrum based on vibration signal are investigated. As the results of the paper, the frequency spectrum does not provide a reliable criterion for an accurate prediction of the residual useful lifetime of an insert. And the weighted k-nearest neighbor algorithm performed best with an MAE of 0.0013, MSE of 0.004, and RMSE of 0.0192. This is an error of 0.001 seconds of the remaining useful lifetime of the insert predicted by the weighted-nearest neighbor algorithm, and it is considered to be a level that can be applied to actual industrial sites.

A Study on the Preservation of Similarity of privated Data (비식별 데이터의 유사성 보존에 관한 연구)

  • Kang, Dong-Hyun;Oh, Hyun-Seok;Yong, Woo-Seok;Lee, Won-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.285-288
    • /
    • 2017
  • 비식별화 모델은 데이터 공유를 위한 모델로 원본데이터를 비식별화 변환 처리하여 개인정보를 보호함과 동시에 분석에 필요한 데이터를 외부에 제공하는 모델로 연구되어 왔다. 변환 방법으로는 삭제, 일반화, 범주화 기술 등이 주로 사용되며 변환 과정 중에는 재식별 가능성을 최소화하기 위해 k-익명성, l-다양성, t-근접성 혹은 differential privacy 등의 프라이버시 모델이 적용되고 있다. 하지만 변환된 비식별 데이터 세트는 필연적으로 원본 데이터 세트와 다른 값을 가지며 이는 결과적으로 최종 분석 결과에 영향을 주게 된다. 이를 위해 두 데이터 세트 간의 차이를 상이도(dissimilarity) 혹은 정보 손실율(information loss)이라는 지표로 측정 하고 있으며 본 지표는 비식별 데이터의 활용성을 평가 하는 데에 매우 중요한 역할을 한다. 본 연구에서는 비식별 데이터와 원본 데이터와 간의 차이를 도메인 기반의 절대적인 기준대비로 표현한 상이도 측정 방법을 제안하며, 그 유효성을 실데이터 기반의 실험을 통해 검증하였다.

A Comparison of Cluster Analyses and Clustering of Sensory Data on Hanwoo Bulls (군집분석 비교 및 한우 관능평가데이터 군집화)

  • Kim, Jae-Hee;Ko, Yoon-Sil
    • The Korean Journal of Applied Statistics
    • /
    • v.22 no.4
    • /
    • pp.745-758
    • /
    • 2009
  • Cluster analysis is the automated search for groups of related observations in a data set. To group the observations into clusters many techniques has been proposed, and a variety measures aimed at validating the results of a cluster analysis have been suggested. In this paper, we compare complete linkage, Ward's method, K-means and model-based clustering and compute validity measures such as connectivity, Dunn Index and silhouette with simulated data from multivariate distributions. We also select a clustering algorithm and determine the number of clusters of Korean consumers based on Korean consumers' palatability scores for Hanwoo bull in BBQ cooking method.

Quantitative Annotation of Edges, in Bayesian Networks with Condition-Specific Data (베이지안 망 연결 구조에 대한 데이터 군집별 기여도의 정량화 방법에 대한 연구)

  • Jung, Sung-Won;Lee, Do-Heon;Lee, Kwang-H.
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.17 no.3
    • /
    • pp.316-321
    • /
    • 2007
  • We propose a quatitative annotation method for edges in Bayesian networks using given sets of condition-specific data. Bayesian network model has been used widely in various fields to infer probabilistic dependency relationships between entities in target systems. Besides the need for identifying dependency relationships, the annotation of edges in Bayesian networks is required to analyze the meaning of learned Bayesian networks. We assume the training data is composed of several condition-specific data sets. The contribution of each condition-specific data set to each edge in the learned Bayesian network is measured using the ratio of likelihoods between network structures of including and missing the specific edge. The proposed method can be a good approach to make quantitative annotation for learned Bayesian network structures while previous annotation approaches only give qualitative one.

Road Map Data Compression Using Extraction of Characteristic (특징점 추출을 이용한 도로망 지도의 데이터 압축)

  • 도재수
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.11b
    • /
    • pp.81-84
    • /
    • 2002
  • 최근, 사회의 요구의 다양성, 고도화에 동반하여 지도정보 시스템에 대한 수요가 증가하고 있다. 이 시스템을 구축할 때, 지도 중에서 각 선도형이 갖는 방대한 데이터를 어떻게 압축하여 시스템에 입력하여, 축적할까하는 것이 문제가 된다. 자동차의 네비게이션 등에 이용하는 도로지도에 한해서는, 도로의 접속관계만 유지된다면, 원래의 도로지도와 다소 차이가 있다고 하여도 충분히 유효하다. 본 연구에서는 이 네비게이션을 목적으로 한, 시가지의 도로망 지도에 대하여, 특징점 추출과 직선 근사를 이용한 데이터 압축법을 제안한다.

  • PDF