• Title/Summary/Keyword: 데이터 일반화

Search Result 677, Processing Time 0.025 seconds

A ODBMS-based XML Document Repository System (ODBMS기반의 XML 문서저장관리시스템)

  • 왕지현;김현기;정의석;임수종;임명은
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.34-36
    • /
    • 2001
  • 컴퓨터 산업이 발전하고 정보량이 늘어남에 따라 XML이 다양한 분야에 사용되고 있다. 본 논문은 여러분야에 활용되고 있는 XML문서들을 효율적으로 저장하고 관리할 수 있을 뿐만 아니라 다 사용자 환경에서 문서의 전체나 일부를 공유할 수 있는 기능을 제공하는 XML 문서저장관리시스템을 소개한다. 다양한 DTD를 수용하기 위해 객체 지향적인 일반화 데이터 모델을 제안하며 , 시스템을 구성하고 있는 각 구성요소 모듈을 설명한다. 일반화 데이터 모델은 DTD 의존적인 모델에 비해 연산량이 적을 뿐더러 여러 DTD를 하나의 스키마로 수용할 수 있다.

  • PDF

Mining Generalized Temporal Patterns in Temporal Databases (시간지원 데이터베이스에서의 시간 계층을 이용한 일반화된 패턴 정보 탐사)

  • 이강태;이준욱;남광우;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.232-233
    • /
    • 1998
  • 이 논문에서는 시간지원 데이터베이스를 대상으로 하여 시간 간격과 시간 위상을 지닌 데이터에서의 정보를 탐사한다. 그리고 시간지원 데이터베이스에서의 시간 정보 유형을 제시하고 이에 따라 탐사되는 패턴의 유형을 분류한다. 또한 시간에 대한 계층적 구조인 시간 계층을 도입하고 이를 이용하여 각 항목의 유효시간 정보를 일반화시킨다. 시간 계층에 의한 유효시간의 일반화에 있어서 발생하는 시간 정보 유형의 변화와 패턴 유형의 변화를 살펴본다. 그리고 시간 간격 변화에 따른 패턴 정보의 발견을 예를 들어 기술한다. 이 논문에서는 시간 계층을 이용하여 시간 간격을 변화시킬 경우 발견되는 새로운 유형의 패턴 지식을 탐사하고 이를 제시한다.

A Vector Watermarking Using the Generalized Square Mask (일반화된 정사각형 마스크를 이용한 벡터 워터마킹 기법)

  • Kang, Hwan-Il;Kim, Kab-Il;Jung, Yo-Won
    • Proceedings of the KIEE Conference
    • /
    • 2000.11d
    • /
    • pp.818-820
    • /
    • 2000
  • 본 연구는 벡터데이터에 워터마크를 삽입하고 추출하는 알고리즘을 제시한다. 삽입방법은 각 좌표를 마스크 안에서의 좌표로 변환한 후 워터마크의 크기에 따라 삽입영역을 다르게 설정한다. 이 방법은 기존의 Sakamoto 알고리즘을 일반화한다. 즉 기존의 마스크는 $2^R$-1이지만 이 논문에서는 일반화된 정사각형을 사용할 수 있다. 또한 잡음에 강인함을 보인다.

  • PDF

Comparative Study on the Building Outline Simplification Algorithms for the Conversion of Construction Drawings to GIS data (건설도면의 GIS 데이터 변환을 위한 건물외곽선 단순화기법 비교 연구)

  • Park, Woo-Jin;Park, Seung-Yong;Yu, Ki-Yun
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2008.06a
    • /
    • pp.437-444
    • /
    • 2008
  • 최근 유비쿼터스 시대를 맞아 건설 분야에서 이용되는 CAD 자료에서 GIS 자료로의 변환 및 융복합에 대한 요구가 증대되면서 상호변환을 위한 연구가 활발하게 진행되고 있다. 본 연구에서는 건설도면 CAD 데이터를 활용하여 수치지도의 건물데이터를 수정, 갱신하기 위한 방법론의 일환으로 건설도면의 건물외곽선을 추출하여 수치지도의 건물데이터 수준으로 일반화하는 선형 단순화 알고리즘을 비교 분석하였다. 선형 단순화 알고리즘은 Douglas-Peucker 알고리즘, Lang 알고리즘, Reumann-Witkam, Opheim 알고리즘을 적용하였으며 분석방법으로는 시각적 분석, 절점 수, 총길이, 면적 변화율 분석 그리고 각 절점이 수치지도 작성내규를 만족하는 비율을 이용하였다. 분석 결과 Douglas-Peycker 알고리즘이 시각적 측면과 절점 수 감소율 측면에서 상대적으로 우수한 단순화 결과를 보여주었으나 수치지도 작성내규 만족도 측면에서는 공통적으로 $50{\sim}60%$ 수준의 만족도를 보이고 있어 국내의 수치지도의 건물데이터를 작성하기 위한 단순화 기법으로는 한계가 있는 것으로 나타났으며 이를 만족시키기 위한 일반화 알고리즘의 개발이 필요하다고 판단된다.

  • PDF

Robust SVM Design for Multi-Class Classification - Application to Biometric data - (다중 클래스 분류를 위한 강인한 SVM 설계 방법 - 생체 인식 데이터에의 적용 -)

  • Cho, Min-Kook;Park, Hye-Young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.760-762
    • /
    • 2005
  • Support vector machine(SVM)은 졸은 일반화 능력을 가진 학습시스템으로, 최근 다양한 패턴 인식 분야에서 적용되고 있다. SVM은 기본적으로 이진 분류기이므로 두 개 이상의 클래스를 분류하기 위해서는 다중 클래스 분류가 가능한 형태로의 설계 방법이 필요하다. 이를 위해 각 클래스별로 독립적인 SVM들을 만들어 결과를 병합하는 방식이 주로 사용되어 왔다. 그러나 이러한 방법은 클래스의 수는 않고 한 클래스 내의 데이터의 수가 많지 않은 경우에는 SVM의 일반화 성능을 저하시키고 노이즈에 민감해지는 문제점을 가지고 있다. 이를 해결하기 위해 본 논문에서는 각 클래스내의 데이터간의 유사도 측정을 위한 통계적 정보를 안정적으로 추출하기 위해 두 데이터의 쌍을 입력으로 받는 새로운 SVM 설계 방법을 제시한다. 제안한 방법을 실제 생체인식 데이터에 적용한 실험에서 기존의 방법보다 우수한 분류 성능을 보임을 확인할 수 있었다.

  • PDF

Molecular Property Prediction with Deep-learning and Pretraining Strategy (사전학습 전략과 딥러닝을 활용한 분자의 특성 예측)

  • Lee, Seungbeom;Kim, Jiye;Kim, Dongwoo;Park, Jaesik;Ahn, Sungsoo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.63-66
    • /
    • 2022
  • 본 논문에서는 분자의 특성을 정확하게 예측하기 위해 효과적인 사전학습(pretraining) 전략과 트랜스포머(Transformer) 모델을 활용한 방법을 제시한다. 딥러닝을 활용한 분자의 성능을 예측하는 연구는 그동안 레이블이 부족한 분자데이터의 특성에 의해 학습 때 사용된 데이터이외의 분자데이터에 대해 일반화 능력이 떨어지는 어려움을 겪었다. 이 논문에서 제시한 모델은 사전학습(pretraining)을 수행할 때 자기지도학습(self-supervised training)을 사용하여 부족한 레이블에 의한 문제점을 피할 수 있다. 대규모 분자 데이터셋으로부터 학습된 이 모델은 4가지 다운스트림 데이터셋에 대해 모두 우수한 성능을 보여주어 일반화 성능이 뛰어나며 효과적인 분자표현을 얻을 수 있음을 보인다.

  • PDF

Dataset Augmentation on Fallen Person Objects in a Autonomous Driving Tractor Environment (자율주행 트랙터 환경에서 쓰러진 사람에 대한 데이터 증강)

  • Hwapyeong Baek;Hanse Ahn;Heesung Chae;Yongwha Chung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.553-556
    • /
    • 2023
  • 데이터 증강은 데이터 불균형 문제를 해결하기 위해 일반화 성능을 향상시킨다. 이는 과적합 문제를 해결하고 정확도를 높이는 데 도움을 준다. 과적합을 해결하기 위해서 본 논문에서는 분할 마스크 라벨링을 자동화하여 효율성을 높이고, RoI를 활용한 분할 Copy-Paste 데이터 증강 기법을 제안한다. 본 논문의 제안 방법을 적용한 결과 YOLOv8 모델에서 기존의 분할, 박스 Copy-Paste 데이터 증강 기법과 비교해서 쓰러진 사람 객체에 대한 정확도가 10.2% 증가함으로써 제안한 방법이 일반화 성능을 높이는 데 효과가 있음을 확인하였다.

Jackknife Estimators in the Left Truncated Exponential Model

  • Cho, Kil-Ho;Cho, Jang-Sik
    • Journal of the Korean Data and Information Science Society
    • /
    • v.17 no.2
    • /
    • pp.487-492
    • /
    • 2006
  • Jackknife estimators for parameters in the left truncated exponential model are presented. And we show that the generalized jackknife estimators are more efficient than others in terms of the bias and the mean squared error.

  • PDF

Properties of Extended Gamma Distribution

  • Lee, In-Suk;Kim, Sang-Moon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.15 no.4
    • /
    • pp.753-758
    • /
    • 2004
  • A generalization of gamma distribution is defined by slightly modifying the form of Kobayashi's generalized gamma function(1991). We define a new extended gamma distribution and study some properties of this distribution.

  • PDF

Estimation of nonlinear GARCH-M model (비선형 평균 일반화 이분산 자기회귀모형의 추정)

  • Shim, Joo-Yong;Lee, Jang-Taek
    • Journal of the Korean Data and Information Science Society
    • /
    • v.21 no.5
    • /
    • pp.831-839
    • /
    • 2010
  • Least squares support vector machine (LS-SVM) is a kernel trick gaining a lot of popularities in the regression and classification problems. We use LS-SVM to propose a iterative algorithm for a nonlinear generalized autoregressive conditional heteroscedasticity model in the mean (GARCH-M) model to estimate the mean and the conditional volatility of stock market returns. The proposed method combines a weighted LS-SVM for the mean and unweighted LS-SVM for the conditional volatility. In this paper, we show that nonlinear GARCH-M models have a higher performance than the linear GARCH model and the linear GARCH-M model via real data estimations.