• Title/Summary/Keyword: 데이터유효화

Search Result 246, Processing Time 0.043 seconds

Automatic Augmentation Technique of an Autoencoder-based Numerical Training Data (오토인코더 기반 수치형 학습데이터의 자동 증강 기법)

  • Jeong, Ju-Eun;Kim, Han-Joon;Chun, Jong-Hoon
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.22 no.5
    • /
    • pp.75-86
    • /
    • 2022
  • This study aims to solve the problem of class imbalance in numerical data by using a deep learning-based Variational AutoEncoder and to improve the performance of the learning model by augmenting the learning data. We propose 'D-VAE' to artificially increase the number of records for a given table data. The main features of the proposed technique go through discretization and feature selection in the preprocessing process to optimize the data. In the discretization process, K-means are applied and grouped, and then converted into one-hot vectors by one-hot encoding technique. Subsequently, for memory efficiency, sample data are generated with Variational AutoEncoder using only features that help predict with RFECV among feature selection techniques. To verify the performance of the proposed model, we demonstrate its validity by conducting experiments by data augmentation ratio.

Traffic Management of Integrated Services using ATM Networks (ATM 망을 이용한 통합서비스의 트래픽 관리)

  • Kim, Hoon;Park, Jong-Dae;Nam, Sang-Shic;Park, Kwang-Chae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10b
    • /
    • pp.1477-1480
    • /
    • 2001
  • 기존 통신사업자가 급변하는 통신시장에 대응하기 위한 구체적 접근방법에 초점을 맞추어 통신기술의 변화와 이에 따른 기존망을 어떻게 개선하여야만 수익성에 차질을 빚지 않을 수 있느냐가 전재 조건이 된다. 먼저 통신기술의 변화에 따른 망의 진화방향을 음성의 패킷화 실현, 망 구조의 단순화 및 통합화를 통한 운용비용의 절감, 향후 신규서비스의 수용에 용이한 방향이 있어야 한다. 본 논문에서는 ATM을 중심으로 한 차세대 교환망에서 음성과 데이터가 동일 패킷망을 사용하므로서 망 대역폭을 효율적으로 활용하는 방법과 유효 대역 사용률을 향상하는 유연한 대역관리 방법에 대해 개괄적으로 논하였으며, 이를 바탕으로 대역폭 할당 프로토콜을 분석한 수 있는 모델을 제안하고, 주어진 음성 및 데이터 트래픽의 요구와 제약을 조건으로 시스템 파라미터를 최적화하기 위해 update interval 시간과 음성과 데이터 트래픽에 예약된 슬롯의 수를 사용하였다. 분석적인 모델은 성능에 관한 트래픽 유형들의 영향뿐만 아니라 혼합 트래픽 시스템의 동적 할당 방법과 대역관리 방법을 제공한다.

  • PDF

A Live Multimedia Multiplexing Method for VBR-coded Elementary Streams with Delay Constraints (지연 조건을 갖는 VBR 부호화된 기본 스트림에 대한 라이브 멀티미디어 서비스 다중화 기법)

  • 김진수
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.9A
    • /
    • pp.1516-1524
    • /
    • 2001
  • 현재 ATM망, giga-bit 이더넷, fast 이더넷 그리고 프레임-릴레이와 같은 고속 전송 망 구축 기술이 발전함에 따라 다양한 소비자 욕구를 촉진시키고 있다. 특히, 다양한 멀티미디어 서비스의 환경에서는 다중화되는 개개의 기본 스트림들에 대한 특성이 더욱 가변적임에 따라, 이를 효과적으로 다중화하여 망에 적응 및 연동시키는 기술은 필수적이다. 본 논문에서는 이와 같은 응용 환경을 고려하여 가변 비트율로 부호화 및 다중화하여 전송되는 과정에 있어서 지나친 전송 대역폭의 낭비를 초래하지 않고 다중화 전송 기법을 제안한다. 가변 비트율로 부호화된 기본 스트림의 각 액세스 단위에 대해 부과되는 지연 크기에 의한 제한 조건 관계식을 정의하고, 이것을 바탕으로 라이브 멀티미디어 서비스를 제공하는 효과적인 두 가지 방안을 제안한다. 제안한 방법은 각각 시간적 측면만을 고려한 방법과 시간/공간적 측면을 동시에 고려한 방법으로 나누어 제안한다. 부호화된 Star-wars 데이터 트레이스를 이용한 모의 실험에서 제안된 방식은 크게 다중화 전송 스트림의 첨두율, 변화율 계수 그리고 유효 대역폭 측면에서 성능을 크게 개선시킴을 확인한다. 그리고, 저 지연을 갖는 멀티미디어 서비스에 대해 상대적으로 우수한 성능이 나타남을 확인한다.

  • PDF

Motion correction captured by Kinect based on synchronized motion database (동기화된 동작 데이터베이스를 활용한 Kinect 포착 동작의 보정 기술)

  • Park, Sang Il
    • Journal of the Korea Computer Graphics Society
    • /
    • v.23 no.2
    • /
    • pp.41-47
    • /
    • 2017
  • In this paper, we present a method for data-driven correction of the noisy motion data captured from a low-end RGB-D camera such as the Kinect device. For this purpose, our key idea is to construct a synchronized motion database captured with Kinect and additional specialized motion capture device simultaneously, so that the database contains a set of erroneous poses from Kinect and their corresponding correct poses from the mocap device together. In runtime, given motion captured data from Kinect, we search the similar K candidate Kinect poses from the database, and synthesize a new motion only by using their corresponding poses from the mocap device. We present how to build such motion database effectively, and provide a method for querying and searching a desired motion from the database. We also adapt the laze learning framework to synthesize the corrected poses from the querying results.

Design and Implementation of KRISTAL-2002 based Academic Content Management System (KRISTAL-2002 기반의 학술정보관리시스템의 설계 및 구현)

  • 김병규;강무영;박재원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.211-213
    • /
    • 2004
  • 과학기술 분야 학회에서 발생되는 고급 학술정보는 산업ㆍ경제적 측면에서 그 효용 가치가 매우 크다. 따라서 국가 경쟁력 강화를 위해 전략적 차원으로 첨단과학기술정보를 디지털화하여 부존자원화 하고 효율적인 서비스체제를 구축하는 것이 매우 중요하다. 이러한 일련의 과정을 수행하는 것이 학술정보관리시스템이다. 한국과학기술정보연구원에서는 학술정보관리를 위하여 관계형 DB와 KRISTAL-II 기반의 관리시스템을 개발하여 운영하고 있다. 하지만 시스템에 종속적인 메타데이터의 형식과 복잡한 관리 프로세스 그리고 다양하지 못한 검색 서비스 제공과 같은 단점을 가지고 있다. 본 논문에서는 데이터의 저장관리와 빠른 검색을 제공하는 KISTI의 최신 IRMS인 KRISTAL-2002만을 사용하여 새로운 학술정보관리시스템(ACMS)를 설계하고 구현하였다. 또한 ACMS는 학술정보의 처리를 메타데이터의 표준인 XML을 사용함으로써 데이터의 유효성 검증과 타 기관의 상호대차 및 원문 교환을 손쉽게 하였다.

  • PDF

A study of advanced learner's modeling based on weighted SVDD for intelligent tutoring system (지능형 교육 시스템을 위한 SVDD 가중치를 이용한 개선된 학습자 모델링 연구)

  • Yoon, Tae-Bok;Lee, Jee-Hyong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.125-127
    • /
    • 2012
  • IT기술의 발달과 함께 학습자의 학습 성향, 능력, 환경 등을 인지하고 그에 적절한 서비스가 가능한 지능형 교육 시스템이 많은 관심을 받고 있다. 학습자에게 지능적이고 개인화된 서비스를 위해서는 학습자를 인지하기 위한 작업이 선행되어야 하며, 이 인지과정을 위해서는 학습자의 학습 과정에서 발생한 데이터를 수집하고 분석하게 된다. 하지만, 수집된 데이터가 학습자의 일관되지 못한 행위나 예측하지 못한 학습 성향을 포함하고 있다면, 그 결과를 신뢰하기 어렵다. 본 논문에서는 학습자에게서 수집된 데이터를 SVDD를 이용하여 가중치를 부여하고, 그 값을 인지과정에 활용한다. 실험에서는 홈 인테리어 교육 컨텐츠 기반에 학습자의 학습 행위에 대한 학습 성향을 진단하기 위해 DOLLS-HI를 이용하였고, 수집된 학습자의 데이터를 분석하여 전통적인 분석 방법 대비 제안하는 방법의 유효함을 확인하였다.

Methodology for Constructing Data for Automatic Generation of Emotional Copywrite (감성적 광고 카피 자동 생성을 위한 데이터 구축 방법론)

  • Jimin Seong;Haeun Shin;Jiyoon Kang
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.336-341
    • /
    • 2023
  • 초대규모 언어모델의 뛰어난 생성 기술이 실질적인 부분에서 많은 도움을 주고 있음에도 불구하고 사람들의 마음을 움직일 수 있는 매력적인 광고 카피를 생성하기에는 아쉬운 점이 많다. 이 연구는 효과적인 광고 카피 자동생성을 위한 데이터 구축 방법론 연구로, 데이터에 일관적으로 학습시킬 수 있는 감성적 카피의 문체적 특징을 프레임워크로 정의하고 이를 모델에 적용한 결과를 보여 데이터 설계 방법론의 유효성을 검증하고자 하였다. 실험 결과 문체 적합성 측면에서 성공적인 결과를 확인한 것에 비해, 한국어 보조사와 같이 미세한 어감 차이를 발생시키는 요소나 의미적 중의성 해석 등의 고차원적인 한국어 구사능력을 필요로 하는 부분에서 생성모델의 개선 여지를 발견할 수 있었다. 본 연구에서 보인 감성형 카피 생성을 위한 프레임워크는 마케팅 실무에서도 유용하게 사용될 수 있을 뿐만 아니라, 고객 세그멘테이션 분석이 이루어진다면 타깃 고객의 취향을 고려한 효과적이고 맞춤화된 광고 카피를 생성에 기여할 수 있을 것으로 기대된다.

  • PDF

Prediction Modeling on Effective Thermal Conductivity of Porous Insulation in Thermal Protection System (열방어구조의 다공성 단열재 유효 열전도율 예측 모델링)

  • Hwang, Kyung-Min;Kim, Yong-Ha;Kim, Myung-Jun;Lee, Hee-Soo;Park, Jung-Sun
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.45 no.3
    • /
    • pp.163-172
    • /
    • 2017
  • Porous insulation have been frequently used in a number of industries by minimizing thermal insulation space because of excellent performance of their thermal insulation. This paper devices an effective thermal conductivity prediction model. First of all, we perform literature survey on traditional effective thermal conductivity prediction models and compare each other model with heat transfer experimental results. Furthermore this research defines advanced effective thermal conductivity prediction models model based on heat transfer experimental results, the Zehner-Schlunder model. Finally we verify that the newly defined effective thermal conductivity prediction model has better performance prediction than other models. Finally, this research performs a transient heat transfer analysis of thermal protection system with a porous insulation using the finite element method and confirms validity of the effective thermal conductivity prediction model.

Calibration and Validation of SWAT for the Neponset River Watershed in Boston (보스턴 넷폰셋강의 수질체계에 대한 스왓모델의 교정과 유효성 검증)

  • Lee, Ja-Won
    • Journal of the Korean association of regional geographers
    • /
    • v.14 no.1
    • /
    • pp.19-26
    • /
    • 2008
  • A validation study has been performed using the Soil and Water Assessment Tool(SWAT) model with data collected for the Neponset River watershed, which includes roughly 130 square miles of land located southwest of Boston. All of this land drains into the Neponset River, and ultimately into Boston Harbor. This paper presents the methodology of a SWAT model. The calculated contribution of the baseflow to the streamflow is far too high whereas the interflow is strongly underestimated. Alternatively, the modified and calibrated model yields far better results for the catchment. The modification allows hydrological processes to be modeled while not restraining the applicability of the model to catchments with other characteristics. For this study, the SWAT 2005 model is used with ArcGIS 9.1 as an interlace, and sensitivity analysis is performed to provide rough estimated values before adjusting sensitive input parameters during calibration period.

  • PDF

Exploring Factors Influencing Users' Continuance Intention in Social Networking Sites (사회네트워킹 사이트 이용자 지속의도에 영향을 미치는 요인에 관한 탐구)

  • Park, Ji-Hong
    • Journal of the Korean Society for information Management
    • /
    • v.25 no.4
    • /
    • pp.205-226
    • /
    • 2008
  • The success of social networking sites (SNSs) may depend on many factors. Continuance use of SNSs is one of these. Especially, in the Web environment where users can leave one service with a single mouse click, maintaining existing members cost much time and efforts. Without continuance use of SNSs, SNS-based service would not create any value. This study focused on identifying factors influencing users' continuance intention in SNSs. Based on relevant literature review, six influencing factors were initially identified. They were reputation, relational capital, knowledge quality, compatibility, personalization, and satisfaction. Web-based questionnaire survey was conducted and a total of 325 usable responses were collected. Reliability test and two rounds of exploratory factor analyses resulted in identifying five factors. The relationship between the factors and the continuance intention was tested by using multiple regression analyses. The analyses revealed that satisfaction was the most significant factor. Knowledge quality and relational capital also had significant effects while reputation and personalization did not have significant effect on continuance intention. Instead, reputation and personalization showed significance in influencing satisfaction.