• Title/Summary/Keyword: Biased Data

검색결과 350건 처리시간 0.028초

Linear Input/output Data-based Predictive Control with Integral Property

  • Song, In-Hyoup;Yoo, Kee-Youn;Park, Myung-Jung;Rhee, Hyun-Ku
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.101.5-101
    • /
    • 2001
  • A linear input/output data-based predictive control with integral action is developed. The control input is obtained directly from the input/output data in a single step. However, the state estimation in subspace identification gives a biased estimate and there is model mismatch when the controller is applied to a nonlinear process. To overcome such difficulties, we add integral action to a linear input/output data-based predictive controller by augmenting the integrated white noise disturbance model and use each of best linear unbiased estimation(BLUE) filter and Kalman filter as a stochastic observer for the unmeasured disturbance. When applied to a continuous styrene polymerization reactor the proposed controller demonstrates.

  • PDF

PCS용 하이브리드 전압제어 발진기에 관한 연구 (A Study on a hybrid Voltage Controlled Oscillator for Personal Communication System)

  • 김영기;김혁;정의석;백경식;이재훈
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.697-700
    • /
    • 1999
  • This Paper presents the design, fabrication, analysis of the measured date of a voltage controlled oscillator(VCO) for the application of Personal Communication Systems. Main VCO circuit consists of self biased emitter resonating circuit with microstrip line resonator on FR4 epoxy substrate. A varactor diode is used for 90MHz frequency tuning with center frequency of 1635MHz Phase noise of -114.67㏈C/Hz at 100KHz off set has been achieved with 3.3 V supply. The size of the fabricated VCO circuit is 1.25 cm$\times$ 1.25 cm.

  • PDF

Comparison of EM and Multiple Imputation Methods with Traditional Methods in Monotone Missing Pattern

  • Kang, Shin-Soo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권1호
    • /
    • pp.95-106
    • /
    • 2005
  • Complete-case analysis is easy to carry out and it may be fine with small amount of missing data. However, this method is not recommended in general because the estimates are usually biased and not efficient. There are numerous alternatives to complete-case analysis. A natural alternative procedure is available-case analysis. Available-case analysis uses all cases that contain the variables required for a specific task. The EM algorithm is a general approach for computing maximum likelihood estimates of parameters from incomplete data. These methods and multiple imputation(MI) are reviewed and the performances are compared by simulation studies in monotone missing pattern.

  • PDF

MLE for Incomplete Contingency Tables with Lagrangian Multiplier

  • Kang, Shin-Soo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권3호
    • /
    • pp.919-925
    • /
    • 2006
  • Maximum likelihood estimate(MLE) is obtained from the partial log-likelihood function for the cell probabilities of two way incomplete contingency tables proposed by Chen and Fienberg(1974). The partial log-likelihood function is modified by adding lagrangian multiplier that constraints can be incorporated with. Variances of MLE estimators of population proportions are derived from the matrix of second derivatives of the loglikelihood with respect to cell probabilities. Simulation results, when data are missing at random, reveal that Complete-case(CC) analysis produces biased estimates of joint probabilities under MAR and less efficient than either MLE or MI. MLE and MI provides consistent results under either the MAR situation. MLE provides more efficient estimates of population proportions than either multiple imputation(MI) based on data augmentation or complete case analysis. The standard errors of MLE from the proposed method using lagrangian multiplier are valid and have less variation than the standard errors from MI and CC.

  • PDF

Adjusting sampling bias in case-control genetic association studies

  • Seo, Geum Chu;Park, Taesung
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.1127-1135
    • /
    • 2014
  • Genome-wide association studies (GWAS) are designed to discover genetic variants such as single nucleotide polymorphisms (SNPs) that are associated with human complex traits. Although there is an increasing interest in the application of GWAS methodologies to population-based cohorts, many published GWAS have adopted a case-control design, which raise an issue related to a sampling bias of both case and control samples. Because of unequal selection probabilities between cases and controls, the samples are not representative of the population that they are purported to represent. Therefore, non-random sampling in case-control study can potentially lead to inconsistent and biased estimates of SNP-trait associations. In this paper, we proposed inverse-probability of sampling weights based on disease prevalence to eliminate a case-control sampling bias in estimation and testing for association between SNPs and quantitative traits. We apply the proposed method to a data from the Korea Association Resource project and show that the standard estimators applied to the weighted data yield unbiased estimates.

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.

시청자와 방송사의 정치성향의 (불)일치가 방송채널 평가에 미치는 편향적 매체지각 효과 (The Effects of Biased Media Perceptions from (In)congruency between TV Audience's and Broadcasting Company's Partisanship on Evaluations of the Broadcasting Channel)

  • 송인덕
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.300-314
    • /
    • 2018
  • 본 연구는 기존의 적대적 매체지각 개념을 확장한 편향적 매체지각을 전제로, 시청자의 정치성향(진보, 중도, 보수)과 시청자가 인식한 방송사의 정치성향(진보, 중도, 보수)이 방송채널 평가(흥미성, 다양성, 창의성, 신뢰성, 유익성, 공정성, 공익성)에 미치는 영향을 분석하였다. 온라인 설문조사를 통해 수집된 전국 성인 시청자 624명의 자료를 통해 조사 당시 가장 정치적으로 중도적인 것으로 평가된 방송사를 선정하여 해당 방송채널에 대한 응답자들의 평가를 다변량 공분산분석(MANCOVA)하였다. 분석결과, 시청자의 정치성향은 방송채널 평가에 영향을 주지 않는 반면, 시청자들이 인식한 방송사의 정치성향에 따라 방송채널 평가가 달라지는 경향이 확인되었다. 또한 시청자의 정치성향과 시청자가 인식한 방송사의 정치성향이 상호작용함으로써 시청자와 방송사의 정치성향이 일치하는 경우에는 방송채널에 대한 평가가 긍정적(우호적 매체지각)인 반면 일치하지 않는 경우에는 평가가 부정적(적대적 매체지각)인 경향이 나타났다. 이러한 연구결과들을 바탕으로 방송채널에 대한 시청자들의 태도형성과 관련한 이론적 및 실용적 함의들을 논의하였다.

영작문 자동채점 시스템 개발에서 학습데이터 부족 문제 해결을 위한 앙상블 기법 적용의 효과 (Effect of Application of Ensemble Method on Machine Learning with Insufficient Training Set in Developing Automated English Essay Scoring System)

  • 이경호;이공주
    • 정보과학회 논문지
    • /
    • 제42권9호
    • /
    • pp.1124-1132
    • /
    • 2015
  • 일반적으로, 교사 학습 알고리즘이 적절히 학습되기 위해서는 레이블의 편향이 없는 충분한 양의 학습데이터가 필요하다. 그러나 영작문 자동채점 시스템 개발을 위한 충분하고 편향되지 않은 학습데이터를 수집하는 것은 어려운 일이다. 또한 영어 작문 평가의 경우, 전체적인 답안 수준에 대한 다면적인 평가가 이루어진다. 적고 편향되기 쉬운 학습데이터와 이를 이용한 여러 평가영역에 대한 학습모델을 생성해야하기 때문에, 이를 위한 적절한 기계학습 알고리즘을 결정하기 어렵다. 본 논문에서는 이러한 문제를 앙상블학습을 통해 완화할 수 있음을 실험에 통해 보이고자 한다. 실제 중, 고등학교 학생들을 대상으로 시행된 단문형 영작문 채점 결과를 학습데이터 개수와 편향성을 조절하여 실험하였다. 학습데이터의 개수 변화와 편향성 변화의 실험 결과, 에이다부스트 알고리즘을 적용한 결과를 투표로 결합한 앙상블 기법이 다른 알고리즘들 보다 전반적으로 더 나은 성능을 나타냄을 실험을 통해 나타내었다.

직류전압을 건 평행판 축전기에서 변위전류 고찰 (Displacement Current in a Parallel Plate Capacitor Biased by DC Voltages)

  • 김재동;장태훈;하혜진;손상호
    • 과학교육연구지
    • /
    • 제45권2호
    • /
    • pp.219-230
    • /
    • 2021
  • 본 연구에서는 고등학교 학생들의 변위전류에 대한 궁금증에서 출발하여 직류전압이 걸린 평행판 축전기에서 자기장과 축전기에 삽입한 토로이드 코일에 유도되는 유도전압에 관한 몇 가지 공식을 얻었다. 이 공식을 바탕으로 통상적인 실험조건에 맞는 컴퓨터 계산 결과, 자기장은 MBL 장치의 자기장 센서로는 측정이 불가능한 매우 작은 값으로 나왔으나, 유도전압은 저항 R값에 크게 의존하지만 전압센서로 측정이 가능한 범위의 값으로 나타났다. 따라서 직류전원을 사용하여 평행판 축전기에서 변위전류를 확인하기 위해서는 적당한 토로이드 코일을 축전기에 삽입하여 이것에 유도되는 유도전압을 측정하는 방법이 유용하다. 덧붙여서, 직류전압을 평행판축전기에 인가하여 변위전류를 확인하고자 하는 실험에서는 저항 R값의 선택이 매우 중요한 실험변수가 된다.

Geometric and Semantic Improvement for Unbiased Scene Graph Generation

  • Ruhui Zhang;Pengcheng Xu;Kang Kang;You Yang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권10호
    • /
    • pp.2643-2657
    • /
    • 2023
  • Scene graphs are structured representations that can clearly convey objects and the relationships between them, but are often heavily biased due to the highly skewed, long-tailed relational labeling in the dataset. Indeed, the visual world itself and its descriptions are biased. Therefore, Unbiased Scene Graph Generation (USGG) prefers to train models to eliminate long-tail effects as much as possible, rather than altering the dataset directly. To this end, we propose Geometric and Semantic Improvement (GSI) for USGG to mitigate this issue. First, to fully exploit the feature information in the images, geometric dimension and semantic dimension enhancement modules are designed. The geometric module is designed from the perspective that the position information between neighboring object pairs will affect each other, which can improve the recall rate of the overall relationship in the dataset. The semantic module further processes the embedded word vector, which can enhance the acquisition of semantic information. Then, to improve the recall rate of the tail data, the Class Balanced Seesaw Loss (CBSLoss) is designed for the tail data. The recall rate of the prediction is improved by penalizing the body or tail relations that are judged incorrectly in the dataset. The experimental findings demonstrate that the GSI method performs better than mainstream models in terms of the mean Recall@K (mR@K) metric in three tasks. The long-tailed imbalance in the Visual Genome 150 (VG150) dataset is addressed better using the GSI method than by most of the existing methods.