• 제목/요약/키워드: Biased Data

검색결과 350건 처리시간 0.027초

편향된 지상기준점을 이용한 비접근지역 영상좌표의 상대정확도 향상연구 (Assessment of Relative Accuracy for Inaccessible Area Imagery Using Biased Ground Control Points)

  • 권현우;조성준;임삼성
    • 한국측량학회지
    • /
    • 제20권2호
    • /
    • pp.165-170
    • /
    • 2002
  • 다목적 실용위성영상을 이용하여 지리정보를 얻기 위해서는 영상의 기하보정이 필수적이지만 현지접근 불능지역은 지상기준점을 획득하기가 어렵고, 지도 독취를 통하여 획득한 지상기준점은 부정확하다. 일반적으로 시스템기하보정은 위성궤도요소 및 자세요소를 이용하나, 이 방법은 위성영상의 절대위치오차를 크게 향상시키지 못한다. 이러한 단점을 보완하기 위하여 본 논문에서는 가상 접근 불능지역과 접근 가능지역을 포함한 영상을 이용하여 접근 가능지역에서 GPS로부터 획득된 지상기준점만으로 편향적인 기하보정을 수행한 후 오차추이분석을 통한 영상좌표의 상대정확도 향상기법을 제시하였다.

FASIM: Fragments Assembly Simulation using Biased-Sampling Model and Assembly Simulation for Microbial Genome Shotgun Sequencing

  • Hur Cheol-Goo;Kim Sunny;Kim Chang-Hoon;Yoon Sung-Ho;In Yong-Ho;Kim Cheol-Min;Cho Hwan-Gue
    • Journal of Microbiology and Biotechnology
    • /
    • 제16권5호
    • /
    • pp.683-688
    • /
    • 2006
  • We have developed a program for generating shotgun data sets from known genome sequences. Generation of synthetic data sets by computer program is a useful alternative to real data to which students and researchers have limited access. Uniformly-distributed-sampling clones that were adopted by previous programs cannot account for the real situation where sampled reads tend to come from particular regions of the target genome. To reflect such situation, a probabilistic model for biased sampling distribution was developed by using an experimental data set derived from a microbial genome project. Among the experimental parameters tested (varied fragment or read lengths, chimerism, and sequencing error), the extent of sequencing error was the most critical factor that hampered sequence assembly. We propose that an optimum sequencing strategy employing different insert lengths and redundancy can be established by performing a variety of simulations.

e-마켓플레이스 솔루션 선정 요인에 관한 연구 (A Study on E-Marketplace Solution Selection Factors)

  • 권혁인;윤심;이은형
    • 한국멀티미디어학회논문지
    • /
    • 제5권6호
    • /
    • pp.712-729
    • /
    • 2002
  • 오늘날 정보통신기술(IT technology)의 급속한 발전은 우리의 생활을 빠르게 변화시키고 있으며, 이러한 변화는 과거와는 전혀 다른 새로운 세계를 형성해 가고 있다. 특히 인터넷의 급속한 이용 확산과 기술 발전은 기업들이 전세계를 기반으로 사업을 전개하는 방식에 혁신을 가져 왔다. 본 연구는 기업간 전자상거래(business to business E-commerce)가 활성화되면서 가상시장(cyber market)으로 등장한 기업간 e-마켓플레이스(B2Be-Marketplace)에 대하여 수행되었다. 기업간 e-마켓플레이스를 구축을 위해서는 적절한 솔루션의 선정과정이 선행되어야 하는데 아직까지 e-마켓플레이스에 대한 연구가 미흡하기 때문에 선정 요인의 기준에 관한 연구가 없었다. 따라서 본 연구에서는 기업간 e-마켓플레이스를 구축할 때 솔루션 선정의 올바른 의사결정을 위한 선정요인의 중요도를 평가해 보았다. 선정요인의 중요도 평가는 e-마켓플레이스의 운영주체와 산업별로 구분하여 각각 수행하였다. 선행연구에서 사용되었던 변수들이 e-마켓플레이스에서는 어떤 상호관련성을 갖고 묶이는지 알아보기 위하여 요인분석을 먼저 실행하였다. 분석결과 솔루션의 특징에 관한 16개의 솔루션 선정 변수들은 '유연성(flexibility)', '용이성(ease of use)', '보안성(security)', '경제성(cost)' 등 4개의 요인으로 분류되었다. 그리고 벤더의 특징에 관한 11개의 솔루션 선정 변수들은 '지원사항(support of vendor)', '일반현황(situation of vendor)', '사업실적(accomplishment of vendor)' 등 3개의 요인으로 구분되었다. 그리고 기업간 e-마켓플레이스 구축 시 중요하게 여기는 솔루션의 중요도 평가를 위해서 e-마켓플레이스의 운영주체와 산업별로 나누어 분실을 하였다. e-다켓블레이스의 운영주체는 각각 구매자 중심형(buyer- biased), 중개자 중심형 (Neutral), 공급자 중심형 (seller-biased)으로 구분하였다. 솔루션의 특성에 관한 중요도 평가 결과 데이터 항목에 대한 보안이 모든 유형에서 상대적으로 높게 나타났다. 벤더의 특성에 관한 중요도는 구매자 중심형의 경우 '추가적 인 지원인력, 교육, 비용, 중개자 중심형은 '교육코스의 장소, 시기, 수준', 공급자 중심형은 '벤더의 시장점유율'로 나타났다. 또한 e-마켓플레이스 산업별로 중요도 평가를 실시한 결과 솔루션 특성에 관해서는 전자업, 무역·유통업, 서비스업(service industry) 모두 '데이터 항목에 대한 보안'이 가장 중요한 것으로 나타났다. 본 연구에서는 솔루션 선정요인에 관한 중요도를 e-마켓플레이스의 유형과 산업 별로 평가해보았는데, 여기에서 밝혀진 중요도를 통해 e 마켓플레이스를 구축하고 자 하는 기업은 솔루션을 자체 개발하거나 구입할 때 올바른 의사결정을 할 수 있다. 그리고 솔루션을 제공하려는 기업측면에서는 e-마켓플레이스를 구축하고자 하는 기업에게 유형과 산업별로 적절한 솔루션을 제공할 수 있다.

  • PDF

빅데이터 기술 경쟁력 분석 (An analysis on the technology competitiveness of BigData)

  • 홍재표;김방룡
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.66-67
    • /
    • 2014
  • 본 연구에서는 특허분석을 실시하여 빅데이터 분야의 기술 경쟁력을 분석하였다. 분석 결과 미국의 특허 활동이 가장 활발하며, 최근 들어 특허 출원 및 등록 특허수가 크게 증가한 것으로 나타났다. 하지만 미국의 특허 활동은 양적 측면에 치우쳐 있는 것으로 판단되는데, 왕성한 특허활동에도 불구하고 인용도 및 영향력지수는 오히려 하락한 것으로 나타났기 때문이다. 한국은 일본, 중국, 캐나다 등과 더불어 비교적 활발한 특허활동을 전개 중이나, 미국과 마찬가지로 양적 측면에 치우쳐 있어 향후 양질의 기술 확보를 위한 노력을 기울여야 할 것으로 사료된다.

  • PDF

Predicting numeric ratings for Google apps using text features and ensemble learning

  • Umer, Muhammad;Ashraf, Imran;Mehmood, Arif;Ullah, Saleem;Choi, Gyu Sang
    • ETRI Journal
    • /
    • 제43권1호
    • /
    • pp.95-108
    • /
    • 2021
  • Application (app) ratings are feedback provided voluntarily by users and serve as important evaluation criteria for apps. However, these ratings can often be biased owing to insufficient or missing votes. Additionally, significant differences have been observed between numeric ratings and user reviews. This study aims to predict the numeric ratings of Google apps using machine learning classifiers. It exploits numeric app ratings provided by users as training data and returns authentic mobile app ratings by analyzing user reviews. An ensemble learning model is proposed for this purpose that considers term frequency/inverse document frequency (TF/IDF) features. Three TF/IDF features, including unigrams, bigrams, and trigrams, were used. The dataset was scraped from the Google Play store, extracting data from 14 different app categories. Biased and unbiased user ratings were discriminated using TextBlob analysis to formulate the ground truth, from which the classifier prediction accuracy was then evaluated. The results demonstrate the high potential for machine learning-based classifiers to predict authentic numeric ratings based on actual user reviews.

EER-ASSL: Combining Rollback Learning and Deep Learning for Rapid Adaptive Object Detection

  • Ahmed, Minhaz Uddin;Kim, Yeong Hyeon;Rhee, Phill Kyu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권12호
    • /
    • pp.4776-4794
    • /
    • 2020
  • We propose a rapid adaptive learning framework for streaming object detection, called EER-ASSL. The method combines the expected error reduction (EER) dependent rollback learning and the active semi-supervised learning (ASSL) for a rapid adaptive CNN detector. Most CNN object detectors are built on the assumption of static data distribution. However, images are often noisy and biased, and the data distribution is imbalanced in a real world environment. The proposed method consists of collaborative sampling and EER-ASSL. The EER-ASSL utilizes the active learning (AL) and rollback based semi-supervised learning (SSL). The AL allows us to select more informative and representative samples measuring uncertainty and diversity. The SSL divides the selected streaming image samples into the bins and each bin repeatedly transfers the discriminative knowledge of the EER and CNN models to the next bin until convergence and incorporation with the EER rollback learning algorithm is achieved. The EER models provide a rapid short-term myopic adaptation and the CNN models an incremental long-term performance improvement. EER-ASSL can overcome noisy and biased labels in varying data distribution. Extensive experiments shows that EER-ASSL obtained 70.9 mAP compared to state-of-the-art technology such as Faster RCNN, SSD300, and YOLOv2.

Bayesian estimation for finite population proportion under selection bias via surrogate samples

  • Choi, Seong Mi;Kim, Dal Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1543-1550
    • /
    • 2013
  • In this paper, we study Bayesian estimation for the finite population proportion in binary data under selection bias. We use a Bayesian nonignorable selection model to accommodate the selection mechanism. We compare four possible estimators of the finite population proportions based on data analysis as well as Monte Carlo simulation. It turns out that nonignorable selection model might be useful for weekly biased samples.

교차타당성을 이용한 확률밀도함수의 불연속점 추정의 띠폭 선택 (Bandwidth selections based on cross-validation for estimation of a discontinuity point in density)

  • 허집
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.765-775
    • /
    • 2012
  • 교차타당성은 커널추정량의 평활모수인 띠폭의 선택 방법으로 흔히 활용되고 있다. 연속인 확률밀도함수의 커널추정량의 띠폭 선택으로 널리 쓰이는 교차타당성 방법으로는 최대가능도교차타당성과 더불어 최소제곱교차타당성과 편의교차타당성이 있다. 확률밀도함수가 하나의 불연속점을 가질 때, Huh (2012)는 불연속점 추정을 위한 커널추정량의 띠폭 선택으로 최대가능도교차타당성을 이용한 방법을 제시하였다. 본 연구에서는 Huh (2012)에 의해 최대가능도교차타당성으로 제안된 띠폭선택의 방법과 같이 한쪽방향커널함수를 이용한 최소제곱교차타당성과 편의교차타당성으로 띠폭 선택 방법을 제시하고, 이들 띠폭 선택 방법들과 Huh (2012)의 최대가능도교차타당성을 이용한 띠폭 선택 방법을 모의실험을 통하여 비교연구 하고자 한다.

AHP를 이용한 장애인고용의 효용성평가 연구 (A Study on The Utility Estimation about Employment of The Disabled)

  • 나혜숙
    • 대한안전경영과학회지
    • /
    • 제10권2호
    • /
    • pp.225-235
    • /
    • 2008
  • It is expected that the change of industrial structure of Knowledge based economy, and service based economy would affect on economic life of physically-challenged person with no exceptions. There have been some former studies which have been misunderstood the employment of disabled due to the declining employment of the disabled and prejudice to the disabled based on biased perspective and public opinion. This study have analyzed the employment conditions of the ordinary workers and disabled workers out of those prejudices and biased opinions. Wage, economic activity ratio, age, educational background and industry those 5 parameters are brought for analyzing the two comparison group. Each parameter have compared based on the statistical data of ordinary workers and disabled workers for past 7 years. Weight between each parameter have been drawn by collecting the experts' opinion using AHP(Analytic Hierarchy Process), and utility of employment of two comparison groups have been estimated through progress inclination of each parameter. Through the estimated outcome, present condition and controversial issues and way of improvement of domestic employment of ordinary workers and the disabled is mentioned.

An Efficient Recursive Total Least Squares Algorithm for Training Multilayer Feedforward Neural Networks

  • Choi Nakjin;Lim Jun-Seok;Sung Koeng-Mo
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.527-530
    • /
    • 2004
  • We present a recursive total least squares (RTLS) algorithm for multilayer feedforward neural networks. So far, recursive least squares (RLS) has been successfully applied to training multilayer feedforward neural networks. But, when input data contain additive noise, the results from RLS could be biased. Such biased results can be avoided by using the recursive total least squares (RTLS) algorithm. The RTLS algorithm described in this paper gives better performance than RLS algorithm over a wide range of SNRs and involves approximately the same computational complexity of $O(N^{2})$.

  • PDF