• 제목/요약/키워드: Missing-feature

검색결과 79건 처리시간 0.029초

Fuzzy Classification Method for Processing Incomplete Dataset

  • Woo, Young-Woon;Lee, Kwang-Eui;Han, Soo-Whan
    • Journal of information and communication convergence engineering
    • /
    • 제8권4호
    • /
    • pp.383-386
    • /
    • 2010
  • Pattern classification is one of the most important topics for machine learning research fields. However incomplete data appear frequently in real world problems and also show low learning rate in classification models. There have been many researches for handling such incomplete data, but most of the researches are focusing on training stages. In this paper, we proposed two classification methods for incomplete data using triangular shaped fuzzy membership functions. In the proposed methods, missing data in incomplete feature vectors are inferred, learned and applied to the proposed classifier using triangular shaped fuzzy membership functions. In the experiment, we verified that the proposed methods show higher classification rate than a conventional method.

효율적인 화상자료 처리와 시각 시스템과 CAD시스템의 인터페이스에 관한 연구 (A Study on Efficient Image Processing and CAD-Vision System Interface)

  • 박진우;김기동
    • 대한산업공학회지
    • /
    • 제18권2호
    • /
    • pp.11-22
    • /
    • 1992
  • Up to now, most researches on production automation have concentrated on local automation, e. g. CAD, CAM, robotics, etc. However, to achieve total automation it is required to link each local modules such as CAD, CAM into a unified and integrated system. One such missing link is between CAD and computer vision system. This thesis is an attempt to link the gap between CAD and computer vision system. In this paper, we propose algorithms that carry out edge detection, thinning and pruning from the image data of manufactured parts, which are obtained from video camera and then transmitted to computer. We also propose a feature extraction and surface determination algorithm which extract informations from the image data. The informations are compatible to IGES CAD data. In addition, we suggest a methodology to reduce search efforts for CAD data bases. The methodology is based on graph submatching algorithm in GEFG(Generalized Edge Face Graph) representation for each part.

  • PDF

A Study on the Prediction of Community Smart Pension Intention Based on Decision Tree Algorithm

  • Liu, Lijuan;Min, Byung-Won
    • International Journal of Contents
    • /
    • 제17권4호
    • /
    • pp.79-90
    • /
    • 2021
  • With the deepening of population aging, pension has become an urgent problem in most countries. Community smart pension can effectively resolve the problem of traditional pension, as well as meet the personalized and multi-level needs of the elderly. To predict the pension intention of the elderly in the community more accurately, this paper uses the decision tree classification method to classify the pension data. After missing value processing, normalization, discretization and data specification, the discretized sample data set is obtained. Then, by comparing the information gain and information gain rate of sample data features, the feature ranking is determined, and the C4.5 decision tree model is established. The model performs well in accuracy, precision, recall, AUC and other indicators under the condition of 10-fold cross-validation, and the precision was 89.5%, which can provide the certain basis for government decision-making.

Default Prediction of Automobile Credit Based on Support Vector Machine

  • Chen, Ying;Zhang, Ruirui
    • Journal of Information Processing Systems
    • /
    • 제17권1호
    • /
    • pp.75-88
    • /
    • 2021
  • Automobile credit business has developed rapidly in recent years, and corresponding default phenomena occur frequently. Credit default will bring great losses to automobile financial institutions. Therefore, the successful prediction of automobile credit default is of great significance. Firstly, the missing values are deleted, then the random forest is used for feature selection, and then the sample data are randomly grouped. Finally, six prediction models of support vector machine (SVM), random forest and k-nearest neighbor (KNN), logistic, decision tree, and artificial neural network (ANN) are constructed. The results show that these six machine learning models can be used to predict the default of automobile credit. Among these six models, the accuracy of decision tree is 0.79, which is the highest, but the comprehensive performance of SVM is the best. And random grouping can improve the efficiency of model operation to a certain extent, especially SVM.

머신러닝 자동화를 위한 개발 환경에 관한 연구 (A Study on Development Environments for Machine Learning)

  • 김동길;박용순;박래정;정태윤
    • 대한임베디드공학회논문지
    • /
    • 제15권6호
    • /
    • pp.307-316
    • /
    • 2020
  • Machine learning model data is highly affected by performance. preprocessing is needed to enable analysis of various types of data, such as letters, numbers, and special characters. This paper proposes a development environment that aims to process categorical and continuous data according to the type of missing values in stage 1, implementing the function of selecting the best performing algorithm in stage 2 and automating the process of checking model performance in stage 3. Using this model, machine learning models can be created without prior knowledge of data preprocessing.

시간흐름을 고려한 특징 추출과 군집 분석을 이용한 헬스 리스크 관리 (Health Risk Management using Feature Extraction and Cluster Analysis considering Time Flow)

  • 강지수;정경용;정호일
    • 한국융합학회논문지
    • /
    • 제12권1호
    • /
    • pp.99-104
    • /
    • 2021
  • 본 논문에서는 시간 흐름을 고려한 특징추출과 군집분석을 이용한 헬스 리스크 관리를 제안한다. 제안하는 방법은 세단계로 진행한다. 첫 번째는 전처리 및 특징추출 단계이다. 이는 웨어러블 디바이스를 이용하여 라이프로그를 수집하여 불완전데이터, 에러, 잡음, 모순된 데이터를 제거하며 결측 값을 처리한다. 그 다음 특징추출을 위해 주성분 분석을 통해 중요 변수를 선택하고, 상관계수와 공분산을 통해 데이터 간의 관계와 유사한 데이터들의 분류를 진행한다. 또한 라이프로그에서 추출한 특징을 분석하기 위해 시간의 흐름을 고려하여 K-means 알고리즘을 통해 동적 군집을 진행한다. 새로운 데이터는 오차 제곱합의 증가분을 기반으로 유사성 거리 측정 방법을 통해 군집을 진행하고, 시간의 흐름을 고려하여 군집에 대한 정보를 추출한다. 따라서 특징 군집을 통해 헬스 의사결정 시스템을 이용하여 신체적 특성, 생활습관, 질병여부, 헬스케어 이벤트 발생위험, 예상 정도 등의 요소를 통해 리스크를 관리할 수 있다. 성능평가는 Precision, Recall, F-measure을 사용하여 제안하는 방법과 퍼지방법, 커널기반 방법을 비교한다. 평가결과 제안하는 방법이 우수하게 평가된다. 따라서 제안하는 방법을 통해 유병자와의 유사도를 이용하여 정확한 사용자의 잠재적 건강 위험을 예측 및 적절한 관리가 가능하다.

정사투영된 2차원 영상과 복원된 3차원 형상의 기하학적 관계 분석 (Analysis of Geometrical Relations of 2D Affine-Projection Images and Its 3D Shape Reconstruction)

  • 고성식;티티진;히로미츠 하마
    • 대한전자공학회논문지SP
    • /
    • 제44권4호통권316호
    • /
    • pp.1-7
    • /
    • 2007
  • 본 논문은 정사투영 카메라로부터 얻어진 2차원 영상으로부터 복원된 3차원 형상과의 기하학적 관계를 분석한다 본 연구의 목적은 2차원과 3차원 관계를 기하학적으로 분석함으로서 잡음에 강인한 3차원 형상 복원에 기여하기 위함이다. 만약 3차원 형상 복원 시 특징점이 손실되지 않고 잡음이 존재하지 않는다면 3차원 형상복원은 고유치 행렬인수분해로 정확하게 얻을 수 있다. 그렇지만 실제 촬영된 피사체의 일부가 보이지 않는 오클루션 또는 낮은 해상도 등의 영향으로 인해, 피사체의 특징점 일부가 손실된 경우는 고유치 행렬인수분해의 계산적 문제가 발생되어 정확한 3차원 복원을 할 수 없게 된다. 더욱이 추출된 특징 점에 잡음이 포함될 경우는 복원된 3차원 형상 역시 그 섭동 영향을 받게 된다. 본 연구는 이러한 잡음환경에서도 손실된 특징 점을 정확히 유추하기 위해 2차원과 3차원 사이의 기하학적 특성을 분석하는데 포커스 한다.

텍스쳐 감지를 이용한 화소값 기울기 필터 및 중간값 필터 기반의 비디오 시퀀스 디인터레이싱 (Intensity Gradient filter and Median Filter based Video Sequence Deinterlacing Using Texture Detection)

  • 강근화;구수일;정제창
    • 한국통신학회논문지
    • /
    • 제34권4C호
    • /
    • pp.371-379
    • /
    • 2009
  • 본 논문에서는 텍스쳐 감지를 이용한 화소값 기울기 필터 및 중간값 필터 기반의 비디오 시퀀스 디인터레이싱 알고리듬을 제안한다. 먼저 보간 할 픽셀의 주변 픽셀들을 이용하여 현재 보간 할 영역이 텍스쳐가 존재하는 영역인지 아니면 평탄한 영역인지를 판단한다. 제안하는 알고리듬에서는 보간 할 영역이 평탄한 영역으로 판단되면 중간값 필터를 이용하여 보간을 하고, 텍스쳐 영역으로 판단되면 화소값 기울기 필터를 이용하여 보간을 하게 된다. 그러므로 현재의 보간 할 영역은 두 개의 카테고리로 분류 할 수 있다. 제안하는 알고리듬은 상황에 맞게 적응적으로 보간을 수행하므로 좀 더 선명하고 정확한 영상을 얻을 수 있다. 그리고 여러 가지 CIF 동영상에 대한 실험 결과는 제안하는 알고리듬이 기존의 알고리듬 보다 객관적, 주관적으로 우수함을 보여준다.

신용평가에서 로지스틱 회귀를 이용한 미결정자 추론 (Undecided inference using logistic regression for credit evaluation)

  • 홍종선;정민섭
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권2호
    • /
    • pp.149-157
    • /
    • 2011
  • 본 연구는 신용평가 과정에서 발생하는 미결정자를 결측자료 문제로 간주하여 MAR와 MNAR 가정 하에서 추론한다. MAR 가정에서 미결정자 추론은 결정자들에 대한 로지스틱 회귀모형의 회귀 계수벡터를 이용하여 미결정자의 부도 확률을 구한 후 결정자의 부도확률과 비교하여 미결정자의 미래 상태를 판단한다. 그리고 MNAR 가정에서의 미결정자 추론은 특성변수가 추가한 로지스틱 모형으로부터 미결정자의 부도확률을 구하고 미결정자를 예측하는 방법을 제안하였다. 두 종류의 실제 자료에 대하여 모의실험을 한 결과, MAR 가정에서 미결정자의 비율이 증가하더라도 원자료의 오분류율과 추론한 결과 차이가 없으며, MNAR 가정에서는 추가적인 변수를 고려하여 미결정자를 추정하였기 때문에 미결정자의 오분류율이 MAR 가정에서의 오분류율보다 감소하고 나아가 전체에서 미결정자가 차지하는 비율이 증가함에 따라 전체의 오분류율이 더욱 감소함을 발견하였다.

스마트 컨트랙트 기반의 유실 애완동물 구조 시스템 개선 (An Improvement of missing pet rescue system based on Smart Contract)

  • 권혁동;김현준;장경배;서화정
    • 한국정보통신학회논문지
    • /
    • 제24권6호
    • /
    • pp.786-794
    • /
    • 2020
  • 동물의 체계적인 관리를 위해 동물등록제가 제정되었다. 애완동물을 키우는 주인은 동물등록을 통해 더 큰 책임감을 가지며 공식적인 복지도 제공받게 되었다. 동물등록제가 제공하는 이점 중 하나는 유실 동물 발생 시, 정보 조회를 통해 빠르고 안전하게 주인에게 돌려보내는 시스템을 마련했다는 것이다. 하지만 주인을 찾아주기 위한 정보 조회 과정에서 현행 법령과 상충하는 부분이 발생한다. 이로 인해 제도가 원활하게 동작하지 않게 되었다. 본 논문에서는 스마트 컨트랙트를 통해 등록된 정보를 일부만 배포 및 조회하는 것으로 유실 동물을 찾는 기능을 원활하게 동작할 것을 제안한다. 제안 기법은 정보를 일부만 공개하는 것으로 법령과 상충되는 부분을 제거하며, 정보 접근성을 높여 정보 조회의 가용 인력을 증원한다. 또한 기존 동물등록제와 호환이 되도록 RFID 값을 통해 조회하는 부분은 그대로 사용하며, 스마트 컨트랙트 쿼리를 통해 정보 조회를 하는 것으로 정확한 정보를 빠르게 획득할 수 있도록 한다. 마지막으로 기존 기법이 개선하지 못한 부분과 제안 기법을 비교하여 개선점을 확인한다.