• 제목/요약/키워드: one class classification

검색결과 350건 처리시간 0.025초

Denoising Auto Encoder 기법을 활용한 진동 데이터 전처리 및 성능비교 (Vibration Data Denoising and Performance Comparison Using Denoising Auto Encoder Method)

  • 장준교;노천명;김성수;이순섭;이재철
    • 해양환경안전학회지
    • /
    • 제27권7호
    • /
    • pp.1088-1097
    • /
    • 2021
  • 기계 장비의 진동 데이터는 필연적으로 노이즈를 포함하고 있다. 이러한 노이즈는 기계 장비의 유지보수를 진행하는데 악영향을 끼친다. 그에 따라 데이터의 노이즈를 얼마나 효과적으로 제거해주냐에 따라 학습 모델의 성능을 좌우한다. 본 논문에서는 시계열 데이터를 전처리 함에 있어 특성추출 과정을 포함하지 않는 Denoising Auto Encoder 기법을 활용하여 데이터의 노이즈를 제거했다. 또한 기계 신호 처리에 널리 사용되는 Wavelet Transform과 성능 비교를 진행했다. 성능비교는 고장 탐지율을 계산하여 진행했으며 보다 정확한 비교를 위해 분류 성능 평가기준 중 하나인 F-1 Score를 계산하여 성능 비교를 진행했다. 고장을 탐지하는 과정에서는 One-Class SVM 기법을 활용하여 고장 데이터를 탐지했다. 성능 비교 결과 고장 진단율과 오차율 측면에서 Denoising Auto Encoder 기법이 Wavelet Transform 기법에 비해 보다 좋은 성능을 나타냈다.

레이저유도 플라즈마 분광법을 이용한 폐금속 분류를 위한 추정 연성정보 기반의 최빈 분류 기술 (Estimated Soft Information based Most Probable Classification Scheme for Sorting Metal Scraps with Laser-induced Breakdown Spectroscopy)

  • 김에덴;장혜민;신성호;정성호;황의석
    • 자원리싸이클링
    • /
    • 제27권1호
    • /
    • pp.84-91
    • /
    • 2018
  • 본 연구에서는 레이저유도 플라즈마 분광법(Laser induced breakdown spectroscopy, LIBS) 기반의 금속 종류별 스펙트럼 데이터를 이용하여 연성정보(soft information)를 추정하고 최빈 클래스로 분류하는(most probable classification) 금속 분류 방법을 제안한다. 폐금속 자원과 같이 사전 정보가 없는 금속을 분류하는 경우 몇 가지 핵심 구성성분에 대한 정량 분석을 통해서 클래스를 추정하는 방법이 효율적이다. 이에 따라 부분 집합 기반의 부분최소제곱회귀법(Partial Least Square Regression, PLSR)을 이용하여 LIBS 검출 스펙트럼으로부터 각 성분의 농도를 독립적으로 신뢰성 있게 추정하고, 인증 표준물질(CRM) 등 알려진 모집합의 농도정보에 기반하여 최고 확률을 갖도록 분류하는 기술을 제안한다. 샘플 스펙트럼들의 다변량 분석을 통해서 여러 성분의 추정 농도를 다변량 정규 분포를 갖는 것으로 가정하고 통합(Joint) 추정 연성정보를 구할 수 있으며, 이를 활용한 최빈 확률 검출이나 추가적인 사전 정보의 결합 등을 통해서 분류 성능을 향상시킬 수 있다. 제안된 기술의 평가를 위해서 9가지 종류의 CRM 금속시료의 LIBS 스펙트럼 데이터를 사용하며, 부분 집합 기반의 PLSR 농도 추정 기술을 기반으로 단변량 혹은 다변량 정규 분포 연성 정보추정을 통해 미지 금속의 검출과 연성 정보의 검출 등을 테스트 하였다. 또한 방사형 차트(Radar chart)를 이용하여 추정된 농도와 획득한 연성정보를 효과적으로 시각화함으로써 기존 라이브러리에 포함된 부분 집합의 금속과 비교하여 해당 금속과의 유사성을 그래프를 통해 추정할 수 있다.

순위 비교를 기반으로 하는 다양한 유전자 개수로 이루어진 암 분류 결정 규칙의 생성 (Generating Rank-Comparison Decision Rules with Variable Number of Genes for Cancer Classification)

  • 윤영미;변상재;박상현
    • 정보처리학회논문지D
    • /
    • 제15D권6호
    • /
    • pp.767-776
    • /
    • 2008
  • 마이크로어레이 기술은 최근 실험적 분자생물학 분야에서 활발히 사용되고 있는 기술이다. 마이크로어레이 데이터는 한 번의 실험으로 수 만개의 유전자에 대한 발현값을 얻을 수 있으므로, 여러 질병의 발현형질을 연구하는데 매우 유용하게 사용된다. 마이크로어레이 데이터의 문제점은 참여하는 유전자의 수에 비해 참여하는 샘플(생물조직샘플)의 수가 매우 적고, 분류분석 기법을 사용하여 얻어진 분류자의 해석이 어렵다는 점이다. 본 연구에서는 위의 문제점을 해결하고자, 샘플 내 순위를 이용하여 동일한 생물학적 목적으로 수행된 공개 마이크로어레이 데이터를 통합하고, 순위 비교를 기반으로 하는 다양한 유전자 개수로 이루어진 암 분류 결정 규칙들로 이루어진 분류자를 제안한다. 본 분류자는 k개의 규칙으로 이루어진 앙상블 방법을 기반으로 하며, 하나의 규칙은 최대N개의 유전자, 관련유전자간의 순위비교 관계식, 판별클래스로 이루어져 있다. 하나의 규칙에 참여하는 유전자의 수를 다양하게 함으로써 좀더 신뢰성 높은 분류자를 생성할 수 있다. 또한 본 분류자는 생물학적 해석이용이하며, 분류자를 구성하는 유전자를 명확히 식별할 수 있고, 총 개수가 많지 않으므로 임상환경에서의 사용가능성도 생각해 볼 수 있다.

일개 대학병원의 소아혈액종양 간호단위의 간호업무량 측정 (Calculation of nursing care hours in a pediatric oncology nursing unit)

  • 김영미
    • 간호행정학회지
    • /
    • 제5권3호
    • /
    • pp.513-524
    • /
    • 1999
  • The shortage of nursing personnel was become one of the most serious problems in operating pediatric oncology nursing unit which was the first pediatric oncology nursing unit in Korea. The purpose of this study was to estimate the optimal number of nursing personnel by calculating nursing care hours. The subjects were 13 staff nurses and inpatients of pediatric oncology nursing unit at Seoul National University Hospital during the period of May 20, 1996, to June 2, 1996. The number of nurses' duty was 132, the number of patients treated was 1288 for these 2 weeks. The tools used for this study were pediatric patient classification indexes and direct & indirect care indexes. Each nurse measured the time that they spent for their activities by self record under the supervision of their nurse manager. The method used to calculate the number of nursing personnel was multiplication of the average number of nursing care hours per patient per day with the number of patients. Percentage, average, t-test, F-test were used for data analysis. The results of this study were as follows : 1) The distribution of patient class : Class I & II none, Class III 86.8%. Class IV 12.9% 2) Direct nursing care hours for a patient per shift according to patient classification: Class III : 27.64 minutes, Class IV : 54.64 minutes The average direct nursing service hours for a patient per shift(3 shift) was 31.54 minutes(94.62 m/day). The average indirect nursing service hours for each patient per duty(3 shift) is 21.3 minutes (63. 91 m/day). 3) The average nursing hours for a patient per duty was 52.80 minutes(2.64h/day). 4) The group of administering medications in direct care activities showed the highest percentage (38.9%). Checking vital signs among observation took the most time am.ong each direct care activity (6.88 minutes for a patient per duty). 5) Charting took the most time of each indirect care activity(52.53 minutes/ duty/nurse). 6) The average personal time per duty is 29.40 minutes, which 'was below 30 minutes of this hospital regulations. 7) The average nursing hours that a nurse provided for a duty was 8.60 hours, which meant that a nurse worked 1.10 hours overtime. 8) Standardizing to a 33 bed to a unit, 17 nurses were needed at the present nursing level.

  • PDF

주기성을 갖는 입출력 데이터의 연관성 분석을 통한 회귀 모델 학습 방법 (Learning Method for Regression Model by Analysis of Relationship Between Input and Output Data with Periodicity)

  • 김혜진;박예슬;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권7호
    • /
    • pp.299-306
    • /
    • 2022
  • 최근 로봇이나 설비, 회로 등에 센서 내장이 보편화 되고, 측정된 센서 데이터를 학습하여 기기의 고장을 진단하기 위한 연구가 활발하게 수행되고 있다. 이러한 고장 진단 연구는 고장 상황이나 종류를 예측하기 위한 분류(Classification) 모델 개발과 정량적으로 고장 상황을 예측하기 위한 회귀(Regression) 모델 개발로 구분된다. 분류 모델의 경우, 단순히 고장이나 결함의 유무(Class)를 확인하는 반면, 회귀 모델은 무수히 많은 수치 중에 하나의 값(Value)을 예측해야 하므로 학습 난이도가 더 높다. 즉, 입력과 출력을 대응시켜 고장을 예측을 할 때, 유사한 입력값이 동일한 출력을 낸다고 결정하기 어려운 불규칙한 상황이 다수 존재하기 때문이다. 따라서 본 논문에서는 주기성을 지닌 입출력 데이터에 초점을 맞추어, 입출력 관계를 분석하고, 슬라이딩 윈도우 기반으로 입력 데이터를 패턴화 하여 입출력 데이터 간의 규칙성을 확보하도록 한다. 제안하는 방법을 적용하기 위해, 본 연구에서는 MMC(Modular Multilevel Converter) 회로 시스템으로부터 주기성을 지닌 전류, 온도 데이터를 수집하여 ANN을 이용하여 학습을 진행하였다. 실험 결과, 한 주기의 2% 이상의 윈도우를 적용하였을 때, 적합도 97% 이상의 성능이 확보될 수 있음을 확인하였다.

공간 통계를 이용한 원격탐사 화상 분류의 공간적 불확실성 분포 추정 (Assessing Spatial Uncertainty Distributions in Classification of Remote Sensing Imagery using Spatial Statistics)

  • 박노욱;지광훈;권병두
    • 대한원격탐사학회지
    • /
    • 제20권6호
    • /
    • pp.383-396
    • /
    • 2004
  • 이 논문은 원격탐사 화상 분류에서 공간적 불확실성 분포를 얻기 위해 공간 통계를 적용하였다. 분류 항목 할당과 참조 자료와 연계된 각각의 불확실성 표현을 위해 2가지 정량적 방법을 제안하였다. 우선 분류 항목 할당에 따른 불확실성 표현을 위해 3가지 정량적 지수를 제안하였다. 그리고 참조 자료와 분류 결과를 결합하고 이와 연계된 불확실성 혹은 정확성 분포를 얼기 위해 지구통계학적 시뮬레이션 기법을 적용하였다. 다중 센서 원격탐사 화상을 이용한 감독 토지 피복 분류 실험을 수행하여 제안 방법을 예시하고, 적용시 제안점을 논의하였다. 실험 결과, 이 논문에서 제시한 방법론을 통해 분류 결과의 해석과 평가를 위한 부가적인 정보추출이 가능하였으며, 제시 방법론의 검증을 위한 다양한 자료에의 적용이 필요한 것으로 판단된다.

Karhunen-Loeve 근사 방법과 Elastic Graph Matching을 병합한 얼굴 인식 (Face Recognition using Karhunen-Loeve projection and Elastic Graph Matching)

  • 이형지;이완수;정재호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.231-234
    • /
    • 2001
  • This paper proposes a face recognition technique that effectively combines elastic graph matching (EGM) and Fisherface algorithm. EGM as one of dynamic lint architecture uses not only face-shape but also the gray information of image, and Fisherface algorithm as a class specific method is robust about variations such as lighting direction and facial expression. In the proposed face recognition adopting the above two methods, the linear projection per node of an image graph reduces dimensionality of labeled graph vector and provides a feature space to be used effectively for the classification. In comparison with a conventional method, the proposed approach could obtain satisfactory results in the perspectives of recognition rates and speeds. Especially, we could get maximum recognition rate of 99.3% by leaving-one-out method for the experiments with the Yale Face Databases.

  • PDF

PCA-SVM을 이용한 Human Detection을 위한 HOG-Family 특징 비교 (Evaluation of HOG-Family Features for Human Detection using PCA-SVM)

  • ;이칠우
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.504-509
    • /
    • 2008
  • Support Vector Machine (SVM) is one of powerful learning machine and has been applied to varying task with generally acceptable performance. The success of SVM for classification tasks in one domain is affected by features which represent the instance of specific class. Given the representative and discriminative features, SVM learning will give good generalization and consequently we can obtain good classifier. In this paper, we will assess the problem of feature choices for human detection tasks and measure the performance of each feature. Here we will consider HOG-family feature. As a natural extension of SVM, we combine SVM with Principal Component Analysis (PCA) to reduce dimension of features while retaining most of discriminative feature vectors.

  • PDF

A Feature Vector Selection Method for Cancer Classification

  • Yun, Zheng;Keong, Kwoh-Chee
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.23-28
    • /
    • 2005
  • The high-dimensionality and insufficiency of gene expression profiles and proteomic profiles makes feature selection become a critical step in efficiently building accurate models for cancer problems based on such data sets. In this paper, we use a method, called Discrete Function Learning algorithm, to find discriminatory feature vectors based on information theory. The target feature vectors contain all or most information (in terms of entropy) of the class attribute. Two data sets are selected to validate our approach, one leukemia subtype gene expression data set and one ovarian cancer proteomic data set. The experimental results show that the our method generalizes well when applied to these insufficient and high-dimensional data sets. Furthermore, the obtained classifiers are highly understandable and accurate.

  • PDF

분광혼합분석 기법을 이용한 탄천유역 불투수율 평가 (Estimating Impervious Surface Fraction of Tanchon Watershed Using Spectral Analysis)

  • 조홍래;정종철
    • 대한원격탐사학회지
    • /
    • 제21권6호
    • /
    • pp.457-468
    • /
    • 2005
  • 도시화에 따른 불투수 지표면의 증가는 도시환경에 부정적인 영향을 미치게 된다. 따라서 도시 내 불투수 지역의 시공간적 변화 사항을 탐색하고 정량화하는 작업은 도시환경을 연구함에 있어 무엇보다 중요한 일이라 할 수 있다 지난 시기 도시지역의 불투수 지표면을 탐색하는 방법으로는 전통적인 영상분류 기법이 많이 사용되었다. 그러나 기존의 전통적인 영상분류 기법은 영상을 구성하는 각 셀이 지표면에 존재하는 다양한 객체들의 분광특성이 혼합된 결과임에도 불구하고 단 하나의 클래스로만 구분하는 단점을 가진다. 또한 불투수 지표면의 비율을 산정하기 위해서는 영상분류 후 각 분류항목에 불투수율을 할당해야하는 2중의 노력이 필요하며, 각 클래스에 단일한 불투수율을 지정해야만 하는 단점을 갖는다. 본 논문에서는 기존의 영상 분류방법이 갖는 이러한 단점을 보완하고자 불투수 지표면의 비율을 산정하기 위해 분광혼합분석 (spectral mixture analysis) 기법을 이용하였다. 분광혼합분석 기법을 적용하기 위해 식생, 토양, low albedo, high albedo 등 4가지 요소를 엔드멤버로 선택하였으며, 불투수율은 low albedo와 high albedo의 합으로 산정하였다. 대상 연구지역은 지난 십여년 동안 급격한 도시화가 진행된 탄천유역을 선정하였으며, 1988, 1994, 2001년의 Landsat 영상을 이용하여 신도시 건설에 따른 불투수 지표면의 변화율을 검토하였다. 분석결과 탄천유역의 불투수율은 88년 $15.6\%$, 94년 $20.1\%$, 2001년 $24\%$로 증가된 것으로 나타났다. 결론적으로 도시 불투수율을 분석 시 분광혼합분석 기법을 적용할 경우 추가적인 노력 없이 비교적 정확한 불투수율을 얻을 수 있음을 확인할 수 있었다.