• 제목/요약/키워드: dimension reduction method

검색결과 250건 처리시간 0.024초

공통요인분석자혼합모형의 요인점수를 이용한 일반화가법모형 기반 신용평가 (A credit classification method based on generalized additive models using factor scores of mixtures of common factor analyzers)

  • 임수열;백장선
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.235-245
    • /
    • 2012
  • 로지스틱판별분석은 금융 분야에서 유용하게 사용되고 있는 통계적 기법으로 신용평가 시 해석이 쉽고 우수한 분별력으로 많이 활용되고 있지만 종속변수에 대한 설명변수들의 비선형적인 관계를 설명하는 부분에는 한계점이 있다. 일반화가법모형은 로지스틱판별모형의 장점과 함께 종속변수와 설명변수 사이의 비선형적인 관계도 설명할 수 있다. 그러나 연속형 설명변수의 수가 대단히 많은 경우이 두 방법은 모형에 유의한 변수를 선택해야하는 문제점이 있다. 따라서 본 연구에서는 다수의 연속형 설명변수들을 공통요인분석자혼합모형에 의한 차원축소를 통해 변환된 소수의 요인점수들을 일반화가법모형의 새로운 연속형 설명변수로 사용하여 신용분류를 하는 방법을 제시한다. 실제 금융자료를 이용하여 로지스틱판별모형과 일반화가법모형, 그리고 본 연구에서 제안한 방법에 의한 정분류율을 비교한 결과 본 연구에서 제안한 방법의 분류 성능이 더 우수하였다.

잡음 민감성이 개선된 퍼지 주성분 분석 (An Improved Robust Fuzzy Principal Component Analysis)

  • 허경용;우영운;김성훈
    • 한국정보통신학회논문지
    • /
    • 제14권5호
    • /
    • pp.1093-1102
    • /
    • 2010
  • 주성분 분석(PCA)은 데이터의 차원을 줄이면서 최대의 데이터 변이를 보존하는 기법으로 차원 축소나 피처 추출을 위해 널리 사용되고 있다. 하지만 PCA는 잡음에 민감한 단점이 있으며, 이러한 잡음 민감성을 해결하기 위해 여러 가지 PCA 변형이 제안되었다. 그 중 robust fuzzy PCA(RF-PCA)는 퍼지 소속도를 사용하여 잡음의 영향을 효과적으로 줄일 수 있음이 입증되었다. 하지만 RF-PCA 역시 몇 가지 문제점이 있고, 수렴성이 그 중 하나이다. RF-PCA는 소속도와 주성분을 갱신할 때 서로 다른 목적 함수를 사용하므로 수렴 속도가 느리고 구해지는 해가 국부 최적 해임을 보장하지 않는다. 이 논문에서는 RF-PCA의 문제점을 해결하기 위해 하나의 목적 함수를 이용해 소속도와 주성분을 갱신할 수 있는 방법을 제안한다. 제안한 방법, RF-PCA2는 반복 최적화를 이용함으로써 국부 최적해에 수렴함을 보장하며, RF-PCA에 비해 빠른 수렴 속도를 가지고, 잡음 민감성이 줄어든다. 이러한 사실들은 실험 결과를 통해 확인할 수 있다.

SVM을 위한 교사 랭크 정규화 (Supervised Rank Normalization for Support Vector Machines)

  • 이수종;허경용
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권11호
    • /
    • pp.31-38
    • /
    • 2013
  • 특징 정규화는 인식기를 적용하기 이전의 전처리 단계로 특징의 스케일에 따른 오류를 줄이기 위해 널리 사용되고 있다. 하지만 기존 정규화 방법은 특징의 분포를 가정하는 경우가 많으며, 클래스 라벨을 고려하지 않으므로 정규화 결과가 인식률에서 최적임을 보장하지 못하는 문제점이 있다. 이 논문에서는 특징의 분포를 가정하지 않는 랭크 정규화 방법과 클래스 라벨을 사용하는 교사 학습법을 결합한 교사 랭크 정규화 방법을 제안하였다. 제안하는 방법은 데이터의 분포를 바탕으로 특징의 분포를 자동으로 추정하므로 특징의 분포를 가정하지 않으며, 데이터 포인트의 최근접 이웃이 가지는 클래스 라벨을 바탕으로 정규화를 시행하므로 오류의 발생을 최소화할 수 있다. 특히 SVM의 경우 서로 다른 클래스에 속하는 데이터 포인트들이 혼재되어 나타나는 영역에 경계선을 설정하므로 이 영역의 밀도를 줄임으로써 경계선 설정을 보다 용이하게 하고 결과적으로 일반화 오류를 감소시킬 수 있다. 이러한 사실들은 실험 결과를 통해 확인할 수 있다.

악성코드 패밀리 분류를 위한 API 특징 기반 앙상블 모델 학습 (API Feature Based Ensemble Model for Malware Family Classification)

  • 이현종;어성율;황두성
    • 정보보호학회논문지
    • /
    • 제29권3호
    • /
    • pp.531-539
    • /
    • 2019
  • 본 논문에서는 악성코드 패밀리 분류를 위한 훈련 데이터의 특징을 제안하고, 앙상블 모델을 이용한 다중 분류 성능을 분석한다. 악성코드 실행 파일로부터 API와 DLL 데이터를 추출하여 훈련 데이터를 구성하며, 의사 결정 트리기반 Random Forest와 XGBoost 알고리즘으로 모델을 학습한다. 악성코드에서 빈번히 사용되는 API와 DLL 정보를 분석하며, 고차원의 훈련 데이터 특징을 저차원의 특징 표현으로 변환시켜, 악성코드 탐지와 패밀리 분류를 위한 API, API-DLL, DLL-CM 특징을 제안한다. 제안된 특징 선택 방법은 데이터 차원 축소와 빠른 학습의 장점을 제공한다. 성능 비교에서 악성코드 탐지율은 Random Forest가 93.0%, 악성코드 패밀리 분류 정확도는 XGBoost가 92.0%, 그리고 정상코드를 포함하는 테스트 오탐률은 Random Forest와 XGBoost가 3.5%이다.

2D-MELPP: A two dimensional matrix exponential based extension of locality preserving projections for dimensional reduction

  • Xiong, Zixun;Wan, Minghua;Xue, Rui;Yang, Guowei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권9호
    • /
    • pp.2991-3007
    • /
    • 2022
  • Two dimensional locality preserving projections (2D-LPP) is an improved algorithm of 2D image to solve the small sample size (SSS) problems which locality preserving projections (LPP) meets. It's able to find the low dimension manifold mapping that not only preserves local information but also detects manifold embedded in original data spaces. However, 2D-LPP is simple and elegant. So, inspired by the comparison experiments between two dimensional linear discriminant analysis (2D-LDA) and linear discriminant analysis (LDA) which indicated that matrix based methods don't always perform better even when training samples are limited, we surmise 2D-LPP may meet the same limitation as 2D-LDA and propose a novel matrix exponential method to enhance the performance of 2D-LPP. 2D-MELPP is equivalent to employing distance diffusion mapping to transform original images into a new space, and margins between labels are broadened, which is beneficial for solving classification problems. Nonetheless, the computational time complexity of 2D-MELPP is extremely high. In this paper, we replace some of matrix multiplications with multiple multiplications to save the memory cost and provide an efficient way for solving 2D-MELPP. We test it on public databases: random 3D data set, ORL, AR face database and Polyu Palmprint database and compare it with other 2D methods like 2D-LDA, 2D-LPP and 1D methods like LPP and exponential locality preserving projections (ELPP), finding it outperforms than others in recognition accuracy. We also compare different dimensions of projection vector and record the cost time on the ORL, AR face database and Polyu Palmprint database. The experiment results above proves that our advanced algorithm has a better performance on 3 independent public databases.

실시간 이미지 획득을 통한 pRBFNNs 기반 얼굴인식 시스템 설계 (A Design on Face Recognition System Based on pRBFNNs by Obtaining Real Time Image)

  • 오성권;석진욱;김기상;김현기
    • 제어로봇시스템학회논문지
    • /
    • 제16권12호
    • /
    • pp.1150-1158
    • /
    • 2010
  • In this study, the Polynomial-based Radial Basis Function Neural Networks is proposed as one of the recognition part of overall face recognition system that consists of two parts such as the preprocessing part and recognition part. The design methodology and procedure of the proposed pRBFNNs are presented to obtain the solution to high-dimensional pattern recognition problem. First, in preprocessing part, we use a CCD camera to obtain a picture frame in real-time. By using histogram equalization method, we can partially enhance the distorted image influenced by natural as well as artificial illumination. We use an AdaBoost algorithm proposed by Viola and Jones, which is exploited for the detection of facial image area between face and non-facial image area. As the feature extraction algorithm, PCA method is used. In this study, the PCA method, which is a feature extraction algorithm, is used to carry out the dimension reduction of facial image area formed by high-dimensional information. Secondly, we use pRBFNNs to identify the ID by recognizing unique pattern of each person. The proposed pRBFNNs architecture consists of three functional modules such as the condition part, the conclusion part, and the inference part as fuzzy rules formed in 'If-then' format. In the condition part of fuzzy rules, input space is partitioned with Fuzzy C-Means clustering. In the conclusion part of rules, the connection weight of pRBFNNs is represented as three kinds of polynomials such as constant, linear, and quadratic. Coefficients of connection weight identified with back-propagation using gradient descent method. The output of pRBFNNs model is obtained by fuzzy inference method in the inference part of fuzzy rules. The essential design parameters (including learning rate, momentum coefficient and fuzzification coefficient) of the networks are optimized by means of the Particle Swarm Optimization. The proposed pRBFNNs are applied to real-time face recognition system and then demonstrated from the viewpoint of output performance and recognition rate.

최적 연관 속성 규칙을 이용한 비명시적 단백질 상호작용의 예측 (Prediction of Implicit Protein - Protein Interaction Using Optimal Associative Feature Rule)

  • 엄재홍;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권4호
    • /
    • pp.365-377
    • /
    • 2006
  • 단백질들은 서로 다른 단백질들과 상호작용 하거나 복합물을 형성함으로써 생물학적으로 중요한 기능을 한다고 알려져 있다. 때문에 대부분의 세포작용에 있어 중요한 역할을 하는 단백질 상호작용의 분석 및 예측에 대한 연구는 여러 연구그룹으로부터 풍부한 데이타가 산출되고 있는 현(現) 게놈시대에서 또 하나의 중요한 이슈가 되고 있다. 본 논문에서는 효모(Saccharomyces cerevisiae)에 대해 공개되어있는 단백질 상호작용 데이타들에서 속성들 간의 연관을 통해 유추 가능한 잠재적 단백질 상호작용들을 예측하기 위한 연관속성 마이닝 방법을 제시한다. 단백질의 속성들 중 연속값을 가지는 속성값들은 최대상호 의존성에 기반을 두어 이산화 하였으며, 정보이론기반 속성선택 알고리즘을 사용하여 단백질들 간의 상호작용 예측을 위해 고려되는 단백질의 속성(attribute) 수 증가에 따른 속성차원문제를 극복하도록 하였다. 속성들 간의 연관성 발견은 데이타마이닝 분야에서 사용되는 연관규칙 발견(association rule discovery) 방법을 사용하였다 논문에서 제안한 방법은 발견된 연관규칙을 통한 단백질 상호작용 예측문제에 있어 최대 약 96.5%의 예측 정확도를 보였으며 속성필터링을 통하여 속성필터링을 하지 않는 기존의 방법에 비해 최대 약 29.4% 연관규칙 발견속도 향상을 보였다.

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.

선체 유공보강판의 최종강도 거동에 관한 연구 (A Study on the Ultimate Strength Behavior for Ship Perforated Stiffened Plate)

  • 고재용;이준교;박주신;배동균
    • 해양환경안전학회:학술대회논문집
    • /
    • 해양환경안전학회 2005년도 춘계학술발표회
    • /
    • pp.141-146
    • /
    • 2005
  • 선체는 기본적으로 판부재들의 조합으로 구성되어 있으며 이들중 상당수는 유공판(Perforated plate)이다. 선체에 설치된 유공판으로서는 선체 상갑판 해치(하역시설로 사용), 선저부의 거더와 플로어(중량경감과 선박 건조 및 검사시 통로확보용), 다이어프램(중량경감 및 파이프 관통의 목적)둥이 있다. 이들 유공판에 하중이 작용하면 좌굴과 최종강도 특성이 크게 변화할 뿐만 아니라 수반되는 면내응력도 재 분포하게 되어 심각한 강도문제를 야기 시킬 수 있다. 실적선에서는 유공주위에 스티프너 보강을 통하여 취약한 좌굴강도 보완하고 있으며, 유공을 고려한 최적의 유공보강판 모델을 적용한 좌굴강도 및 최종강도를 파악할 필요성이 대두시 되고 있다. 이와 같은 측면에서 각 조선소에서는 각국 선급들이 제시하는 유공판의 좌굴설계식을 사용하여 강도계산을 하고 있으나 임의의 유공크기에 대찬 좌굴강도 및 최종강도 평가법을 찾기란 매우 어려운 일이다. 본 연구에서는 실선에서 사용중인 유공보강판의 모델을 조사하여 비선형유한요소법을 적용하여 면내 압축하중이 작용하는 경우에 대해서 유공의 크기와 웹 치수를 변화시켜가며, 최종강도 시리즈 해석을 수행하고 압축최종강도에 미치는 영향을 검토하였다.

  • PDF

유한요소법을 이용한 2급 복합레진 와동의 비교 연구 (A STUDY ON CLASS II COMPOSITE RESIN CAVITY USING FINITE ELEMENT STRESS ANALYSIS)

  • 임영일;여인호;엄정문
    • Restorative Dentistry and Endodontics
    • /
    • 제22권1호
    • /
    • pp.428-446
    • /
    • 1997
  • Restorative procedures can lead to weakening tooth due to reduction and alteration of tooth structure. It is essential to prevent fractures to conserve tooth. The resistance to fracture of the restored tooth may be influenced by many factors, among these are the cavity dimension and the physical properties of the restorative material. The placement of direct composite resin restorations has generally been found to have a strengthening effect on the prepared teeth. It is the purpose of this investigation to study the relationship between the cavity isthmus and the fracture resistance of a tooth in composite resin restorations. In this study, MO cavity was prepared on maxillary first premolar. Three dimensional finite element models were made by serial photographic method and isthmus(1/4, 1/3, 1/2 of intercuspal distance) were varied. Two types of model(B and R model) were developed. B model was assumed perfect bonding between the restoration and cavity wall and R model was left unfilled. A load of 500N was applied vertically at the first node from the lingual slope of the buccal cusp tip. This study analysed the displacement, 1 and 2 direction normal stress and strain with FEM software ABAQUS Version 5.2 and hardware IRIS 4D/310 VGX Work-station. The results were as follows : 1. Displacement of buccal cusp in R model occurred and increased as widening of the cavity, and displacement in B model was little and not influenced by cavity width. 2. There was a significant decrease of stress resulting in increase of fracture resistance in B model when compared with R model. 3. With the increase of the isthmus width, B model showed no change in the stress and strain. In R model, the stress and strain increased both in the area of buccal-pulpal line angle and the buccal side of marginal ridge, therefore the possibility of crack increased. 4. The stress and strain were distributed evenly on the tooth in B model, but in R model, were concentrated on the buccal side of the distal marginal ridge and buccal-pulpal line angle, therefore the possibility of fracture increased.

  • PDF