• 제목/요약/키워드: Feature Evaluation and Selection

검색결과 87건 처리시간 0.023초

바이오 문헌에서의 단백질, 유전자 객체 인식을 위한 특징 추출 (Feature Selection for Bio Named Entity Recognition from Biological Literature)

  • 김태욱;이미정;;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.166-168
    • /
    • 2012
  • 바이오 문헌으로부터의 의미 있는 객체 추출 및 상호작용 관계 추출은 수 많은 바이오 문헌으로부터 유용한 정보를 얻기 위한 필수적인 과정이다. 특히 문헌으로부터 유전자 또는 단백질 이름과 같은 바이오 객체를 정확하게 인지하는 것은 새로운 객체인식의 어려움과 객체를 찾기 위한 특징 패턴의 다양성으로 인해 도전적인 과제로 남아있다. 본 논문에서는 전처리 과정을 거친 문헌 데이터로부터 12개의 의미 있는 속성들을 선택하였다. 선택된 속성에 데이터마이닝 기법중 하나인 속성 추출 기법을 적용하여 객체를 분류하는데 있어 의미 있는 속성들을 추출하였다. 특징 추출 방법과 분류 알고리즘이 분류 성능에 미치는 영향을 평가하기 위해 각 방법의 정확도를 사용하여 분류 성능을 비교였으며, Gain Ratio Attribute Evaluation과 Symmetrical Uncertainty Attribute Evaluation 기법에 의해 추출된 속성이 가장 정확한 분류 성능을 보여주었다.

Analyzing Factors Contributing to Research Performance using Backpropagation Neural Network and Support Vector Machine

  • Ermatita, Ermatita;Sanmorino, Ahmad;Samsuryadi, Samsuryadi;Rini, Dian Palupi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권1호
    • /
    • pp.153-172
    • /
    • 2022
  • In this study, the authors intend to analyze factors contributing to research performance using Backpropagation Neural Network and Support Vector Machine. The analyzing factors contributing to lecturer research performance start from defining the features. The next stage is to collect datasets based on defining features. Then transform the raw dataset into data ready to be processed. After the data is transformed, the next stage is the selection of features. Before the selection of features, the target feature is determined, namely research performance. The selection of features consists of Chi-Square selection (U), and Pearson correlation coefficient (CM). The selection of features produces eight factors contributing to lecturer research performance are Scientific Papers (U: 154.38, CM: 0.79), Number of Citation (U: 95.86, CM: 0.70), Conference (U: 68.67, CM: 0.57), Grade (U: 10.13, CM: 0.29), Grant (U: 35.40, CM: 0.36), IPR (U: 19.81, CM: 0.27), Qualification (U: 2.57, CM: 0.26), and Grant Awardee (U: 2.66, CM: 0.26). To analyze the factors, two data mining classifiers were involved, Backpropagation Neural Networks (BPNN) and Support Vector Machine (SVM). Evaluation of the data mining classifier with an accuracy score for BPNN of 95 percent, and SVM of 92 percent. The essence of this analysis is not to find the highest accuracy score, but rather whether the factors can pass the test phase with the expected results. The findings of this study reveal the factors that have a significant impact on research performance and vice versa.

대심도 복층터널의 다목적 활용을 위한 입지선정 및 통수성능 평가 (A Study on site selection criteria and discharge capability evaluation for the multi-purpose use of a double-deck tunnel in a great depth)

  • 문훈기;길기오;송인철;이혜윤
    • 한국터널지하공간학회 논문집
    • /
    • 제18권3호
    • /
    • pp.283-290
    • /
    • 2016
  • 최근 도시지역의 홍수방지 및 지정체 반복구간의 교통문제 해결을 위해 다목적 대심도 복층터널의 건설이 요구되고 있다. 다목적 복층터널은 주기능인 도로기능 이외에 다목적 기능을 부여해 지하공간의 효율적인 활용을 위해 도입이 절실하다. 본 연구에서는 도심지 치수능력 증진과 도로터널의 기능을 동시에 고려하기 위한 입지선정 조건과 복층터널의 단면 구역별 처리가능한 유량에 대한 기초검토를 수행하였다. 터널의 용도별 입지선정 기준 검토를 통해 복층터널의 다목적 활용을 위한 입지선정 기준 방안을 제시하고 있다. 또한 대심도 복층터널의 다목적 활용성 검토를 위해 계획단면에 대한 홍수시 처리 가능 유량을 검토하였다. 본 연구로부터 복층터널의 입지선정은 다양한 분석을 통한 복합적인 고려가 필요함을 알 수 있다.

Fuzzy AHP를 활용한 스마트폰 선택 및 이용 평가요인에 관한 연구 (A Study of Factors for Evaluating Smartphone Selection and Use using Fuzzy AHP)

  • 황현석;이상훈;김수연
    • 한국산업정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.107-117
    • /
    • 2011
  • 스마트폰은 기존의 피처폰보다 뛰어난 컴퓨팅 성능과 우수한 네트워크 연결성 등의 장점으로 그 사용이 확대되고 있다. 스마트폰 시장의 성장에 따라 수많은 제품들이 출시되고 있으며 사람들은 여러 가지 기준을 통하여 자신에게 적합한 제품을 선택한다. 스마트폰 관련 연구는 최근 점차 늘어나고 있으나 스마트폰의 평가에 관한 연구는 아직 부족한 실정이다. 본 논문은 스마트폰 선택 및 사용 시에 중요하게 고려되는 요인들을 도출하고 요인들 간의 상대적인 중요도를 파악하기 위해 수행되었다. 먼저 문헌조사와 표적집단(focus group) 인터뷰를 통하여 스마트폰의 선택 및 이용에 영향을 미치는 평가요인들을 도출하고, 도출된 평가요인들을 각각 쌍대 비교하여 각 요인에 대한 상대적 중요도를 산출하였다. 응답이 갖는 모호함을 해결하기 위해 퍼지 계층분석과정(Fuzzy AHP: Fuzzy Analytic Hierarchy Process) 기법을 이용하였으며 응답자 중 스마트폰 사용자와 비사용자 집단을 구분하여 그 중요도의 차이를 비교 분석하고, 분석 결과에 따른 실무적 의의를 기술하였다.

컴퓨터 단층 촬영 영상에서의 전이성 척추 종양의 정량적 분류를 위한 라디오믹스 기반의 머신러닝 기법 (Radiomics-based Machine Learning Approach for Quantitative Classification of Spinal Metastases in Computed Tomography)

  • 이은우;임상헌;전지수;강혜원;김영재;전지영;김광기
    • 대한의용생체공학회:의공학회지
    • /
    • 제42권3호
    • /
    • pp.71-79
    • /
    • 2021
  • Currently, the naked eyes-based diagnosis of bone metastases on CT images relies on qualitative assessment. For this reason, there is a great need for a state-of-the-art approach that can assess and follow-up the bone metastases with quantitative biomarker. Radiomics can be used as a biomarker for objective lesion assessment by extracting quantitative numerical values from digital medical images. In this study, therefore, we evaluated the clinical applicability of non-invasive and objective bone metastases computer-aided diagnosis using radiomics-based biomarkers in CT. We employed a total of 21 approaches consist of three-classifiers and seven-feature selection methods to predict bone metastases and select biomarkers. We extracted three-dimensional features from the CT that three groups consisted of osteoblastic, osteolytic, and normal-healthy vertebral bodies. For evaluation, we compared the prediction results of the classifiers with the medical staff's diagnosis results. As a result of the three-class-classification performance evaluation, we demonstrated that the combination of the random forest classifier and the sequential backward selection feature selection approach reached AUC of 0.74 on average. Moreover, we confirmed that 90-percentile, kurtosis, and energy were the features that contributed high in the classification of bone metastases in this approach. We expect that selected quantitative features will be helpful as biomarkers in improving the patient's survival and quality of life.

퍼지의사결정법에 기반한 대학의 컴퓨터교육 만족도 분석 (An analysis of satisfaction index on computer education of university based on Fuzzy Decision Making Method)

  • 류경현;황병곤
    • 한국멀티미디어학회논문지
    • /
    • 제16권4호
    • /
    • pp.502-509
    • /
    • 2013
  • 정보화시대에 대학에서의 교양 컴퓨터교육과정은 컴퓨터에 대한 소양을 쌓고 정보화 사회에 능동적으로 대처할 수 있는 능력을 배양하여 생산성 향상은 물론 국가 간의 경쟁력에서 뒤지지 않게 하는데 목표를 두고 있다. 본 논문에서는 대학생을 대상으로 컴퓨터교육 만족도에 영향을 미치는 결정적인 변인의 발견 및 만족도를 분석한다. 전처리과정으로 자바 기반의 기계 학습 도구인 상관에의한 특성선택을 사용하여 최적의 변인을 선택한다. 그리고 퍼지의사결정법에 기반하여 각 변인의 가중치를 사용하여 최적의 변인을 생성하였다. 본 논문의 연구결과는 컴퓨터교육 만족도 자료의 분석에서 퍼지의사결정법을 제안하고, 재현율과 정밀도 분석에 의해 만족도 평가에 대한 정확성을 확인하였다.

Automated Detection of Retinal Nerve Fiber Layer by Texture-Based Analysis for Glaucoma Evaluation

  • Septiarini, Anindita;Harjoko, Agus;Pulungan, Reza;Ekantini, Retno
    • Healthcare Informatics Research
    • /
    • 제24권4호
    • /
    • pp.335-345
    • /
    • 2018
  • Objectives: The retinal nerve fiber layer (RNFL) is a site of glaucomatous optic neuropathy whose early changes need to be detected because glaucoma is one of the most common causes of blindness. This paper proposes an automated RNFL detection method based on the texture feature by forming a co-occurrence matrix and a backpropagation neural network as the classifier. Methods: We propose two texture features, namely, correlation and autocorrelation based on a co-occurrence matrix. Those features are selected by using a correlation feature selection method. Then the backpropagation neural network is applied as the classifier to implement RNFL detection in a retinal fundus image. Results: We used 40 retinal fundus images as testing data and 160 sub-images (80 showing a normal RNFL and 80 showing RNFL loss) as training data to evaluate the performance of our proposed method. Overall, this work achieved an accuracy of 94.52%. Conclusions: Our results demonstrated that the proposed method achieved a high accuracy, which indicates good performance.

네트워크 트래픽 데이터의 희소 클래스 분류 문제 해결을 위한 전처리 연구 (A Pre-processing Study to Solve the Problem of Rare Class Classification of Network Traffic Data)

  • 류경준;신동일;신동규;박정찬;김진국
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권12호
    • /
    • pp.411-418
    • /
    • 2020
  • 정보보안을 위한 IDS(Intrusion Detection Systems)는 통상적으로 서명기반(signature based) 침입탐지시스템과 이상기반(anomaly-based) 침입 탐지시스템으로 분류한다. 이 중에서도 네트워크에서 발생하는 트래픽 데이터를 기계학습으로 분석하는 이상기반 IDS 연구가 활발하게 진행됐다. 본 논문에서는 공격 유형 학습에 사용되는 데이터에 존재하는 희소 클래스 문제로 인한 성능 저하를 해결하기 위한 전처리 방안에 대해 연구했다. 희소 클래스(Rare Class)와 준 희소 클래스(Semi Rare Class)를 기준으로 데이터를 재구성하여 기계학습의 분류 성능의 개선에 대하여 실험했다. 재구성된 3종의 데이터 세트에 대하여 Wrapper와 Filter 방식을 연이어 적용하는 하이브리드 특징 선택을 수행한 이후에 Quantile Scaler로 정규화를 처리하여 전처리를 완료한다. 준비된 데이터는 DNN(Deep Neural Network) 모델로 학습한 후 TP(True Positive)와 FN(False Negative)를 기준으로 분류 성능을 평가했다. 이 연구를 통해 3종류의 데이터 세트에서 분류 성능이 모두 개선되는 결과를 얻었다.

Android malicious code Classification using Deep Belief Network

  • Shiqi, Luo;Shengwei, Tian;Long, Yu;Jiong, Yu;Hua, Sun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권1호
    • /
    • pp.454-475
    • /
    • 2018
  • This paper presents a novel Android malware classification model planned to classify and categorize Android malicious code at Drebin dataset. The amount of malicious mobile application targeting Android based smartphones has increased rapidly. In this paper, Restricted Boltzmann Machine and Deep Belief Network are used to classify malware into families of Android application. A texture-fingerprint based approach is proposed to extract or detect the feature of malware content. A malware has a unique "image texture" in feature spatial relations. The method uses information on texture image extracted from malicious or benign code, which are mapped to uncompressed gray-scale according to the texture image-based approach. By studying and extracting the implicit features of the API call from a large number of training samples, we get the original dynamic activity features sets. In order to improve the accuracy of classification algorithm on the features selection, on the basis of which, it combines the implicit features of the texture image and API call in malicious code, to train Restricted Boltzmann Machine and Back Propagation. In an evaluation with different malware and benign samples, the experimental results suggest that the usability of this method---using Deep Belief Network to classify Android malware by their texture images and API calls, it detects more than 94% of the malware with few false alarms. Which is higher than shallow machine learning algorithm clearly.

A Study of Evaluation of the Feature from Cooccurrence Matrix and Appropriate Applicable Resolution

  • Seo, Byoung-Jun;Kwon, Oh-Hyoung;Kim, Yong-Il
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 1999년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.8-12
    • /
    • 1999
  • Since the advent of high resolution satellite image, possibilities of applying various human interpretation mechanism to these images have increased. Also many studies about these possibilities in many fields such as computer vision, pattern recognition, artificial intellegence and remote sensing have been done. In this field of these studies, texture is defined as a kind of quantity related to spatial distribution of brightness and tone and also plays an important role for interpretation of images. Especially, methods of obtaining texture by statistical model have been studied intensively. Among these methods, texture measurement method based on cooccurrence matrix is highly estimated because it is easy to calculate texture features compared with other methods. In addition, these results in high classification accuracy when this is applied to satellite images and aerial photos. But in the existing studies using cooccurrence matrix, features have been chosen arbitrarily without considering feature variation. And not enough studies have been implemented for appropriate resolution selection in which cooccurrence matrix can extract texture. Therefore, this study reviews the concept of cooccurrence matrix as a texture measurement method, evaluates usefulness of several features obtained from cooccurrence matrix, and proposes appropriate resolution by investigating variance trend of several features.

  • PDF