• 제목/요약/키워드: Classifier Combination

검색결과 117건 처리시간 0.028초

Identification of Chinese Event Types Based on Local Feature Selection and Explicit Positive & Negative Feature Combination

  • Tan, Hongye;Zhao, Tiejun;Wang, Haochang;Hong, Wan-Pyo
    • Journal of information and communication convergence engineering
    • /
    • 제5권3호
    • /
    • pp.233-238
    • /
    • 2007
  • An approach to identify Chinese event types is proposed in this paper which combines a good feature selection policy and a Maximum Entropy (ME) model. The approach not only effectively alleviates the problem that classifier performs poorly on the small and difficult types, but improve overall performance. Experiments on the ACE2005 corpus show that performance is satisfying with the 83.5% macro - average F measure. The main characters and ideas of the approach are: (1) Optimal feature set is built for each type according to local feature selection, which fully ensures the performance of each type. (2) Positive and negative features are explicitly discriminated and combined by using one - sided metrics, which makes use of both features' advantages. (3) Wrapper methods are used to search new features and evaluate the various feature subsets to obtain the optimal feature subset.

다중 분포 학습 모델을 위한 Haar-like Feature와 Decision Tree를 이용한 학습 알고리즘 (Learning Algorithm for Multiple Distribution Data using Haar-like Feature and Decision Tree)

  • 곽주현;원일용;이창훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권1호
    • /
    • pp.43-48
    • /
    • 2013
  • Adaboost 알고리즘은 얼굴인식을 위한 Haar-like feature들을 이용하기 위해 가장 널리 쓰이고 있는 알고리즘이다. 매우 빠르며 효율적인 성능을 보이고 있으며 하나의 모델이미지가 존재하는 단일분포 데이터에 대해 매우 효율적이다. 그러나 정면 얼굴과 측면 얼굴을 혼합한 인식 등 둘 이상의 모델이미지를 가진 다중 분포모델에 대해서는 그 성능이 저하된다. 이는 단일 학습 알고리즘의 선형결합에 의존하기 때문에 생기는 현상이며 그 응용범위의 한계를 지니게 된다. 본 연구에서는 이를 해결하기 위한 제안으로서 Decision Tree를 Harr-like Feature와 결합하는 기법을 제안한다. Decision Tree를 사용 함으로서 보다 넓은 분야의 문제를 해결하기 위해 기존의 Decision Tree를 Harr-like Feature에 적합하도록 개선한 HDCT라고 하는 Harr-like Feature를 활용한 Decision Tree를 제안하였으며 이것의 성능을 Adaboost와 비교 평가하였다.

사전과 말뭉치를 이용한 한국어 단어 중의성 해소 (Korean Word Sense Disambiguation using Dictionary and Corpus)

  • 정한조;박병화
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.1-13
    • /
    • 2015
  • 빅데이터 및 오피니언 마이닝 분야가 대두됨에 따라 정보 검색/추출, 특히 비정형 데이터에서의 정보 검색/추출 기술의 중요성이 나날이 부각되어지고 있다. 또한 정보 검색 분야에서는 이용자의 의도에 맞는 결과를 제공할 수 있는 검색엔진의 성능향상을 위한 다양한 연구들이 진행되고 있다. 이러한 정보 검색/추출 분야에서 자연어처리 기술은 비정형 데이터 분석/처리 분야에서 중요한 기술이고, 자연어처리에 있어서 하나의 단어가 여러개의 모호한 의미를 가질 수 있는 단어 중의성 문제는 자연어처리의 성능을 향상시키기 위해 우선적으로 해결해야하는 문제점들의 하나이다. 본 연구는 단어 중의성 해소 방법에 사용될 수 있는 말뭉치를 많은 시간과 노력이 요구되는 수동적인 방법이 아닌, 사전들의 예제를 활용하여 자동적으로 생성할 수 있는 방법을 소개한다. 즉, 기존의 수동적인 방법으로 의미 태깅된 세종말뭉치에 표준국어대사전의 예제를 자동적으로 태깅하여 결합한 말뭉치를 사용한 단어 중의성 해소 방법을 소개한다. 표준국어대사전에서 단어 중의성 해소의 주요 대상인 전체 명사 (265,655개) 중에 중의성 해소의 대상이 되는 중의어 (29,868개)의 각 센스 (93,522개)와 연관된 속담, 용례 문장 (56,914개)들을 결합 말뭉치에 추가하였다. 품사 및 센스가 같이 태깅된 세종말뭉치의 약 79만개의 문장과 표준국어대사전의 약 5.7만개의 문장을 각각 또는 병합하여 교차검증을 사용하여 실험을 진행하였다. 실험 결과는 결합 말뭉치를 사용하였을 때 정확도와 재현율에 있어서 향상된 결과가 발견되었다. 본 연구의 결과는 인터넷 검색엔진 등의 검색결과의 성능향상과 오피니언 마이닝, 텍스트 마이닝과 관련한 자연어 분석/처리에 있어서 문장의 내용을 보다 명확히 파악하는데 도움을 줄 수 있을 것으로 기대되어진다.

지형학적 인자를 이용한 광역 홍수범람 위험지역 분석 (Analysis of large-scale flood inundation area using optimal topographic factors)

  • 이경상;이대업;정성호;이기하
    • 한국수자원학회논문집
    • /
    • 제51권6호
    • /
    • pp.481-490
    • /
    • 2018
  • 최근 기후변화와 이상기후의 영향으로 인한 홍수재해의 시 공간적 패턴의 변화가 복잡해짐에 따라 홍수범람 예측은 점점 어려워지고 있다. 이러한 기상이변에 따른 홍수피해를 예방하고 대응하기 위한 비구조적 대책으로 홍수위험등급 및 범람범위 등의 정보를 포함하고 있는 홍수위험지도의 작성이 필요하다. 실제로 고정밀도 홍수위험지도를 작성하기 위해서는 1차적으로 지형, 지질, 토지피복, 기상 등의 자료를 기반으로 강우-유출-범람해석을 통해 침수면적 및 침수깊이 등 범람 정보를 획득해야 되며, 2차적으로 피해액 산정을 위해 사회 경제와 관련된 다양한 DB를 필요로 한다. 하지만 개발도상국에서는 이러한 자료가 부족하고, 일부지역에서는 자료자체를 획득할 수가 없어 홍수위험지도 제작이 불가능하거나 그 정확도가 매우 낮은 실정이다. 본 연구에서는 ASTER 또는 SRTM과 같은 범용 지형자료로부터 주요 지형학적 인자를 선정하고, 선형이진분류법(Liner binary classifiers)과 ROC분석(Receiver Operation Characteristics)을 사용하여 실제 홍수유역을 유사하게 모의하는 최적 지형학적 인자를 도출하고, 이를 기반으로 광역 홍수범람지도를 작성하는 방안을 제시한다. 본 연구에서 제시하는 방법론의 정확도 검증을 위해 북한(2007), 방글라데시(2007), 인도네시아(2010), 태국(2011), 미얀마(2015) 5개국의 대규모 홍수범람에 대해 적용하였다. 실제 홍수범람 영상정보에서 획득된 침수면적과의 공간적 비교 검토 결과, 최저(38%, 방글라데시), 최고(78%)으로 평균적으로 약 60%의 정확도를 나타내는 것으로 분석되었다. 본 연구에서 제시하는 지형학적 인자 기반의 홍수범람지도 작성방법은 미계측유역에 대해서도 DEM만을 사용하여 홍수위험 지역을 쉽게 구분할 수 있다는 장점을 가지고 있어 1 2차원 범람해석 모형의 적용이 어려운 대유역에 대해 홍수범람 우려지역에 대한 공간정보를 제공해줄 수 있을 것으로 판단된다.

감성판별을 위한 생체신호기반 특징선택 분류기 설계 (The Design of Feature Selection Classifier based on Physiological Signal for Emotion Detection)

  • 이지은;유선국
    • 전자공학회논문지
    • /
    • 제50권11호
    • /
    • pp.206-216
    • /
    • 2013
  • 감성은 학습, 행동, 의사결정, 상호대화를 포함한 인간의 일상생활에 중요한 요소이다. 본 논문에서는 시스템의 복잡도를 줄이기 위하여 생체신호로부터 최소한의 중요한 특징만을 추출하여 사용하는 감성 분류기를 설계하고자 한다. 생체신호는 맥파, 피부온도, 피부전도도, 뇌파신호(전두엽, 두정엽)를 사용하였으며, 4가지 감정(보통, 슬픔, 공포, 행복)은 영화 관람을 통하여 유도하였다. 측정한 생체신호로부터 추출한 24개의 특징으로부터 최적의 특징 집합의 결정은 서포트벡터머신 기반 적합도 함수를 사용하는 유전알고리즘을 적용하였다. 최적의 4감정 분류 정확도는 96.4%이었으며, 서포트벡터머신만을 사용하였을 경우보다 17% 높았다. 선택된 최소에러 특징은 맥파 심박변이도의 평균, NN50, 맥파 유도 맥파 전달 시간의 평균, 피부전도도의 평균과 두정엽 뇌파의 ${\delta}$, ${\beta}$ 주파수 대역에너지였다. 실험을 통하여 두정엽 뇌파, 맥파, 피부전도도의 조합이 고정밀 감정 장비에 적합하였으며, 79% 성능을 보인 맥파와 피부전도도의 조합이 간단한 감성장비에 적절하게 적용할 수 있다.

순환 아키텍쳐 및 하이퍼파라미터 최적화를 이용한 데이터 기반 군사 동작 판별 알고리즘 (A Data-driven Classifier for Motion Detection of Soldiers on the Battlefield using Recurrent Architectures and Hyperparameter Optimization)

  • 김준호;채건주;박재민;박경원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.107-119
    • /
    • 2023
  • 군인의 동작 및 운동 상태를 인식하는 기술은 웨어러블 테크놀로지와 인공지능의 결합으로 최근 대두되어 병력 관리의 패러다임을 바꿀 기술로 주목받고 있다. 이때 훈련 상황에서의 평가 및 솔루션 제공, 전투 상황에서의 효율적 모니터링 기능을 의도한대로 제공하기 위해서는 상태 판별의 정확도가 매우 높은 수준으로 유지되어야만 한다. 하지만 입력 데이터가 시계열 또는 시퀀스로 주어지는 경우, 기존의 피드포워드 신경망으로는 분류 성능을 극대화하는데 한계가 발생한다. 전장에서의 군사 동작 인식을 위해 다뤄지는 인간의 행동양식 데이터(3축 가속도 및 3축 각속도)는 시의존적 특성의 분석이 요구되기 때문에, 본 논문은 순환 신경망인 LSTM(Long-short Term Memory) 네트워크를 활용하여 취득 데이터의 이동 양상 및 순서 의존성을 파악하고 여덟 가지의 대표적 군사 동작(Sitting, Standing, Walking, Running, Ascending, Descending, Low Crawl, High Crawl)을 분류하는 고성능 인공지능 모델을 제안한다. 이때, 학습 조건 및 모델 변수는 그 정확도에 결정적인 영향을 끼치지만 인간의 수동적 조정이 필요해 비용 비효율적이고 최적의 값을 보장하지 못한다. 본 논문은 기계 스스로 일반화 성능이 극대화된 조건들을 취득할 수 있도록 베이지안 최적화를 활용해 하이퍼파라미터를 최적화한다. 그 결과, 최종 아키텍쳐는 학습 가능한 파라미터의 개수가 유사한 기존의 인공 신경망과 비교해서 오차율이 62.56% 감소할 수 있었으며, 최종적으로 98.39%의 정확도로 군사 동작 인식 기능을 구현할 수 있었다.

Performance of Prediction Models for Diagnosing Severe Aortic Stenosis Based on Aortic Valve Calcium on Cardiac Computed Tomography: Incorporation of Radiomics and Machine Learning

  • Nam gyu Kang;Young Joo Suh;Kyunghwa Han;Young Jin Kim;Byoung Wook Choi
    • Korean Journal of Radiology
    • /
    • 제22권3호
    • /
    • pp.334-343
    • /
    • 2021
  • Objective: We aimed to develop a prediction model for diagnosing severe aortic stenosis (AS) using computed tomography (CT) radiomics features of aortic valve calcium (AVC) and machine learning (ML) algorithms. Materials and Methods: We retrospectively enrolled 408 patients who underwent cardiac CT between March 2010 and August 2017 and had echocardiographic examinations (240 patients with severe AS on echocardiography [the severe AS group] and 168 patients without severe AS [the non-severe AS group]). Data were divided into a training set (312 patients) and a validation set (96 patients). Using non-contrast-enhanced cardiac CT scans, AVC was segmented, and 128 radiomics features for AVC were extracted. After feature selection was performed with three ML algorithms (least absolute shrinkage and selection operator [LASSO], random forests [RFs], and eXtreme Gradient Boosting [XGBoost]), model classifiers for diagnosing severe AS on echocardiography were developed in combination with three different model classifier methods (logistic regression, RF, and XGBoost). The performance (c-index) of each radiomics prediction model was compared with predictions based on AVC volume and score. Results: The radiomics scores derived from LASSO were significantly different between the severe AS and non-severe AS groups in the validation set (median, 1.563 vs. 0.197, respectively, p < 0.001). A radiomics prediction model based on feature selection by LASSO + model classifier by XGBoost showed the highest c-index of 0.921 (95% confidence interval [CI], 0.869-0.973) in the validation set. Compared to prediction models based on AVC volume and score (c-indexes of 0.894 [95% CI, 0.815-0.948] and 0.899 [95% CI, 0.820-0.951], respectively), eight and three of the nine radiomics prediction models showed higher discrimination abilities for severe AS. However, the differences were not statistically significant (p > 0.05 for all). Conclusion: Models based on the radiomics features of AVC and ML algorithms may perform well for diagnosing severe AS, but the added value compared to AVC volume and score should be investigated further.

유전자 알고리즘 및 국소 적응 오퍼레이션 기반의 의료 진단 문제 자동화 기법 연구 (Medical Diagnosis Problem Solving Based on the Combination of Genetic Algorithms and Local Adaptive Operations)

  • 이기광;한창희
    • 지능정보연구
    • /
    • 제14권2호
    • /
    • pp.193-206
    • /
    • 2008
  • 의료 진단 문제는 기정의된 특성치들로 표현되는 환자의 상태 데이터로부터 병의 유무를 판단하는 일종의 분류 문제로 간주할 수 있다. 본 연구는 혼용 유전자 알고리즘 기반의 분류방법을 도입함으로써 의료 진단 문제와 같은 다차원의 패턴 분류 문제를 해결할 수 있는 방안을 제안하고 있다. 일반적으로 분류 문제는 데이터 패턴에 존재하는 여러 클래스 간 구분경계를 생성하는 접근방법을 사용하는데, 이를 위해 본 연구에서는 일단의 영역 에이전트들을 도입하여 이들을 유전자 알고리즘 및 국소 적응조작을 혼용함으로써 데이터 패턴에 적응하도록 유도하고 있다. 일반적인 유전자 알고리즘의 진화단계를 거친 에이전트들에 적용되는 국소 적응조작은 영역 에이전트의 확장, 회피 및 재배치로 이루어지며, 각 에이전트의 적합도에 따라 이들 중 하나가 선택되어 해당 에이전트에 적용된다. 제안된 의료 진단용 분류 방법은 UCI 데이터베이스에 있는 잘 알려진 의료 데이터, 즉 간, 당뇨, 유방암 관련 진단 문제에 적용하여 검증하였다. 그 결과, 기존의 대표적인 분류기법인 최단거리이웃방법(the nearest neighbor), C4.5 알고리즘에 의한 의사 결정트리(decision tree) 및 신경망보다 우수한 진단 수행도를 나타내었다.

  • PDF

APEX 기반 침입 탐지 시스템 개발에 관한 연구 : (주)제이드 솔류션과 공동 연구 (A Study on Developing Intrusion Detection System Using APEX : A Collaborative Research Project with Jade Solution Company)

  • 김병주
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권1호
    • /
    • pp.38-45
    • /
    • 2017
  • 정보 처리 기술의 컴퓨터 및 네트워크 의존도가 심화됨에 따라 컴퓨터 및 네트워크에 대한 침입 사례가 갈수록 증가하고 있다. 시스템 및 네트워크의 침입을 방지하기 위하여 호스트와 네트워크 기반 침입차단시스템(방화벽 등)이 개발되었지만 기존의 규칙 기반의 침입차단시스템만으로는 보안 관리에 많은 어려움이 있다. 이러한 이유로 인해 시스템 및 네트워크 자원에 대한 침입을 실시간으로 탐지하고 이에 대처하는 침입탐지시스템 개발에 대한 요구가 증가하고 있다. 본 논문에서는 비선형 자료에도 적용 가능하며 수렴성이 보장된 실시간 특징 추출 방법으로 APEX 알고리즘과 점증적 LS-SVM 분류기를 결합한 실시간 침입탐지 시스템을 개발하였다. 일반적으로 실시간 처리 방식은 메모리의 효율성이 좋고 학습 자료의 추가를 허용하는 장점이 있지만 일괄처리 방식에 비해 정확도가 떨어지는 단점이 있다. 따라서 제안한 시스템은 정확도 면에서도 일괄 처리 방식과 비슷한 성능을 나타내고 있어 상용화가 가능한 시스템이다.

알츠하이머 병의 검출을 위한 ML-SVM, PCA, VBM, GMM을 결합한 융합적 성능 비교 (Convergence performance comparison using combination of ML-SVM, PCA, VBM and GMM for detection of AD)

  • 사우라르 알람;권구락
    • 한국융합학회논문지
    • /
    • 제7권4호
    • /
    • pp.1-7
    • /
    • 2016
  • 구조적 MRI 영상은 여러 단 변량과 다변량 방법을 위해 그레이 메터 (GM), 화이트 메터 (WM), 뇌척수액 (CSF) 세션화 과정을 하고 난후 형태계측학적 특징을 추출하기 위해 사용한다. 새로운 접근 방법은 매우 가벼운 알츠하이머 병에서 가벼운 알츠하이머병의 진단을 위해 적용된다. 간이정신상태검사에 따른 형태계측학적 특징과 가우시안 복합 모델 파라미터를 결합하여 정상인으로부터 알츠하이머 병 환자로 분류하는 방법을 제안한다. 결합한 특징은 주성분 분석 기법을 이용한 고차원의 저주를 제거한 후 다중 커널 SVM 분류기에 공급한다. 제안한 진단 방법의 실험적 결과는 90%이상의 특성도와 고민감도에 따라 다중 커널 SVM을 가진 층화 정확도가 96%까지 최대 산출한다.