• 제목/요약/키워드: 분류기

검색결과 4,091건 처리시간 0.036초

DNA 마이크로어레이 데이터의 분류를 위한 종분화 진화 기반의 최적 다중 분류기 (Multiple Optimal Classifiers based on Speciated Evolution for Classifying DNA Microarray Data)

  • 박찬호;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.724-726
    • /
    • 2004
  • DNA 마이크로어레이 기술의 발전은 암의 조기 발견 및 예후 예측을 가능하게 해주었으며, 이와 관련된 많은 연구가 진행 중이다. 마이크로어레이 데이터의 분류에서 관련 유전자들의 선택은 필수적이며, 유전자 선택방법은 분류기와 짝을 이루어 특징-분류기를 형성한다. 이제까지 여러 가지 특징-분류기를 사용하여 마이크로어레이 데이터를 분류해 왔지만, 알고리즘의 한계와 데이터의 결함 등으로 인하여 최적의 특징-분류기를 찾기 어려웠다. 따라서 앙상블 분류기를 이용하여 높은 분류성능을 얻는 방법이 시도되어왔으며. 최적의 것을 찾기 위하여 유전자 알고리즘이 사용되기도 했다. 본 논문에서는 이를 발전시켜 다양한 최적의 앙상블을 생성하기 위해 종분화 방법을 사용한다. 림프종 암 데이터에 대하여 leave-one-out cross-validation을 적용한 결과, 제안한 방법으로 다양한 최적해를 탐색하는 것을 확인할 수 있었다.

  • PDF

지역 기반 분류기의 앙상블 학습 (Ensemble Learning of Region Based Classifiers)

  • 최성하;이병우;양지훈
    • 정보처리학회논문지B
    • /
    • 제14B권4호
    • /
    • pp.303-310
    • /
    • 2007
  • 기계학습에서 분류기틀의 집합으로 구성된 앙상블 분류기는 단일 분류기에 비해 정확도가 높다는 것이 입증되어왔다. 본 논문에서는 새로운 앙상블 학습으로서 데이터의 지역 기반 분류기들의 앙상블 학습을 제시하여 기존의 앙상블 학습과의 비교를 통해 성능을 검증하고자 한다. 지역 기반 분류기의 앙상블 학습은 데이터의 분포가 지역에 따라 다르다는 점에 착안하여 학습 데이터를 분할하여 해당하는 지역에 기반을 둔 분류기들을 만들어 나간다. 이렇게 만들어진 분류기들로부터 지역에 따라 가중치를 둔 투표를 적용하여 앙상블 방법을 이끌어낸다. 본 논문에서 제시한 앙상블 분류기의 성능평가를 위해 단일 분류기와 기존의 앙상블 분류기인 배깅과 부스팅 등을 UCI Machine Learning Repository에 있는 11개의 데이터 셋으로 정확도 비교를 하였다. 그 결과 새로운 앙상블 방법이 기본 분류기로 나이브 베이즈와 SVM을 사용했을 때 다른 방법보다 좋은 성능을 보이는 것을 알 수 있었다.

어휘 유사 문장 판별을 위한 BERT모델의 학습자료 구축 (Methodology of Developing Train Set for BERT's Sentence Similarity Classification with Lexical Mismatch)

  • 정재환;김동준;이우철;이연수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.265-271
    • /
    • 2019
  • 본 논문은 어휘가 비슷한 문장들을 효과적으로 분류하는 BERT 기반 유사 문장 분류기의 학습 자료 구성 방법을 제안한다. 기존의 유사 문장 분류기는 문장의 의미와 상관 없이 각 문장에서 출현한 어휘의 유사도를 기준으로 분류하였다. 이는 학습 자료 내의 유사 문장 쌍들이 유사하지 않은 문장 쌍들보다 어휘 유사도가 높기 때문이다. 따라서, 본 논문은 어휘 유사도가 높은 유사 의미 문장 쌍들과 어휘 유사도가 높지 않은 의미 문장 쌍들을 학습 자료에 추가하여 BERT 유사 문장 분류기를 학습하여 전체 분류 성능을 크게 향상시켰다. 이는 문장의 의미를 결정짓는 단어들과 그렇지 않은 단어들을 유사 문장 분류기가 학습하였기 때문이다. 제안하는 학습 데이터 구축 방법을 기반으로 학습된 BERT 유사 문장 분류기들의 학습된 self-attention weight들을 비교 분석하여 BERT 내부에서 어떤 변화가 발생하였는지 확인하였다.

  • PDF

SVM 분류기를 통한 심실세동 검출 (SVM Classifier for the Detection of Ventricular Fibrillation)

  • 송미혜;이전;조성필;이경중
    • 전자공학회논문지SC
    • /
    • 제42권5호
    • /
    • pp.27-34
    • /
    • 2005
  • 심실세동은 심장의 무질서한 전기적 활동으로 인해 심근 수축이 동시에 이뤄지지 않게 되어 급성심장사에 이르게 하는 부정맥이다. 본 연구에서는 이러한 심실세동 검출을 위해 적은 양의 학습 데이터만으로 좋은 분류 성능을 보이는 SVM(Support Vector Machine) 분류기 기반의 심실세동 검출 알고리즘을 제안하였다. 심전도 신호로부터 SVM 분류기에 입력할 입력 특징을 추출하기 위하여 웨이브렛 변환기반의 대역통과 필터링, R점 검출, 입력 특징 추출구간 설정의 전처리 과정을 수행하였으며 입력 특징으로는 리듬 기반의 정보 및 웨이브렛 변환 계수를 선택하였다. SVM 다원분류기는 정상리듬(NSR) 분류기, 심실 세동과 유사한 심실빈맥(VT) 분류기, 심실세동(VF) 분류기 그리고 그 외 부정맥 분류기로 구성하였다. SVM 분류기의 파라미터 C값과 ${\alpha}$값은 실험을 통하여 최고 성능을 나타내는 C=10, ${\alpha}=1$을 선택하였다. SVM 다원 분류기를 통한 정상리듬, 심실빈맥 심실세동의 검출 평균값은 98.39%, 96.92%, 99.88%의 우수한 검출 성능을 나타냈다. 본 연구에서 제안된 동일 입력특징을 사용하여 SVM 분류기의 심실세동 검출 결과와 다층퍼셉트론 신경망 및 퍼지추론 방법에 의한 결과를 비교하였으며 SVM 분류기가 비슷하거나 우수한 결과를 보였다. 또한 기존 다른 알고리즘에 비하여도 우수한 결과를 보임으로써 제안된 입력 특징을 통한 SVM 분류기 기반의 심실세동 검출이 유용함을 확인할 수 있었다.

신경망을 결합한 다중 SVM 분류기 (A Multiple SVM Classifier Combined With Neural Networks)

  • 고재필;김승태;김은주;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.163-165
    • /
    • 2001
  • 최근 기계학습 분야에서 커널머신을 이용한 대표적 학습기로서 Support Vector Machine(SVM)이 주목받고 있다. SVM은 통계학자인 Vapnik에 의해 제안된 것으로 통계적 학습이론에 기반 하여 뛰어난 일반화 성능을 보여준다. 그러나. SVM은 2클래tm 분류기이므로 일반적인 다중 클래스 패턴인식 문제에 적용할 수 없다. 본 논문에서는 이를 해결하기 위해 SVM을 신경망과 결합하여 다중 클래스 분류기로 확장하는 방법을 새롭게 제안한다. 제안하는 분류기의 성능을 비교하기 위하여 ORL얼굴 데이터를 이용하여 제안하는 분류기와 기존의 대표적인 다중 SVM, 신경망, PCA를 적응한 얼굴인식 실험을 수행하였다. 실험결과 제안하는 분류기를 이용한 얼굴인식률이 기존의 다중 SVM을 이용한 경우보다 3%, 신경망을 이용한 경우보다 6% 높은 수치를 보였다.

  • PDF

암 분류를 위한 기계학습 분류기의 성능평가 (Performance Evaluation of Machine Learning Classifiers for Cancer Classification)

  • 원홍희;조성배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.405-408
    • /
    • 2002
  • Microarray 기술의 발전으로 많은 양의 유전자 정보를 얻게 되어 암의 정확한 분류와 진단에 대한 기대가 커지고 있다. 암을 정확하게 분류하기 위해서는 추출된 유전자에 많은 잡음이 들어가기 때문에 암과 관련이 있는 유전자만을 추출할 필요가 있다. 본 논문에서는 여러 가지 유전자 추출방법과 다양한 분류기의 성능을 체계적으로 평가하기 위하여, 세 가지 벤치마크 암 데이터에 대하여 실험하여 보았다. 또한 분류 성능을 향상시키기 위하여 분류기를 적절하게 결합한 결과, 결합된 분류기의 성능을 확인해볼 수 있었다.

  • PDF

UT 신호형상 인식을 위한 Intelligence Package 개발과 Austenitic Stainless Steel Welding부 결함 분류에 관한 적용 연구 (Intelligence Package Development for UT Signal Pattern Recognition and Application to Classification of Defects in Austenitic Stainless Steel Weld)

  • 이강용;김준섭
    • 비파괴검사학회지
    • /
    • 제15권4호
    • /
    • pp.531-539
    • /
    • 1996
  • 본 연구에서는 초음파 신호형상인식법을 이용하여 용접부의 인공 결함을 분류하기 위한 연구를 실시하였다. 이를 위해 신호처리 및 특징 변수를 추출할 때에 많은 사용자 정의 변수를 가지는 신호 형상 인식 패키지를 개발하였으며 디지탈 신호처리, 특징 변수 추출, 특징 변수의 선택, 분류기 선정 등의 과정을 일괄적으로 처리하였다. 특히, 선형 분류기, 경험적 Bayesian 분류기 등의 통계적 분류기와 신경회로망 분류기를 함께 사용하여 비교, 검토하였다. 이에 관한 적용 연구로 노치와 구멍으로 이루어진 인공 결함을 분류하였다. 그 결과 인공결함 분류에서 높은 인식률을 얻었으며, 특히 적절히 학습 시켰을 경우 신경회로망 분류기가 통계적 분류기에 비하여 인식률 면에서 유리하였다.

  • PDF

항공 라이다 데이터로부터 데이터마이닝 도구 WEKA를 이용한 지형 분류기 제작 지원 시스템 (A Topographical Classifier Development Support System Cooperating with Data Mining Tool WEKA from Airborne LiDAR Data)

  • 이성규;이호준;성철웅;박창후;조우석;김유성
    • 한국측량학회지
    • /
    • 제28권1호
    • /
    • pp.133-142
    • /
    • 2010
  • 국토의 구성 및 변화를 파악하기 위해서 항공 라이다 데이터의 효율적 처리를 통해 정확하게 지표의 유행(land-cover type)을 분류할 수 있는 지능형 지형 분류기(intelligent topographical classifier)의 필요성이 증대되고 있다. 본 연구에서는 정확하고 효율적인 지형 분류기 개발을 용이하게 하기 위해 데이터마이닝 도구인 WEKA를 연동시켜 항공 라이다 데이터를 가공처리하고 다양한 데이터마이닝 기법을 활용한 비교 실험을 통해 정확성이 높은 지형 분류기 제작을 지원하는 소프트웨어 시스템을 개발하였다. 본 연구에서 개발한 지형 분류기 제작 지원 시스템은 항공 영상 이미지 위에 라이다 데이터를 중첩시키는 기능, 효율적인 처리를 위한 타일링 기능, 부분 영역의 3차원 시각화 기능, 타일의 특정 추출 기능, WEKA 입력 자동 생생 기능, 분류 모델의 분류 규칙 집합을 C++ 프로그램으로 자동 코딩하여 분류기로 변환하는 기능, 타일별 지형 분류 결과 표시 기능 등이 구현되어 있다. 또한, 연동된 WEKA틀 이용해서는 분별력이 높은 특정 정보 선정 기능, 다양한 분류 기법을 적용한 지형 분류 모델 생성 기능, 지형 분류 규칙 집합 생생 기능 등을 활용하여 지형 분류기 제작을 지원할 수 있다. 따라서 항공 라이다 데이터를 이용하여 지형의 유형을 분류하는 지능형 지형 분류기를 개발하고자 하는 사용자는 본 연구에서 개발한 지형 분류기 제작 지원 시스템을 활용하여 해당 지형의 특성에 맞고 분류기 개발 목적에 부합하는 지형 분류기를 용이하게 효과적으로 개발할 수 있다.

적응형 신호 형상 인식 프로그램 개발과 AE법에 의한 용접부 결함 분류에 관한 적용 연구 (Development of Adaptive Signal Pattern Recognition Program and Application to Classification of Defects in Weld Zone by AE Method)

  • 이강용;임장묵;김준섭
    • 비파괴검사학회지
    • /
    • 제16권1호
    • /
    • pp.34-45
    • /
    • 1996
  • 음향 방출 신호의 수집 및 처리, 특징값 추출 및 선택, 분류기 설계 및 검증 과정 등을 수행할 수 있는 신호 형상 인식 프로그램을 개발하고, 이를 오스테나이트계 STS304 용접부의 인공 결함 분류 연구에 적용하였다. 특히 분류기로는 선형 함수 분류기, 경험적 Bayesian 분류기, 신경 회로망 분류기를 사용하였고, 센서는 광대역 센서와 공진형 센서를 사용하여 분류기간의 비교와 센서간의 차이점을 검토하였다. 그 결과 신경 회로망 분류기가 다른 분류기에 비해 높은 인식률을 주었고, 공진형 센서보다는 광대역 센서를 통해 받은 신호가 더 높은 인식률을 주었다.

  • PDF

효과적인 얼굴 인식을 위한 인식기 선택 (Classifier Selection for Efficient Face Recognition)

  • 남미영;이필규
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.453-456
    • /
    • 2005
  • 본 논문에서는 얼굴의 속성에 따라 각각의 알고리즘의 인식 성능이 달라지는 점에 착안해서, 다양한 얼굴 데이터를 클러스터링한 후 가장 효과적인 알고리즘을 선택적으로 사용하여 인식 성능을 높이는 방법을 제안하였다. 인식기 융합 문제는 인식결과를 결정짓는 문제에서 많이 사용하는 방식이며, Kuncheva는 데이터를 기준을 두어 영역별로 구분한 후. 각 데이터 영역에 맞는 분류기가 어떠한 것인가를 찾는 방법을 제안하였다. 분류기 여러개를 선택하여 사용할 경우, 어떻게 결과를 융합할것 인가에 대한 문제는 제시하지 않고 있다. 단지. 각 영역에 대하여, 어떠한 분류기를 사용하는 것이 좋을 것인가에 대한 문제만을 해결한다. 어떠한 영역의 데이터는 여러개의 분류기를 적용해도 된다는 결론하에, 각 분류기가 유사한 성능을 나타내므로, 어떠한 분류기를 사용하든 무관하다는 방향으로 전개한다. 따라서 본 논문에서는 각 데이터 영역별로 어떠한 분류기가 좋을 것인지 판단하며, 각 분류기에서 나온 결과값들을 융합하는 방법에 대하여 제안한다.

  • PDF