• 제목/요약/키워드: 이진 분류

검색결과 605건 처리시간 0.025초

Light-weight Classification Model for Android Malware through the Dimensional Reduction of API Call Sequence using PCA

  • Jeon, Dong-Ha;Lee, Soo-Jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권11호
    • /
    • pp.123-130
    • /
    • 2022
  • 최근 API Call 정보를 기반으로 안드로이드 악성코드를 탐지 및 분류하는 연구가 활발하게 진행되고 있다. 그러나 API Call 기반의 악성코드 분류는 방대한 데이터 양과 높은 차원 특성으로 인해 악성코드 분석과 학습 모델 구축 과정에서 과도한 시간과 자원이 소모된다는 심각한 제한사항을 가진다. 이에 본 연구에서는 방대한 API Call 정보를 포함하고 있는 CICAndMal2020 데이터세트를 대상으로 PCA(Principal Component Analysis, 주성분분석)를 사용하여 차원을 대폭 축소시킨 후 LightGBM, Random Forest, k-Nearest Neighbors 등의 다양한 분류 기법 모델을 적용하여 결과를 분석하였다. 그 결과 PCA가 원본 데이터의 특성을 유지하면서 데이터 특성의 차원은 획기적으로 감소시키고 우수한 악성코드 분류 성능을 달성함을 확인하였다. 이진분류 및 다중분류 모두 데이터 특성을 전체 크기의 1% 수준 이하로 줄이더라도 이전 연구 결과보다 높은 수준의 정확도를 나타내었다.

홍도 관속식물상 재검토 (Re-examination of the vascular plants on Hongdo Island, Korea)

  • 장영종;박종수;이진실;이지연;최병희
    • 식물분류학회지
    • /
    • 제51권3호
    • /
    • pp.205-249
    • /
    • 2021
  • 전라남도 신안군에 위치한 홍도의 관속식물상을 연구하였다. 생물다양성 데이터베이스를 통해 과거 홍도 식물상 연구들에서 수집된 표본 검토와 함께, 본인들이 2003년 4월부터 2020년 10월까지 22회에 걸쳐 현지조사를 수행하였다. 과거에 채집된 것과 금번조사 표본을 종합검토한 결과, 홍도의 관속식물은 102과 296속 425종 6아종 41변종으로 총 472분류군의 분포를 확인하였다. 이들 중 111 분류군은 이번 조사에서 새로이 분포가 확인되었으며, 특히 6분류군의 형태적 특징과 생육지를 기록하였다. 또한, 분류학적으로 재검토 및 재동정된 29분류군에 대한 분류학적 주석을 기술하였다. 이번 조사에서 붉은사철란, 수정목, 신안새우난초, 홍도원추리 등 4분류군은 홍도가 국내에서 분포 북한계지임이 밝혀졌다. 한편 흑산도비비추와 홍도서덜취의 분포는 국내에서 홍도와 인근 섬에만 분포가 한정되었다. 이들에 대한 분포도를 기재하였다. 환경부 지정 멸종위기 야생식물은 I급에 나도풍란과 풍란 2분류군, II급에 대흥란, 새깃아재비, 석곡, 신안새우난초, 혹난초 등 5분류군으로 총 7분류군이 확인되었으며, 국립생물자원관에서 발간한 적색자료집에 따른 희귀식물은 11분류군이 확인되었다. 귀화식물은 40분류군이 보고되었다.

SVM음성인식기 구현을 위한 강인한 특징 파라메터 (Robust Feature Parameter for Implementation of Speech Recognizer Using Support Vector Machines)

  • 김창근;박정원;허강인
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.195-200
    • /
    • 2004
  • 본 논문은 두 가지 비교 실험을 통하여 효과적 음성인식 시스템을 제안한다. 분별적 이진 패턴 분류기인 SVM(Support Vector Machines)은 특징 공간에서 비선형 경계를 찾아 분류하는 방법으로 적은 학습 데이터에서도 좋은 분류 성능을 나타낸다고 알려져 있다. 본 논문에서는 학습데이터 수에 따른 HMM(Hidden Markov Model)과 SVM의 인식 성능을 비교하고, 최적의 특징 파라메터를 선택하기 위해 SVM을 이용하여 주성분해석과 독립성분분석을 적용하여 MFCC(Mel Frequency Cepstrum Coefficient)의 특징 공간을 변화시키면서 각각의 인식 성능을 비교 검토하였다. 실험 결과 SVM은 HMM에 비해 적은 학습데이터에서도 높은 인식 성능을 보여주었고, 독립성분분석에 의한 특징 파라메터가 특징 공간상에서의 높은 선형 분별성에 의해 다른 특징 파라메터보다 인식 성능에서 우수함을 확인 할 수 있었다.

Nuclear Ribosomal DNA Intergenic Spacer(IGS) I 영역의 분석에 의한 목질진흙버섯의 계통분류학적 위치 (Phylogenetic Analysis of Nuclear Ribosomal DNA Intergenic Spacer (IGS) I Region of Phellinus linteus)

  • 류영현;이진형;김종국
    • 한국균학회지
    • /
    • 제32권2호
    • /
    • pp.148-151
    • /
    • 2004
  • 본 연구는 Phellinus linteus와 관련 담자균류 속간의 IGS I 영역의 분석에 기초한 분류체계를 정립하기 위해서 실시하였다. 실험에 사용된 Phellinus linteus 균주의 IGS I 영역은 730 bp였고 다른 담자균류의 IGS I 영역과 비교시 5' 말단부위의 $1{\sim}280\;base$까지는 각 균주들간의 보존성이 높게 나타났으며 3' 말단부위로 갈수록 보존성이 감소하다가 다시 증가하는 경향을 보였다. 담자균류의 IGS 영역에 대한 연구가 앞으로 진행된다면 ITS 영역의 비교와 더불어 새로운 계통분류지표로 이용될 수 있을 것이다.

선회분류층형 석탄가스화기내의 비반응 난류 선회유동장 해석 (Numerical Analysis of Turbulent Swirling Cold-Flow in a Cyclonic Coal Gasifier)

  • 이진욱;나혜령;윤용승
    • 에너지공학
    • /
    • 제6권2호
    • /
    • pp.137-144
    • /
    • 1997
  • 선회분류층형 석탄가스화기내의 비반응 난류선회 유동장을 수치해석 기법을 이용하여 해석하였다. 우선 2차원해석과 3차원 해석과의 비교를 통하여 2차원화 가정의 주요변수인 등가틈새(equivalent slit)의 개념이 적절하며, 동시에 2차원 해석결과의 타당성을 입증하였다. 선회분류층형 가스화기내에서 가장 중요한 무차원수인 선회수의 변화에 따른 유동장의 특성변화를 주로 고찰하였다. 또한 유동장의 이론적인 선회수 및 등가틈새너비를 입력으로 이용한 전산해석을 수행하여. 미분탄반응이 존재할 경우의 유동장의 특성을 예측하여 보았다. 버너출구단면적의 크기 및 위치를 적절히 조절함으로써, 가스화기 내부에 미분탄반응에 적절한 유동장을 형성시킬 수 있음을 발견하였다.

  • PDF

스트리밍 데이터에서 확률 예측치를 이용한 효과적인 개념 변화 탐지 방법 (An Effective Concept Drift Detection Method on Streaming Data Using Probability Estimates)

  • 김영인;박정희
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.718-723
    • /
    • 2016
  • 스트리밍 데이터 분석에서 개념 변화가 일어나는 시점을 정확히 탐지하는 것은 분류 모델의 성능을 유지하는 데 있어서 매우 중요한 작업이다. 오류율은 스트리밍 데이터에서 개념 변화 탐지를 위해 많이 사용되는 척도이다. 그러나 0과 1로 이루어진 이진 값만으로 예측 결과를 묘사하는 것은 분류 모델의 행동 패턴을 나타내는 유용한 정보의 손실을 초래할 수 있다. 이 논문에서는 오류율을 이용하는 대신에 확률 예측치를 사용하여 분류기의 성능 패턴을 묘사하고 급격한 변화를 탐지하는 효과적인 개념 변화 탐지 방법을 제안한다. 합성데이터와 실제 스트리밍 데이터를 이용한 실험 결과는 제안한 방법이 개념 변화 시점을 탐지하는데 뛰어난 성능을 가짐을 보여준다.

SMUAP의 패턴분류를 위한 근 신호처리 알고리듬 (A EMG Signal Processing Algorithm for SMUAP Pattern Classification)

  • 이진;조일준;변윤식;홍완희;김성환
    • 대한전자공학회논문지
    • /
    • 제26권7호
    • /
    • pp.106-111
    • /
    • 1989
  • 본 연구에서는 근신호로 부터 SMUAP의 패턴 분류를 위한 새로운 근신호처리 알고리듬을 제시하였다. 제안된 알고리듬은 spike 카운터를 이용한 의사결정 방법으로서 ISI의 조합 및 규칙성을 검사하고, 주파수 평면에서 SMUAP 파형을 정렬하였으며 FIR 필터링을 통하여 스파이크를 선정하였다. 실험결과 IBM PC/AT 상에서 $10{\sim}50%$ MVC에 대한 5초 동안의 침 전극으로 검출된 근신호로 부터 $5{\sim}9$개의 SMUAP를 분류하였으며 인식율은 55% 이상이었고 컴퓨터 수행시간은 2분이었다.

  • PDF

결함 심각도에 기반한 소프트웨어 품질 예측 (Software Quality Prediction based on Defect Severity)

  • 홍의석
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.73-81
    • /
    • 2015
  • 소프트웨어 결함 예측 연구들의 대부분은 입력 개체의 결함 유무를 예측하는 이진 분류 모델들에 관한 것들이다. 하지만 모든 결함들이 같은 심각도를 갖지는 않으므로 예측 모델이 입력 개체의 결함경향성을 몇 개의 심각도 범주로 분류할 수 있다면 훨씬 유용하게 사용될 수 있다. 본 논문에서는 전통적인 복잡도와 크기 메트릭들을 입력으로 하는 심각도 기반 결함 예측 모델을 제안하였다. 학습 알고리즘은 많이 사용되는 네 개의 기계학습 기법들을 사용하였으며, 모델 구조는 삼진 분류 모델로 하였다. 모델 성능 평가를 위해 실험 데이터는 두 개의 NASA 공개 데이터 집합을 사용하였고, 평가 측정치는 Accuracy를 이용하였다. 평가 실험 결과는 역전파 신경망 모델이 두 데이터 집합에 대해 각각 81%와 88% 정도의 Accuracy 값으로 가장 좋은 성능을 보였다.

Load Profile 데이터를 이용한 패턴분류 연구 (A Study of Pattern Classification using Load Profile Data)

  • 유인협;이진기;김선익;고종민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.841-843
    • /
    • 2005
  • 최근에 들어서 전력산업에 규제완화가 도입되면서 환경이 급변하고 있는 실정이다. 여러 가지의 환경변화가 예상되지만, 그 중에서도 공급자간에 경쟁 도입이 전력산업 참여자간에 주요 이슈로 부상하고 있다. 이와 같은 변화는 전력시스템의 기술 개발 뿐만 아니라 경영전략에도 큰 영향을 미치고 있으며, 대 수요자 서비스의 제공이 전략의 핵심이 되고 있다. 따라서 공급자는 보다 나은 서비스를 제공하기 위해서, 수요자 정보의 수집 및 분석을 해야 할 필요가 있다. 이와 같은 수요자 정보의 분석은 여러분야가 있지만 그 중에서도 수요특성을 파악하는 것이 가장 기본이 된다. 수요 특성은 원격검침시스템에서 수집되는 load profile 데이터로써 표현된다. 본 논문에서는 전력 수요자의 부하 특성을 분석하고 명가하기 위하여 수요특성별로 그룹으로 분류하는 방법을 개발하고, 분류된 그룹의 특징을 검토하였다. 이와 같은 부하분석의 정보는 가격설계, 수요 핀 에너지 예측, 송전 및 배전 계획, 에너지 효율 향상 및 부하관리의 필수 자료가 된다. 또한 향후에 개발될 전력 부가서비스의 주요 기반이 될 것으로 예상된다.

  • PDF

카이제곱 통계량과 지지벡터기계를 이용한 스팸메일 필터 (Spam Filter by Using X2 Statistics and Support Vector Machines)

  • 이성욱
    • 정보처리학회논문지B
    • /
    • 제17B권3호
    • /
    • pp.249-254
    • /
    • 2010
  • 본 논문은 지지벡터기계를 이용하여 스팸메일을 자동으로 분류하는 시스템을 제안한다. 이메일에 포함된 단어의 어휘 정보와 품사 태그 정보를 지지벡터기계의 자질로 사용한다. 우리는 카이제곱 통계량을 이용하여 자질을 선택한 후 각각의 자질을 TF, TF-IDF, 이진 가중치 등으로 표현하여 실험하였다. 카이제곱 통계량을 이용하여 선택된 자질들을 이용하여 SVM을 학습한 후, SVM분류기는 각각의 이메일의 스팸 여부를 결정한다. 실험 결과, 선택되어진 자질들이 성능향상을 가져왔으며, TREC05-p1 스팸 말뭉치에 대해 약 98.9%의 정확도를 얻었다.