• 제목/요약/키워드: 패턴벡터추출

검색결과 185건 처리시간 0.027초

악성코드 탐지를 위한 기계학습 알고리즘의 성능 비교 (Performance Comparison of Machine Learning Algorithms for Malware Detection)

  • 이현종;허재혁;황두성
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제57차 동계학술대회논문집 26권1호
    • /
    • pp.143-146
    • /
    • 2018
  • 서명기반 악성코드 탐지는 악성 파일의 고유 해싱 값을 사용하거나 패턴화된 공격 규칙을 이용하므로, 변형된 악성코드 탐지에 취약한 단점이 있다. 기계 학습을 적용한 악성코드 탐지는 이러한 취약점을 극복할 수 있는 방안으로 인식되고 있다. 본 논문은 정적 분석으로 n-gram과 API 특징점을 추출해 특징 벡터로 구성하여 XGBoost, k-최근접 이웃 알고리즘, 지지 벡터 기기, 신경망 알고리즘, 심층 학습 알고리즘의 일반화 성능을 비교한다. 실험 결과로 XGBoost가 일반화 성능이 99%로 가장 우수했으며 k-최근접 이웃 알고리즘이 학습 시간이 가장 적게 소요됐다. 일반화 성능과 시간 복잡도 측면에서 XGBoost가 비교 대상 알고리즘에 비해 우수한 성능을 보였다.

  • PDF

FCM을 이용한 퍼지 RBF 네트워크 (Fuzzy RBF Network using FCM)

  • 김재용;이상수;이준행;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.158-161
    • /
    • 2004
  • RBF 네트워크의 중간층은 클러스터링하는 층이다. 즉, 이 충의 목적은 주어진 자료 집합을 유사한 클러스터들(homogenous cluster)로 분류하는 것이다. 여기서 유사하다는 것은 입력 데이터들에 대한 특징 벡터 공간사이에서 한 클러스터내의 벡터들 간에 거리를 측정하여 정해진 반경 내에 존재하면 같은 클러스터로 분류하고 정해진 반경 내에 존재하지 않으면 다른 클러스터로 분류한다. 그러나 정해진 반경 내에서 클러스터링하는 것은 잘못된 클러스터를 선택하는 단점을 가지게 된다. 그러므로 중간층을 결정하는 .것은 RBF 네트워크의 전반적인 효율성에 큰 영향을 준다. 따라서 본 논문에서는 효율적으로 중간층을 결정하기 위한 방법으로 퍼지 C-Means 클러스터링 알고리즘을 적용한 퍼지 RBF 네트워크를 제안한다. 제안된 퍼지 RBF 네트워크의 학습은 크게 두 단계로 구분된다. 첫 번째 단계는 입력층과 중간층 사이에 퍼지 C-Means 알고리즘이 수행되고, 두 번째 단계는 중간층과 출력층 사이에 지도학습이 수행된다. 제안된 방법의 학습 성능을 평가하기 위하여 실제 주민등록증에서 추출한 숫자패턴에 적용한 결과, 기존의 RBF네트워크 보다 학습 성능이 개선된 것을 확인하였다.

  • PDF

SpPCA와 MLP에 기반을 둔 응합법칙에 의한 MRS 패턴분류 (MRS Pattern Classification Using Fusion Method based on SpPCA and MLP)

  • 송창규;이대종;전병석;유정웅
    • 한국통신학회논문지
    • /
    • 제30권9C호
    • /
    • pp.922-929
    • /
    • 2005
  • 본 논문에서는 SpPCA와 MLP에 기반을 둔 융합법칙에 의한 MRS 패턴분류기법을 제안한다. 차원축소를 위해 사용되는 기존의 PCA 기법은 입력데이터가 비선형 특성을 갖는 경우 최적의 변환행렬을 구할 수 없다는 문제점을 가지고 있다. 따라서, 본 논문에서는 구간별로 입력데이터를 분할한 후 PCA에 의해 특징을 추출하는 SpPCA 기법을 이용하여 입력패턴의 차원을 축소한다. 다음 단계인 분류단계에서는 MLP 비선형분류기를 이용하여 구간마다 추출된 특징벡터를 이용하여 기준패턴과의 유사도를 산출한다. 최종 분류단계에서는 MLP에 의해서 산출된 유사도에 기반을 둔 융합법칙에 의하여 MRS 패턴을 분류한다. 제안된 방법의 유용성을 보이기 위한 실험결과에서 기존의 방법들에 비해서 향상된 인식결과를 보임을 확인하였다.

차량 식별마크와 번호판 인식을 통한 차량인식 (Vehicle Recognition with Recognition of Vehicle Identification Mark and License Plate)

  • 이응주;김성진;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제8권11호
    • /
    • pp.1449-1461
    • /
    • 2005
  • 본 논문에서는 차량의 식별마크 분류 및 차량번호판 인식을 통한 차량인식 알고리즘을 제안하였다. 제안한 알고리즘에서는 먼저 입력 차량영상으로 부터 잡음제거, 세선화 과정 등 전처리 과정들을 수행하고 명암값 변화 빈도 분포를 사용하여 차량식별마크와 번호판 영역을 추출하였다. 또한 추출된 후보 영역으로부터 차량 식별마크와 번호판 영역의 구조적 특성 정보를 사용하여 차량 식별마크, 번호판의 문자 및 숫자를 분류하였으며, 하이브리드 패턴벡터 및 수직수평 패턴벡터를 사용하여 식별마크, 문자 및 숫자를 인식하여 차량 정보 인식율을 개선하였다. 제안한 알고리즘에서는 차량의 식별마크가 차량의 종류에 따라 독립적인 특성, 식별마크와 번호판 영역에서는 문자와 배경이 뚜렷하게 구별되는 특성 및 수평 및 수직빈도수 분포가 식별마크 및 번호판 이외의 영역과 뚜렷이 구별된다는 특성들을 이용하였다. 제안한 방법의 성능을 확인하기 위하여 다양한 환경에서 촬영된 350여개의 영상에 대하여 차량인식 실험을 수행하였고 제안한 방법이 차량번호판의 크기와 위치에 무관하고 잡음의 영향에 덜 민감하였을 뿐만 아니라 불규칙적인 외부환경에서도 인식율이 개선되었다. 또한 식별마크와 번호판 인식의 실시간 처리가 가능하여 실제 주차장이나 도시화도로등에 적용이 가능하다.

  • PDF

효율적인 균열 데이터 수집을 위한 벡터 기반 데이터 증강과 네트워크 학습 (Vector-Based Data Augmentation and Network Learning for Efficient Crack Data Collection)

  • 김종현
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제28권2호
    • /
    • pp.1-9
    • /
    • 2022
  • 본 논문에서는 균열을 감지 할 때 필요한 데이터를 생성할 수 있는 벡터 기반 증강 기법과 이를 학습할 수 있는 합성곱 인공신경망(Convolution Neural Networks, ConvNet) 기법을 제안한다. 균열을 빠르고 정확하게 감지하는 것은 건물 붕괴와 낙하 사고를 사전에 방지할 수 있는 중요한 기술이다. 이 문제를 인공지능으로 해결하기 위해서는 대량의 데이터 확보가 필수적이지만, 실제 균열 이미지를 얻기 위한 상황은 대부분 위험하기 때문에 대량의 균열 데이터를 확보하기는 어렵다. 이런 데이터베이스 구축의 문제점은 인위적인 특정 부분에 변형을 주어 데이터의 양을 늘리는 탄성왜곡(Elastic distortion)으로 완화시킬 수 있지만, 본 논문에서는 이보다 향상된 균열 패턴 결과를 ConvNet을 활용하여 모델링한다. 탄성왜곡보다 우리의 방법이 실제 균열 패턴과 유사하게 추출된 결과를 얻을 수 있었고, 일반적인 데이터 증강에서 사용되는 픽셀 단위가 아닌, 벡터 기반으로 균열 데이터 증강을 설계함으로써 균열의 변화량 측면에서 우수한 결과를 얻을 수 있다. 결과적으로 본 논문에서는 적은 개수의 균열 데이터를 입력으로 사용했음에도 불구하고 균열의 방향 및 패턴을 다양하게 생성하여 효율적으로 균열 데이터베이스를 구축할 수 있다.

음성을 이용한 화자 검증기 설계 및 구현 (Design and Implementation of Speaker Verification System Using Voice)

  • 지진구;윤성일
    • 한국컴퓨터정보학회논문지
    • /
    • 제5권3호
    • /
    • pp.91-98
    • /
    • 2000
  • 본 논문은 음성을 이용하여 개인의 신원을 확인할 수 있는 화자 검증시스템을 설계, 구현하였다. 특징 파라메터로는 선형 예측 계수나 고속 후리에 변환보다 안정적이고 계산량이 적은 장점이 있는 필터뱅크(filterbank)를 사용했으며 추출된 파라메터들을 LBG 알고리즘을 이용하여 각 개인의 코드북을 작성하였다. 작성된 코드북에 의해 특징 파라메터를 벡터양자화하여 얻어진 코드열로 화자 검증의 참조 패턴 및 입력 패턴을 생성, 이들을 동적시간 정합법을 이용하여 유사도를 측정하여 얻어진 유사도와 임계값을 비교하여 음성 의뢰자(client speaker)인지, 사칭자(impostor)인지 결정하는 화자 검증기를 설계, 구현하였다.

  • PDF

K-means 알고리듬을 이용한 비정상 사운드 검출 (Irregular Sound Detection using the K-means Algorithm)

  • 정의필;이재열;조상진
    • 융합신호처리학회논문지
    • /
    • 제6권1호
    • /
    • pp.23-26
    • /
    • 2005
  • 산업 시설 등에서 운전 중인 회전 기계의 동작, 감시, 진단은 설비의 효율적인 운용 및 사고 방지 등을 위해 매우 중요한 일이다. 이상 진단 기술은 기기에 설치된 센서로부터 취득된 데이터의 특징을 추출하는 것과 분류된 데이터를 이용해 정상 또는 이상으로 구분하거나 이상의 원인을 분석하는 두 가지 과정으로 진행할 수 있다. 기존의 기술들은 주파수 분석과 패턴 인식의 방법 등이 적용되어 왔다. 본 논문에서는 운전되고 있는 정상/비정상 상태를 분류하기 위하여 기기들의 사운드 정보를 획득하여 웨이블렛 변환을 거쳐 주파수 대역별 신호를 나누었다. 나누어진 대역별 신호의 RMS값으로 입력벡터를 구성하고 이 입력벡터에 K-means 방법을 적용하여 정상 및 비정상 상태의 모델을 결정한다. 결정된 정상 및 비정상 상태의 모델과 입력 벡터를 비교하여 입력 신호의 정상/비정상을 판단한다.

  • PDF

모노 카메라 영상기반 시간 간격 윈도우를 이용한 광역 및 지역 특징 벡터 적용 AdaBoost기반 제스처 인식 (AdaBoost-based Gesture Recognition Using Time Interval Window Applied Global and Local Feature Vectors with Mono Camera)

  • 황승준;고하윤;백중환
    • 한국정보통신학회논문지
    • /
    • 제22권3호
    • /
    • pp.471-479
    • /
    • 2018
  • 최근 안드로이드, iOS 등의 셋톱박스 기반의 스마트 TV에 대한 보급에 따라 제스처로 TV를 컨트롤 할 수 있는 새로운 접근을 제안한다. 본 논문에서는 모노 카메라 센서를 이용한 AdaBoost 기반 제스처 인식에 관한 알고리즘을 제안한다. 우선, 신체 좌표 추출을 위해 가우시안 배경 제거 및 Camshift 기반 자세 추적 및 추정 알고리즘을 사용한다. AdaBoost 학습 모델을 신체 정규화된 광역 및 지역 특징 벡터의 집합을 특징 패턴으로 하여, 속도가 다른 동작들을 인식할 수 있도록 하였다. 또한 속도가 다른 다양한 제스처를 인식하기 위해 다중 AdaBoost 알고리즘을 적용하였다. CART 알고리즘을 이용하여 성공적인 중요 특징 벡터를 확인하고 중요도가 낮은 특징벡터를 제거하는 방식을 적용하면서 분류 성공률이 높은 최적의 특징 벡터를 탐색하였다. 그 결과 24개의 주성분 특징 벡터를 찾았으며, 기존 알고리즘에 비해 낮은 오분류율(3.73%)과 높은 인식률(95.17%)을 지닌 특징 벡터 및 분류기를 설계하였다.

희소 투영행렬 획득을 위한 RSR 개선 방법론 (An Improved RSR Method to Obtain the Sparse Projection Matrix)

  • 안정호
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권4호
    • /
    • pp.605-613
    • /
    • 2015
  • 본 논문은 패턴인식에서 자주 사용되는 투영행렬을 희소화하는 문제를 다룬다. 최근 임베디드 시스템이 널리 사용됨에 따라 탑재되는 프로그램의 용량이 제한받는 경우가 빈번히 발생한다. 개발된 프로그램은 상수 데이터를 포함하는 경우가 많다. 예를 들어, 얼굴인식과 같은 패턴인식 프로그램의 경우 고차원 벡터를 저차원 벡터로 차원을 축소하는 투영행렬을 사용하는 경우가 많다. 인식성능 향상을 위해 영상으로부터 매우 높은 차원의 고차원 특징벡터를 추출하는 경우 투영행렬의 사이즈는 매우 크다. 최근 라소 회귀분석 방법을 이용한 RSR(rotated sparse regression) 방법론[1]이 제안되었다. 이 방법론은 여러 실험을 통해 희소행렬을 구하는 가장 우수한 알고리즘 중 하나로 평가받고 있다. 우리는 본 논문에서 RSR을 개선할 수 있는 세 가지 방법론을 제안한다. 즉, 학습데이터에서 이상치를 제거하여 일반화 성능을 높이는 방법, 학습데이터를 랜덤 샘플링하여 희소율을 높이는 방법, RSR의 목적함수에 엘라스틱 넷 회귀분석의 패널티 항을 사용한 E-RSR(elastic net-RSR) 방법을 제안한다. 우리는 실험을 통해 제안한 방법론이 인식률을 희생하지 않으며 희소율을 크게 증가시킴으로써 기존 RSR 방법론을 개선할 수 있음을 보였다.

계층적 어탠션 구조와 트랜스포머를 활용한 알츠하이머 진단과 생성 기반 챗봇 (Alzheimer's Diagnosis and Generation-Based Chatbot Using Hierarchical Attention and Transformer)

  • 박준영;최창환;신수종;이정재;최상일
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.333-335
    • /
    • 2022
  • 본 논문에서는 기존에 두 가지 모델이 필요했던 작업을 하나의 모델로 처리할 수 있는 자연어 처리 아키텍처를 제안한다. 단일 모델로 알츠하이머 환자의 언어패턴과 대화맥락을 분석하고 두 가지 결과인 환자분류와 챗봇의 대답을 도출한다. 일상생활에서 챗봇으로 환자의 언어특징을 파악한다면 의사는 조기진단을 위해 더 정밀한 진단과 치료를 계획할 수 있다. 제안된 모델은 전문가가 필요했던 질문지법을 대체하는 챗봇 개발에 활용된다. 모델이 수행하는 자연어 처리 작업은 두 가지이다. 첫 번째는 환자가 병을 가졌는지 여부를 확률로 표시하는 '자연어 분류'이고 두 번째는 환자의 대답에 대한 챗봇의 다음 '대답을 생성'하는 것이다. 전반부에서는 셀프어탠션 신경망을 통해 환자 발화 특징인 맥락벡터(context vector)를 추출한다. 이 맥락벡터와 챗봇(전문가, 진행자)의 질문을 함께 인코더에 입력해 질문자와 환자 사이 상호작용 특징을 담은 행렬을 얻는다. 벡터화된 행렬은 환자분류를 위한 확률값이 된다. 행렬을 챗봇(진행자)의 다음 대답과 함께 디코더에 입력해 다음 발화를 생성한다. 이 구조를 DementiaBank의 쿠키도둑묘사 말뭉치로 학습한 결과 인코더와 디코더의 손실함수 값이 유의미하게 줄어들며 수렴하는 양상을 확인할 수 있었다. 이는 알츠하이머병 환자의 발화 언어패턴을 포착하는 것이 향후 해당 병의 조기진단과 종단연구에 기여할 수 있음을 보여준다.

  • PDF