• Title/Summary/Keyword: automatic classification

검색결과 883건 처리시간 0.028초

행위기반의 프로파일링 기법을 활용한 모바일 악성코드 분류 기법 (Andro-profiler: Anti-malware system based on behavior profiling of mobile malware)

  • 윤재성;장재욱;김휘강
    • 정보보호학회논문지
    • /
    • 제24권1호
    • /
    • pp.145-154
    • /
    • 2014
  • 본 논문에서는 범죄수사에서 사용되는 프로파일링 기법을 이용한 모바일 악성코드 행위 프로파일링을 통하여 효율적인 모바일 악성코드 분류 방법론 Andro-profiler를 제안한다. Andro-profiler는 클라이언트/서버 형태로, 클라이언트 앱이 모바일기기에 설치되어 사용자가 사용하고 있는 앱에 대한 정보를 서버에 전송하고, 서버에서는 해당 앱을 동적 분석 도구인 Droidbox가 설치된 에뮬레이터에서 실행시키면서 발생되는 시스템 콜과 에뮬레이터 로그를 이용하여 해당 앱의 행동을 프로파일링하며, 해당 앱의 프로파일링 목록을 저장된 악성코드 프로파일링 DB와 비교하여 악성유무를 판단하고, 악성코드로 판단될 경우 분류를 실시하여 클라이언트에게 결과를 통보한다. 실험결과, Andro-profiler는 1MB의 악성코드를 분류하는데 평균 55초가 소요되었고, 99%의 정확도로 악성코드를 분류하는 것을 확인하였으며, 기존 방법론보다 더 정확하게 악성코드를 분류할 수 있다.

나이브 베이지안 분류기를 이용한 게시물 자동 분류를 위한 eCRM 에이전트 시스템 (eCRM Agent System for Articles Automatic Classification System based on Naive Bayesian Classifier)

  • 최정민;이병수
    • 전기전자학회논문지
    • /
    • 제8권2호
    • /
    • pp.216-223
    • /
    • 2004
  • 최근 전자 상거래에서 사용하고 있는 게시판은 고객의 능동적인 참여로 운영되며, 게시물은 고객의 직접적인 의사를 들을 수 있는 인 바운드(Inbound)정보로서 다른 eCRM을 위한 고객 접점 채널 과는 성격이 다른 도구이다. 또한 게시판의 효과적인 운영은 게시판 자체의 신뢰도를 향상 시키고 나아가 전자 상거래 전체의 신뢰도를 높여 줄 수 있는 중요한 eCRM 도구이다. 그러나 현재 대부분의 전자상거래에서 운영하는 게시판은 기 분류된 카테고리를 고객이 직접 수동으로 선정하도록 되어 있고, 이렇게 임의로 분류되는 게시물에 대하여 체계적인 처리 과정 없이 답변이 이루어지기 때문에 답변을 하는데 많은 시간이 소요 되고 있으며, 정확한 답변이 이루어지지 않고 있는 실정이다. 따라서, 본 논문에서는 여러 가지 종류의 게시물에 대하여 나이브 베이지안 분류기를 이용하여 게시판의 기존 문제점의 해결과 효과적인 운영 그리고 게시물의 체계적인 분류 관리를 할 수 있는 게시물 자동 분류기를 설계하고 구현하였다. 아울러 문서 분류 학습 기법 중 대표적인 TFIDF. k-NN, 나이브 베이지안 기법들의 게시물 분류 성능을 측정하여 채택한 나이브 베이지안 분류기의 우수성을 확인 하였다.

  • PDF

상품평의 언어적 분석을 통한 상품 평가 요약 시스템 (Product Evaluation Summarization Through Linguistic Analysis of Product Reviews)

  • 이우철;이현아;이공주
    • 정보처리학회논문지B
    • /
    • 제17B권1호
    • /
    • pp.93-98
    • /
    • 2010
  • 본 논문에서는 폭발적으로 증가하고 있는 상품평을 효과적으로 활용하기 위해 언어적 분석을 통하여 상품 평가를 요약하는 시스템을 제안한다. 시스템에서는 스커트 상품 분류의 경우 '디자인'과 '재질'과 같이, 상품을 평가하는 기준이 되는 항목에 대한 상품평의 부정과 긍정의 극성 여부를 판별하여 그래프 형태로 요약하여 제시한다. 본 논문에서는 작은 시드 어휘와 문맥에 기반한 자동 확장 방법을 사용하여 평가 항목 별 평가 어휘 극성 사전을 구축하여 평가 항목에 대한 상품평의 극성을 판정한다. 제안한 방식은 여러 온라인 쇼핑몰의 실제 상품평에 대한 실험에서 극성 사전 추출에서 평균 69.8%의 정확율과 문장별 극성 식별에서 평균 81.8%의 정확율을 보였다.

다중 클래스 SVM과 주석 코드 배열을 이용한 의료 영상 자동 주석 생성 (Medical Image Automatic Annotation Using Multi-class SVM and Annotation Code Array)

  • 박기희;고병철;남재열
    • 정보처리학회논문지B
    • /
    • 제16B권4호
    • /
    • pp.281-288
    • /
    • 2009
  • 본 논문은 의료 영상 중 X-ray 영상에 대한 효과적인 분류와 자동 주석 생성을 위한 방법을 제안한다. X-ray 영상은 일반 자연 영상과는 다르게 영상 내에 중요한 의미를 가지고 있는 관심 영역과 어두운 단색의 배경으로 구성된 특징을 가지고 있음으로 본 논문에서는, 영상의 중요영역에서 해리스 코너 검출기를 이용한 색 구조 기술자(H-CSD)로 색 특징을 추출하고, 질감 특징을 위해 경계선 히스토그램 기술자(EHD)를 사용하였다. 추출된 두 개의 특징 벡터들은 각각 다중 클래스 Support Vector Machine에 적용되어 20개의 카테고리 중 하나로 영상을 분류한다. 마지막으로, 영상은 미리 정의된 카테고리들의 계층적인 관계와 우선 순위에 기반하여 주석 코드 배열(Annotation Code Array)을 부여 받고 이를 이용하여 다수의 최적 키워드를 얻으며 갖게 된다. 실험에서는 제안한 주석 생성방법을 관련 연구 방법과 비교하여 성능이 개선 되었음을 보여주고 있다.

터빈 로터 디스크 키웨이의 초음파 신호로부터 균열정보의 추출을 위한 신호처리 알고리즘의 개발 (Ultrasonic Signal Processing Algorithm for Crack Information Extraction on the Keyway of Turbine Rotor Disk)

  • 이종규;서원찬;박찬;이종오;손영호
    • 비파괴검사학회지
    • /
    • 제29권5호
    • /
    • pp.493-500
    • /
    • 2009
  • 본 연구에서는 터빈 로터 디스크 키웨이에 발생하는 균열의 상세 정보를 추출하기 위하여 초음파 신호처리 알고리즘을 개발하였다. 초음파 검사 시스템에 의한 터빈 로터 디스크 키웨이 시험편의 초음파 신호로부터 B-주사 이미지를 구성하였다. 구성된 B-주사 이미지를 2차원 신호처리를 위한 입력영상으로 이용하여, 전처리, 균열후보영역 검출, 균열영역 판별 및 균열정보 추출의 4단계로 알고리즘을 구성하였다. 개발된 초음파 신호처리 알고리즘을 이용한 실험을 통하여, 개발된 알고리즘이 키웨이 부위에 발생하는 균열의 특징정보 추출에 의한 균열의 정량적인 평가에 효과적임을 확인하였다.

질감 분석과 CNN을 이용한 잡음에 강인한 돼지 호흡기 질병 식별 (Noise-Robust Porcine Respiratory Diseases Classification Using Texture Analysis and CNN)

  • 최용주;이종욱;박대희;정용화
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권3호
    • /
    • pp.91-98
    • /
    • 2018
  • 집단으로 사육되는 돼지 농장에서 돼지 소모성 질환의 자동 탐지는 매우 중요한 문제이다. 특히, 밀집된 돈사에서 사육되는 돼지들의 호흡기 질환은 축산 농가의 막대한 경제적 손실을 야기하는 대표적 질병들 중 하나이다. 본 논문에서는 소리 신호 해석에 기반하여 돼지의 호흡기 질환을 조기 탐지 및 식별하는 잡음에도 강인한 시스템을 제안한다. 제안하는 시스템은, 먼저 1차원의 소리 신호를 2차원의 회색조 영상으로 변환한 후, DNS기법으로 질감 특징 정보를 갖는 이미지를 생성한다. 마지막으로, 이를 CNN에 입력함으로써 잡음에도 강인한 돼지 호흡기 질병 탐지 및 식별 시스템을 구현하고자 한다. 실제 국내 돈사에서 취득한 돼지의 발성음을 이용하여 제안하는 시스템의 성능을 실험적으로 검증한바, 제안된 시스템은 경제적인 비용(저가의 소리 센서)과 시스템 정확도(96.0% 정확도)로 다양한 잡음 환경에서도 돼지의 호흡기 질병들을 탐지할 수 있음을 실험적으로 확인하였다. 제안된 시스템은 독자적인 혹은 기존 방법들의 보완책으로 사용될 수 있다.

회전익항공기 운동모델 개발을 위한 데이터마이닝을 이용한 비행데이터 자동 처리 기법 (Automatic Processing Techniques of Rotorcraft Flight Data Using Data Mining)

  • 오혜주;조성범;최기영;노은정;강병룡
    • 한국항공우주학회지
    • /
    • 제46권10호
    • /
    • pp.823-832
    • /
    • 2018
  • 일반적으로 항공기 운동 모델의 충실도는 대상 항공기의 비행시험 결과와 비교하여 검증한다. 따라서 성능 비교를 위한 기준 비행 데이터를 추출하는데, 각종 잡음이 포함된 방대한 양의 비행데이터를 처리하는 것은 많은 인력과 시간이 소요된다. 특히 회전익항공기는 축간 커플링 효과와 후류 간섭 효과 등으로 비선형성이 큰 특성을 가지고 있으며, 제자리 비행, 후진 비행 등의 다양한 기동을 수행하므로 비행 데이터를 처리하는 것이 복잡하다. 본 연구에서는 회전익항공기의 비행 데이터 처리 기준을 정의하고, 데이터마이닝 기법을 이용한 정적 및 동적 비행 데이터 자동 처리를 위한 절차와 방법을 제시한다. 최종적으로 비행데이터를 사용하여 제시한 방법을 검증한다.

점군집 데이터를 이용한 곡면객체 모델링 및 정확도 분석 (Curved Feature Modeling and Accuracy Analysis Using Point Cloud Data)

  • 이대건;유은진;이동천
    • 한국측량학회지
    • /
    • 제34권3호
    • /
    • pp.243-251
    • /
    • 2016
  • 일반적으로 라이다 데이터 처리 과정은 노이즈 제거, 지표면/비지표면 분리를 위한 필터링, 데이터 분류, 객체분할, 형태인식, 객체 모델링, 성과물에 대한 정확도 검증 등이다. 본 논문은 점군집 라이다 데이터를 이용한 3차원 곡면객체의 모델링과 정확도 검증에 중점을 두고 있다. 기존의 구형 및 원통형 객체 모델링 방법은 함수의 선형화, 미지계수의 초기 근사값 및 반복 계산이 요구되지만, 제안한 방법은 모델링 함수의 미지계수를 직접 결정하는 방법이다. 이를 위하여 객체를 형성하는 단위 객체면 형태를 분석하여 적합한 함수를 결정하고, 함수를 구성하는 미지변수를 추정한 후 정확도를 분석하여 타당성을 검증하였다. 제안한 방법을 반구형 및 반원통의 시뮬레이션 및 실제 건물 데이터에 적용하여 모델링 함수의 계수와 정확도를 산정하였으며, 다양한 형태의 객체 모델링의 자동화에 기여할 것으로 판단된다.

CRFs와 TBL을 이용한 자동화된 음성인식 후처리 방법 (An Automatic Post-processing Method for Speech Recognition using CRFs and TBL)

  • 선충녕;정형일;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권9호
    • /
    • pp.706-711
    • /
    • 2010
  • 음성 인식기의 오류는 음성기반 응용 시스템들의 성능에 크게 영향을 주기 때문에 오류를 줄이기 위한 효과적인 처리 방법이 필요하다. 기존의 후처리 기법들은 수동 작업을 통한 코퍼스나 규칙으로 후처리를 수행하는 것이 일반적이다. 본 논문에서는 문제나 인식기의 특성에 무관하게 자동으로 학습할 수 있는 후처리 모델을 제안한다. 후처리의 문제를 오류의 인식과 수정으로 구분하고 오류 검출 문제는 순차적인 분류 문제로 간주하여 conditional random fields(CRFs)를 사용하고 오류 수정 규칙은 transformation-based learning(TBL)을 이용하여 자동 생성하여 적용하였다. 제안한 방법을 여행 예약 영역의 음성 인식기에 적용한 결과 삽입, 삭제, 치환 오류를 각각 25.85%, 3.57%, 7.42%을 수정하였으며, 이로 인해 인식기의 어휘 오류율을 2% 감소시킬 수 있었다.

분포유사도를 이용한 문헌클러스터링의 성능향상에 대한 연구 (Improving the Performance of Document Clustering with Distributional Similarities)

  • 이재윤
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.267-283
    • /
    • 2007
  • 이 연구에서는 분포 유사도를 문헌 클러스터링에 적용하여 전통적인 코사인 유사도 공식을 대체할 수 있는 가능성을 모색해보았다. 대표적인 분포 유사도인 KL 다이버전스 공식을 변형한 Jansen-Shannon 다이버전스, 대칭적 스큐 다이버전스, 최소스큐 다이버전스의 세 가지 공식을 문헌 벡터에 적용하는 방안을 고안하였다. 분포 유사도를 적용한 문헌 클러스터링 성능을 검증하기 위해서 세 실험 집단을 대상으로 두 가지 실험을 준비하여 실행하였다. 첫 번째 문헌클러스터링실험에서는 최소스큐다이버전스가 코사인 유사도 뿐만 아니라 다른 다이버전스공식의 성능도 확연히 앞서는 뛰어난 성능을 보였다. 두번째 실험에서는 피어슨 상관계수를 이용하여1차 유사도 행렬로부터2차 분포 유사도를 산출하여 문헌 클러스터링을 수행하였다. 실험결과는 2차 분포 유사도가 전반적으로더 좋은 문헌 클러스터링성능을 보이는 것으로 나타났다. 문헌클러스터링에서 처리 시간과 분류 성능을 함께 고려한다면 이 연구에서 제안한 최소 스큐 다이버전스 공식을 사용하고, 분류 성능만 고려할 경우에는 2차 분포 유사도 방식을 사용하는 것이 바람직하다고 판단된다.