• 제목/요약/키워드: 소프트웨어 분류

검색결과 1,131건 처리시간 0.026초

API 정보와 기계학습을 통한 윈도우 실행파일 분류 (Classifying Windows Executables using API-based Information and Machine Learning)

  • 조대희;임경환;조성제;한상철;황영섭
    • 정보과학회 논문지
    • /
    • 제43권12호
    • /
    • pp.1325-1333
    • /
    • 2016
  • 소프트웨어 분류 기법은 저작권 침해 탐지, 악성코드의 분류, 소프트웨어 보관소의 소프트웨어 자동분류 등에 활용할 수 있으며, 불법 소프트웨어의 전송을 차단하기 위한 소프트웨어 필터링 시스템에도 활용할 수 있다. 소프트웨어 필터링 시스템에서 유사도 측정을 통해 불법 소프트웨어를 식별할 경우, 소프트웨어 분류를 활용하여 탐색 범위를 축소하면 평균 비교 횟수를 줄일 수 있다. 본 논문은 API 호출 정보와 기계학습을 통한 윈도우즈 실행파일 분류를 연구한다. 다양한 API 호출 정보 정제 방식과 기계학습 알고리즘을 적용하여 실행파일 분류 성능을 평가한다. 실험 결과, PolyKernel을 사용한 SVM (Support Vector Machine)이 가장 높은 성공률을 보였다. API 호출 정보는 바이너리 실행파일에서 추출할 수 있는 정보이며, 기계학습을 적용하여 변조 프로그램을 식별하고 실행파일의 빠른 분류가 가능하다. 그러므로 API 호출 정보와 기계학습에 기반한 소프트웨어 분류는 소프트웨어 필터링 시스템에 활용하기에 적당하다.

고해상도 위성영상의 분류를 위한 형상 기반 분류 소프트웨어 개발 (Development of Feature-based Classification Software for High Resolution Satellite Imagery)

  • 정수;이창노
    • 대한공간정보학회지
    • /
    • 제12권2호
    • /
    • pp.53-59
    • /
    • 2004
  • 본 연구에서는 고해상도 위성영상의 분류에 적합한 형상 기반 분류 소프트웨어를 개발하기 위한 연구를 수행하였다. 형상 기반 분류에 필요한 영상분할과 퍼지 기반의 분류 알고리즘을 개발하고, 형상 기반 분류에 요구되는 다양한 요소들을 고려하여 사용자와의 원활한 상호작용을 지원하기 위한 사용자 인터페이스를 구현하였다. 개발된 소프트웨어의 성능을 평가하고자 본 연구에서 개발된 소프트웨어와 현재 전 세계적으로 널리 보급되고 있는 형상 기반 분류 관련 상용 소프트웨어인 eCognition을 적용하여 동일한 영상을 시험적으로 처리해 본 결과 유사한 영상 분류결과를 얻을 수 있었다. 영상분할의 경우에는 본 연구에서 개발한 소프트웨어의 처리속도가 우수하였다. 형상 기반 분류를 수행하는 데에는 프로그램과 사용자간의 고도의 상호작용이 요구되므로, 향후에 이를 편리하게 하기 위한 사용자 인터페이스의 보완이 필요하다는 것을 알 수 있었다.

  • PDF

융합소프트웨어산업에 따른 소프트웨어 분류체계에 관한 연구 (Research on Software Classification System based on an Integrated Software Industry)

  • 양효식;전인오
    • 디지털융복합연구
    • /
    • 제11권4호
    • /
    • pp.91-99
    • /
    • 2013
  • 여러 산업과의 융합이 활발히 진행됨에 따라 전 산업 제품에 탑재된 소프트웨어나 금융, 컨설팅, 서비스 등 지식서비스사업과 소프트웨어 산업의 융복합화로 소프트웨어 산업은 소프트웨어 제품 및 서비스 생산 활동뿐만 아니라 소프트웨어 산업 활용부문까지 포함되어야 하고, 또한 소프트웨어 산업의 급진적 환경변화에 대응하여 모바일, 클라우드 컴퓨팅 등의 영역을 소프트웨어 분류체계 구분 시 포함시킬 방향성 정립이 필요한 시점이다. 본 논문에서는 새롭게 등장하거나 기술, 제품, 서비스 등과 융합된 기술 분류를 정립하고자 소프트웨어 생태계 특성상 분류기준 미포함 영역발굴과 분류체계의 미분화 혹은 체계 간 연계부족 등 분류체계의 불완전 영역을 도출하여 새롭게 나타나는 소프트웨어분야에 대해 확립하고자 한다.

소프트웨어 부품의 재사용을 위한 개선된 패싯 분류 방법과 의미 유사도 측정 (Advanced Faceted Classification Scheme and Semantic Similarity Measure for Reuse of Software Components)

  • 강문설
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.855-865
    • /
    • 1996
  • 본 논문에서는 재사용가능한 소프트웨어 부품의 분류 과정을 자동화하여, 소프트 웨어 부품 라이브러리에 구조적으로 저장하는 방안을 제안한다. 효율적이고 자동화 된 소프트웨어 부품의 분류를 위하여 자연어로 기술된 소프트웨어 부품 설명서로부터 의미 정보와 문장 구성 정보 등의 특징을 획득하여 소프트웨어 부품의 특성을 표현하 는 패싯을 결정하고각각의 패싯에 해당하는 항목들을 자동으로 추출하여 소프트웨어 부품 식별자를 구성하였다. 그리고 분류된 소프트웨어 부품들 사이의 의미 유사도를 측정하여 비슷한 특성을 갖는 소프트웨어 부품들을 인접한 장소에 저장시켜 구조화된 소프트웨어 부품 라이브러리를 구축하였다. 제안한 방법은 소프트웨어 부품의 분류 과정이 간단하고, 유사한 소프트웨어 부품을 쉽게 식별할 수 있었으며, 또한 소프트 웨어 부품을 라이브러리에 구조적으로 저장할 수 있다.

  • PDF

가중치 공유를 이용한 소프트웨어 카테고리 자동 분류 (Automated Classification of Software Category using Weight Sharing)

  • 김민하;심규진;이민수;왕승재;권준혁;이찬근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.61-64
    • /
    • 2020
  • 현재까지 심층 학습을 이용하여 텍스트를 자동으로 분류해주는 연구가 활발히 진행되었으며, 특히 소프트웨어 카테고리를 자동으로 분류해주는 연구가 이루어지고 있다. 최근 심층 신경망의 적절한 구조를 효율적으로 탐색할 수 있는 가중치 공유 기법이 연구되었다. 우리는 이를 응용하여 본 논문에서 가중치 공유를 이용한 소프트웨어 카테고리 분류 방법을 제안하며, 여러 실험을 통해 해당 기법의 성능을 측정하고 논의한다.

데이터 오류에서 추출한 데이터 품질 특성 (Extraction of Data Quality Characteristics from Dirty Data)

  • 김수경;최병주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.549-551
    • /
    • 2000
  • 소프트웨어 제품의 품질을 보증하는 일은 매우 중요하며, 국제표준인 ISO/IEC 9126은 소프트웨어 품질 및 특성 및 측정 메트릭 표준을 제공하고 있다. 이때 ISO/IEC 9126에서는 소프트웨어를 프로그램, 절차, 규칙 및 관련문서로 한정하고 있기 때문에 데이터의 품질에는 적용할 수 없다. 본 논문에서는 데이터 품질 평가 및 제어를 위하여 데이터 오류 형태를 분류하고, 이를 기반으로 데이트 품질 특성 및 부특성을 분류한다. 데이터 품질 특성 분류는 ISO/IEC 9126에 정의한 소프트웨어 품질 특성을 데이터 오류 형태에 대응시켜 추출한다. 본 논문에서 제시하는 데이트 품질특성 분류는 지식 공학(knowledge engineering)시스템이 최종 사용자에게 제공하는 데이터나 지식의 품질 측정 및 제어에 기준이 된다.

  • PDF

원전 I&C FSE 분류기준과 이에 따른 상용 소프트웨어의 원전 사용 승인기준

  • 김장열;권기춘
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1995년도 추계학술발표회논문집(2)
    • /
    • pp.1041-1046
    • /
    • 1995
  • 본 논문에서는 원전 I&C Function System Equipment (FSE)의 분류기준을 제시하기 위하여 IEEE 730.1, IEEE 828, IEEE 1012 및 IEC 1226의 관련 표준들을 비교 분석하여 I&C FSE를 근간으로 계측제어 소프트웨어를 원전 I&C 계통의 기능에 따라 Type I, Type II, Type III 및 Type IV로 분류할 수 있는 분류기준, 분류절차 및 예를 제시하였다. 또한, 본 논문의 분류기준을 토대로 하여 최근 이슈가 되고 있는 상용 소프트웨어 (Commercial Off The Shelf Software)의 원전 사용 승인기준을 제시하였다.

  • PDF

텍스트 마이닝을 통한 키워드 추출과 머신러닝 기반의 오픈소스 소프트웨어 주제 분류 (Keyword Extraction through Text Mining and Open Source Software Category Classification based on Machine Learning Algorithms)

  • 이예슬;백승찬;조용준;신동명
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제14권2호
    • /
    • pp.1-9
    • /
    • 2018
  • 오픈소스를 사용하는 사용자 및 기업의 비중이 지속적으로 증가하고 있다. 국외뿐만 아니라 국내에서의 오픈소스 소프트웨어 시장 규모가 급격하게 성장하고 있다. 하지만 오픈소스 소프트웨어의 지속적인 발전에 비해서, 오픈소스 소프트웨어 주제 분류에 대한 연구 거의 이루어지지 않고 있으며 소프트웨어의 분류 체계 또한 구체화되어 있지 않다. 현재는 사용자가 주제를 직접 입력하거나 태깅하는 방식을 사용하고 있으며 이에 따른 오 분류 및 번거로움이 존재한다. 또한 오픈소스 소프트웨어 분류에 대한 연구는 오픈소스 소프트웨어 평가, 추천, 필터링등의 기반 연구로 이용될 수 있다. 따라서 본 연구에서는 머신러닝 모델을 사용하여 오픈소스 소프트웨어를 분류하는 기법에 대하여 제안하고, 머신러닝 모델 별 성능 비교를 제안한다.

허용적 러프집합에 의한 소프트웨어 분류 (The Software Classification by the Tolerance Rough Set)

  • 김성애;최완규;이성주
    • 한국지능시스템학회논문지
    • /
    • 제11권2호
    • /
    • pp.141-147
    • /
    • 2001
  • 소프트웨어의 측정값에 근거하여 소프트웨어 품질에 관한 의사결정을 할 때, 동치관계의 요구조건인 추이적(transitive) 특성이 항상 만족되는 것은 아니다. 순환수(cyclomatic number)가 거의 비슷한 프로그램에서, 하나의 \"구조적인\" 프로그램 범주에 속하고 또 다른 하나는 \"비구조적인\" 프로그램 범주에 속한다고 명확히 분류할 수 있는가하는 점이다. 따라서, 본 연구에서는 동치관계보다는 허용적 관계를 만족하는 허용적 러프집합에 근거한 소프트웨어 분류기준을 제시하고자 한다. 분류기준을 생성하기 위한 실험 데이터 집합을 수집하고, 집합 내의 각 원소에 관한 허용적 클래스들을 생성한 후, 각 허용적 클래스들의 중심값을 클러스터링하여 분류기준을 생성한다. 생성된 분류기준을 또 다른 실험 집합에 적용하여 비교 분석한 결과 생성된 분류기준이 타당함을 보여준다.생성된 분류기준이 타당함을 보여준다.

  • PDF

통계적 기법을 이용한 악성 소프트웨어 분류 (Malware classification using statistical techniques)

  • 원성민;김현주;송종우
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.851-865
    • /
    • 2017
  • 최근 워너크라이라는 이름의 랜섬웨어가 전 세계적으로 큰 화두에 오르면서, 악성 소프트웨어로 인한 피해를 줄이기 위한 방법들이 재조명 되고 있다. 새로운 악성 소프트웨어가 발생했을 때 피해를 최소화하기 위해서는 해당 소프트웨어가 어떤 공격 유형을 가진 악성 소프트웨어인지 빠르게 분류할 필요가 있다. 본 연구 목적은 다양한 통계적 기법을 이용하여 악성 소프트웨어를 효과적으로 분류할 수 있는 모형을 구축하는 데 있다. 모형 적합 시 다항 로지스틱, 랜덤 포레스트, 그래디언트 부스팅, 서포트 벡터 기계 등의 기법들을 이용하였으며, 본 연구를 통해 악성 소프트웨어를 분류하는 데에 있어 중요한 역할을 하는 변수들이 존재한다는 사실을 발견하였다.