• 제목/요약/키워드: classification schemes

검색결과 230건 처리시간 0.028초

정보통신망의 효율적 보안관리를 위한 비즈니스 프로세스 기반의 자산평가모델 및 방법론에 관한 연구 (A Study on Business Process Based Asset Evaluation Model and Methodology for Efficient Security Management over Telecommunication Networks)

  • 우병구;이강수;정태명
    • 정보처리학회논문지C
    • /
    • 제10C권4호
    • /
    • pp.423-432
    • /
    • 2003
  • 정보통신망의 보안관리나 위험분석시 정형화된 자산분석ㆍ평가는 필수적이지만, 기존의 위험분석 방법론 및 도구에는 자산의 분규체계만 다수 제시되어 있을 뿐 구체적인 자산파악 및 가치평가방법은 알려져 있지 않다. 또한, 기존의 자산분류체계는 주로 정보자산이 아닌 일반적인 위험평가를 위한 것이므로, 정보통신망의 정보자산에 대한 분류체계 및 자산가치 평가방법으로는 부적합하다. 특히, 자산평가시의 평가자의 주관성 문제를 해결하는 구체적인 방법이 제시되어있지 못하다. 본 논문에서는 이러한 문제점들을 해결하기 위해, 정형화된 자산평가모델의 정의, 새로운 자산분류스키마, 업무처리(BP)와 자산을 고려한 2차원적 자산업무분류스키마, 다양한 정량가치와 정성가치의 평가방법을 제시하고 특히 무형자산 평가시의 평가자의 주관성 문제의 단점을 보완할 수 있는 베타분포형 델파이 방법은 제안하고자 한다.

Accuracy of Phishing Websites Detection Algorithms by Using Three Ranking Techniques

  • Mohammed, Badiea Abdulkarem;Al-Mekhlafi, Zeyad Ghaleb
    • International Journal of Computer Science & Network Security
    • /
    • 제22권2호
    • /
    • pp.272-282
    • /
    • 2022
  • Between 2014 and 2019, the US lost more than 2.1 billion USD to phishing attacks, according to the FBI's Internet Crime Complaint Center, and COVID-19 scam complaints totaled more than 1,200. Phishing attacks reflect these awful effects. Phishing websites (PWs) detection appear in the literature. Previous methods included maintaining a centralized blacklist that is manually updated, but newly created pseudonyms cannot be detected. Several recent studies utilized supervised machine learning (SML) algorithms and schemes to manipulate the PWs detection problem. URL extraction-based algorithms and schemes. These studies demonstrate that some classification algorithms are more effective on different data sets. However, for the phishing site detection problem, no widely known classifier has been developed. This study is aimed at identifying the features and schemes of SML that work best in the face of PWs across all publicly available phishing data sets. The Scikit Learn library has eight widely used classification algorithms configured for assessment on the public phishing datasets. Eight was tested. Later, classification algorithms were used to measure accuracy on three different datasets for statistically significant differences, along with the Welch t-test. Assemblies and neural networks outclass classical algorithms in this study. On three publicly accessible phishing datasets, eight traditional SML algorithms were evaluated, and the results were calculated in terms of classification accuracy and classifier ranking as shown in tables 4 and 8. Eventually, on severely unbalanced datasets, classifiers that obtained higher than 99.0 percent classification accuracy. Finally, the results show that this could also be adapted and outperforms conventional techniques with good precision.

한의학 연구개발과제 분류에 관한 연구 (A Classification for Research Projects in Oriental Medicine Field)

  • 김상균;김철;장현철;예상준;송미영
    • 정보관리학회지
    • /
    • 제25권4호
    • /
    • pp.309-326
    • /
    • 2008
  • 국가 R&D 사업관리 시스템에서는 국내의 국가 연구개발과제 정보를 관리하고 검색할 수 있도록 하고 있다. 특히 연구개발과제들을 분류하고 다양한 검색 및 분석 서비스를 제공하기 위해서 다양한 분류체계를 이용하고 있다. 하지만 하나의 분류체계에 대해 하나의 분류만 입력 가능하도록 하고 있기 때문에 과제의 성격을 명확히 파악하는데 어려움이 있다. 또한 연구개발과제를 위한 분류체계는 모든 분야에 대한 일반적인 분류를 제공하고 있으나 한의학과 같은 특정 분야에 맞는 분류체계는 제공하지 않고 있다. 반면에 한의학 분야에서는 한의학에 대한 분류체계 연구가 진행되어 왔지만 이 분류체계 또한 한의학 전반에 관한 일반적인 분류이기 때문에 한의학 연구개발과제를 위한 분류로는 적합하지 않는 문제가 있다. 따라서 본 연구에서는 이러한 문제를 해결하기 위해 한의학 분야의 연구개발과제들의 성격을 명확히 파악하고 검색 및 분석에 활용할 수 있는 분류를 제안한다.

Prototype Reduction Schemes와 Mahalanobis 거리를 이용한 Relational Discriminant Analysis (Relational Discriminant Analysis Using Prototype Reduction Schemes and Mahalanobis Distances)

  • 김상운
    • 전자공학회논문지CI
    • /
    • 제43권1호
    • /
    • pp.9-16
    • /
    • 2006
  • RDA(Relational Discriminant Analysis)는 패턴의 특징벡터 대신에 학습 패턴을 대표하는 프로토타입들과의 비유사도 벡터에 기반하여 식별기를 설계하는 방법이다. 따라서 RDA 식별기의 성능은 프로토타입을 선택하는 방법과 비유사도를 측정하는 방법에 따라 결정된다. 본 논문에서는 PRS(Prototype Reduction Schemes)를 이용하여 프로토타입을 추출한 다음, 샘플 벡터들간의 마할라노비스 거리에 의한 상관행렬로 RDA의 식별성능을 향상시키는 방법을 제안한다. 인공 데이터 및 실-생활 데이터를 대상으로 실험한 결과, 제안한 방법의 식별성능이 기존의 방법에 비하여 개선되었음을 확인하였다.

상품 데이터베이스의 동적 특성을 지원하는 분류 모형 (A Classification Model Supporting Dynamic Features of Product Databases)

  • 김동규;이상구;최동훈
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.165-178
    • /
    • 2005
  • 상품 분류체계는 상품 데이터베이스를 설계하는 토대이며 전자상거래에서 상품 정보의 관리 및 활용에 관한 거의 모든 면에서 중심적 역할을 한다. 상품 정보의 효율적이고 편리한 활용을 위해 각 사용자의 관점에 따른 다양한 뷰를 제공할 필요가 있다. 새로운 상품이 출현하고 기존 상품이 사라짐에 따라 분류체계도 이에 따라 일관성을 유지하면서 변경 및 진화해야 한다. 또한 이질적인 다른 분류체계와 매핑되거나 병합될 필요가 있으며, 이 때 정보의 손실을 줄이는 것이 중요하다. 이들 요구사항에 대해, 분류체계는 제한된 시간 및 비용 내에서 수용할 수 있도록 충분히 동적이어야 한다. 그러나, UNSPSC 및 eCl@ss와 같이 현재 널리 사용중인 분류체계는 이러한 동적인 특성에 대한 요구사항을 만족시키지 못한다. 상품 정보는 재료, 시간, 장소 통의 속성과 무결성 조건과 같은 많은 의미를 지니고 있다. 이 논문에서는 상품 데이터베이스의 동적 특성 및 이에 대한 기존 코드 기반 분류 체계의 한계점을 분석하고, [1]에서 제안된 의미적 분류 모형이 상품 데이터베이스의 동적 특성에 관한 요구사항을 만족시킨다는 것을 설명한다. 이 모형은 상품 클래스를 명시적이고 형식적으로 정의할 수 있는 수단을 제공하며, 상품 클래스 간의 관계를 그래프로 구성한다.

기계학습에 기초한 자동분류의 성능 요소에 관한 연구 (An Analytical Study on Performance Factors of Automatic Classification based on Machine Learning)

  • 김판준
    • 정보관리학회지
    • /
    • 제33권2호
    • /
    • pp.33-59
    • /
    • 2016
  • 국내 학술회의 논문으로 구성된 문헌집합을 대상으로 기계학습에 기초한 자동분류의 성능에 영향을 미치는 요소들을 검토하였다. 특히 구현이 쉽고 컴퓨터 처리 속도가 빠른 로치오 알고리즘을 사용하여 "한국정보관리학회 학술대회 논문집"의 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 분류기 생성 방법, 학습집합 규모, 가중치부여 기법, 범주 할당 방법 등 주요 요소들의 특성을 다각적인 실험을 통해 살펴보았다. 결과적으로 분류 환경 및 문헌집합의 특성에 따라 파라미터(${\beta}$, ${\lambda}$)와 학습집합의 크기(5년 이상)를 적절하게 적용하는 것이 효과적이며, 동등한 성능 수준이라면 보다 단순한 단일 가중치부여 기법을 사용하여 분류의 효율성을 높일 수 있음을 발견하였다. 또한 국내 학술회의 논문의 분류는 특정 논문에 하나 이상의 범주가 부여되는 복수-범주 분류(multi-label classification)가 실제 환경에 부합한다고 할 수 있으므로, 이러한 환경을 고려하여 주요 성능 요소들의 특성에 기초한 최적의 분류 모델을 개발할 필요가 있다.

전자 카탈로그를 위한 의미적 분류 모형 (A Semantic Classification Model for e-Catalogs)

  • 김동규;이상구;전종훈;최동훈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권1호
    • /
    • pp.102-116
    • /
    • 2006
  • 전자 카탈로그는 시장 참여자들이 제공하는 상품과 서비스에 대한 정보를 가지고 있으며 결과적으로 전자 상거래의 근간을 형성하고 있다. 카탈로그의 관리는 여러 가지 요소에 의해 복잡해지는데, 상품 분류는 이들의 핵심 요소이다. 분류 계층 구조는 지출 분석, 관세 규제의 실행, 상품의 식별 등을 위해 활용된다. 이와 같이 상품 분류 체계는 상품 데이타베이스의 설계에 토대가 되고, 상품 정보의 활용 및 관리의 거의 모든 면에서 중심적 역할을 한다. 그러나, 데이타 모형, 연산, 의미론 등의 측면에서 상품 분류에 대한 형식적인 연구는 거의 없었다. 분류에 관한 논리적 모형의 부재는 분류에 대해서뿐만 아니라 일반적인 상품 데이타베이스에 대해서도 비일관성 및 비융통성 등 많은 문제를 야기시킨다. 상품 정보의 효율적이고 편리한 활용을 위해 각 사용자의 관점에 따른 다양한 뷰를 제공할 필요가 있다. 새로운 상품이 출현하고 기존 상품이 사라짐에 따라 분류체계도 이에 따라 일관성을 유지하면서 변경 및 진화해야 한다. 또한 이질적인 다른 분류체계와 매핑되거나 병합될 필요가 있으며, 이 때 정보의 손실을 줄이는 것이 중요하다. 이들 요구사항에 대해, 분류체계는 제한된 시간 및 비용 내에서 수용할 수 있도록 충분히 동적이어야 한다. 그러나, UNSPSC 및 eClass와 같이 현재 널리 사용중인 분류체계는 이러한 동적인 특성에 대한 요구사항을 만족시키지 못한다. 이 논문에서 우리는 상품 분류 체계의 의미를 이해하고, 기존의 분류 체계의 이면에 있는 의미를 포획하여 표현할 수 있는 방법으로 의미적 분류 모형을 제시하고자 한다. 상품 정의는 재료, 시간, 장소 등의 속성과 무결성 조건과 같은 많은 의미를 지니고 있다. 상품 데이타베이스의 동적 특성 및 이에 대한 기존코드 기반 분류 체계의 한계점을 분석하고, 제안된 의미적 분류 모형이 상품 데이타베이스의 동적 특성에 관한 요구사항을 만족시킨다는 것을 설명한다. 이 모형은 상품 클래스를 명시적이고 형식적으로 정의할 수 있는 수단을 제공하며, 상품 클래스간의 관계를 그래프로 구성한다. 이 모형은 분류 체계의 매핑을 용이하게 하며, 선행 연구에 의해 제기된 요구 사항 및 문제를 해결한다고 믿는다.

기독교 분야 내부보조표 설정에 관한 연구 - 한국십진분류법 제5판을 중심으로 - (A Study on Building Internal Tables in Christianity of the 5th Edition of Korean Decimal Classification)

  • 정유나;정연경
    • 한국비블리아학회지
    • /
    • 제24권3호
    • /
    • pp.29-51
    • /
    • 2013
  • 본 연구의 목적은 한국십진분류법 제5판의 기독교 분야에 내부보조표를 설정하여 체계적이고 상세한 전개가 가능하도록 분류표를 개발하는 것이다. 이를 위해 기독교의 학문적 범주와 분류체계 분석, 내부보조표에 대한 분석, 이를 바탕으로 한 내부보조표의 설계 및 적용 후 평가를 수행하였다. 학문적 범주를 설정하기 위해 기독교 개론서의 목차를 분석하였으며 분류표 개발을 위해 DDC, UDC, NDC, LCC, 유니온 신학분류법, 한국교회문헌분류법의 분류체계와 내부보조표를 비교하였다. 이를 통해 성경, 설교, 예배, 교회사 분류항목의 신설과 내부보조표를 설정하였으며 이를 도서관의 실무자와 학계 전문가에게 평가받고 수정 보완하였다. 이러한 내부보조표의 설정은 상세 분류를 통해 검색의 효율성을 높이고 향후 다른 분야의 내부보조표 개발의 기초 자료로 활용될 것이다.

문서 분류를 위한 용어 가중치 기법 비교 (Comparison of term weighting schemes for document classification)

  • 정호영;신상민;최용석
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.265-276
    • /
    • 2019
  • 문서-용어 빈도행렬은 텍스트 마이닝에서 분석하고자 하는 개체 정보를 가지고 있는 일반적인 자료 형태이다. 본 연구에서 문서 분류를 위해 문서-용어 빈도행렬에 적용되는 기존의 용어 가중치인 TF-IDF를 소개한다. 추가하여 최근에 알려진 용어 가중치인 TF-IDF-ICSDF와 TF-IGM의 정의와 장단점을 소개하고 비교한다. 또한 문서 분류 분석의 질을 높이기 위해 핵심어를 추출하는 방법을 제시하고자 한다. 추출된 핵심어를 바탕으로 문서 분류에 있어서 가장 많이 활용된 기계학습 알고리즘 중에서 서포트 벡터 머신을 이용하였다. 본 연구에서 소개한 용어 가중치들의 성능을 비교하기 위하여 정확률, 재현율, F1-점수와 같은 성능 지표들을 이용하였다. 그 결과 TF-IGM 방법이 모두 높은 성능 지표를 보였고, 텍스트를 분류하는데 있어 최적화 된 방법으로 나타났다.

분류표에서 사용하는 보조표에 대한 연구 (A study of auxiliary schedules in classification)

  • 정해성
    • 한국도서관정보학회지
    • /
    • 제28권
    • /
    • pp.193-218
    • /
    • 1998
  • The purpose of this study is to analyze and compare of the structure of auxiliary schedules using in DDC, UDC, CC and BC. Auxiliary schedule whish are a n.0, ppended to schedule of all schemes of classification. They consist of items of form of presentation relationship, time, place, languages, racial, ethnic, national groups and persons and phase relation and the symbols of the different items can be added to classification numbers.

  • PDF