• Title/Summary/Keyword: 논문 분류

Search Result 12,480, Processing Time 0.039 seconds

A Study on Incremental Learning Model for Naive Bayes Text Classifier (Naive Bayes 문서 분류기를 위한 점진적 학습 모델 연구)

  • 김제욱;김한준;이상구
    • Proceedings of the Korea Database Society Conference
    • /
    • 2001.06a
    • /
    • pp.331-341
    • /
    • 2001
  • 본 논문에서는 Naive Bayes 문서 분류기를 위한 새로운 학습모델을 제안한다. 이 모델에서는 라벨이 없는 문서들의 집합으로부터 선택한 적은 수의 학습 문서들을 이용하여 문서 분류기를 재학습한다. 본 논문에서는 이러한 학습 방법을 따를 경우 작은 비용으로도 문서 분류기의 정확도가 크게 향상될 수 있다는 사실을 보인다. 이와 같이, 알고리즘을 통해 라벨이 없는 문서들의 집합으로부터 정보량이 큰 문서를 선택한 후, 전문가가 이 문서에 라벨을 부여하는 방식으로 학습문서를 결정하는 것을 selective sampling이라 한다. 본 논문에서는 이러한 selective sampling 문제를 Naive Bayes 문서 분류기에 적용한다. 제안한 학습 방법에서는 라벨이 없는 문서들의 집합으로부터 재학습 문서를 선택하는 기준 측정치로서 평균절대편차(Mean Absolute Deviation), 엔트로피 측정치를 사용한다. 실험을 통해서 제안한 학습 방법이 기존의 방법인 신뢰도(Confidence measure)를 이용한 학습 방법보다 Naive Bayes 문서 분류기의 성능을 더 많이 향상시킨다는 사실을 보인다.

  • PDF

Research Trends and Issues of Records and Archives Classification in Korea (기록분류에 관한 국내 연구 동향과 과제)

  • Seol, Moon-Won
    • Journal of Korean Society of Archives and Records Management
    • /
    • v.12 no.3
    • /
    • pp.203-232
    • /
    • 2012
  • The study aims at reviewing research trends of records classification and archival arrangement, analysing issues, and suggesting futures tasks in related research area. It starts with defining research categories of records and archives classification through analysing the term of 'classification' being found in the Public Records Management Act. Thirty five research papers which are covering classification of records and archives and published in 1980's are selected for contents analysis. Considering the analysis of domestic and foreign research, and the practical needs, it makes clear the issues and tasks for future research. The study concludes with emphasizing more empirical research for guiding records and archives management and reformulating archival theories in electronic environments.

A Scheme to Categorize Ubiquitous Sensor Network Services and Their Practical Issues (유비쿼터스 센서네트워크 서비스 분류 기법 및 상용화 이슈)

  • Eun, Seongbae;So, Sun Sup;Chae, Yigeun
    • IEMEK Journal of Embedded Systems and Applications
    • /
    • v.2 no.3
    • /
    • pp.202-208
    • /
    • 2007
  • Recently, a lot of research have been studied to apply wireless sensor networks to USN applications. The characteristics of USN applications is that they are varied according to the sort of sensors and sensing objects. They includes military applications, water pollusion monitoring, intelligent traffic system, farm, logistics, location position applications, and so on. There is no traditional method to classify these applications. In this paper, we propose a taxonomy scheme to classify USN applications. The criteria is based on 3 properties, the criticalness of services, the mobility of sensing entity, and the mobility of sensed objects, to classify them into 8 groups. We also describe the technical issues and related works in them. Our taxonomy can make USN applications to be easily understood and memorized.

  • PDF

Import Vector Voting Model for Multi-pattern Classification (다중 패턴 분류를 위한 Import Vector Voting 모델)

  • Choi, Jun-Hyeog;Kim, Dae-Su;Rim, Kee-Wook
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.13 no.6
    • /
    • pp.655-660
    • /
    • 2003
  • In general, Support Vector Machine has a good performance in binary classification, but it has the limitation on multi-pattern classification. So, we proposed an Import Vector Voting model for two or more labels classification. This model applied kernel bagging strategy to Import Vector Machine by Zhu. The proposed model used a voting strategy which averaged optimal kernel function from many kernel functions. In experiments, not only binary but multi-pattern classification problems, our proposed Import Vector Voting model showed good performance for given machine learning data.

Study on Classification Scheme for Multilateral and Hierarchical Traffic Identification (다각적이고 계층적인 트래픽 분석을 위한 트래픽 분류 체계에 관한 연구)

  • Yoon, Sung-Ho;An, Hyun-Min;Kim, Myung-Sup
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.3 no.2
    • /
    • pp.47-56
    • /
    • 2014
  • Internet traffic has rapidly increased due to the supplying wireless devices and the appearance of various applications and services. By increasing internet traffic rapidly, the need of Internet traffic classification becomes important for the effective use of network resource. However, the traffic classification scheme is not much studied comparing to the study for classification method. This paper proposes novel classification scheme for multilateral and hierarchical traffic identification. The proposed scheme can support multilateral identification with 4 classification criteria such as service, application, protocol, and function. In addition, the proposed scheme can support hierarchical analysis based on roll-up and drill-down operation. We prove the applicability and advantages of the proposed scheme by applying it to real campus network traffic.

Document Autoclustering for Web Agent (웹 에이전트를 위한 문서 자동 분류)

  • 양찬범;박영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.54-56
    • /
    • 1999
  • 웹 에이전트는 사용자가 웹을 브라우징하는 행위를 모니터하여 사용자의 관심정보를 학습하고 사용자가 필요로 한느 웹 상의 정보를 제공하는 시스템이다. 웹 에이전트는 사용자의 관심정보를 추출하기 위해서 귀납적 기계학습을 수행한다. 이때, 학습의 효율을 높이기 위해서는 관련이 있는 문서들을 그룹화하여 학습 시스템에 제공하여야 한다. 본 논문에서는 비감독 개념 학습 알고리즘인 COBWEB을 이용하여 사용자가 관심을 표시한 문서들의 분류트리를 생성한다. 분류트리는 귀납적 기계학습 시스템의 입력으로 사용될 수 있는 형태가 아니므로 분류 트리의 분석과 문서 분류 후처리 작업을 통해서 문서 집합을 생성해야 한다. 이를 위해서는 분류트리를 분석하여 초기 클러스터를 생성하고, 유사한 클러스터들의 병합을 수행한다. 본 논문에서 제안하는 문서 자동 분류 방식은 비감독 개념 학습 알고리즘이 생성한 문서 분류 트리의 분석을 통해서 충분한 유사도와 적절한 수의 문서를 포함하는 초기 클러스터를 생성할 수 있다. 그러므로 문서 분류의 후처리 작업인 클러스터의 병합 작업에서 불필요한 작업을 제거함으로서 보다 효과적이고 합리적인 문서 분류 작업을 수행한다.

  • PDF

Fingerprint Classification Using Core Points and Flow-line Tracing (Core point와 Flow-line 추적을 이용한 지문 영상의 분류)

  • 박철현;오상근;이경환;김현순;박길흠
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.4B
    • /
    • pp.505-513
    • /
    • 2001
  • 지문영상의 분류는 데이터베이스의 용량이 클 경우 검색시간을 효율적으로 단축시킬 수 있는 핵심적인 기술이다. 따라서 본 논문에서 core point 와 flow-line 추적을 이용한 효율적인 지문 영상 분류 기법을 제안한다. 제안한 방법은 특히 압착 날인된 지문 영상의 분류에 적합한 방법으로 크게 2단계로 이루어져 있다. 첫 번째 단계에서는 먼저 Poincare index를 이용하여 core point를 찾아내고 이를 바탕으로 개략적인 분류를 수행한다. 그 다음 두 번째 단계에서는 core point를 중심으로 flow-line을 추적하여 그 결과를 가지고 세부적인 분류를 수행한다. 세부분류 단계에서는 평활화된 블록의 방향정보를 이용한 효과적인 flow-line 추적 알고리즘과 이를 이용한 새로운 분류 방법이 제안된다. 제안한 방법은 회전이나 이동 그리고 약간의 잡음에 강인한 지문 분류 방법으로 지문입력기를 통하여 획득된 700장의 지문 영상에 적용해 본 결과 93.6%의 분류율을 나타내었다.

  • PDF

A Study on the Advanced Classification and Naming Convention of Malicious Code (개선된 악성 코드 분류지침 및 명명법에 관한 연구)

  • Kwak, Hyo-Seung;Kim, Pan-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11b
    • /
    • pp.1095-1098
    • /
    • 2002
  • 국내외 카 백신업체별로 악성 코드의 분류 체계가 마련되어 있지만 각각의 백신업체별로 분류 체계가 차이가 있고 또한 도스 운영체제 때부터 사용한 분류 체계를 그대로 사용하여 현재의 악성 코드 분류와는 많은 차이를 보이고 있다. 이러한 백신업체들의 악성 코드 분류를 정착하게 분류하는 방법으로 본 논문에서 새로운 악성 코드 분류지침과 분류지침에 의한 명명법을 제안한다. 본 논문에서 제안한 분류지침을 토대로 안티-바이러스 산업 및 악성 코드 연구를 활성화시키는 정책 수립의 기초 자료를 사용한 수 있으며, 악성 코드 정보의 체계화 통합화 표준화 등에 기여할 수 있다.

  • PDF

Reconstruction of E-mail Category Using Dynamic Category Hierarchy and Document Summarization (문서요약 및 동적 분류체계를 사용한 E-mail 분류의 재구성)

  • Ahn, Chan-Min;Park, Sun;Kim, Tae-Soon;Choi, Bum-ghi;Lee, Ju-Hong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.511-514
    • /
    • 2004
  • 현재의 이메일 분류는 규칙기반, 베이시안, SVM 등을 이용하여 스팸메일을 필터링 하는 이원분류가 주로 연구되어지고 있고, 이외에도 다원분류에 대한 연구로는 클러스터링을 이용한 방법이 있다. 그러나 클러스터링에 의한 방법은 단순히 유사도에 의해 메일을 묶는 수준에 그치고 있다. 본 논문에서는 자동 문서요약 방법과 동적분류체계 방법을 결합하여 새로운 이메일 자동 다원분류 방법을 제안했다. 본 논문에서 제안한 방법은 이메일을 자동으로 분류하며 분류한 결과를 검색할 때 사용자의 요구사항을 만족하지 못하면 재분류하여 분류 빛 검색의 정확성을 높였다.

  • PDF

Binary Classifier Construction for U87 Cell Shapes using Fourier Shape Descriptor and SVM (퓨리에 형태표현자와 SVM 을 이용한 U87 세포의 형태학적 분류기 모델구축)

  • Kang, Mi-Sun;Kim, Jeong-Sik;Kim, Myoung-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.751-753
    • /
    • 2010
  • 본 논문에서는 위상차 현미경 영상 내 U87 세포의 정확한 형태학적 분류를 위한 이진 분류기 구축 방법을 제안한다. 본 방법은 Fourier descriptor 기반 세포형상 표현을 SVM 이진분류기 구축에 사용함으로써 분류 대상인 원추형과 원형세포에 대해 영상 내 세포의 위치와 회전, 크기의 변화에 대해 강인한 분류성능을 제공한다. 본 실험을 통해 polynomial 커널에서 학습된 SVM 분류기가 linear, RBF, sigmoid 에 비교하여 가장 정확한 분류 성능을 보임을 확인하였다. 본 연구는 논문상 기준인 두 종류의 세포 형태 분류기를 기반 프레임워크로 삼아 좀더 다양한 세포 형태를 분류할 수 있도록 개선된다면 악성뇌종양의 전이억제치료에 효과적인 전이행동분석에 도움을 줄 수 있을 것으로 기대된다.