Search | Korea Science

Performance Evaluation of a Naive Bayesian Classifier using various Feature Selection Methods (자질선정에 따른 Naive Bayesian 분류기의 성능 비교)

국민상;정영미
- Proceedings of the Korean Society for Information Management Conference
- /
- 2000.08a
- /
- pp.33-36
- /
- 2000
베이즈 확률을 이용한 분류기는 자동분류 초기부터 사용되어 아직까지 이 분야에서 가장 많이 사용되는 분류기 중 하나이다. 본 논문에서는 KTSET 문서에서 임의로 추출한 198건의 정보과학회 관련 논문의 제목 및 초록을 대상으로 베이즈 확률을 이용한 문서의 자동분류 실험을 수행하였으며, 더불어 Naive Bayesian 분류기에 가장 적합한 자질선정 방법을 찾고자 카이제곱 통계량, 상호정보량 및 기대상호정보량, 정보획득량, 역문헌빈도, 역카테고리빈도 등 6가지의 자질선정 기준을 실험하였다. 실험 결과는 카이제곱 통계량을 이용한 분류 실험의 성능이 가장 좋았고, 기대상호정보량과 정보획득량, 역카테고리빈도 또한 자질수에 큰 영향을 받지 않고 비교적 안정적인 성능을 보였다.
PDF

Performance Evaluation of Machine Learning Classifiers for Cancer Classification (암 분류를 위한 기계학습 분류기의 성능평가)

Won, Hong-Hee;Cho, Sung-Bae
- Proceedings of the Korea Information Processing Society Conference
- /
- 2002.11a
- /
- pp.405-408
- /
- 2002
Microarray 기술의 발전으로 많은 양의 유전자 정보를 얻게 되어 암의 정확한 분류와 진단에 대한 기대가 커지고 있다. 암을 정확하게 분류하기 위해서는 추출된 유전자에 많은 잡음이 들어가기 때문에 암과 관련이 있는 유전자만을 추출할 필요가 있다. 본 논문에서는 여러 가지 유전자 추출방법과 다양한 분류기의 성능을 체계적으로 평가하기 위하여, 세 가지 벤치마크 암 데이터에 대하여 실험하여 보았다. 또한 분류 성능을 향상시키기 위하여 분류기를 적절하게 결합한 결과, 결합된 분류기의 성능을 확인해볼 수 있었다.
PDF

도메인 어댑테이션을 이용한 폰트 변화에 강인한 한글 분류기 개발

Park, Jaewoo;Lee, Eunji;Cho, Nam Ik
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2019.11a
- /
- pp.50-53
- /
- 2019
본 논문에서는 도메인 어댑테이션을 이용하여 폰트 변화에 강인한 한글 분류기를 학습하는 방법을 제안한다. 제안하는 네트워크 모델은 총 7 개로 이루어져 있으며 각각 이미지로부터 폰트에 무관한 정보를 추출하는 인코더, 추출된 정보의 유효성을 판단하기 위해 이미지 재합성에 사용되는 디코더, 재합성된 이미지의 글자 분류기, 폰트 분류기, 재합성된 글자의 정교함을 판단하는 판별기(discriminator), 그리고 인코더에서 추출된 정보에 대한 글자 분류기, 폰트 분류기이다. 본 논문에서는 적대적 생성 신경망의 학습법을 따르는 도메인 어댑테이션 기법을 이용하여 인코더의 추출 정보가 폰트 정보는 속이면서 글자 분류의 정확성은 높이도록 학습하였다. 학습 결과 인코더로부터 추출되는 정보들은 폰트에 무관한 성질을 지니면서 글자 분류에 높은 정확성을 띄었으며, 추가로 디코더에서 나오는 이미지들도 원본 폰트와 같은 이미지를 생성해 낼 수 있었다.
PDF

Survey of Efficient Traffic Classification Technique in SDN Environment (SDN 환경에서의 효율적인 트래픽 분류 기법 조사)

Kim, Min-Woo;Kim, Dong-Hyun;Lee, Byung-Jun;Kim, Kyung-Tae;Youn, Hee-Yong
- Proceedings of the Korean Society of Computer Information Conference
- /
- 2019.01a
- /
- pp.147-148
- /
- 2019
네트워크 응용 서비스들은 점점 더 복잡해지고 있으며, 네트워크 통신 기술의 발전과 함께 네트워크의 특성, 네트워크 관리 및 혼잡 제어에 대한 높은 요구 사항을 제시하므로 네트워크 트래픽 분류가 점점 더 중요해지고 있다. 트래픽 분류는 다양한 특성에 따라 네트워크 트래픽을 여러 클래스로 분류하여 처리하는 작업이다. 본 논문에서는 현재 네트워크 분야에서 적용된 여러 트래픽 분류 기법을 조사한다. 이를 통해 SDN(Software Defined Networking) 환경에서 효율적인 트래픽 분류가 가능한 기법 선택을 위해 비교하며 향후 연구를 위해 트래픽 분류 기법들을 소개한다.
PDF

Feature Selection by Genetic Algorithm and Information Theory (유전자 알고리즘과 정보이론을 이용한 속성선택)

Jo, Jae-Hun
- Proceedings of the Korean Institute of Intelligent Systems Conference
- /
- 2007.11a
- /
- pp.108-111
- /
- 2007
속성선택(Feature Selection)은 패턴분류 문제에서 분류기들의 성능을 향상시킬 수 있는 중요한 부분으로 다양한 기법들이 연구되어지고 있다. 특히, 많은 변수와 속성들을 가지는 데이터를 패턴분류 하는 과정에서 주요 속성부분집합을 추출하여 이용함으로써 분류기의 연산속도 및 정확도를 향상시킬 수 있다. 본 논문에서는 유전자 알고리즘과 정보이론의 상호정보량을 이용하여 속성선택을 하는 기법을 제안하였다. 제안된 기법의 성능을 평가하기 위하여 패턴분류 문제에 적용하고 그 성능이 우수함을 확인하였다.
PDF

Incremental Superised Learning based on SVM with Unlabeled Documents (레이블이 없는 문서를 이용한 SVM 기반의 점증적 지도학습)

김수영;조성배
- Proceedings of the Korean Information Science Society Conference
- /
- 2002.04b
- /
- pp.301-303
- /
- 2002
컴퓨터가 널리 보급되고 인터넷이 발전함에 따라 수없이 많은 정보가 디지털 형태로 생산되고 있다. 이러한 정보를 사람이 일일이 가공하고 분류하기에는 한계가 있으므로 자동으로 문서를 분류하고자 하는 연구가 대두되었다. 문서를 자동으로 분류하기 위해 기계학습 방법이 많이 이용되고 있다. 기계학습방법을 이용한 문서분류가 좋은 성능을 내기 위해서는 충분한 양의 학습데이터가 필요하다. 학습데이터를 만들기 위해서는 사람이 일일이 분류해야 하므로, 비용이 많이 든다. 본 논문에서는 적은양의 labeled 데이터로부터 시작하여, 점증적으로 unlabeled 데이터를 학습에 참여시킴으로써, 문서분류의 성능을 높이고자 한다. 실험을 통해 Unlabeled 문서데이터를 사용한 것이 좋은 성능을 보였음을 알 수 있다.
PDF

Comparative Analysis of Classification Schemes for Internet Resources (인터넷 정보자원의 조직을 위한 분류체계에 관한 비교분석)

최희윤
- Proceedings of the Korean Society for Information Management Conference
- /
- 1998.08a
- /
- pp.177-182
- /
- 1998
인터넷 정보자원의 폭발적인 증가에 따라 이를 효율적으로 조직화하고 체계화하는 시스템의 중요성이 증가하고 있다. 이에 따라 주제접근을 용이하게 하고 검색 효율성을 높이는 도구로서 분류체계에 대한 관심이 커지고 있다. 본고에서는 인터넷 서비스의 분류체계 응용사례중 주제별 디렉토리의 인터넷 기반 분류체계와 기존 문헌 분류체계를 비교 분석함으로써 인터넷 환경에 적합한 분류체계의 구성방안을 제시하였다.
PDF

Using Non-Lexical Features for Tweet Sentiment Classificaion (트윗 감정 분류를 위한 비어휘자질의 사용)

Hong, Cho-Hee;Kim, Harksoo
- Annual Conference on Human and Language Technology
- /
- 2012.10a
- /
- pp.160-162
- /
- 2012
문서를 대상으로 한 다양한 감정 분류 연구가 진행되어 왔으며, 최근에는 트윗 감정 분류에 그대로 적용되고 있다. 그러나 트윗은 일반 문서와 다르게 몇 가지의 독특한 특징을 갖고 있어 좋은 성능을 보이지 못하고 있다. 본 논문에서는 기계학습을 기반으로 트윗의 특징과 트윗 사용자 정보 자질을 사용한 실험으로 트윗 감정 분류 성능의 영향을 확인하였다. 실험 결과 트윗에 포함된 이모티콘 감정 극성과, 사용자 성향 극성 자질은 트윗 감정 분류 모델의 성능 향상에 기여를 하는 것을 알 수 있었다.
PDF

Gene Selection based on Class Information (클래스 정보에 기반한 유전자 선택)

Lee Hyunjin
- Proceedings of the Korea Information Processing Society Conference
- /
- 2004.11a
- /
- pp.469-472
- /
- 2004
여러 분류 문제에 다층퍼셉트론이 적용되어 좋은 성능을 보이고 있다. 하지만, 암 분류를 위한 분류기로 사용되는데 있어서 문제점은 샘플데이터 수에 비해 입력으로 사용되는 유전자의 수가 너무 많기 때문에 좋은 성능을 기대하기 힘들다는 점이다. 또한 많은 입력노드로 인해 가중치 파라메터들의 수가 증가하기 때문에 학습시에 계산량의 부담을 가중시킨다. 따라서 본 논문에서는 많은 유전자중에서 암분류에 중요한 영향을 끼치는 유전자를 선택하는 방법을 제안한다. 이러한 유전자 선택을 위하여 클래스의 정보를 나타내는 척도를 분석하고 이를 기반으로 하여 분류율을 향상시킬 수 있는 유전자를 선택하는 방법을 제안한다. 이렇게 선택된 유전자를 입력으로 하여 분류기를 구성하여, 제안하는 방법의 우수성을 검증한다.
PDF

Information Rate and Complexity based Classification of Campus Information & ASP Construction Plan (정보화율과 복잡도에 기반한 대학 정보시스템 분류 및 도입 방안)

Jeon, Byeong-Ho;Lim, Jae-Hyeon;Song, Jae-Sin
- Proceedings of the Korea Information Processing Society Conference
- /
- 2005.11a
- /
- pp.1363-1366
- /
- 2005
대학 정보시스템 분류를 기존의 통합성과 커스터마이징으로 분류하는 것을 현 실정에 맞게 현재의 정보화율을 고려한 어플리케이션 분류를 시도하였다. 전국 대학을 대상으로 실시한 설문조사를 통해 각 시스템의 통합성과 커스터마이징을 조사하여 ‘복잡도’라는 하나의 변수로 설정하였다. 대학에서 정보화가 가능한 모든 시스템에 대해 현재의 정보화율과 복잡도를 고려하여 대학 정보시스템을 분류하였다. 이 분류를 기준으로 ASP 방식을 도입하는 방안(로드맵)을 제시하였다. 분류 모델에 정보화율을 도입함으로써 현재의 상황을 고려한 어플리케이션 분류 모델을 제시하였다. 이 분류 모델은 각 분야에 있어 정보화율에 따른 단계적 ASP 도입 방안 마련에 기초적 기준이 될 것이다.
PDF

Search Result 11,349, Processing Time 0.04 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)