Search | Korea Science

Process Data Classification Using Backpropagation Neural Network and Statistical Processing (역전파 신경망과 통계적 처리를 이용한 공정 데이터 분류)

Kim, Sung-Mo;Kim, Byung-Whan
- Proceedings of the KIEE Conference
- /
- 2002.07d
- /
- pp.2743-2745
- /
- 2002
역전파 신경망과 데이터분포 특징을 고려한 새로운 알고리즘을 개발하였으며, 이를 플라즈마 데이터의 분류에 응용하였다. 데이터 분포는 통계적인 평균치와 표준편차를 이용하여 특징지었으며, 바이어스인자를 이용하여 9 종류의 데이터를 발생하였다. 각 데이터에 대하여 은닉층의 뉴런수를 변화시키며, 바이어스와 뉴런수에 따른 모델성능을 평균학습시간 (ATT), 평균예측정확도 (APA), 최적예측정확도 (BPA), 그리고 분류정확도 (CA) 측면에서 세분하여 분석하였다. ATT와 APA에 대해서는 최적화된 학습인자와 데이터 분류인자가 일치하였고, BPA와 CA는 일치하지 않았다. 두 인자간의 상호작용을 동시에 최적화함으로써 완전 분류를 달성하였다.
PDF

A Weight Boosting Method of Sentiment Features for Korean Document Sentiment Classification (한국어 문서 감정분류를 위한 감정 자질 가중치 강화 기법)

Hwang, Jaewon;Ko, Youngjoong
- Annual Conference on Human and Language Technology
- /
- 2008.10a
- /
- pp.201-206
- /
- 2008
본 논문은 한국어 문서 감정분류에 기반이 되는 감정 자질의 가중치 강화를 통해 감정분류의 성능 향상을 얻을 수 있는 기법을 제안한다. 먼저, 어휘 자원인 감정 자질을 확보하고, 확장된 감정 자질이 감정 분류에 얼마나 기여하는지를 평가한다. 그리고 학습 데이터를 이용하여 얻을 수 있는 감정 자질의 카이 제곱 통계량(${\chi}^2$ statics)값을 이용하여 각 문장의 감정 강도를 구한다. 이렇게 구한 문장의 감정 강도의 값을 TF-IDF 가중치 기법에 접목하여 감정 자질의 가중치를 강화시킨다. 마지막으로 긍정 문서에서는 긍정 감정 자질만 강화하고 부정 문서에서는 부정 감정 자질만 강화하여 학습하였다. 본 논문에서는 문서 분류에 뛰어난 성능을 보여주는 지지 벡터 기계(Support Vector Machine)를 사용하여 제안한 방법의 성능을 평가한다. 평가 결과, 일반적인 정보 검색에서 사용하는 내용어(Content Word) 기반의 자질을 사용한 경우 보다 약 2.0%의 성능 향상을 보였다.
PDF

Incremental Conceptual Clustering Using Modified Category Utility (변형된 Category Utility를 이용한 점진 개념학습)

Kim Pyo Jae;Choi Jin Young
- Proceedings of the Korean Institute of Intelligent Systems Conference
- /
- 2005.04a
- /
- pp.193-197
- /
- 2005
점진적 개념 학습 알고리즘인 COBWEB은 클래스 정보가 주어지지 않은 사례들(instances)을 분류하기 위하여 사례의 속성과 값에 근거하여 학습하며 각 노드가 유사한 사례들의 집합인 클래스에 해당하는 분류 트리를 생성하는 알고리즘이다. 유사한 사례들을 같은 클래스로 분류하기 위한 기준으로 category utility가 사용되며 이는 클래스 내부의 유사도와 클래스간의 차이점을 최대화하는 방향으로 클래스를 분류한다 기존의 COBWEB에 사용되는 category utility는 클래스 사이즈와 예측 정확성 사이의 tradeoff 관계로 볼 수 있으며, 이로 인하여 예측 정확성은 약간 감소하나 클래스 사이즈가 커지는 방향으로 학습이 진행 될 수 있는 편향성(bias)를 가지고 있다. 이는 분류 트리에 불필요한 클래스 노드들(spurious nodes)을 생성하게 하여 학습 결과인 클래스 개념을 이해하는뎨 어렵게 한다. 본 논문에서는 클래스와 그에 속하는 사례들의 속성-값 분포를 고려하여 클래스와 속성의 연관성에 비례한 가충치를 더한 변형된 category utility를 제안하고, dataset에 대한 실험을 통하여 제안된 category utility가 기존의 큰 클래스 사이즈를 선호하는 bias를 완화시킴을 보이고자 한다.
PDF

Film Line Scratch Detection using Neural Network and Morphological Filter (신경망과 모폴로지 필터를 이용한 스크래치 검출)

Kim Kyung-Tai;Kim Eun-Yi
- Proceedings of the Korean Information Science Society Conference
- /
- 2006.06b
- /
- pp.277-279
- /
- 2006
본 논문에서는 스크래치 텍스처 및 형태특성을 이용하여 모든 종류의 스크래치를 자동으로 검출 할 수 있는 방법을 제안한다. 제안한 방법은 텍스처 분류 단계와 형태 필터링 단계를 구성된다. 텍스처 분류단계에서는 스크래치의 텍스처 정보를 이용하여 입력영상의 각 화소를 스크래치와 비스크래래치 영역으로 분류한다. 이때 분류기로 신경망을 사용한다. 형태필터링단계에서는 스크래치의 형태정보에 기반하여 설계된 원소구조를 사용하는 모폴로지 필터를 사용하여 잘못 분류된 스크래치 영역을 제거한다. 제안된 방법의 평가를 위해 다양한 종류의 스크래치를 가진 영화 및 애니메이션 데이터에 대해 실험이 이루어 졌고, 그 결과 제안된 방법의 강건함과 효율성이 입증되었다.
PDF

Selecting Initial Training Set for Active Learning by Clustering (군집화 기법을 이용한 능동적 학습의 최초학습예제 선정)

강재호;류광렬
- Proceedings of the Korean Information Science Society Conference
- /
- 2003.10a
- /
- pp.16-18
- /
- 2003
기계학습의 분류(classification) 기술을 실제 문제에 적용하기 위해서는 카테고리(category)를 부여한 학습예제를 상당수 준비하여야 한다. 예제에 카테고리를 부여(labeling)하는 작업에는 무시할 수 없는 시간과 인력을 필요로 한다. 능동적 학습(active learning)은 동일한 수의 학습예제로 최대한의 성능을 달성하기 위하여 카테고리를 부여할 학습예제를 선별하는 전략이다. 능동적 학습은 현재까지 파악된 정보에 기반하여 분류기(classifier)를 생성하고, 생성된 분류기를 활용하여 카테고리를 부여받았을 때 가장 이득이 큰 예제들을 선정하여 사용자에게 문의하는 과정을 반복하여 수행한다. 만일 능동적 학습의 첫 학습단계에서 학습에 보다 유용한 예제들을 최초학습예제집합으로 선정한다면 같은 수의 학습예제로 더 나은 성능을 달성할 수 있을 것이다. 본 논문에서는 유사한 예제들은 동일한 카테고리에 속할 가능성이 높다는 일반적인 가정에 기반하여 예제들을 군집화(clustering)한 후, 생성된 각 군집을 대표할 수 있는 예제로 최초학습예제집합으로 구성하는 방안을 제안한다. 제안한 방안을 문서분류 문제를 대상으로 실험해 본 결과 최초학습예제들을 임의로 선정하는 방식보다 정확도가 높은 분류기를 생성할 수 있음을 확인하였다.
PDF

Intelligent Diagnosis System with Circuit Breaker (배선 진단 시스템 구성을 위한 지능형 차단 시스템)

Sung, Hwa-Chang;Park, Jin-Bae;Sho, Je-Yoon;Joo, Young-Hoon
- Proceedings of the KIEE Conference
- /
- 2007.07a
- /
- pp.304-305
- /
- 2007
본 논문에서는 진단부분에서 서버를 중심으로 받은 정보를 능동적으로 해석하고 이상 유무에 따른 차단 역할 수행하도록 하는 지능형 차단 시스템에 대한 알고리즘 개발을 목표로 하고 있다. 제안하고자 하는 분류 알고리즘이란, 저압 배선에서 받은 신호에 대한 해석과 더불어 이를 각 이상 정도에 따라 분류하는 것을 말한다. 일반적으로, TFDR을 통해 알아 낼 수 있는 이상 유무의 종류는 damage, open 그리고 short 등이다. 도선 이상의 종류 및 특성에 따른 분류를 위하여, 알고리즘 개발을 위한 사전 이론 조사 및 개요 구성을 목표로 하고 있다. 또한, 기존의 통신 선 상에서 이루어진 결과를 토대로 한 퍼지 분류 규칙 생성 및 분류 알고리즘 개발 역시 앞으로 수행 될 예정이며, 이를 통한 지능형 차단 시스템 구축이 최종 목표이다.
PDF

Feature Selection for Bio Named Entity Recognition from Biological Literature (바이오 문헌에서의 단백질, 유전자 객체 인식을 위한 특징 추출)

Kim, Tae-Wook;Li, Meijing;Tsendsuren, Munkhdalai;Ryu, Keun-Ho
- Proceedings of the Korean Information Science Society Conference
- /
- 2012.06c
- /
- pp.166-168
- /
- 2012
바이오 문헌으로부터의 의미 있는 객체 추출 및 상호작용 관계 추출은 수 많은 바이오 문헌으로부터 유용한 정보를 얻기 위한 필수적인 과정이다. 특히 문헌으로부터 유전자 또는 단백질 이름과 같은 바이오 객체를 정확하게 인지하는 것은 새로운 객체인식의 어려움과 객체를 찾기 위한 특징 패턴의 다양성으로 인해 도전적인 과제로 남아있다. 본 논문에서는 전처리 과정을 거친 문헌 데이터로부터 12개의 의미 있는 속성들을 선택하였다. 선택된 속성에 데이터마이닝 기법중 하나인 속성 추출 기법을 적용하여 객체를 분류하는데 있어 의미 있는 속성들을 추출하였다. 특징 추출 방법과 분류 알고리즘이 분류 성능에 미치는 영향을 평가하기 위해 각 방법의 정확도를 사용하여 분류 성능을 비교였으며, Gain Ratio Attribute Evaluation과 Symmetrical Uncertainty Attribute Evaluation 기법에 의해 추출된 속성이 가장 정확한 분류 성능을 보여주었다.

Automatic Construction and Evaluation of Movie Domain Korean Sentiment Dictionary (영화도메인 한국어 감성사전의 자동구축과 평가)

Cho, Heeryon;Choi, Sang-Hyun
- Proceedings of the Korea Information Processing Society Conference
- /
- 2015.04a
- /
- pp.585-587
- /
- 2015
본 연구에서는 네이버 영화평을 학습데이터로 사용하여 영화평 감성분류에 필요한 감성사전을 자동으로 구축하는 방법에 대해 제안한다. 이 때 학습데이터의 분량과 긍정/부정 영화평의 비율을 달리하여 네 가지의 학습데이터를 마련하고, 각 경우에 대하여 감성사전과 나이브베이즈(이하, NB) 분류기를 구축한 후, 이 둘의 성능을 비교했다. 네 종류의 학습데이터로 구축한 감성사전과 NB 분류기를 이용하여 영화평 감성 자동분류 성능을 비교한 결과, 네 경우의 평균 균형정확도는 감성사전이 78.2%, NB 분류기가 66.1%였다.
https://doi.org/10.3745/PKIPS.y2015m04a.585 인용 PDF

Research on Skype Traffic Classification (Skype 트래픽 분류에 관한 연구)

Lee, Sang-Woo;Jung, Ah-Joo;Lee, Hyun-Shin;Kim, Myung-Sup
- Proceedings of the Korea Information Processing Society Conference
- /
- 2009.04a
- /
- pp.1112-1115
- /
- 2009
네트워크 관리자 입장에서 효율적인 네트워크 관리를 위해 응용 프로그램 별 트래픽 분류의 중요성이 커지고 있다. 응용 프로그램 별 트래픽 분류를 위해 signature 기반, machine learning 방법들이 제안되고 있지만 p2p 방식의 Skype 응용프로그램에 대한 적용결과는 그 신뢰성이 떨어지고 있는 것은 사실이다. 본 논문에서는 Skype의 트래픽을 분류하기 위해 각 Client 마다 Skype application install 시 동적으로 변화하는 Port 를 알아내는 방법, UDP 패킷의 특정위치의 특정 signature, TCP signal flow의 특정위치 패킷에 대한 payload 크기 등을 이용한 Skype traffic 분류 방법을 제안한다. 제안된 방법론은 학내 네트워크에 적용하여 그 타당성을 TMA를 통해 검증하였다.
https://doi.org/10.3745/PKIPS.y2009m04a.1112 인용 PDF

Comparing the Performances of Intent Classifications by Encoder Layer (Encoder Layer를 이용한 의도 분류 성능 비교)

Ahn, Hyeok-Ju;Kim, Hye-Young
- Annual Conference on Human and Language Technology
- /
- 2021.10a
- /
- pp.410-413
- /
- 2021
본 논문에서는 분류 모델의 주류로 사용되고 있는 Encoder 기반 사전학습 모델(BERT, ALBERT, ELECTRA)의 내부 Encoder Layer가 하부 Layer에서는 Syntactic한 분석을 진행하고 상부 Layer로 갈수록 Semantic 한 분석을 진행하는 점, Layer가 구성됨에 따라 Semantic 정보가 Syntactic 정보를 개선해 나간다 점에 기반한 기존 연구 결과를 바탕으로 Encoder Layer를 구성함에 따라 어떻게 성능이 변화하는지 측정한다. 그리고 의도 분류를 위한 학습 데이터 셋도 분류하고자 하는 성격에 따라 Syntactic한 구성과 Semantic한 구성을 보인다는 점에 착안하여 ALBERT 및 ELECTRA를 이용한 의도 분류 모델을 구축하고 각 데이터 셋에 맞는 최적의 Encoder Layer 구성을 가지는 모델을 비교한 결과, 두 데이터 셋 간에 다른 Layer 구성을 보이는 점과 기존 모델보다 성능이 향상됨을 확인하였다.
PDF

Search Result 5,720, Processing Time 0.038 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)