Search | Korea Science

Automatic Document Classification Based on k-NN Classifier and Object-Based Thesaurus (k-NN 분류 알고리즘과 객체 기반 시소러스를 이용한 자동 문서 분류)

Bang Sun-Iee;Yang Jae-Dong;Yang Hyung-Jeong
- Journal of KIISE:Software and Applications
- /
- v.31 no.9
- /
- pp.1204-1217
- /
- 2004
Numerous statistical and machine learning techniques have been studied for automatic text classification. However, because they train the classifiers using only feature vectors of documents, ambiguity between two possible categories significantly degrades precision of classification. To remedy the drawback, we propose a new method which incorporates relationship information of categories into extant classifiers. In this paper, we first perform the document classification using the k-NN classifier which is generally known for relatively good performance in spite of its simplicity. We employ the relationship information from an object-based thesaurus to reduce the ambiguity. By referencing various relationships in the thesaurus corresponding to the structured categories, the precision of k-NN classification is drastically improved, removing the ambiguity. Experiment result shows that this method achieves the precision up to 13.86% over the k-NN classification, preserving its recall.
PDF KSCI

다중 시기/편광 SAR 자료를 이용한 지표 피복 구분

Park, No-Uk;Ji, Gwang-Hun;Gwon, Byeong-Du
- 한국지구과학회:학술대회논문집
- /
- 2005.09a
- /
- pp.79-84
- /
- 2005
이 논문에서는 구름과 같은 기상 상태의 제약 없이 자료 획득이 가능한 SAR 자료를 이용하여 토지 피복 특성을 구분하고자 하였다. 기존 단일 주파수, 편광 상태의 자료만을 제공하는 SAR 자료를 이용한 분류에서의 낮은 분류 정확도를 향상시키고자 이 논문에서는 다중 시기 C 밴드 자료이면서 서로 다른 편광 상태의 자료를 제공하는 Radarsat-1(HH)와 ENVISAT(VV) 자료를 분류에 이용하였다. 분류 기법으로 Random Forests를 적용한 결과, 단일 편광 상태의 자료만을 이용하였을 때에 비해서 보다 향상된 분류 정확도를 얻을 수 있었다.
PDF

Mobile App Clustering and Analyzing using Document Embedding (문서임베딩 기반 모바일 앱 분류 및 이를 이용한 마켓 분석)

Yoon, Yeo Chan;Pahk, Soo Myung;Lim, Heui Seok
- Annual Conference on Human and Language Technology
- /
- 2018.10a
- /
- pp.378-381
- /
- 2018
스마트폰이 출시된 이후로 수많은 어플리케이션이 모바일로 출시되고 있다. 본 논문에서는 모바일 앱을 자동으로 분류하는 방법에 대하여 제안한다. 제안한 방법은 딥러닝 기반의 문서 임베딩 방법을 기반으로 효과적으로 앱을 분류한다. 본 논문에서는 또한 제안한 방법을 이용하여 독점도, 포화도, 인기순위를 기준으로 실제 마켓을 분석한다.
PDF

The Study of Computer Game Classification (컴퓨터 게임의 분류 기법에 관한 연구)

김진용;이성환;황치정
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.04b
- /
- pp.679-681
- /
- 2001
컴퓨터 게임은 고부가가치를 올릴 수 있는 두뇌집약형 산업을 최근에는 게임을 하나의 학문으로 정립하여 이를 체계적으로 연구하여 정립하려는 노력이 활발히 진행중이다. 본 논문에서는 게임을 하나의 학문으로 정립시키기 위한 조사 논문으로 게임 분야에서 가장 기본적인 게임 분류 방법을 제시한다. 게임을 분류하기 위해서는 먼저 게임이 작동하는 플랫폼, 컨텐츠, 관측 시점으로 나누어 게임을 분류하고, 이를 근간으로 세분화하는 방법을 제시한다. 게임 분류 방법은 컴퓨터 게임의 정보검색, 데이터베이스 등에서 활용될 수 있다.
PDF

Classification of DNA Pattern Using Negative Selection (부정 선택을 이용한 DNA의 패턴 분류)

이동욱;심귀보
- Proceedings of the Korean Information Science Society Conference
- /
- 2003.10b
- /
- pp.766-768
- /
- 2003
인간 및 다른 생물들의 DNA 서열이 밝혀짐에 따라 DNA 서열 정보를 이용할 수 있는 계산적 처리방식에 대한 요구가 늘어나고 있다. 본 논문에서는 DNA의 패턴을 분류할 수 있는 면역계 부정 선택에 기반한 알고리즘을 제안한다. 부정 선택은 면역세포 생성시 자신을 인식하지 않는 항원 인식부를 생성하기 위한 과정이다. 이 항원 인식부를 통해 자기와 비자기를 구별한다. 이것을 n개의 자기 또는 비자기 집단으로 확장하고 n개의 항원 집단을 구성하면 n개의 패턴 분류가 가능하다. 본 논문에서는 부정 선택에 기반한 DNA 염기 레벨에서의 패턴 분류방법과 아미노산 레벨에서의 패턴분류 방법을 제안한다.
PDF

A Question Type Classifier Using a Support Vector Machine (지지 벡터 기계를 이용한 질의 유형 분류기)

An, Young-Hun;Kim, Hark-Soo;Seo, Jung-Yun
- Annual Conference on Human and Language Technology
- /
- 2002.10e
- /
- pp.129-136
- /
- 2002
고성능의 질의응답 시스템을 구현하기 위해서는 사용자의 질의 유형의 난이도에 관계없이 의도를 파악할 수 있는 질의유형 분류기가 필요하다. 본 논문에서는 문서 범주화 기법을 이용한 질의 유형 분류기를 제안한다. 본 논문에서 제안하는 질의 유형 분류기의 분류 과정은 다음과 같다. 우선, 사용자 질의에 포함된 어휘, 품사, 의미표지와 같은 다양한 정보를 이용하여 사용자 질의로부터 자질들을 추출한다. 이 과정에서 질의의 구문 특성을 반영하기 위해서 슬라이딩 윈도 기법을 이용한다. 또한, 다량의 자질들 중에서 유용한 것들만을 선택하기 위해서 카이 제곱 통계량을 이용한다. 추출된 자질들은 벡터 공간 모델로 표현되고, 문서 범주화 기법 중 하나인 지지 벡터 기계(support vector machine, SVM)는 이 정보들을 이용하여 질의 유형을 분류한다. 본 논문에서 제안하는 시스템은 질의 유형 분류 문제에지지 벡터 기계를 이용한 자동문서 범주화 기법을 도입하여 86.4%의 높은 분류 정확도를 보였다. 또한 질의 유형 분류기를 통계적 방법으로 구축함으로써 lexico-syntactic 패턴과 같은 규칙을 기술하는 수작업을 배제할 수 있으며, 응용 영역의 변화에 대해서도 안정적인 처리와 빠른 이식성을 보장한다.
PDF

Multi-Modal based ViT Model for Video Data Emotion Classification (영상 데이터 감정 분류를 위한 멀티 모달 기반의 ViT 모델)

Yerim Kim;Dong-Gyu Lee;Seo-Yeong Ahn;Jee-Hyun Kim
- Proceedings of the Korean Society of Computer Information Conference
- /
- 2023.01a
- /
- pp.9-12
- /
- 2023
최근 영상 콘텐츠를 통해 영상물의 메시지뿐 아니라 메시지의 형식을 통해 전달된 감정이 시청하는 사람의 심리 상태에 영향을 주고 있다. 이에 따라, 영상 콘텐츠의 감정을 분류하는 연구가 활발히 진행되고 있고 본 논문에서는 대중적인 영상 스트리밍 플랫폼 중 하나인 유튜브 영상을 7가지의 감정 카테고리로 분류하는 여러 개의 영상 데이터 중 각 영상 데이터에서 오디오와 이미지 데이터를 각각 추출하여 학습에 이용하는 멀티 모달 방식 기반의 영상 감정 분류 모델을 제안한다. 사전 학습된 VGG(Visual Geometry Group)모델과 ViT(Vision Transformer) 모델을 오디오 분류 모델과 이미지 분류 모델에 이용하여 학습하고 본 논문에서 제안하는 병합 방법을 이용하여 병합 후 비교하였다. 본 논문에서는 기존 영상 데이터 감정 분류 방식과 다르게 영상 속에서 화자를 인식하지 않고 감정을 분류하여 최고 48%의 정확도를 얻었다.
PDF

Development of Intelligent Diagnosis System using Fuzzy Classifier (퍼지 분류기를 이용한 지능형 차단 시스템 개발)

Sung, Hwa-Chang;Joo, Young-Hoon;Park, Jin-Bae
- Proceedings of the KIEE Conference
- /
- 2008.07a
- /
- pp.1785-1786
- /
- 2008
본 논문에서는 저압 배선 진단 시스템 구축을 위한 퍼지-베이시안 분류기 기반 지능형 차단 시스템 개발을 목표로 한다. Time-Frequency Domain Reflectometry (TFDR)방법이 바탕이 되어 도선의 이상 상태를 측정하게 되며, 진단 부분에서 받은 정보를 능동적으로 해석하고 이상 유무에 따른 차단의 역할을 수행하는 시스템 개발이 최종 목표이다. 제안하고자 하는 분류 알고리즘은 퍼지-베이시안 분류 알고리즘을 중심으로 구성되며, 분류하고자 하는 도선의 이상상태인 damage, open 그리고 short에 대한 분류 기준을 마련하고자 한다. 또한, 실제 저압 배선에서 얻어진 데이터를 바탕으로 퍼지 분류 규칙의 생성 및 분류 알고리즘 생성을 구체화하여 좀 더 나은 성능의 분류기를 개발하고자 하는 것이 본 논문의 목표이다.
PDF

Improving Performance for $Na{\ddot{i}}ve$ Bayes Classifier Using Virtual Examples (가상예제를 이용한 $Na{\ddot{i}}ve$ Bayes 분류기 성능 향상)

Lee Yujung;Kang Byoungho;Kang Jaeho;Ryu Kwang Ryel
- Proceedings of the Korean Information Science Society Conference
- /
- 2005.11b
- /
- pp.655-657
- /
- 2005
기계학습에서 분류는 훈련 예제들로 학습하여 생성한 분류기를 활용하여 새로운 예제에 어느 한 범주를 부여하는 것을 말한다. 일반적으로 분류의 성능 즉 정확도의 향상은 학습 알고리즘을 개선하거나 훈련예제 집합을 변형시킴으로써 가능하다. 본 논문에서 소개하는 가상예제를 이용한 분류기 성능 향상 방안은 후자에 속한다. 실세계 분류문제에서 많은 수의 훈련예제들을 수집하는 일은 대상문제에 따라 비용이 많이 드는 경우가 있다. 또한 적은 수의 훈련예제를 학습해 생성한 분류기는 분류성능이 좋지 않을 수 있다. 본 논문에서는 이런 문제를 해결하기 위해서 가상예제를 생성해 훈련예제 집합에 추가하는 방안을 제안하고자 한다. 가상예제를 이용한 분류성능 향상방안이 $Na{\ddot{i}}ve$ Bayes 학습 알고리즘 성능 개선에 효과가 있음을 실험을 통해 확인하였다.
PDF

A Classification Model for the Educational Repository System (교육용 저장소 시스템을 위한 분류 모델)

Choi Myoung-Hoi;Jeong Dong-Won
- Proceedings of the Korean Information Science Society Conference
- /
- 2006.06c
- /
- pp.76-78
- /
- 2006
이 논문에서는 교육용 저장소 관리 시스템의 자원들을 위한 분류체계를 제안한다. 생성되는 자원들에 대한 체계적인 저장관리, 정확한 검색 및 활용을 위해서는 적절한 분류체계가 우선적으로 요구된다. 여러 가지 자원들에 대한 효율적이고 편리한 활용을 위하여 자원들의 관점에 따른 다양한 뷰를 제공해야 하고 뷰가 생성과 소멸에 따라 분류체계도 일관성 있게 유지 및 변경되어야 한다. 이 논문에서는 교육 자원들 중에서 학습활동에서 생성되는 구현자원들에 대한 체계적인 관리 및 활용성 향상을 위한 분류체계를 제안한다. 관련된 과학기술분야 분류체계들을 바탕으로 구현자원들에 적합한 분류체계를 정의하며 동적 분류체계 관리 방법을 제안한다. 제안된 분류체계 및 관리 모델은 보다 정확하고 체계적인 구현자원에 대한 관리를 가능하게 하며 또한 활용의 용이성을 향상시킨다.
PDF

Search Result 12,480, Processing Time 0.042 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)