• Title/Summary/Keyword: 속성분류

Search Result 857, Processing Time 0.024 seconds

A Dynamic feature Weighting Method for Case-based Reasoning (사례기반 추론을 위한 동적 속성 가중치 부여 방법)

  • 이재식;전용준
    • Journal of Intelligence and Information Systems
    • /
    • v.7 no.1
    • /
    • pp.47-61
    • /
    • 2001
  • Lazy loaming methods including CBR have relative advantages in comparison with eager loaming methods such as artificial neural networks and decision trees. However, they are very sensitive to irrelevant features. In other words, when there are irrelevant features, larry learning methods have difficulty in comparing cases. Therefore, their performance can be degraded significantly. To overcome this disadvantage, feature weighting methods for lazy loaming methods have been studied. Most of the existing researches, however, were focused on global feature weighting. In this research, we propose a new local feature weighting method, which we shall call CBDFW. CBDFW stores classification performance of randomly generated feature weight vectors. Then, given a new query case, CBDFW retrieves the successful feature weight vectors and designs a feature weight vector fur the query case. In the test on credit evaluation domain, CBDFW showed better classification accuracy when compared to the results of previous researches.

  • PDF

Improving Classification Accuracy for Numerical and Nominal Data using Virtual Examples (가상예제를 이용한 수치 및 범주 속성 데이터의 분류 성능 향상)

  • Lee, Yu-Jung;Kang, Jae-Ho;Kang, Byoung-Ho;Ryu, Kwang-Ryel
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.183-188
    • /
    • 2006
  • 본 논문에서는 베이지안 네트워크를 기반으로 생성하고 평가한 가상예제를 활용하여 범주속성 및 수치속성 데이터에 대한 분류 성능을 향상시키는 방안을 제안한다. 가상예제를 활용하는 종래의 연구들은 주로 수치 속성 데이터를 대상으로 한 반면 본 연구에서는 범주속성 데이터에 대해서도 가상예제를 적용하여 효과를 확인하였다. 그리고 대상 도메인에 특화된 지식을 활용하여 특정 학습 알고리즘의 성능을 향상시키는 것을 목표로 한 기존 연구들과는 달리 본 연구에서는 도메인에 특화된 지식을 활용하는 대신 주어진 훈련 집합을 기반으로 만든 베이지안 네트워크로부터 가상예제를 생성하고, 그 예제가 네트워크의 조건부 우도를 증가시키는데 기여할 경우 유용한 것으로 선별한다. 이러한 생성 및 선별과정을 반복하여 적절한 크기의 가상예제 집합을 수집하여 사용한다. 범주 속성 데이터와 수치 속성을 포함한 데이터를 대상으로 한 실험 결과, 여러 가지 학습 모델의 성능이 향상됨을 확인하였다.

  • PDF

A Study on Standardization of Marine Geographical Names in Korea (우리나라 해양지명 표준화에 관한 연구 - 해양지명 명명 사례조사를 중심으로 -)

  • Lim, Young-Tae;Choi, Yun-Soo;Yoon, Ha-Su
    • Spatial Information Research
    • /
    • v.19 no.6
    • /
    • pp.55-65
    • /
    • 2011
  • All of area we live in has its own geographic names. Even small size of rock under the water has its own name. They are called "marine geographic names". Marine geographic names can be classified two categories. One is a proper name; the other is an attribute name. Rocks, reefs and banks referred in the introduction, belong to the category of the attribute name. And there are certain standards to name marine geographic things. In this study, we conducted a case research with the aims to figure out how we name and use those three features that we consider dangerous factors for marine navigation. This study also focused on differences between the methods used to classify attributes of marine geographic names in the past and today. In addition, it reviewed and analyzed marine geographic names used by Korea Hydrographic and Oceanographic Administration (KHOA) on its own Nautical charts and conducted a case research on marine geographic names notified by Korean Committee on Marine Geographic Names. Based on research and analysis, this study presents future methods regarding marine geographic names standardization.

Genetic Algorithm Based Attribute Value Taxonomy Generation for Learning Classifiers with Missing Data (유전자 알고리즘 기반의 불완전 데이터 학습을 위한 속성값계층구조의 생성)

  • Joo Jin-U;Yang Ji-Hoon
    • The KIPS Transactions:PartB
    • /
    • v.13B no.2 s.105
    • /
    • pp.133-138
    • /
    • 2006
  • Learning with Attribute Value Taxonomies (AVT) has shown that it is possible to construct accurate, compact and robust classifiers from a partially missing dataset (dataset that contains attribute values specified with different level of precision). Yet, in many cases AVTs are generated from experts or people with specialized knowledge in their domain. Unfortunately these user-provided AVTs can be time-consuming to construct and misguided during the AVT building process. Moreover experts are occasionally unavailable to provide an AVT for a particular domain. Against these backgrounds, this paper introduces an AVT generating method called GA-AVT-Learner, which finds a near optimal AVT with a given training dataset using a genetic algorithm. This paper conducted experiments generating AVTs through GA-AVT-Learner with a variety of real world datasets. We compared these AVTs with other types of AVTs such as HAC-AVTs and user-provided AVTs. Through the experiments we have proved that GA-AVT-Learner provides AVTs that yield more accurate and compact classifiers and improve performance in learning missing data.

E-Mail Filtering with Co-training Based on Specific Features (특정 속성과 Co-training을 이용한 전자메일 분류)

  • Ryu, Je;Yoon, Sung-Hee;Han, Kwan-Rok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.549-551
    • /
    • 2003
  • 본 논문은 점점 증가되고 있는 SPAM 메일 문제를 해결하기 위한 방법으로써, 특정 속성에 기반을 둔 학습 알고리즘의 co-training을 통한 전자메일 분류 기법을 제안한다. 전자메일 분류는 결국 문서 분류 기술과 다르지 않다. 이미 많은 연구에서 학습 알고리즘을 이용한 문서 분류 기법은 많이 제안되고 검증되었다. 본 논문에서는 이러한 학습 알고리즘들을 co-training을 통하여 해당 메일이 SPAM인지 아닌지 구분하며, 학습의 효율성을 높이기 위하여 전자메일의 특정한 속성들, 예를 들면, 핵심문구나 기타 특정한 문구 및 전자메일의 헤더 정보 등을 학습 기반으로 이용하였다.

  • PDF

A Classification Study on Logistics Equipments and Their Attributes (물류설비 및 속성 분류체계 연구)

  • Chang, Tai-Woo
    • Journal of the Korean Society for Railway
    • /
    • v.12 no.1
    • /
    • pp.175-182
    • /
    • 2009
  • Needs on ensuring compatibility and conformity of equipments that are used in logistics functions - such as packaging, transporting, loading/unloading and storing - are raised. This article presents a classification scheme for analyzing the interfacing characteristics of logistics equipments focusing on standardized pallets of unit load system. International and domestic classification systems are reviewed and analyzed; as a result several problems are issued. Methods to resolve the problems, to specify the attributes of logistics equipments and to represent the semantics among them using semantic web technology are proposed. This study could make it possible to examine the conformities of interfacing equipments automatically.

Incremental Conceptual Clustering Using Modified Category Utility (변형된 Category Utility를 이용한 점진 개념학습)

  • Kim Pyo Jae;Choi Jin Young
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.04a
    • /
    • pp.193-197
    • /
    • 2005
  • 점진적 개념 학습 알고리즘인 COBWEB은 클래스 정보가 주어지지 않은 사례들(instances)을 분류하기 위하여 사례의 속성과 값에 근거하여 학습하며 각 노드가 유사한 사례들의 집합인 클래스에 해당하는 분류 트리를 생성하는 알고리즘이다. 유사한 사례들을 같은 클래스로 분류하기 위한 기준으로 category utility가 사용되며 이는 클래스 내부의 유사도와 클래스간의 차이점을 최대화하는 방향으로 클래스를 분류한다 기존의 COBWEB에 사용되는 category utility는 클래스 사이즈와 예측 정확성 사이의 tradeoff 관계로 볼 수 있으며, 이로 인하여 예측 정확성은 약간 감소하나 클래스 사이즈가 커지는 방향으로 학습이 진행 될 수 있는 편향성(bias)를 가지고 있다. 이는 분류 트리에 불필요한 클래스 노드들(spurious nodes)을 생성하게 하여 학습 결과인 클래스 개념을 이해하는뎨 어렵게 한다. 본 논문에서는 클래스와 그에 속하는 사례들의 속성-값 분포를 고려하여 클래스와 속성의 연관성에 비례한 가충치를 더한 변형된 category utility를 제안하고, dataset에 대한 실험을 통하여 제안된 category utility가 기존의 큰 클래스 사이즈를 선호하는 bias를 완화시킴을 보이고자 한다.

  • PDF

Classification Activity Thoughts of Elementary Sixth Grade Pupils about Artificial and Natural Stimulus (초등학교 6학년의 인공자극과 자연자극에 대한 분류 사고)

  • Choi, Hyun-Dong;Yang, Il-Ho;Kwon, Chi-Soon
    • Journal of The Korean Association For Science Education
    • /
    • v.26 no.1
    • /
    • pp.40-48
    • /
    • 2006
  • The purpose of this study was to investigate 6th grade pupil's thoughts during classification activities. Two suitable tools in classification activity achievement were developed to achieve this purpose. The first was an artificial stimulus card in which the attribute was prominent; and the other a natural stimulus card in which the attribute was less prominent. Participants of the study were 8 6th grade pupils from D elementary school in Yeongdeungpo-gu, Seoul. Data were collected from interviews with the pupils, the pupil's recordings of classification, the investigator's observation of pupil's actions, and video recordings of the pupil's subject classification process. Results found in this study were as following. First, when doing classification 6th grade pupils considered attribute observation, attribute estimation, preliminary inspection, criteria selection, and sample identification. Second, 6th grade pupil classification thought process was found to be repetitive, passing through the steps of attribute observation, attribute estimation, preliminary inspection, criteria selection, and lastly, sample identification. Third, 6th grade pupils took advantage of cognitive economic efficiency. Study findings also revealed guidance for the teaching and learning of scientific classification. First, once teachers understand the classification thought process of students, more effective classification guidance will be possible. Second, it is necessary that guidance fit each step of the classification thought process.

A Study on Game Character Classification Based on Texture and Edge Orientation Feature (질감 및 에지 방향 특징에 기반한 게임 캐릭터 분류에 관한 연구)

  • Park, Chang-Min
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.16 no.6
    • /
    • pp.1318-1324
    • /
    • 2012
  • This paper proposes a novel method for Game character classification based on texture and edge orientation feature. The character dose not move(NPC) and move the character is classified. Classification of property within the character of straight line segments are used to extract features. First, the character inside edge feature extraction and then calculates EEDH, SSPD. The extracted attribute represents the energy of a particular direction. Thus, these properties were used to classify of NPC and Monster. The proposed method, the user can reduce the unnecessary time in the game.

Extending Na$ddot{i}$ve Bayesian Classifier for Catalog Classification Systems (Na$ddot{i}$ve-Bayesian Classifier를 이 용한 전자 카탈로그 자동 분류 시스템)

  • 서광훈;이경종;김현철;이태희;이상구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.91-93
    • /
    • 2004
  • B2B Marketplace상에서의 거래에서 나타나는 주요한 특징은 다품종 및 대량의 물품 거래가 n:n거래 관계에 놓여있다는 점과 거래자가 원활한 거래 및 기업 내 관리를 위해 각자의 전자 카탈로그를 이용한 거래를 원한다는 정이다. 하지만 개별적인 전자 카탈로그 사용과 미흡한 표준안은 전자 카탈로그 상호 연계의 걸림돌이 되어 시장 형성의 걸림돌이 되고 있다. B2B Marketplace는 표준 분류체계를 중심으로 거래 대상 상품을 재분류하여 구매 당사자간의 거래 대상 물품에 대한 상호 애핑을 지원하는 방법 등으로 이를 충족시키려 하고 있다. 하지만 요청되는 다량의 물품에 대해 매번 분류를 수행해야 하는 고비용의 작업이라는 문제점이 있다. 본 논문에서는 이를 극복하기 위하여 기계학습 기법을 이용한 전자 카탈로그 상품 자동분류기를 모델링하고 이를 구현하는 것에 초점을 두었다. 상품의 속성별로 분류에 끼치는 영향력이 다론 것이라는데 착안하여 전자 카탈로그를 상품 단위로 재 모델링 하였으며 속성별 정보가 풍부하지 못한 정물 극복하기 위하여 속성값을 어휘 단위로 구분한 데이터를 추가 하는 확장 모델을 정의하였다. 또한 해당 모델을 학습시키기 위한 알고리즘으로는 속성별로 다른 가중치를 부여 할 수 있도록 확장된 Naive Bayesian Classifier를 고안하였다. 그리고 이론 B2B Market Place상의 실 데이터에 적용하여 고안된 모델의 유효성을 검증하였다.

  • PDF