• Title/Summary/Keyword: 클러스터링 클래스

Search Result 81, Processing Time 0.039 seconds

User Clustering from Wireless Internet Web Logs (무선 인터넷 웹 로그 파일을 이용한 사용자 클러스터링)

  • 한상훈;신주리;이건명
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.155-157
    • /
    • 2000
  • 무선 인터넷 보급이 확산되고 그 활용범위가 날로 넓어짐에 따라 무선 인터넷 기술에 데이터 마이닝을 접목시키고자 하는 노력은 당연하면서도 필요한 것이다. 이 논문에서는 무선 인터넷에서 사용자를 대표할 수 있는 정보와 무선 인터넷 웹 서버의 로그 파일에 저장된 정보를 접목시킴으로 일정한 액세스 패턴을 가지고 있는 사용자의 클래스를 추출하는 방법을 제시한다. 일정한 액세스 패턴을 가지고 있는 사용자들의 클래스를 추출함으로써 무선 인터넷 서비스를 사용하는 사용자에 대한 서비스의 질을 향상시키는데 기여할 수 있을 것이다.

  • PDF

Identifying candidate of reusable component based on dependency relation graph (의존관계 그래프에 기반한 재사용 컴포넌트 후보 추출)

  • 강민수;이기열;이병정;홍의석;이종석;이숙희;우치수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.554-556
    • /
    • 1999
  • 소프트웨어 품질 향상과 생산성 향상이라는 측면에서 소프트웨어 재사용의 중요성이 널리 인식되어지고 그에 따른 재사용 컴포넌트에 대한 관심이 나날이 커져가고 있다. 이에 따라 재사용성을 측정하는 방법에 대한 연구의 중요성이 커지고 있다. 본 논문에서는 기존의 결합도를 측정하는 방법을 변형하여 두 클래스간의 의존 정도를 측정하고 클래스를 노드로, 측정한 의존 정도를 예지 값으로 하는 방향 그래프를 그린다. 그리고 그 그래프를 클러스터링을 하여 재사용 컴포넌트의 후보를 추출하는 방법을 제시한다.

  • PDF

A Study on Subject Independent Feature Extraction (사용자 독립적 특징 추출을 위한 연구)

  • Bang, Won-Chul;Han, Jeong-Su;Z. Zenn Bien
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.05a
    • /
    • pp.123-125
    • /
    • 2002
  • 여러 사람에게서 생체신호를 측정하여 특징을 추출하는 경우 피실험자마다 다른 신체적 또는 생리학적 특징에 의해 같은 클래스로 분류하고 싶어도 다른 클래스로 잘못 분류되는 경우가 발생한다. 이와 같이 N 명의 사람에게서 얻은 생체신호로 M 개의 클래스를 분류하도록 훈련하여 새로운 사람의 생체신호를 M 개의 클래스로 분류하고자 할 때 발생하는 문제를 해결하기 위한 방법으로 피실험자 독립적인 클러스터링 방법을 제안하고자 한다. 이를 위한 수학적 기반으로 동치관계들의 교집합과 합집합에 근거한 새로운 연산자를 정의하고 이를 이용하여 최대 공통 클러스터(Largest Common Cluster, LCC)라는 새로운 개념을 정의한다 이는 여러 사람에게서 얻은 정보에서 최대한 공통의 성질을 갖는 것들을 찾아내는 수학적이고 체계적인 방법이라 할 수 있다. 따라서 일단 LCC를 찾아내면 이를 특징(feature)으로 삼아 패턴분류기를 설계하면 여러 사람에게 적용가능한 생체신호 인식기를 설계할 수 있게 된다.

  • PDF

On Optimizing LDA-extentions Using a Pre-Clustering (사전 클러스터링을 이용한 LDA-확장법들의 최적화)

  • Kim, Sang-Woon;Koo, Byum-Yong;Choi, Woo-Young
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.44 no.3
    • /
    • pp.98-107
    • /
    • 2007
  • For high-dimensional pattern recognition, such as face classification, the small number of training samples leads to the Small Sample Size problem when the number of pattern samples is smaller than the number of dimensionality. Recently, various LDA-extensions have been developed, including LDA, PCA+LDA, and Direct-LDA, to address the problem. This paper proposes a method of improving the classification efficiency by increasing the number of (sub)-classes through pre-clustering a training set prior to the execution of Direct-LDA. In LDA (or Direct-LDA), since the number of classes of the training set puts a limit to the dimensionality to be reduced, it is increased to the number of sub-classes that is obtained through clustering so that the classification performance of LDA-extensions can be improved. In other words, the eigen space of the training set consists of the range space and the null space, and the dimensionality of the range space increases as the number of classes increases. Therefore, when constructing the transformation matrix, through minimizing the null space, the loss of discriminatve information resulted from this space can be minimized. Experimental results for the artificial data of X-OR samples as well as the bench mark face databases of AT&T and Yale demonstrate that the classification efficiency of the proposed method could be improved.

Modeling of Self-Constructed Clustering and Performance Evaluation (자기-구성 클러스터링의 모델링 및 성능평가)

  • Ryu Jeong woong;Kim Sung Suk;Song Chang kyu;Kim Sung Soo
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.30 no.6C
    • /
    • pp.490-496
    • /
    • 2005
  • In this paper, we propose a self-constructed clustering algorithm based on inference information of the fuzzy model. This method makes it possible to automatically detect and optimize the number of cluster and parameters by using input-output data. The propose method improves the performance of clustering by extended supervised learning technique. This technique uses the output information as well as input characteristics. For effect the similarity measure in clustering, we use the TSK fuzzy model to sent the information of output. In the conceptually, we design a learning method that use to feedback the information of output to the clustering since proposed algorithm perform to separate each classes in input data space. We show effectiveness of proposed method using simulation than previous ones

Pattern Classification of Two Classes' Problem Using Polynomial based Radial Basis Function Neural Networks (다항식기반 RBF 신경회로망을 이용한 2-클래스 문제에 대한 패턴분류)

  • Kim, Gil-Sung;Park, Byoung-Jun;Oh, Sung-Kwon
    • Proceedings of the KIEE Conference
    • /
    • 2007.10a
    • /
    • pp.451-452
    • /
    • 2007
  • 본 논문에서는 다항식 기반 Radial Basis Function(RBF)신경회로망(Polynomial based Radial Basis Function Neural Networks)을 설계하고 이를 2-클래스 패턴 분류 문제에 응용하여 그 성능을 분석한다. 제안된 다항식기반 RBF 신경회로망은 입력층, 은닉층, 출력 층으로 이루어진다. 입력층은 입력 벡터의 값들을 은닉 층으로 전달하는 기능을 수행하고 은닉층은 Fuzzy c-means 클러스터링을 통하여 뉴런의 출력 값으로 내보낸다. 은닉층과 출력층사이의 연결가중치는 상수, 선형식 또는 이차식으로 이루어지며 경사 하강법에 의해 학습된다. Networks의 최종 출력은 연결가중치와 은닉층 출력의 곱에 의해 퍼지추론의 결과로서 얻어진다. 제안된 다항식기반 RBF 신경회로망은 각기 다른 4종류의 2-클래스 분류 문제에 적용 및 평가되어 분류기로써의 성능을 분석한다.

  • PDF

Clustering Method based on Structure Code and HMM for Huge Class On-line Handwritten Chinese Character Recognition (대용량 온라인 필기 한자 인식을 위한 구조 코드 및 HMM 기반의 클러스터링 방법)

  • Kim, Kwang-Seob;Ha, Jin-Young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.472-477
    • /
    • 2008
  • 본 논문에서는 은닉 마르코프 모델(HMM)을 기반한 대용량의 필기 한자 인식의 문제점인 시스템 리소스의 한계와 인식에 소요되는 많은 시간을 단축하기 위해 구조코드와 HMM에 최적화 된 클러스터링 알고리즘을 제안한다. 제안하는 클러스터링 알고리즘의 기본 개념은 훈련된 HMM를 대상으로 하고, HMM의 파라미터 수가 동일한 클래스에 대해서 클러스터를 구성하는 것이다. 또한 인식에 소요되는 시간을 줄이기 위해 2단계 클러스터모델 구조를 사용한다. 총 98,639 종류의 일본 한자를 대상으로 한 실험에서 평균 0.92 sec/char 인식 속도와 30순위 후보인식률 96.03%를 보임으로서 대용량 필기 한자 인식을 위한 좋은 방안이 될 것이라 기대한다.

  • PDF

Optimial Identification of Fuzzy-Neural Networks Structure (퍼지-뉴럴 네트워크 구조의 최적 동정)

  • 윤기찬;박춘성;안태천;오성권
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1998.03a
    • /
    • pp.99-102
    • /
    • 1998
  • 본 논문에서는 복잡하고 비선형적인 시스템의 최적 모델링을 우해서 지능형 퍼지-뉴럴네트워크의 최적 모델 구축을 위한 방법을 제안한다. 기본 모델은 퍼지 추론 시스템의 언어적인 규칙생성의 장점과 뉴럴 네트워크의 학습기능을 결합한 FNNs 모델을 사용한다. FNNs 모델의 퍼지 추론부는 간략추론이 사용되고, 학습은 요류 역전파 알고리즘을 사용하여 다른 모델들에 비해 학습속도가 빠르고 수렴능력이 우수하다. 그러나 기본 모델은 주어진 시스템에 대하여 퍼지 공간을 균등하게 분할하여 퍼지 소속을 정의한다. 이것은 비선형 시스템의 모델링에 있어어서 성능을 저하시켜 최적의 모델을 얻기가 어렵다. 논문에서는 주어진 데이터의 특성을 부여한 공간을 설정하기 위하여 클러스터링 알고리즘을 사용한다. 클러스터링 알고리즘은 주어진 시스템에 대하여 상호 연관성이 있는 데이터들끼리 특성을 나누어 몇 개의 클래스를 이룬다. 클러스터링 알고리즘을 사용하여 초기 FNNs 모델의 퍼지 공간을 나누고 소속함수를 정의한다. 또한, 최적화 기법중의 하나로 자연선택과 자연계의 유전자 메카니즘에 바탕을 둔 탐색 알고리즘인 유전자 알고리즘을 사용하여 주\ulcorner 진 모델에 대하여 최적화를 수행한다. 또한 본 연구에서는 학습 및 테스트 데이터의 성능 결과의 상호 균형을 얻기 위한 하중값을 가긴 성능지수가 제시된다.

  • PDF

Extraction of Classes and Hierarchy from Procedural Software (절차지향 소프트웨어로부터 클래스와 상속성 추출)

  • Choi, Jeong-Ran;Park, Sung-Og;Lee, Moon-Kun
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.9
    • /
    • pp.612-628
    • /
    • 2001
  • This paper presents a methodology to extract classes and inheritance relations from procedural software. The methodology is based on the idea of generating all groups of class candidates, based on the combinatorial groups of object candidates, and their inheritance with all possible combinations and selecting a group of object candidates, and their inheritance with all possible combinations and selecting a group with the best or optimal combination of candidates with respect to the degree of relativity and similarity between class candidates in the group and classes in a domain model. The methodology has innovative features in class candidates in the group and classes in a domain model. The methodology has innovative features in class and inheritance extraction: a clustering method based on both static (attribute) and dynamic (method) clustering, the combinatorial cases of grouping class candidate cases based on abstraction, a signature similarity measurement for inheritance relations among n class candidates or m classes, two-dimensional similarity measurement for inheritance relations among n class candidates or m classes, two-dimensional similarity measurement, that is, the horizontal measurement for overall group similarity between n class candidates and m classes, and the vertical measurement for specific similarity between a set of classes in a group of class candidates and a set of classes with the same class hierarchy in a domain model, etc. This methodology provides reengineering experts with a comprehensive and integrated environment to select the best or optimal group of class candidates.

  • PDF

Effective Classification Method of Hierarchical CNN for Multi-Class Outlier Detection (다중 클래스 이상치 탐지를 위한 계층 CNN의 효과적인 클래스 분할 방법)

  • Kim, Jee-Hyun;Lee, Seyoung;Kim, Yerim;Ahn, Seo-Yeong;Park, Saerom
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.81-84
    • /
    • 2022
  • 제조 산업에서의 이상치 검출은 생산품의 품질과 운영비용을 절감하기 위한 중요한 요소로 최근 딥러닝을 사용하여 자동화되고 있다. 이상치 검출을 위한 딥러닝 기법에는 CNN이 있으며, CNN을 계층적으로 구성할 경우 단일 CNN 모델에 비해 상대적으로 성능의 향상을 보일 수 있다는 것이 많은 선행 연구에서 나타났다. 이에 MVTec-AD 데이터셋을 이용하여 계층 CNN이 다중 클래스 이상치 판별 문제에 대해 효과적인지를 탐구하고자 하였다. 실험 결과 단일 CNN의 정확도는 0.7715, 계층 CNN의 정확도는 0.7838로 다중 클래스 이상치 판별 문제에 있어 계층 CNN 방식 접근이 다중 클래스 이상치 탐지 문제에서 알고리즘의 성능을 향상할 수 있음을 확인할 수 있었다. 계층 CNN은 모델과 파라미터의 개수와 리소스의 사용이 단일 CNN에 비하여 기하급수적으로 증가한다는 단점이 존재한다. 이에 계층 CNN의 장점을 유지하며 사용 리소스를 절약하고자 하였고 K-means, GMM, 계층적 클러스터링 알고리즘을 통해 제작한 새로운 클래스를 이용해 계층 CNN을 구성하여 각각 정확도 0.7930, 0.7891, 0.7936의 결과를 얻을 수 있었다. 이를 통해 Clustering 알고리즘을 사용하여 적절히 물체를 분류할 경우 물체에 따른 개별 상태 판단 모델을 제작하는 것과 비슷하거나 더 좋은 성능을 내며 리소스 사용을 줄일 수 있음을 확인할 수 있었다.

  • PDF