• Title/Summary/Keyword: 클래스 추출

Search Result 416, Processing Time 0.023 seconds

PCA-based Feature Extraction using Class Information (클래스 정보를 이용한 PCA 기반의 특징 추출)

  • Park Myoung Soo;Na Jin Hee;Choi Jin Young
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.04a
    • /
    • pp.428-432
    • /
    • 2005
  • 영상 데이터와 같은 대용량의 데이터를 분류하고자 할 경우, 입력 데이터의 차원을 줄여서 특징 벡터를 뽑아내는 전처리 과정은 필수적이다. 이 경우 특징 벡터가 입력 데이터의 정보를 최대한 포함하도록 하는 것이 중요하다. 특징 벡터를 뽑는 대표적인 방법으로는 PCA, ICA, LDA, MLP와 같은 특징 추출(feature extraction) 방법을 들 수 있다. PCA와 LDA는 무감독 학습 방식이고, LDA, MLP는 감독 학습 방식에 해당한다. 감독학습 방식의 경우 입력 정보와 함께 클래스 정보를 사용하기 때문에 데이터를 분류하기에 더 좋은 특징들을 뽑아낼 수 있는 장점이 있다. 본 논문에서는 무감독 학습 방식인 PCA에 클래스에 대한 정보를 함께 사용하여 특징을 추출함으로써 데이터 분류에 더욱 적합한 특징들을 뽑는 방법을 제안하였다. 그리고, Yale face database를 사용하여 제안한 알고리즘의 성능을 기존의 알고리즘과 비교, 테스트하였다.

  • PDF

Quality Metric for Classes in Object-Oriented Analysis Models (객체지향 분석 모델의 클래스 품질 척도)

  • 김유경;박재년
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.457-459
    • /
    • 2000
  • 객체지향 방법론은 캡슐화(encapsulation), 상속(inherit), 다형성(polymorphism)과 같은 개념을 이용하기 때문에 기존의 절차적 방법론과는 다른 척도가 필요하다. 본 논문에서 제안하는 척도는 객체지향 시스템의 개발 절차 가운데 분석 단계에서 추출할 수 있는 정보만을 사용하여, 클래스가 객체지향 개념에 따라 잘 구성되었는지를 측량하게 된다. 이를 위하여 본 논문에서는 클래스의 품질을 측량하기 위한 척도로 협력의 복잡도와 인터페이스 복잡도를 제안한다. 협력의 복잡도는 클래스가 잠재적으로 얼마나 복잡할 수 있는지를 측량하기 위한 것으로서 클래스가 가지는 책임의 개수를 조사하여 정의된다. 인터페이스 복잡도는 클래스와 협력 관계에 있는 다른 클래스들의 인터페이스를 조사하여 정의된다. 제안된 척도는 기존의 척도들이 가지고 있는 문제점을 해결하기 위하여 이해하기 쉬운 수학적 명세를 용하였으며, 제안된 척도에 대한 수학적 증명과 사례 연구를 통한 검증을 하였다.

  • PDF

Robust SVM Design for Multi-Class Classification - Application to Biometric data - (다중 클래스 분류를 위한 강인한 SVM 설계 방법 - 생체 인식 데이터에의 적용 -)

  • Cho, Min-Kook;Park, Hye-Young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.760-762
    • /
    • 2005
  • Support vector machine(SVM)은 졸은 일반화 능력을 가진 학습시스템으로, 최근 다양한 패턴 인식 분야에서 적용되고 있다. SVM은 기본적으로 이진 분류기이므로 두 개 이상의 클래스를 분류하기 위해서는 다중 클래스 분류가 가능한 형태로의 설계 방법이 필요하다. 이를 위해 각 클래스별로 독립적인 SVM들을 만들어 결과를 병합하는 방식이 주로 사용되어 왔다. 그러나 이러한 방법은 클래스의 수는 않고 한 클래스 내의 데이터의 수가 많지 않은 경우에는 SVM의 일반화 성능을 저하시키고 노이즈에 민감해지는 문제점을 가지고 있다. 이를 해결하기 위해 본 논문에서는 각 클래스내의 데이터간의 유사도 측정을 위한 통계적 정보를 안정적으로 추출하기 위해 두 데이터의 쌍을 입력으로 받는 새로운 SVM 설계 방법을 제시한다. 제안한 방법을 실제 생체인식 데이터에 적용한 실험에서 기존의 방법보다 우수한 분류 성능을 보임을 확인할 수 있었다.

  • PDF

Verb Clustering for Defining Relations between Ontology Classes of Technical Terms Using EM Algorithm (EM 알고리즘을 이용한 전문용어 온톨로지 클래스간 관계 정의를 위한 동사 클러스터링)

  • Jin, Meixun;Nam, Sang-Hyob;Lee, Yong-Hoon;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.233-240
    • /
    • 2007
  • 온톨로지 구축에서 클래스간 관계 설정은 중요한 부분이다. 본 논문에서는 클래스간 상 하위 관계 외의 관계 설정을 위한 클래스간 관계 자동 정의를 목적으로 의존구문분석의 (주어, 용언) (목적어, 용언) 쌍들을 추출하고, 이렇게 추출된 데이터를 이용하여 용언들을 클러스터링 하는 방법을 제안한다. 도메인 전문 코퍼스 데이터 희귀성 문제를 해결하고자, 웹검색을 결합한 방식을 선택하여 도메인 온톨로지 구축 클래스간 관계 자동 설정에 대한 방법론을 제시한다.

  • PDF

The Performance Improvement of Face Recognition Using Multi-Class SVMs (다중 클래스 SVMs를 이용한 얼굴 인식의 성능 개선)

  • 박성욱;박종욱
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.41 no.6
    • /
    • pp.43-49
    • /
    • 2004
  • The classification time required by conventional multi-class SVMs(Support Vector Machines) greatly increases as the number of pattern classes increases. This is due to the fact that the needed set of binary class SVMs gets quite large. In this paper, we propose a method to reduce the number of classes by using nearest neighbor rule (NNR) in the principle component analysis and linear discriminant analysis (PCA+LDA) feature subspace. The proposed method reduces the number of face classes by selecting a few classes closest to the test data projected in the PCA+LDA feature subspace. Results of experiment show that our proposed method has a lower error rate than nearest neighbor classification (NNC) method. Though our error rate is comparable to the conventional multi-class SVMs, the classification process of our method is much faster.

Information Anlaysis and Quality Metrics for Reusing Classes (클래스의 재사용을 위한 정보 분석 및 품질 척도)

  • Kim, Jae-Saeng;Song, Yeong-Jae
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.3
    • /
    • pp.393-400
    • /
    • 1999
  • 클래스에 관한 재사용 관련 정보는 기능.환경면에서 정보와 품질 메트릭 정보로 구분할 수 있다. 기능.환경면에서 정보는 재사용 부품의 기능과 구현 환경에 관한 정보이며, 품질메트릭 정보는 재상용 부품들의 재사용성을 가시적으로 측정할 수 있는 정보이다. 클래스의 재사용성을 측정하기 위해서는 클래스의 절차적이고 객체지향적인 특성들을 모두 고려하여야 한다. 그러므로 본 논문에서는 클래스에 관한 재사용성 관련 정보를 소개하고 품질 메트릭 정보를 정량화시키는 정의식들을 제안하고, 클래스 코드로부터 기능.환경면으로 정보와 품질 메트릭 정보를 추출 및 측정하였다

Component Extraction Method Using Weight Analysis between Use Cases and Classes (Use Case 및 클래스의 가중치 분석에 의한 컴포넌트 추출 기법)

  • Yu, Yeong-Ran;Kim, Su-Dong
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.8
    • /
    • pp.537-549
    • /
    • 2001
  • 소프트웨어의 생산성과 유지보수 비용을 줄여줄 수 있는 기법으로 다양한 컴포넌트 기반의 개발 방법론이 제안되고 있다. 그러나 컴포넌트 기반의 시스템에서 재사용성과 독립성이 높은 컴포넌트의 식별은 가장 중요한 성공 요소 중의 하나임에도 불구하고, 대부분의 컴포넌트 기반 방법론들에서는 직관적이고 분석자의 경험에 의존적인 컴포넌트 식별 방법만을 제공하고 있을 따름이다. 본 논문에서는 분석 단계의 산출물인 시스템의 기능 모델 Use Case 모델과 자료 모델인 클래스 모델에 기반 하여 체계적인 컴포넌트 식별 기법과 지침들을 제안한다. 먼저 클래스에 대한 Use Case의 자료 접근값을 정의하고, 정의된 접근값을 기반으로 Use Case별로 접근되는 클래스의 가중치와 클래스별 동일 접근값을 가지는 Use Case들의 가중치를 계산하다. 두 가중치를 곱하여 최종적인 Use Case&클래스 가중치를 계산하여 후보 컴포넌트 식별의 기준으로 삼는다.

  • PDF

User Clustering from Wireless Internet Web Logs (무선 인터넷 웹 로그 파일을 이용한 사용자 클러스터링)

  • 한상훈;신주리;이건명
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.155-157
    • /
    • 2000
  • 무선 인터넷 보급이 확산되고 그 활용범위가 날로 넓어짐에 따라 무선 인터넷 기술에 데이터 마이닝을 접목시키고자 하는 노력은 당연하면서도 필요한 것이다. 이 논문에서는 무선 인터넷에서 사용자를 대표할 수 있는 정보와 무선 인터넷 웹 서버의 로그 파일에 저장된 정보를 접목시킴으로 일정한 액세스 패턴을 가지고 있는 사용자의 클래스를 추출하는 방법을 제시한다. 일정한 액세스 패턴을 가지고 있는 사용자들의 클래스를 추출함으로써 무선 인터넷 서비스를 사용하는 사용자에 대한 서비스의 질을 향상시키는데 기여할 수 있을 것이다.

  • PDF

Edge Class Design for the Development of Edge-based Image Analysis Algorithm (표준화된 Edge기반 영상분석 알고리즘 개발을 위한 윤곽선 클래스 설계 및 구현)

  • 안기옥;황혜정;채옥삼
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.589-591
    • /
    • 2003
  • 영상에 추출된 윤곽선(Edge)은 물체의 핵심적인 형태정보를 포함하고 있어서 영상인식과 분석의 근간이 되고 있다. 따라서 정확한 윤곽선 검출을 위한 많은 연구가 진행되고 있으며 그 응용분야도 다양하다. 그러나 정작 추출된 윤곽선 정보를 효율적으로 표현하고 활용하기 위한 표준화된 자료구조에 대한 연구는 많지 않아서 연구결과의 공유를 어렵게 하고 있다. 본 논문에서는 검출된 윤곽선을 효율적으로 표현, 관리, 검색, 조작하기 위한 자료클래스를 설계구현 함으로서 윤곽선검출 알고리즘의 표준화와 재사용을 촉진시키고 검출된 다양한 응용을 가능하게 한다.

  • PDF

Identifying candidate of reusable component based on dependency relation graph (의존관계 그래프에 기반한 재사용 컴포넌트 후보 추출)

  • 강민수;이기열;이병정;홍의석;이종석;이숙희;우치수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.554-556
    • /
    • 1999
  • 소프트웨어 품질 향상과 생산성 향상이라는 측면에서 소프트웨어 재사용의 중요성이 널리 인식되어지고 그에 따른 재사용 컴포넌트에 대한 관심이 나날이 커져가고 있다. 이에 따라 재사용성을 측정하는 방법에 대한 연구의 중요성이 커지고 있다. 본 논문에서는 기존의 결합도를 측정하는 방법을 변형하여 두 클래스간의 의존 정도를 측정하고 클래스를 노드로, 측정한 의존 정도를 예지 값으로 하는 방향 그래프를 그린다. 그리고 그 그래프를 클러스터링을 하여 재사용 컴포넌트의 후보를 추출하는 방법을 제시한다.

  • PDF