• Title/Summary/Keyword: 클러스터링 클래스

Search Result 81, Processing Time 0.042 seconds

Class Language Model based on Word Embedding and POS Tagging (워드 임베딩과 품사 태깅을 이용한 클래스 언어모델 연구)

  • Chung, Euisok;Park, Jeon-Gue
    • KIISE Transactions on Computing Practices
    • /
    • v.22 no.7
    • /
    • pp.315-319
    • /
    • 2016
  • Recurrent neural network based language models (RNN LM) have shown improved results in language model researches. The RNN LMs are limited to post processing sessions, such as the N-best rescoring step of the wFST based speech recognition. However, it has considerable vocabulary problems that require large computing powers for the LM training. In this paper, we try to find the 1st pass N-gram model using word embedding, which is the simplified deep neural network. The class based language model (LM) can be a way to approach to this issue. We have built class based vocabulary through word embedding, by combining the class LM with word N-gram LM to evaluate the performance of LMs. In addition, we propose that part-of-speech (POS) tagging based LM shows an improvement of perplexity in all types of the LM tests.

The Software Classification by the Tolerance Rough Set (허용적 러프집합에 의한 소프트웨어 분류)

  • 김성애;최완규;이성주
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.11 no.2
    • /
    • pp.141-147
    • /
    • 2001
  • 소프트웨어의 측정값에 근거하여 소프트웨어 품질에 관한 의사결정을 할 때, 동치관계의 요구조건인 추이적(transitive) 특성이 항상 만족되는 것은 아니다. 순환수(cyclomatic number)가 거의 비슷한 프로그램에서, 하나의 \"구조적인\" 프로그램 범주에 속하고 또 다른 하나는 \"비구조적인\" 프로그램 범주에 속한다고 명확히 분류할 수 있는가하는 점이다. 따라서, 본 연구에서는 동치관계보다는 허용적 관계를 만족하는 허용적 러프집합에 근거한 소프트웨어 분류기준을 제시하고자 한다. 분류기준을 생성하기 위한 실험 데이터 집합을 수집하고, 집합 내의 각 원소에 관한 허용적 클래스들을 생성한 후, 각 허용적 클래스들의 중심값을 클러스터링하여 분류기준을 생성한다. 생성된 분류기준을 또 다른 실험 집합에 적용하여 비교 분석한 결과 생성된 분류기준이 타당함을 보여준다.생성된 분류기준이 타당함을 보여준다.

  • PDF

The Software Classification Criteria based on the Tolerant Rough Set (허용적 러프집합에 기반한 소프트웨어 분류기준)

  • 김상용;최완규;김영식;이성주
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.05a
    • /
    • pp.307-310
    • /
    • 2000
  • 소프트웨어의 측정값에 근거하여 소프트웨어 품질에 관한 의사결정을 할 때, 동치관계의 요구조건인 추이적(transitive) 특성이 항상 만족되는 것은 아니다. 순환수(cyclomatic number)가 거의 비슷한 프로그램에서, 하나는 "구조적인" 프로그램 범주에 속하고 또 다른 하나는 비구조적인 프로그램 범주에 속한다고 명확히 분류 할 수 있는가하는 점이다. 따라서, 본 연구에서는 동치관계보다는 허용적 관계를 만족하는 허용적 러프집합에 근거한 소프트웨어 분류 기준 제시하고자 한다. 분류기준을 생성하기 위한 실험 데이터 집합을 수집하고, 집합 내의 각 원소에 관한 허용적 클래스들을 생성한 후, 각 허용적 클래스들의 중심값을 클러스터링하여 분류기준을 생성한다. 생성된 분류기준을 또 다른 실험 집합에 적용하여 비교 분석하여 생성된 분류기준이 타당함을 보여준다.

  • PDF

A Pattern Recognition Algorithm based on Dynamic Selection of Micro Classifiers (마이크로 인식기의 동적 선택에 의한 패턴인식)

  • Song, Hyeo-Jung;Kim, Baek-Sop
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.397-400
    • /
    • 2002
  • 최근 패턴인식분야에서 성능향상을 목적으로 개별인식기들을 결합하거나 동적 선택에 대한 연구가 활발하게 진행되고 있다. 인식기를 동적으로 선택하는 경우에는 전체 학습패턴으로부터 학습한 개별 인식기를 이용하거나 클러스터링 알고리즘을 이용하여 학습패턴들을 특징공간에서의 부 영역으로 분할한 다음 각 클래스를 하나의 영역과 대응하는 방법이 사용되어 왔다. 이러한 접근방법에서는 각 패턴의 지역적인 정보를 이용하기 때문에 클래스 사이의 결정 경계부분에 대한 지역적인 정보를 이용하기 어렵다. 본 논문에서는 학습패턴의 지역적 영역에 대한 마이크로 인식기를 설계하여 임의의 테스트 패턴에 대한 지역적 영역에서 가장 성능이 좋은 인식기를 동적으로 선택하여 인식 성능을 향상시키는 방법을 제안한다.

  • PDF

A Process for Transforming Non-component Java Programs into EJB Programs (비 컴포넌트 자바 프로그램에서 EJB 프로그램으로의 변환 프로세스)

  • Lee, Sung-Eun
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.3
    • /
    • pp.173-186
    • /
    • 2006
  • In this paper, we suggest a process that transforms non-component Java programs into EJB component programs. We approach following methods to increase reusability of existing Java-based programs. We extract proper factors from existing non-component Java programs to construct for component model, and we suggest a transformation technique using extracted factors. Extracted factors are transformed into EJB components. With consideration for reusability of existing programs and EJB's characteristic, we suggest a process that mixes class clustering and method oriented class restructuring.

  • PDF

An Image Contrast Enhancement Technique Using an Adaptive Fuzzy Clustering Algorithm (적응적 퍼지 클러스터링 알고리듬을 이용한 영상 대비 향상 기법)

  • Lee, Guem-Boon;Kim, Yong-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.527-530
    • /
    • 2001
  • 영상이 시각적인 해석을 위해 처리될 때, 퍼지 이론이 영상 대비 강화에 많이 사용되고 있다. 적응적 퍼지 클러스터링 기법을 사용하여 자동적으로 영상의 명암도에 대한 다중 클래스를 형성하고 여기에 각각의 명암도를 속성 공간으로 전환시키는 퍼지함수를 사용하여 각 픽셀의 명암도에 부합하는 퍼지 소속도를 구한다. 영상 대비 향상을 위하여 구한 퍼지 소속도에 강화 연산자를 반복적 적용한다. 본 논문에서 제안한 방법을 히스토그램 평활화와 비교하기 위해 흑백 영상에 적용하였다.

  • PDF

Min-Max Hash for Similarity Measurement based on Multiset (Min-Max Hash를 활용한 다중 집합 기반의 유사도 측정)

  • Yoon, Jin-Uk;Kim, Byoungwook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.36-39
    • /
    • 2019
  • 데이터 마이닝에서 클러스터링은 서로 유사한 특징을 갖는 데이터들을 동일한 클래스로 분류하는 방법이다. 클러스터링에는 다양한 방법이 존재하지만 대표적으로 집합으로 표현된 데이터들의 유사도를 측정하기 위해서는 자카드 유사도(Jaccard Similarity)를 이용한다. 자카드 유사도는 서로 다른 집합 간의 공통된 부분을 상대적으로 평가하여 유사도를 측정하는 방법이다. 그러나 최근에는 데이터를 저장할 수 있는 기술과 매체의 발전으로 표현할 수 있는 데이터의 영역과 범위는 발전되고 있기 때문에 많은 연산과 시간의 비용이 발생하게 된다. 이를 해결하기 위해서 두 데이터의 표본의 유사도를 통해 실제 데이터들의 유사도를 추정할 수 있는 Min-Hash 가 제안되었다. 본 논문에서는 이를 활용하여 집합의 영역을 다중 집합(Multiset)으로 확장하여 중복되는 값을 가질 수 있는 두 데이터 간의 유사도를 효율적으로 추정할 수 있는 Min-Max Hash 를 제안한다.

Fingerprint Classification using Multiple Decision Templates with SVM (SVM의 다중결정템플릿을 이용한 지문분류)

  • Min Jun-Ki;Hong Jin-Hyuk;Cho Sung-Bae
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.11
    • /
    • pp.1136-1146
    • /
    • 2005
  • Fingerprint classification is useful in an automated fingerprint identification system (AFIS) to reduce the matching time by categorizing fingerprints. Based on Henry system that classifies fingerprints into S classes, various techniques such as neural networks and support vector machines (SVMs) have been widely used to classify fingerprints. Especially, SVMs of high classification performance have been actively investigated. Since the SVM is binary classifier, we propose a novel classifier-combination model, multiple decision templates (MuDTs), to classily fingerprints. The method extracts several clusters of different characteristics from samples of a class and constructs a suitable combination model to overcome the restriction of the single model, which may be subject to the ambiguous images. With the experimental results of the proposed on the FingerCodes extracted from NIST Database4 for the five-class and four-class problems, we have achieved a classification accuracy of $90.4\%\;and\;94.9\%\;with\;1.8\%$ rejection, respectively.

Clustering Method of Class using Aggregation Concepts (집합(Aggregation)개념을 이용한 클래스의 클러스터링 방법)

  • Lim, Keun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.519-521
    • /
    • 2000
  • 본 논문에서는 클러스터 정의시 사용하게 되는 특성으로 노드간 패스 수에 기반한 K-edge 컴포넌트의 그래픽 정의 방법과 노드를 클러스터화 하는 집합화(Aggregation)방법을 제시하였다. 집단화된 하이퍼텍스트 분리를 통해 이전 결과를 개선할 수 있으며, 집단내의 노드간 관련성을 가시화하여 비교할 수 있다.

  • PDF

Design and Implementation of Clustering Web-Server Monitoring System (클러스터링 웹 서버 모니터링 시스템의 설계 및 구현)

  • Lee, Eun;Han, In
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.85-87
    • /
    • 2002
  • 본 논문은 씬 서버들을 클러스터로 구성한 서비스 서버들의 모니터링 항목 값을 인터넷으로 연결된 모니터링 서버에서 수집할 수 있는 모니터링 시스템을 구성한다. 본 시스템은 MS .NET 플랫폼에서 제공하는 성능 모니터 클래스를 사용하여 구현하였으며, 일반적인 모니터링 시스템과 달리 토픽기반 메시지 처리기를 사용하여 다양한 클라이언트의 요구에 적절히 대응할 수 있고, 지역 네트워크뿐만 아니라 인터넷으로 연결된 원격 네트워크의 클라이언트로 수집된 모니터링 항목 값을 전송할 수 있다.

  • PDF