• 제목/요약/키워드: TREE FEATURE

검색결과 364건 처리시간 0.032초

Decision-Tree-Based Markov Model for Phrase Break Prediction

  • Kim, Sang-Hun;Oh, Seung-Shin
    • ETRI Journal
    • /
    • 제29권4호
    • /
    • pp.527-529
    • /
    • 2007
  • In this paper, a decision-tree-based Markov model for phrase break prediction is proposed. The model takes advantage of the non-homogeneous-features-based classification ability of decision tree and temporal break sequence modeling based on the Markov process. For this experiment, a text corpus tagged with parts-of-speech and three break strength levels is prepared and evaluated. The complex feature set, textual conditions, and prior knowledge are utilized; and chunking rules are applied to the search results. The proposed model shows an error reduction rate of about 11.6% compared to the conventional classification model.

  • PDF

다수의 특징과 이진 분류 트리를 이용한 장면 전환 검출 (Shot Change Detection Using Multiple Features and Binary Decision Tree)

  • 홍승범;백중환
    • 한국통신학회논문지
    • /
    • 제28권5C호
    • /
    • pp.514-522
    • /
    • 2003
  • 본 논문에서는 다수의 특징과 이진 분류 트리를 이용하여 장면 전환점(shot change)을 검출하는 향상된 방식을 제안한다. 기존의 장면 전환점 검출 방식에서는 인접한 프레임간에 단일 특징과 고정된 임계값을 주로 사용하였다. 하지만, 비디오 시퀀스 내의 장면 전환점에서는 인접한 프레임간의 내용(content)인 컬러, 모양, 배경 혹은 질감 등이 동시에 변화한다. 따라서 본 논문에서는 단일 특징보다는 상호 보완 관계를 갖는 다수의 특징을 이용하여 장면 전환점을 효율적으로 검출한다. 그리고 장면 전환점의 분류를 위해서는 이진 분류 트리(binary classification tree)를 이용한다. 이 분류 결과에 따라 장면 전환점 검출에 사용될 중요한 특징들을 선별하고, 각 특징들의 최적 임계값을 구한다. 또한, 분류 성능을 확인하기 위해 교차검증(cross-validation)과 드롭 케이스(drop-case)를 수행하였다. 실험 결과, 제안된 기법이 단일 특징들만을 사용한 기존의 방법들 보다 El(Evaluated Index, 성능평가지수)에서 평균 2%의 성능이 향상됨을 알 수 있었다.

Word2vec과 앙상블 분류기를 사용한 효율적 한국어 감성 분류 방안 (Effective Korean sentiment classification method using word2vec and ensemble classifier)

  • 박성수;이건창
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.133-140
    • /
    • 2018
  • 감성 분석에서 정확한 감성 분류는 중요한 연구 주제이다. 본 연구는 최근 많은 연구가 이루어지는 word2vec과 앙상블 방법을 이용하여 효과적으로 한국어 리뷰를 감성 분류하는 방법을 제시한다. 연구는 20 만 개의 한국 영화 리뷰 텍스트에 대해, 품사 기반 BOW 자질과 word2vec를 사용한 자질을 생성하고, 두 개의 자질 표현을 결합한 통합 자질을 생성했다. 감성 분류를 위해 Logistic Regression, Decision Tree, Naive Bayes, Support Vector Machine의 단일 분류기와 Adaptive Boost, Bagging, Gradient Boosting, Random Forest의 앙상블 분류기를 사용하였다. 연구 결과로 형용사와 부사를 포함한 BOW자질과 word2vec자질로 구성된 통합 자질 표현이 가장 높은 감성 분류 정확도를 보였다. 실증결과, 단일 분류기인 SVM이 가장 높은 성능을 나타내었지만, 앙상블 분류기는 단일 분류기와 비슷하거나 약간 낮은 성능을 보였다.

유전 목 지도의 동적 확장 (Dynamic Extension of Genetic Tree Maps)

  • 하성욱;권기향;강대성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.386-395
    • /
    • 2002
  • 본 논문에서는, 인식될 데이타에서 최적 특징을 구성할 수 있는 새로운 신경망 구조인 동적 유전 트리맵(DGTM)을 제안한다. DGTM은 기존의 신경망(neural networks)에서 고려되지 못한 데이터의 특징(feature)에 대한 중요도를 유전 알고리즘(genetic algorithm)으로 구성하고, 특징의 우선순위에 따라 트리 구조를 도입한 GTM(genetic tree-map)을 적용한다. 데이타의 유사성에 따라서 신경망의 뉴런이 동적으로 분리되고 병합될 수 있도록 동적인 기능을 갖는 DGTM(dynamic GTM)으로 확장한 방식을 제안한다.

결정 트리 모델링에 의한 한국어 문맥 종속 음소 분류 연구 (A Study on the Categorization of Context-dependent Phoneme using Decision Tree Modeling)

  • 이선정
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권2호
    • /
    • pp.195-202
    • /
    • 2001
  • 본 논문에서는 한국어 음소가 좌, 우 음소에 따라 발음 방식이 달라질 때 매 음소를 모델링 하는 방법에 관한 연구를 수행한다. 이를 위해 유니트 감소 알고리즘과 결정 트리(Decision Tree)를 사용하는 방법을 사용하여 비교 연구한다. 유니트 감소 알고리즘은 통계적 특성만을 이용한 알고리즘이며 결정 트리 모델링 방식은 한국어 음운정보와 통계적 정보를 이용하여 문맥종속 음소를 분류하는 방식이다. 특히 본 논문에서는 결정 트리를 사용하여 문맥종속 음소를 분류하는 것에 대하여 상세히 기술한다. 마지막으로 결정 트리를 사용하여 분류된 문맥종속 음소의 성능을 실험하였다.

  • PDF

An Application of Decision Tree Method for Fault Diagnosis of Induction Motors

  • Tran, Van Tung;Yang, Bo-Suk;Oh, Myung-Suck
    • 한국해양공학회:학술대회논문집
    • /
    • 한국해양공학회 2006년 창립20주년기념 정기학술대회 및 국제워크샵
    • /
    • pp.54-59
    • /
    • 2006
  • Decision tree is one of the most effective and widely used methods for building classification model. Researchers from various disciplines such as statistics, machine learning, pattern recognition, and data mining have considered the decision tree method as an effective solution to their field problems. In this paper, an application of decision tree method to classify the faults of induction motors is proposed. The original data from experiment is dealt with feature calculation to get the useful information as attributes. These data are then assigned the classes which are based on our experience before becoming data inputs for decision tree. The total 9 classes are defined. An implementation of decision tree written in Matlab is used for these data.

  • PDF

A KD-Tree-Based Nearest Neighbor Search for Large Quantities of Data

  • Yen, Shwu-Huey;Hsieh, Ya-Ju
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권3호
    • /
    • pp.459-470
    • /
    • 2013
  • The discovery of nearest neighbors, without training in advance, has many applications, such as the formation of mosaic images, image matching, image retrieval and image stitching. When the quantity of data is huge and the number of dimensions is high, the efficient identification of a nearest neighbor (NN) is very important. This study proposes a variation of the KD-tree - the arbitrary KD-tree (KDA) - which is constructed without the need to evaluate variances. Multiple KDAs can be constructed efficiently and possess independent tree structures, when the amount of data is large. Upon testing, using extended synthetic databases and real-world SIFT data, this study concludes that the KDA method increases computational efficiency and produces satisfactory accuracy, when solving NN problems.

대규모 무선 센서 네트워크를 위한 계층적 클러스터 트리 기반 분산 주소 할당 기법 (A Hierarchical Cluster Tree Based Address Assignment Method for Large and Scalable Wireless Sensor Networks)

  • 박종준;정훈;황소영;주성순
    • 한국통신학회논문지
    • /
    • 제34권12B호
    • /
    • pp.1514-1523
    • /
    • 2009
  • 현재 무선 센서 네트워크의 주소 할당 기법들은 수백 개 이상의 노드로 구성된 대규모 센서 네트워크를 지원함에 있어 한계를 갖고 있다. WSNs 관련 대표적인 표준화 단체인 ZigBee Alliance에서는 균형 트리 기반의 주소 영역을 구성한 후, 트리 구조에 맞추어 네트워크의 주소를 할당하는 분산 주소 할당 기법이 제시되었다. 하지만 일반적으로 실제 배치된 네트워크는 균형 트리 구조를 갖지 않으며 이로 인해 주소의 낭비 및 고갈이 발생한다. 본 논문에서는 이러한 단점을 해결하기 위해 다수의 균형 트리를 동적으로 구성하는 계층적 클러스터 트리 기반 분산 주소 할당 기법을 제시한다. 제안된 방안에서는 16-bit 주소 영역을 클러스터 식별자 영역과 클러스터 내 주소 영역으로 구분하여 각 클러스터 내부에서는 균형 트리 기반 분산 주소 할당 기법을 사용하고, 주소 고갈 발생시에는 동적으로 새로운 클러스터를 형성하여 주소를 할당한다. 시뮬레이션을 통한 성능 분석에서는 제안된 프로토콜이 기존의 기법보다 주소 사용의 효율 및 고아 노드 발생 부분에서 향상된 결과를 보여준다.

훼손예정지의 지형 및 수목 형태를 고려한 이식목 선정기준에 관한 연구 (Study on the Selection Criteria for Transplanting Trees in the Forest Reserve Areas Designated for Future Development)

  • 이수동;최송현
    • 한국환경생태학회지
    • /
    • 제23권6호
    • /
    • pp.535-544
    • /
    • 2009
  • 산지개발로 인해 불가피하게 훼손되어야 하는 양호한 식생을 대상으로 수목의 외형적 특성인 수형, 흉고직경 등과 기반특성인 토양층위 등 이식가능성 여부를 판단할 수 있는 기준을 제시하고자 본 연구를 진행하였다. 이식수목 선정은 자생성 및 천이단계에 의한 평가, 외형 및 기반특성에 의한 평가 2단계로 구분하여 진행하였다. 1단계에서는 식생발달 측면에서 천이를 주도하는 자생종이 아닌 인공식재수종과 생태적 천이 발달단계에서 도태가 예상되는 수목은 2단계 평가 전에 이식가능 수목에서 제외한 결과 총 3,841주 중 약 5.9%에 해당되는 수목이 이식 불가능한 것으로 판정되었다. 2단계 외형 및 기반특성에 따른 평가에서는 수형등급, 흉고직경급, 토양등급을 기준으로 각각의 수목을 평가한 결과 3,613주 중 약 33.7%(1,218주)는 이식 가능하였으나 23.0%(829주)는 이식 불가능한 것으로 분석되었다. 약 43.3%(1,566주)에 해당되는 수목에 대해서는 이식비용과 새롭게 식재하는 비용에 있어 큰 차이가 없으므로 가능한 이식하는 것이 생태계 보전 측면에서 바람직하나 토양상태 및 수형을 고려하여 현장 관리자의 의견을 반영하도록 제안하였다.

가치분석을 통한 휘처 기반의 요구사항 변경 관리 (Feature-Oriented Requirements Change Management with Value Analysis)

  • 안상임;정기원
    • 한국전자거래학회지
    • /
    • 제12권3호
    • /
    • pp.33-47
    • /
    • 2007
  • 소프트웨어 개발 초기에 모든 요구사항을 정의하는 것은 불가능하기 때문에 요구사항은 소프트웨어 개발이 진행되는 동안에 지속적으로 변경된다. 이러한 요구사항 변경은 개발자가 소프트웨어 구조나 행위를 완벽하게 이해하지 못하거나 변경에 따라 영향을 받는 모든 부분을 식별할 수 없을 경우 많은 오류를 야기 시킨다. 그러므로, 조직의 비즈니스에 공헌하면서 비용 효과적으로 적절히 처리되기 위하여 요구사항은 관리되고 평가되어야한다. 본 논문은 가치분석을 통하여 생성된 휘처 기반의 요구사항추적 링크를 근간으로 하는 요구사항변경 관리 기법을 제안한다. 이는 사용자 요구사항과 산출물간의 연결을 분석하기 위하여 휘처를 중간 매개체로 활용한 추적 링크를 이용한다. 그리고, 요구사항 변경 요청을 휘처 단위로 상세화하기 위한 변경 트리 모델을 정의하고 변경 관리가 수행되는 전체적인 프로세스를 제시한다. 또한, 요구사항 변경 관리 기법을 자산관리포탈시스템에 적용한 사례의 결과를 기술한다.

  • PDF