• Title/Summary/Keyword: 가중치부여방법

Search Result 464, Processing Time 0.03 seconds

Object Categorization Using PLSA Based on Weighting (특이점 가중치 기반 PLSA를 이용한 객체 범주화)

  • Song, Hyun-Chul;Whoang, In-Teck;Choi, Kwang-Nam
    • Journal of Internet Computing and Services
    • /
    • v.10 no.4
    • /
    • pp.45-54
    • /
    • 2009
  • In this paper we propose a new approach that recognizes the similar categories by weighting distinctive features. The approach is based on the PLSA that is one of the effective methods for the object categorization. PLSA is introduced from the information retrieval of text domain. PLSA, unsupervised method, shows impressive performance of category recognition. However, it shows relatively low performance for the similar categories which have the analog distribution of the features. In this paper, we consider the effective object categorization for the similar categories by weighting the mainly distinctive features. We present that the proposed algorithm, weighted PLSA, recognizes similar categories. Our method shows better results than the standard PLSA.

  • PDF

A Study of Indexing Methods with weight-value of Web document (가중치를 가지는 웹문서 색인기법에 관한 연구)

  • Kim, Jong-Young;Kim, Cheol-Su
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.2459-2462
    • /
    • 2002
  • 검색된 문헌들에 대한 항해 시간을 줄이기 위해서 검색된 문헌들의 문헌 순위화가 필수적이다. 문헌 순위화를 위해서는 문헌 순위화를 위한 순위화 정보가 필요하다. 본 논문에서는 검색된 문헌들에 대한 순위화를 보다 효율적으로 수행하기 위한 정보를 제공하기 위하여 HTML 문서에 대한 색인 과정에서 다양한 가중치를 가지는 색이어 추출 방법에 관하여 연구하였다. 웹문서들은 태그로 이루어지며 중요한 색인어들은 특정 태그 속에 포함되어 있다는 것에 착안하여 색인어의 중요도에 영향을 줄 수 있는 태그를 선별하고, 선별된 태그들에 대해 휴리스틱 정보를 이용하여 중요도를 부여한 후 선별된 태그에 영향을 받는 문장들에서 추출된 색인어에 대하여 가중치를 부여하는 방법을 이용하였다. 색인어 추출을 형태소 분석기를 이용하였다. 색인어들이 다양한 가중치를 가지므로 검색 과정에서 검색된 문헌들에 대하여 효율적인 순위화가 가능하여 관련 문헌을 보다 빠르게 찾을 수 있는 환경을 제공할 수 있다.

  • PDF

Topic-based Multi-document Summarization Using Non-negative Matrix Factorization and K-means (비음수 행렬 분해와 K-means를 이용한 주제기반의 다중문서요약)

  • Park, Sun;Lee, Ju-Hong
    • Journal of KIISE:Software and Applications
    • /
    • v.35 no.4
    • /
    • pp.255-264
    • /
    • 2008
  • This paper proposes a novel method using K-means and Non-negative matrix factorization (NMF) for topic -based multi-document summarization. NMF decomposes weighted term by sentence matrix into two sparse non-negative matrices: semantic feature matrix and semantic variable matrix. Obtained semantic features are comprehensible intuitively. Weighted similarity between topic and semantic features can prevent meaningless sentences that are similar to a topic from being selected. K-means clustering removes noises from sentences so that biased semantics of documents are not reflected to summaries. Besides, coherence of document summaries can be enhanced by arranging selected sentences in the order of their ranks. The experimental results show that the proposed method achieves better performance than other methods.

A Study on Optimization of Support Vector Machine Classifier for Word Sense Disambiguation (단어 중의성 해소를 위한 SVM 분류기 최적화에 관한 연구)

  • Lee, Yong-Gu
    • Journal of Information Management
    • /
    • v.42 no.2
    • /
    • pp.193-210
    • /
    • 2011
  • The study was applied to context window sizes and weighting method to obtain the best performance of word sense disambiguation using support vector machine. The context window sizes were used to a 3-word, sentence, 50-bytes, and document window around the targeted word. The weighting methods were used to Binary, Term Frequency(TF), TF ${\times}$ Inverse Document Frequency(IDF), and Log TF ${\times}$ IDF. As a result, the performance of 50-bytes in the context window size was best. The Binary weighting method showed the best performance.

Applicability of Existing Formulae for Composite Roughness (기존 복합 조도계수 산정식의 적용성)

  • Kim, Ji-Sung;Lee, Chan-Joo;Kim, Keuk-Soo;Kim, Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1084-1088
    • /
    • 2010
  • 일반적으로 자연하천에서는 횡방향 흐름저항 요소가 매우 다를 수 있다. 이러한 하천은 흐름저항 요인에 따라 몇 개의 소단면으로 구분될 수 있으며, 1차원 해석을 위해서는 단면 전체를 대표하는 복합 조도계수(composite roughness coefficient)를 사용함으로써 수위 또는 평균유속의 계산이 가능해 진다. 복합 조도계수는 각 소단면의 면적(A), 윤변(P), 또는 동수반경(R)을 적절히 조합하여 각 소단면의 조도계수에 가중치를 부여하면서 계산되는데, 각 산정식들의 개발과정에 도입된 가정 조건에 따라 상이한 가중치를 부여하게 되며, 일부 산정식들에서는 횡방향으로 동일한 재료로 구성된 조건에서도 복합 조도계수 산정 결과는 하상재료에 의한 조도계수와 다른 값을 산정하게 된다. 본 연구에서는 13개의 기존 복합 조도계수 산정식을 이론적으로 검토하였고, 소규모 실내 수리실험자료로부터 실측 복합 조도계수와 계산된 값을 비교 분석하였으며, 소단면 분할방법에 의한 기존 산정식의 적용성을 분석하였다. 분석결과, 윤변을 가중치로 사용하는 경우는 실측 복합 조도계수 그리고 각 산정식에 의한 계산 복합 조도계수의 차이가 비교적 작게 나타났으나 각 산정식의 가정조건에 유의하여야 하는 것으로 나타났다. 한편 단면적 또는 윤변과 동수반경을 조합하여 가중치로 사용하는 경우는 방법별로 큰 차이를 보이는 것으로 분석되었고, 그 원인은 단면분할 방법에 기인하므로 이러한 방법을 적용할 경우에는 소단면 분할방법에 특히 주의하여야 함을 알 수 있다.

  • PDF

Weighting Assignments Paper Retrieval Model Based On Ontology (온톨로지 기반 가중치 부여 논문 검색 모델)

  • Park, Hyun-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.328-331
    • /
    • 2007
  • 많은 연구원들이 자신의 연구 과제를 수행함에 있어 선행 연구 자료로 참고하는 것이 관련 주제에 관한 학술 자료이다. 현재 많은 학교와 기관 그리고 단체에서 관련 학술 자료를 발간하고 있으며 이를 참조하는 방식도 다양하다. 그러나 학술 자료를 참조함에 있어 단어 기반 검색이 사용되고, 발간된 자료의 양이 방대해짐에 따라 사용자가 원하는 정보를 참조하는 데 많은 어려움이 따른다. 본 논문은 이러한 기존 학술 자료 검색 방법을 보완하기 위하여 온톨로지를 기반으로 하는 가중치 부여 논문 검색 모델을 제안한다. 제안한 모델은 논문 관련 정보를 온톨로지로 구축하고, 검색 문서에 가중치를 부여하는 순위화 알고리즘을 적용한 것이다. 이는 기존 유사도 적용 기법에 시멘틱 개념을 적용한 것으로 효율적이고 정확한 논문 검색을 보장한다.

  • PDF

Gradient Descent Approach for Value-Based Weighting (점진적 하강 방법을 이용한 속성값 기반의 가중치 계산방법)

  • Lee, Chang-Hwan;Bae, Joo-Hyun
    • The KIPS Transactions:PartB
    • /
    • v.17B no.5
    • /
    • pp.381-388
    • /
    • 2010
  • Naive Bayesian learning has been widely used in many data mining applications, and it performs surprisingly well on many applications. However, due to the assumption that all attributes are equally important in naive Bayesian learning, the posterior probabilities estimated by naive Bayesian are sometimes poor. In this paper, we propose more fine-grained weighting methods, called value weighting, in the context of naive Bayesian learning. While the current weighting methods assign a weight to each attribute, we assign a weight to each attribute value. We investigate how the proposed value weighting effects the performance of naive Bayesian learning. We develop new methods, using gradient descent method, for both value weighting and feature weighting in the context of naive Bayesian. The performance of the proposed methods has been compared with the attribute weighting method and general Naive bayesian, and the value weighting method showed better in most cases.

Indexing Model and Weight Assignment on Keywords for Contents based Retrieval in XML Documents (XML 문서의 내용기반 검색을 위한 인덱싱 모델 및 색인어의 가중치 부여)

  • 한예지;한창우;서동혁;김수희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.103-105
    • /
    • 2004
  • 본 논문에서는 XML 문서의 내용을 효율적으로 검색하기 위해 필요한 메타데이터의 스키마몰 개발하고 이론 바탕으로 구축되는 내용기반 인덱싱 모델을 제안한다. 제안하는 내용기반 인덱싱 모델은 엘리먼트타입에 따라 랭킹 검색과 불리언 검색을 지원한다. 랭킹 검색 결과의 재현도와 정확도를 높이기 위해, 검색 결과의 출력 기준 노드가 리프 노드와 내부 노드인 경우를 구별하여 색인어에 대한 가중치를 부여하고, 이를 이용하여 질의와 엘리먼트간의 유사도를 계산하는 방법을 제안한다.

  • PDF

An Automatic Classification of Korean Documents Using Weight for Keywords of Document and Corpus : Bayesian classifier (문서의 주제어별 가중치와 말뭉치를 이용한 한국어 문서의 자동분류 : 베이지안 분류자)

  • 허준희;고수정;김태용;최준혁;이정현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.154-156
    • /
    • 1999
  • 문서 분류는 미리 정의된 두 개 또는 그 이상의 클래스에 새로 생성되는 객체들을 할당하는 방법이다. 문서의 자동 분류에 대한 연구는 오래 전부터 연구되어 왔지만 한국어에 대한 적용 및 연구는 다른 분야에 비해 아직까지 활발히 이루어지지 않고 있다. 본 논문에서는 문서를 자동으로 분류하기 위해 문서의 주제어에 가중치를 부여하고, 부족한 문서의 특징을 보충하기 위하여 말뭉치로부터 주제어들과의 상호정보에 의해 추출된 단어를 사용하여 문서를 표현한 후, 가중치를 부여한 문서의 주제어에 베이지안 분류자를 사용하여 문서분류를 수행한다. 실험은 한국어 정보검색 실험용 데이터 집합인 KTset95 문서 4,414개 중 1,300개의 문서를 학습 집합으로, 1,000개의 문서를 분류에 대한 검증 집합으로 사용하였다. 실험 결과, 순수 베이지안 확률을 사용한 기존의 방법보다 실험 집합과 검증 집합에서 각각 1.92%, 4.3% 향상된 분류 정확도를 얻었다.

  • PDF

Texture Classification by a Fusion of Weighted Feature (가중치 특징 벡터를 이용한 질감 영상 인식 방법)

  • 정수연;곽동민;윤옥경;박길흠
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.407-410
    • /
    • 2001
  • 최근 영상 검색(retrieval)과 분류(classification)에서 질감 특징(texture feature)을 이용한 연구들이 활발하게 진행되고 있다. 본 논문에서는 효율적인 질감 특징 추출을 위해 명암도 상호발생 행렬법(gray level co-occurrence matrix)과 웨이블릿 변환(wavelet transform)을 이용하여 질감의 특징을 추출한 후 특징의 중요도에 따라서 가중치를 부여하는 방법을 제안한다. 이렇게 추출된 가중치 대표 벡터들을 기반으로 베이시안 분류기(Bayesian classifier)를 통해 임의의 질감을 인식하였다.

  • PDF