• Title/Summary/Keyword: 가중치부여방법

Search Result 465, Processing Time 0.03 seconds

Query Expansion Using Term Reweighting for Vector Model (벡터모델에서 용어 가중치 재부여를 이용한 질의 확장)

  • 김영천;이재훈;문유미;박병권;이성주
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2001.12a
    • /
    • pp.23-26
    • /
    • 2001
  • 순수한 부울 검색 시스템은 문서와 질의 사이의 유사도를 나타내는 문서값을 계산할 수 없기 때문에, 검색된 문서들을 질의를 만족하는 정보에 따라 정렬할 수 없다. 부울 검색 시스템의 이러한 단점을 보완하는 방법으로 MMM 모델, Paice 모델, p-norm 모델이 개발되었다. 본 논문에서는 높은 검색 효과를 제공하는 벡터모델에서 용어 가중치 재부여를 이용한 정보검색 모델을 제안한다. 벡터모델에서 용어 가중치 재부여를 이용한 질의 확장 모델의 연산 특성이 MMM, Paice, p-norm 모델보다 우수함을 설명하고, 또한 성능 비교를 통하여 이를 입증한다.

  • PDF

Document Summarization using Pseudo Relevance Feedback and Term Weighting (의사연관피드백과 용어 가중치에 의한 문서요약)

  • Kim, Chul-Won;Park, Sun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.16 no.3
    • /
    • pp.533-540
    • /
    • 2012
  • In this paper, we propose a document summarization method using the pseudo relevance feedback and the term weighting based on semantic features. The proposed method can minimize the user intervention to use the pseudo relevance feedback. It also can improve the quality of document summaries because the inherent semantic of the sentence set are well reflected by term weighting derived from semantic feature. In addition, it uses the semantic feature of term weighting and the expanded query to reduce the semantic gap between the user's requirement and the result of proposed method. The experimental results demonstrate that the proposed method achieves better performant than other methods without term weighting.

종이의 durability 개념 및 평가방법

  • Jeong, Yang-Jin;Kim, Tae-Yeong;Lee, Seung-Han
    • Proceedings of the Korea Technical Association of the Pulp and Paper Industry Conference
    • /
    • 2007.04a
    • /
    • pp.257-263
    • /
    • 2007
  • 본 논문은 내구성(durability) 및 내오염성(soiling resistance)이 매우 중요한 성질로 인식되는 유통지의 평가방법을 제안하는데 목적이 있다. 즉, 종이의 내구성 및 내오염성의 측정 및 평가에 있어서, 재현성 및 반복성이 우수하고 합리적인 측정방법 및 평가방법을 구축하는데 목적이 있다. 연구목적에 적합한 시료의 준비, 오염물의 조성, 실험장치 및 실험후의 타당한 평가방법 등에 대하여 선행 연구결과를 고찰하였다. 기존 방법의 수정과 새로운 장치의 제작 및 평가방법의 설정을 통해 재현성이 높은 평가방법을 정립하고자 하였다. 유통지의 내구성을 평가하는 방법으로는 습식, 내오염성, 건식 내오염성, 구김기공도, 내세탁성, 잉크 내마모도 등의 항목을 측정하여 개별항목으로 내구성을 가늠하거나, 몇가지항목에 각기 다른 가중치를 부여하여 구한 내구성 지수(durability index)의 개념으로 내구성을 평가하기도 한다. 본 논문에서는 내구성에 영향하는 요소로 강도적 성질요소(strength property value)와 내오염성 요소(artificial soiling value)로 구분하였다. 강도적 성질요소에서는 전통적으로 내구성과 관련이 깊은 것으로 인식되어 온 내절도(folding endurance), 인열강도(tearing resistance) 및 구김기공도(crumpled porosity)를 인쇄하기 전 용지상태에서 측정하여 4:4:2의 가중치를 주어 구하였다. 내오염성 요소는 국가별 기후특성에 따라 연평균 상대습도가 60% 이상인 경우 인쇄 시료를 대상으로하여 습식 내오염성, 건식 내오염성 및 내석검성을 평가한 후 6:3:1의 가중치를 주어 구하였다. 또한 연평균 60% 미만인 국가의 경우 3:6:1의 가중치를 부여하였다. 이렇게 구해진 강도적 성질요소와 내오염성 요소에 있어 강도적 성질요소는 궁극적으로 내오염성 요소에 영향하기 때문에 3:7의 비율로 가중치를 부여하여 최종적으로 내구성 지수를 구하였다. 이때의 점수가 60점 이상이면 내구성 용지로 정의하였다. 본 논문에서는 현장실험을 통하여 시제품을 제조하였다. 상기 설명된 방법으로 내구성 지수를 구한 결과, 일반 유통지 제조방법으로 제조한 경우 내구성 지수가 약 45점이었다. 반면, 새로 개발된 방법에 의한 고내구성용지(durability paper)의 경우 70점 이상을 나타내어 내구성이 향상되었음을 확인할 수 있었다.

  • PDF

A Disambiguation and Weighting Method using Mutual Information for Query Translation in Korean-to-English Cross-Language IR (한-영 교차언어 정보검색에서 상호정보를 이용한 질의 변환 모호성 해소 및 가중치 부여 방법)

  • Jang, Myung-Gil;Myaeng, Sung-Hyon;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.55-62
    • /
    • 1999
  • 교차언어 문서검색에서는 단일언어 문서 상황을 만들기 위하여 질의나 문서를 다른 언어로 변환하게 되는데, 일반적으로 간단하면서도 실용적인 질의 변환의 방법을 주로 사용하고 있다. 하지만 단순한 대역 사전을 사용한 질의 변환의 경우에 변환 모호성 때문에 40% 이상의 검색 효과의 감소를 가져온다. 본 논문에서는 이러한 변환 모호성을 해결하기 위하여 대역 코퍼스로부터 추출한 상호 정보를 이용하는 단순하지만 효과적인 사전 기반 질의 변환 방법을 제안한다. 본 연구에서는 변환 모호성으로 발생한 다수의 후보들에서 가장 좋은 후보를 선택하는 모호성 해소 뿐 아니라 후보 단어들에 적절히 가중치를 부여하는 방법을 사용한다. 본 질의 변환 방법은 단순히 가장 큰 상호 정보의 단어를 선택하여 모호성 해소만을 적용하는 방법과 Krushall의 최소 스패닝 트리 구성과 유사한 방법으로 상호 정보가 큰 순서대로 간선들을 연결하여 모호성 해소와 가중치 부여를 적용하는 방법들과 질의 변환의 검색 효과를 비교한다. 본 질의 변환 방법은 TREC-6 교차언어 문서검색 환경의 실험에서 단일 언어 문서검색의 경우의 85%, 수작업 모호성 해소의 경우의 96%에 도달하는 성능을 얻었다.

  • PDF

Improvement of Retrieval Performance Using Adaptive Weighting of Key Frame Features (키 프레임 특징들에 적응적 가중치 부여를 이용한 검색 성능 개선)

  • Kim, Kang-Wook
    • Journal of Korea Multimedia Society
    • /
    • v.17 no.1
    • /
    • pp.26-33
    • /
    • 2014
  • Video retrieval and indexing are performed by comparing feature similarities between key frames in shot after detecting a scene change and extracting key frames from the shot. Typical image features such as color, shape, and texture are used in content-based video and image retrieval. Many approaches for integrating these features have been studied. However, the issue of these approaches is how to appropriately assign weighting of key frame features at query time. Therefore, we propose a new video retrieval method using adaptively weighted image features. We performed computer simulations in test databases which consist of various kinds of key frames. The experimental results show that the proposed method has better performance than previous works in respect to several performance evaluations such as precision vs. recall, retrieval efficiency, and ranking measure.

A Study on how to configure Factor on the Power Planning (전원구성시 가중치 부여 방법에 관한 연구)

  • Kim, Tae-Young;Lee, Jung-In;Kim, Kang-Won;Kang, Dong-Joo;Kim, Balho-H.
    • Proceedings of the KIEE Conference
    • /
    • 2009.07a
    • /
    • pp.571_572
    • /
    • 2009
  • 전력수요는 시시각각 변한다. 또한 첨두수요는 매년 증가하고 있다. 이러한 수요의 증가에 따른 발전용량도 증가하여야 한다. 발전용량의 증가를 위해서는 전원계획을 통한 신규 발전소를 건설하여야 한다. 신규발전소를 건설함에 있어서는 송전선 및 여러 가지 조건들을 고려하여 건설하여야 한다. 또한 우리나라는 부하가 집중되어 있는 수도권과 발전기가 집중되어 있는 비수도권으로 크게 구분되어 진다. 이러한 특성 때문에 북상조류의 발생과 송전선의 제약도 크게 걸린다. 이러한 문제를 해결하기 위해 신규발전소를 수도권 근처에 건설하도록 유도하여야 한다. 신규발전소의 수도권 유치를 위해 전원계획시 가중치를 부여하고 있다. 이 논문에서는 총발전비용과 비계량 지표를 이용하여 객관적인 가중치를 부여방법에 대해 논하고 있다.

  • PDF

Automatic Document Classification Based on Word Frequency Weight (단어 빈도 가중치를 이용한 자동 문서 분류)

  • Noh, Hyun-A;Kim, Min-Soo;Kim, Soo-Hyung;Park, Hyuk-Ro
    • Annual Conference of KIPS
    • /
    • 2002.11a
    • /
    • pp.581-584
    • /
    • 2002
  • 본 논문에서는 범주 내의 키워드 빈도에 의해 문서를 자동으로 분류하는 방법을 제안한다. 문서 자동분류 시스템에서는 문서와 문서를 비교하기 위해서 분류 자질(feature)에 적절한 가중치를 부여할 필요가 있다. 본 논문에서는 수작업으로 분류된 신문기사를 이용하여 자질의 가중치를 학습하는 방법을 사용하였다. 기존의 용어가중치 방법은 각 범주별로 가장 많이 등장한 명사부터 순서대로 추출하여 가중치를 주는 방법을 사용한 것에 비해 본 논문에서는 명사의 출현 횟수뿐만 아니라 출현위치를 함께 고려하여 가중치를 계산하는 방법을 제안한다. 또한 단어 빈도 가중치 방법의 변형된 방식을 사용함으로써 기존의 단어 빈도 가중치 방법과 비교하여 분류 정확도 측면에서 9%이상 성능 향상을 있음을 보인다.

  • PDF

Improvement of Retrieval Performance using Automatically Weighted Image Features (영상 특징들에 자동 가중치 부여를 이용한 검색 성능 개선)

  • Kim, Kang-Wook;Park, Jong-Ho;Hwang, Chang-Sik
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.37 no.6
    • /
    • pp.17-21
    • /
    • 2000
  • Typical image features such as color, shape, and texture are used in content based image retrieved. Retrieval which uses only one image feature has little performance in case that the content of image is complex or database contains many images. So, many approaches for integrating these features have been studied. However, the problem of these approaches is how to appropriately weight the image features at query time. In this paper, we propose a new retrieval method using automatically weighted image features. We perform computer simulations in test database which consists of various kinds of images. The experimental results show that the proposed method has better performance than previous works, which use fixed weight for each feature mostly, in respect to several performance cvaluations such as precision vs recall, retrieval efficiency, and ranking measure.

  • PDF

Relevance Feedback Experiments for Korean Information Retrieval Systems (한국어 정보검색 시스템을 위한 다양한 적합성 피드백 방법의 실험)

  • Park, Su-Hyeon;Gwon, Hyeok-Cheol
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.5
    • /
    • pp.682-691
    • /
    • 1999
  • 정보검색 시스템의 검색 효율 향상을 위해서 다양한 적합성 피드백 방법이 개발되었다. 그러나 한국어 정보검색 시스템을 위한 적합성 피드백에 대한 연구는 거의 이루어지지 않은 실정이다. 이 논문에서는 기존에 개발된 적합성 피드백 방법을 한국어 정보 시스템에 적용하여 검색 효율을 비교하고, 새로운 적합성 피드백 방법을 개발 적용하여 기존의 방법들과 검색 효율을 비교분석하였다. 적합성 피드백은 원질의문을 확장할 단어 선택과 선택된 단어 가중치 부여로 이루어진다. 원질의문이 입력되면 검색된 적합문서에서 원질의문을 단어와 밀접한 관계가 있는 단어를 선택하기 위하여 가중치를 부가한후, 원질의문에 추가하여 질의문을 확장한다. 이 논문에서는 원질의문 확장을 위한 단어 선택과 단어 가중치 부여를 위해 3가지 값을 사용한다. 첫째, TF는 적합문서 내의 단어 빈도의 총합이다. 둘째, idf는 해당 문서집단의 역문헌빈도이다. 셋째, r/R은 검색된 적합문서 중에서 해당단어가 있는 적합문서의 비율을 나타낸다. TF와 idf는 정보검색 시스템에서 일반적으로 사용되고있는 값이고 r/R은 이 논문에서 제안한 새로운 값이다.

Object Categorization Using PLSA Based on Weighting Distinctions (특이점 가중치 기반 PLSA를 이용한 객체 범주화)

  • Song, Hyun-Chul;Choi, Kwang-Nam
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.460-465
    • /
    • 2007
  • 영상 내 사물들의 카테고리를 인식하는 연구는 시각적 영상처리와 연관된 다양한 분야에서 활발히 진행되고 있다. 객체 범주화(Object Categorization)는 가정과 같은 실내에서 책상, 의자, 컵, 주전자 등의 다양한 사물들을 구분하여 인식하는데 중요한 역할을 할 수 있다. 본 논문에서는 최근 영상 내 객체들의 카테고리 분석을 위해 연구된 PLSA를 기반으로 특이점에 가중치를 부여하여, 보다 유사한 카테고리 간에 인식 성능을 향상시키는 접근법에 대하여 연구하였다. PLSA는 문서기반의 정보검색 분야로부터 소개된 기법으로, 약한 수준의 비감독 방법임에도 불구하고 인상적인 인식성능을 보여준다. 그러나 비슷한 특징점 분포를 보이는 유사한 카테고리 간의 객체 카테고리 인식에 대해서는 비교적 낮은 성능을 보인다. 본 연구에서는 카테고리간의 비교실험을 통해 각 특징점에 대하여 가중치를 부여한 PLSA를 적용하여 유사한 객체 간의 카테고리 인식 가능성을 살펴보았다. 실험에서는 기존의 PLSA 기법과 제안한 가중치를 부여 PLSA 기법을 각각 적용하여 그 성능을 비교하였다. 본 연구에서는 기존 PLSA 기법에서는 비교적 낮은 인식률을 보인 유사한 카테고리 인식에 대하여 실험 결과를 통해 가중치를 부여한 PLSA 기법이 보다 향상된 성능을 보임을 확인하였다.

  • PDF