• Title/Summary/Keyword: 유사도 가중치

Search Result 576, Processing Time 0.052 seconds

Hybrid Method using Frame Selection and Weighting Model Rank to improve Performance of Real-time Text-Independent Speaker Recognition System based on GMM (GMM 기반 실시간 문맥독립화자식별시스템의 성능향상을 위한 프레임선택 및 가중치를 이용한 Hybrid 방법)

  • 김민정;석수영;김광수;정호열;정현열
    • Journal of Korea Multimedia Society
    • /
    • v.5 no.5
    • /
    • pp.512-522
    • /
    • 2002
  • In this paper, we propose a hybrid method which is mixed with frame selection and weighting model rank method, based on GMM(gaussian mixture model), for real-time text-independent speaker recognition system. In the system, maximum likelihood estimation was used for GMM parameter optimization, and maximum likelihood was used for recognition basically Proposed hybrid method has two steps. First, likelihood score was calculated with speaker models and test data at frame level, and the difference is calculated between the biggest likelihood value and second. And then, the frame is selected if the difference is bigger than threshold. The second, instead of calculated likelihood, weighting value is used for calculating total score at each selected frame. Cepstrum coefficient and regressive coefficient were used as feature parameters, and the database for test and training consists of several data which are collected at different time, and data for experience are selected randomly In experiments, we applied each method to baseline system, and tested. In speaker recognition experiments, proposed hybrid method has an average of 4% higher recognition accuracy than frame selection method and 1% higher than W method, implying the effectiveness of it.

  • PDF

Hierarchic Document Clustering in OPAC (OPAC에서 자동분류 열람을 위한 계층 클러스터링 연구)

  • 노정순
    • Journal of the Korean Society for information Management
    • /
    • v.21 no.1
    • /
    • pp.93-117
    • /
    • 2004
  • This study is to develop a hierarchic clustering model fur document classification and browsing in OPAC systems. Two automatic indexing techniques (with and without controlled terms), two term weighting methods (based on term frequency and binary weight), five similarity coefficients (Dice, Jaccard, Pearson, Cosine, and Squared Euclidean). and three hierarchic clustering algorithms (Between Average Linkage, Within Average Linkage, and Complete Linkage method) were tested on the document collection of 175 books and theses on library and information science. The best document clusters resulted from the Between Average Linkage or Complete Linkage method with Jaccard or Dice coefficient on the automatic indexing with controlled terms in binary vector. The clusters from Between Average Linkage with Jaccard has more likely decimal classification structure.

An Effective Snippet Generation Method using Text Summarization Techniques based on Pseudo Relevance Feedback (유사 적합성 피드백 기반의 문서 요약 기법을 이용한 효과적인 스니펫 생성)

  • An, Hong-Guk;Ko, Young-Joong;Seo, Jung-Yun
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.174-181
    • /
    • 2007
  • 정보 검색의 결과로 나타나는 요약문을 스니펫(snippet)이라 한다. 사용자는 자신이 원하는 정보를 얻기 위해 문서를 검색하는데, 이 때 스니펫은 사용자가 원하는 문서를 찾는데 중요한 역할을 한다. 본 논문에서는 정보검색 분야에서 높은 성능을 보이는 유사 적합성 피드백을 자동 문서 요약에 맞게 적용하여 높은 성능의 스니펫 생성 시스템을 구현한다. 우선, 사용자의 질의가 포함된 문장들을 일차적으로 요약 문장 후보로 추출한다. 그리고 추출된 문장 후보로부터 명사들을 질의 후보로 고려한다. 각 문장이 질의의 포함 여부에 따라 문장의 적합성을 판단하게 되고, 유사 적합성 피드백 확률 모델에 적용한 후 질의 후보들의 가중치를 추정하여 가중치 순위를 통해 확장할 질의들을 결정한다. 확장된 질의들과 기존의 질의들의 가중치를 합산하여 각 문장의 순위를 매기게 되고 가장 높은 순위의 문장들이 스니펫으로 제시된다. 논문에서 제안한 기법은 추가적인 핵심 질의들을 자동으로 확장하여 중요한 문장을 추출할 수 있다. 이 연구를 위해서 일반 상용 정보 검색 서비스에서 제공하는 스니펫을 수집하였고 이들의 정확도와 시스템의 정확도를 비교하였다. 실험 결과를 통해 살펴본 제안된 시스템의 성능은 상용 정보 검색기에서 제공되고 잇는 스니펫의 정확도 보다 우수한 성능을 보였다.

  • PDF

Design and Implementation of a Similarity based Plant Disease Image Retrieval using Combined Descriptors and Inverse Proportion of Image Volumes (Descriptor 조합 및 동일 병명 이미지 수량 역비율 가중치를 적용한 유사도 기반 작물 질병 검색 기술 설계 및 구현)

  • Lim, Hye Jin;Jeong, Da Woon;Yoo, Seong Joon;Gu, Yeong Hyeon;Park, Jong Han
    • The Journal of Korean Institute of Next Generation Computing
    • /
    • v.14 no.6
    • /
    • pp.30-43
    • /
    • 2018
  • Many studies have been carried out to retrieve images using colors, shapes, and textures which are characteristic of images. In addition, there is also progress in research related to the disease images of the crop. In this paper, to be a help to identify the disease occurred in crops grown in the agricultural field, we propose a similarity-based crop disease search system using the diseases image of horticulture crops. The proposed system improves the similarity retrieval performance compared to existing ones through the combination descriptor without using a single descriptor and applied the weight based calculation method to provide users with highly readable similarity search results. In this paper, a total of 13 Descriptors were used in combination. We used to retrieval of disease of six crops using a combination Descriptor, and a combination Descriptor with the highest average accuracy for each crop was selected as a combination Descriptor for the crop. The retrieved result were expressed as a percentage using the calculation method based on the ratio of disease names, and calculation method based on the weight. The calculation method based on the ratio of disease name has a problem in that number of images used in the query image and similarity search was output in a first order. To solve this problem, we used a calculation method based on weight. We applied the test image of each disease name to each of the two calculation methods to measure the classification performance of the retrieval results. We compared averages of retrieval performance for two calculation method for each crop. In cases of red pepper and apple, the performance of the calculation method based on the ratio of disease names was about 11.89% on average higher than that of the calculation method based on weight, respectively. In cases of chrysanthemum, strawberry, pear, and grape, the performance of the calculation method based on the weight was about 20.34% on average higher than that of the calculation method based on the ratio of disease names, respectively. In addition, the system proposed in this paper, UI/UX was configured conveniently via the feedback of actual users. Each system screen has a title and a description of the screen at the top, and was configured to display a user to conveniently view the information on the disease. The information of the disease searched based on the calculation method proposed above displays images and disease names of similar diseases. The system's environment is implemented for use with a web browser based on a pc environment and a web browser based on a mobile device environment.

Visual Object Tracking Using Multiple Object Models (다수 객체 모델을 이용한 객체 추적 기법)

  • Kim, Han-Ul;Kim, Chang-Su
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.11a
    • /
    • pp.104-105
    • /
    • 2015
  • 본 논문에서는 다수 객체 모델을 통해 잘못된 객체 모델 갱신의 영향을 줄이고 객체 추적의 정확도를 향상시키기 위한 방법을 제안한다. 객체 모델 집합은 다수의 객체 모델과 대응하는 가중치들로 정의된다. 각 델과의 유사도 가중 합을 고려 하여 객체 위치를 추정하고, 각 모델의 추정 신뢰도를 계산하여 가중치를 갱신한다. 실험 결과를 통해 제안하는 기법이 오클루젼, 밝기 변화로 인하여 객체 외형이 왜곡되었을 때 추적 성능을 크게 개선함을 보이고 기존 기법들보다 더 정확한 추적 결과를 제공함을 확인한다.

  • PDF

An Aptitude Test System using Fuzzy Reasoning (퍼지 추론을 적용한 적성 평가 시스템)

  • 안수영;김두완;정환묵
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.12a
    • /
    • pp.451-454
    • /
    • 2002
  • 본 논문에서는 개인의 적성을 판단하는 문제를 처리하기 위한 가중치 퍼지추론 알고리즘을 제시하고, 지식표현을 위해 퍼지 집합 이론과 퍼지 생성 규칙들을 이용하였다. 거리척도에 서는 퍼지값이 높은 구간의 척도를 낮은 구간의 척도에 비례하여 유사성을 구하였다. 또한, 가중치를 정량화한 값과 척도값을 연산하여 유사성을 나타냈고, 추출된 항목과 규칙과의 가능성을 구하였다. 여기서, 결과는 수검자들이 응답한 값들에 따라 임의의 직업군이 적당한 지를 나타내기 위해 확신도로 해석하였다.

Indexing Model and Weight Assignment on Keywords for Contents based Retrieval in XML Documents (XML 문서의 내용기반 검색을 위한 인덱싱 모델 및 색인어의 가중치 부여)

  • 한예지;한창우;서동혁;김수희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.103-105
    • /
    • 2004
  • 본 논문에서는 XML 문서의 내용을 효율적으로 검색하기 위해 필요한 메타데이터의 스키마몰 개발하고 이론 바탕으로 구축되는 내용기반 인덱싱 모델을 제안한다. 제안하는 내용기반 인덱싱 모델은 엘리먼트타입에 따라 랭킹 검색과 불리언 검색을 지원한다. 랭킹 검색 결과의 재현도와 정확도를 높이기 위해, 검색 결과의 출력 기준 노드가 리프 노드와 내부 노드인 경우를 구별하여 색인어에 대한 가중치를 부여하고, 이를 이용하여 질의와 엘리먼트간의 유사도를 계산하는 방법을 제안한다.

  • PDF

A Research of Documents Similarity Measuring Based on Word Weight (단어가중치 기반 문서간 유사도 측정에 관한 연구)

  • 김혜숙;박상철;김수형
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.198-201
    • /
    • 2003
  • 사용자의 요구 사항을 정확히 분석하여 효과적으로 개발 단계에 적용하기 위해 문서간의 의존성, 즉 상·하위 문서간의 연계성 등을 측정할 수 있는 방법에 대한 연구가 절실한데 이를 위해 적게는 두 용어가 얼마나 밀접한 관련이 있는가를 나타내는 용어간의 유사도 정보가 중요시된다. 이에 본 논문은 임의의 두 문서에 대한 다양한 유사도 측정방법을 통하여 최적의 유사도를 알아보고 두 문서간 유사여부를 검증하기 위해 Neural Network을 적용하였다. 이러한 유사도 측정과 검증 방법은 분산환경에서 입력되는 요구사항 문서들을 효율적으로 분류, 관리해 줄 수 있으며 사용자 요구사항 분석과 전체 Project 수행에 좋은 기초자료를 제공해 줄 수 있다.

  • PDF

Automatic Transformation of Semantic Roles between PropBank and Sejong using Similarity Estimation based on Tree Level (레벨 기반의 유사도 계산을 이용한 PropBank 의미역과 Sejong 의미역 간의 자동 변환)

  • Youn, Young-Shin;Seok, Mi-Ran;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.221-224
    • /
    • 2014
  • 의미 표지 부착 작업은 구문 표지 부착된 문장의 술어-논항 구조를 파악하여 논항에 적절한 의미역을 부착하는 과정이다. 이 작업을 통하여 생성되는 의미 표지 부착 말뭉치는 의미역 결정에 있어서 절대적으로 필요한 자원이 된다. 의미 표지 부착 말뭉치로는 세계적으로 PropBank가 널리 활용되고 있는데 이를 한국어에 적용시키기 위해서는 PropBank 의미역과 Sejong 의미역 간의 자동 변환이 필요하다. 이전에 제안되었던 이종 의미역 간의 자동변환 방법에서는 명사 계층의 구조 정보를 반영하지 않았다는 문제점이 있었다. 본 논문에서는 이러한 문제점을 보강하기 위하여 명사 계층구조를 반영하여 한국어 PropBank 의미역을 Sejong 의미역으로 자동 변환하는 방법을 제안한다. 제안하는 방법은 PropBank와 Sejong의 맵핑관계 중에서 1:N으로 맵핑되는 PropBank 의미역을 기준으로 명사 계층구조에서 변환 대상 의미역을 가지고 있는 단어와 변환 후보 의미역을 가진 단어들의 개념번호를 뽑아 두 단어 간의 거리를 측정한다. 그리고 레벨 당 가중치를 주어 유사도 계산을 하여 유사도가 적은 값으로 의미역을 자동 변환한다. 본 논문에서 제안하는 방법은 0.8의 성능을 보인다.

  • PDF

A Study on the Improvement of Prediction Accuracy of Collaborative Recommender System under the Effect of Similarity Weight Threshold (협력적 추천시스템에서 유사도 가중치의 임계치 설정에 따른 선호도 예측 정확도 향상에 관한 연구)

  • Lee, Seok-Jun
    • Korean Business Review
    • /
    • v.20 no.1
    • /
    • pp.145-168
    • /
    • 2007
  • Recommender system helps customers to find easily items and helps the e-biz companies to set easily their target customer by automated recommending process. Recommender systems are being adopted by several e-biz companies and from these systems, both of customers and companies take some benefits. This study sets several thresholds to the similarity weight, which indicates a degree of similarity of two customers' preference, to improve the performance of prediction accuracy. According to the threshold, the accuracy of prediction is being improved but some threshold setting shows the reduction of the prediction rate, which is the coverage. This coverage reduction has male effect on the prediction accuracy of customers, so more study on the prediction accuracy of recommender system and to maximize the coverage are needed.

  • PDF