• 제목/요약/키워드: Keyword

검색결과 2,066건 처리시간 0.026초

음소 HMM을 이용한 Keyword Spotting 시스템에서의 Non-Keyword 모델에 관한 연구 (A Study on the Non-keyword Models in the Keyword Spotting System using the Phone-Based Hidden Markov Models)

  • 이활림
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.83-87
    • /
    • 1995
  • Keyword Spotting 이란 음성인식의 한 분야로서 입력된 음성에서 미리 정해진 특정단어 또는 복수 개의 단어들 중 어느 것이 포함되어 있는지의 여부를 찾아내고 이 단어를 식별해 내는 작업을 의미한다. 음소모델을 이용하여 Keyword Spotting 시스템을 구성할 경우 새로운 keyword의 추가 또는 변경이 필요할 때 단순히 그 발음사전에 따라 음소모델들을 연결시킴으로써 keyword 모델을 구성할 수 있으므로 단어모델에 의한 방법에 비해 장점이 있다. 본 논문에서는 triphone을 기본단위로 하는 HMM 에 의해 keyword 모델을 구성하고, non-keyword 모델 및 silence 모델을 함께 사용하는 keyword spotting 시스템을 구성하였다. 이러한 시스템에서 non-keyword 모델은 keyword와 keyword가 아닌 음성을 구분 지어주는 역할을 하므로 인식성능의 향상을 위해서는 적절한 non-keyword 모델의 선택이 필요하다. 본 논문에서는 10개의 state를 갖는 단일모델, 조음방법에 의해 음소들을 clustering 한 모델, 그리고 통계적 방법에 의해 음소들을 clustering 한 모델들을 각각 non-keyword 모델로 사용하여 그 성능을 비교하였다. 6개의 keyword를 대상으로 한 화자독립 keyword spotting 실험결과, 통계적 방법에 의해 음소들을 6 또는 7개의 그룹으로 clustering 한 방법이 가장 우수한 인식성능을 나타냈다.

  • PDF

Keyword spotting에서의 후처리 과정에 관한 연구 (A Study on the Postprocessing In Keyword Spotting)

  • 송화전
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.249-252
    • /
    • 1994
  • Keyword spotting 이란 음성인식의 한 분야로서 컴퓨터가 사람의 음성을 입력받아 이 음성에 미리 정해진 특정단어 또는복수개의 단어들 중 어느 것이 포함되어 있는지의 여부를 찾아내고 이 단어를 식별해 내는 작업을 의미한다. 이러한 keyword spotting 시스템의 인식 오류들을 감소시키는 방법의 하나로 keyword spotting 시스템에 후처리 과정을 둠으로써 잘못 검출된 keyword 들을 제거시키는 방법이 사용될 수 있다. 본 논문에서는 keyword로 검출된 영역에 대한 keyword 모델의 likeihood와 그 여역에 대한 filler 모델의 likelihood의 ratio 와 second best keyword 의 likelihood 그리고, 끝점존재 영역의 구간 길이등 여러 가지 정보를 이용한 후처리과정을 검토하고 인식실험을 통해 이들의 성능을 비교하였다. 6개의 부서명을 keyword로 하는 불특정 화자 keyword spotting 실험을 수행한 결과 baseline 시스템의 경우 고립단어 및 문장 형태의 음성에 대해 95.0%의 keyword 인식률을 얻었으며, 본 논문에서 검토된 네 가지 후처리 방법에 의해 keyword rejection ratio를 0%에서 5%까지 변화시켜 나갈 경우 최저 95.3%에서 최고 97.1%까지 keyword 인식률이 향상된 결과를 얻었다. 특히 성능과 계산량을 종합적으로 고려할 때 끝점 존재 영역의 구간 길이 정보를 이용한 방법이 가장 우수하였다.

  • PDF

가변어휘 핵심어 검출을 위한 비핵심어 모델링 및 후처리 성능평가 (Performance Evaluation of Nonkeyword Modeling and Postprocessing for Vocabulary-independent Keyword Spotting)

  • 김형순;김영국;신영욱
    • 음성과학
    • /
    • 제10권3호
    • /
    • pp.225-239
    • /
    • 2003
  • In this paper, we develop a keyword spotting system using vocabulary-independent speech recognition technique, and investigate several non-keyword modeling and post-processing methods to improve its performance. In order to model non-keyword speech segments, monophone clustering and Gaussian Mixture Model (GMM) are considered. We employ likelihood ratio scoring method for the post-processing schemes to verify the recognition results, and filler models, anti-subword models and N-best decoding results are considered as an alternative hypothesis for likelihood ratio scoring. We also examine different methods to construct anti-subword models. We evaluate the performance of our system on the automatic telephone exchange service task. The results show that GMM-based non-keyword modeling yields better performance than that using monophone clustering. According to the post-processing experiment, the method using anti-keyword model based on Kullback-Leibler distance and N-best decoding method show better performance than other methods, and we could reduce more than 50% of keyword recognition errors with keyword rejection rate of 5%.

  • PDF

A Keyword Network Analysis on Health Disparity in Korea: Focusing on News and its application to Physical Education

  • Kim, Woo-Kyung
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권3호
    • /
    • pp.143-150
    • /
    • 2019
  • This study aimed to analyze the keyword related to Health Disparity in Korea through the method of keyword network analysis and to establish a basic database for suggesting ideas for prospective studies in physical education. To achieve the goal, this study crawled co-occured keyword with 'health' and 'disparity' from news casted in 20 different channels. The duration of the news was 3 months, from September 11th, 2018 to December 11th. The results are as follows. First, among the news during recent 3 months, there were 1,383 keyword related to health disparity and this study selected 173 keyword which had co-occured over 3 times. Second, the inclusiveness of the network was 97.674% and the density was .038. Third, analyzing news related to health disparity, 'mortality' was the most co-occured keyword and 'disparity', 'reinforcement', 'the most', 'health', '6 times', 'Seoul', 'half', 'medicine', and 'local' were shown similarly. And common keyword in 4 centrality were 13 keyword. Lastly, by analyzing eigenvector centrality, significantly different result has shown. 'Disparity' was the most co-occured keyword. Based on this result, this study showed the necessity for reinforcing the public physical education in public education system in Korea. In order to achieve it, the field of physical education must look beyond present elite-focused physical education to public physical activity.

사상체질의학회지 게재논문의 영문 주제어와 MeSH 용어의 비교 분석 (Comparison of Keywords of the Journal of Sasang Constitutional Medicine with MeSH Terms)

  • 김윤영;박혜주;이시우;유종향
    • 사상체질의학회지
    • /
    • 제25권1호
    • /
    • pp.34-42
    • /
    • 2013
  • Objectives The purpose of this study was analyzing the equality between the MeSH terms and the keyword used in the papers published in Journal of Sasang Constitutional Medicine and investigating how to use an appropriate MeSH terms as keyword in the papers. Methods A total of 704 keyword used in 177 papers published from 2009 to 2012 in Journal of Sasang Constitutional Medicine were analyzed to investigate the equality between the keyword and the MeSH terms. The collected data was analyzed using SPSS 17.0 software for frequency analysis. Results Among the 704 keyword, 107 keyword(15.2%) was perfectly matched with the MeSH terms. 64 keyword(9.1%) showed partial difference was with the MeSH terms, and 11 keyword(1.7%) showed partial difference was with the Entry terms. 127 keyword(18.0%) were included in the exception item due to the nature of journal, and 395 keyword(56.1%) were not perfectly matched with the MeSH terms. In the yearly analysis result, the number of papers that keyword and MeSH terms perfectly matched was not significant changed, however the number of papers that keyword and MeSH terms did not matched was continuously increased, which clearly indicate use of MeSH terms as the keyword of the papers published in the journal of Sasang constitution medicine is insufficient. Conclusions The papers published in journal of Sasang constitutional medicine need to be cited in various fields and the paper's finding need to affect in other studies for the development of Korean medicine and Sasang constitutional medicine. The use of proper keyword aligned with the international standards is necessary to accomplish the globalization of them.

키워드 기반 블로그 마케팅을 위한 연관 키워드 추천 시스템 (Associated Keyword Recommendation System for Keyword-based Blog Marketing)

  • 최성자;손민영;김영학
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권5호
    • /
    • pp.246-251
    • /
    • 2016
  • 최근에 SNS와 온라인 매체의 영향력이 커지면서 이를 이용한 마케팅에 대한 관심이 증가하고 있다. 블로그 마케팅은 대형 포털 사이트의 키워드 검색 결과에 따라 상위 노출을 함으로서 비교적 저렴한 비용으로 마케팅의 파급효과와 정보 전달력을 높일 수 있다. 그러나 일부 특정 키워드의 검색 결과의 경우 상위에 노출되려는 경쟁이 과열될 수 있기 때문에, 블로그를 상위에 노출하기 위해서는 장기적이고 적극적인 노력이 필요하다. 따라서 본 연구에서는 블로그의 상위 노출 가능성이 높은 연관 키워드 그룹을 추천하는 새로운 방법을 제안한다. 제안된 방법은 먼저 타겟 키워드의 검색 결과에 포함된 블로그 문서들을 수집하여 단어의 빈번도와 위치정보를 고려하여 연관성이 높은 키워드를 추출하고 필터링한다. 다음에 각 연관 키워드를 타겟 키워드와 비교하여 그들의 연관성, 월간 연관 키워드 검색 량, 검색에 포함된 블로그의 개수, 블로그의 평균 작성 일을 고려하여 상위 노출의 가능성이 높은 연관 키워드 그룹을 추천한다. 본 연구에서 실험을 통하여 제안된 방법이 연관성이 높은 키워드 그룹을 추천함을 보인다.

핵심어 인식을 이용한 음성 자동 편집 시스템 구현 (Implementation of the Automatic Speech Editing System Using Keyword Spotting Technique)

  • 정익주
    • 음성과학
    • /
    • 제3권
    • /
    • pp.119-131
    • /
    • 1998
  • We have developed a keyword spotting system for automatic speech editing. This system recognizes the only keyword 'MBC news' and then sends the time information to the host system. We adopted a vocabulary dependent model based on continuous hidden Markov model, and the Viterbi search was used for recognizing the keyword. In recognizing the keyword, the system uses a parallel network where HMM models are connected independently and back-tracking information for reducing false alarms and missing. We especially focused on implementing a stable and practical real-time system.

  • PDF

네트워크 분석을 통한 저자키워드 출현순서에 대한 의미 분석 (A Study on the Application to Network analysis on Importance of Author keyword based on Sequence of keyword)

  • 권선영
    • 한국융합학회논문지
    • /
    • 제9권9호
    • /
    • pp.9-14
    • /
    • 2018
  • 본 연구는 학술논문의 출현순서에 따른 저자키워드의 중요도를 측정해보고자 하는 연구이다. 이를 위해 학술논문 저자키워드의 출현순서를 측정한 후 네트워크 분석 방법의 연결정도중심성, 근접중심성, 매개중심성, 위세중심성 지수를 사용하여 저자키워드의 중요도를 측정해보았으며 다음으로 각각의 네트워크지수 값과 저자키워드의 출현순서와의 상관관계 분석을 수행하여 출현순서의 특징을 살펴보고자 하였다. 연구결과 연결정도중심성, 근접중심성, 매개중심성, 위세중심성 모두 4번 째 출현순서가 높은 군집의 논문수가 많은 것으로 나타났다. 다음으로 상관관계 분석결과 근접중심성을 제외한 연결정도중심성, 매개중심성, 위세중심성의 경우 출현순서의 뒷부분으로 갈수록 지수 값이 모두 높아지는 것을 볼 때 네트워크 상에서 상대적으로 중요한 용어가 뒷부분에 위치한다는 것을 알 수 있다. 본 연구는 대략적으로 연구자들의 저자키워드 부여 행태를 살펴볼 수 있었다는 점에서 의의를 지닌다. 향후 저자키워드의 전개양상을 심층적으로 살펴 보기 위해서는 상황적 요인, 행동, 심리 등을 파악하여 보완하는 후속 연구가 반드시 필요하다.

학술논문의 저자키워드 출현순서에 따른 저자키워드 중요도 측정을 위한 네트워크 분석방법의 적용에 관한 연구 (A Study on the Application to Network Analysis on the Importance of Author Keyword based on the Position of Keyword)

  • 권선영
    • 정보관리학회지
    • /
    • 제31권2호
    • /
    • pp.121-142
    • /
    • 2014
  • 본 연구는 학술논문의 저자키워드 출현순서에 따른 저자키워드의 중요도를 측정해보고자 하는 연구이다. 먼저 출현순서에 따른 저자키워드의 특징을 분석한 후 네트워크 분석 방법의 연결정도중심성, 근접중심성, 매개중심성, 위세중심성, 그리고 네트워크의 구조적공백성의 효과크기와 같은 지수를 사용하여 학술논문의 저자키워드 출현순서에 따른 저자키워드의 중요도를 측정해보았으며 각각의 네트워크 지수와 저자키워드의 출현순서와의 상관관계분석을 수행하였다. 네트워크 분석 지수 중 연결정도중심성 지수, 매개중심성 지수의 경우 각 학문분야별 저자키워드의 출현순서와의 상관관계의 결과에서의 유의한 분야의 수가 비교적 다른 지수에 비해 많았다. 이와 같은 결과를 통해 저자키워드의 중요도를 단지 출현빈도만으로 판단했던 것에서 벗어나 저자키워드의 중요도 측정을 위한 방법으로 연결정도중심성 지수, 매개중심성 지수도 고려해 볼 수 있음을 알 수 있었다.

개인검색기반 키워드광고 구매전환모형 개발 (Developing the Purchase Conversion Model of the Keyword Advertising Based on the Individual Search)

  • 이동일;김현교
    • 한국경영과학회지
    • /
    • 제38권1호
    • /
    • pp.123-138
    • /
    • 2013
  • Keyword advertising has been used as a promotion tool rather than the advertising itself to online retailers. This is because the online retailer expects the direct sales increase when they deploy the keyword sponsorship. In practice, many online sellers rely on keyword advertising to promote their sales in short term with limited budget. Most of the previous researches use direct revenue factors as dependent variables such as CTR (click through rate) and CVI (conversion per impression) in their researches on the keyword advertising[14, 16, 22, 25, 31, 32]. Previous studies were, however, conducted in the context of aggregate-level due to the limitations on the data availability. These researches cannot evaluate the performance of keyword advertising in the individual level. To overcome these limitations, our research focuses on conversion of keyword advertising in individual-level. Also, we consider manageable factors as independent variables in terms of online retailers (the costs of keyword by implementation methods and meanings of keyword). In our study we developed the keyword advertising conversion model in the individual-level. With our model, we can make some theoretical findings and managerial implications. Practically, in the case of a fixed cost plan, an increase of the number of clicks is revealed as an effective way. However, higher average CPC is not significantly effective in increasing probability of purchase conversion. When this type (fixed cost plan) of implementation could not generate a lot of clicks, it cannot significantly increase the probability of purchase choice. Theoretically, we consider the promotional attributes which influence consumer purchase behavior and conduct individuals-level research based on the actual data. Limitations and future direction of the study are discussed.