• 제목/요약/키워드: associated keyword

검색결과 62건 처리시간 0.029초

Whisper-tiny 모델을 활용한 음성 분류 개선: 확장 가능한 키워드 스팟팅 접근법 (Enhancing Speech Recognition with Whisper-tiny Model: A Scalable Keyword Spotting Approach)

  • 시바니 산제이 콜레카르;진현석;김경백
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.774-776
    • /
    • 2024
  • The effective implementation of advanced speech recognition (ASR) systems necessitates the deployment of sophisticated keyword spotting models that are both responsive and resource-efficient. The initial local detection of user interactions is crucial as it allows for the selective transmission of audio data to cloud services, thereby reducing operational costs and mitigating privacy risks associated with continuous data streaming. In this paper, we address these needs and propose utilizing the Whisper-Tiny model with fine-tuning process to specifically recognize keywords from google speech dataset which includes 65000 audio clips of keyword commands. By adapting the model's encoder and appending a lightweight classification head, we ensure that it operates within the limited resource constraints of local devices. The proposed model achieves the notable test accuracy of 92.94%. This architecture demonstrates the efficiency as on-device model with stringent resources leading to enhanced accessibility in everyday speech recognition applications.

키워드 기반 문서 네트워크를 이용한 네트워크형 지식지도 자동 구성 (Automated networked knowledge map using keyword-based document networks)

  • 유기동
    • 지식경영연구
    • /
    • 제19권3호
    • /
    • pp.47-61
    • /
    • 2018
  • A knowledge map, a taxonomy of knowledge repositories, must have capabilities supporting and enhancing knowledge user's activity to search and select proper knowledge for problem-solving. Conventional knowledge maps, however, have been hierarchically categorized, and could not support such activity that must coincide with the user's cognitive process for knowledge utilization. This paper, therefore, aims to verify and develop a methodology to build a networked knowledge map that can support user's activity to search and retrieve proper knowledge based on the referential navigation between content-relevant knowledge. This paper deploys keywords as the semantic information between knowledge, because they can represent the overall contents of a given document, and because they can play the role of semantic information on the link between related documents. By aggregating links between documents, a document network can be formulated: a keyword-based networked knowledge map can be finally built. Domain expert-based validation test was also conducted on a networked knowledge map of 50 research papers, which confirmed the performance of the proposed methodology to be outstanding with respect to the precision and recall.

트위터를 활용한 실시간 이벤트 탐지에서의 재난 키워드 필터링과 지명 검출 기법 (Keyword Filtering about Disaster and the Method of Detecting Area in Detecting Real-Time Event Using Twitter)

  • 하현수;황병연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권7호
    • /
    • pp.345-350
    • /
    • 2016
  • 본 논문에서는 트위터를 활용하여 이벤트를 실시간으로 탐지하는 시스템에서의 재난 키워드 필터링과 지명 검출 기법을 제안한다. 스마트폰의 보급이 SNS의 빠른 확산을 이끌었고, 최근 SNS를 활용하여 다양한 연구들이 진행되고 있다. SNS 중에서 트위터는 140자의 단문으로 작성되어 빠르게 확산되는 특성을 가지고 있다. 따라서 트윗 사용자들이 작성하는 트윗은 하나의 센서 역할을 수행할 수 있다. 이러한 특성들을 이용하여 발생한 이벤트를 탐지하는 연구가 진행되었다. 그러나 최근 개인 정보 유출 사례가 증가해 자신의 위치 정보를 공개하기 꺼려함에 따라 재난이 발생한 지역을 파악하는데 어려움이 있다. 또한 맞춤법을 따르지 않은 게시글의 내용을 분석하는 과정에서 정확성과 관련된 문제가 발생한다. 따라서 이벤트 발생 탐지 과정에 재난 관련 키워드 필터링과 지명 검출 기법이 추가적으로 적용되어야 한다. 본 논문에서는 재난 관련 키워드 필터링의 적용과 두 가지 지명 검출 기법을 제안한다. 지명을 검출하는 두 가지 기법은 지명 단어에서 발생되는 노이즈를 제거하는 지명 노이즈 제거 기법과 랜드 마크를 이용하여 지명 단어를 확정하는 지명 확정 기법이다. 재난 관련 키워드와 두 지명 검출 기법을 적용한 결과 기존 시스템의 정확도 49%에서 지명노이즈 제거기법은 78%, 지명확정기법은 89%로 향상되었다.

지식 간 내용적 연관성을 표현하는 키워드 기반 네트워크형 지식지도 개발 (Keyword-based networked knowledge map expressing content relevance between knowledge)

  • 유기동
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.119-134
    • /
    • 2018
  • 저장 및 관리하는 지식의 분류체계로서의 의미를 갖는 지식지도는, 문제해결을 위하여 지식을 조회 및 선택하는 사용자의 활동을 지원하고 보완할 수 있는 구조를 갖추어야 한다. 계층형 구조를 갖는 기존의 지식지도는, 관리하는 지식을 체계적으로 정리하는 데에는 이점이 있으나, 지식 사용자가 갖는 인지 및 활용의 논리를 반영하지 못할 뿐만 아니라 지식을 조회 및 추출하는 사용자의 활동을 지원하지 못한다. 본 연구는, 내용적 관련성을 갖는 연관지식을 연쇄적으로 조회 및 추출하는 사용자의 지식활용 패턴을 반영하는, 키워드 기반 네트워크형 지식지도를 구축하는 방법론을 제시한다. 즉, 지식 간 내용적 연관성을 파악하기 위하여 키워드를 추출하고 공통된 키워드를 갖는 지식 간 링크를 해당 키워드를 이용하여 정의한다. 키워드는 해당 지식의 내용을 대변하므로, 키워드를 기반으로 정의된 링크는 내용적으로 관련성이 있는 지식 간에 형성되며, 이를 종합하면 내용적 연관성을 지식 간의 네트워크, 즉 네트워크형 지식지도가 완성된다. 제시된 방법론의 적용 타당성을 검토하기 위해 50개의 연구논문을 이용하여 이들 간의 내용적 연관성을 표현하는 네트워크형 지식지도를 구현하였으며, 검토 결과 만족할만한 수준의 정밀도와 재현율을 보였다.

시맨틱 콘텐츠 검색을 위한 질의 확장 시스템 (Query Expansion System for Semantic Contents Retrieval)

  • 이무훈;최의인
    • 디지털융복합연구
    • /
    • 제10권10호
    • /
    • pp.307-312
    • /
    • 2012
  • 최근 논리적으로 표현된 지식 베이스를 사용하는 키워드 기반 검색에서 보다 더 정확한 결과를 제공하기 위해 시맨틱 검색 방법에 대한 연구가 진행되고 있다. 대부분의 사용자는 정형화된 질의어와 스키마를 사용하는 것 보다 사용자 키워드의 의미를 해석해서 사용한다. 본 논문에서는 시맨틱 검색을 위한 사용자 질의 확장을 제안한다. 제안 시스템에서는 지식 베이스와 연관 검색어를 활용한 사용자 질의 확장 콤포넌트와 사용자 질의 해석 결과를 조정하기 위한 콤포넌트를 제공한다. 마지막으로 논문에서 제안한 사용자 질의 의미 해석 기법의 검증을 위해 프로토타입 시스템의 실험 결과를 설명한다.

주제어에 따른 시왕의 디지털 콘텐츠 구현 (Implementation of Digital Contents of the Ten Kings of Hell according to Keyword)

  • 김경덕;김영덕
    • 한국콘텐츠학회논문지
    • /
    • 제20권4호
    • /
    • pp.530-539
    • /
    • 2020
  • 본 논문에서는 불교 신화에 등장하는 10명의 지옥 왕을 주제어에 따라 시각화하는 디지털 콘텐츠를 구현한다. 10명의 지옥 왕은 시왕으로 불리며, 탱화와 같은 유형문화재로서 일반 사찰에서 찾아볼 수 있다. 시왕은 저승 세계를 관장하는 대왕으로 무속 및 불교문화 속에서 다양한 모습으로 전래되고 있다. 본 논문에서는 고문헌에 등장하는 시왕을 지옥별로 그 특징을 분석하여 주제어를 선별하고, 일반인이 특정 주제어를 선택하면 그에 따른 지옥과 왕을 시각적으로 나타내는 디지털 콘텐츠를 구현한다. 응용 분야로는 게임 및 문화 캐릭터의 개발, 전통문화를 활용한 디지털 스토리텔링, 불교문화와 교리 교육, 게임 등에 그 활용을 기대할 수 있다.

Contents Analysis and Synthesis Scheme for Music Album Cover Art

  • Moon, Dae-Jin;Rho, Seung-Min;Hwang, Een-Jun
    • 전기전자학회논문지
    • /
    • 제14권4호
    • /
    • pp.305-311
    • /
    • 2010
  • Most recent web search engines perform effective keyword-based multimedia contents retrieval by investigating keywords associated with multimedia contents on the Web and comparing them with query keywords. On the other hand, most music and compilation albums provide professional artwork as cover art that will be displayed when the music is played. If the cover art is not available, then the music player just displays some dummy or random images, but this has been a source of dissatisfaction. In this paper, in order to automatically create cover art that is matched with music contents, we propose a music album cover art creation scheme based on music contents analysis and result synthesis. We first (i) analyze music contents and their lyrics and extract representative keywords, (ii) expand the keywords using WordNet and generate various queries, (iii) retrieve related images from the Web using those queries, and finally (iv) synthesize them according to the user preference for album cover art. To show the effectiveness of our scheme, we developed a prototype system and reported some results.

2대 포털사이트 빅데이터를 이용한 한방관련 키워드 분석 (An Analysis of Key Words Related to Traditional Korean Medicine Using Big Data of Two Search Engines)

  • 안정윤;금가정;장아령;송지청
    • 한국의사학회지
    • /
    • 제30권2호
    • /
    • pp.45-61
    • /
    • 2017
  • Objectives : This research aims to investigate the consumer's interest in the Korean Medicine (KM) industry by using Google-trends and Naver-Data lab. A quick and uncomplicated way for those who are already involved with KM industry but do not have expertise in utilizing Big-data searches, is introduced. Methods : 'Direct keyword' was set by FGI (Focus Group Interview) and 'Detailed keyword' was set by using relevant word search and autocomplete search functions in the search engine. By inquiring Naver-Data lab, keyword search volumes are compared by age and sex, date range, and originating region of the researcher. It is possible to determine whether the data is reliable or authentic through examining the associated query. Selected direct keywords used through FGI (Focus Group Interview) were 'Acupuncture', 'Herbal Medicine', 'Cupping', 'Musculoskeletal Disease', 'Diet', and 'Stemina'. Based on these keywords, the following results were derived from the keyword analysis. Results : From August 2016, there was a noticeable surge of interest in men's 'Cupping'. The search for 'Diet' increased in the second quarter of 2016 from all ages. The search volume of 'Stemna' for individuals in their 20s is higher than that of those in their 30s or 40s'. Researchers from the region of Chungcheongbuk-do had a higher level of interest in analgesics and less interest in Korean Medicine. There is a greater interest in the KM market from European countries and America, than from Korea, China, and other Asian countries. Discussion : Despite the limitations of the research, it is meaningful to introduce a quick and easy data search method to compare information by age, sex, and region. Conclusion : The future of research into Korea Medicine and this market is confirmed by our data results which indicate interest from Europe, the United States, and other western countries, but less interest from Korea, China and other Asian countries.

농촌개발 연구동향에 관한 사회연결망분석 - 주제어 중심 구조분석을 중심으로 - (A Social Network Analysis on the Research Trend of Korean Rural Development)

  • 박수진;나주몽
    • 지역연구
    • /
    • 제32권3호
    • /
    • pp.29-43
    • /
    • 2016
  • 본 연구에서는 농촌개발에 관한 지난 30년간의 연구사를 분석함으로써 선행연구에서 간과되었던 연구 과제를 도출, 향후 농촌개발의 연구방향을 모색하는데 기여하고자 하였다. 사회연결망분석을 통해 정책시기별 주요 연구주제어의 변화와 주제어들 간의 연결 구조를 분석하였다. 1986년부터 2000년까지 참여정부 이전에는 연구 분야 간 융합이 활발하지 않으며, 주제어 연결구조에서는 '인구이동, IMF, 녹색관광'의 주제어를 매개로 주제어 간 연계가 일어나고 있지만 그 형태는 복잡하지 않다. 참여정부 시기에는 '노인, 농촌관광, 농촌개발정책' 등의 핵심어를 중심으로 통합된 형태의 복잡한 클러스터가 형성되어 있다. 2008년 이후 현재까지 농촌개발연구의 주제어 네트워크는 클러스터의 결집이 조밀하고 단일형태로 구성되었으며, '공동체, 주민참여, 사회적자본'과 같은 주제어가 본격적으로 연구되기 시작하였다.

4차 산업혁명에 대한 인식 변화 비교 분석: 소셜 미디어 데이터 분석을 중심으로 (A Comparative Analysis of the Changes in Perception of the Fourth Industrial Revolution: Focusing on Analyzing Social Media Data)

  • 유재은;최종우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권11호
    • /
    • pp.367-376
    • /
    • 2020
  • 4차 산업혁명은 빅데이터, 인공지능 등의 기술을 통해 사물들이 지능화 사회로 진입하는데 크게 기여한다. 혁명을 통해 인간의 행태와 인지를 파악할 수 있게 되었고, 인공지능의 활용을 통해 의료, 과학 등 다양한 분야에서 핵심 도구로서 자리매김하였다. 그러나 4차 산업혁명에는 긍정적인 미래와 함께 부정적인 이면이 자리 잡고 있다는 점에 주목하여, 본 연구에서는 소셜 미디어를 통해 수집된 비정형적인 빅데이터를 기반으로 텍스트 마이닝 기법을 활용한 분석을 실시하였다. 연도별(2016년, 2017년, 2018년) 4차 산업혁명과 관련된 키워드를 살펴보고, 각 키워드가 가지고 있는 의미에 대해 파악하고자 하였다. 또한, 연도의 변화에 따라 4차 산업혁명과 관련된 키워드가 어떻게 변화하는지 파악하였으며, R을 활용하여 키워드 연관 분석(Association Analysis)을 실시함으로써 4차 산업혁명과 연관된 키워드 흐름을 통해 4차 산업혁명과 밀접하게 연관된 인식 흐름을 알아보고자 하였다. 마지막으로 연도별 4차 산업혁명과 관련한 긍정적, 부정적인 감정을 살펴봄으로써 4차 산업혁명에 대한 사람들의 인식을 파악하였다. 분석결과, 부정적인 의견은 연마다 감소하고 있었으며 긍정적인 전망과 미래가 더 많아지는 것으로 나타났다.