• 제목/요약/키워드: speaker attention

검색결과 29건 처리시간 0.024초

SNA를 이용한 AI 스피커 지속적 사용에 영향을 미치는 요인 분석 연구: 아마존 에코 리뷰 중심으로 (A Study on the Factors Affecting Continuous Use of AI Speaker Using SNA)

  • 김영범;차경진
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.95-118
    • /
    • 2021
  • 최근 AI 스피커 시장의 규모가 급속도 커지면서 AI 스피커의 다양한 활용 가능성이 크게 주목받고 있다. 소비자들이 다양한 채널을 통해 제품을 사용한 경험을 표현하고 공유하는 환경을 만들어 졌고, 그로 인하여 소비자가 제품을 이용한 경험에 대한 다양하고 솔직한 생각을 남긴 리뷰들의 양이 방대해졌는데, 이러한 리뷰데이터는 소비자의 생각을 분석하는 데에 매우 유용하다고 할 수 있다. 본 연구에서는 이 리뷰데이터를 활용하여 AI 스피커 지속적인 사용에 영향을 미치는 요인에 대하여 분석하고자 하였다. 무엇보다 선행연구를 통하여 도출된 AI 사용의도에 영향을 미치는 7가지 요인들이 실제로 소비자들이 남기는 리뷰에서도 나타나는 요인인지를 확인하고자 하였다. 이를 위해, Amazon.com의 아마존 에코 제품에 대한 고객 리뷰데이터를 기반으로 하여 텍스트마이닝과 사회관계망 분석을 활용하여 분석하였다. 리뷰데이터를 긍정리뷰와 부정리뷰로 분류하고 전처리하여 도출된 단어들 간 연결성을 중심으로 AI 스피커의 지속적인 사용에 영향을 미치는 요인을 분류하고자 연결 중심성 분석을 하였으며, 이를 통해 연결성의 위치가 비슷한 단어들 간 분류를 하기 위하여 CONCOR 분석을 하였다. 긍정 리뷰 연구 결과, 소비자들은 AI 스피커 지속적 사용에 영향을 미치는 요인으로 의인화와 친밀성을 가장 중요하게 보았다. 이 두 요인들은 다른 요인들과도 강한 연결 관계를 보여주었고, 선행연구에서 도출된 요인 외에 연결성도 중요한 요인임을 도출하였다. 또한 추가적으로 부정적인 리뷰 분석 결과, 인식오류와 호환성이 AI 스피커 사용에 있어서 소비자들에게 부정적인 영향을 주는 주요 요인들로 도출되었다. 이러한 연구 결과를 토대로 본 연구에서는 소비자들이 아마존 에코 제품을 지속적으로 사용하게 하는 구체적인 방법에 대하여 제시하고자 한다.

미니멀 라이프를 위한 다기능 스마트 스탠드 설계 및 개발 (Design and Developed a Mifunction Smart Stand for Minimal Life)

  • 맹원우;손태석;안성민;권서진;최하민;이혁의;정호준;강한빛;문성호;김형진
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.377-379
    • /
    • 2018
  • 최근 젊은 세대를 중심으로 간단하고 가벼운 삶을 추구하는 미니멀 라이프가 주목을 받으면서 적은 공간을 차지하고 실용도가 높은 제품들이 주목받고 있다. 따라서 복수의 제품을 하나로 합치면서 작지만 실속 있는 제품에 대한 연구가 많이 진행되고 있다. 본 연구에서는 책상 위의 공간을 절약할 수 있는 스마트 스탠드를 개발하였다. 이 스탠드에는 스마트폰 거치대, 가습기, 음이온 발생기, 스피커의 기능을 스탠드에 결합시키도록 하였다. 이 연구로 인하여 1인 가구의 좁은 집에서 공간적, 경제적으로 효율이 높아질 것으로 기대된다.

  • PDF

유비쿼터스 환경을 위한 하프미러형 인터페이스 시스템 개발과 응용 (Development of Half-Mirror Interface System and Its Application for Ubiquitous Environment)

  • 권영준;김대진;이상완;변증남
    • 제어로봇시스템학회논문지
    • /
    • 제11권12호
    • /
    • pp.1020-1026
    • /
    • 2005
  • In the era of ubiquitous computing, human-friendly man-machine interface is getting more attention due to its possibility to offer convenient services. For this, in this paper, we introduce a 'Half-Mirror Interface System (HMIS)' as a novel type of human-friendly man-machine interfaces. Basically, HMIS consists of half-mirror, USB-Webcam, microphone, 2ch-speaker, and high-speed processing unit. In our HMIS, two principal operation modes are selected by the existence of the user in front of it. The first one, 'mirror-mode', is activated when the user's face is detected via USB-Webcam. In this mode, HMIS provides three basic functions such as 1) make-up assistance by magnifying an interested facial component and TTS (Text-To-Speech) guide for appropriate make-up, 2) Daily weather information provider via WWW service, 3) Health monitoring/diagnosis service using Chinese medicine knowledge. The second one, 'display-mode' is designed to show decorative pictures, family photos, art paintings and so on. This mode is activated when the user's face is not detected for a time being. In display-mode, we also added a 'healing-window' function and 'healing-music player' function for user's psychological comfort and/or relaxation. All these functions are accessible by commercially available voice synthesis/recognition package.

주관적 측정을 이용한 청취 노력의 문헌 고찰 (Literature Review of Listening Effort Using Subjective Scaling)

  • 이지현;이승완;한우재;김진숙
    • Korean Journal of Otorhinolaryngology-Head and Neck Surgery
    • /
    • 제60권3호
    • /
    • pp.99-106
    • /
    • 2017
  • Listening effort is defined as a listener's mental exertion required to understand a speaker's auditory message, especially when distracting conditions are present. This review paper analyzed several subjective scaling tools used to measure the listening effort in order to suggest the best tool for use with hearing-impaired listeners who have to expend much effort even in everyday life. We first explained the importance of measuring listening effort and discussed various kinds of measurements. We then analyzed and categorized 15 recently published articles (i.e., from 2014 to 2016) into three topics: performance and listening effort, listening effort and fatigue, and clinical implication of listening effort. We compared the articles in terms of pros and cons and also identified 10 tools for use in the subjective scaling. Although none of these tools were unified or standardized easily, we concluded that 7-point scale would be the most reasonable as a less time-consuming measurement for compartmentalizing the degree of listening effort. If used with objective tools for measuring the listening effort, the subjective scaling could be a powerful tool for clinical use.

English vowel production conditioned by probabilistic accessibility of words: A comparison between L1 and L2 speakers

  • Jonny Jungyun Kim;Mijung Lee
    • 말소리와 음성과학
    • /
    • 제15권1호
    • /
    • pp.1-7
    • /
    • 2023
  • This study investigated the influences of probabilistic accessibility of the word being produced - as determined by its usage frequency and neighborhood density - on native and high-proficiency L2 speakers' realization of six English monophthong vowels. The native group hyperarticulated the vowels over an expanded acoustic space when the vowel occurred in words with low frequency and high density, supporting the claim that vowel forms are modified in accordance with the probabilistic accessibility of words. However, temporal expansion occurred in words with greater accessibility (i.e., with high frequency and low density) as an effect of low phonotactic probability in low-density words, particularly in attended speech. This suggests that temporal modification in the opposite direction may be part of the phonetic characteristics that are enhanced in communicatively driven focus realization. Conversely, none of these spectral and temporal patterns were found in the L2 group, thereby indicating that even the high-proficiency L2 speakers may not have developed experience-based sensitivity to the modulation of sub-categorical phonetic details indexed with word-level probabilistic information. The results are discussed with respect to how phonological representations are shaped in a word-specific manner for the sake of communicatively driven lexical intelligibility, and what factors may contribute to the lack of native-like sensitivity in L2 speech.

Transformer 네트워크를 이용한 음성신호 변환 (Voice-to-voice conversion using transformer network)

  • 김준우;정호영
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.55-63
    • /
    • 2020
  • 음성 변환은 다양한 음성 처리 응용에 적용될 수 있으며, 음성 인식을 위한 학습 데이터 증강에도 중요한 역할을 할 수 있다. 기존의 방법은 음성 합성을 이용하여 음성 변환을 수행하는 구조를 사용하여 멜 필터뱅크가 중요한 파라미터로 활용된다. 멜 필터뱅크는 뉴럴 네트워크 학습의 편리성 및 빠른 연산 속도를 제공하지만, 자연스러운 음성파형을 생성하기 위해서는 보코더를 필요로 한다. 또한, 이 방법은 음성 인식을 위한 다양한 데이터를 얻는데 효과적이지 않다. 이 문제를 해결하기 위해 본 논문은 원형 스펙트럼을 사용하여 음성 신호 자체의 변환을 시도하였고, 어텐션 메커니즘으로 스펙트럼 성분 사이의 관계를 효율적으로 찾아내어 변환을 위한 자질을 학습할 수 있는 transformer 네트워크 기반 딥러닝 구조를 제안하였다. 영어 숫자로 구성된 TIDIGITS 데이터를 사용하여 개별 숫자 변환 모델을 학습하였고, 연속 숫자 음성 변환 디코더를 통한 결과를 평가하였다. 30명의 청취 평가자를 모집하여 변환된 음성의 자연성과 유사성에 대해 평가를 진행하였고, 자연성 3.52±0.22 및 유사성 3.89±0.19 품질의 성능을 얻었다.

적응적 임계치를 적용한 멀티 채널 소리 기반의 데이터 전송 시스템 (Data Transmission System Applying An Adaptive Threshold Based Multi-channel Sound)

  • 강현모;정진우;최천용;권영훈;이성구
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권1호
    • /
    • pp.93-99
    • /
    • 2014
  • 최근 스마트폰의 보급화로 기기 간 근거리 무선통신에 관련된 기술이 주목받고 있다. 하지만 NFC의 저 보급화로 근거리 무선통신에 별도 추가의 H/W 설치 없이, S/W기반으로 무선통신을 이루어 내는 통신 기술이 필요한 실정이다. 이에 모든 기기에 탑재되어있는 마이크와 스피커를 활용하여 소리를 활용한 근거리 무선통신 기술이 주목받고 있다. 본 논문에서는 소리의 다중채널 병렬식 전송으로 전송속도를 개선함과, 적응적 임계치를 활용하여 잡음 및 기기 마이크별 특성에 따른 상이한 전송률을 개선하는 방법을 제안한다. 이러한 연구는 기업홍보 목적이나 결제시스템과 같은 특정 제한된 조건이 아닌, 일반 사용자를 대상으로 빠르고 편리한 데이터 전송 시스템을 제공하는데 이용될 수 있다.

모바일 기반 증강현실 기술을 활용한 3D전래동화 콘텐츠 연구 (3D Graphic Nursery Contents Developed by Mobile AR Technology)

  • 박영숙;박대우
    • 한국정보통신학회논문지
    • /
    • 제20권11호
    • /
    • pp.2125-2130
    • /
    • 2016
  • 본 논문에서는 모바일 증강현실기술 기반을 활용한 3D전래동화 콘텐츠에 관한 연구이다. 지식기반사회의 핵심콘텐츠 산업으로 주목받고 있는 시공간을 연결하는 SW기술 증강현실(Augmented Reality) 기술을 활용하여 흥미로운 전래동화를 한국어, 중국어, 영어로 자막언어선택으로 외국어학습에 적용한다. 이를 위해 상호작용 AR게임(놀이)으로 재구성하였다. 전래동화는 3D 콘텐츠 제작을 위해 6~8개의 scene으로 분량을 구성하고, 각색하여 번역하였다. 더빙은 모국어로 사용하는 원어민 성우를 통해 표준발음을 사용하여 더빙하였고, 효과음은 장면에 어울리도록 별도 제작하여 편집하였다. 시나리오를 구성하고, 3D 모델구성, 인터렉션 구성, 사운드 이펙트를 구성하고 콘텐츠 메타데이터를 작성한 후, Unity 3D 게임엔진을 실행하여 프로젝트를 생성하고, 스크립터로 기술한다. 재미있고 유익한 전래동화를 ICT기술을 접목한 융복한 콘텐츠로 경험하면서, 첨단기술기반 교육을 수용하며, 생활주변에서 소프트웨어를 인식할 수 있는 기회를 가지게 한다.

한국 설화문에서의 화제표현의 연속성 (Topic Continuity in Korea Narrative)

  • 정희자
    • 인지과학
    • /
    • 제2권2호
    • /
    • pp.405-428
    • /
    • 1990
  • 언어는 정보교환이라는 사회적 기능을 가지고 있다. 60년대 이래로 언어학자들의 관심이 언어의 정보전달 기능, 즉 어떠한 의미가 어떤 형식을 통하여 어떻게 전달되는가 하는, 의미, 형식, 기능의 관계에 점차 집중되게 되었다. 이러한 관계는 문장분석보다는 담화분석을 통하여 더욱 명백하게 파악된다. 본 연구는 한국 설화문에서 사용되는 화제표현의 방법과 표현된 화제의 연속성을 측정함으로 효율적인 정보교환의 방법을 살펴보았다. 분석된 문법구조들은 영대용, 인칭대명사, 지시대명사, 고유대명사, 지시사 뒤에 오는 명사, 소유격을 따르는 명사, 한정적 명사 그리고 비한정적 명사, 모두 8가지이다. 본 연구의 결과를 다음과 같이 요약할수 있다. 첫째, 한국 설화문에서 '인간임'(humanness)이 가장 강한 화제의 연속성을 나타낸다. 인간지시 논항들은 주로 행위자 또는 경엄자를 나타내기 때문에 절이난 담화의 화제역학을 한다. 둘째, 이들 문법구조들은 각기 다른 화제표현의 연속성 정도를 나타낸다. 연속성 정도가 높은 구조일수록 표현이 간단하며, 연속성의 정도가 낮을수록 표현이 복잡하다. 셋째, 화제표현의 연속성은 구조들의 통사적 특성 이외에 사회적문화적 요인들과 작가의 화용상의 목적 등에 좌우되기도 한다. 마지막으로, 실질적인 정보교환의 방법을 파악하기 위하여, 구어체와 문어체 담화문을 비교분석하여 화제표현의 효율적 방법을 고찰할 것을 제의한다.