• 제목/요약/키워드: reference speaker

검색결과 87건 처리시간 0.02초

얼굴형 인공지능 스피커에 대한 선호의 나이 효과 (Age differences of preference for humanoid AI speakers)

  • 오성주;황지현;유지호;한소원
    • 인지과학
    • /
    • 제29권1호
    • /
    • pp.1-16
    • /
    • 2018
  • 본 연구에서 얼굴형 인공지능 스피커에 대한 선호도와 신뢰도가 나이에 따라 어떻게 달라지는지 살펴보았다. 인공지능 스피커의 외형은 성별(남녀)과 나이(20/60대) 네 가지 범주에서 로봇 얼굴과 사람 얼굴이 7단계로 혼합되어 제시되었다. 참여자들 역시 이 네 가지 범주에 맞춰 모집되었고, 각 범주의 얼굴 자극에 대한 호감도와 신뢰도를 7점 척도로 평가하였다. 연구 결과, 인공지능 스피커의 외형이 사람 얼굴을 닮을수록 노인들은 호감도와 신뢰도를 높게 평가했지만, 청년들은 로봇 얼굴과 사람 얼굴이 중간 정도 섞인 형태를 가장 선호하고 신뢰하여 전체적으로 뒤집힌 U자 형태의 평가를 보였다. 네 가지 얼굴 범주에서 선호도를 평가했을 때, 참여자들은 나이와 성별과 관계없이 젊은 얼굴이 가장 높은 점수를 받았다. 그런데, 이모티콘 얼굴과 얼굴이 없이 비어있는 조건을 추가하여 물었을 때, 여전히 노인들은 사람 얼굴을 가장 선호했지만, 청년들은 상대적으로 이모티콘 얼굴과 비어있는 조건을 더 선호하였다. 종합하면, 인공지능 스피커 맥락에서, 노인들은 청년들보다 로봇 얼굴이 아닌 사람 얼굴에 높은 수용적 태도를 보였다. 홀로 사는 노인 인구가 증가하는 미래에 인공지능 스피커의 역할이 중요해짐에 따라, 노인들을 위한 인공지능 스피커의 디자인과 개발에서 본 연구 결과가 좋은 참고가 될 것으로 기대된다.

주행중인 자동차 환경에서의 음성인식 연구 (A Study on Speech Recognition in a Running Automobile)

  • 양진우;김순협
    • 한국음향학회지
    • /
    • 제19권5호
    • /
    • pp.3-8
    • /
    • 2000
  • 본 논문은 주행중인 자동차 환경에서의 음성인식에 대하여 연구하였다. 여기에서 사용한 기준패턴(reference pattern)은 DMS(Dynamic Multi-Section)이며, 인식율을 높이기 위하여 2모델을 제안하였다. 또한 가변적인 차량의 잡음환경에 강인하기 위하여 일반주행(80km/h 이내), 고속주행(80km/h 이상)등으로 나누었으며 차량의 잡음에 따라 자동으로 선택하도록 하였다. 음성의 특징 벡터와 인식 알고리즘은 PLP(Perceptual Linear Predictive) 13차와 OSDP(One-Stage Dynamic Programming)를 사용하였다. 그리고 핸드폰을 사용하는 운전자의 안전을 위하여 음성으로 전화를 걸 수 있도록 하는 전화번호 등록 및 제어기능의 Voice Dialing 기능을 추가하였다. 실험결과 주행중인 자동차 환경에서 자주 사용되는 차량 편의장치 제어명령 33개에 대하여 중부, 영동 고속도로(시멘트 도로 80km/h이상)에서 남성 화자독립 89.75%의 인식율을 구하였으며, 경부고속도로(아스팔트 도로 80km/h이상)에서는 남성화자독립 92.29%의 인식율을 구하였다.

  • PDF

Pitch Accent Realization in North Kyungsang Korean: Tonal Alignment as a Function of Nasal Position in Syllables

  • Sohn, Hyang-Sook
    • 말소리와 음성과학
    • /
    • 제3권2호
    • /
    • pp.37-52
    • /
    • 2011
  • This study investigates patterns of the alignment of the accentual peaks in bisyllabic words of the CVNCV, CVNV, and CVNNV structures in North Kyungsang Korean. Based on the tonal alignment, patterns of the F0 pitch excursion are discussed relative to one another. Issues are addressed concerning how the tonal targets are aligned, and how the tonal specifications of nasals in postvocalic, intervocalic, and prevocalic environments are supplied in the LH, HL, and HH classes. Tonal specification of nasals in various environments is accounted for by extension of the L target, displacement of the pitch peak, and interpolation between two tonal targets, depending on the tonal class. The results in this study provide preliminary evidence that the categorical alignment of the tonal targets is implemented by simply checking the presence or absence of a nasal before or after the nucleus vowel on the segmental string, without reference to the constituency of the nasal in the syllable structure. However, the prosodic structure has a key role to play in explaining speaker-dependent variations in the tonal alignment. Sensitivity to tautosyllabicity has an effect on the shape of the F0 contour, and disparity in the patterns of the pitch excursion is represented as a function of syllable structure correlated with segmental composition of the nasal.

  • PDF

외부소음에 대한 공동주택 실내 소음레벨분포에 관한 실험적 연구 (An Experimental Study on the Prediction of Indoor Sound Level Distribution in Apartment for Exterior Noise)

  • 박현구;김종빈;강동영;장현충;송혁;김선우
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2001년도 춘계학술대회논문집
    • /
    • pp.259-264
    • /
    • 2001
  • It is necessary to predict the sound pressure level(SPL) in rooms before designing an apartment when exterior noises are produced. In order to predict SPL for an apartment that has some specific exterior noises, the following should be known: the characteristics of outdoor noise, sound insulation performance and sound level differences of each room. The purpose of this study is to find out the possibility of predicting sound pressure level of rooms in an apartment by analysing sound level differences among rooms. Sound sources used in this experiment are construction noise, aircraft noise, railroad noise, road traffic noise and white noise as a reference to compare with the previous four. These noises were recorded and reproduced by speaker. As a result, we found that within the sound reduction pattern, the sound difference level appeared uniform depending on the sound insulation characteristics of the windows installed when facing the noise source. When the windows having the same acoustic performance were installed, the SPL in each room resulted in nearly the same values.

  • PDF

A Study on Will as Modal or Non-modal

  • Lee, Young Mi;Kang, Mun Koo
    • 영어어문교육
    • /
    • 제18권3호
    • /
    • pp.175-190
    • /
    • 2012
  • The purpose of this article is to explain the meanings and uses of the English auxiliaries will morpho-syntactically, and answer the question of whether will is a tense auxiliary or a modal one. Some writers even exclude will completely from the semantics of the modal auxiliaries. They argue that the semantics of will is fundamentally non-modal and has only a few modal-like uses. There are some people who treat will to be semantically separate from the other modal auxiliaries. In the light of modal will, the semantics of will basically remains anchored in volition because the lack of required speaker subjectivity, but has undergone so much semantic bleaching that it may also express future time without volition. On the other hand, the semantics of will in the exclusionist view is erroneous and that its semantics is in fact closely related to the semantics of the other modals. This view reinforces the argument that the morpho-syntactic kinship of will, can, may and must also reflects semantic kinship. It is suggested that all the modal auxiliaries show that the correspondence relation is non-verified but potential. And the specific place that will holds is that the correspondence is unverified at the time of utterance but will turn out to become verified. The overall conclusion is that idiosyncratic morpho-syntax shared by the modals reflects the semantics and pragmatics of the English modal auxiliaries and is forced also to include will.

  • PDF

Audio-signal Transfer System Design and Evaluation based on Power Line Communication

  • Kim, Kwan-Kyu;Yeom, Keong-Tae;Kim, Yong-Kab
    • Transactions on Electrical and Electronic Materials
    • /
    • 제9권3호
    • /
    • pp.123-127
    • /
    • 2008
  • The paper is to solve the problem of existing audio signal transfer system which has a difficulties of system organization and the increase of additional install cost and unfriendly interior. To solve the existing system, we drew the new audio signal transfer system based on PLC and evaluated it. A transmitter and a receiver were designed using the PLC chip INT5500CS. An audio signal transfer system was configured with a CD player to which audio signals are sent from the transmitter and a speaker connected to the receiver. For performance evaluation of this system, a USBPre external sound card and Smaart Live 5 which is a PC-based sound measuring program were added. As a result of our experiment, the measured signal level is $2{\sim}3$ dB lower than reference signal, latency is 16.69 ms, and the specific character of coherency is bad in high frequency band. Otherwise, this system transmits and receives signals over 90 % in good condition as a result of measuring pink noise, frequency (1 kHz), and phase, magnitude. In view of the result so far achieved, the system designed this study has excellent performance, it resolves defect of existing audio signal transfer system.

실시간 윈도우 환경에서 DMS모델을 이용한 자동 음성 제어 시스템에 관한 연구 (A Study on the Automatic Speech Control System Using DMS model on Real-Time Windows Environment)

  • 이정기;남동선;양진우;김순협
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.51-56
    • /
    • 2000
  • 본 논문은 음성인식을 이용한 실시간 윈도우 자동 제어 시스템에 관한 연구이다. 사용된 음성 모델은 수행 속도를 높이기 위해 제안된 가변 DMS 모델을 이용하였으며, 인식 알고리즘으로 이를 이용한 One-Stage DP 알고리즘을 사용한다. 인식 대상단어는 윈도우에서 자주 사용되는 66개의 윈도우 제어 명령어들로 구성한다. 본 연구에서 온라인으로 음성을 처리하기 위해 음성 검출 알고리즘을 구현하였으며, 기존 DMS(Dynamic Multi Section)모델 생성시 고정적으로 적용하던 섹션의 수를 입력 신호의 지속 시간을 고려하여 가변적으로 적용한 가변 DMS 모델을 제안하였다. 또한 윈도우에서 사용자 작업에 의해 현재 상태에 인식 대상으로 불필요한 인식 대상단어가 발생하게 되는데 이를 효율적으로 처리하기 위해 사용 모델을 재구성하여 사용하도록 제안하였으며, 인간의 청각적 특성을 고려하여 음성신호에서 개인의 특성은 제외하고 음성 자체의 특징만을 추출하여 특징 벡터를 생성하는 인지 선형 예측(Perceptual Linear Predictive)분석 방법을 이용하였다. 시스템 성능 평가 결과 가변 동적 다중 섹션 모델(Variable DMS model)과 기존의 DMS 모델은 인식률 면에서는 거의 동일하지만 인식 수행 속도는 제안된 모델의 계산량이 기존 모델보다 작기 때문에 향상되었고, 다중 화자 독립 인식률은 99.08%, 다중 화자 종속 인식률은 99.39%의 인식률을 나타내었으며, 실제 노이즈가 있는 환경에서 화자독립실험의 경우 96.25%의 인식률을 보여 주었다.

  • PDF

HMM기반 자동음소분할기의 음소분할 오류 유형 분석 (The Error Pattern Analysis of the HMM-Based Automatic Phoneme Segmentation)

  • 김민제;이정철;김종진
    • 한국음향학회지
    • /
    • 제25권5호
    • /
    • pp.213-221
    • /
    • 2006
  • 합성음의 음질을 향상시키기 위하여 분할된 corpora로부터 합성유닛을 선택하여 사용하는 연속음성합성에서 정확한 음소분할은 매우 중요하다. 일반적으로 음소분할은 사람에 의해 수행되지만 많은 작업량으로 인한 시간적 지연, 일관 성 유지 어려움 등 많은 문제가 발생한다. 이에 따라 음성인식에서 도입된 HMM 기반의 자동음소분할이 음성인식, 음성 합성에서 널리 사용되어지고 있지만 음성전문가의 수작업 결과와 비교할 때 HMM 기반 자동음소분할은 오류가 있고, 이는 합성음 품질의 열화의 주요 원인이 되고 있다. 본 논문에서는 HMM 기반의 자동음소분할기를 사용하여 나타난 자동음소분할 결과와 수작업에 의한 음소분할 결과를 비교하고 유형별로 분석함으로써 음성합성의 성능향상을 위해 개선해야 할 문제점들을 제시한다. 실험에서는 ETRI의 표준형 한국어 공통 음성 DB을 사용하였고, 오차의 범위가 20ms를 벗어난 경우를 분절 오류로 간주하였다. 실험 결과 여성화자의 경우 파열음 + 모음, 파찰음 + 모음, 모음 + 유음 음소쌍에서는 각각 약 99%, 99.5%, 99%의 높은 정확률을 보인 반면, 폐쇄음 + 비음, 폐쇄음 + 유음, 비음 + 유음 음소쌍에서는 44.89%, 50%, 55% 의 낮은 정확률을 보였으며, 남성화자에 대한 실험결과에서도 유사한 경향을 보였다.

개선된 MSVQ 인식 시스템을 이용한 단독어 인식에 관한 연구 (A Study on Isolated Word Recognition using Improved Multisection Vector Quantization Recognition System)

  • 안태옥;김남중;송철;김순협
    • 한국통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.196-205
    • /
    • 1991
  • 본 논문은 화자 독립의 단독이 언직에 관한 연구로 기존의 MSVQ(multisection vector quantization) 일질시스템을 개선한 새로운 MSVQ 시스템을 제안한다. 제안된 내용은 기존의 시스템과는 달리 인식시 시험패턴의 구간 수를 표준패턴의 구간 수보다 한 구간 더 늘리는 것이다. 이 방법에 의한 실험시 인식 대상으로는 146개의 DDD 지역망을 선택했으며, 특징 파라베타로는 12사 LPC 스트럼(cepstrum) 계수를 사용했고 코드북 지정석 중심점 구하는 방법으로 MINSUM과 MINIMAX기법을 사용하였다. 실험 결과에 의하면 DTW(dynamic time warping) 패턴 매칭 방법, VQ(vector quantization)에 의한 방법은 물론 기존의 MSVQ 방법보다 계산량이 감소함과 동시에 더 높은 인식율을 얻을 수 있었다. 수 있었다.

  • PDF

전화음성의 격리단어인식 개선에 관한 연구 (A Study on the Improvement of Isolated Word Recognition for Telephone Speech)

  • 도삼주;은종관
    • 한국음향학회지
    • /
    • 제9권4호
    • /
    • pp.66-76
    • /
    • 1990
  • 본 논문에서는 잡음과 전화선로의 왜곡이 음성인식에 미치는 영향을 알아보고, 전처리 과정을 추가하여 이를 개선하는 방법을 제안하였다. 컴퓨터 모의실험은 음소적으로 고르게 분포되어있는 한국어 격리단어 100단어를 각각 10회 발음한 1000개 데이타를 대상으로하고, 화자종속으로 수행하였다. 먼저 잡음에 대한 개선방법으로 spectral subtraction을 제안하였는데, 이것은 매우 간단하면서도 좋은 성능을 보였다. 다음으로 대역폭제한과 전송로왜곡의 영향을 실험하였는데, 대역폭의 제한과 진폭왜곡은 인식율을 크게 떨어뜨렸으나 위상왜곡은 별로 영향이 없었다. 또, 전송로의 영향을 개선하기 위하여 training data를 사용하여 기준패턴을 변화시키는 방법을 제안하였다. 잡음과 전송로의 왜곡이 동시에 있는 경우에 인식율이 7.7~26.4% 밖에 되지 않았는데, 위에서 제안한 방법을 이용하여 76.2~92.3%로 개선되었다.

  • PDF