• 제목/요약/키워드: Speaker Attribute

검색결과 4건 처리시간 0.021초

RawNet3 화자 표현을 활용한 임의의 화자 간 음성 변환을 위한 StarGAN의 확장 (Extending StarGAN-VC to Unseen Speakers Using RawNet3 Speaker Representation)

  • 박보경;박소민;홍현기
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권7호
    • /
    • pp.303-314
    • /
    • 2023
  • 음성 변환(Voice Conversion)은 개인의 음성 데이터를 다른 사람의 음향적 특성(음조, 리듬, 성별 등)으로 재생성할 수 있는 기술로, 교육, 의사소통, 엔터테인먼트 등 다양한 분야에서 활용되고 있다. 본 논문은 StarGAN-VC 모델을 기반으로 한 접근 방식을 제안하여, 병렬 발화(Utterance) 없이도 현실적인 음성을 생성할 수 있다. 고정된 원본(source) 및 목표(target)화자 정보의 원핫 벡터(One-hot vector)를 이용하는 기존 StarGAN-VC 모델의 제약을 극복하기 위해, 본 논문에서는 사전 훈련된 Rawnet3를 사용하여 목표화자의 특징 벡터를 추출한다. 이를 통해 음성 변환은 직접적인 화자 간 매핑 없이 잠재 공간(latent space)에서 이루어져 many-to-many를 넘어서 any-to-any 구조가 가능하다. 기존 StarGAN-VC 모델에서 사용된 손실함수 외에도, Wasserstein-1 거리를 사용하여 생성된 음성 세그먼트가 목표 음성의 음향적 특성과 일치하도록 보장했다. 또한, 안정적인 훈련을 위해 Two Time-Scale Update Rule (TTUR)을 사용한다. 본 논문에서 제시한 평가 지표들을 적용한 실험 결과에 따르면, 제한된 목소리 변환만이 가능한 기존 StarGAN-VC 기법 대비, 본 논문의 제안 방법을 통해 다양한 발화자에 대한 성능이 개선된 음성 변환을 제공할 수 있음을 정량적으로 확인하였다.

Effective Acoustic Model Clustering via Decision Tree with Supervised Decision Tree Learning

  • Park, Jun-Ho;Ko, Han-Seok
    • 음성과학
    • /
    • 제10권1호
    • /
    • pp.71-84
    • /
    • 2003
  • In the acoustic modeling for large vocabulary speech recognition, a sparse data problem caused by a huge number of context-dependent (CD) models usually leads the estimated models to being unreliable. In this paper, we develop a new clustering method based on the C45 decision-tree learning algorithm that effectively encapsulates the CD modeling. The proposed scheme essentially constructs a supervised decision rule and applies over the pre-clustered triphones using the C45 algorithm, which is known to effectively search through the attributes of the training instances and extract the attribute that best separates the given examples. In particular, the data driven method is used as a clustering algorithm while its result is used as the learning target of the C45 algorithm. This scheme has been shown to be effective particularly over the database of low unknown-context ratio in terms of recognition performance. For speaker-independent, task-independent continuous speech recognition task, the proposed method reduced the percent accuracy WER by 3.93% compared to the existing rule-based methods.

  • PDF

드 만 이후 낭만적 자의식 다시 보기와 워즈워스의 경우 -역사, 주체, (서정)시 (A Post-de Manian Look at Romantic Self-Consciousness and the Wordsworthian Case: History, the Subject, (Lyric) Poetry)

  • 손현
    • 영어영문학
    • /
    • 제60권2호
    • /
    • pp.339-363
    • /
    • 2014
  • This essay reconsiders the subject of Romantic self-consciousness in a post-de Manian perspective. Self-consciousness is an attribute of Romantic lyricism whereby the poetic speaker I remains conscious of how (s)he feels or lives here and now. This self-reflective feature of Romantic poetry has been controversially interpreted either as self-centered solipsism or as self-expressive objectivism. The question is stirring more disputes among Romantic critics after the advent of New Historicism and Feminism. These two historicistic approaches reprove Romantic poetry for a lack of the sense of history and ascribes it to Romantic self-consciousness. They argue that Romantic poets in general displace historical materiality into an object of internal consciousness, so negating absurd social realities "merely to gain their own immortal soul." This essay targets to overcome this negative stance on Romantic self-consciousness with a "subversive" return to Paul de Man's criticism of Romantic internality.

베이커리 크리스마스 마케팅 커뮤니케이션이 신뢰, 구매의도에 미치는 영향: 뚜레쥬르와 파리바게뜨 광고를 중심으로 (The Effect of Christmas Marketing Communication on Trust and Purchase Intention in the Bakery Industry)

  • 서경화;이수범
    • 한국조리학회지
    • /
    • 제19권3호
    • /
    • pp.57-72
    • /
    • 2013
  • 이 연구는 높은 비용이 지불에도 불구하고 크리스마스 케이크 판매촉진의 수단 (광고, 선물 무료)으로 활용하는 마케팅 커뮤니케이션 전략의 장기적 효과에 대해 실증적 분석 하였다. 이러한 검증 결과는 베이커리 업계의 성공적인 관리를 위한 중요한 핵심 요소를 제공할 것으로 판단하였다. SPSS, AMOS를 활용하여 평가 항목에 대한 신뢰성 분석, 타당성 분석을 하였고, 가설 검증을 위해 구조방정식(SEM)이 수행되었다. 본 연구의 결과는 다음과 같다. 첫째, 광고 태도(${\beta}$=0.269, t=4.512, p<0.001)와 사은품 태도(${\beta}$=0.293, t=5.043, p<0.001)는 신뢰에 긍정적인 영향을 미치는 것으로 나타났고, 둘째, 신뢰도는 구매의도에 긍정적인 영향을 미치는 것으로 나타났다(${\beta}$=0.513, t=8.677, p<0.001). 셋째, 광고 태도(${\beta}$=0.104, t=1.966, p<0.05)와 사은품 태도(${\beta}$=0.204, t=3.817, p<0.001)는 구매의도에 긍정적인 영향을 미치는 것으로 나타났다. 마지막으로 광고 태도는 광고타입(배우와 애니메이션)에 따라 다르게 나타났고, 배우 광고가 애니메이션 광고보다 더 높게 평가되었다. 또한 사은품 태도는 사은품 타입(목도리와 스피커 인형/캐릭터 모자)에 따라 다르게 나타났고, 목도리가 스피커 인형/캐릭터 모자보다 높게 평가 되었다.

  • PDF