• 제목/요약/키워드: Virtual speaker

검색결과 29건 처리시간 0.032초

화자인증 시스템에서 선정 방법에 관한 연구 (A Study on Background Speaker Selection Method in Speaker Verification System)

  • 최홍섭
    • 음성과학
    • /
    • 제9권2호
    • /
    • pp.135-146
    • /
    • 2002
  • Generally a speaker verification system improves its system recognition ratio by regularizing log likelihood ratio, using a speaker model and its background speaker model that are required to be verified. The speaker-based cohort method is one of the methods that are widely used for selecting background speaker model. Recently, Gaussian-based cohort model has been suggested as a virtually synthesized cohort model, and unlike a speaker-based model, this is the method that chooses only the probability distributions close to basic speaker's probability distribution among the several neighboring speakers' probability distributions and thereby synthesizes a new virtual speaker model. It shows more excellent results than the existing speaker-based method. This study compared the existing speaker-based background speaker models and virtual speaker models and then constructed new virtual background speaker model groups which combined them in a certain ratio. For this, this study constructed a speaker verification system that uses GMM (Gaussin Mixture Model), and found that the suggested method of selecting virtual background speaker model shows more improved performance.

  • PDF

머리전달함수의 그룹화를 이용한 가상 스피커의 정위감 개선 (Improvement of virtual speaker localization characteristics using grouped HRTF)

  • 서보국;차형태
    • 한국지능시스템학회논문지
    • /
    • 제16권6호
    • /
    • pp.671-676
    • /
    • 2006
  • 일반적으로 가상 스피커 구현을 위한 음상정위 방법으로 HRTF(Head Related Transfer Function) DB를 원음에 convolution하는 기법을 사용하게 된다. 그러나 비개인화된 HRTF는 가상 스피커 구현에 있어 사용자에 따라 상/하 또는 앞/뒤 방향에 대해서 혼돈을 가져올 수 있어 정위감을 저하시킬 수 있다. 본 논문에서는 상/하, 앞/뒤 정위감을 개선하기 위해 가상 스피커 주변의 HRTF를 그룹화하여 만들어진 새로운 HRTF를 사용한 가상 스피커에 대하여 연구한다. 효과적인 HRTF 그룹화를 위해 필요한 HRTF 개수, 위치 등을 실험을 통해 결정하며, 청감 평가를 수행한다. 생성된 HRTF를 사용한 가상 스피커의 성능 평가 결과, 상/하, 앞/뒤 정위감이 개선됨을 실험을 통해 확인하였다.

Cross-speaker anaphora in dynamic semantics

  • Yeom, Jae-Il
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권2호
    • /
    • pp.103-129
    • /
    • 2010
  • In this paper, I show that anaphora across speakers shows both dynamic and static sides. To capture them all formally, I will adopt semantics based on the assumption that variables range over individual concepts that connect epistemic alternatives. As information increases, a variable can take a different range of possible individual concepts. This is captured by the notion of virtual individual (= vi), a set of individual concepts which are indistinguishable in an information state. The use of a pronoun involves two information states, one for the antecedent, which is always part of the common ground, and the other for the pronoun. Information increase changes vis for variables in the common ground. A pronoun can be used felicitously if there is a unique virtual individual in the information state for the antecedent which does not split in two or more distinctive virtual individuals in the information state for the pronoun. The felicity condition for cross-speaker anaphora can be satisfied in declaratives involving modality, interrogatives and imperatives in a rather less demanding way, because in these cases the utterance does not necessarily require non-trivial personal information for proper use of a pronoun.

  • PDF

가상세계 속에 보인 일본어의 가족 간의 문말 표현에 대해 - 교수매체로서의 문말의 정중체와 종조사 사용에 대해 (The Expression of Ending Sentence in Family Conversations in the Virtual Language - Focusing on Politeness and Sentence-final Particle with Instructional Media -)

  • 양정순
    • 비교문화연구
    • /
    • 제39권
    • /
    • pp.433-460
    • /
    • 2015
  • This paper was analyzed the politeness and the expression of ending sentence in family conversations in the virtual language of cartoon characters. Younger speakers have a tendency to unite sentence-final particle to the polite form, older speakers have a tendency to unite it to the plain form in the historical genre. But younger speakers and older speakers unite sentence-final particle to the plain form in other fiction genres. Using terms of respect is determined by circumstances and charactonym. Comparing the translation of conversations with the original, there were the different aspects of translated works. When Japanese instructors are used to study Japanese as the instructional media, they give a supplementary explanation to students. 'WA' 'KASIRA' that a female speaker usually uses are used by a male speaker, 'ZO' 'ZE' that a male speaker usually uses are used by a female speaker in the virtual language of cartoons. In the field of the translation, it is translated 'KANA' 'KASIRA' into 'KA?', 'WA' 'ZO' 'ZE' into 'A(EO)?', 'WAYO' 'ZEYO' into AYO(EOYO)'. When we use sentence-final particle in the virtual language of cartoon, we need to supply supplementary explanations and further examinations.

문학 텍스트의 머신러닝 활용방안 연구 - 화자 지시어 분석을 위한 규칙 선별을 중심으로 - (A Study on the Application of Machine Learning in Literary Texts - Focusing on Rule Selection for Speaker Directive Analysis -)

  • 권경아;고일주;이인성
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.313-323
    • /
    • 2021
  • 본 연구는 문학 텍스트를 활용한 머신러닝 기반 가상 캐릭터(virtual character) 구현을 위해 텍스트 내의 화자 지시어가 지시하는 화자를 판별할 수 있는 규칙을 제안하는 것을 목적한다. 선행 연구에서, 본 연구자는 문학 텍스트를 기계 학습에 적용할 때, 별칭, 별명, 대명사와 같은 화자 지시어들이 특정한 분석 규칙 없이는 기계가 화자를 제대로 파악하지 못하여 학습을 제대로 수행할 수 없다는 점을 발견하였다. 본 연구는 이를 해결하는 방법으로 '화자 지시어(대명사 포함)가 지시하는 화자를 찾는 9가지 규칙'을 소개한다: 위치, 거리, 대명사, 가주어/진주어, 인용문, 화자수, 등장인물 외 지시, 복합 단어 지시, 화자명 분산이 그것이다. 문학 텍스트 내의 등장인물을 가상 캐릭터로 활용하기 위해서는 기계가 이해할 수 있는 방식으로 학습 텍스트를 제공해야 한다. 본 연구자는 본 논문을 통해 제안한 화자 찾기 규칙이 문학 텍스트를 머신러닝에 활용할 때 발생할 수 있는 시행착오를 줄이고, 원활한 학습을 수행하게 하여 질적으로 우수한 학습 결과를 산출할 수 있게 해 줄 것으로 기대한다.

가상현실 기반 상황몰입형 영어 대화 학습 시스템 (Virtual Reality based Situation Immersive English Dialogue Learning System)

  • 김진원;박승진;민가영;이건명
    • 융합정보논문지
    • /
    • 제7권6호
    • /
    • pp.245-251
    • /
    • 2017
  • 이 논문에서는 학습자가 가상현실 안에서 음성으로 원어민 캐릭터와 대화하는 영어 대화 학습 시스템을 제안한다. 제안 시스템에서 사용자는 다양한 시나리오의 가상현실 상황에서 대화를 한다. 시스템은 사용자의 음성을 인식하고, 음성 합성을 이용하여 캐릭터의 음성을 제공한다. 몰입감과 현실감 있는 환경을 제공하는 가상현실 환경을 통해 영어 대화하는 과정에서 학습의 발음을 평가한 정보를 학습자에게 피드백으로 제공한다.

가상 비서와 스마트 스피커에 대한 인식과 기대: 의미 연결망 분석과 감성분석을 중심으로 (Perception of Virtual Assistant and Smart Speaker: Semantic Network Analysis and Sentiment Analysis)

  • 박호현;김장현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.213-216
    • /
    • 2018
  • 인공지능과 음성인식을 기반으로 한 스마트 디바이스의 장점이 부각되면서, 가상 비서(Virtual Assistant)가 인기를 끌고 있다. 가상 비서는 스마트 스피커를 통해 사용자 경험을 제공하며, 일반 소비자들이 가장 사용하기 쉬운 IoT 디바이스로 평가받고 있다. 본 연구는 주요 가상 비서브랜드의 음성인식 플랫폼과 디바이스에 대한 사람들의 인식에 차이가 있는지 살펴보고자 한다. 이를 위해, 트위터에서 가상비서 서비스를 하는 세 기업의 총 6가지 키워드를 포함한 트윗을 수집했다. 수집한 데이터는 의미 연결망 분석 기법(Semantic network analysis)을 적용해 키워드에 대한 사람들의 인식을 분석했다. 추가로 LIWC 감성분석을 통해 사람들의 긍정/부정적 반응을 분석했다. 분석 결과 사람들은 각 키워드에 대한 반응이 다른 것으로 나타났다. 주로 Virtual Assistant가 제공하는 기능과 서비스에 대한 기대와 사용성에 대한 내용이었다. 또한 대부분의 키워드에 긍정적 반응을 보였다.

  • PDF

입체음향 제작기법을 통한 능동소음제어 방법의 효율성 (Effectiveness of Active Noise Control through Three-Dimensional Sound)

  • 박준홍;김준종;민동기
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2014년도 추계학술대회 논문집
    • /
    • pp.955-956
    • /
    • 2014
  • Active noise control is noise reduction method by generate anti-phase control signal for destructive interference of through control speaker. purpose of this paper is create a virtual control source at a using the DBAP(Distance Based Amplitude Panning) algorithm which is one of the three-dimensional sound reproduction method, and verified through the experimentally for noise control method through the virtual control source. We compared active noise method by using one control speaker with active noise control method by using DBAP algorithm.

  • PDF

관광동굴의 대중홍보용 가상 프로젝터디스플레이 (Virtual Projection Display for Public Information of Tourist Cave)

  • 임대규;김종성;박상준;고영탁;송정훈;소대화
    • 동굴
    • /
    • 제87호
    • /
    • pp.14-17
    • /
    • 2008
  • Nowadays, power-point slides are the common form of presentation at meetings or lectures. However, when it comes to explanation and demonstration, it is difficult to do so effectively on a screen that is projected from a projector. This drawback might lower the level of quality of communication between the speaker and his audience. On top of this, the speaker is constrained to a certain amount of space. Based on this fact, in this work the constructed device can be used as an extension for the existing functions and makes up for the disadvantages of projected presentations by means of a web camera which enjoys ease of use and is economically priced. It would be also used as a virtual projection display for information of tourist cave in the field.