• 제목/요약/키워드: Speaker Verification

검색결과 162건 처리시간 0.028초

가변학습율과 온라인모드를 이용한 개선된 EBP 알고리즘 (Improved Error Backpropagation by Elastic Learning Rate and Online Update)

  • Lee, Tae-Seung;Park, Ho-Jin
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.568-570
    • /
    • 2004
  • The error-backpropagation (EBP) algerithm for training multilayer perceptrons (MLPs) is known to have good features of robustness and economical efficiency. However, the algorithm has difficulty in selecting an optimal constant learning rate and thus results in non-optimal learning speed and inflexible operation for working data. This paper Introduces an elastic learning rate that guarantees convergence of learning and its local realization by online upoate of MLP parameters Into the original EBP algorithm in order to complement the non-optimality. The results of experiments on a speaker verification system with Korean speech database are presented and discussed to demonstrate the performance improvement of the proposed method in terms of learning speed and flexibility fer working data of the original EBP algorithm.

  • PDF

펫로스 증후군을 위한 VR 반려동물 교감 시스템 (VR Companion Animal Communion System for Pet Loss Syndrome)

  • 최형문;문미경;이군호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.563-564
    • /
    • 2021
  • 반려동물 보유 가구 수가 증가하면서 반려동물의 상실로 인한 펫로스 증후군을 호소하는 반려인 또한 증가하고 있다. 펫로스 증후군을 치유하기 위해 반려동물을 가상으로라도 만나서 평소에 하던 말과 행동을 할 수 있도록 하여 차츰 이별을 할 수 있도록 할 필요가 있다. 본 논문에서는 VR을 통하여 반려인이 3D로 모델링 된 반려동물과 직접 교감할 수 있는 시스템에 대한 연구 내용을 기술한다. 이 시스템을 통해 떠나보낸 반려동물과 평소와 같은 말과 행동을 할 수 있도록 도와주어 감정의 정화를 서서히 할 수 있도록 해준다.

  • PDF

패턴인식의 MLP 고속학습 알고리즘 (A Fast-Loaming Algorithm for MLP in Pattern Recognition)

  • 이태승;최호진
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권3호
    • /
    • pp.344-355
    • /
    • 2002
  • MLP(multilayer perceptron)는 다른 패턴인식 방법에 비해 여러 가지 훌륭한 특성을 가지고 있어 패턴인식에서 폭넓게 사용되고 있다. 그러나 MLP의 학습에 일반적으로 사용되는 EBP(error backpropagation) 알고리즘은 학습시간이 비교적 오래 걸린다는 단점이 있다. 패턴인식에 사용되는 학습 데이타는 풍부한 중복특성을 내포하고 있으므로 패턴마다 MLP의 내부변수를 갱신하는 온라인 계열의 학습방식이 속도의 향상에 상당한 효과가 있다. 일반적인 온라인 EBP 알고리즘에서는 내부변수 갱신시 고정된 학습률을 적용한다. 고정 학습률을 적절히 선택함으로써 패턴인식 웅용에서 상당한 속도개선을 얻을 수 있지만, 학습률이 고정되고 학습이 진행됨에 따라 학습패턴 영역이 달라지는 학습과정의 각 단계에 효과적으로 대웅하지 못하는 문제가 있다. 이 문제에 대해 본 논문에서는 학습과정을 세 단계로 정의하고, 각 단계별로 필요한 패턴만을 학습에 반영하는 패턴별 가변학습속도 및 학습생략(ILVRS) 방법을 제안한다. ILVRS의 기본개념은 다음과 같다. 학습단계마다 학습에 필요한 패턴의 부분이 달라지므로 이를 구별 하여 학습에 적용할 수 있도록 (1)패턴마다 발생하는 오류치를 적절한 범위 이내로 제한하여 가변 학습률로 사용하고, (2)학습이 진행됨에 따라 불필요한 부분의 패턴을 학습에서 생략한다. 제안한 ILVRS의 성능을 입증하기 위해 본 논문에서는 패턴인식 응용의 한 갈래인 화자증명을 실험하고 그 결과를 제시한다.

인간과 로봇 협력작업을 위한 로봇 지능제어알고리즘 개발에 관한 연구 (A Study on Intelligent Control Algorithm Development for Cooperation Working of Human and Robot)

  • 이우송;정양근;박인만;정종교;김희진;김민성;한성현
    • 한국산업융합학회 논문집
    • /
    • 제20권4호
    • /
    • pp.285-297
    • /
    • 2017
  • This study proposed a new approach to develop an Intelligent control algorithm for cooperative working of human and robot based on voice recognition. In general case of speaker verification, Gaussian Mixture Model is used to model the feature vectors of reference speech signals. On the other hand, Dynamic Time Warping based template matching techniques were presented for the voice recognition about several years ago. We converge these two different concepts in a single method and then implement in a real time voice recognition enough to make reference model to satisfy 95% of recognition performance. In this paper it was illustrated the reliability of voice recognition by simulation and experiments for humanoid robot with 18 joints.

GMM 기반의 문맥독립 화자 검증 시스템의 성능 향상 (Performance Improvement in GMM-based Text-Independent Speaker Verification System)

  • 함성준;신광호;김민정;김주곤;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.131-134
    • /
    • 2004
  • 본 논문에서는 GMM(Gaussian Mixture Model)을 이용한 문맥독립 화자 검증 시스템을 구현한 후, arctan 함수를 이용한 정규화 방법을 사용하여 화자검증실험을 수행하였다. 특징파라미터로서는 선형예측방법을 이용한 켑스트럼 계수와 회귀계수를 사용하고 화자의 발성 변이를 고려하여 CMN(Cepstral Mean Normalization)을 적용하였다. 화자모델 생성을 위한 학습단에서는 화자발성의 음향학적 특징을 잘 표현할 수 있는 GMM(Gaussian Mixture Model)을 이용하였고 화자 검증단에서는 ML(Maximum Likelihood)을 이용하여 유사도를 계산하고 기존의 정규화 방법과 arctan 함수를 이용한 방법에 의해 정규화된 점수(score)와 미리 정해진 문턱값과 비교하여 검증하였다. 화자 검증 실험결과, arctan 함수를 부가한 방법이 기존의 방법보다 항상 향상된 EER을 나타냄을 확인할 수 있었다.

  • PDF

A comparative study of filter methods based on information entropy

  • Kim, Jung-Tae;Kum, Ho-Yeun;Kim, Jae-Hwan
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제40권5호
    • /
    • pp.437-446
    • /
    • 2016
  • Feature selection has become an essential technique to reduce the dimensionality of data sets. Many features are frequently irrelevant or redundant for the classification tasks. The purpose of feature selection is to select relevant features and remove irrelevant and redundant features. Applications of the feature selection range from text processing, face recognition, bioinformatics, speaker verification, and medical diagnosis to financial domains. In this study, we focus on filter methods based on information entropy : IG (Information Gain), FCBF (Fast Correlation Based Filter), and mRMR (minimum Redundancy Maximum Relevance). FCBF has the advantage of reducing computational burden by eliminating the redundant features that satisfy the condition of approximate Markov blanket. However, FCBF considers only the relevance between the feature and the class in order to select the best features, thus failing to take into consideration the interaction between features. In this paper, we propose an improved FCBF to overcome this shortcoming. We also perform a comparative study to evaluate the performance of the proposed method.

양서류 번식음 맵핑을 위한 무인비행장치 시스템의 정확성 검증 (Accuracy verification for unmanned aerial vehicle system for mapping of amphibians mating call)

  • 박민규;배서현
    • 한국환경복원기술학회지
    • /
    • 제25권2호
    • /
    • pp.85-92
    • /
    • 2022
  • The amphibian breeding habitat is confirmed by mating call. In some cases, the researcher directly identifies the amphibian individual, but in order to designate the habitat, it is necessary to map the mating call region of the amphibian population. Until now, it has been a popular methodology for researchers to hear mating calls and outline their breeding habitats. To improve this subjective methodology, we developed a technique for mapping mating call regions using Unmanned Aerial Vehicle (UAV). The technology uses a UAV, fitted with a sound recorder to record ground mating calls as it flies over an amphibian habitat. The core technology is to synchronize the recorded sound pressure with the flight log of the UAV and predict the sound pressure in a two-dimensional plane with probability density. For a demonstration study of this technology, artificial mating call was generated by a potable speaker on the ground and recorded by a UAV. Then, the recorded sound data was processed with an algorithm developed by us to map mating calls. As a result of the study, the correlation coefficient between the artificial mating call on the ground and the mating call map measured by the UAV was R=0.77. This correlation coefficient proves that our UAV recording system is sufficiently capable of detecting amphibian mating call regions.

시각장애인을 위한 딥러닝 기반 음료수 캔 인식 시스템 (A Beverage Can Recognition System Based on Deep Learning for the Visually Impaired)

  • 이찬비;심수현;김선희
    • 디지털산업정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.119-127
    • /
    • 2023
  • Recently, deep learning has been used in the development of various institutional devices and services to help the visually impaired people in their daily lives. This is because not only are there few products and facility guides written in braille, but less than 10% of the visually impaired can use braille. In this paper, we propose a system that recognizes beverage cans in real time and outputs the beverage can name with sound for the convenience of the visually impaired. Five commercially available beverage cans were selected, and a CNN model and a YOLO model were designed to recognize the beverage cans. After augmenting the image data, model training was performed. The accuracy of the proposed CNN model and YOLO model is 91.2% and 90.8%, respectively. For practical verification, a system was built by attaching a camera and speaker to a Raspberry Pi. In the system, the YOLO model was applied. It was confirmed that beverage cans were recognized and output as sound in real time in various environments.

베이커리 크리스마스 마케팅 커뮤니케이션이 신뢰, 구매의도에 미치는 영향: 뚜레쥬르와 파리바게뜨 광고를 중심으로 (The Effect of Christmas Marketing Communication on Trust and Purchase Intention in the Bakery Industry)

  • 서경화;이수범
    • 한국조리학회지
    • /
    • 제19권3호
    • /
    • pp.57-72
    • /
    • 2013
  • 이 연구는 높은 비용이 지불에도 불구하고 크리스마스 케이크 판매촉진의 수단 (광고, 선물 무료)으로 활용하는 마케팅 커뮤니케이션 전략의 장기적 효과에 대해 실증적 분석 하였다. 이러한 검증 결과는 베이커리 업계의 성공적인 관리를 위한 중요한 핵심 요소를 제공할 것으로 판단하였다. SPSS, AMOS를 활용하여 평가 항목에 대한 신뢰성 분석, 타당성 분석을 하였고, 가설 검증을 위해 구조방정식(SEM)이 수행되었다. 본 연구의 결과는 다음과 같다. 첫째, 광고 태도(${\beta}$=0.269, t=4.512, p<0.001)와 사은품 태도(${\beta}$=0.293, t=5.043, p<0.001)는 신뢰에 긍정적인 영향을 미치는 것으로 나타났고, 둘째, 신뢰도는 구매의도에 긍정적인 영향을 미치는 것으로 나타났다(${\beta}$=0.513, t=8.677, p<0.001). 셋째, 광고 태도(${\beta}$=0.104, t=1.966, p<0.05)와 사은품 태도(${\beta}$=0.204, t=3.817, p<0.001)는 구매의도에 긍정적인 영향을 미치는 것으로 나타났다. 마지막으로 광고 태도는 광고타입(배우와 애니메이션)에 따라 다르게 나타났고, 배우 광고가 애니메이션 광고보다 더 높게 평가되었다. 또한 사은품 태도는 사은품 타입(목도리와 스피커 인형/캐릭터 모자)에 따라 다르게 나타났고, 목도리가 스피커 인형/캐릭터 모자보다 높게 평가 되었다.

  • PDF

모바일 상거래 플랫폼에 적합한 음성 템플릿 기반의 사용자 인증 기법 (The Voice Template based User Authentication Scheme Suitable for Mobile Commerce Platform)

  • 윤성현;고훈
    • 디지털융복합연구
    • /
    • 제10권5호
    • /
    • pp.215-222
    • /
    • 2012
  • 전화 기능과 컴퓨터 기능을 갖는 스마트폰의 보급으로 장소에 구애받지 않는 모바일 상거래에 대한 수요가 급증하고 있다. 상거래 서비스는 인증 기법을 적용하여 거래 내용과 거래 당사자에 대한 법적 구속력을 갖는 증거를 남겨야 한다. 스마트폰은 개인용 컴퓨터와 달리 개인정보 노출의 위험이 있고 기기 분실 및 도용에 따른 대리 인증이 상대적으로 쉽다. 기존의 패스워드 및 토큰 기반의 인증 기법은 사용자와 아이디를 물리적으로 연결시키지 못하므로 대리 인증 문제를 해결할 수 없다. 따라서 스마트폰을 모바일 상거래 플랫폼으로 활용하기 위해서는 법적 구속력이 있고 대리 인증이 어려운 새로운 사용자 인증 기법에 대한 연구가 필요하다. 본 논문에서는 사용자 고유 음성 정보와 스마트폰 USIM 정보를 접목한 모바일 ID를 생성하고 이에 기반을 둔 사용자 인증 기법을 설계 및 구현하였다.