• 제목/요약/키워드: reference speaker

검색결과 87건 처리시간 0.029초

국부 봉우리와 골에 의한 피치 검출과 퍼지를 이용한 화자 인식에 관한 연구 (A Study on Speaker Recognition using the Peak and valley pitch detection and the Fuzzy)

  • 김연숙;김희주;김경재
    • 한국정보통신학회논문지
    • /
    • 제8권1호
    • /
    • pp.213-219
    • /
    • 2004
  • 본 논문에서는 국부 봉우리와 골에 의한 피치 파라미터와 퍼지를 포함한 화자 인식 알고리즘을 제안한다. 음성의 패턴 인식에서 인식 성능을 저하시키는 시간 변동과 주파수 변동에 대한 문제를 해결하여 피치를 검출한다. 비선형적인 발성 시간에 따른 시간 변동의 폭을 모두 포함하기 위하여 음성 신호의 애매성을 보완할 수 있는 퍼지의 소속 함수를 이용하여 표준 패턴을 작성하고 퍼지 패턴 매칭을 이용하여 인식을 수행한다.

덕트-음향 시스템에서 소거용스피커 방향에 따른 소음감소효과 (Noise Attenuation Effect According to the Direction of Canceling Speaker in Duct-acoustic System)

  • 이형석;이응석
    • 한국정밀공학회지
    • /
    • 제26권7호
    • /
    • pp.51-57
    • /
    • 2009
  • In this paper, we studied on an attenuation effect of automobile exhaust noise according to the direction of canceling speaker in duct-acoustic ANC system. Automobile exhaust noise was recorded at 800rpm, 3500rpm and 5000rpm of a diesel engine. Directions of canceling speaker can be set to $30^{\circ}$, $90^{\circ}$ and $150^{\circ}$ against the primary noise flow by acrylic ducts to be made for the experimentation. DSP board used to control the ANC system. The algorithm of this ANC system applied the Filtered-x-LMS algorithm that is modified to compensate for a property of DSP input signal and the secondary-path effect. As an experiment result, the direction of canceling speaker was proved to influence the reduction effect of noise. The $150^{\circ}$ duct in the attenuation effect of noise showed a better result than the $90^{\circ}$ or $30^{\circ}$ duct.

선형 변환망을 이용한 화자적응 음성인식 (Speaker Adaptation Using Linear Transformation Network in Speech Recognition)

  • 이기희
    • 한국컴퓨터정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.90-97
    • /
    • 2000
  • 본 논문에서는 불특정 화자의 음성에 대해서도 신뢰성 있는 인식이 이루어지도록 하는 음성인식 시스템을 구현하기 위한 화자적응 음성인식 기법을 제안한다. 제안한 화자적응 기법에 의한 음성인식 시스템은 표준화자의 음성특징을 1차선형 변환 망에 의해 새로운 화자의 음성특징에 선형적으로 적응하여 인식하며. 그 구성은 다층퍼셉트론을 퍼지 벡터양자화기로 사용하는 반연속 HMM을 기반으로 한다 구현한 인식시스템은 그 성능을 확인하기 위해 고립단어 인식실험을 수행하였다. 그 결과, 화자적응 인식인 경우가 화자적응 수행하지 않은 시스템에 비해 인식률이 개선됨을 보였다.

  • PDF

화자 정규화를 위한 비정형 워핑함수 도출에 관한 실험 (Experiments on Extraction of Non-Parametric Warping Functions for Speaker Normalization)

  • 신옥근
    • 한국음향학회지
    • /
    • 제24권5호
    • /
    • pp.255-261
    • /
    • 2005
  • 화자들 사이의 워핑특성을 알아보기 위해 비정형 워핑함수를 도출하는 실험을 수행하였다. 이를 위해 모음의 MFCC와 LP 스펙트럼을 이용하여 화자별, 음소별 대표 스펙트럼을 선정한 다음 음소별 기준 스펙트럼을 선택하였다. 기준 스펙트럼과 대표 스펙트럼을 스펙트럼의 전체대역에서 DTW로 비교하여 화자별 워핑함수를 구한 다음, 이들을 clustering함으로써 비정형 워핑함수의 집합을 도출하였다. 이 함수집합에서 남성화자와 여성화자의 함수들이 각각 구간선형함수와 파워함수와 유사함을 관찰할 수 있었으며, 이를 근거로 이 함수들을 조합한 하이브리드 워핑함수집합을 정의하였다. 음소단위의 인식 실험을 통하여 새로 정의된 함수들의 인식률을 시험하였으며 두 함수집합 모두에서 개선된 인식률을 얻을 수 있었다.

주변 잡음 환경에 강한 화자인식 알고리즘 연구 (A study on the robust speaker recognition algorithm in noise surroundings)

  • 정종순
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.47-54
    • /
    • 2005
  • 대부분의 화자인식 시스템은 음성 분석을 통해 화자의 특징을 음향 파라미터 형태로 추출하여 화자의 표준패턴을 만든 후, 입력된 미지의 음성패턴과의 차이를 계산하여 허용 여부를 최종적으로 판단한다. 화자인식에 사용하는 파라미터는 화자의 특징을 충분히 표현함과 더불어 발성 시마다 변동이 작은 것이 바람직하다. 따라서 본 논문에서도 이를 위해서 다음과 같이 제안하였다. 벡터 양자화모델에 비잡음 환경에 강한 스펙트럼 특징과 잡음 환경에 강한 운율정보를 화자인식 시스템에 이용할 것을 제안하였다. 훈련과정에서 코드북 형성시 실제 데이터를 스펙트럼 특징과 운을 특징을 조합하여 원하는 모델 수만큼 만들었다. 인식과정에서는 입력된 테스트패턴을 각 모델간에 거리 측도로 비교하여 가부를 결정하였다. 실험결과 스펙트럼 특징과 운을 특징을 각각 이용할 경우 보다 좋은 인식율을 얻었으며, 특히 잡음 환경에서 안정된 인식율을 확보하므로 상용화의 가능성을 한층 높였다.

  • PDF

Beyond Politeness: A Spoken Discourse Approach to Korean Address Reference Terms

  • Hong, Jin-Ok
    • 영어어문교육
    • /
    • 제15권2호
    • /
    • pp.93-119
    • /
    • 2009
  • Internalized Confucian cultural scripts trigger meta-pragmatic thinking in Korean communication. Commonly shared cultural knowledge acts as a powerful constraint upon the behavioral patterns of each participant and this knowledge can be strategically manipulated to avoid confrontations. The strategic use of address reference terms utilizes cultural values as a face-redress mechanism to achieve situation-specific goals. This paper offers a view of Korean address reference terms that rests on four revisions of politeness theory (Brown & Levinson, 1978, 1987). First, the notion of discernment - or 'wakimae' - as a culture-specific mechanism is reanalyzed. Secondly, culture-specific values as another R (ranking of imposition) variable are introduced. Thirdly, a reevaluation of the notion of positive face (respect) is discussed. Finally, the address reference terms in combination with other honorifics by the speaker that can be strategically applied either to threaten or to enhance the face of the hearer is observed. Because Confucianism is embedded in Korean cultural identity, teaching cultural values integrated and their roles in situation-dependent politeness is required in order to understand interactional nature of politeness occurring from particular discourse contexts.

  • PDF

한국어 단독음 인식을 위한 표준패턴 설정에 관한 연구 (A Study on Creating Reference Pattern for Recognition of Korean Isolated Word)

  • 김계국;고덕영;이종악
    • 한국음향학회지
    • /
    • 제6권1호
    • /
    • pp.23-28
    • /
    • 1987
  • 본 연구에서는 집단화 알고리즘을 이용하여 한국어 단독음의 표준 패턴을 설정하였다. Minimax기법을 이용하여 각 단독음에 대하여 최고 3개까지 표준패턴을 설정하여 인식하였다. 특징 파라미터는 선형예측계수와 자기 상관 계수를 이용하였으며 패턴들 간의 유사도 비교는 Itakura가 제안한 거리측정법을 이용하였다. 표준패턴을 1개만 설정하였을 때 $55.9\%$, 2개를 설정했을 때 $76.9\%$, 3개를 설정했을 경우는 $89.5\%$의 인식률을 얻었다.

  • PDF

Duct ANC System에서 부가음원 방향별 소음감소효과 (Noise Attenuation Effect According to the Direction of Secondary Sound Source in Duct ANC System)

  • 이응석;이형석
    • 한국소음진동공학회논문집
    • /
    • 제19권3호
    • /
    • pp.251-260
    • /
    • 2009
  • In this paper, we studied on an attenuation effect of automobile exhaust noise according to the direction of canceling speaker in ANC system. Automobile exhaust noise was recorded at 800 rpm, 3500 rpm and 5000 rpm of a diesel engine. Directions of canceling speaker can be set to $30^{\circ}$, $90^{\circ}$ and $150^{\circ}$ against the primary noise flow by acrylic ducts to be made for the experimentation. DSP board with TMS320C6416 chip of Texas Instrument Co. used to control the ANC system. The algorithm of this ANC system applied the Filtered-x-LMS algorithm that is modified to compensate for a property of DSP input signal and the secondary-path effect. As an experiment result, the direction of canceling speaker was proved to influence the reduction effect of noise. The $150^{\circ}$ duct in the attenuation effect of noise showed a better result than the $90^{\circ}$ or $30^{\circ}$ duct.

타워형 에어컨 송풍기 소음의 능동제어 (Active Control of Noise from Fan Blowers in Tower-type Air Conditioners)

  • 류경완;홍진숙;정의봉
    • 한국소음진동공학회논문집
    • /
    • 제27권1호
    • /
    • pp.87-93
    • /
    • 2017
  • This paper investigates active noise control of tower-type air conditioners using the filtered-x least mean square (FXLMS) algorithm to reduce fan blower noise transmission. Firstly, the main components required for the active control system including the error sensor, the control speaker and the reference sensors are selected. Since the noise could significantly reduce if the reference signal includes every frequency response information, a various reference signals from accelerometers and a microphone are used. Secondly, the controller based on the FXLMS algorithm with a single-channel reference signal is implemented. Then, the control performance is examined experimentally for the different reference signals. It is found that the accelerometer signal well possesses the motor vibration related noise and a microphone signal could includes global noise. When using the reference signal with a microphone located near the motor and the fan blower, the active control system reduces the noise globally, except for several peaks.

실 환경에서의 인간로봇상호작용 컴포넌트의 성능평가 (Performance Evaluation of Human Robot Interaction Components in Real Environments)

  • 김도형;김혜진;배경숙;윤우한;반규대;박범철;윤호섭
    • 로봇학회논문지
    • /
    • 제3권3호
    • /
    • pp.165-175
    • /
    • 2008
  • For an advanced intelligent service, the need of HRI technology has recently been increasing and the technology has been also improved. However, HRI components have been evaluated under stable and controlled laboratory environments and there are no evaluation results of performance in real environments. Therefore, robot service providers and users have not been getting sufficient information on the level of current HRI technology. In this paper, we provide the evaluation results of the performance of the HRI components on the robot platforms providing actual services in pilot service sites. For the evaluation, we select face detection component, speaker gender classification component and sound localization component as representative HRI components closing to the commercialization. The goal of this paper is to provide valuable information and reference performance on appling the HRI components to real robot environments.

  • PDF