• 제목/요약/키워드: 무성음

검색결과 122건 처리시간 0.038초

도호쿠 일본어의 폐쇄음 지각에 있어서 voice onset time(VOT)과 후속모음 fundamental frequency(F0)의 역할 (The role of voice onset time (VOT) and post-stop fundamental frequency (F0) in the perception of Tohoku Japanese stops)

  • 변희경
    • 말소리와 음성과학
    • /
    • 제15권1호
    • /
    • pp.35-45
    • /
    • 2023
  • 일본어의 전통적인 어두 폐쇄음은 파열 전에 성대 진동을 동반하는 유성음과 파열 후에 약간의 기음을 동반하는 무성음으로 이분된다. 한편 도호쿠지방의 유성음은 어느 세대나 파열 전에 성대 진동을 동반하지 않고 무성화한 유성음으로 실현되어 다른 지역과 대조를 이룬다. 무성화한 유성음은 voice onset time(VOT)이 양값으로 나타나고 그러면 기존의 무성음의 VOT와 충돌하게 되어 카테고리 구별에 영향을 미치게 된다. 이에 대해 도호쿠지방의 화자는 생성 시에 다른 지역과는 달리 폐쇄음 구별에 후속 모음의 fundamental frequency(F0)를 적극적으로 사용하는 것이 여러 연구에 의해 확인되었다. 본 연구는 인지면에서도 F0가 폐쇄음 구별에 중요한 역할을 하고 있는지를 밝히기 위해 VOT와 함께 검토한 것이다. VOT와 F0를 재합성한 자극음을 사용하여 도호쿠지방 청자를 대상으로 조건을 달리한 여러 개의 지각실험을 실시하였다. 결과에서는 무의미어의 경우 지역차(도호쿠 지방 vs.주부 지방)는 유의하지 않았으나 유의미어에서는 어휘에 따라 F0 사용에 유의한 차이가 있었으며 이러한 차이는 F0를 적극적으로 사용하는 몇몇의 청자들에게서 기인하는 것으로 밝혀졌다. 논의에서는 이들이 혁신 청자들로 여겨지며 이들을 중심으로 폐쇄음 지각에 F0 역할이 일반화되고 지각특성으로서 F0가 확립될 가능성에 대해 추론해 보았다.

LSP를 이용한 음성신호의 성분분리에 의한 CELP 보코더의 전송률 감소에 관한 연구 (A Study on a Reduction of the Transmission Bit Rate by the U/V Decision Using LSP in the CELP Vocoder)

  • 나덕수;박영호;정찬중;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.61-64
    • /
    • 1999
  • 기존의 CELP 보코더에서, 무성음에 대한 별도의 처리 없이 유성음과 동일하게 처리하였다. 유성음과 무성음은 발성모델측면에서 임펄스열과 랜덤 잡음으로 각각 다름에 도 불구하고 동일하게 처리함으로써 합성음에서 음질의 저하 및 계산량과 전송률 측면에서 손실을 가져왔다. 또, U/V(Unvoiced /voiced) 분류기를 사용하는 경우에는 U/V 분류기의 성능에 따라 합성음의 음질저하의 정도의 차이가 심하다. 본 논문에서는 에러율과 전처리 계산량을 쳐소로 할 수 있는 U/V 분류기를 사용하여 CELP 보코더에서 전송률을 감소시키는 방법을 제안한다. CELP 보코더에서는 스펙트럼 정보를 LPC 파라미터로 추출한 후 다시 전송형 파라미터인 LSP(Line Spectrum Frequency)로 변환한다 새로운 린/V 분류기는 이 LSP 파라미터를 이용한다. LSP 파라미터의 주파수영역 분포도와 간격정보를 이용하여 U/V를 결정하게 된다 제안한 방법을 5.3kbps ACELP에 적용하여 성능 평가를 실시하였다 실험결과 음질의 저하 없이 $5.6\%$ (280bps)의 전송률을 감소할 수 있었다.

  • PDF

한국 EFL 학생들의 영어 순자음 인지 (Identification of English Labial Consonants by Korean EFL Learners)

  • 초미희
    • 한국콘텐츠학회논문지
    • /
    • 제6권12호
    • /
    • pp.186-191
    • /
    • 2006
  • 기존의 유표성 이론에 따르면 마찰음이 파열음보다 유표적이므로 발음하기 어렵다는 것은 잘 알려진 사실이다. 따라서 본 연구에서는 한국 EFL 학습자들이 발음하기 어려운 마찰 [f, v]를 어떻게 인지하는지 살펴보기 위해서 영어 순자음 [p, b, f, v]를 판별하는 실험을 기획하였다. 40명의 한국 학생들이 영어 순자음이 들어간 임시어를 인지하는 테스트를 실행한 결과, 순자음의 운율적 위치가 인지 정확도를 결정짓는데 영향을 마침을 발견하였다. 특히 유표성 이론의 예상과 달리, 무성 마찰음 [f]의 정확도가 강세 뒤 모음사이의 위치를 제외한 모든 위치에서 높게 나왔다. 영어 순자음의 평균 인지 정확도는 강세 앞 모음사이 위치와 어두 초성에서 높은 반면에 어말 종성과 강세 뒤 모음사이 위치에서는 낮았다. 한국 학생들의 영어 순자음 인지에는 유표성 이론뿐 만 아니라 음향학적 두드러짐과 강세를 포함하는 청각적인 요소도 작용함을 보여주고 있다.

  • PDF

다자간 영상통화의 오디오 게인콘트롤을 위한 저연산 음성분류방식 (Multi-party video telephony of audio gain control for low computation voice classification method)

  • 류상현;김형국
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2012년도 춘계학술발표대회논문집
    • /
    • pp.349-350
    • /
    • 2012
  • 본 논문에서는 다자간 영상통화의 오디오 게인콘트롤을 위한 저연산 음성분류방식을 제안한다. 제안된 음성분류방식은 입력되는 음성신호를 음성신호의 특징에 따라서 묵음/무성음/유성음으로 분류한다. 입력된 음성신호의 에너지를 이용해서 음성구간과 비음성구간을 판별한다. 음성구간으로 판별된 구간에 대해서 ZCR(Zeor Crossing Rate)를 이용하여 유성음과 무성음으로 분류한다. 제안된 방식의 성능을 측정을 위해 음성분류 정확도와 연산시간을 측정하여 성능을 측정하였다.

  • PDF

신경회로망에 의한 음성스펙트럼의 복원 알고리즘 (Restoration Algorithm of Speech Spectrum using Neural Network)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.512-514
    • /
    • 2011
  • 본 논문에서는 스펙트럼 회복의 수단으로써 신경회로망을 사용하여 푸리에변환(FFT) 진폭성분 및 위상성분을 복원하는 알고리즘을 제안한다. 본 논문에서는 먼저 각 프레임의 FFT 진폭성분들을 유성음 구간과 무성음 구간으로 검출한 후, 유성음 및 무성음 구간에 대해서 각 프레임의 FFT 진폭성분들을 저역, 중역 및 고역으로 각각 분리한 후에 각 대역의 FFT 진폭성분들을 저역용 신경회로망(NN), 중역용 NN, 그리고 고역용 NN의 입력으로 하여 각 NN에 학습시킴으로써 최종 FFT 진폭성분들을 구한다. 본 실험에서는 Aurora2 데이터베이스를 사용하여 FFT의 진폭성분을 복원하는 잡음제거의 알고리즘을 사용하여 여러 잡음에 대해서 본 알고리즘의 유효성을 실험적으로 확인한다.

  • PDF

유, 무성음 및 묵음 식별에 관한 연구 (A study on the Voiced, Unvoiced and Silence Classification)

  • 김명환;김순협
    • 한국음향학회지
    • /
    • 제3권2호
    • /
    • pp.46-58
    • /
    • 1984
  • 본 논문은 한국어 음성 인식을 위한 유성음, 무성음, 묵음 식별에 관한 연구이다. 주어진 음성 구간을 3가지 음성 신호 부류로 식별하기 위하여 패턴 인식 방법을 사용하였다. 여기에 사용한 분석 파 라메타는 음성 신호의 영교차율, 대수 에너지, 정규화 된 첫 번째 자동 상관 계수, 선형 예측 분석에서 얻은 첫 번째 예측 계수, 그리고 예측 오차의 에너지이다. 한편 측정된 파라메타들이 다차원 가우스 확 률 밀도 함수에 따라 분산되었다는 가정하에서 어어진 최소 거리 법칙에 기본을 두고 음성 구간을 결정 하였다. 측정된 파라메타들을 여러 가지 방법으로 조합하여 식별한 결과 영교차율, 첫 번째 예측계수, 예측 오차의 에너지를 측정 파라메타로 사용했을 때 1%보다 적은 식별 오차율을 얻었다.

  • PDF

선별적인 관측열 추출을 통한 DHMM 음성인식의 성능 개선 (Speech Recognition Imptovement Using Extraction Selective Observation in DHMM)

  • 김우창;조선호;고수정;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.374-376
    • /
    • 2000
  • 음성인식 시스템에 사용하는 알고리즘 중에 하나인 DHMM은 코드북을 이용하여 음성의 프레임들에 대한 특징을 관측열로 추출하여 음성의 패턴에 대한 훈련과 인식을 수행하게 된다. 그러나 음성은 유성음과 무성음의 특징 차이가 많이 나게 되므로 하나의 코드북을 이용하게 되면 코드북 오차에 의하여 성질이 전혀 다른 코드북 인덱스를 DHMM의 관측열로 사용하게 된다. 본 논문에서는 음성의 유성음과 무성음에 대한 선별적인 작업을 통해 서로 다른 코드북을 만들어 관측열을 추출하고 선행 관측과 현 관측과의 거리 비교 연산을 통하여 관측의 시간축을 정규화한 관측열을 음성인식에 사용하였다. 본 논문에서 제시하는 인식 방법을 사용하여 실험한 결과, 기존의 인식 방법보다 5.33% 향상된 결과를 얻었다.

  • PDF

주파수대역별 TDNN을 이용한 음성신호의 잡음억제 (Noise Suppression of Speech Signal using TDNN for each Frequency Band)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.341-344
    • /
    • 2009
  • 본 논문에서는 신경회로망(Neural network)에 시간구조를 도입한 시간지연 신경회로망(Time-delay Neural Network: TDNN)을 사용하여 잡음을 포함한 음성신호로부터 잡음을 제거함으로써 음성을 강조하는 것을 목적으로 한다. 본 논문에서는 먼저 각 프레임의 FFT 진폭성분들을 유성음 구간과 무성음 구간으로 검출한 후, 무성음 구간에 대해서는 각 프레임에서 이동평균을 취하여 음성을 강조한다. 유성음 구간에 대해서는 각 프레임의 FFT 진폭성분들을 저역, 중역 및 고역으로 각각 분리한 후에 각 대역의 FFT 진폭성분들을 저역용 TDNN, 중역용 TDNN, 그리고 고역용 TDNN의 입력으로 하여 각 TDNN에 학습시킴으로써 최종 FFT 진폭성분들을 구한다. 본 실험에서는 Aurora2 데이터베이스를 사용하여 FFT의 진폭성분을 복원하는 잡음제거의 알고리즘을 사용하여 여러 잡음에 대해서 본 알고리즘의 유효성을 실험적으로 확인한다.

  • PDF

음소단위를 이용한 소규모 문자-음성 변환 시스템의 설계 및 구현 (Design and Implementation of Simple Text-to-Speech System using Phoneme Units)

  • 박애희;양진우;김순협
    • 한국음향학회지
    • /
    • 제14권3호
    • /
    • pp.49-60
    • /
    • 1995
  • 본 논문은 소규모 시스템에 적용 가능한 한국어 문자-음성 변환 시스템의 설계 및 구현에 대한 연구를 목적으로 한다. 본 논문에서 채택한 음성합성 방법은 파라메터 합성법으로서 LPC(linear Predictive Coding)계열의 PARCOR(PARtial autoCORrelation) 계수를 음향 파라메터로 사용하였으며, 음성합성 단위로는 가장 기본적인 단위인 음소를 채택하였다. 합성 파라메터로는 유성음의 경우 PARCOR계수, 피치, 진폭을 무성음의 경우 잔차신호와 PARCOR계수를 사용하였다. 특히 무성음의 경우 LPC합성시 음질이 떨어진다는 단점이 있었으나, 본 논문에서는 LPC분석시 얻어지는 잔차신호를 무성음의 여기신호로 사용하여 단어 단위의 합성에서 60%의 이해도를 얻을 수 있었다. 합성결과 단어 단위의 합성에 적용 가능하였고, 문장단위의 합성을 위해서는 음소 지속시간 조절에 대한 연구가 진행되어야 할것이다. 본 논문의 구현환경으로는 486 PC상에서 음성의 입,출력을 위해 70[Hz]-4.5[KHz] 대역통과 필터와 증폭기, 그리고 TMS320C30 디지털 신호처리 프로세서를 장착한 DSP 보드를 사용하였다.

  • PDF