• 제목/요약/키워드: 발성특성

검색결과 217건 처리시간 0.026초

한국어 음운인식에서의 조음거리와 긴장성 자질의 특성 연구: 영·유아를 중심으로 (Effects of Articulator-distance and Tense in Phonological Awareness in Korean: The case of Korean Infants and Toddlers)

  • 김충명
    • 한국콘텐츠학회논문지
    • /
    • 제15권8호
    • /
    • pp.424-433
    • /
    • 2015
  • 본 연구는 조음거리와 발성유형에 따른 영유아의 자음 음운인식 능력에서의 차이를 규명해 보기 위해 한국어 장애음을 대상으로 반복측정 실험설계를 통해 진행되었다. 집단 내 변인인으로서의 조음거리는, 연음과 경음의 자질을 갖는 1음절 초성의 조음 위치에 의해 구분된 조음점 간 거리로서 음운인식 수행도의 차이에 구조적으로 영향을 미치는지를 확인하고자 하였다. 실험결과, 음운차이 인식 수행력에서 조음거리를 변인으로 한 주효과를 확인하였는데, 그 거리가 멀어질수록 수행력이 점강하였다. 이는 동일위치나 근접거리 조음점 조건의 음운인식 수행도가 조음점 간 거리가 먼 조건에서의 수행도에 비해 민감한 반응을 보임으로써, 당해 조음점에 인접한 말소리들을 인식하는 능력이 우선 발달하는 결과를 시사함은 물론, 조음 유사성이 조기 음운습득에 영향을 끼칠 수 있음을 말해준다 하겠다. 아울러 집단 간 요인에서도 연령효과를 확인할 수 있었는데, 연령이 높을수록 조음거리에 영향을 덜 받는 경향이 있었으며 인접거리 조건에서는 남아대비, 여아의 수행력이 우수함을 알 수 있었다. 발성유형 중 긴장성을 피험자 내 변인으로 설정한 조건의 주효과는 나타나지 않았지만 연령의 주효과 및 성별과의 상호작용을 통해 연령상승에 따른 긴장음의 인식률의 유의한 상승을 관찰하였고, 긴장음 내에서는 여아의 변별력이 더 우수함을 확인할 수 있었다.

화자 연령 지각과 음성적 특성: 음높이와 발화 속도를 중심으로 (Speaker age estimation and acoustic characteristics: According to pitch and speech rate)

  • 서윤정;신지영
    • 말소리와 음성과학
    • /
    • 제11권4호
    • /
    • pp.9-18
    • /
    • 2019
  • 본고는 한국인 피험자를 대상으로 지각 실험을 진행하여 화자의 실제 연령(Chronological age)과 지각 연령(Perceived age) 간의 상관관계를 살피고, 한국인 피험자가 얼마나 정확하게 익명의 화자의 연령을 지각할 수 있는지를 밝히고자 한다. 또한, 이러한 연령 지각에 음성적 단서가 되는 음높이와 발화 속도와 지각 연령 간의 영향 관계를 검토하고자 한다. 이를 위해, 성인 80명을 대상으로 3가지 과제로 구성된 지각 실험을 진행하였다. 실험 자극은 표준어 화자 40명에게서 추출되었으며, 자유 발화, 낭독 발화, 모음 연장 발성으로 구성되었다. 각 실험은 10초 내외의 음성을 듣고 연령을 구체적인 숫자로 답하는 방식으로 진행되었다. 분석 결과, 한국인 피험자들은 상당히 높은 판단 정확도를 보였으며, 모음 연장 발성을 들었을 때보다 자유 발화와 낭독 발화를 들었을 때 화자의 연령을 더욱 정확하게 짐작하였다. 이러한 결과는 음성이 포함하고 있는 정보량의 차이에 기인한 것으로 보인다. 또한, 음성 분석을 수행한 결과 피험자들은 화자의 음높이와 발화 속도를 참고하여 화자의 연령을 추정하는 것으로 나타났으며, 음높이보다는 발화 속도가 연령 지각에 더 적극적으로 기여한 것으로 나타났다.

비폐색 부위에 따른 비강자음의 음향학적 특성과 비음비율의 변화

  • 손영익;정유석;윤영선;이은경
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1997년도 제8회 학술대회 심포지움
    • /
    • pp.253-253
    • /
    • 1997
  • 비폐색이 있는 경우 음성이 변하는 것을 쉽게 느낄 수 있지만, 비폐색 때의 음향학적인 특성에 대하여 알려진 바를 찾기는 쉽지 않다. 저자들은 인위적으로 비폐색을 유발하여 비폐색 부위에 따른 비강자음의 음향학적 변화특성을 파악하고 비음도의 변화 정도를 비교하고자 하였다. 정상비음도를 보이는 성인남녀 각 10명을 대상으로, 2ml의 부피를 갖도록 수술용장갑에 Merocel$^{\circledR}$을 넣은 뒤, 이를 이용하여 ostiomeatal unit(OMU)을 중심으로 전후상하 4부위의 인위적인 비폐색을 유발하여, 비폐색 전과 후의 부위에 빠른 차이틀 비교하였다. /나나/의 발성을 각 조건에서 3회 실시하여, 모음중간의 /ㄴ/중 (CVCV) 안정된 spectorgram소견을 보이는 부위를 선택하여, 해당구간의 제1, 제2, 제3 음형대와 각각의 bandwidth 평균값을 남녀별로 비교하였고, 표준비음비율이 알려진 rabbit, baby, mama 문장을 이용하여 비음비율을 비교하였다. 남녀모두 비폐색전에 비하여 OMU의 앞쪽부위를 막은 경우에 제1음형대가 가장 뚜렷하게 감소되었으며, 비음비율의 유의한 감소를 보였다. 비폐색이 있는 경우, 비강자음 /ㄴ/은 제1음형대를 중심으로 주요변화가 일어남을 알 수 있었으며, 비폐색 부위에 따라 비음비율이나 제1음형대 감소의 정도가 다름을 알 수 있었다.

  • PDF

확률적 모델을 이용한 연속 숫자음 인식에 관한 연구 (A Study on Continuous Digits Speech Recognition using Probabilistic Models)

  • 이주승;이성권;김순협
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.109-112
    • /
    • 1999
  • 본 연구는 음소 단위의 CHMM(Continuous Hidden Markov Model)을 이용한 한국어 연속 음성인식에 관한 내용이다. 연구실 환경에서 음성으로 전화를 걸기 위하여 연속 숫자음 인식을 수행하였다. ETRI 445 데이터를 사용하여 초기의 모델은 ML(Maximum Likelihood) 추정법을 이용하여 작성하였고 적응화를 위해 최대 사후 확률 추정법을 사용하였다. 연속 숫자음의 인식을 위하여 한국어 숫자음 음성의 음향학적 특성을 고려하여 발성 사전을 작성하였고, 음절 단위로 되어있는 한국어 숫자음의 모든 경우를 고려하여 복수개의 단어를 사전에 등록하였다. 또한 숫자음의 알 뒤 연음현상을 고려하여 작성한 21 종류의 7자리 숫자음과 이를 음절 단위로 세그먼트한 숫자음을 DB로 사용하여 적응화를 수행하였다. 이의 효율성을 입증하기 위하여 ETRI에서 작성한 35종류의 4연속 숫자음 목록을 대상으로 인식실험을 수행하였다.

  • PDF

광화학 상자모델과 기체/입자 평형모델을 이용한 서울의 계절별 질산염 농도 예측 (Prediction of Ambient Concentration of Nitrate in Seoul Using a Photochemical Box Model and a Gas-Aerosol Equilibrium Model)

  • 이시혜;김영성;김용표;김진영
    • 한국대기환경학회:학술대회논문집
    • /
    • 한국대기환경학회 2003년도 춘계학술대회 논문집
    • /
    • pp.347-348
    • /
    • 2003
  • 대기 중의 질산에 의해 생성되는 질산염은 해염성분이나 토양성분과 만나 조대입자 영역에 머물거나 암모늄과 만나 미세입자로 존재할 수 있다. 미세입자로 존재하는 질산염은 여름철과 같은 광화학 반응이 활발할 때 2차적으로 생성되는 물질로, 반휘발성 특성 때문에 측정하는 과정에서 오차가 발생할 가능성도 크다. Seinfeld (1986)에 의하면 미국의 도심 지역에서 미세입자 중 황산염이나 질산염 등 2차 이온 성분의 비율이 전체 입자의 40∼60 %를 차지한다고 보고되고 있으며, 대표적인 도심 지역인 서울에서도 비슷하다 (강충민 등, 1999). (중략)

  • PDF

Ni-Doped $CdGa_2Se_4$및 Undoped $CdGa_2Se_4$단결정의 광발성 특성 (Photoluminescence Properties of Ni-doped and Undoped $CdGa_2Se_4$ Single Crystals)

  • 김창대;정해문;신동호;김화택
    • 한국진공학회지
    • /
    • 제1권2호
    • /
    • pp.254-258
    • /
    • 1992
  • Iodine 화학수송법으로 성장한 Ni-doped CdGa2Se4와 undoped CdGa2Se4 단결정 의 PL 및 PLE 스펙트럼을 조사하였다. Undoped CdGa2Se4 단결정의 PL 스펙트럼에서는 전도대아래 준 연속적으로 분포된 electron trap과 deep level, 그리고 가전자대 위 0.07eV, 0.12eV에 있는 acceptor level 사이의 전자전이에 의한 2개의 emission band를 2.13eV와 1.20eV 영역에서 관측하였으며, Ni-doped 단결정에서는 Ni2+ 이온의 여기상태 3T1(3P)와 바 닥상태 3T1(3F) 사이의 전자전이에 의한 emission band를 1.48eV 영역에서 관측하였다. 이 러한 결과로부터 제안된 CdGa2Se4의 energy band model은 본 연구의 PL mechanism을 설명하는데 가능함을 보여주었다.

  • PDF

음성인식을 이용한 Windows 95 제어 시스템의 구현 (The Implementation of Windows 95 Control System with Speech Recognition)

  • 남동선
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.43-46
    • /
    • 1998
  • 본 논문은 컴퓨터 사용에 미숙한 초보자나 키보드나 마우스를 사용할 수 없는 신체적인 조건을 가진 장애인 또는 PC사용에 미숙한 사용자들을 위해 기존의 인터페이스에 추가적으로 음성을 사용하여 더 효율적인 작업 환경을 만들기 위한 음성을 이용한 Window95 환경에서의 음성 인식 시스템 구현에 관한 것이다. 인터페이스 구현을 위해 사용되는 인식 알고리즘으로는 연결어 인식에 사용되는 OSDP[1] 알고리즘을 단독어 인식에 적용하여 사용하였다. 특징 벡터는 화자 독립적인 특성을 지닌 Perceptual Linear Predictive(PLP)[2] 13차 계수를 사용하였다. 인식 대상 어휘는 윈도우 사용자에게 자주 사용되는 60개의 명령어로 설정하였다. 인식된 후 그 결과는 구현된 시스템의 명령 실행 모듈로 전달되어 윈도우 상에서 실제 수행된다. 구현된 시스템에서는 노트북 내장 마이크를 사용하여 음성을 검출하였고 이를 위한 음성 구간 검출 알고리즘을 사용하였다. 기준 패턴은 20대 남성화자 9인이 2회 발성한 데이터를 이용하였고, 화자 독립으로 온라인 인식률은 91.71%이고, 오프라인 인식률은 96.4%의 인식률을 얻었다.

  • PDF

유전자 알고리듬을 이용한 화자 적응적 음성인식 (Genetic Algorithm for Speaker Adaptation in Speech Recognition)

  • 임동철
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.107-110
    • /
    • 1998
  • 본 논문은 DTW(Dynamic Time Warping)을 이용한 음성인식에서 표준패턴(reference patterns)으로 사용되는 벡터열을 GA(Genetic Algorithm)을 이용하여 보다 적응된 패턴의 벡터열로 생성하는 방법을 제시한다. 본 논문의 필요성은 다음과 같다. 음성인식의 주요한 엔진들 중에 하나로 DTW가 사용된다[1]. DTW는 표준패턴과 시험패턴(test patterns)간의 최적 경로(optimal path)를 찾아내어 가장 유사한 패턴을 찾아내는 방법을 말한다. 그러나 음성은 같은 발음에 대해서도 사람의 발성 길이와 목의 상태 등에 따라 다양한 패턴으로 나타나며 동일 화자의 같은 어휘도 시간과 환경에 따라 변한다. 따라서 이러한 음성의 동적 특성에 적응하는 방법이 필요하다. 본 논문은 이러한 문제에 대한 해결 방법으로 GA를 이용하여 보다 적합하고 적응적인 표준 패턴을 생성시켜 적응하는 방법을 개발하였다.

  • PDF

배우에 의한 한국어 정서음성 데이터베이스 수집 (Collection of Korean Emotional Speech Database from Actors)

  • 조철우;박일서;이용주;김봉완
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.45-48
    • /
    • 2004
  • 본 논문에서는 한국어 정서음성 데이터베이스를 수집하는 과정을 기술하고 및 데이터베이스의 특성에 관해서 논의한다. 데이터베이스는 배우로부터 수집되었으며 주관적 평가에 의해 평가되었다. 배우는 남녀 각 3인씩 총 6인이며, 6가지 정서상태에 의해 10개의 문장을 발성하였고 20명의 평가자가 음성에 포함된 정서상태를 독립적으로 평가하였다. 작성된 데이터베이스는 임의제시 방법에 의한 주관적 평가결과 $80\%$이상의 일치도를 얻었다.

  • PDF

CHMM을 이용한 전화번호 인식에 관한 연구 (A Study of Telephone Digit Recognition Using CHMM)

  • 이성권
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.31-34
    • /
    • 1998
  • 본 연구는 음소 단위의 CHMM을 이용한 연속어 숫자음 인식에 관한 내용이다. ETRI 445 데이터를 사용하여 초기의 모델은 ML 추정법을 이용하여 작성하였고 적응화를 위해 최대 사후 확률 추정법을 사용하였다. 또한 한국어 숫자음 음성의 음향학적 특성을 고려하여 발성 사전을 작성하였고 음절 다누이로 되어있는 한국어 숫자음의 모든 경우를 고려하여 복수개의 단어를 사전에 등록하였다. 또한 적응화 학습에 있어서 숫자음의 앞 뒤 모든 경우를 고려하여 작성한 21 종류의 7자리 전화번호 숫자음 DB로 사용하였고 이의 효율성을 입증하기 위하여 ETRI에서 작성한 35종류의 4연속 숫자음 목록을 대상으로 인식실험을 수행하였다. 그 결과 5인의 화자에 대하여 4연속 숫자음에 대하여 96%의 인식률을 보이고 있으며 7연속 숫자음에 대하여도 약 91%의 결과를 보여주고 있다. 또한 후처리를 두어 연음 현상으로 인한 오인식의 경우에 대해서도 약 2%의 인식률의 증가를 보여주었다.

  • PDF