• 제목/요약/키워드: 기본주파수 ($F_0$)

검색결과 49건 처리시간 0.022초

한국어 발화음성에서 중점단어 탐색을 위한 기본주파수에 대한 연구 (A Study of Fundamental Frequency for Focused Word Spotting in Spoken Korean)

  • 권순일;박지형;박능수
    • 정보처리학회논문지B
    • /
    • 제15B권6호
    • /
    • pp.595-602
    • /
    • 2008
  • 각 문장 별 중점단어는 발화음성을 인식하고 그 의미를 이해하는데 도움을 준다. 발화된 음성신호로부터 중점단어를 탐색할 수 있는 방법을 찾기 위한 노력의 일환으로 실험을 통하여 문장 내에서 중점단어와 그 외의 단어들의 기본주파수의 평균과 분산, 그리고 평균 에너지를 분석해 보았다. 한국어로 된 100개의 발화문장의 음성데이터를 가지고 실험을 한 결과 중점단어는 그 외의 단어들에 비해 대부분 상대적으로 높은 기본주파수의 평균값을 나타내거나 상대적으로 높은 기본주파수의 분산 값을 나타냈다. 이 연구 결과를 이용하면 한국어의 구어문장에서 운율적 특성을 알 수 있을 뿐만 아니라, 자연어 처리를 이용한 핵심어를 추출하는 데에도 도움이 될 것이다.

생체 발성 모형에서 갑상피열근과 윤상갑상근의 기본주파수 조절 기능의 비교 (Comparison of Fundamental Frequency Control Between Thyroarytenoid Muscle and Cricothyroid Muscle: In Vivo Canine Model)

  • 최홍식
    • 대한기관식도과학회:학술대회논문집
    • /
    • 대한기관식도과학회 1993년도 제27차 학술대회 초록집
    • /
    • pp.70-70
    • /
    • 1993
  • 발성시 기본주파수의 조절은 윤상갑상근과 갑상피열근의 적절한 수축 작용에 의한다는 사실은 잘 알려져 있다. 윤상갑상근의 기능은 자세히 알려져 있는데 반하여, 갑상피열근의 기능은 현재까지 생체 발성 모형이 개발되지 않아 자세한 내용을 알 수 없었기에, 저자들은 갑상피열근 기능 검사를 위한 생체 발성 모형을 고안하였다. 개의 갑상연골에 창문을 만들어서, 반회신경의 마지막 분지인 갑상피열 분지를 확인, 절단하고 전극으로 자극하도록 하였다. 유발된 음성에 대한 갑상피열근 수축의 효과는 성역의 결정에 중요한 결정 요소로 작용되며, 가성 (falsetto) 영역에서 갑상피열근의 수축은 기본주파수 하강을 초래하고, 지성 (modal) 영역에서는 반대로 기본주파수가 상승되었다. 한편, 갑상피열근의 자극에 따라 성문하압은 증가되고 성문개대율 (OQ) 은 감소되었다.

  • PDF

한국어-영어 이중언어 화자의 사용 언어, 문맥, 언어 능숙도에 따른 기본 주파수 변화 (Changes in fundamental frequency depending on language, context, and language proficiency for bilinguals)

  • 윤소망;목소라;윤정선;한지윤;임동선
    • 말소리와 음성과학
    • /
    • 제11권1호
    • /
    • pp.9-18
    • /
    • 2019
  • 본 연구에서는 영어-한국어 이중언어 화자의 평균 기본주파수를 분석하여 언어 및 과제에 따른 차이가 있는지 살펴보고, 거주년수 및 언어 능숙도에 따라 언어 간 평균 기본주파수 상이한지 실펴보고자 하였다. 본 연구의 대상자는 영어권 나라에 7년 이상 거주한 한국어-영어 균형적 이중언어 집단 총 28명(남녀 각각 14명, 균형적 이중언어집단), 언어 노출기간 및 언어 능숙도에 차이를 두기 위해 추가로 모집한 영어권 나라 거주년수 3년 이하인 한국어 우세 이중언어 집단 총 20명(남녀 각각 10명, 한국어 우세 이중언어 집단)이다. 이들은 한국어와 영어로 읽기 및 자발화 과제를 수행하였고 Praat을 통해 녹음한 음성파일의 평균 기본주파수를 분석하였다. 이후 각 성별 내 언어 ${\times}$ 과제 이원 배치 분산 분석(two-way repeated ANOVA) 및 집단 ${\times}$ 언어의 이원 혼합 분산 분석(two-way mixed ANOVA)을 실시하였다. 그 결과, 언어 및 과제에 따라 균형적 이중언어 집단의 남녀 대상군 별로 상이한 결과가 나타났다. 여성의 경우 한국어보다 영어의 평균 기본주파수가 유의하게 높았으며(p=.003), 자발화과제보다 읽기 과제에서 평균 기본주파수가 유의하게 높았다(p=.002). 그러나 남성의 경우, 어떠한 조건에서도 유의한 결과가 나타나지 않았다. 두 번째로, 언어 능숙도에 따른 집단 간 비교에서 여성 대상자들에서만 언어 간 기본주파수 변화가 통계적으로 유의하게 나타났다(p=.000). 즉, 한국어 읽기 과제에서 평균 기본주파수가 영어 읽기 과제보다 유의하게 높았다. 그러나 언어 능숙도에 따른 평균 기본주파수의 변화는 통계적으로 유의하지 않았다(p=.830). 남성 대상자의 경우는 어떤 조건에서도 유의한 결과는 없었다. 결과적으로, 이중언어 화자의 언어 간 평균 기본주파수의 변화는 언어의 능숙도와 관계없이 성별에 따라 상이하게 나타났으며 본 연구를 바탕으로 언어 간 평균 주파수의 차이가 해부생리학적 요인이나 언어학적 요인보다도 사화문화적인 요인에 의한 것임을 생각해 볼 수 있도록 한다.

성종에 따른 발화 기본주파수와 발화 및 성악발성 시 성대접촉률의 차이 비교 (Differences in Speaking Fundamental Frequency for Voice Classification and Closed Quotient between Speaking and Singing)

  • 남도현;최홍식
    • 음성과학
    • /
    • 제15권4호
    • /
    • pp.147-157
    • /
    • 2008
  • Habitual speaking fundamental frequency (sF0) plays an important role in determining the voice classification, which can be presented differently depending on the vocal fold length and language habits. The purpose of this study, therefore, was to compare the differences in sF0 for voice classification and closed quotient between speaking and singing. Seventeen singers (7 sopranos, 5 tenors, 5 baritones, mean age 25.1 years) with no evidence of vocal folds pathology were participated. sF0 and closed quotient (CQ) both in speaking and in singing (A3-A5 with soprano, A2-A4 with tenor and baritone) were measured using SPEAD program and electroglottography. No significant differences were observed for sF0 between tenor and baritone groups (p> 0.05). However, CQ in singing was significantly different among three groups (p< 0.05), but CQ in speaking was not (p> 0.05). Furthermore, CQ was significantly different with both soprano (p< 0.01) and tenor groups ((P= 0.02) whereas baritone group revealed there is no difference when compared between speaking and singing. No significant differences in sF0 between tenor and baritone participants may result from decision-making for voice classification by experience and should measure sF0 before determining the voice classification.

  • PDF

음성장애 성인 여성과 정상음성 성인 여성 간 진성구와 가성구의 음성범위프로파일 비교 (Comparison of voice range profiles of modal and falsetto register in dysphonic and non-dysphonic adult women)

  • 김재옥;이승진
    • 말소리와 음성과학
    • /
    • 제14권4호
    • /
    • pp.67-75
    • /
    • 2022
  • 본 연구는 53명의 음성장애 성인 여성과 53명의 정상음성 성인 여성의 진성구와 가성구 음역대 및 진성구-가성구 성구전환이 발생하는 구간을 비교하였다. 최고기본주파수(F0MAX), 최고음성강도(IMAX), 기본주파수범위(F0RANGE) 및 음성강도범위(IRANGE) 모두 음성장애군이 정상음성군에 비해 유의하게 낮았다. 또한 두 집단 모두 F0MAX와 F0RANGE가 진성구에 비해 가성구가 유의하게 높았다. IMAX와 IRANGE는 정상음성군에서 가성구가 진성구보다 유의하게 높았으나 음성장애군은 진성구와 가성구 간에 차이가 없었다. F0MIN과 IMIN은 두 집단 간에 통계적으로 유의한 차이는 없었다. 진성구-가성구 성구전환이 발생하는 지점의 주파수는 음성장애군은 378.86Hz(F4#), 정상음성군은 557.79Hz(C5#)로 음성장애군이 유의하게 낮았다. 본 연구를 통해 음성장애가 있는 성인 여성의 진성구와 가성구 음역대 모두 정상음성 성인 여성에 비해 감소하여 성대가 고주파수에서 진동하기 어렵다는 것을 알 수 있다. 본 연구결과는 성인 여성 음성장애 화자의 진성구와 가성구의 VRP를 함께 살펴봄으로써 음성장애가 미치는 음향학적 특성을 파악하기 위한 기초자료로 사용될 수 있을 것이다.

변성이전, 변성 및 변성이후 남성의 발성범위 프로파일 (Voice range profile in premutation, mutation, and postmutation of men)

  • 김재옥;이승진
    • 말소리와 음성과학
    • /
    • 제13권4호
    • /
    • pp.89-100
    • /
    • 2021
  • 본 연구는 변성 과정의 남성 음역대 특성을 살펴보기 위해 변성이전(21명), 변성(16명), 변성이후(20명) 단계에 있는 57명의 남성을 대상으로 활창과 축약된 발성범위 프로파일(voice range profile, VRP)을 사용하여 음역대를 비교하였다. 또한 측정방법별로 진성구와 가성구 VRP의 차이를 비교하였다. 연구 결과, 평균기본주파수(F0)는 변성이전>변성>변성이후 순이었고, 최고기본주파수(F0max), 기본주파수범위(F0range), 최대음성강도(Imax) 및 음성강도범위(Irange)는 변성 단계에서 가장 낮았으며, 가성구가 진성구에 비해 높았다. 또한 대부분의 변수에서 활창이 축약된 VRP에 비해 높았으나 차이는 유의하지 않았다. 본 연구를 통해 변성 단계에 있는 남성은 변성기의 일시적인 후두의 해부학적 및 생리학적 변화로 인해 성대 진동이 불안정하게 됨으로써 음역대 또한 다른 연령대와 다른 양상을 보임을 알 수 있었다. 이와 더불어 활창을 이용한 VRP와 축약된 VRP 모두 검사자가 숙련된 경우에 임상에서 모두 사용하기에 적합하며, VRP 측정 시 가성구 외에도 진성구 범위까지 측정해야 한다는 사실을 확인하였다.

피치 기반 사운드-컬러이미지 변환에 관한 기초연구 (A Basic Study on the Pitch-based Sound into Color Image Conversion)

  • 강건우;김성일
    • 감성과학
    • /
    • 제15권2호
    • /
    • pp.231-238
    • /
    • 2012
  • 본 연구는 하나의 감각으로 인해 다른 영역의 감각을 불러일으키는 공감각 현상을 기초로 하여 사운드에서 컬러이미지를 유추하여 생성하는 응용 시스템의 구현을 최종 목표로 한다. 이를 위해 사운드의 특징정보인 기본주파수(F0, Fundamental Frequency)에서 음계(Scale) 및 옥타브(Octave) 성분을 추출한 후, HSI 컬러모델인 색상(Hue), 명도(Intensity) 성분에 각각 매핑한다. 본 논문에서 채도(saturation)값은 고정된 값을 사용한다. 이를 다시 RGB 컬러모델로 변환한 후 최종 BMP 포맷으로 컬러 이미지를 출력한다. 본 연구에서 제시한 사운드-컬러이미지 변환 방법을 토대로 기본 변환 시스템을 구현해 본 결과, 기본주파수에서 추출된 음계 및 옥타브 성분의 변화에 따라 색상 및 명도가 상이한 다양한 컬러가 나오는 것을 확인할 수 있었다. 또한 하드웨어적 구현을 위해 TMS320C6713 DSP Board에 포팅하여 실험한 결과 제안된 시스템의 시뮬레이션 결과와 동일한 컬러 이미지가 출력됨을 확인하였다.

  • PDF

한국인과 원어민 영어 발화의 F0 고저 범위 차이와 발음 평가에 있어서 그 역할 (Korean & Native Speakers' High -low Range Differences in F0 and its Role in Pronunciation Assessment)

  • 이석재;조철현;문선영
    • 음성과학
    • /
    • 제10권4호
    • /
    • pp.93-103
    • /
    • 2003
  • This study examines the high-low pitch range differences between Korean and native English speakers' utterances of 36 English sentences, and explores the role of the pitch fluctuation range in the pronunciation assessment. Findings are: i) Korean speakers implement half as much pitch fluctuation as the native speakers with the achievement rate of, on an average, 47%. Especially, pitch fluctuation range is below the average in the sentence types of exclamation, yes-no & wh-questions, ii) the reason why Korean speakers' pitch fluctuation range is only half the range of the native speakers is that Korean speakers do not raise the pitch at certain sentence positions so much as the native speakers, and iii) the range of pitch fluctuation plays an important role in distinguishing the utterances of the native speakers from those of Korean speakers, but does not in rating the English utterances among Korean speakers.

  • PDF

읽기과제에서 나타난 뇌성마비인의 기본주파수 및 진폭의 분포 특성 (Distributions on F0 and Amplitude of Persons with Cerebral Palsy in the Reading Task)

  • 남현욱;최양규
    • 대한음성학회지:말소리
    • /
    • 제66호
    • /
    • pp.1-20
    • /
    • 2008
  • The purpose of this study was to investigate the characteristics of fundamental frequency(F0) and amplitude distributions in persons with cerebral palsy(CP) in the reading task. Participants were divided into three groups: 6 persons with spastic CP, 6 persons with athetoid CP and 6 normal persons who are around 15-20 years old. On the results of this study, firstly, in F0 distributions, most of the spastic CPs tended to appear narrow distributions on the basis of mode, but most of the athetoid CPs were opposite, and both of the CP groups tended to distribute highly on lower and higher frequencies than mean and mode. On the other hand, normal persons had a tendency to appear narrow distributions on the basis of mode. Finally, in amplitude distributions, the spastic CPs showed a tendency that there are little differences between the distribution of mode and the others, and most of the athetoid CPs showed a tendency that the distributions of mode were higher than the others. In addition to, the normal persons had a tendency that the distributions of mode were remarkably higher than both of the CP groups.

  • PDF

체배기 이론을 이용한 Ka-대역 고조파 믹서 설계 (A Ka-band Harmonic Miter Design Using Multiplier Theory)

  • 고민호;강석엽;박효달
    • 한국통신학회논문지
    • /
    • 제30권11A호
    • /
    • pp.1104-1109
    • /
    • 2005
  • 본 논문에서는 주파수 채배기 이론에 근거하여 단일 능동소자로 입력된 기본 LO 주파수($f_{LO}$)의 3차 고조파 성분($3f_{LO}$)의 진폭이 최대가 되는 바이어스 전압을 선택하여 두 입력신호($f_{RF}$, $f_{LO}$)에 대해서 고차 출력신호성분($f_{RF}{\pm}3f_{LO}$)이 최대가 되는 고조파 먹서(harmonic mixer)를 설계 및 제작하였다. 제안된 설계 방법에 의해서 제작된 고조파 먹서는 플라스틱(Plastic) 패키지의 MESFET 소자를 사용하여 기존 Ka-대역에서 동작하는 믹서 회로들이 나타내는 높은 부품 가격, 생산성 및 회로의 복잡도 문제를 해결할 수 있었으며 RF 주파수신호($f_{RF}$=33.5GHz)에 대해서 LO 주파수 신호($f_{LO}$=11.5 GHz)의 3차 고조파 신호($3f_{LO}$=34.5 GHz)가 최대가 되는 게이트 바이어스 전압을 선택하여 중간주파수($3f_{LO}-f_{RF}$=1.0GHz)에서 -10 dB의 낮은 변환 손실 특성을 나타내었다.