• 제목/요약/키워드: 음성 특징

검색결과 1,122건 처리시간 0.045초

구어체 정서표현에 있어서의 음성 특성 연구 (A study on the vocal characteristics of spoken emotional expressions)

  • 이수정
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1999년도 추계학술대회 논문집
    • /
    • pp.277-291
    • /
    • 1999
  • 현 연구에서는 음성합성의 기초자료 수집을 위하여 대화체 감정표현의 음성적인 패러미터를 찾아내려고 시도하였다. 이를 위하여 일단 가장 자주 사용되는 대화체 감정 표현자료가 수집되었고 이들 표현을 발화할 때 가장 주의를 기울이는 발성의 특징들이 탐색되었다. 구어체적 감정표현의 타당한 데이타베이스를 작성하기 위하여 20대와 30로 연령층을 구분하여 자료를 수집, 분석하였다. 그 결과 다양한 감정표현의 발화특성들은 음의 강도, 강도변화, 그리고 음색이 중요한 기준으로 작용하는 것으로 나타났다. 다차원 분석 결과 산출된 20대와 30대의 음성표현의 도면은 개별정서들이 음성의 잠재차원 상에서 상당한 일관된 특징을 지님을 보여 주었다.

  • PDF

성대결절이 있는 서양음악을 전공한 성악도의 발성에 대한 음성분석학적 특징

  • 진성민;김대영;이경철;이용배
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1998년도 제10회 학술대회 심포지움
    • /
    • pp.181-181
    • /
    • 1998
  • 목적 : 성대결절이 있는 서양음악을 전공한 성악도들의 발성시 음향학적 특징과 문제점을 알아보고자 하였다. 대상 및 방법 : 음악대학교 성악과에서 소프라노를 전공하는 학생으로, 음성장애로 인하여 치료를 받은 과거력이 없으면서 성대화상술 검사상 성대결절이 확인된 18세부터 25세 사이의 여학생 10명을 대상군으로 하고, 성대결절이 없는 성악도 20명을 대조군으로 하여 평소 발성상의 문제점과 연주시의 문제점에 대한 설문조사와 음성분석을 시행하였다. (중략)

  • PDF

음향학적 모델에 의한 스펙트럼 필터 알고리즘 (Spectrum Filter Algorithm based on Acoustic Model)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.770-772
    • /
    • 2016
  • 본 논문에서는 음성신호처리 시스템에 유용하게 사용되는 음성신호의 특징 파라미터를 출력하는 스펙트럼 필터모델을 사용하여, 배경잡음 환경 하에서 음성신호 중의 잡음을 제거하는 알고리즘을 제안한다. 따라서 본 논문에서는 배경잡음을 제거할 때 고려해야 할 인간의 청각특성이 포함된 음성의 진폭 스펙트럼에 의한 청각필터의 특성을 도입한다. 본 논문의 실험에서 사용한 성능평가의 방법으로는 음절 명료도의 테스트에 적합한 주관적인 평가인 주파수 영역에서의 스펙트럼 왜곡률(Spectral Distortion, SD)을 사용하여 실험결과를 비교하고 고찰한다.

  • PDF

스마트폰환경에서 음성기반 감정인식 프레임워크 (Speech Emotion Recognition Framework on Smartphone Environment)

  • 방재훈;이승룡;정태충
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.254-256
    • /
    • 2013
  • 기존의 음성기반 감정인식 기술은 충분한 컴퓨팅 파워를 가진 PC에서 수백개의 특징을 사용하여 감정을 인식하고 있다. 이러한 음성기반 감정인식 기술은 컴퓨팅 파워에 제약이 많은 스마트폰 환경을 고려하지 않은 방법이다. 본 논문에서는 제한된 스마트폰 컴퓨팅 파워를 고려한 음성의 특징 추출 기법과 서버 클라이언트 개념을 도입한 효율적인 음성기반 감정인식 프레임워크를 제안한다.

한국어 노인 음성 데이터 증강 및 인식 연구 (A Study of Data Augmentation and Auto Speech Recognition for the Elderly)

  • 김건희;박서윤;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.56-60
    • /
    • 2023
  • 기존의 음성인식은 청장년 층에 초점이 맞추어져 있었으나, 최근 고령화가 가속되면서 노인 음성에 대한 연구 필요성이 증대되고 있다. 그러나 노인 음성 데이터셋은 청장년 음성 데이터셋에 비해서는 아직까지 충분히 확보되지 못하고 있다. 본 연구에서는 부족한 노인 음성 데이터셋 확보에 기여하고자 희소한 노인 데이터셋을 증강할 수 있는 방법론에 대해 연구하였다. 이를 위해 노인 음성 특징(feature)을 분석하였으며, '주파수'와 '발화 속도' 특징을 일반 성인 음성에 합성하여 데이터를 증강하였다. 이후 Whisper small 모델을 파인 튜닝한 뒤 노인 음성에 대한 CER(Character Error Rate)를 구하였고, 기존 노인 데이터셋에 증강한 데이터셋을 함께 사용하는 것이 가장 효과적임을 밝혀내었다.

  • PDF

음성 인식기를 위한 다양한 특징 파라메터의 SVM 인식 성능 비교 (Recognition Performance Comparison to Various Features for Speech Recognizer Using Support Vector Machine)

  • 김평환;박정원;김창근;이광석;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.78-81
    • /
    • 2003
  • 본 논문은 SVM(support vector machine)을 이용한 음성인식기에 대해 효과적인 특징 파라메터를 제안한다. SVM은 특징 공간에서 비선형 경계를 찾아 분류하는 방법으로 적은 학습 데이터에서도 좋은 분류 성능을 나타낸다고 알려져 있으며 최적의 특징 파라메터를 선택하기 위해 본 논문에서는 SVM을 이용한 음성인식기를 사용하여 PCA(principal component analysis), ICA(independent component analysis) 알고리즘을 적용하여 MFCC(met frequency cepstrum coefficient)의 특징 공간을 변화시키면서 각각의 인식 성능을 비교 검토하였다. 실험 결과 ICA에 의한 특징 파라메터가 가장 우수한 성능을 나타내었으며 특징 공간에서 각 클래스의 분포도 또한 ICA가 가장 높은 선형 분별성을 나타내었다.

  • PDF

화자인식을 위한 어트랙터로 부터의 음성특징추출 (Feature Extraction from the Strange Attractor for Speaker Recognition)

  • 김태식
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권2E호
    • /
    • pp.26-31
    • /
    • 1994
  • 화자인식을 위한 음성특징을 카오스의 어트랙터와 신경망를 이용해서 추출하는 방법을 제시한다. 기존의 음성신호 표현방법과 특징 추출법은 음성인식 시스템에서 별 무리가 없이 사용되었으나 2차원 표현에서 오는 한계는 아직까지 극복해야할 과제로 남아있다. 본 연구에서는 최근 각광받고있는 새로운 시그날표현기법인 카오스이론이 스트레인저 어트랙터를 이용하여 음성특징을 추출하는 화자인식시스템에 적용하고자 한다. 입력된 음성신호는 3차원 공간안에서 어트랙터라 불리우는 기하학적인 형태로 표현되는데 이 3차원 어트랙터를 이용하면 기존의 2차원적인 표현으로부터 얻는 특징보다 더 많은 정보를 추출할 수 있을 것이다. 특징추출 기법은 3가지를 제안하였고 각 기법으로 추출된 특징벡터는 신경회로망을 통해 학습되어 인식률을 실험하였다. 제시한 기법들에 따라 다르나 인식률은 약 82%부터 96%까지 나타났다.

  • PDF

복소 스펙트럼 기반 음성 향상의 성능 향상을 위한 time-frequency self-attention 기반 skip-connection 기법 연구 (A study on skip-connection with time-frequency self-attention for improving speech enhancement based on complex-valued spectrum)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권2호
    • /
    • pp.94-101
    • /
    • 2023
  • 음성 향상에서 많이 사용되는 U-Net과 같이 인코더와 디코더로 구성된 심층 신경망 모델은 skip-connection을 통해 인코더의 특징을 디코더에 연결하는 구조로 구성되어 있다. Skip-connection은 디코더에서 향상된 스펙트럼을 재구성하는데 도움을 주며 인코더를 통해 손실된 정보를 보완해줄 수 있다. 이때 skip-connection을 통해 연결되는 인코더의 특징과 디코더의 특징의 의미는 서로 다르다. 본 논문에서는 복소 스펙트럼 기반 음성 향상의 성능 향상을 위해 디코더에 연결되는 인코더의 특징을 디코더 특징의 의미에 가깝게 변환해주도록 skip-connection에 Self-Attention(SA)을 적용하는 방안을 연구하였다. SA는 시퀀스-시퀀스 문제에서 출력 시퀀스를 생성할 때, 입력 시퀀스의 가중 산술 평균을 이용하여 결정적인 부분을 집중해서 볼 수 있도록 하는 기법으로, 음성 향상 분야에서도 이를 적용함으로써 성능 향상에 효과적임을 입증하는 연구가 진행되었다. SA를 skip-connection에 적용하기 위해 인코더 특징과 디코더 특징을 이용하는 총 3가지의 방법에 대해 연구하였다. TIMIT 데이터베이스를 이용한 음성 향상 실험 결과, 제안하는 방법이 기존 skip-connection으로만 연결된 Deep Complex U-Net(DCUNET)과 비교하여 모든 성능 평가 지표에서 향상된 결과를 보였다.

유ㆍ무성음 척도를 포함한 재구성 특징 파라미터의 음성 인식 성능평가 (Performance Evaluation of Speech Recognition Using the Reconstructed Feature Parameter with Voiced-Unvoiced Measure)

  • 이광석;한학용;고시영;허강인
    • 한국정보통신학회논문지
    • /
    • 제7권2호
    • /
    • pp.177-182
    • /
    • 2003
  • 본 연구는 유사음에 강인한 음성인식을 위하여 음성의 유ㆍ무성음 척도를 특징 파라미터에 추가 구성하여 음절과 음소단위의 음성인식을 행하였다. 이를 위하여 피치검출에 이용되는 알고리듬인 HPS(Harmonic Product Spectrum)의 스펙트럼 정보를 이용하여 유ㆍ무성음의 정도를 나타내는 척도를 제안한다. 제안된 척도는 HPS의 첨도와 피크의 개수 그리고 높이척도이다. 이들 척도 값을 포함하여 특징 파라미터를 재구성하고 제안된 특징의 유효성을 검증하기 위하여 CVC형 유사 음절 DB하에서 기존 특징 파라미터와 비교하여 음성인식 실험을 행하였다.

실험실 환경 음성을 이용한 전화음성 인식에 관한 연구 (Telephone Speech Recognition Using Laboratory Environment Speech Data)

  • 윤상호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.391-394
    • /
    • 1994
  • 본 연구에서는 전화선을 통한 음성인식을 위해 저잡음의 실험실 환경에서 수집된 음성 자료를 이용하는 접근을 하였다. 전화 음성과 실험실 음성 간의 특성 차이를 보정하기 위해 선형 회귀 분석법을 이용한 SDCN을 제안하였다. 두 자료간의 보정은 동시 녹음된 실험실 환경의 음성과 전화음성의 SNRDP 따른 두 자료간의 차이를 최소화하는 변환행렬을 구해, 이를 학습자료의 변환에 이용한다. 제안된 방법의 타당성을 확인하기 위해 두가지 인식 알고리즘인 DTW와 이산 HMM 에 대해 실험하였다. DTW를 통한 인식에서개선된 SDCN 에 의한 특징벡터의 변환은 기존의 SDCNDP 따른 특징변환보다 8~17%의 인식률이 향상되었다. 이산 HMM으로 인식할 때는 개선된 SDCNDP 의한 전화음성과 실험실 음성과의 유사도를 보다 잘 나타내기 위해 개선된 SDCN을 적용하고, VQ 코드열 상에서이 코드 사상법을 사용하여 인식률의 향상시켰다.

  • PDF