• 제목/요약/키워드: 음성지수 모델

검색결과 15건 처리시간 0.032초

Joint CDMA/PRMA의 성능향상 기법에 관한 연구

  • 국광호;이강원;박정우;강석열
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2001년도 춘계 학술대회 논문집
    • /
    • pp.134-134
    • /
    • 2001
  • 이동통신 망을 통한 멀티미디어 통신의 수요 급증으로, 차세대 이동통신 시스템에서는 패킷 교환에 기초한 망 구조가 사용될 것으로 예측된다. VOD(Voice Activity Detector)를 갖는 음성 단말은 데이터를 발생시키는 talk spurt(평균이 t$_1$인 지수분포를 따름)와 데이터를 발생시키지 않는 silence period(평균이 t$_2$인 지수분포를 따름)의 두가지 상태를 갖는 마코프 체인으로 모델링된다. Goodman at. al.은 음성 단말들이 talk spurt동안만 데이터를 전송하게 함으로써 더 많은 가입자들을 수용할 수 있는 PRMA(Packet Reservation Multiple Access) 기법을 제안되었다. PRMA 방식에서는 시간 축이 슬롯들로 구성되며 여러개의 슬롯들로 프레임이 형성된다. Silence period 상태에 있던 음성 단말은 talk spurt 상태가 되면 talk spurt의 첫 번째 데이터를 하나의 슬롯을 통해 전송하게 된다. 이때 단말들은 각 슬롯에서 데이터를 전송할 수 있는 확률을 나타내는 채널 접근 확률(channel access probability)에 의해 데이터를 전송하게 되며 전송에 성공하면 슬롯을 예약함으로서 다음 프레임부터는 동일한 위치의 슬롯을 통해 데이터들을 전송하게 된다. DS/CDMA(Direct Sequence/code Division Multiple Access)는 이동통신 단말의 수용 용량상의 이점, 소프트 핸드오버 능력, 보다 용이하게 셀 계획을 세울 수 있는 점 등에 의해 차세대 이동통신 망에서 채택될 예정이다. CDMA 시스템은 간섭(interference)에 의해 용량이 제한을 받게 되며, MAI(Multiple Access Interference)가 시스템의 성능에 많은 영향을 미치게 된다. Brand, et. al.은 간섭의 분산을 줄이기 위해 PRMA 개념을 DS/CDMA 환경으로 확장한 Joint CDMA/PRMA 프로토콜을 제안하였다. 이때 각 슬롯에서의 데이터 전송확률을 그 슬롯에서 예약상태에 있는 음성 단말의 수에 의존하게 하는 방식을 사용하였으며 데이터 전송확률을 나타내는 채널 접근 확률들을 시뮬레이션을 통해 유도하였다. 한편 음성 단말에게는 실시간 서비스를 제공해 주어야 하는 대신 데이터 단말에게는 실시간 서비스를 제공해 주지 않아도 되므로, 트래픽이 많을 때에는 음성 단말의 데이터 전송에 우선권을 주는 것이 바람직하다. 이를 위해서 Brand, et. al.은 채널 접근 확률을 각 슬롯의 트래픽 상태에 따라 적응적으로 산출하는 기법을 제안하였다. 본 연구에서는 Joint CDMA/PRMA의 성능이 채널 접근 함수의 효율성에 많이 의존하게 되므로 보다 효율적인 채널 접근 확률을 구하는 방법을 제안한다. 즉 채널 액세스 확률을 각 슬롯에서 예약상태에 있는 음성 단말의 수뿐만 아니라 각 슬롯에서 예약을 하려고 하는 단말의 수에 기초하여 산출하는 방법을 제안하고 이의 성능을 분석하였다. 시뮬레이션에 의해 새로 제안된 채널 허용 확률을 산출하는 방식의 성능을 비교한 결과 기존에 제안된 방법들보다 상당한 성능의 향상을 볼 수 있었다.

  • PDF

리듬 및 유창성 지수와 한국 화자의 영어 읽기 발화 청취 평가의 관련성 (Relationships between rhythm and fluency indices and listeners' ratings of Korean speakers' English paragraph reading)

  • 정현성
    • 말소리와 음성과학
    • /
    • 제14권4호
    • /
    • pp.25-33
    • /
    • 2022
  • 이 논문은 리듬 및 유창성 지수와 한국 대학생이 읽은 영어 발화의 리듬 및 유창성 청취 평가가 어떤 관련성을 가지는지 분석한 연구이다. 이를 위해 대학생 17명이 'The North Wind and the Sun' 문단을 읽고 영어 발음 수업 사전, 사후 두 차례에 걸쳐 녹음한 것을, 대학원에 재학 중인 현직 영어 교사 및 예비 영어 교사 7명이 리듬 및 유창성에 대한 청취 평가를 진행하였다. 또, 선행 연구에서 언급된 리듬 및 유창성 지수 중 14개 지수를 사용해 각 발화 자료의 지수를 추출하여 지수와 청취 평가의 관련성을 분석하였다. 지수를 분석한 결과 %V, VarcoV, nPVIV에서는 선행 연구의 영어 원어민 지수와 거의 비슷한 양상을 보였고, ΔV, ΔC, VarcoC에서는 원어민보다 높았으며, 발화 속도는 원어민보다 느렸다. 한국 대학생들이 일부 리듬 지수에서는 영어 원어민과 비슷한 양상을 보인다고 할 수 있다. 리듬 및 유창성 지수를 사용하여 리듬 평가 점수와 유창성 평가 점수를 예측할 수 있는 최적의 모델을 탐색한 결과, 리듬 및 유창성 평가 모두에서 유창성 지수인 휴지 비율, 조음 속도, 발화 속도 등이 리듬 지수들보다 평가 점수를 예측하는데 더 큰 기여를 하는 것으로 나타났다.

이동전화망에서 호 도착 시간과 채널 보류 시간의 통계적 분석 (Statistical Analysis of Call Interarrival Time and Channel Holding Time in Cellular Telephony Network)

  • 엄태랑;장주욱;이경근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.478-480
    • /
    • 2003
  • 일반적으로 음성전화망에서 수학적 모델을 사용하여 트래픽 분석을 수행하는 경우 호 도착 시간과 채널 보류 시간은 지수 분포라고 가정한다. 본 논문에서는 이동전화망을 구성하고 있는 교환기에서 추출한 과금 데이터를 이용하여 호 발생으로 인해 집계되는 호량애 관한 호 도착 시간과 채널 보류 시간이 나타내는 분포를 알아본다. 또한 분석된 확률 분포를 통계적 검정 방법을 이용하여 경험분포함수에 대한 기대 분포함수의 적합성을 판별한다.

  • PDF

인공 감정 모델의 설계 (A Design of Artificial Emotion Model)

  • 이인근;서석태;정혜천;권순학
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.58-62
    • /
    • 2007
  • 인간이 생성한 음성, 표정 영상, 문장 등으로부터 인간의 감정 상태를 인식하는 연구와 함께, 인간의 감정을 모방하여 다양한 외부 자극으로 감정을 생성하는 인공 감정(Artificial Emotion)에 관한 연구가 이루어지고 있다. 그러나 기존의 인공 감정 연구는 외부 감정 자극에 대한 감정 변화 상태를 선형적, 지수적으로 변화시킴으로써 감정 상태가 급격하게 변하는 형태를 보인다. 본 논문에서는 외부 감정 자극의 강도와 빈도뿐만 아니라 자극의 반복 주기를 감정 상태에 반영하고, 시간에 따른 감정의 변화를 Sigmoid 곡선 형태로 표현하는 감정 생성 모델을 제안한다. 그리고 기존의 감정 자극에 대한 회상(recollection)을 통해 외부 감정 자극이 없는 상황에서도 감정을 생성할 수 있는 인공 감정 시스템을 제안한다.

  • PDF

잡음환경에서의 음성인식을 위한 모델 파라미터 변환 방식에 관한 연구 (A Study on a Model Parameter Compensation Method for Noise-Robust Speech Recognition)

  • 장육현;정용주;박성현;은종관
    • 한국음향학회지
    • /
    • 제16권5호
    • /
    • pp.112-121
    • /
    • 1997
  • 본 논문에서는 잡음에 강한 음성 인식기를 위한 모델 파라미터 변환 방식에 관하여 살펴보았다. 모델 파라미터 변환에 있어서 잡음에 대한 어떠한 통계 모델도 사용하지 않고 각 단어 단위로 수행되어 실시간 음성 인식이 가능하도록 하였다. Parallel model combination(PCM)은 본 논문에서 제안한 방법과의 성능 비교를 위하여 cepstrum 영역에서 구현되었다. 본 논문에서 제안한 PCM 방법은 modified PCM(MPMC)라 하며, 이 방법은 각 hidden Markov mode(HMM)의 state별로 평균적인 가우시안 믹스처(Gaussian mixture)의 변화률과 개별적인 변화률간에 결합지수를 이용하여 평균을 재조정한다. 또한, vector Taylor series 근사화를 이용한 모델 파라미터 변환을 위하여 cepstrum 영역에서의 환경모델 예측을 위한 expectation-maximization(EM) 해를 유도하여 구현하였다. 본 논문에서 구현된 알고리즘들의 성능 위해 HMM 인식기를 이용한 화자독립 고립단어 인식을 수행하였다. 시용된 잡음은 가우시안 백색 잡음과 주행중에 녹음된 자동차 잡음이며, 각 잡음울 signal-to-noise ratio(SNR)별로 사용하였다. 잡음의 모델은 1 state HMM으로 단어시작 3 프레임(frame)을 이용하여 만들어졌다. 인식 결과는 VTS 접근방식을 이용하였을 경우 매우 우수한 인식률을 나타내었으며, MPMC의 경우도 기존의 PMC보다 인식률이 향상되었다. 특히, 영차 VTS의 경우는 단순히 평균만을 조정하였음에도 불구하고 PMC와 MPMC보다 인식률이 우수하게 나타났다.

  • PDF

심층신경망 기반의 음성인식을 위한 절충된 특징 정규화 방식 (Compromised feature normalization method for deep neural network based speech recognition)

  • 김민식;김형순
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.65-71
    • /
    • 2020
  • 특징 정규화는 음성 특징 파라미터들의 통계적인 특성의 정규화를 통해 훈련 및 테스트 조건 사이의 환경 불일치의 영향을 감소시키는 방법으로서 기존의 Gaussian mixture model-hidden Markov model(GMM-HMM) 기반의 음성인식 시스템에서 우수한 성능개선을 입증한 바 있다. 하지만 심층신경망(deep neural network, DNN) 기반의 음성인식 시스템에서는 환경 불일치의 영향을 최소화 하는 것이 반드시 최고의 성능 개선으로 연결되지는 않는다. 본 논문에서는 이러한 현상의 원인을 과도한 특징 정규화로 인한 정보손실 때문이라 보고, 음향모델을 훈련 하는데 유용한 정보는 보존하면서 환경 불일치의 영향은 적절히 감소시켜 음성인식 성능을 최대화 하는 특징 정규화 방식이 있는 지 검토해보고자 한다. 이를 위해 평균 정규화(mean normalization, MN)와 평균 및 분산 정규화(mean and variance normalization, MVN)의 절충 방식인 평균 및 지수적 분산 정규화(mean and exponentiated variance normalization, MEVN)를 도입하여, 잡음 및 잔향 환경에서 분산에 대한 정규화의 정도에 따른 DNN 기반의 음성인식 시스템의 성능을 비교한다. 실험 결과, 성능 개선의 폭이 크지는 않으나 분산 정규화의 정도에 따라 MEVN이 MN과 MVN보다 성능이 우수함을 보여준다.

1/10 축소모형을 이용한 소공연장의 흡음재와 확산체의 적용위치에 따른 음향성능 비교 (Comparison of Acoustic Performance Depending on the Location of Sound Absorptive and Diffuser in Small Auditoriums Using 1/10 Scale Models)

  • 김태희;박찬재;박지훈;한찬훈
    • 한국음향학회지
    • /
    • 제34권2호
    • /
    • pp.146-156
    • /
    • 2015
  • 본 연구는 흡음재와 확산체의 적용위치가 소공연장의 음향성능에 미치는 영향에 대하여 알아보았다. 서울의 대학로의 2000년 이후 개관한 36곳의 공연장의 평균크기로 소공연장의 표준모델을 설정하여 연구를 진행하였다. 본 연구에서는 마감재 적용유효면적이 가장 작은 뒷벽을 기준으로 마감재의 적용면적을 산출하고, 마감재의 적용위치별 음향성능 변화를 분석하기 위하여 천장, 측벽의 적용위치를 전반부, 중반부, 후반부로 구분하여 총 8가지의 경우를 만들어, 1/10 축소모형실험을 진행하였다. 사용된 음향지표는 잔향시간(Reverberation Time, RT), 초기감쇠시간(Early Decay Time, EDT), 음악명료도(Clarity, C80), 음성명료도(Definition, D50), 음성전달지수(Speech Transmission Index, STI)를 이용하였다. 실험결과 마감재의 적용위치 변화는 소리의 울림에 양과 관련된 음향인자인 잔향시간, 초기감쇠시간 은 최소 변화 감지폭에 의한 (Just Noticeable Difference, JND) 평가시 변화가 뚜렷하게 나타났고, 소리의 명료도와 관련된 인자인 음악명료도, 음성명료도, 음성전달지수는 변화가 거의 없는 것으로 나타났다. 짧은 잔향시간을 얻고자 하는 경우 흡음재와 확산체 적용시 모두 측벽부분을 통한 잔향시간 조절이 가장 효과적이며, 측벽 전반부가 가장 짧은 잔향시간을 얻을 수 있는 위치인 것으로 나타났다.

PMC 방식에서의 분별적 학습을 이용한 잡음 음성인식에 관한 연구 (A Study on Noisy Speech Recognition Using Discriminative Training for PMC Algorithm)

  • 정용주
    • 한국음향학회지
    • /
    • 제19권2호
    • /
    • pp.83-89
    • /
    • 2000
  • 본 논문에서는 기존의 PMC 알고리듬을 분별적으로 적응하는 방법을 제시하여 인식율의 향상을 이루었다. PMC의 분별적인 적응을 위하여 PMC의 변형인 modified PMC 방식을 채택하였고, 여기에서 각 HMM의 상태 및 mixture 에 따른 고유한 결합지수를 분별적으로 학습하는 방법을 취하였다. 인식 실험결과 제안된 방식은 기존의 PMC보다 우수한 성능을 보였을 뿐만 아니라 또 따른 모델 변환기법인 STAR 방식에 비해서도 낮은 SNR인 경우와 적응데이터가 충분하지 않은 경우에는 더 나은 결과를 나타냄을 알 수 있었다.

  • PDF

2020년 8월 토석류 발생지역의 이동확산범위 분석 (Analysis of debris flow movement and diffusion zone, on August 2020)

  • 김민석;안현욱;이승준;김지수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.235-235
    • /
    • 2021
  • 아시아 몬순기후의 영향에 의해 우리나라는 2020년 7월부터 9월까지 약 90일간의 장마로 인해 크고 작은 수재해가 발생하였다. 특히, 안성, 충주, 음성 그리고 곡성 등에서 인명피해가 발생하였으며, 그 외 13개소에서 많은 재산 피해가 발생하였다. 2020년 산사태/토석류 재해로 인한 전국적인 피해액은 약 3,900억으로 보고되고 있으며, 매년 집중호우에 의해 피해 양상이 변하고, 도시지역에서의 발생이 빈번하게 늘고 있다. 집중호우에 의한 산사태/토석류 전이 피해를 저감시키기 위해서는 발생 물질이 어디까지 이동할 수 있는지에 대한 위험범위확산에 대한 연구가 중요하며, 이런 연구를 기반으로 인명피해를 줄이기 위한 연구가 필요하다. 이를 위해 본 연구에서는 천수방정식, 유변학특성 식 그리고 연행침식 식을 조합하여 개발된 적응형 격자기반 2차원 토석류 모델을 이용하여 안성, 음성 그리고 단성지역에서 발생했었던 산사태/토석류 전이 피해 양상을 해석하였다. 산사태 발생 후 2~3일 이내에 지표 지질 및 지형 조사를 실시하였으며, UAV 및 항공사진을 이용하여 산사태 및 토석류의 형태를 맵핑하였다. 지질 및 지형조사 시 간이 Vein tester를 이용하여 야외에서 토양 물성관련 자료를 취득하였으며, 토석류의 이동 흔적(나무 등에의 토석류 타격 흔적)을 이용하여 조사지점에서의 최대 토석류 흐름 깊이를 추정하였다. 정확한 토석류의 유속에 대한 자료 부족으로 2011년 우면산에서 발생한 약 26m/s의 속도를 이용하여 토석류의 흐름 특성을 계산하였다. 이와 더불어 연행침식의 계산을 위해 발생지점 부터 토석류가 퇴적된 하류부까지 기반암의 노출 및 퇴적 정보를 통해 최대 침식 깊이를 추정하여 입력자료로 활용하였다. 토석류 맵핑자료와 비교 결과 정확도가 90%이상으로 나타났으며, 토석류 발생 후 안성 200초, 음성 180초 그리고 단성 180초 이내로 토석류가 하류까지 이동할 수 있는 것으로 계산되었다. 본 연구와 같이 산사태/토석류 발생 메커니즘 해석에 대한 지속적인 연구를 통해 산지 재해에 의한 인명 피해를 줄일 수 있는 토석류확산범위 해석에 대한 연구가 지속적으로 필요할 것으로 판단된다.

  • PDF

불균형 클래스에서 AutoML 기반 분류 모델의 성능 향상을 위한 데이터 처리 (Data Processing of AutoML-based Classification Models for Improving Performance in Unbalanced Classes)

  • 이동준;강지수;정경용
    • 융합정보논문지
    • /
    • 제11권6호
    • /
    • pp.49-54
    • /
    • 2021
  • 최근 스마트 헬스케어 기술의 발전에 따라 일상적인 질환에 대한 관심이 증가하고 있다. 이에 따라 헬스케어 데이터를 통해 예측 모델로 질병을 분석하거나 예측하는 연구들이 증가하고 있다. 그러나 헬스케어 데이터에는 양성 데이터와 음성 데이터의 불균형이 존재한다. 이는 특정 질환을 가진 환자에 비하여 상대적으로 환자가 아닌 사람이 많아 데이터 수집에 어려움이 있어 발생하는 현상이다. 데이터 불균형은 질병 예측 및 탐지 시 진행하는 모델의 성능에 영향을 끼치기 때문에 이를 제거할 필요가 있다. 따라서 본 연구에서는 오버샘플링과 결측값 대치를 통해서 데이터 불균형을 해소한다. AutoML을 기반으로 여러 모델의 성능을 파악하고 모델 중 상위 3개의 모델을 앙상블한다.