통합 검색 | Korea Science

교사 학생 심층신경망을 활용한 다채널 원거리 화자 인증 (Multi channel far field speaker verification using teacher student deep neural networks)

정지원;허희수;심혜진;유하진
- 한국음향학회지
- /
- 제37권6호
- /
- pp.483-488
- /
- 2018
원거리 발성은 화자 인증 시스템의 성능을 하락시키는 주요 요인으로 알려져 있다. 본 논문에서는 교사 학생 학습을 이용하여 원거리 발성에 의한 화자 인증 시스템의 성능 하락을 보상하는 기법을 제안한다. 교사 학생 학습은 미리 학습된 교사 심층신경망의 출력과 학생 신경망의 출력이 같아지도록 학생 신경망을 학습하는 기법이다. 여기서 교사 신경망에는 근거리 발성을, 학생 신경망에는 원거리 발성을 입력한 뒤, 두 신경망의 출력을 동일하게 만드는 과정을 통해 원거리 발성을 보상할 수 있을 것이라고 기대하였다. 하지만 원거리 발성을 보상하는 과정에서, 근거리 발성에 대한 인식률이 저하되는 현상을 실험적으로 발견하였다. 위와 같은 현상을 예방하기 위해 본 논문에서는 교사 심층신경망을 학생 심층신경망의 초깃값으로 사용하는 기법과 학생 심층신경망을 근거리 발성에 대해서도 학습하는 기법을 제안하였다. 모든 실험은 원 음성을 입력 받는 심층신경망을 활용해 수행하였다. 동일한 발성을 각각 4 채널로 근거리와 원거리에서 자체적으로 수집한 문장 종속 데이터셋을 활용하였다. 동일 오류율을 기준으로 근거리 / 원거리 발성에 대한 화자 인증 성능을 평가한 결과 교사 학생 학습을 사용하지 않을 경우 2.55 % / 2.8 %, 기존의 교사 학생 학습을 사용할 경우 9.75 % / 1.8 %, 제안한 기법들을 적용한 경우 2.5 % / 2.7 %의 오류율을 확인하였다.
https://doi.org/10.7776/ASK.2018.37.6.483 인용 PDF KSCI HTML

시간축 변환을 이용한 음성 인식기의 성능 향상에 관한 연구 (Study on the Improvement of Speech Recognizer by Using Time Scale Modification)

이기승
- 한국음향학회지
- /
- 제23권6호
- /
- pp.462-472
- /
- 2004
본 논문에서는 자동 음성 인식기의 성능 저하를 일으키는 요인으로서 발성 속도의 변동에 따를 성능 저하를 보상하기 위한 기법을 제안하였다. 새로운 기법의 제안에 앞서서. 먼저 발성 속도의 변화에 따른 기존의 은닉 마코프 모델을 이용한 음성 인식기의 성능을 정량적으로 분석하였다. 이러한 분석을 통해 발성 속도에 따른 유의한 성능 저하를 관찰하고, 주어진 음성으로부터 발성 속도를 정량적으로 나타낼 수 있는 변수를 도입하였다. 발성 속도를 학습 시 사용한 음성과 유사하게 변화시키기 위해 본 논문에서는 음성 신호에 대한 시간축 변환을 사용하였으며, 최종적으로 발성 속도에 따라 선택적으로 시간축 변환을 적용하여 발성 속도의 변동에 따른 음성 인식의 성능 저하를 보상할 수 있는 기법을 제안하였다. 10자리의 이동통신용 전화번호를 이용한 음성 인식의 실험을 통해, 제안된 기법은 빠르게 발성하는 음성에 대해 15.5％의 오류율 감소를 가져오는 것을 확인할 수 있었다.
PDF KSCI

음성검사 중 공기역학적 검사에서 한국인 정상 평균치 (Mean Value of Aerodynamic Study in Normal Korean)

서장수;송시연;권오철;정옥란
- 대한음성언어의학회:학술대회논문집
- /
- 대한음성언어의학회 1996년도 제6회 학술대회 심포지움
- /
- pp.79-79
- /
- 1996
최근 들어 음성에 대한 일반인들의 관심이 높아지면서 음성이상을 호소하며 이비인후과 외래를 방문하는 환자가 점차적으로 증가하는 추세에 있다. 그러나 이러한 음성이상을 객관적으로 평가할 수 있는 기준이 국내에는 거의 없는 실정이다. 이에 저자들은 본 연구에서 기왕력 상 폐질환이나 신경계질환, 후두질환을 앓은 적이 없으며 음성조율 기관에 이상이 없고 정상적인 청력을 가진 10세에서 69세까지의 무작위 추출된 정상 한국인 남자 112명과 여자 122명을 대상으로 Aerophone II voice function analyzer를 이용하여 공기역동학적 검사 중 최대발성지속시간(maximum phonation time), 평균호기류율(mean airflow rate), 발성율(phonation quotient), 발성시 기류량(phonatory flow volume) 및 성문하압(subglottal pressure)의 정상 한국인의 남녀 년령별 평균치를 측정하고자 하였다. (중략)
PDF

주파수 에너지를 이용한 텍스트 독립 화자인식에 관한 연구 (A Study on the Text-Independent Speaker Recognition Using Frequency Energy)

조연아
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
- /
- pp.235-240
- /
- 1994
모음 검출을 통하여 미리 등록한 단어가 아닌 경우에도 화자를 인식할 수 있도록 특징 파라메터를 개발하고, 실용화가 가능하도록 처리 방법을 간략화한 텍스트 독립 화자 인식 연구를 진행하였다. 이를 위해서, 화자가 발성한 음성에서 모음을 검출하여 화자인식에 사용하는 방법을 제안하였으며, 인식은 각 화자가 발성한 음성 신호에서 모음을 검출한 다음, 검출된 모음의 29 채널의 주파수 에너지를 퍼지값으로 효현한 후, 퍼지 추론을 적용하여 수행하였다. 실험을 위해 모음 검출 알고리듬을 개발하였으며, 화자인식의 특징 파라메터로 29 채널 주파수 에너지를 제안하였는데, 별도의 코드북 없이 사용이 가능하고, 기존의 파라메터에 비해 인식율이 높으면서도 구성 및 계산이 간단한 특징이 있다. 실험결과, 미리 작성된 표준패턴과 동일한 단어를 사용한 텍스트 의존 화자 인식 실험은 95.5% 인식율을 보였고, 표준 패턴과 다른 종류의 단어를 사용한 텍스트 독립 화자인식 실험은 94.2% 인식율을 보이고 있다.
PDF

자연기흉의 임상적 고찰 (Clinical Analysis of Spontaneous Pneumothorax)

손지웅;박재용;김관영;채상철;강태경;박기수;김창호;정태훈
- Tuberculosis and Respiratory Diseases
- /
- 제47권3호
- /
- pp.374-382
- /
- 1999
연구배경: 자연기흉은 임상에서 흔히 접하는데도 불구하고 기흉의 위험인자, 재발율, 임상양상, 치료에 대한 반응과 예후와의 관계를 조사한 연구는 드물다. 방법: 경북대학교병원에서 1996년 1월부터 1997년 12월까지 자연기흉으로 진단받은 225예를 대상으로 기흉의 크기, 폐허탈의 분포, 흉관삽관술 시행빈도 등을 $17{\pm}7.8$개월 추적기간 동안 재발율과 재발의 위험인자를 조사하였다. 결과: 원발성과 자연기흉은 저체중인 환자가 많았으며, 홉연력은 속발성 자연기흉에서 유의하게 많았다(p<0.05). 속발성 자연기흉의 기저질환은 비활동성 폐결핵이 68%로 가장 많았고, 활동성 폐결핵 12.4%, 만성폐쇄성폐질환 11.3% 순이었다. 기흉의 기왕력은 원발성 자연기흉의 경우 28.9%에서, 그리고 속발성 자연기흉의 경우는 25.8%에서 있었다. 폐허탈의 분포는 속발성에서 원발성 자연기흉에 비해 국소형이 유의하게 많았다(p<0.05). 흉관삽관을 시행한 경우는 원발성과 속발성 자연기흉에서 각각 96.8%와 97.9%였으며, 추가적인 흉관 삽관이 필요했던 경우는 원발성 6.4%와 속발성 18.0%로 속발성 자연기흉에서 유의하게 많았다 (p<0.05); 흉관 유치기간은 원발성의 경우 $7.5{\pm}6.57$일인데 비해 속발성은 $18.2{\pm}19.59$일로 속발성 자연기흉에서 유의하게 길었다(p<0.05). 수술적 치료는 원발성 자연기흉의 22.7%, 그리고 속발성 자연기흉의 10.3%에서 시행하였으며, 수술 원발성의 경우 기흉이 기왕력이 있는 경우가 가장 많은 반면 속발성의 경우는 치료실패가 가장 많았다. 보존적인 치료를 방은 경우 재발율은 원발성의 경우 16.5%, 11.8%였으며, 원발성 자연기흉의 재발율은 남자, 흡연자, 저체중에서 높았다. 결론 : 자연기흉의 재발율을 감소시키기 위해서는 수술적 치료 등의 보다 적극적인 치료가 필요할 것으로 생각된다.
PDF

원발성 폐동맥 육종 (Primary Pulmonary Artery Sarcoma A Case Report -A Case Report-)

김성완;구본원
- Journal of Chest Surgery
- /
- 제30권10호
- /
- pp.1036-1039
- /
- 1997
원발성 폐동맥 육종은 드물며, 흔히 폐동맥 색전증으로 오진하기 쉽다. 예후는 매우 좋지않아서 치료하지 않았을 때의 생존율이 약 1.5개월이며,수술후에도 생존율을 일년정도까지 연장할 수있다. 본 교실에서는 원발성 폐동맥 육종을 1례 치험하였기에 보고하고자 한다. 환자는 55세 여자로 주증상은 호흡곤란, 우측흉통, 및 객혈이었다. 술전 흉부 전산화단층촬영상 폐동맥 색전증과 유사한 종괴음영을 나타내었다. 수술은 부분 체외순환하에 폐동맥 성형술과 우측전폐 절제술이 시행되었다. 술후 조직학적 진단은 미분화 육종이었고, 증상은 다소 호전되었으나 술후 3개월에 원인 미상으로 사망하였다.
PDF

전기 Glottographyy(EGG)에 의한 후두구 음력학적 특성 (The Role of the Electroglottography on Laryngeal Articulatory Dynamics)

홍기환;김현기
- 대한음성언어의학회:학술대회논문집
- /
- 대한음성언어의학회 1996년도 제6회 학술대회 심포지움
- /
- pp.93-93
- /
- 1996
최근 많은 음성검사기들의 개발에 의해 발성의 원리에 대한 많은 연구가 진행되었고 실제 임상에 이용되므로써 각종 음성질환의 기전을 연구하는데 많은 도움이 되어왔다. 그중 전기 glottogra-phy(EGG)는 값싸고 완전히 noninvasive한 음성검사기로서 각종 음성질환에 대해 진단, 치료 및 예후판정 등에 이용되어왔으며, 또한 정상 발성시의 성대진동 기전에 대해 연구되어왔다. 그러나 판독하는데 있어 실제 많은 논란이 있는데 이러한 논란은 복잡한 성 대진동 양상에 의해 생기는 것으로 EGG에 의한 양측 성대 사이의 전기 저항도는 실제 성문의 열림의 정도를 의미하는 것이 아니라 성문접촉율을 의미하기 때문이다. (중략)
PDF

질의 원발성 악성 흑색종: 증례보고 (Malignant Melanoma of the Vagina: A Report of 2 Cases)

김옥배;김진희;정영연;조치흠;최태진
- Radiation Oncology Journal
- /
- 제23권2호
- /
- pp.111-115
- /
- 2005
질에서 발생하는 원발성 악성 흑색종은 희귀한 질환으로, 높은 국소 재발률과 조기 전이로 인하여 매우 나쁜 예후를 보인다. 전통적으로 높은 국소 재발율과 낮은 생존율의 개선을 위하여 질 절제술, 골반 내용 제거술 및 서혜부 임파절제술과 같은 근치적 수술을 시행하였으나, 재발률 및 생존율의 개선에 실패하였다. 그러나 최근 광범위 국소 제거술 및 소분할조사법으로 근치적 수술과 유사하거나 향상된 생존율이 보고되고 있다. 또한 병소의 크기가 3 cm 이하인 경우는 일차적 방사선치료만으로도 수술적 절제술과 유사한 생존이 가능하다고 하였다. 저자들은 질에서 발생한 원발성 악성 흑색종에 방사선치료를 시행한 2예를 경험하였기에 문헌 고찰과 함께 보고하고자 한다.
PDF KSCI

가변전송률 CELP 부호화기 설계를 위한 발성률 비교 분석에 관한 연구 (A Study on a comparison and analysis of Speaking rate estimation for adaptive bit rate on CELP vocoder)

장경아;민소연;배명진
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
- /
- pp.105-108
- /
- 2004
음성 부호화 기술은 전송률과 복잡도를 줄이고 음질을 향상시키는 방향으로 진행되고 있다. 현재 상용화되고 있는 CELP형 보코더는 낮은 전송률에 비해 우수한 음질을 제공한다. 본 논문에서는 기존의 방식과 다르게 보코더 단에 입력 음성이 들어가기 앞서 전처리 기법을 수행하는 전처리단을 부가하여 전송률을 낮추는 방법을 소개하고, 소개된 방법들을 각기 비교하고 분석하고자 한다. 전처리기법들을 음성 인식이나 합성에서 사용되는 파라미터들을 적용시켰으며, 처리시간이나 계산시간에 있어 기존의 방식에서 많은 영향을 미치지 않은 간단한 알고리즘으로 구현하였다. 소개하는 전처리단에서는 기존의 코딩방식에서 사용하지 않은 파라미터들, 발성율, 지속시간, PSOLA 방식들을 이용하였다.
PDF

피치변경율에 따른 최적의 피치변경법에 관한 연구 (A Study on the Optimal Pitch Alteration According to the Pitch Alteration Ratio)

박형빈
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
- /
- pp.460-464
- /
- 1998
일반적으로 파형 부호화법에서는 발성자의 개성과 메시지 정보를 보존하여 음질의 명료성이 우수하다. 하지만 파형 부호화법이 규칙에 의한 합성에 적응되도록 하기 위해서는 운유 조절에서 피치 변경법이 요구되어 진다. 본 논문에서는 스펙트럼의 왜곡율을 최소화하면서도 위상을 그대로 보존할 수 있는 시간영역에서의 피치변경법을 적용하였다. 이러한 방법들은 시간영역에서만 처리됨으로써 계산량을 줄여 실시간 운율조절에 적합하다. 결과적으로 피치주기를 100%에서 50%로 압축한 경우 평균 스펙트럼 왜곡율은 5.62%이고, 피치주기를 100%에서 200%로 신장한 경우 평균 스펙트럼 왜곡율은 4.20%정도로 비교적 우수한 결과가 얻어졌다.
PDF

검색결과 219건 처리시간 0.031초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)