• 제목/요약/키워드: 연속 음성 강화

검색결과 4건 처리시간 0.016초

잡음 환경에서의 음성인식을 위한 온라인 빔포밍과 스펙트럼 감산의 결합 (Combining deep learning-based online beamforming with spectral subtraction for speech recognition in noisy environments)

  • 윤성욱;권오욱
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.439-451
    • /
    • 2021
  • 본 논문에서는 실제 환경에서의 연속 음성 강화를 위한 딥러닝 기반 온라인 빔포밍 알고리듬과 스펙트럼 감산을 결합한 빔포머를 제안한다. 기존 빔포밍 시스템은 컴퓨터에서 음성과 잡음을 완전히 겹친 방식으로 혼합하여 생성된 사전 분할 오디오 신호를 사용하여 대부분 평가되었다. 하지만 실제 환경에서는 시간 축으로 음성 발화가 띄엄띄엄 발성되기 때문에, 음성이 없는 잡음 신호가 시스템에 입력되면 기존 빔포밍 알고리듬의 성능이 저하된다. 이러한 효과를 경감하기 위하여, 심층 학습 기반 온라인 빔포밍 알고리듬과 스펙트럼 감산을 결합하였다. 잡음 환경에서 온라인 빔포밍 알고리듬을 평가하기 위해 연속 음성 강화 세트를 구성하였다. 평가 세트는 CHiME3 평가 세트에서 추출한 음성 발화와 CHiME3 배경 잡음 및 MUSDB에서 추출한 연속 재생되는 배경음악을 혼합하여 구성되었다. 음성인식기로는 Kaldi 기반 툴킷 및 구글 웹 음성인식기를 사용하였다. 제안한 온라인 빔포밍 알고리듬 과 스펙트럼 감산이 베이스라인 빔포밍 알고리듬에 비해 성능 향상을 보임을 확인하였다.

Micromechanical 시험법과 음향방출을 이용한 플라즈마 처리된 PBO와 Kevlar 섬유강화 Epoxy 복합재료의 비파괴적 파단특성 및 계면물성 평가 (Nondestructive Microfailure and Interfacial Evaluation of Plasma-Treated PBO and Kevlar Fibers/Epoxy Composites using Micromechanical Test and Acoustic Emission)

  • 박종만;김대식;김성룡
    • Composites Research
    • /
    • 제16권4호
    • /
    • pp.74-79
    • /
    • 2003
  • Micromechanical 시험법과 음향방출을 이용하여 산소 플라즈마 처리된 PBO와 Kevlar 섬유강화 에폭시 복합재료의 계면물성과 미세파괴메카니즘을 고찰하여 상호 비교하였다. 산소 플라즈마 처리된 PBO와 Kevlar 섬유강화 에폭시 복합재료의 계면전단강도와 접착일은 극성 작용기의 도입으로 향상 시킬 수 있었다. 임계표면장력과 총 표면자유에너지 중 극성 표면자유에너지는 플라즈마 처리된 Kevlar 섬유에서 가장 컸으며. 미처리된 PBO의 섬유의 경우에서 가장 작았다. Microfibril 파단 형상은 산소 플라즈마 처리된 Keviar 섬유의 경우에서는 명확하게 관찰 되었으며. 미처리와 비교차여 microfibril 파단이 대각선 방향으로 연속적해서 일어나 가장 많은 섬유 파단 신호가 감지되었다 비파괴 음향방출법을 이용하여 얻은 섬유파단 감지 결과는 microdroplet과 두 섬유강화 복합재료 시험법에서 광학현미경을 이용하여 관찰한 미세파단 형상과 상호 일치하였다.

구어파서를 위한 생성 인식 언어모델 (Generation and Recognition Language Model for Spoken Language Parser)

  • 정홍;황광일
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.167-172
    • /
    • 1999
  • 구어는 프로그래밍 언어와는 달리 주어진 문장 내에서의 해당 어휘의 뜻(semantic information)을 알고 다른 어휘들과의 연관성 (grammatical information)을 알아야만 적절한 형태소분석이 가능하다. 또한 구어는 방대한 양의 어휘들로 구성되어 있으며 사용하는 사람마다의 다양한 응용과 공식화되기 어려운 수많은 예외들로 운용되기 때문에 단순히 찾아보기표와 오토마타만으로는 형태소분석에 한계가 있다. 이에 본 논문에서는 주어진 어휘집과 그 어휘들로 만들어진 다양한 문장들로부터 구어운용의 근본기제를 스스로 학습해나가는 강화학습중심의 언어모델을 제안하고 실제로 한국어 형태소분석에 적용하여 그 성능과 특성을 파악해보았다. 구어파서의 입력은 음절단위의 발음이며 인간이 문장을 듣거나 보는 것과 동일하게 시간에 따라 순차적으로 입력된다. 파서의 출력 또한 시간에 따라 변화되면서 나타나며 입력된 연속음절을 형태소단위로 분리(segmentation)하고 분류(labeling)한 결과를 나타낸다. 생성인식 언어모델이 기존의 언어모델과 다른 점은 구어 파싱에 있어서 필수적인 미등륵어에 대한 유연성과 앞단의 음성인식기 오류에 적절한 반응(fault tolerance)을 나타내는 것이다.

  • PDF

검은머리물떼새의 번식행동 및 번식기 섭식행동의 다양성 (The Diversity of Reproductive and Foraging Behaviors on Breeding Season of Eurasian Oystercatcher (Haematopus ostralegus))

  • 윤무부
    • The Korean Journal of Ecology
    • /
    • 제27권6호
    • /
    • pp.383-390
    • /
    • 2004
  • 본 연구는 1999년 3월부터 2002년 9월에 걸쳐 경기도 시화호, 경기도 웅진군 동${\cdot}$서만도, 장구엽도 3곳에서 검은머리물떼새의 번식기전 행동, 텃세권 행동, 번식생태, 주요 섭식지역과 섭식행동, 종내와 종간번식 및 먹이경쟁에 대해 조사하였다. 검은머리물떼새의 번식 시작은 지역에 따라 차이를 보여 시화호 지역은 4월 중순부터, 동${\cdot}$서만도와 장구엽도의 경우 5월 중순 번식을 시작하였다. 번식에 들어가기 전 짝간의 유대를 강화하기 위한 행동으로 암수짝간의 섭식행동(foraging behavior)과 추적행동(male-female chasing behavior)을 보인다. 교미행동에 들어가기 전 암수는 함께 섭식행동을 하며, 다른 쌍이나 개체들이 섭식장소로 접근해 오면 삑- 삑- 하는 울음소리(piping calling)와 함께 공격적 행동을 보이며 침입자를 쫓아내거나, 침입자 추적비행을 하기도 한다. 연속적 행동양상을 관찰하지 않으면 암수 추적비행과 침입자 추적비행을 구별하기 어렵다. 텃세권 행동은 나비비행(butterfly flight), 음성행동(calling behavior), 침입자 추적행동(chasing behavior), 싸움행동(fight behavior)의 4가지 타입으로 분류하였다. 시화호 지역의 중요 취식 지역은 대부도 선착장 앞쪽, 방어머리 갯벌, 시화방조제 오이도 초입부의 정치망이 설치되어 있는 갯벌, 공단의 조류 조망대 앞쪽 북측 간석지 등 크게 4지역으로 구분된다. 섬지역 중 동${\cdot}$서만도는 썰물시 갯벌에서, 만조시에는 섬 주변에서 취식하였고, 밀${\cdot}$썰물의 차가 없는 장구엽도의 경우 섬 주변에서 주로 취식하였다. 섭식행동 중 종내(intraspecific)와 종간 (interspecific) 경쟁이 이루어졌다. 취식지역에서 검은머리물떼새 개체간에는 먹이를 빼앗기 위해 쫓아가는 행동이 관찰되기도 하고, 중요 취식지역에 다른 개체가 들어올 경우 침입자 추적행동을 하며 쫓아내기도 하였다. 종간 섭식 경쟁은 주로 괭이갈매기와 일어난다. 괭이갈매기와 먹이경쟁이 이루어질 경우에 검은머리물떼새는 먹이를 갈취 당하거나 공격을 받아 다른 지역에서 먹이를 취식하는 개체보다 먹이 섭취율이 상대적으로 떨어지는 것이 관찰되었다. 종간 경쟁이 심하면 섭식지역을 떠나 다른 지역으로 이동하였다.