• 제목/요약/키워드: speech separation

검색결과 88건 처리시간 0.022초

공동주택 내 비상방송설비의 음성명료도 실태 분석 및 재실자 인지성 개선방안 연구 (A Study on the Improving Speech Intelligibility of Emergency Broadcast Equipment in the Apartments)

  • 오소영;조현민;이영주;이민주;윤명오
    • 한국화재소방학회논문지
    • /
    • 제32권4호
    • /
    • pp.60-68
    • /
    • 2018
  • 공동주택의 복잡한 평면 구조와 향상된 벽간 차음성능으로 인해 화재상황의 전달 및 인지가 어려워 피해가 증가되고 있는 실정이다. 본 연구에서는 국내 공동주택 평면 형태를 대상으로 소방시설 중 비상방송설비의 명료성에 대한 실태분석을 진행하였다. 아울러 피난방송의 명확한 인지를 위한 음성명료도 개선 방안을 시뮬레이션을 통해 분석하였다. 현장측정 결과 72, 84, 101 Type 모두 국내 경보설비기준인 90 dBA를 R1 지점에서 만족하지 못하는 것으로 나타났다. 또한 72 Type의 L1 지점(거실) 79.8 dBA를 제외하고는 모든 측정지점에서 출입문을 열었을 때와 닫았을 때 모두 NFPA 기준 75 dBA를 만족하지 못하는 것으로 평가되었다. 침실의 출입문 개구 상태를 기준으로 국내 화재안전기준에서 제시된 1 m 이격지점에서 90 dBA 이상을 만족시 각 침실에서 NFPA 기준인 음압레벨 75 dBA와 CIS 0.7을 만족하였다.

정준 상관 분석을 이용한 잡음 섞인 음성 신호의 분리 (Segaration of Corrupted Speech Signals using Canonical Correlation Analysis)

  • 김선일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.164-167
    • /
    • 2012
  • 음성 신호와 함께 섞인 자동차 배기 소음을 서로 분리해 내는 기술은 점점 음성을 중심으로 발전해가는 인터페이스를 현실화하는데 실질적으로 필요한 기술이다. 따라서 자동차 배기음이 섞인 음성신호를 두 신호간의 독립성이 보장되지 않고 두 신호에 대한 사전 정보가 없는 상태에서 분리해 내기 위해 정준 상관 분석을 사용하여 두 신호를 분리해 내는 연구를 진행하였다. 정준 상관 분석을 이용하여 음성을 분리해 내기 위해서는 분석에 쓰이는 신호의 구성이 중요하다. 정준 상관 분석에 대해 알아보고 음성과 자동차 배기 소음이 섞인 두 개의 신호를 받아서 이를 재구성하여 정준 상관분석을 이용하여 자동차 소음과 음성을 분리해 내었다. Blind Source Separation에 쓰이는 다른 방법과 비교했을 때 독립성이 보장되지 않는 신호에 대해서도 분리가 가능하므로 응용 대상이 상대적으로 넓어 실용적 응용이 가능하다고 할 수 있다.

  • PDF

서울말 /?/와 /?/의 지각특성 (Perceptual cues for /o/ and /u/ in Seoul Korean)

  • 변희경
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.1-14
    • /
    • 2020
  • 서울말의 ᅩ/ᅮ가 모음 공간에서 융합하는 변화가 진행되고 있는 것이 많은 연구들에 의해 지적되어 왔다. 한편 ᅩ/ᅮ의 중복이 현저한 여성의 발화에서는 포먼트 대신 모음의 음질 (H1-H2)이 ᅩ/ᅮ를 구별하고 있는 것이 확인되었다. 본 고의 목적은 생성에 보이는 ᅩ/ᅮ 간의 H1-H2 차이가 지각에서도 유효한지를 확인하는 것이다. 지각에서도 H1-H2가 유효하게 기능하고 있다면 포먼트만으로는 설명이 어려운 여성의 ᅩ/ᅮ를 생성과 지각 모두에서 H1-H2로 정연하게 설명할 수 있을 것이다. 서울, 경기 출신의 대학생 35명을 대상으로 서울말 모어 화자가 단독발화한 ' 오'와 '우'를 사용하여 지각실험을 실시하였다. 자극음은 모두 여성의 발화로 모음 공간에서 상당한 중복을 보이는 182예이다. 생성과 지각의 관계를 보기 위해 자극음의 음향분석도 실시하였다. 정답률(바르게 지각한 동정률)은 평균 89%로 /ᅩ/가 86% (n=88), /ᅮ/가 91% (n=94)였다. 자극음의 음향분석에서 포먼트로 구별이 어려운 ᅩ/ᅮ의 경우 H1-H2가 유의하게 작용하고 있는 것이 확인되었다. 그러나 ᅩ/ᅮ의 지각에 H1-H2의 영향력은 매우 미미하며 ᅩ/ᅮ의 구별에는 남녀 모두 포먼트가 결정적인 역할을 하는 것으로 나타났다. 생성에서 H1-H2로 ᅩ/ᅮ를 구별하는 것은 여성의 발화로, 남성의 발화에서는 H1-H2가 아닌 포먼트로 구별된다. 남성의 발화에서도 H1-H2 차이가 ᅩ/ᅮ의 구별에 쓰인다면 지각에 있어서도 H1-H2가 주된 지각특성이 될 수도 있겠지만 적어도 현 단계에서 ᅩ/ᅮ의 지각에 H1-H2의 사용은 남녀 모두 아직 도입되지 않은 것으로 보인다.

편측성 치조. 구개 파열 환자에서 골 이식술의 치험레 (Case Reports of Bone Grafting in Unilateral Alveolar-palatal Cleft Patients)

  • 배윤호;박재현;이명진;이창곤;진병로;이희경
    • Journal of Yeungnam Medical Science
    • /
    • 제8권1호
    • /
    • pp.198-205
    • /
    • 1991
  • 본 저자들은 2명의 편측성 치조, 구개 파열 환자에서 장골능에서 얻은 골수 망상골로 late secondary bone graft를 시행하여 심미적 기능적으로 양호한 결과를 얻었다. 1. 한 증례에서는 골지지가 거의 없는 우측 상악 중절치를 발거하고 술전 교정치료로 변위된 치아의 배열과 소실된 공간을 회복한 후 골 이식을 시행하였고 다른 증례에서는 술전 교정치료 없이 보철물 제거후 골 이식을 시행 하였다. 2. 파열 변연부위에 골점막 절개를 한후 순측, 구개측 및 비점막을 거상 봉합하여 구비강 누공을 폐쇄한후 장골능에서 얻은 골수 망상골을 이식하였다. 3. 수술후 구비강 누공의 폐쇄로 비음이 개선되었고, 술후 6개월뒤 방사선 사진상 파열 부위의 골 재생을 확인후 결손 치아를 보철치료하였다.

  • PDF

3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구 (A study on the lip shape recognition algorithm using 3-D Model)

  • 김동수;남기환;한준희;배철수;나상동
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1998년도 추계종합학술대회
    • /
    • pp.181-185
    • /
    • 1998
  • 최근 통신 시스템의 연구와 발전 방향은 목소리의 음성 정보와 말하는 얼굴 영상의 화상 정보를 함께 적용하므로서 음성 정보만을 제공하는 경우보다 높은 인식율을 제공한다. 따라서 본 연구는 청각장애자들의 언어 대체수단 중 하나인 구화(speechreading)에서 가장 시각적 변별력이 높은 독순(lipreading)을 PC에서 구현하고자 한다. 간 논문은 기존의 방법과 달리 말하는 영상 시퀀스에서 독순(lipreading)을 행하기 위해 3차원 모델을 사용하여 입의 벌어진 정도, 턱의 움직임, 입술의 돌출과 같은 3차원 특징 정보를 제공하였다. 이와 같은 특징 정보를 얻기 위해 3차원 형상 모델을 입력 동영상에 정합시키고 정합된 3차원모델에서 각 특징점의 변화량을 인식파라미터로 사용하였다. 그리고, 인식 단위로 동영상을 분리하는 방법은 3차원 특징점 변화량에서 얻어지는 강도의 기울기에 의한다. 인식은 다차원(multi-dimensional), 다단계 라벨링 방법을 사용하여 3차원 특징벡터를 입력으로 한 이산 HMM을 사용하였다.

  • PDF

3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구 (A study on the lip shape recognition algorithm using 3-D Model)

  • 남기환;배철수
    • 한국정보통신학회논문지
    • /
    • 제6권5호
    • /
    • pp.783-788
    • /
    • 2002
  • 최근 통신 시스템의 연구와 발전 방향은 목소리의 음성 정보와 말하는 얼굴 영상의 화상 정보를 함께 적용하므로서 음성 정보만을 제공하는 경우보다 높은 인식율을 제공한다. 따라서 본 연구는 청각장애자들의 언어 대체수단 중 하나인 구화(speechreading)에서 가장 시각적 변별력이 논은 입모양 인식을 일반 퍼스널 컴퓨터상에서 구현하고자 한다. 본 논문은 기존의 방법과 달리 말하는 영상 시퀀스에서 입모양 인식을 행하기 위해 3차원 모델을 사용하여 입의 벌어진 정도, 턱의 움직임, 입술의 돌출과 같은 3차원 특징 정보를 제공하였다. 이와 같은 특징 정보를 얻기 위해 3차원 형살 모델을 입력 동영상에 정합시키고 정합된 3차원 형상모델에서 각 특징점의 변화량을 인식파라미터로 사용하였다. 그리고, 인식단위로 동영상을 분리하는 방법은 3차원 특징점 변화량에서 얻어지는 강도의 기울기에 의하여 이루어지고, 인식은 각각의 3차인 특징벡터를 이산 HMM 인식기의 인식 파라메타로 사용하였다.

3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구 (A study on the lip shape recognition algorithm using 3-D Model)

  • 배철수
    • 한국정보통신학회논문지
    • /
    • 제3권1호
    • /
    • pp.59-68
    • /
    • 1999
  • 최근 통신 시스템의 연구와 발전 방향은 목소리의 음성 정보와 말하는 얼굴 영상의 화상 정보를 함께 적용하므로서 음성 정보만을 제공하는 경우보다 높은 인식율을 제공한다. 따라서 본 연구는 청각장애자들의 언어 대체수단 중 하나인 구화(speechreading)에서 가장 시각적 변별력이 높은 입모양 인식을 일반 퍼스널 컴퓨터상에서 구현하고자 한다. 본 논문은 기존의 방법과 달리 말하는 영상 시퀀스에서 입모양 인식을 행하기 위해 3차원 모델을 사용하여 입의 벌어진 정도, 턱의 움직임, 입술의 돌출과 같은 3차원 특징 정보를 제공하였다. 이와 같은 특징 정보를 얻기 위해 3차원 형상 모델을 입력 동영상에 정합시키고 정합된 3차원 형상 모델에서 각 특징점의 변화량을 인식파라미터로 사용하였다. 그리고, 인식단위로 동영상을 분리하는 방법은 3차원 특징점 변화량에서 얻어지는 강도의 기울기에 의하여 이루어지고, 인식은 각각의 3차원 특징벡터를 이산 HMM 인식기의 인식 파라메타로 사용하였다. 본 논문에서는 한국어 10개 모음에 대하여 인식실험하여 비교적 높은 인식율을 얻을 수 있는 것으로 보아 본 연구에서 사용한 특징 벡터를 시간적 변별 요소로서 사용할 수 있음을 제시하였다.

  • PDF

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.