• 제목/요약/키워드: 발성 속도

검색결과 76건 처리시간 0.024초

음절 별 발화속도 조절을 통한 노인 음석인식 개선 (Syllabic Speech Rate Control for Improving Elderly Speech Recognition of Smart Devices)

  • 경주원;손귀영;권순일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1711-1714
    • /
    • 2015
  • 스마트 디바이스가 사회와 소통할 수 있는 도구가 되었음에도 불구하고 아직까지 노인들이 사용하기에는 어려움이 있다. 여기에 음성인식 기술을 이용한 음성인터페이스를 활용함으로써 노인들의 스마트 디바이스에 대한 사용성을 높일 수 있다. 하지만 일반적인 음성인식 시스템은 청장년의 발성 스타일에 맞춰져 있기 때문에, 노화된 노인의 발성이 그대로 입력될 경우 음성인식률이 하락한다. 본 연구에서는 노인의 음절 별 발화속도가 일반적인 음성인식 시스템의 성능을 보증할 수 있는 범위를 벗어나는 경우가 많다는 분석 결과를 토대로 노인의 음절 별 발화속도를 조정한 결과 노인남녀 평균 음성인식률이 15.3% 상승하였다. 이처럼 노인의 음성인식 오류 원인들 중 하나인 발화속도의 재조정으로 음성 인식률을 높일 수 있는 토대를 마련하였다. 이는 노인들이 스마트 디바이스를 이용하여 쉽고 정확한 작업을 수행할 수 있게 됨으로써, 노인들의 사회 참여와 정보 획득이 용이해 지고 더 나아가 세대 간의 소통에도 이바지할 것으로 기대한다.

여성 뉴스 앵커의 발성 특성 분석 (The Characteristics of the Vocalization of the Female News Anchors)

  • 견두헌;배명진
    • 한국음향학회지
    • /
    • 제30권7호
    • /
    • pp.390-395
    • /
    • 2011
  • 본 논문은 각 방송사의 메인 뉴스인 평일 저녁뉴스의 여성 앵커 음성 분석을 통하여 공통적인 음성 요소와 각 방송국별 상대적인 음성 및 음향에는 어떠한 차이가 있는지 연구하였다. 전반적인 음성 특성을 알아보기 위해 6가지 요소를 분석한 결과, 각 방송국별 아나운서는 발화속도를 제외하면 모든 영역에서 뚜렷한 음성 및 발성 특징을 가지고 있었으며 음향시스템적인 차이도 발견 되었다. 주요 분석 요소는 기본 피치 외에 제1포만트와 피치비율에 따른 음색과 피치대역폭을 통한 정감도 요소, 피치대역폭내의 평균피치위치를 통한 문장 끝맺음 양상, 평균 발화속도, 주파수 대역별 에너지 분포를 통한 음향적인 음색 분석이다. 분석된 수치 및 결과는 국내 여성 앵커의 발성 특징의 기준으로 참고 및 활용될 수 있다.

한국어 숫자음에서의 음운변화를 고려한 연결숫자 인식의 성능향상 (Performance Improvement of Connected Digit Recognition by Considering Phoneme Variations in Korean Digit.)

  • 송명규;김형순
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.105-108
    • /
    • 2001
  • 한국어 숫자는 각 숫자가 단음절로 이루어져 있으며, 연속적으로 발음될 때 인접 숫자들의 상호조음현상에 의해 각 숫자의 고유 발음이 변화하고, 또한 그 숫자들의 경계도 모호해지는 문제점이 있다. 한편 연속적인 숫자의 발성을 기대하는 인식시스템에 반하여 일부 사용자는 숫자들을 고려시켜서 발성하기도 한다. 이는 연결숫자의 음운현상만을 고려한 인식 시스템에서는 성능저하의 한 원인이 된다 본 논문에서는 연결숫자의 인식성능 향상을 위해서 한국어 숫자들의 음운 변화를 고려하여 변이음군을 정하였으며, 사용자의 여러 가지 발성형태에 따른 다양한 음운 현상의 변화를 흡수 할 수 있도록 인식 네트웍을 구성하는 방식을 검토하였다. 전화망 4연숫자음을 이용한 화자독립 인식실험을 통해서 한국어 숫자에서 자주 오인식 되는 '이', '오', '일' 인식 성능이 각각 $4..2\%$, $4.2\%$, $2.9\%$씩 향상되었으며, 인식속도도 $33\%$의 개선이 있었다

  • PDF

위 분문부에 발생한 원발성 흑색종 (Primary Melanoma of the Stomach at Cardia)

  • 박종익;강성구;박상수;윤진;김일명;신동규
    • Journal of Gastric Cancer
    • /
    • 제6권3호
    • /
    • pp.193-197
    • /
    • 2006
  • 흑색종은 피부나 점막에 존재하는 멜라닌 세포에서 기원하는 악성 종양으로 피부에 가장 흔하게 발생한다. 위장관계 점막에서도 흑색종이 발생할 수 있는데 원발성은 매우 드물고 대부분은 피부의 원발성 흑색종으로부터 전이되어 나타난다. 위에 발생한 원발성 흑색종은 매우 드물고 치료 성적이 나쁘고 전이 속도가 빨라서 예후가 매우 나쁘다. 저자들은 혈변, 복통과 체중 감소를 주소로 내원한 75세 남자로 수술 전 진행성 위암으로 진단되어 위전절제술을 시행하였으나 수술 후 위 분문부의 원발성 흑색종으로 식도-위 접합부까지 침범한 증례를 경험하였기에 문헌 고찰과 함께 보고하는 바이다. 흑색종 치료에서 수술은 가장 표준적인 치료법이다. 수술 후 보조 요법으로 항암화학요법, 방사선 치료, 면역 치료 등을 시도해 보았지만 생존율 증가가 입증된 치료 방법은 아직 없는 실정이다. 장기간 생존율을 향상시키기 위해서는 조기 진단과 수술적 치료가 가장 중요하다.

  • PDF

중증 장애우용 음성구동 휠체어를 위한 강인한 음성인식 알고리즘 (Robust Speech Recognition Algorithm of Voice Activated Powered Wheelchair for Severely Disabled Person)

  • 석수영;정현열
    • 한국음향학회지
    • /
    • 제26권6호
    • /
    • pp.250-258
    • /
    • 2007
  • 현재의 음성인식 기술은 하드웨어 기술의 발전과 더불어 여러 분야에 응용되고 있지만 음성구동 휠체어와 같은 고신뢰성이 요구되는 응용분야에서는 아직도 그 성능이 불충분하다. 실 환경에서 음성을 통해 안전하게 휠체어를 제어하기 위해서는 도로의 소음 등과 같은 주변잡음의 영향에 의한 음성인식 성능의 저하, 사용자의 기침소리나 숨소리 등과 같은 비음성 입력시의 오동작, 명령어의 불명확한 발성과 일반인과는 다른 발성 속도 및 발성 주파수 등을 고려한 인식시스템이 필요하다. 이를 위하여 본 논문에서는 비음성 입력시의 오동작을 방지하기 위해 인식기의 전처리 단에서 YIN 기본주파수 추출방법을 적용한 후 프레임 별 신뢰도에 기반한 고정도로 음성/비음성을 판별할 수 있는 방법을 제안하고, 불명확한발성에 대한 인식 성능 향상을 위해 화자 적응화 방법 및 개인적인 발성 변이를 표현할 수 있는 다중 후보 단어사전을 구성하여 인식성능 제고를 도모하였다. 잡음이 포함된 실 환경하에서 수집한 데이터를 대상으로 인식실험을 수행한 결과 기존의 켑스트럼 방법에서는 오류 없이 비음성을 찾아내는 재현율은 62%로 나타났으나 본 논문에서 제안한 YIN방법에 기반을 둔 신뢰도 측정방법에서는 95.1%를 나타나 우수한 성능을 나타내었다. 실 환경에서 수집된 2211개의 불명확한 발성을 대상으로 인식실험을 수행한 결과 2000상태 16 혼합수 HMnet 모델을 이용한 경우 인식률이 78.6%로 나타났으나 MAP적응화 방법 및 다중 후보 인식사전을 적용한 결과 99.5%의 인식 성능을 나타내어 제안한 방법의 유효성을 확인할 수 있었다.

화자 연령 지각과 음성적 특성: 음높이와 발화 속도를 중심으로 (Speaker age estimation and acoustic characteristics: According to pitch and speech rate)

  • 서윤정;신지영
    • 말소리와 음성과학
    • /
    • 제11권4호
    • /
    • pp.9-18
    • /
    • 2019
  • 본고는 한국인 피험자를 대상으로 지각 실험을 진행하여 화자의 실제 연령(Chronological age)과 지각 연령(Perceived age) 간의 상관관계를 살피고, 한국인 피험자가 얼마나 정확하게 익명의 화자의 연령을 지각할 수 있는지를 밝히고자 한다. 또한, 이러한 연령 지각에 음성적 단서가 되는 음높이와 발화 속도와 지각 연령 간의 영향 관계를 검토하고자 한다. 이를 위해, 성인 80명을 대상으로 3가지 과제로 구성된 지각 실험을 진행하였다. 실험 자극은 표준어 화자 40명에게서 추출되었으며, 자유 발화, 낭독 발화, 모음 연장 발성으로 구성되었다. 각 실험은 10초 내외의 음성을 듣고 연령을 구체적인 숫자로 답하는 방식으로 진행되었다. 분석 결과, 한국인 피험자들은 상당히 높은 판단 정확도를 보였으며, 모음 연장 발성을 들었을 때보다 자유 발화와 낭독 발화를 들었을 때 화자의 연령을 더욱 정확하게 짐작하였다. 이러한 결과는 음성이 포함하고 있는 정보량의 차이에 기인한 것으로 보인다. 또한, 음성 분석을 수행한 결과 피험자들은 화자의 음높이와 발화 속도를 참고하여 화자의 연령을 추정하는 것으로 나타났으며, 음높이보다는 발화 속도가 연령 지각에 더 적극적으로 기여한 것으로 나타났다.

멸치젓 숙성중 불휘발성아민의 함량 변화 (Change of Nonvolatile Amines During Fermentation of Anchovy)

  • 정종순;이영근;박법규;류병호
    • 한국식품위생안전성학회지
    • /
    • 제4권1호
    • /
    • pp.37-44
    • /
    • 1989
  • 멸치를 물로 씻은 후 식염 10%, 15%, 20% 및 식염과 염화칼리 1:1 홈합염 10%를 각기 첨가하여 1~12주간 숙성할 때 불휘발성 아민의 함량과 미생물의 변화와 시중에 유통중인 멸치젓의 불휘발성아민 함량을 조사하였다. 불휘발성아민은 식염농도가 높을수록 생성량이 적었고 숙성기간별 생성량은 histamine의 경우 숙성 초기부터 증가하여 6주째에 식염 10%, 멸치젓이 657.8ppm으로 최고치를 나타낸 후 감소하기 시작하여 숙성 12주째는 식염 20%, 멸치젓이 210.8ppm으로 가장 적었고 혼합염 10% 멸치젓이 310.8ppm으로 가장 많이 생성되었다. Cadaverine과 putrescine은 숙성 8주째까지 생성량이 증가한 후 점차적으로 줄어들었고 tyramine은 숙성 10주째까지 RPthrwmd가한 뒤 숙성 12주째 현저히 감소하였다. 시중 유통품과 식염 함량이 비슷한 20% 멸치젓의 12주째 실험결과를 비교하면 시중 유통품의 불휘발성 아민 함량이 전반적으로 높게 나타났다. 미생물의 변화는 숙성 초기에는 Achromobacter 속, Aeromonas 속 및 Pseudomonas속이, 숙성 중기에는 Pediococcus속 , Microc....us 속 및 Lactobacillus 속이 많았으며 숙성 후기에는 Sacchromyces 속이 증가하였고 전 숙성기간 동안 미생물은 109주가 분리되었다.

  • PDF

토양 중 디젤 성분의 생분해에 있어서 mass-transfer 영향

  • 조한나;염익태;박주양
    • 한국지하수토양환경학회:학술대회논문집
    • /
    • 한국지하수토양환경학회 2002년도 추계학술발표회
    • /
    • pp.203-206
    • /
    • 2002
  • 토양 오염의 주된 원인인 디젤은 휘발성과 용해도가 낮아 생물학적 처리법이 많이 이용된다. 생물학적 처리에서 Bioavailability 는 생분해의 속도에 영향을 미치며 유효성평가에 있어 중요하다. 디젤로 오염된 토양의 생분해 특성 및 Bioavailability를 평가하기 위하여 생분해 실험과 mass transfer 실험을 수행하였다. 생분해 속도와 mass transfer 속도의 비교를 통해 생분해 초기에는 mass transfer에 의해 그 속도가 부분적으로 제한을 받으나, 일정시간 후에는 mass transfer 속도에 의해 생분해 속도가 결정되어짐을 알 수 있었다. Multi -component 인 디젤 성분에서의 mass transfer 의 영향을 알기 위해 각 성분별에 따라 조사한 결과, linear H.C 성분과 고 휘발성 성분은 생분해 속도가 초기에는 mass transfer 에 의해 부분적으로 제한되고 후에 mass transfer 에 의해 결정되어지나, tracked H.C 성분과 저휘발성 성분은 전체적으로 mass transfer 에 의해 생분해 속도가 제한되고 있음을 알 수 있었다.

  • PDF

입자상 PAHs의 건식 침적량과 건식 침적 속도 추정 (Estimation of Dry Deposition Fluxes and Velocity for Particulate PAHs in Korea)

  • 이지이;배수야;이승묵;김용표
    • 한국대기환경학회:학술대회논문집
    • /
    • 한국대기환경학회 2001년도 추계학술대회 논문집
    • /
    • pp.37-38
    • /
    • 2001
  • Polycyclic Aromatic Hydrocarbons(다환방향족 탄화수소류, 이하 PAHs)는 두 개 이상의 벤젠 고리로 구성되어 있는 반휘발성 유기물질로서 가스상과 입자상에 모두 존재한다. PAHs는 주로 불완전 연소에 의해서 생성되며, 주요 고정 오염원은 주거 난방, 코크 산업, 소각이고, 주요 이동오염원은 자동차 엔진이다. PAHs에는 강한 발암성 혹은 돌연변이원성을 가진 화합물들이 포함되어 있고, 주변 대기에 널리 분포되어 있을 가능성이 높기 때문에 일반 대중이 쉽게 노출될 수 있다. (중략)

  • PDF

확률적 방법을 이용한 음성 개성 변환 (Voice Personality Transformation Using a Probabilistic Method)

  • 이기승
    • 한국음향학회지
    • /
    • 제24권3호
    • /
    • pp.150-159
    • /
    • 2005
  • 본 논문에서는 임의의 음성을 특정 화자가 발성한 것처럼 들리도록 변환하는 음성 개성 변환 알고리즘에 대해 연구하였다. 제안된 기법은 화자의 음성을 LPC 켑스트럼, 피치, 발성 속도를 사용하여 표현하였으며 각각에 대한 변환 규칙을 생성하여 변환을 수행하였다. LPC 켑스트럼은 혼합 가우시안 모델을 이용한 확률적으로 모델링하고, 두 화자간의 대응관계를 조건 확률로 나타내었다. 확률적인 모델링에 필요한 각종 파라메터들을 얻기 위해 최대 가능도 기법이 사용되었으며, 변환 LPC 켑스트럼은 최소 자승 오차 방법에 근거하여 얻어지도록 하였다. 운율 변환을 위한 변수로 본 논문에서는 피치와 발성 속도를 사용하였으며, 두 음성간의 평균값 비율을 사용하여 운율 변환을 수행하였다. 제안된 기법은 기존 벡터 양자화 기반의 기법과 비교에서, 객관적인 척도로 사용한 평균 켑스트럼 거리 감소율, 가능도 증가율 면에서 우수한 성능을 나타내었다. 주관적인 테스트에서도 기존의 방법과 유사한 인식율을 얻었으며 특히 완만하게 변화하는 스펙트럼 궤적에 따른 고음질이 얻어짐을 확인할 수 있었다.