• 제목/요약/키워드: Voice evaluation

검색결과 358건 처리시간 0.031초

무선망에서 효율적인 멀티미디어 전송을 위한 헤더압축 알고리즘 연구 (A Study on Header Compression Algorithm for the Effective Multimedia Transmission over Wireless Network)

  • 윤성열;박석천
    • 한국정보통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.296-304
    • /
    • 2010
  • MoIP는 IP위에 다양한 멀티미디어를 전송가능하게 해주는 기술인데, 기존 음성 서비스에 비해 큰 대역폭을 요구하며, 무선 환경에서의 무선 자원은 이미 한계점에 도달하고 있다. 따라서 이런 문제점을 해결하기 위한 방법으로 헤더 압축에 대한 연구가 많이 되고 있다. SCTP 프로토콜을 이용한 헤더압축은 ROHC-SCTP가 연구되었는데, ROHC-SCTP는 ROHC알고리즘과는 다른 형식의 패킷구조를 가지고 있고, SCTP의 특징을 적용하려면 헤더압축의 성능이 많이 떨어진다는 단점을 가지고 있다. 따라서 본 논문에서는 위의 문제점을 해결하기 위해 향상된 헤더압축 알고리즘을 설계하였다. 본 논문에서 제안한 알고리즘을 평가하기 위해 NS-2 시뮬레이션 환경에서 헤더압축 동작을 모델링하였다. 평가 결과 본 논문에서 설계한 알고리즘이 ROHC-SCTP 알고리즘에 비해 오버헤드율이 낮았고, 데이터의 타입이 많이 변화할 때 총 헤더의 크기가 더 작음을 확인하였다.

품질 보장형 IP 멀티캐스트 수락 제어 메커니즘 (QoS guaranteed IP multicast admission control mechanism)

  • 송강호;이우섭
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2008년도 춘계 종합학술대회 논문집
    • /
    • pp.51-55
    • /
    • 2008
  • High영상, High품질, 양방향성을 요구하는 BcN은 음성전화, 방송, 데이터 인터넷서비스가 모두 가능해지며 고유한 통신서비스 영역을 허물어 버렸다. 또한, 새로운 비즈니스와 ISP에게 안정적으로 품질이 보장되는 정보통신과 High품질 멀티미디어 서비스를 위해 신뢰성 있는 멀티캐스팅 품질보장 메커니즘이 요구 되어진다. 이와 같은 서비스 제공을 위해서는 End-to-End QoS가 보장되는 멀티캐스트 메커니즘이 제공 되어야 하며 사용자가 요구하는 패킷 손실률이나 전송지연 요구사항을 보장과 신뢰성 있는 멀티캐스트 Path망이 제공되어야 한다. 이를 위해 본 논문에서는 IP기반 멀티캐스트 신규 조인시 연결 수락을 효과적으로 할수 있는 Probing 패킷 기반의 멀티캐스트 메커니즘을 제시하고 ns-2를 이용한 성능분석를 제시 하였다.

  • PDF

585-nm Pulsed Dye LASER를 이용한 성대 폴립의 치료 (585-nm Pulsed Dye Laser Treatment of Vocal Polyp)

  • 최홍식;이근완;김민호;권순호;전주현;김광문
    • 대한후두음성언어의학회지
    • /
    • 제18권1호
    • /
    • pp.44-50
    • /
    • 2007
  • Background and Objectives: The 585-nm pulsed dye laser (PDL) has recently been adopted by otolaryngologists because of its epithelial-sparing properties. Many authors have reported the use of PDL for treatment of various vocal cord lesions. This purpose of this study is to examine the effectiveness of 585-nm PDL in the treatment of vocal polyp. Materials and Methods: Eight patients with vocal polyp were treated with 585-nm PDL from Sep. 2006 to Nov. 2006 in Yong-dong Sevrance hospital. 5 of them went through local anesthesia and 3 of them went through general anesthesia. In order to control laser fiber, flexible digital transnasal laryngoscope was applied under local anesthesia and general anesthesia using LMA, and micromanipulator was used under general anesthesia using endotracheal tube. The evaluations of vocal function was done at pre-and postoperation. Results: All patients improved in the perceptual evaluation of voice after PDL surgery. The aerodynamic study revealed that 5 of 8 patients showed improvement in maximal phonation time, and 6 of 8 showed improvement in mean airflow rate during phonation. The acoustic analysis revealed that all patients showed improvement in Jitter and Shimmer, and 7 of 8 showed improvement in noise to harmony ratio. Conclusion: This study demonstrates promising results in the efficacy of 585-nm PDL for the treatment of vocal polyps, and it illustrates a new option for vocal polyp treatment as well as the advantage of PDL surgery.

  • PDF

새로운 스펙트럼 완만화에 의한 합성 음질 개선 (Improvement of Synthetic Speech Quality using a New Spectral Smoothing Technique)

  • 장효종;최형일
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1037-1043
    • /
    • 2003
  • 본 논문에서는 단위음소로 다이폰을 사용하여 음성을 합성하는 방법에 관하여 기술한다. 음성 합성은 기본적으로 단위음소들의 연결을 통하여 이루어지는데, 이때 발생하는 가장 큰 문제점은 두 단위음소 사이의 연결부분에서 불연속이 발생하는 것이다. 이 문제를 해결하기 위하여 본 논문에서는 포만트 궤적뿐 아니라 스펙트럼의 분포특성과 인간의 청각적인 특성을 반영하여 스펙트럼을 완만화하는 방법을 제안한다. 즉, 제안하는 방법은 단위음소의 연결 구간에서 인간의 청각신경 특성을 고려하여 완만화의 양과 범위를 결정한 다음, 두 다이폰 경계의 스펙트럼 분포를 시간에 따라 가중치를 다르게 주어 스펙트럼 완만화를 수행한다. 이 방법은 불연속을 제거하며 완만화로 인하여 발생할 수 있는 음성의 왜곡을 최소화한다. 제안하는 방법의 성능을 평가하기 위하여 ETRI 음성 DB 샘플과 개인별로 자체 녹음한 총 20여개의 문장에서 추출한 약 500여 개의 다이폰에 대하여 실험을 수행하였다.

Efficacy of Calcium Hydroxyapatite in Vocal Fold Augmentation for Unilateral Vocal Fold Paralysis in Asian

  • Lee, Doh Young;Chung, Eun-Jae;Kwon, Seong-Keun
    • 대한후두음성언어의학회지
    • /
    • 제29권2호
    • /
    • pp.83-86
    • /
    • 2018
  • Background and Objectives : This study aimed to evaluate efficacy and complication of injection laryngoplasty using calcium hydroxyapatite (CaHA) for unilateral vocal fold paralysis in Asian. Materials and Methods : A prospective study was conducted on the adult patients with unilateral vocal fold paralysis from May 2015 through January 2016. Injection laryngoplasty was performed by one laryngologist. All patients underwent prospective voice evaluation using the subjective and objective comprehensive battery of assessments, before the procedure and after the procedure at 3 months, and 6 months. Results : A total of 7 patients (5 males and 2 females) were included in this study. VHI-10 was significantly decreased after injection laryngoplasty, at postoperative 6 months (p=0.031), while VAS score and MDADI showed no difference. GRBAS scale gradually decreased in 3 months and 6 months follow-up without statistical significance. Acoustic analysis revealed that jitter, shimmer, and noise-to-harmonic ratio continuously decreased from the baseline at 3 months and 6 months, although statistical significance was not attained. In the aerodynamic analysis, maximal phonation time was gradually increased at 3months and 6 months with significant difference (p=0.016, 0.031, respectively). There was no side effect associated with the procedure. Conclusion : CaHA can be safely used in Asian patients and the onset of maximal efficacy seems to be slow than other studies with Caucasian patients.

Implementation of Speech Recognition and Flight Controller Based on Deep Learning for Control to Primary Control Surface of Aircraft

  • Hur, Hwa-La;Kim, Tae-Sun;Park, Myeong-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권9호
    • /
    • pp.57-64
    • /
    • 2021
  • 본 논문에서는 음성 명령을 인식하여 비행기의 1차 조종면을 제어할 수 있는 장치를 제안한다. 음성 명령어는 19개의 명령어로 구성되며 총 2,500개의 데이터셋을 근간으로 학습 모델을 구성한다. 학습 모델은 TensorFlow 기반의 Keras 모델의 Sequential 라이브러리를 이용하여 CNN 모델로 구성되며, 학습에 사용되는 음성 파일은 MFCC 알고리즘을 이용하여 특징을 추출한다. 특징을 인식하기 위한 2단계의 Convolution layer 와 분류를 위한 Fully Connected layer는 2개의 dense 층으로 구성하였다. 검증 데이터셋의 정확도는 98.4%이며 테스트 데이터셋의 성능평가에서는 97.6%의 정확도를 보였다. 또한, 라즈베리 파이 기반의 제어장치를 설계 및 구현하여 동작이 정상적으로 이루어짐을 확인하였다. 향후, 음성인식 자동 비행 및 항공정비 분야의 가상 훈련환경으로 활용될 수 있을 것이다.

시각장애인에게 상품을 안내하기 위한 객체 식별 알고리즘 (Object Detection Algorithm for Explaining Products to the Visually Impaired)

  • 박동연;임순범
    • 한국콘텐츠학회논문지
    • /
    • 제22권10호
    • /
    • pp.1-10
    • /
    • 2022
  • 시각장애인들은 상품들에 대한 점자 정보와 지원 시스템의 부재로 인해 소매점을 이용하는데 어려움을 겪고 있다. 그에 따라 본 연구에서는 소매점 내 상품을 인식하고, 이를 음성으로 해설하는 시스템의 기본 알고리즘을 제안한다. 우선, 딥러닝 모델이 입력 이미지에서 손 객체와 상품 객체를 감지한다. 그리고 각 객체의 좌표 정보를 계산하여 손 객체와 가장 많이 겹치는 상품 객체를 찾는다. 그 상품을 사용자가 선택한 상품이라고 판단한 뒤, 해당 상품의 대한 영양 정보를 Text-To-Speech를 사용하여 읽어준다. 평가 결과, 학습 모델의 성능이 높은 것을 확인하였다. 본 알고리즘은 시각장애인의 소매점 이용을 지원하는 시스템 구축에 적극적으로 활용될 수 있을 것이다.

최신 대화형 에이전트 기반 상용화 교육 플랫폼 오류 분석 (Error Analysis of Recent Conversational Agent-based Commercialization Education Platform)

  • 이승준;박찬준;서재형;임희석
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.11-22
    • /
    • 2022
  • 최근 교육 분야에서 다양한 인공지능 기술을 활용한 연구와 개발이 이뤄지고 있다. 인공지능을 활용한 교육 중 특히 대화형 에이전트는 시간과 공간의 제약을 받지 않고 음성인식, 번역과 같은 다양한 인공지능 기술과 결합해 더 효과적인 언어 학습을 가능하게 한다. 본 논문은 상용화된 교육용 플랫폼 중 이용자 수가 많고 영어 학습을 위한 대화형 에이전트가 활용된 플랫폼에 대한 동향 분석을 진행하였다. 동향 분석을 통해 현재 상용화된 교육용 플랫폼의 대화형 에이전트는 여러 한계점과 문제점이 존재했다. 구체적인 문제점과 한계점 분석을 위해 사전 학습된 최신 대용량 대화 모델과 비교 실험을 진행하였고, 실험 방법으로 대화형 에이전트의 대답이 사람과 비슷한지를 평가하는 Sensibleness and Specificity Average (SSA) 휴먼 평가를 진행하였다. 실험 내용을 바탕으로, 효과적인 학습을 위해 개선방안으로 대용량 파라미터로 학습된 대화 모델, 교육 데이터, 정보 검색 기능의 필요성을 제안했다.

아두이노와 적외선 센서를 이용한 스마트 도어락과 앱 개발에 대한 연구 (Study on Development for Smart Door Lock and App. using Arduino and Infrared Sensor)

  • 전형준;나윤수;윤여균;김경호;안희운;김재욱
    • 한국전자통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.1199-1206
    • /
    • 2022
  • 본 논문에서는 현대사회에서 전자기기를 스마트폰의 앱을 통해 쉽게 작동시킬 수 있다는 것에 의해 기존의 키패드로만 제어되는 도어락과는 달리 스마트폰을 이용하여 도어락을 제어할 수 있게 앱 인벤터를 이용하여 앱을 제작하였다. 블루투스 모듈 실험을 통해 장애물이 없을 시 스마트폰과 통신거리가 최대 10m까지 제어가 되었고, 음성인식 실험을 통해 60dB의 소음 시 주파수가 500~1000Hz와 1000~1500Hz에서는 인식률이 각각 85%와 90%로 나왔으며, 80dB 소음 시 500~1000Hz와 1000~1500Hz일 때는 각각 70%와 80%의 인식률을 보였다. 실험 평가 결과를 통해 편의성과 보안성을 향상할 수 있음을 확인할 수 있었다.

Gesture Control Gaming for Motoric Post-Stroke Rehabilitation

  • Andi Bese Firdausiah Mansur
    • International Journal of Computer Science & Network Security
    • /
    • 제23권10호
    • /
    • pp.37-43
    • /
    • 2023
  • The hospital situation, timing, and patient restrictions have become obstacles to an optimum therapy session. The crowdedness of the hospital might lead to a tight schedule and a shorter period of therapy. This condition might strike a post-stroke patient in a dilemma where they need regular treatment to recover their nervous system. In this work, we propose an in-house and uncomplex serious game system that can be used for physical therapy. The Kinect camera is used to capture the depth image stream of a human skeleton. Afterwards, the user might use their hand gesture to control the game. Voice recognition is deployed to ease them with play. Users must complete the given challenge to obtain a more significant outcome from this therapy system. Subjects will use their upper limb and hands to capture the 3D objects with different speeds and positions. The more substantial challenge, speed, and location will be increased and random. Each delegated entity will raise the scores. Afterwards, the scores will be further evaluated to correlate with therapy progress. Users are delighted with the system and eager to use it as their daily exercise. The experimental studies show a comparison between score and difficulty that represent characteristics of user and game. Users tend to quickly adapt to easy and medium levels, while high level requires better focus and proper synchronization between hand and eye to capture the 3D objects. The statistical analysis with a confidence rate(α:0.05) of the usability test shows that the proposed gaming is accessible, even without specialized training. It is not only for therapy but also for fitness because it can be used for body exercise. The result of the experiment is very satisfying. Most users enjoy and familiarize themselves quickly. The evaluation study demonstrates user satisfaction and perception during testing. Future work of the proposed serious game might involve haptic devices to stimulate their physical sensation.