• 제목/요약/키워드: Voice evaluation

검색결과 358건 처리시간 0.026초

인공지능 컨트롤러를 이용한 전기 시퀀스 제어 안전 모듈 회로 개발 (Development of Electrical Sequence Control Safety Module Circuit Using Artificial Intelligence Controller)

  • 김홍용
    • 한국재난정보학회 논문집
    • /
    • 제18권4호
    • /
    • pp.699-705
    • /
    • 2022
  • 연구목적: 시퀀스제어는 제조, 유통, 건설, 의료 산업분야의 자동화 등에 응용되어 널리 사용하고 있다. 4차산업의 발전으로 제어분야에 인공지능 융합 기술이 산업에 중요한 요소가 되어가고 있다. 특히 기존 시스템에 마이크로프로세서와 인공지능이 융합된 설비의 안전성과 혁신성을 평가하고 신뢰성 높은 장비개발이 요구되고 있어 교육목적의 장비를 개발하여 해당분야의 발전을 견인하고자 한다. 연구방법: 자체 개발한 일체형 인공지능 컨트롤러 모듈은 기존의 시퀀스 및 PLC제어 회로에 인공지능 능력을 융합한 장비이다. 본 장비의 성능평가항목으로 동작, 음성, 문자, 색상 등의 인식 능력과 회로의 안정성, 신뢰성을 평가하였다. 결론: 시퀀스 및 PLC 회로를 설계 후 융합된 일체형 인공지능 컨트롤러 모듈의 성능평가항목이 모두 만족하였고 회로의 안전성과 신뢰성에 문제가 없는 것으로 나타났다.

휴대형 후두 스트로보스콥의 개발 (Development of Portable Laryngeal Stroboscope)

  • 이재우;권순복;이병주;이진춘;고의경;전경명;왕수건;노정훈
    • 대한후두음성언어의학회지
    • /
    • 제17권1호
    • /
    • pp.28-37
    • /
    • 2006
  • Purpose: Evaluation of vocal cord vibration is very important in cases of voice disorders. There are several equipments for examining the vocal fold vibration such as laryngeal stroboscope, ultra high-speed digital imaging system, and videokymograph. Among these, laryngeal stroboscope is the most popular equipment because of easy to examine the laryngeal pathology. However, current laryngo-stroboscopes are too bulky to move and relatively expensive. The purpose of this research is to develope a portable laryngeal stroboscope of equivalent performance with the current equipments. Methods and Materials: Recently developed high luminescent white LEDs(light emitting diodes) are placed at the head of the endoscope as light sources for the CCD image sensor which is also placed at the head with imaging lens. This arrangement eliminates the bulky light source like expensive halogen or xenon lamps as well as the optical light guiding cables. The LEDs are controlled to flash in phase with the voice frequency of the examinee. The CCD captures these strobo images and converts them into video signals for examinations. Results: There was no functional differences between preexisting stroboscope and the newly developed stroboscope of this study. LED light sources and microprocessor based control circuits of the stroboscope enabled the development of flicker-less, hand-held, portable and battery-operating stroboscope. Conclusion: The developed stroboscope is cost-effective, small-sized, easy to use and very easy desirable to bring and to use in any place.

  • PDF

실내 무선 통신로에서 파일럿 심볼을 삽입한 Concatenated FEC 부호에 의한 WATM의 성능 개선 (A Fault Tolerant ATM Switch using a Fully Adaptive Self-routing Algorithm - The Cyclic Banyan Network)

  • 박기식;강영흥;김종원;정해원;양해권;조성준
    • 한국통신학회논문지
    • /
    • 제24권9A호
    • /
    • pp.1276-1284
    • /
    • 1999
  • 본 논문에서는 실내 무선 통신로를 레일리 (Rayleigh) 페이딩 통신로와 라이시안 (Rician) 페이딩 통신로로 모델링한 다음, 페이딩 보상용 파일럿 심볼을 삽입한 Concatenated FEC 부호를 WATM에 적용하여 셀 비트 오율 (BER) 및 셀 손실 (CLP) 성능을 시뮬레이션을 통해 평가하였다. 또한 이를 통해 얻은 성능 평가 결과를 동일한 조건에서 컨벌루션 부호에 적용하여 얻은 성능 평가 결과와 비교하였다. 레일리 페이딩 통신로에서 음성 서비스의 최대 허용 BER ($\textrm{10}^{-3}$)을 기준으로 결과를 분석해 보면, 파일럿 심볼을 Concatenated FEC 부호에 삽입하는 경우가 컨벌루션 부호에 삽입하는 경우 보다 $E_b/N_o$면에서 약 4 dB의 성능 개선이 얻어짐을 알 수 있었다. 그리고 라이시안 페이딩 통신로에서 직접파 대 반사파 전력비를 나타내는 K 파라미터의 값이 6과 10인 경우, 음성 서비스의 최대 허용 BER을 기준으로 결과를 분석해 보면, 파일럿 심볼을 Concatenated FEC 부호에 삽입하는 경우가 $E_b/N_o$면에서 각각 4 dB와 2 dB의 성능 개선이 얻어짐을 알 수 있었다. 또한 K=6과 K=10인 라이시안 페이딩 통신로에서 CLP =$\textrm{10}^{-3}$을 기준으로 결과를 분석해 보면, 파일럿 심볼을 Concatenated FEC 부호에 삽입하는 경우가 $E_b/N_o$면에서 각각 3.5 dB와 1.5 dB의 성능 개선이 얻어짐을 알 수 있었다.

  • PDF

정상인과 성대용종 환자에서의 공기역학적 검사 (Aerodynamic Study in Normal Korean and Patients with Vocal Polyp)

  • 서장수;송시연;정유선;김정수;지덕환;이무경
    • 대한후두음성언어의학회지
    • /
    • 제10권1호
    • /
    • pp.5-11
    • /
    • 1999
  • 최근 음성장애에 관한 관심이 높아지면서 성대질환 내지는 후두질환의 정확한 진단을 위한 발성기능의 측정이 더욱 중요시되기에 이르렀다 이에 본 연구에서는 정상 한국인 남자 81명, 여자 76명과 성대용종 환자 남자 78명, 여자 65명을 대상으로 공기역학적 검사 중 컴퓨터화된 측정기구와 기류저지법으로 최대발성지속시간, 발성기류량, 평균호기류율, 및 성문하압을 연령별 및 성별에 따라 평균치를 측정, 이를 비교 분석하였다. 최대발성지속시간은 정상인 남자가 20.6${\pm}$6.34초, 여자가 17.2${\pm}$4.20초였고, 성대용종 환자에서 남자가 13.1${\pm}$4.26초, 여자가 11.6${\pm}$4.43초였다. 평균호기류율은 정상인 남자가 170.0${\pm}$67.00ml/sec, 여자가 131.1${\pm}$49.03ml/sec였고, 성대용종 환자에서 남자가 255.7${\pm}$216.52ml/sec, 여자가 183.24${\pm}$107.16ml/sec였다. 발성기류량은 정상인 남자가 3179.0${\pm}$648.94ml. 여자가 2144.1${\pm}$650.81ml였고, 성대용종 환자에서 남자가 2905.8${\pm}$1295.35ml, 여자가 1904.4${\pm}$1068.59ml였다 성문하압은 정상인 남자가 4.0${\pm}$1.88cm$H_2O$, 여자가 3.5${\pm}$4.20cm$H_2O$였고, 성대용종 환자에서 남자가 4.2$\pm$1.48cm$H_2O$, 여자가 3.9${\pm}$1.12cm$H_2O$였다. 성대용종 환자에서 통계학적으로 유의성있게 최대발성지속시간은 감소하고, 평균호기류율은 증가하였으며, 발성기류량과 성문하압은 여자환자에서만 의미 있게 각각 감소하거나 증가하였다. 이상의 결과는 정상인과 성대용종 환자에 있어서 객관적인 공기역학적 검사결과를 보여주며 이는 성대용종 환자의 음성이상에 대한 상태판정이나 치료 후 효과 판정에 기본자료로 이용할 수 있을 것으로 생각된다.

  • PDF

8kbps에 있어서 PCFBD-MPC에 관한 연구 (A Study on PCFBD-MPC in 8kbps)

  • 이시우
    • 인터넷정보학회논문지
    • /
    • 제18권5호
    • /
    • pp.17-22
    • /
    • 2017
  • 유성음원과 무성음원을 사용하는 멀티펄스 음성부호화 방식에 있어서, 대표구간의 멀티펄스 음원을 사용하는 경우에 유성음의 합성음성파형에서 일그러짐이 나타난다. 이러한 원인은 대표구간의 멀티펄스를 피치구간마다 복원하는 과정에서 재생 음성파형이 정규화 되는 것이 원인으로 작용한다. 본 논문에서는 합성 음성파형의 일그러짐을 제어하기 위하여 V/UV/S(Voiced / Unvoiced / Silence)의 스위칭을 사용하고, 피치구간 마다 멀티펄스의 위치를 보정하며, 무성자음(Unvoiced)의 근사합성에 특정주파수를 이용하는 PCFBD-MPC(Position Compensation Frequency Band Division-Multi Pulse Coding)를 제안하였다. 또한 8kbps의 부호화 조건에서 PCFBD-MPC 시스템을 구현하고, PCFBD-MPC의 SNRseg를 평가하였다. 그 결과 PCFBD-MPC의 남자음성에서 13.8dB, 여자음성에서 13.4dB 임을 확인할 수 있었다. 향후 멀티펄스 음원의 진폭과 위치를 동시에 보정하는 8kbps 음성부호화 방식의 음질을 평가하는 연구를 수행하고자 한다. 향후, 멀티펄스 음원의 진폭과 위치를 동시에 보정하는 8kbps 음성부호화 방식의 음질을 평가하는 연구를 하고자 한다. 이러한 방법들은 셀룰러폰이나 스마트폰과 같이 낮은 비트율의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다.

데이터 트래픽 중심의 LTE망에서 VoIP를 위한 스케줄링 알고리즘 성능 분석 (Performance Evaluation of Scheduling Algorithm for VoIP under Data Traffic in LTE Networks)

  • 김성주;이재용;김병철
    • 전자공학회논문지
    • /
    • 제51권12호
    • /
    • pp.20-29
    • /
    • 2014
  • 최근 국내외에서는 LTE가 도입 초기단계를 넘어, LTE-A로의 도약이 이루어지고 있다. 이를 기반으로 고속의 서비스를 제공함으로써, 이동 전화로 시작한 휴대폰의 역할은 데이터 중심의 스마트폰으로 바뀌고 있다. 시스코에 의하면 2018년 전세계 모바일 데이터 트래픽은 지난해 대비 11배 증가 전망할것으로 내다봤다. 한국에서 모바일 비디오가 전국 모바일 트래픽에서 차지하는 비중은 2013년 66%에서 2018년 75%로 증가할 전망이다. 하지만 여전히 음성 서비스가 가장 중요하며, 높은 VoIP 통화 품질을 제공하기 위해서는 다양한 데이터 트래픽을 사용하는 가운데 LTE 망 상황에 따라 전송 속도를 조절하고, 낮은 BLER을 제공해야 한다. 실제 통화를 위한 전송율이 최대 23.85 Kbps인 AMR-WB 코덱을 사용하지만, 초당 수십~수백 MB까지 전송할수 있는 LTE일지라도 셀 가장자리의 사용자에게 일정 수준의 전송률을 떨어뜨리지 않고 유지하는 것은 어려운 일이다. 본 논문에서는 이러한 점을 개선하기 위해 특히 문제가 많이 발생하는 셀 가장자리의 품질을 개선하고자, 다양한 스케줄링 알고리즘의 성능을 분석하고 개선 방안을 제시하였다. 제시된 방안은 2계층 스케줄링 알고리즘을 사용하며, 셀 가장자리에 위치한 VoIP 사용자를 일정 비율 타 어플리케이션에 비해 우선 처리하는 스케줄링 알고리즘을 제공하는 기술이다. 본 논문에서는 throughput과 BLER 측면에서 VoIP 성능이 향상되었음을 확인하였다.

자연지리 강좌를 대상으로 한 온라인 러닝의 효과 분석 (Effectiveness of Online Learning Tools in College Education: Experiments in Physical Geography)

  • 박선엽;오은주
    • 대한지리학회지
    • /
    • 제46권6호
    • /
    • pp.707-723
    • /
    • 2011
  • 현재 대부분의 국내외 대학과 교육 기관에서는 온라인 학습방법을 채택하고 있다. 이에 본 연구는 전통적인 교수법에 대한 상대적 이점으로 많은 온라인 학습도구를 통한 학습효과를 자연지리학 강좌를 중심으로 정량적으로 평가하고자 하였다. 자연지리학 수강자들을 대상으로 실험을 실시하였으며, 인터넷 상에서 정보의 전파 도구로 널리 사용되고 있는 RSS(Really Simple Syndication) 기반의 Podcasting과 Profcast 소프트웨어 프로그램을 이용하여 생성한 동영상 강의가 온라인 도구로 활용되었고, 전통적인 강의실 수업도 함께 병행하였다. 학습효과를 살펴보기 위해, 수강자들이 작성한 강의평가 자료를 분석하였다. 실험은 2007년 봄학기부터 2008년 봄학기까지 동일한 자연지리학 개론 강좌를 대상으로 실시되었다. 본 연구에서 다루어진 실험의 결과에 의하면 온라인 학습 도구는 학습자들의 학습 효과뿐 아니라 수업과 강사에 대한 태도를 긍정적으로 변화시키는 것으로 나타났다. 또한 단순한 PowerPoint 슬라이드만 제공될 때에 비해 교수자의 음성 녹음이 결합된 강의자료가 학습 동기를 높이는데 더욱 효과적인 것으로 조사되었다. 즉, PowerPoint 슬라이드와 같은 시각적인 강의 자료만 제공되는 경우에는 기존의 강의방식과 학습 효과 면에서 큰 차이를 보이지 않았으나, 시각자료에 강의음성이 결합되었을 때, 인터넷 학습자료에 접근하는 빈도가 증가하고 학업성적 및 수업 출석률이 향상되었다. 연구 결과를 바탕으로 온라인과 교실 학습을 병행한 블랜디드형 교수설계 모델이 제안되었다.

갑상선절제술을 받은 여성 환자의 공기역학 검사변수 조사 (Investigation of aerodynamic evaluation in female patients undergoing thyroidectomy)

  • 강영애;권인선;원호륜;장재원;구본석
    • 말소리와 음성과학
    • /
    • 제12권2호
    • /
    • pp.73-80
    • /
    • 2020
  • 갑상선 수술 후 음성변화를 보이는 경우가 흔하며 신경손상의 성대마비부터 심인성 음성장애까지 그 증상은 복합적이고 다양하다. 대부분 자연적으로 회복을 보이지만 환자에게 회복시점에 대한 자세한 정보가 부족하다. 호흡은 음성을 만드는 동력이면서 동시에 후두 기능과 효율에 대한 조절자 역할을 하는데, 갑상선 암 수술의 전신마취 부작용으로 호흡기능 부조화를 유발할 수 있다. 이에 본 연구에서는 갑상선 수술 전후 공기역학적 검사결과를 추적하여 갑상선 수술 후 음성회복에 실제적이고 보완적인 정보를 제공하고자 한다. 2014년 5월부터 2015년 7월까지 갑상선 유두암으로 진단받고 수술 받은 환자를 대상으로 술전 1주일, 술후1개월, 술후3개월에 공기역학 검사를 실시하였다. 성대마비, 보청기 착용자, 항우울증약 복용자, 호흡기 질환자, 뇌졸중 병력자 및 임신 대상자는 제외시켜 최종 34명을 대상자로 선정하였다. 공기역학 검사는 PAS 기계를 사용하였고 분석변수는 총 29개이며, 시간요인에 따른 최고호기류율(p=0.004), 평균음도(p<0.01), 호기류지속시간(p=0.001), 호기량(p=0.018) 변수가 통계적으로 유의미한 차이를 보였다. 이때 시간요인의 대응비교에서 최고호기류율과 평균음도 변수는 술전-술후1개월, 술전-술후3개월 간 차이를 보였고, 호기류지속시간과 호기량 변수는 술전-술후3개월, 술후1개월-술후3개월 간 차이를 보였다. 시간과 수술범위의 교호작용 효과는 호기량 (p=0.024) 변수에서만 유의하였다. 갑상선절제술을 받은 여성군에서 최고호기류율과 평균음도 변수의 차이가 있으며 이는 수술 후 호흡훈련의 필요성이 있으며 호기류지속시간과 호기량 변수의 변화는 수술 후 긍정적 생활습관의 반영으로 여겨진다.

감성평가를 이용한 선교알람관리시스템의 청각아이콘 평가 (Selection of Auditory Icons in Ship Bridge Alarm Management System Using the Sensibility Evaluation)

  • 오승빈;장준혁;박진형;김홍태
    • 한국항해항만학회지
    • /
    • 제37권4호
    • /
    • pp.401-407
    • /
    • 2013
  • 선박 기술 발전에 따라 다양한 장비가 개발되고 있지만 인적요인에 의한 해양사고는 여전히 지속적으로 발생하고 있다. 이러한 상황에서 인적요인에 의한 사고 감소를 위하여 선교 내 항해장비의 인간공학적 설계가 많은 관심의 대상이 되고 있다. 선교에는 항해 및 통신장비로부터 나오는 음향 신호 등 항해사에게 정보를 전달하기 위한 다양한 청각 신호들이 존재한다. 하지만 이러한 청각 신호, 청각 경고음에 대한 인간의 인지능력에 관한 연구는 미흡한 실정이다. 청각 경고음은 크게 음성(speech), 함축적 소리(abstract sound), 청각 아이콘(auditory icon)으로 구분 할 수 있다. 본 연구에서는 청각 경고음 중 청각아이콘을 활용하여 5가지의 경보상황(엔진, 화재, 조타, 전기, 충돌)에서 청각아이콘에 대한 감성평가를 통해 각 상황에 적합한 청각아이콘을 선별하였다. 5가지 경보상황 중 뚜렷한 경향이 나타난 2가지 경보상황(엔진, 충돌)에 대하여 분석을 하였다. 본 연구 결과는 선교 내 청각표시장치와 통합선교알람관리시스템을 위한 기초자료로 활용될 수 있을 것으로 기대된다.

양자 간 대화 상황에서의 화자인식을 위한 문장 시퀀싱 방법을 통한 자동 말투 인식 (Automatic Speech Style Recognition Through Sentence Sequencing for Speaker Recognition in Bilateral Dialogue Situations)

  • 강가람;권오병
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.17-32
    • /
    • 2021
  • 화자인식은 자동 음성시스템에서 중요한 기능을 담당하며, 최근 휴대용 기기의 발전 및 음성 기술, 오디오 콘텐츠 분야 등이 계속해서 확장됨에 따라 화자인식 기술의 중요성은 더구나 부각 되고 있다. 이전의 화자인식 연구는 음성 파일을 기반으로 화자가 누구인지 자동으로 판정 및 정확도 향상을 위한 목표를 가지고 진행되었다. 한편 말투는 중요한 사회언어학적 소재로 사용자의 사회적 환경과 밀접하게 관련되어 있다. 추가로 화자의 말투에 사용되는 종결어미는 문장의 유형을 결정하거나 화자의 의도, 심리적 태도 또는 청자에 대한 관계 등의 기능과 정보를 가지고 있다. 이처럼 종결어미의 활용형태는 화자의 특성에 따라 다양한 개연성이 있어 특정 미확인 화자의 종결어미의 종류와 분포는 해당 화자를 인식하는 것에 도움이 될 것으로 보인다. 기존 텍스트 기반의 화자인식에서 말투를 고려한 연구가 적었으며 음성 신호를 기반으로 한 화자인식 기법에 말투 정보를 추가한다면 화자인식의 정확도를 더욱 높일 수 있을 것이다. 따라서 본 연구의 목적은 한국어 화자인식의 정확도를 개선하기 위해 종결어미로 표현되는 말투(speech style) 정보를 활용한 방법을 제안하는 것이다. 이를 위해 특정인의 발화 내용에서 등장하는 종결어미의 종류와 빈도를 활용하여 벡터값을 생성하는 문장 시퀀싱이라는 방법을 제안한다. 본 연구에서 제안한 방법의 우수성을 평가하기 위해 드라마 대본으로 학습 및 성능평가를 수행하였다. 본 연구에서 제안한 방법은 향후 실존하는 한국어 음성인식 서비스의 성능 향상을 위한 수단으로 사용될 수 있으며 지능형 대화 시스템 및 각종 음성 기반 서비스에 활용될 것을 기대한다.