• 제목/요약/키워드: Speech sound

검색결과 627건 처리시간 0.021초

컨버전스시대 감성영역의 확장과 산업활용 -Sommerer와 Mignonneau의 인터넷 아트 분석을 중심으로- (Expansion of Sensibility Area and Industrial Application in the Convergence Era - With Special Reference to Analysis of the Internet Arts of Sommerer and Mignonneau -)

  • 김희영;이용재
    • 한국콘텐츠학회논문지
    • /
    • 제10권12호
    • /
    • pp.146-154
    • /
    • 2010
  • 오늘날 '컨버전스'와 '소통'은 모든 분야에서 키워드가 되고 있다. 예술가와 공학자는 새로운 기술에 기반을 둔 협업을 통해 그 동안의 상호단절에서 벗어나 점차 소통하고 있다. 컨버전스 시대에 예술 영역의 인터넷 아트와 기술 영역의 내비게이션과 아이폰에서 오감융합기술의 활용이 돋보인다. 소메라와 미뇨노의 인터넷 아트 $\ll$Riding the Net$\gg$, $\ll$The Living Room$\gg$, $\ll$The Living Web$\gg$은 음성인식을 통한 시각이미지와 촉각을 통한 시 공간 표현을 인터넷과 오감융합기술을 통해 구현하고 있다. 그리고 산업기술에서 내비게이션과 아이폰은 음성인식을 통한 오감융합기술을 적용하여 감성영역을 확장하여 인터넷 아트와 비슷한 기술을 선보인다. 이 연구에서 살펴본 바와 같이, 예술과 기술의 융합적 발전은 디지털 아트와 문화기술 산업의 새로운 지평을 열 것으로 보인다.

어휘 인식 시스템에서 학습 모델 분류를 위한 결정 트리 학습 알고리즘 (Decision Tree Learning Algorithms for Learning Model Classification in the Vocabulary Recognition System)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제11권9호
    • /
    • pp.153-158
    • /
    • 2013
  • 인식 대상 학습 모델이 분류되어 있지 않거나 명확하게 분류되지 않은 경우 어휘 인식을 결정하지 못하여 인식률이 저하되며 학습 모델 분류 형태가 변경되거나 새로운 학습 모델이 추가되면 인식 모델의 결정 트리 구조가 변경되어야 하는 구조적 문제가 발생한다. 이러한 문제점을 해결하기 위하여 학습 모델 분류를 위한 결정 트리 학습 알고리즘을 제안한다. 음운 현상이 충분히 반영된 음성 데이터베이스를 구성하고 학습 효과를 확보하기 위하여 학습 모델 분류를 위한 결정 트리 방법을 사용하였다. 본 연구에서는 실내 환경에 대하여 어휘 종속 인식과 어휘 독립 인식 실험을 수행한 결과 실내 환경의 어휘 종속 실험에서는 98.3%의 인식 성능을 보였고, 어휘 독립 실험에서 98.4%의 인식 성능을 보였다.

초등학교 저학년 교실의 실내음향성능 실태조사 (Investigation of the Acoustic Performance of Lower Grade Elementary School Classrooms)

  • 조아현;박찬재;한찬훈
    • 교육시설 논문지
    • /
    • 제28권3호
    • /
    • pp.3-14
    • /
    • 2021
  • Speech information of teachers is transmitted to students in classrooms so that appropriate aural environment should be provided for academic purposes. Many researches have been undertaken for classroom acoustics, and acoustic standards of domestic classrooms were suggested based on the reverberation time and background noise level. However, these standards are suitable for middle and high schools and so not consider the auditory ability by ages. As a precedent research, the present study was begun to suggest an acoustic standard for lower grade elementary school classrooms with children under age 9 who have not normal auditory ability. In order to do this, acoustic performances of the lower grade classrooms were measured and compared with the general classrooms. Also, change of acoustic parameters depending on the desk layout was measured and analyzed. The measured acoustic parameters were background noise, signal to noise ratio, RT, STI, D50, and IACC. As a result, it was found that background noise is exceed the standard of 35dB(A) at the schools along the road sides. Also, it was shown that most of acoustic parameters are higher in the classrooms built recently rather than the old classrooms. Generally, there are not much difference of acoustic parameters among the various desk layouts but, better acoustic performances are acquired at the center line and the seats near sound source. Also, Higher IACC was measured at the seats on the center line facing the source squarely.

딥러닝 기반 음향 신호 대역 확장 시스템 (Deep Learning based Raw Audio Signal Bandwidth Extension System)

  • 김윤수;석종원
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1122-1128
    • /
    • 2020
  • 대역 확장(Bandwidth Extension)이란 채널 용량 부족 혹은 이동통신 기기에 탑재된 코덱의 특성으로 인해 부호화 및 복호화 과정에서 대역 제한(band limited)되거나 손상된 협대역 신호(NB, Narrow Band)를 복원, 확장하여 광대역 신호(WB, Wide Band)로 전환 시켜주는 것을 의미한다. 대역 확장 연구는 주로 음성 신호 위주로 대역 복제(SBR, Spectral Band Replication), IGF(Intelligent Gap Filling)과 같이 고대역을 주파수 영역으로 변환하여 복잡한 특징 추출 과정을 거쳐 이를 바탕으로 사라지거나 손상된 고대역을 복원한다. 본 논문에서는 딥러닝 모델 중 오토인코더(Autoencoder)를 바탕으로 1차원 합성곱 신경망(CNN, Convolutional Neural Network)들의 잔차 연결을 활용하여 복잡한 사전 전처리 과정 없이 일정한 길이의 시간 영역 신호를 입력시켜 대역 확장 시킨 음향 신호를 출력하는 모델을 제안한다. 또한 음성 영역에 제한되지 않는 음악을 포함한 여러 종류의 음원을 포함하는 데이터셋에 훈련시켜도 손상된 고대역을 복원할 수 있음을 확인하였다.

Reconstruction of Pharyngolaryngeal Defects with the Ileocolon Free Flap: A Comprehensive Review and How to Optimize Outcomes

  • Escandon, Joseph M.;Santamaria, Eric;Prieto, Peter A.;Duarte-Bateman, Daniela;Ciudad, Pedro;Pencek, Megan;Langstein, Howard N.;Chen, Hung-Chi;Manrique, Oscar J.
    • Archives of Plastic Surgery
    • /
    • 제49권3호
    • /
    • pp.378-396
    • /
    • 2022
  • Several reconstructive methods have been reported to restore the continuity of the aerodigestive tract following resection of pharyngeal and hypopharyngeal cancers. However, high complication rates have been reported after voice prosthesis insertion. In this setting, the ileocolon free flap (ICFF) offers a tubularized flap for reconstruction of the hypopharynx while providing a natural phonation tube. Herein, we systematically reviewed the current evidence on the use of the ICFF for reconstruction of the aerodigestive tract. A systematic literature search was conducted across PubMed MEDLINE, Web of Science, ScienceDirect, Scopus, and Ovid MEDLINE(R). Data on the technical considerations and surgical and functional outcomes were extracted. Twenty-one studies were included. The mean age and follow-up were 54.65 years and 24.72 months, respectively. An isoperistaltic or antiperistaltic standard ICFF, patch flap, or chimeric seromuscular-ICFF can be used depending on the patients' needs. The seromuscular chimeric flap is useful to augment the closure of the distal anastomotic site. The maximum phonation time, frequency, and sound pressure level (dB) were higher with ileal segments of 7 to 15 cm. The incidence of postoperative leakage ranged from 0 to 13.3%, and the majority was occurring at the coloesophageal junction. The revision rate of the microanastomosis ranged from 0 to 16.6%. The ICFF provides a reliable and versatile alternative for reconstruction of middle-size defects of the aerodigestive tract. Its three-dimensional configuration and functional anatomy encourage early speech and deglutition without a prosthetic valve and minimal donor-site morbidity.

배우 음성 훈련을 위한 EVT 구조연습 활용방안 II (How to Use EVT Figures for Actor Voice Training II)

  • 이영수
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.647-664
    • /
    • 2022
  • 본 연구는 음성 과학에 근간을 두고 있는 에스틸 보이스 트레이닝(Estill Voice Training) 모델의 구조연습(Figure)이 배우가 인물을 창조하는 연기예술에 있어 음성적 전문성의 확장으로 기여할 수 있는 가능성을 모색하고 그에 따른 활용방안을 고찰하는 데 그 목적이 있다. 음성 산출 기관의 유동성과 구조적 측면의 기능성을 통한 훈련 모델은 모호한 추상성에 기인하여 소리의 결과에만 천착하는 기존의 음성 훈련과는 차별화된다. 가성대, 윤상연골, 연구개, AES, 앵커링 등 후두부와 성도의 수의적 조정 능력을 개발하는 것은 예술적 목표음 산출을 보다 용이하게 만드는 과학적 효율성을 가지며 배우가 직면하는 기능적 한계를 창조적으로 극복할 수 있는 기술적 방법론으로 활용될 수 있다. 음성 산출 요소 간의 조화와 협응을 위한 원리적 훈련인 에스틸 모델의 구조연습은 이미지와 추상성이 주류를 이루고 있는 국내의 배우 음성 교육에 대안적 훈련 모델로 활용될 수 있는 실용적 가치를 지닌다.

Volume Control using Gesture Recognition System

  • Shreyansh Gupta;Samyak Barnwal
    • International Journal of Computer Science & Network Security
    • /
    • 제24권6호
    • /
    • pp.161-170
    • /
    • 2024
  • With the technological advances, the humans have made so much progress in the ease of living and now incorporating the use of sight, motion, sound, speech etc. for various application and software controls. In this paper, we have explored the project in which gestures plays a very significant role in the project. The topic of gesture control which has been researched a lot and is just getting evolved every day. We see the usage of computer vision in this project. The main objective that we achieved in this project is controlling the computer settings with hand gestures using computer vision. In this project we are creating a module which acts a volume controlling program in which we use hand gestures to control the computer system volume. We have included the use of OpenCV. This module is used in the implementation of hand gestures in computer controls. The module in execution uses the web camera of the computer to record the images or videos and then processes them to find the needed information and then based on the input, performs the action on the volume settings if that computer. The program has the functionality of increasing and decreasing the volume of the computer. The setup needed for the program execution is a web camera to record the input images and videos which will be given by the user. The program will perform gesture recognition with the help of OpenCV and python and its libraries and them it will recognize or identify the specified human gestures and use them to perform or carry out the changes in the device setting. The objective is to adjust the volume of a computer device without the need for physical interaction using a mouse or keyboard. OpenCV, a widely utilized tool for image processing and computer vision applications in this domain, enjoys extensive popularity. The OpenCV community consists of over 47,000 individuals, and as of a survey conducted in 2020, the estimated number of downloads exceeds 18 million.

성문상부암종에서 성문상 후두부분절제술과 경부청소술의 치료성적 (Treatment Outcome of Supraglottic Partial Laryngectomy and Neck Dissection for Supraglottic Carcinoma)

  • 태경;민현정;송미나;신광수;이승환;김경래;이형석
    • 대한두경부종양학회지
    • /
    • 제23권1호
    • /
    • pp.15-20
    • /
    • 2007
  • Background and Objectives:Supraglottic partial laryngectomy is oncologically sound surgical procedure for selected cases of laryngeal cancer which maintains physiologic speech and swallowing without permanent tracheostoma. The purpose of this study is to evaluate the oncologic and functional results of supraglottic partial laryngectomy and neck dissection for supraglottic cancer. Materials and Methods:Between 1991-2005, Twenty-three supraglottic cancer patients, underwent supraglottic partial laryngectomy, were studied retrospectively. There were 5 patients with cT1, 14 with cT2, 4 with cT3 and 11 patients with cN0, 1 with cN1, 10 with cN2, 1 with cN3. All patients underwent neck dissection and postoperative radiotherapy was added to twenty patients. They were reviewed with respect to primary subsites, extended subsites, treatment result, survival rate, factors affecting the prognosis, postoperative complication, time of decannulation and oral diet, and postoperative voice. Results:Among eleven patients with clinically negative node, six patients had pathologically positive nodes. So occult metastasis was 54.5%. Two patients recurred at cervical lymph node and one had distant metastasis to lung. Local and regional control were 100% and 91.3%. The overall 3-year and 5-year survival rate were 84%, 78%, respectively. Nineteen cases were squamous cell carcinomas and four were basaloid squamous cell carcinomas. Basaloid subtype was significantly affected to survival. Decannulation and oral feeding were possible in 100%. Conclusions:Supraglottic partial laryngectomy is oncologically safe and functionally good procedure in supraglottic cancers. Elective neck dissection is beneficial in management of occult cervical metastasis.

대인공포증의 치료를 위한 가상 연설 시뮬레이터의 실험적 제작 (Construction of Virtual Public Speaking Simulator for Treatment of Social Phobia)

  • 구정훈;장동표;신민보;조항준;안희범;조백환;김인영;김선일
    • 대한의용생체공학회:의공학회지
    • /
    • 제21권6호
    • /
    • pp.615-621
    • /
    • 2000
  • 대인공포증은 사람과의 대면을 무서워하여 그 상황을 회피하는 증상을 말한다. 이 공포증을 치료하기 위해서는 약물치료방법과 인지·행동 치료방법이 주로 사용되었다. 이런 기존의 방법들은 치료 효율이 떨어지며, 치료시 어려움이 있다는 단점을 가지고 있다. 최근에는 기존의 치료방법의 단점을 극복하기 위해 많은 연구에서 가상현실을 정신치료에 적용하고 있다. 가상환경은 환자에게 적절한 자극을 제공하여 환자로 하여금 공포감을 느끼도록 하고, 환자는 이러한 공포상황에 체계적으로 노출됨으로써 공포증을 극복할 수 있게 된다. 본 연구에서는 개인용 컴퓨터를 기반으로 가상 연설 시뮬레이터를 개발하여 대인공포증 치료에 이용하고자 한다. 가상 연설 시뮬레이터를 구성하기 위해 위치센서, 머리 부착형 디스플레이장치와 사운드 시스템을 사용하였고, 치료를 위한 가상환경은 가상청중 8명이 있는 세미나실을 배경으로 구성하였다. 또한 가상현실 정신치료에서 중요한 요소로 작용하는 몰입감을 높이기 위해 머리 부착형 디스플레이 장치에 위치센서를 부착함으로써 환자의 머리이동이 가상환경에 적용되도록 하였고, 여기에 삼차원 사운드를 적용함으로써 목소리나 박수소리 등 여러 가지 소리들이 사실적으로 느껴지도록 하였다. 또한 가상청중이 환자의 발표내용에 맞게 여러 가지 행동과 표정을 변하게 하였다. 본 연구에서 개발한 가상연설 시뮬레이터는 경제적이고 안전한 정신치료에 이용되는 것에 목적이 있으며, 앞으로의 임상실험을 통한 몰입과 공포유발 인자 및 치료효과의 에 관한 정보를 얻고, 이를 시뮬레이터에 계속 적용하는 연구가 필요할 것이다.

  • PDF

하악 전치부 상실로 인한 조음장애를 보이는 경도 지적장애 환아에서 탄성의치를 통한 조음능력의 향상 (Improvement of Articulation Disorder Using Flexible Partial Denture in Intellectural Disability Patient with Missing Lower Incisors)

  • 최해인;최병재;최형준;송제선;이제호
    • 대한소아치과학회지
    • /
    • 제40권4호
    • /
    • pp.306-313
    • /
    • 2013
  • 구강악안면의 여러 구조는 매우 복잡하고 정밀한 상호과정을 거쳐 말소리를 만들어낸다. 그 중 치아는 중요한 조음기관으로서 치아의 상실시 정상적인 발음을 하기 위해서는 혀와 턱의 위치 수정을 통한 적응이 필요하며, 적응 가능 범위를 벗어난 경우에는 적극적인 보철적, 교정적 치료를 요하게 된다. 소아의 다수 치아 상실은 조음에 어려움을 가져올 뿐만 아니라 부정교합, 악골발육 저하, 측두하악관절의 변위, 저작력 저하, 영양 불균형, 심미성 저하 등의 문제를 초래하기 때문에 반드시 상실부위의 회복이 필요하다. 아크릴릭 레진을 이용한 기존의 가철성 장치와 비교하여 Valplast$^{(R)}$ 탄성의치는 조직과 긴밀하기 접착되며 치은의 자연적인 색조를 투과시키는 얇고 강한 레진 유지부를 가져 심미성이 매우 높으며 우수한 물성을 가지는 등 많은 장점을 갖고 있다. 특히 전체적인 두께가 얇고 부피가 작아 이물감이 적고 혀의 움직임을 방해하지 않기 때문에 발음의 회복에 장점을 가진다. 본 증례는 완전탈구된 하악 전치부로 인해 조음장애를 보였으나 Valplast$^{(R)}$ 탄성의치를 장착한 후 조음의 개선을 보인 경도 지적장애 환아에 관한 것으로 조음검사를 통해 하악 전치부의 상실이 조음에 미치는 영향에 보고하고자 한다.