• 제목/요약/키워드: speech situation

검색결과 122건 처리시간 0.029초

뇌성마비 학생을 위한 말소리 산출 도구 프로그램 구현 (Development of Speech Generation Device Program for Student with Cerebral Palsy)

  • 고진복;전병운
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.448-458
    • /
    • 2009
  • 이 연구에서는 문자를 해득한 뇌성마비 학생들의 언어능력에 적절한 의사소통 도구를 구현할 목적으로 말소리 산출 도구(speech generation device: SGD) 프로그램을 제안하였다. 이 연구에서 제안하는 SGD 프로그램은 학습 도구로써의 기능과 의사표현을 위한 수단을 동시에 만족시킬 수 있는 프로그램으로 현재까지의 AAC 도구 사용 목적과 적용이 의사소통 보조기기의 고유한 기능에 한정되어 있었던 것과는 차별화된다. 또한, SGD 프로그램을 기반으로 시스템에서 제공하는 데이터를 분석하여 뇌성마비 학생의 언어 능력을 측정해 볼 수 있으며, 이를 근거로 언어지도 목표를 설정하고 학습 콘텐츠를 수정하여 제공할 수 있도록 구현하였다. 기존의 관련 소프트웨어와 비교해 볼 때, 이 연구에서 구현된 SGD는 인위적 스크립트 상황이 아닌 실제 교수 학습 상황에서 SGD를 통해 제공되는 학습 콘텐츠를 활용하여 보완 대체의사소통(augmentative and alternative communication)을 사용하는 뇌성마비 학생들에게 총체적 언어 지도가 가능하도록 구현하였다는 점에서 의의가 있다.

가변어휘 단어 인식기를 사용한 음성 명령 웹 브라우저 (Voice Command Web Browser Using Variable Vocabulary Word Recognizer)

  • 이항섭
    • 한국음향학회지
    • /
    • 제18권2호
    • /
    • pp.48-52
    • /
    • 1999
  • 본 논문에서는 웹 브라우저 상에서 한국어 음성인식을 이용하여 정보검색을 할 수 있는 가변어휘 단어 인식기를 사용한 음성 명령 웹 브라우저에 대하여 기술한다. 이 시스템의 특징은 웹 브라우저 상에서 보여지는 링크를 가지는 HyperText Word들과 웹 브라우저 메뉴를 음성으로 인식할 수 있는 것으로, 마우스 click 뿐만이 아니라 음성인식을 이용하여서도 웹 브라우저를 사용할 수 있다는 것이다. 웹 브라우저를 통해서 보여지는 문서에서 추출되는 인식 후보들은 각 문서에 따라 고정되지 않고 계속하여 변화하므로, 이러한 가변적인 인식 후보들을 인식하기 위해 가변어휘 단어 인식기를 사용하였다. 가변어휘 단어 인식기는 훈련용 음성 데이터와 무관한 임의의 새로운 어휘를 훈련 없이 인식해 낼 수 있는 인식기로 POW (Phonetically Optimized Words) 3,848 단어를 사용하여 훈련한 결과 32단어에 대해 93.8%의 단어 인식률을 보인다. 음성 명령 웹 브라우저는 Windows 95/NT 환경에서 Netscape Navigator를 사용하여 개발되었으며, 사용자가 음성을 사용하는 새로운 인터페이스를 배울 필요 없이 바로 사용할 수 있도록 사용자 편의성 부분도 고려하여 개발되었다. 개발된 음성 명령 웹 브라우저는 환경 독립, 화자 독립에 대해 On-line으로 실험한 결과 평균 90%의 인식성능을 보인다.

  • PDF

The Aquisition and Description of Voiceless Stops of Spanish and English

  • Marie Fellbaum
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.274-274
    • /
    • 1996
  • This presents the preliminary results from work in progress of a paired study of the acquisition of voiceless stops by Spanish speakers learning English, and American English speakers learning Spanish. For this study the hypothesis was that the American speakers would have no difficulty suppressing the aspiration in Spanish unaspirated stops; the Spanish speakers would have difficulty acquiring the aspiration necessary for English voiceless stops, according to Eckman's Markedness Differential Hypothesis. The null hypothesis was proved. All subjects were given the same set of disyllabic real words of English and Spanish in carrier phrases. The tokens analyzed in this report are limited to word-initial voiceless stops, followed by a low back vowel in stressed syllables. Tokens were randomized and then arranged in a list with the words appearing three separate times. Aspiration was measured from the burst to the onset of voicing(VOT). Both the first language (Ll) tokens and second language (L2) tokens were compared for each speaker and between the two groups of language speakers. Results indicate that the Spanish speakers, as a group, were able to reach the accepted target language VOT of English, but English speakers were not able to reach the accepted range for Spanish, in spite of statistically significant changes of p<.OOl by speakers in both groups of learners. A closer analysis of the speech samples revealed wide variability within the speech of native speakers of English. Not only is variability in English due to the wide range of VOT (120 msecs. for English labials, for example) but individual speakers showed different patterns. These results are revealing for the demands requied in experimental designs and the number of speakers and tokens requied for an adequate description of different languages. In addition, a simple report of means will not distinguish the speakers and the respective language learning situation; measurements must also include the RANGE of acceptability of VOT for phonetic segments. This has immediate consequences for the learning and teaching of foreign languages involving aspirated stops. In addition, the labelling of spoken language in speech technology is shown to be inadequate without a fuller mathematical description.

  • PDF

후두 전 절제 환자에서 음성재활을 위한 기관식도발성 (Tracheoesophageal Shunt Voice in Total Laryngectomee)

  • 왕수건;장선미
    • 대한후두음성언어의학회지
    • /
    • 제19권1호
    • /
    • pp.21-27
    • /
    • 2008
  • Total laryngectomy is the most useful procedure tor advanced laryngopharyngeal cancer, but it remains the major problem such as loss of voice. Voice restoration is essential for every patients who undergo a total laryngectomy. Ideal voice rehabilitation methods can resolve three factors. First, every laryngectomee can produce voice sufficient for communication, second every patient should be allowed to use both hands freely during phonation, and last, the voice restoration methods should be easy and safe without complication during and after treatment. Among various voice rehabilitation procedures during or after total laryngectomy, it can be divided electronic and pneumatic methods. In pneumatic methods, there are also divided both pulmonary air and non-pulmonary air methods. The non-pulmonary air methods include esophageal speech, buccal speech, and pharyngeal speech. Pulmonary air methods are divided into surgical and non-surgical such as pneumatic speech aid. In the surgical methods, there are neoglottic operation, tracheopharyngeal shunt, and tracheopharyngeal shunt operations. Recently, tracheoesophageal shunt with or without prosthesis are being recognized the most effective method. Blom-Singer low pressure prosthesis, Panje button, and Provox are well known types of prosthesis in the tracheoesophageal shunt operation. Amatsu method is a kind of famous tracheoesophageal shunt method without using prosthesis. Authors tried to review the published articles for evaluation of effectiveness and problems of tracheoesophageal shunt operation with or without prosthesis. In conclusion, indwelling type of prosthesis and pharyngeal myotomy and plexus neurectomy are recommended for higher success rate during tracheoesophageal puncture procedure. More over, Amatsu method is also one of the recommended voice rehabilitation procedure during total laryngectomy. In this situation, pharyngeal myotomy and plexus neurectomy may be helpful for better fluent communication.

  • PDF

한국어 핵심어 추출 및 연속 음성 인식을 위한 다목적 전처리 프로세서 설계 (Design of Multi-Purpose Preprocessor for Keyword Spotting and Continuous Language Support in Korean)

  • 김동헌;이상준
    • 디지털융복합연구
    • /
    • 제11권1호
    • /
    • pp.225-236
    • /
    • 2013
  • 음성인식 기술은 단순한 단어 인식을 넘어 자연스럽게 발성한 연속 음성도 인식할 수 있는 수준으로 발전해 왔다. 아이폰에 탑재된 자연어 음성인식 처리 소프트웨어인 시리(Siri)가 2010년에 발표되면서, 음성인식에 대한 연구가 관심을 받고 있다. 한국어 음성 인식 소프트웨어들은 대부분 단어 위주의 인식 서비스로 구성 되어 있으며, 잡음처리 및 음성 에너지 조절 기능들이 부족해 만족할 만한 인식률을 보이지 못하고 있다. 또한 요구된 발성 규칙을 따르지 못한 음성 질의들은 아예 처리하지 못하고 있는 실정이다. 본 논문에서는 이러한 현실적 어려움을 개선할 수 있도록 다목적 전처리 프로세서를 제안하였다. 이 처리기는 음성인식 엔진에 독립적이며, 잡음 제거 기능, 규칙에 따르지 않은 음성 질의도 처리 할 수 있는 핵심어 추출 기능, 그 핵심어를 수식하는 전술부 및 그 해당 음성 질의로부터 수행하기를 원하는 후술부 까지도 추출할 수 있는 기능을 갖추도록 하였다. 실험을 통해, 잡음 제거 효과 평가, 핵심어 인식 성공률, 연속음 인식 성공률을 측정하여 제안한 방법의 타당성을 확인하였다.

상황 정보를 활용한 동영상 문맥 광고 (Contextual In-Video Advertising Using Situation Information)

  • 이봉준;우현욱;이정태;임해창
    • 한국산학기술학회논문지
    • /
    • 제11권8호
    • /
    • pp.3036-3044
    • /
    • 2010
  • 동영상 데이터 서비스가 나날이 증가함에 따라 특정 동영상 장면에 적합한 광고를 보여주거나 추가적인 정보를 제공하려는 요구가 커지고 있다. 장면에 적합한 광고를 보여주기 위하여 동영상의 영상이나 음성 정보를 직접 이용하는 방법은 현재의 기술력으로 한계가 있고, 제목, 카테고리 정보, 요약 등의 메타데이터도 계속해서 변화하는 장면의 내용을 반영하지 못한다. 본 연구는 동영상의 대본 자막에서 추출한 장면의 상황 정보를 이용하여 주어진 동영상 장면에 적합한 광고를 자동으로 부착해 주는 새로운 동영상 문맥 광고 시스템을 제안한다. 대본 자막에서 추출한 상황 정보를 광고 검색에 이용했을 때 높은 성능 향상을 확인할 수 있었고, 이를 이용하여 사용자에게 더 적합한 광고를 보여줄 수 있다.

서인도제도의 로망스어 관련 혼성어 발음에 관한 고찰 - 중미의 $Gar\acute{i}funa$어와 큐바내 Patois어를 중심으로 - (A Study of Creole Languages' Pronunciation in the West Indies - Centering on Central American $Gar\acute{i}funa$ and Cuban Patois)

  • 김우중
    • 음성과학
    • /
    • 제5권2호
    • /
    • pp.93-107
    • /
    • 1999
  • This study deals with a general review of $Gar\acute{i}funa$ and Patois, creole languages which developed out of the sociohistorical situation of the last centuries and are mainly spoken in the West Indies and Carribean Coasts. In this paper, I present some notes and ideas on the linguistic developments and features of these languages. Especially I describe their function connected with a variety of social circumstances and their phonetical/phonological changes from the base languages. This is a result of fieldwork conducted in Honduras, Belize, Cuba and Mexico, from January 1996 to February 1998, using some surveys and collecting words from different materials and texts. And I hope this paper will contribute to research in 'mixed' languages as well as to historical linguists. I am very grateful to Mr. Mauricio $Tom\acute{a}s$, the only uriversity student in $Traves\acute{i}a$, a small town in nothern Honduras and to Mr. Carlos Marcos, a medical student who is from a Haitian family in Santiago de Cuba. Without their cooperation, I couldn't have conducted this research.

  • PDF

Essential technical and intellectual abilities for autonomous mobile service medical robots

  • Rogatkin, Dmitry A.;Velikanov, Evgeniy V.
    • Advances in robotics research
    • /
    • 제2권1호
    • /
    • pp.59-68
    • /
    • 2018
  • Autonomous mobile service medical robots (AMSMRs) are one of the promising developments in contemporary medical robotics. In this study, we consider the essential technical and intellectual abilities needed by AMSMRs. Based on expert analysis of the behavior exhibited by AMSMRs in clinics under basic scenarios, these robots can be classified as intellectual dynamic systems acting according to a situation in a multi-object and multi-agent environment. An AMSMR should identify different objects that define the presented territory (rooms and paths), different objects between and inside rooms (doors, tables, and beds, among others), and other robots. They should also identify the means for interacting with these objects, people and their speech, different information for communication, and small objects for transportation. These are included in the minimum set required to form the internal world model in an AMSMR. Recognizing door handles and opening doors are some of the most difficult problems for contemporary AMSMRs. The ability to recognize the meaning of human speech and actions and to assist them effectively are other problems that need solutions. These unresolved issues indicate that AMSMRs will need to pass through some learning and training programs before starting real work in hospitals.

Segmental Interpretation of Suprasegmental Properties in Non-native Phoneme Perception

  • Kim, Miran
    • 말소리와 음성과학
    • /
    • 제7권3호
    • /
    • pp.117-128
    • /
    • 2015
  • This paper investigates the acoustic-perceptual relation between Korean dent-alveolar fricatives and the English voiceless alveolar fricative /s/ in varied prosodic contexts (e.g., stress, accent, and word initial position). The denti-alveolar fricatives in Korean show a two-way distinction, which can be referred to as either plain (lenis) /s/ or fortis /$s^*$/. The English alveolar voiceless fricative /s/ that corresponds to the two Korean fricatives would be placed in a one-to-two non-native phoneme mapping situation when Korean listeners hear English /s/. This raises an interesting question of how the single fricative of English perceptually maps into the two-way distinction in Korean. This paper reports the acoustic-perceptual mapping pattern by investigating spectral properties of the English stimuli that are heard as either /s/ or /$s^*$/ by Korean listeners, in order to answer the two questions: first, how prosody influences fricatives acoustically, and second, how the resultant properties drive non-native listeners to interpret them as segmental features instead of as prosodic information. The results indicate that Korean listeners' responses change depending on the prosodic context in which the stimuli are placed. It implies that Korean speakers interpret some of the information provided by prosody as segmental one, and that the listeners take advantage of the information in their judgment of non-native phonemes.

음성 인식 테크놀로지 기반의 외국어 말하기 훈련 시스템 개발 (Development of a Foreign Language Speaking Training System Based on Speech Recognition Technology)

  • 구덕회
    • 정보교육학회논문지
    • /
    • 제23권5호
    • /
    • pp.491-497
    • /
    • 2019
  • 글로벌 사회로 발전함에 따라 외국어를 능숙하게 말하고 싶어하는 사람들이 많아지고 있다. 능숙하게 말하기 위해서는 말하는 훈련을 충분히 가져야 하는데 이때 대화 상대방을 필요로 한다. 최근에는 음성 인식 정보 기술의 발달로 인하여 대화 상대방의 인간이 없어도 외국어 말하기 훈련을 수행하는 시스템 개발이 가능할 것으로 기대되고 있다. 이에 본 연구에서는 외국어 말하기 훈련 교육을 위한 테스트베드 시스템을 개발하고 초등학교 수업에 적용하였다. 초등학생에게 영어 대화 상황을 제시하고 말하기 훈련을 실시하도록 하였다. 그 후, 시스템에 대한 만족도와 지속적인 활용 가능성을 조사하였다. 본 연구에서 개발한 시스템을 이용하면 외국어 말하기 학습 훈련에 도움이 된다는 점을 확인하였다.