• 제목/요약/키워드: speech technology

검색결과 1,900건 처리시간 0.028초

SOUND SIMILARITY JUDGMENTS AND PHONOLOGICAL UNITS

  • Yoon, Yeo-Bom
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1997년도 7월 학술대회지
    • /
    • pp.142-143
    • /
    • 1997
  • The purpose of this paper is to assess the psychological status of the phoneme, syllable, and various postulated subsyllabic units in Korean by applying the Sound Similarity Judgment (SSJ) task, to compare the results with those in English, and to discuss the advantage and disadvantage of the SSJ task as a tool for linguistic research. In Experiment 1, 30 subjects listened to pairs of 56 eve words which were systematically varied from 'totally different' (e.g., pan-met) to 'identical' (e.g., pan-pan). Subjects were then asked to rate sound similarity of each pair on a 10-point scale. Not very surprisingly, there was a strong correlation between the number of phonemic segments matched and the similarity score provided by the subjects. This result was in accord with the previous results from English (e.g., Vitz & Winkler, 1973; Derwing & Nearey, 1986) and supported the assumption that the phoneme is the basic phonological unit in Korean and English. However, there were sharply contrasting results between the two languages. When the pairs shared two phonemes (e.g., pan-pat; pan-pen; pan-man), the pairs sharing the fIrst two phonemes were judged significantly more similar than the other two types of pairs. Quite to the contrary, in the comparable English experiments, the pairs sharing the last two phonemes were judged significantly more similar than the other two types of pairs. Experiment 2 was designed to conflrm the results of Experiment 1 by controlling the 'degree' of similarity between phonemes. For example, the pair pan-pam can be judged more similar than the pair pan-nan, although both pairs share the same number of phonemes. This could be interpreted either as confirming the result of Experiment 1 or as the fact that /n/ is more similar to /m/ than /p/ is to /n/ in terms of shared number of distinctive features. The results of Experiment 2 supported the former interpretation. Thus, the results of both experiments clearly showed that, although the 'number' of matched phonemes is the important predictor in judging sound similarity of monosyllabic pairs of both languages, the 'position' of the matched phonemes exerts a different influence in judging sound similarity in the two languages. This contrasting set of results may provide interesting implications for the internal structure of the syllable in the two languages.

  • PDF

대학생의 영어 리듬과 억양구조 인식에 대한 연구 (A Study on the Perception of English Rhythm and Intonation Structure by Korea University Students)

  • 박주현
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1997년도 7월 학술대회지
    • /
    • pp.92-114
    • /
    • 1997
  • This study is aimed to grasp the actual problems of the perception of English rhythm and intonation structure by Korean University students who have studied English in the secondary schools for the past six years, and to establish the systems of English rhythm and intonation structure for the Korean students of English. For this study, the listening test is provided, and 100 students are chosen as the subjects of the study. The noticeable findings are summarized as follows: (1) Koreans perceive the words stress comparatively well in nonsense words, unfamiliar place names, and familiar word. (2) Koreans do not perceive the isochrony of English rhythm well enough. The perception of the sentence stress is very unstable, especially in the sentence involved in polysyllabic words, compound words, and 'emphatic stress' pr 'contrastive stress'(or in the different rhythmic patterns). (3) Koreans do not perceive the nucleus well enough. The perception of the nucleus is more stable in content words than in function words, at the end of a sentence than in the middle of a sentence, and in monosyllabic words than in the polysyllabic words. (4) Koreans do not perceive the boundary(or pause) of intonation group well enough. The perception of the pause is unstable in the long or complex sentence. (5) Koreans discriminate the meaning of English word stress comparatively well, especially in disyllabic words. But the discrimination is somewhat unstable in polysyllabic words and between 'adjective' and 'verb' (6) Koreans' discrimination of the intonation meaning is below the level. Koreans do not perceive the differences of intonation meaning according to the pitch accent or the focus. In conclusion, the writer will propose the procedures for the teaching of rhythm and intonation in the following order: word stress drill longrightarrowstressed and reduced syllables drilllongrightarrowrhythm group drilllongrightarrowthe varying rhythm drilllongrightarrowsentence stress drilllongrightarrownucleus drill longrightarrowintonation group drilllongrightarrowlong utterance drill of more than two intonation group.

  • PDF

스마트 기반 협동학습을 통한 의사소통능력 신장에 관한 연구 (Study on Ability to Communicate with the Smart-based Cooperative Learning)

  • 김정랑;노재춘
    • 정보교육학회논문지
    • /
    • 제18권4호
    • /
    • pp.625-632
    • /
    • 2014
  • 정보통신기술의 발달로 인하여 스마트 기기와 앱, SNS, 미러링 등을 이용한 의사소통이 이루어지고 있으며 이러한 사회의 변화를 반영하여 최근 다양한 협업 상호작용을 강조한 스마트교육이 대두되고 있다. 이에 본 연구에서는 초등학생의 의사소통능력을 신장시키기 위해 스마트교육과 LT 협동학습 모형을 연계한 '스마트 기반 협동학습' 모형을 개발하여 초등학교 3학년 사회과 수업에서 적용하고 스마트 기반 협동학습과 일반적인 협동학습이 의사소통능력에 미치는 영향을 각각 비교, 분석하였다. 그 결과, 일반적인 협동학습 모형을 적용한 수업의 초등학생들보다 스마트 기반 협동학습을 적용한 사회과 수업에서 초등학생들의 표현, 경청과 이해, 상호작용 등 의사소통능력의 모든 하위 영역이 신장되었다. 이는 스마트 기반 협동학습이 학습자의 생각이나 의견을 말과 글로 명료하게 표현하게 하고, 다른 학생들의 말과 글의 의미를 파악할 수 있게 해 주며 사회적 상황에서 목적에 맞게 상호작용하는 능력을 향상시켜 준다고 할 수 있다.

아이트래킹 및 음성인식 기술을 활용한 지체장애인 컴퓨터 접근 시스템 (A Computer Access System for the Physically Disabled Using Eye-Tracking and Speech Recognition)

  • 곽성은;김이삭;심드보라;이승환;황성수
    • 한국HCI학회논문지
    • /
    • 제12권4호
    • /
    • pp.5-15
    • /
    • 2017
  • 컴퓨터 대체접근 기기는 지체장애인의 사회활동 참여에 대한 욕구를 충족시킬 수 있는 방법 중의 하나로 정보통신기술의 발달과 함께 그 필요성이 증대되고 있다. 이러한 기기들은 대부분 발, 머리 등을 이용하여 컴퓨터에 접근할 수 있도록 하는데, 지체장애인의 특성상 발, 머리 등을 이용하여 마우스를 컨트롤하는 것은 쉽지 않으며 속도와 정확도면에서 한계가 있다. 본 논문에서는 기존의 대체접근 기기의 한계를 보완한 '지체장애인 컴퓨터 대체접근시스템'을 제안한다. 제안하는 시스템은 아이트래킹 기술을 이용하여 사용자의 시선만으로 마우스를 이동시킬 수 있고 비교적 누르기 쉬운 외부버튼을 통해 마우스 클릭이 가능하며 음성인식을 통해 문자를 쉽고 빠르게 입력할 수 있다. 또한 마우스 우클릭, 더블클릭, 드래그 기능, 화상 키보드 기능, 인터넷 기능, 스크롤 기능 등 세부적인 기능을 제공하여 컴퓨터가 제공하는 대부분의 작업을 수행할 수 있다.

PG-GAN을 이용한 패션이미지 데이터 자동 생성 (Automaitc Generation of Fashion Image Dataset by Using Progressive Growing GAN)

  • 김양희;이찬희;황태선;김경민;임희석
    • 사물인터넷융복합논문지
    • /
    • 제4권2호
    • /
    • pp.1-6
    • /
    • 2018
  • 이미지와 같은 고차원 데이터로부터 새로운 샘플 데이터를 생성하는 기술은 음성 합성, 이미지 변환 및 이미지 복원 등에 다양하게 활용되고 있다. 본 논문은 고해상도의 이미지들을 생성하는 것과 생성한 이미지들의 variation을 높이기 위한 방안으로 Progressive Growing of Generative Adversarial Networks(PG-GANs)을 구현 모델로 채택하였고, 이를 패션 이미지 데이터에 적용하였다. PG-GANs은 생성자(Generator)와 판별자(discriminator)를 동시에 점진적으로 학습하도록 하는데, 저해상도의 이미지에서부터 계속해서 새로운 레이어들을 추가하여 결과적으로 고해상도의 이미지를 생성할 수 있게끔 하는 방식이다. 또한 생성 데이터의 다양성을 높이기 위하여 미니배치 표준편차 방법을 제안하였고 GAN 모델을 평가하기 위한 기존의 MS-SSIM이 아닌 Sliced Wasserstein Distance(SWD) 평가 방법을 제안하였다.

한국인이 발음한 한국어 /에, 애/와 영어 $/{\varepsilon},\;{\ae}/$모음 (An Acoustic Comparative Study of Korean /에, 애/ and English $/{\varepsilon},\;{\ae}/$ Pronounced by Korean Young Male Speakers)

  • 황혜정;문승재
    • 대한음성학회지:말소리
    • /
    • 제56호
    • /
    • pp.29-47
    • /
    • 2005
  • Investigating and comparing English vowels $/{\varepsilon}/\;and\;/{\ae}/$, and their-supposedly- corresponding vowels in Korean /ㅔ/ and /ㅐ/, this study addresses the following questions: Do Koreans pronounce/ㅔ/ and /ㅐ/ differently? Do they pronounce English $/{\varepsilon}/\;and\;/{\ae}/$ differently? And what is the relationship between the Korean vowels and the English vowels? Is the conventional correspondence (/ㅔ:${\varepsilon}/$, and /ㅐ/:${\ae)/$ appropriate? The results showed that 24 Korean male college students distinguish neither Korean /ㅔ/ and /ㅐ/ nor English $/{\varepsilon}/\;and\;/{\ae}/$, thus suggesting that their inability to distinguish the two vowels in their native tongue has an effect on their production of the English vowels. While not distinguishable within a language, Korean /ㅔ/ and /ㅐ/ still form a separate group from English $/{\varepsilon}/\;and\;/{\ae}/$. But Korean-Produced $/{\varepsilon}/\;and\;/{\ae}/$ are significantly different from American-produced $/{\varepsilon}/\;and\;/{\ae}/:$ Korean-produced $/{\varepsilon}/\;and\;/{\ae}/$ have much lower F1 and F2 than American-produced counterparts. Accordingly it is advised that, in learning English pronunciation, Korean students should be instructed to take the English vowel system as a separate system from Korean one, and thus, not to substitute Korean vowels for English vowels. And students should be provided with specific instructions on the articulatory differences between English vowels and Korean vowels. For example, Cey should be instructed to lower their jaws more for English $/{\varepsilon}/\;and\;/{\ae}/$ than for Korean /ㅔ/ and /ㅐ/.

  • PDF

HMM에 의한 원형 마이크로폰 어레이 적용 드론 위치 추적 (Drone Location Tracking with Circular Microphone Array by HMM)

  • 정형찬;임원호;곽준봉;이시티아크 아메드;장경희
    • 한국항행학회논문지
    • /
    • 제24권5호
    • /
    • pp.393-407
    • /
    • 2020
  • 불법 무인기에 의한 위협을 줄이기 위해, 음향 기반 기법에 의한 추적시스템을 구현하였다. 드론 음향 추적 방식에는 3가지 주요 사항이 있다. 첫째, 가변 빔 형성을 통해 공간을 스캔하여 음원을 찾아 마이크 어레이를 사용하여 소리를 녹음한다. 둘째, 음원의 존재 유·무 여부를 알기 위해 은닉 마르코프 모델(HMM)로 분류한다. 마지막으로 음원이 드론인 경우, 적응형 빔 패턴을 기반의 추적기준 신호로 기록 및 저장된 음원을 사용한다. 시뮬레이션은 배경 노이즈 및 간섭 사운드가 없는 이상적인 상태와 배경 노이즈 및 간섭 사운드가 있는 비이상적인 조건 모두에서 수행되며 불법적인 드론의 추적 성능을 평가하였다. 드론 추적 시스템은 마이크 어레이 성능에 따른 탐색 거리 성능향상 및 음향 패턴 일치 정도에 따른 드론 유무 판정 기준을 설계하여 음성판독 회로설계에 반영하였다.

상황 정보를 활용한 동영상 문맥 광고 (Contextual In-Video Advertising Using Situation Information)

  • 이봉준;우현욱;이정태;임해창
    • 한국산학기술학회논문지
    • /
    • 제11권8호
    • /
    • pp.3036-3044
    • /
    • 2010
  • 동영상 데이터 서비스가 나날이 증가함에 따라 특정 동영상 장면에 적합한 광고를 보여주거나 추가적인 정보를 제공하려는 요구가 커지고 있다. 장면에 적합한 광고를 보여주기 위하여 동영상의 영상이나 음성 정보를 직접 이용하는 방법은 현재의 기술력으로 한계가 있고, 제목, 카테고리 정보, 요약 등의 메타데이터도 계속해서 변화하는 장면의 내용을 반영하지 못한다. 본 연구는 동영상의 대본 자막에서 추출한 장면의 상황 정보를 이용하여 주어진 동영상 장면에 적합한 광고를 자동으로 부착해 주는 새로운 동영상 문맥 광고 시스템을 제안한다. 대본 자막에서 추출한 상황 정보를 광고 검색에 이용했을 때 높은 성능 향상을 확인할 수 있었고, 이를 이용하여 사용자에게 더 적합한 광고를 보여줄 수 있다.

유발된 정서가 대학생의 부정적 어휘정보 처리에 미치는 효과 (The Effects of Priming Emotion among College Students at the Processes of Words Negativity Information)

  • 김충명
    • 융합정보논문지
    • /
    • 제10권10호
    • /
    • pp.318-324
    • /
    • 2020
  • 본 연구는 정상 및 불안 집단 대학생을 대상으로 하나 또는 그 이상의 부정적 어휘를 포함하는 서술어의 의미추론 과정에서 정서유형 및 부정어휘 출현의 정도가 과제처리 속도에 미치는 영향을 알아보고자 수행되었다. 정서 3유형, 자극 2유형 그리고 부정어휘 횟수 3유형을 피험자 내 변인으로, 벡(Beck) 불안척도로 구분된 불안수준을 피험자 간 변인으로 혼합반복측정 설계를 적용하여 피험자 반응시간에 대해 분석한 결과, 정서유형과 자극의 종류 그리고 부정어휘 횟수에 대한 주효과를 확인하였으며, 불안수준 x 부정어 횟수에서 상호작용이 발견되었다. 긍정적 정서에 비해 부정적 정서에서, 비언어 자극보다는 언어 자극 환경에서 과제처리에 더 효율적이었지만, 부정어휘 변인에서는 그 횟수의 증가가 정상집단의 신속한 반응과 불안집단의 지연된 반응으로 분기되면서 부정어휘처리 반응시간의 지체로 나타났다. 또한 유입 정서유형 및 자극의 종류와 상관없이 불안수준은 과제처리 속도를 지연시키는 요인으로 확인되었다. 아울러 추후 연구를 위한 함의와 한계를 논의하였다.

음모론 혹은 토론의 장으로써의 인터넷 방송: Afreeca TV의 망치부인을 중심으로 (Internet Broadcasting As a Place for Conspiracy Theory or Discussion: Focus on BJ Hammer Wife of Afreeca TV)

  • 한석희
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.61-70
    • /
    • 2017
  • 본 연구는 현재 한국 사회에서 크게 성장 중인 인터넷 방송의 모습을 탐구한다. 기술이 발달함에 따라, 기존의 시청자들 개인이 스스로 방송하게 되는 인터넷 방송 시장이 새롭게 태어났다. 국내에서 가장 대중적인 인터넷 방송플랫폼은 Afreeca TV로, Broadcasting Jockey(BJ)들이 자신의 채널에서 고유의 콘텐츠로 다양한 장르의 방송을 하고 있다. 근래의 혼란스러운 한국 사회와 맞물려, 시사/정치의 장르도 인기가 점점 높아진 장르로 변하고 있다. 구체적으로, 본 연구는 시사/정치 부분에서 유명한 BJ 망치부인을 사례를 중심으로 분석하여, 그녀의 채널의 특징, 의견, 시청자들과 소통 방법이 한국 사회에서 언론의 자유에 대해 어떠한 시사점을 던지는 지 등을 분석한다. 이를 통해, 인터넷 방송이 음모론 혹은 토론의 장이 되는지에 대해 입체적으로 탐구하고, 더 나아가 인터넷 방송의 청사진에 대해 토론한다.