• 제목/요약/키워드: visual-audio

검색결과 424건 처리시간 0.028초

시각과 청각에 의한 공간적 지각에 관한 연구 (A Study of the spatial perception by audio-visual information)

  • 이채봉;강대기
    • 융합신호처리학회논문지
    • /
    • 제11권2호
    • /
    • pp.132-136
    • /
    • 2010
  • 본 연구에서는 시청각 자극의 공간적 차이가 지각 공간에 있어서 사물과 영상의 배치에 주는 영향을 조사하기 위해 심리적 실험을 하였다. 실험에서는 시각자극과 청각자극을 동시에 제시하고 두 개의 자극이 공간적으로 어느 정도 차이를 느끼는가를 판단하였다. 시각자극은 정면에 있는 스피커를 중심으로 $-70^{\circ}$, $-40^{\circ}$, $-20^{\circ}$, $0^{\circ}$, $20^{\circ}$, $40^{\circ}$, $70^{\circ}$의 7방향, 청각자극은 시각자극을 중심으로 하여 $-20^{\circ}{\sim}20^{\circ}$까지 $5^{\circ}$ 간격으로 9방향을 제시하였다. 실험 참가자는 시각자극과 청각자극이 어느 정도 차이가 있다라고 느낀 것을 1에서 5까지 5단계 평가 척도를 이용하여 회답하였다. 그 결과 시각자극의 제시 각도가 $0^{\circ}$의 경우는 청각자극의 제시 각도가 시각자극의 제시 각도에서 멀어짐에 따라 점차적으로 크게 나타났으며 제시 각도를 중심으로 좌우 대칭으로 나타났다. 정면에서 우측에 시각자극이 제시된 경우는 청각자극의 제시 각도가 시각자극의 제시 각도에서 멀어짐에 따라 평가치가 크게 되었다. 이것은 시각자극의 제시 각도가 $0^{\circ}$의 경우와 같은 경향을 나타내었다. 반대로 좌측에 시각자극이 제시된 경우는 평가치가 작게 나타났다. 이것은 제시 각도가 멀어짐에도 불구하고 같은 방향에서 제시되고 있다는 것을 알 수 있으며 거리를 짧게 인식하는 경향이 나타났다.

음성인식 기반 인터렉티브 미디어아트의 연구 - 소리-시각 인터렉티브 설치미술 "Water Music" 을 중심으로-

  • 이명학;강성일;김봉화;김규정
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.354-359
    • /
    • 2008
  • 소리-시각 인터랙티브 설치미술인 "Water Music" 은 관객의 음성에 따라서 변하는 물결의 파동을 표현한다. 음정인식 기반 인터페이스 기술을 이용하여 벽면에 비디오 프로젝션 된 시각적 물결이미지로 나타난다. 물결이미지는 동양화의 붓으로 그린 물결과 작은 원형의 입자들을 생성하여 표현된 영상으로 구성된다. 관객은 입김을 불어 넣거나 소리를 냄으로써 화면에서 연속적으로 생성되는 컴퓨터 프로그램 기반 물결의 움직임과 상호 반응할 수 있다. 이러한 공생적인 소리 시각 환경은 관객에게 생각으로 그리고 신체적으로 환영적 공간을 경험하도록 한다. 본 설치작업에서 관객과 상호 반응 할 수 있는 움직이는 물결을 생성하기 위하여 적용된 주요 프로그램은 Visual C++ and DirectX SDK이며, 풀 프레임 3D 렌더링 기술과 파티클 시스템이 사용되었다.

  • PDF

Design of Music Learning Assistant Based on Audio Music and Music Score Recognition

  • Mulyadi, Ahmad Wisnu;Machbub, Carmadi;Prihatmanto, Ary S.;Sin, Bong-Kee
    • 한국멀티미디어학회논문지
    • /
    • 제19권5호
    • /
    • pp.826-836
    • /
    • 2016
  • Mastering a musical instrument for an unskilled beginning learner is not an easy task. It requires playing every note correctly and maintaining the tempo accurately. Any music comes in two forms, a music score and it rendition into an audio music. The proposed method of assisting beginning music players in both aspects employs two popular pattern recognition methods for audio-visual analysis; they are support vector machine (SVM) for music score recognition and hidden Markov model (HMM) for audio music performance tracking. With proper synchronization of the two results, the proposed music learning assistant system can give useful feedback to self-training beginners.

멀티모달러티를 이용한 실시간 음원추적 시스템 구현 (The Implementation of Real-Time Speaker Localization Using Multi-Modality)

  • 박정옥;나승유;김진영
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.459-461
    • /
    • 2004
  • This paper presents an implementation of real-time speaker localization using audio-visual information. Four channels of microphone signals are processed to detect vertical as well as horizontal speaker positions. At first short-time average magnitude difference function(AMDF) signals are used to determine whether the microphone signals are human voices or not. And then the orientation and distance information of the sound sources can be obtained through interaural time difference and interaual level differences. Finally visual information by a camera helps get finer tuning of the speaker orientation. Experimental results of the real-time localization system show that the performance improves to 99.6% compared to the rate of 88.8% when only the audio information is used.

  • PDF

효과적인 표준 발음 교육 (The Effective Education of the Standard Pronunciations)

  • 이동석
    • 대한음성학회지:말소리
    • /
    • 제51호
    • /
    • pp.17-37
    • /
    • 2004
  • The purpose of this dissertation is to make the general korean speakers to learn the standard pronunciations. But it is in existence that the obstructions of the command of the standard pronunciations. They are the mistake in the education course on the korean pronunciations, the teacher's capability and the mass communications's duplicity. To overcome this obstructions, we must concentrate our efforts on the propagation of the standard pronunciations. To propagate of the standard pronunciations we can take a several method. These are the presentation of the pronunciation mistakes, audio-visual teaching, the presentation of the pronunciation principles and the use of the korean dictionary. The standard pronunciations are different from the pronunciations of the general korean speakers in many respects. So we can't make an accurate estimate of the pronunciation's changes. No one knows what will happen in the future about the korean pronunciations. But we must teach the standard pronunciations to the general korean speakers. The standard pronunciations are offically valid in the present time.

  • PDF

입술정보를 이용한 음성 특징 파라미터 추정 및 음성인식 성능향상 (Estimation of speech feature vectors and enhancement of speech recognition performance using lip information)

  • 민소희;김진영;최승호
    • 대한음성학회지:말소리
    • /
    • 제44호
    • /
    • pp.83-92
    • /
    • 2002
  • Speech recognition performance is severly degraded under noisy envrionments. One approach to cope with this problem is audio-visual speech recognition. In this paper, we discuss the experiment results of bimodal speech recongition based on enhanced speech feature vectors using lip information. We try various kinds of speech features as like linear predicion coefficient, cepstrum, log area ratio and etc for transforming lip information into speech parameters. The experimental results show that the cepstrum parameter is the best feature in the point of reconition rate. Also, we present the desirable weighting values of audio and visual informations depending on signal-to-noiso ratio.

  • PDF

The use of audio-visual aids and hyper-pronunciation method in teaching English consonants to Japanese college students

  • Todaka, Yuichi
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.149-154
    • /
    • 1996
  • Since the 1980s, a number of professionals in the ESL/EFL field have investigated the role of pronunciation in the ESL/EFL curriculum. Applying the insights gained from the second language acquisition research, these efforts have focused on the integration of pronunciation teaching and learning into the communicative curriculum, with a shift towards overall intelligibility as the primary goal of pronunciation teaching and learning. The present study reports on the efficacy of audio-visual aids and hyper-pronunciation training method in teaching the productions of English consonants to Japanese college students. The talk will focus on the implications of the present study, and the presenter makes suggestions to teaching pronunciation to Japanese learners.

  • PDF

위계적 고착현상 치료 프로그램의 적용: 사례 연구 (Hierarchical Treatment of Aphasic Perserveration Program: A Case Study)

  • 정옥란;심홍임;고도흥
    • 음성과학
    • /
    • 제8권4호
    • /
    • pp.75-86
    • /
    • 2001
  • This study explored the effectiveness of a hierarchical treatment of aphasic perseveration (TAP) program in a Korean client with transcortical sensory aphasia. The subject with 52% perserveration score (Korean version of Boston Naming Test : K-BNT) was 44 year-old female with MCA (Middle cerebral artery) infarction. The experimental design used was an alternating treatment design with the hierarchical TAP and conventional audio-visual stimulation. The frequency of occurrence of perseverative behaviors and correct response in naming performance were analyzed and compared. It was claimed that the hierarchical TAP was more effective in naming performance than conventional audio-visual stimulation in terms of correct naming response. The frequency of occurrence of perseverative behaviors was lower in hierarchical TAP but the difference was relatively small. Unlike in English, sentence completion task was no longer stimulable while unison speech was very stimulable among the specific strategies of TAP program in Korean. Therefore, it could be said that TAP is language-dependent.

  • PDF

비디오 문서의 구조 정보를 이용한 메타데이터 모델링에 관한 연구 (A study on Metadata Modeling using Structure Information of Video Document)

  • 권재길
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권4호
    • /
    • pp.10-18
    • /
    • 1998
  • 비디오 정보는 전자도서관이나 WWW 및 주문형 비디오(VOD) 시스템과 같은 다양한 분야에서 중요한 요소로 부각되고 있으며, 시청각적(audio-visual), 시공간적(spatial-temporal), 의미적(semantics) 정보를 모두 포함하고 있어 사용자에게 다양한 형태의 정보를 제공할 수 있다. 또한 대부분의 경우 비디오 문서 전체를 검색하는 대신 비디오의 원하는 장면만을 검색할 수 있는 기능이 요구되고 있다. 따라서 본 논문에서는 이러한 검색의 다양성을 지원하기 위해 계층적으로 구성되어 있는 동영상 문서의 구조 정보를 이용하여 메타데이터를 모델링하고, 이를 통하여 동영상 문서를 통합적으로 다룰 수 있는 데이터베이스 스키마를 설계한다.

  • PDF

치과기공과 교수방법의 효율화를 위한 방안 (The Plan for the Effective Method of Dental Laboratory Technology)

  • 이도경
    • 대한치과기공학회지
    • /
    • 제8권1호
    • /
    • pp.31-36
    • /
    • 1986
  • This treatise suggests the effective method for the dental laboratory technology teaching plan. It will present concrete practical steps for and audio-visual dental laboratory technology education approach. It will also help students to understand the dental laboratory theory and practice learned in the class and make use of it greatly in the field work. As follows: 1. Instructor should teach interestingly basic dental laboratory technology theory with illustrations and figures on the teaching method. 2. In practical traing class, instructor should teach every step, using audio-visual materials such as slides and video tapes/Instructor and his assist and should show an example to the students. 3. Instructor should make a standard and train the studtnes repeatedly until they come up to it. 4. Students should be skilled in every case through field work during their spare time and vacation. 5. Instructor should also teach job moral and manner to the students so that they can be adapted themselves to the social activities and be successful dental laboratory technician after graduation.

  • PDF