• 제목/요약/키워드: visual-audio

검색결과 424건 처리시간 0.027초

Audio-visual 멀티모달 정보 기반의 비정상 활성 돼지 탐지 시스템 (Abnormal Active Pig Detection System using Audio-visual Multimodal Information)

  • 채희찬;이준희;이종욱;정용화;박대희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.661-664
    • /
    • 2022
  • 양돈을 관리하는 데에 있어 비정상 개체를 식별하고 사전에 추적하거나 격리할 수 있는 양돈업 시스템을 구축하는 것은 효율적인 돈사관리를 위한 필수 요소이다. 그러나 돈사내의 이상 상황을 탐지하는 연구는 보고되었지만, 이상 상황이 발생한 돼지를 특정하여 식별하는 연구는 찾아보기 힘들다. 따라서, 본 연구에서는 소리를 활용하여 이상 상황이 발생함을 탐지한 후 영상을 활용하여 소리를 낸 특정 돼지를 식별할 수 있는 시스템을 제안한다. 해당 시스템의 주요 알고리즘은 활성 화자 탐지 문제에서 착안하여 이를 돈사에 맞게 적용하여, 비정상 소리를 내는 활성 돼지를 식별 가능하도록 구현하였다. 제안한 방법론은 모의 실험을 통해 돈사 내의 이상 상황이 발생한 돼지를 식별할 수 있음을 확인하였다.

대화형 방송을 위한 3차원 오디오 방송단말 (A 3D Audio Broadcasting Terminal for Interactive Broadcasting Services)

  • 박기윤;이태진;강경옥;홍진우
    • 방송공학회논문지
    • /
    • 제10권1호
    • /
    • pp.22-30
    • /
    • 2005
  • 본 논문에서는 사용자 제어에 따라 3차원 오디오 장면을 재구성할 수 있는 대화형 오디오 방송단말에 관하여 기술한다. MPEG-4 AudioBIFS 규격에 따라 계층적으로 표현한 오디오 장면의 속성을 사용자 제어에 따라 갱신하고, 주어진 속성을 참조하여 오디오 데이터를 3차원 공간상에 재합성하는 방식을 취한다. 단말은 MPEG-4 Audio 최상위 노드와 몇몇 비디오 노드를 지원하며, 센서 노드와 라우트 요소를 이용하는 대신에 노드 유형에 따른 사용자 인터페이스를 미리 정의함으로써 필드 갱신 BIFS 명령어를 지원한다. 3차원 오디오 데이터를 재생하는 기능은 사용자의 입력에 대한 피드백을 풍부하게 하여 대화형 방송의 효과를 극대화하고, 사실감을 제고하는 데 중요한 역할을 담당한다. 본 단말에서는 3차원 오디오 기술을 이용하여 음상의 위치, 지향성, 모양, 잔향특성 등을 사용자가 제어할 수 있다. 본 논문에서는 가상 합주 프로그램 등의 서비스 예를 통해 대화형 방송단말의 서비스 모델을 제시한다.

Comparison of McGurk Effect across Three Consonant-Vowel Combinations in Kannada

  • Devaraju, Dhatri S;U, Ajith Kumar;Maruthy, Santosh
    • Journal of Audiology & Otology
    • /
    • 제23권1호
    • /
    • pp.39-48
    • /
    • 2019
  • Background and Objectives: The influence of visual stimulus on the auditory component in the perception of auditory-visual (AV) consonant-vowel syllables has been demonstrated in different languages. Inherent properties of unimodal stimuli are known to modulate AV integration. The present study investigated how the amount of McGurk effect (an outcome of AV integration) varies across three different consonant combinations in Kannada language. The importance of unimodal syllable identification on the amount of McGurk effect was also seen. Subjects and Methods: Twenty-eight individuals performed an AV identification task with ba/ga, pa/ka and ma/ṇa consonant combinations in AV congruent, AV incongruent (McGurk combination), audio alone and visual alone condition. Cluster analysis was performed using the identification scores for the incongruent stimuli, to classify the individuals into two groups; one with high and the other with low McGurk scores. The differences in the audio alone and visual alone scores between these groups were compared. Results: The results showed significantly higher McGurk scores for ma/ṇa compared to ba/ga and pa/ka combinations in both high and low McGurk score groups. No significant difference was noted between ba/ga and pa/ka combinations in either group. Identification of /ṇa/ presented in the visual alone condition correlated negatively with the higher McGurk scores. Conclusions: The results suggest that the final percept following the AV integration is not exclusively explained by the unimodal identification of the syllables. But there are other factors which may also contribute to making inferences about the final percept.

Comparison of McGurk Effect across Three Consonant-Vowel Combinations in Kannada

  • Devaraju, Dhatri S;U, Ajith Kumar;Maruthy, Santosh
    • 대한청각학회지
    • /
    • 제23권1호
    • /
    • pp.39-48
    • /
    • 2019
  • Background and Objectives: The influence of visual stimulus on the auditory component in the perception of auditory-visual (AV) consonant-vowel syllables has been demonstrated in different languages. Inherent properties of unimodal stimuli are known to modulate AV integration. The present study investigated how the amount of McGurk effect (an outcome of AV integration) varies across three different consonant combinations in Kannada language. The importance of unimodal syllable identification on the amount of McGurk effect was also seen. Subjects and Methods: Twenty-eight individuals performed an AV identification task with ba/ga, pa/ka and ma/ṇa consonant combinations in AV congruent, AV incongruent (McGurk combination), audio alone and visual alone condition. Cluster analysis was performed using the identification scores for the incongruent stimuli, to classify the individuals into two groups; one with high and the other with low McGurk scores. The differences in the audio alone and visual alone scores between these groups were compared. Results: The results showed significantly higher McGurk scores for ma/ṇa compared to ba/ga and pa/ka combinations in both high and low McGurk score groups. No significant difference was noted between ba/ga and pa/ka combinations in either group. Identification of /ṇa/ presented in the visual alone condition correlated negatively with the higher McGurk scores. Conclusions: The results suggest that the final percept following the AV integration is not exclusively explained by the unimodal identification of the syllables. But there are other factors which may also contribute to making inferences about the final percept.

웹 콘텐츠의 정보제시유형이 어린이 뉴스정보처리과정에 미치는 영향 (The Effects of the Presentation Mode of Web Contents on the Children's Information Processing Process)

  • 최이정
    • 한국콘텐츠학회논문지
    • /
    • 제5권3호
    • /
    • pp.113-122
    • /
    • 2005
  • 본 연구는 웹 콘텐츠 표현의 기본 4요소라고 할 수 있는 동영상, 오디오 이미지, 텍스트의 서로 다른 활용이 수용자의 정보처리과정에 어떤 영향을 미치는지를 특히 어린이 뉴스 사이트를 중심으로 실험연구를 통해 고찰한 것이다. 이를 위해 다섯 개의 어린이 피험자 그룹별로 똑같은 스토리의 뉴스정보를 각각 "동영상1(화면과 음성정보 중복)", "동영상2(화면과 음성정보 분리)", "오디오", "텍스트", "텍스트+이미지(사진)"의 서로 다른 형태로 제작한 웹사이트를 통해 전달하고 집단간 뉴스정보기억차이를 검증했다. 검증결과 동영상으로 뉴스를 전달하도록 디자인된 사이트는 다른 형식의 사이트에 비해 어린이의 뉴스정보기억과 관련하여 가장 효율적인 것으로 나타났고, 이런 동영상의 장점은 동영상내의 화면과 음성정보가 중복될 때 특히 강화되는 것으로 나타났다.

  • PDF

포스트모던적 관점에서 본 모션그래픽 디자인 접근 방안 (Method of Motion Graphic Design Approach from Postmodern Point of View)

  • 김교완;홍수정
    • 한국콘텐츠학회논문지
    • /
    • 제6권9호
    • /
    • pp.124-131
    • /
    • 2006
  • 현재 모션그래픽은 하나의 산업분야로 자리 잡아 그래픽 디자인에 있어서 독자적인 장르를 형성하고 있다. 디자이너는 문자, 이미지, 그래픽, 등의 시각적 혹은 형태적인 운영이나 해석은 물론이고 모션의 연출과 사운드까지도 메시지를 전달하는 표현요소로서 인식하여야 한다. 그러나 디자이너들에게 있어서 시각적인 모션 원리나 청각적인 사운드 표현의 이론적 기준은 아직 모호한 상태이고 대부분 그들의 감각에 의존하고 있는 상황이다. 이러한 문제의 해결을 위해 장르 간의 배타적 구분에 얽매이지 않은 포스트모더니즘의 시각에서 모션그래픽을 연구해 보고자 한다. 무용 안무의 활용은 오브제의 움직임이라는 시각적 정보전달과 음악이라는 청각적 영상 전달이라는 측면에서 모션그래픽 디자인의 접근 방법이 될 수 있을 것이다. 이에 본 논문은 무용과 음악의 기본구조를 모션그래픽에 대입시켜 그 연관성에 대해 알아보았고 이를 바탕으로 모니터 안에서 오브제의 움직임에 따른 효과적인 사운드 표현 방법과 기술에 대해 연구하였다. 무용 안무의 움직임과 음파의 특성을 기초로 하여 예술적 가치를 인지하고 모션그래픽 디자이너들의 폭넓은 창작 방법에 대한 방향을 모색하는 데에 이 논문의 의의를 둔다.

  • PDF

지역주민(地域住民)의 중학교(中學校) 실(室) 이용(利用)에 관(關)한 모델 (A Model for the Use of Middle School Rooms by the Community)

  • 민창기
    • 교육시설
    • /
    • 제6권2호
    • /
    • pp.13-23
    • /
    • 1999
  • This paper seeks to find out the policies of management and layout of middle school rooms for the community people's use. This paper surveys community's needs with respect to both the use of school rooms before, during, and after classes and preferences of use of school rooms. This paper adopts two experimental case studies to find out the models. It uses t-test analysis of the statistics to find out community people's preferences for the use of school rooms between two communities in an urban area, and uses simple and multiple regression analyses to develop models concerning community people's uses of school rooms before, during, and after classes. It also uses cluster analysis to find out the cluster among community people's preference of school rooms. It found, first, that community people's use of school rooms after class can be influenced by the uses of a play ground, a music classroom, an audio visual classroom, and a gymnasium. The use during regular classes is related to the uses of the fine arts classroom, a general classroom, a home economics classroom, a gymnasium, and a playground. The use before class is affected by the uses of a fine arts classroom, a playground, and a library. It also found that, with respect to community people's preferential use of school rooms, the rooms can be clustered as a cluster of laboratories such as a general classroom, a music room, a fine arts classroom, a science classroom, a home economics classroom, and a technique classroom, a cluster of athletic areas such as a gymnasium and a playground, and a cluster of supporting facilities such as a library, an audio visual classroom, and a computer classroom. Those clusters can also be clustered in more detail, i. e., that both a general classroom and playground can be apart from a cluster of laboratories or a cluster of supporting facilities; that an audio visual classroom can be fostered into a cluster with a home economics affairs classroom and a technique classroom. Finally this paper suggests policies of management and layout of school rooms.

  • PDF

시선추적-뇌파 기반의 비디오 요약 생성 방안 연구 (Video Summarization Using Eye Tracking and Electroencephalogram (EEG) Data)

  • 김현희;김용호
    • 한국문헌정보학회지
    • /
    • 제56권1호
    • /
    • pp.95-117
    • /
    • 2022
  • 본 연구는 시선 및 뇌파 정보를 이용하여 오디오-비주얼(audio-visual, AV) 시맨틱스 기반의 동영상 요약 방법들을 개발하고 평가해 보았다. 이를 위해서 27명의 대학생들을 대상으로 시선추적과 뇌파 실험을 수행하였다. 평가 결과, 뇌파와 동공크기 데이터를 함께 사용한 방법의 평균 재현율(0.73)이 뇌파 또는 동공크기 데이터만을 사용한 방법의 평균 재현율(뇌파: 0.50, 동공크기: 0.68)보다 높게 나타났다. 또한 AV 시맨틱스 기반의 개인화된 동영상 요약의 평균 재현율(0.57)이 AV 시맨틱스 기반의 일반적인 동영상 요약의 평균 재현율(0.69)보다 낮게 나타난 원인들을 분석하였다. 끝으로, AV 시맨틱스 기반 동영상 요약 방법과 텍스트 시맨틱스 기반 동영상 요약 방법 간의 차이 및 특성도 비교분석해 보았다.

호스피스 환자와 가족을 위한 임종교육 시청각 자료 개발 (Development of Audio-visual Aids of Death Education for Hospice Patients and Their Families)

  • 서미숙;강유정;윤지윤;김태연;조혜준;박소연;이시연;장지혜;김유진;강믿음
    • Journal of Hospice and Palliative Care
    • /
    • 제19권3호
    • /
    • pp.240-248
    • /
    • 2016
  • 목적: 호스피스완화의료의 목적은 환자와 가족의 고통을 줄이고 삶과 죽음의 질을 향상시키는데 있다. 편안한 임종을 맞이하는 것은 죽음의 질을 향상시키는데 역할을 한다. 이를 위해 환자와 보호자는 남은 삶 동안 임종을 준비할 수 있도록 임종과정 중 발생하는 다양한 문제와 요구에 대한 이해가 필요하다. 따라서 호스피스 환자와 가족을 위한 매뉴얼화된 임종교육 시청각 자료를 개발하고자 한다. 방법: 시청각 자료 개발을 위해서는 문헌고찰을 토대로 접근하기 쉬운 파워포인트 유인물로 초기 교육자료 개발하였고 다섯 차례에 걸친 전문의의 자문과 수정 및 보완, 평가 과정을 거쳐 완성하였다. 결과: 호스피스 환자와 가족들을 대상으로 한 시청각 교육자료는 3차시 5단계로 분류하였으며 교육 소요시간은 총 26분 34초이다. 최종 교육프로그램은 시청각 교육실 협력 하에 촬영하였으며 시청각 자료를 완성하였다. 결론: 본 연구는 완화의료병동의 구축과 전문성 증대를 위해 개발된 매뉴얼화 된 임종교육 시청각 자료로써 큰 의의가 있으며, 호스피스 환자와 가족뿐 아니라 호스피스 영역 전문 종사자들이 호스피스 환자와 가족을 대상으로 효율적인 임종교육 자료로 적극 활용되길 기대한다.

시청각 기구를 이용한 소아환자의 행동조절에 관한 연구 (EVALUATION OF PEDIATRIC DENIAL PATIENTS' BEHAVIOR AFTER USING AUDIO-VISUAL AIDS)

  • 염순준;박기태
    • 대한소아치과학회지
    • /
    • 제29권2호
    • /
    • pp.189-195
    • /
    • 2002
  • 치과진료시 환아는 어느 정도의 공포를 느끼게 되고, 이에 따른 다양한 부정적 반응을 표출하게 된다. 소아환자의 행동조절을 위해 여러 방법들이 시도되어 왔고, 최근 소아치과 분야에서 사용이 증가하고 있는 시청각자료의 이용도 그 중의 하나이다. 본 연구에서는 시청각자료의 사용이 치과진료시 환아의 반응에 미치는 영향과, 환아의 나이, 치과병력, 일일 TV나 비디오 시청시간 등과의 상관관계를 알아보고자 하였다. 삼성서울병원 소아치과를 내원한 만 $3{\sim}6$세의 건강한 아동 30명을 동수의 두 군으로 나누어, 1군에서는 치료시 통상의 tell-show-do만을 시행하였고, 2군에서는 시청각기구의 사용을 병행하였다. 발치를 제외한 통상의 보존적 술식만 실행하였고, 초진시 설문지를 통해 환아의 나이, 치과병력유무, Frankl 행동지수, 일일 TV나 비디오 시청시간을 조사하여 중등도의 협조도를 보이는 환아만을 대상으로 하였다. 치료시 환아의 행동평가에는 Houpt 행동분류 지수를 이용, 수면유도, 움직임, 울음 및 전체적인 반응을 기록하였다. 초진시 조사한 두 군간의 나이와 일일 TV나 비디오 시청시간 사이에는 차이가 없었다. 수면유도에 있어서 시청각군에서 유의성있는 수면유도 효과를 보였으며, 움직임이나 울음에 대하여는 유의성있는 차이를 보이지 않았다. 전체적 반응에 대한 평가에서는 시청각군이 유의성있는 개선된 반응을 보였는데, 치과병력의 존재, 연령의 증가, 시청각매체와의 빈번한 접촉시 시청각자료를 이용한 행동조절에 보다 긍정적으로 반응하였다.

  • PDF