• 제목/요약/키워드: Sound recognition

검색결과 311건 처리시간 0.028초

360VR 콘텐츠의 음원위치정보를 활용한 시점예측 전송기법 (Efficient Transmission Scheme with Viewport Prediction of 360VR Content using Sound Location Information)

  • 정은영;김동호
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.1002-1012
    • /
    • 2019
  • 360VR 콘텐츠는 시청자의 시점변화에 따른 즉각적인 반응이 필요하고 고화질의 영상이 제공되어야 한다. 따라서 한정된 대역폭에서 360VR 시청자의 만족도를 보장하는 효율적인 전송기술이 필요하다. 그 일환으로 사용자의 시점을 예측하고 시점에 해당하는 영역과 해당하지 않는 영역에 다른 비트율을 할당하여 전체 대역폭 소모를 감소시키는 연구들이 소개되고 있다. 본 논문에서는 시점 예측의 정확도 향상을 목표로 기존 시각인지 정보만 활용했던 방식에 추가적으로 청각인지 정보인 360VR 콘텐츠의 음원위치정보를 활용한 시점 예측을 제안한다. 또한, 향상된 시점예측 방식을 이용하여 비트율을 효율적으로 할당함으로써 개선된 성능을 제공하는 전송 방식을 제안한다. 성능 분석 결과 제안한 시점 예측방식은 기존 방식 대비 시점 예측의 정확도가 향상되었으며, 이를 바탕으로 제안한 전송 방식은 제한된 대역폭 내에서 사용자의 시점에 해당하는 타일에 고품질의 영상을 제공할 수 있음을 확인하였다.

Electronic Attendance System Using Smart Device and High Frequency Signal

  • Myoungbeom Chung
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권11호
    • /
    • pp.103-111
    • /
    • 2023
  • 최근 대학교에서는 출석 처리를 위해 NFC 인증, QR 코드 인증, Sound-QR 인증, 블루투스 BLE 인증, 얼굴 인식 등 다양한 방식의 전자출결 시스템을 사용해왔다. 그러나 기존 방법들은 데이터 변형에 의한 출석 오류, 강의실 밖에서의 오인식 출석, 중도 이탈 처리의 어려움 등 여러 가지 문제점이 발생하고 있다. 따라서 본 연구에서는 이러한 문제점을 해결하며, 보다 정확한 전자출결을 관리하기 위해 고주파 신호 기반 전자출결 시스템을 제안한다. 고주파 신호는 블루투스 신호를 대치하는 것으로 신호의 전달 범위가 강의실 내로 한정되며, 신호의 변화가 필요할 경우 그 값을 즉시 변화할 수 있는 장점이 있다. 제안 시스템의 성능 검증을 위해 블루투스 기반 전자출결 시스템과의 비교 실험을 실시하였고, 그 결과 제안 방법이 높은 정확도를 나타내었다. 즉, 제안 방법은 스마트 기기 기반 전자출결 시스템에 즉시 활용할 수 있는 유용한 서비스가 될 것이다.

영상음향의 사운드디자인설계가 커뮤니케이션 효과에 미치는 영향 - TV광고음향을 뇌 지수 분석기법으로 - (Influences of a Sound Design of Media Contents on Communication Effects - TV-CF Sound Using a BQ-TEST)

  • 유회종;서현주;문남미
    • 방송공학회논문지
    • /
    • 제13권5호
    • /
    • pp.602-611
    • /
    • 2008
  • 지금까지 TV, 영화, 광고 등 미디어콘텐츠 제작에서 사운드디자인은 스토리를 전달하는 청각효과측면에서 전문가의 경험적 느낌에 의하여 주로 진행되었으며, 수용자가 느끼는 시청각적 효과를 적용키 위한 정량적 연구와 검증은 아직 취약한 실정이다. 본 연구에서는 미디어콘텐츠 제작에서 사운드디자인설계의 차이가 수용자에게 미치는 커뮤니케이션 효과의 차이를 알아보고자 시도한 비 동등성 대조군 전후 유사실험 연구이다. 연구방법은 60초의 TV광고영상을 음악으로만 디자인한 실험영상(A트랙)과, 음향효과와 음악으로 디자인한 실험영상(B트랙)을 시청하는 동안 뇌파측정을 통하여 얻어진 뇌 지수(Brain Quotient)를 비교 분석하여, 어떠한 사운드 디자인 설계가 수용자의 커뮤니케이션 효과에 차이가 있는가를 알아보았다. 그 결과, 첫째, 인지효과의 해당 뇌지수인 주의지수(ATQ)를 A트랙과 B트랙을 비교한 결과 A트랙이 B트랙보다 높은 활성화 차이를 보였다. 이는 음악위주의 사운드 디자인이 음향효과디자인보다 수용자에게 더 높은 관심과 집중도를 보였다고 해석할 수 있다. 둘째, 감성효과에 해당하는 정서지수(EQ)를 A트랙과 B트랙 비교결과 A트랙이 B트랙보다 높은 활성화를 보였다. 이 역시 음악위주의 사운드디자인이 음향효과위주의 디자인보다 정서적으로 감성효과가 높게 관여한다는 것을 의미한다. 셋째, 기억활성효과에 해당하는 뇌 활성지수(ACQ)는 A트랙과 B트랙 비교결과 B트랙 군보다 A트랙 군이 약간의 차이가 있었으나 유의하지는 않았다. 이번 실험을 통하여 지금까지 강한 집중을 위해서는 음향효과디자인이, 정서적인 감정은 음악디자인이 관여도가 높다는 기존의 연구에서, TV광고음향의 한정이 있기는 하나 집중도에서 음악디자인이 오히려 효과가 높을 수 있으며, 정서적인 관여는 역시 음악디자인이 효과가 높다는 결론을 얻을 수 있었다. 다만 기억활성도에서 유의한 차이가 없었던 점은 피험자숫자를 늘리는 등 계속적 연구가 필요하다. 본 연구는 미디어콘텐츠에서 사운드디자인설계가 수용자에게 미치는 커뮤니케이션효과의 영향을 뇌파측정을 통하여 정량적으로 알아 본 것에 의의가 있으며, 사운드디자인제작현장의 기초 자료로 활용될 수 있음을 기대한다.

H.264 압축과 SVDD를 이용한 영상 감시 시스템에서의 비정상 집단행동 탐지 (Abnormal Crowd Behavior Detection via H.264 Compression and SVDD in Video Surveillance System)

  • 오승근;이종욱;정용화;박대희
    • 정보보호학회논문지
    • /
    • 제21권6호
    • /
    • pp.183-190
    • /
    • 2011
  • 감시카메라 환경에서 군중의 비정상 집단행동 탐지란 감시카메라로부터 유입되는 영상에서 다중 객체가 위험에 처한 상황을 신속하고 정확하게 탐지하는 분야를 말한다. 본 논문에서는 CCTV 등과 같은 감시카메라 환경에서 움직임 벡터와 SVDD를 이용하여 집단내의 비정상 상황을 탐지하는 프로토타입 시스템을 제안한다. 제안된 시스템은 H.264 압축과정에서의 움직임 벡터 정보를 이용하여 영상내의 움직임 정보를 추출 표현하였으며, 비정상 집단행동의 판별 문제를 실용적 차원의 단일 클래스 분류 문제로 재해석하여 단일 클래스 SVM의 대표적 모델인 SVDD를 탐지기로 설계하였다. 제안된 시스템은 H.264 압축 과정에서 얻어지는 움직임 벡터를 이용함으로써, 실시간성을 보장하며 SVDD의 점증적 갱신 학습 능력으로 인하여 비정상 집단행동 데이터베이스의 변화에도 능동적으로 적응할 수 있다. 공개적으로 사용 가능한 벤치마크 데이터 셋인 PETS 2009와 UMN을 이용하여 본 논문에서 제안한 비정상 집단행동 탐지 시스템의 성능을 실험적으로 검증한다.

화자식별 기반의 AI 음성인식 서비스에 대한 사이버 위협 분석 (Cyber Threats Analysis of AI Voice Recognition-based Services with Automatic Speaker Verification)

  • 홍천호;조영호
    • 인터넷정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.33-40
    • /
    • 2021
  • 음성인식(ASR: Automatic Speech Recognition)은 사람의 말소리를 음성 신호로 분석하고, 문자열로 자동 변화하여 이해하는 기술이다. 초기 음성인식 기술은 하나의 단어를 인식하는 것을 시작으로 두 개 이상의 단어로 구성된 문장을 인식하는 수준까지 진화하였다. 실시간 음성 대화에 있어 높은 인식률은 자연스러운 정보전달의 편리성을 극대화하여 그 적용 범위를 확장하고 있다. 반면에, 음성인식 기술의 활발한 적용에 따라 관련된 사이버 공격과 위협에 대한 우려 역시 증가하고 있다. 기존 연구를 살펴보면, 자동화자식별(ASV: Automatic Speaker Verification) 기법의 고안과 정확성 향상 등 기술 발전 자체에 관한 연구는 활발히 이루어지고 있으나, 실생활에 적용되고 있는 음성인식 서비스의 자동화자 식별 기술에 대한 사이버 공격 및 위협에 관한 분석연구는 다양하고 깊이 있게 수행되지 않고 있다. 본 연구에서는 자동화자 식별 기술을 갖춘 AI 음성인식 서비스를 대상으로 음성 주파수와 음성속도를 조작하여 음성인증을 우회하는 사이버 공격 모델을 제안하고, 상용 스마트폰의 자동화자 식별 체계를 대상으로 실제 실험을 통해 사이버 위협을 분석한다. 이를 통해 관련 사이버 위협의 심각성을 알리고 효과적인 대응 방안에 관한 연구 관심을 높이고자 한다.

식생활교육지원법 실시 이후 초등학교 식생활 교육 실태 및 인식 (The Actual Conditions and Recognition of Dietary Life Education in Elementary School after Execution of the Dietary Life Education Support Act)

  • 김주영;심기현
    • 한국식품영양학회지
    • /
    • 제24권3호
    • /
    • pp.295-305
    • /
    • 2011
  • The goal of this study was to provide basic data for the future development of dietary life education in elementary schools by understanding the current conditions of the program after the execution of the Dietary Life Education Support Act. We conducted a survey to understand dietary teachers' recognition of dietary life education in elementary schools. We found that teachers' recognition was low and that dietary life education in elementary schools is still carried out indirectly by focusing on nutrition knowledge. Dietary life education is carried out during lunch time and dietary life-related class hours. However teachers of lower class levels did not have any practical subject related to dietary life and responded that a lack of time devoted to dietary life education was the biggest problem with the program. Most teachers responded that dietary life education in elementary schools is necessary for the formation of students' sound dietary habits, and that the development of a system of teachers directly responsible for dietary life education is necessary. In the past, dietary life education has typically been carried out at home, but now schools are required to play a role because of family nuclearization and the increase in working couples. Therefore, to revitalize dietary life education programs in elementary schools according to the Dietary Life Education Support Act, we suggest more systematic and segmentalized studies.

Corticostriatal Connections of the Superior Temporal Regions in the Macaque Monkey

  • Jung, Yongwook;Hong, Sungwon
    • Animal cells and systems
    • /
    • 제7권4호
    • /
    • pp.317-325
    • /
    • 2003
  • Corticostriatal connections of auditory areas within the rostral and caudal portions of the superior temporal gyrus (STG) and in the supratemporal plane(STP) of pigtail macaque (Macacca nemestrina) were studied with particular emphasis on specific projections to the ventral striatum. Retrograde tracers were Injected into five different regions of the ventral striatum such as the ventromedial caudate nucleus, ventral shell, central shell, dorsal core of the nucleus accumbens (NA), and ventrolateral putamen to Identify the cells of origin. There were only few projections from the auditory areas in the STP to the ventral striatum. However, the association (or belt) areas of the STG collectively had widespread corticostriatal projections characterized by differential topographic distributions. The rostral parts of the STG strongly projected to the ventromedial caudate nucleus. The midportion of the STG also projected to the same ventral striatal regions, but the connections were relatively less extensive. Interestingly, the caudal portion of the STG had no connection to all subregions of the ventral striatum. These differential patterns of corticostriatal connectivity suggest that the ventromedial caudate nucleus would be a major auditory convergence area and mainly involved in sound recognition rather than spatial localization of sound sources.

다기능성을 가진 음성 인식 요람 연구 (Study on the multi-functional Cradle by Voice Recognitions)

  • 박광성;안상진;조경록;최시온;박용욱
    • 한국전자통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.701-706
    • /
    • 2017
  • 본 연구에서는 요람을 기존의 리모컨이나 수동으로 구동하는 방식과 달리 APP을 통하여 사람의 음성을 인식하면 모터로 동작하도록 요람을 제작하였다. 또한 요람에 온습도센서를 장착하여 실시간으로 요람의 온도와 습도를 LCD를 통해서 확인할 수 있고, 또한 소리크기에 따라 결과 값을 가지는 사운드센서를 이용하여 결과 값을 a, b, c로 지정하여 이 결과 값의 합이 1150을 넘으면 아기의 울음소리로 인식하여 APP에 알림표시와 알림음이 작동하도록 하는 기능을 가지는 요람을 제작하였다.

말소리와 성격 이미지 (Speech sound and personality impression)

  • 이은영;유혜옥
    • 말소리와 음성과학
    • /
    • 제9권4호
    • /
    • pp.59-67
    • /
    • 2017
  • Regardless of their intention, listeners tend to assess speakers' personalities based on the sounds of the speech they hear. Assessment criteria, however, have not been fully investigated to indicate whether there is any relationship between the acoustic cue of produced speech sounds and perceived personality impression. If properly investigated, the potential relationship between these two will provide crucial insights on the aspects of human communications and further on human-computer interaction. Since human communications have distinctive characteristics of simultaneity and complexity, this investigation would be the identification of minimum essential factors among the sounds of speech and perceived personality impression. The purpose of this study, therefore, is to identify significant associations between the speech sounds and perceived personality impression of speaker by the listeners. Twenty eight subjects participated in the experiment and eight acoustic parameters were extracted by using Praat from the recorded sounds of the speech. The subjects also completed the Neo-five Factor Inventory test so that their personality traits could be measured. The results of the experiment show that four major factors(duration average, pitch difference value, pitch average and intensity average) play crucial roles in defining the significant relationship.

돌돔(Oplegnathus fasciatus)에 대한 인위적인 해상풍력발전소 건설소음의 면역학적 영향 (Effect of Artificial Noise from Offshore Wind Power Generation on Immunological Parameters in Rock Bream (Oplegnathus fasciatus))

  • 최광민;주민수;강경식;우원식;김경호;손민영;손하정;박찬일
    • 한국어병학회지
    • /
    • 제34권2호
    • /
    • pp.243-248
    • /
    • 2021
  • Offshore wind power generation is an energy generation field that is rapidly developing owing to the increasing demand for clean energy. However, the physiological response of fish to the underwater noise generated during construction or operation of wind turbines is unclear. We confirmed the effects of sound pressures of 125, 135, 145, and 155 dB/µPa, including 140 dB/µPa (the standard sound pressure for noise damage recognition in South Korea), through serum analysis in rock bream (Oplegnathus fasciatus). High mortality induced by reduced immunity through artificial infection after stimulation was confirmed. These results suggest that rock bream is negatively affected by the noise generated during the construction of offshore wind power plants.