• 제목/요약/키워드: Audio Analysis

검색결과 544건 처리시간 0.022초

채널 기반에서 객체 기반의 오디오 콘텐츠로의 변환을 위한 비균등 선형 마이크로폰 어레이 기반의 음원분리 방법 (Non-uniform Linear Microphone Array Based Source Separation for Conversion from Channel-based to Object-based Audio Content)

  • 전찬준;김홍국
    • 방송공학회논문지
    • /
    • 제21권2호
    • /
    • pp.169-179
    • /
    • 2016
  • 오늘날 UHDTV (Ultra-High-Definition TV) 시대에 사용될 멀티미디어 부호화기로 MPEG-H에 대한 표준화가 진행되고 있다. 향후 방송용 오디오 콘텐츠는 채널 기반 오디오 콘텐츠에서 진화하여 객체 기반 오디오 콘텐츠까지도 포함하게 될 예정이다. 이에 따라, 채널 기반 오디오 콘텐츠의 객체 기반 오디오 콘텐츠로의 유기적인 변환이 필요한 실정이다. 본 논문에서는 이러한 유기적인 변환을 실현 가능하게 할 수 있는 비균등 선형 마이크로폰 어레이 기반의 음원분리 기법을 제안한다. 제안된 기법은 주어진 어레이 배치에 따라 채널간의 시간차를 분석하고, 분석된 시간차에 따라 주파수별로 특정 방위각에 위치한 입력 오디오 신호의 spectral magnitude를 예측한다. 이후, azimuth와 width 파라메타를 조정함으로써 객체 오디오 생성을 위한 음원을 분리한다. 제안된 음원분리 기법의 성능을 평가하기 위하여 객관적 음원분리 지표 및 분리정확도를 측정하였고, 최소 분산 무손실 응답 빔형성기와 독립 성분 분석 기법 등 기존 음원분리 기법과의 그 성능을 비교하였다. 비교 결과, 제안된 기법이 기존 음원분리 기법들에 비하여 우수한 음원분리 성능을 보이는 것을 알 수 있었다.

오디오 데이터 내 개인 신상 정보 검출과 마스킹을 위한 인공지능 API의 활용 및 음성 분할 방법의 연구 (A System of Audio Data Analysis and Masking Personal Information Using Audio Partitioning and Artificial Intelligence API)

  • 김태영;홍지원;김도희;김형종
    • 정보보호학회논문지
    • /
    • 제30권5호
    • /
    • pp.895-907
    • /
    • 2020
  • 최근 기존 텍스트 기반 콘텐츠 외 멀티미디어 콘텐츠의 영향력이 급증함에 따라 콘텐츠 내 정보들을 처리할 수 있도록 도와주는 서비스가 콘텐츠 이용에 큰 편리함을 주고 있다. 이러한 서비스의 대표적인 기능으로는 중요 정보에 대한 검색과 마스킹이 있다. 텍스트 데이터와 이미지 데이터의 검색 및 마스킹 기술을 제공해주는 솔루션들은 활발히 보급되고 있어 쉽게 접할 수 있다. 그러나 오디오 콘텐츠의 경우, 검색 및 마스킹의 필요성은 인식되지만 기술의 난이도로 인해 범용적으로 적용되는 솔루션을 찾는 것이 쉽지 않다. 본 논문은 음성 분할을 이용하여 오디오 데이터 내 정보 검색과 마스킹 기능을 제공하는 웹 애플리케이션을 제안한다. 추가적으로, 국내외 인공지능 기반 음성 인식 API에 대한 분석을 통해 적절한 API의 선택을 진행하였으며, 정규식을 이용한 개인 신상 정보의 검출 방법을 제시하였다. 마지막으로 구현결과의 정확도를 측정하여 성능을 검증하였다. 본 논문의 기여점은 오디오 데이터 내 특정 패턴의 검출 및 마스킹 기능을 설계하고 실험을 통해 검증한 것에 있다.

Car Audio의 소비자 감성요소 선호도 조사를 위한 웹 기반 컨조인트 분석 사레 연구 (A Case Study of conjoint Analysis based on WWW for Customer's Gamsung Factor Preference of car Audio System)

  • 박창민;오기태;이선영;이건표
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2000년도 추계학술대회 논문집
    • /
    • pp.171-177
    • /
    • 2000
  • 본 연구는 ‘문화적 미래형 감성디자인 개발’을 위한 Car AV시스템 개발 프로젝트의 일환으로서 기존 제품의 사용성 평가와 사용자 관찰 방법 등을 통해 사용 환경과 사용자의 이용 행태에 관해 조사하고, 특히 컨조인트 분석을 통해 사용자의 선호도에 주요한 영향을 미친 신뢰성 있는 속성을 규명하고자 하는데 목적이 있다. 컨조인트 분석 프로세스에서 추출된 독립적인 각각의 속성과 수준들의 조합안을 바탕으로 사용자 선호도 조사를 함으로써 궁극적으로는 최적의 속성과 수준의 조합안을 제시하고자 한다. 또한 컨조인트 분석을 위해서 인터넷을 이용한 조사 시스템 구축과 활용 과정에 대해 살펴봄으로써 이의 실질적인 활용과 문제점에 관해 고찰하고자 한다.

  • PDF

요성을 중심으로 한 피리의 음색 변화 분석 및 필터 디자인 (Timbral Analysis of the Piri Sound and Designing an Audio Filter for Yoseong Expression)

  • 남상봉;이선진;이강성;이돈응
    • 한국HCI학회논문지
    • /
    • 제10권2호
    • /
    • pp.5-11
    • /
    • 2015
  • 요성은 음을 떨어서 내는 소리로 국악기 피리의 중요한 연주 표현 기법 중 하나이다. 본 연구에서는 이러한 피리의 요성 시에 나타나는 음색 특징을 분석하고 이를 반영하는 필터를 제시하였다. 이를 위하여 우선 피리의 구조에서 발생하는 음향 특성을 비숫한 구조의 서양악기와 비교하였으며, 그 결과를 바탕으로 요성 시에 발생하는 음색 변화를 집중적으로 분석하였다. 분석 결과를 바탕으로 피리의 평소리를 요성소리로 변화시킬 수 있는 필터를 제시하였다.

지방자치단체 광고효용성에 대한 탐색적 연구: KTX 광고노출 환경을 중심으로 (Pilot Study for Analysis of TV Ads of Local Governments)

  • 송승열;임상국;김정규
    • 한국멀티미디어학회논문지
    • /
    • 제23권1호
    • /
    • pp.43-49
    • /
    • 2020
  • Along side with the rapid growth of local governments' advertising bills, there are few studies focused on the effectiveness of these ads. Especially one of the media being used by the local governments is the Korea Express Train (KTX), where they advertise in the train coaches' KTX video monitor. Unfortunately the ads in KTX are exposed without audio mostly. The current study, therefore, probed on the effectiveness of these ads. This study utilized transportation theory and content analysis methodology to give insight to its discourse. We established two analysis units (camera and subtitles), and then analyzed 107 local government ads. From the camera analysis, it is observed that local governments' festival and tour promotion ads more often employ dynamic angles such as drone shot and long shot. Also, from subtitles usage analysis, it is observed that many of the ads make use of large size titles and subtitles which could prevent viewers seeing visual shots. In the special case audio-less KTX ads, this study recommends emphasis on subtitles which will enhance the ad effectiveness of the ad messages.

Interference Analysis from S-DAB into T-IMT-2000 in 2630-2655MHz

  • Kang B. S.
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 학술대회지
    • /
    • pp.792-795
    • /
    • 2004
  • This paper is an interference analysis from S-DAB(Satellite-Digital Audio Broadcasting) into terrestrial IMT-2000 systems intending to use the band 2630-2 655 MHz and that could be used to determine the impact of S­DAB on terrestrial IMT-2000 in the context of co-frequency sharing through the development of pfd masks.

  • PDF

A Practical Digital Video Database based on Language and Image Analysis

  • Liang, Yiqing
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1997년도 International Conference MULTIMEDIA DATABASES on INTERNET
    • /
    • pp.24-48
    • /
    • 1997
  • . Supported byㆍDARPA′s image Understanding (IU) program under "Video Retrieval Based on Language and image Analysis" project.DARPA′s Computer Assisted Education and Training Initiative program (CAETI)ㆍObjective: Develop practical systems for automatic understanding and indexing of video sequences using both audio and video tracks(omitted)

  • PDF

3차원 오디오 시스템에서 합과 차 여파기를 이용한 새로운 광대억 간섭신호 제거 방법 (A New Robust Acoustic Crosstalk Cancellation Method with Sum and Difference Filter in 3D Audio System)

  • 김래훈;임준석;성굉모
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.17-21
    • /
    • 2001
  • 현재 라우드스피커를 이용하는 3차원 오디오 시스템에서의 간섭신호를 제거함으로써 최적 청취 영역 (sweet spot)을 넓히는 여러 가지 방법들이 제안되어 있다. 그러나 기존의 방법들은 간섭신호를 제거할 수 있는 주파수가 제한되어 최적 청취 영역 형성이 제한되는 단점을 공통적으로 가지고 있다. 특히, 저주파 대역의 간섭신호를 제거하지 못하는 본질적인 문제점을 가지고 있다. 본 논문에서는 기존의 시스템보다 훨씬 넓은 주파수 대역에서 간섭신호를 효과적으로 제거할 수 있는 새로운 광대역 간섭신호제거 방법을 제안한다. 이 방법은 세 개의 라우드스피커를 이용한 방법에 합과 차 여파기를 적용하였다.

  • PDF

차량 주행소음을 고려한 자동차 오디오 음질 개선 및 주관적 음질평가 연구 (A Study on the Car Audio Sound Quality Enhancement under Vehicle Noise and Its Subjective Evaluation)

    • 한국음향학회지
    • /
    • 제18권8호
    • /
    • pp.108-115
    • /
    • 1999
  • 본 연구에서는 차 실내의 공간 음향특성으로 인한 음향왜곡과 주행소음으로 인한 오디오 음질 저하를 동시에 개선하기 위한 디지털 필터를 설계하여 음질을 개선하는 방법을 제안하였다. 라우드스피커의 입력에 적용할 디지털 필터는 차량 주행 소음 특성과 차 실내의 음향특성을 고려하여 설계하였다. 차량소음 분석은 주파수 옥타브 밴드 분석법을 이용한 객관적인 분석과 감성적 분석법인 NCB 곡선법을 사용했다. 그 결과를 이용하여 오디오 유니트의 11밴드 디지털 필터 보정치를 구하는데 사용하였다. 최적 음질 구현을 위해 7가지 형태의 디지털 필터를 설계하여 기준 음악원에 적용하여 음악원 샘플을 얻었고, 여기에 100km 차량 주행소음을 합성한 9가지의 음악원 샘플을 제작하였다. 64명의 평가자를 대상으로 Scheffe'가 제안한 7점 주관 평가법을 사용하여 9가지 음악원 샘플에서 최적음질을 나타내는 디지털 필터를 선택하였다.

  • PDF

패션 디자인 프로세스와 스토리텔링의 관계 정립에 관한 연구 (A Study on Establishing Relationship between Fashion Design Process and Storytelling)

  • 성유정;권기영
    • 한국의류산업학회지
    • /
    • 제11권2호
    • /
    • pp.210-218
    • /
    • 2009
  • The Purpose of this study is to demonstrate Storytelling as an effective device for Fashion Design by establishing relationship between Fashion Design Process and Storytelling. Through researching a social background and a concept of storytelling, found that story used interactively is a powerful tool for attention, understanding and change in both individuals and communities. Analysed the elements and the structure of storytelling and Fashion Design Process, by researching preceding researches. Therefore, we proposed a new four elements -text factor, visual factor, audio factor and virtual factor- and four steps (1)exploring stories, (2)planning a story, (3)building the story, (4)do storytelling- of storytelling and four steps-(1)gathering and analysing informations, (2)building a concept, (3)planning and developing a design, (4)do evaluation and make decision- of fashion design process. Through comparative analysis, we found a closeness between two structures, a use of common factors and also found characteristics to be considered in each stage. In the first stage, we found text, visual and audio factor as common factors. In the second stage, we suggested text and visual factor as common factors and also suggested clarity, realism and probability as characteristics. In the third stage, we found text, visual and virtual factor and also found dynamism, immersion and continuity. In the last stage, we suggested text, visual, virtual and audio factor and also suggested presence and interactivity as characteristics.