• 제목/요약/키워드: audio genre

검색결과 40건 처리시간 0.022초

스펙트럼 대비 MFCC 특징의 음악 장르 분류 성능 분석 (Study on the Performance of Spectral Contrast MFCC for Musical Genre Classification)

  • 서진수
    • 한국음향학회지
    • /
    • 제29권4호
    • /
    • pp.265-269
    • /
    • 2010
  • 본 논문에서는 새로운 형태의 스펙트럼 특징인 스펙트럼 대비 MFCC (SCMFCC)를 제안하고 음악 장르 분류 성능을 분석하였다. 음악 장르 분류를 위해서는 장르 간의 차이를 두드러지게 할 수 있는 특징을 사용해야 하므로, 음악의 화음 구조 및 강약을 잘 표현하는 스펙트럼 대비 특징들이 관심을 받아왔다. 본 논문에서 제안된 SCMFCC는 멜 켑스트럼 상에서 스펙트럼의 대비를 이용하여 기존의 MFCC를 음악 분류에 적합하도록 변형했다. 널리 사용되고 있는 음악 장르 데이터베이스에서 실험을 수행하여, 제안된 SCMFCC 특징의 음악 장르 분류 성능을 기존의 다른 특징들과 비교하였다.

발생/소멸 패턴을 이용한 비정형 혼합 오디오의 주성분 검출 (Detecting Prominent Content in Unstructured Audio using Intensity-based Attack/release Patterns)

  • 김사무엘
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.224-231
    • /
    • 2013
  • 이 논문에서는 비정형 혼합 오디오 신호에서 청취자에게 전달 되도록 의도된 주된 신호의 종류를 검출해 낼 수 있는 방법을 제안한다. 주된 신호의 종류는 음성, 음악, 음향효과로 정하였으며, 인텐서티 기반의 발생/소멸 패턴에서 추출할 수 있는 특징을 사용하여 그들을 구별할 수 있는 방법을 소개한다. 청취자가 주어진 오디오 신호에서 주된 신호를 받아들이는 주관적인 평가를 반영하기 위해서, 웹기반의 평가시스템을 도입하여 18시간의 다양한 종류의 장르 비디오의 오디오를 평가하였다. 실험을 통하여 비디오의 장르별로 각기 다른 성능을 보이지만 가능성 있는 (음성위주의 토크쇼의 경우 86.7%, 액션 영화 49.3%)정확도를 보였다.

영상 콘텐츠의 오디오 분석을 통한 메타데이터 자동 생성 방법 (Method of Automatically Generating Metadata through Audio Analysis of Video Content)

  • 용성중;박효경;유연휘;문일영
    • 한국항행학회논문지
    • /
    • 제25권6호
    • /
    • pp.557-561
    • /
    • 2021
  • 영상 콘텐츠를 사용자에게 추천하기 위해서는 메타데이터가 필수적인 요소로 자리 잡고 있다. 하지만 이러한 메타데이터는 영상 콘텐츠 제공자에 의해 수동적으로 생성되고 있다. 본 논문에서는 기존 수동으로 직접 메타데이터를 입력하는 방식에서 자동으로 메타데이터를 생성하는 방법을 연구하였다. 기존 연구에서 감정 태그를 추출하는 방법에 추가로 영화 오디오를 통한 장르와 제작국가에 대한 메타데이터 자동 생성 방법에 대해 연구를 진행하였다. 전이학습 모델인 ResNet34 인공 신경망 모델을 이용하여 오디오의 스펙트로그램으로부터 장르를 추출하고, 영화 속 화자의 음성을 음성인식을 통해 언어를 감지하였다. 이를 통해 메타데이터를 생성 인공지능을 통해 자동 생성 가능성을 확인할 수 있었다.

영화배우 김혜수의 스크린 퍼포먼스 (Screen Performance of the Korean Actress Kim Hye-Soo)

  • 김종국
    • Journal of Information Technology Applications and Management
    • /
    • 제28권1호
    • /
    • pp.43-51
    • /
    • 2021
  • This article explores Kim Hye-soo's film acting from the perspective of performance, which means a socio-cultural action planned and intended for a certain purpose. Through the aspect of screen performance which the identity of the era that the performance study aims for is expressed through acting and reappeared in a system of verbal and non-verbal symbols, it was intended to enhance the academic value of Korean film acting. First, Kim Hye-soo's acting performance transforms by repeating genre acting. The sensuality and sexual attractiveness that evaluates Kim Hye-soo are repeated by the typical vision required by genre films, but the acting performance is not consumed or subordinated as a tool for visual pleasure. Second, Kim Hye-soo's body, face, emotion and audio are engraved with memories of the times, and the sociocultural identity of the performance is expressed through dynamic interaction between actions and reactions. Third, Kim Hye-soo's restored and recreated performance is sensitive to the changes of the times and is still in the process.

음악 장르 분류를 위한 새로운 자동 Taxonomy 구축 알고리즘 (New Automatic Taxonomy Generation Algorithm for the Audio Genre Classification)

  • 최택성;문선국;박영철;윤대희;이석필
    • 한국음향학회지
    • /
    • 제27권3호
    • /
    • pp.111-118
    • /
    • 2008
  • 본 논문에서는 음악 장르 분류를 위한 새로운 자동 Taxonomy 구축 알고리즘을 제안한다. 제안된 알고리즘은 모든 가능한 노드들의 분류 확률을 예측하여 예측된 분류 성능값이 가장 좋은 조합을 Taxonomy로 구축하는 것이다. 제안된 알고리즘에서의 분류 확률 예측은 훈련 데이터를 k-fold cross validation을 이용하여 분류기에 적용함으로써 이루어진다. 제안된 알고리즘을 기반으로 한 분류 성능 측정은 2 클래스로 이루어진 각각의 노드에 2개 범주 분류에 효과적인 support vector machine을 적용함으로써 이루어진다. 제안된 알고리즘의 성능 검증을 위해 음색, 리듬, 피치 등 오디오 신호의 특징을 나타내는 다양한 파라미터를 오디오 신호로부터 추출하여 제안된 알고리즘과 기존의 다중 범주 분류기들을 이용하여 분류성능을 평가하였다. 다양한 실험결과 제안된 알고리즘은 기존의 알고리즘에 비하여 5%에서 25%정도의 분류 성능이 향상된 것을 확인할 수 있었고 특히 낮은 차원의 특징벡터를 이용한 분류 실험에서는 10% 에서 25% 향상된 좋은 성능을 보였다.

음원 내 보컬 주파수 대역 분석에 기반한 음향기기 추천시스템 (A system for recommending audio devices based on frequency band analysis of vocal component in sound source)

  • 김정현;석철민;김민주;김수연
    • 한국산업정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.1-12
    • /
    • 2022
  • 음원 스트리밍 서비스와 Hi-Fi 시장이 성장함에 따라 다양한 음향기기들이 출시되고 있다. 이로 인해 소비자들의 제품 선택에 대한 폭은 넓어졌지만 자신의 음악적 취향과 일치하는 제품을 찾기는 더욱 어려워졌다. 본 연구에서는 사용자가 선호하는 음원으로부터 보컬 성분을 추출하고 이를 토대로 사용자에게 가장 적합한 음향기기를 추천하는 시스템을 제안하였다. 이를 위해 먼저 원본 음원을 Python의 Spleeter Library를 통해 분리하여 보컬 음원을 추출하고 제조사의 음향기기의 주파수 대역 데이터를 수집한 결과를 각각 격자 그래프로 나타내었다. 추출한 보컬 음원의 주파수 대역과 음향기기의 주파수 대역 측정치 데이터를 비교하기 위한 지표로서 Matching Gap Index(MGI)를 제안하였다. 산출된 MGI 값을 토대로 사용자 선호와의 유사도가 가장 높은 음향기기를 추천한다. 추천 결과는 음향 전문업체에서 제공하는 장르별 Equalizer 데이터를 이용하여 검증하였다.

음악의 클라이맥스 추출을 이용한 내용 기반 장르 분류 (Content-Based Genre Classification Using Climax Extraction in Music)

  • 고일주;정명범
    • 한국멀티미디어학회논문지
    • /
    • 제10권7호
    • /
    • pp.817-826
    • /
    • 2007
  • 기존의 음악 분류 연구는 음악에서 임의 20초 구간 또는 $40%{\sim}45%$ 지난 부분으로부터 20초 구간을 얻은 후 여러 가지 신호적 특징을 추출하여 장르 분류에 사용해왔다. 본 논문에서는 기존 연구의 성공률을 높이기 위해 음악의 클라이맥스 구간을 추출하여 장르 분류하는 것을 제안한다. 음악은 도입과 진행, 클라이맥스 부분으로 나뉘며, 클라이맥스는 음악이 강조하는 부분으로서 그 음악의 특징을 가장 잘 나타낸다. 즉, 음악을 분석하거나, 분류할 때 클라이맥스 부분을 이용하면 보다 효과적인 결과를 얻을 것이다. 음악의 클라이맥스는 FFT를 이용하여 박자와 마디 정보를 얻은 후 마디별 파형 집중도로부터 추출할 수 있다. 논문에서는 기존의 연구에 사용된 방법과 제안한 방법인 클라이맥스를 이용하여 장르 분류 실험을 하였다. 기존 방법은 47%의 성공률을 보이는 반면 제안한 방법은 55% 향상된 성공률을 얻을 수 있었다.

  • PDF

Collaborative Filtering and Genre Classification for Music Recommendation

  • Byun, Jeong-Yong;Nasridinov, Aziz
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.693-694
    • /
    • 2014
  • This short paper briefly describes the proposed music recommendation method that provides suitable music pieces to a listener depending on both listeners' ratings and content of music pieces. The proposed method consists of two methods. First, listeners' ratings prediction method is a combination the traditional user-based and item-based collaborative filtering methods. Second, genre classification method is a combination of feature extraction and classification procedures. The feature extraction step obtains audio signal information and stores it in data structure, while the second one classifies the music pieces into various genres using decision tree algorithm.

A Study on the Application of Motion Graphics Animation in Opening Titles of Noir Dramas

  • LinLin Huang;Xinyi Shan;Jeanhun Chung
    • International Journal of Advanced Culture Technology
    • /
    • 제12권3호
    • /
    • pp.278-283
    • /
    • 2024
  • As the introductory content of televison series, the opening titles are crucial for helping the audience quickly grasp the tone of the narrative. With the continuous integration of the televison production industry and digital computer technology, motion graphics, featuring its unique dynamic graphic design, offers new avenues for title sequence creation. This paper dives into the application of motion graphics in the title sequences of noir genre television series, analyzing aspects such as visual style, content presentation, and narrative expression. By comparing early static text title sequences with motion graphics ones, this paper reveals the advantages of motion graphics in designing opening titles for noir genre television series and examines how it enhances visual impact and improves audience experience. This study not only enriches the creative techniques for title sequence design, but also provides valuable insights for future creations.

오디오의 파형과 FFT 분석을 이용한 대표 선율 검색 (Representative Melodies Retrieval using Waveform and FFT Analysis of Audio)

  • 정명범;고일주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권12호
    • /
    • pp.1037-1044
    • /
    • 2007
  • 최근 내용 기반 음악 검색 시스템에서는 사용자의 응답 시간을 단축시키기 위해 음악의 대표성을 갖는 선율을 추출하여 색인하고, 검색 시 이를 사용한다. 기존 연구에서는 미디(midi) 데이타를 이용하여 대표 선율을 추출하는 방법이 제안되었으나, 미디 데이타에 한정되는 단점이 있었다. 따라서 본 논문에서는 디지털 신호처리를 이용하여 모든 오디오 파일 포맷에 적용 가능한 대표 선율 검색을 제안한다. 대표 선율 검색을 위해 FFT(Fast Fourier Transform)을 이용하여 박자와 마디를 찾고 각 마디들의 PCM 데이타로부터 높은 수치가 나타나는 빈도를 측정한다. 이때 높은 수치들이 가장 많이 뭉쳐 있는 영역에서 여덟 마디 간격이 오디오 데이타의 대표 선율 영역이다. 제안 방법의 유효성을 검증하기 위한 실험으로 총 1000곡을 선택하여 대표 선율을 추출하였고, 그 결과 템포를 찾아낸 737곡 중 79.5%의 정확성을 보였다.