• Title/Summary/Keyword: Music Algorithm

검색결과 344건 처리시간 0.031초

비디오 데이터에서의 컬러 감성 정보 추출 방법 (A Method of Color KANSEI Information Extraction in Video Data)

  • 최준호;황명권;최창;김판구
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.532-535
    • /
    • 2008
  • 디지털 콘텐츠의 대부분을 차지하는 동영상에 대한 검색 서비스가 필수 기능으로 대두되고 있으며, 검색 서비스를 수행하는 시스템은 최신 기술을 접목시켜 보다 지능적이고, 의미적인 검색을 할 수 있는 검색 엔진이나 지능형 검색 기법 등의 필요성이 점차 증대되고 있다. 이에 본 논문에서는 디지털 콘텐츠 데이터에 대한 특성요소 분석 및 검색 기술과 구현, 감성어휘기반 분석 및 검색 방안을 위해 멀티미디어 콘텐츠 데이터의 구조 설계와 분석 관리 도구 및 의미론적 특성요소 추출기술과 콘텐츠 내 컬러 정보 기반 감성처리 알고리즘을 제안하였다.

  • PDF

Development of Audio Melody Extraction and Matching Engine for MIREX 2011 tasks

  • 송재종;장달원;이석필;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.164-166
    • /
    • 2012
  • In this paper, we proposed a method for extracting predominant melody of polyphonic music based on harmonic structure. Harmonic structure is an important feature parameter of monophonic signal that has spectral peaks at the integer multiples of its fundamental frequency. We extract all fundamental frequency candidates contained in the polyphonic signal by verifying the required condition of harmonic structure. Then, we combine those harmonic peaks corresponding to each extracted fundamental frequency and assign a rank to each after calculating its harmonic average energy. We run pitch tracking based on the rank of extracted fundamental frequency and continuity of fundamental frequency, and determine the predominant melody. For the query by singing/humming (QbSH) task, we proposed Dynamic Time Warping (DTW) based matching engine. Our system reduces false alarm by combining the distances of multiple DTW processes. To improve the performance, we introduced the asymmetric sense, pitch level compensation, and distance intransitiveness to DTW algorithm.

  • PDF

무선 위치 인식에서 타원형 산란 채널에 적합한 초광대역 신호 도착 방향 추정 (Angle-of-arrival Estimation fit for an Elliptical Scattering Channel in a Wireless Positioning)

  • 이용업;박중후
    • 한국통신학회논문지
    • /
    • 제33권11C호
    • /
    • pp.949-954
    • /
    • 2008
  • 타원형 산란 무선 채널 환경에서 고속 단거리 옥내 무선 통신용 초광대역 수신기의 입력에 클러스터 형태로 도착하는 신호의 도착 방향을 추정하기 위해 새로 초광대역 신호 모형을 제안한다. 추정 기법은 일반적인 다중신호분류 기법을 변경한 알고리즘이며, 제안된 추정 기법을 초광대역 신호 모형에 적용하여 두 종류의 매개변수인 신호 도착방향 변수와 퍼짐 변수를 얻는다. 제안한 신호 모형과 추정 기법은 초광대역 타원형 산란 무선 통신 환경 안에서 컴퓨터 모의실험을 통해 검증된다.

바이스태틱 MIMO 레이다 시스템의 위치탐지 무력화를 위한 신호공간 재밍 기법 (Signal-Space Jamming Scheme for Disturbing Target Localization of Bistatic MIMO Radar System)

  • 여광주;정원주
    • 한국전자파학회논문지
    • /
    • 제29권11호
    • /
    • pp.878-883
    • /
    • 2018
  • 본 논문은 분산 배치된 다수의 전자전 센서를 통하여 수신된 바이스태틱 multiple-input multiple-output(MIMO) 레이다 시스템의 신호를 조합하여 레이다 시스템의 위치탐지 기능을 무력화 혹은 기만하는 재밍 설계기법을 제안한다. 제안된 기법은 하나의 전자전 센서에서 수집된 신호를 특정주기로 지연시킨 신호들의 합을 송신하거나, 다수의 센서에서 수집된 신호들의 가중치 합을 송신하여, 표적을 탐지 못하게 하거나 허위표적을 발생시킨다. 시뮬레이션 결과를 통해서 제안한 기법의 재밍 성능을 확인한다.

유전자 알고리즘을 활용한 소셜네트워크 기반 하이브리드 협업필터링 (Social Network-based Hybrid Collaborative Filtering using Genetic Algorithms)

  • 노희룡;최슬비;안현철
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.19-38
    • /
    • 2017
  • 본 연구는 사용자 평점 이외에 사용자 간 직접 간접적 신뢰 및 불신 관계 네트워크의 분석 결과를 추가로 반영한 새로운 하이브리드 협업필터링(Collaborative filtering, CF) 추천방법을 제안한다. 구체적으로 사용자 간의 유사도를 계산할 때 사용자 평가점수의 유사성만을 고려하는 기존의 CF와 다르게, 사용자 신뢰 및 불신 관계 데이터의 사회연결망분석 결과를 추가적으로 고려하여 보다 정교하게 사용자 간의 유사도를 산출하였다. 이 때, 사용자 간의 유사도를 재조정하는 접근법으로 특정 이웃 사용자가 신뢰 및 불신 관계 네트워크에서 높은 신뢰(또는 불신)를 받을 때, 추천 대상이 되는 사용자와 해당 이웃 간의 유사도를 확대(강화) 또는 축소(약화)하는 방안을 제안하고, 더 나아가 최적의 유사도 확대 또는 축소의 정도를 결정하기 위해 유전자 알고리즘(genetic algorithm, GA)을 적용하였다. 본 연구에서는 제안 알고리즘의 성능을 검증하기 위해, 특정 상품에 대한 사용자의 평가점수와 신뢰 및 불신 관계를 나타낸 실제 데이터에 추천 알고리즘을 적용하였으며 그 결과, 기존의 CF와 비교했을 때 통계적으로 유의한 수준의 예측 정확도 개선이 이루어짐을 확인할 수 있었다. 또한 신뢰 관계 정보보다는 불신 관계 정보를 반영했을 때 예측 정확도가 더 향상되는 것으로 나타났는데, 이는 사회적인 관계를 추적하고 관리하는 측면에서 사용자 간의 불신 관계에 대해 좀 더 주목해야 할 필요가 있음을 시사한다.

Long Term Average Spectrum을 이용한 성악가들의 Speaking Voice 분석 (Long Term Average Spectrum Characteristics of Speaking Voice of Western Operatic Singers)

  • 이경철;홍석진;진성민
    • 대한후두음성언어의학회지
    • /
    • 제15권2호
    • /
    • pp.122-127
    • /
    • 2004
  • Background and Objectives : Many studies have described and analyzed singer's formant and it has been shown that the epilaryngeal tube in the human airway is responsible for vocal ring, or the singer's formant. A similar phenomenon produced by trained singers in their speech led some authors to examine the speaker's ring. This study was designed to analyze the speaking voice of the singers and speaker's ring. Baterials and Methods : Ten tenors, fifteen baritones, fifteen sopranos and ten mezzo sopranos attending the music college, department of vocal music were chosen for this study. Fifteen male and fifteen female untrained normal speakers were chosen for control group. Each subject was asked to produce a sample of a sustained spoken vowel /ah/ sound for at least five seconds and read sentence 'Kaeul'. The sound data was analyzed using the Fast Fourier Transform(FFT) - based power spectrum, Long term average(LTA) power spectrum using the FFT algorithm of the Computerized Speech Lab(CSL, Kay elemetrics, Model 4300B, USA). Statistical analysis was performed using the Mann-Whitney test of the Statistical Package for Social Sciences(SPSS). Results : For LTA Power spectrum of/ah/ sound, a significant increase was seen in the 2,500-3,500Hz region(p<0.01) in four trained singer group compared with untrained speaker group, and a significant increase in the 9,000-10,000Hz region(p<0.01) in soparano group. Similarly, in sentence 'Kaeul', there was a significant increase in energy in the tenor, baritone, mezzo soprano group compared with the untrained speaker group in the 2,500-3,500Hz region(p<0.01), and a significant increase in all frequency region(p<0.01) in the soprano group. Conclusions : The LTA power spectrum suggests that trained singers group show more energy concentration in the 'singer's formant' region in the speaking voice, and authors believe this region to be the 'speaker's ring'. Further research is needed on the effect of singing training on the resonance of the speaking voice.

  • PDF

성악다들의 목소리에 대한 Long Term Average Spectrum 분석 -$2^{nd}$ Singer's Formant의 존재 가능성에 대하여- (Long Term Average Spectrum Characteristics of Head and Chest Register Sounds of Western Operatic Singers : Extended Study)

  • 반재호;권영경;진성민
    • 대한후두음성언어의학회지
    • /
    • 제15권1호
    • /
    • pp.31-36
    • /
    • 2004
  • Background and Objectives : It has been shown that the epilaryngeal tube in the human airway is responsible for vocal ring, or the singer's formant. In previous study, authors showed that in trained tenors, besides the conventional singer's formant in the region of ,5500Hz, another energy peak was observed in the region of 8,000Hz. This peak was interpreted as the second resonance of the epilarynx tube. Singers in other voice categories who produce vocal ring are assumed to have the same peak, but no measurements have as yet been made. Materials and Methods : Fifteen tenors, fourteen baritones, seven sopranos and five mezzo sopranos attending the music college, department of vocal music who could reliably produce the head and chest registers were chosen for this study. Each subject was asked to produce an/ah/sound for at least three seconds for the head register sound(tenors ; G4, barions ; E4 sopranos ; F5 and mezzosopranos ; C5) and for the chest register sound (tenors ; C3, baritones ; D3, sopranos ; D4 and Mezzosoprano ; A3). The sound data was analyzed using the Fast Fourier Transform (FFT)-based power spectrum, Long term average(LTA) power spectrum using the FFT algorithm of the Computerized Speech Lab (CSL, Kay elemetrics, Model 4300B, USA). Statistical analysis was performed using the Mann-Whitney test of the Statistical Package for Social sciences(SPSS). Results : For head register sounds, a significant increase was seen in the 2,200-3,400Hz region(p<0.05) and the Similar to the head register sounds, there was a significant increase in energy in the four trained singer group compared with the untrained group in the 2,200-3,100Hz region(p<0.05), the 7,800-8,400Hz region(p<0.05) for the chest register sounds. Conclusions : When good vocal production was made for the head and chest registers, an energy peak was observed near 2,500Hz, a frequency already known as the "singer's formant', in all subjects in the study group. Another region of increased energy was observed around 8,000Hz that had not been noticed previously. The authors believe this region to be the second singer's formant.

  • PDF

고속 추적 특성을 위한 디지털 역지향성 배열 안테나 시스템 설계와 특성 평가 (System Design and Evaluation of Digital Retrodirective Array Antenna for High Speed Tracking Performance)

  • 김소라;유흥균
    • 한국통신학회논문지
    • /
    • 제38A권8호
    • /
    • pp.623-628
    • /
    • 2013
  • 역지향성 배열 안테나 시스템은 기존의 빔형성 기술들에 비하여 복잡도가 낮고 간단하여 시스템 동작 속도가 빠르다. 따라서 고속이동체 환경에서의 빔추적에 용이하다. 하지만 역지향성 배열 안테나는 다중경로 환경 또는 다중 사용자 신호에 따른 AOA(anle of arrival) 추정에 어려움이 있다. 이러한 AOA 추정의 불확실성을 개선 하기 위해 MUSIC 알고리즘과 결합한 디지털 역지향성 배열 안테나 시스템을 제안한다. 본 논문에서는 위상을 추정하는 디지털 PLL 하나를 통하여 위상을 찾는 디지털 역지향성 배열 안테나 시스템을 설계하며 시속 300Km/h의 속도의 이동체를 송수신 거리 100m일때, 원 경로를 따라 움직이는 환경에서의 역지향성 배열 안테나 시스템의 성능을 확인하였고, 다중경로 환경을 고려 하였을 때 시스템의 성능 또한 확인하였다. 고속 추적 모델에 따라AOA를 추적한 결과 10dB의 SNR에서는 오차크기의 평균이 $4.2^{\circ}$, SNR이 20dB인 경우에는 오차크기 평균이 $1.3^{\circ}$이다.

화음탐색법을 이용한 강섬유 및 하이브리드 섬유보강 콘크리트의 최적배합 설계 (Optimized Mix Proportioning of Steel and Hybrid Reinforced Concrete Using Harmony Search Algorithm)

  • 이치훈;이주하;윤영수
    • 콘크리트학회논문집
    • /
    • 제18권2호
    • /
    • pp.151-159
    • /
    • 2006
  • 강섬유보강 콘크리트는 일반 콘크리트에 비해 휨성능이 월등히 우수하지만, 아직까지 국내에는 이에 대한 명확한 배합설계 지침이 확립되어 있지 않은 상황이다. 또한, 강섬유를 2종이상 동시에 혼입하여 사용하는 하이브리드 섬유보강 콘크리트에 대해서는 최근에 들어서야 그 연구가 시작되었으며, 이에 대해서도 배합에 대한 구체적인 지침이 확립되어 있지 않다. 따라서 본 연구에서는 새로운 최적화 기법인 화음탐색법을 이용하여 강섬유 및 하이브리드 섬유보강 콘크리트의 최적배합 프로그램을 개발하였으며, 검증 실험을 수행하여 프로그램의 신뢰도를 높였다. 이는 현장 시험 배합횟수의 감소 및 배합설계의 편의성 향상 등에 도움이 될 것으로 기대된다. 또한, 실험 결과 동일한 강섬유 혼입률이라 하더라도, 하이브리드 섬유보강 콘크리트가 일반 강섬유보강 콘크리트보다 휨강도 및 휨인성 모두 우수한 것으로 나타났으며 이를 프로그램 상에 추가 반영하였다. 이는 세계적으로도 아직 연구 초기 단계에 있는 하이브리드 섬유보강 콘크리트의 휨 특성을 파악하는데에도 향후 연구의 발판이 될 것으로 생각되며, 지속적인 실험 및 연구로 보완이 된다면 보다 더 정밀도를 높일 수 있을 것으로 기대된다.

평균 제곱 투영 오차의 기울기에 기반한 가변 망각 인자 FAPI 알고리즘 (Mean Square Projection Error Gradient-based Variable Forgetting Factor FAPI Algorithm)

  • 서영광;신종우;서원기;김형남
    • 전자공학회논문지
    • /
    • 제51권5호
    • /
    • pp.177-187
    • /
    • 2014
  • 본 논문에서는 고속 부공간 추적 기법인 FAPI (Fast Approsimated Power Iteration)에 GVFF RLS (Gradient-based Variable Forgetting Factor Recursive Least Square Error)를 적용한 GVFF FAPI 를 제안한다. 기존의 FAPI는 신호의 공분산 행렬을 추정하기 위해 고정 망각 인자를 사용하기에, 부공간이 지속적으로 변하는 비정재 환경에 적용하기 여려운 단점이 있다. 이러한 문제점을 해결하기 위해, GVFF FAPI는 개선된 MSE (Mean Square Error)의 분석으로부터 유도된 MSE의 기울기 기반의 시변 망각 인자를 사용한다. 또한 GVFF RLS의 망각 인자 업데이트 식을 개선하여 부공간이 지속적으로 변하는 비정재 환경에서 부공간 에러를 줄인다. 개선된 망각 인자 업데이트 식은 MSE의 기울기가 양수이면 망각 인자를 빠르게 감소하게 하고 MSE의 기울기가 음수이면 망각 인자를 천천히 증가시킨다. 모의실험을 통해서 도래각이 지속적으로 변하는 환경에서 GVFF FAPI 알고리즘이 기존의 FAPI 알고리즘보다 작은 부공간 에러를 가지는 것을 보이고, 추적된 부공간을 도래각 추정기법에 적용하였을 때 추적된 도래각의 RMSE (Root Mean Square Error)가 더 작은 것을 확인한다.