• 제목/요약/키워드: Music Algorithm

검색결과 346건 처리시간 0.027초

압축율 변화에 따른 멀티채널 오디오의 품질 및 Predistortion 의 영향 평가 (Quality Assessment and Predistortion Evaluation of the Multi-channel Audio Codec according to the bitrate changing)

  • 차경환;장대영;김성한;김천덕
    • 한국음향학회지
    • /
    • 제15권2호
    • /
    • pp.55-60
    • /
    • 1996
  • 본 논문에서는 멀티채널 오디오의 전송 및 재생에 있어서 압축율 변화에 따른 음질의 주관 평가와 matrixing과 dematrixing 과정에서 발생하는 가청잡음을 보상해 주는 predistortion 의 영향을 평가하였다. 시뮬레이션은 지각 부호화를 이용하는 MPEG-2 오디오 계층2의 알고리즘을 사용하였으며, 압출율은 384, 320, 256, 128kbps로 변화시키면서 predistortion 의 유/무에 따른 음질의 영향을 평가하였다. double blind 법에 의한 주관 평가 결과 3/2채널에서 5점 열화척도가 320kbps까지는 -1이하로 원음과 차이가 없거나 거슬리지 않는 것으로 평가되었으며, predistortion의 영향은 128kbps에서 척도1정도 품질이 향상되었으며, 특히 음성시료가 음악시료보다 더욱 향상된 결과를 얻었다.

  • PDF

퍼지 ART 알고리즘을 이용한 인쇄 악보의 자동 인식과 연주 (Automated Recognition of Printed Music using Fuzzy ART Algorithm and Performance)

  • 김미정;김광백;박충식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.410-414
    • /
    • 2008
  • 음악 연구에 따른 컴퓨터의 역할이 점차 중요한 비중을 차지함에 따라 보다 효과적인 악보 인식 방법이 요구된다. 기존의 악보 인식 방법에서는 특정 수정 프로그램에서 만든 악보만 그 프로그램에서 재수정과 재생이 가능하다는 단점이 있다. 본 논문에서는 이러한 단점을 보완하기 위하여 이미 작성 되어있는 악보들을 자동으로 인식하고 재생을 할 수 있는 방법을 제안한다. 제안된 악보 인식 방법은 수평 히스토그램을 이용하여 악보 이미지의 오선을 제거한 후, Grassfire 알고리즘을 적용하여 잡음을 제거하고 악보 구성 기호들을 추출한다. 추출된 악보 구성 기호들은 악보 구성 기호의 특징을 이용하여 음표와 쉼표, 그 외의 기호들로 분리한다. 분리된 음표 기호들은 박자마다 다른 음표 형태의 특징을 이용하여 다시 세밀하게 분리하고 쉼표와 그 외의 기호들은 퍼지 ART 알고리즘을 적용하여 인식한다. 인식된 악보 구성 기호들을 이용하여 각각 정보를 저장하고 향후에 악보 구성 기호에 해당하는 음의 재생을 용이하게 한다. 제안된 악보 인식 방법의 성능을 평가하기 위해 50장의 악보 영상을 대상으로 실험한 결과, 본 논문에서 제시한 악보 영상의 인식 방법이 실험을 통해서 효율적인 것을 확인하였다.

  • PDF

비디오 데이터에서의 컬러 감성 정보 추출 방법 (A Method of Color KANSEI Information Extraction in Video Data)

  • 최준호;황명권;최창;김판구
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.532-535
    • /
    • 2008
  • 디지털 콘텐츠의 대부분을 차지하는 동영상에 대한 검색 서비스가 필수 기능으로 대두되고 있으며, 검색 서비스를 수행하는 시스템은 최신 기술을 접목시켜 보다 지능적이고, 의미적인 검색을 할 수 있는 검색 엔진이나 지능형 검색 기법 등의 필요성이 점차 증대되고 있다. 이에 본 논문에서는 디지털 콘텐츠 데이터에 대한 특성요소 분석 및 검색 기술과 구현, 감성어휘기반 분석 및 검색 방안을 위해 멀티미디어 콘텐츠 데이터의 구조 설계와 분석 관리 도구 및 의미론적 특성요소 추출기술과 콘텐츠 내 컬러 정보 기반 감성처리 알고리즘을 제안하였다.

  • PDF

Development of Audio Melody Extraction and Matching Engine for MIREX 2011 tasks

  • 송재종;장달원;이석필;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.164-166
    • /
    • 2012
  • In this paper, we proposed a method for extracting predominant melody of polyphonic music based on harmonic structure. Harmonic structure is an important feature parameter of monophonic signal that has spectral peaks at the integer multiples of its fundamental frequency. We extract all fundamental frequency candidates contained in the polyphonic signal by verifying the required condition of harmonic structure. Then, we combine those harmonic peaks corresponding to each extracted fundamental frequency and assign a rank to each after calculating its harmonic average energy. We run pitch tracking based on the rank of extracted fundamental frequency and continuity of fundamental frequency, and determine the predominant melody. For the query by singing/humming (QbSH) task, we proposed Dynamic Time Warping (DTW) based matching engine. Our system reduces false alarm by combining the distances of multiple DTW processes. To improve the performance, we introduced the asymmetric sense, pitch level compensation, and distance intransitiveness to DTW algorithm.

  • PDF

무선 위치 인식에서 타원형 산란 채널에 적합한 초광대역 신호 도착 방향 추정 (Angle-of-arrival Estimation fit for an Elliptical Scattering Channel in a Wireless Positioning)

  • 이용업;박중후
    • 한국통신학회논문지
    • /
    • 제33권11C호
    • /
    • pp.949-954
    • /
    • 2008
  • 타원형 산란 무선 채널 환경에서 고속 단거리 옥내 무선 통신용 초광대역 수신기의 입력에 클러스터 형태로 도착하는 신호의 도착 방향을 추정하기 위해 새로 초광대역 신호 모형을 제안한다. 추정 기법은 일반적인 다중신호분류 기법을 변경한 알고리즘이며, 제안된 추정 기법을 초광대역 신호 모형에 적용하여 두 종류의 매개변수인 신호 도착방향 변수와 퍼짐 변수를 얻는다. 제안한 신호 모형과 추정 기법은 초광대역 타원형 산란 무선 통신 환경 안에서 컴퓨터 모의실험을 통해 검증된다.

바이스태틱 MIMO 레이다 시스템의 위치탐지 무력화를 위한 신호공간 재밍 기법 (Signal-Space Jamming Scheme for Disturbing Target Localization of Bistatic MIMO Radar System)

  • 여광주;정원주
    • 한국전자파학회논문지
    • /
    • 제29권11호
    • /
    • pp.878-883
    • /
    • 2018
  • 본 논문은 분산 배치된 다수의 전자전 센서를 통하여 수신된 바이스태틱 multiple-input multiple-output(MIMO) 레이다 시스템의 신호를 조합하여 레이다 시스템의 위치탐지 기능을 무력화 혹은 기만하는 재밍 설계기법을 제안한다. 제안된 기법은 하나의 전자전 센서에서 수집된 신호를 특정주기로 지연시킨 신호들의 합을 송신하거나, 다수의 센서에서 수집된 신호들의 가중치 합을 송신하여, 표적을 탐지 못하게 하거나 허위표적을 발생시킨다. 시뮬레이션 결과를 통해서 제안한 기법의 재밍 성능을 확인한다.

유전자 알고리즘을 활용한 소셜네트워크 기반 하이브리드 협업필터링 (Social Network-based Hybrid Collaborative Filtering using Genetic Algorithms)

  • 노희룡;최슬비;안현철
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.19-38
    • /
    • 2017
  • 본 연구는 사용자 평점 이외에 사용자 간 직접 간접적 신뢰 및 불신 관계 네트워크의 분석 결과를 추가로 반영한 새로운 하이브리드 협업필터링(Collaborative filtering, CF) 추천방법을 제안한다. 구체적으로 사용자 간의 유사도를 계산할 때 사용자 평가점수의 유사성만을 고려하는 기존의 CF와 다르게, 사용자 신뢰 및 불신 관계 데이터의 사회연결망분석 결과를 추가적으로 고려하여 보다 정교하게 사용자 간의 유사도를 산출하였다. 이 때, 사용자 간의 유사도를 재조정하는 접근법으로 특정 이웃 사용자가 신뢰 및 불신 관계 네트워크에서 높은 신뢰(또는 불신)를 받을 때, 추천 대상이 되는 사용자와 해당 이웃 간의 유사도를 확대(강화) 또는 축소(약화)하는 방안을 제안하고, 더 나아가 최적의 유사도 확대 또는 축소의 정도를 결정하기 위해 유전자 알고리즘(genetic algorithm, GA)을 적용하였다. 본 연구에서는 제안 알고리즘의 성능을 검증하기 위해, 특정 상품에 대한 사용자의 평가점수와 신뢰 및 불신 관계를 나타낸 실제 데이터에 추천 알고리즘을 적용하였으며 그 결과, 기존의 CF와 비교했을 때 통계적으로 유의한 수준의 예측 정확도 개선이 이루어짐을 확인할 수 있었다. 또한 신뢰 관계 정보보다는 불신 관계 정보를 반영했을 때 예측 정확도가 더 향상되는 것으로 나타났는데, 이는 사회적인 관계를 추적하고 관리하는 측면에서 사용자 간의 불신 관계에 대해 좀 더 주목해야 할 필요가 있음을 시사한다.

Long Term Average Spectrum을 이용한 성악가들의 Speaking Voice 분석 (Long Term Average Spectrum Characteristics of Speaking Voice of Western Operatic Singers)

  • 이경철;홍석진;진성민
    • 대한후두음성언어의학회지
    • /
    • 제15권2호
    • /
    • pp.122-127
    • /
    • 2004
  • Background and Objectives : Many studies have described and analyzed singer's formant and it has been shown that the epilaryngeal tube in the human airway is responsible for vocal ring, or the singer's formant. A similar phenomenon produced by trained singers in their speech led some authors to examine the speaker's ring. This study was designed to analyze the speaking voice of the singers and speaker's ring. Baterials and Methods : Ten tenors, fifteen baritones, fifteen sopranos and ten mezzo sopranos attending the music college, department of vocal music were chosen for this study. Fifteen male and fifteen female untrained normal speakers were chosen for control group. Each subject was asked to produce a sample of a sustained spoken vowel /ah/ sound for at least five seconds and read sentence 'Kaeul'. The sound data was analyzed using the Fast Fourier Transform(FFT) - based power spectrum, Long term average(LTA) power spectrum using the FFT algorithm of the Computerized Speech Lab(CSL, Kay elemetrics, Model 4300B, USA). Statistical analysis was performed using the Mann-Whitney test of the Statistical Package for Social Sciences(SPSS). Results : For LTA Power spectrum of/ah/ sound, a significant increase was seen in the 2,500-3,500Hz region(p<0.01) in four trained singer group compared with untrained speaker group, and a significant increase in the 9,000-10,000Hz region(p<0.01) in soparano group. Similarly, in sentence 'Kaeul', there was a significant increase in energy in the tenor, baritone, mezzo soprano group compared with the untrained speaker group in the 2,500-3,500Hz region(p<0.01), and a significant increase in all frequency region(p<0.01) in the soprano group. Conclusions : The LTA power spectrum suggests that trained singers group show more energy concentration in the 'singer's formant' region in the speaking voice, and authors believe this region to be the 'speaker's ring'. Further research is needed on the effect of singing training on the resonance of the speaking voice.

  • PDF

성악다들의 목소리에 대한 Long Term Average Spectrum 분석 -$2^{nd}$ Singer's Formant의 존재 가능성에 대하여- (Long Term Average Spectrum Characteristics of Head and Chest Register Sounds of Western Operatic Singers : Extended Study)

  • 반재호;권영경;진성민
    • 대한후두음성언어의학회지
    • /
    • 제15권1호
    • /
    • pp.31-36
    • /
    • 2004
  • Background and Objectives : It has been shown that the epilaryngeal tube in the human airway is responsible for vocal ring, or the singer's formant. In previous study, authors showed that in trained tenors, besides the conventional singer's formant in the region of ,5500Hz, another energy peak was observed in the region of 8,000Hz. This peak was interpreted as the second resonance of the epilarynx tube. Singers in other voice categories who produce vocal ring are assumed to have the same peak, but no measurements have as yet been made. Materials and Methods : Fifteen tenors, fourteen baritones, seven sopranos and five mezzo sopranos attending the music college, department of vocal music who could reliably produce the head and chest registers were chosen for this study. Each subject was asked to produce an/ah/sound for at least three seconds for the head register sound(tenors ; G4, barions ; E4 sopranos ; F5 and mezzosopranos ; C5) and for the chest register sound (tenors ; C3, baritones ; D3, sopranos ; D4 and Mezzosoprano ; A3). The sound data was analyzed using the Fast Fourier Transform (FFT)-based power spectrum, Long term average(LTA) power spectrum using the FFT algorithm of the Computerized Speech Lab (CSL, Kay elemetrics, Model 4300B, USA). Statistical analysis was performed using the Mann-Whitney test of the Statistical Package for Social sciences(SPSS). Results : For head register sounds, a significant increase was seen in the 2,200-3,400Hz region(p<0.05) and the Similar to the head register sounds, there was a significant increase in energy in the four trained singer group compared with the untrained group in the 2,200-3,100Hz region(p<0.05), the 7,800-8,400Hz region(p<0.05) for the chest register sounds. Conclusions : When good vocal production was made for the head and chest registers, an energy peak was observed near 2,500Hz, a frequency already known as the "singer's formant', in all subjects in the study group. Another region of increased energy was observed around 8,000Hz that had not been noticed previously. The authors believe this region to be the second singer's formant.

  • PDF

고속 추적 특성을 위한 디지털 역지향성 배열 안테나 시스템 설계와 특성 평가 (System Design and Evaluation of Digital Retrodirective Array Antenna for High Speed Tracking Performance)

  • 김소라;유흥균
    • 한국통신학회논문지
    • /
    • 제38A권8호
    • /
    • pp.623-628
    • /
    • 2013
  • 역지향성 배열 안테나 시스템은 기존의 빔형성 기술들에 비하여 복잡도가 낮고 간단하여 시스템 동작 속도가 빠르다. 따라서 고속이동체 환경에서의 빔추적에 용이하다. 하지만 역지향성 배열 안테나는 다중경로 환경 또는 다중 사용자 신호에 따른 AOA(anle of arrival) 추정에 어려움이 있다. 이러한 AOA 추정의 불확실성을 개선 하기 위해 MUSIC 알고리즘과 결합한 디지털 역지향성 배열 안테나 시스템을 제안한다. 본 논문에서는 위상을 추정하는 디지털 PLL 하나를 통하여 위상을 찾는 디지털 역지향성 배열 안테나 시스템을 설계하며 시속 300Km/h의 속도의 이동체를 송수신 거리 100m일때, 원 경로를 따라 움직이는 환경에서의 역지향성 배열 안테나 시스템의 성능을 확인하였고, 다중경로 환경을 고려 하였을 때 시스템의 성능 또한 확인하였다. 고속 추적 모델에 따라AOA를 추적한 결과 10dB의 SNR에서는 오차크기의 평균이 $4.2^{\circ}$, SNR이 20dB인 경우에는 오차크기 평균이 $1.3^{\circ}$이다.