• 제목/요약/키워드: Music Engineering

검색결과 612건 처리시간 0.026초

음원 데이터베이스의 효율적 확장을 지원하는 내용 기반 음원 검색 시스템 (A Content-based Audio Retrieval System Supporting Efficient Expansion of Audio Database)

  • 박지훈;강현철
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권5호
    • /
    • pp.811-820
    • /
    • 2017
  • 음원 서비스의 주요 기능 중 하나인 내용 기반 검색을 위해 음원의 지문을 채취하여 데이타베이스에 저장하고 색인하여 검색에 활용하는 기법이 널리 사용되고 있다. 그런데 지속적으로 추가되는 신규 음원의 지문이 기존의 데이타베이스에 계속 삽입되면 공간 효율 및 음원 검색 성능의 저하가 점차 초래되는 문제점이 있다. 따라서 시스템 운용 비용의 증가를 가져오는 주기적인 데이터 베이스 재구성 없이 효율적인 음원 데이타베이스의 확장을 지원하는 기법이 요구된다. 본 논문에서는 샤잠의 지문 채취 알고리즘을 기반으로 클러스터 컴퓨팅 환경에서 맵리듀스 및 NoSQL 데이타베이스를 사용하여 이러한 문제를 해결하는 내용 기반 음원 검색 시스템의 설계를 제시하고 실제 음원 데이터를 이용한 다양한 실험을 통해 그 성능을 평가한다.

의료 영상보안을 위한 기하학적 변형에 견고한 워터마킹 알고리즘 설계 (Design of robust Watermarking Algorithm against the Geometric Transformation for Medical Image Security)

  • 이윤배;오근탁
    • 한국정보통신학회논문지
    • /
    • 제13권12호
    • /
    • pp.2586-2594
    • /
    • 2009
  • 디지털 워터마크 기법은 지적 창작물(음악, 영상, 동영상)에 대한 저작권과 재산권의 보호 및 인증, 데이터 손실 여부 판단, 복사 방지 및 추적 등을 목적으로 한 사후 재산권의 보호 기술로 제안되었다. 본 연구에서는 워터마크의 기하학적인 왜곡에 대한 공격에 견고하게 하도록 영상의 전처리 과정을 거친 후 선택된 기하학적인 불변점을 골라 그 점을 중심으로 워터마크를 삽입하여 추출한다. 특히 의료 영상의 병변 관찰을 위해 발생된 RST(Rotation Scale, Translation) 변환 및 여러 가지 영상처리에 강인하며 일정 기간 압축 저장되는 영상에서도 워터마킹이 유지되도록 워터쉐드(watershed) 분할 방법을 통한 견고한 워터 마킹 알고리즘을 제안 하였다. 이를 통해 본 논문에서 제안한 워터마킹 알고리즘은 의료 영상에 대한 JPEG압축공격, RST공격, 그리고 필터링 공격보다 강인함을 확인하였다.

자동작곡에서 조성과 반복구성을 위한 후처리 방법 및 다수 곡 학습을 위한 평균 신경망 방법 (Postprocessing for Tonality and Repeatability, and Average Neural Networks for Training Multiple Songs in Automatic Composition)

  • 김경환;정성훈
    • 한국지능시스템학회논문지
    • /
    • 제26권6호
    • /
    • pp.445-451
    • /
    • 2016
  • 본 논문에서는 기존의 인공신경망을 이용한 자동작곡에서 음악적으로 부족한 부분을 개선하기 위해 조성을 후처리하는 방법과 멜로디에 반복성을 주는 방법 그리고 다수의 곡을 학습하기 위한 평균 신경망 방법을 제안한다. 인공신경망을 이용하여 작곡된 곡의 멜로디는 인공신경망에 학습된 곡의 멜로디에 따라서 출력되는 것으로 음악적으로 특정한 조성에 맞는 곡이 출력되지 않으며 또한 반복적인 멜로디 구성이 나오기 어렵다. 본 논문에서는 이를 해결하기 위하여 인공신경망이 출력한 멜로디를 음악이론에 따라서 특정한 조성으로 후처리하는 방법과 마디구분을 반복적으로 구성하여 멜로디 진행에 반복을 주는 방법을 제안한다. 또한 기존 연구에서 사용한 다수의 곡을 학습하는 방법은 여러 가지 단점이 있었다. 이를 해결하기 위하여 다수의 곡을 학습하는 방법으로 각 곡을 학습한 인공신경망의 가중치를 평균하여 만든 평균 인공신경망을 사용하는 것을 제안한다. 제안한 방법을 적용하여 작곡한 결과 제안한 방법이 기존의 문제점을 해결하는 것을 확인할 수 있었다.

다문화가족 아동과 청소년에게 적용된 건강 관련 중재연구의 동향 : 간호교육에의 시사점 (Trends in Health-Related Intervention Research Applied to Children and Adolescents in Multicultural Families)

  • 유하나;최정아
    • 실천공학교육논문지
    • /
    • 제11권1호
    • /
    • pp.133-141
    • /
    • 2019
  • 본 연구는 다문화가족 아동 및 청소년에게 제공된 건강관련 중재 연구들의 동향과 효과를 분석함으로써 간호 중재 및 교육방안의 근거를 제공하고자 시행되었다. Scoping 방법에 따라 8개의 국내외 전자데이터베이스를 통하여 검색된 604개의 문헌 중 선정기준과 제외기준에 따라 최종 12편의 문헌을 분석하였다. 분석 결과, 초등학생 대상의 연구가 대부분이었고, 중재 프로그램의 유형은 미술 활동, 음악 활동, 심리 치료 및 상담, 신체 활동이며, 중재 효과는 신체적, 심리사회적, 발달상의 변수로 분류되었다. 본 연구를 통해 다문화가족 아동 및 청소년의 주요 건강 문제 예방 및 증진을 위한 중재 연구의 필요성이 제기되었으며, 더불어 신체적, 심리사회적, 발달적 영역을 포함하는 포괄적인 중재 전략 마련이 요구됨을 확인하였다.

딥러닝 기반 음향 신호 대역 확장 시스템 (Deep Learning based Raw Audio Signal Bandwidth Extension System)

  • 김윤수;석종원
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1122-1128
    • /
    • 2020
  • 대역 확장(Bandwidth Extension)이란 채널 용량 부족 혹은 이동통신 기기에 탑재된 코덱의 특성으로 인해 부호화 및 복호화 과정에서 대역 제한(band limited)되거나 손상된 협대역 신호(NB, Narrow Band)를 복원, 확장하여 광대역 신호(WB, Wide Band)로 전환 시켜주는 것을 의미한다. 대역 확장 연구는 주로 음성 신호 위주로 대역 복제(SBR, Spectral Band Replication), IGF(Intelligent Gap Filling)과 같이 고대역을 주파수 영역으로 변환하여 복잡한 특징 추출 과정을 거쳐 이를 바탕으로 사라지거나 손상된 고대역을 복원한다. 본 논문에서는 딥러닝 모델 중 오토인코더(Autoencoder)를 바탕으로 1차원 합성곱 신경망(CNN, Convolutional Neural Network)들의 잔차 연결을 활용하여 복잡한 사전 전처리 과정 없이 일정한 길이의 시간 영역 신호를 입력시켜 대역 확장 시킨 음향 신호를 출력하는 모델을 제안한다. 또한 음성 영역에 제한되지 않는 음악을 포함한 여러 종류의 음원을 포함하는 데이터셋에 훈련시켜도 손상된 고대역을 복원할 수 있음을 확인하였다.

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.

비대면 시대에 메타버스를 이용한 교육의 효과와 적용사례에 대한 연구 (A Study on the Effects and Application Cases of Education Using Metaverse in the Non-Face-To-Face Era)

  • 송은지
    • 실천공학교육논문지
    • /
    • 제14권2호
    • /
    • pp.361-366
    • /
    • 2022
  • 최근 가상증강현실 기술의 발달로 메타버스가 차세대 인터넷 시대를 주도할 새로운 패러다임으로 떠오르면서 사회나 경제적 활동이 게임, 엔터테인먼트, 음악, 콘텐츠 산업 등을 중심으로 확산 중이다. 더구나 코로나19 발생 이후 비대면 전환이 가속화되면서 생활양식과 산업현장이 언택트(Untact)화 되고 나아가 빠르게 메타버스화 되고 있다. 특히, 교육 분야에 메타버스 적용이 주목받고 있는데, 이는 아바타를 이용한 실시간 음성 대화, 3차원 오브젝트, 360도 영상 등을 활용하는 실감형 수업이 몰입도를 높여 원격 교육의 한계를 극복할 수 있기 때문이다. 본 연구에서는 메타버스의 개념을 살펴보고 메타버스를 활용한 교육이 비대면 시대에 교육의 효과를 높일 수 있는 대안이 될 수 있음을 고찰한다. 특히 언어교육에 효율적임을 보이고 실제 메타버스 기반 한국어 언어교육 프로그램을 제안한다.

사용자 경험정보를 고려한 결정트리 기반 음악 추천 시스템 (A Decision Tree-based Music Recommendation System Using the user experience)

  • 김유리;김성지;김정호;조재림;이동욱;김석진;전수빈;서동만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.655-658
    • /
    • 2020
  • 최근 IT 기술의 발달로 태블릿, 스마트폰과 같은 다양한 디바이스로 손쉽게 음악을 감상할 수 있다. 하지만 최근 이런 기술 발달과는 다르게 사용자가 원하는 음악을 검색하는 방법은 고전적인 형태에서 벗어나지 않고 있다. 기존 음악 검색 방법은 텍스트 기반, 내용 기반, 소비자 감성 기반의 음악 추천 검색 방법이 있으며 저장된 메타 데이터를 이용하여 사용자의 질의에 대한 결과만 제공할 뿐 사용자의 경험 정보를 고려하지 않는다. 그리고 기존 플랫폼들은 사용자가 최근 많이 들은 가수, 장르, 분위기를 종합하여 사용자에게 어울리는 음악을 추천을 할 뿐 사용자의 경험정보를 고려하여 음악을 추천하지는 않는다. 본 논문에서는 사용자의 경험 정보를 활용하여 사용자 맞춤형 음악 추천 시스템을 제안한다. 본 시스템은 사용자의 현재 기분 정보, 주변 날씨 정보 등을 입력 받는다. 이후, 경험 정보를 기반으로 결정 트리를 통해 사용자 요구 기반의 음악 추천 시스템을 구축하였다.

Missing-Feature 복구를 위한 대역 독립 방식의 베이시안 분류기 기반 마스크 예측 기법 (Mask Estimation Based on Band-Independent Bayesian Classifler for Missing-Feature Reconstruction)

  • 김우일;;고한석
    • 한국음향학회지
    • /
    • 제25권2호
    • /
    • pp.78-87
    • /
    • 2006
  • 본 논문에서는 알려지지 않은 잡음 환경에서 강인한 음성 인식 성능을 위하여 missing-feature복구 기법을 다루며, 베이시안 분류기를 기반으로 하는 마스크 예측 기법의 성능을 향상시킬 수 있는 방법을 제안한다. 기존의 마스크 예측 기법에서는 배경 잡음 종류에 독립적인 성능을 위해 전 주파수 대역을 분할하여 발생시킨 유색 잡음을 마스크 예측기의 훈련에 이용하였으나, 제한된 양의 훈련 데이터베이스 조건에서는 성능의 한계가 불가피하다. 보다 다양한 잡음 스펙트럼을 반영하면서 마스크 예측의 성능을 향상시키기 위해, 서로 다른 주파수 대역에 독립적인 구조를 가지는 베이시안 분류기를 제안하며, 훈련에 사용하는 유색 잡음의 생성 방식을 이에 맞게 수정한다. 각각의 주파수 대역을 분할하여 유색 잡음을 생성함으로써 다양한 잡음 환경을 반영하는 동시에 훈련 데이터베이스 부족 문제를 줄일 수 있다. 제안하는 마스크 예측 기법을 클러스터 기반의 missing-feature 복구 기법과 결합하여 음성 인식기에 적용함으로써 성능을 평가한다. 실험 결과는 제안한 기법이 백색 잡음, 자동차잡음, 배경 음악환경에서 기존의 방법에 비해 향상된 성능을 가짐을 입증한다.

인공 신경망을 이용한 보청기용 실시간 환경분류 알고리즘 (Real Time Environmental Classification Algorithm Using Neural Network for Hearing Aids)

  • 서상완;육순현;남경원;한종희;권세윤;홍성화;김동욱;이상민;장동표;김인영
    • 대한의용생체공학회:의공학회지
    • /
    • 제34권1호
    • /
    • pp.8-13
    • /
    • 2013
  • Persons with sensorineural hearing impairment have troubles in hearing at noisy environments because of their deteriorated hearing levels and low-spectral resolution of the auditory system and therefore, they use hearing aids to compensate weakened hearing abilities. Various algorithms for hearing loss compensation and environmental noise reduction have been implemented in the hearing aid; however, the performance of these algorithms vary in accordance with external sound situations and therefore, it is important to tune the operation of the hearing aid appropriately in accordance with a wide variety of sound situations. In this study, a sound classification algorithm that can be applied to the hearing aid was suggested. The proposed algorithm can classify the different types of speech situations into four categories: 1) speech-only, 2) noise-only, 3) speech-in-noise, and 4) music-only. The proposed classification algorithm consists of two sub-parts: a feature extractor and a speech situation classifier. The former extracts seven characteristic features - short time energy and zero crossing rate in the time domain; spectral centroid, spectral flux and spectral roll-off in the frequency domain; mel frequency cepstral coefficients and power values of mel bands - from the recent input signals of two microphones, and the latter classifies the current speech situation. The experimental results showed that the proposed algorithm could classify the kinds of speech situations with an accuracy of over 94.4%. Based on these results, we believe that the proposed algorithm can be applied to the hearing aid to improve speech intelligibility in noisy environments.