• 제목/요약/키워드: Music Algorithm

검색결과 344건 처리시간 0.027초

시선 방향 추정 알고리즘을 이용한 다중 사물 제어 시스템의 구현 (Implementation of Multi-device Remote Control System using Gaze Estimation Algorithm)

  • 유혜미;이주영;전수림;나정은
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.812-814
    • /
    • 2022
  • 제어할 사물을 선택하기 위해 여러 단계를 거쳐야 하는 기존 '스마트 홈'의 단점을 보완하고자 본 논문에서는 사용자의 시선 방향을 추정하여 사용자가 바라보는 방향에 있는 사물을 제어할 수 있는 시스템을 제안한다. 일반 RGB 카메라를 통해 Pose Estimation으로 추출한 Landmark들의 좌표 값을 이용하여 시선 방향을 추정하는 알고리즘을 구현하였으며, 이는 근적외선 카메라와 Gaze Tracking 모델링을 통해 이루어지던 기존의 시선 추적 기술에 비해 가벼운 데이터를 산출하고 사용자와 센서간의 위치 제약이 적으며 별도의 장비를 필요로 하지 않는다. 해당 알고리즘으로 산출한 시선 추적의 정확도가 실제 주거환경에서 사용하기에 실효성이 있음을 실험을 통해 입증하였으며, 최종적으로 이 알고리즘을 적용하여 적외선 기기와 Google Home 제품에 사용할 수 있는 시선 방향 사물 제어 시스템을 구현하였다.

Visual Rhythm의 방향성을 이용한 장면변환 검출 (Scene change detection using visual rhythm by direction)

  • 윤상호;유지상
    • 한국통신학회논문지
    • /
    • 제29권8C호
    • /
    • pp.1193-1202
    • /
    • 2004
  • 최근 디지털 컨텐츠 관리의 중요성이 점점 증대되는 가운데, 동영상 컨텐츠의 중복장면을 최대한 줄이고, 대량의 비디오 데이터를 효과적으로 하기 위하여 장면변환 검출과 관련된 연구가 계속 진행되고 있다. 기존의 히스토그램과 화소 차를 이용한 장면변환 검출 기법은 조명변화와 움직임에 민감한 결과를 나타내었다. 따라서, 최근에는 계산량이 적고, 장면특성을 비교적 잘 나타내는 visual rhythm을 사용한 검출 방법이 많이 연구되어지고 있다. 본 논문에서는 visual rhythm의 방향성을 이용하여 장면을 검출하는 기법을 제안하였다. 제안하는 기법에서는 계산량을 효과적으로 줄일 수 있으며, 방향성 측정으로 인해 움직임이 있는 장면에서도 지속적인 성능을 가질 수 있다. 실험 결과에서는 기존에 사용되던 히스토그램을 이용한 장면변환 검출과 비교하여 약 30%의 성능효과를 보였고, 움직임이 많은 광고와, 뮤직비디오에서 비슷한 성능이 유지됨을 확인 할 수 있었다.

스펙트럼 성형기법을 이용한 멀티미디어 콘텐츠의 명료도 향상 (Intelligibility Enhancement of Multimedia Contents Using Spectral Shaping)

  • 지유나;박영철;황영수
    • 전자공학회논문지
    • /
    • 제53권11호
    • /
    • pp.82-88
    • /
    • 2016
  • 본 논문에서는 스펙트럼 성형기법을 이용한 멀티미디어 콘텐츠 명료도 향상 알고리즘을 제안한다. 영화, 동영상과 같은 오디오-비주얼 미디어 콘텐츠에서 다이얼로그는 영상의 내용을 이해하기 위한 중요한 요소이다. 하지만 종종 영상내의 효과음, 배경음악 등과 같이 함께 믹싱 된 오디오 성분에 의해 중요한 정보를 지닌 다이얼로그의 명료도가 떨어지는 문제점이 제기되어왔다. 뿐만 아니라 멀티미디어 콘텐츠의 이용 환경이 다양해지면서 청자의 주변 환경 또한 오디오 볼륨에 영향을 미치는 요소가 된다. 본 논문에서는 이러한 문제점을 해결하기 위해 영상의 중요 단서를 담고 있는 사운드트랙의 음성 성분 명료도를 높이고자 한다. 제안된 알고리즘은 먼저 영상의 스테레오 오디오 신호에서 음성 존재 확률(Speech Presence Probability)을 이용한 소프트 마스커를 통해 다이얼로그 성분을 검출한다. 추출된 다이얼로그 성분은 스펙트럼 성형 기법을 적용하여 명료도에 중요한 영향을 미치는 고주파대역의 성분을 증폭시키는 등 음성 신호 스펙트럼의 에너지를 재분배하여 신호의 명료도를 향상 시켰다. 마지막으로 크기 정규화 과정을 통해 프로세스 전과 후의 전체 오디오의 파워를 동일하게 유지함으로써 증폭으로 인한 스피커의 오디오 포화(saturation)를 방지하였다. 실험을 통해 본 알고리즘이 동일한 오디오 볼륨에서 영상의 명료도를 향상시킴을 확인 할 수 있었다.

HTML 태그 순서를 이용한 불법 사이트 탐지 자동화 기술 (An Automated Technique for Illegal Site Detection using the Sequence of HTML Tags)

  • 이기룡;이희조
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1173-1178
    • /
    • 2016
  • 2001년 비트토렌트 프로토콜이 설계된 후로 음악, 영화, 소프트웨어 등 모든 것을 다운로드할 수 있게 되었다. 이를 통해 저작권이 있는 파일이 무분별하게 공유가 되었고 저작권자들은 많은 피해를 입었다. 이 문제를 해결하기 위해 국가에서는 관련법을 제정하였고 ISP는 불법 사이트를 차단하였다. 이러한 노력들에도 불구하고 pirate bay와 같은 불법 사이트들은 도메인을 바꾸는 등 쉽게 사이트를 재오픈하고 있다. 이에 우리는 재오픈된 불법 사이트를 쉽게 탐지하는 기술을 제안한다. 이 자동화 기술은 구글 검색엔진을 이용하여 도메인을 수집하고, 최장공통부분수열(LCS) 알고리즘을 이용하여 기존 웹페이지 태그와 검색된 웹페이지 태그를 비교, 유사도를 측정한다. 실험을 위해 총 2,383개의 검색 결과를 구글 검색으로 얻었다. LCS 유사도 알고리즘을 적용하여 검사한 결과 44개의 해적 사이트를 탐지하였다. 또한 해외 불법 사이트에 적용한 결과 805개 검색 도메인에서 23개의 불법 사이트를 탐지하였다. 이를 통해 제안된 탐지 자동화 기술을 사용한다면 불법 사이트가 재 오픈을 하더라도 쉽게 탐지할 것으로 보인다.

자기상관과 에지 히스토그램을 이용한 동영상 전환점 검출 (Detection of Video Cut Using Autocorrelation Function and Edge Histogram)

  • 노정진;문영호;유지상
    • 한국통신학회논문지
    • /
    • 제29권9C호
    • /
    • pp.1269-1278
    • /
    • 2004
  • 본 논문에서는 자기상관 함수와 에지 히스토그램 비교법을 이용하여 동영상 전환점을 자동으로 추출하는 기법을 제안한다. 기존에는 컬러 히스토그램 비교법을 많이 사용하였으나, 급격한 조명 변화에 민감하고 컬러 히스토그램 분포가 비슷한 부분의 장연 전환을 놓칠 있다는 단점이 있다. 본 논문에서 제안하는 자기상관과 에지 히스토그램 비교법을 사용하면 조명 변화에 의한 장면전환이 잘못 검출되는 것을 방지 할 수 있다 제안한 기법의 성능평가를 위하여 광고, 뉴스, 드라마, 애니메이션 등 다양한 비디오 데이터에 가지고 실험한 결과, 컬러 히스토그램 비교법보다 Recall에서는 약 10%, Precision 에서는 약 17% 성능이 향상되었다 특히 카메라 기법 중의 Fade 와 Zoon In/out 에 좋은 성능을 보인다.

의료 영상보안을 위한 기하학적 변형에 견고한 워터마킹 알고리즘 설계 (Design of robust Watermarking Algorithm against the Geometric Transformation for Medical Image Security)

  • 이윤배;오근탁
    • 한국정보통신학회논문지
    • /
    • 제13권12호
    • /
    • pp.2586-2594
    • /
    • 2009
  • 디지털 워터마크 기법은 지적 창작물(음악, 영상, 동영상)에 대한 저작권과 재산권의 보호 및 인증, 데이터 손실 여부 판단, 복사 방지 및 추적 등을 목적으로 한 사후 재산권의 보호 기술로 제안되었다. 본 연구에서는 워터마크의 기하학적인 왜곡에 대한 공격에 견고하게 하도록 영상의 전처리 과정을 거친 후 선택된 기하학적인 불변점을 골라 그 점을 중심으로 워터마크를 삽입하여 추출한다. 특히 의료 영상의 병변 관찰을 위해 발생된 RST(Rotation Scale, Translation) 변환 및 여러 가지 영상처리에 강인하며 일정 기간 압축 저장되는 영상에서도 워터마킹이 유지되도록 워터쉐드(watershed) 분할 방법을 통한 견고한 워터 마킹 알고리즘을 제안 하였다. 이를 통해 본 논문에서 제안한 워터마킹 알고리즘은 의료 영상에 대한 JPEG압축공격, RST공격, 그리고 필터링 공격보다 강인함을 확인하였다.

음색 기반 뇌파측정 및 분석기법 개발 (Development of EEG Signals Measurement and Analysis Method based on Timbre)

  • 박승민;이영환;고광은;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제20권3호
    • /
    • pp.388-393
    • /
    • 2010
  • 문화콘텐츠기술(CT, Culture Technology)은 문화 산업 발전을 위한 기술로 문화콘텐츠 기획과 상품화, 미디어탑재, 전달의 가치사슬 과정 등 문화상품의 부가가치를 높이기 위해 소용되는 모든 형태의 유무형의 기술이다. 문화콘텐츠 기술(CT)분야에서 음악의 특징을 분석하여 다양한 어플리케이션을 개발하는 연구가 활발히 진행되고 있다. 이와 관련된 연구 중 EEG를 측정하고 그 결과에서 음악적 자극에 대한 반응을 검출하여 활용하는 연구가 주목받고 있다. 본 논문에서는 EEG에서 음악적 자극에 대응되는 반응신호들을 증폭시켜 평균화 하는 방법인 ERP(Event-Related Potentials) 실험을 기반으로 음색을 추출하는 과정에서 노이즈를 제거하기 위한 방법으로 ICA 알고리즘을 적용하여 음색 추출 및 노이즈 제거 결과에 따른 EEG의 특성을 분석하여 적용한다.

오디오 정보를 이용한 골프 동영상 자동 색인 알고리즘 (Automatic Indexing Algorithm of Golf Video Using Audio Information)

  • 김형국
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.441-446
    • /
    • 2009
  • 본 논문에서는 오디오 정보 분석을 이용하여 골프 통영상을 자동 색인하는 알고리즘을 제안한다. 제안하는 알고리즘에서는 입력되는 골프 동영상을 비디오 신호와 오디오 신호로 분리한 후에, 연속적인 오디오 스트림을 Adaboost Cascade 분류방식을 통하여 스튜디오 환경에서의 아나운서의 음성구간, 선수이름이 TV 화면에 소개 될 때 수반되는 음악구간, 선수들의 플레이에 따라 반응하는 관중들의 박수 및 환호성 소리구간, 필드에서의 레포터의 음성구간, 바다나 바람 등의 필드환경 잡음 사운드구간 등의 5가지 구간으로 분류한다. 그리고 드라이브 샷, 아이런 샷과 퍼팅 샷 시에 발생하는 스윙 사운드는 onset 검출과 변조스펙트럼 검증 방법을 통해 검출되며, 관객의 박수 소리 구간과 결합하여 액션 및 하이라이트를 효율적으로 색인할 수 있게 한다. 제안된 알고리즘은 오디오 신호의 간단한 연산을 통해 의미를 지니고 있는 기본구조들을 검출하기 때문에 골프 동영상에서 사용자가 원하는 부분을 빠르게 브라우징하는 임베이디드 시스템에 적용가능하다.

인공 신경망을 이용한 보청기용 실시간 환경분류 알고리즘 (Real Time Environmental Classification Algorithm Using Neural Network for Hearing Aids)

  • 서상완;육순현;남경원;한종희;권세윤;홍성화;김동욱;이상민;장동표;김인영
    • 대한의용생체공학회:의공학회지
    • /
    • 제34권1호
    • /
    • pp.8-13
    • /
    • 2013
  • Persons with sensorineural hearing impairment have troubles in hearing at noisy environments because of their deteriorated hearing levels and low-spectral resolution of the auditory system and therefore, they use hearing aids to compensate weakened hearing abilities. Various algorithms for hearing loss compensation and environmental noise reduction have been implemented in the hearing aid; however, the performance of these algorithms vary in accordance with external sound situations and therefore, it is important to tune the operation of the hearing aid appropriately in accordance with a wide variety of sound situations. In this study, a sound classification algorithm that can be applied to the hearing aid was suggested. The proposed algorithm can classify the different types of speech situations into four categories: 1) speech-only, 2) noise-only, 3) speech-in-noise, and 4) music-only. The proposed classification algorithm consists of two sub-parts: a feature extractor and a speech situation classifier. The former extracts seven characteristic features - short time energy and zero crossing rate in the time domain; spectral centroid, spectral flux and spectral roll-off in the frequency domain; mel frequency cepstral coefficients and power values of mel bands - from the recent input signals of two microphones, and the latter classifies the current speech situation. The experimental results showed that the proposed algorithm could classify the kinds of speech situations with an accuracy of over 94.4%. Based on these results, we believe that the proposed algorithm can be applied to the hearing aid to improve speech intelligibility in noisy environments.

화음탐색법과 토목 및 수자원공학 최적화문제에의 적용 (Harmony search algorithm and its application to optimization problems in civil and water resources engineering)

  • 김중훈
    • 한국수자원학회논문집
    • /
    • 제51권4호
    • /
    • pp.281-291
    • /
    • 2018
  • 화음탐색법은 2001년 고려대학교 수자원연구실에서 개발한 최적화 알고리즘으로 재즈의 즉흥연주에서 반복적인 연습을 거듭할 수 록 좋은 화음이 만들어지는 현상에 착안하였다. 화음탐색법은 처음 소개된 논문이 Google Scholar 기준 약 3,600여 회(2018년 1월 11일 기준) 인용될 만큼 유전자알고리즘과 견줄만한 세계적인 최적화 알고리즘이 되었고 비단 수자원공학 및 토목공학 뿐 만 아니라 공학 전 분야, 의학, 경영학, 인문학 등 다양한 분야에 적용되고 있다. 본 논문은 화음탐색법을 포함한 최적화 알고리즘이 수자원공학의 다양한 분야에서 널리 적용되기를 바라며 작성된 화음탐색법 총설논문(Review Article)이다. 따라서, 본 논문에서는 먼저 화음탐색법을 간략히 소개하고 적용분야 및 분야별 적용 빈도를 살펴본다. 또한 화음탐색법의 세계화 현황을 관련 학회의 성장과 관련 연구프로젝트의 동향 정리를 통해 알아본다. 마지막으로 국내 수자원공학 분야 연구에 적용된 최적화 알고리즘 현황을 살펴보고 활용의 증대를 위한 몇 가지 제안사항을 전달하며 마무리한다.