• 제목/요약/키워드: 동적 세그멘테이션

검색결과 5건 처리시간 0.022초

동적 세그멘테이션을 이용한 폴리포닉 오디오 신호의 정현파 모델링 (Sinusoidal Modeling of Polyphonic Audio Signals Using Dynamic Segmentation Method)

  • 장호근;박주성
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.58-68
    • /
    • 2000
  • 본 논문에서는 폴리포닉 오디오 신호에 대한 정현파 모델링 방법을 제안한다. 정현화 모델링을 폴리포닉 오디오 신호에 적용하는데 있어서 가장 큰 문제점은 스펙트럼 분석을 위한 분석 윈도우의 크기를 결정할 수 없다는 것이다. 또한 고음질의 합성음을 위해서는 악기음의 특성을 결정짓는 어택이 잘 보존되어야 한다. 본 논문에서는 입력 신호를 6개의 옥타브 벤드 구조의 다중 해상도 필터 뱅크를 통과시키고, 각 서브벤드 신호에 대해 서로 다른 크기의 분석 윈도우를 적용시킴으로써 폴리포닉 오디오 신호에 대한 분석 윈도우 크기 결정 문제를 해결한다. 정현파 모델링에서 발생하는 어택과 같은 천이 구간에서의 퍼짐 현상을 개선하기 위해 각 서브밴드 신호에 동적 세그맨테이션 방법을 적용하여 천이 구간 근처에서는 분석과 합성 프레임 크기를 작게 하는 방법을 사용한다. 이 방법을 통해 서브밴드 신호의 구간별 시간-주파수 특성에 따라 적절한 크기의 윈도우를 선택할 수 있다. 동적 세그멘테이션 방법으로는 기존의 방법보다 계산량과 성능 면에서 더 나은 특성을 보이는 방법을 제안한다. 여러가지 폴리포닉 오디오 신호에 대한 시뮬레이션 결과 제안한 정현파 모델링 방법이 음질의 손상 없이 원래 신호를 잘 복원할 수 있음을 확인하였다.

  • PDF

인물 사진에서의 얼굴 추출과 눈 개폐 여부 검증 (Face detection and eye blinking verification in common photos)

  • 배정호;황영철;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.801-804
    • /
    • 2008
  • 얼굴 추출 과정은 얼굴 인식 과정의 가장 선행되는 과정이라고 할 수 있다. 하지만 얼굴이라는 객체는 매우 고유동적인 성격을 가지고 있어서 접근하는 방법을 어떻게 하느냐에 따라서 그 결과가 매우 달라지는 경우가 많다. 본 논문은 배경 속에 들어가 있는 얼굴이라는 객체를 CbCr 분포 맵에 기반을 둔 색상 정보와 세그멘테이션, 레이블링을 통해 추출, 색상 정보와 에지 정보를 이용하여 눈 영역을 검출하고 개폐 여부를 검증하는 알고리즘을 수행하였다.

  • PDF

정현파 모델링을 이용한 폴리포닉 오디오 신호의 시간축 변화 (Time-Scale Modification of Polyphonic Audio Signals Using Sinusoidal Modeling)

  • 장호근;박주성
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.77-85
    • /
    • 2001
  • 본 논문에서는 폴리포닉 음과 같은 복잡한 스펙트럼을 갖는 오디오 신호를 정현파 성분으로 모델링하고, 이를 바탕으로 고음질의 시간축 변화된 음을 얻는 방법을 제안한다. 입력 신호는 옥타브 밴드 구조의 다중 해상도 필터 뱅크를 통과하고 여기에서 나온 각 서브밴드 신호로부터 정현파 성분이 축출된다. 서브밴드 신호의 정현파 분석시 정현파 성분을 추출하는 구간의 크기를 국지적인 신호의 특성에 따라 다르게 해 주는 동적 세그멘테이션 방법을 적용한다. 이렇게 함으로써 기존 정현파 모델링에서 신호의 천이 구간에서 발생하는 퍼짐 현상을 개선하고, 시간축 변화 시에도 원래 음에 가까운 음질을 얻을 수 있다. 정현파 분석을 위한 스펙트럼 분석 도구로는 심리 음향 모델을 적용한 matching pursuit을 사용함으로써 정현파 성분의 갯수를 줄이고, matching pursuit의 반복 과정에 대한 합리적인 정지 조건을 제공할 수 있다. 정현파 성분으로 표현하기 어려운 신호의 잡음 성분은 원래 신호에서 정현파 성분으로 합성된 신호를 뺀 것으로 얻을 수 있으며, 스펙트럼 포락선 근사화 방법으로써 모델링된다. 본 논문의 알고리즘을 적용해 다양한 폴리포닉 음에 대해 실험한 결과 제안한 정현파 모델링 방법이 원래 신호의 음질을 잘 복원할 수 있고, 시간축 변화율이 큰 경우에도 신호의 천이 구간을 잘 표현할 수 있음을 확인하였다.

  • PDF

사용자 선호도와 시각적 기술자를 이용한 사용자 프로파일 기반 이미지 추천 알고리즘 (Image recommendation algorithm based on profile using user preference and visual descriptor)

  • 김덕환;양준식;조원희
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.463-474
    • /
    • 2008
  • 정보 기술과 인터넷의 발전은 멀티미디어 컨텐츠의 양에 있어서 폭발적인 성장을 가져 왔으며 이러한 멀티미디어 컨텐츠 양의 증가는 이용자의 요구에 맞는 멀티미디어 컨텐츠 추천에 대한 필요성을 더 증가 시켰다. 현재까지 일반상품과 멀티미디어 컨텐츠 추천을 위한 기법에는 협업필터링 (CF: Collaborative Filtering)이 있다. 하지만 기존의 CF 기법은 이미지가 갖고 있는 시각적 특징을 제대로 표현하지 못하고 있으며, 입력 데이터의 희박성 (Sparsity) 문제와 신상품 추천 문제 그리고 선호도의 동적인 변화 문제를 포함하고 있기 때문에 이미지 컨텐츠 추천에는 적합하지 않다. 이와 같은 기존의 CF기법의 단점을 해결하기 위해서 본 논문에서는 새로운 이미지 추천 방법으로 FBCF (Feature Based Collaborative Filtering) 기법을 제안한다. FBCF 기법은 시각적 특징을 선호도에 따라 군집화한 새로운 사용자 프로파일 구성방법을 제시하며, 선호도 피드백을 통하여 구매자의 현재 성향을 추천에 반영할 수 있다. 실제 모바일 이미지 데이터를 사용한 실험에서 FBCF 기법이 기존의 CF 기법보다 400% 향상된 성능을 보임을 확인할 수 있다.

감시 비디오에서 등록 및 미등록 물체의 실시간 도난 탐지 (Realtime Theft Detection of Registered and Unregistered Objects in Surveillance Video)

  • 박혜승;박승철;주영복
    • 한국정보통신학회논문지
    • /
    • 제24권10호
    • /
    • pp.1262-1270
    • /
    • 2020
  • 최근 관심이 높아지고 있는 스마트 감시 비디오에 관한 연구는 주로 침입자 탐지 및 추적과 유기 물체 탐지에 초점이 맞춰져 왔고, 도난 물체의 실시간 탐지에 대한 연구는 중요성에 비해 상대적으로 미흡한 상황이다. 본 논문은 스마트 감시 비디오 적용 환경을 고려하여 두 가지의 서로 다른 도난 물체 탐지 알고리즘을 제시한다. 먼저 이중 배경 차감 모델(dual background subtraction model)을 사용하여 사전에 정적 및 동적으로 등록된 감시 대상 물체의 도난을 탐지하는 알고리즘을 제시한다. 그리고 이중 배경 차감 모델과 Mask R-CNN 기반의 객체 세그멘테이션 기술을 통합적으로 적용하여 일반 감시 물체의 도난을 탐지하는 알고리즘을 제시한다. 전자의 알고리즘은 등록된 감시 물체를 대상으로 계산 능력이 높지 않은 환경에서 경제적인 도난 탐지 서비스를 제공할 수 있고, 후자의 알고리즘은 충분한 계산 능력을 제공할 수 있는 환경에서 보다 광범위한 일반 감시 물체의 도난 탐지에 적용할 수 있다.