• 제목/요약/키워드: Quantization Error

검색결과 296건 처리시간 0.026초

피치 히스토그램과 MFCC-VQ 동적 패턴을 사용한 음악 검색 (Music Identification Using Pitch Histogram and MFCC-VQ Dynamic Pattern)

  • 박철의;박만수;김성탁;김회린
    • 한국음향학회지
    • /
    • 제24권3호
    • /
    • pp.178-185
    • /
    • 2005
  • 본 논문에서는 내용기반 음악 정보 검색 방법으로써 멜로디의 시간 변화 특성과 통계적 특성을 모두 이용할 수 있는 hybrid 방법에 대해 제안하였다. 실제 방송 환경에의 적용을 위해 드라마 OST의 좁은 검색 범위뿐만 아니라 가요 1,005곡의 넓은 검색 범위에서도 제안한 방법을 이용하여 실험하였다. 제안된 방법은 특징 벡터로써 pitch와 MFCC(Mel Frequency Cepstral Coefficient)를 사용하여 음의 특성을 나타내었으며 멜로디를 표현하기 위해 피치 히스토그램과 VQ (Vector Quantization) 코드화한 MFCC의 템포럴 시퀀스를 이용함으로써 음악 검색 방법에 멜로디의 시간 변화 특성과 통계적 특성을 함께 적용할 수 있었다. 또한 pitch 히스토그램과 MFCC-VQ 템포럴 방법을 모두 사용한 hybrid 방식에 적절한 패턴 매칭 방법을 제안함으로써 기존의 각 단일 방식을 이용한 성능 결과 (MFCC-VQ 템포럴)와 비교하여 볼 때 드라마 OST 검색 범위에서는 평균 $9.9\%$, 가요 1,005곡의 검색 범위에서는 $10.2\%$의 오류 감소율을 나타내었다.

동영상 동기화 알고리즘을 이용한 수업 분석 방법 (Class Analysis Method Using Video Synchronization Algorithm)

  • 권오성
    • 정보교육학회논문지
    • /
    • 제19권4호
    • /
    • pp.441-448
    • /
    • 2015
  • 본 논문은 기 촬영된 수업 동영상을 분석 결과와 동기화하여 재생시키고 확인할 수 있는 소프트웨어 구현에 관한 것이다. 이를 위하여 본 논문에서는 동영상 재생 구간과 분석 내용이 동기화 될 수 있도록 하는 동영상 인덱싱 방법, 자료구조, 그에 따른 선별적 재생 방안을 제시한다. 사용자는 제안하는 방식을 이용하여 동영상 재생 내용을 구간별로 확인할 수 있고 역으로 분석 결과를 입력으로 원하는 지점의 동영상 구간을 검색할 수 있다. 본 논문에서는 수업 분석을 도입, 전개, 정리의 시간 흐름 단계로 구분하여 진행하였고, 단계별 재생에 맞게 일정 간격으로 분석 필터를 적용하였다. 구현된 수업 분석 소프트웨어를 사용하여 몇 가지 수업 사례를 적용한 결과, 성공적으로 필요한 수업 분석을 진행할 수 있었고 동기화 성능 실험에서도 그 효율성을 확인할 수 있었다.

Pan-Tilt-Zoom 카메라를 이용한 파노라마 배경 생성과 객체 추적 (Panorama Background Generation and Object Tracking using Pan-Tilt-Zoom Camera)

  • 백인호;임재현;박경주;백준기
    • 대한전자공학회논문지SP
    • /
    • 제45권3호
    • /
    • pp.55-63
    • /
    • 2008
  • 본 논문은 전 방향을 감시할 수 있는 Pan-Tilt-Zoom(PTZ) 카메라를 이용한 파노라마 배경 생성과 객체 추적 방법을 제안한다. 제안된 방법은 연속되는 두 영상의 외곽 영역에서 미리 정한 지역만 위상정합(phase correlation)을 하여 카메라의 지역 움직임을 빠르게 추정하고 벡터 양자화를 통하여 움직임 추정 오차를 최소화 한다. 추정된 움직임 값을 이용하여 겹침 영역이 존재하는 영상들을 획득하여 실린더에 투영시키고 영상을 재 정렬함으로써 파노라마 배경 영상을 생성할 수 있다. 객체 추적은 미리 생성된 파노라마 배경과 입력 영상의 차분 방법을 이용하여 배경과 객체를 분리하고 객체의 움직임을 추적한다. 제안된 객체 추적 방법은 PTZ 카메라를 이용하여 빠르고 안정적인 배경 생성이 가능하고, 전방향의 객체를 지속적으로 추적하는 것이 가능하다. 제안된 방법은 실시간 처리가 가능하며 넓은 감시 지역에서 객체의 형태를 추적하거나 얼굴인식과 같은 분야에서 이용될 수 있을 것이다.

Adaptive OFDMA with Partial CSI for Downlink Underwater Acoustic Communications

  • Zhang, Yuzhi;Huang, Yi;Wan, Lei;Zhou, Shengli;Shen, Xiaohong;Wang, Haiyan
    • Journal of Communications and Networks
    • /
    • 제18권3호
    • /
    • pp.387-396
    • /
    • 2016
  • Multiuser communication has been an important research area of underwater acoustic communications and networking. This paper studies the use of adaptive orthogonal frequency-division multiple access (OFDMA) in a downlink scenario, where a central node sends data to multiple distributed nodes simultaneously. In practical implementations, the instantaneous channel state information (CSI) cannot be perfectly known by the central node in time-varying underwater acoustic (UWA) channels, due to the long propagation delays resulting from the low sound speed. In this paper, we explore the CSI feedback for resource allocation. An adaptive power-bit loading algorithm is presented, which assigns subcarriers to different users and allocates power and bits to each subcarrier, aiming to minimize the bit error rate (BER) under power and throughput constraints. Simulation results show considerable performance gains due to adaptive subcarrier allocation and further improvement through power and bit loading, as compared to the non-adaptive interleave subcarrier allocation scheme. In a lake experiment, channel feedback reduction is implemented through subcarrier clustering and uniform quantization. Although the performance gains are not as large as expected, experiment results confirm that adaptive subcarrier allocation schemes based on delayed channel feedback or long term statistics outperform the interleave subcarrier allocation scheme.

가변 영역 색상을 이용한 내용기반 영상검색 (Content-based Image Retrieval using Variable Region Color)

  • 김동우;송영준;권동진;안재형
    • 한국산학기술학회논문지
    • /
    • 제6권5호
    • /
    • pp.367-372
    • /
    • 2005
  • 본 논문은 가변 영역을 이용한 내용기반 영상 검색 방법을 제안한다. 내용기반 검색에서 색상을 이용하는 경우 대부분 컬러 히스토그램을 사용한다. 그러나 기존 컬러 히스토그램 검색 방법들은 양자화 오류 등의 이유로 정확성이 떨어지고, 공간정보가 부족한 단점이 있다. 이를 극복하기 위해 제안 방법은 색상 정보를 HSV 공간으로 변환하여 순수 색상 정보인 hue 성분만을 양자화하여 히스토그램을 구한다. 한편 공간정보가 부족한 문제점을 해결하기 위해 색상 특징과 영역간의 상관관계를 고려하여 객체 영역을 선정한다. 선정된 객체 영역에서는 영역 크기를 유지한다. 그러나 비객체 영역은 한 개의 영역으로 통합된다. 가변적인 영역이 선정된 후 색상 특징을 이용해 검색한다. 실험 결과 제안방법이 정확율(precision) 평균으로 10$\%$ 향상되었다.

  • PDF

중계기를 사용하는 다중 사용자 OFDMA 시스템을 위한 효율적인 인지 협력 통신 기법 (Efficient Cognitive and Cooperative Communication Scheme for Multiuser OFDMA Systems using Relays)

  • 강민규;상영진;고병훈;김광순
    • 한국통신학회논문지
    • /
    • 제34권3A호
    • /
    • pp.235-243
    • /
    • 2009
  • 본 논문에서는 무선 중계기를 사용하는 다중 사용자 OFDMA 시스템에서 주파수 효율성을 향상시키기 위한 효율적인 인지 협력 통신 기법을 고려하였다. 먼저 인지 기술을 통한 효율적인 주파수 재사용으로 하향 링크의 처리율 (throughput)을 높일 수 있는 프레임 구조를 제안하였다. 그리고 주파수 재사용시 중계기로부터의 간섭 제거를 위한 선부호화 (preceding) 기법으로서 비교적 낮은 복잡도로 구현하기 쉬운 THP (Tomlinson-Harashima preceding)가 사용될 때, 각 사용자들이 궤환하는 양자화된 채널값의 오류에 따른 링크의 유효 신호대 잡음비를 수학적으로 유도하여, 이를 바탕으로 기지국이 효과적으로 적응 전송률 제어 (adaptive rate control)를 수행할 수 있도록 하였다. 시스템 레벨 모의실험을 통하여 본 논문에서 제안하는 인지 협력 통신 기법이 수행될 경우 추가적으로 발생하는 궤환량을 함께 고려한 전체적인 시스템의 주파수 효율성이 향상됨을 보였다.

SHADOW EXTRACTION FROM ASTER IMAGE USING MIXED PIXEL ANALYSIS

  • Kikuchi, Yuki;Takeshi, Miyata;Masataka, Takagi
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.727-731
    • /
    • 2003
  • ASTER image has some advantages for classification such as 15 spectral bands and 15m ${\sim}$ 90m spatial resolution. However, in the classification using general remote sensing image, shadow areas are often classified into water area. It is very difficult to divide shadow and water. Because reflectance characteristics of water is similar to characteristics of shadow. Many land cover items are consisted in one pixel which is 15m spatial resolution. Nowadays, very high resolution satellite image (IKONOS, Quick Bird) and Digital Surface Model (DSM) by air borne laser scanner can also be used. In this study, mixed pixel analysis of ASTER image has carried out using IKONOS image and DSM. For mixed pixel analysis, high accurated geometric correction was required. Image matching method was applied for generating GCP datasets. IKONOS image was rectified by affine transform. After that, one pixel in ASTER image should be compared with corresponded 15×15 pixel in IKONOS image. Then, training dataset were generated for mixed pixel analysis using visual interpretation of IKONOS image. Finally, classification will be carried out based on Linear Mixture Model. Shadow extraction might be succeeded by the classification. The extracted shadow area was validated using shadow image which generated from 1m${\sim}$2m spatial resolution DSM. The result showed 17.2% error was occurred in mixed pixel. It might be limitation of ASTER image for shadow extraction because of 8bit quantization data.

  • PDF

쇼핑몰 이미지 저작권보호를 위한 영상 워터마킹 (Image Watermarking for Copyright Protection of Images on Shopping Mall)

  • 배경율
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.147-157
    • /
    • 2013
  • 디지털 환경의 도래와 언제 어디서나 접근할 수 있는 고속 네트워크의 도입으로 디지털 콘텐츠의 자유로운 유통과 이용이 가능해졌다. 이러한 환경은 역설적으로 다양한 저작권 침해를 불러 일으키고 있으며, 온라인 쇼핑몰에서 사용하는 상품 이미지의 도용이 빈번하게 발생하고 있다. 인터넷 쇼핑몰에 올라오는 상품 이미지와 관련해서는 저작물성에 대한 시비가 많이 일어나고 있다. 2001년 대법원 판결에 의하면 햄 광고를 위하여 촬영한 사진은 단순히 제품의 모습을 전달하는 사물의 복제에 불과할 뿐 창작적인 표현이 아니라고 적시하였다. 다만 촬영자의 손해액에 대해서는 인정함으로써 광고사진 촬영에 소요되는 통상적인 비용을 손해액으로 산정하게 하였다. 상품 사진 이외의 실내사진이라 하여도 '한정된 공간에서 촬영되어 누가 찍어도 동일한 사진'이 나올 수 밖에 없는 경우에는 창작성을 인정하지 않고 있다. 2003년 서울지방법원의 판례는 쇼핑몰에 사용된 사진에서 피사체의 선정, 구도의 설정, 빛의 방향과 양의 조절, 카메라 각도의 설정, 셔터의 속도, 셔터찬스의 포착 기타 촬영방법, 현상 및 인화 등의 과정에서 촬영자의 개성과 창조성이 인정되면 저작권법에 의하여 보호되는 저작물에 해당한다고 선고하여 손해를 인정하였다. 결국 쇼핑몰 이미지도 저작권법상의 보호를 받기 위해서는 단순한 제품의 상태를 전달하는 것이 아니라 촬영자의 개성과 창조성이 인정될 수 있는 노력이 필요하다는 것이며, 이에 따라 쇼핑몰 이미지를 제작하는 비용이 상승하고 저작권보호의 필요성은 더욱 높아지게 되었다. 온라인 쇼핑몰의 상품 이미지는 풍경사진이나 인물사진과 같은 일반 영상과 달리 매우 독특한 구성을 갖고 있으며, 따라서 일반 영상을 위한 이미지 워터마킹 기술로는 워터마킹 기술의 요구사항을 만족시킬 수 없다. 쇼핑몰에서 주로 사용되는 상품 이미지들은 배경이 흰색이거나 검은색, 또는 계조(gradient)색상으로 이루어져 있어서 워터마크를 삽입할 수 있는 공간으로 활용이 어렵고, 약간의 변화에도 민감하게 느껴지는 영역이다. 본 연구에서는 쇼핑몰에 사용되는 이미지의 특성을 분석하고 이에 적합한 이미지 워터마킹 기술을 제안하였다. 제안된 이미지 워터마킹 기술은 상품 이미지를 작은 블록으로 분할하고, 해당 블록에 대해서 DCT 양자화 처리를 함으로써 워터마크 정보를 삽입할 수 있도록 하였다. 균일한 DCT 계수 양자화 값의 처리는 시각적으로 영상에 블록화 현상을 불러오기 때문에 제안한 알고리즘에서는 블록의 경계 면에 붙어있는 영상 값에 대해서는 양자화 값의 분배를 작게 하고, 경계 면에서 멀리 떨어져있는 영상 값에 대해서는 양자화 값의 분배를 크게 함으로써 영상의 객관적 품질뿐 아니라 시각적으로 느끼는 주관적 품질도 향상 시켰다. 제안한 알고리즘에 의해서 워터마크가 삽입된 쇼핑몰 이미지의 PSNR(Peak Signal to Noise Ratio)은 40.7~48.5[dB]로 매우 우수한 품질을 보였으며, 일반 쇼핑몰 이미지에서 많이 사용되는 JPEG 압축은 QF가 70 이상인 경우에는 BER이 0이 나왔다.

Landsat 7 TM/ETM+ 위성영상을 이용한 군산지역 지표 온도와 NDVI에 대한 상관분석 (A Correlation Analysis between Land Surface Temperature and NDVI in Kunsan City using Landsat 7 TM/ETM+ Satellite Images)

  • 이홍로;김형무
    • 한국지리정보학회지
    • /
    • 제8권2호
    • /
    • pp.31-43
    • /
    • 2005
  • 황해연안 전라북도 군산시 지역의 15년 동안의 4개 시점을 선택하여 육상도시 변화탐지를 목적으로 지표온도와 NDVI를 비교 관찰하고 NDVI최저대-지표온도최고대 상관관계를 분석하였다. 위성영상은 장기간에 걸친 광역지역의 연속모니터링에 효과적이므로 군산시를 촬영한 Landsat-5 TM과 Landsat-7 ETM+인공위성 영상을 분석대상으로 하였으며 에러보정을 위한 승인된 "gain", "bias" 또는 "offset"의 임계치를 대입하여 TM과 ETM+영상간의 오차를 정량화하고 분류하여 비교 검정하였다. 본 연구는 Landsat-5 TM과 Landsat-7 ETM+인공위성 영상을 전북 군산시 도시변화탐지에 적용하고 지표온도, 토지피복, 식생 변수를 검증하여 지표온도와 NDVI식생지수와의 R=(+)0.9478의 강한 양의 상관관계를 검출함으로써 제안한 위성영상을 이용한 NDVI최저대-지표온도최고대 상관분석모델이 육상 도시변화탐지에 매우 효과적임을 입증할 수 있다.

  • PDF

의류 검색용 회전 및 스케일 불변 이미지 분류 및 검색 기술 (Invariant Classification and Detection for Cloth Searching)

  • 황인성;조법근;전승우;최윤식
    • 방송공학회논문지
    • /
    • 제19권3호
    • /
    • pp.396-404
    • /
    • 2014
  • 의류 검색 분야는 의류의 비정형 특성으로 인해 매우 어려운 분야로 인식 오류 및 연산량을 줄이기 위한 노력이 많이 진행되어 왔으나 이를 위한 학습 및 인식 과정 전체에 대한 구체적인 사례가 없고 일부 관련 기술들은 아직 많은 한계를 보이고 있다. 이에 본 논문에서는 입력된 영상에서 사람 객체를 파악하여 착용한 의상으로부터 색상, 무늬, 질감 등 의상이 가질 수 있는 특성 정보를 분석하여, 이를 분류하고 검색하는 방법에 대한 전 과정을 구체적으로 보였다. 특히, 의류의 패턴 및 무늬 등을 구분하기 위한 비정형 의류 검색을 위한 LBPROT_35 디스크립터를 제안하였다. 이 제안 방식은 영상의 통계적 특징을 분석하는 기존의 LBP_ROT(Local Binary Pattern with ROTation-invariant) 방식에 추가로 원 영상에 크기 변화가 생겨도 검색해 낼 수 있도록 하는 특성이 추가된 것이며, 이를 통해 비정형 의류 검색 시 옷이 회전되어 있거나 스케일에 변화가 있어도 높은 검색율을 얻을 수 있게 되었다. 또한 색 공간을 11개의 구간으로 양자화 하는 방식을 이용하여 컬러 분류를 구현하여, 의류 검색에 있어서 중요한 컬러 유사성을 상실하지 않도록 하였다. 한편, 인터넷 상의 의류 사진들로부터 추출한 총 810장의 트레이닝 이미지로 데이터베이스를 구축하고 이들 중 36장을 질의영상으로 테스트 한 결과, 94.4%의 인식률을 보이는 등 Dense-SIFT 대비 높은 인식률을 보였다.