• 제목/요약/키워드: Descriptor system

검색결과 217건 처리시간 0.031초

MPEG-7 오디오 하위 서술자를 이용한 음악 검색 방법에 관한 연구 (A Study on the Music Retrieval System using MPEG-7 Audio Low-Level Descriptors)

  • 박만수;박철의;김회린;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.215-218
    • /
    • 2003
  • 본 논문에서는 MPEG-7에 정의된 오디오 서술자를 이용한 오디오 특징을 기반으로 한 음악 검색 알고리즘을 제안한다. 특히 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 Query by humming에 이용 될 수 있다. 이러한 연구를 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다 본 논문에서는 방송 시스템에 적용 할 수 있도록 검색 범위를 특정 컨텐츠의 O.S.T 앨범으로 제한하였다. 즉, 사용자가 임의로 선택한 부분적인 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징벡터를 구성하기 위한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능 평가를 수행한 결과 timbral spectral feature들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 Euclidean distance 방식보다 우수한 성능을 보였다.

  • PDF

Face Spoofing Attack Detection Using Spatial Frequency and Gradient-Based Descriptor

  • Ali, Zahid;Park, Unsang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.892-911
    • /
    • 2019
  • Biometric recognition systems have been widely used for information security. Among the most popular biometric traits, there are fingerprint and face due to their high recognition accuracies. However, the security system that uses face recognition as the login method are vulnerable to face-spoofing attacks, from using printed photo or video of the valid user. In this study, we propose a fast and robust method to detect face-spoofing attacks based on the analysis of spatial frequency differences between the real and fake videos. We found that the effect of a spoofing attack stands out more prominently in certain regions of the 2D Fourier spectra and, therefore, it is adequate to use the information about those regions to classify the input video or image as real or fake. We adopt a divide-conquer-aggregate approach, where we first divide the frequency domain image into local blocks, classify each local block independently, and then aggregate all the classification results by the weighted-sum approach. The effectiveness of the methodology is demonstrated using two different publicly available databases, namely: 1) Replay Attack Database and 2) CASIA-Face Anti-Spoofing Database. Experimental results show that the proposed method provides state-of-the-art performance by processing fewer frames of each video.

Improved Feature Selection Techniques for Image Retrieval based on Metaheuristic Optimization

  • Johari, Punit Kumar;Gupta, Rajendra Kumar
    • International Journal of Computer Science & Network Security
    • /
    • 제21권1호
    • /
    • pp.40-48
    • /
    • 2021
  • Content-Based Image Retrieval (CBIR) system plays a vital role to retrieve the relevant images as per the user perception from the huge database is a challenging task. Images are represented is to employ a combination of low-level features as per their visual content to form a feature vector. To reduce the search time of a large database while retrieving images, a novel image retrieval technique based on feature dimensionality reduction is being proposed with the exploit of metaheuristic optimization techniques based on Genetic Algorithm (GA), Extended Binary Cuckoo Search (EBCS) and Whale Optimization Algorithm (WOA). Each image in the database is indexed using a feature vector comprising of fuzzified based color histogram descriptor for color and Median binary pattern were derived in the color space from HSI for texture feature variants respectively. Finally, results are being compared in terms of Precision, Recall, F-measure, Accuracy, and error rate with benchmark classification algorithms (Linear discriminant analysis, CatBoost, Extra Trees, Random Forest, Naive Bayes, light gradient boosting, Extreme gradient boosting, k-NN, and Ridge) to validate the efficiency of the proposed approach. Finally, a ranking of the techniques using TOPSIS has been considered choosing the best feature selection technique based on different model parameters.

빅데이터의 효과적인 처리 및 활용을 위한 클라이언트-서버 모델 설계 (Design of Client-Server Model For Effective Processing and Utilization of Bigdata)

  • 박대서;김화종
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.109-122
    • /
    • 2016
  • 최근 빅데이터 분석은 기업과 전문가뿐만 아니라 개인이나 비전문가들도 큰 관심을 갖는 분야로 발전하였다. 그에 따라 현재 공개된 데이터 또는 직접 수집한 이터를 분석하여 마케팅, 사회적 문제 해결 등에 활용되고 있다. 국내에서도 다양한 기업들과 개인이 빅데이터 분석에 도전하고 있지만 빅데이터 공개의 제한과 수집의 어려움으로 분석 초기 단계에서부터 어려움을 겪고 있다. 본 논문에서는 빅데이터 공유를 방해하는 개인정보, 빅트래픽 등의 요소들에 대한 기존 연구와 사례들을 살펴보고 정책기반의 해결책이 아닌 시스템을 통해서 빅데이터 공유 제한 문제를 해결 할 수 있는 클라이언트-서버 모델을 이용해 빅데이터를 공개 및 사용 할 때 발생하는 문제점들을 해소하고 공유와 분석 활성화를 도울 수 있는 방안에 대해 기술한다. 클라이언트-서버 모델은 SPARK를 활용해 빠른 분석과 사용자 요청을 처리하며 Server Agent와 Client Agent로 구분해 데이터 제공자가 데이터를 공개할 때 서버 측의 프로세스와 데이터 사용자가 데이터를 사용하기 위한 클라이언트 측의 프로세스로 구분하여 설명한다. 특히, 빅데이터 공유, 분산 빅데이터 처리, 빅트래픽 문제에 초점을 맞추어 클라이언트-서버 모델의 세부 모듈을 구성하고 각 모듈의 설계 방법에 대해 제시하고자 한다. 클라이언트-서버 모델을 통해서 빅데이터 공유문제를 해결하고 자유로운 공유 환경을 구성하여 안전하게 빅데이터를 공개하고 쉽게 빅데이터를 찾는 이상적인 공유 서비스를 제공할 수 있다.

개선된 챔퍼매칭 우도기반 2차원 평면 객체 추적 (2D Planar Object Tracking using Improved Chamfer Matching Likelihood)

  • 오치민;정문호;유범재;이칠우
    • 정보처리학회논문지B
    • /
    • 제17B권1호
    • /
    • pp.37-46
    • /
    • 2010
  • 본 논문에서는 개선된 챔퍼매칭(Chamfer Matching)으로 2차원 평면 객체 모델을 추적하는 방법을 제시한다. 기존 챔퍼매칭은 배경이 복잡할 경우 객체와 영상간의 유사도를 계산하기 어려운 단점이 있다. 따라서 본 논문에서는 챔퍼매칭을 에지와 코너특징을 사용해 복잡한 배경에서도 유사도를 계산할 수 있도록 개선한다. 개선된 챔퍼매칭은 기하(Geometric) 모델을 추적하는 파티클 필터(Particle Filter)의 우도함수로 사용된다. 기하모델은 2차원 평면 객체를 에지 및 코너 특징점과 포즈로 모델링하며, 색상 변화에 안정적인 객체서술자이다. 파티클 필터는 칼만필터 보다 더 비선형적인 추적 방법이다. 따라서 제안된 방법은 복잡한 환경에서 객체를 추적하기 위해 기하모델 및 파티클 필터, 개선된 챔퍼 매칭을 사용한다. 실험 결과에서는 제안 방법의 강건함을 기존 방법의 비교를 통해 나타낸다.

차별적인 영상특징들에 적응 가능한 융합구조에 의한 도로상의 물체추적 (Traffic Object Tracking Based on an Adaptive Fusion Framework for Discriminative Attributes)

  • 김삼용;오세영
    • 전자공학회논문지SC
    • /
    • 제43권5호
    • /
    • pp.1-9
    • /
    • 2006
  • 대부분의 영상을 이용한 물체추적은 적용환경을 단순화하거나 특정한 영상특징만을 적용할 수 있는 제한된 환경에서 잘 동작하기 때문에 이러한 물체추적방법은 지능자동차의 운전자보조시스템이 적용되는 복잡하고 동적인 교통 환경에서 원하는 물체를 추적하기는 어렵다. 이와 같은 물체간의 부분적인 교합이 존재하고 배경과 물체들이 동시에 동적으로 변하는 복잡한 환경에서는 물체의 색상, 외관, 외형 등과 같은 다양한 영상특징들을 적절하게 융합할 수 있는 구조가 요구된다. 본 논문에서는 기존의 파티클 필터를 이용한 적응형 융합구조[1]와 SIFT[2]를 이용한 영상특징 기술자를 강인한 영상특징으로 사용하고 시점 배경의 동적인 변화에 적응할 수 있도록 학습함으로써 추적의 강건성과 적응성을 향상시킨다. 제안된 알고리듬은 운전자 보조 시스템에서의 차량, 보행자, 자전거와 같은 도로상의 물체추적에 적용하였다.

옷감의 질감 명명 체계 확립을 위한 질감 속성자 분류 -여성 슈트용 추동복지의 질감 속성을 중심으로- (Classification of Textural Descriptors for Establishing Texture Naming System(TNS) of Fabrics -Textural Descriptions of Women's Suits Fabrics for Fall/winter Seasons-)

  • 한은경;김은애
    • 한국의류학회지
    • /
    • 제30권5호
    • /
    • pp.699-710
    • /
    • 2006
  • The objective of this study was to identify the texture-related components of woven fabrics and to develop a multidimensional perceptual structure map to represent the tactile textures. Eighty subjects in clothing and tektite industries were selected for multivariate data on each fabric of 30 using the questionnaire with 9 pointed semantic differential scales of 20 texture-related adjectives. Data were analyzed by factor analysis, hierarchical cluster analysis, and multidimensional scaling(MDS) using SPSS statistical package. The results showed that the five factors were selected and composed of density/warmth-coolness, stiffness, extensibility, drapeability, and surface/slipperiness. As a result of hierarchical cluster analysis, 30 fabrics were grouped by four clusters; each cluster was named with density/warmth-coolness, surface/slipperiness, stiffness, and extensibility, respectively. By MDS, three dimensions of tactile texture were obtained and a 3-dimensional perceptual structure map was suggested. The three dimensions were named as surface/slipperiness, extensibility, and stiffness. We proposed a positioning perceptual map of fabrics related to texture naming system(TNS). To classify the textural features of the woven fabrics, hierarchical cluster analysis containing all the data variations, even though it includes the errors, may be more desirable than texture-related multidimensional data analysis based on factor loading values in respect of the effective variables reduction without losing the critical variations.

멀티채널 오디오 서비스를 위한 지상파 DMB 미디어처리기 설계 (The Design of Terrestrial DMB Media Processor for Multi-Channel Audio Services)

  • 강경옥;홍재근;서정일
    • 한국음향학회지
    • /
    • 제24권4호
    • /
    • pp.186-193
    • /
    • 2005
  • 지상파 디지털멀티미디어방송 (Terrestrial Digital Multimedia Broadcasting, T-DMB)은 7인치 화면에서 VCD급의 고화질 비디오와 CD급의 고품질 오디오를 이동수신 환경에서 제공하는 기술로서, 2005년도 중반부터 상용 서비스가 시작될 예정이다. 그러나, T-DMB 규격에서는 가용 대역폭의 제한으로 인하여 오디오 신호를 위한 대역폭이 128kbps로 제한되어 있으며, 모노와 스테레오 채널 서비스만이 가능하도록 하고 있다. 본 논문은 기존의 T-DMB 수신기과 역호환성 (Backward Compatibility)을 유지하면서 멀티채널 오디오 콘텐츠를 제공할 수 있는 미디어처리기와 재생기 구조를 제안한다. 또한, T-DMB수신기의 다양한 스피커 환경에서도 최적의 오디오 콘텐츠를 제공할 수 있도록, 멀티채널 오디오 콘텐츠를 재생환경에 맞게 적응시킬 수 있는 수신기 구조를 제안한다. 기존의 T-DMB 수신기와 호환성을 유지하면서 멀티채널 오디오 콘텐츠를 제공하기 위하여 멀티채널 오디오를 위한 부가데이터를 메인 오디오 스트림의 종속 스트림으로 정의하였으며, 기존 T-DMB 시스템의 BIFS (Binary Format for Scene)를 수정하지 않고 부가되는 오디오 객체를 제어할 수 있는 OD (Object Descriptor) 구조를 제안한다.

인공위성 영상의 객체인식을 위한 영상 특징 분석 (Feature-based Image Analysis for Object Recognition on Satellite Photograph)

  • 이석준;정순기
    • 한국HCI학회논문지
    • /
    • 제2권2호
    • /
    • pp.35-43
    • /
    • 2007
  • 본 논문은 특징검출(feature detection)과 특징해석(feature description) 기법을 이용하여, 영상 매칭 (matching)과 인식(recognition)에 필요한 다양한 파라미터의 변화에 따른 인식률의 차이를 분석하기 위한 실험 내용을 다룬다. 본 논문에서는 영상의 특징분석과 매칭프로세스를 위해, Lowe의 SIFT(Scale-Invariant Transform Feature)를 이용하며, 영상에서 나타나는 특징을 검출하고 해석하여 특징 데이터베이스로 구축한다. 특징 데이터베이스는 구글 어스를 통해 획득한 위성영상으로부터 50여개 건물에 대해 구축되는데, 이는 각 건물 영상으로부터 추출된 특징 점들의 좌표와 128차원의 벡터의 값으로 이루어진 특징 해석데이터로 저장된다. 구축된 데이터베이스는 각 건물에 대한 정보가 태그의 형식으로 함께 저장되는데, 이는 카메라로부터 획득한 입력영상과의 비교를 통해 입력영상이 가리키는 지역 내에 존재하는 건물에 대한 정보를 제공하는 역할을 한다. 실험은 영상 매칭과 인식과정에서 작용하는 내-외부적 요소들을 제시하고, 각 요소의 상태변화에 따라 인식률의 차이를 비교하는 방법으로 진행되었으며, 본 연구의 최종적인 시스템은 모바일기기의 카메라를 이용하여 카메라가 촬영하고 있는 지도상의 객체를 인식하고, 해당 객체에 대한 기본적인 정보를 제공할 수 있다.

  • PDF

비-파라미터 기반의 움직임 분류를 통한 비디오 검색 기법 (Video retrieval method using non-parametric based motion classification)

  • 김낙우;최종수
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.1-11
    • /
    • 2006
  • 본 논문에서는 샷(shot) 기반 비디오 색인 구조에서 비-파라미터(non-parametric) 기반의 움직임 분류를 통한 비디오 영상 검색 기법을 제안한다. 본 논문에서 제안하는 비디오 검색 시스템은 장면 전환 기법을 통해 얻은 샷 단위의 짧은 비디오로부터 대표 프레임과 움직임 정보를 취득한 후, 이를 통해 시각적 특징과 움직임 특징을 추출하여 유사도를 비교함으로써 시-공간적 특징을 이용한 실시간 검색이 가능하도록 구현되었다. 비-파라미터 기반의 움직임 특징의 추출은 MPEG 압축 스트림으로부터 정규화된 움직임 벡터계(界)를 추출한 후, 각각의 정규화된 움직임 벡터를 여러 개의 각도 빈(bin)으로 양자화하고 이의 평균과 분산, 방향 등을 고려함으로써 효과적으로 이루어진다. 대표 프레임에서의 시각 특징 검출을 위해서는 에지 기반의 공간 기술자를 이용하였다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 시스템이 매우 효과적임을 잘 나타내고 있다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용한다.