• 제목/요약/키워드: shape descriptor

검색결과 103건 처리시간 0.03초

Score Image Retrieval to Inaccurate OMR performance

  • Kim, Haekwang
    • 방송공학회논문지
    • /
    • 제26권7호
    • /
    • pp.838-843
    • /
    • 2021
  • This paper presents an algorithm for effective retrieval of score information to an input score image. The originality of the proposed algorithm is that it is designed to be robust to recognition errors by an OMR (Optical Music Recognition), while existing methods such as pitch histogram requires error induced OMR result be corrected before retrieval process. This approach helps people to retrieve score without training on music score for error correction. OMR takes a score image as input, recognizes musical symbols, and produces structural symbolic notation of the score as output, for example, in MusicXML format. Among the musical symbols on a score, it is observed that filled noteheads are rarely detected with errors with its simple black filled round shape for OMR processing. Barlines that separate measures also strong to OMR errors with its long uniform length vertical line characteristic. The proposed algorithm consists of a descriptor for a score and a similarity measure between a query score and a reference score. The descriptor is based on note-count, the number of filled noteheads in a measure. Each part of a score is represented by a sequence of note-count numbers. The descriptor is an n-gram sequence of the note-count sequence. Simulation results show that the proposed algorithm works successfully to a certain degree in score image-based retrieval for an erroneous OMR output.

저니키 모멘트 서술자를 이용한 M:N 면 객체 쌍의 형상 유사도 측정 (Shape similarity measure for M:N areal object pairs using the Zernike moment descriptor)

  • 허용;유기윤
    • 한국측량학회지
    • /
    • 제30권2호
    • /
    • pp.153-162
    • /
    • 2012
  • 본 연구는 저니키 모멘트 서술자를 이용하여 객체 쌍의 기수성에 영향을 받지 않고 M:N 면 객체 쌍의 형상 유사도를 측정할 수 있는 방법을 제안한다. 제안된 형상 유사도는 저니키 기저함수에 객체 집합의 공간적 분포 영역을 투영하여 얻어지는 모멘트를 이용하기 때문에 형상을 구성하는 객체들의 기수성에 영향을 받지 않는다. 또한 낮은 차수의 기저함수에 대응되는 모멘트는 전역적인 형상을 표현하고, 높은 차수의 기저함수에 대응되는 모멘트는 지역적인 형상을 표현하기 때문에 원형상과 유사한 수준으로 형상을 복원할 수 있는 차수까지의 모멘트를 이용함으로써 효과적으로 형상을 서술하고 비교하는 것이 가능하다. 제안된 방법은 서울시 지역의 도로명주소 지도와 차량용 항법 지도의 건물 객체를 대상으로 적용 및 평가하였다. 기존 중첩면적비를 이용한 유사도에 비하여 제안된 유사도는 기수성의 변화에 강건함을 확인할 수 있었다.

신집수형상디스크립터와 Nash 모형의 지체시간 사이의 상관성 분석 (The Correlation Analysis Between New Catchment Shape Descriptor and The Lag Time of Nash Model)

  • 김주철;정관수;김재한
    • 한국수자원학회논문집
    • /
    • 제37권12호
    • /
    • pp.1065-1074
    • /
    • 2004
  • 본 연구는 Moussa(2003)에 의하여 개발된 등가타원을 기반으로 한 신집수형상디스크립터에 대한 소개 및 수문학적 적용성 평가를 목적으로 한다. 두 디스크립터 a+b, a+b+${\varepsilon}OM$과 지체시간 사이의 상관성 분석이 수행되었고 이를 Nash 모형 매개변수들의 대표치 산정에 적용하였다. 본 연구의 실용성을 조사하기 위하여 한강 수계의 평창강 유역, 금강 수계의 보청천 유역 그리고 낙동강 수계의 위천 유역들에 각각 이 디스크립터특이 적용되었다. 그 결과, 두 디스크립터는 양자 모두 고전적 지형인자들에 비하여 지체시간과 높은 상관성을 보여 Moussa(2003)가 제시한 연구 결과를 국내 유역으로부터 확인할 수 있었고 실제 적용강의 간편성을 위하여 전자가 추천된다. 또한 본 연구로부터 유도된 대표순간단위도들은 일관성 있는 유역응답특성을 보여 신집수형상디스크립터의 수문학적 적용성을 확인 할 수 있었다. 앞으로 보다 많은 유역들에 대한 사례분석이 필요한 것으로 판단된다.

형상 특징자 기반 강인성 3D 모델 해싱 기법 (Robust 3D Model Hashing Scheme Based on Shape Feature Descriptor)

  • 이석환;권성근;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제14권6호
    • /
    • pp.742-751
    • /
    • 2011
  • 본 논문에서는 형상 특징자인 열 커널 인증 (Heat Kernel Signature, HKS)를 기반으로 강인한 3D 모델 해싱을 제안한다. 키와 매개변수에 의존한 형상 특징자 기반 3D 모델 해싱을 제안한다. 제안한 방법에서는 Mesh Laplace 연산자의 고유치와 고유벡터에 의하여 각 꼭지점에 대한 전역 및 국부 타임 HKS 계수를 구한 다음, 이 계수들을 정방형 2D 셀로 군집화한다. 그리고 각 셀에 할당된 HKS 계수 쌍의 거리 가중치 기반으로 정의된 특징계수와 랜덤 계수 키와의 조합에 의하여 중간 해쉬 계수를 생성한 다음, 이진화 과정에 의하여 최종 이진 해쉬를 생성한다. 본 실험에서는 3D 범용 툴을 이용한 다양한 기하하적 공격과 위상학적 공격을 통하여 강인성을 평가하였고, 모델과 키 조합에 대한 해쉬의 유일성을 평가하였다. 또한 인증 범위를 만족히는 공격 세기를 측정함으로써 모델 공간성을 평가하였다. 실험결과로부터 제안한 3D 모델 해싱이 기존 해싱에 비하여 강인성 모델 공간성 및 유일성이 우수함을 확인하였다.

단면 형상 영상을 이용한 3차원 모델 검색 (3D Model Retrieval Using Sliced Shape Image)

  • 박유신;서융호;윤용인;권준식;최종수
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.27-37
    • /
    • 2008
  • 멀티미디어 기술과 콘텐츠의 발달로 3차원 데이터의 사용 범위가 넓어지고, 이를 보다 효율적으로 관리하고 검색하기 위한 시스템이 필요하다. 본 논문은 효율적인 3차원 모델의 형상 기반 검색을 하기위해 모델의 특징을 추출하는 단면 형상 영상 방법을 제안한다. 3차원 모델의 특징 기술자는 모델에 대한 위치, 회전, 크기에 불변해야 하므로 모델을 정규화 시키는 작업이 필요하다. 본 논문에서는 주성분 분석 방법을 이용하여 정규화하였다. 제안한 알고리즘은 주성분 분석을 통해 각 축의 방향 성분을 찾고, 각 축에 직교하는 n 개의 평면을 생성한다. 이 평면은 각 축의 방향과 직교 성분을 갖으며 단면 형상 영상을 구하는데 사용된다. 단면 형상 영상은 3차원 모델과 각 평면이 교차해서 생기는 2차원 평면 영상이다. 제안한 3차원 모델의 특징 기술자는 단면 형상 영상의 중심점과 2차원 형상(shape)을 이루는 직선까지의 유클리디안 거리(distance)값들의 분포도이다. 검색 성능 평가는 MPEG-7에서 제시한 표준 평가 방법인 표준화된 수정 검색 순위의 평균(ANMRR)을 이용하였고 제안한 방법의 우수성을 실험 결과를 통해 입증하였다.

로봇 사진사를 위한 오메가 형상 추적기와 얼굴 검출기 융합을 이용한 강인한 머리 추적 (Robust Head Tracking using a Hybrid of Omega Shape Tracker and Face Detector for Robot Photographer)

  • 김지성;정지훈;안광호;유연걸;이원형;정명진
    • 로봇학회논문지
    • /
    • 제5권2호
    • /
    • pp.152-159
    • /
    • 2010
  • Finding a head of a person in a scene is very important for taking a well composed picture by a robot photographer because it depends on the position of the head. So in this paper, we propose a robust head tracking algorithm using a hybrid of an omega shape tracker and local binary pattern (LBP) AdaBoost face detector for the robot photographer to take a fine picture automatically. Face detection algorithms have good performance in terms of finding frontal faces, but it is not the same for rotated faces. In addition, when the face is occluded by a hat or hands, it has a hard time finding the face. In order to solve this problem, the omega shape tracker based on active shape model (ASM) is presented. The omega shape tracker is robust to occlusion and illuminationchange. However, whenthe environment is dynamic,such as when people move fast and when there is a complex background, its performance is unsatisfactory. Therefore, a method combining the face detection algorithm and the omega shape tracker by probabilistic method using histograms of oriented gradient (HOG) descriptor is proposed in this paper, in order to robustly find human head. A robot photographer was also implemented to abide by the 'rule of thirds' and to take photos when people smile.

칼라와 에지 히스토그램 기술자를 이용한 영상 마이닝 향상 기법 (The Usage of Color & Edge Histogram Descriptors for Image Mining)

  • 안성옥;박동원
    • 컴퓨터교육학회논문지
    • /
    • 제7권5호
    • /
    • pp.111-120
    • /
    • 2004
  • 영상의 칼라, 텍스쳐, 오브젝트의 형체 등과 같은 하위 수준의 특징을 표현할 수 있는 기술자를 MPEG-7 표준에서 규정하고 있다. 하지만, 각각의 기술자를 따로 분석함으로써는 성능 향상에 불충분한 점이 있었다. 본 논문에서는 칼라 기술자와 텍스쳐 기술자를 결합하여 영상검색의 성능을 향상시키는 방법을 제안한다. MPEG-7 표준에서 정의한 $l_{1}$-norm방법보다, 본 논문에서는 칼라 히스토그램의 경우 코사인 근사도 계수를, 에지 히스토그램의 경우 유클리디언 디스턴스를 적용 실험하여 진일보한 결과를 도출할 수 있었다.

  • PDF

MPEG-7 질감 기술자 (MPEG-7 Texture Descriptor)

  • 강호경;정용주;유기원;노용만;김문철;김진웅
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.10-22
    • /
    • 2000
  • 본 논문에서는 MPEG-7 표준 비쥬얼 분야 기술자에게 영상의 질감 정보의 표현 방법에 대해 다룬다. 질감 기술자는 멀티미디어 컨텐츠 표현에 대한 국제 표준에서 칼라, 윤곽, 객체나 카메라 움직임 등과 함께 중요한 비쥬얼 특징으로 다루어지고 있으며 표준화의 대상이 되고 있다. 본 논문에서는 현재 MPEG-7 표준안으로 잠정 채택된 휴먼 비쥬얼 시스템(Human Visual System, HVS)에 기반한 질감 기술자에 대하여 논한다. 이 방법은 라돈(Radon) 변환을 통하여 영상을 시각인지 특성에 맞게 변환하고, 뇌의 비쥬얼 피질(Visual Cortex)의 반응과 일치하게 다수개의 주파수 채널들로 질감을 분해한다. 그리고 각 채널들에서의 평균 에너지와 에너지의 편차가 영상의 질감 기술자로 추출한다. 본 논문에서 질감 영상 검색에 있어서 현재 MPEG-7 실험 데이터베이스인 T1∼T7에서 검색 율을 측정하였다. 실험결과 본 영상 질감 기술자 표현 방법은 모든 실험 데이터베이스에서 우수한 검색 성능과 빠른 특징 추출 능력을 보였다.

  • PDF

내용 기반 이미지 검색에서 효율적인 색상-모양 표현을 위한 복소 색상 모델 (Complex Color Model for Efficient Representation of Color-Shape in Content-based Image Retrieval)

  • 최민석
    • 디지털융복합연구
    • /
    • 제15권4호
    • /
    • pp.267-273
    • /
    • 2017
  • 각종 디지털 기기와 통신 기술의 발전으로 다양한 멀티미디어 콘텐츠의 생산과 유통이 폭발적으로 증가하고 있다. 이미지와 동영상 등의 멀티미디어 데이터의 검색을 위해서는 기존의 문자 위주의 검색과는 다른 접근 방식이 필요하다. 이미지의 여러 가지 물리적인 특징들을 정량화 하여 분석하고 이를 비교하여 유사한 이미지를 검색하는 내용기반 이미지 검색에서 색상과 모양은 주요 물리적 특징들이다. 지금까지는 색상과 모양을 서로 독립적인 특징으로 분리하여 이용하였지만, 인지적 관점에서 두 특징은 밀접한 관련이 있다. 본 논문에서는 색상과 모양 특징을 동시에 표현하기 위하여 3차원 색상 정보를 2차원 복소수 형식으로 표현하는 복소 색상 모델을 이용하여 색상의 공간적 분포 모양을 기술하는 방법을 제안한다. 복소 이미지를 주파수 변환한 후 저주파 영역의 소수의 계수만으로 복원하는 실험을 통하여 제안된 방법이 색상의 공간적 분포 모양을 효율적으로 표현할 수 있음을 보였다.

퓨리에 기술자 분석을 이용한 단일 흙 입자의 형상 분석 (Soil Particle Shape Analysis Using Fourier Descriptor Analysis)

  • 구본휘;김태식
    • 한국지반환경공학회 논문집
    • /
    • 제17권3호
    • /
    • pp.21-26
    • /
    • 2016
  • 주문진 표준사와 사우디 아라비아의 Ras Al Khair 사질토 입자의 형상에 대한 분석을 실시하였다. 광학현미경을 사용하여 200배 확대하여 해상도 $640{\times}320$으로 디지털 이미지를 촬영하였다. 사질토 입자의 디지털 이미지를 영상 처리를 통해 입자 경계면의 좌표를 추출하였다. 추출한 입자의 경계면 좌표를 복소 평면에 도시하고, 극형식으로 변환 후 퓨리에 변환을 실시하였다. 퓨리에 변환을 통해 추출된 각각의 계수 값들은 입자 형상의 특징을 반영하며, 좌표의 기준점 이동에 대해 불변하는 값으로 사질토 입자의 이미지에 대해 좌표의 기준점과 회전등에 관계없이 항상 같은 값을 갖게 되어 입자의 형상 분석에 적합하다. 각각의 계수 값을 입자의 등가 반경으로 정규화하여 퓨리에 기술자를 추출하여 입자의 형상을 정량적으로 분석하였다. -3에서 +3의 범위에 해당되는 주요 퓨리에 기술자들을 분석한 결과 주문진 표준사 입자의 경우 신장(elongation)이 가장 두드러진 형상의 특징이었으며 그다음으로는 비대칭성(asymmetry)이 두드러진 특징이었다. Ras Al Khair 사질토의 형상도 주문진 표준사와 같은 형상 특징을 나타냈다. 또한 퓨리에 기술자 분석 결과 작은 구조가 전체 구조와 비슷한 형태로 되풀이되는 프랙탈의 미세구조 특성이 나타나는 것으로 판단되었다. 해상도 $640{\times}320$과 해상도 $160{\times}80$의 주문진 표준사의 디지털 이미지를 비교한 결과 -3에서 +3에 해당되는 주요 퓨리에 기술자에 대해서는 해상도가 크게 영향을 미치지 않는 것으로 나타났으나 텍스쳐 분석에는 영향을 미치는 것으로 나타났다.