• 제목/요약/키워드: Image decomposition

검색결과 368건 처리시간 0.022초

다양한 형식의 얼굴정보와 준원근 카메라 모델해석을 이용한 얼굴 특징점 및 움직임 복원 (Facial Features and Motion Recovery using multi-modal information and Paraperspective Camera Model)

  • 김상훈
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.563-570
    • /
    • 2002
  • 본 논문은 MPEG4 SNHC의 얼굴 모델 인코딩을 구현하기 위하여 연속된 2차원 영상으로부터 얼굴영역을 검출하고, 얼굴의 특징데이터들을 추출한 후, 얼굴의 3차원 모양 및 움직임 정보를 복원하는 알고리즘과 결과를 제시한다. 얼굴 영역 검출을 위해서 영상의 거리, 피부색상, 움직임 색상정보등을 융합시킨 멀티모달합성의 방법이 사용되었다. 결정된 얼굴영역에서는 MPEG4의 FDP(Face Definition Parameter) 에서 제시된 특징점 위치중 23개의 주요 얼굴 특징점을 추출하며 추출성능을 향상시키기 위하여 GSCD(Generalized Skin Color Distribution), BWCD(Black and White Color Distribution)등의 움직임색상 변환기법과 형태연산 방법이 제시되었다. 추출된 2차원 얼팔 특징점들로부터 얼굴의 3차원 모양, 움직임 정보를 복원하기 위하여 준원근 카메라 모델을 적용하여 SVD(Singular Value Decomposition)에 의한 인수분해연산을 수행하였다. 본 논문에서 제시된 방법들의 성능을 객관적으로 평가하기 위하여 크기와 위치가 알려진 3차원 물체에 대해 실험을 행하였으며, 복원된 얼굴의 움직임 정보는 MPEG4 FAP(Face Animation Parameter)로 변환된 후, 인터넷상에서 확인이 가능한 가상얼굴모델에 인코딩되어 실제 얼굴파 일치하는 모습을 확인하였다.

JPEG2000에서 ROI 코딩 품질에 영향을 미치는 요소의 성능 평가 (A Performance Evaluation of Factors Influencing the ROI Coding Quality in JPEG2000)

  • 강기준;김현주;이점숙
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권4호
    • /
    • pp.197-206
    • /
    • 2006
  • 정지 영상 압축 표준인 JPEG2000의 가장 큰 특징 중의 하나는 관심영역(ROI) 코딩이다. JPEG2000은 다양한 ROI 기법과 ROI 파리미터를 제공하는데, 이것을 특정 응용 프로그램에 적용하기 위해서는 적절한 값을 선택해야 한다. 본 논문에서는 JPEG2000 성능에 영향을 미치는 ROI 코딩 기법과 ROI 파라미터가 ROI 품질과 전체 영상 품질에 어떤 영향을 미치는지를 평가한다. 평가에 사용된 ROI 기법은 Maxshift 방법과 Implicit 방법이며 평가된 파라미터는 타일 크기와 ROI 크기, 코드블록의 크기, DWT 분해 레벨의 수, ROI 중요도가 사용된다. 타일 크기가 크면 품질은 좋아지며, ROI가 크면 품질은 떨어지며, 코드블록은 Maxshit와 Implicit 모두에서 $32{\times}32$가 최고의 품질을 보이며, ROI 중요도가 커지면 품질은 떨어지고, 분해 레벨의 수가 증가할수록 품질은 떨어진다.

  • PDF

DWT에 의한 분자영상의 특징 추출 (Feature Extraction of Molecular Images by DWT)

  • 최규락;안병주;이상복
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권12호
    • /
    • pp.21-26
    • /
    • 2013
  • 본 논문에서는 분자영상의 궁극적 목표를 달성하기 위하여 분자영상의 특징 추출 기법을 제안하였다. 실험영상을 DWT 변환결과로 실험한 결과 1레벨과 2레벨의 분해 결과에서는 저주파 영역의 성분이 나타나지만 3레벨 분해 결과에서는 데이터 성분이 거의 나타나지 않음을 알 수 있었다. 육안으로 관찰은 되지 않지만 3레벨 분해한 결과의 데이터 값을 출력하였다. 데이터의 출력은 DWT에 의하여 나타나는 저주파영역의 수평방향과 수직방향의 데이터, 고주파영역의 수평방향의 데이터와 수직방향의 데이터, 대각고주파영역의 수평방향과 수직방향의 데이터를 출력하여 분자영상과 다른 디지털영상인 CT, MRI, PET영상의 데이터와 비교할 수 있게 하였다.

Adaptive V1-MT model for motion perception

  • Li, Shuai;Fan, Xiaoguang;Xu, Yuelei;Huang, Jinke
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권1호
    • /
    • pp.371-384
    • /
    • 2019
  • Motion perception has been tremendously improved in neuroscience and computer vision. The baseline motion perception model is mediated by the dorsal visual pathway involving the cortex areas the primary visual cortex (V1) and the middle temporal (V5 or MT) visual area. However, few works have been done on the extension of neural models to improve the efficacy and robustness of motion perception of real sequences. To overcome shortcomings in situations, such as varying illumination and large displacement, an adaptive V1-MT motion perception (Ad-V1MTMP) algorithm enriched to deal with real sequences is proposed and analyzed. First, the total variation semi-norm model based on Gabor functions (TV-Gabor) for structure-texture decomposition is performed to manage the illumination and color changes. And then, we study the impact of image local context, which is processed in extra-striate visual areas II (V2), on spatial motion integration by MT neurons, and propose a V1-V2 method to extract the image contrast information at a given location. Furthermore, we take feedback inputs from V2 into account during the polling stage. To use the algorithm on natural scenes, finally, multi-scale approach has been used to handle the frequency range, and adaptive pyramidal decomposition and decomposed spatio-temporal filters have been used to diminish computational cost. Theoretical analysis and experimental results suggest the new Ad-V1MTMP algorithm which mimics human primary motion pathway has universal, effective and robust performance.

유전알고리즘에 의한 다단 gain-shape 양자화기의 최적 코드북 설계 (An optimal codebook design for multistage gain-shape vector quantizer using genetic algorithms)

  • 김대진;안선하
    • 전자공학회논문지S
    • /
    • 제34S권1호
    • /
    • pp.80-93
    • /
    • 1997
  • This paper proposes a new technique of optimal codebook design in multistage gain-shape vector quantization (MS-GS VQ) for wireless image communication. An original image is divided into a smany blocks as possible in order to get strong robustness to channel transmission errors: the original image is decomposed into a number of subband images, each of which contains a sperate spatial frequency information and is obtained by the biorthogonal wavlet transform; each subband is separated into several consecutive VQ stages, where each stage has a residual information of the previous stage; one vector in each stage is divided into two components-gain and shape. But, this decomposition genrates too many blocks and it thus makes the determination of optimal codebooks difficult. We overcome this difficulty by evolving each block's codebook independently with different genetic algorithm that uses each stage's individual training vectors. Th eimpact of th eproposed VQ technique on the channel transmission errors is compared with that of other VQ techniques. Simulation results show that the proposed VQ technique (MS-GS VQ) with the optimal codebook designe dy genetic algorithms is very robust to channel transmission errors even under the bursty and high BER conditions.

  • PDF

임의의 영역 안에 텍스처 표현을 위한 Wavelet및 Gabor 텍스처 기술자와 성능평가 (Gabor and Wavelet Texture Descriptors in Representing Textures in Arbitrary Shaped Regions)

  • 심동규
    • 한국멀티미디어학회논문지
    • /
    • 제9권3호
    • /
    • pp.287-295
    • /
    • 2006
  • 본 논문은 임의의 영역 안에 존재하는 텍스처를 검색하기 위한 wavelet과 Gabor기반 텍스처 표현 기법을 제안하고 이들의 검색성능을 평가한다. 지금까지 Gator 평면에서의 평균과 표준편차 특징 기술자가 직사각형안의 텍스처를 표현하기에 가장 적합한 것으로 알려져 있다. 하지만 임의의 영역 안의 물체를 표현하는 기술이 실제 검색이나 여러 다른 텍스처 표현 응용 예에 더욱 필요한 실정이다. 본 연구에서는 wavelet과 Gabor 필터에 기반한 특징 추출법을 제안하고 이들을 실제 텍스처 데이터 베이스에 적용해 본 결과, wavelet기반 특징 기술자가 Gator기반 기술자에 비하여 더욱 효과적임을 발견하였다. 특히 wavelet평면에서 표준편차와 엔트로피 특징을 사용함으로써 가장 좋은 검색 성능을 냄을 알 수 있었다. 또한, 본 논문에서는 다양한 실제 텍스처 영상을 가지고 wavelet과 Gator에 기반한 다양한 특징벡터에 따른 검객 성능을 평가하였다.

  • PDF

조각보와 매듭을 활용한 전통 배자 디자인 개발 (Development of Traditional Baeja Design Applied Jogakbo and Knot)

  • 양숙향
    • 한국의상디자인학회지
    • /
    • 제16권4호
    • /
    • pp.189-203
    • /
    • 2014
  • In this study, Creative motifs using face composition of Jogakbo and Knot Symbol were developed, and applied to traditional Baeja of Joseon Dynasty to develop design contents of traditional clothes. As for study method, 7 motifs of new formative image that integrates traditional beauty and contemporary sense were developed by applying Knot Symbols and face compositions of Jogakbo with the use of Adobe Illustrator CS6 and Adobe Photoshop CS6 vector graphic software. The motifs were designed in contemporary image in face compositions like rectangle pattern, triangle pattern, dual rectangle pattern, vertical and horizontal pattern, pinwheel pattern, gojunmun pattern and free pattern by involving various changes like repetition, rotation, reduction, expansion and decomposition and using the colors used in the Jogakbo. It is desired that through this study, traditional Baeja may develop to bear traditional and contemporary image so that our traditional clothes design may become global. Also it is anticipated that this study will contribute to development of culture products of Hanbok like Jeogori, pants and skirt that require change of design in the global era while maintaining traditional beauty to appeal to the emotions of world citizens.

  • PDF

초저속 전송 네트웍을 위한 웨이브릿 변환을 이용한 비디오 코딩 (Video Coding Using Wavelet Decomposition for Very Low Bit - rate Networks)

  • 오황석;이흥규
    • 한국정보처리학회논문지
    • /
    • 제4권10호
    • /
    • pp.2629-2639
    • /
    • 1997
  • 최근 초저속 전송 매체용 비디오 코딩 기법에 대한 관심이 높아지고 있다. 그러나 기존의 블럭을 기반으로 하는 변환 코딩기법들은 비트율 제한으로 인해 블럭화 현상 등으로 화질 열화가 심하다. 본 논문에서는 초저속 전송 매체를 위하여 웨이브릿 변환과 다중해상도 움직임 추정 및 보상 기법을 이용하는 비디오 코딩 시스템을 제안한다. 제안된 시스템은 non-stationary 신호를 적응적으로 표현하며, 인간 시각 특성을 잘 반영하는 웨이브릿 변환을 사용한다. 웨이브릿 변환된 계수들은 움직임 추정 및 보상 후 예측 오차의 크기에 따라서 다양한 모드로 코딩된다. 이와 함께 일정한 화질을 유지하기 위하여 간단한 버퍼 제어 기법을 사용한다. 실험을 통하여 제안된 기법은 블럭화 현상이 줄어들며, 기존의 블럭을 기반으로 하는 변환 코딩 기법보다 복원 영상의 화질이 좋음을 보였다.

  • PDF

Vehicle Face Re-identification Based on Nonnegative Matrix Factorization with Time Difference Constraint

  • Ma, Na;Wen, Tingxin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권6호
    • /
    • pp.2098-2114
    • /
    • 2021
  • Light intensity variation is one of the key factors which affect the accuracy of vehicle face re-identification, so in order to improve the robustness of vehicle face features to light intensity variation, a Nonnegative Matrix Factorization model with the constraint of image acquisition time difference is proposed. First, the original features vectors of all pairs of positive samples which are used for training are placed in two original feature matrices respectively, where the same columns of the two matrices represent the same vehicle; Then, the new features obtained after decomposition are divided into stable and variable features proportionally, where the constraints of intra-class similarity and inter-class difference are imposed on the stable feature, and the constraint of image acquisition time difference is imposed on the variable feature; At last, vehicle face matching is achieved through calculating the cosine distance of stable features. Experimental results show that the average False Reject Rate and the average False Accept Rate of the proposed algorithm can be reduced to 0.14 and 0.11 respectively on five different datasets, and even sometimes under the large difference of light intensities, the vehicle face image can be still recognized accurately, which verifies that the extracted features have good robustness to light variation.

특이값 분해에 기반한 3차원 메쉬 동영상의 SNR 계층 부호화 (SNR Scalable Coding of 3-D Mesh Sequences Based on Singular Value Decomposition)

  • 허준희;김창수;이상욱
    • 방송공학회논문지
    • /
    • 제13권3호
    • /
    • pp.289-298
    • /
    • 2008
  • 본 논문은 특이값 분해에 기반하여 다양한 화질을 지원하는 3차원 메쉬 동영상의 SNR 계층 부호화 기법을 제안한다. SVD는 메쉬 동영상을 적은 수의 기저 벡터들과 특이값들로 표현하여 부호화 성능을 높일 수 있다. 본 논문에서는 비트 평면 부호화를 적용한 후 각 이진화 단계와 화질 사이의 관계를 정량적으로 유도한다. 유도된 관계식을 이용하여 비트량-왜곡 측면에서 최적화된 부호화 순서를 정의한다. 또한 시공간 영역의 잉여 정보를 효율적으로 제거하는 예측 기법을 제시한다. 모의 실험을 통하여 제안하는 알고리듬이 다양한 SNR을 지원하며 기존의 기법에 비해 향상된 비트량-왜곡 성능을 발휘함을 보인다.