• 제목/요약/키워드: Image Feature Vector

검색결과 499건 처리시간 0.025초

저전력 영상 특징 추출 하드웨어 설계를 위한 하드웨어 폴딩 기법 기반 그라디언트 매그니튜드 연산기 구조 (Gradient Magnitude Hardware Architecture based on Hardware Folding Design Method for Low Power Image Feature Extraction Hardware Design)

  • 김우석;이주성;안호명
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권2호
    • /
    • pp.141-146
    • /
    • 2017
  • 본 논문에서는 저전력 영상 특징 추출 하드웨어 설계를 위한 하드웨어 폴딩 기법 기반 저면적 Gradient magnitude 연산기 구조를 제안한다. 하드웨어 복잡도를 줄이기 위해 Gradient magnitude 벡터의 특징을 분석하여 기존 알고리즘을 하드웨어를 공유하여 사용할 수 있는 알고리즘으로 변경하여 Folding 구조가 적용될 수 있도록 했다. 제안된 하드웨어 구조는 기존 알고리즘의 특징을 최대한 이용했기 때문에 데이터 품질의 열화가 거의 없이 구현될 수 있다. 제안된 하드웨어 구조는 Altera Quartus II v16.0 환경에서 Altera Cyclone VI (EP4CE115F29C7N) FPGA를 이용하여 구현되었다. 구현 결과, 기존 하드웨어 구조를 이용하여 구현한 연산기와의 비교에서 41%의 logic elements, 62%의 embedded multiplier 절감 효과가 있음을 확인했다.

효율적인 feature map 추출 네트워크를 이용한 2D 이미지에서의 3D 포인트 클라우드 재구축 기법 (3D Point Cloud Reconstruction Technique from 2D Image Using Efficient Feature Map Extraction Network)

  • 김정윤;이승호
    • 전기전자학회논문지
    • /
    • 제26권3호
    • /
    • pp.408-415
    • /
    • 2022
  • 본 논문에서는 효율적인 feature map 추출 네트워크를 이용한 2D 이미지에서의 3D 포인트 클라우드 재구축 기법을 제안한다. 본 논문에서 제안한 기법의 독창성은 다음과 같다. 첫 번째로, 메모리 측면에서 기존 기법보다 약 27% 더 효율적인 새로운 feature map 추출 네트워크를 사용한다. 제안하는 네트워크는 딥러닝 네트워크의 중간까지 크기 축소를 수행하지 않아, 3D 포인트 클라우드 재구축에 필요한 중요한 정보가 유실되지 않았다. 축소되지 않은 이미지 크기로 인해 발생하는 메모리 증가 문제는 채널의 개수를 줄이고 딥러닝 네트워크의 깊이를 얕게 효율적으로 구성하여 해결하였다. 두 번째로, 2D 이미지의 고해상도 feature를 보존하여 정확도를 기존 기법보다 향상시킬 수 있도록 하였다. 축소되지 않은 이미지로부터 추출한 feature map은 기존의 방법보다 자세한 정보가 담겨있어 3D 포인트 클라우드의 재구축 정확도를 향상시킬 수 있다. 세 번째로, 촬영 정보를 필요로 하지 않는 divergence loss를 사용한다. 2D 이미지뿐만 아니라 촬영 각도가 학습에 필요하다는 사항은 그만큼 데이터셋이 자세한 정보를 담고 있어야 하며 데이터셋의 구축을 어렵게 만드는 단점이다. 본 논문에서는 추가적인 촬영 정보 없이 무작위성을 통해 정보의 다양성을 늘려 3D 포인트 클라우드의 재구축 정확도가 높아질 수 있도록 하였다. 제안하는 기법의 성능을 객관적으로 평가하기 위해 ShapeNet 데이터셋을 이용하여 비교 논문들과 같은 방법으로 실험한 결과, 본 논문에서 제안하는 기법의 CD 값이 5.87, EMD 값이 5.81 FLOPs 값이 2.9G로 산출되었다. 한편, CD, EMD 수치가 낮을수록, 재구축한 3D 포인트 클라우드가 원본에 근접하는 정확도가 향상된 결과를 나타낸다. 또한, FLOPs 수치가 낮을수록 딥러닝 네트워크에 필요한 메모리가 적게 소요되는 결과를 나타낸다. 따라서, 제안하는 기법의 CD, EMD, FLOPs 성능평가 결과가 다른 논문의 기법들보다 메모리 측면에서 약 27%, 정확도 측면에서 약 6.3% 향상된 결과를 나타내어 객관적인 성능이 입증되었다.

3차원 형상 복원을 위한 점진적 점유 예측 네트워크 (Progressive occupancy network for 3D reconstruction)

  • 김용규;김덕수
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제27권3호
    • /
    • pp.65-74
    • /
    • 2021
  • 3차원 형상 복원(3D reconstruction)은 이미지 또는 영상 속 물체를 3차원 형상으로 복원하는 것을 말한다. 본 연구는 물체의 전반적 형상을 넘어 세부적인 모습까지 복원할 수 있는 표현력을 가진 3차원 형상 복원 네트워크인, 점진적 점유 네트워크를 제안한다. 본 연구가 제안하는 네트워크는 이미지 전체의 정보를 담고 있는 특징(feature)을 사용하는 기존 점유 네트워크와 달리, 수용 영역(receptive field)의 크기에 따라 다양한 수준의 이미지 특징을 추출해서 사용한다. 그리고, 다양한 수준의 이미지 특징을 디코더(decoder) 내 디코더 블록(decoder block)들에 순차적으로 반영하여, 형상 복원의 품질이 단계적으로 개선하는 네트워크 구조를 제안한다. 본 연구는 또한, 다양한 수준의 이미지 특징을 적절히 조합하여 사용하는 디코더 블록구조를 제안한다. 본 연구는 제안하는 네트워크의 성능 검증을 위해 ShapeNet 데이터 세트를 사용하였으며, 기존의 점유 네트워크(ONet) 및 다양한 수준의 이미지 특징을 사용하는 최신 연구(DISN)와 성능 비교하였다. 그 결과, 기존 점유 네트워크 대비 세 가지 검증 지표 모두에서 높은 성능을 달성하였으며, DISN과는 대등한 수준의 성능을 보여주었다. 그리고 복원 형상의 시각적 비교 결과, 본 연구의 점진적 점유 네트워크가 기존 점유 네트워크 대비, 물체의 세부 모습을 잘 복원하는 것을 확인하였다. 또한, DISN이 복원 실패한 물체의 얇은 부분 또는 이미지에서 가려진 부분을 본 연구의 네트워크는 잘 잡아내는 결과를 확인할 수 있었다. 이러한 결과는 본 연구가 제안하는 점진적 점유 네트워크의 유용성을 검증하는 결과다.

얼굴인식을 위한 해마의 뇌모델링 학습 알고리즘 개발 (Development of Learning Algorithm using Brain Modeling of Hippocampus for Face Recognition)

  • 오선문;강대성
    • 대한전자공학회논문지SP
    • /
    • 제42권5호
    • /
    • pp.55-62
    • /
    • 2005
  • 본 논문에서는 인간의 인지학적인 두뇌 원리인 대뇌피질과 해마 신경망을 공학적으로 모델링하여 얼굴 영상의 특징 벡터들을 고속 학습하고, 각 영상의 최적의 특징을 구성할 수 있는 해마 신경망 모델링 알고리즘인 HNMA(Hippocampal Neuron Modeling Algorithm)을 이용한 얼굴인식 시스템을 제안한다. 시스템은 크게 특징추출 부분과 학습 및 인식 부분으로 구성 되어 있으며, 특징추출 부분에서는 PCA(Principal Component Analysis)와 LDA (Linear Discriminants Analysis)를 순차적으로 적용하여 분별력이 좋은 특징들로 구성한다. 학습부분에서는 해마 신경망 구조의 순서에 따라 입력되는 영상 데이터의 특징들을 치아 이랑 영역에서 호감도 조정에 따라서 반응 패턴으로 이진화 하고, CA3 영역에서 자기 연상 메모리 단계를 거쳐 노이즈를 제거한다. CA3의 정보를 받는 CAI영역에서는 신경망에 의해 학습되어 장기기억이 만들어 진다. 제안한 시스템의 성능을 평가하기 위하여 실험은 표정과 포즈변화 그리고 저 화질 이미지를 각각 구분하여 인식률을 확인하였다. 실험 결과, 본 논문에서 제안하는 특징 추출 방법과 학습 방법을 다른 방법들과 비교하였을 때, 학습시간비용과 인식률에서 우수함을 확인하였다.

3차원 뇌 자기공명 영상의 비지도 학습 기반 비강체 정합 네트워크 (Unsupervised Non-rigid Registration Network for 3D Brain MR images)

  • 오동건;김보형;이정진;신영길
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제15권5호
    • /
    • pp.64-74
    • /
    • 2019
  • 비강체 정합은 임상적 필요성은 높으나 계산 복잡도가 높고, 정합의 정확성 및 강건성을 확보하기 어려운 분야이다. 본 논문은 비지도 학습 환경에서 3차원 뇌 자기공명 영상 데이터에 딥러닝 네트워크를 이용한 비강체 정합 기법을 제안한다. 서로 다른 환자의 두 영상을 입력받아 네트워크를 통하여 두 영상 간의 특징 벡터를 생성하고, 변위 벡터장을 만들어 기준 영상에 맞추어 다른 쪽 영상을 변형시킨다. 네트워크는 U-Net 형태를 기반으로 설계하여 정합 시 두 영상의 전역적, 지역적인 차이를 모두 고려한 특징 벡터를 만들 수 있고, 손실함수에 균일화 항을 추가하여 3차원 선형보간법 적용 후에 실제 뇌의 움직임과 유사한 변형 결과를 얻을 수 있다. 본 방법은 비지도 학습을 통해 임의의 두 영상만을 입력으로 받아 단일 패스 변형으로 비강체 정합을 수행한다. 이는 반복적인 최적화 과정을 거치는 비학습 기반의 정합 방법들보다 빠르게 수행할 수 있다. 실험은 50명의 뇌를 촬영한 3차원 자기공명 영상을 가지고 수행하였고, 정합 전·후의 Dice Similarity Coefficient 측정 결과 평균 0.690으로 정합 전과 비교하여 약 16% 정도의 유사도 향상을 확인하였다. 또한, 비학습 기반 방법과 비교하여 유사한 성능을 보여주면서 약 10,000배 정도의 속도 향상을 보여주었다. 제안 기법은 다양한 종류의 의료 영상 데이터의 비강체 정합에 활용이 가능하다.

사실적인 3D 얼굴 모델링 시스템 (Realistic individual 3D face modeling)

  • 김상훈
    • 한국전자통신학회논문지
    • /
    • 제8권8호
    • /
    • pp.1187-1193
    • /
    • 2013
  • 본 논문은 사실적인 3D 얼굴 모델링과 얼굴 표정 생성 시스템을 제안한다. 사실적인 3D 얼굴 모델링 기법에서 개별적인 3D 얼굴 모양과 텍스쳐 맵을 만들기 위해 Generic Model Fitting 기법을 적용하였다. Generic Model Fitting에서 Deformation Function을 계산하기 위해 개별적인 얼굴과 Generic Model 사이의 대응점을 결정하였다. 그 후, Calibrated Stereo Camera로부터 캡쳐 된 영상들로부터 특징점을 3D로 복원하였다. 텍스쳐 매핑을 위해 Fitted된 Generic Model을 영상으로 Projection하였고 사전에 정의된 Triangle Mesh에서 텍스쳐를 Generic Model에 매핑 하였다. 잘못된 텍스쳐 매핑을 방지하기 위해, Modified Interpolation Function을 사용한 간단한 방법을 제안하였다. 3D 얼굴 표정을 생성하기 위해 Vector Muscle기반 알고리즘을 사용하고, 보다 사실적인 표정 생성을 위해 Deformation 과 vector muscle 기반의 턱 rotation을 적용하였다.

NMF와 LDA 혼합 특징추출을 이용한 해마 학습기반 RFID 생체 인증 시스템에 관한 연구 (A Study on the RFID Biometrics System Based on Hippocampal Learning Algorithm Using NMF and LDA Mixture Feature Extraction)

  • 오선문;강대성
    • 대한전자공학회논문지SP
    • /
    • 제43권4호
    • /
    • pp.46-54
    • /
    • 2006
  • 최근 각종 온라인 상거래 및 개인 신분카드 이용이 늘어나면서 개인 인증의 중요성이 부각되고 있다. RFID(Radio Frequency Identification) tag가 내장된 개인 신분 카드가 점차 증가하고 있지만, 본인의 인증을 할 수 있는 방법이 미비하기 때문에, 자동화 할 수 있는 대책이 시급하다. RFID tag는 현재 메모리 용량이 매우 작기 때문에, 개인의 생체정보를 저장하기 위해서는 효율적인 특징추출 방법이 필요하며, 저장된 특징들을 비교하기 위해서는 새로운 인식방법이 필요하다. 본 논문에서는 인간의 인지학적인 두뇌 원리인 해마 신경망을 공학적으로 모델링하여 얼굴 영상의 특징 벡터들을 고속 학습하고, 각 영상의 최적의 특정을 구성할 수 있는 해마 신경망 모델링 알고리즘을 이용한 개인생체 인증 시스템에 관한 연구를 수행하였다. 시스템은 크게 NMF(Non-negative Matrix Factorization)와 LDA(Linear Discriminants Analysis) 혼합 알고리즘을 이용한 특징 추출 부분과 해마신경망을 모델링하고 인식 성능을 실험하는 것으로 구성 되어 있다. 제안한 시스템의 성능을 평가하기 위하여 실험은 표정변화와 포즈변화가 포함된 이미지를 각각 구분하여 인식률을 확인하였다. 실험 결과, 본 논문에서 제안하는 특정 추출 방법과 학습 방법을 다른 방법들과 비교하였을 때, 학습시간비용과 인식률에서 우수함을 확인하였다.

Sub Oriented Histograms of Local Binary Patterns for Smoke Detection and Texture Classification

  • Yuan, Feiniu;Shi, Jinting;Xia, Xue;Yang, Yong;Fang, Yuming;Wang, Rui
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권4호
    • /
    • pp.1807-1823
    • /
    • 2016
  • Local Binary Pattern (LBP) and its variants have powerful discriminative capabilities but most of them just consider each LBP code independently. In this paper, we propose sub oriented histograms of LBP for smoke detection and image classification. We first extract LBP codes from an image, compute the gradient of LBP codes, and then calculate sub oriented histograms to capture spatial relations of LBP codes. Since an LBP code is just a label without any numerical meaning, we use Hamming distance to estimate the gradient of LBP codes instead of Euclidean distance. We propose to use two coordinates systems to compute two orientations, which are quantized into discrete bins. For each pair of the two discrete orientations, we generate a sub LBP code map from the original LBP code map, and compute sub oriented histograms for all sub LBP code maps. Finally, all the sub oriented histograms are concatenated together to form a robust feature vector, which is input into SVM for training and classifying. Experiments show that our approach not only has better performance than existing methods in smoke detection, but also has good performance in texture classification.

칼라 클러스터 모델에 근거한 균일 칼라 영상 변환 (Uniform Color Image Transformation based on Color Cluster Model)

  • 이정환;박세현;김중수
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1646-1657
    • /
    • 1996
  • 본 논문에서는 균일 칼라 영상 신호의 모델링에 대하여 설명하였으며 이 모델의 성질에 근거하여 균일 칼라영상을 변환하는 방법을 제안하였다. 먼저 칼라 영상 신호 의 모델링을 위하여 칼라 변동원인을 각 칼라 성분에 동등하게 작용하는 "동등요인 (identical or multiplicative)"과 각 칼라 성분에 독립적으로 작용하는 "독립요인 (independent or additive factor)"으로 분류하였으며 각각을 정규 분포로 모델링하 였다. 또한 클러스터의 분포모양은 (R, G, B) 3차원 특징 공간에서 길쭉한 타원체를 형성하며 타원체의 최장축 방향은 클러스터의 평균벡터 방향과 일치하게 됨을 알 수 있었다. 그리고 영상 처리 장치로부터 입력된 균일 칼라 영상을 모델에 적합하도록 변환하는 방법을 연구하였다. 3차원 좌표 변환 방법을 기술하였고 클러스터의 평균 벡터가 한 좌표축이 되도록 하는 변환 행렬을 구하였다. 제안된 방법을 인공 및 자연 칼라 영상을 사용하여 컴퓨터 시뮬레이션으로 실험하였으며 그 결과 변환된 칼라 영 상은 클러스터의 최장축 방향과 평균 벡터가 거의 일치하였다.방향과 평균 벡터가 거의 일치하였다.

  • PDF

동적 셔플링을 이용한 MPEG기반의 동영상 암호화 방법에 관한 연구 (A Study on Video Data Protection Method based on MPEG using Dynamic Shuffling)

  • 이지범;이경학;고형화
    • 한국멀티미디어학회논문지
    • /
    • 제10권1호
    • /
    • pp.58-65
    • /
    • 2007
  • 본 논문에서는 MPEG 기반의 동영상 데이터를 보호하기 위한 알고리즘을 제안하였다. 기존의 고정된 셔플링 테이블을 사용하는 단순 전치 암호화의 경우 계산량이 적은 반면에 선택적 평문 공격에 취약한 난점을 가지고 있다. 이러한 단점을 보완하기 위해서는 프레임 단위로 셔플링 테이블을 동적으로 생성해야 하는데 이 경우, 동적인 셔플링 테이블 생성 시간과 키를 관리하는 것이 문제가 된다. 이러한 문제를 해결하기 위해 영상의 특징에 따라 적응적으로 변하는 인터리빙 알고리즘을 제안하고 이를 이용하여 DPCM 처리된 8*8 블록을 셔플링하여 일차적으로 영상을 스크램블링한 후 기존의 랜덤 셔플링 테이블을 이용하여 최종적으로 영상을 암호화하였다. 실험 결과 기존의 SEED를 이용한 암호화 방식에 비해 수행 시간이 약 10% 정도에 불과했고 암호화에 따른 압축률 감소 등의 문제는 보이지 않았다. 동영상 암호화는 인트라 프레임에 대해서는 정지영상과 통일한 방식의 암호화 방법을 적용하고 예측 프레임에서는 DC 계수 및 AC 계수에 비해 상대적으로 데이터량이 적으면서 암호화 효과가 좋은 움직임 벡터를 대상으로 암호화하였고 예측 프레임내의 인트라블록에 의한 암호화 효과가 떨어지는 것을 방지하기 위해 매크로 블록 셔플링 알고리즘을 이용하였다.

  • PDF