• 제목/요약/키워드: Image Normalization

검색결과 246건 처리시간 0.023초

Adaptive low-resolution palmprint image recognition based on channel attention mechanism and modified deep residual network

  • Xu, Xuebin;Meng, Kan;Xing, Xiaomin;Chen, Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권3호
    • /
    • pp.757-770
    • /
    • 2022
  • Palmprint recognition has drawn increasingly attentions in the past decade due to its uniqueness and reliability. Traditional palmprint recognition methods usually use high-resolution images as the identification basis so that they can achieve relatively high precision. However, high-resolution images mean more computation cost in the recognition process, which usually cannot be guaranteed in mobile computing. Therefore, this paper proposes an improved low-resolution palmprint image recognition method based on residual networks. The main contributions include: 1) We introduce a channel attention mechanism to refactor the extracted feature maps, which can pay more attention to the informative feature maps and suppress the useless ones. 2) The ResStage group structure proposed by us divides the original residual block into three stages, and we stabilize the signal characteristics before each stage by means of BN normalization operation to enhance the feature channel. Comparison experiments are conducted on a public dataset provided by the Hong Kong Polytechnic University. Experimental results show that the proposed method achieve a rank-1 accuracy of 98.17% when tested on low-resolution images with the size of 12dpi, which outperforms all the compared methods obviously.

머신러닝 기반 낙상 인식 알고리즘 (Fall Detection Algorithm Based on Machine Learning)

  • 정준현;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.226-228
    • /
    • 2021
  • 구글사에서 출시된 ML Kit API의 Pose detection를 사용한 영상기반 낙상 알고리즘을 제안한다. Pose detection 알고리듬을 사용하여 추출된 신체의 33개의 3차원 특징점을 활용하여 낙상을 인식한다. 추출된 특징점을 분석하여 낙상을 인식하는 알고리듬은 k-NN을 사용한다. 영상의 크기와 영상내의 인체의 크기에 영향을 받지 않도록 정규화과정을 거치며 특징점들의 상대적인 움직임을 분석하여 낙상을 인식한다. 본 실험을 위해 사용한 13개의 테스트 영상중 13개의 영상에서 낙상을 인식하여 100%의 성공률을 보였다.

  • PDF

정렬과 평균 정규화를 이용한 2D ECG 신호 압축 방법 (2D ECG Compression Using Optimal Sorting Scheme)

  • 이규봉;주영복;한찬호;허경무;박길흠
    • 전자공학회논문지SC
    • /
    • 제46권4호
    • /
    • pp.23-27
    • /
    • 2009
  • 이 논문에서는 효율적인 2D 방식의 심전도 신호 압축 방법을 제안한다. ID 심전도 신호는 2D 신호로 변환된 후 주기와 복잡도를 바탕으로 정렬되고 상호간의 상관 관계를 적용한다. 그 다음 불연속이 발생하는 지점을 기준으로 각 구간을 분할하고 주기의 평균으로 정규화 한 후 보통의 영상 신호를 압축하는 방식과 유사한 방식으로 정렬된 2D 신호를 압축한다. 압축 방식으로는 JPEG 2000이 사용되었으며 실험 데이터는 심전도 압축에서 표준화되어 사용되는 MIT-BIH arrhythmia database를 사용하였다. 제안된 방법은 기존의 2D 심전도 압축 방식과 비교하여 보다 개선된 성능을 보여 준다.

웃음 치료 훈련을 위한 웃음 표정 인식 시스템 개발 (Development of a Recognition System of Smile Facial Expression for Smile Treatment Training)

  • 이옥걸;강선경;김영운;정성태
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.47-55
    • /
    • 2010
  • 본 논문은 실시간 카메라 영상으로부터 얼굴을 검출하고 얼굴 표정을 인식하여 웃음 치료훈련을 할 수 있는 시스템을 제안한다. 제안된 시스템은 카메라 영상으로부터 Haar-like 특징을 이용하여 얼굴 후보 영역을 검출한 다음, SVM분류기를 이용하여 얼굴 후보 영역이 얼굴 영상인지 아닌지를 검증한다. 그 다음에는 검출된 얼굴 영상에 대해, 조명의 영향을 최소화하기 위한 방법으로 히스토그램 매칭을 이용한 조명 정규화를 수행한다. 표정 인식 단계에서는 PCA를 사용하여 얼굴 특징 벡터를 획득한 후 다층퍼셉트론 인공신경망을 이용해 실시간으로 웃음표정을 인식하였다. 본 논문에서 개발된 시스템은 실시간으로 사용자의 웃음 표정을 인식하여 웃음 양을 화면에 표시해 줌으로써 사용자 스스로 웃음 훈련을 할 수 있게 해 준다. 실험 결과에 따르면, 본 논문에서 제안한 방법은 SVM 분류기를 통한 얼굴 후보 영역 검증과 히스토그램 매칭을 이용한 조명정규화를 이용하여 웃음 표정 인식률을 향상시켰다.

칼라 및 다해상도 질감 특징 결합에 의한 영상검색 (Image Retrieval Using Combination of Color and Multiresolution Texture Features)

  • 천영덕;성중기;김남철
    • 한국통신학회논문지
    • /
    • 제30권9C호
    • /
    • pp.930-938
    • /
    • 2005
  • 본 논문에서는 칼라 특징과 다해상도 질감 특징의 효율적인 결합에 근거한 내용기반 영상검색 기법을 제안한다. 칼라 특징으로는 칼라의 공간적인 상관관계를 잘 나타내는 HSV 칼라 오토코렐로그램(color autocorrelogram)을 선택하였고, 질감 특징으로는 국부 밝기 변화와 국부 질감의 부드러움 정도를 잘 측정하는 BDIP와 BVLC를 선택하였다. 이 질감 특징들은 칼라 영상의 휘도(luminance) 성분에서 웨이브렛(wavelet) 분해되어 다해상도로 추출되었다. 그리고 이들 칼라와 질감 특징들은 효율적인 유사도 측정을 위해 각각 이들의 차원들과 표준편차 벡터들에 의해 정규화된 후 결합되었다. 실험을 위한 영상으로는 Corel DB와 VisTex DB, 그리고 이들로부터 파생되어 다양한 해상도의 영상으로 구성된 Corel_MR DB와 VisTex_MR DB를 사용하였다. 실 험 결과, 제안한 방법은 Precision vs. Recall 평가에서 기존의 BDIPBVLC 방법과 칼라 오토코렐로그램 방법보다 각각 평균 $8\%$와 평균 $11\%$ 향상된 성능을 나타내었으며 웨이브렛. 모멘트, CSD, 히스토그램을 이용한 방법들보다 $10\%$ 이상의 높은 성능을 나타내었다. 특히, 제안한 방법이 다른 방법들 보다 다해상도로 구성된 영상 DB에서 높은 검색 성능 차이를나타내었다.

도심지역의 그림자 영향을 고려한 다시기 고해상도 위성영상의 선택적 히스토그램 매칭 (Selective Histogram Matching of Multi-temporal High Resolution Satellite Images Considering Shadow Effects in Urban Area)

  • 염준호;김용일
    • 대한공간정보학회지
    • /
    • 제20권2호
    • /
    • pp.47-54
    • /
    • 2012
  • 도심지 모델링과 분석을 효과적으로 수행하기 위해서는 다른 시기나 다른 지역의 추가적인 고해상도 위성영상이 반드시 필요하다. 그러나 같은 지상 개체라 하더라도 서로 다른 영상에서 방사적인 불일치가 존재하며 이는 영상 처리와 분석의 정확도를 저하시키는 원인이 된다. 더욱이 도심지의 경우 건물, 수목, 교량, 기타 구조물 등 높이를 갖는 개체들은 영상 전체에 걸쳐 그림자를 발생시키며 이는 상대 방사 정규화의 질을 저하시킨다. 본 연구에서는 태양과 위성의 기하학적 위치 정보, 부가적인 수치 표고 모델이 없어도 적용이 가능한 단영상 기반의 그림자 추출기법을 적용하고 그림자의 영향을 배제한 선택적인 히스토그램 매칭 기법을 제안하였다. 건물의 에지 버퍼 영역에 대한 인접 정보와 분할을 통해 생성된 객체의 공간 및 분광인자를 이용하여 그림자를 추출한 후, 아스팔트 도로와 같이 그림자로 잘못 추출된 이상 객체를 제거하였다. 최종적으로 그림자 지역이 마스킹 된 Quickbird-2 다시기 영상을 이용하여 비그림자 지역만을 이용하여 선택적 히스토그램 매칭을 수행하였다.

OpenCL 기반의 그래디언트 라돈변환을 이용한 만화영상의 정규화 (Comic Image Normalization using the gradient Radon Transform based on OpenCL implementation)

  • 김동근;전혁준;황치정
    • 정보처리학회논문지B
    • /
    • 제18B권4호
    • /
    • pp.221-230
    • /
    • 2011
  • 디지털 만화영상은 인터넷에서 매우 인기 있는 컨텐츠이다. 일반적으로 디지털 만화영상은 디지털 스캐너에 의해 스캔되며, 후처리를 하지 않으면 서로 다른 크기와 기울어짐을 가질 수 있으며, 경계부분에 내용이외의 여백이 있을 수 있다. 기울어짐과 여백이 없이 영상의 내용의 크기를 정규화하는 것은 내용기반 만화영상 검색과 같은 응용에서 매우 중요한 단계이다. 본 논문에서는 그래디언트 라돈변환을 사용하여 검출한 선분을 이용하여 만화영상의 박스 프레임을 검출하는 방법을 제안한다. 만화영상에서 박스프레임은 여백이 없는 만화영상 내용으로 이루어진 최대 사각영역이다. 만화영상의 크기를 정규화하고, 기울어짐을 없애기 위하여 박스 프레임을 사용하고, 선분 검출 속도를 높이기 위하여 OpenCL로 구현하였다. 제안 방법이 만화영상에서 효과적으로 박스 프레임을 검출함을 실험으로 보였다.

신, 구 차량 번호판 통합 인식에 관한 연구 (A Study on Recognition of Both of New & Old Types of Vehicle Plate)

  • 한건영;우영운;한수환
    • 한국정보통신학회논문지
    • /
    • 제13권10호
    • /
    • pp.1987-1996
    • /
    • 2009
  • 최근 들어 기존의 녹색 바탕의 차량 번호판에서, 흰색 바탕의 신 차량 번호판으로 교체되고 있다. 하지만, 아직 기존의 차량 번호판이 신 차량 번호판으로 전면 교체 되지 않아 두 번호판 모두 사용되고 있기 때문에 주차 관리 시스템, 속도위반, 신호 위반 등 무인 카메라를 이용한 시스템에서, 기존 차량 번호판과 신 차량 번호판 특징에 맞는 인식 시스템이 요구된다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 기존의 녹색 번호판과 흰색 번호판 모두를 추출하고 인식 할 수 있는 알고리즘에 관한 연구를 수행하였다. 다양한 환경 에서 획득한 차량 영상으로부터 번호판 영역을 추출하기 위하여 형태학적 특징을 이용하였고, 추출된 번호판 영역의 수평, 수직 히스토그램과 문자의 상대적 위치 정보를 이용하여, 문자를 분리하였다. 최종적으로, 분리된 문자를 인식하기 위해 주성분 분석법(PCA : Principal Component Analysis)과 선형 판별 분석법(LDA : Linear Discriminant Analysis)을 적용하여 인식 시스템을 구성하였다. 실험 결과, 불규칙한 조명 상태에서도 상대적으로 높은 추출률과 문자 인식률을 나타내었다.

세그멘테이션 기반 차선 인식 네트워크를 위한 적응형 키포인트 추출 알고리즘 (Adaptive Key-point Extraction Algorithm for Segmentation-based Lane Detection Network)

  • 이상현;김덕수
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권1호
    • /
    • pp.1-11
    • /
    • 2023
  • 딥러닝 기반의 이미지 세그멘테이션은 차선 인식을 위해 널리 사용되는 접근 방식 중 하나로, 차선의 키포인트를 추출하기 위한 후처리 과정이 필요하다. 일반적으로 키포인트는 사용자가 지정한 임계값을 기준으로 추출한다. 하지만 최적의 임계값을 찾는 과정은 큰 노력을 요구하며, 데이터 세트(또는 이미지)마다 최적의 값이 다를 수 있다. 본 연구는 사용자의 직접 임계값 지정 대신, 대상의 이미지에 맞추어 적절한 임계값을 자동으로 설정하는 키포인트 추출 알고리즘을 제안한다. 본 논문의 키포인트 추출 알고리즘은 차선 영역과 배경의 명확한 구분을 위해 줄 단위 정규화를 사용한다. 그리고 커널 밀도 추정을 사용하여, 각 줄에서 각 차선의 키포인트를 추출한다. 제안하는 알고리즘은 TuSimple과 CULane 데이터 세트에 적용되었으며, 고정된 임계값 사용 대비 정확도 및 거리오차 측면에서 1.80%p와 17.27% 향상된 결과를 얻는 것을 확인하였다.

Multiple-image Encryption and Multiplexing Using a Modified Gerchberg-Saxton Algorithm in Fresnel-transform Domain and Computational Ghost Imaging

  • Peiming Zhang;Yahui Su;Yiqiang Zhang;Leihong Zhang;Runchu Xu;Kaimin Wang;Dawei Zhang
    • Current Optics and Photonics
    • /
    • 제7권4호
    • /
    • pp.362-377
    • /
    • 2023
  • Optical information processing technology is characterized by high speed and parallelism, and the light features short wavelength and large information capacity; At the same time, it has various attributes including amplitude, phase, wavelength and polarization, and is a carrier of multi-dimensional information. Therefore, optical encryption is of great significance in the field of information security transmission, and is widely used in the field of image encryption. For multi-image encryption, this paper proposes a multi-image encryption algorithm based on a modified Gerchberg-Saxton algorithm (MGSA) in the Fresnel-transform domain and computational ghost imaging. First, MGSA is used to realize "one code, one key"; Second, phase function superposition and normalization are used to reduce the amount of ciphertext transmission; Finally, computational ghost imaging is used to improve the security of the whole encryption system. This method can encrypt multiple images simultaneously with high efficiency, simple calculation, safety and reliability, and less data transmission. The encryption effect of the method is evaluated by using correlation coefficient and structural similarity, and the effectiveness and security of the method are verified by simulation experiments.