• 제목/요약/키워드: 이미지 인식기법

검색결과 388건 처리시간 0.033초

이산 코사인 변환 기법을 이용한 선택적인 홍채영상 알고리즘 (Selective Iris Image Algorithms Using Discrete Cosine Transform)

  • 김찬중;김재훈;최복천
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1169-1172
    • /
    • 2010
  • 대부분의 홍채인식 시스템의 전반부를 살펴보면 카메라를 통한 이미지를 획득 후 전처리 과정에서 동공의 경계를 잡는 과정이 수행된다. 카메라를 통한 이미지 획득 시 초점이 좋은 이미지와 나쁜 이미지가 같이 획득이 된다. 초점이 나쁜 이미지는 동공의 경계를 잡는 과정에 있어서 좋은 이미지보다 시간이 오래 걸리기 마련이다. 이에 본 논문에서는 영상획득 후 동공의 경계를 잡는 과정 전에 DCT(Discrete Cosine Transform)를 이용한 선명도 측정하는 방법을 제안한다. 카메라를 통한 영상을 획득한 후 초점이 좋은 영상과 나쁜 영상을 구분하게 되고 초점이 좋은 영상만을 선택하여 다음 과정인 동공의 경계를 잡는 작업을 수행하게 된다. 제안하는 방법은 DCT를 이용한 이미지의 선별 작업에 시간이 소비 되지만 나쁜 영상을 이용하여 동공의 경계를 잡느라 걸리는 시간을 줄일 수 있는 장점을 기대할 수 있다. 우선적으로 수학적 분석을 통하여 23%의 속도 절감을 통한 성능 개선의 가능성을 보였고, 실제 구현을 통하여 속도 향상이 기대된다.

Backpropagation Network을 이용한 악보 인식 (Recognition of Music using Backpropagation Network)

  • 박현준;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.258-261
    • /
    • 2007
  • 본 논문에서는 신경회로망 알고리즘 중 하나인 Backpropagation Network을 이용한 악보인식 기법과 그에 필요한 악보 이미지에 대한 전처리 기법을 제안한다. 전처리과정으로 이진화, 기울기 보정, 오선제거 등의 과정을 수행하여 인식에 필요한 음악 기호와 음표를 분리한다. 분리된 음악 기호와 음표들은 Backpropagation 알고리즘을 사용하여 구성된 음표 인식 신경망과 비음표 인식 신경망을 통해 각각 음표와 비음표 인식과정을 거친다. 다양한 복잡도를 가진 악보를 대상으로 한 실험 및 분석 결과를 통해 제안한 악보 인식 기법의 정확도를 기술하였다.

  • PDF

이미지 이어붙이기를 이용한 인간-객체 상호작용 탐지 데이터 증강 (Human-Object Interaction Detection Data Augmentation Using Image Concatenation)

  • 이상백;이규철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권2호
    • /
    • pp.91-98
    • /
    • 2023
  • 인간-객체 상호작용 탐지는 객체 탐지와 상호작용 인식을 함께 풀어야하는 분야로 탐지 모델의 학습을 위해서 많은 데이터를 필요로 한다. 현재 공개된 데이터셋은 규모가 부족하여 데이터 증강 기법에 대한 요구가 커지고 있으나, 대부분의 연구에서 기존의 객체 탐지, 이미지 분할분야에서 활용하는 증강 기법을 활용하고 있는 실정이다. 이에 본 연구에서는 인간-객체 상호작용 탐지 분야에서 활용하는 데이터셋의 특성을 파악하고, 이를 통해 인간-객체 상호작용 탐지 모델 성능 향상에 효과적인 데이터 증강 기법을 제안한다. 본 연구에서 제안한 증강 기법에 대한 검증을 위하여 실험 환경을 구축하고, 기존의 학습 모델에 적용하여 증강 기법을 적용할 경우에 탐지 모델의 성능 향상이 가능함을 확인하였다.

인공신경망을 이용한 지문인식 (Fingerprint Recognition Using Artificial Neural Network)

  • 정재현;최병윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.417-420
    • /
    • 2014
  • 최근 늘어난 금융 사고들로 인하여 이를 방지하기 위한 보안 시스템의 중요성이 증가하고 있다. 보안 시스템들 중에서도 생체인식 시스템이 주목받고 있는데, 여러 가지 생체인식 방법들 중에서도 지문인식이 보안성, 신뢰성, 휴대성 등 여러 가지 면에서 가장 주목 받고 있다. 본문에서는 이러한 지문인식 기법을 인공신경망을 이용하여 구현하였다. 인공신경망은 뇌기능의 특성을 컴퓨터로 표현하기 위한 수학모델로서 특정 패턴들을 프로그램이 인식할 수 있도록 만들어 준다. 인공신경망을 이용하기 위하여 입력된 지문 이미지를 평활화, 이진화, 세선화 등의 전처리 과정을 거친다. 전처리 과정을 거친 지문이미지에서 특징점을 추출하고 신경망을 통하여 프로그램이 지문을 인식하게 한다.

  • PDF

지능형 인식 및 추적 기술을 이용한 다중 객체 추적 시스템의 설계 (Design of Multi Object Tracking System Using Intelligent Recognition and Tracking Technology)

  • 오승훈;유성훈;김수찬;오성권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.1367-1368
    • /
    • 2015
  • 본 논문에서는 지능형 인식 기술인 RBFNNs 패턴분류기와 추적 기법인 Particle Filter를 융합한 다중 객체 추적 시스템을 설계한다. 여러 객체가 동시에 존재하는 상황에서 각각의 객체를 개별적으로 추적하기 위해 추적 기법에 인식 알고리즘을 추가하였다. 학습 데이터는 다양한 상황에서 정확한 인식 결과를 확인하기 위해 정면, 좌, 우측 데이터를 사용하였으며, 테스트 영상에서 검출된 얼굴 이미지를 테스트 데이터로 사용하였다. 추적 알고리즘인 Particle Filter를 사용하여 검출된 객체의 추적을 수행하며, 인식 결과를 바탕으로 다양한 객체에 대하여 개별적인 추적을 수행한다.

  • PDF

딥러닝 기반 주행 차로 인식 기법을 활용한 차선 변경 검출 기술 (Lane departure detection method using driving lane recognition based on deep learning)

  • 이경민;송혁;김제우;최병호;인치호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.332-333
    • /
    • 2018
  • 본 논문에서는 딥러닝 기반의 주행 차로 인식 기법을 활용한 차선 변경 검출 기술을 제안한다. 제안한 방법은 주행 차로, 좌우 차로, 차량 등 3 종의 이미지 데이터를 학습, 검증, 실험 데이터로 나눠 활용하였다. 주행 차로 및 차선 변경 인식을 위하여 변형된 AlexNet 모델을 개발하였다. 실험 결과 주행 차로 69.45%, 좌우 차로 66.9%, 차량 76.4%의 인식률 결과를 보여 기존 패턴인식 방법과 비교하여 우수한 결과를 보였다.

  • PDF

저전력 영상 특징 추출 하드웨어 설계를 위한 공통 부분식 제거 기법 기반 이미지 필터 하드웨어 최적화 (Image Filter Optimization Method based on common sub-expression elimination for Low Power Image Feature Extraction Hardware Design)

  • 김우석;이주성;안호명;김병철
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권2호
    • /
    • pp.192-197
    • /
    • 2017
  • 본 논문은 저전력 영상 특징 추출 하드웨어 설계를 위한 공통 부분식 제거 기법 기반 이미지 필터 하드웨어 최적화 기법을 제안한다. 저전력 및 고성능 물체인식 하드웨어는 공장 자동화를 위한 산업용 로봇에 필수 모듈로 채택되고 있다. 따라서 물체인식 하드웨어의 영상 특징 추출 알고리즘에 다양하게 적용되는 Gaussian gradient 필터 하드웨어의 저면적 설계가 필수적이다. Gaussian gradient 필터의 하드웨어 복잡도를 줄이기 위해 필터에 사용되는 계수의 Symmetric한 특징과 Transposed form FIR 필터 하드웨어 구조를 이용했다. 제안된 이미지 필터의 하드웨어 구조는 알고리즘에 적용된 계수의 변형 없이 구현되었기 때문에 윤곽선 검출 알고리즘에 적용했을 때 검출 데이터의 열화 없이 구현될 수 있다. 제안된 이미지 필터 하드웨어 구조는 기존 구조와 비교했을 때 곱셈기의 수를 50% 절감할 수 있음을 확인했다.

이미지 인식을 이용한 비마커 기반 모바일 증강현실 기법 연구 (Non-Marker Based Mobile Augmented Reality Technology Using Image Recognition)

  • 조휘준;김대원
    • 융합신호처리학회논문지
    • /
    • 제12권4호
    • /
    • pp.258-266
    • /
    • 2011
  • 증강현실 기술이 많이 보편화 되고 사용 양태가 다양화됨에 따라 적용되는 분야 및 범위 또한 우리 생활 곳곳에서 쉽게 나타나고 볼 수 있게 되었다. 기존의 카메라 비전 기반 증강현실 기법들은 현실 세계의 실제 정보 이용 보다는 마커를 이용한 기술을 더 많이 사용하였다. 이러한 마커 인식을 통한 증강현실 기법은 그 응용 범위가 제한적이고 사용자가 해당 서비스 응용 프로그램에 몰입하는데 적절한 환경을 제공하는데 한계가 존재한다. 본 논문에서 스마트 모바일 단말 기반 증강현실 기술 구현을 위해 단말 장치에 내장된 카메라와 이미지 처리 기술을 활용하여 어떠한 마커도 없는 상태에서 사용자가 현실세계의 영상으로부터 객체를 인식하고 해당 객체에 연결된 3D 컨텐츠와 관련 정보를 현실 세계의 영상에 추가되게 함으로써 서비스가 구현되는 증강현실 가술을 제시하였다. 이미지로부터의 객체 인식은 미리 등록되어 있는 창조용 정보와 비교하는 과정을 통해 진행되었으며 이 과정에서 스마트 모바일 장치의 특성을 고려하여 구동 속도 향상을 목표로 유사도 측정을 위한 연산량을 줄이도록 하였다. 또한 3D 컨텐츠가 단말 화면상에 출력된 후 사용자는 스마트 모바일 장치를 이용한 터치 이벤트를 통해 상호작용이 가능하도록 설계되었다. 이 후 사용자의 선택에 따라 웹 브라우저를 통하여 객체와 연관된 정보를 얻을 수 있도록 하였다. 본 논문에 묘사된 시스템을 이용하여 기존 기술과의 객체 인식 및 동작 속도, 정확도, 인식 오류 검출 정도 등의 성능 차이를 비교 분석하였고 그 결과를 제시함으로써 스마트 모바일 환경에 적합한 증강현실 기법을 소개하고 실험을 통해 검증하고자 하였다.

다중 입력 영상과 Cross-Input Neighborhood Differences를 이용한 사람 재인식 기법 (A Person Re-identification Scheme Using Multiple Input images and Cross-Input Neighborhood Differences)

  • 김현우;김형준;임동혁;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1045-1048
    • /
    • 2019
  • 최근 CCTV 사용이 보편화되면서 방범 목적으로 서비스 시설이나 공공시설에 설치되는 CCTV의 수가 급격하게 증가하고 있다. 그에 따라 CCTV를 감시하는 노동력이 부족해지는 문제가 발생하여 이를 대체하기 위해 카메라 영상을 통하여 한번 인식한 사람을 다른 시간이나 장소에서 촬영된 영상에서 다시 인식하는 사람 재인식 기술이 주목받고 있다. 또한, 이러한 사람 재인식 기술은 보안 분야뿐만 아니라 영화나 드라마와 같은 영상 컨텐츠에 적용되어 불법 복제물을 찾는 일에 사용될 수도 있다. 기존의 사람 재인식에는 이미지의 유사도를 계산하는 방법이 사용되었지만, 조명이나 카메라 각도가 달라지면 성능이 급격하게 떨어지는 문제가 있었다. 최근에는 딥러닝 기술이 발달하면서 전반적인 영상처리 분야의 성능이 향상되었고, 사람 재인식 분야 역시 딥러닝을 활용하면서 성능이 향상되었다. 하지만 딥러닝을 활용한 방법의 경우 보통 두 개의 이미지를 입력으로 사용하여 같은지 다른지를 판단하게 되므로 각 이미지의 공통점이나 차이점을 동시에 고려하기는 어려운 점이 있다. 본 논문에서는 이러한 점을 해결하기 위해 세 개의 사람 이미지를 입력으로 사용하여 특징을 추출하고, 특징 맵을 재구성하여 각 이미지의 차이점과 공통점을 동시에 고려하며 학습할 수 있는 모델을 제안한다.

ViT 기반 모델 역전 공격 및 방어 기법들에 대한 연구 (Survey of the Model Inversion Attacks and Defenses to ViT)

  • 유미선;백윤흥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.15-17
    • /
    • 2023
  • ViT(Vision Transformer)는 트랜스포머 구조에 이미지를 패치들로 나눠 한꺼번에 인풋으로 입력하는 모델이다. CNN 기반 모델보다 더 적은 훈련 계산량으로 다양한 이미지 인식 작업에서 SOTA(State-of-the-art) 성능을 보이면서 다양한 비전 작업에 ViT 를 적용하는 연구가 활발히 진행되고 있다. 하지만, ViT 모델도 AI 모델 훈련시에 생성된 그래디언트(Gradients)를 이용해 원래 사용된 훈련 데이터를 복원할 수 있는 모델 역전 공격(Model Inversion Attacks)에 안전하지 않음이 증명되고 있다. CNN 기반의 모델 역전 공격 및 방어 기법들은 많이 연구되어 왔지만, ViT 에 대한 관련 연구들은 이제 시작 단계이고, CNN 기반의 모델과 다른 특성이 있기에 공격 및 방어 기법도 새롭게 연구될 필요가 있다. 따라서, 본 연구는 ViT 모델에 특화된 모델 역전 공격 및 방어 기법들의 특징을 서술한다.