• 제목/요약/키워드: 신경망 기반 이미지 인식

검색결과 83건 처리시간 0.025초

고유 얼굴과 퍼지 신경망을 이용한 얼굴 인식 기법 (Face Recognition using Eigenfaces and Fuzzy Neural Networks)

  • 김재협;문영식
    • 전자공학회논문지CI
    • /
    • 제41권3호
    • /
    • pp.27-36
    • /
    • 2004
  • 일반적으로 영상에서 얼굴 영상을 검출하고 인식하는 알고리즘은 패턴 인식 연구에 있어서 인간과 컴퓨터의 상호작용의 연구라는 면에서 아주 중요한 문제로 연구되어 왔다. 본 논문에서는 고유얼굴과 퍼지 신경망을 이용한 얼굴인식 기법을 제안한다. PCA(Principal Component Analysis) 방식은 우수한 인식 결과를 보장하는 얼굴인식 기법중의 하나이며, 얼굴 영상을 이용하여 공분산 행렬을 계산하고, 공분산 행렬을 통해 생성된 저차원의 벡터, 즉 고유얼굴(Eigenface)을 이용하여 가중치를 계산하고, 이 가중치를 기준으로 인식을 수행하는 기법이다. 이를 기반으로 하여, 본 논문에서는 전처리 과정, 고유얼굴 과정, 퍼지 소속도 함수 설계 과정, 신경망 학습 과정, 인식과정으로 구성된 5단계의 얼굴 인식 알고리즘을 제안한다. 먼저 각 얼굴 영상들은 전처리과정을 거치며 이 영상들을 이용하여 고유얼굴을 추출한다. 추출된 고유얼굴을 이용한 가숭치 135개에 대하여 비대칭 가우시안 함수를 응용한 퍼지 소속도 함수를 이용하여 퍼지 소속도가 부여되며 이 소속도들이 신경망의 입력으로 사용되어 학습과정을 거친다. 학습과정을 거친 후, 신경망의 출력은 현재의 얼굴 이미지가 데이터베이스의 얼굴 이미지와 유사한 정도를 나타내게 되어 인식을 수행한다. 제안하는 알고리즘으로 가중치의 개수와 퍼지 레벨의 개수에 대하여 기존의 얼굴 데이터 베이스를 이용하여 실험하였으며, 실험 결과 특정 조건하에서 약 95% 이상의 인식 성능을 확인할 수 있었다.

마코프 모텔 기반 지문의 구조적 특징 분류 (Markov Models based Classification of Fingerprint Structural Features)

  • 정혜욱;원종진;김문현
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2005년도 추계학술대회 및 정기총회
    • /
    • pp.33-38
    • /
    • 2005
  • 지문분류는 대규모 인증시스템에 사용되는 지문 데이터 베이스를 종류별로 인덱싱 하거나 인식 시스템에 다양하게 쓰이는 매우 중요한 방법이다. 지문은 일반적으로 융선의 전체모양 등 전역적인 특징을 기반으로 분류하며, 분류방법에는 규칙기반 접근, 구문론적 접근, 구조적 접근, 통계적 접근, 신경망 기반 접근 등이 있다. 본 논문에서는 지문의 구조적인 특징을 바탕으로 관찰되는 특징의 상태가 매순간 변화하는 확률론적 정보추출 방식인 마코프 모델을 적용한 지문분류 방법을 제안한다. 지문 이미지의 전처리 과정을 거친 후 각 클래스 분류를 위해 대표 융선을 찾아 방향정보를 추출하고 이를 이용하여 5가지 클래스로 분류될 수 있도록 설계하였다. 좋은품질(Good)과 나쁜품질(Poor)의 데이터를 포함한 훈련집합을 사용하여 각 클래스별로 학습된 마코프 모델은 임의의 지문이미지 분류시 높은 분류율을 보였다. 또한 기존의 구조적 접근방법에 비하여 다양한 품질의 지문이미지의 방향성 정보를 이용한 확률론적 방법이기 때문에 예외적인 지문이미지 분류시 잘 적용될 수 있다.

  • PDF

홈보안 시스템을 위한 CNN 기반 2D와 2.5D 얼굴 인식 (CNN Based 2D and 2.5D Face Recognition For Home Security System)

  • ;김강철
    • 한국전자통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.1207-1214
    • /
    • 2019
  • 4차 산업혁명의 기술이 우리도 모르는 사이 우리의 삶 속으로 스며들고 있다. CNN이 이미지 인식 분야에서 탁월한 능력을 보여준 이후 많은 IoT 기반 홈보안 시스템은 침입자로부터 가족과 가정을 보호하며 얼굴을 인식하기 위한 좋은 생체인식 방법으로 CNN을 사용하고 있다. 본 논문에서는 2D와 2.5D 이미지에 대하여 여러 종류의 입력 이미지 크기와 필터를 가지고 있는 CNN의 구조를 연구한다. 실험 결과는 50*50 크기를 가진 2.5D 입력 이미지, 2 컨벌류션과 맥스풀링 레이어, 3*3 필터를 가진 CNN 구조가 0.966의 인식률을 보여 주었고, 1개의 입력 이미지에 대하여 가장 긴 CPU 소비시간은 0.057S로 나타났다. 홈보안 시스템은 좋은 얼굴 인식률과 짧은 연산 시간을 요구하므로 본 논문에서 제안한 구조의 CNN은 홈보안 시스템에서 얼굴인식을 기반으로 하는 액추에이터 제어 등에 적합한 방법이 될 것이다.

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.

심층 학습 기반의 수기 일회성 암호 인증 시스템 (Handwritten One-time Password Authentication System Based On Deep Learning)

  • 리준;이혜영;이영준;윤수지;배병일;최호진
    • 인터넷정보학회논문지
    • /
    • 제20권1호
    • /
    • pp.25-37
    • /
    • 2019
  • 심층 학습 및 온라인 생체 인식 기반 인증의 급속한 개발에 영감을 받아, 본 논문에서는 심층 학습을 기반으로 필체 인식 및 작성자 검증을 수행하는 수기 일회성 암호 인증 시스템을 제안한다. 본 논문에서는 수기로 작성된 숫자를 인식할 수 있는 합성곱 신경망과, 입력된 필체와 실제 사용자의 필체 사이 유사성을 계산할 수 있는 Siamese 신경망을 설계한다. 본 논문에서는 작성자 검증을 위한 NIST Speical Database 19 제 2판의 첫 번째 응용 사례를 제시한다. 본 논문이 제안하는 시스템은 네 장의 입력 이미지를 기반으로 한 숫자 인식 작업에서 98.58%, 작성자 검증 작업에서 93%의 정확도를 달성했다. 본 논문의 저자들은 제안한 필체 기반 생체 인식기술이 FIDO 프레임워크 기반의 다양한 온라인 인증 서비스에 활용될 수 있을 것이라 예상한다.

스킵 연결 형태 기반의 손 관절 2D 및 3D 검출 기법 (2D and 3D Hand Pose Estimation Based on Skip Connection Form)

  • 구종회;김미경;차의영
    • 한국정보통신학회논문지
    • /
    • 제24권12호
    • /
    • pp.1574-1580
    • /
    • 2020
  • 기존의 신체 인식 방법은 특수한 기기를 사용하거나 이미지로부터 영상처리를 통해 검출하는 방법들이 있다. 특수 기기를 사용할 경우 기기를 사용할 수 있는 환경이 제약되고 기기의 비용이 많이 든다는 단점이 있다. 카메라와 영상처리를 사용할 경우 환경의 제약과 비용이 낮아지는 장점이 있지만, 성능이 떨어진다. 이런 단점을 해결하기 위해 카메라와 합성 곱 심층 신경망을 사용한 신체 인식 방법들이 연구되었다. 합성 곱 심층 신경망의 성능을 올리기 위해 다양한 기법들이 제안되었다. 본 논문에서는 합성 곱 심층 신경망의 성능을 올리기 위한 기법 중 스킵 연결을 다양한 형태로 사용하여 스킵 연결이 손 검출 망에 끼치는 영향을 실험하였다. 실험을 통해 기본 스킵 연결 이외 추가적인 스킵 연결의 존재가 성능에 나은 영향을 끼치고 하향 스킵 연결만 추가된 망이 가장 나은 성능을 보임을 확인하였다.

머신러닝 기반 사진인식 기술을 활용한 다이어트 AI

  • 노가현;윤인경
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.384-387
    • /
    • 2020
  • AI가 각광받고 있는 시대에 발 맞추어 머신러닝, 딥러닝을 활용한 이미지 인식 기술을 구현하였다. 사용자가 원하는 음식 사진을 업로드하면 인공 신경망 알고리즘이 convolution을 수행해 데이터베이스에 학습시켜 두었던 이미지들 가운데 유사도가 가장 높은 수치로 나오는 이미지를 결과로 보여주어, 사용자는 사진만으로도 음식의 칼로리 정보, 칼로리를 소모하기 위한 운동량 등의 정보를 간편하게 알 수 있는 시스템을 구축하였다. 또한 MYSQL과 PHP를 활용하여 자신의 칼로리 정보를 저장하고, 사용자가 매일 입력하는 몸무게의 변화량 등을 실시간으로 확인할 수 있는 등의 데이터베이스 서버를 구축하였다. 스마트폰을 통해 정보를 얻을 수 있도록 어플리케이션을 구성했다.

  • PDF

모바일 환경 영상인식을 위한 신경망기반 Speeded Up Robust Features 차원 감소 (Dimensionality Reduction of Speeded Up Robust Features Using Neural Networks for Object Recognition in Mobile Environments)

  • 윤두밈;김경중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.421-424
    • /
    • 2011
  • 최근에 스마트폰이 발달하고 대부분의 모바일 기기에 카메라가 달리면서 카메라를 이용한 애플리케이션 또한 늘어나고 있는데 기존의 PC상에서 로고 인식등을 위해 사용되는 SURF를 이용한 이미지 매칭에는 유클리드 거리 계산을 사용하고 있다. 그러나 이 방법으로는 PC보다는 사양이 낮은 모바일 기기에 적용하기에는 기존에 사용하고 있는 방법이 인식할 이미지마다 모든 특징점을 비교하는 방법을 사용하기 때문에 연산량이 높은 편이다. 본 논문에서는 미리 인식할 이미지를 뉴럴넷에 학습시킨 뒤, 뉴럴넷을 필터링으로 사용하여 일부의 특징점만을 비교해 연산량을 줄여서 속도를 향상시키는 방법을 제안하였으며 이를 이용하여 대략 30%가량의 성능 향상이 나타난 것을 알 수 있었다.

Deep Learning Based Tree Recognition rate improving Method for Elementary and Middle School Learning

  • Choi, Jung-Eun;Yong, Hwan-Seung
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권12호
    • /
    • pp.9-16
    • /
    • 2019
  • 본 연구의 목적은 수업 시 스마트기기에 적용할 수 있는 나무 이미지를 인식하고 분류하여 정확도를 측정할 수 있는 효율적인 모델을 제안하는 것이다. 2015개정 교육과정으로 개정되면서 초등학교 4학년 과학교과서의 학습 목표에서 스마트 기기 사용한 식물 인식이 새롭게 추가 되었다. 특히 나무 인식의 경우 다른 사물 인식과 달리 수형, 수피, 잎, 꽃, 열매의 부위별 특징이 있으며, 계절에 따라 모양 및 색깔의 변화를 거치므로 인식률에 차이가 존재한다. 그러므로 본 연구를 통해 컨볼루션 신경망 기반의 사전 학습된 인셉션V3모델을 이용하여 재학습 전 후의 나무 부위별 인식률을 비교한다. 또한 각 나무의 유형별 이미지 정확도를 결합시키는 방식을 통해 효율적인 나무 분류 방안을 제시하며 교육현장에서 사용하는 스마트기기에 적용 할 수 있을 것이라 기대한다.

뉴로모픽 구조 기반 FPGA 임베디드 보드에서 이미지 분류 성능 향상을 위한 특징 표현 방법 연구 (Feature Representation Method to Improve Image Classification Performance in FPGA Embedded Boards Based on Neuromorphic Architecture)

  • 정재혁;정진만;윤영선
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권2호
    • /
    • pp.161-172
    • /
    • 2021
  • 뉴로모픽 아키텍처는 저에너지로 인공지능 기술을 지원하는 차세대 컴퓨팅으로 주목받고 있다. 그러나 뉴로모픽 아키텍처 기반의 FPGA 임베디드 보드는 크기나 전력 등으로 인하여 가용 자원이 제한된다. 본 논문에서는 제한된 자원을 효율적으로 사용하기 위해 특징점의 고려 없이 크기를 재조정하는 보간법과 에너지 기반으로 특징점을 최대한 보존하는 DCT(Discrete Cosine Transform) 기법을 통한 특징 표현 방법을 비교 및 평가한다. 크기가 조정된 이미지는 일반적인 PC 환경에서와 FPGA 임베디드 보드의 Nengo 프레임워크에서 컨벌루션 신경망을 통해 정확도를 비교 분석했다. 실험 결과 PC의 컨벌루션 신경망과 FPGA Nengo 환경 모두에서 DCT 기반 분류 성능이 일반 보간법보다 약 1.9% 높은 성능을 보였다. 실험 결과를 바탕으로 뉴로모픽 구조 기반 FPGA 보드의 제한된 자원 환경에서 기존에 사용되던 보간법 대신 DCT 방식을 이용한다면 분류에 사용되는 뉴런의 표현에 많은 자원을 할당하여 인식률을 높일 수 있을 것으로 기대한다.