• 제목/요약/키워드: 신경망 기반 이미지 인식

검색결과 83건 처리시간 0.029초

합성곱 신경망(CNN)을 이용한 U-Net 기반의 인공지능 안면 정면화 모델 (Face Frontalization Model with A.I. Based on U-Net using Convolutional Neural Network)

  • 이상민;손원호;진창균;김지현;김지윤;박나은;김가은;권진영;이혜리;김종완;오덕신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.685-688
    • /
    • 2020
  • 안면 인식은 Face ID를 비롯하여 미아 찾기, 범죄자 추적 등의 분야에 도입되고 있다. 안면 인식은 최근 딥러닝을 통해 인식률이 향상되었으나, 측면에서의 인식률은 정면에 비해 특징 추출이 어려우므로 비교적 낮다. 이런 문제는 해당 인물의 정면이 없고 측면만 존재할 경우 안면 인식을 통한 신원확인이 어려워 단점으로 작용될 수 있다. 본 논문에서는 측면 이미지를 바탕으로 정면을 생성함으로써 안면 인식을 적용할 수 있는 상황을 확장하는 인공지능 기반의 안면 정면화 모델을 구현한다. 모델의 안면 특징 추출을 위해 VGG-Face를 사용하며 특징 추출에서 생길 수 있는 정보 손실을 막기 위해 U-Net 구조를 사용한다.

연속형 속성을 갖는 인공 신경망의 규칙 추출 (Extracting Rules from Neural Networks with Continuous Attributes)

  • 바트셀렘;이완곤;전명중;박현규;박영택
    • 정보과학회 논문지
    • /
    • 제45권1호
    • /
    • pp.22-29
    • /
    • 2018
  • 지난 수십 년 동안 인공 신경망은 음성 인식에서 이미지 분류에 이르기까지 수많은 분야에서 성공적으로 사용되었다. 그러나 인공 신경망은 특정 결론이 어떻게 도출되었는지 알 필요가 있음에도 불구하고 이러한 결과를 설명할 수 있는 능력이 부족하다. 대부분의 연구는 신경망에서 이진 규칙을 추출하는데 초점을 맞추고 있지만, 기계 학습 응용 프로그램에 사용되는 데이터는 연속된 값이 포함되어 있기 때문에 실용적이지 않은 경우가 있다. 이러한 격차를 줄이기 위해 본 논문에서는 연속된 값이 포함된 데이터로부터 학습된 신경망에서 논리 규칙을 추출하는 알고리즘을 제안한다. 초평면 기반 선형 분류기를 사용하여 입력 및 은닉 층 사이에서 학습된 가중치로부터 규칙을 추출하고, 비선형 분류 규칙을 생성하기 위해 은닉 층과 출력 층에서 학습된 이진 규칙과 분류기를 결합한다. 비선형 연속값으로 구성된 여러 데이터셋을 대상으로 진행한 실험에서 제안하는 방법이 논리적 규칙을 정확하게 추출할 수 있음을 보였다.

전이학습과 그래프 합성곱 신경망 기반의 다중 패션 스타일 인식 (Recognition of Multi Label Fashion Styles based on Transfer Learning and Graph Convolution Network)

  • 김성훈;최예림;박종혁
    • 한국전자거래학회지
    • /
    • 제26권1호
    • /
    • pp.29-41
    • /
    • 2021
  • 최근 패션업계에서는 급속도로 발전하는 딥러닝 방법론을 활용하려는 시도가 늘고 있다. 이에 따라 다양한 패션 관련 문제들을 다루는 연구들이 제안되었고, 우수한 성능을 달성하였다. 하지만 패션 스타일 분류 문제의 경우, 기존 연구들은 한 옷차림이 여러 스타일을 동시에 포함할 수 있다는 패션 스타일의 특성을 반영하지 못하였다. 따라서 본 연구에서는 동시에 존재하는 레이블 간의 종속성을 모델링하고, 이를 반영하여 패션 스타일의 다중 분류 문제를 해결하고자 한다. 패션 스타일 사이의 종속성을 포착하고 탐색하기 위해 GCN(graph convolution network) 기반의 다중 레이블 인식 모델을 적용하였다. 또한 전이학습을 통해 모델의 학습 속도 및 성능을 향상시켰다. 제안하는 모델은 웹 크롤링을 통해 수집한 SNS 이미지 데이터를 이용하여 검증하였으며, 비교 모델 대비 우수한 성능을 기록하였다.

HCI를 위한 트리 구조 기반의 자동 얼굴 표정 인식 (Automatic Facial Expression Recognition using Tree Structures for Human Computer Interaction)

  • 신윤희;주진선;김은이;;;박세현;정기철
    • 한국산업정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.60-68
    • /
    • 2007
  • 본 논문에서는 자동으로 사용자의 얼굴 표정을 인식할 수 있는 시스템을 제안한다. 제안된 시스템은 휴리스틱 정보를 기반으로 설계된 트리 구조를 이용하여 행복, 역겨움, 놀람의 감정과 무표정을 인식한다. 카메라로부터 영상이 들어오면 먼저 얼굴 특징 검출기에서 피부색 모델과 연결성분 분석을 이용하여 얼굴 영역을 획득한다. 그 후에 신경망 기반의 텍스처 분류기를 사용하여 눈 영역과 비 눈 영역으로 구분한 뒤 눈의 중심 영역과 에지 정보를 기반으로 하여 눈, 눈썹, 입 등의 얼굴 특징을 찾는다. 검출된 얼굴 특징들은 얼굴 표정 인식기에 사용되며 얼굴 인식기는 이를 기반으로 한 decision tree를 이용하여 얼굴 감정을 인식한다. 제안된 방법의 성능을 평가하기 위해 MMI JAFFE, VAK DB에서 총 180장의 이미지를 사용하여 테스트하였고 약 93%의 정확도를 보였다.

  • PDF

생체 기반 시각정보처리 동작인식 모델링 (A Bio-Inspired Modeling of Visual Information Processing for Action Recognition)

  • 김진옥
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권8호
    • /
    • pp.299-308
    • /
    • 2014
  • 신체 동작, 얼굴 표정과 같이 아주 복잡한 생체 패턴을 인식하고 분류하는 인간의 능력을 모방한 정보처리 컴퓨팅 관련 연구가 최근 다수 등장하고 있다. 특히 컴퓨터비전 분야에서는 인간의 뛰어난 인지 능력 중 상황정보 없이 시각시퀀스에서 동작을 분류하는 기능을 통해 시공간적 패턴 코딩과 빠른 인식 방법을 이해하고자 한다. 본 연구는 비디오 시퀀스상의 동작인식에 생물학적 시각인지과정의 영향을 받은 생체 기반 컴퓨터비전 모델을 제시하였다. 제안 모델은 이미지 시퀀스에서 동작을 검출하고 시각 패턴을 판별하는 데 생체 시각처리과정의 신경망 구조 단계를 반영하였다. 실험을 통해 생체 기반 동작인식 모델이 인간 시각인지 처리의 여러 가지 속성을 고려했을 뿐 아니라 기존 동작인식시스템에 비해 시간 정합성이 뛰어나며 시간 변화에 강건한 분류 능력을 보임을 알 수 있다. 제안 모델은 지능형 로봇 에이전트와 같은 생체 기반 시각정보처리 시스템 구축에 기여할 수 있다.

번호판 정규화에 의한 인식 성능 향상 기법 (Recognition Performance Enhancement by License Plate Normalization)

  • 김도현;강민경;차의영
    • 한국정보통신학회논문지
    • /
    • 제12권7호
    • /
    • pp.1278-1290
    • /
    • 2008
  • 본 논문은 자동차 번호판 인식 시스템의 전반적인 성능을 향상시키기 위한 전처리 방법과 신경회로망을 이용한 문자 인식기를 제안한다. 먼저 자동차 번호판 영상에서 번호판의 외곽 직선을 가상 직선 매칭에 의해 검출하고 검출된 직선의 교점을 구하여 4개의 외곽 꼭지점을 구한다. 4개의 꼭지점 좌표에 의해 양선형 변환으로 직사각형 모양의 번호판 영상으로 정규화한다. 정규화된 번호판 영상으로부터 문자를 추출한 뒤 Delta-bar-delta 알고리즘에 의해 학습된 신경 회로망 기반 인식기로 번호판을 인식한다. 다양한 환경에서 획득된 자동차 번호판 영상을 대상으로 실험한 결과 제안된 번호판 이미지의 정규화에 의해 인식 성능이 16%까지 향상됨을 확인하였다.

소규모 합성곱 신경망을 사용한 연령 및 성별 분류 (Age and Gender Classification with Small Scale CNN)

  • ;류재흥
    • 한국전자통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.99-104
    • /
    • 2022
  • 인공지능은 놀라운 이점으로 우리 삶의 중요한 부분을 차지하고 있다. 기계는 이미지에서 물체를 인식하는 것, 특히 사람들을 정확한 나이와 성별 그룹으로 분류하는 것에 있어서 인간을 능가하고 있다. 이러한 측면에서 나이와 성별 분류는 최근 수십 년 동안 컴퓨터 비전 연구자들 사이에서 뜨거운 주제 중 하나였다. 심층 합성곱 신경망(CNN) 모델의 배포는 최첨단 성능을 달성했다. 그러나 대부분의 CNN 기반 아키텍처는 수십 개의 훈련 매개 변수로 매우 복잡하기 때문에 많은 계산 시간과 자원이 필요하다. 이러한 이유로 기존 방법에 비해 훈련 매개 변수와 훈련 시간이 현저히 적은 새로운 CNN기반 분류 알고리즘을 제안한다. 덜 복잡함에도 불구하고 우리 모델은 UTKFace 데이터 세트에서 연령 및 성별 분류의 더 나은 정확도를 보여준다.

스켈레톤 조인트 매핑을 이용한 딥 러닝 기반 행동 인식 (Deep Learning-based Action Recognition using Skeleton Joints Mapping)

  • 타스님;백중환
    • 한국항행학회논문지
    • /
    • 제24권2호
    • /
    • pp.155-162
    • /
    • 2020
  • 최근 컴퓨터 비전과 딥러닝 기술의 발전으로 비디오 분석, 영상 감시, 인터렉티브 멀티미디어 및 인간 기계 상호작용 응용을 위해 인간 행동 인식에 관한 연구가 활발히 진행되고 있다. 많은 연구자에 의해 RGB 영상, 깊이 영상, 스켈레톤 및 관성 데이터를 사용하여 인간 행동 인식 및 분류를 위해 다양한 기술이 도입되었다. 그러나 스켈레톤 기반 행동 인식은 여전히 인간 기계 상호작용 분야에서 도전적인 연구 주제이다. 본 논문에서는 동적 이미지라 불리는 시공간 이미지를 생성하기 위해 동작의 종단간 스켈레톤 조인트 매핑 기법을 제안한다. 행동 클래스 간의 분류를 수행하기 위해 효율적인 심층 컨볼루션 신경망이 고안된다. 제안된 기법의 성능을 평가하기 위해 공개적으로 액세스 가능한 UTD-MHAD 스켈레톤 데이터 세트를 사용하였다. 실험 결과 제안된 시스템이 97.45 %의 높은 정확도로 기존 방법보다 성능이 우수함을 보였다.

딥러닝 기반 미얀마 문자의 특징 추출 및 인식 (Feature Extraction and Recognition of Myanmar Characters Based on Deep Learning)

  • 옴마킨;이성근
    • 한국전자통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.977-984
    • /
    • 2022
  • 최근 동남아시아의 경제발전에 따라 정보기기의 활용이 광범위하게 확산되고 있으며, 지능적 문자인식을 이용한 응용서비스에 대한 수요가 증가하고 있다. 본 논문은 동남아시아 국가 중 하나인 미얀마 문자에 대한 딥러닝 기반 특징 추출 및 인식에 대해 논한다. 특징 추출에는 미얀마 알파벳(33자)과 숫자(10자리)를 사용한다. 본 논문은 9개의 특징을 추출하고 3개 이상의 새로운 특징을 제안한다. 각 문자와 숫자의 특징을 추출하여 성공적인 결과로 표현하였다. 인식 부분에서는 합성곱 신경망을 사용하여 문자 구분에 대한 실행을 평가한다. 제안한 알고리즘은 캡처된 이미지 데이터 세트에 구현되고, 이에 대한 성능을 평가한다. 입력 데이터 세트에 대한 모델의 정밀도는 96%이며 실시간 입력 이미지를 사용한다.

무인항공기 영상 및 딥러닝 기반 객체인식 알고리즘을 활용한 해안표착 폐기물 탐지 기법 연구 (Study on Detection Technique for Coastal Debris by using Unmanned Aerial Vehicle Remote Sensing and Object Detection Algorithm based on Deep Learning)

  • 박수호;김나경;정민지;황도현;엥흐자리갈 운자야;김보람;박미소;윤홍주;서원찬
    • 한국전자통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.1209-1216
    • /
    • 2020
  • 본 연구에서는 무인항공기 원격탐사 기법과 딥러닝 기반 객체인식 알고리즘을 활용한 해안표착폐기물 탐지기법을 제안한다. 항공영상 내에 존재하는 해안표착폐기물을 탐지하기 위해 심층신경망 기반 객체 인식 알고리즘을 제안하였다. PET, 스티로폼, 기타 플라스틱의 3가지 클래스의 이미지 데이터셋으로 심층신경망 모델을 훈련시켰으며, 각 클래스별 탐지 정확도를 Darknet-53과 비교하였다. 이를 통해 해안표착 폐기물을 무인항공기를 통해 성상별 모니터링할 수 있었으며, 향후 본 연구에서 제안하는 방법이 적용될 경우 해변 전체에 대한 성상별 전수조사가 가능하며, 이를 통해 해양환경 감시 분야의 효율성 증대에 기여할 수 있을 것으로 판단된다.