• 제목/요약/키워드: 신경망 기반 이미지 인식

검색결과 83건 처리시간 0.027초

신경망을 이용한 내용 기반 이미지 분류 (A Contents-Based Image Classification Using Neural Network)

  • 이재원;김상균
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.177-180
    • /
    • 2001
  • 본 논문에서는 신경망을 이용한 내용 기반 이미지 분류 방법을 제안한다. 분류 대상이미지는 인터넷상의 다양한 이미지들 중 오브젝트 이미지이대 웹 에이전트를 통하여 획득하고 정규화 과정을 거친다. 획득한 이미지를 분류하기 위한 특징은 웨이블릿 변란 후 추출된 질감 특징이다. 추출된 질감 특징을 이용하여 학습패턴을 생성하고 신경망을 학습한다. 그리고 구성된 신경망 분류기로 이미지를 분류한다. 본 연구에서는 다양한 질감 특징들 중에서 대비(contrast), 에너지(energy), 엔트로피(entropy)를 이용하여 특징을 추출한다. 실험에 사용한 데이터는 30종류에 대하여 각각 10개씩, 300개의 이미지들을 학습 데이터, 테스트 데이터로 사용하여 구성된 분류기의 인식률을 실험하였다.

  • PDF

이미지 패치 기반 합성곱 신경망을 통한 아날로그 게이지 인식 (Analog Gauge Reading with Image Patch-based Convolutional Neural Network)

  • 견민수;백승한;박종일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.95-98
    • /
    • 2022
  • 아날로그 게이지는 여전히 많은 산업 시설에서 사용되고 있지만, 게이지 값을 사람이 수동으로 읽기 때문에 정확히 측정하기 위해 많은 시간이 소모가 되는 문제점이 있다. 이러한 이유로 최근에는 합성곱 신경망을 사용하여 아날로그 게이지 값을 자동으로 인식하는 연구가 진행되고 있다. 그러나 대부분의 선행연구들은 게이지가 촬영된 영상을 그대로 입력으로 사용하고 있으며, 이러한 방법은 사람이 게이지를 읽는 과정을 고려하였을 때 불필요한 부분이 많다. 본 논문에서는 게이지 전체 이미지를 학습에 사용하지 않고, 게이지의 특정 이미지 패치 기반으로 아날로그 게이지 값을 인식하는 방법을 제안한다. 제안하는 방법은 게이지의 중심, 눈금의 최소, 최대, 지침의 좌표를 기반으로 이미지 패치를 생성하고 채널 축으로 병합하여 학습을 진행하였으며, 최종적으로게이지의 각도를 계산한다. 이는 게이지의 평균 각도 오차를 통해 제안한 방법이 게이지 값을 인식하는데 우수한 성능이 보였으며, 게이지 이미지에 장애물이 있는 경우에도 게이지 값을 인식할 수 있음을 확인하였다.

  • PDF

CNN 기반 동물상 인식 모델 구현 (An Implementation of Animal Face Recognition Model based on Convolutional Neural Network)

  • 박용빈;임선영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.645-647
    • /
    • 2022
  • 최근 딥러닝 기반의 이미지 분류는 다양한 산업과 서비스에서 활용되고 있으며, 이미지 인식을 통한 다양한 테스트가 SNS를 통해 인기를 끌고 있다. CNN은 대표적인 이미지 분류를 위한 신경망 모델로 본 연구에서는 사진속의 얼굴에 대해 동물상 인식을 위하여 동물 얼굴 이미지 및 각 동물상을 대표하는 연예인의 이미지를 수집하고, CNN 기반의 동물상 인식 모델을 구현하였다.

신경망과 그래픽 기법을 이용한 심전도 결과지 이미징 시스템 (An ECG Document Imaging System based on Neural Network and Graphic Techniques)

  • 김진상;최상열;배인호;김윤년
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.269-272
    • /
    • 2006
  • 병원의 각종 측정 장비에서 출력되는 결과지나 의사들이 작성한 기록지를 스캔하여 이미지형태로 저장하는 이미징 시스템 개발이 크게 요구되고 있다. 본 논문에서는 신경망과 그래픽 기법을 사용하여 대학병원 심전도실에서 사용되는 여섯 종류의 심전도 출력지를 이미지 형태로 저장하고 검색하는 이미징 시스템의 설계와 구현에 대해 논하였다. 구현된 시스템은 여섯 종류의 심전도 출력지를 분류하고, 분류된 각 출력지에 인쇄된 중요한 측정 데이터를 인식하여 데이터베이스에 저장한다. 심전도 출력지의 분류는 각 샘플 서식들의 평균 히스토그램을 구한 다음 새로운 출력지가 들어올 때 평균 히스토그램과의 거리가 가장 가까운 출력지로 분류하는 nearest-neighbor 방법을 사용하였다. 출력지에 인쇄된 데이터의 인식을 위해 먼저 XML로 작성한 출력지별 추출 정보를 기반으로 스캔한 이미지의 영역 분할 작업을 수행한다. 분할된 영역들은 신경망을 이용해 문자 인식을 하고, 인식된 문자들이 데이터베이스의 해당 속성값으로 저장된다. 스캔한 출력지는 의사들이 주석을 붙이거나 조건 검색을 위해 이미지 형태로 저장된다.

  • PDF

AWS Lambda Serverless Computing 기술을 활용한 효율적인 딥러닝 기반 이미지 인식 서비스 시스템 (An Efficient Deep Learning Based Image Recognition Service System Using AWS Lambda Serverless Computing Technology)

  • 이현철;이성민;김강석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권6호
    • /
    • pp.177-186
    • /
    • 2020
  • 최근 딥러닝(Deep Learning) 기술의 발전에 따라 컴퓨터 비전(Computer Vision) 분야의 이미지 인식 성능이 향상되고 있으며, 또한 Serverless Computing이 이벤트 기반의 클라우드 애플리케이션 개발 및 서비스를 위한 차세대 클라우드 컴퓨팅 기술로 각광받고 있어 딥러닝과 Serverless Computing 기술을 접목하여 실생활에 이미지 인식 서비스를 사용하고자 하는 시도가 증가하고 있다. 따라서 본 논문에서는 Serverless Computing 기술을 활용하여 효율적인 딥러닝 기반 이미지 인식 서비스 시스템 개발 방법을 기술한다. 제안하는 시스템은 Serverless Computing 기반 AWS Lambda Server를 이용하여 적은 비용으로 대형 신경망 모델을 사용자에게 서비스할 수 있는 방법을 제안한다. 또한 AWS Lambda Server의 단점인 Cold Start Time 문제와 용량제한 문제를 해결하여 효과적으로 대형 신경망 모델을 사용하는 Serverless Computing 시스템을 구축할 수 있음을 보인다. 실험을 통해 AWS Lambda Serverless Computing 기술을 활용하여 본 논문에서 제안한 시스템이 비용 절감뿐만 아니라 처리 시간 및 용량제한 문제를 해결하여 대형 신경망 모델을 서비스하기에 효율적인 성능을 보임을 확인하였다.

대안적 통째학습 기반 저품질 레거시 콘텐츠에서의 문자 인식 알고리즘 (Character Recognition Algorithm in Low-Quality Legacy Contents Based on Alternative End-to-End Learning)

  • 이성진;윤준석;박선후;유석봉
    • 한국정보통신학회논문지
    • /
    • 제25권11호
    • /
    • pp.1486-1494
    • /
    • 2021
  • 문자 인식은 스마트 주차, text to speech 등 최근 다양한 플랫폼에서 필요로 하는 기술로써, 기존의 방법과 달리 새로운 시도를 통하여 그 성능을 향상시키려는 연구들이 진행되고 있다. 그러나 문자 인식에 사용되는 이미지의 품질이 낮을 경우, 문자 인식기 학습용 이미지와 테스트 이미지간에 해상도 차이가 발생하여 정확도가 떨어지는 문제가 발생된다. 이를 해결하기 위해 본 논문은 문자 인식 모델 성능이 다양한 품질 데이터에 대하여 강인하도록 이미지 초해상도 및 문자 인식을 결합한 통째학습 신경망을 설계하고, 대안적 통째학습 알고리즘을 구현하여 통째 신경망 학습을 수행하였다. 다양한 문자 이미지 중 차량 번호판 이미지를 이용하여 대안적 통째학습 및 인식 성능 테스트를 진행하였고, 이를 통해 제안하는 알고리즘의 효과를 검증하였다.

인공신경망을 이용한 USB 인식 시스템 (A USB classification system using deep neural networks)

  • 우세형;박지수;은성배;차신
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.535-538
    • /
    • 2022
  • IoT 디바이스의 Plug & Play를 위하여 IoT 디바이스의 대표적인 유선 인터페이스인 USB의 종류를 이미지를 통하여 인식하는 모듈을 개발한다. IoT 디바이스를 구동시키기 위해서는 통신 및 디바이스 하드웨어를 구동하기 위한 드라이버가 필요하다. IoT 디바이스에 연결되는 유선 인터페이스를 스마트폰의 카메라 촬영을 통하여 얻은 이미지를 이용하여서 해당 통신 인터페이스를 인식한다. 대표적인 유선 인터페이스인 USB에 대하여 인공신경망 기반의 기계학습을 통하여 USB의 종류를 분류한다. 인공신경망의 충분한 학습을 위하여 인터넷을 통하여 USB 이미지를 수집하고, 이미지 처리를 통하여 추가적인 이미지 데이터 셋을 확보한다. 합성곱 신경망과 더불어서 다양한 심층 인공신경망으로 인식기를 구현하여서 그 성능을 비교, 평가한다.

  • PDF

소 부류 객체 분류를 위한 CNN기반 학습망 설계 (Training Network Design Based on Convolution Neural Network for Object Classification in few class problem)

  • 임수창;김승현;김연호;김도연
    • 한국정보통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.144-150
    • /
    • 2017
  • 최근 데이터의 지능적 처리 및 정확도 향상을 위해 딥러닝 기술이 응용되고 있다. 이 기술은 다층의 데이터 처리 레이어들로 구성된 계산 모델을 통해 이루어지는데, 이 모델은 여러 수준의 추상화를 거쳐 데이터의 표현을 학습한다. 딥러닝의 한 부류인 컨볼루션 신경망은 인간 행동 추정, 얼굴 인식, 이미지 분류, 음성 인식 같은 연구 분야에서 많이 활용되고 있다. 이미지 분류에 좋은 성능을 보여주는 컨볼루션 신경망은 깊은 학습망과 많은 부류를 이용하면 효과적으로 분류율을 높일수 있지만, 적은 부류의 데이터를 사용할 경우, 과적합 문제가 발생할 확률이 높아진다. 따라서 본 논문에서는 컨볼루션 신경망기반의 소부류의 분류을 위한 학습망을 제작하여 자체적으로 구축한 이미지 DB를 학습시키고, 객체를 분류하는 연구를 실험 하였으며, 1000개의 부류를 분류하기 위해 제작된 기존 공개된 망들과 비교 실험을 통해 기존 망보다 평균 7.06%이상의 상승된 분류율을 보여주었다.

순차 램 기반 누적 신경망을 이용한 수화 인식 (Sign Language recognition Using Sequential Ram-based Cumulative Neural Networks)

  • 이동형;강만모;김영기;이수동
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.205-211
    • /
    • 2009
  • 가중치가 없는 램 기반 신경망은 가중치를 재조정하는 기존 신경망에 비해 계산량 및 인식 시간이 적은 장점을 가지고 있다. 특히 연속적인 연관성을 갖는 제스처와 같은 행위 정보는 각각의 정보들이 시계열적 상관관계를 갖는다. 이와 같은 행위 정보를 인식하려면 일반적으로 많은 계산량과 처리 시간이 요구된다. 이런 문제점을 해결하기 위해 일반적으로 전처리 과정의 삽입 및 하드웨어 인터페이스 활용 등을 이용한다. 본 논문에서는 이와 같은 추가적인 방법 없이 순차 램 기반 누적 신경망으로 연속적인 행위 정보인 한글 복합어 수화 인식 시스템을 구현하였다. 제안된 모델의 성능을 검증하기 위하여 카메라로부터 입력받은 연속적인 복합어 수화 영상을 최소한의 이미지 처리인 경계선 검출만으로 수화 인식을 실험하였다. 경계선 검출 후 이진 영상을 전처리 과정 없이 제안된 순차 램 기반 누적 신경망 시스템으로 처리된 결과는 93%의 인식률을 얻었다.

  • PDF

Unicode 기반 다국어 명함인식기 개발 (A Development of Unicode-based Multi-lingual Namecard Recognizer)

  • 장동협;이재홍
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.117-122
    • /
    • 2009
  • 명함을 이용한 전세계적인 고객 관리 시스템을 구축하기 위해 다국어 명함인식기를 개발하였다. 먼저 다양한 언어의 문자인식 및 학습을 위해 Unicode 기반 문자 이미지 DB를 구축하였으며, 다양한 입력 장치를 통해 획득한 명함 영상에 대하여 정확한 데이터를 얻기 위한 다양한 컬러영상 처리 기술이 적용되었다. 다음에 다층 퍼셉트론 신경망, 언어 유형별 개별 문자인식, 각 언어별 명함에 사용된 필드별 키워드 DB를 이용한 후처리를 적용하여 명함 인식률을 향상시켰다.