• 제목/요약/키워드: 이미지 인식기법

검색결과 386건 처리시간 0.038초

딥 러닝 기법을 활용한 이미지 내 한글 텍스트 인식에 관한 연구 (Research on Korea Text Recognition in Images Using Deep Learning)

  • 성상하;이강배;박성호
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.1-6
    • /
    • 2020
  • 본 연구에서는 컴퓨터 비전의 분야 중 하나인 문자 인식에 관한 연구를 수행했다. 대표적인 문자인식 기법 중 하나인 광학식 문자 판독 기법의 경우 일정한 규격과 서식에서 벗어나게 되면 인식률이 떨어진다는 한계점이 있다. 따라서 본 연구에서는 딥 러닝 기법을 적용해 이러한 문제점을 해결하고자 한다. 또한 기존의 문자 인식 연구의 경우 대부분 영어 및 숫자 인식에 국한되어 있다. 따라서 본 연구는 한글 인식을 위한 딥 러닝 기반 문자 인식 알고리즘을 제시한다. 알고리즘은 1-NED 평가 방법에서 0.841의 점수를 얻었으며, 이는 영어 인식 결과와 비슷한 수치이다. 본 연구를 통해 딥 러닝 기반 한글 인식 알고리즘의 성능을 확인할 수 있으며, 이를 통해 향후 연구방향에 대해 제시한다.

순위부여를 지원하는 공간배치 표현 기법의 성능평가 (Performance Evaluation of Spatial-match Representation Scheme Supporting Ranking)

  • 김연중;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.253-255
    • /
    • 1998
  • 멀티미디어 정보 검색 응용에 있어서 관련성 있는 멀티미디어 문서를 검색하기 위해 이미지에 대한 내용-본위 검색이 필수적이다. 이를 위하여 이미지를 몇 개의 인식 가능한 심볼 즉, 아이콘으로 표현하고, 주어진 문서를 대표하는 값으로 받아들여 색인을 한다. 사용자가 이미지에 대한 내용-본위 검색을 요구하면, 질의에 있는 이미지를 아이콘으로 변환한 후, 접근 기법을 통하여 원하는 이미지를 검색한다. 이를 위해 많은 아이코닉 표현 기법이 제안되었다. 본 논문에서는 SRR과 기존의 9DLT방법 및 SMR 방법과 검색효율 면에서 성능 비교를 수행한다. 마지막으로 성능 실험을 통하여 제안한 방법이 기존의 9DLT 및 SMR 방법에 비해 정확률 측면에서 약 0.1 재현율 측면에서 약 0.2 만큼 우수함을 보인다.

이미지 내의 텍스트 데이터 인식 정확도 향상을 위한 멀티 모달 이미지 처리 프로세스 (Multi-modal Image Processing for Improving Recognition Accuracy of Text Data in Images)

  • 박정은;주경돈;김철연
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.148-158
    • /
    • 2018
  • 광학 문자 인식(OCR)은 텍스트를 포함한 이미지에서 텍스트 영역을 인식하고 이로부터 텍스트를 추출하는 기술이다. 전체 텍스트 데이터 중 상당히 많은 텍스트 정보가 이미지에 포함되어 있기 때문에 OCR은 데이터 분석 분야에 있어 중요한 전처리 단계를 담당한다. 대부분의 OCR 엔진이, 흰 바탕의 검정 글씨의 단순한 형태를 가진 이미지와 같은, 텍스트와 배경의 구분이 뚜렷한 저 복잡도 이미지에 대해서는 높은 인식률을 보이는 반면, 텍스트와 배경의 구분이 뚜렷하지 않은 고 복잡도 이미지에 대해서는 저조한 인식률을 보이기 때문에, 인식률 개선을 위해 입력 이미지를 OCR 엔진이 처리하기 용이한 이미지로 변형하는 전처리 작업이 필요하게 된다. 따라서 본 논문에서는 OCR 엔진의 정확성 증대를 위해 텍스트 라인별로 이미지를 분리하고, 영상처리 기법 기반의 CLAHE 모듈과 Two-step 모듈을 병렬적으로 수행하여 텍스트와 배경 영역을 효율적으로 분리한 후 텍스트를 인식한다. 이어서 두 모듈의 결과 텍스트에 대하여 N-gram방법과 Hunspell 사전을 결합한 알고리즘으로 인식률을 비교하여 가장 높은 인식률의 결과 텍스트를 최종 결과물로 선정하는 방법론을 제안한다. 대표적인 OCR 엔진인 Tesseract와 Abbyy와의 다양한 비교 실험을 통해 본 연구에서 제안하는 모듈이 복잡한 배경을 가진 이미지에서 가장 정확한 텍스트 인식률을 보임을 보였다.

Light-EBGM(Elastic Bunch Graph Matching) 방법을 이용한 얼굴인식 (Face Recognition using Light-EBGM(Elastic Bunch Graph Matching ) Method)

  • 권만준;전명근
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.138-141
    • /
    • 2004
  • 본 논문은 EBGM(Elastic Bunch Graph Matching)기법을 이용한 얼굴인식에 대해 다룬다. 대용량 영상 정보에 대해 차원 축소를 이용한 얼굴인식 기법인 주성분기법이나 선형판별기법에서는 얼굴 영상 전체의 정보를 이용하는 반면 본 논문에서는 얼굴의 눈, 코, 입 등과 같은 얼굴 특징점에 대해 주파수와 방향각이 다른 여러 개의 가버 커널과 영상 이미지의 컨볼루션(Convolution)의 계수의 집합(Jets)을 이용한 특징 데이터를 이용한다. 하나의 얼굴 영상에 대해서는 모든 영상이 같은 크기의 특징 데이터로 표현되는 Face Graph가 생성되며, 얼굴인식 과정에서는 추출된 제트의 집합에 대해서 상호 유사도(Similarity)의 크기를 비교하여 얼굴인식을 수행한다. 본 논문에서는 기존의 EBGM방법의 Face Graph 생성 과정을 보다 간략화 한 방법을 이용하여 얼굴인식 과정에서 계산량을 줄여 속도를 개선하였다.

  • PDF

전자책 환경을 위한 사회적 어노테이션 및 탐색 지원 기법 (Social Annotation and Navigation Support for Electronic Textbooks)

  • 김재경;손원성
    • 한국멀티미디어학회논문지
    • /
    • 제12권10호
    • /
    • pp.1486-1498
    • /
    • 2009
  • 최근 전자 도서관 분야에서는 기존의 종이책을 디지털 형식으로 변환할 때 원본 문서의 모든 정보를 보존 할 수 있도록 스캐닝을 통한 이미지 기반의 형식을 이용하는데 주력하여왔다. 텍스트 형식의 문서와는 달리 이미지 형식의 문서는 해당 문서가 가진 정보를 쉽게 인식하기 어렵기 때문에 사용자가 접근, 처리 및 검색 등 디지털 문서로서 이미지를 활용하는데 에는 새로운 기법이 요구된다. 본 논문에서는 이미지 기반 문서에서 사용자 정보를 입력할 수 있는 어노테이션 및 사회적 탐색 지원 기법을 적용하여 디지털 문서의 사용성을 높이고, 특히 기존 온라인 교육 시스템에서 문제적으로 지적돼온 학습자의 낮은 참여율을 제안 기법을 통하여 개선하였다. 제안 기법은 현재 대학원 수업에 적용되어 어노테이션 및 사회적 탐색기법이 학습자가 학습 자료를 보다 효율적으로 활용하고 교육 시스템의 활용성을 얼마나 높이는지에 대해 검증하였다.

  • PDF

효율적인 사물 이미지 분류를 위한 계층적 이미지 분류 체계의 설계 및 구현 (Design and Implementation of Hierarchical Image Classification System for Efficient Image Classification of Objects)

  • 유태우;김윤욱;정하민;유현수;안용학
    • 융합보안논문지
    • /
    • 제18권3호
    • /
    • pp.53-59
    • /
    • 2018
  • 본 논문에서는 효율적인 사물 이미지 분류를 위한 계층적 이미지 분류 체계 방안에 대해 제안한다. 기존의 전체 이미지를 한 번에 분류하는 무 계층 이미지 분류에서는 상대적으로 유사한 모양을 가진 사물은 효율적으로 인식하지 못하는 모습을 보여줬다. 따라서 본 논문에서는 사물 이미지에 대해 계층적으로 분류를 시도하는 단계적 계층 구조에서의 이미지 분류 기법을 소개한다. 또한, 실제 시스템에 딥 러닝 이미지 분류가 적용되었을 때 발생할 수 있는 확장성에 대해서 고려하기 위해 확장성이 고려된 효율적인 클래스 구성 방식과 알고리즘도 소개한다. 이와 같은 방식은 상대적으로 유사한 형태를 보인 사물 이미지에 대해 더 높은 신뢰도로 이미지를 분류하는 것을 가능하게 한다.

  • PDF

한국어 및 영어 이미지 캡션이 가능한 범용적 모델 및 목적에 맞는 텍스트를 생성해주는 기법 (A general-purpose model capable of image captioning in Korean and Englishand a method to generate text suitable for the purpose)

  • 조수현;오하영
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1111-1120
    • /
    • 2022
  • Image Captioning은 이미지를 보고 이미지를 언어로 설명하는 문제이다. 해당 문제는 이미지 처리와 자연어 처리 두 가지의 분야를 하나로 묵고 이해하고 하나로 묶어 해결할 수 있는 중요한 문제이다. 또한, 이미지를 자동으로 인식하고 텍스트로 설명함으로써 시각 장애인을 위해 이미지를 텍스트로 변환 후 음성으로 변환하여 주변 환경을 이해하는 데 도움을 줄 수 있으며, 이미지 검색, 미술치료, 스포츠 경기 해설, 실시간 교통 정보 해설 등 많은 곳에 적용할 수 있는 중요한 문제이다. 지금까지의 이미지 캡션 구 방식은 이미지를 인식하고 텍스트화시키는 데에만 집중하고 있다. 하지만 실질적인 사용을 하기 위해 현실의 다양한 환경이 고려되어야 하며 뿐만 아니라 사용하고자 하는 목적에 맞는 이미지 설명을 할 수 있어야 한다. 본 논문에서는 범용적으로 사용 가능한 한국어 및 영어 이미지 캡션 모델과 이미지 캡션 목적에 맞는 텍스트 생성 기법을 제한한다.

이미지 센서와 3축 가속도 센서를 이용한 인간 행동 인식 (Human Activity Recognition using an Image Sensor and a 3-axis Accelerometer Sensor)

  • 남윤영;최유주;조위덕
    • 인터넷정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.129-141
    • /
    • 2010
  • 본 논문에서는 사람의 행동 모니터링을 위한 멀티 센서 기반의 웨어러블 지능형 디바이스를 제안한다. 다중 행동을 인식하기 위해, 이미지 센서와 가속도 센서를 이용하여 행동 인식 알고리즘을 개발하였다. 멀티 센서로부터 얻은 데이터를 분석하기 위해 그리드 기반 옵티컬 플로우 방법을 제안하고 SVM 분류기법을 이용하였다. 이미지 센서로부터 얻은 모션 벡터의 방향과 크기를 이용하였고, 3축 가속도 센서로부터 얻은 데이터에서 FFT의 축과 크기와의 상관관계를 계산하였다. 실험 결과에서 이미지 센서 기반과 3축 가속도 센서기반의 행동 인식률은 각각 55.57 %, 89.97%를 보였으나 제안한 멀티센서기반의 행동인식률은 92.78% 를 보였다.

PCA 기반의 SVM을 이용한 SAR 이미지의 표적 인식에 관한 연구 (A Study on Target Recognition with SAR Image using Support Vector Machine based on Principal Component Analysis)

  • 장하영;이일병
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.434-437
    • /
    • 2011
  • 차세대 지능적 무기체계의 자동화를 목표로 SAR(Synthetic Aperture Radar) 영상 신호를 이용한 표적 인식률 향상을 위한 여러가지 방법들이 제안되어 왔다. 기존의 연구들은 SAR 영상의 고차원 특징을 그대로 사용했기 때문에 표적 인식의 성능저하가 있었다. 본 연구에서는 정보 획득 거리가 길고, 날씨에 제약이 없이 전천후 작전 운용이 가능하도록 레이더의 특징과 고해상도 영상을 결합한 SAR 이미지를 이용한 표적 인식률 향상 방법을 제안한다. 효과적인 표적 인식을 하기위해 고차원의 특징벡터를 저차원의 특징벡터로 축소하는 PCA(Principal Component Analysis)를 기반으로 하는 SVM(Support Vector Machine)을 사용한 표적 인식 기법을 사용하였고, PCA 기반의 SVM 분류기를 이용한 표적 인식이 SVM 만을 사용한 표적 인식보다 향상된 성능을 보인 것을 확인하였다.

실시간 다중 객체 인식 및 추적 기법 (Real-time Multi-Objects Recognition and Tracking Scheme)

  • 김대훈;노승민;황인준
    • 한국항행학회논문지
    • /
    • 제16권2호
    • /
    • pp.386-393
    • /
    • 2012
  • 본 논문에서는 객체의 관심점(interest points)에 대한 지역 특징 기술자를 이용하여 이미지나 동영상에서 다수의 관심 객체를 효과적으로 인식하고 추적하기 위한 기법을 제안한다. 이를 위해 먼저 대상이 되는 객체를 포함하는 다양한 이미지를 수집하고 SURF 알고리즘을 적용하여 객체의 관심점과 그들에 대한 지역 특징 기술자를 생성한다. 지역 특징에 대한 통계적인 분석을 통하여 관심점들 중에서 해당 객체의 특성을 가장 잘 표현하는 대표점(representative points)을 선택하고 이를 바탕으로 이미지에 존재하는 객체를 인식한다. 또한, 지역 특징 기술자의 정합을 응용하여 각 SURF 지점들의 움직임 벡터를 생성하고 이를 기반으로 실시간으로 객체를 추적한다. 제안하는 기법은 모든 객체를 독립적으로 다루기 때문에, 여러 개의 객체를 동시에 인식하고 추적할 수 있다. 다양한 실험을 통해, 동영상에서 객체의 존재 여부 및 종류를 신속하게 판별하고 관심 객체의 추적을 효과적으로 수행할 수 있음을 보인다.