• 제목/요약/키워드: image feature extraction

검색결과 1,017건 처리시간 0.027초

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.

휴대용 전자 후각 장치에서 다채널 마이크로 센서 신호의 영상 정합을 이용한 가스 인식 (Vapor Recognition Using Image Matching of Micro-Array Sensor Response from Portable Electronic Nose)

  • 양윤석
    • 전자공학회논문지SC
    • /
    • 제48권2호
    • /
    • pp.64-70
    • /
    • 2011
  • 휴대용 인공 전자 후각 시스템 (E-nose)의 가스 측정 환경은 실험실 내의 정교하게 제어되는 환경과 달리 온도, 농도, 기체 시료의 유속 등의 외부 요인의 변동이 매우 심하다. 이런 환경에서도 사용 가능한 단순하고 강인하고 정확한 가스 패턴 인식 알고리듬의 개발은 마이크로 바이오 센서의 발달과 함께 확대되고 있는 휴대용 및 소형 측정 진단 시스템에 있어 매우 중요하다. 본 연구에서는 PDA 기반의 휴대용 전자 후각 시스템을 활용해 실제 변화하는 환경에서 다채널 마이크로 센서로부터 감지되는 가스 신호를 수집하고, 여기에 영상 정합 기법을 적용하여 알고리듬의 강인성과 향상된 정확도를 검증하는 것을 목표로 하였다. 제안된 방법을 6종류의 가스 시료에 대한 7채널 마이크로 센서의 휴대 환경 측정 데이터에 적용하고, 기존의 최대 민감도 특징 추출 기법과 비교한 결과, 외부 환경의 변동에 영향 받지 않는 안정된 인식 성능 뿐 아니라 기존의 방법으로 구별하기 어렵던 2 종의 유사한 가스 시료에 대해서도 정확한 구분이 가능함을 보였다. 제안된 방법은 다양한 환경 변화에 노출되는 유비쿼터스 센서 네트워크 (USN)의 데이터 처리에도 쉽게 응용될 수 있을 것이며, 응용 현장에서 높은 안정성과 정확성을 요구하는 휴대용 의료 진단, 환경 감지 기술의 실용화에 큰 도움을 줄 수 있을 것으로 기대한다.

제품의 특성추출을 통한 디자인 적용 방법에 관한 연구 (A Study of Feature-Extraction from the Specifically Intended Product Designs)

  • 형성은;조운대;조광수
    • 감성과학
    • /
    • 제10권1호
    • /
    • pp.87-98
    • /
    • 2007
  • 본 연구의 목적은 특정 목적을 가진 제품들의 특성들을 파악하여 디자인 개발시 이러한 특성들을 제품 컨셉 또는 디자인 형태에 응용하고자 함이다. 이를 위해 먼저 실험 대상을 설정하였고, 실험 대상을 선택한 후 실험 대상에 관한 기초 설문과 실험 대상 이미지 분석을 실시하였다. 이후 실험 대상의 디자인과 기능적 요소를 추출하여 코딩하였다. 그리고 실험 대상의 이미지분석 후 얻은 요소와 실험 대상의 요소의 관계를 증명하였으며, 실험 대상의 특성 추출을 위한 설문을 실시하였다. 이러한 실험 프로세스를 거쳐 특정한 제품에 특성들을 추출함으로써 디자인 개발 시 소비자 니즈의 분석이 가능하며, 제품을 이해하는 기초 자료로 사용이 가능하다. 또한 디자이너가 제품을 쉽게 이해하고 디자인 개발 시 컨셉 설정에 큰 기초가 된다. 본 연구의 MP3의 경우 MP3의 이미지 분석 결과 음악성, 확장성, 휴대성, 사용성, 신체 부담감, 인터페이스, 그리고 개성으로 나타났으며, 이들과 각각 연관된 특성들을 찾았다. 이로써 MP3를 디자인할 때 중요 특성들을 제시하였다. 이러한 기초 연구를 통해 보다 효과적인 소비자 니즈 파악이 가능하고, 디자인 기초 학문 발전을 가져올 것이다.

  • PDF

비가시성과 유사도 증가를 통한 강인한 패턴 워터마킹 방법 (A Robust Pattern Watermarking Method by Invisibility and Similarity Improvement)

  • 이경훈;김용훈;이태홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권10호
    • /
    • pp.938-943
    • /
    • 2003
  • 본 논문에서는 Tikhonov-Miller 처리를 이용하여 다양한 공격에 대해서 워터마킹의 강인성을 향상시키는 방법을 제안한다. 시각적으로 판별할 수 있는 패턴 워터마크를 웨이브릿 변환 영역에서 수평(LH2), 수직(HL2), 대각(HH2) 성분의 부대역에 임계치를 기준으로 가중치를 달리 부여하여 삽입한다. 또한 인간 시각 시스템의 특징을 이용하여 워터마크를 삽입한다. 삽입한 워터마크는 보안성과 높은 추출율을 위해 무작위로 섞었다. 그런 다음 섞어 짜 맞추기(Interlace)를 했다. 제안한 방법의 강인성과 유사성 향상을 입증하기 위해 명암, 크기 변화, 필터링, 잘라내기, 히스토그램 평활화, 손실압축(JPEG, gif)과 같은 영상처리를 하였다. 실험 결과 제안한 방법은 비가시성을 고려하여 강인하게 워터마크를 삽입할 수 있고 여러 공격에 대해서 더욱 높은 상관 계수로 추출할 수 있었다.

한글 외곽선 폰트의 자소 분할 (Hangul Component Decomposition in Outline Fonts)

  • 구상옥;정순기
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제17권4호
    • /
    • pp.11-21
    • /
    • 2011
  • 본 논문은 한글 외곽선 폰트를 입력으로 글자의 초성, 중성, 종성 요소(컴포넌트)를 통계적-구조적 정보를 이용하여 분할하는 방법을 제안한다. 한 폰트 내에서 한글 컴포넌트는 통계적으로 일정한 위치에 나타나며, 각 컴포넌트를 이루는 획 간의 관계는 그 컴포넌트의 구조적 특징을 나타낸다. 우리는 먼저 각 컴포넌트의 위치를 저장하는 컴포넌트 히스토그램을 생성하여 컴포넌트 위치에 관한 통계 정보를 저장하였다. 그리고 글자의 구조적 정보를 반영하기 위해 픽셀의 방향성 확률을 기반으로 픽셀클러스터를 만들고, 클러스터의 위치, 방향 및 크기, 클러스터간 인접성 정보를 이용하여 후보 획을 추출하였다. 마지막으로 릴렉세이션 레이블링을 통해 후보 획 집합과 미리 정의된 글자 모델 간의 가장 적합한 구조적 매치를 구하였다. 본 논문에서 제안한 컴포넌트 분할방법은 한글 폰트의 조형적 특징에 관한 연구 및 이를 활용한 폰트분류 빛 폰트검색에 활용될 수 있다.

On Motion Planning for Human-Following of Mobile Robot in a Predictable Intelligent Space

  • Jin, Tae-Seok;Hashimoto, Hideki
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제4권1호
    • /
    • pp.101-110
    • /
    • 2004
  • The robots that will be needed in the near future are human-friendly robots that are able to coexist with humans and support humans effectively. To realize this, humans and robots need to be in close proximity to each other as much as possible. Moreover, it is necessary for their interactions to occur naturally. It is desirable for a robot to carry out human following, as one of the human-affinitive movements. The human-following robot requires several techniques: the recognition of the moving objects, the feature extraction and visual tracking, and the trajectory generation for following a human stably. In this research, a predictable intelligent space is used in order to achieve these goals. An intelligent space is a 3-D environment in which many sensors and intelligent devices are distributed. Mobile robots exist in this space as physical agents providing humans with services. A mobile robot is controlled to follow a walking human using distributed intelligent sensors as stably and precisely as possible. The moving objects is assumed to be a point-object and projected onto an image plane to form a geometrical constraint equation that provides position data of the object based on the kinematics of the intelligent space. Uncertainties in the position estimation caused by the point-object assumption are compensated using the Kalman filter. To generate the shortest time trajectory to follow the walking human, the linear and angular velocities are estimated and utilized. The computer simulation and experimental results of estimating and following of the walking human with the mobile robot are presented.

신경망을 이용한 로버스트 주성분 분석에 관한 연구 (On Robust Principal Component using Analysis Neural Networks)

  • 김상민;오광식;박희주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제7권1호
    • /
    • pp.113-118
    • /
    • 1996
  • 주성분 분석은 자료압축, 특징추출, 통신이론, 패턴인식 그리고 화상처리등의 컴퓨터 공학분야에서 중요하게 사용되고 있다. Oja(1982,1989,1992)는 확률적 경사 강하법(SGA:Stochastic Gradient Ascent)을 이용한 제한된 헵규칙을 제안하여 주성분 분석에 사용하였다. 그러나, 이 규칙은 이상치에 민감하므로 이상치의 영향을 줄이기 위해, Xu & Yuille(1995)는 통계물리 방법을 이용한 로버스트 에너지함수를 생성하여 로버스트 주성분 분석방법을 제안하였다. 또한 Devlin et.al(1981)은 M-추정량을 이용하여 주성분 분석을 하였다. 본 논문에서는 Oja(1992)의 규칙과 Xu & Yuille(1995)의 로버스트 에너지함수를 이용하여 신경망을 구성하였다. 그리고, Devlin et.al(1981)이 제안한 시뮬레이션조건하에서 실험을 하였다. 실험한 결과와 Devlin et.al(1981)의 결과를 비교, 분석함으로써, 신경망의 성능을 확인하고자 한다.

  • PDF

오디오의 Peak 특징을 이용한 동일 영화 콘텐츠 검색 (Similar Movie Contents Retrieval Using Peak Features from Audio)

  • 정명범;성보경;고일주
    • 한국멀티미디어학회논문지
    • /
    • 제12권11호
    • /
    • pp.1572-1580
    • /
    • 2009
  • 검색을 위해 동영상 데이터 전체를 이용하면 많은 시간과 저장 공간이 필요하다. 이를 보완하고자 기존의 동일 영화 검색은 영상 정보의 일부를 이용하여 동일한 영상 검색에 사용해 왔다. 그러나 이 방법은 같은 영상임에도 비디오 부호화기이나 해상도가 다른 경우 전혀 다른 영상으로 인식한다. 따라서 본 논문에서는 동영상의 오디오 정보를 이용하여 동일한 동영상을 찾는 알고리즘을 제안한다. 제안 방법은 부호화율, 부호화기, 샘플링 수의 변화에도 유사한 파형을 형성하는 Peak 정보를 바탕으로 데이터베이스에 색인하고, 검색한다. 논문에서는 제안 방법의 성능을 확인하기 위해 1,000개의 동영상 데이터를 검색 실험하였으며, 92.1%의 성공률을 나타내었다.

  • PDF

스켈레톤 벡터 정보와 RNN 학습을 이용한 행동인식 알고리즘 (Using Skeleton Vector Information and RNN Learning Behavior Recognition Algorithm)

  • 김미경;차의영
    • 방송공학회논문지
    • /
    • 제23권5호
    • /
    • pp.598-605
    • /
    • 2018
  • 행동 인식은 데이터를 통해 인간의 행동을 인식하는 기술로서 비디오 감시 시스템을 통한 위험 행동과 같은 어플리케이션에 활용되어 질 수 있다. 기존의 행동 인식 알고리즘은 2차원 카메라를 통한 영상이나 다중모드 센서, 멀티 뷰와 같은 장비를 이용한 방법을 사용하거나 3D 장비를 이용하여 이루어져 왔다. 2차원 데이터를 사용한 경우 3차원 공간의 행위 인식에서는 가려짐과 같은 현상으로 낮은 인식율을 보였고 다른 방법은 복잡한 장비의 구성이나 고가의 추가적인 장비로 인한 어려움이 많았다. 본 논문은 RGB와 Depth 정보만을 이용하여 추가적인 장비 없이 CCTV 영상만으로 인간의 행동을 인식하는 방법을 제안한다. 먼저 RGB 영상에서 스켈레톤 추출 알고리즘을 적용하여 관절과 신체부위의 포인트를 추출한다. 이를 식을 적용하여 변위 벡터와 관계 벡터를 포함한 벡터로 변형한 후 RNN 모델을 통하여 연속된 벡터 데이터를 학습한다. 학습된 모델을 다양한 데이터 세트에 적용하여 행동 인식 정확도를 확인한 결과 2차원 정보만으로 3차원 정보를 이용한 기존의 알고리즘과 유사한 성능을 입증할 수 있었다.

Environmental IoT-Enabled Multimodal Mashup Service for Smart Forest Fires Monitoring

  • Elmisery, Ahmed M.;Sertovic, Mirela
    • Journal of Multimedia Information System
    • /
    • 제4권4호
    • /
    • pp.163-170
    • /
    • 2017
  • Internet of things (IoT) is a new paradigm for collecting, processing and analyzing various contents in order to detect anomalies and to monitor particular patterns in a specific environment. The collected data can be used to discover new patterns and to offer new insights. IoT-enabled data mashup is a new technology to combine various types of information from multiple sources into a single web service. Mashup services create a new horizon for different applications. Environmental monitoring is a serious tool for the state and private organizations, which are located in regions with environmental hazards and seek to gain insights to detect hazards and locate them clearly. These organizations may utilize IoT - enabled data mashup service to merge different types of datasets from different IoT sensor networks in order to leverage their data analytics performance and the accuracy of the predictions. This paper presents an IoT - enabled data mashup service, where the multimedia data is collected from the various IoT platforms, then fed into an environmental cognition service which executes different image processing techniques such as noise removal, segmentation, and feature extraction, in order to detect interesting patterns in hazardous areas. The noise present in the captured images is eliminated with the help of a noise removal and background subtraction processes. Markov based approach was utilized to segment the possible regions of interest. The viable features within each region were extracted using a multiresolution wavelet transform, then fed into a discriminative classifier to extract various patterns. Experimental results have shown an accurate detection performance and adequate processing time for the proposed approach. We also provide a data mashup scenario for an IoT-enabled environmental hazard detection service and experimentation results.