• 제목/요약/키워드: Visual Feature Extraction

검색결과 142건 처리시간 0.024초

시각매카니즘을 이용한 지도에서의 파선정보추출기구의 제안 (Extraction Of Dashed Line Information On Maps Using Visual Mechanism)

  • 박시동;김욱현
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.170-177
    • /
    • 1996
  • 본 논문은 고양이와 원숭이의 시각피질에서 보이는 특징추출경로를 모델화하여 지도화상으로부터 파선을 추출하는 파선정보추출용 뉴럴 네트워크를 제안한다. 제안하는 파선정보추출기구는 칼라입력화상을 흑백화상으로 변환한 후, 방향별 직선을 추출한다. 다음으로, 추출된 각 방향별 직선 중 추출하고자 하는 파선보다 긴 직선을 제거한 후, 파선의 성질인 연속된 짧은 직선을 찾아내어 추출한다. 제안하는 뉴럴 네트워크는 국립지리원에서 발행한 1/25,000 축척의 지도에 적용되었으며, 지도화상으로부터 성공적으로 파선 정보를 추출할 수 있음을 보였다.

  • PDF

Trajectory Generation of a Moving Object for a Mobile Robot in Predictable Environment

  • Jin, Tae-Seok;Lee, Jang-Myung
    • International Journal of Precision Engineering and Manufacturing
    • /
    • 제5권1호
    • /
    • pp.27-35
    • /
    • 2004
  • In the field of machine vision using a single camera mounted on a mobile robot, although the detection and tracking of moving objects from a moving observer, is complex and computationally demanding task. In this paper, we propose a new scheme for a mobile robot to track and capture a moving object using images of a camera. The system consists of the following modules: data acquisition, feature extraction and visual tracking, and trajectory generation. And a single camera is used as visual sensors to capture image sequences of a moving object. The moving object is assumed to be a point-object and projected onto an image plane to form a geometrical constraint equation that provides position data of the object based on the kinematics of the active camera. Uncertainties in the position estimation caused by the point-object assumption are compensated using the Kalman filter. To generate the shortest time trajectory to capture the moving object, the linear and angular velocities are estimated and utilized. The experimental results of tracking and capturing of the target object with the mobile robot are presented.

SVM 기법에 기초한 청각장애인의 영어모음 발음을 위한 음성 인식 및 입술형태 특징 추출 (Speech Recognition and Lip Shape Feature Extraction for English Vowel Pronunciation of the Hearing - Impaired Based on SVM Technique)

  • 이근민;한경임;박혜정
    • 재활복지공학회논문지
    • /
    • 제11권3호
    • /
    • pp.247-252
    • /
    • 2017
  • 이 연구의 목적은 SVM 기술에 근거한 시각 보조기에 주로 의존하는 청각 장애인을 위한 영어 모음 발음에 대한 시각 교습 방법을 제안하는데 있다. 귀로 듣기 어려운 소리로부터 SVM 기술을 사용하여 소리 특징을 추출함으로써, 각 모음의 입술 모양이 추출되었다. 모음에 대한 입술 모양의 세련미는 언어 학습자가 발음기의 움직임을 눈으로 쉽게 볼 수 있다는 점에서 유리하며, 청각 장애인을 위한 영어 모음을 학습하고 가르치는 데 유용할 것이다.

An Explainable Deep Learning-Based Classification Method for Facial Image Quality Assessment

  • Kuldeep Gurjar;Surjeet Kumar;Arnav Bhavsar;Kotiba Hamad;Yang-Sae Moon;Dae Ho Yoon
    • Journal of Information Processing Systems
    • /
    • 제20권4호
    • /
    • pp.558-573
    • /
    • 2024
  • Considering factors such as illumination, camera quality variations, and background-specific variations, identifying a face using a smartphone-based facial image capture application is challenging. Face Image Quality Assessment refers to the process of taking a face image as input and producing some form of "quality" estimate as an output. Typically, quality assessment techniques use deep learning methods to categorize images. The models used in deep learning are shown as black boxes. This raises the question of the trustworthiness of the models. Several explainability techniques have gained importance in building this trust. Explainability techniques provide visual evidence of the active regions within an image on which the deep learning model makes a prediction. Here, we developed a technique for reliable prediction of facial images before medical analysis and security operations. A combination of gradient-weighted class activation mapping and local interpretable model-agnostic explanations were used to explain the model. This approach has been implemented in the preselection of facial images for skin feature extraction, which is important in critical medical science applications. We demonstrate that the use of combined explanations provides better visual explanations for the model, where both the saliency map and perturbation-based explainability techniques verify predictions.

모바일 시각 검색 시스템의 성능 향상을 위하여 개선된 Speeded Up Robust Features(SURF) 알고리듬 (Modified Speeded Up Robust Features(SURF) for Performance Enhancement of Mobile Visual Search System)

  • 서정진;윤경로
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.388-399
    • /
    • 2012
  • 본 논문에서는 지역 특징 추출 방법 중 하나인 SURF를 개선시켜 모바일 환경에 적합한 특징 추출 및 정합 방법에 대하여 기술한다. 모바일 환경에서 최적의 성능을 내기 위해 크게 세 가지 방법을 제안한다. 첫 번째는 SURF 기술자의 차원을 축소시키는 방법이다. 기존의 64차원과 여러 차원의 기술자들의 성능을 비교 분석한다. 두 번째로 고속 헤시안 검출기에서 헤시안 행렬의 대각합을 통해 계산되는 라플라시안 부호를 사용하여 정합 성능을 높인다. 즉, 부호가 같으면 같은 특성의 특징점으로 여겨 정합하고 그렇지 않으면 정합하지 않는다. 세 번째는 특징점간의 거리 측정 시 사용하는 거리 비율을 실험하고, 실험을 통해 얻어진 거리 비율을 사용하여 정합의 성능을 높였다. 마지막으로, 기존의 시스템과 제안한 시스템의 성능을 비교하여 제안한 시스템의 성능 향상을 검증하고, 제안한 시스템이 비교적 정합률의 성능 저하 없이 응답속도를 크게 개선함을 보였다.

광류를 사용한 빠른 자연특징 추적 (Fast Natural Feature Tracking Using Optical Flow)

  • 배병조;박종승
    • 정보처리학회논문지B
    • /
    • 제17B권5호
    • /
    • pp.345-354
    • /
    • 2010
  • 시각기반 증강현실을 구현하기 위한 추적 방법들은 정형 패턴 마커를 가정하는 마커 추적기법과 영상 특징점을 추출하여 이를 추적하는 자연특징 추적기법으로 분류된다. 마커 추적기법은 빠른 마커의 추출 및 인식이 가능하여 모바일 기기에서도 실시간 처리가 가능하다. 한편 자연 특징 추적기법의 경우는 입력 영상의 다양성을 고려해야 하므로 계산량이 많은 처리과정을 거쳐야 한다. 따라서 저사양의 모바일 기기에서는 빠른 실시간 처리에 어려움이 있다. 기존의 자연특징 추적에서는 입력되는 카메라 영상의 매 프레임마다 특징점을 추출하고 패턴매칭 과정을 거친다. 다수의 자연특징점들을 추출하는 과정과 패턴매칭 과정은 계산량이 많아 실시간 응용에 많은 제약을 가하는 요인으로 작용한다. 특히 등록된 패턴의 개수가 증가될수록 패턴매칭 과정의 처리시간도 증가하게 된다. 본 논문에서는 이러한 단점을 해결하고자 자연특징 추적 과정에 광류를 사용하여 모바일 기기에서의 실시간 동작이 가능하도록 하였다. 패턴매칭에 사용된 특징점들은 다음의 연속 프레임에서 광류추적 기법을 적용하여 대응점들을 빠르게 찾도록 하였다. 또한 추적 과정에서 소실되는 특징점의 수에 비례하여 새로운 특징점들을 추가하여 특징점의 전체 개수는 일정 수준으로 유지되도록 하였다. 실험 결과 제안하는 추적 방법은 자연특징점 추적 시간을 상당히 단축시킬 뿐만 아니라 카메라 자세 추정 결과도 더욱 안정시킴을 보여주었다.

A Survey of Real-time Road Detection Techniques Using Visual Color Sensor

  • Hong, Gwang-Soo;Kim, Byung-Gyu;Dogra, Debi Prosad;Roy, Partha Pratim
    • Journal of Multimedia Information System
    • /
    • 제5권1호
    • /
    • pp.9-14
    • /
    • 2018
  • A road recognition system or Lane departure warning system is an early stage technology that has been commercialized as early as 10 years but can be optional and used as an expensive premium vehicle, with a very small number of users. Since the system installed on a vehicle should not be error prone and operate reliably, the introduction of robust feature extraction and tracking techniques requires the development of algorithms that can provide reliable information. In this paper, we investigate and analyze various real-time road detection algorithms based on color information. Through these analyses, we would like to suggest the algorithms that are actually applicable.

Improved Bimodal Speech Recognition Study Based on Product Hidden Markov Model

  • Xi, Su Mei;Cho, Young Im
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권3호
    • /
    • pp.164-170
    • /
    • 2013
  • Recent years have been higher demands for automatic speech recognition (ASR) systems that are able to operate robustly in an acoustically noisy environment. This paper proposes an improved product hidden markov model (HMM) used for bimodal speech recognition. A two-dimensional training model is built based on dependently trained audio-HMM and visual-HMM, reflecting the asynchronous characteristics of the audio and video streams. A weight coefficient is introduced to adjust the weight of the video and audio streams automatically according to differences in the noise environment. Experimental results show that compared with other bimodal speech recognition approaches, this approach obtains better speech recognition performance.

A Deep Learning-Based Image Semantic Segmentation Algorithm

  • Chaoqun, Shen;Zhongliang, Sun
    • Journal of Information Processing Systems
    • /
    • 제19권1호
    • /
    • pp.98-108
    • /
    • 2023
  • This paper is an attempt to design segmentation method based on fully convolutional networks (FCN) and attention mechanism. The first five layers of the Visual Geometry Group (VGG) 16 network serve as the coding part in the semantic segmentation network structure with the convolutional layer used to replace pooling to reduce loss of image feature extraction information. The up-sampling and deconvolution unit of the FCN is then used as the decoding part in the semantic segmentation network. In the deconvolution process, the skip structure is used to fuse different levels of information and the attention mechanism is incorporated to reduce accuracy loss. Finally, the segmentation results are obtained through pixel layer classification. The results show that our method outperforms the comparison methods in mean pixel accuracy (MPA) and mean intersection over union (MIOU).

COLORNET: Importance of Color Spaces in Content based Image Retrieval

  • Judy Gateri;Richard Rimiru;Micheal Kimwele
    • International Journal of Computer Science & Network Security
    • /
    • 제23권5호
    • /
    • pp.33-40
    • /
    • 2023
  • The mainstay of current image recovery frameworks is Content-Based Image Retrieval (CBIR). The most distinctive retrieval method involves the submission of an image query, after which the system extracts visual characteristics such as shape, color, and texture from the images. Most of the techniques use RGB color space to extract and classify images as it is the default color space of the images when those techniques fail to change the color space of the images. To determine the most effective color space for retrieving images, this research discusses the transformation of RGB to different color spaces, feature extraction, and usage of Convolutional Neural Networks for retrieval.