• 제목/요약/키워드: Image based localization

검색결과 258건 처리시간 0.022초

A study on Face Image Classification for Efficient Face Detection Using FLD

  • Nam, Mi-Young;Kim, Kwang-Baek
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 SMICS 2004 International Symposium on Maritime and Communication Sciences
    • /
    • pp.106-109
    • /
    • 2004
  • Many reported methods assume that the faces in an image or an image sequence have been identified and localization. Face detection from image is a challenging task because of variability in scale, location, orientation and pose. In this paper, we present an efficient linear discriminant for multi-view face detection. Our approaches are based on linear discriminant. We define training data with fisher linear discriminant to efficient learning method. Face detection is considerably difficult because it will be influenced by poses of human face and changes in illumination. This idea can solve the multi-view and scale face detection problem poses. Quickly and efficiently, which fits for detecting face automatically. In this paper, we extract face using fisher linear discriminant that is hierarchical models invariant pose and background. We estimation the pose in detected face and eye detect. The purpose of this paper is to classify face and non-face and efficient fisher linear discriminant..

  • PDF

Basic Physical Principles and Clinical Applications of Computed Tomography

  • Jung, Haijo
    • 한국의학물리학회지:의학물리
    • /
    • 제32권1호
    • /
    • pp.1-17
    • /
    • 2021
  • The evolution of X-ray computed tomography (CT) has been based on the discovery of X-rays, the inception of the Radon transform, and the development of X-ray digital data acquisition systems and computer technology. Unlike conventional X-ray imaging (general radiography), CT reconstructs cross-sectional anatomical images of the internal structures according to X-ray attenuation coefficients (approximate tissue density) for almost every region in the body. This article reviews the essential physical principles and technical aspects of the CT scanner, including several notable evolutions in CT technology that resulted in the emergence of helical, multidetector, cone beam, portable, dual-energy, and phase-contrast CT, in integrated imaging modalities, such as positron-emission-tomography-CT and single-photon-emission-computed-tomography-CT, and in clinical applications, including image acquisition parameters, CT angiography, image adjustment, versatile image visualizations, volumetric/surface rendering on a computer workstation, radiation treatment planning, and target localization in radiotherapy. The understanding of CT characteristics will provide more effective and accurate patient care in the fields of diagnostics and radiotherapy, and can lead to the improvement of image quality and the optimization of exposure doses.

3차원 거리정보와 DSM의 정사윤곽선 영상 정합을 이용한 무인이동로봇의 위치인식 (Localization of Unmanned Ground Vehicle based on Matching of Ortho-edge Images of 3D Range Data and DSM)

  • 박순용;최성인
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권1호
    • /
    • pp.43-54
    • /
    • 2012
  • 본 논문에서는 야지 환경에서 동작하는 무인이동로봇에서 획득한 3차원 LIDAR (Light Detection and Ranging) 센서 정보와 로봇이 이동하는 지형의 3차원 DSM (Digital Surface Map)에서 정사윤곽선(Ortho-edge) 특징영상을 생성하고 정합하여 로봇의 현재 위치를 추정하는 기술을 제안한다. 최근의 무인이동로봇의 위치 인식에 대한연구는 GPS (Global Positioning System), IMU (Inertial Measurement Unit), LIDAR 등의 위치인식 센서를 융합하는 경우가 많아지고 있다. 특히 LIDAR에서 획득한 거리정보를 ICP(Iterative Closest Point) 기반의 기하정합으로 로봇의 위치를 추정하는 기술이 개발되고 있다. 그러나 이동로봇에서 획득한 센서 정보는 DSM의 센싱 방향과 큰 차이차이가 있어 기존의 기하정합 기술을 사용하는데 어려움이 있다. 본 논문에서는 서로 다른 센싱 방향에서 획득한 3차원 LIDAR 거리정보와 DSM에서 정사윤곽선이라는 특징 영상을 생성하고 이들을 정합하여 로봇의 위치를 추정하는 새로운 기술을 제안한다. DSM으로부터 현재 시점의 정사윤곽선 영상을 생성하는 방법, 전방향 LIDAR 거리센서에서 정사윤곽선 영상을 생성하는 방법, 그리고 정사윤곽선 영상의 정합 기술을 설명하였다. 실험에서는 다양한 주행 경로에 대한 위치 추정의 오차를 분석하고 제안 기술의 성능의 우수성을 보였다.

그레디언트 행렬 고유치의 기하 평균을 이용한 특징점 검출 (Feature Detection using Geometric Mean of Eigenvalues of Gradient Matrix)

  • 예철수
    • 대한원격탐사학회지
    • /
    • 제30권6호
    • /
    • pp.769-776
    • /
    • 2014
  • 동일 대상에 대한 두 영상의 등록을 위해서는 두 영상에 공통적으로 존재하는 특징점을 검출하고 검출된 특징점 간의 대응관계를 찾는 과정이 필수적이다. 본 논문에서는 화소의 밝기 변화를 측정할 수 있는 그레디언트 행렬의 고유치 기하평균에 기반한 새로운 특징점 검출기를 제안한다. 제안하는 특징점 검출기는 그레디언트 행렬의 두 고유치의 기하평균 크기에 비례하고 기하 평균 크기가 동일한 경유 두 고유치의 상대적인 차이에 비례하여 가변적으로 변하는 특성을 가진다. 제안한 특징점 검출기의 성능 평가를 위해 다양한 종류의 코너가 존재하는 합성 영상과 항공 영상을 기준 영상으로 사용하여 코너 검출의 위치 오차를 분석하였다. 제안한 검출기의 위치 오차는 Gaussian smoothing scale 조건하에서 대표적인 코너 검출기인 Harris detector의 위치 오차보다 작은 결과가 얻어졌다.

입체음향 구현을 위한 머리전달함수의 IIR필터 설계 (IIR Filter Design of HRTF for Implementation of 3D Sound)

  • 김판곤;박장식;김현태
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 춘계 종합학술대회 논문집
    • /
    • pp.341-345
    • /
    • 2005
  • 본 논문에서는 FIR 필터를 IIR 필터로 근사시키는 알고리즘을 제안한다. 제안하는 알고리즘은 균형화모델감소법의 개념을 바탕으로 한다. 더미 헤더의 머리전달함수를 32차 IIR 필터로 모델링한다. 근사화된 머리전달함수를 해드폰을 통해 바이노럴 사운드로 재생하면 입체음향이 구현된다. 컴퓨터 시뮬레이션과 DSP 보드를 병행하여 실험하였다. 10명의 피실험자를 대상으로 한 실험을 통해 기존의 FIR 필터를 사용한 경우와 같이 IIR 필터로 구현한 근사화된 머리전달함수를 사용한 경우도 동일하게 인지된 것을 확인할 수 있었다.

  • PDF

빔공간-영역 다채널 비음수 행렬 분해 알고리즘을 이용한 음원 분리 기법 Part II: 빔공간-변환 기법에 대한 고찰 (Audio Source Separation Method based on Beamspace-domain Multichannel Non-negative Matrix Factorization, Part II: A Study on the Beamspace Transform Algorithms)

  • 이석진;박상하;성굉모
    • 한국음향학회지
    • /
    • 제31권5호
    • /
    • pp.332-339
    • /
    • 2012
  • 빔공간 변환(beamspace transform) 기법은 공간 영역의 신호를 입사각 혹은 그 사인함수의 영역으로 변환하는 기법으로, MUSIC과 같은 음원 정위 및 추적(source localization and tracking) 문제나 적응 빔형성(adaptive beamforming)과 같은 문제에서 많이 사용되는 기법이다. 다채널 음원 분리 기법에 사용될 때에는, 음원의 정보 뿐만아니라 해당 음원의 이미지(image)를 재구성하여야 하므로 역변환 기법 또한 중요하다. 본 논문에서는 멀티 채널 음원 분리 기법을 위한 빔공간 변환 기법과 그 역변환 기법에 대하여 고찰하였으며, 특히 빔공간-영역 다채널 비음수 행렬 분해 기법에 적용되었을 때 그 성능에 미치는 영향을 중점적으로 살펴보았다.

케이블 내 근접 결함 추정을 위한 영상 처리 기반의 시간 주파수 영역 반사파 계측법 (Image Processing Based Time-Frequency Domain Reflectometry for Estimating the Fault Location Close to the Applied Signal Point)

  • 정종민;이춘구;윤태성;박진배
    • 전기학회논문지
    • /
    • 제63권12호
    • /
    • pp.1683-1689
    • /
    • 2014
  • In this paper, we propose an image processing based time-frequency domain reflectometry(TFDR) in order to estimate the fault location of a cable. The Wigner-Ville distribution is used for analysis in both the time domain and the frequency domain when the conventional TFDR estimates the fault location in a cable. However, the Winger-Ville distribution is a bi-linear function, and hence the cross-term is occurred. The conventional TFDR cannot estimate the accurate fault location due to the cross-term in case the fault location is close to the position where the reference signal is applied to the cable. The proposed method can reduce the cross-term effectively using binarization and morphological image processing, and can estimate the fault location more accurately using the template matching based cross correlation compared to the conventional TFDR. To prove the performance of the proposed method, the actual experiments are carried out in some cases.

영상 기반 위치 인식을 위한 대규모 언어-이미지 모델 기반의 Bag-of-Objects 표현 (Large-scale Language-image Model-based Bag-of-Objects Extraction for Visual Place Recognition)

  • 정승운;박병재
    • 센서학회지
    • /
    • 제33권2호
    • /
    • pp.78-85
    • /
    • 2024
  • We proposed a method for visual place recognition that represents images using objects as visual words. Visual words represent the various objects present in urban environments. To detect various objects within the images, we implemented and used a zero-shot detector based on a large-scale image language model. This zero-shot detector enables the detection of various objects in urban environments without additional training. In the process of creating histograms using the proposed method, frequency-based weighting was applied to consider the importance of each object. Through experiments with open datasets, the potential of the proposed method was demonstrated by comparing it with another method, even in situations involving environmental or viewpoint changes.

Deep Local Multi-level Feature Aggregation Based High-speed Train Image Matching

  • Li, Jun;Li, Xiang;Wei, Yifei;Wang, Xiaojun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권5호
    • /
    • pp.1597-1610
    • /
    • 2022
  • At present, the main method of high-speed train chassis detection is using computer vision technology to extract keypoints from two related chassis images firstly, then matching these keypoints to find the pixel-level correspondence between these two images, finally, detection and other steps are performed. The quality and accuracy of image matching are very important for subsequent defect detection. Current traditional matching methods are difficult to meet the actual requirements for the generalization of complex scenes such as weather, illumination, and seasonal changes. Therefore, it is of great significance to study the high-speed train image matching method based on deep learning. This paper establishes a high-speed train chassis image matching dataset, including random perspective changes and optical distortion, to simulate the changes in the actual working environment of the high-speed rail system as much as possible. This work designs a convolutional neural network to intensively extract keypoints, so as to alleviate the problems of current methods. With multi-level features, on the one hand, the network restores low-level details, thereby improving the localization accuracy of keypoints, on the other hand, the network can generate robust keypoint descriptors. Detailed experiments show the huge improvement of the proposed network over traditional methods.

격자위상혼합지도방식과 적응제어 알고리즘을 이용한 SLAM 성능 향상 (Increasing the SLAM performance by integrating the grid-topology based hybrid map and the adaptive control method)

  • 김수현;양태규
    • 전기학회논문지
    • /
    • 제58권8호
    • /
    • pp.1605-1614
    • /
    • 2009
  • The technique of simultaneous localization and mapping is the most important research topic in mobile robotics. In the process of building a map in its available memory, the robot memorizes environmental information on the plane of grid or topology. Several approaches about this technique have been presented so far, but most of them use mapping technique as either grid-based map or topology-based map. In this paper we propose a frame of solving the SLAM problem of linking map covering, map building, localizing, path finding and obstacle avoiding in an automatic way. Some algorithms integrating grid and topology map are considered and this make the SLAM performance faster and more stable. The proposed scheme uses an occupancy grid map in representing the environment and then formulate topological information in path finding by A${\ast}$ algorithm. The mapping process is shown and the shortest path is decided on grid based map. Then topological information such as direction, distance is calculated on simulator program then transmitted to robot hardware devices. The localization process and the dynamic obstacle avoidance can be accomplished by topological information on grid map. While mapping and moving, pose of the robot is adjusted for correct localization by implementing additional pixel based image layer and tracking some features. A laser range finer and electronic compass systems are implemented on the mobile robot and DC geared motor wheels are individually controlled by the adaptive PD control method. Simulations and experimental results show its performance and efficiency of the proposed scheme are increased.