• 제목/요약/키워드: Feature point extraction

검색결과 266건 처리시간 0.029초

4D 이미징 레이더의 저밀도 PCD 데이터 군집화와 각 군집에 복셀 특징 추출 기법을 적용한 3D 객체 인식 기법 (3D Object Detection with Low-Density 4D Imaging Radar PCD Data Clustering and Voxel Feature Extraction for Each Cluster)

  • 오차영;권순재;정현정;정구민
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권6호
    • /
    • pp.471-476
    • /
    • 2022
  • 본 논문은 악천후에 약한 카메라와 라이다(LiDAR)의 문제점을 해결하기 위해 개발된 4D 이미징 레이더를 활용한 객체 인식 기법을 제안한다. 4D 이미징 레이더를 통해 데이터를 측정 및 수집하는 경우 라이다 데이터보다 포인트 클라우드 데이터의 밀도가 낮다는 단점이 있다. 밀도가 낮아 객체 사이의 거리가 넓은 특성을 이용하여, 객체를 군집화하고 해당 군집에서 voxel을 통해 객체의 특징을 추출하는 기법을 제안한다. 또한, 추출된 특징을 이용한 객체 인식 기법을 제안한다.

Bird's Eye View Semantic Segmentation based on Improved Transformer for Automatic Annotation

  • Tianjiao Liang;Weiguo Pan;Hong Bao;Xinyue Fan;Han Li
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권8호
    • /
    • pp.1996-2015
    • /
    • 2023
  • High-definition (HD) maps can provide precise road information that enables an autonomous driving system to effectively navigate a vehicle. Recent research has focused on leveraging semantic segmentation to achieve automatic annotation of HD maps. However, the existing methods suffer from low recognition accuracy in automatic driving scenarios, leading to inefficient annotation processes. In this paper, we propose a novel semantic segmentation method for automatic HD map annotation. Our approach introduces a new encoder, known as the convolutional transformer hybrid encoder, to enhance the model's feature extraction capabilities. Additionally, we propose a multi-level fusion module that enables the model to aggregate different levels of detail and semantic information. Furthermore, we present a novel decoupled boundary joint decoder to improve the model's ability to handle the boundary between categories. To evaluate our method, we conducted experiments using the Bird's Eye View point cloud images dataset and Cityscapes dataset. Comparative analysis against stateof-the-art methods demonstrates that our model achieves the highest performance. Specifically, our model achieves an mIoU of 56.26%, surpassing the results of SegFormer with an mIoU of 1.47%. This innovative promises to significantly enhance the efficiency of HD map automatic annotation.

Prediction of Closed Quotient During Vocal Phonation using GRU-type Neural Network with Audio Signals

  • Hyeonbin Han;Keun Young Lee;Seong-Yoon Shin;Yoseup Kim;Gwanghyun Jo;Jihoon Park;Young-Min Kim
    • Journal of information and communication convergence engineering
    • /
    • 제22권2호
    • /
    • pp.145-152
    • /
    • 2024
  • Closed quotient (CQ) represents the time ratio for which the vocal folds remain in contact during voice production. Because analyzing CQ values serves as an important reference point in vocal training for professional singers, these values have been measured mechanically or electrically by either inverse filtering of airflows captured by a circumferentially vented mask or post-processing of electroglottography waveforms. In this study, we introduced a novel algorithm to predict the CQ values only from audio signals. This has eliminated the need for mechanical or electrical measurement techniques. Our algorithm is based on a gated recurrent unit (GRU)-type neural network. To enhance the efficiency, we pre-processed an audio signal using the pitch feature extraction algorithm. Then, GRU-type neural networks were employed to extract the features. This was followed by a dense layer for the final prediction. The Results section reports the mean square error between the predicted and real CQ. It shows the capability of the proposed algorithm to predict CQ values.

무인항공기 영상 활용 자동 정합점 추출을 통한 KOMPSAT-3A 위성영상의 RPC 보정 (RPC Correction of KOMPSAT-3A Satellite Image through Automatic Matching Point Extraction Using Unmanned AerialVehicle Imagery)

  • 박주언;김태헌;이창희;한유경
    • 대한원격탐사학회지
    • /
    • 제37권5_1호
    • /
    • pp.1135-1147
    • /
    • 2021
  • 고해상도 위성영상의 기하보정을 위해 촬영 당시의 위성 센서와 지표면과의 기하학적 관계를 복원하는 센서모델링 과정이 필요하다. 이를 위해 일반적으로 고해상도 위성은 RPC (Rational Polynomial Coefficient) 정보를 제공하고 있지만, 제공 RPC는 위성 센서의 위치와 자세 등에 의해 발생하는 기하왜곡을 포함하고 있다. 이러한 RPC 오차를 보정하기 위해 일반적으로 지상기준점(Ground Control Points)을 활용한다. 지상기준점을 수집하는 대표적인 방법으로 현장 측량을 통해 지상좌표를 취득하지만, 이는 위성영상의 품질이나 촬영 시기에 따른 토지피복의 변화, 기복변위 등으로 위성영상 내에서 지상기준점을 판독하기에 어려운 문제가 있다. 이에 최근에는 다양한 센서로부터 취득된 영상지도를 참조자료로 이용하여, 영상정합 기법을 통해 지상기준점 수집을 자동화할 수 있다. 본 연구에서는 무인항공기 영상을 활용하여 추출된 정합점을 통해 KOMPSAT-3A 위성영상의 RPC를 보정하고자 한다. 무인항공기 영상과 KOMPSAT-3A 위성영상의 정합점 추출을 위한 전처리 방법을 제안하고, 대표적인 특징기반 정합기법(Feature-based matching method)과 영역기반 정합기법(Area-based matching method)인 SURF (Speeded-Up Robust Features)와 위상상관(Phase Correlation) 기법을 각각 적용하여 추출된 정합점의 특성을 비교하였다. 각 기법을 통해 추출된 정합점을 활용하여 RPC 보정계수를 산출한 후, GNSS (Global Navigation Satellite System) 측량을 통해 직접 취득한 검사점에 적용하여 KOMPSAT-3A의 기하품질을 향상하였다. 제안기법의 성능 및 활용성 검증을 위해 GCP를 이용하여 보정한 결과와 비교하여 분석하였다. GCP 기반 보정 방법은 제공 RPC보다 Sample은 2.14 pixel, Line은 5.43 pixel 만큼 개선된 보정 정확도를 보였다. 그리고 SURF와 위상상관 기법을 활용한 제안기법은 제공 RPC보다 각각 Sample은 0.83 pixel, 1.49 pixel만큼 보정되었으며, Line은 4.81 pixel, 5.19 pixel만큼 개선되었다. 이를 통해 GCP 기반 위성영상 RPC 보정 방법의 대안으로 무인항공기 영상이 활용될 수 있음을 확인하였다.

랜드마크 코너 추출을 적용한 모바일 카메라 기반 위치결정 기법 (Mobile Camera-Based Positioning Method by Applying Landmark Corner Extraction)

  • 이유진;윤완상;이수암
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1309-1320
    • /
    • 2023
  • 모바일 기기의 기술 발전과 대중화는 어디서든 사용자의 위치를 확인할 수 있으며 인터넷을 사용할 수 있도록 발전되었다. 그러나 실내의 경우 인터넷은 끊김없이 사용할 수 있지만 global positioning system (GPS) 기능은 활용하기 어렵다. 실내 공공장소인 백화점, 박물관, 컨퍼런스장, 학교, 터널 등 GPS가 수신되지 않는 음영 지역에서 실시간 위치정보 제공의 필요성이 증가하고 있다. 이에 따라 최근의 실내 측위 기술은 랜드마크 데이터베이스를 구축하기 위해 light detection and ranging (LiDAR) 장비를 기반으로 연구가 증가하고 있다. 본 연구에서는 랜드마크 데이터베이스 구축의 접근성에 초점을 두어 모바일 기기를 기반으로 랜드마크를 촬영한 단일 이미지와 사전에 구축된 랜드마크 데이터베이스 정보를 이용하여 사용자의 위치를 추정하는 기법을 개발하고자 하였다. 첫 번째로, 랜드마크 데이터베이스를 구축하였다. 랜드마크를 촬영한 모바일 이미지만으로 사용자 위치를 추정하기 위해서는 모바일 이미지에서 랜드마크 검출이 필수적이고, 검출된 랜드마크에서 고정적인 성격을 가진 지점의 지상좌표 취득이 필수적이다. 두 번째 단계에서는 bag of words (BoW) 영상 검색 기술을 적용해 랜드마크 데이터베이스 중 모바일 이미지가 촬영한 랜드마크를 유사한 4위까지 검색하였다. 세 번째 단계에서는 scale invariant feature transform (SIFT) 특징점 추출 기법과 Homography random sample consensus (RANSAC)을 통해 검색된 4개의 후보 랜드마크들 중 가장 유사한 하나의 랜드마크를 선정하였고, 이때 임계값 설정을 통해 정합점 수를 기반으로 한 차례 더 필터링을 수행하였다. 네 번째 단계에서는 대응된 랜드마크와 모바일 이미지간의 Homography 행렬을 통해 랜드마크 이미지를 모바일 이미지에 투사하여 랜드마크의 영역과 코너(외곽선)점을 검출하였다. 마지막으로, 위치추정 기법을 통해 사용자의 위치를 추정하였다. 해당 기술의 성능을 분석한 결과, 랜드마크 검색 성능은 약 86%로 측정되었다. 위치추정 결과와 사용자의 실제 지상좌표를 비교한 결과, 약 0.56 m의 수평 위치 정확도를 갖는 것이 확인되어 별도의 고가 장비 없이 랜드마크 데이터베이스를 구축하여 모바일 영상으로 사용자 위치 추정이 가능한 것을 확인하였다.

다수의 영상간 효율적인 스티칭을 위한 카메라 센서 정보 기반 영상 그룹핑 기술 (Images Grouping Technology based on Camera Sensors for Efficient Stitching of Multiple Images)

  • 임지헌;이의상;김회정;김규헌
    • 방송공학회논문지
    • /
    • 제22권6호
    • /
    • pp.713-723
    • /
    • 2017
  • 파노라마 영상은 카메라 시야각의 제한을 극복하여 넓은 시야를 가질 수 있으므로 컴퓨터 비전, 스테레오 카메라 등의 분야에서 효율적으로 연구되고 있다. 파노라마 영상을 생성하기 위해서는 왜곡이 생기는 광각 카메라를 사용하는 대신 다수의 일반 카메라로 촬영한 영상들을 스티칭 하는 것이 영상의 왜곡 현상을 줄일 수 있기에 많이 활용되어지고 있다. 영상 스티칭 기술은 여러 영상에서 추출한 특징점의 디스크립터를 생성하고, 특징점들 간의 유사도를 비교하여 영상들을 이어 붙여 큰 하나의 영상으로 만드는 것이다. 각각의 특징점은 수십 수백차원의 정보를 가지고 있고, 스티칭 할 영상이 많아질수록 데이터 처리 시간이 증가하게 된다. 특히, 하나의 객체에 대하여 다수의 불특정 카메라에 의해 촬영한 영상들을 기반으로 파노라마를 생성할 경우, 유사한 영상들에 대한 중복적 특징점 추출의 과정을 거치기에 그 처리 시간은 더욱 증가한다. 본 논문에서는 이와 같이, 하나의 객체 또는 환경에 대하여 불특정 다수의 카메라에서 획득한 영상을 기반으로 스티칭을 효율적으로 처리하기 위한 전처리 과정을 제안한다. 그 방법으로 카메라 센서 정보를 기반으로 영상들을 미리 그룹화 하여 한 번에 스티칭 할 영상의 수를 줄임으로써 데이터 처리 시간을 줄일 수 있다. 후에 계층적으로 스티칭 하여 하나의 큰 파노라마를 만든다. 본 논문에서 제안한 그룹핑 전처리를 통해 다수의 영상을 대상으로 한 스티칭 시간이 대폭 감소하는 것을 실험 결과를 통해 검증하였다.

모사 와전류 탐상신호를 이용한 비대칭 단면을 갖는 축대칭 결함의 형상분류 (Classification of Axis-symmetric Flaws with Non-Symmetric Cross-Sections using Simulated Eddy Current Testing Signals)

  • 송성진;김창환;신영길;이향범;박윤원;임창재
    • 비파괴검사학회지
    • /
    • 제21권5호
    • /
    • pp.510-517
    • /
    • 2001
  • 본 연구는 와전류 형상인식 기법을 증기발생기 세관의 보다 실제적인 결함 평가 문제에 적용하기 위한 목적으로 시도되었다. 이를 위해 증기발생기 세관에 발생하는 실제적인 결함을 보다 사실적으로 모사하는 다섯 가지 형태의 외벽 결함을 선택하고, 이들 결함의 크기 인자와 시험주파수를 변화시켜 가면서, 유한요소 수치해석 프로그램을 이용하여 이론적인 결함신호를 생성하였다. 그리고, 이들 결함신호의 분석을 효율적으로 수행하기 위한 도구로서, '와전류 특징추출 프로그램', '와전류 특징분석 프로그램', 그리고 'PNN 결함분류 프로그램'을 자체적으로 개발하였다. 비대칭 단면을 갖는 결함의 신호는 교점이 원점으로부터 이격되는 현상이 관찰되었는데, 이러한 특성을 반영하는 특징을 추가하여 총 18개의 특징을 시험주파수 별로 정의하였다. 이 특징들을 이용하여 결함을 분류하는 확률신경회로망을 구성하고 결함 분류를 수행한 결과, 결함단면의 대칭성 여부를 결정하는 문제에서는 비교적 높은 정확도를 얻었으나, 결함선단의 첨도를 판단하는 문제에서는 낮은 정확도를 얻었다.

  • PDF

On Motion Planning for Human-Following of Mobile Robot in a Predictable Intelligent Space

  • Jin, Tae-Seok;Hashimoto, Hideki
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제4권1호
    • /
    • pp.101-110
    • /
    • 2004
  • The robots that will be needed in the near future are human-friendly robots that are able to coexist with humans and support humans effectively. To realize this, humans and robots need to be in close proximity to each other as much as possible. Moreover, it is necessary for their interactions to occur naturally. It is desirable for a robot to carry out human following, as one of the human-affinitive movements. The human-following robot requires several techniques: the recognition of the moving objects, the feature extraction and visual tracking, and the trajectory generation for following a human stably. In this research, a predictable intelligent space is used in order to achieve these goals. An intelligent space is a 3-D environment in which many sensors and intelligent devices are distributed. Mobile robots exist in this space as physical agents providing humans with services. A mobile robot is controlled to follow a walking human using distributed intelligent sensors as stably and precisely as possible. The moving objects is assumed to be a point-object and projected onto an image plane to form a geometrical constraint equation that provides position data of the object based on the kinematics of the intelligent space. Uncertainties in the position estimation caused by the point-object assumption are compensated using the Kalman filter. To generate the shortest time trajectory to follow the walking human, the linear and angular velocities are estimated and utilized. The computer simulation and experimental results of estimating and following of the walking human with the mobile robot are presented.

지역적 불변특징 기반의 3차원 환경인식 및 모델링 (Recognition and Modeling of 3D Environment based on Local Invariant Features)

  • 장대식
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.31-39
    • /
    • 2006
  • 본 논문에서는 지능로봇. 지능형자동차. 지능형빌딩 등에 다양하게 활용될 수 있는 3차원 환경과 여기에 포함된 물체의 실시간 인식을 위한 새로운 접근 방법을 제안한다. 본 논문에서는 먼저 사람이 환경을 인식하고 상호작용하는 데 사용하는 3가지 기본 원칙을 설정하고, 이 기본 원칙들을 이용하여 실시간 3차원 환경 및 물체 인식을 위한 통합된 방법을 제시한다. 이들 3가지 기본 원칙은 다음과 같다. 첫째, 전역 적인 평면 특징들을 인식함으로써 작업환경의 기하학적 구조에 대한 개략적 특성화를 고속으로 진행한다. 둘째, 작업환경 속에서 기존에 알려진 물체를 먼저 빠르게 인식하고 이를 데이터베이스 내에 저장되어 있는 물체의 모델로 교체한다. 셋째, 다중 해상도 Octree 표현 방법을 이용하여 기타 영역을 주어진 작업의 필요에 따라 적응적으로 실시간 모델링 한다. 본 논문에서는 3차원 SIFT로 언급되는 3차원 좌표를 가지는 SIFT특징들을 3차원 좌표정보와 함께 확장하여 사용함으로서 전역적 평면 특징의 빠른 추출, 고속의 물체 인식, 빠른 장면 정합 등의 기능에 활용하고 이와 동시에 스테레오 카메라로부터 입력되는 3차원 좌표의 잡음과 불완전성을 극복한다.

  • PDF

자율주행을 위한 Self-Attention 기반 비지도 단안 카메라 영상 깊이 추정 (Unsupervised Monocular Depth Estimation Using Self-Attention for Autonomous Driving)

  • 황승준;박성준;백중환
    • 한국항행학회논문지
    • /
    • 제27권2호
    • /
    • pp.182-189
    • /
    • 2023
  • 깊이 추정은 차량, 로봇, 드론의 자율주행을 위한 3차원 지도 생성의 핵심 기술이다. 기존의 센서 기반 깊이 추정 방식은 정확도는 높지만 가격이 비싸고 해상도가 낮다. 반면 카메라 기반 깊이 추정 방식은 해상도가 높고 가격이 저렴하지만 정확도가 낮다. 본 연구에서는 무인항공기 카메라의 깊이 추정 성능 향상을 위해 Self-Attention 기반의 비지도 단안 카메라 영상 깊이 추정을 제안한다. 네트워크에 Self-Attention 연산을 적용하여 전역 특징 추출 성능을 향상시킨다. 또한 카메라 파라미터를 학습하는 네트워크를 추가하여 카메라 칼리브레이션이 안되어있는 이미지 데이터에서도 사용 가능하게 한다. 공간 데이터 생성을 위해 추정된 깊이와 카메라 포즈는 카메라 파라미터를 이용하여 포인트 클라우드로 변환되고, 포인트 클라우드는 Octree 구조의 점유 그리드를 사용하여 3D 맵으로 매핑된다. 제안된 네트워크는 합성 이미지와 Mid-Air 데이터 세트의 깊이 시퀀스를 사용하여 평가된다. 제안하는 네트워크는 이전 연구에 비해 7.69% 더 낮은 오류 값을 보여주었다.