• 제목/요약/키워드: Initial position detection

검색결과 65건 처리시간 0.028초

모바일 기기에서의 얼굴 특징점 및 선형 보간법 기반 시선 추적 (Gaze Detection Based on Facial Features and Linear Interpolation on Mobile Devices)

  • 고유진;박강령
    • 한국멀티미디어학회논문지
    • /
    • 제12권8호
    • /
    • pp.1089-1098
    • /
    • 2009
  • 최근에 인간컴퓨터 상호작용 분야에서 사용자의 시선 위치를 파악하여 더욱 편리한 입력 장치를 개발하고자 하는 연구가 많이 진행되고 있다. 기존의 대부분 연구들은 큰 모니터를 사용하는 컴퓨터 환경에서 시선 추적 시스템을 개발하였다. 최근 이동단말기의 사용 증대로 이동 중에 시선 추적에 의한 단말기 제어의 필요성이 증대되고 있다. 이에 본 연구에서는 이동형 컴퓨터 (Ultra-Mobile PC) 및 컴퓨터 내장 카메라를 이용하여 사용자의 얼굴을 추적하고, 얼굴내의 특징점의 위치를 능동외관모델 (Active Appearance Model)을 기반으로 추적하는 연구를 수행하였다. 본 논문의 독창성은 기존 연구와는 달리 소형 화면을 가지는 이동 단말기에서 사용자의 시선 위치를 추적할 수 있는 방법을 제안한 점과 정밀한 얼굴 특징점 검출을 위하여 능동외관모델을 사용한 점이다. 또한 사용자의 초기 캘리브레이션시 얻어진 특징값을 기반으로, 입력 특징값들을 정규화 함으로써, Z거리에 따라 시선 위치 정확도가 영향을 받지 않는다는 점이다. 실험결과, 약 1.77도의 시선 오차를 발생하였으나, 추가적인 얼굴 움직임에 의한 마우스 움직임 기능으로 이러한 시선 오차는 더욱 줄일 수 있음을 알 수 있었다.

  • PDF

위성 탑재 합성개구 레이더 영상에서의 도로 검출 (Road Detection in the Spaceborne Synthetic Aperture Radar Images)

  • 전성민;홍기상
    • 전자공학회논문지S
    • /
    • 제35S권11호
    • /
    • pp.123-132
    • /
    • 1998
  • 본 논문은 위성 탑재 합성개구 레이더 영상에서 중요한 지리적 특징점인 도로를 검출하는 기법을 제시한다. 도로에 대한 모델로서 snake를 사용하였고, 이 snake의 외부 에너지를 도로의 특성에 맞도록 새롭게 정의 하였다. 레이더 영상만을 사용할 경우 도로를 검출하는 것이 매우 어려우므로 다른 정보가 필요하다. 우리는 디지털 지도를 이용하여 snake의 위치와 형태를 초기화하는데 사용하였다. 레이더 영상에 나타나는 도로의 지리적 위치는 지형부호화(geocoding)를 통해서 대략적으로만 알 수 있고, 보통의 디지털 지도는 정확도가 낮아서 두 데이터 사이에는 큰 오차가 존재한다. 초기 매칭(matching) 과정을 통하여 이 오차를 매우 줄이고, 디지털 지도에서 추출한 도로를 이용하여 snake의 형태를 초기화한 후 에너지를 최소화함으로써 도로를 검출한다. 도로 검출시에 나타나는 대표적이 두 가지 문제점을 제시하고 이 문제점을 완화시키는 방법을 제안하였다.

  • PDF

도심 자율주행을 위한 라이다 정지 장애물 지도 기반 위치 보정 알고리즘 (LiDAR Static Obstacle Map based Position Correction Algorithm for Urban Autonomous Driving)

  • 노한석;이현성;이경수
    • 자동차안전학회지
    • /
    • 제14권2호
    • /
    • pp.39-44
    • /
    • 2022
  • This paper presents LiDAR static obstacle map based vehicle position correction algorithm for urban autonomous driving. Real Time Kinematic (RTK) GPS is commonly used in highway automated vehicle systems. For urban automated vehicle systems, RTK GPS have some trouble in shaded area. Therefore, this paper represents a method to estimate the position of the host vehicle using AVM camera, front camera, LiDAR and low-cost GPS based on Extended Kalman Filter (EKF). Static obstacle map (STOM) is constructed only with static object based on Bayesian rule. To run the algorithm, HD map and Static obstacle reference map (STORM) must be prepared in advance. STORM is constructed by accumulating and voxelizing the static obstacle map (STOM). The algorithm consists of three main process. The first process is to acquire sensor data from low-cost GPS, AVM camera, front camera, and LiDAR. Second, low-cost GPS data is used to define initial point. Third, AVM camera, front camera, LiDAR point cloud matching to HD map and STORM is conducted using Normal Distribution Transformation (NDT) method. Third, position of the host vehicle position is corrected based on the Extended Kalman Filter (EKF).The proposed algorithm is implemented in the Linux Robot Operating System (ROS) environment and showed better performance than only lane-detection algorithm. It is expected to be more robust and accurate than raw lidar point cloud matching algorithm in autonomous driving.

Automatic detection of tooth cracks in optical coherence tomography images

  • Kim, Jun-Min;Kang, Se-Ryong;Yi, Won-Jin
    • Journal of Periodontal and Implant Science
    • /
    • 제47권1호
    • /
    • pp.41-50
    • /
    • 2017
  • Purpose: The aims of the present study were to compare the image quality and visibility of tooth cracks between conventional methods and swept-source optical coherence tomography (SS-OCT) and to develop an automatic detection technique for tooth cracks by SS-OCT imaging. Methods: We evaluated SS-OCT with a near-infrared wavelength centered at 1,310 nm over a spectral bandwidth of 100 nm at a rate of 50 kHz as a new diagnostic tool for the detection of tooth cracks. The reliability of the SS-OCT images was verified by comparing the crack lines with those detected using conventional methods. After performing preprocessing of the obtained SS-OCT images to emphasize cracks, an algorithm was developed and verified to detect tooth cracks automatically. Results: The detection capability of SS-OCT was superior or comparable to that of trans-illumination, which did not discriminate among the cracks according to depth. Other conventional methods for the detection of tooth cracks did not sense initial cracks with a width of less than $100{\mu}m$. However, SS-OCT detected cracks of all sizes, ranging from craze lines to split teeth, and the crack lines were automatically detected in images using the Hough transform. Conclusions: We were able to distinguish structural cracks, craze lines, and split lines in tooth cracks using SS-OCT images, and to automatically detect the position of various cracks in the OCT images. Therefore, the detection capability of SS-OCT images provides a useful diagnostic tool for cracked tooth syndrome.

A deep learning-based approach for feeding behavior recognition of weanling pigs

  • Kim, MinJu;Choi, YoHan;Lee, Jeong-nam;Sa, SooJin;Cho, Hyun-chong
    • Journal of Animal Science and Technology
    • /
    • 제63권6호
    • /
    • pp.1453-1463
    • /
    • 2021
  • Feeding is the most important behavior that represents the health and welfare of weanling pigs. The early detection of feed refusal is crucial for the control of disease in the initial stages and the detection of empty feeders for adding feed in a timely manner. This paper proposes a real-time technique for the detection and recognition of small pigs using a deep-leaning-based method. The proposed model focuses on detecting pigs on a feeder in a feeding position. Conventional methods detect pigs and then classify them into different behavior gestures. In contrast, in the proposed method, these two tasks are combined into a single process to detect only feeding behavior to increase the speed of detection. Considering the significant differences between pig behaviors at different sizes, adaptive adjustments are introduced into a you-only-look-once (YOLO) model, including an angle optimization strategy between the head and body for detecting a head in a feeder. According to experimental results, this method can detect the feeding behavior of pigs and screen non-feeding positions with 95.66%, 94.22%, and 96.56% average precision (AP) at an intersection over union (IoU) threshold of 0.5 for YOLOv3, YOLOv4, and an additional layer and with the proposed activation function, respectively. Drinking behavior was detected with 86.86%, 89.16%, and 86.41% AP at a 0.5 IoU threshold for YOLOv3, YOLOv4, and the proposed activation function, respectively. In terms of detection and classification, the results of our study demonstrate that the proposed method yields higher precision and recall compared to conventional methods.

LSTM Network with Tracking Association for Multi-Object Tracking

  • Farhodov, Xurshedjon;Moon, Kwang-Seok;Lee, Suk-Hwan;Kwon, Ki-Ryong
    • 한국멀티미디어학회논문지
    • /
    • 제23권10호
    • /
    • pp.1236-1249
    • /
    • 2020
  • In a most recent object tracking research work, applying Convolutional Neural Network and Recurrent Neural Network-based strategies become relevant for resolving the noticeable challenges in it, like, occlusion, motion, object, and camera viewpoint variations, changing several targets, lighting variations. In this paper, the LSTM Network-based Tracking association method has proposed where the technique capable of real-time multi-object tracking by creating one of the useful LSTM networks that associated with tracking, which supports the long term tracking along with solving challenges. The LSTM network is a different neural network defined in Keras as a sequence of layers, where the Sequential classes would be a container for these layers. This purposing network structure builds with the integration of tracking association on Keras neural-network library. The tracking process has been associated with the LSTM Network feature learning output and obtained outstanding real-time detection and tracking performance. In this work, the main focus was learning trackable objects locations, appearance, and motion details, then predicting the feature location of objects on boxes according to their initial position. The performance of the joint object tracking system has shown that the LSTM network is more powerful and capable of working on a real-time multi-object tracking process.

삼각 메쉬를 위한 기하학 스네이크 (Geometric Snakes for Triangular Meshes)

  • 이윤진;이승용
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제7권3호
    • /
    • pp.9-18
    • /
    • 2001
  • 삼각 메쉬의 특징점을 찾는 것은 메쉬 편집, 메쉬 몰핑, 메쉬 압축, 메쉬 신호처리 등 여러 가지 응용 분야에서 중요하게 사용된다. 본 논문에서는 삼각 메쉬의 특징점을 찾기 위한 방법으로 기하학 스네이크를 제시하였다. 기하학 스네이크는 영상 스네이크를 확장한 것으로, 사용자가 초기 위치를 정하면 에너지 함수를 최소화함으로써 가까이에 있는 특징점을 찾는다. 기하학 스네이크는 항상 메쉬 표면 위에서만 이동하여야 하므로 메쉬를 매개 변수화하여 스네이크를 이차원 상에 매핑된 메쉬상에서 이동시켰다. 스네이크를 특징점으로 이동시키기 위한 외부 에너지는 메쉬 표면의 노말 변화를 이용하여 계산하였다.

  • PDF

현금 인출기 사용자의 선글라스 및 마스크 인식 시스템 (A System for Recognizing Sunglasses and a Mask of an ATM User)

  • 임동악;고재필
    • 한국멀티미디어학회논문지
    • /
    • 제11권1호
    • /
    • pp.34-43
    • /
    • 2008
  • 본 논문에서는 현금인출기 사용자의 선글라스 및 마스크를 인식하는 시스템을 설명한다. 제안하는 시스템은 얼굴윤곽을 먼저 추출하고 이로부터 눈과 입의 위치를 추정한다. 마지막으로, 눈과 입 영역에 대해 각각 히스토그램 인덱싱 기법을 적용하여 선글라스 및 마스크를 인식한다. 눈이나 입 영역이 가려진 상태에서 얼굴윤곽 추출과 눈 및 입의 위치 추정을 위해 얼굴모양모델을 도입한다. 얼굴모양모델의 정합성능을 향상시키기 위해 2단계에 걸친 얼굴후보영역 검출을 도입하고 모델의 초기위치를 다변화하여 반복 정합을 실시한다. 배경모델에 기반한 얼굴후보영역 검출 방법의 성능을 보장하기 위해서 배경모델을 자동으로 갱신할 수 있도록 시스템을 구성한다. 실험에서는 연구실에서 획득한 영상에 대하여 시스템의 설정에 관한 실험을 제시하고 마스크 및 선글라스 인식 결과를 보인다.

  • PDF

AAM 기반 얼굴 표정 인식을 위한 입술 특징점 검출 성능 향상 연구 (A Study on Enhancing the Performance of Detecting Lip Feature Points for Facial Expression Recognition Based on AAM)

  • 한은정;강병준;박강령
    • 정보처리학회논문지B
    • /
    • 제16B권4호
    • /
    • pp.299-308
    • /
    • 2009
  • AAM(Active Appearance Model)은 PCA(Principal Component Analysis)를 기반으로 객체의 형태(shape)와 질감(texture) 정보에 대한 통계적 모델을 통해 얼굴의 특징점을 검출하는 알고리즘으로 얼굴인식, 얼굴 모델링, 표정인식과 같은 응용에 널리 사용되고 있다. 하지만, AAM알고리즘은 초기 값에 민감하고 입력영상이 학습 데이터 영상과의 차이가 클 경우에는 검출 에러가 증가되는 문제가 있다. 특히, 입을 다문 입력얼굴 영상의 경우에는 비교적 높은 검출 정확도를 나타내지만, 사용자의 표정에 따라 입을 벌리거나 입의 모양이 변형된 얼굴 입력 영상의 경우에는 입술에 대한 검출 오류가 매우 증가되는 문제점이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 입술 특징점 검출을 통해 정확한 입술 영역을 검출한 후에 이 정보를 이용하여 AAM을 수행함으로써 얼굴 특징점 검출 정확성을 향상시키는 방법을 제안한다. 본 논문에서는 AAM으로 검출한 얼굴 특징점 정보를 기반으로 초기 입술 탐색 영역을 설정하고, 탐색 영역 내에서 Canny 경계 검출 및 히스토그램 프로젝션 방법을 이용하여 입술의 양 끝점을 추출한 후, 입술의 양 끝점을 기반으로 재설정된 탐색영역 내에서 입술의 칼라 정보와 에지 정보를 함께 결합함으로써 입술 검출의 정확도 및 처리속도를 향상시켰다. 실험결과, AAM 알고리즘을 단독으로 사용할 때보다, 제안한 방법을 사용하였을 경우 입술 특징점 검출 RMS(Root Mean Square) 에러가 4.21픽셀만큼 감소하였다.

FPGA real-time calculator to determine the position of an emitter

  • Tamura, M.;Aoyama, T.
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.473-478
    • /
    • 2003
  • To detect motions of bodies, we have discussed them with two viewpoints; one is a detection algorithm, and another is the hardware implementation. The former is to find small terms expansions for sine/cosine functions. We researched Maclaurin and optimum expansions, and moreover to reduce hardware amounts, revised the expansions. The expansions don't include divide calculations, and the error is within 0.01%. As for the former problem, there is another approach also; that is the cordic method. The method is based on the rotation of a vector on the complex plain. It is simple iterations and don't require large logic. We examined the precision and convergence of the method on C-simulations, and implemented on HDL. The later problem is to make FPGA within small gates. We considered approaches to eliminate a divider and to reduce the bit number of arithmetic. We researched Newton-Raphson's method to get reciprocal numbers. The higher-order expression shows rapid convergence and doesn't be affected by the initial guess. It is an excellent algorithm. Using them, we wish to design a detector, and are developing it on a FPGA.

  • PDF