• 제목/요약/키워드: Keypoint

검색결과 80건 처리시간 0.023초

SIFT 특징을 이용한 의료 영상의 회전 영역 보정 (Correction of Rotated Region in Medical Images Using SIFT Features)

  • 김지홍;장익훈
    • 한국멀티미디어학회논문지
    • /
    • 제18권1호
    • /
    • pp.17-24
    • /
    • 2015
  • In this paper, a novel scheme for correcting rotated region in medical images using SIFT(Scale Invariant Feature Transform) algorithm is presented. Using the feature extraction function of SIFT, the rotation angle of rotated object in medical images is calculated as follows. First, keypoints of both reference and rotated medical images are extracted by SIFT. Second, the matching process is performed to the keypoints located at the predetermined ROI(Region Of Interest) at which objects are not cropped or added by rotating the image. Finally, degrees of matched keypoints are calculated and the rotation angle of the rotated object is determined by averaging the difference of the degrees. The simulation results show that the proposed scheme has excellent performance for correcting the rotated region in medical images.

도로 위 숫자 및 기호 인식을 위한 광각렌즈 기반 Camera Calibration 연구

  • 강진규;홍형길;;;박강령;조형오
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1406-1407
    • /
    • 2015
  • 본 논문에서는 도로 위 숫자 및 기호인식에 적합한 Calibration Model에 대하여 연구하였다. 기존에 제시된 Geometric Transform, Fisheye Projection, Caltech Toolbox 기반 방법으로 얻은 Calibration Model의 성능을 비교하였다. Geometric Transform은 Fisheye Distortion Correction에 부적합한 결과를 얻었고, Fisheye Projection은 성능은 좋으나 시스템에 사용할 Camera Lens의 Specification을 모르기 때문에 이를 예측해야 하는 단점이 있다. 마지막으로 Caltech Tool box 기반 방법은 Calibration을 위한 Keypoint를 수동으로 지정하다 보니까 이로 인한 오차가 존재하게 된다. Calibration을 시도 할 때마다 결과에 차이가 있었으며, Calibration 결과의 측면에서 Fisheye Projection이 가시적으로 가장 좋은 결과를 나타냈다.

HigherHRNet 기반의 발추정 기법을 통한 횡단보도 보행자 인식 (Pedestrian Recognition of Crosswalks Using Foot Estimation Techniques Based on HigherHRNet)

  • 정경민;한주훈;이현
    • 대한임베디드공학회논문지
    • /
    • 제16권5호
    • /
    • pp.171-177
    • /
    • 2021
  • It is difficult to accurately extract features of pedestrian because the pedestrian is photographed at a crosswalk using a camera positioned higher than the pedestrian. In addition, it is more difficult to extract features when a part of the pedestrian's body is covered by an umbrella or parasol or when the pedestrian is holding an object. Representative methods to solve this problem include Object Detection, Instance Segmentation, and Pose Estimation. Among them, this study intends to use the Pose Estimation method. In particular, we intend to increase the recognition rate of pedestrians in crosswalks by maintaining the image resolution through HigherHRNet and applying the foot estimation technique. Finally, we show the superiority of the proposed method by applying and analyzing several data sets covered by body parts to the existing method and the proposed method.

Over blur를 감소시킨 Deep CNN 구현 (Implementation of Deep CNN denoiser for Reducing Over blur)

  • 이성훈;이광엽;정준모
    • 전기전자학회논문지
    • /
    • 제22권4호
    • /
    • pp.1242-1245
    • /
    • 2018
  • 본 논문에서, Gaussian noise를 제거할 때 발생하는 over blurring 현상을 감소시키는 network를 구현하였다. 기존 filtering 방식은 원 영상을 blurring하여 noise를 제거함으로써, edge나 corner 같은 high frequency 성분도 함께 지워지는 것을 확인할 수 있다. CNN (Convolutional Neural Network)기반 denoiser의 경우도 사소한 edge, keypoint를 noise로 인식하여 이러한 정보를 잃게 된다. 우리는 CNN을 기반으로 denoising된 high frequency 성분만을 획득하여 기존 denoiser에 추가함으로써 denoising 성능을 유지하면서 over blurring을 완화하는 network 제안한다.

GAN 및 키포인트와 로컬 아핀 변환을 이용한 스타일 변환 동적인 이미지 애니메이션 네트워크 구축 (Construction of Dynamic Image Animation Network for Style Transformation Using GAN, Keypoint and Local Affine)

  • 장준보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.497-500
    • /
    • 2022
  • High-quality images and videos are being generated as technologies for deep learning-based image style translation and conversion of static images into dynamic images have developed. However, it takes a lot of time and resources to manually transform images, as well as professional knowledge due to the difficulty of natural image transformation. Therefore, in this paper, we study natural style mixing through a style conversion network using GAN and natural dynamic image generation using the First Order Motion Model network (FOMM).

동작 비디오 분석을 통한 캐릭터 애니메이션 생성 (Character Animation Generation from Motion Video Analysis)

  • 임예슬;박종승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.517-520
    • /
    • 2021
  • 본 논문에서는 동작 비디오를 분석하고 이를 3차원 캐릭터 애니메이션으로 생성하는 방법을 제시한다. 비디오에서의 사람의 동작 인식에서는 OpenPose를 사용하여 사람의 몸 keypoints를 추적해 2차원 위치 좌표로 얻는다. 3차원 캐릭터 애니메이션으로 생성하기 위해 Deep-Learning을 사용하여 2차원 위치 좌표를 3차원 위치 좌표로 변경한다. 캐릭터 스켈레톤에 적용하기 위해 3차원 위치 좌표를 회전값으로 변환하고 그 회전값을 캐릭터 스켈레톤 좌표에 맞게 변환한다. 비디오의 사람의 동작과 유사한 3차원 캐릭터 애니메이션을 생성하는 방법을 제안하고 적용 결과를 제시한다.

RGB 이미지와 Depth 이미지를 이용한 3D 휴먼 키포인트 탐지 (3D Human Keypoint Detection With RGB and Depth Image)

  • 정근석;이예지;윤경로
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.239-241
    • /
    • 2021
  • 2019 발생한 COVID-19로 인하여 전 세계 사람들의 여가 활동이 제한되면서 건강관리를 위해 홈 트레이닝에 많은 관심을 기울이고 있다. 뿐만 아니라 최근 컴퓨팅 기술의 발전에 따라 사람의 행동을 눈으로 직접 판단했던 작업을 컴퓨터가 키포인트 탐지를 통해 인간의 행동을 이해하려는 많은 연구가 진행되고 있다. 이에 따라 본 논문은 Azure Kinect를 이용하여 촬영한 RGB 이미지와 Depth 이미지를 이용하여 3D 키포인트를 추정한다. RGB 이미지는 2D 키포인트 탐지기를 이용하여 2차원 공간에서의 좌표를 탐지한다. 앞서 탐지한 2D 좌표를 Depth 이미지에 투영하여 추출한 3D 키포인트의 깊이 값을 이용하여 3D 키포인트 탐지에 대한 연구 개발하였다.

  • PDF

구조물 검출 네트워크 및 특징점 필터링을 이용한 원격 탐사 영상 정합 (Remote Sensing Image Registration using Structure Extraction and Keypoint Filtering)

  • 성준영;이우주;오승준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.300-304
    • /
    • 2020
  • 본 논문에서는 원격 탐사 영상 정합에서 정확도는 유지하면서 특징점 매칭 (Matching) 복잡도를 줄이기 위해 입력 영상을 전처리하는 구조물 검출 네트워크를 이용한 원격 탐사 영상 정합 방법을 제안한다. 영상 정합의 기존 방법은 입력 영상에서 특징점을 추출하고 설명자 (Descriptor)를 생성한다. 본 논문에서 제안하는 방법은 입력 영상에서 특징점 매칭에 영향을 미치는 구조물만 추출하여 새로운 영상을 만들어 특징점을 추출한다. 추출된 특징점은 필터링 (Filtering)을 거쳐 원본 영상에 매핑 (Mapping)되어 설명자를 생성하여 특징점 매칭 속도를 향상시킨다. 또한 구조물 검출 네트워크에서 학습 영상과 시험 영상의 특성의 차이로 생기는 성능 저하 문제를 개선하기 위해 히스토그램 매핑 기법을 이용한다. 아리랑 3 호가 획득한 원격 탐사 영상에 대한 실험을 통해 제안하는 방법은 정확도를 유지하면서 계산 시간을 SURF 보다 87.5%, SIFT 보다 92.6% 감소시킬 수 있다.

  • PDF

공항 내 시설 안내 서비스를 위한 마커리스 한국 수어 인식 기술 (Keypoint-based Korean sign language recognition for guiding airport facilities)

  • 박한무;정윤영
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.476-478
    • /
    • 2020
  • 공항은 다양한 시설들이 혼재되어 있는 복합 공간으로 원하는 장소로 이동하기 위해서는 지도나 표지판뿐만 아니라 유·무인 안내 서비스를 이용하는 것이 필수적이다. 그러나 이러한 시설 안내 서비스는 이용객의 대다수를 차지하는 비장애인을 기준으로 설계되어 있는 것이 대부분이며, 특히 청각장애인은 음성 언어인 한국어를 통한 의사소통이 어려워 이러한 안내 서비스의 사각 지대에 놓여있다고 볼 수 있다. 본 논문에서는 청각장애인을 대상으로 공항 내 시설 위치 안내 서비스를 제공하는 키오스크를 구현하기 위해 마커리스(makerless) 한국 수어 인식 기술을 적용하는 방법을 제안한다. 기존의 알고리즘들이 수어를 인식하기 위해 사용자의 신체에 마커(marker)를 부착하거나 사용에 제약이 있는 깊이, 자기장 센서 등을 활용한 데 반해, 특징점 기반의 인식 기술은 별도의 마커 없이 RGB 영상만을 활용하여 수어를 인식하기 때문에 사용자의 편의성을 극대화할 수 있는 방법이다. 영상 기반의 마커리스 수어 인식 기술을 위치 안내 키오스크에 적용함으로써 청각장애인이 다른 사람의 도움 없이 공항 시설을 쉽고 안전하게 이용할 수 있도록 지원할 수 있으며, 나아가 배리어프리 (barrier-free) 공항을 구현하는 데에 큰 도움이 될 수 있을 것으로 기대된다.

  • PDF

MediaPipe를 활용한 춤동작 가이드 시스템 (Dance Movement Guide System using MediaPipe)

  • 김현서;정재영;문미경
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.355-356
    • /
    • 2023
  • K-POP의 가파른 성장세에 따라 댄스 콘텐츠 산업이 확산되는 추세이다. 최근 SNS의 보급이 증가하면서 자신의 댄스 영상을 촬영하고 공유하기도 한다. 그러나 초보자들은 자신의 동작이 어떻게 보이는지 평가하는 데 어려움을 겪어 춤동작을 습득하기 쉽지 않다. 본 논문에서는 MediaPipe를 활용하여 안무 영상과 사용자의 춤영상을 비교하고 올바르게 동작을 따라 하고 있는지 검출해 주는 시스템에 대해 기술한다. 본 시스템을 통해 사용자의 춤동작에 대한 피드백을 받을 수 있으며 초보자들도 정확한 춤동작을 연습할 수 있을 것으로 기대한다.

  • PDF