• Title/Summary/Keyword: Computer vision technology

검색결과 666건 처리시간 0.023초

3차원 인체 포즈 인식을 이용한 상호작용 게임 콘텐츠 개발 (Developing Interactive Game Contents using 3D Human Pose Recognition)

  • 최윤지;박재완;송대현;이칠우
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.619-628
    • /
    • 2011
  • 일반적으로 비전기반 3차원 인체 포즈 인식 기술은 HCI(Human-Computer Interaction)에서 인간의 제스처를 전달하기 위한 방법으로 사용된다. 특수한 환경에서 단순한 2차원 움직임 포즈만 인식할 수 있는 2차원 포즈모델 기반 인식 방법에 비해 3차원 관절을 묘사한 포즈모델은 관절각에 대한 정보와 신체 부위의 모양정보를 선행지식으로 사용할 수 있어서 좀 더 일반적인 환경에서 복잡한 3차원 포즈도 인식할 수 있다는 장점이 있다. 이 논문은 인체의 3차원 관절 정보를 이용한 포즈 인식 기술을 인터페이스로 활용한 상호작용 게임 콘텐츠 개발에 관해 기술한다. 제안된 시스템에서 사용되는 포즈는 인체 관절 중 14개 관절의 3차원 위치정보를 이용해서 구성한 포즈 템플릿과 현재 사용자의 포즈를 비교해 인식된다. 이 방법을 이용하여 제작된 시스템은 사용자가 부가적인 장치의 사용 없이 사용자의 몸동작만으로 자연스럽게 게임 콘텐츠를 조작할 수 있도록 해준다. 제안된 3차원 인식 기술을 게임 콘텐츠에 적용하여 성능을 평가한다. 향후 다양한 환경에서 더욱 강건하게 포즈를 인식할 수 있는 연구를 수행할 계획이다.

내부 그레디언트 정보를 이용한 일반화된 허프변환 (Generalized Hough Transform using Internal Gradient Information)

  • 장지영
    • 융합정보논문지
    • /
    • 제7권3호
    • /
    • pp.73-81
    • /
    • 2017
  • 일반화된 허프변환(GHough)은 임의의 2차원 모델 추출을 위해 사용되는 유용한 기법이다. 그러나 GHough는 모델의 회전과 축척 관련 사전 정보가 없을 경우 모든 경우의 수를 나열하는 변환 방식을 택하기 때문에 4차원 패러미터 배열이라는 방대한 메모리 사용이 불가피하며 실행시간 또한 오래 걸릴 수밖에 없다. 이를 개선하기 위해 제안된 몇몇 n-to-1 변환 방식 들은 4차원 대신 2차원 패러미터 배열 사용만으로도 임의의 모델 추출을 가능케 한 반면 2차원 패러미터 공간에 던져지는 무작위 투표 때문에 모델 추출 오류 가능성 또한 높다 하겠다. 본 논문은 이와 같은 2차원 패러미터 공간에 던져지는 무작위 투표를 감소시키기 위한 방안으로 모델 내부의 추가적인 그레디언트 정보 활용을 제안하며 모델 윤곽선 정보에 추가로 모델 내부 그레디언트 정보를 활용할 경우 2차원 패러미터 공간에 던져지는 무작위 투표수를 효과적으로 줄일 수 있으며 따라서 실행시간 또한 단축될 수 있음을 실험을 통해 입증한다.

간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법 (Sampling-based Control of SAR System Mounted on A Simple Manipulator)

  • 이아현;이주호;이주행
    • 한국CDE학회논문집
    • /
    • 제19권4호
    • /
    • pp.356-367
    • /
    • 2014
  • A robotic sapatial augmented reality (RSAR) system, which combines robotic components with projector-based AR technique, is unique in its ability to expand the user interaction area by dynamically changing the position and orientation of a projector-camera unit (PCU). For a moving PCU mounted on a conventional robotic device, we can compute its extrinsic parameters using a robot kinematics method assuming a link and joint geometry is available. In a RSAR system based on user-created robot (UCR), however, it is difficult to calibrate or measure the geometric configuration, which limits to apply a conventional kinematics method. In this paper, we propose a data-driven kinematics control method for a UCR-based RSAR system. The proposed method utilized a pre-sampled data set of camera calibration acquired at sufficient instances of kinematics configurations in fixed joint domains. Then, the sampled set is compactly represented as a set of B-spline surfaces. The proposed method have merits in two folds. First, it does not require any kinematics model such as a link length or joint orientation. Secondly, the computation is simple since it just evaluates a several polynomials rather than relying on Jacobian computation. We describe the proposed method and demonstrates the results for an experimental RSAR system with a PCU on a simple pan-tilt arm.

ResNet-50 합성곱 신경망을 위한 고정 소수점 표현 방법 (Efficient Fixed-Point Representation for ResNet-50 Convolutional Neural Network)

  • 강형주
    • 한국정보통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.1-8
    • /
    • 2018
  • 최근 합성곱 신경망은 컴퓨터 비전에 관련된 여러 분야에서 높은 성능을 보여 주고 있으나 합성곱 신경망이 요구하는 많은 연산양은 임베디드 환경에 도입되는 것을 어렵게 하고 있다. 이를 해결하기 위해 ASIC이나 FPGA를 통한 합성곱 신경망의 구현에 많은 관심이 모이고 있고, 이러한 구현을 위해서는 효율적인 고정 소수점 표현이 필요하다. 고정 소수점 표현은 ASIC이나 FPGA에서의 구현에 적합하나 합성곱 신경망의 성능이 저하될 수 있는 문제가 있다. 이 논문에서는 합성곱 계층과 배치(batch) 정규화 계층에 대해 고정 소수점 표현을 분리해서, ResNet-50 합성곱 신경망의 합성곱 계층을 표현하기 위해 필요한 비트 수를 16비트에서 10비트로 줄일 수 있게 하였다. 연산이 집중되는 합성곱 계층이 더 간단하게 표현되므로 합성곱 신경망 구현이 전체적으로 더 효율적으로 될 것이다.

메쉬 워핑에 의한 정면 영상으로부터의 3D 얼굴 모델링 (3D Face Modeling from a Frontal Face Image by Mesh-Warping)

  • 김중식;김진모;조형제
    • 한국멀티미디어학회논문지
    • /
    • 제16권1호
    • /
    • pp.108-118
    • /
    • 2013
  • 최근 컴퓨터 비전, 컴퓨터 그래픽스 분야의 급속한 발전과 하드웨어의 우수한 성능으로 인해 3차원 모델링 기술 또한 급속히 발전 되었다. 그리고 다양한 3D 컨텐츠들의 등장으로 3차원 모델링 기술의 수요가 더욱 많아지고 그 질 또한 높아지고 있다. 3D 얼굴 모델은 이러한 컨텐츠들에 폭 넓게 적용될 수 있어 활용성이 높다. 본 논문에서는 주어진 한 장의 2D 정면 얼굴 영상으로부터 3D 얼굴을 모델링하는 방법을 제안한다. 이를 위해 다수의 정점으로 구성된 3D 일반 얼굴 모델을 입력 얼굴 영상과의 대응관계를 통해 변형하여 3D 얼굴을 모델링한다. 우선 AAM을 이용하여 입력된 얼굴 영상에서 특징점을 추출한다. 그리고 추출된 특징점만으로 직관적인 모델을 변형하기 위해 메쉬 워핑을 적용한다. 여기에 얼굴의 깊이 정보를 유도하기 위하여 한 장의 정면 얼굴 영상을 활용한 명도 변화 기반의 깊이 값의 추출을 시도한다. 이러한 과정을 통해 경제적으로 부담되지 않으며 사용 환경에 대한 제한이 적어 보편적으로 활용될 수 있는 3D 얼굴 모델링 방법을 구현하고 그 타당성을 실험으로 보인다.

Ego-resilience, Disaster-Experience and Core competencies of Disaster response between Paramedic Students' and Nursing Students'

  • Jung, Ji-Yeon;Yun, Hyeong-Wan
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권9호
    • /
    • pp.109-117
    • /
    • 2019
  • This study was attempted to provide fundamental data in a disaster response education program by comparing the differences between students of the paramedic and nursing in ego-resilience, disaster-experience and core competencies of disaster response. The data is collected from March 2 to April 2, 2019, on a total of 358 students (196 paramedic students and 162 nursing students) based in Jeolla Province. The structured questionnaire were used as research tools and the collected data were analyzed by using the SPSS program as frequency, percentage, t-test, ANOVA and Pearson's correlation coefficient. The average score of total ego-resilience among the subjects was 86.97 out of 125 points. The number of paramedic students who experienced or witnessed the disaster situation in person was 11.2%, and the number of nursing students was 11.7%. The core competence of disaster response was 3.21% in paramedic students and 3.16% in nursing students. The ego-resilience of the paramedic and nursing students according to their general characteristics is statistically significant differences (t=2.797, p<.005) and the paramedic students has an average score of 3.52 points, which is higher than the nursing students (3.42 points). General characteristics and experience in disasters are statistically significant differences (t=2.797, p<.005), paramedic students had more disaster experiences (3.11 points) than nursing students (2.67 points). It indicated the static correlation relationship between ego-resilience, disaster experience and core competences of disaster response (p<.000). Through this study, the paramedic students were found to be more ego-resilience, more disaster experience and more critical capacity for disaster treatment than nursing students.

객체 추적을 이용한 풋살 영상 분석 시스템에 관한 연구 (A Study on Futsal Video Analysis System Using Object Tracking)

  • 정하림;권한길;이길형;정수경;고동범;전광일;박정민
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.201-210
    • /
    • 2021
  • 본 논문에서는 객체 추적 기술을 이용한 분석 프로그램과 분석한 데이터를 시각화하여 제공하는 웹서버로 구성된 풋살 영상분석 시스템을 소개한다. 기존의 분석 시스템의 경우 특수한 장치나, 고비용의 카메라를 이용하기 때문에 사용자들이 쉽게 이용하기에 부담스럽다. 따라서 본 논문에서는 평면 영상만을 이용해 선수의 경기를 분석하여 데이터를 시각화하는 시스템을 설계하고 개발한다. 객체를 추적하며 누적된 값을 계산하여 객체의 픽셀당 거리를 구하고 이를 기반으로 속도 관련 데이터와 거리 기반 데이터를 추출한다. 추출된 데이터를 시각화 라이브러리를 통해 그래프와 이미지로 변환하고, 웹페이지를 통해 편리하게 이용할 수 있도록 한다. 본 분석 시스템을 통해 기존의 분석 시스템의 문제점을 개선하고 데이터 기반의 과학적이고 효율적인 분석을 이용할 수 있도록 한다.

U-net기반 동적 연기 탐지 기법 (Tracking Method of Dynamic Smoke based on U-net)

  • 곽경민;노영주
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권4호
    • /
    • pp.81-87
    • /
    • 2021
  • 4차 산업혁명 시대에 맞추어 인공지능 기술은 눈에 띄게 발전하고 있다. 그 중 CNN 등을 활용한 시각 데이터 기반의 인공지능이 활발히 연구 진행 중이다. 시각 기반 모델 중 하나인 U-net은 Semantic Segmentation에 강한 정확도를 보이고 있다. 기존의 U-net을 활용하여 여러 가지 연구들이 진행 되어왔지만 가스, 연기와 같이 외곽선이 뚜렷하지 않은 연구들은 아직 부족한 실정이다. 또한 이와 대조적으로 가스, 연기 탐지에 대해 많은 연구들이 진행이 되어왔지만 U-net 등을 활용하여 단순한 Detection이 아닌 Segmentation 연구는 부족하다. 이를 토대로 본 연구에서는 U-net을 활용하여 가스, 연기 등을 탐지하는 연구를 진행하였다. 본 논문에서는 설정한 실험환경에서 3D camera를 활용하여 데이터를 수집하고 학습 및 테스트 셋을 생성한 방법을 기술하고, U-net을 적용한 방법과 얻은 결과를 검증한 내용을 서술하고, 마지막으로 활용방안 등에 대하여 논하였다.

YOLOv8 알고리즘 기반의 주행 가능한 도로 영역 인식과 실시간 추적 기법에 관한 연구 (Research on Drivable Road Area Recognition and Real-Time Tracking Techniques Based on YOLOv8 Algorithm)

  • 서정희
    • 한국전자통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.563-570
    • /
    • 2024
  • 본 논문은 운전자의 운행 보조 역할로 주행 가능한 차선 영역을 인식하고 추적하는 방법을 제안한다. 주요 주제는 차량 내부의 앞 유리 중앙에 설치된 카메라를 통해 실시간으로 획득한 영상을 기반으로 컴퓨터 비전과 딥 러닝 기술을 활용하여 주행 가능한 도로 영역을 예측하는 심층 기반 네트워크를 설계한다. 본 연구는 YOLOv8 알고리즘을 이용하여 카메라에서 직접 획득한 데이터로 훈련한 새로운 모델을 개발하는 것을 목표한다. 실제 도로에서 자신의 차량의 정확한 위치를 실제 영상과 일치하게 시각화하여 주행 가능한 차선 영역을 표시 및 추적함으로써 운전자 운행의 보조하는 역할을 기대한다. 실험 결과, 대부분 주행 가능한 도로 영역의 추적이 가능했으나 밤에 비가 심하게 오는 경우와 같은 악천후에서 차선이 정확하게 인식되지 않는 경우가 발생하여 이를 해결하기 위한 모델의 성능 개선이 필요하다.

이미지 분할(image segmentation) 관련 연구 동향 파악을 위한 과학계량학 기반 연구개발지형도 분석 (Scientometrics-based R&D Topography Analysis to Identify Research Trends Related to Image Segmentation)

  • 김영찬;진병삼;배영철
    • 한국산업융합학회 논문집
    • /
    • 제27권3호
    • /
    • pp.563-572
    • /
    • 2024
  • Image processing and computer vision technologies are becoming increasingly important in a variety of application fields that require techniques and tools for sophisticated image analysis. In particular, image segmentation is a technology that plays an important role in image analysis. In this study, in order to identify recent research trends on image segmentation techniques, we used the Web of Science(WoS) database to analyze the R&D topography based on the network structure of the author's keyword co-occurrence matrix. As a result, from 2015 to 2023, as a result of the analysis of the R&D map of research articles on image segmentation, R&D in this field is largely focused on four areas of research and development: (1) researches on collecting and preprocessing image data to build higher-performance image segmentation models, (2) the researches on image segmentation using statistics-based models or machine learning algorithms, (3) the researches on image segmentation for medical image analysis, and (4) deep learning-based image segmentation-related R&D. The scientometrics-based analysis performed in this study can not only map the trajectory of R&D related to image segmentation, but can also serve as a marker for future exploration in this dynamic field.