• Title/Summary/Keyword: 비전 기반 기술

Search Result 545, Processing Time 0.031 seconds

An Object-based Tracking Scheme for Interactive HyperVideo (대화형 하이퍼 비디오 저작을 위한 객체 기반 추적 방법)

  • 황본우;손형진;이성환
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.427-429
    • /
    • 2001
  • 컴퓨터 비전 기술을 이용한 효과적인 객체 추적 기술은 인공 시각, 컴퓨터와 인간의 상호작용(HCI), 영상 기반 제어 장치, 감시 시스템 등 다양한 분야의 응용에 있어 중요한 연구 과제이다. 특히 최근 들어 초고속 통신망의 보급으로 인해 인터넷 방송과 같은 실시간 동영상 전송 기술이 가능해 짐에 따라 단순한 텍스트와 정지영상을 제공하는 하이퍼텍스트 환경에서 사운드를 포함하는 동영상 데이터를 제공하는 하이퍼미디어 환경으로 변하고 있다. 이러한 하이퍼미디어 환경에서의 객체 추적은 객체 단위의 링크가 가능한 하이퍼비디오 구현에 있어서 필수적이다. 따라서 본 논문에서는 다양한 동영상 데이터 상의 객체를 효과적으로 추적하는 알고리즘을 제안하고자 한다.

  • PDF

특집 : 레이저 기반 초정밀 초고속 가공시스템 - 신개념 레이저 기반 초정밀/초고속 레이저 복합/유연 가공 기술 개발

  • Ryu, Gwang-Hyeon;Nam, Gi-Jung
    • 기계와재료
    • /
    • v.22 no.1
    • /
    • pp.30-35
    • /
    • 2010
  • 전자부품산업이 빠르게 발전하고 있기 때문에 고기능성 PCB의 수요 또한 많이 늘고 있다. 이러한 PCB는 전자제품의 굴곡성(flexibility) 있는 형태로 발전하여 전자제품의 소형화 및 고밀도화가 가능하고, 반복적인 굴곡에 높은 내구성을 갖는 연성(flexible) PCB(FPCB)의 사용이 증가하고 있으며, 이런 시장의 요구에 맞춰 연성 다층 구조의 FPCB에 대한 정밀 고속 가공 기술에 대한 수요도 급격히 확대되고 있다. 따라서 장비 운영의 효율성 극대화 및 설비 투자를 최소화하고 단일 장비로 절단(half cut, full cut), 제거, 트리밍, 리페어 고정 등을 수행할 수 있는 장비 개발을 위한 스캐너/스테이지 고정밀 제어, Z축 스텝가공, 멀티포인트 비전 인식을 통한 왜곡 최소화 등의 요소기술 개발관련 내용을 소개하고자 한다.

  • PDF

Multiple Vehicle Tracking System Using Stereo Vision (스테레오 비전을 이용한 다중 차량 추적 시스템)

  • Lim, Young-Chul;Kim, Dongyoung;Lee, Chung-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1321-1323
    • /
    • 2013
  • 지능형 자동차에서 영상 기반 능동 안전시스템의 신뢰성을 확보하기 위해서는 도로 위의 다양한 객체를 강건하게 검출하고, 추적하는 것이 가장 중요하다. 본 논문에서는 다중 가설 기반 추적 프레임워크를 이용하여, 실시간으로 전방 차량을 검출하고 추적하는 시스템을 제안한다. 제안한 시스템은 다양한 외부 도로 환경에서 획득된 실험 영상에 대하여 10-15Hz 의 처리 속도로, 평균적으로 98%의 인식률을 제공할 수 있다.

Korean and English Text Image Super-Resolution for Improving Text Recognition Accuracy (텍스트 인식률 개선을 위한 한글 및 영어 텍스트 이미지 초해상화)

  • Kwon, Junhyeong;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.11a
    • /
    • pp.72-75
    • /
    • 2022
  • 야외 환경을 카메라로 촬영한 일반 영상에서 텍스트 이미지를 검출하고 인식하는 기술은 로봇 비전, 시각 보조 등의 기반이 되는 기술로 활용될 수 있어 매우 중요한 기술이다. 하지만 저해상도의 텍스트 이미지의 경우 텍스트 이미지에 포함된 노이즈나블러 등이 더 두드러지기 때문에 텍스트 내용을 인식하는 것이 어렵다. 이에 본 논문은 일반 영상에서의 저해상도 한글 및 영어 텍스트에 대한 이미지 초해상화를 통해 텍스트 인식 정확도를 개선하였다. 트랜스포머에 기반한 모델로 한글 및 영어 텍스트에 대한 이미지 초해상화를 수행하였으며, 영어 및 한글 데이터셋에 대해 제안한 초해상화 방법을 적용했을 때 그렇지 않을 때보다 텍스트 인식 성능이 개선되는 것을 확인하였다.

  • PDF

Deep Learning-based Real-Time Super-Resolution Architecture Design (경량화된 딥러닝 구조를 이용한 실시간 초고해상도 영상 생성 기술)

  • Ahn, Saehyun;Kang, Suk-Ju
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.228-229
    • /
    • 2020
  • 최근 딥러닝 기술은 여러 컴퓨터 비전 응용 분야에서 많이 쓰이고 있다. 물체 인식, 분류 및 영상 생성 등을 예로 들 수 있다. 특히 초고해상도 변환 문제에서 최근 딥러닝을 사용하면서 큰 성능 개선을 얻고 있다. Fast super-resolution convolutional neural network (FSRCNN)은 딥러닝 기반 초고해상도 알고리즘으로 잘 알려져 있으며, 여러 개의 convolutional layer로 추출한 저 해상도의 입력 특징을 활용하여 deconvolutional layer에서 초고해상도의 영상을 출력하는 알고리즘이다. 본 논문에서는 병렬 연산 효율성을 고려한 FPGA 기반 convolutional neural networks 가속기를 제안한다. 특히 deconvolutional layer를 convolutional layer로 변환하는 방법을 통해서 에너지 효율적인 가속기를 설계했다. 또한 제안한 방법은 FPGA 리소스를 고려하여 FSRCNN의 구조를 변형한 Optimal-FSRCNN을 제안한다. 사용하는 곱셈기의 개수를 FSRCNN 대비 2.4 배 압축하였고, 초고해상도 변환 성능을 평가하는 지표인 PSNR은 FSRCNN과 비슷한 성능을 내고 있다. 이를 통해서 FPGA 에 최적화된 네트워크를 구현하여 FHD 입력 영상을 UHD 영상으로 출력하는 실시간 영상처리 기술을 개발했다.

  • PDF

서보모터 일체형 유압펌프의 특징 및 개발동향

  • Seong, Baek-Ju
    • 기계와재료
    • /
    • v.22 no.4
    • /
    • pp.58-66
    • /
    • 2010
  • 서보모터 일체형 유압펌프는 핵심 유압기술과 전기 및 전자 제어기술로 구성되는 다분야 융합기술로서, 이와 관련된 기술을 활용하는 전기, 기계, 유압 등 거의 전 산업분야에 걸쳐 이 기술의 국산화 개발에 따른 파급효과가 크다. 특히, 이 개발 기술의 특징은 기존 유사제품과의 동일 출력대비 획기적인 저소음화와 컴팩트화 그리고 에너지 절감의 극대화를 이루었다는데 있다. 본 기술의 개발과정을 통해서 전기 및 기계의 일체화 설계기술, 제작기술, 주물기술, 유체해석기술, 시험평가기술 등 선진국에 비해 상대적으로 취약한 이 분야의 국내 기술인프라 기반기술을 확고히 할 수 있는 계기가 될 수 있다. 본 고에서는 서보모터 일체형 유압펌프의 산업, 기술 동향 및 특허동향 분석을 통한 연구개발 방향 변화를 살펴보고, 향후 기대되는 기술적 비전을 소개하였다.

  • PDF

A Real-time Vision-based Page Recognition and Markerless Tracking in DigilogBook (디지로그북에서의 비전 기반 실시간 페이지 인식 및 마커리스 추적 방법)

  • Kim, Ki-Young;Woo, Woon-Tack
    • 한국HCI학회:학술대회논문집
    • /
    • 2009.02a
    • /
    • pp.493-496
    • /
    • 2009
  • Many AR (Augmented Reality) applications have been interested in a marker-less tracking since the tracking methods give camera poses without attaching explicit markers. In this paper, we propose a new marker-less page recognition and tracking algorithm for an AR book application such as DigilogBook. The proposed method only requires orthogonal images of pages, which need not to be trained for a long time, and the algorithm works in real-time. The page recognition is done in two steps by using SIFT (Scale Invariant Feature Transform) descriptors and the comparison evaluation function. And also, the method provides real-time tracking with 25fps ~ 30fps by separating the page recognition and the frame-to-frame matching into two multi-cores. The proposed algorithm will be extended to various AR applications that require multiple objects tracking.

  • PDF

Study of Methodology for Recognizing Multiple Objects (다중물체 인식 방법론에 관한 연구)

  • Lee, Hyun-Chang;Koh, Jin-Kwang
    • Journal of the Korea Society of Computer and Information
    • /
    • v.13 no.7
    • /
    • pp.51-57
    • /
    • 2008
  • In recent computer vision or robotics fields, the research area of object recognition from image using low cost web camera or other video device is performed actively. As study for this, there are various methodologies suggested to retrieve objects in robotics and vision research areas. Also, robotics is designed and manufactured to aim at doing like human being. For instance, a person perceives apples as one see apples because of previously knowing the fact that it is apple in one's mind. Like this, robotics need to store the information of any object of what the robotics see. Therefore, in this paper, we propose an methodology that we can rapidly recognize objects which is stored in object database by using SIFT (scale invariant feature transform) algorithm to get information about the object. And then we implement the methodology to enable to recognize simultaneously multiple objects in an image.

  • PDF

Road Surface Classification Using Weight-Based Clustering Algorithm (가중치 기반 클러스터링 기술을 이용한 도로표면 유형 분류 알고리즘)

  • Kim, Hyungmin;Song, Joongseok;Park, Jong-Il
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.11a
    • /
    • pp.146-149
    • /
    • 2014
  • 최근 자동차 산업과 IT 기술의 융합이 활발해지면서 스마트카, 자율주행 자동차(무인 자동차)와 같은 지능형 자동차 개발이 활발히 진행되고 지능형 자동차의 비전 기반 기술개발도 활발히 진행되고 있다. 고속도로와 같이 포장된 도로나 자갈길과 같은 비포장 도로에서도 운전자의 승차감을 고려한 능동적 안전시스템과 안정적인 자율주행 자동차의 주행능력을 보장하는 기술들 중 도로 유형을 판단하는 것이 중요 요소 중 하나이다. 따라서 본 논문에서는 가중치 기반 클러스터링 기술을 이용하여 도로표면 유형을 분류하는 알고리즘을 제안한다. 아스팔트, 자갈길, 흙길, 눈길의 도로표면 영상 데이터를 히스토그램의 분포도와 최고점 위치, 에지 영상의 에지량, 채도성분을 이용하여 특징값을 추출하고 클러스터를 구성한다. 분류할 입력 도로표면 영상에 대해 특징값을 분석한 후 탐색범위 내 선택된 각 클러스터의 벡터와의 거리를 측정하여 가중치를 계산하고 가중치가 높은 클러스터를 분류하여 입력 영상에 대한 도로표면을 결정한다. 실험결과 제안하는 방법이 각 도로표면 영상의 특징값과 이를 이용한 가중치만을 이용하여 약 91.25%의 정확도로 도로의 표면을 분류해 내는 것을 볼 수 있었다.

  • PDF

Comparison of Image Compression Performance based on RoI Extraction Methods for Machines Vision (RoI 추출 방법에 따른 기계를 위한 영상 압축 성능 비교)

  • Lee, Yegi;Kim, Shin;Yoon, Kyoungro
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.146-149
    • /
    • 2022
  • 기존 RDO(Rate Distortion Optimization) 기반 압축 방식은 압축 성능에 초점을 두기 때문에 영상 내 인지 특성이 무시될 수 있다. 따라서 RoI(Region of Interest)을 기반으로 압축률을 조절하는 연구가 고안[1, 2, 3, 4] 되었으며, HVS(Human Visual System) 관점에서 영상 내 중요한 부분에 대해 더 높은 품질로 영상을 압축하는 연구가 대부분이다. 최근 인공지능 기술이 발전함에 따라 지능형 영상 분석에 대한 수요가 증가하고 있으며, 이에 따라 머신 비전을 위한 영상 부호화 및 효율적인 전송에 대한 필요성이 대두되고 있다. 본 논문에서는 VVC(Versatile Video Coding)의 dQP(delta Quantization Parameter)를 활용하여 RoI(Region of Interest) 기반압축 방법을 제안하고, 두가지의 RoI 추출 방식을 소개한다. Detectron2 Faster R-CNN X101-FPN [5]의 첫번째 탐지기를 통해 후보 영역 기반 RoI 을 추출하고, 두번째 탐지기를 통해 객체 기반 RoI 을 추출하여, 영상 내 객체 부분과 비객체 부분으로 나누어 서로 다른 압축률로 압축을 수행하였으며, 이에 따른 성능을 비교하고자 한다.

  • PDF