• 제목/요약/키워드: bounding box

검색결과 156건 처리시간 0.023초

공간분할트리를 이용한 효율적인 충돌탐지 방법에 관한 연구 (A Study on Method for Effective Collision Detection Using a Spatial Partition Tree)

  • 남승우;정연철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.11-14
    • /
    • 2002
  • 게임에서 충돌탐지는 게임의 성능향상을 위해 중요하다. 본 논문에서는 효율적인 충돌탐지를 위해 BSP 트리를 사용한다. 공격에 사용되는 스프라이트와 공격의 대상이 되는 스프라이트를 트리로 구성하여 빠른 시간내에 충돌탐지를 행한다. 또한 스프라이트의 모양에 따라 경계 볼륨(bounding volume)을 구와 박스(box)를 선택적으로 사용하여 충돌탐지에서 발생하는 문제점을 해결한다.

  • PDF

자연 영상에서 획 너비 추정 기반 텍스트 영역 이진화 (The Binarization of Text Regions in Natural Scene Images, based on Stroke Width Estimation)

  • ;김정환;이귀상
    • 스마트미디어저널
    • /
    • 제1권4호
    • /
    • pp.27-34
    • /
    • 2012
  • In this paper, a novel text binarization is presented that can deal with some complex conditions, such as shadows, non-uniform illumination due to highlight or object projection, and messy backgrounds. To locate the target text region, a focus line is assumed to pass through a text region. Next, connected component analysis and stroke width estimation based on location information of the focus line is used to locate the bounding box of the text region, and each box of connected components. A series of classifications are applied to identify whether each CC(Connected component) is text or non-text. Also, a modified K-means clustering method based on an HCL color space is applied to reduce the color dimension. A text binarization procedure based on location of text component and seed color pixel is then used to generate the final result.

  • PDF

GAP 군집화에 기반한 필기 한글 단어 분리 (Word Segmentation in Handwritten Korean Text Lines based on GAP Clustering)

  • 정선화;김수형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.660-667
    • /
    • 2000
  • 본 논문에서는 필기 한글 문자열 영상에 대한 단어 분리 방법을 제안한다. 제안된 방법은 gap 의 크기 정보를 사용하여 단어를 분리하는데, 이때 gap은 문자열 영상을 수직방향으로 투영한 후 흰-런 (white-run)을 찾음으로써 구할 수 있다. 문자열 영상으로부터 얻어지는 gap들의 크기를 측정한 후, 각각의 gap을 단어와 단어사이에 존재하는 gap과 문자와 문자사이에 존재하는 gap 중 하나로 분류한다. 본 논문에서는 필기 영문 문자열의 단어 분리를 위해 제안된 기존의 세 가지 거리 척도를 채택하고 군집화에 기반한 세 가지 분류방법을 적용하여 한글 문자열의 단어 분리를 위한 최적의 조합을 선정하였다. 우편봉투 상에 작성된 주소열로부터 수작업으로 추출한 305 개의 문자열 영상을 사용하여 실험한 결과 BB(bounding box) 거리를 사용하여 순차적 군집 방법을 적용하는 경우 3 순위까지의 누적 단어 분리 성공률이 88.52% 로서 가장 우수한 성능을 보여 주었다. 또한 하나의 문자열 영상에 대한 단어 분리 속도는 약 0.05초이다.

  • PDF

변형된 마칭큐브 테이블을 이용한 볼륨 광선 투과법 가속화 (Volume Ray Casting Acceleration Method using Modified Marching Cubes Tables)

  • 임석현;김주환;신병석
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권3호
    • /
    • pp.210-216
    • /
    • 2009
  • CPU기반의 볼륨 광선 투사법을 위하여 빈 공간을 도약하는 많은 방법들이 소개되었다. 하지만 광선의 샘플점이 투명한 공간과 비투명한 공간 사이에 있는 반투명-셀에 놓일 경우 기존의 방법들은 투명도 값을 매번 계산해야 하는 문제점이 있다. 이 문제를 해결하기 위하여 기존 마칭큐브를 이용하는 방법이 제안되었다. 광선이 반투명-셀에 도착하면 마칭큐브 방법을 이용하여 생성된 삼각형들을 둘러싸고 있는 육면체를 구하고, 현재 샘플점이 육면체 내/외부에 있는지 계산한다. 샘플점이 육면체 외부에 위치하면 투명하다고 판단되어 재샘플링 연산없이 다음 샘플점으로 이동한다. 하지만 기존의 마칭큐브 테이블 구조를 그대로 이용하면 인접한 복셀의 테이블 값을 여러 번 참조해야 하므로 비효율적이다. 본 논문에서는 볼륨 광선 투사법에 적합한 마칭큐브 테이블을 제안함으로써 렌더링 속도를 높인다.

피부색 범위의 점진적 확장에 의한 얼굴 검출 방법 (A Face Detection Method using Gradual Expansion of Skin Color Range)

  • 문대성;한영미;김민환
    • 한국멀티미디어학회논문지
    • /
    • 제4권5호
    • /
    • pp.396-405
    • /
    • 2001
  • 일반적으로 피부색과 유사한 칼라가 포함된 복잡한 배경으로부터 미리 정의된 단일 칼라 임계값을 이용해 얼굴영역을 정확하게 추출하는 것은 매우 어렵다. 이에 본 연구에서는 초기 피부색 범위를 점진적으로 확장시키면서 얼굴 영역을 추출하는 방법을 제안한다. 초기 피부색 범위는 인터넷에서의 다양한 영상으로부터 얼굴 영역의 피부색 분포를 분석하여 매우 밀집되어 나타나는 범위로 선정한다. 피부색 범위를 확장함에 따라 영상 공간에서의 얼굴후보 영역도 확장되어 나타나는데, 확장 단계별로 확장된 얼굴 후보 영역이 실제 얼굴임을 검증하기 위해 얼굴의 모양정보와 얼굴 기관의 위치적 정보를 사용한다. 모양 제한자로는 타원의 특성과 외접 사각형(bounding box)의 가로와 세로의 비율을 사용한다. 얼굴 기관으로는 눈과 입만을 사용했는데, 얼굴 후보 영역 내부의 가로 방향성을 가지는 경계가 주로 눈과 입의 영역임에 착안한 것으로서 비교적 수월하게 추출할 수 있기 때문이다. 실험을 통해, 제안한 방법이 하이라이트(highlight)에 의해 얼굴 영역의 일부가 왜곡된 경우와 얼굴 영역이 피부색과 유사한 배경에 인접해 있는 경우에 대해서도 강인하게 얼굴 영역을 추출할 수 있음을 확인할 수 있었다.

  • PDF

컬러 히스토그램과 CNN 모델을 이용한 객체 추적 (Object Tracking using Color Histogram and CNN Model)

  • 박성준;백중환
    • 한국항행학회논문지
    • /
    • 제23권1호
    • /
    • pp.77-83
    • /
    • 2019
  • 본 논문에서는 컬러 히스토그램과 CNN 모델을 이용한 객체 추적 기법 알고리즘을 제안한다. CNN (convolutional neural network) 모델기반 객체 추적 알고리즘인 GOTURN (generic object tracking using regression network)의 정확도를 높이기 위해 컬러 히스토그램 기반 mean-shift 추적 알고리즘을 합성하였다. 두 알고리즘을 SVM (support vector machine)을 통해 분류하여 추적 정확도가 더 높은 알고리즘을 선택하도록 설계하였다. Mean-shift 추적 알고리즘은 객체 추적에 실패할 때 경계 박스가 큰 범위로 움직이는 경향이 있어 경계 박스의 이동거리에 제한을 두어 정확도를 향상시켰다. 또한 영상 평균 밝기, 히스토그램 유사도를 고려하여 두 알고리즘의 추적 시작 위치를 초기화하여 성능을 높였다. 결과적으로 기존 GOTURN 알고리즘보다 본 논문에서 제안한 알고리즘이 전체적으로 정확도가 1.6% 향상되었다.

도심로 주행을 위한 딥러닝 기반 객체 검출 및 거리 추정 알고리즘 적용 (Application of Deep Learning-based Object Detection and Distance Estimation Algorithms for Driving to Urban Area)

  • 서주영;박만복
    • 한국ITS학회 논문지
    • /
    • 제21권3호
    • /
    • pp.83-95
    • /
    • 2022
  • 본 논문은 자율주행 차량 적용을 위한 객체 검출과 거리 추정을 수행하는 시스템을 제안한다. 객체 검출은 최근 활발하게 사용되는 딥러닝 모델 YOLOv4의 특성을 이용해서 입력 이미지 비율에 맞춰 분할 grid를 조정하고 자체 데이터셋으로 전이학습된 네트워크로 수행한다. 검출된 객체까지의 거리는 bounding box와 homography를 이용해 추정한다. 실험 결과 제안하는 방법에서 전반적인 검출 성능 향상과 실시간에 가까운 처리 속도를 보였다. 기존 YOLOv4 대비 전체 mAP는 4.03% 증가했다. 도심로 주행시 빈출하는 보행자, 차량 및 공사장 고깔(cone), PE드럼(drum) 등의 객체 인식 정확도가 향상되었다. 처리 속도는 약 55 FPS이다. 거리 추정 오차는 X 좌표 평균 약 5.25m, Y 좌표 평균 0.97m으로 나타났다.

차량 탑승 인원 감지를 위한 트리거 기술에 관한 연구 (A Study on the Trigger Technology for Vehicle Occupant Detection)

  • 이동진;이지원;장종욱;장성진
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.120-122
    • /
    • 2021
  • 현재 국내외 자동차 수요가 증가하게 되면서 차량탑승 인원은 적어지고 차량 수는 증가하는 추세이다. 이는 교통체증이 더 심해지게 되는 주요 원인이 된다. 이를 해결하기 위해 다인승 전용차로, HOV(High-occupancy vehicle) lane을 운영하고 있지만, 이용 조건을 무시하고 불법으로 이용하는 사람들이 계속 증가하고 있다. 이러한 불법행위를 경찰이 육안으로 판단하여 단속하기 때문에 단속 정확도도 낮으며 효율이 떨어진다. 본 논문에서는 이와 같은 문제를 해결하기 위해 컴퓨터 비전을 이용한 영상 분석 기술을 이용해서 보다 효율적인 탐지를 할 수 있는 시스템 설계를 제안한다. 기존의 연구되었던 차량 탐지 방법을 개선하여 영상 안에서 트리거를 설정하여 탐지 객체가 선정된 후 대상에 대해서 집중적으로 영상 분석을 진행할 수 있게 설계했으며 딥러닝 객체 인식 모델인 YOLO 모델을 사용하여 실시간 객체 탐지와 정확한 신호를 얻기 위해 영상 내 bounding box로 판단하는 것이 아닌 중심점의 이동량을 이용하는 방법을 제안한다.

  • PDF

딥러닝 모델을 활용한 실시간 인쇄물 문자 탐지 시스템 (Real-time Printed Text Detection System using Deep Learning Model)

  • 최예준;김송원;문미경
    • 한국전자통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.523-530
    • /
    • 2024
  • 웹페이지나 디지털 문서 등과 같은 온라인에서는 사용자가 검색하고 싶은 특정 단어나 특정 문구를 실시간으로 검색하는 기능이 있다. 인쇄된 도서나 참고서 등과 같은 인쇄물에는 실시간으로 특정 단어나 특정 문구를 찾는 기능이 없어 어려움을 겪는 경우가 많다. 본 논문에서는 텍스트를 탐지(Detection)하는 딥러닝 모델과 텍스트를 인식(Recognition)하는 OCR을 활용한 실시간 문자 탐지 시스템의 개발내용에 관해 기술한다. 본 연구에서는 EAST 모델을 사용하여 텍스트를 탐지하는 방법, 탐지한 텍스트를 EasyOCR을 사용하여 인식하는 방법, 인식한 텍스트를 사용자가 검색하고 싶은 특정 단어나 특정 문구를 비교하여 bounding box로 나타내는 방법을 제안한다. 이 시스템을 통해 사용자는 도서나 참고서 등과 같은 인쇄물에서 실시간으로 검색하고 싶은 특정 단어나 특정 문구를 찾아 필요한 정보를 쉽고 빠르게 찾는 것에 효과적일 것을 기대한다.

OpenGL을 이용한 대용량 Polygon Model의 View-Frustum Culling 기법 (A View-Frustum Culling Technique Using OpenGL for Large Polygon Models)

  • 조두연;정성준;이규얼;김태완;최항순;성우제
    • 한국게임학회 논문지
    • /
    • 제1권1호
    • /
    • pp.55-60
    • /
    • 2001
  • With rapid development of graphic hardware, researches on Virtual Reality and 3D Games have received more attention than before. For more realistic 3D graphic scene, objects were to be presented with lots of polygons and the number of objects shown in a scene was remarkably increased. Therefore, for effective visualization of large polygon models like this, view-frustum culling method, that visualizes only objects shown in the screen, has been widely used. In general, the bounding boxes that include objects are generated firstly, and the boxes are intersected with view-frustum to check whether object is in the visible area or not. Recently, an algorithm that can check in-out test of objects using OpenGL's selection mode, which is originally used to select the objects in the screen, is suggested. This algorithm is fast because it can use hardware acceleration. In this study, by implementing and applying this algorithm to large polygon models, we showed the efficiency of OpenGL assisted View-Frustum Culling algorithm. If this algorithm is applied to 3D games that have to process more complicated characters and landscapes, performance improvement can be expected.

  • PDF