• 제목/요약/키워드: 객체윤곽 추출알고리즘

검색결과 50건 처리시간 0.023초

형태학적 특성과 FCM 기반 퍼지 RBF 네트워크를 이용한 컨테이너 식별자 인식 (Container Identifier Recognition Using Morphological Features and FCM-Based Fuzzy RBF Network)

  • 김광백;김영주;우영운
    • 한국정보통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.1162-1169
    • /
    • 2007
  • 본 논문에서는 항만에서 취급하는 컨테이너의 식별자를 인식하는 방법을 제안한다. 실제 컨테이너 영상을 그레이 영상으로 변환한 후, 프리윗 마스크(Prewitt mask)를 적용하여 윤곽선을 검출하고 컨테이너를 식별할 수 있는 개별 식별자의 형태학적 특징 정보를 이용하여 식별자 후보 영역을 추출한다. 검출된 식별자 후보 영역은 개별 식별자 영역외에 잡음 영역이 포함되어 있으므로 4방향 윤곽선 추적 알고리즘과 Grassfire 알고리즘을 적용하여 잡음을 제거하고 개별 식별자들을 각각 객체화한다. 잡음이 제거된 식별자 후보 영역에서 객체화 한 개별식자는 컨테이너 식별을 위해 FCM 기반 퍼지 RBF 네트워크를 적용하여 인식한다. 본 논문에서 제안한 컨테이너 식별자 인식 방법의 성능을 평가하기 위해 실제 컨테이너 영상 300장을 대상으로 실험한 결과, 기존의 방법보다 인식 성능이 개선되었음을 확인할 수 있었다.

CUDA 기반 영상 분할을 사용한 비사실적 렌더링 (Non-Photorealistic Rendering Using CUDA-Based Image Segmentation)

  • 윤현철;박종승
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권11호
    • /
    • pp.529-536
    • /
    • 2015
  • 비사실적 렌더링(NPR; Non-Photorealistic Rendering)은 2차원 영상과 3차원 모델을 대상으로 하는 방법이 다르며 각각의 대상에 NPR을 적용하여 두 콘텐츠를 혼합하면 이질감이 나타나는 문제점이 있다. 본 논문에서는 3차원 객체와 영상에 있어서 각각의 대상에 카툰 및 스케치와 같은 비사실적 효과를 적용하여 조화롭게 혼합하는 기법을 제시한다. 제안 기법은 2차원 영상의 데이터를 분석하여 컬러 분포 특징을 얻고 이를 이용하여 실사 영상이나 3D 객체의 컬러 수를 줄인다. 단순화된 컬러맵과 윤곽선 에지 데이터로부터 비사실적 렌더링을 실시한다. 컬러맵 정보의 추출 및 적용 과정에서 자연스러운 장면 연출을 위해서 영상분할 과정이 필요하다. 그러나 영상분할 기법은 많은 연산을 필요로 한다. 특히 크기가 큰 입력에 대해서는 비사실적 렌더링에 많은 시간이 소요된다. 처리 시간이 많은 영상분할의 고속화를 위하여 GPU(Graphics Processing Unit)를 이용한 병렬 컴퓨팅을 할 수 있는 GPGPU(General-Purpose GPU)를 사용한다. GPGPU의 사용으로 알고리즘의 수행속도를 크게 개선하였다. 또한 영상분할 후 단순화된 컬러를 추출하여 일련의 컬러맵을 생성한 뒤 3D 객체에 NPR을 적용할 때 추출해낸 컬러맵을 적용하여 2차원 영상과 3차원 객채 간의 이질감을 줄이고 조화롭게 하였다.

투영된 모션과 히스토그램 인터섹션을 이용한 강건한 물체추적 (Robust object tracking using projected motion and histogram intersection)

  • 이봉석;문영식
    • 정보처리학회논문지B
    • /
    • 제9B권1호
    • /
    • pp.99-104
    • /
    • 2002
  • 기존의 물체추적기법은 템플릿 매칭, 물체의 경계선 재 검출, 물체의 움직임 정보 등을 사용하여 수행되었다. 그러나, 템플릿 매칭의 경우 많은 계산 시간을 요구하고, 경계선을 재 검출하는 경우 윤곽선이 잘못 설정되는 경우가 있으며, 물체의 움직임 정보를 사용하는 경우에는 움직이는 카메라에서 움직이는 물체만을 추적하기가 쉽지 않은 단점이 있다. 본 논문에서는 투영된 모션과 히스토그램 인터섹션을 이용한 강건한 물체추적 방법을 제안한다. 초기 객체추출은 영상분할 후 영역선택을 통하여 구성하고 선택된 객체를 가로 및 세로의 밝기 값을 1차원 신호로 투영하여 객체의 개략적인 평행이동 벡터를 추정한다. 추정된 변위를 기준으로 하여 객체의 가능한 회전 및 스케일에 대한 템플릿을 구성하고, 이들에 대하여 개선된 히스토그램 인터섹션을 사용하여 물체 추적을 수행한다. 제안한 알고리즘의 강건한 물체추적 성능을 실험에 의하여 확인하였다.

최적 pRBFNNs 패턴분류기 기반 2차원 영상과 ASM 알고리즘을 이용한 얼굴인식 알고리즘 설계 (Design of Optimized pRBFNNs-based Face Recognition Algorithm Using Two-dimensional Image and ASM Algorithm)

  • 오성권;마창민;유성훈
    • 한국지능시스템학회논문지
    • /
    • 제21권6호
    • /
    • pp.749-754
    • /
    • 2011
  • 본 연구에서는 최적 pRBFNNs 패턴분류기 기반 2차원 영상과 ASM 알고리즘을 이용한 얼굴인식 시스템을 설계하고자 한다. 기존의 2차원 영상 기반 얼굴 인식 기법들은 인식하고자 하는 객체의 영상내의 위치, 크기 및 배경의 존재 유무에 따라 인식률이 영향을 받는 단점이 있으며, 본 연구에서는 이를 보완하기 위하여 관심 영역 내에서의 얼굴 영역 추출 및 특징 추출기법을 이용한 얼굴인식 방법을 소개한다. 본 연구에서는 CCD 카메라를 이용하여 영상을 획득하고 히스토그램 평활화를 이용하여 조명으로 왜곡된 영상정보를 개선한다. AdaBoost 알고리즘을 이용하여 얼굴영역을 검출하고 ASM을 통하여 얼굴 윤곽선 및 형상을 추출하여 개인 프로필을 구성한 후 PCA 알고리즘을 사용하여 고차원 얼굴데이터의 차원을 축소한다. 그리고 인식 모듈로서 pRBFNNs 패턴분류기를 제안한다. 제안된 다항식 기반 RBFNNs은 조건부, 결론부, 추론부 세 가지의 기능적 모듈로 구성되어 있고 조건부는 퍼지 클러스터링을 사용하여 입력 공간을 분할하고, 결론부는 분할된 로컬 영역을 다항식 함수로 표현한다. 또한 차분진화 알고리즘을 이용하여 제안된 분류기의 파라미터, 즉, 학습률, 모멘텀 계수, 퍼지 클러스터링의 퍼지화 계수를 최적화한다. 제안된 다항식 기반 RBFNNs는 얼굴 인식을 위한 패턴분류기로서 직접 CCD 카메라로부터 입력받은 데이터를 영상 보정, 얼굴 검출 및 특징 추출 등과 같은 데이터 전 처리 과정을 포함하여 고차원 데이터로 이루어진 얼굴 영상에 대한 인식 성능을 확인한다.

영역 확장 기반 추적을 이용한 3차원 의료 영상 분할 기법 (3D Medical Image Segmentation Using Region-Growing Based Tracking)

  • 고선영;이재연;임정은;나종범
    • 대한의용생체공학회:의공학회지
    • /
    • 제21권3호
    • /
    • pp.239-246
    • /
    • 2000
  • 본 논문에서는, 입력으로 주어진 사람이 직접 분할한 1장의 슬라이스의 결과로부터 인접한 슬라이스들에 대해서 자동으로 원하는 장기를 추적하여 분할하는 반자동 분할 알고리즘을 제안한다. 일반적으로. 영역 확장에 기반한 추적 방법은 객체 투영. 초기 영역(seed) 추출, 그리고 영역확장에 의한 윤곽선 결정의 세 단계로 이루어진다. 이 때 의료 영상의 특성 상 장기들 사이의 경계가 모호한 경우 잘못 선택된 초기 영역은 최종 윤곽선이 장기 안쪽으로 파고 들거나 주변 영역으로 퍼져 나가는 결과를 만들 수 있다. 제안한 알고리즘에서는 영상의 특성을 이용하여 분할하려는 장기와 비슷한 밝기 값을 가지는 주변 장기와 붙어 있는 부분에서 주의 깊게 초기 영역을 선택해 줌으로써. 적절한 경계를 얻을 수 있으며, 경사도가 낮은 영역에서 깨끗한 윤곽선을 얻지 못하는 영역 확장 방법의 문제점의 해결을 위하여 Fourier descriptor를 사용한 후처리(post-Processing) 방법을 제안하였다. 또한, 양 방향 추적을 통해서 새로운 영역이 나타났을 때에도 놓치지 않고 찾아낼 수 있다. 본 논문에서 제안한 알고리즘을 1mm 간격의 82장의 X선 CT 영상에서 좌우측 신장 분할에 적용한 결과 만족할 만한 결과를 얻었다.

  • PDF

환자움직임 감지를 위한 효율적인 하드웨어 및 소프트웨어 혼성 모드 영상처리시스템설계에 관한 연구 (A study on the design of an efficient hardware and software mixed-mode image processing system for detecting patient movement)

  • 정승민;정의성;김명환
    • 인터넷정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.29-37
    • /
    • 2024
  • 본 논문에서는 환자와 같은 특정 객체의 움직임을 감지하고 추적하기 위한 효율적인 영상처리 시스템을 제안한다. 이진화된 차 영상에서 객체의 윤곽선추출을 위하여 기존 알고리즘대비 대비 정밀한 감지가 가능하고 혼성모드설계에 용이한 세선화 알고리즘을 적용하여 영역을 추출한다. 연산량이 많은 이진화와 세선화 단계를 RTL(Register Transfer Level) 기반으로 설계하여 논리회로 합성을 거쳐 최적화된 하드웨어 블록으로 대체된다. 설계된 이진화 및 세선화 블록은 표준 180n CMOS 라이브러리를 이용하여 논리회로로 합성한 후 시뮬레이션을 통하여 동작을 검증하였다. 소프트웨어기반의 성능비교를 위해 32bit FPGA 임베디드시스템 환경에서 640 × 360 해상도의 샘플 영상을 적용하여 이진 및 세선화 연산에 대한 성능분석도 실시하였다. 검증결과 혼성모드 설계가 이전의 소프트웨어로만 이루어지는 처리속도에서 이진 및 세선화 단계에서 93.8% 향상될 수 있음을 확인하였다. 제안된 객체인식을 위한 혼성모드 시스템은 인공지능 네트워크가 적용되지 않는 엣지 컴퓨팅 환경에서도 환자의 움직임을 효율적으로 감시할 수 있을 것으로 기대된다.

필기체 숫자 데이터 차원 감소를 위한 선분 특징 분석 알고리즘 (Line-Segment Feature Analysis Algorithm for Handwritten-Digits Data Reduction)

  • 김창민;이우범
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권4호
    • /
    • pp.125-132
    • /
    • 2021
  • 인공신경망의 계층의 깊이가 깊어지고 입력으로 사용되는 데이터 차원이 증가됨에 신경망의 학습 및 인식에 있어서 많은 연산을 고속으로 요구하는 고연산의 문제가 발생한다. 따라서 본 논문에서는 신경망 입력 데이터의 차원을 감소시키기 위한 데이터 차원 감소 방법을 제안한다. 제안하는 선분 특징 분석(Line-segment Feature Analysis; LFA) 알고리즘은 한 영상 내에 존재하는 객체의 선분(Line-segment) 특징을 분석하기 위하여 메디안 필터(median filter)를 사용한 기울기 기반의 윤곽선 검출 알고리즘을 적용한다. 추출된 윤곽 영상은 [0, 1, 2, 4, 8, 16, 32, 64, 128]의 계수 값으로 구성된 3×3 또는 5×5 크기의 검출 필터를 이용하여 8가지 선분의 종류에 상응하는 고유값을 계산한다. 각각의 검출필터로 계산된 고유값으로부터 동일한 반응값을 누적하여 두 개의 1차원의 256 크기의 데이터를 생성하고 두 가지 데이터 요소를 합산하여 LFA256 데이터를, 두 데이터를 합병하여 512 크기의 LAF512 데이터를 생성한다. 제안한 LFA 알고리즘의 성능평가는 필기체 숫자 인식을 위한 데이터 차원 감소를 목적으로 PCA 기법과 AlexNet 모델을 이용하여 비교 실험한 결과 LFA256과 LFA512가 각각 98.7%와 99%의 인식 성능을 보였다.

피사계 심도가 낮은 이미지에서 웨이블릿 기반의 자동 ROI 추출 및 마스크 생성 (An Automatic ROI Extraction and Its Mask Generation based on Wavelet of Low DOF Image)

  • 박순화;서영건;이부권;강기준;김호용;김형준;김상복
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.93-101
    • /
    • 2009
  • 본 논문에서는 웨이블릿 변환 된 고주파 서브밴드들의 에지 정보를 이용하여 관심 객체 영역을 고속으로 자동 검출해주는 새로운 알고리즘을 제안하였다. 제안된 방법에서는 에지정보를 이용하여 블록단위의 4-방향 객체 윤곽탐색 알고리즘(4-DOBS)을 수행하여 관심객체를 검출한다. 전체 이미지는 $64{\times}64$또는 $32{\times}32$ 크기의 코드 블록으로 먼저 나누어지고, 각 코드 블록 내에 에지들이 있는지 없는지에 따라 관심 코드블록 또는 배경이 된다. 4-방향은 바깥쪽에서 이미지의 중앙으로 탐색하고, 피사계 심도가 낮은 이미지는 중앙으로 갈수록 에지가 발견된다는 특징을 이용한다. 에지를 모두 발견하면 내부의 이미지 블록은 모두 관심영역으로 간주하고, 이 블록들은 빠르게 마스킹되어 서버로 전송되어 동적 ROI를 제공한다. 이는 기존 방법들의 문제점이였던 복잡한 필터링 과정과 영역병합 문제로 인한 높은 계산 복잡도를 상당히 개선시킬 수 있었고, 블록 단위의 처리로 인하여 실시간 처리를 요하는 응용에서도 적용 가능하였다.

항공 LiDAR 데이터를 이용한 건물추출과 상부구조물 특성분석 및 모델링 (Utilizing Airborne LiDAR Data for Building Extraction and Superstructure Analysis for Modeling)

  • 정형섭;임새봄;이동천
    • 한국측량학회지
    • /
    • 제26권3호
    • /
    • pp.227-239
    • /
    • 2008
  • 항공 레이저 스캐닝(ALS) 시스템으로부터 획득한 LiDAR 데이터를 미용하여 3차원 객체 모델링과 지형도 제작을 위해서는 데이터의 기하학적 및 의미적인 분할과 같은 체계적인 데이터 처리가 선행되어야 한다. ALS로 부터 활용 가능한 LiDAR 데이터를 획득하기 위해서는 GPS, INS 및 레이저 스캐너 데이터의 통합이 필수적이다. 본 연구에서는 건물추출과 지붕 구조물 분할을 위해서 LiDAR 데이터를 영상화하여 디지털 영상처리 기법을 적용하였다. 영상화된 데이터를 사용하는 주요 장점 중 하나는 기존의 다양한 영상처리 알고리즘을 사용할 수 있다는 점이다. 격자화 및 정량화를 거치는 영상화 과정에서 원시 LiDAR 데이터가 한정된 밝기값으로 변환되므로 평활화 및 상세 정보의 손실이 발생될 수 있지만. 평활화된 데이터는 표면분할과 모델링에 오히려 적합하다. 건물의 경계선은 윤곽선 추출 연산자를 이용하여 정확하게 추출하였으며, 건물 모양에 적합하도록 규격화하였다. 건물 지붕의 구조물의 분할은 영역확산을 기반으로 수행하였다. 이 결과 다양한 디지털 영상처리 기법을 복합적으로 적용하여 건물추출과 지붕 구조물의 면분할이 가능함을 보여주었다. 또한 지붕의 형태를 재현하기 위한 특성정보 추출에 관한 개념적 방법을 제안하였다. 지붕 데이터를 분할하고 모델링을 위해 통계적 및 기하적 특성을 이용하였으며. 제안한 방법에 의한 시뮬레이션 결과는 지붕면을 분할하고 모델링하는데 가능함을 보여주고 있다.

2 단계 결정트리 학습을 이용한 뇌 자기공명영상 분류 (Classification of Brain Magnetic Resonance Images using 2 Level Decision Tree Learning)

  • 김형일;김용욱
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권1호
    • /
    • pp.18-29
    • /
    • 2007
  • 본 논문에서는 뇌 자기공명영상을 분류하기 위하여 결정트리 알고리즘을 2 단계로 적용하는 영상 분류 시스템을 제안한다. 영상으로부터 얻을 수 있는 정보에는 두 종류가 있다. 하나는 크기, 색상, 질감, 윤곽선 등 영상으로부터 직접 얻을 수 있는 하위레벨 특징들이고, 다른 하나는 특정 객체의 존재 유무, 여러 부위 사이의 공간적 관계 등 분할된 영상들에 대한 해석을 통해서 얻을 수 있는 상위레벨 특징들이다. 의미에 따라 영상을 분류하기 위해서는 상위레벨 특징들을 기반으로 학습 및 분류가 수행되어야 한다. 제안하는 시스템에서는 결정트리 학습을 각각의 레벨에 개별적으로 적용하며, 하위레벨 분류 결과를 이용하여 상위레벨의 특징을 추출한다. 종양이 있는 뇌 자기공명영상 집합에 대하여 분류 실험을 수행하였으며, 몇 가지 실험 결과를 통해 제안된 시스템의 효과를 확인하였다.