• 제목/요약/키워드: error segmentation

검색결과 213건 처리시간 0.023초

프레임 특징 비교를 이용한 압축비디오 분할 (MPEG Video Segmentation Using Frame Feature Comparison)

  • 김영호;강대성
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.25-30
    • /
    • 2003
  • 최근 들어 디지털 기술의 발전은 문자, 음성, 화상, 비디오 등과 같은 멀티미디어 정보가 매우 큰 비중을 차지하고 있다 이들 중에서 비디오와 관련된 연구로는 비디오 색인 및 검색에 관한 연구가 많이 진행되고 있다. 본 논문에서는 MPEG으로 압축된 비디오 분할을 위한 새로운 알고리즘을 제안한다. Shot 검출 즉 장면전환 검출은 MPEG 비디오 시퀀스에서 분할하는 가장 기본적이면서 중요한 작업이며 비디오 색인 및 검색을 위한 첫 번째 단계이다. 일반적으로 많이 사용되는 분할 알고리즘은 이전 프레임과 현재 프레임을 비교하기 때문에 물체의 빠른 움직임이나 카메라의 움직임, 카메라 후레쉬의 섬광 등 화면 변화에 따라 오검출이 생기는 단점이 있었다 따라서 본 논문에서는 기존 알고리즘에 검출한 장면전환 지점을 사용하여 이웃 프레임들과의 특징차 비교를 통하여 한번 더 판별하였다. 실험 결과 기존 알고리즘 보다 정확한 장면전환 검출을 할 수 있었다.

  • PDF

고휘도 영역의 적합성 평가에 기반한 광원 보상 (Illumination Compensation Based on Conformity Assessment of Highlight Regions)

  • 권오설
    • 방송공학회논문지
    • /
    • 제19권1호
    • /
    • pp.75-82
    • /
    • 2014
  • 본 논문에서는 이색성 반사 모델에서 분할 과정을 없애는 동시에 카메라의 잡음을 제거함으로써 광원을 보상하는 방법을 제안한다. 일반적으로 고휘도 영역의 화소는 광원에 대한 많은 정보를 포함하게 된다. 따라서 고휘도 영역을 분석함으로써 광원의 특성을 쉽게 분석할 수 있다. 이때 기존의 방법은 고휘도 영역 분할이 필요하고, 이로 인해 영역 분할의 정확성이 광원 추정의 결과에 영향을 미치게 된다. 본 논문은 고휘도 영역에 대해 안정도를 평가함으로써 영역 분할 과정을 생략할 수 있다. 또한 이 과정에서 잡음 및 센서의 불균일에 따른 정확성 감소의 요인들은 제거하였다.

딥러닝 기법을 이용한 망막 혈관 분할 (Retinal Blood Vessel Segmentation using Deep Learning)

  • 김범상;이익현
    • 한국정보기술학회논문지
    • /
    • 제17권5호
    • /
    • pp.77-82
    • /
    • 2019
  • 당뇨망막증은 망막의 말초혈관에 순환장애가 일어나 발생하는 당뇨병의 합병증으로, 이를 진단하기 위하여 미세혈관류를 분할하였다. 기존 필터와 특징을 사용한 혈관분할은 두꺼운 혈관은 비교적 잘 분할을 하나, 미세한 혈관에 대해서는 정확도가 떨어진다는 단점이 있다. 그리하여 전처리로 노이즈 제거를 위한 필터, 영상 대비를 위한 히스토그램 평활화를 사용하였으며, 픽셀 단위 분할을 위해 딥러닝 기법을 이용하였다. 기존 방법의 정확도는 90% ~ 94%이며, 제안한 방법의 정확도는 95%이다. 결과 영상에서 시신경 유두 및 삼출몰 주변에서 분할 오류가 나타나는 문제점이 있으나, 이는 네트워크 깊이가 얕음에 의한 오류로 향후 네트워크 변경을 통해 정확도를 개선할 수 있다.

잉여수체계를 이용한 MDC프로세서의 설계에 관한 연구 (A study on the Design of MDC Processor using the Residue Number System)

  • 김형민;조원경
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1988년도 전기.전자공학 학술대회 논문집
    • /
    • pp.662-665
    • /
    • 1988
  • This paper proposes the Minimum-Distance Classification(MDC) processor using the Residue Number System(RNS). The proposed MDC Processor in this paper is efficient for real-time pattern clustering application and illustrate satisfiable error rate in application experiments of image segmentation but error rate increase as cluster number do.

  • PDF

DCT와 정보 화소 밀도를 이용한 PDA로 획득한 명함 영상에서의 영역 해석 (Region Analysis of Business Card Images Acquired in PDA Using DCT and Information Pixel Density)

  • 김종흔;장익훈;김남철
    • 한국통신학회논문지
    • /
    • 제29권8C호
    • /
    • pp.1159-1174
    • /
    • 2004
  • 본 논문에서는 PDA에 장착된 카메라를 사용하여 획득한 명함 영상에 대한 효율적인 영역 해석 알고리듬을 제안한다. 제안된 방법은 크게 영역 분할, 정보 영역 분류, 문자 영역 분류의 3개 과정으로 구성된다. 영역 분할에서는 입력 명함 영상을 8${\times}$8 크기의 블록으로 나누고 각 블록을 저주파 대역에서의 정규화 된 DCT 계수의 에너지를 이용하여 정보 블록과 배경 블록으로 분류한 다음, 블록에 대한 영역 라벨링을 통하여 정보 영역과 배경 영역으로 분할한다. 정보 영역 분류에서는 각 정보 영역을 블록 신호의 수평, 수직 방향 에지 성분과 저주파 대역에서의 DCT 계수의 에너지 비와 이진화 된 정보 영역 내에서의 흑화소인 정보 화소의 밀도를 이용하여 문자 영역과 배경 영역으로 분류한다. 문자 영역 분류에서는 분류된 문자 영역을 정보 화소의 밀도와 평균 런 길이를 이용하여 다시 큰 문자와 작은 문자 영역으로 분류한다. 실험결과 제안된 영역 해석 방법은 여러 종류의 명함을 다양한 주변 여건에서 PDA로 획득한 시험 영상에 대하여 정보 영역과 배경 영역을 잘 분할하고, 정보 영역을 문자 영역과 그림 영역으로 잘 분류하며, 다시 문자 영역을 큰 문자와 작은 문자 영역으로 잘 분류함을 보였다 그리고 제안된 영역 분할 방법과 정보 영역 분류 방법은 기존의 방법들보다 각각 약 2.2-10.1%와 7.7%의 에러율 향상을 보였다.

Automatic Liver Segmentation on Abdominal Contrast-enhanced CT Images for the Pre-surgery Planning of Living Donor Liver Transplantation

  • Jang, Yujin;Hong, Helen;Chung, Jin Wook
    • Journal of International Society for Simulation Surgery
    • /
    • 제1권1호
    • /
    • pp.37-40
    • /
    • 2014
  • Purpose For living donor liver transplantation, liver segmentation is difficult due to the variability of its shape across patients and similarity of the density of neighbor organs such as heart, stomach, kidney, and spleen. In this paper, we propose an automatic segmentation of the liver using multi-planar anatomy and deformable surface model in portal phase of abdominal contrast-enhanced CT images. Method Our method is composed of four main steps. First, the optimal liver volume is extracted by positional information of pelvis and rib and by separating lungs and heart from CT images. Second, anisotropic diffusing filtering and adaptive thresholding are used to segment the initial liver volume. Third, morphological opening and connected component labeling are applied to multiple planes for removing neighbor organs. Finally, deformable surface model and probability summation map are performed to refine a posterior liver surface and missing left robe in previous step. Results All experimental datasets were acquired on ten living donors using a SIEMENS CT system. Each image had a matrix size of $512{\times}512$ pixels with in-plane resolutions ranging from 0.54 to 0.70 mm. The slice spacing was 2.0 mm and the number of images per scan ranged from 136 to 229. For accuracy evaluation, the average symmetric surface distance (ASD) and the volume overlap error (VE) between automatic segmentation and manual segmentation by two radiologists are calculated. The ASD was $0.26{\pm}0.12mm$ for manual1 versus automatic and $0.24{\pm}0.09mm$ for manual2 versus automatic while that of inter-radiologists was $0.23{\pm}0.05mm$. The VE was $0.86{\pm}0.45%$ for manual1 versus automatic and $0.73{\pm}0.33%$ for manaual2 versus automatic while that of inter-radiologist was $0.76{\pm}0.21%$. Conclusion Our method can be used for the liver volumetry for the pre-surgery planning of living donor liver transplantation.

복부 컴퓨터 단층촬영영상에서 다중 확률 아틀라스 기반 형상제한 그래프-컷을 사용한 신실질 자동 분할 (Automatic Segmentation of Renal Parenchyma using Graph-cuts with Shape Constraint based on Multi-probabilistic Atlas in Abdominal CT Images)

  • 이재선;홍헬렌;나군호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제22권4호
    • /
    • pp.11-19
    • /
    • 2016
  • 본 논문에서는 복부 CT 영상에서 다중 확률 아틀라스 기반 형상제한 그래프-컷을 사용한 신실질 자동 분할 방법을 제안한다. 제안 방법은 다음의 세 단계로 구성된다. 첫째, 신실질의 다양한 형상정보를 이용하기 위해 피질기반 유사정합을 통한 다중 확률 아틀라스를 생성한다. 둘째, 최대사후확률 추정을 통해 그래프-컷의 초기 씨앗을 추출하고, 형상제한 그래프-컷을 통해 신실질을 분할한다. 셋째, 확률 아틀라스의 정합 오차를 줄이고 분할 정확도를 높이기 위해, 정합 및 분할을 반복적으로 수행한다. 제안방법의 성능을 평가하기 위해 정성적 평가 및 정량적 평가를 수행하였다. 실험결과 제안방법이 신실질과 유사한 밝기값을 갖는 주변 영역으로의 누출을 방지하여 개선된 분할 정확도를 보여준다.

관개용수로 CCTV 이미지를 이용한 CNN 딥러닝 이미지 모델 적용 (Application of CCTV Image and Semantic Segmentation Model for Water Level Estimation of Irrigation Channel)

  • 김귀훈;김마가;윤푸른;방재홍;명우호;최진용;최규훈
    • 한국농공학회논문집
    • /
    • 제64권3호
    • /
    • pp.63-73
    • /
    • 2022
  • A more accurate understanding of the irrigation water supply is necessary for efficient agricultural water management. Although we measure water levels in an irrigation canal using ultrasonic water level gauges, some errors occur due to malfunctions or the surrounding environment. This study aims to apply CNN (Convolutional Neural Network) Deep-learning-based image classification and segmentation models to the irrigation canal's CCTV (Closed-Circuit Television) images. The CCTV images were acquired from the irrigation canal of the agricultural reservoir in Cheorwon-gun, Gangwon-do. We used the ResNet-50 model for the image classification model and the U-Net model for the image segmentation model. Using the Natural Breaks algorithm, we divided water level data into 2, 4, and 8 groups for image classification models. The classification models of 2, 4, and 8 groups showed the accuracy of 1.000, 0.987, and 0.634, respectively. The image segmentation model showed a Dice score of 0.998 and predicted water levels showed R2 of 0.97 and MAE (Mean Absolute Error) of 0.02 m. The image classification models can be applied to the automatic gate-controller at four divisions of water levels. Also, the image segmentation model results can be applied to the alternative measurement for ultrasonic water gauges. We expect that the results of this study can provide a more scientific and efficient approach for agricultural water management.

SOM 기반의 계층적 군집 방법을 이용한 계산 효율적 비디오 객체 분할 (Computation ally Efficient Video Object Segmentation using SOM-Based Hierarchical Clustering)

  • 정찬호;김경환
    • 대한전자공학회논문지SP
    • /
    • 제43권4호
    • /
    • pp.74-86
    • /
    • 2006
  • 본 논문에서는 계산 효율적이고 노이즈에 강건한 비디오 객체 분할 알고리즘을 제안한다. 움직임 분할과 색 분할을 효율적으로 결합한 시공간 분할 방법의 구현을 위해 SOM 기반의 계층적 군집 방법을 도입하여 특징 벡터들의 군집 관점에서 분할 과정을 해석함으로써 기존의 객체 분할 방법에서 정확한 분할 결과를 얻기 위해서 요구되어지는 많은 연산량과 노이즈에 의한 시스템의 성능 저하 문제를 최소화한다. 움직임 분할 과정에서는 움직임 추정 에러에 의한 영향을 최소화하기 위해서 MRF 기반의 MAP 추정 방법을 이용하여 계산한 움직임 벡터의 신뢰도를 이용한다. 또한 움직임 분할의 성능 향상을 위해서 움직임 신뢰도 히스토그램을 이용한 노이즈 제거 과정을 거칠 뿐만 아니라 자동으로 장면 내에 존재하는 객체의 수를 구하기 위해서 군집 유효성 지표를 이용한다. 객체 추적의 성능 향상을 위해 교차 투영 기법을 이용하며, 분할 결과의 시간적 일관성 유지를 위해 동적 메모리를 이용한다. 다양한 특성을 가지는 비디오 시퀀스들을 이용한 실험을 통해 제안하는 방법이 계산 효율적이고 노이즈에 강건하게 비디오 객체 분할을 수행함은 물론 기존의 구현 방법에 비해 정확한 분할 결과를 얻을 수 있음을 확인하였다.

문자 영역을 강조하기 위한 적응적 오차 확산법 (Adaptive Error Diffusion for Text Enhancement)

  • 권재현;손창환;박태용;조양호;하영호
    • 대한전자공학회논문지SP
    • /
    • 제43권1호
    • /
    • pp.9-16
    • /
    • 2006
  • 본 논문에서는 최대 기울기 차이(maximum gradient difference, MGD)를 이용한 효과적인 문자 분할과 문자 영역을 강조하기 위한 적응적 오차 확산법을 제안한다. 스캔 라인을 따라 기울기를 계산하고, 잠재적 문자 영역을 융합하기 위해 국부적 윈도우 내에 MGD 값을 채운다. 노이즈 필터링을 거친 후, 배경에는 기존 오차 확산법, 문자에는 경계 향상 오차 확산법을 적용한다. 서로 다른 하프토닝 알고리즘의 사용으로 눈에 거슬리는 결함이 발생하기 때문에 경계 결함을 줄이기 위해 단계적 팽창(gradual dilation)을 적용한다. 단계적으로 팽창된 문자 영역(gradually dilated to저 region, GDTR)에 기반한 샤프닝(sharpening)은 문자 영역의 경계에서 연속적으로 점이 찍히는 것을 막을 수 있다. 제안한 적응적 오차 확산법은 일반적인 오차 필터를 이용하여 경계 향상 정도를 조절할 수 있는 칼라 하프토닝 방법이다. 경계 향상 정도와 색차를 분석하여 경계 향상 계수를 정하고, 경계 향상 오차 확산법의 사용으로 인해 점이 찍히지 않는 결함을 줄이기 위하여 추가적인 오차 요소를 반영하였다. 스캔한 영상을 제안한 방법을 이용하여 하프토닝하면 배경의 변화 없이 문자 부분이 선명한 결과를 얻을 수 있다.