• 제목/요약/키워드: Image Normalization

검색결과 246건 처리시간 0.029초

한국어 8모음 자동 독화에 관한 연구 (A Study on Speechreading about the Korean 8 Vowels)

  • 이경호;양룡;김선옥
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.173-182
    • /
    • 2009
  • 본 논문은 한국어 8단모음을 인식하기 위한 효율적인 파라미터의 추출과 자동 독화 시스템의 구축에 관하여 연구한 것이다. 얼굴의 특징들은 다양한 칼라 공간에서 다양한 값으로 표현되는 것을 이용하여 각 표현 값들을 증폭하거나 또는 축소, 대비시켜 얼굴 요소들이 추출되도록 하였다. 눈과 코의 위치, 안쪽 입의 외곽선, 윗입술의 상단, 이의 외곽선을 특징 점으로 찾았으며, 이를 분석하여 안쪽 입의 면적, 안쪽 입의 높이와 폭, 이의 보임 비율 코와 윗입술 상단과의 거리를 파라미터로 사용하였다. 2400개의 영상으로 분석하였고 이 분석을 바탕으로 신경망 시스템을 구축한 후 인식 실험을 하였다. 정상인 5명이 동원되었고, 사람들 사이에 있는 관찰 오차를 정규화를 통하여 수정하였으며 실험하여 파라미터의 유용성 관점에서 좋은 결과를 얻었다.

Measurement of nuclear fuel assembly's bow from visual inspection's video record

  • Dusan Plasienka;Jaroslav Knotek;Marcin Kopec;Martina Mala;Jan Blazek
    • Nuclear Engineering and Technology
    • /
    • 제55권4호
    • /
    • pp.1485-1494
    • /
    • 2023
  • The bow of the nuclear fuel assembly is a well-known phenomenon. One of the vital criteria during the history of nuclear fuel development has been fuel assembly's mechanical stability. Once present, the fuel assembly bow can lead to safety issues like excessive water gap and power redistribution or even incomplete rod insertion (IRI). The extensive bow can result in assembly handling and loading problems. This is why the fuel assembly's bow is one of the most often controlled geometrical factors during periodic fuel inspections for VVER when compared e.g. to on-site fuel rod gap measurements or other instrumental measurements performed on-site. Our proposed screening method uses existing video records for fuel inspection. We establish video frames normalization and aggregation for the purposes of bow measurement. The whole process is done by digital image processing algorithms which analyze rotations of video frames, extract angles whose source is the fuel set torsion, and reconstruct torsion schema. This approach provides results comparable to the commonly utilized method. We tested this new approach in real operation on 19 fuel assemblies with different campaign numbers and designs, where the average deviation from other methods was less than 2 % on average. Due to the fact, that the method has not yet been validated during full scale measurements of the fuel inspection, the preliminary results stand for that we recommend this method as a complementary part of standard bow measurement procedures to increase measurement robustness, lower time consumption and preserve or increase accuracy. After completed validation it is expected that the proposed method allows standalone fuel assembly bow measurements.

Efficient Semi-automatic Annotation System based on Deep Learning

  • Hyunseok Lee;Hwa Hui Shin;Soohoon Maeng;Dae Gwan Kim;Hyojeong Moon
    • 대한임베디드공학회논문지
    • /
    • 제18권6호
    • /
    • pp.267-275
    • /
    • 2023
  • This paper presents the development of specialized software for annotating volume-of-interest on 18F-FDG PET/CT images with the goal of facilitating the studies and diagnosis of head and neck cancer (HNC). To achieve an efficient annotation process, we employed the SE-Norm-Residual Layer-based U-Net model. This model exhibited outstanding proficiency to segment cancerous regions within 18F-FDG PET/CT scans of HNC cases. Manual annotation function was also integrated, allowing researchers and clinicians to validate and refine annotations based on dataset characteristics. Workspace has a display with fusion of both PET and CT images, providing enhance user convenience through simultaneous visualization. The performance of deeplearning model was validated using a Hecktor 2021 dataset, and subsequently developed semi-automatic annotation functionalities. We began by performing image preprocessing including resampling, normalization, and co-registration, followed by an evaluation of the deep learning model performance. This model was integrated into the software, serving as an initial automatic segmentation step. Users can manually refine pre-segmented regions to correct false positives and false negatives. Annotation images are subsequently saved along with their corresponding 18F-FDG PET/CT fusion images, enabling their application across various domains. In this study, we developed a semi-automatic annotation software designed for efficiently generating annotated lesion images, with applications in HNC research and diagnosis. The findings indicated that this software surpasses conventional tools, particularly in the context of HNC-specific annotation with 18F-FDG PET/CT data. Consequently, developed software offers a robust solution for producing annotated datasets, driving advances in the studies and diagnosis of HNC.

갑상선 초음파 영상의 평활화 알고리즘에 따른 U-Net 기반 학습 모델 평가 (Evaluation of U-Net Based Learning Models according to Equalization Algorithm in Thyroid Ultrasound Imaging)

  • 정무진;오주영;박훈희;이주영
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제47권1호
    • /
    • pp.29-37
    • /
    • 2024
  • This study aims to evaluate the performance of the U-Net based learning model that may vary depending on the histogram equalization algorithm. The subject of the experiment were 17 radiology students of this college, and 1,727 data sets in which the region of interest was set in the thyroid after acquiring ultrasound image data were used. The training set consisted of 1,383 images, the validation set consisted of 172 and the test data set consisted of 172. The equalization algorithm was divided into Histogram Equalization(HE) and Contrast Limited Adaptive Histogram Equalization(CLAHE), and according to the clip limit, it was divided into CLAHE8-1, CLAHE8-2. CLAHE8-3. Deep Learning was learned through size control, histogram equalization, Z-score normalization, and data augmentation. As a result of the experiment, the Attention U-Net showed the highest performance from CLAHE8-2 to 0.8355, and the U-Net and BSU-Net showed the highest performance from CLAHE8-3 to 0.8303 and 0.8277. In the case of mIoU, the Attention U-Net was 0.7175 in CLAHE8-2, the U-Net was 0.7098 and the BSU-Net was 0.7060 in CLAHE8-3. This study attempted to confirm the effects of U-Net, Attention U-Net, and BSU-Net models when histogram equalization is performed on ultrasound images. The increase in Clip Limit can be expected to increase the ROI match with the prediction mask by clarifying the boundaries, which affects the improvement of the contrast of the thyroid area in deep learning model learning, and consequently affects the performance improvement.

PCA와 LDA을 이용한 차량 번호판 통합 인식에 관한 연구 (A Study on Recognition of Both of PCA and LAD Using Types of Vehicle Plate)

  • 이진기;김현열;이승규;이건화;박영록;안기남;배철수;박영철
    • 한국정보전자통신기술학회논문지
    • /
    • 제6권1호
    • /
    • pp.6-17
    • /
    • 2013
  • 최근 들어 기존의 녹색 바탕의 차량 번호판에서, 흰색 바탕의 신 차량 번호판으로 교체되고 있다. 하지만, 아직 기존의 차량 번호판이 신 차량 번호판으로 전면 교체 되지 않아 두 번호판 모두 사용되고 있기 때문에 주차 관리 시스템, 속도위반, 신호 위반 등 무인 카메라를 이용한 시스템에서, 기존 차량 번호판과 신 차량 번호판 특징에 맞는 인식 시스템이 요구된다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 기존의 녹색 번호판과 흰색 번호판 모두를 추출하고 인식 할 수 있는 알고리즘에 관한 연구를 수행하였다. 다양한 환경에서 획득한 차량 영상으로부터 번호판 영역을 추출하기 위하여 형태학적 특징을 이용하였고, 추출된 번호판 영역의 수평, 수직 히스토그램과 문자의 상대적 위치 정보를 이용하여, 문자를 분리하였다. 최종적으로, 분리된 문자를 인식하기 위해 주성분 분석법(PCA : Principal Component Analysis)과 선형 판별 분석법(LDA : Linear Discriminant Analysis)을 적용하여 인식 시스템을 구성하였다. 실험 결과, 불규칙한 조명 상태에서도 상대적으로 높은 추출률과 문자 인식률을 나타내었다.

부분공간과 LVQ 분류기에 기반한 실시간 얼굴 인식 (Real-Time Face Recognition Based on Subspace and LVQ Classifier)

  • 권오륜;민경필;전준철
    • 인터넷정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.19-32
    • /
    • 2007
  • 본 논문에서는 실시간 얼굴인증 시스템의 구축을 위한 LVQ 신경망 기반의 새로운 얼굴 인식 방법을 제안한다. 기존의 연구에서 PCA, LDA 변환이 많이 적용되며 신경망을 결합한 형태가 제안되고 있지만 신경망 학습 시간이 오래 걸리는 단점을 가지고 있다. LVQ 신경망은 학습 시간이 짧고 클래스간의 분리도를 최대화할 수 있는 교사학습방법이다. 따라서, 본 논문에서 제안된 방법은 동영상으로부터 실시간으로 입력되는 얼굴영상을 PCA와 LDA변환을 순차적으로 적용하여 부분공간상의 변환된 특징벡터로부터 LVQ 신경망의 학습을 통하여 얼굴을 인식한다. 외부조명의 영향에 강건한 인식시스템을 구축하기 위하여 얼굴검출 단계에서 검출된 얼굴영역은 밝기값의 최대-최소 정규화 방법에 의해 보정된 정규화 영상을 생성한다. 정규화된 얼굴영상은 PCA와 LDA 변환을 통해 부분공간상의 특징벡터로 변환된다. 변환된 훈련 데이터로부터 LVQ 신경망의 초기 중심 벡터를 결정하고 신경망의 학습률 향상을 위해 K-Means 클러스터링 알고리즘을 적용하며, 초기 중심 벡터를 이용하여 LVQ2 학습 방법에 의해 학습된 중심벡터는 클래스의 대표 벡터가 된다. 결국 각 클래스의 대표 벡터로부터 입력 영상의 특징벡터간의 유클리디언 거리 비교법을 적용하여 얼굴 인식을 수행한다. ORL 데이터베이스를 이용한 정지 영상에 대한 인식과 실시간으로 입력되는 영상에 대한 인식 등 두 가지 형태의 영상을 기반으로 실험한 결과 두 경우에 모두 제안된 방법이 기존의 인식 방법보다 인식률에서 우수함을 입증할 수 있었다.

  • PDF

다중 분류기의 판정단계 융합에 의한 얼굴인식 (Multi-classifier Decision-level Fusion for Face Recognition)

  • 염석원
    • 대한전자공학회논문지SP
    • /
    • 제49권4호
    • /
    • pp.77-84
    • /
    • 2012
  • 얼굴인식 기술은 지능형 보안, 웹에서 콘텐츠 검색, 지능로봇의 시각부분, 머신인터페이스 등, 활용이 광범위 하다. 그러나 일반적으로 대상자의 표정과 포즈 변화, 주변의 조명 환경과 같은 문제가 있으며 이와 더불어 원거리에서 획득한 영상의 경우 저해상도를 비롯하여 블러와 잡음에 의한 영상의 열화 등의 여러 가지 어려움이 발생한다. 본 논문에서는 포톤 카운팅(Photon-counting) 선형판별법(Linear Discriminant Analysis)을 이용한 다중 분류기(Classifier)에 의한 판정을 융합하여 얼굴 영상 인식을 수행한다. Fisher 선형판별법은 집단 간 분산을 최대로 하고 집단 내 분산을 최소로 하는 공간으로 선형 투영하는 방법으로, 학습영상의 수가 적을 경우 특이행렬 문제가 발생하지만 포톤카운팅 선형 판별법은 이러한 문제가 없으므로 차원축소를 위한 전 처리 과정이 필요 없다. 본 논문의 다중 분류기는 포톤 카운팅 선형판별법의 유클리드 거리(Euclidean Distance) 또는 정규화된 상관(Normalized Correlation)을 적용하는 판정규칙에 따라 구성된다. 다중분류기의 판정의 융합은 각 분류기 cost의 정규화(Normalization), 유효화(Validation), 그리고 융합규칙(Fusion Rule)으로 구성된다. 각 분류기에서 도출된 cost는 같은 범위로 정규화된 후 유효화 과정에서 선별되고 Minimum, 또는 Average, 또는 Majority-voting의 융합규칙에 의하여 융합된다. 실험에서는 원거리에서 획득한 효과를 구현하기 위하여 고해상도 데이터베이스 영상을 인위적으로 Unfocusing과 Motion 블러를 이용하여 열화하여 테스트하였다. 실험 결과는 다중분류기 융합결과의 인식률은 단일분류기보다 높다는 것을 보여준다.

다중 해상도 가버 특징 벡터를 이용한 강인한 눈 검출 (Robust Eye Localization using Multi-Scale Gabor Feature Vectors)

  • 김상훈;정수환;조성원;정선태
    • 전자공학회논문지CI
    • /
    • 제45권1호
    • /
    • pp.25-36
    • /
    • 2008
  • 눈 검출은 눈 동공의 정 중앙의 위치를 찾아내는 작업을 의미하며, 얼굴 인식 및 관련된 응용 분야 등에서 필요한 작업이다. 현재까지 보고된 대부분의 눈 검출 방법의 경우 성공적인 적용을 위해서는 여전히 정확도 및 검출 속도의 개선을 필요로 한다. 본 논문에서는 큰 계산량의 부담이 없는 다중 해상도 가버 특징 벡터를 이용한 강인한 눈 검출 방법을 제안한다. 가버 특징 벡터를 사용한 눈 검출은 EBGM 등에서 이미 이용되고 있다. 그런데, RBGM 등에서 사용한 눈 검출 방법은 초기값에 민감하고 조명, 자세 등에 강인하지 못하여, 만족할 만한 검출률을 얻기 위해서는 광범위한 탐색 범위가 필요하다. 이는 계산량의 상당한 증가를 초래한다. 본 논문에서 제안한 눈 검출 방법은 다중 해상도 접근 방법을 활용한다. 먼저, 원래 해상도 얼굴 이미지를 다운샘플링하여 얻은 저해상도 얼굴 이미지에서, 초기 추정 눈 위치에서의 가버 특징 벡터와 해당 해상도의 눈에 대한 가버 특징 벡터 모델과의 가버젯 유사도를 이용하여 눈 위치를 검출한다. 이후 검출된 눈 위치를 업스케일링하여 상위 해상도의 얼굴 이미지에서의 눈 위치 초기값으로 취하고 앞 단계에서처럼 가버젯 유사도를 이용하여 눈을 검출한다. 이 과정을 반복하여 최종적으로 원래 해상도 얼굴 이미지에서의 눈 위치를 확정한다. 또한, 본 논문에서는 제안된 다중 해상도 접근 방법이 조명에 대해서도 보다 강인하도록 하는 데 효과적인 조명 정규화 기법을 제안하고, 이를 다중 해상도 접근 방법의 전처리 단계에 추가적으로 적용함으로써 눈 검출 성공률을 더욱 개선하였다. 실험을 통해, 본 논문에서 제안한 다중스케일 가버 특징 벡터 기반 눈 검출 방법은 계산량을 크게 증가 시키지 않으면서 기존 연구들에서 보고된 다른 눈 검출 방법에 비해 정확도가 개선된 검출 방법이며, 자세 및 조명 변화에 대해서도 강인하다는 것을 확인하였다.

웨이브릿 변환 영역의 칼라 및 질감 특징을 이용한 영상검색 (Image Retrieval Using Multiresoluton Color and Texture Features in Wavelet Transform Domain)

  • 천영덕;성중기;김남철
    • 대한전자공학회논문지SP
    • /
    • 제43권1호
    • /
    • pp.55-66
    • /
    • 2006
  • 본 논문에서는 웨이브릿 변환된 영역에서 추출된 다해상도 칼라 및 질감 특징의 효율적인 결합을 이용한 점진적 영상검색 기법을 제안한다. 칼라 특징으로 칼라 영상의 H(Hue)와 S(Saturation) 성분의 칼라 오토코렐로그램을 선택하였고, 질감 특징으로는 V(value) 성분의 BDIP와 BVLC 모멘트를 선택하였다 선택된 특징들에 대하여 웨이브릿 변환 영역의 각 분해 레벨로부터 다해상도 특징벡터들을 얻었다. 칼라와 질감 특징의 다해상도 특징벡터들은 특징들의 차원들과 표준 편차 벡터들에 의해 정규화되어 효율적으로 결합되었고, 저장 공간을 고려하여 각 대상 영상들의 특징벡터들은 효율적으로 양자화 되었으며 점진적 검색 기법을 적용하여 유사도 계산시 계산량을 줄였다. 제안한 방법은 칼라 히스토그램, 칼라 오토코렐로그램, SCD, CSD, 웨이브릿 모멘트, EHD, BDIPBVLC, 칼라 히스토그램과 웨이브릿 모멘트의 결합을 이용한 방법들보다 정확도 대 재현율 평가에서는 평균 $15\%,$ ANMRR 평가에서는 평균 0.2 향상된 성능을 나타내었다. 특히, 제안한 방법은 다양한 해상도를 가지는 영상 DB에서 더욱 우수한 성능을 나타내었다

인공위성 화상데이터를 이용한 솔잎혹파리 피해 확산모델의 개발 (A Development of Damaged Spread Model of the Pine Needle Gall Midge Using Satellite Image Data)

  • 안기원;이효성;서두천;신석효
    • 대한공간정보학회지
    • /
    • 제6권2호
    • /
    • pp.105-117
    • /
    • 1998
  • 본 연구에서는 Landsat-5 TM 데이터를 사용하여, 강원도 양양군, 인제군, 홍천군 일부지역을 대상으로 솔잎혹파리 피해지역과 경년변화를 효율적으로 추출할 수 있는 기법을 연구 제시하였다. 또한 피해상황을 파악하여 피해지역의 지형적 상관관계를 규명하고, 피해확산방향을 예측하여, 인공위성 화상데이터가 산림의 병충해 감시에 유용함을 입증함과 아울러, 효과적인 방제를 위한 기초자료를 제공하는데 그 목적이 있다. 연구결과 수치표고화상을 이용한 BRCT(Backwards Radiance Correction Transformation)기법을 통하여 지형영향으로 인한 그림자지역을 효과적으로 제거시켜, 피해지역 추출시 그 유효성을 높일 수 있었다. 분류된 피해지역은 분석결과 경사 $31^{\circ}{\sim}38^{\circ}$, 온도 $21^{\circ}C{\sim}25^{\circ}C$, 남서 남동 사면 및 산지 최고 표고의 $23%{\sim}39%$에서 피해가 주로 발생하며, 피해가 확산되는 신규지역은 경사향 $46^{\circ}{\sim}180^{\circ}$, 경사도 $27^{\circ}{\sim}30^{\circ}$, 온도 $11^{\circ}C{\sim}12^{\circ}C$ 및 산지최고표고의 $27%{\sim}39%$ 지역에서 피해가 주로 확산됨을 알 수 있었으며, 신규피해지역의 환경인자와 식생지수를 이용하여 피해예측지수(NDI; New Damaged Index)를 개발하였다.

  • PDF