• Title/Summary/Keyword: 영상 전처리

Search Result 1,103, Processing Time 0.037 seconds

Korean Lip Reading System Using MobileNet (MobileNet을 이용한 한국어 입모양 인식 시스템)

  • Won-Jong Lee;Joo-Ah Kim;Seo-Won Son;Dong Ho Kim
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.11a
    • /
    • pp.211-213
    • /
    • 2022
  • Lip Reading(독순술(讀脣術)) 이란 입술의 움직임을 보고 상대방이 무슨 말을 하는지 알아내는 기술이다. 본 논문에서는 MBC, SBS 뉴스 클로징 영상에서 쓰이는 문장 10개를 데이터로 사용하고 CNN(Convolutional Neural Network) 아키텍처 중 모바일 기기에서 동작을 목표로 한 MobileNet을 모델로 이용하여 발화자의 입모양을 통해 문장 인식 연구를 진행한 결과를 제시한다. 본 연구는 MobileNet과 LSTM을 활용하여 한국어 입모양을 인식하는데 목적이 있다. 본 연구에서는 뉴스 클로징 영상을 프레임 단위로 잘라 실험 문장 10개를 수집하여 데이터셋(Dataset)을 만들고 발화한 입력 영상으로부터 입술 인식과 검출을 한 후, 전처리 과정을 수행한다. 이후 MobileNet과 LSTM을 이용하여 뉴스 클로징 문장을 발화하는 입모양을 학습 시킨 후 정확도를 알아보는 실험을 진행하였다.

  • PDF

A Research on Anomaly type of face detection using Neural Network (신경망을 이용한 정상·비정상 얼굴유형 탐지 연구)

  • Kim, Woon-Yoeng;Weon, IllYoung
    • Annual Conference of KIPS
    • /
    • 2009.11a
    • /
    • pp.623-624
    • /
    • 2009
  • 본 논문에서는 신경망의 오류 역전파(Backpropagation) 학습 알고리즘을 이용한 얼굴의 정상 비정상을 인식하는 보안 시스템을 제안하였다. 제안된 시스템은 정지영상 및 동영상에서 입력된 얼굴영상을 전처리 단계에서 얼굴영역을 검출하여 $160{\times}160$ 크기의 고정 크기로 확대 및 축소 작업을 거친다. Mosaic 처리와 LaplacianEdge 처리를 거쳐 $40{\times}40$ 크기로 이진화한 정규화 데이터를 Gravity-Center 처리를 한다. 오류 역전파 학습 알고리즘으로 얼굴의 특징을 학습한 후 각종 정상 및 비정상 얼굴 데이터를 이용하여 인식률을 실험 하였다. 실험데이터는 이 분야의 공인 자료인 LFW Face Database[7] 데이터를 사용하였으며, 실험결과는 제안된 방법이 문제 해결에 적합한 접근임을 보여준다.

Development of integrated data augmentation automation tools for deep learning (딥러닝 학습용 집적화된 데이터 증강 자동화 도구 개발)

  • Jang, Chan-Ho;Lee, Seo-Young;Park, Goo-Man
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.283-286
    • /
    • 2021
  • 4차 산업혁명을 맞이해 최근 산업 및 기술 영역에서는 인공지능을 이용한 생산력 향상, 자동화 등 딥러닝의 보편화가 빠르게 진행되고 있다. 또한, 딥러닝의 성능을 도출하기 위해서는 수많은 양의 학습용 데이터가 필요하며 그 데이터의 양은 딥러닝 모델의 성능과 정비례한다. 이에 본 작품은 최신형 영상처리 Library인 Albumentations를 이용하여 영상처리 알고리즘을 이용하여 이미지를 증강하고, 이미지 데이터 크롤링 기능을 통해 Web에서 영상 데이터를 수집을 자동화하며, Label Pix를 연동하여 수집한 데이터를 라벨링 한다. 더 나아가 라벨링 된 데이터의 증강까지 포함하여 다양한 증강 자동화를 한 인터페이스에 집적시켜 딥러닝 모델을 생성할 때 데이터 수집과 전처리를 수월하게 한다. 또한, Neural Net 기반의 AdaIN Transfer를 이용하여 이미지를 개별적으로 학습하지 않고 Real time으로 이미지의 스타일을 옮겨올 수 있도록 하여 그림 데이터의 부족 현상을 해결한다.

  • PDF

A Histogram Matching Scheme for Color Pattern Classification (컬러패턴분류를 위한 히스토그램 매칭기법)

  • Park, Young-Min;Yoon, Young-Woo
    • The KIPS Transactions:PartB
    • /
    • v.13B no.7 s.110
    • /
    • pp.689-698
    • /
    • 2006
  • Pattern recognition is the study of how machines can observe the environment, learn to distinguish patterns of interest from their background, and make sound and reasonable decisions about the categories of the patterns. Color image consists of various color patterns. And most pattern recognition methods use the information of color which has been trained and extract the feature of the color. This thesis extracts adaptively specific color feature from images with several limited colors. Because the number of the color patterns is limited, the distribution of the color in the image is similar. But, when there are some noises and distortions in the image, its distribution can be various. Therefore we cannot extract specific color regions in the standard image that is well expressed in special color patterns to extract, and special color regions of the image to test. We suggest new method to reduce the error of recognition by extracting the specific color feature adaptively for images with the low distortion, and six test images with some degree of noises and distortion. We consequently found that proposed method shouws more accurate results than those of statistical pattern recognition.

Automated Image Matching for Satellite Images with Different GSDs through Improved Feature Matching and Robust Estimation (특징점 매칭 개선 및 강인추정을 통한 이종해상도 위성영상 자동영상정합)

  • Ban, Seunghwan;Kim, Taejung
    • Korean Journal of Remote Sensing
    • /
    • v.38 no.6_1
    • /
    • pp.1257-1271
    • /
    • 2022
  • Recently, many Earth observation optical satellites have been developed, as their demands were increasing. Therefore, a rapid preprocessing of satellites became one of the most important problem for an active utilization of satellite images. Satellite image matching is a technique in which two images are transformed and represented in one specific coordinate system. This technique is used for aligning different bands or correcting of relative positions error between two satellite images. In this paper, we propose an automatic image matching method among satellite images with different ground sampling distances (GSDs). Our method is based on improved feature matching and robust estimation of transformation between satellite images. The proposed method consists of five processes: calculation of overlapping area, improved feature detection, feature matching, robust estimation of transformation, and image resampling. For feature detection, we extract overlapping areas and resample them to equalize their GSDs. For feature matching, we used Oriented FAST and rotated BRIEF (ORB) to improve matching performance. We performed image registration experiments with images KOMPSAT-3A and RapidEye. The performance verification of the proposed method was checked in qualitative and quantitative methods. The reprojection errors of image matching were in the range of 1.277 to 1.608 pixels accuracy with respect to the GSD of RapidEye images. Finally, we confirmed the possibility of satellite image matching with heterogeneous GSDs through the proposed method.

Radiometric Correction Algorithm for KITSAT-3 Images (우리별 3호 영상의 복사학적 보정 알고리즘)

  • Shin, Dongseok;Kwak, Sunghee;Kim, Tag-Gon
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.2 no.2
    • /
    • pp.9-14
    • /
    • 1999
  • This paper describes an algorithm for the correction of major radiometric errors shown in MEIS (Multi-spectral Earth Imaging System) images on board KITSAT-3. MEIS images contain various radiometric errors as also shown in the images obtained from other remote sensing sensors. This paper introduces the two major radiometric error sources shown in MEIS images and the corresponding correction algorithm. The proposed algorithm was integrated to an operational preprocessing software and validated by applying the algorithm to several tens of MEIS images. This algorithm will therefore applied operationally to raw MEIS images before they are distributed to users.

  • PDF

Shape region segmentation based on color and edge characteristics of moving images (동영상의 컬러 및 에지 정보에 기초한 shape 영역 segmentation 기법 연구)

  • Park, Jin-Nam;Lee, Jae-Duck;Yoon, Sung-Soo;Huh, Young;Jung, Sung-Hwan
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2001.11b
    • /
    • pp.149-154
    • /
    • 2001
  • 멀티미디어 정보표현 기술인 MPEG-7 표준이 빠른 속도의 진전을 보임에 따라 이를 활용한 검색 기술 개발도 활발히 진행 중에 있다 방대한 량의 동영상 내용 검색 기술 연구에 있어서 우선적으로 고려되어야 할 부분이 내용이 연속되는 프레임들의 분류이다. 이를 위해서는 물리적인 장면전환이 이루어지는 부분에 대한 실시간 자동 cut detection 기술 및 이 컷 프레임 영상에 대한 내용 기술을 자동적으로 수행할 필요성이 있다. 각 컷 프레임의 자동 내용 기술의 전처리로써 본 논문에서는 장면전환이 생기는 프레임의 영상의 어떠한 정보도 사전 정보로 취하지 않고 사용자의 개입이 없는 상황에서 영상의 컬러 특성 및 에지 정보만을 가지고 shape 영역 segmentation을 자동으로 실행하는 방법을 제안한다. 제안한 방법의 성능은 segmentation된 영상과 원 영상과의 영역비교를 통한 유사도에 의해 평가하며, 시뮬레이션 결과에서 제안한 알고리즘은 평균 90%이상의 영역 분할이 정확하게 됨을 알 수 있었고, 컬러의 구분이 명확하지 않은 자연영상에서도 robust한 segmentation 결과를 나타냄을 본 연구를 통하여 알 수 있었다.

  • PDF

An Image Resolution Enhancement Algorithm Using Low Level Interpolation (하위 레벨 보간을 이용한 영상 해상도 향상 기술)

  • Kim, Won-Hee;Kim, Jong-Nam
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2009.05a
    • /
    • pp.865-869
    • /
    • 2009
  • An image resolution enhancement is mainly utilized as pre-processing technique for various image processing application. It requires to decrease image quality deterioration such as blurring. In this paper, we propose an image resolution enhancement algorithm using low level interpolation. In the proposed algorithm, we calculate an error using low level interpolation, estimate an error image from the calculated error. The estimated error image is added interpolated high resolution image, it become lastly reconstruction image. Our experiments obtained the average PSNR about 1dB which is improved results better than conventional method for sensitive image quality. Also, subjective image quality with edge region is more clearness. The proposed method may be helpful for applications in various multimedia systems such as image restoration.

  • PDF

High resolution satellite image classification enhancement using restortation of buildin shadow and occlusion (건물 그림자와 폐색 보정을 통한 고해상도 위성영상의 분류정확도 향상)

  • Kim, Hye-Jin;Han, You-Kyung;Choi, Jae-Wan;Kim, Yong-Il
    • Proceedings of the KSRS Conference
    • /
    • 2009.03a
    • /
    • pp.13-17
    • /
    • 2009
  • 고해상도 위성영상의 분류 기술은 최근 가장 활발히 연구되고 있는 분야 중 하나로 텍스쳐(texture), NDVI, PCA 영상 등 다양한 전처리 정보들을 추출하고 이를 멀티스펙트럴 밴드와 조합하여 분류 정확도를 높이는 기술을 개발하는 연구들이 주를 이루고 있다. 고해상도 위성영상에서 건물의 그림자와 옆벽면의 폐색 지역은 개체 추출 및 분류를 방해하는 주된 요인이 되며, 다양한 형태와 분광특성을 갖는 개개의 건물은 자동 분류 과정을 통해 제대로 식별되지 않는다는 한계를 갖는다. 이에 본 연구에서는 KOMPSAT-2 단영상으로부터 효율적으로 건물 정보 및 토지피복을 분류하기 위하여, 추출된 건물 정보를 바탕으로 건물의 그림자와 폐색지역을 보정한 후 비건물 지역에 대한 분류를 수행하여 분류 정확도를 높이고자 하였다. 우선 삼각벡터구조 기반의 반자동 인터페이스를 이용하여 건물의 3차원 모델 및 그림자 영역을 추출하고 이로부터 추출된 그림자 영역을 효과적으로 보정하기 위해 반복 선형회귀 연산을 이용한 그림자 보정을 수행한 후 inpainting 기법을 건물 폐색영역 복원에 적용하여 영상의 품질을 향상시켰다. 이러한 과정을 통해 도심 지역의 영상 분석에 있어 가장 큰 오차를 일으키는 인공물의 그림자와 폐색에 의한 오차를 최소화한 후 분류에 적용하여 이를 보정 전 영상을 이용한 분류 결과와 비교하였다.

  • PDF

Video Transmission Method for Constant Video Quality in Next-Generation Wireless Networks (차세대 이동망에서 영상 품질을 보장하기 위한 전송 방법)

  • Park, Sang-Hyun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2007.06a
    • /
    • pp.175-178
    • /
    • 2007
  • According to recently presented QoS architecture by 3GPP, a traffic conditioner may be deployed to provide conformance of the negotiated QoS. A real-time frame-layer rate control method which can be applied to the traffic conditioner is proposed. The proposed rate control method uses a non-iterative optimization method for low computational complexity, and performs bit allocation at the frame level to minimize the average distortion over an entire sequence as well as variations in distortion between frames. The proposed algorithm does not produce time delay from encoding, and is suitable for real-time low-complexity video encoder.

  • PDF