• 제목/요약/키워드: 마스킹 기법

검색결과 136건 처리시간 0.028초

경량화된 임베디드 시스템에서 의미론적인 픽셀 분할 마스킹을 이용한 효율적인 영상 객체 인식 기법 (Efficient Object Recognition by Masking Semantic Pixel Difference Region of Vision Snapshot for Lightweight Embedded Systems)

  • 윤희지;박대진
    • 한국정보통신학회논문지
    • /
    • 제26권6호
    • /
    • pp.813-826
    • /
    • 2022
  • 카메라를 이용한 영상 처리와 그에 따른 인공지능 기술의 발달로 다양한 분야의 기술이 발전하기 시작했다. 하지만 보드가 가벼울수록 연산이 많이 필요한 영상 처리 알고리즘을 구현하기 힘들다. 본 논문에서는 경량 임베디드 보드에서 물체 인식 알고리즘을 위한 딥러닝을 사용하는 방법을 제안한다. 비교적 적은 양의 계산으로 segmentation을 처리하는 딥러닝 알고리즘을 사용하여 ROI(Region of Interest)를 결정할 수 있다. 영역을 마스킹한 후, 더 정확한 딥러닝 알고리즘을 사용해 물체 감지를 할 수 있다. Python에서 입력 이미지를 처리하기 위해 OpenCV를 사용했고 ENet과 YOLO(You Only Look Once)를 사용하여 이미지를 처리했다. 이 알고리즘을 실행함으로써 평균 오차가 절반으로 감소해 정확한 객체 검출을 처리할 수 있고 경량 임베디드 보드에서 실시간으로 객체 인식을 실행할 수 있다. 이 연구는 자율주행과 IoT에서 저가격 경량화된 응용에 활용될 수 있을 것으로 기대된다.

주파수 영역 심층 신경망 기반 음성 향상을 위한 실수 네트워크와 복소 네트워크 성능 비교 평가 (Performance comparison evaluation of real and complex networks for deep neural network-based speech enhancement in the frequency domain)

  • 황서림;박성욱;박영철
    • 한국음향학회지
    • /
    • 제41권1호
    • /
    • pp.30-37
    • /
    • 2022
  • 본 논문은 주파수 영역에서 심층 신경망 기반 음성 향상 모델 학습을 위하여 학습 대상과 네트워크 구조에 따라 두 가지 관점에서 성능을 비교 평가한다. 이때, 학습 대상으로는 스펙트럼 매핑과 Time-Frequency(T-F) 마스킹 기법을 사용하였고 네트워크 구조는 실수 네트워크와 복소 네트워크를 사용하였다. 음성 향상 모델의 성능은 데이터 셋 규모에 따라 Perceptual Evaluation of Speech Quality(PESQ)와 Short-Time Objective Intelligibility(STOI) 두 가지 객관적 평가지표를 통해 평가하였다. 실험 결과, 네트워크의 종류와 데이터 셋 종류에 따라 적정한 훈련 데이터의 크기가 다르다는 것을 확인하였다. 또한, 데이터의 크기와 학습 대상에 따라 복소 네트워크보다 실수 네트워크가 비교적 높은 성능을 보이기 때문에 총 파라미터의 수를 고려한다면 경우에 따라 실수 네트워크를 사용하는 것이 보다 현실적인 해결책일 수 있다는 것을 확인하였다.

의료 이미지 데이터의 비식별화 방안에 관한 연구 (Study for the Pseudonymization Technique of Medical Image Data)

  • 백종일;송경택;최원균;유기근;이필우;인한진;김철중;여광수;김순석
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제6권6호
    • /
    • pp.103-110
    • /
    • 2016
  • 최근 의료데이터의 유출사고가 빈번히 발생하여 환자의 프라이버시 침해 및 의료기관의 피해가 날로 증가하고 있다. 정부에서는 개인정보보호법등과 같은 법규를 제정하여 이러한 피해사례 예방하고 있다. 이중 의료기관 및 의료데이타에 대한 가이드라인은 보건복지부에서 발표한 '국내 의료기관 개인정보보호 가이드라인' 정도만 발표되어 있다. 환자개인의 민감정보를 포함한 의료데이타를 타의료기관 또는 제3의 연구기관등에 전달이 필요한 경우가 발생한다. 전달하고자 하는 의료 이미지 데이터를 일반적인 이미지파일 (JPG, JPEG, TIFF)의 포맷으로 자료의 교환이 이루어지고 있다. 이와같이 일반적인 이미지 포맷의 파일은 아무런 보호조치가 되어 있지 않아 외부로 유출시에는 파일내에 포함된 환자의 주요 식별정보가 노출되는 위험성이 존재한다. 본 연구에서는 이미지 파일에 대한 광학문자판독기술(OCR)을 적용하고 민감정보가 포함된 이미지파일에 암호화된 모자이크기술을 이용한 마스킹 기법을 도입하여 이러한 위험성을 해결하기 위한 이미지 비식별화 방안을 제시한다.

다해상도 영상과 개선된 RBF 네트워크를 이용한 계층적 영문 명함 인식 (Hierarchical Recognition of English Calling Card by Using Multiresolution Images and Enhanced RBF Network)

  • 김광백;김영주
    • 정보처리학회논문지B
    • /
    • 제10B권4호
    • /
    • pp.443-450
    • /
    • 2003
  • 본 논문은 영문 명함의 다해상도 영상을 이용한 계층적 영살 처리를 통해 문자를 추출하고 개선된 신경망 기법을 이용하여 문자를 인식하는 새로운 계층적 명함 인식 알고리즘을 제안하였다 계층적 인식 알고리즘은 명함 인식 과정을 구성하는 각 처리 단계별로 처리 시간을 단축함과 동시에 성능 향상을 위해 입력된 명함 영상을 해상도가 서로 다른 영상들로 분리하여 적용한다. 우선 1/3배 축소 영상에 가로 스미어링 기법을 적용하여 명함 영상 내에서 문자들을 포함하는 문자열 영역을 추출하고, 문자열 영역으로부터 개별 문자를 추출하기 위하여 1/2배 축소 영상에 새로 스미어링 및 윤곽선 추적 마스킹을 적용한다. 마지막으로 추출된 문자를 인식하기 위해서 문자의 형태학적 특성을 그대로 가지고 있는 원 영상을 사용하며, 다양한 형태를 가진 명함상의 문자를 인식하기 위해 ART1 기반의 개선된 RBF 네트워크를 제안하고 인식 과정에 적용하였다 제안된 인식 알고리즘을 실제 영문 명함 영상에 적용하여 실험한 결과, 기존의 방법과 비교하여 문자 추출 및 인식 성능이 크게 향상됨을 확인하였다.

불균일 클러터 환경에서 다중 표적탐지 성능 향상을 위한 반복 백색화 투영 통계 기법 (Iterative Pre-Whitening Projection Statistics for Improving Multi-Target Detection Performance in Non-Homogeneous Clutter)

  • 박혁;강진환;김상효
    • 대한전자공학회논문지SP
    • /
    • 제49권4호
    • /
    • pp.120-128
    • /
    • 2012
  • 본 논문에서는 불균일한 클러터 환경에서 다중 표적탐지 성능을 향상시키기 위한 변형된 반복 백색화 투영 통계(modified iterative pre-whitening projection statistics: MIPPS) 기법을 제안하였다. MIPPS 기법은 항공기용 레이더에서 사용하는 시공간 적응 처리(space-time adaptive processing) 알고리듬의 불균일성 검출(non-homogeneity detection: NHD) 기법으로 반사신호 세기가 서로 다른 다수의 표적이 근접거리에 혼재되어 있는 환경에서 우수한 표적탐지 성능을 나타낸다. 모의실험을 통해 기존의 다양한 NHD 기법들의 성능을 분석하고, 본 논문에서 제안하는 MIPPS 기법이 강한 표적신호에 의해 야기되는 마스킹 효과(masking effect)를 최소화하면서 반사신호 세기가 약한 표적에 대한 평균 탐지 확률을 향상시킬 수 있음을 확인하였다.

적응형 언샤프 마스킹을 위한 지역적 밝기 기반의 가중치 맵 생성 기법 (A Weight Map Based on the Local Brightness Method for Adaptive Unsharp Masking)

  • 황태훈;김진헌
    • 한국멀티미디어학회논문지
    • /
    • 제21권8호
    • /
    • pp.821-828
    • /
    • 2018
  • Image Enhancement is used in various applications. Among them, unsharp masking methods can improve the contrast with a simple operation. However, it has problems of noise enhancement and halo effect caused by the use of a single filter. To solve this problems, adaptive processing using multi-scale and bilinear filters is being studied. These methods are effective for improving the halo effect, but it require a lot of calculation time. In this paper, we want to simplify adaptive filtering by generating a weight map based on local brightness. This weight map enables adaptive processing that eliminates the halo effect through a single multiplication operation. Through experiments, we confirmed the suppression of the halo effect through the result image of the proposed algorithm and existing algorithm.

신호 에너지의 지각적인 간섭현상에 의한 컨벌루션 노이즈의 해석에 관한 연구 (The Study for Perceptual Convolutional Noise by the Masking Effect of Signal)

  • 김헌중;한헌수;홍민철;차형태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2002년도 정기총회 및 학술대회
    • /
    • pp.187-190
    • /
    • 2002
  • 본 논문에서는 잡음 환경에서의 사람의 청각 시스템에서의 신호 에너지에 대한 지각(perception) 패턴을 나타내는 임계 대역에서의 여기(excitation)에너지와 이러한 신호 에너지 사이의 지각적인 간섭 효과를 나타내는 마스킹 특성을 이용하여 지각적인 컨벌루션 잡음(covolutional noise)해석을 통한 잡음 제어 기법을 연구하였다. 이러한 지각적 컨벌루션 잡음은 지각 영역에서 잡음 에너지에 의한 간섭 현상의 영향을 나타내며, 신호의 지각 적인 특성 변화 및 부가 잡음(additional noise) 제어 후에 신호 내에 잔존하는 잔여 노이즈를 반영하는 것이다. 실험 결과 부가 잡음 제어 필터와 컨벌루션 잡음 제어 필터가 대등한 노이즈 제어 성능을 나타내었으며, 다양한 잡음 환경에서 이러한 지각 영역에서의 부가 잡음 제어와 컨벌루션 잡음 제어를 통해 높은 SNR비 개선과 더불어 MOS 측정을 통해서도 높은 음질을 보장할 수 있음을 확인 할 수 있었다.

  • PDF

실시간 운영체제 CNU_RTOS상에서 HISR로 구현된 DPC의 성능 분석 (Performance analysis of DPC designed through a HISR on CNU_RTOS Real-Time Operating System)

  • 정복재;이철훈
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.29-30
    • /
    • 2012
  • 하드웨어 기술이 빠르게 성장함에 따라 임베디드 시스템의 발전이 가속화 되고 있다. 이러한 임베디드 시스템 상에서 논리적이고 신뢰성 있는 처리를 지원해 주기 위해 실시간 운영체제를 도입하게 되었다. 이러한 실시간 운영체제의 인터럽트 처리는 더 높은 우선순위의 인터럽트 서비스 루틴 수행에 의해 현재 발생한 인터럽트가 마스킹 되어 인터럽트 지연시간이 길어질 수 있다. 이러한 경우 시간결정성이 보장되지 않아 실시간성이 저해 된다. 범용 운영체제인 윈도우즈 운영체제의 경우 DPC(Deferred Procesure Call)라는 메커니즘을 이용하여 인터럽트 지연시간을 줄이는데, DPC란 인터럽트에서 보다 덜 중요한 부분을 지연처리호출로 처리하도록 하여 인터럽트의 지연시간을 줄이는 방식으로 이러한 DPC 메커니즘을 국산 실시간 운영체제인 CNU_RTOS상에서 HISR(High Level Interrupt Service Routine)을 이용하여 구현하였다. 본 논문에서는 CNU_RTOS상에서 HISR을 이용하여 구현된 DPC기법을 이용한 인터럽트의 처리 시간과 일반 인터럽트의 처리시간을 비교하여 측정하고 분석한다.

  • PDF

다중 물체 인식 기술 기반 프로젝션 매핑 시스템의 설계 (Design of Projection Mapping System based on Multiple Object Detection)

  • 조인재;전성환;최유주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.723-725
    • /
    • 2016
  • 본 논문에서는 프로젝션 기반 증강현실의 초기 캘리브레이션 단계에서 수동화 작업 절차를 줄이기 위하여 위치가 변화하는 다중 물체의 위치를 자동으로 추출하여 가상이미지를 투사하기 위한 실시간 마스킹 기반 프로젝션 매핑 기법을 제안하다. 이를 위하여 카메라 영상으로부터 실재하는 여러 개의 3차원 물체의 영역을 인식하고, 프로젝션 되는 가상 이미지의 디스플레이 영역을 자동으로 계산하는 절차를 제시한다. 제안 방법을 적용한 프로젝션 매핑 프로토타입 시스템을 설계 구현하고, 동적 배경이 결합된 프로젝션 매핑 콘텐츠 제작 결과를 제시한다.

딥러닝 기반 비속어 필터링 채팅 프로그램 설계 및 구현 (Design and Implementation of Profanity Filtering Chat Program Based on Deep Learning)

  • 이건환;박주찬;최동원;이연경;최호빈;한연희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.998-1001
    • /
    • 2019
  • 최근에 게임이나 채팅 프로그램 내에서의 비속어 필터링은 금칙어 기반으로 운영되고 있다. 하지만 금칙어 기반의 프로그램은 여러 한계점을 보이며, 따라서, 본 논문에서는 'Text-CNN'을 활용한 딥러닝 기법에 기반하여 비속어 필터링 프로그램을 제안한다. 데이터의 자질을 '자모' 단위로 전처리하여 학습시키고 어느 부분이 비속어인지 검출하여 마스킹 처리하는 'LIME 알고리즘'을 사용하여 우리의 프로그램을 이용하는 사용자들에게 바른 언어습관을 지향하며 더 나아가 올바른 인터넷 문화를 조성할 수 있도록 필터링 채팅 프로그램을 제안한다.