• 제목/요약/키워드: Structural Similarity (SSIM)

검색결과 79건 처리시간 0.023초

Optical flow의 레벨 간소화 및 노이즈 제거와 에지 정보를 이용한 2D/3D 변환 기법 (2D/3D image Conversion Method using Simplification of Level and Reduction of Noise for Optical Flow and Information of Edge)

  • 한현호;이강성;이상훈
    • 한국산학기술학회논문지
    • /
    • 제13권2호
    • /
    • pp.827-833
    • /
    • 2012
  • 본 논문은 2D/3D 변환에서 깊이정보 생성을 위해 연산량을 감소시키는 레벨 간소화 기법을 적용하고 객체의 고유벡터를 이용하여 노이즈를 제거한 Optical flow를 이용하는 방법을 제안한다. Optical flow는 깊이정보를 생성하기 위한 방법 중 하나로 두 프레임간의 픽셀의 변화 벡터 값을 나타내어 움직임 정보를 나타내며 픽셀 단위로 처리하므로 정확도가 높다. 그러나 픽셀 단위 연산으로 긴 연산 시간이 소요되며 모든 픽셀을 연산하는 특성상 노이즈가 생길 수 있는 문제점이 있다. 본 논문에서는 이를 해결하기 위해 레벨 간소화 과정을 거쳐 연산 시간을 단축하였고 Optical flow를 영상에서 고유벡터를 갖는 영역에만 적용하여 노이즈를 제거한 뒤 배경 영역에 대한 깊이 정보를 에지 영상을 이용하여 생성하는 방법을 제안하였다. 제안한 방법으로 깊이정보를 생성한 뒤 DIBR(Depth Image Based Rendering)으로 2차원 영상을 3차원 입체 영상으로 변환하였고 SSIM(Structural SIMilarity index)으로 최종 생성된 영상의 오차율을 분석하였다.

손실 영역 분석 기반의 학습데이터 매핑 기법을 이용한 초해상도 연구 (Super Resolution using Dictionary Data Mapping Method based on Loss Area Analysis)

  • 한현호;이상훈
    • 한국융합학회논문지
    • /
    • 제11권3호
    • /
    • pp.19-26
    • /
    • 2020
  • 본 논문에서는 학습된 사전 기반 초해상도 결과를 개선하기 위해 분석한 손실 영역을 기반으로 학습 데이터를 적용하는 방법을 제안하였다. 기존의 학습된 사전 기반 방법은 입력 영상의 특징을 고려하지 않는 학습된 영상의 형태로 출력할 수 있으며, 이 과정에서 인공물이 발생할 수 있다. 제안하는 방법은 입력 영상과 학습된 영상의 일치하지 않는 특징으로 인한 인공물 발생을 줄이기 위해 1차 복원 결과를 분석함으로써 손실 정보를 추정하였다. 추정된 결과의 잡음 및 화소 불균형을 가우시안 기반의 커널로 개선하여 생성된 특징 맵에 따라 학습 데이터를 매핑하였다. 결과 비교를 위해 기존의 초해상도 방법과 제안 방법의 결과를 고화질 영상과 PSNR(Peak Signal to Noise Ratio), SSIM(Structural SIMilarity Index) 으로 비교한 결과 각각 4%와 3%의 향상된 결과를 확인하였다.

Short-time Fourier transform 소음맵을 이용한 컨볼루션 기반 BSR (Buzz, Squeak, Rattle) 소음 분류 (BSR (Buzz, Squeak, Rattle) noise classification based on convolutional neural network with short-time Fourier transform noise-map)

  • 부석준;문세민;조성배
    • 한국음향학회지
    • /
    • 제37권4호
    • /
    • pp.256-261
    • /
    • 2018
  • 차량 내부에는 BSR(Buzz, Squeak, Rattle) 세 가지 유형의 소음이 발생한다. 본 논문에서는 심층 컨볼루션 신경망으로 추출한 소음 특징에 기반하여 자동으로 차량 내부의 BSR 소음을 분류하는 분류기를 제안한다. 차량 내부의 소음은 전처리 단계에서 STFT(Short-time Fourier Transform) 알고리즘을 사용하여 소음 맵으로 표현된다. 생성된 소음 맵 내부에서 실제 소음의 위치를 정확하게 파악하기 어려운 문제에 대처하기 위해서 슬라이딩 윈도우 방법으로 분할하였다. 본 논문에서는 t-SNE(t-Stochastic Neighbor Embedding) 알고리즘을 사용하여 심층 컨볼루션 신경망 내부 파라미터를 시각화하고 정성적인 방식으로 오분류데이터를 분석하였다. 분류된 데이터의 정량적인 분석을 위해 소음의 종류별 유사도를 SSIM(Structural Similarity Index) 수치에 기반하여 정량화하여 리트랙터의 떨림음이 정상주행음과 가장 유사하다는 것을 밝혔다. 제안하는 방법의 분류기는 기타 기계학습 알고리즘 대비 최고 분류 정확도를 달성하였다(99.15%).

에지 투영의 유사도를 이용한 압축된 영상에 대한 Reduced-Reference 화질 평가 (Reduced-Reference Quality Assessment for Compressed Videos Based on the Similarity Measure of Edge Projections)

  • 김동오;박래홍;심동규
    • 대한전자공학회논문지SP
    • /
    • 제45권3호
    • /
    • pp.37-45
    • /
    • 2008
  • 화질 평가는 원영상과 열화된 영상 간의 차이를 측정함으로써, 열화된 영상의 화질이 좋고 나쁨을 판단하는 것을 목표로 한다. 본 논문에서는 열화된 영상의 화질 평가를 위해, 원영상과 열화된 영상 전체를 비교하는 것 대신, 원영상과 열화된 영상, 각각의 특징으로 에지 투영을 이용하는 방법을 제안하였다. 여기서 에지 투영은 에지 맵에서 수직, 수평 방향으로 투영시킴으로써 얻을 수 있다. 에지 투영 시 수직, 수평 방향에 대한 그래디언트 크기를 고려함으로써, 보다 나은 화질 평가 방법을 제안하였다. 제안한 방법의 탁월함을 기존의 화질 평가 방법인 structural similarity(SSIM), edge peak signal-to-noise ratio(EPSNR), 그리고 edge histogram descriptor(EHD) 방법과 비교 실험을 통해 보였다.

Two-Step Rate Distortion Optimization Algorithm for High Efficiency Video Coding

  • Goswami, Kalyan;Lee, Dae Yeol;Kim, Jongho;Jeong, Seyoon;Kim, Hui Yong;Kim, Byung-Gyu
    • Journal of Multimedia Information System
    • /
    • 제4권4호
    • /
    • pp.311-316
    • /
    • 2017
  • High Efficiency Video Coding (HEVC) is the newest video coding standard for improvement in video data compression. This new standard provides a significant improvement in picture quality, especially for high-resolution videos. A quadtree-based structure is created for the encoding and decoding processes and the rate-distortion (RD) cost is calculated for all possible dimensions of coding units in the quadtree. To get the best combination of the block an optimization process is performed in the encoder, called rate distortion optimization (RDO). In this work we are proposing a novel approach to enhance the overall RDO process of HEVC encoder. The proposed algorithm is performed in two steps. In the first step, like HEVC, it performs general rate distortion optimization. The second step is an extra checking where a SSIM based cost is evaluated. Moreover, a fast SSIM (FSSIM) calculation technique is also proposed in this paper.

Joint Spatial-Temporal Quality Improvement Scheme for H.264 Low Bit Rate Video Coding via Adaptive Frameskip

  • Cui, Ziguan;Gan, Zongliang;Zhu, Xiuchang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권1호
    • /
    • pp.426-445
    • /
    • 2012
  • Conventional rate control (RC) schemes for H.264 video coding usually regulate output bit rate to match channel bandwidth by adjusting quantization parameter (QP) at fixed full frame rate, and the passive frame skipping to avoid buffer overflow usually occurs when scene changes or high motions exist in video sequences especially at low bit rate, which degrades spatial-temporal quality and causes jerky effect. In this paper, an active content adaptive frame skipping scheme is proposed instead of passive methods, which skips subjectively trivial frames by structural similarity (SSIM) measurement between the original frame and the interpolated frame via motion vector (MV) copy scheme. The saved bits from skipped frames are allocated to coded key ones to enhance their spatial quality, and the skipped frames are well recovered based on MV copy scheme from adjacent key ones at the decoder side to maintain constant frame rate. Experimental results show that the proposed active SSIM-based frameskip scheme acquires better and more consistent spatial-temporal quality both in objective (PSNR) and subjective (SSIM) sense with low complexity compared to classic fixed frame rate control method JVT-G012 and prior objective metric based frameskip method.

A Tracking Method of Same Drug Sales Accounts through Similarity Analysis of Instagram Profiles and Posts

  • Eun-Young Park;Jiyeon Kim;Chang-Hoon Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.109-118
    • /
    • 2024
  • 전 세계 소셜 미디어 사용자가 증가하면서 다양한 범죄의 수단으로 소셜 미디어가 악용되는 사례가 증가하고 있다. 특히, 소셜 미디어를 통한 마약 유통은 마약 판매자와 소비자의 높은 접근성으로 인해 청소년들의 마약 호기심을 자극하고, 구매를 용이하게 한다는 점에서 심각한 사회문제로 대두되고 있다. 본 논문에서는 다양한 소셜 미디어 중, 국내 19세에서 24세 청소년이 가장 많이 사용하는 인스타그램을 대상으로 프로필 사진, 소개글, 게시물 사진과 게시글을 수집하고, 각 정보의 유사도 분석을 통해 수집한 다수의 계정을 활용하여 마약을 유통하는 마약사범 추적 기술을 개발한다. 4개 수집 정보 중, 이미지 형태의 프로필 사진 및 게시물 사진은 SSIM(Structural Similarity Index Measure) 기반으로 유사도를 분석하고, 텍스트 형태의 소개글 및 게시글은 자카드 유사도 및 코사인 유사도 기법을 사용하여 유사도를 분석한다. 이와 같은 유사도 분석을 통해, 각 수집 정보별 계정 간의 유사도를 측정할 수 있으며 유의수준 이상의 유사성을 갖는 계정들에 대해 동일 마약 유통 계정으로 판단할 수 있다. 또한, 수집한 4개 정보에 대해 로지스틱 회귀분석을 수행하여 게시물 사진을 제외한 프로필 사진, 소개글, 게시글이 동일 마약 판매 계정을 추적하는 데에 유효한 정보임을 확인하였다.

패턴매칭을 이용한 섬유결함 검출시스템의 설계 (A system design for textile defect detection using pattern matching)

  • 강현수;김종준;송낙운
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.474-477
    • /
    • 2010
  • 본 논문에서는 패턴인식을 이용한 의류의 결함을 자동으로 탐색하는 시스템을 설계하였다. 이는 히스토그램을 기반으로 하여 영상의 특징을 추출하고 템플릿 매칭을 이용해서 패턴을 추적하도록 하였스며, 또한, SSIM(Structural Similarity) Index를 통해 추적된 패턴과 원 패턴의 유사도를 HVS(Human Vision System)을 기준으로 하여 결함을 판별할수 있도록 하였다.

Wavelet 변환과 결합한 잔차 학습을 이용한 희박뷰 전산화단층영상의 인공물 감소 (Artifact Reduction in Sparse-view Computed Tomography Image using Residual Learning Combined with Wavelet Transformation)

  • 이승완
    • 한국방사선학회논문지
    • /
    • 제16권3호
    • /
    • pp.295-302
    • /
    • 2022
  • 희박뷰 전산화단층촬영(computed tomography; CT) 영상화 기술은 피폭 방사선량을 감소시킬 수 있을 뿐만 아니라 획득한 투영상의 균일성을 유지하고 잡음을 감소시킬 수 있는 장점이 있다. 하지만 재구성 영상 내 인공물 발생으로 인하여 화질 및 피사체 구조가 왜곡되는 단점이 있다. 본 연구에서는 희박뷰 CT 영상의 인공물 감소를 위해 wavelet 변환과 잔차 학습(residual learning)을 적용한 콘볼루션 신경망(convolutional neural network; CNN) 기반 영상화 모델을 개발하고, 개발한 모델을 통한 희박뷰 CT 영상의 인공물 감소 정도를 정량적으로 분석하였다. CNN은 wavelet 변환 층, 콘볼루션 층 및 역 wavelet 변환 층으로 구성하였으며, 희박뷰 CT 영상과 잔차 영상을 각각 입출력 영상으로 설정하여 영상화 모델 학습을 진행하였다. 영상화 모델 학습을 위해 평균제곱오차(mean squared error; MSE)를 손실함수로, Adam 함수를 최적화 함수로 사용하였다. 학습된 모델을 통해 입력 희박뷰 CT 영상에 대한 예측 잔차 영상을 획득하고, 두 영상간의 감산을 통해 최종 결과 영상을 획득하였다. 또한 최종 결과 영상에 대한 시각적 특성, 최대신호대잡음비(peak signal-to- noise ratio; PSNR) 및 구조적유사성지수(structural similarity; SSIM)를 측정하였다. 연구결과 본 연구에서 개발한 영상화 모델을 통해 희박뷰 CT 영상의 인공물이 효과적으로 제거되며, 공간분해능이 향상되는 결과를 확인하였다. 또한 wavelet 변환과 잔차 학습을 미적용한 영상화 모델에 비해 본 연구에서 개발한 영상화 모델은 결과 영상의 PSNR 및 SSIM을 각각 8.18% 및 19.71% 향상시킬 수 있음을 확인하였다. 따라서 본 연구에서 개발한 영상화 모델을 이용하여 희박뷰 CT 영상의 인공물 제거는 물론 공간분해능 향상 및 정량적 정확도 향상 효과를 획득할 수 있다.