• 제목/요약/키워드: Compressed Images

검색결과 267건 처리시간 0.024초

MPEG으로 압축된 비디오에서 최소 복호화에 의한 빠른 장면전환검출 알고리듬 (Fast Scene Change Detection Algorithm in MPEG Compressed Video by Minimal Decoding)

  • 김강욱;이재승;김종훈;황찬식
    • 정보처리학회논문지B
    • /
    • 제9B권3호
    • /
    • pp.343-350
    • /
    • 2002
  • 비디오 데이터의 장면전환검출은 연속되는 두 개 샷(shot) 사이의 경계인 컷(cut)을 검출하는 것으로 비디오 검색과 색인에 있어서 매우 중요한 과정이다. 본 논문에서는 압축된 비디오에서 최소 복호화에 의한 빠르고 정확한 장면전환검출 알고리듬을 제안한다. 제안한 방법은 먼저 I-프레임간의 DC 영상을 비교해서 장면전환을 포함한 GOP(group of Picture)를 찾고 GOP 내에서 장면전환이 발생한 정확한 위치는 B-프레임에서 매크로블록의 부호화 형태에 관한 정보를 이용해서 찾는다. 실험결과 제안한 방법이 모든 DC 영상을 사용한 기존의 방법보다 Precision과 Recall 측면에서 더 좋은 성능을 나타내었다. 그리고 제안한 방법은 빠르고 정확하며 작은 저장공간을 필요로 한다는 장점을 가진다.

다중 관심영역의 자동 추출 및 부호화 방법 (Automatic Extraction and Coding of Multi-ROI)

  • 서영건;홍도순;박재흥
    • 디지털콘텐츠학회 논문지
    • /
    • 제12권1호
    • /
    • pp.1-9
    • /
    • 2011
  • JPEG2000에서는 영상에서 원하는 영역을 타 영역(배경)보다 고화질로 압축하는 기법인, 관심영역 부호화 방법을 제공하고 있는데, 본 연구에서는 얼굴이 포함된 영상을 이용하여, 얼굴 영역이 가장 우선적으로 처리되고 높은 품질로 압축되도록 부가 서비스를 제공한다. 제안 기법은 크게 두 단계로 구성된다. 첫 번째는 얼굴 추출 단계이고, 두 번째는 관심영역 부호화 단계이다. 얼굴 추출은 영상의 모든 화소에 대해 $20{\times}20$ 윈도우 화소 크기로 자르거나 축소하여 전처리 과정을 거친 후 신경망을 이용하여 인식한다. 추출된 각 영역은 관심영역 마스크로 표시되고, Maxshift 방식을 이용하여 부호화된다. 이후에 EBCOT 과정을 거처 압축 및 저장된다. 기존의 방법은 고주파 성분의 분포에 의해 관심영역을 찾은 후 부호화하는 방법이 많이 연구되었다. 반면에 본 연구는 인간의 인지 능력을 이용하여, 여러 개의 얼굴이 포함된 영상에서 충분히 유용한 기법임을 보인다.

블록 기반 DCT 압축 영상의 화질 개선을 위한 후처리 필터링 알고리듬 (A Postfiltering Algorithm for Enhancement in Block-based DCT Compressed Images)

  • 김용훈;정종혁
    • 한국지능시스템학회논문지
    • /
    • 제24권1호
    • /
    • pp.22-27
    • /
    • 2014
  • 블록기반의 이산여현변환 압축 표준을 사용하는 저 비트율 압축 영상과 동영상에서 발생하는 블록킹 현상과 링잉 현상은 화질 열화의 주된 원인으로 지적되고 있다. 블록킹 현상과 링잉 현상은 블록 경계와 에지 경계에서 원 영상에 없던 고주파 성분이 나타나는 현상이므로 저역통과 필터를 적용하면 제거할 수 있다. 그러나 단순히 저역통과 필터를 적용하면 원 영상에 존재하는 에지와 같은 고주파 성분도 제거되어 또 다른 화질 열화 및 번짐 현상을 야기하게 된다. 본 논문에서는 이러한 문제를 해결하기 위하여 주변 화소의 밝기 유사성에 기반한 가중치를 계산하고, 가우시안 저역 통과 필터의 계수에 이 가중치를 곱하여 필터링하는 방법을 제안한다. 실험 결과, 제안된 방법은 PSNR 측면에서 0.4~0.76dB 정도의 향상을 얻었을 뿐만 아니라, 주관적 화질면에서도 우수한 성능을 얻을 수 있음을 확인하였다.

Exterior 투영데이터를 이용한 Region-of-Interest CT의 반복적 영상재구성 방법 (An Iterative Image Reconstruction Method for the Region-of-Interest CT Assisted from Exterior Projection Data)

  • 진승오;권오경
    • 대한의용생체공학회:의공학회지
    • /
    • 제35권5호
    • /
    • pp.132-141
    • /
    • 2014
  • In an ordinary CT scan, a large number of projections with full field-of-view (FFOV) are necessary to reconstruct high resolution images. However, excessive x-ray dosage is a great concern in FFOV scan. Region-of-interest (ROI) CT or sparse-view CT is considered to be a solution to reduce x-ray dosage in CT scanning, but it suffers from bright-band artifacts or streak artifacts giving contrast anomaly in the reconstructed image. In this study, we propose an image reconstruction method to eliminate the bright-band artifacts and the streak artifacts simultaneously. In addition to the ROI scan for the interior projection data with relatively high sampling rate in the view direction, we get sparse-view exterior projection data with much lower sampling rate. Then, we reconstruct images by solving a constrained total variation (TV) minimization problem for the interior projection data, which is assisted by the exterior projection data in the compressed sensing (CS) framework. For the interior image reconstruction assisted by the exterior projection data, we implemented the proposed method which enforces dual data fidelity terms and a TV term. The proposed method has effectively suppressed the bright-band artifacts around the ROI boundary and the streak artifacts in the ROI image. We expect the proposed method can be used for low-dose CT scans based on limited x-ray exposure to a small ROI in the human body.

Blended-Transfer Learning for Compressed-Sensing Cardiac CINE MRI

  • Park, Seong Jae;Ahn, Chang-Beom
    • Investigative Magnetic Resonance Imaging
    • /
    • 제25권1호
    • /
    • pp.10-22
    • /
    • 2021
  • Purpose: To overcome the difficulty in building a large data set with a high-quality in medical imaging, a concept of 'blended-transfer learning' (BTL) using a combination of both source data and target data is proposed for the target task. Materials and Methods: Source and target tasks were defined as training of the source and target networks to reconstruct cardiac CINE images from undersampled data, respectively. In transfer learning (TL), the entire neural network (NN) or some parts of the NN after conducting a source task using an open data set was adopted in the target network as the initial network to improve the learning speed and the performance of the target task. Using BTL, an NN effectively learned the target data while preserving knowledge from the source data to the maximum extent possible. The ratio of the source data to the target data was reduced stepwise from 1 in the initial stage to 0 in the final stage. Results: NN that performed BTL showed an improved performance compared to those that performed TL or standalone learning (SL). Generalization of NN was also better achieved. The learning curve was evaluated using normalized mean square error (NMSE) of reconstructed images for both target data and source data. BTL reduced the learning time by 1.25 to 100 times and provided better image quality. Its NMSE was 3% to 8% lower than with SL. Conclusion: The NN that performed the proposed BTL showed the best performance in terms of learning speed and learning curve. It also showed the highest reconstructed-image quality with the lowest NMSE for the test data set. Thus, BTL is an effective way of learning for NNs in the medical-imaging domain where both quality and quantity of data are always limited.

고압 천연 가스 인젝터의 분무 특성에 관한 연구 (An Investigation on the Spray Characteristics of a Compressed Natural Gas Injector)

  • 삭다 통차이;강유진;임옥택
    • 한국수소및신에너지학회논문집
    • /
    • 제29권2호
    • /
    • pp.219-225
    • /
    • 2018
  • This study was carried out to investigate the injection characteristics of 800 kPa compressed natural gas compressed natural gas (CNG) injector developed in Korea. The CNG injector with multi-holes, employed in this experiment, was designed to inject CNG in the manifold at high pressure of 800 kPa. The spray macroscopic visualization test was carried out via Schlieren photography to study fuel-air mixing process. The fundamental spray characteristics, such as spray penetration, spray cone angle and spray velocity, were evaluated in the constant volume combustion chamber (CVCC) with varying the constant back pressure in CVCC from 0 to 1.8 bar. For the safety reason, nitrogen ($N_2$) and an acetone tracer were utilized as a surrogate gas fuel instead of CNG. The surrogate gas fuel pressures were controlled at 3, 5.5, and 8 bar, respectively. Injection durations were set at 5 ms throughout the experiment. The simulating events of the low engine speed were arranged at 1,000 rpm. The spray images were recorded by using a high-speed camera with a frame rate of 10,000 f/s at $512{\times}256pixels$. The spray characteristics were analyzed by using the image processing (Matlab). The results showed the significant difference that higher injection pressure had more effect on the spray shape than the lower injection pressure. When the injection pressure was increased, the longer spray penetration occurred. Moreover, the linear relation between speed and time are dependent on the injection pressure as well.

Biases in the Assessment of Left Ventricular Function by Compressed Sensing Cardiovascular Cine MRI

  • Yoon, Jong-Hyun;Kim, Pan-ki;Yang, Young-Joong;Park, Jinho;Choi, Byoung Wook;Ahn, Chang-Beom
    • Investigative Magnetic Resonance Imaging
    • /
    • 제23권2호
    • /
    • pp.114-124
    • /
    • 2019
  • Purpose: We investigate biases in the assessments of left ventricular function (LVF), by compressed sensing (CS)-cine magnetic resonance imaging (MRI). Materials and Methods: Cardiovascular cine images with short axis view, were obtained for 8 volunteers without CS. LVFs were assessed with subsampled data, with compression factors (CF) of 2, 3, 4, and 8. A semi-automatic segmentation program was used, for the assessment. The assessments by 3 CS methods (ITSC, FOCUSS, and view sharing (VS)), were compared to those without CS. Bland-Altman analysis and paired t-test were used, for comparison. In addition, real-time CS-cine imaging was also performed, with CF of 2, 3, 4, and 8 for the same volunteers. Assessments of LVF were similarly made, for CS data. A fixed compensation technique is suggested, to reduce the bias. Results: The assessment of LVF by CS-cine, includes bias and random noise. Bias appeared much larger than random noise. Median of end-diastolic volume (EDV) with CS-cine (ITSC or FOCUSS) appeared -1.4% to -7.1% smaller, compared to that of standard cine, depending on CF from (2 to 8). End-systolic volume (ESV) appeared +1.6% to +14.3% larger, stroke volume (SV), -2.4% to -16.4% smaller, and ejection fraction (EF), -1.1% to -9.2% smaller, with P < 0.05. Bias was reduced from -5.6% to -1.8% for EF, by compensation applied to real-time CS-cine (CF = 8). Conclusion: Loss of temporal resolution by adopting missing data from nearby cardiac frames, causes an underestimation for EDV, and an overestimation for ESV, resulting in underestimations for SV and EF. The bias is not random. Thus it should be removed or reduced for better diagnosis. A fixed compensation is suggested, to reduce bias in the assessment of LVF.

변환영역에서의 지능형 분류벡터양자화를 이용한 영상압축 (Image Compression using an Intelligne Classified Vector Quantization Method in Transform Domain)

  • 이현수;공성곤
    • 한국지능시스템학회논문지
    • /
    • 제7권4호
    • /
    • pp.18-28
    • /
    • 1997
  • 이 논문에서는 영상데이터를 여러개의 영상블록들로 나누고 이산 코사인변환 영역에서 물체의 에지에 해당하는 영상블록을 에지방향을 고려하여 적절히 분류함으로써 영상데이터를 효과적을 압축하였다. 벡터양자화에 의한 영상데이터의 압축은 높은 압축률을 실현할 수 있지만 영상내 물체의 에지부근이 손상되어 시각적인 화질이 저하되는 단점이 있다. 높은 압축률을 유지하면서도 시각적인 화질의 열화를 피하기 위하여 영상블록의 이산 코사인변환계수의 에너지 분포에 따라 에지블록을 8개의 부류로 분류하였다. 또한 이 분류과정을 통하여 얻어진 데이터를 가지고 신경회로망을 학습하여 구현한 에지블록의 분류과정과 성능을 비교하였다. 에너지분포에 의한 에지분류방법과 신경망으로 학습한 분류과정은 에지특성벡터에 의한 분류벡터양자화에 비해 더 높은 PSNR과 시각적으로 좋은 화질을 보여주었다.

  • PDF

3D 메쉬 모델의 쉐이딩 시 시각적 왜곡을 방지하는 법선 벡터 압축에 관한 연구 (The Compression of Normal Vectors to Prevent Visulal Distortion in Shading 3D Mesh Models)

  • 문현식;정채봉;김재정
    • 한국CDE학회논문집
    • /
    • 제13권1호
    • /
    • pp.1-7
    • /
    • 2008
  • Data compression becomes increasingly an important issue for reducing data storage spaces as well as transmis-sion time in network environments. In 3D geometric models, the normal vectors of faces or meshes take a major portion of the data so that the compression of the vectors, which involves the trade off between the distortion of the images and compression ratios, plays a key role in reducing the size of the models. So, raising the compression ratio when the normal vector is compressed and minimizing the visual distortion of shape model's shading after compression are important. According to the recent papers, normal vector compression is useful to heighten com-pression ratio and to improve memory efficiency. But, the study about distortion of shading when the normal vector is compressed is rare relatively. In this paper, new normal vector compression method which is clustering normal vectors and assigning Representative Normal Vector (RNV) to each cluster and using the angular deviation from actual normal vector is proposed. And, using this new method, Visually Undistinguishable Lossy Compression (VULC) algorithm which distortion of shape model's shading by angular deviation of normal vector cannot be identified visually has been developed. And, being applied to the complicated shape models, this algorithm gave a good effectiveness.

압축 비디오에서 단계적 접근방법에 의한 빠른 장면전환검출 알고리듬 (Fast Scene Change Detection Algorithm in Compressed Video by a phased-approach Method)

  • 이재승;천이진;윤정오
    • 한국산업정보학회논문지
    • /
    • 제6권3호
    • /
    • pp.115-122
    • /
    • 2001
  • 비디오 데이터의 장면전환검출은 연속되는 두 개 샷(shot) 사이의 경계인 컷(cut)을 검출하는 것으로 비디오 검색과 색인의 첫 번째 단계로서 매우 중요한 역할을 한다. 본 논문에서는 압축된 비디오에서 최소의 복호화로 빠르고 정확한 장면전환을 검출하기 위해 단계적 접근을 이용한 알고리듬을 제안한다. 제안한 방법은 먼저 I-프레임의 DC 영상을 이용해서 장면전환을 포함한 GOP(group of picture)를 찾고 GOP내에서 장면전환이 발생한 정확한 위치는 B-프레임에서 매크로블록의 부호화 형태에 관한 정보를 이용해서 찾는다. 이 방법은 기존의 P, B-프레임의 DC 영상을 모두 이용하는 것보다 간단하고 P, B-프레임의 DC 영상에서 발생하는 화질 열화를 고려할 필요가 없다는 장점이 있다. 실험결과 제안한 방법이 기존의 모든 프레임의 DC 영상을 이용한 방법보다 성능이 우수함을 볼 수 있다.

  • PDF