통합 검색 | Korea Science

신경망 기반 오디오 초 해상도 기술 성능 분석 (Performance analysis of audio super-resolution based on neural networks)

임우택;백승권;성종모;이태진
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 하계학술대회
- /
- pp.337-339
- /
- 2020
오디오 초 해상도 기술은 저 해상도의 오디오 신호를 이용하여 고 해상도의 오디오를 복원 또는 생성해 내는 기술이다. 본 기술 분야는 기존에 주파수 대역 확장, 인공 대역 확장 기술 등으로 연구되었으나, 최근 딥러닝 기술의 발전, 이미지 초 해상도 기술 연구 등에 힘입어 오디오 초 해상도 기술 이라는 이름으로 주로 연구되고 있다. 본 논문에서는 이러한 오디오 초 해상도 기술에 연구 동향에 대하여 설명하고, 기존의 논문 들에서 주로 다루고 있는 음성 데이터 베이스가 아닌 MedleyDB 음악 데이터 베이스를 활용하여 실험을 수행하였다. 실험은 4-폴드 교차 검증을 통해 수행되었으며, 실험 결과 제안하는 컨벌루션 신경망 구조 기반 오디오 초 해상도 기술은 입력 저해상도 오디오 대비 SNR 이 3.41 dB 향상됨을 확인하였다.
PDF

초고해상도 영상 복원을 위한 Preconditioned Conjugate Gradient 최적화 기법 (Preconditioned Conjugate Gradient Method for Super Resolution Image Reconstruction)

이은성;김정태
- 한국통신학회논문지
- /
- 제31권8C호
- /
- pp.786-794
- /
- 2006
본 논문에서는 초고해상도 영상을 복원하기 위한 최적화 기법으로 널리 사용되는 PCG(Preconditioned Conjugate Gradient) 기법을 위한 새로운 preconditioner를 제안하였다. 제안된 preconditioner는 기존의 블록 circulant preconditioner를 확장하여 roughness 벌칙 함수에 대해서 효과적인 수렴이 가능하도록 한 것으로써, 잡음에 민감한 기존 방법의 성능을 개선할 수 있는 것이다. 제안된 preconditioner의 성능을 확인하기 위한 실험과 시뮬레이션에서 제안된 PCG 방법은 기존 방법보다 우수한 수렴 속도를 보였다.
PDF KSCI

2D super resolution network를 이용한 Point Cloud 데이터 개선 (Improvement of point cloud data using 2D super resolution network)

박성환;김규헌
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 하계학술대회
- /
- pp.16-18
- /
- 2021
미디어 기술은 사용자가 더욱 몰입감을 느낄 수 있는 방향으로 개발되어 왔다. 이러한 흐름에 따라 기존의 2D 이미지에 비해 깊이감을 느낄 수 있는 증강 현실, 가상 현실 등 3D 공간 데이터를 활용하는 미디어가 주목을 받고 있다. 포인트 클라우드는 수많은 3차원 좌표를 가진 여러 개의 점들로 구성된 데이터 형식이므로 각각의 점들에 대한 좌표 및 색상 정보를 사용하여 3D 미디어를 표현한다. 고정된 크기의 해상도를 갖는 2D 이미지와 다르게 포인트 클라우드는 포인트의 개수에 따라 용량이 유동적이며, 이를 기존의 비디오 코덱을 사용하여 압축하기 위해 국제 표준기구인 MPEG(Moving Picture Experts Group)에서는 Video-based Point Cloud Compression (V-PCC)을 제정하였다. V-PCC는 3D 포인트 클라우드 데이터를 직교 평면 벡터를 이용하여 2D 패치로 분해하고 이러한 패치를 2D 이미지에 배치한 다음 기존의 2D 비디오 코덱을 사용하여 압축한다. 본 논문에서는 앞서 설명한 2D 패치 이미지에 super resolution network를 적용함으로써 3D 포인트 클라우드의 성능 향상하는 방안을 제안한다.
PDF

노출이 다른 다수의 입력 영상을 사용한 초해상도 영상 복원 (Super Resolution Reconstruction from Multiple Exposure Images)

이태형;하호건;이철희;하영호
- 대한전자공학회논문지SP
- /
- 제49권1호
- /
- pp.73-80
- /
- 2012
초해상도 영상복원은 동일한 노출을 가진 다수의 저해상도 영상을 사용하며, 각 영상들 간의 부화소 이동량을 통해 높은 해상도를 가지는 영상을 복원하는 방법이다. 최근에는 노출이 다른 다수의 입력 영상들을 사용하여 해상도와 동적범위 모두를 향상시키는 방법들이 제시되고 있다. 기존의 방법들은 장면의 휘도 변환을 위한 카메라 응답곡선과 톤 맵핑 방법을 필수적으로 요구한다. 이러한 과정에서 CRC 곡선은 추가적인 영상 획득을 요구하며, 과정 또한 복잡하다. 특히 톤 맵핑은 방법에 따라 결과 영상의 화질을 일정하게 나타내지 못하는 장점이 있다. 따라서 본 연구에서는 가중치 맵을 사용한 고해상도 동적 범위 확장 영상 재현 방법을 제시한다. 제안된 방법에서 먼저 각 입력 영상에서 인간 시각에 가장 잘 보이는 영역을 가중치 맵(weight map)이라 정의하고, 가중치 맵이 적용된 입력 영상을 초해상도 복원방법에 적용함으로써, 해상도와 동적 범위가 모두 확장된 결과 영상을 획득한다. 이 방법은 카메라 응답곡선과 톤 맵핑을 사용하지 않음으로 일정한 화질을 획득한다. 또한 제안된 방법은 입력 영상의 구성에 따라 결과 영상의 화질이 다르게 나타남으로, 수수의 불규칙한 입력에도 유사한 결과를 획득하기 위한 밝기 보상 요소를 제안한다.
PDF KSCI

상호증류를 통한 SRGAN 판별자의 성능 개선 (Performance Improvement of SRGAN's Discriminator via Mutual Distillation)

이여진;박한훈
- 융합신호처리학회논문지
- /
- 제23권3호
- /
- pp.160-165
- /
- 2022
상호증류는 교사 네트워크 도움 없이 다수의 네트워크 사이에 지식을 전달함으로써 협력적으로 학습하도록 유도하는 지식증류 방법이다. 본 논문은 상호증류가 초해상화 네트워크에도 적용 가능한지 확인하는 것을 목표로 한다. 이를 위해 상호증류를 SRGAN의 판별자에 적용하는 실험을 수행하고, 상호증류가 SRGAN의 성능 향상에 미치는 영향을 분석한다. 실험 결과, 상호증류를 통해 판별자의 지식을 공유한 SRGAN은 정량적, 정성적 화질이 개선된 초해상화 영상을 생성하였다.
https://doi.org/10.23087/jkicsp.2022.23.3.007 인용 PDF KSCI

CNN을 이용한 Quad Tree 기반 2D Smoke Super-resolution (Quad Tree Based 2D Smoke Super-resolution with CNN)

홍병선;박지혁;최명진;김창헌
- 한국컴퓨터그래픽스학회논문지
- /
- 제25권3호
- /
- pp.105-113
- /
- 2019
물리 기반 유체 시뮬레이션은 고해상도 연산을 위해 많은 시간이 필요하다. 이 문제를 해결하기 위해 저해상도 유체 시뮬레이션의 한계를 딥 러닝으로 보완하는 연구들이 있으며, 그중에서는 저해상도의 시뮬레이션 데이터를 고해상도로 변환해주는 Super-resolution 분야가 있다. 하지만 기존 기법들은 전체 데이터 공간에서 밀도 데이터가 없는 부분까지 연산하므로 전체 시뮬레이션 속도 면에서 효율성이 떨어지며, 입력 해상도가 큰 경우에는 GPU 메모리가 부족해 연산할 수 없는 경우가 발생할 수 있다. 본 연구에서는 공간 분할 법 중 하나인 쿼드 트리를 활용하여 시뮬레이션 공간을 분할 및 분류하여 Super-resolution 하는 기법을 제안한다. 본 기법은 필요 공간만 Super-resolution 하므로 전체 시뮬레이션 가속화가 가능하고, 입력 데이터를 분할 연산하므로 GPU 메모리 문제를 해결할 수 있게 된다.
https://doi.org/10.15701/kcgs.2019.25.3.105 인용 PDF KSCI

신경망 이미지 부호화 모델과 초해상화 모델의 합동훈련 (Joint Training of Neural Image Compression and Super Resolution Model)

조현동;김영웅;차준영;김동현;임성창;김휘용
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 하계학술대회
- /
- pp.1191-1194
- /
- 2022
인터넷의 발전으로 수많은 이미지와 비디오를 손쉽게 이용할 수 있게 되었다. 이미지와 비디오 데이터의 양이 기하급수적으로 증가함에 따라, JPEG, HEVC, VVC 등 이미지와 비디오를 효율적으로 저장하기 위한 부호화 기술들이 등장했다. 최근에는 인공신경망을 활용한 학습 기반 모델이 발전함에 따라, 이를 활용한 이미지 및 비디오 압축 기술에 관한 연구가 빠르게 진행되고 있다. NNIC (Neural Network based Image Coding)는 이러한 학습 가능한 인공신경망 기반 이미지 부호화 기술을 의미한다. 본 논문에서는 NNIC 모델과 인공신경망 기반의 초해상화(Super Resolution) 모델을 합동훈련하여 기존 NNIC 모델보다 더 높은 성능을 보일 수 있는 방법을 제시한다. 먼저 NNIC 인코더(Encoder)에 이미지를 입력하기 전 다운 스케일링(Down Scaling)으로 쌍삼차보간법을 사용하여 이미지의 화소를 줄인 후 부호화(Encoding)한다. NNIC 디코더(Decoder)를 통해 부호화된 이미지를 복호화(Decoding)하고 업 스케일링으로 초해상화를 통해 복호화된 이미지를 원본 이미지로 복원한다. 이때 NNIC 모델과 초해상화 모델을 합동훈련한다. 결과적으로 낮은 비트량에서 더 높은 성능을 볼 수 있는 가능성을 보았다. 또한 합동훈련을 함으로써 전체 성능의 향상을 보아 학습 시간을 늘리고, 압축 잡음을 위한 초해상화 모델을 사용한다면 기존의 NNIC 보다 나은 성능을 보일 수 있는 가능성을 시사한다.
PDF

Super-resolution Convolutional Neural Network를 이용한 전산화단층상의 화질 평가 (Image Quality Evaluation in Computed Tomography Using Super-resolution Convolutional Neural Network)

남기복;조정효;이승완;김번영;임도빈;이다혜
- 한국방사선학회논문지
- /
- 제14권3호
- /
- pp.211-220
- /
- 2020
고화질의 전산화단층촬영상을 통해 정확한 병변 검출과 진단을 할 수 있다. 이와 같은 장점 때문에 전산화단층촬영 시 방사선량을 줄이면서 영상 화질을 개선하기 위해 많은 연구가 수행되었다. 최근 전산화단층촬영상 화질을 향상시키기 위한 딥러닝 기반 기술이 개발되었고, 기존의 기술에 비해 우수한 성능을 보이고 있다. 본 연구에서는 전산화단층촬영상의 공간분해능을 향상시키기 위해 초고해상도 합성곱 신경망 모델을 사용하였으며, 초고해상도 합성곱 신경망 모델의 성능을 결정하는 초 매개 변수 변화에 따른 영상 화질을 평가하여 초고해상도 합성곱 신경망 모델에 대한 초 매개 변수의 효과를 검증하였다. Profile, 구조적 유사성 지수, 최대신호 대 잡음비 및 반치폭을 측정하여 초 매개 변수 변화에 따른 초고해상도 합성곱 신경망 모델의 성능을 평가하였다. 연구결과, 초고해상도 합성곱 신경망 모델의 성능은 epoch와 training set이 증가함에 따라 향상되었으며, 전산화단층촬영상 화질을 향상시키기 위해 learning rate 최적화가 필요하다는 사실을 확인하였다. 따라서 최적의 초 매개 변수와 함께 구현된 초고해상도 합성곱 신경망 모델은 전산화단층촬영상의 품질을 향상시킬 수 있다.
https://doi.org/10.7742/jksr.2020.14.3.211 인용 PDF KSCI HTML

단일 영상 초해상도 기술의 복잡도 감소를 위한 픽셀 단위 생략 방법 (A pixel-wise skip method to reduce complexity of single image super resolution)

이종석;권용혜;심동규
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2019년도 하계학술대회
- /
- pp.255-256
- /
- 2019
본 논문에서는 초고해상도 기술의 복잡도를 줄이기 위하여 픽셀단위 생략 방법을 제안한다. 제안하는 방법은 픽셀 단위로 수평, 수직 방향의 밝기에 대한 2 차 미분치에 기반하여 생략을 결정한다. 제안하는 방법의 성능 평가를 위하여 가장 간단한 초고해상도 알고리즘인 SRCNN 과 제안하는 방법의 PSNR 비교한다. 그 결과 제안하는 방법이 평균적으로 약 47%의 픽셀이 생략이 되면서 SRCNN 대비 0.2dB PSNR 감소를 보인다.
PDF

Cross-CNN 기반의 초해상도 기술 (Cross-CNN based Image Super Resolution)

박장수;이종석;박시내;심동규
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2018년도 하계학술대회
- /
- pp.195-197
- /
- 2018
본 논문은 초해상도 영상 생성을 위한 CNN 구조를 제안한다. 제안하는 Cross-CNN 은 2 차원 필터의 분리성과 활성화 함수의 비선형성을 바탕으로 VDSR 구조의 시작과 마지막 층을 제외한 중간 층들에 교차하는 1 차원 필터를 적용한다. 제안하는 방법은 기존의 방법보다 적은 가중치를 사용하여 실행 시간을 단축하였다. 실험은 VDSR 실험에 사용된 291 개의 영상과 B100 영상을 이용하였다. 제안하는 방법은 네트워크 중간층에서 기존 방법 대비 약 1/3 의 가중치를 사용하여 20%의 속도 향상을 보였다.
PDF

검색결과 240건 처리시간 0.035초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)