• 제목/요약/키워드: 영상 스케일링

검색결과 73건 처리시간 0.028초

초고해상도 복원에서 성능 향상을 위한 다양한 Attention 연구 (A Study on Various Attention for Improving Performance in Single Image Super Resolution)

  • 문환복;윤상민
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.898-910
    • /
    • 2020
  • 컴퓨터 비전에서 단일 영상 기반의 초고해상도 영상 복원의 중요성과 확장성으로 관련 분야에서 많은 연구가 진행되어 왔으며, 최근 딥러닝에 대한 관심이 증가하면서 딥러닝을 활용한 단안 영상 기반 초고해상도 연구가 활발히 진행되고 있다. 대부분의 딥러닝을 기반으로 하는 단안 영상 기반 초고해상도 복원 연구는 복원 성능을 향상시키기 위해 네트워크의 구조, 손실 함수, 학습 방법에 초점이 맞추어 연구가 진행되었다. 한편, 딥러닝 네트워크를 깊게 쌓지 않고 초고해상도 영상 복원 성능을 향상시키기 위해 추출된 특징 맵을 강조하는 Attention Module에 대한 연구가 다양한 분야에 적용되어 왔다. Attention Module은 다양한 관점에서 네트워크의 목적에 맞는 특징 정보를 강조 및 스케일링 한다. 본 논문에서는 초고해상도 복원 네트워크를 기반으로 다양한 구조의 Channel Attention과 Spatial Attention을 설계하고, 다양한 관점에서 특징 맵을 강조하기 위해 다중 Attention Module 구조를 설계하여 성능을 분석 및 비교한다.

CT 이미지 세그멘테이션을 위한 3D 의료 영상 데이터 증강 기법 (3D Medical Image Data Augmentation for CT Image Segmentation)

  • 고성현;양희규;김문성;추현승
    • 인터넷정보학회논문지
    • /
    • 제24권4호
    • /
    • pp.85-92
    • /
    • 2023
  • X-ray, Computed Tomography (CT), Magnetic Resonance Imaging (MRI)과 같은 의료데이터에서 딥러닝을 활용해 질병 유무 판별 태스크와 같은 문제를 해결하려는 시도가 활발하다. 대부분의 데이터 기반 딥러닝 문제들은 높은 정확도 달성과 정답과 비교하는 성능평가의 활용을 위해 지도학습기법을 사용해야 한다. 지도학습에는 다량의 이미지와 레이블 세트가 필요하지만, 학습에 충분한 양의 의료 이미지 데이터를 얻기는 어렵다. 다양한 데이터 증강 기법을 통해 적은 양의 의료이미지와 레이블 세트로 지도학습 기반 모델의 과소적합 문제를 극복할 수 있다. 본 연구는 딥러닝 기반 갈비뼈 골절 세그멘테이션 모델의 성능 향상과 효과적인 좌우 반전, 회전, 스케일링 등의 데이터 증강 기법을 탐색한다. 좌우 반전과 30° 회전, 60° 회전으로 증강한 데이터셋은 모델 성능 향상에 기여하지만, 90° 회전 및 ⨯0.5 스케일링은 모델 성능을 저하한다. 이는 데이터셋 및 태스크에 따라 적절한 데이터 증강 기법의 사용이 필요함을 나타낸다.

DWT 영역에서의 주파수 정보를 활용한 가변 윈도우 기반의 스테레오 정합 알고리즘 (A New Stereo Matching Algorithm based on Variable Windows using Frequency Information in DWT Domain)

  • 서영호;구자명;김동욱
    • 한국정보통신학회논문지
    • /
    • 제16권7호
    • /
    • pp.1437-1446
    • /
    • 2012
  • 본 논문에서는 스테레오 카메라 환경에서 고속으로 깊이 정보를 얻기 위한 응용분야에 적합한 스테레오 정합 기법을 제안하고자 한다. 이러한 조건을 만족하기 위해서 DWT 영역에서의 주파수 정보와 가변 정합창을 이용하는 적응적인 스테레오 정합 기법을 제안한다. 공간 영역에서 영상의 국부적인 특성을 분석하여 정합창의 크기를 결정하고, 주파수 영역에서 영상의 주파수 특성을 분석하여 정합창의 형태 및 스케일링 요소를 결정한다. 주파수 영역에 대한 정보를 이용하기 위해서 로컬 DWT와 전역 DWT를 활용하는 기법을 모두 적용하였다. 본 논문은 스테레오 정합을 위한 제안한 기법은 유사한 수준의 복잡도에서 고정 정합창 기반의 기법과 비교할 때 PSNR이 향상되는 것을 확인하였다.

특징의 효과적 병합에 의한 광고영상정보의 분류 기법 (A Grouping Method of Photographic Advertisement Information Based on the Efficient Combination of Features)

  • 정재경;전병우
    • 전자공학회논문지CI
    • /
    • 제48권2호
    • /
    • pp.66-77
    • /
    • 2011
  • 본 논문은 특징을 효과적으로 병합하여 계층적 색인구조를 적용하는 광고영상의 분류기법에 대한 체계적 방법을 제안한다. 본 방법은 온라인 및 오프라인 상의 광고 영상 정보 관리를 위한 효과적인 응용으로써, 특별히 광고 영상정보의 추적을 위한 전처리 과정을 제공한다. 이를 위하여 전체 영상에 대한 일반적 정보를 포함하는 전역특징과 영상의 지역적 특성에 기반하는 지역특징을 고려한다. 고안된 지역특징은 영상 회전, 스케일링, 잡음추가, 빛의 변화에 불변하여 아핀(Affine) 변환에 의한 화면 차 영상에 대하여도 신뢰성 높은 매칭 도를 얻을 수 있고 동질의 영상 쌍을 검색하는데 있어서도 높은 정확도를 보여준다. 제안 방법은 우선 전역특징으로 전체영상자료에서 다수의 영상 쌍들로 개략적인 영상 군을 구성한 후에, 영상군안에서 지역특징에 의한 동질 영상 쌍들 즉 정밀한 영상 군들로 분리하는 정밀 매칭을 실행한다. 실행시간을 단축하기 위해 전형적인 클러스터링으로 전역특성이 유사한 영상들끼리 그룹화 함으로서 지역특징에 의한 동질 영상 쌍 간 과도한 매칭 시간의 문제점을 극복한다.

스트리밍 서비스를 위한 TCP 프로토콜의 QoS 성능 향상 기법 (A Method of QoS Performance Improvement based on TCP Protocol for Streaming Service)

  • 김상형;조재상;유원경;유관종
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.655-657
    • /
    • 2005
  • 지속적인 네트워크 환경의 개선과 기술의 비약적인 발전으로 인해 인터넷을 이용한 여러 가지 서비스가 등장하게 되었고, AOD, VOD 등과 같은 멀티미디어 데이터를 제공하는 스트리밍 서비스가 두각을 보이기 시작했다. 본 논문에서는 네트워크 상황에 따라 QoS를 향상시키기 위한 MPEG 비디오 스트림의 혼합 스케일링 방식을 이용한 신뢰성을 보장할 수 있는 TCP 전송 방식을 제안하여, 스케일러블 전송이 가능하면서 고화질의 영상을 서비스할 수 있도록 한다.

  • PDF

적응성 방향 미분에 의한 에지 검출기의 설계 및 평가 (Design of Edge Detection Algorithm Based on Adaptive Directional Derivative)

  • 김은미
    • 한국멀티미디어학회논문지
    • /
    • 제8권10호
    • /
    • pp.1329-1336
    • /
    • 2005
  • 본 논문에서는 다양한 에지의 폭에 적합한 최적의 에지 검출 알고리듬을 제안한다. 제안된 알고리듬을 적용할 edge point에 대한 새로운 정의를 도입하고, 스케일링에 무관한 확장된 방향 미분을 얻기 위해 픽셀 공간에서의 방향 미분을 일반화한다. 또한, 2D 영상에 대하여 제안한 알고리듬을 적용한 에지 검출의 결과를 구하고 기존의 알고리듬에 의한 것과 비교 분석한다.

  • PDF

이미지 스케일링 알고리즘의 성능 평가 (A Performance Evaluation Method of Image Scaling Algorithms)

  • 은진화;권병헌;최명렬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.875-878
    • /
    • 2001
  • 본 논문에서는 디지털 영상의 확대 및 축소에 필요한 보간 방식들에 대한 성능을 평가하는 방법에 대하여 논하였다. 본 논문에서 비교한 성능 평가 방법에는 PSNR 비교와 에지(edge) 특성 비교, 그리고 화소 값이 다른 화소수 비교와 Binary 이미지를 이용한 비교 방법들이 있으며, 이러한 비교 방법들은 보간된 이미지의 특성에 따라 각각의 장, 단점을 가지고 있다. 본 논문에서는 각 평가 방법이 어떠한 특성의 화질을 평가하는데 유용한지 컴퓨터 시뮬레이션을 통해 비교 분석하였다.

  • PDF

이미지 초해상화를 이용한 얼굴 인식 (Face Recognition using Image Super-Resolution)

  • 박준영;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.85-87
    • /
    • 2022
  • 최근 CCTV 출입 기록, 휴대폰 보안, 스마트 매장 등에서 얼굴 인식을 통해 개인을 식별하는 기술이 널리 사용되고 있다. 카메라의 각도, 조명, 사람의 움직임 등 얼굴 인식에 많은 외부 환경이 영향을 미치고 있지만 그중에서도 실제 영상에서 얼굴이 차지하는 영역이 작아 저해상도 얼굴 인식에 어려움을 겪고 있다. 이러한 문제점을 해결하고자 본 논문에서는 이미지 해상도가 얼굴 인식에 끼치는 영향을 알아보고 이미지 초해상화를 통해 얼굴 인식 성능을 개선하고자 한다. 쌍선형, 양3차 회선 보간법과 딥러닝 기반의 이미지 초해상화 모델인 RCAN을 이용하여 업스케일링한 데이터셋에 대해 학습한 ArcFace를 통해 얼굴 검증 평가를 진행하였다. 고해상도 이미지는 얼굴 인식 성능을 향상시키며, RCAN을 사용한 이미지 초해상화가 보간법을 사용한 방법보다 더 좋은 성능을 보였다.

  • PDF

다중 사용자 포즈 추정 및 트래킹 알고리즘의 구현 (Development of Multi-Person Pose-Estimation and Tracking Algorithm)

  • 김승렬;안소윤;서영호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.215-217
    • /
    • 2021
  • 본 논문은 3D 공간에서 사용자를 추출한 뒤, 체적 정보 분석을 통한 3D 스켈레톤(skeleton) 분석 과정을 통해 정확도 높은 다수 사용자의 위치 추적 기술에 대해 연구하였다. 이를 위하여 YOLO(You Only Look Once)를 활용하여 실시간으로 객체를 검출(Real-Time Object Detection)한 뒤 Google의 Mediapipe를 활용해 스켈레톤 추출, 스켈레톤 정규화(normalization)를 통한 스켈레톤의 크기 및 상대적 비율 계산, RGB 영상 스케일링(Scaling) 후 주요 마디 인접 영역의 RGB 색상 정보를 추출하는 방법을 통해 정확도가 개선된 높은 성능의 다중 사용자 추적 기술을 연구하였다.

  • PDF

3DoF+ 비디오 부호화를 위한 깊이 매핑 기법 (A Depth Mapping Method for 3DoF+ Video Coding)

  • 박지훈;이준성;박도현;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.295-296
    • /
    • 2020
  • 3DoF+ 비디오 부호화 표준을 개발하고 있는 MPEG-I 비주얼 그룹은 표준화 과정에서 참조 SW 코덱인 TMIV(Test Model for Immersive Video)를 개발하고 있다. TMIV 는 제한된 공간에서 동시에 여러 위치에서 획득한 뷰(view)의 텍스처(texture) 비디오와 깊이(depth) 비디오를 효율적으로 압축하여 임의 시점의 뷰 렌더링(rendering)을 제공한다. TMIV 에서 수행되는 깊이 비디오의 비트 심도 스케일링 및 압축은 깊이 정보의 손실을 발생하며 이는 렌더링(rendering)된 임의 시점 비디오의 화질 저하를 야기한다. 본 논문에서는 보다 효율적인 깊이 비디오 압축을 위한 히스토그램 등화(histogram equalization) 기반의 구간별(piece-wise) 깊이 매핑 기법을 제안한다. 실험결과 제안기법은 자연 영상(natural sequence)의 End-to-End 부호화 성능에서 평균적으로 3.1%의 비트율 절감이 있음을 확인하였다.

  • PDF