• Title/Summary/Keyword: 최적방송

Search Result 567, Processing Time 0.055 seconds

심층 신경망을 통한 자연 소리 분류를 위한 최적의 데이터 증대 방법 탐색 (Search of an Optimal Sound Augmentation Policy for Environmental Sound Classification with Deep Neural Networks)

  • 박진배;;배성호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.18-21
    • /
    • 2020
  • 심층 신경망은 영상 분류, 음성 인식, 그리고 문자 번역 등 다양한 분야에서 효과적인 성능을 보여주고 있다. 신경망의 구조 변화, 신경망 간의 정보 전달, 그리고 학습에 사용되는 데이터 증대 등의 확장된 연구를 통해 성능은 더욱 발전하고 있다. 그 중에서도 데이터 증대는 기존에 수집한 데이터의 변형을 통해 심층 신경망에 더 다양한 데이터를 제공함으로써 더욱 일반화된 신경망을 학습시기키는 것을 목표로 한다. 하지만 기존의 음향 관련 신경망 연구에서는 모델의 학습에 사용되는 데이터 증대 방법의 연구가 영상 처리 분야만큼 다양하게 이루어지지 않았다. 최근 영상 처리 분야의 데이터 증대 연구는 학습에 사용되는 데이터와 모델에 따라 최적의 데이터 증대 방법이 다르다는 것을 실험적으로 보여주었다. 이에 영감을 받아 본 논문은 자연에서 발생하는 음향을 분류하는데 있어서 최적의 데이터 증대 방법을 실험적으로 찾으며, 그 과정을 소개한다. 음향에 잡음 추가, 피치 변경 혹은 스펙트로그램의 일부 제한 등의 데이터 증대 방법을 다양하게 조합하는 실험을 통해 경험적으로 어떤 증대 방법이 효과적인지 탐색했다. 결과적으로 ESC-50 자연 음향 데이터 셋에 최적화된 데이터 증대 방법을 적용함으로써 분류 정확도를 89%로 향상시킬 수 있었다.

  • PDF

두 장의 LDR 영상을 이용한 HDR 영상 취득 기법 (Acquisition of HDR Image Using Two LDR Images)

  • 박태장;박인규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.89-90
    • /
    • 2010
  • 기존의 HDR (high dynamic range) 영상취득 기법은 한 장의 HDR 영상을 얻기 위해 여러 장의 LDR (low dynamic range) 영상을 취득하기 때문에 영상 취득에 많은 시간이 소요된다. 본 논문에서는 이런 단점을 보안하기 위해 두 장의 LDR 영상을 이용하여 평균 밝기 값에 대한 노출 곡선을 추정한다. 그리고 추정된 노출곡선을 이용하여 밝은 영상과 어두운 영상 각각의 최적의 노출 시간을 취득하는 기법을 제안한다.

  • PDF

주변 블록을 이용한 고속 화면내 모드 결정 알고리즘 (Fast Intra Mode Decision Algorithm Using Neighboring Block)

  • 김윤주;서영호;김동욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.222-223
    • /
    • 2014
  • 본 논문에서는 HEVC의 화면내 모드에서 예측을 수행할 블록의 주변적 특성을 이용한 고속 모드 결정 알고리즘을 제안한다. 기존의 화면내 예측 방법으로는 33가지 방향성 예측방법과 두 가지의 무 방향성 방법을 이용하게 된다. 이때 최적의 예측 모드를 선택하기 위하여 RD cost 계산을 하게 된다. 본 논문에서는 모드 선택의 복잡성을 줄이고 고속 모드를 결정하기 위하여 예측 할 블록의 주변 중 가장 자리와 가중치 특성을 고려하였다.

  • PDF

Gradient-Projection 기법을 이용한 압축 영상의 블록화 및 링 현상 제거 (Gradient-Projection Algorithm for Reducing Blocking Artifacts and Ringing Effects of Compressed Images)

  • 홍민철;최태은;연창모;박영만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1998년도 학술대회
    • /
    • pp.91-94
    • /
    • 1998
  • 본 논문에서는 블록간, 블록 내수, 수평. 수직 방향성, 그리고 시간 영역의 정보를 이용하는 압축 동영상의 블록화 및 링 현상을 제거하는 방식을 제안한다. 위의 정보를 이용하여 새로운 부가 함수가 정의되며, 최적 해를 구하기 위해 gradient와 projection을 결합시킨 hybrid 형태의 기법을 이용한다. 또한, 정규화 계수들 및 projection을 위한 영역의 설정을 부호화단에서는 이용 가능한 정보로부터 추출하게 되므로 계산량을 감소시킬 수 있다. 실험 결과로부터 제안된 방식의 효율성을 확인할 수 있다.

  • PDF

다중 클래스에 대한 피춰 추출 방법의 최적화

  • 홍준용;이철희
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1997년도 학술대회
    • /
    • pp.75-78
    • /
    • 1997
  • 본 논문에서는 여러 개의 클래스가 정의되어 있을 경우에 피춰(feature)추출을 최적화 하는 방법을 제안한다. 제안된 알고리즘은 피춰를 하나씩 추출하며 그 과정마다 각 클래스의 가중치를 조정하여 최적의 해를 얻는 방법을 사용한다. 처음에는 각 클래스에 동일한 가중치를 주어 criterion function을 구하고 이로부터 첫 번째 피춰를 얻는다. 이 피춰에 의한 오류와 전체 피춰를 사용하였을 경우의 오류의 차이가 가장 큰 클래스에 더 많은 가중치를 주어 새로운 criterion function을 구하여 두 번째 피춰를 얻는다. 이 과정에서 오류는 Bhattacharyya distance에 의해 예측한다.

  • PDF

LDWS에서 6개의 서브 블록을 이용한 차선 인식 능력 개선에 관한 연구 (A Study on Improvement of Lane Detection Capability of the LDWS Using 6 Sub-Blocks)

  • 이종원;원승재;권택수;강동욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.282-284
    • /
    • 2011
  • 본 논문은 원활한 차선 인식을 위한 전체 시스템 시간을 단축하는 방법에 초점을 맞추고 또한 기존의 차선 인식 시스템의 문제점을 알아보고 그 중에서 급커브에서의 문제점, 중앙선 인식이 잘되지 않는 문제를 개선하기 위한 방법과 최적의 경보를 울리기 위한 논리를 찾아보았다.

  • PDF

Truncated Nuclear Norm 최소화를 이용한 HDR 영상 합성 (HDR Image Synthesis Using Truncated Nuclear Norm Minimization)

  • 이철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 추계학술대회
    • /
    • pp.108-109
    • /
    • 2015
  • 본 논문은 low-rank 행렬의 truncated nuclear norm 최소화를 이용한 HDR (high dynamic range) 영상 합성 기법을 제안한다. 제안하는 기법에서는 기존의 LDR (low dynamic range) 영상에서 얻은 밝기의 선형 관계에 기반하여 HDR 합성을 low-rank 행렬 완성 문제로 변환한 후, ALM (augmented Lagrange multiplier) 기법을 이용하여 효율적으로 최적의 해를 구한다. 컴퓨터 모의실험을 통해 제안하는 기법이 기존 기법에 비해서 낮은 계산 복잡도를 보이면서도 더 높은 품질의 HDR 영상을 합성하는 것을 확인한다.

  • PDF

학습된 선형 변환 기저를 이용한 VVC 잔자신호 변환

  • 김남욱;이영렬
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.160-161
    • /
    • 2020
  • 본 논문에서는 비디오 코딩 잔차신호를 보다 효율적으로 변환하기 위하여 오프라인으로 잔차신호를 학습하여 RD(Rate Distortion) Cost를 기반으로 분류된 몇 가지 변환 기저들을 생성하고, 비디오 복호화 과정 중 잔차신호를 역변환을 수행할 때 주변의 복호화가 완료된 신호들을 이용하여 최적의 변환 기저를 선택하여 해당 변환 기저로 역변환을 수행하여 효율적으로 잔차신호를 압축하는 방법에 대해 제안한다. 변환 기저 생성에는 분류된 잔차신호들에 대하여 2 차원 혹은 1 차원 KLT를 계산함으로써 얻어내어진다. 제안하는 방법은 VTM(VVC Test Model) version 10에서 실험하였으며 약 0.5% 정도의 성능향상을 보인다.

  • PDF

DVB MPEG의 AFD 를 이용한 화면 구현 방법 (Display implementation used to AFD of MPEG in DVB)

  • 김민경;윤희용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.78-81
    • /
    • 2008
  • HDTV로 전환되면서 방송국에서는 4:3의 SDTV와 16:9의 HDTV가 동시 방송되는 과도기를 맞고 있다. 유럽에서 채택한 DTV 표준인 DVB 방식인 경우 MPEG에 화면 비 정보와 AFD 정보를 신호에 실어 수신 장치에서 화변 비 정보를 알 수 있도록 하고 있다. 이 정보를 이용하여 방송에 따라 화면 비를 설정하고 최적의 화면 비율 상태로 시청할 수 있는 모드를 제공하도록 소프트웨어로 구현하고자 한다.

데이터 방송에서 요청확률을 고려한 데이터 스케줄링 알고리즘 (A Data Scheduling Algorithm Considering the Request Probability for Data Broadcasting)

  • 민재호;황주연;백두원
    • 한국멀티미디어학회논문지
    • /
    • 제11권3호
    • /
    • pp.398-403
    • /
    • 2008
  • 비대칭 통신환경에서는 서버가 사용자에게 데이터를 전송하는 방법으로 데이터 방송을 사용한다. 이 방법은 서버에서 사용자에게 필요한 모든 데이터를 주기적으로 반복해서 전송하고 사용자는 필요한 데이터가 방송되면 그 데이터를 사용한다. 그러므로 사용자는 필요한 데이터가 방송될 때까지 기다려야한다. 이러한 사용자의 대기시간은 줄여야만 한다. 대기시간을 줄이기 위하여 서버에서는 각각의 데이터의 순서를 스케줄링하여 방송해야 한다. 본 논문에서는 사용자가 각각의 데이터를 요청할 확률, 데이터의 크기와 데이터의 최적주기를 이용하여 데이터를 스케줄링하는 방법을 제안하고 이 방법들의 효용성을 검증했다. 이를 위해 제안한 방법으로 데이터를 스케줄링하여 사용자의 평균대기시간을 구하는 실험을 하였다. 실험 결과 빈도만 고려한 방법에 비해 약 13%의 성능이 증가되었다.

  • PDF