통합 검색 | Korea Science

드론 시뮬레이션을 대체할 학습 게임 제작 연구 (A Study on the Production of Learning Game to Replace Drone Simulation)

이승주;송창하;이만권;진민준;조상현
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 추계학술대회
- /
- pp.340-343
- /
- 2020
캡스톤 기업 연계형의 과제로 드론 교육에 쓰이는 시뮬레이션을 대체할 드론 교육 게임을 제작한다. 교육생의 입장에서 시뮬레이션은 복잡하고 지루하기 때문에 다양한 교육과 정보, 재미있는 콘텐츠를 담은 드론 게임을 만들어 스스로 학습을 진행하게 하는 것이 목표이다. 제작에 앞서 먼저 연구된 시뮬레이션과 게임을 통해 어떤 문제로 상용화가 되기 힘이 들었는지 조사했다. 재미있는 콘텐츠를 제공해 드론 기초 조작을 쉽게 학습할 수 있도록 유도했지만 교육생들이 실제 드론을 어떤 컨트롤러로 조작하는가에 대한 조사가 미흡했다. 이를 해결하기 위해서 필요한 학습 콘텐츠를 설계하고 교육생들이 소지한 드론 컨트롤러로 체험을 할 수 있도록 구현했다.
PDF

딥러닝 기반 이산웨이블릿변환 네트워크 (Discrete Wavelet Transform Network based on Deep Learning)

이주원;박찬승;윤영재;김동욱
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 추계학술대회
- /
- pp.347-350
- /
- 2020
본 논문에서는 영상 변환 기술인 이산웨이블릿변환(Discrete Wavelet Transform, DWT)를 딥러닝 기반의 네트워크로 구현한다. 딥러닝 기술 중에도 CNN 기반으로 네트워크를 설계하였으며, 본 DWT 네트워크는 해상도에 의존적이지 않은 계층들로만 구성된다. 데이터세트를 구성할 때 파이썬의 라이브러리를 사용하여 레이블 데이터세트를 구성한다. 128×128크기의 gray-scale 영상을 입력으로 사용하고 이에 대응하는 레이블 데이터세트를 구성하여 1-level DWT를 수행하는 네트워크의 학습을 진행한다. 역방향 변환도 네트워크 설계 후 데이터세트를 구성하여 학습을 진행한다. 학습이 완료된 1-level DWT 네트워크를 반복적으로 사용하여 Multi-level DWT 네트워크를 구성한다. 또한 양자화에 의한 간단한 영상압축 실험을 진행하여 DWT 네트워크의 성능과 압축 등의 응용분야에 활용할 수 있음을 보인다. 설계한 DWT 네트워크의 1-level 순방향 변환 성능은 42.18dB의 PSNR을 보였고, 1-level 역방향 변환 성능은 50.13dB의 PSNR을 보였다.
PDF

균일한 부류 확률값 학습을 통한 도메인 일반화 (Domain Generalization via Class Balanced Probability Learning)

윤성준;심규진;김창익
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 추계학술대회
- /
- pp.103-105
- /
- 2020
본 논문에서는, 영상 분류 문제에서 손실 값 계산 시 정답 부류를 제외한 나머지 부류에서 우세한 결괏값이 나오지 않도록 평활화하는 보조적인 손실함수를 고안한다. 합성곱 신경망 구조를 이용해 학습이 진행되면 손실함수가 작아지는 방향으로 가중치가 갱신되기 때문에, 정답을 제외한 나머지 부류들의 결괏값은 줄어든다. 하지만, 정답을 제외한 나머지 부류들 사이의 상대적인 값이 고려되지 않고 손실함수가 줄어들기 때문에 값들은 균일하지 않게 되고, 정답 부류와 유사한 특징을 가진 부류들의 값이 상대적으로 커지게 된다. 이는 정답 부류와 나머지 부류 중 가장 값이 큰 부류 사이에 공통의 특징을 공유한다고 생각할 수 있다. 정답 부류만이 가지고 있는 고유의 특징을 추출하지 못하고, 다른 부류도 가지고 있는 특징의 흔적이 남아있게 됨으로써 테스트 시 소스 도메인과 전혀 다른 도메인의 영상이 보일 때 그러한 특징이 부각 되어 부정확한 결과를 초래하게 된다. 본 논문에서는 단순한 손실함수의 추가로 도메인이 다른 환경에서 기존의 연구보다 좋은 분류 결과를 보여주는 것을 실험을 통해 확인하였다.
PDF

심층적 강화학습 기반 적응적 GOP 선택을 통한 HEVC/H.265 인코더 제어 (Deep Reinforcement Learning based Adaptive GOP Selection for HEVC/H.265 Encoder)

이정경;김나영;강제원
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 추계학술대회
- /
- pp.140-142
- /
- 2020
본 논문에서는 심층적 강화학습 기반 GOP (Group of Picture) 크기를 선택하여 HEVC/H.265의 인코더를 제어하는 방법을 제안한다. 기존 방법에서는 현재 비디오 신호를 부호화 하는 과정에서 이미 부호화한 정보를 사용해야하는 부호화 의존성에 관한 문제가 있었다. 제안 방법은 강화학습 방식을 도입하여 이러한 문제를 극복하고 입력 비디오의 시간적 상관도에 따라 GOP의 크기를 적응적으로 선택하여 부호화 한다. 본 논문에서는 GOP 선택을 위한 강화학습 환경을 새롭게 정의하고 부호화 성능에 따른 보상을 부여하는 방식으로 학습을 수행한다. 제안된 적응적 GOP 선택에 따라 인코더 제어 시, 부호화 방법의 부호화 효율이 -6.07% BD-rate 향상된 실험 결과를 보이며 본 방법의 우수성을 입증한다.
PDF

딥러닝을 활용한 가정 모니터링 CCTV (Home Monitoring CCTV by using deep learning)

김아린;이은지;권혜영;백혜민
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2020년도 추계학술발표대회
- /
- pp.960-963
- /
- 2020
소비자원 소비자 위해 정보 동향 분석 보고서에 따르면, 10대 미만과 60대 이상이 겪는 사고 중 가정 내 사고의 비율이 약 70%로 높은 비율을 차지하는 것을 볼 수 있다. 기존의 CCTV는 실시간으로 영상 전송은 가능하지만 영상 속의 상황 분석은 하지 못하며, 이를 위해선 지켜보는 인력이 추가로 필요하다. 따라서 보호자의 비용 부담 없이 24시간 행동 분석을 통해 보호가 필요한 가족 구성원의 사고를 예방할 수 있으며 침입과 같은 범죄를 막을 수 있는 AI CCTV의 필요성을 느껴 제작하였다. 해당 CCTV는 실시간 분석으로 영상 내의 위험을 감지하고 감지 후 관련 사항을 등록된 연락처로 송출해서 보호자에게 위험 상황을 알릴 수 있다. 향후 가정 내의 IOT 기기들과 연결하여 위험 상황 발생 시 직접 위험 상황을 해결할 수 있는 스마트 홈 보안으로 범위를 넓힐 수 있다.
https://doi.org/10.3745/PKIPS.y2020m11a.960 인용 PDF

딥러닝 기반의 복원 네트워크을 사용한 위상 홀로그램 비디오 압축 방법 (Phase-only Hologram Video Compression Method Using Deep Learning-Based Restoration Network)

김우석;강지원;오관정;김진웅;김동욱;서영호
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 하계학술대회
- /
- pp.93-94
- /
- 2021
본 연구는 딥러닝 기반의 복원 모델을 사용하여, 비디오 압축을 통해 변질된 위상 홀로그램의 화질을 복원하는 방법을 제안한다. 압축 효율을 위해 위상 홀로그램의 해상도를 감소시킨 후 압축한다. 원래의 해상도로 되돌린 홀로그램을 딥러닝 모델을 사용하여 복원한다. 복원된 위상 홀로그램은 원본 홀로그램을 압축한 것보다 동일한 BPP에서 더 높은 PSNR을 보인다.
PDF

홀로그램 지적재산권을 위한 딥러닝 기반 워터마킹 기법 (Deep learning-based watermarking technique for holographic intellectual property rights)

강지원;서영호;김동욱
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 하계학술대회
- /
- pp.91-92
- /
- 2021
디지털 홀로그램(digital hologram, DH)은 2차원 데이터에 3차원의 정보를 포함하는 차세대 영상 콘텐츠이다. 따라서 이 콘텐츠의 유통을 위해서는 그 지적재산권이 반드시 보호되어야 한다. 본 논문에서는 이를 위한 딥러닝 기반 DH의 워터마킹 방법을 제안한다. 이 방법은 워터마크의 비가시성, 공격에 대한 강인성, 워터마크 추출 시 호스트 정보를 사용하지 않는 blind 워터마킹 방법이다. 이 네트워크는 고주파 성분이 강한 DH의 특성을 감안하여 호스트 데이터를 축소하지 않고 워터마크 데이터를 확장하여 워터마크를 삽입한다. 또한 홀로그램의 복원성능을 위한 학습을 제안한다. 제안한 방법을 다양한 종류와 강도의 공격에 대해 실험을 수행하여 그 성능을 보인다.
PDF

딥러닝 기반의 눈 랜드마크 위치 검출이 통합된 시선 방향 벡터 추정 네트워크 (Deep Learning-based Gaze Direction Vector Estimation Network Integrated with Eye Landmark Localization)

주희영;고민수;송혁
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 하계학술대회
- /
- pp.180-182
- /
- 2021
본 논문은 눈 랜드마크 위치 검출과 시선 방향 벡터 추정이 하나의 딥러닝 네트워크로 통합된 시선 추정 네트워크를 제안한다. 제안하는 네트워크는 Stacked Hourglass Network[1]를 백본(Backbone) 구조로 이용하며, 크게 랜드마크 검출기, 특징 맵 추출기, 시선 방향 추정기라는 세 개의 부분으로 구성되어 있다. 랜드마크 검출기에서는 눈 랜드마크 50개 포인트의 좌표를 추정하며, 특징 맵 추출기에서는 시선 방향 추정을 위한 눈 이미지의 특징 맵을 생성한다. 그리고 시선 방향 추정기에서는 각 출력 결과를 조합하고 이를 통해 최종 시선 방향 벡터를 추정한다. 제안하는 네트워크는 UnityEyes[2] 데이터셋을 통해 생성된 가상의 합성 눈 이미지와 랜드마크 좌표 데이터를 이용하여 학습하였으며, 성능 평가는 실제 사람의 눈 이미지로 구성된 MPIIGaze[3] 데이터 셋을 이용하였다. 실험을 통해 시선 추정 오차는 0.0396 MSE(Mean Square Error)의 성능을 보였으며, 네트워크의 추정 속도는 42 FPS(Frame Per Second)를 나타내었다.
PDF

FisheyeNet: 딥러닝을 활용한 어안렌즈 왜곡 보정 (FisheyeNet: Fisheye Image Distortion Correction through Deep Learning)

이홍재;원재성;이다은;이성배;김규헌
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 하계학술대회
- /
- pp.271-274
- /
- 2021
Fisheye 카메라로 촬영된 영상은 일반 영상보다 넓은 시야각을 갖는 장점으로 여러 분야에서 활용되고 있다. 그러나 fisheye 카메라로 촬영된 영상은 어안렌즈의 곡률로 인하여 영상의 중앙 부분은 팽창되고 외곽 부분은 축소되는 방사 왜곡이 발생하기 때문에 영상을 활용함에 있어서 어려움이 있다. 이러한 방사 왜곡을 보정하기 위하여 기존 영상처리 분야에서는 렌즈의 곡률을 수학적으로 계산하여 보정하기도 하지만 이는 각각의 렌즈마다 왜곡 파라미터를 추정해야 하기 때문에, 개별적인 GT (Ground Truth) 영상이 필요하다는 제한 사항이 있다. 이에 본 논문에서는 렌즈의 종류마다 GT 영상을 필요로 하는 기존 기술의 제한 사항을 극복하기 위하여, fisheye 영상만을 입력으로 하여 왜곡계수를 계산하는 딥러닝 네트워크를 제안하고자 한다. 또한, 단일 왜곡계수를 왜곡모델로 활용함으로써 layer 수를 크게 줄일 수 있는 경량화 네트워크를 제안한다.
PDF

합성 이미지에 대한 기존 머신 러닝 이미지 분류 모델의 성능 비교 (Comparison of Machine Learning Models for Image Classification on Composite Images)

정윤진;한지형
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 하계학술대회
- /
- pp.324-326
- /
- 2021
증강현실은 현실 공간에 가상의 객체를 합성한 영상을 생성하는 기술이다. 증강현실 기술에 대한 지속적인 수요 증가와 기술 발전이 이루어져 왔으며, 앞으로 사용자에게 현실을 기반으로 생성된 이질감이 느껴지지 않는 정교한 영상을 제공할 수 있으리라 기대할 수 있다. 본 논문에서는 증강현실 기술로 생성된 합성 영상이 정교한 영상임을 판단할 수 있는 객관적인 기준을 마련하기 위해 기존의 머신 러닝 기반의 이미지 분류 모델들로 합성 이미지 예측에 대한 실험을 진행하고 그 결과를 비교한다.
PDF

검색결과 1,590건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)