• 제목/요약/키워드: Learning media

검색결과 1,571건 처리시간 0.023초

CNN 기반 동영상의 프레임 삭제 검출 기법 (Detection of Frame Deletion Using Convolutional Neural Network)

  • 홍진형;양윤모;오병태
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.886-895
    • /
    • 2018
  • 본 논문에서는 동영상의 압축 과정에서 발생하는 규칙성을 이용하여 동영상의 조작 여부를 검출하는 기법에 대해 소개한다. 제안방식은 동영상의 이중 압축과 일부 영상의 조작에 의해 잃어버린 계층적 규칙성을 이용한다. 이러한 불규칙성을 추출하기 위해 HEVC의 기본 단위인 CU와 TU의 분할정보를 이용한다. 성능 향상을 위해 지역적인 정보를 활용하여 CU와 TU의 분할 지도를 제작한 뒤, GoP 단위로 묶어 입력 데이터를 제작한다. 효과적인 분류를 위하여 3차원 합성곱 신경망을 이용하여 동영상의 이중 압축 및 조작 여부를 판단한다. 실험 결과, 기존의 기계학습 알고리즘을 이용한 연구 결과에 비해 더욱 효과적으로 동영상의 조작 여부를 판단함을 확인하였다.

인터랙티브 미디어 플랫폼 콕스에 제공될 4가지 얼굴 변형 기술의 비교분석 (Comparison Analysis of Four Face Swapping Models for Interactive Media Platform COX)

  • 전호범;고현관;이선경;송복득;김채규;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제22권5호
    • /
    • pp.535-546
    • /
    • 2019
  • Recently, there have been a lot of researches on the whole face replacement system, but it is not easy to obtain stable results due to various attitudes, angles and facial diversity. To produce a natural synthesis result when replacing the face shown in the video image, technologies such as face area detection, feature extraction, face alignment, face area segmentation, 3D attitude adjustment and facial transposition should all operate at a precise level. And each technology must be able to be interdependently combined. The results of our analysis show that the difficulty of implementing the technology and contribution to the system in facial replacement technology has increased in facial feature point extraction and facial alignment technology. On the other hand, the difficulty of the facial transposition technique and the three-dimensional posture adjustment technique were low, but showed the need for development. In this paper, we propose four facial replacement models such as 2-D Faceswap, OpenPose, Deekfake, and Cycle GAN, which are suitable for the Cox platform. These models have the following features; i.e. these models include a suitable model for front face pose image conversion, face pose image with active body movement, and face movement with right and left side by 15 degrees, Generative Adversarial Network.

시멘틱 세그멘테이션을 활용한 이미지 오브젝트의 효율적인 영역 추론 (Efficient Inference of Image Objects using Semantic Segmentation)

  • 임헌영;이유림;지민규;고명현;김학동;김원일
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.67-76
    • /
    • 2019
  • 본 연구에서는 다중 라벨링이 되어 있는 이미지 데이터를 대상으로 시멘틱 세그멘테이션을 활용한 효율적인 오브젝트별 영역 분류 기법을 연구한다. 이미지 데이터에 포함된 색상 정보, 윤곽선, 명암, 채도 등 다양한 픽셀 단위 정보와 프로세싱 기법뿐만 아니라 각 오브젝트들이 위치한 세부 영역을 의미 있는 단위로 추출하여 추론 결과에 반영하는 실험을 진행하고 그 결과에 대해 논의한다. 이미지 분류에서 훌륭한 성능을 검증받은 뉴럴 네트워크를 활용하여 비정형성이 심하고 다양한 클래스 오브젝트가 포함된 이미지 데이터를 대상으로 어떤 오브젝트가 어디에 위치하였는지 파악하는 작업을 진행한다. 이러한 연구를 기반으로 향후 다양한 오브젝트가 포함된 복잡한 이미지의 실시간 세부 영역 분류를 진행하는 인공지능 서비스 제공을 목표로 한다.

A Study on Self-medication for Health Promotion of the Silver Generation

  • Oh, Soonhwan;Ryu, Gihwan
    • International Journal of Advanced Culture Technology
    • /
    • 제8권4호
    • /
    • pp.82-88
    • /
    • 2020
  • With the development of medical care in the 21st century and the rapid development of the 4th industry, electronic devices and household goods taking into account the physical and mental aging of the silver generation have been developed, and apps related to health and health are generally developed and operated. The apps currently used by the silver generation are a form that provides information on diseases by focusing on prevention rather than treatment, such as safety management apps for the elderly living alone and methods for preventing diseases. There are not many apps that provide information on foods that have a direct effect and nutrients in that food, and research on apps that can obtain information about individual foods is insufficient. In this paper, we propose an app that analyzes food factors and provides self-medication for health promotion of the silver generation. This app allows the silver generation to conveniently and easily obtain information such as nutrients, calories, and efficacy of food they need. In addition, this app collects/categorizes healthy food information through a textom solution-based crawling agent, and stores highly relevant words in a data resource. In addition, wide deep learning was applied to enable self-medication recommendations for food. When this technique is applied, the most appropriate healthy food is suggested to people with similar eating patterns and tastes in the same age group, and users can receive recommendations on customized healthy foods that they need before eating. This made it possible to obtain convenient healthy food information through a customized interface for the elderly through a smartphone.

산업현장에서의 선택적 소음 제거를 위한 환경 사운드 분류 기술 (Environmental Sound Classification for Selective Noise Cancellation in Industrial Sites)

  • 최현국;김상민;박호종
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.845-853
    • /
    • 2020
  • 본 논문에서는 산업현장에서의 선택적 소음 제거를 위한 환경 사운드 분류 기술을 제안한다. 산업현장에서의 소음은 작업자의 청력 손실의 주요 원인이 되며, 소음 문제를 해결하기 위한 소음 제거 기술이 널리 연구되고 있다. 그러나 기존 소음 제거 기술은 모든 소리를 구분 없이 차단하는 문제를 가지며, 모든 소음에 공통된 제거 방법을 적용하여 각 소음에 최적화된 소음 제거 성능을 보장할 수 없다. 이러한 문제를 해결하기 위해 사운드 종류에 따라 선택적 동작을 하는 소음 제거가 필요하고, 본 논문에서는 이를 위해 딥 러닝 기반의 환경 사운드 분류 기술을 제안한다. 제안 방법은 기존 오디오 특성인 멜-스펙트로그램의 한계를 극복하기 위해 새로운 특성으로서 멜-스펙트로그램 기반의 시간 변화 특성과 통계적 주파수 특성을 사용하며, 합성곱 신경망을 이용하여 특성을 모델링 한다. 제안하는 분류기를 사용하여 3가지 소음과 2가지 비소음으로 구성된 총 5가지 클래스로 사운드를 분류하였고, 제안하는 오디오 특성을 사용하여 기존 멜-스펙트로그램 특성을 사용할 때에 비하여 분류 정확도가 6.6% 포인트 향상되는 것을 확인하였다.

근전도 센서를 연동한 둥근 어깨 개선 모바일 어플리케이션 제안 (Proposal of mobile application for rounded shoulder improvement in connection with EMG sensor)

  • 박소미;계윤신;임희수;박수이
    • 한국정보통신학회논문지
    • /
    • 제25권5호
    • /
    • pp.667-676
    • /
    • 2021
  • 최근 우리나라의 청소년들은 스마트폰 과사용, 많은 학습량에 따른 신체활동 부족 등으로 인하여 자세 불균형의 위험에 노출되어있다. 또한 코로나 19로 인해 효과적인 비대면 운동 서비스에 대한 니즈가 증가하고 있는 추세이다. 이에 착안해 본 연구에서는 청소년들을 대상으로 둥근 어깨 개선의 효과를 제공하면서 비대면 서비스의 한계를 극복하기 위해 근전도 센서를 활용한 운동 서비스를 제안하고자 한다. 둥근 어깨를 개선할 수 있는 운동 프로그램을 구성하고, 효과적으로 운동할 수 있도록 근전도 센서를 연동한 어플리케이션을 구현하였다. 운동 프로그램은 4주 동안 타깃 근육 부위를 번갈아 가며 운동할 수 있도록 구성했고, 이에 따라 변화하는 근전도 수치를 측정하여 피드백을 제공할 수 있는 기능을 부가했다. 본 연구를 통하여 운동 기반의 자세 교정 디지털 서비스의 바탕을 제공하고, 이를 통하여 불균형한 신체를 개선함으로써 건강 증진의 가능성을 도모하고자 한다.

증강현실 기반의 키즈 콘텐츠 제작을 위한 관찰 조작형 모델의 설계 및 구현 (Design and Implementation of Observation Manipulation Model for Creating Kids Contents Based on Augmented Reality)

  • 오암석
    • 한국정보통신학회논문지
    • /
    • 제25권3호
    • /
    • pp.339-345
    • /
    • 2021
  • 코로나19로 인해 온라인 교육이 발달하면서 교육에 AI, AR/VR등의 신기술을 결합한 에듀테크 시장이 급격히 성장하고 있다. 또한, 1가구 1자녀 가정이 늘면서 자녀에 대한 투자가 집중됨에 따라 매년 출산율이 줄어듦에도 불구하고 키즈 산업은 꾸준히 성장 중이다. 그러나 늘어나는 수요에 비해 에듀테크 시장의 콘텐츠 공급은 더딘 편이다. 이에 본 논문에서는 AR 기술을 이용하여 편의성, 실용성, 효율성을 갖춘 AR 키즈 콘텐츠를 개발하고 지원함으로써 이러한 문제를 해결 하는데 도움을 주는 것을 목적으로 한다. 유아 어휘 학습 지원용 AR 콘텐츠는 단순히 보고 듣는 것이 끝이 아니라, 콘텐츠를 직접 조작해볼 수 있는 관찰 조작형 모델이라 유아의 흥미를 유발하고 아동의 단어학습에 도움을 준다. 본 논문은 본격적인 언어발달이 나타나는 생후 15개월 이상 36개월 이하의 유아를 대상으로 한다.

린스타트업 기법을 활용한 유튜브 인플루언서의 창업전략 (Youtube Influencer's Startup Strategy Using Lean Startup Technique)

  • 박정선;박상혁;김영락
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권1호
    • /
    • pp.147-173
    • /
    • 2022
  • Purpose As the use of social network services has become common, it has become possible to freely communicate and establish relationships with other people anytime, anywhere for communication and information sharing. Influencers who have a strong influence on consumers' perceptions and attitudes through their own opinions and stories have appeared on various social media channels such as YouTube. Recently, companies utilize influencers with a large number of followers to check interactions with customers to understand customer attitudes and opinions about products in real time. Start-ups with insufficient resources need to quickly examine customer responses to reduce the probability of failure after product planning. The Lean process of creating an MVP and quickly confirming and learning the market response should be repeated over and over again. Findings In this paper, we try to suggest that the YouTube platform can play a sufficient role as a customer experiment space through examples. The case company is a company that has successfully commercialized products by continuously interacting with customers through the YouTube platform for the first four months of its founding. This paper is expected to be helpful in the experimental process for prospective founders and early founders to examine customer responses to reduce the probability of market failure before commercialization. Design/methodology/approach This paper analyzed the YouTube channel data of case companies based on the netnography methodology and presented the contents of the lean process management carried out in the experimental stage and the post-production stage through interview research.

피부 미세요소 조절을 통한 얼굴 영상 합성 (Facial Image Synthesis by Controlling Skin Microelements)

  • 김유진;박인규
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.369-377
    • /
    • 2022
  • 최근 딥러닝 기반의 얼굴 합성 연구는 전체적인 스타일이나 헤어, 안경, 화장과 같은 요소를 포함하는 매우 사실적인 얼굴을 생성하는 결과를 보인다. 그러나 피부의 미세 구조와 같은 매우 세부적인 수준의 얼굴은 생성하지 못한다. 본 논문에서는 이러한 한계점을 극복하고자 한 장의 얼굴 라벨 영상으로부터 피부 미세 요소의 종류와 강도 조절을 통해 더욱 사실적인 얼굴 영상을 합성하는 기법을 제안한다. 제안하는 기법은 Image-to-Image Translation 방법인 Pix2PixHD를 이용해 얼굴 영역과 피부 요소인 주름, 모공, 홍조가 표시된 라벨 영상을 변환하여 미세 요소가 추가된 얼굴 영상을 생성한다. 피부 요소 영역을 조절한 라벨 영상을 다양하게 생성함으로써 이에 대응하는 미세한 피부 요소가 반영된 다양한 사실적인 얼굴 영상을 생성할 수 있음을 실험을 통해 보인다.

비디오 인코더를 통한 딥러닝 모델의 정수 가중치 압축 (Compression of DNN Integer Weight using Video Encoder)

  • 김승환;류은석
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.778-789
    • /
    • 2021
  • 최근 다양한 분야에서 뛰어난 성능을 나타내는 Convolutional Neural Network(CNN)모델을 모바일 기기에서 사용하기 위한 다양한 연구가 진행되고 있다. 기존의 CNN 모델은 모바일 장비에서 사용하기에는 가중치의 크기가 크고 연산복잡도가 높다는 문제점이 있다. 이를 해결하기 위해 가중치의 표현 비트를 낮추는 가중치 양자화를 포함한 여러 경량화 방법들이 등장하였다. 많은 방법들이 다양한 모델에서 적은 정확도 손실과 높은 압축률을 나타냈지만, 대부분의 압축 모델들은 정확도 손실을 복구하기 위한 재학습 과정을 포함시켰다. 재학습 과정은 압축된 모델의 정확도 손실을 최소화하지만 많은 시간과 데이터를 필요로 하는 작업이다. Weight Quantization이후 각 층의 가중치는 정수형 행렬로 나타나는데 이는 이미지의 형태와 유사하다. 본 논문에서는 Weight Quantization이후 각 층의 정수 가중치 행렬을 이미지의 형태로 비디오 코덱을 사용하여 압축하는 방법을 제안한다. 제안하는 방법의 성능을 검증하기 위해 ImageNet과 Places365 데이터 셋으로 학습된 VGG16, Resnet50, Resnet18모델에 실험을 진행하였다. 그 결과 다양한 모델에서 2%이하의 정확도 손실과 높은 압축 효율을 달성했다. 또한, 재학습 과정을 제외한 압축방법인 No Fine-tuning Pruning(NFP)와 ThiNet과의 성능비교 결과 2배 이상의 압축효율이 있음을 검증했다.