• 제목/요약/키워드: 모델합성

검색결과 1,729건 처리시간 0.038초

고화질 멀티 모달 영상 합성을 통한 다중 콘텐츠 통합 애니메이션 방법 (Multicontents Integrated Image Animation within Synthesis for Hiqh Quality Multimodal Video)

  • 노재승;강진범
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.257-269
    • /
    • 2023
  • 최근 딥러닝 모델을 통해 사진이나 영상을 활용하여 영상 합성을 수행하는 것에 대한 요구가 높아지고 있다. 기존 영상 합성 모델의 경우 주어진 영상으로부터 모션 정보만을 전이하여 사진에 대한 애니메이션 효과를 생성하였다. 하지만 이러한 합성 모델의 경우 음성에 따른 립싱크가 불가능하다는 문제와 함께 합성 결과물의 화질이 떨어진다는 문제점이 있다. 문제를 해결하기 위해 본 논문에서는 이미지 애니메이션 기법을 기반으로 한 새로운 프레임워크에 대해 설명한다. 본 프레임워크에서는 합성하려는 사진과 영상, 그리고 오디오를 제공하면 사진의 인물 특징을 유지한 채 주어진 영상의 행동을 따라 움직이는 것뿐만 아니라 음성에 맞게 발화하는 모습도 함께 합성하여 모션 전이와 함께 립싱크를 수행한 합성 결과물을 생성한다. 또한 초해상화 기법을 영상 합성물에도 활용하여 더욱 고화질, 고해상도의 합성 결과물을 제공하도록 구성하였다.

시간적 분해에 기반한 F0 궤적 모델에 관한 연구 (F0 Contour Model based on Temporal Decomposition)

  • 변효진;김연준;오영환
    • 한국음향학회지
    • /
    • 제18권8호
    • /
    • pp.75-83
    • /
    • 1999
  • 본 논문에서는 음성합성의 억양 제어를 위한 새로운 F0 궤적 모델을 제안한다. 제안한 모델은 발성된 문장의 F0 궤적을 중첩가산되는 사건들로 분해하고, 각 사건들을 가우시안 종모양의 사건함수로 모델링한다. 그리고 제안한 모델을 위한 파라미터 추정 알고리즘을 제시한다. 제안한 모델은 특정한 음운론적 지식에 기반하지 않았으며, F0 궤적의 분석단계와 합성단계에 모두 사용 가능하다. 제안한 모델의 성능평가를 위해 다양한 장르에서 추출한 여러 형태의 500문장의 코퍼스를 구축하고, 이를 전문 아나운서에게 발성하게 하여 구축한 음성코퍼스로 실험한 결과, 원음성의 F0 궤적과 제안한 모델에 의해 합성된 F0 궤적의 평균 제곱 오류근이 7.87Hz이었다.

  • PDF

명암효과와 질감매핑을 이용한 얼굴영상 합성에 관한 연구 (A Study on the Facial Image Synthesis Using Texture Mapping and Shading Effect)

  • 김상현;정성환;김신환;김남철
    • 한국통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.913-921
    • /
    • 1993
  • 질감매핑은 대부분의 모델기반 부호화 시스템에서 영상합성 방식으로 사용 되어진다. 이 영상합성 방법은 정면 얼굴영상의 질감정보로만 영상을 합성한다. 따라서, 모델이 회전 되었을 때, 질감매핑은 명암측면에서 어색한 영상을 합성할 수 있다. 본 논문에서는 명암효과를 고려한 새로운 질감매핑이 연구되었다. 또한 회전에 대비하여 귀의 철선프레임과 머리카락의 변화를 부가하였다. 제안된 방식을 이용하여 실험한 결과, 자연스러운 영상합성이 가능하였다.

  • PDF

구속적 비선형 최적화에 의한 합성재료 탄성물성치의 수치적 예측 (Numerical Prediction of elastic Material Properties of Composites by A Constrained Nonlinear Optimization Method)

  • 신수봉;고현무
    • 전산구조공학
    • /
    • 제10권2호
    • /
    • pp.225-232
    • /
    • 1997
  • 서로 다른 기지의 성질을 갖는 재료들을 혼합하여 만든 합성재료의 새로운 물성치는 일반적으로 실험으로 규명하고 있다. 혼합하는 재료들의 체적비에 따라 실험으로 측정한 합성재료의 탄성계수와 포와송비는 그 합성재료로 만들어지는 구조물의 역학적 거동을 예측하는 해석적 모델의 기본자료로 사용된다. 합성재료 탄성물성치의 수치적 예측은 합성재료에 대한 유한요소 모델로 해석한 정적변위와 균질.등방성으로 가정한 모델을 해석한 정적변위와의 차이를 최소화하는 구속적 비선형 최적화기법을 사용하여 수행하였다. 유한요소 모델은 체적비에 따라 혼합물질을 분배하기 용이하도록 제안하였으며 구속조건 및 하중조건은 일축인장에 의한 거동을 예측하도록 설정하였다. 본 논문에서는 고체입자를 섞어 만든 합성재료의 탄성물성치를 예제를 통하여 수치적으로 예측하고 그 결과를 실험결과 및 이론식들과 비교.검토하였다.

  • PDF

부분구조합성법을 이용한 전차량 모델의 진동 특성 분석 (Analysis of Vibration Characteristics of a Full Vehicle Model Using Substructure Synthesis Method)

  • 김범석;김봉수;유홍희
    • 대한기계학회논문집A
    • /
    • 제34권5호
    • /
    • pp.519-525
    • /
    • 2010
  • 승용 차량과 항공기와 같은 대형 구조물에 대한 해석에는 유한요소법이 일반적으로 사용되고 있다. 그러나 대형 구조물을 유한요소로 모델화 하여 해석하는 경우에는 자유도의 수가 수천에서 수만에 이르게 되어 이를 직접 해석하기 위해서는 많은 시간과 노력이 필요하다. 따라서 차량 모델과 같은 대형 복잡 구조물을 효율적으로 해석하기 위해 부분구조 합성법이 많이 사용되고 있다. 본 연구에서는 Craig-Bampton 방법을 이용한 전차량 모델링 방법을 제안하고 전차량 모델의 진동 특성을 분석하였다. 차량 모델을 구성하는 각 부분을 각각 부분구조 모델로 치환한 후 다시 합성하여 전차량 모델을 구성하였다. 또한, 서브프레임 주요 설계변수, 즉 마운트 위치나 프레임 크기의 편차가 전체 시스템의 모드 특성의 통계적 변화에 미치는 영향을 살펴보았다.

합성곱 신경망과 장단기 메모리를 이용한 사격음 분석 기법 (Shooting sound analysis using convolutional neural networks and long short-term memory)

  • 강세혁;조지웅
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.312-318
    • /
    • 2022
  • 본 논문은 딥러닝기법 중 하나인 합성곱 신경망과 순환 신경망 중 하나인 장단기 메모리를 이용하여 사격시 발생하는 소음(이하 사격음)만으로 화기의 종류, 사격음 발생지점에 관한 정보(거리와 방향)을 추정하는 모델을 다루었다. 이를 위해 미국 법무부 산하 연구소의 지원하에 생성된 Gunshot Audio Forensic Dataset을 이용하였으며, 음향신호를 멜 스펙트로그램(Mel-Spectrogram)으로 변환한 후, 4종의 합성곱 신경망과 1종의 장단기 메모리 레이어로 구성된 딥러닝 모델에 학습 및 검증 데이터로 제공하였다. 제안 모델의 성능을 확인하기 위해 합성곱 신경망으로만 구성된 대조 모델과 비교·분석하였으며, 제안 모델의 정확도가 90 % 이상으로 대조모델보다 우수한 성능을 보였다.

키워드 인식을 위한 한글 Pseudo 2D HMM의 동적 합성 방법 (Dynamic Synthesis of Pseudo 2D HMMs for Korean Characters in Key Character Recognition Tasks)

  • 조범준
    • 한국통신학회논문지
    • /
    • 제26권6B호
    • /
    • pp.820-827
    • /
    • 2001
  • 한글은 둘 또는 세 개의 자모가 사각형 영역 안에 적절히 배치된 구조로 되어 있다. 이와 같은 구성 방법에 따라 글자의 영상을 합성하고 이를 실시간에 Pseudo 2D HMM으로 변환하는 방법을 제안한다. 본 방법에 따라 실시간 합성된 모델과 추가의 필러(filler) 모델, 여백 모델을 문서 영상의 글자 영역에서 핵심어 검출에 적용하였다. 실험 결과 최소한의 설계 변수 조정으로도 오검출, 미검출률이 낮고 언어 모델 없이 숫자 89%, 한글 80%의 검출성능을 보였으며, 따라서 제안된 방법이 인쇄 문자 패턴의 실시간 모델링 및 키워드 검출에 효과가 있음을 보였다. 본 연구 결과는 내용 기반의 광학 문서 색인 등에 활용할 수 있다.

  • PDF

피치 변화음의 합성을 위한 도파관 모델 (Pitch-shifted sound synthesis using digital waveguide model)

  • 조상진;강명수;정의필
    • 융합신호처리학회논문지
    • /
    • 제10권2호
    • /
    • pp.127-131
    • /
    • 2009
  • 디지털 도파관 모델은 파동 방정식의 일반해를 이용하여 진행파를 표현하고 이 진행파의 파동이동을 지연 라인으로 나타낸다. 일반적인 도파관 모델에서의 단일 지연은 샘플링 시간 간격을 의미하지만, 공간 기준 도파관 모델의 단일 지연은 샘플링된 공간의 거리를 의미한다. 이러한 차이점으로 인해 파동의 이동 거리를 직접적으로 조절할 수 있는 공간기준 도파관 모델이 비브라토 음과 같이 피치가 변하는 음을 합성할 수 있다고 알려져 있다. 본 논문에서는 지연라인의 길이의 비로서 피치가 변하는 음을 합성할 수 있는 시간 기준 디지털 도파관 모델을 제안하고 기존의 공간 기준 도파관 모델과의 성능을 비교하였다.

  • PDF

특징 추출기에 따른 SRGAN의 초해상 성능 분석 (Super Resolution Performance Analysis of GAN according to Feature Extractor)

  • 박성욱;김준영;박준;정세훈;심춘보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.501-503
    • /
    • 2022
  • 초해상이란 해상도가 낮은 영상을 해상도가 높은 영상으로 합성하는 기술이다. 딥러닝은 영상의 해상도를 높이는 초해상 기술에도 응용되며 실현은 2아4년에 발표된 SRCNN(Super Resolution Convolutional Neural Network) 모델로부터 시작됐다. 이후 오토인코더 (Autoencoders) 구조로는 SRCAE(Super Resolution Convolutional Autoencoders), 합성된 영상을 실제 영상과 통계적으로 구분되지 않도록 강제하는 GAN (Generative Adversarial Networks) 구조로는 SRGAN(Super Resolution Generative Adversarial Networks) 모델이 발표됐다. 모두 SRCNN의 성능을 웃도는 모델들이나 그중 가장 높은 성능을 끌어내는 SRGAN 조차 아직 완벽한 성능을 내진 못한다. 본 논문에서는 SRGAN의 성능을 개선하기 위해 사전 훈련된 특징 추출기(Pre-trained Feature Extractor) VGG(Visual Geometry Group)-19 모델을 변경하고, 기존 모델과 성능을 비교한다. 실험 결과, VGG-19 모델보다 윤곽이 뚜렷하고, 실제 영상과 더 가까운 영상을 합성할 수 있는 모델을 발견할 수 있을 것으로 기대된다.