• Title/Summary/Keyword: 데이터 합성

Search Result 1,389, Processing Time 0.034 seconds

Generative Adversarial Networks를 이용한 Face Morphing 기법 연구 (Face Morphing Using Generative Adversarial Networks)

  • 한윤;김형중
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권3호
    • /
    • pp.435-443
    • /
    • 2018
  • 최근 컴퓨팅 파워의 폭발적인 발전으로 컴퓨팅의 한계 라는 장벽이 사라지면서 딥러닝 이라는 이름 하에 순환 신경망(RNN), 합성곱 신경망(CNN) 등 다양한 모델들이 제안되어 컴퓨터 비젼(Computer Vision)의 수많은 난제들을 풀어나가고 있다. 2014년 발표된 대립쌍 모델(Generative Adversarial Network)은 비지도 학습에서도 컴퓨터 비젼의 문제들을 충분히 풀어나갈 수 있음을 보였고, 학습된 생성기를 활용하여 생성의 영역까지도 연구가 가능하게 하였다. GAN은 여러 가지 모델들과 결합하여 다양한 형태로 발전되고 있다. 기계학습에는 데이터 수집의 어려움이 있다. 너무 방대하면 노이즈를 제거를 통한 효과적인 데이터셋의 정제가 어렵고, 너무 작으면 작은 차이도 큰 노이즈가 되어 학습이 쉽지 않다. 본 논문에서는 GAN 모델에 영상 프레임 내의 얼굴 영역 추출을 위한 deep CNN 모델을 전처리 필터로 적용하여 두 사람의 제한된 수집데이터로 안정적으로 학습하여 다양한 표정의 합성 이미지를 만들어 낼 수 있는 방법을 제시하였다.

파수 영역에서 모노스태틱 변환을 이용한 바이스태틱 개구합성 레이다 영상화 기법 연구 (A Study on Bistatic SAR Imaging Using Bistatic-to-Monostatic Conversion in Wavenumber Domain)

  • 조병래;선선구;이정수;박규철;하종수
    • 한국전자파학회논문지
    • /
    • 제24권2호
    • /
    • pp.207-213
    • /
    • 2013
  • 본 논문에서는 바이스태틱-모노스태틱 변환을 이용하여 바이스태틱 개구합성 레이다 영상화를 위한 ${\omega}$-K(omega-K) 알고리즘에 대해 기술하였다. 고려된 바이스태틱 개구합성 레이다는 1개의 정지된 송신 안테나와 여러 개의 수신 안테나로 구성된 물리적 배열 구조로 구성되어 있다. 수신 안테나의 물리적 배열 구조의 길이는 SAR 시스템의 개구합성 길이와 동일하다. 모노스태틱 구조와 다르게 바이스태틱 구조에서 ${\omega}$-K(omega-K) 알고리즘은 2차원 파수 영역에서 정확한 수학적 해를 얻을 수 없다. 제안된 영상화 기법의 핵심은 바이스태틱 구조의 데이터를 모노스태틱 구조의 데이터로 변환하는 것이다. 시뮬레이션과 실제 측정된 데이터를 이용하여 제안된 영상화 기법이 효과적임을 보여준다.

다시점 3차원 비디오 재생 시스템 설계 및 구현 (Design and Implementation of Multi-View 3D Video Player)

  • 허영수;박광훈
    • 방송공학회논문지
    • /
    • 제16권2호
    • /
    • pp.258-273
    • /
    • 2011
  • 본 논문에서는 기존 비디오 재생 시스템보다 고속으로 동작하는 다시점 3차원 비디오 재생 시스템을 설계하여 구현하였다. 대용량의 다시점 영상 데이터를 고속으로 처리하기 위해 구성 모듈들을 병렬화하여 다중코어 프로세서 환경에서 최적의 속도를 얻을 수 있는 구조를 제안하였다. 병목지점의 병행성을 활용하기 위하여 복호화, 영상합성, 렌더링 모듈을 파이프라인 구조로 설계하였다. 부하 균형을 위하여 복호화 모듈을 시점 단위로 분할하고, 영상합성 모듈을 합성영상을 기준으로 기하적으로 데이터 분할하였다. 실험결과로서, 다시점 영상이 올바르게 합성되어 무안경식 다시점 입체디스플레이 상에서 시청 시 입체감을 느낄 수 있었으며, 제안하는 응용프로그램의 처리구조는 다중코어 프로세서를 최대 활용하여 대용량의 다시점 영상데이터를 고속으로 처리할 수 있었다.

온도와 물성의 불확실성을 고려한 고무 마운트의 동특성 해석 (Analysis on the Dynamic Characteristics of a Rubber Mount Considering Temperature and Material Uncertainties)

  • 이두호;황인성
    • 한국전산구조공학회논문집
    • /
    • 제24권4호
    • /
    • pp.383-389
    • /
    • 2011
  • 본 논문에서는 통계적인 방법을 이용하여 점탄성 제진재인 합성고무의 물성에 대한 변동성을 평가하는 방법을 제안하고 측정데이터를 이용하여 합성고무에 대한 평가를 수행하고 합성고무로 이루어진 고무 마운트에 대한 동특성 해석을 수행하였다. 고무 물성의 불확실성 인자로는 외기 온도의 변화와 실험 데이터의 오차 및 점탄성 물질모델의 오차를 고려하였다. 고무는 분수차 미분모델로 표현되었고, 온도의 영향은 비선형 이동계수모델을 도입하여 복소계수로 나타내어 동강성과 감쇠를 표현하였다. 이러한 물성모델을 바탕으로 고무에 대한 물성 실험데이터와 물성계수의 확률밀도함수 사이에 정의된 우도함수를 최대화하는 통계적 보정방법을 이용하여 물성모델의 물질계수들에 대한 변동성을 추정하였다. 합성고무로 이루어진 제진용 고무 마운트에 대하여 유한요소모델을 이용하여 동특성을 계산하였다. 동특성의 계산시 추정된 물성의 통계값을 적용하고 몬테카를로 해석을 통하여 동강성의 변동성을 살펴서 그 변동성이 매우 큼을 확인하였다.

시분할 특징 융합 합성곱 신경망을 이용한 스마트폰 사용자의 행동 검출 (Detection The Behavior of Smartphone Users using Time-division Feature Fusion Convolutional Neural Network)

  • 신현준;곽내정;송특섭
    • 한국정보통신학회논문지
    • /
    • 제24권9호
    • /
    • pp.1224-1230
    • /
    • 2020
  • 스마트폰의 보급 이후 웨어러블 디바이스에 대한 관심이 높아지고 다양화되면서 사용자들의 생활에 밀접하게 연관되고 있으며, 개인화된 서비스를 제공하기 위한 방법으로 사용되고 있다. 본 논문에서는 스마트폰에 내장된 3축 가속도 센서와 3축 자이로 센서의 정보를 합성곱 신경망에 적용하여 사용자의 행동을 검출하는 방법을 제안한다. 인간의 행동은 동작의 크기와 범위에 따라서 동작을 구성하는 신호 데이터의 지속시간을 포함한 시작 시점과 끝나는 시점이 다르다. 이로 인해 합성곱 신경망에 그대로 적용하면 행동 인식 정확도에 대한 성능상의 문제가 있다. 따라서 센서 데이터를 시간의 구간에 따라 분할된 특징을 학습하는 시분할 특징 융합 합성곱 신경망(TDFFCNN: Time-Division Feature Fusion Convolutional Neural Network)을 제안하였다.

콘포머 기반 FastSpeech2를 이용한 한국어 음식 주문 문장 음성합성기 (A Korean menu-ordering sentence text-to-speech system using conformer-based FastSpeech2)

  • 최예린;장재후;구명완
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.359-366
    • /
    • 2022
  • 본 논문에서는 콘포머 기반 FastSpeech2를 이용한 한국어 메뉴 음성합성기를 제안한다. 콘포머는 본래 음성 인식 분야에서 제안된 것으로, 합성곱 신경망과 트랜스포머를 결합하여 광역과 지역 정보를 모두 잘 추출할 수 있도록 한 구조다. 이를 위해 순방향 신경망을 반으로 나누어 제일 처음과 마지막에 위치시켜 멀티 헤드 셀프 어텐션 모듈과 합성곱 신경망을 감싸는 마카론 구조를 구성했다. 본 연구에서는 한국어 음성인식에서 좋은 성능이 확인된 콘포머 구조를 한국어 음성합성에 도입하였다. 기존 음성합성 모델과의 비교를 위하여 트랜스포머 기반의 FastSpeech2와 콘포머 기반의 FastSpeech2를 학습하였다. 이때 데이터셋은 음소 분포를 고려한 자체 제작 데이터셋을 이용하였다. 특히 일반대화 뿐만 아니라, 음식 주문 문장 특화 코퍼스를 제작하고 이를 음성합성 훈련에 사용하였다. 이를 통해 외래어 발음에 대한 기존 음성합성 시스템의 문제점을 보완하였다. ParallelWave GAN을 이용하여 합성음을 생성하고 평가한 결과, 콘포머 기반의 FastSpeech2가 월등한 성능인 MOS 4.04을 달성했다. 본 연구를 통해 한국어 음성합성 모델에서, 동일한 구조를 트랜스포머에서 콘포머로 변경하였을 때 성능이 개선됨을 확인하였다.

활용 주체별 빅데이터 수용 인식 차이에 관한 연구: 활용 목적, 조직 규모, 업종 특성을 중심으로 (Intention to Use and Group Difference in Adopting Big Data: Towards a Comprehensive View)

  • 이영주;양현철
    • 정보화정책
    • /
    • 제24권1호
    • /
    • pp.79-99
    • /
    • 2017
  • 빅데이터 관련 기술이 점차 성숙해지고 있고 공공부문을 중심으로 초기 성공사례들이 발표되고 있으나 실질적인 가치 창출에 대한 확신 부족과 개인정보 유출에 대한 여전한 우려로 산업 전반으로의 확산이 더딘 실정이다. 본 연구에서는 빅데이터 도입 과정에서 다양한 이해관계자 집단 별로 긍정적, 부정적 인식이 도입 활성화에 어떠한 차이를 보이는지 탐색적으로 규명하고자 한다. 먼저 기술수용모형(TAM)과 업무기술적합성(TTF) 모형, 프라이버시 계산이론을 바탕으로 긍정적인 평가요인과 부정적인 평가요인을 통합하여 독립변수를 개발하고 빅데이터 이용의도를 종속변수로 하는 연구 모형을 개발하였다. 국내 빅데이터 실사용자 또는 잠재적 사용자를 대상으로 실증 분석한 결과 선행요인 중 빅데이터의 인지된 유용성, 업무기술적합성, 개인정보침해위험이 이용의도에 유의미한 영향을 주고, 사용용이성은 유의성이 없는 것으로 나타났다. 또한 각 요인 별로 빅데이터 활용 주체에 따른 집단 간 변수의 평균 차이를 부분적으로 발견할 수 있었고, 독립변수와 종속변수와의 인과관계에서도 일부 조절효과를 발견하였다. 본 연구의 시사점을 통해 향후 빅데이터의 산업 활성화를 위해서 이해관계자 별 차별화된 정책 개발이 필요한 시점이다.