• Title/Summary/Keyword: 모델합성

Search Result 1,729, Processing Time 0.031 seconds

The Cardinality Residual Connection Method Applied to Transformer Model combining with BERT Layer (BERT layer를 합성한 Transformer 모델에 적용한 Cardinality Residual connection 방법)

  • Choi, Gyu-Hyeon;Lee, Yo-Han;Kim, Young-Kil
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.27-31
    • /
    • 2020
  • 본 논문에서는 BERT가 합성된 새로운 Transformer 구조를 제안한 선행연구를 보완하기 위해 cardinality residual connection을 적용한 새로운 구조의 모델을 제안한다. Transformer의 인코더와 디코더의 셀프어텐션에 BERT를 각각 합성한 모델의 잔차연결을 수정하여 학습 속도와 번역 성능을 개선하고자 한다. 그리고 가중치를 다르게 부여하는 실험으로 어텐션을 선택하는 효과적인 방법을 제시하고 원문의 언어에 맞는 BERT를 사용하는 이유를 설명한다. IWSLT14 독일어-영어 말뭉치와 AI hub에서 제공하는 영어-한국어 말뭉치를 이용한 실험에서는 제안하는 방법의 모델이 기존 모델에 비해 더 나은 학습 속도와 번역 성능을 보였다.

  • PDF

The Modeling and Simulation for Pseudospectral Time-Domain Method Synthetic Environment Underwater Acoustics Channel applied to Underwater Environment Noise Model (수중 환경 소음 모델이 적용된 의사 스펙트럼 시간영역 법 합성환경 수중음향채널 모델링 및 시뮬레이션)

  • Kim, Jang-Eun;Kim, Dong-Gil;Han, Dong-Seog
    • Journal of the Korea Society for Simulation
    • /
    • v.25 no.3
    • /
    • pp.15-28
    • /
    • 2016
  • It is necessary to analyze underwater acoustics channel(UAC) modeling and simulation for underwater weapon system development and acquisition. In order to analyze UAC, there are underwater acoustics propagation numerical analysis models(Ray theory, Parabolic equation, Normal-mode, Wavenumber integration). However, If these models are used for multiple frequency signal analysis, they are inaccurate to calculate result of analysis effectiveness and restricted for signal processing and analysis. In this paper, to overcome this problem, we propose simple/multiple frequency signal analysis model of the Pseudospectral Time-Domain Method synthetic environment UAC applied to underwater environment noise model as like as realistic underwater environment. In order to confirm the validation of the model, we performed the 9 scenarios simulation(4 scenarios of single frequency signal, 4 scenarios of multiple frequency signal, 1 scenario of single/multiple frequency signal like submarine radiated noise) for validation and confirmed the validation of this model through the simulation model.

A Study on the Korean Text-to-Speech Conversion Using the Formant Synthesizer(I) (포만트 합성방식에 의한 한국어 문자/음성 변환에 관한 연구 (I))

  • 김민년
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.119-122
    • /
    • 1995
  • 음소단위의 포만트 합성방식을 이용하여 한국어의 규칙합성에 대해 시험하였다. 포만트 합성방식으로는 Klatt가 제안한 직/병렬 합성기를 수정하여 사용하였으며, 운율 정보를 나타내는 피치값의 제어는 Fujisaki 모델을 이용하였다. 합성에 사용되는 각 파라미터들이 합성음의 음질 및 파형에 미치는 영향을 분석할 수 있도록 합성 파라미터와 음성파형 및 스펙트로그램을 화면에 나타내고 마우스를 이용하여 파라미터 값을 사용자가 적절히 변경한 후 합성할 수 있는 포만트 방식의 합성 Tool을 개발하였으며, 이를 이용하여 한국어 문자/음성변환 시스템을 지속적으로 연구하고자 한다.

  • PDF

Light weight architecture for acoustic scene classification (음향 장면 분류를 위한 경량화 모형 연구)

  • Lim, Soyoung;Kwak, Il-Youp
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.6
    • /
    • pp.979-993
    • /
    • 2021
  • Acoustic scene classification (ASC) categorizes an audio file based on the environment in which it has been recorded. This has long been studied in the detection and classification of acoustic scenes and events (DCASE). In this study, we considered the problem that ASC faces in real-world applications that the model used should have low-complexity. We compared several models that apply light-weight techniques. First, a base CNN model was proposed using log mel-spectrogram, deltas, and delta-deltas features. Second, depthwise separable convolution, linear bottleneck inverted residual block was applied to the convolutional layer, and Quantization was applied to the models to develop a low-complexity model. The model considering low-complexity was similar or slightly inferior to the performance of the base model, but the model size was significantly reduced from 503 KB to 42.76 KB.

Analysis and Synthesis of Audio Signals using a Sinusoidal Model with Psychoacoustic Criteria (정현파 모델을 이용한 오디오 신호의 심리음향적 분석 및 합성)

  • 남승현;강경옥;홍진우
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.2
    • /
    • pp.77-82
    • /
    • 1999
  • A sinusoidal model has been widely used in the analysis and synthesis of speech and audio signals, and becomes one of the efficient candidates for high quality low bit rate audio coders. One of the crucial steps in the analysis and synthesis using a sinusoidal model is the detection of tonal components. This paper proposes an efficient method for the analysis and synthesis of audio signals using a sinusoidal model, which uses psychoacoustic criteria such as masking effect, masking index, and JNDf(Just Noticeable Difference in Frequency). Simulation results show that the proposed method reduces the number of sinusoids significantly without degrading the quality of the synthesized audio signals.

  • PDF

Synthesis and Classification of Active Sonar Target Signal Using Highlight Model (하이라이트 모델을 이용한 능동소나 표적신호의 합성 및 인식)

  • Kim, Tae-Hwan;Park, Jeong-Hyun;Nam, Jong-Geun;Lee, Su-Hyung;Bae, Keun-Sung
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.2
    • /
    • pp.135-140
    • /
    • 2009
  • In this paper, we synthesized active sonar target signals based on highlights model, and then carried out target classification using the synthesized signals. If the target aspect angle is changed, the different signals are synthesized. To know the result, two different experiments are done. First, The classification results with respect to each aspect angle are shown. Second, the results in two group in aspect angle are acquired. Time domain feature extraction is done using matched filter and envelope detection. It shows the pattern of each highlights. Artificial neural networks and multi-class SVM are used for classifying target signals.

XML Specification of Workflow-Based S/W Architecture for Component Composition (컴포넌트 합성을 위한 워크플로우 기반 S/W 아키텍쳐 모델의 XML 명세)

  • Cho, Kwang-Yun;Seo, Hyo-Gil;Hong, Chan-Ki
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.369-372
    • /
    • 2005
  • 최근 소프트웨어의 수요가 증가함에 따라 수요를 충족시키기 위한 다양한 응용 소프트웨어 개발 방식 중 컴포넌트 기반 소프트웨어 개발(CBSD: Component-Based Software Development) 기술이 빠르게 발전하였고, 이에 실제 개발된 컴포넌트의 합성을 통한 커다란 응용 소프트웨어 개발이 활발히 진행되고 있다. 또한 컴포넌트들이 서로 정확하게 합성되고, 작동할 수 있는 방법으로 소프트웨어 아키텍쳐 기반의 합성 환경에 대한 연구들이 진행되고 많은 방법들이 제안되었다[1]. 이에 본 논문에서는 지금껏 제안된 아키텍쳐 모델들이 갖고 있는 소프트웨어 개발에 있어 전체적인 흐름파악의 어려움과 변경의 파급효과라는 문제점들을 해결 및 최소화 시킬 수 있는 방법으로 제안된 워크플로우라는 개념을 사용한 소프트웨어 아키텍쳐 모델에 대한 추가 연구와 더불어 아키텍쳐의 명세를 XML로 정의하므로, 명세 구문의 수정 및 확장이 용이하도록 하였다.

  • PDF

Bottom-up Composition and Verification of Embedded Software (내장형 소프트웨어 컴포넌트의 상향식 합성과 검증)

  • Choi, Yun-Ja
    • The KIPS Transactions:PartD
    • /
    • v.17D no.6
    • /
    • pp.415-422
    • /
    • 2010
  • This paper proposes service-oriented composition and verification techniques for incrementally extracting high-level abstract behavior of unit components in a systematic manner. Proposed techniques include the definition for abstract component, which is a basic building-block of the abstraction process, an algorithm for port-based synchronized abstraction, and projection abstraction. A verification framework is developed using the proposed techniques and its efficiency is demonstrated through a case example.

Segmental duration modelling for Korean text-to-speech synthesis (한국어 음성합성에서 음운지속시간 모델화)

  • Lee YangHee
    • Proceedings of the KSPS conference
    • /
    • 1996.02a
    • /
    • pp.125-135
    • /
    • 1996
  • 본 논문에서는 자연스러운 음성을 합성하기 위하여, 한국어 음운지속시간의 변화에 있어서 문절과 구내의 음절수와 음절의 위치에 의한 영향과 인접하는 음운의 영향에 대하여 통계적으로 분석하였고, 분석된 시간 특징을 제어 요소로 하는 회귀트리를 생성하여 음운 지속시간을 모델 화하였다. 또한, 제안된 음운 지속시간 모델에 의해 예측실험을 행하여, 측정치와 예측치간의 다중 상관계수가 0.74정도이고, 각 음운의 예측오차의 75%이상이 25ms이내로 제안된 모델의 타당성이 입증되었다.

  • PDF

Realistics Facial Expression Animation and 3D Face Synthesis (실감 있는 얼굴 표정 애니메이션 및 3차원 얼굴 합성)

  • 한태우;이주호;양현승
    • Science of Emotion and Sensibility
    • /
    • v.1 no.1
    • /
    • pp.25-31
    • /
    • 1998
  • 컴퓨터 하드웨어 기술과 멀티미디어 기술의 발달로 멀티미디어 입출력 장치를 이용한 고급 인터메이스의 필요성이 대두되었다. 친근감 있는 사용자 인터페이스를 제공하기 위해 실감 있는 얼굴 애니메이션에 대한 요구가 증대되고 있다. 본 논문에서는 사람의 내적 상태를 잘 표현하는 얼굴의 표정을 3차원 모델을 이용하여 애니메이션을 수행한다. 애니메이션에 실재감을 더하기 위해 실제 얼굴 영상을 사용하여 3차원의 얼굴 모델을 변형하고, 여러 방향에서 얻은 얼굴 영상을 이용하여 텍스터 매핑을 한다. 변형된 3차원 모델을 이용하여 얼굴 표정을 애니메이션 하기 위해서 해부학에 기반한 Waters의 근육 모델을 수정하여 사용한다. 그리고, Ekman이 제안한 대표적인 6가지 표정들을 합성한다.

  • PDF