• 제목/요약/키워드: 모델합성

검색결과 1,757건 처리시간 0.029초

다중 스케일 시간 확장 합성곱 신경망을 이용한 방송 콘텐츠에서의 음성 검출 (Speech detection from broadcast contents using multi-scale time-dilated convolutional neural networks)

  • 장병용;권오욱
    • 말소리와 음성과학
    • /
    • 제11권4호
    • /
    • pp.89-96
    • /
    • 2019
  • 본 논문에서는 방송 콘텐츠에서 음성 구간 검출을 효과적으로 할 수 있는 심층 학습 모델 구조를 제안한다. 또한 특징 벡터의 시간적 변화를 학습하기 위한 다중 스케일 시간 확장 합성곱 층을 제안한다. 본 논문에서 제안한 모델의 성능을 검증하기 위하여 여러 개의 비교 모델을 구현하고, 프레임 단위의 F-score, precision, recall을 계산하여 보여 준다. 제안 모델과 비교 모델은 모두 같은 학습 데이터로 학습되었으며, 모든 모델은 다양한 장르(드라마, 뉴스, 다큐멘터리 등)로 구성되어 있는 한국 방송데이터 32시간을 이용하여 모델을 학습되었다. 제안 모델은 한국 방송데이터에서 F-score 91.7%로 가장 좋은 성능을 보여주었다. 또한 영국과 스페인 방송 데이터에서도 F-score 87.9%와 92.6%로 가장 높은 성능을 보여주었다. 결과적으로 본 논문의 제안 모델은 특징 벡터의 시간적 변화를 학습하여 음성 구간 검출 성능 향상에 기여할 수 있었다.

연속음성 인식 및 합성을 위한 운율 경계강도 예측 모델 (Prosody Boundary Index Prediction Model for Continuous Speech Recognition and Speech Synthesis)

  • 강평수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.99-102
    • /
    • 1998
  • 본 연구에서는 연속음 인식과 합성을 위한 경계강도 예측 모델을 제안한다. 운율 경계 강도는 음성 합성에서는 운율구 사이의 휴지기의 길이 조절로 합성음의 자연도에 기여를 하고 연속음 인식에서는 인식과정에서 나타나는 후보문장의 선별 과정에 특징변수가 되어 인식률 향상에 큰 역할을 한다. 음성학적으로 발화된 문장은 큰 경계 단위로 볼 때 운율구 형태로 이루어졌다고 볼 수 있으며 구의 경계는 문장의 문법적인 특징과 관련을 지을 수 있게 된다. 본 논문에서는 운율 경계 강도 수준을 4로 하고 문법적인 특징으로는 트리구조 방법으로 결정된 오른쪽 가지의 수식의 깊이(rd)와 link grammar방법으로 결정된 음절수(syl), 연결거리(torig)를 bigram 모형과 결합하여 운율적 경계 강도를 예측한다. 예측 모형으로는 다중 회귀 모형과 Marcov 모형을 제안한다. 이들 모형으로 낭독체 200 문장에 대해 실험한 결과 76%로 경계 강도를 예측할 수 있었다.

  • PDF

영상기반 3-D 모델링 및 합성 기법 구현 (Implementation of image-based 3-D modeling and synthesis technique)

  • 송문재;권용무;임성규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.591-593
    • /
    • 1998
  • 실제감을 가지는 가상의 환경을 만들고, 사용자의 interaction에 맞추어 가상 환경과오브젝트를 조정하는 분야는 최근에 들어 많은 관심을 끌고 있다. 본 논문에서는 실제 영상을 이용하여 3차원 오브젝트 모델링 및 합성하는 방법에 대한 논의를 하였다. 실제 영상에서 깊이 정보를 얻어내는 방법으로는 다해상도 다기선 스테레오 정합 기법(multi-resolution multiple-baseline stereo matching technique : MR-MBS)을 이용하였으며, 실제 영상에서 생성된 모델을 Open Inventor 환경에서 모델을 재구성하고 performer를 이용하여, 최종적인 합성 영상을 만들어 내었다. 합성된 임의시점에서의 영상에서 사용자 조작에 따라 각각의 오브젝트를 조정 할 때 결과 영상을 실시간으로 얻을 수 있었고, 실제 영상의 텍스춰를 그대로 사용함으로써 실제감을 높일 수 있었다.

  • PDF

유전독성물질의 평가방법과 그 기작에 관한 연구

  • 이정섭;박종근;박종광;박상대
    • 한국응용약물학회:학술대회논문집
    • /
    • 한국응용약물학회 1993년도 제2회 신약개발 연구발표회 초록집
    • /
    • pp.170-170
    • /
    • 1993
  • 유전독성물절외 검출과 평가에 용이하게 사용할 수 있는 모델 시스템의 개발 및 DNA 회복기작을 규명할 목적으로 수종의 돌연변이, 발암원을 이용하여 배양 포유동물세포 및 어류세포에서 세포생존률, DNA 합성 및 복제억제의 양상 등을 비교 분석하였다. MMS및 MNNG 와 같은 알칼라제는 CHO 세포에서 유의한 DNA 합성저해, DNA 복재억제, DNA 단사절단 및 비주기성 DNA 합성률의 증가를 유발하였다. Benzo(a)pyrene과 3-methylcholanthrene좌 같은 DNA 상해 전구물질의 경우 유전독성 여부의 판정에는 반드시 S-9/15과 같은 대사활성계 또는 mouse embryonic fibroblast와 같은 대사 활성능이 있는 세포와의 co-culture system들이 필요함을 확인하였으며, 이들에 의한 DNA 상해와 복재억제 유도의 작용양상은 자외선의 작용양상과 유사하였다. 배양 어류세포에서 자외선에 의한 세포생존율의 측정, 광재활성능의 분석 및 자외선에 의해 유발된 피리미딘 이량체 절제능 검토 및 DNA 합성 저해능의 결과를 분석함으로써 유전독성 평가를 위한 모델 시스템 구축의 기초결과를 얻었다.

  • PDF

XML 뷰를 지원하는 랩퍼에서 트리 기반의 XML 뷰 합성 모델 (A Tree-Based View Composition Model in Storage Wrapper Supporting XML Views)

  • 강동완;배종민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1481-1484
    • /
    • 2003
  • XML 뷰 기반의 랩퍼 시스템은 지역 데이터베이스에 대한 XML 뷰 정의를 지원하고, 사용자는 XML 질의어를 이용하여 XML 뷰에 대한 질의를 할 수 있다. 이 때, XML 뷰와 질의간의 합성이 필수적인데, 본 논문에서는 XML 뷰와 사용자 질의를 높은 수준에서 추상화하여 모두 트리로 표현하고, 이것을 이용하여 질의에 나타난 뷰의 경로식에 대한 항해를 통해 합성을 수행하는 모델을 제시한다. 뷰 트리는 가상의 XML 문서의 구조를 그대로 반영하기 때문에 경로식의 항해를 쉽게 하며, XML 뷰의 스키마를 생성하고, 질의 결과 문서를 구성하는 템플릿으로 활용된다. 또한, XML 뷰와 질의의 추상화된 개념적 통일은 다단계 XML 뷰 정의와 합성을 지원하고, 구현을 용이하게 한다.

  • PDF

3차원 모델 기반 영상전송 시스템에서의 특징점 추출과 영상합성 연구 (A Study on the Feature Point Extraction and Image Synthesis in the 3-D Model Based Image Transmission System)

  • 배문관;김동호;정성환;김남철;배건성
    • 한국통신학회논문지
    • /
    • 제17권7호
    • /
    • pp.767-778
    • /
    • 1992
  • 3-D 모델 기반 부호화 시스템에서 특징점 추출과 영상합성에 대하여 연구하였다. 얼굴의 특징점들은 영상처리 기술들과 얼굴에 대한 사전지식을 이용하여 자동적으로 추출된다. 추출된 얼굴의 특징점들을 이용하여 얼굴에 정합된 철선 프레임을 특징점의 움직임에 따라 변형시킨다. 변형된 철선 프레임 위에 초기 정면 영상의 질감을 매핑함으로써 합성영상이 만들어진다. 실험결과, 합성영상은 부자연스러움이 거의 나타나지 않았다.

  • PDF

합성 이미지에 대한 기존 머신 러닝 이미지 분류 모델의 성능 비교 (Comparison of Machine Learning Models for Image Classification on Composite Images)

  • 정윤진;한지형
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.324-326
    • /
    • 2021
  • 증강현실은 현실 공간에 가상의 객체를 합성한 영상을 생성하는 기술이다. 증강현실 기술에 대한 지속적인 수요 증가와 기술 발전이 이루어져 왔으며, 앞으로 사용자에게 현실을 기반으로 생성된 이질감이 느껴지지 않는 정교한 영상을 제공할 수 있으리라 기대할 수 있다. 본 논문에서는 증강현실 기술로 생성된 합성 영상이 정교한 영상임을 판단할 수 있는 객관적인 기준을 마련하기 위해 기존의 머신 러닝 기반의 이미지 분류 모델들로 합성 이미지 예측에 대한 실험을 진행하고 그 결과를 비교한다.

  • PDF

삼차원 합성곱 신경망과 X선 단층 영상에서 추출한 형태학적 특징을 이용한 PEMFC용 가스확산층의 투과도 예측 (Permeability Prediction of Gas Diffusion Layers for PEMFC Using Three-Dimensional Convolutional Neural Networks and Morphological Features Extracted from X-ray Tomography Images)

  • 유한길;윤군진
    • Composites Research
    • /
    • 제37권1호
    • /
    • pp.40-45
    • /
    • 2024
  • 본 연구에서는 고분자 전해질막 연료전지용 가스확산층의 투과도를 예측하기 위해 삼차원 합성곱 신경망 모델을 사용하는 방법론을 소개한다. 먼저, 기계학습 모델을 학습시키기 위해 X-선 단층 촬영을 통해 얻은 실제 가스확산층 이미지에서 형태학적 특성을 추출해 가스확산층의 대표 체적 요소로 이루어진 인공 데이터셋을 생성한다. 이러한 형태학적 특성은 다공성, 섬유 배향, 직경의 통계적 분포가 포함된다. 구축한 인공 데이터셋 대표 체적 요소들의 투과도를 평가하기 위해 격자 볼츠만 방법이 사용되었으며 각각의 대표 체적 요소들의 투과도를 도출하였다. 이러한 인공 데이터셋을 통해 삼차원 합성곱 신경망 모델을 학습시켰으며 인공 데이터셋을 학습한 삼차원 합성곱 신경망 모델이 실제 가스확산층의 대표 체적 요소 투과도 또한 잘 예측하는 것을 확인하였다.

키워드 음성인식을 위한 음성합성 기반 자동 학습 기법 (A Automated Method for Training Keyword Spotter based on Speech Synthesis)

  • 임재봉;이종수;조용훈;백윤주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.494-496
    • /
    • 2021
  • 최근 경량 딥러닝 기반 키워드 음성인식은 가전, 완구, 키오스크 등 다양한 응용에 음성 인터페이스를 쉽게 적용할 수 있는 기술로서 주목받고 있다. 키워드 음성인식은 일부 키워드만 인식 가능한 음성인식 기술로서 저성능 디바이스에서 활용 가능한 장점이 있다. 그러나 응용에 따라 필요한 키워드에 대하여 다시 음성데이터를 수집해야하고 이를 학습하여 모델을 새로 준비해야하는 단점이 있다. 따라서 본 연구에서는 음성데이터 수집 없이 음성합성을 통해 생성한 음성으로만 키워드 음성인식 모델을 학습하는 음성합성 기반 자동 학습 기법을 제안하였다. 생성한 음성데이터를 활용하고자하는 시도가 활발히 이루어지고 있으나, 기존 연구에서는 정확도를 유지하기 위하여 수집한 실제 음성데이터가 필요한 한계가 있다. 제안한 자동 학습 기법은 생성한 음성데이터에 대해 복합 데이터 증대 기법을 적용하여 실제 음성데이터 없이 키워드 음성인식의 정확도를 높였다. 제안한 기법에 대하여 상용 음성합성 서비스를 기반으로 수집한 한국어 키워드 데이터세트를 활용하여 성능평가를 진행하였다. 20개 한국어 키워드에 대해 실험한 결과, 제안한 기법을 적용하여 학습시킨 키워드 음성인식 모델의 정확도는 86.44%임을 확인하였다.

부모멘트를 받는 합성보의 전단합성 거동에 대한 유한요소해석 (FE Analysis of the Composite Action in the Composite Beam subjected to the Hogging Moment)

  • 신현섭
    • 한국산학기술학회논문지
    • /
    • 제14권8호
    • /
    • pp.4048-4057
    • /
    • 2013
  • 부모멘트를 받는 합성보 슬래브에서 인장균열 발생과 균열의 진행에 따른 슬래브의 강성저하가 전단연결부의 합성거동에 미치는 영향을 실험적으로 분석하기는 매우 어렵다. 본 논문에서는 부모멘트를 받는 합성보에서 콘크리트 슬래브 및 강재 보, 스터드를 포함한 전단연결부 등의 형상과 물성을 최대한 실제와 유사하게 모델링하는 기법을 이용함으로써, 부재 간 합성작용을 해석할 수 있는 3차원 유한요소모델을 개발하였다. 개발된 3차원 유한요소모델을 이용하여 부모멘트 구간에 설치되는 합성보의 전체 휨거동 및 기존의 1차원 또는 2차원 모델로는 해석이 어려운 전단합성작용을 분석할 수 있었다. 해석결과에 따르면 부모멘트를 받는 합성보에서의 전단연결부 거동은 철근콘크리트 슬래브의 철근비 및 인장 균열거동에 지배를 받게 됨을 알 수 있었다. 전단연결부의 하중-슬립 관계를 검토해 본 결과, 전단연결부의 슬립강성은 슬래브의 초기균열 및 철근의 항복이 발생한 시점을 기준으로 변화됨을 알 수 있었다. 또한, 구간별로 합성율이 100% 미만으로 설계되는 부분합성 설계가 합성설계의 효율성 측면에서 더 유리할 수 있다는 기존의 실험적 연구결과를 간접적으로 확인할 수 있었다.