• 제목/요약/키워드: 파라미터공간

검색결과 1,377건 처리시간 0.028초

LSTM-RNN 기반 음성합성을 위한 파라미터 생성 알고리즘 (Parameter Generation Algorithm for LSTM-RNN-based Speech Synthesis)

  • 박상준;한민수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.105-106
    • /
    • 2017
  • 본 논문에서는 최대 우도 기반 파라미터 생성 알고리즘을 적용하여 인공 신경망의 출력인 음향 파라미터 열의 정확성 및 자연성을 향상시키는 방법을 제안하였다. 인공 신경망의 출력으로 정적 특징벡터 뿐 만 아니라 동적 특징벡터도 함께 사용하였고, 미리 계산된 파라미터 분산을 파라미터 생성에 사용하였다. 추정된 정적, 동적 특징벡터의 평균, 분산을 EM 알고리즘에 적용하여 최대 우도 기준 파라미터를 추정할 수 있다. 제안된 알고리즘은 파라미터 생성 시 동적 특징벡터 및 분산을 함께 적용하여 시간축에서의 자연성을 향상시켰다. 제안된 알고리즘의 객관적 평가로 MCD, F0 의 RMSE 를 측정하였고, 주관적평가로 선호도 평가를 실시하였다. 그 결과 기존 알고리즘 대비 객관적, 주관적 성능이 향상되는 것을 검증하였다.

  • PDF

T-DMB 환경에서의 DIBR 기반의 3 차원 서비스를 위한 효율적인 파라미터 설정 (An Efficient Parameter Setting for 3D Service Based on DIBR over T-DMB)

  • 이상섭;오영진;이수영;정철곤;김중규;이광순;허남호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.75-77
    • /
    • 2009
  • 깊이 영상 기반 렌더링(DIBR) 방법은 제한된 대역폭을 가진 지상파 DMB(T-DMB)환경에서의 3 차원 서비스를 위한 방법으로 연구되고 있다. T-DMB 환경에서의 DIBR 기반의 3 차원 서비스는 기준 영상과 깊이 영상을 전송 받아 가상의 좌/우 시점 영상을 생성한다. 가상의 좌/우 시점 영상을 생성하기 위해서는 콘텐츠와 디스플레이 환경에 따른 파라미터 값이 주어져야 한다. 하지만 많은 연구에서 표준화된 파라미터 값을 제시하지 않음으로써 렌더링의 기준이 모호해지고, 임의로 정해진 파라미터 값에 의해 DIBR 결과가 크게 달라진다. 또한 콘텐츠에 따른 파라미터 값을 임의로 설정하게 되면 추가적인 정보를 전송해야 하는 문제점이 발생한다. 이에 본 논문에서는 다양한 콘텐츠에 적용 가능하면서도 T-DMB 환경에 적합하도록 계산량을 줄일 수 있는 표준화된 파라미터 설정 방법을 제안하고자 한다.

ARS와 신경회로망을 이용한 장애음성의 수집, 분석 및 식별에 관한 연구 (Collection, Analysis and Classification of Pathological Voice from ARS using Neural Network)

  • 김광인;조철우;김대현;왕수건;전계록;안시훈;김기련;김용주
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.955-958
    • /
    • 2000
  • 본 논문은 음성신호를 이용해 성대의 질환이 있는 환자를 진단하고 병명을 판별하게끔 유도하는 자동 진단 시스템을 개발하기 위한 연구의 일부로, 그중 ARS를 이용하여 환자의 음성을 수집, 분석, 식별의 실험에 대한 연구이다. 본 연구 팀에서는 이미 CSL을 이용한 장애음성 데이터의 수집과 식별에 관한 연구 결과를 발표한바 있다. 하지만 선행연구에서는 방음실에서 디지털 녹음기를 이용하여 수집한 음성을 사용했기 때문에, ARS를 통하여 녹음한 음성과는 샘플링 주파수나 대역폭, 잡음성분등의 데이터의 특성이 상당한 차이가 있다. 이러한 이유로 ARS를 통하여 녹음한 음성에 보다 적합한 파라미터 분석프로그램을 작성하여 파라미터를 구하였다. 이 파라미터들은 Kay사의 MDVP를 기초로하여 작성하였고, 대부분 80%정도의 신뢰성을 가졌다. 수집한 음성의 식별은 정상음성과 양성음성의 두가지 경우로 분리하였다. 식별기법으로는 신경망을 이용하였고, 식별파라미터는 구한 파라미터중 6개의 파라미터를 선별하여 식별한 결과 약 90%정도의 식별율을 가졌다.

  • PDF

카메라의 내부 파라미터를 고려한 수렴형 다중 깊이 지도의 정렬 (Alignment of Convergent Multi-view Depth Map in Based on the Camera Intrinsic Parameter)

  • 이강훈;박종일;신홍창;방건
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.457-459
    • /
    • 2015
  • 본 논문에서는 원의 호 곡선에 따라 배치된 다중 RGB 카메라 영상으로 생성한 깊이 지도를 정렬하는 방법을 제안한다. 원의 호 곡선에 따라 배치된 카메라는 각 카메라의 광축이 한 점으로 만나서 수렴하는 형태가 이상적이다. 그러나 카메라 파라미터를 살펴보면 광축이 서로 수렴하지 않는다. 또한 카메라 파라미터는 오차가 존재하고 내부 파라미터도 서로 다르기 때문에 각 카메라 영상들은 수평과 수직 오차가 발생한다. 이와 같은 문제점을 해결하기 위해 첫 번째로 광축이 한 점으로 수렴하기 위해서 카메라 외부 파라미터를 보정하여 깊이 영상 정렬을 하였다. 두 번째로 내부 파라미터를 수정하여 각 깊이 영상들의 수평과 수직 오차를 감소시켰다. 일반적으로 정렬된 깊이 지도를 얻기 위해서는 초기 RGB 카메라 영상으로 정렬을 수행하고 그 결과 영상으로 깊이 영상을 생성한다. 하지만 RGB 영상으로 카메라의 회전과 위치를 보정하여 정렬하면 카메라 위치 변화에 따른 깊이 지도 변화값 적용이 복잡해 진다. 즉 정렬 계산 과정에서 소수점 단위 값이 사라지기에 최종 깊이 지도의 값에 영향을 미친다. 그래서 RGB 영상으로 깊이 지도를 생성하고 그것을 처음 RGB 카메라 파라미터로 워핑(warping)하였다. 그리고 워핑된 깊이 지도 값을 가지고 정렬을 수행하였다.

  • PDF

CNN 의 파라미터와 정확도간 상호 강인성 연구 및 파라미터 비트 연산 자동화 프레임워크 개발 (Study the mutual robustness between parameter and accuracy in CNNs and developed an Automated Parameter Bit Operation Framework)

  • 이동인;김정헌 ;임승호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.451-452
    • /
    • 2023
  • 최근 CNN 이 다양한 산업에 확산되고 있으며, IoT 기기 및 엣지 컴퓨팅에 적합한 경량 모델에 대한 연구가 급증하고 있다. 본 논문에서는 CNN 모델의 파라미터 비트 연산을 위한 자동화 프레임워크를 제안하고, 파라미터 비트와 모델 정확도 사이의 관계를 실험 및 연구한다. 제안된 프레임워크는 하위 n- bit 를 0 으로 설정하여 정보 손실 발생시킴으로써 ImageNet 데이터셋으로 사전 학습된 CNN 모델의 파라미터와 정확도의 강인성을 비트 단위로 체계적으로 실험할 수 있다. 우리는 비트 연산을 수행한 파라미터로 InceptionV3, InceptionResnetV2, ResNet50, Xception, DenseNet121, MobileNetV1, MobileNetV2 모델의 정확도를 평가한다. 실험 결과는 성능이 낮은 모델일수록 파라미터와 정확도 간의 강인성이 높아 성능이 좋은 모델보다 정확도를 유지하는 비트 수가 적다는 것을 보여준다.

구조해석을 위한 PSC 박스의 객체 정보 모델에 관한 연구 (A study of object information model of PSC box girder bridge for structural analysis)

  • 조성훈;박재근;이헌민;이광명;신현목
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2009년도 정기 학술대회
    • /
    • pp.348-351
    • /
    • 2009
  • 본 논문에서는 구조해석을 위한 PSC 박스 거더교의 객체 정보 모델에 관한 연구를 수행하였다. 대상 교량의 객체 정보 모델을 생성하기 위해서는 수많은 형상 및 치수에 관한 파라미터를 필요로 하게 된다. 따라서 본 연구에서는 이 교량의 설계 목적에 맞는 파라미터를 분류하였고, 파라미터들 사이의 계층구조(Structure)와 상관관계를 정의하였다. 또한 본 연구에서 적용된 인터페이스 프로그램은 3차원 객체 모델에서 출력된 파라미터를 변환하여 구조해석을 위한 입력값으로 변환시켜, 해석 결과값을 구조계산서에 출력시킴으로써 엔지니어가 설계 타당성과 모델변경 요구를 용이하게 할 수 있게 하였다. 그리고 대상 모델에 대한 설계변경은 구조물의 특징에 맞는 상관파라메트릭 방법을 적용하여 신속하게 할 수 있도록 유도하였다. 이 연구를 통해 건설구조물의 설계를 3D 모델로 하기위한 가능성을 확인하였다.

  • PDF

채널 간 위상차 파라미터 생략 기법을 이용한 오디오 부호화 (An Audio Coding Technique Employing the Inter-channel Phase Difference Skip)

  • 김현휘;김인철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.3-4
    • /
    • 2015
  • 본 논문에서는 공간 오디오 부호화 기법인 MPEG 서라운드에서 공간 파라미터 전송 시 위상 파라미터를 생략하는 기법에 대해 다룬다. 기존 방법에서는 한 프레임이 모두 적은 위상차를 가지는 경우에도 정상적으로 처리하여 전송한다. 이러한 경우 위상차 파라미터를 생략하여 비트 효율을 향상시킬 수 있다. 스테레오 복원 과정에서 발생하는 채널 간 시간차에 기반해 설계된 양자화기를 생략 기법에 적용하면 기존에 비해 평균적으로 40 ~ 50% 정도의 위상 파라미터 절감 효과를 얻을 수 있다.

  • PDF

스프링 최적설계를 위한 피로수명 파라미터의 역 추정 (Inverse Estimation of Fatigue Life Parameters for Spring Design Optimization)

  • 김완범;안다운;최주호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2011년도 정기 학술대회
    • /
    • pp.345-348
    • /
    • 2011
  • 구조요소의 설계에서 유한요소해석은 매우 효과적인 방법이다. 이 방법은 시험 수행에 드는 시간과 비용을 줄여준다. 그러나 공정 과정과 환경에 의하여 생기는 입력 물성치들의 변화 때문에 우리는 유한요소해석의 결과를 전적으로 믿어서는 안 된다. 따라서 유한요소해석의 신뢰성을 증명하는 것은 매우 중요하다. 본 연구에서는 현장에 축적된 피로 수명 시험 데이터를 바탕으로 유한요소해석을 이용하여 피로수명 파라미터를 역 추정 하는 연구를 수행하였다. 베이지안 접근법을 이용하여 불확실성 피로 수명 파라미터의 사후분포를 구하였고, 마코프체인몬테카를로(Markov Chain Monte Carlo) 기법을 이용하여 역 추정된 파라미터의 샘플 데이터를 생성하였다. 얻어진 샘플 데이터를 기반으로 새로운 형상의 스프링에 대한 피로 수명을 예측한다. 신뢰성 기반 형상 최적화(RBDO)는 서스펜션 코일 스프링의 요구수명을 만족시키기 위하여 수행된다. 또한 크리깅 근사 모델은 유한요소해석의 연산 량 감소를 위해 이용한다.

  • PDF

이동 멀티미디어 방송(DMB)에서의 H.264/AVC압축 파라미터 성능연구

  • 신승호;김경남;김태용
    • 방송과미디어
    • /
    • 제12권4호
    • /
    • pp.28-39
    • /
    • 2007
  • 다양한 디지털 기술의 발전으로 인하여 방송형태의 이동 멀티미디어 서비스가 다국적으로 제안되고, 국내에서는 이동 멀티미디어 방송 (DMB: Digital Multimedia Broadcasting)을 통하여 야외나 이동시에도 시청이 가능한 방송서비스가 활발해지고 있다. 휴대 및 이동수신 방송 환경에서 비디온 오디오 및 데이터를 포함한 멀티미디어 방송 서비스를 효율적으로 제공하기 위해서는 다양한 장소에서 수신 영상에 대한 품질 확보가 필수적이다. 본 논문에서는 현재 이동 멀티미디어 방송이 비디오 압축방식으로 채택하고 있는 H.264/AVC 압축 파라미터의 성능 연구에 대하여 기술한다. 현재 국내의 위성/지상파 DMB의 경우 비디오의 압축 방법으로 H.264/AVC baseline 1.3의 표준규격을 사용한다. 이러한 비디오 코덱(codec) 이용하여 비디오 영상을 압축할 경우 관련 파라미터(parameter) 조절이 가능한데, 비디오를 압축할 경우 관련 파라미터들을 어떻게 정하느냐에 따라 서로 다른 수신환경에서 압축 효율 및 재생된 비디오의 화질에 많은 영향을 미친다. 따라서 수신 환경에 가장 적합한 비디오 화질을 얻기 위해서는 관련 파라미터 설정이 매우 중요하다. 본 논문에서는 다양한 압축 파라미터들 중 화질에 많은 영향을 미치는 항목을 선정하여, 해당 파라미터의 변화가 재생된 비디오 화질에 미치는 영향을 객관적 평가척도인 PSNR, Bit-rate, 수행시간 등을 이용하여 분석하였다. 또한, 실험 결과를 바탕으로 이동 멀티미디어 방송 환경에서의 H.264 인코더의 적정 압축 파라미터 및 인코더의 성능 개선 방안을 제안한다.

채널 간 위상차 파라미터 생략 기법을 이용한 오디오 부호화 (An Audio Coding Technique Employing the Inter-channel Phase Difference Skip)

  • 김현휘;김인철
    • 방송공학회논문지
    • /
    • 제21권3호
    • /
    • pp.369-379
    • /
    • 2016
  • 본 논문에서는 음성/음악 통합 압축 기술(USAC)에 적용된 공간 오디오 부호화 기법인 MPEG 서라운드에서 채널 간 위상차(IPD) 파라미터를 효과적으로 생략하는 기법에 대해 다룬다. 기존의 방법에서는 파라미터 밴드의 IPD 파라미터가 모두 작은 경우에도 전체를 처리하여 전송한다. 이러한 경우 생략을 통해 비트 효율을 향상시킬 수 있다. IPD 파라미터의 심리음향적 민감도를 고려하여 청취 환경에서 인지하지 못하는 문턱 값을 추정하고, 문턱 값 아래의 위상차를 발생시키는 IPD 파라미터는 0으로 설정하고 전송하지 않는다. 제안하는 채널 간 위상차 파라미터 생략 기법을 적용하면 기존에 비해 38% 정도의 위상 파라미터 절감 효과를 얻을 수 있고, MUSHRA 청취 실험을 통해 복호화된 오디오의 음질 하락이 없음을 보인다.