• 제목/요약/키워드: 합성성과지표

검색결과 14건 처리시간 0.022초

RawNet3를 통해 추출한 화자 특성 기반 원샷 다화자 음성합성 시스템 (One-shot multi-speaker text-to-speech using RawNet3 speaker representation)

  • 한소희;엄지섭;김회린
    • 말소리와 음성과학
    • /
    • 제16권1호
    • /
    • pp.67-76
    • /
    • 2024
  • 최근 음성합성(text-to-speech, TTS) 기술의 발전은 합성음의 음질을 크게 향상하였으며, 사람의 음성에 가까운 합성음을 생성할 수 있는 수준에 이르렀다. 특히, 다양한 음성 특성과 개인화된 음성을 제공하는 TTS 모델은 AI(artificial intelligence) 튜터, 광고, 비디오 더빙과 같은 분야에서 널리 활용되고 있다. 따라서 본 논문은 훈련 중 보지 않은 화자의 발화를 사용하여 음성을 합성함으로써 음향적 다양성을 보장하고 개인화된 음성을 제공하는 원샷 다화자 음성합성 시스템을 제안했다. 이 제안 모델은 FastSpeech2 음향 모델과 HiFi-GAN 보코더로 구성된 TTS 모델에 RawNet3 기반 화자 인코더를 결합한 구조이다. 화자 인코더는 목표 음성에서 화자의 음색이 담긴 임베딩을 추출하는 역할을 한다. 본 논문에서는 영어 원샷 다화자 음성합성 모델뿐만 아니라 한국어 원샷 다화자 음성합성 모델도 구현하였다. 제안한 모델로 합성한 음성의 자연성과 화자 유사도를 평가하기 위해 객관적인 평가 지표와 주관적인 평가 지표를 사용하였다. 주관적 평가에서, 제안한 한국어 원샷 다화자 음성합성 모델의 NMOS(naturalness mean opinion score)는 3.36점이고 SMOS(similarity MOS)는 3.16점이었다. 객관적 평가에서, 제안한 영어 원샷 다화자 음성합성 모델과 한국어 원샷 다화자 음성합성 모델의 P-MOS(prediction MOS)는 각각 2.54점과 3.74점이었다. 이러한 결과는 제안 모델이 화자 유사도와 자연성 두 측면 모두에서 비교 모델들보다 성능이 향상되었음을 의미한다.

5·18민주화운동이 지역경제에 미친 경제적 영향 분석: 통제집단합성법(SCM)을 이용한 접근 (The Economic Impact of the May 18 Democratic Uprising on the Regional Economy: A Synthetic Control Method (SCM) approach)

  • 류덕현;서동규
    • 분석과 대안
    • /
    • 제6권2호
    • /
    • pp.155-183
    • /
    • 2022
  • 본 연구는 통제집단 합성법(Synthetic Control Method, SCM)을 사용해 518민주화운동이 광주/전남지역에 미친 부정적 충격을 계량경제학적으로 분석하는 것을 목적으로 하고 있다. 통제집단 합성법은 미시계량경제학의 이중차분법과 유사한 방법론으로 국가, 지역 등의 거시집계변수들에 적용하여 특정 사건의 인과관계 규명을 위해 처치집단과 통제집단의 사건 이후의 성과차이를 계량하는 데이터 중심 추계 방법론이다. 본 연구에서는 1980년 기준 광역 지방자치 단체의 지방세수 자료를 지역의 경제력에 대한 대리변수로 하고 여러 사회 경제적 지표를 통해 518민주화운동이 광주/전남 지역의 경제에 미친 영향을 분석했다. 본 연구에서는 1971년부터 2000년까지 자료를 사용하여 분석하였는데 실증 분석 결과 1980년을 기준으로 최대 17%까지 광주/전남 지역의 지방세수가 정상 경로와 비교하면 덜 걷혔다고 분석할 수 있었다. 또한 통제집단 합성법의 강건성 분석 방법인 시점이동 위약효과 분석과 공간이동 위약효과 분석을 통해서도 이러한 분석의 유의함을 확인할 수 있었다.

장기간 레이더 반사도를 활용한 Bayesian 추론 기반의 레이더 반사도-강수량 관계식 불확실성 평가 (Uncertainty Assessment of Radar Reflectivity-Rainfall Relationship based on Bayesian Perspective using Long-term Radar Reflectivity)

  • 김태정;김호준;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.61-61
    • /
    • 2020
  • 최근 수문기상학 분야에서 레이더 강수량을 활용한 응용연구가 활발하게 진행되고 있다. 하지만 레이더 강수량은 대류성 및 층상형 등과 같이 강수특성을 기준으로 레이더 반사도-강수량(Reflectivity-Rainfall, Z-R) 관계식 매개변수를 시공간적으로 동일하게 적용하여 레이더 강수량을 산정하는 방법론은 지상관측 강수량과 정량적인 편의 오차(systematic error)를 발생시킬 수 있는 문제점이 있다. 본 연구는 장기간의 레이더 합성장 반사도를 활용하여 Z-R 관계식 매개변수를 산정하였으며, 이 과정에서 Bayesian 추론 기법을 도입하여 Z-R 관계식 매개변수의 불확실성을 정량화하였다. 추가적으로 편의 오차를 최소화하기 위하여 계절성을 고려한 Z-R 관계식을 산정하였다. 건기와 우기로 구분하여 산정된 Z-R 관계식 매개변수의 공간적으로 변동성과 더불어 강수의 계절적 특성에 기인하는 Z-R 관계식 매개변수의 역비례 관계를 확인하였다. 최종적으로, 제안된 방법론으로 산정된 레이더 강수장은 일반적으로 레이더 강수량 산정에 널리 이용되는 Marshall-Palmer Z-R 관계식으로 산정된 강수장에 비하여 우수한 통계지표를 제시하였다.

  • PDF

시분할 FPGA 합성에서 마이크로 레지스터 개수에 대한 하한 추정 기법 (A Lower Bound Estimation on the Number of Micro-Registers in Time-Multiplexed FPGA Synthesis)

  • 엄성용
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권9호
    • /
    • pp.512-522
    • /
    • 2003
  • 시분할 FPGA는 회로가 동작하는 중 회로의 기능을 재구성할 수 있는 동적 재구성 기능을 갖춘 FPGA 칩이다. 따라서 이러한 칩을 위한 회로 합성 기법에서는 주어진 논리 회로를 각각 다른 시간대에 수행할 여러 개의 부분회로로 분할한 후, 동일한 하드웨어 회로를 시간차를 두고 공유하도록 해야 한다. 기존의 연구에서는, 칩의 제한된 용량 문제를 해결하기 위해, 동일 시간대에 필요한 자원으로서 각 세부 함수를 수행하는 LUT(Look-Up Table)의 개수와 LUT의 출력 결과를 다른 시간대에 사용하기 위해 그 결과를 임시 저장하는데 필요한 마이크로 레지스터(micro register)의 개수를 최소화하는 데 중점을 두고 있다. 본 논문에서는 시분할 FPGA 합성용 도구 중의 하나로서 회로 구현에 필요한 메모리 원소, 즉 마이크로 레지스터의 개수에 대한 하한(lower bound)을 추정하는 기법에 대해 설명한다. 이 방법에서는 입력되는 논리 회로를 직접 합성하지 않고서도 그 회로가 필요로 하는 전체 마이크로 레지스터 개수에 대한 하한을 각각 추정함으로써 특정한 합성 기법에 관계없이 회로 구현에 필요한 최소한의 마이크로 레지스터의 개수에 대한 정보를 추출한다. 만일, 기존의 합성 결과가 본 연구에서 추정된 하한과 일치할 경우, 그 결과는 최적의 결과를 의미한다. 반면에, 하한과의 차이가 있는 경우에는 기존의 연구 결과에 비해 더 좋은 합성 결과가 존재하거나, 또는 본 연구에서 추정한 하한보다 더 좋은(큰, 정확한) 하한이 실제 존재함을 의미한다. 따라서 이러한 비교 분석을 통해, 기존 연구는 물론, 향후에 개발할 새로운 합성 방법의 결과가 최적인지, 또는 개선의 여지가 있는지를 판단하는 좋은 지표를 얻을 수 있다. 실험 결과, 추정된 하한은 기존 연구의 합성 결과와 다소 차이가 있었다. 이러한 차이는 우선, 기존의 합성 결과는 LUT 개수를 적절히 유지하는 가운데 마이크로 레지스터를 최소화한 결과인 반면, 본 하한 추정에서는 합성 가능한 모든 결과 중, LUT 개수와는 전혀 무관하게, 마이크로 레지스터 개수를 최대한 작게 사용할 합성 예를 추정하기 때문이라고 판단된다. 또 한편으로는 마이크로 레지스터 개수에 대한 하한 추정 문제 자체가 갖는 거대한 변동성과 복잡성으로 인해 제안한 추정 기법이 정밀도에 한계를 가지는 것으로 해석할 수 있으며, 다른 한편으로는 기존 연구 결과보다 더 좋은 합성 결과가 존재할 가능성이 높음을 의미하는 것으로 해석될 수 있다.

전기자동차의 경고음에 대한 인지성 평가 (Detectability Evaluation for Alert Sound in an Electric Vehicle)

  • 한만욱;이상권
    • 대한기계학회논문집A
    • /
    • 제41권10호
    • /
    • pp.923-929
    • /
    • 2017
  • 모터로 구동되는 전기자동차에서 발생하는 소리의 특징은 일반적으로 내연기관 자동차보다 음압이 낮아, 보행자에게 접근하는 차량을 인지 못하는 경우가 종종 발생한다. 따라서 전기자동차에 추가적인 경고음이 필요하다. 잘 들리는 경고음을 개발하기 위해, 이번 연구에서는 화성학 이론과 신호처리를 기초로 제작하였다. 도로에서 측정된 배경소음은 합성된 신호에 추가되었다. 주관적 평가로 이 경고음의 인지성을 측정하였다. 심리음향 이론과 주관적 평가를 통해 인지성과 관련된 요소를 조사하였다. 라우드니스, 샤프니스, 러프니스 등 알려져 있는 심리음향 지표는 인지성과 낮은 상관성을 가졌지만, 반대로 음의 지속구간에 높은 상관성이 있음을 발견하였다.

MODIS 식생지수에 미치는 센서 geometry의 영향과 센서 간 자료 호환성 검토 (Compatibility of MODIS Vegetation Indices and Their Sensitivity to Sensor Geometry)

  • 박선엽
    • 대한지리학회지
    • /
    • 제49권1호
    • /
    • pp.45-56
    • /
    • 2014
  • 지표의 식생활력도를 간접적으로 반영하는 위성 기반의 식생지수 자료를 연속적으로 확보하기 위해 자료합성법이 통상적으로 적용된다. 이는 자료합성을 통해 누락 자료나 신호 오류의 영향을 최소화함으로써 장기적인 식생지수 자료 구축이 가능해지기 때문이다. 또, 합성주기에 따라 두 개 이상의 위성 센서로부터 같은 시점에 생성된 식생지수 자료를 상호교호적으로 사용할 경우, 식생지수 자료 축적의 연속성과 안정성을 보다 더 강화할 수 있다. 본 연구는 식물생장 연구에 있어 위성시스템 간 자료 호환 가능성뿐만 아니라 MODIS 자료 취득 조건, 즉 태양과 센서의 천정각이 미치는 영향을 센서 geometry 측면에서 파악하여 장기적인 식생모니터링을 위한 자료 구축 개선에 기여하고자 한다. 연구 기간 중 센서천정각의 변화는 일정한 패턴을 보이지 않았고, 연도별로 불규칙한 등락을 나타냈다. 또, 동일 계절별로 분석한 결과에서도 계절에 따른 특징적 경년변화 패턴은 나타나지 않았다. 두 가지 분석 대상 자료인 NDVI와 EVI를 비교했을 때, EVI가 NDVI에 비해 더 안정된 결과를 보여주었고, 전반적으로 중위도 지역 식물생장의 계절적 특성을 전형적으로 보여주었다. 식생피복에 따른 NDVI-EVI 간 상관관계는 모두 유효한 결과를 얻었으나, 식생피복별로 상관도 차이를 보였고 상호간에 선형 관계가 아닌 상단부에서 수렴되는 곡선 관계를 보여주었다. Terra와 Aqua 위성에 의해 오전과 오후에 각각 관측된 식생지수를 비교한 결과, 상관계수 범위는 NDVI의 경우 0.641-0.880로, EVI의 경우 0.747-0.963으로 나타나, NDVI자료에 비해 EVI자료의 호환성이 높은 것으로 조사되었다. 두 센서 기반의 식생지수간 호환성 개선을 위해서는 두 자료 간의 회귀선으로부터 벗어나 있는 예외치에 대한 정밀한 분석이 과제로 남는다.

  • PDF

AI면접 대상자에 대한 다면적 평가방법론 -얼굴인식, 음성분석, 자연어처리 영역의 융합 (Multifaceted Evaluation Methodology for AI Interview Candidates - Integration of Facial Recognition, Voice Analysis, and Natural Language Processing)

  • 지현욱;이상진;문성민;이재열;이동은;임규상
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.55-58
    • /
    • 2024
  • 최근 각 기업의 AI 면접시스템 도입이 증가하고 있으며, AI 면접에 대한 실효성 논란 또한 많은 상황이다. 본 논문에서는 AI 면접 과정에서 지원자를 평가하는 방식을 시각, 음성, 자연어처리 3영역에서 구현함으로써, 면접 지원자를 다방면으로 분석 방법론의 적절성에 대해 평가하고자 한다. 첫째, 시각적 측면에서, 면접 지원자의 감정을 인식하기 위해, 합성곱 신경망(CNN) 기법을 활용해, 지원자 얼굴에서 6가지 감정을 인식했으며, 지원자가 카메라를 응시하고 있는지를 시계열로 도출하였다. 이를 통해 지원자가 면접에 임하는 태도와 특히 얼굴에서 드러나는 감정을 분석하는 데 주력했다. 둘째, 시각적 효과만으로 면접자의 태도를 파악하는 데 한계가 있기 때문에, 지원자 음성을 주파수로 환산해 특성을 추출하고, Bidirectional LSTM을 활용해 훈련해 지원자 음성에 따른 6가지 감정을 추출했다. 셋째, 지원자의 발언 내용과 관련해 맥락적 의미를 파악해 지원자의 상태를 파악하기 위해, 음성을 STT(Speech-to-Text) 기법을 이용하여 텍스트로 변환하고, 사용 단어의 빈도를 분석하여 지원자의 언어 습관을 파악했다. 이와 함께, 지원자의 발언 내용에 대한 감정 분석을 위해 KoBERT 모델을 적용했으며, 지원자의 성격, 태도, 직무에 대한 이해도를 파악하기 위해 객관적인 평가지표를 제작하여 적용했다. 논문의 분석 결과 AI 면접의 다면적 평가시스템의 적절성과 관련해, 시각화 부분에서는 상당 부분 정확도가 객관적으로 입증되었다고 판단된다. 음성에서 감정분석 분야는 면접자가 제한된 시간에 모든 유형의 감정을 드러내지 않고, 또 유사한 톤의 말이 진행되다 보니 특정 감정을 나타내는 주파수가 다소 집중되는 현상이 나타났다. 마지막으로 자연어처리 영역은 면접자의 발언에서 나오는 말투, 특정 단어의 빈도수를 넘어, 전체적인 맥락과 느낌을 이해할 수 있는 자연어처리 분석모델의 필요성이 더욱 커졌음을 판단했다.

  • PDF

NH4+Y-zeolite의 개질을 통한 벤젠 흡·탈착 성능 증진 연구 (A Study on the Modification of NH4+Y-zeolite for Improving Adsorption/Desorption Performance of Benzene)

  • 장영희;노영일;이상문;김성수
    • 청정기술
    • /
    • 제25권1호
    • /
    • pp.33-39
    • /
    • 2019
  • 활성탄(activated carbon, A.C)은 휘발성 유기화합물(volatile organic compounds, VOCs) 제거를 위해 가장 많이 사용되고 있지만 흡/탈착 시 열화현상으로 인한 화재위험성, 잦은 교체 주기로 인한 비용 부담, 수분에 의한 성능 저하 등의 문제점을 가지고 있다. 이러한 문제들을 해결하기 위하여 소수성 제올라이트 흡착제가 연구되고 있다. 본 연구에서는 소수성 개질법 중 하나인 수증기처리 및 산 처리를 통해 $NH_4{^+}Y$-zeolite를 소수성 Y-zeolite로 합성하여 높은 표면적, 열적 안정성과 습도저항성을 확보하고자 하였다. Y-zeolite와 개질된 Y-550-HN, Y-600-HN, Y-650-HN의 흡착성능은 23, 38, 77, $61mg\;g^{-1}$으로 나타났으며, 소수성 개질 정도를 확인할 수 있는 지표인 Si/Al ratio 변화를 XRF 분석으로 확인하였다. 그 결과, Y-zeolite를 개질하였을 때 흡착성능이 증진되었고, Si/Al 비는 Y, Y-550-HN, Y-600-HN, Y-650-HN 순으로 각각 3.1765, 6.6706, 7.3079, 7.4635 임을 확인하였다. 반면에 높은 열처리 온도에 의한 구조적 결정화가 성능 저하에 영향을 미칠 수 있음을 확인하였다. 반면에 Y-zeolite의 최적 열처리 온도가 존재하며, 이와 같은 최적 개질 조건 연구는 높은 내구성과 안정성을 갖는 흡착제를 제조할 수 있는 조건으로써 향후 활성탄을 대체할 수 있을 것으로 판단하였다.

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.

소의 생리적 특성에따름 세포내 텔로미어 함량과 텔로머레이스 활성도 분석 (The Amount of Telomeric DNA and Telomerase Activity on Cattle Cells)

  • 최덕순;조창연;손시환
    • Journal of Animal Science and Technology
    • /
    • 제50권4호
    • /
    • pp.445-456
    • /
    • 2008
  • 텔로미어란 염색체 말단부에 TTAGGG의 반복 염기서열과 특정 단백질로 구성되어 있는 것으로 핵 내 염색체의 안정성에 작용을 하며 세포의 노화, 사멸 및 암의 발생과 관련이 있다. 텔로머레이스는 텔로미어의 길이를 일정하게 유지하기 위한 직접적 효소로서 telomeric DNA 합성에 관여하는 ribonucleoprotein이다. 본 연구에서는 한우와 Holstein종 136두를 대상으로 백혈구 세포를 이용하여 연령 별, 품종 별, 성 별 텔로미어 함량을 분석하였다. 또한 동일 연령에서 혈액, 간, 뇌, 심장, 신장 및 생식선 조직들의 텔로미어 함량과 텔로머레이스 활성도도 비교 분석하였다. Telomeric DNA의 양적분석은 양적형광접합보인법(Q-FISH)을 이용하였고, 텔로머레이스 활성도의 분석은 TRAP방법을 이용하였다. 분석 결과, 소의 백혈구 세포들에 있어 개체의 연령이 증가함에 따라 텔로미어의 함유율이 점진적이며 유의적으로 감소되는 양상을 보였고, 한우가 Holstein에 비해 텔로미어 함유율이 높게 나타나 품종 간 유의적 차이가 있었으며, 성 간에도 수컷이 암컷에 비해 유의적으로 높은 텔로미어 함유율을 나타내었다. 반면 동일 연령의 간, 심장, 신장, 폐, 혈액 세포내 텔로미어의 함유율은 차이가 없는 것으로 나타났다. 텔로머레이스 활성도는 태아의 모든 조직에서 비교적 강한 활성을 보였지만, 성 성숙이 된 18개월령에서는 생식선 조직을 제외한 나머지 조직에서 텔로머레이스 활성도는 현저하게 떨어져 조직별 세포의 증식성 특이성과 텔로머레이스 활성도간에는 밀접한 연관성이 있는 것으로 나타났다. 이상의 결과로서 세포내 텔로미어 양적 분포 양상 및 텔로머레이스 활성도를 이용하여 개체의 연령 지표 또는 생리적 표지의 개발 가능성을 제시하고 자 한다.