• 제목/요약/키워드: regularization method

검색결과 303건 처리시간 0.026초

딥러닝 기반 가창 음성합성(Singing Voice Synthesis) 모델링 (Deep Learning based Singing Voice Synthesis Modeling)

  • 김민애;김소민;박지현;허가빈;최윤정
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.127-130
    • /
    • 2022
  • 본 논문은 생성자 손실함수를 이용한 가창 음성합성 모델링에 대한 연구로서 기존 이미지 생성에 최적화된 딥러닝 알고리즘 중 BEGAN모델을 오디오 생성모델(SVS모델)에 적용시킬 때 발생할 수 있는 여러 요인에 대해 분석하고 최적의 품질을 도출하기 위한 실험을 수행하였다. 특히 BEGAN 기반 모델에서 제안된 L1 loss가 어느 시점에서 감마(𝛾)파라미터의 역할을 상실하게 한다는 점을 개선하고자 알파(𝛼)파라미터를 추가한 후 각 파라미터 값들의 구간별 실험을 통해 최적의 값을 찾아냄으로써 가창합성 생성물의 품질향상에 기여할 수 있음을 확인하였다.

  • PDF

NIST AI 위험 관리 프레임워크 적용: NTIS 데이터베이스 분석의 MAP, MEASURE, MANAGE 접근 사례 연구 (Applying NIST AI Risk Management Framework: Case Study on NTIS Database Analysis Using MAP, MEASURE, MANAGE Approaches)

  • 임정선;배성훈;권태훈
    • 산업경영시스템학회지
    • /
    • 제47권2호
    • /
    • pp.21-29
    • /
    • 2024
  • Fueled by international efforts towards AI standardization, including those by the European Commission, the United States, and international organizations, this study introduces a AI-driven framework for analyzing advancements in drone technology. Utilizing project data retrieved from the NTIS DB via the "drone" keyword, the framework employs a diverse toolkit of supervised learning methods (Keras MLP, XGboost, LightGBM, and CatBoost) enhanced by BERTopic (natural language analysis tool). This multifaceted approach ensures both comprehensive data quality evaluation and in-depth structural analysis of documents. Furthermore, a 6T-based classification method refines non-applicable data for year-on-year AI analysis, demonstrably improving accuracy as measured by accuracy metric. Utilizing AI's power, including GPT-4, this research unveils year-on-year trends in emerging keywords and employs them to generate detailed summaries, enabling efficient processing of large text datasets and offering an AI analysis system applicable to policy domains. Notably, this study not only advances methodologies aligned with AI Act standards but also lays the groundwork for responsible AI implementation through analysis of government research and development investments.

다중 차분 필터에 의한 IEEE 802.15.4b LR-WPAN 주파수 옵셋의 개선 (Improvement of IEEE 802.15.4b LR-WAPN Frequency Offset with Multiple Differential Filter)

  • 정차근;강성민
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.10-17
    • /
    • 2009
  • 본 논문에서는 915MHz 대역 IEEE 802.15.4b LR-WPAN(Low-Rate Wireless Personal Area Network) 비동기 DSSS O-QPSK 기반 수신 시스템의 주파수 옵셋 영향을 분석하고, 차분 필터를 추가 함으로써 주파수 옵셋을 보상할 수 있는 방법을 제시한다. IEEE 802.15.4b 915MHz 규격에서는 DSSS PSSS-ASK 변조방식과 DSSS O-QPSK 변조방식을 채용하여 250kbps의 전송율을 갖는 새로운 방식을 제시하고 있다. 본 논문에서 사용한 DSSS O-QPSK 변조방식은 40ppm(주파수 옵셋 36.6kHz)까지는 BER에 변화가 없으나, 그 이상의 주파수 옵셋이 발생하면 BER이 높아져 안정적인 수신이 어려운 문제가 있다. 이 문제를 해결하기 위해 DSSS O-QPSK 기반 수신기의 상관기에 MDDF(Multiple Delay Differential Filter)를 적용하여 ${\pm}80ppm$에서도 안정적인 수신이 가능함을 보인다. 제안 알고리즘의 성능을 검증하기 위해, 다양한 AWGN 및 주파수 옵셋 환경을 가정한 컴퓨터 모의실험의 결과를 제시하고, 그 유효성을 입증한다.

제약하의 예측조합 방법을 활용한 산업별 고용비중 예측 (Prediction of the employment ratio by industry using constrainted forecast combination)

  • 김정우
    • 한국융합학회논문지
    • /
    • 제11권11호
    • /
    • pp.257-267
    • /
    • 2020
  • 본 연구는 우리나라 수출 분야의 산업별 고용비중을 다양한 머신러닝 기법을 활용하여 예측하고, 예측성능을 높이기 위하여 머신러닝 기법 예측값들에 예측조합 기법을 적용하였다. 특히, 본 연구에서는 각 머신러닝 기법 예측값들에 부여되는 가중치의 합을 1로 설정하는 제약하의 예측조합 기법을 사용하여 예측의 정확성과 안정성을 확보하고자 하였다. 또한, 본 연구는 산업별 고용비중에 영향을 주는 다양한 변수를 고려하기 위하여 재귀적특성제거 방법을 사용하여 주요 변수를 선별한 후, 머신러닝 기법에 적용함으로써 예측과정 상에서의 효율성을 높였다. 분석결과, 예측조합 방법에 따른 예측값은 머신러닝 기법의 예측값들보다 실제의 산업 고용비중에 근접한 것으로 나타났으며, 머신러닝 기법의 예측값들이 큰 변동성을 보이는 것과 달리 제약하의 예측조합 기법은 안정적인 예측값을 나타내었다.

계층적 ZP-스플라인을 이용한 곡선 복구 기법 (Curve Reconstruction from Oriented Points Using Hierarchical ZP-Splines)

  • 김현준;김민호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제22권5호
    • /
    • pp.1-16
    • /
    • 2016
  • 본 논문에서는 최소자승법에 기반한 효율적인 곡선 복구 기법을 제안한다. 구체적으로는, 법선 벡터를 포함한 평면상의 샘플포인트가 주어졌을 때 계층적인 ZP(Zwart-Powell)-스플라인의 레벨로 곡선을 복구하는데, 세밀한 부문을 복구하면서도 비교적 큰 구멍도 효율적으로 메꾸고 있다. 정규화를 위해서는, (1) 선형시스템의 특이성을 피하기 위한 티코노프 정규항과 (2) 아이소커브를 부드럽게 하기 위한 이산 라플라스 정규항 두 가지를 사용하고 있다. 정량적인 벤치마크 테스트를 통해 비교한 결과, 본 방법은 다항식에 기반한 기법들에 비해 훨씬 우수한 결과를 보여준다는 것을 확인할 수 있다. 구멍이 있는 데이터의 경우, 계층적인 B-스플라인과 비교해본 결과 엇비슷한 품질을 보이지만 약 90%의 계산량만을 필요로 한다.

Joint Overlapped Block Motion Compensation Using Eight-Neighbor Block Motion Vectors for Frame Rate Up-Conversion

  • Li, Ran;Wu, Minghu;Gan, Zongliang;Cui, Ziguan;Zhu, Xiuchang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권10호
    • /
    • pp.2448-2463
    • /
    • 2013
  • The traditional block-based motion compensation methods in frame rate up-conversion (FRUC) only use a single uniquely motion vector field. However, there will always be some mistakes in the motion vector field whether the advanced motion estimation (ME) and motion vector analysis (MA) algorithms are performed or not. Once the motion vector field has many mistakes, the quality of the interpolated frame is severely affected. In order to solve the problem, this paper proposes a novel joint overlapped block motion compensation method (8J-OBMC) which adopts motion vectors of the interpolated block and its 8-neighbor blocks to jointly interpolate the target block. Since the smoothness of motion filed makes the motion vectors of 8-neighbor blocks around the interpolated block quite close to the true motion vector of the interpolated block, the proposed compensation algorithm has the better fault-tolerant capability than traditional ones. Besides, the annoying blocking artifacts can also be effectively suppressed by using overlapped blocks. Experimental results show that the proposed method is not only robust to motion vectors estimated wrongly, but also can to reduce blocking artifacts in comparison with existing popular compensation methods.

조리개 마스크 휠을 이용한 정칙화 기반 초해상도 디모자이킹 (Regularization-based Superresolution Demosaicing using Aperture Mask Wheels)

  • 신정호
    • 방송공학회논문지
    • /
    • 제23권1호
    • /
    • pp.146-153
    • /
    • 2018
  • 본 논문에서는 베이어 영역에서의 저해상도 영상을 고해상도 컬러 영상으로 복원하기 위한 초해상도 디모자이킹 기술을 제안한다. 제안한 방법은 조리개 마스크 휠의 다양한 형태의 조리개 마스크로 초점 열화가 발생되기 때문에 취득한 저해상도 영상들은 서로 다른 방향의 초점열화를 가지며 부화소 단위의 영상 정합이 필요하지 않고 단지 조리개 마스크 형태에 해당하는 초점열화만 추정하면 초해상도 영상복원 방법을 적용할 수 있다. 제안한 시스템은 기존의 카메라 렌즈 시스템에 조리개 마스크 휠을 추가함으로써 새로운 형태의 렌즈 시스템을 제작할 필요 없이 초해상도 영상을 복원할 수 있는 카메라 시스템으로 확장 가능하다. 마지막으로 본 논문에서 제안한 조리개 마스크를 이용한 사용한 초해상도 디모자이킹 기술의 성능을 검증하기 위해서 기존의 초해상도 영상복원과 디모자이킹 기술과 비교하였으며, 그 결과 공간 및 컬러 해상도가 상당히 개선되었음을 보였다.

Using Bayesian Approaches to Reduce Truncation Artifact in Magnetic Resonance Imaging

  • 이수진
    • 대한의용생체공학회:의공학회지
    • /
    • 제19권6호
    • /
    • pp.585-593
    • /
    • 1998
  • 퓨리에 자기공명영상 기법의 경우 촬영시간 단축 및 적절한 신호대잡음비 유지를 위해 phase-encoded 신호의 개수를 감소시키는 경우가 종종 있다. 그러나, 이는 재구성된 영상에 번짐과 물결무늬 형태의 truncation artifact를 초래한다. 본 논문에서는 이러한 truncation artifact를 감소시키기 위해 Bayesian 방법에 근거한 새로운 정칙화기법을 제안한다. Truncation artifact는 phase 방향으로만 형성되므로 종전의 상호 대칭형태의 주변화소를 고려한 piecewise smoothness 사전정보를 사용할 경우 read 방향으로의 미세한 영상정보가 유실되기 쉽다. 따라서, 본 연구에서는 종전의 단순대칭형 보다 개선된 형태로서 자기공명영상의 공간정보를 포착할 수 있는 정교한 사전정보의 형태를 제안한다. 본 연구진의 실험결과 새롭게 제안된 방법으로 적용할 경우 truncation artifact가 감소될 뿐 아니라 종전의 미세정보유실 현상이 감소됨으로써 tissue regularity와 경계가 한층 더 향상됨을 확인할 수 있었다.

  • PDF

시간영역 Gauss-Newton 전체파형 역해석 기법의 성능평가 (Performance Evaluation of a Time-domain Gauss-Newton Full-waveform Inversion Method)

  • 강준원
    • 한국전산구조공학회논문집
    • /
    • 제26권4호
    • /
    • pp.223-231
    • /
    • 2013
  • 본 논문에서는 물성이 균일하지 않은 반무한 고체영역의 탄성파속도 분포를 재구성하기 위한 시간영역 Gauss-Newton 전체파형 역해석 기법을 소개한다. 반무한 영역을 유한 계산영역으로 치환하기 위하여 유한영역의 경계에 수치적 파동흡수 경계조건인 perfectly-matched-layers(PMLs)를 도입하였다. 이 역해석 문제는 PML을 경계로 하는 영역에서의 탄성파동방정식을 구속조건으로 하는 최적화 문제로 성립되며, 표면에서 측정된 변위응답과 혼합유한요소법에 의해 계산된 응답간의 차이를 최소화함으로써 미지의 탄성파속도 분포를 결정한다. 이 과정에서 Gauss-Newton-Krylov 최적화 알고리즘과 정규화기법을 사용하여 탄성파속도의 분포를 반복적으로 업데이트하였다. 1차원 수치예제들을 통해 Gauss-Newton 역해석으로 부터 재구성된 탄성파속도의 분포가 목표값에 충분히 근사함을 보였으며, Fletcher Reeves 최적화 알고리즘을 사용한 기존의 역해석 결과에 비해 수렴율이 현저히 개선되고 계산 소요시간이 단축됨을 확인할 수 있었다.

음향광학 단층촬영(Acousto-Optical Tomography)의 수학적 모델과 수치해석적 시뮬레이션 (Mathematical Model for Acousto-Optical Tomography and Its Numerical Simulation)

  • 남혜원;허장용;김소영;이레나
    • 한국의학물리학회지:의학물리
    • /
    • 제23권1호
    • /
    • pp.42-47
    • /
    • 2012
  • 본 연구는 최근 의공학 분야에서 중요한 영역으로 대두되고 있는 광학과 초음파의 장점을 결합한 영상 방법인 AOT (Acousto-Optical Tomography)의 수학적 모델을 제시하였다. AOT는 광학 필드를 초음파 기둥에서 변화 시켜서 초음파 기둥의 위치 정보를 이용하여 영상을 재구성하는 방법이다. AOT의 수학적 모델은 두 단계로 나뉠 수 있다. 첫 번째 단계에서는 광학 필드의 복원을 하고, 두 번째 단계에서는 획득한 광학 필드를 기반으로 확산 방정식의 역문제를 풀어 흡수함수 ${\mu}$ (absorption coefficient)를 산출한다. 본 연구에서는 두 번째 단계에 해당하는 역문제의 해를 구하기 위하여 수치해석적인 최소화 문제로 변환하고, 수치적 팬텀을 이용하여 시뮬레이션 하였다. 전통적인 기울기 하강 방법을 이용하여 역 문제 시뮬레이션의 결과를 보였다. 전변동 정규화 기반의 최소화 문제를 제안하여 기울기 하강 방법의 결과에서 보인 번짐 효과를 개선하였다.