• 제목/요약/키워드: VAE

검색결과 72건 처리시간 0.025초

벡터 양자화 변분 오토인코더 기반의 폴리 음향 생성 모델을 위한 잔여 벡터 양자화 적용 연구 (A study on the application of residual vector quantization for vector quantized-variational autoencoder-based foley sound generation model)

  • 이석진
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.243-252
    • /
    • 2024
  • 최근에 연구되기 시작한 폴리(Foley) 음향 생성 모델 중 벡터 양자화 변분 오토인코더(Vector Quantized-Variational AutoEncoder, VQ-VAE) 구조와 Pixelsnail 등 생성모델을 활용한 생성 기법은 중요한 연구대상 중 하나이다. 한편, 딥러닝 기반의 음향 신호의 압축/복원 분야에서는 기존의 VQ-VAE 구조에 비해 잔여 벡터 양자화 기술이 더 적합한 것으로 보고되고 있으며, 따라서 본 논문에서는 폴리 음향 생성 분야에서도 잔여 벡터 양자화 기술이 효과적으로 적용될 수 있을지 연구하고자 한다. 이를 위하여 본 논문에서는 기존의 VQ-VAE 기반의 폴리 음향 생성 모델에 잔여 벡터 양자화 기술을 적용하되, Pixelsnail 등 기존의 다른 모델과 호환이 가능하고 연산 자원의 소모를 늘리지 않는 모델을 고안하여 그 효과를 확인하고자 하였다. 효과를 검증하기 위하여 DCASE2023 Task7의 데이터를 활용하여 실험을 진행하였으며, 그 결과 평균적으로 0.3 가량의 Fréchet audio distance 의 향상을 보이는 것을 확인하였다. 다만 그 성능 향상의 정도가 제한적이었으며, 이는 연산 자원의 소모를 유지하기 위하여 시간-주파수축의 분해능이 저하된 영향으로 판단된다.

장애인 거주시설 평면변경 안에 대한 유효성 검증에 관한 연구 - 심층인터뷰와 VAE기법을 통한 분석 - (Validation Studies on Plans of Refurbished Disabled Homes with VAE Analysis and Interview Investigation)

  • 손동화;김경원;최재필
    • 한국주거학회논문집
    • /
    • 제28권2호
    • /
    • pp.13-21
    • /
    • 2017
  • A well designed disabled home needs to consider various design principles and variables. It should consider not only physical accessibility but also psychological aspects. Previous research studies have shown that barrier-free/universal designs which were primarily focused on physical access and usage of facilities and building operations. This research paper will examine, a selection of refurbished disabled homes, introduced by the Korean Disabled People's Development Institutes in 2013. The plan samples are to be analyzed using the Visual Access and Exposure spatial analysis program coupled with supporting information extracted from consultations and feedback from experienced professional disabled home staff members. This research paper aims to propose the usage and viability of VAE Analysis in the design and planning of disabled home layouts. The purpose of this study is to specify the differences in visual spatial relationships between the plans before and after refurbishment in accordance to staff and user requirements. This will ensure a bettered environment for the users and ensuring an optimized of spatial programming and building operation and usage.

Bi-LSTM VAE 기반 차량 CAN 침입 탐지 시스템 (Bi-LSTM VAE based Intrusion Detection System for In-Vehicle CAN)

  • 김용수;강효은;김호원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.531-534
    • /
    • 2022
  • 승차 공유, 카풀, 렌터카의 이용률이 증가하면서 많은 사용자가 동일한 차량에 로컬 액세스 할 수 있는 시나리오가 더욱 보편화됨에 따라 차량 네트워크에 대한 공격 가능성이 커지고 있다. 차량용 CAN Bus Network에 대한 DoS(Denial of Service), Fuzzy Attack 및 Replay Attack과 같은 공격은 일부 ECU(Electronic Controller Unit) 비활성 및 작동 불능 상태를 유발한다. 에어백, 제동 시스템과 같은 필수 시스템이 작동 불가 상태가 되어 운전자에게 치명적인 결과를 초래할 수 있다. 차량 네트워크 침입 탐지를 위하여 많은 연구가 진행되고 있으나, 기존 화이트리스트를 이용한 탐지 방법은 새로운 유형의 공격이 발생하거나 희소성이 높은 공격일 때 탐지하기 어렵다. 본 논문에서는 인공신경망 기반의 CAN 버스 네트워크 침입 탐지 기법을 제안한다. 제안하는 침입 탐지 기법은 2단계로 나누어 진다. 1단계에서 정상 패킷 분포를 학습한 VAE 모형이 이상 탐지를 수행한다. 이상 패킷으로 판정될 경우, 2단계에서 인코더로부터 추출된 잠재변수와 VAE의 재구성 오차를 이용하여 공격 유형을 분류한다. 분류 결과의 신뢰점수(Confidence score)가 임계치보다 낮을 경우 학습하지 않은 공격으로 판단한다. 본 연구 결과물은 정보보호 연구·개발 데이터 첼린지 2019 대회의 차량 이상징후 탐지 트랙에서 제공하는 정상 및 3종의 차량 공격시도 패킷 데이터를 대상으로 성능을 평가하였다. 실험을 통해 자동차 제조사의 규칙이나 정책을 사전에 정의하지 않더라도 낮은 오탐율로 비정상 패킷을 탐지해 낼 수 있음을 확인할 수 있다.

VAE를 이용한 의미적 연결 관계 기반 다중 문서 요약 기법 (Multi-Document Summarization Method Based on Semantic Relationship using VAE)

  • 백수진
    • 디지털융복합연구
    • /
    • 제15권12호
    • /
    • pp.341-347
    • /
    • 2017
  • 많은 양의 문서 데이터가 증가됨에 따라 사용자는 해당 문서를 이해하기 위한 요약된 정보를 필요로 한다. 그러나, 기존 문서 요약 연구 방법들은 지나치게 단순한 통계에 의존함으로써 문장의 모호성 및 의미 있는 문장 생성을 위한 다중 문서 요약 연구가 미흡한 실정이다. 본 논문에서는 의미적 연결 관계에 대한 파악 및 불필요한 정보를 처리하기 위한 전처리 과정을 거치며, 어휘 의미 패턴 정보를 기반으로 VAE를 이용하여 문장 간의 의미적 연결성을 높인 다중 문서 요약 기법을 제안하였다. 문장을 이루고 있는 단어 벡터들을 이용하여, 잠재된 변수로 생성된 압축된 정보와 속성 판별기로부터 학습을 한 후 문장을 재구성함으로써 의미적 연결 처리가 자연스러운 요약문을 생성하였다. 제안된 방법과 다른 문서 요약 방법을 비교했을 시 미세하지만 더 향상된 성능을 나타냈으며, 이는 의미적 문장 생성 및 연결성을 높일 수 있음을 증명하였다. 앞으로, 다양한 속성 설정 값을 가지고 실험하여 의미적 연결 관계를 확장할 수 있는 방법을 연구하고자 한다.

변분 오토인코더와 비교사 데이터 증강을 이용한 음성인식기 준지도 학습 (Semi-supervised learning of speech recognizers based on variational autoencoder and unsupervised data augmentation)

  • 조현호;강병옥;권오욱
    • 한국음향학회지
    • /
    • 제40권6호
    • /
    • pp.578-586
    • /
    • 2021
  • 종단간 음성인식기의 성능향상을 위한 변분 오토인코더(Variational AutoEncoder, VAE) 및 비교사 데이터 증강(Unsupervised Data Augmentation, UDA) 기반의 준지도 학습 방법을 제안한다. 제안된 방법에서는 먼저 원래의 음성데이터를 이용하여 VAE 기반 증강모델과 베이스라인 종단간 음성인식기를 학습한다. 그 다음, 학습된 증강모델로부터 증강된 데이터를 이용하여 베이스라인 종단간 음성인식기를 다시 학습한다. 마지막으로, 학습된 증강모델 및 종단간 음성인식기를 비교사 데이터 증강 기반의 준지도 학습 방법으로 다시 학습한다. 컴퓨터 모의실험 결과, 증강모델은 기존의 종단간 음성인식기의 단어오류율(Word Error Rate, WER)을 개선하였으며, 비교사 데이터 증강학습방법과 결합함으로써 성능을 더욱 개선하였다.

VAE계 분말을 혼입한 고강도 폴리머 시멘트 모르타르의 강도 특성 (Strength Properties of High-Strength Polymer Cement Mortars Containing VAE Powder)

  • 최중구;이건철;이건영
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2014년도 추계 학술논문 발표대회
    • /
    • pp.19-20
    • /
    • 2014
  • This study is to find out the tensile strength and bonding strength of VAE powder as a preliminary study for the application of the powder to the high strength concrete. The result of the study showed that the compressive strength decreases when more polymers is put into the concrete. On the other hand, it showed that the tensile strength and the bonding strength get improved when the more polymers are put into the concrete. Especially in case of the mixture for high strength concrete, it was found out that more strength is produced than the ordinary concrete.

  • PDF

Comparative Analysis of Anomaly Detection Models using AE and Suggestion of Criteria for Determining Outliers

  • Kang, Gun-Ha;Sohn, Jung-Mo;Sim, Gun-Wu
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권8호
    • /
    • pp.23-30
    • /
    • 2021
  • 본 연구에선 제조 공정에서의 양/불량 판정을 위한 오토인코더(AE) 기반의 이상 탐지 방법들의 비교 분석과 우수한 성능을 보인 이상치 판별 기준을 제시한다. 제조 현장의 특성상 불량 데이터의 수는 적고, 불량의 형태가 다양하다. 이러한 특성은 정상과 비정상 데이터를 모두 활용하는 인공지능 기반 양/불량 판정 모델의 성능을 저하시키고, 성능 향상을 위한 비정상 데이터의 추가 확보에 시간과 비용을 발생시킨다. 이러한 문제를 해결하기 위해서 정상 데이터만을 이용해 이상 탐지를 수행하는 AE, VAE 등 AE 기반의 모델에 관한 연구들이 진행되고 있다. 본 연구에서는 Convolutional AE, VAE, Dilated VAE 모델을 기반으로 잔차 이미지에 대한 통계치와 MSE, 정보 엔트로피를 이상치 판별 기준으로 선정하여 각 모델의 성능을 비교 분석했다. 특히 Convolutional AE 모델에 대해서 범위 값을 적용했을 때, AUC PRC 0.9570, F1 Score 0.8812, AUC ROC 0.9548, 정확도 87.60%의 가장 우수한 성능을 보였다. 이는 기존의 이상치 판별 기준으로 자주 사용되었던 MSE에 비해 정확도 기준 약 20%P(Percentage Point)의 성능 향상을 보이며, 이상치 판별 기준에 따른 모델 성능 향상이 가능함을 확인하였다.

Poly(vinyl alcohol)을 이용한 Poly(vinyl acetate-co-ethylene) Emulsion 중합에 대한 연구 (Study on the Emulsion Polymerization of poly(vinyl acetate-co-ethylene) Using Poly(vinyl alcohol) as Emulsifier)

  • 최용해;이원기
    • 접착 및 계면
    • /
    • 제11권3호
    • /
    • pp.89-99
    • /
    • 2010
  • 본 논문에서는 poly(vinyl acetate-co-ethylene)을 산화, 환원 방법으로 중합할 때 poly(vinyl alcohol) (PVOH)이 최종 에멀젼의 물성에 미치는 영향과 pH의 변화가 최종 에멀젼의 물성에 미치는 영향에 대하여 알아보았다. 실험 결과 PVOH의 분자량이 에멀젼 성질에 크게 영향을 미쳤다. 분자량이 낮은 PVOH 이용 시는 점도가 낮은 제품을 얻었고, 분자량이 큰 PVOH를 이용 시는 높은 점도의 제품을 얻었다. 그러나 pH를 변화 시키면서 중합한 제품의 최종 성질은 PVOH에 대하여 다른 결과를 얻었다. 일반적으로 중합도가 높고 부분 검화물의 PVOH를 이용한 poly(vinyl acetate) 에멀젼 최종점도는 상대적으로 매우 높은 점도를 유지하는 데 비하여, VAE 에멀젼에서는 높은 pH에서 합성 시에는 낮은 에멀젼의 점도를 얻었다. 이것은 에멀젼 합성 중에 PVOH의 분자량의 저하에 의한 영향으로 판단된다. pH가 증가 할수록 그라프트율이 감소하고, 분자량이 감소하면서 점도가 낮아진다는 결과를 얻었다.

LSTM-VAE를 활용한 기계시설물 장치의 이상 탐지 시스템 (Anomaly Detection System in Mechanical Facility Equipment: Using Long Short-Term Memory Variational Autoencoder)

  • 서재홍;박준성;유준우;박희준
    • 품질경영학회지
    • /
    • 제49권4호
    • /
    • pp.581-594
    • /
    • 2021
  • Purpose: The purpose of this study is to compare machine learning models for anomaly detection of mechanical facility equipment and suggest an anomaly detection system for mechanical facility equipment in subway stations. It helps to predict failures and plan the maintenance of facility. Ultimately it aims to improve the quality of facility equipment. Methods: The data collected from Daejeon Metropolitan Rapid Transit Corporation was used in this experiment. The experiment was performed using Python, Scikit-learn, tensorflow 2.0 for preprocessing and machine learning. Also it was conducted in two failure states of the equipment. We compared and analyzed five unsupervised machine learning models focused on model Long Short-Term Memory Variational Autoencoder(LSTM-VAE). Results: In both experiments, change in vibration and current data was observed when there is a defect. When the rotating body failure was happened, the magnitude of vibration has increased but current has decreased. In situation of axis alignment failure, both of vibration and current have increased. In addition, model LSTM-VAE showed superior accuracy than the other four base-line models. Conclusion: According to the results, model LSTM-VAE showed outstanding performance with more than 97% of accuracy in the experiments. Thus, the quality of mechanical facility equipment will be improved if the proposed anomaly detection system is established with this model used.

시지각 기반의 공간분석이론에 따른 관람동선 비교 연구 (A Comparative Study on the Museum Visitor Circulation with Spatial Analysis Theory base on Visual Perception)

  • 정수영;임채진;윤성규
    • 한국실내디자인학회논문집
    • /
    • 제20권3호
    • /
    • pp.198-205
    • /
    • 2011
  • The study on how visitors of a museum view exhibition is necessary for providing quality experience to the visitors. Previous studies on the movement of visitors of a museum focused on qualitative analysis after the follow-up survey. Therefore, the purpose of this study is to find out various ways to use quantitative analysis methods on the movement of visitors in the museum. Quantitative analysis of the exhibition place and movement of visitors was conducted using programs to produce quantitative results from the space analysis including VAE, VGA, V-ERAM and ESA. VAE and VGA helped to understand the spatial structure and ESA was helpful to predict how the flow of human traffic would be in the museum. If the programs are used all together, it would be easier to quantitatively predict how the How of human traffic would be in an exhibition room. However, this study is in its infancy, so following studies are necessary based on more data and results of analysis in the future.