• Title/Summary/Keyword: 속도 기반 모델

Search Result 1,364, Processing Time 0.031 seconds

Comparing the effects of letter-based and syllable-based speaking rates on the pronunciation assessment of Korean speakers of English (철자 기반과 음절 기반 속도가 한국인 영어 학습자의 발음 평가에 미치는 영향 비교)

  • Hyunsong Chung
    • Phonetics and Speech Sciences
    • /
    • v.15 no.4
    • /
    • pp.1-10
    • /
    • 2023
  • This study investigated the relative effectiveness of letter-based versus syllable-based measures of speech rate and articulation rate in predicting the articulation score, prosody fluency, and rating sum using "English speech data of Koreans for education" from AI Hub. We extracted and analyzed 900 utterances from the training data, including three balanced age groups (13, 19, and 26 years old). The study built three models that best predicted the pronunciation assessment scores using linear mixed-effects regression and compared the predicted scores with the actual scores from the validation data (n=180). The correlation coefficients between them were also calculated. The findings revealed that syllable-based measures of speech and articulation rates were more effective than letter-based measures in all three pronunciation assessment categories. The correlation coefficients between the predicted and actual scores ranged from .65 to .68, indicating the models' good predictive power. However, it remains inconclusive whether speech rate or articulation rate is more effective.

Text-to-speech with linear spectrogram prediction for quality and speed improvement (음질 및 속도 향상을 위한 선형 스펙트로그램 활용 Text-to-speech)

  • Yoon, Hyebin
    • Phonetics and Speech Sciences
    • /
    • v.13 no.3
    • /
    • pp.71-78
    • /
    • 2021
  • Most neural-network-based speech synthesis models utilize neural vocoders to convert mel-scaled spectrograms into high-quality, human-like voices. However, neural vocoders combined with mel-scaled spectrogram prediction models demand considerable computer memory and time during the training phase and are subject to slow inference speeds in an environment where GPU is not used. This problem does not arise in linear spectrogram prediction models, as they do not use neural vocoders, but these models suffer from low voice quality. As a solution, this paper proposes a Tacotron 2 and Transformer-based linear spectrogram prediction model that produces high-quality speech and does not use neural vocoders. Experiments suggest that this model can serve as the foundation of a high-quality text-to-speech model with fast inference speed.

Deep Learning Model for Weather Forecast based on Knowledge Distillation using Numerical Simulation Model (수치 모델을 활용한 지식 증류 기반 기상 예측 딥러닝 모델)

  • 유선희;정은성
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.530-531
    • /
    • 2023
  • 딥러닝에서 지식 증류 기법은 큰 모델의 지식을 작은 모델로 전달하여 작은 모델의 성능을 개선하는 방식이다. 지식 증류 기법은 모델 경량화, 학습 속도 향상, 학습 정확도 향상 등에 활용될 수 있는데, 교사 모델이라 불리는 큰 모델은 일반적으로 학습된 딥러닝 모델을 사용한다. 본 연구에서는 학습된 딥러닝 모델 대신에 수치 기반 시뮬레이션 모델을 사용함으로써 어떠한 효과가 있는지 검증하였으며, 수치 모델을 활용한 기상 예측 모델에서의 지식 증류는 기존 단독 딥러닝 모델 학습 대비 더 작은 학습 횟수(epoch)에서도 동일한 에러 수준(RMSE)까지 도달하여, 학습 속도 측면에서 이득이 있음을 확인하였다.

Korean Question Generation using BERT-based Sequence-to-Sequence Model (BERT 기반 Sequence-to-Sequence 모델을 이용한 한국어 질문 생성)

  • Lee, Dong-Heon;Hwang, Hyeon-Seon;Lee, Chang-Gi
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.60-63
    • /
    • 2020
  • 기계 독해는 입력 받은 질문과 문단의 관계를 파악하여 알맞은 정답을 예측하는 자연어처리 태스크로 양질의 많은 데이터 셋을 필요로 한다. 기계 독해 학습 데이터 구축은 어려운 작업으로, 문서에서 등장하는 정답과 정답을 도출할 수 있는 질문을 수작업으로 만들어야 한다. 이러한 문제를 해결하기 위하여, 본 논문에서는 정답이 속한 문서로부터 질문을 자동으로 생성해주는 BERT 기반의 Sequence-to-sequence 모델을 이용한 한국어 질문 생성 모델을 제안한다. 또한 정답이 속한 문서와 질문의 언어가 같고 정답이 속한 문장의 주변 단어가 질문에 등장할 확률이 크다는 특성에 따라 BERT 기반의 Sequence-to-sequence 모델에 복사 메카니즘을 추가한다. 실험 결과, BERT + Transformer 디코더 모델의 성능이 기존 모델과 BERT + GRU 디코더 모델보다 좋았다.

  • PDF

Accuracy analysis of the Orbit-based Sensor Modeling with various GCP configurations (기준점 배치에 따른 궤도기반 센서모델의 정확도 분석)

  • Kim, Dong-Wook;Kim, Hyun-Suk;Kim, Tae-Jung
    • Proceedings of the KSRS Conference
    • /
    • 2008.03a
    • /
    • pp.207-212
    • /
    • 2008
  • 연구에서는 SPOT-3 인공위성 영상으로부터 얻어진 영상 스테레오 스트립과 GCP(Ground Control Point)자료를 이용하여 다양한 GCP배치에 따른 궤도기반 센서모델의 정확성에 대해 분석하였다. 실험에 사용된 기준점자료는 춘천지역에서부터 나주지역에 이르기 까지 약 420km 길이의 지역에 대해 GPS측량을 통해 획득하였다. 궤도기반 센서모델에 적용된 미지수는 위성의 위치와 속도, 자세를 표현하는 방정식의 계수를 미지수로 선택하여 일곱 가지 방식으로 조합하였다. 실험은 우선 모델점의 위치를 일곱 가지 경우로 결정하고 각 경우에 대해 일정한 개수의 모델점을 선택하였다. 그리고 각 경우의 모델점의 위치에 대해 궤도기반 센서모델의 미지수 조합 모델을 각 각 다르게 적용해 본 후 그 결과를 시각적, 수치적으로 분석해 보았다. 실험 결과 모델점의 위치에 관계 없이 궤도기반 모델에 적용할 수 있는 높은 정확도를 나타내는 미지수 조합모델을 찾아낼 수가 있었고, 여러 가지 모델점의 위치를 궤도기반 센서모델에 적용해 본 결과 지리적, 시간적, 경제적 효율성을 갖는 최적의 미지수 조합을 찾을 수가 있었다.

  • PDF

A Use of Expectation Maximization Clustering for Constructing a Markov Chain of Human Mobility Model (기대치 최대화 기반의 군집화를 통한 인간 이동 패턴의 마르코프 연쇄모델 도출)

  • Kim, Hyunuk;Song, Ha Yoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.864-867
    • /
    • 2012
  • 사람들이 휴대용 위치정보 수집 장비나 혹은 스마트폰을 사용하면서 사람의 이동 정보인 위치정보들을 모으는 일이 가능해 졌다. 이러한 위치정보들을 가지고 본 논문에서는 사람의 이동 모델을 나타내고자 하였다. 이동 정보들은 머물러 있는(Stay)상태와 이동하는(Moving) 상태로 나눌 수 있는데 이러한 상태 중 머물러 있는 상태가 군집화가 되어 연쇄 모델속의 하나의 상태(State)로 나타나 질 수 있다. 물론 이동 정보들을 통해 연쇄모델 속 각 상태간의 전이 확률 또한 계산 할 수 있다. 이러한 일련의 과정을 본 논문에서는 기대치 최대화 기반 군집화 과정을 통해 연속시간 연쇄 모델의 형태로 인간의 이동성을 표현하였다. 또한 이러한 모델에서 대표 군집(macro)과 그 부속 군집(micro)을 표현할 수 있었고 이러한 모습은 대표적인 큰 군집 속의 작은 군집의 형태로 나타나게 된다.

A Study on comparison of calculation between CPU-intensive and GPU-intensive and finding proper model for specific program (GPU기반의 계산속도와 CPU기반의 계산속도 비교 및 특정 프로그램에 따른 적합한 모델 찾기에 대한 연구)

  • Shin, Hyun-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.48-51
    • /
    • 2019
  • 최근 기술이 발달함으로 인해 더 짧은시간에 더 많은 계산량이 필요해진 시대가 왔다. 본 연구에서는 CPU와 GPU의 구조를 파악하고 계산속도를 비교한다. 직렬 방식의 알고리즘에서의 병렬 방식의 알고리즘 및 현재 GPU 병렬처리 적용 사례 및 추후 적합한 모델 찾기에 대해 연구한다.

Deep-Learning Seismic Inversion using Laplace-domain wavefields (라플라스 영역 파동장을 이용한 딥러닝 탄성파 역산)

  • Jun Hyeon Jo;Wansoo Ha
    • Geophysics and Geophysical Exploration
    • /
    • v.26 no.2
    • /
    • pp.84-93
    • /
    • 2023
  • The supervised learning-based deep-learning seismic inversion techniques have demonstrated successful performance in synthetic data examples targeting small-scale areas. The supervised learning-based deep-learning seismic inversion uses time-domain wavefields as input and subsurface velocity models as output. Because the time-domain wavefields contain various types of wave information, the data size is considerably large. Therefore, research applying supervised learning-based deep-learning seismic inversion trained with a significant amount of field-scale data has not yet been conducted. In this study, we predict subsurface velocity models using Laplace-domain wavefields as input instead of time-domain wavefields to apply a supervised learning-based deep-learning seismic inversion technique to field-scale data. Using Laplace-domain wavefields instead of time-domain wavefields significantly reduces the size of the input data, thereby accelerating the neural network training, although the resolution of the results is reduced. Additionally, a large grid interval can be used to efficiently predict the velocity model of the field data size, and the results obtained can be used as the initial model for subsequent inversions. The neural network is trained using only synthetic data by generating a massive synthetic velocity model and Laplace-domain wavefields of the same size as the field-scale data. In addition, we adopt a towed-streamer acquisition geometry to simulate a marine seismic survey. Testing the trained network on numerical examples using the test data and a benchmark model yielded appropriate background velocity models.

Preliminary Study on Automated Path Generation and Tracking Simulation for an Unmanned Combine Harvester (자율주행 콤바인을 위한 포장 자동 경로생성 및 추종 시뮬레이션 기초연구)

  • Jeon, Chan-Woo;Kim, Hak-Jin;Han, XiongZhe;Kim, Jung-Hun
    • Proceedings of the Korean Society for Agricultural Machinery Conference
    • /
    • 2017.04a
    • /
    • pp.20-20
    • /
    • 2017
  • 궤도형 차량의 이동구조는 에너지 소비 측면에서 단점이 있지만 접지압의 감소로 인한 평지 및 야지험지에서도 원활한 주행이 가능한 장점으로 인해 농업분야의 플랫폼에서 많이 사용된다. 곡식을 베는 일과 탈곡하는 일을 한 번에 하는 콤바인도 이러한 무한궤도형 이동구조를 사용한다. 또한 궤도형 차량의 방향전환 및 주행속도 변환은 좌 우 궤도의 회전 속도를 다르게 하여 동시에 제어하기 때문에 정교한 주행 성능을 위해서는 궤도형 차량의 기구학 모델을 고려한 경로 계획이 필요하다. 본 연구에서는 직교형 포장에서 Round harvesting 기법 기반으로 궤도형 차량의 기구학 모델 및 포장정보를 고려한 자율주행 콤바인 경로계획 알고리즘을 개발하고자 하였다. 이를 위해 Labview 기반의 궤도형 차량 시뮬레이션을 구축하여 실제 포장정보를 이용해 생성 된 경로의 적용 가능성을 구명하고자 하였다. 자율주행 콤바인 경로 계획은 콤바인의 길이, 너비, 회전 시 좌 우 궤도의 속도 비, 직진 속도와 회전 속도 비, 회전 각도, 포장의 외부 경계선, 작업 겹침 량, 회경 횟수를 이용하여 좌현 새머리 선회를 포함한 내부 왕복작업 경로를 생성하며 외부 회경 횟수는 2~3회를 가정하였다. 자율주행 시뮬레이션은 차체와 궤도 자체의 미끄러짐과 작동기 지연시간을 단순화 한 궤도형 기구학 모델형태로 구성하였다. 추종 알고리즘은 선견 거리법을 사용하였으며, 측면 변이값과 방향 오차의 선형조합을 이용하여 조향변수를 정의하고 퍼지로직기반으로 좌 우 궤도 속도를 7 단계화하여 조향장치를 모델링하였다. 실험결과 개발 된 경로생성 알고리즘은 실제 취득 된 포장 외부 경계 GPS 위 경도를 이용해 자동으로 생성이 가능하며 간략화 된 콤바인 시뮬레이션에서 직진주행 RMS 위치 오차는 0.05 m, 선회구간에서 직진 구간 진입 시 RMS 위치 오차는 0.11 m, 직진 구간 RMSE 방향 오차는 3.2 deg로 콤바인 예취부 간격인 30 cm보다 작은 위치 오차를 보이며 생성된 경로 전체 추종이 가능함을 나타내었다.

  • PDF

A Study on Deep Learning Model for Container Load Status Monitoring (컨테이너 적재 상태 모니터링을 위한 딥러닝 모델 연구)

  • Oh, Seyeong;Jeong, Junho;Choi, Bulim;Yeon, Jeong Hum;Seo, Yonguk;Kim, Sangwoo;Youn, Joosang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.320-321
    • /
    • 2022
  • 부두 내 컨테이너를 적재하는 과정에서 정렬 상태가 부정확한 경우 강풍으로 인한 안전사고가 발생할 가능성이 있다. 본 논문에서는 컨테이너 안전사고를 예방하기 위한 딥러닝 기반의 컨테이너 정렬 상태 분류 알고리즘을 제안한다. 제안하는 알고리즘은 정렬을 분류하는 기준을 제시하고 YOLO 기반의 모델을 구현했다. 추론 속도, 검출 정확도, 분류 정확도를 기준으로 각 모델의 성능을 평가했으며 성능 결과는 YOLOv4모델이 YOLOv3모델에 비해서 추론 속도는 느리지만, 검출 정확도와 분류 정확도는 높음을 보인다.