• 제목/요약/키워드: listening log

검색결과 7건 처리시간 0.023초

Writing Listening Logs and Its Effect on Improving L2 Students' Metacognitive Awareness and Listening Proficiency

  • Lee, You-Jin;Cha, Kyung-Whan
    • International Journal of Contents
    • /
    • 제16권4호
    • /
    • pp.50-67
    • /
    • 2020
  • This study investigated whether writing weekly listening logs could influence college English learners' metacognitive awareness and listening proficiency. In addition, the Metacognitive Awareness Listening Questionnaire (MALQ) was applied to examine the learners' knowledge of their listening process. It is process-oriented research conducted by analyzing the MALQ and students' listening logs as to how their metacognitive awareness and listening proficiency have changed during the semester. Eighty-nine students who took an English listening practice course at a university participated in this study. The research findings are as follows. First, it turned out that there was a significant relationship between EFL university students' listening comprehension and some subscales of metacognitive awareness. Second, the students had an opportunity to reflect on learning through regular listening activities, and weekly listening logs, which included important information about listening process and practice. Third, as the students' listening proficiency increased at the end of the semester, it was found that introducing listening logs along with classroom lessons helped the students improve their listening ability. Finally, the high proficiency group students used multiple strategies simultaneously, regardless of the type of listening strategies, while the low proficiency group students used one or two limited listening strategies. However, the low proficiency group students may have had trouble expressing their ideas in English or recognizing the listening strategies they used, not because they did not use a lot of listening strategies. Therefore, teachers should regularly check if students are following their instructions and help them use appropriate strategies for better understanding.

다양한 손실 함수를 이용한 음성 향상 성능 비교 평가 (Performance comparison evaluation of speech enhancement using various loss functions)

  • 황서림;변준;박영철
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.176-182
    • /
    • 2021
  • 본 논문은 다양한 손실 함수에 따른 Deep Nerual Network(DNN) 기반 음성 향상 모델의 성능을 비교 평가한다. 베이스라인 모델로는 음성의 위상 정보를 고려할 수 있는 복소 네트워크를 사용하였다. 손실 함수는 두 가지 유형의 기본 손실 함수, Mean Squared Error(MSE)와 Scale-Invariant Source-to-Noise Ratio(SI-SNR)를 사용하였으며 두 가지 유형의 지각 기반 손실 함수 Perceptual Metric for Speech Quality Evaluation(PMSQE)과 Log Mel Spectra(LMS)를 사용한다. 성능은 각 손실 함수의 다양한 조합을 사용하여 얻은 출력을 객관적인 평가와 청취 테스트를 통해 측정하였다. 실험 결과, 지각기반 손실 함수를 MSE 또는 SI-SNR과 결합하였을 때 전반적으로 성능이 향상되며, 지각기반 손실함수를 사용하면 객관적 지표에서 약세를 보이는 경우라도 청취 테스트에서 우수한 성능을 보임을 확인하였다.

Personalized Battery Lifetime Prediction for Mobile Devices based on Usage Patterns

  • Kang, Joon-Myung;Seo, Sin-Seok;Hong, James Won-Ki
    • Journal of Computing Science and Engineering
    • /
    • 제5권4호
    • /
    • pp.338-345
    • /
    • 2011
  • Nowadays mobile devices are used for various applications such as making voice/video calls, browsing the Internet, listening to music etc. The average battery consumption of each of these activities and the length of time a user spends on each one determines the battery lifetime of a mobile device. Previous methods have provided predictions of battery lifetime using a static battery consumption rate that does not consider user characteristics. This paper proposes an approach to predict a mobile device's available battery lifetime based on usage patterns. Because every user has a different pattern of voice calls, data communication, and video call usage, we can use such usage patterns for personalized prediction of battery lifetime. Firstly, we define one or more states that affect battery consumption. Then, we record time-series log data related to battery consumption and the use time of each state. We calculate the average battery consumption rate for each state and determine the usage pattern based on the time-series data. Finally, we predict the available battery time based on the average battery consumption rate for each state and the usage pattern. We also present the experimental trials used to validate our approach in the real world.

Human Laughter Generation using Hybrid Generative Models

  • Mansouri, Nadia;Lachiri, Zied
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권5호
    • /
    • pp.1590-1609
    • /
    • 2021
  • Laughter is one of the most important nonverbal sound that human generates. It is a means for expressing his emotions. The acoustic and contextual features of this specific sound are different from those of speech and many difficulties arise during their modeling process. During this work, we propose an audio laughter generation system based on unsupervised generative models: the autoencoder (AE) and its variants. This procedure is the association of three main sub-process, (1) the analysis which consist of extracting the log magnitude spectrogram from the laughter database, (2) the generative models training, (3) the synthesis stage which incorporate the involvement of an intermediate mechanism: the vocoder. To improve the synthesis quality, we suggest two hybrid models (LSTM-VAE, GRU-VAE and CNN-VAE) that combine the representation learning capacity of variational autoencoder (VAE) with the temporal modelling ability of a long short-term memory RNN (LSTM) and the CNN ability to learn invariant features. To figure out the performance of our proposed audio laughter generation process, objective evaluation (RMSE) and a perceptual audio quality test (listening test) were conducted. According to these evaluation metrics, we can show that the GRU-VAE outperforms the other VAE models.

A DNN-Based Personalized HRTF Estimation Method for 3D Immersive Audio

  • Son, Ji Su;Choi, Seung Ho
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권1호
    • /
    • pp.161-167
    • /
    • 2021
  • This paper proposes a new personalized HRTF estimation method which is based on a deep neural network (DNN) model and improved elevation reproduction using a notch filter. In the previous study, a DNN model was proposed that estimates the magnitude of HRTF by using anthropometric measurements [1]. However, since this method uses zero-phase without estimating the phase, it causes the internalization (i.e., the inside-the-head localization) of sound when listening the spatial sound. We devise a method to estimate both the magnitude and phase of HRTF based on the DNN model. Personalized HRIR was estimated using the anthropometric measurements including detailed data of the head, torso, shoulders and ears as inputs for the DNN model. After that, the estimated HRIR was filtered with an appropriate notch filter to improve elevation reproduction. In order to evaluate the performance, both of the objective and subjective evaluations are conducted. For the objective evaluation, the root mean square error (RMSE) and the log spectral distance (LSD) between the reference HRTF and the estimated HRTF are measured. For subjective evaluation, the MUSHRA test and preference test are conducted. As a result, the proposed method can make listeners experience more immersive audio than the previous methods.

다기준 의사결정 방법을 고려한 베이지안 네트워크 기반 음악 추천 시스템 (Bayesian network based Music Recommendation System considering Multi-Criteria Decision Making)

  • 김남국;이상용
    • 디지털융복합연구
    • /
    • 제11권3호
    • /
    • pp.345-352
    • /
    • 2013
  • 최근 스마트 기기 사용자의 증가에 따라 모바일 음악에 대한 수요와 생산이 꾸준히 증가하고 있다. 이에 따라 대중화된 음악의 폭이 넓어지면서 사용자가 선호하는 음악에 대한 선택의 기준 또한 매우 다양해지고 복잡해지는 추세이다. 이러한 이유로 모바일 환경에서 사용자 개인이 선호하는 음악을 정교하게 추천하기 위한 지능적 음악 추천 기법에 대한 연구가 활발히 진행되고 있다. 그러나 기존의 음악 추천시스템은 청취로그를 이용한 단순 추천 방법을 사용하고 있어 사용자의 선호도를 제대로 고려하지 못하고 있다. 본 논문에서는 사용자의 선호도를 반영한 개인화된 적응형 음악 추천 시스템을 제안한다. 본 시스템에서는 계층적 의사결정 도구인 AHP를 이용하여 사용자의 개개인의 음악적 선호도를 반영한 음악 추천이 가능토록 하였으며, 베이지안 네트워크 기반의 사용자 피드백 통해 지속적인 사용자의 음악적 선호도를 반영하도록 하였다. 본 시스템의 성능을 평가하기 위해 12명의 실험자를 각각 3명씩 4그룹으로 나누어 실험하였으며 그 결과 87.5%의 추천 만족도를 얻었다.

서울말의 wh-섬 제약 지각 연구 (A perceptual study of the wh-island constraint in Seoul Korean)

  • 윤원희
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.27-35
    • /
    • 2021
  • wh-섬 구조는 내포문에 있는 의문사 구가 모문의 작용역을 갖을 수 없도록 하는 제약이다. 서울말에서 내포문 의문사 구가 모문의 작용역으로 해석할 수 없다고 알려져 있으나 의문사 억양으로 발화될 경우 모문 작용역 해석도 가능하다고 보고되었다. 청취 실험을 통하여 서울말에서 의문사 구의 모문 작용역 해석이 가능한지 알아보았다. 내포문에 '누구를'을 넣어 만든 세 종류의 의문문, 즉 부정 대명사와 내포문 작용역을 갖는 판정 의문문과 의문사 억양으로 발화된 모문 작용역 해석이 가능한 설명 의문문을 자극으로 준비하고 비교를 위해 일반 명사를 사용한 판정 의문문 문장도 함께 실험하였다. 피험자는 자극 문장을 듣고 '네/아니오'를 선택하거나 아니면 설명 의문문을 선택하도록 지시하였다. 피험자의 대답과 함께 선택에 소요된 반응 시간을 함께 기록하여 함께 분석하였다. 분석 결과 83.7%의 피험자가 모문 작용역 해석을 받아들이는 결과를 보여주었고 반응 시간에서 모문 작용역 문장에 대한 선택이 정답과 오답을 포함하여 가장 긴 소요 시간을 보여주었다. 이를 통해 서울말은 약한 wh-섬 제약이라고 할 수 있다.