• 제목/요약/키워드: acoustic features

검색결과 323건 처리시간 0.027초

음향 실험을 기초로 한 몽골어와 한국어의 단모음 대조분석 (Contrastive Analysis of Mongolian and Korean Monophthongs Based on Acoustic Experiment)

  • 이중진
    • 말소리와 음성과학
    • /
    • 제2권2호
    • /
    • pp.3-16
    • /
    • 2010
  • This study aims at setting the hierarchy of difficulty of the 7 Korean monophthongs for Mongolian learners of Korean according to Prator's theory based on the Contrastive Analysis Hypothesis. In addition to that, it will be shown that the difficulties and errors for Mongolian learners of Korean as a second or foreign language proceed directly from this hierarchy of difficulty. This study began by looking at the speeches of 60 Mongolians for Mongolian monophthongs; data were investigated and analyzed into formant frequencies F1 and F2 of each vowel. Then, the 7 Korean monophthongs were compared with the resultant Mongolian formant values and are assigned to 3 levels, 'same', 'similar' or 'different sound'. The findings in assessing the differences of the 8 nearest equivalents of Korean and Mongolian vowels are as follows: First, Korean /a/ and /$\wedge$/ turned out as a 'same sound' with their counterparts, Mongolian /a/ and /ɔ/. Second, Korean /i/, /e/, /o/, /u/ turned out as a 'similar sound' with each their Mongolian counterparts /i/, /e/, /o/, /u/. Third, Korean /ɨ/ which is nearest to Mongolian /i/ in terms of phonetic features seriously differs from it and is thus assigned to 'different sound'. And lastly, Mongolian /$\mho$/ turned out as a 'different sound' with its nearest counterpart, Korean /u/. Based on these findings the hierarchy of difficulty was constructed. Firstly, 4 Korean monophthongs /a/, /$\wedge$/, /i/, /e/ would be Level 0(Transfer); they would be transferred positively from their Mongolian counterparts when Mongolians learn Korean. Secondly, Korean /o/, /u/ would be Level 5(Split); they would require the Mongolian learner to make a new distinction and cause interference in learning the Korean language because Mongolian /o/, /u/ each have 2 similar counterpart sounds; Korean /o, u/, /u, o/. Thirdly, Korean /ɨ/ which is not in the Mongolian vowel system will be Level 4(Overdifferentiation); the new vowel /ɨ/ which bears little similarity to Mongolian /i/, must be learned entirely anew and will cause much difficulty for Mongolian learners in speaking and writing Korean. And lastly, Mongolian /$\mho$/ will be Level 2(Underdifferentiation); it is absent in the Korean language and doesn‘t cause interference in learning Korean as long as Mongolian learners avoid using it.

  • PDF

CNN 잡음 감쇠기에서 커널 사이즈의 최적화 (Optimization of the Kernel Size in CNN Noise Attenuator)

  • 이행우
    • 한국전자통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.987-994
    • /
    • 2020
  • 본 논문은 음향잡음감쇠기에서 CNN(: Convolutional Neural Network) 계층의 커널 사이즈가 성능에 미치는 영향을 위한 연구하였다 이 시스템은 기존의 적응필터를 이용하는 대신 신경망 적응예측필터를 이용한 심층학습 알고리즘으로 잡음감쇠 성능을 개선한다. 100-neuron, 16-filter CNN 필터와 오차 역전파(back propagation) 알고리즘을 이용하여 잡음이 포함된 단일입력 음성신호로부터 음성을 추정한다. 이는 음성신호가 갖는 유성음 구간에서의 준주기적 성질을 이용하는 것이다. 본 연구에서 커널 사이즈에 대한 잡음감쇠기의 성능을 검증하기 위하여 Tensorflow와 Keras 라이브러리를 사용한 시뮬레이션 프로그램을 작성하고 모의실험을 수행하였다. 모의실험 결과, 커널 사이즈가 16 정도일 때 평균자승오차(MSE: Mean Square Error) 및 평균절대값오차(MAE: Mean Absolute Error) 값이 가장 작은 것으로 나타났으며 사이즈가 이보다 더 작거나 커지면 MSE 및 MAE 값이 증가하는 것을 볼 수 있다. 이는 음성신호의 경우 커널 사이즈가 16 정도일 때 특성을 가장 잘 포집할 수 있음을 알 수 있다.

생성적 적대 신경망을 이용한 음향 도플러 기반 무 음성 대화기술 (An acoustic Doppler-based silent speech interface technology using generative adversarial networks)

  • 이기승
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.161-168
    • /
    • 2021
  • 본 논문에서는 발성하고 있는 입 주변에 40 kHz의 주파수를 갖는 초음파 신호를 방사하고 되돌아오는 신호의 도플러 변이를 검출하여 발성음을 합성하는 무 음성 대화기술을 제안하였다. 무음성 대화 기술에서는 비 음성 신호로 부터 추출된 특징변수와 해당 음성 신호의 파라메터 간 대응 규칙을 생성하고 이를 이용하여 음성신호를 합성하게 된다. 기존의 무 음성 대화기술에서는 추정된 음성 파라메터와 실제 음성 파라메터간의 오차가 최소화되도록 대응규칙을 생성한다. 본 연구에서는 추정 음성 파라메터가 실제 음성 파라메터의 분포와 유사하도록 생성적 적대 신경망을 도입하여 대응 규칙을 생성하도록 하였다. 60개 한국어 음성을 대상으로 한 실험에서 제안된 기법은 객관적, 주관적 지표상 으로 기존의 신경망 기반 기법보다 우수한 성능을 나타내었다.

Hierarchical Flow-Based Anomaly Detection Model for Motor Gearbox Defect Detection

  • Younghwa Lee;Il-Sik Chang;Suseong Oh;Youngjin Nam;Youngteuk Chae;Geonyoung Choi;Gooman Park
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권6호
    • /
    • pp.1516-1529
    • /
    • 2023
  • In this paper, a motor gearbox fault-detection system based on a hierarchical flow-based model is proposed. The proposed system is used for the anomaly detection of a motion sound-based actuator module. The proposed flow-based model, which is a generative model, learns by directly modeling a data distribution function. As the objective function is the maximum likelihood value of the input data, the training is stable and simple to use for anomaly detection. The operation sound of a car's side-view mirror motor is converted into a Mel-spectrogram image, consisting of a folding signal and an unfolding signal, and used as training data in this experiment. The proposed system is composed of an encoder and a decoder. The data extracted from the layer of the pretrained feature extractor are used as the decoder input data in the encoder. This information is used in the decoder by performing an interlayer cross-scale convolution operation. The experimental results indicate that the context information of various dimensions extracted from the interlayer hierarchical data improves the defect detection accuracy. This paper is notable because it uses acoustic data and a normalizing flow model to detect outliers based on the features of experimental data.

Thyroid Nodules with Isolated Macrocalcifications: Malignancy Risk of Isolated Macrocalcifications and Postoperative Risk Stratification of Malignant Tumors Manifesting as Isolated Macrocalcifications

  • Hye Yun Gwon;Dong Gyu Na;Byeong-Joo Noh;Wooyul Paik;So Jin Yoon;Soo-Jung Choi;Dong Rock Shin
    • Korean Journal of Radiology
    • /
    • 제21권5호
    • /
    • pp.605-613
    • /
    • 2020
  • Objective: To determine the malignancy risk of isolated macrocalcifications (a calcified nodule with complete posterior acoustic shadowing) detected on ultrasonography (US) and to evaluate the postoperative American Thyroid Association (ATA) risk stratification of malignant tumors manifesting as isolated macrocalcifications. Materials and Methods: A total of 3852 thyroid nodules (≥ 1 cm) of 3061 consecutive patients who had undergone biopsy between January 2011 and June 2018 were included in this study. We assessed the prevalence, malignancy rate, and size distribution of isolated macrocalcifications and evaluated the histopathologic features and postoperative ATA risk stratification of malignant tumors manifesting as isolated macrocalcifications. Results: Isolated macrocalcifications were found in 38 (1.2%) of the 3061 patients. Final diagnosis was established in 30 (78.9%) nodules; seven malignant tumors were diagnosed as papillary thyroid carcinomas (PTCs). The malignancy rate of the isolated macrocalcifications was 23.3% in the 30 nodules with final diagnoses and 18.4% in all nodules. Among the six surgically-treated malignant tumors, five (83.3%) had an extrathyroidal extension (ETE) (minor ETE 1, gross ETE 4), and two (33.3%) had macroscopic lymph node metastasis. Four (66.7%) malignant tumors were categorized as high-risk tumors, one as an intermediate-risk tumor, and one as a low-risk tumor using the ATA risk stratification. Histopathologically, out of the six malignant tumors, ossifications were noted in four (66.7%) and predominant calcifications in two (33.3%). Conclusion: The US pattern of isolated macrocalcifications (≥ 1 cm) showed an intermediate malignancy risk (at least 18.4%). All malignant tumors were PTCs, and most showed an aggressive behavior and a high or intermediate postoperative ATA risk.

심해 자율무인잠수정 우라시마의 잠항시험에서 취득된 북 구마노 분지 해저 선상지 시스템의 음향 영상 (Acoustic images of the submarine fan system of the northern Kumano Basin obtained during the experimental dives of the Deep Sea AUV URASHIMA)

  • Kasaya, Takafumi;Kanamatsu, Toshiya;Sawa, Takao;Kinosita, Masataka;Tukioka, Satoshi;Yamamoto, Fujio
    • 지구물리와물리탐사
    • /
    • 제14권1호
    • /
    • pp.80-87
    • /
    • 2011
  • 자율무인잠수정은 해수면탐사선에 비해 해저면에 더 가까이 접근할 수 있는 장점을 제공한다. 수심자료, 해저면 물질 정보와 해저면 하부 영상을 얻기 위해서는 자율무인잠수정에 탑재된 다중빔음향즉심기, 해저면영상탐사기 및 천부지층탐사기 등이 유용하게 사용된다. 일본해양연구개발기구는 3000m급 자율무인잠수정 우라시마를 개발하였다. 잠수정의 전력공급용 연료전지시스템의 공학적 개발과 시험과정을 거쳐 우라시마에는 신형 리튬이온전지 시스템이 설치되었다. 잠수정은 초기 공학적인 업무에서 과학적 사용 목적으로 개량되었다. 다양한 과학장비들이 추가되었고 2006년부터 과학적인 목적의 임무수행을 위한 잠항시험이 수행되었다. 2007년 시험운항에서 일본 기이반도 해역 북구마노분지 부근에서 우라시마의 해저면영상탐사기와 천부지층탐사기를 이용하여 고해상 음향영상자료를 획득하였다. 후방산란강도 도면에서는 많은 암설류가 확인되었고, 천부지층탐사단면에서 연구해역의 북동쪽 끝 부근의 하부구조가 확인되었다. 이러한 특징은 최신 선상지의 형성과 관련된 구조를 암시한다. 그러나 남서 해역에서는 해저면 하부 ~20 ms 부근에서 강한 반사층이 존재하는데, 이는 삭박특징으로 해석되며 현재는 더 젊은 해저 퇴적물로 덮여있다. 잠수정의 성능은 지속적으로 향상되고, 우라시마를 활용하여 많은 유용한 결과가 얻어질 것으로 기대된다.

전기 Glottography(EGG)를 이용한 후두구음역학적 특성 (The Role of the Electroglottography on the Laryngeal Articulation of Speech)

  • 홍기환;박병암;양윤수;서수영;김현기
    • 대한후두음성언어의학회지
    • /
    • 제8권1호
    • /
    • pp.18-26
    • /
    • 1997
  • There are two types of phonetic study, acoustic and physiologic, for differentiating the three manner categories of Korean stop consonants. On the physiologic studies, there are endoscopic, electromyographic(EMG), electroglottographic(EGG) and aerodynamic studies. In this study, I tried to investigate general features of Korean stops using EGG study for the open quotient of vocal fold and baseline shift during speech, and aerodynamic characteristics for e subglottal air pressure, air flow and glottal resistance at consonants. On the aerodynamic study, the glottalized and aspirated stops may be characterized by e increasing subglottal pressure comparing with lenis stop at consonants. The airflow is largest in the aspirated stops followed by lenis stops and glottalized. The glottal airway resistance (GAR) showed highest in the glottalized followed by the lenis, but lowest in e aspirated during e production of consonants, and showed highest in e aspirated, but low in the glottalized and lenis during the production of vowel. The glottal resistance at consonant showed significant difference among consonants and significant interaction between subject and types of consonant. The glottal resistance at vowel showed significant difference among consonants, and e interaction occured between subject and types of consonant. The electroglottography(EGG) has been used for investigating e functioning of e vocal folds during its vibration. The EGG should be related to the patterns of the vocal fold vibration during phonation in characterizing the temporal patterns of each vibratory cycle. The purpose of this study is to investigate the dynamic change of EGG waveforms during continuous speech. The dynamic changes of EGG waveforms fir the three-way distinction of Korean stops were characterized that the aspirated stop appears to be characterized by largest open quotient and smallest glottal contact area of the vocal folds in e initial portion of vocal fold vibration ; the lenis stop by moderate open quotient and glottal contact area ; but the glottalized stop by smallest open quotient and largest glottal contact area. There may be close relationship between the OQ(open quotient) in the initial voice onset and the glottal width at the time of consonant production, the larger glottal width just before vocal fold vibration results in the smaller OQ of the vocal fold vibration in the initial voice onset. The EGG changes of baseline shift during continuous speech production were characterized by the different patterns for the three types of Korean consonants. The small and less stiffness change of baseline shift was found for the lenis and the glottalized, and the largest and stiffest change was found for the aspirated. On the baseline shift for the initial voice onset, they showed so similar patterns with for the consonant production, larger changed in the aspirated. for the lenis and the glottalized during the initial voice onset, three subjects showed individual difference each other. I suggest at s characteristics were strongly related with articulatory activity of vocal tract for the production of consonant, especially for the aspirated stop. The suspecting factors to affect EGG waveforms are glottal width, vertical laryngeal movement and the intrapharyngeal pressure to neighboring tissue during connected spech. So the EGG may be an useful method to describe laryngeal activity to classify pulsing conditions of the larynx during speech production, and EGG research can be controls for monitoring the vocal tract articulation, although above factors to affect EGG would have played such a potentially role on vocal fold vibratory behavior obtained using consonant production.

  • PDF

한반도의 동해 대륙주변부의 지각구조 : 심부 탄성파탐사결과 (Crustal Structure of the Continental Margin of Korea in the East Sea: Results From Deep Seismic Sounding)

  • 김한준;조현무;주형태;홍종국;유해수;박창업
    • 지구물리와물리탐사
    • /
    • 제6권1호
    • /
    • pp.40-52
    • /
    • 2003
  • 한반도와 일본열도 사이에 위치하는 동해 남서부의 열림모델이 다양하게 제시되었음에도 불구하고 한반도의 대륙주변부의 지각구조는 잘 알려져 있지 않다. 그 결과 동해의 열림을 설명하는 데에 필요한 대륙의 리프팅과 해저면 확장과정은 정확히 제시되지 못하고 있다. 이 연구에서는 다중채널 탄성파자료와 해저면지진계자료로부터 한반도의 대륙주변부에서 울릉분지의 중앙부까지 지각구조를 구하였다. 울릉분지의 지각은 그 두께가 약 10km로서 정상보다 두꺼우나 깊이에 따른 속도분포에서 전형적인 해양지각의 특성을 갖는다. 대륙주변부에서 대륙과 해양지각간의 급격한 전이가 발생하는데 약 50km의 거리에서 지각의 두께가 상당히 감소하며 모호면이 얕아진다. 대륙주변부에서는 특징적으로 고속도(최대 7.4km/s)의 하부지각이 존재하는데 이것은 대륙사면 아래에서 10km이상 두꺼우며 바다쪽으로 첨멸된다. 이 고속도의 하부지각은 맨틀의 온도가 정상보다 뜨거운 환경에서 대륙이 리프트되는 동안 형성된 magmatic underplating으로 해석된다. 대륙사면의 음향기반은 많은 양의 화산분출에 의해 발달된 화성층서를 보여준다. 이러한 점들은 한반도 대륙주변부의 진화가 화산성의 리프트된 대륙주변부에서 일어나는 과정에 의해 설명될 수 있음을 제시한다. 지구규모의 지진파 토모그래피는 상부 맨틀이 한반도의 대륙주변부와 울릉분지에서 비정상적으로 뜨거운 것을 보여줌으로써 이러한 제시를 뒷받침한다.

Praat을 활용한 영어발음특성의 시각적 연구 (A Visual Study of the Quality of English Pronunciation Using the Praat Program)

  • 박희석
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권3호
    • /
    • pp.323-331
    • /
    • 2013
  • Praat프로그램을 활용하면 시각적인 영어교육효과를 얻을 수 있다. 시청각교육이 중시되는 영어교육의 방법론에 비추어볼 때 시각적인 연구의 활용은 교육의 효율성 측면에서 기대되는바가 크다고 할 수 있다. 이러한 점에 착안하여 본 연구에서는 현재 고등학교에 재학 중인 학생들 중 영어성적이 1,2등급에 해당되는 학생과 5,6등급에 해당되는 학생들을 두 그룹으로 나누어 각각의 그룹이 원어민의 발음과 어떤 차이를 보이는지를 알아보고, 그 차이가 어떻게 다른지를 시각적인 면으로 규명해보고자 시도하였다. 이를 위해 원어민이 녹음한 CD가 내장되어있는 영어발음교재를 실험자료로 활용하였다. 구체적으로 영어발음에서 외국인어투를 보일 가능성이 있는 영어저모음과 이중모음이 들어있는 단어와 문장을 대상으로 하였으며, 단어와 문장들은 캠브리지대학교 출판국에서 출간된 English Pronunciation in Use의 교재내용 중의 일부를 활용하였다. 실험을 통해 나타난 결과를 보면 한국인 피 실험자의 두 집단 간에 공히 모음이나 단어단위에선 집단 간, 그리고 원어민의 녹음자료와의 사이에서도 유의미한 차이가 나타나지 않았다. 그러나 다섯 단어 이상으로 구성된 상대적으로 긴 문장단위의 실험에서는 5,6등급 집단의 발음이 유의미하게 크게 나타났다. 이러한 결과는 한국인 피 실험자들의 억양구현실패에서 기인한 것으로 보여지며, 이러한 분석은 Praat프로그램에서 제공한 시각적인 자료에 의해 뒷받침되고 있다.

IoT 센서를 이용한 국산 RV차량 음향시스템의 음향특성에 관한 분석 (IoT Based Performance Measurement of Car Audio Systems in Korean Recreation Vehicles)

  • 박형우;이상민
    • 인터넷정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.57-64
    • /
    • 2017
  • 오늘날 자동차 제조회사들은 차량의 기능과 성능을 향상시키는 기술에 주안을 두는 것은 기본이고, 시장성의 극대화 및 고객 만족도를 높이기 위해 고품질 오디오 장치 구축에도 투자를 아끼지 않고 있다. 특히 고가의 차량일수록 일반 청음실에서 느낄 수 있는 높은 수준의 음향 시설을 갖추려고 한다. 이러한 현상은 차량의 모델에 국한되지 않는다. 요즘 인기가 많은 RV차량에서도 고객들이 수준 높은 음질을 만끽할 수 있도록 제조사들은 고품질의 음향 시스템을 탑재하는 움직임을 발견할 수 있다. 그러나 고품질 음향시스템은 대부분 고가의 부품을 필요로 하는 관계로, 이는 필연적으로 자동차 판매가의 증대를 야기한다. 따라서 비교적 저가의 음향시스템을 이용하더라도 고객이 만족해 할 수 있는 음질을 구현하는 차량 내 음향 시스템 구축의 필요성이 대두되었다. 즉, 인간의 청각적 특성이 고려된 객관적인 자동차 '오디오 시스템 성능 측정 지표' 및 튜닝 방법에 관한 연구가 필요하다. 본 논문에서는 RV차량의 오디오 시스템의 성능을 평가하고 개선하기 위해 인간의 청각적 특성이 고려된 오디오 신호의 특성을 사물인터넷(IoT) 센서를 이용해 측정하고 분석하였다. 분석 결과 사람에게 민감한 대역의 높은 에너지지가 있는 점은 인지에 대한 비중을 높일 수 있으나, 해당 대역만 강조된 경우에는 성가심을 유발할 수 있는 것으로 나타났다. 그리고 왜곡된 주파수 평탄도는 음질에 나쁜 영향을 줄 수 있어 주파수 응답의 평탄화를 필요로 한다는 점을 발견할 수 있었다.