• 제목/요약/키워드: Sound Recordings

검색결과 36건 처리시간 0.025초

Separation of Single Channel Mixture Using Time-domain Basis Functions

  • 장길진;오영환
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.146-146
    • /
    • 2002
  • We present a new technique for achieving source separation when given only a single channel recording. The main idea is based on exploiting the inherent time structure of sound sources by learning a priori sets of time-domain basis functions that encode the sources in a statistically efficient manner. We derive a learning algorithm using a maximum likelihood approach given the observed single channel data and sets of basis functions. For each time point we infer the source parameters and their contribution factors. This inference is possible due to the prior knowledge of the basis functions and the associated coefficient densities. A flexible model for density estimation allows accurate modeling of the observation, and our experimental results exhibit a high level of separation performance for simulated mixtures as well as real environment recordings employing mixtures of two different sources. We show separation results of two music signals as well as the separation of two voice signals.

땅강아지의 주음성에 관한 연구 (Phonotaxis of the African Mole Cricket, Gryllotalpa africana Palisot de Beauvois)

  • 김기황
    • 한국응용곤충학회지
    • /
    • 제32권1호
    • /
    • pp.76-82
    • /
    • 1993
  • 경기도 화성군 소재 한국인삼연초연구소 경작시험장 내에서 1990년과 1992년에 땅강아지(Gryllotalpa africana)의 주음성을 조사하였다. 웅성충은 지표 밑 굴의 입구로부터 유인음을 냈은데 강도는 입구 15 cm 위에서 77~80 dB 이었다. 녹음된 웅충 유인음이 직경 1.4m의 funnel중앙에 설치된 2개의 horn speaker에 의해 105~110 dB 로 증폭하여 야외에서 방사되었을 때 비상 성충이 일몰 후 약 30분부터 1.5시간 동안 유인되었다. 유인성충들 중, 14.3~16.7%는 funnel안에, 65.7~74.7%는 발음원으로부터 2 m 이내에 지면에 착지하였다. 자충률은 66.7~74.3%였는데, 이는 야외 개최군의 성비에 기인하는 것으로 보였다. funnel 안과 그 중심에서 2m 이내의 거리에 착지하는 성층수는 blacklight trap에 유인된 성층수보다 다소 많은 경향을 보였다.

  • PDF

에너지와 위상을 고려한 선택적 주파수 차감법을 이용한 보컬 분리 (Vocal Separation Using Selective Frequency Subtraction Considering with Energies and Phases)

  • 김현태;박장식
    • 방송공학회논문지
    • /
    • 제20권3호
    • /
    • pp.408-413
    • /
    • 2015
  • 최근 원음 반주기에 대한 관심이 증가됨에 따라 고가의 스튜디오 직접 녹음 방법 대신 보다 저렴한 방법을 시도하고 있다. 그 구체적인 방법으로는 가수의 음악 앨범에서 가수의 목소리만 제거하여 원음 반주 음원을 만드는 것이다. 본 논문에서는 보컬이 포함된 구간에서 스테레오로 녹음된 반주음악에서 보컬을 분리하는 시스템을 제안한다. 제안하는 시스템은 두 단계로 구성된다. 첫 단계는 보컬을 검출하는 단계이다. 이 단계에서는 MFCC를 가지고 SVM 방법을 이용하여 입력 신호를 보컬 부분과 비보컬 부분으로 분리한다. 두 번째 단계에서는 보컬 부분에 대해 각 주파수 빈별로 선택적 주파수 차감을 수행한다. 이 때 채널 신호의 주파수 빈별로 에너지 값 뿐만 아니라 위상까지 고려하여 차감 여부를 판별한다. 제안하는 방법으로 보컬을 제거한 음악에 대한 청취 실험에서 상대적으로 높은 만족도를 보여준다.

큰바다사자의 명음과 지역적 그룹과의 관계 (Relationship between roar sound and regional groups of Steller sea lion, Eumetopias jubatus)

  • 박태건;이이다 코지;김욱성;김성기;김석재;류경진;이유원
    • 수산해양기술연구
    • /
    • 제51권2호
    • /
    • pp.195-202
    • /
    • 2015
  • Hundreds of Steller sea lions, Eumetopias jubatus, migrate from Sakhalin and the northern Kuril Islands to Hokkaido in Japan every winter. During this migration, they may use their roaring sounds to navigate and to maintain their groups. We recorded the roars of wild Steller sea lions that had landed on reefs on the west coast of Hokkaido, and those of captive sea lions, while making video recordings. The fundamental frequency ($F_0$), Formant frequency ($F_1$), pulse repetition rate (PRR), and duration of syllables (T) were analyzed using a sonagraph. $F_0$, $F_1$, and PRR of the roars emitted by captive sea lions increased in the order male, female. By contrast, the $F_1$ of wild males was lower than that of females, while the $F_0$ and PRR of wild males and females did not differ statistically. These results suggest regional differences between the five groups showed that.

Relationship between roar sound characteristics and body size of Steller sea lion

  • Park, Tae-Geon;Iida, Kohji;Mukai, Tohru
    • 수산해양기술연구
    • /
    • 제46권4호
    • /
    • pp.458-465
    • /
    • 2010
  • Hundreds of Steller sea lions, Eumetopias jubatus, migrate from Sakhalin and the northern Kuril Islands to Hokkaido every winter. During this migration, they may use their roaring sounds to navigate and to maintain their groups. We recorded the roars of wild Steller sea lions that had landed on reefs on the west coast of Hokkaido, and those of captive sea lions, while making video recordings. A total of 300 roars of wild sea lions and 870 roars of captive sea lions were sampled. The fundamental frequency ($F_0$), formant frequency ($F_1$), pulse repetition rate (PRR), and duration of syllables (T) were analyzed using a sonagraph. $F_0$, $F_1$, and PRR of the roars emitted by captive sea lions increased in the order male, female, and juvenile. By contrast, the $F_1$ of wild males was lower than that of females, while the $F_0$ and PRR of wild males and females did not differ statistically. Moreover, the $F_0$ and $F_1$ frequencies for captive sea lions were higher than those of wild sea lions, while PRR in captive sea lions was lower than in wild sea lions. Since there was a linear relationship between body length and the $F_0$ and $F_1$ frequencies in captive sea lions, the body length distribution of wild sea lions could be estimated from the $F_0$ and $F_1$ frequency distribution using a regression equation. These results roughly agree with the body length distribution derived from photographic geometry. As the volume of the oral cavity and the length of the vocal cords are generally proportional to body length, sampled roars can provide useful information about a population, such as the body length distribution and sex ratio.

정악대금과 산조대금의 음색 특징 분석 (An Analysis of Timbre Comparison between Jeongak Daegeum and Sanjo Daegeum)

  • 성기영
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권3호
    • /
    • pp.229-236
    • /
    • 2020
  • 본 논문에서는 우리나라의 국악기중 대표적인 관악기인 대금의 음색을 분석하였다. 대금은 크게 정악대금과 산조대금으로 구분하여 사용되고 있는데, 정악대금은 궁중음악과 풍류음악에서 연주되고 있으며, 산조대금은 산조, 시나위, 민속음악에서 주로 연주된다. 이렇게 2개의 대금이 서로 다른 음악장르에서 연주되고 있는 이유는 악기의 개량에 따른 것인데, 관의 길이와 지공의 위치를 조정하여 산조대금이 정악대금에 비하여 빠른 연주가 가능하게 되었고, 다양한 연주기법을 적용할 수 있게 되었으며, 음색의 차이를 만들어 냄으로써 음악과 조화로운 악기의 선택을 가능하게 하였다. 이번 실험에서는 정악대금과 산조대금을 같은 음을 연주하여 녹음한 결과를 바탕으로 배음의 구조와 음색의 특징을 분석하였으며, 이를 통해 저음이 풍부한 정악대금이 궁중음악 등 장중한 분위기의 곡에 조화로우며, 상대적으로 고음이 맑은 산조대금이 독주 등 밝은 음악에 잘 어울린다는 것을 알 수 있었다.

Characteristics of Vibration Response Imaging in Healthy Koreans

  • Choi, Kyu-Hee;Kim, Kwan-Il;Bang, Ji-Hyun;Kim, Jae-Hwan;Choi, Jun-Yong;Jung, Sung-Ki;Jung, Hee-Jae
    • 대한한의학회지
    • /
    • 제32권6호
    • /
    • pp.10-17
    • /
    • 2011
  • Background: Vibration response imaging (VRI) is a new technology that records energy generated by airflow during the respiration cycle. Analysis of lung sound using VRI may overcome the limitations of auscultation. Objectives: To set a VRI standard for healthy Koreans, we conducted a clinical assessment to evaluate breath sound images and quantification in healthy subjects and compared the findings with reported breath sound characteristics. Methods: Recordings were performed using the VRIxp. Eighty subjects took a deep breath four times during a 12-second interval while sitting upright. The quantitative aspect was analyzed using the VRI quantitative lung data (QLD) for total left lung, total right lung and for six lung regions: left upper lung (LUL), left middle lung (LML), left lower lung (LLL), right upper lung (RUL), right middle lung (RML), right lower lung (RLL). The qualitative aspect was provided through image assessments by three reviewers. Results: In all regions the left lung had significantly higher QLD than the right lung (P<0.005, paired t-test). The inter-rater agreement was 0.78. 84% of the images were found normal by the final assessment. Among the 16% (n=13) of images with abnormal final assessment, the most common flawed features were dynamic image (77%, n=10) and maximum energy frame (MEF) shape (77%, n=10). No significant differences were found between males and females for QLD but there were significant differences in qualitative aspects including dynamic images, MEF shape, and missing LLL. Conclusion: The characteristics of healthy Koreans are similar to those of Western subjects reported previously. VRI is easy to use and objective, and so is helpful to diagnose patients with respiratory diseases and to monitor the progress of diseases after medical treatments.

보컬 녹음에서 모니터에 적용된 컴프레서가 가창에 미치는 영향 (Effects of Dynamic Compression to Listening Monitor on Vocal Recording)

  • 김시온;박재록
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권2호
    • /
    • pp.93-100
    • /
    • 2019
  • 현대 대중음악의 보컬 녹음에서 소리의 다이내믹을 압축해주는 컴프레서는 필수적인 장비이다. 컴프레서는 음악청취를 위한 믹스에서 뿐 아니라 가수가 녹음을 하는 중에 반주와 함께 자신의 목소리를 듣기 위한 모니터에 적용되기도 한다. 이 연구는 보컬 녹음에 있어 모니터 환경에 적용된 컴프레서가 가수의 가창에 미치는 영향에 대한 실험 연구다. 10명의 참여 가수를 섭외하여 블라인드 테스트로 모니터를 통해 들리는 보컬에 1:1, 2:1, 4:1의 압축 비율의 컴프레서를 걸어 가창에 어떻게 영향을 받는지를 실험하였다. 실험 결과 모니터에 적용된 압축 비율이 높을 수록 다이내믹이 큰 부분에서 더 크게 노래하고, 음색이 더 밝았지만 음정은 미세하게 부정확해지는 결과가 나타났다. 블라인드를 유지한 상황에서의 사후 인터뷰 결과 가수들은 모니터에 컴프레서를 통해 압축된 소리를 듣는 것을 대체로 선호하는 것도 발견되었다. 실험에서 사용한 음악이 다이내믹의 범위가 넓은 발라드곡이었기 때문에 모든 음악 녹음에 일반화할 수는 없지만 녹음 현장의 모니터링에 대한 중요한 시사점을 제공할 수 있을 것으로 생각한다. 또한 모니터 환경에 따른 가수의 가창에 미치는 영향에 대해 실증 연구를 통해 연구된 본 논문을 바탕으로 녹음 기술에 대한 인지과학적 접근이 추가로 이루어지기를 희망한다.

소프라노 1인의 모음곡 발성 시 제 1 포먼트의 변화양상 (The First Formant Characteristics in Vocalize of One Soprano)

  • 송윤경;진성민
    • 대한후두음성언어의학회지
    • /
    • 제16권1호
    • /
    • pp.10-14
    • /
    • 2005
  • Background and Objectives : Vowels are characterized on the basis of formant patterns. The first formant(F1) is determined by high-low placement of the tongue, and the second formant (F2) by front-back placement of the tongue. The fundamental frequency(F0) of a soprano often exceed the normal frequency of the first formant. And the vocal intensity is boosted when F0 is high and a harmonic coincides with a formant. This is called a formant tuning. Experienced singers thus learned how to tune their formants over a resonable range by lowering the tongue to maximize their vocal intensity. So, the current study aimed to identify the formant tuning in one experienced soprano by comparing the first formants of vowel [i] in three different voice production : speech, ascending scale, and vocalize. Materials and Method : All voices recordings of vowel [i] in speech, ascending scale (from F4 note to A4 note), and vocalize(:Ridente la calam") were made with digital audio tape-corder in a sound treated room. And the captured data were analyzed by the long term average(LTA) power spectrum using the FFT algorithm of the Computerized Speech Lab(CSL, Kay elementrics, Model, 4300B). Results : Although the first formant of vowel [i] in speech was 238Hz, those of ascending scale [i] were 377Hz, 405Hz, 453Hz respectively in F4(349z), G4(392Hz), A4(440Hz) note, and 722Hz, 820Hz, 918Hz respectively in F5 (698Hz), G5(784Hz), A5(880Hz) note. In vocalize, first formants of [i] were 380Hz, 398Hz, 453Hz respectively in F4, G4, A4 note, and 720Hz, 821Hz, 890Hz respectively in F5, G5, A5 note. Conclusion : These results showed that the first formant of ascending scale and vocalize sustained higher frequency than fundamental frequency in high pitch. This finding implicates that the formant tuning of vowel [i] in ascending scale was also noted in vocalize.

  • PDF

대전 원도심 소리풍경에 관한 의미론적 연구 - 대흥동 성당과 은행동 성심당 종소리를 중심으로 - (A Semantic Study on the Soundscape of the Historic Downtown of Daejeon - Focusing on the Bells of Daeheung-dong Cathedral and Enhang-dong Sungsimdang -)

  • 김명신
    • 한국조경학회지
    • /
    • 제50권2호
    • /
    • pp.64-75
    • /
    • 2022
  • 본 연구의 목적은 대전 원도심의 랜드마크이자 명소인 중구 대흥동 성당과 은행동 성심당 두 장소의 종소리가 지닌 사운드스케이프의 성격과 의미를 조명하는 것이다. 연구는 현장 답사 및 녹취, 관련 자료와 사운드스케이프 이론 등의 문헌연구에 의해 이루어졌다. 대전시는 20세기 초 일제강점기에 철도 대전역과 함께 생성된 도시로, 충남도청이 대전으로 이전하면서 대전역 인근에 위치한 중구 대흥동과 은행동 일대는 크게 발달하며 원도심을 형성하였다. 90년대에 서구로 주요 행정기관이 대거 이전하면서 대전 원도심은 쇠락의 길을 걷게 되었고 세종시 개발로 쇠락은 가속화되었다. 그런 가운데, 대흥동 성당과 한국전쟁 당시 한 피난민에 의해 설립된 성심당은 원주민들이 떠나간 대전 원도심을 굳건히 지키고 있다. 대흥동 성당은 일제 강점기에 설립되어 2019년 들어 100년의 역사를 지니게 된 지역 랜드마크로, 일제 강점기에 탄생한 대전시와 역사를 같이 하는 역사문화자산이다. 한국전쟁을 배경으로 탄생한 성심당 또한 설립 60년의 역사를 지닌 역사문화자산이자 대전 명소 1위로 선정된 지역 랜드마크이다. 인근 주택가에까지 들려오는 대흥동 성당의 종소리에서 출발한 이 탐구는, 대로 건너에 위치한 은행동 성심당의 종소리를 발견하기에 이르렀다. 본 고는 대흥동 성당과 은행동 성심당의 종소리가 시그널 사운드(signal sound)를 넘어 사운드마크(soundmark)의 성격을 지님을 머레이의 사운드스케이프 소리 범주를 통해 파악하였다. 나아가 비교적 최근의 EU 사운드스케이프 정의에 따라 두 종소리의 의미 분석을 시도했다. 두 종소리는 표층적 차원에서는 시그널사운드이지만 심층적 차원에서는 대전 원도심의 사운드마크이다. 외형적으로는 규모나 스케일, 빈도, 유명도에서 차이가 있으나, 두 종소리는 특별한 인연의 역사성과 장소성, 로컬리티와 선한 영향력 등에서 의미를 공유한다. 본 연구의 시사점은 대전 중구 원도심 도시 재생 혹은 도시 개발에서 두 장소가 시각적 랜드마크 뿐만 아니라 사운드마크로서도 지역 역사문화자산임을 밝힌 데 있다.