통합 검색 | Korea Science

심층 신경망 기반의 사운드 분류를 위한 청각 특성 추출 기술 (Auditory Feature Extraction for Sound Classification based on Deep Neural Network)

장우진;신성현;윤호원;조효진;장원;박호종
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2017년도 하계학술대회
- /
- pp.31-32
- /
- 2017
본 논문에서는 심층 신경망 기반의 사운드 분류를 위한 청각 특성 추출 기술을 제안한다. 심층 신경망은 인간의 신경망을 모델링 하기 때문에 인간의 인식을 기반으로 하는 특성을 사용한다면 더 적합한 학습을 할 수 있다. 기존 방법인 MFCC와 스펙트로그램과는 달리 스파이크그램은 인간의 청각 시스템을 기반으로 파형을 해석하는 방법이기 때문에 심층 신경망에 더 효율적인 특성이라고 할 수 있다. 따라서 본 논문에서는 사운드 분류 기술의 특성으로 스파이크그램을 이용하는 방법을 제안한다. 제안한 방법을 사용하면 MFCC와 스펙트로그램을 사용하는 것보다 더 높은 분류 성능을 얻을 수 있다.
PDF

사운드스케이프 관점에서의 '정온(靜穩)'의 의미 고찰 (Review the concept of 'Jeongwon(靜穩)' on the view point of soundscape)

장길수;백건종;박사근;신훈
- 한국소음진동공학회:학술대회논문집
- /
- 한국소음진동공학회 2007년도 춘계학술대회논문집
- /
- pp.507-510
- /
- 2007
본 연구의 목적은 소음진동규제법을 비롯한 각종 소음진동관련 규정의 목적이나 정책의 목표에 기술된 '정온'의 의미를 명확히 하는 것이다. 이를 위해 먼저 사운드스케이프 사상에서 나타난 소음의 개념과 쾌적성을 고찰하고, 관련 연구자의 '정온'에 대한 정의를 검토하였다. 그 결과 '정온'은 조용함으로서 양호한 음환경 조성의 기본 요건이지만, 그것만이 절대적 의미의 정온이 아니며 high acoustic quality의 관점에서 사람들이 선호하는 소리가 포함되고 원하지 않은 소리를 마스킹할 수 있는 유쾌한 환경까지를 포함한 상대적 의미가 되어야 함을 알 수 있었다.
PDF

사운드스케이프 디자인의 개념과 그 창조적 활동영역 (Concept of Soundscape Design and the Creative Activity Domains)

한명호
- 한국소음진동공학회:학술대회논문집
- /
- 한국소음진동공학회 2014년도 추계학술대회 논문집
- /
- pp.425-430
- /
- 2014
The purpose of this study is to establish a clear-cut concept and meaning of soundscape design through an inquiry into the various literatures on the ideologies, features and domains of soundscape design. Soundscape enables us to design various relationship through a sound in that it is important for interaction, namely the relations with sound, environment and people in a region. Soundscape design is an endogenous design which is participated in a large number of people of the region, and it contains various activities such as research study, environmental preservation, creation of sound environment and sound education.
PDF

음원 압축을 위한 다채널 MPEG 오디오 복호화기에 설계 및 구현 (Design and Implementation of Multi-channel MPEG Audio Decoder to compress Sound)

김태훈;장호근;백광렬;박주성
- 전자공학회논문지S
- /
- 제36S권5호
- /
- pp.112-121
- /
- 1999
본 연구에서는 사운드 합성에 응용할 목적으로 설계된 오디오 복호화기에 대한 내용을 담고 있다. 악기음을 ROM에 저장한 후 그 데이터를 이용하여 사운드 합성을 하는 PCM 방식에서 많은 악기음 데이터를 저장하면 할수록 더욱 좋은 음질의 사운드를 합성할 수 있다. 따라서 한정된 용량에 더욱 많은 악기음을 저장하기 위해서는 압축이 꼭 필요하다. 이를 위해서는 미리 압축한 악기음을 ROM에 저장한 후 그것을 필요시 복호화해 줄 복호화기만 있으면 된다. 그와 동시에 많은 악기음을 내기 위해서는 빠른 복호화기 필수적이다. 그래서 MPEG-1 오디오의 layer-1을 기본으로 하여 44.1 KHz의 샘플링 주파수로 32가지 악기음에 대한 실시간 복호화를 수행한다. 여기서는 음원 압축이라는 특수한 목적에 맞추어 압축의 효율성을 높이고 스스로 루프를 만들어서 합성의 편의를 제공하고 기존의 MPEG-1 오디오 layer-1에서 변형이 된 새로운 포맷과 추가된 기능에 관한 내용을 담고 있으며 이러한 복호화기를 설계하고 FPGA를 이용하여 검증하였다.
PDF

음원 트랙스토어 기반 2차 저작권 해결안 (Copyright Dispute Resolution with Musical Track Store)

이승택;김인범;박상현
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2016년도 제53차 동계학술대회논문집 24권1호
- /
- pp.123-124
- /
- 2016
음악은 원천적으로 합주가 매우 용이한 특성이 존재하므로 다수의 사람이 하나의 음악을 만들 수 있다. 따라서 자신이 기본 음악을 만든 뒤 음악 전문가가 제작한 사운드 트랙을 추가하면 음악적 품질이 쉽게 높아질 수 있다. 본 논문에서는 이러한 사운드 트랙을 쉽게 거래할 수 있는 효과적인 트랙스토어의 도입과 이에 따른 2차 저작권 침해 및 분쟁을 해결할 수 있는 방안을 제시한다. 이를 통해 전문가 수준과 버금가는 개인의 음악 제작, 유통, 소비를 활성화할 수 있고, 또한 이와 연관된 산업 및 문화의 확대 및 발전에 기여할 수 있다.
PDF

의료기기에서 생성되는 사운드 생체신호 분석을 위한 빅데이터 플랫폼 설계 (Design of Big Data Platform for Sound Bio-Signal Analysis from Medical Devices)

고광만;김성진;신정훈;윤희선
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2014년도 춘계학술발표대회
- /
- pp.932-933
- /
- 2014
최근에는 의료 빅데이터 분야에서 의료기기, 의료전문가로부터 생성 또는 감지되는 사운드 생체신호(심장박동, 호흡, 맥박, 진맥) 데이터의 특징을 디지털 데이터로 추출하여 패턴 데이터로 변환한 후, 이를 빅데이터 분석 플랫폼 기반으로 분석하여 진료, 처방, 예방 등에 유용한 정보를 생성하는 모델 구축 연구가 활성화되고 있다. 본 논문에서는 사운드 생체신호 특징을 디지털 데이터로 추출하여 (주)리아컴즈 NeoQubit 빅데이터 플렛폼을 기반으로 패턴 데이터를 분석하고 예측할 수 있는 모델을 제시한다.
https://doi.org/10.3745/PKIPS.y2014m04a.932 인용 PDF

제한된 계산량으로 가정내 음향 상황을 검출하는 사운드 이벤트 검출 시스템 개발 (Development of Sound Event Detection for Home with Limited Computation Power)

장달원;이재원;이종설
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2019년도 하계학술대회
- /
- pp.257-258
- /
- 2019
이 논문에서는 가정내 음향 상황에 대한 사운드 이벤트 검출을 수행하는 시스템을 개발하는 내용을 담고 있다. 사운드 이벤트 검출 시스템은 마이크로폰 입력에 대해서 입력신호로부터 특징을 추출하고, 특징으로부터 이벤트가 있었는지 아닌지를 분류하는 형태를 가지고 있다. 본 연구에서는 독립형 디바이스가 가정내 위치한 상황을 가정하여 개발을 진행하였다. 가정내에서 일어날 수 있는 음향 상황을 가정하고 데이터셋 녹음을 진행하였다. 데이터셋을 기반으로 특징과 분류기를 개발하였으며, 적은 계산량으로 결과를 출력해야 하는 독립형 디바이스에 활용하기 위해서 특징셋을 간소화하는 과정을 거쳤다. 개발결과는 가정의 거실환경에서 녹음된 소리를 스피커로 출력하여 테스트하였으며, 다양한 음향 상황에 대한 개발이 추가적으로 필요하다.
PDF

이미지를 이용한 사운드 그래픽 이퀄라이저의 구성에 대한 연구 (A study of sound graphic equalizer configuration using photo image)

서준석;홍성대;박진완
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2008년도 학술대회 2부
- /
- pp.430-435
- /
- 2008
IT기술의 발전과 함께 휴대용 음원 재생 기기의 보급에 따라 다양한 형대로 분화되어진 하드웨어는 다양한 형대로 발전하고 있으며, 이와 함께 청각적 정보만을 위한 하드웨어로 그 기능을 제한하지 않고 좀더 많은 정보를 사용자에게 전달하기 위한 그래픽 유저 인터페이스(GUI)의 기능이 강조되고 있다. 전자 기기를 통하여 출력되는 음원은 단순히 외부로 음을 출력하는 목적을 넘어서 음원의 분석을 통하여 사용자에게 소리에 대한 특정을 시각적 정보로 전달하는, 청각적 정보의 시각화 과정의 중요성이 강조되고 있다. 이러한 요구로 인하여 음원의 특정적 정보를 시각적으로 표현하는 것을 목적으로 하는 사운드 그래픽 이퀄라이저(Sound graphic equalizer)를 이용함에 이르게 되었다. 본 논문에서는 GUI의 한 형태인 사운드 그래픽 이퀄라이저에서 기존 방식의 막대그래프의 형태에서 벗어난, 사용자와의 피드백(Feedback)이 가능한 새로운 시각적 표현 형태를 지닌 사운드 그래픽 이퀄라이저의 대안을 찾고자 한다. 음원의 특정을 분석하여 각각의 소리에 대한 정보를 시각적으로 표현하는데 있어 새로운 형태적 구성 방안을 사운드 비쥬얼라이제이션(Sound visualization) 작품을 통하여 구성하고 각각의 음원 따라 시각적 음원 정보를 접하는 사용자의 취향에 따른 이미지를 이용하여 구성하는 개인 맞춤형 사운드 그래픽 이퀄라이저의 구축 가능성을 타진해본다. 사용자와의 소통 과정을 통한 실시간 출력 영상의 형태 적용을 통하여 사용자 친화적인 GUI 형태를 구축하는데 있어 새로운 대안을 제시하고자 한다.
PDF

사운드 마스크 필터를 이용한 수중 과도 신호 추출 (Extraction of an Underwater Transient Signal Using Sound Mask-filter)

복태훈;김주호;팽동국;이종현;배진호;김성일
- 한국음향학회지
- /
- 제31권8호
- /
- pp.532-541
- /
- 2012
수중 과도 신호는 주변 소음과는 구별된다. 과도 신호는 음향학적 특색에 따라 특징들이 다양하기 때문에 데이터베이스화가 요구된다. 이에 본 논문에서는 해양에서 국지적이고 일시적으로 존재하는 과도 신호를 추출하기위해 사운드 마스크 필터링 방법을 활용하였다. 표준 신호를 선택하여 원 음원과의 상호상관관계를 구하였다. 상호상관신호의 포락선에서 최대우도법에 의해 결정된 역치를 사용하여 과도 신호를 위한 사운드 마스크 필터를 구하였다. 사운드 마스크 필터를 활용하여, 수중 소음원에서 바다메기의 과도 신호를 추출하였다. 유사하게, 원 음원에 인위적으로 인공 신호를 추가한 신호에서 동일한 방식으로 바다메기와 인공 신호를 과도 신호로서 추출하였다. 또한 표준신호에 따라서 다르게 추출된 과도신호의 비교를 통해 표준신호 선택의 중요함을 제시하였다. 본 논문에서 제안된 사운드 마스크 필터링 방법은 해양 주변 소음원에서 과도 신호의 데이터베이스 구축에 활용될 수 있고, 특히, 임의의 신호에서 원하는 신호를 추출하는 데에 활용 가능성이 있다.
https://doi.org/10.7776/ASK.2012.31.8.532 인용 PDF KSCI

범용 디지털 신호처리기를 이용한 국악기 사운드 엔진 개발 (Sound Engine for Korean Traditional Instruments Using General Purpose Digital Signal Processor)

강명수;조상진;권순덕;정의필
- 한국음향학회지
- /
- 제28권3호
- /
- pp.229-238
- /
- 2009
본 논문에서는 TMS3320F2812 신호처리기를 이용하여 가야금과 태평소의 사운드 엔진을 구현하였다. Commuted Waveguide Synthesis (CWS) 기반의 가야금과 태평소 모델을 신호처리기에 탑재하고 악기 선택 버튼을 두어 해당 악기의 사운드 샘플을 매 일정 시간마다 합성하도록 하였다. 합성음은 SPI 통신을 이용하여 DAC로 전송되며 오디오 인터페이스를 거쳐 스피커를 통해 재생된다. 합성 모델의 지연 라인은 합성음의 피치를 조절하는데, 이 지연라인의 길이를 결정하기 위해 GPIO를 이용하여 한 샘플을 합성하는데 필요한 시간을 측정하였다. 가야금은 $28.6{\mu}s$, 태평소는 $21{\mu}s$가 소요되었다. 태평소와 가야금의 동시 발음수를 고려하였을 때 태평소는 동시 발음수 1을 가지므로 $21{\mu}s$, 가야금은 일반적으로 동시 발음수가 2이므로 $57.2{\mu}s$의 연산시간이 필요하다. 이는 실시간 연주가 충분히 가능한시간이다. 제안한 사운드 엔진의 경우, 인터럽트 서비스 루틴에서 각 사운드 샘플의 합성과 DAC로의 전송이 일어난다. 인터럽트 서비스 루틴은 시스템의 안정성을 보장하기 위해 타이머의 주기 매칭 이벤트를 이용하여 $60{\mu}s$마다 주기적으로 호출된다. 이와 같이 합성된 음을 녹음하여 원음과 스펙트럼으로 비교한 결과, 가야금은 원음과 매우 유사한 음을 합성할 수 있었고, 태평소는 '무(無), 황(黃), 태(太), 중(仲)' 음을 제외한 나머지 음에 대해서 태평소의 음색을 잘 표현하는 음을 합성 할 수 있었다.
https://doi.org/10.7776/ASK.2009.28.3.229 인용 PDF KSCI

검색결과 585건 처리시간 0.048초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)