• Title/Summary/Keyword: 음성에너지크기

Search Result 32, Processing Time 0.023 seconds

A Study on Isolated Words Speech Recognition in a Running Automobile (주행중인 자동차 환경에서의 고립단어 음성인식 연구)

  • 유봉근
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.381-384
    • /
    • 1998
  • 본 논문은 주행중인 자동차 환경에서 운전자의 안전성 및 편의성의 동시 확보를 위하여, 보조적인 스위치 조작없이 상시 음성의 입, 출력이 가능하도록 한다. 이때 잡음에 강인한 threshold 값을 구하기 위하여, 일정한 시간마다 기준 에너지와 영교차율(Zero Crossing Rate)을 변경하며, 밴드패스 필터(bandpass filter)를 이용하여 1차, 2차로 나누어 실시간 상태에서 자동으로, 정확하게 끝점검출(End Point Detection)을 처리한다. 기준패턴(reference pattern)은 DMS(Dynamic Multi-Section)을 사용하며, 화자의 변별력을 높이기 위하여 2개의 모델사용을 제안한다. 또한 주행중인 차량의 잡음환경에 강인하기 위하여 일반주행(80km/h 이내), 고속주행(80km/h 이상)등으로 나누며 차량의 가변잡음 크기에 따라 자동으로 선택하도록 한다. 음성의 특징 벡터와 인식 알고리즘은 PLP 13차와 One-Stage Dynamic Programming (OSDP)를 이용한다. 실험결과, 자주 사용되는 차량 편의장치 제어명령 33개에 대하여 중부, 영동 고속도로(시속 80Km/h 이상)에서 화자독립 89.75%, 화자종속 90.08%의 인식율을 구하였으며, 경부 고속도로에서는 화자독립 92.29%, 화자종속 92.42%의 인식율을 구하였다. 그리고 저속 주행중인 자동차 환경(80km/h 이내, 시멘트, 아스팔트 등의 서울시내 및 시외독립)에서는 화자독립 92.89%, 화자종속 94.44% 인식율을 구하였다.

  • PDF

A Study of Emotional Variation Tendency by Movie Genre Based on Speech Signal Analysis (음성신호 분석 기반의 영화 장르별 감정변화 특성 연구)

  • Yoo, Hwang-Jun;Han, Sang-Hyo;Kim, Bong-Hyun;Ka, Min-Kyoung;Cho, Dong-Uk
    • Proceedings of the KAIS Fall Conference
    • /
    • 2011.12a
    • /
    • pp.295-298
    • /
    • 2011
  • 인간의 능력 중 가장 주목할 만한 것은 언어를 습득하고 그것을 이용하여 서로 의사소통을 할 수 있다는 것이다. 모든 언어에는 그 언어만이 가지는 특수성뿐만 아니라 공통적으로 존재하는 보편적인 특성이 있다. 이것 외에도 언어 위에 입혀지는 사람의 목소리는 의사소통을 하는데 있어 상대의 심리를 파악하는 중요한 단서가 된다. 특히, 언어는 습득되어져야 활용되고 그 습득되어지는 환경에 영향을 받으며 이러한 환경에 따라 사람의 목소리, 억양 등이 변화하게 되는 것이다. 따라서 본 논문에서는 음성신호 분석 기법을 적용하여 장르별 영화시청에 따른 시각적, 청각적 요인이 목소리에 미치는 영향을 분석하는 연구를 수행하였다. 이를 위해 장르별 영화를 시청한 후 성대 진동 및 음성에너지의 크기 변화를 측정하여 감정변화를 분석하는 실험을 수행하였다.

  • PDF

Intelligibility Enhancement of Multimedia Contents Using Spectral Shaping (스펙트럼 성형기법을 이용한 멀티미디어 콘텐츠의 명료도 향상)

  • Ji, Youna;Park, Young-cheol;Hwang, Young-su
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.53 no.11
    • /
    • pp.82-88
    • /
    • 2016
  • In this paper, we propose an intelligibility enhancement algorithm for multimedia contents using spectral shaping. The dialogue signals is essential to understand the plot of audio-visual media contents such as movie and TV. However, the non-dialogue components as like sound effects and background music often degrade the dialogue clarity. To overcome this problem, this paper tries to improves the dialogue clarity of audio soundtracks which contain important cues for the visual scenes. In the proposed method, the dialogue components are first detected by soft masker based on speech presence probability (SPP) which is widely used in speech enhancement field. Then, extracted dialogue signals are applied to the spectral shaping method. It reallocate the spectral-temporal energy of speech to enhanced the intelligibility. The total energy is maintained as unchanged via a loudness normalization process to prevent saturation. The algorithm was evaluated using the modeled and real movie soundtracks and it was shown that the proposed algorithm enhances the dialogue clarity while preserving the total audio power.

On the Transmission Quality of Wide-Band Telephony (전화 대역 확장에 따른 통화품질의 변화)

  • 김정환
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.155-158
    • /
    • 1995
  • 150~7,000Hzd의 확대역 전화를 위한 전화 전송특성 설계지침으로 활용하기 위해, 확대역과 300~3400Hz 의 협대역 전화에 대한 통화품질 평가결과를 비교/분석하였다. 토화품질 평가는, 조정법에 의한 선호 라우드니스 레벨고 ㅏ동가 라우드니스 레벨 조정실험, 그리고 단음절 명료도평가로 구성되었다. 선호 라우드니스 레벨 조정실험의 결과, 협대역과 확대역 음성에 대한 피험자의 선호레벨이 각각 70.7dB 및 68.6dB로 약 2dB의 차이를, 피험자간 분산은 2.12와 6.11로 의미있는 차이를 보였는데, 이것은 음성대역의 확장에 따라 사용자들의분산이 크기 때문에 확대역 전화에서 수화음량 조절기능이 필요함을 증명한 결과이다. 그리고, 협/확대역 조건에서의 100개 단음절에 대한 명료도 실험 결과에서, 전체 명료도 점수간에는 통계적으로 의미있는 차이를 보이지 않았지만 단음절중 3,400Hz이상에서 많은 에너지를 갖는, 파열음 'ㅌ', 파찰음 'ㅈ', 'ㅉ', 'ㅊ', 그리고 마찰음 'ㅅ', 'ㅆ' 으로 시작하는 20개 단음절에 대한 부분명료도에 있어서 협대역과 확대역 조건간에 20%의 명료도 차이를 나타내었다. 또한, 비교 라우드니스 레벨 조정실험의 결과, 협대역과 확대역 사이의 평균 라우드니스 레벨 차이가 약 3.4dB (A)로 나타났는데, 이 결과는 국내 확대역 전화의 수화음량적격 설정에 지침으로 활용할 것이다.

  • PDF

Efficient Implementation of SVM-Based Speech/Music Classifier by Utilizing Temporal Locality (시간적 근접성 향상을 통한 효율적인 SVM 기반 음성/음악 분류기의 구현 방법)

  • Lim, Chung-Soo;Chang, Joon-Hyuk
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.49 no.2
    • /
    • pp.149-156
    • /
    • 2012
  • Support vector machines (SVMs) are well known for their pattern recognition capability, but proper care should be taken to alleviate their inherent implementation cost resulting from high computational intensity and memory requirement, especially in embedded systems where only limited resources are available. Since the memory requirement determined by the dimensionality and the number of support vectors is generally too high for a cache in embedded systems to accomodate, frequent accesses to the main memory occur inevitably whenever the cache is not able to provide requested data to the processor. These frequent accesses to the main memory result in overall performance degradation and increased energy consumption because a memory access typically takes longer and consumes more energy than a cache access or a register access. In this paper, we propose a technique that reduces the number of main memory accesses by optimizing the data access pattern of the SVM-based classifier in such a way that the temporal locality of the accesses increases, fully utilizing data loaded into the processor chip. With experiments, we confirm the enhancement made by the proposed technique in terms of the number of memory accesses, overall execution time, and energy consumption.

Pronunciation Influence Analysis of Carbonate Drink and Eucalyptus Fragrance by Applying Speech Signal Processing Techniques (음성신호 처리 기술을 적용한 탄산음료와 유칼립투스 발향이 발음에 미치는 영향 분석)

  • Kim, Bong-Hyun;Cho, Dong-Uk
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.37 no.5C
    • /
    • pp.420-428
    • /
    • 2012
  • One of the most important means in modern NQ emphasized smart society is the communication skill. Especially, effects on improving pronunciation accuracy, it is mostly necessary to accurately express his or her own idea due to the personal relation influence 38% of voice. For this, this paper proposed the voice influence analysis of carbonate drink and eucalyptus fragrance. In particular, in the case of carbonate drink, the amounts of drinking accumulation is verified for analysing the drinking accumulation influence. Also, eucalyptus fragrance is reported for influencing the pronunciation accuracy. For this, jitter, shimmer, pitch and intensity of voice is analyzed. Finally, we accomplish an voice analysis of quantization, objective and visualization for such carbonate drink and eucalyptus fragrance.

Attachment Energy of Janus Particles at Fluid-Fluid Interfaces (유체 계면에서 야누스 입자의 흡착 에너지)

  • Park, Bum Jun
    • Korean Chemical Engineering Research
    • /
    • v.51 no.6
    • /
    • pp.655-660
    • /
    • 2013
  • In this review, I present the configuration behaviors of various Janus particles at fluid-fluid interfaces. As a model system, Janus spheres, Janus ellipsoids, and Janus dumbbells are selected to investigate the effect of shape, size, and wettability on their configurations. In particular cases, Janus ellipsoids can adopt two distinct configurations (i.e., upright and tilted configurations) due to the presence of two energy minima in the attachment energy profile. On the contrary, a single energy minimum is found in the case of Janus dumbbells such that they adopt either the upright or tilted configuration. Interestingly, the geometric and chemical asymmetry and anisotropy in the characteristic properties of Janus dumbbells lead to an intermediate state in which the particles can rotate freely in a certain range of orientation angles.

ZnO Nanostructure Characteristics by VLS Synthesis (VLS 합성법을 이용한 ZnO 나노구조의 특성)

  • Choi, Yuri;Jung, Il Hyun
    • Applied Chemistry for Engineering
    • /
    • v.20 no.6
    • /
    • pp.617-621
    • /
    • 2009
  • Zinc oxide (ZnO) nanorods were grown on the pre-oxidized silicon substrate with the assistance of Au and the fluorine-doped tin oxide (FTO) based on the catalysts by vapor-liquid-solid (VLS) synthesis. Two types of ZnO powder particle size, 20nm, $20{\mu}m$, were used as a source material, respectively The properties of the nanorods such as morphological characteristics, chemical composition and crystalline properties were examined by X-ray diffraction (XRD), energy-dispersive X-ray spectroscopy (EDX) and field-emission scanning electron microscope (FE-SEM). The particle size of ZnO source strongly affected the growth of ZnO nanostructures as well as the crystallographic structure. All the ZnO nanostructures are hexagonal and single crystal in nature. It is found that $1030^{\circ}C$ is a suitable optimum growth temperature and 20 nm is a optimum ZnO powder particle size. Nanorods were fabricated on the FTO deposition with large electronegativity and we found that the electric potential of nanorods rises as the ratio of current rises, there is direct relationship with the catalysts, Therefore, it was considered that Sn can be the alternative material of Au in the formation of ZnO nanostructures.

Properties of Silicon Coated Fabric for Membrane Treated by Low Temperature Plasma (저온플라즈마 처리에 의한 실리콘코팅 막구조 원단의 특성변화)

  • Park, Beob;Lee, Jang-Hun;Koo, Kang
    • Proceedings of the Korean Society of Dyers and Finishers Conference
    • /
    • 2011.03a
    • /
    • pp.60-60
    • /
    • 2011
  • 막구조는 근래에 와서 대공간 구조 및 지붕구조에 가장 보편적으로 사용되는 경량 인장 구조물로 각광받고 있다. 구조용 막재는 풍하중 및 설하중에 충분히 감당할 수 있도록 강도와 내구성을 가지고 있어야 한다. 일반적으로 막구조 재는 PVC코팅 폴리에스터막, 실리콘코팅 유리섬유막, PTFE코팅 유리섬유막이 있다. 제직되는 원단의 크기가 한정되어 있기 때문에 재단 후 접착하여 제작한다. 이 때문에 이음부분이 나 재단부분에 코팅으로 인한 접착이 어려워 고온고압으로 접착을 한다. 이 연구에서는 실리콘코팅 유리섬유막의 접착시 어려움을 보완하기 위해 저온 Plasma를 이용한 처리법으로 방전에 의해 Plasma를 발생시켜 50w, 100w 출력으로 10분, 20분간 처리하여 그 결과를 접촉각과 SEM 관찰을 통해 표면처리를 관찰하였다. Plasma 처리로 인해 실리콘 표면층에 균열이 발생하고 표면이 갈라짐을 확인할 수 있었다. 접촉각측정 결과 Plasma 출력과 시간의 증가함에 따라 접촉각은 감소하였다. 실리콘코팅 원단에 저온 Plasma 처리한 후 표면 특성을 분석하고 원단을 접착을 시켜 박리 강도를 측정함으로써 막구조 원단의 접착력 향상에 대한 연구를 진행하였다. KS K 0533 접착포의 박리 강도 시험방법으로 실리콘코팅 원단의 박리 강도를 측정한 결과 플라즈마 처리 원단이 플라즈마 미처리 원단보다 박리 강도가 향상된 것을 확인할 수 있었다. 저온 Plasma 처리 시간이 증가할수록 표면의 젖음성을 향상시켜 접촉각을 낮추었다. 이는 곧 표면에너지의 증가를 뜻하는 것으로 접착력을 증가시켜 실리콘코팅 원단의 접착성을 시킴으로써 강한 강도와 내구성을 갖춘 막구조물의 개발에 기대되고 있다.

  • PDF

램제트 엔진에서의 화염 전파와 비정상 연소 현상에 관한 수치해석

  • ;Vigor Yang
    • Proceedings of the Korean Society of Propulsion Engineers Conference
    • /
    • 2000.04a
    • /
    • pp.10-10
    • /
    • 2000
  • 램제트 엔진은 비추력이 높고 추력 레벨은 낮으므로, 2단 추진기관에 적합한 추진 시스템이다. 1단-추진기관의 작동이 끝나고, 2단 램제트 엔진이 점화 후 안정된 연소에 도달되기까지 비행체의 속도는 항력에 의하여, 초당 약 마하수 0.1 정도씩 감소된다. 1단 연소 후 2단 램제트로 전환되는 지연시간이 길수록 1단에서 요구되는 종말 가속도는 증가되므로, 1단이 차지하게되는 부피는 증가되고 비행체의 크기 또한 늘어나게 된다. 따라서 1단에서 2단 램제트로 천이되는데 소요되는 시간을 가능한 짧게 하는 것이 효과적이다. 그러나 램제트 엔진의 특성상 선결되어야할 다음과 같은 여러 문제들이 있다. 첫째, 1단 작동 시 공기 흡입구와 연소실은 차단벽으로 분리되어 있다가, 1단 연소후 차단막이 제거되어 외부공기가 램제트 연소실로 흡입된다. 흡입되는 공기는 흡입구의 형상에 의하여 램 압축되지만 초음속으로 연소실을 통과하게된다. 연료 주입 구에서 공급되는 연료는 연소실에서 유동의 흐름방향(streamline)에 따라서 연소실로 확산되는데, 연소되기 전에는 유속이 빠르게 노즐로 빠져 나가므로 램제트 연료가 재순환 구역(recirculation zone)으로 침투하는데 쉽지가 않다. 둘째, 연소실 입구에서 발생되는 와류 (ring vortex)는 1단 연료의 고온 연소 가스를 연소실로 확산시키는데, 비 균일한 온도 분포를 유발하여 램제트 연료의 점화에너지가 공급되는 시간이 적당하지 않을 경우 균일한 화염 전파에 악영향을 준다. 셋째, 연소실에서의 빠른 유동 조건은 연료가 연소실에 머무를 수 있는 시간을 감소시키며, 연소실 입구에서 강한 전단 응력이 발생되어 화염이 안정화되는데 악 영향을 미치게된다. 본 논문은 공기 흡입구, 연소실 및 노즐을 통합하여 수치해석을 하였으며 열유동/점화/연소등의 미케니즘을 이해하고, 주요 인자들 중 와류의 영향에 초점을 맞추었다.다고 판단되며 배기 가스 자체에 대기 공기중에 함유되어 있던 습기가 얼어붙는(Icing화) 문제가 발생하기 때문에 배기가스의 Icing을 방지하기 위하여 압축기 끝단에서 공기를 추출하여 배기부분에 송출할 필요성이 있는 것으로 판단되었다. 출구가스의 기체 유동속도가 매우 빠르므로 (100-l10m.sec) 이를 완화하기 위한 디퓨저의 설계가 요구된다고 판단된다. 또 연소기 후방에 물을 주입하는 경우 열교환기 및 기타 부분품에 발생할 수 있는 부식 및 열교환 효율 저하도 간과할 수 없는 문제로 파악되었다. 이러한 기술적 문제가 적절히 해결되는 경우 비활성 가스 제너레이터는 민수용으로는 대형 빌딩, 산림, 유조선 등의 화재에 매우 적절히 사용되어 질 수 있을 뿐 아니라 군사적으로도 군사작전 중 및 공군 기지의 화재 그리고 지하벙커에 설치되어 있는 고급 첨단 군사 장비 등의 화재 뿐 아니라 대간첩작전 등에 효과적으로 활용될 수 있을 것으로 판단된다.가 작으며, 본 연소관에 충전된 RDX/AP계 추진제의 경우 추진제의 습기투과에 의한 추진제 물성 변화는 미미한 것으로 나타났다.의 향상으로, 음성개선에 효과적이라고 사료되었으며, 이 방법이 편측 성대마비 환자의 효과적인 음성개선의 치료방법의 하나로 응용될 수 있으리라 생각된다..7%), 혈액투석, 식도부분절제술 및 위루술·위회장문합술을 시행한 경우가 각 1례(2.9%)씩이었다. 13) 심각한 합병증은 9례(26.5%)에서 보였는데 그중 식도협착증이 6례(17.6%), 급성신부전증 1례(2.9%), 종격동기흉과 폐염이 병발한 경우와 폐염이 각 1례(2.9%)였다. 14) 식도경 시행회수는 1회가 17례(54.8%), 2회가 9례(29.0%), 3회 이상이 5례(16.1%)였다.EX>$IC_{50}$/ 값이 210 $\mu\textrm{g}$/$m\ell$로서 효과적

  • PDF