• Title/Summary/Keyword: 음성효율

Search Result 870, Processing Time 0.027 seconds

Integration of Computer-Aided Diagnosis, Speech Recognition and Picture Archiving and Communication (컴퓨터지원진단, 음성인식과 의료영상저장전송시스템의 통합)

  • 김진철;이우주;임옥현;이배호
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11a
    • /
    • pp.224-227
    • /
    • 2003
  • 컴퓨터와 공학 분야에서의 빠른 기술적 진보는 의료정보의 처리에 있어 새로운 패라다임을 제시함으로써 의료정보사회의 변화를 가속화시키고 있다. 본 논문에서는 단일 플랫폼에서 운영하기 위한 컴퓨터지원진단, 음성인식과 의료영상저장전송시스템의 통합을 제안한다. 단일 플랫폼에서 운영되는 통합시스템은 세 시스템의 장점을 최대로 하는 향상과 시너지효과를 가져왔다. 컴퓨터지원진단과 음성인식은 시간과 비용 절감 면에서 두드러진 개선을 가져왔으며, 제안한 시스템은 병원의 디지털화와 병원경영의 효율을 높일 수 있을 것이다.

  • PDF

Construction of Dialogue Corpus and Structured Documentation of Annotation Information (대화 코퍼스의 구축 및 주석 정보의 구조적 문서화)

  • 강창규;김영일;김봉완;이용주
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11a
    • /
    • pp.269-272
    • /
    • 2003
  • 음성인식의 연구 대상은 낭독음성에서 대화음성으로 발전해가고 있다. 이를 위해서는 대량의 대화코퍼스가 필요하다. 그러나 아직 충분한 양의 대화코퍼스가 구축되어 있지 못하며 코퍼스의 주석 정보 또한 복잡하고 다양하게 표현하고 있어 효율적인 활용이 어렵다. 따라서 본 논문에서는 대화 영역으로 텔래뱅킹 영역을 설정하고 대화코퍼스를 구축하여 구축된 대화코퍼스의 주석 정보를 XML(Extensible Markup Language)로 표준화할 수 있도록 DTD(Document Type Definition)를 정의하여 문서 구조화하였다.

  • PDF

A VOICEDIUNVOICED DECOMPOSITION OF SPEECH BASED ON MAXIMUM LIKELIHOOD METHOD (ML 기반의 음성의 유/무성음 성분 분리)

  • 강명구
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.475-478
    • /
    • 1998
  • 음성에 공존하는 유/무성음 성분을 추정하는 알고리즘을 제안하였다. 유성음 성분은 주기성을 띤 사인곡선의 형태로 표현되며, 무성음 성분은 자동회기의 결과로 표현된다. 두 성분을 각각 차례대로 추정할 경우 한 성분에 대한 추정치의 정확도가 나머지 성분의 추정에도 영향을 주기 때문에 제안된 알고리즘은 두 성분을 공동으로 추정한다. 실제 ML 추정치는 구하기 어려워 이에 근접하는 추정치를 선형 방정식들을 interative 방법으로 풀어 구현하였다. 예비 시험결과 제안한 알고리즘이 정확하고 효율적으로 두 성분을 추정함을 알 수 있었고, 합성된 데이터 뿐만 아니라 실제 음성 데이터를 이용한 실험에서도 좋은 결과를 보여주었다.

  • PDF

A Dynamic Channel Allocation for Hierarchical Cellular Systems. (계층구조 셀룰러 시스템하에서의 동적채널할당방법)

  • 김정기
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 1998.10a
    • /
    • pp.82-85
    • /
    • 1998
  • 본 논문에서는 음성호 및 데이터호를 동시에 서비스하는 계층구조를 가지는 CDMA 셀룰러 시스템에서 트래픽 특성을 고려한 효율적인 채널 할당 알고리듬을 제안한다. 제안된 채널할당 알고리듬은 첫째, 계층구조를 가지는 셀룰러 시스템에서 호의 종류를 음성호와 데이타호로 나누고 트래픽의 특성을 분석한다. 둘째, 위에서 구한 트래픽 특성을 바탕으로 핸드오프와 신규호 블록킹확률을 최소로 하기 위하여 마이크로셀에서 매크로셀로 오버플로우 시키는 방식을 적용한다. 셋째, 신규화와 핸드오프호의 블록킹 확률을 구하고 QoS를 만족시키는 음성호와 데이터호의 채널분배 방법을 제시하여 시스템의 성능을 향상시키고자 한다.

  • PDF

A Pitch Contour Retrieval Algorithm Using Voice Input (음성 입력에 의한 음곡선 검색 알고리즘)

  • 이호선
    • Proceedings of the KAIS Fall Conference
    • /
    • 2000.10a
    • /
    • pp.339-347
    • /
    • 2000
  • 본 논문은 디지털 음악 도서관에서 입력된 음성을 인식하여 생성한 음곡선에 의해 임의의 음악정보를 효율적으로 검색하기 위한 알고리즘을 제안한다. 종래의 전형적인 음악정보 검색 항목인 제목이나 작곡자 또는 주제를 입력하는 것이 아니라, 사용자가 음악 데이터베이스로부터 검색하고자 하는 음악의 일부를 마이크를 통해서 노래한다. 그러면 입력된 음성에 대한 음 신호를 처리하여 음표정보를 인식하고, 이를 바탕으로 음정 곡선을 생성하여 이를 탐색 패턴으로 사용한다. 제안한 검색 알고리즘은 일반적으로 근사 탐색을 위해 많이 사용하는 동적 프로그래밍 방법과 함께 실험을 통해 탐색 시간을 비교하여 향상된 탐색 시간을 보인다.

Voice Recognition Performance Improvement using the Convergence of Bayesian method and Selective Speech Feature (베이시안 기법과 선택적 음성특징 추출을 융합한 음성 인식 성능 향상)

  • Hwang, Jae-Chun
    • Journal of the Korea Convergence Society
    • /
    • v.7 no.6
    • /
    • pp.7-11
    • /
    • 2016
  • Voice recognition systems which use a white noise and voice recognition environment are not correct voice recognition with variable voice mixture. Therefore in this paper, we propose a method using the convergence of Bayesian technique and selecting voice for effective voice recognition. we make use of bank frequency response coefficient for selective voice extraction, Using variables observed for the combination of all the possible two observations for this purpose, and has an voice signal noise information to the speech characteristic extraction selectively is obtained by the energy ratio on the output. It provide a noise elimination and recognition rates are improved with combine voice recognition of bayesian methode. The result which we confirmed that the recognition rate of 2.3% is higher than HMM and CHMM methods in vocabulary recognition, respectively.

An Efficient Voice Activity Detection Method using Bi-Level HMM (Bi-Level HMM을 이용한 효율적인 음성구간 검출 방법)

  • Jang, Guang-Woo;Jeong, Mun-Ho
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.10 no.8
    • /
    • pp.901-906
    • /
    • 2015
  • We presented a method for Vad(Voice Activity Detection) using Bi-level HMM. Conventional methods need to do an additional post processing or set rule-based delayed frames. To cope with the problem, we applied to VAD a Bi-level HMM that has an inserted state layer into a typical HMM. And we used posterior ratio of voice states to detect voice period. Considering MFCCs(: Mel-Frequency Cepstral Coefficients) as observation vectors, we performed some experiments with voice data of different SNRs and achieved satisfactory results compared with well-known methods.

A New Morphological Analysis for the Spoken Language Translation System (음성언어 번역 시스템을 위한 새로운 형태소 분석)

  • 양승원;김재훈
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.4
    • /
    • pp.17-22
    • /
    • 1999
  • It is difficult to integrate the speech processing systems and machine translation system in the spoken language translation system by reason that each system uses its own data and basic processing unit. So, we need a common I/O unit which is used in the whole system. In this paper, we propose a Pscudo-Morpheme as the interface between speech processing systems and language translation system. We implement a morphological analysis system for Pseudo-morpheme. The speech processing system using this pseudo-morpheme can get better result than other systems using the phrase or the general morpheme. So, the quality of the whole spoken language translation system can be improved. The analysis-ratio of our implemented system is 98.9%. This is similar to the common morphological analysis systems.

  • PDF

Audio Mixer Algorithm for Enhancing Speech Quality of Multi-party Audio Telephony (다자간 음성통화 품질 향상을 위한 오디오 믹서 알고리즘)

  • Ryu, Sang-Hyeon;Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • v.32 no.6
    • /
    • pp.541-547
    • /
    • 2013
  • The speech quality of multi-party audio telephony between two, three or more participants is decreased by audio volume imbalance, audio volume saturation and noise level increase. To solve this issue, this paper proposes an advanced audio mixing algorithm for software-based multi-point control unit. Our approach is based on the combined voice activity detection and gain control technique that consists of a set of algorithms that classify audio signals, estimate audio volumes, adjust gain factors and mix audio signals of all channels. The proposed audio mixing algorithm is computationally efficient, delivers high-quality speech, and is suitable for use in any practical multi-party audio telephony.