• 제목/요약/키워드: Speech rate

검색결과 1,245건 처리시간 0.029초

HMM의 출력확률을 이용한 신경회로망의 성능향상에 관한 연구 (A study on performance improvement of neural network using output probability of HMM)

  • 표창수;김창근;허강인
    • 융합신호처리학회논문지
    • /
    • 제1권1호
    • /
    • pp.1-6
    • /
    • 2000
  • 본 논문은 HMM(Hidden Markov Model)을 이 용하여 인식을 수행할 경우의 오류를 최소화 할 수 있는 후처리 과정으로 신경망을 결합시켜 HMM 단독으로 사용하였을 때 보다 높은 인식률을 얻을 수 있는 HMM과 신경망의 하이브리드 시스템을 제안한다 HMM을 이용하여 학습한 후 학습에 참여하지 않은 데이터를 인식하였을 때 오인식 데이터를 정인식으로 인식하도록 HMM의 출력으로 얻은 각 출력확률을 후처리에 사용될 신경망의 학습용으로 사용하여 신경망을 학습하여 HMM과 신경망을 결합한 하이브리드 시스템을 만든다 이와 같은 HMM과 신경망을 결합한 하이브리드 모델을 사용하여 단독 숫자음에서 실험한 결과 HMM 단독으로 사용하였을 때 보다 MLP에서는 약 $4.5\%$ RBFN에서는 약 $2\%$의 인식률 향상이 있었다. 기존의 하이브리드 시스템이 갖는 많은 학습시간이 소요되는 문제점과 실시간 음성인식시스템을 구현할 패의 학습데이터의 부족으로 인한 인식률 저하를 해결할 수 있는 방법임을 확인할 수 있었다

  • PDF

프레임 크기가 작은 터보 코드의 복잡도에 대한 성능 분석 (Performance analysis on the complexity of turbo code with short frame sizes)

  • 김연구;고영훈;김남
    • 한국통신학회논문지
    • /
    • 제24권7A호
    • /
    • pp.1046-1051
    • /
    • 1999
  • PCCC(Parallel Concatenated Convolutional Codes: 터보 코드)는 블록 크기가 크면 클수록 성능이 우수한 것으로 잘 알려져 있다. 본 논문은 차세대 이동 통신 시스템에서 프레임 크기가 작은 음성/제어 프레임을 이용하여 터보 코드의 성능을 검증하여 보고, 비슷한 디코딩 복잡도에 터보 코드와 컨벌루션 코드의 성능과 시스템에 적용하기 위한 조건들을 고려하였다. 그 결과 터보 코드는 프레임 크기가 작은 조건에서 반복 횟수 3회만으로도 차세대 통신 시스템에 적합한 10-3이상의 좋은 성능을 나타내었다. 그러나, 10-3의 BER을 기준으로 비슷한 복잡도를 고려하였을 때는 부호화율이 1/2인 터보 코드(K = 5)의 성능은 낮은 Eb/N0에서 컨벌루션 코드(K = 9)보다 우수하고, K = 3인 터보 코드의 성능은 K = 7인 컨벌루션 코드보다 우수하였다. 또한 부호화율이 1/3인 경우 K = 3 또는 5인 터보 코드가 부호화율이 1/2인 터보 코드와 비슷한 성능을 나타내었다.

  • PDF

영화 <블라인드 사이드 Blind Side>에 나타난 '드라마' 장르의 미국 문화 특성 (The cultural characteristic of American film (genre drama) in )

  • 한용택;우정권
    • 비교문화연구
    • /
    • 제26권
    • /
    • pp.273-296
    • /
    • 2012
  • The purpose of this paper is to examine the characteristics of American film (genre drama) through the analysis of , which merits our attention because the proportion of domestic gross earnings to foreign gross earnings is four to one. It means that the cultural discount rate of this film is relatively higher than the films which belong to the other genres, for example adventure, action, fantasy, SF etc. And it would be correct to say that this film is typically american. What is the reason of this difference of cultural discount rate? And what allows this film to be defined as a typical American film. The analysis of shows that the difference doesn't result from the actant structure. In fact the narrative structure of this film is similar to the other films of drama genre like or : the common structure of drama genre is characterized by an encounter of sujet and adjuvant and the progress of their relationship. But the drama is a genre in which the reflection of the actualities is important as compared with other genres. In that sense the story of is based upon the American cultural characteristics. Because the process that realize the progress of relationship between two protagonists is typically American such as race problem, adoption system, concept of family, system of education and going to college etc. As a result it is possible that move less the worldwide spectators than the American spectators.

Signal Enhancement of a Variable Rate Vocoder with a Hybrid domain SNR Estimator

  • Park, Hyung Woo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.962-977
    • /
    • 2019
  • The human voice is a convenient method of information transfer between different objects such as between men, men and machine, between machines. The development of information and communication technology, the voice has been able to transfer farther than before. The way to communicate, it is to convert the voice to another form, transmit it, and then reconvert it back to sound. In such a communication process, a vocoder is a method of converting and re-converting a voice and sound. The CELP (Code-Excited Linear Prediction) type vocoder, one of the voice codecs, is adapted as a standard codec since it provides high quality sound even though its transmission speed is relatively low. The EVRC (Enhanced Variable Rate CODEC) and QCELP (Qualcomm Code-Excited Linear Prediction), variable bit rate vocoders, are used for mobile phones in 3G environment. For the real-time implementation of a vocoder, the reduction of sound quality is a typical problem. To improve the sound quality, that is important to know the size and shape of noise. In the existing sound quality improvement method, the voice activated is detected or used, or statistical methods are used by the large mount of data. However, there is a disadvantage in that no noise can be detected, when there is a continuous signal or when a change in noise is large.This paper focused on finding a better way to decrease the reduction of sound quality in lower bit transmission environments. Based on simulation results, this study proposed a preprocessor application that estimates the SNR (Signal to Noise Ratio) using the spectral SNR estimation method. The SNR estimation method adopted the IMBE (Improved Multi-Band Excitation) instead of using the SNR, which is a continuous speech signal. Finally, this application improves the quality of the vocoder by enhancing sound quality adaptively.

Steri-Oss 임플랜트의 임상 결과에 관한 연구 (A STUDY OF CLINICAL RESULTS ON STERI-OSS ENDOSSEOUS IMPLANTS)

  • 민영규;권혁신;정재헌
    • 대한치과보철학회지
    • /
    • 제36권2호
    • /
    • pp.258-272
    • /
    • 1998
  • This investigation evaluated patients who received Steri-Oss implants from the Dental Hospital of Chosun University during the period from March 1989 to August 1997. 346 fixtures of 127 patients were included in this study. The results were as follows ; 1.The follow-up period was defined as the period between the surgical placement of the implants and the last follow-up examination. The mean follow-up period was $2.17{\pm}1.21$ years. 2.The period between fixture installation and second surgery was $0.71{\pm}0.44$ years in the maxilla and $0.46{\pm}0.21$ years in the mandible. 3.The number of fixtures which were installed in the upper jaw(112) was less than that in the lower jaw(234) and in the posterior region(260) was more than in the anterior region(86). 4.The length of fixture which was most frequently used was 12 mm and least was 8mm. Screw implants were installed more than cylindrical implants. 3.8mm implant was the most common implans, followed by 4.5mm and 3.25mm. 5.The number of augmentation cases was more than that of non-augmentation cases and the rate of augmentation cases in the maxilla was more than that in the mandible. 6.Implant restorations for partial edentulos patients(94cases) were more than single- tooth implant restorations(33cases) or implant restorations for complete edentulos patients(10cases). 7.Free-standing prostheses for partially edentulous patients were more commom than any other type of connection between implants and natural teeth. 8.Plaque Index($0.95{\pm}0.74$) and Gingival Index($0.31{\pm}0.52$) were very similar around the natural teeth and reflected an acceptable level of plaque and gingivitis control. Mean value for keratinized mucosa index($1.93{\pm}1.20$) remained fairly constant around level 2(1-2 mm keratinized epithelium). 9.Patients were generally satisfied with implant in terms of comfort, function, speech and esthetics. 10.There was not a statistically significant differences in overall survial rate between implants placed in the maxilla (91.5%) and those placed in the mandible (93.8%). Fourteen implants lost before the prosthetic rehabilitation and eleven implants lost following variable periods in function after the prosthetic phase of the treatment. 11.Cause of implant failures was exfoliation or removal of fixture due to non-osseointegration before the prosthetic rehabilitation or due to fracture of fixture, masticatory pain after the prosthetic rehabilitation. 12.The survival rate of Steri-Oss implants using the Kaplan-Meier statistical analysis was 93.8% at 2 year and 86.6% at 5 year, In all cases, implant losses occured predominantly in the healing period. There was a steep decline in the rate of implant loss after the first year. 13.The survival rate of Steri-Oss implants in the anterior region was 94.8% at 2 year and 94.8% at 5 year and that in the posterior region was 92.8% at 2 year and 75.9% at 5 year. In conclusion, this study revealed a number of parameters and guidelines for achieving an optimal success rate in osseointegration.

  • PDF

입 모양 인식 시스템 전처리를 위한 관심 영역 추출과 이중 선형 보간법 적용 (Region of Interest Extraction and Bilinear Interpolation Application for Preprocessing of Lipreading Systems)

  • 한재혁;김용기;김미혜
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.189-198
    • /
    • 2024
  • 입 모양 인식은 음성 인식의 중요 부분 중 하나로 음성 인식을 위한 입 모양 인식 시스템에서 입 모양 인식 성능을 개선하기 위한 여러 연구가 진행됐다. 최근의 연구에서는 인식 성능을 개선하기 위해 입 모양 인식 시스템의 모델 구조를 수정하는 방법이 사용됐다. 본 연구에서는 모델 구조를 수정하는 것으로 인식 성능을 개선하는 기존의 연구와 달리 모델 구조의 변화 없이 인식 성능을 개선하는 것을 목표로 한다. 모델 구조의 수정 없이 인식 성능을 개선하기 위해, 사람이 하는 입 모양 인식에서 사용되는 단서를 참고해 입 모양 인식 시스템의 기존 관심 영역인 입술 영역과 함께 턱, 뺨과 같은 다른 영역을 관심 영역으로 설정하고 각 관심 영역의 인식률을 비교해 가장 높은 성능의 관심 영역을 제안한다. 또한, 관심 영역 크기를 정규화하는 과정에서 보간법의 차이로 인해 발생하는 정규화 결과의 차이가 인식 성능에 영향을 준다고 가정하고 최근접 이웃 보간법, 이중 선형 보간법, 이중 삼차 보간법을 사용해 동일한 관심 영역을 보간하고 각 보간법에 따른 입 모양 인식률을 비교해 가장 높은 성능의 보간법을 제안한다. 각 관심 영역은 객체 탐지 인공신경망을 학습시켜 검출하고, 각 관심 영역을 정규화하고 특징을 추출하고 결합한 뒤, 결합된 특징들을 차원 축소한 결과를 저차원 공간으로 매핑하는 것으로 동적 정합 템플릿을 생성했다. 생성된 동적 정합 템플릿들과 저차원 공간으로 매핑된 데이터의 거리를 비교하는 것으로 인식률을 평가했다. 실험 결과 관심 영역의 비교에서는 입술 영역만을 포함하는 관심 영역의 결과가 이전 연구의 93.92%의 평균 인식률보다 3.44% 높은 97.36%의 평균 인식률을 보였으며, 보간법의 비교에서는 이중 선형 보간법이 97.36%로 최근접 이웃 보간법에 비해 14.65%, 이중 삼차 보간법에 비해 5.55% 높은 성능을 나타내었다. 본 연구에 사용된 코드는 https://github.com/haraisi2/Lipreading-Systems에서 확인할 수 있다.

SVM Based Speaker Verification Using Sparse Maximum A Posteriori Adaptation

  • Kim, Younggwan;Roh, Jaeyoung;Kim, Hoirin
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제2권5호
    • /
    • pp.277-281
    • /
    • 2013
  • Modern speaker verification systems based on support vector machines (SVMs) use Gaussian mixture model (GMM) supervectors as their input feature vectors, and the maximum a posteriori (MAP) adaptation is a conventional method for generating speaker-dependent GMMs by adapting a universal background model (UBM). MAP adaptation requires the appropriate amount of input utterance due to the number of model parameters to be estimated. On the other hand, with limited utterances, unreliable MAP adaptation can be performed, which causes adaptation noise even though the Bayesian priors used in the MAP adaptation smooth the movements between the UBM and speaker dependent GMMs. This paper proposes a sparse MAP adaptation method, which is known to perform well in the automatic speech recognition area. By introducing sparse MAP adaptation to the GMM-SVM-based speaker verification system, the adaptation noise can be mitigated effectively. The proposed method utilizes the L0 norm as a regularizer to induce sparsity. The experimental results on the TIMIT database showed that the sparse MAP-based GMM-SVM speaker verification system yields a 42.6% relative reduction in the equal error rate with few additional computations.

  • PDF

변형된 Dynamic Averaging 방법을 이용한 단독어인식 (Isolated Word Recognition using Modified Dynamic Averaging Method)

  • 정의봉;고영혁;이종악
    • 한국음향학회지
    • /
    • 제10권2호
    • /
    • pp.23-28
    • /
    • 1991
  • 본 논문을 특정화자에 대한 단독어 음성 인식에 대한 연구이다. 우리는 표준패턴으로서 변형된 dynamic linear averaging 방법을 이용한 DTW 음성 인식 시스템을 제안한다. 57개의 모든 도시명이 인식 대상 어휘로 선정되었고 12차 LPC cepstram 계수를 특징계수로 사용하였다. 이 논문은 표준패턴으로 변형된 dynamic linear averaging 방법을 이용하여 인식 실험을 한것 이외에도 같은 데이터 같은 조건상에서 causal 방법과 dynamic averaging방법, linear averaging방법, clustering 방법을 이용하여 실험하였다. 실험결과로 변형시킨 dynamic linear averaging 방법을 이용한 DTW 음성인식이 97.6%로 가장 좋은 인식율을 보였다.

  • PDF

효율적인 다채널 구현을 위한 ITU-T G.723,1 음성 부호화기 고속 알고리듬 제안 (A Proposal of fast Algorithms of ITU-T G.723.1 for Efficient Multichannel Implementation)

  • 정성교;박영철;윤성완;차일환;윤대희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.67-70
    • /
    • 2000
  • 최근 들어, 인터넷의 폭넓은 보급과 급속한 대중화에 따라 네트워크를 통하여 음성을 전송하거나 저장하려는 시도가 많이 이루어지고 있다. 본 논문에서는 네트워크를 통한 멀티미디어 전송에서 음성부호화 표준으로 널리 상용되는 ITU-T G.723.1 dual-rate speech coder의 효율적인 다채널 구현을 위한 고속 알고리듬을 제안한다. 고속 알고리듬은 부호화 과정에서 많은 계산량을 차지하는 적응 코드북 검색과 고정 코드북 검색 과정에 적용된다. 적응 코드북 검색 과정에서는 지연과 이득을 동시에 찾는 기존의 방법 대신, 지연과 이득을 순차적으로 검색함으로써 계산량을 개선하였다. 전송률에 따라 다른 알고리듬을 사용하는 고정 코드북 검색 과정에서는 다음과 같은 고속 알고리듬을 제안한다. MP-MLQ(Multi-Pulse Maximum Likely Quantization) 방법을 사용하는 높은 전송률(6.3 kbit/s)인 경우, 펄스를 등 간격으로 검색함으로써 계산량을 줄였다. ACELP(Algebraic CELP) 방법을 사용하는 낮은 전송률(5.3 kbit/s)인 경우는 기존의 nested-loop 검색방법 대신, 펄스를 쌍으로 나누어 순차적으로 찾는 depth-first tree 검색 방법을 적용하여 계산량을 감소시켰다. 제안된 고속 알고리듬에 대해 주관적 음질 평가 방법을 수행한 결과, 제안된 방법이 기존의 방법에 비해 음질의 저하가 없음을 확인하였다. 고정 소수점 DSP인 TMS320C6201을 사용하여 고속 알고리듬을 구현한 결과, 높은 전송률의 경우에는 10.29 MIPS, 낮은 전송률의 경우에는 8.70 MIPS의 연산량으로 구현 가능함을 확인하였다.

  • PDF

노인 주간보호시설의 운영, 인력, 서비스 현황 (The Current Status of Adult Day Care in Korea - Operation, Staffing, and Service -)

  • 박연환
    • 대한간호학회지
    • /
    • 제37권4호
    • /
    • pp.613-623
    • /
    • 2007
  • Purpose: The purpose of this study was to describe the operation, staffing, and services provided at adult day care centers in Korea. Methods: The study was a cross-sectional descriptive survey. The subjects were 209 centers among 280 centers registered in Korea (response rate 74.6%). The data was collected from August to December in 2006. Results: 48.8% of centers were located in a city area. The centers were based on the Social Model 65.5% of the centers were open Monday to Friday, an average of $7{\sim}8$ hours per day Dementia, stroke or frail elderly could use the center, and 57.4% of centers were used for dementia and stroke elderly together. The enrollment of elderly was 13.5. The number of total staff was 8.27, the number of RN's and social workers was 0.67, and 2.54 respectively. The social services(Meal preparation 98.6%, Special event 98.1%, Transportation, 97.1%) were provided more than the health services(Physical therapy 98.1%, ADL training 95.2%, Counseling 84 7%, Vaccination 82.8%, Health monitoring 78.9%, Health education 78.5%, Bathing 66.1%, and Speech therapy 28.2%). Conclusion: These results suggest we have to develop a health-focused adult day health care model based on the needs of elderly and their families. Nurses will have an important role in adult day health care.