• Title/Summary/Keyword: Recognition Improvement

검색결과 1,496건 처리시간 0.028초

남녀성별 분류를 위한 화자종속 음성인식 알고리즘 (Speaker-dependent Speech Recognition Algorithm for Male and Female Classification)

  • 최재승
    • 한국정보통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.775-780
    • /
    • 2013
  • 본 논문에서는 백색잡음 및 자동차잡음 환경 하에서 남녀 성별인식이 가능한 신경회로망에 의한 화자종속 음성인식 알고리즘을 제안한다. 본 논문에서 제안한 음성인식 알고리즘은 남성화자 및 여성화자를 인식하기 위하여 LPC 켑스트럼 계수를 사용하여 신경회로망에 의하여 학습된다. 본 실험에서는 백색잡음 및 자동차잡음에 대하여 총 6개의 신경회로망의 네크워크에 대한 인식결과를 나타낸다. 인식실험의 결과로부터 백색잡음에 대해서는 최대 96% 이상의 인식률, 자동차잡음에 대해서는 최대 88% 이상의 인식률을 구하였다. 마지막으로 본 실험에서는 제안하는 음성인식 알고리즘이 배경잡음 환경 하에서의 기존의 음성인식 알고리즘과 비교하여 본 방식의 알고리즘이 유효하다는 것을 실험으로 확인한다.

Glottal flow 신호에서의 향상된 특징추출 및 다중 특징파라미터 결합을 통한 화자인식 성능 향상 (Performance Improvement of Speaker Recognition Using Enhanced Feature Extraction in Glottal Flow Signals and Multiple Feature Parameter Combination)

  • 강지훈;김영일;정상배
    • 한국정보통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2792-2799
    • /
    • 2015
  • 본 논문에서는 화자 인식의 성능을 개선하기 위해서 glottal flow로부터 source mel-frequency cepstral coefficient (SMFCC), 왜도, 첨도를 추출하여 활용하였다. 일반적으로 glottal flow의 고주파 대역은 응답의 크기가 평탄하므로 미리 정한 차단주파수 미만에 대해서만 SMFCC를 추출한다. 추출된 SMFCC, 왜도, 첨도는 종래의 특징 파라미터와 결합된 후 종래의 화자인식 시스템과 동등한 조건에서의 성능 비교를 위하여 principal component analysis (PCA) 및 linear discriminiat analysis (LDA)를 통한 차원축소가 행해진다. 대용량의 화자인식 실험결과를 통해서 제안된 인식 시스템이 종래의 화자인식 시스템 보다 더 좋은 성능을 나타냄을 확인할 수 있었으며, 특히 가우시안 혼합이 낮을 때 더 높은 성능향상을 나타내었다.

A Qualitative Study on Job Satisfaction of Dental Hygienists with Low Experience

  • Park, Ji-Hyeon;Lim, Soon-Ryun
    • 치위생과학회지
    • /
    • 제20권3호
    • /
    • pp.163-170
    • /
    • 2020
  • Background: Job satisfaction of dental hygienists has been discussed continuously in dental hygiene research. It has been the most representative performance variable in dental and human resource management. However, in quantitative research, most of the studies have analyzed the causal relationship with variables related to dental hygienists' job satisfaction. The existing qualitative research contains only the studies that targeted dental hygienists with an experience of more than 10 years. The present study aimed to understand and to characterize the job satisfaction of dental hygienists with an experience of 2 to 10 years and to compare it with the qualitative research on dental hygienists with an experience of 10 or more years. Methods: An in-depth interview of dental hygienists with 2 to 10 years of experience working in 10 dental clinics was conducted. For data analysis, Giorgi's analysis method was used. Results: After analyzing the meaning of job satisfaction of dental hygienists, 180 semantic words and 19 subcategories were derived. The results of the interview were categorized into for central meanings: recognition and rewards, work experience and ability improvement, occupational characteristics, and work characteristics. Recognition and rewards included workplace recognition, patient recognition, self-effort and recognition, and the feeling of being rewarded. Work experience and ability improvement included various work experiences and factors relates to improving the work ability. Occupational characteristics included professional job, interest and persistence, job extensibility, and no burden of employment. Work characteristics included working conditions and separation of work and private life. Conclusion: The development of tools to measure the level of dental hygienists' job satisfaction after long-term service and to conduct follow-up research regarding ways and effects to improve job satisfaction is needed.

HMM의 출력확률을 이용한 신경회로망의 성능향상에 관한 연구 (A study on performance improvement of neural network using output probability of HMM)

  • 표창수;김창근;허강인
    • 융합신호처리학회논문지
    • /
    • 제1권1호
    • /
    • pp.1-6
    • /
    • 2000
  • 본 논문은 HMM(Hidden Markov Model)을 이 용하여 인식을 수행할 경우의 오류를 최소화 할 수 있는 후처리 과정으로 신경망을 결합시켜 HMM 단독으로 사용하였을 때 보다 높은 인식률을 얻을 수 있는 HMM과 신경망의 하이브리드 시스템을 제안한다 HMM을 이용하여 학습한 후 학습에 참여하지 않은 데이터를 인식하였을 때 오인식 데이터를 정인식으로 인식하도록 HMM의 출력으로 얻은 각 출력확률을 후처리에 사용될 신경망의 학습용으로 사용하여 신경망을 학습하여 HMM과 신경망을 결합한 하이브리드 시스템을 만든다 이와 같은 HMM과 신경망을 결합한 하이브리드 모델을 사용하여 단독 숫자음에서 실험한 결과 HMM 단독으로 사용하였을 때 보다 MLP에서는 약 $4.5\%$ RBFN에서는 약 $2\%$의 인식률 향상이 있었다. 기존의 하이브리드 시스템이 갖는 많은 학습시간이 소요되는 문제점과 실시간 음성인식시스템을 구현할 패의 학습데이터의 부족으로 인한 인식률 저하를 해결할 수 있는 방법임을 확인할 수 있었다

  • PDF

심한 소음환경에서 언어장애인 음성 인식률 향상을 위한 단어선정 방법 및 장치 개선에 관한 연구 (A Study on Word Selection Method and Device Improvement for Improving Speech Recognition Rate of Speech-Language-impaired in Severe Noise Environment)

  • 양기웅;이형근
    • 한국정보통신학회논문지
    • /
    • 제23권5호
    • /
    • pp.555-567
    • /
    • 2019
  • 언어장애인, 언어 사용이 불편한 분들의 경우 조금의 잡음 환경에도 음성인식률이 저하되어 사회 생활시 어려움을 겪게 된다. 언어 사용 시 불편함을 장치로 개선시킴과 동시에, 언어 장애인의 발음 특성을 고려하여 단어 선정 시 자체 개선한 단어 선정 방법을 사용하여 280개 단어를 선정하였다. 실험에 사용된 MEMS 개발 장치는 재질, 유도선 종류, 길이, 방향을 고려하여 제작되었으며 잘못된 발음으로 인한 음성과 심한 소음에서 음성 인식률 향상을 위하여 개발된 MEMS 장치와 개발된 단어 선정 방법을 사용하여 개선시켰다. 개선 방법으론 새로운 단어 선정 방법과 mems 장치를 개선하여 진행하였으며 결과를 포함하였다.

PLM 시스템 활용도 향상 방안의 중요도에 관한 연구 (A Study on the Importance of Measures for Improving PLM System Usage)

  • 유종광;임성택;민대환
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권1호
    • /
    • pp.239-269
    • /
    • 2022
  • Purpose This paper attempts to identify items for improving the usage of PLM(Product Lifecycle Management) systems and suggests ways to prioritize improvement items on the basis of importance. It also tries to find out differences in the importance of improvement items due to the company size, the industry, the job, or the PLM solution. Design/methodology/approach Through a survey from participants to a PLM System Conference, data were collected from a sample of 181 users who had the previous experience in using a PLM system. In order to figure out the differences in the importance among user groups, the F-test with the Scheffe test as a post-hoc analysis was used in case of equal variances and the Welch test with the Dunnett T3 test was used in case of unequal variances. Findings This study sorted out 25 improvement ideas according to their importance assessed by the PLM system users. The top five ideas are improving data consistency, error minimization, fast system response time, enhancing user recognition, and business process improvement. The support group puts higher importance than the general user group in data consistency, fast system response time, enhancing user recognition, business process improvement, dedicated team for data consistency, continuous support from management, hardware performance upgrade, output linkage to other systems, and shortening problem solving duration. The largest company group attaches significantly higher weights than the smallest company group to data consistency, error minimization, fast system response time, business process improvement, dedicated team for data consistency, security with proper access management, output linkage to other systems, and better user interface.

지식베이스를 이용한 임베디드용 연속음성인식의 어휘 적용률 개선 (Vocabulary Coverage Improvement for Embedded Continuous Speech Recognition Using Knowledgebase)

  • 김광호;임민규;김지환
    • 대한음성학회지:말소리
    • /
    • 제68권
    • /
    • pp.115-126
    • /
    • 2008
  • In this paper, we propose a vocabulary coverage improvement method for embedded continuous speech recognition (CSR) using knowledgebase. A vocabulary in CSR is normally derived from a word frequency list. Therefore, the vocabulary coverage is dependent on a corpus. In the previous research, we presented an improved way of vocabulary generation using part-of-speech (POS) tagged corpus. We analyzed all words paired with 101 among 152 POS tags and decided on a set of words which have to be included in vocabularies of any size. However, for the other 51 POS tags (e.g. nouns, verbs), the vocabulary inclusion of words paired with such POS tags are still based on word frequency counted on a corpus. In this paper, we propose a corpus independent word inclusion method for noun-, verb-, and named entity(NE)-related POS tags using knowledgebase. For noun-related POS tags, we generate synonym groups and analyze their relative importance using Google search. Then, we categorize verbs by lemma and analyze relative importance of each lemma from a pre-analyzed statistic for verbs. We determine the inclusion order of NEs through Google search. The proposed method shows better coverage for the test short message service (SMS) text corpus.

  • PDF

품사 부착 말뭉치를 이용한 임베디드용 연속음성인식의 어휘 적용률 개선 (Vocabulary Coverage Improvement for Embedded Continuous Speech Recognition Using Part-of-Speech Tagged Corpus)

  • 임민규;김광호;김지환
    • 대한음성학회지:말소리
    • /
    • 제67호
    • /
    • pp.181-193
    • /
    • 2008
  • In this paper, we propose a vocabulary coverage improvement method for embedded continuous speech recognition (CSR) using a part-of-speech (POS) tagged corpus. We investigate 152 POS tags defined in Lancaster-Oslo-Bergen (LOB) corpus and word-POS tag pairs. We derive a new vocabulary through word addition. Words paired with some POS tags have to be included in vocabularies with any size, but the vocabulary inclusion of words paired with other POS tags varies based on the target size of vocabulary. The 152 POS tags are categorized according to whether the word addition is dependent of the size of the vocabulary. Using expert knowledge, we classify POS tags first, and then apply different ways of word addition based on the POS tags paired with the words. The performance of the proposed method is measured in terms of coverage and is compared with those of vocabularies with the same size (5,000 words) derived from frequency lists. The coverage of the proposed method is measured as 95.18% for the test short message service (SMS) text corpus, while those of the conventional vocabularies cover only 93.19% and 91.82% of words appeared in the same SMS text corpus.

  • PDF

계층적 CNN을 이용한 방송 매체 내의 객체 인식 시스템 성능향상 방안 (Performance Improvement of Object Recognition System in Broadcast Media Using Hierarchical CNN)

  • 권명규;양효식
    • 디지털융복합연구
    • /
    • 제15권3호
    • /
    • pp.201-209
    • /
    • 2017
  • 본 논문은 계층적 Convolutional Nerual Network(CNN)을 이용한 스마트폰용 객체 인식 시스템이다. 전체적인 구성은 스마트폰과 서버를 연결하여 서버에서 컨볼루셔널 뉴럴 네트워크로 객체 인식을 하고 수집된 데이터를 매칭시켜 스마트폰으로 객체의 상세정보를 전달하는 방법이다. 또한 계층적 컨볼루셔널 뉴럴 네트워크와 단편적 컨볼루셔널 뉴럴 네트워크와 비교하였다. 계층적 컨볼루셔널 뉴럴 네트워크는 88%, 단편적 컨볼루셔널 뉴럴 네트워크는 73%의 정확도를 가지며 15%p의 성능 향상을 보였다. 이를 기반으로 스마트폰과 방송매체와 연동한 T-Commerce 시장 확장의 가능성을 보여준다. 아울러 방송영상을 시청하면서 Information Retrieval, AR/VR 서비스도 제공 가능하다.

사람 기계간 의사소통 시스템을 위한 눈동자 모션 인식 알고리즘 개선에 대한 연구 (Study on improvement of the pupil motion recognition algorithm for human-computer interface system)

  • 허승원;이희빈;이승준;유윤섭
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.377-378
    • /
    • 2018
  • 본 논문은 이전에 발표한 "FPGA와 OpenCV를 이용한 눈동자 모션인식을 통한 의사소통 시스템"을 보완한다. 몸을 자연스럽게 움직일 수 없는 전신마비, 루게릭 환자들을 위한 시스템으로, 눈동자의 모션을 인식하여 FPGA에서 텍스트를 실시간으로 선택한다. 본 논문에서는 사용자가 전신마비 환자인 것을 기반으로 눈 검출 기능의 연산을 최소한으로 줄여 모션인식의 속도를 향상키는 알고리즘을 제안한다.

  • PDF