• 제목/요약/키워드: Recognition Improvement

검색결과 1,491건 처리시간 0.026초

독립성분분석법을 이용한 음성인식기의 성능향상 (Performance Improvement of Speech Recognition Based on Independent Component Analysis)

  • 김창근;한학용;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
    • /
    • pp.285-288
    • /
    • 2001
  • 본 논문에서는 신호간의 의존성과 관련성이 최소가 되도록 분리하는 독립성분분석 법을 이용하여 입력음성에서 변동량이 많은 방향으로 주축을 찾아 그 정보를 이용하여 데이터의 중복성을 제거한 후 음성특징벡터를 추출하는 방법을 제안한다. 학습 하고자하는 음성인식기의 음성에서 독립성분분석법을 이용하여 특징벡터를 추출하고 HMM 을 사용하여 기존의 음성특징벡터로 사용되는 mel-cepstrum과 비교하여 학습, 인식실험을 수행하였으며 제안한 방법에서 음성인식성능의 향상을 확인할 수 있었다. 또한, 인식시 주변여건에 따라 잡음에 의한 인식성능 저하에도 유연히 대처할 수 있음을 앞 수 있었다.

  • PDF

차량 번호판 밝기 제어를 이용한 인식률 개선 방안 (Improvement Method of Recognition Rate Using Brightness Control of Vehicle License Plate)

  • 이광옥;배상현
    • 스마트미디어저널
    • /
    • 제6권3호
    • /
    • pp.57-63
    • /
    • 2017
  • 차량번호인식 개선을 위해서는 무엇보다 양질의 차량이미지를 획득하는 것이 무엇보다 먼저 선행되어야 하는 필수적인 요소이다. 일반적인 도로영상들은 시간, 햇빛, 날씨 등 다양한 환경의 영향을 받아 번호판 밝기가 일률적이지 않고 다양한 형태로 나타나기 때문에 여러 가지 이미지 보정 기능을 거치게 되고 이로 인하여 인식속도 저하, 인식률 저하 등이 나타난다. 따라서, 본 논문에서는 실시간 영상 촬영 시 번호판 주위의 밝기를 측정하여 카메라의 shutter, bright, gain등 이미지 밝기와 품질에 영향을 주는 각 요소를 실시간으로 제어하여 빠르고 선명한 고품질의 차량 이미지 촬영하기 위해 실시간 도로 영상을 통하여 제안된 방법을 테스트 하였다.

OCR 엔진 기반 분류기 애드온 결합을 통한 이미지 내부 텍스트 인식 성능 향상 (Scene Text Recognition Performance Improvement through an Add-on of an OCR based Classifier)

  • 채호열;석호식
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1086-1092
    • /
    • 2020
  • 일상 환경에서 동작하는 자율 에이전트를 구현하기 위해서는 이미지나 객체에 존재하는 텍스트를 인식하는 기능이 필수적이다. 주어진 이미지에 입력 변환, 특성 인식, 워드 예측을 적용하여 인식된 텍스트에 존재하는 워드를 출력하는 과정에 다양한 딥러닝 모델이 활용되고 있으며, 딥뉴럴넷의 놀라운 객체 인식 능력으로 인식 성능이 매우 향상되었지만 실제 환경에 적용하기에는 아직 부족한 점이 많다. 본 논문에서는 인식 성능 향상을 위하여 텍스트 존재 영역 감지, 텍스트 인식, 워드 예측의 파이프라인에 OCR 엔진과 분류기로 구성된 애드온을 추가하여 기존 파이프라인이 인식하지 못한 텍스트의 인식을 시도하는 접근법을 제안한다. IC13, IC15의 데이터 셋에 제안 방법을 적용한 결과, 문자 단위에서 기존 파이프라인이 인식하는데 실패한 문자의 최대 10.92%를 인식함을 확인하였다.

뉴로모픽 시스템 향상을 위한 RRAM 기반 시냅스 소자 리뷰 (A Review of RRAM-based Synaptic Device to Improve Neuromorphic Systems)

  • 박건우;김제규;최건우
    • 반도체디스플레이기술학회지
    • /
    • 제21권3호
    • /
    • pp.50-56
    • /
    • 2022
  • In order to process a vast amount of data, there is demand for a new system with higher processing speed and lower energy consumption. To prevent 'memory wall' in von Neumann architecture, RRAM, which is a neuromorphic device, has been researched. In this paper, we summarize the features of RRAM and propose the device structure for characteristic improvement. RRAM operates as a synapse device using a change of resistance. In general, the resistance characteristics of RRAM are nonlinear and random. As synapse device, linearity and uniformity improvement of RRAM is important to improve learning recognition rate because high linearity and uniformity characteristics can achieve high recognition rate. There are many method, such as TEL, barrier layer, NC, high oxidation properties, to improve linearity and uniformity. We proposed a new device structure of TiN/Al doped TaOx/AlOx/Pt that will achieve high recognition rate. Also, with simulation, we prove that the improved properties show a high learning recognition rate.

잔향 환경 음성인식을 위한 다중 해상도 DenseNet 기반 음향 모델 (Multi-resolution DenseNet based acoustic models for reverberant speech recognition)

  • 박순찬;정용원;김형순
    • 말소리와 음성과학
    • /
    • 제10권1호
    • /
    • pp.33-38
    • /
    • 2018
  • Although deep neural network-based acoustic models have greatly improved the performance of automatic speech recognition (ASR), reverberation still degrades the performance of distant speech recognition in indoor environments. In this paper, we adopt the DenseNet, which has shown great performance results in image classification tasks, to improve the performance of reverberant speech recognition. The DenseNet enables the deep convolutional neural network (CNN) to be effectively trained by concatenating feature maps in each convolutional layer. In addition, we extend the concept of multi-resolution CNN to multi-resolution DenseNet for robust speech recognition in reverberant environments. We evaluate the performance of reverberant speech recognition on the single-channel ASR task in reverberant voice enhancement and recognition benchmark (REVERB) challenge 2014. According to the experimental results, the DenseNet-based acoustic models show better performance than do the conventional CNN-based ones, and the multi-resolution DenseNet provides additional performance improvement.

Multimodal Parametric Fusion for Emotion Recognition

  • Kim, Jonghwa
    • International journal of advanced smart convergence
    • /
    • 제9권1호
    • /
    • pp.193-201
    • /
    • 2020
  • The main objective of this study is to investigate the impact of additional modalities on the performance of emotion recognition using speech, facial expression and physiological measurements. In order to compare different approaches, we designed a feature-based recognition system as a benchmark which carries out linear supervised classification followed by the leave-one-out cross-validation. For the classification of four emotions, it turned out that bimodal fusion in our experiment improves recognition accuracy of unimodal approach, while the performance of trimodal fusion varies strongly depending on the individual. Furthermore, we experienced extremely high disparity between single class recognition rates, while we could not observe a best performing single modality in our experiment. Based on these observations, we developed a novel fusion method, called parametric decision fusion (PDF), which lies in building emotion-specific classifiers and exploits advantage of a parametrized decision process. By using the PDF scheme we achieved 16% improvement in accuracy of subject-dependent recognition and 10% for subject-independent recognition compared to the best unimodal results.

최대우도를 부가한 주파수 변이 PMC 방법의 잡음 음성 인식 성능개선 (Recognition Performance Improvement for Noisy-speech by Parallel Model Compensation Adaptation Using Frequency-variant added with ML)

  • 최숙남;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제16권8호
    • /
    • pp.905-913
    • /
    • 2013
  • 잡음에 강건한 음성 인식을 위한 주파수 변이를 이용한 PMC( Parallel Model Compensation Using Frequency-variant, FV-PMC) 방법은 인식시 입력음성에 혼입이 예상되는 잡음들을 평균 주파수 변이도를 임계치로 하여 몇 가지 잡음 군으로 분류한 후 각 잡음 군 별로 인식을 수행하는 방법이다. 이 방법은 기준 임계치를 이용하여 양호하게 분류된 잡음 음성들에 대해서는 매우 우수한 성능을 보이나, 미 분류된 잡음 음성들에 대해서는 기존의 PMC 방법에서와 같이 무잡음 모델과 결합하여 음성 인식을 수행함으로 인해 평균 음성 인식률이 낮아지는 문제점이 있다. 이러한 문제점을 해결하기 위하여 본 논문에서는 기존의 방법에서 사용하였던 평균주파수 임계치 방법 대신에 최대 우도를 부가하여 미분류를 방지함으로써 입력 잡음음성에 포함되는 잡음의 군별 잡음 분류 율을 높여 인식률을 제고하는 개선된 주파수 변이 PMC 인식방법을 제안하였다. Aurora 2.0 데이터베이스를 이용한 인식실험결과, 기존의 FV-PMC 방법에 비해 향상된 결과를 확인할 수 있었다.

RVM을 이용한 음성인식기의 구현 (Implementation of Speech Recognizer using Relevance Vector Machine)

  • 김창근;고시영;허강인;이광석
    • 한국정보통신학회논문지
    • /
    • 제11권8호
    • /
    • pp.1596-1603
    • /
    • 2007
  • 본 논문에서는 음성인식 시스템을 구현함에 있어 중요한 특징 파라미터와 학습, 인식 알고리즘의 선택을 위한 제안을 하기 위하여 각각 세 가지의 방법을 조합하여 인식 실험을 수행하고 검토하였다. 두 종류의 실험을 통하여 하드웨어 장치로 구현할 경우 보다 효과적인 음성 인식 시스템을 제안한다. 첫 번째로는 특징 파라미터의 성능을 평가하기 위하여 기존의 MFCC와 MFCC를 PCA와 ICA를 이용하여 특징 공간을 변화시킨 새로운 특징 파라미터를 제안하여 총 3종류의 특징파라미터에 대한 인식 실험을 수행하였으며, 두 번째로는 학습데이터 수에 따른 HMM, SVM, RVM의 인식 성능을 실험하였다. 이상의 실험에 의하여 ICA에 의한 특징 파라미터가 특징 공간상에서의 높은 선형 분별성에 의해 MFCC와 비교하여 평균 1.5%의 성능향상을 확인할 수 있었으며 학습데이터의 감소에 따른 인식실험에서는 HMM과 비교하여 RVM에서 최고 3.25%의 성능향상을 확인하였다. 이에 근거하여 TI사의 DSP(TMS320C32)를 사용하여 음성 인식기를 구현하여 실시간으로 실험하여 시뮬레이션과 비교하였다. 이와 같은 결과로서 본 논문에서 제안하는 음성인식시스템을 위한 효과적인 방법은 ICA를 이용한 특징 파라미터를 추출하고 RVM을 이용하여 인식을 수행하는 것이라 판단한다.

모바일 환경에서의 명함인식 성능 향상에 관한 연구 (A Study on Performance Improvement of Business Card Recognition in Mobile Environments)

  • 신현섭;김차종
    • 한국정보통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.318-328
    • /
    • 2014
  • 본 논문은 모바일 환경에서의 명함 인식 성능 향상을 위한 방안으로 서로 다른 알고리즘과 학습 데이터를 갖는 이종(異種)의 명함 인식 엔진을 병렬처리 하여 데이터를 결합하는 하이브리드 OCR 에이전트를 제안하였고, 모바일 카메라의 특성상 촬영자의 환경에 따라 변하는 조명, 촬영방향, 명함의 배경에 적응하는 모바일 카메라에서의 명함 이미지 전처리 기법을 제안하였다. 본 논문에서 제안한 방법으로 하이브리드 OCR 에이전트를 구성할 경우 단일 엔진을 구성하였을 때 보다 국문명함의 명함 인식률이 평균 90.69%에서 95.5%로 향상되었고, 이미지 전처리 기법을 적용함으로써 이미지 용량이 50% 수준으로 줄어들었으며 이미지 전처리 기법을 적용하기 전보다 인식률이 83%에서 92.48% 수준으로 약 9.4%의 향상 효과를 얻을 수 있었다.

성남지역 학교 영양(교)사와 학부모의 친환경농산물에 대한 인지도 (Recognition of Environmentally-friendly Agricultural Products for School Foodservice of Nutrition Teachers and Parents in 2018 at Seongnam in Gyeonggi province)

  • 권지수;조우균
    • 대한지역사회영양학회지
    • /
    • 제24권4호
    • /
    • pp.290-299
    • /
    • 2019
  • Objectives: This study examined the nutrition teachers' and parents' recognition of environmentally-friendly agricultural products (EAPs) used in school foodservice. Methods: A questionnaire survey was given to 128 school foodservice nutrition teachers in Seongnam and 189 parents from Oct. 16 to Oct. 31, 2018 at Seongnam in Gyeonggi province. The survey included information on the recognition, satisfaction, and improvement of EAPs, and the results of the two groups were compared. Results: A comparison of the recognition of EAPs showed that nutrition teachers knew more about the EAPs and local government support in school foodservice than the parents. On the other hand, the parents were more aware than the nutrition teachers in that children have a higher affinity for EAPs than for general agricultural products in the school foodservice. A comparison of the level of satisfaction with the EAPs by nutrition teachers and parents revealed the nutrition teachers to be significantly more satisfied than parents in terms of the color, taste and nutrition of EAPs. Among the items that should be provided with EAPs, more than 50% of each group of nutrition teachers and parents answered that vegetables must be provided first. Some 70.9% of nutrition teachers and 84.5% of parents were aware of the certification standards of EAPs. The nutrition teachers had showed a slightly higher score than the parents in the certification system (3.51 vs. 3.25). In terms of improving the EAPs, 36.2% of nutrition teachers answered a reasonable price preferentially, whereas 56.4% of parents answered maintaining quality. In the expected effects of using EAPs, 57.9% of nutrition teachers answered an improvement of parents' satisfaction on the school foodservice. On the other hand, 38.0% of parents answered an improvement of children' satisfaction on school foodservice. Conclusions: Nutrition teachers and parents need to be educated on the certification systems that would enhance the trust in EAPs.