• 제목/요약/키워드: Recognition Range

검색결과 677건 처리시간 0.033초

Optical Music Score Recognition System for Smart Mobile Devices

  • Han, SeJin;Lee, GueeSang
    • International Journal of Contents
    • /
    • 제10권4호
    • /
    • pp.63-68
    • /
    • 2014
  • In this paper, we propose a smart system that can optically recognize a music score within a document and can play the music after recognition. Many historic handwritten documents have now been digitalized. Converting images of a music score within documents into digital files is particularly difficult and requires considerable resources because a music score consists of a 2D structure with both staff lines and symbols. The proposed system takes an input image using a mobile device equipped with a camera module, and the image is optimized via preprocessing. Binarization, music sheet correction, staff line recognition, vertical line detection, note recognition, and symbol recognition processing are then applied, and a music file is generated in an XML format. The Music XML file is recorded as digital information, and based on that file, we can modify the result, logically correct errors, and finally generate a MIDI file. Our system reduces misrecognition, and a wider range of music score can be recognized because we have implemented distortion correction and vertical line detection. We show that the proposed method is practical, and that is has potential for wide application through an experiment with a variety of music scores.

임베디드 시스템에서 사용 가능한 적응형 MFCC 와 Deep Learning 기반의 음성인식 (Voice Recognition-Based on Adaptive MFCC and Deep Learning for Embedded Systems)

  • 배현수;이호진;이석규
    • 제어로봇시스템학회논문지
    • /
    • 제22권10호
    • /
    • pp.797-802
    • /
    • 2016
  • This paper proposes a noble voice recognition method based on an adaptive MFCC and deep learning for embedded systems. To enhance the recognition ratio of the proposed voice recognizer, ambient noise mixed into the voice signal has to be eliminated. However, noise filtering processes, which may damage voice data, diminishes the recognition ratio. In this paper, a filter has been designed for the frequency range within a voice signal, and imposed weights are used to reduce data deterioration. In addition, a deep learning algorithm, which does not require a database in the recognition algorithm, has been adapted for embedded systems, which inherently require small amounts of memory. The experimental results suggest that the proposed deep learning algorithm and HMM voice recognizer, utilizing the proposed adaptive MFCC algorithm, perform better than conventional MFCC algorithms in its recognition ratio within a noisy environment.

농촌 지역사회노인의 만성질병수와 치매예방행위에 미치는 치매인식의 매개효과 (The Mediating Effect of Dementia Recognition on the Number of Chronic Diseases and Dementia Prevention Behaviors of Elders in Rural Communities)

  • 박필남
    • 한국농촌간호학회지
    • /
    • 제15권2호
    • /
    • pp.41-48
    • /
    • 2020
  • Purpose: This study was a descriptive study to identify the factors affecting the dementia prevention behavior of elders in rural communities. Methods: The participants in this study were 125 elders aged 60 or older who lived in Eup or Myeon areas of P city. For data analysis, SPSS/WIN 22.0 was used to perform descriptive statistics, t-test, ANOVA, Pearson correlation, and linear multiple regression and mediated effects. Results: Scores for dementia recognition, dementia attitude and dementia prevention behavior averaged 5.6±2.50 points in the 0~11 range, 38.8±4.59 in 14~56 and 20.2±3.59 in 10~30 respectively. Dementia recognition (a), dementia attitude (b), dementia prevention behavior (c) and the number of chronic diseases of the elders (d) were positively or negatively correlated with each other (rab=.29, p<.01; rbc=.26, p<.01; rac=.36, p<.01; rad=-.29, p<.01; rcd=.19, p<.05). Factors affecting dementia prevention behavior were dementia recognition, dementia attitude, and degree of dementia interest. When the number of chronic diseases affects dementia prevention behavior, dementia recognition has a mediating effect. Conclusion: In order to prevent dementia among elders in rural areas, appropriate management of chronic diseases and provision of appropriate dementia-related education and information to enhance dementia recognition should be provided.

ARMA 필터를 이용한 로그 에너지 특징의 정규화 방법 (A Log-Energy Feature Normalization Method Using ARMA Filter)

  • 신광호;정호열;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제11권10호
    • /
    • pp.1325-1337
    • /
    • 2008
  • 훈련과 인식의 환경적 차이가 음성 인식 성능 저하의 주요 요인이며, 이러한 환경적 불일치를 줄이기 위한 다양한 잡음 처리 방법들이 연구되고 있다. 이 가운데 로그 에너지 특징에 대한 ERN(log-Energy dynamic Range Normalization), SEN(Silence Energy Normalization) 등이 우수한 성능을 보이고 있다. 그러나 이들 방법은 상대적으로 큰 갈을 갖는 로그 에너지 특징에 대해서는 처리가 불가능한 문제점이 이으며, 특히 SNR값이 작은 환경에서는 이러한 문제로 인하여 환경적 불일치가 더욱 크게 나타나고 있다. 이를 해결하기 위해서 본 논문은 자동 회귀 방식으로 이동 평균을 계산하여 로그 에너지 특징을 스무딩(smoothing)하는 ARMA(Auto-Regression and Moving Average) 필터를 후처리로 적용하는 방법을 제안한다. Aurora 2.0 DB를 이용한 인식 실험 결과, 제안 방법이 기존의 방법들에 비해 향상된 인식 결과를 얻을 수 있었다.

  • PDF

다중 채널 융합 기법을 이용한 DTV 기반 수동형 레이다의 표적 인식 방법 (Target Recognition Method of DTV-Based Passive Radar Using Multi-Channel Combining Method)

  • 설승환;최영재;최인식
    • 한국전자파학회논문지
    • /
    • 제28권10호
    • /
    • pp.794-801
    • /
    • 2017
  • 본 논문에서는 DTV(Digital Television) 기반의 수동형 레이다와 다중 채널 융합 기법을 이용한 항공기 표적 인식 방법을 제안하였다. DTV에서 송신되는 다수의 채널을 융합하여 표적인식에 필요한 해상도의 HRRP(High Resolution Range Profile)를 획득하였다. HRRP는 AR(Auto Regressive) 기법 또는 제로 패딩 기법을 이용하여 획득하였다. 획득한 HRRP로부터, 경사하강법을 이용한 CLEAN 기법을 통해 산란점을 추출한 후 특성벡터를 생성하였으며, 이를 신경망 구분기에 학습시켜 표적 인식을 수행하였다. 제안된 방법의 성능을 검증하기 위하여 실제 국내에서 운용되고 있는 3개의 송신소(관악산, 용문산, 견월악)의 주파수 대역을 가정하고, 4종의 항공기 실스케일 3D 캐드 모델을 이용하여 제안된 방법과 각 송신소의 단일 채널 주파수를 이용하였을 때의 표적인식 성능을 비교하였다. 시뮬레이션 결과, 제안된 방법이 3개의 송신소 모두에서 각 송신소의 단일 채널 주파수를 이용하였을 때보다 높은 표적 인식 성능을 보였다.

컨테이너터미널 내의 야드 트랙터 위치인식을 위한 적외선 통신시스템 개발 (Development of Infrared-Ray Communication System for Position Recognition of Yard Tractor in Container Terminal)

  • 홍동희;김창곤
    • 디지털융복합연구
    • /
    • 제11권1호
    • /
    • pp.211-223
    • /
    • 2013
  • 국내 컨테이너터미널에서는 야드 트랙터의 위치를 실시간으로 인식하기 위해 RFID시스템을 사용하고 있다. 그러나 RFID를 이용한 위치인식은 트랜스퍼 크레인을 이용하는 야드 작업에는 문제가 없으나, 컨테이너 크레인을 이용하는 본선 작업에는 문제가 있다. 즉, 컨테이너 크레인에서 크레인 밑의 4개 차선에서 움직이는 야드 트랙터들을 구분하여 정확히 인식하기가 불가능하기 때문이다. 따라서 본 논문에서는 트랜스퍼 크레인의 야드 작업은 물론이고 컨테이너 크레인의 본선 작업에서도 동일한 방식으로 정확히 야드 트랙터를 인식할 수 있는 적외선 통신시스템을 개발하였다. 본 연구의 결과 인식 횟수가 일정하게 측정되었으며, 25m의 거리에서도 인식범위가 5.7m로 측정 가능하였다. 즉, 컨테이너 크레인 밑을 이동하는 여러 대의 야드 트랙터들을 구분하여 인식할 수 있는 인식 범위를 가지게 되었다.

관절 가동범위 향상을 위한 원격 모션 인식 재활 시스템 (A Home-Based Remote Rehabilitation System with Motion Recognition for Joint Range of Motion Improvement)

  • 김경아;정완영
    • 융합신호처리학회논문지
    • /
    • 제20권3호
    • /
    • pp.151-158
    • /
    • 2019
  • 재해로 인한 부상 및 만성 질환 등의 다양한 요인으로 신체적 장애를 가진 환자, 혹은 신체의 노화로 인하여 몸의 움직임의 범위가 제한된 노인과 같은 경우, 치료의 일종으로 병원에서의 재활 프로그램의 참여를 권장 받는 경우가 있다. 그러나 이들은 신체의 거동이 불편하므로 보호자의 동행 없이 재활 프로그램의 참여를 위한 이동이 쉽지 않다. 또한, 병원에서는 각각의 환자 및 노인들에게 재활 운동을 지도해주어야 하는 불편함이 존재한다. 이러한 이유로, 이 논문에서는 모션 인식을 통하여 집에서도 타인의 도움 없이 재활 운동이 가능한 원격 재활 프로그램을 개발하였다. 해당 시스템은 사용자 집의 스테레오 카메라와 컴퓨터를 이용하여 구동할 수 있으며, 모션 인식 기능을 통하여 사용자의 실시간 운동 상태 확인이 가능하다. 사용자가 재활 운동에 참여하는 동안, 시스템은 사용자의 특정 부위의 관절가동범위(Joint ROM; Joint Range of Motion)를 저장하여 신체 기능의 향상도를 확인한다. 이 논문에서는 시스템의 검증을 위하여 총 4명의 실험군이 참여하였으며, 총 3종류의 운동을 각 9회씩 반복한 데이터를 이용하여 각 실험군의 시작 및 마지막 운동의 관절가동범위의 차이를 비교하였다.

On-Line Blind Channel Normalization for Noise-Robust Speech Recognition

  • Jung, Ho-Young
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제1권3호
    • /
    • pp.143-151
    • /
    • 2012
  • A new data-driven method for the design of a blind modulation frequency filter that suppresses the slow-varying noise components is proposed. The proposed method is based on the temporal local decorrelation of the feature vector sequence, and is done on an utterance-by-utterance basis. Although the conventional modulation frequency filtering approaches the same form regardless of the task and environment conditions, the proposed method can provide an adaptive modulation frequency filter that outperforms conventional methods for each utterance. In addition, the method ultimately performs channel normalization in a feature domain with applications to log-spectral parameters. The performance was evaluated by speaker-independent isolated-word recognition experiments under additive noise environments. The proposed method achieved outstanding improvement for speech recognition in environments with significant noise and was also effective in a range of feature representations.

  • PDF

Modified SNR-Normalization Technique for Robust Speech Recognition

  • Jung, Hoi-In;Shim, Kab-Jong;Kim, Hyung-Soon
    • The Journal of the Acoustical Society of Korea
    • /
    • 제16권3E호
    • /
    • pp.14-18
    • /
    • 1997
  • One fo the major problems in speech recognition is the mismatch between training and testing environments. Recently, SNR normalization technique, which normalizes the dynamic range of frequency channels in mel-scaled filterbank, was proposed[1]. While it showed improved robustness against additive noise, it requires a reliable speech detection mechanism and several adaptation parameters to be optimized. In this paper, we propose a modified SNR normalization technique. In this technique, we take simply the maximum of filterbank output and predetermined masking constant for each frequency band. According to the speaker-independent isolated word recognition in car noise environments, proposed modification yields better recognition performance that the original SNR normalization method, with rather reduced complexity.

  • PDF

사과가공품의 인지도 및 중요도-만족도 분석 (Recognition and Importance-Satisfaction of Apple Processed Products)

  • 허무열
    • 한국식생활문화학회지
    • /
    • 제25권1호
    • /
    • pp.1-8
    • /
    • 2010
  • The purpose of this study was to analyze consumer recognition, perceived importance, and satisfaction to create a new apple processed product and to promote its consumption. Data were collected from 527 men and women living throughout Korea through a self-administrated questionnaire. Frequencies, one-way analysis of variance, and Duncan's multiple range were conducted using SPSS v. 17.0 software. Recognition of juice and drinks, milk and dairy products, apple jam, and seasoning was high, while that of the other products was low. Consumer perceived importance of products was higher than consumer satisfaction of products. Quality preservation attributes were sanitation, taste, flavor, place of origin, and convenience of purchase. Attributes for improved consumer post-purchase satisfaction after purchasing were content of apple, quality of apple, price, and certificate of quality. The attributes of content of apple and certificate of quality were statistically different by consumer age.