통합 검색 | Korea Science

증강현실을 위한 객체인식 기술 성능 비교 (Object Recognition Technology Performance Comparison for Augmented Reality)

신은지;신광성
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2021년도 춘계학술대회
- /
- pp.348-350
- /
- 2021
증강현실의 핵심기술은 객체인식기술이다. 최근 CNN등 댜양한 인공지능 알고리즘의 개발로 인하여 영상s에서 특정 객체를 효과적으로 구분하는 것이 가능해졌다. 객체를 빠르고 정확하게 인식하는 기술이 확보되어야 더욱 현실감있고 몰입감있는 증강현실 콘텐츠의 구현이 가능해진다. 본 연구에서는 SSD(single shot multibox detector)를 이용한 객체인식 모델과 YOLO를 이용한 객체 인식 모델의 비교평가를 수행하였다.
PDF

CNN을 적용한 조명변화에 강인한 얼굴인식 연구 (Research on Robust Face Recognition against Lighting Variation using CNN)

김연호;박성욱;김도연
- 한국전자통신학회논문지
- /
- 제12권2호
- /
- pp.325-330
- /
- 2017
얼굴인식 기술은 지난 수십 년간 연구되어온 분야로서 보안, 엔터테인먼트, 모바일 서비스 등 다양한 영역에서 활용되고 있다. 얼굴인식 기술이 가진 주된 문제점은 밝기, 조명각도, 영상 회전등의 환경적 변화 요소에 따라 인식률이 현저하게 감소된다는 것이다. 따라서 본 논문에서는 최근 많은 계산량을 처리할 수 있는 컴퓨터 하드웨어와 알고리즘의 발전으로 재조명 받고 있는 CNN을 이용해 조명변화에 강인한 얼굴인식 방법을 제안하였다. 이후 성능검증을 위해 기존의 얼굴인식 알고리즘인 PCA, LBP, DCT와 결과 비교를 진행하였으며, 각각 9.82%, 11.6%, 4.54%의 성능 향상을 보였다. 또한 기존 신경망을 적용한 얼굴인식 연구결과 비교에서도 5.24%의 성능 향상을 기록하여 최종 인식률 99.25%를 달성하는 결과를 보였다.
https://doi.org/10.13067/JKIECS.2017.12.2.325 인용 PDF KSCI

음소 유사율 오류 보정을 이용한 어휘 인식 후처리 시스템 (Vocabulary Recognition Post-Processing System using Phoneme Similarity Error Correction)

안찬식;오상엽
- 한국컴퓨터정보학회논문지
- /
- 제15권7호
- /
- pp.83-90
- /
- 2010
어휘 인식 시스템에서 인식률 저하의 요인으로는 유사한 음소 인식과 부정확한 어휘 제공으로 인해 오인식 오류가 존재한다. 부정확한 어휘의 입력으로 특징을 추출하여 인식할 경우 오인식의 결과가 나타나거나 유사한 음소로 인식되며 특징 추출이 제대로 이루어지지 않으면 음소 인식 시 유사한 음소로 인식하게 된다. 따라서 본 논문에서는 음소가 갖는 특징을 기반으로 음소 유사율을 이용한 어휘 인식 후처리에서의 오류 보정 후처리 시스템을 제안하였다. 음소 유사율은 모노폰으로 훈련시킨 훈련 데이터를 각각의 음소에 MFCC와 LPC 특징 추출 방법을 이용하여 구하였다. 유사한 음소는 정확한 음소로 인식할 수 있도록 유도하여 부정확한 어휘 제공으로 인하여 오인식되는 오류를 최소화하였다. 음소 유사율과 신뢰도를 이용하여 오류 보정율을 구하였으며, 어휘 인식 과정에서 오류로 판명된 어휘에 대하여 오류 보정을 수행하였다. 에러패턴 학습을 이용한 시스템과 의미기반을 이용한 시스템에 비해 시스템 성능 평가 결과 MFCC와 LPC는 각각 7.5%와 5.3%의 인식 향상률을 보였다.
https://doi.org/10.9708/jksci.2010.15.7.083 인용 PDF KSCI

한글 단어의 음성 인식 처리에 관한 연구 (A Study on Processing of Speech Recognition Korean Words)

남기훈
- 문화기술의 융합
- /
- 제5권4호
- /
- pp.407-412
- /
- 2019
본 논문에서는 한글 단어 단위의 음성 인식 처리 기술을 제안한다. 음성 인식은 마이크와 같은 센서를 사용하여 얻은 음향학적 신호를 단어나 문장으로 변환시키는 기술이다. 대부분의 외국어들은 음성 인식에 있어서 어려움이 적은 편이다. 그에 반면, 한글의 모음과 받침 자음 구성이어서 음성 합성 시스템으로부터 얻은 문자를 그대로 사용하기에는 부적절하다. 기존 구조의 음성 인식 기술을 개선해야만 보다 정확하게 단어를 인식할 수 있다. 이러한 문제를 해결하기 위해 기존 방식의 음성 인식구조에 새로운 알고리즘을 추가하여 음성 인식률을 높이게 하였다. 먼저 입력된 단어를 전처리 과정을 수행한 후 결과를 토큰 처리한다. 레벤스테인 거리 알고리즘과 해싱 알고리즘에서 처리된 결과 값을 조합한 후 자음 비교 알고리즘을 거쳐 표준 단어를 출력한다. 최종 결과 단어를 표준화 테이블과 비교하여 존재하면 출력하고 존재하지 않으면 테이블에 등록하도록 하였다. 실험 환경은 스마트폰 응용 프로그램을 개발하여 사용하였다. 본 논문에서 제안된 구조는 기존 방식에 비해 인식률의 성능이 표준어는 2%, 방언은 7% 정도 향상되었음을 보였다.
https://doi.org/10.17703/JCCT.2019.5.4.407 인용 PDF KSCI

객체 인식 모델 기반 실시간 교통신호 정보 인식 (Real-time traffic light information recognition based on object detection models)

주은오;김민수
- 지적과 국토정보
- /
- 제52권1호
- /
- pp.81-93
- /
- 2022
최근 자율주행 기술에서 차량 주변 객체 인식과 교통표지판 및 차량 신호 인식을 위한 연구가 활발히 수행되고 있으며, 특히 차량 신호 인식은 자율주행 기술에 있어서 핵심 요소로 평가되고 있다. 이에 차량 신호 인식을 위한 다양한 연구가 진행되어 왔으며, 최근에는 딥러닝 기반 객체 인식 모델을 활용한 차량 신호 인식 연구가 크게 증가하고 있다. 또한 AIHub에서 음성, 비전, 자율주행 등을 위한 양질의 국내 인공지능 학습데이터 셋이 공개됨에 따라 이들 데이터를 활용한 국내 환경에 적합한 차량 신호 인식 모델의 개발도 가능하게 되었다. 이에 본 연구에서는 AIHub의 학습데이터와 객체 인식모델 YOLO를 적용한 국내 차량 신호 인식 모델을 개발하였다. 특히 차량 신호의 인식 성능을 개선하기 위하여 YOLOv4와 YOLOv5의 다양한 모델을 적용하였으며 학습데이터의 클래스도 다양하게 분류하여 실험을 수행하였다. 결론적으로 YOLOv5가 YOLOv4보다 차량 신호 인식에 조금 더 적합함을 확인할 수 있었으며, 두 모델의 아키텍처 비교를 통하여 YOLOv5 성능이 우수한 이유를 확인할 수 있었다.
https://doi.org/10.22640/lxsiri.2022.52.1.81 인용 PDF KSCI

위탁급식소 영양사와 조리종사원의 HACCP 적용지식 및 직무수행수준에 대한 인지도 평가 (Assessment of Hygiene Knowledge and Recognition on Job Performance Levels for HACCP Implementation for Dieticians and Employees at Contract Foodservices)

문혜경;전지영;류은순
- 대한영양사협회학술지
- /
- 제10권3호
- /
- pp.261-271
- /
- 2004
The purpose of this study was to provide basic data for practical HACCP training. A survey was conducted and analysed on 46 contract foodservices: 13 "Appointed" foodservices (appointed by Korean Food & Drug Administration), 17 "Voluntary Applying" foodservices (voluntarily applied HACCP, but not appointed), 16 "Non-applying" foodservices (not applied HACCP). Hygiene knowledge and recognition on job performance levels for HACCP application for 46 dieticians and 361 employees were surveyed. According to the survey, 61.5% of the "Appointed" dieticians took HACCP training from outside the company, 58.8% of "Voluntary Applying" dieticians took in-house HACCP training, and 62.4% of "Non-applying" dieticians have not taken any HACCP training. As for the comparison of hygiene knowledge, total mean of employees (6.38) showed significantly lower average than that of the dieticians (7.82) (p<0.001). From the result for recognition on job performance levels, total mean of dieticians (3.91) indicated generally good performance while employees (3.41) (p<0.001) showed considerably lower recognition. Hygiene knowledge and recognition on job performance levels of both dieticians and employees showed considerably close correlation (p<0.01 or p<0.05).
PDF

변형된 Dynamic Averaging 방법을 이용한 단독어인식 (Isolated Word Recognition using Modified Dynamic Averaging Method)

정의봉;고영혁;이종악
- 한국음향학회지
- /
- 제10권2호
- /
- pp.23-28
- /
- 1991
본 논문을 특정화자에 대한 단독어 음성 인식에 대한 연구이다. 우리는 표준패턴으로서 변형된 dynamic linear averaging 방법을 이용한 DTW 음성 인식 시스템을 제안한다. 57개의 모든 도시명이 인식 대상 어휘로 선정되었고 12차 LPC cepstram 계수를 특징계수로 사용하였다. 이 논문은 표준패턴으로 변형된 dynamic linear averaging 방법을 이용하여 인식 실험을 한것 이외에도 같은 데이터 같은 조건상에서 causal 방법과 dynamic averaging방법, linear averaging방법, clustering 방법을 이용하여 실험하였다. 실험결과로 변형시킨 dynamic linear averaging 방법을 이용한 DTW 음성인식이 97.6%로 가장 좋은 인식율을 보였다.
PDF

A Robust Method for Partially Occluded Face Recognition

Xu, Wenkai;Lee, Suk-Hwan;Lee, Eung-Joo
- KSII Transactions on Internet and Information Systems (TIIS)
- /
- 제9권7호
- /
- pp.2667-2682
- /
- 2015
Due to the wide application of face recognition (FR) in information security, surveillance, access control and others, it has received significantly increased attention from both the academic and industrial communities during the past several decades. However, partial face occlusion is one of the most challenging problems in face recognition issue. In this paper, a novel method based on linear regression-based classification (LRC) algorithm is proposed to address this problem. After all images are downsampled and divided into several blocks, we exploit the evaluator of each block to determine the clear blocks of the test face image by using linear regression technique. Then, the remained uncontaminated blocks are utilized to partial occluded face recognition issue. Furthermore, an improved Distance-based Evidence Fusion approach is proposed to decide in favor of the class with average value of corresponding minimum distance. Since this occlusion removing process uses a simple linear regression approach, the completely computational cost approximately equals to LRC and much lower than sparse representation-based classification (SRC) and extended-SRC (eSRC). Based on the experimental results on both AR face database and extended Yale B face database, it demonstrates the effectiveness of the proposed method on issue of partial occluded face recognition and the performance is satisfactory. Through the comparison with the conventional methods (eigenface+NN, fisherfaces+NN) and the state-of-the-art methods (LRC, SRC and eSRC), the proposed method shows better performance and robustness.
https://doi.org/10.3837/tiis.2015.07.019 인용 PDF KSCI KPUBS HTML

의미 분석과 형태소 분석을 이용한 핵심어 인식 시스템 (Key-word Recognition System using Signification Analysis and Morphological Analysis)

안찬식;오상엽
- 한국멀티미디어학회논문지
- /
- 제13권11호
- /
- pp.1586-1593
- /
- 2010
확률적 패턴 매칭과 동적 패턴 매칭의 어휘 인식 오류 보정 방법에서는 핵심어를 기반으로 문장을 의미론적으로 분석하므로 형태론적 변형에 따른 핵심어 분석이 어려운 문제점을 가지고 있다. 이를 해결하기 위해 본 연구에서는 음절 복원 알고리즘에서 형태소 분석을 이용하여 인식된 음소 열을 의미 분석 과정을 통해 음소의 의미를 파악하고 형태론적 분석으로 문장을 복원하여 어휘 오인식률을 감소하였다. 시스템 분석을 위해 음소 유사률과 신뢰도를 이용하여 오류 보정률을 구하였으며, 어휘 인식 과정에서 오류로 판명된 어휘에 대하여 오류 보정을 수행하였다. 에러 패턴 학습을 이용한 방법과 오류 패턴 매칭 기반 방법, 어휘 의미 패턴 기반 방법의 성능 평가 결과 2.0%의 인식 향상률을 보였다.
PDF KSCI

Emotion recognition from speech using Gammatone auditory filterbank

레바부이;이영구;이승룡
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
- /
- pp.255-258
- /
- 2011
An application of Gammatone auditory filterbank for emotion recognition from speech is described in this paper. Gammatone filterbank is a bank of Gammatone filters which are used as a preprocessing stage before applying feature extraction methods to get the most relevant features for emotion recognition from speech. In the feature extraction step, the energy value of output signal of each filter is computed and combined with other of all filters to produce a feature vector for the learning step. A feature vector is estimated in a short time period of input speech signal to take the advantage of dependence on time domain. Finally, in the learning step, Hidden Markov Model (HMM) is used to create a model for each emotion class and recognize a particular input emotional speech. In the experiment, feature extraction based on Gammatone filterbank (GTF) shows the better outcomes in comparison with features based on Mel-Frequency Cepstral Coefficient (MFCC) which is a well-known feature extraction for speech recognition as well as emotion recognition from speech.

검색결과 858건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)