통합 검색 | Korea Science

PCA와 얼굴방향 정보를 이용한 얼굴인식 (Face recognition using PCA and face direction information)

김승재
- 한국정보전자통신기술학회논문지
- /
- 제10권6호
- /
- pp.609-616
- /
- 2017
본 논문은 얼굴 인식에 있어 안정적인 인식률을 얻기 위해 입력 영상에 대한 좌우 회전정보를 사용하여 보다 안정적이며 높은 인식률을 내기위한 알고리즘을 제안한다. 제안하는 알고리즘은 웹 카메라 환경에서 얼굴 영상을 입력정보로 사용하여 향상된 인식률을 얻기 위해 영상의 사이즈 축소 및 밝기와 컬러에 대한 정보를 정규화한 후 전처리 과정을 거쳐 얼굴 영역만을 분할 검출한다. 검출된 후보 영역에 대해 주성분분석(PCA)을 적용하여 특징벡터를 구하여 얼굴을 분류한다. 또한 인식률의 오차 범위를 줄이기 위해 입력되는 얼굴 영상에 대한 방향성을 고려하여 좌 우 $45^{\circ}$ 회전 정보를 가진 영상을 대상으로 데이터 셋을 구성하여 PCA로 각각의 특징벡터를 구하였다. 구해진 특징벡터로 안정된 인식률을 얻기 위해 고유공간에 뿌린 후 각각의 특징들을 대상으로 유클리디안(euclidean distant) 거리를 비교하여 최종 얼굴을 인식한다. PCA에 의한 특징벡터는 저차원의 데이터이지만 얼굴을 표현하는데 있어 아무런 문제가 없으며 계산량이 적어 인식 속도도 빠를 수 있다. 본 논문에서 제안하는 방법은 기존의 다른 알고리즘에 비해 빠른 인식과 인식률의 안전성과 정확성을 향상시킬 수 있고 실시간 인식 시스템에도 사용할 수 있다.
https://doi.org/10.17661/jkiiect.2017.10.6.609 인용 PDF KSCI

복합 특징과 결합 인식기에 의한 필기체 숫자인식 (Recognition of Handwritten Numerals using Hybrid Features And Combined Classifier)

박중조;송영기;김경민
- 한국정보통신학회논문지
- /
- 제5권1호
- /
- pp.14-22
- /
- 2001
필기체 숫자는 개인에 따라 필체가 매우 다양하므로 단일 특징과 단일 분류기를 사용하여 오프라인 필기체 숫자인식을 수행할 경우 높은 인식률을 얻기가 어렵다. 이에 본 논문에서는 복합 특징과 결합 인식기를 사용하여 필기체 숫자 인식의 인식률을 향상시키는 방안을 제시한다. 인식률의 향상을 위해, 먼저 상호 보완적인 특징들-방향특징, 교차점특징, 망특징-을 선정하고 이를 사용하여 숫자영상의 전역적 및 국부적 특징을 갖는 세 종류의 새로운 복합 특징을 구성한다. 그리고 패턴 인식기로는 세 개의 신경회로망 분류기를 퍼지 적분으로 결합한 결합 인식기를 사용한다. 본 인식기의 성능 평가를 위해 Concordia 대차의 무제약 필기체 숫자 데이터베이스를 사용하여 실험한 결과 97.85%의 인식률을 달성하였다.
PDF

적응 프루닝 알고리즘과 PDT-SSS 알고리즘을 이용한 한국어 연속음성인식에 관한 연구 (A Study on the Korean Continuous Speech Recognition using Adaptive Pruning Algorithm and PDT-SSS Algorithm)

황철준;오세진;김범국;정호열;정현열
- 한국멀티미디어학회논문지
- /
- 제4권6호
- /
- pp.524-533
- /
- 2001
연속음성인식 시스템의 실용화를 위해서 가장 중요한 것은 높은 인식 성능을 가지면서 동시에 실시간으로 인식되어야 한다. 이를 위하여 본 연구에서는 먼저 연속음성인식의 인식률 향상을 위하여 효과적인 음향모델을 구성하기 위하여 PDT-SSS(Phonetic Decision Tree-based Successive State Splitting) 알고리즘을 도입하여 HM-Net을 구성하고, 언어모델로서 반복학습을 이용하여 인식률 향상을 제고한다. 그리고, 기존의 연구에서 유효함이 입증된 프레임 단위 적응 프루닝 알고리즘을 연속음성에 적용하여 인식 속도를 개선하고자 한다. 제안된 방법의 유효성을 확인하기 위하여, 남성 4인이 항공편 예약 관련 음성에 대하여 인식 실험을 수행하였다. 그 결과 연속음성인식률 90.9%, 단어인식률 90.7%의 높은 인식성능을 얻었으며, 적응 프루닝 알고리즘을 적용한 경우 인식성능의 저하없이 약 1.2초(전체의 15%)의 인식시간을 줄일 수 있어 제안된 방법의 유효성을 확인할 수 있었다.
PDF

한국어 음성/문자 공용인식기의 성능향상을 위한 가변 상태수 CHMM모델의 구성 (Difference State Number of CHMM Model to Improve the Performance of SCCRS)

석수영;김민정;김광수;정호열;정현열
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
- /
- pp.95-98
- /
- 2002
문자인식 또는 음성인식을 위해 사용되어지는 CHMM(Continuous Hidden Markov Model)모델은 일반적으로 모델의 상태수를 일정한 수로 고정하는 고정 상태수 모델 구조를 가지고 있으나, 이는 개별적인 인식 단위의 특성을 고려하지 않은 경우로써 이를 고려한 가변 상태수 모델을 사용할 경우 인식률 향상을 기대할 수 있다. 개별적인 인식 단위에 적합한 모델 상태수를 결정하는 방법으로 파라미터 히스토그램 방법과, BIC(Bayesian Information Criterion)방법을 사용하는 것이 대표적이다. 이들 방법들은 개별적인 인식단위의 우도값만을 향상시키기 위한 방법으로 전체인식률과 직접적으로 비례하지는 않는다. 따라서, 본 논문에서는 고정 상태수를 갖는 모델 적용 방법과 인식단위별 상태수 변화에 따른 인식률을 비교하였으며, 이를 바탕으로 각 모델별 상태수를 달리하는 가변 상태수 CHMM모델 구성 방법을 제안한다. 제안된 가변상태수 모델의 유효성을 확인하기 위해 음성/문자 공용인식기 중 필기체 문자 인식에 적용한 결과 제안한 LM(Local Maximum)으로 구성된 가변 상태수 모델이 MLE와 BIC로 구성된 모델과 인식률 면에서는 거의 동일한 성능을 유지하면서 전체 상태수는 MLE 모델에 비해 $31\%$, BIC로 구성된 모델에 비해 $22\%$ 감소를 나타내어 제안한 모델의 유효성을 확인할 수 있었다.
PDF

PCA기반의 스테레오 얼굴영상에서 거리에 따른 인식률 비교 (Comparison of recognition rate with distance on stereo face images base PCA)

박장한;남궁재찬
- 대한전자공학회논문지SP
- /
- 제42권1호
- /
- pp.9-16
- /
- 2005
본 논문에서는 스테레오 영상에서 좌ㆍ우측 영상을 입력받아 거리 변화에 따른 얼굴인식률을 PCA(Principal Component Analysis) 알고리듬으로 비교한다. 제안된 방법에서는 RGB컬러공간에서 YCbCr컬러공간으로 변환하여 얼굴영역을 검출한다. 또한 스테레오 영상을 이용하여 거리를 취득한 후 추출된 얼굴영상의 확대 및 축소하여 보다 강건한 얼굴영역을 추출하고, PCA 알고리듬으로 인식률을 실험하였다. 취득된 얼굴영상의 평균적인 인식결과로 98.61%(30cm), 98.91%(50cm), 99.05%(100cm), 99.90%(120cm), 97.31%(150cm), 96.71%(200cm)의 인식률을 얻을 수 있었다. 따라서 실험을 통하여 제안된 방법은 거리에 따라 확대 및 축소를 적용하면 높은 인식률을 얻을 수 있음을 보였다.
PDF KSCI

이미지 내의 텍스트 데이터 인식 정확도 향상을 위한 멀티 모달 이미지 처리 프로세스 (Multi-modal Image Processing for Improving Recognition Accuracy of Text Data in Images)

박정은;주경돈;김철연
- 데이타베이스연구회지:데이타베이스연구
- /
- 제34권3호
- /
- pp.148-158
- /
- 2018
광학 문자 인식(OCR)은 텍스트를 포함한 이미지에서 텍스트 영역을 인식하고 이로부터 텍스트를 추출하는 기술이다. 전체 텍스트 데이터 중 상당히 많은 텍스트 정보가 이미지에 포함되어 있기 때문에 OCR은 데이터 분석 분야에 있어 중요한 전처리 단계를 담당한다. 대부분의 OCR 엔진이, 흰 바탕의 검정 글씨의 단순한 형태를 가진 이미지와 같은, 텍스트와 배경의 구분이 뚜렷한 저 복잡도 이미지에 대해서는 높은 인식률을 보이는 반면, 텍스트와 배경의 구분이 뚜렷하지 않은 고 복잡도 이미지에 대해서는 저조한 인식률을 보이기 때문에, 인식률 개선을 위해 입력 이미지를 OCR 엔진이 처리하기 용이한 이미지로 변형하는 전처리 작업이 필요하게 된다. 따라서 본 논문에서는 OCR 엔진의 정확성 증대를 위해 텍스트 라인별로 이미지를 분리하고, 영상처리 기법 기반의 CLAHE 모듈과 Two-step 모듈을 병렬적으로 수행하여 텍스트와 배경 영역을 효율적으로 분리한 후 텍스트를 인식한다. 이어서 두 모듈의 결과 텍스트에 대하여 N-gram방법과 Hunspell 사전을 결합한 알고리즘으로 인식률을 비교하여 가장 높은 인식률의 결과 텍스트를 최종 결과물로 선정하는 방법론을 제안한다. 대표적인 OCR 엔진인 Tesseract와 Abbyy와의 다양한 비교 실험을 통해 본 연구에서 제안하는 모듈이 복잡한 배경을 가진 이미지에서 가장 정확한 텍스트 인식률을 보임을 보였다.

교통정보 안내전화 음성인식 신뢰성에 대한 연구 (A Study on the Speech Recognition Reliability of Traffic Information ARS)

한대철;문학룡;류승기
- 대한전기학회:학술대회논문집
- /
- 대한전기학회 2011년도 제42회 하계학술대회
- /
- pp.1246-1247
- /
- 2011
지능형교통시스템(ITS) 구축 사업을 통해 수집된 소통정보, 대중교통정보 등의 교통관련 정보를 제공하기 위한 방법으로 교통정보 안내전화(ARS)를 적용하여 도로 이용자에게 교통정보를 제공하고 있다. 도로 이용자에게 보다 편리한 교통정보 서비스를 제공하기 위한 일환으로 교통정보 안내전화(ARS)에 음성인식을 적용하고 있다. 그러나 초기 ARS에 음성인식을 적용한 결과 음성인식 성공률은 상당히 높은 것으로 나타났으나, 이용자가 증가하여 샘플링 수가 증가함에 따라 음성 인식 성공률은 점차 저하되고 있는 실정이다. 이를 해결하기 위한 방안으로 충분한 샘플링을 확보하여 주기적이고 지속적인 음성인식에 대한 튜닝을 실시하여 음성인식에 대한 성공률을 향상 시킬 필요가 있다.
PDF

인공신경망을 이용한 숫자인식에 관한 연구 (A Study on Numerical Recognition Using Artificial Neural Network)

전민혁;김병욱
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2019년도 춘계학술발표대회
- /
- pp.511-514
- /
- 2019
인공지능이 정형화된 수치 데이터뿐만 아니라 비정형 데이터까지도 인식해야하는 시대가 왔다. 보안 분야 이외에도 사회 전반에서 숫자 인식을 활용하고 점차 확대되고 있다. 숫자인식을 위해 인공신경망을 이용하였다. 인공신경망은 입력 층, 중간 층, 출력 층으로 이루어져 있다. 각 층은 노드와 노드들을 연결하는 가중치로 구성되어 있다. data set을 입력 값으로 하여 각각의 가중치를 곱한다. 오차역전파법을 이용하여 가중치 값을 갱신한다. 갱신하는 과정에서 학습률과 가중치 조정을 통해 결과 값의 정확도를 연구한다. 궁극적으로 학습된 data set과 인공신경망 알고리즘을 이용하여 손 글씨로 된 숫자를 인식한다. 실험에서 학습률과 중간층의 노드 개수를 조정하여 인식률을 높여간다.
https://doi.org/10.3745/PKIPS.y2019m05a.511 인용 PDF

청각장애인을 위한 음성-자막 자동 변환 시스템 개발 및 음성 인식률 고도화 (Development and Enhancement of Automatic Caption Generation System based on Speech-to-Text for the Hearing Impaired)

최미애;김승현;조민애;박동영;김용호;윤종후
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 하계학술대회
- /
- pp.465-468
- /
- 2020
인터넷 미디어, OTT, VOD 등 신규미디어가 비장애인의 정보제공 매체로 널리 확대되나, 자막 서비스를 제공하지 않아 청각장애인의 정보 격차가 더욱 심화되고 있다. 청각장애인의 미디어 접근성 제고를 위해 음성인식 서버 및 스마트 폰·태블릿 앱 간 연계를 통해 음성을 인식하여 자동으로 자막을 생성하고 표시하는 음성-자막 자동 변환 시스템을 개발하였고 음성인식률을 높이기 위해 뉴스/시사/다큐 장르 영상 콘텐츠의 음성에 대해 학습용 데이터를 제작하여 음성인식 성능을 고도화 시켰다. 본 논문에서는 청각장애인을 위한 음성-자막 자동 변환시스템 구성과 음성인식률 비교 평가 결과를 보여준다.
PDF

A Robust Real-Time License Plate Recognition System Using Anchor-Free Method and Convolutional Neural Network

Kim, Dae-Hoon;Kim, Do-Hyeon;Lee, Dong-Hoon;Kim, Yoon
- 한국컴퓨터정보학회논문지
- /
- 제27권4호
- /
- pp.19-26
- /
- 2022
최근 지능형 교통 체계의 발전에 따라 자동차 번호판 인식 시스템이 다양한 분야에서 활용되고 있다. 주행 중인 자동차의 번호판을 인식하기 위해서는 실시간성이 보장되어야 하며, 영상이 왜곡되어 뚜렷하지 않거나 번호판의 크기가 작은 저해상도 영상에서도 높은 인식률이 유지되어야 한다. 본 논문에서는 자유 앵커 방식 기반의 객체 탐지 알고리즘과 합성곱 신경망(CNN) 기반의 문자 인식 알고리즘을 이용하여 처리 속도를 향상한 실시간 자동차 번호판 인식 시스템을 제안한다. 더불어 공간 변형 네트워크를 이용하여 저해상도 및 왜곡된 영상에서의 인식률을 높였다. 제안하는 시스템의 인식률은 93.769%, 이미지 당 처리 속도는 약 0.006초로 기존 자동차 번호판 인식 시스템보다 빠른 속도로 자동차 번호판을 인식하며, 다양한 환경 및 품질의 영상에 대해 높은 인식률을 유지하는 것을 확인할 수 있다.
https://doi.org/10.9708/jksci.2022.27.04.019 인용 PDF KSCI HTML

검색결과 3,096건 처리시간 0.036초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)