• Title/Summary/Keyword: 존재 인식

Search Result 2,165, Processing Time 0.026 seconds

A New Temporal Filtering Method for Improved Automatic Lipreading (향상된 자동 독순을 위한 새로운 시간영역 필터링 기법)

  • Lee, Jong-Seok;Park, Cheol-Hoon
    • The KIPS Transactions:PartB
    • /
    • v.15B no.2
    • /
    • pp.123-130
    • /
    • 2008
  • Automatic lipreading is to recognize speech by observing the movement of a speaker's lips. It has received attention recently as a method of complementing performance degradation of acoustic speech recognition in acoustically noisy environments. One of the important issues in automatic lipreading is to define and extract salient features from the recorded images. In this paper, we propose a feature extraction method by using a new filtering technique for obtaining improved recognition performance. The proposed method eliminates frequency components which are too slow or too fast compared to the relevant speech information by applying a band-pass filter to the temporal trajectory of each pixel in the images containing the lip region and, then, features are extracted by principal component analysis. We show that the proposed method produces improved performance in both clean and visually noisy conditions via speaker-independent recognition experiments.

Stable and Precise Multi-Lane Detection Algorithm Using Lidar in Challenging Highway Scenario (어려운 고속도로 환경에서 Lidar를 이용한 안정적이고 정확한 다중 차선 인식 알고리즘)

  • Lee, Hanseul;Seo, Seung-Woo
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.52 no.12
    • /
    • pp.158-164
    • /
    • 2015
  • Lane detection is one of the key parts among autonomous vehicle technologies because lane keeping and path planning are based on lane detection. Camera is used for lane detection but there are severe limitations such as narrow field of view and effect of illumination. On the other hands, Lidar sensor has the merits of having large field of view and being little influenced by illumination because it uses intensity information. Existing researches that use methods such as Hough transform, histogram hardly handle multiple lanes in the co-occuring situation of lanes and road marking. In this paper, we propose a method based on RANSAC and regularization which provides a stable and precise detection result in the co-occuring situation of lanes and road marking in highway scenarios. This is performed by precise lane point extraction using circular model RANSAC and regularization aided least square fitting. Through quantitative evaluation, we verify that the proposed algorithm is capable of multi lane detection with high accuracy in real-time on our own acquired road data.

Automatic Generation of Training Data for Korean Speech Recognition Post-Processor (한국어 음성인식 후처리기를 위한 학습 데이터 자동 생성 방안)

  • Seonmin Koo;Chanjun Park;Hyeonseok Moon;Jaehyung Seo;Sugyeong Eo;Yuna Hur;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.465-469
    • /
    • 2022
  • 자동 음성 인식 (Automatic Speech Recognition) 기술이 발달함에 따라 자동 음성 인식 시스템의 성능을 높이기 위한 방법 중 하나로 자동 후처리기 연구(automatic post-processor)가 진행되어 왔다. 후처리기를 훈련시키기 위해서는 오류 유형이 포함되어 있는 병렬 말뭉치가 필요하다. 이를 만드는 간단한 방법 중 하나는 정답 문장에 오류를 삽입하여 오류 문장을 생성하여 pseudo 병렬 말뭉치를 만드는 것이다. 하지만 이는 실제적인 오류가 아닐 가능성이 존재한다. 이를 완화시키기 위하여 Back TranScription (BTS)을 이용하여 후처리기 모델 훈련을 위한 병렬 말뭉치를 생성하는 방법론이 존재한다. 그러나 해당 방법론으로 생성 할 경우 노이즈가 적을 수 있다는 관점이 존재하다. 이에 본 연구에서는 BTS 방법론과 인위적으로 노이즈 강도를 추가한 방법론 간의 성능을 비교한다. 이를 통해 BTS의 정량적 성능이 가장 높은 것을 확인했을 뿐만 아니라 정성적 분석을 통해 BTS 방법론을 활용하였을 때 실제 음성 인식 상황에서 발생할 수 있는 실제적인 오류를 더 많이 포함하여 병렬 말뭉치를 생성할 수 있음을 보여준다.

  • PDF

A Study on Weighted Spectral Subtraction Using Adaptive Threshold In Car Noise Environment (차량내 잡음 환경에서 적응적 경계값을 이용한 가중치 주파수 차감에 관한 연구)

  • 전선도
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.185-188
    • /
    • 1998
  • 실제의 음성 인식 및 음성 통신 등의 음성 처리 시스템에서는 음성 신호를 손상시키는 배경 잡음 신호의 존재로 그 성능이 많이 저하된다. 특히 차량 내와 같은 잡음이 극심한 상황에서는 전처리 부분에서 이러한 잡음을 제거시켜 주어야한다. 본 연구는 자동차 내의 배경 잡음에 의해 손상된 음성에서 배경 잡음을 주파수 차감에 의하여 제거시킨다. 특히 음성 정보의 손실이 적은 잡음 추정 방법으로 가중치를 이용하여 잡음을 추정하는 가중치 주파수 차감법을 이용하였다. 이러한 가중치 주파수 차감법 사용의 전제 조건은 잡음의 변화가 완만한 경우에 적당하다. 그러나 실제적인 상황에서 배경잡음신호의 변화가 큰 경우가 존재한다. 이러한 이유에서 본 연구는 잡은 추정시 잡음 추정값을 이용하여 추정 잡음 경계값을 적응적으로 변화하는 차감법을 제안한다. 이러한 방법은 추정된 잡음 신호의 변화율을 이용하여 경계값을 상황에 따라 적응적으로 변화시키는 방법이다. 모의 실험에 의하여 고정적인 경계값을 갖는 가중치 주파수 차감법에 비해 제안한 적응적 경계값을 갖는 가중치 주파수 차감법의 출력 SNR이 증가함을 확인하였고, 음성 인식 시스템에 정용한 인식 실험에서도 성능이 향상됨을 확인하였다.

  • PDF

A High-Precision Indoor Localization Technique using Ultrasonic and/or IEEE 802.15.4a based Bilateration (초음파 및 IEEE 802.15.4a 기반 이변 측위를 이용한 고정밀 실내 위치 인식 기법)

  • Nam, Young Jin;Park, Young-Kyun;Nam, Min-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.804-806
    • /
    • 2009
  • 최근 실내 위치 인식을 위하여 IEEE 802.15.4a에 기반한 거리측정 및 이 값들을 이용한 다양한 위치 인식 기법이 제안되고 있다. 본 논문에서는 실내에서 간단한 초음파 모듈과 적은 수의 IEEE 802.15.4a 노드를 이용하여 고정밀 위치정보를 제공하는 기법을 제시한다. 제안된 기법이 기존의 삼변측량기법에 비해서 실내환경에 존재하는 다양한 전파 방해에 덜 민감하여 보다 높은 정밀도를 제공한다는 것을 실제적인 구현과 실험을 통하여 검증한다. 또한, 제안된 기법은 삼변측량을 이용할 때보다 상대적으로 적은 수의 노드를 이용하기 때문에 경제적인 측면에서도 이점이 존재한다.

Endpoint Detection in the Car Noise Environment for Speech Recognition (음성인식을 위한 자동차 소음환경에서의 끝점 검출)

  • 서동권;신원호;양태영;김원구;윤대희
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.1
    • /
    • pp.76-79
    • /
    • 1998
  • 소음이 존재하지 않는 환경에서는 에너지 파라메터만으로도 정확한 끝점 검출을 수 행할 수 있으나 신호대 잡음비가 0dB에 가까운 자동차 환경에서는 끝점 검출이 거의 불가 능하다. 본 논문에서는 자동차 소음 환경에서 음성 구간 검출을 위하여 단구간 영교차율과 2∼4kHz의 주파수 영역 에너지를 사용한 끝점 검출 방법을 제안하였다. 제안된 방법과 기 존의 방법의 성능을 DTW를 이용한 단독음 인식 시스템에 적용하여 인식률로 비교하였으 며 제안된 음성 구간 검출 방법을 적용한 경우가 보다 좋은 인식률을 나타내었다.

  • PDF

Effective Speaker Recognition Technology Using Noise (잡음을 활용한 효과적인 화자 인식 기술)

  • Ko, Suwan;Kang, Minji;Bang, Sehee;Jung, Wontae;Lee, Kyungroul
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.259-262
    • /
    • 2022
  • 정보화 시대 스마트폰이 대중화되고 실시간 인터넷 사용이 가능해짐에 따라, 본인을 식별하기 위한 사용자 인증이 필수적으로 요구된다. 대표적인 사용자 인증 기술로는 아이디와 비밀번호를 이용한 비밀번호 인증이 있지만, 키보드로부터 입력받는 이러한 인증 정보는 시각 장애인이나 손 사용이 불편한 사람, 고령층과 같은 사람들이 많은 서비스로부터 요구되는 아이디와 비밀번호를 기억하고 입력하기에는 불편함이 따를 뿐만 아니라, 키로거와 같은 공격에 노출되는 문제점이 존재한다. 이러한 문제점을 해결하기 위하여, 자신의 신체의 특징을 활용하는 생체 인증이 대두되고 있으며, 그중 목소리로 사용자를 인증한다면, 효과적으로 비밀번호 인증의 한계점을 극복할 수 있다. 이러한 화자 인식 기술은 KT의 기가 지니와 같은 음성 인식 기술에서 활용되고 있지만, 목소리는 위조 및 변조가 비교적 쉽기에 지문이나 홍채 등을 활용하는 인증 방식보다 정확도가 낮고 음성 인식 오류 또한 높다는 한계점이 존재한다. 상기 목소리를 활용한 사용자 인증 기술인 화자 인식 기술을 활용하기 위하여, 사용자 목소리를 학습시켰으며, 목소리의 주파수를 추출하는 MFCC 알고리즘을 이용해 테스트 목소리와 정확도를 측정하였다. 그리고 악의적인 공격자가 사용자 목소리를 흉내 내는 경우나 사용자 목소리를 마이크로 녹음하는 등의 방법으로 획득하였을 경우에는 높은 확률로 인증의 우회가 가능한 것을 검증하였다. 이에 따라, 더욱 효과적으로 화자 인식의 정확도를 향상시키기 위하여, 본 논문에서는 목소리에 잡음을 섞는 방법으로 화자를 인식하는 방안을 제안한다. 제안하는 방안은 잡음이 정확도에 매우 민감하게 반영되기 때문에, 기존의 인증 우회 방법을 무력화하고, 더욱 효과적으로 목소리를 활용한 화자 인식 기술을 제공할 것으로 사료된다.

  • PDF

전력수송의 고속도로 765kV 송전기술①

  • 이동일
    • Electric Engineers Magazine
    • /
    • v.249 no.5
    • /
    • pp.32-35
    • /
    • 2003
  • 전기의 존재는 이미 기원전 600년경 호박을 마찰시켰을 때 발생하는 마찰전기에서 인류가 최초로 인식되었으며 이러한 이유로 전기의 어원은 호박에서 비롯되었다. 이후 지구상에 존재하는 전기를 인류가 에너지원으로 활용하기 시작한 것은 1880년경 에디슨이 처음으로 전구를 발명하여 실용화한 이후였으며 이렇게 실용화된 전기의 활용은 초기에 매우 작은 규모의 직류로 공급과 소비가 이루어졌다.

  • PDF

Face Recognition System using Machine Learning (Machine Learning을 이용한 얼굴 인식 전자 출결 시스템)

  • Lee, Jang-Yeol;Lee, Seo-Woo;Won, Jong-Min;Shin, Dong-Ryeol
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.07a
    • /
    • pp.137-140
    • /
    • 2017
  • 전자 출결의 방식으로 NFC, Bluetooth, Wi-Fi, RFID등의 통신 방식의 전자 출결과 생체 인식 방법의 전자 출결인 지문 인식, 홍채 인식, 얼굴 인식 등이 있다. 그러나 대부분의 전자 출결 시스템은 초기 구축 및 시스템 오류 발생에 따른 유지보수의 어려움이 존재하고, 통신 방식의 전자 출결에서는 신호의 간섭 및 감쇄로 인한 불안정한 출석 문제가 발생한다. 그리고 생체 인식방식의 전자 출결의 경우에는 고가의 장비가 요구된다. 본 논문에서는 스마트 폰 Application 및 머신 러닝 framework인 Apache Spark를 이용하여 초기 구축 단계 이후 발생하는 유지보수 비용을 최소화하고, 머신 러닝을 이용하여 얼굴 인식률을 높이는 방법을 제안한다. 또한 제안하는 시스템을 이용하는 사용자가 출결을 진행할수록 인식률이 향상되는 방법을 제안한다.

  • PDF

Speech Data Base Construction at LG Electronics (LG 전자의 음성 DB 구축 현황)

  • 김락용
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.280-282
    • /
    • 1995
  • 음성인식시스템 개발을 위해서는 음성 데이터베이스 구축이 필요하며 이를 위해 LG 전자에서 구축한 두 가지 데이터베이스에 관해서 기술한다. LG 전자에서 보유한 음성 데이터 베이스는 차량 및 전화 선로상에 존재하는 잡음이 포함된 상태에서 수집한 숫자음과 제어 단어로 이루어져 있으며 마이크와 핸드셋을 통과한 음서잉 사용되었으며, 화자 독립 음성 인식을 위한 400-500 명분의 화자로 구성되어 있다.

  • PDF