• 제목/요약/키워드: 디지털 사용 인식

검색결과 725건 처리시간 0.026초

디지털 영상처리 기법을 이용한 동전 분류 및 인식 (Coin Recognition and Classification Using Digital Image Processing)

  • 이정표;이종연;현창호
    • 한국지능시스템학회논문지
    • /
    • 제22권1호
    • /
    • pp.7-11
    • /
    • 2012
  • 본 연구는 USB카메라를 통해서 얻은 동전 영상을 가지고 디지털 영상처리 기법을 적용하여 동전을 인식하고 동전별 분류를 하는 기법을 제안 및 개발한다. 본 작품은 가정에서도 동전을 계산할 때, 쉽고 빠르게 계산할 수 있는 편의성을 제공해 주는 장점을 가지고 있다. 본 작품의 개발을 위해서 USB 카메라를 사용하였고, 동전의 크기 및 색깔별 분류를 위하여 디지털 영상처리 기법을 사용하였다. 마지막으로, 제안한 작품의 완성도 및 신뢰성 검증을 위하여 MATLAB을 이용하여 분류 기준에 따른 정확도를 모의실험 하였고, 또한 MATLAB과 일반 PC를 이용하여 동전 분류 시스템을 제작하였다.

가우시안 분포에서 Maximum Log Likelihood를 이용한 벡터 양자화 기반 음성 인식 성능 향상 (Vector Quantization based Speech Recognition Performance Improvement using Maximum Log Likelihood in Gaussian Distribution)

  • 정경용;오상엽
    • 디지털융복합연구
    • /
    • 제16권11호
    • /
    • pp.335-340
    • /
    • 2018
  • 정확한 인식률을 보이고 있는 상업적인 음성인식 시스템은 화자종속 고립데이터로부터 학습 모델을 사용한다. 그러나 잡음 환경에서 데이터양에 따라 음성인식의 성능이 저하되는 문제점이 있다. 본 논문에서는 가우시안 분포에서 Maximum Log Likelihood를 이용한 벡터 양자화 기반 음성 인식 성능 향상을 제안한다. 제안하는 방법은 음성에 대한 특징을 가지고 벡터 양자화와 Maximum Log Likelihood 음성 특징 추출 방법을 이용하여 유사 음성에 대한 음성 인식의 정확성을 높이는 최적 학습 모델 구성 방법이다. 이를 위해 HMM을 기반으로 음성 특징을 추출하는 방법을 사용한다. 제안하는 방법을 사용하여 기존 시스템에서 생성되어 사용되는 음성 모델에 대한 부정확한 음성 모델에 대한 정확성을 향상시킬 수 있으므로 음성 인식에 강인한 모델을 구성할 수 있다. 제안하는 방법은 음성 인식 시스템에서 향상된 인식의 정확도를 보인다.

딥러닝 기반 사용자 친화형 키오스크 시스템 (An User-Friendly Kiosk System Based on Deep Learning)

  • 강수연;이유진;정현아;조승아;이형규
    • 한국산업정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.1-13
    • /
    • 2024
  • 본 연구는 키오스크 사용 증가로 인한 변화에 대응하기 위해 사용자 특성을 고려한 맞춤형 동적 키오스크 화면을 제공하는 것을 목표로 한다. 디지털 취약계층인 시각장애인, 노인, 어린이, 휠체어 사용자 등의 특성에 따른 화면 구성의 최적화를 위해 객체 탐지, 걸음걸이 인식, 음성발화 인식기술을 종합하여 사용자의 특성(휠체어 사용 여부, 시각 장애, 연령 등)을 실시간으로 분석하고, 이를 기반으로 9개의 카테고리로 사용자를 분류한다. 키오스크 화면은 사용자의 특성에 따라 동적으로 조정되어 효율적인 서비스 제공이 가능하다. 본 연구는 임베디드 환경에서 시스템 통신 및 운용이 이루어졌으며, 사용된 객체 탐지, 걸음걸이 인식, 음성발화 인식 기술은 각각 74%, 98.9%, 96%의 정확도를 보여준다. 제안된 기술은 프로토타입을 구현하여 그 효용성을 검증하였으며, 이를 통해 본 연구가 디지털 격차의 축소와 사용자 친화적인 "배리어 프리 키오스크" 서비스 제공의 가능성을 보였다.

개선된 Levenshtein Distance 알고리즘을 사용한 어휘 탐색 시스템 (Vocabulary Retrieve System using Improve Levenshtein Distance algorithm)

  • 이종섭;오상엽
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.367-372
    • /
    • 2013
  • 기존의 Levenshtein distance 알고리즘은 어휘들 간의 순서가 정해져 있지 않은 경우에 사용되므로 어휘 탐색 작업의 중요도를 구분할 수 없는 단점을 가진다. 본 연구에서 제안하는 개선된 Levenshtein 방법에서는 효율적으로 사용빈도에 따라 어휘들을 탐색하고, 어휘들 간의 순서를 가지는 가중치를 부여한다. 따라서 어휘의 수가 증가하는 경우에도 효율적으로 사용빈도에 따라 어휘를 탐색하여 인식율이 저하되는 단점을 해결하고, 인식 시간을 향상 및 탐색 공간의 효율적으로 관리할 수 있는 장점을 가진다. 제안한 시스템을 분석한 결과 실내 환경에서 어휘 종속 인식률은 97.81%, 어휘 독립 인식률은 96.91%의 인식률을 나타났다. 또한, 실외 환경에서 어휘 종속 인식률은 91.11%, 어휘 독립 인식률은 90.01%의 인식률을 나타났다.

디지털교과서 활용 학교 교사의 테크놀로지 리더십 인식수준 분석 (Assessing Technology Leadership Perception of Teachers in Digital Textbook Utilizing Schools)

  • 송연옥;변호승
    • 컴퓨터교육학회논문지
    • /
    • 제14권1호
    • /
    • pp.147-158
    • /
    • 2011
  • 이 연구는 디지털교과서(Digital Textbook; DT) 활용 학교 교사의 테크놀로지 리더십에 대한 요구 및 수준을 규명하는 것을 목적으로 하였다. 연구의 대상은 2009년도 디지털교과서 연구학교에서 디지털교과서를 사용하고 있는 초등학교 교사 97명(남 40명, 여57명) 이었다. 요구분석조사를 위한 도구는 기존의 테크놀로지 리더십 역량을 디지털교과서 환경에 맞게 수정하여 사용하였고, 보리치(Borich) 공식을 이용하여 요구도를 산출 및 해석 하였다. 연구 결과, 디지털교과서 연구학교 교사들이 가장 중요하게 인식하고 있는 영역은 교사 '본인의 교수 학습방법'이었으며, 현 수준이 가장 낮다고 인식하는 영역은 '학교지원'인것으로 나타났다. 각 영역별로 개선필요성이 가장 높다고 인식하고 있는 테크놀로지 리더십 항목들은 '디지털교과서 활용에 대한 구성원 간 역할 분담', '창의성을 배양할 수 있는 디지털교과서 교수 학습 방법', '디지털교과서 문제 발생 시 대처 능력', '디지털교과서 문제 발생 시 보조 인력 지원', '디지털교과서 효과 측정을 위한 다양한 평가도구 개발', '장애 학생을 위한 디지털교과서 자원 지원'인 것으로 분석되었다. 이 결과를 바탕으로 디지털교과서의 성공적인 학교 도입을 위해 테크놀로지 리더십을 향상시킬 수 있는 방법들을 구체적으로 제안하였다.

  • PDF

휴대폰에서의 홍채인식 연구

  • 박강령
    • 전자공학회지
    • /
    • 제33권1호
    • /
    • pp.35-45
    • /
    • 2006
  • 최근 휴대폰에서 개인 정보 보안의 중요성이 대두되고 있으며, 이에 따라 생체인식 기능을 내장한 휴대폰에 관심이 집중되고 있으므로, 본 논문에서는 휴대용 기기에 홍채인식기술을 적용하기 위한 방법을 제안하고 하다. 기존의 홍채인식 알고리즘은 인식을 위해 확대된 홍채영상을 사용하여 처리하였고, 이러한 홍채영상을 획득하기 위해서 고 배율의 줌 렌즈(zoom lens)와 초점 렌즈(focus lens)를 사용하였다. 그런데, 휴대폰에서의 홍채인식을 시도하기 위해 줌렌즈와 초점렌즈를 장착하게 되면 가격이 상승하고 부피가 증가되어, 작고 휴대하기 편리한 휴대폰의 특징에 맞지 않아 사용하기 어려운 문제가 있다. 그러나 최근 휴대폰의 멀티미디어 기기 융복합 추세로 인해 휴대폰 내에 장착된 메가 픽셀 카메라(Mega-pixel Camera)의 성능이 급속히 발전함에 따라, 고 배율의 줌, 초점 렌즈 없이도 확대된 홍채영상의 획득이 가능하게 되었다. 즉, 메가 픽셀 카메라 폰을 사용하여 사용자로부터 원거리에서 취득한 얼굴영상에서 홍채 영역이 홍채인식을 위해 충분한 픽셀정보를 가지게 된다. 그러나 이러한 경우 입력 얼굴영상에서 눈 영역을 먼저 찾는 과정이 요구된다. 본 논문에서는 이러한 얼굴영상에서 각막에 의해 반사되는 조명 반사광을 기반으로 휴대폰에서의 홍채인식을 위한 고속 동공검출 방법을 제안한다. 또한 입력 영상 신호를 디지털 신호로 변환하는 과정에서 밝기와 대조 값을 조정하여 동공의 검은 영역과 조명 밝은 반사 위치를 추출함으로써, 정확한 홍채 영역을 보다 빠르고 쉽게 추출할 수 있는 방법 역시 제안한다. 그리고 일반적으로 휴대폰에서 홍채 인식의 경우 손으로 들고 사용하므로, 손 흔들림에 의한 영상 흐림 현상이 빈번하게 발생하게 된다. 이러한 문제를 해결하기 위하여 본 연구에서는 영상 복원 기법을 적용하여 흐려진 홍채 영상을 복원하는 기법을 제안한다. 마지막으로, 휴대폰의 경우 실외에서 사용이 빈번함으로, 입력 홍채 영상에서 태양광에 의한 영향을 많이 받게 된다. 이러한 문제를 해결하여 홍채 인식 성능을 개선할 수 있는 방법 역시 소개하고자 한다.

  • PDF

인터액티브 커뮤니케이션을 위한 햅틱장치의 설계

  • 최정수;백윤수
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2004년도 춘계학술대회 논문요약집
    • /
    • pp.186-186
    • /
    • 2004
  • 정보화 산업의 급속한 발전을 통하여 무수히 많은 양의 정보들이 디지털화되어 왔고, 이러한 정보를 인식하기 위해서 인간은 멀티미디어나 컴퓨터를 통해 디지털화된 환경에 접속하게 되는데, 이는 시각과 청각을 통해 디지털화된 정보를 인간에게 전달하여 준다 이러한 시각과 청각을 이용한 정보 입출력 장치를 장시간 사용할 경우 정신적으로나 육체적으로 피곤함[l]과 지루함을 느끼게 되고, 장시간 사용이후에도 외부환경에 대한 반응이 일순간 둔감해질 수도 있다.(중략)

  • PDF

HMM을 기반으로 한 사전 확률의 문제점을 해결하기 위해 베이시안 기법 어휘 인식 모델에의 사후 확률을 융합한 잡음 제거 (Noise Removal using a Convergence of the posteriori probability of the Bayesian techniques vocabulary recognition model to solve the problems of the prior probability based on HMM)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제13권8호
    • /
    • pp.295-300
    • /
    • 2015
  • 사전 확률분포를 모델링하는 HMM을 사용하는 어휘 인식에서 인식 어휘의 모델들의 대한 인식 확률이 이산적인 분포를 나타내며 인식을 위한 계산량이 적은 장점이 있지만 인식률을 계산했을 때 상대적으로 낮은 단점이 있다. 이를 개선하기 위하여 베이시안 기법 어휘 인식 모델을 융합한 잡음 제거 인식률 향상을 제안한다. 본 논문은 베이시안 기법 어휘 인식을 위한 모델 구성을 베이시안 기법의 최적화한 인식 모델을 구성하였다. HMM을 기반으로 한 사전 확률 방법과 베이시안 기법인 사후확률을 융합하여 잡음을 제거하고 인식률을 향상시켰다. 본 논문에서 제안한 방법을 적용한 결과 어휘 인식률에서 98.1%의 인식률을 나타내었다.

키넥트를 사용한 NUI 설계 및 구현 (A Design and Implementation of Natural User Interface System Using Kinect)

  • 이새봄;정일홍
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권4호
    • /
    • pp.473-480
    • /
    • 2014
  • 오늘날 컴퓨터의 사용이 대중화 되면서 키보드나 마우스와 같은 기존의 사용자 인터페이스에 비해 보다 편리하고 자연스러운 인터페이스에 대한 연구가 활발히 진행되면서, 최근 마이크로소프트의 동작 인식 모듈인 키넥트에 대한 관심이 높아지고 있다. 키넥트는 내장된 센서를 통해 신체의 주요 관절의 움직임 및 깊이 정보를 인식할 수 있으며 내장 마이크를 통해 간단한 음성인식도 가능하다. 본 논문에서는 OpenCV 라이브러리를 키넥트에 접목하여, 키넥트의 깊이 데이터, skeleton tracking, labeling 알고리즘으로 손 영역 추출 및 움직임의 정보를 인식하여 가상 마우스와 가상 키보드를 구현하고, 음성인식을 통해 기존 입력 장치의 기능을 구현하는 것을 목표로 한다.

신성장동력산업용 대어휘 음성인식 기술 동향 및 응용

  • 강점자;강병옥;정호영;정훈;이윤근
    • 전자통신동향분석
    • /
    • 제23권1호통권109호
    • /
    • pp.65-76
    • /
    • 2008
  • 신성장동력산업용 음성인식 기술은 지능형 로봇, 텔레매틱스, 홈네트워크, 차세대 PC, 디지털 콘텐츠 검색 등에 음성인식 기술을 적용하기 위한 것이다. 음성인식 기술은 사람이 일상생활 속에서 사용하는 단말기들의 제어나 정보 서비스를 마우스나 키보드를 사용하지 않고, 사람이 갖는 가장 친화적이면서 편리한 의사소통 도구인 목소리를 사용하여 원하는 단말기의 제어나 정보 서비스를 제공 받을 수 있도록 지원하는 기술을 말한다. 본 고에서는 음성인식 기술의 발전과정을 통한 음성인식 기술의 발전 동향에 대해서 설명하고, 신성장동력산업 분야의 인터페이스로 음성인식 기술을 적용한 핵심 요소 기술에 대한 개발 동향과 응용 사례에 대해서 기술한다.