• 제목/요약/키워드: 인식기 융합

검색결과 229건 처리시간 0.023초

스마트 이동단말 기반 시선 추적기 설계 (A Design of Gaze Tracker based on Smart Mobile Device)

  • 고기남;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1455-1456
    • /
    • 2013
  • 최근 스마트 이동단말에 장착된 영상 센서를 통해 획득한 영상에서 실시간으로 사용자의 눈을 인식하거나 시선을 추적하여 콘텐츠 제어, 행태 분석 등을 수행하는 기술에 대한 필요성이 증가하고 있다. 기존의 영상 분석 기반 시선 추적 기술은 고가의 시선 추적기를 기반으로 하며, 추적한 시선 좌표를 통해 실제 응시객체를 분석하는 사후 작업이 필요하다. 이에, 본 논문에서는 OpenCV를 기반으로 스마트 이동단말의 전면에 장착된 영상 센서에서 사용자의 눈을 인식하고, 시선을 추적한 후, 이를 실시간으로 시선 좌표와 화면의 콘텐츠 내 객체 영역을 매칭함으로써, 응시객체를 분석하는 스마트 이동단말 기반 시선 추적기를 설계하였다. 본 논문의 시선 추적기는 시선 추적을 수행하기 위해, 사용자에게 5개의 화면 교정점을 제공하고 응시하도록 하여 시선 추적 범위를 측정한다. 또한, 스마트 이동단말에 내장된 자이로스코프 센서를 통해 기울기가 변경될 시, 이를 반영하여 시선 교정을 수행하도록 설계하였다.

기계 번역기의 언어별 외래어 인식 정확도 비교 연구 (A Comparative Study on the Machine Translation Accuracy of Loanword by Language)

  • 김규석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.319-322
    • /
    • 2021
  • 4차 산업혁명 시대에는 빠른 무선 네트워크와 빅데이터를 기반으로 다양한 기술과 서비스들이 생겨나고 있다. 이런 환경 속에서 우리는 언제 어디서나 스마트폰을 통해 음악을 듣고, 게임을 하며, 웹서핑을 하는 등 PC에 버금가는 다양한 활동을 할 수 있다. 누구든 쉽게 전세계의 웹페이지에 접속하고 SNS를 통해 외국인 친구들과도 쉽게 연락을 할 수 있다. 기계 번역 기술 또한 이렇게 사용자가 늘어나는 만큼 빅데이터를 기반으로 그 정확도가 향상되고 있다. 그러나 일반 명사나 구문과는 다르게 은어, 외래어 등의 사용빈도가 상대적으로 낮은 단어들에 대한 기계 번역 정확도는 여전히 개선이 필요하다. 본 연구에서는 국내에서 가장 많이 사용되는 기계 번역기인 papago 번역기와 Google 번역기의 외래어 인식 정확도에 대한 비교 연구를 진행하였다. 추후, 본 연구 결과를 통해 앞으로의 새로운 연구 방향을 제시한다.

dSPACE 보드를 이용한 음성인식 명령처리시스템 실시간 구현에 관한 연구 (A study on real-time implementation of speech recognition and speech control system using dSPACE board)

  • 김재웅;정원용
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.173-176
    • /
    • 2000
  • 음성은 인간이 가진 가장 편리한 제어전송수단으로 이를 통한 제어는 인간에게 많은 편리함을 제공할 것이다. 본 논문에서는 다층구조 신경망(Multi-Layer Perceptron)을 이용하여 간단한 음성인식 명령처리시스템을 Matlab 상에서 구성해 보았다. 음성인식을 통한 제어의 목적을 위해 화자종속, 고립단어인식기를 목표로 설정하여 연구를 수행하였다. 음성의 시작점과 끝점을 검출하기 위해 단구간 에너지와 영교차율(ZCR)을 이용하였고 인식기의 특징파라미터로는 12차 LPC켑스트럼 계수를 사용하였다. 그리고 신경망의 출력값을 기동, 정지시에 활성화되도록 3개의 계층으로 하였고, 신경망의 뉴런의 개수를 각각 12, 12, 2으로 설정하였다. 먼저 기준음성패턴으로 학습시킨 후에 Matlab 환경하에 동작하는 dSPACE 실시간처리보드에 변환된 C프로그램을 다운로드하고, 음성을 입력하여 인식 후 dSPACE보드의 D/A컨버터의 출력단에 연결된 DC모터를 기동, 정지제어를 수행하였다. 실시간 음성인식 명령처리 시스템 구현을 통하여 원격제어와 같은 음성명령을 통한 제어가 가능함을 확인할 수 있었다.

  • PDF

문맥정보를 이용한 이중모드 음성인식 (Blmodal Speech Recognition Using Contextual Feature)

  • 류정우;김은주;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.631-633
    • /
    • 2004
  • 최근 잡음환경에서 신뢰도 높은 음성인식을 위해 음성정보와 영상정보를 융합하는 이중모드 음성인식 방법이 활발히 연구되고 일다. 본 논문에서는 보다 음성 인식률을 향상시키기 위해 사용자가 말한 단어들의 순차 패턴을 나타내는 문맥정보를 이용한 후처리 방법을 제안한다. 이러한 문맥정보를 인식하기 위해 다층퍼셉트론 구조를 갖는 문맥정보 인식기를 제안한다 이중모드 음성인식기와 문맥정보 인식기 결과를 효율적으로 결합하기 위한 후처리 방법으로 순차 결합방법을 제안한다. 문맥정보를 이용한 이중모드 음성인식이 잡음 환경에서 90%이상의 인식률을 보였다 본 논문은 잡음환경에서 강인한 음성인식을 위해 문맥정보와 같은 사용자 행동패턴이 새로운 정보로 이용될 수 있다는 가능성을 제시한다.

  • PDF

독립성분분석법을 이용한 음성인식기의 성능향상 (Performance Improvement of Speech Recognition Based on Independent Component Analysis)

  • 김창근;한학용;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
    • /
    • pp.285-288
    • /
    • 2001
  • 본 논문에서는 신호간의 의존성과 관련성이 최소가 되도록 분리하는 독립성분분석 법을 이용하여 입력음성에서 변동량이 많은 방향으로 주축을 찾아 그 정보를 이용하여 데이터의 중복성을 제거한 후 음성특징벡터를 추출하는 방법을 제안한다. 학습 하고자하는 음성인식기의 음성에서 독립성분분석법을 이용하여 특징벡터를 추출하고 HMM 을 사용하여 기존의 음성특징벡터로 사용되는 mel-cepstrum과 비교하여 학습, 인식실험을 수행하였으며 제안한 방법에서 음성인식성능의 향상을 확인할 수 있었다. 또한, 인식시 주변여건에 따라 잡음에 의한 인식성능 저하에도 유연히 대처할 수 있음을 앞 수 있었다.

  • PDF

등록 지문의 정보 융합에 관한 연구 (Fingerprint Fusion Based on Minutiae and Ridge for Enrollment)

  • 이동재;최경택;이상훈;김재희
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.93-100
    • /
    • 2004
  • 본 논문은 등록 지문의 정보를 융합하여 보다 많은 정보를 이용함으로써 지문 검증의 성능을 향상시키는 방법을 제안한다. 크기가 작은 센서는 많은 응용 분야에 적용시킬 수 있는 장점을 가지지만, 실제 지문을 입력 받는 센서 입력창의 물리적인 크기가 작기 때문에 지문 정보를 충분히 입력받지 못할 뿐만 아니라 등록된 지문 영상과 검증을 위해 입력된 지문 영상 사이의 공통영역이 축소되어 전체적인 시스템의 성능을 저하시키는 문제점이 있다. 이러한 문제점은 등록 영상을 여러 장 받아 그 정보를 융합하여 보다 큰 지문 영역을 표현하도록 함으로써 해결할 수 있다. 이를 위해서는 등록 영상간의 좌표계를 정밀하게 일치시키는 과정이 무엇보다 중요하다. 본 논문에서는 먼저 등록영상 사이의 대응 특징점 쌍을 이용하여 거칠게 일치시킨 다음, 융선의 정보를 포함하는 Distance Map을 이용하여 정밀하게 일치시키는 방법을 사용하였다. 정밀하게 일치된 좌표계를 통해 각각의 등록 지문들의 특징 정보는 하나의 큰 등록 정보로 형성된다. 제안된 방법을 통해 형성된 특징 융합 정보는 보다 넓은 면적의 지문을 표현할 수 있기 때문에 센서 입력창이 작아서 생기는 문제를 극복함으로써 지문 인식기의 성능을 향상시킨다. 본 논문의 실험 견과는 제안한 융합 특징 정보를 이용하는 방법이 그렇지 않은 방법보다 지문 인식기의 성능을 월등하게 향상시킴을 보여준다.

딥러닝 기반 OCR 인식 엔진의 정확도 향상을 위한 전/후처리기 기술 구현 (Implementation of Pre-Post Process for Accuraty Improvement of OCR Recognition Engine Based on Deep-Learning Technology)

  • 장창복;김기봉
    • 융합정보논문지
    • /
    • 제12권1호
    • /
    • pp.163-170
    • /
    • 2022
  • 4차산업 혁명이 도래함에 따라 AI 기술을 적용하는 솔루션 개발이 활발하게 이루어지고 있다. 2017년도부터 금융권, 보험사를 중심으로 AI 기반 RPA(Robotic Process Automation)을 이용한 업무 자동화 솔루션 도입이 이루어지기 시작했으며, 최근에는 RPA 솔루션 도입 단계를 지나 확산하는 시기로 진입하고 있다. 이러한 RPA 솔루션을 이용한 업무 자동화 중에서 각 종 문서들을 이용한 업무 자동화에는 문서내의 문자 정보를 얼마나 정확하게 인식하는지가 매우 중요하다. 이러한 문자 인식은 최근 딥러닝 기술을 도입함으로써 그 정확도가 많이 높아졌지만, 여전히 완벽한 인식 정확도 갖는 인식 모델은 존재하지 않는다. 따라서, 본 논문에서는 딥러닝 기반 문자 인식 엔진에 전/후 처리기 기술을 적용할 경우 얼마나 정확도가 향상되는지를 확인하고 RPA 인식 엔진과 연계 기술을 구현하였다.

음성 및 제스처를 이용한 멀티 모달 명령어 인식 시스템 (Multi-Modal Instruction Recognition System using Speech and Gesture)

  • 김정현;노용완;권형준;홍광석
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2006년도 하계 학술대회 논문집
    • /
    • pp.57-62
    • /
    • 2006
  • 휴대용 단말기의 소형화 및 지능화와 더불어 차세대 PC 기반의 유비쿼터스 컴퓨팅에 대한 관심이 높아짐에 따라 최근에는 펜이나 음성 입력 멀티미디어 등 여러 가지 대화 모드를 구비한 멀티 모달 상호작용 (Multi-Modal Interaction MMI)에 대한 연구가 활발히 진행되고 있다. 따라서, 본 논문에서는 잡음 환경에서의 명확한 의사 전달 및 휴대용 단말기에서의 음성-제스처 통합 인식을 위한 인터페이스의 연구를 목적으로 Voice-XML과 Wearable Personal Station(WPS) 기반의 음성 및 내장형 수화 인식기를 통합한 멀티 모달 명령어 인식 시스템 (Multi-Modal Instruction Recognition System : MMIRS)을 제안하고 구현한다. 제안되어진 MMIRS는 한국 표준 수화 (The Korean Standard Sign Language : KSSL)에 상응하는 문장 및 단어 단위의 명령어 인식 모델에 대하여 음성뿐만 아니라 화자의 수화제스처 명령어를 함께 인식하고 사용함에 따라 잡음 환경에서도 규정된 명령어 모델에 대한 인식 성능의 향상을 기대할 수 있다. MMIRS의 인식 성능을 평가하기 위하여, 15인의 피험자가 62개의 문장형 인식 모델과 104개의 단어인식 모델에 대하여 음성과 수화 제스처를 연속적으로 표현하고, 이를 인식함에 있어 개별 명령어 인식기 및 MMIRS의 평균 인식율을 비교하고 분석하였으며 MMIRS는 문장형 명령어 인식모델에 대하여 잡음환경에서는 93.45%, 비잡음환경에서는 95.26%의 평균 인식율을 나타내었다.

  • PDF

한국 중년기 남녀의 다문화사회에 대한 태도 (Attitude about multicultural society of Korea male-female in the middle age)

  • 박은아;이은주
    • 문화기술의 융합
    • /
    • 제4권2호
    • /
    • pp.131-138
    • /
    • 2018
  • 본 연구의 목적은 다문화사회에 대한 한국 중년기 남녀의 인식 유형을 확인하기 위함이다. 다문화사회에 대한 인식과 관련된 42개의 진술문은 25명의 대상자에게 적용하여 자료를 수집하였고, 이를 PC QUANL program을 이용하여 처리하였다. 다문화사회에 대한 중년기 남녀의 인식은 3개의 유형 '분노-배척형', '배려-수용형', '경계-동화요구형'으로 나타났다. 연구대상자들은 공통적으로 다문화 사회에 대해 인식은 하고 있는 것으로 나타났다. 그러므로, 본 연구에서 확인된 인식 유형을 중심으로 다문화사회에 대한 중년기 남녀의 인식유형에 따라 다문화사회 인식증진 관련 중재 및 프로그램을 개발에 본 연구 결과를 활용할 수 있을 것이다.

Raised Cosine RBF 신경망을 이용한 무제약 필기체 숫자 인식 (Recognition of Unconstrained Handwritten Digits Using Raised Cosine RBF Neural Networks)

  • 박준근;김상희;박원우
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.48-53
    • /
    • 2002
  • 본 논문에서는 무제약 필기체 숫자 인식에 있어서 향상된 RBF(Radial Basis Function) 신경망을 이용한 새로운 접근 방법을 제시하였다. RBF 신경망은 인식률과 인식 속도를 향상시키기 위해 기저 함수로서 Raised Cosine RBF를 사용하였다. Raised Cosine RBF 신경망 분류기의 성능 평가를 위하여 캐나다 몬트리올 Concordia 대학의 무제약 필기체 숫자 데이터베이스를 사용하였고, 실험 결과 98.05%의 인식률을 보였다.

  • PDF