• Title/Summary/Keyword: 영상언어인식

Search Result 94, Processing Time 0.026 seconds

Digit Recognition Rate Comparision in DHMM and Neural Network (DHMM과 신경망에서 숫자음 인식률 비교)

  • 박정환;이원일;황태문;이종혁
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2002.05a
    • /
    • pp.171-174
    • /
    • 2002
  • 음성 신호는 언어정보, 개인성, 감정 등의 여러 가지 정보를 포함한 음향학적인 신호인 동시에 가장 자연스럽고 널리 쓰이는 의사소통 수단의 하나이다. 본 연구에서는 저장된 음성 신호에서 추출한 특징 파라미터를 사용한 경우와 음성 특징파라미터에 입술 패턴에 대한 영상정보를 통시에 사용한 경우 DHMM과 신경망을 통하여 각각 인식률을 비교해 보았다. 그 결과 입술패턴에 대할 영상정보도 음성인식에 사용 할 수 있음을 알 수 있었다.

  • PDF

Server based Mobile Multi-lingual Recognition System of Name-card (서버기반 모바일 다국어 명함인식 시스템)

  • Jang, Dong-Hyeub;Lee, Jae-Hong;Kim, Seong-Hak
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.3 no.4
    • /
    • pp.155-162
    • /
    • 2014
  • In this study, we developed a server-based mobile multi-lingual name-card recognition system which utilizes smartphone only as a terminal for capturing images of name-card and displaying results of recognition, running server as a recognizer of characters. For efficient processing and transmission of captured images, we corrected the distorted images, removed noises from them, and defined the socket-based protocol for wireless transmission of images between smartphone and the recognizer on server. Various tests for name-cards of five language types show increased recognition rate and speed of the developed system against conventional smartphone-based recognizers.

A Finger Counting Method for Gesture Recognition (제스처 인식을 위한 손가락 개수 인식 방법)

  • Lee, DoYeob;Shin, DongKyoo;Shin, DongIl
    • Journal of Internet Computing and Services
    • /
    • v.17 no.2
    • /
    • pp.29-37
    • /
    • 2016
  • Humans develop and maintain relationship through communication. Communication is largely divided into verbal communication and non-verbal communication. Verbal communication involves the use of a language or characters, while non-verbal communication utilizes body language. We use gestures with language together in conversations of everyday life. Gestures belong to non-verbal communication, and can be offered using a variety of shapes and movements to deliver an opinion. For this reason, gestures are spotlighted as a means of implementing an NUI/NUX in the fields of HCI and HRI. In this paper, using Kinect and the geometric features of the hand, we propose a method for recognizing the number of fingers and detecting the hand area. A Kinect depth image can be used to detect the hand region, with the finger number identified by comparing the distance of outline and the central point of a hand. Average recognition rate for recognizing the number of fingers is 98.5%, from the proposed method, The proposed method would help enhancing the functionality of the human computer interaction by increasing the expression range of gestures.

Enhancement of Petrolglyphs image (암각화 영상 향상)

  • 최호형;김기석
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2004.06a
    • /
    • pp.73-76
    • /
    • 2004
  • 인류 문화 발달에 있어 언어의 발달과 함께 이루어진 가장 초기 단계의 의사소통 수단은 몸짓이며, 또 다른 정보 교류 방법은 그림이다. 그런 점에서 구석기 시대의 동굴 암각화에서 볼 수 있는 들소, 사슴, 큰 새 등은 단순히 대상물을 묘사한 개별적 그림으로 가정하기 보다는 오히려 종교적 제의 양상을 알려주는 상징으로 이해하는 것이 바람직하다. 그러나 잦은 풍화 작용과 침식 작용으로 인하여 암각화의 인식에는 한계가 있다. 이에 디지털영상처리 기법을 기반으로 인간시각에 더 잘 보이도록 영상을 향상시키면서 더 짧은 연구기간에 더 않은 암각화를 올바로 인식하고, 더 정확하게 문명의 흐름을 밝혀 낼 수 있다. 본 논문에서 디지털 영상처리 기법을 신축적으로 적용시켜 암각화 인식에 거슬리는 불필요한 영상 잡음들을 제거하고 영상을 더 선명하게 보이게 하는 알고리듬을 제안한다.

  • PDF

character segmentation using histogram (히스토그램을 이용한 문자 영역 추출)

  • Kim, Jieum;Jung, Woo Young
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.173-174
    • /
    • 2012
  • 문자 영역의 추출은 명함 등 문서의 정형화된 문자 인식, 비전 기반 감시 시스템에서의 간판, 부호 등의 자연영상에서의 문자 인식 등 다양한 분야에 활용될 수 있다. 우리가 관심을 갖는 문자는 간판이나 이름표 등 다른 이에게 정보를 전달해주는 기능을 하는 것으로 그 전배경의 구분이 명확하다. 이러한 특징은 히스토그램의 변화와 관련이 되어 있으며 본 논문에서는 그 변화를 분석함으로써 문자 영역 추출 방법을 제안한다.

  • PDF

A Stroke Matching Method for the Off-line Recognition of Handprinted Hanguls (필기체 한글의 오프라인 인식을 위한 획 정합 방법)

  • Kim, Ki-Cheol;Lee, Seong-Whan
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.225-235
    • /
    • 1992
  • 본 논문은 오프라인 필기체 한글 인식에 관한 연구로서, 입력 문자 영상에 대한 위치 정규화, 외곽선 추적 및 세선화의 전처리 과정을 거쳐 외곽선의 방향 성분 분포, 세선화한 결과의 방향 성분 분포, 구조적 특징점 분포 등의 특징을 추출한 다음, 획을 추출하여 획의 방향과 길이에 대한중점 분포 특징으로 정합하는 필기 한글의 인식을 위한 획 정합 방법을 제안하였다. 인식 시간의 단축을 위해 먼저 외곽선의 방향성분분포를 이용하여 대분류하였으며, 한글 사용 빈도수 상위 520자로 구성되는 필기 데이타에 대한 실험 결과, 평균 91%의 인식률과 평균 0.46초의 문자당 인식 시간을 보임으로써 제안된 획 정합 방법이 입력 문자의 잡영이나 획의 기울기에 대한 변형을 효과적으로 흡수할 수 있음을 알 수 있었다.

  • PDF

Off-line recognition of Hanguls handprinted in sammool style with statistical feature extraction method (통계적 특징 추출 방법을 이용한 샘물체 필기 한글의 오프라인 인식)

  • Lee, Seong-Whan;Park, Jeong-Seon
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.237-248
    • /
    • 1992
  • 본 논문에서는 통계적인 특징 추출 방법을 사용하여 샘물체로 필기된 한글을 고속으로 인식하는 방법을 소개한다. 대부분이 직선 성분으로 이루어진 한글의 특성을 이응하기 위하여 입력 영상으로부터 수평, 수직, 사선, 역사선의 방향 성분을 추출하며, 검은 화소의 밀도에 따라 동적으로 그물을 결정함으로써 획 간의 접촉 변형에 무관한 특징 벡터를 추출한다. 이와 같은 통계적 특징 추출 방법은 크기 정규화나 세선화 과정이 필요없으며, 또한 샘물체라는 필기 형태의 제약에 의해 정합 대상 부류의 수가 현저히 줄어들기 때문에 인식에 소요되는 시간을 상당히 줄일 수 있음은 물론, 인식률을 향상시켰다. 제안된 방법의 타당성을 검증하기 위하여 샘물체로 필기된 KS 완성형 한글 2,350자에 대해 실험한 결과, 평균 90% 이상의 인식률을 보이며, IBM PC 486(33MHz)상에서 문자당 평균 0.17초의 인식 속도를 보임으로써, 실용적인 고속 OCR 시스템의 개발 가능성을 확인할 수 있었다.

  • PDF

Printed Korean Characters Recognition Using Neural Networks Based on Feature Extraction (피쳐 추출에 기반을 둔 신경회로망을 이용한 인쇄체 한글 문자 인식)

  • Kim, Woo-Tae;Yoon, Byung-Sik;Chien, Sung-Il
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.287-299
    • /
    • 1991
  • 본 논문은 하드웨어 구현이 가능한 신경 회로망을 구성하여 한글 문자 인식을 수행하였다. 먼저 입력 장치로부터 받아들인 문자 영상은 인식 속도를 높히기 위하여 특별한 전처리 과정 없이 직접 피쳐를 추출하였으며 추출한 피쳐로는 하드웨어 구현이 용이한 교차 피쳐와 투영 피쳐를 이진화로 코딩하였다. 신경 회로망의 하드웨어 구현을 가능하게 하기위해서 정수형 연결 강도와 비선형 Hard-limit 함수를 가지고 학습을 하는 Rounding 학습 방법을 도입하여 학습시켰으며 한글의 구조적 특성을 이용하여 한글을 유형별로 Module화 및 Submodule화 작업을 수행한 다음 인식하는 계층적인 문자 인식 시스템을 구성하였다. 그리고 이러한 방법을 이용하여 한글 문자 인식용 CMOS 신경회로망 Chip을 설계하였다.

  • PDF

An Emotion Recognition and Expression Method using Facial Image and Speech Signal (음성 신호와 얼굴 표정을 이용한 감정인식 몇 표현 기법)

  • Ju, Jong-Tae;Mun, Byeong-Hyeon;Seo, Sang-Uk;Jang, In-Hun;Sim, Gwi-Bo
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.04a
    • /
    • pp.333-336
    • /
    • 2007
  • 본 논문에서는 감정인식 분야에서 가장 많이 사용되어지는 음성신호와 얼굴영상을 가지고 4개의(기쁨, 슬픔, 화남, 놀람) 감정으로 인식하고 각각 얻어진 감정인식 결과를 Multi modal 기법을 이용해서 이들의 감정을 융합한다. 이를 위해 얼굴영상을 이용한 감정인식에서는 주성분 분석(Principal Component Analysis)법을 이용해 특징벡터를 추출하고, 음성신호는 언어적 특성을 배재한 acoustic feature를 사용하였으며 이와 같이 추출된 특징들을 각각 신경망에 적용시켜 감정별로 패턴을 분류하였고, 인식된 결과는 감정표현 시스템에 작용하여 감정을 표현하였다.

  • PDF

Keypoint-based Korean sign language recognition for guiding airport facilities (공항 내 시설 안내 서비스를 위한 마커리스 한국 수어 인식 기술)

  • Park, Han-Mu;Jeong, Yoon Young
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.476-478
    • /
    • 2020
  • 공항은 다양한 시설들이 혼재되어 있는 복합 공간으로 원하는 장소로 이동하기 위해서는 지도나 표지판뿐만 아니라 유·무인 안내 서비스를 이용하는 것이 필수적이다. 그러나 이러한 시설 안내 서비스는 이용객의 대다수를 차지하는 비장애인을 기준으로 설계되어 있는 것이 대부분이며, 특히 청각장애인은 음성 언어인 한국어를 통한 의사소통이 어려워 이러한 안내 서비스의 사각 지대에 놓여있다고 볼 수 있다. 본 논문에서는 청각장애인을 대상으로 공항 내 시설 위치 안내 서비스를 제공하는 키오스크를 구현하기 위해 마커리스(makerless) 한국 수어 인식 기술을 적용하는 방법을 제안한다. 기존의 알고리즘들이 수어를 인식하기 위해 사용자의 신체에 마커(marker)를 부착하거나 사용에 제약이 있는 깊이, 자기장 센서 등을 활용한 데 반해, 특징점 기반의 인식 기술은 별도의 마커 없이 RGB 영상만을 활용하여 수어를 인식하기 때문에 사용자의 편의성을 극대화할 수 있는 방법이다. 영상 기반의 마커리스 수어 인식 기술을 위치 안내 키오스크에 적용함으로써 청각장애인이 다른 사람의 도움 없이 공항 시설을 쉽고 안전하게 이용할 수 있도록 지원할 수 있으며, 나아가 배리어프리 (barrier-free) 공항을 구현하는 데에 큰 도움이 될 수 있을 것으로 기대된다.

  • PDF