• Title/Summary/Keyword: 형태 인식 기술

Search Result 913, Processing Time 0.027 seconds

A Basic Study on Automation of the Subjective Evaluation using Speech Recognition (음성인식을 이용한 주관평가의 자동화에 관한 기초연구)

  • 한화영;고한우;윤용현;조택동
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2000.11a
    • /
    • pp.113-117
    • /
    • 2000
  • 수작업으로 이루어지고 있는 환경의 영향이나 작업의 영향에 따른 정신피로나 신체피로의 주관적인 평가를 자동화하기 위한 방법에 대하여 논하였다. 사람의 가장 자연스러운 의사소통인 평가어를 척도로 하여 평가가 이루어지는 음성인식기술을 응용한 주관평가법에 대하여 연구하였다. 주관평가의 자동화를 위하여 우선, 평가어에 대한 음성 인식을 한 후 인식된 평가 결과 데이터를 이용하여 설문지를 자동 생성시킴과 동시에 파일 형태로 저장시켰다. 음성 인식 알고리즘으로는 DTW(Dynamic Time Warping)인식 알고리즘을 사용하였고. 설문지 질의 내용은 집중도 평가를 이용하였다. 인식실험은 설문에 대한 응답에 필요한 평가어를 대상으로 하였다.

  • PDF

Face Recognition using SIFT and Subspace Analysis (SIFT와 부분공간분석법을 활용한 얼굴인식)

  • Kim, Dong-Hyun;Park, Hye-Young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.390-394
    • /
    • 2010
  • 본 논문에서는 영상인식에서 널리 사용되는 지역적 특징인 SIFT와 부분공간분석에 의한 차원축소방법의 결합을 통하여 얼굴을 인식하는 방법을 제안한다. 기존의 SIFT기반 영상인식 방법에서는 추출된 키 포인트 각각에 대하여 계산된 특징기술자들을 개별적으로 비교하여 얻어지는 유사도를 바탕으로 인식을 수행하는데 반해, 본 논문에서 제안하는 접근법은 SIFT의 특징기술자를 명도 값으로 표현된 얼굴 영상을 여려 변형에 강건한 형태로 표현되도록 변환하는 표현방식으로 본다. SIFT기반의 특징기술자에 의해 표현된 얼굴 영상을 부분공간분석법에 의해 저차원의 특징벡터로 다시 표현되고, 이 특징벡터를 이용하여 얼굴인식을 수행한다. 잘 알려진 벤치마크 데이터인 AR 데이터베이스에 대한 실험을 통해 제안한 방법이 조명 변화와 가려짐에 강인한 인식 결과를 보여줄 뿐 아니라, 기존의 SIFT 기반의 얼굴 인식 방법에 비하여 우수한 처리 속도를 보임을 확인하였다.

  • PDF

Deep Learning Based Object Recognition in Spherical Panoramic Image (구면 파노라마 영상에서의 딥러닝 기반 객체 인식)

  • Jung, Minsuk;Park, Jong-Seung
    • Journal of Korea Game Society
    • /
    • v.18 no.5
    • /
    • pp.5-14
    • /
    • 2018
  • A lot of research has been done on image recognition technique for planar images and the performance has also been improved. However, it is difficult to recognize objects in spherical panoramic images or images in special form which are given in various environments because of the spherical distortion given in different form from the planar case. In this paper, we show that the neural network recognition approach can be used for object recognition in spherical image and suggest a method of using cubemap transform in order to increase recognition accuracy in spherical image.

3D Object Editing Puzzle Using Hand Motion Recognition (손 모션 인식을 통한 3D 객체 편집 활용 퍼즐)

  • Kim, Min-Seok;Kim, Ji-Hoon;Kim, Hye-Rim;Jung, Seung-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.608-610
    • /
    • 2019
  • 현재 손 모션 인식 기술을 활용한 응용 서비스가 많이 나타나고 있다. 립 모션으로 사용자의 손동작을 인식하여 나타나는 행동결과를 통해 3D 오브젝트를 편집하는 형태의 기술을 활용하여 3D 퍼즐을 맞춘다. 입체적인 3D 퍼즐을 함으로써 사용자는 다방면으로 교육적인 결과를 얻을 수 있으며, 유아들을 대상으로 공간지각능력, 두뇌 활성화에 효과적이다. 이에 본 논문에서는 개발 환경 및 테스트와 3D 퍼즐에서 사용하게 될 손동작 관련 기술에 대해 연구하였다.

A Study on Colored LED Tag Recognition Method based on 8MP CMOS Sensor (8MP CMOS센서기반 Colored LED Tag 인식 기법에 대한 연구)

  • Lee, Min-Woo;Jeong, Sun-Ho;Yang, Seung-Youn;Shin, Jae-Kwon;Kim, Jin-Tae;Lee, Jung-Hoon;Cha, Jae-Sang
    • Proceedings of the KIEE Conference
    • /
    • 2015.07a
    • /
    • pp.1435-1435
    • /
    • 2015
  • 광고 및 홍보의 마케팅 수단의 일환으로써 점포별로 QR코드를 사용하는 사례가 급격히 늘고 있다. 정보도트의 일종인 QR코드의 경우는 스마트폰과 더불어 홍보수단의 일환으로 활용되는 사례가 증가하고 있는 반면 QR코드는 정보를 표현할 수 있는 디자인의 범위가 좁고, 전송할 수 있는 Data의 용량이 적으며, 어두운 환경에서의 인식률이 저하되는 단점이 있다. 이에 기존의 QR코드 보다 다양한 디자인이 가능하고 대용량의 Data 전송이 가능한 컬러코드가 대두되고 있다. 컬러코드란 4가지 색상(빨강, 파랑, 초록, 검정)을 이용한 매트릭스 형태의 코드로 각종 디지털 정보를 저장하는 새로운 개념의 데이터 표현 기술이며, 이는 각 컬러에 디지털 정보를 매핑(mapping)하여 콘텐츠나 URL 등의 실제 정보들을 제공하는 역할을 하도록 설계되어 있다. 8MP CMOS센서기반 Colored LED Patch 인식 기법은 VLC에 포함되는 하나의 기술로서 차세대 조명 및 정보 디스플레이 장치로 각광을 받고 있는 반도체 조명 기술인 광원 정보 인식 기법이다. 따라서, 본 논문에서는 8MP CMOS센서 기반 컬러코드 LED Patch 인식 기법에 대해 제안하였다. 8MP CMOS 센서를 이용한 Colored LED Patch 인식 기법 중 하나로서 위치 정보 서비스 등 다양한 정보 획득이 가능하도록 연구하였으며, 동영상, 웹사이트 링크 등 여러 형식에 적용이 가능하도록 하였다. 본 연구에서 사용되는 8MP CMOS센서를 기반 Colored LED Patch 인식 기법을 통해 컬러코드는 코드 플랫폼으로 연결되어 콘텐츠의 위치를 파악하고 이용자에게 콘텐츠 및 정보가 전송된다. 이는 QR코드보다 높은 인식률로 빠르고 편리하게 정보를 제공할 수 있었다. 본 논문에서는 상기 제안 기술을 통하여 LED Patch의 높은 주목성과 가시성을 확보하여 보다 효과적인 광고 및 홍보의 시인성을 확보할 수 있다. 향후 본 제안기술을 통하여 사회 안전망을 위한 위치 및 정보 서비스 제공이 가능하며, 효과적인 광고 효과를 도출할 수 있을 것으로 사료된다.

  • PDF

Performance Evaluation of Shape Descriptors for Gait Analysis Based on Silhouette Sequence (실루엣 영상기반 보행 분석을 위한 형태 기술자의 성능 평가)

  • Kim, Seon-Jong
    • Journal of Intelligence and Information Systems
    • /
    • v.15 no.4
    • /
    • pp.53-64
    • /
    • 2009
  • This paper presents a performance evaluation of shape descriptors for gait analysis in case of silhouette sequence images. We used moment descriptors(MD), Fourier descriptors(FD) and Zernike descriptors(ZD) as a shape descriptor. To evaluate their performance, we firstly defined the performance index, that is, AI(asymmetry index) and PI(periodic index) based on the periodic property of the gait images. This is why they are represented by periodic parameters due to periodic gait images. This index means that how the shape is represented periodically. According to these indexes, we evaluated the data sets with periodic images, downloaded from internet. The results showed that Zernike descriptors had better performance of AI = 1.09 and PI = 2.21 than others. And in case of FD and ZD, it's efficient to implement the gait analysis with 5~10 parameters.

  • PDF

Robot Navigation Technology and Its Standardization Trends (로봇주행 기술 및 표준화 동향)

  • Yu, W.P.;Choi, S.L.;Lee, J.Y.;Park, S.H.
    • Electronics and Telecommunications Trends
    • /
    • v.26 no.6
    • /
    • pp.108-119
    • /
    • 2011
  • 로봇주행은 환경 정보와 위치 정보를 기반으로 현재 위치로부터 목적지까지 경로를 생성하고 제어하는 기술 체계를 의미한다. 주행 기술은 이미 로봇청소기, 군용로봇, 무인주행 자동차, 농업용 무인트랙터 등 개인용 서비스 로봇으로부터 전문서비스 로봇까지 다양한 응용제품의 형태로 구현되고 있다. 즉, 로봇주행은 로봇의 이동(mobility) 기능을 구현하는 것으로 제품 형태로 혹은 획기적인 기술 시연을 통해 보편화되고 있다. 본 고에서는 로봇주행 기술의 개요와 이를 구성하는 핵심 요소기술의 동향을 살펴보고 산업 및 표준화 동향을 살펴봄으로써 인식, 제어, SW, 시스템 공학 등 첨단융합기술로서의 로봇주행의 중요성과 기술확보 방향에 대해 살펴보고자 한다.

  • PDF

유비쿼터스 네트워킹을 위한 컴퓨팅 미들웨어 기술의 설계

  • 김정기;신창민;유석대;박승민
    • Information and Communications Magazine
    • /
    • v.20 no.5
    • /
    • pp.645-656
    • /
    • 2003
  • 최근에 정보 산업과 이동 통신 기술이 발전함에 따라 퍼스널 컴퓨터를 넘어 컴퓨터의 개념이 매우 빠르게 확장되고 있다. 이동 정보 단말 형태의 PDA, HPC(hand-held PC), 휴대폰 등이 개발되었고, 셋탑박스(set-top box), 지능형 디지털 TV, 인터넷 냉장고 등의 정보가전은 임베디드 운영체제(embedded OS)를 내장하여 컴퓨터로 발전하고 있으며, 제어 및 계측 기기들도 마이크로 프로세서를 내장하여 임베디드 시스템으로 발전하고 있다. 이렇게 새롭게 확장된 컴퓨터 시스템들은 인간 생활의 편리성과 다양성을 위해 상호 연결되어 하나의 네트워크를 형성하고 있으며, 상호간에 정보를 공유하고 협력하여 언제 어디서나 통신 및 컴퓨팅이 가능한 유비쿼터스 네트워킹(Ubiquitous Networking)으로 발전하고 있다. 본 논문에서는 이러한 유비쿼터스 네트워킹에서 필요한 컴퓨팅 미들웨어(Middleware) 기술의 최근 동향을 살펴보고 본 연구에서 제안하는 새로운 미들웨어 기술을 설계한다. 이러한 미들웨어 기술은 편재(遍在)되어 있는 컴퓨팅 장치를 상호 이용하기 위해 컴퓨터의 환경을 탐지하여 저장하고 재이용하는 상황 인식 기술, 편재된 장치들이 네트워크에 연결되면서 정보를 전달하는 Ad-hoc 네트워킹과 동적 라우팅 기술, 그리고 정보 전달을 위해 제어 코드와 데이터를 패킷 (packet) 형태로 전달하는 협력 메시지(Cooperative Message) 기술 등이 포함된다.

딥러닝 기반 얼굴 검출, 랜드마크 검출 및 얼굴 인식 기술 연구 동향

  • Hwang, Won-Jun
    • Broadcasting and Media Magazine
    • /
    • v.22 no.4
    • /
    • pp.41-49
    • /
    • 2017
  • 본 논문에서는 최근 각광받고 있는 Convolutional Neural Network(CNN)과 같은 딥러닝 기반의 얼굴 인식 연구 동향을 살펴 보고자 한다. 얼굴 인식은 입력 영상이 들어왔을 때 자동으로 누구인지 알아내는 알고리즘으로 크게 얼굴 검출, 얼굴 랜드마크 검출 및 얼굴 특징 추출로 나누어진다. 본 논문에서는 얼굴 검출, 랜드마크 검출 및 얼굴 특징 추출에 특화된 딥러닝 알고리즘을 하나씩 살펴보고 이들이 어떻게 발전해 왔는지를 확인하고자 한다. 특히, 딥러닝 기반 얼굴 인식 알고리즘들은 딥러닝 기반 물체 인식의 발전 방향과 유사하게 진행되어 오다가 최근에는 얼굴 인식에 특화된 딥러닝 아키텍처 형태로 발전하고 있다. 어떤 방향이 얼굴 인식에 더 도움이 될지에 대해서도 확인하고 실제로 어떤 문제를 해결하고 있는지 확인하고자 한다.

A Study of Speech Recognition Web Services Environment for Voice Browser (Voice Browser를 위한 음성 인식 웹서비스 환경에 관한 연구)

  • Hong, In-Suk;Kim, Yoon-Joong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.142-145
    • /
    • 2009
  • 음성인터페이스 관련 표준화는 음성 대화, 음성인식/합성, 전화망 등의 접속망을 상호 분리하여 음성정보시스템 구성요소들 각각의 상호 독립적인 개발을 보장해 주며, 각 요소의 이해가 없이도 음성정보시스템을 개발할 수 있도록 함으로써 음성정보기술의 보급 및 확산에 크게 기여하고 있다. 이에 W3C에서는 Voice Browser에 대한 표준화를 현재 진행 중에 있으며 Vocie Browser WG에서 Voice Browser를 위한 SIF(Speech Interface Framework)를 제안하였다. 제안된 SIF에서 Voice Browser가 음성인식을 실행하기 위해서는 많은 자원의 소요와 부하가 생길 수 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 음성인식 웹 서비스를 기존의 SIF에 추가한 새로운 형태의 SIF를 제안하고자 한다. 음성인식은 원격 시스템에서 수행하고 그 결과를 Voice Browser가 사용할 수 있도록 음성인식 웹서비스 환경을 구축하였다. 그리고, XML-SRGS 포멧의 grammar를 음성인식기가 사용하는 EBNF 포멧의 grammar로 변환시키는 변환기를 구현하였다.