• 제목/요약/키워드: recognition mechanism

검색결과 368건 처리시간 0.033초

MSFM: Multi-view Semantic Feature Fusion Model for Chinese Named Entity Recognition

  • Liu, Jingxin;Cheng, Jieren;Peng, Xin;Zhao, Zeli;Tang, Xiangyan;Sheng, Victor S.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권6호
    • /
    • pp.1833-1848
    • /
    • 2022
  • Named entity recognition (NER) is an important basic task in the field of Natural Language Processing (NLP). Recently deep learning approaches by extracting word segmentation or character features have been proved to be effective for Chinese Named Entity Recognition (CNER). However, since this method of extracting features only focuses on extracting some of the features, it lacks textual information mining from multiple perspectives and dimensions, resulting in the model not being able to fully capture semantic features. To tackle this problem, we propose a novel Multi-view Semantic Feature Fusion Model (MSFM). The proposed model mainly consists of two core components, that is, Multi-view Semantic Feature Fusion Embedding Module (MFEM) and Multi-head Self-Attention Mechanism Module (MSAM). Specifically, the MFEM extracts character features, word boundary features, radical features, and pinyin features of Chinese characters. The acquired font shape, font sound, and font meaning features are fused to enhance the semantic information of Chinese characters with different granularities. Moreover, the MSAM is used to capture the dependencies between characters in a multi-dimensional subspace to better understand the semantic features of the context. Extensive experimental results on four benchmark datasets show that our method improves the overall performance of the CNER model.

몰입형 대형 사이니지 콘텐츠를 위한 STAGCN 기반 인간 행동 인식 시스템 (STAGCN-based Human Action Recognition System for Immersive Large-Scale Signage Content)

  • 김정호;황병선;김진욱;선준호;선영규;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권6호
    • /
    • pp.89-95
    • /
    • 2023
  • 인간 행동 인식 (Human action recognition, HAR) 기술은 스포츠 분석, 인간과 로봇 간의 상호작용, 대형 사이니지 콘텐츠 등의 애플리케이션에 활용되는 핵심 기술 중 하나이다. 본 논문에서는 몰입형 대형 사이니지 콘텐츠를 위한 STAGCN (Spatial temporal attention graph convolutional network) 기반 인간 행동 인식 시스템을 제안한다. STAGCN은 attention mechanism을 통해 스켈레톤 시퀀스의 시공간적 특징에 서로 다른 가중치를 부과하여, 동작 인식에 중요한 관절 및 시점을 고려할 수 있다. NTU RGB+D 데이터셋을 사용한 실험 결과, 제안된 시스템은 기존 딥러닝 모델들에 비해 높은 분류 정확도를 달성한 것을 확인했다.

Multi Parallel GAP(Genetic Algorithm Processor)를 이용한 회전 불변 패턴 인식에의 응용 (Application of Multi Parallel GAP to Rotation-Invariant Pattern Recognition)

  • 조민석;허인수;이주환;정덕진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(3)
    • /
    • pp.29-32
    • /
    • 2001
  • In this paper, we applied the high-performance PGAP(Parallel Genetic Algorithm Processor) to recognizing rotated pattern. In order to perform this research efficiently, we used Multi-PGAP system consisted of four PGAP. In addition, we used mental rotation based on the rotated pattern recognition mechanism of human to reduce the number of operation. Also, we experimented with distinguishing specific pattern from similar coin patterns and determine rotated angle between patterns. The result showed that the development of future artificial recognition system is feasible by employing high performance PGAPS.

  • PDF

성도 면적 함수와 벡터 양자화를 이용한 음성 인식에 관한 연구 (A Study on Speech Recognition using Vocal Tract Area function and Vector Quantization)

  • 송제혁;김동준;박상희
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1993년도 추계학술대회
    • /
    • pp.171-174
    • /
    • 1993
  • We propose the vocal tract area function as the feature vector of speech recognition. Vocal tract area function is directly related to speech production. The vocal tract area function is not only showing mechanism of speech production but also can be used as an effective feature vector in speech, recognition in this study.

  • PDF

차량 탑재용 카메라를 이용한 실시간 차량 번호판 인식 기법 (Real-time Vehicle License Plate Recognition Method using Vehicle-loaded Camera)

  • 장재건
    • 인터넷정보학회논문지
    • /
    • 제6권3호
    • /
    • pp.147-158
    • /
    • 2005
  • 나날이 심각해지는 교통문제에서 차량에 대한 정보를 이용하여 교통흐름을 개선해 줄 뿐만 아니라, 교통위반 차량을 효율적으로 적발할 수 있다. 차량 번호판은 차량정보를 인식하는데 중요하게 사용될 수 있다. 본 논문에서는 이동식 형태인 차량에 탑재한 카메라를 이용하여 촬영한 영상에서 차량의 번호판을 인식하는 새로운 기법을 제안한다. 여러 단계의 영상처리 과정과 인식 과정을 거쳐서 실시간에 처리할 수 있는 시스템으로 일반 차량뿐 아니라 특장차에 대한 인식도 가능하게 한다. 제안한 기법을 이용한 실제적 환경에서의 영상과 인식에 대한 결과가 실험결과에서 보여진다.

  • PDF

가상 세계 거주자의 지각 메커니즘 설계 및 구현 (Design and Implementation of the Perception Mechanism for the Agent in the Virtual World)

  • 박재우;정근재;박종희
    • 한국콘텐츠학회논문지
    • /
    • 제11권8호
    • /
    • pp.1-13
    • /
    • 2011
  • 가상 세계에서 인간과 유사한 에이전트를 만들기 위해서는 지각, 인식, 판단 그리고 행동에 대한 정교한 설계가 중요하다. 이와 관련하여 자율형 에이전트의 지각 기능과 인식 기능을 개발하고자 한다. 시야 속에서 획득되어진 가장 원시적 데이터인 이미지의 색상차를 이용하여 모양과 영역들을 구별하는 것으로부터 점, 선 색깔들을 기본 단위로 사용하는 지각 메커니즘을 개발한다. 이렇게 지각되어진 모양들을 지능적으로 인식하기 위해서 가려지거나 손실된 모양에서 원래의 모양을 추측하기 위한 추론 알고리즘을 개발하고 객체에 관해 온톨로지로 부터 얻어진 일반적 특성정보를 이용한다. 개별적으로 파악된 이차원 모양들과 다른 모양들과의 공간적 위치관계들이 삼차원 모양들을 이루고 그러한 모양을 가진 해당 객체들은 장면들을 구성하게 된다. 삼차원 모양들은 각 장면에서 자신만의 영역을 차지하며 에이전트는 객체들과 장면들을 분석하여 사물과 현상들을 인식한다. 이러한 장면에 대한 인식기능을 이용하여 에이전트가 시공간 영역속에서 지식을 축적하고 이용하는 방법을 개발하고 예제상황을 통해 구현결과를 보여준다.

A New Residual Attention Network based on Attention Models for Human Action Recognition in Video

  • Kim, Jee-Hyun;Cho, Young-Im
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.55-61
    • /
    • 2020
  • 딥 러닝 기술의 발전과 컴퓨팅 파워 등의 개선으로 인해 비디오 기반 연구는 최근 많은 관심을 얻고 있다. 비디오 데이터가 이미지 데이터와 비교하여 가장 큰 차이는 비디오 데이터에는 많은 양의 시간적, 공간적 정보가 포함되어 있다는 점이다. 이처럼 비디오에 포함된 많은 양의 데이터로 인해 컴퓨터 비전 연구에 있어서 행동 인식은 중요한 연구 과제 중 하나이지만, 비디오와 같이 움직임이 있는 환경에서 인간의 행동 인식은 매우 복잡하고 도전적인 과제이다. 인간에 대한 여러 연구를 바탕으로 인공지능에서는 인간과 유사한 주의(attention)메커니즘이 효율적인 인식 모델이라는 것을 알게 되었다. 이 효율적인 모델은 이미지 정보와 복잡한 연속 비디오 정보를 처리하는 데 이상적이다. 본 논문에서는 이러한 연구배경을 기반으로, 비디오에서 인간의 행동을 효율적으로 인식하기 위해 먼저 인간의 행동에 주목한 후 비디오 행동 인식에 주의메커니즘을 도입하고자 한다. 논문의 주요내용은 두 가지 주의 메카니즘을 기반으로 컨볼루션 신경망을 이용한 새로운 3D 잔류 주의 네트워크를 제안함으로써 비디오에서 인간의 행동을 식별하고자 한다. 제안 모델의 평가 결과 최대 90.7%정도의 정확도를 보였다.

이용자 중심의 얼굴 표정을 통한 감정 인식 TV의 상호관계 연구 -인간의 표정을 통한 감정 인식기반의 TV과 인간의 상호 작용 연구 (The interaction between emotion recognition through facial expression based on cognitive user-centered television)

  • 이종식;신동희
    • 한국HCI학회논문지
    • /
    • 제9권1호
    • /
    • pp.23-28
    • /
    • 2014
  • In this study we focus on the effect of the interaction between humans and reactive television when emotion recognition through facial expression mechanism is used. Most of today's user interfaces in electronic products are passive and are not properly fitted into users' needs. In terms of the user centered device, we propose that the emotion based reactive television is the most effective in interaction compared to other passive input products. We have developed and researched next generation cognitive TV models in user centered. In this paper we present a result of the experiment that had been taken with Fraunhofer IIS $SHORE^{TM}$ demo software version to measure emotion recognition. This new approach was based on the real time cognitive TV models and through this approach we studied the relationship between humans and cognitive TV. This study follows following steps: 1) Cognitive TV systems can be on automatic ON/OFF mode responding to motions of people 2) Cognitive TV can directly select channels as face changes (ex, Neutral Mode and Happy Mode, Sad Mode, Angry Mode) 3) Cognitive TV can detect emotion recognition from facial expression of people within the fixed time and then if Happy mode is detected the programs of TV would be shifted into funny or interesting shows and if Angry mode is detected it would be changed to moving or touching shows. In addition, we focus on improving the emotion recognition through facial expression. Furthermore, the improvement of cognition TV based on personal characteristics is needed for the different personality of users in human to computer interaction. In this manner, the study on how people feel and how cognitive TV responds accordingly, plus the effects of media as cognitive mechanism will be thoroughly discussed.

시각장애인의 보행 보조를 위한 지팡이 메커니즘 설계 (Design of Cane Mechanism for Walking Aid of Visually Impaired Person)

  • 김병호
    • 로봇학회논문지
    • /
    • 제11권2호
    • /
    • pp.108-114
    • /
    • 2016
  • This paper presents a sensor-based cane mechanism for walking aid of the visually impaired person. We also describe an approach to decide properly the length of the specified cane mechanism. The cane mechanism has some sensors to identify the possibility of a collision between the cane user and an object and/or a person, and a signal processing unit that enables the user to recognize such a collision is attached in the mechanism. Thus, the walker using this cane can recognize in advance the possibility of such a collision in his walking process. Consequently, it is helpful for the visually impaired person to walk on a pedestrian road safely. The feature of the proposed cane mechanism and its availability have been shown through experimental works in a typical walking environment.

성도 면적 함수를 이용한 음성 인식에 관한 연구 (A Study on Speech Recognition using Vocal Tract Area Function)

  • 송제혁;김동준
    • 대한의용생체공학회:의공학회지
    • /
    • 제16권3호
    • /
    • pp.345-352
    • /
    • 1995
  • The LPC cepstrum coefficients, which are an acoustic features of speech signal, have been widely used as the feature parameter for various speech recognition systems and showed good performance. The vocal tract area function is a kind of articulatory feature, which is related with the physiological mechanism of speech production. This paper proposes the vocal tract area function as an alternative feature parameter for speech recognition. The linear predictive analysis using Burg algorithm and the vector quantization are performed. Then, recognition experiments for 5 Korean vowels and 10 digits are executed using the conventional LPC cepstrum coefficients and the vocal tract area function. The recognitions using the area function showed the slightly better results than those using the conventional LPC cepstrum coefficients.

  • PDF