• 제목/요약/키워드: Temporal Attention Mechanism

검색결과 17건 처리시간 0.021초

Depth Images-based Human Detection, Tracking and Activity Recognition Using Spatiotemporal Features and Modified HMM

  • Kamal, Shaharyar;Jalal, Ahmad;Kim, Daijin
    • Journal of Electrical Engineering and Technology
    • /
    • 제11권6호
    • /
    • pp.1857-1862
    • /
    • 2016
  • Human activity recognition using depth information is an emerging and challenging technology in computer vision due to its considerable attention by many practical applications such as smart home/office system, personal health care and 3D video games. This paper presents a novel framework of 3D human body detection, tracking and recognition from depth video sequences using spatiotemporal features and modified HMM. To detect human silhouette, raw depth data is examined to extract human silhouette by considering spatial continuity and constraints of human motion information. While, frame differentiation is used to track human movements. Features extraction mechanism consists of spatial depth shape features and temporal joints features are used to improve classification performance. Both of these features are fused together to recognize different activities using the modified hidden Markov model (M-HMM). The proposed approach is evaluated on two challenging depth video datasets. Moreover, our system has significant abilities to handle subject's body parts rotation and body parts missing which provide major contributions in human activity recognition.

DeepPTP: A Deep Pedestrian Trajectory Prediction Model for Traffic Intersection

  • Lv, Zhiqiang;Li, Jianbo;Dong, Chuanhao;Wang, Yue;Li, Haoran;Xu, Zhihao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권7호
    • /
    • pp.2321-2338
    • /
    • 2021
  • Compared with vehicle trajectories, pedestrian trajectories have stronger degrees of freedom and complexity, which poses a higher challenge to trajectory prediction tasks. This paper designs a mode to divide the trajectory of pedestrians at a traffic intersection, which converts the trajectory regression problem into a trajectory classification problem. This paper builds a deep model for pedestrian trajectory prediction at intersections for the task of pedestrian short-term trajectory prediction. The model calculates the spatial correlation and temporal dependence of the trajectory. More importantly, it captures the interactive features among pedestrians through the Attention mechanism. In order to improve the training speed, the model is composed of pure convolutional networks. This design overcomes the single-step calculation mode of the traditional recurrent neural network. The experiment uses Vulnerable Road Users trajectory dataset for related modeling and evaluation work. Compared with the existing models of pedestrian trajectory prediction, the model proposed in this paper has advantages in terms of evaluation indicators, training speed and the number of model parameters.

디지털 게임 설계 장치로서의 다중 프레임 연구 (A Study on the frame within a frame as a Digital Game Design Tool)

  • 김다인;성정환
    • 한국게임학회 논문지
    • /
    • 제21권6호
    • /
    • pp.111-124
    • /
    • 2021
  • 회화를 기점으로 영화, 만화, 게임을 아울러 관객의 시선을 묶는 행위의 주축을 담당하는 것은 프레임이다. 프레임에 대해 안다는 것은 프레임을 읽을 수 있게 되는 것이며, 사용할 수 있게 되는 것이다. 따라서 본 논문은 디지털 게임의 프레임, 그 중에서도 일차 프레임의 한정된 구성을 보완하는 다중 프레임에 관해 다룬다. 본 논문에서는 게임의 기본 구성인 구조적 프레임, 플레이어 행위의 출력인 가변적 프레임, 기존 시각 매체 특성을 나타내는 표면적 프레임으로 다중 프레임을 분류한다. 이를 통해 디지털 게임 설계 장치로서의 다중 프레임의 양상을 살펴본다. 본 논문은 향후 게임의 다중 프레임 활용 가능성을 도출하고 다중 프레임 분석의 기제를 제공했다는 데서 유의미하다.

동적 메모리 네트워크의 시간 표현과 데이터 확장을 통한 질의응답 최적화 (Question Answering Optimization via Temporal Representation and Data Augmentation of Dynamic Memory Networks)

  • 한동식;이충연;장병탁
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.51-56
    • /
    • 2017
  • 질의응답 문제를 인공지능 모델을 통해 해결하는 연구는 메모리 네트워크의 등장으로 인해 방법론의 변화를 맞이하고 있으며, 그 중 동적 메모리 네트워크(DMN)는 인간 기억 체계에 착안하여 신경망 기반의 주의 기제를 적용하면서, 질의응답에서 일어나는 각 인지 과정들을 모듈화 했다는 특징들을 갖는다. 본 연구에서는 부족한 학습 데이터를 확장 시키고, DMN이 내포하고 있는 시간 인식의 한계를 개선해 정답률을 높이고자 한다. 실험 결과, 개선된 DMN은 1K-bAbI 문제의 테스트 데이터에서 89.21%의 정답률과, 95%를 질의응답 통과의 기준의 정답률으로 가정할 때 12개의 과제를 통과하는 성능을 보여 정확도 면에서 기존의 DMN에 비해 13.5%p 만큼 더 높고, 4개의 과제를 추가로 통과하는 성능 향상을 보여주었다. 또한 뒤이은 실험을 통해, 데이터 내에서 비슷한 의미 구조를 가지는 단어들은 벡터 공간상에서 강한 군집을 이룬다는 점과, 일화 기억 모듈 통과 횟수와 근거 사실 수의 성능에 큰 영향을 미치는 직접적인 연관성을 발견하였다.

Grouting diffusion mechanism in an oblique crack in rock masses considering temporal and spatial variation of viscosity of fast-curing grouts

  • Huang, Shuling;Pei, Qitao;Ding, Xiuli;Zhang, Yuting;Liu, Dengxue;He, Jun;Bian, Kang
    • Geomechanics and Engineering
    • /
    • 제23권2호
    • /
    • pp.151-163
    • /
    • 2020
  • Grouting method is an effective way of reinforcing cracked rock masses and plugging water gushing. Current grouting diffusion models are generally developed for horizontal cracks, which is contradictory to the fact that the crack generally occurs in rock masses with irregular spatial distribution characteristics in real underground environments. To solve this problem, this study selected a cement-sodium silicate slurry (C-S slurry) generally used in engineering as a fast-curing grouting material and regarded the C-S slurry as a Bingham fluid with time-varying viscosity for analysis. Based on the theory of fluid mechanics, and by simultaneously considering the deadweight of slurry and characteristics of non-uniform spatial distribution of viscosity of fast-curing grouts, a theoretical model of slurry diffusion in an oblique crack in rock masses at constant grouting rate was established. Moreover, the viscosity and pressure distribution equations in the slurry diffusion zone were deduced, thus quantifying the relationship between grouting pressure, grouting time, and slurry diffusion distance. On this basis, by using a 3-d finite element program in multi-field coupled software Comsol, the numerical simulation results were compared with theoretical calculation values, further verifying the effectiveness of the theoretical model. In addition, through the analysis of two engineering case studies, the theoretical calculations and measured slurry diffusion radius were compared, to evaluate the application effects of the model in engineering practice. Finally, by using the established theoretical model, the influence of cracking in rock masses on the diffusion characteristics of slurry was analysed. The results demonstrate that the inclination angle of the crack in rock masses and azimuth angle of slurry diffusion affect slurry diffusion characteristics. More attention should be paid to the actual grouting process. The results can provide references for determining grouting parameters of fast-curing grouts in engineering practice.

준 지도학습과 여러 개의 딥 뉴럴 네트워크를 사용한 멀티 모달 기반 감정 인식 알고리즘 (Multi-modal Emotion Recognition using Semi-supervised Learning and Multiple Neural Networks in the Wild)

  • 김대하;송병철
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.351-360
    • /
    • 2018
  • 인간 감정 인식은 컴퓨터 비전 및 인공 지능 영역에서 지속적인 관심을 받는 연구 주제이다. 본 논문에서는 wild 환경에서 이미지, 얼굴 특징점 및 음성신호로 구성된 multi-modal 신호를 기반으로 여러 신경망을 통해 인간의 감정을 분류하는 방법을 제안한다. 제안 방법은 다음과 같은 특징을 갖는다. 첫째, multi task learning과 비디오의 시공간 특성을 이용한 준 감독 학습을 사용함으로써 영상 기반 네트워크의 학습 성능을 크게 향상시켰다. 둘째, 얼굴의 1 차원 랜드 마크 정보를 2 차원 영상으로 변환하는 모델을 새로 제안하였고, 이를 바탕으로 한 CNN-LSTM 네트워크를 제안하여 감정 인식을 향상시켰다. 셋째, 특정 감정에 오디오 신호가 매우 효과적이라는 관측을 기반으로 특정 감정에 robust한 오디오 심층 학습 메커니즘을 제안한다. 마지막으로 소위 적응적 감정 융합 (emotion adaptive fusion)을 적용하여 여러 네트워크의 시너지 효과를 극대화한다. 제안 네트워크는 기존의 지도 학습과 반 지도학습 네트워크를 적절히 융합하여 감정 분류 성능을 향상시켰다. EmotiW2017 대회에서 주어진 테스트 셋에 대한 5번째 시도에서, 제안 방법은 57.12 %의 분류 정확도를 달성하였다.

망상의 신경심리학적 기전 (Neuropsychological Mechanism of Delusion)

  • 이성훈;김동화;박윤조;박혜정;신윤식
    • 수면정신생리
    • /
    • 제7권1호
    • /
    • pp.60-66
    • /
    • 2000
  • 목 적: 정신분열병이 뇌질환으로 인식되고 연구되면서 그 정신병리 역시 특정 뇌의 구조와 기능의 장애에 의해 발생될 것으로 기대되었다. 저자들은 그 대표적인 증상인 망상이 뇌의 어떤 구조와 기능의 장애와 관계되는 지를 알아보기 위해 기질적 뇌손상이 없는 정신과와 뇌손상 환자에서 신경심리 검사와 망상과의 관계성을 연구하였다. 방 법: 정신과 환자 69명, 뇌손상 환자 50명, 총119명의 환자에서 Halstead Reitan 신경심리 검사와 K-WAIS, 청각사건 관계전위 검사 및 MMPI를 시행하였다. MMPI 항목 중 망상과 관계되는 24개 항목에서 산출된 점수와 신경심리 검사와 N120과 P300의 전위와 잠복기와 어떤 상관 관계가 있는지를 통계적으로 알아보았다. 또 정신과 환자에서 망상 점수가 높은 고망상군 18명과 저망상군 21명을 t-test로 비교하였다. 결 과: 뇌손상 환자군에서 망상이 전두엽 기능을 보는 범주화 검사, 선로 잇기 AB 검사, 촉각 수행 검사, 숫자 상징 검사, 손끝 숫자 쓰기 검사와 전체적인 뇌손상 수준을 보는 IQ와 뇌손상 지수와 높은 유의한 상관 관계를 보였다. 또 좌측 측두 및 두정엽 기능을 보는 지식, 이해, 어휘, 공통성, 언어 발음 지각 검사, 높은 유의한 상관 관계를 보였고 피질하 기능을 보는 산수, 숫자 외우기, 집중력 점수, 숫자 상징 검사, 바꿔 쓰기, 선로 잇기 AB 검사와 유의한 상관 관계를 보였다. 또 우측 반구 기능을 보는 촉각 수행 검사의 위치, 빠진 곳 찾기, 동작 점수와 유의한 상관 관계를 보였다. 고망상군 정신과 환자군이 저망상군 정신과 환자에 비해 좌측 반구 기능을 보는 검사인 이해, 어휘, 언어성 점수에서 유의한 차이가 있었고, 피질하 기능을 보는 $N_1$의 전위, 산수와 숫자 상징에서 유의한 차이가 있었다. 결 론: 망상은 전두엽, 좌측 측두 및 두정엽, 피질하가 상호 중요한 역할을 하면서 발생되는 것으로 생각되며, 우측 반구도 부분적으로 관계 된 것으로 보인다.

  • PDF