• 제목/요약/키워드: 다중 모달

검색결과 54건 처리시간 0.026초

가상 인간의 감정 표현 인식을 위한 비언어적 다중모달 영향 분석 (Impact Analysis of nonverbal multimodals for recognition of emotion expressed virtual humans)

  • 김진옥
    • 인터넷정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.9-19
    • /
    • 2012
  • 디지털 콘텐츠에서 HCI로 활용되는 가상 인간은 얼굴 표정과 신체자세와 같은 모달을 이용하여 다양한 감정을 표현하지만 비언어적 다중모달의 조합에 대한 연구는 많지 않다. 감정을 표현하는 가상 인간을 제작하려면 계산 엔진 모델은 얼굴 표정과 신체자세와 같은 비언어적 모달의 조합이 사용자에 의해 어떻게 인식되는지를 고려해야 하기 때문에 본 연구는 가상 인간의 감정 표현 디자인에 필요한 비언어적 다중모달의 영향을 분석하여 제시한다. 먼저 가상 인간에 대한 다중모달 별 감정 인식을 평가하여 다른 모달간의 상대적 영향성을 분석하였다. 그리고 일치하는 얼굴과 자세 모달을 통해 기본 감정 및 정서가와 활성화 인식에 대한 영향을 평가하며 감정이 불일치하는 다중모달을 통해 일상생활에서 빈번하게 드러나는 중첩된 감정의 인식 정도를 관측하였다. 실험 결과, 가상 인간의 얼굴과 신체자세의 표정이 일치하면 감정 인식이 용이하며, 얼굴 표정으로 감정 카테고리를 판별하지만 감정의 활성화 차원 판단에는 자세 모달리티가 선호됨을 확인하였다. 본 연구 결과는 감정을 드러내는 가상 인간의 행동 동기화 및 애니메이션 엔진 시스템 구현에 활용할 수 있다.

바이오 응용을 위한 초음파 및 광학 기반 다중 모달 영상 기술 (Ultrasound-optical imaging-based multimodal imaging technology for biomedical applications)

  • 이문환;박희연;이경수;김세웅;김지훈;황재윤
    • 한국음향학회지
    • /
    • 제42권5호
    • /
    • pp.429-440
    • /
    • 2023
  • 이 연구는 초음파 광학 영상 기반의 다중 모달 영상 기술에 대한 최신 연구 동향과 응용 가능성에 대해 조사하였다. 초음파 영상은 실시간 영상 기능을 가지고 있으며 인체에 상대적으로 안전한 특성으로 인해 의료 분야에서 다양한 질병의 진단에 사용되고 있다. 그러나 초음파 영상은 해상도가 낮은 한계가 있어 진단 정확도를 향상시키기 위해 다른 광학 영상과의 결합을 통한 다중 모달 영상 기술 개발 연구가 진행되고 있다. 특히 초음파 광학 영상 기반의 다중 모달 영상 기술은 각각의 영상 기법의 장점을 극대화하고 단점을 보완함으로써 질병 진단 정확도를 향상시킬 수 있는 수단으로 사용되고 있다. 이러한 기술은 초음파의 실시간 영상 기능과 광간섭 단층 영상 융합 기술, 초음파 광음향 다중 모달 영상 기술, 초음파 형광 다중 모달 영상 기술, 초음파 형광 시정수 다중 모달 영상 기술 및 초음파 분광 다중 모달 영상 기술 등 다양한 형태로 제안되고 있다. 본 연구에서는 이러한 초음파 광학 영상 기반의 다중 모달 영상 기술의 최신 연구 동향을 소개하고, 의학 및 바이오 분야에서의 응용 가능성을 조사하였다. 이를 통해 초음파와 광학 기술의 융합이 어떻게 진행되고 있는지에 대한 통찰력을 제공하고, 의료 분야에서의 진단 정확도 향상을 위한 새로운 접근 방식에 대한 기반을 마련하였다.

암묵 데이터를 활용한 인문학 인풋값과 다중 모달리티의 가중치 할당 방법에 관한 연구 (A Study on the Weight Allocation Method of Humanist Input Value and Multiplex Modality using Tacit Data)

  • 이원태;강장묵
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.157-163
    • /
    • 2014
  • 이용자의 감성은 그 어느 때보다 기업, 정부 그리고 개인 간의 소통에서 중요한 변수로 인식된다. 특히 수많은 연구에서 이용자의 감성을 파악하는 방법으로 음성 톤, 속도, 얼굴 표정, 몸의 이동 방향과 속도, 제스쳐 등이 사용된다. 다중 모달리티는 단일의 모달리티보다 정확도가 높은 반면 멀티 센싱에 따른 인식률 한계와 데이터 처리 부하 그리고 센싱된 값을 추론하는 우수한 알고리즘이 요구된다. 즉 다중 모달리티는 각 모달리티의 개념, 속성이 상이하여 인간의 감성값이라는 표준화된 값으로 전환하는데 오류가 발생할 수 있다. 이 문제를 해결하기 위해 다중 모발리티 중관계망 분석, 문맥 파악, 디지털 필터 등의 기술을 이용하여 이용자에게 우선 순위를 갖는 감성 표현 모달리티를 추출할 필요가 있다. 특정 상황에 우선 순위를 갖는 모달리티와 그 주변을 에워싼 다른 모발리티를 암묵 값으로 처리하면 감성 인식에 있어 컴퓨터 자원의 소비 대비 견고한 시스템을 구성할 수 있다. 본 연구 결과, 암묵 데이터를 활용하여 다중 모발리티 중 가중치를 어떻게 부여할지에 대하여 제안하였다.

모바일 환경에서 다중 바이오인식 기반의 금융 거래를 위한 사용자 인증 프레임워크 (A Framework of User Authentication for Financial Transaction based Multi-Biometrics in Mobile Environments)

  • 한승진
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권1호
    • /
    • pp.143-151
    • /
    • 2015
  • 바이오인식 기술은 기존의 PIN이나 패스워드와 달리 분실하거나 도용될 가능성이 적기 때문에 새로운 인증 수단으로 대체되고 있다. 그러나 바이오인식 정보는 PIN이나 패스워드 혹은 개인정보와 달리 노출되어 도용이 된다면 수정할 방법이 없다. 따라서, 기존의 단일 모달리티에 단일 바이오인식 정보처럼 노출이 되면 치명적인 방법이 아닌 다중 모달리티와 다중 바이오인식 정보를 사용하여 사용자와 TTP 혹은 금융기관 간 인증하도록 함으로써 본 논문은 보다 신뢰성있는 방법을 제안하고 기존의 방법과 보안 및 성능을 비교한다.

표면거리 및 표면곡률 최적화 기반 다중모달리티 뇌영상 정합 (Multimodal Brain Image Registration based on Surface Distance and Surface Curvature Optimization)

  • 박지영;최유주;김민정;태우석;홍승봉;김명희
    • 정보처리학회논문지A
    • /
    • 제11A권5호
    • /
    • pp.391-400
    • /
    • 2004
  • 서로 다른 종류의 영상을 정확하게 연관시켜 복합적인 정보를 제공하는 다중모달리티 의료 영상정합기법 중 표면정보 기반 영상정합에서는 일반적으로 동일 대상에 대한 서로 다른 모달리티에서 추출된 표면 윤곽정보 사이의 거리를 최소화함으로써 매칭이 이루어진다. 그런데 동일대상에 대해 취득되는 서로 다른 두 모달리티는 관심 영역 상의 표면 특성이 서로 유사하다. 그러므로 다중모달리티 영상정합에서 표면거리와 함께 표면의 형태 특성을 고려하여 두 영상을 매칭하는 방법이 정합결과의 정확도를 향상시킬 수 있다. 본 연구에서는 동일 대상의 서로 다른 두 모달리티 뇌영상 간의 표면거리와 표면곡률을 최적화하는 정합기법을 제안한다. 영상정합은 참조영상과 테스트영상에 대한 표면정보 생성과 이 두 개의 표면정보를 최적화하는 단계로 구성된다. 표면정보 생성 단계에서는 두 모달리티로부터 관심영역의 윤곽선을 추출하고, 이 중 참조 볼륨의 윤곽선에 대해서는 표면거리맵과 표면곡률맵을 구성하게 된다. 최적화 단계에서는 표면거리맵과 표면곡률맵을 참조하는 최적화 평가함수(cost function)에 의해 두 객체의 표면거리 차이와 표면곡률 차이를 최소화하는 정합 변환 값이 결정되고, 이것이 테스트영상의 변환에 적용되어 결과적으로 두 영상이 정합 되게 된다. 제안된 최적화 평가함수는 표면거리 정보만을 사용하는 평가함수에 비해 보다 견고한 정합 정확도를 보였으며 또한 본 연구는 정합결과의 볼륨 가시화를 통해 효율적인 영상 분석 수단을 제공하고자 하였다.

다중 편광 SAR 영상 목표물 인식을 위한 딥 컨볼루션 뉴럴 네트워크 (Convolutional neural network for multi polarization SAR recognition)

  • 염광영;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.102-104
    • /
    • 2017
  • 최근 Convolutional neural network (CNN)을 도입하여, SAR 영상의 목표물 인식 알고리즘이 높은 성능을 보여주었다. SAR 영상은 4 종류의 polarization 정보로 구성되어있다. 기계와 신호처리의 비용으로 인하여 일부 데이터는 적은 수의 polarization 정보를 가지고 있다. 따라서 우리는 SAR 영상 data 를 멀티모달 데이터로 해석하였다. 그리고 우리는 이러한 멀티모달 데이터에 잘 작동할 수 있는 콘볼루션 신경망을 제안하였다. 우리는 데이터가 포함하는 모달의 수에 반비례 하도록 scale factor 구성하고 이를 입력 크기조절에 사용하였다. 입력의 크기를 조절하여, 네트워크는 특징맵의 크기를 모달의 수와 상관없이 일정하게 유지할 수 있었다. 또한 제안하는 입력 크기조절 방법은 네트워크의 dead filter 의 수를 감소 시켰고, 이는 네트워크가 자신의 capacity 를 잘 활용한다는 것을 의미한다. 또 제안된 네트워크는 특징맵을 구성할 때 다양한 모달을 활용하였고, 이는 네트워크가 모달간의 상관관계를 학습했다는 것을 의미한다. 그 결과, 제안된 네트워크의 성능은 입력 크기조절이 없는 일반적인 네트워크보다 높은 성능을 보여주었다. 또한 우리는 전이학습의 개념을 이용하여 네트워크를 모달의 수가 많은 데이터부터 차례대로 학습시켰다. 전이학습을 통하여 네트워크가 학습되었을 때, 제안된 네트워크는 특정 모달의 조합 경우만을 위해 학습된 네트워크보다 높은 성능을 보여준다.

  • PDF

Imaginary Soundscape 기반의 딥러닝을 활용한 회화와 음악의 매칭 및 다중 감각을 이용한 융합적 평가 방법 (Convergence evaluation method using multisensory and matching painting and music using deep learning based on imaginary soundscape)

  • 정하영;김영준;조준동
    • 한국융합학회논문지
    • /
    • 제11권11호
    • /
    • pp.175-182
    • /
    • 2020
  • 본 연구에서는 회화 감상에 도움이 되는 사운드스케이프를 구성하기 위해 딥러닝 기술을 활용하여 클래식 음악을 매칭하는 기술을 소개하고 회화와 음악 매칭이 얼마나 잘 되었는지에 대해 평가할 수 있는 평가 지표를 제안한다. 평가 지표는 리커드 5점 척도를 통한 적합도 평가와 멀티모달 측면의 평가로 진행하였다. 회화와 음악 매칭에 대해 13명의 실험 참가자의 적합도 평가의 점수는 3.74/5.0 이었고, 또한 13명의 실험 참가자의 멀티모달 평가에서 회화와 음악 매칭의 코사인 유사도의 평균은 0.79였다. 멀티모달적 평가는 새로운 사용자 경험을 측정할 수 있는 평가 지표가 될 것으로 기대된다. 또한 본 연구를 통해 시각과 청각의 인터랙션을 제안함으로써 다중감각 예술작품 경험을 향상시키고자 하였다. 본 연구에서 제안된 회화와 음악 매칭이 다중감각 예술작품 전시에서 활용되며 더 나아가 이는 시각 장애인들의 예술작품 감상에 대한 접근성을 높일 수 있을 것이라 기대한다.

다중 모달 정합에 의한 Visible Human의 뼈 분할 방법 (Bone Segmentation Method of Visible Human using Multimodal Registration)

  • 이호;김동성;강흥식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.719-726
    • /
    • 2003
  • 본 논문에서는 Visible Human 컬러 단면 영상에서 인접한 지방 영역과 색상 특성이 유사하여 구별이 매우 힘든 뼈 영역을 분할하기 위해 다중 모달 정합 방법을 제안한다. 뼈와 그 인접영역의 구별이 뚜렷한 CT 영상에서 뼈를 분할하고 두 영상의 정합을 이용하여 컬러 영상에서 최종 뼈 분할을 수행한다. CT 영상에서 뼈의 분할 방법은 임계값 기반 방법을 사용하였고, 정합은 두 영상에서 신체 부위를 임계값 기반의 방법을 사용하여 분할된 객체들의 경계를 상호 상관관계(cross-correlation)방법을 사용하여 수행하였다. 제안된 방법은 Visible Human 컬러 단면 영상 중에 뼈와 인접 지방이 유사하여 그 분할이 어려운 머리부위와 다리부위에 적용하여 고무적인 결과론 얻었다.

표면 및 복셀 유사성 기반 다중모달리티 비선형 의료영상정합 (Multimodality Nonlinear Medical Image Registration based on Surface Information & Voxel Similarity)

  • 김민정;김명희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.1633-1636
    • /
    • 2005
  • 의료영상정합은 환자의 해부학적 정보와 기능적 정보를 혼합함으로써 기능이상부위의 해부학적 위치를 판별하기 위한 목적으로 널리 이용되고 있다. 그러나 실제적으로 여러 종류의 환자영상 취득이 어렵거나 해부학적 영상정보가 손실되는 경우가 적지 않다. 따라서 표준 정상인 해부학적 영상과 환자 기능영상을 정합함으로써 보다 객관적인 환자 기능이상부위 분석이 요구된다. 이는 다중개체, 다중모달리티간 영상정합으로 기존의 표면정보 또는 복셀정보 기반 방법으로는 한계가 있다. 따라서 본 연구에서는 두 대상영상 표면 뿐 아니라 내부 볼륨까지 대응시킬 수 있는 표면정보와 복셀정보를 혼합 적용한 기법을 제안한다.

  • PDF

다중모달을 이용한 전자상거래시스템 개발 (Development of a Electronic Commerce System of Multi-Modal Information)

  • 장찬용;류갑상
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 추계종합학술대회
    • /
    • pp.729-732
    • /
    • 2001
  • 다중정보를 이용한 개인 인증시스템은 음성인식, 얼굴인식, 전자서명 둥의 방법을 이용하여 보안 시스템을 구축하는 기술로서 통신망 전반에 존재하는 많은 위협들로부터 중요한 정보를 보호할 수 있는 매우 효율적인 방법이다. 본 논문에서는 공개키 암호 및 전자서명 기술을 기반으로 디지털 정품 컴퓨터 S/W 및 H/W 와 관련된 제품을 인터넷 공간에서 거래할 수 있는 전자상거래 시스템(CBT-Shop)을 구현하였다. 다중정보의 개인인증 기술을 싸이버테크 인터넷 쇼핑몰의 설계와 구현에 적용함으로서 보안이 고려된 상거래시스템 구현이 가능하게 됨을 설명하고 있다.

  • PDF