• 제목/요약/키워드: 멀티 모달

검색결과 272건 처리시간 0.022초

다중 편광 SAR 영상 목표물 인식을 위한 딥 컨볼루션 뉴럴 네트워크 (Convolutional neural network for multi polarization SAR recognition)

  • 염광영;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.102-104
    • /
    • 2017
  • 최근 Convolutional neural network (CNN)을 도입하여, SAR 영상의 목표물 인식 알고리즘이 높은 성능을 보여주었다. SAR 영상은 4 종류의 polarization 정보로 구성되어있다. 기계와 신호처리의 비용으로 인하여 일부 데이터는 적은 수의 polarization 정보를 가지고 있다. 따라서 우리는 SAR 영상 data 를 멀티모달 데이터로 해석하였다. 그리고 우리는 이러한 멀티모달 데이터에 잘 작동할 수 있는 콘볼루션 신경망을 제안하였다. 우리는 데이터가 포함하는 모달의 수에 반비례 하도록 scale factor 구성하고 이를 입력 크기조절에 사용하였다. 입력의 크기를 조절하여, 네트워크는 특징맵의 크기를 모달의 수와 상관없이 일정하게 유지할 수 있었다. 또한 제안하는 입력 크기조절 방법은 네트워크의 dead filter 의 수를 감소 시켰고, 이는 네트워크가 자신의 capacity 를 잘 활용한다는 것을 의미한다. 또 제안된 네트워크는 특징맵을 구성할 때 다양한 모달을 활용하였고, 이는 네트워크가 모달간의 상관관계를 학습했다는 것을 의미한다. 그 결과, 제안된 네트워크의 성능은 입력 크기조절이 없는 일반적인 네트워크보다 높은 성능을 보여주었다. 또한 우리는 전이학습의 개념을 이용하여 네트워크를 모달의 수가 많은 데이터부터 차례대로 학습시켰다. 전이학습을 통하여 네트워크가 학습되었을 때, 제안된 네트워크는 특정 모달의 조합 경우만을 위해 학습된 네트워크보다 높은 성능을 보여준다.

  • PDF

멀티모달 기반의 감성 조명 시스템 (Sensitivity Lighting System Based on multimodal)

  • 권순민;정인범
    • 한국정보통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.721-729
    • /
    • 2012
  • 본 논문에서는 인간의 감성을 멀티모달 환경에 기반하여 인식하여 감성지수에 따라 조명의 색을 조절하는 감성조명 시스템을 구현하였다. 감성조명을 위하여 사용된 LED 조명은 친 환경적이며 고효율 및 긴 수명을 가지고 있다. 특히 LED 조명은 단일 조명구로도 다양한 색 표현이 가능한 장점을 가지고 있다. 인간의 감성을 보다 정확하게 판별하기 위하여 사용자의 얼굴 영상 정보와 및 각성 상태 정보를 동시에 사용하여 멀티모달에 기반된 감성지수를 산출하였다. 실험을 통하여 LED 조명 색감이 사용자의 감성지수에 따라 변화 되므로 기존의 조명들에 비하여 인간 친화적인 조명시스템을 구축함을 보인다.

캐릭터 에이전트 기반 멀티모달 프리젠테이션 저작도구 설계 및 구현 (Design and Implementation of a Character Agent based Multimodal Presentation Authoring Tool)

  • 정성태;정석태
    • 한국정보통신학회논문지
    • /
    • 제7권5호
    • /
    • pp.941-948
    • /
    • 2003
  • 컴퓨터를 이용한 프리젠테이션의 효율성을 높일 수 있는 한 방법으로 캐릭터 에이전트 기반의 멀티모달 프리젠테이션 표식언어(MPML: Multimodal Presentation Markup Language)가 개발되었다. 그러나, MPML은 캐릭터 에이전트의 행위만 기술하고 프리젠테이션 배경 텍스트와 이미지는 HTML(Hyper Text Markup Language) 문서를 불러서 사용하기 때문에 프리젠테이션 저작이 용이하지 않다. 본 논문에서는 캐릭터 행위 뿐 만아니라 프레젠테이션 배경도 같이 기술할 수 있도록 기존의 MPML을 확장하여 EMPML을 설계한다. 그리고 EMPML을 위한 저작 도구를 설계하고 구현한다. 제안된 저작 도구는 프리젠테이션 배경과 캐릭터 에이전트 행위 기술을 일원화하여 WYSIWIG(What You See Is What You Get) 방식의 편집을 제공함으로써 사용자들이 EMPML의 세부 내용을 모르더라도 멀티모달 프리젠테이션을 쉽게 만들 수 있도록 해준다.

유비쿼터스 환경의 상황인지 모델과 이를 활용한 멀티모달 인터랙션 디자인 프레임웍 개발에 관한 연구 (Ubiquitous Context-aware Modeling and Multi-Modal Interaction Design Framework)

  • 김현정;이현진
    • 디자인학연구
    • /
    • 제18권2호
    • /
    • pp.273-282
    • /
    • 2005
  • 본 연구는 유비쿼터스 컴퓨팅 환경구축에 활용하기 위한 상황인지 모델과 이를 활용한 멀티모달 인터랙션 디자인 프레임웍을 제안하였다. 먼저 상황인지 모델개발을 위해 사용자의 인터랙션 상황을 파악하는 방법과 수집된 상황의 의미를 추론하여 사용자 요구에 맞는 멀티모달 인터랙션 서비스를 제공하는 방법을 연구하였다. 또한 상황인지 모델(Context cube)을 활용한 멀티모달 인터랙션 디자인 프레임웍을 제안하였으며, 이 프레임웍의 활용성을 검증하는 사례연구를 수행하고, 개인화된 유비쿼터스 서비스 도출 및 이 서비스의 산업화 가능성을 제시하였다. 상황인지는 사용자의 기본 행위(Basic Activity), 공간에서의 사용자 위치 및 공간내의 기기 및 환경 요소, 시간 요소와 사용자의 일상적인 스케줄 정보 요소에 의해 파악할 수 있으며, 이러한 요소들을 종합하여 공간적인 개념의 상황인지 모델(Context Cube)을 개발함으로써, 구체적인 공간 모델 내에서의 다양하고 개인화 된 유비쿼터스 서비스의 제안이 가능하였다. 또한, 실제적인 사용자 시나리오에 의한 사례연구를 통해 개념 모델을 구축하는 과정 및 각 과정에서 요구되는 정보의 유형을 검증하고, 상황인지 모델에서의 구성요소의 내용과 배열 등을 정의함으로써 개념모델의 완성도를 높였으며, 상황인지 모델에서 표현되는 사용자의 인터랙션 특징을 바탕으로 멀티모달 인터랙션 디자인의 접근방법을 개발함으로서 이를 디자인 프레임웍으로 구체화할 수 있었다.

  • PDF

멀티모달 인터페이스를 사용한 웹 게임 시스템의 구현 (Implementation of Web Game System using Multi Modal Interfaces)

  • 이준;안영석;김지인;박성준
    • 한국게임학회 논문지
    • /
    • 제9권6호
    • /
    • pp.127-137
    • /
    • 2009
  • 웹 게임은 웹 브라우저를 통해 게임을 즐길 수 있도록 해주는 게임의 한 종류로써 편리한 접근성 및 대용량의 게임데이터를 다운로드가 필요하지 않는 장점을 가지고 있다. 이러한 웹 게임은 최근 모바일 기기의 발전과 웹 2.0 시대를 맞아 새로운 성장의 기회를 가지고 있다. 본 연구에서는 이러한 웹 게임에 사용자의 직관적인 조작이 가능한 멀티모달 인터페이스 및 모바일 기기를 연동할 수 있는 새로운 형태의 시스템을 제안 한다. 본 논문에서는 웹 게임의 인터페이스로써 멀티모달 인터페이스인 Wii를 사용하였으며, 여러 사용자들이 일반 PC 및 UMPC와 같은 모바일 기기를 통해서도 게임을 즐길 수 있는 구조를 설계 하였다. 본 논문에서 제안된 시스템을 평가하기 위해 기존의 방법으로 웹 게임을 즐길 때와 멀티모달 인터페이스를 사용하는 경우에 따른 성능 평가 및 사용자 평가를 하였으며, 실험 결과 모바일 기기에서 멀티모달 인터페이스를 사용한 경우에 게임 클리어 시간 및 에러가 감소하는 결과를 얻었으며 사용자들의 흥미도 또한 가장 높게 나왔다.

  • PDF

이동환경에서 치열영상과 음성을 이용한 멀티모달 화자인증 시스템 구현 (An Implementation of Multimodal Speaker Verification System using Teeth Image and Voice on Mobile Environment)

  • 김동주;하길람;홍광석
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.162-172
    • /
    • 2008
  • 본 논문에서는 이동환경에서 개인의 신원을 인증하는 수단으로 치열영상과 음성을 생체정보로 이용한 멀티모달 화자인증 방법에 대하여 제안한다. 제안한 방법은 이동환경의 단말장치중의 하나인 스마트폰의 영상 및 음성 입력장치를 이용하여 생체 정보를 획득하고, 이를 이용하여 사용자 인증을 수행한다. 더불어, 제안한 방법은 전체적인 사용자 인증 성능의 향상을 위하여 두 개의 단일 생체인식 결과를 결합하는 멀티모달 방식으로 구성하였고, 결합 방법으로는 시스템의 제한된 리소스를 고려하여 비교적 간단하면서도 우수한 성능을 보이는 가중치 합의 방법을 사용하였다. 제안한 멀티모달 화자인증 시스템의 성능평가는 스마트폰에서 획득한 40명의 사용자에 대한 데이터베이스를 이용하였고, 실험 결과, 치열영상과 음성을 이용한 단일 생체인증 결과는 각각 8.59%와 11.73%의 EER를 보였으며, 멀티모달 화자인증 결과는 4.05%의 EER를 나타냈다. 이로부터 본 논문에서는 인증 성능을 향상하기 위하여 두 개의 단일 생체인증 결과를 간단한 가중치 합으로 결합한 결과, 높은 인증 성능의 향상을 도모할 수 있었다.

적은 양의 음성 및 텍스트 데이터를 활용한 멀티 모달 기반의 효율적인 감정 분류 기법 (Efficient Emotion Classification Method Based on Multimodal Approach Using Limited Speech and Text Data)

  • 신미르;신유현
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.174-180
    • /
    • 2024
  • 본 논문에서는 wav2vec 2.0과 KcELECTRA 모델을 활용하여 멀티모달 학습을 통한 감정 분류 방법을 탐색한다. 음성 데이터와 텍스트 데이터를 함께 활용하는 멀티모달 학습이 음성만을 활용하는 방법에 비해 감정 분류 성능을 유의미하게 향상시킬 수 있음이 알려져 있다. 본 연구는 자연어 처리 분야에서 우수한 성능을 보인 BERT 및 BERT 파생 모델들을 비교 분석하여 텍스트 데이터의 효과적인 특징 추출을 위한 최적의 모델을 선정하여 텍스트 처리 모델로 활용한다. 그 결과 KcELECTRA 모델이 감정 분류 작업에서 뛰어난 성능이 보임을 확인하였다. 또한, AI-Hub에 공개되어 있는 데이터 세트를 활용한 실험을 통해 텍스트 데이터를 함께 활용하면 음성 데이터만 사용할 때보다 더 적은 양의 데이터로도 더 우수한 성능을 달성할 수 있음을 발견하였다. 실험을 통해 KcELECTRA 모델을 활용한 경우가 정확도 96.57%로 가장 우수한 성능을 보였다. 이는 멀티모달 학습이 감정 분류와 같은 복잡한 자연어 처리 작업에서 의미 있는 성능 개선을 제공할 수 있음을 보여준다.

모달 스트레인 에너지를 이용한 3차원 형상 비교 (3D Shape Comparison Using Modal Strain Energy)

  • 최수미
    • 한국멀티미디어학회논문지
    • /
    • 제7권3호
    • /
    • pp.427-437
    • /
    • 2004
  • 3차원 모델간의 형상을 비교하는 것은 형상을 기반으로 하는 인식, 검색, 분류 등을 위해 매우 중요하다. 본 논문에서는 모델의 이동, 회전, 스케일 변화에 영향받지 않고, 모델을 구성하는 정점들이 비균일 하고 불완전한 경우에도 강인한 3차원 형상 비교 방법을 제안한다. 먼저 입력 데이터로부터 고유 모드를 이용한 모달 모델을 구성하고 모달 스트레인 에너지를 이용하여 형상 간의 유사성을 비교한다. 제안된 방법은 고유 진동수에 따라 고유 모드들을 순서화 함으로써 형태 변형을 전역적인 것에서부터 지역적인 것으로 체계화한다. 이렇게 체계화된 형상 표현과 모달 스트레인 에너지를 이용함으로써 국부적인 형태에 치우치지 않고 전체적인 형태의 유사성을 평가하였다.

  • PDF