통합 검색 | Korea Science

비디오 질의 응답 시스템을 위한 전이 학습 기반의 멀티 모달 퓨전 정답 선택 모델 (Transfer Learning-based Multi-Modal Fusion Answer Selection Model for Video Question Answering System)

박규민;박성배
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
- /
- pp.548-553
- /
- 2021
비디오 질의 응답은 입력으로 주어진 비디오와 질문에 적절할 정답을 제공하기 위해 텍스트, 이미지 등 다양한 정보처리가 요구되는 대표적인 multi-modal 문제이다. 질의 응답 시스템은 질의 응답의 성능을 높이기 위해 다수의 서로 다른 응답 모듈을 사용하기도 하며 생성된 정답 후보군 중 가장 적절할 정답을 선택하는 정답 선택 모듈이 필요하다. 정답 선택 모듈은 응답 모듈의 서로 다른 관점을 고려하여 응답 선택을 선택할 필요성이 있다. 하지만 응답 모듈이 black-box 모델인 경우 정답 선택 모듈은 응답 모듈의 parameter와 예측 분포를 통해 지식을 전달 받기 어렵다. 그리고 학습 데이터셋은 응답 모듈이 학습에 사용했기 때문에 과적합 문제로 각 모듈의 관점을 학습하기엔 어려우며 학습 데이터셋 이외 비교적 적은 데이터셋으로 학습해야 하는 문제점이 있다. 본 논문에서는 정답 선택 성능을 높이기 위해 전이 학습 기반의 멀티모달 퓨전 정답 선택 모델을 제안한다. DramaQA 데이터셋을 통해 성능을 측정하여 제안된 모델의 우수성을 실험적으로 증명하였다.
PDF

데이터 퓨전을 위한 무선 센서 네트워크용 스패닝 트리 : FST (FST : Fusion Rate Based Spanning Tree for Wireless Sensor Networks)

서창진;신지수
- 정보처리학회논문지C
- /
- 제16C권1호
- /
- pp.83-90
- /
- 2009
무선 센서 네트워크(Wireless Sensor Network : WSN)는 자율적으로 라우팅 경로를 구성하여 물리적으로 떨어진 지역의 데이터를 수집하는 무선망이다. 본 논문은 주기적으로 수집한 모든 데이터를 하나의 기지 노드로 전달하는 convergecast 환경에서 퓨전(fusion)을 반영한 라우팅 방법을 제안한다. 지금까지 대부분의 연구는 무퓨전(no-fusion)과 전퓨전(full-fusion)의 두 경우만을 다루었다. 제안하는 Fusion rate based Spanning Tree(FST)는 임의의 퓨전율 f ($0{\leq}f{\leq}1$)에서 총 전송 에너지 비용을 줄이는 라우팅 경로를 제공 한다. FST는 무퓨전(f = 0)과 전퓨전(f = 1)의 convergecast에서 각각 최적의 토폴로지인 최소 경로 트리(Shortest Path spanning Tree : SPT)와 최소 스패닝 트리(Minimum Spanning Tree : MST)를 제공하며, 임의의 f (0 < f < 1)에 대해서도 SPT나 MST보다 우수한 토폴로지를 제공한다. 시뮬레이션은 100-노드 WSN에서 모든 f ($0{\leq}f{\leq}1$)에 대해 FST의 총 길이가 평균적으로 MST보다 약 31%, SPT보다 약 8% 절약 됨을 보여준다. 따라서 우리는 FST가 WSN에서 매우 유용한 토폴로지임을 확인하였다.
https://doi.org/10.3745/KIPSTC.2009.16-C.1.83 인용 PDF KSCI

피싱 웹사이트 URL의 수준별 특징 모델링을 위한 컨볼루션 신경망과 게이트 순환신경망의 퓨전 신경망

부석준;김혜정
- 정보보호학회지
- /
- 제29권3호
- /
- pp.29-36
- /
- 2019
폭발적으로 성장하는 소셜 미디어 서비스로 인해 개인간의 연결이 강화된 환경에서는 URL로써 전파되는 피싱 공격의 위험성이 크게 강조된다. 최근 텍스트 분류 및 모델링 분야에서 그 성능을 입증받은 딥러닝 알고리즘은 피싱 URL의 구문적, 의미적 특징을 각각 모델링하기에 적절하지만, 기존에 사용하는 규칙 기반 앙상블 방법으로는 문자와 단어로부터 추출되는 특징간의 비선형적인 관계를 효과적으로 융합하는데 한계가 있다. 본 논문에서는 피싱 URL의 구문적, 의미적 특징을 체계적으로 융합하기 위한 컨볼루션 신경망 기반의 퓨전 신경망을 제안하고 기계학습 방법 중 최고의 분류정확도 (0.9804)를 달성하였다. 학습 및 테스트 데이터셋으로 45,000건의 정상 URL과 15,000건의 피싱 URL을 수집하였고, 정량적 검증으로 10겹 교차검증과 ROC커브, 정성적 검증으로 오분류 케이스와 딥러닝 내부 파라미터를 시각화하여 분석하였다.
PDF KSCI

저해상도 원격탐사 데이터의 지상해상도 향상을 위한 퓨전영상 생성기법 연구 (A Study on the Technique of Fusion Image Generation for Ground Resolution Enhancement of Low Resolution Remote Sensing Data)

연상호;박희주
- 한국콘텐츠학회:학술대회논문집
- /
- 한국콘텐츠학회 2003년도 추계종합학술대회 논문집
- /
- pp.384-388
- /
- 2003
현재 고해상도의 원격탐사 영상을 이용하기 위해서는 고가의 비용을 부담해야 하고 데이터의 용량도 매우 커서 실제로 사용에는 대부분의 사람들이 매우 소극적이다. 이미 수집된 저해상도의 활발한 활용을 위해서는 값이 저렴하면서도 해상도가 좋은 분광력이나 지상해상도를 높여주어야 한다. 따라서 본 연구에서는 해상도가 각기 다른 영상을 관련 자료들을 근거로 20년 전에 저해상도인 30m의 위성영상과 5m의 고해상도 위성사진과의 합성을 통하여 저해상도에서 판독할 수 없었던 여러 종류의 지형지물을 파악할 수 있는 고해상도의 퓨젼 영상을 생성시킨 것이다.
PDF

위성영상데이터와 DEM에 의한 3차원 공간정보 생성 결과 비교 (Comparing on the Generation Results of 3 Dimension Spatial Information by DEM and Satellite Image Data)

연상호;홍일화
- 한국측량학회:학술대회논문집
- /
- 한국측량학회 2003년도 춘계학술발표회 논문집
- /
- pp.139-144
- /
- 2003
3차원 이상의 공간정보의 생성은 우리가 살아가는 현실공간을 입체적으로 조망해 볼 수 있는 가장 일반적인 요구사항이 되었고, 이를 여러 분야에서 다각적으로 활용하려는 연구가 활발히 진행되고 있다. 또한 3차원 이상의 조건을 부여하여 시공간에서 동영상으로 보여주기 위하여 3차원 지형 시뮬레이션을 제작할 수 있는 기술이 보편화 되고 있어 건설분야에서도 적극적인 도입으로 각종 공사계획 및 설계에 이용할 예정이다. 본 연구에서는 이러한 지형공간데이터의 생성을 위하여 원격탐사 데이터와 수치지형도를 이용하여 우리나라 3차원 데이터의 자성 방법과 그 결과를 비교하였으며, 그 결과 DEM에 의한 3차원 수치 기복영상과 위성영상의 합성에 의한 퓨전 영상의 3차원 적용을 통하여 향후 고해상도의 적용시 발생할 수 있는 입체영상의 문제점등을 사전확인 할 수 있었다.
PDF

감정 인지를 위한 음성 및 텍스트 데이터 퓨전: 다중 모달 딥 러닝 접근법 (Speech and Textual Data Fusion for Emotion Detection: A Multimodal Deep Learning Approach)

에드워드 카야디;송미화
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2023년도 추계학술발표대회
- /
- pp.526-527
- /
- 2023
Speech emotion recognition(SER) is one of the interesting topics in the machine learning field. By developing multi-modal speech emotion recognition system, we can get numerous benefits. This paper explain about fusing BERT as the text recognizer and CNN as the speech recognizer to built a multi-modal SER system.
https://doi.org/10.3745/PKIPS.y2023m11a.526 인용 PDF

사용자 프로파일을 이용한 적응력 있는 비디오 브라우징 서비스 (Adaptive Video Browsing Service Using User Profile)

고경철;신성윤;임정훈;이양원
- 한국멀티미디어학회:학술대회논문집
- /
- 한국멀티미디어학회 2001년도 추계학술발표논문집
- /
- pp.308-313
- /
- 2001
최근 인터넷의 급속한 성장과 빠른 보급, 정보통신 분야의 기술퓨전 현상들은 인터넷을 이용한 다양한 컨텐츠의 개발을 가속화시키고 있다. 특히 멀티미디어 스트리밍 기술은 일반 사용자들에게 동영상은 물론 풍부한 멀티미디어 데이터 전송을 통하여 능동적인 대화형 서비스를 제공할 수 있는 장점들을 가지고 있다. 본 논문에서는 사용자의 접속 횟수 및 접속시간 등의 빈도수에 따른 사용자 개인 가중치를 이용하여 사용자에게 보다 친숙하고 흥미를 유발할 수 있는 비디오 데이터 서비스를 제공하고자 하였으며, 카테고리 기반 및 키워드 기반에 따른 사용자 접근 정보를 이용하여 비디오 데이터를 분류하고 선별한 검색 서비스를 제공하고자 하였다. 또한 비디오 브라우징 시스템을 이용하여 사용자가 원하는 항목에 대한 비디오 검색을 장면 검색에서 샷 검색까지 프레임단위로 동영상을 이용하여 브라우징 할 수 있도록 하였으며, 해당 영역의 텍스트 및 관련 정보를 보다 세밀하고 정확하게 브라우징 할 수 있도록 정보를 제공하고자 하였다.
PDF

비디오 편집 시스템을 활용한 원격 비디오 브라우징 서비스 (Distance Video Browsing Service Using Video Editing System)

고경철;신성윤;임정훈;이양원
- 한국멀티미디어학회:학술대회논문집
- /
- 한국멀티미디어학회 2001년도 추계학술발표논문집
- /
- pp.303-307
- /
- 2001
최근 인터넷의 급속한 성장과 빠른 보급, 정보통신 분야의 기술퓨전 현상들은 인터넷을 이용한 다양한 콘텐츠의 개발을 가속화시키고 있다. 특히 멀티미디어 스트리밍 기술은 일반 사용자들에게 동영상은 물곤 풍부한 멀티미디어 데이터 전송을 통하여 능동적인 대화형 서비스를 제공할 수 있는 장점들을 가지고 있다. 비디오 편집시스템은 데이터의 종류에 따라서 제안된 알고리즘과 자동/수동 분류방식을 이용하여 장면전환 검출의 정확성과 효율성을 높이고자 하였으며, 사용자의 요구에 적합한 의미 정보들을 추출하고 편집하여 내용기반 데이터베이스 시스템을 구축하고자 하였다. 또한 원격에서 웹을 통한 브라우징 서비스를 통하여 데이터베이스로부터 사용자의 요구에 능동적으로 대처할 수 있는 비디오 브라우징 서비스를 제공하고자 하였다.
PDF

벡터와 신경망 모델에서 데이터 퓨전 기법을 이용한 정보검색의 효율성 향상 (Improving the Effectiveness of Information Retrieval Using Data Fusion Method in the Vector and Neural Network Model)

최성환
- 한국정보관리학회:학술대회논문집
- /
- 한국정보관리학회 2001년도 제8회 학술대회 논문집
- /
- pp.137-142
- /
- 2001
본 논문에서는 벡터모델과 신경망 모델을 이용하여 데이터 퓨전의 관점에서 다중증거로서 가중치, 문헌분리가, 엔트로피, 공기유사도를 적절히 결합하여 질의를 확장하는 방법을 제안한다. 실험결과 코사인 정규화 가중치 알고리즘, 문서길이 정규화 가중치 알고리즘과 결합하여 질의를 확장하는 것이 정규화시키지 않고 단순히 문헌빈도와 역문헌빈도의 조합을 이용한 가중치 알고리즘과 결합했을 때 보다 평균 정확률 향상이 더 높게 나타났다. 또한 다양한 공기기반 유사도를 이용하여 질의확장을 한 결과 벡터모델과 신경망 모델에서 코사인 공기유사도에 기반하여 질의확장한 경우가 다른 공기유사도에 비해 더 좋은 성능을 보였다.
PDF

모션 캡쳐 시스템을 위한 센서 퓨전 (Sensor Fusion for Motion Capture System)

정일권;박찬종;김형교;원광연
- 한국컴퓨터그래픽스학회논문지
- /
- 제6권3호
- /
- pp.9-15
- /
- 2000
본 논문에서는 모션 캡쳐 시스템을 위한 센서 퓨전 방법을 제안한다. 제안된 시스템에서는 두가지 종류의 센서가 상호보완적으로 사용된다. 연기자의 팔에 부착된 12개의 광학식마커를 보조하기 위해서 4개의 자기식 센서(마커)가 팔 상박과 손등에 부착된다. 광학식 마커는 장애물에 의하여 가려질 수 있기 때문에 광학식 센서의 정보는 불완전할 수 있으며 이 경우 자기식 센서 정보가 불연속인 광학식 센서의 정보를 이어주는데 사용된다. 센서 신호간의 관계를 모델링하기 위해 시스템 동정화 방법을 사용한다. 입 출력 데이터로부터 동적 시스템들을 구성하고 시스템 동정화 방법을 사용하여 후보 모델들로부터 가장 좋은 모델을 결정한다. 제안된 방법은 현재 간단한 신호처리 기법을 사용하고 있는데, 추후 연구에선 Wiener나 Kalman 필터를 사용한 새로운 방법을 제안하고자 한다.
PDF

검색결과 35건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)