• 제목/요약/키워드: cue multimedia

검색결과 15건 처리시간 0.023초

Angle-Based Virtual Source Location Representation for Spatial Audio Coding

  • Beack, Seung-Kwon;Seo, Jeong-Il;Moon, Han-Gil;Kang, Kyeong-Ok;Hahn, Min-Soo
    • ETRI Journal
    • /
    • 제28권2호
    • /
    • pp.219-222
    • /
    • 2006
  • Virtual source location information (VSLI) has been newly utilized as a spatial cue for compact representation of multichannel audio. This information is represented as the azimuth of the virtual source vector. The superiority of VSLI is confirmed by comparison of the spectral distances, average bit rates, and subjective assessment with a conventional cue.

  • PDF

An Efficient Representation Method for ICLD with Robustness to Spectral Distortion

  • Beack, Seung-Kwon;Seo, Jeong-Il;Kang, Kyung-Ok;Hanh, Min-Soo
    • ETRI Journal
    • /
    • 제27권3호
    • /
    • pp.330-333
    • /
    • 2005
  • The Inter-Channel Level Difference (ICLD) is a cue parameter to estimate spectral information in a binaural cue coding that has been recently in the spotlight as a multichannel audio signal compression technique. Even though the ICLD is an essential parameter, it is generally distorted by quantization. In this paper, a new modified ICLE representation method to minimize the quantization distortion is proposed by adopting a flexible determination of the reference channel and the unidirectional quantization. Our experimental result confirms that the proposed method improves the multichannel audio output quality even with the reduced bit-rate.

  • PDF

아이디어 마이닝 분야에서 문헌과 웹페이지의 아이디어 발췌에 대한 연구 (A Study on Extracting Ideas from Documents and Webpages in the Field of Idea Mining)

  • 이태영
    • 정보관리학회지
    • /
    • 제29권1호
    • /
    • pp.25-43
    • /
    • 2012
  • 일반적인 문헌/문서나 웹페이지에서 창조에 도움이 되는 아이디어와 준아이디어를 색출하기 위하여 아이디어 마이닝 기법을 적용하였다. 아이디어 마이닝과 의견 마이닝 및 논제 신호 마이닝에서 사용하는 발췌 기법으로 웹 페이지, 문헌, 문서 등에 포함되어 있는 아이디어를 발췌하였다. 발췌 기법을 (1) 결정적 단서 어구, (2) 단서 멀티미디어, (3) 문맥 신호, 및 (4) 담화 구절 방법으로 정리하여 7가지 아이디어 유형 -사상, 계획, 의견, 글, 그림, 소리, 공식 별로 실험하였다. 각 기법들의 효율성은 재현율과 정확률을 혼합한 F 측정값으로 판단하였고 (1), (3), (4) 방법은 대체로 긍정적인 평가를 얻었다. 특히, 결정적 단서 어구는 아이디어 적출에 문맥 신호는 준아이디어 추출에 효과적인 것으로 판단되었다.

A Study on Process of Creating 3D Models Using the Application of Artificial Intelligence Technology

  • Jiayuan Liang;Xinyi Shan;Jeanhun Chung
    • International Journal of Advanced Culture Technology
    • /
    • 제11권4호
    • /
    • pp.346-351
    • /
    • 2023
  • With the rapid development of Artificial Intelligence (AI) technology, there is an increasing variety of methods for creating 3D models. These include innovations such as text-only generation, 2D images to 3D models, and combining images with cue words. Each of these methods has unique advantages, opening up new possibilities in the field of 3D modeling. The purpose of this study is to explore and summarize these methods in-depth, providing researchers and practitioners with a comprehensive perspective to understand the potential value of these methods in practical applications. Through a comprehensive analysis of pure text generation, 2D images to 3D models, and images with cue words, we will reveal the advantages and disadvantages of the various methods, as well as their applicability in different scenarios. Ultimately, this study aims to provide a useful reference for the future direction of AI modeling and to promote the innovation and progress of 3D model generation technology.

그래픽 정보에서의 시각단서 적용에 따른 몰입과 재인 성향 (Tendency of Immersion and Recognition on Application of Visual Cue in Graphic Information)

  • 권효정;이화세
    • 한국멀티미디어학회논문지
    • /
    • 제15권9호
    • /
    • pp.1174-1183
    • /
    • 2012
  • 본 연구는 다변화된 정보 인터페이스 환경에서 사용자의 시각 몰입과 재인 과정에 시각단서가 어떠한 역할을 하는지와, 시각정보 구조와의 관련성을 분석하기 위하여 실시되었다. 그리하여 최신 그래픽 정보 사용자 트렌드를 고려하여 과학적인 도구와 주관적 내면 평가를 활용한 평가모형을 설계하고, 보다 체계적인 실험과정을 통하여 획득한 몰입과 재인의 사용자 경험 데이터를 분석하였다. 이를 토대로 향후 최신의 디바이스에 광범위하게 적용 가능한 그래픽 정보 사용자의 기초설계모형과 표준 평가 모형을 구축하는 데 기여할 수 있을 것이다.

증강현실을 이용한 선택적 가이드 시스템 -관람자의 관심에 따라 박물관 관람을 안내 하는 가이드 시스템 (Augmented Reality based Museum Guidance System Selective Viewing)

  • 박준석;이동현;박준
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.45-48
    • /
    • 2008
  • 박물관이나 전시관에서 많은 관람객들은 전시물에 대한 멀티미디어 정보를 얻기를 원할 뿐만 아니라 특정한 스타일, 작가, 주제별로 관람하고 싶어 한다. 박물관이나 전시관에는 증강 현실을 이용한 선택적 가이드 시스템을 이용하여 글이나 그림, 다국어 음성, 비디오와 같은 전시물에 대한 정보를 관람객에게 제공하며 관람자들의 흥미에 따른 관람 경로를 관람자에게 제공 해준다. 다음 전시물까지 가는 경로의 정보는 증강현실을 이용하거나, 멀티미디어 정보를 이용해서 관람자들에게 제공한다. 이 시스템은 외관적으로는, UMPC(Ultra Mobile PC)와 카메라, 그리고 관성 센서로 구성되어 있다. 처음 이 시스템을 시작하면, 관람자는 자신의 흥미에 맞는 전시물을 메뉴를 선택한다. 그 후, 시스템은 선택된 전시물과 연관된 관람 경로를 설정하고 다음 전시물에 대한 방향과 거리 그리고 어디로 가는지, 어느 방향에 있는지, 얼마나 멀리 있는지 그리고 전시물에 대한 시각적 실마리의 정보가 주어진다. 해당 정보를 이용하여 다음 전시물을 찾고 화면에 표시된 시각적 실마리와 카메라에서 얻어지는 전시물의 영상을 일치시키면 전시물에 대한 정보를 멀티미디어 형태로 보여준다. 사용자들의 간단한 실험을 통해서 이 시스템은 큰 전시실에도 관람자로 하여금 유익하게 관람할 수 있다.

  • PDF

가상 공간 개념 스케치를 위한 음향 반향을 포함하는 새로운 곡선 모델링 도구 (A New Curve Modeling Tool with the Acoustic Reflection for the Virtual Spatial Conceptual Sketch)

  • 최상민;김학수;채영호
    • 한국멀티미디어학회논문지
    • /
    • 제12권2호
    • /
    • pp.281-289
    • /
    • 2009
  • 본 논문에서는 공간 스케치에 일반적으로 나타나는 깊이 입력 오차를 줄이는 효과적인 공간 입력을 구현하기 위해 깊이 값 인지를 도와주는 한 면 혹은 두 면의 가상 음향 반향판을 통한 새로운 상호작용 기술을 소개하고, 다양한 실험을 통해 음향 반향판을 가진 가상의 벽이 현실적인 가상 개념 디자인을 위한 효과적인 피드백으로 사용된 것을 보여 준다. 제안된 아이디어를 이용하여 깊이 값이 일정한 평면에서는 한 면 가상 음향 반향판의 피드백을 이용하여 모델과의 일치도를 약 35% 높일 수 있었고, 기울어진 평면에서는 두면 반향을 이용하여 한 면에 비해 악 4%의 일치도를 증가시킬 수 있었으며, 곡면 꽃병에서는 약 15%의 일치도를 증가시킬 수 있었다.

  • PDF

동영상 합성 및 편집을 위한 특징점 기반 조명 및 그림자 추정 (Feature-Based Light and Shadow Estimation for Video Compositing and Editing)

  • 황규현;박상훈
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제18권1호
    • /
    • pp.1-9
    • /
    • 2012
  • 사실적 동영상 콘텐츠를 제작하기 위해 개발된 동영상 기반 모델링 / 렌더링은 컴퓨터 그래픽스와 컴퓨터 비전 분야에서 중요한 연구주제 중 하나이다. 원본 입력 동영상 클립과 3차원 그래픽 모델을 부드럽게 합성하기 위해, 실세계 장면 촬영에 사용된 광원과 카메라의 기하학적인 정보가 필수적으로 요구된다. 본 논문에서는 원본 동영상 클립에서 나타나는 물체들의 위상과 그림자들의 윤곽 정보로부터 최적의 광원에 대한 위치와 방향을 추정하는 간단한 기법에 대해 설명한다. 본 기법은 추정된 광원을 이용함으로써 삽입된 모델에 대한 렌더링뿐만 아니라 잘 어울리는 그림자의 생성을 하는 기능을 제공한다. 그림자는 경험적으로 3차원 공간에 존재하는 물체들 사이의 상대적인 위치를 보여주는 중요한 시각적 요소로 알려져 있다. 따라서 본 기법은 제안된 실시간 그림자 생성과 렌더링 알고리즘을 통해 최종적 합성된 동영상의 사실성을 높일 수 있다.

인간의 주의시각에 기반한 시각정보 선택 방법 (Visual Information Selection Mechanism Based on Human Visual Attention)

  • 최경주;박민철
    • 한국멀티미디어학회논문지
    • /
    • 제14권3호
    • /
    • pp.378-391
    • /
    • 2011
  • 본 논문에서는 입력장치로 들어오는 수많은 시각정보 중 현 시점에서 가장 유용하다고 생각되는 정보를 인간의 상향식 주의시각에 기반하여 선택하는 시각정보 선택기법에 대해 소개한다. 제안하는 시스템은 색상, 명도, 방위, 형태 등 저수준의 공간특징 외에 시간특징으로서 움직임 정보와 3차원 정보인 깊이 정보를 추가적으로 사용함으로써 기존방법에 비해 정보 선택의 정확도를 높혔다. 움직임 정보 추출 시 발생할 수 있는 노이즈를 제거하기 위해 인간의 움직임 인지에 대한 연구결과를 이용하는 새로운 접근법을 사용하였으며, 입력 영상 내 객체들이 부분적으로 겹쳐있다거나 동일한 현저도를 가지고 있을 때에도 현저한 영역을 제대로 선택해낼 수 있도록 깊이 정보를 사용하여 유의미한 영역을 선별하고 우선순위를 부여하였다. 실험결과를 통해 제안하는 방법이 기존의 방법에 비해 높은 정확도를 가짐을 확인할 수 있었다.

참여형 멀티미디어 시스템 사용자 감성평가를 위한 다차원 심물리학적 척도 체계 (Development of Multiple-modality Psychophysical Scaling System for Evaluating Subjective User Perception of the Participatory Multimedia System)

  • 나종관;박민용
    • 대한인간공학회지
    • /
    • 제23권3호
    • /
    • pp.89-99
    • /
    • 2004
  • A comprehensive psychophysical scaling system, multiple-modality magnitude estimation system (MMES) has been designed to measure subjective multidimensional human perception. Unlike paper-based magnitude estimation systems, the MMES has an additional auditory peripheral cue that varies with corresponding visual magnitude. As the simplest, purely psychological case, bimodal divided-attention conditions were simulated to establish the superiority of the MMES. Subjects were given brief presentations of pairs of simultaneous stimuli consisting of visual line-lengths and auditory white-noise levels. In the visual or auditory focused-attention conditions, only the line-lengths or the noise levels perceived should be reported respectively. On the other hand, in the divided-attention conditions, both the line-lengths and the noise levels should be reported. There were no significant differences among the different attention conditions. Human performance was better when the proportion of magnitude in stimulus pairs were identically presented. The additional auditory cues in the MMES improved the correlations between the magnitude of stimuli and MMES values in the divided-attention conditions.