• 제목/요약/키워드: visual-audio

검색결과 424건 처리시간 0.039초

서비스 통합형 ATM 멀티미디어 통신단말 (Multifunctional communication terminal on ATM networ)

  • 황대환;이종형;박영덕;조규섭
    • 한국통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.873-892
    • /
    • 1998
  • 본 논문은 광대역 ISDN에서 사용될 수 있는 멸티미디어 통신단말의 구조를 제안하였다. 제안한 구조는 ITU-T, Digital Audio-Visual Council(DAVIC), A TM Forum 등의 국제, 사설 표준기구에서 권고하고 있는 멀티미디어단말 및 서비스를 분석한 결과이며, 기존 통신단말과의 연동을 보장하며, 현재 및 미래의 멀티미디어 응용서비스에 유연하게 대처할 수 있는 구조를 갖도록 하였다. 제안한 구조에 따라 설계된 서비스 통합형 멀티미디어 통선단말은 범용 PC에 탑재되는 멸티미디어 처리보드와 ATM 접속보드로 나누어 구현하였다. 구현된 서비스 통합형 멸티미디어 통신단말은 검색, 분배형 통신서비스와 대화형 통신서비스를 동시에 제공하는 것이 가능하며, 이에 따르는 서비스 별의 기능시험을 수행하였다.

  • PDF

중등학교 환경교육에서의 환경관련 TV 프로그램 활용 방안에 관한 연구 (A Study on Utilization Plans of TV Programs Related to Environmental Issues as an Environmental Education Material in)

  • 이무춘;김경미
    • 한국환경교육학회지:환경교육
    • /
    • 제19권3호
    • /
    • pp.165-182
    • /
    • 2006
  • Demands for developing diverse teaching methods and materials which can lead to active participation of students in classes have been emerged for environmental education in secondary schools. In order for more effective environmental education, a variety of programs in the mass media including public broadcasting have been used. Advantages associated with the broadcasted TV programs include compensation of temporal and spatial limits embedded with the printing media, improvement of studying efficiency, and provision of diverse studying opportunities, leading to the promotion of the awareness of environmental issues. In this study, 256 environmental issues related TV programs being aired via major public broadcasting companies such as EBS, KBS, MBC and SBS between years of 2003 and 2004 were analyzed. During the present research, selection of the programs was made based on the weight of the environmental issues in independent programs being aired for at least 10 minutes. A survey as a primary means was carried out for the utilization of the audio-visual educational materials in order to provide a new method employing the TV programs which were related to the environmental issues during the instruction in secondary schools.

  • PDF

Emotion Recognition of Low Resource (Sindhi) Language Using Machine Learning

  • Ahmed, Tanveer;Memon, Sajjad Ali;Hussain, Saqib;Tanwani, Amer;Sadat, Ahmed
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.369-376
    • /
    • 2021
  • One of the most active areas of research in the field of affective computing and signal processing is emotion recognition. This paper proposes emotion recognition of low-resource (Sindhi) language. This work's uniqueness is that it examines the emotions of languages for which there is currently no publicly accessible dataset. The proposed effort has provided a dataset named MAVDESS (Mehran Audio-Visual Dataset Mehran Audio-Visual Database of Emotional Speech in Sindhi) for the academic community of a significant Sindhi language that is mainly spoken in Pakistan; however, no generic data for such languages is accessible in machine learning except few. Furthermore, the analysis of various emotions of Sindhi language in MAVDESS has been carried out to annotate the emotions using line features such as pitch, volume, and base, as well as toolkits such as OpenSmile, Scikit-Learn, and some important classification schemes such as LR, SVC, DT, and KNN, which will be further classified and computed to the machine via Python language for training a machine. Meanwhile, the dataset can be accessed in future via https://doi.org/10.5281/zenodo.5213073.

스펙트럼 성형기법을 이용한 멀티미디어 콘텐츠의 명료도 향상 (Intelligibility Enhancement of Multimedia Contents Using Spectral Shaping)

  • 지유나;박영철;황영수
    • 전자공학회논문지
    • /
    • 제53권11호
    • /
    • pp.82-88
    • /
    • 2016
  • 본 논문에서는 스펙트럼 성형기법을 이용한 멀티미디어 콘텐츠 명료도 향상 알고리즘을 제안한다. 영화, 동영상과 같은 오디오-비주얼 미디어 콘텐츠에서 다이얼로그는 영상의 내용을 이해하기 위한 중요한 요소이다. 하지만 종종 영상내의 효과음, 배경음악 등과 같이 함께 믹싱 된 오디오 성분에 의해 중요한 정보를 지닌 다이얼로그의 명료도가 떨어지는 문제점이 제기되어왔다. 뿐만 아니라 멀티미디어 콘텐츠의 이용 환경이 다양해지면서 청자의 주변 환경 또한 오디오 볼륨에 영향을 미치는 요소가 된다. 본 논문에서는 이러한 문제점을 해결하기 위해 영상의 중요 단서를 담고 있는 사운드트랙의 음성 성분 명료도를 높이고자 한다. 제안된 알고리즘은 먼저 영상의 스테레오 오디오 신호에서 음성 존재 확률(Speech Presence Probability)을 이용한 소프트 마스커를 통해 다이얼로그 성분을 검출한다. 추출된 다이얼로그 성분은 스펙트럼 성형 기법을 적용하여 명료도에 중요한 영향을 미치는 고주파대역의 성분을 증폭시키는 등 음성 신호 스펙트럼의 에너지를 재분배하여 신호의 명료도를 향상 시켰다. 마지막으로 크기 정규화 과정을 통해 프로세스 전과 후의 전체 오디오의 파워를 동일하게 유지함으로써 증폭으로 인한 스피커의 오디오 포화(saturation)를 방지하였다. 실험을 통해 본 알고리즘이 동일한 오디오 볼륨에서 영상의 명료도를 향상시킴을 확인 할 수 있었다.

오디오와 이미지의 다중 시구간 정보와 GAN을 이용한 영상의 하이라이트 예측 알고리즘 (Video Highlight Prediction Using GAN and Multiple Time-Interval Information of Audio and Image)

  • 이한솔;이계민
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.143-150
    • /
    • 2020
  • 최근 다양한 매체를 통해 폭발적인 양의 콘텐츠가 업로드 되고 있으며 그 가운데 게임과 스포츠 영상은 상당한 비율을 차지한다. 방송사에서는 시청자 편의를 위해 경기 영상 중 흥미를 끄는 장면을 모아 하이라이트 영상을 만들어 제공한다. 그러나 이는 시간과 비용이 많이 소요되는 문제가 있다. 본 논문에서는 게임과 스포츠 경기에서 자동으로 하이라이트를 예측하는 모델을 제안한다. 기존의 방법들이 이미지 정보만을 주로 이용하는데 반해 우리는 오디오와 이미지 정보를 함께 사용하며, 영상의 단기적 전후관계와 중장기적 흐름을 동시에 파악하는 방법을 제시한다. 또한 더 좋은 특징벡터를 찾아내기 위해 GAN을 결합한 모델을 설명한다. 제안하는 모델들은 e스포츠 경기 영상과 야구 경기 영상을 이용하여 평가한다.

이러닝 콘텐츠에서 비음성 사운드에 대한 학습자 인식 분석 (Learners' Perceptions toward Non-speech Sounds Designed in e-Learning Contents)

  • 김태현;나일주
    • 한국콘텐츠학회논문지
    • /
    • 제10권7호
    • /
    • pp.470-480
    • /
    • 2010
  • 이러닝 콘텐츠에는 시각자료와 함께 다양한 청각자료를 포함하고 있음에도 불구하고 그동안 학습자료에서 청각정보 설계에 대한 연구는 극히 제한적으로 이루어져 왔다. 청각정보의 한 유형인 비음성 사운드가 학습자들에게 피드백 제공 및 행위유도를 즉시적으로 할 수 있다는 장점을 감안한다면 비음성 사운드의 체계적 설계가 요구된다. 이에 본 논문은 다차원척도법을 활용하여 학습자들이 이러닝 콘텐츠에 설계된 비음성 사운드를 어떠한 방식으로 인식하고 있는지를 경험적으로 탐색하는 것을 목적으로 수행되었다. 한국교육학술정보원에서 제공하는 이러닝 콘텐츠에 설계된 비음성 사운드 중 대표성이 있는 11개의 비음성 사운드가 선정되었다. A 대학교 3학년 학생 66명을 대상으로 11개의 비음성 사운드들 간의 유사 정도에 대해 응답하도록 하였고 그 결과가 다차원 공간에 표현되었다. 연구결과, 학습자들은 비음성 사운드의 길이와 비음성 사운드가 전달하는 긍정적 혹은 부정적 분위기에 따라 비음성 사운드를 구분하여 인식하고 있는 것으로 나타났다.

USB 다중 신호 전송 시스템 (The USB Multi-signal Transmission System)

  • 채정식;김아용;정회경
    • 한국정보통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.1330-1335
    • /
    • 2013
  • 최근 컴퓨터에서 DVI(Digital Visual Interface), 오디오, 비디오, USB(Universal Serial Bus), 랜(LAN) 등의 다양한 신호를 동시에 전송할 필요성이 요구됨에 따라 케이블이 복잡해지고 확장성 등의 문제점이 제기 되고 있다. 이에, 본 논문에서는 하나의 USB 케이블을 이용하여 컴퓨터의 영상, 음성, USB, 랜 등의 신호를 분배 할 수 있는 하나의 USB 다중 신호 전송 시스템을 설계 및 구현하였다. 따라서, USB 다중 신호 전송을 위해 단일 USB 신호를 DVI, 오디오, 다중 USB, 랜으로 변환하는 변환기 모듈들을 구현하였다. 이는 USB 방식으로 DVI 포트를 지원하며, 최대 1920 * 1080 해상도를 지원한다. USB 다중 신호 전송 시스템은 하나의 케이블로 다수의 신호를 전송하여 각종 케이블의 설치 비용이 절감되고, 화면 복제 기능을 이용하여 학교 및 학원 등에서 강의 편의 제공 및 컴퓨터 주변 포트의 확장성을 제공할 것이다.

Development of a Real-time Vehicle Driving Simulator

  • Kim, Hyun-Ju;Park, Min-Kyu;Lee, Min-Cheoul;You, Wan-Suk
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.51.2-51
    • /
    • 2001
  • A vehicle driving simulator is a virtual reality device which makes a human being feel as if the one drives a vehicle actually. The driving simulator is effectively used for studying interaction of a driver-vehicle and developing the vehicle system of new concepts. The driving simulator consists of a motion platform, a motion controller, a visual and audio system, a vehicle dynamic analysis system, a vehicle operation system and etc. The vehicle dynamic analysis system supervises overall operation of the simulator and also simulates dynamic motion of a multi-body vehicle model in real-time. In this paper, the main procedures to develop the driving simulator are classified by 4 parts. First, a vehicle motion platform and a motion controller, which generates realistic motion using a six degree of freedom Stewart platform driven hydraulically. Secondly, a visual system generates high fidelity visual scenes which are displayed on a screen ...

  • PDF

지상파 DMB 컨텐츠의 MPEG-4 BIFS 최적화 기법 (MPEG-4 BIFS Optimization for Interactive T-DMB Content)

  • 차경애
    • 한국산업정보학회논문지
    • /
    • 제12권1호
    • /
    • pp.54-60
    • /
    • 2007
  • The Digital Multimedia Broadcasting(DMB) system is developed to offer high quality multimedia content to the mobile environment. The system adopts the MPEG-4 standard for the main video, audio and other media format. For providing interactive contents, it also adopts the MPEG-4 scene description that refers to the spatio-temporal specifications and behaviors of individual objects. With more interactive contents, the scene description also needs higher bitrate. However, the bandwidth for allocating meta data, such as scene description is restrictive in the mobile environment. On one hand, the DMB terminal renders each media stream according to the scene description. Thus the binary format for scene(BIFS) stream corresponding to the scene description should be decoded and parsed in advance when presenting media data. With this reasoning, the transmission delay of the BIFS stream would cause the delay in transmitting whole audio-visual scene presentations, although the audio or video streams are encoded in very low bitrate. This paper presents the effective optimization technique in adapting the BIFS stream into the expected bitrate without any waste in bandwidth and avoiding transmission delays inthe initial scene description for interactive DMB content.

  • PDF

다중모드 특징을 사용한 뉴스 동영상의 앵커 장면 검출 기법 (Multi-modal Detection of Anchor Shot in News Video)

  • 유성열;강동욱;김기두;정경훈
    • 방송공학회논문지
    • /
    • 제12권4호
    • /
    • pp.311-320
    • /
    • 2007
  • 본 논문에서는 뉴스 동영상 정보의 생성을 위해 뉴스 단위의 기준이 되는 앵커 장면을 효과적으로 검출하는 기법을 제안한다. 우선 뉴스 동영상의 오디오 및 비디오 구성 요소에 대한 관찰을 통하여 앵커 장면 검출에 적합한 기본적인 특징들을 선택하였다. 제안 알고리듬에서는 색인의 정확도를 높이기 위해 몇몇 오디오 특징과 함께 비디오 특징으로서 움직임 특징을 함께 이용하였으며, 전체적인 구조는 '오디오 정지 구간 검출', '오디오 클러스터 분류', 그리고 '움직임 활동도와의 매칭'의 3단계로 구성된다. MPEG-2 방식으로 부호화된 뉴스 동영상에 대한 실험을 통해 제안 알고리듬의 성능이 만족스러움을 확인하였다.