• 제목/요약/키워드: visual-audio

검색결과 424건 처리시간 0.022초

MPEG-4 Shape Decoder의 적합성 검사 (Conformance Test for MPEG-4 Shape Decoders)

  • 황혜전;박인수;박수현;이병욱
    • 한국통신학회논문지
    • /
    • 제25권6B호
    • /
    • pp.1060-1067
    • /
    • 2000
  • MPEG-4 영상압축 방식은 객체지향적이다. 기존의 H.261, MPEG-1, MPEG-2에서 화면 전체를 부호화 해주는 것과 달리 MPEG-4에서는 한 화면을 물체, 배경 등 여러 객체들로 나누어 각각의 객체를 따로 부호화한다. 이렇게 전송된 객체들은 수신 단말기에서 다시 합성하여 완성된 화면으로 보여준다. MPEG-4의 형상 부호화는 화면에서 visual 객체에 해당하는 부분만을 부호화 해주는 부분이다. 본 논문에서는 MPEG-4 디코더가 형상 복호화의 표준 규격을 따르는지를 시험하는 방법을 제안한다. 본 논문은 BAB type을 결정하는 mode 복호화의 모든 경우와 Context-based Arithmetic 복호화의 Context computation에 대한 모든 경우에 대해 확인하는 방법을 제안하였다.

  • PDF

전력선 통신 기반 HD급 미디어 전송 시스템 설계 및 성능 분석 (System Design of High-Definition Media Transceiver based on Power Line Communication and Its Performance Analysis)

  • 김지형;김관웅;김용갑
    • 전기학회논문지
    • /
    • 제59권1호
    • /
    • pp.192-196
    • /
    • 2010
  • Due to a development of a modem technology as Power Line Communication(PLC) over 200 Mbps, the high-speed multi-media data trasmission could be currently possible. The strength of the PLC has no more additional wiring work. PLC has also possible to high quality data transmission with currently electrical cable. It has a various strong point campare with existing wire and wireless communication technologies. In This paper we develop a high quality media transmitter-receiver based on merging the HomePlug AV, which is 200 Mbps class PLC technology and HDMI Interface technology. The video function was used for the VEDEO TEST GENERATOR in order to a property valuation. Smart Live 6 software were used for the assessment of audio property. As the result of measurement of the HD class images by capturing from the receiver of the PLC, the quality of images couldn't be confirm any deterioration, which has compared with original reflections. In case of audio part as the result of confirmation of the Phase, Magnitude, it has been confirmed that over 90% of nomal transmition and receiving of acoustic signal. It can be possible to have HD class Media service through the PLC.

지방자치단체 광고효용성에 대한 탐색적 연구: KTX 광고노출 환경을 중심으로 (Pilot Study for Analysis of TV Ads of Local Governments)

  • 송승열;임상국;김정규
    • 한국멀티미디어학회논문지
    • /
    • 제23권1호
    • /
    • pp.43-49
    • /
    • 2020
  • Along side with the rapid growth of local governments' advertising bills, there are few studies focused on the effectiveness of these ads. Especially one of the media being used by the local governments is the Korea Express Train (KTX), where they advertise in the train coaches' KTX video monitor. Unfortunately the ads in KTX are exposed without audio mostly. The current study, therefore, probed on the effectiveness of these ads. This study utilized transportation theory and content analysis methodology to give insight to its discourse. We established two analysis units (camera and subtitles), and then analyzed 107 local government ads. From the camera analysis, it is observed that local governments' festival and tour promotion ads more often employ dynamic angles such as drone shot and long shot. Also, from subtitles usage analysis, it is observed that many of the ads make use of large size titles and subtitles which could prevent viewers seeing visual shots. In the special case audio-less KTX ads, this study recommends emphasis on subtitles which will enhance the ad effectiveness of the ad messages.

모바일 디바이스의 인터페이스 아이덴티티 개선 및 사용성 증대방안 (How of Improve an identity of mobile device interface and usability?)

  • 송상곤;김영선;추희정;강태영;홍노경
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 2부
    • /
    • pp.140-145
    • /
    • 2008
  • 모바일 디바이스는 한정된 디스플레이 공간과 인터렉션의 제한적인 요소를 가지고 있다. 모바일 디바이스의 중요한 이슈 중 하나는 이러한 상황에서 어떻게 제조사의 Identity를 표현할 수 있느냐 하는 것이다. 그것은 사용자에게 일관성이라는 측면에서 매력적이기 때문이다. 그러므로 우리는 GUI, IA, AUI 요소에 해당하는 사용자 경험요소들로부터 추출하고 통합하는 작업들을 진행하였다. 이 연구는 각 부서의 실무담당자들이 모여 전사 TF로 진행되었다. 이 연구에서는 대상제품의 다양한 특성을 반영하면서 일관성을 유지하기 위해 여러 방법들과 프로세스들을 거치면서 시도되었다. 이러한 적용 가능한 결과들은 진행되는 본문에서와 같은 논의과정을 거쳐 얻어진 젓이다.

  • PDF

L2 Proficiency Effect on the Acoustic Cue-Weighting Pattern by Korean L2 Learners of English: Production and Perception of English Stops

  • Kong, Eun Jong;Yoon, In Hee
    • 말소리와 음성과학
    • /
    • 제5권4호
    • /
    • pp.81-90
    • /
    • 2013
  • This study explored how Korean L2 learners of English utilize multiple acoustic cues (VOT and F0) in perceiving and producing the English alveolar stop with a voicing contrast. Thirty-four 18-year-old high-school students participated in the study. Their English proficiency level was classified as either 'high' (HEP) or 'low' (LEP) according to high-school English level standardization. Thirty different synthesized syllables were presented in audio stimuli by combining a 6-step VOTs and a 5-step F0s. The listeners judged how close the audio stimulus was to /t/ or /d/ in L2 using a visual analogue scale. The L2 /d/ and /t/ productions collected from the 22 learners (12 HEP, 10 LEP) were acoustically analyzed by measuring VOT and F0 at the vowel onset. Results showed that LEP listeners attended to the F0 in the stimuli more sensitively than HEP listeners, suggesting that HEP listeners could inhibit less important acoustic dimensions better than LEP listeners in their L2 perception. The L2 production patterns also exhibited a group-difference between HEP and LEP in that HEP speakers utilized their VOT dimension (primary cue in L2) more effectively than LEP speakers. Taken together, the study showed that the relative cue-weighting strategies in L2 perception and production are closely related to the learner's L2 proficiency level in that more proficient learners had a better control of inhibiting and enhancing the relevant acoustic parameters.

미소지진(微小地震) 장기관측(長期觀測)을 위한 지진기록계(地震記錄計)의 개발(開發) (Development of Seismic Recorder for Long-term Observation of Microearthquakes)

  • 김성균;조규장;정부흥;문창배;신인철;성낙훈
    • 자원환경지질
    • /
    • 제21권2호
    • /
    • pp.185-191
    • /
    • 1988
  • A two channel seismic recorder suitable for long-term observation of microearthquakes is developed. The direct analogue recording on cassette tape is adopted in the recorder whose circuits of amplifier and mortor units of an audio cassette recorder are modified. The recorder provides contineous record of 10 days with DC 12V battery (100AH) and with standard cassette tape of 60 minute use. The binary coded time signals of date, hour, and minute are generated once a minute by the timing system and absolute time input using radio to measure the time drift is also possible. For the seismic signal processing, the analogue signals from audio cassette player pass A/D converter and digitized data are stored in personal computer. Then visual records can be obtained using computer graphic mode. Basic programs "ADCONVO" and "DRAWO" to accomplish A/D conversions, the creation of data files and visualization of signals were written. Some sample signals reproduced from the recorded tape are presented.

  • PDF

웹을 기반으로 한 MPEG-4 동영상 E-mail 시스템의 개발 (A Study on the Development of Web-based Full Motion Video E-mail System using MPEG-4)

  • 고재승
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권3호
    • /
    • pp.283-294
    • /
    • 2002
  • 인터넷이 상용화된 요즈음, 웹을 기반으로 한 동영상 e-mail 시스템이 본격적으로 필요한 시기이다. 그러나 비디오 데이터는 너무 용량이 커서 상당한 압축을 하지 않는다면 인터넷 상에서의 전송이 매우 어렵다. 본 연구에서는 국제 표준으로 자리잡은 MPEG-4 기술을 이용하여 동영상 메일을 구현하면서, 기존의 방법으로는 해결하기 힘든 동영상의 실시간 압축, 웹 상에서의 자유로운 접근을 가능하게 하는 액티브 엑스 제어(Active X Control) 기술 등을 동영상 및 오디오 압축 기술과 함께 개발하여 적용하였다. 이 기술을 이용하면 누구나 자유롭게 동영상 메일을 전세계 어디로나 보내는 것이 가능하다. 한편 이 기술의 주요한 응용분야는 멀티미디어 메일링 서비스, 동영상 광고, 원격 교육 및 진료, 쇼핑 물 구축 등이다.

  • PDF

가상현실 환경에서 기하학적 음향 기술 기반의 3차원 사운드 모델링 기술에 관한 연구 (A Study of 3D Sound Modeling based on Geometric Acoustics Techniques for Virtual Reality)

  • 김정길
    • 한국위성정보통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.102-106
    • /
    • 2016
  • 스마트 폰의 대중화와 고속 무선 통신 기술의 도움으로 고품질 멀티미디어 콘텐츠가 모바일 기기에서 보편화되고 있다. 특히, Oculus Rift의 출시는 소비자 시장에서 가상현실 기술의 새로운 시대를 열고 있다. 또한 컴퓨터 게임을 보다 사실적 구동을 위한 3D 오디오 기술은 곧 차세대 모바일 기기에 적용될 것이며, 시각적인 것보다 더 광범위한 사실적 경험을 제공 할 것으로 예상된다. 따라서 이 논문에서는 가상현실 기반의 응용 프로그램에서 3D 사운드 모델링을 위한 개념, 알고리즘 및 시스템에 대하여 기술하고자 하며 특히 기하학적 음향 기술 기반의 알고리즘에 초점을 맞추었다. 이를 위하여 먼저, 사운드 전파를 모델링하기 위해 물리적 기반의 기하학적 알고리즘과 다중 채널 기술 중심으로 오디오 렌더링을 위한 중요한 설계 원칙 소개와 오디오 렌더링 파이프 라인을 씬 그래프 기반의 가상 현실 시스템 및 최신 하드웨어 구조 소개를 포함한다.

대화 영상 생성을 위한 한국어 감정음성 및 얼굴 표정 데이터베이스 (Korean Emotional Speech and Facial Expression Database for Emotional Audio-Visual Speech Generation)

  • 백지영;김세라;이석필
    • 인터넷정보학회논문지
    • /
    • 제23권2호
    • /
    • pp.71-77
    • /
    • 2022
  • 본 연구에서는 음성 합성 모델을 감정에 따라 음성을 합성하는 모델로 확장하고 감정에 따른 얼굴 표정을 생성하기 위한 데이터 베이스를 수집한다. 데이터베이스는 남성과 여성의 데이터가 구분되며 감정이 담긴 발화와 얼굴 표정으로 구성되어 있다. 성별이 다른 2명의 전문 연기자가 한국어로 문장을 발음한다. 각 문장은 anger, happiness, neutrality, sadness의 4가지 감정으로 구분된다. 각 연기자들은 한 가지의 감정 당 약 3300개의 문장을 연기한다. 이를 촬영하여 수집한 전체 26468개의 문장은 중복되지 않으며 해당하는 감정과 유사한 내용을 담고 있다. 양질의 데이터베이스를 구축하는 것이 향후 연구의 성능에 중요한 역할을 하므로 데이터베이스를 감정의 범주, 강도, 진정성의 3가지 항목에 대해 평가한다. 데이터의 종류에 따른 정확도를 알아보기 위해 구축된 데이터베이스를 음성-영상 데이터, 음성 데이터, 영상 데이터로 나누어 평가를 진행하고 비교한다.

멀티모달 정보를 이용한 응급상황 인식 시스템의 설계 및 구현 (Design and Implementation of Emergency Recognition System based on Multimodal Information)

  • 김영운;강선경;소인미;권대규;이상설;이용주;정성태
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권2호
    • /
    • pp.181-190
    • /
    • 2009
  • 본 논문은 비주얼 정보, 오디오 정보, 중력 센서 정보에 기반한 멀티 모달 응급상황 인식 시스템을 제안한다. 제안된 시스템은 비디오 처리 모듈, 오디오 처리 모듈, 중력 센서 처리 모듈, 멀티모달 통합 모듈로 구성된다. 비디오 처리 모듈과 오디오 처리 모듈 각각은 이동, 정지 기절 등의 동작을 인식하여 멀티모달 통합 모듈에 전달한다. 멀티 모달 통합 모듈은 전달된 정보로부터 응급 상황을 인식하고 오디오 채널을 통하여 사용자에게 질문을 하고 대답을 인식함으로써 응급 상황을 재확인한다. 실험결과 영상에서는 91.5%, 착용형 중력센서는 94% 인식률을 보였으나 이들을 통합하면 응급상황을 100% 인식하는 결과를 보였다.