• 제목/요약/키워드: voice image

검색결과 293건 처리시간 0.03초

웹드라마 <오구실>의 내레이션 기능 연구 (The Function of Voice-over Narration in the Web-drama OH Ku-sil)

  • 류재형
    • 한국콘텐츠학회논문지
    • /
    • 제18권6호
    • /
    • pp.399-413
    • /
    • 2018
  • 이 연구는 <오구실>의 스토리텔링에 있어서 내레이션이 차지하는 중요성과 그 기능들을 이해하는 데에 그 목적이 있다. 연구의 결과, 1인칭 내레이션의 경우 주관적 진술을 통해 시청자와의 친밀감을 제고하였으며 하나의 내레이션이 두 개의 시간대와 연관될 수 있음을 확인하였다. 1인칭 내레이션과 달리 3인칭 내레이션은 기존 영상 매체에서의 역할로부터 그 쓰임새를 확장시키고 있음을 발견할 수 있었다. 첫째, <오구실>의 3인칭 내레이션은 스토리 이해에 필수적인 정보를 시청자에게 전달하는 핵심적인 기능을 수행하였다. 둘째, 기존 영상 매체에서의 객관적/권위적 진술로부터 주관적/권유적 진술로 그 기능이 변화하고 있었다. 셋째, 희화적인 진술을 통해 3인칭 내레이터가 해설자로부터 가상의 등장인물로 그 역할의 범위를 넓혀가고 있음 또한 확인하였다. 이는 빠듯한 시간 제약 하에서 효율적인 스토리텔링을 추구하는 웹드라마의 매체 특성에 대한 기존 내레이션의 대응으로 볼 수 있으며, 이처럼 진일보한 내레이션은 스토리 정보와 재미의 요소를 속도감 있게 전달하면서 기피해야 할 스토리텔링 방식에서 벗어나 웹드라마라는 새로운 매체의 필수 요소이자 존재 조건으로 진화하고 있다.

스마트 거울의 제작을 통해 이루어진 공학 교육 실천 방법론에 관한 연구 (A Study on the Practical Methodology of Engineering Education through the Making of Smart Mirror)

  • 서명덕;권지영;장은영
    • 실천공학교육논문지
    • /
    • 제10권1호
    • /
    • pp.9-15
    • /
    • 2018
  • 음성 인식 기반 API를 이용하여 디지털 사이니지(Digital Signage)를 구성하고, 상용화된 다른 제품들과 차별되도록 사용자의 음성 명령으로 날씨, 지도, 운동 정보, 일정, 영상 등의 정보를 얻는 VRSM(Voice Recognition Smart Mirror)을 제안하여, 독자적인 졸업인증제의 결과물로 평가받는 과정을 통해, 공학교육의 효과적인 실천 방안을 제시한다. 전공에서 2인 1조로 3학기동안 진행되는 작품 설계 및 제작 기회를 경험하였다. 종합설계를 통해 공학적 접근 방법과 창의적 사고 기회를 경험하였으며, 그 중간 결과에 대해 본 학회의 학술대회에 참가하여 우수 학술상을 수상하였고, 기타 학회의 논문 경진대회에서도 입상의 결과를 얻었다. 이 과정을 통해 얻어진 실무 능력의 향상이 자신감과 취업 기회 획득에 유리함을 실제 취업들을 통해 입증하였다.

Speaker Detection and Recognition for a Welfare Robot

  • Sugisaka, Masanori;Fan, Xinjian
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.835-838
    • /
    • 2003
  • Computer vision and natural-language dialogue play an important role in friendly human-machine interfaces for service robots. In this paper we describe an integrated face detection and face recognition system for a welfare robot, which has also been combined with the robot's speech interface. Our approach to face detection is to combine neural network (NN) and genetic algorithm (GA): ANN serves as a face filter while GA is used to search the image efficiently. When the face is detected, embedded Hidden Markov Model (EMM) is used to determine its identity. A real-time system has been created by combining the face detection and recognition techniques. When motivated by the speaker's voice commands, it takes an image from the camera, finds the face inside the image and recognizes it. Experiments on an indoor environment with complex backgrounds showed that a recognition rate of more than 88% can be achieved.

  • PDF

영상정보 통합형 전기설비 감시시스템 개발 연구 (A study on development of multimedia SCADA system for electric facility)

  • 이원태;이재조;정영경;김관호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1998년도 하계학술대회 논문집 G
    • /
    • pp.2445-2447
    • /
    • 1998
  • For increasing the quality of SCADA system, the application of image information is demanded from typical SCADA system based on data information. Until now, the remote control and monitoring systems combine data information but now gradually have trends to combine voice, data and image information. So multimedia technology is applied to realize new SCADA system. Depends on these requires, we apply new concepts of communication network and multimedia technology to the SCADA system for electric facility. In this paper, we aim at developing multi media supervisory control and data acquisition system based on data and image information, which used electric power system and security system.

  • PDF

몰입감 향상을 위한 VR 영상 콘텐츠의 시청각 유도와 구성요소에 관한 연구 (A Study on Visual and Auditory Inducement of VR Image Contents and the Inducement Components of for Immersion Improvement)

  • 이랑구;정진헌
    • 디지털융복합연구
    • /
    • 제14권11호
    • /
    • pp.495-500
    • /
    • 2016
  • 2016년을 기점으로 VR 시장이 급속도로 성장하고 있으며, 현재 VR 시장에서 가장 중요한 이슈로 떠오르고 있는 것은 VR 콘텐츠이다. 사용자의 몰입감과 상호작용을 최대한 충족시킬 수 있는 제작 기법과 좀 더 다양한 VR 콘텐츠가 필요하기 때문이다. 본 연구는 VR 콘텐츠 중 VR 영상 콘텐츠를 중심으로 몰입감을 지속할 수 있게 하고 향상할 수 있는 시청각 유도의 구성요소들을 국내외 사례 분석을 통해 시청각 유도의 올바른 방향성을 찾아보았다. 그 결과 시청각 유도의 시각적 청각적 구성요소로는 촬영, 편집, 조명, 스티칭, 그래픽, 이펙트, 성우 내레이션, 더빙, 등장인물의 음성, 배경음악 및 효과음 등이 있었고, 다시 기술적 내용적 요소로는 촬영기법, 편집기법, 조명, 스티칭, 그래픽과 이펙트, 사운드 및 효과음, 미장센 중심의 연극적 연출, 등장인물의 대사 및 내레이션, 등장인물과 오브제의 움직임 등으로 나타났으며, 더불어 향후 VR 영상 콘텐츠는 몰입감을 향상할 수 있는 시청각적 구성요소들과 함께 기술적 내용적인 구성요소들이 필요하며 지속적인 연구가 병행되어야 할 것이다.

3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구 (A study on the lip shape recognition algorithm using 3-D Model)

  • 배철수
    • 한국정보통신학회논문지
    • /
    • 제3권1호
    • /
    • pp.59-68
    • /
    • 1999
  • 최근 통신 시스템의 연구와 발전 방향은 목소리의 음성 정보와 말하는 얼굴 영상의 화상 정보를 함께 적용하므로서 음성 정보만을 제공하는 경우보다 높은 인식율을 제공한다. 따라서 본 연구는 청각장애자들의 언어 대체수단 중 하나인 구화(speechreading)에서 가장 시각적 변별력이 높은 입모양 인식을 일반 퍼스널 컴퓨터상에서 구현하고자 한다. 본 논문은 기존의 방법과 달리 말하는 영상 시퀀스에서 입모양 인식을 행하기 위해 3차원 모델을 사용하여 입의 벌어진 정도, 턱의 움직임, 입술의 돌출과 같은 3차원 특징 정보를 제공하였다. 이와 같은 특징 정보를 얻기 위해 3차원 형상 모델을 입력 동영상에 정합시키고 정합된 3차원 형상 모델에서 각 특징점의 변화량을 인식파라미터로 사용하였다. 그리고, 인식단위로 동영상을 분리하는 방법은 3차원 특징점 변화량에서 얻어지는 강도의 기울기에 의하여 이루어지고, 인식은 각각의 3차원 특징벡터를 이산 HMM 인식기의 인식 파라메타로 사용하였다. 본 논문에서는 한국어 10개 모음에 대하여 인식실험하여 비교적 높은 인식율을 얻을 수 있는 것으로 보아 본 연구에서 사용한 특징 벡터를 시간적 변별 요소로서 사용할 수 있음을 제시하였다.

  • PDF

ANALYSIS OF DYNAMIC PRIORITY QUEUE WITH APPLICATIONS IN ATM NETWORKS

  • Choi, Doo-Il;Lee, Yu-Tae
    • Journal of applied mathematics & informatics
    • /
    • 제7권2호
    • /
    • pp.617-627
    • /
    • 2000
  • ATM networks support diverse traffic types with different service requirement such as data, voice, video and image. This paper analyzes a dynamic priority queue to satisfy Quality of Service (QoS) requirements of traffic. to consider the burstiness of traffic, we assume the arrival to be a Markovian arrival process(MAP) . Performance measures such as loss and delay are derived, Finally, some numerical results show the performance of the system.

Recognition of the Korean alphabet Using Neural Oscillator Phase model Synchronization

  • Kwon, Yong-Bum;Lee, Jun-Tak
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.315-317
    • /
    • 2003
  • Neural oscillator is applied in oscillatory systems (Analysis of image information, Voice recognition. Etc...). If we apply established EBPA(Error back Propagation Algorithm) to oscillatory system, we are difficult to presume complicated input's patterns. Therefore, it requires more data at training, and approximation of convergent speed is difficult. In this paper, I studied the neural oscillator as synchronized states with appropriate phase relation between neurons and recognized the Korean alphabet using Neural Oscillator Phase model Synchronization.

  • PDF

Control of IEEE1394 digital home appliances using AV/C Command Set

  • Kim, Il-Jung;Park, Jong-An
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.98.2-98
    • /
    • 2001
  • It is necessary to have enough transmission capacity for advanced internet techniques and various digital home appliances networking. Home appliances interface IEEE1394 technique has much wealthy transmission skill. IEEE1394 is using home appliances through various information form image and voice change data real time print out. In this paper, AVC CTS technology and IEEE1394 technology are introduced. Digital Video Camera includes compression format using DV. System composition control is consisted of protocols like IEC-61883 and AV/C command set standard.

  • PDF

정신지체인을 위한 Multimedia 비언어성직업적성검사 시스템 개발 (Development of Reading -Free Vocational Interest Inventory for Mental Retardation)

  • 김남행;심임섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.688-690
    • /
    • 1998
  • 직업 선택의 과정에 있어 능력, 적성만큼 중요시 해야 할 것은 그 직업에 대해 흥미도이다. 특히 장애인들의 경우 직업을 준비하는 단계에서부터 어느 영역에 직업적 흥미가 있는가를 파악해야 하는 일은 중요하다. Text, Audio/Voice, Image등 멀티미디어 data를 이용, 흥미와 주의 집중을 높혀 직업적 흥미영역에 대한 정확한 data를 얻을 수 있는 시스템 개발이 필요하다.

  • PDF