• 제목/요약/키워드: 영상 표현

검색결과 2,313건 처리시간 0.032초

음악제작을 위한 음성합성엔진의 활용과 기술 (Application and Technology of Voice Synthesis Engine for Music Production)

  • 박병규
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권2호
    • /
    • pp.235-242
    • /
    • 2010
  • 음악제작에 쓰이는 음성합성엔진은 악기 소리와 음색의 합성에 머물던 과거의 신디사이저와는 달리, 인간의 목소리를 각 음소에 따라 샘플화하여 탑재함과 동시에 각 음소의 연결을 주파수 영역 내에서 자연스럽게 처리함으로써 실제 사람이 노래하는 것과 같은 수준까지 도달하게 되었다. 사용자들은 이러한 음성합성엔진을 음악제작에 국한하여 쓰지 않고 캐릭터를 활용한 콘서트, 영상제작, 음반, 모바일 서비스 등 2차 창작물로 새로운 음악의 형태를 창조하며 문화적 패러다임을 바꾸어 나가고 있다. 현재 음성합성엔진 기술은 악보 편집기를 통하여 사용자가 원하는 음과 가사, 그리고 음악적 표현 파라미터를 입력한 뒤, 실제 가성 샘플을 데이터베이스에서 가져와 합성엔진에서 발음들을 조합, 연결하여 노래하는 것을 가능하게 한다. 이러한 컴퓨터음악 기술의 발전으로 인해 파생된 새로운 음악 형태들은 문화적으로 큰 반향을 불러일으키고 있다. 이에 따라 본 논문은 구체적 활용 사례를 살펴보고 합성기술을 탐색함으로써, 사용자들이 음성합성엔진을 이해하고 습득하는 데 기여함과 동시에 그들의 다양한 음악제작에 도움이 되고자 한다.

원격 촉감 커뮤니케이션을 위한 시스템 프로토타입 (A System Prototype for Remote Haptic Communication)

  • 차종은;이준훈;류제하
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.238-243
    • /
    • 2006
  • 최근에는 통신기술과 인터넷의 발달로 원격의 사람과 전화, 이메일, 메신저 또는 화상회의 시스템 등을 통해서 쉽게 의사소통 할 수 있다. 이 시스템들은 주로 음성, 그림, 동영상 또는 문자 기반의 시청각 정보를 서로 주고 받으며 자신의 의사 및 감정을 전달하는 통로를 제공한다. 그러나 일상 생활에서 시청각 정보 외에 촉감 정보도 서로 의사소통 하는데 중요한 역할을 한다. 악수, 포옹 등의 촉감 상호작용은 사람 사이에서 친근감을 표시하는데 가장 직접적인 방법으로 자신의 감정을 전달하거나 느낌을 표현하는데 사용된다. 그럼에도 불구하고 촉감 상호작용을 가능케 하는 의사소통 시스템의 연구는 아직 폭넓게 진행되고 있지 않다. 본 논문에서는 일상에서와 같이 원격에서도 상대를 바라 볼 수 있고 자연스럽게 접촉할 수 있는 원격 촉감 커뮤니케이션 시스템을 제안한다. 이 시스템에서는 로컬 사용자가 손가락으로 상대의 몸 특정 부위를 만질 수 있고 서로 그 촉감을 실시간으로 느낄 수 있다. 이 시스템은 크게 AR 시스템, 그래픽 시스템, 햅틱 시스템, 택타일 시스템의 부시스템들로 나눌 수 있다. AR 시스템에서는 몸의 한 부위에 사각형의 AR 마커를 부착한 원격 사용자를 웹카메라로 촬영하고 ARToolKit 을 사용하여 마커의 위치를 측정한다. AR 마커의 바로 밑에는 택타일 장치가 장착되어 있으며 이 부위를 통하여 원격의 사용자는 로컬사용자가 자신의 팔을 만지는 느낌을 받게된다. 그래픽 시스템은 로컬사용자에게 촬영된 원격 사용자와 측정된 마커의 위치가 대표하는 원격 사용자의 가상 피부, 그리고 자신의 가상 손가락을 보여준다. 햅틱 시스템에서는 촉감 장치를 사용하여 로컬 사용자의 손가락 위치를 구하여 원격 사용자의 가상 피부와 접촉했을 때 그 충돌을 감지하고 접촉력을 계산하여 촉감 장치에 반영함으로써 그 접촉력을 느낄 수 있도록 한다. 택타일 시스템에서는 원격 사용자의 AR 마커 밑에 장착된 배열 타입의 진동 촉감 장치에 접촉 정보를 주어 로컬 사용자와 접촉 했을 때 접촉 부위에 진동을 줌으로써 촉감을 느끼도록 한다.

  • PDF

그림모델과 파티클필터를 이용한 인간 정면 상반신 포즈 인식 (Pictorial Model of Upper Body based Pose Recognition and Particle Filter Tracking)

  • 오치민;;김민욱;이칠우
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.186-192
    • /
    • 2009
  • 본 논문은 비전을 이용한 인간 정면 상반신 포즈를 인식 방법에 대해서 기술한다. 일반적으로 HCI(Human Computer Interaction)와 HRI(Human Robot Interaction)에서는 인간이 정면을 바라볼 때 얼굴, 손짓으로 의사소통 하는 경우가 많기 때문에 본 논문에서는 인식의 범위를 인간의 정면 그리고 상반신에 대해서만 한정한다. 인간 포즈인식의 주요 두 가지 어려움은 첫째 인간은 다양한 관절로 이루어진 객체이기 때문에 포즈의 자유도가 높은 문제점 때문에 모델링이 어렵다는 것이다. 둘째는 모델링된 정보와 영상과의 매칭이 어려운 것이다. 이를 해결하기 위해 본 논문에서는 모델링이 쉬운 그림모델(Pictorial Model)을 이용해 인체를 다수 사각형 파트로 모델링 하였고 이를 이용해 주요한 상반신 포즈를 DB화 해 인식한다. DB 포즈로 표현되지 못하는 세부포즈는 인식된 주요 포즈 파라미터로 부터 파티클필터를 이용해 예측한 다수 파티클로부터 가장 높은 사후분포를 갖는 파티클을 찾아 주요 포즈를 업데이트하여 결정한다. 따라서 주요한 포즈 인식과 이를 기반으로 한 세부 포즈를 추적하는 두 단계를 통해 인체 정면 상반신 포즈를 정확하게 인식 할 수 있다.

  • PDF

한국어 모음 입술독해를 위한 시공간적 특징에 관한 연구 (A Study on Spatio-temporal Features for Korean Vowel Lipreading)

  • 오현화;김인철;김동수;진성일
    • 한국음향학회지
    • /
    • 제21권1호
    • /
    • pp.19-26
    • /
    • 2002
  • 본 논문에서는 한국어 입술독해를 위한 기반 연구로서 음성학에 기반하여 음성의 시각적 기본 단위인 viseme을 정의하고 입술의 움직임을 적절히 표현할 수 있는 특징들을 추출하여 그 성능을 분석하였다. 먼저, 다수의 화자로부터 한국어 모음에 해당하는 입술의 동영상 데이터베이스를 획득하고 각모음별 시각적 특성을 분석하여 7개의 한국어 모음 viseme을 정의하였으며 입술 윤곽선상의 특징점과 시공간적 특징 벡터들을 추출하여 은닉 마르코프 모델에 적용함으로써 효과적인 입술독해를 위한 각 특징 벡터별 성능을 비교하였다. 7개의 한국어 각 viseme에 대한 인식 실험 결과에서 입술의 안팎 윤곽선의 정보가 모두 반영된 특징 벡터가 입술독해에 효과적으로 적용될 수 있으며 윤곽선 상의 특징점들의 시간적 움직임 크기와 방향이 입술독해를 위하여 매우 중요한 요소임을 확인할 수 있었다.

다양한 에지를 이용한 모션영역 기반 회화적 애니메이션 (Motion Areas based Painterly Animation using Various Edges)

  • 박영섭;윤경현
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제14권1호
    • /
    • pp.1-10
    • /
    • 2008
  • 본 논문에서는 동영상을 입력하여 손으로 그린 듯 한 회화적 애니메이션을 생성하기 위한 방법을 제안한다. 회화적 애니메이션에서 가장 중요한 요소 중 하나는 프레임 간 브러시 스트로크의 시간적 일관성을 유지하는 것이다. 이것은 프레임 간 브러시 스트로크들의 부드러운 움직임을 보장해주는 중요한 역할을 한다. 본 논문에서는 브러시 스트로크의 부드러운 움직임을 위해서 모션 영역들을 이용한다. 모션 영역은 프레임 간 객체들이 움직이는 영역을 의미하며 두 가지 타입으로 구성되어져 있다. 강한 모션 영역은 연속되는 두 장의 프레임 간 평가된 모션 벡터에 의해서 리얼 에지 및 히든 에지가 움직이는 영역을 말한다. 리얼 에지는 객체들의 윤곽선을 의미하며 히든 에지는 그라데이션 현상이 나타나는 영역에서 명암의 결의 방향을 표현하기 위한 경계를 의미한다. 약한 모션 영역은 모션이 발생한 전체 영역 중 강한 모션 영역을 뺀 영역을 말한다. 회화적 애니메이션에서 시간적 일관성은 이러한 모션 영역들을 이용하여 캔버스 위에 브러시들을 덧칠함으로써 유지될 수 있다.

  • PDF

Cyber World의 Moving Brand Identity에 관한 연구 (Moving Brand Identity in Cyber World)

  • 황인경
    • 한국정보통신학회논문지
    • /
    • 제20권1호
    • /
    • pp.65-71
    • /
    • 2016
  • Cyber world는 유기적으로 살아 있어, 계속 진화하며, 인간과 상호 소통하면서, 컴퓨팅과 네트워크의 단말을 통하여 가상과 현실의 인간 생활에 직간접적으로 연결된다. Cyber world에서 brand는 심벌과 로고타입 등 디자인으로 표현되는 BI(Brand Identity)를 통해서 창조되며, 디지털 기술의 발전에 맞춰서 발전해 오고 있다. 본 논문은 기업과 조직의 브랜드 가치를 향상시키고, 빠른 속도로 확산되는 cyber world의 mobile 환경에 적응하는 동영상을 개발하여 나타내고자 한다. Brand identity의 개념, brand identity의 구조, 통합적 brand identity 연구를 시작으로, 해외 Swisscom, HP, BBC 사례에서 적용한 brand identity의 개념과 구현을 연구하였다. 그리고, 가치 향상을 위한 moving brand identity를 위해 본인 작품인 ACM SIG CHI 2015, HCI Korea 2014, Aegis Ship 'Yulgok YiYi'의 설계 내용과 개발한 결과물을 통해 moving brand identity에 적용하여 개발하였다. 본 논문은 cyber world에서 moving brand identity를 연구하여 기업가치의 향상과, 우리나라의 브랜딩 향상 전략에 기여 할 것이다.

실시간 Dense Disparity Map 추출을 위한 고성능 가속기 구조 설계 (High Performance Coprocessor Architecture for Real-Time Dense Disparity Map)

  • 김정길;;김신덕
    • 정보처리학회논문지A
    • /
    • 제14A권5호
    • /
    • pp.301-308
    • /
    • 2007
  • 본 논문에서는 위상기반 양안스테레오정합 알고리즘을 이용, 실시간으로 dense disparity map을 추출 가능한 고성능 가속기 구조를 설계하였다. 채택된 알고리즘은 웨이블릿 기반의 위상차 기법의 강건성과 위상상관 기법의 기본적인 control 기법을 결합한 Local Weighted Phase Correlation(LWPC) 스테레오정합 알고리즘으로서 4개의 주요 단계로 구성이 되어 있다. 해당 알고리즘의 효율적인 병렬 하드웨어의 설계를 위하여, 제안된 가속기는 각 단계의 기능블록은 SIMD(Single Instruction Multiple Data Stream) 모드로 동작하게 되며, 전체적으로 각 기능 블록은 파이프라인(pipeline) 모드로 실행된다. 그 결과 제안된 구조에서 제시된 파이프라인 동작 모드의 선형 배열 프로세서는 행렬 순차수행 방법에 의한 2차원 영상처리에서 전치메모리의 필요를 제거하면서도 연산의 일반성과 고효율을 유지하게 한다. 제안된 하드웨어 구조는 Xilinx HDL을 이용하여 필요한 하드웨어 자원을 look up table, flip flop, slice, memory의 소모량으로 표현하였으며, 그 결과 실시간 처리 성능의 단일 칩 구현 가능성을 보여주었다.

공공장소에서 공연을 위한 휴머노이드 로봇 공연 시스템 (Humanoid Robot Performance System for Performing in Public Places)

  • 황희수
    • 한국산학기술학회논문지
    • /
    • 제17권3호
    • /
    • pp.190-196
    • /
    • 2016
  • 본 논문은 행사나 전시장 또는 길거리 공연이 가능한 휴머노이드(Humanoid) 로봇 공연 시스템을 제안한다. 본 공연 시스템의 공연 장치들은 모듈 구조로 이동이 쉽고 모듈별 독립 또는 협연이 가능하다. 로봇 공연 시스템은 개선 및 개작이 쉽도록 오픈 소스 기반의 하드웨어 및 소프트웨어로 개발한다. 로봇 공연 시스템에서 로봇, 디스플레이, 오디오, 비디오 및 개별 공연 장치를 제어하는 공연 제어 프로그램은 오픈 소스 언어인 프로세싱(Processing)으로 작성되며 로봇을 이용한 연주 장치와 무대 장치는 오픈 소스 하드웨어인 아두이노(Arduino)를 기반으로 제작된다. 로봇 공연 컨텐츠는 장면별로 이미지, 오디오, 컴퓨터 그래픽 및 비디오 영상 등으로 구성되며 이들을 실행하고 제어하는 로봇 공연 프로그램은 장면별로 로봇 및 공연 장치들과 동기화를 위해 통신한다. 또한 공연에서 주제 표현이 필요한 공연 소품은 3D 모델링 후 3D 프린팅으로 제작한다. 본 로봇 공연 시스템의 컨텐츠는 할로윈 축제를 주제로 구성하며 할로윈 날 전후로 전시장 또는 경연장과 같은 공공장소에서 공연된다.

이미지 피라미드를 이용한 변위 맵의 실시간 렌더링 (Real-Time Rendering of a Displacement Map using an Image Pyramid)

  • 오경수;기현우
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권5_6호
    • /
    • pp.228-237
    • /
    • 2007
  • 역변위 매핑은 기하정보를 증가시키지 않고, 모델에 상세함을 더하는데 사용된다. 우리는 부드럽고 정확한 굴곡을 표현할 수 있는 GPU 기반의 실시간 역변위 매핑 기법을 제안한다. 이를 위하여, 렌더될 각 픽셀에서 광선을 만들고 이를 전진시켜 나가며 변위 맵과의 교차점을 찾는다. 광선 추적을 안전하고 효율적으로 수행하기 위하여, 변위 맵을 쿼드트리 형태의 이미지 피라미드로 만들고, 이 트리를 하향식으로 탐색하며 전진해 나간다. 나아가, 변위 맵이 화면에서 확대되었을 때 선형 보간을, 그리고 화면에서 멀어져 작게 보일때는 때는 밉맵 필터링을 통해 화질을 향상시키고 렌더링을 가속화한다. 실험을 통해, 기존의 GPU 기반의 기법들과는 달리 날카로운 변위 맵에 대해 예각에서도 깨끗한 이미지를 생성하는 것을 확인하였다. 초당 수 백 프레임의 빠른 속도로 렌더링할 수 있었으며, 변위 맵의 해상도가 커져도 렌더링 속도의 저하가 적었다. 우리의 기법은 구현이 간단하고 수행속도가 빠르기 때문에 현존하는 게임이나 가상 현실 시스템 등에 쉽게 적용할 수 있다.

영화 [실미도]의 이데올로기와 리얼리티에 대한 비판적 고찰 (A Critical Study on Ideology and Reality of Silmido)

  • 서인숙
    • 한국콘텐츠학회논문지
    • /
    • 제8권7호
    • /
    • pp.161-173
    • /
    • 2008
  • 영화 [실미도](2003)는 은폐되었던 역사적 사실을 폭로하면서 실미도에서 행해진 특수부대의 훈련 과정을 스펙타클하게 묘사한다. 말하자면 영화라는 허구적 공간이 사실적으로 변모된다. 영화는 파쇼적인 정부에 대해 비판적 시각과 함께 정부의 권위를 보호하는 이데올로기적 모순을 노출시킨다. 또한 영화는 이런 역사적 사건을 재현하는데 있어서 신파와 같은 멜로적 표현에 의한 감성적 과잉으로 묘사한다. 여기서 관객의 동화작용은 비극적 민족 담론으로부터 파생되는 감정 이입으로 성취된다. [실미도]는 이성적 차원이 아닌 감성적 차원에서 상상의 공동체라는 민족의식에 호소하는 영화이다. 시각적 영상은 남과 북으로 나뉜 민족적 비극이라는 감상주의에 의해 더욱 고조된다. [실미도]는 신파적인 감상주의를 통해 분단 이데올로기에 의해 야기된 비극적 상황을 더욱 심화시킨다. 더구나 이 비극에서 군사정부는 야만적으로 묘사되는데 비해 실미도 부대원들은 영웅적으로 묘사되고 있다.