• 제목/요약/키워드: Representation of video Data

검색결과 64건 처리시간 0.052초

멀티미디어 방송을 위한 SMIL 편집 시스템 구현 (Implementation of SMIL Editor for Multimedia Broadcasting)

  • 장대영;김창수;정회경
    • 한국정보통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.622-629
    • /
    • 2004
  • 최근 디지털 방송 및 인터넷이 확산되면서, 다양한 멀티미디어 정보를 보다 자유롭게, 시간과 공간의 제약을 받지 않으면서 이용할 수 있게 되었다. 이러한 최근의 동향에 따라 오디오, 비디오와 같은 멀티미디어 데이터 표현에 대한 관심이 급증하면서 많은 사용자들은 멀티미디어 데이터를 통합한 서비스를 요구하게 되었다. 이에 따라 1998년 W3C에서 멀티미디어 객체의 표현 및 동기화 문제를 해결하기 위해 XML에 기반을 둔 SMIL(Synchronized Multimedia Integration Language)을 제안하였다. 이러한 멀티미디어 요소가 통합된 SMIL 문서는 플레이어를 통해 사용자와 상호 작용하는 멀티미디어 컨텐츠로서 단순히 오디오만 전달하는 인터넷 라디오 방송에 다양한 멀티미디어 요소를 접속하여 보다 않은 정보를 전달하며, 이를 통해 사용자 중심의 새로운 인터넷 라디오 방송 서비스를 창출할 수 있는 가능성이 마련되었다. 이에, 본 논문에서는 일반 사용자들이 손쉽게 멀티미디어 데이터들의 시간, 공간에 따른 배치 및 동기화를 표현하고 기술할 수 있도록 SMIL 문서 편집기를 설계 및 구현한 내용을 기술한다.

리뷰 데이터와 제품 정보를 이용한 멀티모달 감성분석 (Multimodal Sentiment Analysis Using Review Data and Product Information)

  • 황호현;이경찬;유진이;이영훈
    • 한국전자거래학회지
    • /
    • 제27권1호
    • /
    • pp.15-28
    • /
    • 2022
  • 최근 의류 등의 특정 쇼핑몰의 온라인 시장이 크게 확대되면서, 사용자의 리뷰를 활용하는 것이 주요한 마케팅 방안이 되었다. 이를 이용한 감성분석에 대한 연구들도 많이 진행되고 있다. 감성분석은 사용자의 리뷰를 긍정과 부정 그리고 필요에 따라서 중립으로 분류하는 방법이다. 이 방법은 크게 머신러닝 기반의 감성분석과 사전기반의 감성분석으로 나눌 수 있다. 머신러닝 기반의 감성분석은 사용자의 리뷰 데이터와 그에 대응하는 감성 라벨을 이용해서 분류 모델을 학습하는 방법이다. 감성분석 분야의 연구가 발전하면서 리뷰와 함께 제공되는 이미지나 영상 데이터 등을 함께 고려하여 학습하는 멀티모달 방식의 모델들이 연구되고 있다. 리뷰 데이터에서 제품의 카테고리와 사용자별로 사용되는 단어 등의 특징이 다르다. 따라서 본 논문에서는 리뷰데이터와 제품 정보를 동시에 고려하여 감성분석을 진행한다. 리뷰를 분류하는 모델로는 기본 순환신경망 구조에서 Gate 방식을 도입한 Gated Recurrent Unit(GRU), Long Short-Term Memory(LSTM) 그리고 Self Attention 기반의 Multi-head Attention 모델, Bidirectional Encoder Representation from Transformer(BERT)를 사용해서 각각 성능을 비교하였다. 제품 정보는 모두 동일한 Multi-Layer Perceptron(MLP) 모델을 이용하였다. 본 논문에서는 사용자 리뷰를 활용한 Baseline Classifier의 정보와 제품 정보를 활용한 MLP모델의 결과를 결합하는 방법을 제안하며 실제 데이터를 통해 성능의 우수함을 보인다.

T-DMB 하이브리드 데이터 서비스 Part 1: 하이브리드 BIFS 기술 (T-DMB Hybrid Data Service Part 1: Hybrid BIFS Technology)

  • 임영권;김규헌;정제창
    • 방송공학회논문지
    • /
    • 제16권2호
    • /
    • pp.350-359
    • /
    • 2011
  • 1990년대 이후 방송 기술의 눈부신 발전은 고선명 방송 서비스의 도입으로 가정에서의 고화질 방송 서비스 제공을 가능하게 하였을 뿐만 아니라, 이동 방송 서비스의 등장으로 고속으로 이동하는 차량에서도 방송 서비스를 즐길 수 있도록 하였다. Terrestrial Digital Multimedia Broadcasting (T-DMB) 기술은 이동 방송 서비스 제공을 위해 개발된 기술 중 성공적으로 상용화된 기술 중 하나이다. 고속 이동체에서의 안정적인 방송 수신 기능 외에 T-DMB의 기술적 혁신 중 주목할 만한 것으로는 MPEG-4 표준에 기반 한 시스템 프레임워크를 들 수 있다. 이는 장면 기술(Scene Description) 및 그래픽 객체 표현 언어인 Binary Format for Scene (BIFS)와 객체(object) 개념의 멀티미디어 구성 요소 표현 방식인 Object Descriptor (OD) 프레임워크를 통해 대화형 데이터 서비스를 제공할 수 있다. 그런데, T-DMB 대화형 데이터 서비스에는 두 가지 근본적인 제약 사항이 존재한다. 첫 번째 제약 사항은 대화형 서비스를 위한 그래픽 데이터는 비디오 화면을 벗어날 수 없어 항상 비디오 화면 위에 중첩되어 표현되어야 한다는 것이다. 두 번째 제약 사항은 양방향 서비스를 위한 데이터는 항상 방송망을 통해서만 전송되어야 한다는 것이다. 이러한 제약 사항은 단말의 위치 정보나 사용자의 특성 정보를 반영한 개인 맞춤형 서비스 제공의 제약조건이 되고 있다. 본 논문에서는 이러한 제약 사항을 극복하기 위해 기존방송망 및 무선 인터넷 망을 통해 각각 전송되는 장면 기술 정보 뿐만 아니라, 단말의 저장 장치에 저장된 장면 기술 정보를 활용하는 T-DMB 하이브리드 데이터 서비스 방식을 제안하고 기존 T-DMB 데이터 서비스와의 역호환성을 보장하는 하이브리드 BIFS 기술을 제안한다.

희소한 부호 자리수 계수를 갖는 FIR 필터 설계 (Design of FIR Filters With Sparse Signed Digit Coefficients)

  • 김시현
    • 전기전자학회논문지
    • /
    • 제19권3호
    • /
    • pp.342-348
    • /
    • 2015
  • 광대역 통신 모뎀이나 초고해상도 비디오 코덱 등과 같이 높은 데이터율을 갖는 시스템을 하드웨어로 구현할 때에는 디지털 필터의 고속 구현이 필수적이다. 디지털 필터의 임계경로는 대부분 MAC (multiplication and accumulation) 연산 회로이므로 필터 계수의 0이 아닌 비트의 갯수가 희소하다면 하드웨어 비용이 적은 덧셈기로도 디지털 필터를 고속으로 구현할 수 있다. 압축센싱은 신호의 희소 표현이나 희소 신호의 복원에 우수한 성능을 보임이 최근 연구에서 보고되고 있다. 본 논문에서는 압축센싱에 기반한 디지털 FIR 필터의 CSD (canonic signed digit) 계수를 찾는 방법을 제안한다. 주어진 주파수 응답과의 오차를 최소하면서 탐욕적 방법으로 희소한 0이 아닌 부호자리수를 찾고 잘못 선택되었던 부호자리수는 제거하는 과정을 반복한다. 설계 예를 통해 제안된 방법으로 희소한 0이 아닌 CSD 계수의 FIR 필터를 설계할 수 있음을 보인다.

사용자의 인터렉션 향상을 위한 EPUB eBook 변환 기법 (EPUB eBook Converting Schemes for Improving User Interactions)

  • 이남희;김재훈;김강석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권3호
    • /
    • pp.117-124
    • /
    • 2017
  • 기존 책 문서인 PDF문서를 전자책에서 사용 가능하도록 전자책의 표준 형태로 변환하는 과정이 필요하다. PDF문서를 전자책의 표준 형태인 EPUB으로 변환할 때, 인쇄 색상 표현방법인 CMYK를 디지털 색상 RGB 형태로 변환하는 과정에서 형태의 차이로 인해 색감이 제대로 변환되지 못하는 문제점이 있다. 그리고 EPUB은 동영상, 자바스크립트 등을 이용해서 시각적인 효과를 줄 수 있으며, 사용자와의 상호작용이 가능하다. 본 연구는 PDF를 EPUB으로 변환 시 발생할 수 있는 문제점에 대해서 연구를 하였다. (1) 첫 번째는 색감을 잃지 않도록 ICC 프로파일을 이용한 변환 연구를 수행하였다. (2) 두 번째는 변환 과정에서 레이아웃 구성에 대한 연구를 수행하였다. (3) 세 번째는 전자책 독자들과 상호작용할 수 있는 시각적인 효과를 제공하기 위하여, 텍스트 중 특정 부분을 인식하여 시각적인 효과를 주는 연구를 수행하였으며 기존 책에서의 퀴즈를 추출하여 변환 시 자바스크립트를 이용한 퀴즈 플랫폼 프로토타입을 구현하였다. 또한 PDF문서를 EPUB에 기반 한 전자책 문서로 변환 후 사용자 평가를 통해 변환유효성 및 편의성을 검증하였다.

A Longitudinal Case Study of Late Babble and Early Speech in Southern Mandarin

  • Chen, Xiaoxiang
    • 비교문화연구
    • /
    • 제20권
    • /
    • pp.5-27
    • /
    • 2010
  • This paper studies the relation between canonical/variegated babble (CB/VB) and early speech in an infant acquiring Mandarin Chinese from 9 to 17 months. The infant was audio-and video-taped in her home almost every week. The data analyzed here come from 1,621 utterances extracted from 23 sessions ranging from 30 minutes to one hour, from age 00:09;07 to 01:05;27. The data was digitized, and segments from 23 sessions were transcribed in narrow IPA and coded for analysis. Babble was coded from age 00:09;07 to 01:00;00, and words were coded from 01:00;00 to 01:05;27, proto-words appeared at 11 months, and some babble was still present after 01:10;00. 3821 segments were counted in CB/VB utterances, plus the segments found in 899 word tokens. The data transcription was completed and checked by the author and was rechecked by two other researchers who majored in Chinese phonetics in order to ensure the reliability, we reached an agreement of 95.65%. Mandarin Chinese is phonetically very rich in consonants, especially affricates: it has aspirated and unaspirated stops in labial, alveolar, and velar places of articulation; affricates and fricatives in alveolar, retroflex, and palatal places; /f/; labial, alveolar, and velar nasals; a lateral;[h]; and labiovelar and palatal glides. In the child's pre-speech phonetic repertoire, 7 different consonants and 10 vowels were transcribed at 00:09;07. By 00:10;16, the number of phones was more than doubled (17 consonants, 25 vowels), but the rate of increase slowed after 11 months of age. The phones from babbling remained active throughout the child's early and subsequent speech. The rank order of the occurrence of the major class types for both CB and early speech was: stops, approximants, nasals, affricates, fricatives and lateral. As expected, unaspirated stops outnumbered aspirated stops, and front stops and nasals were more frequent than back sounds in both types of utterances. The fact that affricates outnumbered fricatives in the child's late babble indicates the pre-speech influence of the ambient language. The analysis of the data also showed that: 1) the phonetic characteristics of CB/VB and early meaningful speech are extremely similar. The similarities of CB/VB and speech prove that the two are deeply related; 2) The infant has demonstrated similar preferences for certain types of sounds in the two stages; 3) The infant's babbling was patterned at segmental level, and this regularity was similarly evident in the early speech of children. The three types being coronal plus front vowel; labial plus central and dorsal plus back vowel exhibited much overlap in the phonetic forms of CB/ VB and early speech. So the child's CB/ VB at this stage already shared the basic architecture, composition and representation of early speech. The evidence of similarity between CB/VB and early speech leaves no doubt that phones present in CB/VB are indeed precursors to early speech.

CoRe 개발 과정을 통한 과학교사의 PCK 변화에 관한 사례 연구 -중학교 1학년 "분자의 운동"을 중심으로- (A Case Study on the Development of Science Teachers PCK through development of Content Representation (CoRe) -Focusing on "Molecular Motion" for 7th grade class-)

  • 장효순;최병순
    • 한국과학교육학회지
    • /
    • 제30권6호
    • /
    • pp.870-885
    • /
    • 2010
  • 이 연구의 목적은 숙련된 전공 교사와 비전공 교사가 공동 작업으로 중학교 1학년 "분자의 운동"에 관한 CoRe를 개발하면서, 개발 과정에서 연구 참여자들이 경험하는 것은 무엇이며, 개발 과정 경험 후 이들이 수업에서 나타나는 PCK 변화는 무엇인지 알아보는 것이었다. 이 연구는 도구적 사례 연구이며, 연구 참여자를 의도적 표본 추출하였다. CoRe 개발 과정 녹음과 수업 관찰 녹화, 면담으로 자료를 수집하였고, 모든 자료는 전사 후 분석하였다. 연구 결과, 연구 참여자들이 CoRe 개발 논의 과정을 통해 교과 내용 지식과 이전 수업에 대해 반성하고, 교사 자신의 오개념을 수정하고 개념을 명료화했으며, 교수 내용과 목표를 분명히 인식하고, 학생들의 선개념에 대한 이해를 높이는 경험을 한다는 것을 확인할 수 있었다. 특히 비전공 연구 참여자들은 전공 교사와의 논의를 통해 이전의 수업에서 입자적 관점이 부족했었던 면을 확인하고, "분자의 운동"에서 무엇을 왜 가르쳐야 할지를 명확히 인식하게 되었음을 강조했다. CoRe 개발 경험 후 비전공 연구 참여자들은 PCK의 구성 요소 중 과학 교육과정에 대한 지식에 가장 큰 영향을 받아, 수업에서 입자성과 분자의 운동을 강조하는 모습을 보였다. 또 CoRe에서 논의된 새로운 교수 전략을 도입했다. 비전공 연구 참여 교사들의 PCK가 변하는 정도는 자신의 지식과 이전 수업에 대한 반성적 사고 정도와 교사의 정의적 특성에 따라 달랐다. 이 연구를 통해 CoRe 개발 과정이 교사의 전문성 신장에 필수적인 반성적 사고를 촉진시키고, PCK에도 유의미한 영향을 미침을 확인할 수 있었다. 특히 전공자와 비전공자가 공동으로 CoRe를 개발하는 논의 과정을 통해 통합 교과에서 비전공자들이 보이는 일종의 결여를 확인하고 보완할 수 있음을 알 수 있었다. 또한 인식이 곧바로 실천으로 연결되는 것이 아니라 내면화되기까지는 시간과 노력이 요구된다는 것도 확인할 수 있었다.

포스트-미디엄과 포스트프로덕션 : 포스트모더니즘 이후 현대미술의 '동시대성(contemporaneity)' (Post-Medium and Postproduction: Contemporaneity of Contemporary Art)

  • 정연심
    • 미술이론과 현장
    • /
    • 제14호
    • /
    • pp.187-215
    • /
    • 2012
  • In recent studies of art historical methodology, such as Critical Terms for Art History and The Art of Art History, subjectivity, identity, abjection, and other terms have been placed safely in the genealogy of contemporary art history. This paper questions the contemporaneity in the story of contemporary art in our time in relation to two other critical terms that have been regularly cited by contemporary critics, not only in Euro-American fields but also in Korea. The terms are postmedium and postproduction, respectively, as used by Rosalind Krauss and Nicolas Bourriaud. This paper stems from the critical condition in which art criticism and theory have their power in the rise of neo-liberalism. But this paper does not deal with the contemporary as a chronological term for art history but rather examines the three critical terms-contemporaneity, post-medium, and postproduction-that have garnered scholarly attention. I would like to put aside postmodernism for the moment; I don't disregard the postmodern condition although the death of postmodern critical terms has resulted in the loss of its polemical power in art worlds such as in exhibitions, etc. To look at "the postproduction in the age of post-medium age after postmodernism," I first explore Krauss's notion of post-medium because, unlike media artists like Lev Manovich and Peter Weibel, Krauss's post-medium condition is different and insists on medium specificity. In this sense, Krauss has turned out to be another Greenberg in disguise. For her, photography and video are expanded mediums after Greenberg, because Krauss has spent her life explicating those mediums. Under the Cup, her recent publication, came out in 2011, and discusses her desire to defend medium-specificity against the intermedia of installation art found ubiquitously in international exhibitions and biennales. Her usage of post-medium has been taken up by Weibel as postmedia in a broader sense. But whether the post-medium condition or the postmedia age, we nonetheless enter the new age of the contemporary. Consequently, this paper questions what constitutes contemporaneity in our times. It is said that there is nothing new on earth, yet I find original artistic strategies among the younger generation in the postmedia age. The contemporary justifies its place in art fields and criticism by keeping its distance from postmodernism although we still find the remnants of postmodern artistic practices and theoretical foundations. By looking at materials written by Terry Smith, I would like to examine contemporaneity as a rhetoric where artists, critics, and curators endeavor to set up a new spirit of criticism, distant from the past of modernism and postmodernism. In discussions, modernism and postmodernism act as catalysts interacting with each other while justifying their own place. In conclusion, my paper reaches to delineate where the contemporary finds its place among artists' responses and working methods. It explores the postproduction of the Internet and the World Wide Web generations, where images become data rather than representation (of modernism) and appropriation (of postmodernism). This paper analyzes Bourriaud's text, as well as relevant artists like Pierre Huyghe, Liam Gillick, and others. By examining the aforementioned critical terms, I would like to reconsider our own contemporary art in Korea, especially among young artists influenced by digital media and the World Wide Web in the 1990s.

  • PDF

모션캡처 활용을 통한 창작발레<청춘>창작과정연구 (A Study on the Creative Process of Creative Ballet <Youth> through Motion Capture Technology)

  • 장소정;박아름
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.809-814
    • /
    • 2023
  • 현재 무용 현장에서의 과학기술을 직접적으로 활용하고 창작에 직결되는 배경과 방법을 기술한 논문연구가 부족하다. 본 연구자는 창작무용<청춘>에 모션캡처를 적용하고 공연에 반영한 장면의 창작과정을 서술하였다. 연구 방법으로는 현장에서 생성된 현상이나 체험을 분석하는 연구 방법으로 창조된 결과물로부터 새로운 지식과 의미를 도출하는 방법인 실기기반연구(Practice Based Research)을 활용하였다. 창작발레<청춘>은 총 4장으로 구성되어 4장에서의 모션캡처된 영상은 하이라이트 장면으로 과거의 발레리나의 이미지를 형상화하였고, 과거의 '나'이면서 현재의 꿈이기도 한 장면의 의미를 지녔다. 모션캡처의 사용은 장면의 이미지를 부각시켰으며, 관객의 몰입도를 높이는 역할을 하였다. 무용계는 모션캡처과 같은 과학기술과의 협업을 통해 무형자산을 디지털화 하는 것에 친숙해질 필요가 있으며 실험적인 시도를 훈련하고 지속해야 한다. 또한 협업을 통해 디지털화 된 과정과 공연, 그리고 공연기록을 통해 움직임의 범위를 확장하고 가치와 의미를 끊임없이 부여하는 연구를 지속해야 할 것이다.

H.264 압축과 SVDD를 이용한 영상 감시 시스템에서의 비정상 집단행동 탐지 (Abnormal Crowd Behavior Detection via H.264 Compression and SVDD in Video Surveillance System)

  • 오승근;이종욱;정용화;박대희
    • 정보보호학회논문지
    • /
    • 제21권6호
    • /
    • pp.183-190
    • /
    • 2011
  • 감시카메라 환경에서 군중의 비정상 집단행동 탐지란 감시카메라로부터 유입되는 영상에서 다중 객체가 위험에 처한 상황을 신속하고 정확하게 탐지하는 분야를 말한다. 본 논문에서는 CCTV 등과 같은 감시카메라 환경에서 움직임 벡터와 SVDD를 이용하여 집단내의 비정상 상황을 탐지하는 프로토타입 시스템을 제안한다. 제안된 시스템은 H.264 압축과정에서의 움직임 벡터 정보를 이용하여 영상내의 움직임 정보를 추출 표현하였으며, 비정상 집단행동의 판별 문제를 실용적 차원의 단일 클래스 분류 문제로 재해석하여 단일 클래스 SVM의 대표적 모델인 SVDD를 탐지기로 설계하였다. 제안된 시스템은 H.264 압축 과정에서 얻어지는 움직임 벡터를 이용함으로써, 실시간성을 보장하며 SVDD의 점증적 갱신 학습 능력으로 인하여 비정상 집단행동 데이터베이스의 변화에도 능동적으로 적응할 수 있다. 공개적으로 사용 가능한 벤치마크 데이터 셋인 PETS 2009와 UMN을 이용하여 본 논문에서 제안한 비정상 집단행동 탐지 시스템의 성능을 실험적으로 검증한다.