• 제목/요약/키워드: 합성 시각

검색결과 187건 처리시간 0.048초

축구 비디오 인덱싱을 위한 장면 전환 검출과 시각 정보 분석 (Scene Change Detection and Visual Information Analysis for Soccer Video Indexing)

  • 신성윤;강오형;문경;이양원
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.290-294
    • /
    • 2001
  • 비디오 데이터를 인덱싱 하기 위해서는 우선적으로 장면 전환을 검출하여 키 프레임을 추출하고 추출된 키 프레임을 바탕으로 인덱싱 작업을 수행한다. 본 논문에서는 장면 전환을 검출하기 위하여 컬러 히스토그램과 $\chi$$^2$히스토그램을 합성한 방법을 이용하여 키 프레임을 추출하고, 축구 비디오가 갖는 특성을 이용하여 샷 사이의 흐름을 파악하여 시각 정보를 분석하며, 이를 바탕으로 축구 비디오를 다양한 방법으로 인덱싱하는 방법을 제시한다.

  • PDF

입체 콘텐츠 제작 기술 동향 분석 (Technical Trend of Stereoscopic Content Production)

  • 김해동;김혜선;장호욱;남승우
    • 전자통신동향분석
    • /
    • 제26권1호
    • /
    • pp.13-24
    • /
    • 2011
  • 영화 "아바타"가 개봉되면서 입체 콘텐츠 특히 입체 영화에 대해 많은 사람들이 관심을 갖게 되었다. 초기 국내에서, 스테레오 영상 제작 시도는 많았지만, 입체 영상을 단순히 한 쌍의 영상을 보여주는 것으로 생각하여 잘못 제작되는 경우가 많았다. 입체영상 제작 기술은 한 쌍의 영상을 인간의 양안에 각각의 영상을 보여주면 3차원으로 인식한다는 데 기술적 근간을 두고 있으나, 초기엔 실세계에서 인간이 인식하는 것과 유사하게 처리되지 않아 시각피로를 유발하는 경우가 많았다. 그래서, 본 원고에서는 "아바타" 영화와 같은 입체영상을 제작하기 위해 어떠한 기술과 고려되어야 할 사항들이 있는지 살펴본다. 현재 입체 영상 획득 방식인 두 대의 카메라를 이용하여 실사로 촬영하는 데 필요한 기술과, 그 결과 영상을 후반작업에서 보정하고 합성하여 시각피로를 최소화하는 방법 및 기술들을 중심으로 살펴본다.

  • PDF

비디오 캡션 생성을 위한 의미 특징 학습과 선택적 주의집중 (Semantic Feature Learning and Selective Attention for Video Captioning)

  • 이수진;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.865-868
    • /
    • 2017
  • 일반적으로 비디오로부터 캡션을 생성하는 작업은 입력 비디오로부터 특징을 추출해내는 과정과 추출한 특징을 이용하여 캡션을 생성해내는 과정을 포함한다. 본 논문에서는 효과적인 비디오 캡션 생성을 위한 심층 신경망 모델과 그 학습 방법을 소개한다. 본 논문에서는 입력 비디오를 표현하는 시각 특징 외에, 비디오를 효과적으로 표현하는 동적 의미 특징과 정적 의미 특징을 입력 특징으로 이용한다. 본 논문에서 입력 비디오의 시각 특징들은 C3D, ResNet과 같은 합성곱 신경망을 이용하여 추출하지만, 의미 특징은 본 논문에서 제안하는 의미 특징 추출 네트워크를 활용하여 추출한다. 그리고 이러한 특징들을 기반으로 비디오 캡션을 효과적으로 생성하기 위하여 선택적 주의집중 캡션 생성 네트워크를 제안한다. Youtube 동영상으로부터 수집된 MSVD 데이터 집합을 이용한 다양한 실험을 통해, 본 논문에서 제안한 모델의 성능과 효과를 확인할 수 있었다.

FAX 문서에 대한 DM 합성 알고리즘을 이용한 디지털 서명의 제안 (A Proposal On Digital Signature For FAX Document Using DM Algorithm)

  • 박일남;이대영
    • 정보보호학회논문지
    • /
    • 제7권2호
    • /
    • pp.55-72
    • /
    • 1997
  • 본 논문에서는 FAX문서에 직접 서명을 실행하는 디지털 서명 방식을 제안한다. 서명 비트를 합성하기 위해 기주사된 복수개의 참조 주사선중 키에 의해 선택된 주사선의 변화화소와 부호화주사선의 변화화소의 거리의 우기성을 이용하여 합성 비트열에 따라 거리를 신축조작하는 합성알고리즘을 제안한다. 앞서 제시한 방식에 비해 서명의 확산이 가능하므로 부분 서명에 의해 문서전체에 대한 서명이 구현되어 서명 속도가 개선되며 합성 전제조건의 제거로 합성 가능량이 증가한다. 또한 제안하는 디지털 서명구조에 의해 디지털 서명의 제 3 조건인 송신 부인 봉쇄를 구현한다. 디지털 서명된 송신 문서는 원 문서와 시각적으로 구분이 어려워 제 3자에게는 통상의 문서교환으로 인식될 것이다.

코퍼스 기반의 립싱크 알고리즘 개발 (Development of a lipsync algorithm based on A/V corpus)

  • 하영민;김진영;정수경
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.145-148
    • /
    • 2000
  • 이 논문에서는 2차원 얼굴 좌표데이터를 합성하기 위한 음성과 영상 동기화 알고리즘을 제안한다. 영상변수의 획득을 위해 화자의 얼굴에 부착된 표시를 추적함으로써 영상변수를 획득하였고, 음소정보뿐만 아니라 운율정보들과의 영상과의 상관관계를 분석하였으며 합성단위로 시각소에 기반한 코퍼스를 선택하고, 주변의 음운환경도 함께 고려하여 연음현상을 모델링하였다. 입력된 코퍼스에 해당되는 패턴들을 lookup table에서 선택하여 주변음소에 대해 기준패턴과의 음운거리를 계산하고 음성파일에서 운율정보들을 추출해 운율거리를 계산한 후 가중치를 주어 패턴과의 거리를 얻는다. 이중가장 근접한 다섯개의 패턴들의 연결부분에 대해 Viterbi Search를 수행하여 최적의 경로를 선택하고 주성분분석된 영상정보를 복구하고 시간정보를 조절한다.

  • PDF

u-GIS 야외 증강현실 시스템 개발에 관한 연구 (A Study on u-GIS Outdoor Augmented Reality System Development)

  • 김정환;김신형;길우성
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권1호
    • /
    • pp.183-188
    • /
    • 2009
  • 본 논문에서는 3차원 공간정보의 질을 향상시키고, 공간정보만으로 표현하기 어려운 부분을 시각화하는 u-GIS 야외 증강현실 시스템 개발 방법을 제안한다. 이 방법은 증강현실 시스템을 개발하기 위해 세 가지 기술을 사용한다. 첫째, 증강현실을 위한 카메라 영상을 포함한 센서 정보측정 및 보정기술과 둘째, 카메라 연동센서 기반 트래킹 기술. 마지막으로, 카메라 영상과 3차원 공간 정보의 정합을 위한 3차원 공간정보 합성기술이다. 본 논문에서는 세 가지 기술을 기반으로 실제 공간정보와 3D GIS 모델을 합성하여 증강하는 시스템을 개발하였다.

  • PDF

인터렉티브 하이브리드 미디어 응용기술 -MPEG-4 SNHC를 중심으로-

  • 김형곤
    • 방송과미디어
    • /
    • 제3권2호
    • /
    • pp.44-58
    • /
    • 1998
  • 최근의 멀티미디어 기술은 정보의 디지털화와 온라인화에 따라 가전, 컴퓨터, 통신 및 방송 기술이 융화되어 가는 추세에 있으며, 대화형의 하이브리드 멀티미디어 기술을 그 특징으로 하고있다. 하이브리드 멀티미디어는 컴퓨터 그래픽 및 미디(MIDI) 기술로 인위적으로 생성한 2D/3D그래픽 및 음향을 실제의 자연적인 영상과 소리에 추가하여 합성하므로 생성된다. MPEG-4는 이렇게 인위적으로 합성되거나 자연적인 영상 혹은 음향 정보의 디지털 하이브리드 멀티미디어 부호화를 목적으로 하며, 활성화된 혼합 미디어의 내용기반 처리, 상호, 동작 및 사용자의 쉬운 접근 등을 가능하게 한다. SNHC(Synthetic-Natural Hybrid Coding)는 기존의 수동적인 미디어의 전달뿐 아니라 실시간 처리가 가능한 인터랙티브 응용 분야까지 다루고 있으며, 통합된 시공간 부호화 기법을 사용하여 시각, 청각, 2차원, 3차원 컴퓨터 그래픽스 등 다양한 형태의 표준 AV(Aural/Visual) 객체를 처리한다. 표준화는 주로mesh-segmented 비디오 부호화, 구조물 부호화, 객체간의 동기화, AV 객체 스트림의 멀티플렉싱, 혼합 미디어 형태의 시-공간 통합화 등에서 이루어지게 되는데, 이는 궁극적으로 네트워크로 연결되는 가상 환경(Virtual Environment)에서 다수의 사용자가 서로 상호작용 할 수 있는 틀을 제공하는데 있다. 이러한 틀이 제공되면, 대화형 하이브리드 멀티미디어라는 새로운 형태의 정보를 사용함으로써 기존의 미디어로는 경험하지 못하는 다양한 응용과 서비스를 경험할 수 있을 것이다.

  • PDF

향신료와 식품산업

  • 노완섭
    • 동아시아식생활학회지
    • /
    • 제12권5호
    • /
    • pp.424-430
    • /
    • 2002
  • 사람이 음식을 섭취하는 목적은 생존과 건강 그리 사람이 음식을 섭취하는 목적은 생존과 건강 그리고 활동을 위해서 이다. 그러나, 음식을 섭취하는 것이 영양만을 위한 것은 아니다. 여러 가지 음식을 여러 가지 형태로 식사를 통하여 즐긴다는 것은 음식을 맛있게 먹는다는 것이며, 맛있게 먹기 위해서는 맛과 향이 조화를 이를 뿐만 아니라 음식이 맛있게 보이기 위해서는 시각적으로도 아름답게 보여야 한다. 따라서. 식품 재료를 신선한 상태로 이용하거나 조리와 가공을 통하여 음식물로 만드는 것도 음식을 보다 더 상미하기 위한 것이다. 식품을 조리할 때 소금. 간장, 식초, 설탕, 조미료 등 여러 가지 향신료를 다양한 형태로 사용함으로써 식욕과 기호를 증진시키게 되는 것이다. 문화의 진전에 따라 식생활이 더욱 다양해지고, 발전함에 따라 향신료의 종류와 형태도 더욱 다채로워지고 있다. 향신료의 수요증가와 변화욕구에 따라 인공 즉, 합성적인 제조품인 합성향료의 출현을 보기에 이르렀다. 그러나, 향신료의 경우 대부분이 아직도 자연품(분말, 추출물, 정유 등)이 대부분이며, 상당한 종류가 향신야채로서 상용되고 있다. 따라서 본 발표에서는 우리나라 식품산업에서 옛 부터 전통적으로 사용하였고, 현재에도 널리 사용하고 있는 향신료에 대하여 식품산업적 이용상황과 앞으로 나아갈 방향에 대하여 살펴보고자 한다.

  • PDF

화면해설방송 콘텐츠 저작 기술 (Descriptive Video Service Contents Authoring Technique)

  • 장인선;임우택;안충현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.175-176
    • /
    • 2014
  • 본 논문에서는 시각장애인의 TV 시청 보조기술인 화면해설방송(Descriptive Video Service)에 있어 다양한 편의 기술을 적용하여 저작자로 하여금 편리하고 경제적으로 화면해설방송물을 제작할 수 있도록 하는 저작 기술을 제안한다. 제안하는 방법은 화면해설 대본 작성의 편의를 위한 화면해설 삽입 추천 기술과 성우 음성 더빙을 대체할 수 있는 TTS 기반의 합성음성 기술, 또한 마스터 오디오와 합성음성 화면해설을 믹싱하기 위한 오디오 믹싱 기술을 포함한다. 마지막으로, 제안하는 기술의 구현 예를 제시한다.

  • PDF

한국어 음성합성과 인식을 이용한 웹 브라우저 설계 및 구현 (Design and Implementation of Web browser Using Voice synthesis & Recognition for Korean language)

  • 조경환;최훈일;조철환;장영건
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.278-280
    • /
    • 2000
  • 인터넷의 중요성이 증가함에 따라, 웹 브라우저에 음성 인터페이스를 추가하는 연구와 개발이 이루어지고 있다. 그러나, 아직까지 기존의 모든 웹 문서가 HTML로 작성되어 있어, 효과적인 음성 인터페이스를 하기에는 많은 어려움이 있으며, 음성이 느린 출력 매체이므로 사용자가 빠르게 인지할 수 있는 방안이 연구되어야 한다. 본 논문에서는 사용자의 웹 액세스를 높이기 위하여, 웹 브라우저에 연결되는 웹 문서에서, 각각의 객체를 추출한 후, 사용자가 그 객체에 바로 액세스를 하거나 한국어 음성으로 그 정보를 알 수 있는 방법을 사용하여, 음성으로 제어할 수 있는 한국어 음성 웹 브라우저를 설계하고 구현하였다. 음성합성과 인식을 사용하여 브라우저를 제어하기 때문에, 노약자나 어린이 또는 시각장애인들이 쉽게 웹 서핑을 할 수 있도록 도와줄 수 있고, 또한 현재 사용되고 있는 웹 문서에서의 객체추출을 사용하기 때문에 특별히 문서의 변환이 필요 없는 장점이 있다.

  • PDF