• 제목/요약/키워드: 텍스트 영상

검색결과 605건 처리시간 0.025초

콘텐츠 제작방식, 지각된 위험, 미디어 풍부성이 고객만족에 미치는 영향 분석 (Empirical Analysis on the Effect of Design Pattern of Web Page, Perceived Risk and Media Richness to Customer Satisfaction)

  • 박봉원;이중만;이종원
    • 한국콘텐츠학회논문지
    • /
    • 제11권6호
    • /
    • pp.385-396
    • /
    • 2011
  • 인터넷의 웹페이지는 다양한 형태로 존재하지만, 크게 텍스트 중심의 웹페이지, 텍스트와 이미지로 구성된 웹페이지, 그리고 텍스트와 동영상으로 구성된 웹페이지로 구분할 수 있다. 본 연구에서는 콘텐츠 제작방식에 따라서 변하는 소비자들의 지각된 위험 수준과 미디어 풍부성이 미치는 영향을 분석하며, 이들 요인이 고객만족에 미치는 영향을 분석한다. 분석결과, 텍스트 형식의 웹페이지가 텍스트와 이미지 혹은 동영상으로 구성된 웹페이지에 비해서 지각된 위험 중 성능위험, 심리적 위험, 시간 위험 등으로 구성된 개인적 위험을 더 크게 느끼는 것으로 나타났다. 또한, 미디어 풍부성 측면에서는 텍스트와 이미지 혹은 동영상으로 구성된 웹페이지가 텍스트 위주의 웹페이지에 비해서 상징성 및 사회적 실재감이 높은 것으로 조사되었다. 그리고 개인적 위험 및 텍스트 형식의 웹페이지는 고객 만족에 음의 영향을 미치며, 상징성 및 사회적 실재감은 양의 효과를 가진다. 본 연구는 지각된 위험과 미디어 풍부성의 개념을 콘텐츠 제작방식과 연결시킴으로써 기대와는 달리 동영상 콘텐츠가 폭발적으로 성장하지 못한 점에 대해서 규명한데 의의를 둔다.

장면 텍스트 영역 추출을 위한 적응적 에지 강화 기반의 기울기 검출 및 보정 (The Slope Extraction and Compensation Based on Adaptive Edge Enhancement to Extract Scene Text Region)

  • 백재경;장재혁;서영건
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권4호
    • /
    • pp.777-785
    • /
    • 2017
  • 실세계에서 텍스트가 포함 된 장면은 텍스트를 추출하고 인식하여 많은 정보를 얻을 수 있으므로, 장면의 텍스트 영역을 추출하고 인식하는 기술들은 꾸준히 발전하고 있다. 장면에서 텍스트 영역을 추출하는 기술은 크게 텍스쳐를 기반으로 하는 방법과 연결요소방법, 그리고 이 둘을 적절히 혼합하는 방법들로 구분 할 수 있다. 텍스처를 기반으로 하는 방법은 영상의 색상, 명도 등의 정보를 이용하여 텍스트가 다른 요소와는 다른 값을 갖는다는 것을 기반으로 한다. 연결 요소 방법은 장면의 각 화소마다 인접해 있는 유사 화소를 연결 요소로 만들어 기하학적인 특성을 이용하여 판별한다. 본 논문에서는 텍스트 영역 추출의 정확도를 높이기 위해 영상의 기울기를 검출하고 보정한 후 에지를 적응적으로 변경하는 방법을 제안한다. 제안 방법은 영상의 기울기를 보정한 후 텍스트가 포함 된 정확한 영역만 추출하기 때문에 MSER보다 15%, EEMSER보다 10% 더 정확하게 영역을 얻었다.

증강현실을 이용한 패턴 인식 (Pattern Recognition Using Augmented Reality)

  • 왕레이;신성윤;이양원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.203-206
    • /
    • 2009
  • 분 논문은 카메라 장비와 마커, DB를 이용하여 문자의 색감과 모음, 자음을 인식하여 문자에 해당되는 이미지 및 영상을 HMD 및 모니터, 가정에서 사용하는 화상 카메라 등을 이용하여 보다 구체적인 정보를 전달할 수 있게 해준다. DB에는 각 텍스트의 모음과 자음에 관한 텍스트가 등록되어 있으며, 각각의 색과 텍스트를 비교하여 해당하는 이미지를 출력하게 된다. 기존의 증강현실 기법은 해당 마크에 관한 패턴을 인식하여 그에 해당하는 이미지 및 영상을 출력하는데, DB를 이용한 문자인식을 사용할 경우 사용자에게 텍스트를 인식하여 연관된 많은 정보를 제공할 수 있게 된다. 제안된 인터페이스는 다양한 모습을 어려 시야를 통해 기존의 카탈로그보다 사용자의 접근성을 향상시키고, 미리 정의된 DB에 접근하여 해당 문자에 관한 여러가지 정보를 사용자에게 전달한다. 여러 전달 매체를 이용, 가상현실 및 증강현실 등을 다양한 카탈로그 뿐만 아니라 교육 및 신문 잡지, 광고 등 문자가 등장하는 여러 분야에 활용이 가능하다.

  • PDF

표정짓고 말하는 가상 얼굴의 실시간 합성 (Realtime Synthesis of Virtual Faces with Facial Expressions and Speech)

  • 송경준;이기영;최창석;민병의
    • 한국음향학회지
    • /
    • 제17권8호
    • /
    • pp.3-11
    • /
    • 1998
  • 본 논문에서는 고품질의 얼굴 동영상과 운율이 첨가된 음성을 통합하여 자연스런 가상얼굴을 실시간으로 합성하는 방법을 제안한다. 이 방법에서는 한글 텍스트를 입력하여, 텍스트에 따라 입모양과 음성을 합성하고, 얼굴 동영상과 음성의 동기를 맞추고 있다. 먼저, 텍스트를 음운 변화한 후, 문장을 분석하고 자모음사이의 지속시간을 부여한다. 자모음과 지 속시간에 따라 입모양을 변화시켜 얼굴 동영상을 생성하고 있다. 이때, 텍스트에 부합한 입 모양 변화뿐만 아니라, 두부의 3차원 동작과 다양한 표정변화를 통하여 자연스런 가상얼굴 을 실시간으로 합성하고 있다. 한편, 음성합성에서는 문장분석 결과에 따라 강세구와 억양구 를 정하고 있다. 강세구와 억양구를 이용하여 생성된 운율모델이 고품질의 음성합성에 필요 한 지속시간, 억양 및 휴지기를 제어한다. 합성단위는 무제한 어휘가 가능한 반음절과 triphone(VCV)의 조합이며, 합성방식은 TD-PSOLA를 사용한다.

  • PDF

JDBC를 이용한 웹기반 사용자 질의 영상 검색 (Web based User Query Image Retrieval using JDBC)

  • 차상환;이상열;황병곤
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2003년도 춘계학술대회
    • /
    • pp.57-61
    • /
    • 2003
  • 본 논문에서는 웹 에이전트를 이용하여 웹 상에서 멀티미디어 정보를 검색하는 것으로 HTML문서에 나타나는 텍스트 중 영상 이름이나 링크에 붙어 있는 텍스트를 추출하여 멀티미디어 자료를 JDBC를 이용하여 데이터베이스화하였다. 이 데이터베이스에 저장된 영상 자료는 웹 브라우저에서 질의자의 스케치에 의한 검색과 그리고 예제 영상 질의로 검색하는 방법을 제시하여 질의 효율성을 개선하였다.

  • PDF

I 프레임에 기반한 MPEG 압축영상에서의 자막 탐지 (Localization of captions in MPEG compression images based on I frame)

  • 유태웅
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권11호
    • /
    • pp.1465-1476
    • /
    • 2001
  • 실시간 자막 탐지는 비디오 인덱싱, 텍스트의 이해, 자동 자막 탐지시스템 등 수많은 응용 분야에서 요구된다. 본 논문은 I 프레임을 기반으로 MPEG 압축 동영상에서 자막을 탐지하는 알고리즘을 제안한다. 제안한 알고리즘은 자막 텍스춰 정보와 색체 정보를 사용하여 배경 영상으로부터 자막을 정확히 분리한다. 기존 알고리즘들은 압축 동영상으로부터 텍스트 영역을 추출하기 전에 압축을 먼저 해제하는데 제안한 알고리즘은 DCT 압축 도메인에서 직접 자막 텍스트 영역을 탐지한다.

  • PDF

명도 정보와 분할/합병 방법을 이용한 자연 영상에서의 텍스트 영역 추출 (Text Region Extraction of Natural Scene Images using Gray-level Information and Split/Merge Method)

  • 김지수;김수형;최영우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권6호
    • /
    • pp.502-511
    • /
    • 2005
  • 본 논문에서는 자연 이미지에 포함되어 있는 텍스트를 추출하기 위해 명도 정보를 사용한 하이브리드 분석 방법(HAM)을 제안하였다. 즉, 제안한 방법은 명도 정보 분석(Gray-intensity Information Analysis)과 분할/합병 분석(Split/Merge Analysis)을 결합하였다. 제안한 방법의 추출 결과를 보면 단순한 영상과 복잡한 영상 모두에서 기존의 연구 결과보다 우수한 성능을 보임을 알 수 있었다.

템플릿 기반의 자동 소셜 매거진 및 영상 합성 서비스 (Template-based Auto Social Magazine and Video Creation Service)

  • 이재원;장달원;김미지;김지수;김서율;이종설
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.129-132
    • /
    • 2019
  • 최근 자연어 처리 기술에 대한 중요도가 높아지고, 발전 속도가 빨라지면서, 산업 전반에 걸쳐 챗봇에 대한 수요가 증가하고 있다. 본 논문은 챗봇을 이용한 소셜 매거진 생성 및 배포, 그리고 이를 활용하여 사용자에게 텍스트를 음성으로 변환하여 동영상의 형태로 전달해 주는 시스템을 다루고 있다. 챗봇이 사용자 대화를 수집, 분석하여 상황에 맞는 키워드를 추출하고, 중복 콘텐츠 제거, 텍스트 요약 등 일련의 과정을 거쳐 소셜 매거진을 생성 및 배포하는 서비스와, 매거진의 각 콘텐츠를 구성하는 이미지, 텍스트 정보를 가지고 음성 합성, 자막 생성, 영상 효과 등을 이용하여 영상을 합성하는 서비스에 관한 것이다. 본 논문에서 제안한 시스템에 대한 성능은 실험을 통하여 검증하였다.

  • PDF

음성 인터페이스 STT(Speech to Text)를 활용한 동영상 스트리밍 자막 강조 시스템 (Subtitle Highlighting System for Video Streaming using Speech Interface STT (Speech to Text))

  • 이강찬;조대수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.567-568
    • /
    • 2021
  • 자막은 자막을 볼 수 있는 모든 사람들의 정보전달, 의사소통을 할 수 있는 유용한 도구로 사용 되고 있지만 자막은 평범한 텍스트로 있어 자막에서 강조된 부분, 감정 등을 전달 할 수 없다는 단점을 가지고 있다. 그러므로 청각 장애인들은 해당 컨텐츠의 감정, 강조 되는 부분을 알 수 없어 대화의 숨은 의미가 다른 방향으로 이해 할 수 있다는 위험성을 가지고 있다. 본 논문에서는 음성을 텍스트로 변환하는 STT(Speech To Text)를 이용하여 동영상 스트리밍 서비스를 실시간으로 음성을 텍스트로 변환과 동시에 강조하는 부분까지 개발하여 청각장애인 입장에서 기존 자막보다 효율적인 시각적 효과를 주는 미디어 접근을 위한 동영상 스트리밍 자막 서비스를 개발하고자 한다.

  • PDF

ChatGPT 를 활용한 영상 요약 모델에 관한 연구 (Video Summarization with ChatGPT)

  • 이원호;강준규 ;성나영 ;조수현 ;김영종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.694-695
    • /
    • 2023
  • 최근 ChatGPT 를 각 분야에 활용하는 연구가 활발하게 이루어지고 있다. ChatGPT 는 최신 자연어 처리 모델로, 텍스트를 통해 입출력을 진행한다. 본 논문에서는 이러한 ChatGPT 를 활용하여 영상을 효과적으로 요약할 수 있는 새로운 접근 방식을 제시한다. STT 기술을 사용하여 영상의 자막에 대한 텍스트 파일을 추출하고 이를 ChatGPT 로 요약한다. 최종적으로 기존 텍스트와의 유사도 분석을 통해 유사도가 높은 부분을 선택하여 영상을 편집하고 요약한다.