• Title/Summary/Keyword: 영상 언어

Search Result 529, Processing Time 0.025 seconds

A LECTURE SEARCH SYSTEM USING RELEVANT INFORMATION AND SPEECH TRANSCRIPTION (보조 자료와 음성 전사를 사용한 강의 검색 시스템)

  • Lee, Donghyeon;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.140-144
    • /
    • 2008
  • 음성 오디오 검색 시스템을 구축하기 위해서는 몇 가지 과정이 필요하다. 첫 번째 과정이 음성 인식기를 이용하여 음성 오디오를 텍스트 형태로 표현하는 것이다. 하지만, 음성 인식기에서 수반되는 음성 인식 오류를 피할 수는 없다. 음성 인식 오류를 최소화하기 위해서 음성 인식 출력의 lattice를 색인(index)해야 하는데, 보다 효과적인 처리를 위하여 압축된 형태를 사용한다. 본 연구에서는 특별히 한국어 강의를 대상으로 검색 시스템을 구축했다. 강의에서는 특별히 관련된 자료를 쉽게 구할 수 있는 데, 이런 자료를 언어 모델에 이용하여 음성 인식 성능을 향상 시킬 수 있다. 또한, 강의 자료를 이용한 추가 색인 테이블(index table)을 생성하여 검색 성능 향상에 도움을 준다. 실험에서 고등학교 과정 수학 강의 동영상을 이용하여 자동화된 강의 검색 시스템을 구축하고, 보조 자료를 이용해 성능을 향상 시키는 것을 보인다.

  • PDF

Digit Recognition Rate Comparision in DHMM and Neural Network (DHMM과 신경망에서 숫자음 인식률 비교)

  • 박정환;이원일;황태문;이종혁
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2002.05a
    • /
    • pp.171-174
    • /
    • 2002
  • 음성 신호는 언어정보, 개인성, 감정 등의 여러 가지 정보를 포함한 음향학적인 신호인 동시에 가장 자연스럽고 널리 쓰이는 의사소통 수단의 하나이다. 본 연구에서는 저장된 음성 신호에서 추출한 특징 파라미터를 사용한 경우와 음성 특징파라미터에 입술 패턴에 대한 영상정보를 통시에 사용한 경우 DHMM과 신경망을 통하여 각각 인식률을 비교해 보았다. 그 결과 입술패턴에 대할 영상정보도 음성인식에 사용 할 수 있음을 알 수 있었다.

  • PDF

Type and strategy of storytelling in mobile video contents about science and technology : focused on activity-centered video on YouTube (모바일 과학기술 영상 콘텐츠의 유형과 스토리텔링 전략 : 활동형 유튜브 채널을 중심으로)

  • Kim, hye-yung;Yoo, dong-hwan
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.177-178
    • /
    • 2019
  • 논문은 국내 모바일 과학기술 영상 콘텐츠의 활성화를 위해 과학기술 관련 유튜브 채널의 글로벌 선도그룹의 유형과 스토리텔링 전략을 분석하였다. 구독자 순위를 기준으로 상위 22개의 채널을 맥락과 활동에 따라 3개 유형으로 분류하고, 이 중 언어사용이 적고 역동적 볼거리를 제공하는 활동 중심의 채널들을 다시 4개의 세부 유형으로 나누었다. 4개 유형을 중점으로 스토리텔링 전략을 분석하여 킬러콘텐츠 제작 시 고려할 시사점을 도출하였다.

  • PDF

Design and Development of the Verbal Interaction Analysis Program for Supporting Teaching Consultation (수업컨설팅 지원을 위한 수업언어 분석 프로그램 설계 및 개발)

  • Baek, Je-Eun;Kim, Kyung-Hyun
    • The Journal of Korean Association of Computer Education
    • /
    • v.18 no.1
    • /
    • pp.1-12
    • /
    • 2015
  • The purpose of this study is to develop verbal interaction analysis program for supporting teaching consultation. For this a class language analysis program was developed to manage analysis results systematically in various angles. The program has following characteristics. First, program users can create the frame of analysis tool freely, so he can analysis a class as a desired. Second, qualitative analysis results as well as quantitative analysis results can be acquired. Third, personalized analysis is available, as users can set program environments freely such as analysis unit time, video player environments, and input and output file type. Finally, it can record and manage activity results according to class consulting procedures systematically. It is expected that this program will allow class consulting to be in place in school fields in more professional way.

An Image Processing Learning System with An Actual Practice (현장실습이 가능한 영상처리 학습 시스템)

  • 하석운;신현갑
    • Journal of the Korea Computer Industry Society
    • /
    • v.4 no.10
    • /
    • pp.673-684
    • /
    • 2003
  • In order to understand the concepts of image processing with effect, a learning system with an actual practice is necessary. As most image processing learning materials have some inconvenient respects that it is difficult to understand the processing procedure because they simply show the processed results as figures in the contents, and also, a separate practice tool is needed to operate the source codes because they provide the program source codes as a part in the context. In this paper, in order to solve above inconvenient respects, an image processing learning system that be able to improve the learning effects as accomplishing the theory studying and the actual practice in parallel is proposed. As this system is composed on the bases of java, it is independent to the platforms and it is possible to implement on the Web.

  • PDF

Development of Virtual Reality Contents for Korean Sign Language Interpretation (수화 통역을 위한 VR 콘텐츠 개발)

  • Na, Kil-Hang;Lee, Byung-Ho;Kim, Jong-Hun;Kim, Jong-Nam;Jung, Young-Kee
    • 한국HCI학회:학술대회논문집
    • /
    • 2009.02a
    • /
    • pp.690-695
    • /
    • 2009
  • 본 논문은 영화, 방송, 애니메이션 등의 다양한 동영상 콘텐츠에 수화 애니메이션을 합성하여 동영상 콘텐츠를 청각 및 언어장애인들에게 이해시키기 위한 수화 통역 VR 콘텐츠 시스템을 제안하고자 한다. 제안된 시스템은 수화 사전에 있는 수화들을 3D 애니메이션으로 DB화하기 위해, 모션 캡처 시스템과 데이터 글러브를 사용하여 실제 사람처럼 자연스러운 애니메이션을 생성하였다. 최종적으로 동영상 콘텐츠의 자막이나 대본의 구문분석을 한 후, 이를 수화용 단어자막을 통해 수화 애니메이션을 DB에서 검색한 후, 실시간적으로 기존 동영상 콘텐츠와 동기합성을 하여 수화 통역 콘텐츠를 제공하는 VR 콘텐츠 시스템을 구현하였고 이 시스템을 동화용 애니메이션에 적용하였다.

  • PDF

A Study on High-Speed Transform and Quantization for JPEG Encoder (JPEG 인코더용 고속 변환 및 양자화에 관한 연구)

  • Noh, si-chan;Kim, kyung-hyun;Lee, min-su;Sonh, seoung-il
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2007.11a
    • /
    • pp.825-828
    • /
    • 2007
  • 오늘날 영상정보는 여러 분야에 있어 아주 큰 비중을 차지하고 있다. 다량의 정보를 가진 영상 신호의 효율적인 전송이나 저장에는 많은 제약이 따르게 되므로 고속의 영상 압축 관련 기술의 개발은 필수적이다. 본 논문은 JPEG에서 표준규격으로 채택하고 있는 DCT 및 양자화의 하드웨어에 적합한 고속연산 알고리즘을 연구하였고, JPEG 인코더에 적용 가능한 효율적인 회로 구조를 설계하였다. 연구된 DCT 및 양자화 모듈을 VHDL언어로 설계 및 합성하였으며 설계된 모듈은 영상 압축의 고속데이터 처리에 응용 가능하다.

  • PDF

Development of Automatic Reading System for On-Off Type DNA Chip (온-오프 타입 DNA 칩의 자동판독 시스템)

  • Ryu, Mun-Ho;Kim, Jong-Dae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.609-612
    • /
    • 2006
  • 본 연구는 진단용 DNA 칩의 자동판독 시스템을 제안하는 것을 목적으로 한다. 일반적인 자동판독 시스템의 사양을 정의하고 그 구현방법을 제안하였다. 응용 예로서 자궁경부암 진단용 DNA 칩을 대상으로 GenePix 스캐너 프로그램 환경에 적용하였다. 영상획득은 GenePix 의 라이브러리를 사용하여 HTML 언어로 구현하였고, 영상의 판단과 보고서 생성은 Microsoft Visual C++ 6.0를 사용하여 COM 형태로 구현하였다. 결과 보고서는 한글 2002 문서에 환자 정보와 결과 정보 등에 해당하는 곳에 미리 정의된 표지문자열들을 삽입하여 템플릿을 만들었다. 판독 시스템은 템플릿을 읽어들여 처리 결과의 내용으로 표지문자열들을 치환하여 보고서를 생성하였다. 제안한 시스템을 통해서 스캐닝을 통한 영상획득, 영상읠 판독, 결과 보고서 생성으로 구성된 전체 판독과정이 사용자의 개입 없이 자동으로 처리될 수 있었다. 본 시스템은 기존에 수작업을 자동화여 판독 시간을 단축하고 판독 기준을 정량화하여 진단용 DNA 칩이 대량검사 활용되는 공헌할 것으로 기대된다.

  • PDF

Implementation of Real-time Image Processing and Augmented Reality for Smart Mobile Phone (스마트폰을 이용한 실시간 영상처리와 증강현실의 구현)

  • Kim, Jae-Young;Jun, Hee-Sung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.394-397
    • /
    • 2011
  • 애플의 아이폰4 스마트폰에 OpenCV 라이브러리를 활용하여 실시간 처리가 가능한 영상처리 프로그램을 구현하였다. 구현된 영상처리 프로그램은 이치화, 적응이치화, 에지 추출, 외곽선 추출 등이며 Objective-C 언어로 버튼 등의 인터페이스를 사용하는 아이폰 앱으로 구현되었다. 또한 증강현실을 구현하기 위해 Wagner가 개발한 ARToolKitPlus 라이브러리의 각 단계를 분석하였으며, 이 라이브러리를 이용해 Loulier가 아이폰에 구현한 VRToolKit을 이용하여 가상물체를 실시간으로 증강하는 실험을 진행하였다. 가상물체는 OpenGL ES 함수를 사용해 텍스처맵핑 기법으로 제작한 지구 모형으로 실시간 증강시에도 매끄럽게 정합되는 결과를 얻었다. 본 연구는 향후 스마트폰에서의 얼굴인식 등의 영상처리 프로그램 개발 및 멀티마커의 인식 등의 증강현실 프로그램 개발의 기본 토대로 사용될 수 있다.

A Method for Recovering Image Data for Caption Regions and Replacing Caption Text (비디오 자막 영역 원영상 복원 후 자막 교환 방법)

  • Chun, Byung-Tae;Han, Kyu-Seo;Bae, Young-Lae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.743-746
    • /
    • 2001
  • 멀티미디어 정보 중 비디오 데이터는 정보량이 많기 때문에 자동화된 비디오 영상 처리 기술이 필요하다. 시청자의 이해와 시청의 편의성을 제공하기 위하여 대부분 비디오에 자막을 삽입하게 된다. 외국 방송물 및 영화에 삽입된 다른 언어 자막을 편집 과정에서 자막으로 교환 할 필요성이 종종 있게 된다. 기존의 방법들은 자막 부분을 충분히 포함하는 일정 영역에 특정 색상을 채운 후 새로운 자막을 삽입하게 된다. 기존 방법의 문제점은 많은 영역에 대해 비디오 영상 정보를 손실 시킴으로써 시청자에게 시청의 불편을 초래하고 자막 교환의 비 효율성과 부 자연스러움을 발생시킨다. 본 논문에서는 기존 방법의 문제점을 극복하기 위하여 자막 영역을 원영상으로 복원한 후 다른 자막으로 교환하는 방법을 제안하고자 한다. 원영상 복원을 위하여 비디오 정보와 BMA(Block Matching Algorithm)를 이용한 원영상 복원 방법을 제안하고, 복원된 영역에 다른 자막으로 교환함으로써 효과적인 자막 교환 방법을 제안하고자 한다. 실험 결과 원영상 복원을 이용한 자막 교환 방법은 기존 방법에 비해 자연스럽고 효과적인 교환 방법임을 볼 수 있었다.

  • PDF