• 제목/요약/키워드: 영상 언어

검색결과 529건 처리시간 0.028초

보조 자료와 음성 전사를 사용한 강의 검색 시스템 (A LECTURE SEARCH SYSTEM USING RELEVANT INFORMATION AND SPEECH TRANSCRIPTION)

  • 이동현;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.140-144
    • /
    • 2008
  • 음성 오디오 검색 시스템을 구축하기 위해서는 몇 가지 과정이 필요하다. 첫 번째 과정이 음성 인식기를 이용하여 음성 오디오를 텍스트 형태로 표현하는 것이다. 하지만, 음성 인식기에서 수반되는 음성 인식 오류를 피할 수는 없다. 음성 인식 오류를 최소화하기 위해서 음성 인식 출력의 lattice를 색인(index)해야 하는데, 보다 효과적인 처리를 위하여 압축된 형태를 사용한다. 본 연구에서는 특별히 한국어 강의를 대상으로 검색 시스템을 구축했다. 강의에서는 특별히 관련된 자료를 쉽게 구할 수 있는 데, 이런 자료를 언어 모델에 이용하여 음성 인식 성능을 향상 시킬 수 있다. 또한, 강의 자료를 이용한 추가 색인 테이블(index table)을 생성하여 검색 성능 향상에 도움을 준다. 실험에서 고등학교 과정 수학 강의 동영상을 이용하여 자동화된 강의 검색 시스템을 구축하고, 보조 자료를 이용해 성능을 향상 시키는 것을 보인다.

  • PDF

DHMM과 신경망에서 숫자음 인식률 비교 (Digit Recognition Rate Comparision in DHMM and Neural Network)

  • 박정환;이원일;황태문;이종혁
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 춘계종합학술대회
    • /
    • pp.171-174
    • /
    • 2002
  • 음성 신호는 언어정보, 개인성, 감정 등의 여러 가지 정보를 포함한 음향학적인 신호인 동시에 가장 자연스럽고 널리 쓰이는 의사소통 수단의 하나이다. 본 연구에서는 저장된 음성 신호에서 추출한 특징 파라미터를 사용한 경우와 음성 특징파라미터에 입술 패턴에 대한 영상정보를 통시에 사용한 경우 DHMM과 신경망을 통하여 각각 인식률을 비교해 보았다. 그 결과 입술패턴에 대할 영상정보도 음성인식에 사용 할 수 있음을 알 수 있었다.

  • PDF

모바일 과학기술 영상 콘텐츠의 유형과 스토리텔링 전략 : 활동형 유튜브 채널을 중심으로 (Type and strategy of storytelling in mobile video contents about science and technology : focused on activity-centered video on YouTube)

  • 김혜영;유동환
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.177-178
    • /
    • 2019
  • 논문은 국내 모바일 과학기술 영상 콘텐츠의 활성화를 위해 과학기술 관련 유튜브 채널의 글로벌 선도그룹의 유형과 스토리텔링 전략을 분석하였다. 구독자 순위를 기준으로 상위 22개의 채널을 맥락과 활동에 따라 3개 유형으로 분류하고, 이 중 언어사용이 적고 역동적 볼거리를 제공하는 활동 중심의 채널들을 다시 4개의 세부 유형으로 나누었다. 4개 유형을 중점으로 스토리텔링 전략을 분석하여 킬러콘텐츠 제작 시 고려할 시사점을 도출하였다.

  • PDF

수업컨설팅 지원을 위한 수업언어 분석 프로그램 설계 및 개발 (Design and Development of the Verbal Interaction Analysis Program for Supporting Teaching Consultation)

  • 백제은;김경현
    • 컴퓨터교육학회논문지
    • /
    • 제18권1호
    • /
    • pp.1-12
    • /
    • 2015
  • 본 연구는 수업컨설팅을 효과적으로 지원하기 위한 수업언어 분석 프로그램을 개발하는 데 목적이 있다. 이를 위해 사용자 요구사항을 바탕으로 수업언어를 체계적으로 분석할 수 있는 컴퓨터 프로그램을 개발하였다. 개발된 수업언어 분석 프로그램은 다음과 같은 특징이 있다. 첫째, 사용자가 분석 도구의 틀을 원하는 바대로 설정할 수 있기 때문에 다양한 형태의 수업언어 분석이 가능하다. 둘째, 횟수나 시간비율과 같은 양적 분석의 결과뿐만 아니라 수업언어 전사와 같은 질적 분석의 결과를 얻을 수 있다. 셋째, 사용자가 분석 단위 시간, 동영상 플레이어 환경, 입력 및 결과 파일 형태와 같은 프로그램 환경을 자유롭게 설정할 수 있기 때문에 개인별 맞춤형 분석이 가능하다. 마지막으로 수업컨설팅 절차에 따른 활동 결과를 체계적으로 기록하고 관리할 수 있다. 이 프로그램은 수업컨설팅이 보다 전문적으로 이루어지도록 지원할 것이라 기대한다.

현장실습이 가능한 영상처리 학습 시스템 (An Image Processing Learning System with An Actual Practice)

  • 하석운;신현갑
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권10호
    • /
    • pp.673-684
    • /
    • 2003
  • 영상처리에 관한 이론을 제공하고 있는 대부분의 서적들은 여러 가지 영상처리 과정은 프로그램 코드로, 영상처리 결과는 결과 영상만을 단순하게 제공하고 있기 때문에 학습자가 그 처리과정과 결과를 직접 확인하기 위해서는 별도의 컴파일러를 사용해야 하는 불편함이 있다. 따라서 이론 학습과 동시에 그 결과를 확인할 수 있도록 실습을 병행할 수 있는 학습 도구의 개발이 필요하다. 본 논문에서는 영상처리에 관한 이론을 단원 별로 체계적으로 학습할 수 있을 뿐만 아니라, 해당 단원에 관계되는 영상처리과정을 이해할 수 있도록 제공되는 실습 창을 통해 직접 프로그램을 작성하고 실행하여 그 결과를 확인할 수 있는 현장 실습이 가능한 영상처리 학습 시스템을 제시 한다. 제시하는 시스템은 플랫폼에 독립인 시스템이 되기 위해서 자바 언어로 구현하였으며, 학습 내용의 체계적인 관리와 제공을 위해서 단원 별 내용을 데이터베이스로 구성함으로써 사용자가 필요에 따라 단원 별로 재학습하기에 적합하도록 구성하였다.

  • PDF

수화 통역을 위한 VR 콘텐츠 개발 (Development of Virtual Reality Contents for Korean Sign Language Interpretation)

  • 나길항;이병호;김종헌;김종남;정영기
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.690-695
    • /
    • 2009
  • 본 논문은 영화, 방송, 애니메이션 등의 다양한 동영상 콘텐츠에 수화 애니메이션을 합성하여 동영상 콘텐츠를 청각 및 언어장애인들에게 이해시키기 위한 수화 통역 VR 콘텐츠 시스템을 제안하고자 한다. 제안된 시스템은 수화 사전에 있는 수화들을 3D 애니메이션으로 DB화하기 위해, 모션 캡처 시스템과 데이터 글러브를 사용하여 실제 사람처럼 자연스러운 애니메이션을 생성하였다. 최종적으로 동영상 콘텐츠의 자막이나 대본의 구문분석을 한 후, 이를 수화용 단어자막을 통해 수화 애니메이션을 DB에서 검색한 후, 실시간적으로 기존 동영상 콘텐츠와 동기합성을 하여 수화 통역 콘텐츠를 제공하는 VR 콘텐츠 시스템을 구현하였고 이 시스템을 동화용 애니메이션에 적용하였다.

  • PDF

JPEG 인코더용 고속 변환 및 양자화에 관한 연구 (A Study on High-Speed Transform and Quantization for JPEG Encoder)

  • 노시찬;김경현;이민수;손승일
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.825-828
    • /
    • 2007
  • 오늘날 영상정보는 여러 분야에 있어 아주 큰 비중을 차지하고 있다. 다량의 정보를 가진 영상 신호의 효율적인 전송이나 저장에는 많은 제약이 따르게 되므로 고속의 영상 압축 관련 기술의 개발은 필수적이다. 본 논문은 JPEG에서 표준규격으로 채택하고 있는 DCT 및 양자화의 하드웨어에 적합한 고속연산 알고리즘을 연구하였고, JPEG 인코더에 적용 가능한 효율적인 회로 구조를 설계하였다. 연구된 DCT 및 양자화 모듈을 VHDL언어로 설계 및 합성하였으며 설계된 모듈은 영상 압축의 고속데이터 처리에 응용 가능하다.

  • PDF

온-오프 타입 DNA 칩의 자동판독 시스템 (Development of Automatic Reading System for On-Off Type DNA Chip)

  • 유문호;김종대
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.609-612
    • /
    • 2006
  • 본 연구는 진단용 DNA 칩의 자동판독 시스템을 제안하는 것을 목적으로 한다. 일반적인 자동판독 시스템의 사양을 정의하고 그 구현방법을 제안하였다. 응용 예로서 자궁경부암 진단용 DNA 칩을 대상으로 GenePix 스캐너 프로그램 환경에 적용하였다. 영상획득은 GenePix 의 라이브러리를 사용하여 HTML 언어로 구현하였고, 영상의 판단과 보고서 생성은 Microsoft Visual C++ 6.0를 사용하여 COM 형태로 구현하였다. 결과 보고서는 한글 2002 문서에 환자 정보와 결과 정보 등에 해당하는 곳에 미리 정의된 표지문자열들을 삽입하여 템플릿을 만들었다. 판독 시스템은 템플릿을 읽어들여 처리 결과의 내용으로 표지문자열들을 치환하여 보고서를 생성하였다. 제안한 시스템을 통해서 스캐닝을 통한 영상획득, 영상읠 판독, 결과 보고서 생성으로 구성된 전체 판독과정이 사용자의 개입 없이 자동으로 처리될 수 있었다. 본 시스템은 기존에 수작업을 자동화여 판독 시간을 단축하고 판독 기준을 정량화하여 진단용 DNA 칩이 대량검사 활용되는 공헌할 것으로 기대된다.

  • PDF

스마트폰을 이용한 실시간 영상처리와 증강현실의 구현 (Implementation of Real-time Image Processing and Augmented Reality for Smart Mobile Phone)

  • 김재영;전희성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.394-397
    • /
    • 2011
  • 애플의 아이폰4 스마트폰에 OpenCV 라이브러리를 활용하여 실시간 처리가 가능한 영상처리 프로그램을 구현하였다. 구현된 영상처리 프로그램은 이치화, 적응이치화, 에지 추출, 외곽선 추출 등이며 Objective-C 언어로 버튼 등의 인터페이스를 사용하는 아이폰 앱으로 구현되었다. 또한 증강현실을 구현하기 위해 Wagner가 개발한 ARToolKitPlus 라이브러리의 각 단계를 분석하였으며, 이 라이브러리를 이용해 Loulier가 아이폰에 구현한 VRToolKit을 이용하여 가상물체를 실시간으로 증강하는 실험을 진행하였다. 가상물체는 OpenGL ES 함수를 사용해 텍스처맵핑 기법으로 제작한 지구 모형으로 실시간 증강시에도 매끄럽게 정합되는 결과를 얻었다. 본 연구는 향후 스마트폰에서의 얼굴인식 등의 영상처리 프로그램 개발 및 멀티마커의 인식 등의 증강현실 프로그램 개발의 기본 토대로 사용될 수 있다.

비디오 자막 영역 원영상 복원 후 자막 교환 방법 (A Method for Recovering Image Data for Caption Regions and Replacing Caption Text)

  • 전병태;한규서;배영래
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.743-746
    • /
    • 2001
  • 멀티미디어 정보 중 비디오 데이터는 정보량이 많기 때문에 자동화된 비디오 영상 처리 기술이 필요하다. 시청자의 이해와 시청의 편의성을 제공하기 위하여 대부분 비디오에 자막을 삽입하게 된다. 외국 방송물 및 영화에 삽입된 다른 언어 자막을 편집 과정에서 자막으로 교환 할 필요성이 종종 있게 된다. 기존의 방법들은 자막 부분을 충분히 포함하는 일정 영역에 특정 색상을 채운 후 새로운 자막을 삽입하게 된다. 기존 방법의 문제점은 많은 영역에 대해 비디오 영상 정보를 손실 시킴으로써 시청자에게 시청의 불편을 초래하고 자막 교환의 비 효율성과 부 자연스러움을 발생시킨다. 본 논문에서는 기존 방법의 문제점을 극복하기 위하여 자막 영역을 원영상으로 복원한 후 다른 자막으로 교환하는 방법을 제안하고자 한다. 원영상 복원을 위하여 비디오 정보와 BMA(Block Matching Algorithm)를 이용한 원영상 복원 방법을 제안하고, 복원된 영역에 다른 자막으로 교환함으로써 효과적인 자막 교환 방법을 제안하고자 한다. 실험 결과 원영상 복원을 이용한 자막 교환 방법은 기존 방법에 비해 자연스럽고 효과적인 교환 방법임을 볼 수 있었다.

  • PDF