• Title/Summary/Keyword: 영상 언어

Search Result 529, Processing Time 0.027 seconds

An Emotion Recognition and Expression Method using Facial Image and Speech Signal (음성 신호와 얼굴 표정을 이용한 감정인식 몇 표현 기법)

  • Ju, Jong-Tae;Mun, Byeong-Hyeon;Seo, Sang-Uk;Jang, In-Hun;Sim, Gwi-Bo
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.04a
    • /
    • pp.333-336
    • /
    • 2007
  • 본 논문에서는 감정인식 분야에서 가장 많이 사용되어지는 음성신호와 얼굴영상을 가지고 4개의(기쁨, 슬픔, 화남, 놀람) 감정으로 인식하고 각각 얻어진 감정인식 결과를 Multi modal 기법을 이용해서 이들의 감정을 융합한다. 이를 위해 얼굴영상을 이용한 감정인식에서는 주성분 분석(Principal Component Analysis)법을 이용해 특징벡터를 추출하고, 음성신호는 언어적 특성을 배재한 acoustic feature를 사용하였으며 이와 같이 추출된 특징들을 각각 신경망에 적용시켜 감정별로 패턴을 분류하였고, 인식된 결과는 감정표현 시스템에 작용하여 감정을 표현하였다.

  • PDF

Word Segmentation Algorithm for Handwritten Documents based on k-means Clustering (k-평균 클러스터링을 이용한 필기 문서 영상의 단어 분리법)

  • Ryu, Jewoong;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.06a
    • /
    • pp.38-41
    • /
    • 2014
  • 본 논문에서는 필기 문서 영상을 분석하여 단어 단위로 요소들을 분할하는 방법을 제안한다. 일반적으로 인쇄 문서에 비하여 필기 문서에서는 글자 간 간격이 일정하지 않을 뿐만 아니라 필기자 또는 작성된 언어에 따라 특성이 매우 다르게 나타나기 때문에 단어를 분리하는 것은 어려운 문제로 간주되었고 많은 연구가 진행되었다. 제안하는 방법은 이 문제를 해결하기 위하여 글자 획의 두께를 고려하여 정규화시킨 각 연결 요소간 간격과 간격 안에 존재하는 글자 픽셀의 수로 구성된 2 차원의 특징값을 추출하였다. 이 특징값을 바탕으로, 제안하는 방법은 k-평균 클러스터링을 이용하여 각 텍스트라인을 구성하는 연결 요소간 간격을 단어 사이의 간격과 단어 내부 글자간의 간격으로 분류하였다. ICDAR 2013 Handwriting Segmentation Contest 데이터베이스에 대한 실험 결과 제안하는 방법은 가장 우수한 성능을 나타내었다.

  • PDF

A Design on the High-Speed MPEG-Audio Filter by DALUT (DALUT방식을 이용한 고속 MPEG-Audio 필터 설계)

  • Gu, Dae Seong;Kim, Jong Bin
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.27 no.8C
    • /
    • pp.812-818
    • /
    • 2002
  • 반도체 기술과 멀티기디어 통신기술이 발달하면서 고품위의 영상과 다중 채널의 오디오에 관심을 갖게되었다. 특히 DVD 시장의 급성장으로 인하여 고품질의 영상 및 오디오 필요성이 중요한 기술로 대두되었다. MPEG-Audio 표준안은 어떠한 비트율도 지원한다. 본 논문에서는 MPEG-Audio의 핵심부분인 필터부분을 DALUT (Distributed Arithmetic Look-Up Table)방식을 사용하여 FPGA(Field Programmable Gate Array)에 구현하였다. 고속 필터를 설계하기 위해서 승산기 대신에 DALUT를 사용하였으며 최소 10㎒에서 최대 30㎒ 사이에서 동작한다. 본 논문의 설계는 모두 VHDL로 구현하였으며, 알고리즘 검증은 C언어를 사용하였다. VHDL의 시뮬레이션은 ALDEC사의 Active-HDL5.1과 Synopsys사의 vhdlsim을 사용하였고, 합성은 Synopsys사의 design-analyzer를 사용하였다. 타겟 라이브러리는 XILINX사의 XC4010E, XC4020EX, XC4052XL을 사용하였으며, P&R 툴은 XACT Ml.4를 사용하였다.

Construction of Road Alignment Information System Using Digital Imagery (수치영상을 이용한 도로선형정보체계 구축)

  • Seo, Dong-Ju;Lee, Jong-Chool;Park, Woon-Yong;Cha, Sung-Yeoul
    • 한국지형공간정보학회:학술대회논문집
    • /
    • 2003.09a
    • /
    • pp.83-88
    • /
    • 2003
  • 최근 수치영상은 사진측량의 기본원리를 이용하여, 각종 첨단 산업분야에 그 응용이 증대되고 있으며, 많은 관심과 연구가 진행되고 있다. 특히 가장 중요한 국가시설물인 도로 경우에기존도로의 설계자료나 수치지도가 없는 지역인 경우가 많아 그 자료들을 획득하는데 많은 비용이 소모된다. 또한 도로자료 획득시 도로에 교통량의 증가로 종래 측량방법으로는 상당한 어려움이 있다. 따라서 본 연구에서는 수치사진측량에 의한 도로선형정보체계 구축방법을 제시 하고자한다. 먼저 수치사진측량에서 취득된 자료들을 객체 지향적인 언어인 Delphi를 이용하여 도로평면선형정보와 도로종단선형정보를 구축하는 프로그램을 개발하였다. 개발한 도로평면선형정보는 기발표된 연구보다 IP값은 약 X,Y방향으로 약 2m정도 정확도가 향상되었고, 곡선반경(R)은 약 2.5m정도의 정확도향상이 있었다.

  • PDF

Implementation of multi media service using MPEG-4 BIFS (MPEG-4 BIFS를 이용한 멀티미디어 서비스 구현)

  • Lee, Hee-Hoon;Lee, Kyung-Ju;Nam, Jin-A;Lee, Bo-Kyung;Jung, Eui-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10d
    • /
    • pp.657-660
    • /
    • 2006
  • MPEG-4 BIFS는 장면서술언어로서 본 논문에서는 MPEG-4 영상을 이용한 양방향 멀티미디어 서비스를 구현하는데 그 목적이 있으며, 장면서술은 MPEG-4 장면을 구성하는 객체들의 시공간적 구성관계를 기술하는 것이다. 또한, 본 논문에서는 MPEG-4에 정의된 다양한 데이터 포맷들로 영상 신호와 대응되는 실시간 데이터정보를 Display 하여 사용자 입력을 받아 그 정보를 사용자에게 보여 줌으로써 양방향 서비스를 사용자에게 제공할 수 있도록 하였으며, 양방향데이터서비스가 지원되는 플레이어를 개발하였다.

  • PDF

Dynamic Synthesis of Pseudo 2D HMMs for Korean Characters in Key Character Recognition Tasks (키워드 인식을 위한 한글 Pseudo 2D HMM의 동적 합성 방법)

  • 조범준
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.6B
    • /
    • pp.820-827
    • /
    • 2001
  • 한글은 둘 또는 세 개의 자모가 사각형 영역 안에 적절히 배치된 구조로 되어 있다. 이와 같은 구성 방법에 따라 글자의 영상을 합성하고 이를 실시간에 Pseudo 2D HMM으로 변환하는 방법을 제안한다. 본 방법에 따라 실시간 합성된 모델과 추가의 필러(filler) 모델, 여백 모델을 문서 영상의 글자 영역에서 핵심어 검출에 적용하였다. 실험 결과 최소한의 설계 변수 조정으로도 오검출, 미검출률이 낮고 언어 모델 없이 숫자 89%, 한글 80%의 검출성능을 보였으며, 따라서 제안된 방법이 인쇄 문자 패턴의 실시간 모델링 및 키워드 검출에 효과가 있음을 보였다. 본 연구 결과는 내용 기반의 광학 문서 색인 등에 활용할 수 있다.

  • PDF

Implementation of Efficient Effect of CMOS Image Sensor (CMOS 이미지 센서용 효과적인 Effect 구현)

  • Song, Hyung-Don;Lee, Dong-Hun;Sonh, Seung-Il
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.1
    • /
    • pp.999-1003
    • /
    • 2005
  • 본 논문에서는 영상 입력 장치 또는 카메라 이미지 센서로부터 얻은 이미지 데이터에 대하여 Bayer입력 포맷을 우리가 디스플레이 장치로 보는 영상으로 출력하기 위해 전처리 작업을 수행한 후 이미지 이펙트를 수행한다. 본 논문에서는 연산량과 레지스터의 수를 줄이고 칩의 성능을 향상시키기 위해 이미지 이펙트를 RGB에 적용하지 하지 않고 YCbCr을 이용하여 이미지 이펙트를 수행한다. 이를 구현하기위해 원본 이미지 사이즈를 640${\times}$480으로 입력 데이터를 사용하고, 소프트웨어로 전처리하여 이미지 결과를 확인한 후, 최적화된 알고리즘를 적용하여 VHDL설계언어를 이용한 하드웨어 설계 후, ModelSim 6.0a를 이용하여 데이터를 검증한다.

  • PDF

A Development of A Movie Contents Retrieval System based on Web Service (웹 서비스 기반의 영화 컨텐츠 검색 시스템 개발)

  • Kwak Kil-Sin;Joo Kyung-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.571-574
    • /
    • 2004
  • 디지털화 된 멀티미디어 데이터가 증가함에 따라 데이터의 효과적인 분류 및 검색 작업이 더욱 중요해 지고 있으며, 네트워크와 하드웨어의 발전으로 영상 정보를 검색함에 있어 기존의 웹상의 클라이언트/서버 기반 검색만으로는 부족하게 되었다. 이에 따라 영상 정보를 웹상에서 뿐만 아니라 모바일 같은 이기종간의 검색이 필요하다. 그러나 이기종 간의 플랫폼에서 동일한 정보를 얻기 위해서는 상호운용성에 문제가 있다. 웹 서비스(Web Service)는 분산 애플리케이션에 대한 언어-중립적(language-neutral)과 벤더-중립적(vendor-neutral)[5]을 제시하고 있어 기존의 서로 다른 플랫폼간의 정보 이전 문제를 해결할 수 있다. 따라서 본 논문에서는 영화 컨텐츠 검색 시스템을 웹 서비스화 하였다.

  • PDF

A Design and Implementation about the Web-Based Remote Control System Environments (웹을 기반으로 한 원격 제어시스템 환경 설계 및 구현)

  • Lee, Jeong-Bae
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.2
    • /
    • pp.377-384
    • /
    • 1999
  • In this paper, client/server model for remote conveyor control and monitoring system is designed and implemented to simulate the product line of vehicles. The client system located at the monitoring office is using a web applet based system, and sends some commands to the server system which guards and controls the conveyer system directly. And server system is implemented as the web based system by using Java programming language too. The system has a distributed database system environments to manage and maintain the product line of conveyor system.

  • PDF

Word-balloon effects on Video (비디오에 대한 말풍선 효과 합성)

  • Lee, Sun-Young;Lee, In-Kwon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.332-334
    • /
    • 2012
  • 최근 영화나 드라마 같은 미디어 데어터가 폭발적으로 증가하면서, 다양한 언어로 번역된 자막 데이터도 증가하고 있다. 이러한 자막은 대부분 화면 하단이나 우측에 위치가 고정되어 나타내는 방식을 취하고 있다. 그러나 이 방식에는 몇 가지 한계점을 가지고 있다. 자막과 등장인물의 얼굴이 거리가 먼 경우, 시청자의 시선이 분산되어 영상에 집중하기 어렵다는 점과 청각장애를 가진 사람의 경우 자막만으로는 누가 말하고 있는 대사인지 혼동이 온다는 점이다. 본 논문에서는 만화에서 대사를 전달하기 위해 사용하던 말풍선을 동영상의 자막을 나타내는데 사용하는 새로운 자막 시스템을 제안한다. 말풍선을 사용하면 말꼬리로 화자의 위치를 가리키고, 시청자의 시선을 화자의 얼굴 근처에 집중시킴으로써 기존 자막이 갖는 한계점을 개선시킬 수 있다. 본 연구의 결과물을 검증하기 위해 사용자 평가를 실시했고, 기존의 자막 방식에 비해 시선의 안정성과 흥미성, 정확도에서 더 낫다는 결과를 얻을 수 있었다.