• 제목/요약/키워드: 영상 언어

검색결과 529건 처리시간 0.036초

다양한 유형의 서식문서 처리를 위한 효과적인 모형 기반 방법에 관한 연구 (Efficient Model-based Form Processing Methods for Various Kinds of Form Documents)

  • 변영철;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.420-422
    • /
    • 1998
  • 본 논문에서는 여러 가지 유형의 서식문서를 효과적으로 처리하기 위한 방법을 제안하고 모형 기반 서식 처리 시스템을 위한 프레임워크를 구현한다. 이를 위해서 서식문서의 모형으로 등록되는 정보로서 네가지 유형의 서식문서에 관한 지식을 정의하고, 이를 기술하기 위한 서식 기술 언어를 정의한다. 먼저, 서식 등록 과정에서 서식에 관한 네가지 유형의 지식을 서식 모형으로 등록한다. 그리고 서식 처리 과정에서 시스템에 등록되어 있는 서식 모형을 이용하여 서식을 분류함으로써 계산 시간을 줄일 수 있다. 실험결과 8개의 서식 모형이 등록되어 있을 경우에는 평균 서식 분류 시간은 0.74초였으며, 5개 혹은 6개의 항목을 추출하는데 걸리는 시간은 평균 0.45초였다. 본 방법은 서식 영상의 질이 좋지 않을 경우에도 잘 동작함은 물론 서식 모형만 추가함으로써 다른 서식 문서도 쉽게 처리할 수 있다.

  • PDF

VHDL을 이용한 H.263+ Codec의 설계 (A Design of H.263+ Codec using VHDL)

  • 김은성;김상철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.12-14
    • /
    • 1999
  • H.263+[1]는 1996년에 비디오압축 표준안으로 확정된 H.263의 확장으로 현재 널리 퍼져 있는 저 전송률의 가정용 전화선을 위한 비디오 압축에 관한 표준안으로 1988년에 확정되었다. H.263+의 기본 알고리즘은 H.263과 같으나 사용상의 편의를 위한 여러 선택모드와 이종의 네트워크환경에서 발생하는 대역폭의 변화나 에러를 위한 scalability(계층부호화)와 같은 새로운 기능이 추가되었다. 새로운 표준안에 따른 실시간 비디오 전송을 처리하기 위해서 필연적으로 하드웨어 코덱의 개발 필요성이 대두되고 있으며 실시간 비디오 코덱은 영상회의 전화기나 멀티미디어 전송시스템의 핵심기술로써 적용될 수 있다. 본 논문에서는 ITU-T H.263+의 기본모드와 새로이 추가된 선택모드 일부를 지원하는 코덱을 하드웨어 기술 언어인 VHDL(VHSIC Hardware Description Language)을 사용하여 기술하고 각 모듈과 최상의 모듈을 시뮬레이션하여 동작을 검증했다.

  • PDF

GPS 위치정보를 이용한 멀티미디어 관광 콘텐츠 제공 서비스 (Multimedia Tour Contents Service System Employing GPS-based Location Information)

  • 김영철;김상태;차현철;김현덕
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2009년도 추계학술대회
    • /
    • pp.55-58
    • /
    • 2009
  • 위치기반 서비스는 사용자의 위치를 자동으로 인식하여 사용자의 위치를 고려한 맞춤형 서비스를 제공하며, 일반적으로 위치정보 획득을 위해 GPS(Global Positioning System)를 이용하고 있다. 본 논문에서는 GPS 수신기를 통해 수신된 정보로부터 차량의 위치정보를 인식하고, 이를 사전에 설정된 관광 차량의 이동경로와 비교 분석하여 안내 방송이 필요한 각 관광지까지의 거리와 소요시간 등을 실시간으로 인식한다. 또, 이러한 인식결과를 이용하여 사전 또는 실시간으로 설정된 관광지의 멀티미디어 관광 콘텐츠를 영상과 음성으로 재생하여 관광객에게 제공하게 된다. 특히, 각각 사용 언어가 다른 사용자가 동시에 서비스를 이용하더라도 별도의 음성채널을 통하여 서비스를 제공하며, 사용자 수신기에서 채널을 선택하여 이용하므로 사용자 편의성을 높일 수 있다.

  • PDF

고립단어 음성인식에서 신경망을 이용한 사용자 적응형 후처리 (User Adjustment Post-Process Using Neural Network In Isolated Word Speech Recognition)

  • 김영진;김은주;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.736-738
    • /
    • 2005
  • 최근 PDA나 PMP와 같은 개인용 모바일 기기의 인터페이스 개발로써 잡음환경에 강인한 음성인식 기술들이 연구되고 있으며 이러한 방법으로 오류패턴, 순차패턴, 의미정보, 문맥정보와 같이 인식기에 독립적인 정보를 이용하거나 영상 정보와 같이 언어와 성격이 다른 이질적인 정보를 이용하여 후처리를 하는 연구들이 진행되어 왔다. 그러나 인식기와 독립적인 정보로 후처리를 하는 방법들의 인식률은 인식기의 사전 인식률이 주변 잡음에 의해 떨어질 경우 후처리 인식률도 같이 떨어지는 현상이 벌어진다. 따라서 본 논문에서는 주변 잡음으로 인한 인식기의 사전 인식률에 저하를 줄이는 방법으로 사용자 적응형 후처리를 제안한다. 사용자 적응형 후처리에 사용되는 데이터는 사용자의 발화에 대한 인식기의 출력 값들이며, 출력 값들은 화자독립모델에 의해 계산되는 각 단어들의 유사도 들이다. 따라서 화자독립모델의 결과를 사용자 적응형 후처리에 적용한 결과 인식기의 오류를 $58.7\%$ 줄일 수 있었다.

  • PDF

SystemC를 이용한 JPEG 인코더/디코더의 구현 (Implementation of JPEG Encoder and Decoder with SystemC)

  • 유명근;송기용
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2006년도 하계 학술대회 논문집
    • /
    • pp.89-92
    • /
    • 2006
  • 본 논문에서는 SystemC를 이용하여 데이터를 압축하는 JPEG의 인코더와 디코더 구현에 대하여 기술한다. SystemC는 SoC의 설계생산성을 높이기 위해 high-level abstraction에 기반하여 시스템을 모델링하고 명시하는 시스템 수준 설계 언어이고, JPEG은 DCT와 Huffman 코드를 이용하여 정지영상 정보를 압축하는 알고리즘이다. 설계된 JPEG 인코더와 디코더 모듈의 동작을 검증하기 위하여 인코더 모듈에 $16{\times}16$ 크기의 픽셀 RGB 데이터를 입력하고, 디코더 모듈에 인코더 모듈의 출력을 입력으로 연결하여 최종 출력되는 데이터를 비교 및 분석하여 확인하였다.

  • PDF

딥러닝을 활용한 저연령층 영어 교육 시스템 (English Education System for Kids using Deep Learning)

  • 김희용;장호택;이수현;이해연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.971-973
    • /
    • 2017
  • 국제화 시대를 맞이하여 세계 공용어인 영어의 중요성이 부각되고 있다. 특히, 영어 교육의 학습 연령대는 점점 낮아지고 있는 추세이며, 이에 동반하여 저 연령층 영어 교육 콘텐츠가 출시되고 있다. 하지만 현재 저 연령층을 대상으로 출시되는 콘텐츠들은 연령에 맞지 않는 교육 자료를 제시하거나 언어 학습에 필요한 상황적 다양성이 부족한 것이 현실이다. 본 논문에서는 딥러닝을 적용하여 사용자가 원하는 상황을 촬영한 영상에서 대상 연령에 적합한 영어 문장을 생성하고 읽어주는 학습 시스템을 제안한다. 본 시스템을 통하여 저 연령층에 적합한 영어 교육 환경을 제공하고, 저 연령층에게 나타나는 영어 교육의 불균형을 해소하고자 한다.

저가의 비전 기반 트래킹 시스템을 이용한 그림 툴 (Drawing Tool with Vision-Based Tracking System)

  • 이주영;허혜정;박미정;이선규;서민영;유주희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제46차 하계학술발표논문집 20권2호
    • /
    • pp.295-296
    • /
    • 2012
  • 그림 툴은 실시간 비디오 영상 스트림과 트래킹 시스템을 통해 사용자의 손가락 움직임의 입력을 받아 가상의 오브젝트들을 그려서 보여주는 툴이다. 핵심개발기술은 병렬처리언어인 CUDA사용하여 개발된 저가의 비전 기반 트래킹 시스템이다. 저가의 트래킹 시스템과 그림툴의 설계, 구현, 앞으로의 발전 방향에 대해 설명한다.

  • PDF

손동작 인식을 통한 Human-Computer Interaction 구현 (Recognition of Hand gesture to Human-Computer Interaction)

  • 이래경;김성신
    • 한국지능시스템학회논문지
    • /
    • 제11권1호
    • /
    • pp.28-32
    • /
    • 2001
  • 인간의 손동작 인식은 오랫동안 언어로서의 역할을 해왔던 통신수단의 한 방법이다. 현대의 사회가 정보화 사회로 진행됨에 따라 보다 빠르고 정확한 의사소통 및 정보의 전달을 필요로 하는 가운데 사람과 컴퓨터간의 상호 연결 혹은 사람의 의사 표현에 있어 기존의 장치들이 가지는 단점을 보안하며 이 부분에 사람의 두 손으로 표현되는 자유로운 몸짓을 이용하려는 연구가 최근에 많이 진행되고 있는 추세이다. 본 논문에선 2차원 입력 영상으로부터 동적인 손동작의 사용 없이 손의 특징을 이용한 새로운 인식 알고리즘을 제안하고, 보다 높은 인식률과 실 시간적 처리를 위해 Radial Basis Function Network 및 부가적인 특징점을 통한 손동작의 인식을 구현하였다. 또한 인식된 손동작의 의미를 바탕으로 인식률 및 손동작 표현의 의미성에 대한 정확도를 판별하기 위해 로봇의 제어에 적용한 실험을 수행하였다.

  • PDF

고속 컬러 좌표계 변환을 위한 병렬 프로그래밍 (Parallel programming for high-speed color space conversion)

  • 최상근;손채봉
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.142-145
    • /
    • 2015
  • YUV 파일을 RGB 형태의 color space 로 변환하는 과정은 엄청난 연산으로 많은 시간이 소요된다. 이런 문제를 다양한 방법을 이용하여 속도 감소율을 확인할 것이다. 처음으로 기본 소스코드의 소요시간을 기준으로 삼기 위하여 최적화와 병렬프로그래밍을 사용하지 않고 프로그램을 설계하였다. 최적화와 병렬프로그래밍 단계를 진행하였을 때 C언어로 구현 된 최적화되기 전과 최종적으로 CUDA 기반의 병렬프로그래밍을 사용한 함수를 비교해보았을 때 속도의 증가율이 575%로 엄청난 속도의 차이를 확인할 수 있다. 이와 같은 기술을 영상을 다루는 모든 분야에서 처리속도가 증가함에 따라 효과적인 작업을 기대해 볼 수 있다.

  • PDF

SMIL을 이용한 e-Catalog의 저작 (Authoring of e-Catalogs Using SMIL)

  • 홍재현;최옥경;강현철;한상용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.171-174
    • /
    • 2001
  • 인터넷의 발전과 전자상거래의 대중화로 인해 시간과 공간의 제약을 받지 않고 상품을 구매하는 고객들이 늘어나고 있다. 이로 인해 상품의 상세한 정보를 고객에게 제공하여 상품에 대한 흥미와 관심을 높일 필요가 있다. 그러나, 현재 대부분의 e-Catalog들은 상품의 정보를 단순한 텍스트나 이미지 중심으로 제공하고 있어서 상품에 대한 상세한 정보를 제공하는 데 한계를 지니고 있고 e-Catalog 저작자 또한 다양한 미디어 데이타를 이용하여 e-Catalog를 저작하기란 쉽지가 않다. 이러한 문제점을 해결하기 위해 기존의 e-Catalog에서 주로 사용되던 텍스트 및 이미지 외에 오디오나 동영상과 같은 동적인 멀티미디어 데이타를 폭넓게 활용하는 e-Catalog 저작 도구가 필요하다. 이를 위해 본 논문에서는 XML의 한 응용 분야인 동기화 멀티미디어 통합 언어 SMIL(Synchronized Multimedia Integration Language)을 이용하여 보다 진보된 e-Catalog를 쉽게 저작할 수 있는 e-Catalog 저작 방법 및 사례에 대해 기술한다.

  • PDF