• 제목/요약/키워드: 영상 언어

검색결과 529건 처리시간 0.026초

퍼지 분류기를 이용한 비전 기반 열차 위치 및 움직임 추정 (Vision-Based Train Position and Movement Estimation Using a Fuzzy Classifier)

  • 송재원;안태기;이대호
    • 디지털융복합연구
    • /
    • 제10권1호
    • /
    • pp.365-369
    • /
    • 2012
  • 본 논문에서는 열차 선로 모니터링을 위한 열차의 위치 및 이동을 추정하는 비전 기반 기법을 제안한다. 퍼지 분류기를 이용하여 열차의 상태를 판별하며, 프레임 차와 배경 감산을 각각 열차의 움직임과 존재를 판결하기 위해서 사용하고, 퍼지 분류기의 언어 변수로 사용된다. 실험 결과에서 제안하는 기법은 열차의 위치와 움직임을 정확히 추정하는 것을 볼 수 있다. 그러므로 제안하는 기법은 군중 밀도를 추정하거나 안전 감시를 수행하는 열차 모니터링 시스템에 활용될 수 있을 것이다.

DMB 데이터 서비스에서의 유아 대상 EDUTAINMENT 어플리케이션 개발 (Development of EDUTAINMENT Application on DMB Data Service)

  • 공신;김효용;박태진;최윤철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.223-228
    • /
    • 2007
  • 근래 주목받는 키워드인 유비쿼터스(Ubiquitous), UCC(User Created Contents) 등은 기술적 발달과 함께한 사람들의 행동 양식 변화를 잘 반영하고 있다. 기술적인 측면에서 모바일 환경으로의 진화는 사람들에게 시공간적 제약을 없애주었으며, '호모 루덴스'로 표현된 유희적 인간의 개념은 현대인의 행동 양식을 잘 표현했다. 이중 지상파 이동 멀티미디어 방송(Digital Multimedia Broadcasting, DMB)은 방송에 있어서 시공간적 제약을 없앤 대표적인 사례이며, 'EDUTAINMENT(에듀테인먼트)'는 교육에 유희를 결합한 실례라고 하겠다. 특히 DMB는 정보와 유희의 욕구를 기본적으로 충족시킬 수 있는 방송이라는 매체를 이용한다는 점에서 에듀테인먼트의 기술적 기반이 될 수 있으며, 이를 통해 저 연령의 학습자에게 유희와 교육을 동시에 제공함으로써, 학습효과를 높일 수 있는 장점이 있다. 본 논문에서는 DMB 시스템을 위한 유아 대상의 에듀테인먼트 어플리케이션을 설계하고, 구현한다. 이 어플리케이션을 위해 스토리텔링, 음악과 악기 선택 시스템, 타임라인 및 자유표면 게임 시스템 등 DMB 시스템에 적절하며, 에듀테인먼트의 조건을 충족하는 몇 가지 방법론을 제안하여 방송을 통해 콘텐츠와 대상자가 서로 상호작용 할 수 있도록 한다. 이를 위해서는 기존 방송의 음성, 영상 서비스를 넘어 상호작용의 필수적인 요소라고 할 수 있는 데이터 서비스를 요구하며, 이는 MPEG-4 Part 11: BIFS(Binary Format for Scenes) 기술을 기반으로 그 구현에는 VRML에 기초한 BT(BIFS Text) 언어를 사용한다.

  • PDF

피지컬 인터페이스의 구현에 관한 연구

  • 오병근
    • 디자인학연구
    • /
    • 제16권2호
    • /
    • pp.131-140
    • /
    • 2003
  • 컴퓨터를 이용한 인터랙션 디자인에 있어서 일반적인 입력방식은 키보드나 마우스를 이용하여 사용자가 모니터를 통해 인터페이스를 조작하는 제한적 형태이다. 그러나 이것은 기존의 전기나 전자의 기초기술을 활용하여 다른 형식의 입력방법을 창작하고 구현하여 인터랙션 디자인의 영역을 넓힐 수 있다. 최근 컴퓨터나 영상매체를 이용한 미디어 예술표현도 다양한 방식으로 제공되는 인터페이스를 사용자가 직접 참여하여 작동해야 예술적 표현이 완성되는 형식이 선보이고 있다. 피지컬 인터페이스를 이용한 인터랙션 디자인도 사용자가 작동하는 인터페이스로부터의 신호를 디지털이나 아날로그 형식으로 구분하고 컴퓨터에 입력하거나 출력하므로써 이를 활용할 수 있다. 이 때 인터페이스의 신호는 컴퓨터가 안전하게 받아들 일 수 있는 형식이 필요하므로 이를 위한 전기적 회로장치 구현이 필요하다. 인터페이스의 형식도 컴퓨터 키보드나 마우스 등의 기존 형태가 아닌 스위치나 센서, 카메라 등을 이용한 또 다른 물리적 형태의 창작물이 되는 것이다. 이러한 형태의 인터랙션 디자인은 인간이 원래부터 사용하는 언어와 몸짓을 이용한 인터랙션의 인간적(Humanity) 풍부함을 부여할 수 있는 디자인이라고 할 수 있다.

  • PDF

딥러닝을 이용한 대규모 한글 폰트 인식 (Large-Scale Hangul Font Recognition Using Deep Learning)

  • 양진혁;곽효빈;김인중
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.8-12
    • /
    • 2017
  • 본 연구에서는 딥러닝을 이용해 3300종에 이르는 다양한 한글 폰트를 인식하였다. 폰트는 디자인 분야에 있어서 필수적인 요소이며 문화적으로도 중요하다. 한글은 영어권 언어에 비해 훨씬 많은 문자를 포함하고 있기 때문에 한글 폰트 인식은 영어권 폰트 인식보다 어렵다. 본 연구에서는 최근 다양한 영상 인식 분야에서 좋은 성능을 보이고 있는 CNN을 이용해 한글 폰트 인식을 수행하였다. 과거에 이루어진 대부분의 폰트 인식 연구에서는 불과 수 십 종의 폰트 만을 대상으로 하였다. 최근에 이르러서야 2000종 이상의 대용량 폰트 인식에 대한 연구결과가 발표되었으나, 이들은 주로 문자의 수가 적은 영어권 문자들을 대상으로 하고 있다. 본 연구에서는 CNN을 이용해 3300종에 이르는 다양한 한글 폰트를 인식하였다. 많은 수의 폰트를 인식하기 위해 두 가지 구조의 CNN을 이용해 폰트인식기를 구성하고, 실험을 통해 이들을 비교 평가하였다. 특히, 본 연구에서는 3300종의 한글 폰트를 효과적으로 인식하면서도 학습 시간과 파라미터의 수를 줄이고 구조를 단순화하는 방향으로 모델을 개선하였다. 제안하는 모델은 3300종의 한글 폰트에 대하여 상위 1위 인식률 94.55%, 상위 5위 인식률 99.91%의 성능을 보였다.

  • PDF

파이선 스크립트를 이용한 태양계 행성 시뮬레이터 구현 (Implementing Solar System Simulator using Python Script)

  • 최은영;이임건
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권4호
    • /
    • pp.49-56
    • /
    • 2015
  • 본 논문에서는 3D 애니메이션 도구인 마야를 이용하여 태양계를 모델링하고 각 행성의 움직임과 물리적인 속성들을 정밀하고 객관적으로 구현하여 태양계의 구조를 시각적으로 쉽게 이해할 수 있도록 시뮬레이터를 구현하였다. 메뉴를 이용한 마야의 모델링으로는 정밀한 물리적 속성 값을 표현하기 어려우므로 파이선 스크립트를 이용하여 각 행성의 특성을 표현하였다. 제안하는 시뮬레이터는 가상현실 분야나 학생들의 교육 자료로서 사용 가능하도록 모델링과 렌더링을 실사와 동일하게 구현하였다. 또한 마야 애니메이션에서의 메뉴를 이용한 모델링과 스크립트 언어인 파이선을 활용하여 누구라도 쉽게 실사 영상을 볼 수 있도록 하였다.

이 러닝 콘텐츠에 효과적인 컴퓨터 프로그램 시각화 방안에 대한 연구 (A Study on a Computer Program Visualization Method Effective for the e-Learning Contents)

  • 하상호
    • 공학교육연구
    • /
    • 제10권3호
    • /
    • pp.109-124
    • /
    • 2007
  • 인터넷과 컴퓨팅 기술의 진보와 함께 사이버 공간에서 효과적인 학습을 위한 이 러닝(e-learning)에 대한 관심이 국, 내외적으로 매우 높다. 그러나 오늘날 대부분의 이 러닝 컨텐츠는 주로 텍스트 위주이며, 이미지, 동영상, 음성 등과 같은 간단한 수준의 멀티미디어 요소가 추가되는 정도의 수준에 불과하다. 본 논문에서는 컴퓨터 프로그래밍 이 러닝에 효과적인 방법을 제안한다. 제안된 방법은 순서도를 이용한 프로그램 시각화에 기반한다. 제안된 방법의 특징은 문장 수준 단위의 단계적, 계층적 프로그램 시각화, 언어의 제어 구조에 대한 순서도 기반 시각화, 프로그램 전체 구조로의 시각화 범위 확대, 소스 프로그램 대비 시각화, 학습자와의 상호작용 등을 들 수 있다. 마지막으로, 제안된 방법을 실현하는 시스템을 구현하고, 예제 프로그램에 대해서 그 실행 예를 보인다.

실시간 이차원 웨이블릿 변환의 FPGA 구현을 위한 효율적인 메모리 사상 (The Efficient Memory Mapping of FPGA Implementation for Real-Time 2-D Discrete Wavelet Transform)

  • 김왕현;서영호;김종현;김동욱
    • 한국통신학회논문지
    • /
    • 제26권8B호
    • /
    • pp.1119-1128
    • /
    • 2001
  • 본 논문에서는 이차원(2-D) 이산 웨이블릿 면환(Discrete Wavelet Transform, DWT)을 이용한 연상압축기를 FPGA 칩에서 실시간으로 동작 가능하도록 하는 효율적인 메모리 스케줄링 방법(E$^2$M$^2$)을 제안하였다. S/W적으로 위의 메모리 사상 방법을 검증한 후, 실제로 상용화된 SFRAM을 선정하여 메모리 제어기를 구현하였다. 본 논문에서는 Mallet-tree를 이용한 2-D DWT 영상압축 칩을 구현할 경우를 가정하였다. 이 알고리즘은 연산 과정에서 많은 데이터를 정장하여야 하는데, FPGA는 많은 데이터를 저장할 수 있는 메모리가 내장되어 있지 않으므로 외부 메모리를 사용하여야 한다. 외부메모리는 열(row)에 대해서만 연속(burst) 읽기, 쓰기 동작이 가능하기 때문에 Mallet-tree 알고리즘의 데이터 입출력을 그대로 적용할 경우 실시간 동작을 수행하는 DWT 압축 칩을 구현할 수 없다. 본 논문에서는 데이터 쓰기를 수행할 경우에는 메모리 셀(cell)의 수직 방향을 저장시키고 읽기를 수행할 때는 수평으로 데이터의 연속 읽기를 수행함으로써 필터가 항상 수평 방향에 위치하게 하는 방법을 제안하였다. 입방법을 C-언어로 DWT 커넬(Kernel)과 메모리의 에뮬레이터(emulator)를 구현하여 실험한 결과, Mallat-tree 이론을 그대로 적용시켰을 때와 동일한 필터링을 수행할 수 있음을 검증하였다. 또한, 상용화된 SDRAM의 메모리 제어기를 H/W로 구현하여 시뮬레이션 함으로써 본 논문에서 제안한 방법이 실제적인 하드웨어로 실시간 동작을 할 수 있음을 보였다.

  • PDF

H.264/AVC용 CAVLC 디코더의 구현 연구 (a study on an Implementation of CAVLC Decoder for H.264/AVC)

  • 봉재훈;김원삼;손승일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.552-555
    • /
    • 2007
  • 지상파 DMB등에서 많이 사용하고 있는 기술은 H.264이다. 이 H.264는 적은 비트율에 비하여 고해상도의 영상을 만들어 낸다. 이런 손실압축을 하기 위해서 인트라와 인터등과 같은 전처리 과정과 DCT(Discrete Cosine Transform), 양자화 등등이 존재하지만 H.264에서 실제로 압축이 되는 부분은 엔트로피코딩이다. H.264에서는 Exp-Golomb과 CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding) 세 가지를 지원하고 있다. 이중 CAVLC는 테이블을 기반으로한 압축기법을 사용한다. 테이블을 이용할 때는 코드워드의 길이와 값을 비교하는 방식을 사용하게 된다. 이는 수 많은 메모리 접속으로 인한 전력소모와 연산지연을 가져온다. 본 논문에서는 전송된 비트스트림에서 데이터를 찾을 때 코드워드의 길이와 값을 테이블에 비교해서 찾지 않고 테이블에 존재하는 규칙을 수식화 하여 찾을 수 있도록 하였다. 이는 최초 '1'이 나올때까지의 '0'의 개수와 그 이후 존재하는 코드의 값을 이용하여서 각 단계에 필요한 데이터를 추출해 낸다. 위와 같은 알고리즘을 이용하여 VHDL언어로 설계하였다.

  • PDF

SIFT의 descriptor를 위한 sin/cos 프로세서의 구현 (Implementation of sin/cos Processor for Descriptor on SIFT)

  • 김영진;이현수
    • 한국콘텐츠학회논문지
    • /
    • 제13권4호
    • /
    • pp.44-52
    • /
    • 2013
  • SIFT(Scale Invariant Feature Transform) 알고리즘은 현재 비디오 감시카메라, 자율 주행시스템 등과 같은 영상 시스템에서 많이 사용되고 있다. SIFT 알고리즘에서 연산량과 연산시간이 가장 많이 필요한 부분이 descriptor의 sin/cos 함수를 연산하는 부분이다. 그러므로 본 논문에서는 SIFT 알고리즘에 사용되는 descriptor를 위한 sin/cos 함수를 하드웨어로 구현하였다. Verilog-HDL 언어를 사용하여 FPGA로 구현하고 그 성능을 분석한다. Xilinx Spartan 2E(XC2S200E-PQ208-6) 를 사용하여 구현하였을때, 149 Slices에 233 LUTs가 소모되었으며, 최대 주파수는 60.01MHz로 동작하였다. 또한 descriptor에 적용하여 소프트웨어와 비교 하였을 때 40배 정도의 빠른 성능 향상을 얻었다.

교육용 컨텐츠 저작 시스템의 설계 및 구현 (Design and Implementation of the Education Content Producing System)

  • 류경숙;이혜정;정석태;정성태;이용주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.219-222
    • /
    • 2003
  • SMIL을 이용하여 텍스트, 이미지, 음성, 영상, 애니메이션 등의 다양한 멀티미디어 클립들을 시간적/공간적으로 자유롭게 배치하고, 다양한 멀티미디어 프리젠테이션을 구성할 수 있는 교육용 컨텐츠를 구현할 수 있다. 하지만, SMIL은 HTML이나 XML과 같이 태그를 사용하므로 이를 구현하기 위해서는 텍스트 입력이 가능한 메모장이나 워드프로세서 등을 사용하여 문서를 작성해야하기 때문에 그에 따른 각각의 태그와 속성을 모두 암기해야만 효율적인 컨텐츠를 제작할 수 있다. 그러므로 사용자 입장에서는 시간적인 면에서, 또는 비용면에서 비효율적인 방식이다. 본 논문에서는 멀티미디어 동기화 언어인 SMIL을 기반으로 한 교육용 멀티미디어 컨텐츠 및 멀티미디어 데이터를 누구나 손쉽게 제작하고 처리할 수 있도록 SMIL을 기반으로 하는 교육용 컨텐츠 저작 시스템을 개발하여 컨텐츠를 제작하는 사용자들의 번거로움과 불편함을 없애고 효율성을 높일 수 있게 하였다.

  • PDF