• 제목/요약/키워드: 영상 언어

검색결과 529건 처리시간 0.026초

텍스쳐 특징과 구조적인 정보를 이용한 문서 영상의 분할 및 분류 (Document Image Segmentation and Classification using Texture Features and Structural Information)

  • 박근혜;김보람;김욱현
    • 융합신호처리학회논문지
    • /
    • 제11권3호
    • /
    • pp.215-220
    • /
    • 2010
  • 본 논문은 문서 영상을 대상으로 표, 그림, 글자 등의 각 구성요소들을 자동으로 분류하기 위한 새로운 텍스쳐 기반의 영상 분할 및 분류 방법을 제안한다. 제안한 방법은 문서 영상 분할 단계와 문서 영상 내 구성요소 분류 단계로 이루어진다. 먼저 영상 분할을 수행한 후, 분할된 영역을 대상으로 문서 영상의 구성 요소들을 분류하는데, 이때 각 구성 요소는 서로 다른 텍스쳐를 가지고 있는 영역이라는 특징을 이용한다. 분할된 영역들을 분류하기 위한 텍스쳐 특징을 추출하기 위해 다양한 텍스쳐 분석에 광범위하게 사용되는 2차원 가보필터를 이용한다. 제안한 방법은 구성 요소와 사용 언어에 대한 사전 지식을 이용하지 않으면서 문서 영상의 분할 및 구성요소 분류에서 좋은 성능을 보인다. 제안한 방법은 멀티미디어 데이터 검색, 실시간 영상 처리 등과 같은 다양한 분야에 적용 될 수 있다.

하드매트(Hard Matte) 영상 기법에 관한 연구 (A Study of Images on the Hard matte Skill)

  • 김인철
    • 디자인학연구
    • /
    • 제12권4호
    • /
    • pp.23-32
    • /
    • 1999
  • 하드매트는 영화의 표현에 있어서 대형화면을 열망하던 초창기 영화 감독들의 희망을 반영한 장치였다. 그러나 이러한 희망이 실현되면서 하드매트 방식은 영상 내용을 규정짓는 또 다른 장치로 변모되어 오늘에 이르고 있다. 즉 하드매트는 하나의 띠처럼 이루어져 영화의 시작 부분에서 관객의 시선을 새롭게 유도하는 기능을 하고 있다. 이러한 기능은 영화의 끝 부분에서는 시작과는 다른 기능을 하지만 영상에서 하드매트는 색다르면서도 인상적인 기법으로 계속 사용되고 있다. 적지 않은 감독들이 영상의 내용을 규정하면서 한편으로, 관객들에게 은유의 방법으로써 하드매트를 보여주고 있으며 이러한 방식은 이른바 HDTV 방식이 개발되면서 레터박스 스타일로 이어지고 있다. 요즈음 들어서는 젊은 층을 겨냥한 뮤직 비디오에서 하드매트 방식이 보여짐에 따라 하나의 유행이 되다시피 하고 있다. CF들 중에서도 여러 작품에서 하드매트 방식을 볼 수 있는데 이것은 뮤직 비디오 등으로 하드매트에 익숙해진 젊은이들에게 적극 어필되고 있다. 비록 하드매트가 영화 초기 기술적 실험의 하나로 이루어진 방법이었지만 현대에 이르러 영상 내용을 규정하게 되는 중요한 사례로 볼 수 있다. 내용이 형식을 주로 규정해온 시각 문화 양상과 구별되는 중요한 기법인 셈이다. 그렇지만 하드매트가 보여주는 일시적인 시각적 장점에만 의존하여 영상을 옆으로 늘어나게 하거나, 외국 영화의 크레딧에서 하드매트를 쓰는 까닭에 아무런 의도도 없이 모방만 한다면 문제가 될 수 있다. 이런 관점에서 형식이 이루어낸 영상 내용 규정이라는 영상 언어를 통하여 우리 나라 영상의 발전을 모색해 본다.

  • PDF

서버기반 모바일 다국어 명함인식 시스템 (Server based Mobile Multi-lingual Recognition System of Name-card)

  • 장동협;이재홍;김성학
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권4호
    • /
    • pp.155-162
    • /
    • 2014
  • 본 연구에서는 문자인식기술의 활용도를 높이고 인식률을 높이기 위해 스마트폰을 문자영상의 입력, 인식결과의 디스플레이, 영상전송을 위한 단말기로만 활용하고 서버에서 문자인식을 처리하도록 하는 서버기반 모바일 다국어 명함인식 시스템을 개발하였다. 인식 시스템에서는 스마트폰에서 촬영된 영상의 효율적인 처리와 전송을 위해, 왜곡보정과 잡음제거 등을 수행하였고, 인식서버와의 효율적인 영상전송을 위한 소켓기반 프로토콜을 정의하였다. 5개 언어의 명함들에 대한 다양한 실험을 통해 개발된 시스템이 기존 스마트폰 기반 문자인식기에 비해 향상된 인식률과 인식속도를 보였다.

의사결정 트리를 이용한 한글 자막 추출 (Korean Caption Extraction with Decision Tree)

  • 정제희;이승훈;김재광;이지형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.527-532
    • /
    • 2008
  • 자막은 영상과 관련이 있는 정보를 포함한다. 이러한 영상의 정보를 이용하기 위해서 자막을 추출하는 연구가 진행되고 있다. 기존의 자막 추출 연구는 언어 독립적인 특징으로 자막을 이루는 획의 에지는 일정한 간격을 유지하거나 수평라인으로 존재하는 글자의 분포를 이용한 방법을 제안하였다. 이러한 방법들은 획의 간격이 일정한 자막이나 하나의 글자가 하나의 획으로 이루어진 글자에서만 정상적인 동작을 보장하였다. 본 논문에서는 한글 자막 특징을 고려한 자막 추출 방법을 제안한다. 먼저, 한글 자막의 특징인 가로 획의 다수 분포를 고려한 적응형 에지 이진화를 수행하여 에지 영상을 생성하고 에지 연결 객체를 생성한다. 그 후에 생성한 연결 객체를 특징을 추출하여 사전에 생성한 의사결정 트리로 연결 객체를 자막과 비자막 연결객체로 분류한다. 의사결정 트리를 생성하기 위해서 사용한 연결 객체는 뉴스, 다큐멘터리 프로그램에서 획득하였으며, 성능 평가를 위해서 뉴스, 다큐멘터리, 스포츠 프로그램과 같은 대중 방송에서 획득한 영상에서 자막을 추출하였다. 평가 방법은 찾아진 연결 객체 중에 자막 연결 객체의 비율과 전체 자막 중에서 찾아진 자막 연결 객체의 비율로 분석하였다. 실험 결과에서는 제안한 방법이 한글 자막의 추출에 적용 가능함을 보여준다.

  • PDF

DSP와 FPGA의 Co-design을 이용한 원격측정용 임베디드 JPEG2000 시스템구현 (A Co-design Method for JPEG2000 Video Compression System in Telemetry using DSP and FPGA)

  • 유제택;현명한;남주훈
    • 한국항공우주학회지
    • /
    • 제39권9호
    • /
    • pp.896-903
    • /
    • 2011
  • 본 논문에서는 차세대 영상 압축 표준으로 주목받고 있는 JPEG2000 알고리즘을 유도탄 원격측정용 영상압축모듈 임베디드 시스템(embedded system)에서 효율적으로 구현하기 위한 DSP와 FPGA co-design 방법을 제안한다. DSP와 함께 FPGA에서 co-processing할 부분은 JPEG2000 알고리즘 가운데서 계산량이 많으면서도 FPGA 상에 구현하기 적합한 알고리즘인 MQ-코더 부분을 소프트웨어 profiling 작업을 거쳐 선정하였고 VHDL 언어를 사용해서 병렬 처리에 적합하도록 설계하였다. 구현한 MQ-코더의 성능을 검증하기 위하여 JBIG2 표준 테스트 벡터 및 실제 영상을 사용하였다. 실험결과 본 논문에서 제안한 MQ-코더는 기존 소프트웨어 코더보다 약 3배 정도의 압축속도를 향상 시켰다.

Randomwalk 이론을 이용한 Web 기반 동영상 프로그램의 개발 (Development of Web-Based Simulation Program Using the Randomwalk Theory)

  • 김성근;김주래;우규환
    • 대한화학회지
    • /
    • 제43권4호
    • /
    • pp.469-474
    • /
    • 1999
  • 본 연구에서는 Randomwalk 이론을 이용하여 동영상 프로그램을 개발하였다. 보통 화학 교과는 원자, 분자와 같은 입자의 행동을 이해하는데 어려움이 많아 이에 관한 학생들의 오개념이 많이 나타나고 있다. Randomwalk 이론을 도입한 동영상으로 분자 운동을 표현한 본 프로그램은 실제 분자 운동의 과정을 제대로 이해하는데 도움을 줄 것이다. 본 연구에서는 특히 JAVA 언어를 사용하여 Web 상에 프로그램을 구현함으로써 누구나 쉽게 이용할 수 있게 하였다. 이들 프로그램은 두가지의 프로그램으로 짜여져 있다. 하나는'Diffusion' 프로그램이며, 입자의 확산 과정을 실제와 같이 동영상으로 구현되도록 하였다. 또 다른 하나는 'Randomwalk' 프로그램으로 입자의 운동 과정에 대한 궤적을 표현함으로써 분자 운동에 대한 분명한 이해를 가능하게 하였다.

  • PDF

웹 상에서 통계적 에지검출기 개발 및 구현 (Development and Implementation of Statistical Edge Detectors on the Web)

  • 임동훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.133-141
    • /
    • 2005
  • 웹 영상에서 에지는 픽셀의 밝기가 급격하게 변화되는 부분으로 에지를 통하여 물체의 위치나 크기, 물체의 텍스처에 대한 정보를 얻을 수 있다. 지금까지 에지 검출은 주로 단순한 영상에 대해 미분 연산자를 이용한 수학적 방법에 의해 이루어져왔고 최근에 잡음이 포함된 복잡한 영상에 대해 통계적 방법을 이용한 에지검출에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 영상실험을 통하여 기존의 Sobel 연산자 등을 이용한 수학적 방법과 Canny 방법, Wavelet 변환방법 그리고 통계적인 T 검정과 Wilcoxon 검정을 이용한 방법들과의 에지검출 성능을 비교분석하고 Java 언어를 사용하여 웹 상에서 구현한다.

  • PDF

숏폼(Shortform) 동영상 기반 브랜드의 전략적 경험 디자인 - 李子柒(이자칠)의 미식(美食) 동영상을 중심으로 - (Strategic Experience Design of Shortform Video-based Brand - Focused on LIZIQI's Food Videos -)

  • 최여여;김영재
    • 한국콘텐츠학회논문지
    • /
    • 제20권7호
    • /
    • pp.185-194
    • /
    • 2020
  • 본 연구는 숏폼 동영상 기반의 브랜딩에 있어서 브랜드가 소비자들에게 제공하는 전략적 경험 디자인 요소를 사례를 통해 확인하였다. 숏폼 동영상 기반 브랜드의 감각, 감성, 인지, 행동, 관계 경험은 크리에이터가 차별화된 개성을 소셜 미디어 채널을 통해 표현하고 소비자들과 소통하고 상호작용하는 과정에서 구체화된 경험 요소들의 수행으로 제공된다. 李子柒(이자칠)의 미식 동영상은 동방미식생활가(東方美食生活家)로서의 브랜드 정체성을 동영상 속 음식의 시청각적 자극, 시각·언어적 아이덴티티와 제품 외관의 결합을 통한 인지적 강화, 전자매체에 의한 행동적 참여 유도를 통해 소비자들에게 제공하였다. 또한, 인적 요소를 활용한 정서적 유대감과 공동 브랜딩을 통한 책임감 공유로 감성, 관계 경험을 제공함으로써 강력한 브랜드 관계를 구축하였다. 이는 다양한 숏폼 동영상 콘텐츠 기반의 브랜딩 사례로 확장하여 전략적 브랜드 경험 디자인 요소들을 통한 브랜드 구축 전략에 유용한 접근 방법을 제시한다고 할 수 있을 것이다.

CT와 MRI 영상을 이용한 간담도계 간접볼륨렌더링 (Indirect Volume Rendering of Hepatobiliary System from CT and MRI Images)

  • 진계환;이태수
    • 한국방사선학회논문지
    • /
    • 제1권2호
    • /
    • pp.23-30
    • /
    • 2007
  • 본 논문에서는 CT(Computed Tomography)와 MRI(Magnetic Resonance Imaging)을 이용하여 획득한 2차원의 복부영상을 영역분할, 문턱치법 등의 전처리과정을 거쳐 3차원영상을 생성하는 방법을 제시함으로써 가상내시경(Virtual Endoscopy)에 응용하고자 한다. 3차원영상 가시화 방법으로는 개인용 컴퓨터에서 이용되는 범용의 그래픽가속기를 이용하여 빠른 속도로 렌더링을 할 수 있는 장점을 가지는 표면볼륨기법을 이용하였다. 여기에 이용한 알고리즘은 계산량이적은 Marching Cubes 이다. 그리고 워크스테션이나 전용의 프로그램이 없더라도 웹 브라우저 상에서 실행되는 가상현실모델링언어(VRML, Virtual Reality Modeling Language)양식의 3차원 영상을 생성하는 방법을 제시한다. CT의 3차원 영상 파일의 노드 수와 삼각형 수 및 크기는 각각 85,367, 174,150, 10,124이었고, MRI의 3차원 영상 파일의 노드 수와 삼각형 수 및 크기는 각각 34,029, 67,824, 3,804이었다.

  • PDF

DSP(Digital signal proccesor)를 이용한 산업현장에서의 안전모 미착용 인식 기술 (Recognizing that a person doesn't put on a safety cap using DSP.)

  • 이용욱;송강석;정무일;임철후;문성모
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.530-533
    • /
    • 2009
  • 본 연구는 DSP(Digital signal processor)상에서 영상 처리 기술을 이용한 안전모 미착용 인식 기술을 개발한다. 이는 산업 현장에 배치된 영상 입력 장치를 통해 입력된 영상을 영상 처리하고, 안전모를 미착용한 사람이 발견될 경우 감독관에게 해당 인식 결과를 전송하여 조치를 취함으로써 만약의 사고 발생시 안전모를 착용하지 아니하여 발생할 수 있는 추가적인 인명피해를 미연에 방지한다. 안전모 미착용을 인식하기 위해서는 입력된 영상에서의 오브젝트 추출, 노이즈 제거, 사람/사물 판단, 머리 영역 추출, HSV 색공간을 이용한 안전모 착용 유/무 판단 등의 과정을 거친다. 영상입력 및 영상처리는 DSP를 이용해 처리하고 알고리즘의 속도 개선을 위하여 C언어 기반의 코드를 DSP가 제공하는 고유 함수(Intrinsics)들을 이용하여 최적화 한다.

  • PDF