Search | Korea Science

Video Caption Extraction and Image Enhancement (비디오 자막 추출 및 이미지 향상에 관한 연구)

김소명;최영우;정규식
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.10b
- /
- pp.359-361
- /
- 2000
본 논문에서는 비디오 자막 이미지를 인식하기 위해 필요한 영상 향상의 단계로서 다중 결합을 적용한다. 또한 다중 결합을 위한 동일한 자막의 판단 및 결합된 결과를 재평가하기 위한 방법을 제안한다. 입력된 칼라 이미지로부터 RLS(Run Length Smearing)가 적용된 에지 이미지를 얻고, 수직 및 수평 히스토그램 분포를 이용하여 자막과 자막 영역에 대한 정보를 추출한다. 프레임 내의 자막 영역의 중첩 정도를 이용하여 동일 자막을 판단하고, 동일한 자막을 갖는 프레임들끼리 다중 결합을 수행함으로써 향상된 이미지를 얻는다. 끝으로 결합된 영상에 대한 평가를 수행하여 잘못 결합된 이미지들로 인한 오류를 해결하고 재평가한다. 제안한 방법을 통해, 배경 부분의 잡영이 완화된 자막 이미지를 추출하여 인식의 정확성과 신뢰성을 높일 수 있었다. 또한 동일한 자막의 시작 프레임과 끝 프레임의 위치 파악은 디지털 비디오의 색인 및 검색에 효과적으로 이용될 수 있을 것이다.
PDF

A Comparative Analysis of Deep Learning Frameworks for Image Learning (이미지 학습을 위한 딥러닝 프레임워크 비교분석)

jong-min Kim;Dong-Hwi Lee
- Convergence Security Journal
- /
- v.22 no.4
- /
- pp.129-133
- /
- 2022
Deep learning frameworks are still evolving, and there are various frameworks. Typical deep learning frameworks include TensorFlow, PyTorch, and Keras. The Deepram framework utilizes optimization models in image classification through image learning. In this paper, we use the TensorFlow and PyTorch frameworks, which are most widely used in the deep learning image recognition field, to proceed with image learning, and compare and analyze the results derived in this process to know the optimized framework. was made.
https://doi.org/10.33778/kcsa.2022.22.4.129 인용 PDF KSCI

The Interlock Techniques of A Digital Image Frame n:m Server based on Embedded Linux Utilizing Multi Agent (멀티 에이젼트를 이용한 임베디드 리눅스 기반의 디지털 이미지 프레임 n:m 서버 연동기법)

Jung, Ku-Hak;Kim, Hong-Kyu;Koo, Young-Wan
- Proceedings of the Korean Information Science Society Conference
- /
- 2006.10d
- /
- pp.808-811
- /
- 2006
디지털 액자 또는 디지털 앨범은 여러장의 디지털 이미지를 저장 장치에 저장하여 LCD를 통해 디지털 이미지를 감상할 수 있는 임베디드 장치로 저장 장치에 기록되어 있는 이미지나 네트워크와 통신이 된다면 이미지 서버와 1:1 통신으로 지정된 이미지를 다운받을 수 있다. 이러한 1:1 통신의 이미지 다운로드 방법은 액자에서 액자로 이미지를 전송하거나 다운받을 수 없으므로 원격지의 디지털 액자로 자신이 원하는 이미지를 전송할 수 없는 불편함이 있다. 이에 본 논문에서는 자신의 디지털 액자에서 원격지의 디지털 액자 또는 원격지의 디지털 액자에서 자신의 디지털 액자로 선택한 이미지, 또는 전송받는 이미지를 송수신 할 수 있는 디지털 전자액자의 n:m 연동 방법을 제안한다. 본 논문에서 제안한 방법은 범용 이미지 서버와 디지털 전자액자에 에이젼트를 사용하여 디지털 전자액자와 원격지 디지털 전자액자의 이미지 공유가 가능할 수 있다.
PDF

A Hierarchical Static/Dynamic Mosaicing (계층형 정적/동적 모자이크)

신성윤;고경철;이양원
- Proceedings of the Korea Multimedia Society Conference
- /
- 2001.11a
- /
- pp.282-285
- /
- 2001
이미지 모자이크 시스템이란 이미지 내의 객체나 배경을 하나의 이미지 크기에 전체적으로 표현할 수 없거나 부분적으로 보이지 않는 영역을 갖는 일련의 여러 이미지와 동영상의 프레임 이미지를 하나로 정합하여 확장된 이미지를 나타내는 시스템이다. 본 논문에서는 보다 효율적인 검색과 표현을 위하여 트리 형태의 계층형 이미지 모자이크 시스템을 구축하는 방법을 제시하며, 정적인 이미지 모자이크와 동적 이미지 모자이크를 모두 구축하는 방법에 대해서 제시한다.
PDF

Online Game: Its Time-Space Frame and Realities (온라인게임: 정보통신기술이 매개하는 시-공간 프레임과 실재성)

Kim, Ji Yeon
- Journal of Science and Technology Studies
- /
- v.12 no.1
- /
- pp.79-106
- /
- 2012
The paper discusses the issue of reality related to interaction between users and electronic figures that mediate by online game system. MMORPG(Massively Multiple Online Role Playing Game) has been known as virtual world that physically and electronically interconnect users and mechanical elements over huge area. Already game items have became a kind of reality for some users long time ago. How these figures could have been regarded as realities? It suggests to take place the temporality of practice around game world. Tremendous practices of human and machines produce their relations and these relations are reinforced self-referentialy. They could constitute their time-space frame that be situated a figure as the something in it.
PDF

A Method for Lecture Video Browsing by Extracting Presentation Slides (강의 동영상에서 슬라이드 추출을 통한 동영상 브라우징 기법)

Kim, Tak-Eun;Lim, Seon-Kyu;Kim, Myoung-Ho
- Proceedings of the Korean Information Science Society Conference
- /
- 2011.06c
- /
- pp.119-122
- /
- 2011
동영상 플레이어에서 제공되는 브라우징 기법은 동영상의 주요 장면을 이미지로 보여줌으로써, 사용자가 주요 장면에 쉽게 접근할 수 있도록 해준다. 강의 동영상은 일반 동영상과는 달리 매우 정적이므로, 기존 동영상 브라우징 기법은 강의 동영상에 적용하기에 알맞지 않다. 본 연구에서는 강의 동영상에 주로 슬라이드가 함께 나온다는 점에 착안하여, 영상에서 슬라이드 이미지를 추출하여 이를 대표 프레임으로 지정하는 방법에 대해 연구하고, 브라우징 인터페이스를 구현하였다. 슬라이드 이미지가 대표 프레임으로 사용되므로 학습자는 대표 프레임들만을 보고 동영상을 시청하지 않고도 원하는 정보를 신속하고 정확하게 찾을 수 있다.

A Study on Multiple Target Tracking Using Adaptive Neural Network and Mosaic Background Extraction (모자이크 배경이미지 추출과 적응적 신경망을 이용한 다중 보행자 추적 시스템에 관한 연구)

서창진;양황규
- Journal of the Korea Institute of Information and Communication Engineering
- /
- v.7 no.8
- /
- pp.1802-1808
- /
- 2003
In this paper, we propose a method about the extraction of the pedestrian tracking trajectory in the road and we used the method of mosaic background extraction and adaptive neural network for automatic pedestrian tracking system. We used mosaic background extraction to overcome ghost phenomenon. And we detected pedestrian using differential image analysis. We used adaptive neural network for multiple pedestrian tracking that nonrigid form moving. The ART2 network is capable of detecting the masscenters of moving objects within one frame. The history of neurons positions in the sequential frames approximates the traces of the targets. The experiments done with the network in simulated environment show promising results.
PDF KSCI

High Resolution Video Synthesis with a Hybrid Camera (하이브리드 카메라를 이용한 고해상도 비디오 합성)

Kim, Jong-Won;Kyung, Min-Ho
- Journal of the Korea Computer Graphics Society
- /
- v.13 no.4
- /
- pp.7-12
- /
- 2007
With the advent of digital cinema, more and more movies are digitally produced, distributed via digital medium such as hard drives and network, and finally projected using a digital projector. However, digital cameras capable of shotting at 2K or higher resolution for digital cinema are still very expensive and bulky, which impedes rapid transition to digital production. As a low-cost solution for acquiring high resolution digital videos, we propose a hybrid camera consisting of a low-resolution CCD for capturing videos and a high-resolution CCD for capturing still images at regular intervals. From the output of the hybrid camera, we can synthesize high-resolution videos by software as follows: for each frame, 1. find pixel correspondences from the current frame to the previous and subsequent keyframes associated with high resolution still images, 2. synthesize a high-resolution image for the current frame by copying the image blocks associated with the corresponding pixels from the high-resolution keyframe images, and 3. complete the synthesis by filling holes in the synthesized image. This framework can be extended to making NPR video effects and capturing HDR videos.
PDF

Region Detection Using the Feature Point Extraction from Medical Image (의료영상에서 특징점 추출을 이용한 영역추출)

김엄준;성미영
- Proceedings of the Korean Information Science Society Conference
- /
- 1998.10c
- /
- pp.429-431
- /
- 1998
본 논문에서는 의료 영상 중에서 성대 운동의 불규칙적인 움직임을 판단하여 자동으로 진단 파라미터를 구하는 비디오스트로보키모그래피(Videostrobokymography) 시스템에서 관심 영역을 추출하는 방법을 소개하고자 한다. CCD카메라에 의해 촬영된 영상은 비디오 테이프에 저장된 후 이미지 캡쳐 보드에서 그레이 이미지(gray-level)로 변환되어 저장된다. 입력된 영상은 움직이는 영상을 촬영한 것이므로 관심 영역의 위치가 각 프레임마다 다르다. 또한 실제로 입력된 성대영상들이 점진적인 농도 변화를 보이기 때문에 에지에 의해 영역을 추출하는 일반적인 영역 추출방법은 사용하기 어렵다. 본 논문에서는 두 번의 단계를 통하여 관심 영역을 추출하고 있다. 첫 번째는 입력된 영상에서 노이즈를 제거한 후 각 프레임에서 영상의 최소 에너지를 구한다. 두 번째로 농도 변화 값을 특징 값으로 이용하는 분할-합병 알고리즘(Split-merge Algorithm)을 적용하여 관심 영역을 추출하였다. 제안한 알고리즘을 19명의 성대 영상에 적용하여 분석한 결과 성대의 관심 영역을 추출할 수 있었다. 그리고, 영상의 에너지 값을 이용하는 스네이크 알고리즘(Snake Algorithm)에 적용하여 비교해본 결과 본 연구에서 제안하는 스네이크 알고리즘보다 좋은 성능을 보임을 확인할 수 있었다. 본 연구에서 제안하는 관심 영역 추출 방법은 동적인 변화를 보이는 영상에서 관심 영역을 추출할 수 있을 뿐 아니라 계산 량이 적어 200x280크기의 이미지를 초당 약 40프레임에 대한 관심 영역을 추출할 수 있는 장점이 있다.
PDF

Distance Learning and Re-Ranking based Broadcasting Contents Tagging with Blog Postings (거리 학습과 재서열화를 이용한 방송 콘텐츠에 대한 블로그 포스팅 태깅)

Son, Jeong-Woo;Kim, Sun-Joong;Kim, Hwa-Suk;Cho, Keeseong
- Proceedings of the Korea Information Processing Society Conference
- /
- 2014.11a
- /
- pp.882-885
- /
- 2014
이미지 혹은 영상에 대한 자동 태깅은 해당 콘텐츠에 대한 추가적인 정보를 자동으로 시스템에 제공하는 기술로써 영상 인식, 콘텐츠 매시업, 정보 검색 등 다양한 기술/서비스 분야에서 여러 목적으로 활용되고 있다. 특히, 방송 콘텐츠는 많은 양의 정보를 제한된 영역 및 시간에 축약하여 담고 있기 때문에 영상 처리 기술을 통한 객체 인식이나, 콘텐츠 매시업, 추천 서비스 등의 성능 향상을 위해 자동 혹은 수동 태깅을 통한 정보 제공이 요구된다. 본 논문에서는 블로그를 이용한 프레임 단위의 방송 콘텐츠 태깅 기술을 제안한다. 제안하는 기술은 기존의 콘텐츠 단위의 정보 제공이나, 수동 태깅 된 정보를 제공하는 기술들과 달리, 영상의 각 프레임에 대한 자동 태깅을 목표로 한다. 제안하는 방법은 거리 학습을 통해 영상의 각 프레임이 가지는 특성을 고려한 모델을 구축한 후, 이를 토대로 영상의 프레임들과 블로그의 이미지를 매칭한다. 매칭된 결과를 기반으로 특정 블로그는 영상 내 특정 프레임 구간에 태깅 된다. 제안한 방법은 이미지 매칭 성능을 측정하여 평가하였다. 블로그 이미지에 대해 Top 1 매칭 프레임을 살펴본 결과, 70%의 정확률을 보였다. 소프트 매칭(Top n)의 경우, 최대 90%의 성능을 얻을 수 있음을 실험을 통해 알 수 있었다.
https://doi.org/10.3745/PKIPS.y2014m11a.882 인용 PDF

Search Result 333, Processing Time 0.025 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)