• 제목/요약/키워드: computer screen image

검색결과 193건 처리시간 0.026초

몰입형 비디오 압축을 위한 스크린 콘텐츠 코딩 성능 분석 (Screen Content Coding Analysis to Improve Coding Efficiency for Immersive Video)

  • 이순빈;정종범;김인애;이상순;류은석
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.911-921
    • /
    • 2020
  • 최근 MPEG-I (Immersive) 그룹에서는 몰입형 비디오(Immersive Video)에 대한 표준화 프로젝트를 통해 압축 성능 탐색을 진행하고 있다. MIV(MPEG Immersive Video) 표준 기술은 다수의 시점 영상과 깊이 맵을 통한 깊이 맵 기반 이미지 렌더링(DIBR)을 바탕으로 제한적인 6DoF을 제공하고자 하는 기술이다. 현재 MIV에서는 바탕 시점(Basic View)과 각 시점의 고유한 영상 정보를 패치 단위로 모아둔 추가 시점(Additional View)으로 처리하는 모델을 채택하고 있다. MIV에서 생성된 아틀라스는 포함되는 시점의 성격에 따라 다른 영상의 특성을 나타내어 비디오 코덱의 압축 효율에 대한 고찰이 필요하다. 따라서 본 논문에서는 다양한 시점과 패치들이 반복되는 패턴에 착안하여 화면 내 블록 카피(IBC: intra block copy) 등의 압축 기법이 포함된 스크린 콘텐츠 코딩 툴에 대한 성능 비교 분석을 진행하여 복원 영상에서 최대 -15.74% Peak Signal-to-Noise Ratio (PSNR) 관점에서의 부호화 성능 향상을 제공하였다.

포그 스크린을 이용한 공간증강현실(SAR) 구현 (Implementation of Spatial Augmented Reality Using Fog Screen)

  • 박연용;정문열
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제25권3호
    • /
    • pp.43-54
    • /
    • 2019
  • 이 연구는 디스플레이 장비와 사용자를 분리하여 현실 공간 전체, 또는 현실 공간 속 허공에 이미지를 디스플레이하는 '공간증강현실(Spatial Augmented Reality)' 구현에 적합한 포그 스크린의 활용 방안에 대하여 전체적으로 조망 하였다. 세 번의 전시와 한 번의 공연을 통하여 통과가 가능한 포그 스크린이 공간증강현실을 구현하는데 있어 적합한 소재라는 것과 포그 스크린을 이용한 공간증강현실 구현을 통하여 무대나 전시에서 홀로그램 연출이 이전보다 쉬워졌다는 것에 대해서도 증명 하였다. 전시와 함께 공연계 종사자들을 상대로 실시한 설문조사를 통하여 포그 스크린을 알고 있는 사람들이 절반에 불과하다는 것과 실제로 포그 스크린을 관람한 사람의 비율이 전체 응답자 중에서 10% 정도로 매우 낮다는 것을 확인 하였다. 또한, 포그 스크린이 주변 공간에 어떠한 영향을 미치는가를 알아보기 위하여 국립아시아문화전당 어린이문화원에서 처음 실시한 시간과 거리 변화에 따른 습도 변화 관찰 실험을 통하여 포그 스크린을 중심으로 반경 5m 이내의 습도가 2~3%($6,400m^3$ 기준) 정도 증가할 수 있다는 것을 확인 하였다. 이를 통하여 전시장에서 물감이나 종이, 나무와 같이 습기에 취약한 소재를 사용하는 전시물과 함께 전시할 경우, 포그 스크린과의 설치 유격에 참고할 수 있는 최소한의 근거를 마련하였다.

Geometric Image Compensation Method for a Portable Projector Based on Prewarping Using 2D Homography

  • Cho, Jinsoo;Won, Jongkil;Bae, Jongwoo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권9호
    • /
    • pp.2299-2311
    • /
    • 2013
  • As portable multimedia devices become more popular and smaller, the use of portable projectors is also rapidly increasing. However, when portable projectors are used in mobile environments in which a dedicated planar screen is not available, the problem of geometric distortion of the projected image often arises. In this paper, we present a geometric image compensation method for portable projectors to compensate for geometric distortions of images projected on various types of planar or nonplanar projection surfaces. The proposed method is based on extraction of the two-dimensional (2D) geometric information of a projection area, setting of the compensation area, and prewarping using 2D homography. The experimental results show that the proposed method allows effective compensation for waved and arbitrarily shaped projection areas, as well as tilted and bent surfaces that are often found in the mobile environment. Furthermore, the proposed method is more computationally efficient than conventional image compensation methods that use 3D geometric information.

적외선 영상센서를 이용한 스마트 터치 프로젝터 시스템 기술 연구 (A Study on Smart Touch Projector System Technology Using Infrared (IR) Imaging Sensor)

  • 이국선;오상헌;전국휘;강성수;유동희;김병규
    • 한국멀티미디어학회논문지
    • /
    • 제15권7호
    • /
    • pp.870-878
    • /
    • 2012
  • 최근의 많은 컴퓨터 기술의 발전과 센서 기술의 발전의 결합으로 매우 다양한 형태의 사용자 경험에 기반한 사용자 인터페이스(User interface) 기술들이 출현하고 있다. 본 연구에서는 적외선 영상을 이용한 스마트 터치 프로젝터 시스템 기술에 관한 연구와 그 결과를 소개한다. 제안된 시스템에서는 사용자가 빔 프로젝터를 사용할 때 적외선 펜을 이용하여 이벤트를 발생시키면 적외선 영상센서를 통하여 그 이벤트를 인식하여 마우스 이벤트를 발생시키는 기법을 제안한다. 입력되는 펜의 움직임 추출과 추적을 기반으로 움직임 이벤트 패턴을 설계하였으며, 입력 영상 화면과 실제 사용하는 하드웨어의 해상도에 차이가 있기 때문에 이 오차를 최소화 하기 위해서 화면 좌표보정 알고리즘을 제안한다. 이러한 기술은 빔 프로젝터에 간단한 프로세서만 장착이 된다면 다른 이동식 노트북 등이 필요 없이 언제든지 회의나 발표 등을 진행할 수 있는 차세대 휴먼-컴퓨터 상호작용(Human-Computer Interaction) 기술이다.

측두하악 장애환자의 하악 운동 Simulation에 관한 연구 (A STUDY ON SIMULATION OF THE MANDIBULAR MOVEMENT OF THE PATIENTS WITH TEMPOROMANDIBULAR JOINT DISORDER)

  • 박상윤;강동완;계기성
    • 대한치과보철학회지
    • /
    • 제29권2호
    • /
    • pp.161-175
    • /
    • 1991
  • To understand the biomechanics of the mandibular movement of the patients with T.M.J. disorder, it is necessary to analyze the mandibular movement by the least moving points of instantaneous center of rotation on computer screen. In this study, two subjects without T.M.J. disorder and with normal occlusion and few patients with T.M.J. disorder were selected for obtaining the processing data. The habitual opening and dosing movements were recorded by image recognition system of video and computer and then the mandibular movement and the least moving point were analyzed using computer program for image anaysis of specialized points. The results obtained were as follows: 1. The least moving points of control group during opening and dosing were dose to the mandibular foramen, but in the test group there were differences between two positions of the least moving points during opening and closing. 2. The variations of the least moving point were in the range of $0.02\sim0.05cm$ of X-coordinate and $0.07\sim0.10cm$ of Y-coordinate for control group, whereas in the range of $0.05\sim0.30cm$ of X-coordinate and $0.08\sim1.65cm$ of Y-coordinate for test group. 3. The index of variation during opening and dosing movements was shown in $0.8\sim1.0$ for the control group and in $0.56\sim2.6$ for the test group. 4. After the treatment of the test group No. 4 by occlusal splint the least moving point was dose to the mandibular foramen and the index of variation was changed from 25 to 05. 5. The tracing shape of the least moving point in the test group represented the irregularities compared to the control group. 6. The mandibular opening and dosing movements were simulated on the computer screen following the movement of the least moving point of instantaneous center of rotation.

  • PDF

A Fast Algorithm for Korean Text Extraction and Segmentation from Subway Signboard Images Utilizing Smartphone Sensors

  • Milevskiy, Igor;Ha, Jin-Young
    • Journal of Computing Science and Engineering
    • /
    • 제5권3호
    • /
    • pp.161-166
    • /
    • 2011
  • We present a fast algorithm for Korean text extraction and segmentation from subway signboards using smart phone sensors in order to minimize computational time and memory usage. The algorithm can be used as preprocessing steps for optical character recognition (OCR): binarization, text location, and segmentation. An image of a signboard captured by smart phone camera while holding smart phone by an arbitrary angle is rotated by the detected angle, as if the image was taken by holding a smart phone horizontally. Binarization is only performed once on the subset of connected components instead of the whole image area, resulting in a large reduction in computational time. Text location is guided by user's marker-line placed over the region of interest in binarized image via smart phone touch screen. Then, text segmentation utilizes the data of connected components received in the binarization step, and cuts the string into individual images for designated characters. The resulting data could be used as OCR input, hence solving the most difficult part of OCR on text area included in natural scene images. The experimental results showed that the binarization algorithm of our method is 3.5 and 3.7 times faster than Niblack and Sauvola adaptive-thresholding algorithms, respectively. In addition, our method achieved better quality than other methods.

패션일러스트레이션에서의 포토몽타주 표현방법과 효과 (A Photomontage Expression and an Effect in Fashion Illustration)

  • 권지영;유영선
    • 복식
    • /
    • 제54권8호
    • /
    • pp.49-58
    • /
    • 2004
  • The purpose of this study is to develop a photomontage expression in order to express a characteristic personality and creativity of artists of effectively in fashion illustration. The results of this study were as follows : 1) Because of a fashion and a human body were the major subjects in fashion illustration, human body transformation and composition between a human body and heterogeneous objects by photomontage appeared with a lot of works. 2) Photomontage appeared with a parody in a truth recurrence differ from a visual art, a parody seemed to be a humor with recurrence image of the original and it appeared with the general public image and it is effective in message delivery. 3) It was a stopped screen. but photomontage was expressed through overlapping and reiteration was characteristic, and it appeared with movement. a direction, a speed and rhythm effectively. 4) One screen of general chapter was only to express limited meaning, but after screen of a lot of chapter, it was able to express that was borrowed and reconstructive with a lot of contents or different contents are more than before. 5) It is changed, and composited images have a multiple point of time, and it extend a space-time limit, visual limit and an expression enabled a multidimensional space-time. Moreover, photomontage neglects unique sincerity and fact of a photo by development and utilization of computer graphic. and it can get a screen effect to spread in the virtual world as abstraction and hyper-reality. Therefore, if various photomontage expression apply to fashion illustration works, it can overcome a limit of a visual expression. and it is able to become an important way for expanding a filed of expression and enhancement of a practical function gradually in fashion illustration

지하철 플랫폼 스크린 도어 침범 인식을 위한 변형된 캐니에지 검출 알고리듬 (Modified Canny Edge Detection Algorithm for Detecting Subway Platform Screen Door Invasion)

  • 이하운
    • 한국전자통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.663-670
    • /
    • 2019
  • 지하철에서 스크린 도어와 플랫폼간의 경계선을 검출할 수 있는 변형된 케니에지 검출 알고리듬을 제안한다. 일반적으로 지하철에서는 플랫폼과 스크린 도어 사이의 경계선은 주변에 비해 어둡게 나타나므로 이의 특성을 고려하여 변형된 bottom-hat 변환을 이용해 에지 영상을 만든다. 이렇게 구한 에지 영상에 이중 문턱화를 통해 강한 에지와 약한 에지를 포함하는 이중 문턱화 영상을 얻는다. 이중 문턱화 영상에 호프 변환을 적용하여 플랫폼과 스크린 도어 간의 경계선을 검출하여 그 길이를 계산하고, 사람 등 물체가 있을 때와 없을 때와의 경계선 길이를 비교함으로써, 경계선을 침범 여부를 판단하는 알고리듬을 제안한다. 본 논문에서는 카메라 높이 위치에 따라 두 종류의 서로 다른 입력영상을 사용하여 제안한 변형된 케니에지 검출 알고리듬에 대한 결과를 컴퓨터 시뮬레이션으로 나타내었다.

모바일 디바이스 화면의 클릭 가능한 객체 탐지를 위한 싱글 샷 디텍터 (Single Shot Detector for Detecting Clickable Object in Mobile Device Screen)

  • 조민석;전혜원;한성수;정창성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권1호
    • /
    • pp.29-34
    • /
    • 2022
  • 모바일 디바이스 화면상의 클릭 가능한 객체를 인지하기 위한 데이터셋을 구축하고 새로운 네트워크 구조를 제안한다. 모바일 디바이스 화면에서 클릭 가능한 객체를 기준으로 다양한 해상도를 가진 디바이스에서 여러 애플리케이션을 대상으로 데이터를 수집하였다. 총 24,937개의 annotation data를 text, edit text, image, button, region, status bar, navigation bar의 7개 카테고리로 세분화하였다. 해당 데이터셋을 학습하기 위한 모델 구조는 Deconvolution Single Shot Detector를 베이스라인으로, backbone network는 기존 ResNet에 Squeeze-and-Excitation block을 추가한 Squeeze-and-Excitation networks를 사용하고, Single shot detector layers와 Deconvolution module을 Feature pyramid networks 형태로 쌓아 올려 header와 연결한다. 또한, 기존 input resolution의 1:1 비율에서 오는 특징의 손실을 최소화하기 위해 모바일 디바이스 화면과 유사한 1:2 비율로 변경하였다. 해당 모델을 구축한 데이터셋에 대하여 실험한 결과 베이스라인에 대비하여 mean average precision이 최대 101% 개선되었다.

원격 로봇작업을 위한 실시간 수박 형상 추출 알고리즘 (Development of Real Time and Robust Feature Extraction Algorithm of Watermelon for Tele-robotic Operation)

  • 김시찬;황헌
    • Journal of Biosystems Engineering
    • /
    • 제29권1호
    • /
    • pp.71-78
    • /
    • 2004
  • Real time and robust algorithm to extract the features of watermelon was developed from the remotely transmitted image of the watermelon. Features of the watermelon at the cultivation site such as size and shape including position are crucial to the successful tole-robotic operation and development of the cultivation data base. Algorithm was developed based on the concept of task sharing between the computer and the operator utilizing man-computer interface. Task sharing was performed based on the functional characteristics of human and computer. Identifying watermelon from the image transmitted from the cultivation site is very difficult because of the variable light condition and the complex image contents such as soil, mulching vinyl, straws on the ground, irregular leaves and stems. Utilizing operator's teaching through the touch screen mounted on the image monitor, the complex time consuming image processing process and instability of processing results in the watermelon identification has been avoided. Color and brightness characteristics were analyzed from the image area specified by the operator's teaching. Watermelon segmentation was performed using the brightness and color distribution of the specified imae processing area. Modified general Hough transform was developed to extract the shape, major and minor axes, and the position, of the watermelon. It took less than 100 msec of the image processing time, and was a lot faster than conventional approach. The proposed method showed the robustness and practicability in identifying watermelon from the wireless transmitted color image of the cultivation site.