• Title/Summary/Keyword: 속도 영상화

Search Result 762, Processing Time 0.038 seconds

Implementation of An Unmanned Counter based on YOLO Deep Learning Object Recognition (YOLO 기반 딥러닝 객체 인식 무인계산대 개발에 관한 연구)

  • Park, Tae-Baek
    • Annual Conference of KIPS
    • /
    • 2022.11a
    • /
    • pp.776-778
    • /
    • 2022
  • 우리는 일상 속에서 다양한 결제시스템을 접할 수 있다. 그중 무인계산 시스템은 소비자가 구매부터 결제까지 스스로 하는 방식이다. 발전된 기술이 편리함을 제공하지만, 일부 소비자들은 오히려 사용에 어려움을 겪고 사람이 계산을 해주는 기존의 시스템을 선호하는 경우가 많다. 본 논문에서는 소형 IOT 기기와 딥러닝 객체 인식 시스템을 기반으로 한 무인계산대를 설계하고 개발하였다. 계산대의 모습을 구현하기 위해 아두이노 컨베이어 벨트를 이용하고 라즈베리 파이와 파이 카메라를 이용하여 객체 인식 환경을 구현하였다. 파이 카메라를 통해 영상을 인식하고 해당 영상을 실시간으로 전송하여 PC에서 YOLO를 통해 객체를 탐지한다. 이후 탐지된 객체는 소비자가 확인할 수 있도록 디스플레이에 시각화한다. 본 논문에서 제안한 딥러닝 객체 인식 무인계산 시스템은 공산품이 주를 이루는 무인 상점에 활용할 수 있다.

Fast Distributed Video Coding using Parallel LDPCA Encoding (LDPCA 병렬 부호화를 이용한 고속 분산비디오부호화)

  • Park, Jongbin;Kim, Jaehwan;Jeon, Byeungwoo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.11a
    • /
    • pp.136-137
    • /
    • 2010
  • 본 논문에서는 고속, 저전력 비디오 부호화에 적합한 변환영역 Wyner-Ziv 분산비디오부호화기를 더욱 고속화하기 위한 병렬처리 방법을 제안한다. 기존에는 변환영역 Wyner-Ziv 분산비디오부호화를 위해 양자화 정보를 비트플레인단위로 분해후 이를 순차적으로 LDPCA 부호화하여 전체 부호화기 연산량에서 LDPCA의 복잡도가 약 54% 정도 차지하였고, 이는 고비트율로 부호화 할수록 더욱 증가하였다. 제안방법은 이를 개선하기 위해 여러 개의 비트플레인을 하나의 심벌 (symbol)로 묶어서 LDPCA 부호화를 수행하여 한 번의 연산으로 여러 개의 데이터를 동시에 처리할 수 있게 한다. 일종의 단일 명령 복수 데이터 처리 (SIMD, Single instruction, multiple data)에 의한 고속화 방법이다. 이를 통해 제안방법은 기존의 순차적 처리 방법에 비해 저비트율에서는 8배, 고비트율에서는 55배까지 LDPCA의 부호화 속도를 향상시켰다. 결과적으로 전체 부호화에서 LDPCA의 상대적인 복잡도 비율은 4%정도로 낮아지게 되었으며 Wyner-Ziv 영상의 부호화 속도도 약 1.5 ~ 2배까지 향상되었다. 제안방법은 LDPCA를 사용하는 다른 Wyner-Ziv 분산비디오부호화 구조에도 적용 가능할 것으로 기대한다.

  • PDF

Fabricatin and Hydrogen Storage Property of Mg-33.5%Ni Alloy Powder Prepared by Melt-Spining Process (Melt-spining 공법에 의한 Mg-33.5%Ni 수소 저장 합금 제조 및 수소저장 특성)

  • Hong, Seong-Hyeon;Yim, Chang-Dong;Bae, Jong-Soo;Na, Young-Sang
    • Journal of Hydrogen and New Energy
    • /
    • v.18 no.4
    • /
    • pp.399-405
    • /
    • 2007
  • The hyper-eutectic Mg-33.5%Ni alloy was rapidly solidified by melt spinning process. The melt-spun Mg-33.5%Ni has amorphous structure and crystallization occurred above $162^{\circ}C$. The hydriding and dehydriding rates of melt-spun Mg-33.5%Ni increased with cycle and high rate of hydrogen storage occurred at 3rd cycle. The maximum hydrogen amount absorbed in melt-spun Mg-33.5%Ni at $300^{\circ}C$ is about 4.5%.

Construction of Web-Based Medical Imgage Standard Dataset Conversion and Management System (웹기반 의료영상 표준 데이터셋 변환 및 관리 시스템 구축)

  • Kim, Ji-Eon;Lim, Dong Wook;Yu, Yeong Ju;Noh, Si-Hyeong;Lee, ChungSub;Kim, Tae-Hoon;Jeong, Chang-Won
    • Annual Conference of KIPS
    • /
    • 2021.05a
    • /
    • pp.282-284
    • /
    • 2021
  • 최근 4차 산업혁명으로 의료빅데이터 기반으로 한 AI 기술이 급속도로 발전하고 있다. 특히, 의료영상을 기반으로 병변을 탐색, 분활 및 정량화 그리고 자동진단 및 예측 관련된 기술이 AI 제품으로 출시되고 있다. AI 기술개발은 많은 학습데이터가 요구되며, 임상검증에 단일기관에서 2개 이상 기관의 검증이 요구되고 있다. 그러나 아직까지도 단일기관에서 학습용 데이터와 테스트, 검증용 데이터를 달리하여 기술개발에 활용하고 있다. 본 논문은 AI 기술개발에 필요한 영상데이터에 대한 표준화된 데이터셋 변환 및 관리를 위한 시스템에 대해 기술한다. 다기관 데이터를 수집하기 위해서는 각 기관의 의료영상 데이터 수집 및 저장하는 기준이 명확하지 않아 표준화 작업이 필요하다. 제안한 시스템은 기관 또는 다기관 연구 그룹의 의료영상데이터를 표준화하여 저장할 수 있을 뿐만 아니라 의료영상 뷰어 및 의료영상 리스트를 통해 연구자가 원하는 의료영상 데이터 셋을 검색하여 다양한 데이터셋으로 제공할 수 있기 때문에 수집 및 변환 그리고 관리까지 지원할 수 있는 시스템으로 영상기반의 머신러닝 연구에 활력을 불어넣을 수 있을 것으로 기대하고 있다.

Fingerprint Identification Using the Distribution of Ridge Directions (방향분포를 이용한 지문인식)

  • Kim Ki-Cheol;Choi Seung-Moon;Lee Jung-Moon
    • Journal of Digital Contents Society
    • /
    • v.2 no.2
    • /
    • pp.179-189
    • /
    • 2001
  • This paper aims at faster processing and retrieval in fingerprint identification systems by reducing the amount of preprocessing and the size of the feature vector. The distribution of fingerprint directions is a set of local directions of ridges and furrows in small overlapped blocks in a fingerprint image. It is extracted initially as a set of 8-direction components through the Gabor filter bank. The discontinuous distribution of directions is smoothed to a continuous one and visualized as a direction image. Then the center of the distribution is selected as a reference point. A feature vector is composed of 192 sine values of the ridge angles at 32-equiangular positions with 6 different distances from the reference point in the direction image. Experiments show that the proposed algorithm performs the same level of correct identification as a conventional algorithm does, while speeding up the overall processing significantly by reducing the length of the feature vector.

  • PDF

Synchronized One-to-many Media Streaming employing Server-Client Coordinated Adaptive Playout Control (적응형 재생제어를 이용한 동기화된 일대다 미디어 스트리밍)

  • Jo, Jin-Yong;Kim, Jong-Won
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.28 no.5C
    • /
    • pp.493-505
    • /
    • 2003
  • A new inter-client synchronization framework for multicast media streaming is proposed employing a server-client coordinated adaptive playout control. The proposed adaptive player controls the playback speed of audio and video by adopting the time-scale modification of audio. Based on the overall synchronization status as well as the buffer occupancy level, the playout speed of each client is manipulated within a perceptually tolerable range. Additionally, the server implicitly helps increasing the time available for retransmission while the clients perform an interactive error recovery mechanism with the assistance of playout control. The network-simulator based simulations show that the proposed framework can reduce the playout discontinuity without degrading the media quality, and thus mitigate the client heterogeneity.

Performance Comparison of Wave Information Retrieval Algorithms Based on 3D Image Analysis Using VTS Sensor (VTS 센서를 이용한 3D영상 분석에 기초한 파랑 정보 추출 알고리즘 성능 비교)

  • Ryu, Joong-seon;Lim, Dong-hee;Kim, Jin-soo;Lee, Byung-Gil
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.20 no.3
    • /
    • pp.519-526
    • /
    • 2016
  • As marine accidents happen frequently, it is required to establish a marine traffic monitoring system, which is designed to improve the safety and efficiency of navigation in VTS (Vessel Traffic Service). For this aim, recently, X-band marine radar is used for extracting the sea surface information and, it is necessary to retrieve wave information correctly and provide for the safe and efficient movement of vessel traffic within the VTS area. In this paper, three different current estimation algorithms including the classical least-squares (LS) fitting, a modified iterative least-square fitting routine and a normalized scalar product of variable current velocities are compared with buoy data and then, the iterative least-square method is modified to estimate wave information by improving the initial current velocity. Through several simulations with radar signals, it is shown that the proposed method is effective in retrieving the wave information compared to the conventional methods.

Improving Watching HDTV Environment by Analyzing Visual Perception of Character Graphics (문자그래픽 시각인지도 분석에 따른 HDTV시청환경 개선 연구)

  • Lee, Kook-Se;Moon, Nam-Mee
    • 한국HCI학회:학술대회논문집
    • /
    • 2009.02a
    • /
    • pp.583-589
    • /
    • 2009
  • The new HDTV technologies provide crystal clear images and surrounding sounds for broadcasting screen in order to serve higher quality of broadcasting. They have four times the resolution of conventional TV and handle 16:9 wide screen aspect ratio images. Due to such technological shift, the function of Character Graphic has been particularly revaluated: it used to be only a subsidiary method to literally deliver visual images, but nowadays it is considered one of the essential elements capable of giving higher values to broadcasting programs. And there is an urgent need for changing its attributes such as fonts, sizes, colors, moving speeds to fit to bigger screen ratio and much more qualified images of HDTV. To meet such a need, Delphi surveys are made twice with three groups of TV production staffs: Art Directors, CG Designers and Production & Transmission team, these groups which are divided on the basis of their roles in broadcasting production process. With the results of these surveys, this article analyzes how all of the attributes of Character Graphic have affected the media users' Visual Perception, and then, suggests a new format designed in OSMU(One Source Multi Use) by which TV character graphics can be properly transmitted to various media formats.

  • PDF

A New Car License Plate Recognition Using Morphological Characteristic and Fuzzy ART Algorithm (형태학적 특징과 퍼지 ART 알고리즘을 이용한 신 차량 번호판 인식)

  • Kang, Hyo-Joo;Kim, Mi-Jeong;Kang, Hye-Min;Park, Choong-Shik;Lee, Jong-Hee;Kim, Kwang-Baek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2007.10a
    • /
    • pp.413-417
    • /
    • 2007
  • 2006년 11월 이후 신 차량 번호판 등장 후, 신 차량 번호판 차량이 꾸준히 증가하고 있다. 이에 따라 속도위반, 신호위반 단속, 무인 주차 관리 시스템, 범죄 및 도주 차량 검거, 고속도로 톨게이트에서 통행료 지불로 인한 교통 체증현상을 해소하기 위한 자동 요금 징수와 같은 다양한 경우에서 신 자동차 번호판의 특징에 맞는 인식 시스템이 요구되고 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 지능형 신 자동차 번호판 인식 방법을 제안한다. 무인 카메라에서 획득된 신 차량 영상을 그레이 레벨로 변환한 후에 블록 이진화한다. 블록 이진화된 차량 영상을 대상으로 차량의 형태학적 특징을 적용하여 잡음을 제거한 후, 번호판 영역을 추출한다. 추출된 번호판 영역에 대해 Grassfire 알고리즘을 적용하여 개별 코드를 추출한다. 차량 번호판을 인식하기 위하여 추출된 개별 코드를 퍼지 ART 알고리즘을 적용하여 학습 및 인식한다. 제안된 차량 번호판 추출 및 인식 방법의 성능을 평가하기 위해 100장의 차량 영상을 대상으로 실험한 결과, 제안된 차량 번호판 추출 및 인식 방법이 실험을 통해서 효율적인 것을 확인하였다.

  • PDF

A Study on Game Contents Classification Service Method using Image Region Segmentation (칼라 영상 객체 분할을 이용한 게임 콘텐츠 분류 서비스 방안에 관한 연구)

  • Park, Chang Min
    • Journal of Service Research and Studies
    • /
    • v.5 no.2
    • /
    • pp.103-110
    • /
    • 2015
  • Recently, Classification of characters in a 3D FPS game has emerged as a very significant issue. In this study, We propose the game character Classification method using Image Region Segmentation of the extracting meaningful object in a simple operation. In this method, first used a non-linear RGB color model and octree color quantization scheme. The input image represented a less than 20 quantized color and uses a small number of meaningful color histogram. And then, the image divided into small blocks, calculate the degree of similarity between the color histogram intersection and adjacent block in block units. Because, except for the block boundary according to the texture and to extract only the boundaries of the object block. Set a region by these boundary blocks as a game object and can be used for FPS game play. Through experiment, we obtain accuracy of more than 80% for Classification method using each feature. Thus, using this property, characters could be classified effectively and it draws the game more speed and strategic actions as a result.