• Title/Summary/Keyword: 온라인 디코딩

Search Result 5, Processing Time 0.018 seconds

Implementation of PDF417 2-dimensional Barcode Decoder (PDF417 이차원 바코드 디코딩 알고리즘의 구현)

  • 정정구;한희일
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.289-292
    • /
    • 2001
  • 종래에 사용되어 왔던 1차원 바코드가 정보를 포함하고 있는 데이터베이스에 접근하는 데이터 키 역할을 주로 해온 것에 비해, 2차원 바코드는 다량의 데이터를 포함할 수 있고 고밀도의 데이터 표현이 가능하여, 호스트 컴퓨터의 데이터 베이스에 온라인 연결할 필요없이 확인하고자 하는 사람이나 대상물에 대한 정보를 얻을 수 있다. 본 논문에서는 가장 널리 사용되는 2차원 바코드 체계인 PDF417 을 중심으로 디지털 카메라를 통하여 입력한 영상을 이진화하여 시작 심볼 또는 정지 심볼을 검색함으로써 2차원 바코드 영역을 추출한 다음, 추출된 영역으로부터 바코드의 행과 열의 수, 오류수정 정도 등의 헤더정보를 검출하고 이를 바탕으로 코드워드를 추출하는 알고리즘을 제안한다. 얻어진 코드워드는 데이터를 효율적으로 저장하기위해 정보가 숫자인지, ASCII코드인지 혹은 바이트 정보인지에 따라 다른 방식으로 인코딩 되어 있는데, 그에 따른 디코딩 알고리즘을 제안한다.

  • PDF

Policy-based performance comparison study of Real-time Simultaneous Translation (실시간 동시통번역의 정책기반 성능 비교 연구)

  • Lee, Jungseob;Moon, Hyeonseok;Park, Chanjun;Seo, Jaehyung;Eo, Sugyeong;Lee, Seungjun;Koo, Seonmin;Lim, Heuiseok
    • Journal of the Korea Convergence Society
    • /
    • v.13 no.3
    • /
    • pp.43-54
    • /
    • 2022
  • Simultaneous translation is online decoding to translates with only subsentence. The goal of simultaneous translation research is to improve translation performance against delay. For this reason, most studies find trade-off performance between delays. We studied the experiments of the fixed policy-based simultaneous translation in Korean. Our experiments suggest that Korean tokenization causes many fragments, resulting in delay compared to other languages. We suggest follow-up studies such as n-gram tokenization to solve the problems.

A Study on MPEG-4 Streaming System Using DTS for QoS(Quality of Service) (DTS를 이용한 MPEG-4 미디어 오브젝트 스트리밍 시스템에 관한 연구)

  • Han, Jong-Min;Jeong, Jin-Hwan;Yoo, Chuck
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11b
    • /
    • pp.1631-1634
    • /
    • 2002
  • 멀티미디어 서버는 클라이언트가 요청한 멀티미디어 데이터 스트림을 효율적으로 제공하기 위해 사용된다. 현재, 정보통신 기술의 발달로 인해 멀티미디어 서버는 멀티미디어 정보를 온라인으로 서비스 할 수 있게 되었다. 하지만 네트워크 상에서 발생하는 Packet Delay 에 때문에 서버에서 사용자에게 연속적이고 엄격한 실시간 제약이 있는 비디오 전송과 같은 멀티미디어 서비스를 제공하는 것은 매우 힘들다. 따라서, 본 논문에서는 서버에서 필요한 Packet 를 먼저 전송하여 Packet Delay 를 줄이는 방법을 제안하였다. MPEG-4 에서 오브젝트의 AU(Access Unit)들의 디코딩 시간을 표시하는 DTS(Decoding Time Stamp)를 참조하여 생성된 Deadline threshold 를 기준으로 Deadline 이 가장 빠른 AU부터 전송하는 스케줄링 알고리즘을 이용하여 MPEC-4 미디어 오브젝트를 스트리밍한다.

  • PDF

Parallel Gaussian Processes for Gait and Phase Analysis (보행 방향 및 상태 분석을 위한 병렬 가우스 과정)

  • Sin, Bong-Kee
    • Journal of KIISE
    • /
    • v.42 no.6
    • /
    • pp.748-754
    • /
    • 2015
  • This paper proposes a sequential state estimation model consisting of continuous and discrete variables, as a way of generalizing all discrete-state factorial HMM, and gives a design of gait motion model based on the idea. The discrete state variable implements a Markov chain that models the gait dynamics, and for each state of the Markov chain, we created a Gaussian process over the space of the continuous variable. The Markov chain controls the switching among Gaussian processes, each of which models the rotation or various views of a gait state. Then a particle filter-based algorithm is presented to give an approximate filtering solution. Given an input vector sequence presented over time, this finds a trajectory that follows a Gaussian process and occasionally switches to another dynamically. Experimental results show that the proposed model can provide a very intuitive interpretation of video-based gait into a sequence of poses and a sequence of posture states.

Korean speech recognition using deep learning (딥러닝 모형을 사용한 한국어 음성인식)

  • Lee, Suji;Han, Seokjin;Park, Sewon;Lee, Kyeongwon;Lee, Jaeyong
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.2
    • /
    • pp.213-227
    • /
    • 2019
  • In this paper, we propose an end-to-end deep learning model combining Bayesian neural network with Korean speech recognition. In the past, Korean speech recognition was a complicated task due to the excessive parameters of many intermediate steps and needs for Korean expertise knowledge. Fortunately, Korean speech recognition becomes manageable with the aid of recent breakthroughs in "End-to-end" model. The end-to-end model decodes mel-frequency cepstral coefficients directly as text without any intermediate processes. Especially, Connectionist Temporal Classification loss and Attention based model are a kind of the end-to-end. In addition, we combine Bayesian neural network to implement the end-to-end model and obtain Monte Carlo estimates. Finally, we carry out our experiments on the "WorimalSam" online dictionary dataset. We obtain 4.58% Word Error Rate showing improved results compared to Google and Naver API.