• 제목/요약/키워드: Quantized Learning

검색결과 17건 처리시간 0.023초

글자 영상을 위한 학습기반 초고해상도 기법 (Learning-based Super-resolution for Text Images)

  • 허보영;송병철
    • 전자공학회논문지
    • /
    • 제52권4호
    • /
    • pp.175-183
    • /
    • 2015
  • 본 논문은 글자 영상을 효과적으로 확대 (up-scaling)하기 위한 학습 기반 초고해상도 (super-resolution; SR) 기법을 제안한다. 제안 기법은 크게 학습 단계와 합성 단계로 나뉜다. 학습 단계에서 다양한 HR (high-resolution) /LR (low-resolution) 글자 영상 쌍들을 수집한다. LR영상들은 양자화를 하고, 충분히 많은 수의 HR-LR 블록쌍들을 추출한다. 양자화된 LR블록을 기준으로 블록 쌍들을 소정의 개수의 클래스들로 구분한다. 클래스 별로 최적의 2D-FIR 필터 계수를 계산하고, 양자화한 후색인용 LR 블록과 함께 사전에 저장한다. 합성 단계에서 입력 LR 영상 내 각 블록을 양자화한 후 사전 내 양자화된 LR블록들과 정합하여 가장 근사한 블록에 대응하는 FIR 필터계수를 선정한다. 마지막으로 선택된 FIR필터로 HR 블록을 합성하여 최종적인 HR영상을 생성한다. 또한, 우리는 잡음이 있는 글자 영상에 대응하기 위해 학습과정에서 잡음 세기에 따른 복수개의 사전들을 제작한다. 입력 LR 영상의 잡음 레벨에 맞는 사전을 선택하여 HR영상을 합성한다. 실험 결과는 제안 기법이 종래 기법보다 잡음이 없는 환경에서는 물론 잡음이 있는 환경에서 우수한 주관적/객관적 화질을 가짐을 보인다.

관성과 SOFM-HMM을 이용한 고립단어 인식 (Isolated word recognition using the SOFM-HMM and the Inertia)

  • 윤석현;정광우;홍광석;박병철
    • 전자공학회논문지B
    • /
    • 제31B권6호
    • /
    • pp.17-24
    • /
    • 1994
  • This paper is a study on Korean word recognition and suggest the method that stabilizes the state-transition in the HMM by applying the `inertia' to the feature vector sequences. In order to reduce the quantized distortion considering probability distribution of input vectors, we used SOFM, an unsupervised learning method, as a vector quantizer, By applying inertia to the feature vector sequences, the overlapping of probability distributions for the response path of each word on the self organizing feature map can be reduced and the state-transition in the Hmm can be Stabilized. In order to evaluate the performance of the method, we carried out experiments for 50 DDD area names. The results showed that applying inertia to the feature vector sequence improved the recognition rate by 7.4% and can make more HMMs available without reducing the recognition rate for the SOFM having the fixed number of neuron.

  • PDF

압축된 영상 복원을 위한 양자화된 CNN 기반 초해상화 기법 (Quantized CNN-based Super-Resolution Method for Compressed Image Reconstruction)

  • 김용우;이종환
    • 반도체디스플레이기술학회지
    • /
    • 제19권4호
    • /
    • pp.71-76
    • /
    • 2020
  • In this paper, we propose a super-resolution method that reconstructs compressed low-resolution images into high-resolution images. We propose a CNN model with a small number of parameters, and even if quantization is applied to the proposed model, super-resolution can be implemented without deteriorating the image quality. To further improve the quality of the compressed low-resolution image, a new degradation model was proposed instead of the existing bicubic degradation model. The proposed degradation model is used only in the training process and can be applied by changing only the parameter values to the original CNN model. In the super-resolution image applying the proposed degradation model, visual artifacts caused by image compression were effectively removed. As a result, our proposed method generates higher PSNR values at compressed images and shows better visual quality, compared to conventional CNN-based SR methods.

다층구조 퍼셉트론을 이용한 분류 영상압축 및 코딩 (Classified Image Compression and Coding using Multi-Layer Percetpron)

  • 조광보;박철훈;이수영
    • 한국통신학회논문지
    • /
    • 제19권11호
    • /
    • pp.2264-2275
    • /
    • 1994
  • 본 논문에서는 블록 분류와 코딩과 함께 신경회로망을 이용한 영상압축을 보였다. 오차 역전파 알고리즘으로 학습되는 다층구조 신경회로망은 정규화된 영상데이타를 감소된 공간 중복성을 가지는 은닉층의 값으로 변환하는데 사용된다. 기본적으로 영상압축은 입력층과 출력층의 뉴런보다 적은 수의 은닉층 뉴런에 의해 얻어진다. 여기에 시각체계의 민감도에 따른 영상블럭 복잡성에 따라 적응적으로 압축되므로 블록을 분류한다. 또한 은닉뉴런의 양자화된 값은 효과적인 전송을 위해 entropy coding을 이용한 경우 화질의 큰 저하없이 약 25:1의 압축률을 얻었다.

  • PDF

퍼지 벡터 양자화기 사상화와 신경망에 의한 화자적응 음성합성 (Speaker-Adaptive Speech Synthesis based on Fuzzy Vector Quantizer Mapping and Neural Networks)

  • 이진이;이광형
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.149-160
    • /
    • 1997
  • 본 연구에서는 퍼지사상화(fuzzy mapping)와 FLVQ(fuzzy learning vector quantization)에 의한 사상된(mapped)코드북을 사용하는 화자적용 음성합성 알고리즘 을 제안하고, 기존의 음성합성결과와 비교한다. 입력화자와 기준화자의 코드북은 FLVQ 방법으로 작성한다. 사상된 코드북은 퍼지 히스토그램을 작성하여 이들을 선형 결합함으로써 얻어지는 퍼지 사상화에 의하여 작성된다. 대응 코드벡터의 퍼지 히스 토그램은 동일 입력벡터에 대해 선택된 입력화자의 코드벡터와 기준화자의 코드벡터 사이의 DTW(dynamic time warping)을 행하여 대응하는 코드벡터들의 소속값 (membership value)을 누적하여 얻는다. 음성합성시에는 사상된 코드북을 사용하여 입력화자의 음성을 퍼지벡터 양자화한 다음, FCM(fuzzy c means) 합성규칙을 사용하 여 사상된 코드북내의 코드벡터가 아닌 새로운 하나의 합성벡터를 얻게 되어 좀 더 입력화자에 적응된 합성음을 얻게 된다. 이 기술의 성능평가는 성별이 서로 다른 화 자를 입력화자 및 기준화자로 선정하여 입력화자의 음성에 가까운 정도로 평가하였으 며 그 결과 기존의 음성합성보다 입력화자에 더 적용된 합성음을 얻었다.

  • PDF

Vest-type System on Machine Learning-based Algorithm to Detect and Predict Falls

  • Ho-Chul Kim;Ho-Seong Hwang;Kwon-Hee Lee;Min-Hee Kim
    • PNF and Movement
    • /
    • 제22권1호
    • /
    • pp.43-54
    • /
    • 2024
  • Purpose: Falls among persons older than 65 years are a significant concern due to their frequency and severity. This study aimed to develop a vest-type embedded artificial intelligence (AI) system capable of detecting and predicting falls in various scenarios. Methods: In this study, we established and developed a vest-type embedded AI system to judge and predict falls in various directions and situations. To train the AI, we collected data using acceleration and gyroscope values from a six-axis sensor attached to the seventh cervical and the second sacral vertebrae of the user, considering accurate motion analysis of the human body. The model was constructed using a neural network-based AI prediction algorithm to anticipate the direction of falls using the collected pedestrian data. Results: We focused on developing a lightweight and efficient fall prediction model for integration into an embedded AI algorithm system, ensuring real-time network optimization. Our results showed that the accuracy of fall occurrence and direction prediction using the trained fall prediction model was 89.0% and 78.8%, respectively. Furthermore, the fall occurrence and direction prediction accuracy of the model quantized for embedded porting was 87.0 % and 75.5 %, respectively. Conclusion: The developed fall detection and prediction system, designed as a vest-type with an embedded AI algorithm, offers the potential to provide real-time feedback to pedestrians in clinical settings and proactively prepare for accidents.

뉴럴 디코딩의 원리와 최신 연구 동향 소개 (Principles and Current Trends of Neural Decoding)

  • 김광수;안정열;차성광;구교인;구용숙
    • 대한의용생체공학회:의공학회지
    • /
    • 제38권6호
    • /
    • pp.342-351
    • /
    • 2017
  • 뉴럴 디코딩은 뉴론이 발화한 스파이크 트레인으로부터 뉴론에 인가된 원 자극을 추정하는 작업을 말한다. 디코딩은 뉴론들끼리 어떻게 신호를 주고 받는 지를 이해함으로써 궁극적으로 뇌가 어떻게 정보처리를 하는 지 이해하는 기초적인 작업이다. 이 논문에서 우리는 3가지 뉴럴 디코딩 방법, 즉 빈도 디코딩, 시간 디코딩, 군집 디코딩 방법에 대해 설명하겠다. 빈도 디코딩은 자극에 대한 스파이크의 발화빈도 정보를 이용하여 자극을 복원하는 방법을 말한다. 역사적으로 가장 먼저 시도되었고 가장 간단한 디코딩 방법이다. 그러나 정수 개인 스파이크 개수로부터 빈도를 계산하는 과정에서 빈도자체가 불연속이고 양자화될 가능성이 높기 때문에 간단하고 정적인 자극이 아닌 경우 빈도 디코딩으로는 자극을 복원하기 어렵다는 한계를 가지고 있다. 시간 디코딩은 스파이크 발생 빈도가 아닌 개별 스파이크들의 발생시각을 이용한 디코딩 방법을 말하며 실제 빠르게 변화하는 자극의 경우 신경세포는 빈도 디코딩이 아니라 시간 디코딩을 통해 자극을 추정하는 것으로 이해되고 있다. 군집 디코딩은 단일 신경세포가 아닌 군집 신경세포로부터 자극을 복원하는 방법이다. 군집 디코딩은 단일 신경 세포 디코딩에 비해 신경 세포의 가변성에 따른 불확실성을 감소시킬 수 있고 서로 다른 자극의 특성을 동시에 표현할 수 있다는 장점을 갖는다. 이 논문에서는 먼저 세 가지 뉴럴디코딩 방법에 대해 소개하고 정보이론이 뉴럴디코딩에 어떻게 적용되는 지를 다룬 후 마지막으로 최근에 각광받고 있는 기계학습 방법에 의한 뉴럴 디코딩에 대해 다루도록 하겠다.