• 제목/요약/키워드: CONV

검색결과 113건 처리시간 0.024초

후보 선별과 최적후보 안정성을 이용한 고속 움직임 예측 알고리즘 (Fast Motion Estimation Algorithm using Selection of Candidates and Stability of Optimal Candidates)

  • 김종남
    • 방송공학회논문지
    • /
    • 제23권5호
    • /
    • pp.628-635
    • /
    • 2018
  • 본 논문에서는 비디오 부호화에서 중요한 고속 움직임 예측 알고리즘을 제안한다. 기존의 전영역 탐색 방법의 많은 계산량으로 인하여 예측화질향상과 연산량 감축을 위한 연구가 진행되어 왔으며, 본 논문에서는 전영역 탐색기반의 방법과 비교하여 예측화질은 거의 유지하면서 무의미한 계산량을 줄이는 방법을 제안한다. 제안하는 알고리즘은 각 후보 지점에 대하여 부분 블록 에러 합을 계산하고, 이에 따라 다음 단계에서 진행할 후보들을 선별하고, 최소 에러지점의 최적후보에 대해 단계별 안정성을 비교 판단하여 그 다음 단계의 진행 여부를 결정함으로써 최적의 움직임 벡터를 계산한다. 이를 통하여 전체의 최소블록매칭에러를 갖는 지점을 조기에 발견하고, 불필요한 후보들을 더 빨리 제거함으로써 불필요한 계산량을 줄이고 계산속도 향상을 얻을 수 있다. 또한 제안하는 알고리즘은 단독으로 사용할 뿐만 아니라 기존의 고속 알고리즘들과 결합하여 사용해도 예측화질은 거의 유지하면서 계산량을 대폭 줄일 수 있으며, 실험결과에서 이를 검증한다.

A comparison of deep-learning models to the forecast of the daily solar flare occurrence using various solar images

  • Shin, Seulki;Moon, Yong-Jae;Chu, Hyoungseok
    • 천문학회보
    • /
    • 제42권2호
    • /
    • pp.61.1-61.1
    • /
    • 2017
  • As the application of deep-learning methods has been succeeded in various fields, they have a high potential to be applied to space weather forecasting. Convolutional neural network, one of deep learning methods, is specialized in image recognition. In this study, we apply the AlexNet architecture, which is a winner of Imagenet Large Scale Virtual Recognition Challenge (ILSVRC) 2012, to the forecast of daily solar flare occurrence using the MatConvNet software of MATLAB. Our input images are SOHO/MDI, EIT $195{\AA}$, and $304{\AA}$ from January 1996 to December 2010, and output ones are yes or no of flare occurrence. We consider other input images which consist of last two images and their difference image. We select training dataset from Jan 1996 to Dec 2000 and from Jan 2003 to Dec 2008. Testing dataset is chosen from Jan 2001 to Dec 2002 and from Jan 2009 to Dec 2010 in order to consider the solar cycle effect. In training dataset, we randomly select one fifth of training data for validation dataset to avoid the over-fitting problem. Our model successfully forecasts the flare occurrence with about 0.90 probability of detection (POD) for common flares (C-, M-, and X-class). While POD of major flares (M- and X-class) forecasting is 0.96, false alarm rate (FAR) also scores relatively high(0.60). We also present several statistical parameters such as critical success index (CSI) and true skill statistics (TSS). All statistical parameters do not strongly depend on the number of input data sets. Our model can immediately be applied to automatic forecasting service when image data are available.

  • PDF

심층 컨볼루션 신경망을 사용한 초분광 영상의 공간 분광학적 분류 기법 (HyperConv: spatio-spectral classication of hyperspectral images with deep convolutional neural networks)

  • 고세윤;전구;원중호
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.859-872
    • /
    • 2016
  • 초분광 영상 데이터는 픽셀마다 수백 개의 스펙트럼 밴드에 대한 정보가 주어지는 고차원 데이터로, 농업, 식품처리, 광물학, 물리학, 환경학, 지리학 등 광범위한 분야에 활용되고 있다. 그 중 하나는 토지 피복의 분류 문제인데, 이는 자연 재해 예방, 자연 자원 감시, 환경에 대한 정보 수집에 있어서 중요한 문제이다. 하지만 차원의 저주, 시공간적 변동성, 레이블된 데이터의 부족 때문에 토지 피복의 정확한 분류에는 어려움이 따른다. 이 논문에서는 이러한 문제를 해결하기 위해 컨볼루션 신경망에 기반한 새로운 심층 학습 구조를 제안한다. 제안된 구조는 원하는 지점 주변 픽셀의 정보를 컨볼루션 신경망을 통해 처리하고, 그 지점의 스펙트럼 정보를 강조하기 위해 컨볼루션 층의 출력과 스펙트럼 정보를 함께 소프트맥스 분류기의 입력으로 사용한다. 이 구조는 추가적인 특징 추출 과정을 필요로 하지 않고, 그래픽 처리 장치 등을 이용한 병렬화가 간편하다는 점에서 기존 방법들보다 유리하다. 실험 결과, 제안된 구조는 기존에 가장 좋은 성능을 보인 분류기와 비슷하거나 더 좋은 분류 정확도를 보여 좋은 일반화 성능을 보이는 것을 확인할 수 있었다.

지능형 예측감시 시스템을 위한 보안 프레임워크 (Security Framework for Intelligent Predictive Surveillance Systems)

  • 박정훈;박남제
    • 한국융합학회논문지
    • /
    • 제11권3호
    • /
    • pp.77-83
    • /
    • 2020
  • 최근 지능형 예측감시 시스템이 등장하고 있다. 지능형 예측감시 시스템의 추론을 위해서는 현재 및 과거의 데이터가 필요하며, 이러한 데이터의 분석을 통하여 곧 발생할 상황에 대한 예측을 가능하게 한다. 그러나, 이러한 과정에서 영상 객체의 개인정보를 취급하게 될 소지가 높으므로, 개인정보보호를 위해서는 보안에 대한 고려가 필수적이다. 특히, 개인의 생활패턴, 주요 이동 경로 등에 대한 정보가 해킹을 통하여 공개적으로 노출된다면 프라이버시 측면에서 문제가 될 것이다. 기존의 영상감시 프레임워크는 개인정보보호 측면에서 한계점이 있으며, 특히 개인정보보호에 취약한 측면이 있다. 본 논문에서는 개인정보보호를 고려한 지능형 예측감시 시스템을 위한 보안 프레임워크를 제안하였다. 제안한 방법에서는 단말, 전송, 감시, 모니터링 계층으로 구분하여 단위별 세부 구성요소를 명시하였으며, 특히 객체 단위별 세부 접근제어와 비식별화를 지원하여 영상감시 과정에서의 능동형 개인정보보호가 가능하다. 또한, 데이터 전송시 보안 기능과 RBAC 제공을 통한 접근제어의 장점을 갖는다.

회전한 상표 이미지의 진위 결정을 위한 기계 학습 데이터 확장 방법 (Machine Learning Data Extension Way for Confirming Genuine of Trademark Image which is Rotated)

  • 구본근
    • Journal of Platform Technology
    • /
    • 제8권1호
    • /
    • pp.16-23
    • /
    • 2020
  • 상표권 보호를 위한 상표 이미지의 진위 결정에 심층 신경망인 합성곱 신경망을 이용할 수 있다. 이를 위해, 상표로 등록되어 있는 한 장의 상표 이미지를 반복적으로 학습하는 것은 기계학습의 성능을 감소시키는 원인이 된다. 따라서, 이러한 응용에서 학습 데이터는 다양한 방법으로 생성된다. 하지만 대상 이미지가 회전되어 있으면 원본이라 하더라도 인식하지 못하거나 위조 상표로 분류되기도 한다. 본 논문에서는 회전한 상표 이미지의 진위 결정을 위한 기계학습 데이터의 확장 방법을 제안한다. 본 논문에서 제안하는 학습 데이터 확장 방법은 기울어진 이미지를 생성하고 이를 학습 데이터로 사용하는 것이다. 본 논문에서 제안하는 학습 데이터 확장 방법의 유효성 검증을 위해 대학의 로고를 대상으로 학습 데이터를 생성하였으며, 이를 활용하여 합성곱 신경망을 학습시킨 후 검증용 데이터를 이용하여 정확도를 평가하였다. 정확도 평가 결과에 따르면 본 논문에서 제안한 방법으로 생성한 학습 데이터를 활용하면 회전한 상표를 대상으로 한 진위 여부 결정에 합성곱 신경망을 활용할 수 있다.

  • PDF

Contextual Modeling in Context-Aware Conversation Systems

  • Quoc-Dai Luong Tran;Dinh-Hong Vu;Anh-Cuong Le;Ashwin Ittoo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권5호
    • /
    • pp.1396-1412
    • /
    • 2023
  • Conversation modeling is an important and challenging task in the field of natural language processing because it is a key component promoting the development of automated humanmachine conversation. Most recent research concerning conversation modeling focuses only on the current utterance (considered as the current question) to generate a response, and thus fails to capture the conversation's logic from its beginning. Some studies concatenate the current question with previous conversation sentences and use it as input for response generation. Another approach is to use an encoder to store all previous utterances. Each time a new question is encountered, the encoder is updated and used to generate the response. Our approach in this paper differs from previous studies in that we explicitly separate the encoding of the question from the encoding of its context. This results in different encoding models for the question and the context, capturing the specificity of each. In this way, we have access to the entire context when generating the response. To this end, we propose a deep neural network-based model, called the Context Model, to encode previous utterances' information and combine it with the current question. This approach satisfies the need for context information while keeping the different roles of the current question and its context separate while generating a response. We investigate two approaches for representing the context: Long short-term memory and Convolutional neural network. Experiments show that our Context Model outperforms a baseline model on both ConvAI2 Dataset and a collected dataset of conversational English.

Lightweight Attention-Guided Network with Frequency Domain Reconstruction for High Dynamic Range Image Fusion

  • 박재현;이근택;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.205-208
    • /
    • 2022
  • Multi-exposure high dynamic range (HDR) image reconstruction, the task of reconstructing an HDR image from multiple low dynamic range (LDR) images in a dynamic scene, often produces ghosting artifacts caused by camera motion and moving objects and also cannot deal with washed-out regions due to over or under-exposures. While there has been many deep-learning-based methods with motion estimation to alleviate these problems, they still have limitations for severely moving scenes. They also require large parameter counts, especially in the case of state-of-the-art methods that employ attention modules. To address these issues, we propose a frequency domain approach based on the idea that the transform domain coefficients inherently involve the global information from whole image pixels to cope with large motions. Specifically we adopt Residual Fast Fourier Transform (RFFT) blocks, which allows for global interactions of pixels. Moreover, we also employ Depthwise Overparametrized convolution (DO-conv) blocks, a convolution in which each input channel is convolved with its own 2D kernel, for faster convergence and performance gains. We call this LFFNet (Lightweight Frequency Fusion Network), and experiments on the benchmarks show reduced ghosting artifacts and improved performance up to 0.6dB tonemapped PSNR compared to recent state-of-the-art methods. Our architecture also requires fewer parameters and converges faster in training.

  • PDF

Deep learning-based AI constitutive modeling for sandstone and mudstone under cyclic loading conditions

  • Luyuan Wu;Meng Li;Jianwei Zhang;Zifa Wang;Xiaohui Yang;Hanliang Bian
    • Geomechanics and Engineering
    • /
    • 제37권1호
    • /
    • pp.49-64
    • /
    • 2024
  • Rocks undergoing repeated loading and unloading over an extended period, such as due to earthquakes, human excavation, and blasting, may result in the gradual accumulation of stress and deformation within the rock mass, eventually reaching an unstable state. In this study, a CNN-CCM is proposed to address the mechanical behavior. The structure and hyperparameters of CNN-CCM include Conv2D layers × 5; Max pooling2D layers × 4; Dense layers × 4; learning rate=0.001; Epoch=50; Batch size=64; Dropout=0.5. Training and validation data for deep learning include 71 rock samples and 122,152 data points. The AI Rock Constitutive Model learned by CNN-CCM can predict strain values(ε1) using Mass (M), Axial stress (σ1), Density (ρ), Cyclic number (N), Confining pressure (σ3), and Young's modulus (E). Five evaluation indicators R2, MAPE, RMSE, MSE, and MAE yield respective values of 0.929, 16.44%, 0.954, 0.913, and 0.542, illustrating good predictive performance and generalization ability of model. Finally, interpreting the AI Rock Constitutive Model using the SHAP explaining method reveals that feature importance follows the order N > M > σ1 > E > ρ > σ3.Positive SHAP values indicate positive effects on predicting strain ε1 for N, M, σ1, and σ3, while negative SHAP values have negative effects. For E, a positive value has a negative effect on predicting strain ε1, consistent with the influence patterns of conventional physical rock constitutive equations. The present study offers a novel approach to the investigation of the mechanical constitutive model of rocks under cyclic loading and unloading conditions.

중소유통기업지원을 위한 상품 카테고리 재분류 기반의 수요예측 및 상품추천 방법론 개발 (Development of the Demand Forecasting and Product Recommendation Method to Support the Small and Medium Distribution Companies based on the Product Recategorization)

  • 이상일;유영웅;나동길
    • 산업경영시스템학회지
    • /
    • 제47권2호
    • /
    • pp.155-167
    • /
    • 2024
  • Distribution and logistics industries contribute some of the biggest GDP(gross domestic product) in South Korea and the number of related companies are quarter of the total number of industries in the country. The number of retail tech companies are quickly increased due to the acceleration of the online and untact shopping trend. Furthermore, major distribution and logistics companies try to achieve integrated data management with the fulfillment process. In contrast, small and medium distribution companies still lack of the capacity and ability to develop digital innovation and smartization. Therefore, in this paper, a deep learning-based demand forecasting & recommendation model is proposed to improve business competitiveness. The proposed model is developed based on real sales transaction data to predict future demand for each product. The proposed model consists of six deep learning models, which are MLP(multi-layers perception), CNN(convolution neural network), RNN(recurrent neural network), LSTM(long short term memory), Conv1D-BiLSTM(convolution-long short term memory) for demand forecasting and collaborative filtering for the recommendation. Each model provides the best prediction result for each product and recommendation model can recommend best sales product among companies own sales list as well as competitor's item list. The proposed demand forecasting model is expected to improve the competitiveness of the small and medium-sized distribution and logistics industry.

된장의 쓴맛 펩타이드 특성 (Characteristics of bitter peptides from Doenjang)

  • 홍혜정;이혜수
    • 한국식품조리과학회지
    • /
    • 제10권1호
    • /
    • pp.45-50
    • /
    • 1994
  • 본 연구에서는 재래식 된장, Asp. oryzae를 이용한 고지와 소금의 배합을 달리한 개량식 된장 세가지(A; 쌀고지 :콩 :소금:53 : 100 : 33, B: 쌀고지 .콩 :소금=100 : 100 : 40, C: 쌀고지 :콩 :소금=200 : 100 : 40)를 만들어 일반 성분의 변화와 쓴맛 펩타이드의 특성을 살펴보고 쓴맛 펩타이드가 된장의 수응도에 어떠한 영향을 미치는지를 알아보았다. 1. 4가지 된장 모두 총질소는 발효기간 중 약간씩 증가하였으며 아미노산태 질소는 크게 증가하였다. 특히 재래식 된장의 아미노산태 질소는 다른 시료에 비해 큰폭의 증가를 보였다. 환원당은 쌀고지를 첨가한 된장의 경우 함량이 월등힌 많았으며 숙성됨에 따라 모든 된장이 증가 추세를 보였다. pH는 된장이 숙성됨에 따라 점차로 저하하였으며 고지가 첨가된 된장의 경우 더욱 산성을 띠었다. 2. 숙성시킨 된장에서 쓴맛 펩타이드의 특성을 알아보기 위해 소수성 펩타이드를 2 : 1(v/v) Chloroform-me-thanol로 추출하였다. 추출된 추출물을 겔 크로마토그래피를 사용하여 분자량별로 분리하고 다시 TLC로 정제하였다. 정제된 펩타이드는 쓴맛 검사를 하여서 쓴맛을 나타내는 펩타이드를 얻었다. 쓴맛 펩타이드의 아미노산 조성은 다음과 같다. 재래식 된장 peak 1-1. Trp-(Asp, Arg, Thr, Ser, Glu, Pro)-Phe 개량식 된장 B peak 1 Trp-(lie, Pro, Asp, Lys, Val, Glu)-Trp 개량식 된장 B peak 1 Trp-(lie, Pro, Asp, Lys, Val, Glu)-Trp 개량식 된장 C peak 1-2 Trp-(tyr, Thr, Glu, Pro, Gly)-Phe. 3. 관능검사의 결과를 Pearson 상관관계를 알아본 결과 쓴맛과 전체적인 수응도와의 상관관계는 높지 않았다.

  • PDF