• 제목/요약/키워드: deep similarity

검색결과 223건 처리시간 0.019초

이중 동종 CNN 구조를 이용한 ASL 알파벳의 이미지 분류 (Classifying Images of The ASL Alphabet using Dual Homogeneous CNNs Structure)

  • 어니요조브 쇼크루크;권만성;박성종;김광준
    • 한국전자통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.449-458
    • /
    • 2023
  • 많은 사람들이 수화는 청각 장애가 있고 말을 할 수 없는 사람들을 위한 것이라고 생각하지만 물론 그들과 대화하고 싶은 사람들에게 필요하다. ASL(: American Sign Language) 알파벳 인식에서 가장 큰 문제 중 하나는 높은 클래스 간 유사성과 높은 클래스 내 분산이다. 본 논문에서는 이 두 가지 문제점을 극복할 수 있는 유사도 학습을 수행하여 이미지 간의 클래스 간 유사도와 클래스 내 분산을 줄이는 아키텍처를 제안하였다. 제안된 아키텍처는 매개변수(가중치 및 편향)를 공유하는 이중으로 구성된 동일한 컨벌루션 신경망으로 구성하고 또한 이 경로를 통해 유사도 학습과 분산을 줄이는 Keras API를 적용하였다. 이중 동종 CNN을 사용한 유사성 학습 결과는 두 클래스의 좋지 않은 결과를 포함하지 않음으로써 클래스 간 유사성과 변동성을 줄임으로서 정확도가 개선된 결과를 나타내고 있다.

DenseNet을 활용한 식물 잎 분류 방안 연구 (Classification Method of Plant Leaf using DenseNet)

  • 박용민;강수명;채지훈;이준재
    • 한국멀티미디어학회논문지
    • /
    • 제21권5호
    • /
    • pp.571-582
    • /
    • 2018
  • Recently, development of deep learning has shown better image classification result than human. According to recent research, a hidden layer of deep learning is deeper, and a preservation of extracted features shows good results. However, in the case of general images, the extracted features are clear and easy to sort. This study aims to classify plant leaf images. This plant leaf image has high similarity in each image. Since plant leaf images have high similarity not only between images of different species but also within the same species, classification accuracy is not increased by simply extending the hidden layer or connecting the layers. Therefore, in this paper, we tried to improve the hidden layer of the algorithm called DenseNet which shows the recent excellent classification results, and compare the results of several different modified layers. The proposed method makes it possible to classify plant leaf images collected in a natural environment more easily and accurately than conventional methods. This results in good classification of plant leaf image data including unnecessary noise obtained in a natural environment.

DEXA에서 딥러닝 기반의 척골 및 요골 자동 분할 모델 (Automated Ulna and Radius Segmentation model based on Deep Learning on DEXA)

  • 김영재;박성진;김경래;김광기
    • 한국멀티미디어학회논문지
    • /
    • 제21권12호
    • /
    • pp.1407-1416
    • /
    • 2018
  • The purpose of this study was to train a model for the ulna and radius bone segmentation based on Convolutional Neural Networks and to verify the segmentation model. The data consisted of 840 training data, 210 tuning data, and 200 verification data. The learning model for the ulna and radius bone bwas based on U-Net (19 convolutional and 8 maximum pooling) and trained with 8 batch sizes, 0.0001 learning rate, and 200 epochs. As a result, the average sensitivity of the training data was 0.998, the specificity was 0.972, the accuracy was 0.979, and the Dice's similarity coefficient was 0.968. In the validation data, the average sensitivity was 0.961, specificity was 0.978, accuracy was 0.972, and Dice's similarity coefficient was 0.961. The performance of deep convolutional neural network based models for the segmentation was good for ulna and radius bone.

Short-time Fourier transform 소음맵을 이용한 컨볼루션 기반 BSR (Buzz, Squeak, Rattle) 소음 분류 (BSR (Buzz, Squeak, Rattle) noise classification based on convolutional neural network with short-time Fourier transform noise-map)

  • 부석준;문세민;조성배
    • 한국음향학회지
    • /
    • 제37권4호
    • /
    • pp.256-261
    • /
    • 2018
  • 차량 내부에는 BSR(Buzz, Squeak, Rattle) 세 가지 유형의 소음이 발생한다. 본 논문에서는 심층 컨볼루션 신경망으로 추출한 소음 특징에 기반하여 자동으로 차량 내부의 BSR 소음을 분류하는 분류기를 제안한다. 차량 내부의 소음은 전처리 단계에서 STFT(Short-time Fourier Transform) 알고리즘을 사용하여 소음 맵으로 표현된다. 생성된 소음 맵 내부에서 실제 소음의 위치를 정확하게 파악하기 어려운 문제에 대처하기 위해서 슬라이딩 윈도우 방법으로 분할하였다. 본 논문에서는 t-SNE(t-Stochastic Neighbor Embedding) 알고리즘을 사용하여 심층 컨볼루션 신경망 내부 파라미터를 시각화하고 정성적인 방식으로 오분류데이터를 분석하였다. 분류된 데이터의 정량적인 분석을 위해 소음의 종류별 유사도를 SSIM(Structural Similarity Index) 수치에 기반하여 정량화하여 리트랙터의 떨림음이 정상주행음과 가장 유사하다는 것을 밝혔다. 제안하는 방법의 분류기는 기타 기계학습 알고리즘 대비 최고 분류 정확도를 달성하였다(99.15%).

딥러닝과 Char2Vec을 이용한 문장 유사도 판별 (The Sentence Similarity Measure Using Deep-Learning and Char2Vec)

  • 임근영;조영복
    • 한국정보통신학회논문지
    • /
    • 제22권10호
    • /
    • pp.1300-1306
    • /
    • 2018
  • 본 연구는 자연어 처리 문제 중 하나인 문장 유사도 판별 문제를 딥러닝으로 해결하는 데에 있어 Char2Vec기반으로 문장을 전 처리하고 학습시켜 그 성능을 확인하고 대표적인 Word Embedding 모델 Word2Vec를 대체할 수 있는 가능성이 있는지 파악하고자 한다. 임의의 두 문장을 비교할 때 쓰는 딥러닝 구조로 Siamese Ma-STM 네트워크를 사용하였다. Word2Vec와 Char2Vec를 각각 기반으로 한 문장 유사도 판별 모델을 학습시키고 그 결과를 분석하였다. 실험 결과 Char2Vec를 기반으로 학습시킨 모델이 validation accuracy 75.1%을 보였고 Word2Vec를 기반으로 학습시킨 모델은 validation accuracy 71.6%를 보였다. 따라서 고 사양을 요구하는 Word2Vec대신 임베딩 레이어를 활용한 Char2Vec 기반의 전처리 모델을 활용함으로 분석 환경을 최적화 할 수 있다.

딥러닝을 이용한 강좌 추천시스템 (Course recommendation system using deep learning)

  • 임민아;황승연;신동진;오재곤;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.193-198
    • /
    • 2023
  • 딥러닝을 이용한 학습자 맞춤 강의 추천 프로젝트를 연구한다. 추천시스템은 웹과 앱에서 쉽게 발견할 수 있으며 이 특성을 이용한 예제는 사용자 클릭으로 특성 영상 추천과 SNS에서 평소 사용자가 관심 있던 분야의 아이템을 광고하는 것이 있다. 본 연구에서는 문장 유사도인 Word2Vec를 주로 이용하여 2번의 필터링을 거쳤으며 Surprise 라이브러리를 통해 강좌 추천을 하였다. 이러한 시스템으로 사용자에게 간편하고 편리하게 원하는 분류의 강좌 데이터를 제공한다. Surprise 라이브러리는 Python scikit-learn 기반의 라이브러리이며 추천시스템에 편리하게 사용된다. 데이터를 분석하여 시스템을 빠른 속도로 구현하고 딥러닝을 사용하여 강좌 단계를 거쳐 보다 더 정밀한 결과를 구현해낸다. 사용자가 관심 있는 키워드를 입력하면 해당 키워드와 강좌 제목과의 유사도를 실행하고 추출된 영상 데이터로 또 음성 텍스트와의 유사도를 실행하여 추출된 데이터로 Surprise 라이브러리를 통해 가장 높은 순위의 영상 데이터를 추천한다.

Siamese 네트워크 기반 SAR 표적영상 간 유사도 분석 (Similarity Analysis Between SAR Target Images Based on Siamese Network)

  • 박지훈
    • 한국군사과학기술학회지
    • /
    • 제25권5호
    • /
    • pp.462-475
    • /
    • 2022
  • Different from the field of electro-optical(EO) image analysis, there has been less interest in similarity metrics between synthetic aperture radar(SAR) target images. A reliable and objective similarity analysis for SAR target images is expected to enable the verification of the SAR measurement process or provide the guidelines of target CAD modeling that can be used for simulating realistic SAR target images. For this purpose, this paper presents a similarity analysis method based on the siamese network that quantifies the subjective assessment through the distance learning of similar and dissimilar SAR target image pairs. The proposed method is applied to MSTAR SAR target images of slightly different depression angles and the resultant metrics are compared and analyzed with qualitative evaluation. Since the image similarity is somewhat related to recognition performance, the capacity of the proposed method for target recognition is further checked experimentally with the confusion matrix.

Corneal Ulcer Region Detection With Semantic Segmentation Using Deep Learning

  • Im, Jinhyuk;Kim, Daewon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.1-12
    • /
    • 2022
  • 안과 환자의 질병을 판단하기 위해서는 특수 촬영 장비를 통해 찍은 안구영상을 이용한 안과의사의 주관적 판단의 개입이 전통적으로 활용되고 있다. 본 연구에서는 안과 의료진이 질병을 판단할 때 보조적 도움이 될 수 있도록 객관적 진단결과를 제시해주는 각막궤양 의미론적 분할방법에 대하여 제안하였다. 이를 위해 DeepLab 모델을 활용하였고 그 중 Backbone network으로 Xception과 ResNet 네트워크를 이용하였다. 실험결과를 나타내기 위한 평가지표로 다이스 유사계수와 IoU 값을 이용하였고 ResNet101 네트워크를 사용하였을 때 'crop & resized' 이미지에 대해 최대 평균 정확도 93%의 다이스 유사계수 값을 보였다. 본 연구는 객체 검출을 위한 의미론적 분할모델 또한 안구의 각막궤양 부분과 같은 불규칙하고 특이한 모양을 추출하고 분류하는데 뛰어난 결과를 도출할 수 있는 성능을 보유하고 있음을 보여주었다. 향후 학습용 Dataset을 양적으로 보강하여 실험결과의 정확도를 제고할 수 있도록 하고 실제 의료진단 환경에서 구현되어 사용되어 질 수 있도록 할 계획이다.

북동태평양 한국 망간단괴 광구해역에서 환경충격 시험지역과 보존지역간의 수층환경 및 침강입자 플럭스 유사성 비교 (Evaluation of Similarity of Water Column Properties and Sinking Particles between Impact and Preserved Sites for Environmental Impact Assessment in the Korea Contracted Area for Manganese Nodule Development, NE Pacific)

  • 손주원;김경홍;김형직;주세종;유찬민
    • Ocean and Polar Research
    • /
    • 제36권4호
    • /
    • pp.423-435
    • /
    • 2014
  • Verifying the similarity of environmental characteristics between an artificial impact site and a preserved or reference site is necessary to quantitatively and qualitatively evaluate the environmental impact of mining activity. Although an impact site (BIS station) and a preserved site (called KOMO station) that have been selected in the Korea manganese nodule contract area may share similar environmental characteristics, similarities in terms of the water column environment between both sites has not been investigated. In this study, we compared the chemical properties of the water columns and sinking particle fluxes between BIS and KOMO stations through two observations (August 2011 and September 2012). Additionally, we observed particle fluxes at the KOMO station for five years (July 2003~July 2008) to understand long-term natural variability. Vertical distributions of water column properties such as dissolved oxygen, inorganic nutrients (N, P, Si), total organic carbon below surface layer (within the depth range of 200 m) were not considerably different between the two sites. Especially, values of water column parameters in the abyssopelagic zone from 4000 m to bottom layer (~5000 m) were very similar between the BIS and KOMO sites. Sinking particle fluxes from the two sites also showed similar seasonality. However, natural variation of particle flux at the KOMO site varied from 3.5 to $129.9mg\;m^{-2}day^{-1}$, with a distinct temporal variation originating from ENSO events (almost forty times higher than a minimum value). These results could provide valuable information to more exactly evaluate the environmental impact of mining activity on water columns.

Deep Learning-Based Low-Light Imaging Considering Image Signal Processing

  • Minsu, Kwon
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.19-25
    • /
    • 2023
  • 이 논문에서는 image signal processing 을 고려하여 저조도에서 촬영된 저품질의 raw 이미지를 딥러닝에 기반하여 개선하는 방법을 제안한다. 스마트폰 카메라의 경우 DSLR 카메라에 비해 렌즈나 센서의 확장에 제약이 있어 저조도 상황에서 이미지에 노이즈가 증가되고 품질이 저하되는 문제점을 보인다. 기존 딥러닝 기반 저조도 이미지 처리 방식은 image signal processing의 주요 요소인 렌즈 쉐이딩 효과와 화이트 밸런스를 고려하지 못하여 부자연스러운 이미지를 생성하기도 한다. 본 논문에서는 렌즈 쉐이딩 효과와 화이트 밸런스를 딥러닝 모델에 적용하기 위해 중심거리와 채널 평균을 활용한다. 스마트폰으로 촬영된 저조도 이미지를 통한 실험에서 제안하는 방법이 기존 방법에 비해 더 높은 peak signal to noise ratio 와 structural similarity index measure를 달성함과 동시에 높은 품질의 저조도 이미지를 생성함을 확인한다.