• 제목/요약/키워드: Deep-Learning

검색결과 5,689건 처리시간 0.034초

MEDU-Net+: a novel improved U-Net based on multi-scale encoder-decoder for medical image segmentation

  • Zhenzhen Yang;Xue Sun;Yongpeng, Yang;Xinyi Wu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권7호
    • /
    • pp.1706-1725
    • /
    • 2024
  • The unique U-shaped structure of U-Net network makes it achieve good performance in image segmentation. This network is a lightweight network with a small number of parameters for small image segmentation datasets. However, when the medical image to be segmented contains a lot of detailed information, the segmentation results cannot fully meet the actual requirements. In order to achieve higher accuracy of medical image segmentation, a novel improved U-Net network architecture called multi-scale encoder-decoder U-Net+ (MEDU-Net+) is proposed in this paper. We design the GoogLeNet for achieving more information at the encoder of the proposed MEDU-Net+, and present the multi-scale feature extraction for fusing semantic information of different scales in the encoder and decoder. Meanwhile, we also introduce the layer-by-layer skip connection to connect the information of each layer, so that there is no need to encode the last layer and return the information. The proposed MEDU-Net+ divides the unknown depth network into each part of deconvolution layer to replace the direct connection of the encoder and decoder in U-Net. In addition, a new combined loss function is proposed to extract more edge information by combining the advantages of the generalized dice and the focal loss functions. Finally, we validate our proposed MEDU-Net+ MEDU-Net+ and other classic medical image segmentation networks on three medical image datasets. The experimental results show that our proposed MEDU-Net+ has prominent superior performance compared with other medical image segmentation networks.

Research on Ocular Data Analysis and Eye Tracking in Divers

  • Ye Jun Lee;Yong Kuk Kim;Da Young Kim;Jeongtack Min;Min-Kyu Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권8호
    • /
    • pp.43-51
    • /
    • 2024
  • 본 논문은 수중 활동을 주로 하는 다이버를 대상으로 특수 목적용 다이버 마스크를 이용해서 안구 데이터를 획득 및 분석하고, 이를 이용해서 사용자의 시선을 추적하는 방법에 대해 제안한다. 안구 데이터 분석을 위해 자체 제작한 안구 데이터 셋을 구축하였고, YOLOv8-nano 모델을 활용해서 학습 모델을 생성하였다. 학습 모델의 프레임 당 소요 시간은 평균 45.52ms를 달성하였고, 눈을 뜬 상태와 감는 상태를 구별하는 인식 성공률은 99%를 달성하였다. 안구 데이터 분석 결과를 바탕으로 현실 세계 좌표를 매칭할 수 있는 시선 추적 알고리즘을 개발하였다. 이 알고리즘의 검증 결과 x축은 약 1%, y축은 약 6%의 평균 오차율을 나타내는 것을 알 수 있었다.

Driver Group Clustering Technique and Risk Estimation Method for Traffic Accident Prevention

  • Tae-Wook Kim;Ji-Woong Yang;Hyeon-Jin Jung;Han-Jin Lee;Ellen J. Hong
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권8호
    • /
    • pp.53-58
    • /
    • 2024
  • 교통사고는 인간의 생명뿐만 아니라 사회적으로 큰 비용을 발생시키는 문제이다. 최근에는 교통사고 문제를 해결하기 위하여, 딥러닝 기술과 도로의 시공간적 정보를 통해 교통사고 위험도를 예측하는 연구가 진행되었다. 그러나 교통사고는 도로의 시공간적 정보뿐만 아니라 인적요소 또한 교통사고에 매우 큰 영향을 미치지만 이에 대한 연구는 상대적으로 활성화되지 않았다. 본 논문은 교통사고 데이터셋을 바탕으로 클러스터링 기법을 적용하여 운전자 그룹 및 특성을 분석하였으며, 각 운전자 그룹 및 특성에 대한 위험도를 산출하는 방법을 제시 및 적용하였다. 이 과정에서 본 논문에서 제시한 전처리 기법이 기존에 일반적으로 사용되었던 원-핫 임베딩, Min-Max Scaling 기법보다 더 높은 성능을 보임으로써 더 적합한 전처리 기법임을 보였다.

CNN 기반 슬관절 골관절염 중증도 판단을 위한 통합 보완된 등급 판정 시스템 (An Integrated and Complementary Evaluation System for Judging the Severity of Knee Osteoarthritis Using CNN)

  • 윤예찬
    • 한국산업정보학회논문지
    • /
    • 제29권4호
    • /
    • pp.77-89
    • /
    • 2024
  • 슬관절 골관절염(OA, Osteoarthritis)은 전 세계적으로 매우 흔한 근골격계 질환이다. 빠르고 정확한 초기 진단이 필요한 슬관절 골관절염의 등급은 현재 분산된 분류 시스템에 따라 다르게 판정되며, 각 분류 시스템마다 기준이 상이하다. 또한 의료진이 X-ray 사진을 직접 보고 판독하기 때문에 의료진의 주관적인 의견에 따라 달라지며 시간이 많이 소요되어 정확한 진단과 명확한 치료 계획 수립에 시간이 지연되고 있다. 따라서 본 연구는 딥러닝 기술인 CNN을 사용하여 슬관절 골관절염 등급 판단 기준이 되는 협착 부분의 길이 측정 알고리즘과 골극의 탐지 및 길이 측정 알고리즘을 따로 설계하였다. 또한 기존 분류 시스템을 통합 보완한 등급 분류 시스템을 만들어 실제 의료진의 판단과 일치하는 결과를 나타내고자 한다. 공개적으로 사용 가능한 OAI (Osteoarthritis Initiative) 데이터를 기반으로 하여, 총 9,786개의 슬관절 방사선 데이터가 본 연구에 사용되었으며, 최종적으로 Accuracy(정확도) 69.8%, F1 score 76.65%를 달성하였다.

감시 시스템에서 궤적 분류를 이용한 이상 탐지 방법 (Anomaly Detection Method Based on Trajectory Classification in Surveillance Systems)

  • 서정훈;황지인;팔 아비쉑;이하은;고대식;송석일
    • Journal of Platform Technology
    • /
    • 제12권3호
    • /
    • pp.62-70
    • /
    • 2024
  • 최근의 감시 시스템은 카메라, 레이더 등 다양한 센서를 중복 사용하여 침입 탐지의 정확도를 향상시키려는 노력을 기울이고 있다. 그러나 야간, 악천후, 침입자의 위장 등으로 인해 카메라(RGB, Thermal) 센서를 통한 객체 인식이 정확하지 않을 때도 있다. 이러한 상황에서는 카메라나 레이더 센서를 통해 추출된 객체의 궤적을 활용하여 침입자를 탐지할 수 있다. 본 논문에서는 객체 인식이 어려운 환경에서 궤적 정보만을 이용하여 침입자를 탐지하는 방법을 제안한다. 제안하는 방법은 동물, 사람의 정상 및 비정상(침입, 배회) 궤적 데이터를 이용하여 LSTM-Attention 기반 궤적 분류 모델을 학습하고, 이 모델을 이용해서 사람의 비정상 궤적을 찾아내서 침입 탐지를 수행한다. 마지막으로, 제안하는 방법의 타당성을 실 데이터를 이용한 실험을 통해 입증한다.

  • PDF

Automated 3D scoring of fluorescence in situ hybridization (FISH) using a confocal whole slide imaging scanner

  • Ziv Frankenstein;Naohiro Uraoka;Umut Aypar;Ruth Aryeequaye;Mamta Rao;Meera Hameed;Yanming Zhang;Yukako Yagi
    • Applied Microscopy
    • /
    • 제51권
    • /
    • pp.4.1-4.12
    • /
    • 2021
  • Fluorescence in situ hybridization (FISH) is a technique to visualize specific DNA/RNA sequences within the cell nuclei and provide the presence, location and structural integrity of genes on chromosomes. A confocal Whole Slide Imaging (WSI) scanner technology has superior depth resolution compared to wide-field fluorescence imaging. Confocal WSI has the ability to perform serial optical sections with specimen imaging, which is critical for 3D tissue reconstruction for volumetric spatial analysis. The standard clinical manual scoring for FISH is labor-intensive, time-consuming and subjective. Application of multi-gene FISH analysis alongside 3D imaging, significantly increase the level of complexity required for an accurate 3D analysis. Therefore, the purpose of this study is to establish automated 3D FISH scoring for z-stack images from confocal WSI scanner. The algorithm and the application we developed, SHIMARIS PAFQ, successfully employs 3D calculations for clear individual cell nuclei segmentation, gene signals detection and distribution of break-apart probes signal patterns, including standard break-apart, and variant patterns due to truncation, and deletion, etc. The analysis was accurate and precise when compared with ground truth clinical manual counting and scoring reported in ten lymphoma and solid tumors cases. The algorithm and the application we developed, SHIMARIS PAFQ, is objective and more efficient than the conventional procedure. It enables the automated counting of more nuclei, precisely detecting additional abnormal signal variations in nuclei patterns and analyzes gigabyte multi-layer stacking imaging data of tissue samples from patients. Currently, we are developing a deep learning algorithm for automated tumor area detection to be integrated with SHIMARIS PAFQ.

해충 카운팅의 정확성 향상을 위한 Dual Block 기반의 새로운 Mada-CenterNet (A new Mada-CenterNet based on Dual Block to improve accuracy of pest counting)

  • 곽희진;이철희;손창환
    • 전기전자학회논문지
    • /
    • 제28권3호
    • /
    • pp.342-351
    • /
    • 2024
  • 농업 분야에서 해충에 대한 효과적인 방제는 작물 생산성 향상에 필수적인 요소이다. 해충의 방제를 위해서는 해충의 종류, 발생 시기는 물론이며, 해충의 발생량에 대한 정보가 필요하다. 해충의 발생량을 파악하는 방법인 해충 카운팅 관련 선행 연구인, Mada-CenterNet은 변형 가능한 컨볼루션과 멀티스케일 어텐션 퓨전을 활용하여 해충 카운팅의 정확도를 향상시켰으며 해당 분야에서 가장 우수하다고 보고되고 있다. 본 연구에서는 Mada-CenterNet의 트랜스포머 구조인 멀티스케일 어텐션 대체하는 새로운 트랜스포머 구조인 듀얼 블록을 적용하였으며, 픽셀 경로와 시맨틱 경로의 교차 어텐션을 통해 더욱 정교한 특징 맵을 추출하였다. 실험 결과, 제안된 모델은 기존 Mada-CenterNet보다 해충 카운팅 정확도가 우수함과 동시에 폐색 문제와 해충의 몸체 손상, 다양한 모습으로 인한 탐지의 어려움을 효과적으로 완화하였다. 기존 해충 카운팅의 방법과 달리, 인력 및 시간 비용을 절감할 수 있다는 장점을 확보할 수 있으며 물체의 계수가 필요한 다른 농업 분야에도 활용이 가능할 것으로 기대된다.

피부병변 영상 분할의 성능향상을 위한 VmCUnet (VmCUnet for Improving the Performance of Skin lesion Image Segmentation)

  • 김홍진;이태희;황우성;최명렬
    • 전기전자학회논문지
    • /
    • 제28권3호
    • /
    • pp.405-411
    • /
    • 2024
  • 본 논문에서는 피부병변 영상에서 이미지 분할 성능을 향상시키기 위해 설계된 딥러닝 모델인 VmCUnet을 제안한다. VmCUnet은 Vm-UnetV2와 CIM(Cross-Scale Interaction Module)을 결합하여 인코더의 각 계층에서 추출한 특징들을 CIM으로 통합하여 다양한 패턴과 경계를 정확하게 인식할 수 있다. VmCUnet은 ISIC-2017와 ISIC-2018 데이터 세트를 사용하여 피부 병변의 이미지 분할을 수행하였고 Unet, TransUnet, SwinUnet Vm-Unet, Vm-UnetV2와 비교하여 성능 지표인 IoU, Dice Score에서 더 높은 성능을 보였다. 향후 작업에서는 다양한 의료 영상 데이터 세트에 대한 추가 실험을 수행하여 VmCUnet 모델의 일반화 성능을 검증할 예정이다.

실시간 항공영상 기반 UAV-USV 간 협응 유도·제어 알고리즘 개발 (A Study on a Real-Time Aerial Image-Based UAV-USV Cooperative Guidance and Control Algorithm )

  • 김도균;김정현;손희훈;최시웅;김동한;여찬영;박종용
    • 대한조선학회논문집
    • /
    • 제61권5호
    • /
    • pp.324-333
    • /
    • 2024
  • This paper focuses on the cooperation between Unmanned Aerial Vehicle (UAV) and Unmanned Surface Vessel (USV). It aims to develop efficient guidance and control algorithms for USV based on obstacle identification and path planning from aerial images captured by UAV. Various obstacle scenarios were implemented using the Robot Operating System (ROS) and the Gazebo simulation environment. The aerial images transmitted in real-time from UAV to USV are processed using the computer vision-based deep learning model, You Only Look Once (YOLO), to classify and recognize elements such as the water surface, obstacles, and ships. The recognized data is used to create a two-dimensional grid map. Algorithms such as A* and Rapidly-exploring Random Tree star (RRT*) were used for path planning. This process enhances the guidance and control strategies within the UAV-USV collaborative system, especially improving the navigational capabilities of the USV in complex and dynamic environments. This research offers significant insights into obstacle avoidance and path planning in maritime environments and proposes new directions for the integrated operation of UAV and USV.

상처와 주름이 있는 지문 판별에 효율적인 심층 학습 비교연구 (A Comparative Study on the Effective Deep Learning for Fingerprint Recognition with Scar and Wrinkle)

  • 김준섭;림빈 보니카;성낙준;홍민
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.17-23
    • /
    • 2020
  • 인간의 특성과 관련된 측정 항목을 나타내는 생체정보는 도난이나 분실의 염려가 없으므로 높은 신뢰성을 가진 보안 기술로서 큰 주목을 받고 있다. 이러한 생체정보 중 지문은 본인 인증, 신원 파악 등의 분야에 주로 사용된다. 신원을 파악할 때 지문 이미지에 인증을 수행하기 어려운 상처, 주름, 습기 등의 문제가 있을 경우, 지문 전문가가 전처리단계를 통해 직접 지문에 어떠한 문제가 있는지 파악하고 문제에 맞는 영상처리 알고리즘을 적용해 문제를 해결한다. 이때 지문에 상처와 주름이 있는 지문 영상을 판별해주는 인공지능 소프트웨어를 구현하면 손쉽게 상처나 주름의 여부를 확인할 수 있고, 알맞은 알고리즘을 선정해 쉽게 지문 이미지를 개선할 수 있다. 본 연구에서는 이러한 인공지능 소프트웨어의 개발을 위해 캄보디아 왕립대학교의 학생 1,010명, Sokoto 오픈 데이터셋 600명, 국내 학생 98명의 모든 손가락 지문을 취득해 총 17,080개의 지문 데이터베이스를 구축했다. 구축한 데이터베이스에서 상처나 주름이 있는 경우를 판별하기 위해 기준을 확립하고 전문가의 검증을 거쳐 데이터 어노테이션을 진행했다. 트레이닝 데이터셋과 테스트 데이터셋은 캄보디아의 데이터, Sokoto 데이터로 구성하였으며 비율을 8:2로 설정했다. 그리고 국내 학생 98명의 데이터를 검증 데이터 셋으로 설정했다, 구성된 데이터셋을 사용해 Classic CNN, AlexNet, VGG-16, Resnet50, Yolo v3 등의 다섯 가지 CNN 기반 아키텍처를 구현해 학습을 진행했으며 지문의 상처와 주름 판독에서 가장 좋은 성능을 보이는 모델을 찾는 연구를 수행했다. 다섯가지 아키텍처 중 지문 영상에서 상처와 주름 여부를 가장 잘 판별할 수 있는 아키텍처는 ResNet50으로 검증 결과 81.51%로 가장 좋은 성능을 보였다.