• 제목/요약/키워드: Instance Segmentation

검색결과 67건 처리시간 0.035초

Size Estimation for Shrimp Using Deep Learning Method

  • Heng Zhou;Sung-Hoon Kim;Sang-Cheol Kim;Cheol-Won Kim;Seung-Won Kang
    • 스마트미디어저널
    • /
    • 제12권3호
    • /
    • pp.112-119
    • /
    • 2023
  • Shrimp farming has been becoming a new source of income for fishermen in South Korea. It is often necessary for fishers to measure the size of the shrimp for the purpose to understand the growth rate of the shrimp and to determine the amount of food put into the breeding pond. Traditional methods rely on humans, which has huge time and labor costs. This paper proposes a deep learning-based method for calculating the size of shrimps automatically. Firstly, we use fine-tuning techniques to update the Mask RCNN model with our farm data, enabling it to segment shrimps and generate shrimp masks. We then use skeletonizing method and maximum inscribed circle to calculate the length and width of shrimp, respectively. Our method is simple yet effective, and most importantly, it requires a small hardware resource and is easy to deploy to shrimp farms.

인스턴스 세그멘테이션 기반 토마토 병충해 탐지 모델 구현 및 적용성 평가 (Instance Segmentation Based Tomato Pests Disease Detection for Feasibility Evaluation)

  • 김은경;박준용;문용혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.417-419
    • /
    • 2022
  • 농축업에 ICT 기술을 접목한 스마트 팜은 생육환경을 자동으로 조절하여 노동력 등을 줄이고도 생산성과 품질을 향상시키는 것이 큰 장점이다. 하지만, 수익으로 이어지는 출하량과 품질 유지를 위해서 병충해에 주의를 기울여야 함은 여전하다. 따라서 토마토 잎 병충해 발생 시, 적절한 대응을 통해 더 큰 피해를 막을 수 있으므로, 초기 증상을 포착하는 기법을 개발한다. 오픈 데이터 셋인 Ai hub 의 시설작물 질병 데이터셋과 추가로 확보한 샘플을 포함해 2 개의 충해, 4 개의 병해에 1,231 장으로 데이터셋을 직접 구성해서 학습했다. 객체 탐지와 세그먼테이션이 동시에 가능하며 작은 병변도 잘 탐지하는 모델을 사용해서 총 6 가지 병충해에 대한 뚜렷한 증상 탐지를 보여주었다.

공사현장 자재관리 자동화를 위한 영상기반 인공지능 모델개발 (Development of Image-Based Artificial Intelligence Model to Automate Material Management at Construction Site)

  • 신윤수;김준희
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2021년도 가을 학술논문 발표대회
    • /
    • pp.221-222
    • /
    • 2021
  • Conventionally, in material management at a construction site, the type, size, and quantity of materials are identified by the eyes of the worker. Labor-intensive material management by manpower is slow, requires a lot of manpower, is prone to errors, and has limitations in that computerization of information on the identified types and quantities is additionally required. Therefore, a method that can quickly and accurately determine the type, size, and quantity of materials with a minimum number of workers is required to reduce labor costs at the construction site and improve work efficiency. In this study, we developed an automated convolution neural network(CNN) and computer vision technology-based rebar size and quantity estimation system that can quickly and accurately determine the type, size, and quantity of materials through images.

  • PDF

Swin Transformer를 이용한 항공사진에서 다중클래스 차량 검출 (The Detection of Multi-class Vehicles using Swin Transformer)

  • 이기춘;정유석;이창우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.112-114
    • /
    • 2021
  • 도시 상태를 탐지하기 위해서는 운송 수단 수, 교통 흐름등이 필수적으로 파악되어야 할 요소이다. 본 논문에서는 기존의 Mask R-CNN을 이용하여 다양한 차량의 형태를 학습하고, 드론으로 촬영한 도시항공 영상에서 특정 유형의 차량 들을 검출하는 시스템을 오늘날 NLP 분야에서 널리 쓰이게 된 Transformer 모델을 컴퓨터 비전 문제에 도입하여 기존의 컨볼루션 신경망보다 높은 성능을 보여준 Swin Transformer 모델을 이용하여 기존의 연구에서 보여주었던 검출 시스템 능력을 향상시켰다.

  • PDF

비디오 데이터 보강을 이용한 인물 개체 분할 (Human Instance Segmentation using Video Data Augmentation)

  • 전현진;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.532-534
    • /
    • 2022
  • 본 논문에서는 미생 드라마 비디오들을 토대로 구축한 비디오 인물 개체 분할 데이터 집합인 MHIS를 소개하고, 등장인물 클래스 간의 심각한 데이터 불균형 문제를 효과적으로 해결하기 위한 새로운 비디오 데이터 보강 기법인 CDVA를 제안한다. 기존의 비디오 데이터 보강 기법들과는 달리, 새로운 CDVA 보강 기법은 비디오의 시공간적 맥락을 충분히 고려해서 부족한 인물 클래스의 훈련 비디오 데이터들을 추가 생성함으로써, 비디오 개체 분할 신경망 모델의 성능을 효과적으로 개선시킬 수 있다. 본 논문에서는 정량 및 정성 실험들을 통해, 제안 비디오 데이터 보강 기법의 우수성을 입증한다.

Transfer-learning-based classification of pathological brain magnetic resonance images

  • Serkan Savas;Cagri Damar
    • ETRI Journal
    • /
    • 제46권2호
    • /
    • pp.263-276
    • /
    • 2024
  • Different diseases occur in the brain. For instance, hereditary and progressive diseases affect and degenerate the white matter. Although addressing, diagnosing, and treating complex abnormalities in the brain is challenging, different strategies have been presented with significant advances in medical research. With state-of-art developments in artificial intelligence, new techniques are being applied to brain magnetic resonance images. Deep learning has been recently used for the segmentation and classification of brain images. In this study, we classified normal and pathological brain images using pretrained deep models through transfer learning. The EfficientNet-B5 model reached the highest accuracy of 98.39% on real data, 91.96% on augmented data, and 100% on pathological data. To verify the reliability of the model, fivefold cross-validation and a two-tier cross-test were applied. The results suggest that the proposed method performs reasonably on the classification of brain magnetic resonance images.

영상장비와 딥러닝을 이용한 고속도로 터널 균열 탐지 시스템 개발 (Development of Crack Detection System for Highway Tunnels using Imaging Device and Deep Learning)

  • 김병현;조수진;채홍제;김홍기;강종하
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제25권4호
    • /
    • pp.65-74
    • /
    • 2021
  • 빠르게 증가하는 노후 터널을 효율적으로 관리하기 위하여 최근 영상장비를 이용한 점검 방법론들이 많이 제안되고 있다. 하지만 기존의 방법론들은 대부분 국한된 영역에서 검증을 수행하였을 뿐 아니라, 다른 물체들이 존재하지 않는 깨끗한 콘크리트 표면에서 검증되어 실제 현장에 대한 적용성을 검증하기 어려웠다. 따라서 본 논문에서는 이러한 한계를 극복하기 위하여 비균열 물체 학습에 기반한 6단계 터널 균열 탐지 딥러닝 모델 개발 프레임워크를 제안한다. 제안된 프레임워크는 터널에서 취득된 이미지 내 균열 탐색, 픽셀 단위 균열 라벨링, 딥러닝 모델 학습, 비균열 물체 수집, 비균열 물체 재학습, 최종 학습 데이터 구축의 총 6단계로 이루어진다. 제안된 프레임워크를 이용하여 개발된 균열 탐지 딥러닝 모델 개발을 수행하였으며, 일반 균열 1561장, 비균열 206장으로 개별 물체 세분화(Instance Segmentation) 모델인 Cascade Mask R-CNN을 학습시켰다. 학습된 모델의 현장 적용성을 검토하기 위하여 전선, 전등 등을 포함하는 약 200m 길이의 실제 터널에서 균열 탐지를 수행하였다. 실험 결과 학습된 모델은 99% 정밀도와 92%의 재현율을 나타내며 뛰어난 현장 적용성을 나타내었다.

New Seed Detection by Shape Analysis for Construction of Vascular Structures

  • Shim, Hack-Joon;Lee, Hyun-Joon;Yun, Il-Dong;Lee, Sang-Uk
    • 대한의용생체공학회:의공학회지
    • /
    • 제31권6호
    • /
    • pp.427-433
    • /
    • 2010
  • Although tracking methods are efficient and popular for vessel segmentation, they require a seed to initiate an instance of tracking. In this paper, a new method to detect new seeds for tracking of arterial segments from CT angiography (CTA) and to construct a vascular structure is proposed. The proposed algorithm is based on shape analysis of connected components in a volume of interest around a vessel segment which was already extracted by tracking. The eigenvalues of the covariance matrix are used as the shape features for detection. The experimental results on actual clinical data showed that the results totally revealed the arterial tree not hindered by bone or veins. In visual comparison to a method which combines registration and subtraction of both pre-contrast and post-contrast CT volumes, the proposed method produced comparable results to the reference method and were confirmed of its feasibility for clinical use of reducing the cost and burden of patients.

-건설현장에서의 시공 자동화를 위한 Laser Sensor기반의 Workspace Modeling 방법에 관한 연구- (Human Assisted Fitting and Matching Primitive Objects to Sparse Point Clouds for Rapid Workspace Modeling in Construction Automation)

  • 권순욱
    • 한국건설관리학회논문집
    • /
    • 제5권5호
    • /
    • pp.151-162
    • /
    • 2004
  • Current methods for construction site modeling employ large, expensive laser range scanners that produce dense range point clouds of a scene from different perspectives. Days of skilled interpretation and of automatic segmentation may be required to convert the clouds to a finished CAD model. The dynamic nature of the construction environment requires that a real-time local area modeling system be capable of handling a rapidly changing and uncertain work environment. However, in practice, large, simple, and reasonably accurate embodying volumes are adequate feedback to an operator who, for instance, is attempting to place materials in the midst of obstacles with an occluded view. For real-time obstacle avoidance and automated equipment control functions, such volumes also facilitate computational tractability. In this research, a human operator's ability to quickly evaluate and associate objects in a scene is exploited. The operator directs a laser range finder mounted on a pan and tilt unit to collect range points on objects throughout the workspace. These groups of points form sparse range point clouds. These sparse clouds are then used to create geometric primitives for visualization and modeling purposes. Experimental results indicate that these models can be created rapidly and with sufficient accuracy for automated obstacle avoidance and equipment control functions.

건설 인공지능 개발사례로 보는 전공교육 인력의 중요성 (The Importance of Manpower in Major Education as an Example of Artificial Intelligence Development in Construction)

  • 허석재;이상현;이성원;김명훈;정란
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2021년도 가을 학술논문 발표대회
    • /
    • pp.223-224
    • /
    • 2021
  • The process before the model learning stage in AI R&D can be subdivided into data collection/cleansing-data purification-data labeling. After that, according to the purpose of development, it goes through a stage of verifying the model by performing learning by using the algorithm of the artificial intelligence model. Several studies describe an important part of AI research as the learning stage, and try to increase the accuracy by changing the structure and layer of the AI model. However, if the refinement and labeling process of the learning data is tailored only to the model format and is not made for the purpose of development, the desired AI model cannot be obtained. The latest research reveals that most AI research failures are the failure of the learning data rather than the structure of the AI model. analyzed.

  • PDF