• 제목/요약/키워드: vision AI

검색결과 154건 처리시간 0.028초

AI 및 텍스트 마이닝 기법을 활용한 지반조사보고서 데이터 추출 자동화 (Automated Data Extraction from Unstructured Geotechnical Report based on AI and Text-mining Techniques)

  • 박지민;서완혁;서동희;윤태섭
    • 한국지반공학회논문집
    • /
    • 제40권4호
    • /
    • pp.69-79
    • /
    • 2024
  • 현장 지반정수 데이터는 다양한 현장 및 실내시험을 통해 획득된 후 지반조사보고서의 형태로 작성되어 유통된다. 효율적인 설계 및 시공을 위해선 지반정수의 디지털 데이터베이스화가 필수적이나, 현재 지반조사보고서 데이터는 수동 입력 방식으로 많은 시간과 인력이 소요되며, 오류가 발생하기도 한다. 본 연구는 이미지 기반 딥러닝 모델 및 텍스트 마이닝 기법을 사용하여 지반조사보고서에서 데이터를 자동으로 추출하는 방법을 제안하였다. 딥러닝 기반의 페이지 분류 모델과 텍스트 서칭 알고리즘을 사용하여 지반조사보고서 부록 내 세부 지반시험 결과 보고서를 100%의 정확도로 분류할 수 있었다. 컴퓨터 비전 알고리즘을 통해 보고서 페이지 내 유효한 데이터 영역을 결정하고, 텍스트 분석을 통해 추출 데이터 항목과 상응하는 지반 데이터를 짝지어 데이터를 추출했다. 제안한 모델은 205개의 지반조사 보고서로 구성된 데이터셋을 통해 검증되었으며, 평균 93.0%의 데이터 추출 정확도를 기록하였다. 마지막으로, 추출 모델의 실무 적용성을 위해 사용자 인터페이스 기반 프로그램을 개발하였다. 프로그램 내 사용자 상호작용을 통해 지반조사보고서 PDF 파일을 업로드하고 자동으로 보고서를 분석 및 데이터를 추출, 편집할 수 있도록 했다. 이를 통해 지반조사보고서의 디지털화 및 지반 데이터베이스 구축이 더욱 효율적이고 정확하게 이루어질 수 있을 것으로 판단된다.

Improving Test Accuracy on the MNIST Dataset using a Simple CNN with Batch Normalization

  • Seungbin Lee;Jungsoo Rhee
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권9호
    • /
    • pp.1-7
    • /
    • 2024
  • 본 논문은 MNIST 데이터셋을 활용한 손글씨 숫자 인식에서 합성곱 신경망(CNN)과 배치정규화(BN)를 결합한 모델을 제안한다. LeCun et al.의 LeNet-5 모델의 성과를 뛰어넘는 것을 목표로 6계층 신경망 구조를 설계하였다. 제안된 모델은 28×28 픽셀 이미지를 입력으로 받아 합성곱, 맥스 풀링, 완전연결계층을 거쳐 처리하며, 특히 배치정규화계층을 도입하여 학습 안정성과 성능을 향상시켰다. 실험에서는 60,000개의 훈련 이미지와 10,000개의 테스트 이미지를 사용하였으며, Momentum 최적화 알고리즘을 적용하였다. 모델 구성에서는 30개의 필터, 필터 사이즈 5×5, 패딩 0, 스트라이드 1을 사용하였고, ReLU 활성화 함수를 채택하였다. 훈련 과정에서는 미니배치 사이즈 100, 총 20 에포크, 학습률 0.1로 설정하였다. 결과적으로 제안된 모델은 99.22%의 테스트 정확도를 달성하여 LeNet-5의 99.05%를 상회하였으며, F1-score 0.9919를 기록하여 모델의 성능을 입증하였다. 또한, 본 논문에서 제안한 6계층 모델은 LeCun et al.의 LeNet-5(7계층 모델)와 Ji, Chun and Kim(10계층 모델)이 제안한 모델보다 더 단순한 구조로 모델의 효율성을 강조하였다. 본 연구의 결과는 AI 비전 검사기 등 실제 산업 응용에서 활용 가능성을 보여주며, 특히 스마트팩토리에서 부품의 불량 상태를 판별하는 데 효과적으로 적용될 수 있을 것으로 기대된다.

가정정책 방향 모색을 위한 전문가 조사 연구 : 통합적 가정정책 관점을 중심으로 (A Delphi Survey for Seeking Progress in Family Policy : Focusing on Integrated Family Policy Perspective)

  • 김경신;정민자;송혜림;성미애;박정윤
    • 가정과삶의질연구
    • /
    • 제26권6호
    • /
    • pp.167-179
    • /
    • 2008
  • This study attempted to develop integrated family policy. For this purpose, a delphi survey was conducted twice among 15 professionals regarding the general contents of family policy, the goals and outcomes of president Roh's administration, the direction and plan of action for future family policy. The results of this study are as follows: Firstly, the main results of president Roh's administration were the creation of the Ministry of Women and Families, and the Healthy Families Law. Nevertheless, that government had no long-term vision or action programs. Secondly, there are two aspects of family policy which one is family members based and the other is family life cycle based. Accordingly the subjects of this study insist that family policy has to cover people's whole life, all families regardless of family structure, and has to integrate the plans and programs which have been served to individuals, for example, women, child, youth, and elderly. Thirdly, the orientations of future family policy are to be toward happiness, health, equality, coexistence, harmony, growth, generosity, diversity, self-control, and a sustainable society. So the concept of the integrated family policy has to cover all aspects of the family and the diversity of family life. Therefore, the service delivery system for family policy has to converge into the Healthy Family Center.

드론 영상 활용 시설물 이동 인식 정확도 분석 및 활용 서비스 구현 (Implementation of Facility Movement Recognition Accuracy Analysis and Utilization Service using Drone Image)

  • 김광석;오아라;최윤수
    • 한국가스학회지
    • /
    • 제25권5호
    • /
    • pp.88-96
    • /
    • 2021
  • 첨단 IoT(사물인터넷) 기술이 에너지 업계의 안전을 위해 다양하게 쓰이고 있다. 안전대책의 중심에는 드론이 인간을 대신해 다양한 역할을 한다. 드론은 사람이 일일이 점검하기 어려운 대규모 시설과 공간 제약으로 손길이 닿기 어려운 곳에 다가가는 역할을 하고 있다. 본 연구에서는 가스 위험 시설물의 효율적 대응 관리를 위해 드론 영상을 활용하여 위험 시설물의 이동정확도 및 완성도를 실험하였으며 이동 인식 정확도 100%, 데이터 분석 평균 정확도 95.8699%로, 평균 완성도 100%임을 확인하였다 실험 결과를 토대로, ICT 기술과 접목된 미래 지향적인 시설물 위험성 분석시스템을 구현 제시하였으며. 향후 조건을 다각화한 추가 실험이 필요하다.

유사 이미지 분류를 위한 딥 러닝 성능 향상 기법 연구 (Research on Deep Learning Performance Improvement for Similar Image Classification)

  • 임동진;김태홍
    • 한국콘텐츠학회논문지
    • /
    • 제21권8호
    • /
    • pp.1-9
    • /
    • 2021
  • 딥 러닝을 활용한 컴퓨터 비전 연구는 여전히 대규모의 학습 데이터와 컴퓨팅 파워가 필수적이며, 최적의 네트워크 구조를 도출하기 위해 많은 시행착오가 수반된다. 본 연구에서는 네트워크 최적화나 데이터를 보강하는 것과 무관하게 데이터 자체의 특성만을 고려한 CR(Confusion Rate)기반의 유사 이미지 분류 성능 향상 기법을 제안한다. 제안 방법은 유사한 이미지 데이터를 정확히 분류하기 위해 CR을 산출하고 이를 손실 함수의 가중치에 반영함으로서 딥 러닝 모델의 성능을 향상시키는 기법을 제안한다. 제안 방법은 네트워크 최적화 결과와 독립적으로 이미지 분류 성능의 향상을 가져올 수 있으며, 클래스 간의 유사성을 고려해 유사도가 높은 이미지 식별에 적합하다. 제안 방법의 평가결과 HanDB에서는 0.22%, Animal-10N에서는 3.38%의 성능향상을 보였다. 제안한 방법은 다양한 Noisy Labeled 데이터를 활용한 인공지능 연구에 기반이 될 것을 기대한다.

경량화된 임베디드 시스템에서 의미론적인 픽셀 분할 마스킹을 이용한 효율적인 영상 객체 인식 기법 (Efficient Object Recognition by Masking Semantic Pixel Difference Region of Vision Snapshot for Lightweight Embedded Systems)

  • 윤희지;박대진
    • 한국정보통신학회논문지
    • /
    • 제26권6호
    • /
    • pp.813-826
    • /
    • 2022
  • 카메라를 이용한 영상 처리와 그에 따른 인공지능 기술의 발달로 다양한 분야의 기술이 발전하기 시작했다. 하지만 보드가 가벼울수록 연산이 많이 필요한 영상 처리 알고리즘을 구현하기 힘들다. 본 논문에서는 경량 임베디드 보드에서 물체 인식 알고리즘을 위한 딥러닝을 사용하는 방법을 제안한다. 비교적 적은 양의 계산으로 segmentation을 처리하는 딥러닝 알고리즘을 사용하여 ROI(Region of Interest)를 결정할 수 있다. 영역을 마스킹한 후, 더 정확한 딥러닝 알고리즘을 사용해 물체 감지를 할 수 있다. Python에서 입력 이미지를 처리하기 위해 OpenCV를 사용했고 ENet과 YOLO(You Only Look Once)를 사용하여 이미지를 처리했다. 이 알고리즘을 실행함으로써 평균 오차가 절반으로 감소해 정확한 객체 검출을 처리할 수 있고 경량 임베디드 보드에서 실시간으로 객체 인식을 실행할 수 있다. 이 연구는 자율주행과 IoT에서 저가격 경량화된 응용에 활용될 수 있을 것으로 기대된다.

객체 감지 데이터 셋 기반 인체 자세 인식시스템 연구 (Research on Human Posture Recognition System Based on The Object Detection Dataset)

  • 유암;리라이춘;루징쉬엔;쉬멍;정양권
    • 한국전자통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.111-118
    • /
    • 2022
  • 컴퓨터 비전 연구에서 2차원 인체 자세는 매우 광범위한 연구 방향으로 특히 자세 추적과 행동 인식에서 유의미한 분야다. 인체 자세 표적 획득은 이미지에서 인체 목표를 정확히 찾는 방법을 연구하는 것이 핵심이며 인체 자세 인식은 인공지능(AI)에 적용하는 한편 일상생활에 활용되고 있어서 매우 중요한 연구의의가 있다. 인체 자세 인식 효과의 우수성의 기준은 인식 과정의 성공률과 정확도에 의해 결정된다. 본 연구의 인체 자세 인식에서는 딥러닝 전용 데이터셋인 MS COCO를 기반하여 인체를 17개의 키 포인트로 구분하였다. 다음으로 주요 특징에 대한 세분화 마스크(segmentation mask) 방법을 사용하여 인식률을 개선하였다. 최종적으로 신경망 모델을 설계하고 간단한 단계별 학습부터 효율적인 학습에 이르기까지 많은 수의 표본을 학습시키는 알고리즘을 제안하여 정확도를 향상할 수 있었다.

The Methodology of the Golf Swing Similarity Measurement Using Deep Learning-Based 2D Pose Estimation

  • Jonghyuk, Park
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.39-47
    • /
    • 2023
  • 본 논문에서는 골프 동영상 속 스윙 자세 사이의 유사도를 측정할 수 있는 방법을 제안한다. 딥러닝 기반 인공지능 기술이 컴퓨터 비전 분야에 효과적인 것이 알려지면서 동영상을 기반으로 한 스포츠 데이터 분석에 인공지능을 활용하기 위한 시도가 증가하고 있다. 본 연구에서는 딥러닝 기반의 자세 추정 모델을 사용하여 골프 스윙 동영상 속 사람의 관절 좌표를 획득하였고, 이를 바탕으로 각 스윙 구간별 유사도를 측정하였다. 제안한 방법의 평가를 위해 GolfDB 데이터셋의 Driver 스윙 동영상을 활용하였다. 총 36명의 선수에 대해 스윙 동영상들을 두 개씩 짝지어 스윙 유사도를 측정한 결과, 본인의 또 다른 스윙이 가장 유사하다고 평가한 경우가 26명이었으며, 이때의 유사도 평균 순위는 약 5위로 확인되었다. 이로부터 비슷한 동작을 수행하고 있는 경우에도 면밀히 유사도를 측정하는 것이 가능함을 확인할 수 있었다.

객체 인식 모델 기반 실시간 교통신호 정보 인식 (Real-time traffic light information recognition based on object detection models)

  • 주은오;김민수
    • 지적과 국토정보
    • /
    • 제52권1호
    • /
    • pp.81-93
    • /
    • 2022
  • 최근 자율주행 기술에서 차량 주변 객체 인식과 교통표지판 및 차량 신호 인식을 위한 연구가 활발히 수행되고 있으며, 특히 차량 신호 인식은 자율주행 기술에 있어서 핵심 요소로 평가되고 있다. 이에 차량 신호 인식을 위한 다양한 연구가 진행되어 왔으며, 최근에는 딥러닝 기반 객체 인식 모델을 활용한 차량 신호 인식 연구가 크게 증가하고 있다. 또한 AIHub에서 음성, 비전, 자율주행 등을 위한 양질의 국내 인공지능 학습데이터 셋이 공개됨에 따라 이들 데이터를 활용한 국내 환경에 적합한 차량 신호 인식 모델의 개발도 가능하게 되었다. 이에 본 연구에서는 AIHub의 학습데이터와 객체 인식모델 YOLO를 적용한 국내 차량 신호 인식 모델을 개발하였다. 특히 차량 신호의 인식 성능을 개선하기 위하여 YOLOv4와 YOLOv5의 다양한 모델을 적용하였으며 학습데이터의 클래스도 다양하게 분류하여 실험을 수행하였다. 결론적으로 YOLOv5가 YOLOv4보다 차량 신호 인식에 조금 더 적합함을 확인할 수 있었으며, 두 모델의 아키텍처 비교를 통하여 YOLOv5 성능이 우수한 이유를 확인할 수 있었다.

CNN 기반 전이학습을 이용한 뼈 전이가 존재하는 뼈 스캔 영상 분류 (Classification of Whole Body Bone Scan Image with Bone Metastasis using CNN-based Transfer Learning)

  • 임지영;도탄콩;김수형;이귀상;이민희;민정준;범희승;김현식;강세령;양형정
    • 한국멀티미디어학회논문지
    • /
    • 제25권8호
    • /
    • pp.1224-1232
    • /
    • 2022
  • Whole body bone scan is the most frequently performed nuclear medicine imaging to evaluate bone metastasis in cancer patients. We evaluated the performance of a VGG16-based transfer learning classifier for bone scan images in which metastatic bone lesion was present. A total of 1,000 bone scans in 1,000 cancer patients (500 patients with bone metastasis, 500 patients without bone metastasis) were evaluated. Bone scans were labeled with abnormal/normal for bone metastasis using medical reports and image review. Subsequently, gradient-weighted class activation maps (Grad-CAMs) were generated for explainable AI. The proposed model showed AUROC 0.96 and F1-Score 0.90, indicating that it outperforms to VGG16, ResNet50, Xception, DenseNet121 and InceptionV3. Grad-CAM visualized that the proposed model focuses on hot uptakes, which are indicating active bone lesions, for classification of whole body bone scan images with bone metastases.