• 제목/요약/키워드: Computer Vision

검색결과 2,208건 처리시간 0.032초

딥러닝 기반 픽셀 단위 콘크리트 벽체 균열 검출 방법 (Deep Learning-based Pixel-level Concrete Wall Crack Detection Method)

  • 강경수;류한국
    • 한국건축시공학회지
    • /
    • 제23권2호
    • /
    • pp.197-207
    • /
    • 2023
  • 콘크리트는 압축력에 잘 저항하고 내구성이 우수하여 널리 사용되는 재료이다. 하지만 구조물은 시공 단계에서 주변 환경, 사용되는 재료의 특성에 따라 완공된 후 표면의 균열, 구조물의 침하 등 다양한 하자가 발생하거나 시간이 지남에 따라 콘크리트 구조물 표면에 결함이 발생한다. 그대로 방치하면 구조물에 심각한 손상을 초래하기 때문에 안전 점검을 통해 검사해야 한다. 하지만 전문 검사원들이 직접 조사하기에 비용이 높고 육안으로 판단하는 외관 검사법을 사용한다. 고층 건물일수록 상세한 검사가 힘들다. 본 연구는 노후화로 인해 콘크리트 표면에 발생하는 결함 중 균열을 탐지하는 딥러닝 기반 시맨틱 세그먼테이션 모형과 해당 모형의 특징 추출과 일반화 성능을 높이기 위한 이미지 어그멘테이션 기법을 개발하였다. 이를 위해 공개 데이터셋과 자체 데이터셋을 결합하여 시맨틱 세그먼테이션용 데이터셋을 구축하고 대표적인 딥러닝 기반 시맨틱 세그먼테이션 모형들을 비교실험하였다. 콘크리트 내벽을 중점으로 학습한 모형의 균열 추출 성능은 81.4%이며, 개발한 이미지 어그멘테이션을 적용한 결과 3%의 성능향상을 확인하였다. 향후 고층 건물과 같이 접근성이 어려운 지점을 드론을 통해 콘크리트 외벽에서 균열을 검출할 수 있는 시스템을 개발함으로써 실질적으로 활용할 수 있기를 기대한다.

실시간 온라인 수업 수강자들의 집중력 기반 복습 지원 도구의 설계 및 구현 (Design and Implementation of a Concentration-based Review Support Tool for Real-time Online Class Participants)

  • 김태환;조대수;박승민
    • 한국전자통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.521-526
    • /
    • 2023
  • 최근 팬데믹으로 인하여 대부분의 교육 시스템은 비대면 강좌를 통해 이루어지고 있다. 비대면 강좌는 대면강좌와는 달리 수강자들이 집중을 유지하는데 더욱 어려우며, 평가 목록 중 하나인 수업 태도에 대한 교수자의 평가 또한 어렵다. 본 논문에서는 비대면 강좌에서 사용할 수 있는 실시간 화상 강의에서 수강자들의 집중력 기반 복습 지원 시스템을 제안한다. 이 시스템은 기존의 화상 시스템에서 사용하는 장비를 이용하여 수강자의 얼굴, 동공 및 사용자 활동을 실시간으로 측정하여 이를 교수자에게 여러 가지의 형태로 수강자의 실시간 집중도 측정값을 전달한다. 동시에 집중도 측정값이 일정 수준보다 낮아지면 수강자에게 알림을 주며 동시에 강의의 타임스탬프를 기록해 주도록 한다. 이 시스템을 이용하여 교수자가 수업 시 실시간으로 수강자들의 수업 참여 여부 확인 및 수강자들의 수업 태도를 평가하는 데 도움을 주고 수강자들의 수업 능력을 향상 시켜주도록 한다.

Estimation of liquid limit of cohesive soil using video-based vibration measurement

  • Matthew Sands;Evan Hayes;Soonkie Nam;Jinki Kim
    • Geomechanics and Engineering
    • /
    • 제33권2호
    • /
    • pp.175-182
    • /
    • 2023
  • In general, the design of structures and its construction processes are fundamentally dependent on their foundation and supporting ground. Thus, it is imperative to understand the behavior of the soil under certain stress and drainage conditions. As it is well known that certain characteristics and behaviors of soils with fines are highly dependent on water content, it is critical to accurately measure and identify the status of the soils in terms of water contents. Liquid limit is one of the important soil index properties to define such characteristics. However, liquid limit measurement can be affected by the proficiency of the operator. On the other hand, dynamic properties of soils are also necessary in many different applications and current testing methods often require special equipment in the laboratory, which is often expensive and sensitive to test conditions. In order to address these concerns and advance the state of the art, this study explores a novel method to determine the liquid limit of cohesive soil by employing video-based vibration analysis. In this research, the modal characteristics of cohesive soil columns are extracted from videos by utilizing phase-based motion estimation. By utilizing the proposed method that analyzes the optical flow in every pixel of the series of frames that effectively represents the motion of corresponding points of the soil specimen, the vibration characteristics of the entire soil specimen could be assessed in a non-contact and non-destructive manner. The experimental investigation results compared with the liquid limit determined by the standard method verify that the proposed method reliably and straightforwardly identifies the liquid limit of clay. It is envisioned that the proposed approach could be applied to measuring liquid limit of soil in practical field, entertaining its simple implementation that only requires a digital camera or even a smartphone without the need for special equipment that may be subject to the proficiency of the operator.

응시점 추정 기반 관심 영역 내 객체 탐지 (Object detection within the region of interest based on gaze estimation)

  • 한석호;장훈석
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권3호
    • /
    • pp.117-122
    • /
    • 2023
  • 사용자가 현재 응시하고 있는 위치를 자동으로 인식하는 응시점 추정과 추정된 응시점을 기반으로 객체를 탐지하는 기술을 활용한다면 사람의 시각적 행동을 파악하는데 더 정확하고 효율적인 방안이 될 수 있을 것이다. 본 논문에서는 응시점을 중심으로 관심 영역을 생성하고 해당 영역 내에서 객체를 탐지하는 방안을 제시한다. 자세하게는, 삼차원 응시점을 추정한 후에 추정된 응시점을 기반으로 관심 영역을 생성하여 관심 영역 내에서만 객체 탐지가 이루어지도록 설계한다. 실험을 통해 일반적인 객체 탐지와 제안된 관심 영역 내 객체 탐지 성능을 비교한 결과, 프레임당 처리 시간은 각각 1.4ms, 1.1ms로 관심 영역 내 객체 탐지가 처리 속도 면에서 더 우수한 것을 확인할 수 있었다.

Dynamic characteristics monitoring of wind turbine blades based on improved YOLOv5 deep learning model

  • W.H. Zhao;W.R. Li;M.H. Yang;N. Hong;Y.F. Du
    • Smart Structures and Systems
    • /
    • 제31권5호
    • /
    • pp.469-483
    • /
    • 2023
  • The dynamic characteristics of wind turbine blades are usually monitored by contact sensors with the disadvantages of high cost, difficult installation, easy damage to the structure, and difficult signal transmission. In view of the above problems, based on computer vision technology and the improved YOLOv5 (You Only Look Once v5) deep learning model, a non-contact dynamic characteristic monitoring method for wind turbine blade is proposed. First, the original YOLOv5l model of the CSP (Cross Stage Partial) structure is improved by introducing the CSP2_2 structure, which reduce the number of residual components to better the network training speed. On this basis, combined with the Deep sort algorithm, the accuracy of structural displacement monitoring is mended. Secondly, for the disadvantage that the deep learning sample dataset is difficult to collect, the blender software is used to model the wind turbine structure with conditions, illuminations and other practical engineering similar environments changed. In addition, incorporated with the image expansion technology, a modeling-based dataset augmentation method is proposed. Finally, the feasibility of the proposed algorithm is verified by experiments followed by the analytical procedure about the influence of YOLOv5 models, lighting conditions and angles on the recognition results. The results show that the improved YOLOv5 deep learning model not only perform well compared with many other YOLOv5 models, but also has high accuracy in vibration monitoring in different environments. The method can accurately identify the dynamic characteristics of wind turbine blades, and therefore can provide a reference for evaluating the condition of wind turbine blades.

이미지 기반 축산물 불량 탐지에서의 희소 클래스 처리 전략 (Sparse Class Processing Strategy in Image-based Livestock Defect Detection)

  • 이범호;조예성;이문용
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1720-1728
    • /
    • 2022
  • 인공지능 기술의 발전으로 산업 4.0시대가 열렸고 축산업에서도 ICT 기술이 접목된 스마트 농장의 구현이 큰 관심을 받고 있다. 그중에서도 컴퓨터 비전 기반 인공지능 기술을 접목한 축산물 및 축산 가공품의 품질 관리 기술은 스마트 축산의 핵심 기술에 해당한다. 그러나 인공지능 모형 훈련을 위한 축산물 이미지 데이터 수의 부족과 특정 범주(class)에 대한 데이터 불균형은 관련 연구 및 기술 개발에 큰 장해물이 되고 있다. 이러한 문제들을 해결하기 위해, 본 연구에서는 오버샘플링과 적대적 사례 생성기법의 활용을 제안한다. 제안되는 방법은 성공적인 불량 탐지 (Defect detection) 관점을 기반으로 하며, 이는 부족한 데이터 레이블을 효과적으로 활용하는데 필요한 방법이다. 최종적으로 실험을 통해 제안된 방법의 타당성을 확인하고 활용 전략을 검토한다.

생성적 적대 신경망을 활용한 부분 위변조 이미지 생성에 관한 연구 (A Study on Image Creation and Modification Techniques Using Generative Adversarial Neural Networks)

  • 송성헌;최봉준;문미경
    • 한국전자통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.291-298
    • /
    • 2022
  • 생성적 적대 신경망(Generative Adversarial Networks, GAN)은 내부의 두 신경망(생성망, 판별망)이 상호 경쟁하면서 학습하는 네트워크이다. 생성자는 현실과 가까운 이미지를 만들고, 구분자는 생성자의 이미지를 더 잘 감별하도록 프로그래밍 되어있다. 이 기술은 전체 이미지 X를 다른 이미지 Y로 생성, 변환 및 복원하기 위해 다양하게 활용되고 있다. 본 논문에서는 원본 이미지에서 부분 이미지만 추출한 후, 이를 자연스럽게 다른 객체로 위변조할 수 있는 방법에 관해 기술한다. 먼저 원본 이미지에서 부분 이미지만 추출한 후, 기존에 학습시켜놓은 DCGAN 모델을 통해 새로운 이미지를 생성하고, 이를 전체적 스타일 전이(overall style transfer) 기술을 사용하여 원본 이미지의 질감과 크기에 어울리도록 리스타일링(re-styling) 한 후, 원본 이미지에 자연스럽게 결합하는 과정을 거친다. 본 연구를 통해 원본 이미지의 특정 부분에 사용자가 원하는 객체 이미지를 자연스럽게 추가/변형할 수 있음으로써 가짜 이미지 생성의 또 다른 활용 분야로 사용될 수 있을 것이다.

실시간 온라인 수업 및 시험 태도 데이터 세트 설계 및 구현 (Real-time Online Study and Exam Attitude Dataset Design and Implementation)

  • 김준식;이찬휘;송혁;권순철
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.124-132
    • /
    • 2022
  • 최근 코로나바이러스감염증-19(COVID-19)로 인해 온라인 원격 수업과 비대면 시험으로 인해 수업 태도 및 시험 부정행위에 대한 관리가 어려움을 겪고 있다. 따라서 온라인으로 학생들의 행동을 자동으로 인식하고 검출하는 시스템이 필요하다. 사람의 행동을 인식하는 행동 인식의 경우 컴퓨터 비전에서 많이 연구되는 기술 중 하나이다. 이러한 시스템을 개발하기 위해서는 온라인 수업 및 시험에서 주요 정보가 될 수 있는 사람의 팔 움직임 정보와 주변 물체에 대한 정보를 포함하는 데이터가 필요하다. 기존 데이터 세트는 여러 분야에 대해 분류를 하거나 일상생활 행동으로 구성되어 있어 본 시스템에 적용시키기에 어려움이 있다. 본 논문에서는 실시간으로 진행되는 온라인 시험 및 수업에서 태도를 분류할 수 있는 데이터 세트를 제시한다. 또한, 기존의 행동 인식 데이터 세트와의 비교를 통해 제안된 데이터 세트가 올바르게 구성되었는지를 보여준다.

딥러닝 영상 분할의 정확도 향상을 위한 처리방법 연구 (A Study on the Processing Method for Improving Accuracy of Deep Learning Image Segmentation)

  • 최동규;김민영;장종욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.169-171
    • /
    • 2021
  • 자율주행, CCTV, 휴대폰 보안, 주차시설 등 카메라를 통한 이미지 처리는 실생활의 많은 문제를 해결하기 위해 사용되고 있다. 간단한 구분의 경우는 이미지 처리를 통해 해결하지만, 복잡하게 섞인 물체의 이미지 또는 이미지 내 특징을 찾아내기 어렵다. 이런 특징점 해결을 위해 사람에 가깝게 생각하고 판단할 수 있도록 영상데이터에 분류, 탐지, 분할에서 딥러닝 기술을 도입하고 있다. 물론 이미지 처리만 수행하는 것보다 결과가 좋지만, 딥러닝을 사용한 영상 분할의 방법에서 판단된 결과물이 실제 객체와 편차가 있는 것을 확인하였다. 본 논문에서는 영상 분할의 정밀도를 높이기 위해 딥러닝 영상 분할의 결과물을 출력하기 직전 간단한 이미지 처리를 통하여 정확도 향상을 수행하는 방법에 관해 연구하였다.

  • PDF

딥러닝 기반 사전학습 언어모델에 대한 이해와 현황 (A Survey on Deep Learning-based Pre-Trained Language Models)

  • 박상언
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.11-29
    • /
    • 2022
  • 사전학습 언어모델은 자연어 처리 작업에서 가장 중요하고 많이 활용되는 도구로, 대량의 말뭉치를 대상으로 사전학습이 되어있어 적은 수의 데이터를 이용한 미세조정학습으로도 높은 성능을 기대할 수 있으며, 사전학습된 토크나이저과 딥러닝 모형 등 구현에 필요한 요소들이 함께 배포되기 때문에 자연어 처리 작업에 소요되는 비용과 기간을 크게 단축시켰다. 트랜스포머 변형 모형은 이와 같은 장점을 제공하는 사전학습 언어모델 중에서 최근 가장 많이 사용되고 있는 모형으로, 번역을 비롯하여 문서 요약, 챗봇과 같은 질의 응답, 자연스러운 문장의 생성 및 문서의 분류 등 다양한 자연어 처리 작업에 활용되고 있으며 컴퓨터 비전 분야와 오디오 관련 분야 등 다른 분야에서도 활발하게 활용되고 있다. 본 논문은 연구자들이 보다 쉽게 사전학습 언어모델에 대해 이해하고 자연어 처리 작업에 활용할 수 있도록 하기 위해, 언어모델과 사전학습 언어모델의 정의로부터 시작하여 사전학습 언어모델의 발전과정과 다양한 트랜스포머 변형 모형에 대해 조사하고 정리하였다.