• 제목/요약/키워드: Computer Vision

검색결과 2,219건 처리시간 0.025초

Joint Reasoning of Real-time Visual Risk Zone Identification and Numeric Checking for Construction Safety Management

  • Ali, Ahmed Khairadeen;Khan, Numan;Lee, Do Yeop;Park, Chansik
    • 국제학술발표논문집
    • /
    • The 8th International Conference on Construction Engineering and Project Management
    • /
    • pp.313-322
    • /
    • 2020
  • The recognition of the risk hazards is a vital step to effectively prevent accidents on a construction site. The advanced development in computer vision systems and the availability of the large visual database related to construction site made it possible to take quick action in the event of human error and disaster situations that may occur during management supervision. Therefore, it is necessary to analyze the risk factors that need to be managed at the construction site and review appropriate and effective technical methods for each risk factor. This research focuses on analyzing Occupational Safety and Health Agency (OSHA) related to risk zone identification rules that can be adopted by the image recognition technology and classify their risk factors depending on the effective technical method. Therefore, this research developed a pattern-oriented classification of OSHA rules that can employ a large scale of safety hazard recognition. This research uses joint reasoning of risk zone Identification and numeric input by utilizing a stereo camera integrated with an image detection algorithm such as (YOLOv3) and Pyramid Stereo Matching Network (PSMNet). The research result identifies risk zones and raises alarm if a target object enters this zone. It also determines numerical information of a target, which recognizes the length, spacing, and angle of the target. Applying image detection joint logic algorithms might leverage the speed and accuracy of hazard detection due to merging more than one factor to prevent accidents in the job site.

  • PDF

딥러닝을 이용한 구강 스캐너 이미지 내 치아 영역 실시간 검출 (Real-time Tooth Region Detection in Intraoral Scanner Images with Deep Learning)

  • 박나윤;김지훈;김태민;송경진;변유진;강민주;전경구;김재곤
    • 산업경영시스템학회지
    • /
    • 제46권3호
    • /
    • pp.1-6
    • /
    • 2023
  • In the realm of dental prosthesis fabrication, obtaining accurate impressions has historically been a challenging and inefficient process, often hindered by hygiene concerns and patient discomfort. Addressing these limitations, Company D recently introduced a cutting-edge solution by harnessing the potential of intraoral scan images to create 3D dental models. However, the complexity of these scan images, encompassing not only teeth and gums but also the palate, tongue, and other structures, posed a new set of challenges. In response, we propose a sophisticated real-time image segmentation algorithm that selectively extracts pertinent data, specifically focusing on teeth and gums, from oral scan images obtained through Company D's oral scanner for 3D model generation. A key challenge we tackled was the detection of the intricate molar regions, common in dental imaging, which we effectively addressed through intelligent data augmentation for enhanced training. By placing significant emphasis on both accuracy and speed, critical factors for real-time intraoral scanning, our proposed algorithm demonstrated exceptional performance, boasting an impressive accuracy rate of 0.91 and an unrivaled FPS of 92.4. Compared to existing algorithms, our solution exhibited superior outcomes when integrated into Company D's oral scanner. This algorithm is scheduled for deployment and commercialization within Company D's intraoral scanner.

저전력 장치를 위한 자원 효율적 객체 검출기 (Resource-Efficient Object Detector for Low-Power Devices)

  • 악세이 쿠마 샤마;김경기
    • 반도체공학회 논문지
    • /
    • 제2권1호
    • /
    • pp.17-20
    • /
    • 2024
  • 본 논문은 전통적인 자원 집약적인 컴퓨터 비전 모델의 한계를 해결하기 위해 저전력 엣지 장치에 최적화된 새로운 경량 객체 검출 모델을 제안합니다. 제안된 검출기는 Single Shot Detector (SSD)에 기반하여 소형이면서도 견고한 네트워크를 설계하였고, 작은 객체를 효율적으로 감지하는 데 있어 효율성을 크게 향상시키도록 모델을 구성하였다. 이 모델은 주로 두 가지 구성요소로 구성되어 있습니다: Depthwise 와 Pointwise Convolution 레이어를 사용하여 효율적인 특징 추출을 위한 Light_Block, 그리고 작은 객체의 향상된 감지를 위한 Enhancer_Block 으로 나누었다. 우리의 모델은 300x480 의 이미지 크기를 가진 Udacity 주석이 달린 데이터셋에서 처음부터 훈련되었으며, 사전 훈련된 분류 가중치의 필요성을 제거하였다. 약 0.43M 의 파라미터로 5.5MB 만의 무게를 가진 우리의 검출기는 평균 정밀도 (mAP) 27.7%와 140 FPS 의 처리 속도를 달성하여, 정밀도와 효율성 모두에서 기존 모델을 능가하였다. 따라서, 본 논문은 추론의 정확성을 손상시키지 않으면서 엣지 장치를 위한 객체 검출에서의 효과적인 경량화를 보여주고 있다.

Aruco marker 기반 건설 현장 작업자 위치 파악 적용성 분석 (Scholarly Assessment of Aruco Marker-Driven Worker Localization Techniques within Construction Environments)

  • 최태훈;김도근;장세준
    • 한국건축시공학회지
    • /
    • 제23권5호
    • /
    • pp.629-638
    • /
    • 2023
  • 본 논문에서는 건설현장 작업자의 실내 위치 추적을 위한 새로운 방법을 소개한다. 전통적으로 GPS및 NTRIP과 같은 기술은 주로 야외에서 효과적인 위치 확인을 제공하는 데 사용되었습니다. 그러나 이러한 기술은 실내에서 사용할 경우 정확도가 떨어지는 문제가 있습니다. 이러한 문제를 해결하기 위해 본 논문에서는 Aruco marker를 활용하여 작업자의 위치를 추적하는 방법을 제안한다. Aruco marker는 작업자와 마커 사이의 거리를 측정하는 데 사용됩니다. 이 새로운 접근 방식은 기존 위치 확인 방법에 비해 더욱 정확한 실내 위치 확인을 제공합니다. 작업자 위치를 실시간으로 확인할 수 있어 작업 일정을 최적화하고 작업자 간 협업을 촉진합니다. 따라서 Aruco marker를 활용한 실내 측위 방식은 기존의 기술의 문제점을 보완하는 실내 위치 확인 시스템으로 활용될 수 있다.

Copper Filter Dryer 품질보증을 위한 결함 검출 및 원인 분석 (Defect Detection and Cause Analysis for Copper Filter Dryer Quality Assurance)

  • 오석민;박진제;다어반권;장병호;김흥재;김창순
    • 한국산업정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.107-116
    • /
    • 2024
  • Copper Filter Dryer(CFD)는 냉동 및 냉방 시스템에서 냉매의 순환 시 불순물을 제거하여 깨끗한 냉매를 유지하는 역할을 하며, CFD의 결함은 냉동 및 냉방 시스템의 누수, 수명 저하 등 제품의 결함으로 이어질 수 있어 품질보증이 필수적이다. 기존에는 품질 검사 단계에서 작업자가 검사하고 결함을 판단하는 방법이 주로 사용되었으나, 이러한 방법은 주관적으로 판단하기 때문에 정확하지 못하다. 본 논문에서는 CFD 축관 및 용접 공정 과정에서 발생하는 결함을 검출하고 기존의 품질 검사를 대체하기 위해 YOLOv7 객체 감지 알고리즘을 사용하여 결함을 검출했고, F1-Score 0.954, 0.895의 검출 성능을 확인하였다. 또한, 결함 이미지의 Timestamp에 해당하는 센서 데이터 분석을 통해 용접 과정 중 발생하는 결함의 원인을 분석하였다. 본 논문은 CFD 공정 중 발생하는 결함을 검출하고 원인을 분석함으로써 제조 품질보증과 개선 방안을 제시한다.

Dual-stream Co-enhanced Network for Unsupervised Video Object Segmentation

  • Hongliang Zhu;Hui Yin;Yanting Liu;Ning Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권4호
    • /
    • pp.938-958
    • /
    • 2024
  • Unsupervised Video Object Segmentation (UVOS) is a highly challenging problem in computer vision as the annotation of the target object in the testing video is unknown at all. The main difficulty is to effectively handle the complicated and changeable motion state of the target object and the confusion of similar background objects in video sequence. In this paper, we propose a novel deep Dual-stream Co-enhanced Network (DC-Net) for UVOS via bidirectional motion cues refinement and multi-level feature aggregation, which can fully take advantage of motion cues and effectively integrate different level features to produce high-quality segmentation mask. DC-Net is a dual-stream architecture where the two streams are co-enhanced by each other. One is a motion stream with a Motion-cues Refine Module (MRM), which learns from bidirectional optical flow images and produces fine-grained and complete distinctive motion saliency map, and the other is an appearance stream with a Multi-level Feature Aggregation Module (MFAM) and a Context Attention Module (CAM) which are designed to integrate the different level features effectively. Specifically, the motion saliency map obtained by the motion stream is fused with each stage of the decoder in the appearance stream to improve the segmentation, and in turn the segmentation loss in the appearance stream feeds back into the motion stream to enhance the motion refinement. Experimental results on three datasets (Davis2016, VideoSD, SegTrack-v2) demonstrate that DC-Net has achieved comparable results with some state-of-the-art methods.

Deep-learning performance in identifying and classifying dental implant systems from dental imaging: a systematic review and meta-analysis

  • Akhilanand Chaurasia;Arunkumar Namachivayam;Revan Birke Koca-Unsal;Jae-Hong Lee
    • Journal of Periodontal and Implant Science
    • /
    • 제54권1호
    • /
    • pp.3-12
    • /
    • 2024
  • Deep learning (DL) offers promising performance in computer vision tasks and is highly suitable for dental image recognition and analysis. We evaluated the accuracy of DL algorithms in identifying and classifying dental implant systems (DISs) using dental imaging. In this systematic review and meta-analysis, we explored the MEDLINE/PubMed, Scopus, Embase, and Google Scholar databases and identified studies published between January 2011 and March 2022. Studies conducted on DL approaches for DIS identification or classification were included, and the accuracy of the DL models was evaluated using panoramic and periapical radiographic images. The quality of the selected studies was assessed using QUADAS-2. This review was registered with PROSPERO (CRDCRD42022309624). From 1,293 identified records, 9 studies were included in this systematic review and meta-analysis. The DL-based implant classification accuracy was no less than 70.75% (95% confidence interval [CI], 65.6%-75.9%) and no higher than 98.19 (95% CI, 97.8%-98.5%). The weighted accuracy was calculated, and the pooled sample size was 46,645, with an overall accuracy of 92.16% (95% CI, 90.8%-93.5%). The risk of bias and applicability concerns were judged as high for most studies, mainly regarding data selection and reference standards. DL models showed high accuracy in identifying and classifying DISs using panoramic and periapical radiographic images. Therefore, DL models are promising prospects for use as decision aids and decision-making tools; however, there are limitations with respect to their application in actual clinical practice.

AI 및 IoT 기반 스마트팜 병충해 예측시스템 개발: YOLOv5 및 Isolation Forest 모델 적용 연구 (Development of AI and IoT-based smart farm pest prediction system: Research on application of YOLOv5 and Isolation Forest models)

  • 박미경;심현
    • 한국전자통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.771-780
    • /
    • 2024
  • 본 연구에서는 딸기 농장을 대상으로 YOLOv5 아키텍처를 기반으로 한 컴퓨터 비전 모델과 Isolation Forest Classifier를 적용하여 병충해를 실시간으로 감지 및 예측하는 시스템을 개발하였다. 모델 성능 평가 결과, YOLOv5 모델은 평균 정밀도(mAP 0.5) 78.7%, 정확도 92.8%, 재현율 90.0%, F1 점수 76%로 높은 예측 성능을 나타냈다. 본 시스템은 딸기 농장뿐만 아니라 다른 작물과 다양한 환경에도 적용할 수 있도록 설계되었다. 토마토 농장에서 수집된 데이터를 기반으로 새로운 AI 모델을 학습한 결과, 주요 병충해인 역병과 황화병에 대한 예측 정확도가 85% 이상으로 나타났으며, 기존 모델보다 예측 정확도가 10% 이상 향상되었다.

건강추천시스템(HRS) 연구 동향: 인용네트워크 분석과 GraphSAGE를 활용하여 (Research Trends of Health Recommender Systems (HRS): Applying Citation Network Analysis and GraphSAGE)

  • 장하렴;유지수;양성병
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.57-84
    • /
    • 2023
  • 현대사회는 정보통신기술 및 빅데이터 기술의 발전으로 누구나 인터넷을 통해 손쉽게 방대한 데이터를 얻고 활용할 수 있는 시대로, 양질의 데이터를 수집하는 능력을 넘어 수많은 정보 속에서 올바른 데이터만을 선별하는 능력이 더욱 중요해지고 있다. 이러한 기조는 학계에서도 이어지고 있는데, 축적되는 연구물 속에서 양질의 연구를 선별하여 올바른 지식구조를 형성하기 위해, 다양한 연구 분야에서 체계적 고찰(systematic review) 및 비체계적 고찰(non-systematic review)과 같은 문헌연구(literature review)가 수행되고 있다. 한편, 코로나19 팬데믹 이후 의료산업에서도 그동안 합의에 이르지 못했던 원격의료가 제한적으로나마 허용되고, 인공지능 및 빅데이터 기술이 응용된 건강추천시스템(health recommender systems: HRS)과 같은 새로운 의료서비스가 각광을 받고 있다. 하지만, 실무적으로 HRS가 미래 의료산업 발전을 이끌 중요한 기술로 평가받고 있음에도 불구하고, 학술적인 문헌연구는 다른 분야에 비해 매우 부족한 실정이다. 더불어 HRS는 학제적 성격이 강한 융합 분야임에도 불구하고, 기존의 문헌연구는 비체계적 고찰과 체계적 고찰 방법만을 주로 활용하여 이뤄졌기 때문에, 다른 연구 분야와의 상호작용이나 동적인 관계를 유추하기에는 한계가 존재한다. 이에, 본 연구에서는 인용네트워크 분석(citation network analysis: CNA)을 활용하여 HRS 및 주변 연구 분야의 전체적인 네트워크 구조를 파악하였다. 또한, 이 과정에서 최신 논문이 인용 관계가 잘 나타나지 않는 문제를 보완하기 위해 GraphSAGE 알고리즘을 적용함으로써, HRS 연구에 있어 'recommender system', 'wireless & IoT', 'computer vision', 'text mining' 등과 같은 연구 분야들의 중요도가 높아지고 있음을 파악하였으며, 이와 동시에 개인화(personalization) 및 개인정보보호(privacy) 등과 같은 새로운 키워드가 주요 이슈로 등장하고 있음을 확인하였다. 본 연구를 통해 HRS 연구 커뮤니티의 구조를 파악하고, 관련된 연구 동향을 살펴보며, 미래 HRS 연구 방향을 설계함에 있어 실질적인 통찰을 제공할 수 있을 것으로 기대한다.

주시각도에 따른 조절기능의 변화 (A Study on the Changes of Accommodative Function in Respect to the Viewing Angle)

  • 이학준;김정희
    • 한국안광학회지
    • /
    • 제14권2호
    • /
    • pp.9-14
    • /
    • 2009
  • 목적: 본 연구는 근거리 작업자의 주시선 각도 변화에 따른 조절효율과 순목횟수, 조절래그에 대한 상관관계를 조사하여 독서, 컴퓨터나 TV등을 오랜 시간동안 주시할 때 두통을 동반하거나 눈의 피로를 호소하는 원인 및 안정피로를 완화시키는 적합한 주시각도를 알아보고자 실시하였다. 방법: 컴퓨터 등의 근거리 작업을 많이 하는 20세에서 36세까지의 대학생 남자 12명과 여자 15명 총 27명을 대상으로 근거리 작업자의 주시선의 각도 변화에 따른 조절효율과 눈 깜빡임 횟수, 조절래그량의 크기를 조사하였다. 굴절이상을 완전교정한 후 포롭터를 근거리 모드로 전환하여 40 cm에 근거리 시표를 위치시키고 수평면을 기준으로 $40^{\circ}$ 아래방향, $20^{\circ}$ 아래방향, 수평방향, $20^{\circ}$ 윗 방향을 주시하였을 때 각각의 주시방향에서 1분 동안의 조절효율성, 눈의 깜빡임 횟수를 측정하였고 검영기를 이용하여 동적검영법으로 조절래그를 측정하였다. 결과: 주시선이 $40^{\circ}$ 하방보다 윗 방향쪽으로 이동할수록 조절효율은 감소하였고, 눈 깜빡임 횟수와 조절래그량은 증가하여 근거리 작업 시 눈이 건조해지고 조절반응량이 감소하는 것으로 조사되었다. 결론: 근거리 작업 시 책이나 컴퓨터 화면의 위치를 수평방향보다 $40^{\circ}$ 하방에 위치시키면 눈의 피로도를 최소화할 수 있다.

  • PDF