• 제목/요약/키워드: Object-Detection

검색결과 2,531건 처리시간 0.03초

UGV에서 3D 레이저 라인 센서를 이용한 강건하고 효율적인 이격 측정 (Robust and Efficient Measurement Using a 3D Laser Line Sensor on UGVs)

  • 신지우;박준용;김서연;김태식;정진만
    • 정보처리학회 논문지
    • /
    • 제13권9호
    • /
    • pp.468-473
    • /
    • 2024
  • 도심 지역에서의 굴착 작업은 지반 변형을 유발할 수 있으며, 이는 인근 인프라에 피해를 줄 수 있다. 지반 변형으로 인해 작업 현장 근처의 보도블록에 변위가 발생할 수 있다. 변위를 정확하게 측정하여 지반 변형의 잠재적인 위험을 평가하는 지표로 사용할 수 있다. 본 논문에서는 UGV에 장착된 3D 레이저 라인 센서를 이용한 강건하고 효율적인 보도블록 이격 측정 방법을 제안한다. 제안 방법은 2D 투영 기반 객체 탐지와 CPLF 알고리즘을 통한 측정의 두 단계로 구성된다. 실험 결과, CPLF 알고리즘이 PLF에 비해 효율적임을 확인했으며, CPLF 알고리즘이 1.36 mm의 오차와 10.76ms의 처리 시간을 보여 제안 방법이 다양한 유형의 보도블록과 환경적 요인이 존재하는 실제 환경에서도 UGV에서 3D 레이저 라인센서를 이용하여 강건한 온라인 측정을 보장하면서도 높은 정확성을 유지할 수 있음을 확인했다.

Training Dataset Generation through Generative AI for Multi-Modal Safety Monitoring in Construction

  • Insoo Jeong;Junghoon Kim;Seungmo Lim;Jeongbin Hwang;Seokho Chi
    • 국제학술발표논문집
    • /
    • The 10th International Conference on Construction Engineering and Project Management
    • /
    • pp.455-462
    • /
    • 2024
  • In the construction industry, known for its dynamic and hazardous environments, there exists a crucial demand for effective safety incident prevention. Traditional approaches to monitoring on-site safety, despite their importance, suffer from being laborious and heavily reliant on subjective, paper-based reports, which results in inefficiencies and fragmented data. Additionally, the incorporation of computer vision technologies for automated safety monitoring encounters a significant obstacle due to the lack of suitable training datasets. This challenge is due to the rare availability of safety accident images or videos and concerns over security and privacy violations. Consequently, this paper explores an innovative method to address the shortage of safety-related datasets in the construction sector by employing generative artificial intelligence (AI), specifically focusing on the Stable Diffusion model. Utilizing real-world construction accident scenarios, this method aims to generate photorealistic images to enrich training datasets for safety surveillance applications using computer vision. By systematically generating accident prompts, employing static prompts in empirical experiments, and compiling datasets with Stable Diffusion, this research bypasses the constraints of conventional data collection techniques in construction safety. The diversity and realism of the produced images hold considerable promise for tasks such as object detection and action recognition, thus improving safety measures. This study proposes future avenues for broadening scenario coverage, refining the prompt generation process, and merging artificial datasets with machine learning models for superior safety monitoring.

매장 문화재 공간 분포 결정을 위한 지하투과레이더 영상 분석 자동화 기법 탐색 (Automated Analyses of Ground-Penetrating Radar Images to Determine Spatial Distribution of Buried Cultural Heritage)

  • 권문희;김승섭
    • 자원환경지질
    • /
    • 제55권5호
    • /
    • pp.551-561
    • /
    • 2022
  • 지구물리탐사기법은 매장 문화재 조사에 필요한 높은 해상도의 지하 구조 영상 생성과 매장 유구의 정확한 위치 결정하는 데 매우 유용하다. 이 연구에서는 경주 신라왕경 중심방의 고해상도 지하투과레이더 영상에서 유구의 규칙적인 배열이나 선형 구조를 자동적으로 구분하기 위하여 영상처리 기법인 영상 특징 추출과 영상분할 기법을 적용하였다. 영상 특징 추출의 대상은 유구의 원형 적심과 선형의 도로 및 담장으로 캐니 윤곽선 검출(Canny edge detection)과 허프 변환(Hough Transform) 알고리듬을 적용하였다. 캐니 윤곽선 검출 알고리듬으로 검출된 윤곽선 이미지에 허프 변환을 적용하여 유구의 위치를 탐사 영상에서 자동 결정하고자 하였으나, 탐사 지역별로 매개변수를 달리해서 적용해야 한다는 제약이 있었다. 영상 분할 기법의 경우 연결요소 분석 알고리듬과 QGIS에서 제공하는 Orfeo Toolbox (OTB)를 이용한 객체기반 영상분석을 적용하였다. 연결 요소 분석 결과에서, 유구에 의한 신호들이 연결된 요소들로 효과적으로 인식되었지만 하나의 유구가 여러 요소로 분할되어 인식되는 경우도 발생함을 확인하였다. 객체기반 영상분석에서는 평균이동(Large-Scale Mean-Shift, LSMS) 영상 분할을 적용하여 각 분할 영역에 대한 화소 정보가 포함된 벡터 레이어를 우선 생성하였고, 유구를 포함하는 영역과 포함하지 않는 영역을 선별하여 훈련 모델을 생성하였다. 이 훈련모델에 기반한 랜덤포레스트 분류기를 이용해 LSMS 영상분할 벡터 레이어에서 유구를 포함하는 영역과 그렇지 않은 영역이 자동 분류 될 수 있음을 확인하였다. 이러한 자동 분류방법을 매장 문화재 지하투과레이더 영상에 적용한다면 유구 발굴 계획에 활용가능한 일관성 있는 결과를 얻을 것으로 기대한다.

입 모양 인식 시스템 전처리를 위한 관심 영역 추출과 이중 선형 보간법 적용 (Region of Interest Extraction and Bilinear Interpolation Application for Preprocessing of Lipreading Systems)

  • 한재혁;김용기;김미혜
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.189-198
    • /
    • 2024
  • 입 모양 인식은 음성 인식의 중요 부분 중 하나로 음성 인식을 위한 입 모양 인식 시스템에서 입 모양 인식 성능을 개선하기 위한 여러 연구가 진행됐다. 최근의 연구에서는 인식 성능을 개선하기 위해 입 모양 인식 시스템의 모델 구조를 수정하는 방법이 사용됐다. 본 연구에서는 모델 구조를 수정하는 것으로 인식 성능을 개선하는 기존의 연구와 달리 모델 구조의 변화 없이 인식 성능을 개선하는 것을 목표로 한다. 모델 구조의 수정 없이 인식 성능을 개선하기 위해, 사람이 하는 입 모양 인식에서 사용되는 단서를 참고해 입 모양 인식 시스템의 기존 관심 영역인 입술 영역과 함께 턱, 뺨과 같은 다른 영역을 관심 영역으로 설정하고 각 관심 영역의 인식률을 비교해 가장 높은 성능의 관심 영역을 제안한다. 또한, 관심 영역 크기를 정규화하는 과정에서 보간법의 차이로 인해 발생하는 정규화 결과의 차이가 인식 성능에 영향을 준다고 가정하고 최근접 이웃 보간법, 이중 선형 보간법, 이중 삼차 보간법을 사용해 동일한 관심 영역을 보간하고 각 보간법에 따른 입 모양 인식률을 비교해 가장 높은 성능의 보간법을 제안한다. 각 관심 영역은 객체 탐지 인공신경망을 학습시켜 검출하고, 각 관심 영역을 정규화하고 특징을 추출하고 결합한 뒤, 결합된 특징들을 차원 축소한 결과를 저차원 공간으로 매핑하는 것으로 동적 정합 템플릿을 생성했다. 생성된 동적 정합 템플릿들과 저차원 공간으로 매핑된 데이터의 거리를 비교하는 것으로 인식률을 평가했다. 실험 결과 관심 영역의 비교에서는 입술 영역만을 포함하는 관심 영역의 결과가 이전 연구의 93.92%의 평균 인식률보다 3.44% 높은 97.36%의 평균 인식률을 보였으며, 보간법의 비교에서는 이중 선형 보간법이 97.36%로 최근접 이웃 보간법에 비해 14.65%, 이중 삼차 보간법에 비해 5.55% 높은 성능을 나타내었다. 본 연구에 사용된 코드는 https://github.com/haraisi2/Lipreading-Systems에서 확인할 수 있다.

시계열 고해상도 항공영상을 이용한 소나무재선충병 감염목 탐지 - 강원대학교 학술림 일원을 대상으로 - (Detection of Pine Wilt Disease tree Using High Resolution Aerial Photographs - A Case Study of Kangwon National University Research Forest -)

  • 박정묵;최인규;이정수
    • 한국지리정보학회지
    • /
    • 제22권2호
    • /
    • pp.36-49
    • /
    • 2019
  • 본 연구는 강원대학교 학술림을 대상으로 현장조사 기반(Field Survey Based)에 의한 감염목(FSB_감염목)과 객체분류기반(Object Classification Based)에 의한 감염목(OCB_감염목)을 추출하고 감염목에 대한 공간적 분포특성 및 발생강도 평가를 목적으로 하였다. OCB 최적 가중치는 Scale 11, Shape 0.1, Color 0.9, Compactness 0.9, Smoothness 0.1로 선정되었으며, 전체 분류정확도는 약 94%, Kappa 계수는 0.88로 매우 높았다. OCB_감염목 지역은 약 2.4ha로 전체 면적의 약 0.05% 발생하였다. OCB_감염목와 FSB_감염목의 임분구조 분포특성 및 지형 지리적 요인을 비교 하면, OCB_감염목 영급은 IV영급의 분포비율이 약 44%로 가장 높았으며, FSB_감염목의 영급도 IV영급의 분포비율이 약 55%로 가장 높았다. OCB_감염목의 IV영급 비율은 FSB_감염목보다 약 11% 낮았다. OCB_감염목 경급은 소경목과 중경목이 약 93%로 대부분을 차지한 반면, FSB_감염목 경급은 중경목과 대경목이 약 87%로 전체 대상지의 경급 분포와 상이하였다. 한편, OCB_감염목 표고 분포비율은 401-500m에서 약 30%로 가장 높은 반면, FSB_감염목은 301-400m에서 약 45%로 상이하였으며, 임도로부터 접근성 분포 비율은 OCB_감염목과 FSB_감염목 모두 100m이하에서 각각 약 24%와 31%로 가장 높아 임도로부터 접근성이 높을수록 감염목이 높았다. OCB_감염목 핫스팟은 31임반과 32임반으로 영급과 경급이 높은 지역에서 높게 분포하였다.

이물 객체 탐지 성능 개선을 위한 딥러닝 네트워크 기반 저품질 영상 개선 기법 개발 (Development of deep learning network based low-quality image enhancement techniques for improving foreign object detection performance)

  • 엄기열;민병석
    • 인터넷정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.99-107
    • /
    • 2024
  • 경제성장과 산업 발전에 따라 반도체 제품부터 SMT 제품, 전기 배터리 제품에 이르기 까지 많은 전자통신 부품들의 제조과정에서 발생하는 철, 알루미늄, 플라스틱 등의 이물질로 인해 제품이 제대로 동작하지 않거나, 전기 배터리의 경우 화재를 발생하는 문제까지 심각한 문제로 이어질 가능성이 있다. 이러한 문제를 해결하기 위해 초음파나 X-ray를 이용한 비파괴 방법으로 제품 내부에 이물질이 있는지 판단하여 문제의 발생을 차단하고 있으나, X-ray 영상을 취득하여 이물질이 있는지 판정하는 데에도 여러 한계점이 존재한다. 특히. 크기가 작거나 밀도가 낮은 이물질들은 X-Ray장비로 촬영을 하여도 보이지 않는 문제점이 있고, 잡음 등으로 인해 이물들이 잘 안 보이는 경우가 있으며, 특히 높은 생산성을 가지기 위해서는 빠른 검사속도가 필요한데, 이 경우 X-ray 촬영시간이 짧아지게 되면 신호 대비 잡음비율(SNR)이 낮아지면서 이물 탐지 성능이 크게 저하되는 문제를 가진다. 따라서, 본 논문에서는 저화질로 인해 이물질을 탐지하기 어려운 한계를 극복하기 위한 5단계 방안을 제안한다. 첫번째로, Global 히스토그램 최적화를 통해 X-Ray영상의 대비를 향상시키고, 두 번째로 고주파 영역 신호의 구분력을 강화하기 위하여 Local contrast기법을 적용하며, 세 번째로 Edge 선명도 향상을 위해 Unsharp masking을 통해 경계선을 강화하여 객체가 잘 구분되도록 한다, 네 번째로, 잡음 제거 및 영상향상을 위해 Resdual Dense Block(RDB)의 초고해상화 방법을 제안하며, 마지막으로 Yolov5 알고리즘을 이용하여 이물질을 학습한 후 탐지한다. 본 연구에서 제안하는 방식을 이용하여 실험한 결과, 저밀도 영상 대비 정밀도 등의 평가기준에서 10%이상의 성능이 향상된다.

Hybrid CNN-LSTM 알고리즘을 활용한 도시철도 내 피플 카운팅 연구 (A Study on People Counting in Public Metro Service using Hybrid CNN-LSTM Algorithm)

  • 최지혜;김민승;이찬호;최정환;이정희;성태응
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.131-145
    • /
    • 2020
  • 산업혁신의 흐름에 발맞추어 다양한 분야에서 활용되고 있는 IoT 기술은 빅데이터의 접목을 통한 새로운 비즈니스 모델의 창출 및 사용자 친화적 서비스 제공의 핵심적인 요소로 부각되고 있다. 사물인터넷이 적용된 디바이스에서 누적된 데이터는 사용자 환경 및 패턴 분석을 통해 맞춤형 지능 시스템을 제공해줄 수 있어 편의 기반 스마트 시스템 구축에 다방면으로 활용되고 있다. 최근에는 이를 공공영역 혁신에 확대 적용하여 CCTV를 활용한 교통 범죄 문제 해결 등 스마트시티, 스마트 교통 등에 활용하고 있다. 그러나 이미지 데이터를 활용하는 기존 연구에서는 개인에 대한 사생활 침해 문제 및 비(非)일반적 상황에서 객체 감지 성능이 저하되는 한계가 있다. 본 연구에 활용된 IoT 디바이스 기반의 센서 데이터는 개인에 대한 식별이 불필요해 사생활 이슈로부터 자유로운 데이터로, 불특정 다수를 위한 지능형 공공서비스 구축에 효과적으로 활용될 수 있다. 대다수의 국민들이 일상적으로 활용하는 도시철도에서의 지능형 보행자 트래킹 시스템에 IoT 기반의 적외선 센서 디바이스를 활용하고자 하였으며 센서로부터 측정된 온도 데이터를 실시간 송출하고, CNN-LSTM(Convolutional Neural Network-Long Short Term Memory) 알고리즘을 활용하여 구간 내 보행 인원의 수를 예측하고자 하였다. 실험 결과 MLP(Multi-Layer Perceptron) 및 LSTM(Long Short-Term Memory), RNN-LSTM(Recurrent Neural Network-Long Short Term Memory)에 비해 제안한 CNN-LSTM 하이브리드 모형이 가장 우수한 예측성능을 보임을 확인하였다. 본 논문에서 제안한 디바이스 및 모델을 활용하여 그간 개인정보와 관련된 법적 문제로 인해 서비스 제공이 미흡했던 대중교통 내 실시간 모니터링 및 혼잡도 기반의 위기상황 대응 서비스 등 종합적 메트로 서비스를 제공할 수 있을 것으로 기대된다.

명사 어휘의미망을 활용한 문법 검사기의 문맥 오류 결정 규칙 일반화 (Generalization of error decision rules in a grammar checker using Korean WordNet, KorLex)

  • 소길자;이승희;권혁철
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.405-414
    • /
    • 2011
  • 국내에서 가장 일반적으로 사용되고 있는 규칙 기반 오류 검출 방법은 언어 전문가가 한국어 문서에서 자주 발생하는 오류에 대한 검출 규칙을 경험적으로 구축하고 있다. 그러나 이렇게 경험적으로 규칙을 만들면 새로운 패턴의 문장이 나타날 때마다 규칙이 수정되어야 하므로 일관성 있는 오류 검사 및 교정을 기대할 수 없다. 본 논문에서는 이를 해결하려고 최근 개발되고 있는 어휘의미망 중에서 KorLex와 같은 정규화된 언어 자원을 활용하여 단어들의 범주 정보를 추출하고 이를 이용하여 오류 결정 규칙을 일반화한다. 그러나 현재 구축된 KorLex에는 명사의 계층관계 정보는 구축되어 있지만, 문장 요소와의 관계 정보, 즉, 격틀 정보가 부족하다. 본 논문에서는 용언 의미 오류 결정 규칙으로 사용할 선택제약 명사 클래스를 정보이론에 기초한 MDL과 Tree Cut Model을 활용하여 추출하고 이러한 선택제약 명사 클래스를 사용하여 문법 검사기 규칙을 일반화하는 방안을 제안한다. 실험 결과, 혼동하기 쉬운 네 개의 용언에 대해 목적어로 사용된 명사를 선택제약 명사 클래스로 일반화하여 문법 검사기 오류 결정 규칙 수를 평균 64.8%로 줄였고 기존 명사를 사용한 문법 검사기보다 정확도 측면에서 평균 약 6.2%정도 향상된 결과를 얻을 수 있었다.

얼굴인식의 향상을 위한 스테레오 영상기반의 3차원 정보를 이용한 인식 (Recognition method using stereo images-based 3D information for improvement of face recognition)

  • 박장한;백준기
    • 전자공학회논문지CI
    • /
    • 제43권3호
    • /
    • pp.30-38
    • /
    • 2006
  • 본 논문에서는 스테레오 얼굴영상으로부터 3차원 정보인 거리와 깊이 정보를 이용해 거리에 따라 얼굴인식률이 떨어지는 것을 개선하였다. 단안 영상은 객체의 거리, 크기, 이동, 회전, 깊이 등의 불확실한 정보로 인해 인식률이 떨어지는 문제점이 있다. 또한 얼굴의 회전, 조명, 표정변화 등의 영상정보가 취득되지 않으면 인식률이 매우 저하되는 단점이 있다. 그래서 본 연구는 이와 같은 문제점을 해결하고자 한다. 제안된 방법은 눈 검출 알고리듬, 얼굴의 회전 방향분석, PCA(Principal Component Analysis)로 구성된다. 또한 제한된 영역에서 얼굴을 고속으로 검출하기 위해 RGB컬러공간에서 YCbCr공간으로 변환한다. 얼굴후보 영역에서 다층 상대적인 밝기 맵을 생성하여 얼굴의 기하학적인 구조로부터 얼굴인지를 판별한다. 스테레오 얼굴영상으로부터 거리 및 눈과 입의 깊이 정보를 취득하고, 거리에 따라 확대, 축소, 이동, 회전 등의 정규화를 통해 $92{\times}112$ 크기의 얼굴을 검출한다. 검출된 왼쪽 얼굴영상과 추정된 방향의 차를 PCA로 학습한다. 제안된 방법은 정면에서 최대 95.8%(100cm), 포즈변화에 따라 98.3%의 인식률을 얻을 수 있었다. 따라서 실험을 통하여 제안된 방법은 거리에 따라 확대, 축소와 회전 등의 정확한 정규화로 높은 인식률을 얻을 수 있음을 보였다.

The Study on The Identification Model of Friend or Foe on Helicopter by using Binary Classification with CNN

  • Kim, Tae Wan;Kim, Jong Hwan;Moon, Ho Seok
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.33-42
    • /
    • 2020
  • 각종 감시체계에서 육안에 의존하여 물체를 식별해내는 것은 어렵고 실수하기 쉬우므로 군 감시체계에서 자동식별능력의 필요성은 더욱 높아지고 있다. 사회에 발표되는 모형들은 군 무기체계에 대한 데이터가 반영되지 않아 군에 바로 적용하는 것은 제한된다. 본 연구는 군용 헬기의 이미지에 합성곱 신경망을 적용하여 피아식별 모형을 구축한 연구이다. 제안하는 모형은 우리나라에서 주로 사용하고 있는 헬기인 AH-64 기종과 공산권 국가에서 주로 사용하고 있는 헬기인 Mi-17 기종의 이미지를 통해 학습시켜 구축되었다. 제안하는 모형의 성능을 살펴보면, 평가척도를 이용하여 평가한 결과 97.8%의 정확도, 97.3%의 정밀도, 98.5% 재현율과 97.9%의 F-measure의 성능을 보임을 확인하였다. 이런 분류 결과에 대해서 Feature-map을 통해 아군 헬기의 바퀴와 무장, 그리고 흡기구 주변이, 적군 헬기의 바퀴, 흡기구, 그리고 창문 부위가 피아식별 모형의 분류 기준임을 확인할 수 있었다. 본 연구는 CNN을 이용하여 군 무기체계 중 헬기의 영상정보에 대한 피아식별에 대한 분류를 처음으로 시도한 연구이며, 본 연구에서 제안하는 모형은 기존의 다른 무기체계에 대한 분류 모형보다 높은 정확도를 보인다.