• 제목/요약/키워드: object detection

검색결과 2,458건 처리시간 0.031초

딥러닝기반 건축폐기물 이미지 분류 시스템 비교 (A Comparison of Image Classification System for Building Waste Data based on Deep Learning)

  • 성재경;양민철;문경남;김용국
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.199-206
    • /
    • 2023
  • 본 연구는 건축시 발생되는 폐기물의 자동분류를 위해 딥러닝 알고리즘을 활용해 건출 폐기물 데이터를 각각 목재 폐기물, 플라스틱 폐기물, 콘크리트 폐기물로 분류하는 두 모델들을 통해서 성능 비교를 한다. 건축 폐기물의 분류를 위해 사용된 딥러닝 알고리즘은 합성곱 신경망 이미지 분류 알고리즘 VGG-16과 NLP를 기반으로 이미지를 시퀀스화 시킨ViT, Vision Transformer 모델을 사용했다. 건축 폐기물 데이터 수집을 위해 이미지 데이터를 전 세계 검색엔진에서 크롤링 하였고, 육안으로도 명확히 구분하기 어렵거나, 중복되는 등 실험에 방해되는 이미지는 전부 제외하여 각 분류당 1천장씩 총 3천장의 이미지를 확보했다. 또한, 데이터 학습시에 모델의 정확도 향상에 도움을 주기 위해 데이터 확대 작업을 진행해 총 3만장의 이미지로 실험을 진행 하였다. 수집된 이미 데이터가 정형화 되어있지 않은 데이터 임에도 불구하고 실험 결과는 정확도가 VGG-16는 91.5%, ViT 는 92.7%의 결과가 나타났다. 이는 실제 건축폐기물 데이터 관리 작업에 실전 활용 가능성을 제시한 것으로 보인다. 본 연구를 바탕으로 추후에 객체 탐지 기법이나 의미론적 분할 기법까지 활용한다면, 하나의 이미지 안에서도 여러 세밀한 분류가 가능해 더욱 완벽한 분류가 가능할 것이다.

PCA 기반 변환을 통한 다해상도 피처 맵 압축 방법 (A Feature Map Compression Method for Multi-resolution Feature Map with PCA-based Transformation)

  • 박승진;이민훈;최한솔;김민섭;오승준;김연희;도지훈;정세윤;심동규
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.56-68
    • /
    • 2022
  • 본 논문에서는 VCM을 위한 다해상도 피처 맵에 대한 압축 방법을 제안한다. 제안하는 압축 방법은 PCA 기반의 변환을 통해 다해상도 피처 맵의 채널 및 해상도 계층 간 중복성을 제거하며 변환에 사용된 기저 벡터와 평균 벡터 그리고 변환을 통해 얻어진 변환 계수를 각각의 특성에 따라 VVC 기반 부호화기와 DeepCABAC을 통하여 압축한다. 제안하는 방법의 성능을 측정하기 위하여 OpenImageV6와 COCO 2017 validation set에 대하여 객체 검출 성능을 평가하며, MPEG-VCM 앵커 및 본 논문에서 제안하는 피처 맵 압축 앵커 대비 bpp와 mAP를 BD-rate 관점에서 비교한다. 실험 결과, 제안하는 방법은 OpenImageV6에서 피처 맵 압축 앵커 대비 25.71%의 BD-rate 성능 향상을 보이며, 특히 COCO 2017 validation set의 크기가 큰 객체들에 대해서 MPEG-VCM 앵커 대비 최대 43.72%의 BD-rate 성능이 향상됨을 보인다.

무인 점포 사용자 이상행동을 탐지하기 위한 지능형 모션 패턴 인식 알고리즘 (Intelligent Motion Pattern Recognition Algorithm for Abnormal Behavior Detections in Unmanned Stores)

  • 최영준;나지영;안준호
    • 인터넷정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.73-80
    • /
    • 2023
  • 최근 최저시급의 가파른 인상으로 인건비에 대한 부담이 늘어남과 함께 코로나19의 여파로 무인 상점의 점유율이 높아지고 있는 추세이다. 그로 인해 무인 점포를 타겟으로 하는 도난 범죄들도 같이 늘어나고 있어 이러한 도난 사고를 방지하기 위해 Just-Walk-Out 시스템을 도입하고 고비용의 LiDAR 센서, 가중치 센서 등을 사용하거나 수동으로 지속적인 CCTV 감시를 통해서 확인하고 있다. 하지만 이런 고가의 센서를 많이 사용할수록 점포 운영에 있어 비용 부담이 늘어나게 되고, CCTV 확인은 관리자가 24시간 내내 감시하기 어려워서 사용이 제한적이다. 본 연구에서는 이런 센서들이나 사람에 의지하는 부분을 해결할 수 있고 무인점포에서 사용할 수 있는 저비용으로 도난 등의 이상행동을 하는 고객을 탐지하여 클라우드 기반의 알림을 제공하는 인공지능 영상 처리 융합 알고리즘을 제안하고자 한다. 또한 본 연구에서는 mediapipe를 이용한 모션캡쳐, YOLO를 이용한 객체탐지 그리고 융합 알고리즘을 통해 무인 점포에서 수집한 행동 패턴 데이터를 바탕으로 각 알고리즘들에 대한 정확도를 확인하며 다양한 상황 실험을 통해 융합 알고리즘의 성능을 증명했다.

선형분광혼합화소분석을 이용한 서부지역 DMZ의 토지피복 변화 탐지 (Land-Cover Change Detection of Western DMZ and Vicinity using Spectral Mixture Analysis of Landsat Imagery)

  • 김상욱
    • 한국지리정보학회지
    • /
    • 제9권1호
    • /
    • pp.158-167
    • /
    • 2006
  • 본 연구는 DMZ 및 민통선지역의 토지피복 변화양상을 생태학적 측면에서 파악해보는데 목적을 두고 있다. 한반도 허리를 가르는 대상형 지역인 DMZ에 대하여 남북간 왕래가 잦은 서부지역에 대하여 토지피복특성을 파악해 보았는데, 비접근지역인 연구지역 특성상 본 연구에서는 위성영상자료를 활용하여 토지피복의 현황 및 변화특성을 파악해 보았다. '80년대 중반(Landsat TM, '87.05.20) 및 2000년대 초반의 영상(Landsat ETM+, '02.06.06)을 활용함으로써 최근 15년 동안 토지피복이 어떻게 변화했는지 파악하였으며, 생태적 가치가 큰 DMZ 지역의 토지피복 분류정확도를 높이기 위하여, 선형분광혼합화소분석(linear spectral mixture analysis : LSMA)을 이용하였다. 이 분석법은 하나의 화소를 단일한 지표물로 가정하여 영상을 처리하는 기존의 기법과 달리, 각 화소의 토지피복의 혼합정도를 세분화 한 후 대상지의 토지피복 특성을 가장 잘 반영하는 순수한 화소값 별로 분할영상(fraction image)을 생성하였는데, 본 연구에서는 식생, 토양, 수문의 3가지 화소에 대한 분할영상을 생성하였다. 분석결과 토지피복 가운데 산림지역의 면적이 가장 많은 감소를 가져왔는데, 남한지역의 경우 산림의 $39.04km^2$가, 북한지역은 $52.37km^2$가 다른 토지피복으로 변화되었다. 농경지의 경우 북한은 농경지 면적의 $56.15km^2$가 나대지로 변화되었는데, 이는 남한에 비하여 농경지 관리가 소홀하여 나대지 상태로 방치되고 있음을 알 수 있다. 공간적인 측면에서 볼 때, 민통선지역의 경우 전반적으로 토지피복의 변화가 나타나고 있으며, DMZ 내부의 경우도 장단반도 주변지역, 파주시 및 북한 판문군지역의 경우 그 변화가 민통선지역과 비슷한 양상을 보이고 있다.

  • PDF

공간통계분석기법을 이용한 소셜 네트워크 유력지역 탐색기법 연구 (A Study on Detection Methodology for Influential Areas in Social Network using Spatial Statistical Analysis Methods)

  • 이영민;박우진;유기윤
    • 대한공간정보학회지
    • /
    • 제22권4호
    • /
    • pp.21-30
    • /
    • 2014
  • 최근 소셜 미디어의 활성화로 인해 소셜 네트워크상에서 수많은 자발적 추종자들을 확보한 새로운 형태의 유력자가 대두되고 있다. 소셜 네트워크상에서의 유력자를 탐색하는 연구들이 진행되어 왔고, 관련 서비스가 제공 중에 있으나 이들은 유력자 규명에 있어 위치기반 소셜 네트워크 서비스(LBSNS)가 가지고 있는 위치 정보에 대한 반영이 부족하다는 한계점을 가지고 있었다. 이에 본 연구에서는 공간통계분석기법을 이용하여 LBSNS 데이터를 대상으로 다양한 사회문화적 이슈에 대한 발언에 영향력을 가지는 유력자를 공간적으로 탐색하고, 이를 활용하는 방안을 제시하고자 하였다. 이를 위해 트위터의 지오태깅된 메시지를 분석 데이터로 사용하였으며, 서울시를 공간적 범위로 하여 한 달 동안 총 168,040건의 메시지를 수집하였다. 또한 '정치', '경제', 'IT'를 연구 대상 범주로 설정하고, 데이터 수집 기간 동안 이슈가 되었던 키워드들을 주어진 범주별로 분류하였다. 이를 바탕으로 키워드에 대한 유력자를 파악하기 위한 노출도를 도출하고, 이에 대해 서울시의 행정동을 기준으로 공간결합연산을 실시함으로써 각 키워드에 대한 행정동별 노출도를 산출하였다. 그리고 행정동별로 산출된 노출도의 공간적 의존성을 고려하여 유력지수를 도출하였으며, 키워드별로 상위의 유력지수를 보이는 지역을 유력지역으로 추출하여 이들의 공간적인 분포 특성과 키워드들 간의 공간적 상관성을 분석하였다. 실험 결과, 동일 범주 내에서 키워드 간의 공간적 상관계수는 0.3 이상으로 높은 상관성을 보였으며, 정치범주와 경제범주의 키워드 간 상관계수 역시 평균 0.3으로 비교적 높은 상관성을 보인 반면, 정치범주와 IT범주, 경제범주와 IT범주 키워드 간의 상관계수는 각각 0.18, 0.15로 낮은 상관성을 보였다. 본 연구는 유력자에 대한 연구를 공간 정보의 관점에서 구체화시켰다는 점에서 의의를 가지며, 향후에 gCRM(geographic Customer Relationship Management) 등의 분야에 유용하게 활용될 수 있을 것이다.

초음파 서모그라피를 이용한 실시간 결함 검출에 대한 연구 (A Study on Real-Time Defect Detection Using Ultrasound Excited Thermography)

  • 조재완;서용칠;정승호;정현규;김승호
    • 비파괴검사학회지
    • /
    • 제26권4호
    • /
    • pp.211-219
    • /
    • 2006
  • 초음파 서모그라피는 초음파 진동 에너지 여기에 의한 물체의 표면 및 표면 아래에 존재하는 결함부위의 선택적 발열 특성을 적외선 열영상 카메라로 관측하는 것이다. 결함(균열, 박리, 공극 등) 이 존재하는 구조물에 초음파 진동 에너지를 입사시킬 경우 결함 부근에서의 국부적인 발열로 인해 건전 부위와의 급격한 온도차를 드러내는 핫 스폿이 관측된다. 초음파 진동 에너지 여기에 의한 핫 스폿 관측 및 분석을 통해 결함을 진단하는 것이 초음파 서모그라피를 이용한 비파괴 결함 진단 방법이다. 이를 이용한 결함 검출을 위해서는 초음파의 진동에너지를 검사 구조물에 효율적으로 전달하는 것이 중요하다 본 논문에서는 초음파 서모그라피를 이용한 실시간 결함검출에 대해 기술한다. 초음파 진동에너지의 입사 방향에 따른 결함 검출 특성을 평가하기 위해 진동에너지의 전달 방향을 시편과 수직 또는 수평방향으로 각각 입사시켰다. 각각의 입사 방향에 따른 초음파 트랜스듀서 양단에 인가되는 전압을 디지털 오실로스코우프로 계측 비교하였다. 결함 검출에 사용한 시편은 14 mm 두께의 SUS 균열(crack) 시편, PCB 기판(1.8 mm), 인코넬 600 판(1.0 mm) 및 CFRP 판(3.0 mm)의 4종류이다. 4종류의 시편에 대해 280ms 펄스폭의 초음파에너지를 수직 수평으로 각각 입사시켰다. 4종류 모두 수직방향으로 초음파 진동에너지를 입사시켰을 때 수평방향에 비해 전달 손실이 적었다. 복합재료인 PCB, CFRP 판은 수직방향으로 초음파 진동에너지를 입사시켰을 때 수평방향에 비해 결함 위치에서 열이 크게 발생하였으며 선택적 발열 현상도 3배 이상 지속되었다. 금속재료인 인코넬 600판과 SUS 시편은 수평방향이 수직방향보다 핫 스폿이 빨리 관측되었다.

농업용 저수지 모니터링을 위한 다해상도 SAR 영상의 활용 (Multi-resolution SAR Image-based Agricultural Reservoir Monitoring)

  • 이슬찬;정재환;오승철;정하규;최민하
    • 대한원격탐사학회지
    • /
    • 제38권5_1호
    • /
    • pp.497-510
    • /
    • 2022
  • 농업용 저수지는 수자원이 계절적으로 편중된 한반도에서 갈수기 용수 공급을 위한 필수적인 구조물이다. 효율적인 물 관리를 위해서는 중소규모 저수지에 대한 체계적이고 효과적인 모니터링이 필요하며, 합성개구 레이더(Synthetic Aperture Radar, SAR) 영상은 전천후 관측이 가능하다는 특징과 함께 연속적인 저수지 모니터링을 위한 도구가 된다. 본 연구에서는 10 m급 해상도를 갖는 Sentinel-1 SAR 영상과 1 m급 해상도의 Capella X-SAR 영상을 활용하여 울산광역시 차리, 갈전, 뒷골 저수지의 수체를 탐지하였으며, 이를 통해 국내 중소규모 저수지 모니터링에의 활용성을 평가하고자 하였다. Z fuzzy function 기반 임계값 산정을 통한 영상분할기법과 객체 탐지 기반 분할기법인 Chan-vese (CV) 기법을 통해 수체 영역을 산정하였으며, UAV 영상과의 비교를 통해 성능을 정량적으로 평가하였다. 임계값 기반 탐지 정확도는 Sentinel-1의 경우 약 0.87, 0.89, 0.77 (차리, 갈전, 뒷골), Capella의 경우 약 0.78, 0.72, 0.81로 나타났으며, CV 기법 적용 시 모든 저수지에서 정확도가 향상되는 것을 확인하였다(Sentinel-1: 0.94, 0.89, 0.84, Capella: 0.92, 0.89, 0.93). Capella는 모든 저수지/분할기법에 대해 수체와 비수체의 경계를 비교적 뚜렷하게 모의하였으나, 고해상도로 인한 speckle noise가 충분히 평활화되지 않아 오탐지 및 미탐지가 다소 발생하였다. 오탐지의 제거를 위해 광학 센서 기반 보조자료를 활용하여 마스킹한 결과, 정확도가 최대 13% 향상되는 것을 확인할 수 있었다. 본 연구 결과를 바탕으로 SAR 위성 기반 더욱 정확한 저수지 탐지가 이루어진다면 소규모 저수지를 포함, 종합적인 가용수량에 대한 연속적인 모니터링이 가능할 것이며, 효과적인 수자원 관리에 기여할 수 있을 것으로 기대된다.

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.