• 제목/요약/키워드: 자동 영상 분할

검색결과 397건 처리시간 0.03초

콘크리트 라이닝 균열 분할 딥러닝 모델 평가 방법 (An evaluation methodology for cement concrete lining crack segmentation deep learning model)

  • 함상우;배수현;이임평;이규필;김동규
    • 한국터널지하공간학회 논문집
    • /
    • 제24권6호
    • /
    • pp.513-524
    • /
    • 2022
  • 터널을 비롯한 여러 가지 기반시설물에 발생한 콘크리트 균열을 영상과 딥러닝 기반으로 자동 탐지하는 연구가 최근 활발히 이루어지고 있다. 이러한 연구성과를 실제 현장에 적용하려면 딥러닝 모델의 신뢰성을 설명할 수 있어야한다. 본 연구에서는 선형성이 강한 균열의 기하적인 특성을 고려했을 때 화소 기반으로 계산하는 기존 평가지표가 충분치 않다는 점을 지적하며, 균열 분할 딥러닝 모델의 성능을 더 합리적으로 설명할 수 있는 다른 평가지표를 제시하고 비교 분석한다. 먼저 선형 객체의 유사성을 측정할 수 평가방법을 제시한다. 구체적으로는 기준 데이터에 허용 버퍼(tolerance buffer)를 부여하여 평가하는 방법을 설계, 구현, 검증한다. 실험 결과 본 연구에서 제안하는 방법은 균열 분할 딥러닝 모델 평가시 기존 대비 과대평가 또는 과소평가 문제를 해결할 수 있었으며, 화소 기반 성능 평가 지표에 비해 균열 분할 딥러닝 모델의 성능을 더 잘 설명할 것으로 기대한다.

능동모양모델 알고리듬을 위한 삼차원 모델생성 기법 (Three-dimensional Model Generation for Active Shape Model Algorithm)

  • 임성재;정용연;호요성
    • 대한전자공학회논문지SP
    • /
    • 제43권6호
    • /
    • pp.28-35
    • /
    • 2006
  • 통계적 데이터를 이용하여 모양 변이가 가능한 능동모양모델(Active Shape Model, ASM)은 이차원 영상의 분할 및 인식에 성공적으로 사용되고 있다. 삼차원 모델 기반 기법은 객체 경계의 인식 및 묘사(delineating)를 위한 더욱 현실적인 모양 억제력(constraint)을 갖는다는 점에서 이차원 모델 기반 기법에 비해 좋은 결과를 가져온다. 그러나 삼차원 모델 기반 기법을 위해서는 분할된 객체들의 집합인 훈련(training) 데이터로부터 삼차원 모양모델을 생성하는 것이 가장 중요하고 필수적인 단계이며, 현재까지도 커다란 도전 과제로 남아있다. 삼차원 모양모델 생성에서 가장 중요한 단계는 포인트 분산모델(PDM)을 생성하는 것이다. PDM 생성을 위해서는 상응하는 특징점(landmark)을 모든 훈련 데이터의 대응하는 위치에서 선택해야 한다. 그러나 현재까지 많이 사용되는 특징점의 수동 선택 기법은 시간이 많이 소비되며, 많은 오류를 발생한다. 본 논문에서는 삼차원 통계적 모양모델의 생성을 위한 새로운 자동 기법을 제안한다. 주어진 삼차원 훈련 모양 데이터에서, 삼차원 모델은 다음 방법에 의해 생성된다. 1) 훈련 모양 데이터의 거리 변환(distance transform)으로부터 평균(mean) 모양 생성, 2) 평균 모양에서 자동적으로 특징점을 선택하기 위한 사면체(tetrahedron) 기법 사용, 3) 거리 표식(distance labeling) 기법을 통한 각 훈련 모양에서 특징점의 전파(propagating). 본 논문에서는 50명의 복부 CT 영상으로부터 간(liver)을 위한 삼차원 모델을 생성하고, 평가를 위i괘 정확성과 밀집도(compactness)를 조사한다. 기존의 삼차원 모델 생성 기법들은 객체의 모양과 기하학적 및 위상학적으로 심각한 제한을 갖지만, 본 논문에서 제안한 기법은 위와 같은 제한 없이 어느 데이터 집합에도 적용할 수 있다.3mW이며, 시제품 ADC의 칩 면적은 $0.47mm^2$ 이다. 각각 56dB, 65dB이고, 전력 소모는 1.2V 전원 전압에서 각각 4.8mW, 2.4mW이며 제작된 ADC의 칩 면적은 $0.8mm^2$이다.quential scan) 알고리즘과 성능을 비교한다. 실험결과, 제안된 알고리즘은 순차 검색에 비하여 최대 13.2배까지 성능이 향상되었으며, 인덱스의 개수 k가 증가함에 따라 검색 성능도 함께 증가하였다.라서 보다 안전성과 효율성이 뛰어난 2차 대사물질을 찾아내는 연구와 아울러 방제기능이 있는 물질의 생합성경로를 구명하고 대사공학적으로 이용하므로 병해충에 저항성이 있고 잡초 방제효과를 갖는 형질전환 식물을 육성하는 연구가 지속적으로 이루어져야 할 것이다.{\sim}83.8%$ 범위(範圍)를 차지 하였다. 5) 칼슘 섭취량(攝取量)은 권장량 500 mg 에 비(比)하여 양구지역(楊口地域) 아동(兒童)이 $282.4{\sim}355.0mg$이었고 여주지역(麗州地域) 아동(兒童)이 $284.6{\sim}429.0mg$ 이었다. 6) 철(鐵) 섭취량(攝取量)은 권장량 10mg에 비(比)하여 양구지역(楊口地域) 아동(兒童)이 $6.0{\sim}12.1mg$ 범위(範圍)이었고 여주지역(麗州地域) 아동(兒童)이 $6.4{\sim}16.7mg$ 범위(範圍)로 상당수의 아동(兒童)이 권장량에 미달(未達) 되었다. 7) 비터민 A 섭취량(攝取量)은 양구지역(楊口地域)이 $703.4{\sim}1495.6\;IU$ 범위(範圍)이었고 여주지역(麗州地域) 아동(兒童)이 $750.5{\sim}1521.2\;IU$ 범위(範圍)로서 ${\beta}-carotene$으로서의 권장량 5100 I.U,에 비(比)하여 매우 부족되었다

서베일런스에서 회선 신경망 기술을 이용한 사람 추적 기법 (Human Tracking Technology using Convolutional Neural Network in Visual Surveillance)

  • 강성관;천상훈
    • 디지털융복합연구
    • /
    • 제15권2호
    • /
    • pp.173-181
    • /
    • 2017
  • 본 논문에서는 현재와 이전의 영상 프레임 뿐 만 아니라 영상의 축척과 이전 위치에 주어진 객체의 비율과 위치 추정에 대한 학습 문제로서 사람 추적 문제를 다룬다. 본 논문에서는 회선 신경망 분류기를 이용한 사람 검출방법을 제안한다. 제안하는 방법은 신경망을 정규화하고 검출 작업을 위한 특징 표현을 자동으로 최적화함으로써 사람 검출의 정확성을 향상시킨다. 제안하는 방법에서는 감시 영상 시스템에서 실시간 영상이 들어오면 제일 먼저 위치를 추정하는 작업을 수행하기 위하여 회선신경망을 학습시킨다. 기존의 다른 학습 방법과 달리 회선신경망은 두쌍의 연속된 영상 프레임으로부터 공간적이고 시간적인 특징을 모두 공동으로 학습시킨다. 회선 신경망에 의해 학습된 특징을 이용하는 SVM 분류기의 정확성은 회선 신경망의 정확성과 일치한다. 이것은 자동적으로 최적화된 특징의 중요성을 확인시켜 준다. 그러나, 회선 신경망을 이용한 사람 객체의 분류에 대한 계산 시간은 사용된 특징의 타입과 관계없이 SVM의 것보다 약 40분의 1정도로 작다.

시각매체를 위한 병렬처리 시스템 (A Parallel Processing System for Visual Media Applications)

  • 이형;박종원
    • 한국통신학회논문지
    • /
    • 제27권1A호
    • /
    • pp.80-88
    • /
    • 2002
  • 영상과 그래픽 및 비디오와 같은 시각 매체들을 실시간으로 처리하기 위한 구현 기술과 그에 따른 확정성 측면에서 많은 연구들이 진행되고 있는데, 이러한 연구들은 영상처리 전용 프로세서 구현부터 다양한 매체들을 함께 처리할 수 있는 프로세서 구현을 포함하는 범주까지 진행되고 있다. 또한, 다양한 병렬처리 기법들이 실시간 처리를 위한 프로세서의 구현에 적용되고 있다. 본 논문은 이러한 시각매체들을 실시간으로 처리하기 위하여 메모리 시스템과 다수개의 처리기로 구성된 pipelined SIMD 구조를 갖는 병렬처리시스템을 제안한다. 메모리시스템은 m개의 메모리 모듈과 메모리 제어기로 구성되어 있는 다중접근 기억장치로써, m개의 메모리 모듈에서 병렬로 n(=p${\times}$q)개의 데이터에 접근하기 위한 다양한 형태, 즉, 행(1${\times}$pq)과 열(pq${\times}$1) 및 블록 (p${\times}$q) 접근을 제공한다. 제안한 병렬처리시스템에 얼굴인식과 퐁 음영 및 동영상에서의 자동영상분할을 적용하여 시스템 성능을 분석하였다.

도심지역의 고해상도 위성영상 정합에 대한 그림자 영향 분석 (Analysis of Shadow Effect on High Resolution Satellite Image Matching in Urban Area)

  • 염준호;한유경;김용일
    • 대한공간정보학회지
    • /
    • 제21권2호
    • /
    • pp.93-98
    • /
    • 2013
  • 다중 시기에 수집된 고해상도 위성영상은 효과적인 도심지 분석과 모니터링을 위한 필수적인 자료이다. 그러나 같은 지역에 대해 다른 센서에서 수집된 영상은 물론, 동일 센서 영상이라 하더라도 두 영상간의 기하학적 위치정보가 서로 일치하지 않는 문제가 존재한다. 따라서 다중 영상의 효과적인 활용을 위해서는 영상 정합을 위해 매칭 포인트를 추출하는 일이 필수적이다. 그러나 도심지의 경우 건물, 교량, 나무, 기타 인공 구조물 등의 영향으로 넓은 영역에 그림자가 분포하며 그림자의 방향과 강도는 영상 수집 시기에 따라 달라지기 때문에 정확한 매칭 포인트를 추출하는데 어려움이 있다. 본 연구에서는 대표적인 매칭점 추출 기법인 SIFT(Scale-Invariant Feature Transform) 기법과 자동 그림자 추출 기법을 적용하여 도심지역의 그림자가 영상 정합에 미치는 영향을 분석하였다. 영상 분할을 통해 생성된 세그먼트의 분광 및 공간인자를 이용하여 그림자 객체를 추출하였으며 이 때 건물 버퍼 영역을 그림자의 인접정보로서 활용하였다. SIFT 기법을 통해 추출된 매칭점이 그림자에 위치하는 경우 이를 제거하고 영상 정합을 수행하였다. 최종적으로 고해상도 위성영상의 정합에 대한 그림자의 영향을 분석하기 위해 추출된 매칭점과 정합 결과의 정확도를 정량적, 시각적으로 평가하였다.

한방 설진을 위한 컴퓨터 지원 진단 소프트웨어 구현 (Implementation of Computerized Assistant Diagnosis Software for Tongue Diagnosis in the Oriental Medicine)

  • 이우범
    • 전자공학회논문지
    • /
    • 제51권6호
    • /
    • pp.175-182
    • /
    • 2014
  • 한방에서 설진은 초기 병증을 진단할 수 있는 방법으로 객관적인 진단 지표의 개발은 중요한 연구 분야 가운데 하나이다. 그러나 이전의 대부분의 설진 시스템은 한의사의 간섭을 배제한 자동 진단을 위한 전문가 시스템으로서 진료를 위한 객관화된 진단 지표의 생성에 있어서 어려움이 있었다. 따라서 본 논문에서는 한방 설진에 있어서 한의사의 진료 행위에 의해서 최적화된 설진을 위한 진단 지표를 계산하는 컴퓨터 지원 진단 소프트웨어를 제안한다. 개발한 소프트웨어는 반자동 방식으로 설질 추출을 위해서는 한의사의 매뉴얼 방식을 이용하고, 설태 영역을 자동 분할하여 비설태와 설태의 색상, WTCI 등에 대한 수치적 진단 지표를 한의사에게 실시간으로 제공한다. 또한, 설태 비율을 이용하여 소태, 박태, 후태의 분류 확률 추정 값과 진료 편의를 위한 전자의무기록 차트 기능도 제공한다. 구현된 컴퓨터 지원 진단 소프트웨어의 유효성 평가를 위해서는 60명의 피실험자를 대상으로 혀 영상을 구축하고, 설진 소프트웨어를 실험한 결과 피실험자의 95%가 소프트웨어 사용-유효성을 나타냈다.

딥러닝을 이용한 병징에 최적화된 딸기 병충해 검출 기법 (Strawberry Pests and Diseases Detection Technique Optimized for Symptoms Using Deep Learning Algorithm)

  • 최영우;김나은;볼라파우델;김현태
    • 생물환경조절학회지
    • /
    • 제31권3호
    • /
    • pp.255-260
    • /
    • 2022
  • 본 논문은 딥러닝 알고리즘을 이용하여 딸기 영상 데이터의 병충해 존재 여부를 자동으로 검출할 수 있는 서비스 모델을 제안한다. 또한 병징에 특화된 분할 이미지 데이터 세트를 제안하여 딥러닝 모델의 병충해 검출 성능을 향상한다. 딥러닝 모델은 CNN 기반 YOLO를 선정하여 기존의 R-CNN 기반 모델의 느린 학습속도와 추론속도를 개선하였다. 병충해 검출 모델을 학습하기 위해 일반적인 데이터 세트와 제안하는 분할 이미지 데이터 세트를 구축하였다. 딥러닝 모델이 일반적인 학습 데이터 세트를 학습했을 때 병충해 검출률은 81.35%이며 병충해 검출 신뢰도는 73.35%이다. 반면 딥러닝 모델이 분할 이미지 학습 데이터 세트를 학습했을 때 병충해 검출률은 91.93%이며 병충해 검출 신뢰도는 83.41%이다. 따라서 분할 이미지 데이터를 학습한 딥러닝 모델의 성능이 우수하다는 것을 증명할 수 있었다.

영역정보기반의 유전자알고리즘을 이용한 텍스트 후보영역 검출 (Detection of Text Candidate Regions using Region Information-based Genetic Algorithm)

  • 오준택;김욱현
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.70-77
    • /
    • 2008
  • 본 논문은 화소 단위의 정보가 아닌 분할된 영역들의 정보를 기반으로 유전자 알고리즘을 이용한 텍스트 후보영역 검출방안을 제안한다. 먼저, 영상분할을 수행하기 위해 색상별 화소분류와 비동질적인 군집의 감소를 위한 영역 단위의 재분류 알고리즘을 수행한다. 색상별 화소분류에 이용되는 EWFCM(Entropy-based Weighted Fuzzy C-Means) 알고리즘은 공간정보를 추가한 개선된 FCM 알고리즘으로써, 잡음에 강건한 특징을 가진다. EWFCM 알고리즘에 의해 분류된 화소들의 군집정보를 기반으로 수행되는 영역 단위의 재분류는 화소나 군집 단위의 재분류에 비해 효과적으로 영상에 존재하는 비동질적인 군집들을 감소시킬 수 있다. 그리고 텍스트 후보영역 검출은 분할된 영역들로부터 추출한 방향성 에지 성분에 대한 분산값 및 에너지, 크기, 개수 등의 정보를 기반으로 유전자알고리즘에 의해 수행된다. 이는 화소 단위의 정보를 이용한 방법보다 더 명확한 텍스트 영역정보를 획득할 수 있으며, 향후 자동문자인식에서 좀 더 손쉽게 이용될 수 있다. 실험 결과 제안한 분할방법은 기존 방법이나 화소나 군집 기반의 재분류보다 좋은 결과를 보였으며, 텍스트 후보영역 검출에서도 화소 단위의 정보를 이용한 기존 방법보다 더 좋은 결과를 보여 제안방법의 유효성을 확인하였다.

가상 대장 내시경 시스템을 위한 고속 경로 생성 알고리즘 (A Fast Flight-path Generation Algorithm for Virtual Colonoscopy System)

  • 강동구;이재연;나종범
    • 대한의용생체공학회:의공학회지
    • /
    • 제24권2호
    • /
    • pp.77-82
    • /
    • 2003
  • 삼차원 CT 영상을 이용하여 대장 내부의 병변을 관찰하고 진단하기 위한 비침습적 검사 방법인 가상 대장 내시경을 위하여 가상 카메라의 관찰점과 관찰 방향을 제공하기 위한 적절한 경로가 필요하다. 특히. 인간의 대장은 매우 길고 복잡하므로 사용자가 직접 경로를 생성하려면 많은 시간이 걸리고 정확한 결과를 기대하기 어렵다. 또한 경로를 자동으로 생성하는 기존의 방법들은 계산량이 많아 약 수 분에서 수 십분 이상의 수행 시간이 걸리고. 사람의 대장이 가지는 대표적인 구조인 두께가 급격히 변하거나 곡률이 큰 영역에서 적절한 중앙선을 얻기 어려우며. 끊김이 있는 부적절한 경로를 생성하고, 평활화된 경로가 대상체의 표면과 충돌할 가능성을 배제할 수 없다. 이 논문에서는 계산량이 적은 거리 지도 및 제안된 순서 지도를 이용하여 끊김이 없고 적절한 중앙선을 얻는 고속의 알고리즘을 제안한다 순서 지도는 대상체 내부의 각 복셀에서의 가능한 경로의 방향을 나타내며 거리 지도는 대상체 내부의 각 복셀과 가장 가까운 배경 복셀까지의 거리를 나타낸다. 제안한 방법에서는 두 지도들을 이용하여 끝점에서 출발하여 시작점을 향하는 동시에 더욱 넓은 영역으로 진행하는 경로를 얻으므로, 대상체의 두께와 곡률의 크기에 관계없이 적절한 중앙선을 얻을 수 있다. 이와 함께 경로의 충돌 가능성을 완전히 제거할 수 있는 간단한 평활화 방법을 제안한다 알고리즘의 적절성을 검증하기 위해 사람의 대장의 특징을 가진 팬텀(phantom) 데이터를 이용하여 실험하였다. 사람의 대장 CT 데이터를 이용하여 800MHz PC에서 1분 이내에 적절한 경로를 얻었으며 이를 따라 이동하는 가상의 카메라로부터 만족할만한 가상 대장 내시경 영상을 얻을 수 있음을 보였다.

딥러닝 기반 스타일 변환 기법을 활용한 인공 달 지형 영상 데이터 생성 방안에 관한 연구 (A Study for Generation of Artificial Lunar Topography Image Dataset Using a Deep Learning Based Style Transfer Technique)

  • 나종호;이수득;신휴성
    • 터널과지하공간
    • /
    • 제32권2호
    • /
    • pp.131-143
    • /
    • 2022
  • 달 현지 탐사를 위해 무인 이동체가 활용되고 있으며, 달 지상 관심 지역의 지형 특성을 정확하게 파악하여 실시간으로 정보화 하는 작업이 요구된다. 하지만, 정확도 높은 지형/지물 객체 인식 및 영역 분할을 위해서는 다양한 배경조건의 영상 학습데이터가 필요하며 이러한 학습데이터를 구축하는 과정은 많은 인력과 시간이 요구된다. 특히 대상이 쉽게 접근하기 힘든 달이기에 실제 현지 영상의 확보 또한 한계가 있어, 사실에 기반하지만 유사도 높은 영상 데이터를 인위적으로 생성시킬 필요성이 대두된다. 본 연구에서는 가용한 중국의 달 탐사 Yutu 무인 이동체 및 미국의 Apollo 유인 착륙선에서 촬영한 영상을 통해 위치정보 기반 스타일 변환 기법(Style Transfer) 모델을 적용하여 실제 달 표면과 유사한 합성 영상을 인위적으로 생성하였다. 여기서, 유사 목적으로 활용될 수 있는 두 개의 공개 알고리즘(DPST, WCT2)를 구현하여 적용해 보았으며, 적용 결과를 시간적, 시각적 측면으로 비교하여 성능을 평가하였다. 평가 결과, 실험 이미지의 형태 정보를 보존하면서 시각적으로도 매우 사실적인 영상을 생성할 수 있음을 확인하였다. 향후 본 실험의 결과를 바탕으로 생성된 영상 데이터를 지형객체 자동 분류 및 인식을 위한 인공지능 학습용 영상 데이터로 추가 학습된다면 실제 달 표면 영상에서도 강인한 객체 인식 모델 구현이 가능할 것이라 판단된다.