• 제목/요약/키워드: convolution method

검색결과 592건 처리시간 0.025초

정규화 및 항등사상이 활성함수 성능에 미치는 영향 (The Effect of regularization and identity mapping on the performance of activation functions)

  • 류서현;윤재복
    • 한국산학기술학회논문지
    • /
    • 제18권10호
    • /
    • pp.75-80
    • /
    • 2017
  • 본 논문에서는 딥러닝에서 활용되는 정규화(regularization) 및 항등사상(identity mapping)이 활성함수(activation function) 성능에 미치는 영향에 대해 설명한다. 딥러닝에서 활성함수는 비선형 변환을 위해 사용된다. 초기에는 sigmoid 함수가 사용되었으며, 기울기가 사라지는 기존의 활성함수의 문제점을 극복하기 위해 ReLU(Rectified Linear Unit), LReLU(Leaky ReLU), PReLU(Parametric ReLU), ELU(Exponetial Linear Unit)이 개발되었다. 활성함수와의 연구와는 별도로 과적합(Overfitting)문제를 해결하기 위해, Dropout, 배치 정규화(Batch normalization) 등의 정규화 방법들이 개발되었다. 추가적으로 과적합을 피하기 위해, 일반적으로 기계학습 분야에서 사용되는 data augmentation 기법이 활용된다. 딥러닝 구조의 측면에서는 기존에 단순히 컨볼루션(Convolution) 층을 쌓아올리는 구조에서 항등사상을 추가하여 순방향, 역방향의 신호흐름을 개선한 residual network가 개발되었다. 위에서 언급된 활성함수들은 각기 서로 다른 특성을 가지고 있으나, 새로운 정규화 및 딥러닝 구조 연구에서는 가장 많이 사용되는 ReLU에 대해서만 검증되었다. 따라서 본 논문에서는 정규화 및 항등사상에 따른 활성함수의 성능에 대해 실험적으로 분석하였다. 분석을 통해, 정규화 및 항등사상 유무에 따른 활성함수 성능의 경향을 제시하였으며, 이는 활성함수 선택을 위한 교차검증 횟수를 줄일 수 있을 것이다.

영상의 에지 특징정보를 이용한 주석기반 및 내용기반 영상 검색 시스템의 구현 (Implementation of Annotation-Based and Content-Based Image Retrieval System using)

  • 이태동;김민구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권5호
    • /
    • pp.510-521
    • /
    • 2001
  • 영상은 대용량적인 특성과 비정형적인 특성을 가지고 있으므로 신속하고 효율적으로 영상을 검색하기 위해 영상의 정확한 특징정보를 추출하여 검색 시스템을 구축하여야 한다. 영상 검색 시스템은 텍스트 기반의 전통 데이타베이스와는 다른 모델링 방법과 검색방법을 사용한다. 따라서, 영상 검색 시스템에서의 검색속도와 정확도를 향상시키기 위해서는 새로운 영상 데이타베이스 생성기법과 효율적인 검색 기법이 필요하다. 본 논문에서는 입력 영상으로부터 검색에 상용되는 에지 특징정보 추출을 위해 라플라시 안마스크와 입력 영상을 컨벌루션하여 에지의 외곽선 데이타를 추출하였으며, 그리고 추출한 에지 특징정보와 메타데이타로 영상 데이타베이스를 생성하여 신속하고 효율적으로 영상을 검색할 수 있도록 주석기반 및 내용기반 영상 검색 시스템을 구현하였다. 주석기반 및 내용기반 영상 검색 시스템은 영상의 하위 레벨에 표현된 내용기반 에지 특징정보와 특징정보 추출이 어려운 상위레벨에 표현된 주석기반 에지 특징 정보를 영상의 색인으로 구성하여 사용하기 때문에 영상 컨텐츠 검색의 성능을 향상시킬 수 있다. 마지막으로 본 논문에서 제시한 영상 검색 시스템은 메타데이타에 의해 영상 데이타베이스를 구축하므로 정확한 영상 컨텐츠 정보의 축적관리와 영상의 정보공유 및 재이용이 가능하다.

  • PDF

흉부 CT 영상에서 결절의 밝기값, 재질 및 형상 증강 영상 기반의 GGN-Net을 이용한 간유리음영 결절 자동 분류 (Automated Classification of Ground-glass Nodules using GGN-Net based on Intensity, Texture, and Shape-Enhanced Images in Chest CT Images)

  • 변소현;정주립;홍헬렌;송용섭;김형진;박창민
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제24권5호
    • /
    • pp.31-39
    • /
    • 2018
  • 본 논문에서는 흉부 CT 영상에서 결절의 밝기값, 재질 및 형상 증강 영상 기반의 GGN-Net을 이용해 간유리음영 결절 자동 분류 방법을 제안한다. 첫째, 입력 영상에 결절 내부의 고형 성분의 유무 및 크기 정보가 포함될 수 있도록 밝기값, 재질 및 형상 증강 영상의 활용을 제안한다. 둘째, 다양한 입력 영상을 여러 개의 컨볼루션 모듈을 통해 획득한 특징맵을 내부 네트워크에서 통합하여 훈련하는 GGN-Net를 제안한다. 제안 방법의 분류정확성 평가를 위해 순수 간유리음영 결절 90개와 고형 성분의 크기가 5mm 미만인 혼합 간유리음영 결절 38개, 5mm 이상 고형 성분의 크기를 가지는 혼합 간유리음영 결절 23개의 데이터를 사용하였으며, 입력 영상이 간유리음영 결절 분류 결과에 미치는 영향을 비교하기 위해 다양한 입력 영상을 구성하여 결과를 비교하였다. 실험 결과, 밝기값, 재질 및 형상 정보가 함께 고려된 입력 영상을 사용한 제안 방법이 정확도가 82.75%로 가장 좋은 결과를 보였다.

RGB-D 정보를 이용한 2차원 키포인트 탐지 기반 3차원 인간 자세 추정 방법 (A Method for 3D Human Pose Estimation based on 2D Keypoint Detection using RGB-D information)

  • 박서희;지명근;전준철
    • 인터넷정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.41-51
    • /
    • 2018
  • 최근 영상 감시 분야에서는 지능형 영상 감시 시스템에 딥 러닝 기반 학습 방법이 적용되어 범죄, 화재, 이상 현상과 같은 다양한 이벤트들을 강건하게 탐지 할 수 있게 되었다. 그러나 3차원 실세계를 2차원 영상으로 투영시키면서 발생하는 3차원 정보의 손실로 인하여 폐색 문제가 발생하기 때문에 올바르게 객체를 탐지하고, 자세를 추정하기 위해서는 폐색 문제를 고려하는 것이 필요하다. 따라서 본 연구에서는 기존 RGB 정보에 깊이 정보를 추가하여 객체 탐지 과정에서 나타나는 폐색 문제를 해결하여 움직이는 객체를 탐지하고, 탐지된 영역에서 컨볼루션 신경망을 이용하여 인간의 관절 부위인 14개의 키포인트의 위치를 예측한다. 그 다음 자세 추정 과정에서 발생하는 자가 폐색 문제를 해결하기 위하여 2차원 키포인트 예측 결과와 심층 신경망을 이용하여 자세 추정의 범위를 3차원 공간상으로 확장함으로써 3차원 인간 자세 추정 방법을 설명한다. 향후, 본 연구의 2차원 및 3차원 자세 추정 결과는 인간 행위 인식을 위한 용이한 데이터로 사용되어 산업 기술 발달에 기여 할 수 있다.

가변 길이 입력 발성에서의 화자 인증 성능 향상을 위한 통합된 수용 영역 다양화 기법 (Integrated receptive field diversification method for improving speaker verification performance for variable-length utterances)

  • 신현서;김주호;허정우;심혜진;유하진
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.319-325
    • /
    • 2022
  • 화자 인증 시스템에서 입력 발성 길이의 변화는 성능을 하락시킬 수 있는 대표적인 요인이다. 이러한 문제점을 개선하기 위해, 몇몇 연구에서는 시스템 내부의 특징 가공 과정을 여러가지 서로 다른 경로에서 수행하거나 서로 다른 수용 영역(Receptive Field)을 가진 합성곱 계층을 활용하여 다양한 화자 특징을 추출하였다. 이러한 연구에 착안하여, 본 연구에서는 가변 길이 입력 발성을 처리하기 위해 보다 다양한 수용 영역에서 화자 정보를 추출하고 이를 선택적으로 통합하는 통합된 수용 영역 다양화 기법을 제안한다. 제안한 통합 기법은 입력된 특징을 여러가지 서로 다른 경로에서 다른 수용 영역을 가진 합성곱 계층으로 가공하며, 가공된 특징을 입력 발성의 길이에 따라 동적으로 통합하여 화자 특징을 추출한다. 본 연구의 심층신경망은 VoxCeleb2 데이터세트로 학습되었으며, 가변 길이 입력 발성에 대한 성능을 확인하기 위해 VoxCeleb1 평가 데이터 세트를 1 s, 2 s, 5 s 길이로 자른 발성과 전체 길이 발성에 대해 각각 평가를 수행하였다. 실험 결과, 통합된 수용 영역 다양화 기법이 베이스라인 대비 동일 오류율을 평균적으로 19.7 % 감소시켜, 제안한 기법이 가변 길이 입력 발성에 의한 성능 저하를 개선할 수 있음을 확인하였다.

3차원 객체 탐지를 위한 어텐션 기반 특징 융합 네트워크 (Attention based Feature-Fusion Network for 3D Object Detection)

  • 유상현;강대열;황승준;박성준;백중환
    • 한국항행학회논문지
    • /
    • 제27권2호
    • /
    • pp.190-196
    • /
    • 2023
  • 최근 들어, 라이다 기술의 발전에 따라 정확한 거리 측정이 가능해지면서 라이다 기반의 3차원 객체 탐지 네트워크에 대한 관심이 증가하고 있다. 기존의 네트워크는 복셀화 및 다운샘플링 과정에서 공간적인 정보 손실이 발생해 부정확한 위치 추정 결과를 발생시킨다. 본 연구에서는 고수준 특징과 높은 위치 정확도를 동시에 획득하기 위해 어텐션 기반 융합 방식과 카메라-라이다 융합 시스템을 제안한다. 먼저, 그리드 기반의 3차원 객체 탐지 네트워크인 Voxel-RCNN 구조에 어텐션 방식을 도입함으로써, 다중 스케일의 희소 3차원 합성곱 특징을 효과적으로 융합하여 3차원 객체 탐지의 성능을 높인다. 다음으로, 거짓 양성을 제거하기 위해 3차원 객체 탐지 네트워크의 탐지 결과와 이미지상의 2차원 객체 탐지 결과를 결합하는 카메라-라이다 융합 시스템을 제안한다. 제안 알고리즘의 성능평가를 위해 자율주행 분야의 KITTI 데이터 세트를 이용하여 기존 알고리즘과의 비교 실험을 수행한다. 결과적으로, 차량 클래스에 대해 BEV 상의 2차원 객체 탐지와 3차원 객체 탐지 부분에서 성능 향상을 보였으며 특히 Voxel-RCNN보다 차량 Moderate 클래스에 대하여 정확도가 약 0.47% 향상되었다.

뇌종양 환자의 양성자 치료 시 Range Compensator의 Smooth Thickness 적용에 따른 선량비교 (Dose comparison according to Smooth Thickness application of Range compensator during proton therapy for brain tumor patient)

  • 김태완;김대웅;김재원;정경식
    • 대한방사선치료학회지
    • /
    • 제28권2호
    • /
    • pp.139-148
    • /
    • 2016
  • 목 적 : 양성자 치료 시 사용되는 Range Compensator는 Target의 Distal Margin의 선량에 대해 정상조직에 전달되는 양성자 빔 선량을 보정하는 역할을 한다. 이에 뇌종양 치료에 사용되는 Range Compensator의 Smooth Thickness를 다르게 적용함에 따른 PTV와 OAR의 선량을 비교하여 대상 부위의 선량이 개선되는 것을 확인해 보고자 한다. 대상 및 방법 : 본원에서 양성자 치료를 받은 뇌종양 환자 10명을 대상으로 Eclipse Proton Planning System(Version 10.0, Varian, USA)의 Compensator Editor를 사용하여 Range Compensator에 적용되는 Smooth Thickness를 각각 1회에서 5회까지 순차적으로 적용하였다. 치료계획의 알고리즘은 Proton Convolution Superposition(version 8.1.20 or 10.0.28)을 사용하였고, Smooth Thickness를 단계적으로 적용함에 따른 PTV의 Dmax, Dmin, Homogeneity Index, Conformity Index 그리고 종양주위의 OAR 선량을 비교하였다. 결 과 : Smooth Thickness를 1회에서 5회까지 적용하였을 때 PTV의 최대선량(Dmax)은 최대 4.3%, 최소 0.8%, 평균 1.81% 감소하였으며, 최소선량(Dmin)은 최대 1.8%, 최소 0.2%, 평균 0.82% 증가하였고, 최대선량과 최소선량의 차이는 최대 5.9%, 최소 1.4%, 평균 2.63% 감소하였다. Homogeneity Index는 평균 0.018 감소하였고 Conformity Index는 거의 변화가 없었다. OAR 선량은 Brain Stem에서 최대 1.6%, 최소 0.1%, 평균 0.59% 감소하였으며, Optic Chiasm에서 최대 1.3%, 최소 0.3%, 평균 0.45% 감소하였으나, C와 E환자가 각각 0.3%, 0.6% 증가하였다. 그리고 Rt. Optic Nerve에서 최대 1.5%, 최소 0.3%, 평균 0.8% 감소하였으나, B환자가 0.1% 증가하였다. Lt. Optic Nerve에서는 최대 1.8%, 최소 0.3%, 평균 0.67% 감소하였으나, H환자가 0.4% 증가하였다. 결 론 : 뇌종양 환자의 양성자 치료에 사용되는 Range Compensator의 Smooth Thickness가 단계적으로 적용될수록 Compensator의 해상도가 증가하여 가장 최적화된 양성자 빔 선량을 전달할 수 있다. 이는 PTV에 좀 더 균일한 선량을 조사할 수 있고 또한 OAR에 작용하는 불필요한 선량을 감소시켜 부작용을 줄일 수 있을 것으로 사료된다.

  • PDF

Analytical Anisotropic Algorithm을 사용한 폐암 치료 시 MU 검증 프로그램 적용에 관한 고찰 (Examinations on Applications of Manual Calculation Programs on Lung Cancer Radiation Therapy Using Analytical Anisotropic Algorithm)

  • 김종민;김대섭;홍동기;백금문;곽정원
    • 대한방사선치료학회지
    • /
    • 제24권1호
    • /
    • pp.23-30
    • /
    • 2012
  • 목 적: Analytical Anisotropic Algorithm (AAA)을 사용하여 계산된 폐 부위 방사선치료계획은 Pencil Beam Convolution (PBC) Algorithm 기반의 MU 검증 프로그램을 이용하였을 때 MU의 오차가 발생하여 MU 검증 프로그램 사용에 어려움이 있다. 본원에서는 AAA를 사용하여 계산된 치료계획을 검증할 방법에 대하여 연구하였다. 대상 및 방법: Eclipse treatment planning system (Version 8.9, Varian, USA)을 사용하여 폐 부위 정위적체부방사선치료(Stereotactic Body Radiation Therapy, SBRT) 7건에서의 총 57개 조사야(Field) 각각에 대하여 선량계산 알고리즘으로 PBC와 AAA를 사용하여 계산하였다. 수립된 치료계획의 MU를 자체 개발하여 사용 중인 MU 검증 프로그램의 MU와 비교 분석하였다. PBC 알고리즘과 AAA에서 발생한 오차에 영향을 미칠 수 있는 조사야크기(Field size), 방사선이 폐 조직을 통과한 거리, 방사선이 종양 조직을 통과한 거리, 유효깊이(Effective depth) 등 4가지 변수에 대하여 오차와의 상관관계를 상용 프로그램을 이용하여 분석하였다. 결 과: PBC 알고리즘의 오차는 $0.2{\pm}1.0%$로 나타났으며 AAA의 오차는 $3.5{\pm}2.8%$로 나타났다. 또한, 오차에 영향을 미칠 수 있는 4가지 변수에 대해 분석한 결과, 방사선이 폐 조직을 통과한 거리와 MU의 오차와의 관계에서 상관계수 0.648 (P=0.000)로 유의하게 증가하였고, ${\Delta}_{AAA}$=L.P 0.00903+0.02048이라는 MU 보정인자를 산출해 낼 수 있었으며 MU 보정인자를 MU 검증 프로그램에 적용한 결과, 적용 전 $3.5{\pm}2.8%$의 오차는 $0.4{\pm}2.0%$ 이내로 줄어들었다. 결 론: 본 연구에서는 방사선이 폐 조직을 통과한 거리가 커질수록 MU 검증 프로그램과의 오차가 커짐을 알아냈으며, MU보정인자라는 간단한 방법을 통해 AAA 알고리즘의 MU를 검증할 수 있게 되었다.

  • PDF

연(鉛)필터의 투과선량을 이용한 15 MV X선의 에너지스펙트럼 결정과 조직선량 비교 (Compare the Clinical Tissue Dose Distributions to the Derived from the Energy Spectrum of 15 MV X Rays Linear Accelerator by Using the Transmitted Dose of Lead Filter)

  • 최태진;김진희;김옥배
    • 한국의학물리학회지:의학물리
    • /
    • 제19권1호
    • /
    • pp.80-88
    • /
    • 2008
  • 최근의 방사선 치료선량 계획시스템은 대체로 커널빔을 컨볼루션하여 조직선량을 구하고 있다. 본 연구에서는 광자선 빔에 따른 심부선량과 임의의 깊이에서 프로파일 선량을 구하기 위하여 반복적 수치해석을 통해 투과 필터에 의한 감쇠선량으로부터 에너지 스펙트럼을 구성하였다. 실험은 15 MV X선(Oncor, Siemens사)과 이온선량계 0.125 cc (PTW T31010)을 이용하여 납필터를 투과한 선량을 측정하여 이루어졌다. 15 MV X선의 에너지스펙트럼은 0.25 MeV 간격으로 납필터 0.51 cm에서 8.04 cm의 감쇠선량으로 실측치와 비교하여 구하였다. 실험 연산에서 15 MV X선의 최대유량은 3.75 MeV에서 나타났으며, 평균에너지는 4.639 MeV를 보였으며, 투과선량은 평균 0.6%의 오차인 반면에 최대오차는 납두께 5 cm에서 2.5%를 보였다. 조직선량은 에너지에 크게 의존하므로, 평탄형 필터의 중심과 Tangent 0.075와 0.125인 가장자리의 에너지를 구하였으며, 각각 4.211 MeV와 3.906 MeV로 나타났다. 심부선량과 프로파일 선량은 상업화로 공급되고 있는 선량계획시스템에 중심 선속과 가장자리의 각 에너지스펙트럼을 적용하여 구하여 실측선량률과 비교하였다. 생성된 심부선량 곡선은 조사면 $6{\times}6cm^2$에서 $30{\times}30cm^2$까지 실측치와 비교한 결과 1% 이내의 거의 일치하는 값을 얻었으며, 프로파일 곡선은 $10{\times}10cm^2$에서 1% 이내의 오차를 보였으나, $30{\times}30cm^2$와 같이 큰 조사면의 얕은 깊이에서는 2%의 오차를 보였다. 따라서 투과선량을 연산으로 구한 에너지 스펙트럼이 조직선량을 평가하는 데 상당히 적은 오차범위 내에서 정량적이고 정성적으로 얻을 수 있음을 알 수 있다.

  • PDF

Deep Convolution Neural Networks 이용하여 결함 검출을 위한 결함이 있는 철도선로표면 디지털영상 재 생성 (Regeneration of a defective Railroad Surface for defect detection with Deep Convolution Neural Networks)

  • 김현호;한석민
    • 인터넷정보학회논문지
    • /
    • 제21권6호
    • /
    • pp.23-31
    • /
    • 2020
  • 본 연구는 철도표면상에 발생하는 노후 현상 중 하나인 결함 검출을 위해 학습데이터를 생성함으로써 결함 검출 모델에서 더 높은 점수를 얻기 위해 진행되었다. 철도표면에서 결함은 선로결속장치 및 선로와 차량의 마찰 등 다양한 원인에 의해 발생하고 선로 파손 등의 사고를 유발할 수 있기 때문에 결함에 대한 철도 유지관리가 필요 하다. 그래서 철도 유지관리의 자동화 및 비용절감을 위해 철도 표면 영상에 영상처리 또는 기계학습을 활용한 결함 검출 및 검사에 대한 다양한 연구가 진행되고 있다. 일반적으로 영상 처리 분석기법 및 기계학습 기술의 성능은 데이터의 수량과 품질에 의존한다. 그렇기 때문에 일부 연구는 일반적이고 다양한 철도표면영상의 데이터베이스를 확보하기위해 등간격으로 선로표면을 촬영하는 장치 또는 탑재된 차량이 필요로 하였다. 본연구는 이러한 기계적인 영상획득 장치의 운용비용을 감소시키고 보완하기 위해 대표적인 영상생성관련 딥러닝 모델인 생성적 적대적 네트워크의 기본 구성에서 여러 관련연구에서 제시된 방법을 응용, 결함이 있는 철도 표면 재생성모델을 구성하여, 전용 데이터베이스가 구축되지 않은 철도 표면 영상에 대해서도 결함 검출을 진행할 수 있도록 하였다. 구성한 모델은 상이한 철도 표면 텍스처들을 반영한 철도 표면 생성을 학습하고 여러 임의의 결함의 위치에 대한 Ground-Truth들을 만족하는 다양한 결함을 재 생성하도록 설계하였다. 재생성된 철도 표면의 영상들을 결함 검출 딥러닝 모델에 학습데이터로 사용한다. 재생성모델의 유효성을 검증하기 위해 철도표면데이터를 3가지의 하위집합으로 군집화 하여 하나의 집합세트를 원본 영상으로 정의하고, 다른 두개의 나머지 하위집합들의 몇가지의 선로표면영상을 텍스처 영상으로 사용하여 새로운 철도 표면 영상을 생성한다. 그리고 결함 검출 모델에서 학습데이터로 생성된 새로운 철도 표면 영상을 사용하였을 때와, 생성된 철도 표면 영상이 없는 원본 영상을 사용하였을 때를 나누어 검증한다. 앞서 분류했던 하위집합들 중에서 원본영상으로 사용된 집합세트를 제외한 두 개의 하위집합들은 각각의 환경에서 학습된 결함 검출 모델에서 검증하여 출력인 픽셀단위 분류지도 영상을 얻는다. 이 픽셀단위 분류지도영상들과 실제 결함의 위치에 대한 원본결함 지도(Ground-Truth)들의 IoU(Intersection over Union) 및 F1-score로 평가하여 성능을 계산하였다. 결과적으로 두개의 하위집합의 텍스처 영상을 이용한 재생성된 학습데이터를 학습한 결함 검출모델의 점수는 원본 영상만을 학습하였을 때의 점수보다 약 IoU 및 F1-score가 10~15% 증가하였다. 이는 전용 학습 데이터가 구축되지 않은 철도표면 영상에 대해서도 기존 데이터를 이용하여 결함 검출이 상당히 가능함을 증명하는 것이다.