• 제목/요약/키워드: object pooling

검색결과 25건 처리시간 0.02초

CT 영상에서 폐 결절 분할을 위한 경계 및 역 어텐션 기법 (Boundary and Reverse Attention Module for Lung Nodule Segmentation in CT Images)

  • 황경연;지예원;윤학영;이상준
    • 대한임베디드공학회논문지
    • /
    • 제17권5호
    • /
    • pp.265-272
    • /
    • 2022
  • As the risk of lung cancer has increased, early-stage detection and treatment of cancers have received a lot of attention. Among various medical imaging approaches, computer tomography (CT) has been widely utilized to examine the size and growth rate of lung nodules. However, the process of manual examination is a time-consuming task, and it causes physical and mental fatigue for medical professionals. Recently, many computer-aided diagnostic methods have been proposed to reduce the workload of medical professionals. In recent studies, encoder-decoder architectures have shown reliable performances in medical image segmentation, and it is adopted to predict lesion candidates. However, localizing nodules in lung CT images is a challenging problem due to the extremely small sizes and unstructured shapes of nodules. To solve these problems, we utilize atrous spatial pyramid pooling (ASPP) to minimize the loss of information for a general U-Net baseline model to extract rich representations from various receptive fields. Moreover, we propose mixed-up attention mechanism of reverse, boundary and convolutional block attention module (CBAM) to improve the accuracy of segmentation small scale of various shapes. The performance of the proposed model is compared with several previous attention mechanisms on the LIDC-IDRI dataset, and experimental results demonstrate that reverse, boundary, and CBAM (RB-CBAM) are effective in the segmentation of small nodules.

MDA/PSM상에서 퍼베이시브 서비스를 지원하는 닷넷 컴포넌트의 명세 및 생성 기법 (A Technique to Specify and Generate .NET Components in MDA/PSM for Pervasive Service)

  • 금득규;김수동
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권7호
    • /
    • pp.635-645
    • /
    • 2007
  • 컴포넌트 기술은 재사용 가능한 컴포넌트를 조합하여 효율적으로 소프트웨어 시스템을 개발하기 위한 기술로 정착되어 왔으며, 마이크로소프트의 닷넷은 최근의 대표적 컴포넌트 기술 중의 하나이다. 모델기반 아키텍처(Model Driven Architecture, MDA)는 설계 모델을 점진적으로 변환하여 소프트웨어를 자동으로 생성하는 새로운 개발 방식이다. MDA에서 구조적 모델 변환은 성공적으로 적용되었으나, 동적모델과 퍼베이시브 서비스(Pervasive Services) 특히, 트랜잭션 서비스, 보안 서비스, 동기화 서비스, 객체 풀링 둥과 같은 기능에 대한 모델 변환은 부족하다 엔터프라이즈 애플리케이션 시스템은 다 계층 분산 아키텍처를 가지며 이러한 아키텍처에서 퍼베이시브 서비스는 필수적이다 닷넷 플랫폼은 코드상에서 애트리뷰트(Attribute) 코드를 명시함으로써 이러한 퍼베이시브 서비스를 지원하는 Component Object Model+ (COM+) 컴포넌트를 구현한 수 있다. 본 논문에서는 엔터프라이즈 시스템 개발에서 필수적인 퍼베이시브 서비스의 기능과 닷넷 컴포넌트 생성을 위한 요소를 명세화하여, 이를 UML 프로파일로 정의한다. 또한, 정의된 프로파일을 이용하여 .NET/C#용 플랫폼 종속적 모델(PSM)을 명세한 후 도구를 이용하여 코드를 자동 생성하는 기법을 제안한다. 본 논문에서 정의된 UML 프로파일은 Meta Object Facility(MOF)를 준수한 UML 도구 및 MDA 도구에서 사용이 가능하다. 또한, 제안한 방법을 사용할 경우 퍼베이시브 서비스 기능을 지원하는 .NET 컴포넌트를 쉽게 자동 생성할 수 있으며 높은 개발 생산성, 확장성, 이식성 및 유지보수성을 증가시킬 수 있다.

딥러닝 알고리즘과 2D Lidar 센서를 이용한 이미지 분류 (Image Classification using Deep Learning Algorithm and 2D Lidar Sensor)

  • 이준호;장혁준
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1302-1308
    • /
    • 2019
  • 본 논문은 CNN (Convolutional Neural Network)와 2D Lidar 센서에서 획득한 위치 데이터를 이용하여 이미지를 분류하는 방법을 제시한다. Lidar 센서는 데이터 정확도, 형상 왜곡 및 광 변화에 대한 강인성 측면에서의 이점으로 인해 무인 장치에 널리 사용되어 왔다. CNN 알고리즘은 하나 이상의 컨볼루션 및 풀링 레이어로 구성되며 이미지 분류에 만족스러운 성능을 보여 왔다. 본 논문에서는 학습 방법에 따라 다른 유형의 CNN 아키텍처들인 Gradient Descent (GD) 및 Levenberg-arquardt (LM)를 구현하였다. LM 방법에는 학습 파라메터를 업데이트하는 요소 중 하나인 Hessian 행렬 근사 빈도에 따라 두 가지 유형이 있다. LM 알고리즘의 시뮬레이션 결과는 GD 알고리즘보다 이미지 데이터의 분류 성능이 우수하였다. 또한 Hessian 행렬 근사가 더 빈번한 LM 알고리즘은 다른 유형의 LM 알고리즘보다 작은 오류를 보여주었다.

무인점포 이상행동 인식을 위한 유전 알고리즘 기반 자세 추정 모델 최적화 (Optimization of Pose Estimation Model based on Genetic Algorithms for Anomaly Detection in Unmanned Stores)

  • 이상협;박장식
    • 한국산업융합학회 논문집
    • /
    • 제26권1호
    • /
    • pp.113-119
    • /
    • 2023
  • In this paper, we propose an optimization of a pose estimation deep learning model for recognition of abnormal behavior in unmanned stores using radio frequencies. The radio frequency use millimeter wave in the 30 GHz to 300 GHz band. Due to the short wavelength and strong straightness, it is a frequency with less grayness and less interference due to radio absorption on the object. A millimeter wave radar is used to solve the problem of personal information infringement that may occur in conventional CCTV image-based pose estimation. Deep learning-based pose estimation models generally use convolution neural networks. The convolution neural network is a combination of convolution layers and pooling layers of different types, and there are many cases of convolution filter size, number, and convolution operations, and more cases of combining components. Therefore, it is difficult to find the structure and components of the optimal posture estimation model for input data. Compared with conventional millimeter wave-based posture estimation studies, it is possible to explore the structure and components of the optimal posture estimation model for input data using genetic algorithms, and the performance of optimizing the proposed posture estimation model is excellent. Data are collected for actual unmanned stores, and point cloud data and three-dimensional keypoint information of Kinect Azure are collected using millimeter wave radar for collapse and property damage occurring in unmanned stores. As a result of the experiment, it was confirmed that the error was moored compared to the conventional posture estimation model.

특징 맵 중요도 기반 어텐션을 적용한 복소 스펙트럼 기반 음성 향상에 관한 연구 (A study on speech enhancement using complex-valued spectrum employing Feature map Dependent attention gate)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.544-551
    • /
    • 2023
  • 잡음 음성의 지각적 품질과 명료도 향상을 위해 활용되는 음성 향상은 크기 스펙트럼을 이용한 방법에서 크기와 위상을 같이 향상시킬 수 있는 복소 스펙트럼을 이용한 방법으로 연구되어왔다. 본 논문에서는 잡음 음성의 명료도와 품질을 더욱 향상시키기 위해 복소 스펙트럼 기반 음성 향상 시스템에 어텐션 기법을 적용하는 방안에 관해 연구를 수행하였다. 어텐션 기법은 additive attention을 기반으로 수행하며 복소 스펙트럼의 특성을 고려하여 어텐션 가중치를 계산할 수 있도록 하였다. 또한 특징 맵의 중요도를 고려하기 위해 전역 평균 풀링 연산을 같이 사용하였다. 복소 스펙트럼 기반 음성 향상은 Deep Complex U-Net(DCUNET) 모델을 기반으로 수행하였으며, additive attention은 Attention U-Net 모델에서 제안된 방법을 기반으로 연구를 수행하였다. 거실 환경의 잡음 데이터에 대해 음성 향상을 수행한 결과, 제안한 방법이 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short Time Objective Intelligibility(STOI) 평가 지표에서 기준 모델보다 개선된 성능을 보였으며, 낮은 Signal-to-Noise Ratio(SNR) 조건의 다양한 배경 잡음 환경에 대해서도 일관된 성능 향상을 보였다. 이를 통해 제안한 음성 향상 시스템이 효과적으로 잡음 음성의 명료도와 품질을 향상시킬 수 있음을 보여주었다.