• 제목/요약/키워드: 풀링기법

검색결과 23건 처리시간 0.146초

3D CNN 기반 전립선 MRI 영상 분할 기술 (3D CNN-Based Segmentation of Prostate MR images)

  • 문주혁;최환;이세호;장원동;김창수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.145-146
    • /
    • 2017
  • 본 논문에서는 남성의 하반신을 촬영한 MRI 영상으로부터 전립선을 분할하는 알고리즘을 제안한다. 우선 3 차원 입체 영상을 학습하기 위해 3D 컨볼루션 계층(convolutional layer) 및 3D 풀링 계층(pooling layer)에 기반한 네트워크를 제안한다. 다음으로 네트워크의 최후단에 해당하는 전연결 계층(fully connected layer)의 강인한 학습을 돕는 잡음 계층을 제안한다. 잡음 계층은 네트워크의 학습 파라미터 혹은 출력 영상에 가우시안 잡음를 더함으로써 드롭 아웃과 같이 훈련 영상에 대한 과적합(overfitting)을 막고 테스트 영상에 강인한 네트워크의 학습을 돕는다. 마지막으로 실험을 통해 제안하는 기법이 기존 기법에 비해 우수한 분할 성능을 보임을 확인한다.

  • PDF

부하분산 메타데이터 카탈로그 서비스의 성능 분석 (Performance Analysis of Load Balanced Metadata Catalog Service)

  • 안선일;이세훈;김남규;황순욱
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.555-559
    • /
    • 2007
  • 메타데이터 카탈로그 서비스는 그리드 상에 저장된 파일들에 대한 메타데이터에 대한 접근을 제공한다. 본 논문에서는 자주 사용되는 메타데이터 카탈로그 서비스 중의 하나인 AMGA의 성능을 분석하였다. DB에 대한 직접 접근에 비해 약 700%의 오버헤드가 있었으며, 이 중 가장 큰 오버헤드는 GSI/SSL을 처리하는 오버헤드로 약 350%를 차지하였다. 본 논문에서는 이 오버헤드를 줄일 수 있는 방법 중의 하나로 부하분산 기법을 제안하고, 이 기법의 성능을 측정하였다. LAN 환경의 경우 AMGA 서버의 증가에 따라 성능 향상이 가능함을 확인하였다. 그리드 상의 작업이 직접 AMGA에 접근하는 경우 데이터베이스에 직접 접근하는 것만큼의 성능 향상을 얻기 위해서는 AMGA 내부에 DB 연결 풀링 기법과 부하분산 기법을 활용하는 것이 필요함을 확인하였다.

  • PDF

콘볼류션 신경망을 이용한 손글씨 숫자 인식 구현 (Implementation of Handwriting Number Recognition using Convolutional Neural Network)

  • 박태주;송특섭
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.561-562
    • /
    • 2021
  • CNN(Convolutional Neural Network)은 다양한 이미지를 인식하는데 많이 사용되고 있다. 본 발표에서는 딥러닝의 CNN 기법을 적용해서 사람이 직접 손으로 쓴 한 자리 숫자를 인식하였다. 딥러닝 네트워크는 합성곱 레이어, 풀링 레이어, 플래튼 레이어로 구성하였고 마지막으로 최적화 방법, 학습률과 손실 함수를 설정하였다.

  • PDF

계산 속도와 왜곡 강인성을 동시 고려한 이미지 품질 평가 (Image Quality Assessment Considering both Computing Speed and Robustness to Distortions)

  • 김석원;홍성우;진정찬;김영진
    • 정보과학회 논문지
    • /
    • 제44권9호
    • /
    • pp.992-1004
    • /
    • 2017
  • 이미지 품질을 정확히 평가하기 위해 이미지 평가 도구는 인간 시각 시스템을 반영해야 한다. 즉, 이미지의 구조, 색, 명암 비 등 여러 가지 요소들을 고려하여 평가해야 한다. 또한 스마트 폰과 같은 모바일 임베디드 기기의 폭넓은 사용에 따라 빠른 수행 속도를 갖는 것이 중요하다. 본 논문에서는 인간 시각 만족과 빠른 계산속도 달성을 동시에 얻기 위하여 색 유사도, 변화율 유사도, 위상 유사도를 상승적으로 결합하였고 최적화된 이미지 풀링 및 양자화 기반으로 설계하였다. 제안하는 기법은 기존에 존재하는 13개의 기법과 비교하였고 네 가지 검증 도구를 사용하여 성능을 검증하였다. 실험 결과 세 검증 도구에서 가장 우수한 성능을 보였고 한 검증 도구에서 기존 최고 기법인 VSI에 이어 두 번째로 좋은 성능을 보였으며 실행 속도는 VSI에 대해 평균 약 20% 개선된 결과를 얻었다. 또한 기존의 기법들 보다 더 인간 시각 시스템과 제안 기법의 품질 평가 값의 연관성이 크게 존재함을 확인하였다.

초분광 이미지 픽셀 분류를 위한 풀링 연산과 PSNR을 이용한 최적 밴드 선택 기법 (Optimal Band Selection Techniques for Hyperspectral Image Pixel Classification using Pooling Operations & PSNR)

  • 장두혁;정병현;허준영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.141-147
    • /
    • 2021
  • 본 연구를 통해 임베디드 시스템(Embedded System)에서 뉴럴 네트워크(Neural Network) 인풋의 차원 감소 방식으로 복잡한 연산량을 줄여 초분광 대용량 데이터 특징 정보의 활용률을 개선하기 위해, 전체 밴드를 밴드별 최댓값과 최솟값 차이로 부분집합으로 군집화하여, 각 부분집합에서 밴드 선택 알고리즘을 적용한다. 특징 추출과 특징 선택 기법 중에, 특징 선택 기법을 통해, 파장 범위와 관계없이 데이터세트에 맞는 최적의 밴드 수와 기존 알고리즘 적용 소요 시간과 성능을 향상하고자 한다. 이 실험을 통해 기존 밴드 선택 기법보다 1/3~ 1/9배 소요 시간을 단축했음에도 불구하고 K-최근접 이웃 분류기를 통한 성능 면에서는 약 4% 이상 향상된 의미 있는 결과를 도출하였다. 실시간 초분광 데이터 분석 활용에는 어렵지만, 개선된 가능성을 확인했다.

컨볼루셔널 뉴럴 네트워크를 이용한 주인공 식별 기반의 영상장면 탐색 기법 (A scene search method based on principal character identification using convolutional neural network)

  • 권명규;양형식
    • 융합정보논문지
    • /
    • 제7권2호
    • /
    • pp.31-36
    • /
    • 2017
  • 본 논문은 대량의 영상에서 특정 출연자가 나오는 영상부분을 탐색하여 재생하고자 한다. TV영상 프로그램에서 주인공이나 특정 장면을 탐색 하려면 영상을 플레이하거나 코너를 설정하여 시청한다. 기존 방식은 장면 탐색이나 코너별 시청시 수동으로 offset값을 설정 하여야만 한다. 그러나 본 논문에서 제안하는 방식은 주인공 얼굴을 학습 시킨후 영상인식으로 주인공을 찾고 주인공이 등장하는 장면으로 이동하여 영상을 재생 하게 된다. 특정 출연자에 대한 데이터는 크롤링 기법을 활용하여 추출 및 수집한다. 수집된 데이터를 기반으로 컨볼루셔널 뉴럴 네트워크 알고리즘을 사용하여 학습하고 이를 이용하여 성능 평가를 진행한다. 성능 평가는 드라마를 재생하면서 추출된 키 프레임에서 학습 된 특정 출연자를 추출, 판단하는 방법으로 정확도를 측정한다. 학습된 장면을 얼마나 빨리 그리고 정확하게 탐색 하는지 성능 확인결과 약 93%의 정확도를 확보하였다. 도출된 성능을 기반으로 특정 장면만을 시청하는 코너별 시청, 인물 탐색 및 상세정보 retrieval 등 영상서비스에 응용 하고자 한다.

문화예술분야 전문인력에 대한 유리천장효과 분석: J산업과 R산업 중심으로 (Glass ceiling in arts and culture professionals: Between J and R industries)

  • 전종섭;허식
    • 문화경제연구
    • /
    • 제21권2호
    • /
    • pp.3-28
    • /
    • 2018
  • 본 연구의 목적은 RIF 무조건 분위회귀에 Oaxaca-Blinder 분해기법을 적용한 분위회귀임금분해를 통해 문화예술분야에 유리천장 현상이 존재하는지를 규명하는 것이다. 문화예술전문인력들이 종사하는 산업의 특성을 고려하여 "문화콘텐츠" 분야(대분류 J산업) 전문인력과"순수예술" 분야(대분류 R산업) 전문인력으로 구분하였고, 분석을 위해 "고용형태별 임금근로조사" 자료에서 2009년부터 2016년까지의 풀링자료를 이용하였다. 주요결과를 요약하면 다음과 같다. 첫째, OLS 임금분해 결과 순수예술 전문인력의 임금격차의 크기는 문화콘텐츠전문인력에 비해 낮게 나타났으나 이를 구성하는 차별부분의 비중은 오히려 더 크게 나타났다. 둘째, 분위회귀 임금분해 결과에서는 문화예술영역의 전문인력에 대한 유리천장효과가 서로 상이한 것으로 나타났다. 문화콘텐츠 전문인력에서는 중위부분 이후로 임금소득의 상위분위로 이동함에 따라 꾸준히 차별부분이 증가하는 지속적인 유리천장효과가 관찰되었고, 순수예술 전문인력에서는 70분위까지 감소하던 차별부분이 80분위와 90분위에서 급격히 상승하여 제한적인 유리천장효과가 고위영역에 집중되는 것이 관찰되었다.

GPGPU 기반 Convolutional Neural Network의 효율적인 스레드 할당 기법 (Efficient Thread Allocation Method of Convolutional Neural Network based on GPGPU)

  • 김민철;이광엽
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권10호
    • /
    • pp.935-943
    • /
    • 2017
  • 많은 양의 데이터 기반으로 학습하는 neural network 중 이미지 분류나 음성 인식 등에 사용되어 지고 있는 CNN(Convolution neural network)는 현재까지도 우수한 성능을 가진 구조로 계속적으로 발전되고 있다. 제한된 자원을 가진 임베디드 시스템에서 활용하기에는 많은 어려움이 있다. 그래서 미리 학습된 가중치를 사용하지만 여전히 한계점이 있기 때문에 이를 해결하기 위해 GPU의 범용 연산을 위해서 사용하는 GP-GPU(General-Purpose computing on Graphics Processing Units)를 활용하는 추세다. CNN은 단순하고 반복적인 연산을 수행하기 때문에 SIMT(Single Instruction Multiple Thread)기반의 GPGPU에서 스레드 할당과 활용 방법에 따라 연산 속도가 많이 달라진다. 스레드로 Convolution 연산과 Pooling 연산을 수행할 때 쉬어야 하는 스레드가 발생하는 데 이러한 문제를 해결하기 위해 남은 스레드가 다음 피쳐맵과 커널 계산에 활용되는 방법을 사용함으로써 연산 속도를 증가시켰다.

MDA/PSM상에서 퍼베이시브 서비스를 지원하는 닷넷 컴포넌트의 명세 및 생성 기법 (A Technique to Specify and Generate .NET Components in MDA/PSM for Pervasive Service)

  • 금득규;김수동
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권7호
    • /
    • pp.635-645
    • /
    • 2007
  • 컴포넌트 기술은 재사용 가능한 컴포넌트를 조합하여 효율적으로 소프트웨어 시스템을 개발하기 위한 기술로 정착되어 왔으며, 마이크로소프트의 닷넷은 최근의 대표적 컴포넌트 기술 중의 하나이다. 모델기반 아키텍처(Model Driven Architecture, MDA)는 설계 모델을 점진적으로 변환하여 소프트웨어를 자동으로 생성하는 새로운 개발 방식이다. MDA에서 구조적 모델 변환은 성공적으로 적용되었으나, 동적모델과 퍼베이시브 서비스(Pervasive Services) 특히, 트랜잭션 서비스, 보안 서비스, 동기화 서비스, 객체 풀링 둥과 같은 기능에 대한 모델 변환은 부족하다 엔터프라이즈 애플리케이션 시스템은 다 계층 분산 아키텍처를 가지며 이러한 아키텍처에서 퍼베이시브 서비스는 필수적이다 닷넷 플랫폼은 코드상에서 애트리뷰트(Attribute) 코드를 명시함으로써 이러한 퍼베이시브 서비스를 지원하는 Component Object Model+ (COM+) 컴포넌트를 구현한 수 있다. 본 논문에서는 엔터프라이즈 시스템 개발에서 필수적인 퍼베이시브 서비스의 기능과 닷넷 컴포넌트 생성을 위한 요소를 명세화하여, 이를 UML 프로파일로 정의한다. 또한, 정의된 프로파일을 이용하여 .NET/C#용 플랫폼 종속적 모델(PSM)을 명세한 후 도구를 이용하여 코드를 자동 생성하는 기법을 제안한다. 본 논문에서 정의된 UML 프로파일은 Meta Object Facility(MOF)를 준수한 UML 도구 및 MDA 도구에서 사용이 가능하다. 또한, 제안한 방법을 사용할 경우 퍼베이시브 서비스 기능을 지원하는 .NET 컴포넌트를 쉽게 자동 생성할 수 있으며 높은 개발 생산성, 확장성, 이식성 및 유지보수성을 증가시킬 수 있다.

특징 맵 중요도 기반 어텐션을 적용한 복소 스펙트럼 기반 음성 향상에 관한 연구 (A study on speech enhancement using complex-valued spectrum employing Feature map Dependent attention gate)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.544-551
    • /
    • 2023
  • 잡음 음성의 지각적 품질과 명료도 향상을 위해 활용되는 음성 향상은 크기 스펙트럼을 이용한 방법에서 크기와 위상을 같이 향상시킬 수 있는 복소 스펙트럼을 이용한 방법으로 연구되어왔다. 본 논문에서는 잡음 음성의 명료도와 품질을 더욱 향상시키기 위해 복소 스펙트럼 기반 음성 향상 시스템에 어텐션 기법을 적용하는 방안에 관해 연구를 수행하였다. 어텐션 기법은 additive attention을 기반으로 수행하며 복소 스펙트럼의 특성을 고려하여 어텐션 가중치를 계산할 수 있도록 하였다. 또한 특징 맵의 중요도를 고려하기 위해 전역 평균 풀링 연산을 같이 사용하였다. 복소 스펙트럼 기반 음성 향상은 Deep Complex U-Net(DCUNET) 모델을 기반으로 수행하였으며, additive attention은 Attention U-Net 모델에서 제안된 방법을 기반으로 연구를 수행하였다. 거실 환경의 잡음 데이터에 대해 음성 향상을 수행한 결과, 제안한 방법이 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short Time Objective Intelligibility(STOI) 평가 지표에서 기준 모델보다 개선된 성능을 보였으며, 낮은 Signal-to-Noise Ratio(SNR) 조건의 다양한 배경 잡음 환경에 대해서도 일관된 성능 향상을 보였다. 이를 통해 제안한 음성 향상 시스템이 효과적으로 잡음 음성의 명료도와 품질을 향상시킬 수 있음을 보여주었다.