• 제목/요약/키워드: Intensity-Based Image Processing

검색결과 186건 처리시간 0.027초

딥러닝에 의한 라이다 반사강도로부터 엄밀정사영상 생성 (True Orthoimage Generation from LiDAR Intensity Using Deep Learning)

  • 신영하;형성웅;이동천
    • 한국측량학회지
    • /
    • 제38권4호
    • /
    • pp.363-373
    • /
    • 2020
  • 정사영상 생성을 위한 많은 연구들이 진행되어 왔다. 기존의 방법은 정사영상을 제작할 경우, 폐색지역을 탐지하고 복원하기 위해 항공영상의 외부표정요소와 정밀 3D 객체 모델링 데이터가 필요하며, 일련의 복잡한 과정을 자동화하는 것은 어렵다. 본 논문에서는 기존의 방법에서 탈피하여 딥러닝(DL)을 이용하여 엄밀정사영상을 제작하는 새로운 방법을 제안하였다. 딥러닝은 여러 분야에서 더욱 급속하게 활용되고 있으며, 최근 생성적 적대 신경망(GAN)은 영상처리 및 컴퓨터비전 분야에서 많은 관심의 대상이다. GAN을 구성하는 생성망은 실제 영상과 유사한 결과가 생성되도록 학습을 수행하고, 판별망은 생성망의 결과가 실제 영상으로 판단될 때까지 반복적으로 수행한다. 본 논문에서 독일 사진측량, 원격탐사 및 공간정보학회(DGPF)가 구축하고 국제 사진측량 및 원격탐사학회(ISPRS)가 제공하는 데이터 셋 중에서 라이다 반사강도 데이터와 적외선 정사영상을 GAN기반의 Pix2Pix 모델 학습에 사용하여 엄밀정사영상을 생성하는 두 가지 방법을 제안하였다. 첫 번째 방법은 라이다 반사강도영상을 입력하고 고해상도의 정사영상을 목적영상으로 사용하여 학습하는 방식이고, 두 번째 방법에서도 입력영상은 첫 번째 방법과 같이 라이다 반사강도영상이지만 목적영상은 라이다 점군집 데이터에 칼라를 지정한 저해상도의 영상을 이용하여 재귀적으로 학습하여 점진적으로 화질을 개선하는 방법이다. 두 가지 방법으로 생성된 정사영상을 FID(Fréchet Inception Distance)를 이용하여 정량적 수치로 비교하면 큰 차이는 없었지만, 입력영상과 목적영상의 품질이 유사할수록, 학습 수행 시 epoch를 증가시키면 우수한 결과를 얻을 수 있었다. 본 논문은 딥러닝으로 엄밀정사영상 생성 가능성을 확인하기 위한 초기단계의 실험적 연구로서 향후 보완 및 개선할 사항을 파악할 수 있었다.

IPTV에서 컷 검색을 위한 색 분포정보를 이용한 FE-CBIRS (FE-CBIRS Using Color Distribution for Cut Retrieval in IPTV)

  • 구건서
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.91-97
    • /
    • 2009
  • 본 논문은 IPTV에서 방영되는 디지털 콘텐츠에서 검색하고자 하는 컷의 위치 정보를 검색하는데, 이때 색 분포에 관한 특징 정보를 이용한 FE-CBIRS을 제안한다. 기존 CBIRS에서는 색상과 모양에 대한 정보를 추출하여 이미지를 구분하는 특징정보로써 활용하며, 이미지를 세그멘테이션 처리하여 얻은 부분영역 특징정보를 전체 이미지의 특징정보와 함께 사용하여 검색하는 방법을 제시하였다. 또한 적용되는 색상 특징 정보의 경우 색상, 채도, 명도의 각각에 대한 평균, 표준편차, 왜도를 사용하며 부분영역을 특징정보로 적용하는 경우 대표색상만을 사용한다. 아울러 모양특징정보의 경우 추출된 부분영역들에 대한 불변 모멘트가 주요하게 사용된다. 이로 인한 처리시간의 문제, 정확성의 문제가 제기되어 왔다. 그러나 본 논문에서 제시하는 방법에서는 추출된 색상 특징정보들을 클래스별로 구분하여 인덱싱 하고 검색 시 비교대상 이미지를 해당 컷에 한정하여 적용하므로서 검색속도를 향상시키도록 하였다.

명시야 현미경 영상에서의 세포 분할을 위한 이중 사전 학습 기법 (Dual Dictionary Learning for Cell Segmentation in Bright-field Microscopy Images)

  • 이규현;트란민콴;정원기
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제22권3호
    • /
    • pp.21-29
    • /
    • 2016
  • 본 논문은 명시야 (bright-field) 현미경 영상를 위한 데이터 기반 세포 분할 알고리즘을 제시한다. 제시된 알고리즘은 일반적인 사전 학습 기법과 다르게 동시에 두 개의 사전과 관련된 희소 코드 (sparse code)를 통해 정의된 에너지 함수의 최소화를 진행하게 된다. 두 개의 사전 중 하나는 명시야 영상에 대해 학습된 사전이고 다른 하나는 사람에 의해 수작업으로 세포 분할된 영상에 대해 학습된 것이다. 학습된 두 개의 사전을 세포 분할 될 새로운 입력 영상에 대해 적용하여 이와 관련된 희소 코드를 획득한 후 픽셀 단위의 분할을 진행하게 된다. 효과적인 에너지 최소화를 위해 합성곱 희소 코드 (Convolutional Sparse Coding)와 Alternating Direction of Multiplier Method(ADMM)이 사용되었고 GPU를 사용하여 빠른 분산 연산이 가능하다. 본 연구는 이전에 사용된 가변형 모델 (deformable model)을 이용한 세포 분할 방식과는 다르게 제시된 알고리즘은 세포 분할을 위해 사전 지식이 필요없이 데이터 기반의 학습을 통해서 쉽고 효율적으로 세포 분할을 진행할 수 있다.

그래픽 하드웨어 가속을 이용한 실시간 색상 인식 (Real-time Color Recognition Based on Graphic Hardware Acceleration)

  • 김구진;윤지영;최유주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권1호
    • /
    • pp.1-12
    • /
    • 2008
  • 본 논문에서는 야외 및 실내에서 촬영된 차량 영상에 대해 실시간으로 차량 색상을 인식할 수 있는 GPU(Graphics Processing Unit) 기반의 알고리즘을 제시한다. 전처리 과정에서는 차량 색상의 표본 영상들로부터 특징벡터를 계산한 뒤, 이들을 색상 별로 조합하여 GPU에서 사용할 참조 텍스쳐(Reference texture)로 저장한다. 차량 영상이 입력되면, 특징벡터를 계산한 뒤 GPU로 전송하고, GPU에서는 참조 텍스쳐 내의 표본 특징리터들과 비교하여 색상 별 유사도를 측정한 뒤 CPU로 전송하여 해당 색상명을 인식한다. 분류의 대상이 되는 색상은 가장 흔히 발견되는 차량 색상들 중에서 선택한 7가지 색상이며, 검정색, 은색, 흰색과 같은 3가지의 무채색과 빨강색, 노랑색, 파랑색, 녹색과 같은 4가지의 유채색으로 구성된다. 차량 영상에 대한 특징벡터는 차량 영상에 대해 HSI(Hue-Saturation-Intensity) 색상모델을 적용하여 색조-채도 조합과 색조-명도 조합으로 색상 히스토램을 구성하고, 이 중의 채도 값에 가중치를 부여함으로써 구성한다. 본 논문에서 제시하는 알고리즘은 다양한 환경에서 촬영된 많은 수의 표본 특징벡터를 사용하고, 색상 별 특성을 뚜렷이 반영하는 특징벡터를 구성하였으며, 적합한 유사도 측정함수(likelihood function)를 적용함으로써, 94.67%에 이르는 색상 인식 성공률을 보였다. 또한, GPU를 이용함으로써 대량의 표본 특징벡터의 집합과 입력 영상에 대한 특징벡터 간의 유사도 측정 및 색상 인식과정을 병렬로 처리하였다. 실험에서는, 색상 별로 1,024장씩, 총 7,168장의 차량 표본 영상을 이용하여 GPU에서 사용하는 참조 텍스쳐를 구성하였다. 특징벡터의 구성에 소요되는 시간은 입력 영상의 크기에 따라 다르지만, 해상도 $150{\times}113$의 입력 영상에 대해 측정한 결과 평균 0.509ms가 소요된다. 계산된 특징벡터를 이용하여 색상 인식의 수행시간을 계산한 결과 평균 2.316ms의 시간이 소요되었고, 이는 같은 알고리즘을 CPU 상에서 수행한 결과에 비해 5.47배 빠른 속도이다. 본 연구에서는 차량만을 대상으로 하여 색상 인식을 실험하였으나, 일반적인 피사체의 색상 인식에 대해서도 제시된 알고리즘을 확장하여 적용할 수 있다.

원격 자동 검침을 위한 효과적인 계량기 숫자 분할 (An Efficient Numeric Character Segmentation of Metering Devices for Remote Automatic Meter Reading)

  • 보반 토안;정선태;조성원
    • 한국멀티미디어학회논문지
    • /
    • 제15권6호
    • /
    • pp.737-747
    • /
    • 2012
  • 최근 들어, 기존 계량기에서의 원격 자동 검침을 지원하기 위한 영상 기반 계량기 데이터 숫자 인식에 대한 관심이 증대되고 있다. 성공적인 숫자 인식을 달성하는 데 숫자 분할은 매우 중요한 과정이다. 본 논문에서는 다양한 조명하의 다양한 계량기들에 대해서 잘 수행되는 효과적인 계량기 숫자 분할 방법을 제안한다. 제안된 계량기 숫자 분할 방법은 먼저 계량기 전체 숫자 영역을 정교한 관심영역으로 검출하고, 이후 검출된 관심영역에서 각 숫자를 분할하는 2단계로 구성된다. 정교한 관심영역 검출은 조명 개선 전처리 후에 수평 라인 세그먼트를 이용한 개략적 관심영역 추출, 이진화후 수직 및 수평 투영을 이용한 클리핑을 통한 개략 관심영역 정교화 등의 과정으로 처리된다. 검출된 관심영역에서의 숫자 분할은 '숫자 구역 수직 분할' 및 '수직 분할된 각 숫자 구역에서의 숫자 분할' 등의 2개 과정을 통해 안정적으로 분할되도록 처리된다. 저대비, 저저도, 음영, 포화 등 다양한 조명 환경하의 다양한 계량기 종류에 대해 직접 촬영하여 자체 제작한 계량기 이미지 데이터베이스에 기반한 실험을 통해 본 논문에서 제안한 숫자 분할 방법을 평가하고, 제안방법이 다양한 조명 환경하의 다양한 계량기 타입에 대해서 계량기 숫자를 효과적으로 잘 분할함을 확인하였다.

산업용 CT 볼륨데이터에서 템플릿 매칭을 통한 이물질 자동 검출 (Automatic Detection of Foreign Body through Template Matching in Industrial CT Volume Data)

  • 지혜림;홍헬렌
    • 한국멀티미디어학회논문지
    • /
    • 제16권12호
    • /
    • pp.1376-1384
    • /
    • 2013
  • 본 논문에서는 산업용 CT 볼륨데이터에서 템플릿 매칭을 통하여 제품의 이물질을 자동 검출하는 기법을 제안한다. 제안방법은 다음과 같은 세 단계로 이루어진다. 첫째, 다운 샘플링 데이터에서 잡음제거 후 제품을 배경과 분리하고, 영상의 평균값 및 표준편차를 이용하여 초기 이물질 후보를 추출한 후, K-평균 클러스터링을 이용하여 이물질 후보를 추출한다. 둘째, 템플릿 매칭을 이용하여 제품과 유사도가 다른 이물질을 검출한다. 이 때, 검출하고자 하는 이물질의 크기에 따라 밝기값평균차이(SSD)와 조인트 엔트로피를 이용한 유사도 평가를 통하여 이물질을 검출한다. 셋째, 원 볼륨데이터에서 이물질 검출률을 개선하기 위하여 여과기법으로 제품의 이물질을 최종 검출한다. 본 제안 방법의 결과를 평가하기 위해 산업용 CT 볼륨데이터와 시뮬레이션 데이터를 사용하여 육안평가, 정확성 평가와 수행시간 측정을 수행하였다. 정확성 평가를 위하여 기존 밝기값 기반 검출 기법을 비교방법으로 사용하고, 다이스 계수 유사도를 측정하였다.

1/3-옥타브 대역통과필터를 이용한 음상정위기법 성능 향상 (Improving a Sound Localization Using 1/3-octave Band Pass Filter)

  • 황신;양진우;정완섭;김순협
    • 한국음향학회지
    • /
    • 제20권3호
    • /
    • pp.98-103
    • /
    • 2001
  • 인간의 청각기관은 소리의 방향과 거리인지에 있어서 여러 가지의 정보들을 복합적으로 이용한다. 이러한 양 귀에 들어오는 소리세기의 차이, 위상의 차이, 그리고 주파수 스펙트럼의 차이 등의 정보들을 종합적으로 포함하고 있는 것이 머리전달함수이다. 본 논문에서는 이 머리전달함수를 이용한 3차원 음상정위를 위해 사람의 청각기관에 알맞은 1/3-옥타브 대역통과필터를 이용한 알고리즘을 제안한다. 먼저 측정된 머리전달함수의 음색왜곡 및 음질저하를 최소화하기 위해 1/3-옥타브 대역통과필터를 이용해 간략화시켰으며, 간략화된 데이터베이스를 크기와 시간의 부분으로 나누어 모듈을 구성하였다. 이의 성능평가를 위해 객관평가와 주관평가를 실시하였으며, 실험결과 85.7%정도의 음상정위의 성능 개선을 가져왔다.

  • PDF

CNN 기반 스펙트로그램을 이용한 자유발화 음성감정인식 (Spontaneous Speech Emotion Recognition Based On Spectrogram With Convolutional Neural Network)

  • 손귀영;권순일
    • 정보처리학회 논문지
    • /
    • 제13권6호
    • /
    • pp.284-290
    • /
    • 2024
  • 음성감정인식(Speech Emotion Recognition, SER)은 사용자의 목소리에서 나타나는 떨림, 어조, 크기 등의 음성 패턴 분석을 통하여 감정 상태를 판단하는 기술이다. 하지만, 기존의 음성 감정인식 연구는 구현된 시나리오를 이용하여 제한된 환경 내에서 숙련된 연기자를 대상으로 기록된 음성인 구현발화를 중심의 연구로 그 결과 또한 높은 성능을 얻을 수 있지만, 이에 반해 자유발화 감정인식은 일상생활에서 통제되지 않는 환경에서 이루어지기 때문에 기존 구현발화보다 현저히 낮은 성능을 보여주고 있다. 본 논문에서는 일상적 자유발화 음성을 활용하여 감정인식을 진행하고, 그 성능을 향상하고자 한다. 성능평가를 위하여 AI Hub에서 제공되는 한국인 자유발화 대화 음성데이터를 사용하였으며, 딥러닝 학습을 위하여 1차원의 음성신호를 시간-주파수가 포함된 2차원의 스펙트로그램(Spectrogram)로 이미지 변환을 진행하였다. 생성된 이미지는 CNN기반 전이학습 신경망 모델인 VGG (Visual Geometry Group) 로 학습하였고, 그 결과 7개 감정(기쁨, 사랑스러움, 화남, 두려움, 슬픔, 중립, 놀람)에 대해서 성인 83.5%, 청소년 73.0%의 감정인식 성능을 확인하였다. 본 연구를 통하여, 기존의 구현발화기반 감정인식 성능과 비교하면, 낮은 성능이지만, 자유발화 감정표현에 대한 정량화할 수 있는 음성적 특징을 규정하기 어려움에도 불구하고, 일상생활에서 이루어진 대화를 기반으로 감정인식을 진행한 점에서 의의를 두고자 한다.

항로표지 보호를 위한 디지털 영상기반 해무 강도 측정 알고리즘 (Sea Fog Level Estimation based on Maritime Digital Image for Protection of Aids to Navigation)

  • 유은지;이효찬;조성윤;권기원;임태호
    • 인터넷정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.25-32
    • /
    • 2021
  • 미래 해상 환경 변화에 맞춰 해상 항로표지가 다양한 분야에 걸쳐 활용되며 쓰임이 증대되고 있다. 해상 항로표지는 항행하는 선박의 위치, 방향 및 장애물의 위치를 알려주는 항행보조시설로, 현재는 단순히 선박의 안전 항해를 도울 뿐 아니라, 여러 센서와 카메라를 탑재하여 해양 기상환경을 파악하고 기록하는 수단으로 변모하고 있다. 하지만 주로 선박과의 충돌로 인해 소실되며 특히 해무로 인한 관측 시야 저하로 안전사고가 발생한다. 해무 유입은 항만, 해상교통 등에 위험을 초래하고 시간과 지역에 따라 발생 가능성의 차이가 커 예측이 쉽지 않다. 또한, 전 해역에 분포되어있는 항로표지의 특성상 개별 관리가 어렵다. 이를 해결하고자 본 논문에서는 항로표지에 설치된 카메라에서 촬영한 영상으로 해무 강도를 측정하는 방안을 통하여 해양 기상환경을 파악해 보완하고 날씨로 인한 항로표지 안전사고를 해결하는 것을 목적으로 한다. 설치가 어렵고 높은 비용이 드는 광학 및 온도 센서 대신 항로표지에 설치된 카메라의 일반 영상을 사용하여 해무 강도를 측정한다. 덧붙여 다양한 해역에서의 실시간 해무 파악을 위한 선행 연구로, 안개 모델(Haze Model), Dark Channel Prior(DCP)를 이용해 해무 강도 측정 기준을 제시한다. DCP를 적용한 영상에서 특정 픽셀값의 문턱값(Threshold value)을 설정하고, 이를 기준으로 전체 영상에서 해무가 존재하지 않는 픽셀의 수를 통해 해무 강도를 추정한다. 합성 해무 데이터셋과 실제 해무 동영상을 캡처해 만든 실제 해무 데이터셋으로 해무 강도 측정 여부를 검증했다.

SWI의 신경영상분야의 임상적 이용 (Clinical Applications of Neuroimaging with Susceptibility Weighted Imaging: Review Article)

  • 노근탁;강현구;김인중
    • Investigative Magnetic Resonance Imaging
    • /
    • 제18권4호
    • /
    • pp.290-302
    • /
    • 2014
  • 목적: 자화율 강조 자기공명영상 (Susceptibility-weighted imaging)은 혈액분해산물, 석회화, 철 침착물을 발견하는데 있어 높은 민감도를 보이는 3D spoiled gradient-echo pulse sequence 이다. 본 임상화보는 자화율 강조 자기공명영상의 주된 임상적 적용에 대해 설명하고 논의하는 데에 그 목적이 있다. 대상과 방법: 자화율 강조 자기공명영상은 자기강도영상 (magnitude image)과 위상영상 (phase image)을 이용한 고해상도, 3D fully velocity-compensated gradient-echo sequence 에 기초를 두고 있다. 정맥 구조물의 가시성을 향상시키기 위해, 자기강도영상은 여과된 위상 데이터 (phase data) 로부터 발생된 위상 마스크 (phase mask)를 이용해 증폭되고, 이것은 최소강도투사 (Minimal intensive projection) 알고리즘을 이용한 3D dataset 후처리 과정을 거치게 된다. 3T 자기공명기기에서 SWI를 포함하는 자기공명영상 검사를 시행한 총 200명의 환자를 대상으로 연구하였다. 결과: 자화율 강조 자기공명영상은 다양한 뇌 질환의 발견에 매우 유용하였다. 200명의 환자 중 80명은 선천성 정맥 기형, 22명은 해면상 혈관종, 12명은 다양한 질환에서의 석회화, 21명은 혈관자화 징후 (susceptibility vessel sign) 또는 미세출혈을 동반하는 뇌혈관 질환, 52명은 뇌종양, 2명은 미만성 축삭 손상, 3명은 동정맥 기형, 5명은 뇌경막 동정맥루, 1명은 모야모야병, 그리고 2명은 파킨슨병이 관찰되었다. 결론: 자화율 강조 자기공명영상은 미세 저혈량 혈관성 병변, 석회화 그리고 미세출혈과 다양한 뇌병변의 진단에 유용하다.