• 제목/요약/키워드: 분할 마스크

검색결과 133건 처리시간 0.022초

음성 분리를 위한 스펙트로그램의 마루와 골을 이용한 시간-주파수 공간에서 소리 분할 기법 (A Method of Sound Segmentation in Time-Frequency Domain Using Peaks and Valleys in Spectrogram for Speech Separation)

  • 임성길;이현수
    • 한국음향학회지
    • /
    • 제27권8호
    • /
    • pp.418-426
    • /
    • 2008
  • 본 논문에서는 스펙트로그램에서 마루와 골을 이용한 주파수 채널 분할 알고리즘을 제안한다. 주파수 채널 분할 문제는 동일한 음원으로부터 발생한 음성이 포함된 주파수 채널들을 하나의 그룹으로 묶는 것을 의미한다. 제안된 알고리즘은 입력 신호의 평탄화된 스펙트럼에 기반한 알고리즘이다. 평탄화된 스펙트럼에서 마루와 골은 각각 세그먼트의 중심과 경계를 판단하기 위해 사용된다. 각 세그먼트를 하나의 소리로 묶는 그룹핑 단계 이전에 제안된 알고리즘에 의한 세그멘테이션 결과가 유용함을 평가하기 위하여 이상적인 마스크에 의한 세그멘테이션 결과와 제안된 방법을 비교한다. 제안된 방법을 협대역 잡음, 광대역 잡음, 다른 음성신호와 혼합된 음성신호에 대하여 실험하였다.

영상구도에 근거한 영상내의 주요객체 자동추출 기법 (Automatic Extraction of Major Object in the Image based on Image Composition)

  • 강선도;유헌우;신영근;장동식
    • 한국콘텐츠학회논문지
    • /
    • 제8권3호
    • /
    • pp.8-17
    • /
    • 2008
  • 본 논문에서는 새로운 주요객체 자동추출 알고리즘을 제안한다. 제안된 알고리즘은 크게 2단계 과정으로 요약될 수 있다. 1단계로 객체와 배경을 분리하는 영상분할 작업을 수행한다. 우선적으로 '인간은 3또는 4개의 주요 색상으로 축약하여 사물을 인식한다'는 연구 결과에 따라 K-means 알고리즘을 이용하여 3구역으로 분할하고, 분할된 영상 간 히스토그램 유사도를 계산하여 임계값 이상으로 유사하면 병합하는 과정을 수행한다. 2단계로 영상구도에 근거해 분할된 영상 중에 객체라고 지정하는 작업을 수행한다. 사람이 사진을 잘 찍기 위해서는 '주요객체의 위치를 영상구도에 맞추어 촬영하는 것이 바람직하다는 사실'에 근거하여 삼각구도를 바탕으로 가중치 마스크를 설계하여 객체위치를 역 추정하였다. 제안된 방법의 우수성을 보이기 위해 약 400개의 영상에 대해 실험하였으며, 최근에 발표된 KMCC, GBIS방법과도 비교하였다.

Improved STGAN for Facial Attribute Editing by Utilizing Mask Information

  • Yang, Hyeon Seok;Han, Jeong Hoon;Moon, Young Shik
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권5호
    • /
    • pp.1-9
    • /
    • 2020
  • 본 논문에서는 머리카락과 모자 영역의 마스크 정보를 활용하여 더 자연스러운 얼굴 속성 편집(facial attribute editing)을 수행하는 모델을 제안한다. 최신 얼굴 속성 편집 연구인 STGAN은 다중 얼굴 속성을 자연스럽게 편집하는 성과를 보였다. 그러나 머리카락과 관련된 속성을 편집할 때 부자연스러운 결과를 생성할 수 있다. 제안하는 방법의 핵심 아이디어는 기존 모델에서 부족했던 얼굴 영역의 정보를 모델에 추가로 반영하는 것이다. 이를 위해 세 가지 아이디어를 적용한다. 첫째로 마스크를 통해 머리카락 면적 속성을 추가하여 머리카락 정보를 보완한다. 둘째로 순환 일관성 손실(cycle consistency loss)을 추가하여 영상의 불필요한 변화를 억제한다. 셋째로 모자 분할 신경망을 추가하여 모자 영역 왜곡을 방지한다. 정성적 평가를 통해 제안하는 방법 적용 여부에 따른 유효성을 평가 및 분석한다. 실험 결과에서 제안하는 방법이 머리카락 및 얼굴 영역을 더 자연스럽게 생성하고, 모자 영역의 왜곡을 성공적으로 방지했다.

이미지 정합을 이용한 COG 불량 검출 (The Faulty Detection of COG Using Image Subtraction)

  • 주기세
    • 해양환경안전학회:학술대회논문집
    • /
    • 해양환경안전학회 2005년도 추계학술대회지
    • /
    • pp.203-208
    • /
    • 2005
  • 수 마이크로 단위로 계측되는 반도체 COG의 정밀도를 높이기 위해서 라인스캔 카메라로 영상을 획득한다. 하지만 불량 검출은 스캔속도와 조명조건에 매우 민감하다. 본 논문에서는 불량이 없는 COG 영상과 입력영상을 정합하여 불량 검출의 정확성을 높이기 위한 방법에 대하여 제안하였다. 두 이미지를 정합시키는 방법으로 영역분할 템플릿 매칭 방법을 사용하였으며 그라디언트 마스크와 AND 연산하여 최종 결과 영상을 획득하였다. 제안된 방법은 다른 이미지 정합 법에 대하여 커다란 성능향상을 보임을 일련의 실험들을 통하여 보여준다.

  • PDF

Salt and Pepper 잡음 환경에서 잡음 분포를 이용한 확장 필터 (Extension Filter using Noise Distribution in Salt and Pepper Noise Environments)

  • 천봉원;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.429-431
    • /
    • 2019
  • 이미지 프로세싱에서 잡음은 영상의 품질에 직접적인 영향을 미치는 요소이며, 특히 영상 분할, 에지 검출, 영상 인식과 같은 알고리즘을 포함하는 시스템의 처리과정에 악영향을 미친다. 따라서 전처리 과정으로 잡음 제거가 중요한 역할을 하고 있으며, 이를 위해 다양한 기법들이 제시되었다. 본 논문에서는 Salt and Pepper 잡음의 밀도가 높은 환경에서 효율적으로 잡음을 제거하기 위한 알고리즘을 제안하였다. 제안한 알고리즘은 잡음의 밀도에 따라 필터링 마스크를 단계적인 확장하여 잡음을 제거하였으며, 밀도가 높은 영역에서도 우수한 잡음 제거 성능을 보였다. 제안한 알고리즘의 성능 평가를 위해 시뮬레이션을 통해 기존 방법과 제안한 알고리즘을 비교 분석하였다.

  • PDF

화상회의 영상에서 움직이는 화자의 분할 및 추적 알고리즘 (Segmentation and Tracking Algorithm for Moving Speaker in the Video Conference Image)

  • 최우영;김한메
    • 전기전자학회논문지
    • /
    • 제6권1호
    • /
    • pp.54-64
    • /
    • 2002
  • 본 논문에서는 화상회의 영상 데이터에서 화자를 분할하고, 그 움직임을 추적하는 알고리즘을 제안하였다. 실시간 처리가 가능하도록 화자 분할과 움직임 추적 순으로 처리되는 알고리즘으로 단순화하였다. 분할 한계에서는 차분 방법에 의해 구한 움직임 정보와 영상의 밝기 정보를 사용하여 화자를 분할하였다. 분할된 화자로부터 기준 마스크 영상을 생성하였다. 움직임 추적 단계에서는 움직임 추적에 불필요한 블록들은 제외함으로써 빠르게 움직임을 추적할 수 있는 블록정합 알고리즘을 사용하여 추적하였다. 시뮬레이션에서 여러 시험 영상에 제안한 알고리즘을 적용하여 움직이는 화자를 분할하고, 그 움직임를 추적하는 올바른 결과를 얻을 수 있었다.

  • PDF

거푸집 부재 인식을 위한 인공지능 이미지 분할 (Artificial Intelligence Image Segmentation for Extracting Construction Formwork Elements)

  • 아이샤 무니라 초드리;문성우
    • 한국BIM학회 논문집
    • /
    • 제12권1호
    • /
    • pp.1-9
    • /
    • 2022
  • Concrete formwork is a crucial component for any construction project. Artificial intelligence offers great potential to automate formwork design by offering various design options and under different criteria depending on the requirements. This study applied image segmentation in 2D formwork drawings to extract sheathing, strut and pipe support formwork elements. The proposed artificial intelligence model can recognize, classify, and extract formwork elements from 2D CAD drawing image and training and test results confirmed the model performed very well at formwork element recognition with average precision and recall better than 80%. Recognition systems for each formwork element can be implemented later to generate 3D BIM models.

반사 파장 선폭 확장을 위해 장력 조절기를 적용시킨 광섬유 브래그 격자(Fiber Bragg grating) 제작 기술 (Fabrication of Fiber Bragg gratings using a tension controller for broad wavelength linewidth)

  • 최보훈
    • 한국정보통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.350-356
    • /
    • 2012
  • 가우스 광분포를 가지는 KrF 엑시머 레이저 빔과 위상마스크를 이용하여 광섬유 브래그 격자를 제작하고 제작된 격자의 장력에 대한 특성 변화가 측정되었다. 3 nm 범위 내에서 브래그 파장은 1.24 nm/10kpsi 로 선형적으로 변화하였다. 외부 장력 인가 장치와 광섬유 제작 장치를 결합하여 하나의 위상 마스크로 4 개의 중심 파장이 다른 광섬유 격자를 제작한 뒤 이들을 이용하여 기존의 단일 광섬유 브래그 격자로 얻을 수 있는 파장 선폭보다 2배 증가된 1.5 nm 인 3 dB 대역폭을 갖는 광섬유 브래그 격자를 얻었다.

이미지 정합을 이용한 COG 불량 검출 (The Faulty Detection of COG Using Image Registration)

  • 주기세;정종면
    • 한국정보통신학회논문지
    • /
    • 제10권2호
    • /
    • pp.308-314
    • /
    • 2006
  • 수 마이크로 단위로 계측되는 반도체 COG의 검사 정밀도를 높이기 위해서 라인스캔 카메라가 이용된다. 여러 가지 불량 요인 중 이물질 검출은 COG 패턴이 미세하고 복잡하기 때문에 불량 자동 검사 단계에서 가장 어려운 기술이었다. 본 논문에서는 매칭 속도를 높이기 위하여 2단계 영역분할 템플릿 매칭 방법을 제안하였다. 아울러 수 마이크로 단위의 이물짙 검출을 위하여 그라디언트 마스크와 AND 연산을 이용한 새로운 방법을 제안하였다. 제안된 2단계 템플릿 매칭을 사용한 방법은 기존의 상관 계수 이용법 에 비해 0.3-0.4초 매칭 속도를 향상시켰다. 그리고 제안된 마스크 적용 이물질 검출방법은 기존 마스크를 이용하지 않은 방법에 비해 불량 검출률을 $5-8\%$ 향상시켰다.

퍼지 클러스터링을 이용한 다중 스펙트럼 자기공명영상의 분할 (Segmentation of Multispectral MRI Using Fuzzy Clustering)

  • 윤옥경;김현순;곽동민;김범수;김동휘;변우목;박길흠
    • 대한의용생체공학회:의공학회지
    • /
    • 제21권4호
    • /
    • pp.333-338
    • /
    • 2000
  • 본 논문에서는 T1 강조영상, T2 강조 영상 그리고 PD의 영상의 특징을 상호 보완적으로 이용한 자동적인 영상 분할법을 제안한다. 제안한 분할 알고리듬은 3단계로 이루어지는데, 첫 단계에서는 PD 영상으로부터 대뇌 마스크를 획득한 후, T1과 T2, PD의 입력 영상에 대뇌 마스크를 씌워 각각의 대뇌 영상을 추출하고, 둘째 단계에서는 대뇌 내부 조직에 해당하는 두드러진 클러스터(outstanding cluster)를 3차원 클러스터들 중에서 선택한다. 3차원 클러스터는 최적스케일 영상(optimal scale image)으로 이루어지는 3차원 공간상에서 화소가 밀집된 봉우리들을 교집합해서 생성되는 클러스터로 결정한다. 최적스케일 영상은 각 2타원 히스토그램에 스케일 스페이스 필터링을 적용시키고 그래프(graph) 구조를 검색하여 2차원 히스토그램의 모양을 가장 잘 나타내는 봉우리(peak) 영상을 최적 스케일 영상으로 선택한다. 마지막 단계에서는 앞에서 찾은 두드러진 클러스터의 중심값을 FCM 알고리듬의 초기중심 값으로 두고, FCM 알고리듬을 이용하여 대뇌 영상을 분할한다. 제안한 분할 알고리듬은 정확한 클러스터의 중심값을 계산함으로 초기 값을 영향을 많이 받는 FCM 알고리듬의 단점을 보완하였고 다중 스펙트럼 영상의 특성을 조합하여 분할에 이용함으로 단일 스펙트럼 영상만을 이용하는 방법보다 향상된 결과를 얻을 수 있었다.

  • PDF