• 제목/요약/키워드: 에지검출

검색결과 698건 처리시간 0.024초

시공간 영상을 이용한 계층적인 장면 전환 검출 (Hierarchical shot Boundary Detection Using Time-Space Image)

  • 홍기진;김영봉
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.496-498
    • /
    • 2000
  • 동영상 비디오 시퀸스에서 필요로 하는 장면을 빠르고 쉽게 찾을 수 있도록 해주는 내용 기반 검색에 대한 연구가 활발히 이루어져 오고 있다. 특히, 내용 기반 검색 시스템의 기초 기술인 비디오 데이터의 샷(shot)에 따른 분할 연구는 다양한 방법으로 소개되었으나 정확도가 높은 분할 알고리즘이 아직 개발되지 않고 있는 실정이다. 본 논문에서는 비압축 비디오에서 컷(cut) 검출의 효율성을 향상시키기 위해 기존의 히스토그램 비교법과 시공간 영상을 활용하는 계층적인(hierarchical) 방법을 제안한다. 이를 위해 먼저 동영상의 각 프레임에서 한 행(row)씩 추출하여 동영상 전체를 대표하도록 시공간 영상을 생성하고, 생성된 시공간 영상에서 수평 에지(edge)를 이용한 프레임(frame) 특징값으로 장면 전화의 후보 영역을 선택하였다. 그리고 선택된 후보 영역을 히스토그램 비교법으로 분석하게 된다.

  • PDF

옴니버스 형태의 동영상에서 태깅아이콘을 이용한 에피소스 분할 방법 (The Method of Episode Segmentation using Tagging-Icon on Video of Omnibus Type)

  • 주성일;최형일
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.117-119
    • /
    • 2010
  • 본 논문에서는 옴니버스 형태의 동영상을 각 프로그램 별로 자동 분할하는 방법에 대해 제안하고자 한다. 국내 TV 프로그램의 경우 대부분의 개그 프로그램에서는 코너 별로 상단 또는 하단의 일정 위치에 코너명을 캡션으로 삽입하여 옴니버스 형태의 영상을 서비스한다. 이러한 코너명을 태깅아이콘으로 하여 지속되는 구간을 검출하여 시작시점과 종료시점을 검출함으로써 동영상을 의미적으로 분할 할 수 있다. 하지만 태깅아이콘의 경우 매우 높은 투명도를 갖는 경우가 많으므로 본 연구에서는 에지와 시간적인 지속성을 이용하여 에피소드를 분할하는 방법을 제안하고, 옴니버스 형태의 다양한 개그 프로그램에 대해 실험하여 제안한 방법의 우수성을 보인다.

  • PDF

스테레오 영상을 이용한 물체 거리 측정 (The Object Distance Measurement using Stereo Image)

  • 장동영;오은택
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2007년도 하계종합학술대회 논문집
    • /
    • pp.351-352
    • /
    • 2007
  • 본 논문에서는 인간의 시각 특성 중 특정 물체의 거리를 지각하는 메커니즘을 실시간 처리를 위해 하드웨어로 구현하였다. 본 논문에서 구현된 시스템은 크게 스테레오 영상 입 출력부와 영상을 처리하기 위한 IP 부로 구성된다. 입 출력부는 ALTERA 사의 Excalibur을 기반으로 하여 Image Decoder, UART, SDRAM, SRAM, TFT-LCD등으로 구성된 Image Board로 스테레오 영상을 받아 처리할 수 있게 설계하였다. IP부분은 Image Decoder 내부 레지스터를 설정하기 위한 I2C 버스 IP, 두 개의 Image Decoder를 통해 들어오는 스테레오 영상 입력 IP, 에러 보정을 위한 미디언 필터링 IP부, 에지 검출 IP, 거리를 검출하기 위한 스테레오 정합을 IP와 결과 영상을 보여주기 위한 TFT-LCD IP를 구현하였다.

  • PDF

개선된 허프 변환을 이용한 기울어진 자동차 번호판의 정형화 기법 (Normalization Algorithm of Rotated Car Plate using Advanced Hough Transform)

  • 정호영;김하영;윤희주;차의영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.907-910
    • /
    • 2004
  • 본 논문에서는 자동차 번호판 인식의 성공률을 높이기 위해 자동차 번호판을 정형화하는 법을 제시한다. 번호판의 테두리 직선을 찾기 위해서 Hough 변환과 Mask 를 사용한 방법을 제시하고, 그 방법을 사용하여 다수의 기울어진 번호판 영상을 정확하게 정형화할 수 있었다. Hough 변환과 Mask 를 이용한 직선 검출 방법은 두꺼운 에지 성분이나 저해상도 영상의 경우에도 효과적으로 직선을 검출해냄을 알 수 있었다.

  • PDF

임펄스 잡음 제거를 위한 알파트림 평균 필터 (Alpha-trimmed Mean Filter for Impulse Noise Removal)

  • 김국승;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.393-396
    • /
    • 2010
  • 본 논문에서는 영상신호의 전송과정에서 임펄스 잡음에 의해 훼손된 영상의 복원을 위한 알파-트림 필터를 제안 하였다. 제안된 필터는 먼저 형태학상의 잡음 검출기를 이용하여 잡음화소를 확인하고 알파-트림 평균 필터를 이용하여 임펄스 노이즈를 제거 한다. 이 제안된 필터는 정확하게 잡음 검출을 할 수 있으며, 에지 영역의 보존 및 효과적으로 임펄스 잡음을 제거 할 수 있다. 그리고 시뮬레이션을 통해 기존의 방법들과 그 성능을 비교하였다.

  • PDF

적응적 탬플릿 마스킹과 패턴 벡터 기법을 이용한 일본 차량 번호판 인식 (Japanese License Plate Recognition Using Adaptive Template Masking and Pattern Vector Method)

  • 김미진;김국성;이응주
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.635-640
    • /
    • 2003
  • 본 논문에서는 일본 차량 번호판 인식에 적응적 탬플릿 마스킹 방법을 이용하여 번호판 문자, 숫자를 분할하고 패턴벡터기법을 이용하여 인식하는 방법을 제안하였다 주, 야간과 거리에 따른 일본 차량 번호판 영상을 입력받아 전처리 과정을 수행한 후 에지 정보와 명도값 변화의 빈도수를 이용하여 번호판 영역을 검출하였다 검출된 번호판 영역에서 각 문자 및 숫자의 위치정보와 적응적 탬플릿을 이용하여 분할하고 번호판의 지역문자를 무게중심 패턴으로 분류 한 다음 크기와 이동에 무관한 특실을 가지는 패턴 벡터를 적용하여 문자를 인식하였으며, 숫자는 Four Segment Pattern을 이용하여 인식하도록 하였다 본 논문에서 제안한 방법을 실제 일관 차량 번호판 인식에 적용한 결과 98.8% 추출율과 96.6%의 인식율을 나타내었다.

  • PDF

자율 주행을 위한 실시간 차선 인식 (Real-Time Road Lane Recognition for Autonomous Driving)

  • 황인찬;이봉환;이규원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.94-97
    • /
    • 2009
  • 본 논문에서는 실제 도로 환경에서의 실시간 차선 인식 방법을 제안한다. 전방주시카메라를 활용하여 촬영한 입력영상으로부터 도로영역에 해당하는 관심영역을 추출하고 반복적인 평균 명도를 측정하여 이진화함으로써 차선 특징을 검출하고 YCbCr 변환한 영상에 대한 실험 임계값을 적용하여 중앙선의 특징을 검출하였다. 이에 Canny 알고리즘을 이용한 에지 추출로 허프 변환시의 작업량을 최소화하였으며 허프 변환하여 얻은 차선 후보군으로부터 각도를 기반으로 필터링하여 통계적으로 우선순위가 높은 선분을 차선으로 인식하였다. 또한 실제 도로 환경에서 수집한 동영상으로 실험한 결과 강건한 차선 인식률을 보였다.

컴퓨터 비전 기반 UAV 영상의 도로표면 결함탐지 방안 (Detection Method for Road Pavement Defect of UAV Imagery Based on Computer Vision)

  • 주용진
    • 한국측량학회지
    • /
    • 제35권6호
    • /
    • pp.599-608
    • /
    • 2017
  • 아스팔트 도로표면의 균열은 자동차 속도, 연료 소비량, 도로주행 시 승차감, 도로표면의 내구성 등에 영향을 미친다. 이러한 도로의 균열은 장시간 방치 시 상당히 위험한 결과를 초래할 수 있다. 사람이 직접 균열을 찾아 내어 적절한 조치를 취하기에는 너무 많은 시간과 비용이 소모된다. 또한 고가의 레이저 장비 차량들을 활용하기에는 초기 비용과 장비 운용에 어려움을 가진다. 이에 본 연구에서는 UAV 영상을 이용해 컴퓨터 비전 기반의 관심영역(ROI: Region of Interest) 설정과 에지 검출 알고리즘을 적용하여 도로표면의 균열탐지 방안을 제시하였다. 본 연구 결과는 무인항공기를 활용한 효율적인 도로표면 결함탐지 및 유지보수 방안으로 제시될 수 있다. 또한 도로 이외 건물빌딩의 외벽, 대규모 저장 탱크 등 다양한 건축, 토목 구조물에 발생된 균열 탐지에 활용이 가능하며 비용저감 효과를 기대할 수 있을 것이다.

로그폴라 영상 표현을 위한 매개변수 방정식의 Hough 변환 (Parametric Equation of Hough Transform for Log-Polar Image Representation)

  • 최일;김동수;태성일
    • 대한전자공학회논문지SP
    • /
    • 제39권4호
    • /
    • pp.455-461
    • /
    • 2002
  • 본 논문에서는 로그폴라 (log-polar) 영상 평면에서의 Hough 변환을 위하여, 잘 알려진 unboundedness 문제를 해결하는 새로운 폴라 형태의 로그 직선 (log line) 매개변수 방정식을 제안한다. 직각 좌표상의 영상으로부터 로그폴라 영상을 생성하기 위하여, 황반부와 주변 영역으로 분리되는 Bolduc의 방법을 이용한다. 그리고 Hough 변환의 입력으로 이용되는 로그폴라 에지 영상은 Sobel 연산자로부터 추출되는 황반부 에지 영상과 본 논문에서 제안하는 공간변형 가중치가 고려된 새로운 그래디언트 연산자가 적용되어 추출되는 주변 영역을 결합하여 생성한다. 그런데 LPM (log-polar mapping; LPM)의 고유한 특성인 비선형 표본화로 인하여 시선고착점으로부터 멀리 떨어진 주변 영역에 포함되는 로그 직선들을 구성하는 화소들은 매우 산재되어 분포된다. 이러한 로그 직선들을 효과적으로 검출하기 위하여 Hough 누적 셀의 값이 공간변형 가중치가 고려되어 계산되도록 한다. 본 논문에서 제안하는 방법이 황반부와 주변 영역을 동시에 지나는 직선들뿐만 아니라 시선고착점으로부터 멀리 떨어진 주변 영역에 존재하는 직선들도 검출될 수 있음을 실험을 통하여 확인한다.

ATM 보안 시스템을 위한 모델 인증 알고리즘 (Model Verification Algorithm for ATM Security System)

  • 정헌;임춘환;편석범
    • 대한전자공학회논문지TE
    • /
    • 제37권3호
    • /
    • pp.72-78
    • /
    • 2000
  • 본 연구에서는 ATM 보안 시스템을 위한 DCT와 신경망 기반 모델 인증 알고리즘을 제안한다. CCD 카메라를 이용하여 일정한 조도와 거리에서 30명의 얼굴영상을 획득한 후 데이터 베이스를 구성한다. 모델 인증 실험을 위해 동일인에 대해 학습영상 4장 그리고 실험 영상 4장을 각각 획득한다. 얼굴영상의 에지를 검출한 후 에지 분포에 의해 얼굴영상에서 사각형태로 특징영역을 검출한다. 특징영역에는 눈썹, 눈, 코, 입, 그리고 뺨이 포함된다. 특징영역에 대해 DCT를 수행한 후 대각방향의 계수 합을 구해 특징벡터를 추출한다. 특징벡터는 정규화되어 신경망의 입력 벡터가 된다. 패스워드를 고려하지 않는 경우, 데이터 베이스를 검색한 결과 학습된 얼굴영상에 대해서는 100%의 인증율을 나타내었고 학습되지 않는 얼굴영상의 경우에는92%의 인증률을 나타내었다. 그러나 패스워드를 고려한 경우 모두 100%의 인증율을 보였다.

  • PDF