• 제목/요약/키워드: Video Image Detection Technique

검색결과 95건 처리시간 0.028초

시간적 계층에서의 스케일러블 부호화 고속 모드 결정 방법 (Fast Coding Mode Decision for Temporal Scalability in H.264/AVC Scalable Extension)

  • 전병우
    • 한국정보전자통신기술학회논문지
    • /
    • 제6권2호
    • /
    • pp.71-75
    • /
    • 2013
  • 최근의 멀티미디어 서비스 환경은 다양한 전송 속도, 영상 크기나 화질을 지원하고 있다. 그러나 고정된 영상크기 또는 화질로의 부호화만이 가능한 기존의 비디오 부호화 기술은 새로운 멀티미디어 서비스 환경을 충족시키기가 어렵다. 따라서 새로운 환경적 요구를 충족시키기 위해 기존의 H.264/AVC 표준을 기반으로 다양한 영상크기와 화질을 지원할 수 있는 새로운 비디오 부호화 표준인 H.264/AVCSE(Scalable Extension)의 표준화가 진행되었다. H.264/AVC SE은 한번의 부호화된 스트림으로 다양한 크기나 화질을 가진 여러 개의 영상을 제공할 수 있다. 하지만 이를 위하여 기존의 H.264/AVC 표준에 비해 보다 복잡도가 요구되어 지기 때문에 이를 효과적으로 감소시킬 수 있는 추가적인 기술이 제공되어야한다. 본 논문에서는 H.264/AVC SE 표준이 가지는 복잡도 중 대부분을 차지하는 모드 결정법의 복잡도를 감소시키기 위해 이전과 이후 픽춰의 참조모드를 이용하는 early skip 알고리즘과 GOP내에 존재하는 모드들의 History를 이용하는 MHM(Mode History Map) 알고리즘을 이용한 고속모드 결정법을 제안한다.

서프 및 하프변환 기반 운전자 동공 검출기법 (Face and Iris Detection Algorithm based on SURF and circular Hough Transform)

  • 아텀 렌스키;이종수
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.175-182
    • /
    • 2010
  • 본 논문에서는 얼굴과 동공을 검색하는 새로운 기법을 제시하며, 안전운행을 위한 운전자의 동공 감시에 적용한 실험결과를 포함하고 있다. 제시된 기법은 세 단계 주요 과정을 거치는데, 먼저 스킨칼라 세그먼테이션 기법으로 얼굴을 찾는 과정으로 이는 지금까지 사용된 휴리스틱모델이 아닌 학습과정 모델에 기반을 두고 있다. 다음에 얼굴 특징 세그먼테이션으로 눈, 입, 눈썹 등의 부분을 검출 하는데, 이를 위해 얼굴 각 부분에서 추출한 고유 특징들에 대한 PDF 추정을 사용하고 있다. 마지막으로 서큘러 하프 변환기법으로 눈 안의 동공을 찾아낸다. 제시된 기법을 조명이 다른 웹 얼굴 영상과 운전자의 CCD 얼굴 영상에 적용하여 동공을 찾아내는 실험을 하여, 높은 동공 검출율을 확인하였다.

조기 화재인식을 위한 화염 및 연기 검출 (Flame and Smoke Detection for Early Fire Recognition)

  • 박장식;김현태;최수영;강창순
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.427-430
    • /
    • 2007
  • 본 논문에서는 화재에 의한 인적물적 피해를 최소화하기 위하여 조기에 화재를 영상처리 기법을 이용하여 검출하는 방법을 제안한다. 인공조명으로 부터 화염을 판별하기 위해 화염의 고유한 색정보를 이용하여 화염후보영역을 판별하고 화염후보영역이 아닌 경우는 배경과 현재 프레임의 밝기차이와 채도를 측정하여 연기후보영역을 판별한다. 그러나 단순한 밝기 및 색체 정보만으로 화염이나 연기로 판별할 경우 오인식할 경우가 많아 화염 및 연기 후보영역에 대해 움직임을 측정한다. 각 후보영역에 대해 전형적인 움직임이 검출되면 최종적으로 화염인 경우는 활동성 정보를 이용하여 화염으로 판별하고 연기인 경우는 경계검출법을 적용하여 최종 연기 영역을 검출한다. 제안하는 방법에 대해 실제 CCTV 카메라의 영상신호에 적용한 시뮬레이션을 통해 효과적으로 화염과 연기를 동시에 검출할 수 있음을 확인하였다.

  • PDF

MPEG 압축 영상에서의 고속 특징 요소 추출을 이용한 장면 전환 검출과 키 프레임 선택 (Scene Change Detection and Key Frame Selection Using Fast Feature Extraction in the MPEG-Compressed Domain)

  • 송병철;김명준;나종범
    • 방송공학회논문지
    • /
    • 제4권2호
    • /
    • pp.155-163
    • /
    • 1999
  • 본 논문은 새로운 장면 전환 검출과 키 프레임 선태 기법을 제안하였다. 이를 위해 본 논문에서는 MPEG 압축 동영상에서 직접 DC 영상 및 에지(edge) 영상을 추출하여 이용하는데, 공간 영역으로 변환 후 에지 연상을 추출할 경우 계산량이 많다는 문제점이 있다. 따라서 본 논문에서는 그 계산량을 줄이기 위해 DCT 블록 당 5개의 저 대역 AC 계수들만을 이용하여 축소된 에지 영상을 고속으로 추출하는 방법을 제안하고, 이를 바탕으로 AC 예측(prediction)을 이용한 고속 에지 추출 기법도 추가적으로 제안하였다. 화질 측면에서 전자가 후자보다 약간 우수하지만, 두 방법 모두 영상의 중요한 에지 특징들을 잘 추출할 수 있다. 이와 같이 얻어진 에지 영상 및DC 영상을 이용하여 에지 에너지 다이어그램(dege energy diagram)과 히스토그램(histogram)을 구하여 급진적인 장면 전환 및 페이드(fade), 디졸브(dissolve) 같은 점진적인 장면 전환을 정확하게 검출함을 모의 실험을 통해 확인하였다. 또한 공간 영역에서 구한 에지 영상들에 비해 제안한 방법들에 의한 에지 영상들이 점진적인 장면 검출에 있어 훨씬 적은 계산량으로 비슷한 성능을 보임을 확인하였다. 마지막으로 HVS(human visual system)에 기반하여 각 장면에서 키 프레임을 선택하는 방법도 제안하였다. 위에서 얻어진 에지 및 DC 영상을 이용하기 때문에 optical flow를 이용하는 기존 방법에 비해 적은 계산량으로 의미 있는 키 프레임을 선택할 수 있었다.

  • PDF

다중 구간 샘플링에 기반한 배경제거 알고리즘 (Background Subtraction Algorithm Based on Multiple Interval Pixel Sampling)

  • 이동은;최영규
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권1호
    • /
    • pp.27-34
    • /
    • 2013
  • 배경제거는 동영상의 내용을 자동으로 분석하기 위한 매우 중요한 기술의 하나로 움직이는 객체를 검출하고 추적하기 위한 핵심 기술이다. 본 논문에서는 배경 모델과 함께 배경 영상을 제공하는 새로운 샘플링 기반의 배경제거 알고리즘을 제안한다. 제안된 방법에서는 움직임이 빠른 객체와 느린 객체를 동시에 처리하기 위해 다중 구간 샘플링 기법을 이용하여 배경 모델을 생성한다. 이러한 다중 구간 배경 모델들로부터 최선의 배경 모델을 만들기 위해 "신뢰도"를 사용한 것이 본 논문의 특징이다. 배경 제거 분야에서 다양한 모델을 병합하여 하나의 모델을 만들기 위해 신뢰도를 정의하여 사용한 경우는 현재까지 보고되지 않았다. 실험을 통해 제안된 방법이 다양한 속도의 객체가 존재하고 시간에 따른 그림자의 이동과 같은 환경 변화가 있는 응용에서도 안정적인 결과를 나타내는 것을 알 수 있었다.

The Value of I-Scan Image-Enhanced Endoscopy in the Diagnosis of Vocal Cord Leukoplakia

  • Lee, Young Chan;Eun, Young-Gyu;Park, Il-Seok
    • 대한후두음성언어의학회지
    • /
    • 제29권2호
    • /
    • pp.98-102
    • /
    • 2018
  • Background and Objectives : Detection of vascular abnormalities in vocal cord (VC) leukoplakia is important for the diagnosis of neoplastic change of the mucosa. The aim of this study was to investigate the value of i-scan in the differential diagnosis of VC leukoplakia based on visualization of abnormal vascular features. Material and Methods : Fifty-two patients with leukoplakia were enrolled in the study. Images of their larynx obtained using conventional white light endoscopy and an i-scan-enhanced endoscopy (Pentax DEFINA EPK-3000 Video Processors, with Pentax VNLJ10) were reviewed. The microvascular features of the lesions and vascular changes were analyzed and the results were compared with the histopathologic diagnosis. Results : Among the 52 leukoplakia patients, 7 (13.5%) patients had squamous hyperplasia, 10 (19.3%) mild dysplasia, 2 (3.8%) moderate dysplasia, 14 (26.9%) severe dysplasia, 4 (7.7%) carcinoma in situ, and 15 (28.8%) invasive squamous cell carcinoma on histopathologic examination. Using i-scan-enhanced endoscopy, abnormal vascular change with neoplastic neoangiogenesis was detected in most cases of malignant VC lesion [severe dysplasia : 9/14 (64.3%), carcinoma in situ: 2/4 (50.0%), and invasive squamous cell carcinoma : 11/15 (73.4%)]. Conclusion : i-scan-enhanced endoscopy is a useful optical technique for the diagnosis of VC leukoplakia. Our results suggest that i-scan may be a promising diagnostic tool in the early detection of laryngeal cancer.

Automatic Person Identification using Multiple Cues

  • Swangpol, Danuwat;Chalidabhongse, Thanarat
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.1202-1205
    • /
    • 2005
  • This paper describes a method for vision-based person identification that can detect, track, and recognize person from video using multiple cues: height and dressing colors. The method does not require constrained target's pose or fully frontal face image to identify the person. First, the system, which is connected to a pan-tilt-zoom camera, detects target using motion detection and human cardboard model. The system keeps tracking the moving target while it is trying to identify whether it is a human and identify who it is among the registered persons in the database. To segment the moving target from the background scene, we employ a version of background subtraction technique and some spatial filtering. Once the target is segmented, we then align the target with the generic human cardboard model to verify whether the detected target is a human. If the target is identified as a human, the card board model is also used to segment the body parts to obtain some salient features such as head, torso, and legs. The whole body silhouette is also analyzed to obtain the target's shape information such as height and slimness. We then use these multiple cues (at present, we uses shirt color, trousers color, and body height) to recognize the target using a supervised self-organization process. We preliminary tested the system on a set of 5 subjects with multiple clothes. The recognition rate is 100% if the person is wearing the clothes that were learned before. In case a person wears new dresses the system fail to identify. This means height is not enough to classify persons. We plan to extend the work by adding more cues such as skin color, and face recognition by utilizing the zoom capability of the camera to obtain high resolution view of face; then, evaluate the system with more subjects.

  • PDF

구강 백반증 진단에 있어서 i-scan image-enhanced 내시경의 진단적 유용성 (The diagnostic value of i-scan image-enhanced endoscopy in the diagnosis of oral cavity leukoplakia)

  • 이영찬;은영규;박일석
    • 대한두경부종양학회지
    • /
    • 제34권2호
    • /
    • pp.29-34
    • /
    • 2018
  • Background/Objectives: The aim of this study was to investigate the diagnostic value of i-scan in the differential diagnosis of oral cavity leukoplakia based on visualization of abnormal vascular features. Materials & Methods: Thirty- one patients with oral cavity leukoplakia were enrolled in the study. Images of their oral cavity obtained using conventional white light endoscopy and an i-scan-enhanced endoscopy (Pentax DEFINA EPK-3000 Video Processors, with Pentax VNLJ10) were reviewed. The microvascular features of the lesions and vascular changes were analyzed and the results were compared with the histopathologic diagnosis. Results: Among the 31 oral cavity leukoplakia patients, 8 (25.8%) patients revealed hyperkeratosis, 10 (31.2%) low-grade dysplasia, 5 (16.2%) high-grade dysplasia and 8 (25.8%) invasive squamous cell carcinoma on histopathologic examination. Using i-scan-enhanced endoscopy, we could found abnormal vascular change with neoplastic neoangiogenesis in most high-grade dysplasia or invasive cancer in oral cavity. (high-grade dysplasia: 4/5 [80.0%], and invasive squamous cell carcinoma: 7/8 [87.5%]). Conclusion: i-scan-enhanced endoscopy could be a useful optical technique for the diagnosis of oral cavity leukoplakia. Our results suggest that i-scan may be a promising diagnostic tool in the early detection of suspected oral mucosal lesion.

딥러닝 기반 지하공동구 제어반 문열림 인식 (Deep Learning-based Object Detection of Panels Door Open in Underground Utility Tunnel)

  • 김경환;김지은;정우석
    • 한국재난정보학회 논문집
    • /
    • 제19권3호
    • /
    • pp.665-672
    • /
    • 2023
  • 연구목적: 지하공동구는 도시 지하에 전기, 수도, 가스 등의 인프라를 공동 수용하는 시설로 공기 흐름이 부족하여 계절에 상관없이 결로가 자주 발생한다. 결로는 전기 설비의 누전 화재를 일으키는 원인이 되므로 지하공동구 내의 조명 등 각종 시설물 관리를 위해 필요한 제어반은 결로에 노출되지 않도록 문이 닫힌 상태로 관리되어야 한다. 본 논문에서는 딥러닝 객체인식 기술을 활용하여 수km 거리에 반복 배치된 공동구 제어반의 문 열림 여부를 이동 카메라 조건과 조명이 꺼진 조건에서도 인식하고자 한다. 연구방법: 지하공동구를 순찰하는 로봇이 촬영한 영상데이터를 이용하여 딥러닝 객체인식 모델인 YOLO를 모자이크 이미지 증강기법으로 학습시켜 제어반 문 열림과 문 닫힘을 인식한다. 연구결과: 모자이크 이미지 증강기법으로 학습시킨 모델과 사용하지 않은 모델의 성능을 비교한 결과, 모자이크 학습 모델이 더 우수한 성능(모든 클래스에 대한 mAP가 0.994 이상임)을 보이는 것을 확인하였다. 결론: 지하공동구의 조명이 꺼진 상태에서도, 공동구 내부 시설물이 복잡한 환경에서도 제어반의 문열림 여부를 우수한 성능으로 인식하여 지하공동구 재난안전관리에 도움이 될 것으로 기대된다.

딥러닝 기반 영상처리 기법 및 표준 운동 프로그램을 활용한 비대면 온라인 홈트레이닝 어플리케이션 연구 (Non-face-to-face online home training application study using deep learning-based image processing technique and standard exercise program)

  • 신윤지;이현주;김준희;권다영;이선애;추윤진;박지혜;정자현;이형석;김준호
    • 문화기술의 융합
    • /
    • 제7권3호
    • /
    • pp.577-582
    • /
    • 2021
  • 최근 AR, VR 및 스마트 디바이스 기술의 발전에 따라 피트니스 산업에서도 비대면 환경을 기반으로 한 서비스 수요가 증가하고 있다. 비대면 온라인 홈트레이닝 서비스는 기존의 오프라인 서비스에 비해 시간과 장소의 제약이 없다는 장점이 있으나 운동 기구의 부재 및 사용자의 정확한 운동 자세 유지여부, 운동량의 측정이 어려운 단점이 존재한다. 본 연구에서는 이러한 단점을 보완할 수 있는 표준 운동 프로그램을 개발하고 딥러닝 기반 신체 자세 추정 영상처리를 통하여 새로운 비대면 홈트레이닝 어플리케이션 알고리즘을 제안한다. 본 연구의 알고리즘 기반 어플리케이션을 활용한다면 표준 운동 프로그램 영상의 트레이너를 사용자가 직접 보고 따라하면서 사용자 스스로 자세를 교정하며 정확한 운동이 가능하다. 나아가 본 연구의 알고리즘을 용도에 맞게 커스터마이징 한다면 공연, 영화, 동아리 활동, 컨퍼런스 분야로의 적용도 가능할 것이다.