• Title/Summary/Keyword: 내용 기반 영상 검색

Search Result 396, Processing Time 0.031 seconds

효율적인 이미지 분할을 위한 RGB 채널 선택 기법 (RGB Channel Selection Technique for Efficient Image Segmentation)

  • 김현종;박영배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1332-1344
    • /
    • 2004
  • 최근 초고속 통신망 및 멀티미디어 관련기술의 발달로 인해 멀티미디어 데이타를 좀 더 효율적으로 전송하고 저장, 검색하는 기술이 요구되고 있다. 그 중에서 의미 기반 영상 검색은 색상, 질감, 모양 정보 등의 저 차원 특징 정보와 이미지 데이타에 의미를 부여하기 위해 주석 처리하는 것이 일반적이다. 그리고 부여된 키워드와 같은 어휘 사전을 이용하여 의미기반 정보검색을 수행하고 있지만, 기존의 키 워드기반 텍스트 정보검색의 한계를 벗어나지 못하는 문제를 야기 시킨다. 두 번째 문제점으로 내용 기반이미지 검색시스템에서 검색 성능이 떨어지며, 복잡한 배경을 가진 이미지에서 객체를 분리하기가 어렵고, 그리고 영역의 과잉 분할로 인하여 영역 추출이 어렵다. 그리고 복잡한 다중 객체를 가진 이미지에서 객체들을 분리하기 어렵다는 것이다. 이러한 문제점들을 해결하기 위해서, 본 논문에서는 총 다섯 가지 단계로 처리할 수 있는 내용 기반 검색 시스템을 구축한다. 다섯 단계 중에서 가장 중요한 부분은 RGB 이미지들 중에서 배경이 가장 큰 것과 가장 작은 것을 추출한다. 특히, 배경이 가장 큰 이미지를 이용하여 피사체와 배경을 추출하는 방법을 제안한다. 두 번째 문제점을 해결하기 위해서, RGB 채널 분할 기법을 이용하여 객체를 분리하고, Watermerge의 임계값을 이용하여 영역의 과잉분할을 최적화하며, RGB 채널 선택 기법을 이용하여 다중객체를 분리하는 방법을 제안한다. 실험을 통하여 기존에 검색하기 어려웠던 복잡한 객체들을 검색하는 방법들을 대체할 수 있도록, 제안한 기법이 기존의 방법보다 검색 성능이 우수함을 입증한다.과 황산이온의 농도에 따르는 것으로 생각된다. 이상과 같이, 에트린자이트는 콘크리트 내에서 다양한 내외부적인 화학작용 따라 특징적인 산출 양상을 보이며, 주변 환경 조건에 따라 다른 광물로 전이되는 나타내었다. 이러한 연구결과, 에트린자이트의 생성에 따른 콘크리트의 성능저하는 그 광물학적 특성과 분포양상에 관련성을 가지는 것으로 나타났다.인 상관관계를 보이지 않는 것으로 나타난다. 이에 비해서 팽윤도는 벤토나이트의 광물조성, 표면전하 특성, 입도 및 형상 등의 물리화학적 성향을 포괄하는 체표면적 수치와 대략적으로 반비례적인 관계를 보인다 따라서 벤토나이트 현탁액에서의 유변학적 특성은 몬모릴로나이트의 표면전하 특성, 형태, 입도 및 조직 등의 차이에 의해서 달라지는 점토 입자들의 응집특성 및 취합결정체의 형상에 주로 규제되고, 제올라이트와 같은 미세한 불순 광물성분들의 영향도 부수적으로 관여되는 복합적인 성향인 것으로 해석된다.18.88%이상 향상시키는 것으로 나타났다. 3. 유지방 함량 23.80%인 control 치즈의 cholesterol 함량은 81.47mg/100g이었고, 균질압력 1200psi(91kg/$cm^2$)에 $\beta$-cyclodextrin 2%를 첨가한 cheese에서는 cholesterol 함량이 20.15mg/100g으로 cholesterol 제거율이 75.27%로 가장 높게 나타났다. 4. Meltability는 균질압력 1200psi(91kg/$cm^2$)에 $\beta$-cyclodextrin 1과 2%로 처리한

필드와 모션벡터의 특징정보를 이용한 스포츠 뉴스 비디오의 장르 분류 (Automatic Genre Classification of Sports News Video Using Features of Playfield and Motion Vector)

  • 송미영;장상현;조형제
    • 정보처리학회논문지B
    • /
    • 제14B권2호
    • /
    • pp.89-98
    • /
    • 2007
  • 비디오와 브라우징, 검색, 조작을 위해서 비디오 내용을 기술하는 색인이 요구된다. 지금까지 색인의 구성은 대부분 비디오 내용에 제한된 키워드를 수작업으로 할당하는 전문가에 의해 수행되었는데 이는 비용과 시간을 소비하는 사업이므로 비디오 내용을 자동으로 분류하는 것이 필요하다. 이 연구는 축구, 골프, 야구, 농구, 배구 등 5종의 스포츠 뉴스 비디오의 분석과 요약을 위해서 자동적이고 효율적인 방법을 제안한다. 우선, 스포츠 뉴스 비디오를 앵커 장면과 스포츠 기사 장면으로 분류한다. 장면 분류는 앵커 장면의 영상 전처리와 색상 특정을 기반으로 한다. 그리고 필드의 우세색상과 모션 방향을 특징으로 이용하여 스포츠 장면을 5개의 장르로 분류한다. 241개의 스포츠 뉴스 장면에 대한 실험에서 75%의 정확도를 얻었다. 따라서 제안된 기법은 향후 개별 스포츠 뉴스와 스포츠 하이라이트를 위한 뉴스 비디오를 검색하는데 이용될 수 있을 것이다.

스포츠 장르 분석을 위한 스포츠 뉴스 비디오의 의미적 장면 분류 (Semantic Scenes Classification of Sports News Video for Sports Genre Analysis)

  • 송미영
    • 한국멀티미디어학회논문지
    • /
    • 제10권5호
    • /
    • pp.559-568
    • /
    • 2007
  • 앵커 장면 검출은 내용기반 뉴스 비디오 색인과 검색 시스템에서 비디오 장면의 의미적 파싱과 색인을 추출하는데 중요한 역할을 한다. 이 논문은 스포츠 뉴스의 단위 구조화를 위해서 뉴스 동영상에 존재하는 앵커 구간을 구분해내는 효율적인 알고리즘을 제안한다. 앵커 장면을 검출하기 위해서, 우선 MPEG4 압축 비디오에서 DCT 계수치와 모션 방향성 정보를 이용하여 앵커 후보 장면을 결정한다. 그리고 검출된 후보앵커 장면으로부터 영상처리 방법을 활용하여 뉴스 비디오를 앵커 장면과 비앵커(스포츠) 장면으로 분류한다. 제안된 방법은 앵커 장면 검출 실험에서 평균적으로 98%의 정확도와 재현율을 얻었다.

  • PDF

동영상데이터의 프레임간 색상차의 자승합을 이용한 컷 검출시스템 (The Cut Detection System using Sum of Square Difference of Color between frames of Video Image Data)

  • 김병철;정창렬;고진광
    • 인터넷정보학회논문지
    • /
    • 제3권5호
    • /
    • pp.51-62
    • /
    • 2002
  • 컴퓨터의 발전과 정보통신기술의 발달은 멀티미디어 기술 확산과 대용량의 멀티미디어 동영상데이터 사용을 증가시켰다. 동영상데이터는 전체적인 데이터를 파악하고, 원하는 동영상을 바로 재생 가능할 뿐만 아니라 동영상 데이터의 정보가 요약된 리스트제공이 필요하다. 그리고 효과적인 동영상 검색을 위해서는 동영상 데이터의 색인과정이 필수적이며 꼭 필요한 기술이다. 따라서 본 연구는 동영상 데이터 내용기반 색인에 기초가 된 프레임의 짓 검출의 효과적인 방법을 제안한다. 제안된 방법은 프레임의 대각선 방향으로 나누어 일정한 픽셀 색상 정보 값을 추출하였다 동영상 데이터의 각각 프레임에서 추출된 칼라색상의 픽셀값은 A(j, i)행렬로 i는 프레임 수. j는 프레임의 영상 높이로 저장한다. 저장되어진 픽셀값은 프레임간의 색상차의 자승합을 이용하여 프레임간의 특정 값의 차이를 임계 값보다 클 경우 빠르고 정화하게 컷을 검출하였다. 프레임 컷 검출에 대한 실험을 포괄적으로 하기 위해 여러 종류의 동영상 데이터를 실험 대상으로 하여 컷 검출 시스템의 성능을 비교 분석하였다.

  • PDF

장면 전환점 검출을 위한 프레임의 평균오차 비교에 관한 연구 (A Study on Frame of MSE Comparison for Scene Chang Detection Retrieval)

  • 김단환;김형균;오무송
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 춘계종합학술대회
    • /
    • pp.638-642
    • /
    • 2002
  • 대용량의 동영상 데이터 이용에 있어 사용자가 전체 동영상 데이터를 한눈에 파악할 수 있고, 필요한 경우 원하는 지점부터 동영상을 재생할 수 있도록 하기 위하여 동영상 데이터의 정보를 요약해 놓은 프레임 리스트를 제공하며, 효과적인 동영상 검색을 위해서는 동영상 데이터의 색인과정이 필요하다. 본 논문은 내용기반 색인에 기초가 될 동영상의 장면 전환점 검출에 관한 효과적인 방법을.제안하고자 한다. 제안된 방법은 동영상 데이터를 대각선 방향으로 일정 픽셀의 칼라 값을 추출하여 동영상의 전체 구조를 파악할 수 있도록 정지영상으로 샘플링 하였으며, 샘플링 된 데이터는 장면전환점을 한눈으로 파악할 수 있었다. 각각의 프레임에서 추출한 픽셀의 칼라 값은 행렬A에 i$\times$j 행렬로 i는 프레임 수, j는 프레임의 영상 높이로 저장하고 MSE(Mean Square Error) 도입하여 각 프레임의 평균 오차를 계산한다. 평균오차와 일정 임계값을 초과하면 그 프레임을 장면 전환점으로 검출하고자 한다.

  • PDF

토픽맵을 이용한 e-Learning 모델에 관한 연구 (A study on e-Learning Model using TopicMap)

  • 권오상;문석재;엄영현;국윤규;정계동;최영근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (D)
    • /
    • pp.750-753
    • /
    • 2006
  • e-Learning 분야는 정부, 기업, 학교 등 많은 조직에서 교육을 위한 수단으로 사용되어지고 있다. 이러한 e-Learning은 독립적인 운영플렛폼의 개발부터 웹 기반의 코스웨어(Courseware)까지 발전해왔다. 코스웨어는 컴퓨터 전달 체제를 통하여 교수-학습 과정을 촉진시켜 명시된 교수 목표 하에 학습자의 지식과 기능의 바람직한 변화를 목적으로 설계 및 개발된 교육용 소프트웨어와 데이터라고 할 수 있다. 또한 컴퓨터 언어 및 저작도구(Authoring Tools)를 이용하여 각 과목별 교육내용을 음성, 그림, 애니메이션, 동영상 등의 다양한 형태로 제시될 수 있도록 저작된 프로그램으로 주로 눈으로 보고 귀로 들으면서 학습하는 유형이다. 현재 코스웨어에서 제공되는 정보는 학습에 대한 정보와 교수정보 그리고 Client의 학습 진행 상황 등을 제공한다. 하지만 학습에 연관된 다른 학습이나 학습에 관련된 교수들의 전공정보, 또한 학습에 관련된 어플리케이션 등을 검색하려 할 때는 하나하나 따로 검색을 해야 하는 어려움이 따른다. 본 논문에서는 이러한 문제점을 해결하기 위하여 학습에 대한 목적과 관련학습, 관련교수, 관련연구, 관련 어플리케이션 등의 연관성을 토픽맵(TopicMap)을 이용하여 학습에 대한 더 정확한 정보를 쉽게 검색할 수 있게 한다. Client가 찾으려는 토픽을 중심으로 연관된 토픽과 카테고리를 나열하여 수작업으로 인한 검색시간과 잘못된 키워드 검색을 해결하였다.

  • PDF

스마트 디바이스 기반 조리실습교육용 앱 개발 (The Development of Application for Culinary Practice Education using Smart Device)

  • 강경심
    • 디지털융복합연구
    • /
    • 제12권1호
    • /
    • pp.511-518
    • /
    • 2014
  • 본 연구의 목적은 정보통신 기술의 발달에 따른 교육환경 변화에 적응할 수 있는 스마트 디바이스 기반의 조리실습교육용 앱을 제작 보급하는 것으로 2012년 7월 1일부터 12월 30일까지 진행되었고 App의 설계는 조리실습 교육 내용 중 서양요리에 대한 이론 내용과 만드는 방법, 실습 동영상, 평가 문항으로 구성하였다. 또한 교수자와 학습자의 상호작용을 위해 공지사항과 관리자 문의 항목을 추가하였으며, 31가지 메뉴에 대한 메인요리사진 31개와 메뉴별 만드는 과정 사진 155개, 요리 레시피 31개, 요리 팁 31개, 평가 문항 372개, 요리 동영상 31개가 제작되었다. 제작된 콘텐츠는 사이트 http://kongju-fn.dslink.co.kr/super/index.html에 접속하여 직접 입력함으로써 App이 제작되도록 하였고, 이렇게 제작한 App을 'play store'에서 '요리박사'로 검색하면 찾을 수 있도록 하였다. 본 연구는 조리실습교육용 App의 개발이 전무한 시점에 제작되었다는 데 그 의의가 있다.

MPEG 압축 영역에서의 움직이는 객체 추적 및 해석 (A Study on The Tracking and Analysis of Moving Object in MPEG Compressed domain)

  • 문수정;이준환;박동선
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.103-106
    • /
    • 2001
  • 본 논문에서는 MPEG2비디오 스트림에서 직접 얻을 수 있는 정보들을 활용하여 카메라의 움직임을 추정하여 이를 기반으로 하여 움직이는 객체를 추정하고자 한다. 이를 위해, 먼저 MPEG2의 움직임 벡터는 압축의 효율성 때문에 움직임의 예측이 순서적이지 못한데, 예측 프레임들의 속성을 이용하여 이를 광 플로우(Optical Flow)를 갖는 움직임 벡터(Motion Vector)로 변환하였다. 그리고 이러한 벡터들을 이용하여 카메라의 기본적인 움직임인 팬(Fan), 틸트(Tilt). 줌(Zoom) 등을 정의하였다. 이를 위하여 팬, 틸트-줌 카메라 모델의 매개변수와 같은 의미의 $\Delta$x, $\Delta$y, $\alpha$값을 정의하고자 움직임 벡터 성분의 Hough변환을 이용하여 $\Delta$x, $\Delta$y, $\alpha$값들을 구하였다. 또한 이러한 카메라 움직임(Camera Operation)은 시간적으로 연속적으로 발생하는 특징을 이용하여 각 프레임마다 구한 카메라의 움직임을 보정하였다. 마지막으로 움직이는 객체의 추정은 우선 사용자가 원하는 객체를 바운딩박스 형태로 정의한 후 카메라 움직임이 보정된 객체의 움직임 벡터를 한 GOF(Group of Pictures) 단위로 면적 기여도에 따라 누적하여 객체를 추적하고 해석하였으며 DCT 질감 정보를 이용하여 객체의 영역을 재설정 하였다. 물론 압축된 MFEG2비디오에서 얻을 수 있는 정보들은 최대 블록 단위이므로 객체의 정의도 블록단위 이상의 객체로 제한하였다. 제안된 방법은 비디오 스트림에서 직접 정보를 얻음으로써 계산속도의 향상은 물론 카메라의 움직임특성과 움직이는 객체의 추적들을 활용하여 기존의 내용기반의 검색 및 분석에도 많이 응용될 수 있다. 이러한 개발 기술들은 압축된 데이터의 검색 및 분석에 유용하게 사용되리라고 기대되며 , 특히 검색 툴이나 비디오 편집 툴 또는 교통량 감시 시스템, 혹은 무인 감시시스템 등에서 압축된 영상의 저장과 빠른 분석을 요구시 필요하리라고 기대된다.

  • PDF

동영상 컨텐츠의 메타데이타에 기반한 효율적인 브라우징 기법 (Efficient Browsing Method based on Metadata of Video Contents)

  • 천수덕;신정훈;이상준
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.513-518
    • /
    • 2010
  • 정보기술은 통신 및 멀티미디어 기술의 발전에 힘입어 빠르게 발전하고 있으며, 이에 따른 디지털 콘텐츠에 대한 수요가 증가하였다. 디지털 콘텐츠 중 비디오 콘텐츠는 VOD, NOD, 디지털 도서관, IPTV, UCC 등 다양한 응용 분야에서 점점 확산되고 있다. 비디오 데이터는 순차적인 특성이 있으며, 시간과 공간정보가 결합한 3차원 데이터로서 계산 비용이 많이 드는 작업이기 때문에 검색이나 브라우징이 어렵다. 본 논문에서는 비디오 데이터를 구조화하는 동영상 내용 편집 도구(ATVC: Authoring Tool for Video Contents)를 제안한다. 동영상 내용 편집 도구는 비주얼 리듬을 이용하여 비디오 데이터에서 대표 프레임을 추출한 다음 XML을 이용한 태그 및 키워드 정보를 대표 프레임에 삽입하는 도구(Tool)이다. 비주얼 리듬은 3차원의 시공간적인 정보를 2차원으로 매핑한 정보로 IDCT과정 없이 픽셀 정보를 얻을 수 있어 처리속도가 빠르며 컷, 와이프, 디졸브 등의 편집 효과를 효과적으로 구분할 수 있다. 그리고 XML 데이터에는 태그 및 키워드 정보와 함께 대표 프레임의 정보까지 저장되므로 효율적인 브라우징을 제공할 수 있다.

동적 분할 기법을 이용한 효율적인 대표키 프레임 추출 (Efficient Representative-Key Frame Extraction Using Dynamic Segmentation Method)

  • 김영희;이순희;최운종;박장춘
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.515-517
    • /
    • 1999
  • 본 논문에서는 내용 기반 검색을 위한 방법의 핵심 기술중의 하나인 효율적인 대표키 프레임 추출을 위해 동적인 분할 기법을 제안하고, 다양한 장르의 비디오 데이터에 대하여 그 성능을 평가해 본다. 제안된 대표키 프레임 추출법은 기존의 균등 분할 방법에서 필요 이상의 분할이나 적은 분할로 인하여 중복 추출되거나 추출 대상에서 제외되었던 대표키를 효율적으로 검출할 수 있는 방법으로서 이는 분할 기준을 영상의 각 장르별 특징에 맞도록 동적으로 적용함으로써 획일적인 값을 적용한 기존의 연구와는 달리 차별을 가진다. 제안된 알고리즘으로 대표키 프레임을 추출하기 위하여 뉴스, 영화, 뮤직 드라마, 광고와 같은 다양한 장르별로 실험한 결과, 제안된 대표키 프레임 검출 방법이 효율적임을 확인할 수 있었다.

  • PDF