• Title/Summary/Keyword: Multimedia Information Retrieval System

검색결과 217건 처리시간 0.026초

스포츠 장르 분석을 위한 스포츠 뉴스 비디오의 의미적 장면 분류 (Semantic Scenes Classification of Sports News Video for Sports Genre Analysis)

  • 송미영
    • 한국멀티미디어학회논문지
    • /
    • 제10권5호
    • /
    • pp.559-568
    • /
    • 2007
  • 앵커 장면 검출은 내용기반 뉴스 비디오 색인과 검색 시스템에서 비디오 장면의 의미적 파싱과 색인을 추출하는데 중요한 역할을 한다. 이 논문은 스포츠 뉴스의 단위 구조화를 위해서 뉴스 동영상에 존재하는 앵커 구간을 구분해내는 효율적인 알고리즘을 제안한다. 앵커 장면을 검출하기 위해서, 우선 MPEG4 압축 비디오에서 DCT 계수치와 모션 방향성 정보를 이용하여 앵커 후보 장면을 결정한다. 그리고 검출된 후보앵커 장면으로부터 영상처리 방법을 활용하여 뉴스 비디오를 앵커 장면과 비앵커(스포츠) 장면으로 분류한다. 제안된 방법은 앵커 장면 검출 실험에서 평균적으로 98%의 정확도와 재현율을 얻었다.

  • PDF

u-Farm을 위한 모바일 기반의 농작물 재배 현장 중심형 스마트 병해충 정보검색 시스템 설계 및 구현 (Design and Implementation of Produce Farming Field-Oriented Smart Pest Information Retrieval System based on Mobile for u-Farm)

  • 강주희;정세훈;노선식;소원호;심춘보
    • 한국전자통신학회논문지
    • /
    • 제10권10호
    • /
    • pp.1145-1156
    • /
    • 2015
  • 현재 농작물의 품질과 직결되는 병해충에 관하여 농작물 재배 현장에서 바로 사용할 수 있는 모바일 전용의 응용 시스템은 부족한 실정이다. 따라서 본 논문에서는 병해충 예찰 및 기본 정보에 관해서는 충실하나 즉각적인 진단 기능이 매우 부족하고 아울러 농작물 재배 현장에서 바로 사용할 수 있는 모바일 기반의 병해충 전용 시스템의 부재를 개선하기 위해서, u-Farm을 위한 모바일 기반의 농작물 재배 현장 중심형 스마트 병해충 정보검색 시스템을 설계 및 구현한다. 제안하는 시스템은 이미지의 전문 분석에 유용한 검색 라이브러리인 루씬(Lucene) 및 JSON 데이터 구조를 기반으로 농작물 재배 현장에서 병해충의 정보를 웹뿐만 아니라, 본인이 소유한 스마트 폰을 통해 실시간으로 직접 확인할 수 있는 장점이 있다. 또한, 시스템의 확장 및 재사용성을 높이기 위해 객체지향 모델링을 기반으로 설계하였으며, 농작물의 메타 정보뿐만 아니라, 메타 정보 기반의 텍스트 및 색상 등과 같은 이미지 특징 정보를 기반으로 검색이 가능하다. 본 시스템을 통해 u-Farm 실현뿐만 아니라 농업인이나 재배 현장 관리자들이 농작물 작황, 병해충 현황 파악 및 관리를 실시간으로 진행할 수 있다.

사용자 선호도와 시각적 기술자를 이용한 사용자 프로파일 기반 이미지 추천 알고리즘 (Image recommendation algorithm based on profile using user preference and visual descriptor)

  • 김덕환;양준식;조원희
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.463-474
    • /
    • 2008
  • 정보 기술과 인터넷의 발전은 멀티미디어 컨텐츠의 양에 있어서 폭발적인 성장을 가져 왔으며 이러한 멀티미디어 컨텐츠 양의 증가는 이용자의 요구에 맞는 멀티미디어 컨텐츠 추천에 대한 필요성을 더 증가 시켰다. 현재까지 일반상품과 멀티미디어 컨텐츠 추천을 위한 기법에는 협업필터링 (CF: Collaborative Filtering)이 있다. 하지만 기존의 CF 기법은 이미지가 갖고 있는 시각적 특징을 제대로 표현하지 못하고 있으며, 입력 데이터의 희박성 (Sparsity) 문제와 신상품 추천 문제 그리고 선호도의 동적인 변화 문제를 포함하고 있기 때문에 이미지 컨텐츠 추천에는 적합하지 않다. 이와 같은 기존의 CF기법의 단점을 해결하기 위해서 본 논문에서는 새로운 이미지 추천 방법으로 FBCF (Feature Based Collaborative Filtering) 기법을 제안한다. FBCF 기법은 시각적 특징을 선호도에 따라 군집화한 새로운 사용자 프로파일 구성방법을 제시하며, 선호도 피드백을 통하여 구매자의 현재 성향을 추천에 반영할 수 있다. 실제 모바일 이미지 데이터를 사용한 실험에서 FBCF 기법이 기존의 CF 기법보다 400% 향상된 성능을 보임을 확인할 수 있다.

문맥을 고려한 예제 기반 동영상 검색 알고리즘 (Content Based Video Retrieval by Example Considering Context)

  • 박주현;낭종호;김경수;하명환;정병희
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권12호
    • /
    • pp.756-771
    • /
    • 2003
  • 효율적인 동영상 검색 방법은 많은 양의 동영상 데이터를 관리하는 디지털 비디오 라이브러리 시스템에서 필수적으로 요구되는 기능이다. 본 논문에서는 샷 단위 동영상을 문맥, 전경, 배경, 오디오로 나누어 비교하여 질의 동영상과 비슷한 동영상을 찾아내는 예제 기반 동영상 검색 알고리즘을 제안하였고, 제안한 알고리즘에 따라서 저작 및 검색도구를 구현하였다. 샷간의 관계 정보 즉, 문맥을 고려한다는 것은 인접한 샷들 간의 오디오, 움직임 정보들과 같은 저급 수준 내용 정보 간에 변화 패턴을 비교한다는 것이다. 두 번째 비교 요소인 전경은 움직이는 객체들의 집합을 의미하고, 세 번째 비교 요소인 배경은 전경을 제외한 나머지 비디오 정보를 의미한다. 이러한 비교 방법은 동영상 제작 과정에 근거한 것으로써 사용자로 하여금 직관적인 비교를 할 수 있게 한다. 또한 질의 신을 직접 구성할 수 있게 하였고, 각각의 비교요소에 가중치를 부여할 수 있도록 하여서 사용자의 검색의도를 자유롭게 반영할 수 있도록 하였다. 본 논문에서는 동영상이 가지고 있는 의미 정보를 검색에 완전히 반영하지는 못하지만, 문맥을 통해서 부분적인 의미 정보를 사용할 수 있도록 하였으며, 질의 신 구성과 직관적인 비교 요소를 사용함으로써 사용자의 검색 의도를 최대한 반영하고자 하였다.

휘도 마스킹과 DC Modulus 알고리즘을 이용한 비디오 워터마킹 (A Blind Video Watermarking Technique Using Luminance Masking and DC Modulus Algorithm)

  • 장용원;김인택;한승수
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제51권7호
    • /
    • pp.302-307
    • /
    • 2002
  • Digital watermarking is the technique, which embeds an invisible signal including signal including owner identification and copy control information into multimedia data such as audio, video, and images for copyright protection. A new MPEG watermark embedding algorithm using complex block effect based on the Human Visual System(HVS) is introduced in this paper. In this algorithm, $8{\times}8$ dark blocks are selected, and the watermark is embedded in the DC component of the discrete cosine transform(DCT) by using quantization and modulus calculation. This algorithm uses a blind watermark retrieval technique, which detects the embedded watermark without using the original image. The experimental results show that the proposed watermark technique is robust against MPEG coding, bitrate changes, and various GOP(Group of Picture) changes.

인터넷기반 멀티미디어 정보검색시스템 : 옥서'95의 색인 및 검색 (Design and Implementation of a Multimedia Information Retrieval System based on Internet)

  • 강현규;장호욱;전미선;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-92
    • /
    • 1996
  • 본 논문은 인터넷 기반의 멀티미디어 정보 검색 시스템인 옥서 '95의 정보 색인 및 검색에 대한 설계 및 구현에 대하여 논한다. 정보 구축시 키워드의 확장 개념으로서의 키팩트 추출과 모호성 해소 그리고 키팩트, 하이퍼 문서 및 멀티미디어 데이타의 색인을 한다. 또한 검색시 자연언어 질의에 대한 키팩트의 추출, 확장 및 서열처리를 통하여 사용자가 원하는 정보를 검색하게 한다. 검색대상의 문서로서 백과사전, 신문기사, 기술문서를 다루었으며 여러가지 검색 기능을 설계 및 구현하였다. 전문을 대상으로 색인 및 검색을 하였으며 앞으로 전자도서관이나 정보통신 서비스에 활용할 예정이다.

  • PDF

재미 감성 주제 온톨로지를 이용한 질의어 확장 멀티미디어 데이터 검색 시스템 구현 (Implementation of Query Expansion Multimedia Data Retrieval System using "FUN" Based Ontology of Emotion)

  • 이정송;변동률;박순철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.279-284
    • /
    • 2010
  • 최근 컴퓨터와 네트워크의 기술 발달로 멀티미디어 데이터가 폭발적으로 증가하고 있다. 따라서 정보검색 시스템도 텍스트 데이터 위주에서 벗어나 멀티미디어 데이터 검색이 큰 비중을 차지하고 있다. 또한 멀티미디어 데이터 질의어처리도 기술적인 변화와 함께 다양한 질의어 확장으로 검색의 정확성을 높이고 있다. 본 논문에서는 인간의 감성에 대한 '재미' 주제 온톨로지를 구축하여 질의어 확장에 응용하였고, 한편의 동영상에서 재미 요소를 찾아내는 멀티미디어 데이터 검색 시스템을 구축하였다. 온톨로지 구축은 한글 워드넷(KorLex)에서 "재미"라는 특정 감소 요소의 의미 계층 구조를 파악하고 토픽맵을 이용하여 구축하였다. 또한, 온톨로지에 정의된 용어들 사이의 가중치는 실시간으로 계산하여 질의어를 확장에 적용하였으며, 따라서 검색의 효율성과 질을 높였다. 검색방법은 사용자가 질의어를 직접 입력하는 텍스트 입력 검색과 온톨로지 구조를 이용한 GUI 인터페이스 검색방법으로 나누어 사용자의 편의성을 증대시켰다.

  • PDF

다중 얼굴 태깅 자동화 (Automatic Tagging Scheme for Plural Faces)

  • 이충연;이재동;진성아
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.11-21
    • /
    • 2010
  • 최근 웹페이지의 생성 및 웹이 가진 정보량이 기하급수적으로 늘면서 사용자의 검색 목적을 파악하여 효율을 높이기 위한 다양한 방법이 연구되고 있으며, 태깅 시스템이 하나의 대안으로 떠오르고 있다. 태깅 시스템은 인터넷 사용자로 하여금 태그라고 불리는 메타데이터를 글, 사진, 동영상 등에 부여하도록 함으로써 콘텐츠의 검색 및 브라우징을 편리하게 하는 시스템이다. 이처럼 태그는 해당 페이지의 대표 키워드를 의미하므로 콘텐츠 분류의 기준을 마련할 수 있으나, 사용자에 의해 직접 입력되어야 하는 수고가 필요하고, 또한 무분별한 태깅으로 인해 오히려 분류에 방해가 되는 등의 문제점들이 있다. 본 논문에서는 이러한 태깅의 문제를 해결하기 위한 방법으로 얼굴인식 알고리즘을 활용한 영상콘텐츠 내에서의 다중 얼굴 태깅 자동화 방법을 제시한다. 이를 위해 먼저 여러 얼굴검출 방법 중 Haar-like features와 AdaBoost 알고리즘을 이용하여 빠른 속도와 높은 정확도로 영상콘텐츠 내에서 얼굴 영역을 검출한다. 이후 PCA와 고유얼굴을 이용하여, 검출해 낸 얼굴을 데이터베이스에 미리 저장해 놓은 프로필 사진과 비교, 인식해냄으로써 해당 인물에 대한 정보를 불러와서 자동으로 태깅하는 시스템을 구현하였다. 이러한 새로운 방식의 태깅 기술은 현존하는 사진공유, 쇼핑, 검색 등의 수많은 웹서비스에 적용이 가능하며, 특히 소셜네트워크서비스에서의 사진 관리나 인물검색 등에서 활용할 때 큰 효과를 보일 것으로 기대된다.

단면 형상 영상을 이용한 3차원 모델 검색 (3D Model Retrieval Using Sliced Shape Image)

  • 박유신;서융호;윤용인;권준식;최종수
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.27-37
    • /
    • 2008
  • 멀티미디어 기술과 콘텐츠의 발달로 3차원 데이터의 사용 범위가 넓어지고, 이를 보다 효율적으로 관리하고 검색하기 위한 시스템이 필요하다. 본 논문은 효율적인 3차원 모델의 형상 기반 검색을 하기위해 모델의 특징을 추출하는 단면 형상 영상 방법을 제안한다. 3차원 모델의 특징 기술자는 모델에 대한 위치, 회전, 크기에 불변해야 하므로 모델을 정규화 시키는 작업이 필요하다. 본 논문에서는 주성분 분석 방법을 이용하여 정규화하였다. 제안한 알고리즘은 주성분 분석을 통해 각 축의 방향 성분을 찾고, 각 축에 직교하는 n 개의 평면을 생성한다. 이 평면은 각 축의 방향과 직교 성분을 갖으며 단면 형상 영상을 구하는데 사용된다. 단면 형상 영상은 3차원 모델과 각 평면이 교차해서 생기는 2차원 평면 영상이다. 제안한 3차원 모델의 특징 기술자는 단면 형상 영상의 중심점과 2차원 형상(shape)을 이루는 직선까지의 유클리디안 거리(distance)값들의 분포도이다. 검색 성능 평가는 MPEG-7에서 제시한 표준 평가 방법인 표준화된 수정 검색 순위의 평균(ANMRR)을 이용하였고 제안한 방법의 우수성을 실험 결과를 통해 입증하였다.

답안 마킹 이벤트를 이용한 학습 성취도 분석 시스템 (A Learning Accomplishment Analysis System using Answer Marking Events)

  • 이종희;김정재;신창둔;오해석
    • 정보처리학회논문지A
    • /
    • 제10A권5호
    • /
    • pp.571-578
    • /
    • 2003
  • 웹의 등장은 멀티미디어 기술 및 컴퓨터 통신 기술 개발의 가속화 및 이를 응용한 컨텐츠 개발에 촉진제 역할을 하게 되었다. 또한 웹기반 교육시스템의 연구에서도 전자도서관과 LOD 기술을 접목한 연구들이 활발히 진행되어 왔다. 최근에는 교수-학습 활동에서의 새로운 형태인 웹을 기반으로 한 교육(WBI : Web-Based Instruction)이라는 교수 모형이 제시되기에 이르렀다. 또한, 학습자의 요구에 맞는 코스웨어의 주문이 증가되고 있는 추세이명 그에 따라 웹 기반 교육 시스템에 효율적이고 자동화된 교육 에이전트의 필요성이 인식되고 있다. 본 논문에서는 학습 평가에서 학습자의 답안 마킹 이벤트를 이용한 학습 성취도 분석 시스템을 제안한다. 제안한 시스템은 먼저 학습자의 학습 행위를 지속적으로 모니터링하고 평가하여 개인 학습자의 학습 성취도를 계산하며, 이 성취도를 에이전트의 스케쥴에 적용하여 학습자에서 적합한 코스를 제공하고, 학습자는 이러한 코스에 따라 능력에 맞는 반복된 학습을 통하여 적극적은 완전학습을 수행하게 된다.