통합 검색 | Korea Science

오디오와 영상 정보를 이용한 비디오 세그먼테이션 및 크래시피케이션 (Segmentation and Classification Using Audio and Image Information)

정해준;정성환
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2000년도 추계학술발표논문집 (하)
- /
- pp.891-894
- /
- 2000
본 논문에서는 효과적인 내용기반 비디오 검색을 위한 샷 경계 검출, 장면 경계 검출, 그리고 비디오 크래시피케이션 방법을 연구하였다. 먼저, 샷 경계 검출을 위해 칼라 히스토그램과 DCT 변환 계수를 통합하여 사용했다. 그리고 장면 경계 검출을 위해서는 영상 정보뿐만 아니라 오디오 정보를 함께 사용하여 장면 경계를 검출하였다. 또한 비디오 크래시피케이션에서는 장면 경계검출시 추출한 오디오 정보를 이용해 비디오를 내용별로 분류하는 연구를 제안하였다. 뉴스, 광고, 스포츠 등 다양한 3개 분야의 TV 프로그램으로 구성된 약 8,500개 영상 프레임과 약 50,000개의 오디오 프레임을 가진 실험 비디오 데이터베이스를 구성하여 제안된 시스템을 실험하였다. 실험한 결과, 약 88%의 정확도(Precision)를 가지는 장면 경계 검출과 약 85%의 평균 분류율을 보였다.
PDF

지역적 $X^2$를 이용한 장면전환검출 기법 (Scene Change Detection Using Local $X^2$)

신성윤;백성은;표성배;이양원
- 한국컴퓨터정보학회지
- /
- 제15권1호
- /
- pp.203-207
- /
- 2007
본 논문에서는 비디오의 분할을 위하여 먼저 기존에 제안되었던 차이 값 추출방법들의 단점들을 극복하고 장점을 최대한 활용할 수 있으며 급진적 장면전환부터 점진적 장면전환까지 모두 예측할 수 있는 강건하고 복합적인 차이 값 추출방법에 대해서 제안한다. 이 방법은 지역적 $X^2$-테스트로서 기존의 컬러 히스토그램과 $X^2$-테스트를 결합한 방법이다. 본 논문을 위하여 기존의 히스토그램 기반 알고리즘과 비교하여 좋은 성능을 보여주는 $X^2$-테스트를 변형하였고, 컬러 값의 세분화 작업에 따른 검출효과를 높이기 위하여 명암도 등급에 따른 가중치를 적용한 지역적 $X^2$-테스트를 이용하였다. 이 방법은 복잡하고 다양한 시세계의 영상 변화를 가장 일반적이고 표준화된 방법으로 분석하고 분할하며 표현할 수 있는 방법이다. 기존의 $X^2$-테스트와 제안된 지역적 $X^2$-테스트 방법의 비교는 실험을 통해 입증되었다.
PDF

MPEG 압축 영역에서 B 프레임의 특징을 이용한 점진적 장면전환 검출에 관한 연구 (A Study of The Gradual Scene Change Detection Using The Features of B Frame in Compressed MPEG Videos)

김중헌;박두영;장종환
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2002년도 추계학술발표논문집 (상)
- /
- pp.719-722
- /
- 2002
비디오 데이터의 효율적인 저장, 관리를 위해서는 장면전환 검출을 통한 비디오 분할 기술에 대한 연구가 필요하다. 기존의 장면전환 검출 알고리즘은 복호화에 의한 연산량 및 프레임들간의 비교에 의한 연산량이 많아 속도에 제한을 받았다. 본 논문에서는 MPEG 압축 비디오에서 효과적인 장면전환 검출을 위해 MPEG 압축도메인에서 B 프레임들의 매크로블록타입의 통계적 특성변화를 이용하여 점진적 장면전환검출을 빠르고 정확하게 할 수 있는 알고리즘을 제안한다.
PDF

XML기반 멀티미디어 검색시스템의 설계 (Design of Multimedia Retrieval System based on XML)

윤미희;조동욱
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
- /
- pp.59-62
- /
- 2003
컴퓨팅 기술의 발달 밍 보편화로 인해 사용자들의 멀티미디어에 대한 요구가 증가하였고, 이러한 요구를 만족시키기 위해서는 단순한 텍스트 형식의 데이터가 아닌 멀티미디어 데이터, 특히 비디오 데이터에 대한 저장, 관리, 검색하는 기능이 필수적이다. 본 논문에서는 비디오데이터에 대한 효율적인 의미검색을 위해 주석기반 검색뿐만 아니라 특징기반 검색을 지원한다. 특히 사용자가 원하는 객체나 장면의 유사성 검색이 가능하며, 장면의 검색 결과로 제시된 장면을 선택한 후 선택된 장면을 기반으로 사용자가 원하는 좀 더 정확한 장면의 검색을 위한 SQBE(scene-query-by-example) 질의가 가능한 XML 기반 멀티미디어 검색시스템을 제안한다.
PDF

객체 우선 순위에 의한 MPEG-4 랜더링 객체수의 최소화 (Minimizing MPEG-4 Rendering Object by Object Ordering)

이윤주;김상욱;마평수
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
- /
- pp.115-118
- /
- 2001
실시간 운영체제 기반의 세탑박스나 휴대 단말기에는 값싸고, 파워 소모량이 적은 CPU 를 대부분 탑재하는데, CPU 의 처리속도가 낮아 MPEG-4 미디어 객체의 삽입, 삭제, 변경 명령과 같은 사용자 상호 작용에 의한 장면 변화 프리젠테이션시 화면이 껌뻑이거나 프리젠테이션 속도가 현저하게 떨어지는 경우가 있다. 이에 랜더링되는 객체에 우선 순위를 부여하여, 장면 변화가 있을 때마다 전체 장면을 다시 프리젠테이션할 필요없이, 초기 장면에서 변경된 객체들만 우선 순위에 따라 다시 랜더링하여, 랜더링되는 객체수를 최소화하는 객체 우선 순위 컴포지션 방법을 제안한다. 객체에 우선 순위를 부여함으로써 프리젠테이션시 랜더링 순서를 임의로 변경할 수 있어 자유롭게 장면을 구성할 수 있고, 화면이 껌뻑이지 않고 속도가 빨라 자연스러운 프리젠테이션을 가능하게 한다.
PDF

하이브리드 검출기법을 이용한 교양비디오의 장면 전환 검출 (The Scene Change Detection of Cultural Videos Using Hybrid Detecting Techniques)

이지현;진송철;문종환;이양원
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2004년도 춘계학술발표대회
- /
- pp.165-168
- /
- 2004
기존 장면 전환 검출 방법들은 대부분 특정 영역에 제한되어 사용할 수 있는 방법들이며, 많은 중요한 특징 정보들을 유실하여 장면 전환 검출에 효율적이지 못하였다. 또한 장면 전환 검출을 통하여 의미 정보를 추출하기가 어렵고, 카메라와 객체의 동작을 정확히 인식하지 못하기 때문에 하이브리드 장면전환 검출 기법을 적용하여 의미 있는 정보를 효율적으로 검출 하였다.
PDF

피처레벨 비디오 분석과, 적응적 장면 선택을 이용한 비디오 캡셔닝 피처 생성

Lee, Ju-Hee;Kang, Je-Won
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 추계학술대회
- /
- pp.212-214
- /
- 2020
본 논문에서는 비디오의 피처레벨 분석을 통해 비디오의 장면 구성 특징을 파악하고, 그에 적응적으로 대표 프레임을 선택하는 방법을 제안한다. 제안된 방법으로 생성된 캡셔닝 피처는 비디오를 잘 요약하고, 이를 통해 효과적인 캡셔닝을 수행할 수 있다. 기존 비디오 캡셔닝 연구에서는 비디오의 장면 구성을 고려하지 않고 단순 등간격으로 프레임 추출을 통하여 비디오 캡셔닝을 수행하였다. 이는 다양한 장면의 모임으로 이루어진 비디오의 특성을 고려하지 않은 방법으로, 경우에 따라 주요 장면을 놓치거나, 불필요하게 중복된 프레임을 선택하는 문제가 발생한다. 본 논문에서는 비디오의 피처레벨 분석을 통해 비디오의 구성 특징을 파악하고, 이를 고려해 적응적으로 주요 프레임을 추출하여 이와 같은 문제를 해결하여 비디오 캡셔닝 에서의 성능향상을 보인다. 제안 알고리즘을 이용하여 생성된 피처는 비디오를 잘 요약하여 비디오 캡셔닝 수행 시, MSVD 데이터 셋에서 4 개의 평가지표에 대해 약 0.78%의 성능향상을 보였고, MSR-VTT 데이터 셋에서 약 0.6%의 성능향상을 보였다.
PDF

비디오 프레임의 최소 화소를 이용한 장면 전환 검출 기술 (Shot Change Detection Algorithm Using Minimum Pixels of Video Frame)

김원희;문광석;김종남
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2008년도 추계학술발표대회
- /
- pp.145-148
- /
- 2008
장면 전환 검출은 대용량 비디오 데이터의 효과적인 관리를 위해서 사용되는 기술로서 현재까지 비디오 프레임의 크기를 대폭 축소시킨 환경에서의 연구는 미미하다. 따라서 본 논문에서는 비디오 프레임의 최소 화소를 이용한 장면 전환 검출 기술을 제안한다. 장면 전환 검출을 위한 특징값 추출 요소로 가중치 분산을 사용하였고, 가변 구간 참조를 통한 적응적인 임계값을 설정하였다. 실험을 통해서 기존의 방법들보다 precision에서 2~20.4%, recall에서 3~18.2%, F1에서 1.1~19.3% 향상된 것을 확인하였고, 비디오 데이터 화소수를 1/256로 축소하여 실험한 결과 기존의 방법들보다 검출률이 월등하게 향상된 것을 알 수 있었다. 제안하는 방법은 계산량 감소를 통한 고속 처리를 가능하게 하여 다양한 소프트웨어 및 하드웨어 플랫폼에서의 고속 장면 전환 검출에 유용하게 사용될 수 있다.
https://doi.org/10.3745/PKIPS.y2008m011a.145 인용 PDF

MMT-CI 기반 멀티 소스를 활용한 효율적 장면구성정보 설계 (Design the Scene Coposition-Information using Multi-Source based on MMT-CI)

홍지예;김규헌
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2014년도 추계학술대회
- /
- pp.107-110
- /
- 2014
방통융합시대가 도래함에 따라 방송망뿐만 아니라 IP망을 통해 콘텐츠를 소비할 수 있는 스마트TV의 보급이 급속히 확산되고 있다. 또한 영상과 음악 및 광고와 같은 멀티미디어 콘텐츠의 소비 환경이 한 화면에 한 가지의 미디어 서비스만 제공받는 환경에서 다양한 정보를 동시에 소비할 수 있는 환경으로 확대되면서 다양한 정보를 하나의 화면에서 혼용적으로 전달하기 위한 장면구성정보가 필요하게 되었다. 장면구성정보는 미디어가 소비되는 특정 시간과 해당 공간의 정보를 기술하므로써 다수의 미디어를 복합적으로 소비하는 방법으로, IP 기반에서도 여러 개의 화면을 통해 여러 소스의 콘텐츠를 소비하여 다양한 사용자 경험(User Experience)를 제공하고자 ISO/IEC JTC1/SC29/WG11(별칭 MPEG)에서는 방송서비스에서 방송망 및 IP망을 활용하여 멀티미디어 데이터를 전송할 때 사용하는 MPEG Media Transport(MMT)를 기반으로 장면구성정보를 제공하기 위한 MMT-Composition Information(MMT-CI)를 기술표준화하였다. 본 논문에서는 MMT-CI의 표준문서에 따라 W3C의 웹언어인 HTML5와 확장성 언어인 XML을 이용하여 멀티소스를 활용한 장면구성정보를 기술하는 것을 제안하고 장면구성서비스에 적용을 위한 플레이어를 구현 및 검증한다.
PDF

MPEG-4 LASeR 장면기술을 활용한 효율적인 EPG 서비스 제공 방법 (Effective EPG service on the basis of using MPEG-4 LASeR scene description)

박용철;김병철;김규헌
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2011년도 추계학술대회
- /
- pp.188-191
- /
- 2011
본 논문에서는 MPEG-4 LASeR (Lightweight Application Scene Representation) 장면기술을 활용하여 효과적인 EPG(Electronic Program Guide) 서비스를 제공하는 방안을 제안한다. EPG는 텔레비전 방송 프로그램의 편성표를 텔레비전 화면상에 표시하는 것으로, 텔레비전을 시청하는 사람은 이 편성표를 통해 원하는 프로그램을 선택하거나 시간, 제목, 채널, 장르 등을 기준으로 원하는 프로그램을 검색할 수 있는 서비스를 말한다. 국제 표준 규격인 MPEG-4에는 장면의 동적인 업데이트를 위해 다양한 명령을 포함한 장면 서술정보를 제공 할 수 있는 LASeR 기술을 제공하고 있다. 특히, LASeR 표준은 구조화된 정보의 표현 및 수정 방법을 제공하기 위한 방법으로 PMSI (Presentation Method & Structured Information)를 제정하였으며, 해당 기술은 장면 서술정보에서 구조화된 정보의 일부분을 참조하여 장면에 효과적으로 표현하는 것을 가능하게 해 준다. 본 논문에서는 MPEG-4 LASeR PMSI를 기존의 텍스트 중심의 단순 EPG에 적용하여 텍스트 뿐만이 아닌 이미지 비디오 등의 멀티미디어 데이터를 활용하여 보다 동적으로 EPG 서비스를 제공하는 방법에 대하여 제안한다.
PDF

검색결과 1,568건 처리시간 0.035초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)