• 제목/요약/키워드: 영상 특징추출

검색결과 2,333건 처리시간 0.033초

캐릭터 넷을 통한 내러티브 텍스트 시각화 디자인 연구 (Design of Narrative Text Visualization Through Character-net)

  • 전혜정;박승보;이오준;유은순
    • 한국콘텐츠학회논문지
    • /
    • 제15권2호
    • /
    • pp.86-100
    • /
    • 2015
  • 인터넷 발전과 스마트 혁명을 거치며 사용자가 생산하는 데이터양이 중가하고 그 유형도 다양해졌다. 이렇게 방대한 양의 데이터를 분석하고 새로운 가치로 활용한다는 개념의 빅데이터가 새로운 이슈로 부상하였다. 더욱이 빅데이터 속의 콘텐츠들을 검색하기 위해서는 동영상이 포함하고 있는 스토리에 대한 분석과 시각화에 대한 연구가 필요하다. 따라서 본 연구에서는 등장인물들 간의 대화를 분석하여 스토리를 모델링하는 캐릭터 넷(Character-net)이라는 인터페이스를 개발하였다. 캐릭터 넷은 스토리가 있는 동영상을 분석해서 인물들을 자동으로 추출할 수 있고, 등장인물들 간의 관계를 자동으로 모형화 할 수 있다. 이로써 기존 연구와는 다른 방법으로 스토리를 가시화하는 툴의 가능성을 발견할 수 있었다. 하지만 아직 활용하기 어렵고 한 눈에 스토리 특징을 파악하기 어렵다는 단점이 발견되었다. 이러한 캐릭터 넷을 개선하기 위해서는 정보 디자인을 접목하여 해결할 수 있을 것이라 가정하였다. 따라서 본고에서는 먼저 데이터 정보디자인 분야에서의 시각화 디자인들을 간략하게 소개하였다. 나아가 동영상 스토리를 시각화하는 연구 사례들을 살펴보았다. 그리고 캐릭터 넷의 핵심 아이디어와 기존 연구와의 기술적 차이점에 대해 소개한 뒤, 추가적으로 이를 디자인적 솔루션을 접목하여 개선할 수 있는 방법들을 모색하였다.

시간영역 필터를 이용한 립리딩 성능향상에 관한 연구 (A Study on Lip-reading Enhancement Using Time-domain Filter)

  • 신도성;김진영;최승호
    • 한국음향학회지
    • /
    • 제22권5호
    • /
    • pp.375-382
    • /
    • 2003
  • 현재 음성인식 분야에서는 잡음이 심한 환경에서 음성 인식률을 향상시킬 수 있는 바이모달의 한 형태인 립리딩 기술에 관한 연구가 활발히 진행되고 있다. 립리딩 연구에 있어서 가장 중요한 것은 정확한 입술 이미지를 찾아내는 것이다. 그러나 조명변화, 화자의 발음습관, 입술 모양의 다양성, 입술의 회전과 크기 변화 등의 환경 변화 요인 때문에 안정적인 성능을 예측하기가 힘든 실정이다. 본 논문에서는 보다 안정적 성능을 얻기 위해 시간영역에서 이미지를 임펄스 응답 필터링을 수행을 통해 향상된 인식성능을 보였다. 또한 본 연구에서는 입술 전체 영상을 대상으로 처리하는 립리딩 기법의 사용으로 인해 발생하는 데이터 용량 증가를 고려해 영상의 정보는 손실하지 않고 그 특징만을 추출하여 데이터의 양을 줄일 수 있는 주성분 분석을 전처리 과정으로 사용하였다. 본 연구에서는 영상정보만을 사용하여 음성인식 성능 관찰을 위해 자동차 내에서 서비스가 가능한 22단어를 선정하여 인식실험을 하였다. 이 단어들의 인식 성능을 비교하기 위하여 음성 인식 알고리듬으로 잘 알려진 HMM(Hidden Markov Model)을 이용하였다. 실험결과 PCA(Principal component Analysis)하였던 경우 립리딩이 64%의 인식률을 보인 반면, 시간영역필터를 립리딩에 적용시 72.7%로 인식률의 향상을 보였다.

위성영상 분석과 현장조사를 통한 대구 신서혁신도시의 친환경적 도시계획의 적용 검토 (Application of Eco-friendly Planning of Sinseo Innovation City in Daegu using the Analysis of Satellite Image and Field Survey)

  • 김지영;김은정
    • 한국측량학회지
    • /
    • 제37권3호
    • /
    • pp.143-156
    • /
    • 2019
  • 본 연구의 목적은 위성영상 자료를 활용한 정규식생지수 및 지표면온도 변화분석과 현장조사를 통해 대구 신서혁신도시가 환경친화적 개발이 이루어졌는가를 검토하는데 목적이 있다. 분석방법으로는 Landsat 위성영상을 활용하여 개발이전(2008년)과 개발이후(2018년)의 정규식생지수와 지표면온도의 변화 값을 도출하였다. 이와 함께 정규식생지수와 지표면온도의 변화가 두드러진 지역을 추출하여 현장조사를 실시함으로써 해당지역의 도시계획적 특징이 어떠한지를 확인하고자 하였다. 연구의 분석결과는 다음과 같다. 우선, 신서혁신도시의 개발로 인해 평균적으로 정규식생지수는 0.07 감소하였고, 지표면온도는 $0.85^{\circ}C$ 증가하였다. 둘째, 정규식생지수가 감소하고 지표면온도가 증가한 구역은 불투성의 재료를 활용한 기반시설이 집중적으로 건설된 곳이었다. 반대로 정규식생지수는 증가하고 지표면온도가 감소한 구역은 생태블럭 주차장, 옥상녹화, 투수성이 높은 보도 포장 등의 설계적 기법을 활용한 곳이었다. 셋째, 지구단위계획 시행지침의 적용 수준을 검토한 결과, 정규식생지수가 증가하고 표준화된 지표면온도가 감소한 구역에서 해당 지침에서 제시한 친환경계획 사항들이 비교적 잘 적용된 것을 확인할 수 있었다. 이 연구를 통해 향후 도시개발사업을 시행할 시에 친환경 도시계획에 대한 방안을 제시할 수 있을 것이다.

기계학습(machine learning) 기반 터널 영상유고 자동 감지 시스템 개발을 위한 사전검토 연구 (A preliminary study for development of an automatic incident detection system on CCTV in tunnels based on a machine learning algorithm)

  • 신휴성;김동규;임민진;이규범;오영섭
    • 한국터널지하공간학회 논문집
    • /
    • 제19권1호
    • /
    • pp.95-107
    • /
    • 2017
  • 본 논문에서는 제도적으로 운영 중인 터널내 CCTV들로부터 실시간으로 들어오는 영상들을 최신 딥러닝 알고리즘을 이용, 학습시켜 다양한 조건의 터널환경에서 돌발 상황을 감지하고 그 돌발 상황의 종류들을 분류해 내는 시스템 개발을 위한 사전검토 연구를 수행하였다. 사전검토 연구를 위해, 2개의 도로현장의 교통류 CCTV영상 일부를 이용하여 가용한 전통적인 영상처리기법으로 영상내부로 집입하는 차량을 감지하고, 이동경로를 추적하여 일정 시간간격의 이동 차량의 좌표와 시간정보를 추출하고 학습자료를 구성하였다. 각 차량의 이동정보는 차선변경, 정차 등 6가지의 이벤트 정보와 연계된다. 차량 이동정보와 이벤트로 구성된 학습자료는 레질리언스(resilience) 기계학습 알고리즘을 이용하여 학습하였다. 2개의 은닉층을 설정하고, 각 은닉층의 노드수에 대한 9개의 은닉구조 모델을 설정하여 매개변수 연구를 수행하였다. 본 사전검토의 경우에는 첫 번째, 두 번째 은닉층 노드수가 각각 300개와 150개로 설정된 모델이 합리적으로 가장 추론정확도가 높은 것으로 평가되었다. 이로부터 일반화되기 매우 힘든 복잡한 교통류 상황을 기계학습을 이용하여 어떠한 사전 규칙설정 없이도 교통류의 특징들을 정확히 자동으로 감지할 수 있는 가능성을 보였다. 본 시스템은 시스템의 운용을 통해 지속적으로 교통류 영상과 이벤트 정보가 늘어난다면, 자동으로 그 시스템의 인지능력과 정확도가 자동으로 향상되는 효과도 기대할 수 있다.

얼굴 추적에서의 Staggered Multi-Scale LBP를 사용한 선택적인 점진 학습 (Selective Incremental Learning for Face Tracking Using Staggered Multi-Scale LBP)

  • 이용걸;최상일
    • 전자공학회논문지
    • /
    • 제52권5호
    • /
    • pp.115-123
    • /
    • 2015
  • 점진 학습은 비교적 높은 얼굴 추적 성능을 보이지만, 환경적인 변화로 인해 추적에 오차가 발생하면 그 이후의 추적에 오차가 전파되어 추적 성능이 감소한다는 단점이 있다. 본 논문에서는, 다양한 변이 조건에서 강인하게 동작할 수 있는 선택적인 점진 학습 방법을 제안한다. 먼저, 개별 프레임에 대해 LBP(Local Binary Pattern) 특징을 추출하여 사용함으로써 조명 변이에 보다 강인하게 동작 할수 있고, Staggered Multi-Scale LBP를 사용하여 점진 학습에 사용할 패치(patch)를 선택하여 이전 프레임에서의 오차가 전파되는 것을 방지하였다. 실험을 통해, 제안한 방법이 조명 변이와 같은 환경적 변이가 존재하는 비디오 영상에 대해서도 기존의 추적 방법들보다 우수한 얼굴 추적 성능을 보이는 것을 확인할 수 있었다.

다중 생체신호를 이용한 신경망 기반 전산화 감정해석 (Neural-network based Computerized Emotion Analysis using Multiple Biological Signals)

  • 이지은;김병남;유선국
    • 감성과학
    • /
    • 제20권2호
    • /
    • pp.161-170
    • /
    • 2017
  • 감정은 학습능력, 행동, 판단력 등 삶의 많은 부분에 영향을 끼치므로 인간의 본질을 이해하는 데 중요한 역할을 한다. 그러나 감정은 개인이 느끼는 강도가 다르며, 시각 영상 자극을 통해 감정을 유도하는 경우 감정이 지속적으로 유지되지 않는다. 이러한 문제점을 극복하기 위하여 총 4가지 감정자극(행복, 슬픔, 공포, 보통) 시 생체신호(뇌전도, 맥파, 피부전도도, 피부 온도)를 획득하고, 이로부터 특징을 추출하여 분류기의 입력으로 사용하였다. 감정 패턴을 확률적으로 해석하여 다른 공간으로 매핑시켜주는 역할을 하는 Restricted Boltzmann Machine (RBM)과 Multilayer Neural Network (MNN)의 은닉층 노드를 이용하여 비선형적인 성질의 감정을 구별하는 Deep Belief Network (DBN) 감정 패턴 분류기를 설계하였다. 그 결과, DBN의 정확도(약 94%)는 오류 역전파 알고리즘의 정확도(약 40%)보다 높은 정확도를 가지며 감정 패턴 분류기로서 우수성을 가짐을 확인하였다. 이는 향후 인지과학 및 HCI 분야 등에서 활용 가능할 것으로 사료된다.

희소 투영행렬 획득을 위한 RSR 개선 방법론 (An Improved RSR Method to Obtain the Sparse Projection Matrix)

  • 안정호
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권4호
    • /
    • pp.605-613
    • /
    • 2015
  • 본 논문은 패턴인식에서 자주 사용되는 투영행렬을 희소화하는 문제를 다룬다. 최근 임베디드 시스템이 널리 사용됨에 따라 탑재되는 프로그램의 용량이 제한받는 경우가 빈번히 발생한다. 개발된 프로그램은 상수 데이터를 포함하는 경우가 많다. 예를 들어, 얼굴인식과 같은 패턴인식 프로그램의 경우 고차원 벡터를 저차원 벡터로 차원을 축소하는 투영행렬을 사용하는 경우가 많다. 인식성능 향상을 위해 영상으로부터 매우 높은 차원의 고차원 특징벡터를 추출하는 경우 투영행렬의 사이즈는 매우 크다. 최근 라소 회귀분석 방법을 이용한 RSR(rotated sparse regression) 방법론[1]이 제안되었다. 이 방법론은 여러 실험을 통해 희소행렬을 구하는 가장 우수한 알고리즘 중 하나로 평가받고 있다. 우리는 본 논문에서 RSR을 개선할 수 있는 세 가지 방법론을 제안한다. 즉, 학습데이터에서 이상치를 제거하여 일반화 성능을 높이는 방법, 학습데이터를 랜덤 샘플링하여 희소율을 높이는 방법, RSR의 목적함수에 엘라스틱 넷 회귀분석의 패널티 항을 사용한 E-RSR(elastic net-RSR) 방법을 제안한다. 우리는 실험을 통해 제안한 방법론이 인식률을 희생하지 않으며 희소율을 크게 증가시킴으로써 기존 RSR 방법론을 개선할 수 있음을 보였다.

딥러닝을 이용한 범용적 스테그아날리시스 (Generalized Steganalysis using Deep Learning)

  • 김현재;이재구;김규완;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권4호
    • /
    • pp.244-249
    • /
    • 2017
  • 스테그아날리시스(Steganalysis)란 이미지 등 일반적인 자료에 암호화된 정보를 은닉하는 스테가노그래피(Steganography)에 대한 검출 및 분석 방법으로, 기계학습 기반 방법론을 포함한다. 기존 기계학습 기반 스테그아날리시스는 영상(Image)의 특징(Feature) 추출 및 모델링에 기반하며, 최근 딥러닝(Deep Learning)의 적용으로 검출 정확도가 큰 폭으로 향상되었다. 하지만 현존하는 스테그아날리시스 모델은 단일 스테가노그래피 기법에 대해 국한되어 있어 학습에 사용되지 않은 스테고(Stego) 이미지의 경우 검출이 불가능한 결정적 한계를 가진다. 본 연구에서는 다양한 스테가노그래피 기법으로 생성된 스테고 이미지에 딥러닝을 적용하여 스테그아날리시스를 학습하는 범용적 모델을 제안한다. 다양한 실험을 통해 제안 기법의 효용성 및 가능성을 확인하고, 범용적 스테그아날리시스 모델이 각각에 특화된 검출 기법과 유사한 정확도로 스테고 이미지를 검출할 수 있음을 보인다.

방송콘텐츠 저작권 식별관리를 위한 UCI 표준식별체계와 내용기반 식별정보의 상호연계 연구 (A Study on Cross-Association between UCI Identification System and Content-based Identifier for Copyright Identification and Management of Broadcasting Content)

  • 김주섭;남제호
    • 방송공학회논문지
    • /
    • 제14권3호
    • /
    • pp.288-298
    • /
    • 2009
  • 본 논문에서는 방송콘텐츠 저작권 식별관리를 위한 방송콘텐츠의 Video Signature와 국가표준콘텐츠식별체계인 UCI(Universal Content Identifier)의 연계 방안을 제시한다. Video Signature는 UCI와 같은 식별자의 인위적인 부여 과정이 없더라도 동영상 콘텐츠 자체에서 직접 특징정보를 추출할 수 있기 때문에, 이미 배포 유통된 콘텐츠에 대해서도 식별 확인이 가능하다. 따라서, 본 연구에서는 최근 국가표준콘텐츠식별체계로 통합, 단일화된 UCI 식별체계와 내용기반 식별정보인 Video Signature의 지속적인 연계를 위하여, 바이너리로 표현된 Video Signature를 포함하는 UCI 응용메타데이터를 정의한다. 그리고 UCI 표준식별체계 기반 Video Signature 전송 및 관리 메카니즘에 기반한 방송콘텐츠의 저작권 식별관리 및 부가서비스 시나리오를 제시한다.

증강현실을 위한 가상 공간좌표 생성 (Cyberspace Coordinate Create for Augmented Reality)

  • 반경진;류남훈;김경옥;한재정;김응곤
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.765-769
    • /
    • 2009
  • 기존의 증강현실은 객체와 배경과의 원활한 상호작용을 위하여 데이터 글러브나 마커 등을 이용하였다. 이는 사용에 불편함과 몰입감 저하의 결과를 발생한다. 증강현실에서 몰입감을 강화하기 위해서는 부가적인 입력장치의 제거가 필요하다. 이를 위해 마커가 부착되지 않은 상태에서도 정확한 공간좌표의 인식을 필요로 한다. 본 논문에서는 증강현실에서의 몰입감 향상을 위해 부가적인 입력장치의 착용없이 상호 작용을 하기 위한 가상의 공간좌표 생성 기법을 제안한다. 제안된 방법은 획득한 영상을 2차원 공간상에 투영하고 특징선을 추출하여 투영된 가상공간좌표를 계산하여 가상의 객체를 투영하였다. 이는 Markerless 증강과 모바일 증강 등에 응용이 가능하다.

  • PDF