• 제목/요약/키워드: Character-net

검색결과 83건 처리시간 0.032초

Character-Net을 이용한 주요배역 추출 (Major Character Extraction using Character-Net)

  • 박승보;김유원;조근식
    • 인터넷정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.85-102
    • /
    • 2010
  • 본 논문에서는 동영상의 등장인물 간의 상황을 기초로 배역간의 관계를 정의한 Character-Net을 구축하는 방법과 이를 이용하여 동영상으로부터 주요배역을 추출하는 방법을 제안한다. 인터넷의 발전과 함께 디지털화된 동영상의 수가 기하급수적으로 증가하여 왔고 원하는 동영상을 검색하거나 축약하기 위해 동영상으로부터 의미정보를 추출하려는 다양한 시도가 있어왔다. 상업용 영화나 TV 드라마와 같이 이야기 구조를 가진 대부분의 동영상은 그 속에 존재하는 등장인물들에 의해 이야기 전개가 이루어지게 되므로, 동영상 분석을 위해 인물 간의 관계와 상황을 체계적으로 정리하고 주요배역을 추출하여 동영상 검색이나 축약을 위한 정보로 활용할 필요가 있다. Character-Net은 영상의 그룹 단위에 등장하는 인물들을 찾아 화자와 청자를 분류하여 등장인물 기반의 그래프로 표현하고 이 그래프를 누적하여 전체 동영상의 등장인물들 간의 관계를 묘사한 네트워크다. 그리고 이 네트워크에서 연결정도 중심성 분석을 통해 주요배역을 추출할 수 있다. 이를 위해 본 논문에서는 Character-Net을 구축하고 주요배역을 추출하는 실험을 진행 하였다.

Character-net을 이용한 스토리 가시화 시스템 (Story Visualization System using Character-net)

  • 박승보;백영태
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제47차 동계학술대회논문집 21권1호
    • /
    • pp.29-30
    • /
    • 2013
  • 본 논문에서는 영화나 소설과 같은 콘텐츠의 스토리를 가시화해서 보여주는 시스템에 대해 제안하고 설명한다. 스토리를 가시화 해주기 위해 등장인물들 간의 관계를 모형화하는 Character-net 방법론을 채용하였고 스토리 진행에 따른 Character-net 변화를 분석하여 보여주는 시스템을 개발하였다. 시스템은 Character-net 변화 실행창과 등장인물 중심성 시계열 그래프 창으로 구성하였다. 두 개 창을 통해 스토리 차원의 검색이 가능토록 하였다. 본 논문에서는 스토리 가시화 시스템에 대해 설명하고 추가적으로 필요한 사항들에 대해 논의한다.

  • PDF

Character-net의 3차원 시각화를 통한 조력자의 유형 분류 (Helper Classification via Three Dimensional Visualization of Character-net)

  • 박승보;전윤배;박주현;유은순
    • 방송공학회논문지
    • /
    • 제23권1호
    • /
    • pp.53-62
    • /
    • 2018
  • 스토리를 분석하기 위해서는 스토리의 행동 주체인 등장인물에 대한 분석이 선행되어야 한다. 현재의 등장인물 분석 방법인 Character-net이나 RoleNet과 같은 방법은 최종 누적된 스토리의 결과에 대한 분석만을 진행하여 조연의 역할 분류를 하기에는 부족한 면이 있다. 조연의 역할 분석을 위해 축적된 형태의 스토리 분석 방법이 아닌 스토리 진행에 따른 시계열적 분석 방법을 연구할 필요가 있다. 본 논문은 Character-net의 3차원 시각화를 통해 등장인물들 중에 조력자들을 유형에 따라 멘토와 단짝친구로 분류하는 방법을 제안하고 그 방법의 정확도를 평가하는 논문이다. 3차원 시각화를 위해 WebGL을 사용하여 웹브라우저 상에서 누구나 결과를 확인할 수 있도록 인터페이스를 구성하였다. 또한 멘토와 단짝친구를 구별하기 위한 규칙을 제안하였고 그 성능을 평가하였다. 영화 7편에 대해 선정된 10명의 등장인물에 대해 평가한 결과 90%의 정확도를 나타내는 것을 확인하였다.

대화 참여자 결정을 통한 Character-net의 개선 (Improvement of Character-net via Detection of Conversation Participant)

  • 김원택;박승보;조근식
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.241-249
    • /
    • 2009
  • 동영상 검색이나 축약과 같은 동영상 분석을 위해 동영상 어노테이션 기술이나 동영상 정보 표현에 대한 다양한 연구가 있어왔다. 이를 위해 본 논문은 대화 참여자 결점을 위한 영상적 요소와 이러한 요소를 이용하여 Character-net 표현을 개선하는 방법을 제안한다. 기존 Character-net이 자막이 뜨는 시간에 나타나는 등장인물들만을 대화참여자로 고려하므로 일부의 청자를 제외시키는 문제점이 있다. 대화 참여자는 대화상황 파악의 극히 중요한 요소로 동영상 검색 시에 기준이 될 수 있으며 동영상의 이야기 전개를 이끌어 나간다. 대화 참여자를 결정하기 위한 영상적 요소에는 자막의 유무, 장면, 인물 등장순서, 시선방향, 패턴, 입의 움직임 등이 있다. 본 논문에서는 이러한 영상적 요소에 근거하여 대화 참여자를 판단하고 동영상 표현방법인 Character-net을 개선하고자 한다. 제안한 여러 요소들이 결합되고 일정한 조건이 만족되었을 때 대화참여자를 정확히 검출할 수 있다. 따라서 본 논문에서는 대화참여자를 결정하기 위한 영상적 요소들을 제안하고 이를 통해 Character-net의 표현성능을 개선하고 실험을 통하여 제안된 방법론이 대화 참여자 판단의 정확성과 Character-net의 표현성능을 제고함을 증명하였다.

Variations of AlexNet and GoogLeNet to Improve Korean Character Recognition Performance

  • Lee, Sang-Geol;Sung, Yunsick;Kim, Yeon-Gyu;Cha, Eui-Young
    • Journal of Information Processing Systems
    • /
    • 제14권1호
    • /
    • pp.205-217
    • /
    • 2018
  • Deep learning using convolutional neural networks (CNNs) is being studied in various fields of image recognition and these studies show excellent performance. In this paper, we compare the performance of CNN architectures, KCR-AlexNet and KCR-GoogLeNet. The experimental data used in this paper is obtained from PHD08, a large-scale Korean character database. It has 2,187 samples of each Korean character with 2,350 Korean character classes for a total of 5,139,450 data samples. In the training results, KCR-AlexNet showed an accuracy of over 98% for the top-1 test and KCR-GoogLeNet showed an accuracy of over 99% for the top-1 test after the final training iteration. We made an additional Korean character dataset with fonts that were not in PHD08 to compare the classification success rate with commercial optical character recognition (OCR) programs and ensure the objectivity of the experiment. While the commercial OCR programs showed 66.95% to 83.16% classification success rates, KCR-AlexNet and KCR-GoogLeNet showed average classification success rates of 90.12% and 89.14%, respectively, which are higher than the commercial OCR programs' rates. Considering the time factor, KCR-AlexNet was faster than KCR-GoogLeNet when they were trained using PHD08; otherwise, KCR-GoogLeNet had a faster classification speed.

등장인물들의 시간적 관계 변화에 기초한 스토리 가시화에 관한 연구 (A Study of Story Visualization Based on Variation of Characters Relationship by Time)

  • 박승보;백영태
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권3호
    • /
    • pp.119-126
    • /
    • 2013
  • 본 논문에서는 영화나 소설과 같이 스토리를 갖는 콘텐츠에 대해 스토리를 가시화해서 보여주는 시스템에 대해 제안하고 설명한다. 스토리를 가시화 해주기 위해 등장인물들 간의 관계를 모형화 하는 Character-net 방법론을 스토리 모형으로 적용하였다. 하지만 Character-net은 전체 스토리를 누적된 형태로 표현하기 때문에 스토리 진행에 따른 변화를 보여주기 한계가 있다. 이의 개선을 위해 Character-net의 변화와 등장인물들의 변화를 분석하여 보여주는 시스템을 개발하였다. 시스템은 Character-net 변화 실행 및 분석창과 등장인물 중심성 변화 시계열 그래프 창으로 구성하였다. 두 가지 창을 통해 주요 등장인물들이 처음 등장하거나 처음 만나는 장면과 같은 등장인물들 사이에서 나타나는 주요 변화지점을 찾는 기능과 인디그리와 아웃디그리의 변화 패턴을 통해 등장인물의 성향이나 성향의 변화를 추적할 수 있도록 지원하는 기능을 구현하였다. 본 논문에서는 이러한 스토리 가시화 시스템에 대해 설명하고 추가적으로 필요한 사항들에 대해 논의한다.

Character-net에서 배역비중의 분류와 커뮤니티 클러스터링 (Role Grades Classification and Community Clustering at Character-net)

  • 박승보;조근식
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권11호
    • /
    • pp.169-178
    • /
    • 2009
  • 동영상으로부터 원하는 정보를 검색하려는 다양한 연구들이 있어왔다. 하지만 기존의 연구들은 동영상의 스토리에 대한 고려 없이 특정한사물의 인식이나 사물간의 관계 정보만을 추출하여 검색에 이용하였다. 동영상에서 정확한 정보를 검색하기 위해서는 스토리의 주축이 되는 등장인물과 등장인물의 커뮤니티에 기반을 둔 연구가 반드시 필요하다. 따라서 본 논문은 등장인물에 기반을 둔 동영상 정보검색 방법을 기술한다. 등장인물들은 서로 대화를 통해 관계를 맺으며 스토리를 진행시킨다. 등장인물들 간의 관계는 배역의 비중을 분류하고 등장인물들이 이루는 커뮤니티를 구분하여 스토리에 형성되어 있는 관계를 분석할 수 있다. 이를 위해 본 논문에서 등장인물들의 관계를 묘사할 수 있는 Character-net을 제안하고 Character-net으로부터 등장인물들의 배역의 비중을 분류하고 등장인물들이 이루는 커뮤니티를 클러스터링 하는 방법에 대해 기술하고 실험을 통해 그 효용성을 입증한다.

한글 인식을 위한 CNN 기반의 간소화된 GoogLeNet 알고리즘 연구 (Streamlined GoogLeNet Algorithm Based on CNN for Korean Character Recognition)

  • 김연규;차의영
    • 한국정보통신학회논문지
    • /
    • 제20권9호
    • /
    • pp.1657-1665
    • /
    • 2016
  • CNN(Convolutional Neural Network)을 사용한 심화 학습이 다양한 분야에서 진행되고 있으며 관련 연구들은 이미지 인식의 많은 분야에서 높은 성능을 보이고 있다. 본 논문에서는 한글 인식을 위해 대규모 한글 데이터베이스를 학습할 수 있는 CNN 구조의 간소화된 GoogLeNet을 사용한다. 본 논문에 사용된 데이터베이스는 대규모 한글 데이터베이스인 PHD08로 총 2,350개의 한글 문자에 대해 각 2,187개의 샘플을 가져 총 5,139,450개의 데이터로 구성되어 있다. 간소화된 GoogLeNet은 학습의 결과로 학습 종료 시점에서 PHD08에 대해 99% 이상의 Top-1 테스트 정확도를 보였으며 실험의 객관성을 높이기 위해 PHD08에 존재하지 않는 한글 폰트로 이루어진 한글 데이터를 제작하여 상용 OCR 프로그램들과 분류 성능을 비교하였다. 상용 OCR 프로그램들은 66.95%에서 83.17%의 분류 성공률을 보인 반면, 제안하는 간소화된 GoogLeNet은 평균 89.14%의 분류 성공률을 보여 상용 OCR 프로그램들보다 높은 분류 성공률을 보였다.

SSD-Mobilenet과 ResNet을 이용한 모바일 기기용 자동차 번호판 인식시스템 (Vehicle License Plate Recognition System using SSD-Mobilenet and ResNet for Mobile Device)

  • 김운기;;조성원
    • 스마트미디어저널
    • /
    • 제9권2호
    • /
    • pp.92-98
    • /
    • 2020
  • 본 논문은 고성능의 서버 없이 안드로이드 스마트폰 단독으로 동작할 수 있도록 경량화 딥러닝 모델을 사용하여 구현한 자동차 번호판 인식 시스템을 제안한다. 자동차 번호판 인식시스템은 [번호판검출]-[문자영역 분할]-[문자인식]으로 3단계의 과정으로 구성되며, 번호판검출은 SSD-Mobilenet, 문자영역 분할은 ResNet에 localization을 추가하여 사용하였고 문자인식은 ResNet을 이용하여 구현하였다. 테스트한 기기는 삼성 갤럭시 S7, LG Q9이며 정확도는 약 85.3%, 실행속도는 약 1.1초가 소요된다.

Convolutional Neural Network를 통한 대규모 한글 데이터 학습 (Learning of Large-Scale Korean Character Data through the Convolutional Neural Network)

  • 김연규;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.97-100
    • /
    • 2016
  • CNN(Convolutinal Neural Network)을 사용하여 다양한 분야에 대한 심화 학습이 진행되고 있으며 이미지 인식 분야에서 특히 높은 성능을 보이고 있다. 본 논문에서는 5,000,000개 이상의 대규모 한글 문자 데이터베이스를 사용하여 한글을 Convolutional Neural Network에 학습 시킨 후 테스트 정확도를 확인한다. 실험에 사용된 CNN 구조는 AlexNet에 기반하여 새로 만들어진 KCR(Korean Character Recognition)-AlexNet 이며 학습 결과 98% 이상의 테스트 정확도를 보였다. 실험에 사용된 데이터베이스는 대규모 한글 데이터 데이터베이스인 PHD08로 총 2,350개의 한글 문자에 대해 각 문자마다 2,187개의 샘플을 가져 총 5,139,450 개의 데이터가 존재한다. 본 연구를 통해 KCR-AlexNet이 한글 데이터베이스인 PHD08을 학습하는데 우수한 구조임을 보인다.

  • PDF