• 제목/요약/키워드: 주석기반

검색결과 331건 처리시간 0.024초

반자동 언어데이터 증강 방식에 기반한 FbSA 모델 학습을 위한 감성주석 데이터셋 FeSAD 구축 (Building Sentiment-Annotated Datasets for Training a FbSA model based on the SSP methodology)

  • 윤정우;황창회;최수원;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.66-71
    • /
    • 2021
  • 본 연구는 한국어 자질 기반 감성분석(Feature-based Sentiment Analysis: FbSA)을 위한 대규모의 학습데이터 구축에 있어 반자동 언어데이터 증강 기법(SSP: Semi-automatic Symbolic Propagation)에 입각한 자질-감성 주석 데이터셋 FeSAD(Feature-Sentiment-Annotated Dataset)의 개발 과정과 성능 평가를 소개하는 것을 목표로 한다. FeSAD는 언어자원을 활용한 SSP 1단계 주석 이후, 작업자의 주석이 2단계에서 이루어지는 2-STEP 주석 과정을 통해 구축된다. SSP 주석을 위한 언어자원에는 부분 문법 그래프(Local Grammar Graph: LGG) 스키마와 한국어 기계가독형 전자사전 DECO(Dictionnaire Electronique du COréen)가 활용되며, 본 연구에서는 7개의 도메인(코스메틱, IT제품, 패션/의류, 푸드/배달음식, 가구/인테리어, 핀테크앱, KPOP)에 대해, 오피니언 트리플이 주석된 FeSAD 데이터셋을 구축하는 프로세싱을 소개하였다. 코스메틱(COS)과 푸드/배달음식(FOO) 두 도메인에 대해, 언어자원을 활용한 1단계 SSP 주석 성능을 평가한 결과, 각각 F1-score 0.93과 0.90의 성능을 보였으며, 이를 통해 FbSA용 학습데이터 주석을 위한 작업자의 작업이 기존 작업의 10% 이하의 비중으로 감소함으로써, 학습데이터 구축을 위한 프로세싱의 소요시간과 품질이 획기적으로 개선될 수 있음을 확인하였다.

  • PDF

비디오의 의미검색과 유사성검색을 위한 통합비디오정보시스템 (Hybrid Video Information System Supporting Content-based Retrieval and Similarity Retrieval)

  • 윤미희;윤용익;김교정
    • 한국정보처리학회논문지
    • /
    • 제6권8호
    • /
    • pp.2031-2041
    • /
    • 1999
  • 본 논문에서는 비정형, 대용량의 비디오데이터의 특징기반 검색과 주석기반 검색을 통합하여 다양한 사용자의 의미검색을 지원하고, 유사성 질의를 지원하는 통합비디오정보시스템(Hybrid Video Information System : HVIS)을 제안한다. HVIS는 메타데이터 모델링을 위해 한편의 비디오를 비디오 다큐먼트, 시퀸스, 장면, 객체로 나누고 물리적인 비디오스트림을 위한 원시데이터계층(raw_data layer)과 주석기반 검색, 특징기반 검색, 유사성 검색을 지원하기 위한 메타데이터계층(meta_data layer)의 두 개의 계층을 가진 통합 계층지향 메타데이터모델(Two layered Hybrid Object-oriented Metadata Model : THOMM)과 이 모델을 기반으로 주석기반 질의, 특징기반 질의, 유사질의가 가능한 비디오질의언어 (Video Query Language)와 질의를 처리하기 위한 비디오질의처리기 (Video Query Processor : VQP)와 질의처리알고리즘을 제안한다. 특히 유사한 장면, 객체를 찾는 유사질의시 사용자의 관심을 고려한 유사성 정도를 나타내는 식을 제시한다. 제안된 시스템은 Visual C++, ActiveX와 ORACLE를 이용하여 구현되었다.

  • PDF

트리기반 멀티미디어 데이터의 의미적 검색을 위한 프레임워크 설계 (Design of the Framework for Tree-based Semantic Retrieval of Multimedia Data)

  • 안형근;고재진;양상석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.133-135
    • /
    • 2005
  • 현재 웹을 사용하는 사람, 디지털 컨텐츠, 정보의 생성이 계속적으로 증가하여 오고 있다. 최근 웹 데이터는 멀티미디어 데이터(비디오, 오디오, 웹TV, 이미지 등)라고 말해도 무방할 것이다. 이런 방대한 멀티미디어 데이터의 검색은 사용자들에게는 아주 중요한 작업이 되었으며, 효과적인 멀티미디어 검색 시스템의 필요성이 대두되고 있다. 최근까지의 멀티미디어 데이터 검색은 내용${\cdot}$주석기반의 검색이 주를 이루고 있다. 하지만 내용${\cdot}$주석 기반 검색은 의미${\cdot}$추론적 검색에서는 부족함을 보여주고 있는 실정이다. 따라서 본 논문에서는 검색 방법 중에서도 주석 기반 검색에서 가지는 문제점을 살펴보고 그에 대한 해결 알고리즘과 프레임워크를 제안한다.

  • PDF

오픈도메인 질의문 자동 분류를 위한 주석 말뭉치 구축 연구 (A study on the Construction of Annotated corpora for the Automatic Classification of Open Domain Queries)

  • 안애림;이서진;최동현;김응균;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.309-314
    • /
    • 2019
  • 본 연구는 오픈도메인 자연어 질의문 유형을 '질문 초점(Question Focus)'에 따라 분류하고, 기계학습 기반 질의문 유형 분류기의 성능 향상을 위한 주석 말뭉치 구축을 목표로 한다. 오픈도메인 질의문 분석을 통해 의문사 등의 키워드 기반 질의문 유형 분류의 한계를 설명하고, 질의문 내의 비명시적인 의미자질을 고려한 질문 초점 기반 질의문 유형 분류 기준을 정의하였다. 이 기준에 따라 구축된 112,856 문장의 주석 말뭉치를 기계학습(CNN) 기반 문장 분류 시스템의 학습 데이터로 사용하여 실험한 결과 F1-Score 97.72%성능을 보였다. 또한 이를 카카오 오픈도메인 질의응답시스템에 적용하여 질의문 확장을 위한 의미 자질로 사용하였고 그 결과 전체 시스템 성능을 1.6%p 향상시켰다.

  • PDF

DICOM 표준 영샹을 위한 이미지 기반의 주석 (An Image-Based Annotation for DICOM Standard Image)

  • 장석환;김회율
    • 한국멀티미디어학회논문지
    • /
    • 제7권9호
    • /
    • pp.1321-1328
    • /
    • 2004
  • 본 논문에서는 DICOM 영상 내에 이미지 기반의 주석을 생성/삽입할 수 있는 새로운 DICOM 객체를 제안한다. 본 논문에서 제안한 주석 처리 방법은 이미지 자체를 주석으로 사용하기 때문에 사용자가 입력한 다양한 형태의 정보(문자, 스케치, 그림)를 주석 내에 쉽게 저장할 수 있다. 주석 영상은 원 영상과는 독립적으로 저장/관리 되기 때문에 원 영상에는 전혀 영향을 주지 않고 삽입/추가/변경 등이 가능하다. 또한, 제안된 주석은DICOM영상 내에 직접 저장되기 때문에 PACS/EMR이 설치되어 있지 않은 중소 병원에 매우 유용할 것으로 기대된다.

  • PDF

영상의 에지 특징정보를 이용한 주석기반 및 내용기반 영상 검색 시스템의 구현 (Implementation of Annotation-Based and Content-Based Image Retrieval System using)

  • 이태동;김민구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권5호
    • /
    • pp.510-521
    • /
    • 2001
  • 영상은 대용량적인 특성과 비정형적인 특성을 가지고 있으므로 신속하고 효율적으로 영상을 검색하기 위해 영상의 정확한 특징정보를 추출하여 검색 시스템을 구축하여야 한다. 영상 검색 시스템은 텍스트 기반의 전통 데이타베이스와는 다른 모델링 방법과 검색방법을 사용한다. 따라서, 영상 검색 시스템에서의 검색속도와 정확도를 향상시키기 위해서는 새로운 영상 데이타베이스 생성기법과 효율적인 검색 기법이 필요하다. 본 논문에서는 입력 영상으로부터 검색에 상용되는 에지 특징정보 추출을 위해 라플라시 안마스크와 입력 영상을 컨벌루션하여 에지의 외곽선 데이타를 추출하였으며, 그리고 추출한 에지 특징정보와 메타데이타로 영상 데이타베이스를 생성하여 신속하고 효율적으로 영상을 검색할 수 있도록 주석기반 및 내용기반 영상 검색 시스템을 구현하였다. 주석기반 및 내용기반 영상 검색 시스템은 영상의 하위 레벨에 표현된 내용기반 에지 특징정보와 특징정보 추출이 어려운 상위레벨에 표현된 주석기반 에지 특징 정보를 영상의 색인으로 구성하여 사용하기 때문에 영상 컨텐츠 검색의 성능을 향상시킬 수 있다. 마지막으로 본 논문에서 제시한 영상 검색 시스템은 메타데이타에 의해 영상 데이타베이스를 구축하므로 정확한 영상 컨텐츠 정보의 축적관리와 영상의 정보공유 및 재이용이 가능하다.

  • PDF

XMARS : XML 기반 멀티미디어 주석 및 검색 시스템 (XMARS : XML-based Multimedia Annotation and Retrieval System)

  • 남윤영;황인준
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.541-548
    • /
    • 2002
  • 본 논문에서는 XML을 이용하여 멀티미디어 데이터를 구조적으로 표현하고 효율적으로 추출하기 위한 XML 기반 멀티미디어 주석 및 검색 시스템을 제안한다. 이 시스템은 멀티미디어 데이터에 대한 주석이나 검색, 브라우징을 위한 그래픽 인터페이스를 제공하며 멀티미디어 정보를 표현하기 위해 계층적 메타데이터 모델을 기반으로 하여 구현되었다. 비디오에 대한 메타데이터는 MPEG-7 표준에 정의되어 있는 멀티미디어 서술 스키마를 기반으로 XML 스키마를 사용하여 작성하였다. 또한, 멀티미디어 데이터의 효율적인 인덱싱과 추출을 위하여 자막과 주석을 바탕으로 한 카테고라이징 기법을 사용한다.

자동 주석 갱신 및 멀티 분할 색상 히스토그램 기법을 이용한 의미기반 비디오 검색 시스템 (A Semantic-based Video Retrieval System using Method of Automatic Annotation Update and Multi-Partition Color Histogram)

  • 이광형;전문석
    • 한국통신학회논문지
    • /
    • 제29권8C호
    • /
    • pp.1133-1141
    • /
    • 2004
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 설계하고 구현한 시스템은 실험을 통한 성능평가에서 90% 이상의 높은 정확도를 보였다.

상호 관계 기반 자동 이미지 주석 생성 (Correlation-based Automatic Image Captioning)

  • Hyungjeong, Yang;Pinar, Duygulu;Christos, Falout
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1386-1399
    • /
    • 2004
  • 본 논문에서는 상호 관계에 기반한 자동 이미지 주석 생성 방법을 보인다 새로운 실험 이미지를 위한 자동 주석의 생성은 훈련 데이타 내의 주석과 함께 주어진 이미지들을 이용하여 이미지의 시각적 속성과 텍스트 속성의 상호 관계를 발견해 냄으로 수행된다. 본 논문에서 제시하는 상호 관계 기반 자동주석 생성 모델은 1) 시각적 속성의 적절한 군집화, 2) 시각적 속성과 텍스트 속성의 가중치 부여, 3) 노이즈 제거를 위한 차원 축소 등의 요소를 고려하여 설계된다. 실험은 680 MB의 Corel 이미지 데이터를 이용하여 각 10개의 데이타 집합에 대해 수행되었으며, 실험 결과, 시각적 속성과 텍스트 속성에 대한 가중치 부여와 시각적 속성의 적절한 군집화가 모델의 성능을 향상시키며, 본 논문에서 제시한 상호 관계기반 모델이 기존의 EM을 이용한 자동 주석 생성 모델에 비해 45%의 상대적 성능 향상을 보인다.

내용기반 이미지 및 비디오 검색 시스템 성능분석에 관한 연구 (A Study on the Performance Analysis of Content-based Image & Video Retrieval Systems)

  • 김성희
    • 한국비블리아학회지
    • /
    • 제15권2호
    • /
    • pp.97-115
    • /
    • 2004
  • 본 논문에서는 먼저 이미지 및 비디오 내용기반 검색 시스템 개념 및 유형을 분석 한 후 현재 상용중인 내용기반 검색시스템 5개를 선정해서 기존의 선행연구 및 각 시스템 홈페이지를 방문하여 성능을 분석 하였다. 그 결과 멀티미디어 정보검색의 효율성을 개선하기 위해서는 내용기반 검색과 주석기반 검색을 병행하는 것이 바람직한 것으로 나타났다.

  • PDF