• 제목/요약/키워드: 내용 기반 특징

검색결과 775건 처리시간 0.027초

한국어의 이형태 표준화를 통한 구 기반 통계적 기계 번역 성능 향상 (Improve Performance of Phrase-based Statistical Machine Translation through Standardizing Korean Allomorph)

  • 이원기;김영길;이의현;권홍석;조승우;조형미;이종혁
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.285-290
    • /
    • 2016
  • 한국어는 형태론적으로 굴절어에 속하는 언어로서, 어휘의 형태가 문장 속에서 문법적인 기능을 하게 되고, 형태론적으로 풍부한 언어라는 특징 때문에 조사나 어미와 같은 기능어들이 다양하게 내용어들과 결합한다. 이와 같은 특징들은 한국어를 대상으로 하는 구 기반 통계적 기계번역 시스템에서 데이터 부족문제(Data Sparseness problem)를 더욱 크게 부각시킨다. 하지만, 한국어의 몇몇 조사와 어미는 함께 결합되는 내용어에 따라 의미는 같지만 두 가지의 형태를 가지는 이형태로 존재한다. 따라서 본 논문에서 이러한 이형태들을 하나로 표준화하여 데이터부족 문제를 완화하고, 베트남-한국어 통계적 기계 번역에서 성능이 개선됨을 보였다.

  • PDF

Wavelet과 신경망을 이용한 내용기반 얼굴 검색 시스템 (Content-based Face Retrieval System using Wavelet and Neural Network)

  • 강영미;정성환
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권3호
    • /
    • pp.265-274
    • /
    • 2001
  • 본 논문에서는 얼굴의 특징 영역에 근거하여 얼굴을 검색할 수 있는 내용기반의 얼굴 검색 시스템을 제안한다. 질의를 위해 이름이나 주민등록번호와 같은 키워드를 사용하는 대신에, 제안한 시스템은 시각적 질의로서 얼굴 영상을 사용한다. 이를 위해, 얼굴 구성 요소를 포함하는 특징 영역을 HSl 칼라 모델이 제공하는 칼라 정보와 Wavelet 변환이 제공하는 에지 정보를 이용하여 추출한 후, 신경망을 통하여 분류ㆍ검색한다. 제안한 검색 시스템은 Oracle DBMS를 사용하여 클라이언트/서버 환경으로 구축되었다. 150개의 다양한 얼굴 영상으로 실험한 결과, 약 88.3%의 검색율을 보였다.

  • PDF

한국어의 이형태 표준화를 통한 구 기반 통계적 기계 번역 성능 향상 (Improve Performance of Phrase-based Statistical Machine Translation through Standardizing Korean Allomorph)

  • 이원기;김영길;이의현;권홍석;조승우;조형미;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.285-290
    • /
    • 2016
  • 한국어는 형태론적으로 굴절어에 속하는 언어로서, 어휘의 형태가 문장 속에서 문법적인 기능을 하게 되고, 형태론적으로 풍부한 언어라는 특징 때문에 조사나 어미와 같은 기능어들이 다양하게 내용어들과 결합한다. 이와 같은 특징들은 한국어를 대상으로 하는 구 기반 통계적 기계번역 시스템에서 데이터 부족 문제(Data Sparseness problem)를 더욱 크게 부각시킨다. 하지만, 한국어의 몇몇 조사와 어미는 함께 결합되는 내용어에 따라 의미는 같지만 두 가지의 형태를 가지는 이형태로 존재한다. 따라서 본 논문에서 이러한 이형태들을 하나로 표준화하여 데이터부족 문제를 완화하고, 베트남-한국어 통계적 기계 번역에서 성능이 개선됨을 보였다.

  • PDF

퍼지 적분을 이용한 내용기반 영상 검색 (Content- based Image Retrieval using Fuzzy Integral)

  • 김동우;송영준
    • 한국지능시스템학회논문지
    • /
    • 제16권2호
    • /
    • pp.203-208
    • /
    • 2006
  • 멀티미디어 시대의 도래와 함께 영상 정보의 관리는 중요한 분야로 자리 잡았고, 이러한 영상 정보의 체계적인 관리에 효과적인 내용기반 영상 검색 시스템이 등장하였다. 본 논문은 기존의 컬러 히스토그램 방식의 단점인 공간 정보의 부재로 인한 문제점을 특징들의 영역을 할당하여 보완하고, 질감 정보와 모양 정보를 추가하여 정확율을 높인다. 또한 기존의 다중 특징을 사용하는 방법들은 가중치를 수동으로 설정하여 검색 과정이 복잡한 단점이 있다. 우리는 이러한 문제점을 퍼지 적분 가중치 할당 유사도 비교 방법으로 보완하여 가중치를 자동으로 설정하게 한다. 컬러 영상1,000개에 대해 실험한 결과, 퍼지 적분을 사용한 제안 방법이 기존의 방법보다. 정확율과 재현율의 측면에서 보다 우수함을 보인다.

내용기반 영상검색을 위한 색상과 휘도 정보를 이용한 필터 구현 (Implementation on the Filters Using Color and Intensity for the Content based Image Retrieval)

  • 노진수;백창희;이강현
    • 전자공학회논문지CI
    • /
    • 제44권1호
    • /
    • pp.122-129
    • /
    • 2007
  • 영상 정보의 이용도가 증가함에 따라 영상을 효율적으로 관리할 수 있는 시스템의 필요성이 증가하고 있다. 이에 따라, 본 논문에서는 색채 특징과 영상의 형태와 위치 정보의 효율적인 결합에 근거한 내용기반 영상 검색 엔진을 제안한다. 색채 특징으로는 색채의 공간적인 상관관계를 잘 나타내는 HSI 색채 히스토그램을 선택하였고, 형태와 위치 특징들은 HSI의 휘도 성분에서 불변 모멘트를 이용하여 추출하였다. 효율적인 유사도 측정을 위해 추출된 특징(색채 히스토그램, Hu 모멘트)을 결합하여 정확도를 측정하였다. http://www.freefoto.com에서 제공하는 DB를 사용하여 실험한 결과, 제안된 검색엔진은 93%의 정확도를 가지며 성공적으로 영상 검색에 사용될 수 있음을 보였다.

자동 주석 갱신 및 멀티 분할 색상 히스토그램 기법을 이용한 의미기반 비디오 검색 시스템 (A Semantic-based Video Retrieval System using Method of Automatic Annotation Update and Multi-Partition Color Histogram)

  • 이광형;전문석
    • 한국통신학회논문지
    • /
    • 제29권8C호
    • /
    • pp.1133-1141
    • /
    • 2004
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 설계하고 구현한 시스템은 실험을 통한 성능평가에서 90% 이상의 높은 정확도를 보였다.

질감특징들의 융합을 이용한 영상검색 (Image Retrieval Using the Fusion of Texture Features)

  • 천영덕;서상용;김남철
    • 한국통신학회논문지
    • /
    • 제27권3A호
    • /
    • pp.258-267
    • /
    • 2002
  • 본 논문에서는 저자 등이 질감특징으로 제안한 바 있는 BDIP(block difference of inverse probabilities) 모멘트 특징과 새로이 질감특징으로 제안하는 BVLC(block variation of local correlation coefficient) 모멘트 특징을 기존의 웨이브렛 모멘트 질감특징과 융합하여 칼라영상을 대상으로 검색하는 내용기반 검색법을 제시하였다. 효율적인 융합을 위해 각 특징벡터들에 대한 가중치는 전체 DB에서 각 특징벡터의 성분이 가지는 표준편차와 각 특징벡터가 가지는 차원과의 곱의 역수로 하였다. 시험영상으로는 Corel Draw Photo DB와 Vistex 질감영상 DB를 사용하였다. 실험결과, 제안한 검색기법은 일반영상뿐만 아니라 질감영상에서도 웨이브렛 모멘트 특징보다 7%정도 성능이 향상됨을 확인할 수 있었다.

내용기반에 의한 뉴스 비디오 검색 시스템 (Content-based News Video Retrieval System)

  • 배종식;양해술;최형진
    • 한국콘텐츠학회논문지
    • /
    • 제11권2호
    • /
    • pp.54-60
    • /
    • 2011
  • 본 논문은 멀티미디어 정보 검색을 위한 비디오 데이터 처리 기법에 관한 연구로서 뉴스 비디오 도메인에 기반하여 비디오 정보를 효과적으로 검색할 수 있는 비디오 검색 시스템이다. 효과적인 시스템을 구축하기 위하여 비디오 데이터의 생성과 구성에 관한 사전 지식을 이용하여 의미 정보와 특징 정보를 추출한다. 이를 바탕으로 뉴스 비디오를 내용별로 인덱싱하여 신속하게 뉴스 비디오를 검색하도록 한다. 본 논문에서는 실제 KBS 방송국에서 방송 중인 뉴스에 적용하여 실험하고 시스템 평가를 위하여 프리시즌과 리콜을 사용하였다.

비디오 영상 정보 검색을 위한 문자 추출 및 인식 (Caption Detection and Recognition for Video Image Information Retrieval)

  • 구건서
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권7호
    • /
    • pp.901-914
    • /
    • 2002
  • 본 논문에서는 비디오에서 입력된 영상으로부터 내용기반 검색을 위해 자동으로 자막을 추출하여 특징 추출을 기반의 단층 연결 신경망 인식기(FE-MCBP)에 의해 자막 문자를 인식하여 영상 자막의 내용을 검출하는 방법을 제시하였다. 비디오에서 자막 추출은 먼저, 비디오에서 일정한 시간 간격으로 획득한 프레임 중에서 히스토그램 분석을 통하여 키 프레임을 찾는 과정을 수행하며, 그 다음에 각각의 키 프레임에 대하여 칼라 세그먼테이션 후 라인 검사 방법 통하여 자막 영역을 추출하도록 하였다. 마지막으로 추출된 자막영역에서 개별문자를 분리하였다. 본 연구에서는 칼라 히스토그램을 분석 후 지역 최대값을 이용하여 세그먼테이션 후 라인 검사를 수행함으로써 처리 속도와 자막영역 검출의 정확도를 개선하였다. 비디오에서 자막 추출은 비디오 정보를 멀티미디어 데이터베이스화하는 초기 단계로 추출된 자막은 바로 문자 인식기의 입력이 된다. 또한 인식된 자막정보는 데이터베이스로 구축되며 내용기반 검색 기법에 의해 검색되도록 하였다.

  • PDF

내용 기반 이미지 검색을 위한 효율적인 분산 고차원 색인 기법 (An Efficient Distributed High-Dimensional Index Structure for Contents-Based Image Retrieval)

  • 김민수;김기훈;송희섭;한진수;유승훈;안지환;박주영;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.43-44
    • /
    • 2017
  • 다양한 디지털 기기 활용의 증가로 인해 멀티미디어 데이터가 증가됨에 따라 내용 기반으로 검색하는 기술이 연구되고 있다. 내용 기반 검색을 위해 멀티미디어에서 추출된 고차원 특징 벡터가 대용량이 되면서 고차원 데이터를 분산해서 관리하는 색인 기법이 필요하다. 본 논문에서는 대용량 멀티미디어 데이터에서 유사한 이미지를 검출하기 위한 분산 고차원 색인 기법을 제안한다. 제안하는 기법은 마스터/슬레이브 구조로 되어 있다. 마스터 서버의 색인 구조는 그리드 방식을 사용하여 검색 요청 시 탐색하는 노드를 감소시킨다. 슬레이브 서버의 색인 구조는 구 형태로 색인하여 범위 질의와 최근접 질의를 효율적으로 검색한다.

  • PDF