• 제목/요약/키워드: 색인화

검색결과 272건 처리시간 0.023초

IPTV 서비스 검색을 위한 최적화 정보 기반 메타데이터 캡슐화 구조 설계 및 구현 (Design and Implementation of an Optimization information based Metadata Encapsulation Architecture for IPTV Service Discovery)

  • 오봉진;백의현;유관종
    • 정보처리학회논문지C
    • /
    • 제18C권4호
    • /
    • pp.255-264
    • /
    • 2011
  • TV-Anytime은 XML을 PVR이나 방송서비스에 적용하기 위하여 서비스, 컨텐츠 정보 표현을 위한 스키마와 전송 프로토콜을 정의하여 많은 방송 규격에서 참조 문서로 활용되고 있다. 높은 확장성과 가독성에 비해 텍스트기반으로 정보를 기술하여 문서가 커지는 단점이 존재하며 이를 극복하기 위한 인코딩 알고리즘이 많이 제안되고 있다. 본 논문에서는 TVA 디스크립션을 전송하는 과정에서 문서의 크기를 최소화 할 수 있는 최적화 정보를 서버 단에서 반영하는 효율적인 인코딩 방식과 캡슐화 과정에서 색인 정보에 필요한 정보를 줄이고 정보를 빠르고 직관적으로 수신할 수 있는 인덱싱 방식을 제안한다.

과학 논문 초록 말뭉치 구축 및 선학습 트랜스포머 기반 초록 자동구조화 방법 (Scientific Paper Abstract Corpus and Automatic Abstract Structure Parsing using Pretrained Transformer)

  • 김서경;조윤희;허세훈;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.280-283
    • /
    • 2020
  • 논문 초록은 논문의 내용을 요약해 제시함으로써 독자들의 연구결과물에 대한 빠른 검색과 이해를 도모한다. 초록의 구성은 대부분 전형적인 경우가 많기 때문에, 초록의 구조를 자동 분석하여 색인해두면 유사구조 초록을 검색하거나 생성하는 등의 연구효율화에 기여할 수 있다. 허세훈 외 (2019)는 초록 자동구조화를 위한 말뭉치 SPA2019 및 기계학습기반의 자동구조화 방법을 제시하였다. 본 연구는, 기존 SPA2019 의 구조화 오류를 바로잡고, SPA2019 에서 추출한 1,346 개의 초록데이터와 2,385 개의 초록데이터를 추가한 SPA2020 말뭉치를 새로이 소개한다. 또한, 다양한 선학습 기반 트랜스포머들을 활용하여 초록 자동구조화를 수행하였으며, 그 결과 BERT-0.86%, RoBERTa-0.86%, ALBERT-0.84%, XLNet-0.86%, DistilBERT-0.85% 등의 자동구조화 성능을 보임을 확인하였다.

  • PDF

GPU를 이용한 R-tree에서의 범위 질의의 병렬 처리 (Parallel Range Query processing on R-tree with Graphics Processing Units)

  • 유보선;김현덕;최원익;권동섭
    • 한국멀티미디어학회논문지
    • /
    • 제14권5호
    • /
    • pp.669-680
    • /
    • 2011
  • R-tree는 데이터베이스 시스템에서 가장 많이 사용되는 색인 구조로 다차원의 데이터를 관리하는데 매우 효율적이다. 하지만 데이터베이스 시스템이 처리해야 하는 데이터의 용량이 증가함에 따라, 기존의 R-tree에서의 범위 질의의 처리는 디스크의 접근 지연 등의 이유로 인하여 수행 시간이 증가하게 되었다. 이러한 문제들을 해결하기 위하여 버퍼를 사용하거나 혹은 다수의 디스크와 프로세서를 사용하여 병렬로 질의를 수행하고자 하는 많은 연구들이 진행되었다. 이러한 연구들의 일환으로 최근 Graphics Processing Unit(GPU)을 이용한 병렬화 기법들에 대한 연구들이 진행되고 있다. 이러한 GPU의 적용을 통한 병렬화는 계산 속도의 증가와 디스크 접근 횟수의 감소를 통하여 수행 속도의 개선을 가능하게 하지만 GPU와 CPU사이의 메모리 교환 및 GPU 메모리의 접근 지연 등에 의한 오버헤드를 발생시킨다. 본 논문에서는 이러한 오버헤드를 해결하고 효과적으로 GPU를 적용하기 위하여 GPU를 버퍼로 사용하여 범위 질의를 병렬화하는 기법을 제안하였다. 버퍼 알고리즘을 통하여 메모리 교환 횟수를 줄이고, 동시 접근 가능한 메모리의 용량을 증가시켜 메모리의 접근 지연을 최소화 할 수 있었다. 제안 기법과 기존의 인덱스의 비교 실험에서 최대의 경우 5배 정도의 성능이 개선되는 것을 확인 할 수 있었다.

호주 원주민 공동체 아카이브와 '평행출처주의'의 현재적 의미 (Aboriginal Community Archives in Australia and Current Meaning of "Parallel Provenance")

  • 이경래
    • 기록학연구
    • /
    • 제40호
    • /
    • pp.29-60
    • /
    • 2014
  • 본 논문은 호주의 원주민 공동체 아카이브 사례를 중심으로 발전한 '평행 출처주의'의 형성 과정을 추적하고, 이것이 국내 과거사 아카이브의 기록화 과정에 어떤 함의를 가질 수 있는지를 고찰했다. 이 글은 호주 원주민 공동체 아카이브의 역사적 발전을 중심에 놓고, 그 시기를 크게 식민주의 아카이브, 후기식민주의 아카이브, 그리고 동시대 아카이브로 구분했다. 각 국면 분석을 통해 본 연구는 호주원주민 공동체 아카이브의 관리 및 구축 방법에 있어서 고유한 특성들과 원주민 아카이브의 진화 과정을 살폈다. 즉 식민주의 아카이브에서는 백인 관료들이 생산한 현용 행정기록 중심의 아카이브 전통과 그로 인한 다중 출처주의의 발전에 주목했다. 후기 식민주의 아카이브에서는 기록화 범주로서 호주원주민의 등장과 이들에 대한 인명 색인 작업에 대해 비판적으로 검토하였다. 마지막으로 동시대 아카이브에서는 호주 원주민의 타자화를 극복하기 위한 호주 기록학계의 최근의 움직임을 '평행 출처주의' 개념을 통해 살펴보았다. 결론에서는 이 개념의 현재적 의의를 통해 그동안 역사에서 재현되지 못한 피해당사자들이 주체가 되는 국내 과거사아카이브의 민주적인 동시대적 재구성을 위한 함의를 도출하고자 했다.

인용 지표를 이용한 재순위화 및 질의 확장의 성능 평가 - 인용색인 데이터베이스를 기반으로 - (Performance Evaluation of Re-ranking and Query Expansion for Citation Metrics: Based on Citation Index Databases)

  • 이혜경;이용구
    • 한국문헌정보학회지
    • /
    • 제57권3호
    • /
    • pp.249-277
    • /
    • 2023
  • 본 연구의 목적은 인용 지표가 인용 색인 데이터베이스의 검색성능 향상에 기여할 가능성을 파악하는 데에 있다. 이를 위하여 본 연구는 문헌정보학 분야 10개의 질의를 Web of Science에서 검색하여 수집한 3,467건의 문헌과 2000년부터 2021년까지 SSCI 문헌정보학 분야 저널 85종에 수록된 60,734건의 문헌을 기반으로 적합성 판단을 거쳐, 검색 결과의 상위 100순위에 대한 성능 및 검색 방식과 인용 지표를 활용한 재순위화, 그리고 벡터 공간모형 검색시스템 구축 등에 따른 질의 확장 실험을 수행하였다. 그 결과 첫째, 인용 지표를 단독으로 사용한 재순위화의 성능은 Web of Science의 검색성능과 상이하였으며, 인용 지표는 Web of Science 기존 시스템에 적용되지 않는 독립적인 지표로 작용하고 있었다. 둘째, 고유 질의어 수에 질의어의 총 출현 빈도를 조합하고 인용수를 보조적으로 사용했을 때, 성능에 긍정적인 영향을 미칠 것으로 확인하였다. 셋째, 질의 확장에서는 전반적으로 벡터 공간모형 기반 검색시스템의 기본 성능 대비 성능이 향상되었다. 넷째, 이용자 적합성을 통해 질의 확장을 적용한 경우가 시스템 적합성을 적용한 경우보다 성능이 향상 되었다. 다섯째, 피인용 수를 적합 문헌과 더불어 사용하면 최상위권 내 적합 문헌에서의 순위 변동 가능성을 보여주었다.

영역기반 영상 검색을 위한 FRIP 시스템 (FRIP System for Region-based Image Retrieval)

  • 고병철;이해성;변해란
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권3호
    • /
    • pp.260-272
    • /
    • 2001
  • 본 논문에서는, 영역 기반 영상 검색 시스템인 FRIP(Finding Region In the Pictures)을 제안한다. 이 시스템은 크게 색상과 방향성 질감 성분을 결합하는 굳건한 영상 분할 알고리즘과, 분할된 각 영역으로부터 특징 정보들을 추출하고 검색하는 3개의 알고리즘을 포함하고 있다. 영역 분할을 위해서, 영상으로부터 확장 및 이동된 색상 좌표계와, 방향성 질감 성분을 추출하여, 본 시스템에서 제안하는 원형필터에 적용시킨다. 원형 필터에 의해, 영역의 경계선이 자연스럽게 유지 될 수 있고, 또한 일반적인 영역 병합 알고리즘에 의해 병합되지 않던 의미 없는 줄무늬나 작은 점 영역들도 몸체 영역으로 병합 될 수 있다. 영상을 분할한 후에, 효율적인 저장 공간의 관리와 특징 정보 계산 시간을 줄이기 위하여 각 영역으로부터 최적의 특징 정보만을 추출하고 이것을 색인화 하여 데이타베이스에 저장하고 검색에 사용한다. 사용자 인터페이스를 위해서는, 영역의 '색상', '크기', '모양', '위치'와 같은 4개의 질의 조건을 주고, 사용자의 요구에 따라 정합 점수를 계산한 뒤, 그 점수에 따라 상위 검색 결과를 보여 주도록 설계되었다.

  • PDF

외국인 학습자를 위한 문맥 기반 실시간 국어 문장 교정 (Context Based Real-time Korean Writing Correction for Foreigners)

  • 박영근;김재민;이성동;이현아
    • 정보과학회 논문지
    • /
    • 제44권10호
    • /
    • pp.1087-1093
    • /
    • 2017
  • 외국인 유학생과 국내 체류 외국인 등 한국어를 학습하고자 하는 외국인이 지속적으로 증가함에 따라 외국인 한국어 학습자의 교육에 대한 관심이 높아지고 있다. 기존 맞춤법 검사기는 한국인의 사용에 중점을 두고 있어 외국인 한국어 학습자가 사용하기에는 다소 부적절하다. 본 논문에서는 한국어의 문맥 특성과 외국인의 작문 특성을 반영한 한국어 교정 방식을 제안한다. 제안하는 방식에서는 국어 문서에서 자주 사용되는 표현을 추천 교정으로 제시하기 위해 말뭉치를 활용한다. 말뭉치에서 추출된 어절 바이그램에 대한 음절 역색인을 사용하여 입력된 작문에 대한 교정 후보 집합을 얻고, 외국인의 작문 특성을 반영하는 편집거리 계산 방법을 사용하여 순위화된 추천 교정을 제시한다. 구현된 시스템에서는 사용성 향상을 위해 키보드 후킹에 기반한 사용자인터페이스를 제공하여 다른 응용프로그램에서의 입력과 동시에 문장 교정 결과를 얻을 수 있다. 외국인의 작문 환경에 대한 평가에서는 타 시스템에 비해 검출률을 약 45% 향상시켜, 제안된 시스템을 사용하는 경우 외국인 사용자가 스스로 작문 오류를 판단하고 수정할 수 있어 한국어 학습에 많은 도움이 될 것으로 기대된다.

자막의 구조적 특징을 이용한 축구 비디오 하이라이트 생성 (Creation of Soccer Video Highlight Using The Structural Features of Caption)

  • 허문행;신성윤;이양원;류근호
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.671-678
    • /
    • 2003
  • 디지털 비디오는 대용량의 저장 공간을 필요로 하는 시간적으로 매우 긴 데이터이다. 따라서 사용자들은 대용량의 긴 비디오를 시청하기 전에 사전에 제작된 요약된 비디오를 시청하고 싶어 한다. 특히, 스포츠 비디오 분야에서는 하이라이트 비디오를 시청하고자 한다. 결과적으로 하이라이트 비디오는 사용자들이 비디오를 시청하고자 할 경우 그 비디오가 시청할 가치가 있는지를 결정하는데 사용된다. 본 논문에서는 자막의 구조적 특징을 이용하여 축구 비디오 하이라이트를 생성하는 방법을 제시한다. 자막의 구조적 특징은 자막이 갖는 시간적 특징과 공간적 특징으로서 이러한 구조적 특징을 이용하여 자막 프레임 구간과 자막 키 프레임을 추출한다. 그리고 하이라이트 비디오는 자막 키 프레임들에 대한 장면 재설정과 논리적 색인화 및 하이라이트 생성 규칙을 이용하여 생성한다. 마지막으로, 브라우저를 통한 사용자의 항목 선택에 의하여 하이라이트 비디오와 비디오 세그먼트에 대한 검색과 브라우징을 수행할 수 있다.

영화의 쇼트리스트 데이터를 기반한 클라이맥스 표현 분석 (The Climax Expression Analysis Based on the Shot-list Data of Movies)

  • 임양미
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.965-976
    • /
    • 2016
  • 최근 디지털영상의 발달로 시청각 몰입에 대한 정량적 연구는 진행되고 있으나, 영화에서 내용이나 클라이맥스 부분의 영상을 정량적으로 분석하는 것은 거의 연구되지 않았다. 본 연구에서는 일반적인 영상표현 구성요소들인 쇼트사이즈(shot size), 카메라 앵글(camera angle), 카메라의 움직임의 방향(camera direction), 카메라 위치(camera position), 배우들의 대립 구도(objective & subjective) 등을 사용하여 정량적 분석을 진행하였다. 이들 사용에는 규칙이 있어 원칙을 파괴하는 부분의 영상 쇼트에서 주로 클라이맥스 효과를 볼 수 있다. 본 연구는 기존에 있는 영화들을 영상표현 구성 요소 기반으로 쇼트리스트 (shot-list)분석하여 클라이맥스 효과를 내기 위해 공통적으로 사용되는 몇 가지 방법들을 정량적으로 분석한다. 이와 같은 쇼트리스트 분석 기반의 클라이맥스 부분을 찾는 방법 제안은 영화와 같은 긴 영상에서 특정 부분만 검색하고 싶을 때, 영화의 장르를 검색하거나 색인화할 때 사용될 수 있다. 또한 검색된 일부 클라이맥스 영상과 유사 관련 정보를 제공하는 등의 다양한 정보 제공 서비스 분야에서 효용성이 높다고 할 수 있다.

자막 정보를 이용한 축구 비디오 하이라이트 생성 (Creation of Soccer Video Highlights Using Caption Information)

  • 신성윤;강일고;이양원
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.65-76
    • /
    • 2005
  • 디지털 비디오는 대용량의 저장 공간을 필요로 하는 매우 긴 데이터이다. 따라서 비디오 시청자들은 원래의 긴 비디오를 시청하기 전에 요약된 버전을 시청하기를 원한다. 특히, 스포츠 분야에서 하이라이트 비디오는 자주 시청된다. 다시 말해서, 하이라이트 비디오는 비디오 시청자에게 그 비디오를 시청할 가치가 있는지를 결정하게 한다. 본 논문에서는 시간과 공간 형태로 된 자막의 구조적 특징을 이용하여 축구 비디오 하이라이트를 생성한다. 이와 같은 구조적 특징들은 자막 프레임 구간과 자막 키 프레임을 추출하는데 사용된다. 하이라이트 비디오는 자막 키 프레임의 장면 재설정, 논리적 색인화, 그리고 하이라이트 생성 규칙에 의하여 생성된다. 마지막으로, 하이라이트 비디오와 비디오 세그먼트들은 비디오 시청자가 브라우저를 통하여 원하는 항목을 선택함으로서 검색되고 브라우징 될 수 있다

  • PDF