• 제목/요약/키워드: Automatic metadata generation

검색결과 12건 처리시간 0.023초

Automatic Extraction of Metadata Information for Library Collections

  • Yang, Gi-Chul;Park, Jeong-Ran
    • International Journal of Advanced Culture Technology
    • /
    • 제6권2호
    • /
    • pp.117-122
    • /
    • 2018
  • As evidenced through rapidly growing digital repositories and web resources, automatic metadata generation is becoming ever more critical, especially considering the costly and complex operation of manual metadata creation. Also, automatic metadata generation is apt to consistent metadata application. In this sense, metadata quality and interoperability can be enhanced by utilizing a mechanism for automatic metadata generation. In this article, a mechanism of automatic metadata extraction called ExMETA is introduced in order to alleviate issues dealing with inconsistent metadata application and semantic interoperability across ever-growing digital collections. Conceptual graph, one of formal languages that represent the meanings of natural language sentences, is utilized for ExMETA as a mediation mechanism that enhances the metadata quality by disambiguating semantic ambiguities caused by isolation of a metadata element and its corresponding definition from the relevant context. Hence, automatic metadata generation by using ExMETA can be a good way of enhancing metadata quality and semantic interoperability.

Automatic Generation of Video Metadata for the Super-personalized Recommendation of Media

  • Yong, Sung Jung;Park, Hyo Gyeong;You, Yeon Hwi;Moon, Il-Young
    • Journal of information and communication convergence engineering
    • /
    • 제20권4호
    • /
    • pp.288-294
    • /
    • 2022
  • The media content market has been growing, as various types of content are being mass-produced owing to the recent proliferation of the Internet and digital media. In addition, platforms that provide personalized services for content consumption are emerging and competing with each other to recommend personalized content. Existing platforms use a method in which a user directly inputs video metadata. Consequently, significant amounts of time and cost are consumed in processing large amounts of data. In this study, keyframes and audio spectra based on the YCbCr color model of a movie trailer were extracted for the automatic generation of metadata. The extracted audio spectra and image keyframes were used as learning data for genre recognition in deep learning. Deep learning was implemented to determine genres among the video metadata, and suggestions for utilization were proposed. A system that can automatically generate metadata established through the results of this study will be helpful for studying recommendation systems for media super-personalization.

시멘틱 웹 기반 개방형 전자도서관 모델에 관한 연구 (A Study of Semantic Web Based Open Digital Library Model)

  • 황상규
    • 정보관리학회지
    • /
    • 제21권1호
    • /
    • pp.187-207
    • /
    • 2004
  • 최근에 이르러 차세대 웹 아키텍처인 시멘틱 웹에 관한 연구에 대한 관심이 증대되고 있다. 정보학적인 관점에서, 차세대 웹 아키텍처인 시멘틱 웹은 하나의 거대한 메타데이터 조직으로 볼 수 있다 시멘틱 웹을 거대한 메타데이터 조직으로 볼 수 있는 가장 큰 이유는, 시멘틱 웹을 구축 과정에서 가장 중요한 단계 중 하나가 웹 정보자원에 대한 정형화된 메타데이터를 작성하는 것이기 때문이며, 이용자는 메타데이터를 이용하여 보다 쉽게 자신이 원하는 정보를 찾을 수 있다. 본 논문에서는, 시멘틱 웹 환경 하에서 서로 다른 정보체계구조를 지닌 개방형 전자도서관간의 상호 운영성을 제공하기 위하여 새로운 방식의 응용프로화일 메타데이터구조를 개발하였다. 새로운 방식의 응용프로화일 메타데이터구조를 토대로, 개방형도서관모델에서 서로 다른 형태의 대규모메타데이터를 통합하기 위한 통합메타데이터 자동생성 및 통합검색 알고리즘을 개발하였다.

ChatGPT가 자동 생성한 더블린 코어 메타데이터의 품질 평가: 국내 도서를 대상으로 (Quality Evaluation of Automatically Generated Metadata Using ChatGPT: Focusing on Dublin Core for Korean Monographs)

  • 김선욱;이혜경;이용구
    • 정보관리학회지
    • /
    • 제40권2호
    • /
    • pp.183-209
    • /
    • 2023
  • 이 연구의 목적은 ChatGPT가 도서의 표지, 표제지, 판권기 데이터를 활용하여 생성한 더블린코어의 품질 평가를 통하여 ChatGPT의 메타데이터의 생성 능력과 그 가능성을 확인하는 데 있다. 이를 위하여 90건의 도서의 표지, 표제지와 판권기 데이터를 수집하여 ChatGPT에 입력하고 더블린 코어를 생성하게 하였으며, 산출물에 대해 완전성과 정확성 척도로 성능을 파악하였다. 그 결과, 전체 데이터에 있어 완전성은 0.87, 정확성은 0.71로 준수한 수준이었다. 요소별로 성능을 보면 Title, Creator, Publisher, Date, Identifier, Right, Language 요소가 다른 요소에 비해 상대적으로 높은 성능을 보였다. Subject와 Description 요소는 완전성과 정확성에 대해 다소 낮은 성능을 보였으나, 이들 요소에서 ChatGPT의 장점으로 알려진 생성 능력을 확인할 수 있었다. 한편, DDC 주류인 사회과학과 기술과학 분야에서 Contributor 요소의 정확성이 다소 낮았는데, 이는 ChatGPT의 책임표시사항 추출 오류 및 데이터 자체에서 메타데이터 요소용 서지 기술 내용의 누락, ChatGPT가 지닌 영어 위주의 학습데이터 구성등에 따른 것으로 판단하였다.

시맨틱 웹에서 의미 검색을 위한 RDF 메타데이타 자동 생성 (Automatic Generation of RDF Metadata for Semantic Search in Semantic Web)

  • 강상구;양재영;양승섭;최원종;최중민
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.311-320
    • /
    • 2002
  • 시맨틱 웹은 인간이 이해하는 것처럼 웹 문서의 의미를 컴퓨터가 처리할 수 있도록 하는데 있다. 그러나 인터넷 등 정보통신 기술의 발전으로 인해 정보량이 급증함으로써 이들 정보 자원을 효과적으로 검색하기에는 많은 어려움이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 주석 에디터를 사용하여 논문에 대한 RDF 메타데이타의 자동 생성 방법을 제안한다. 사용자가 논문을 주석 처리할 때, 문서에 대한 특징을 추출하고 온토로지 인터페이스를 사용하여 문서를 분류한다. 구현된 시스템을 통해 사용자는 추출된 메타데이타를 메타데이타 뷰를 통해 볼 수 있으며, HTML 뷰를 통해 메타데이타를 수동으로 수정이 가능하다. 이 메타데이타는 RDF Repository로 저장할 수 있으며, 주석 뷰를 통하여 RDF 메타데이타 생성을 확인할 수 있다. 이렇게 생성된 RDF 메타데이타는 웹 로봇이 내용의 의미 파악 및 카테고리 정보를 쉽게 알 수 있도록 해준다. 본 논문은 검색 엔진을 통하여 논문 검색시 전체 내용보다 RDF 메타데이타 정보만으로 효율적인 검색을 할 수 있는 방법에 초점을 둔다.

  • PDF

학술논문 내에서 참고문헌 정보가 포함된 서지 메타데이터 자동 생성 연구 (Automatic Generation of Bibliographic Metadata with Reference Information for Academic Journals)

  • 정선기;신현호;지선영;최성필
    • 한국문헌정보학회지
    • /
    • 제56권3호
    • /
    • pp.241-264
    • /
    • 2022
  • 서지정보는 연구 주제의 최신 동향의 인지와 유용성을 검증하는 데에 참고할 수 있다. 즉, 각자 연구자들이 필요로 하는 문헌에 신속하게 접근하기 위해서는 학술논문에서 저자 정보, 요약, 초록, 참고문헌 등을 쉬운 방법으로 파악해야 한다. 그러나, 현재 출판되는 PDF 형식의 전자 학술논문은 출판 주체별로 고유한 양식을 띄고 있어서, 몇몇 특징에 의한 규칙 기반 추출법으로는 수많은 문헌에서 목표 정보를 추출하여 요약된 서지사항으로 자동 생성하기 어렵다. 이에 본 연구는 학술논문 서지사항 자동 생성에 있어서 양식의 다양성으로 인한 메타데이터 자동 추출의 난점을 극복할 방법을 제안한다. 제안하는 모델은 서지사항이 주로 기술되는 학술논문의 첫 페이지에서 목표 영역과 본문의 시작점을 구분할 수 있는 심층신경망 기반 모델과 앞의 모델로 추출된 서지사항을 상세한 메타데이터로 분류하고 재생성하는 규칙 기반 모델로 구성된다. 제안하는 모델은 참고문헌 요약정보를 생성하는 모델도 포함하는데, 본문의 말미와 참고문헌 시작점의 분리, 그리고 개별 참고문헌 추출을 규칙 기반 방법으로 진행하고, 추출한 각개 참고문헌의 서지정보를 분류하는 데에 심층신경망을 이용하도록 구성하였다. 추가로, 논문 자체의 서지정보를 전후처리 없이 추출/생성하는 모델의 가능성을 확인하기 위하여 참고문헌 영역까지 아우르는 모델을 구축하여 비교 실험을 진행하였다. 실험 결과 본 논문에서 제안하는 방식이 서지정보를 전후처리 하지 않고 진행한 비교 실험에 비하여 더 높은 성능을 보였다.

메타데이터를 활용한 그룹형 커뮤니티의 자동생성 (Automatic Generation of Group-type Community making efficient use of Metadata)

  • 윤선정;주우석;윤태수;김기홍
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.250-252
    • /
    • 2006
  • 본 논문에서는 근래에 폭발적인 성장을 하고 있는 1인 미디어의 대량의 데이터 가운데서 양질의 정보를 집중적으로 관리하고 효과적인 검색기능을 지원하는 그룹형 커뮤니티 시스템을 구축하기 위하여 메타데이터를 활용하는 것을 제안한다. 이를 위해 특별히 교육정보 만을 대상으로 하여 여기에 사용될 메타데이터 기술 요소를 개발하고 교육용 데이터에 적용 가능한 적정 카테고리를 개발하였으며 이를 검증하기 위하여 그룹형 교육 커뮤니티 EduLOG(Educational blog) 서비스를 구축하였다. 이 시스템은 새로운 교육용 커뮤니티를 개설하는 것이 아니라 기존의 많은 사용자층을 가지고 있는 1인 미디어를 활용하여 유용한 정보를 생성해 내고 공급하는 것이 가능하다는 것과 나아가 메타데이터 요소의 활용에 의해 인터넷 상에서 정확성과 신속성을 지원하는 검색 시스템 구축이 가능하다는 것을 보여준다.

  • PDF

영상 추천 서비스의 개선을 위한 영상 미디어의 메타데이터 자동생성 방법에 대한 연구 (A Research on the Method of Automatic Metadata Generation of Video Media for Improvement of Video Recommendation Service)

  • 유연휘;박효경;용성중;문일영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.281-283
    • /
    • 2021
  • 국내 OTT(Over-the-top media service) 시장의 추천 서비스에서 거론되는 대표 업체는 Youtube와 Netflix이다. Youtube는 여러 방법을 거쳐 2016년부터 이용자의 시청 시간을 기록하여 이용하는 알고리즘을 머신러닝에 도입하면서 개인화된 추천을 본격화하였고, Netflix는 사용자의 선택한 영상, 시청 시간대, 영상 시청 기기 등 정보 수집을 통해 이용자를 분류하고 비슷한 시청 패턴을 가진 사람들을 같은 그룹에 묶는 방식과 영상을 직접 시청 후 사람이 태그(메타데이터)를 직접 기록하여 사용자로부터 수집한 정보와 영상에 붙은 태그 정보를 이용한다. 본 논문에서는 수기로 작성하던 영상 미디어의 메타데이터를 자동으로 생성하여 영상미디어의 추천을 개선하기 위한 방법을 제안하고자 한다.

  • PDF

A Generation Method of Spatially Encoded Video Data for Geographic Information Systems

  • Joo, In-Hak;Hwang, Tae-Hyun;Choi, Kyoung-Ho;Jang, Byung-Tae
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.801-803
    • /
    • 2003
  • In this paper, we present a method for generating and providing spatially encoded video data that can be effectively used by GIS applications. We collect the video data by a mobile mapping system called 4S-Van that is equipped by GPS, INS, CCD camera, and DVR system. The information about spatial object appearing in video, such as occupied region in each frame, attribute value, and geo-coordinate, are generated and encoded. We suggest methods that can generate such data for each frame in semi-automatic manner. We adopt standard MPEG-7 metadata format for representation of the spatially encoded video data to be generally used by GIS application. The spatial and attribute information encoded to each video frame can make visual browsing between map and video possible. The generated video data can be provided and applied to various GIS applications where location and visual data are both important.

  • PDF