• Title/Summary/Keyword: 공개 데이터

Search Result 1,029, Processing Time 0.03 seconds

Analysis of YouTube Trending Video Dataset by Country and Category (YouTube 인기 급상승 동영상 데이터셋의 국가별-카테고리별 분석)

  • Jung, Jimin;Kim, Seungjin;Jung, Sungwook;Lee, Dongyun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.05a
    • /
    • pp.209-211
    • /
    • 2022
  • YouTube, a video platform used by millions of people worldwide, provides a rapidly growing video service. This study aims to understand the characteristics and cultural differences of each country using the Kaggle dataset, one of the public datasets, and to show the usefulness of the public dataset. For this purpose, we analyze data from 11 countries, 15 categories, and about 1.1 million trending videos. This study adopts Python to obtain the number of videos by category for data analysis, the selection period of videos rapidly increasing in popularity, and the ratio of unique videos. In the future, based on machine learning, we plan to research to help diagnose individual videos and establish channel operation plans and strategies by predicting the selection possibility and selection period based on machine learning.

  • PDF

Design of Security Kernel System based on the Digital Signature to Prevent Hacking (전자서명기반의 해킹방지 보안 커널시스템 설계)

  • 도경화;이상훈;이영택;정우식;전문석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.422-424
    • /
    • 2003
  • 최근 전자서명방식의 사용이 급증하고 있으나, 인터넷의 해킹과 데이터의 피해는 날로 심각해져가고 있다 특히, 정보의 특성에 따라 데이터의 접근을 허용하지 않아야 하는 경우는 보안에 대한 중요성이 더욱 강조된다. 따라서, 본 논문은 시스템의 안전성을 위하여 암호화와 공개키기반구조를 이용하고 있으며, 중요 데이터의 안전성을 높이기 위하여 데이터베이스 접근시에도 전자서명 및 암호화롤 통한 보안 커널시스템을 제안하고 설계한다. 본 논문은 교육망이라는 특정 목적을 가진 네트웍망을 실험환경으로 하여 전자서명방식을 통한 인증 뿐만아니라, 데이터의 공개 및 위.변조를 막기 위한 방법인 보안 커널시스템을 제공하기 위한 방법을 제안하고 설계한다.

  • PDF

A study on Gunsan crime mapping system (군산 범죄예방 시스템에 관한 연구)

  • Han, Dong-Yup;On, Byung-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1638-1641
    • /
    • 2015
  • 최근 다양한 공공 데이터가 속속 개방되고 있지만, 지역 내의 범죄 데이터는 통계 데이터 이외에는 공개되지 않고 있다. 이처럼 공공 데이터의 확보가 어려운 경우에는 해당 지역 내의 범죄 관련 모든 온라인 뉴스 기사를 주기적으로 수집하고 범죄 현황에 관한 정보를 자동으로 추출하여 맵(map)에 시각화 하여 보여주는 프레임워크의 개발이 필요하다. 본 논문에서는 프레임워크 개발에 필요한 주요 알고리즘들과 효과적인 시각화 방안을 제안한다. 또한 이미 공개된 군산시의 범죄 발생 통계 자료를 비교하여 제안 시스템의 효용성을 평가한다.

A study on designing guidelines for Linked Open Data organization of national databases (공공데이터베이스의 Linked Open Data구축을 위한 가이드라인 설계)

  • Yi, Hyun-Jung;Nam, Young-Joon
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2012.08a
    • /
    • pp.63-68
    • /
    • 2012
  • 공공데이터베이스는 공무상의 활용뿐만 아니라 민간의 창의성과 결합할 경우 새로운 비즈니스와 일자리를 창출할 수 있는 잠재력을 가지고 있다. 미국과 영국 등 해외 주요국들은 공공정보 재사용의 가치를 깨닫고 공공데이터를 Linked Data화하는 작업을 진행하고 있다. Linked Data는 웹에서 자유롭게 데이터를 개방하여 연계할 수 있도록 하는 네트워크 기술이다. 본 고에서는 국내 공공정보의 개방과 재사용을 지원하기 위한 방안으로 Linked Data 구축을 제안하고, 이를 위해 데이터, 시스템, 서비스의 3가지 측면에서 표준화 방안을 제안하였다. 데이터 표준화 측면에서는 데이터 표현 및 접근에 관한 표준을 준수하고, 표준화된 데이터모델과 데이터구조에 대한 정보와 함께 완전하게 수요자 입장에서 배포해야 한다. 특히 데이터의 상용화나 재가공에 아무런 제약이 없는 완전한 공개를 원칙으로 해야 한다. 시스템 표준화 측면에서 Linked Data 플랫폼은 트리플 스토어, 원데이터의 트리플 변환기, 그리고 추론기로 구성되어야 한다. 서비스 표준화 측면에서는 Linked Data를 이용자에게 다양한 포맷으로 제공할 수 있는 인터페이스가 제공되어야 한다. 무엇보다도 공공정보의 공개와 재사용성을 위한 국가적 차원의 거버넌스와 지원이 마련되어야 공공정보의 Linked Data 플랫폼이 온전히 이루어질 수 있을 것이다.

  • PDF

A Study on the Sharing of Research Data in Library and Information Science Field (문헌정보학 분야 연구데이터 공유에 관한 연구)

  • Cho, Jane
    • Journal of the Korean Society for information Management
    • /
    • v.34 no.4
    • /
    • pp.59-79
    • /
    • 2017
  • This study analyzed the type, subject and open level of research data in the field of library and information science field shared by Figshare, and statistically analyzed the characteristics of data with relatively high recyclability. The results of the analysis showed that datasets and papers were most common data types, and open access and research data were the most common keywords of data, and that 70% of the data were published in a form that can not be processed mechanically such as pdf. As a result of analysis of the relationship between characteristics of research data and degree of sharing, open access areas such as APC (Article Processing Charge) were found to be most common in the subject. However in data type, gray literature such as paper found to be highly utilized rather than dataset.

Design of AOD System for MP3 Copyright Protection (MP3 저작권 보호를 위한 AOD 시스템의 설계)

  • Kim, Yeong-Jun;Kim, Tae-Yun
    • The KIPS Transactions:PartD
    • /
    • v.9D no.2
    • /
    • pp.323-328
    • /
    • 2002
  • In recent years, e-Commerce is very active on the Internet, especially the World Wide Web alone: with the popularization of Internet using high-speed networks. Especially, Circulation of Multimedia Contents like MP3 data if widely being focused as one of the popular researches. However, the existing models of AOD (Audio On Demand) System lack substantial illegal copy protection or copyright protection. In this paper, we propose an AOD System that guarantees substantial illegal copy protection and copyright protection based on the PKI (Public Key Infrastructure). As transmitting MP3 data using the user's public key, the proposed .method prevents the attack of dropper during transmitting data. Also, it guarantees the right of users and distributors by prohibiting illegal users from using MP3 data.

인터넷 보안과 보안 컨설팅

  • 안혜연
    • Proceedings of the Korea Database Society Conference
    • /
    • 2000.11a
    • /
    • pp.11-26
    • /
    • 2000
  • o 정보 보호란\ulcorner : 데이터 및 시스템을 고의적 혹은 실수에 의한 불법적인 공개(노출), 변조, 파괴 및 지체로부터의 보호. o 정보보호의 목표 - 비밀성 (Confidentiality)의 보장 - 무결성 (Integrity)의 보장 (중략)

  • PDF

Constructing Korean Dialogue Natural Inference Dataset through Pseudo Labeling (Pseudo Labeling을 통한 한국어 대화 추론 데이터셋 구축)

  • Young-Jun Lee;Chae-Gyun Lim;Yunsu Choi;Ji-Hui Lm;Ho-Jin Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.205-209
    • /
    • 2022
  • 페르소나 대화 시스템이 상대방의 개인화된 정보에 일관된 응답을 생성하는 것은 상당히 중요하며, 이를 해결하기 위해 최근에 많은 연구들이 활발히 이루어지고 있다. 그 중, PersonaChat 데이터셋에 대해 수반/중립/모순 관계를 라벨링한 DialoguNLI 데이터셋이 제안되었으며, 일관성 측정, 페르소나 속성 추론 태스크 등 여러 분야에 활용되고 있다. 그러나, 공개적으로 이용가능한 한국어로 된 대화 추론 데이터셋은 없다. 본 연구에서는 한국어로 번역된 페르소나 대화 데이터셋과 한국어 자연어 추론 데이터셋에 학습된 모델을 이용하여 한국어 대화 추론 데이터셋(KorDialogueNLI)를 구축한다. 또한, 사전학습된 언어모델을 학습하여 한국어 대화 추론 모델 베이스라인도 구축한다. 실험을 통해 정확도 및 F1 점수 평가 지표에서 KLUE-RoBERTa 모델을 미세조정(fine-tuning)시킨 모델이 가장 높은 성능을 달성하였다. 코드 및 데이터셋은 https://github.com/passing2961/KorDialogueNLI에 공개한다.

  • PDF

A Study on Librarians' Perception about Government 3.0 (정부 3.0에 대한 도서관 사서의 인식조사 연구)

  • Noh, Younghee
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.27 no.2
    • /
    • pp.51-80
    • /
    • 2016
  • Recently in accordance with Government 3.0 policy, public data is being released in large quantities and entrepreneurs are succeeding in utilizing this policy to develop products and apps that increase the convenience of the people to use the information. As libraries belong to the public domain, libraries must open a variety of data to the public in accordance with the Government 3.0 policy, and make the various applications utilizing the data. Therefore, this study investigated the government 3.0 Policy, classified the success cases of the applications according to specific criteria, identified data having high availability from the library data, and tried to discover data that can increase the utilization value through the library from other subject areas. An awareness survey was conducted of librarians of the University and Special Library and the results are as follows: First, librarians' awareness about the Government 3.0 was more than the average of 3.6, whereas for the initiatives presented in 3.0. Second, those responding that the government 3.0 policy would have a positive effect on libraries were six times higher than those responding negatively. Third, the respondents listed the ways that the policy can be effectively utilized in the library, in order, as providing to the user public open data classified by topic, providing user education about utilizing method of public open data, and privacy-related user education regarding open data utilization. Fourth, there was overall agreement by the respondents that public open data would be helpful in improving the library's changing role and image, with 60% responding in a positive way.

A Study on the Performance Improvement of Machine Translation Using Public Korean-English Parallel Corpus (공공 한영 병렬 말뭉치를 이용한 기계번역 성능 향상 연구)

  • Park, Chanjun;Lim, Heuiseok
    • Journal of Digital Convergence
    • /
    • v.18 no.6
    • /
    • pp.271-277
    • /
    • 2020
  • Machine translation refers to software that translates a source language into a target language, and has been actively researching Neural Machine Translation through rule-based and statistical-based machine translation. One of the important factors in the Neural Machine Translation is to extract high quality parallel corpus, which has not been easy to find high quality parallel corpus of Korean language pairs. Recently, the AI HUB of the National Information Society Agency(NIA) unveiled a high-quality 1.6 million sentences Korean-English parallel corpus. This paper attempts to verify the quality of each data through performance comparison with the data published by AI Hub and OpenSubtitles, the most popular Korean-English parallel corpus. As test data, objectivity was secured by using test set published by IWSLT, official test set for Korean-English machine translation. Experimental results show better performance than the existing papers tested with the same test set, and this shows the importance of high quality data.