• Title/Summary/Keyword: 콘텐츠 수집

Search Result 2,172, Processing Time 0.033 seconds

Building Casebase for the Content Analysis in Internet Community (인터넷 커뮤니티 콘텐츠 분석을 위한 사례베이스 구축)

  • Ko, Min Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.937-938
    • /
    • 2009
  • 인터넷의 대중화로 커뮤니티에 콘텐츠가 대량으로 생성되고 있고, 이들은 또 다른 측면의 여론으로 그 비중이 커져가고 있다. 이러한 변화에 기존에 구축된 웹 데이터베이스를 기준으로 생성된 인터넷 커뮤니티 콘텐츠를 처리하고자 할 경우, 새로이 생성된 언어와 패턴으로 인하여 분류 및 관리에 어려움이 많다. 본 연구는 이를 해결하기 위해서 실시간으로 웹로봇을 활용하여 새로운 사례와 데이터를 수집하고, 이를 사례별로 분류한 사례베이스를 구축하여 대량의 커뮤니티 콘텐츠 분석이 가능하다.

Intelligent Web Crawler for Supporting Big Data Analysis Services (빅데이터 분석 서비스 지원을 위한 지능형 웹 크롤러)

  • Seo, Dongmin;Jung, Hanmin
    • The Journal of the Korea Contents Association
    • /
    • v.13 no.12
    • /
    • pp.575-584
    • /
    • 2013
  • Data types used for big-data analysis are very widely, such as news, blog, SNS, papers, patents, sensed data, and etc. Particularly, the utilization of web documents offering reliable data in real time is increasing gradually. And web crawlers that collect web documents automatically have grown in importance because big-data is being used in many different fields and web data are growing exponentially every year. However, existing web crawlers can't collect whole web documents in a web site because existing web crawlers collect web documents with only URLs included in web documents collected in some web sites. Also, existing web crawlers can collect web documents collected by other web crawlers already because information about web documents collected in each web crawler isn't efficiently managed between web crawlers. Therefore, this paper proposed a distributed web crawler. To resolve the problems of existing web crawler, the proposed web crawler collects web documents by RSS of each web site and Google search API. And the web crawler provides fast crawling performance by a client-server model based on RMI and NIO that minimize network traffic. Furthermore, the web crawler extracts core content from a web document by a keyword similarity comparison on tags included in a web documents. Finally, to verify the superiority of our web crawler, we compare our web crawler with existing web crawlers in various experiments.

Development of Simulation Tool to Support Privacy-Preserving Data Collection (프라이버시 보존 데이터 수집을 지원하기 위한 시뮬레이션 툴 개발)

  • Kim, Dae-Ho;Kim, Jong Wook
    • Journal of Digital Contents Society
    • /
    • v.18 no.8
    • /
    • pp.1671-1676
    • /
    • 2017
  • In theses days, data has been explosively generated in diverse industrial areas. Accordingly, many industries want to collect and analyze these data to improve their products or services. However, collecting user data can lead to significant personal information leakage. Local differential privacy (LDP) proposed by Google is the state-of-the-art approach that is used to protect individual privacy in the process of data collection. LDP guarantees that the privacy of the user is protected by perturbing the original data at the user's side, but a data collector is still able to obtain population statistics from collected user data. However, the prevention of leakage of personal information through such data perturbation mechanism may cause the significant reduction in the data utilization. Therefore, the degree of data perturbation in LDP should be set properly depending on the data collection and analysis purposes. Thus, in this paper, we develop the simulation tool which aims to help the data collector to properly chose the degree of data perturbation in LDP by providing her/him visualized simulated results with various parameter configurations.

Consortium Service Using Automatic Collecting System of E-Journal Usage Statistics (전자저널 이용통계 자동수집기를 이용한 컨소시엄 서비스 방안)

  • Jung, Youngim;Kim, Jeong Hwan;You, Beom-Jong
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2011.05a
    • /
    • pp.39-40
    • /
    • 2011
  • 온라인 정보자원의 활용이 급속히 증가하면서, 정보자원 이용량에 대한 일관적이고 표준화된 통계 구축의 필요성에 대한 인식이 널리 확산되고 있다. 그러나 대부분의 도서관에서는 정보공급사로부터 이용통계를 수작업으로 수집하고, 정보공급사별로 상이한 통계 보고서를 재가공하여 분석하기에는 많은 어려움이 따른다. 본 논문에서는 전자정보 컨소시엄에 참가하는 개별 도서관을 대신하여 컨소시엄 주관기관에서 각 정보공급사별 이용통계를 자동으로 통합 수집하여 표준화된 포맷으로 구축하고, 이를 다양한 형태와 정보로 재가공하여 서비스 방안을 제안하였다.

  • PDF

A Case Study on Methods Using Union Catalog for Journal Collection Policy (학술지 수집을 위한 종합목록 활용 사례 연구)

  • Lee, Hye-jin;Kim, Hye-sun;Kim, Wan-jong
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2007.11a
    • /
    • pp.371-375
    • /
    • 2007
  • Korea's information dependency on the foreign information is high and the domestic information production volume absolutely insufficient. So, research and academic library will select information resources through the limited budget and back up the research and development. This paper propose methods using union cataloging for effective journal collection development through a case study on the OCLC Collection Analysis system and Ulrich Serials Analysis System(USAS).

  • PDF

A Study on Construction Method of Foreign Scientific Database by Utilizing Available Information Resources (가용자원을 활용한 해외학술정보 데이터베이스제작방법에 관한 연구)

  • 노경란;권오진
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2003.05a
    • /
    • pp.323-326
    • /
    • 2003
  • There are marv problems in conventional database Construction of foreign scientific journal from material aquisition to DB loading. This paper's purpose is to design database construction model which utilizes available information resources scattered several locations and uses agents technology to gather essential metadata efficiently. This paper describes component informations of foreign scientific database and related available resources. And it describes a process of DB construction that include metadata gathering method, automatic metadata classification method, and metadata quality monitoring method.

  • PDF

Factor Affecting Psychological Well-Being in Nursing Students (간호대학생의 심리적 안녕감에 미치는 영향)

  • Kang, Mi Kyung
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2018.05a
    • /
    • pp.387-388
    • /
    • 2018
  • 본 연구는 간호대학생의 신체화 증상, 학업 탄력성이 심리적 안녕감의 영향 요인을 탐색하기 위한 양적 조사연구이다. 자료수집은 2017년 12월부터 2018년 2월 까지 259명의 간호 대학생들로부터 수집된 구조화 된 설문지를 통해 조사하였다. 수집된 자료는 SPSS/WIN 22.0을 사용하여 분석하였고 빈도와 백분율, 평균과 표준편차, t-test, ANOVA, Pearson's correlation, Multiple regression으로 분석하였다. 심리적 안녕감은 신체화 증상과 유의한 부적 상관관계(r=-.435, p<.000)를 보였고, 학업탄력성과 유의한 정적 상관관계(r=.773, p<.000)를 보였다. 심리적 안녕감의 예측 요인으로는 신체화증상(${\beta}=-4.745$, p<.000)과 학업탄력성(${\beta}=16.746$, p<.000)으로 나타났으며, 모형의 설명력은 66.8%로 나타났다. 이러한 결과를 바탕으로, 간호 대학생의 삶의 질을 향상시키기 위해서는 신체적 증상과 학업 탄력성 향상에 초점을 맞춘 효과적인 심리적 안녕감 증진 프로그램을 제언한다.

  • PDF

A Study on the Construction of Food-Oriental Medicine Integration Data (식품-한의 융합 식치 데이터 구축 연구)

  • Kim, yu-jin;Jang, dai-ja
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.271-272
    • /
    • 2019
  • 4차 산업시대로의 진입과 함께 인구 고령화 현상이 지속되면서 정보, 의료, 식품 분야 등의 역할이 중요해지고 있다. 특히 건강한 삶을 영위하기 위해 식품과 의료가 융합한 식치 정보에 대한 사람들의 관심과 필요성이 증가하고 있는 것에 비해 이에 대한 연구는 부족한 실정이다. 따라서 본 연구는 식품과 한의 정보를 수집하고 융합하여 식품 또는 식재료의 영양, 성질, 효능, 질병 등이 결합된 하나의 식치 데이터를 시스템 상으로 구축하고자 하였다. 이를 위해 고조리서, 한의서, 역사서 등의 고문헌과 논문, 특허 등의 현대 과학적 연구 자료를 수집하였으며, 수집된 자료들을 일정 기준에 따라 분류하고 코드화 하였다. 이후 정제된 각각의 데이터들 간의 연관성을 파악하고 연결 지어 식품과 한의 정보가 통합된 하나의 새로운 식치 데이터를 구축하였다.

  • PDF

Sign Image Database Collected at Jeonju Hanok Village (전주 한옥마을에서 수집한 간판영상 데이터베이스)

  • Oh, Il-Seok;Heo, Gi-Su
    • The Journal of the Korea Contents Association
    • /
    • v.6 no.11
    • /
    • pp.243-248
    • /
    • 2006
  • Recognition of sign has been studied to provide convenience tour information for foreigners and strangers through automatic recognition of sign. The sign image database is essential to training the classifier and to intuitive measurement of performance. In this paper, we described the sign image database collected at Jeonju Hanok Village. As to 45 each other sign image, corresponding 50 images are collected under several condition. This database could be important content to study for the field of pattern recognition.

  • PDF

A Synthetic Proposal of Technical Blocking Method Based on the Harmful Internet Contents Access (유해컨텐츠 접속 동기에 기초한 기술적 차단 방법의 종합적 제시)

  • Cho, Dong Uk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.645-648
    • /
    • 2004
  • 본 논문은 유해콘텐츠를 접속하는 동기를 통하여 이를 효과적으로 차단하기 위한 전체적 방법에 대한 제시를 행하고자 한다. 이를 위해 첫째, 인터넷 유해 콘텐츠의 접속 동기를 분석한다. 또한 인터넷 유해 콘텐츠를 접속하는데 있어 가장 큰 요소인 스팸메일에 대해 실태 파악 및 분석을 행하고자 한다. 이를 위해 우선적으로 스팸메일이 증가하는 이유, 스팸메일 발송자가 전자우편을 수집하는 방법 그리고 각종 스팸메일 방지 방안 및 스팸 방지 기술에 대해 기술하고자 한다. 또한 수신측에서 행해지고 있는 스팸메일 차단에 대해 여과를 안 하는 이유 등에 대해 조사함으로써 스팸메일 차단에 대한 연구 방향을 잡기 위한 기초 자료로 삼고자 하며 이를 기초로 이메일을 수집 단계에서부터 차단이 이루어 지게 하기 위한 종합적 차단 방법에 대해 제안하고자 한다.

  • PDF