• Title/Summary/Keyword: news Web

Search Result 250, Processing Time 0.025 seconds

Text Mining and Visualization of Papers Reviews Using R Language

  • Li, Jiapei;Shin, Seong Yoon;Lee, Hyun Chang
    • Journal of information and communication convergence engineering
    • /
    • v.15 no.3
    • /
    • pp.170-174
    • /
    • 2017
  • Nowadays, people share and discuss scientific papers on social media such as the Web 2.0, big data, online forums, blogs, Twitter, Facebook and scholar community, etc. In addition to a variety of metrics such as numbers of citation, download, recommendation, etc., paper review text is also one of the effective resources for the study of scientific impact. The social media tools improve the research process: recording a series online scholarly behaviors. This paper aims to research the huge amount of paper reviews which have generated in the social media platforms to explore the implicit information about research papers. We implemented and shown the result of text mining on review texts using R language. And we found that Zika virus was the research hotspot and association research methods were widely used in 2016. We also mined the news review about one paper and derived the public opinion.

Transformation scheme of web contents using XSL (VoiceNews: XSL을 이용한 웹 컨텐츠 변환기법)

  • 김원철;황인준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10c
    • /
    • pp.592-594
    • /
    • 2003
  • 무선 단말기의 보급과 네트워크 기술의 발전은 무선 단말기를 이용한 인터넷 접속을 증가시키고 있다. 그러나 대부분의 웹 페이지들이 데스크탑에 최적화 되어 있어 무선 단말기를 이용하여 사용자가 원하는 부분에 접근하기까지 반복적인 스크롤링을 해야하는 불편한 점이있다. 기존의 대부분 연구들이 웹페이지를 요약하는 기법을 제안하였지만, 대부분의 웹 페이지들은 한 페이지에 세분화된 섹션과 많은 내용을 담고 있기 때문에 제한된 화면과 입력장치를 가진 무선단말기에 대한 최적화된 해결책이라고 할 수 없다. 이런 문제점을 해결하기 위해 본 논문에서는 웹의 뉴스 페이지내의 뉴스의 섹션을 추출하고. 무선 환경에 적합하도록 VoiceXML형태로 변환해 주는 기법을 제안한다. 본 논문에서 제안된 기법을 통해 사용자는 무선 단말기의 각종 단점을 극복함과 동시에 뉴스에서 선호하는 섹션의 맞춤형 뉴스 서비스를 제공받을 수 있다.

  • PDF

A Study on Document Filtering Using Naive Bayesian Classifier (베이지안 분류기를 이용한 문서 필터링)

  • Lim Soo-Yeon;Son Ki-Jun
    • The Journal of the Korea Contents Association
    • /
    • v.5 no.3
    • /
    • pp.227-235
    • /
    • 2005
  • Document filtering is a task of deciding whether a document has relevance to a specified topic. As Internet and Web becomes wide-spread and the number of documents delivered by e-mail explosively grows the importance of text filtering increases as well. In this paper, we treat document filtering problem as binary document classification problem and we proposed the News Filtering system based on the Bayesian Classifier. For we perform filtering, we make an experiment to find out how many training documents, and how accurate relevance checks are needed.

  • PDF

A Study on Classifying and Analyzing the News Form in the Web for Automatic Summarization (자동 요약을 위한 웹 기사들의 유형 구분과 주연문맥 추출에 관한 연구)

  • Lee Tae-Young
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2006.08a
    • /
    • pp.169-174
    • /
    • 2006
  • 웹 상의 기사들의 종류를 보도, 기획/해설, 인터뷰/대담, 논설, 신변잡기로 나누어 자동요약을 위한 프레임을 작성하였다. 각 기사 프레임들은 글 구조적으로 분석되어 '사건, 상황, 연관, 과정, 원인, 결과, 결론, 전망, 방안, 평가 등'과 같은 문단 슬롯이 부여되었고 문단 슬롯은 다시 문장 슬롯으로 세분되었다. 'if-needed' 패싯으로 육하원칙인 '주체, 객체, 시간, 장소, 원인, 방법'을 택하였다. 슬롯이나 패싯의 실제값들을 추출 표현하는 과정에서 문구의 수사적 역할과 단어 최상위 범주 및 줄거리 단위를 참조하였다. 기사의 유형과 문단 및 문장 슬롯을 판별하기 위해서 유형 판별 규칙과 슬롯 판별 규칙을 구비하였다.

  • PDF

A Study on the Toxic Comments Classification Using CNN Modeling with Highway Network and OOV Process (하이웨이 네트워크 기반 CNN 모델링 및 사전 외 어휘 처리 기술을 활용한 악성 댓글 분류 연구)

  • Lee, Hyun-Sang;Lee, Hee-Jun;Oh, Se-Hwan
    • The Journal of Information Systems
    • /
    • v.29 no.3
    • /
    • pp.103-117
    • /
    • 2020
  • Purpose Recently, various issues related to toxic comments on web portal sites and SNS are becoming a major social problem. Toxic comments can threaten Internet users in the type of defamation, personal attacks, and invasion of privacy. Over past few years, academia and industry have been conducting research in various ways to solve this problem. The purpose of this study is to develop the deep learning modeling for toxic comments classification. Design/methodology/approach This study analyzed 7,878 internet news comments through CNN classification modeling based on Highway Network and OOV process. Findings The bias and hate expressions of toxic comments were classified into three classes, and achieved 67.49% of the weighted f1 score. In terms of weighted f1 score performance level, this was superior to approximate 50~60% of the previous studies.

Case Study for RFID Applications from Business Model Perspective (RFID 응용 사례 연구 : 비즈니스 모델 관점)

  • Joung, Seok-In;Kim, Dae Shik
    • Journal of Information Technology Applications and Management
    • /
    • v.20 no.1
    • /
    • pp.197-216
    • /
    • 2013
  • Despite the vast potential opportunities of RFID technology in various industrial applications, deployment of RFID applications is rather limited to meet a large industrial demand in Korea. We conducted in-depth case study to organize the RFID applications in business model framework in order to provide practical insights for the development of innovative RFID applications. Throughout extensive searching for RFID applications in literature, web, news, and policy reports, we first classified passive RFID applications, mobile RFID applications, and active RFID applications. Value creation and implementation issues are compared and analyzed for each of RFID applications using Afuah and Tucci business model. This study can contribute in establishing future development of RFID technology, competitive business strategy, and government policy to stimulate Korea RFID industry.

Multi-Screen Saver For Displaying Various Search Result Defined By User (사용자가 정의한 다양한 웹 정보를 출력하는 멀티-스크린 세이버)

  • Na, Sang-Yeob
    • Journal of the Korea Computer Industry Society
    • /
    • v.10 no.3
    • /
    • pp.93-98
    • /
    • 2009
  • In this paper, Implement Multi-Screensaver for displaying various search result defined by user. This screens aver can display useful information by convergence web and traditional screens aver concepts. User of this screensaver can define display information when the screensaver is working, like news articles, weather information and movie etc. Therefore, user can obtain the interested information when the computer is idle, i.e. Screensaver is working.

  • PDF

A Semantic Web-based Personalized News Service Using Dynamic Profiles (동적 프로파일을 이용한 시맨틱 웹 기반의 맞춤 뉴스 서비스)

  • Choo, Eun-Ha;Jang, Eun-Sill;Lee, Yong-Kyu
    • Annual Conference of KIPS
    • /
    • 2005.05a
    • /
    • pp.877-880
    • /
    • 2005
  • 기존의 뉴스 서비스는 정적 프로파일을 사용하여 고정된 관심분야 만을 서비스하기 때문에 관심이 바뀌었을 경우에는 이를 쉽게 반영하지 못하는 문제점이 있다. 따라서 본 논문에서는 이러한 문제점을 해결하기 위하여 프로파일을 동적으로 관리하여 개인의 관심이 바뀌어가는 것을 바로 반영할 수 있도록 하고, 정보 간의 의미를 파악하여 관련 정보를 쉽게 찾을 수 있도록 도와주는 시맨틱 기술을 적용한 맞춤 뉴스 서비스 시스템을 설계 및 구현한다. 그 결과, 사용자의 변화된 관심에 따른 맞춤 뉴스 서비스를 제공할 수 있다.

  • PDF

Design and Implement of News Retrieval System based on User's Location (사용자 위치 기반 뉴스 검색 시스템의 설계 및 구현)

  • Kwon, Sun-Ock;Park, Chan;Jeong, Ji-Seong;Kim, Jong-Oh;Kim, Do-Hyeong;Park, Jin-A;Kwon, Sin-Ae;Ju, Seong-Yeon;Yoo, Kwan-Hee
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2012.05a
    • /
    • pp.73-74
    • /
    • 2012
  • 스마트 폰에 탑재된 기능들이 다양한 분야에서 활용되고 있으며 사용자는 스마트폰의 위치정보 서비스를 통하여 주변의 여러 정보를 손쉽게 접근 할 수 있게 되었다. 그러나 국내에서는 뉴스와 위치 정보 서비스를 결합하여 뉴스 정보를 제공해주는 프로그램이 거의 없는 현실이다. 본 논문에서는 스마트폰과 웹 서버(Web Server)간의 위치 정보와 뉴스 정보를 서로 통신하여 주고받아 스마트폰 사용자에게 주변의 뉴스기사를 제공해주는 어플리케이션 시스템을 제안한다.

  • PDF

Domain Adaptation for Opinion Classification: A Self-Training Approach

  • Yu, Ning
    • Journal of Information Science Theory and Practice
    • /
    • v.1 no.1
    • /
    • pp.10-26
    • /
    • 2013
  • Domain transfer is a widely recognized problem for machine learning algorithms because models built upon one data domain generally do not perform well in another data domain. This is especially a challenge for tasks such as opinion classification, which often has to deal with insufficient quantities of labeled data. This study investigates the feasibility of self-training in dealing with the domain transfer problem in opinion classification via leveraging labeled data in non-target data domain(s) and unlabeled data in the target-domain. Specifically, self-training is evaluated for effectiveness in sparse data situations and feasibility for domain adaptation in opinion classification. Three types of Web content are tested: edited news articles, semi-structured movie reviews, and the informal and unstructured content of the blogosphere. Findings of this study suggest that, when there are limited labeled data, self-training is a promising approach for opinion classification, although the contributions vary across data domains. Significant improvement was demonstrated for the most challenging data domain-the blogosphere-when a domain transfer-based self-training strategy was implemented.