• 제목/요약/키워드: Web News

검색결과 247건 처리시간 0.022초

기자직의 웹 정보탐색행위 패턴 분석 (Analyzing Patterns in News Reporters' Information Seeking Behavior on the Web)

  • 권혜진;정동열
    • 정보관리학회지
    • /
    • 제27권4호
    • /
    • pp.109-130
    • /
    • 2010
  • 본 연구의 목적은 기자직의 웹 행동 분석을 통해 웹 정보탐색행위 패턴의 특성을 규명하는 것이다. 이를 위해 본 연구는 기자직 23명을 대상으로 트랜잭션로그를 수집하여 분석하였다. 데이터 수집을 위하여 분석 대상의 컴퓨터에 웹 트래킹 소프트웨어를 설치하였으며, 2주 동안 총 39,860개의 웹 로그가 수집되었다. 세션의 시작과 종료 패턴, 단계별 이행 패턴, 순차규칙 모형이 분석되었으며, 기자직과 일반인의 웹 이용 패턴을 비교하였다. 이를 토대로 기자직의 웹 정보탐색행위 패턴을 사실확인형 탐색, 사실확인형 검색, 조사형 탐색, 조사형 검색 등 4가지 형태로 유형화하였다.

Grammatical Structure Oriented Automated Approach for Surface Knowledge Extraction from Open Domain Unstructured Text

  • Tissera, Muditha;Weerasinghe, Ruvan
    • Journal of information and communication convergence engineering
    • /
    • 제20권2호
    • /
    • pp.113-124
    • /
    • 2022
  • News in the form of web data generates increasingly large amounts of information as unstructured text. The capability of understanding the meaning of news is limited to humans; thus, it causes information overload. This hinders the effective use of embedded knowledge in such texts. Therefore, Automatic Knowledge Extraction (AKE) has now become an integral part of Semantic web and Natural Language Processing (NLP). Although recent literature shows that AKE has progressed, the results are still behind the expectations. This study proposes a method to auto-extract surface knowledge from English news into a machine-interpretable semantic format (triple). The proposed technique was designed using the grammatical structure of the sentence, and 11 original rules were discovered. The initial experiment extracted triples from the Sri Lankan news corpus, of which 83.5% were meaningful. The experiment was extended to the British Broadcasting Corporation (BBC) news dataset to prove its generic nature. This demonstrated a higher meaningful triple extraction rate of 92.6%. These results were validated using the inter-rater agreement method, which guaranteed the high reliability.

기자직의 웹 정보탐색행위 연구 (A Study on News Reporters' Information Seeking Behavior on the Web)

  • 권혜진;정동열
    • 한국문헌정보학회지
    • /
    • 제45권2호
    • /
    • pp.325-344
    • /
    • 2011
  • 본 연구의 목적은 기자직의 웹 정보탐색행위의 전반적 현황을 조사하고, 정보요구, 선호 정보원, 정보기술과 인터넷 이용, 만족도의 특성을 형성하는 변인과의 관련성을 분석하는데 있다. 이를 위해 본 연구는 일간지, 주간지, 월간지, 인터넷 신문 등 국내 신문사에 소속된 205명의 취재기자를 대상으로 설문 조사를 수행하였다. 기자직의 웹 정보탐색 주요 목적은 간단한 사실 확인과 전반적인 배경 정보 수집이었으며, 기자직의 정보요구에 대한 특성은 직책과 매체종류, 인터넷친밀도와 밀접한 관련성이 있는 반면 성별, 연령, 취재분야, 경력과는 관련성이 낮은 것으로 나타났다.

웹 뉴스의 기사 추출과 요약 (Text Extraction and Summarization from Web News)

  • 한광록;선복근;유형선
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-10
    • /
    • 2007
  • 뉴스 콘텐츠 등 웹을 통해 제공되는 많은 정보들은 불필요한 클러터를 많이 포함하고 있다. 이러한 클러터들은 문서의 요약, 추출, 검색과 같은 자동화된 정보처리 시스템의 구축을 어렵게 한다. 본 논문에서는 웹 뉴스 콘텐츠를 추출하고 이를 요약하는 시스템을 구축하고자 한다. 추출 시스템은 HTML로 된 뉴스 콘텐츠를 입력받아 DOM 트리와 유사한 요소 트리를 구축하며, 이 요소 트리에서 HTML 태그의 하이퍼링크 속성을 갖는 클러터를 제외하면서 본문을 추출한다. 추출 시스템을 통해 추출된 본문은 요약시스템으로 전달되어 핵심 문장이 추출된다. 요약 시스템은 공기관계 그래프를 이용하여 구성한다. 본 논문에서 구현한 시스템을 통해 추출된 요약 문장은 SMS와 같은 메시지 서비스를 통하여 PDA이나 모바일 폰 등에 전송될 수 있을 것으로 기대된다.

  • PDF

Design and Adaptation for Internet News Data Extraction Middleware(INDEM) System

  • Sun, Bok-Keun
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.55-62
    • /
    • 2016
  • In this paper, we propose the INDEM(Internet News Data Extraction Middleware) system for the removal of the unnecessary data in internet news. Although data on the internet can be used in various fields such as source of data of IR(Information Retrieval), Data mining and knowledge information service, it contains a lot of unnecessary information. The removal of the unnecessary data is a problem to be solved prior to the study of the knowledge-based information service that is based on the data of the web page. The INDEM system parses html and explores the XPath, and it is to perform the analysis. The user simply utilize INDEM by implementing an abstract class that provides INDEM, and can obtain the analysis information. INDEM System through this process delivers the analysis information including the main contents of news site to the users. In this paper, the INDEM system was adapted in a stand-alone and web service system and it was evaluated on the basis of 16 news site. As a result, performance of the INDEM system is affected in html source data size and complexity of used html grammar than the main news data size.

온라인 뉴스 댓글에 나타난 뉴스 이용자들의 이념적 성향에 관한 연구: 포털과 언론사닷컴의 20대 대선 관련 뉴스기사를 중심으로 (A Study of Users' Ideological Propensity in the Comments of Online News: Focusing upon the Stories of the Web Portal Sites and the Press Website News Related to the 20th presidential Election)

  • 박광순;안종묵
    • 산업융합연구
    • /
    • 제20권12호
    • /
    • pp.135-143
    • /
    • 2022
  • 본 연구는 포털뉴스와 언론사닷컴 뉴스댓글에 나타난 이용자들의 정치이데올로기 성향이 어떠한지를 살펴보기 위해 실시되었다. 이 같은 분석결과를 통해 포털뉴스와 언론사닷컴뉴스는 물론, 이들 뉴스를 이용하는 유권자들의 정치성향을 파악할 수 있었다. 본 연구에 필요한 자료 수집은 선거일 전 약 90일간 174개의 뉴스기사 댓글을 대상으로 이루어졌다. 분석은 네이버뉴스와 다음뉴스, 더불어민주당과 국민의힘, 언론사닷컴뉴스와 네이버뉴스 간 비교를 위해 t-test 기법으로 실시되었다. 분석결과 네이버뉴스 댓글은 보수정당 후보에 대한 긍정적인 내용의 비율이 더 높은 반면, 다음뉴스 댓글은 진보정당 후보에 대한 긍정적인 내용의 비율이 더 높았다. 따라서 네이버뉴스는 정치적으로 보수성향 이용자들이 더 많이 이용하는 반면, 다음뉴스는 진보성향 이용자들이 더 많이 이용하고 있다는 것을 알 수 있었다.

키워드 분석을 이용한 개인화 모바일 웹 뉴스 컨텐츠 생성에 관한 연구 (A Study on Personalized Mobile Web News Contents Creation using Keyword Analysis)

  • 한승현;임영환
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.277-285
    • /
    • 2007
  • 본 연구에서는 웹 뉴스 채널 컨텐츠의 키워드 분석을 이용한 개인화된 모바일 웹 컨텐츠 생성 방법에 대해 제안한다. 기존의 웹 사이트의 뉴스기사 검색에서 제공하는 RSS와 연계된 웹 컨텐츠에서 빠르게 데이터를 획득하고, 키워드 분석을 통한 개인화 기법을 적용하여 컨텐츠를 필터링한다. 제안한 방법을 사용함으로써 수많은 뉴스 채널에서 보다 빠르고 쉽게 모바일용 웹 컨텐츠를 생성할 수 있어 컨텐츠 제작비용을 줄일 수 있다. 또한 키워드 분석을 이용하여 무선 인터넷 사용자들의 보다 세밀한 관심영역에 대응할 수 있으며 컨텐츠 필터링과 컨텐츠 접근에 대한 만족도를 향상시킬 수 있다.

  • PDF

미래뉴스 서비스를 위한 사용자 경험조사 - 패션 뉴스를 중심으로 (Proposal of Future News Service - Focusing of Fashion News)

  • 조현희;이유영;류한영
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.907-910
    • /
    • 2009
  • 인터넷이 발전하면서 뉴스는 종이에서 웹으로 확장되었다. 그리고 이러한 확장은 새로운 기술로 발달하는 웹과 함께 뉴스를 더욱 새로운 형식을 갖추게 할 것으로 예상된다. 본 연구는 이러한 변화를 바탕으로 발전할 뉴스의 미래에 대한 사용자 경험조사를 하고자 진행되었다. 뉴스는 일반인에게 아직 알려지지 않은 소식을 일컫는 것으로, 우리들 삶속에 공존한다. 따라서 뉴스는 사용자의 일상생활에 적극 활용될 때 그 의미가 있다. 본 연구는, 문헌조사를 통해 현재 뉴스 컨텐츠 분야 16개를 알아보았다. 그리고 그중 일상과 관련된 8가지 항목을 선정한 후, 연구의 사례로서 일상생활 속에서의 패션뉴스에 대한 사용자 경험을 조사하였다. 조사결과, 패션뉴스를 접하게 되는 사용자 니즈가 인터페이스-플랫폼-컨텐츠 항목으로 분류될 수 있었으며, 이 항목을 통하여, 미래 패션뉴스 서비스의 사용자 니즈를 알 수 있었다.

  • PDF

바람직한 웹마케팅의 방향과 웹광고 성과에 관한 연구 (A study on sustainable direction of web-marketing and web-advertising performance)

  • 강인원;조은선
    • 통상정보연구
    • /
    • 제17권1호
    • /
    • pp.3-28
    • /
    • 2015
  • 이용자의 집중을 이끌기 위한 웹광고의 자극들이 증가하는 가운데, 웹광고들이 오히려 이용자의 웹활동을 방해하는 경우가 많아졌다. 하지만 이용자들이 웹광고를 회피할수록 기업은 더욱 자극적인 광고로 이용자의 집중을 이끌고자 노력하고 있어 과연 기업이 원하는 웹광고 성과를 달성할 수 있을지에 대한 의문이 가중되고 있다. 이에 본 연구는 웹광고의 자극요소들이 웹광고에 대한 이용자의 태도와 이후 웹광고 성과에 이르는 과정을 살펴보았다. 연구결과, 웹광고의 과도한 자극이 오히려 웹광고와 해당 웹사이트에 대한 부정적인 성과를 초래할 수 있으며, 웹광고의 유용성 및 유희성에 의해 웹광고의 설득수준이 높아짐을 확인할 수 있었다. 또한, 웹사이트의 특성에 따라 인터넷신문 사이트와 전자상거래 사이트에서의 웹광고 자극과 그에 대한 성과의 차이를 비교 분석하였다. 그 결과, 전자상거래 사이트보다도 인터넷신문 사이트에서의 광고 자극이 더욱 침입성과 혼란성이 높아 웹사이트를 회피하게 됨을 확인할 수 있었다. 이러한 연구결과를 바탕으로 본 연구는 기업이 기대하는 성과를 얻을 수 있고 이용자의 편익도 증진할 수 있는 바람직한 웹마케팅의 방향을 논의하고자 한다.

  • PDF

퍼지 연관규칙을 이용한 뉴스레터 시스템 설계 및 구현 (Design AND IMPLEMENTATION of A News letter system using fuzzy association rules)

  • 정연홍;박우수;박규석
    • 인터넷정보학회논문지
    • /
    • 제3권5호
    • /
    • pp.41-49
    • /
    • 2002
  • 웹 마이닝은 World Wide Web으로부터 유용한 정보를 발견하고 분석하는 일로 정의 할 수 있다. 본 논문에서는 이러한 웹 마이닝을 통하여, 사용자 접근 페이지(성향)를 분석하고, 사용자에게 유용한 정보를 제공할 수 있는 시스템을 구축 하였다. 제안 시스템은 웹 사이트를 방문한 사용자의 행동과 발송된 뉴스레터로부터의 행동에 따른 정보를 조사하고 필터링을 통해 카테고리별로 분류과정을 거친다. 이러한 과정을 통해 생성된 각 카테고리에 대해 최근에 접근한 사용자들에 퍼지 연관규칙 (fuzzy association rules)을 적용하며, 이렇게 생성된 집합과 각 사용자가 접근한 페이지들의 집합을 비교하여 각 사용자에게 적합한 뉴스레터를 발송할 수 있다.

  • PDF