• 제목/요약/키워드: News Article Recommendation

검색결과 9건 처리시간 0.023초

온라인 뉴스 가치 평가 및 개인화 기법 (A Method for Evaluating Online News Value and Personalization)

  • 최광선;김수동
    • 한국산학기술학회논문지
    • /
    • 제16권12호
    • /
    • pp.8195-8209
    • /
    • 2015
  • 본 논문의 연구 목표는 뉴스 가치 평가에 근거한 중요 뉴스 자동 추천 및 개인화 방안을 제시하는 데에 있다. 뉴스 가치 평가는 전통적인 오프라인 신문에서 편집장들이 1면 뉴스를 선정할 때 사용하는 접근법으로 본 논문에서는 이를 시스템적으로 구현하는 방안을 제시한다. 이렇게 함으로써 콘텐츠 주제에 대한 전통적인 개인 선호 성향과는 다르게 뉴스의 사회적 가치에 대한 관심 성향을 기준으로 중요 뉴스를 선별할 수가 있다. 뉴스의 사회적 가치는 지면 신문의 기존 연구에서 제시한 사회적 중요도, 새로운 볼거리, 수용자 관련성, 인간적 흥미 4가지 기준을 준용하였고, 본 연구에서는 이를 시스템적으로 적용하기 위한 절차적, 구조적 방안을 도출하였다. 중요 뉴스의 선별 과정은 뉴스의 가치 평가를 위한 과정과 평가된 결과를 개인화하는 과정으로 구성된다. 실험을 통해 특정 시점에서의 각 온라인 뉴스 서비스들의 중요 뉴스들과 본 논문에서 제시한 기법을 통해 선별된 중요 뉴스들에 대한 사용자 만족도를 비교 평가하여 본 연구에서 제안하는 방법이 더 효과적임을 확인하였다.

Prediction of Stock Returns from News Article's Recommended Stocks Using XGBoost and LightGBM Models

  • Yoo-jin Hwang;Seung-yeon Son;Zoon-ky Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.51-59
    • /
    • 2024
  • 투자자는 수익의 극대화를 위해 언론사의 기사를 포함한 다양한 정보를 활용하여 투자 전략을 수립한다. 이에 국내 언론사에서도 신뢰도 있는 투자정보를 제공하기 위해, 애널리스트의 종목분석 보고서에 기초한 종목 추천기사를 게재하고 있다. 본 연구에서는 종목 추천기사 게재를 하나의 사건(event)으로 간주하고, XGBoost와 LightGBM 모델을 활용하여 기사 게재 10일 이후 가격의 상승 또는 하락을 예측하는 분류 모델을 제시한다. 또한, 전체 추천종목을 유가증권시장과 코스닥 시장 및 기업규모(대형/소형)에 따라 4가지로 분류하고, 하위 그룹에 따라 모델의 예측 정확도에 차이가 있는지 파악하고자 한다. 학습 결과 전체 모델의 분류 정확도는 XGBoost 75%, LightGBM 71%로 나타났고, 예측 정확도는 유가증권 시장 예측력이 코스닥시장 주식 대비 높게 나타났으며, 대형주의 예측력이 소형주 보다 높게 나타났다. 마지막으로, SHAP(Shapley Additive exPlanations) 분석을 통해 개별 모델의 예측에 중요한 변수를 살펴보고 모델의 해석력을 제고하였다.

지능형 온라인 뉴스 추천시스템 개발을 위한 체계적 속성간 상대적 중요성 분석: PWYW 지불모델을 중심으로 (An Analysis of the Comparative Importance of Systematic Attributes for Developing an Intelligent Online News Recommendation System: Focusing on the PWYW Payment Model)

  • 이형주;정누리;양성병
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.75-100
    • /
    • 2018
  • 최근 웹툰, 음원, 동영상, 게임, 교육, 앱 등 많은 콘텐츠 기업에서 콘텐츠 유료화 정책을 추진하고 있으나, 무료 콘텐츠에 익숙한 독자들의 문화적 관성이 온라인 콘텐츠의 유료화 전환에 많은 어려움을 주고 있다. 특히 온라인 뉴스 콘텐츠는 포털 사이트를 통해 무료로 배포되고 있어 유료화에 대한 독자들의 거부감이 다른 온라인 콘텐츠 보다 더욱 심한 실정이다. 이러한 문제 해결을 위해 학계 및 산업계에서 온라인 콘텐츠의 유료화 방안에 대한 연구가 다양한 차원에서 진행되었다. 최근에는 일부 온라인 뉴스 매체를 중심으로 독자들이 자발적으로 마음에 드는 뉴스 콘텐츠에 대해 원하는 만큼의 구독료를 지불하게 하는 Pay-What-You-Want (PWYW) 지불모델을 적용하는 시도가 이뤄지고 있다. 이에 본 연구는 PWYW 모델의 성공적인 정착을 위한 선결요인으로 독자의 자발적 독자구독료 지불행위에 영향을 미치는 온라인 뉴스 콘텐츠의 체계적 속성을 도출하고, 각 속성 및 하위 속성의 상대적 중요도를 비교 분석하였다. 좀 더 구체적으로, 선행연구 분석을 통해 기사제목 유형, 기사 이미지 자극성, 기사 가독성, 기사 유형, 기사 지배적 정서, 기사 내용-이미지 유사성 등 총 여섯 가지의 온라인 뉴스 콘텐츠의 체계적 속성을 도출하였으며, 내용분석(content analysis)을 통해 각 기사의 속성값을 측정하고 이를 기반으로 컨조인트 분석(conjoint analysis)을 실시하여 속성 간 상대적 중요도를 계산 및 검증하였다. PWYW 모델이 적용된 온라인 뉴스 콘텐츠 379개에 대한 컨조인트 분석 결과, 기사 가독성, 기사 내용-이미지 유사성, 기사제목 유형 등의 순으로 자발적 독자구독료에 큰 영향을 주는 것으로 분석된 반면, 기사 유형, 기사 지배적 정서, 기사 이미지 자극성 등은 상대적으로 낮은 중요도를 보이는 것으로 조사되었다. 본 연구는 내용분석과 컨조인트 분석을 동시에 실시하여 온라인 뉴스 콘텐츠에 대한 자발적 지불의도에 영향을 미치는 체계적 요인을 도출하고, 그 상대적 중요도까지 살펴보았다는 점에서 학술적 의의가 있으며, 온라인 뉴스 콘텐츠 제작자 및 사이트 운영자들로 하여금 독자들의 자발적 지불을 유도할 수 있는 가이드라인을 제시하였다는 점에서 그 실무적 의의가 있다.

스마트폰 환경에서 기사 읽기 습관 고려한 뉴스 추천 시스템 설계 및 구현 (Design and Implementation of Personalized News Recommendation System Considering User Reading Habit under Smartphone Environment)

  • 송특섭
    • 한국정보통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.1628-1633
    • /
    • 2014
  • 본 연구는 스마트폰환경에서 사용자의 관심주제와 읽기습관을 분석하여 읽기 습관을 분석하여 관심 있는 뉴스기사를 추천 시스템을 제안하였다. 사용자가 직접 관심영역의 가중치를 정함으로서 관심주제의 기사를 우선적으로 보여 주어 사용자가 쉽게 관심기사를 읽을 수 있도록 하였다. 또한 사용자가 사회적으로 이슈가 되는 기사에 관심을 갖는 경우 이를 반영하기 위해서 단순히 기사를 클릭하고 읽지 않은 경우는 가중치를 낮게 설정하였으며, 기사를 끝까지 스크롤을 하고 기사를 끝까지 읽은 경우는 가중치를 높게 설정하였다. 특정 분야의 기사를 자주 읽은 경우는 XML의 구조정보를 사용하여 관심주제영역의 가중치를 높게 설정함으로써 관련분야의 기사를 우선적으로 볼 수 있도록 하였다.

다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링 (User-Perspective Issue Clustering Using Multi-Layered Two-Mode Network Analysis)

  • 김지은;김남규;조윤호
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.93-107
    • /
    • 2014
  • 대부분의 인터넷 쇼핑몰은 자사 고객의 관심 분야를 파악하고 이를 상품 추천에 효과적으로 활용하기 위해 많은 노력을 기울이고 있다. 하지만 고객이 회원 가입 시 직접 입력한 개인 정보는 신뢰하기가 어렵고, 고객의 구매 패턴을 통해 파악한 관심 분야 정보는 자사 사이트 내에 진입한 이후에만 보인 한정된 패턴이라는 측면에서 해당 고객의 다양한 관심분야를 제대로 나타낸다고 보기 어렵다. 이러한 한계를 극복하기 위해 본 연구에서는 고객의 평소 인터넷 사용 기록을 통해 최근 방문 사이트들의 주제를 분석함으로써, 고객의 실제 관심 분야를 파악할 수 있는 방안을 제시하였다. 또한 토픽 분석을 통해 각 사이트의 주제를 도출하고 도출된 주제를 다시 동시 방문자 관점에서 군집화 함으로써, 고객 관점에서 의미가 있는 상위 수준의 새로운 테마를 발굴하기 위한 방법론을 제안하였다. 연구의 특징은 유사주제 중심의 군집화라는 기존 연구와는 달리 사용자 관점의 관심주제 중심 군집화라 할 수 있다. 향후 사용자 중심의 카테고리 설계를 비롯한 새로운 관점의 고객군 정의 등 보다 높은 차원의 마케팅 전략 수립에 활용이 가능할 것으로 기대된다. 사용자 관점의 이슈 군집화 과정은 크롤링, 토픽 분석, 액세스 패턴 분석, 네트워크 병합, 네트워크 변환 및 군집화와 같은 여섯 가지 주요단계로 구성되어있다. 이를 위해 텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 비정형 텍스트를 기반으로한 빅데이터의 활용 방법을 모색하였다. 제안 방법론의 실무 적용 가능성을 평가하기 위해, 국내 최대 포털 뉴스 사이트의 방문자 2,177명의 1년간 방문 기록과 뉴스기사 대한 분석을 수행하고 그 결과를 요약하여 제시하였다.

Kakao Deep Reading Index: Consumption Time as a Key Factor in News Curation Algorithm

  • Lee, Dongkwon;Kim, Daewon
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권10호
    • /
    • pp.4833-4848
    • /
    • 2019
  • This paper introduces the structure and effects of Kakao's news curation algorithm, which is created based on the Deep Reading Index (DRI). The DRI examines the extent of deep reading through content reading time, that is, the duration of reader engagement with an article. Current news curation algorithms focus on reader choice, with the click-through rate or pageviews as the gauge for consumption frequency. DRI is a product of the challenge of introducing and adopting a new factor called 'consumption time' instead of 'frequency of consumption', which is the basis of existing curation algorithms. The analysis of DRI-based services proves that the new algorithm can act as a curation system that is more effective in providing in-depth and quality news reports.

개인화된 뉴스 서비스를 위한 소셜 네트워크 기반의 콘텐츠 추천기법 (Content-based Recommendation Based on Social Network for Personalized News Services)

  • 홍명덕;오경진;가명현;조근식
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.57-71
    • /
    • 2013
  • 세계에는 수많은 사람들이 살아가고 있고, 사람들의 일상으로부터 매일, 매 시간 단위로 새로운 뉴스가 발생한다. 발생되는 뉴스는 예정된 일과 예상하지 못한 일들을 포함하고 있다. 발생하는 뉴스의 거대한 양과 이를 전달하는 수많은 미디어들로 인해 사람들은 뉴스 콘텐츠를 이용하는데 많은 시간을 소비하게 된다. 하지만 미디어에 시시각각 나타나는 속보와 실시간 이슈의 대부분이 가십 기사로 이루어져 있어 사용자들이 자신의 성향에 맞는 뉴스를 선별하고, 뉴스로부터 정보를 획득하는 것은 쉽지 않은 일이다. 또한 사용자의 관심사가 시간에 따라 변하기 때문에 뉴스 제공에 있어 사용자의 변하는 관심사를 반영하는 것이 요구된다. 본 논문에서는 사용자의 최근 관심사를 기반으로 사용자 선호도에 맞는 뉴스를 제공하기 위한 콘텐츠 기반의 추천 기법 및 시스템을 제안한다. 사용자의 최근 선호도를 파악하기 위하여 소셜 네트워크 서비스인 Facebook 사용자의 정보와 최근 게시글을 이용하여 동적으로 사용자 프로파일을 생성하여 이를 뉴스 서비스에 활용하고, 사용자 선호도에 적합한 뉴스를 추출하기 위해서 뉴스 콘텐츠의 분석을 요구한다. 뉴스 콘텐츠 분석을 위해 미디어에서 제공되는 뉴스의 카테고리를 사용하고, 뉴스 방송원고의 분석 및 주요 키워드 추출을 통해 뉴스 프로파일을 생성한다. 사용자 프로파일과 뉴스 프로파일 간의 유사도 측정을 위해서는 두 프로파일 간 형식의 일치화가 요구되므로 사용자 프로파일을 뉴스 프로파일과 동일한 형태로 생성한다. 사용자가 시스템에 접속하면 시스템은 사용자 프로파일에 명시된 선호도를 기반으로 뉴스 프로파일과의 유사도를 측정하고, 사용자 선호도에 가장 적합한 뉴스들을 제공하게 된다. 또한 사용자에게 제공된 뉴스 프로파일과 다른 뉴스 프로파일들 간에 유사도를 측정하여 유사도가 높은 관련된 뉴스들을 제공하게 된다. 제안한 개인화된 뉴스 서비스의 성능을 평가하기 위해 사용자에게 추천된 뉴스에 대한 사용자 평가와 시스템 예측값의 오차를 기반으로 6Sub-Vectors 벤치마크 알고리즘과 성능 평가를 수행하였고, 실험 결과를 통해 제안한 시스템의 우수성을 입증하였다.

추천시스템관련 학술논문 분석 및 분류 (A Literature Review and Classification of Recommender Systems on Academic Journals)

  • 박득희;김혜경;최일영;김재경
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.139-152
    • /
    • 2011
  • 1990년대 중반에 협업 필터링의 출현으로 인하여 추천시스템에 관련된 연구가 늘어나게 되었다. 협업 필터링의 출현 이후 내용 기반 필터링, 협업 필터링과 내용 기반 필터링이 혼합된 하이브리드 필터링 등 새로운 기법들이 출현함으로써 2000년대에는 추천시스템의 연구가 눈에 띄게 증가하였다. 하지만 현재까지 추천시스템에 관련된 문헌들에 대한 리뷰와 분류가 체계적으로 되어있지 않다. 이와 같은 문제에 대한 해결방안으로써, 본 연구에서는 2001년부터 2010년도까지의 추천시스템에 관련된 문헌들 중 MIS Journal Ranking의 125개의 저널에서 추천시스템(Recommender system, Recommendation system), 협업 필터링(Collaborative Filtering), 내용 기반 필터링(Content based Filtering), 개인화 시스템(Personalized system) 등의 5가지 키워드로 제한하여 조사하였다. 총 37개의 저널에서 논문을 검색하였으며, 검색되어진 논문을 분석한 결과 추천시스템과 관련이 없는 논문을 제외한 총 187개의 논문을 선정하여 분석하였다. 이 연구에서는 그러나 컨퍼런스 논문, 석사, 박사학위 논문, 영어로 작성되지 않은 논문, 완성되지 않은 논문 등은 제외하였다. 본 연구에서는 187개의 논문을 분석하여 2001년부터 2010년까지의 각각의 년도 별 추천시스템의 연구에 대한 동향 분석, Journal별 추천시스템의 게재 분류, 추천시스템 어플리케이션의 사용 분야(책, 문서, 이미지, 영화, 음악, 쇼핑, TV 프로그램, 기타)별 분류 및 분석, 추천시스템에 사용된 데이터마이닝 기술(연관 규칙, 군집화, 의사 결정나무, 최근접 이웃 기법, 링크 분석 기법, 신경망, 회귀분석, 휴리스틱 기법)별 분류 및 분석을 수행하였다. 따라서 본 연구에서 제안한 각각의 분류 및 분석 결과들을 통하여 현재까지 추천시스템의 연구에 대한 연구 동향을 파악 할 수 있었으며, 분석결과를 통해 추천시스템에 관심이 있는 연구자와 전문가에게 미래의 추천시스템의 연구에 대한 가이드라인을 제시 할 수 있을 것이라고 기대한다.

준 지도 학습과 커리큘럼 학습을 이용한 유사 기사 추천 모델 (Semi-supervised GPT2 for News Article Recommendation with Curriculum Learning)

  • 서재형;오동석;어수경;박성진;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.495-500
    • /
    • 2020
  • 뉴스 기사는 반드시 객관적이고 넓은 시각으로 정보를 전달하지 않는다. 따라서 뉴스 기사를 기존의 추천 시스템과 같이 개인의 관심사나 사적 정보를 바탕으로 선별적으로 추천하는 것은 바람직하지 않다. 본 논문에서는 최대한 객관적으로 다양한 시각에서 비슷한 사건과 인물에 대해서 판단할 수 있도록 유사도 기반의 기사 추천 모델을 제시한다. 길이가 긴 문서 사이의 유사도를 측정하기 위해 GPT2 [1]언어 모델을 활용했다. 이 과정에서 단방향 디코더 모델인 GPT2 [1]의 단점을 추가 학습으로 개선했으며, 저장 공간의 효율과 핵심 문단 추출을 위해 BM25 [2]함수를 사용했다. 그리고 준 지도 학습 [3]을 통해 유사도 레이블링이 되어있지 않은 최신 뉴스 기사에 대해서도 자가 학습을 진행했으며, 이와 함께 길이가 긴 문단에 대해서도 효과적으로 학습할 수 있도록 문장 길이를 기준으로 3개의 단계로 나누어진 커리큘럼 학습 [4]방식을 적용했다.

  • PDF