• 제목/요약/키워드: 뉴스기사 분석

검색결과 365건 처리시간 0.033초

사용자 관심 이슈 분석을 통한 추천시스템 성능 향상 방안 (Improving Performance of Recommendation Systems Using Topic Modeling)

  • 최성이;현윤진;김남규
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.101-116
    • /
    • 2015
  • 많은 기관들이 데이터에 기반을 둔 의사결정을 수행해 왔으며, 특히 수치자료를 비롯한 정형 데이터가 이러한 목적으로 널리 활용되어 왔다. 하지만 최근에는 스마트기기와 소셜미디어의 발달로 인해 다양한 형태를 가진 방대한 양의 정보가 생성, 공유, 저장되면서, 전통적인 정형 데이터 기반 의사결정으로부터 비정형 빅데이터 기반 의사결정으로 관심의 전환이 이루어지고 있다. 데이터 기반 의사결정의 대표적 분야인 추천시스템 분야에서도 성능 향상을 위해 비정형 데이터를 활용해야 한다는 필요성이 최근 꾸준히 제기되고 있다. 특히 사용자의 성향이나 선호도는 고객의 니즈와 직결되기 때문에, 비정형 데이터 분석을 통해 사용자의 성향을 파악하고 이를 통해 상품 추천 및 구매 예측의 정확도를 향상시키기 위한 노력이 매우 시급하게 이루어질 필요가 있다. 따라서 본 연구에서는 사용자의 성향을 측정하여 재구매 예측 정확도, 특히 카테고리별 재구매 예측 정확도를 높임으로써, 궁극적으로 추천시스템의 성능을 향상시킬 수 있는 방안을 제시한다. 구체적으로는 사용자의 일상적인 인터넷 사용 기록을 분석하여 고객이 조회하는 뉴스 기사의 이슈를 식별하고 다양한 이슈에 대한 고객의 관심을 계량화한 후, 이를 활용하여 고객의 카테고리별 재구매 여부를 예측하는 모델을 제안하고자 한다. 실제 웹 트랜잭션으로부터 도출된 인터넷 뉴스 조회 기록 및 쇼핑몰 구매 기록을 대상으로 실험을 수행한 결과, 고객의 과거 구매이력만을 활용한 카테고리 재구매 예측 모형에 비해 본 연구에서 제안한 모형, 즉 고객의 과거 구매이력과 관심 이슈를 모두 활용한 예측 모형의 정확도가 다소 우수한 것으로 나타났다.

텍스트 마이닝을 통한 우리나라의 벼 도열병 발생 개황 분석 (Analysis of Rice Blast Outbreaks in Korea through Text Mining)

  • 송성민;정현정;김광형;김기태
    • 식물병연구
    • /
    • 제28권3호
    • /
    • pp.113-121
    • /
    • 2022
  • 벼 도열병은 전 세계적으로 발병하여 쌀 수확량을 크게 감소시키는 주요 식물병이다. 벼 도열병은 한국에서도 주기적으로 대발생하여 사회경제적으로 큰 피해를 입힌다. 이를 예방하기 위해서는 병 발생 예찰 시스템이 필요하다. 또한 병 발생에 대한 역학 조사는 식물병 관리를 위한 의사결정을 내릴 때 도움을 줄 수 있다. 현재 도열병 예찰 및 역학 조사는 주로 작물의 생육량, 기상 환경 요인 등 정량적으로 측정 가능한 정형 데이터를 기반으로 수행되고 있다. 정형 데이터와 함께 도열병 발생과 관련한 텍스트 자료들도 많이 축적되고 있다. 그러나 이러한 비정형 데이터를 이용한 역학 조사는 이루어지지 않고 있다. 비정형 데이터를 활용하여 유용한 정보를 추출한다면 도열병을 포함한 앞으로의 식물병 관리에 사용할 수 있을 것이다. 이 연구는 텍스트 마이닝을 통해 도열병 관련 뉴스 기사를 분석하여 우리나라에서 벼 도열병이 다발생한 연도와 지역을 조사하였고, 해당 지역의 평균 기온, 합계 강수량, 일조시간, 공급된 벼 품종을 분석하였다. 이를 통해 2020년 평년에 비해 낮은 기온과 일조시간 및 높은 강수량이 전국적인 도열병 다발생의 원인에 기여했고, 2021년 전라북도와 경상북도 일부 지역의 다발생은 비슷한 기상학적 요인에 의한 것으로 추측할 수 있었다. 더하여 같은 벼 품종의 연작에 의한 도열병 다발생 가능성과 질소 비료의 시비량이 병 발생에 미치는 영향에 대한 추후 연구가 필요하다. 결론적으로, 쏟아지는 정보의 홍수속에서 관련 기사를 종합적으로 보기 어렵다. 따라서, 텍스트 마이닝을 통해 얻은 결과로 특정 키워드들이 많이 관찰될 때 적극적 방제에 대한 의사결정을 할 수 있는 시스템이 구축될 필요가 있다. 이는 추후 딥러닝 기술과 접목되어 벼 도열병 역학 조사 도구로 사용될 수도 있을 것이다. 텍스트 마이닝을 통해 얻은 유의미한 정보를 기존의 정형 데이터 기반의 모델과 결합한다면 농업현장에서 병발생 예측 또는 방제기술 개선에 필요한 고품질 정보를 제공해줄 수 있을 것이라고 예상한다.

코로나19 상황에서 지역사회 먹을거리 이슈에 관한 탐색적 연구: 지역별 이슈를 통한 소셜 빅데이터를 중심으로 (An Exploratory Study on Local Community Food Issues in the Context of COVID-19: Focusing on Social Big Data through Regional Issues)

  • 최홍규
    • 한국콘텐츠학회논문지
    • /
    • 제21권8호
    • /
    • pp.546-558
    • /
    • 2021
  • 본 연구는 코로나19 상황에서 지역사회 먹을거리 관련 이슈를 살펴보았으며, 온라인 공간에서 생산된 소셜 빅데이터의 내용을 분석하는 데 초점을 맞췄다. 우선, 코로나19로 사회적 거리두기가 시행된 후 지역별 홈페이지와 온라인 커뮤니티인 카페에서 확산한 먹을거리 관련 이슈를 분석했다. 다음으로는 언론 뉴스, SNS, 포털 등에서 확산하는 먹을거리 관련 이슈의 내용을 살펴봤다. 그 결과 서울과 경기 등 수도권에 비해 여타 지역 홈페이지에 먹을거리 관련 게시물이 더 많았지만, 온라인 커뮤니티의 경우에는 서울과 경기 지역에 등록된 온라인 커뮤니티에 먹을거리 관련 이슈가 더 많았다. 지역별 온라인 커뮤니티의 먹을거리 관련 키워드는 지역사회 경제와 관련한 내용을 주로 포함하고 있었다. 언론 기사, SNS, 검색포털 이슈에는 지역사회 먹을거리 관련 정책, 정보, 상품 등의 소비과정에서 논의될 수 있는 내용이 주로 나타났다. 연구결과를 통해 지역사회 단위로 특화한 정보 공유체계는 발견되지 않고, 온라인 커뮤니티가 현실적인 먹을거리 정보를 제공하는 데 기여할 수 있으며, 소셜미디어를 통해 지역별 먹을거리 정책의 성과검증이 가능할 것이라는 점을 발견할 수 있었다.

대중음악 오디션 프로그램의 진정성 담론 전략에 관한 탐색적 연구 - <미스터트롯>을 중심으로 - (An Exploratory Study on the Authenticity Discourse Strategies of Popular Music Audition Programs - Focused on -)

  • 이재원;김원겸
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권6호
    • /
    • pp.1-13
    • /
    • 2021
  • 본 연구는 TV조선 오디션 프로그램 <내일은 미스터트롯> 방송 이후 트로트가 방송콘텐츠 시장에서 우월적 지위를 갖게 된 기제를 탐색했다. 트로트 오디션 프로그램이 기존의 오디션 프로그램과 어떤 차별화 및 대중화 전략을 취했는지 프로그램의 서사 구조를 분석하고, 음악 전문가 심층 인터뷰, 제작진의 인터뷰 기사 등을 분석했다. <미스터트롯>은 기존의 오디션 프로그램의 성공 전략을 뒤집는 방식의 전략으로 시청자들에게 어필했다. 먼저, 실력자/비실력자 참가자들이 서로 경쟁하는 게 아니라, 실력자/실력자가 대결을 펼치는 방식을 취했다. 오디션 프로그램의 주요 전략인 '진정성 담론'을 그동안 개인사를 통해 이뤄냈던 것과 달리, 이번 트로트 오디션에서는 가창 실력을 새로운 '진정성 담론'으로 설정하였다. 둘째, 오디션 프로그램이라면 필수적이라고 여겨졌던 '악마의 편집'을 탈피하고, 악역을 배제하는 전략을 취하고 쇼 연출에 주력했다. 셋째, 아이돌음악, 힙합, 밴드 등 특정 장르의 전문성을 보여야 한다고 여겨졌던 오디션 프로그램의 관행을 깨고 트로트를 다양한 장르와 접합시켰다. 넷째, 10대, 20대 혹은 남성, 여성 등 특정 세대나 성별을 주로 공략했던 이전 오디션 프로그램과 달리, 다양한 연령대를 공략해 시청층을 확대하는 전략을 구사했다. 다섯째, 시청자들의 흥미를 유발하고, 감정이입을 돕는 자막을 잘 활용한 '자막 전략'으로 중장년 팬덤을 형성해냈다.

식민지 신문 '사회면'의 감정정치 -사회적 사실들의 정치적 서사화 (The Society Page of Newspaper of the colonized Korea, its politics of sentiment and modulation of social facts)

  • 유선영
    • 한국언론정보학보
    • /
    • 제67권
    • /
    • pp.177-208
    • /
    • 2014
  • 이 연구는 1920~1930년대 식민지 시기 신문의 사회면-사회적 보도가 정치적으로 부호화되고 해독되는 양식화의 메커니즘을 분석하고 있다. 민족국가와 정치부재, 그리고 주밀한 검열체제 하에서 신문은 비정치적 장르를 정치화하는 담론전략을 시도하며 사회면은 이 식민지적 맥락 안에서 정치적 언설로 구성되고 해독되었다. 이를 규명하기 위해 첫째 민간지의 사회면의 위상 및 편집방향, 둘째 사회면의 사회적 사실을 생산하기 위한 취재, 조직, 기자, 기사작법, 셋째 사회면을 둘러싼 신문과 기자의 부호화 전략 및 이에 공조하는 독자의 해독 규약을 분석했다. 사회면 또는 사회적 사실의 정치적 양식화는 객관적 사실보다 이면의 심리적 사실을 중시하고, 식민지 현실의 부정적 현상(現狀)에 주목하면서 운명공동체로서 민족적 비참을 형상화하며 뉴스를 극적 구조의 감정적 현실 서사(實事敍辭)로 구성하였다. 사회면은 민족공동체적 감각을 공유하고 유지하는 데 의미를 부여하며 이를 위해 민족적 감정을 동요하는 취재보도와 기사의 양식화를 이룬 것이다. 식민지에서는 모든 사회적 사실들이 정치적 문제로 환원된다는 점을 전제하면 사회면에 배치되는 사회적 사실들에 정치적 함의를 덧씌우기 위한 식민지 지식인/기자들의 전략과 전술, 의도는 식민지 저널리즘의 한 특수한 양상을 드러낸다.

  • PDF

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

쿡방 콘텐츠 노출이 농식품 소비에 미치는 효과: 감자 소비를 중심으로 (Effects of Exposure to Cooking Show Contents on the Consumption of Agricultural Products: Focused on Potato Consumption)

  • 나형철;김현웅;고현석;신재훈;조용빈;아지즈 나스리디노프;류관희
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.400-407
    • /
    • 2021
  • 최근 TV와 유튜브 채널에서 먹방과 쿡방 프로그램이 증가하면서 다양한 매체를 통한 음식 및 요리 프로그램 시청이 식품 소비에 미치는 영향력도 점차 증가하고 있다. 최근 유명 요리연구가인 백종원 씨가 방송에서 언급한 농식품 소비가 급증했다는 '백종원 효과'에 대한 여러 뉴스 기사가 있었고, 백종원 씨의 이름을 딴 식품까지 시장에 출시되었다. 본 연구에서는 다양한 매체를 통해서 영향력 있는 요리 콘텐츠를 생산하는 백종원 씨를 쿡방 콘텐츠의 대표적 사례로 삼고, 백종원 씨가 집밥 백선생 TV 프로그램에서 요리법을 방송한 농식품 중 감자를 선정하여, '백종원 효과'가 감자 소비에 미치는 영향을 평가했다. 집밥 백선생 프로그램에서 감자 요리법이 처음 방송된 후 방송 전후 감자 구매금액의 차이를 농식품 소비자 패널의 감자 구매금액 데이터와 이중차분법을 이용하여 방송 전후 6개 시점(3, 6, 9, 12, 24, 36개월)에 비교하였다. 사용된 데이터는 감자 구매금액, 감자 소매가격, 감자 도매가격 등의 정형 데이터와 TV 프로그램과 블로그 데이터 등의 비정형 데이터가 활용되었다. 분석 시점 모두에서 방송 후 감자 구매금액이 방송 전 구매금액보다 적었으며, 감자 소비에서 집밥 백선생 프로그램을 통한 '백종원 효과'의 존재를 시사하는 결과는 본 연구에서 관찰되지 않았다.

기념 뮤지컬과 독립운동의 기억 -<신흥무관학교>, <구>, <워치>를 중심으로 (Musicals and Memories of the March 1 Independence Movement - Centered on the musical Shingheung Military School, Ku: Songs of the Goblin, Watch)

  • 정명문
    • 공연문화연구
    • /
    • 제43호
    • /
    • pp.229-261
    • /
    • 2021
  • 역사적 사실을 기억하고 기념하는 방식에는 기억 주체와 당대의 권력 관계 즉 기억의 정치학이 반영된다. 본고는 2019년에 공연된 기념 뮤지컬 <신흥무관학교>, <구: 도깨비들의 노래>, <워치>를 통해 변화된 지점들을 분석하였다. 위 작품들은 만주 독립운동, 홍코우 공원의거를 배경으로 하되 기록되지 않은 것을 채우면서 독립 운동에서 기념해야 할 것들을 조정하였다. <신흥무관학교>의 경우, 공식 기록 속 인물을 배경으로 하되 이름 없는 이들을 전면에 내세워 기념 대상을 확대하였다. <구 : 도깨비들의 노래>는 타임 슬립을 통해 망각된 대상을 재현하고 사죄하면서 기억을 수정한다. <워치>는 사진, 뉴스 릴, 신문기사 등 다큐멘터리 기법을 통해 팩션의 스펙터클을 강화하였지만, 기록에 한정되는 한계도 드러난다. 3.1 운동 및 대한민국 임시정부 수립 100주년 기념 뮤지컬에서는 '민중의 움직임'이 현재와 연결되고 있음을 적극적으로 드러내는 장치들이 발견된다. 이를 위해 공식적 기록에 새로 생산된 가치와 기억을 반영하였고, 군중의 일상과 감정에 공을 쏟았다. 또한 실증적 고찰과 호명하기를 동시에 활용하여 신뢰성을 높였다. "100주년 기념"으로 호출된 뮤지컬에서는 독립운동가와 함께 움직인 군중의 일상과 감정 즉 미시문화사적 접근이 담겨 있다. 기념해야 할 목표와 목적의 이동이 나타난 것이다. 이 시도들은 동시대적 공감대 형성이란 성과를 얻었다는 점에서 의미가 있다.

비정형 텍스트 분석을 활용한 이슈의 동적 변이과정 고찰 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 임명수;김남규
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.1-18
    • /
    • 2016
  • 최근 가용한 텍스트 데이터 자원이 증가함에 따라 방대한 텍스트 분석을 통해 새로운 가치를 창출하고자 하는 수요가 증가하고 있다. 특히 뉴스, 민원, 블로그, SNS 등을 통해 유통되는 글로부터 다양한 이슈를 발굴해내고 이들 이슈의 추이를 분석하는 이슈 트래킹에 대한 연구가 활발하게 이루어지고 있다. 전통적인 이슈 트래킹은 토픽 모델링을 통해 오랜 기간에 걸쳐 지속된 주요 이슈를 발굴한 후, 각 이슈를 구성하는 문서 수의 세부 기간별 분포를 분석하는 방식으로 이루어진다. 하지만 전통적 이슈 트래킹은 각 이슈를 구성하는 내용이 전체 기간에 걸쳐 변화 없이 유지된다는 가정 하에 수행되기 때문에, 다양한 세부 이슈가 서로 영향을 주며 생성, 병합, 분화, 소멸하는 이슈의 동적 변이과정을 나타내지 못한다. 또한 전체 기간에 걸쳐 지속적으로 출현한 키워드만이 이슈 키워드로 도출되기 때문에, 핵실험, 이산가족 등 세부 기간의 분석에서는 매우 상이한 맥락으로 파악되는 구체적인 이슈가 오랜 기간의 분석에서는 북한이라는 큰 이슈에 함몰되어 가려지는 현상이 발생할 수 있다. 본 연구에서는 이러한 한계를 극복하기 위해 각 세부 기간의 문서에 대한 독립적인 분석을 통해 세부 기간별 주요 이슈를 도출한 후, 각 이슈의 유사도에 기반하여 이슈 흐름도를 도출하고자 한다. 또한 각 문서의 카테고리 정보를 활용하여 카테고리간의 이슈 전이 패턴을 분석하고자 한다. 본 논문에서는 총 53,739건의 신문 기사에 제안 방법론을 적용한 실험을 수행하였으며, 이를 통해 전통적인 이슈 트래킹을 통해 발굴한 주요 이슈의 세부 기간별 구성 내용을 살펴볼 수 있을 뿐 아니라, 특정 이슈의 선행 이슈와 후행 이슈를 파악할 수 있음을 확인하였다. 또한 카테고리간 분석을 통해 단방향 전이와 양방향 전이의 흥미로운 패턴을 발견하였다.

데이터 분석을 통한 UX 방법론 연구 고객 세그먼트 분류를 통한 페르소나 도출을 중심으로 (UX Methodology Study by Data Analysis Focusing on deriving persona through customer segment classification)

  • 이슬이;박도형
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.151-176
    • /
    • 2021
  • 정보기술 산업이 발전됨에 따라 다양한 종류의 데이터가 생겨나고 있고 이를 가공하여 산업에 활용하는 것이 필수인 시대가 되었다. 온 오프라인 상에서 수집된 다양한 디지털 데이터를 분석하여 활용하는것은 산업 내의 고객에게 적합한 경험을 제공하기 위해서 꼭 필요한 과정이다. 새로운 비즈니스, 제품, 서비스를 창출하기 위해서는다방면에서 수집된 고객 데이터를 활용하여잠재고객의 니즈를 깊게 파악하고 행동패턴을 분석하여 숨겨진 욕망의 신호를 잡아내는것이 필수이다. 그러나 효과적인 서비스 개발을 위해서 병행해서 진행되어야 할 데이터 분석, UX 방법론을 활용한 연구는 각각 따로 진행되고 있고 산업 내의 활용 예시가 부족한 것이 사실이다. 본 연구에서는 데이터 분석 방법과 UX 방법론을 응용하여 하나의 프로세스를 제작하였다. 행복을 주제로 진행된 설문조사에서 추출된 고객 데이터를 활용하여 고객의 특성을 파악하기 위한 데이터 분석을 진행하였다. 요인, 회귀분석을 실시하여 행복 데이터 설문의 요인 간의 연관 관계를 확인하였다. 그 다음 연관 관계를 군집을 분류하고 가장 최적의 군집 수를 추출하여분류하였다. 이러한 결과를 바탕으로 교차분석을 진행하여 군집 별로 인구통계학적 특성을 확인하였다. 세그먼트를 분류하기 전 서비스 정의를 하기 위하여 뉴스 기사 및 SNS 문장들을 바탕으로 텍스트 마이닝을 통해 주요 키워드를 바탕으로 아이디어를 도출하였고 이중에 가장 타당한 서비스를 선택하였다. 이러한 결과를 바탕으로 세그먼트및 목표 고객을 선정한 후 세그먼트의 특성대로 대상자를 선정하여 인터뷰를진행하였다. 그 후 특성 및 프로파일정보를 활용하여 페르소나를 제작하여고객의 행동과 최종 목표를 서술하였다. 일반적인페르소나와 데이터를 활용한 페르소나를 비교하여 각각의 특성을 비교 분석하였다. 본 연구를 통해 도출된 프로세스는 다변화되는 서비스의 변화 상황에서 적절한 타겟 고객의 정의 및 정확한 분류 체계로 나뉘어진 고객군을파악 할 수 있는 방법을 제시 한 것에 의의가 있다.