• 제목/요약/키워드: news topic

검색결과 234건 처리시간 0.027초

댓글 분석을 통한 19대 한국 대선 후보 이슈 파악 및 득표율 예측 (Issue tracking and voting rate prediction for 19th Korean president election candidates)

  • 서대호;김지호;김창기
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.199-219
    • /
    • 2018
  • 인터넷의 일상화와 각종 스마트 기기의 보급으로 이용자들로 하여금 실시간 의사소통이 가능하게 하여 기존의 커뮤니케이션 양식이 새롭게 변화되었다. 인터넷을 통한 정보주체의 변화로 인해 데이터는 더욱 방대해져서 빅데이터라 불리는 정보의 초대형화를 야기하였다. 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회로 여겨지고 있다. 특히 텍스트 마이닝은 비정형 텍스트 데이터를 이용해 패턴을 탐구하여 의미있는 정보를 찾아낸다. 텍스트 데이터는 신문, 도서, 웹, SNS 등 다양한 곳에 존재하기 때문에 데이터의 양이 매우 다양하고 방대하여 사회적 실제를 이해하기 위한 데이터로 적합하다. 본 연구는 한국 최대 인터넷 포털사이트 뉴스의 댓글을 수집하여 2017년 19대 한국 대선을 대상으로 연구를 수행하였다. 대선 선거일 직전 여론조사 공표 금지기간이 포함된 2017년 4월 29일부터 2017년 5월 7일까지 226,447건의 댓글을 수집하여 빈도분석, 연관감성어 분석, 토픽 감성 분석, 후보자 득표율 예측을 수행하였다. 이를 통해 각 후보자들에 대한 이슈를 분석 및 해석하고 득표율을 예측하였다. 분석 결과 뉴스 댓글이 대선 후보들에 대한 이슈를 추적하고 득표율을 예측하기에 효과적인 도구임을 보여주었다. 대선 후보자들은 사회적 여론을 객관적으로 판단하여 선거유세 전략에 반영할 수 있고 유권자들은 각 후보자들에 대한 이슈를 파악하여 투표시 참조할 수 있다. 또한 후보자들이 빅데이터 분석을 참조하여 선거캠페인을 벌인다면 국민들은 자신들이 원하는 바가 후보자들에게 피력, 반영된다는 것을 인지하고 웹상에서 더욱 적극적인 활동을 할 것이다. 이는 국민의 정치 참여 행위로써 사회적 의의가 있다.

항공산업 미래유망분야 선정을 위한 텍스트 마이닝 기반의 트렌드 분석 (Text Mining-Based Emerging Trend Analysis for the Aviation Industry)

  • 김현정;조남옥;신경식
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.65-82
    • /
    • 2015
  • 최근 경제적 사회적 부가가치를 창출할 수 있는 유망분야를 선정하여 국가 전략 및 정책 수립 시 반영하기 위해 미래 핵심 이슈를 발견하고 트렌드를 분석하는 것에 대한 관심이 급증하고 있다. 기존에는 미래의 핵심 기술이나 이슈를 발견하고 트렌드 분석을 통해 미래유망분야를 선정하는 연구를 위해 문헌 조사 또는 전문가 평가와 같은 정성적 연구방법이 사용되어 왔다. 그러나 이 연구방법은 대량의 정보로부터 결과를 도출하는데 많은 시간과 비용이 소요될 뿐만 아니라 전문가의 주관적인 가치가 반영될 가능성이 존재한다. 이와 같은 한계점을 보완하고자 최근 국토교통, 안전, 정보통신기술 등 다양한 분야에서 미래유망분야를 선정하기 위하여 정성적 연구방법에 텍스트 마이닝과 같은 정량적 연구방법을 상호 보완적으로 활용하는 방식으로 트렌드 분석을 수행하는 연구 방법론의 패러다임 변화가 시도되고 있다. 본 연구는 항공산업 전반적인 분야에 빅데이터 분석 방법인 텍스트 마이닝 기법을 적용하여 항공 분야의 연구동향을 파악하고 미래유망분야를 전망하였다. 텍스트 마이닝 기법 중하나인 토픽 분석을 이용하여 항공산업 전반적인 분야의 문서 집합 내 잠재된 토픽을 추출하고, 연도별로 핵심 토픽의 추이를 분석하였다. 분석 결과 항공산업의 미래유망분야로 항공안전정책, 항공운임(저가항공), 그리고 친환경 고연비 연료가 도출되었다. 본 연구결과는 분석 대상을 논문에 한정하여 수행하였다는 한계점이 존재하나, 항공산업 분야의 핵심 이슈를 도출하기 위하여 텍스트 마이닝 기반의 트렌드 분석에 대한 활용가능성을 제시하고, 미래유망분야를 선정하기 위한 정량적인 분석 방법론의 전형을 마련하였다는 점에서 의의가 있다.

텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 방법론 (Mapping Categories of Heterogeneous Sources Using Text Analytics)

  • 김다솜;김남규
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.193-215
    • /
    • 2016
  • 최근 다양한 소셜 네트워크 서비스의 증가로 인해 사용자들은 각자의 목적 및 취향에 따라 여러 매체를 동시에 이용하는 경향을 보이고 있다. 또한 특정 주제에 대한 정보를 수집할 때에도 소셜 네트워크 서비스, 인터넷 뉴스, 블로그 등 여러 매체를 동시에 활용하는 것이 일반적이다. 하지만 다양한 매체를 통해 유통되는 문서들은 서로 유사한 주제, 심지어는 동일한 내용을 다루더라도 각 매체 별 정책 및 기준에 따라 각기 다른 카테고리로 관리되고 있으며, 이는 이종 매체를 아우르는 범위에서 특정 카테고리에 대한 탐색을 수행하고자 하는 시도에 걸림돌로 작용하고 있다. 이러한 제약을 극복하기 위해, 본 연구에서는 기존 매체 고유의 카테고리 체계는 그대로 유지하면서 이종 매체 간 카테고리 매핑을 수행하는 방법을 제시한다. 즉, 개별 문서를 다양한 매체의 관점에서 재분류하고 이러한 결과를 문서에 2차원 레이블로 저장함으로써, 이종 매체에 속한 다양한 문서들을 마치한 매체에 속한 것과 같이 동일한 카테고리 기준으로 탐색할 수 있는 논리적 장치를 제안한다. 본 논문에서는 국내 인터넷 뉴스 포털 사이트 두 곳의 뉴스 기사 6,000건에 대해 제안 방법론을 적용한 실험을 통해 각 기사에 매체와 카테고리 정보로 구성된 2차원 레이블을 부여하였으며, 매체 간, 지도 학습과 준지도 학습 간, 동질 학습 데이터와 이질학습 데이터 간의 정확도 비교 실험을 수행하였다. 특히 매우 흥미롭게도, 일부 카테고리에서 이질 학습 데이터를 사용한 준지도 학습의 분류 정확도가 지도 학습 및 동질 학습 데이터를 사용한 준지도 학습의 분류 정확도보다 높게 나타나는 현상을 발견하였다.

빅카인즈를 활용한 GenAI(생성형 인공지능) 기술 동향 분석: ChatGPT 등장과 스타트업 영향 평가 (GenAI(Generative Artificial Intelligence) Technology Trend Analysis Using Bigkinds: ChatGPT Emergence and Startup Impact Assessment)

  • 이현주;성창수;전병훈
    • 벤처창업연구
    • /
    • 제18권4호
    • /
    • pp.65-76
    • /
    • 2023
  • 기술 창업 및 스타트업 분야에서는 인공지능(AI)의 발전이 사업 모델 혁신의 핵심 주제로 부상하였다. 이를 통해 벤처기업들은 경쟁력 확보를 위해 AI를 중심으로 다양한 노력을 기울이고 있다. 본 연구는 GenAI 기술의 발전과 스타트업 생태계 간의 관계를 국내 뉴스 기사를 분석하여, 기술 창업 분야의 동향을 파악하는 것을 목적으로 하였다. 본 연구는 빅카인즈(BIG Kinds)를 활용하여 1990년부터 2023년 8월 10일까지의 국내 뉴스 기사에서 ChatGPT의 등장 전후를 중심으로 GenAI 관련 뉴스 기사, 주요 이슈 및 트렌드의 변화를 조사하였으며, 네트워크 분석 및 키워드 시각화를 통해 관련성을 시각화하였다. 연구결과, 2017년부터 2023년까지 GenAI에 대한 언급이 기사 내에서 점차 증가하였다. 특히, OpenAI의 GPT-3.5를 기반으로 한 ChatGPT 서비스가 주요 이슈로 부각 되었는데, 이 서비스는 OpenAI의 DALL-E, Google의 MusicLM, VoyagerX의 Vrew 등과 같은 언어 모델 기반 GenAI 기술의 대중화를 시사하였다. 이로써 생성형 인공지능은 다양한 분야에서의 유용성을 입증하며, ChatGPT 출시 이후 국내 기업들의 한국어 언어 모델 개발 활동이 활발히 이루어지고 있는 것으로 확인되었다. 리튼 테크놀로지스와 같은 스타트업들도 GenAI를 활용하여 기술 창업 분야에서의 영역을 확장하고 있다. 본 연구에서는 GenAI 기술과 스타트업 창업 활동 간의 연관성을 확인하였으며, 이는 혁신적인 비즈니스 전략의 구축 지원을 시사하며 GenAI 기술의 발전과 스타트업 생태계의 성장을 지속해서 형성할 것으로 전망된다. 더 나아가 국제적 동향 및 다양한 분석 방법의 활용, 실제 현장에서의 GenAI 응용 가능성을 모색하는 연구가 요구 된다. 이러한 노력은 GenAI 기술의 발전과 스타트업 생태계의 성장 발전에 이바지할 것으로 기대된다.

  • PDF

The Decision-Making Journey of Malaysian Women with Early Breast Cancer: A Qualitative Study

  • Abdullah, Adina;Abdullah, Khatijah Lim;Yip, Cheng Har;Teo, Soo-Hwang;Taib, Nur Aishah;Ng, Chirk Jenn
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제14권12호
    • /
    • pp.7143-7147
    • /
    • 2013
  • Background: The survival outcomes for women presenting with early breast cancer are influenced by treatment decisions. In Malaysia, survival outcome is generally poor due to late presentation. Of those who present early, many refuse treatment for complementary therapy. Objective: This study aimed to explore the decision making experiences of women with early breast cancer. Materials and Methods: A qualitative study using individual in-depth interviews was conducted to capture the decision making process of women with early breast cancer in Malaysia. We used purposive sampling to recruit women yet to undergo surgical treatment. A total of eight participants consented and were interviewed using a semi-structured interview guide. These women were recruited from a period of one week after they were informed of their diagnoses. A topic guide, based on the Ottawa decision support framework (ODSF), was used to facilitate the interviews, which were audio recorded, transcribed and analysed using a thematic approach. Results: We identified four phases in the decision-making process of women with early breast cancer: discovery (pre-diagnosis); confirmatory ('receiving bad news'); deliberation; and decision (making a decision). These phases ranged from when women first discovered abnormalities in their breasts to them making final surgical treatment decisions. Information was vital in guiding these women. Support from family members, friends, healthcare professionals as well as survivors also has an influencing role. However, the final say on treatment decision was from themselves. Conclusions: The treatment decision for women with early breast cancer in Malaysia is a result of information they gather on their decision making journey. This journey starts with diagnosis. The women's spouses, friends, family members and healthcare professionals play different roles as information providers and supporters at different stages of treatment decisions. However, the final treatment decision is influenced mainly by women's own experiences, knowledge and understanding.

미디어 생산시간이 미디어 정치에 미치는 영향에 관한 연구 - 독일총선의 TV토론을 중심으로 (Under the Pressure of the Topic Selection and Representation Rules of the Mass Media over the Slow Political Process Time - For Example the Televised Debate to Elections to the Federal Assembly in Germany)

  • 심영섭
    • 한국언론정보학보
    • /
    • 제45권
    • /
    • pp.187-219
    • /
    • 2009
  • 미디어를 통해 정책의제 설정과 정책홍보가 늘어나면서, 정치인과 정당은 미디어의 표현기법과 뉴스 생산조건에 맞춰 나가야 하는 압박을 받고 있다. 미디어의 생산조건에 맞추는 정치로 정치인들은 정책 설명을 통해 국민을 이해시키려 하기보다는 미디어를 통해 자신의 이미지를 알리기 위한 연출기법을 배우는 데 더 의존하게 된다. 정치인들의 연출기법 차용은 효과적인 정책홍보라는 원칙에 위반되지는 않지만, 정치가 미디어의 생산조건에 맞춰나가면서 점점 더 정책의제 설명보다는 이미지 연출에 의존하는 현상이 두드러지고 있다. 폴리테인먼트를 통한 정치연출은 유권자들에게 정치인 개인에 대한 평가는 물론, 정당의 정책수행 능력평가와 대의 민주주의의 정당성 확보에 이르기까지 광범위하게 영향을 미치고 있다. 또한 미디어 생산시간에 맞춘 폴리테인먼트의 강화는 숙의 민주주의의 합리적인 발전을 어렵게 만들며, 연출을 통한 가상정치의 확산이라는 불합리한 현상까지 발생시키고 있다. 이 연구에서는 미디어 생산시간이 정치과정에 미치는 영향을 알아보기 위해 지금까지 두 차례에 걸쳐 실시된 독일총선에서의 TV토론을 사례로 분석했다. 그 결과 미디어의 연출적 요소가 미디어를 통한 정치적 토론은 물론, 정치 커뮤니케이션 전 과정에 걸쳐 영향력을 행사하고 있음을 알 수 있었다.

  • PDF

웹게시판에서 가상온도를 이용한 게시글의 인기 예측 (Predicting the Popularity of Post Articles with Virtual Temperature in Web Bulletin)

  • 김수도;김소라;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.19-29
    • /
    • 2011
  • 블로그는 사용자에게 자신의 의견을 표현하고 다른 사람들의 의견을 수렴할 수 있는 자유로운 의사표현 네트워크를 제공한다. 어떤 글은 사회적, 정치적 이슈를 몰고 다니기도 하며 또 어떤 글은 사용자의 관심을 끌지 못하고 지나가기도 한다. 글이 작성된 초기에 향후 얼마나 인기를 얻을지 예측한다는 것은 글의 저자, 블로거, 광고회사 그리고 웹호스팅 모두에게 흥미로울 것이다. 인기를 예측하기 위한 다양한 연구들이 진행되어 왔지만 대부분의 연구들이 사용자간의 상호연관성에 기반하고 있고 정확한 값으로 표현하는데 높은 에러율을 발생하고 있다. 본 논문에서는 블로그에 글이 작성된 초기에 향후 글의 인기를 예측하기 위해 조회수를 사용하여 글의 인기를 4타입(explosion, hot, warm, cold)의 가상 온도로 예측하는 방법을 제안한다. 먼저 글의 포화시점을 정의하고, 초기 조회수와 포화시점 조회수의 관계를 통해 포화시점 조회수를 예측하는 모델링 공식을 유도하였다. 예측된 포화시점 조회수를 이용하여 글의 인기를 4타입의 가상 온도로 표현하였다. 초기 관찰기간에 따라 예측 정확률이 결정되고 있다. 실험결과 30분 이후부터 MAPE(Mean Absolute Percentage Error)가 30%이하로 낮아졌지만, explosive 타입의 경우 초기 조회수로 예측하기 힘들었다. explosive를 제외한 hot, warm, cold 타입에서는 30분후부터 86%이상의 평균 예측 정확률을 보여주며, 70분후부터는 90%이상의 평균 예측 정확률을 보여주고 있었다.

코로나 이전과 이후의 4차 산업혁명과 광고의 뉴스기사 분석 : LDA와 Word2vec을 중심으로 (News Article Analysis of the 4th Industrial Revolution and Advertising before and after COVID-19: Focusing on LDA and Word2vec)

  • 차영란
    • 한국콘텐츠학회논문지
    • /
    • 제21권9호
    • /
    • pp.149-163
    • /
    • 2021
  • 4차 산업혁명이란 인공지능(AI), 사물인터넷(IoT), 로봇기술, 드론, 자율주행과 가상현실(VR) 등 정보통신 기술이 주도하는 차세대 산업혁명을 말하는 것으로, 광고 산업 발전에도 큰 영향을 미쳤다. 그러나 지금 전세계는 코로나 확산 방지를 위하여, 비접촉, 비대면 생활환경으로 급속도로 빠르게 변화하고 있다. 이에 따라 4차 산업혁명과 광고의 역할도 변화하고 있다. 따라서 본 연구에서는 코로나 19 이전과 이후의 4차산업 혁명과 광고의 변화를 살펴보기 위해 빅카인즈를 활용해서 텍스트 분석을 하였다. 코로나 19 이전인 2019년과 코로나 19 이후인 2020년을 비교하였다. LDA토픽 모형 분석과 딥러닝 기법인 Word2vec을 통해 주요 토픽과 문서분류를 하였다. 연구결과 코로나19 이전에는 정책, 콘텐츠, AI 등이 나타났으나, 코로나 이후에는 데이터를 활용한 금융, 광고, 배달 등으로 점차 영역이 확장되며, 더불어 인재양성 교육이 중요한 이슈로 나타난 것을 알 수 있었다. 또한, 코로나 19 이전에는 4차 산업혁명 기술과 관련된 광고를 활용하는 것이 주류를 이루었다면, 코로나 19 이후에는 참여, 협력, 일상 필요 등 좀 더 적극적으로 첨단기술 자체에 대한 교육과 인재양성 등에 대한 키워드가 두드러지게 나타나고 있다. 따라서 이러한 연구결과는 코로나 19 이후에 4차 산업혁명에서 광고의 나아갈 방향을 제시하면서, 이에 필요한 이론적, 실무적으로 적용할 수 있는 다각적인 전략을 제시하는 데 의의가 있다.

2023 대한민국 디지털 비즈니스 트렌드 인식조사: 학계와 산업계의 다양한 목소리를 들어보다 (2023 Korea Digital Business Trend Study: Listening to Voices from Academia and Industry)

  • 양희동;안현철;이정;강현정
    • 경영정보학연구
    • /
    • 제25권1호
    • /
    • pp.189-212
    • /
    • 2023
  • 본 연구는 언론 분석, 전문가 인터뷰, 대규모 설문조사 등 다양한 방법을 활용하여 2023년에 주목해야할 중요 디지털 비즈니스 트렌드를 도출하였다. 기존 트렌드 연구의 경우 국내 디지털 비즈니스 환경에 특화되어 있지 않고 도출 과정이 투명하지 않아 결과의 객관성에 있어 제한을 갖는 경우가 많은데, 본 연구는 국내 디지털 비즈니스 분야의 다양한 분야의 전문가로부터 다양한 방식으로 의견을 수렴하여 결과의 타당성을 강조하였다. 먼저 국내외 주요 기업의 보고서 외에 국내 IT 언론기사를 수집한 후 토픽모델링 분석방법을 통해 주요 이슈를 도출하였으며, 그 결과를 바탕으로 13인의 학계 및 산업계 전문가와 인터뷰를 진행하였다. 인터뷰 결과 선정된 16개의 후보 트렌드에 대해 210명의 전문가로부터 설문조사를 실시하여 최종 10대 트렌드를 선정하였다. 더불어 해외와 국내와의 시각 비교를 위해 미국 정보화 협회에서 매년 실시하는 설문과 동일한 도구를 이용하여 추가적으로 트렌드 비교 분석을 하였다. 본 연구는 국내 디지털 비즈니스 리더들의 다양한 의견을 과학적으로 수렴하여 국내 비즈니스 환경을 고려한 디지털 비즈니스 트렌드 전망을 도출했다는 점에서 의의가 있으며, 국내의 독특한 IT 트렌드를 파악하고 국제적인 트렌드와 어떤 차이가 있는지 비교 분석함으로써 시장 별 IT 기술 및 서비스 사업의 전략형성에 기여할 것으로 기대한다.

데이터 분석을 통한 UX 방법론 연구 고객 세그먼트 분류를 통한 페르소나 도출을 중심으로 (UX Methodology Study by Data Analysis Focusing on deriving persona through customer segment classification)

  • 이슬이;박도형
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.151-176
    • /
    • 2021
  • 정보기술 산업이 발전됨에 따라 다양한 종류의 데이터가 생겨나고 있고 이를 가공하여 산업에 활용하는 것이 필수인 시대가 되었다. 온 오프라인 상에서 수집된 다양한 디지털 데이터를 분석하여 활용하는것은 산업 내의 고객에게 적합한 경험을 제공하기 위해서 꼭 필요한 과정이다. 새로운 비즈니스, 제품, 서비스를 창출하기 위해서는다방면에서 수집된 고객 데이터를 활용하여잠재고객의 니즈를 깊게 파악하고 행동패턴을 분석하여 숨겨진 욕망의 신호를 잡아내는것이 필수이다. 그러나 효과적인 서비스 개발을 위해서 병행해서 진행되어야 할 데이터 분석, UX 방법론을 활용한 연구는 각각 따로 진행되고 있고 산업 내의 활용 예시가 부족한 것이 사실이다. 본 연구에서는 데이터 분석 방법과 UX 방법론을 응용하여 하나의 프로세스를 제작하였다. 행복을 주제로 진행된 설문조사에서 추출된 고객 데이터를 활용하여 고객의 특성을 파악하기 위한 데이터 분석을 진행하였다. 요인, 회귀분석을 실시하여 행복 데이터 설문의 요인 간의 연관 관계를 확인하였다. 그 다음 연관 관계를 군집을 분류하고 가장 최적의 군집 수를 추출하여분류하였다. 이러한 결과를 바탕으로 교차분석을 진행하여 군집 별로 인구통계학적 특성을 확인하였다. 세그먼트를 분류하기 전 서비스 정의를 하기 위하여 뉴스 기사 및 SNS 문장들을 바탕으로 텍스트 마이닝을 통해 주요 키워드를 바탕으로 아이디어를 도출하였고 이중에 가장 타당한 서비스를 선택하였다. 이러한 결과를 바탕으로 세그먼트및 목표 고객을 선정한 후 세그먼트의 특성대로 대상자를 선정하여 인터뷰를진행하였다. 그 후 특성 및 프로파일정보를 활용하여 페르소나를 제작하여고객의 행동과 최종 목표를 서술하였다. 일반적인페르소나와 데이터를 활용한 페르소나를 비교하여 각각의 특성을 비교 분석하였다. 본 연구를 통해 도출된 프로세스는 다변화되는 서비스의 변화 상황에서 적절한 타겟 고객의 정의 및 정확한 분류 체계로 나뉘어진 고객군을파악 할 수 있는 방법을 제시 한 것에 의의가 있다.