• 제목/요약/키워드: 기사분석

검색결과 1,082건 처리시간 0.033초

생성 AI 기반 뉴스 기사 심리지수를 활용한 부동산 가격 예측 모델 (Predictive Model for Real Estate Prices Using Sentiment Index of news articles based on Generative AI )

  • 김수아;권미주;조수빈;김은수;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1198-1199
    • /
    • 2023
  • 부동산 시장은 다양한 요인에 의해 가격이 결정되며 거시경제 변수뿐 만 아니라 뉴스 기사, SNS 등 다양한 비정형 데이터의 영향을 받는다. 특히 뉴스 기사는 국민들이 느끼는 경제 심리를 반영하고 있어 부동산 가격에 영향을 크게 미치는 변수라고 판단된다. 본 연구에서는 뉴스 기사의 세분화된 감정 분석을 통해 전통적인 분석 방법보다 더 의미 있는 결과를 얻을 수 있는 부동산 가격 예측 모델을 생성하였으며 뉴스 기사로부터 심리 지수를 산출하기 위해 생성 AI 를 활용하였다. 제안하는 매매가격지수 예측 모델을 통해 부동산 시장과 뉴스 기사와의 관계성에 대해 파악할 수 있으며, 사회/경제적 동향을 반영한 부동산 가격 변동을 예측할 수 있을 것으로 보인다.

대통령후보 공약에 대한 언론보도 비교연구: 보수적 언론과 진보적 언론의 내용분석을 중심으로 (A comparative study of news media coverage on the presidential candidate's commitments: applying Content Analysis method)

  • 홍용락
    • 디지털융복합연구
    • /
    • 제15권11호
    • /
    • pp.85-95
    • /
    • 2017
  • 뉴스 미디어는 대통령 후보들의 공약을 보도하면서 주관적 논평을 하며, 이는 정치 커뮤니케이션에서 중요한 의미를 가진다. 본 연구의 목적은 언론의 대통령 후보 공약에 대한 보도 특성과 신문 간 차이를 살펴보고 그 함의를 논의하는 것이다. 보수적 신문과 진보적 신문, 즉 조선일보와 경향신문에 보도된 2주간의 뉴스 기사를 표집하여, 체계화된 코딩유목에 따라 내용분석을 실시하였다. 수집된 기사에 대해 빈도분석과 신문 간 보도 논조의 차이를 검증하기 위해 교차분석을 수행하였고, 분석도구로는 SPSS 통계패키지를 이용하였다. 분석 결과, 기사 제목에서의 논조 차이는 발견되지 않았으나, 기사의 내용적 차원에서는 신문 간 논조 차이가 통계적으로 유의미하게 나타나 연구가설이 검증되었다. 이 같은 연구결과는 보수와 진보적 성격의 신문간 보도 차이로 인한 언론의 프레이밍 효과를 시사한다. 후속 연구로 지난 선거 후보들의 공약 보도와의 비교, 기사 논조의 차이에 대한 언어 사용의 심층적 분석을 위한 네트워크분석, 공약의 신문보도와 방송보도의 비교분석이 제안된다.

공적 이슈에 대한 미디어 보도 분석: 수돗물 관련 기사를 중심으로 (A Study on the Media Coverage of Public Issue: Focusing on Drinking-Water Issues)

  • 김성태;이창호
    • 한국언론정보학보
    • /
    • 제39권
    • /
    • pp.40-68
    • /
    • 2007
  • 수질개선과 아리수 홍보 노력에도 불구하고 일반 국민들의 수돗물에 대한 불신은 여전히 계속되고 있다. 본 연구는 국내의 주요 신문, 텔레비전, 인터넷 신문에 보도된 수돗물 관련 뉴스를 기사 유형 및 내용, 기사 작성자, 취재원, 그리고 뉴스 가치라는 분석 유목을 통해 그 보도 경향을 살펴보았다. 언론에서 다뤄진 주제는 식용수로서의 적합성 논의가 가장 많았고 수돗물 이물질 발견, 수돗물 관련 정부정책, 수도 관련 보도, 수질 검사 결과 순이었다. 기사 본문 내용의 논조를 분석한 결과 인터넷이 가장 부정적인 보도태도를 나타냈다. 기사 작성자의 경우, 일반 취재기자가 작성한 뉴스가 압도적이었고 전문기자가 쓴 경우는 전체 기사의 1% 미만이었다. 결론적으로 수돗물과 같은 공적 이슈를 제대로 보도하기 위해서는 전문기자의 육성이 시급하고 취재원을 다양화시키는 노력이 필요하며 흥미위주의 보도보다 심층적인 접근을 통한 기사 작성이 요구된다고 하겠다.

  • PDF

확장된 6하원칙을 이용한 신문기사 자동요약 (An automatic extraction of newspaper articles using expanded 5WlH)

  • 윤재민;강인수;권오옥;배재학;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.466-468
    • /
    • 2002
  • 본 논문은 신문기사를 추출(Extract)하는데 있어서, 신문기사의 구조적인 특징을 분석한 후, 6하원칙(5W1H)과 전문(Lead)과의 관계를 유추하여 신문기사를 효과적으로 요약하기 위한 방법과 알고리즘을 제안하였다. 본 연구에서는 먼저 신문기사에서 가장 중요한 단락인 전문에서 6하원칙의 각 구성성분을 추출하고, 본문에서는 전문에 나타난 6하원칙의 각 성분이 어떻게 재사용되며 강조되고 있는가를 파악하기 위래 제안된 방법과 알고리즘을 이용하여 중요한 문장을 추출하였다. 실험문서는 조선일보 웹사이트에서 제공하는 신문기사 100건을 대상으로 하였으며 요약율이 20%와 30%일 경우 제안한 방법의 정확률은 각각 82.4%와 74.1%로 기존의 전문기반(Lead-based)방법보다 3.6%와 6.3% 향상되었다.

  • PDF

자질 가중치의 재조정을 통한 감정 분류 (Sentiment Classification Using Feature Reweighting)

  • 서형원;김형철;김재훈;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.145-150
    • /
    • 2009
  • 이 논문은 한글 뉴스 기사의 댓글에 대한 감정 분류 방법을 제안한다. 제안된 방법은 기계학습을 이용하는데 본 논문에서는 자질의 가중치를 재조정하는 좀 색다른 방법을 제안한다. 일반적으로 댓글은 독자들이 특정 기사에 대해서 어떠한 감정을 가지고 있는지를 파악하는 중요한 단서가 된다. 그런데 독자들의 감정은 가사에 어떤 분야에 속하느냐에 영향을 받는다. 예를 들면 정치 기사는 부정적인 댓글은 많이 포함하고 있으며 인물 기사는 긍정적인 기사를 많이 포함한다. 이 논문은 이와 같은 댓글의 속성을 이용해서 기사의 원문과 기사의 분야 정보를 이용하여 가중치를 조정한다. 제안된 시스템의 성능을 평가하기 위해 신문 기사와 댓글을 수집하여 감정 말뭉치를 구축하였으며 감정자질을 추출하기 위해 감정 사전을 구축하였다. 제안된 시스템의 $F_1$ 척도는 92.2%였으며 원문의 감정 단어와 분야 정보가 댓글의 감정을 분류하는데 중요한 자질임을 알 수 있었다.

  • PDF

온라인 과학 기사 텍스트 마이닝을 통해 분석한 에너지 용어 사용의 맥락 (Analyzing Different Contexts for Energy Terms through Text Mining of Online Science News Articles)

  • 오치영;강남화
    • 과학교육연구지
    • /
    • 제45권3호
    • /
    • pp.292-303
    • /
    • 2021
  • 본 연구에서는 일상생활에서 에너지 용어가 사용되는 맥락을 알아보기 위하여 온라인 과학 기사를 수집하여 언어 네트워크, 토픽 모델링 분석 기법을 활용해 에너지 관련 기사에 사용된 용어의 빈도, 용어 네트워크, 기사의 주제를 분석하였다. 분석에 사용된 자료는 2018.3.1.부터 1년간의 온라인 과학 분야의 기사 중 에너지를 검색어로 하여 10개의 국내 중앙지에서 검색 및 선정된 2,171편이다. 이 기사들을 자연어 처리하여 51,224개의 문장과 507,901개의 단어로 데이터를 구성하였다. R 프로그램을 활용하여 용어 빈도수 분석 및 언어 네트워크 분석을 실시하였고, 에너지 용어 사용의 맥락 탐색을 위해 구조적 토픽 모델링 분석을 적용해 기사의 주제를 도출하였다. 기사에 사용된 용어 중 빈도수가 유난히 높은 용어는 기술, 연구, 개발로 새로운 소식을 알리는 기사의 특성을 반영한 것으로 나타났다. 한편, 기사 2편당 한 번 이상의 빈도로 사용되는 용어에는 산업 관련 용어(산업, 제품, 시스템, 생산, 시장)와 '전기', '환경'과 같이 에너지 관련 용어로 충분히 기대되는 용어들이 있었다. 한편, 에너지 관련 과학 수업에서 자주 사용되는 '태양', '열', '온도', '발전'도 빈도수 상위에 속하는 용어로 드러났다. 용어 네트워크 분석에서는 산업 및 기술과 관련된 용어와 기초과학 및 연구 관련 용어들이 약한 강도이지만 서로 군집을 이루는 것을 확인하였다. 한편, 에너지와 쌍을 이루는 용어의 분석에서는 '에너지 효율'을 비롯해 '에너지 절감', '에너지 소비' 등과 같이 에너지의 사용에 관한 용어들이 다수를 이루고 그 사용 빈도가 가장 높았다. 에너지 용어가 사용되는 맥락은 16개의 주제를 분류한 4가지 영역으로 '첨단산업', '산업', '기초과학', '환경 및 건강'으로 나타났다. 에너지 사용 관련 용어가 상당히 많이 사용된다는 결과는 에너지 수업의 시작점으로 에너지 저급화 개념의 도입이 효과적일 수 있음을 시사한다. 또한, 첨단산업이나 환경 및 건강의 맥락을 에너지 학습에 도입할 필요성도 보여준다. 본 연구에서 드러난 16개 주제에서 보이는 다양한 에너지 용어가 사용되는 맥락을 재구성해 에너지 관련 수업에 활용한다면 학생들이 학교에서의 에너지 학습과 일상적 상황을 통합적으로 인식하는 데 도움이 될 것이다.

텍스트 마이닝 기법을 활용한 동남권 신공항 신문기사 분석 (Analysis of News Regarding New Southeastern Airport Using Text Mining Techniques)

  • 한무명초;김양석;이충권
    • 스마트미디어저널
    • /
    • 제6권1호
    • /
    • pp.47-53
    • /
    • 2017
  • 사회적 이슈는 정책의 방향을 결정하는 중요한 요인이며, 신문은 사회적 이슈를 반영하는 중요한 채널이다. 신문기사의 텍스트를 분석하는 것은 사회적 이슈를 이해하는 데 기여할 수 있지만, 대규모의 비정형 데이터인 뉴스를 수작업으로 분석하는 것은 매우 어렵다. 따라서 본 연구는 텍스트 분석기법과 연관분석 기법을 활용해 비정형 신문기사 내용을 정형화하여 사회적 이슈의 이해관계자들 간 관점 차이를 시스템적으로 분석하는 것을 목적으로 한다. 본 연구 수행을 위해 각 지역을 대표하는 신문사(조선일보, 중앙일보, 동아일보, 매일신문, 부산일보)를 선정한 후 기사 115건과 댓글 6,772건을 2주간 수집하여 분석하였다. 연구 결과 전국 일간지들은 해당 지역과 정치적인 관계에 초점을 맞춘 반면에, 지역 일간지들은 속해 있는 지자체를 대변하는 논조로 기사가 작성된 측면이 강하게 나타났다.

R기반 데이터마이닝 분석을 통한 상수관망 자료 활용가능성 제시 (Presenting the possibility of using water pipe network data through R-based data mining analysis)

  • 홍성진;이찬욱;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.236-236
    • /
    • 2020
  • 데이터마이닝은 빅데이터를 활용하는데 주로 활용되는 기술이다. 빅데이터 활용의 중요성이 증대됨에 따라 빅데이터를 기반으로 데이터마이닝을 활용한 생산, 금융, 통신 등의 성공적인 활용사례가 있지만 상수도 시설물에 적용한 사례는 드물다. 본 연구에서는 R프로그램을 기반으로 확보하기 어려운 데이터를 얻고자 관련 기사를 수집하고 데이터마이닝의 주요 기능인 분류, 군집(K-means)분석을 수행하였다. 예를들어, 상수관로의 정밀한 누수 분석을 위해서는 관경, 매설년도 등의 세분화된 자료가 필요하나 이러한 자료들은 쉽게 확보할 수 없다는 한계를 갖고 있다. 이러한 관점에서 상수관망 단수, 누수 등의 키워드를 통해 얻을 수 있는 기사를 기반으로 주요 키워드에 대한 군집분석을 수행하여 세분화된 상수관망 자료를 획득 및 분석하였다. 단수, 누수 키워드 기사에 의해 관경정보 등 파손된 관로의 정보를 확보할 수 있는 것으로 나타났으며 향후 확보하기 어려운 데이터를 보완할 수 있는 방법 중 하나로 활용될 수 있을것으로 기대된다. 그러나, 데이터의 양과 보다 정교한 군집분석을 위한 키워드설정 등의 추가연구가 필요할 것으로 판단된다.

  • PDF

정기간행물기사 색인서비스의 포괄성 측정에 관한 연구 -국어학 문헌을 중심으로- (An Indexing Coverage Study of Periodical Literature in a Subject Area of Korean Language)

  • 장혜란
    • 정보관리학회지
    • /
    • 제11권1호
    • /
    • pp.17-29
    • /
    • 1994
  • 서지대조법을 활용하여 국내 정기간행물기사 색인서비스의 포괄성을 측정하였다. "국어학논저목록집"으로 부터 추출한 국어정책 분야의 문헌 675건을 기본서지로 하여 "정기간행물기사색인"과 국어국문학논문목록" 두 가지의 색인서비스를 탐색하여 포함여부를 조사하였다. 분석결과 1977년 부터 1990년까지 출판된 문헌에 대한 "정기간행물기사색인"의 포괄성은 약 63%, 1986년 부터 1990년까지 출판된 문헌에 대한 "국어국문학논문목록"의 포괄성은 약 33%, 두 서비스의 통합포괄성은 약78%로 나타났다. 그밖에 두 서비스의 중복성, 유일성 등이 측정되었으며 수록된 문헌의 주제별 분석과 제외된 문헌의 수록잡지에 대한 분석도 수행되었다.며 수록된 문헌의 주제별 분석과 제외된 문헌의 수록잡지에 대한 분석도 수행되었다.

  • PDF

온라인 빅 데이터 분석 결과와 상수도 통계 비교를 통한 데이터 가치 추출 (Data value extraction through comparison of online big data analysis results and water supply statistics)

  • 홍성진;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.431-431
    • /
    • 2021
  • 4차 산업혁명의 도래로 사회기반시설물의 계획 및 운영관리에 있어 데이터 분석을 통한 가치추출에 대한 관심은 매우 높은 상황이다. 데이터의 가용성과 접근성, 정부 지원 등을 평가하는 공공데이터 개방지수에서 한국은 1점 만점에 0.93점을 획득하여 경제협력개발기구 회원국 중 1위(2019년 기준)를 할 정도로 매우 높은 수준(평균 0.60점)이다. 그러나 공식적으로 발표 및 배포되는 사회기반시설물 관련 정보와 심도 있는 연구 분석이 필요한 정보는 접근이 여전히 제한적이라 할 수 있다. 특히 대표적인 사회기반시설물인 상수도시스템은 대부분 국가중요시설로 지정되어 있어 다양한 정보를 획득하고 분석하는데 제약이 존재하며, 관련 국가통계인 상수도통계에서는 누수사고 등과 같은 비정상적 상황에 대한 사고지점, 원인 등과 같은 세부정보는 제공하고 있지 않다. 본 연구에서는 웹크롤링 및 빅데이터 분석기술을 활용하여 과거 일정기간 발생한 지자체의 상수도 누수사고 관련 뉴스를 전수조사하고 도출된 사고건수를 국가 공인 정보인 상수도통계자료와 비교·분석하였다. 독립적인 누수사고 기사를 추출하기 위해서 중복기사의 제거, 누수 관련 키워드 정립, 상수도분야 이외의 관련기사 제거 등의 절차가 필요하며, 이와 같은 기법은 R프로그래밍을 통해 구현되었다. 추가적으로 뉴스기사의 자연어 처리기반 정보추출기법을 통해 누수사고 건수 뿐만 아니라 사고발생일, 위치, 원인, 피해정도, 그리고 대상 관로의 크기 등을 획득하여 상수도 통계에서 제시하고 있는 정보보다 많은 가치를 추출하여 연계할 수 있는 방안을 제시하였다. 제시된 방법론을 국내 A광역시에 적용하여 누수사고 건수를 비교한 결과 상수도통계에서 제시하고 있는 누수발생건수와 유사한 규모의 사고건수를 뉴스기사분석을 통해 도출할 수 있었다. 제안된 방법론은 추가적인 정보의 추출이 가능하다는 점에서 향후 활용성이 높을 것으로 기대된다.

  • PDF