• 제목/요약/키워드: news topic

검색결과 236건 처리시간 0.025초

텍스트 분석의 신뢰성 확보를 위한 스팸 데이터 식별 방안 (Detecting Spam Data for Securing the Reliability of Text Analysis)

  • 현윤진;김남규
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.493-504
    • /
    • 2017
  • 최근 뉴스, 블로그, 소셜미디어 등을 통해 방대한 양의 비정형 텍스트 데이터가 쏟아져 나오고 있다. 이러한 비정형 텍스트 데이터는 풍부한 정보 및 의견을 거의 실시간으로 반영하고 있다는 측면에서 그 활용도가 매우 높아, 학계는 물론 산업계에서도 분석 수요가 증가하고 있다. 하지만 텍스트 데이터의 유용성이 증가함과 동시에 이러한 텍스트 데이터를 왜곡하여 특정 목적을 달성하려는 시도도 늘어나고 있다. 이러한 스팸성 텍스트 데이터의 증가는 방대한 정보 가운데 필요한 정보를 획득하는 일을 더욱 어렵게 만드는 것은 물론, 정보 자체 및 정보 제공 매체에 대한 신뢰도를 떨어뜨리는 현상을 초래하게 된다. 따라서 원본 데이터로부터 스팸성 데이터를 식별하여 제거함으로써, 정보의 신뢰성 및 분석 결과의 품질을 제고하기 위한 노력이 반드시 필요하다. 이러한 목적으로 스팸을 식별하기 위한 연구가 오피니언 스팸 탐지, 스팸 이메일 검출, 웹 스팸 탐지 등의 분야에서 매우 활발하게 수행되었다. 본 연구에서는 스팸 식별을 위한 기존의 연구 동향을 자세히 소개하고, 블로그 정보의 신뢰성 향상을 위한 방안 중 하나로 블로그의 스팸 태그를 식별하기 위한 방안을 제안한다.

태양계 인터넷이 심우주 탐사에 미치는 영향 분석 (Analysis of effectiveness of solar system internet to deep space exploration)

  • 구철회;김창균;류동영;최기혁
    • 한국항공우주학회지
    • /
    • 제44권3호
    • /
    • pp.240-246
    • /
    • 2016
  • 근래 우주 과학 및 연구의 가장 뜨거운 뉴스 또는 성과는 2013년 NASA의 화성 로버인 Curiosity, 2013년 중국의 달 착륙선/로버인 Chang'e 3 호, 2014년 ESA의 67P/Churyumov-Gerasimenko 소행성 탐사선 Rosetta, 그리고 2015년 NASA의 명왕성 탐사선 New Horizons 일 것이다. 이와 같은 장거리 심우주 탐사가 현 기술로 가능하다는 것에 매우 고무될 수밖에 없다. 하지만 이런 놀라운 심우주 항행 기술의 발전에도 불구하고 심우주 데이터 통신 기술 영역은 이렇다 할 변화가 없었다. 이 영역은 큰 변화를 현재까지 거부해 왔으나 최근 들어 지상의 우수한 통신 기술들을 심우주 탐사에 적용하려는 움직임이 관찰되고 있음에 주목할 필요가 있다. 그중에 하나가 본 논문에서 다루려고 하는 태양계 인터넷 기술이다. 본 논문에서 심우주 탐사에 태양계 인터넷이 미치는 영향을 분석하여 발표하고자 한다.

비정형, 정형 데이터의 이미지 학습을 활용한 시장예측 (MPIL: Market prediction through image learning of unstructured and structured data)

  • 이윤선;이주홍;최범기;송재원
    • 스마트미디어저널
    • /
    • 제10권2호
    • /
    • pp.16-21
    • /
    • 2021
  • 금융 시계열 분석은 현대 사회의 경제적, 사회적으로 매우 중요한 역할을 하며 세계 발전에 영향을 미치는 중요한 과제지만 많은 잡음(noise)과 불확실성 등의 어려움으로 인해 금융 시계열 분석 예측은 어려운 연구 주제이다. 본 논문에서는 비정형 데이터와 정형 데이터를 함께 이미지로 변환하여 시장을 예측 하는 방법(MPIL)을 제안한다. 시장 예측을 위해 n일 기간의 비정형 데이터인 SNS, 뉴스 데이터를 감정분석하고 정형 데이터인 시장 데이터를 GADF 알고리즘으로 이미지 변환하고 이미지 학습을 통해 n+1일의 가격을 예측하는 초단기 시장을 예측한다. MPIL은 평균 정확도 56%로 기존 시장예측에 사용되던 감정분석을 활용하여 LSTM으로 시장을 예측하는 모델 평균 정확도 50%보다 높은 정확도를 보였다.

IoT 센서를 활용한 미세먼지 분석 기술 개발 (Development of Fine Dust Analysis Technology using IoT Sensor)

  • 신동진;이진;허민희;황승연;이용수;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.121-129
    • /
    • 2021
  • 최근 중국에서 발생하는 황사와 더불어 국내에서는 뉴스 등 미디어를 통해 미세먼지가 큰 화제가 되고 있다. 외부에서 발생하는 미세먼지도 있지만, 외부 미세먼지가 내부로 유입되면서 공기 청정기 제품의 구입율이 높아지고 있다. 공기 청정기는 내부에 필터를 사용하고 있으며, 센서를 통해 필터의 교체 유무를 LED 알람을 통해 사용자에게 알려준다. 하지만, 현재 필터율이 얼마나 감소하였는지 측정하고, 작동하는 송풍기의 압력을 결정해주는 제품은 없는 상태이다. 따라서 본 논문에서는 IoT 기기인 아두이노와 미세먼지 센서, 차압 센서를 활용하여 데이터를 직접 생성하고, 측정된 미세먼지와 압력 값을 계산하여 필터율에 따라 필터가 얼마나 노화되었는지 확인할 수 있는 프로그램을 파이썬 프로그래밍을 이용하여 개발하였다.

뉴스 데이터 마이닝을 통한 배달 플랫폼 참여자의 사회적 이슈 분석 (Exploring Social Issues of On-demand Delivery Platform Participants)

  • 박수경;이현준;이봉규
    • 디지털융복합연구
    • /
    • 제19권7호
    • /
    • pp.79-85
    • /
    • 2021
  • 코로나19 이후 배달 플랫폼에 참여하는 개인이 증가하고 있다. 이러한 현상은 좀 더 나은 미래 설계를 위하여 한 개 이상의 소득원을 확보한다는 엔(n)잡러 세태와 맞물려, 더욱 관심이 고조되고 있다. 그러나 아직 해당 현상에 관한 학술적 논의는 매우 부족하다. 이에, 본 연구는 코로나 19가 시작된 2019년 1월부터 현시점까지의 기간을 연구대상으로, 관련 뉴스 데이터에 대한 텍스트 마이닝을 통한 사회적 논의주제를 발굴하고자 하였다. 결과는 현상에 대한 소개, 참여자 속성에 대한 논의, 그들의 수익에 관한 관심, 좋은 일자리인지에 대한 담론, 그리고 그들을 둘러싼 우려라는 주제로 함축·제시하였다. 본 연구는 배달 플랫폼 비즈니스와 관련된 논의의 관점을 개인 참여자로 확대하여 현상을 체계적으로 조망하였다는데 의의가 존재한다. 본 연구를 기반으로, 향후 감성분석 결합을 통하여 특정 주제에 관한 긍정·부정 감성조망 등 해당 현상을 둘러싼 더욱 세밀한 사회적 담론 분석이 형성되길 기대한다.

네트워크 이론을 이용한 한국과 베트남의 관심어 차이 분석 - 스마트시티를 중심으로 (Analysis of the different of Interest words between Korea and Vietnam using network theory - Focusing on smart city)

  • 정성윤;김남곤
    • 스마트미디어저널
    • /
    • 제11권8호
    • /
    • pp.73-83
    • /
    • 2022
  • 본 연구는 정보력이 약한 신생 건설엔지니어링 기업이 해외 건설시장에 성공적으로 진출할 수 있도록 지원하기 위한 일환으로 해외 건설시장에서 관심을 갖는 관심어가 무엇이고, 우리나라와 어떤 차이가 있는지를 분석하고자 하였다. 이를 위해 최근 한국과 베트남에서 관심이 높은 스마트시티를 대상으로 2,473개의 뉴스 기사 제목과 주요 기사를 수집하였다. 네트워크 구성과 토픽 모델링을 통해 관심어와 관심어 간의 연결 관계를 살펴 보았다. 또한, 페이지랭크 중심성을 사용하여 네트워크에서 관심어의 영향력을 측정하였다. 이러한 분석을 통해 양국에서 스마트시티 관련 구축, 도시, 디지털에 대한 관심이 높은 것을 알 수 있었으며, 한국과 베트남이 갖는 관심어의 차이를 유추하였다. 끝으로, 본 연구가 갖는 제약과 이를 보완하기 위한 추가적인 연구 방향을 제시하였다.

코로나19 발생 후 지역농산물 이용 간편식에 대한 시장 이슈 변화: 온라인 빅데이터의 텍스트마이닝 (Change in Market Issues on HMR (Home Meal Replacements) Using Local Foods after the COVID-19 Outbreak: Text Mining of Online Big Data)

  • 주유정;변우진;윤지현
    • 한국식생활문화학회지
    • /
    • 제38권1호
    • /
    • pp.1-14
    • /
    • 2023
  • This study was conducted to explore the change in the market issues on HMR (Home Meal Replacements) using local foods after the COVID-19 outbreak. Online text data were collected from internet news, social media posts, and web documents before (from January 2016 to December 2019) and after (from January 2020 to November 2022) the COVID-19 outbreak. TF-IDF analysis showed that 'Trend', 'Market', 'Consumption', and 'Food service industry' were the major keywords before the COVID-19 outbreak, whereas 'Wanju-gun', 'Distribution', 'Development', and 'Meal-kit' were main keywords after the COVID-19 outbreak. The results of topic modeling analysis and categorization showed that after the COVID-19 outbreak, the 'Market' category included 'Non-face-to-face market' instead of 'Event,' and 'Delivery' instead of 'Distribution'. In the 'Product' category, 'Marketing' was included instead of 'Trend'. Additionally, in the 'Support' category, 'Start-up' and 'School food service' appeared as new topics after the COVID-19 outbreak. In conclusion, this study showed that meaningful change had occurred in market issues on HMR using local foods after the COVID-19 outbreak. Therefore, governments should take advantage of such market opportunity by implementing policy and programs to promote the development and marketing of HMR using local foods.

착용 의무 해제에도 마스크를 쓰는 이유 -뉴스 빅데이터 분석으로 확인한 불확실성하의 선택 (Why Are People Wearing Masks When They Are Relieved of Their Obligation? -Choosing Under Uncertainty by News Big Data Analysis)

  • 서기량;이상기
    • 문화기술의 융합
    • /
    • 제9권4호
    • /
    • pp.113-119
    • /
    • 2023
  • 코로나19 방역정책의 주요 수단이었던 마스크 의무착용이 해제되었음에도 불구하고, 일부 시민들이 여전히 마스크를 착용하고 있는 현상에 주목하여 왜 일부 시민들은 마스크를 벗지 않는지를 밝히고자 했다. 이와 관련한 여론조사 등을 통해 일부 시민들이 마스크를 계속 쓰는 이유를 큰 맥락에서 확인할 수 있었다. 본 논문에서는 시민들의 행동과 태도에 적지 않은 영향을 미치는 언론기사에서 마스크 착용의무 해제와 관련한 사안을 어떻게 보도했는지를 분석(토픽 모델링 및 의미연결망 분석)함으로써, 시민들이 마스크를 계속 착용하는 이면을 직⋅간접적으로 확인해보고자 했다. 이를 통해 코로나19 엔데믹이 선언되지 않은 불확실한 상황 속에서 시민들이 스스로를 보호하기 위해, 방역당국의 의무착용 해제 발표에도 불구하고 마스크를 계속 쓰는 것을 확인할 수 있었다. 향후 코로나19와 같은 위기가 자주 반복될 것으로 예측되는 상황에서 방역당국의 신뢰 형성이 중요하다는 것을 결론으로 제시했다.

빅데이터를 활용한 색조화장품의 구매 요인에 관한 연구: 토픽모델링과 Concor 분석을 중심으로 (A Study on the Purchasing Factors of Color Cosmetics Using Big Data: Focusing on Topic Modeling and Concor Analysis)

  • 이은희;배승희
    • 한국응용과학기술학회지
    • /
    • 제40권4호
    • /
    • pp.724-732
    • /
    • 2023
  • 본 연구에서는 코로나 이후 색조화장품 시장의 소비자들의 온라인 관심 정보에 대한 자료 수집을 통하여 색조화장품 정보 검색의 특성과 텍스트 마이닝 분석 결과에 나타난 코로나 이후 색조화장품 시장의 주요 관심정보들을 분석하고자 하였다. 실증분석에서는 "색조화장품" 이라는 단어를 포함하는 뉴스, 블로그, 카페, 웹페이지 등의 모든 문서들을 분석 대상으로 텍스트 마이닝을 수행하였다. 분석 결과 코로나 이후 색조화장품에 대한 온라인 정보 검색은 주로 구매 정보와 피부와 마스크 관련 화장법 등에 관한 정보와 관심 브랜드와 행사 정보 등의 주요 토픽이 주를 이루고 있었다. 결과적으로 코로나 이후 색조화장품 구매자들은 적극적인 온라인 정보 검색을 통하여 제품 가치와 안전성, 가격 혜택, 매장 정보 등의 구매 정보에 더욱 민감하게 될 것이므로 이에 대한 대응전략이 요구된다.

비정형 텍스트 분석을 활용한 이슈의 동적 변이과정 고찰 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 임명수;김남규
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.1-18
    • /
    • 2016
  • 최근 가용한 텍스트 데이터 자원이 증가함에 따라 방대한 텍스트 분석을 통해 새로운 가치를 창출하고자 하는 수요가 증가하고 있다. 특히 뉴스, 민원, 블로그, SNS 등을 통해 유통되는 글로부터 다양한 이슈를 발굴해내고 이들 이슈의 추이를 분석하는 이슈 트래킹에 대한 연구가 활발하게 이루어지고 있다. 전통적인 이슈 트래킹은 토픽 모델링을 통해 오랜 기간에 걸쳐 지속된 주요 이슈를 발굴한 후, 각 이슈를 구성하는 문서 수의 세부 기간별 분포를 분석하는 방식으로 이루어진다. 하지만 전통적 이슈 트래킹은 각 이슈를 구성하는 내용이 전체 기간에 걸쳐 변화 없이 유지된다는 가정 하에 수행되기 때문에, 다양한 세부 이슈가 서로 영향을 주며 생성, 병합, 분화, 소멸하는 이슈의 동적 변이과정을 나타내지 못한다. 또한 전체 기간에 걸쳐 지속적으로 출현한 키워드만이 이슈 키워드로 도출되기 때문에, 핵실험, 이산가족 등 세부 기간의 분석에서는 매우 상이한 맥락으로 파악되는 구체적인 이슈가 오랜 기간의 분석에서는 북한이라는 큰 이슈에 함몰되어 가려지는 현상이 발생할 수 있다. 본 연구에서는 이러한 한계를 극복하기 위해 각 세부 기간의 문서에 대한 독립적인 분석을 통해 세부 기간별 주요 이슈를 도출한 후, 각 이슈의 유사도에 기반하여 이슈 흐름도를 도출하고자 한다. 또한 각 문서의 카테고리 정보를 활용하여 카테고리간의 이슈 전이 패턴을 분석하고자 한다. 본 논문에서는 총 53,739건의 신문 기사에 제안 방법론을 적용한 실험을 수행하였으며, 이를 통해 전통적인 이슈 트래킹을 통해 발굴한 주요 이슈의 세부 기간별 구성 내용을 살펴볼 수 있을 뿐 아니라, 특정 이슈의 선행 이슈와 후행 이슈를 파악할 수 있음을 확인하였다. 또한 카테고리간 분석을 통해 단방향 전이와 양방향 전이의 흥미로운 패턴을 발견하였다.