• 제목/요약/키워드: news analysis

검색결과 1,115건 처리시간 0.025초

헬스케어 분야 빅데이터 분석을 위한 개체명 사전구축에 새로운 역 N-Gram 적용 연구 (A Study on Applying Novel Reverse N-Gram for Construction of Natural Language Processing Dictionary for Healthcare Big Data Analysis)

  • 이경현;백락준;김우수
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.391-396
    • /
    • 2024
  • 본 연구에서는 헬스케어 분야에 특화된 개체명 사전을 구축하기 위해 기존 N-Gram 방식의 한계를 극복하고 성능을 향상하게 시키기 위해 새로운 역 N-Gram 방식을 제안하였다. 제안된 역 N-Gram 방식은 헬스케어 관련 빅데이터의 복잡한 언어적 특성을 더 정밀하게 분석하고 처리할 수 있다. 제안된 방식의 효율성 검증을 위해 매년 1월에 개최되는 소비자 가전 전시회(Consumer Electronics Show: CES) 기간 동안 발표된 헬스케어 및 디지털 헬스케어 관련 빅데이터를 수집하기 위하여 뉴스를 대상으로 2010년 1월 1일부터 31일, 그리고 2024년 1월 1일부터 31일까지 언급된 2,185건의 뉴스 제목 및 요약문을 파이썬 프로그래밍언어로 새로운 역 N-Gram 방식을 구현하여 전처리한 결과, 헬스케어 분야에서의 자연어 처리를 위한 사전이 안정적으로 구축되었음을 확인할 수 있었다.

트윗 데이터를 활용한 IT 트렌드 분석 (An Analysis of IT Trends Using Tweet Data)

  • 이진백;이충권;차경진
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.143-159
    • /
    • 2015
  • 불확실한 환경변화에 대처하고 장기적 전략수립을 위해 기업에게 있어서 IT 트렌드에 대한 예측은 오랫동안 중요한 주제였다. IT 트렌드에 대한 예측을 기반으로 새로운 시대에 대한 인식을 하고 예산을 배정하여 빠르게 변화하는 기술의 추세에 대비할 수 있기 때문이다. 해마다 유수의 컨설팅업체들과 조사기관에서 차년도 IT 트렌드에 대해서 발표되고는 있지만, 이러한 예측이 실제로 차년도 비즈니스 현실세계에서 나타났는지에 대한 연구는 거의 없었다. 본 연구는 현존하는 빅데이터 기술을 활용하여 서울지역을 중심으로 지난 8개월동안(2013년 5월1일부터 2013년12월31까지) 정보통신산업진흥원과 한국정보화진흥원에서 2012년 말에 발표한 IT 트렌드 토픽이 언급된 21,589개의 트윗 데이터를 수집하여 분석하였다. 또한 2013년에 나라장터에 올라온 프로젝트들이 IT트렌드 토픽과 관련이 있는지 상관관계분석을 실시하였다. 연구결과, 빅데이터, 클라우드, HTML5, 스마트홈, 테블릿PC, UI/UX와 같은 IT토픽은 시간이 지날수록 매우 빈번하게 언급되어졌으며, 이 같은 토픽들은 2013년 나라장터 공고 프로젝트 데이터와도 매우 유의한 상관관계를 가지고 있는 것을 확인할 수 있었다. 이는 전년도(2012년)에 예측한 트렌드들이 차년도(2013년)에 실제로 트위터와 한국정부의 공공조달사업에 반영되어 나타나고 있는 것을 의미한다. 본 연구는 최신 빅데이터툴을 사용하여, 유수기관의 IT트렌드 예측이 실제로 트위터와 같은 소셜미디에서 생성되는 트윗데이터에서 얼마나 언급되어 나타나는지 추적했다는 점에서 중요한 의의가 있고, 이를 통해 트위터가 사회적 트랜드의 변화를 효율적으로 추적하기에 유용한 도구임을 확인하고자 할 수 있었다.

텍스트 마이닝을 활용한 저출산 정책과 대중인식 비교 (Comparative Analysis of Low Fertility Policy and the Public Perceptions using Text-Mining Methodology)

  • 배기련;문현정;이재일;박미나;박아름
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.29-42
    • /
    • 2021
  • 한국의 저출산 심화에 따라 본 연구는 정부의 저출산 대응정책과 그에 대한 대중인식을 비교하여 근본적인 차이점을 밝히고자 했다. 이를 위해 네 차례의 '저출산·고령사회 기본계획'과 제3·4차 기본계획 발표 직후 2주간의 뉴스 댓글을 분석대상으로 선정하여, 빈도분석, 동시출현단어 분석, 구조적 등위성 분석을 실시하였다. 정책문서 빈도분석결과 제1·2차 시기는 직접적인 보육지원이, 제3·4차 시기부터는 사회구조적인 접근이 눈에 띄었다. 동시출현단어 분석에서는 정책과 댓글 모두 '육아'에서 일과 가정의 양립을 지향하였다. '결혼'과 '출산'의 경우 댓글은 연속성, 정책은 단절성이 두드러지며 특히 주거와 고용문제에서 큰 차이가 있었다. 댓글의 구조적 등위성 분석 결과에서는 대중들의 자녀 양육환경에 대한 관심, 정책 실효성에 대한 문제의식을 확인할 수 있었다. 본 연구는 빅데이터를 활용해 대중들의 인식을 확인하였다는 점에서 의의를 가지므로, 이에 근거한 정책 개선 등 향후 저출산 대응이 나아가야 할 방향을 수립하는 데 도움을 줄 수 있을 것이다.

빅데이터 분석을 통한 무인계산대 사용자 경험에 관한 연구 (A study on the User Experience at Unmanned Checkout Counter Using Big Data Analysis)

  • 김애숙;정선미;류기환;김희영
    • 문화기술의 융합
    • /
    • 제8권2호
    • /
    • pp.343-348
    • /
    • 2022
  • 본 연구는 SNS 빅데이터를 활용하여 소비자들이 인지하는 무인계산대에 대한 사용자 경험을 분석하고자 한다. 이 연구를 위하여 네이버(NAVER)와 다음(Daum)에서 블로그, 뉴스, 지식인, 카페, 지식인(팁), 웹 문서를 대상으로 분석하였고 자료 검색을 위한 키워드는 '무인계산대'를 사용하였다. 자료 분석 기간을 2020년 1월1일부터 2021년 12월 31일까지 2년으로 선정하였다. 자료수집 및 분석을 위해서는 텍스톰(TEXTOM)을 통하여 빈도 및 매트릭스 데이터를 추출하였고 UCINET 6 프로그램의 NetDraw 기능을 이용해 네트워크 분석과 시각화 분석을 실시하였다. 그 결과 무인계산대는 소비자들의 경험요소 정의에 따라 접근성, 사용성, 지속사용의도, 기타로 군집화하였다. 공급자 측면에서 최저임금 인상과 근로시간 단축에 따른 문제를 해결하기 위해 무인계산대가 무분별하게 확산된다면 사회적 관점에서 더 큰 고용문제가 발생할 것이다. 아울러 무인계산에 익숙하지 않은 노인과 젊은 세대, 어린이, 외국인 등을 위해 쉽고 편리한 무인계산대 보급을 위한 제도화가 필요하다.

모바일 간편 결제 서비스 활성화 전략 : 토픽 모델링과 PEST - SWOT 분석 방법론을 기반으로 (Proposal of Promotion Strategy of Mobile Easy Payment Service Using Topic Modeling and PEST-SWOT Analysis)

  • 박성우;김세형;강주영
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.365-385
    • /
    • 2022
  • 간편 결제 서비스는 간편 인증 수단을 이용한 결제 및 송금 서비스이다. 코로나 19로 인해 온라인 거래가 증가하면서 간편 결제 서비스 이용이 증가하고 있다. 이와 함께 네이버페이, 카카오페이, 토스와 같은 전자금융업이 간편 결제 시장의 경쟁 구도를 다각화하고 있다. 해외의 핀테크 기업인 PayPal과 Alibaba는 자국 내 독보적인 점유율을 보유하고 있지만, 국내 간편 결제 시장은 독보적인 점유율을 차지하고 있는 업체가 없어 경쟁이 심화되고 있다. 본 연구에서는 간편 결제 시장 참여자를 전자금융업자, 휴대폰 제조업자, 금융회사로 분류하고, 각 업종의 대표적인 서비스들에 대해 SWOT 분석을 진행하였다. 구글 플레이스토어 실 사용자 후기를 토픽모델링 기법을 사용하여 분석하였고, 긍정 토픽을 강점으로 부정 토픽을 약점으로 활용하였다. 또한, 뉴스 기사를 P(정치), E(경제), S(사회), T(기술)로 나누어 토픽모델링을 진행하여 간편 결제 서비스에 대한 기회와 위협을 도출하였다. 본 연구를 통해 간편 결제 시장 참여자가 자사의 서비스 역량을 확인할 수 있도록 하고, 서비스별로 간편 결제 시장에서 우위를 점할 수 있는 서비스 활성화 전략을 제안하고자 한다.

지역정체성 연구와 지역신문의 활용 -지리학적 연구주제의 탐색- (Regional Identity and Community Paper: A Search for Subject and Method of Geographical Research)

  • 이영민
    • 한국지역지리학회지
    • /
    • 제5권2호
    • /
    • pp.1-14
    • /
    • 1999
  • 한국의 지역사회는 근대화 및 세계화시대를 거치면서 중앙에의 종속성 심화와 세계자본에의 식민화 가능성 증대라는 위기의 상황에 봉착해 있다. 이러한 시대적 상황을 타개하기 위해서는 무엇보다도 일상생활과 생활공간에 있어서의 대응 전략이 요망되며, 그러한 전략 개발의 바탕이 되는것이 바로 지역정체성의 확립이다. 최근 지리학계에서 소지역, 즉 일상생활공간에 대한 관심이 고조되고 있는 것은 이러한 이유 때문이라고 할 수 있다. 하지만 소지역연구에 대한 이론적 논의들은 많이 있어 왔으나, 구체적인 소지역을 대상으로 한 경험적 연구는 그리 많지 않은데, 이는 연구를 위한 자료와 방법의 제한성과 관련이 있다고 판단된다. 지역신문은 대체로 행정구역상 군, 중소도시, 대도시의 구 단위의 소지역에서 발간되는 신문으로, 지역에 밀착된 작은 뉴스들이나 생활정보 등을 주요 기사로 다루고 있다. 따라서 지역신문은 지역정체성을 확인하고, 그 형성 메카니즘을 분석할 수 있는 귀중한 자료인 것이다. 지역신문에 관한 지리학적 관심은 우선 지역신문의 지리적 분포 현황과 그 시기별 변천을 추적, 정리하는 작업으로부터 구체화되어야 할 것이다. 또한 지역의 성격을 밝히기 위한 정보원으로써도 적극 활용될 수 있을 것이다. 그리고 지역신문을 통한 공동체 구성원들의 통합 과정과 이를 배경으로 한 지역의 중심성, 흑은 자생력의 확보 여부에 대해서도 연구가 이루어져야 할 것이다.

  • PDF

국내 주요 10대 기업에 대한 국민 감성 분석: 다범주 감성사전을 활용한 빅 데이터 접근법 (Public Sentiment Analysis of Korean Top-10 Companies: Big Data Approach Using Multi-categorical Sentiment Lexicon)

  • 김서인;김동성;김종우
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.45-69
    • /
    • 2016
  • 최근에 빅 데이터를 활용하여 감성을 측정하는 시도가 활발히 이루어지고 있다. 통신 매체와 SNS의 발달로 기업은 국민의 감성을 파악하고 즉시 대응해야할 필요성이 생겼다. 우리나라의 경제는 대기업에 대한 의존도가 높기 때문에 10대 기업에 대한 감성분석은 의미가 있다고 할 수 있다. 이러한 측면에서 본 연구는 다 범주를 기준으로 구축한 감성사전을 활용하여 우리나라 10대 기업에 대한 감성을 분석하였다. 빅 데이터를 이용하여 감성을 분석한 기존의 선행연구는 감성을 차원으로 분류하는 경향이 있다. 차원적 감성으로 감성을 분류하는 것은 분류의 기준이 학술적으로 증명되었기에 감성 분석에 주로 사용되어 왔지만 전문가 정도의 지식이 있어야 분류할 수 있어 보편적인 감성을 대변하는 데 비효과적이기에 보완이 필요하다고 할 수 있다. 개별 범주적 감성은 이 점을 보완할 수 있는 분류 방식으로 일정 수준의 주관성이 개입되지만 보편적으로 느낄 수 있는 감성을 측정하는데 효과적이다. 따라서 본 연구는 보편적인 감성의 측정을 위해 감성을 차원으로 분류하지 않고 개별 범주로 분류하여 9가지 영역으로 나누었다. 선행 연구에서 추출한 9가지 범주에 해당하는 감성 단어에 기초하여 감성사전을 구축하였으며 감성 단어가 검출된 빈도를 기준으로 감성을 분석했다. 대상 데이터는 2014년 1월부터 2016년 1월까지 우리나라 10대 기업에 대하여 축적된 뉴스 데이터이다. 대상 데이터에서 검출된 감성 단어의 빈도를 기준으로 각 기업에 대한 감성 순위를 나누고 분포를 확인하였다. 기업에 따라서 감성이 다를 수 있는지, 특정 사건이 각 기업에 대한 감성에 영향을 줄 수 있는지 가설을 세우고 검정하였다. 결론적으로, 다 범주 감성 사전을 활용한 감성 분석은 기업 간 비교와 시점 간 비교에 유의한 것으로 나타났다. 본 연구는 빅 데이터에 산재해있는 감성을 국민의 시각으로 측정하는 하나의 대안으로서 의의가 있다.

과학기술정책 연구와 사회, 정부 : 과학기술의 사회이슈, 정부정책, 학술연구의 공진화 분석 (Science and Technology Policy Studies, Society, and the State : An Analysis of a Co-evolution Among Social Issue, Governmental Policy, and Academic Research in Science and Technology)

  • 권기석;정서화;이찬구
    • 기술혁신학회지
    • /
    • 제21권1호
    • /
    • pp.64-91
    • /
    • 2018
  • 이 연구의 목적은 우리나라에서 과학기술정책 연구가 본격적으로 등장한 이래 과학기술을 둘러싼 사회이슈, 학술연구, 과학기술정책이 어떻게 상호작용해 왔는지 탐색하는 데에 있다. 과학기술정책 연구가 시대적 수요를 얼마나 수용해 왔는지, 문제해결을 위해 얼마나 적절하게 대응해 왔는지 분석하였다. 이를 위해 크게 사회이슈, 학술연구, 그리고 과학기술정책의 텍스트에 대한 네트워크분석과 군집분석을 실시하였다. 먼저, 과거 20년 동안 과학기술 관련 언론 기사를 중심으로 사회이슈를 분석하였다. 다음으로, 과학기술정책 연구논문과 정부문서를 각각 분석해봄으로써 사회문제로 제기된 과학기술 관련 정책수요들이 연구를 통해 정부정책으로 이어졌는지 분석하였다. 분석 결과, 과학기술정책 연구는 통합적인 시각보다는 주로 급변하는 기술혁신에 발 빠르게 움직이는 단편적 연구가 많다고 할 수 있다. 그러나 다음 시기에서는 연구주제의 성숙도를 높이면서, 사회적 반응성을 높이는 공진화 경향을 보여 주었다. 이러한 과정에서 삼자간 시차 현상 또한 확인할 수 있었다. 향후 과학기술정책 연구는 기존의 미시수준의 연구에서 중범위와 거시수준으로 확장되어야 할 것이다. 특히 과학기술의 정책과정과 공공관리에 관심을 가져야하며, 사회적 이슈에 대한 민감성을 높이는 정책의제설정 등에 대한 연구가 필요하다는 시사점을 도출하였다.

빅데이터를 통한 내국인의 '한식' 인식 연구 : 텍스트마이닝과 의미연결망 중심으로 (A study on the Domestic Consumer's Perception of "Hansik" with Big Data Analysis : Using Text Mining and Semantic Network Analysis)

  • 박경원;윤희경
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.145-151
    • /
    • 2020
  • 한국의 국가 브랜드 중 하나인 '한식'에 대한 내국인 소비자 인식 파악을 위해 검색어 '한식'으로 데이터 수집을 진행하였다. 분석 프로그램 텍스톰(Textom3.5)을 사용하여 2018년 11월 1일부터 2019년 10월 31일까지의 네이버 블로그와 뉴스 데이터를 수집하였다. 빈도 분석과 TF-IDF 분석 결과, 한식의 인식에서 '뷔페'가 가장 중요한 부분을 차지했다. 스타 셰프의 방송 콘텐츠가 한식의 인식에 영향을 미치고 있었으며, '퓨전화'와 '고급화' 등 한식에 대한 인식이 비단 전통성에 머무르고 있지만은 않음을 알 수 있었다. UCINET6와 NetDraw를 활용한 CONCOR 분석 결과, 다양한 식문화의 클러스터, 방송에 출연한 고급 레스토랑의 클러스터, 한식 브랜드 클러스터, 한식 뷔페의 클러스터가 형성되었다. 한식의 연상 이미지 강화를 위한 방안으로 뷔페 메뉴의 다양성을 차용한 한식 개발, 고급화된 한식 홍보를 위한 미디어 노출, 간편식 수요에 대한 마케팅적 시각과 콘텐츠 개발을 제안하는 바이다.

핵심 정보와 주변 정보의 확산 과정 연구: 단어의 가시성(visibility)과 연결성(connectivity) 분석을 중심으로 본 언론의 프레임 (An Analysis of Diffusion of Main Information and Peripheral Information: Focusing on Visibility and Connectivity of Word based on Network Analysis)

  • 홍주현
    • 한국콘텐츠학회논문지
    • /
    • 제16권3호
    • /
    • pp.269-287
    • /
    • 2016
  • 이 연구는 유병언 사망 사건과 관련된 언론 보도를 네트워크 분석하고, 이 사건이 소셜네트워크사이트를 통해 어떻게 확산되는지 이슈의 확산 과정을 네트워크 분석했다. 지상파 언론과 종편을 분석 대상으로 언론보도의 이슈 현저성, 단어의 가시성과 연결성을 분석했다. 네트워크 분석 결과 종편은 사건과 관련된 핵심 정보보다는 유병언 유류품, 브랜드, 시신에 대한 루머를 강조했고, 지상파 방송은 국과수의 DNA 검사 결과를 중심으로 보도했다. 시기별로 보면 1기 지상파는 '유병언 시신 발견 프레임'을, 종편은 '수사 비난 프레임', '명품 강조 프레임'으로 사건을 틀지었다. 2기 지상파는 '유병언 사인 분석 프레임'을, 종편은 '의혹 제기 프레임'을 강조했다. 3기 지상파는 몇 건 밖에 보도하지 않아 분석의 의미가 없고 종편은 '주변 정보 강조 프레임'이 부각되었다. 언론의 보도는 유투브와 SNS를 통해 확산되었는데, 네트워크 분석 결과 유병언 사망과 관련된 루머가 주목을 받은 것으로 나타났다. 인터넷과 SNS의 발달로 독자들이 적극적으로 의견을 표출하면서 루머를 확산시킨 것으로 생각된다. 음모론의 확산 과정에서 주류 언론은 종편의 선정적이고 자극적인 보도에 밀려 영향을 발휘하지 못했음이 밝혀졌다.