• 제목/요약/키워드: 뉴스빅데이터

검색결과 206건 처리시간 0.028초

Analysis of related words for each private security service through collection of unstructured data

  • Park, Su-Hyeon;Cho, Cheol-Kyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.219-224
    • /
    • 2020
  • 이 연구의 목적은 뉴스 빅데이터 분석사이트인 '빅카인즈'를 통해 민간경비의 시대적 구분과 업무에 따라 언론에 보도된 자료들을 통하여 민간경비의 인식과 흐름을 분석하여 민간경비산업의 이론적 근거를 제시하는 데 주된 목적을 두고 있다. 연구방법은 다양하게 흩어져있는 비정형 데이터를 분석이 가능하도록 정형화된 데이터로 바꾸고, 민간경비 성장기에 민간경비 업무별 키워드 트렌드와 연관어 분석을 실시하였다. 연구결과에 따른 민간경비 인식은 각종 범죄 및 사건·사고 및 정규직 관련 이슈를 통해서 언론에 많이 노출되었다. 또한 민간경비업무 영역별로 인식하지 못하고 단순 경비원으로 인식하는 경향이 강했으며 민간경비와 경찰의 연관성이 높은 것으로 보아 경찰력을 보조하는 역할로 인식함은 물론이고 치안을 담당하는 공동의 주체로서 인식되고 있다고 볼 수 있다. 따라서 민간경비에 대한 인식을 객관적으로 판단하고 이를 통해 국가의 안전을 책임지고 사회질서를 유지하는 주체로써 민간경비를 인식하는 초석이 되어야 할 것으로 사료된다.

국가핵심기술 관계망 구축을 통한 연관정보 분석연구: 디스플레이 기술을 중심으로 (A Study on the Analysis of Related Information through the Establishment of the National Core Technology Network: Focused on Display Technology)

  • 박세희;윤원석;장항배
    • 한국전자거래학회지
    • /
    • 제26권2호
    • /
    • pp.123-141
    • /
    • 2021
  • 경제 구조의 기술 의존성이 강해져 국가핵심기술의 중요성은 더욱 대두되고 있다. 하지만 기술 자체적 특성으로 인해 연관 범위가 추상적이고 국가핵심기술 고유의 특성상 정보공개가 제한적이기 때문에 보호대상이 될 기술의 범위를 정하는 것에 어려움이 있다. 이를 해결하기 위해 국가핵심기술과 연관성이 높은 중요 기술을 판별하는 데에 최적화 된 문헌 종류와 분석 기법을 제안하였다. 디스플레이 분야 국가핵심기술 키워드로 수집한 네 개 문헌종류(뉴스, 논문, 보고서, 특허) 데이터에 빅데이터 분석의 텍스트 마이닝 분석기법인 TF-IDF와 LDA 토픽 모델링을 적용하는 파일럿 테스트를 진행하였다. 그 결과로 특허 데이터에 LDA 토픽 모델링을 적용한 결과가 국가핵심기술과 연관성이 높은 중요기술을 추출하였다. OLED, 마이크로LED를 포함하여 디스플레이 전후방산업에 관련된 중요 기술을 판별 할 수 있었으며 이 결과를 관계망으로 시각화하여 국가핵심기술과 연관된 중요 기술의 범위를 명확히 하였다. 본 연구를 통해 기술이 가지는 연관범위의 모호성을 보다 명확히 하였으며, 국가핵심기술이 가지는 제한적인 정보공개 특성을 극복할 수 있다.

산업별 지속가능경영 전략 고찰: ESG 보고서와 뉴스 기사를 중심으로 (A Study on Industry-specific Sustainability Strategy: Analyzing ESG Reports and News Articles)

  • 김원희;권영옥
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.287-316
    • /
    • 2023
  • 최근 전 세계적으로 기업의 환경(Environmental)·사회(Social)·지배구조(Governance)의 비재무적 요소를 고려한 지속가능경영이 필수적으로 요구되면서, 각 기업들은 이에 대응할 수 있는 전략적 방향 수립이 중요해지고 있다. 특히 기업이 속한 산업별로 상이한 ESG 이슈에 대한 이해를 바탕으로 산업과 개별 기업의 특성을 반영한 전략을 개발하고 추진할 수 있어야 할 것이다. 이에 본 연구에서는 금융, 제조, IT 분야별로 나누어 주요 국내 기업들의 ESG 보고서와 관련 뉴스 기사를 이용하여 산업별 ESG 동향과 활동을 비교 분석하였다. 키워드 빈도분석과 토픽 모델링을 활용한 분석 결과, 국내 ESG 선도 기업들의 지속가능경영 활동에서의 산업별 차이를 도출 할 수 있다. 금융 분야에서는 '고객 중심 경영'과 '기후 변화 대응', 제조 분야에서는 '지속가능한 공급망 관리'와 '탄소중립', IT 분야에서는 '기술혁신'과 '디지털 책임'이 강조되었다. ESG 요소별 우선 순위가 높은 활동의 예를 들면, 환경 측면에서는 '에너지 절감과 친환경 활동', 사회 측면에서는 '사회공헌과 상생', 지배구조 측면에서는 '이사회 독립성 강화와 리스크 관리' 등으로 나타났다. 더 나아가 산업별 각 ESG 요소의 핵심 이슈 뿐 아니라 ESG 보고서와 뉴스 기사의 내용 유사성 및 차별점도 확인하였다. 연구의 결과는 산업별 동향을 고려한 ESG 경영 전략 및 정책의 방향성을 제시하고 있으며 이는 산업별 ESG 평가체계 수립에도 도움이 될 것으로 기대한다.

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.

다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링 (User-Perspective Issue Clustering Using Multi-Layered Two-Mode Network Analysis)

  • 김지은;김남규;조윤호
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.93-107
    • /
    • 2014
  • 대부분의 인터넷 쇼핑몰은 자사 고객의 관심 분야를 파악하고 이를 상품 추천에 효과적으로 활용하기 위해 많은 노력을 기울이고 있다. 하지만 고객이 회원 가입 시 직접 입력한 개인 정보는 신뢰하기가 어렵고, 고객의 구매 패턴을 통해 파악한 관심 분야 정보는 자사 사이트 내에 진입한 이후에만 보인 한정된 패턴이라는 측면에서 해당 고객의 다양한 관심분야를 제대로 나타낸다고 보기 어렵다. 이러한 한계를 극복하기 위해 본 연구에서는 고객의 평소 인터넷 사용 기록을 통해 최근 방문 사이트들의 주제를 분석함으로써, 고객의 실제 관심 분야를 파악할 수 있는 방안을 제시하였다. 또한 토픽 분석을 통해 각 사이트의 주제를 도출하고 도출된 주제를 다시 동시 방문자 관점에서 군집화 함으로써, 고객 관점에서 의미가 있는 상위 수준의 새로운 테마를 발굴하기 위한 방법론을 제안하였다. 연구의 특징은 유사주제 중심의 군집화라는 기존 연구와는 달리 사용자 관점의 관심주제 중심 군집화라 할 수 있다. 향후 사용자 중심의 카테고리 설계를 비롯한 새로운 관점의 고객군 정의 등 보다 높은 차원의 마케팅 전략 수립에 활용이 가능할 것으로 기대된다. 사용자 관점의 이슈 군집화 과정은 크롤링, 토픽 분석, 액세스 패턴 분석, 네트워크 병합, 네트워크 변환 및 군집화와 같은 여섯 가지 주요단계로 구성되어있다. 이를 위해 텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 비정형 텍스트를 기반으로한 빅데이터의 활용 방법을 모색하였다. 제안 방법론의 실무 적용 가능성을 평가하기 위해, 국내 최대 포털 뉴스 사이트의 방문자 2,177명의 1년간 방문 기록과 뉴스기사 대한 분석을 수행하고 그 결과를 요약하여 제시하였다.

Analysis of the relationship between service robot and non-face-to-face

  • Hwang, Eui-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권12호
    • /
    • pp.247-254
    • /
    • 2021
  • 코로나19가 확산되면서 비대면 활동이 요구되었고, 서비스로봇의 활용 분야는 점차 증가되고 있다. 본 논문은 뉴스 빅데이터 분석시스템인 빅카인즈를 활용하여 최근 3년(2018.10~2021.9)간 '서비스로봇 AND 비대면' 키워드가 포함된 키워드 검색을 통하여 코로나19 전후에 서비스로봇의 사용 증가 추세와 비대면과의 연관성을 분석하였다. 그 결과 1차(2018.10~2019.9) 기간에 키워드 빈도수 0건, 2차(2019.10~2020.9) 기간에 52건, 3차(2020.10~2021.9) 기간에는 112건으로 2차 기간에 비하여 115% 증가하였다. 2~3차 기간에 관계도 키워드 트렌드 연관어 분석에서 공통으로 거론되는 키워드로는 코로나19, 인공지능, 산업통상자원부, LG전자이었으며, 코로나19의 가중치가 제일 크게 나타나 분석 키워드에 연관성이 가장 큰 것을 확인할 수 있었다. 코로나19의 확산으로 비대면이 요구되고 정보통신 기술의 발전으로 서비스로봇은 그 활용 분야가 급격하게 증가하고 있다. 이에 따른 비대면 경제를 이끌 서비스 로봇의 상용화를 위하여 안전, 성능 분야의 표준화 및 전문성이 요구되는 인력양성이 시급한 실정이다.

미술품 거래정보 온라인 제공시스템 구축을 위한 정보전략계획 (A Study on the Information Strategy Planing for the Construction of the Online Information System for the Transaction of Art)

  • 서병민
    • 디지털융복합연구
    • /
    • 제17권11호
    • /
    • pp.61-70
    • /
    • 2019
  • 사회경제적 발전과 교육부의 창의인성교육의 강화와 함께 일반국민도 미술품에 대한 향유문화가 고조되고 있고, 미술품이 투자대체제로써의 관심이 증대되고 있는 흐름 속에 미술품 시장의 산업화가 확대되고 있다. 최근 정부에서도 미술진흥 중장기 계획 수립을 발표하는 등 미술품 시장 활성화를 위한 정책적 의지를 나타내고 있다. 4차산업혁명 시대의 도래로 인공지능(AI), 가상현실(VR), 빅데이터 등 지능정보기술과 융 복합하는 현대미술 콘텐츠가 선보이고 있고, 인문학 및 창의융합에 대한 사회적 관심도 고조되고 있다. 이에 따라 누구나 쉽게 미술시장 정보에 접근할 수 있게 하고, 작가와 가격대별 검색기능과 분석자료, 비평 등 통합정보를 제공하는 등 미술시장의 투명화와 활성화 전략의 수립이 필요하다. 본 논문은 미술시장 경매거래정보 제공, 미술시장 보고서 및 뉴스 제공, 홍보 플랫폼 제공, 미술시장 분석서비스 및 회원관계관리 서비스를 제공하는 미술품 거래정보 온라인 제공시스템 구축을 위한 정보시스템계획을 수립하였다. 이를 위해 미술시장에 대한 환경분석과 중점분석을 통해 미래모델을 수립하였으며, 이에 따른 전략과제와 이행계획도 수립하였다.

빅데이터 분석을 활용한 웰에이징 요인에 관한 연구 : 신문기사를 중심으로 (A Study on the Factors of Well-aging through Big Data Analysis : Focusing on Newspaper Articles)

  • 이종형;강경희;김용하;임효남;구진희;김광환
    • 한국산학기술학회논문지
    • /
    • 제22권5호
    • /
    • pp.354-360
    • /
    • 2021
  • 사람들은 개인의 삶의 만족을 위하여 일과 삶의 균형을 맞추며 건강하고 행복하게 살아가는 것을 희망하고 있다. 따라서 걱정 없이 행복하고 건강하게 나이가 들어가는 것을 의미하는 웰에이징(well-aging)에 대한 관심이 높아지고 있다. 본 연구는 웰에이징 관련 신문기사를 분석하여 웰에이징과 연관된 요인들을 파악하고자 하였다. 파이썬(Python) 기반의 웹 크롤링(web crawling)을 활용하여 2020년 11월까지 포탈 사이트 다음(daum)의 뉴스 서비스에 게재된 1,199편의 기사를 수집하였으며, 이중 연구 주제에 일치하는 기사 374편을 연구대상으로 선정하였다. 텍스트마이닝의 빈도분석 결과, '노인', '건강', '피부', '웰에이징', '제품', '사람', '노화', '여성', '국내', '은퇴' 등의 순서로 상위 10개의 키워드가 중요하게 파악되었다. 또한 출현 빈도가 높은 45개의 중요 키워드를 기반으로 사회 네트워크 분석을 수행한 결과 '피부-주름', '피부-노화', '노인-건강'이 강한 연결 관계를 나타났다. CONCOR 분석을 수행한 결과 45개의 중요 키워드들은 '삶과 행복', '질병과 죽음', '영양과 운동', '힐링', '헬스산업', '노화와 안티에이징', '건강', '노인서비스'의 8개 군집으로 구성되어, 신문기사들을 기반으로 나타나는 웰에이징과 관련된 요인들을 유추할 수 있었다.

이미지 캡션 및 재귀호출을 통한 스토리 생성 방법 (Automated Story Generation with Image Captions and Recursiva Calls)

  • 전이슬;조동하;문미경
    • 융합신호처리학회논문지
    • /
    • 제24권1호
    • /
    • pp.42-50
    • /
    • 2023
  • 기술의 발전은 제작 기법, 편집 기술 등 미디어 산업 전반에 걸쳐 디지털 혁신을 이루어 왔고, OTT 서비스와 스트리밍 시대를 관통하며 소비자 관람 형태의 다양성을 가져왔다. 빅데이터와 딥러닝 네트워크의 융합으로 뉴스 기사, 소설, 대본 등 형식을 갖춘 글을 자동으로 생성하였으나 작가의 의도를 반영하고 문맥적으로 매끄러운 스토리를 생성한 연구는 부족하였다. 본 논문에서는 이미지 캡션 생성 기술로 스토리보드 속 사진의 흐름을 파악하고, 언어모델을 통해 이야기 흐름이 자연스러운 스토리를 자동 생성하는 것을 기술한다. 합성곱 신경망(CNN)과 주의 집중기법(Attention)을 활용한 이미지 캡션 생성 기술을 통해 스토리보드의 사진을 묘사하는 문장을 생성하고, 첫 번째 이미지 캡션을 KoGPT-2에 입력하여 생성된 새로운 글과 두 번째 이미지의 캡션을 다음 입력값으로 활용한 재귀적 접근 방안을 제안하여 전후 문맥이 자연스럽고 기획 의도에 맞는 스토리를 생성하는 연구를 진행한다. 본 논문으로 인공지능을 통해 작가의 의도를 반영한 스토리를 자동으로 대량 생성하여 콘텐츠 창작의 고통을 경감시키고, 인공지능이 디지털 콘텐츠 제작의 전반적인 과정에 참여하여 미디어 지능화를 활성화한다.

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.