• 제목/요약/키워드: 텍스트마이닝 분석

검색결과 1,003건 처리시간 0.025초

텍스트 마이닝 기반의 데이터 분석 웹 애플리케이션 (Data Analysis Web Application Based on Text Mining)

  • 길완제;김재웅;박구락;이윤열
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.103-104
    • /
    • 2021
  • 본 논문에서는 텍스트 마이닝 기반의 토픽 모델링 웹 애플리케이션 모델을 제안한다. 웹크롤링 기법을 활용하여 키워드를 입력하면 요약된 논문 정보를 파일로 저장할 수 있고 또한 키워드 빈도 분석과 토픽 모델링 등을 통해 연구 동향을 손쉽게 확인해볼 수 있는 웹 애플리케이션을 설계하고 구현하는 것을 목표로 한다. 제안 모델인 웹 애플리케이션을 통해 프로그래밍 언어와 데이터 분석 기법에 대한 지식이 부족하더라도 논문 수집과 저장, 텍스트 분석을 경험해볼 수 있다. 또한, 이러한 웹 시스템 개발은 기존의 html, css, java script와 같은 언어에 의존하지 않고 파이썬 라이브러리를 활용하였기 때문에 파이썬을 기반으로 데이터 분석과 머신러닝 교육을 수행할 경우 프로젝트 기반 수업 교육 과정으로 채택이 가능할 것으로 기대된다.

  • PDF

텍스트마이닝을 이용한 한국 대통령의 해양관에 관한 연구 (A Study on Text Mining Analysis of Presidential Maritime Concept in KOREA)

  • 김성국;이태휘
    • 한국항만경제학회지
    • /
    • 제36권3호
    • /
    • pp.39-54
    • /
    • 2020
  • 대통령 중심제의 정치체제에서는 대통령의 언어가 국가정책의 형성과 의사결정 과정에 지대한 영향을 미치게 된다. 대통령의 이념과 중심가치에 따라 정책우선순위가 결정되고 그 우선순위에 따라 다양한 정책이 수립되고 집행된다. 그래서 대통령의 연설문을 내용분석하는 연구가 관심의 대상이 되고 있다. 대통령의 연설문은 언어 자료이기 때문에 비정형이면서 비구조화 된 텍스트를 분석하기 위해서는 기계학습과 딥러닝의 방법을 통해 빅데이터 분석이 이루어지고 있다. 본 연구에서는 1996년부터 24년간에 걸쳐 "바다의 날" 기념식의 대통령 연설문을 확보하여 텍스트마이닝 방법의 일종인 토픽모델링의 방법으로 분석하였다. 분석결과 역대 대통령은 모두 자신의 국정운영 방향에 부합되는 해양관을 가지고 연설문을 발표하였다는 것을 확인하였다. 해양의 고유가치인 해양-산업-자원 토픽은 훼손되지 않고 지속적으로 역대 대통령이 모두 강조하고 있음을 확인하였다.

텍스트 마이닝 기법을 이용한 게임 마케팅 비디오에서의 스피치 분석 (Analysis of speech in game marketing video using text mining techniques)

  • 이여경;김재직
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.147-159
    • /
    • 2022
  • 오늘날 다양한 소셜 미디어 플랫폼이 널리 퍼져 있고 사람들은 그들의 일상생활 속에서 밀접하게 그러한 플랫폼들을 이용하고 있다. 이에 따라, 많은 수의 구독자, 시청, 댓글 등을 보유한 인플루언서들은 우리 사회 속에서 큰 영향력을 가지게 되었다. 이러한 추세에 따라 많은 회사들은 그들의 상품과 서비스 판매의 촉진을 위한 마케팅 목적으로 인플루언서들을 적극 활용하고 있다. 본 연구에서는 게임 마케팅을 위한 비디오에서 인플루언서들의 스피치를 추출하고 텍스트화하여 이를 텍스트 마이닝 기술을 이용하여 탐색적으로 분석한다. 분석에 있어, 성공한 마케팅 비디오와 실패한 마케팅 비디오를 구분하고 성공, 실패한 마케팅 비디오에서 인플루언서들의 언어적 특징들을 비교 분석한다.

웹 스크래핑과 텍스트마이닝을 이용한 공공 및 민간공사의 사고유형 분석 (A Study on the Analysis of Accident Types in Public and Private Construction Using Web Scraping and Text Mining)

  • 윤영근;오태근
    • 문화기술의 융합
    • /
    • 제8권5호
    • /
    • pp.729-734
    • /
    • 2022
  • 건설업의 사고원인 파악을 위해 사고사례를 이용한 다양한 연구가 진행되고 있지만, 공공 및 민간공사의 차이점에 대한 연구는 미미한 실정이다. 본 연구에서는 발주 유형별 사고원인 분석을 위해 웹 스크래핑과 텍스트 마이닝 기술을 적용하였다. 수집된 10,000건 이상의 정형 및 비정형 데이터에 대한 통계분석과 워드클라우드 분석을 통해 공공 및 민간공사의 사고유형과 사고원인에 대한 차이가 확인되었다. 또한, 주요 사고원인들의 상관관계를 파악함으로써 향후 안전관리 대책 수립에 기여할 수 있다.

텍스트마이닝 기반 아동 감정 분석 시스템 및 아동용 감정 사전 구축 방안 (A Child Emotion Analysis System using Text Mining and Method for Constructing a Children's Emotion Dictionary)

  • 박영준;김선용;김요한
    • 한국전자통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.545-550
    • /
    • 2024
  • 급격하게 변화되는 사회 속에서 현대인들은 다양한 스트레스를 경험하고 있으며, 아동 또한 정신 건강 진료량이 눈에 띄게 증가하고 있다. 소아정신건강장애 등 아동의 정신 건강 문제를 예방하기 위해서는 감정 상태를 빠르게 파악해야 하지만, 유아기 아동들은 몇 가지 단어만을 사용하여 자신의 감정을 표현하는 경우가 많기에 어려움이 있다. 본 논문에서는 아동 심리 상태를 우울, 불안, 외로움, 두려움 등 4가지의 감정으로 세분화하고 아동 심리 전문가의 점수를 기반으로 한 아동용 감정 사전 구축 방안을 제안한다. 또한, STT 및 텍스트 마이닝 기반의 아동 감정 분석 시스템을 제안하고 실제 음성 데이터로 성능을 평가하였다. 평가 결과는 제안한 아동용 감정 분석 시스템이 아동 감정 상태를 정확하게 파악할 수 있음을 보여준다.

상품 리뷰 분석을 위한 텍스트 마이닝 기법의 비교 (A Comparison of Text Mining Algorithms for Product Review Analysis)

  • 이지웅;진영택
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.882-884
    • /
    • 2019
  • 오늘날 정보화 시대에서는 온라인 쇼핑의 상품리뷰 등 대용량의 텍스트 문서가 존재하며 제품에 대한 정서적인 의견뿐만 아니라 제품 선호도 및 상품 비교와 같은 유용한 정보를 제공한다. 본 논문에서는 사용자가 작성한 상품 리뷰로부터 제품의 특성을 비교하는 비교의견을 추출하기 위해 적용한 다양한 텍스트 마이닝 기법의 비교 결과를 제시한다.

텍스트마이닝을 활용한 핀테크 및 디지털 금융 서비스 트렌드 분석 (Trend Analysis of FinTech and Digital Financial Services using Text Mining)

  • 김도희;김민정
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.131-143
    • /
    • 2022
  • 본 연구는 핀테크를 중심으로 국내 디지털 금융 서비스 시장의 트렌드를 파악하고자 신문기사와 트위터 데이터를 대상으로 텍스트마이닝 기법을 사용하여 분석을 진행하였다. 핀테크 시장의 성장 과정에 있어서 간편결제 서비스 도입, 인터넷전문은행 출범, 데이터 3법 개정안 통과, 마이데이터 사업 신청 등 중요하게 작용을 한 4가지 시점을 기준으로 빈도분석을 수행하여 핵심 키워드 간의 차이를 살펴보았다. 또한 핀테크 선도 국가인 중국·미국과 미래 키워드를 핀테크 키워드와 결합한 빈도분석 결과를 통해 세계 시장 속에서 국내 핀테크 산업의 현 위치와 미래 시장 전망을 예측하였다. 마지막으로 트위터 트윗을 대상으로 감성분석을 진행하여 핀테크 서비스에 대한 소비자의 기대와 우려를 정량화하였다. 따라서 본 연구는 금융 생태계 변화 과정을 살펴보고, 분석 결과를 종합함으로써 정부와 기업이 향후 핀테크 시장 발전에 있어서 활용할 수 있는 전략적 방향성 및 대응 전략을 제시한 점에서 의의가 있다.

텍스트 마이닝 기법을 이용한 학습 수요자 요구에 관한 연구 : SNS를 중심으로 (A Study on Learners' Needs Analysis Using Text Mining Techniques : Focusing on SNS)

  • 이명숙;이경미;임영규;한경임;박혜정
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제53차 동계학술대회논문집 24권1호
    • /
    • pp.259-261
    • /
    • 2016
  • 본 연구는 교양교육에 대한 학습 수요자의 요구와 현재 편성되어 있는 교양교육 교과목들에 대한 차이를 알아본다. 학습 수요자의 다양한 생각들을 SNS를 통해 데이터를 수집하고, 텍스트 마이닝 기법을 이용하여 유용한 정보를 발견하고 시각화 분석을 통해 학습자의 요구를 제시한다. 분석 결과로는 학습자는 교수자와 상호작용 잘되는 수업 방식, 학습자가 참여할 수 있는 수업, 자기주도 학습을 선호하였다. 또한 교양교육 교과목 개설로서는 취업에 필요한 외국어, 자격증 취득이 가능한 과목, 실생활에 적용할 수 있는 실용적인 과목들을 요구하여 실제 균형에 맞게 개설된 교과목과는 차이를 보임을 알 수 있었다.

  • PDF

텍스트 마이닝을 활용한 연구 동향 분석 (Analysis of Research Trends Using Text Mining)

  • 심재권
    • 창의정보문화연구
    • /
    • 제6권1호
    • /
    • pp.23-30
    • /
    • 2020
  • 본 논문은 융복합 논문지인 창의정보문화연구의 연구 동향을 분석하기 위한 목적으로 텍스트 마이닝 방법을 활용하였다. 기존의 연구동향 분석방법은 전통적인 내용분석 방법을 사용하여 연구자 개인의 성향이 반영되는 한계가 있었다. 따라서, 기존 연구 동향 분석의 한계를 보완하고자 본 논문에서는 토픽 모델링 기법을 사용하였고, 창의정보문화연구 논문지의 2015년에서 2019년까지 발간된 논문 전체의 영문초록을 분석하였다. 분석 결과, 가장 많이 등장한 단어는 "education"이었고, 8개의 연구 주제가 도출되었다. 도출된 주제는 교육대상, 교육평가, 학습자역량, 소프트웨어와 메이커 문화, 정보교육과 컴퓨터교육, 미래교육, 창의성, 교수학습방법으로 분석되었다. 본 논문의 텍스트 마이닝을 활용하여 융복합연구 논문지의 연구동향을 분석하였다는 점에서 의의가 있다고 할 수 있다.