• 제목/요약/키워드: 디지털텍스트

검색결과 490건 처리시간 0.024초

LSTM과 증시 뉴스를 활용한 텍스트 마이닝 기법 기반 주가 예측시스템 연구 (A study on stock price prediction system based on text mining method using LSTM and stock market news)

  • 홍성혁
    • 디지털융복합연구
    • /
    • 제18권7호
    • /
    • pp.223-228
    • /
    • 2020
  • 주가는 사람들의 심리를 반영하고 있으며, 주식시장 전체에 영향을 미치는 요인으로는 경제성장률, 경제지료, 이자율, 무역수지, 환율, 통화량 등이 있다. 국내 주식시장은 전날 미국 및 주변 국가들의 주가지수에 영향을 많이 받고 있으며 대표적인 주가지수가 다우지수, 나스닥, S&P500이다. 최근 주가뉴스를 이용한 주가분석 연구가 활발히 진행되고 있으며, 인공지능 기반한 분석을 통하여 과거 시계열 데이터를 기반으로 미래를 예측하는 연구가 진행 중에 있다. 하지만, 주식시장은 예측시스템에 의해서 단기간 적중이 되더라도, 시장은 더 이상의 단기 전략대로 움직여지지 않고, 새롭게 변할 수밖에 없다. 따라서, 본 모델을 삼성전자 주식데이터와 뉴스 정보를 텍스트 마이닝으로 모니터링하여 분석한 결과를 나타내어 예측이 가능한 모델을 제시하였으며, 향후 종목별 예측을 통하여 실제 예측이 정확한지 확인하여 발전시켜 나갈 예정임.

교수-학습지원시스템에서 학습자 질의응답 자동분류를 위한 토픽 모델링 (Topic modeling for automatic classification of learner question and answer in teaching-learning support system)

  • 김경록;송혜진;문남미
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권2호
    • /
    • pp.339-346
    • /
    • 2017
  • 기사와 댓글, 질의응답과 같은 비정형 데이터에 기반한 텍스트 분석에 대한 관심이 증가하고 있다. 이는 사람들의 견해인 비정형 텍스트 데이터로부터 특징을 파악하고, 평가, 예측 및 추천에 활용할 수 있기 때문이다. TEL 분야에서도 MOOC 서비스의 확대로 교수학습지원시스템 기반 토론, 질의응답 서비스를 자동화하기 위한 관심이 증가하고 있다. 시스템에 축적된 질의응답 데이터를 기반으로 질의 토픽을 생성하고, 새로운 질의에 대해 토픽을 자동분류하기 위해서이다. 따라서 본 연구에서는 새로운 질의 토픽을 자동분류 할 수 있도록 LDA기법을 활용한 토픽 모델링을 제안하고자 한다. 이를 바탕으로 질의 토픽 사전을 생성하고 새로운 질의에 대해 토픽을 자동분류 할 수 있다. 일부 질의에서는 0.7 이상의 높은 자동 분류를 보였으며, 새로운 질의가 여러 토픽에 포함될수록 좀 더 좋은 자동분류 결과를 보였다.

텍스트마이닝 및 CONCOR 분석을 활용한 환자안전문화 융복합 연구주제 분석 (The Study on the patient safety culture convergence research topics through text mining and CONCOR analysis)

  • 백수미;문인오
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.359-367
    • /
    • 2021
  • 본 연구의 목적은 텍스트 마이닝 및 CONCOR 분석을 활용해 국내 환자안전문화 연구주제를 분석하는 것이다. 연구방법은 자료수집, 데이터 전처리, 텍스트 마이닝과 사회연결망 분석, CONCOR 분석 단계로 진행하였으며, 2021년 9월1일 기준으로 '환자안전문화'의 주제어를 검색하여 중복된 논문과 본 연구 목적에 부합되지 않는 논문을 제외한 총 136편을 분석하였다. 자료 분석은 텍스톰(Textom)과 UCINET 프로그램을 이용하였다. 본 연구의 결과 환자안전문화 관련 연구의 TF(빈도)는 환자안전(patient safety), TF-IDF(문서상의 중요도)는 간호(nursing) 가 가장 높게 나타났다. CONCOR 분석결과 환자안전문화를 구성하는 지식 및 태도, 커뮤니케이션, 의료서비스, 팀, 작업환경, 구조, 조직 및 경영의 총 7개의 클러스터가 도출되었다. 추후 환자안전문화 구축과 환자결과와의 연관성에 대한 연구가 진행되어야 할 필요가 있다.

저소득층 대학생들의 진로준비과정에서의 성별·전공별 특성에 대한 사례연구: 텍스트 빈도분석과 연관분석의 적용 (A Case Study on Characteristics of Gender and Major in Career Preparation of University Students from Low-income Families: Application of Text Frequency Analysis and Association Rules)

  • 이지혜;이신혜
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.61-69
    • /
    • 2018
  • 이 연구는 청년들의 높은 비정규직 비율과 계층 양극화의 우려 속에서 저소득층 대학생의 진로준비과정에 대해 이해하고 시사점을 구하기 위한 것이다. 이를 위하여 S 장학재단에서 장학금 지원을 받는 13명의 대학생들을 연구 대상으로 선정하였고, 6회의 인터뷰를 진행하여 그 축어록을 바탕으로 텍스트마이닝 기법을 활용한 분석을 실시하였다. 분석 결과, 대학생들은 인터뷰 과정에서 이전의 학업 경험을 회상하거나 진로를 설계할 때, 가정환경과 소득수준의 영향을 받는 것으로 보이며, 이러한 차이는 성별, 전공별로 다른 특성이 있는 것으로 나타났다. 이 연구는 질적 연구 방법으로 축적된 자료에 텍스트마이닝 기법을 융합적으로 적용하여 분석한 연구로 종래의 진로연구에 비하여 방법론적 확장을 시도했다는 의의를 갖고 있다. 그 결과, 저소득층 대학교 장학생들의 성별 및 전공별 진로준비과정의 차이를 대학생활 및 진로준비와 관련된 단어들의 관계를 통해 탐색적으로 살펴볼 수 있었다.

특허와 뉴스 기사를 이용한 가상현실 기술에 관한 탐색적 연구 (An Exploratory Study of VR Technology using Patents and News Articles)

  • 김성범
    • 디지털융복합연구
    • /
    • 제16권11호
    • /
    • pp.185-199
    • /
    • 2018
  • 이 연구의 목적은 가상현실(VR)의 핵심기술을 특허 분석을 통해서 도출하고 VR에 대한 사회와 대중의 관심을 뉴스 분석을 통해서 탐색하는 것이다. 연구1에서는 특허 텍스트의 단어 출현 빈도를 이용하여 핵심 키워드를 도출하고 업체별, 연도별, 기술 분류별 비교를 하였으며, 네트워크 분석 프로그램인 넷마이너를 사용하여 특허의 IPC 코드를 분석하였다. 연구2에서는 뉴스 기사의 텍스트를 내용분석 도구인 T-LAB 프로그램을 사용하여 분석하였다. 키워드 선정을 위해 TF-IDF를 사용하였고, 카이제곱과 연관지수(Association index) 알고리즘을 사용하여 VR과 관련성이 높은 단어를 추출하였다. 이 연구를 통해 VR 기술이 광학과 머리착용디스플레이(HMD), 데이터 분석, 전기, 전자 기술을 포함하는 융합기술임을 확인하였고, 광학기술이 중심적 기술임을 발견하였다. 뉴스 기사를 통해서는 대중은 VR 공급업체와 시장의 형성과 성장에 관심을 가지며 VR은 사용자 경험에 기초해서 개발되어야 함을 도출하였다.

사용자 맞춤형 외국어학습 콘텐츠 구성을 위한 연구 (A study on Customized Foreign Language Learning Contents Construction)

  • 김귀정;이재일
    • 디지털융복합연구
    • /
    • 제17권1호
    • /
    • pp.189-194
    • /
    • 2019
  • 본 논문은 글로벌 시대를 살아가는 외국어 학습자들의 학습환경에서 IT기술과 학습콘텐츠의 개발을 통해 사용자 성향별 맞춤 콘텐츠를 제작하는 방법론에 대한 연구이다. 전 세계의 다양한 외국어 학습자들이 모바일기기와 모바일학습콘텐츠를 활용하여 다양한 분야의 학습활동을 하고 있으며 외국어학습이 대표적인 모바일 학습분야의 하나라고 볼 수 있다. 제시된 외국어학습콘텐츠 구성은 학습자의 모국어 음성 문자 텍스트를 기반으로 정보수집 및 콘텐츠 제작의 과정을 거쳐 사용자의 성향별 학습콘텐츠를 구성하는 방법을 제시하였다. 이는 학습자의 학습활동이 실제사용환경과 최대한 유사하게 만들어서 학습과 실제사용에 차이점이 없도록 콘텐츠를 구성하여 학습 후 시행착오를 거쳐 올바른 사용 순서로 이루어지는 기존의 학습방법과 차이를 보여준다. 또한 학습자 개인의 선호 어휘 문맥을 콘텐츠화하여 학습에 사용하므로 학습콘텐츠와 개인성향의 일치를 이루어 학습의 이질감을 최대한 줄여주는 역할을 할 수 있다. 본 연구 내용을 토대로 학습자의 모국어 어휘 문맥 분석 및 텍스트화 과정에 대한 추후 연구가 필요하다.

텍스트 마이닝을 활용한 데이터 거버넌스 연구 동향 분석: 2009년~2021년 국내 학술지 논문을 중심으로 (The Study on Data Governance Research Trends Based on Text Mining: Based on the publication of Korean academic journals from 2009 to 2021)

  • 정선경
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.133-145
    • /
    • 2022
  • 연구 목적은 데이터 거버넌스의 연구 동향을 파악하고자 하였다. 연구 대상은 데이터 거버넌스 개념과 전략이 제시되기 시작한 2009년부터 2021년까지의 논문 158편을 대상으로 하였다. 주요 연구방법은 텍스트 마이닝을 활용하였고, 주요 방법은 빈도분석, 워트클라우드, 네트워크 분석 및 토픽 모델링 기법을 사용하여 분석하였다. 연구 결과 최빈 키워드는 정보, 빅데이터, 관리, 정책, 정부, 법률, 스마트가 확인되었다. 또한 네트워크 분석 결과 데이터 산업 정책, 데이터 거버넌스 성과, 국방, 거버넌스, 데이터 공공 등의 주제로 연관된 연구 수행이 이루어지고 있었다. 토픽 모델링을 통해 도출된 4개 토픽은 "데이터 거버넌스 정책", "데이터 거버넌스 플랫폼", "데이터 거버넌스 관련 법률", "데이터 거버넌스 구현"이며, 이중 "데이터 거버넌스 플랫폼" 관련 연구는 증가 추세를 보였고, "데이터 거버넌스 구현"은 축소되고 있는 경향이었다. 본 연구는 데이터 거버넌스 관련 연구를 종합적으로 정리하였다. 데이터 거버넌스는 조직 차원의 데이터 경영 및 데이터 통합 정책, 관련 기술 등 관련 분야와 다양한 시각에서 연구영역 확대가 필요하다. 향후 해외데이터 거버넌스들을 대상으로 한 분석 대상을 확대하고 4차산업혁명, 인공지능, 메타버스 등 데이터 기반 미래 산업이 요구되는 산업 분야에서의 연구 방향과 정책 방향 수립 관련 후속 연구를 기대할 수 있다.

공유경제 참여자의 비즈니스 등록정책에 대한 인식과 심적기재: 온라인 발화에 대한 텍스트마이닝 (Study on Participants' Perceptions of Sharing Economy Policies: A Text Ming Approach to Online Community Posts)

  • 박수경
    • 디지털융복합연구
    • /
    • 제20권2호
    • /
    • pp.47-56
    • /
    • 2022
  • 온라인 플랫폼의 등장은 개인들이 방 한 칸과 같이 작은 자원을 시장에서 거래할 수 있게 하였다. 그러나 이러한 경제활동에 대한 명확한 규제가 존재하지 않아 다양한 부작용이 대두되었다. 이에 정부는 온라인 플랫폼을 매개로 한 경제활동이 만들어내는 의도치 않은 결과들에 대한 자정을 목표로 관련 정책을 재정립하였다. 그러나 아직 정책은 표류하고 있으며, 다수의 참여자가 기존 정책에 불응을 선택하고 있다. 이에 본 연구에서는 참여자들이 기존 정책에 대한 불응을 결정함에 있어, 어떤 인식을 하고 있는지를 세밀하게 조망해보고자 한다. 이를 위하여 텍스트마이닝 기법을 적용하였다. 주요 온라인 커뮤니티에 남겨진 참여자들의 발화를 수집하여, 관련 정책에 대한 인식과 그 심적기재를 5개의 주제로 도출하였다. 정부의 정책에 따르는 것은 자유의사에 의한 결정이다. 따라서 처벌이나 벌금과 같은 무조건적인 억제 기재를 상정하는 것보다, 정책대상 즉, 현 참여자에 대한 깊이 있는 이해를 수행하는 것이 선행되어야 한다. 이에, 향후 본 연구를 기반으로 이들을 정책순응으로 유도할 수 있는 기재들을 세밀히 논의할 수 있기를 기대한다.

텍스트마이닝을 이용한 미세먼지 관련 신문기사 분석 (An Analysis of Newspaper Articles on Fine Particle Matter Using Text Mining Techniques)

  • 양지연
    • 디지털융복합연구
    • /
    • 제20권1호
    • /
    • pp.1-13
    • /
    • 2022
  • 본 연구에서는 미세먼지에 대한 신문 기사의 시대별, 신문사별 특징을 살펴보고 있다. 이를 위하여 빅카인즈에서 1995년 이후 주요 신문사들의 관련 기사를 추출하였고 텍스트마이닝, 감성분석, 회귀분석을 활용하였다. 그 결과, 2010년 이전에는 대기오염도 측정 단어나 국내 오염원 관련 단어가 많이 등장했으나 2010년대에 들어서면서 "중국"이 큰 빈도로 나타났으며 정책적 대응, 미세먼지가 건강에 미치는 영향, 관련 제품에 대한 광고·홍보, 국내 오염원에 관한 기사까지 다양한 주제의 기사가 등장했다. 중앙일보, 한겨레, 경향신문은 상대적으로 정부의 정책이나 규제와 관련된 기사가 많은 반면, 대부분의 지역지에서는 지역 자체의 배출원 및 저감대책에 관한 기사가 많았다. 본 연구 결과는 미세먼지 관련 언론보도의 추이를 살필 수 있는 기초 자료로 활용될 수 있으리라 기대한다. 향후 포스트코로나 시대의 국내 미세먼지의 상황과 관련 기사의 트렌드를 추가적으로 비교, 검토할 수 있을 것이다.

시각적 패러독스에서 이미지와 텍스트의 상관관계 -폭스바겐 광고 사례의 분석을 중심으로- (Relationship between Images and Text in the Visual Paradox -Focusing on Case Studies of Volkswagen Ads-)

  • 김진곤;박영원
    • 한국콘텐츠학회논문지
    • /
    • 제12권1호
    • /
    • pp.176-184
    • /
    • 2012
  • 사람들은 다양한 미디어에 노출되고 있다. '디지털 혁명' 이후 미디어의 양적 팽창은 빠른 속도로 이루어지고 있다. 미디어의 팽창으로 인해 광고는 수용자의 반응을 이끌어내기 위한 노력이 필요하다. 수용자의 반응을 이끌기 위한 노력으로써 수사적 표현이 사용된다. 본 논문은 수사적 표현 중 시각적 패러독스에 주목하였다. 시각적 패러독스의 특성인 의도적인 모순이나 모호성은 수용자의 반응을 유도하는 효과적인 표현 수단이기 때문이다. 본 논문은 패러독스에 대한 논리학적 정의 및 유형 구분을 기반으로 하여 시각적 패러독스에 대해 정의하였다. 또한 광고에서의 시각적 패러독스는 이미지와 텍스트의 관계성이 중요한 역할을 한다고 판단하여, 메타언어를 통해 이미지와 텍스트의 의미작용을 위한 상관관계를 밝혀내고자 하였다. 이러한 연구 과정의 증명을 위해 폭스바겐 자동차 광고 사례를 분석하였다. 사례 분석을 통해 이미지와 텍스트가 상호 작용하여 새로운 의미를 생성한다는 것을 확인하였다.