• 제목/요약/키워드: Comparative Text Analysis

검색결과 170건 처리시간 0.027초

기업 리뷰 정보를 활용한 주가 방향 예측 모델 비교 분석 (A Comparative Analysis of the Prediction Models for the Direction of Stock Price Using the Online Company Reviews)

  • 임용택;임희석
    • 한국융합학회논문지
    • /
    • 제11권8호
    • /
    • pp.165-171
    • /
    • 2020
  • 텍스트 마이닝을 활용한 주가 방향 예측 연구에서는 대부분 뉴스, SNS 데이터를 사용하고 있다. 하지만 뉴스, SNS 데이터로부터 기업에 대한 솔직하고 생생한 정보는 얻기 어렵다는 약점이 존재한다. 본 논문에서는 실제 근무 경험이 있는 내부 직원의 기업 리뷰를 반영하여, 종업원 만족도를 활용한 주가의 방향성을 예측하는 문제를 다룬다. 머신러닝 모델별 성능평가를 통해 예측 정확도를 비교, 분석한 결과 종업원의 기업 리뷰 데이터를 추가로 이용한 주가 방향 예측 모델은 그렇지 않은 모델 대비 뛰어난 분류 성과를 보였다. 본 연구는 금융 공학에 자연어처리기술을 활용한 융합 연구로서 주가 예측 분야에서 종업원 만족도를 활용한 기존에 없던 새로운 방법론을 추구하였다. 실무적으로 주가 방향 예측 분야에 유용한 정보를 제공할 것으로 기대된다.

전래동화 <해님과 달님>의 이본(異本) 비교 (Comparison with the Alternative Versions of the Korean Fairy Tele )

  • 송정숙
    • 한국도서관정보학회지
    • /
    • 제36권1호
    • /
    • pp.47-69
    • /
    • 2005
  • 구전설화에 바탕을 두고 있는 전래동화는 다양한 이본이 존재하는데, 어린이들을 위해 어떤 책을 선택하는 것이 좋을지, 즉 어느 책의 본문이 가장 좋을지가 늘 의문이었다. 이 연구는 이 의문을 해결하기 위하여 시도된 것으로 원문서지학의 연구방법으로 문헌을 비평하였다. 널리 알려진 전래동화 <해님과 달님>의 이본 6편을 대상으로 줄거리 파악을 통해 구조를 분석하고 이를 토대로 제목, 배경, 등장인물, 문체, 기능을 비교 분석하였다. 그 결과 6편의 이본 가운데 어효선본의 본문이 비교적 우수하다고 판단되었다. 어효선본에서 조력자인 옥황상제를 하느님으로 바꾸고, 문체를 구어체로 바꾸며, 해와 달이 된 오누이가 서로 바꾸는 마지막 장면을 삭제한다면 이상적인 원문이 될 것이다. 이러한 원문서지학적인 연구가 축적되고, 이러한 역량이 갖추어질 때 비로소 사서가 내용, 즉 컨텐츠에 대해서 발언할 수 있게 될 것이다.

  • PDF

아토피 피부염의 임상연구병행 경제성평가 프로토콜 개발을 위한 체계적 문헌고찰연구 (Systematic Review for the Development of the Clinical Study with Economical Assessment Protocol on Atopic Dermatitis)

  • 권지예;선지혜;윤화정;김남권
    • 한방안이비인후피부과학회지
    • /
    • 제30권1호
    • /
    • pp.17-28
    • /
    • 2017
  • Objectives : The aim of this study is reviewing the literature to extracting the key parameter and finding the calibration parameter for the clinical study with economical assessment protocol on atopic dermatitis. Methods : Literature search is performed using PUBMED for literature published from Janurary 2000 to December 2016. We included randomized controlled trials(RCTs) with economic assessment in which human participants. Results : Among the articles published from January 2000 to December 2016, The 1464 articles were found. After reviewing the title, abstract and full text, the five articles were selected. Selected articles are classified 3 CEA(cost effective analysis)study, 1 CMA(cost minimizing analysis)study and 1 cost analysis study. Conclusions : We found highly reliable key parameters and calibration parameters, which might be necessary factors for developing research protocol of economic evaluation alongside clinical trial about atopic dermatitis patients.

초등학교 과학 교과서의 거꾸로 수업 활용 가능성에 대한 교사들의 인식 - 한국과 싱가포르 교과서 비교 연구 - (Elementary Teachers' Conceptions about Applicability of Science Textbooks for Flipped Learning - Comparative Study of Korean and Singaporean Textbooks -)

  • 이수아;신영준;전영석
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제36권2호
    • /
    • pp.163-179
    • /
    • 2017
  • This study is to examine whether elementary science textbooks in Korea and Singapore are applicable to flipped learning. By comparative study we sought to identifying appropriate features of science textbooks for learner-centered teaching. We analyzed text pages on the unit of 'Working of electricity' in Korean elementary science textbook for sixth grade and three chapters of 'Electric circuits, Using electricity, Conductors of electricity' in Singaporean elementary textbook, 'Science : My pals are here!'. We designed evaluating frameworks for science textbooks based on the four pillars of flipped learning. and applied it to 10 elementary teachers evaluate two textbooks. They evaluated textbooks with Likert Scale items and wrote detailed statements and exemplars about their choices. We analyzed the teachers' evaluative descriptions inductively and chose commonly mentioned characteristics. Based on the analysis, we got to the conclusion about specific features of two elementary science textbooks in terms of flexible environment, learning culture, intentional contents, and teachers' expertises. Implications for improving science textbooks towards flipped learning and learner-centered teaching through comparative study were discussed.

적은 양의 음성 및 텍스트 데이터를 활용한 멀티 모달 기반의 효율적인 감정 분류 기법 (Efficient Emotion Classification Method Based on Multimodal Approach Using Limited Speech and Text Data)

  • 신미르;신유현
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.174-180
    • /
    • 2024
  • 본 논문에서는 wav2vec 2.0과 KcELECTRA 모델을 활용하여 멀티모달 학습을 통한 감정 분류 방법을 탐색한다. 음성 데이터와 텍스트 데이터를 함께 활용하는 멀티모달 학습이 음성만을 활용하는 방법에 비해 감정 분류 성능을 유의미하게 향상시킬 수 있음이 알려져 있다. 본 연구는 자연어 처리 분야에서 우수한 성능을 보인 BERT 및 BERT 파생 모델들을 비교 분석하여 텍스트 데이터의 효과적인 특징 추출을 위한 최적의 모델을 선정하여 텍스트 처리 모델로 활용한다. 그 결과 KcELECTRA 모델이 감정 분류 작업에서 뛰어난 성능이 보임을 확인하였다. 또한, AI-Hub에 공개되어 있는 데이터 세트를 활용한 실험을 통해 텍스트 데이터를 함께 활용하면 음성 데이터만 사용할 때보다 더 적은 양의 데이터로도 더 우수한 성능을 달성할 수 있음을 발견하였다. 실험을 통해 KcELECTRA 모델을 활용한 경우가 정확도 96.57%로 가장 우수한 성능을 보였다. 이는 멀티모달 학습이 감정 분류와 같은 복잡한 자연어 처리 작업에서 의미 있는 성능 개선을 제공할 수 있음을 보여준다.

효과적인 가짜 뉴스 탐지를 위한 텍스트 분석과 네트워크 임베딩 방법의 비교 연구 (A Comparative Study of Text analysis and Network embedding Methods for Effective Fake News Detection)

  • 박성수;이건창
    • 디지털융복합연구
    • /
    • 제17권5호
    • /
    • pp.137-143
    • /
    • 2019
  • 가짜 뉴스는 소셜 미디어와 같이 사용자가 상호작용하는 미디어 플랫폼에서 정보가 빠른 속도로 확산되는 이점을 가지는 오류 정보(misinformation)의 한 형태이다. 최근 가짜 뉴스의 증가로 인해 사회적으로 많은 문제가 발생하고 있다. 본 논문에서는 이러한 가짜 뉴스를 탐지하는 방법을 제안한다. 이전의 가짜 뉴스 탐지는 텍스트 분석을 사용한 연구가 주로 수행되었다. 본 연구는 소셜 미디어의 뉴스가 확산되는 네트워크에 초점을 두고, 네트워크 임베딩 방법인 DeepWalk 로 자질을 생성하고 로지스틱 회귀분석을 사용하여 가짜 뉴스를 분류한다. 인터넷에 공개된 뉴스 211개와 120만개의 뉴스 확산 네트워크 데이터를 사용한 가짜 뉴스 탐지에 대한 실험을 수행하였다. 연구 결과 텍스트 분석에 비하여 네트워크 임베딩을 사용한 가짜 뉴스 탐지의 정확도가 최소 1.7%에서 최대 10.6% 더 높게 나타났다. 또한, 텍스트 분석과 네트워크 임베딩을 결합한 가짜 뉴스 탐지는 네트워크 임베딩에 비해 정확도의 상승이 나타나지 않았다. 본 연구의 결과는 기업이나 조직은 온라인 상에서 확산되는 가짜 뉴스 탐지에 효과적으로 활용될 수 있다.

2009 개정 교육과정에 근거한 중학교 정보 교과서의 비교 분석 (The Comparative Analysis of Middle School Informatics Textbooks Based on 2009 Revised Curriculum)

  • 강오한
    • 한국멀티미디어학회논문지
    • /
    • 제19권6호
    • /
    • pp.1065-1073
    • /
    • 2016
  • In this paper, we examined informatics textbooks for middle school students in accordance with 2009 revised curriculum through conducting both content analysis and surveys. The content analysis was analyzed the composition and contents of textbooks. Survey questionnaires were based on the authorization criteria and selection standards of informatics textbooks. The content analysis demonstrated that there were discrepancies among textbooks in areas such as the total number of pages, related material, the number of core concepts introduced in each chapter, and the application of software. The survey results showed that two sections - 'Expression and Modification' and 'Text' exhibited the most positive results, and the 'Creativity' section the least. Using the findings above, we present alternative ways to improve qualities of these textbooks.

중학교 과학 교과서의 범주별 분석 비교 (Comparative Analysis of Current Science Textbooks on Category)

  • 구수정;최돈형
    • 한국과학교육학회지
    • /
    • 제12권2호
    • /
    • pp.97-107
    • /
    • 1992
  • ln this study, we analyzed 5 science textbooks currently used for the 7th graders quantitatively by using the science textbook rating system of Collette and Chiappetta(1986), making meta-analysis of the results of 17 graduate school students of Seoul National University. The rating system consists of 11 categories with detailed items respectively : content, organization, reading level, instruction approach, illustrations, end-chapter teaching aids, laboratory activities in text and/or accompanying manual, teacher aids, indices and glossaries and mechanical makeup of text. Each item in the checklist is to be given between one and five points and the total number of possible points in this rating system is 290. It was shown that 5 science textbooks currently used for 7th-year-students were all "poor" in terms of total points and had, at large, uniformed results especially in 10 items; 7 items concerning moral and ethical implications of science, vocabulary lists, accompanying laboratory manual, annotated editions for test, supply list for laboratory program, student workbook and glossary with low points, while 3 items concerning facilities needed for laboratory activities, activities relevant to the content and textbook size with high points. A Science teachers could get a broad view with a correct impression of the books usefulness in making an evaluation of available textbooks.

  • PDF

코로나-19 이전과 이후 식생활 관련 제로웨이스트 운동 양상과 소비자 반응 비교 (A Comparative Study of Dietary Related Zero-waste Patterns and Consumer Responses Before and After COVID-19)

  • 박인형;박유민;이철;선정은;호문접;정재은
    • Human Ecology Research
    • /
    • 제60권1호
    • /
    • pp.21-38
    • /
    • 2022
  • This study uses text mining compares and contrasts consumers' social media discourses on dietary related zero-waste movement before and after COVID-19. The results indicate that the amount of buzz on social networks for the zero- waste movement has been increasing after COVID-19. Additionally, the results of frequency analysis and topic modeling revealed that subjects associated with zero-waste movement were more diversified after COVID-19. Although the results of a sentiment analysis and word cloud visualization confirmed that consumers' positive responses toward the zero-waste have been increasing, they also revealed a need to educate and encourage those who are still not aware of the need for zero-waste. Finally, consumers mentioned only a small number of companies participating in zero-waste movement on SNS, indicating that the level of active involvement by such companies is much lower than that of consumers. Theoretical and educational implications as well as those for government policy-making are considered.

A Multi-Class Classifier of Modified Convolution Neural Network by Dynamic Hyperplane of Support Vector Machine

  • Nur Suhailayani Suhaimi;Zalinda Othman;Mohd Ridzwan Yaakub
    • International Journal of Computer Science & Network Security
    • /
    • 제23권11호
    • /
    • pp.21-31
    • /
    • 2023
  • In this paper, we focused on the problem of evaluating multi-class classification accuracy and simulation of multiple classifier performance metrics. Multi-class classifiers for sentiment analysis involved many challenges, whereas previous research narrowed to the binary classification model since it provides higher accuracy when dealing with text data. Thus, we take inspiration from the non-linear Support Vector Machine to modify the algorithm by embedding dynamic hyperplanes representing multiple class labels. Then we analyzed the performance of multi-class classifiers using macro-accuracy, micro-accuracy and several other metrics to justify the significance of our algorithm enhancement. Furthermore, we hybridized Enhanced Convolution Neural Network (ECNN) with Dynamic Support Vector Machine (DSVM) to demonstrate the effectiveness and efficiency of the classifier towards multi-class text data. We performed experiments on three hybrid classifiers, which are ECNN with Binary SVM (ECNN-BSVM), and ECNN with linear Multi-Class SVM (ECNN-MCSVM) and our proposed algorithm (ECNNDSVM). Comparative experiments of hybrid algorithms yielded 85.12 % for single metric accuracy; 86.95 % for multiple metrics on average. As for our modified algorithm of the ECNN-DSVM classifier, we reached 98.29 % micro-accuracy results with an f-score value of 98 % at most. For the future direction of this research, we are aiming for hyperplane optimization analysis.