• 제목/요약/키워드: Text Index

검색결과 268건 처리시간 0.026초

Stock prediction using combination of BERT sentiment Analysis and Macro economy index

  • Jang, Euna;Choi, HoeRyeon;Lee, HongChul
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권5호
    • /
    • pp.47-56
    • /
    • 2020
  • 주가지수는 한 국가의 경제 지표뿐만 아니라 투자판단의 지표로도 활용되므로 이를 예측하는 연구가 지속해서 진행되고 있다. 주가지수 예측을 하는 작업은 기술적, 경제적 및 심리적 요인 등이 반영된 것으로 예측의 정확도를 위해서는 복합적 요인을 고려해야 한다. 따라서 지수의 변동에 영향을 미치는 요인들을 선별하여 반영한 주가지수 예측모델연구가 필요하다. 이와 관련한 기존 연구에서는 시장의 변동을 만들어 내는 뉴스 정보 또는 거시 경제 지표를 각각 이용하거나, 몇 가지의 지표 조합만을 반영한 예측 연구가 대부분이었다. 따라서 본 연구에서는 미국 다우존스지수 예측을 위해 뉴스 정보의 감성 분석과 다양한 거시경제지표를 고려하여 효과적인 지표 조합을 제시하고자 한다. 뉴스 정보의 감성 분석은 최신 자연어처리 기법인 BERT와 NLTK VADER를 사용하고, 예측모델은 주가예측모델로 적합하다고 알려진 딥러닝 예측모델 LSTM을 적용하여 가장 효과적인 지표 조합을 제시했다.

벡터 양자화를 이용한 한국어 억양 곡선 생성 (Generation of Korean Intonation using Vector Quantization)

  • 안혜선;김형순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.209-212
    • /
    • 2001
  • 본 논문에서는 text-to-speech 시스템에서 사용할 억양 모델을 위해 벡터 양자화(vector quantization) 방식을 이용한다. 어절 경계강도(break index)는 세단계로 분류하였고, CART(Classification And Regression Tree)를 사용하여 어절 경계강도의 예측 규칙을 생성하였다. 예측된 어절 경계강도를 바탕으로 운율구를 예측하였으며 운율구는 다섯 개의 억양 패턴으로 분류하였다. 하나의 운율구는 정점(peak)의 시간축, 주파수축 값과 이를 기준으로 한 앞, 뒤 기울기를 추출하여 네 개의 파라미터로 단순화하였다. 운율구에 대해서 먼저 운율구가 문장의 끝일 경우와 아닐 경우로 분류하고, 억양 패턴 다섯 개로 분류하여. 모두 10개의 운율구 set으로 나누었다. 그리고 네 개의 파라미터를 가지고 있는 운율구의 억양 패턴을 벡터 양자화 방식을 이용하여 분류(clusteing)하였다 운율의 변화가 두드러지는 조사와 어미는 12 point의 기본주파수 값을 추출하고 벡터 양자화하였다. 운율구와 조사 어미의 codebook index는 문장에 대한 특징 변수 값을 추출하고 CART를 사용하여 예측하였다. 합성할 때에는 입력 tort에 대해서 운율구의 억양 파라미터를 추정한 다음, 조사와 어미의 12 point 기본주파수 값을 추정하여 전체 억양 곡선을 생성하였고 본 연구실에서 제작한 음성합성기를 통해 합성하였다.

  • PDF

바다-$IV/I^2R$: 고차원 이미지 색인 구조를 이용한 효율적인 내용 기반 이미지 검색 시스템의 설계와 구현 (BADA-$IV/I^2R$: Design & Implementation of an Efficient Content-based Image Retrieval System using a High-Dimensional Image Index Structure)

  • 김영균;이장선;이훈순;김완석;김명준
    • 한국정보처리학회논문지
    • /
    • 제7권2S호
    • /
    • pp.678-691
    • /
    • 2000
  • A variety of multimedia applications require multimedia database management systems to manage multimedia data, such as text, image, and video, as well as t support content-based image or video retrieval. In this paper we design and implement a content-based image retrieval system, BADA-IV/I$^2$R(Image Information Retrieval), which is developed based on BADA-IV multimedia database management system. In this system image databases can be efficiently constructed and retrieved with the visual features, such as color, shape, and texture, of image. we extend SQL statements to define image query based on both annotations and visual features of image together. A high-dimensional index structure, called CIR-tree, is also employed in the system to provide an efficient access method to image databases. We show that BADA-IV/I$^2$R provides a flexible way to define query for image retrieval and retrieves image data fast and effectively: the effectiveness and performance of image retrieval are shown by BEP(Bull's Eye Performance) that is used to measure the retrieval effectiveness in MPEG-7 and comparing the performance of CIR-tree with those of X-tree and TV-tree, respectively.

  • PDF

성인 및 청소년의 엄지손가락 반복사용에 따른 근 피로한계 비교 (Comparison of Muscular Endurance Limit of the Thumb with Repetitive Using Between Adults and Children)

  • 박정홍;김광훈;손권
    • 대한의용생체공학회:의공학회지
    • /
    • 제34권1호
    • /
    • pp.1-7
    • /
    • 2013
  • According to the frequent use of mobile devices, risk of repetitive strain injury for the finger joints was increasing recently. The purpose of this study was to investigate the difference of muscular endurance limit of the thumb between adults and children. A total of thirty subjects (15 adults: $41.0{\pm}7.9$ years and 15 children: $9.5{\pm}2.7$ years) was recruited for this experiment. Maximum voluntary contraction (MVC) of the thumb was measured for 100 trials for each subject by using a push-pull gauge. From the maximum peak value obtained, three main factors (MVC, endurance limit, and fatigue index) were defined to quantify fatigue characteristics of the thumb flexor muscle. The experimental results showed that the mean of MVC, endurance limit, and fatigue index of the children were approximately 50% compared to the adults (p < 0.001). From the results of Pearson correlation test, the endurance limit was highly correlated with weight, age, hand length rather than height. Based on this study, children are more vulnerable to repetitive task using the thumb such as text/SNS messaging, gaming, and scrolling.

Applying Keyword Analysis to Predicting Agriculture Product Price Index: The Case of the Chinese Farming Market

  • Wang, Zhi-yuan;Kwon, Ohbyung;Liu, Fan
    • Asia Pacific Journal of Business Review
    • /
    • 제1권1호
    • /
    • pp.1-22
    • /
    • 2016
  • The prediction of prices of agricultural products in the agriculture IT sector plays a significant role in the economic life of consumers and anyone engaged in agricultural business, and as these prices fluctuate more often than do other prices, the prediction of these prices holds a great deal of research promise. For this reason, academic literature has provided studies on the factors influencing the prices of agricultural products and the price index. However, as these factors vary, they are difficult to predict, resulting in the challenge of acquiring quantitative data. China is one example of a country without a reliable prediction system for prices of agricultural products. Fortunately, disclosed heterogeneous data can be found on the Internet, which allows for the effective collection of factors related to the prediction of these product prices through the use of text mining. The data provided online is valuable in that they reflect the opinions of the general public in real-time. Accordingly, this study aims to use heterogeneous data from the Internet and suggest a model predicting the prices of agricultural products before functional analyses. Toward this end, data analyses were conducted on the Chinese agricultural products market, one of the largest markets in the world.

Intelligent missing persons index system Implementation based on the OpenCV image processing and TensorFlow Deep-running Image Processing

  • Baek, Yeong-Tae;Lee, Se-Hoon;Kim, Ji-Seong
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권1호
    • /
    • pp.15-21
    • /
    • 2017
  • In this paper, we present a solution to the problems caused by using only text - based information as an index element when a commercialized missing person indexing system indexes missing persons registered in the database. The existing system could not be used for the missing persons inquiry because it could not formalize the image of the missing person registered together when registering the missing person. To solve these problems, we propose a method to extract the similarity of images by using OpenCV image processing and TensorFlow deep - running image processing, and to process images of missing persons to process them into meaningful information. In order to verify the indexing method used in this paper, we constructed a Web server that operates to provide the information that is most likely to be needed to users first, using the image provided in the non - regular environment of the same subject as the search element.

저자프로파일링분석과 저자동시인용분석의 유용성 비교 검증 (A Comparison Test on the Potential Utility between Author Profiling Analysis(APA) and Author Co-Citation Analysis(ACA))

  • 유종덕;최은주
    • 정보관리학회지
    • /
    • 제28권1호
    • /
    • pp.123-144
    • /
    • 2011
  • 본 연구는 학문의 지적 구조를 분석하는 새로운 분석기법인 저자프로파일링분석과 전통적인 분석기법인 저자동시인용분석을 비교하여 분석함으로써 국내 연구환경에 맞는 지적 구조 분석 방법을 제안하는 데 목적을 두고 있다. 이를 위하여 본 연구에서는 인용색인을 이용하지 않고 학문의 지적 구조를 분석할 수 있는 텍스트마이닝을 이용한 저자프로파일링분석을 통하여 새로운 지적 구조 방법의 유용성을 확인하 고자 하였다. 분석대상 학술지는 "대한건축학회 논문집 - 계획계"를 대상으로 하였다.

초등학생 대상의 국내 구강건강관리 프로그램에 대한 체계적 문헌고찰 (A systematic review of domestic oral health care programs for elementary school children)

  • 여안나;이수영
    • 한국치위생학회지
    • /
    • 제20권3호
    • /
    • pp.257-268
    • /
    • 2020
  • Objectives: This purpose of this study was to examine the trends in interventional research and analyze the contents and results of intervention through a systematic literature review of the domestic research literature, suggesting the effect of an oral care program on elementary school students. Methods: A total of 262 articles were retrieved initially, and the duplicate articles were then removed, excluded after screening titles, abstracts, and full-text articles. Finally, a total of 16 papers were used in the review. Results: The study included 9 articles with the nonequivalent control group pretest-posttest design and 7 with the one-group pretest-posttest design. All articles were of non-randomized studies. The most common index of the interventional effect was dental plaque. Further, oral health behaviors and knowledge, perception, self-efficacy, and DMFT index were common indices. In the quality assessment, in the "blinding of outcome assessment" among six items of ROBANS, 12 studies showed a high risk of bias. Conclusions: In order to develop an interventional oral health care program for elementary school students and evaluate the effectiveness, a strict research design and qualitative improvement of research reports are required, and continuous research should be conducted to develop a systematic protocol.

혈액투석 환자를 위한 통합적 관리 프로그램의 개발 및 효과 (Development and Evaluation of Integrated Management Program for Hemodialysis Patients)

  • 김보라;유하나
    • 가정간호학회지
    • /
    • 제31권1호
    • /
    • pp.66-76
    • /
    • 2024
  • Purpose: This study aimed to develop and evaluate an integrated management program to enhance self-efficacy, compliance with sick-role behaviors, symptom management, and biomarker indication in hemodialysis patients. Methods: The integrated management program was developed through a systematic review of literature, analysis of relevant online data, and expert validation. It comprised 480 min of video-based education delivered eight times over four weeks, supplemented by weekly phone consultations and text message support from a nurse. To evaluate the program's effectiveness, it was administered to 44 patients with hemodialysis in a single group in a pre-post test experimental study. Changes in self-efficacy, sick-role behavior compliance, dialysis symptom index, and biomarkers were assessed. Results: The program yielded statistically significant improvements in self-efficacy (t=-7.13, p<.001), sick-role behavioral compliance (t=-7.35, p<.001), dialysis symptom index (t=4.32, p<.001), and blood urea nitrogen levels (t=2.55, p=.014) among the participants. Conclusion: The integrated management program is an effective intervention for improving hemodialysis patients' self-efficacy, compliance with sick-role behaviors, and experience of symptoms. Additionally, it is considered an intervention with high clinical applicability and efficiency through video reproducibility.

빅데이터 기반의 정성 정보를 활용한 부도 예측 모형 구축 (Bankruptcy Prediction Modeling Using Qualitative Information Based on Big Data Analytics)

  • 조남옥;신경식
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.33-56
    • /
    • 2016
  • 대부분의 부도 예측에 관한 연구는 재무 변수를 중심으로 통계적 방법 또는 인공지능 기법을 적용하여 부도 예측 모형을 구축하였다. 그러나 재무비율과 같은 회계 정보를 이용한 부도 예측 모형은 재무 제표 결산 시점과 신용평가 시점 간 시차를 고려하지 않을 뿐만 아니라 해당 산업의 경제적 상황과 같은 외부 환경적인 요소를 반영하기 어렵다는 한계점이 존재하였다. 기업의 부도 여부를 예측하기 위해 정량 정보인 재무 변수만을 이용하는 것에 한계가 있음에도 불구하고 정성 정보를 부도 예측 모형에 반영한 연구는 아직 미흡한 실정이다. 본 연구에서는 재무 변수를 이용하는 기존 부도 예측 모형의 성과를 개선하기 위해 빅데이터 기반의 정성 정보를 추가적인 입력 변수로 활용하는 부도 예측 모형을 제안하였다. 제안 모형의 성과 향상은 정성 정보를 예측 모형에 통합시키기에 적합한 형태로 정보의 유형을 변환시킬 수 있는가에 따라 달려있다. 이에 본 연구에서는 정성 정보 처리를 위한 방법으로 빅데이터 분석 기법 중 하나인 텍스트 마이닝(Text Mining)을 활용하였다. 해당 산업과 관련된 경제 뉴스 데이터로부터 경제 상황에 대한 감성 정보를 추출하기 위해 도메인 중심의 감성 어휘 사전을 구축하고, 구축된 어휘 사전을 기반으로 감성 분석(Sentiment Analysis)을 수행하였다. 형태소 분석 등을 포함한 텍스트 전처리 과정을 거쳐 감성 어휘를 추출하고, 각 어휘에 대한 극성 및 감성 점수를 부여하였다. 분석 결과, 전통적 부도 예측 모형에 경제 뉴스 데이터에서 도출한 정성 정보를 반영하는 것은 모형의 성과를 개선하는 것으로 나타났다. 특히, 경제 상황에 대한 부정적 감정이 기업의 부도 여부를 예측하는 데 더욱 효과적임을 알 수 있었다.