• Title/Summary/Keyword: 결과값 예측 방법

Search Result 1,548, Processing Time 0.038 seconds

A Hybrid Value Predictor using Static and Dynamic Classification in Superscalar Processors (슈퍼스칼라 프로세서에서 정적 및 동적 분류를 사용한 혼합형 결과 값 예측기)

  • 김주익;박홍준;조영일
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.30 no.10
    • /
    • pp.569-578
    • /
    • 2003
  • Data dependencies are one of major hurdles to limit ILP(Instruction Level Parallelism), so several related works have suggested that the limit imposed by data dependencies can be overcome to some extent with use of the data value prediction. Hybrid value predictor can obtain the high prediction accuracy using advantages of various predictors, but it has a defect that same instruction has overlapping entries in all predictor. In this paper, we propose a new hybrid value predictor which achieves high performance by using the information of static and dynamic classification. The proposed predictor can enhance the prediction accuracy and efficiently decrease the prediction table size of predictor, because it allocates each instruction into single best-suited predictor during the fetch stage by using the information of static classification. Also, it can enhance the prediction accuracy because it selects a best- suited prediction method for the “Unknown”pattern instructions by using the dynamic classification mechanism. Simulation results based on the SimpleScalar/PISA tool set and the SPECint95 benchmarks show the average correct prediction rate of 85.1% by using the static classification mechanism. Also, we achieve the average correction prediction rate of 87.6% by using static and dynamic classification mechanism.

Prediction of Laminate Composite Strength Using Probabilistic Approach (확률분포를 이용한 복합재료의 강도예측)

  • 조영준;강태진;이경우
    • Composites Research
    • /
    • v.13 no.1
    • /
    • pp.33-39
    • /
    • 2000
  • A numerical approach for predicting the ultimate strength of laminate composites has been studied using the Weibull distribution of the strengths of lamina plies. The probabilistic initial failure strengths of laminates were calculated using Tsai-Hill failure criterion. The ultimate strength of the laminate composites has been predicted using progressive failure analysis. The experimental results show that the strength prediction based on the Weibull distribution of ply strength reasonably agrees well with the experimentals better than equal strength assumption.

  • PDF

A Study on the Automatic Extraction of Fomulation and Properties in Chemical Field Patent Document by Using Machine Learning Technology (기계학습 기술을 활용한 화학분야 특허문서의 조성/물성 정보 자동추출 방법 연구)

  • Kim, Hongki;Lee, Hayoung;Park, Jinwoo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.277-280
    • /
    • 2019
  • 본 논문에서는 화학분야 특허 문서에 존재하는 도표(TABLE) 데이터를 인공지능 기술을 활용하여 자동으로 추출하고 정형화된 형태로 가공하는 방법을 제안한다. 특허 문서에서 도표 데이터는 실시예에서 실험결과나 비교결과를 간결하고 가시적으로 표현하기 위하여 주로 사용되나, 셀의 속성을 정의하는 헤더부분과 수치가 표현되는 값 부분의 경계가 모호하여 구조화하는데 어려움이 있다. 본 논문에서 제안하는 방법은 소량의 학습데이터를 구축하고 기계학습을 통해 도표에 존재하는 셀의 속성을 예측하고, 예측된 속성을 토대로 조성과 물성 정보를 자동으로 구분하여 추출하는 방법을 제시한다. 제시된 방법을 활용하여 화학 분야 조성물 특허의 도표데이터에 시뮬레이션 결과 각 항목별 98.17%의 속성 예측 정확도를 나타내었으며 기존 규칙기반 연구보다 작업난이도, 예측정확도에서 우수한 성과를 보인다.

  • PDF

Time-Series Data Prediction using Hidden Markov Model and Similarity Search for CRM (CRM을 위한 은닉 마코프 모델과 유사도 검색을 사용한 시계열 데이터 예측)

  • Cho, Young-Hee;Jeon, Jin-Ho;Lee, Gye-Sung
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.5
    • /
    • pp.19-28
    • /
    • 2009
  • Prediction problem of the time-series data has been a research issue for a long time among many researchers and a number of methods have been proposed in the literatures. In this paper, a method is proposed that similarities among time-series data are examined by use of Hidden Markov Model and Likelihood and future direction of the data movement is determined. Query sequence is modeled by Hidden Markov Modeling and then the model is examined over the pre-recorded time-series to find the subsequence which has the greatest similarity between the model and the extracted subsequence. The similarity is evaluated by likelihood. When the best subsequence is chosen, the next portion of the subsequence is used to predict the next phase of the data movement. A number of experiments with different parameters have been conducted to confirm the validity of the method. We used KOSPI to verify suggested method.

Prediction of Probabilistic Meteorological Drought Using Bayesian Network (베이지안 네트워크를 활용한 기상학적 가뭄의 확률론적 예측)

  • Shin, Ji Yae;Kwon, Hyun-Han;Kim, Tae-Woong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.20-20
    • /
    • 2015
  • 최근 기후변화의 영향으로 전 세계적으로 홍수와 가뭄의 발생빈도가 증가하고 있다. 특히, 가뭄은 우리나라에서 겨울과 봄철을 중심으로 매년 발생되고 있다. 가뭄의 정확한 발생을 판단하기는 어려우나, 가뭄이 발생되면 그 진행속도는 홍수보다 느리기 때문에 초기에 가뭄의 발생가능성을 예측한다면 가뭄에 대한 피해를 줄일 수 있다. 따라서 최근 가뭄 예측에 대한 다양한 연구가 이루어지고 있다. 본 연구에서는 가뭄발생의 불확실성을 내포하기 위하여 Bayesian Network (BN) 모형과 SPI의 자기상관성을 바탕으로 가까운 미래의 가뭄 발생확률을 예측하는 방법을 제안하였다. BN은 변수들 간의 인과관계를 확률적으로 나타낼 수 있는 네트워크 모형으로, 자연현상에 대한 위험도 분석 및 의학 분야에서 질병추정을 위한 모형으로 활용되고 있다. 본 연구에서는 가까운 미래의 가뭄 예측을 위하여 APEC 기후센터(APEC Climate Center, APCC)에서 제공하는 다중모형앙상블(Multi-model Ensemble, MME) 강우예측 결과로 도출한 미래 SPI 및 과거 강우량 자료로 구축한 SPI를 부모노드로, 예측 SPI를 자식노드로 BN을 구축하였다. BN의 각각의 노드를 Gaussian 확률분포모형으로 가정한 뒤, Likelihood weighting 방법으로 주변사후분포확률(Marginal posterior distribution)을 추정하여 미래의 SPI의 발생확률을 계산하였다. 2008년부터 2013년의 BN 가뭄 예측값과 MME 강우예측 결과로 도출한 SPI를 실제 관측 강우량으로 산정한 SPI와 비교하였으며, BN이 실제 관측결과에 가까운 결과가 도출되었다. 본 연구에서는 BN을 활용하여 가까운 미래의 가뭄 발생가능성을 확률적으로 나타낼 수 있는 방법을 제시하였으며, 그 결과 가뭄상태별 가뭄 발생확률이 산정되었다.

  • PDF

Improvement of Trip Generation Model in Seoul Metropolitan Area (수도권지역의 통행발생모형의 검증 (회귀모형과 카테고리모형을 중심으로))

  • Kim, Jin-Ja;Rhee, Jong-Ho
    • Journal of Korean Society of Transportation
    • /
    • v.22 no.3 s.74
    • /
    • pp.49-58
    • /
    • 2004
  • The first and perhaps the most critical and perhaps the most important step in the process of predicting future traffic volume in a region (Zone) is to estimate the number of trips generated in from each traffic analysis zone. Most trip generation models for urban transportation planning, and highway in Korea are regression models. In Korea the category analysis has not been tried for last decades since the proper data such as the household travel behavior data have not been collected. Recently, the comprehensive household travel behavior survey such as ${\ulcorner}$1996 The Household Travel Behavior Survey${\lrcorner}$, ${\ulcorner}$2002 The Household Travel Behavior Survey${\lrcorner}$ has been done. In this paper, the cross-classification tables of Seoul Metropolitan Area including the City of Seoul and Kyonggi Province are estimated by the category analysis. The tables are compared with regression models and ${\ulcorner}$2002 The Household Travel Behavior Survey${\lrcorner}$ data in terms of predictive capabilities in Seoul Metropolitan Area. Improvement strategies for trip generation forecast in Seoul Metropolitan Area are proposed.

Stock Market Prediction using Sentiment Dictionary based on Predicates (서술어 중심 감성 사전을 통한 주가 등락 예측)

  • Um, Jang-Yun;Lee, Soowon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.857-860
    • /
    • 2014
  • 본 연구에서는 경제 뉴스로부터 서술어 중심의 감성 사전을 구축하고, 하루 동안에 배포된 뉴스를 이용해 전일 종가 대비 당일 종가의 등락을 예측하는 모델을 제안한다. 기존의 주식 도메인 관련 감성 사전을 구축하는 방식은 주가 등락에 관련된 명사를 중심으로 사전을 구축하는 방식이나 대부분의 명사는 극성 값이 중립인 경우가 많아 극성 값을 추정하기 힘들다는 문제점이 있다. 본 연구에서는 극성 값이 잘 표현되는 서술어 중심의 감성사전을 구축하고 극성 값을 자동 추출하여 주가의 등락을 예측한다. 실험 결과 기존 감성 사전을 통한 주가 예측 방법에 비하여 본 연구에서 제안하는 서술어 중심의 감성 사전을 통한 주가 예측 정확도가 높게 나타났다.

Development of Performance to Predict the Prognosis of Korean Patients with Acute Myocardial Infarction by Data Transformation for Naïve Bayes Method (나이브 베이지안 방법을 위한 데이터 변환법으로 한국인 급성 심근경색증 환자의 예후를 예측하는 성능의 향상)

  • Cho, Sun Ho;Kim, Jeong-su;Kwon, Hyuk-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.868-871
    • /
    • 2014
  • 오늘날 한국에서는 급성 심근경색증으로 인한 사망률이 높은 상태로, 발병 시에 치료까지 신속한 의사결정이 요구되는 위중한 질병이기 때문에, 한국인에게 맞는 급성 심근경색증 연구가 매우 중요 하다. 본 연구는 한국인 급성 심근경색증 등록 데이터를 이용해 기계 학습 방법의 한 종류인 나이브 베이지안 방법을 이용해 급성 심근경색증 환자의 예후를 예측하고자, 의료 데이터의 특성에 따른 데이터 변환 방법을 제안한다. 타겟 클래스에서 보다 중요한 의미를 가진 death 값에 대해 각 값을, nominal value, numeric value, 결측치로 구분한 방식에 따라, 확률을 계산해 변환한다. 실험 결과를 통해 결측치를 피처마다 존재하는 값들의 평균을 낸 값으로 대입하였을 때 가장 좋은 성능임을 알 수 있었는데, 기존의 방법에 비해 precision=5.4%, recall=7.0%의 성능이 향상되었다. 따라서 제안한 방법은 나이브 베이지안 방법의 예측 성능 향상에 기여하였다고 판단된다. 이후 적용했던 데이터 변환 방법을 여러 가지 기계 학습 방법에서 판단해보고, 다른 타겟 클래스에도 시험해보고자 한다.

Prediction of Semiconductor Exposure Process Measurement Results using XGBoost (XGBoost를 사용한 반도체 노광 공정 계측 결과 예측)

  • Shin, Jeong Il;Park, Ji Su;Shon, Jin Gon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.505-508
    • /
    • 2021
  • 반도체 회로의 미세화로 단위 공정이 증가하면 TAT(turn-around time) 증가에 따른 제조 비용이 늘어난다. 반도체 공정 중 포토 공정은 마스크의 회로를 웨이퍼에 전사하는 공정으로 전사를 담당하는 노광장비의 성능에 의해 회로의 정확성이 결정된다. 이런 정확성을 검증하는 계측공정은 회로의 미세화가 진행될수록 필요성은 증가하나 TAT 증가의 주된 요인으로 최근 기계학습을 사용한 다양한 예측 모형들의 개발로 계측 결과를 예측하는 실험들이 진행되고 있다. 본 논문은 노광장비 센서들의 이상값을 감지하여 분류 후 계측공정을 진행하는 LFDC(Lithography Fault Detection and Classification) 시스템의 문제인 분류 성능이 떨어지는 것을 해결하기 위해 XGBoost를 사용하여 계측공정을 진행하지 않고 노광장비 센서의 이상값을 학습된 학습기를 통해 분류하여 포토 공정을 재진행하거나 다음 공정을 진행하는 방법을 실험하였다. 실험에서 사용된 계측 결과 예측 모형은 89%의 정확도를 확보하였고 반도체 데이터 특성인 심각한 불균형의 데이터에 대해서도 같은 정확도를 얻었다. 이런 결과는 노광장비 센서들의 이상값에 대해 89%는 정상으로 판단하였고 정상으로 판단한 웨이퍼를 실제 계측 시 예측과 같은 결과를 얻었다. 계측 결과 예측 모형을 사용하면 실제 계측을 진행하지 않고 노광장비 센서들의 이상값에 대한 판정을 할 수 있어 TAT 단축으로 제조 비용감소, 계측 장비 부하 감소 및 효율 향상을 할 수 있다. 하지만 본 논문에서는 90%의 성능을 보이는 계측 결과 예측 모형으로 여전히 10%에 대해서는 실제 계측이 필요한 문제에 대해 추후 더 연구가 필요하다.

Long-term runoff prediction of Gyeongan-cheon watershed using statistically forecasted weather information (통계적 기상예측정보를 이용한 경안천 유출량 장기 전망)

  • Kim, Chul-Gyum;Lee, Jeongwoo;Lee, Jeong Eun;Kim, Hyeonjun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.413-413
    • /
    • 2022
  • 본 연구에서는 통계적 방법으로 도출된 장기 기상예측정보를 이용하여 유역에서의 유출량 전망 가능성을 검토하였다. 먼저 한강권역의 월 강수량과 기온에 대해 글로벌 기후지수와의 원격상관성을 기반으로 다중회귀모형 기반의 통계적 예측모형을 구성하여 미래기간(1~12개월)에 대한 월 단위 기상예측정보를 도출하였다. 월 단위로 도출된 강수량과 기온은 통계적 상세화 기법을 통해 한강권역 주요 ASOS 관측소 지점별로 일 단위 강수량과 기온자료로 변환하였으며, 상세화된 일 자료를 유역모형인 SWAT의 입력자료로 활용하여 경안천 유역의 미래기간에 대한 유출량을 도출하였다. 유출량 예측성을 평가하기 위하여 과거기간(2003~2021년)을 대상으로 관측유출량과 예측기상정보로부터 산출된 예측유출량을 비교하였다. 각 월별로 예측된 유출량의 중앙값과 관측값의 적합도를 분석한 결과, PBIAS는 -5.2~-2.7%, RSR은 0.79~0.91, NSE는 0.34~0.38, r은 0.59~0.62로 강수량 및 기온의 예측성에 비해 낮게 나타났다. 전 기간에 대해 월별로 분석한 예측결과에 대한 3분위 확률은 5월, 6월, 7월, 9월, 11월은 평균 42.8%로 예측성이 충분한 것으로 나타났으나, 나머지 월에서의 평균 예측성은 17.3%로 매우 낮게 나타났다. 상세화된 기상정보를 이용하여 유역모델링을 통해 산정한 유출량에 대한 전망 결과는 기상예측결과에 비해 상대적으로 예측성이 낮은 것으로 분석되었다. 이는 관측값 자체에서 나타날 수 있는 불확실성에 기인할 수도 있으며, 유출량에 지배적인 영향을 주는 강수량의 예측성에 대한 문제가 유역 모델링 과정에서 증폭되어 나타나는 문제일 수도 있다. 또한 지점별 일 자료로 상세화되는 과정에서의 불확실성, 우리나라 여름철 유출량 변동성 등 여러 가지 요인이 복합적으로 영향을 주어 나타나는 것으로 생각된다. 향후 다양한 대상유역에 대한 검토와 기상예측모형의 보완, 상세화 과정에서의 불확실성 해소 등을 통해 예측성을 개선할 계획이다.

  • PDF