• 제목/요약/키워드: 결과값 예측 방법

검색결과 1,548건 처리시간 0.035초

슈퍼스칼라 프로세서에서 정적 및 동적 분류를 사용한 혼합형 결과 값 예측기 (A Hybrid Value Predictor using Static and Dynamic Classification in Superscalar Processors)

  • 김주익;박홍준;조영일
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권10호
    • /
    • pp.569-578
    • /
    • 2003
  • 데이타 종속성은 명령어 수준 병렬성을 향상시키는데 중요한 장애요소가 되고 있으며, 최근 여러 논문에서 데이타 종속을 제거하기 위하여 결과 값을 예상하는 방법이 연구되고 있다. 혼합형 결과 값 예측기는 여러 예측기의 장점을 이용하여 높은 예상 정확도를 얻을 수 있지만, 동일한 명령어가 여러 개의 예측기 테이블에 중복 엔트리를 갖게되어 높은 하드웨어의 비용을 필요로 한다는 단점이 있다. 본 논문에서는 정적 및 동적 분류 정보를 이용하여 높은 성능을 얻을 수 있는 새로운 혼합형 결과 값 예측기를 제안한다. 제안된 예측기는 반입 단계 동안 정적 분류 정보를 사용하여 적절한 예측기에 할당함으로써 테이블 크기를 효과적으로 감소시켰고 예상정확도를 향상시켰다. 또한 제안된 예측기는 동적 분류를 사용하여“Unknown”유형의 명령어에 가장 적절한 예측방법을 선택하도록 하여 예상 정확도를 더욱 향상시켰다. SimpleScaiar/PISA 툴셋과 SPECint95 벤치마크 프로그램에서 시뮬레이션 한 결과, 정적 분류 정보를 사용하였을 경우 평균 예상 정확도가 85.1%, 정적 및 동적 분류 정보를 모두 사용하였을 경우 87.6%의 평균 예상 정확도를 얻을 수 있었다.

확률분포를 이용한 복합재료의 강도예측 (Prediction of Laminate Composite Strength Using Probabilistic Approach)

  • 조영준;강태진;이경우
    • Composites Research
    • /
    • 제13권1호
    • /
    • pp.33-39
    • /
    • 2000
  • 복합재료 적층판의 최종강도를 점증적 파손 해석방법을 사용하여 예측하였다. 플라이 강도를 확률분포로 가정했을 경우와 상수로 가정했을 경우 각각의 최종강도를 예측하였다. 복합재료의 강도에 대한 확률분포인 Weibull 분포를 이용하여 임의의 강도 값을 얻은 후 이 값을 Tsai-Hill 파손식에 대입하여 파손여부를 판정하고 파손이 일어나면 재료의 물성을 떨어뜨렸다. 이 방법에 의해서 얻어진 결과를 플라이의 강도를 상수로 가정하여 해석한 경우와의 차이에 대하여 고찰하였다. 결과적으로 두 경우 모두 실험치와 약간의 오차를 보였지만 파손의 경향성에 있어서는 확률분포를 이용한 강도해석이 실험값과 더 근사한 결과를 보였다.

  • PDF

기계학습 기술을 활용한 화학분야 특허문서의 조성/물성 정보 자동추출 방법 연구 (A Study on the Automatic Extraction of Fomulation and Properties in Chemical Field Patent Document by Using Machine Learning Technology)

  • 김홍기;이하영;박진우
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.277-280
    • /
    • 2019
  • 본 논문에서는 화학분야 특허 문서에 존재하는 도표(TABLE) 데이터를 인공지능 기술을 활용하여 자동으로 추출하고 정형화된 형태로 가공하는 방법을 제안한다. 특허 문서에서 도표 데이터는 실시예에서 실험결과나 비교결과를 간결하고 가시적으로 표현하기 위하여 주로 사용되나, 셀의 속성을 정의하는 헤더부분과 수치가 표현되는 값 부분의 경계가 모호하여 구조화하는데 어려움이 있다. 본 논문에서 제안하는 방법은 소량의 학습데이터를 구축하고 기계학습을 통해 도표에 존재하는 셀의 속성을 예측하고, 예측된 속성을 토대로 조성과 물성 정보를 자동으로 구분하여 추출하는 방법을 제시한다. 제시된 방법을 활용하여 화학 분야 조성물 특허의 도표데이터에 시뮬레이션 결과 각 항목별 98.17%의 속성 예측 정확도를 나타내었으며 기존 규칙기반 연구보다 작업난이도, 예측정확도에서 우수한 성과를 보인다.

  • PDF

CRM을 위한 은닉 마코프 모델과 유사도 검색을 사용한 시계열 데이터 예측 (Time-Series Data Prediction using Hidden Markov Model and Similarity Search for CRM)

  • 조영희;전진호;이계성
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.19-28
    • /
    • 2009
  • 시계열의 예측에 대한 문제는 오랫동안 많은 연구자들의 연구의 대상이었으며 예측을 위한 많은 방법이 제안되었다. 본 논문에서는 은닉 마코프 모델(Hidden Markov Model)과 우도(likelihood)를 사용한 유사도 검색을 통하여 향후 시계열 데이터의 운행 방향을 예측하는 방법을 제안한다. 이전에 기록된 시계열 데이터에서 질의 시퀸스(sequence)와 유사한 부분을 검색하고 유사 부분의 서브 시퀸스를 사용하여 시계열을 예측하는 방법이다. 먼저 주어진 질의 시퀸스에 대한 은닉 마코프 모델을 작성한다. 그리고 시계열 데이터에서 순차적으로 일정 길이의 서브 시퀸스를 추출하고 추출된 서브 시퀸스와 작성된 은닉 마코프 모델과의 우도를 계산한다. 시계열 데이터로부터 추출된 서브 시퀸스 중에서 우도가 가장 높은 시퀸스를 유사 시퀸스로 결정하고 결정된 부분 이후의 값을 추출하여 질의 시퀸스 이후의 예측 값을 추정한다. 실험 결과 예측 값과 실제 값이 상당한 유사성을 나타내었다. 제안된 방법의 유효성은 코스피(KOSPI) 종합주가지수를 대상으로 실험하여 검증한다.

베이지안 네트워크를 활용한 기상학적 가뭄의 확률론적 예측 (Prediction of Probabilistic Meteorological Drought Using Bayesian Network)

  • 신지예;권현한;김태웅
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.20-20
    • /
    • 2015
  • 최근 기후변화의 영향으로 전 세계적으로 홍수와 가뭄의 발생빈도가 증가하고 있다. 특히, 가뭄은 우리나라에서 겨울과 봄철을 중심으로 매년 발생되고 있다. 가뭄의 정확한 발생을 판단하기는 어려우나, 가뭄이 발생되면 그 진행속도는 홍수보다 느리기 때문에 초기에 가뭄의 발생가능성을 예측한다면 가뭄에 대한 피해를 줄일 수 있다. 따라서 최근 가뭄 예측에 대한 다양한 연구가 이루어지고 있다. 본 연구에서는 가뭄발생의 불확실성을 내포하기 위하여 Bayesian Network (BN) 모형과 SPI의 자기상관성을 바탕으로 가까운 미래의 가뭄 발생확률을 예측하는 방법을 제안하였다. BN은 변수들 간의 인과관계를 확률적으로 나타낼 수 있는 네트워크 모형으로, 자연현상에 대한 위험도 분석 및 의학 분야에서 질병추정을 위한 모형으로 활용되고 있다. 본 연구에서는 가까운 미래의 가뭄 예측을 위하여 APEC 기후센터(APEC Climate Center, APCC)에서 제공하는 다중모형앙상블(Multi-model Ensemble, MME) 강우예측 결과로 도출한 미래 SPI 및 과거 강우량 자료로 구축한 SPI를 부모노드로, 예측 SPI를 자식노드로 BN을 구축하였다. BN의 각각의 노드를 Gaussian 확률분포모형으로 가정한 뒤, Likelihood weighting 방법으로 주변사후분포확률(Marginal posterior distribution)을 추정하여 미래의 SPI의 발생확률을 계산하였다. 2008년부터 2013년의 BN 가뭄 예측값과 MME 강우예측 결과로 도출한 SPI를 실제 관측 강우량으로 산정한 SPI와 비교하였으며, BN이 실제 관측결과에 가까운 결과가 도출되었다. 본 연구에서는 BN을 활용하여 가까운 미래의 가뭄 발생가능성을 확률적으로 나타낼 수 있는 방법을 제시하였으며, 그 결과 가뭄상태별 가뭄 발생확률이 산정되었다.

  • PDF

수도권지역의 통행발생모형의 검증 (회귀모형과 카테고리모형을 중심으로) (Improvement of Trip Generation Model in Seoul Metropolitan Area)

  • 김진자;이종호
    • 대한교통학회지
    • /
    • 제22권3호
    • /
    • pp.49-58
    • /
    • 2004
  • 본 논문에서는 서울시와 경기도에서 발표한 통근 및 등교통행발생 회귀모형과 ${\ulcorner}$1996년 교통센서스 조사${\lrcorner}$ 자료로 만든 통근통행발생률 및 등교통행발생률을 이용하여 2002년의 통근 및 등교통행발생량을 예측하였다. 그리고 ${\ulcorner}$2002년 교통센서스 조사${\lrcorner}$의 관측값과 비교하여 기존 통행발생모형의 개선방법을 제시하였다. 연구의 결과, 경기도의 통근통행발생회귀모형과 카테고리모형의 예측은 유사한 분포를 보이는 반면, 서울시의 통근통행발생 회귀모형으로 예측한 경우 인천광역시와 경기도에서 관측값보다 평균 40.16% 과대 예측되었다. 등교통행발생 예측값과 관측값이 서울시와 경기도 지역에서 비슷하게 예측되었다. 인천광역시 지역의 경우 경기도에서 발표한 회귀모형으로 예측한 값이 관측값보다 평균 79.71% 작게 예측되었다. 분석 결과 수도권에서의 장래 통근과 등교통행발생량 예측에서 카테고리분석법이 회귀분석법 보다 예측력이 우수한 것으로 나타났다. 우리나라에서는 장래 카테고리화된 자료의 부재로 카테고리 분석의 장래의 통행량 예측에 어려움이 따른다. 이에 카테고리분석을 적용하여 회귀분석의 취약점을 보완할 수 있는 것으로 판단된다.

서술어 중심 감성 사전을 통한 주가 등락 예측 (Stock Market Prediction using Sentiment Dictionary based on Predicates)

  • 엄장윤;이수원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.857-860
    • /
    • 2014
  • 본 연구에서는 경제 뉴스로부터 서술어 중심의 감성 사전을 구축하고, 하루 동안에 배포된 뉴스를 이용해 전일 종가 대비 당일 종가의 등락을 예측하는 모델을 제안한다. 기존의 주식 도메인 관련 감성 사전을 구축하는 방식은 주가 등락에 관련된 명사를 중심으로 사전을 구축하는 방식이나 대부분의 명사는 극성 값이 중립인 경우가 많아 극성 값을 추정하기 힘들다는 문제점이 있다. 본 연구에서는 극성 값이 잘 표현되는 서술어 중심의 감성사전을 구축하고 극성 값을 자동 추출하여 주가의 등락을 예측한다. 실험 결과 기존 감성 사전을 통한 주가 예측 방법에 비하여 본 연구에서 제안하는 서술어 중심의 감성 사전을 통한 주가 예측 정확도가 높게 나타났다.

나이브 베이지안 방법을 위한 데이터 변환법으로 한국인 급성 심근경색증 환자의 예후를 예측하는 성능의 향상 (Development of Performance to Predict the Prognosis of Korean Patients with Acute Myocardial Infarction by Data Transformation for Naïve Bayes Method)

  • 조선호;김정수;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.868-871
    • /
    • 2014
  • 오늘날 한국에서는 급성 심근경색증으로 인한 사망률이 높은 상태로, 발병 시에 치료까지 신속한 의사결정이 요구되는 위중한 질병이기 때문에, 한국인에게 맞는 급성 심근경색증 연구가 매우 중요 하다. 본 연구는 한국인 급성 심근경색증 등록 데이터를 이용해 기계 학습 방법의 한 종류인 나이브 베이지안 방법을 이용해 급성 심근경색증 환자의 예후를 예측하고자, 의료 데이터의 특성에 따른 데이터 변환 방법을 제안한다. 타겟 클래스에서 보다 중요한 의미를 가진 death 값에 대해 각 값을, nominal value, numeric value, 결측치로 구분한 방식에 따라, 확률을 계산해 변환한다. 실험 결과를 통해 결측치를 피처마다 존재하는 값들의 평균을 낸 값으로 대입하였을 때 가장 좋은 성능임을 알 수 있었는데, 기존의 방법에 비해 precision=5.4%, recall=7.0%의 성능이 향상되었다. 따라서 제안한 방법은 나이브 베이지안 방법의 예측 성능 향상에 기여하였다고 판단된다. 이후 적용했던 데이터 변환 방법을 여러 가지 기계 학습 방법에서 판단해보고, 다른 타겟 클래스에도 시험해보고자 한다.

XGBoost를 사용한 반도체 노광 공정 계측 결과 예측 (Prediction of Semiconductor Exposure Process Measurement Results using XGBoost)

  • 신정일;박지수;손진곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.505-508
    • /
    • 2021
  • 반도체 회로의 미세화로 단위 공정이 증가하면 TAT(turn-around time) 증가에 따른 제조 비용이 늘어난다. 반도체 공정 중 포토 공정은 마스크의 회로를 웨이퍼에 전사하는 공정으로 전사를 담당하는 노광장비의 성능에 의해 회로의 정확성이 결정된다. 이런 정확성을 검증하는 계측공정은 회로의 미세화가 진행될수록 필요성은 증가하나 TAT 증가의 주된 요인으로 최근 기계학습을 사용한 다양한 예측 모형들의 개발로 계측 결과를 예측하는 실험들이 진행되고 있다. 본 논문은 노광장비 센서들의 이상값을 감지하여 분류 후 계측공정을 진행하는 LFDC(Lithography Fault Detection and Classification) 시스템의 문제인 분류 성능이 떨어지는 것을 해결하기 위해 XGBoost를 사용하여 계측공정을 진행하지 않고 노광장비 센서의 이상값을 학습된 학습기를 통해 분류하여 포토 공정을 재진행하거나 다음 공정을 진행하는 방법을 실험하였다. 실험에서 사용된 계측 결과 예측 모형은 89%의 정확도를 확보하였고 반도체 데이터 특성인 심각한 불균형의 데이터에 대해서도 같은 정확도를 얻었다. 이런 결과는 노광장비 센서들의 이상값에 대해 89%는 정상으로 판단하였고 정상으로 판단한 웨이퍼를 실제 계측 시 예측과 같은 결과를 얻었다. 계측 결과 예측 모형을 사용하면 실제 계측을 진행하지 않고 노광장비 센서들의 이상값에 대한 판정을 할 수 있어 TAT 단축으로 제조 비용감소, 계측 장비 부하 감소 및 효율 향상을 할 수 있다. 하지만 본 논문에서는 90%의 성능을 보이는 계측 결과 예측 모형으로 여전히 10%에 대해서는 실제 계측이 필요한 문제에 대해 추후 더 연구가 필요하다.

통계적 기상예측정보를 이용한 경안천 유출량 장기 전망 (Long-term runoff prediction of Gyeongan-cheon watershed using statistically forecasted weather information)

  • 김철겸;이정우;이정은;김현준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.413-413
    • /
    • 2022
  • 본 연구에서는 통계적 방법으로 도출된 장기 기상예측정보를 이용하여 유역에서의 유출량 전망 가능성을 검토하였다. 먼저 한강권역의 월 강수량과 기온에 대해 글로벌 기후지수와의 원격상관성을 기반으로 다중회귀모형 기반의 통계적 예측모형을 구성하여 미래기간(1~12개월)에 대한 월 단위 기상예측정보를 도출하였다. 월 단위로 도출된 강수량과 기온은 통계적 상세화 기법을 통해 한강권역 주요 ASOS 관측소 지점별로 일 단위 강수량과 기온자료로 변환하였으며, 상세화된 일 자료를 유역모형인 SWAT의 입력자료로 활용하여 경안천 유역의 미래기간에 대한 유출량을 도출하였다. 유출량 예측성을 평가하기 위하여 과거기간(2003~2021년)을 대상으로 관측유출량과 예측기상정보로부터 산출된 예측유출량을 비교하였다. 각 월별로 예측된 유출량의 중앙값과 관측값의 적합도를 분석한 결과, PBIAS는 -5.2~-2.7%, RSR은 0.79~0.91, NSE는 0.34~0.38, r은 0.59~0.62로 강수량 및 기온의 예측성에 비해 낮게 나타났다. 전 기간에 대해 월별로 분석한 예측결과에 대한 3분위 확률은 5월, 6월, 7월, 9월, 11월은 평균 42.8%로 예측성이 충분한 것으로 나타났으나, 나머지 월에서의 평균 예측성은 17.3%로 매우 낮게 나타났다. 상세화된 기상정보를 이용하여 유역모델링을 통해 산정한 유출량에 대한 전망 결과는 기상예측결과에 비해 상대적으로 예측성이 낮은 것으로 분석되었다. 이는 관측값 자체에서 나타날 수 있는 불확실성에 기인할 수도 있으며, 유출량에 지배적인 영향을 주는 강수량의 예측성에 대한 문제가 유역 모델링 과정에서 증폭되어 나타나는 문제일 수도 있다. 또한 지점별 일 자료로 상세화되는 과정에서의 불확실성, 우리나라 여름철 유출량 변동성 등 여러 가지 요인이 복합적으로 영향을 주어 나타나는 것으로 생각된다. 향후 다양한 대상유역에 대한 검토와 기상예측모형의 보완, 상세화 과정에서의 불확실성 해소 등을 통해 예측성을 개선할 계획이다.

  • PDF