• 제목/요약/키워드: Model Tuning

검색결과 762건 처리시간 0.032초

폴리트로픽 지수 기반의 재열 가스터빈 입구온도 산출 알고리즘 개발 (Development of a Polytropic Index-Based Reheat Gas Turbine Inlet Temperature Calculation Algorithm)

  • 한영복;김성호;김변곤
    • 한국전자통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.483-494
    • /
    • 2023
  • 최근 가스터빈 발전기는 전력계통의 주파수 조절용으로 널리 사용되고 있다. 가스터빈의 입구온도는 기기의 성능과 수명에 관련된 핵심요소이지만 터빈구조 및 운전환경 등의 이유로 입구온도를 직접 측정하지 않고 가스터빈 배기가스 온도 측정값을 이용하여 입구온도의 추정 값을 구해 이를 연소제어에 사용하고 있다. 특히 재열 가스터빈의 입구온도는 안정적 운전관리에 있어서 매우 중요하지만 제작사가 산출 식에 대한 정보를 제공하지 않고 있어 현장 실무자들은 많은 어려움을 겪고 있다. 이에 본 연구에서는 폴리트로픽 과정식의 기반 위에 머신러닝 기반의 선형회귀 분석기법을 사용하여 가스터빈의 입구온도를 추정할 수 있는 방법을 제시하고자 한다. 또한 선형회귀분석을 통해 얻어진 입구온도 산출 모델식의 유용성 분석과 검증을 통해 입구온도 산출 알고리즘을 제안함으로서 재열 가스터빈 연소튜닝 기술수준 향상에 도움이 되고자 한다.

데이터센터 장애 예방을 위한 인프라 이상징후 분석: RRCF와 Prophet Ensemble 분석 기반 (Infrastructure Anomaly Analysis for Data-center Failure Prevention: Based on RRCF and Prophet Ensemble Analysis)

  • 신현종;김성근;천병환;진경복;양승정
    • 한국빅데이터학회지
    • /
    • 제7권1호
    • /
    • pp.113-124
    • /
    • 2022
  • 데이터센터의 장애 예방을 위해 머신러닝과 빅데이터를 활용한 다양한 방법들이 적용되어 왔다. 그러나 개별 장비 기반의 성능지표를 참조하거나, 인프라 운영환경을 고려하지 않은 접근방법으로 실제 활용되는 데에는 많은 한계가 있었다. 이에 본 연구에서는 개별 인프라 장비들의 성능지표를 통합 모니터링하며, 다양한 장비들의 성능지표를 구간화, 등급화 하여 단일수치화를 진행한다. 인프라 운영에 대한 경험치 기반으로 데이터 전처리를 수행하며, RRCF(Robust Random Cut Forest)분석과 Prophet 분석 모델을 앙상블하여 이상징후 검출에 신뢰도 있는 분석결과를 도출하였다. 데이터센터 내 운영담당자들의 접근을 용이하게 하기 위해 장애분석시스템을 구현하여 데이터센터 장애의 선제 대응과 적정한 튜닝시점을 제시할 수 있다.

FubaoLM : 연쇄적 사고 증류와 앙상블 학습에 의한 대규모 언어 모델 자동 평가 (FubaoLM : Automatic Evaluation based on Chain-of-Thought Distillation with Ensemble Learning)

  • 김희주;전동현;권오준;권순환;김한수;이인권;김도현;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.448-453
    • /
    • 2023
  • 대규모 언어 모델 (Large Language Model, LLM)을 인간의 선호도 관점에서 평가하는 것은 기존의 벤치마크 평가와는 다른 도전적인 과제이다. 이를 위해, 기존 연구들은 강력한 LLM을 평가자로 사용하여 접근하였지만, 높은 비용 문제가 부각되었다. 또한, 평가자로서 LLM이 사용하는 주관적인 점수 기준은 모호하여 평가 결과의 신뢰성을 저해하며, 단일 모델에 의한 평가 결과는 편향될 가능성이 있다. 본 논문에서는 엄격한 기준을 활용하여 편향되지 않은 평가를 수행할 수 있는 평가 프레임워크 및 평가자 모델 'FubaoLM'을 제안한다. 우리의 평가 프레임워크는 심층적인 평가 기준을 통해 다수의 강력한 한국어 LLM을 활용하여 연쇄적 사고(Chain-of-Thought) 기반 평가를 수행한다. 이러한 평가 결과를 다수결로 통합하여 편향되지 않은 평가 결과를 도출하며, 지시 조정 (instruction tuning)을 통해 FubaoLM은 다수의 LLM으로 부터 평가 지식을 증류받는다. 더 나아가 본 논문에서는 전문가 기반 평가 데이터셋을 구축하여 FubaoLM 효과성을 입증한다. 우리의 실험에서 앙상블된 FubaoLM은 GPT-3.5 대비 16% 에서 23% 향상된 절대 평가 성능을 가지며, 이항 평가에서 인간과 유사한 선호도 평가 결과를 도출한다. 이를 통해 FubaoLM은 비교적 적은 비용으로도 높은 신뢰성을 유지하며, 편향되지 않은 평가를 수행할 수 있음을 보인다.

  • PDF

Generative AI parameter tuning for online self-directed learning

  • Jin-Young Jun;Youn-A Min
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권4호
    • /
    • pp.31-38
    • /
    • 2024
  • 본 연구는 온라인 원격교육에서 코딩 교육 활성화를 위해, 생성형 AI 기반의 학습 지원 도구개발에 필요한 하이퍼 파라미터 설정을 제안한다. 연구를 위해 세 가지 다른 학습 맥락에 따라 하이퍼 파라미터를 설정할 수 있는 실험 도구를 구현하고, 실험 도구를 통해 생성형 AI의 응답 품질을 평가하였다. 생성형 AI 자체의 기본 하이퍼 파라미터 설정을 유지한 실험은 대조군으로, 연구에서 설정한 하이퍼 파라미터를 사용한 실험은 실험군으로 하였다. 실험 결과, 첫 번째 학습맥락인 "학습 지원"에서는 실험군과 대조군 사이의 유의한 차이가 관찰되지 않았으나, 두 번째와 세 번째 학습 맥락인 "코드생성"과 "주석생성"에서는 실험군의 평가점수 평균이 대조군보다 각각 11.6% 포인트, 23% 포인트 높은 것으로 나타났다. 또한, system content에 응답이 학습 동기에 미칠 수 있는 영향을 제시하면 학습 정서를 고려한 응답이 생성되는 것이 관찰되었다.

유역정보 기반 Transformer및 LSTM을 활용한 다목적댐 일 단위 유입량 예측 (Prediction of multipurpose dam inflow utilizing catchment attributes with LSTM and transformer models)

  • 김형주;송영훈;정은성
    • 한국수자원학회논문집
    • /
    • 제57권7호
    • /
    • pp.437-449
    • /
    • 2024
  • 딥러닝을 활용하여 유역 특성을 반영한 유량 예측 및 비교 연구가 주목받고 있다. 본 연구는 셀프 어텐션 메커니즘을 통해 대용량 데이터 훈련에 적합한 Transformer와 인코더-디코더(Encoder-Decoder) 구조를 가지는 LSTM-based multi-state-vector sequence-to-sequence (LSTM-MSV-S2S) 모형을 선정하여 유역정보(catchment attributes)를 고려할 수 있는 모형을 구축하였고 이를 토대로 국내 10개 다목적댐 유역의 유입량을 예측하였다. 본 연구에서 설계한 실험 구성은 단일유역-단일훈련(Single-basin Training, ST), 다수유역-단일훈련(Pretraining, PT), 사전학습-파인튜닝(Pretraining-Finetuning, PT-FT)의 세 가지 훈련 방법을 사용하였다. 모형의 입력 자료는 선정된 10가지 유역정보와 함께 기상 자료를 사용하였으며, 훈련 방법에 따른 유입량 예측 성능을 비교하였다. 그 결과, Transformer 모형은 PT와 PT-FT 방법에서 LSTM-MSV-S2S보다 우수한 성능을 보였으며, 특히 PT-FT 기법 적용 시 가장 높은 성능을 나타냈다. LSTM-MSV-S2S는 ST 방법에서는 Transformer보다 높은 성능을 보였으나, PT 및 PT-FT 방법에서는 낮은 성능을 보였다. 또한, 임베딩 레이어 활성화 값과 원본 유역정보를 군집화하여 모형의 유역 간 유사성 학습 여부를 분석하였다. Transformer는 활성화 벡터가 유사한 유역들에서 성능이 향상되었으며, 이는 사전에 학습된 다른 유역의 정보를 활용해 성능이 개선됨을 입증하였다. 본 연구는 다목적댐별 적합한 모형 및 훈련 방법을 비교하고, 국내 유역에 PT 및 PT-FT 방법을 적용한 딥러닝 모형 구축의 필요성을 제시하였다. 또한, PT 및 PT-FT 방법 적용 시 Transformer가 LSTM-MSV-S2S보다 성능이 더 우수하였다.

딥러닝 시계열 알고리즘 적용한 기업부도예측모형 유용성 검증 (Corporate Default Prediction Model Using Deep Learning Time Series Algorithm, RNN and LSTM)

  • 차성재;강정석
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.1-32
    • /
    • 2018
  • 본 연구는 경제적으로 국내에 큰 영향을 주었던 글로벌 금융위기를 기반으로 총 10년의 연간 기업데이터를 이용한다. 먼저 시대 변화 흐름에 일관성있는 부도 모형을 구축하는 것을 목표로 금융위기 이전(2000~2006년)의 데이터를 학습한다. 이후 매개 변수 튜닝을 통해 금융위기 기간이 포함(2007~2008년)된 유효성 검증 데이터가 학습데이터의 결과와 비슷한 양상을 보이고, 우수한 예측력을 가지도록 조정한다. 이후 학습 및 유효성 검증 데이터를 통합(2000~2008년)하여 유효성 검증 때와 같은 매개변수를 적용하여 모형을 재구축하고, 결과적으로 최종 학습된 모형을 기반으로 시험 데이터(2009년) 결과를 바탕으로 딥러닝 시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 Lee(2015) 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓모형, 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, '비선형적인 변수들', 변수들의 '다중 공선성 문제', 그리고 '데이터 수 부족'이란 한계점이 존재한다. 이에 로짓 모형은 '비선형성'을, Lasso 회귀분석 모형은 '다중 공선성 문제'를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 연구를 진행한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.

부하 균형 유지를 고려한 파이프라인 해시 조인 방법 (A Pipelined Hash Join Method for Load Balancing)

  • 문진규;박노상;김평중;진성일
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.755-768
    • /
    • 2002
  • 다중 조인 연산의 파이프라인 방식 처리에서 조인 어트리뷰트의 자료 불균형(data skew)이 성능에 주는 영향을 연구하고, 자료 불균형을 대비하여 적재부하를 라운드-로빈 방식으로 정적 분할하는 방법과 자료분포도를 이용하여 적응적으로 분할하는 두 가지 파이프라인 해시 조인 알고리즘을 제안한다. 해시 기반 조인을 사용하면 여러 개의 조인을 파이프라인 방식으로 처리할 수 있다. 다중 조인의 파이프라인 방식 처리는 조인 중간 결과를 디스크를 통하지 않고 다른 프로세서에게 직접 전달하므로 효율적이다. 파이프라인 해시 조인 알고리즘이 자료 불균형을 대비한 부하 균형 유지 메커니즘을 갖고 있지 않다면 자료 불균형은 성능에 매우 심각한 영향을 줄 수 있다. 본 논문은 자료 불균형의 영향과 제안된 두 가지 기법을 비교하기 위하여 파이프라인 세그먼트의 실행 모형, 비용 모형, 그리고 시뮬레이터를 개발한다. 다양한 파라미터로 모의 실험을 한 결과에 의하면 자료 불균형은 조인 선택도와 릴레이션 크기에 비례하여 시스템 성능을 떨어뜨림을 보여준다. 그러나 제안된 파이프 라인 해시 조인 알고리즘은 다수의 버켓 사용과 분할의 조율을 통해 자료 불균형도가 심한 경우에도 좋은 성능을 갖게 한다.

Mobile-DTV 응용을 위한 광대역 주파수 합성기의 설계 (A Design of Wideband Frequency Synthesizer for Mobile-DTV Applications)

  • 문제철;문용
    • 대한전자공학회논문지SD
    • /
    • 제45권5호
    • /
    • pp.40-49
    • /
    • 2008
  • Mobile-DTV 응용을 위한 분수형 주파수 합성기를 1.8V $0.18{\mu}m$ CMOS 공정으로 설계하였다. VCO는 PMOS를 사용하여 위상잡음을 감소시켰고, 인덕터와 캐패시터, 버렉터(varactor)를 선택적으로 스위칭하는 기법을 적용하여 측정 결과 800MHz-1.67GHz 대역에서 동작이 가능한 것을 확인하였다. VCO 이득 곡선의 선형 특성을 개선하기 위해서 버렉터 바이어스 기법을 사용하였고, 개수를 2개로 최소화 하였다. 추가적으로 버렉터 스위칭 기법을 사용해서 VCO 이득 저하 특성을 개선하였다. 또한, VCO 주파수 교정 블록을 사용해서 VCO 이득 저하를 개선하면서, VCO 이득의 간격을 일정하게 유지하도록 설계하였다. 분수형 주파수 분주비를 위한 시그마-델타 변조기의 설계 시 통합 모의실험 기법(co-simulation method)을 적용해서 설계의 정확성과 효율성을 향상시켰다. VCO와 PFD, CP, LF는 Cadence Spectre를 이용하여 검증하였고, 분주기는 Spectre와 Matlab Simulink, ModelSim, HSPICE를 이용하여 검증하였다. 주파수 합성기의 전체 소모 전력은 1.8V 전원 전압에서 18mW이고, VCO의 주파수 영역은 최대 주파수의 약 52.1%가 되는 것을 확인하였다. 또한 VCO의 위상 잡음은 1GHz, 1.5GHz, 2GHz 출력 주파수에서 1MHz 오프셋에서 -100dBc/Hz 이하의 잡음 특성을 확인하였다.

새로운 금속막대 커패시터를 적용한 감쇄모드 도파관 대역통과 여파기 (Evanescent-mode Waveguide Band-pass Filter Applied by Novel Metal Post Capacitor)

  • 김병문;윤리호;이상민;홍재표
    • 한국전자통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.775-782
    • /
    • 2022
  • 본 논문에서는 보다 편리한 튜닝을 위해 Evanescent-Mode Rectangle Waveguide(EMRWG)에 삽입된 새로운 작은 직경의 원통형 포스트 커패시터를 제안하였다. EMRWG급전을 위한 제안된 구조는 입력 및 출력 끝에서 도파관과 동일한 너비와 높이를 갖는 단일 리지 직사각형 도파관을 사용하였다. 삽입된 포스트 커패시터는 EMRWG의 넓은 벽체 하부 중앙에 형성된 원형 홈과 상부에 삽입된 동심원기둥 포스트로 구성된다. 먼저 제안된 구조에 대한 등가회로 모델을 제시하였고, EMRWG와 단일 리지 도파관이 결합될 때 이상적인 변압기의 접합 서셉턴스와 권선비는 각각 HFSS(3d fullwave 시뮬레이터, Ansoft Co.)를 사용하여 두 가지 경우에 대해 시뮬레이션하였다. 얻어진 매개변수와 EMRWG의 특성을 이용하여 삽입된 기둥의 서셉턴스 및 공진 특성을 분석하였다. 중심주파수 4.5GHz, 대역폭 170MHz의 2포스트 필터는 WR-90 도파관을 이용하여 설계하였으며, 등가회로 모델에 대한 계산과 HFSS와 CST를 이용한 시뮬레이션 결과가 서로 일치하였다.

기계학습 기반 약물의 태아 독성 예측 연구 (Predicting the Fetotoxicity of Drugs Using Machine Learning)

  • 정명현;유선용
    • 생명과학회지
    • /
    • 제33권6호
    • /
    • pp.490-497
    • /
    • 2023
  • 임산부의 기존 질병 또는 임신 중 발생한 질병을 치료하기 위한 약물의 사용은 태아에게 잠재적인 위협이 될 수 있으므로 약물의 태아 독성 여부를 예측하는 것이 필수적이다. 하지만 약물의 태아 독성을 밝혀내는 것은 많은 시간과 비용을 필요로 하며 인간 태아에게서 독성 작용을 나타내는 근거가 불분명하다. 이에 따라 최근 태아 독성 평가를 위한 시험 설계의 현대화, 예측성 개선, 동물 사용 및 투자 비용 감소를 위한 in silico 태아 독성 평가 모델의 필요성이 대두되고 있다. 본 연구는 태아 독성 정보를 수집하고 다양한 기계학습 알고리즘을 적용하여 태아 독성 예측이 가능한 모델을 구축하였으며, 태아 독성 예측 모델의 입력 값으로 활용하기 위해 각 약물에 대한 구조적 및 생리학적 특성 벡터를 생성하였다. 이후 예측 정확도 개선을 위해 초매개변수를 조정하여 모델을 최적화 하였다. 개발한 태아 독성 예측 모델의 유효성을 검증하기 위해 학습 셋과 독립된 테스트 셋을 활용하여 정량적 성능 평가를 수행하였으며, 모든 모델의 약물 및 약물 후보 물질의 태아 독성 여부를 예측할 수 있는 것을 확인하였다(AUROC>0.85, AUPR>0.9). 나아가, 예측 모델의 특성 중요도를 분석하여 태아 독성과 관련성이 높은 약물의 특성을 제시하였다. 제안한 모델은 적은 비용과 시간으로 예측 점수를 제공함으로써 인간에 대한 태아 독성 연구를 설계하는 과정에 도움이 될 것을 기대한다.