• 제목/요약/키워드: 정규화 변수

검색결과 183건 처리시간 0.029초

LSTM을 이용한 주가예측 모델의 학습방법에 따른 성능분석 (A Performance Analysis by Adjusting Learning Methods in Stock Price Prediction Model Using LSTM)

  • 정종진;김지연
    • 디지털융복합연구
    • /
    • 제18권11호
    • /
    • pp.259-266
    • /
    • 2020
  • 과거 인공지능 분야에서는 지식 기반의 전문가 시스템 및 머신러닝 알고리즘들을 금융 분야에 적용하는 연구가 꾸준하게 수행되어 왔다. 특히 주식에 대한 지식 기반의 시스템 트레이딩은 이제 보편화되었고, 최근에는 대용량 데이터에 기반한 딥러닝 기술을 주가 예측에 적용하기 시작했다. 이중 LSTM은 시계열 데이터에 대한 검증된 모델로서 주가 예측에도 적용되고 있다. 본 논문에서는 주가 예측 모델로서 LSTM을 적용할 때 성능향상을 위해 고려해야 할 복잡한 매개변수 설정과 적용 함수들에 대해 적합한 조합 방법을 제안하도록 한다. 크게 가중치와 바이어스에 대한 초기화 대상과 설정 방법, 과적합을 피하기 위한 정규화 적용 대상과 설정 방법, 활성화 함수 적용 방법, 최적화 알고리즘 선택 등을 제시한다. 이 때 나스닥 상장사들에 대한 대용량 데이터를 바탕으로 각각의 방법들을 적용하여 정확도를 비교하면서 평가한다. 이를 통해 주가 예측을 위한 LSTM 적용 시 최적의 모델링 방법을 실증적인 형태로 제안하여 현실적인 시사점을 갖도록 한다. 향후에는 입력 데이터의 포맷과 길이, 하이퍼파라미터들에 대한 성능평가를 추가 수행하여 주요 설정 항목들의 조합에 대한 일반화 연구를 수행하고자 한다.

교육종단연구 분석을 위한 빅데이터 플랫폼 개발 및 적용 (Development and Application of a Big Data Platform for Education Longitudinal Study Analysis)

  • 박정;조완섭
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.11-27
    • /
    • 2020
  • 본 논문에서는 교육종단연구 데이터를 효과적으로 저장·처리·분석하기 위한 데이터 플랫폼을 개발하고, 이를 서울교육종단연구(SELS)에 적용하여 유용성을 확인한다. 플랫폼은 데이터 전처리부와 데이터 분석부로 구성된다. 데이터 전처리부에서는 1) 마스킹 2) 요인화 3) 정규화·이산화 4) 데이터 유도 5) 데이터 웨어하우징 과정을 통해 교육종단연구 데이터 웨어하우스를 생성하게 된다. 데이터 분석부는 OLAP과 데이터 마이닝(DM)으로 구성된다. 먼저, OLAP에서는 측정값 선정, 스키마 설계를 거쳐 OLAP을 수행하게 된다. 이후 DM에서는 변수 선택, 연구모형 선택, 데이터 수정, 인수튜닝, 모형학습, 모형평가 및 해석단계를 거친다. 본 플랫폼에서 전처리 과정을 거쳐 생성된 데이터 웨어하우스는 다양한 연구자들에 의해 공유될 수 있고, 지속적인 연구결과 데이터 셋의 축적이 가능하므로 후속 연구자들은 추가적인 분석을 수월하게 수행할 수 있게 된다. 또한, 정책입안자들도 SELS 데이터 웨어하우스에 직접 접근하여 다차원 분석을 통해 온라인으로 분석할 수 있어 과학적인 의사결정이 가능하게 된다. 본 연구에서는 개발된 플랫폼의 유용성을 입증하기 위해 SELS 데이터를 플랫폼 상에서 구축하고 수학 학업성취도를 측정값으로 선정하여 OLAP 및 DM을 수행하였으며, 측정값에 영향을 주는 다양한 요인을 데이터 마이닝 기법을 사용하여 분석하였다. 이를 통해 데이터 기반 교육정책 시사점을 빠르고 효과적으로 도출할 수 있었다.

인체 바이오모니터링 지식 모델링 및 데이터베이스 구축 (Knowledge Modeling and Database Construction for Human Biomonitoring Data)

  • 이장우;양세희;이헌주
    • 한국식품위생안전성학회지
    • /
    • 제35권6호
    • /
    • pp.607-617
    • /
    • 2020
  • 인체 바이오모니터링(Human biomonitoring, HBM) 데이터는 뇨와 혈액 등 생체지표으로부터 환경유해물질의 측정을 통해 획득되며, 다양한 노출원과 경로로부터 노출되는 유해물질의 인체노출수준 및 건강영향과의 상관성을 파악하기 위해 매우 중요하다. 국내의 경우 식품의약품안전처를 비롯한 국가기관의 다양한 HBM 프로그램을 통하여 HBM 데이터가 생산되고 있다. 그러나, 목적, 시기, 연구자 및 측정 장비의 차이에 의하여 서로 다른 형식에 따라 생산되다 보니, 데이터의 호환성의 문제로 인하여 특정 HBM 데이터를 신속하게 조회해야 하거나 인구집단별 시간적 추이분석 내지는 다른 국가의 자료와 비교에 난점을 가지고 있다. 따라서, 본 연구에서는 HBM 데이터를 체계적으로 데이터베이스(Database, DB)화하고 활용성을 증진하게 시킬 목적으로 지식 모델링을 실시하였다. 지식 모델링은 HBM 데이터의 생산되는 변수들을 그룹화하고 관계를 분석하여 2차원 구조의 개체 및 집합론에 기초한 방법론인 관계형 데이터 모델링 기법을 활용하여 실시하였다. 지식모델은 조사대상자를 인구집단으로 중심으로 설문자료, 측정자료, 노출 평가자료 개체로 구성하고 그 안에 속성들을 정의하고, 개체간에 관계를 설정하는 방식으로 구성하였다. 또한, 도출된 지식 모델을 기반으로 식품의약품안전처에서 2006년-2018년까지 수행한 HBM의 원시데이터를 수집, 정제 및 정규화하여 통합 DB를 구축하였다. 이와 같이 통합된 HBM-DB는 개별 자료원 내지는 특정 자료원들을 선택하여 기간별 농도 수준에 대한 통계분석은 물론, 다양한 검색조건을 통하여 데이터 추출을 할 수 있는 구조로 구축하였다. 본 HBM-DB는 관계형 DB모델로 구축되어 지속적인 대용량 DB 축적이나 HBM 데이터 해석을 위한 도구로써 효율적으로 수행할 수 있을 것으로 생각된다.

WIM 자료를 활용한 화물차 축하중 분포 모형 개발 (Development of Truck Axle Load Distribution Model using WIM Data)

  • 이동석;오주삼
    • 대한토목학회논문집
    • /
    • 제26권5D호
    • /
    • pp.821-829
    • /
    • 2006
  • 교통하중은 포장 설계 및 해석에서 가장 중요한 입력 변수로서 포장 파손의 주요 원인이 된다. 따라서 정확한 포장 설계 및 해석을 위해서는 적절한 교통하중 정량화가 선행되어야 한다. 전통적으로 교통하중은 혼합된 교통흐름을 설계목적의 하나의 값으로 변환시켜주는 ESALs 관점에서 추정되어왔으나 이는 AASHO 도로 테스트를 통해 도출된 지극히 경험적인 값으로 전 노선망에 대해 평균적인 계수로 적용하기에는 한계가 있다. 이러한 등가단축하중계수의 문제점을 해결하기 위해 선진국에서는 역학적 개념을 도입한 많은 연구를 진행한 결과 역학적-경험적 설계법(Mechanistic-Empirical Design)에 적용할 수 있는 축하중 분포(Axle Load Spectra)를 이용한 교통하중 정량화 방안을 수립하였다. 본 논문에서는 일반국도에 설치 운영되고 있는 WIM 시스템을 통해 수집된 화물차 하중 데이터를 이용하여 축하중 분포 특성(Axle Load Spectra)을 이해하고 혼합정규분포함수에 기초한 축 형태별 하중 분포 모형식을 제시하였으며, 이를 기존 하중 분포 모형과 비교 평가하였다. 본 논문에서 제시한 화물차 축하중 분포 특성 및 축하중 분포 모형식은 향후 일반국도 및 고속도로의 포장 설계법 개발을 위한 교통하중 정량화 방안 수립 시, 과적 차량 단속 정책 수립 시, 도로 유지관리를 위한 계획 수립 시 기초자료로써 활용가능하다.

완전궤환 비선형 계통에 대한 적응 신경망 제어기 (Adaptive Neural Control of Nonlinear Pure-feedback Systems)

  • 박장현;김성환;장영학
    • 전기전자학회논문지
    • /
    • 제14권3호
    • /
    • pp.182-189
    • /
    • 2010
  • 본 논문은 논어파인 완전궤환 비선형시스템에 대한 적응 신경망 제어기를 제안한다. 제안하는 방법은 원래의 계통식을 새롭게 정의되는 상태변수에 대해서 표준 정규식으로 재구성하여 제어식을 구성함으로써 기존의 알고리듬에서 일반적으로 사용하는 백스태핑(backstepping)을 회피할 수 있다는 장점을 갖는다. 백스태핑을 회피함으로서 본 논문에서 제안하는 새로운 방법은 기존의 제어 알고리듬에 비해서 제어기 구조와 안정도 증명이 현저히 간략해 지게 되는 장점을 갖는다. 제안된 제어기는 미지의 이상 제어식을 근사화하기 위해서 오직 하나의 신경망만을 사용하며 이점 역시 기존의 제어알고리듬이 다수의 신경망을 사용하는 것과 구별되는 점이다. 모의실험을 통하여 제안된 알고리듬의 성능과 효율을 보인다.

국내 보조기층 재료의 변형특성을 고려한 전체 변형률 영역의 구성모델 개발 (Development of whole Strain Range Constitutive Model Considering Deformational Characteristics of Subbase Materials in Korea)

  • 권기철
    • 한국도로학회논문집
    • /
    • 제6권3호
    • /
    • pp.65-77
    • /
    • 2004
  • 보조기층 재료의 변형특성은 역학적 포장설계에 있어서 대단히 중요한 입력변수이다 국내에서 사용되는 보조기층 재료는 대부분 입상의 자갈질 흙으로서, 실제 시공현장에서 7종의 시료를 채취하였다. 보조기층 재료의 변형특성 평가를 위하여 공진주/비틂전단시험 삼축압축시험,자유단공진주시험을수행하여 탄성계수에 대한 여러 영향요소를 검토하였다. 보조기층 재료의 탄성계수에 대한 하중주파수 및 하중반복횟수의 영향은 매우 작은 것으로 평가되었으며 공학적 관점에서 무시가능 할 것으로 생각된다 보조기층 재료의 탄성계수는 구속응력과 변형률 크기에 대단히 큰 영향을 받는 것으로 나타났고, 대표적인 정규화탄성계수 감소곡선과 구성모델을 제안하였다.

  • PDF

기계 학습 기반 분석을 위한 다변량 정형 데이터 처리 및 시각화 방법: Titanic 데이터셋 적용 사례 연구 (Multi-Variate Tabular Data Processing and Visualization Scheme for Machine Learning based Analysis: A Case Study using Titanic Dataset)

  • 성주형;권기원;박경원;송병철
    • 인터넷정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.121-130
    • /
    • 2024
  • 정보 통신 기술의 기하급수적인 발전에 따라 확보 가능한 데이터의 종류와 크기가 증가하고 있다. 이러한 대량의 데이터를 활용하기 위해, 통계 등 확보한 데이터를 분석하는 것이 중요하지만 다양화되고 복잡도가 증가한 데이터를 일반적인 방법으로 처리하는 것에는 명확한 한계가 있다. 한편, 연산 처리 능력 고도화 및 자동화 시스템에 대한 수요 증가에 따라 다양한 분야에 기계 학습을 적용하여 그동안 해결하지 못하였던 문제들을 풀고자 하는 시도가 증가하고 있다. 기계 학습 모델의 성능을 확보하기 위해서 모델의 입력에 사용되는 데이터를 가공하는 것과 해결하고자 하는 목적 함수에 따라 모델을 설계하는 것이 중요하다. 많은 연구를 통해 데이터의 종류 및 특성에 따라 데이터를 처리하는 방법이 제시되었으며, 그 방법에 따라 기계 학습의 성능에는 큰 차이가 나타난다. 그럼에도 불구하고, 데이터의 종류와 특성이 다양해짐에 따라 데이터 분석을 위하여 어떠한 데이터 처리 방법을 적용해야 하는지에 대한 어려움이 존재한다. 특히, 기계 학습을 이용하여 비선형적 문제를 해결하기 위해서는 다변량 데이터를 처리하는 것이 필수적이다. 본 논문에서는 다양한 형태의 변수를 포함하는 Kaggle의 Titanic 데이터셋을 이용하여 기계 학습 기반으로 데이터 분석을 수행하기 위한 다변량 정형 (tabular) 데이터 처리 방법에 대해 제시한다. 데이터 특성에 따른 통계 분석을 적용한 입력 변수 필터링, 데이터 정규화 등의 처리 방법을 제안하고, 데이터 시각화를 통해 데이터 구조를 분석한다. 마지막으로, 기계 학습 모델을 설계하고, 제안하는 다변량 데이터 처리를 적용하여 모델을 훈련시킨다. 그 이후, 훈련된 모델을 사용하여 탑승객의 생존 여부 예측 성능을 분석한다. 본 논문에서 제시하는 다변량 데이터 처리와 시각화를 적용하여 다양한 환경에서 기계 학습 기반 분석에 확장할 수 있을 것으로 기대한다.

C형 및 H형 철근콘크리트 구조벽체의 2축 상호작용과 등하중법 (Biaxial Interaction and Load Contour Method for Reinforced Concrete C- and H-shaped Structural Walls)

  • 남혜성;엄태성
    • 콘크리트학회논문집
    • /
    • 제29권2호
    • /
    • pp.189-200
    • /
    • 2017
  • C형 및 H형 단면의 구조벽체는 고층 건물에서 횡력저항시스템으로 널리 이용된다. 이러한 이형벽체는 축력과 함께 x축 및 y축에 대한 2방향 휨모멘트를 동시에 받으므로, 안전한 벽체설계를 위해서는 휨-압축 상호작용을 정확히 고려해야 한다. 이 연구에서는, 대칭단면을 갖는 기둥을 위하여 개발된 기존 등하중법을 수정하여, 2방향으로 재하된 C형 및 H형 벽체를 위한 근사설계방법을 제안하였다. 다양한 단면형상을 갖는 이형벽체에 대하여 2방향 모멘트강도를 계산할 수 있는 단면해석 프로그램을 개발하고, 실험결과와 비교를 통하여 프로그램의 정확성을 검증하였다. 또한 개발한 프로그램을 사용한 변수연구를 통하여, C형 및 H형 이형벽체 단면에 대한 2축 상호작용 특성을 분석하였다. 분석 결과, C형 및 H형 이형벽체의 2축 상호작용은 모멘트 방향과 압축력 크기에 의하여 크게 영향을 받는 것으로 나타났다. 이러한 변수연구를 통하여 일정한 압축력에서 2축 모멘트강도의 상관관계를 나타내는 정규화된 컨투어 설계식을 제안하였다. 또한 실무에서 쉽게 활용할 수 있도록, 제안된 컨투어 설계식을 사용한 이형벽체 설계절차와 설계예제를 제시하였다.

성문(聲紋)과 사상체질(四象體質)과의 상관성(相關性)에 관(關)한 연구(硏究) (A Study on the Correlation between Sound Spectrogram and Sasang Constitution)

  • 양승현;김달래
    • 사상체질의학회지
    • /
    • 제8권2호
    • /
    • pp.191-202
    • /
    • 1996
  • 사상의학(四象醫學)에 있어서 체질변증(體質辨證)은 매우 중요한 과제로서 많은 의가(醫家)들에 의해 연구되고 있으나 지금까지 객관적으로 인정된 방법은 없다고 하겠다. 본 연구는 성문(聲紋)과의 상관성(相關性)을 통하여 사상체질(四象體質) 변증(辨證)에 도움이 되고자 하였다. 태음인(太陰人) 26명, 소음인(少陰人) 25명, 소양인(少陽人) 15명의 음성(音聲)울 녹음하여 시간 측정을 하였고, 성문분석기로 음성의 기본주파수(基木周波數)를 분석하여 비교하였으며 결과는 다음과 같다. 1. 태음인, 소음인, 소양인의 측정된 문장 발음 속도는 유사한 경향을 보였다. 2. 기본주파수 빈도분포그래프와 정규분포 그래프에서 태음인의 중심값이 소음인과 소양인에 비해 낮게 나타났으며, 소음인과 소양인 사이의 중심값은 유사한 경향을 보였다. 3. 기본주파수 빈도분포 그래프와 정규분포 그래프에서 폭의 경우는 체질 간에 유사한 경향을 보였다. 4. 세 체질의 기본주파수 평균값의 경우 태음인은 소음인에 비해 낮게 나타나서 태음인과 소음인은 통계학적으로 유의적인 차이점이 인정되었으며, 이는 태음인의 저음 사용이 소음인에 비하여 많음을 의미 한다고 볼 수 있다. 따라서 성문의 기본주파수 분석을 통한 사상체질 분류검사방법은 사상체질의 객관화를 위한 하나의 보조적인 방법이 될 수 있다고 사료된다. 제언 및 문제점 1. 문장뿐만 아니라 실제 대화음성의 분석이 필요할 것으로 생각된다. 2. 좀 더 많은 자료의 수집 분석이 필요하며, 남성뿐만 아니라 여성과 연령별로의 분석도 연구되어야 한다고 생각된다. 3. 녹음시의 여러 변수, 예를 들연 녹음시의 잡음, 조사대상자의 긴장, 또는 감기나 기타 질병으로 인한 음성변화 등에 대한 문제점도 주의해야 할 것으로 생각된다. 4. 기본주파수이외의 다른 변수, 예를 들어 공명주파수나 음의 강도등을 이용한 체질과의 상관성에 관한 연구가 필요하다고 생각된다.

  • PDF

의료기관 인증제에 대한 인식이 요양병원 간호인력의 환자안전관리 활동에 미치는 영향 (Influence of Recognition for Health Care Accreditation on Patient Safety Managing Activities of Nursing Staffs in Geriatric Hospital)

  • 권명숙;조현숙
    • 한국노년학
    • /
    • 제38권1호
    • /
    • pp.15-26
    • /
    • 2018
  • 본 연구는 2013년 요양병원의 의무 인증제 이후 간호인력의 의료기관 인증제에 대한 인식과 환자안전관리 활동 정도를 조사하고, 인증제 인식과 환자안전관리 활동 간의 상관관계 및 환자안전관리 활동에 미치는 영향요인을 확인하여, 요양병원 간호인력의 환자안전관리 활동을 증진하기 위한 기초자료를 제공하고자 시행되었다. 본 연구는 서술적 조사연구로 서울, 인천, 부천 소재의 의료기관 인증을 획득한 6개 요양병원 소속 간호사 및 간호조무사 대상으로 2016년 4월 18일부터 4월 30일까지 구조화된 설문지를 활용하여 총 182명의 자료를 수집하였다. 수집된 자료는 SPSS/WIN 15.0 Program을 이용하여 t-test, ANOVA, Pearson's correlation coefficient, 다중 회귀분석을 실시하였다. 연구결과, 의료기관 인증제의 인식정도는 문항평균 3.60점(최고 5점), 환자안전관리 활동은 문항평균 4.39점(최고 5점)이었다. 의료기관 인증제의 인식과 환자안전관리 활동 간에는 유의한 양적 상관관계(r=.339, p<.001)가 있었고, 환자안전관리 활동에 가장 큰 영향을 미치는 변수는 '내부서비스 품질향상'(${\beta}=.362$, p<.001)이었고, 이외 '최종학력'(${\beta}=.194$, p=.005)이 유의한 영향을 미쳤으며, 이들 변수의 설명력은 16.4% 이었다. 따라서 요양병원 간호인력의 환자안전관리 활동이 증진되기 위해서는 의료기관 인증제에 대한 인식, 특히 '내부서비스 품질향상' 인식을 높이기 위한 기관의 인증제 교육프로그램 운용의 정규화 및 활성화를 위한 제고방안이 포함되어야 한다.