• 제목/요약/키워드: 선형회귀 모델

검색결과 440건 처리시간 0.025초

다중 회귀 분석을 이용한 한자 난이도 예측 기법 연구 (Prediction Techniques for Difficulty Level of Hanja Using Multiple Linear Regression)

  • 최정환;노지우;김순태
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.219-225
    • /
    • 2019
  • 한자 급수와 같이 기존 한자 난이도 선정 방식에 문제점이 있다. 실생활에서 쓰이는 한글 단어와 차이가 나며 해당 급수가 실제로 얼마나 많이 쓰이는지 알 수가 없다. 이러한 문제를 해결하기 위해 빈도수를 이용하여 다중 회귀 분석을 이용하여 한자 난이도를 측정한다. 초등 교과서를 기반으로 한자활용빈도수와 한글의미빈도수를 집계한다. 두 빈도수와 획수를 함께 사용하여 설문지를 작성하여 해당 한자의 학습 적정 시기를 답변 받아 이를 회귀에서 사용할 타겟 변수로 이용한다. 단계별 회귀분석을 이용하여 적절한 피처를 선택하고 다중 선형 회귀 분석을 한다. 모델의 R2는 0.1105가 나왔으며 RMSE는 0.1105의 결과가 나왔다.

스포츠 아우터웨어용 나일론 직물의 소리 감각과 이와 관련된 객관적 파라미터들 (Sound Sensation and Its Related Objective Parameters of Nylon Fabrics for Sports Outerwear)

  • Yi, Eunjou;Cho, Gilsoo
    • 한국의류학회지
    • /
    • 제25권9호
    • /
    • pp.1593-1602
    • /
    • 2001
  • 본 연구는 스포츠 아우터웨어용 나일론 직물의 소리에 대한 주관적 감각과 이에 관련된 객관적 측정치를 규명하기 위하여, 서로 다른 8종의 나일론 직물의 소리의 스펙트럼 파형을 고찰하였으며, 소리 파라미터로 총음압(level pressure of total sound, LPT),세 가지 AR (autoregressive)계수, Zwicker의 심리음향학적 모델에 따른 크기(Z)와 날카로움(Z)를 계산하였고, Kawabata Evaluation System(KES)으로 직물의 물리적 성질을 측정하였다. 주관적 감각 평가를 위하여 피험자에게 녹음된 각 직물소리를 들려주어 7개 소리 감각 (부드러움, 시끄러움, 날카로움, 맑음, 거 침, 높음, 유쾌함)을 의미분별척도로 답하게 한 후, 단계적 선형 회귀식을 이용하여 직물 소리의 주관적 감각에 대한 예측 모델을 제시하였다. 울트라스웨이드를 제외한 태피터 나일론 직물들은 스펙트럼 파형 에서 다른 조성 섬유의 직물들보다 음압 값이 높고, 총음압이 60dB 안팎의 값을 보여, 착용자에게 불쾌감을 줄 것으로 예상되었으며, 주관적 감각 평가에서도 소리의 부드러움과 맑음, 유쾌함에서 음의 점수를, 시끄러움과 날카로움, 거침, 높음에서 양의 점수를 얻었다. 주관적 감각의 예측모델에서 총음압은 시끄러움과 거침에 정적 영향을, 유쾌함에 부적 영향을 미쳐서 나일론 직물 소리의 총음압이 50dB 이하일 때 주관적으로 유쾌하게 느껴지는 것으로 나타났다.

  • PDF

일부 농촌 성인을 대상으로 한 고혈압과 식이섭취와의 관계에 관한 연구 (A Study on Relationship between Hypertension and Dietary Intake in a Rural Adult Population)

  • 고운영;김정순
    • Journal of Preventive Medicine and Public Health
    • /
    • 제30권4호
    • /
    • pp.729-740
    • /
    • 1997
  • 고혈압과 영양소 섭취와의 관계를 분석하기 위하여 춘천시 남면과 사북면의 10개리에 거주하는 30세 이상 성인을 대상으로 1995년 7월$\sim$8월, 1996년 6월에 혈압측정 및 24시간 회상법을 이용한 식이조사를 시행하여 남자 250명, 여자 297명을 대상으로 분석하였다. 혈압과 영양소 섭취와의 관련성을 분석한 결과를 요약하면 아래와 같다. 1. 평균 수축기 혈압과 영양소 섭취와의 상관관계 분석에서 유의한 상관관계를 보인 영양소는 남성에서 단백질 에너지(%)였다$(\gamma=0.16)$. 여성에서는 유의한 상관 관계를 보여주지 않았다. 2. 평균 이완기 혈압과의 상관관계 분석시 남성에서 단백질 밀도와 단백질 에너지(%)가 강한 양의 상관관계를(p<0.01)보여주었으며, 칼슘 밀도(calcium density)와 에너지 보정 단백질도 유의한 양의 상관관계를 보여주었다. 여성에서는 유의한 상관관계를 보인 영양소는 없었다. 3. 탄수화물과 나트륨을 제외한 영양소 섭취량은 전체적으로 고혈압군에서 높았으나 유의한 차이는 보이지 않았다. 4. 다중선형회귀분석(multiple linear regression analysis)에서 남성의 경우 영양소 밀도를 이용한 모델에서는 평균 이완기 혈압만이 단백질 밀도와 유의한 양의 연관성을 보여주었다. 에너지 보정 영양소를 이용한 모델에서는 평균 이완기 혈압과 에너지 보정 단백질만이 유의한 양의 연관성을, 총 열량은 음의 연관성을 보여주었다. 여성의 경우는 평균 수축기 및 이완기 혈압과 유의한 연관성을 보여주는 영양소는 없었다. 5. 고혈압과 영양소와의 관계를 성, 연령, 체질량 지수, 가족력을 보정하고 선형중회귀로짓분석을 이용하여 분석시 영양소 밀도를 이용한 모델에서는 단백질 밀도가 강한 양의 연관성을(Odds ratio=3.18), 지방밀도는 유의한 양의 연관성을(Odds ratio=1.94)을, 나트륨 밀도는 유의한 음의 연관성을 보여주었다(Odds ratio=0.73). 에너지 보정 영양소를 이용한 모델에서는 에너지 보정 단백질이 유의한 양의 연관성을 보여주었다(Odds ratio=1.01). 본 연구는 단면조사를 통하여 혈압과 영양소와의 상관관계 분석과 고혈압군과 정상혈압군의 영양소 섭취의 차이를 분석하여 영양소섭취와 고혈압과의 연관성을 보고자 하였는데 적대적인 영양소 섭취량보다는, 같은 에너지 섭취수준에서 단백질과 지방 섭취가 상대적으로 많은 경우가 양의 연관성을 보였고, 나트륨 섭취가 상대적으로 적은 경우가 음의 연관성을 보였다.

  • PDF

k-Nearest Neighbor 알고리즘을 이용한 도심 내 주요 도로 구간의 교통속도 단기 예측 방법 (Short-Term Prediction of Vehicle Speed on Main City Roads using the k-Nearest Neighbor Algorithm)

  • 모하메드 아리프 라시이디;김정민;류광렬
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.121-131
    • /
    • 2014
  • 교통속도는 교통 문제를 해결하기 위한 중요한 지표 중 하나이다. 이를 이용하여 교통혼잡 탐지, 주행 시간 예측, 도로 설계와 같은 다양한 문제 해결에 활용할 수 있다. 따라서 정확한 교통속도 예측은 지능형 교통 시스템의 개발에 있어 필수적인 요소라고 할 수 있다. 본 논문에서는 대한민국 부산시의 특정 도로를 대상으로 교통 속도에 대한 분석 및 예측을 수행하였다. 과거 연구에서는 대상 도로의 속도 예측을 위해 과거 대상 도로의 교통속도 이력 데이터만을 사용하였다. 그러나 실제 대상 도로의 교통 상황은 인접한 도로의 교통 상황의 영향을 받게 된다. 따라서 본 논문에서는 실제 부산시의 과거 교통속도 이력 데이터를 기반으로 대상 도로와 인접 도로를 모두 고려하여 교통속도 예측 모델의 학습을 위한 속성을 추출하였다. 이와 같이 후보 속성들을 추출 한 후 선형 회귀 (linear regression), 모델 트리 (model tree) 및 k-nearest neighbor (k-NN) 기법을 이용하여 속성의 부분집합 선택 (feature subset selection)과 교통속도 예측 모델 생성을 수행하였다. 실험 결과 주어진 교통 데이터에서 k-NN 기법은 선형 회귀 및 모델 트리 기법에 비해 평균절대백분율오차 (mean absolute percent error, MAPE)와 제곱근평균제곱오차 (root mean squared error, RMSE) 측면에서 더 나은 성능을 보임을 확인하였다.

기계학습법을 이용한 IoMT 핀테크 모델을 기반으로 한 구조화 스토리지에서의 빅데이터 관리 연구 (Big Data Management in Structured Storage Based on Fintech Models for IoMT using Machine Learning Techniques)

  • 김경실
    • 산업과 과학
    • /
    • 1권1호
    • /
    • pp.7-15
    • /
    • 2022
  • 사물인터넷(IoT) 기술은 최근 의료사물인터넷(IoMT)으로 정의된 대량의 의료 데이터를 처리하여 발전을 위해 개발된 의료분야에서 많이 활용되고 있다. 수집된 광범위한 의료 데이터는 수집된 의료 데이터를 처리하기 위해 구조화된 방식으로 클라우드에 저장된다. 그러나 방대한 양의 의료 데이터를 효과적으로 처리하는 것은 쉽지 않기 때문에 의료분야 구조 데이터를 개발하는 것이 필요하다. 본 논문에서는 IoMT에서 수집된 구조화된 건강 관리 데이터를 처리하기 위한 기계 학습 모드를 개발하였다. 광범위한 의료 데이터를 처리하기 위해 본 논문에서는 의료 데이터 처리를 위한 MTGPLSTM 모델을 제안하였다. 제안된 모델은 의료 정보 처리를 위한 선형 회귀 모델을 통합한다. 개발된 모델 이상치 모델은 IoMT에서 수집된 COVID-19 의료 데이터들의 평가 및 예측을 위해 FinTech 모델을 기반으로 구현되었다. 제안된 MTGPLSTM 모델은 감염 확산 방지를 위한 계획 계획을 예측하고 평가하기 위한 회귀 모델로 구성된다. 개발된 모델 성능은 LR, SVR, RFR, LSTM 및 제안된 MTGPLSTM 모델과 같은 서로 다른 분류기를 고려하였으며 1GB, 2GB, 3GB 등 데이터 크기가 다르다는 점도 주요하게 고려되었다. 제안된 MTGPLSTM 모델이 전 세계 데이터에 대해 최대 4% 감소된 MAPE 및 RMSE 값을 달성하였고 중국의 경우 기존 분류기보다 최대 6% 최소인 최소 MAPE(0.97)이 달성되었다.

양식장 어류 생육 데이터 분석 및 마이닝 (Data Analysis and Mining for Fish Growth Data in Fish-Farms)

  • 예성빈;박정선;한순희;정희택
    • 한국전자통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.127-142
    • /
    • 2023
  • 양식장에서 양식어의 생육 정보인 크기 및 무게의 관리는 가장 기본적인 목표이다. 본 연구에서는 육상 양식장에서 입식 또는 분조 시점부터 출하 시점까지를 epoch로 정의하고, 총 3 epoch에 대하여 생육데이터를 시계열 관점에서 분석하고자 한다. 양식장에서 시간 흐름에 따라 발생하는 양식어의 크기 및 무게 등의 생육 정보를 수질 환경 정보, 급이 정보와 비교 분석하고, 분석 결과를 이용하여 모델을 제시한다. 본 연구에서는 현장에서 획득된 데이터를 이용하여 크기 및 무게에 대하여 Box-Jenkins 방법을 이용하여 선형, 지수, 로그 회귀분석 모델을 제시한다.

단일이미지에서의 초해상도 영상 생성을 위한 패치 정보 기반의 선형 보간 연구 (Patch Information based Linear Interpolation for Generating Super-Resolution Images in a Single Image)

  • 한현호;이종용;정계동;이상훈
    • 한국융합학회논문지
    • /
    • 제9권6호
    • /
    • pp.45-52
    • /
    • 2018
  • 본 논문은 단일 이미지에서 초해상도 영상 생성을 위해 저해상도 이미지에서 생성한 패치정보를 기반으로 선형보간하는 방법을 제안하였다. 기존의 초해상도 생성 방법인 전역 공간의 회귀 모델을 사용하면 특정 영역에 대해 참조할 정보가 부족하여 일반적으로 품질이 떨어지는 결과가 나타난다. 이러한 결과를 보완하기 위해 제안하는 방법은 초해상도 이미지 생성 과정에서 영상을 패치 단위로 지역을 분할하여 의미있는 정보를 수집하고, 수집된 정보를 기반으로 초해상도 이미지 생성을 위해 확장시킨 이미지 매트릭스 영역의 구성정보를 분석하여 선형 보간 과정을 거치고 패치정보를 대응시켜 탐색한 최적의 패치 정보를 기준으로 선형 보간하는 방법을 제안하였다. 실험을 위해 원본 이미지를 복원된 영상과 PSNR, SSIM으로 비교 평가하였다.

Rubidium-82 심근 Dynamic PET 영상과 이중적분법을 이용한 국소 심근 혈류 예측의 기본 모델 연구 (Regional Myocardial Blood Flow Estimation Using Rubidium-82 Dynamic Positron Emission Tomography and Dual Integration Method)

  • 곽철은;정재민
    • 대한의용생체공학회:의공학회지
    • /
    • 제16권2호
    • /
    • pp.223-230
    • /
    • 1995
  • Rb-82 dynamic PET과 이중적분법에 의한 국소 심근 혈류측정 연구를 시행하고자 실험 개를 이용한 심근 경색 모델과 허혈성 심근질환에서 좌심실 입력함수에 의한 정상 및 관류결손 심근에서의 혈류를 측정하였다. 이중적분법이 선형회귀모델에 의한 혈류측정방법에 비하여 안정도가 높고 심근내혈류가 선형적인 가정을 배제할 수 있어 사용 가능한 방법이 될 수 있음을 확인하였다.

  • PDF

웹 소프트웨어의 위험분석 모델에 관한 연구 (A Study of Risk Analysis Model on Web Software)

  • 김지현;오성균
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.281-289
    • /
    • 2006
  • 소프트웨어 개발환경이 웹 기반으로 급격히 전환되고 있으나 웹 소프트웨어 품질 측정 메트릭이나 추정 모델에 대한 연구는 매우 미흡한 실정이다. 본 연구는 웹 소프트웨어의 위험도가 객체 속성과 상관관계가 있는지 선형회귀 방법을 사용하여 분석하였고, 실무에서 사용되고 있는 중형이상의 6개 시스템을 대상으로 규모와 클래스 수(NOC), 규모와 메소드 수(NOM) 및 복잡도와 클래스 수(NOC), 복잡도와 메소드 수(NOM)에 관한 적정 모델을 제안하였다. 실험에 사용한 6 시스템 중 5 시스템(S06 제외)의 규모(LOC)와 NOM이 높은 관련성을 보였고 4 시스템(S04 & S06 제외)의 복잡도와 NOM, 복잡도와 NOC가 높은 관련성을 보였다. 여기서 웹 소프트웨어 구조를 이루는 서버, 클라이언트. HTML 세 요소 각각의 복잡도를 비교하였는데, 두 시스템(S04, S06)은 각 요소의 복잡도 차이가 비교적 높았으며 1시스템(S06)은 HTML 복잡도가 크게 치우쳐 있었다. 즉 위험도를 미리 추정하여 유지보수성을 향상시키기 위해서는 NOM으로 추정가능 하도록 세 요소의 복잡도를 균일하게 유지해야 함을 제시한다.

  • PDF

심층인공신경망을 이용한 암반사면의 전단강도 산정 (Calculation of Shear Strength of Rock Slope Using Deep Neural Network)

  • 이자경;최주성;김태형;김종우
    • 한국지반신소재학회논문집
    • /
    • 제21권2호
    • /
    • pp.21-30
    • /
    • 2022
  • 전단강도는 암반 비탈면 안정성 평가에서 가장 중요한 지표이다. 일반적으로 기존 문헌자료, 역해석, 실험 등의 결과를 비교하여 산정한다. 암반 비탈면에서의 전단강도는 불연속면의 상태와 관련된 변수를 추가로 고려해야 한다. 이 변수들은 시추조사를 통해 여부를 파악하는 것이 어려울뿐더러 전단강도와의 정확한 관계를 찾아내기도 어렵다. 본 연구에서는 역해석을 통해 산정된 데이터를 이용했다. 기존 고려되었던 변수들의 관계를 딥러닝에 접목시켜 전단강도 산정에 적합한지 그 가능성을 모색하였다. 비교를 위해 기존에 사용되는 간단한 선형회귀(Linear Regression) 모델과 딥러닝 알고리즘인 심층인공신경망(DNN) 모델을 사용하였다. 각 분석 모델은 비슷한 예측결과를 도출해내었지만 미세한 차이로 DNN의 설명력이 개선된 결과를 나타내었다.