• 제목/요약/키워드: 선형회귀 모델

검색결과 440건 처리시간 0.032초

소프트웨어 개발비용을 추정하기 위한 FFP 기반 모델 (A FFP-based Model to Estimate Software Development Cost)

  • 박주석;정기원
    • 정보처리학회논문지D
    • /
    • 제10D권7호
    • /
    • pp.1137-1144
    • /
    • 2003
  • 소프트웨어 규모를 측정하기 위한 기존의 기능점수 기법은 관리정보 시스템에 적합하도록 구성되어 있으나 최근의 실시간 및 내장형 시스템의 적용성 확장에 따라 완전기능점수(FFP, Full Function Point) 기법이 제안되었다. 그러나, FFP 기반의 소프트웨어 규모 측정 방법에 관한 많은 연구는 이루어지고 있으나, FFP로 측정된 소프트웨어 규모에 대한 개발비용을 추정할 수 있는 모델 연구는 미흡한 실정이다. 본 논문은 FFP로 실제 개발된 소프트웨어의 완전기능점수를 기반으로 소프트웨어 개발에 투입될 노력을 추정하는 선형 회귀분석 모델과 거듭제곱 회귀분석 모델을 평가하여 가장 적합한 모델로써 거듭제곱 모델을 선정하였다. 선정된 거듭제곱 모델을 적용할 경우 가장 근사치의 소프트웨어 개발비용을 추정할 수 있음을 보였다.

소프트웨어 개발 세부단계 노력 추정 모델 (A Model for Software Effort Estimation in the Development Subcycles)

  • 박석규;박영목;박재흥
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권6호
    • /
    • pp.859-866
    • /
    • 2001
  • 성공적인 프로젝트 계획은 활용 가능한 일정과 더불어 프로젝트를 완수하는데 요구되는 노력을 얼마나 정확히 추정하느냐에 달려있다. 새로운 또는 보다 나은 모델 개발에 많은 연구가 이루어졌지만 현존하는 소프트웨어 노력 추정 모델들은 개발 전순기에 대해 투입되는 총 개발노력과 단위시간당 소요되는 인력인 노력 함수만을 제공한다. 또한, Putnam은 세부단계별로 일정한 개발노력 투입 비율을 제시하였다. 그러나 소프트웨어의 규모, 복잡도와 운영환경의 영향으로 인해 프로젝트 별로 투입되는 총 개발노력의 규모에 차이가 발생하며, 그 결과, 개발 세부단계별로 투입되는 노력의 규모도 프로젝트마다 차이가 발생한다. 본 논문은 총 개발노력 변동에 따른 소프트웨어의 명세화, 구축과 시험단계에 투입될 개발노력을 추정하는 선형과 다항식 모델을 제시하였다. 이 모델들은 128개의 다른 소프트웨어 프로젝트들로부터 유도되었다. 제안된 모델은 프로젝트의 일정과 노력 할당 관리에 실질적인 지침을 제공할 것이다.

  • PDF

The Unsupervised Learning-based Language Modeling of Word Comprehension in Korean

  • Kim, Euhee
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권11호
    • /
    • pp.41-49
    • /
    • 2019
  • 본 연구는 비지도 기계학습 기술과 코퍼스의 각 단어를 이용하여 한국어 단어를 형태소 분석하는 언어 모델을 구축하는데 목적을 둔다. 그리고 이 언어 모델의 단어 형태소 분석의 결과와 언어 심리 실험결과에서 얻은 한국어 언어사용자의 단어 이해/판단 시간이 상관관계을 갖는지를 규명하고자 한다. 논문에서는 한국어 세종코퍼스를 언어 모델로 학습하여 형태소 분리 규칙을 통해 한국어 단어를 자동 분리하는데 발생하는 단어 정보량(즉, surprisal(놀라움) 정도)을 측정하여 실제 단어를 읽는데 걸리는 반응 시간과 상관이 있는지 분석하였다. 이를 위해 코퍼스에서 단어에 대한 형태 구조 정보를 파악하기 위해 Morfessor 알고리즘을 적용하여 단어의 하위 단위 분리와 관련한 문법/패턴을 추출하고 형태소를 분석하는 언어 모델이 예측하는 정보량과 반응 시간 사이의 상관관계를 알아보기 위하여 선형 혼합 회귀(linear mixed regression) 모형을 설계하였다. 제안된 비지도 기계학습의 언어 모델은 파생단어를 d-형태소로 분석해서 파생단어의 음절의 형태로 처리를 하였다. 파생단어를 처리하는 데 필요한 사람의 인지 노력의 양 즉, 판독 시간 효과가 실제로 형태소 분류하는 기계학습 모델에 의한 단어 처리/이해로부터 초래될 수 있는 놀라움과 상관함을 보여 주었다. 본 연구는 놀라움의 가설 즉, 놀라움 효과는 단어 읽기 또는 처리 인지 노력과 관련이 있다는 가설을 뒷받침함을 확인하였다.

인공위성 및 재분석 자료를 이용한 미세먼지 농도와 수문기상인자의 상관성 분석 (Hydrometeorological Drivers of Particulate Matter Using Satellite and Reanalysis Data)

  • 이슬찬;정재환;최민하
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.100-100
    • /
    • 2019
  • 최근 대기 중 미세먼지의 농도가 높은 일수가 급증하면서, 미세먼지를 저감하고자 하는 연구가 활발히 이루어지고 있다. 미세먼지는 주로 자동차 혹은 공장 등 인간 활동에 의한 오염물질 배출에 의해 발생하는 것으로 알려져 있으며, 태양복사에너지, 토양수분, 강우, 풍속 등의 수문기상학적 인자에 의해 발생, 이동, 소멸의 과정을 거친다. 현재 우리나라에서는 미세먼지 농도를 관측하기 위해 지점 기반의 관측소를 운영하고 있으며, 관측소가 위치하지 않은 지역의 미세먼지 농도는 선형 보간법 등을 활용한 내삽 기법을 통해 제공하고 있다. 그러나 미세먼지 농도는 다양한 수문기상인자들의 영향에 의한 차이가 크게 나타나기 때문에 지점 기반의 자료로는 해당 지역의 미세먼지 농도를 추정하는 데 어려움이 많다. 본 연구에서는 미세먼지의 공간적인 분포를 추정하고자 MODerate resolution Imaging Spectroradiometer (MODIS) 에어로졸 자료와 Global Land Data Assimilation System (GLDAS) 수문기상인자를 활용하여 미세먼지 농도에 영향을 주는 것으로 판단되는 다양한 수문기상인자들과의 상관성을 분석하였다. 미세먼지와 각 인자간의 상관성을 분석하여 높은 상관성을 갖는 수문기상인자들을 도출하고 최적의 선형회귀분석 모델을 구축하기 위해 베이지안 모델 평균(Bayesian Model Averaging, BMA)을 사용하였으며, 지점 데이터와의 비교를 통해 활용성을 검증하였다. 전체적으로 수문기상인자를 사용한 선형회귀분석 결과에서는 미세먼지농도 변화의 경향을 반영하고 있는 것을 확인할 수 있었으나, 계절별, 지역별 등 대기 특성을 고려하지 않아 각 기간의 급격한 농도 변화를 감지하기에 어려움이 있었다. 이러한 연구를 바탕으로 수문기상인자와 미세먼지 농도의 패턴이 더욱 정확히 분석된다면, 미세먼지 농도 모니터링과 정확한 예보 시스템의 구축에 효과적으로 활용 될 것으로 기대된다.

  • PDF

지질조건에 따른 자연사면 토층의 투수계수 산정모델 제안 (Proposal of Models to Estimate the Coefficient of Permeability of Soils on the Natural Terrain considering Geological Conditions)

  • 전덕찬;송영석;한신인
    • 지질공학
    • /
    • 제20권1호
    • /
    • pp.35-45
    • /
    • 2010
  • 본 연구에서는 10여년 동안 국내 산사태 발생지역 및 인근 미발생지역에서 채취된 자연사면에서의 토층을 대상으로 획득된 약 1,150여개소의 토질시험결과를 토대로 지질조건에 따른 토층의 평균 물성치를 산정하고, 통계적인 분석을 실시하여 지질조건별 투수계수에 대한 간편식을 제안하였다. 투수계수는 화강암지역과 이암지역에서 큰 것으로 나타났으며, 세립토함유량은 이암지역과 편마암지역에서 큰 것으로 나타났다. 지질조건에 따른 토층의 투수계수를 산정하기 위해서 상관성 분석을 실시한 결과 종속변수를 투수계수로 하고 독립변수를 세립토함유량, 함수비, 건조단위중량 및 간극비로 선정하였다. 회귀분석결과 지질조건별 제안된 선형회귀식에서는 공통적으로 세립토함유량 및 간극비가 가장 많이 포함되었다. 제안된 선형회귀식을 검증하기 위하여 타 지역의 토층을 대상으로 수행된 투수계수 측정결과와 선형회귀식으로 예측된 결과를 서로 비교하였다. 비교결과 일부 측정된 결과와 예측된 결과가 차이가 있는 것으로 나타났으나, 그 차이는 비교적 작은 것으로 나타났다. 본 연구에서 제안된 지질조건별 투수계수 산정을 위한 선형회귀식은 국내 지반을 대상으로 적용이 가능할 것으로 판단되나, 추후 지속적인 검증 및 수정이 필요할 것으로 판단된다.

자동차 모의운전환경에서 Simulator Sickness의 예측에 관한 연구 (A study on Prediction of Simulator Sickness in Driving Simulation)

  • 김도희
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1998년도 추계학술대회 및 정기총회
    • /
    • pp.170-173
    • /
    • 1998
  • 본 연구에서는 시뮬레이터나 그와 유사한 가상현실환경(Virtual Reality Environment ; VRE)에서 일어날 수 있는 Simulator Sickness가 어떤 사람들에게 쉽게 발생하는지를 예측하기 위하여 다중선형회귀(Multiple linear regression) 방정식으로 예측회귀모형을 제시하였다. 이 회귀모형에서의 종속변수는 김도희 외(1998)에 의해 개발된 RSSQ의 종합점수이고, 독립변수는 실제운전경력에 1을 더한 값에 나이를 곱한 값, 과거 멀미를 경험한 정도, 1주일 평균 동화상 시간, 현재의 건강상태로 되어져 있다. 이 회귀모형의 R2값은 약 0.52로 Kolasinski(1996)의 모델보다 설명력이 18% 증가하였고, 부수적인 별도의 실험을 하지 않고도 간단한 개인 신상에 관한 간단한 자료만으로도 훨씬 좋은 결과를 예측할 수 있게 되었다. 따라서 시뮬레이터나 가상현실에서 일어나는 Simulator Sickness가 어떠한 사람에게 걸리기가 쉬운지를 쉽게 예측할 수 있게 되었고, 이러한 사람들에게는 시뮬레이터나 가상현실의 이용을 자제시키거나 주의를 주어 특별관리 함으로써 시뮬레이터나 가상현실을 운영하는데 많은 도움을 줄 수 있을 것이다.

  • PDF

PM2.5농도 산출을 위한 경험적 다중선형 모델 분석 (Analysis of Empirical Multiple Linear Regression Models for the Production of PM2.5 Concentrations)

  • 추교황;이규태;정명재
    • 한국지구과학회지
    • /
    • 제38권4호
    • /
    • pp.283-292
    • /
    • 2017
  • 본 연구에서는 서울지역의 지상 미세먼지($PM_{2.5}$) 농도를 산출하기 위하여 경험적인 모델들을 개발하였다. 연구에 이용한 자료는 2012년 1월 1일부터 2013년 12월 31일까지이며 Terra와 Aqua위성의 MODIS센서에서 산출되는 에어로졸 광학두께, 옹스트롬 지수, 기상변수들과 행성경계층두께와 관련된 6개의 다중 선형 회귀모델들의 차이를 분석하였다. 그 결과 에어로졸 광학두께와 옹스트롬 지수, 상대습도, 풍속, 풍향, 행성경계층두께, 기온 자료를 입력 자료로 사용한 $M_6$모델이 가장 좋은 결과를 보였다. 통계적인 분석에 따르면 $M_6$ 모델을 사용하여 계산된 $PM_{2.5}$와 관측된 $PM_{2.5}$농도 사이의 결과는 상관계수(R=0.62)와 평균제곱근오차($RMSE=10.70{\mu}gm^{-3}$)이다. 또한 산출된 계절별 지표면 $PM_{2.5}$농도는 여름철(R=0.38)과 겨울철(R=0.56)보다 봄(R=0.66)과 가을철(R=0.75)에 상대적으로 더 좋은 상관 관계를 보였다. 이러한 결과는 에어로졸 광학두께의 계절별 관측 특성으로 인한 것으로써 다른 계절에 비하여 여름과 겨울철 에어로졸 광학두께 관측이 구름과 눈/얼음 표면에 의한 관측 제한과 오차를 가져온 것으로 분석되었다. 따라서 본 연구에서 사용한 경험적 다중선형회귀 모델은 위성에서 산출된 에어로졸 광학두께 자료가 지배적인 변수로 작용하며 $PM_{2.5}$산출 결과들을 향상시키기 위해서는 추가적인 기상 변수를 이용해야 할 것이다. 또한 경험적 다중선형회귀 모델을 이용하여 $PM_{2.5}$를 산출한 결과는 인공위성 자료로부터 대기환경 감시를 가능하게 하는 방법이 될 수 있어 유용할 것이다.

컴퓨팅 사고 교육 게임 데이터를 사용한 게임 점수 예측 모델 성능 비교 연구 (A Comparative Study on Game-Score Prediction Models Using Compuational Thinking Education Game Data)

  • 양영욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.529-534
    • /
    • 2021
  • 컴퓨팅 사고는 21세기에 필요한 중요한 소양 중 하나로 여겨지면서 여러 국가에서 컴퓨팅 사고 교육 과정을 도입하여 시행하고 있다. 컴퓨팅 사고 교육 방법 중 교육용 게임 기반 방법은 학생들의 참여와 동기를 증대시키고 컴퓨팅 사고에 대한 접근성을 높여준다. Autothinking은 학습자들에게 컴퓨팅 사고 교육을 제공하기 위한 목적으로 개발한 교육용 게임으로 학습자들에게 동적으로 피드백을 제공하고, 학습자의 컴퓨팅 사고 능력에 따라서 난이도를 자동으로 조절하는 적응적 시스템이다. 하지만 규칙기반으로 게임을 디자인하여 지능적으로 학습자들의 컴퓨팅 사고를 고려하거나 피드백을 주지 못한다. 본 연구에서는 Autothikning을 통해 수집한 게임 데이터를 소개하고, 이를 활용하여 해당 게임의 적응성을 높이기 위해 컴퓨팅 사고를 반영하는 게임 점수의 예측을 수행한다. 이 문제를 해결하기 위해 회귀 문제에 가장 많이 사용되는 선형 회귀, 결정 트리, 렌덤 포레스트, 서포트 벡터 머신 알고리즘에 대한 비교연구를 수행하였다. 연구 수행결과 선형회귀 방법이 게임 점수 예측에 가장 좋은 성능을 보여주었다.

P-$\Delta$ 효과를 고려한 RC 기둥의 극한저항력 산정 (Ultimate Resisting Capacity of RC Columns Considering P-$\Delta$ Effect)

  • 곽효경;김진국;김한수
    • 한국전산구조공학회논문집
    • /
    • 제15권1호
    • /
    • pp.105-116
    • /
    • 2002
  • 이 논문에서는 철근콘크리트 장주의 극한저항력을 효과적으로 산정할 수 있는 설계 관계식이 제안되었다. 철근콘크리트 기둥의 거동은 여러 설계변수들의 영향을 받는데 특히 콘크리트의 강도, 철근비, 세장비 및 편심 등에 의해 크게 영향을 받으므로 설계식의 제안을 위해 위의 4가지 변수들을 변화시켜가며 철근콘크리트 기둥의 비선형 해석을 수행하였다. 콘크리트의 균열 등을 포함한 재료의 비선형성을 고려하기 위해 적층단면법이 사용되었으며, p-△ 효과를 구현하기 위하여 기하강성행렬이 고려되었다. 해석결과로부터 각 변수의 변화에 따른 철근콘크리트 기둥의 저항력의 변화를 비교하였으며 이를 토대로 회귀분석 모델을 제안하였다. 또한 회귀분석을 수행하여 철근콘크리트 장주의 극한저항력을 효과적으로 산정할 수 있는 회귀분석식을 제안하였고, 기존의 설계기준과 비교하여 제안식의 효율성을 검증하였다.

하이브리드 ARIMA-신경망 모델을 통한 항만물동량 예측에 관한 연구 (A study on the forecast of container traffic using hybrid ARIMA-neural network model)

  • 신창훈;강정식;박수남;이지훈
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2007년도 추계학술대회 및 제23회 정기총회
    • /
    • pp.259-260
    • /
    • 2007
  • 컨테이너항만의 물동량 예측은 항만의 계발 및 운영계획을 위해 매우 중요한 과정이다. 일반적으로 회귀분석, ARIMA 등의 통계적 방법론을 통해 많은 예측이 이뤄져왔다. 최근의 연구에서는 인공 신경망(ANN)기법을 통한 예측이 이뤄지고 있으며 기존의 선형적인 기법을 대신하고 있다. 본 연구에서는 선형모델과 비선형모델에 강점이 있는 ARIMA와 신경망 모델을 결합해 보다 효과적인 예측 모델을 개발하고자 한다. 실제 항만의 과거 자료를 통해 모델의 적합성을 측정하였고 항만의 특성에 따라 모형의 적합성이 다양하게 나타났다.

  • PDF