• 제목/요약/키워드: Random Variables

검색결과 1,684건 처리시간 0.035초

국내 식물 형태 연구에 사용된 다변량분석 논문에 대한 재고 (A Review of Multivariate Analysis Studies Applied for Plant Morphology in Korea)

  • 장계선;오하나;김휘;이흥수;장진성
    • 한국산림과학회지
    • /
    • 제98권3호
    • /
    • pp.215-224
    • /
    • 2009
  • 최근 10여년간(1997-2008년) 국내 식물 형태관련 연구논문중 주요 3개 학회지(한국임학회지, 한국식물분류학회지, 한국육종학회지)와 기타학회지(한국자원식물학회지, 생명과학학회지, 약용작물학회지, 한국양봉학회지, 원예과학기술지, 원예학회지) 등에 발표된 다변량 분석 54개 논문을 재검토하였다. 이들 논문에서 주성분 분석(PCA), 유집분석(CA)이 가장 많이 사용되었는데 본 연구는 이와 관련된 분석방법과 기초 통계 분석의 문제점을 검토하였다. 주성분 분석의 문제점은 기존 표본에 추출과 자료의 정규분포성에 대한 가설을 무시하는 것으로서 분산과 공분산을 구할 수 없는 정성형질을 섞어 사용하여 주성분 분석의 결과를 왜곡하여 분석하는 것이었다. 또한, 유집분석은 분석방법론에 따라 상당한 차이를 보여 정량적 형질 보다는 정성적 형질로 계수화하여 분석함을 권장하지만 대부분 정량적 형질로 분석하여 실제 상호 분석 대상군 간의 관계가 형성되지 않는 계단상 모양을 보였다. 또한, 일부 연구논문에서는 통계적 가설을 무시하고 임의로 자료를 해석하는 것도 자주 발견되는 문제점 중 하나였다. 주성분분석에서 주의해야 할 점은 주로 정량적 형질 사용이 권장되며, 이외 일정 수 이상의 변량(20여개 이상)과 적절한 개체수(40-50개 이상)가 필요하다는 것이다. 유집분석(혹은 군집분석)은 분석 대상을 강제로 유집시키는 성향이 있어 통계적 검증 방법을 사용하지 않고 단순히 거리 계산법 혹은 알고리즘 분석 방법에 의해 결과에 상당한 차이를 보이기 때문에 정량적 형질만을 근간으로 한 유집분석은 자제할 필요가 있다. 모든 자료를 쉽게 분석하기 위해서 단순히 통계적 방법론에 의존하기 보다는 연구목적과 일치한 분석 방법론을 적용하고자 하는 노력이 필수적이다.

다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 미치는 영향 연구 (The Effect of Meta-Features of Multiclass Datasets on the Performance of Classification Algorithms)

  • 김정훈;김민용;권오병
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.23-45
    • /
    • 2020
  • 기업의 경쟁력 확보를 위해 판별 알고리즘을 활용한 의사결정 역량제고가 필요하다. 하지만 대부분 특정 문제영역에는 적합한 판별 알고리즘이 어떤 것인지에 대한 지식은 많지 않아 대부분 시행착오 형식으로 최적 알고리즘을 탐색한다. 즉, 데이터셋의 특성에 따라 어떠한 분류알고리즘을 채택하는 것이 적합한지를 판단하는 것은 전문성과 노력이 소요되는 과업이었다. 이는 메타특징(Meta-Feature)으로 불리는 데이터셋의 특성과 판별 알고리즘 성능과의 연관성에 대한 연구가 아직 충분히 이루어지지 않았기 때문이며, 더구나 다중 클래스(Multi-Class)의 특성을 반영하는 메타특징에 대한 연구 또한 거의 이루어진 바 없다. 이에 본 연구의 목적은 다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 유의한 영향을 미치는지에 대한 실증 분석을 하는 것이다. 이를 위해 본 연구에서는 다중 클래스 데이터셋의 메타특징을 데이터셋의 구조와 데이터셋의 복잡도라는 두 요인으로 분류하고, 그 안에서 총 7가지 대표 메타특징을 선택하였다. 또한, 본 연구에서는 기존 연구에서 사용하던 IR(Imbalanced Ratio) 대신 시장집중도 측정 지표인 허핀달-허쉬만 지수(Herfindahl-Hirschman Index, HHI)를 메타특징에 포함하였으며, 역ReLU 실루엣 점수(Reverse ReLU Silhouette Score)도 새롭게 제안하였다. UCI Machine Learning Repository에서 제공하는 복수의 벤치마크 데이터셋으로 다양한 변환 데이터셋을 생성한 후에 대표적인 여러 판별 알고리즘에 적용하여 성능 비교 및 가설 검증을 수행하였다. 그 결과 대부분의 메타특징과 판별 성능 사이의 유의한 관련성이 확인되었으며, 일부 예외적인 부분에 대한 고찰을 하였다. 본 연구의 실험 결과는 향후 메타특징에 따른 분류알고리즘 추천 시스템에 활용할 것이다.

세가지 도축 종료 시점을 공변량으로 하는 한우 도체형질에 대한 유전능력 분석모형 (Genetic Analysis of Carcass Traits in Hanwoo with Different Slaughter End-points)

  • 최연호;윤호백;최성복;정흥우
    • Journal of Animal Science and Technology
    • /
    • 제47권5호
    • /
    • pp.703-710
    • /
    • 2005
  • 한우의 성장과 도체형질에 대한 유전능력 평가모형을 개발하기 위해 4가지 공분산 모형을 적용하여 후대검정에 공시된 수소와 거세 수소의 자료에 대한 표현형 및 유전자형에 대한 분산-공분산을 추정하였다. 4가지 모형은 검정소와 검정차수로 구분한 동기그룹의 고정효과와 임의효과인 종모우 효과로 구성된 부계 반형매 모형을 적용하였다. 도체형질에 대해서는 4가지 공변량을 추가하였는데 모형 1에는 도축일령의 1차식효과를, 모형 2에는 도축연령의 1차와 2차식 효과를 사용하였고, 모형 3에는 절식체중을 모형 4에는 등지방두께를 각기 1차식 공변량으로 사용하였다. 도축일령의 2차식 효과는 유의적이지 않았으나 도축일령에 대한 회귀로 인하여 4개 도체형질에 대한 유전 분산-공분산 성분에 큰 차이를 보였다. 도축 일령을 공변량으로 하였을 때 등지방 두께, 등심단면적, 도체중, 근내지방도와 도체율에 대한 유전력은 각기 0.34, 0.22, 0.24, 0.42, 0.18로 추정되었다. 도체중과 다른 도체형질간에는 정(+)의 유전상관을 보였으나, 등지방 두께와 등심단면적, 그리고 근내지방도와 도체율 간에는 낮은 부(-)의 유전상관을 보였다. 절식체중에 대한 회귀는 도체중에 대한 유전분산과 타 도체형질과의 유전 공분산을 감소시켰으며, 등지방 두께에 대한 회귀는 등심단면적에 대한 유전분산과 등심단면적과 도체중 간의 유전 공분산을 증가시켰다. 절식체중이나 등지방두께를 공변량으로 한 모형으로부터 추정된 분산-공분산 성분은 도축 일령을 공변량으로 했을 때와 상이한 구조를 보였는데, 이들 두 가지 공변량은 골격-근육-지방조직으로 구성되는 신체 부분적 발달 정도와 관련이 있는 것으로 판단된다.

다중모형조합기법을 이용한 상품추천시스템 (Product Recommender Systems using Multi-Model Ensemble Techniques)

  • 이연정;김경재
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.39-54
    • /
    • 2013
  • 전자상거래의 폭발적 증가는 소비자에게 더 유리한 많은 구매 선택의 기회를 제공한다. 이러한 상황에서 자신의 구매의사결정에 대한 확신이 부족한 소비자들은 의사결정 절차를 간소화하고 효과적인 의사결정을 위해 추천을 받아들인다. 온라인 상점의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 그러나 사용자의 기호를 제대로 반영하지 못하는 추천시스템은 사용자의 실망과 시간낭비를 발생시킨다. 본 연구에서는 정확한 사용자의 기호 반영을 통한 추천기법의 정교화를 위해 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 본 연구에서 제안하는 모형은 크게 두 개의 단계로 이루어져 있으며, 첫 번째 단계에서는 상품군 별 우량고객 선정 규칙을 도출하기 위해서 로지스틱 회귀분석 모형, 의사결정나무 모형, 인공신경망 모형을 구축한 후 다중모형조합기법인 Bagging과 Bumping의 개념을 이용하여 세 가지 모형의 결과를 조합한다. 두 번째 단계에서는 상품군 별 연관관계에 관한 규칙을 추출하기 위하여 장바구니분석을 활용한다. 상기의 두 단계를 통하여 상품군 별로 구매가능성이 높은 우량고객을 선정하여 그 고객에게 관심을 가질만한 같은 상품군 또는 다른 상품군 내의 다른 상품을 추천하게 된다. 제안하는 상품추천시스템은 실제 운영 중인 온라인 상점인 'I아트샵'의 데이터를 이용하여 프로토타입을 구축하였고 실제 소비자에 대한 적용가능성을 확인하였다. 제안하는 모형의 유용성을 검증하기 위하여 제안 상품추천시스템의 추천과 임의 추천을 통한 추천의 결과를 사용자에게 제시하고 제안된 추천에 대한 만족도를 조사한 후 대응표본 T검정을 수행하였으며, 그 결과 사용자의 만족도를 유의하게 향상시키는 것으로 나타났다.

반응표면분석법을 활용한 Glabridin 함유 나노에멀젼의 피부흡수 향상을 위한 제형 최적화 연구 (A Study on Formulation Optimization for Improving Skin Absorption of Glabridin-Containing Nanoemulsion Using Response Surface Methodology)

  • 김세연;김원형;윤경섭
    • 대한화장품학회지
    • /
    • 제49권3호
    • /
    • pp.231-245
    • /
    • 2023
  • 화장품 업계에서는 미백, 주름, 항산화, 항노화 등 기능성 화장품의 신소재 개발과 더불어 실제로 피부에 적용 시 피부흡수율을 높이는 기술이 중요하다. 이에 본 연구에서는 실험설계법인 반응표면분석법(RSM)을 활용하여 나노에멀젼 제형을 최적화하고자 하였다. Glabridin을 활성성분으로 하여 고압유화 방법으로 나노에멀젼을 제조하였으며, 최종적으로 최적화한 나노에멀젼의 피부흡수율을 평가하였다. RSM 인자로서 계면활성제 함량, 콜레스테롤 함량, 오일 함량, 폴리올 함량, 고압유화 압력, 고압유화 횟수를 달리하여 나노에멀젼을 제조하였다. 그 중 입자 크기에 가장 큰 영향을 미치는 인자인 계면활성제 함량, 오일 함량, 고압유화 압력, 고압유화 횟수를 독립변수로 하였고, 나노에멀젼의 입자 크기와 피부흡수율을 반응변수로 하였다. 중심점 5 회 반복실험을 포함하여 총 29 회 실험이 무작위로 수행되었으며, 제조된 나노에멀젼의 입자 크기와 피부흡수율을 측정하였다. 그 결과를 바탕으로 최소 입자 크기, 최대 피부흡수율을 갖는 제형을 최적화하였으며, 계면활성제 함량 5.0 wt%. 오일 함량 2.0 wt%, 고압유화 압력 1,000 bar, 고압유화 횟수 4 pass를 최적 조건으로 도출하였다. 최적 조건으로 제조한 나노에멀젼의 물성으로 입자 크기는 111.6 ± 0.2 nm, 다분산지수는 0.247 ± 0.014, 제타전위는 -56.7 ± 1.2 mV로 측정되었다. 나노에멀젼과 일반 에멀젼 피부흡수 시험 결과, 24 h 후 나노에멀젼의 누적 투과량은 79.53 ± 0.23%이며, 대조군으로서 에멀젼의 누적 투과량은 66.54 ± 1.45%로 나노에멀젼이 에멀젼보다 13% 높았다.

벤처기업정밀실태조사와 한국기업혁신조사 데이터를 활용한 통계적 매칭의 타당성 검증 (The Validity Test of Statistical Matching Simulation Using the Data of Korea Venture Firms and Korea Innovation Survey)

  • 안경민;이영찬
    • 지식경영연구
    • /
    • 제24권1호
    • /
    • pp.245-271
    • /
    • 2023
  • 최근 데이터 경제가 가속화되면서 경영학 분야에서는 데이터 매칭이라는 새로운 기법이 주목받고 있다. 데이터 매칭은 모집단이 같지만 서로 다른 표본에서 수집된 데이터셋을 합치는 기법 또는 처리 과정을 의미한다. 그중에서 통계적 매칭은 서로 다른 데이터를 결합하는데 있어서 사업자 번호와 같이 기준이 되는 변수가 없는 경우 통계적 함수를 활용하여 데이터를 매칭하는 방법이다. 선행연구 검토결과 경제학, 교육학, 보건, 의료 등 다양한 분야에서 통계적 매칭이 많이 사용되고 있는데 반해 경영학 분야는 제한적임을 확인할 수 있었다. 본 연구는 기존 경영학 분야에서 충분히 연구되지 않았던 통계적 매칭의 유용성을 검증하고 활용도를 높이는 방안을 연구하고자 한다. 연구목적을 달성하기 위해 본 연구에서는 2020 벤처기업정밀실태조사와 2020 한국기업혁신조사 자료를 활용하여 통계적 매칭 시뮬레이션을 수행하였다. 먼저, 선행연구를 바탕으로 통계적 매칭에 사용되는 변수를 선정하였다. 공통변수는 업종, 종업원수, 지역, 업력, 상장시장, 매출로 설정하였고, 검증을 위한 고유변수와 제공변수는 중소기업 혁신에서 가장 중요한 연구인력 비율과 R&D 비용으로 각각 설정하였다. 사전 검증을 위해 2020 벤처기업정밀실태조사 자료를 수여자 데이터 30%와 기여자 데이터 70%로 분할하였다. 통계적 매칭에는 마할라노비스 거리와 랜덤 핫덱을 결합한 방식을 사용하였고, 성능평가는 수여자 데이터와 원시 데이터의 평균값 비교와 커널 밀도 함수(Kernel Density Estimation)를 통해 데이터 분포를 비교하였다. 검증결과, 수여자 데이터 30%와 기여자 데이터 70%에서 추출된 매칭 데이터의 평균값이 통계적으로 유의한 차이가 없는 것으로 나타나 유사한 데이터가 매칭된다는 것을 확인하였다. 또한, 두 데이터의 커널 밀도 함수로 도출한 데이터 분포 역시 유사한 형태가 나타나는 것을 확인할 수 있었다. 사후 검증에는 2020 벤처기업정밀실태조사에서 임의로 30%를 수여자 데이터로 추출하고 2020 한국기업혁신조사 자료를 기여자 데이터로 설정하여 통계적 매칭을 수행하고 검증하였다. 사전 검증과 마찬가지로 공통변수는 업종, 종업원수, 지역, 업력, 상장시장, 매출로 설정하였고, 검증을 위한 고유변수는 연구 인력 비율과 R&D 비용으로 정의하였다. 분석 결과, 수여자 데이터의 연구인력 비율의 평균과 기여자 데이터의 평균은 예상과 다르게 통계적으로 차이가 있는 것으로 나타났다. 하지만 커널 밀도 함수에 따른 두 데이터의 분포는 유사한 형태를 보이는 것으로 조사되어 통계적 매칭의 적절성을 확인할 수 있었다. R&D 비용은 통계적 매칭 수행 결과, 수여자 데이터의 R&D 비용 평균과 기여자 데이터의 평균이 통계적으로 차이가 없었고, 커널 밀도 함수도 유사한 분포를 보이는 것으로 조사되었다. 이러한 결과는 모집단은 동일하지만 서로 다른 표본에서 수집된 자료를 통계적으로 결합하여 신뢰할 수 있는 새로운 데이터를 확보할 수 있다는 측면에서 큰 의의가 있다. 또한, 경영학 분야에서 많이 사용되지 않았던 데이터 매칭 방법론을 모의실험을 통해 타당성을 검증함으로써 연구용 데이터 확보와 연구방법론의 확장에 기여했다는 점에서 시사점을 가진다.

머신러닝 기법을 이용한 재해강도 분류모형 개발 (Development of disaster severity classification model using machine learning technique)

  • 이승민;백선욱;이준학;김경탁;김수전;김형수
    • 한국수자원학회논문집
    • /
    • 제56권4호
    • /
    • pp.261-272
    • /
    • 2023
  • 최근 급격한 도시화와 기후변화에 따라 재난에 의한 피해가 증가하고 있다. 국내 기상청에서는 표준 경보(주의보, 경보)를 전국적으로 통일된 표준 경보 기준(3시간 및 12시간 최대 누적강우량)에 따라 발령하여 재해에 따른 지역별, 재난 사상별 특성이 고려되지 않은 문제점이 있다. 따라서 본 연구에서는 서울특별시, 인천광역시, 경기도의 호우·태풍에 대한 재해 피해액 및 누적강우량을 활용하여 대상지역별 재해강도에 따른 단계별 기준을 설정하고, 강우에 따라 발생할 수 있는 재해의 강도를 분류하는 모형을 개발하고자 하였다. 즉, 본 연구에서는 호우·태풍에 의한 재해 피해액 누적 분포 함수의 분위별로 재해강도의 범주(관심, 주의, 경계, 심각 단계)를 분류하였고, 재해강도의 범주에 따른 누적강우량 기준을 대상 지자체별로 제시하였다. 그리고 지자체별 재해강도 분류모형 개발을 위해 4가지(의사결정나무, 서포트 벡터 머신, 랜덤 포레스트, XGBoost)의 머신러닝 모형을 활용하였는데 강우량, 누적강우량, 지속시간 최대 강우량(3시간, 12시간), 선행강우량을 독립변수로 이용하여 종속변수인 지자체별 재해강도를 분류하였다. 각 모형별 F1 점수를 이용한 정확도 평가 결과, 의사결정나무의 F1 점수가 0.56으로 가장 우수한 정확도를 보였다. 본 연구에서 제시한 머신러닝 기반 재해강도 분류모형을 활용하면 호우·태풍에 의한 재해에 대한 지자체별 위험 상태를 단계별로 파악할 수 있어, 재난 담당자들의 신속한 의사결정을 위한 기초 자료로 활용될 수 있을 것으로 판단된다.

중소기업의 스마트팩토리 도입의도에 영향을 미치는 요인에 관한 연구 - 정부지원기대와 과업기술적합도를 포함하여 (Factors Affecting Intention to Introduce Smart Factory in SMEs - Including Government Assistance Expectancy and Task Technology Fit -)

  • 김정래
    • 벤처혁신연구
    • /
    • 제3권2호
    • /
    • pp.41-76
    • /
    • 2020
  • 본 연구는 스마트팩토리 도입의도에 영향을 미치는 요인을 실증 분석을 통해 확인하였다. 4차산업혁명의 핵심분야인 스마트팩토리 도입에 있어서 어떤 요인이 중요하게 영향을 미치는가에 대한 연구이며, 아직까지 스마트팩토리 분야에서 기술 수용에 관한 연구가 부족한 상황에서 학술적 실무적 의의가 있다고 믿는다. 정보기술의 수용요인 연구에 설명력이 검증된 통합기술수용이론(UTAUT)을 기반으로 연구를 진행하였으며, UTAUT 이론의 4가지 독립변수인 성과기대, 노력기대, 사회적영향, 촉진조건에 추가로 스마트팩토리의 특성상 중요한 요인으로 예상되는 정부지원기대(Government Assistance Expectancy)를 독립변수에 추가하였다. 또한 스마트팩토리 기술수용의 기술적인 요인을 확인하고자 과업기술적합도(Task Technology Fit)변수 추가하여 스마트팩토리 도입의도에 미치는 영향관계를 실증 분석하였다. 또한 과업기술적합도의 선행변수인 과업특성(Task Characteristics)과 기술특성(Technology Characteristics)이 과업기술적합도에 어떠한 영향을 미치는지에 대한 분석도 진행하였다. 새로운 기술에 대한 신뢰(Trust)의 정도가 기술의 수용에 있어 매우 중요한 영향을 미칠 것으로 예상되어 신뢰를 매개변수로 추가하였다. 마지막으로 새로운 정보기술에 의한 혁신이 사용자에게 불가피하게 거부감을 야기할 수 있다는 선행연구들을 토대로 혁신저항(Innovation Resistance)을 조절역할을 하는 연구변수에 추가하여 실증적 검증을 진행하였다. 연구 결과 성과기대, 사회적 영향, 정부지원기대, 과업기술적합도는 스마트팩토리 도입의도에 정(+)의 영향을 미쳤다. 영향력의 크기는 정부지원기대(β=.487) > 과업기술적합도(β=.218) > 성과기대(β=.205) > 사회적영향(β=.204) 순으로 나타났다. 과업특성과 기술특성은 모두 과업기술적합도에 정(+)의 영향이 확인되었으며, 과업특성(β=.559)이 기술특성(β=.328)보다 과업기술적합도에 더 영향이 큰 것으로 나타났다. 신뢰에 대한 매개 효과 검정에서 6개 독립변수 각각과 스마트팩토리 도입의도 간에 신뢰의 통계적으로 유의미한 매개역할은 확인되지 않았다. 혁신저항의 조절효과 검정을 통해, 혁신저항이 정부지원기대와 스마트팩토리 도입의도 간 정(+)의 조절역할을 하는 것으로 나타났다. 즉 혁신저항이 크면 클수록 정부지원기대가 스마트팩토리 도입의도에 미치는 영향력이 혁신저항이 적은 경우보다 커지는 것으로 나타났다.

GOCI-II 대기상한 반사도와 기계학습을 이용한 남한 지역 시간별 에어로졸 광학 두께 산출 (Retrieval of Hourly Aerosol Optical Depth Using Top-of-Atmosphere Reflectance from GOCI-II and Machine Learning over South Korea)

  • 양세영;최현영;임정호
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.933-948
    • /
    • 2023
  • 대기 중 에어로졸은 인체에 악영향을 끼칠 뿐 아니라 기후 시스템에도 직간접적인 영향을 미치므로 에어로졸의 특성과 시공간적인 분포에 대한 이해는 매우 중요하다. 이를 위해 위성기반 관측을 통해 에어로졸 광학 두께(Aerosol Optical Depth, AOD)를 산출하여 에어로졸을 모니터링하는 다양한 연구가 수행되어 왔다. 하지만 이는 주로 조견표를 활용한 역 산출 알고리즘에 기반하여 이루어지기 때문에 많은 계산량을 요구하며 불확실성이 존재한다. 따라서, 본 연구에서는 Geostationary Ocean Color Imager-II (GOCI-II)의 대기상한반사도와 30일 동안의 대기상한반사도 중 최솟값과 관측 시점 값의 차이 값, 수치 모델 기반 기상학적 변수 등을 활용하여 기계학습 기반 고해상도 AOD 직접 산출 알고리즘을 개발하였다. Light Gradient Boosting Machine (LGBM) 기법이 사용되었으며, 추정된 결과는 지상 관측 자료인 Aerosol Robotic Network (AERONET) AOD를 활용하여 랜덤, 시간 및 공간별 N-fold 교차검증을 통해 검증되었다. 세 가지 교차검증 결과 R2=0.70-0.80, RMSE=0.08-0.09, 기대오차(Expected Error, EE) 안에 있는 비율은 75.2-85.1% 수준으로 안정적인 성능을 보였다. Shapley Additive exPlanations (SHAP) 분석에서는 반사도 관련 변수들이 기여도의 상위권 대부분을 차지하고 있는 것을 통해 반사도 자료가 AOD 추정에 많은 기여를 하는 것을 확인하였다. 서울과 울산 지역에 대한 시간 별 AOD의 공간 분포를 분석한 결과, 개발된 LGBM 모델은 시간의 흐름에 따라 AERONET AOD 값과 유사한 수준으로 AOD를 추정하고 있었다. 이를 통해 높은 시공간 해상도(i.e., 시간별, 250 m)에서의 AOD 산출이 가능함을 확인하였다. 또한, 산출 커버리지 비교에서 LGBM 모델의 평균 산출 빈도가 GOCI-II L2 AOD 산출물 대비 8.8%가량 증가한 것을 통해 기존 물리모델기반 AOD 산출 과정에서 발생하던 밝은 지표면에 대한 과도한 마스킹의 문제점을 개선시킨 것을 확인하였다.

집중형센터를 가진 역물류네트워크 평가 : 혼합형 유전알고리즘 접근법 (Evaluating Reverse Logistics Networks with Centralized Centers : Hybrid Genetic Algorithm Approach)

  • 윤영수
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.55-79
    • /
    • 2013
  • 본 연구에서는 집중형 센터를 가진 역물류네트워크(Reverse logistics network with centralized centers : RLNCC)를 효율적을 해결하기 위한 혼합형 유전알고리즘(Hybrid genetic algorithm : HGA) 접근법을 제안한다. 제안된 HGA에서는 유전알고리즘(Genetic algorithm : GA)이 주요한 알고리즘으로 사용되며, GA 실행을 위해 0 혹은 1의 값을 가질 수 있는 새로운 비트스트링 표현구조(Bit-string representation scheme), Gen and Chang(1997)이 제안한 확장샘플링공간에서의 우수해 선택전략(Elitist strategy in enlarged sampling space) 2점 교차변이 연산자(Two-point crossover operator), 랜덤 돌연변이 연산자(Random mutation operator)가 사용된다. 또한 HGA에서는 혼합형 개념 적용을 위해 Michalewicz(1994)가 제안한 반복적언덕오르기법(Iterative hill climbing method : IHCM)이 사용된다. IHCM은 지역적 탐색기법(Local search technique) 중의 하나로서 GA탐색과정에 의해 수렴된 탐색공간에 대해 정밀하게 탐색을 실시한다. RLNCC는 역물류 네트워크에서 수집센터(Collection center), 재제조센터(Remanufacturing center), 재분배센터(Redistribution center), 2차 시장(Secondary market)으로 구성되며, 이들 각 센터 및 2차 시장들 중에서 하나의 센터 및 2차 시장만 개설되는 형태를 가지고 있다. 이러한 형태의 RLNCC는 혼합정수계획법(Mixed integer programming : MIP)모델로 표현되며, MIP 모델은 수송비용, 고정비용, 제품처리비용의 총합을 최소화하는 목적함수를 가지고 있다. 수송비용은 각 센터와 2차 시장 간에 제품수송에서 발생하는 비용을 의미하며, 고정비용은 각 센터 및 2차 시장의 개설여부에 따라 결정된다. 예를 들어 만일 세 개의 수집센터(수집센터 1, 2, 3의 개설비용이 각각 10.5, 12.1, 8.9)가 고려되고, 이 중에서 수집센터 1이 개설되고, 나머지 수집센터 2, 3은 개설되지 않을 경우, 전체고정비용은 10.5가 된다. 제품처리비용은 고객으로부터 회수된 제품을 각 센터 및 2차 시장에서 처리할 경우에 발생되는 비용을 의미한다. 수치실험에서는 본 연구에서 제안된 HGA접근법과 Yun(2013)의 연구에서 제안한 GA접근법이 다양한 수행도 평가 척도에 의해 서로 비교, 분석된다. Yun(2013)이 제안한 GA는 HGA에서 사용되는 IHCM과 같은 지역적탐색기법을 가지지 않는 접근법이다. 이들 두 접근법에서 동일한 조건의 실험을 위해 총세대수 : 10,000, 집단의 크기 : 20, 교차변이 확률 : 0.5, 돌연변이 확률 : 0.1, IHCM을 위한 탐색범위 : 2.0이 사용되며, 탐색의 랜덤성을 제거하기 위해 총 20번의 반복실행이 이루어 졌다. 사례로 제시된 두 가지 형태의 RLNCC에 대해 GA와 HGA가 각각 실행되었으며, 그 실험결과는 본 연구에서 제안된 HGA가 기존의 접근법인 GA보다 더 우수하다는 것이 증명되었다. 다만 본 연구에서는 비교적 규모가 작은 RLNCC만을 고려하였기에 추후 연구에서는 보다 규모가 큰 RLNCC에 대해 비교분석이 이루어 져야 할 것이다.