• 제목/요약/키워드: Exponential Distribution

검색결과 833건 처리시간 0.021초

미세균열의 간격 분포를 이용한 결의 평가(IV) (Evaluation for Rock Cleavage Using Distribution of Microcrack Spacings (IV))

  • 박덕원
    • 암석학회지
    • /
    • 제26권2호
    • /
    • pp.127-141
    • /
    • 2017
  • 거창지역의 쥬라기 화강암에 대하여 결의 특성에 대한 분석을 실시하였다. 박편의 확대사진(${\times}6.7$) 및 간격-누적빈도 도표에서 도출한 미세균열의 간격과 관련된 파라미터를 통하여 여섯 방향의 결에 대한 다기준 평가를 실시하였다. 결에 대한 이들 간격의 파라미터의 대표 값에 대한 분석 결과를 요약하면 다음과 같다. 첫째로, 여섯 도표 사이의 배열순을 지시하는 주요 파라미터의 도출을 위한 분석을 수행하였다. 위의 분석을 위하여 여섯 방향의 결에 대한 5개 파라미터의 값에 대하여 증가 또는 감소하는 순으로 배열하였다. 주요 파라미터(평균 간격-중앙 간격, $S_{mean}-S_{median}$) 및 평균 간격의 값이 감소하는 순은 H1, H2, G1, G2, R1 그리고 R2 방향의 순과 상호 부합한다. 여섯 방향의 결의 이러한 순차적인 배열은 간격과 관련된 여섯 도표의 순차적인 배열에 대한 근거를 제공할 수 있다. 둘째로, 위의 주요 파라미터 그리고 다양한 파라미터 사이의 9개 상관도를 상관계수($R^2$)가 감소하는 순으로 배열하였다. 이들 관련도는 공통적으로 멱법칙함수의 높은 상관성을 보여 준다. 평균 간격, 밀도 및 선 oa의 길이의 값은 주요 파라미터의 값과 정비례하지만, 반면에 상수(a), 지수(${\lambda}$), 간격의 빈도수(N), 선 oa'의 길이, 지수 직선의 기울기(${\theta}$) 및 총 길이($1mm{\geq}$)는 반비례한다. 셋째로, 3개 면에 대한 파라미터의 값 그리고 3개 결에 대한 파라미터의 값 사이의 상관성 분석의 결과는 다음과 같다. 3개 면 및 3개 결에 대한 빈도수, 총 간격, 상수, 지수, 기울기, 선 oa' 길이의 값은 R' < G' < H' 및 H < G < R의 순을 각각 보여 준다. 반면에, 3개 면 및 3개 결에 대한 평균 간격, (평균 간격 - 중앙 간격), 밀도 및 선 oa의 길이의 값은 H' < G' < R' 및 R < G < H의 순을 각각 보여 준다. 3개 결 및 3개 면 사이의 파라미터의 값의 상호 역순의 상관성이 도출될 수 있다. 이러한 유형의 상관성 분석은 3개 채석면의 판별에 유용하다.

분리학습 모델을 이용한 수출액 예측 및 수출 유망국가 추천 (Export Prediction Using Separated Learning Method and Recommendation of Potential Export Countries)

  • 장영진;원종관;이채록
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.69-88
    • /
    • 2022
  • 최근 코로나19 팬데믹으로 인해 전 세계 경제와 외교 상황에 급격한 변화가 일어나고 있으며, 수출 의존도가 높은 한국은 이러한 변화에 큰 영향을 받고 있다. 본 연구에서는 기업의 수출전략 수립 및 의사결정 지원을 위해 차년도 수출액 예측 모델을 구축하고, 모델의 예측 결과를 바탕으로 수출 유망국가 추천 방식을 제안한다. 본 연구에서는 모델이 다양한 정보를 학습할 수 있도록 국가별, 품목별, 거시경제 변수 등 선행 연구에서 중요하게 사용된 변수를 다방면으로 수집하였다. 수집한 데이터를 분석한 결과, 국가와 품목에 따라서 수출액의 분포가 매우 비대칭적인 것을 확인할 수 있었다. 따라서, 모델의 예측 성능을 향상시키고 설명력을 확보하기 위해서 분리학습 방식을 사용하였다. 분리학습은 전체 데이터를 동질적인 하위 그룹으로 분리하고 개별 모델을 구축하는 방식으로, 본 연구에서는 수출액을 기준으로 5개 구간으로 데이터를 분리하였다. 모델 학습 과정에서 구간별 특성을 반영하여 구간1부터 구간4까지는 LightGBM을 사용하고, 구간5는 지수이동평균을 사용하였으며 이를 통해 모델의 예측 성능을 향상시킬 수 있었다. 모델의 설명력 확보를 위해서 추가로 구간별 모델의 SHAP-value를 계산하고 중요도가 높은 변수를 제시했다. 또한, 본 연구에서는 예측 모델을 기반으로 2단계 수출 유망국가 추천 방식을 제안했다. 효율적인 수출 전략 수립을 위해서 BCG 매트릭스와 국가별 점수 산출 방식을 사용하였고, 품목별 유망 국가 순위와 수출 관련 주요 정보들을 제공하였다. 본 연구는 다양한 정보를 학습한 머신러닝 모델로 여러 국가와 품목에 대한 예측을 실시하고, 이 과정에서 분리학습 방식으로 예측 성능을 향상시켰다는 점에서 의의가 있다. 또한, 현재 무역 관련 서비스들이 과거 데이터에 기반한 정보를 제공하고 있음을 고려할 때, 본 연구에서 제안한 예측 모델과 유망국가 추천 방식은 기업들의 미래 수출 전략 수립 및 동향 파악에 유용하게 사용될 수 있을 것으로 기대된다.

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.