• 제목/요약/키워드: ranking model

검색결과 394건 처리시간 0.019초

지하매설물 중 도시가스 지하배관에 대한 위험성 서열화 분석 (Risk Ranking Analysis for the City-Gas Pipelines in the Underground Laying Facilities)

  • 고재선;김효
    • 한국화재소방학회논문지
    • /
    • 제18권1호
    • /
    • pp.54-66
    • /
    • 2004
  • 본 논문은 도시 가스 지하배관의 위험관리체계를 유지하는데 필요한 요소들 중 배관의 위험성평가에 적절한 기법을 제안하고, 그 평가결과에 근거하여 가장 비용-효과가 큰 배관 유지관리방안을 찾아내는데 그 목적이 있다. 본 연구에서 제안된 지하배관의 위험성서열화의 접근방법은 세 가지 측면에서 행하여졌는데, 첫째는 RBI(Risk Based Inspection)으로서 배관의 위험도에 영향을 주는 주변인구조건, 관의 크기 및 두께. 사용시간 등을 기준으로 일차적 평가를 함으로서 노출위험도의 높고 낮음을 정성적으로 평가하였고, 둘째는 Scoring System으로서 매설된 배관의 환경적인 요소에 기초하여 점수화하여 구체적으로 위험도를 서열화 하였다. 셋째로는 THOMAS 이론으로부터 대상배관의 누출빈도를 정량화 하였다. 그 결과 도시 가스 대상배관의 노출위험도는 대략 중간이상의 값을 갖는 것으로 나타났으며, 제안된 SPC기법을 적용하여 위험성을 평가한 결과, 대상배관의 부식위험성 점수 값이 허용범위(30-70)에 골고루 분포하는 것으로 보아 설정된 평가기준이 실제배관에 대해 상대적인 부식위험성을 잘 서열화 됨을 알 수 있었다. 또한 THOMAS모델을 적용한 평가결과로서의 Score값은 배관의 길이를 포함한 여러 치수들에 무관한 환경요인에 관련된 값인 반면, 기본누출빈도는 배관의 길이를 포함해서 다른 치수들에 비례함을 보여주고 있다. 그 결과 점수 값이 상대적으로 적은 배관구간(상대적으로 위험성이 낮은 구간)도 배관길이가 훨씬 더 크다면 누출발생빈도가 더 높은 값을 갖는다는 것을 알 수 있었다. 또한 대상 파이프라인의 허용위험수용범위는 전체 누출 빈도 값인 최대 1.00E-01/yr로부터 최소 2.50E-02의 영역을 나타내고 있어 이에 상응되는 높은 Consequence를 수용 가능한 영역으로 낮추는 조치가 필요함을 보여주고 있고, 종합파손확률에 대해 사용시간을 회기 분석법(Regression Analysis)으로 예측한 결과, 이에 대한 방정식을 유추할 수 있었고, 그에 대한 결과가 대상 파이프라인의 사용 년 수인 11년에서 13년으로 나타나 실제 대상배관들의 연령과 거의 일치함을 알 수 있었다. 따라서 본 연구에서 제안된 위험성 서열화 접근방법은 실제적으로 지하배관의 유지관리를 하는데 있어서 매우 효율적으로 적용될 수 있을 것으로 사료된다.

미국 프로농구(NBA)의 플레이오프 진출에 영향을 미치는 주요 변수 예측: 3점과 턴오버 속성을 중심으로 (Prediction of Key Variables Affecting NBA Playoffs Advancement: Focusing on 3 Points and Turnover Features)

  • 안세환;김영민
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.263-286
    • /
    • 2022
  • 본 연구는 웹 크롤링을 이용하여 1990년부터 2022년까지 총 32개년에 해당하는 NBA 통계 정보를 획득하고, 탐색적 데이터 분석을 통해 관심 변수를 관찰하고 관련된 파생변수를 생성한다. 입력 데이터에 대한 정제 과정을 거쳐 무의미한 변수들을 제거하고, 남은 변수에 대한 상관관계 분석, t 검정 및 분산분석을 수행하였다. 관심 변수에 대해 플레이오프 진출/미진출 그룹 간 평균의 차이를 검정하였고, 이를 보완하기 위해 순위를 기준으로 하는 3개 집단(상위/중위/하위) 간 평균 차이를 재확인하였다. 입력 데이터 중 올해 시즌 데이터만을 테스트 세트로 활용하였고, 모델 훈련을 위해서는 훈련 세트와 검증 세트를 분할하여 5-fold 교차검증을 수행하였다. 교차검증 결과와 시험 세트를 이용한 최종 분석 결과를 비교하여 성능 지표에서 차이가 없음을 확인함으로써 과적합 문제를 해결하였다. 원시 데이터의 품질 수준이 높고, 통계적 가정을 만족하기 때문에 적은 수준의 데이터 세트임에도 불구하고 대부분 모델에서 좋은 결과를 나타냈다. 본 연구는 단순히 머신러닝을 이용하여 NBA의 경기 결과를 예측하거나 플레이오프 진출 여부만을 분류하는 것에서 그치지 않고, 입력 특성의 중요도를 파악하여 높은 중요도를 갖는 주요 변수에 본 연구의 관심 대상 변수가 포함되는지를 확인하였다. Shap value의 시각화를 통해 특성 중요도의 결과만으로 해석할 수 없었던 한계를 극복하고, 변수의 진입/제거 과정에서 중요도 산출에 일관성이 부족하다는 점을 보완할 수 있었다. 본 연구에서 관심 대상으로 분류했던 3점 및 실책과 관련된 다수의 변수가 미국 프로농구에서의 플레이오프 진출에 영향을 미치는 주요 변수에 포함되는 것으로 나타났다. 본 연구는 기존의 스포츠 데이터 분석 분야에서 다루었던 경기 결과, 플레이오프 및 우승 예측 등의 주제를 포함하고 분석을 위해 여러 머신러닝 모델을 비교 분석했다는 점에서 유사성이 있지만, 사전에 관심 속성을 설정하고, 이를 통계적으로 검증함으로써 머신러닝 분석 결과와 비교하였다는 측면에서 차이가 있다. 또한 XAI 모델 중 하나인 SHAP를 이용하여 설명 가능한 시각화 결과를 제시함으로써 기존 연구와 차별화하였다.

스타트업의 스케일업 창업생태계 구성요소의 IPA 분석 (IPA Analysis of the Components of the Scale-up Entrepreneurial Ecosystem of Startups)

  • 윤혜미;남정민
    • 벤처창업연구
    • /
    • 제17권6호
    • /
    • pp.25-37
    • /
    • 2022
  • 본 연구는 우리나라 국가 수준에서 스케일업 창업생태계의 구성요소에 대한 중요도와 만족도(현재 수준)를 창업 후 7년 이내의 스타트업 창업자들을 대상으로 설문을 실시하고 구성요소별 스케일업 정책 방향을 IPA(importance-performance analysis) 분석을 활용하여 분석하는 데 목적이 있다. 창업생태계의 주체자인 창업자들의 인식은 창업의 양과 질에 영향을 주기 때문에 스케일업 구성요소에 대한 인식을 분석 하고 진단해 보는 연구가 필요하다. 국가 경제와 창업생태계의 발전을 위해서는 스타트업에서 스케일업, 유니콘으로 부상하는 기업들이 배출되어야 하고 이를 위해서는 스케일업 창업생태계를 위한 요소들이 필요하다. 본 연구의 주요 연구 결과는 다음과 같다. 첫째, 창업자들이 인식하는 스케일업 창업생태계 구성요소의 중요도 순위는 '성장단계별 자금 지원', '기업 맞춤형 스케일업 지원', '규제 개선', '스케일업 전용 펀드', '투자 대형화', '기술 인재 육성'순으로 나타났다. 둘째, 중요도-만족도 매트릭스에서 향후 집중적으로 개선해야 하는 요인은 '범정부 통합 추진 계획', '스케일업 전문 조직 운영', '기업 맞춤형 스케일업 지원', '규제 개선', '한국 스케일업 모델 구축'으로 나타났다. 이에 따라, 스케일업 창업생태계를 위해 다양하고 대형화된 금융자본, 사업 분야별 스케일업 프로그램의 다양화, 스타트업과 스케일업 지원의 연계, 신기술 및 신산업 분야의 규제 완화, 기업 맞춤형의 스케일업 성장 역량 강화, 해외 네트워킹 기회 제공 등을 시사점으로 도출할 수 있다. 또한 국내 스케일업 창업생태계 구성요소를 도출하고 이에 대한 인식을 진단한 연구로 정책 실무와 학술적으로 기여할 것으로 본다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.