• 제목/요약/키워드: 확률론

검색결과 1,461건 처리시간 0.026초

데이터 마이닝을 이용한 고혈압환자의 당뇨질환 동반에 관한 데이터 질 관리 알고리즘 개발 (Developing data quality management algorithm for Hypertension Patients accompanied with Diabetes Mellitus By Data Mining)

  • 황규연;이은숙;김고원;홍성옥;박정선;곽미숙;이예진;임채혁;박태현;박종호;강성홍
    • 디지털융복합연구
    • /
    • 제14권7호
    • /
    • pp.309-319
    • /
    • 2016
  • 보건의료데이터의 질적 수준을 향상시키기 위해서는 데이터 질 관리 알고리즘을 개발할 필요성이 있다. 이에 본 연구에서는 질환의 유병률, 입원율이 높은 고혈압 환자의 당뇨질환 동반에 관련된 데이터 질 관리 알고리즘을 개발하고자 하였다. 이를 위해 2011년, 2012년 퇴원손상심층조사 자료 중 고혈압 환자 61,199건을 추출하여 분석대상으로 하였다. 데이터 마이닝의 대화식 의사결정나무 방법과 Outlier Detection 방법론을 통해 데이터 질 관리 알고리즘 개발한 결과 고혈압 환자가 당뇨병을 동반상병으로 가지는데 영향을 미치는 요인으로는 성별, 연령, 당뇨병성 사구체 장애, 당뇨병성 망막병증, 당병성 다발성 신경병증 등이 있었다. 의사결정나무 결과에 따라 당뇨병을 동반상병으로 가질 확률 값이 80% 이상이거나, 20% 이하인 집단을 Outlier(극단치)로 정의하고, 고혈압 환자의 당뇨 동반에 대한 극단치를 가지는 6개 집단을 발견하였다. 이와 같이 Outlier(극단치) 집단에 포함되는 실제 데이터를 확인하여 데이터의 질적 수준을 향상 시킬 필요가 있다.

통계와 시각화를 결합한 데이터 분석: 예측모형 대한 시각화 검증 (Data analysis by Integrating statistics and visualization: Visual verification for the prediction model)

  • 문성민;이경원
    • 디자인융복합연구
    • /
    • 제15권6호
    • /
    • pp.195-214
    • /
    • 2016
  • 예측 분석은 패턴인식(Pattern recognition) 혹은 기계학습(Machine learning)으로 불리는 확률적 학습 알고리즘을 기반으로 하기 때문에 사용자가 분석 과정에 개입하여 더 많은 정보를 얻어내기 위해서는 높은 통계적 지식수준이 요구된다. 또한 사용자는 분석 결과외의 다른 정보를 확인 할 수 없고 데이터의 특성 변화와 데이터 하나하나의 특징을 파악하기 힘들다는 단점이 있다. 본 연구는 이러한 예측분석의 단점을 보완하고자 통계적인 데이터 분석 방법과 시각화 분석 방법을 결합하여 데이터 분석을 진행하였으며 통계적인 분석 방법만을 진행 할 경우 발생하는 단점을 보완하고 데이터에서 더 많은 정보를 도출해 내기 위한 방법론을 제시 하고자하였다. 이를 위해 본 연구는 영화 리뷰에서 추출한 감정 어휘가 독립변인이고 영화의 흥행 값이 종속변인인 데이터를 예제 데이터로 활용하여 진행하였다. 본 연구의 연구 방법론을 적용하였을 때의 이점은 다음과 같다. 첫째, 의사결정나무 분석에서 제시된 분할 기준이 적용될 때 마다 변하는 데이터의 패턴을 파악할 수 있다. 둘째, 제시된 최종 예측모형에 포함된 데이터들의 특성을 확인 할 수 있다. 본 연구의 시사점은 예측모형의 단점을 보완하고 데이터로부터 더 많은 정보를 추출하기 위해 통계적인 데이터 분석과 시각적인 데이터 분석을 결합하여 시행하였다는 것이다. 통계적인 분석 방법을 통해 각 변수의 관계를 파악하고 높은 예측 값을 가지는 모형을 도출하였으며, 시각화 분석에서는 인터랙션 기능을 제공함으로서 통계적으로 제시된 예측모형을 검증하고 더 다양한 정보를 도출 할 수 있게 하였다.

교통사고잦은곳 발생분포를 활용한 개선사업 구간선정 방안 (Identification Method for Hazardous Road Sections Based on Black Spot Distribution)

  • 김상옥;안성채;최기주;장일준
    • 대한교통학회지
    • /
    • 제26권3호
    • /
    • pp.67-74
    • /
    • 2008
  • 현재 시행 중인 지점단위 사고잦은곳 개선사업은 매년 효율성이 저하되고 있으나, 효율성 제고방안으로 제기되고 있는 구간단위 개선사업은 방법론에 있어 아직까지 구체적인 방안이 제시되지 못하고 있는 실정이다. 이에 본 연구는 일반국도를 대상으로 개선사업 및 미개선사업 지점으로 부터 사업 차년도 신규 사고잦은곳에 이르는 거리자료를 분석하여, 적정 개선사업 구간길이 및 구간설정 방안을 제시하고자 하였다. 거리자료 분석결과, 개선사업을 실시한 교차로로부터 2Km 내 신규 사고잦은곳이 발생할 확률이 미개선 교차로 지점에 비해 높은 것으로 나타났으나 개선사업 내역별 거리분포 차이는 미미한 것으로 나타났다. 최종적으로, 상호 인접거리가 2km내에 있는 일련의 사고잦은곳을 포함하는 구간을 개선사업 후보구간으로 선정하는 방안을 제시하였다.

불확실성하에서의 확률적 기법에 의한 판매 및 실행 계획 최적화 방법론 : 서비스 산업 (Optimization Methodology for Sales and Operations Planning by Stochastic Programming under Uncertainty : A Case Study in Service Industry)

  • 황선민;송상화
    • 산업경영시스템학회지
    • /
    • 제39권4호
    • /
    • pp.137-146
    • /
    • 2016
  • In recent years, business environment is faced with multi uncertainty that have not been suffered in the past. As supply chain is getting expanded and longer, the flow of information, material and production is also being complicated. It is well known that development service industry using application software has various uncertainty in random events such as supply and demand fluctuation of developer's capcity, project effective date after winning a contract, manpower cost (or revenue), subcontract cost (or purchase), and overrun due to developer's skill-level. This study intends to social contribution through attempts to optimize enterprise's goal by supply chain management platform to balance demand and supply and stochastic programming which is basically applied in order to solve uncertainty considering economical and operational risk at solution supplier. In Particular, this study emphasizes to determine allocation of internal and external manpower of developers using S&OP (Sales & Operations Planning) as monthly resource input has constraint on resource's capability that shared in industry or task. This study is to verify how Stochastic Programming such as Markowitz's MV (Mean Variance) model or 2-Stage Recourse Model is flexible and efficient than Deterministic Programming in software enterprise field by experiment with process and data from service industry which is manufacturing software and performing projects. In addition, this study is also to analysis how profit and labor input plan according to scope of uncertainty is changed based on Pareto Optimal, then lastly it is to enumerate limitation of the study extracted drawback which can be happened in real business environment and to contribute direction in future research considering another applicable methodology.

게임이론을 활용한 강변여과 개발 적지선정 (Site Suitability Analysis for Riverbank Filtration Using Game Theory)

  • 이상일;이상신
    • 한국수자원학회논문집
    • /
    • 제43권1호
    • /
    • pp.95-104
    • /
    • 2010
  • 최근 지표수의 취수원 다변화 및 수질에 대한 불신 등으로 강변여과 개발에 관심이 모아지고 있다. 선진국에서의 강변여과 개발은 150년 정도의 역사를 가지고 있으며, 우리나라에서도 지속적으로 증가하고 있는 용수수요에 안정적으로 대처하기 위한 원수 확보방안으로 강변여과에 대한 조사가 1990년대부터 시작되었고, 현재 낙동강을 중심으로 몇몇 지자체에서는 강변여과를 활용한 상수도 공급이 이루어지고 있다. 그러나 지금까지는 강변여과에 의한 개발가능량 산정과 관정개발에 연구가 집중되어 개발가능지 선정에 관한 체계적인 연구가 이루어지지 않고 있는 실정이다. 본 논문에서는 게임이론을 활용한 강변여과 개발 적지선정에 대해 연구하였다. 게임이론은 수학적 분석이론의 하나로 사회과학(특히 경제학)과 생물학, 공학, 컴퓨터과학 등에 적용되고 있으며, 본 연구에서는 강변여과 개발을 위한 적정 후보지 결정에 이용되었다. 제안된 정책모형은 확률적 접근을 시도한 새로운 방법론이며, 적지선정을 위한 효율적인 분석이 가능한 것으로 나타났다.

목구조 설계를 위한 확정론적 구조 설계법과 확률 기반 구조 설계법의 비교 연구 (Methods for wooden structural design- A comparative research between deterministic design and probability based design)

  • 박문재;김광철
    • 한국가구학회지
    • /
    • 제20권4호
    • /
    • pp.358-373
    • /
    • 2009
  • Probability based design(PBD)method has some advantages against current design methods. First, it can provide the quantitative values for the structural safety or capacity through the reliability index, $^{\beta}$. That presented the certainty on the corresponding structure for the designer or user, also that permitted the broad consideration in the safety of structures. In addition, it can give the quantitative lifetime of the related structure in the calculation process of target reliability index. Also, incidental economical efficiency can be expected because decrease of required structural material can be obtained by using the practical material data. Unlikely current deterministic structural design methods, main advantage is the reflection of real condition in the structural design process by application of the data with not small clear specimen but structural size material. Advanced countries, namely America, Canada, Europe, Australia and New Zealand already converted from allowable stress design(ASD) method to PBD method and used as a standard wooden structures code in the late 1980s and 1990s. Other domestic constructions standards such as the steel or concrete constructions accepted and used the PBD methods already. Accordingly, wooden structural design method also should be converted from deterministic ASD to probabilistic LRFD(Load and resistance factor design) in order to keep pace with worldwide demands for PBD. Hence, to suggest the reason of introduction the PBD in domestic wooden structural design and analysis, a brief example was used to show the different reliability index by using the different design methods. Definition, merits and demerits of deterministic ASD and probabilistic LRFD were followed. Also the three examples were presented to show the similarity and differences between ASD and LRFD. Finally, connection problems that might cause a disputation in wooden structural design and analysis were broadly examined.

  • PDF

도로공사에서 생애주기비용을 사용한 지급조정모델 개발에 관한 연구 (LCCA-embedded Monte Carlo Approach for Modeling Pay Adjustment at the State DOTs)

  • 최재호
    • 한국건설관리학회:학술대회논문집
    • /
    • 한국건설관리학회 2002년도 학술대회지
    • /
    • pp.72-77
    • /
    • 2002
  • 미국에서는 품질 관리 문제를 해결할 수 있는 아이디어로 지급(Pay) Factor가 사용되어왔으며 현재는 생애주기비용까지 고려한 한층 진보된 지급조정모델 개발에 많은 관심을 가지고 있다. 하지만 이러한 지급조정모델절차의 개발은 품질특성변수 선택의 문제, 품질특성변수의 확률적 분포와 도로 공용성간의 관계 분석의 문제, 그리고 하나의 전체 지급조정모델 개발의 문제 등으로 미 교통부에서 어려움을 가지고 있다. 본 논문에서는 이러한 점을 극복하기 위한 방법론으로 생애주기비용분석을 고려한 몬테카를로 시뮬레이션 접근 방식이 사용되었다. 미 여러 교통부에서 적용 가능한 견본이 될 수 있도록 현 위스콘신 교통국에서 사용중인 도로관리 관련 시스템들에서 데이터를 축출하여 지급조정을 격정하기 위한 분석 절차를 제시하고 이를 근간으로 지급조정모델 결정 지원 시스템을 개발하였으며 민감도 분석을 실행하여 실제 데이터를 사용하여 개발된 지급조정모델의 적정성을 평가하였다. 본 논문에서 사용된 지급조정모델 개발 절차는 한층 정확성을 높인 도로공용성예측모델과 생애주기비용모델을 사용함으로써 실제 프로젝트에 사용 가능할 것으로 판단된다.

  • PDF

박물관 빛 환경과 관람행태의 상관관계에 관한 연구 - 조도에 의한 관람확률과 관람빈도의 해석을 중심으로 - (A Study on the Relationship between Light Environment and Visitors' Behavior in a Museum - Focus on the Interpretation of Tracking Score and Tracking Frequency with Intensity of Illumination -)

  • 이미연;정성욱
    • 한국실내디자인학회논문집
    • /
    • 제19권4호
    • /
    • pp.82-89
    • /
    • 2010
  • The studies published up to now, related to the correlation between spatial structure and visitors' behavior in a museum are rather relatively lacking when it comes to the in-depth consideration for the effect of the actual exhibition environment. So the main purpose of this study is to define the correlation between the light environment and the visitors' behavior. Towards this end, this study uses 'space syntax' to quantify the spatial structure with 'integration', 'connectivity' and 'control value'. Meanwhile, 'tracking score' and 'tracking frequency' were selected as the scope among the indices of behavior's analysis. The results of this study are as follows; First, integration and correlation of tracking score and tracking frequency are lowest when it comes to the extra large historical museums where the difference of intensity of illumination by each convex space. Meanwhile, the most considerable effect is exerted by control value. Compared to tracking score, tracking frequency is closely related to 'syntactic variables'. Second, visitors do not take the short cut the dark exhibition space even when very dark exhibition spaces continue after passing through relatively bright space. Analysis of visitors' behavior by control value in the exhibition space composed of this type of intensity of illumination environment is not valid. Third, visitors move to relatively brighter transitional space compared to the exhibition space with low intensity of illumination when passing through dark exhibition continually. Meanwhile, when visitors pass through the exhibition space there is some difference intensity of illumination they move to relatively dark exhibition center among the subsequent exhibition spaces. Accordingly, when the composition of exhibition space that continues onto the environment of low intensity of illumination is inevitable, differentiating intensity of illumination appropriately would be effective in inducing visit to the subsequent exhibition space.

항행 안전 시스템을 위한 안전 목표 수준 기반 위험 평가 방법론 (Hazard Assessment Methodology Based on Target Level of Safety for CNS/ATM System)

  • 이홍석;조상훈
    • 한국항행학회논문지
    • /
    • 제20권4호
    • /
    • pp.285-291
    • /
    • 2016
  • CNS/ATM 분야에서 안전 평가는 시스템을 개발하는데 반드시 필요한 개발 활동이다. 현재까지, 안전 평가와 관련된 많은 참고할 만한 자료들이 있으나 CNS/ATM분야에서 무엇을 어떻게 적용해야 할지 명확하게 명시된 자료는 없다. 또 다른 문제는 DO-278A기반으로 소프트웨어를 개발하기 위해서는 개발하고자 하는 소프트웨어에 대한 소프트웨어 보증 수준이 결정되어 있어야 한다. 하지만 개발 보증 수준을 결정하는 체계도 또한 정의되어 있지 않다. 이와 같은 문제를 해결하기 위해 본 논문에서는 ICAO Doc 9689에 정의된 안전 목표 수준을 기반으로 한 위험 평가를 수행하기 위한 방법을 제시한다. 항행 안전 시스템에서 일반적으로 적용 가능하도록 하기 위해 위험 평가 수행 절차를 수학적으로 표현하였으며 위험 평가를 위해 필요한 위험원의 심각도 분류, 발생 확률, 시스템 안전 목표 수준 등을 정의하고 위험 평가를 수행하기 위해 이벤트 트리 분석 절차를 적용하는 방법을 설명하였다.

고장 데이터의 플롯을 이용한 소프트웨어 신뢰도 성장 모델의 성능평가 (Performance estimation for Software Reliability Growth Model that Use Plot of Failure Data)

  • 정혜정;양해술;박인수
    • 정보처리학회논문지D
    • /
    • 제10D권5호
    • /
    • pp.829-836
    • /
    • 2003
  • 소프트웨어 신뢰도 성장 모델은 다양하게 연구되어져 있다. 그러나 이러한 모델에서 정확한 모수를 측정하는 것은 그리 쉽지 않다. 특히 고장 데이터에 대하여 소프트웨어 신뢰도 성장 모델의 추정이 정확히 이루어져야만 모델을 설명하는 모수의 추정도 정확하게 이루어질 수 있다. 이러한 측면에서 테스팅을 통해서 얻어진 소프트웨어의 고장 데이터의 정규확률점수를 구해서 두 개의 값에 대한 플롯을 그려보고 그려진 결과를 이용해서 분포를 예측하여 예측된 분포에 적합한 소프트웨어 신뢰도 성장 모델을 적용한다면 상당히 정확한 테스팅 결과론 얻을 수 있을 것이다. 본 논문에서는 고장 테이터의 플롯을 통한 결과를 통해서 분포를 예측하고 모델을 성능평가 척도에 따라서 모의실험을 하여 그 결과를 통해서 소프트웨어 신뢰도 성장 모델의 적합성을 검정하는 연구이다. 연구결과 고장데이터의 정규점수를 이용한 플롯을 보고 소프트웨어 신뢰도 성장 모델을 예측할 수 있었고 이러한 예측을 통해서 모델 선정한다면 모델의 성능평가에서도 우수함을 확인할 수 있다.