• Title/Summary/Keyword: 생존데이터

Search Result 325, Processing Time 0.026 seconds

Machine learning in survival analysis (생존분석에서의 기계학습)

  • Baik, Jaiwook
    • Industry Promotion Research
    • /
    • v.7 no.1
    • /
    • pp.1-8
    • /
    • 2022
  • We investigated various types of machine learning methods that can be applied to censored data. Exploratory data analysis reveals the distribution of each feature, relationships among features. Next, classification problem has been set up where the dependent variable is death_event while the rest of the features are independent variables. After applying various machine learning methods to the data, it has been found that just like many other reports from the artificial intelligence arena random forest performs better than logistic regression. But recently well performed artificial neural network and gradient boost do not perform as expected due to the lack of data. Finally Kaplan-Meier and Cox proportional hazard model have been employed to explore the relationship of the dependent variable (ti, δi) with the independent variables. Also random forest which is used in machine learning has been applied to the survival analysis with censored data.

Review of Lung Cancer Survival Analysis with Multimodal Data (다중 모드 데이터를 사용한 폐암 생존분석 검토)

  • Choi, Chul-woong;Kim, Hyeon-Ji;Shim, Eun-Seok;Im, A-yeon;Lee, Yun-Jun;Jeong, Seon-Ju;Kim, Kyung-baek
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.784-787
    • /
    • 2020
  • 폐암 환자의 생존율을 예측할 때 미국암연합회(AJCC)의 TNM병기 분류체계에 의해 진단되는 최종병기를 많이 사용한다. 최종병기는 폐암환자의 임상데이터 중 하나로 종양의 위치, 크기, 전이정도를 고려하여 환자의 폐암 상태를 판별하는 정보이다. 최종병기는 개략적인 환자의 상황을 설명하는 데 효과적이지만, 보다 구체적인 생존분석을 위해서는 임상데이터 뿐만 아니라 PET/CT와 같은 영상 데이터를 함께 분석해야 한다. 이 논문에서는 데이터 과학적 접근을 통해 폐암환자의 임상데이터, CT영상과 PET영상 등 다양한 종류의 데이터를 함께 활용하는 생존분석기법을 검토한다. 실험을 통해 다중 모드 데이터를 활용하는 생존분석을 위해 비선형모델 개발과 Feature임베딩 기법 고도화가 필요함을 확인하였다.

A Study on the Data Fusion Algorithm under Operational Environment of the Sensors for Helicopter ASE System (헬기 생존계통 센서 운용 환경 하에서의 데이터 융합 알고리즘에 관한 연구)

  • Park, Young-Sun;Kim, Hwa-Soo;Kim, Sook-Gyeong;Wu, Sang-Min;Jung, Hun-Gi
    • Journal of the military operations research society of Korea
    • /
    • v.34 no.3
    • /
    • pp.79-92
    • /
    • 2008
  • The purpose of this paper is to design an algorithm for data fusion of sensors data in the helicopter ASE system, using Bayesian Network, which was selected among several knowledge base data fusion methods after consideration and applied to this study. The result of the algorithm analysis shows that Bayesian Network is effective method for solving this problem.

Comparison of parametric and nonparametric hazard change-point estimators (모수적과 비모수적 위험률 변화점 통계량 비교)

  • Kim, Jaehee;Lee, Sieun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.27 no.5
    • /
    • pp.1253-1262
    • /
    • 2016
  • When there exists a change-point in hazard function, it should be estimated for exact parameter or hazard estimation. In this research, we compare the hazard change-point estimators. Matthews and Farewell (1982) parametric change-point estimator is based on the likelihood and Zhang et al. (2014) nonparametric estimator is based on the Nelson-Aalen cumulative hazard estimator. Simulation study is done for the data from exponential distribution with one hazard change-point. The simulated data generated without censoring and the data with right censoring are considered. As real data applications, the change-point estimates are computed for leukemia data and primary biliary cirrhosis data.

The Study on Data Encryption Schemes Using LDU Decomposition (LDU 분해를 이용한 데이터 암호화 기법에 관한 연구)

  • 최성진;윤희용;최중섭;이강신
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.757-759
    • /
    • 2003
  • 저장장치의 발전과 인터넷 사용량의 증가, 전자 상거래의 활성화에 의해 많은 사람들이 디지털정보를 편리하게 이용할 수 있게 되었다. 이에 따라 저장장치의 보안성과 생존성은 가장 중요한 사항으로 고려되고 있으며, 이러한 보안성과 생존성을 높이기 위하여 새로운 분산저장기법의 연구개발이 절실히 필요한 실정이다. 따라서, 본 논문에서는 분산저장시스템의 보안성과 생존성을 높이기 위해 필수적으로 필요한 분산/암호화 기법을 LDU 분해를 이용하여 제안하고, 제안된 기법의 가용성을 평가한다 제안된 기법은 데이터의 분할과 암호화를 동시에 허락하여 보안성을 높임과 동시에 기존의 기법과 비교하여 10%정도의 가용성 향상을 보인다.

  • PDF

Survival Strategies for Data Business in the Post-COVID Era (포스트 코로나 시대 데이터 비즈니스 생존전략)

  • Lee, Raehyung
    • Journal of Technology Innovation
    • /
    • v.28 no.4
    • /
    • pp.165-175
    • /
    • 2020
  • In this viewpoint paper, we overlook the potential of the data industry and the strategies needed in order to survive in this new socio-economic order brought by COVID-19. The social distancing culture is leading to the expansion and centralization of data. The government established the development plan of the data industry ecosystem and the capital flow is following this stream, so this is an opportunity for those in the data business. To survive and grow in the data industry ecosystem, we need to identify quality characteristics that have a comparative advantage over competitors based on high data quality and need to determine the target business segmentation to avoid wasting resources and make efficient investments.

A Study on Energy-Efficient Deployment for Wireless Sensor Networks (무선 센서네트워크의 에너지 효율적 배치에 관한 연구)

  • 문준수;이상학;이승관;정태충
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10c
    • /
    • pp.10-12
    • /
    • 2004
  • 무선 센서네트워크는 센싱 지역에 분산되어 있는 초소형 센서 노드들이 감지/처리한 데이터를 수집노드로 전송하여 원격의 사용자가 센싱 지역의 상황인지를 가능하게 하는 유비쿼터스 컹퓨팅의 기반 네트워크이다. 전력 사용이 극히 제한된 센서 노드를 이용하여 무선 센서 망을 구성, 유지하며 데이터를 수집하기 위해서는 효율적인 망의 형태와 이에 따른 네트워크 배치 전략을 필요로 한다. 클러스터 기반 네트워크의 형태는 밀집도가 높은 센서네트워크에서 데이터병합을 수행하고 노드간 에너지 소비 균형을 이루기 위한 효과적인 구조이다. 본 논문에서는 클러스터 기반의 단일 홉 전송 구조에서 데이터 수집률을 높이고 노드간 에너지 사용의 균형을 이루게 하여 네트워크의 생존시간을 최대화할 수 있는 네트워크 배치 방법을 제안하였다. 클러스터링 기법에 따른 에너지 소비 모델을 분석하고 이를 통해 노드의 적절한 밀집도를 산출하였다. 싱크로부터 멀어질수록, 센서필드의 중앙보다는 외곽에 노드의 배치를 조밀하게 배치하여 네트워크의 생존시간을 늘렸다. 시뮬레이션을 통해 효율적인 네트워크의 배치가 노드간 에너지 소비의 균형을 이루도록 하여 네트워크의 생존시간을 늘일 수 있음을 확인하였다.

  • PDF

Analysis of mortality after death of spouse in relation to duration of bereavement and dependence relation between married couple -using married couples data from survivor's pension of National Pension Service- (부부의 사망시차 및 생존기간의 종속관계 분석 -국민연금의 유족연금 데이터를 이용한 연구-)

  • Baek, HyeYoun;Han, Jeonglim;Lee, Hangsuck
    • Journal of the Korean Data and Information Science Society
    • /
    • v.26 no.4
    • /
    • pp.931-946
    • /
    • 2015
  • Many multiple life insurance products consider benefits that are contingent on the combined survival status of two lives. To value premiums of the insurance products accurately, we need to consider the impact of the survivorship of one life on another. To show a dependence relation between married couple, we calculate correlation coefficients by using married couples data from National Pension Service and the results show some positive dependence between them. Moreover, by analyzing the death after bereavement, we find a evidence that mortality rates increase after the death of a spouse and, in addition, that this phenomenon, the broken-heart syndrome, diminishes over time. The results of this study can support the method to calculate the premium of multiple life insurance reflecting more realistic joint mortality rates.

A schema and stepwise methodology for modeling the data quality (단계적 데이터 품질 모델링 방법론과 스키마)

  • 나관상;백두권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.18-120
    • /
    • 2001
  • 고객에게 원하는 정보를 제공하기 위해서는 데이터의 설계, 개발 및 이용에 있어 최적화된 데이터의 모델링 및 구조화가 매우 중요하며, 이를 통해 사용자에게 적기에 고품질의 데이터를 제공하는 것이 무한 경쟁시대에서 생존을 위한 핵심 요소이다. 특히, 우리는 인터넷의 출현으로 오프라인 기업에서 오라인 기업으로 급속한 전환과 기업간, 기업과 고객간, 기업과 정부간 보다 넓게는 전세계의 국가를 하나로 엮는 정보유통 시대에 살고 있다. 인터넷 상거래의 활성하와 전자정부 구현 등에서 기업 생존의 핵심 요소는 방대한 양의 데이터를 어떻게 공유하고 유통시키며, 양질의 데이터를 구축 하느냐 이다. 본 고에서는 기존 시스템의 컨버젼이나 마이그레이션 또는 이질적 시스템 통합과정에서 그리고 데이터베이스 설계과정에서 데이터의 품질을 향상시키기 위해 필요한 데이터 품질문제를 알아보고, 체계적으로 데이터 품질을 추출 및 표현하기 위한 방법론을 제안하며, 이를 개선 발전시키기 위한 연구방향을 소개한다.

  • PDF

A study on improve survivability of sensor node and design of protocol in RFID Middleware environment (RFID 미들웨어 환경에서 센서 노드의 생존성 향상과 효율적인 프로토콜 설계를 위한 연구)

  • Choi, Yong-Sik;John, Young-Jun;Park, Sang-Hyun;Han, Soo;Shin, Sung-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10d
    • /
    • pp.68-73
    • /
    • 2006
  • 센서 노드의 송수신 상태를 분석하여 노드의 생존성 향상과 효율적인 프로토콜 설계를 하려고 한다. 센서 노드의 분석을 위한 실험 환경은 다음과 같다. 센서 노드의 생존성-가용 배터리, 센서 노드의 출력-검색 가능 영역, 센서 노드의 통신 경로-라우팅 테이블 생성, 센서 노드의 대역폭-송신 데이터의 크기이다. RFID 태그와 리더를 통한 관리 시스템과 재해방지를 위한 다양한 센서를 통한 정보 수집 시스템과 의사결정 시스템에 적용 될 수 있다. 그리고 다양한 센서 데이터로부터 수신된 데이터의 자료수집, 센서분류, 수신율 조절 시스템을 위한 프로토콜 설계 자료로 활용 가능하다.

  • PDF