• 제목/요약/키워드: 편향 기반 예측

검색결과 29건 처리시간 0.026초

비선형 회귀분석을 이용한 쇄석다짐말뚝의 극한지지력 예측 (Estimation of Ultimate Bearing Capacity of Gravel Compaction Piles Using Nonlinear Regression Analysis)

  • 박준모;한용배;장연수
    • 한국해안·해양공학회논문집
    • /
    • 제25권2호
    • /
    • pp.112-121
    • /
    • 2013
  • 쇄석다짐말뚝의 한계상태설계법에서 신뢰성이론에 기반한 저항계수를 보정하기 위해서는 신뢰도 높은 극한지지력의 평가가 요구되고 있으며, 실무에서는 극한지지력을 예측하기 위하여 주로 정재하시험을 이용하고 있다. 정재하시험의 하중-침하량 곡선을 여러 도해법 등을 이용하여 극한지지력을 예측하는 평가법들이 설계기준에 제시되어 있으나, 기술자의 판단에 따라 극한하중이 일정하게 산정되지 못함으로써 신뢰성을 확보하기 어려운 단점이 있었다. 본 연구에서는 쇄석다짐말뚝의 정재하시험 결과를 비선형 회귀분석을 이용하여 극한지지력을 예측하고, 기존의 극한지지력 판정법과 비교함으로써 실제 극한지지력을 예측하는데 적합한 비선형 회귀모형을 제안하였다. 또한 극한지지력 판정법이 저항편향계수에 미치는 영향을 분석하고, 한계상태설계법을 위한 데이터베이스 축적을 목적으로 정재하시험을 계획하는데 필요한 시험조건을 검토하였다.

카드산업에서 휴면 고객 예측 (Prediction of Dormant Customer in the Card Industry)

  • 이동규;신민수
    • 서비스연구
    • /
    • 제13권2호
    • /
    • pp.99-113
    • /
    • 2023
  • 고객 기반의 산업에서 고객 Retention은 기업의 경쟁력이라 할 수 있으며, 고객 Retention을 높이는 것은 기업의 경쟁력을 높이는 것이라 할 수 있다. 따라서, 미래 휴면 고객을 잘 예측하여 관리하는 것은 기업의 경쟁력을 높이는데 무엇보다 중요하다. 왜냐하면, 신규 고객을 유치하는데 필요한 비용이 기존 고객을 Lock-in 시키는데 드는 비용 보다 많은 것으로 알려져 있기 때문이다. 특히, 수 많은 카드사가 존재하는 국내 카드 산업의 휴면 카드를 관리하고자 정부에서 휴면 카드 자동 해지 제도를 도입하고 있으며, 카드 산업에서 휴면 고객을 관리하는 것이 무엇보다 중요한 과제로 떠오르고 있다. 본 연구에서는 카드 산업에서 휴면 고객을 예측하기 위해 Recurrent Neural Network (RNN)방법론을 사용하였으며, RNN방법론 중에서 긴 시간을 효율적으로 학습할 수 있는 Long-Short Term Memory (LSTM)을 활용하였다. 또한, 통합기술수용이론 (UTAUT)을 입각하여 카드 산업에서 휴면 고객을 예측하는데 필요한 변수를 재정의하였다. 그 결과 안정된 모형의 정확도와 F-1 score를 얻을 수 있었으며, Hit-Ratio를 통하여 모형의 안정된 결과를 입증하였다. 기존 연구에서 지적된 통합기술수용이론 (UTAUT)에서 발생 될 수 있는 인구통계학적 정보의 조절 효과도 발생 되지 않은 것을 보였으며, 이로 인해 통합기술수용이론(UTAUT)를 이용한 변수 선정 모형에서 LSTM을 이용한 휴면 고객 예측 모형은 편향되지 않고 안정된 결과를 가져다 줄 수 있다는 것을 입증하였다.

2008 서울서베이 표본추출틀 구축 및 표본추출 사례 연구 (A Case Study on the Construction of the Sampling Frame and Sampling Design for 2008 Seoul Survey)

  • 강현철;박승열;김지연;김인수;이동수;황재일;박민규
    • 한국조사연구학회지:조사연구
    • /
    • 제10권3호
    • /
    • pp.157-172
    • /
    • 2009
  • 추출된 표본을 바탕으로 관심 모집단의 특성을 파악하는 조사연구에 있어서는 실제로 표본이 추출되는 표본추출틀의 모집단 대표성이 매우 중요하다. 표본추출틀이 관심 모집단을 적절한 수준으로 포함하지 못하는 경우 심각한 표본추출틀 편향이 발생하게 되고 이로 인하여 효율적인 추출법에 의하여 추출된 표본의 통계적 신뢰도 역시 손상된다. 그러나 대규모 조사를 위한 표본추출틀의 구축은 시간과 비용의 측면에서 비효율적이고 따라서 국가에서 제공하는 전수 조사 기반의 표본추출틀이 흔히 사용된다. 대표적으로 국내의 가구조사를 위한 표본추출틀로는 매 5년마다 시행되는 인구주택총조사 기반의 자료가 사용된다. 그러나 인구주택총조사 기반 표본추출틀의 경우 인구주택총조사 시점과 실제 조사 시점과의 시간적 차이로 인한 표본추출틀의 모집단 대표성에 문제가 발생하게 된다. 특별히 인구 유동성이 심한 서울과 같은 대도시의 경우 시간의 경과에 따른 모집단 분포의 변화가 심하게 나타나리라 예측할 수 있다. 따라서 본 연구에서는 2008 서울서베이 가구 조사를 위해 새롭게 표본추출틀을 구축한 것과 새 표본추출틀을 기초로 하여 표본을 추출한 사례를 다룬다. 기존 인구주택총조사 기반 표본추출틀이 시간이 지남에 따라 대표성을 상실하는 문제점을 지적하고 주민등록 DB와 과세대장 DB를 기반으로 한 새로운 표본추출틀을 2008년 서울서베이 가구조사를 위한 표본추출틀로 제시하였다. 새롭게 작성된 표본추출틀로부터의 가구표본추출과정과 가중치 및 모평균 추정량 또한 제시되었다.

  • PDF

항목 내용물의 클러스터 정보를 고려한 협력필터링 방법의 확률적 재해석 (Probabilistic Reinterpretation of Collaborative Filtering Approaches Considering Cluster Information of Item Contents)

  • 김병만;이경금;오상엽
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권9호
    • /
    • pp.901-911
    • /
    • 2005
  • 인터넷의 상업적 이용이 증가하고 인터넷에서 쉽게 얻을 수 있는 정보의 양이 풍성해지면서 정보 필터링 (information filtering) 기법은 대량의 정보 공간에서 사용자의 요구와 기호에 맞는 항목을 찾는 과정에 널리 사용되고 있다. 많은 협력필터링 (collaborative filtering) 시스템이 사용자 평가를 기반으로 사용자나 항목들 사이의 유사성을 찾아내고 이를 바탕으로 추천을 해왔지만 사용자 편향 (user bias), 비전이 연관 (non-transitive association), cold start 문제와 같이 성능을 높이기 위해 해결해야 할 문제들이 남아있다. 이 세 가지 문제는 사용자나 항목들 사이에 더 정확한 유사도를 찾아내는 과정에 장애가 된다. 본 논문에서는 이러한 문제들을 해결하기 위해 제안된 UCHM 및 ICHM 방법을 확률적으로 재해석하였다. 이 확률적 모델은 객체 (사용자 또는 품목)들을 그룹들로 구분하고 각 그룹 내에서 사용자 평가가 가우시안 분포를 따른다는 가정 하에 사용자들이 무엇을 선호할 것인지 예측한다. 실세계 자료에 대한 실험 결과, 제안된 방식이 다른 방식들과 비교할 만한 성능을 보인다는 것을 확인할 수 있었다.

A Delphi study on how to vitalize the blockchain-based NFT

  • Sang-yub Han;Ho-kyoung Ryu
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.77-87
    • /
    • 2024
  • 본 연구에서는 블록체인 및 NFT 분야 전문가들을 대상으로 델파이 기법을 활용하여 PEST(Political, Economic, Social, Technological 4가지 관점의 거시환경분석) 및 디지털 자산으로서의 3가지 조건 (가치 측정, 가치 저장, 가치 교환)에 대해 NFT 활성화 요건들을 조사하였다. 정치적/법적 요인으로 선정된 항목은 없었고, 경제적 요인으로 'NFT에 대한 소유 가치 및 투자 가치 확보', 사회적 요인으로 'NFT 거래에도 주식거래와 유사한 토대 마련', 기술적 요인으로 '사용하기 쉽고 보안성 높은 전자지갑', '손쉬운 사용자 접근성', 가치 측정 수단 및 교환의 매개 수단으로 선정된 요인은 없었으며, 가치 저장 수단으로 '저장된 가치에 대한 안전한 관리 및 소유 증명', '실물 자산과의 연계를 통한 시장 신뢰 확보' 등 NFT 상거래 활성화를 위한 6개의 요인들이 중요하다는 결과를 확인하였다. 본 연구에서 활용된 델파이 기법은 불확실한 미래 예측을 위해 전문가들을 대상으로 익명에 기반한 복수의 라운드 진행을 통해 합의된 의견에 수렴하였으며 전문가 선정의 대표성 및 의견 편향 등의 단점을 보완하기 위해 라운드별 추가 의견 수렴 및 질문 항목에의 반영 검토 과정도 병행하였다.

지역주의의 역동성과 전망: 투표, 편견과 선거제도를 중심으로

  • 이명진
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.207-212
    • /
    • 2000
  • 본 연구는 최근의 사회조사와 선거자료를 이용하여 한국사회의 지역주의의 특징을 살펴보고자 한다. 첫째, 최근의 선거결과에 보이는 지역주의적 투표는 지역간 사회적 거리를 잘 보여주고 있다. 둘째, 이러한 사회적 거리는 '편견과 차별'의 형태로 다양한 일상생활에서 존재하고 있다. 많은 사람들은 이러한 편견을 믿고 있으며, 편견에 의한 지역적 차별을 경험하고 있다. 특히 이러한 경험은 특정지역(호남)과 관련되어 있다. 셋째, 이러한 정치적 측면(지역주의적 투표)과 사회적 측면(지역간 편견)을 선거제도와 연결하여 살펴봄으로써, 앞으로 한국사회의 정치제도의 변화에 대한 전망을 할 수 있다. 연구의 잠재적인 가정은 선거에 있어서 지역적인 투표가 무조건 '나쁜' 것만은 아니라는 것이다. 한국 정치에서 나타나는 지도자나 이데올로기의 편향은 많은 사람들로 하여금 투표나 선거에서 출신지를 중요한 요소로 삼게 하였다. 이러한 요소는 쉽게 사라지지는 않을 것이며, 앞으로 선거제도의 변화에 중요한 역할을 할 것이다. 이러한 예측은 세 가지 중요한 요소에 근거하고 있다. 첫째, 유권자들의 지역주의에 대한 믿음과 예측은 쉽게 사라지지 않을 것이다. 둘째, 정치지도자들은 지역주의를 선거와 관련한 자신의 이익을 위해서 최대한 이용할 것이다. 셋째, 지역주의에 근거한 유권자들의 성향은 최근 선거와 투표에서 더욱 강화되고 있다. 정치엘리트들이 지역적인 기반을 중심으로 결합하려는 경향이 강해지고 있다. 이러한 경향은 이들 정치엘리트 사이의 내각중심제에 대한 선호도와 지역당의 출현 가능성을 증가시킬 것이다.도 설치행위의 처분성과 관련하여 횡단보도의 설치행위와 같은 일반적인 명령을 항고소송의 대상으로 할 필요성이 존재한다면 이른바 독일에서의 일반처분이라는 개념을 무리하게 받아들여 이를 행정행위의 한 유형으로 한다거나 우리 판례와 같이 "직접적이고 구체적인 법적 효과"를 미치는 명령이라는 명확치 않은 기준에 의하여 처분성을 인정하기보다는 일반적인 명령과 개별적인 행정행위를 구분하고 명령에 대하여도 취소소송의 대상으로 삼도록 하는 보다 명확하고 일관성 있는 논의전개를 제안하였다.수 있었다.로 첨가하여 48시간 배양한 후 암항원 유전자 발현성을 측정한 결과 세포주에 따라 다소 차이는 있으나 대개 0.2 uM농도에서도 유전자 발현이 유도되었으며 1, 5 uM농도에서 매우 강하게 유도되었다. ADC 처리가 페암세포주의 MHC와 B7 발현을 증가시키는가를 알아보기 위해 1 uM 농도의 ADC를 72시간 처치한 후 FACS 분석을 실시한 결과 4개의 페암세포주에서 MHC 및 B7분자의 발현은 유도되지 않았다. 또 ADC농도가 세포성장에 미치는 영향을 알아보기 위하여 ADC를 0.2, 1, 5 uM농도로 96시간 처치 후 세포수를 측정하여 상대성장지수를 알아본 결과 ADC 처치 농도가 증가함에 따라 세포의 성장은 매우 감소하였다. 결론: 폐암세포주에서 ADC처치는 MAGE, GAGE 및 NY-ESO-1과 같은 세포독성 T 림프구 반응을 유도할 수 있는 암항원의 발현을 증가시킬 수 있으며, ADC의 세포독성과 항원 발현 유발시간을 분석할 때 1 uM 농도에서 48시간 처치한 후 ADC가 없는 배지에서

  • PDF

유전 알고리즘을 이용한 국소가중회귀의 다중모델 결합을 위한 점진적 앙상블 학습 (Incremental Ensemble Learning for The Combination of Multiple Models of Locally Weighted Regression Using Genetic Algorithm)

  • 김상훈;정병희;이건호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권9호
    • /
    • pp.351-360
    • /
    • 2018
  • 전통적으로 나태한 학습에 해당하는 국소가중회귀(LWR: Locally Weighted Regression)모델은 입력변수인 질의지점에 따라 예측의 해를 얻기 위해 일정구간 범위내의 학습 데이터를 대상으로 질의지점의 거리에 따라 가중값을 달리 부여하여 학습 한 결과로 얻은 짧은 구간내의 회귀식이다. 본 연구는 메모리 기반학습의 형태에 해당하는 LWR을 위한 점진적 앙상블 학습과정을 제안한다. LWR를 위한 본 연구의 점진적 앙상블 학습법은 유전알고리즘을 이용하여 시간에 따라 LWR모델들을 순차적으로 생성하고 통합하는 것이다. 기존의 LWR 한계는 인디케이터 함수와 학습 데이터의 선택에 따라 다중의 LWR모델이 생성될 수 있으며 이 모델에 따라 예측 해의 질도 달라질 수 있다. 하지만 다중의 LWR 모델의 선택이나 결합의 문제 해결을 위한 연구가 수행되지 않았다. 본 연구에서는 인디케이터 함수와 학습 데이터에 따라 초기 LWR 모델을 생성한 후 진화 학습 과정을 반복하여 적절한 인디케이터 함수를 선택하며 또한 다른 학습 데이터에 적용한 LWR 모델의 평가와 개선을 통하여 학습 데이터로 인한 편향을 극복하고자 한다. 모든 구간에 대해 데이터가 발생 되면 점진적으로 LWR모델을 생성하여 보관하는 열심학습(Eager learning)방식을 취하고 있다. 특정 시점에 예측의 해를 얻기 위해 일정구간 내에 신규로 발생된 데이터들을 기반으로 LWR모델을 생성한 후 유전자 알고리즘을 이용하여 구간 내의 기존 LWR모델들과 결합하는 방식이다. 제안하는 학습방법은 기존 단순평균법을 이용한 다중 LWR모델들의 선택방법 보다 적합도 평가에서 우수한 결과를 보여주고 있다. 특정지역의 시간 별 교통량, 고속도로 휴게소의 시간별 매출액 등의 실제 데이터를 적용하여 본 연구의 LWR에 의한 결과들의 연결된 패턴과 다중회귀분석을 이용한 예측결과를 비교하고 있다.

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.

농지 공간격자 자료의 층화랜덤샘플링: 농업시스템 기후변화 영향 공간모델링을 위한 국내 농지 최적 층화 및 샘플 수 최적화 연구 (A stratified random sampling design for paddy fields: Optimized stratification and sample allocation for effective spatial modeling and mapping of the impact of climate changes on agricultural system in Korea)

  • 이민영;김용은;홍진솔;조기종
    • 환경생물
    • /
    • 제39권4호
    • /
    • pp.526-535
    • /
    • 2021
  • 공간 샘플링은 공간모델링 연구에 활용되어 샘플링 비용을 줄이면서 모델링의 효율성을 높이는 역할을 한다. 농업분야에서는 기후변화 영향을 예측하고 평가하기 위한 고해상도 공간자료 기반 모델링에 대한 연구 수요가 빠르게 증가하고 있으며, 이에 따라 공간 샘플링의 필요성과 중요성이 증가하고 있다. 본 연구는 국내 농지 공간샘플링 연구를 통해 농업분야 기후변화연구의 공간자료 활용의 효율성을 제고하고자 하였다. 본 연구는 층화랜덤샘플링을 기반으로 하였으며, 1 km 해상도의 농지 공간격자자료 모집단(11,386개 격자)에 대해서 RCP 시나리오별(RCP 4.5/8.5) 연대별(2030/2050/2080년대) 공간샘플링을 설계하였다. 국내 농지는 기상 및 토양 특성에 따라 계층화 되었으며, 샘플링 효율 극대화를 위해 최적 층화 및 샘플 배정 최적화를 수행하였다. 최적화는 작물수량, 온실가스 배출량, 해충 분포 확률을 포함하는 16개 목표 변수에 대해 주어진 정밀도 제한 내에서 샘플 수를 최소화하는 방향으로 진행되었다. 샘플링의 정밀도와 정확도 평가는 각각 변동계수(CV)와 상대적 편향을 기반으로 하였다. 국내 농지 공간격자 모집단 계층화 및 샘플 배정 및 샘플 수 최적화 결과, 전체 농지는 5~21개 계층, 46~69개 샘플 수 수준에서 최적화되었다. 본 연구결과물들은 국내 농업시스템 대표 공간격자로써 널리 활용될 수 있을 것으로 기대된다. 또한, 기후변화 영향예측 공간모델링 연구들에 활용되어 샘플링 비용 및 계산 시간을 줄이면서도 모델의 효율성을 높이는 데에 기여할 수 있다.