• 제목/요약/키워드: Weighted average

검색결과 889건 처리시간 0.031초

비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측 모델 (A Recidivism Prediction Model Based on XGBoost Considering Asymmetric Error Costs)

  • 원하람;심재승;안현철
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.127-137
    • /
    • 2019
  • 재범예측은 70년대 이전부터 전문가들에 의해서 꾸준히 연구되어온 분야지만, 최근 재범에 의한 범죄가 꾸준히 증가하면서 재범예측의 중요성이 커지고 있다. 특히 미국과 캐나다에서 재판이나 가석방심사 시 재범 위험 평가 보고서를 결정적인 기준으로 채택하게 된 90년대를 기점으로 재범예측에 관한 연구가 활발해졌으며, 비슷한 시기에 국내에서도 재범요인에 관한 실증적인 연구가 시작되었다. 지금까지 대부분의 재범예측 연구는 재범요인 분석이나 재범예측의 정확성을 높이는 연구에 집중된 경향을 보이고 있다. 그러나 재범 예측에는 비대칭 오류 비용 구조가 있기 때문에 경우에 따라 예측 정확도를 최대화함과 동시에 예측 오분류 비용을 최소화하는 연구도 중요한 의미를 가진다. 일반적으로 재범을 저지르지 않을 사람을 재범을 저지를 것으로 오분류하는 비용은 재범을 저지를 사람을 재범을 저지르지 않을 것으로 오분류하는 비용보다 낮다. 전자는 추가적인 감시 비용만 증가되는 반면, 후자는 범죄 발생에 따른 막대한 사회적, 경제적 비용을 야기하기 때문이다. 이러한 비대칭비용에 따른 비용 경제성을 반영하여, 본 연구에서 비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측모델을 제안한다. 모델의 첫 단계에서 최근 데이터 마이닝 분야에서 높은 성능으로 각광받고 있는 앙상블 기법, XGBoost를 적용하였고, XGBoost의 결과를 로지스틱 회귀 분석(Logistic Regression Analysis), 의사결정나무(Decision Trees), 인공신경망(Artificial Neural Networks), 서포트 벡터 머신(Support Vector Machine)과 같은 다양한 예측 기법과 비교하였다. 다음 단계에서 임계치의 최적화를 통해 FNE(False Negative Error)와 FPE(False Positive Error)의 가중 평균인 전체 오분류 비용을 최소화한다. 이후 모델의 유용성을 검증하기 위해 모델을 실제 재범예측 데이터셋에 적용하여 XGBoost 모델이 다른 비교 모델 보다 우수한 예측 정확도를 보일 뿐 아니라 오분류 비용도 가장 효과적으로 낮춘다는 점을 확인하였다.

경기도 화성시 우음도 일원의 화강암 암맥군과 U-Pb 연령 (Granite Dike Swarm and U-Pb Ages in the Ueumdo, Hwaseong City, Korea)

  • 채용운;강희철;김종선;박정웅;하수진;임현수;신승원;김형수
    • 한국지구과학회지
    • /
    • 제43권5호
    • /
    • pp.618-638
    • /
    • 2022
  • 경기육괴 중서부에 위치한 화성시 우음도 일대에는 고원생대 호상편마암을 관입하고 있는 중기 쥐라기의 화강암 암맥군이 발달한다. 우음도 일대의 대표 노두에서 야외 횡절관계를 근거하면 4개의 암맥들(UE-A, UE-C, UE-D, UE-E)로 구분되며, 방향성에 따라서는 북서 방향(UE-A 암맥), 북서 내지 서북서 방향(UE-C 암맥), 북동 방향(UE-D 및 UE-E 암맥)의 3개의 암맥군으로 나타난다. 이들 화강암 암맥들은 괴상의 중립~조립질의 흑운모 화강암으로 야외에서 관찰된 이들의 상대연령은 UE-A, UE-D (=UE-E), UE-C 순으로 젊어진다. 또한 암맥들의 기하학적 분석으로부터 UEA 및 UE-C 암맥은 대략 북동-남서 방향의 최소수평응력장 하에서 관입한 것으로 판단된다. 주원소 분석에 의한 SiO2 평균 함량에서 비교적 낮은 값을 보인 UE-A 암맥은 다른 암맥들보다 초기 마그마 분화의 산물임을 지시하여 암맥들의 상대연령과도 부합한다. SHRIMP 저어콘 U-Pb 연대측정으로부터 구한 암맥별 206Pb/238U 누적평균연령은 각각 약 167 Ma (UE-A), 164 Ma (UE-C), 167 Ma (UE-D), 167 Ma (UE-E)로 UE-A, UE-D, UE-E 암맥들은 매우 유사한 연령을 보이며 이들 암맥 중 가장 세립인 UE-C 암맥은 가장 젊은 연령을 나타내어 야외에서 관찰한 상호 횡절관계에 의한 상대연령과 주원소 분석 결과와도 일치한다. 따라서 연구지역의 화강암 암맥들은 중생대 중기 쥐라기(약 167 Ma와 164 Ma)에 짧은 시간 간격을 두고 다양한 화강암질 마그마가 관입한 결과이며, 이들 관입 시기는 지리적으로 중기 쥐라기 암체들이 널리 분포하고 있는 경기육괴의 심성암체들과 일치하는 연령이다. 따라서 연구지역의 화강암 암맥군은 지구조적으로 쥐라기 동안 섭입하는 해양판의 얕아지는 섭입각과 함께 북서 방향으로 이동하는 화성활동의 결과로 형성되었음을 의미한다.

토지피복변화에 따른 금강 상류 댐 유역 산림 경관의 구조적 변화 분석 (Analysis of Spatial Changes in the Forest Landscape of the Upper Reaches of Guem River Dam Basin according to Land Cover Change)

  • 김경태;이현정;김휘문;송원경
    • 한국환경생태학회지
    • /
    • 제37권4호
    • /
    • pp.289-301
    • /
    • 2023
  • 유역 내 산림은 생태계 유지에 있어 중요한 역할을 맡고 있으며 생태네트워크 체계를 구성하는 주요 기반 환경이다. 그러나 지난 수십여 년간 행해진 무분별한 개발사업으로 인해 산림 파편화 및 토지이용 변화가 가속화되었으며 본래의 기능을 상실하게 되었다. 산림 생태계를 파악하는 데 있어 산림의 구조적 패턴은 생태적 과정과 기능에 직접적인 영향을 미치기 때문에 변화패턴을 파악하고 분석하는 것은 중요한 인자라 할 수 있다. 이에 본 연구는 금강 상류 댐 유역을 대상으로 FRAGSTATS 모델을 통해 시계열적인 토지피복변화에 따른 산림 경관의 구조적 변화를 분석하였다. 토지피복 변화탐지를 통한 금강 상류 댐 유역 내 토지피복변화는 1980년대부터 2010년대까지 산림 33.12km2(0.62%), 시가화건조지역 67.26km2 (1.26%) 증가하였고 농업지역 148.25km2(2.79%) 감소하였다. 유역 내 산림 경관분석결과 No sampling 분석에서는 경관백분율(PLAND), 면적가중근접지수(CONTIG_AM), 평균 중심지 면적(CORE_MN), 인접지수(PLADJ)가 증가하였고 패치수(NP), 경관형태지수(LSI), 응집지수(COHESION)가 감소하였다. Moving window 분석을 통해 구조적 변화패턴을 파악한 결과, 경상북도 상주시, 충청북도 보은군, 전라북도 진안군 내 산림 경관은 상대적으로 잘 보전되어 있었으나 충청북도 옥천군, 영동군 그리고 충청남도 금산군 사이의 경계부와 전라북도 무주군과 장수군 인접 지역의 산림 경관에서는 파편화가 진행되고 있었다. 결과를 토대로 추후 해당 지역의 산림 관리전략 수립 시 파편화 지역을 대상으로 조림사업을 수립할 필요가 있을 것으로 사료된다. 본 연구를 통해 산림 경관의 파편화가 예상되는 지역을 도출할 수 있었으며, 유역 산림의 건전성 평가 및 관리계획 수립을 위한 기초자료로써 활용될 가능성을 기대할 수 있다.

EPC 프로젝트의 위험 관리를 위한 ITB 문서 조항 분류 모델 연구: 딥러닝 기반 PLM 앙상블 기법 활용 (Research on ITB Contract Terms Classification Model for Risk Management in EPC Projects: Deep Learning-Based PLM Ensemble Techniques)

  • 이현상;이원석;조보근;이희준;오상진;유상우;남마루;이현식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.471-480
    • /
    • 2023
  • 국내 건설수주 규모는 2013년 91.3조원에서 2021년 총 212조원으로 특히 민간부문에서 크게 성장하였다. 국내외 시장 규모가 성장하면서, EPC(Engineering, Procurement, Construction) 프로젝트의 규모와 복잡성이 더욱 증가되고, 이에 프로젝트 관리 및 ITB(Invitation to Bid) 문서의 위험 관리가 중요한 이슈가 되고 있다. EPC 프로젝트 발주 이후 입찰 절차에서 실제 건설 회사에게 부여되는 대응 시간은 한정적일 뿐만 아니라, 인력 및 비용의 문제로 ITB 문서 계약 조항의 모든 리스크를 검토하는데 매우 어려움이 있다. 기존 연구에서는 이와 같은 문제를 해결하고자 EPC 계약 문서의 위험 조항을 범주화하고, 이를 AI 기반으로 탐지하려는 시도가 있었으나, 이는 레이블링 데이터 활용의 한계와 클래스 불균형과 같은 데이터 측면의 문제로 실무에서 활용할 수 있는 수준의 지원 시스템으로 활용하기 어려운 상황이다. 따라서 본 연구는 기존 연구와 같이 위험 조항 자체를 정의하고 분류하는 것이 아니라, FIDIC Yellow 2017(국제 컨설팅엔지니어링 연맹 표준 계약 조건) 기준 계약 조항을 세부적으로 분류할 수 있는 AI 모델을 개발하고자 한다. 프로젝트의 규모, 유형에 따라서 세부적으로 검토해야 하는 계약 조항이 다를 수 있기 때문에 이와 같은 다중 텍스트 분류 기능이 필요하다. 본 연구는 다중 텍스트 분류 모델의 성능 고도화를 위해서 최근 텍스트 데이터의 컨텍스트를 효율적으로 학습할 수 있는 ELECTRA PLM(Pre-trained Language Model)을 사전학습 단계부터 개발하고, 해당 모델의 성능을 검증하기 위해서 총 4단계 실험을 진행했다. 실험 결과, 자체 개발한 ITB-ELECTRA 모델 및 Legal-BERT의 앙상블 버전이 57개 계약 조항 분류에서 가중 평균 F1-Score 기준 76%로 가장 우수한 성능을 달성했다.

웹기반 지능형 기술가치평가 시스템에 관한 연구 (A Study on Web-based Technology Valuation System)

  • 성태응;전승표;김상국;박현우
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.23-46
    • /
    • 2017
  • 2000년대 이전부터 북미 유럽의 선진국을 중심으로 특정 기업이나 사업(프로젝트)에 관한 가치를 평가하는 사례는 있어 왔으나, 개별 기술(특허)의 경제적 가치를 산정하는 체계나 방법론은 국내를 중심으로 최근 들어 활성화되어 왔다. 이러한 기술가치평가 분야는 기술이전(거래), 현물출자, 사업타당성 분석, 투자유치, 세무/소송 등의 다양한 용도로 활용되고 있다. 물론 기술보증기금의 KTRS, 발명진흥회의 SMART 3.1과 같이, 평가대상기술에 대한 기술력(등급) 평가 혹은 특허등급평가를 정성적으로 수행하는 온라인 시스템은 존재해 왔으나, 대상기술의 정량적인 가치금액까지 산출해 주는 웹기반 지능형 기술가치평가 시스템은 한국과학기술정보연구원(KISTI)에 의해 유일하게 개발 및 공식 오픈되어 확산 활용되고 있다. 본 고에서는 KISTI에서 개발 운영중인 웹기반 'STAR-Value' 시스템을 중심으로, 탑재된 방법론 및 평가모델의 유형, 이를 지원하는 참조정보 및 데이터베이스(D/B)가 어떻게 연계 활용되는지를 소개한다. 특히 미래에 발생할 경제적 수익을 추정하여 현재가치화하는 소득접근법 기반의 대표 모델인 현금흐름할인(DCF) 모델과 특정 로열티율을 기반으로 로열티수입료의 현재가치를 기술료 대가로 산정하는 로열티절감모델을 포함한 6개 모델, 그리고 관련 지원정보(기술수명, 기업(업종)재무정보, 할인율, 산업기술요소 등)의 데이터 기반 연계 방식에 대해 살펴본다. STAR-Value 시스템은 평가대상기술에 대한 국제특허분류(IPC) 혹은 한국표준산업분류(KSIC) 등의 분류 정보로부터 기술순환주기(TCT) 지수, 유사업종(혹은 유사기업)의 매출액 성장률 및 수익성 데이터, 업종별 가중평균자본비용(WACC) 및 산업기술요소 지수 등 메타데이터값을 자동적으로 불러오고 여기에 조정요인을 반영하여 기술가치의 산출결과가 높은 신뢰성 및 객관성을 가지도록 한다. 나아가 대상기술의 잠재적 시장규모와 해당 사업화주체의 시장점유율에 대한 정보까지 보유 재무데이터 기반으로 참조값을 제시하거나 기존에 완료된 평가사례 축적 기반으로 업종별 유사 기술의 가치범위값을 제시해 준다면, 본 시스템이 보다 지능형으로 지원 모듈을 연계 활용하고 실시간으로 손쉽게 고(高)정확도의 기술가치범위를 제시해 줄 수 있을 것으로 기대된다. 본 고에서는 웹기반 STAR-Value 시스템이 참조데이터 기반으로 지능형 연계를 수행하도록 해주는 모형선택 가이드라인 지원기능, 기술가치범위 추론 지원기능, 유사기업 선정 기반의 시장점유율 산정 지원기능의 내부 로직 구성을 설명한다. 상기 지원기능을 통해 비전문가(또는 초보자) 수준에서 최적의 평가모형 선택, 기술가치 범위 추론, 유사기업 선택 및 시장점유율 산정에 대한 정보지원이 데이터 사이언스 및 기계학습 기반으로 수행될 수 있다. 본 연구는 기술가치평가 분야의 이론적 타당성을 평가실무에서 활용할 수 있는 평가모델 및 지원정보를 실제 탑재한 웹기반 시스템의 소개에 의미가 있으며, 추가적으로 보다 객관적이고 손쉬운 지능형 지원시스템의 활용성을 높임으로써, 앞으로 기술사업화의 제 분야에서 다양하게 활용할 수 있을 것으로 기대된다.

손해평고(损害评估): 대전자구비행소적탐색성고찰(对电子口碑行销的探索性考察) (Assessing the Damage: An Exploratory Examination of Electronic Word of Mouth)

  • Funches, Venessa Martin;Foxx, William;Park, Eun-Joo;Kim, Eun-Young
    • 마케팅과학연구
    • /
    • 제20권2호
    • /
    • pp.188-198
    • /
    • 2010
  • 此研究旨在考察负口碑(即NWOM)对在线行销的影响, 着重分析服务失败的描述以及通信服务商的意向是如何影响消费者对企业竞争力的评估, 对企业的态度, 以及积极的口碑行销和行为意向. 对通信说服力的研究着重于 "谁说了什么; 对谁;通过何渠道;有何影响(Chiu 2007)". 在此我们研究了电子网络发布, 尤其是 "什么" 的两个方面: 通信服务失败的等级以及个人发布的知觉意向. 电子负口碑看似正在毁掉产品或企业的声誉, 这也就不难理解为什么人们总对它带有偏见, 认为其不可靠. 根据归因理论, 人们总会寻求事件的原因, 尤其是那些消极的意外的事件(Weiner 2006). Hennig-Thurau和Walsh (2003)提出 "既然读者的知识和对在线信息的作者信任度都很有限, 可以把电子口碑当做是表达-行为关系的有效调节. 此据此我们提出以下假设: 假设1. 在衡量(a)企业竞争力, (b)人们对企业的态度, (c)积极的口碑, 以及(d)行为意向时, 面临高等级服务失败电子负口碑的对象得分低于面临低等级服务失败电子负口碑的对象. 假设2. 在衡量(a)企业竞争力, (b)人们对企业的态度, (c)积极的口碑, 以及(d)行为意向时, 面临警告意向电子负口碑的对象得分低于面临报复意向电子负口碑的对象假设3. 在电子负口碑中, 服务失败的等级和知觉意向互相影响, 因此在衡量(a)企业竞争力, (b)人们对企业的态度, (c)积极的口碑, 以及(d)行为意向时, 警告意向的电子负口碑的平均反应值大于报复意向的电子负口碑. 主要研究包括一个2 (服务失败的严重性) x 2(警告意向VS报复意向的负口碑)的析因实验. 将通过模拟的在线网络发布信息刺激在线对象. 这一方案描述的服务失败是在传统的零售机构不接受礼物卡, 通过一家在线的研究公司从全国抽样. 共有113个对象参与此研究, 共分析了104份调查问卷. 研究对象认为该方案很现实, 92.3%对此反应强烈. 方案的运作相当令人满意, 所有的措施都经预先的测试验证, 各个项目也经分析证实可靠并有效. 多变量方差分析结果显示多变量间无明显的互相影响, 因此我们只研究主要影响-后倾向和服务失败的严重性. 后倾向主要影响对企业的态度, 积极的口碑和行为意向. 服务失败的严重性主要影响4个因变量: 企业的竞争力, 对企业的态度, 积极的口碑和行为意向. 需特别指出的是, 当电子负口碑描述为严重的服务失败时, 企业的竞争力低于电子负口碑描述为较轻的服务失败时. 当电子负口碑描述为严重的服务失败时, 对企业的态度差于电子负口碑描述为较轻的服务失败时. 当电子负口碑描述为严重的服务失败时, 企业的口碑差于电子负口碑描述为较轻的服务失败时. 当电子负口碑描述为严重的服务失败时, 行为意向低于电子负口碑描述为较轻的服务失败时. 因此, 假设1中的abcd都得到了支持. 另外, 衡量对企业的态度时, 警告意向的电子负口碑得分低于报复意向的电子负口碑. 衡量企业的口碑时, 警告意向的电子负口碑得分低于报复意向的电子负口碑. 衡量行为意向时, 警告意向的电子负口碑得分低于报复意向的电子负口碑. 因此与假设2中的a项不符, 尽管结果指向的是假设方向. 除此之外, 在假设的三个变量中, 后倾向对服务失败的严重性无明显的多变量或单变量影响. 因此, 假设3被推翻. 此研究有研究和管理的双重蕴涵, 如之前的研究一样, 此研究结果证实了服务失败的严重性影响消费者知觉, 态度, 积极的口碑以及行为意向(Weun et al. 2004). 关于进一步的相关性, 在线内容证实了该反应, 这意味着企业需要努力进行服务补救. 至于电子负口碑的知觉意向, 如之前的研究一样, 此研究结果意味着读者对原始资料的意向影响其对知觉, 态度, 积极口碑和行为意向的作用大小. 对管理者的蕴涵在于, 当消费者发现在线交流可靠且有影响力时, 不是所有的交流都同等重要. 电子口碑的好处在于它可以监测潜在的问题并提供纠正的可能性, 即使有潜在的危害.

폭소노미 사이트를 위한 랭킹 프레임워크 설계: 시맨틱 그래프기반 접근 (A Folksonomy Ranking Framework: A Semantic Graph-based Approach)

  • 박현정;노상규
    • Asia pacific journal of information systems
    • /
    • 제21권2호
    • /
    • pp.89-116
    • /
    • 2011
  • In collaborative tagging systems such as Delicious.com and Flickr.com, users assign keywords or tags to their uploaded resources, such as bookmarks and pictures, for their future use or sharing purposes. The collection of resources and tags generated by a user is called a personomy, and the collection of all personomies constitutes the folksonomy. The most significant need of the folksonomy users Is to efficiently find useful resources or experts on specific topics. An excellent ranking algorithm would assign higher ranking to more useful resources or experts. What resources are considered useful In a folksonomic system? Does a standard superior to frequency or freshness exist? The resource recommended by more users with mere expertise should be worthy of attention. This ranking paradigm can be implemented through a graph-based ranking algorithm. Two well-known representatives of such a paradigm are Page Rank by Google and HITS(Hypertext Induced Topic Selection) by Kleinberg. Both Page Rank and HITS assign a higher evaluation score to pages linked to more higher-scored pages. HITS differs from PageRank in that it utilizes two kinds of scores: authority and hub scores. The ranking objects of these pages are limited to Web pages, whereas the ranking objects of a folksonomic system are somewhat heterogeneous(i.e., users, resources, and tags). Therefore, uniform application of the voting notion of PageRank and HITS based on the links to a folksonomy would be unreasonable, In a folksonomic system, each link corresponding to a property can have an opposite direction, depending on whether the property is an active or a passive voice. The current research stems from the Idea that a graph-based ranking algorithm could be applied to the folksonomic system using the concept of mutual Interactions between entitles, rather than the voting notion of PageRank or HITS. The concept of mutual interactions, proposed for ranking the Semantic Web resources, enables the calculation of importance scores of various resources unaffected by link directions. The weights of a property representing the mutual interaction between classes are assigned depending on the relative significance of the property to the resource importance of each class. This class-oriented approach is based on the fact that, in the Semantic Web, there are many heterogeneous classes; thus, applying a different appraisal standard for each class is more reasonable. This is similar to the evaluation method of humans, where different items are assigned specific weights, which are then summed up to determine the weighted average. We can check for missing properties more easily with this approach than with other predicate-oriented approaches. A user of a tagging system usually assigns more than one tags to the same resource, and there can be more than one tags with the same subjectivity and objectivity. In the case that many users assign similar tags to the same resource, grading the users differently depending on the assignment order becomes necessary. This idea comes from the studies in psychology wherein expertise involves the ability to select the most relevant information for achieving a goal. An expert should be someone who not only has a large collection of documents annotated with a particular tag, but also tends to add documents of high quality to his/her collections. Such documents are identified by the number, as well as the expertise, of users who have the same documents in their collections. In other words, there is a relationship of mutual reinforcement between the expertise of a user and the quality of a document. In addition, there is a need to rank entities related more closely to a certain entity. Considering the property of social media that ensures the popularity of a topic is temporary, recent data should have more weight than old data. We propose a comprehensive folksonomy ranking framework in which all these considerations are dealt with and that can be easily customized to each folksonomy site for ranking purposes. To examine the validity of our ranking algorithm and show the mechanism of adjusting property, time, and expertise weights, we first use a dataset designed for analyzing the effect of each ranking factor independently. We then show the ranking results of a real folksonomy site, with the ranking factors combined. Because the ground truth of a given dataset is not known when it comes to ranking, we inject simulated data whose ranking results can be predicted into the real dataset and compare the ranking results of our algorithm with that of a previous HITS-based algorithm. Our semantic ranking algorithm based on the concept of mutual interaction seems to be preferable to the HITS-based algorithm as a flexible folksonomy ranking framework. Some concrete points of difference are as follows. First, with the time concept applied to the property weights, our algorithm shows superior performance in lowering the scores of older data and raising the scores of newer data. Second, applying the time concept to the expertise weights, as well as to the property weights, our algorithm controls the conflicting influence of expertise weights and enhances overall consistency of time-valued ranking. The expertise weights of the previous study can act as an obstacle to the time-valued ranking because the number of followers increases as time goes on. Third, many new properties and classes can be included in our framework. The previous HITS-based algorithm, based on the voting notion, loses ground in the situation where the domain consists of more than two classes, or where other important properties, such as "sent through twitter" or "registered as a friend," are added to the domain. Forth, there is a big difference in the calculation time and memory use between the two kinds of algorithms. While the matrix multiplication of two matrices, has to be executed twice for the previous HITS-based algorithm, this is unnecessary with our algorithm. In our ranking framework, various folksonomy ranking policies can be expressed with the ranking factors combined and our approach can work, even if the folksonomy site is not implemented with Semantic Web languages. Above all, the time weight proposed in this paper will be applicable to various domains, including social media, where time value is considered important.

소셜 네트워크 분석 기법을 활용한 협업필터링의 특이취향 사용자(Gray Sheep) 문제 해결 (Resolving the 'Gray sheep' Problem Using Social Network Analysis (SNA) in Collaborative Filtering (CF) Recommender Systems)

  • 김민성;임일
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.137-148
    • /
    • 2014
  • 상품 검색시간의 단축과 쇼핑에 투입되는 노력의 감소 등, 온라인 쇼핑이 주는 장점에 대한 긍정적인 인식이 확산되면서 전자상거래(e-commerce)의 중요성이 부각되는 추세이다. 전자상거래 기업들은 고객확보를 위해 다양한 인터넷 고객관계 관리(eCRM) 활동을 전개하고 있는데, 개인화된 추천 서비스의 제공은 그 중 하나이다. 정확한 추천 시스템의 구축은 전자상거래 기업의 성과를 좌우하는 중요한 요소이기 때문에, 추천 서비스의 정확도를 높이기 위한 다양한 알고리즘들이 연구되어 왔다. 특히 협업필터링(collaborative filtering: CF)은 가장 성공적인 추천기법으로 알려져 있다. 그러나 고객이 상품을 구매한 과거의 전자상거래 기록을 바탕으로 미래의 추천을 하기 때문에 많은 단점들이 존재한다. 신규 고객의 경우 유사한 구매 성향을 가진 고객들을 찾기 어렵고 (Cold-Start problem), 상품 수에 비해 구매기록이 부족할 경우 상관관계를 도출할 데이터가 희박하게 되어(Sparsity) 추천성능이 떨어지게 된다. 취향이 독특한 사용자를 뜻하는 'Gray Sheep'에 의한 추천성능의 저하도 그 중 하나이다. 이러한 문제인식을 토대로, 본 연구에서는 소셜 네트워크 분석기법 (Social Network Analysis: SNA)과 협업필터링을 결합하여 데이터셋의 특이 취향 사용자 (Gray Sheep) 문제를 해소하는 방법을 제시한다. 취향이 독특한 고객들의 구매데이터를 소셜 네트워크 분석지표를 활용하여 전체 데이터에서 분리해낸다. 그리고 분리한 데이터와 나머지 데이터인 두 가지 데이터셋에 대하여 각기 다른 유사도 기법과 트레이닝 셋을 적용한다. 이러한 방법을 사용한 추천성능의 향상을 검증하기 위하여 미국 미네소타 대학 GroupLens 연구팀에 의해 수집된 무비렌즈 데이터(http://movielens.org)를 활용하였다. 검증결과, 일반적인 협업필터링 추천시스템에 비하여 이 기법을 활용한 협업필터링의 추천성능이 향상됨을 확인하였다.

한국가족계획사업(韓國家族計劃事業)의 문제점(問題點) (Problems in the Korean National Family Planning Program)

  • 홍종관
    • Clinical and Experimental Reproductive Medicine
    • /
    • 제2권2호
    • /
    • pp.27-36
    • /
    • 1975
  • The success of the family planning program in Korea is reflected in the decrease in the growth rate from 3.0% in 1962 to 2.0% in 1971, and in the decrease in the fertility rate from 43/1,000 in 1960 to 29/1,000 in 1970. However, it would be erroneous to attribute these reductions entirely to the family planning program. Other socio-economic factors, such as the increasing age at marriage and the increasing use of induced abortions, definitely had an impact on the lowered growth and fertility rate. Despite the relative success of the program to data in meeting its goals, there is no room for complacency. Meeting the goal of a further reduction in the population growth rate to 1.3% by 1981 is a much more difficult task than any one faced in the past. Not only must fertility be lowered further, but the size of the target population itself will expand tremendously in the late seventies; due to the post-war baby boom of the 1950's reaching reproductive ages. Furthermore, it is doubtful that the age at marriage will continue to rise as in the past or that the incidence of induced abortion will continue to increase. Consequently, future reductions in fertility will be more dependent on the performance of the national family planning program, with less assistance from these non-program factors. This paper will describe various approaches to help to the solution of these current problems. 1. PRACTICE RATE IN FAMILY PLANNING In 1973, the attitude (approval) and knowledge rates were quite high; 94% and 98% respectively. But a large gap exists between that and the actual practice rate, which is only 3695. Two factors must be considered in attempting to close the KAP-gap. The first is to change social norms, which still favor a larger family, increasing the practice rate cannot be done very quickly. The second point to consider is that the family planning program has not yet reached all the eligible women. A 1973 study determineded that a large portion, 3096 in fact, of all eligible women do not want more children, but are not practicing family planning. Thus, future efforts to help close the KAP-gap must focus attention and services on this important large group of potential acceptors. 2. CONTINUATION RATES Dissatisfaction with the loop and pill has resulted in high discontinuation rates. For example, a 1973 survey revealed that within the first six months initial loop acceptance. nearly 50% were dropouts, and that within the first four months of inital pill acceptance. nearly 50% were dropouts. These discontinuation rates have risen over the past few years. The high rate of discontinuance obviously decreases the contraceptive effectiveness. and has resulted in many unwanted births which is directly related to the increase of induced abortions. In the future, the family planning program must emphasize the improved quality of initial and follow-up services. rather than more quantity, in order to insure higher continuation rates and thus more effective contraceptive protection. 3. INDUCED ABORTION As noted earlier. the use of induced abortions has been increase yearly. For example, in 1960, the average number of abortions was 0.6 abortions per women in the 15-44 age range. By 1970. that had increased to 2 abortions per women. In 1966. 13% of all women between 15-44 had experienced at least one abortion. By 1971, that figure jumped to 28%. In 1973 alone, the total number of abortions was 400,000. Besides the ever incre.sing number of induced abortions, another change has that those who use abortions have shifted since 1965 to include- not. only the middle class, but also rural and low-income women. In the future. in response to the demand for abortion services among rural and low-income w~men, the government must provide and support abortion services for these women as a part of the national family planning program. 4. TARGET SYSTIi:M Since 1962, the nationwide target system has been used to set a target for each method, and the target number of acceptors is then apportioned out to various sub-areas according to the number of eligible couples in each area. Because these targets are set without consideration for demographic factors, particular tastes, prejudices, and previous patterns of acceptance in the area, a high discontinuation rate for all methods and a high wastage rate for the oral pill and condom results. In the future. to alleviate these problems of the methodbased target system. an alternative. such as the weighted-credit system, should be adopted on a nation wide basis. In this system. each contraceptive method is. assigned a specific number of points based upon the couple-years of protection (CYP) provided by the method. and no specific targets for each method are given. 5. INCREASE OF STERILIZA.TION TARGET Two special projects. the hospital-based family planning program and the armed forces program, has greatly contributed to the increasing acceptance in female and male sterilization respectively. From January-September 1974, 28,773 sterilizations were performed. During the same time in 1975, 46,894 were performed; a 63% increase. If this trend continues, by the end of 1975. approximately 70,000 sterilizations will have been performed. Sterilization is a much better method than both the loop and pill, in terms of more effective contraceptive protection and the almost zero dropout rate. In the future, the. family planning program should continue to stress the special programs which make more sterilizations possible. In particular, it should seek to add the laparoscope techniques to facilitate female sterilization acceptance rates. 6. INCREASE NUMBER OF PRIVATE ACCEPTORS Among the current family planning users, approximately 1/3 are in the private sector and thus do not- require government subsidy. The number of private acceptors increases with increasing urbanization and economic growth. To speed this process, the government initiated the special hospital based family planning program which is utilized mostly by the private sector. However, in the future, to further hasten the increase of private acceptors, the government should encourage doctors in private practice to provide family planning services, and provide the contraceptive supplies. This way, those do utilize the private medical system will also be able to receive family planning services and pay for it. Another means of increasing the number of private acceptors, IS to greatly expand the commercial outlets for pills and condoms beyond the existing service points of drugstores, hospitals, and health centers. 7. IE&C PROGRAM The current preferred family size is nearly twice as high as needed to achieve a stable poplation. Also, a strong boy preference hinders a small family size as nearly all couples fuel they must have at least one or more sons. The IE&C program must, in the future, strive to emphasize the values of the small family and equality of the sexes. A second problem for the IE&C program to work. with in the: future is the large group of people who approves family planning, want no more children, but do not practice. The IE&C program must work to motivate these people to accept family planning And finally, for those who already practice, an IE&C program in the future must stress continuation of use. The IE&C campaign, to insure highest effectiveness, should be based on a detailed factor analysis of contraceptive discontinuance. In conclusion, Korea faces a serious unfavorable sociodemographic situation- in the future unless the population growth rate can be curtailed. And in the future, the decrease in fertility will depend solely on the family planning program, as the effect of other socio-economic factors has already been maximumally felt. A second serious factor to consider is the increasing number of eligible women due to the 1950's baby boom. Thus, to meet these challenges, the program target must be increased and the program must improve the effectiveness of its current activities and develop new programs.

  • PDF