• 제목/요약/키워드: fair prediction

검색결과 32건 처리시간 0.018초

Learning fair prediction models with an imputed sensitive variable: Empirical studies

  • Kim, Yongdai;Jeong, Hwichang
    • Communications for Statistical Applications and Methods
    • /
    • 제29권2호
    • /
    • pp.251-261
    • /
    • 2022
  • As AI has a wide range of influence on human social life, issues of transparency and ethics of AI are emerging. In particular, it is widely known that due to the existence of historical bias in data against ethics or regulatory frameworks for fairness, trained AI models based on such biased data could also impose bias or unfairness against a certain sensitive group (e.g., non-white, women). Demographic disparities due to AI, which refer to socially unacceptable bias that an AI model favors certain groups (e.g., white, men) over other groups (e.g., black, women), have been observed frequently in many applications of AI and many studies have been done recently to develop AI algorithms which remove or alleviate such demographic disparities in trained AI models. In this paper, we consider a problem of using the information in the sensitive variable for fair prediction when using the sensitive variable as a part of input variables is prohibitive by laws or regulations to avoid unfairness. As a way of reflecting the information in the sensitive variable to prediction, we consider a two-stage procedure. First, the sensitive variable is fully included in the learning phase to have a prediction model depending on the sensitive variable, and then an imputed sensitive variable is used in the prediction phase. The aim of this paper is to evaluate this procedure by analyzing several benchmark datasets. We illustrate that using an imputed sensitive variable is helpful to improve prediction accuracies without hampering the degree of fairness much.

주가 경향 예측 모델의 공정한 성능 평가 방법 (Fair Performance Evaluation Method for Stock Trend Prediction Models)

  • 임정수
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.702-714
    • /
    • 2020
  • 주식 투자는 재테크의 하나로 금리 인하와 비과세 제도의 축소에 따라 주목을 받기 시작했다. 그러나 투자에 전문적인 지식이 필요할 뿐 아니라 위험 부담이 크다는 단점이 있다. 따라서 주가 경향의 정확한 예측은 개인투자자에게나 주식 투자 관련 서비스를 제공하는 회사에 중요한 능력이며, 더욱 정확한 예측을 위한 연구가 활발히 진행 중이다. 그러나 예측 연구들의 공정한 비교와 최고의 예측 모델을 얻기 위한 하이퍼-파라미터의 최적화에는 예측 모델의 성능을 정확하게 평가하는 방법이 필요한데, 지금까지 예측 모델의 성능 평가에 대한 연구는 미진한 상태이며, 기존 방법들을 그대로 답습하고 있는 실정이다. 이에 본 논문에서는 주가 예측 모델 성능 평가를 측정기준과 데이터 구성의 관점에서 분석하고, 예측 불균형 비율을 이용한 주가 경향 예측 모델의 공정한 성능 평가 방법을 제안한다.

링크 계층 재전송을 고려한 무선 패킷 스케줄링 알고리즘 (Wireless Packet Scheduling Algorithms based on Link Level Retransmission)

  • 김남기;윤현수
    • 한국통신학회논문지
    • /
    • 제30권2A호
    • /
    • pp.98-106
    • /
    • 2005
  • 본 논문에서는 MAC 계층 이하에 존재하는 링크 계층 재전송 기법과 잘 부합할 수 있는 새로운 무선 패킷 스케줄링 알고리즘인 WFQ-R (Wireless Fair Queueing with Retransmission) 알고리즘을 제안한다. WFQ-R 알고리즘에서 링크 계층 재전송에 의해 사용된 자원은 재전송을 수행한 플로우(flow)가 다른 플로우들에게 미리 차용한 자원으로 취급한다. 즉 MAC 계층 이하의 재전송 과정에서 패킷 스케줄러의 허락 없이 사용되어진 자원을 재전송을 수행한 플로우에게 책임 지움으로써 WFQ-R 알고리즘은 무선 공평성(fairness)을 획득할 수 있게 된다. 본 논문에서는 실험을 통하여 WFQ-R 알고리즘기 공평성을 유지함과 동시에 시스템 성능을 최대화 함을 보인다. 또 플로우 구분성(seperation)과 보상성(compensation)도 획득할 수 있음도 보인다.

한국어 기계독해 기반 법률계약서 리스크 예측 모델 (Risk Prediction Model of Legal Contract Based on Korean Machine Reading Comprehension)

  • 이치훈;노지우;정재훈;주경식;이동희
    • 한국IT서비스학회지
    • /
    • 제20권1호
    • /
    • pp.131-143
    • /
    • 2021
  • Commercial transactions, one of the pillars of the capitalist economy, are occurring countless times every day, especially small and medium-sized businesses. However, small and medium-sized enterprises are bound to be the legal underdogs in contracts for commercial transactions and do not receive legal support for contracts for fair and legitimate commercial transactions. When subcontracting contracts are concluded among small and medium-sized enterprises, 58.2% of them do not apply standard contracts and sign contracts that have not undergone legal review. In order to support small and medium-sized enterprises' fair and legitimate contracts, small and medium-sized enterprises can be protected from legal threats if they can reduce the risk of signing contracts by analyzing various risks in the contract and analyzing and informing them of toxic clauses and omitted contracts in advance. We propose a risk prediction model for the machine reading-based legal contract to minimize legal damage to small and medium-sized business owners in the legal blind spots. We have established our own set of legal questions and answers based on the legal data disclosed for the purpose of building a model specialized in legal contracts. Quantitative verification was carried out through indicators such as EM and F1 Score by applying pine tuning and hostile learning to pre-learned machine reading models. The highest F1 score was 87.93, with an EM value of 72.41.

X-대역 마이크로스트립 배열 안테나 설계 (Design of An X-Band Microstrip Array Antenna)

  • 윤용민;이석곤;최재현;노진입;김동환;안병철
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(1)
    • /
    • pp.447-450
    • /
    • 2002
  • In this paper, we present design methods for a series-fed microstrip patch array operating at X-band frequency. The array consists of 18 rectangular patches connected to 3 quarter-wave impedance transformers. The power divider is designed for the uniform element excitation. The element excitation is then made to be tapered by increasing the input impedance of elements located at array edges. The designed antenna is fabricated and tested. Results of test show a fair agreement with the prediction.

  • PDF

정성변수를 고려한 공공아파트 기획단계 공사비 예측모델 (Cost Prediction Model using Qualitative Variables focused on Planning Phase for Public Multi-Housing Projects)

  • 지성민;현창택;문현석
    • 한국건설관리학회논문집
    • /
    • 제13권2호
    • /
    • pp.91-101
    • /
    • 2012
  • 공공아파트 프로젝트의 기획단계에서 수행되는 적정 공사비 예측은 기획부터 유지관리까지 전(全) 단계에 걸쳐서 영향을 미치게 되므로 명확한 예측기준 및 방법이 제시되어야 한다. 그러나 현재까지 다양한 다중회귀모델을 활용한 공사비 예측 방법이 개발되어 왔으나, 정성변수를 포함하여 공사비를 예측하는 방법에 대한 연구는 부족한 상황이다. 따라서 본 연구에서는 기획단계 활용을 위한 정성변수를 포함하는 공사비 예측모델을 개발하고자 하였다. 이를 위하여 공사비 영향요인을 분석 및 추출하고, 회귀분석을 위한 독립변수를 선정하였다. 그리고 정성변수를 포함하는 공사비 예측모델을 개발하며 사례적용을 통한 검증을 실시하였다. 개발된 공사비 예측모델과 "RESAMPLING 기법"을 사용하여 구조형식별 공사비 가산비율을 제시하였다. 본 연구에서 제시한 더미회귀모델과 가산비율을 활용하면, 일반적인 공사비 예측과 함께 동일한 평형, 세대수, 연면적에서 평면형식과 구조형식을 변경시켰을 때의 공사비 예측이 가능할 것으로 기대된다.

초고압 가공 송전선로의 라디오 잡음 예측계산식 개발 (I) (Formulas for Predicting Radio Noise from Overhead HVAC Transmission Lines)

  • 양광호;주문노;명성호;신구용;이동일
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 하계학술대회 논문집 C
    • /
    • pp.1088-1090
    • /
    • 1999
  • The radio noise produced by corona discharge in high voltage transmission tines is one of the most important line design considerations. Therefore it is necessary to pre-evaluate radio noise for transmission line designers using Prediction formulas or field test results. In this Paper, more accurate and useful formulas for Predicting radio noise during fair and foul weathers in AC transmission lines were proposed through comparison with the existing formulas. Also it was verified by comparing with the long-term measured data from operating lines that the Proposed formulas are very accurate. The Proposed prediction formulas are developed by the applications of nonlinear least square optimization method to radio noise database collected from lines throughout the world.

  • PDF

Prediction Models on Internet Auctions

  • Hong, Chong-Sun;Song, Ki-Yong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권3호
    • /
    • pp.795-804
    • /
    • 2006
  • Most internet auction sites open to users the bid history with the ascending order of bid amounts. Whereas eBay.com presents second bid prices, auction.co.kr provides highest bid prices. In this paper, the bidhistory is arranged according to the passage of tim, which can help to understand the situations and trends of bid prices, especially for multiple auctions. This manipulated data can be visualized by using profile plots. The successful bid prices could be estimated based on some prediction models with appropriate prior informations. Both sellers and bidders can be provided useful informations with these statistical analyses, and then fair online auctions in Korea will grow actively and rapidly.

  • PDF

원추지수를 이용한 경운 정지 작업의 작업성 예측 (Prediction of tillage Workability by Cone Index)

  • 최석원;오영근;김경욱
    • Journal of Biosystems Engineering
    • /
    • 제25권3호
    • /
    • pp.195-202
    • /
    • 2000
  • This study was conducted to recognize a possibility that cone index can be used as a means of evaluating the tillage workability. Cone indexes were measured every 24 hours after rainfall at the experimental plots, and the rotary and plowing operations were conducted at the same time. The workability was evaluated on a basis of three categories of good, fair and poor depending on the quality of the performed works. Although the workability was affected by many factors such as soil type, moisture content ground slope and weather condition, the duration and amount of rainfall were of most influence. Results of the study showed that a good workability was resulted from the cone indexes greater than an average of 552 kPa for rotary operations and 671 kPa for plowing operations. Fair work was obtained with cone indexes greater than an average of 331 kPa for rotary operations and 459 kPa for plowing operations. The cone indexes less than an average of 171 kPa and 149 kPa resulted in poor workabilities for rotary and plowing operations, respectively. The experimental results may provide a general guideline for evaluating the tillage workability by cone index.

  • PDF

국내 회사채 신용 등급 예측 모형의 비교 연구 (Comparative study of prediction models for corporate bond rating)

  • 박형권;강준영;허성욱;유동현
    • 응용통계연구
    • /
    • 제31권3호
    • /
    • pp.367-382
    • /
    • 2018
  • 회사채 신용 등급 예측 모형에 대한 연구는 신용 평가 기관이 회사채 신용 등급 평가에 사용될 것이라 예상 되는 여러 재무적 특성 변수들을 기반으로 진행되었으며 선형 회귀 모형(linear regression), 순위 로짓(ordered logit), 순위 프로빗(ordered probit), 서포트 벡터 기계(support vector machine), 랜덤 포레스트(random forest) 등 다양한 모형들을 적용하여 개발되었다. 하지만 기존 연구들에서 고려한 회사채 신용 등급은 연구에 따라 5등급에서 20등급까지 다른 등급 구간을 적용하였으며 분석에 이용된 표본 자료의 기간 및 대상도 상이하여 예측 성능의 공정한 비교에 어려움이 있다. 따라서 본 연구에서는 2013년부터 2017년까지의 회사채 신용 등급 자료와 기존 연구들에서 사용된 재무 지표들을 통합하여 기존에 발표된 예측 모형들을 동일한 자료에 적용하고 예측 성능을 비교하였다. 추가적으로 Elastic-net 벌점화 회귀 모형 및 순위 로짓, 순위 프로빗 모형을 적합하여 LASSO 벌점이 선택됨을 확인하였으며 LASSO 벌점을 고려한 예측 모형이 대응하는 기존의 예측 모형들보다 향상된 성능을 보임을 확인하였다. 본 연구의 수행 결과, 랜덤 포레스트를 이용한 예측 모형이 15등급 기준 검증 자료에서 정확한 등급 예측률이 69.6%로 다른 모형과 비교하여 높은 예측 성능을 나타내었다.