• Title/Summary/Keyword: Minimize Total Error

검색결과 76건 처리시간 0.033초

비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측 모델 (A Recidivism Prediction Model Based on XGBoost Considering Asymmetric Error Costs)

  • 원하람;심재승;안현철
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.127-137
    • /
    • 2019
  • 재범예측은 70년대 이전부터 전문가들에 의해서 꾸준히 연구되어온 분야지만, 최근 재범에 의한 범죄가 꾸준히 증가하면서 재범예측의 중요성이 커지고 있다. 특히 미국과 캐나다에서 재판이나 가석방심사 시 재범 위험 평가 보고서를 결정적인 기준으로 채택하게 된 90년대를 기점으로 재범예측에 관한 연구가 활발해졌으며, 비슷한 시기에 국내에서도 재범요인에 관한 실증적인 연구가 시작되었다. 지금까지 대부분의 재범예측 연구는 재범요인 분석이나 재범예측의 정확성을 높이는 연구에 집중된 경향을 보이고 있다. 그러나 재범 예측에는 비대칭 오류 비용 구조가 있기 때문에 경우에 따라 예측 정확도를 최대화함과 동시에 예측 오분류 비용을 최소화하는 연구도 중요한 의미를 가진다. 일반적으로 재범을 저지르지 않을 사람을 재범을 저지를 것으로 오분류하는 비용은 재범을 저지를 사람을 재범을 저지르지 않을 것으로 오분류하는 비용보다 낮다. 전자는 추가적인 감시 비용만 증가되는 반면, 후자는 범죄 발생에 따른 막대한 사회적, 경제적 비용을 야기하기 때문이다. 이러한 비대칭비용에 따른 비용 경제성을 반영하여, 본 연구에서 비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측모델을 제안한다. 모델의 첫 단계에서 최근 데이터 마이닝 분야에서 높은 성능으로 각광받고 있는 앙상블 기법, XGBoost를 적용하였고, XGBoost의 결과를 로지스틱 회귀 분석(Logistic Regression Analysis), 의사결정나무(Decision Trees), 인공신경망(Artificial Neural Networks), 서포트 벡터 머신(Support Vector Machine)과 같은 다양한 예측 기법과 비교하였다. 다음 단계에서 임계치의 최적화를 통해 FNE(False Negative Error)와 FPE(False Positive Error)의 가중 평균인 전체 오분류 비용을 최소화한다. 이후 모델의 유용성을 검증하기 위해 모델을 실제 재범예측 데이터셋에 적용하여 XGBoost 모델이 다른 비교 모델 보다 우수한 예측 정확도를 보일 뿐 아니라 오분류 비용도 가장 효과적으로 낮춘다는 점을 확인하였다.

MLSPIV를 이용한 유속산정시 오차요인 규명 및 실내실험을 통한 유속산정오차 분석 (Identification of Factors Affecting Errors of Velocity Calculation on Application of MLSPIV and Analysys of its Errors through Labortory Experiment)

  • 김영성;이현석
    • 한국수자원학회논문집
    • /
    • 제43권2호
    • /
    • pp.153-165
    • /
    • 2010
  • Large-Scale Particle Image Velocimetry (LSPIV)는 Particle Image Velocimetry (PIV)를 실험실내의 비교적 규모가 큰 흐름이나 하천에서의 표면유속장의 측정 등 넓은 영역에 적용할 수 있도록 확장시킨 것이다. LSPIV는 PIV의 구성요소를 포함하여 추적자 투하, 조명, 촬영, 이미지 변환, 이미지 처리 및 후처리의 여섯 단계로 구성된다. 본 연구에서는 LSPIV의 모바일 버전인 MLSPIV를 이용하여 하천에서의 유속측정시 각 단계별로 발생가능한 오차성분을 정의하였고, 기존의 연구 결과를 바탕으로 오차의 영향이 정량적으로 밝혀진 것을 정리하였다. 각 단계별로 오차 발생요인을 조사한 결과 27개의 성분오차성분을 파악하였다. 이중에서 5개의 오차요소는 기존에 연구가 진행되었고, 7개의 오차요소는 본 논문에서 적용시의 MLSPIV에는 그 효과가 미치지 않는 것으로 파악하였다. 나머지 15개의 오차성분 중 4가지 오차성분- 샘플링시간, 이미지 해상도, 추적자의 성질, 바람-에 대해서 유속산정시 미치는 영향을 파악하기 위하여 개수로 실험장치를 이용한 실내시험을 실시하였다. 이미지 프로세싱에 이용한 이미지수로부터 나타나는 유속계산 오차를 조사한 결과 이미지의 개수가 50매 이상인 경우는 이로 인한 오차가 1 % 이하로 감소함을 파악하였다. 촬영된 이미지의 해상도가 유속계산시 미치는 영향을 조사하기 위해 세 가지 이미지 해상도로 변화시키면서 유속측정 오차를 분석한 결과 저해상도의 이미지를 이용한 경우 고해상도 이미지를 이용한 경우와 비교하여 3 % 가량의 차이를 나타내었다. 추적자의 성질과 바람의 영향에 대해서는 흐름의 평균유속이 큰 경우에는 바람이 추적자에 마치는 영향이 현격히 줄어듬을 보이고 있다. 즉, 유속이 증가함에 따라 바람의 영향은 감소하나, 바람의 영향을 최소화시키기 위해서는 가급적 비중이 큰 물질(0.5

지상LiDAR를 이용한 터널의 Reverse Engineering (Tunnel Reverse Engineering Using Terrestrial LiDAR)

  • 조형식;손홍규;김종석;이석군
    • 대한토목학회논문집
    • /
    • 제28권6D호
    • /
    • pp.931-936
    • /
    • 2008
  • 지상LiDAR는 토탈스테이션에 비해 신속한 측량이 가능하기 때문에 터널의 내공단면 측량을 적기에 수행하고 중심선 오차와 여 미굴량 발생을 최소화할 수 있는 강점을 가지고 있어 지상LiDAR를 이용한 터널의 내공단면 측량 및 계측이 점점 증대되고 있으며 보다 효율적이고 정확한 지상LiDAR 활용을 위한 연구도 활발하게 진행 중이다. 현재 일반적으로 터널의 여 미굴량을 계산할 때 사용되는 양단면 평균법의 경우 기존 측량 방식인 토탈스테이션 및 사진측량 등과의 비교는 많이 이루어졌으나 터널 전체의 3차원 위치정보를 얻을 수 있는 지상LiDAR를 이용하여 터널의 내공단면을 측량 체적 및 여 미굴량을 구할 때 관측간격에 따른 기준이 없는 실정이다. 이에 본 연구에서는 시험터널에 대한 reverse engineering을 실시하여 터널 내공단면 측량 시 터널단면의 체적을 비교하여 가장 합리적인 간격을 결정하고 이 결과를 토대로 현재 설계 데이터가 존재하지 않는 시험터널에 대한 CAD도면을 제작하였다. 또한 지상LiDAR 기술의 정확도를 검증하기 위하여 토탈스테이션과의 비교를 통하여 타겟좌표 정확도, 입사각에 따른 정확도 분석을 실시하였다.

자동차 부품 수요의 예측 모형 개발 (Development of the Forecasting Model for Parts in an Automobile)

  • 홍정식;안재경;홍석기
    • 대한산업공학회지
    • /
    • 제27권3호
    • /
    • pp.233-238
    • /
    • 2001
  • This paper deals with demand forecasting of parts in an automobile model which has been extinct. It is important to estimate how much inventory of each part in the extinct model should be stocked because production lines of some parts may be replaced by new ones although there is still demands for the model. Furthermore, in some countries, there is a strong regulation that the automobile manufacturing company should provide customers with auto parts for several years whenever they are requested. The major characteristic of automobile parts demand forecasting is that there exists a close correlation between the number of running cars and the demand of each part. In this sense, the total demand of each part in a year is determined by two factors, the total number of running cars in that year and the failure rate of the part. The total number of running cars in year k can be estimated sequentially by the amount of shipped cars and proportion of discarded cars in years 1, 2,$\cdots$, i. However, it is very difficult to estimate the failure rate of each part because available inter-failure time data is not complete. The failure rate is, therefore, determined so as to minimize the mean squared error between the estimated demand and the observed demand of a part in years 1, 2,$\cdots$, i. In this paper, data obtained from a Korean automobile manufacturing company are used to illustrate our model.

  • PDF

DEVELOPMENT OF A CRYOGENIC TESTING SYSTEM FOR MID-INFRARED DETECTORS ON SPICA

  • Nishiyama, Miho;Kaneda, Hidehiro;Ishihara, Daisuke;Oseki, Shinji;Takeuchi, Nami;Nagayama, Takahiro;Wada, Takehiko
    • 천문학논총
    • /
    • 제32권1호
    • /
    • pp.355-357
    • /
    • 2017
  • For future space IR missions, such as SPICA, it is crucial to establish an experimental method for evaluating the performance of mid-IR detectors. In particular, the wavelength dependence of the sensitivity is important but difficult to be measured properly. We are now preparing a testing system for mid-IR Si:As/Si:Sb detectors on SPICA. We have designed a cryogenic optical system in which IR signal light from a pinhole is collimated, passed through an optical filter, and focused onto a detector. With this system, we can measure the photoresponse of the detector for various IR light using optical filters with different wavelength properties. We have fabricated aluminum mirrors which are adopted to minimize thermal distortion effects and evaluated the surface figure errors. The total wavefront error of the optical system is $1.3{\mu}m$ RMS, which is small enough for the target wavelengths ($20-37{\mu}m$) of SPICA. The point spread function measured at a room temperature is consistent with that predicted by the simulation. We report the optical performance of the system at cryogenic temperatures.

감소(減少)하는 고장률(故障率)하에서 오류예측 및 테스트 시간(時間)의 최적화(最適化)에 관한 연구(硏究) (Error Forecasting & Optimal Stopping Rule under Decreasing Failure Rate)

  • 최명호;윤덕균
    • 품질경영학회지
    • /
    • 제17권2호
    • /
    • pp.17-26
    • /
    • 1989
  • This paper is concerned with forecasting the existing number of errors in the computer software and optimizing the stopping time of the software test based upon the forecasted number of errors. The most commonly used models have assessed software reliability under the assumption that the software failure late is proportional to the current fault content of the software but invariant to time since software faults are independents of others and equally likely to cause a failure during testing. In practice, it has been observed that in many situations, the failure rate decrease. Hence, this paper proposes a mathematical model to describe testing situations where the failure rate of software limearly decreases proportional to testing time. The least square method is used to estimate parameters of the mathematical model. A cost model to optimize the software testing time is also proposed. In this cost mode two cost factors are considered. The first cost is to test execution cost directly proportional to test time and the second cost is the failure cost incurred after delivery of the software to user. The failure cost is assumed to be proportional to the number of errors remained in the software at the test stopping time. The optimal stopping time is determined to minimize the total cost, which is the sum of test execution cast and the failure cost. A numerical example is solved to illustrate the proposed procedure.

  • PDF

기능성 경사복합재의 적층조형을 위한 분해기반 공정계획 (Decomposition-based Process Planning far Layered Manufacturing of Functionally Gradient Materials)

  • 신기훈;김성환
    • 한국CDE학회논문집
    • /
    • 제11권3호
    • /
    • pp.223-233
    • /
    • 2006
  • Layered manufacturing(LM) is emerging as a new technology that enables the fabrication of three dimensional heterogeneous objects such as Multi-materials and Functionally Gradient Materials (FGMs). Among various types of heterogeneous objects, more attention has recently paid on the fabrication of FGMs because of their potentials in engineering applications. The necessary steps for LM fabrication of FGMs include representation and process planning of material information inside an FGM. This paper introduces a new process planning algorithm that takes into account the processing of material information. The detailed tasks are discretization (i.e., decomposition-based approximation of volume fraction), orientation (build direction selection), and adaptive slicing of heterogeneous objects. In particular, this paper focuses on the discretization process that converts all of the material information inside an FGM into material features like geometric features. It is thus possible to choose an optimal build direction among various pre-selected ones by approximately estimating build time. This is because total build time depends on the complexity of features. This discretization process also allows adaptive slicing of heterogeneous objects to minimize surface finish and material composition error. In addition, tool path planning can be simplified into fill pattern generation. Specific examples are shown to illustrate the overall procedure.

치과보철물의 재제작 실태에 관한 예비조사 (A pilot study on remake of dental prosthesis of dental laboratory working)

  • 남신은
    • 대한치과기공학회지
    • /
    • 제40권3호
    • /
    • pp.173-180
    • /
    • 2018
  • Purpose: The purpose of this study was to verify the remake rate and cause of dental prosthesis and to investigate major factors of remake of dental prosthesis. Methods: This study carried out self-administered questionnaire survey from 126 nationwide dental laboratory CEO and directors, which was conducted from September to October in 2016. Results: Total remake rate of dental prosthesis was 10.1% at the nationwide dental laboratories. It was in order of remake rate of dental prosthesis 11.8% for CAD/CAM, 11.5% for porcelain and 11.0% for implant prosthesis. Error of clinical impression was the highest remake cause(63.7%). Nevertheless, dental laboratory take the responsibility of expense for remake of dental prosthesis, regardless of remake cause(67.4%). There was no relation between dental laboratory characteristics and the remake rate of dental prosthesis(p>.05). Conclusion : The remake rate of dental prostheses should be reduced to minimize the economic loss of dental laboratories and raise dental prosthesis satisfaction. It is required to communicate of dentist, dental technicians, and patients, moreover, undistorted information about oral environment should be provided to the dental technicians.

Swarm Intelligence-based Power Allocation and Relay Selection Algorithm for wireless cooperative network

  • Xing, Yaxin;Chen, Yueyun;Lv, Chen;Gong, Zheng;Xu, Ling
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권3호
    • /
    • pp.1111-1130
    • /
    • 2016
  • Cooperative communications can significantly improve the wireless transmission performance with the help of relay nodes. In cooperative communication networks, relay selection and power allocation are two key issues. In this paper, we propose a relay selection and power allocation scheme RS-PA-PSACO (Relay Selection-Power Allocation-Particle Swarm Ant Colony Optimization) based on PSACO (Particle Swarm Ant Colony Optimization) algorithm. This scheme can effectively reduce the computational complexity and select the optimal relay nodes. As one of the swarm intelligence algorithms, PSACO which combined both PSO (Particle Swarm Optimization) and ACO (Ant Colony Optimization) algorithms is effective to solve non-linear optimization problems through a fast global search at a low cost. The proposed RS-PA-PSACO algorithm can simultaneously obtain the optimal solutions of relay selection and power allocation to minimize the SER (Symbol Error Rate) with a fixed total power constraint both in AF (Amplify and Forward) and DF (Decode and Forward) modes. Simulation results show that the proposed scheme improves the system performance significantly both in reliability and power efficiency at a low complexity.

다단 치차장치 설계 시스템 개발에 관한 연구(제 1보: 정식화된 제원 설계 프로세스의 제안) (Development of a Design System for Multi-Stage Gear Drives (1st Report : Procposal of Formal Processes for Dimensional Design of Gears))

  • 정태형
    • 한국정밀공학회지
    • /
    • 제17권9호
    • /
    • pp.202-209
    • /
    • 2000
  • In recent years the concern of designing multi-stage gear drives increases with the more application of gear drives in high-speed and high-load. until now however research on the gear drive design has been focused on single gear pairs and the design has been depended on experiences and know-how of designers and carried out commonly by trial and error. We propose the automation of the dimensional design of gears and the configuration design for gear arrangement of two-and three-stage cylindrical gear drives. The dimensional design is divided into two types of design processes to determine the dimensions of gears. The first design process(Process I) uses the total volume of gears to determine gear ratio and uses K factor unit load and aspect ratio to determine gear dimensions. The second one(Process II) makes use of Niemann's formula and center distance to calculate gear ratio and dimensions. Process I and II employ material data from AGMA and ISO standards respectively. The configuration design determines the positions of gears to minimize the volume of gearbox by simulated annealing algorithm. Finally the availability of the design algorithm is validated by the design examples of two-and three-stage gear drives.

  • PDF