• 제목/요약/키워드: Machine intelligence

검색결과 1,151건 처리시간 0.023초

머신러닝 기반 부도예측모형에서 로컬영역의 도메인 지식 통합 규칙 기반 설명 방법 (Domain Knowledge Incorporated Local Rule-based Explanation for ML-based Bankruptcy Prediction Model)

  • 조수현;신경식
    • 경영정보학연구
    • /
    • 제24권1호
    • /
    • pp.105-123
    • /
    • 2022
  • 신용리스크 관리에 해당하는 부도예측모형은 기업에 대한 신용평가라고도 볼 수 있으며 은행을 비롯한 금융기관의 신용평가모형의 기본 지식기반으로 새로운 인공지능 기술을 접목할 수 있는 유망한 분야로 손꼽히고 있다. 고도화된 모형의 실제 응용은 사용자의 수용도가 중요하나 부도예측모형의 경우, 금융전문가 혹은 고객에게 모형의 결과에 대한 설명이 요구되는 분야로 설명력이 없는 모형은 실제로 도입되고 사용자들에게 수용되기에는 어려움이 있다. 결국 모형의 결과에 대한 설명은 모형의 사용자에게 제공되는 것으로 사용자가 납득할 수 있는 설명을 제공하는 것이 모형에 대한 신뢰와 수용을 증진시킬 수 있다. 본 연구에서는 머신러닝 기반 모형에 설명력을 제고하는 방안으로 설명대상 인스턴스에 대하여 로컬영역에서의 설명을 제공하고자 한다. 이를 위해 설명대상의 로컬영역에 유전알고리즘(GA)을 이용하여 가상의 데이터포인트들을 생성한 후, 로컬 대리모델(surrogate model)로 연관규칙 알고리즘을 이용하여 설명대상에 대한 규칙기반 설명(rule-based explanation)을 생성한다. 해석 가능한 로컬 모델의 활용으로 설명을 제공하는 기존의 방법에서 더 나아가 본 연구는 부도예측모형에 이용된 재무변수의 특성을 반영하여 연관규칙으로 도출된 설명에 도메인 지식을 통합한다. 이를 통해 사용자에게 제공되는 규칙의 현실적 가능성(feasibility)을 확보하고 제공되는 설명의 이해와 수용을 제고하고자 한다. 본 연구에서는 대표적인 블랙박스 모형인 인공신경망 기반 부도예측모형을 기반으로 최신의 규칙기반 설명 방법인 Anchor와 비교하였다. 제안하는 방법은 인공신경망 뿐만 아니라 다른 머신러닝 모형에도 적용 가능한 방법(model-agonistic method)이다.

GPT를 활용한 개인정보 처리방침 안전성 검증 기법 (Safety Verification Techniques of Privacy Policy Using GPT)

  • 심혜연;권민서;윤다영;서지영;이일구
    • 정보보호학회논문지
    • /
    • 제34권2호
    • /
    • pp.207-216
    • /
    • 2024
  • 4차 산업혁명으로 인해 빅데이터가 구축됨에 따라 개인 맞춤형 서비스가 급증했다. 이로 인해 온라인 서비스에서 수집하는 개인정보의 양이 늘어났으며, 사용자들의 개인정보 유출 및 프라이버시 침해 우려가 높아졌다. 온라인 서비스 제공자들은 이용자들의 프라이버시 침해 우려를 해소하기 위해 개인정보 처리방침을 제공하고 있으나, 개인정보 처리방침은 길이가 길고 복잡하여 이용자가 직접 위험 항목을 파악하기 어려운 문제로 인해 오남용되는 경우가 많다. 따라서 자동으로 개인정보 처리방침이 안전한지 여부를 검사할 수 있는 방법이 필요하다. 그러나 종래의 블랙리스트 및 기계학습 기반의 개인정보 처리방침 안전성 검증 기법은 확장이 어렵거나 접근성이 낮은 문제가 있다. 본 논문에서는 문제를 해결하기위해 생성형 인공지능인 GPT-3.5 API를 이용한 개인정보 처리방침 안전성 검증 기법을 제안한다. 새로운 환경에서도 분류 작업을 수행할 수 있고, 전문 지식이 없는 일반인이 쉽게 개인정보 처리방침을 검사할 수 있다는 가능성을 보인다. 실험에서는 블랙리스트 기반 개인정보 처리방침과 GPT 기반 개인정보 처리방침이 안전한 문장과 안전하지 않은 문장의 분류를 얼마나 정확하게 하는지와 분류에 소요된 시간을 측정했다. 실험 결과에 따르면, 제안하는 기법은 종래의 블랙리스트 기반 문장 안전성 검증 기법보다 평균적으로 10.34% 높은 정확도를 보였다.

보존지역의 합리적 관리를 위한 철새 서식 확률지도 구축 - 부산 Eco Delta City (EDC)를 중심으로 - (Probability Map of Migratory Bird Habitat for Rational Management of Conservation Areas - Focusing on Busan Eco Delta City (EDC) -)

  • 김근한;공석준;김희년;구경아
    • 한국환경복원기술학회지
    • /
    • 제26권6호
    • /
    • pp.67-84
    • /
    • 2023
  • In some areas of the Republic of Korea, the designation and management of conservation areas do not adequately reflect regional characteristics and often impose behavioral regulations without considering the local context. One prominent example is the Busan EDC area. As a result, conflicts may arise, including large-scale civil complaints, regarding the conservation and utilization of these areas. Therefore, for the efficient designation and management of protected areas, it is necessary to consider various ecosystem factors, changes in land use, and regional characteristics. In this study, we specifically focused on the Busan EDC area and applied machine learning techniques to analyze the habitat of regional species. Additionally, we employed Explainable Artificial Intelligence techniques to interpret the results of our analysis. To analyze the regional characteristics of the waterfront area in the Busan EDC district and the habitat of migratory birds, we used bird observations as dependent variables, distinguishing between presence and absence. The independent variables were constructed using land cover, elevation, slope, bridges, and river depth data. We utilized the XGBoost (eXtreme Gradient Boosting) model, known for its excellent performance in various fields, to predict the habitat probabilities of 11 bird species. Furthermore, we employed the SHapley Additive exPlanations technique, one of the representative methodologies of XAI, to analyze the relative importance and impact of the variables used in the model. The analysis results showed that in the EDC business district, as one moves closer to the river from the waterfront, the likelihood of bird habitat increases based on the overlapping habitat probabilities of the analyzed bird species. By synthesizing the major variables influencing the habitat of each species, key variables such as rivers, rice fields, fields, pastures, inland wetlands, tidal flats, orchards, cultivated lands, cliffs & rocks, elevation, lakes, and deciduous forests were identified as areas that can serve as habitats, shelters, resting places, and feeding grounds for birds. On the other hand, artificial structures such as bridges, railways, and other public facilities were found to have a negative impact on bird habitat. The development of a management plan for conservation areas based on the objective analysis presented in this study is expected to be extensively utilized in the future. It will provide diverse evidential materials for establishing effective conservation area management strategies.

HEC 소프트웨어 기반 홍수범람지도 엑셀러레이터 개발 (A Development of Flood Mapping Accelerator Based on HEC-softwares)

  • 김종천;황석환;정종호
    • 대한토목학회논문집
    • /
    • 제44권2호
    • /
    • pp.173-182
    • /
    • 2024
  • 최근 홍수예측과 관련한 연구에서 기계학습과 같은 인공지능 기법을 이용한 데이터모형의 활용에 관한 관심이 높다. 데이터모형은 미리 학습된 정보를 활용하기 때문에 모의에 소요되는 시간을 크게 줄일 수 있다는 장점이 있다. 그러나 데이터모형의 사전학습을 위해서는 많은 양의 침수자료가 필요한 데 반하여 적용할 수 있는 실측자료가 부족한 것이 현실이다. 대안으로 매개변수가 검정된 물리모형의 모의 결과를 실측자료와 함께 사전학습자료로 활용하고 있다. 이러한 상황에서 본 연구에서는 하천범람에 의한 침수예측에 데이터모형을 활용하고자 사전학습을 위한 홍수범람지도를 생성하는 엑셀러레이터를 개발하였다. 개발된 엑셀러레이터에서는 HEC-1을 이용한 홍수량 산정, HEC-RAS를 이용한 홍수위 산정, RAS Mapper를 이용한 하천범람 모의 및 침수예상도 출력의 전체 과정을 자동화한다. 이에 따라 사용자는 수백에서 수십만건의 강우시나리오에 대하여 손쉽게 침수예상도 데이터베이스를 구축할 수 있다. 그래픽 편의 인터페이스(GUI)를 포함하여 홍수범람지도 작성에 필요한 다양한 편의기능을 탑재하고 있으며, 전국에 걸쳐서 위치한 26개소의 테스트베드에 적용하여 실무적용성을 검토하였다.

온라인 주식 포럼의 핫토픽 탐지를 위한 감성분석 모형의 개발 (Development of Sentiment Analysis Model for the hot topic detection of online stock forums)

  • 홍태호;이태원;리징징
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.187-204
    • /
    • 2016
  • 소셜 미디어를 이용하는 사용자들이 직접 작성한 의견 혹은 리뷰를 이용하여 상호간의 교류 및 정보를 공유하게 되었다. 이를 통해 고객리뷰를 이용하는 오피니언마이닝, 웹마이닝 및 감성분석 등 다양한 연구분야에서의 연구가 진행되기 시작하였다. 특히, 감성분석은 어떠한 토픽(주제)를 기준으로 직접적으로 글을 작성한 사람들의 태도, 입장 및 감성을 알아내는데 목적을 두고 있다. 고객의 의견을 내포하고 있는 정보 혹은 데이터는 감성분석을 위한 핵심 데이터가 되기 때문에 토픽을 통한 고객들의 의견을 분석하는데 효율적이며, 기업에서는 소비자들의 니즈에 맞는 마케팅 혹은 투자자들의 시장동향에 따른 많은 투자가 이루어지고 있다. 본 연구에서는 중국의 온라인 시나 주식 포럼에서 사용자들이 직접 작성한 포스팅(글)을 이용하여 기존에 제시된 토픽들로부터 핫토픽을 선정하고 탐지하고자 한다. 기존에 사용된 감성 사전을 활용하여 토픽들에 대한 감성값과 극성을 분류하고, 군집분석을 통해 핫토픽을 선정하였다. 핫토픽을 선정하기 위해 k-means 알고리즘을 이용하였으며, 추가로 인공지능기법인 SOM을 적용하여 핫토픽 선정하는 절차를 제시하였다. 또한, 로짓, 의사결정나무, SVM 등의 데이터마이닝 기법을 이용하여 핫토픽 사전 탐지를 하는 감성분석을 위한 모형을 개발하여 관심지수를 통해 선정된 핫토픽과 탐지된 핫토픽을 비교하였다. 본 연구를 통해 핫토픽에 대한 정보 제공함으로써 최신 동향에 대한 흐름을 알 수 있게 되고, 주식 포럼에 대한 핫토픽은 주식 시장에서의 투자자들에게 유용한 정보를 제공하게 될 뿐만 아니라 소비자들의 니즈를 충족시킬 수 있을 것이라 기대된다.

지능형 온라인 핸드메이드 서비스 도입을 위한 구매자 의사결정모형에 관한 연구 (A Study on the Buyer's Decision Making Models for Introducing Intelligent Online Handmade Services)

  • 박종원;양성병
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.119-138
    • /
    • 2016
  • 산업혁명 이후 기계로 만든 공산품이 시장의 대부분을 차지하고 있지만, 최근에는 장인의 노력, 품질에 대한 믿음, 제품의 희소성, 제품을 사용함으로써 얻는 자부심 등을 이유로 많은 소비자들이 같은 범주의 공산품보다 더 비싼 가격을 주고 핸드메이드 제품을 구매하고 있다. Etsy.com은 세계 최대 온라인 핸드메이드 플랫폼으로 2015년 4월 기업공개에서 2조원이 넘는 자금을 조달하면서 온라인 핸드메이드 플랫폼의 잠재력을 증명하였다. 그러나 실제 온라인 플랫폼 환경에서 이루어진 지능형 서비스 관련 선행연구들을 살펴보면 대부분 공산품만을 대상으로 하고 있어, 핸드메이드 제품에 대한 학술적 접근이 충분히 이뤄지지 않고 있음을 알 수 있다. 이에, 본 연구에서는 신호 이론과 온라인 플랫폼에서의 구매자-판매자 관계 특성에 대한 선행연구를 바탕으로 온라인 핸드메이드 플랫폼에 적용 가능한 핵심 특성요인인 입점 상점 특성(명성, 규모)과 입점 상점 관계특성(정보공유, 관계기간)을 도출한 후, Etsy.com 웹사이트에서 웹 하베스팅 방법으로 수집된 데이터를 이용하여 실증 분석하였다. 분석 결과, 입점 상점 특성 가운데 명성과 규모, 그리고 입점 상점 관계특성 가운데 정보공유는 입점 상점의 총 판매량에 유의한 영향을 주는 것으로 확인되었다. 또한, 입점 상점 특성 중 명성, 그리고 입점 상점 관계특성 중 관계기간은 입점 상점의 가격 프리미엄에 유의한 영향을 주는 것으로 나타났다. 본 연구의 결과로 온라인 핸드메이드 플랫폼에서 지능형 서비스 도입 및 운영을 위한 효과적인 관리 기준을 제시하고, 나아가 입점 상점이 핸드메이드 제품에 대한 판매량 증진 및 가격 프리미엄 극대화를 위한 실질적 전략 마련에 도움이 될 수 있기를 기대한다.

AdaBoost 알고리즘기반 SVM을 이용한 부실 확률분포 기반의 기업신용평가 (Corporate Credit Rating based on Bankruptcy Probability Using AdaBoost Algorithm-based Support Vector Machine)

  • 신택수;홍태호
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.25-41
    • /
    • 2011
  • 최근 몇 년간 SVM(support vector machines)기법은 패턴인식 또는 분류의사결정문제를 위한 분석기법으로서 기존의 데이터마이닝 기법과 비교할 때, 매우 높은 성과를 갖는 것으로 인식되어 왔다. 더 나아나 많은 연구자들은 SVM기법이 1980년대 이후 대표적인 예측 및 분류모형으로 인정받은 인공신경망기법(ANNs : Artificial Neural Networks)에 비해 더 성과가 좋다는 사실을 실증적으로 입증해 왔다(Amendolia et al., 2003; Huang et al., 2004, Huang et al., 2005; Tay and Cao, 2001; Min and Lee, 2005; Shin et al., 2005; Kim, 2003). 일반적으로 이와 같이 다양한 데이터마이닝 기법에 의해 분석되는 이진분류 또는 다분류 의사결정문제들은 특히 금융분야 등에 있어서 오분류비용에 민감하며, 이로 인한 오분류의 경제적 손실도 상대적으로 매우 크다고 할 수 있다. 따라서 기업부도예측모형과 같은 이진분류모형의 결과값을, 부도확률에 기초하여 정교하게 계산된 사후확률의 개념으로서 다분류의 신용등급평가의 문제로 변환할 필요가 있다. 그러나, SVM 모형의 결과값은 기본적으로 그와 같은 부도확률분포를 보여주지 않는다. 따라서, 그러한 확률분포를 정교하게 보여줄 방법을 제시할 필요가 있다(Platt, 1999; Drish, 2001). 본 연구는 AdaBoost 알고리즘기반의 SVM 모형을 이용하여, 이진분류모형으로서 IT 기업의 부실예측모형에 적용한 후, 이 SVM 모형의 예측결과를 SVM의 손실함수에 적용하여 계산된 값을 사후부도확률의 정규분포 특성에 따라 이를 구간화하여 IT기업에 대한 다분류 신용등급 평가의 문제로 전환시키는 방법을 제시하였다. 그리고 본 연구에서 제안하는 방법은 이러한 AdaBoost 알고리즘기반 SVM 모형이 각 기업이 고유한 신용위험(부도확률)을 갖고 있다는 조건하에서, 신용등급부여를 위한 부도확률분포 구간을 정교하게 조정함으로써 오분류 문제를 좀 더 줄일 수 있음을 제시하였다.

머신러닝 기법을 이용한 납축전지 열화 예측 모델 개발 (Building battery deterioration prediction model using real field data)

  • 최근호;김건우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.243-264
    • /
    • 2018
  • 현재 전세계 배터리 시장은 이차전지 개발에 박차를 가하고 있는 실정이지만, 실제로 소비되는 배터리 중 가격 대비 성능이 좋고 재충전을 통해 다시 재사용이 가능한 납축전지(이차전지)의 소비가 광범위하게 이루어지고 있다. 하지만 납축전지는 복합적 셀(cell)을 묶어 하나의 배터리를 구성하여 활용하는 배터리의 특성상 하나의 셀에서 열화가 발생하면 전체 배터리의 손상을 가져와 열화가 빨리 진행되는 문제가 존재한다. 이를 극복하기 위해 본 연구는 기계학습을 통한 배터리 상태 데이터를 학습하여 배터리 열화를 예측할 수 있는 모델을 개발하고자 한다. 이를 위해 실제 현장에서 배터리 상태를 지속적으로 모니터링 할 수 있는 센서를 골프장 카트에 부착하여 실시간으로 배터리 상태 데이터를 수집하고, 수집한 데이터를 이용하여 기계학습 기법을 적용한 분석을 통해 열화 전조 현상에 대한 예측 모델을 개발하였다. 총 16,883개의 샘플을 분석 데이터로 사용하였으며, 예측 모델을 만들기 위한 알고리즘으로 의사결정나무, 로지스틱, 베이지언, 배깅, 부스팅, RandomForest를 사용하였다. 실험 결과, 의사결정나무를 기본 알고리즘으로 사용한 배깅 모델이 89.3923%이 가장 높은 적중률을 보이는 것으로 나타났다. 본 연구는 날씨와 운전습관 등 배터리 열화에 영향을 줄 수 있는 추가적인 변수들을 고려하지 못했다는 한계점이 있으나, 이는 향후 연구에서 다루고자 한다. 본 연구에서 제안하는 배터리 열화 예측 모델은 배터리 열화의 전조현상을 사전에 예측함으로써 배터리 관리를 효율적으로 수행하고 이에 따른 비용을 획기적으로 줄일 수 있을 것으로 기대한다.

Are you a Machine or Human?: 소셜 로봇의 인간 유사성과 소비자 해석수준이 의인화에 미치는 영향 (Are you a Machine or Human?: The Effects of Human-likeness on Consumer Anthropomorphism Depending on Construal Level)

  • 이준식;박도형
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.129-149
    • /
    • 2021
  • 최근 인간과 사회적으로 상호작용할 수 있는 소셜 로봇(Social Robot)에 대한 관심이 커지고 있다. ICT 기술 발전에 힘입어 소셜 로봇이 개인에게 맞춤형 서비스와 정서적 교감을 제공하기 쉬워졌으며, 현대의 사회문제들과 이로 인한 개인의 삶의 질 저하를 해소하기 위한 수단으로 소셜 로봇의 역할이 주목받고 있다. 소셜 로봇에 대한 관심에 힘입어 소셜 로봇 보급 또한 크게 늘고 있다. 많은 기업이 다양한 목표시장을 겨냥하기 위한 로봇 제품들을 시장에 선보이고 있으나, 현재까지 시장을 선도하는 명확한 흐름은 부재하다. 이에 따라 소셜 로봇의 디자인을 통해 로봇을 차별화하고자 하는 시도가 늘고 있다. 특히 의인화는 소셜 로봇 디자인에서 중요하게 연구되고 있으며, 소셜 로봇을 의인화하여 긍정적인 효과를 발현하려는 접근이 많이 시도되었다. 그러나 소셜 로봇에 대한 의인화가 형성되는 메커니즘을 체계적으로 설명하는 연구는 부족하다. 의인화에 대한 모호한 이해는 소셜 로봇의 의인화를 형성하기 위한 디자인 최적점의 도출을 어렵게 하고 있다. 본 연구는 소셜 로봇의 의인화가 형성되는 메커니즘을 검증하는 것을 목적으로 한다. 본 연구는 3×2 Mixed Design의 실험 연구를 통해 소셜 로봇의 인간 유사성(Human-likeness)과 개인의 해석수준(Construal Level)이 의인화 형성에 미치는 영향을 확인하였다. 의인화가 형성되는 메커니즘에 대한 6개의 연구 가설을 제시하고, 206명 표본의 데이터를 분석하여 가설을 검증하였다. 분석 결과 소셜 로봇의 인간 유사성 수준에 따라 로봇 의인화 수준이 높아지며, 소비자 해석수준에 따라 인간 유사성이 의인화에 미치는 영향이 다르게 나타남을 확인하였다. 본 연구는 소셜 로봇의 디자인 속성인 인간 유사성과 개인의 사고방식인 해석수준을 함께 고려하여 의인화가 형성되는 메커니즘을 설명하였다는 점에서 시사점이 있다. 본 연구의 결과를 소셜 로봇 의인화 형성을 위한 디자인 최적화의 기준으로 활용할 수 있을 것으로 기대한다.

기계학습을 활용한 특허수명 예측 및 영향요인 분석 (Prediction of patent lifespan and analysis of influencing factors using machine learning)

  • 김용우;김민구;김영민
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.147-170
    • /
    • 2022
  • 특허의 사적 가치(private value)를 나타내는 특허수명 추정은 오래전부터 연구되었으나 추정과정에서 선형모델에 의존하는 경우가 대부분이었고, 기계학습 방법을 사용하더라도 변수 간 관계에 대한 해석이나 설명이 부족하였다. 본 연구에서는 특허의 생존 기간이 특허의 가치를 대리한다는 기존 연구결과를 바탕으로 특허 등록 이후의 생존 기간(연장횟수) 예측을 통해 특허의 가치를 추정한다. 이를 위해 1996~2017년까지 미국 특허청(USPTO)에 출원하여 등록된 특허 4,033,414개를 수집하였다. 특허수명을 예측하기 위해 기존 연구에서 특허수명에 영향을 미친다고 밝혀진 특허의 특성, 특허의 소유자 특성, 특허의 발명가 특성을 반영할 수 있는 다양한 변수가 사용되었다. 서로 다른 4개의 모델(Ridge Regression, Random Forest, Feed-forward Neural Network, Gradient Boosting Models)을 생성하고, 모델 학습 과정에서는 5-fold Cross Validation으로 초매개변수 조정이 이루어졌다. 이후 생성된 모델의 성능을 평가하고 특허수명을 추정할 수 있는 예측변수의 상대적 중요도를 제시하였다. 또한, 성능이 우수했던 Gradient Boosting Model을 기반으로 Accumulated Local Effects Plot을 제시하여 예측변수와 특허수명 간 관계를 시각적으로 나타내었다. 마지막으로 모델에 의해서 평가된 개별 특허의 평가 근거를 제시하기 위하여 Kernal SHAP(SHapley Additive exPlanations)을 적용하고 특허평가 시스템에의 적용 가능성을 제시한다. 본 연구는 기존에 특허수명을 추정하는 연구에 누적적으로 기여한다는 점 그리고 선형성을 바탕으로 진행된 기존 특허수명 추정 연구들의 한계를 보완하고 복잡한 비선형 관계를 설명가능한 방식으로 제시하였다는 점에서 학문적 의의가 있다. 또한, 개별 특허의 평가 근거를 도출하는 방법을 소개하고 특허평가 시스템에의 적용 가능성을 제시하였다는 점에서 실무적 의의가 있다.