• 제목/요약/키워드: 의사결정 알고리즘

검색결과 583건 처리시간 0.022초

신용카드 불법현금융통 적발을 위한 축소된 앙상블 모형 (Illegal Cash Accommodation Detection Modeling Using Ensemble Size Reduction)

  • 이화경;한상범;지원철
    • 지능정보연구
    • /
    • 제16권1호
    • /
    • pp.93-116
    • /
    • 2010
  • 불법현금융통 적발모형 개발에 앙상블 접근방법을 사용하였다. 불법현금융통은 국내 신용카드사의 손익에 영향을 미치며 최근 국제화되고 있음에도 불구하고 학문적인 접근이 이루어지지 않았다. 부정행위 적발모형(Fraud Detection Model, FDM)은 데이터 불균형 문제로 인하여 좋은 성능을 얻기 어려운데, 다수의 모형을 결합하는 앙상블이 대안으로 제시되어 왔다. 앙상블에 포함된 모형들의 다양성이 보장된다면 단일모형에 비해 더 좋은 성능을 보인다는 점은 이미 인정되고 있으며, 최근 연구 결과는 학습된 모든 기본모형들을 사용하는 것보다 적절한 기본모형들만 선택하여 앙상블에 포함시키는 것이 바람직하다는 것이다. 본 논문에서는 효과적인 불법현금융통 적발을 위하여 축소된 앙상블 기법을 사용하는데, 정확성과 다양성 척도를 사용하여 앙상블에 참여할 기본모형을 선택하는 것이다. 다양성은 앙상블을 구성하는 기본모형들 사이의 불일치 (Disagreement or Ambiguity)를 의미하는데, FDM에 내재된 데이터 불균형문제를 고려하여 두 가지 측면에 중점을 두었다. 첫째, 학습 자료의 추출 과정에서 다양성을 확보하기 위한 소수 범주의 과잉추출 방법과 적절한 훈련 방법에 대해 설명하였다. 둘째, 소수범주에 초점을 맞추어 기존의 다양성 척도를 효과적인 척도로 변형시키고, 전진추가법과 후진소거법의 동적 다양성 계산법을 도입하여 앙상블에 참여할 기본모형을 평가하였다. 실험에 사용된 학습 알고리즘은 신경망, 의사결정수와 로짓 회귀분석이었으며, 동질적 앙상블과 이질적 앙상블을 구성하여 성능평가를 하였다. 실험결과 불법현금융통 적발모형에 있어 축소된 앙상블은 모든 기본모형이 포함된 앙상블과 성능 차이가 없었다. 축소된 앙상블은 앙상블 구성의 복잡성을 감소시키고 구현을 용이하게 한다는 점에서 FDM에서도 유력한 모형 수립 접근방법이 될 수 있음을 보였다.

TMDL 지원을 위한 QUAL2E 모델을 이용한 GIS기반의 삭감시나리오 작성 지원시스템 개발에 관한 연구 (A Study on the Development of GIS Based Mitigation Scenario Support System Using QUAL2E Model for TMDL)

  • 이철용;김계현;이혁;유광현
    • 대한환경공학회지
    • /
    • 제34권3호
    • /
    • pp.177-188
    • /
    • 2012
  • 본 연구는 국내 TMDL 지원을 위하여 삭감시나리오 작성 및 수질모의가 가능한 GIS 기반의 삭감시나리오 작성 지원시스템을 개발하는 것을 주요 목적으로 하였다. 연구대상지역은 금강수계 내 삽교천 상류 31 km 구간이며, QUAL2E 모델이 시스템에 적용되었다. 점 및 비점오염원 속성과 다양한 지도 자료를 수집하여 공간 DB를 구축하였다. 각 단위유역의 BOD, T-N, T-P 배출부하량을 산정하였고, 삭감시나리오 작성 과정에서 이들의 수치만을 간단히 조작하여 수질모의가 가능하도록 시스템을 개발하였다. 세 가지 삭감시나리오가 적용되었으며, GIS 기반의 결과 비교를 통해 효율적인 삭감시나리오 선정이 가능하였다. 따라서 본 연구에서 개발된 시스템은 향후 최적 의사결정지원에 기여할 것으로 기대된다. 아울러 새로운 삭감시나리오 작성 방법 및 알고리즘 개발에도 활용될 것으로 판단된다. 향후 시스템 고도화를 위해서는 오염원별 관리에 따른 삭감시나리오의 작성 지원, 대상지역의 확대 적용 등의 후속 연구가 필요할 것으로 사료된다.

빅데이터 분석을 통한 중력식 항만시설 수정프로젝트 레벨의 상태변화 특성 분석 (A Study on Condition Analysis of Revised Project Level of Gravity Port facility using Big Data)

  • 나용현;박미연;장신우
    • 한국재난정보학회 논문집
    • /
    • 제17권2호
    • /
    • pp.254-265
    • /
    • 2021
  • 연구목적: 국내 항만시설의 진단을 통한 성능 및 안전에 대한 점검과 진단을 20년 넘게 진행되었지만 그 진단 이력과 결과를 활용한 중장기적인 시설개선과 성능개선을 위한 발전전략이나 방향이 현실적으로 작동하지 않고 있다. 특히, 사용년수가 오래된 항만구조물의 경우, 선박의 대형화와 사용빈도 증가, 기후변화로 인한 자연재해의 영향 등으로 안전성능과 기능적 면에서 상당히 많은 문제점을 내포하고 있다. 연구방법: 본 연구에서는 중력식 안벽에 대한 부재수준의 유지관리 이력 데이터를 수집하여 이를 빅데이터로써 정의하고 해당 데이터를 바탕으로 프로젝트 수준의 시설물의 노후화 패턴 및 열화를 추정하기 위한 예측근사모델을 도출하였다. 특히 GP 및 SGP 기법의 머신러닝 알고리즘을 통하여 생성된 상태기반 노후도 패턴 및 열화 근사모델에 대한 유효성 검토를 통해 빅데이터 활용에 적합한 모델을 상호비교하고 제안하였다. 연구결과: 제안된 기법의 적합성을 검토한 결과 GP기법은 RMSE 및 R2는 0.9854와 0.0721, SGP기법은 0.7246과 0.2518로 GP기법을 적용한 예측모델이 적합한 것으로 검토 되었다. 결론: 머신러닝 기법을 통해 이러한 연구는 향후 항만시설 데이터취합이 지속적으로 이루어진다면 향후 항만시설 투자의사결정에 중요한 역할을 할 것으로 기대한다.

A Study on the Classification of Unstructured Data through Morpheme Analysis

  • Kim, SungJin;Choi, NakJin;Lee, JunDong
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.105-112
    • /
    • 2021
  • 빅데이터 시대에 접어들며 데이터에 대한 관심이 폭발적으로 늘어나고 있다. 특히, 인터넷 및 소셜미디어의 발전은 새로운 데이터들의 생성으로 연결되어 빅데이터와 인공지능 시대의 실현과 융합 기술의 새로운 장을 열 수 있게 되었으며, 과거에는 프로그램으로 다루지 못하던 데이터에 대한 분석 요구가 많이 발생하고 있다. 본 논문에서는 빅데이터 시대에서 많이 요구되는 비정형 데이터에 대한 분류를 위하여 분석 모델을 설계하고 이를 검증하였다. 데이터는 디비피아의 논문 요약과 주제어, 그리고 부주제 어를 크롤링하였으며, 코엔엘피의 데이터 사전을 이용해 데이터베이스를 생성하고, 형태소 분석을 통하여 단어의 토큰화 과정을 수행하였다. 또한, 카이스트의 9 품사 분류 체계를 이용해 명사를 추출하고, TF-IDF 값을 생성하였으며, 학습 데이터와 Y 값을 결합하여 분석 데이터 셋을 생성하였다. 이와 같이 생성된 분석 데이터 셋에 랜덤 포레스트와 서포트 벡터 머신 그리고 의사결정트리, 이렇게 세 가지 분석 알고리즘을 적용하여 분류의 적정성을 측정하였다. 본 논문에서 제안한 분류 모델 기법은 논문 분류 외에도 민원 분류 분석 및 텍스트 관련 분석 등 다양한 분야에 유용하게 사용될 수 있다.

인공지능 수학 교육을 위한 빅데이터 프로젝트 과제 가이드라인 (Guidelines for big data projects in artificial intelligence mathematics education)

  • 이정화;한채린;임웅
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제62권2호
    • /
    • pp.289-302
    • /
    • 2023
  • 지식정보사회의 비약적인 발전에 힘입어 빅데이터를 분석하여 가치있는 결과물을 도출하고 유용한 정보를 추출하는 역량이 학교 수학의 주요 목표 중 하나로 급부상하고 있다. 고등학교 수학 진로 선택 과목 중 하나인 <인공지능 수학>은 디지털 기술을 활용한 통계 프로젝트를 통해 빅데이터에 기반한 새로운 통계 교육의 기회를 제공할 수 있다. 이 연구에서는 효과적인 빅데이터 통계 프로젝트 기반 과제를 설계하기 위한 일련의 가이드라인을 제안하고, 이 기준에 따라 5종의 인공지능 수학 교과서에 실린 최적화 단원 과제들을 평가하였다. 인공지능 수학 교과에서 빅데이터 통계 프로젝트 과제를 설계 시 고려하도록 도출된 가이드라인은 다음과 같다: (1) 지식과 기술을 국가 학교 수학 교육과정에 맞추고, (2) 전처리된 대규모 데이터 세트를 사용하며, (3) 데이터 과학자의 문제 해결 방법을 사용하고, (4) 의사 결정을 장려하며, (5) 공학도구를 활용하고, (6) 협업 학습을 촉진한다. 분석 결과에 따르면 가이드라인에 완전히 부합하는 과제는 드물었고, 특히 대부분의 교과서에서 가이드라인 2에 해당하는 요소를 프로젝트 과제에서 통합하지 못하고 있는 것으로 나타났다. 또한 소규모 데이터 세트나 빅데이터를 전처리 없이 직접 사용하는 경우가 많아 학생들의 빅데이터의 개념에 대한 오해를 불러일으킬 것이 우려된다. 본 연구에서는 결과를 토대로 인공지능에 필요한 관련 수학 지식과 기술을 밝히고, 이것이 빅데이터 과제에 통합될 때 얻을 수 있는 잠재적 이점과 교육적 고려사항에 대해 논의하였다. 이 연구는 수학적 개념과 머신러닝 알고리즘과의 연계 및 빅데이터를 사용하는 통계 교육에서의 효과적인 공학적 도구 사용에 대한 통찰을 제공하고자 하였다.

통계와 시각화를 결합한 데이터 분석: 예측모형 대한 시각화 검증 (Data analysis by Integrating statistics and visualization: Visual verification for the prediction model)

  • 문성민;이경원
    • 디자인융복합연구
    • /
    • 제15권6호
    • /
    • pp.195-214
    • /
    • 2016
  • 예측 분석은 패턴인식(Pattern recognition) 혹은 기계학습(Machine learning)으로 불리는 확률적 학습 알고리즘을 기반으로 하기 때문에 사용자가 분석 과정에 개입하여 더 많은 정보를 얻어내기 위해서는 높은 통계적 지식수준이 요구된다. 또한 사용자는 분석 결과외의 다른 정보를 확인 할 수 없고 데이터의 특성 변화와 데이터 하나하나의 특징을 파악하기 힘들다는 단점이 있다. 본 연구는 이러한 예측분석의 단점을 보완하고자 통계적인 데이터 분석 방법과 시각화 분석 방법을 결합하여 데이터 분석을 진행하였으며 통계적인 분석 방법만을 진행 할 경우 발생하는 단점을 보완하고 데이터에서 더 많은 정보를 도출해 내기 위한 방법론을 제시 하고자하였다. 이를 위해 본 연구는 영화 리뷰에서 추출한 감정 어휘가 독립변인이고 영화의 흥행 값이 종속변인인 데이터를 예제 데이터로 활용하여 진행하였다. 본 연구의 연구 방법론을 적용하였을 때의 이점은 다음과 같다. 첫째, 의사결정나무 분석에서 제시된 분할 기준이 적용될 때 마다 변하는 데이터의 패턴을 파악할 수 있다. 둘째, 제시된 최종 예측모형에 포함된 데이터들의 특성을 확인 할 수 있다. 본 연구의 시사점은 예측모형의 단점을 보완하고 데이터로부터 더 많은 정보를 추출하기 위해 통계적인 데이터 분석과 시각적인 데이터 분석을 결합하여 시행하였다는 것이다. 통계적인 분석 방법을 통해 각 변수의 관계를 파악하고 높은 예측 값을 가지는 모형을 도출하였으며, 시각화 분석에서는 인터랙션 기능을 제공함으로서 통계적으로 제시된 예측모형을 검증하고 더 다양한 정보를 도출 할 수 있게 하였다.

여행자 페르소나 기반 도서관 여행 코스 추천 모델 개발 - J시 도서관 여행을 위한 시설 및 동선 중심으로 - (Developing Library Tour Course Recommendation Model based on a Traveler Persona: Focused on facilities and routes for library trips in J City)

  • 이수현;김현수;백지원;오효정
    • 한국도서관정보학회지
    • /
    • 제54권2호
    • /
    • pp.23-42
    • /
    • 2023
  • 도서관 여행 프로그램은 J시가 처음 도입, 운영하고 있는 새로운 형태의 문화프로그램으로, 도서관 여행자는 정해진 코스에 따라 관내 특화 도서관을 여행하며 다양한 체험을 하게 된다. 본 연구는 보다 많은 이용자들이 도서관 여행에 참여할 기회를 누릴 수 있도록 기존 고정된 단체여행 형태 외에 개별 참여하는 이용자의 특성을 고려한 맞춤형 코스 추천 모델 구축을 목적으로 한다. 이를 위해 도서관 여행자의 특성을 유형화하여 여행자 페르소나를 설정하였으며, 그에 따른 도서관 평가 항목과 평가 기준을 수립하였다. 도서관 여행 프로그램의 대상이 되는 도서관 22관을 선정, 실제 답사를 통해 도서관 데이터를 실측하였다. 수집한 데이터를 기반으로 여행자의 특성에 적합한 도서관의 특징을 도출하였으며, 의사결정나무 알고리즘을 활용해 페르소나 기반의 도서관 여행 코스 추천 모델을 개발하였다. 나아가 추천 모델의 활용 가능성을 시연하기 위해 이를 적용한 모바일 앱 목업을 제작하였으며, 실제 J시 도서관 이용자들을 대상으로 사용자 평가를 진행해 개발한 모델의 만족도와 개선사항을 파악하였다.

기계 학습 모델을 통해 XGBoost 기법을 활용한 부산 컨테이너 물동량 예측 (Forecasting the Busan Container Volume Using XGBoost Approach based on Machine Learning Model)

  • 웬티프엉타인;조규성
    • 사물인터넷융복합논문지
    • /
    • 제10권1호
    • /
    • pp.39-45
    • /
    • 2024
  • 항만 성능에 대한 정확한 평가는 컨테이너 물동량은 매우 중요한 요소이며, 효과적인 항만 개발 및 운영 전략에 대한 정확한 예측이 필수적이다. 하지만 해양 산업의 급격한 변화로 인해 컨테이너 물동량 예측의 정확성이 향상되기는 어렵다. 이를 해결하기 위해 사물인터넷(IoT)을 이용한 항만 성능에 미치는 영향을 분석하여 부산항의 경쟁력과 효율성을 향상시키기 위해 적용이 필요하다. 이에 본 연구에서는 부산항의 미래 컨테이너 물동량을 예측하기 위한 예측 모델을 개발하는 것을 목표로 이를 통해 항만 관리 기관의 개선된 의사 결정과 항만 생산성을 향상시키는 데 초점을 맞추고 있다. 항만 컨테이너 물동량을 예측하기 위해 본 연구에서는 기계 학습 모델의 Extreme Gradient Boosting (XGBoost) 기법을 도입하였다. XGBoost는 다른 알고리즘에 비해 높은 정확도, 빠른 학습 및 예측 속도,과적합을 방지하고 Feature Importance 제공하는 장점이 돋보인다. 특히 XGBoost는 회귀 예측 모델링에 직접 사용할 수 있어 기존 연구에서 제시된 물동량 예측 모델의 정확도 향상에 도움이 된다. 이를 통해 본 연구는 4.3% MAPE (Mean absolute percenture error) 값으로 제안된 방법이 컨테이너 물동량을 정확하고 신뢰성 있게 예측할 수 있다. 본 연구에서 제시한 방법론을 통해서 부산 컨테이너물동량의 정확성을 높일 수 있을 것으로 판단된다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

사고가 시각을 바꾼다: 조절 초점에 따른 소비자 감성 기반 웹 스타일 평가 모형 및 추천 알고리즘 개발 (Individual Thinking Style leads its Emotional Perception: Development of Web-style Design Evaluation Model and Recommendation Algorithm Depending on Consumer Regulatory Focus)

  • 김건우;박도형
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.171-196
    • /
    • 2018
  • 본 연구는 디자인 영역 중 웹 스타일에 대해서 소비자 감성과 만족과의 관계를 연구했다. 기존 웹 스타일 연구들은 웹의 레이아웃과 구조도 등과 색상 등이 감성에 미치는 영향에서 연구했다. 본 연구는 기존 연구들과 차별되게 웹의 구성 요소를 배제하고 소비자의 감성 지표만을 갖고 소비자 만족과의 관계를 분석했다. 분석을 위해 검증을 위해 소비자 204명을 대상으로 40개 웹 스타일 테마를 선정, 각 소비자에게 4개씩 평가하도록 하였다. 소비자에게 평가하도록 한 감성 형용사는 18개의 대비되는 쌍을 갖는 감성 형용사로 구성하였고, 요인 분석을 통해 상위 감성 지표를 추출했다. 각 감성 지표들은 '부드러움', '모던함', '명확함', '꽉 참' 이었으며, 감성지표들이 소비자 만족에 미치는 영향이 다를 것으로 판단하여 가설을 수립했다. 분석 결과에 따라 가설 1과 2, 3은 채택되었으며, 가설 4의 경우는 기각되었다. 가설 4의 경우 기각되었지만 정의 방향이 아닌 부의 방향으로 유의한 것으로 나타났다. 이때, 조절 초점 성향이 감성이라는 정보처리 과정에서 소비자 만족에 미치는 영향이 다를 것으로 판단했다. 조절 초점 성향은 조직 행동 및 의사결정에 영향을 주기도 하며, 정치, 문화, 윤리적 판단 및 행동은 물론 광범위적 심리적 문제와 사고 프로세스, 감정적 반응에도 영향을 미친다. 때문에 각 감성 지표에 대한 조절 초점 간 차이를 확인할 필요성이 있고, 각 감성 지표에 대한 세부 가설을 수립했다. 세부 가설을 검증하기 위해 조절 회귀 분석을 수행했다. 분석 결과 가설 5는 부분적으로 지지됐고, 가설 5.3만 지지되었고, 5.4의 경우 기각되었지만 가설과의 반대 방향으로 지지되었다. '명확함'의 경우 향상 초점이 소비자 만족에 더 큰 영향을 보였고, 예방 초점일수록 '꽉 참'을 더 선호한 것으로 나타났다. 분석 결과를 바탕으로 조절 초점 성향을 향상, 예방, 중간 성향으로 3집단으로 구분, 소비자 감성 기반으로 웹 스타일에 대한 추천을 할 수 있는 알고리즘을 개발했다.