• 제목/요약/키워드: 기계적 학습

검색결과 1,714건 처리시간 0.031초

A Classification Model for Illegal Debt Collection Using Rule and Machine Learning Based Methods

  • Kim, Tae-Ho;Lim, Jong-In
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.93-103
    • /
    • 2021
  • 금융당국의 채권추심 가이드라인, 추심업자에 대한 직접적인 관리 감독 수행 등의 노력에도 불구하고 채무자에 대한 불법, 부당한 채권 추심은 지속되고 있다. 이러한 불법, 부당한 채권추심행위를 효과적으로 예방하기 위해서는 비정형데이터 기계학습 등 기술을 활용하여 적은 인력으로도 불법 추심행위에 대한 점검 등에 대한 모니터링을 강화 할 수 있는 방법이 필요하다. 본 연구에서는 대부업체의 추심 녹취 파일을 입수하여 이를 텍스트 데이터로 변환하고 위법, 위규 행위를 판별하는 규칙기반 검출과 SVM(Support Vector Machine) 등 기계학습을 결합한 불법채권추심 분류 모델을 제안하고 기계학습 알고리즘에 따라 얼마나 정확한 식별을 하였는지를 비교해 보았다. 본 연구는 규칙기반 불법 검출과 기계학습을 결합하여 분류에 활용할 경우 기존에 연구된 기계학습만을 적용한 분류모델 보다 정확도가 우수하다는 것을 보여 주었다. 본 연구는 규칙기반 불법검출과 기계학습을 결합하여 불법여부를 분류한 최초의 시도이며 후행연구를 진행하여 모델의 완성도를 높인다면 불법채권 추심행위에 대한 소비자 피해 예방에 크게 기여할 수 있을 것이다.

게임 프로그램 이해를 통한 ″프로그래밍″학습 (Programing Learning by Understanding of Game Programs)

  • 신재훈;김종훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.661-663
    • /
    • 2001
  • '컴퓨터 교육'이라는 개념은 컴퓨터를 이용한 교육과 컴퓨터를 배우는 교육 두 가지 의미를 동시에 가지고 있기 때문에 사용하는데 주의를 기울여야 한다. 후자의 개념으로서 '컴퓨터 교육'은 전산학에 대한 개론 및 프로그래밍과 관련된 학습이 핵심을 이룬다. 특히 프로그래밍의 학습의 경우는 코딩, 컴파일링, 디버깅 등의 복잡한 과정과 함께 운영체제 및 하드웨어에 대한 지식 같은 프로그래밍 외적인 분야에 대해서도 다양한 이해가 요구된다. 기존의 프로그래밍 학습은 프로그래밍 언어의 문법에 대한 기계적 암기나 사용법을 익히는 것에 치중하여 논리적인 사고를 키우는데 적합하지 못했다. 이에 본 논문에서는 프로그래밍에 대한 기본적인 통찰력을 기를 수 있도록 프로그래밍 언어의 기초가 되는 C로 코딩된 게임 프로그램들을 분석.이해한다.

  • PDF

명세 기반 인공지능 학습 데이터 수집 방법 (A Specification-Based Methodology for Data Collection in Artificial Intelligence System)

  • 김동기;최병기;이재호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권11호
    • /
    • pp.479-488
    • /
    • 2022
  • 최근 기계학습 기술이 빠르게 발전함에 따라 지능형 시스템을 구성하는 여러 기술 중에서 인지, 추론 및 판단, 행위와 같은 분야에서 기계학습을 활용한 연구가 활발히 이루어지고 있다. 이러한 기계학습을 활용하기 위해서는 학습을 위한 데이터의 구축이 필수적이다. 하지만 데이터가 생성되는 환경에 따라 생성되는 데이터의 종류가 다양하고, 기계학습에 활용할 학습모델에 따라 요구되는 데이터의 종류와 양식이 다르다. 이로 인해 새로운 환경에서 기존의 데이터 수집 방법을 재사용하지 못하고 매번 특화된 데이터 수집 모듈을 개발해야 한다는 문제가 있다. 본 논문에서는 위와 같은 문제를 해결하기 위해 명세 기반 인공지능 데이터 수집 방법을 제안하여 데이터 수집 환경에 따른 데이터 수집 방법의 재사용성을 확보하고, 데이터 수집 기능 구현을 자동화할 수 있는 방법을 제시하고자 한다.

탄성학 일별

  • 박진무
    • 기계저널
    • /
    • 제29권3호
    • /
    • pp.224-230
    • /
    • 1989
  • 기계공학에서 모든 분야의 궁극적 목표로서 하드웨어의 설계 제작을 들 수 있으며, 그 단계의 학문적 기초로서 고체역학의 중요성은 잘 알려져 있다. 이 글에서는 고체역학의 핵심 기초로서 탄성 이론을 선택하고, Crandall 등의 고체역학 교과서(1)로부터 연속적 학습을 상상하면서 그 몇 요점을 일별(一瞥)하고저 한다.

  • PDF

R기계학습 소프트웨어를 이용한 미세먼지 예측 (Korean Dust Prediction using R Machine Learning Software)

  • 장재호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.491-492
    • /
    • 2019
  • 최근, 한국에서는 사람들이 미세먼지로 많은 고통을 받고 있으며, 특히, 초미세먼지(PM2.5)의 경우에는 생성될 때, 화학적인 2차 반응에 의하여 생성되는 것으로 여겨지고 있다. 본 논문에서는 R에서 제공하는 기계학습 프로그램을 이용하여 초미세먼지를 예측하기 위한 실험을 진행하였다. R소프트웨어는 빅데이터 및 통계 분석을 위해서 많이 사용되고 있는 프로그램이다. 최근에는 인공지능의 기계학습을 위한 기능도 제공하고 있는데, 데이터 예측을 할 때, 사용하면 매우 유용하다.

소스코드 취약성 분류를 위한 기계학습 기법의 적용 (Application of Machine Learning Techniques for the Classification of Source Code Vulnerability)

  • 이원경;이민주;서동수
    • 정보보호학회논문지
    • /
    • 제30권4호
    • /
    • pp.735-743
    • /
    • 2020
  • 시큐어코딩은 악의적인 공격 혹은 예상치 못한 오류에 대한 강인함을 제공해줄 수 있는 안전한 코딩 기법으로 정적분석도구의 지원을 통해 취약한 패턴을 찾아내거나 오염 데이터의 유입 가능성을 발견한다. 시큐어코딩은 정적기법을 적극적으로 활용하는 만큼 룰셋에 의존적이라는 단점을 가지며, 정적분석 도구의 복잡성이 높아지는 만큼 정확한 진단이 어렵다는 문제점을 안고 있다. 본 논문은 시큐어코딩을 지원하는 목적으로 기계학습 기법 중 DNN과 CNN, RNN 신경망을 이용하여 개발보안가이드 상의 주요 보안약점에 해당하는 패턴을 학습시키고 분류하는 모델을 개발하며 학습 결과를 분석한다. 이를 통해 기계학습 기법이 정적분석과 더불어 보안약점 탐지에 도움을 줄 수 있을 것으로 기대한다.

Transfer-Learning 기법을 이용한 영역검출 기법에 관한 연구 (A Study on Area Detection Using Transfer-Learning Technique)

  • 신광성;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.178-179
    • /
    • 2018
  • 최근 자율주행 및 음성인식 등 인공지능 분야에서 기계학습을 이용한 방법이 활발히 연구되고 있다. 디지털 영상에서 특정 사물이나 영역을 인식하기 위해 고전적인 경계검출 및 패턴인식 등의 고전적인 영상처리 방법으로는 많은 한계를 가지고 있으나 deep-learning 등 기계학습 방법을 이용하면 사람의 인지수준에 근접한 결과를 얻을 수 있다. 하지만 기본적으로 deep-learning 등 기계학습은 방대한 양의 학습데이터가 확보되어야 한다. 따라서 환경 분석을 위한 항공사진처럼 데이터의 양이 매우 적은 경우 영역 구분을 위해 기계학습을 적용하기 어렵다. 본 연구에서는 입력영상의 dataset 크기가 적고 입력 영상의 형태가 training dataset의 category에 포함되지 않는 경우 사용할 수 있는 transfer-learning 기법을 적용하며 이를 이용하여 영상 내에서 특정 영역 검출을 수행한다.

  • PDF

시추공 수리 이상점 탐지를 위한 기계학습 알고리즘의 적용성 연구 (A Study on the Applicability of Machine Learning Algorithms for Detecting Hydraulic Outliers in a Borehole)

  • 최승범;박경우;이창수
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.561-573
    • /
    • 2023
  • 한국원자력연구원은 심부 암반의 수리/지화학 특성 분석을 위해 KURT (KAERI Underground Research Tunnel)를 건설하였고, 다수의 조사용 시추공을 시추하여 각종 시험을 수행 중이다. 시추공 조사에서 목적에 적합한 조사 구간 선정은 매우 중요하며 수리 유동 파악 및 지하수 채수가 목적인 경우, 유량이 풍부한 구간이 조사 목적에 부합한다. 본 연구에서는 이러한 구간을 수리 이상점으로 정의했으며, 심도 1km 수준의 시추공 물리검층 자료(온도, 전기전도도)를 활용하여 이를 탐지하고자 하였다. 체계적이고 효율적인 이상점 탐지를 위해 기계학습 알고리즘 중 DBSCAN, OCSVM, kNN, isolation forest을 적용하고 그 적용성을 파악하였다. 데이터 전처리와 알고리즘 최적화를 수행했으며, 그 결과 네 가지 알고리즘은 각각 55, 12, 52, 68개의 수리 이상점을 탐지하였다. 본 논문을 통해 기계학습 알고리즘의 활용 가능성을 확인했으나, 학습에 활용된 입력자료가 제한적이었기 때문에, 향후 추가적인 검증과 보완이 바람직한 것으로 판단된다.

준지도 학습을 이용한 트윗 감정 분류 (Sentiment Classification for Korean Tweets via Semi-Supervised Learning)

  • 서형원;노경목;천민아;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.123-125
    • /
    • 2012
  • 본 논문은 기계 학습을 이용한 감정 분류에 필요한 학습 말뭉치를 효율적으로 확장하는 방법에 대하여 기술한다. 학습 말뭉치는 일반적으로 그에 알맞은 레이블을 정해야 하는데, 그 양이 어마어마하기 때문에 이 과정을 일일이 사람이 할 수는 없다. 그에 대한 해결책으로써 이미 많은 준지도학습 방법이 연구되었고, 그것을 트윗이라는 짧은 문서를 감정 분류하는 것에 적용해도 감정 문서 분류기의 성능이 좋다는 결과를 확인하였다.

  • PDF

표 질의응답을 위한 언어 모델 학습 및 데이터 구축 (Pre-trained Language Model for Table Question and Answering)

  • 심묘섭;전창욱;최주영;김현;장한솔;민경구
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.335-339
    • /
    • 2021
  • 기계독해(MRC)는 인공지능 알고리즘이 문서를 이해하고 질문에 대한 정답을 찾는 기술이다. MRC는 사전 학습 모델을 사용하여 높은 성능을 내고 있고, 일반 텍스트문서 뿐만 아니라 문서 내의 테이블(표)에서도 정답을 찾고자 하는 연구에 활발히 적용되고 있다. 본 연구에서는 기존의 사전학습 모델을 테이블 데이터에 활용하여 질의응답을 할 수 있는 방법을 제안한다. 더불어 테이블 데이터를 효율적으로 학습하기 위한 데이터 구성 방법을 소개한다. 사전학습 모델은 BERT[1]를 사용하여 테이블 정보를 인코딩하고 Masked Entity Recovery(MER) 방식을 사용한다. 테이블 질의응답 모델 학습을 위해 한국어 위키 문서에서 표와 연관 텍스트를 추출하여 사전학습을 진행하였고, 미세 조정은 샘플링한 테이블에 대한 질문-답변 데이터 약 7만건을 구성하여 진행하였다. 결과로 KorQuAD2.0 데이터셋의 테이블 관련 질문 데이터에서 EM 69.07, F1 78.34로 기존 연구보다 우수한 성능을 보였다.

  • PDF