• 제목/요약/키워드: Machine Learning

검색결과 5,355건 처리시간 0.04초

워드임베딩을 활용한 복압성 요실금 관련 연구 동향에 관한 융합 연구 (A Convergence Study of the Research Trends on Stress Urinary Incontinence using Word Embedding)

  • 김준희;안선희;곽경태;원영수;유화익
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.1-11
    • /
    • 2021
  • 본 연구의 목적은 '복압성 요실금'을 키워드로 검색된 연구들의 경향과 특성을 단어 빈도를 통해 분석하고, 워드 임베딩을 사용하여 그 관계를 모델링 하고자 하였다. 의학 서지 데이터베이스인 MEDLINE에 등록되어 있는 복압성 요실금 연구 9,868개 논문들의 초록 문자 데이터를 Python 프로그램을 이용하여 추출하였다. 그런 다음 빈도 분석을 통해 10개의 키워드를 선택하였다. 키워드 관련 단어들의 유사도는 Word2Vec 머신러닝 알고리즘으로 분석하였다. 그리고, t-SNE 기법을 사용하여 단어의 위치와 거리가 시각화하였고, 이에 따라 그룹을 분류하여 이를 분석하였다. 복압성 요실금과 관련된 연구는 1980년대 이후 빠르게 증가했다. 키워드 분석을 통해 논문 초록에서 가장 많이 사용된 키워드는 '여성', '요도', '수술'로 나타났다. Word2Vec 모델링을 통해 복압성 요실금 관련 연구에서 주요 키워드들과 가장 높은 연관성을 나타내는 단어들에는 '여성', '절박', '증상' 등이 있었다. 그리고, t-SNE 기법을 통해 키워드와 관련 단어들은 복압성 요실금의 증상, 신체 기관의 해부학적 특성, 그리고 수술적 중재를 중심으로 하는 3개의 그룹으로 분류될 수 있었다. 본 연구는 초록을 구성하는 단어들의 키워드 빈도 분석 및 워드임베딩 방식을 이용하여 복압성 요실금 관련 연구들의 동향을 살펴본 최초의 연구이다. 본 연구의 결과는 향후 연구자들이 복압성 요실금 관련 연구 분야의 주제와 방향성을 선택하는 데 있어 기초자료로 활용될 수 있을 것이다.

냉동시스템 고장 진단 및 고장유형 분석을 위한 3단계 분류 알고리즘에 관한 연구 (A study on the 3-step classification algorithm for the diagnosis and classification of refrigeration system failures and their types)

  • 이강배;박성호;이희원;이승재;이승현
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.31-37
    • /
    • 2021
  • 산업의 발전으로 도시화로 인해 건물의 규모가 커지면서, 건물의 공기 정화 및 쾌적한 실내 환경을 유지의 필요성 또한 증가하고 있다. 냉동 시스템의 모니터링 기술의 발전으로 건물 내에 발생하는 전력 소모량을 관리할 수 있게 되었다. 특히 상업용 건물에서 발생하는 전력 소모량 중 약 40%가 냉동 시스템에서 일어난다. 따라서 본 연구 냉동시스템 고장진단 알고리즘을 개발하기 위해서 냉동시스템의 구조를 이해하고, 냉동 시스템의 운영과정에서 발생하는 데이터를 수집 분석하여 다양한 유형과 심각도를 가지는 고장 상황을 조기에 신속하게 탐지 분류하고자 하였다. 특히 분류가 어려운 고장 유형들의 분류 정확도를 향상시키기 위하여 3단계 진단 및 분류 알고리즘을 개발하여 제안하였다. 다수의 실험과 초모수 (hyper parameter) 최적화 과정을 거쳐 각 단계에 적합한 분류 모형으로 SVM과 LGBM에 기반 한 모형을 제시하였다. 본 연구에서는 고장에 영향을 미치는 특성을 최대한 보존하면서, 선행연구에서 어려움을 겪었던 냉매 관련 고장을 포함한 모든 고장 유형을 우수한 결과로 도출하였다.

CNN 강우여부 분류기를 적용한 ANN 기반 X-Band 레이다 유의파고 보정 (Estimation of Significant Wave Heights from X-Band Radar Based on ANN Using CNN Rainfall Classifier)

  • 김희연;안경모;오찬영
    • 한국해안·해양공학회논문집
    • /
    • 제33권3호
    • /
    • pp.101-109
    • /
    • 2021
  • 항해용 X-band 레이다를 이용한 파랑관측은 해수면에 후방산란 된 전자기파 이미지를 분석하여 이루어진다. 1분당 42개의 해수면 시계열 이미지로부터 3차원 FFT를 계산하고 변조전달함수(Modulation Transfer Function)를 구하여 파랑정보를 추출한다. 따라서 레이다 파고계로 계측한 유의파고의 정확도는 X-band 레이다 영상의 상태에 따라 결정된다. 2020년 여름 태풍 마이삭과 하이선 내습 시 강릉 안인 해안에 설치된 X-band 레이다 파고계로 관측한 유의파고의 오차가 크게 발생하였다. 이는 태풍 내습 시 급격히 유의파고가 증가하는 한편 강한 강우가 동반되어 X-band 레이다 영상의 품질이 저하되었기 때문이다. 최대 오차 발생 이전까지 많은 강우가 있었음이 확인된다. 본 연구에서는 convolution neural network(CNN)을 이용하여 레이다 이미지로부터 강우 여부를 분류하고 강우여부에 따라 강우시 인공신경망 모델을 적용하여 태풍 시 유의파고 관측 정확도를 향상시켰다. 폭우를 동반한 태풍 시 레이다 자료 특성에 기반하여 인공신경망 유의파고 산출 알고리즘을 개선하고 이를 통해 X-band 레이다 파고계의 정확도를 향상시키는 방법을 제시하였다.

배깅과 부스팅 알고리즘을 이용한 핸드볼 결과 예측 비교 (Comparison of Handball Result Predictions Using Bagging and Boosting Algorithms)

  • 김지응;박종철;김태규;이희화;안지환
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.279-286
    • /
    • 2021
  • 본 연구는 여자핸드볼 경기에서 발생되는 움직임 정보를 바탕으로 앙상블 기법의 배깅과 부스팅 알고리즘의 예측력을 비교하고, 움직임 정보의 활용가능성을 분석하는데 목적이 있다. 연구의 목적을 달성하기 위하여 15번의 연습경기에서 관성센서를 활용해 수집한 움직임 정보를 활용한 경기 결과예측을 랜덤포레스트와 Adaboost 알고리즘을 활용해 비교·분석하였다. 연구결과 첫째, 랜덤포레스트 알고리즘의 예측률은 66.9 ± 0.1%로 나타났으며, Adaboost 알고리즘의 예측률은 65.6 ± 1.6%로 나타났다. 둘째, 랜덤포레스트는 승리 결과는 모두 예측하였고, 패배의 결과는 하나도 예측하지 못하였다. 반면, Adaboost 알고리즘은 승리 예측 91.4%, 패배예측 10.4%라고 나타났다. 셋째, 알고리즘의 적합성 여부에서 랜덤포레스트는 과적합의 오류가 없었지만, Adaboost는 과적합의 오류가 나타났다. 본 연구결과를 바탕으로 스포츠경기를 예측할 때 움직임 정보도 활용 가능성을 확인하였으며, 랜덤포레스트 알고리즘이 보다 우수함을 확인하였다.

POI(Practical Openness Index)를 활용한 문헌정보학 연구자 국제학술논문의 개방성 연구 (Study on the Openness of International Academic Papers by Researchers in Library and Information Science Using POI (Practical Openness Index))

  • 조재인
    • 한국도서관정보학회지
    • /
    • 제52권2호
    • /
    • pp.25-44
    • /
    • 2021
  • OA 논문이 증가하는 상황에서 개별 연구자의 연구 성과 유통이 얼마나 개방적인지를 지수화하는 POI(Practical Openness Index)가 등장하였다. 본 연구는 국내 문헌정보학 연구자들이 국제학술지에 출판한 논문을 대상으로 OA 여부와 방식을 조사하고 연구자 단위의 POI를 도출해 지수의 분포를 살펴보았다. 또한 연구자의 세부 연구 분야나 국제협력 활동이 개방성에 관련성을 보이는지 분석하였다. 그 결과 Unpaywall을 통해 정상적으로 OA 여부와 방식이 식별된 논문은 82명 연구자의 492건으로 나타났으며, 20.7%의 논문만이 공개되어 있는 것으로 분석되었다. 두 번째, 골드 OA 방식의 공개 논문은 의학 분야 저널에 수록된 텍스트마이닝 분야 논문이 많았으며, 그린 OA방식으로 공개된 논문은 외국인 공동저자 소속 기관의 리포지터리나 PMC와 같은 초국가적 주제 리포지터리에서 공개되고 있는 것으로 확인되었다. 세 번째, POI 지수는 절반 가량의 연구자가 0으로 나타났으나, 계량정보학, 기계학습 및 지식처리 영역의 연구자들에게서 상대적으로 높게 나타났다. 또한 연구자의 해외공동연구 활동이 논문 공개와 관련성이 있는 것으로 분석되었다.

용담댐 기존운영에 대한 의사결정중심 기후변화 영향 평가 (A decision-centric impact assessment of operational performance of the Yongdam Dam, South Korea)

  • 김대하;김은희;이승철;김은지;신준
    • 한국수자원학회논문집
    • /
    • 제55권3호
    • /
    • pp.205-215
    • /
    • 2022
  • 대기온실가스 증가로 인해 전지구 평균기온은 이미 1.0℃ 이상 상승했고 폭염, 가뭄, 홍수 등 극한 기상현상의 빈도는 점점 더 높아질 것으로 전망되고 있다. 본 연구에서는 전북·충청지역의 이·치수안전도 확보에 큰 역할을 하고 있는 용담댐의 기존 운영방식이 기후변화에 얼마나 취약한 지 의사결정 지표를 중심으로 평가하였다. 현실적인 기후 스트레스 테스트를 위해 GR6J 강우-유출 모형, Random Forests 댐운영 모형을 관측자료에 적합시켰고 추계학적 기법으로 생성된 294개의 기후스트레스 시계열을 모형에 입력해 연최대일방류량, 저수량신뢰도, 공급신뢰도의 변화를 분석하였다. 그 결과 2021~2040년 기간 용담댐 저수량신뢰도는 과도한 수준으로 증가할 것으로 전망되었고 이에 반해 공급신뢰도의 증가는 저수량 신뢰도에 미치지 못할 것으로 나타났다. 평균강수량과 강수변동성의 증가로 20년 빈도 연최대방류량은 50%의 확률로 43% 증가할 것으로 나타났다. 용담댐의 기존운영방식은 저수량 확보에 과도하게 치중되어 있는 것으로 판단되며 이 운영이 지속될 경우 용담댐 하류지역의 홍수위험은 더 가중될 것으로 예상된다.

이관 기록물 분류 자동화를 위한 목록 기반 이상치 판별 학습데이터 구축 (Building the Outlier Candidate Discrimination Training Data based on Inventory for Automatic Classification of Transferred Records)

  • 정지혜;이젬마;왕호성;오효정
    • 한국기록관리학회지
    • /
    • 제22권1호
    • /
    • pp.43-59
    • /
    • 2022
  • 전자적으로 생산된 공공기록물은 생산과 동시에 편철되고 보존기간이 부여되며 일정기간이 지나면 영구기록물관리기관으로 이관되어 보존된다. 이관 시 기록물관리 담당자가 기록물 분류정보를 확인하고 품질을 일정 수준으로 유지토록 해야 하지만, 이관된 기록물의 분류는 기록물 정리/기술 업무로 편성되어 있고, 대부분의 정리/기술 업무는 수작업에 의존하고 있어 당해 연도에 처리해야 할 기록물 수량을 맞추기 어려운 실정이다. 이에 본 연구는 이관 기록물 분류 업무의 효율화와 일관된 기준을 유지하기 위한 방안을 제안하고자 한다. 이를 위해 먼저 국가기록원에서 수행하고 있는 현행의 기록분류 업무 프로세스를 분석하고 개선 요구사항을 수렴하여 분류 업무의 수작업을 최소화하기 위한 방안으로 이관된 기록물의 편철 정보, 즉 목록에 기반한 분류 이상치 후보를 판별하는 과정을 도출·체계화하였다. 나아가 제안한 이상치 판별 프로세스를 실제 국가기록원으로 이관된 기록물을 대상으로 적용하고, 그 결과를 규격화하여 추후 기계학습에 활용 가능한 학습데이터 형식으로 구축하였다. 본 연구의 궁극적인 목적은 지능형 전자기록 관리 환경 구축을 위한 사전 단계로, 기록관리 업무 내 기계학습 기법이 적용 가능한 문제 유형을 선별하고 자동화하는 방안을 모색하고자 한다.

Back TranScription(BTS)기반 데이터 구축 검증 연구 (A Study on Verification of Back TranScription(BTS)-based Data Construction)

  • 박찬준;서재형;이설화;문현석;어수경;임희석
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.109-117
    • /
    • 2021
  • 최근 인간과 컴퓨터의 상호작용(HCI)을 위한 수단으로 음성기반 인터페이스의 사용률이 높아지고 있다. 이에 음성인식 결과에 오류를 교정하기 위한 후처리기에 대한 관심 또한 높아지고 있다. 그러나 sequence to sequence(S2S)기반의 음성인식 후처리기를 제작하기 위해서는 데이터 구축을 위해 human-labor가 많이 소요된다. 최근 기존의 구축 방법론의 한계를 완화하기 위하여 음성인식 후처리기를 위한 새로운 데이터 구축 방법론인 Back TranScription(BTS)이 제안되었다. BTS란 TTS와 STT 기술을 결합하여 pseudo parallel corpus를 생성하는 기술을 의미한다. 해당 방법론은 전사자(phonetic transcriptor)의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축할 수 있다. 본 논문은 기존의 BTS 연구를 확장하여 어떠한 기준 없이 데이터를 구축하는 것보다 어투와 도메인을 고려하여 데이터 구축을 해야함을 실험을 통해 검증을 진행하였다.

부도예측모형에서 도메인 지식을 통합한 반사실적 예시 기반 설명력 증진 방법 (Domain Knowledge Incorporated Counterfactual Example-Based Explanation for Bankruptcy Prediction Model)

  • 조수현;신경식
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.307-332
    • /
    • 2022
  • 부도예측모형은 여러 금융기관의 신용평가모형의 지식기반(knowledge base)로 이용되고 있으며 최근 머신러닝 기법의 발전으로 이를 도입하여 고도화하려는 다양한 시도가 진행 중이다. 그러나 실제 이러한 모형이 도입되기 위해서는 모형을 이용하는 사용자와 설명제공 대상인 고객의 이해와 수용이 전제되어야 한다. 그러나 사용자에게 제공되는 설명이 현실적 타당성(feasibility)이 결여되어 있다면 모형의 신뢰성과 수용도에 부정적인 영향을 미친다. 이에 따라 본 연구는 도메인 지식을 설명 생성 알고리즘에 통합하여 현실적으로 타당한 설명을 사용자에게 제공하고자 한다. 본 연구에서는 머신러닝 기반의 부도예측 모형에 설명력을 더하는 방법으로 반사실적 예시(counterfactual example) 기반의 로컬영역에서의 설명을 제공하는 모델을 제안한다. 제안 모델은 모형에 이용된 재무변수의 특성을 설명력 생성 알고리즘에 통합하여 설명의 현실적 가능성을 확보하고 이를 통해 사용자의 이해와 수용을 도모하고자 한다. 또한 본 연구에서는 반사실적 예시기반 설명을 위해 유전알고리즘(GA)를 이용하며 다목적함수를 목적함수로 설정하여 반사실적 예시의 주요 기준이 되는 항목을 반영하고 있다. 본 연구는 대표적인 머신러닝 기법인 인공신경망을 이용해 부도예측모형을 학습시킨 뒤, 사후적 방법(post-hoc)으로 설명을 위한 알고리즘을 도입하여 기존의 모형 설명 알고리즘인 LIME과 현실적 가능성이 결여된 반사실적 예시 기반 알고리즘과 비교하였다. 더 나아가 제안방법의 금융/회계 분야의 종사자를 대상으로 서베이를 진행하여 제안 방법의 설명의 질을 정성적으로 평가하였다.

미국 정보 대학의 데이터사이언스 학위 현황 연구 (Degree Programs in Data Science at the School of Information in the States)

  • 박형주
    • 한국도서관정보학회지
    • /
    • 제53권2호
    • /
    • pp.305-332
    • /
    • 2022
  • 본 연구의 목적은 문헌정보학 프로그램이 있는 정보 대학에서 수여하는 데이터사이언스 학위의 현황을 알아보는 것이다. 데이터 수집의 대상은, 2022년 미국도서관협회의 인가를 받은 문헌정보학 프로그램이 있는 64개의 대학에서 수여하는 데이터사이언스 학위였다. 분석의 대상은 각 대학의 데이터사이언스 학위 과정, 부전공, 세부 전공, 수료증, 취업 후 예상 진로, 취업률 등이었다. 교과 분석을 위해 미국 정보 대학에서 제시한 교과목 명, 교과 설명, 중점 교육 분야를 분석했다. 데이터사이언스를 학위 명으로 개설한 대학은 총 8개 정보 대학의 12개 학위였으며, 학사 학위 5개, 석사 학위 6개, 박사 학위 1개였다. 개설된 교과의 주제는 데이터사이언스 입문, 정보검색, 데이터마이닝, 데이터베이스, 데이터와 인문학, 머신 러닝, 메타데이터, 연구 방법론, 데이터 분석 및 시각화, 실습/캡스톤, 윤리 및 보안, 이용자, 정책, 큐레이션 및 관리였다. 대부분의 대학은 전통적인 문헌정보학 교과를 개설하지 않고 있었다. 정보 대학이 제시한 졸업 후 예상 취업 진로는 데이터사이언티스트, 데이터 엔지니어, 데이터 분석가 등이었다. 본 연구의 결과는 정보학의 관점에서 데이터사이언스 학위 과정, 세부 전공, 수료증 또는 교과과정 개발 및 개정을 위한 논의에 활용될 수 있는 기초 자료로 활용되기를 기대한다.