• 제목/요약/키워드: Machine Learning

검색결과 5,394건 처리시간 0.029초

특징집합 IG-MLP 평가 기반의 최적화된 특징선택 방법을 이용한 질환 예측 머신러닝 모델 (Optimized Feature Selection using Feature Subset IG-MLP Evaluation based Machine Learning Model for Disease Prediction)

  • 김경륜;김재권;이종식
    • 한국시뮬레이션학회논문지
    • /
    • 제29권1호
    • /
    • pp.11-21
    • /
    • 2020
  • 암을 제외한 한국인의 가장 높은 사망원인은 심뇌혈관질환으로 사망원인의 24%를 차지한다. 현재 국내 환자의 심혈관질환의 위험도 산출은 프레밍험 위험지수를 기반으로 하지만, 국외의 가이드라인에 의존하고 있어 정확도가 떨어지는 편이며, 뇌혈관질환의 예측에 대한 위험도는 산출할 수 없다. 심뇌혈관질환은 예방을 위한 조기증상들의 특징 분석이 어려워 질환예측이 힘들며, 한국인에 적합한 예측 방법이 필요하다. 본 연구의 목적은 심뇌혈관질환 데이터를 이용하여, 특징집합 IG-MLP 평가 기반의 특징선택 방법론을 시뮬레이션 하여 검증하는 것이다. 제안하는 방법은 제4~7기 국민건강영양조사 원시자료를 이용한다. 심뇌혈관질환의 예측에 중요한 특징들을 선별하기 위해, 속성들의 심뇌혈관질환에 대한 정보이득-다층신경망을 이용한 분석을 실시하며, 최종적으로 선별된 특징을 이용한 심뇌혈관질환 예측 모델을 제공한다. 제안하는 방법으로 한국인의 심뇌혈관질환에 관련된 중요한 특징들을 찾을 수 있으며, 최적화된 특징들로 구성된 예측 모델은 한국인에 대해 더욱 정확한 심뇌혈관 예측을 할 수 있다.

분산 파일시스템의 소거 코딩 구현 및 성능 비교 (Implementation and Performance Measuring of Erasure Coding of Distributed File System)

  • 김재열;김영철;김동오;김홍연;김영균;서대화
    • 한국통신학회논문지
    • /
    • 제41권11호
    • /
    • pp.1515-1527
    • /
    • 2016
  • 최근의 빅데이터, 머신러닝, 클라우드 컴퓨팅 분야의 성장에 따라 대용량의 비정형 데이터를 저장할 수 있는 스토리지의 중요성은 날로 커지고 있다. 이에 따라 MAHA-FS, GlusterFS, Ceph 등의 개방형 하드웨어 기반의 분산 파일시스템 기술이 많은 주목을 받고 있다. 이러한 저비용 분산 파일시스템들은 데이터의 내결함성을 보장하기 위하여 초기에 복제 방식을 사용하였으나, 스토리지의 용량이 커질수록 복제 방식이 가지는 스토리지 공간의 저효율성이 점차 부각되면서 이를 보완하려는 방향으로 연구가 진행되고 있다. 본 논문은 복제방식을 대체하여 스토리지 공간 효율성을 향상시킬 수 있는 소거코딩 기법을 MAHA-FS 분산 파일시스템에 적용하여 스토리지의 효율성을 높이고, 소거코딩 지원에 따라 발생하는 데이터 일관성 문제를 해결하는 효율적인 방식으로 VDelta 기법을 제안하고 적용하였다. 본 논문은 MAHA-FS와 GlusterFS의 소거코딩의 구조적 차이점을 기술하고 두 파일시스템의 성능을 비교하여 MAHA-FS의 소거코딩 성능이 GlusterFS에 비해 우수함을 확인하였다.

한국 청년실업률 예측 모형에서 네이버와 구글 검색 정보의 유용성 분석 (Comparative Usefulness of Naver and Google Search Information in Predictive Models for Youth Unemployment Rate in Korea)

  • 정재운
    • 디지털융복합연구
    • /
    • 제16권8호
    • /
    • pp.169-179
    • /
    • 2018
  • 최근 고급 예측모형 연구에 웹 검색 정보가 활용되고 있다. 세계 웹 검색시장에서 구글이 절대적 우위를 점하고 있지만, 국내 웹 검색시장에서는 네이버가 절대적 우위를 보이고 있다. 이러한 특성을 토대로 본 연구는 예측모형을 활용하여 구글과 네이버의 한국어 검색 정보에 대한 유용성을 비교해 보고자 한다. 이를 위해 ARIMA 모형을 활용하여 세 가지의 한국 청년실업률 예측 시계열 모형을 개발하였다. 모형1은 한국 청년실업률 데이터만 사용하였으며, 모형2와 3은 모형1에 네이버와 구글의 검색어 정보를 각각 추가하였다. 모형 훈련기간에서는 모형1보다 모형2와 3이 더 우수한 예측력을 보였다. 모형2와 3은 서로 다른 검색어 정보와 상관관계를 보였으며, 예측기간 1과 2에서 모형3이 가장 좋은 성능을 보였다. 예측기간 2에서는 모형 3만 유의미한 예측결과를 나타내었다. 이 비교 연구는 네이버와 구글 검색엔진을 이용한 한국어 웹 검색 정보의 유용성을 이해하는 데 도움을 준다.

MaxEnt와 GIS를 활용한 반달가슴곰 동면장소 분석: 비동면 기간 동안의 서식지 비교 연구 (Analysis of Hibernating Habitat of Asiatic Black Bear(Ursus thibetanus ussuricus ) based on the Presence-Only Model using MaxEnt and Geographic Information System: A Comparative Study of Habitat for Non-Hibernating Period)

  • 정대호;강병선;조재운;김석범;김정진
    • 한국지리정보학회지
    • /
    • 제19권3호
    • /
    • pp.102-113
    • /
    • 2016
  • 본 연구는 지리산국립공원에 서식하는 반달가슴곰의 겨울철 서식지 환경을 체계적으로 관리하기 위해 GIS 및 기계학습 모형으로 서식환경을 분석하여 지리산국립공원의 겨울철 동면기 서식지인 동면 장소 출현과 비동면기 동안의 서식지 환경과의 관계를 파악하였다. 그 결과 환경요인 중 동면 장소 선택에 가장 큰 영향을 준 요인은 경사로 41.4%, 그 다음으로 고도가 20.4%, 탐방로로부터 거리 10.9%, 영급 7.7% 순으로 나타났다. 한편, 반달가슴곰 서식지와 동면지역 서식지 평가결과를 비교해 본 결과, 평균 고도는 동면지역이 63m가 높았으며 최적 고도는 400m 이상 높게 나타났다. 평균 경사는 $7^{\circ}$가 높고 최적 경사는 $12{\sim}43^{\circ}$ 더 급한 지역을 선호하는 것으로 나타났다. 도로와의 거리는 동면지역이 평균 300m 이상 더 떨어져 있었으며, 최적 이격 거리의 범위는 1,300~2,400m 더 떨어져 있는 것으로 나타났다. 이는 겨울철 동면의 메커니즘을 위한 동면 지역선택 시 조금 더 외부의 침입으로부터 안전하고, 인간과의 접촉에서 멀어지려는 습성에 의한 것으로 판단된다. 본 연구는 반달가슴곰이 동면기간 동안 혹독한 추위와 많은 위협요인을 피할 수 있는 동면 장소를 선택하는 서식환경요소를 분석함으로써, 반달가슴곰의 동면 생태 기작과 서식지 관리를 위한 기초적 자료를 제공하고자 한다.

기계공학과에서 제시하는 Hands-on Experience 중심의 "엔지니어링 디자인" 교과목의 강의사례 (A Case Study of "Engineering Design" Education with Emphasize on Hands-on Experience)

  • 김홍찬;김지훈;김관주;김정수
    • 공학교육연구
    • /
    • 제10권2호
    • /
    • pp.44-61
    • /
    • 2007
  • 본 논문은 공학 교육에서 강조하고 있는 창의력, 협업 능력 및 의사소통능력의 함양을 주 목적으로 홍익대학교 기계 시스템디자인공학과에서 새로이 개발한 교과목에 관하여 소개하고자 한다. '기계 시스템 디자인공학과'는 엔지니어링 디자인을 강조하는 새로운 교과목을 갖춘, 기존 홍익대학교 기계공학과의 새로운 이름이다. 급변하는 교육환경과 산업계의 요구에 부응하기위해서 기계공학과는 아날로그 기반, 산업중심의 하드한 관점에서 디지털 기반, 인간 중심의 소프트한 가치 중심으로 그 교육 접근방식을 전환하였다. 이러한 관점에서 새로이 개설된 세 가지 학과목인 기계 시스템디자인 개론, 창의적 공학 설계, 제품디자인은 공통적으로 팀 프로젝트를 통해서 손으로 직접 만들고 대화하고 표현하는(이하 Hands-on experience)경험을 중요시 하고 있다. 또한 이들 과정에서는 브레인스토밍(Brain Storming)과 스케치를 통한 시제작(Prototyping) 과정을 강조하고 있으며, 전통적으로 다루기 힘들고 무거운 금속 소재 대신에 폴리스티렌 블록이나 카드보드와 같은 가볍고 유연성 있는 소재를 사용하여 가능한 다양하고 창의적인 원형(Prototype)을 만들고, 팀원들간의 활발한 의사소통을 체험 할 수 있도록 유도하였다. Hands-on experience 중심 프로그램들은 학생들로 하여금 협업능력을 강조한 학과목들을 통해 시각적이며 구체적인 체험을 하게 하여 전통적으로 분석적이고 수학적이며 추상적인 사고에 초점을 맞춘 공학과목들을 균형적으로 보완하는 역할을 할 것으로 보이며, 졸업 후 그들이 산업현장에서 접하게 될 복잡하고 구체적인 엔지니어링 과제들을 해결하는 엔지니어링 감각과 창의력을 개발하는데 중요한 역할을 할 수 있을 것으로 예상된다.

초분광 표적 탐지를 위한 L2,1-norm Regression 기반 밴드 선택 기법 (Band Selection Using L2,1-norm Regression for Hyperspectral Target Detection)

  • 김주창;양유경;김준형;김준모
    • 대한원격탐사학회지
    • /
    • 제33권5_1호
    • /
    • pp.455-467
    • /
    • 2017
  • 초분광 영상을 이용한 표적 탐지를 수행할 때에는 인접한 분광 밴드의 중복성의 문제 및 고차원 데이터로 인해 발생하는 방대한 계산량의 문제점을 해결하기 위한 특징 추출 과정이 필수적이다. 본 연구는 기계 학습 분야의 특징 선택 기법을 초분광 밴드 선택에 적용하기 위해 $L_{2,1}$-norm regression 모델을 이용한 새로운 밴드 선택 기법을 제안하였으며, 제안한 밴드 선택 기법의 성능 분석을 위해 표적이 존재하는 초분광영상을 직접 촬영하고 이를 바탕으로 표적 탐지를 수행한 결과를 분석하였다. 350 nm~2500 nm 파장 대역에서 밴드 수를 164개에서 약 30~40개로 감소시켰을 때 Adaptive Cosine Estimator(ACE) 탐지 성능이 유지되거나 향상되는 결과를 보였다. 실험 결과를 통해 제안한 밴드 선택 기법이 초분광 영상에서 탐지에 효율적인 밴드를 추출해 내며, 이를 통해 성능의 감소 없이 데이터의 차원 감소를 수행할 수 있어 향후 실시간 표적 탐지 시스템의 처리 속도 향상에 도움을 줄 수 있을 것으로 보인다.

CRM의 기능 분류를 위한 통계적 학습에 관한 연구 (A Study of Statistical Learning as a CRM s Classifier Functions)

  • 장근;이정배;이병수
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.71-76
    • /
    • 2004
  • 현재 ERP와 CRM은 대부분 전통적인 기능적 수행에만 초점이 맞추어져 있다. 그러나 최근의 경영환경은 인터넷(Internet)과 이를 기반으로 하는 전자상거래의 비약적 발전에 기인하여 시장의 변화를 가져왔으며, 이는 대부분 e-비즈니스화 되어 가고 있으며, 이를 추진하면서 제휴기관과의 관계증진, 고객관계의 혁신적 개선은 물론 조직내부의 업무프로세스의 획기적 개선을 통한 경쟁력 강화를 적극적으로 전개하고 있다. CRM(Customer Relationship Management)은 기업이 획득한 고객을 지속적으로 유지하고, 기업에 대한 고객의 가치를 증진시키기 위해 기업과 고객간의 상호 이익적 관계를 형성 유지 강화하려는 기업의 일련의 마케팅과정으로 다양하고도 수많은 고객들의 정보를 기반으로 수행되기 때문에 고객 정보를 파악할 수 있는 시스템 기반을 필요로 하며, 생산과 상품의 전달경로, 마케팅, 그리고 의사결정 등의 경영 카테고리와 연관되어 있다. 한편 ERP는 SCM과 CRM 및 SEM(Strategic Enterprise Management)등으로 기능을 확대해감에 따라 21세기의 ERP는 e-비즈니스의 전략적 도구로 발전해 갈 것이다. 본 논문에서는 이를 위한 중재 도구를 제시함으로써 고객에게 더욱 더 효율적이고 고 부가가치 있는 의미 있는 데이터들의 통계적 기계 학습법을 통해 CRM의 기능들을 효율적으로 분류할 수 있도록 한다. 또한 시스템 특징으로는 기존에 수작업으로 이루어지던 파일의 분류 작업을 기계 학습법을 통한 에이전트가 자동으로 수행함으로써 사용자가 좀 더 효율적으로 작업을 수행 할 수 있도록 한 것이다.

사람 걸음 탐지 및 배경잡음 분류 처리를 위한 도플러 레이다용 딥뉴럴네트워크 (Human Walking Detection and Background Noise Classification by Deep Neural Networks for Doppler Radars)

  • 권지훈;하성재;곽노준
    • 한국전자파학회논문지
    • /
    • 제29권7호
    • /
    • pp.550-559
    • /
    • 2018
  • 본 논문은 딥뉴럴네트워크(deep neural network: DNN)를 이용해 사람 걸음 및 배경잡음원에 의해 발생한 마이크로 도플러 신호를 탐지 및 분류 처리하는 연구를 제안한다. 기존 분류처리 연구는 경험 및 통계적인 방법을 통해 분류기 성능에 직접적으로 영향을 미치는 의미있는 특징을 추출하기 위한 복잡한 과정을 포함한다. 그러나 딥뉴럴네트워크는 다수의 레이어 층을 단계적으로 통과하는 과정을 통해 점진적으로 특징을 재구성 및 생성하므로, 별도의 특징 추출과정을 생략할 수 있으며, 자연스럽게 네트워크상에서 특징을 생성할 수 있는 이점이 있다. 따라서 본 논문에서는 마이크로 도플러 신호 인식을 위한 딥뉴럴네트워크 효과성 입증을 위해, 이진분류기와 다층클래스 분류기를 다층퍼셉트론과 딥뉴럴네트워크를 통해 설계하고 비교분석한다. 실험 결과, 다층퍼셉트론은 이진분류기의 경우 테스트세트에 대한 분류 정확도가 90.3 %로 측정되었고, 다층클래스 분류기의 경우 테스트세트에 대한 분류정확도가 86.1 %로 측정되었다. 딥뉴럴네트워크는 이진분류기의 경우 테스트세트에 대한 분류 정확도가 97.3 %로 측정되었고, 다층클래스 분류기의 경우 테스트세트에 대한 분류정확도가 96.1 %로 측정되었다.

선형 강도 교정을 이용한 라만 스펙트럼 인식 (The identification of Raman spectra by using linear intensity calibration)

  • 박준규;백성준;박아론
    • 한국산학기술학회논문지
    • /
    • 제19권3호
    • /
    • pp.32-39
    • /
    • 2018
  • 라만 스펙트럼은 측정 장비 및 환경 조건에 따라 동일한 물질이라도 스펙트럼의 강도 차이를 보인다. 이는 라만 분광의 패턴 인식적인 접근에 제약을 주기 때문에 장비간의 호환성 및 라만 데이터베이스의 재사용을 위해 반드시 해결해야 하는 문제다. 이를 위해 이전의 주요 연구들에서는 측정 장비 간에 전달 함수를 가정하고 이를 구한 후 직접적인 스펙트럼의 교정을 수행하였다. 하지만 이 방식은 강도 왜곡을 발생시키는 다른 조건들에 대해서는 대처 할 수 없는 방법이다. 따라서 본 논문에서는 다양한 측정 조건에 보다 유연하게 대응 할 수 있는 선형 강도 교정을 이용한 분류 방법을 제안하였다. 제안한 방법의 성능 평가를 위해 실험에서는 14033종의 화학 물질에서 측정된 라만 라이브러리를 실험물질에 대한 판별 지표로 사용하였으며, 3개의 라만 분광기로부터 측정된 10종의 화학 물질 라만 스펙트럼을 실험 데이터로 사용하였다. 실험결과에 따르면 제안한 방법을 사용하였을 때 강도 왜곡된 스펙트럼에 대해 100%의 판별 성능을 보였으며, 판별된 스펙트럼에 대해서도 이전보다 높은 상관점수를 보여 사용자가 화학 물질을 판별하는 데 유용한 도구로 사용될 수 있음을 확인하였다.

API 특성 정보기반 악성 애플리케이션 식별 기법 (A Scheme for Identifying Malicious Applications Based on API Characteristics)

  • 조태주;김현기;이정환;정문규;이정현
    • 정보보호학회논문지
    • /
    • 제26권1호
    • /
    • pp.187-196
    • /
    • 2016
  • 안드로이드 애플리케이션은 악성코드를 삽입한 후 재서명하여 배포하는 리패키징 공격에 취약하다. 이러한 공격을 통해 사용자의 사생활 정보나 개인정보 유출 등의 피해가 자주 발생하고 있는 실정이다. 모든 안드로이드 애플리케이션은 사용자가 직접 작성한 메소드와 API로 구성된다. 이중 플랫폼의 리소스에 접근하며 실제 애플리케이션의 기능적인 특징을 나타내는 것은 API이고, 사용자가 작성한 메소드 역시 API를 이용하며 기능적 특징을 나타낸다. 본 논문에서는 악성 애플리케이션이 주로 활용하는 민감한 API들을 분석 대상으로 하여 악성애플리케이션이 어떤 행위를 하고, 어떤 API 를 사용하는지 사전에 식별할 수 있는 분석 기법을 제안한다. 사용하는 API를 토대로 API의 특성정보를 기반으로 나이브 베이즈 분류 기법을 적용하여 비슷한 기능을 하는 API에 대해 기계 학습하도록 한다. 이렇게 학습된 결과를 토대로 악성 애플리케이션이 주로 사용하는 API를 분류하고, 애플리케이션의 악성 위험 정도에 대한 정량적 판단 기준을 제시한다. 따라서, 제안 기법은 모바일 애플리케이션의 취약점 정도를 정량적으로 제시해 줌으로써 모바일 애플리케이션 개발자들이 앱 보안성을 사전에 파악하는데 많은 기여를 할 수 있을 것으로 기대된다.