• 제목/요약/키워드: 기계모델

검색결과 4,667건 처리시간 0.029초

관계추출 모델 학습을 위한 반자동 패턴 마이닝 (Semiautomatic Pattern Mining for Training a Relation Extraction Model)

  • 최규현;남상하;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.257-262
    • /
    • 2016
  • 본 논문은 비구조적인 자연어 문장으로부터 두 개체 사이의 관계를 표현하는 구조적인 트리플을 밝히는 관계추출에 관한 연구를 기술한다. 사람이 직접 언어적 분석을 통해 트리플이 표현되는 형식을 입력하여 관계를 추출하는 규칙 기반 접근법에 비해 기계가 데이터로부터 표현 형식을 학습하는 기계학습 기반 접근법은 더 다양한 표현 형식을 확보할 수 있다. 기계학습을 이용하려면 모델을 훈련하기 위한 학습 데이터가 필요한데 학습 데이터가 수집되는 방식에 따라 지도 학습, 원격지도 학습 등으로 구분할 수 있다. 지도 학습은 사람이 학습 데이터를 만들어야하므로 사람의 노력이 많이 필요한 단점이 있지만 양질의 데이터를 사용하는 만큼 고성능의 관계추출 모델을 만들기 용이하다. 원격지도 학습은 사람의 노력을 필요로 하지 않고 학습 데이터를 만들 수 있지만 데이터의 질이 떨어지는 만큼 높은 관계추출 모델의 성능을 기대하기 어렵다. 본 연구는 기계학습을 통해 관계추출 모델을 훈련하는데 있어 지도 학습과 원격지도 학습이 가지는 단점을 서로 보완하여 타협점을 제시하는 학습 방법을 제안한다.

  • PDF

다단계 기계학습 기법을 이용한 구묶음 성능향상 (Performance Improvement of Chunking Using Cascaded Machine Learning Methods)

  • 전길호;서형원;최명길;남유림;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.107-109
    • /
    • 2011
  • 기계학습은 학습말뭉치로부터 문제를 해결하기 위한 규칙을 학습하여 모델을 생성한다. 생성된 모델의 성능을 높이기 위해서는 문제에 적합한 자질들을 많이 이용해야 하지만 많은 자질들을 사용하면 모델의 생성시간은 느려지는 것이 사실이다. 이 문제를 해결하기 위해 본 논문에서는 다단계 기법을 적용한 기계학습으로 구묶음 시스템을 제작하여 학습모델의 생성시간을 단축하고 성능을 높이는 기법을 제안한다. 많은 종류의 자질들을 두 단계로 분리하여 학습하는 기법으로 1단계에서 구의 경계를 인식하고 2단계에서 구의태그를 결정한다. 1단계의 학습자질은 어휘 정보, 품사 정보, 띄어쓰기 정보, 중심어 정보를 사용하였으며, 2단계 학습자질은 어휘 정보와 품사 정보 외에 1단계 결과에서 추출한 구의 시작 품사 정보와 끝 품사 정보, 구 정보, 구 품사 정보를 자질로 사용하였다. 평가를 위해서 본 논문에서는 ETRI 구문구조 말뭉치를 사용하였다.

  • PDF

한-영 관용구 기계번역을 위한 NMT 학습 방법 (NMT Training Method for Korean-English Idiom Machine Translation)

  • 최민주;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-356
    • /
    • 2020
  • 관용구는 둘 이상의 단어가 결합하여 특정한 뜻을 생성한 어구로 기계번역 시 종종 오역이 발생한다. 이는 관용구가 지닌 함축적인 의미를 정확하게 번역할 수 없는 기계번역의 한계를 드러낸다. 따라서 신경망 기계 번역(Neural Machine Translation)에서 관용구를 효과적으로 학습하려면 관용구에 특화된 번역 쌍 데이터셋과 학습 방법이 필요하다. 본 논문에서는 한-영 관용구 기계번역에 특화된 데이터셋을 이용하여 신경망 기계번역 모델에 관용구를 효과적으로 학습시키기 위해 특정 토큰을 삽입하여 문장에 포함된 관용구의 위치를 나타내는 방법을 제안한다. 실험 결과, 제안한 방법을 이용하여 학습하였을 때 대부분의 신경망 기계 번역 모델에서 관용구 번역 품질의 향상이 있음을 보였다.

  • PDF

건설자동화 기계의 연구개발 단계에 따른 성능 분석 모델 개발 (Development of the Performance Analysis Model Based on Research and Development Phases for Automated Construction Equipment)

  • 이정호;김영석
    • 한국건설관리학회논문집
    • /
    • 제9권2호
    • /
    • pp.67-80
    • /
    • 2008
  • 국내의 경우 2000년 이후부터 건설교통부의 지원 하에 건축/토목/메카트로닉스 전문가 집단을 중심으로 경쟁력 있는 건설자동화 기계들이 개발되어 현장에 시험 적용되어 왔다. 개발완료된 자동화 기계의 성능을 분석하여 재래식 방식과 비교한 자동화 방식의 효율성을 제시하기 위한 연구가 수행되었으나 자동화 기계 연구개발 과정에서 요구되는 성능 분석을 체계적으로 수행하지 못하였다. 또한 자동화 기계 개발의 중요한 목적의 일부인 안전성 및 품질 향상 정도에 대해서 정성적으로만 기술함으로써 자동화 기계 개발의 종합적 가치 분석이 수행되지 못한 점은 문제점으로 지적되어 왔다. 따라서 본 연구에서는 자동화 기계 연구개발 단계를 타당성 분석 단계/제작 단계/실용화 및 마케팅 단계로 구분하고 각 단계에서 요구되는 건설자동화 기계의 성능 분석을 효율적으로 수행할 수 있도록 성능 분석 절차 및 방법론의 제시를 통해 건설자동화 기계의 종합적 성능 분석 모델 및 시스템을 개발하였다. 본 연구를 통해 제안된 성능 분석 모델 및 시스템의 활용을 통해 건설자동화 기계 개발 타당성 분석 및 현장의 요구사항을 만족시키는 우수한 성능을 지닌 자동화 기계를 개발할 수 있으며, 개발된 자동화 기계의 마케팅 전략을 효과적으로 수립할 수 있도록 함으로써 건설자동화 기계의 확대 보급 및 실용화에 기여할 수 있을 것으로 기대된다.

AFM을 이용한 세포의 기계적 특성 연구

  • 이상명;윤의성
    • 기계저널
    • /
    • 제51권10호
    • /
    • pp.30-33
    • /
    • 2011
  • 이 글에서는 AFM을 이용한 다양한 세포 모델의 기계적 특성 분석 기술과 이를 바탕으로 한 의학적 응용 기술에 대해 알아보고자 한다.

  • PDF

사물인터넷 환경에서 제품 불량 예측을 위한 기계 학습 모델에 관한 연구 (A Study on the Machine Learning Model for Product Faulty Prediction in Internet of Things Environment)

  • 구진희
    • 융합정보논문지
    • /
    • 제7권1호
    • /
    • pp.55-60
    • /
    • 2017
  • 사물인터넷 환경에서 인간의 개입 없는 지능화된 서비스를 위해서는 IoT 디바이스에서 생성되는 빅데이터로 부터 정상 패턴을 학습하고 이를 기반으로 불량, 오작동과 같은 이상 징후에 대해 예측하는 과정이 요구된다. 본 연구의 목적은 제품 공정의 다양한 기기에서 발생되는 빅데이터를 분석함으로써 제품 불량을 예측할 수 있는 기계 학습모델을 구현하는 것이다. 기계 학습 모델은 어느 정도 볼륨을 가진 기존 데이터를 기반으로 분석을 해야 하므로 빅데이터 분석도구 R을 사용하였으며, 제품 공정에서 수집된 데이터에는 제품에 대한 불량 여부가 포함되어 있으므로 지도 학습 모델을 활용하였다. 연구의 결과, 제품 불량에 영향을 주는 변수 및 변수 조건을 분류하였고, 의사결정 트리를 기반으로 제품의 불량 여부에 대한 예측 모델을 제시하였다. 또한, ROC Curve를 이용한 모델의 적합성 및 성능평가 분석에서 모델의 예측력은 상당히 높게 나타났다.

공공빅데이터를 활용한 기계학습 기반 뇌졸중 위험도 예측 (Machine Learning-based Stroke Risk Prediction using Public Big Data)

  • 정선우;이민지;유선용
    • 한국항행학회논문지
    • /
    • 제25권1호
    • /
    • pp.96-101
    • /
    • 2021
  • 본 논문은 빅데이터를 이용하여 심방세동 환자의 뇌졸중 발병을 예측하는 기계 학습 모델을 제시한다. 학습 데이터로는 국민 건강 보험공단에서 제공하는 대한민국 전수에 해당하는 심방세동 환자의 정보를 수집하였다. 수집된 정보는 인구사회학, 과거 병력, 건강검진을 포함한 68개 독립변수로 구성된다. 본 연구의 목표는 기존 심방세동 환자의 뇌졸중 위험도 예측에 사용되던 통계적 모델 (CHADS2, CHA2DS2-VASc)의 성능을 검증하고 기계 학습 모델을 적용하여 기존 모델보다 높은 정확도를 가지는 모델을 제시하는 것이다. 제안하는 모델의 정확도, AUROC (area under the receiver operating characteristic)를 검증한 결과 제안하는 기계 학습 기반의 모형이 심방세동 환자의 뇌졸중 위험도를 사용한 모델이 기존의 통계적 모델보다 높은 정확도, 민감도, 특이도를 가지는 것을 확인할 수 있었다.