• 제목/요약/키워드: 기계학습 구조

검색결과 314건 처리시간 0.028초

일영 통계기계번역에서 의존문법 문장 구조와 품사 정보를 사용한 클러스터링 기법 (A Clustering Method using Dependency Structure and Part-Of-Speech(POS) for Japanese-English Statistical Machine Translation)

  • 김한경;나휘동;이금희;이종혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.993-997
    • /
    • 2009
  • 클러스터링 기법은 다양한 분야에서 이용되어 왔으며, 통계 기반 기계번역에서도 익히 사용된 기법이다. 그러나 기존의 연구에서는 깊이 있는 문법적인 분석 없이 기계학습 기법을 사용하거나, 문장구조의 정보를 사용하더라도 정규식을 이용하여 판별하는 선에서 그치는 경우가 많았다. 본 논문에서는 각 문장의 의존관계 문법에 따른 구조와 조사 등의 품사 정보를 사용하여 문장구조를 파악하고 유형별로 분류하여 각각에 특화된 언어모델을 획득하는 방법과, 이를 구 기반 통계기계번역에 추가적인 정보로 사용하여 번역성능을 향상하는 데 이용하는 방법을 제안한다.

해석가능한 기계학습을 적용한 소지역 인구 추정에 관한 연구: 부산광역시를 대상으로 (A Study on the Population Estimation of Small Areas using Explainable Machine Learning: Focused on the Busan Metropolitan City)

  • 김유현;김동현
    • 한국지리정보학회지
    • /
    • 제26권4호
    • /
    • pp.97-115
    • /
    • 2023
  • 최근 저출산, 고령화 등 인구의 구조가 급격히 변화하고 있고 인구 분포의 불균등성이 확대되고 있는 시점에서 인구 추정 방식의 변화가 요구되고 있으며 소지역 단위에서 보다 정확한 추정이 요구되고 있다. 본 연구는 이러한 인구 추정 방식 변화 요구에 대응하기 위해 부산광역시를 대상으로 해석가능한 기계학습 방법을 적용하여 500m 격자 단위에서 2040년 인구를 추정하는 것을 목적으로 하고 있다. 해석가능한 기계학습의 방법과 코호트 요인법을 각각 적용하여 격자별 인구추정 결과를 비교해본 결과, 기계학습 방법이 인구 구조 변동에 영향을 미칠 가능성이 있는 여러 변수의 조합 반영이 가능하여 보다 낮은 오차를 도출함으로써 소지역과 같이 인구 변화폭이 큰 지역의 추정에 있어 적용력이 높음을 확인하였다. 인구감소시대에 과대추정된 인구 값은 도시계획에서 투자의 비효율성과 특정 부문에 대한 과잉 투자에 따른 타 부문에서의 질적 저하와 같은 문제를 일으킬 가능성이 높으며, 과소추정된 인구 값 역시 도시의 축소를 가속화시켜 삶의 질을 저하시키는 문제를 초래하므로 적절한 인구 추정 방법과 대안을 마련해야 할 필요가 있을 것으로 판단된다.

효과적인 필기체 인식을 위한 인공지능 알고리즘 (Artificial Intelligence Algorithms for Identification of Handwriting)

  • 김승주;이재영;한종기
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.151-153
    • /
    • 2016
  • 최근 스마트폰, PC, 태블릿 같은 전자기기들이 발전하면서 기계를 통해 소통하는 시대가 왔다. 기계와 소통하기 위해 우리가 사용하는 문자를 인식하는 것은 중요한 일이다. 이런 전자기기들이 문자, 영상인식을 해야 할 필요성이 더욱 증가함에 따라 머신러닝의 중요성이 대두되었다. 머신러닝은 컴퓨터의 학습을 위해 알고리즘과 기술을 개발하는 분야를 말한다. 머신러닝의 기법과 관련된 알고리즘의 종류는 수없이 많다. 그 중에서도 Neural Network는 사람의 뇌 신경구조를 토대로 착안하여 네트워크를 만들고 이를 학습에 이용한 머신러닝 기법이다. 이런 인공지능 알고리즘인 Neural Network 구조를 바탕으로 특징을 추출하여 학습을 하는 Convolution Neural Network 기법의 사용이 늘고 있다. 본 논문에서는 Neural Network와 Convolution Neural Network의 알고리즘을 이용한 필기체 인식 실험을 하고 그 내용을 비교하였다.

  • PDF

기계가독형사전에서 상위어 판별을 위한 규칙 학습 (Learning Rules for Identifying Hypernyms in Machine Readable Dictionaries)

  • 최선화;박혁로
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.171-178
    • /
    • 2006
  • 기계가독형사전(Machine Readable Dictionary)에서 단어의 정의문에 나타나는 항목 단어의 상위개념을 추출하는 대부분의 연구들은 전문가에 의해 작성된 어휘패턴을 사용하였다. 이 방법은 사람이 직접 패턴을 수집하므로 시간과 비용이 많이 소모될 뿐만 아니라, 자연언어에는 같은 의미를 가진 다앙한 표현들이 존재하므로 넓은 커버리지를 갖는 어휘패턴들을 수집하는 것이 매우 어렵다는 단점이 있다. 이런 문제점들을 해결하기 위하여, 본 논문에서는 구문적 특징만을 이용한 상위어 판별 규칙을 기계학습함으로써 기존에 사용되었던 어휘패턴의 지나친 어휘 의존성으로 인한 낮은 커버리지 및 패턴 수집의 문제를 해결하는 방법을 제안한다. 제안한 방법으로 기계학습된 규칙들을 상위어 자동추출과정에적용한 결과 정확도 92.37% 성능을 보였다. 이는 기존 연구들보다 향상된 성능으로 기계학습에 의해 수집된 판별규칙이 상위어 판별에 있어서 어휘패턴의 문제를 해결할 수 있다는 것을 입증하였다.

유아 언어학습에 대한 하이퍼망 메모리 기반 모델 (Hypernetwork Memory-Based Model for Infant's Language Learning)

  • 이지훈;이은석;장병탁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.983-987
    • /
    • 2009
  • 유아들의 언어습득에 있어서 중요한 점 하나는 학습자에 대한 언어환경의 노출이다. 유아가 접하는 언어환경은 부모와 같은 인간뿐만 아니라 각종 미디어와 같은 인공적 환경도 포함되며, 유아는 이러한 방대한 언어환경을 탐색하면서 언어를 학습한다. 본 연구는 대용량의 언어 데이터 노출이 영향을 미치는 유아언어학습을 유연하고 적절하게 모사하는 인지적 기제에 따른 기계학습 방식을 제안한다. 유아의 초기 언어학습은 문장수준의 학습과 생성 같은 행동들이 수반되는데, 이는 언어 코퍼스에 대한 노출만으로 모사가 가능하다. 모사의 핵심은 언어 하이퍼망 구조를 가진 기억기반 학습모델이다. 언어 하이퍼망은 언어구성 요소들 간의 상위차원 관계 표상을 가능케 함으로써 새로운 데이터 스트림에 대해 유사구조의 적용과 이용을 도모하여 발달적이고 점진적인 학습을 모사한다. 본 연구에서는 11 개의 유아용 비디오로부터 추출한 문장 32744개를 언어 하이퍼망을 통한 점진적 학습을 수행하여 문장을 생성해 유아의 점진적, 발달적 학습을 모사하였다.

폼 구조의 유효 기계적 물성 및 열전도율 예측을 위한 균질화 데이터 기반 전이학습 프레임워크의 개발 (Development of Homogenization Data-based Transfer Learning Framework to Predict Effective Mechanical Properties and Thermal Conductivity of Foam Structures)

  • 이원주;김수한;심현종;이주호;안병혁;김유정;정상융;신현성
    • Composites Research
    • /
    • 제36권3호
    • /
    • pp.205-210
    • /
    • 2023
  • 본 연구에서는 폼 구조의 효율적인 유효 기계적 물성 및 열전도율 예측을 위한 균질화 데이터 기반 전이학습 프레임워크를 개발하였다. Eshelby 텐서 기반의 평균장 균질화(Mean-field homogenization, MFH)는 타원체 형태의 공동을 포함하는 다공성 구조의 물성을 효율적으로 예측할 수 있지만, 셀룰러(cellular) 폼 구조의 물성은 정확하게 예측하기 어렵다. 한편, 유한요소 균질화(Finite element homogenization, FEH)는 정확성은 높지만 상대적으로 높은 해석 시간을 동반한다. 본 논문에서는 평균장 균질화와 유한요소 균질화의 장점을 결합한 데이터 기반 전이학습 프레임워크(Framework)를 제안하였다. 구체적으로, 대량의 평균장 균질화 데이터를 도출하여 사전학습 모델(Pre-trained model)을 구축하고, 상대적으로 소량의 유한요소 균질화 데이터를 이용하여 미세 조정(Fine-tuning) 하였다. 제안된 프레임워크를 검증하기 위한 수치 예제를 수행하였으며, 해석 정확도를 확인하였다. 본 연구의 결과는 다양한 폼 구조를 가진 재료의 해석에 적용할 수 있을 것으로 기대한다.

격조사 복원: 구문분석 전처리 (Case Particle Restoration as Preprocessing for Syntactic Analysis)

  • 서형원;권홍석;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-7
    • /
    • 2012
  • 본 논문은 구문분석의 전처리로서 생략된 한국어 격조사의 복원 방법을 제안한다. 격조사 생략은 체언과 용언 사이의 관계가 아주 밀접하여 생략하여도 의사 전달에 문제가 없을 경우에 자주 발생한다. 이렇게 생략된 조사는 구문분석의 복잡도를 크게 높일 뿐 아니라 구문 분석의 오류의 원인이 되기도 한다. 본 논문에서는 구문구조 부착 말뭉치를 분석하여 생략된 조사는 그 체언과 용언 사이의 거리가 매우 가깝다는 사실을 발견하였고 이 성질을 이용해서 기계학습 방법을 이용해서 생략된 조사를 복원하는 방법을 제안한다. 본 논문에서는 ETRI 구문구조 부착 말뭉치를 이용해서 실험한 결과, 생략된 조사의 81%를 정확하게 복원할 수 있었다.

  • PDF

회귀 문제에서 예측값들의 분산을 줄이기 위한 딥뉴럴 네트워크 구조 연구 (A study on the architecture of a deep neural network to reduce the variance of predicted values in a regression problem)

  • 김종환;여도엽
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.11-14
    • /
    • 2022
  • 본 논문에서는 회귀 문제에서 예측값들의 분산을 줄이기 위한 딥뉴럴 네트워크 구조를 제안한다. 일반적인 회귀 문제에서 딥뉴럴 네트워크 학습 시, 하나의 입력에 대한 레이블 값을 이용하여 학습한다. 본 눈문에서는 하나의 입력에 대한 레이블 값뿐만 아니라 두 입력에 대한 레이블 값들의 차이를 학습시키는 딥뉴럴 네트워크 구조를 제안한다. 통계학 이론을 통하여 예측값들의 분산이 줄어든다는 것을 증명한다. 또한, 배관 곡관의 감육두께를 예측하는 문제를 통해 제안된 네트워크의 성능을 검증한다. 일반적인 딥뉴럴 네트워크 구조를 이용하였을 때에 비하여 제안한 네트워크 구조를 이용하였을 때, 회귀 문제의 예측값들의 분산이 감소함을 확인한다.

  • PDF

과학 논문 초록 말뭉치 구축 및 선학습 트랜스포머 기반 초록 자동구조화 방법 (Scientific Paper Abstract Corpus and Automatic Abstract Structure Parsing using Pretrained Transformer)

  • 김서경;조윤희;허세훈;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.280-283
    • /
    • 2020
  • 논문 초록은 논문의 내용을 요약해 제시함으로써 독자들의 연구결과물에 대한 빠른 검색과 이해를 도모한다. 초록의 구성은 대부분 전형적인 경우가 많기 때문에, 초록의 구조를 자동 분석하여 색인해두면 유사구조 초록을 검색하거나 생성하는 등의 연구효율화에 기여할 수 있다. 허세훈 외 (2019)는 초록 자동구조화를 위한 말뭉치 SPA2019 및 기계학습기반의 자동구조화 방법을 제시하였다. 본 연구는, 기존 SPA2019 의 구조화 오류를 바로잡고, SPA2019 에서 추출한 1,346 개의 초록데이터와 2,385 개의 초록데이터를 추가한 SPA2020 말뭉치를 새로이 소개한다. 또한, 다양한 선학습 기반 트랜스포머들을 활용하여 초록 자동구조화를 수행하였으며, 그 결과 BERT-0.86%, RoBERTa-0.86%, ALBERT-0.84%, XLNet-0.86%, DistilBERT-0.85% 등의 자동구조화 성능을 보임을 확인하였다.

  • PDF

진화 신경망을 이용한 DNA Microarray 데이터 분석 (Analysis of DNA Microarray Data Using Evolutionary Neural Networks)

  • 김경중;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.733-735
    • /
    • 2003
  • DNA Microarray 기술은 유전자의 발현여부를 매우 빠르게 검사할 수 있는 도구이며 각종 질병의 발생여부를 예측하기 위한 정보를 제공한다. 유전자 발현 데이터로부터 암의 발생 여부를 예측하기 위해서는 기존의 접근방법과 다른 기계학습 기법이 요구된다. 일반적으로 샘플의 개수가 극히 적은 반면에 특징의 개수는 수천에서 수만 개가 존재하기 때문에 문제의 특성에 맞는 분류기의 구조를 결정하는 것이 매우 어려운 일이기 때문이다. 진화 신경망은 신경망의 구조와 가중치를 동시에 학습하며 사용자는 각 개체의 적합도를 평가할 수 있는 방법만 제공해 주면된다. 특히 신경망의 구조를 사전에 고정하지 않아도 되는 장점이 있기 때문에 전문적인 지식이 없는 사용자라도 이용가능하다. 대장암 데이터에 대한 실험결과 제안하는 분류기 모델이 다층 퍼셉트론, SVM (support vector machine), 최근접 이웃 방법에 비해 향상된 성능을 보였다.

  • PDF