• 제목/요약/키워드: 기계학습 구조

검색결과 314건 처리시간 0.025초

통사문법적 지식이 '독서기계'의 음성출력에 미치는 영향과 중요성 (The Influence and Impact of syntactic-grammatical knowledge on the Phonetic Outputs of a 'Reading Machine')

  • 홍성심
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.225-230
    • /
    • 2020
  • 인공지능, 딥러닝, 머신러닝 등이 괄목할만한 발전을 이루면서 2016년경부터 100여개의 언어를 비롯하여 가장 보편적으로 사용되어 온 Google Translate (구글기계번역기)는 자연언어처리(NLP) 분야와 외국어 학습 등 언어활용 분야에 독보적인 역할을 하고 있다. 본 논문은 구글기계번역기, Google Translate에 있어서, 영어모국어화자가 가진 통사문법적-범주적 지식의 중요성과 그 영향력에 대해 살펴보고자 한다. Jackendoff (1999)는 맹인을 위한 독서기계(Reading Machine)등을 구축하려면 통사구조적 지식과 문법적 분해력(parsing)이 매우 중요하고, 적어도 현재의 컴퓨터는 엄청난 발전을 이루기는 하였으나, 인간의 두뇌를 따라갈 수 없다는 결론을 내렸다. Jackendoff가 논의했던 몇 가지 어휘항목과 통사구조적 중의성을 활용하여, Google Translate 기계발음번역기를 통해 그의 주장을 확인하는 실험을 실시하고, 그 결과를 분석하는 것이 이 논문의 목표이다. 이 연구는 Jackendoff의 주장처럼 L1 화자가 내재화한 통사문법적, 범주-구조적 지식은 NLP, 혹은 "독서기계"등의 구축에서 중요하며, 이는 Chomsky (1986, 2005)등에서 논의된 내재적언어 (I-language)의 핵심이라는 점을 시사한다.

평면적 어휘 자질들을 활용한 확장 혼합 커널 기반 관계 추출 (Relation Extraction based on Extended Composite Kernel using Flat Lexical Features)

  • 최성필;정창후;최윤수;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권8호
    • /
    • pp.642-652
    • /
    • 2009
  • 본 논문에서는 기존의 관계 추출 성능을 향상시키기 위해서 기존의 자질 기반 방법에서 추구하였던 개체 주변 문맥 다양성 정보의 추출 및 적용과 커널 기반 방법의 강점인 관계 인스턴스에 대한 구문 구조적 자질 정보의 통합 활용을 통한 확장된 혼합 커널을 제안한다. ACE RDC 코퍼스를 활용한 실험에서, 기존의 합성곱 구문 트리 커널 기반 혼합 커널을 기반으로 총 9 종류의 평면적 어휘 자질 집합을 정의하고 이를 적용함으로써 성능 향상에 기여하는 어휘 자질 유형을 파악할 수 있었으며, 적은 규모의 학습 집합으로도 현재 최고 수준의 성능에 필적하는 결과를 얻을 수 있었다. 결론적으로 관계 추출을 위한 세 가지 핵심 정보, 즉 개체 자질, 구문 구조적 자질, 주변 문맥 어휘 자질을 통합 적용하면 관계 추출의 성능을 향상시킬 수 있음을 알 수 있었다.

Descriptor 특성이 신경망포텐셜의 소재 물성 예측 정확도에 미치는 영향에 관한 연구 (The Impact of Descriptor Characteristics on the Accuracy of Neural Network Potentials for Predicting Material Properties)

  • 김지영
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권6호
    • /
    • pp.378-384
    • /
    • 2023
  • 본 연구에서는 신경망포텐셜(Neural Network Potential)의 효율성과 정확도를 동시에 달성할 수 있는 기술자 벡터 조건을 도출하고자 한다. 소재 시스템은 단원소 소재인 실리콘으로 선정하였으며, 인공신경망 학습을 위한 원자 구조별 에너지 데이터는 밀도범함수이론 계산을 통하여 생성하였다. Behler-Parrinello 타입의 원자중심대칭함수를 기술자 벡터로 사용하였고, 다양한 벡터 길이에 대한 신경망포텐셜 생성 후 분자동역학 시뮬레이션에 적용하여 실리콘 소재의 구조 및 기계적 물성 재현성을 평가하였다. 실험 결과, 물성 재현 정확도를 유지하면서 학습 및 계산 효율성을 동시에 달성할 수 있는 기술자벡터의 최소 길이는 약 50이고, 소재의 기계적 물성이 이 길이에 더 큰 영향을 받으며, 같은 길이의 조건에서는 방사 대비 각도 방향 대칭함수를 더 반영하면 신경망포텐셜의 정확도가 올라감을 발견하였다. 이를 토대로 신경망포텐셜의 효율성과 정확도 동시 달성을 위한 최적의 기술자벡터 설정 가이드라인 제공이 가능할 것으로 기대된다.

Echo State Network 모델의 은닉 뉴런 간 연결구조에 따른 성능과 동역학적 특성 분석 (Analyzing Performance and Dynamics of Echo State Networks Given Various Structures of Hidden Neuron Connections)

  • 윤상웅;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권4호
    • /
    • pp.338-342
    • /
    • 2015
  • 시계열 데이터를 다룰 수 있는 기계학습모델인 회귀 신경망은 되먹임 연결을 허용하기 때문에 앞먹임 신경망에 비해 훨씬 다양한 구조를 가질 수 있다. 본 연구에서는 은닉 뉴런 간의 네트워크 구조에 초점을 맞추어 그것이 회귀 신경망의 정보처리 능력에 미치는 영향을 탐구하고자 한다. 이를 위해 회귀신경망 모델 중 하나인 Echo State Network을 기준으로 하여, 여러 가지 잘 알려진 네트워크 모델에 따라 은닉 뉴런 간 연결을 구성하고 각각의 경우에 시계열 학습 능력과 동역학을 분석하였다. 그 결과, 은닉 뉴런의 네트워크 구조에 따라 모델의 성능이 큰 폭으로 변하는 것이 관찰되었으며, 그러한 현상은 신경망 동역학이 가지는 임계도(criticality)의 변화와 잘 일치했다. 본 연구의 결과는 기존 회귀 신경망 연구에서 주된 관심사였던 신경망 연결 가중치뿐만 아니라 신경망의 연결 구조가 모델의 성능에 중요한 영향을 미친다는 사실을 보여주며, 성능 향상을 위한 중요한 단서가 될 수 있다.

공작기계 컨트롤러용 고속 신경망 필터의 기초설계 (The Basic Design of High Speed Neural Network Filter for Application of Machine Tools Controller)

  • 김진선;신우철;홍준희
    • 한국공작기계학회:학술대회논문집
    • /
    • 한국공작기계학회 2003년도 추계학술대회
    • /
    • pp.125-130
    • /
    • 2003
  • This Paper describes a Nonlinear adoptive noise canceller using Neural Network for Machine Tools Controller System. Back-Propagation Learning Algorithm based MLP (Multi Layer Perceptron)is used an adaptive filters. In this Paper. it assume that the noise of primary input in the adaptive noise canceller is not the same characteristic as that of the reference input. Experimental results show that the neural network base noise canceller outperforms the linear noise canceller. Especially to make noise cancel close to realtime, Primary Input is divided by Unit and each divided pan is processed for very short time than all the processed data are unified to whole data.

  • PDF

영한 기계번역에서 긴 문장의 구문 분석 정확성 향상을 위한 쉼표의 용도 분류 (Comma Usage Classification for Improving Parsing Accuracy of Long Sentences in English-Korean Machine Translation)

  • 김성동;박성훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.1-6
    • /
    • 2006
  • 영한 기계번역에서 긴 문장은 분석 복잡도가 높아서 정확하게 분석하기 어렵다. 본 논문에서는 영어 구문 분석의 정확성을 향상시키기 위해서 긴 문장을 구성하는 쉼표의 역할을 자동적으로 판단하는 방법을 연구하였다. 쉼표는 긴 문장을 구성할 때 많이 사용되며 하나의 긴 문장을 만들 때 다양한 역할을 한다. 긴 문장을 분석할 때 쉼표에 의해 분할되는 부분을 독립적으로 분할하고 쉼표의 역할에 따라 분석된 결과를 적절하게 결합한다면 보다 빠르고 정확하게 주어진 문장 구조를 얻을 수 있다. 본 논문에서는 쉼표의 용도가 표시된 말뭉치로부터 분포 차이를 이용하여 쉼표 분류 규칙을 생성한다. 실험을 통해 논문에서 제시한 방법과 다른 학습방법에 의한 쉼표 분류의 정확도를 비교하여 본 논문에서 제시한 방법이 실용적 가치가 있음을 보인다.

  • PDF

신경망 분류기를 이용한 암 관련 유전자 발현정보를 분류 (Classification of Cancer-related Gene Expression Data Using Neural Network Classifiers)

  • 권영준;류중원;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.295-297
    • /
    • 2001
  • 최근 생물 유전자 정보를 효과적으로 분석하기 위한 적절한 도구의 필요성이 대두되고 있다. 본 논문에서는 백혈병 환자의 골수로부터 얻어낸 DNA Microarray 유전 정보를 분류하여 환자가 가지고 있는 암의 종류를 예측하기 위한 최적의 특징추출방법과 분류 방법을 찾고자 한다. 이를 위해 피어슨 상관관계, 유클리디안 거리, 코사인 계수, 스피어맨 상관관계, 정보 이득, 상호 정보, 신호 대잡음비의 7가지 특징 추출 방법을 사용하였으며, 역전과 신경망, 의사결정 트리, 구조 적응형 자기구성 지도, $textsc{k}$-최근접 이웃 등 가지의 기계학습 분류기를 이용하여 분류 실험을 하였다. 실험결과, 피어슨 상관관계와 역전파 신경망을 이용한 분류 방법이 97.1%의 인식률을 보임을 알 수 있었다.

  • PDF

효율적인 전용회선 자원 사용량 예측을 위한 통계적 기법과 기계학습 모델 비교 연구 (A Comparative Study of Statistical Techniques and Machine Learning Models for Efficient Leased Line Resource Usage Prediction)

  • 이인규;송미화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.474-476
    • /
    • 2021
  • 전용회선은 두 지역을 독점적으로 사용하는 구조이기 때문에 안정된 품질수준과 보안성이 확보되어 교환 회선의 급격한 증가에도 불구하고 지속적으로 많이 사용하는 회선 방식이다. 하지만 비용이 상대적으로 고가이기 때문에 네트워크 전용회선의 자원을 적절히 배치하고 활용하여 최적의 상태를 유지하는 것이 중요한 요소이다. 이에 본 연구에서는 기업 네트워크에서 사용하는 전용회선의 실제 사용률 데이터를 기반으로 다양한 시계열 데이터 예측 모델을 적용하고 성능을 평가하였다. 일반적으로 통계적인 방법으로 많이 사용하는 평활화 모형 및 ARIMA 모형과 요즘 많은 연구가 되고 있는 인공신경망에 기반한 딥러닝의 대표적인 모델들을 적용하여 각각의 예측에 대한 성능을 측정하고 비교하였다.

번역 품질 예측을 위한 HTER 분포 평준화 기반 인조 번역 품질 말뭉치 구축 방법 (Construction of an Artificial Training Corpus for The Quality Estimation Task based on HTER Distribution Equalization)

  • 박준수;이원기;신재훈;한효정;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.460-464
    • /
    • 2019
  • 번역 품질 예측은 기계번역 시스템이 생성한 번역문의 품질을 정답 번역문을 참고하지 않고 예측하는 과정으로, 번역문의 사후 교정을 위한 번역 오류 검출의 역할을 담당하는 중요한 연구이다. 본 논문은 문장 수준의 번역 품질 예측 문제를 HTER 구간의 분류 문제로 간주하여, 번역 품질 말뭉치의 HTER 분포 불균형으로 인한 성능 제약을 완화하기 위해 인조 사후 교정 말뭉치를 이용하는 방법을 제안하였다. 결과적으로 HTER 분포를 균등하게 조정한 학습 말뭉치가 그렇지 않은 쪽에 비해 번역 품질 예측에 더 효과적인 것을 보였다.

  • PDF

딥러닝을 활용한 선박가치평가 모델 개발

  • 최정석;김동균
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2020년도 추계학술대회
    • /
    • pp.108-110
    • /
    • 2020
  • 본 연구의 목적은 딥러닝 기법의 하나인 인공신경망 모델을 활용하여 선박의 가치평가 모델을 개발하는 것이다. 선박의 가치는 해운시장 변화와 밀접한 관계가 있으며, 경기 변동성이 크고 시장 민감성이 높은 해운시장의 특성상 가치의 불확실성 역시 높게 나타나고 있다. 이러한 선박가치의 중요성에도 불구하고 국내외적으로 선박가치평가의 체계 개선 및 평가모델의 객관성과 신뢰성을 제고시키기 위한 연구는 부족한 실정이다. 따라서 본 연구에서는 딥러닝 방법을 통해 선박의 가치를 산출하는 새로운 평가모델을 제시하고자 한다. 가치평가의 대상은 중고 VLCC선이며, 선행연구를 통해 선박의 가치 변화를 유발하는 주요 요인들을 선별하여 변수를 설정하고 2010년 1월부터 현재까지의 해당 데이터를 확보하였다. 교차검증을 통해 파라미터들을 추정하여 인공신경망의 최적 구조를 식별하고 이에 대한 객관성과 신뢰성을 검증한 결과 인공신경망 모델의 가치평가 정확성이 우수함을 확인하였다. 본 연구는 선박가치평가의 전통적 방법론에서 탈피하여 기계학습 기반의 딥러닝 모델을 활용한 측면에서 독창적인 의미가 있다.

  • PDF