• 제목/요약/키워드: 자연어 분석

검색결과 556건 처리시간 0.037초

BART를 이용한 한국어 자연어처리: 개체명 인식, 감성분석, 의미역 결정 (BART for Korean Natural Language Processing: Named Entity Recognition, Sentiment Analysis, Semantic role labelling)

  • 홍승연;나승훈;신종훈;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.172-175
    • /
    • 2020
  • 최근 자연어처리는 대용량 코퍼스를 이용하여 언어 모델을 사전 학습하고 fine-tuning을 적용함으로 다양한 태스크에서 최고 성능을 갱신하고 있다. BERT기반의 언어 모델들은 양방향의 Transformer만 모델링 되어 있지만 BART는 양방향의 Transformer와 Auto-Regressive Transformer가 결합되어 사전학습을 진행하는 모델로 본 논문에서는 540MB의 코퍼스를 이용해 한국어 BART 모델을 학습 시키고 여러 한국어 자연어처리 태스크에 적용하여 성능 향상 있음을 보였다.

  • PDF

자연어 처리 기반 챗봇이 포함된 E-스포츠 애플리케이션 개발 (Development of E-Sports Application including Natural Language Processing-based Chatbot)

  • 이수정;하예성;정경훈;서진태
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.501-502
    • /
    • 2023
  • 본 논문은 자연어 처리(Natural Language Processing, NLP) 기술과 Flutter 언어를 활용하여 E-스포츠(E-Sports) 애플리케이션을 개발하는 방법을 제안한다. E-스포츠는 전 세계적으로 급속히 성장하는 산업이며, 많은 팬과 선수들이 참여하고 있다. 그러나 E-스포츠 관련 정보를 찾고 이해하기 위해서는 다양한 데이터를 직접 검색하고 분석해야 하는 어려움이 있다. 이러한 어려움을 극복하기 위해 자연어 처리 기술을 활용한 챗봇이 접목된 E-스포츠 애플리케이션을 개발하여 사용자가 효율적으로 관련 정보를 얻을 수 있도록 한다.

  • PDF

한국어 문서 분류를 위한 신경망 구조 탐색 (Neural Architecture Search for Korean Text Classification)

  • 지병규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.125-130
    • /
    • 2023
  • 최근 심층 신경망을 활용한 한국어 자연어 처리에 대한 관심이 높아지고 있지만, 한국어 자연어 처리에 적합한 신경망 구조 탐색에 대한 연구는 이뤄지지 않았다. 본 논문에서는 문서 분류 정확도를 보상으로 하는 강화 학습 알고리즘을 이용하여 장단기 기억 신경망으로 한국어 문서 분류에 적합한 심층 신경망 구조를 탐색하였으며, 탐색을 위해 사전 학습한 한국어 임베딩 성능과 탐색한 신경망 구조를 분석하였다. 탐색을 통해 찾아낸 신경망 구조는 기존 한국어 자연어 처리 모델에 대해 4 가지 한국어 문서 분류 과제로 비교하였을 때 일반적으로 성능이 우수하고 모델의 크기가 작아 효율적이었다.

  • PDF

인터넷 정보검색 인터페이스를 위한 한국어 의미분석 (Semantic analysis of Korean for web-search interface)

  • 권혜진;노현철;이근배;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-195
    • /
    • 1996
  • 본 논문에서는 자연어를 통한 웹 정보검색 모델을 제시하고, 이를 위한 한국어 처리 방법을 소개한다. 자연어 질의에 대해 범주 문법에 기반한 구문 중심의 의미 파싱을 통해 QLF(quasi logical form)을 생성하며, 의미의 선택 제약 방법을 통해 모호성을 제거한다. QLF의 담화 처리를 통해 session 기반의 웹 검색을 실현할 수 있는 방법을 제안한다.

  • PDF

자연어를 이용한 유해 영상 탐지 (Inappropriate Video Detect Using Natural Language Process)

  • 이정훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.721-724
    • /
    • 2018
  • 최근 청소년들은 욕설, 폭력적, 선정적, 비하적 표현을 일상생활에서 자연스럽게 사용하고 있다. 현재 청소년들은 자극적이고 폭력적인 개인 방송을 시청하며 유해 표현을 학습한다. 그래서 여러 기업에서는 모니터링 요원을 배치하거나 사용자들의 신고를 통해 유해 영상을 제재하는 중이다. 하지만 방대한 규모의 동용상 때문에 사람이 직접 모든 영상을 확인하는 것은 물리적으로 불가능하다. 따라서 본 논문에서는 자연어 처리 기술을 활용하여 자동으로 유해 영상을 탐지하는 시스템을 제안하고자 한다. 본 시스템은 데이터 수집, 텍스트 변환, 형태소 분석, 유해 사전 구성, 유해 판단 5가지 과정으로 이루어진다.

프로그램 및 자연어 표절 검출을 위한 국내.외 동향 및 감정 S/W 툴의 분석 (Analysis of Domestic.Foreign Trend and Assessment Tools for Programs and Natural Language Plagiarism)

  • 조동욱;신승수;윤미희
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권12호
    • /
    • pp.1659-1668
    • /
    • 2002
  • 컴퓨터 소프트웨어, 디지털 콘텐츠등 디지털 정보 재산권의 보호는 현재 뿐 아니라 향후 국가의 국력을 좌우할 수 있을 정도로 대단히 주요한 과제가 아닐 수 없다. 본 논문에서는 디지털 정보 재산권과 관련된 국내ㆍ외 연구 동향과 표절의 감정을 체계적으로 행하기 위한 소프트웨어 툴에 대해 비교ㆍ분석을 행하고자 한다. 주요 내용으로는 JISC을 중심으로 한 국외 감정 기관의 사업 동향과 분석 그리고 국내기관이나 단체의 움직임을 살펴보고자 한다. 또한 자연어 표절이나 프로그램 표절을 감정 할 수 있는 S/W툴에 대해 비교ㆍ분석을 행하고자 한다.

  • PDF

주의집중 메커니즘 기반의 양방향 GRU-CRF를 이용한 화행 분석과 슬롯 필링 공동 학습 모델 (A Joint Learning Model for Speech-act Analysis and Slot Filling Using Bidirectional GRU-CRF Based on Attention Mechanism)

  • 윤정민;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.252-255
    • /
    • 2018
  • 화행 분석이란 자연어 발화를 통해 나타나는 화자의 의도를 파악하는 것을 말하며, 슬롯 필링이란 자연어 발화에서 도메인에 맞는 정보를 추출하기 위해 미리 정의되어진 슬롯에 대한 값을 찾는 것을 말한다. 최근 화행 분석과 슬롯 필링 연구는 딥 러닝 기반의 공동 학습을 이용하는 연구가 많이 이루어지고 있고 본 논문에서는 한국어 특허상담 도메인 대화 말뭉치를 이용하여 공동 학습 모델을 구축하고 개별적인 모델과 성능을 비교한다. 또한 추가적으로 공동 학습 모델에 주의집중 메커니즘을 적용하여 성능이 향상됨을 보인다. 최종적으로 주의집중 메커니즘 기반의 공동 학습 모델이 기준 모델과 비교하여 화행 분류와 슬롯 필링 성능이 각각 3.35%p, 0.54%p 향상되어 85.41%, 80.94%의 성능을 얻었다.

  • PDF

폴트 트리의 상태차트 변환 방법론 연구 (Study of methodology for converting Fault Tree to Statecharts )

  • 이혁;이진호;김진현;최진영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.597-600
    • /
    • 2008
  • 안전성 분석 활동으로 널리 쓰이는 폴트 트리 분석은 그 원인들의 관계를 논리게이트로 표현하고 원인을 자연어로 설명한다. 폴트 트리에서 자연어를 사용하여 사고의 원인을 나타내는 것은 폴트 트리 자체의 검증뿐만 아니라, 동일한 대상의 시스템 명세에도 적용하기에 어려운 부분이다. 본 논문에서는 폴트 트리를 상태 차트로 변환하는 방법을 제안 하였으며, 상태차트로 변환된 폴트 트리를 상태차트로 명세 된 시스템의 기능적 요구사항과 결합함으로써 상태차트로 표현된 기능 명세가 안전성 분석활동을 통해 얻은 폴트 트리에 순응 되는지 여부를 볼 수 있었고, 폴트 트리에서의 분석 대상인 사고가 발생하기 까지를 추적할 수 있었다.

복합 웹 서비스를 위한 자연어 인터페이스 (Natural Language Interface for Composite Web Services)

  • 임종현;이경호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권2호
    • /
    • pp.144-156
    • /
    • 2010
  • 복합 웹 서비스를 이용하고자 하는 사용자의 요구가 늘어나고 있지만 유비쿼터스 환경에서 일반 사용자들이 쉽게 복합 웹 서비스를 사용할 수 있는 환경은 마련되지 않고 있다. 본 논문에서는 웹 서비스에 대한 기술적인 지식이 없는 일반인들도 쉽게 자신의 요구사항을 표현 가능한 자연어 기반의 사용자 친화적인 인터페이스를 제안한다. 특히 사용자의 표현을 효율적으로 분석하기 위해 사용자의 문장으로부터 정교한 수준의 복합적인 워크플로우를 추출하고, 문장 분석을 통해 적합한 서비스를 찾는 방법을 제안한다. 특히 많은 제어 구문과 구절로 이루어진 복잡한 문장으로부터 정교한 수준의 추상 워크플로우를 추출한다.

학습 상담 내용의 자연어 처리를 위한 오픈 데이터 현황 분석 (Analyze the Open data for Natural Language Processing of Learning Counseling)

  • 김유두
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.500-501
    • /
    • 2019
  • 4차산업의 융합시대를 맞이하여 단순한 학습이 아닌 다양한 학문을 학습하고 융합하여 적용하기 위해서는 주입식 수업보다는 자기주도방식의 학습방법이 중요해지고 있다. 따라서 다양한 교육 기관에서는 자기주도적인 학습 방법의 개발에 많은 노력을 하고 있다. 자기주도적인 학습이 효과적으로 수행되기 위해서는 교수자는 학생의 학업에 직접 관여하기 보다는 학업의 전체적인 과정을 관리하는 것이 더 중요하다. 이에 학습 상담은 자기주도적학습을 효과적으로 수행하는데 중요한 방법이 된다. 이에 본 논문에서는 학습 상담 내용을 자연어 처리를 통해 다양한 응용이 가능하도록 이를 구현할 수 있는 자연어 처리를 위한 오픈 데이터 현황에 대한 분석을 수행 하였다.

  • PDF