• Title/Summary/Keyword: 언어망 분석

Search Result 169, Processing Time 0.037 seconds

Intelligent Workbench for Korean Concept-Net Construction (한국어 개념망 구축을 위한 지능형 워크벤치)

  • Hur Jeong;Choi Mi-Ran;Jang Myung-Gil
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.472-474
    • /
    • 2005
  • 개념망은 상당히 도메인에 의존적인 언어자원에 해당한다. 따라서, 도메인이 다른 분야에 적용하고자 한다면, 많은 수정이 요구된다. 그러나 개념망의 편집은 언어 이해 능력이 뛰어난 언어학자들 조차도 상당히 많은 시간이 요구되는 작업이다. 대부분의 시간소요는 개념망의 전체적인 계층구조를 스캐닝하는 작업과 특정 노드를 검색하는 작업에 의한 것이다. 기 구축된 개념망을 분석하면 계층관계에 있는 어휘들간의 일관된 규칙을 발견할 수 있다. 이 논문에서는 어휘들의 뜻풀이와 상위어간의 관계성, 복합명사와 상위어간의 관계성을 통계적으로 분석하였다 분석된 결과를 기반으로 확률모델을 이용하여 상위어 추천 기능을 구현하였다. 상위어 추천 기능의 시간 절감 효과를 실험하기 위해 실험자 2인을 대상으로 개념망 구축에 소요되는 시간을 측정하였다. 상위어 추천 기능이 있는 지능형 워크벤치를 이용할 경우 개념망 작업 시간은 약 $65\%$정도로 단축되는 것을 확인할 수 있었다. 본 지능형 워크벤치는 다양한 도메인에서 요구되는 개념망 구축의 시간 비용 절감에 크게 기절할 것으로 기대된다.

  • PDF

Explaining predictions of Recurrent Neural Network in Sentiment Analysis (감성분석에서 순환신경망의 예측 설명)

  • Bae, Jangseong;Lee, Changki
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.125-130
    • /
    • 2019
  • 최근 순환신경망은 여러 자연어처리 분야에서 좋은 성능을 보이고 있다. 하지만 순환신경망의 복잡한 네트워크 구조 때문에 순환신경망이 어떠한 근거로 예측 결과를 제시했는지 해석하기 어려운 문제점이 있다. 따라서, 순환신경망이 적용된 자연어처리 시스템이 도출한 결과의 타당성을 제공하고 자연어처리 시스템에 중요한 자질을 선별하기 위한 연구가 필요하다. 본 논문에서는 자연어처리 분야의 하나인 감성분석에서 순환신경망의 예측을 분석한다. 학습된 감성분석 시스템의 예측을 해석하기 위해 입력 자질에 대한 민감도 분석을 수행하고 이를 어텐션 메커니즘과 비교하고 그 결과에 대해 설명한다.

  • PDF

자연어를 이용한 사용자 접속에 관한 연구

  • Lee, Dong-Ae;Jang, Deok-Seong
    • Annual Conference on Human and Language Technology
    • /
    • 1990.11a
    • /
    • pp.149-155
    • /
    • 1990
  • MS-DOS 명령을 대신하는 자연어 인터페이스를 연구하였다. 자연어로 입력되는 한국어 문장을 형태소분석, 구문분석, 의미분석, 개념분석을 통해 대응되는 일련의 MS-DOS 명령을 생성한다. 형태소 분석에서는 Tabular Parsing법을 사용하였고, 구문분석에서는 문법적인 수식-피수식 관계를 확대하여 의미상의 수식-피수식 관계를 설정하고 이에 따라 문장을 몇개의 단위로 나눈다. 의미분석에서는 동사와 이들 단위들간의 관계와 단위를 구성하는 어절들간의 관계를 격관계로 설정하여, 개념망(semantic network)으로 문장의 의미를 표현한다. 이 개념망으로부터 MS-DOS 명령을 생성한다.

  • PDF

Semantic Network Analysis of 'Young-Kl(panic buying)': Focusing on News Source Diversity ('영끌' 보도에 대한 언어망 분석: 뉴스 정보원 다양성을 중심으로)

  • Lee, Jeng Hoon
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.12
    • /
    • pp.23-33
    • /
    • 2021
  • This study analyzed news articles about 'Young-Kl' reported by 11 media outlets, identifying news frames and quotation frames. Using a semantic network analysis, this study inspected the quotations frames and measured the frequency of the quotes and sources types. Also, the concentration index of the frames was measured. The results showed that news frames consisted of 10 topics and quotation frames consisted of 14 topics. Although the differences among quotation frames by media as well as by source types were observed, the concentration index of sources such as government, political arena, and business appeared high. Therefore, this study suggested that numerical diversity of news sources would not establish the diversity of news frames.

Learning of Artificial Neural Networks about the Prosody of Korean Sentences. (인공 신경망의 한국어 운율 학습)

  • Shin Dong-Yup;Min Kyung-Joong;Lim Un-Cheon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.121-124
    • /
    • 2001
  • 음성 합성기의 합성음의 자연감을 높이기 위해 자연음에 내재하는 정확한 운율 법칙을 구하여 음성합성 시스템에서 이를 구현해 주어야 한다 무제한 어휘 음성합성 시스템의 문-음성 합성기에서 필요한 운율 법칙은 언어학적 정보를 이용해 구하거나, 자연음에서 추출하고 있다 그러나 추출한 운율 법칙이 자연음에 내재하는 모든 운율 법칙을 반영하지 못했거나, 잘못 구현되는 경우에는 합성음의 자연성이 떨어지게 된다. 이런 점을 고려하여 본 논문에서는 한국어 자연음을 분석하여 추출한 운율 정보를 인공 신경망이 학습하도록 하고 훈련을 마친 인공 신경망에 문장을 입력하고, 출력으로 나오는 운율 정보와 자연음의 운율 정보를 비교한 결과 제안한 인공 신경망이 자연음에 내재하고 있는 운율을 학습할 수 있음을 알 수 있었다. 운율의 3대 요소는 피치 , 지속시간, 크기의 변화이다. 제안한 인공 신경망이 한국어 문장의 음소 열을 입력으로 받아들이고, 각 음소의 지속시간에 따른 피치변화와 크기 변화를 출력으로 내보내면 자연음을 분석해 구한 각 음소의 운율 정보인 목표 패턴과 출력 패턴 의 오차를 최소화하도록 인공 신경망의 가중치를 조절할 수 있도록 설계하였다. 지속시간에 따른 각 음소의 피치와 크기 변화를 학습시키기 위해 피치 및 크기 인공 신경망을 구성하였다. 이들 인공 신경망을 훈련시키기 위해 먼저 음소 균형 문장 군을 구축하여야 하고, 이들 언어 자료를 특정 화자가 일정 환경에서 읽고 이를 녹음하여 , 분석하여 구한운율 정보를 운율 데이터베이스로 구축하였다. 문장 내의 각 음소에 대해 지속 시간과 피치 변화 그리고 크기 변화를 구하고, 곡선 적응 방법을 이용하여 각 변화 곡선에 대한 다항식 계수와 초기 값을 구해 운율 데이터베이스를 구축한다. 이 운율 데이터베이스의 일부는 인공 신경망을 훈련시키는데 이용하고, 나머지로 인공 신경망의 성능을 평가하여 인공 신경망이 운율 법칙을 학습할 수 있었다. 언어 자료의 문장 수를 늘리고 발음 횟수를 늘려 운율 데이터베이스를 확장하면 인공 신경망의 성능을 높일 수 있고, 문장 내의 음소의 수를 감안하여 인공 신경망의 입력 단자의 수는 계산량과 초분절 요인을 감안하여 결정해야 할 것이다

  • PDF

Predicting Movie Evaluation using Deep LSTM (순환 신경망(LSTM) 이용한 영화 평점 예측)

  • Kang, Kyeongpil;Choo, Jaegul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.591-594
    • /
    • 2016
  • 소비자의 선호도 및 여론을 정량적인 방법으로 분석하기 위해 비정형 데이터의 분석은 필수적인 요소가 되고 있다. 하지만 비정형 데이터는 언어의 구조 및 모호성 등으로 인해 분석하기 어려운 형태이다. 따라서 본 연구는 최근 각광받고 있는 인공신경망, 특히 그 중에서도 순환 신경망의 한 모델인 Deep LSTM을 이용하여 비정형 데이터를 분석하고 이를 활용하여 어순 및 어감 등의 언어의 구조적 문제에도 효과적인 정략적 모델을 설계하여 학습하고 이를 기존의 인공신경망 모델과 비교 분석하고자 한다.

Single Document Extractive Summarization Based on Deep Neural Networks Using Linguistic Analysis Features (언어 분석 자질을 활용한 인공신경망 기반의 단일 문서 추출 요약)

  • Lee, Gyoung Ho;Lee, Kong Joo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.8 no.8
    • /
    • pp.343-348
    • /
    • 2019
  • In recent years, extractive summarization systems based on end-to-end deep learning models have become popular. These systems do not require human-crafted features and adopt data-driven approaches. However, previous related studies have shown that linguistic analysis features such as part-of-speeches, named entities and word's frequencies are useful for extracting important sentences from a document to generate a summary. In this paper, we propose an extractive summarization system based on deep neural networks using conventional linguistic analysis features. In order to prove the usefulness of the linguistic analysis features, we compare the models with and without those features. The experimental results show that the model with the linguistic analysis features improves the Rouge-2 F1 score by 0.5 points compared to the model without those features.

A Study on the Prosody Generation of Korean Sentences using Neural Networks (신경망을 이용한 한국어 운율 발생에 관한 연구)

  • Lee Il-Goo;Min Kyoung-Joong;Kang Chan-Koo;Lim Un-Cheon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.65-69
    • /
    • 1999
  • 합성단위, 합성기, 합성방식 등에 따라 여러 가지 다양한 음성합성시스템이 있으나 순수한 법칙합성 시스템이 아니고 기본 합성단위를 연결하여 합성음을 발생시키는 연결합성 시스템은 연결단위사이의 매끄러운 합성계수의 변화를 구현하지 못해 자연감이 떨어지는 실정이다. 자연음에 존재하는 운율법칙을 정확히 구현하면 합성음의 자연감을 높일 수 있으나 존재하는 모든 운율법칙을 추출하기 위해서는 방대한 분량의 언어자료 구축이 필요하다. 일반 의미 문장으로부터 운율법칙을 추출하는 것이 바람직하겠으나, 모든 운율 현상이 포함된 언어자료는 그 문장 수가 극히 방대하여 처리하기 힘들기 때문에 가능하면 문장 수를 줄이면서 다양한 운율 현상을 포함하는 문장 군을 구축하는 것이 중요하다. 본 논문에서는 음성학적으로 균형 잡힌 고립단어 412 단어를 기반으로 의미문장들을 만들었다. 이들 단어를 각 그룹으로 구분하여 각 그룹에서 추출한 단어들을 조합시켜 의미 문장을 만들도록 하였다. 의미 문장을 만들기 위해 단어 목록에 없는 단어를 첨가하였다. 단어의 문장 내에서의 상대위치에 따른 운율 변화를 살펴보기위해 각 문장의 변형을 만들어 언어자료에 포함시켰다. 자연감을 높이기 위해 구축된 언어자료를 바탕으로 음성데이타베이스를 작성하여 운율분석을 통해 신경망을 훈련시키기 위한 목표패턴을 작성하였다 문장의 음소열을 입력으로 하고 특정음소의 운율정보를 발생시키는 신경망을 구성하여 언어자료를 기반으로 작성한 목표패턴을 이용해 신경망을 훈련시켰다. 신경망의 입력패턴은 문장의 음소열 중 11개 음소열로 구성된다. 이 중 가운데 음소의 운율정보가 출력으로 나타난다. 분절요인에 의한 영향을 고려해주기 위해 전후 5음소를 동시에 입력시키고 문장내에서의 구문론적인 영향을 고려해주기 위해 해당 음소의 문장내에서의 위치, 운율구에 관한 정보등을 신경망의 입력 패턴으로 구성하였다. 특정화자로 하여금 언어자료를 발성하게 한 음성시료의 운율정보를 추출하여 신경망을 훈련시킨 결과 자연음의 운율과 유사한 합성음의 운율을 발생시켰다.

  • PDF

Brain neural networks based on individual's verbal and visuospatial abilities (fMRI를 이용하여 지적능력에 따른 뇌 신경망 규명 : 언어능력 vs 공간지각능력)

  • 이경화;박세훈;김연희;손진훈
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2001.05a
    • /
    • pp.175-181
    • /
    • 2001
  • 본 연구의 목적은 사람들이 언어과제와 공간지각과제을 수행하는 동안 활성화되는 뇌 영역의 차이를 규명하는 것이다. 428명의 대학생을 대상으로 집단 심리실험을 수행하여, fMRI 연구를 위한 실험참여자로 17명의 오른손잡이 여대생을 선정하였다. 17명 중 8명은 언어능력은 뛰어나지만 공간지각능력이 떨어지고, 나머지 9명은 언어능력은 빈약하지만, 공간지각능력이 우수한 사람들이었다. fMRI 실험에 사용된 패러다임에는 언어과제와 공간지각과제가 각각 8block으로 구성되었으며, 각 block은 동일한 과제 3문항을 포함하였다. fMRI 이미징은 1.5T Siemens Vision Scanner로 수집되었으며, Single-shot EPI 기법으로 (TR/TE : 3840/40ms, flip angle : 90, FOV : 220, 64x64 matrix) 이미지를 스캔하였다. 자료분석은 SPM-99 소프트웨어를 사용하였다. 감산(subtraction)분석결과, 언어능력이 뛰어난 집단에서는 양측 대상회(bilateral cingulate gyri)와 좌측 상두정엽 (left superior parietal lobe)이 더 많이 활성화되었고, 언어능력이 떨어지는 집단에서는 양측 전두엽 (both frontal lobes)이 더 많이 활성화되었다. 공간지각능력이 떨어지는 집단에서는 우측 시상 (right thalamus)과 좌측 측-후두엽 (left temporooccipital)이 더 많이 활성화되었다. 언어능력이나 공간지각능력이 우수한 집단에서는 공통적으로 대상회 (cingulate gyri)가 활성화되었다.

  • PDF

Neural Architecture Search for Korean Text Classification (한국어 문서 분류를 위한 신경망 구조 탐색)

  • ByoungKyu Ji
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.125-130
    • /
    • 2023
  • 최근 심층 신경망을 활용한 한국어 자연어 처리에 대한 관심이 높아지고 있지만, 한국어 자연어 처리에 적합한 신경망 구조 탐색에 대한 연구는 이뤄지지 않았다. 본 논문에서는 문서 분류 정확도를 보상으로 하는 강화 학습 알고리즘을 이용하여 장단기 기억 신경망으로 한국어 문서 분류에 적합한 심층 신경망 구조를 탐색하였으며, 탐색을 위해 사전 학습한 한국어 임베딩 성능과 탐색한 신경망 구조를 분석하였다. 탐색을 통해 찾아낸 신경망 구조는 기존 한국어 자연어 처리 모델에 대해 4 가지 한국어 문서 분류 과제로 비교하였을 때 일반적으로 성능이 우수하고 모델의 크기가 작아 효율적이었다.

  • PDF