• 제목/요약/키워드: Linguistic Information

검색결과 535건 처리시간 0.023초

표준화된 매개변수 소속함수에 기반을 둔 언어적 케이스 기반 퍼지 추론 (A Linguistic Case-based Fuzzy Reasoning based on SPMF)

  • 최대영
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.163-168
    • /
    • 2010
  • 표준화된 매개변수 소속함수에 기반을 둔 언어적 케이스 기반 퍼지 추론 방법을 제안한다. 제안된 방법은 선형 시간 복잡도를 갖는 퍼지 추론을 위한 효율적인 방법을 제공한다. 결과적으로 제안된 방법은 퍼지 추론의 속도를 개선하는데 사용될 수 있다. 언어적 케이스 기반 퍼지 추론 과정에서 표준화된 매개변수 소속함수에 기반을 둔 언어적 케이스 색인과 검색 방법을 제시한다. 이는 기존의 언어 근사 방법과 비교할 때 상대적으로 빠르게 계산될 수 있다. 공학적인 관점에서 이는 가치 있는 장점이 될 수 있다.

언어자원 자동 구축을 위한 위키피디아 콘텐츠 활용 방안 연구 (A Study on Utilization of Wikipedia Contents for Automatic Construction of Linguistic Resources)

  • 류철중;김용;윤보현
    • 디지털융복합연구
    • /
    • 제13권5호
    • /
    • pp.187-194
    • /
    • 2015
  • 급변하는 자연언어를 기계가 이해할 수 있도록 하기 위해서는 다양한 언어지식자원(linguistic knowledge resources)의 구축이 필수적으로 수반된다. 본 논문에서는 온라인 콘텐츠의 특성을 활용해 언어지식자원을 자동으로 구축함으로써 지속적으로 확장 가능한 방법을 고안하고자 한다. 특히 언어분석 과정에서 가장 활용도가 높은 개체명(NE: Named Entity) 사전을 자동으로 구축, 확장하는데 주안점을 둔다. 이를 위해 본 논문에서는 개체명 사전 구축대상문서로 위키피디아(Wikipedia)를 선정, 그 특성을 파악하기 위해 다양한 통계 분석을 수행하였다. 이에 기반하여 위키피디아 콘텐츠가 갖는 구문적 특성과 구조 정보 등의 메타데이터를 활용하여 개체명 사전을 구축, 확장하는 방법을 제안한다.

언어 정보가 반영된 문장 점수를 활용하는 삭제 기반 문장 압축 (Deletion-Based Sentence Compression Using Sentence Scoring Reflecting Linguistic Information)

  • 이준범;김소언;박성배
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.125-132
    • /
    • 2022
  • 문장 압축은 원본 문장의 중요한 의미는 유지하면서 길이가 축소된 압축 문장을 생성하는 자연어처리 태스크이다. 문법적으로 적절한 문장 압축을 위해, 초기 연구들은 사람이 정의한 언어 규칙을 활용하였다. 또한 시퀀스-투-시퀀스 모델이 기계 번역과 같은 다양한 자연어처리 태스크에서 좋은 성능을 보이면서, 이를 문장 압축에 활용하고자 하는 연구들도 존재했다. 하지만 언어 규칙을 활용하는 연구의 경우 모든 언어 규칙을 정의하는 데에 큰 비용이 들고, 시퀀스-투-시퀀스 모델 기반 연구의 경우 학습을 위해 대량의 데이터셋이 필요하다는 문제점이 존재한다. 이를 해결할 수 있는 방법으로 사전 학습된 언어 모델인 BERT를 활용하는 문장 압축 모델인 Deleter가 제안되었다. Deleter는 BERT를 통해 계산된 perplexity를 활용하여 문장을 압축하기 때문에 문장 압축 규칙과 모델 학습을 위한 데이터셋이 필요하지 않다는 장점이 있다. 하지만 Deleter는 perplexity만을 고려하여 문장을 압축하기 때문에, 문장에 속한 단어들의 언어 정보를 반영하여 문장을 압축하지 못한다. 또한, perplexity 측정을 위한 BERT의 사전 학습에 사용된 데이터가 압축 문장과 거리가 있어, 이를 통해 측정된 perplexity가 잘못된 문장 압축을 유도할 수 있다는 문제점이 있다. 이를 해결하기 위해 본 논문은 언어 정보의 중요도를 수치화하여 perplexity 기반의 문장 점수 계산에 반영하는 방법을 제안한다. 또한 고유명사가 자주 포함되어 있으며, 불필요한 수식어가 생략되는 경우가 많은 뉴스 기사 말뭉치로 BERT를 fine-tuning하여 문장 압축에 적절한 perplexity를 측정할 수 있도록 하였다. 영어 및 한국어 데이터에 대한 성능 평가를 위해 본 논문에서 제안하는 LI-Deleter와 비교 모델의 문장 압축 성능을 비교 실험을 진행하였고, 높은 문장 압축 성능을 보임을 확인하였다.

A Case of Applying Flipped learning to Norms of Language Course

  • Sim, Ji-Young
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권5호
    • /
    • pp.73-78
    • /
    • 2018
  • Recently, Flipped Learning is attracting attention as a method for qualitative growth of university education. Flipped Learning is a kind of computer based education and consisted of online video lectures and offline student activities. This paper introduces the results of applying Flipped Learning for one semester to Korean linguistic norms course. As for this course, the contents related to the knowledge and information were provided individually before the class through online video, and the offline classes focused on student-led activities. When qualitatively evaluating the results of the course, students developed a more comprehensive and flexible mind set beyond the preexisting normative attitudes and showed increase in analytical and critical thinking in understanding the principles of linguistic norms and spelling system. According to these results we argue that it is necessary to actively adopt Flipped Learning in the humanities education, including the grammar classes.

자유대화의 음향적 특징 및 언어적 특징 기반의 성인과 노인 분류 성능 비교 (Comparison of Classification Performance Between Adult and Elderly Using Acoustic and Linguistic Features from Spontaneous Speech)

  • 한승훈;강병옥;동성희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.365-370
    • /
    • 2023
  • 사람은 노화과정에 따라 발화의 호흡, 조음, 높낮이, 주파수, 언어 표현 능력 등이 변화한다. 본 논문에서는 이러한 변화로부터 발생하는 음향적, 언어적 특징을 기반으로 발화 데이터를 성인과 노인 두 그룹으로 분류하는 성능을 비교하고자 한다. 음향적 특징으로는 발화 음성의 주파수 (frequency), 진폭(amplitude), 스펙트럼(spectrum)과 관련된 특징을 사용하였으며, 언어적 특징으로는 자연어처리 분야에서 우수한 성능을 보이고 있는 한국어 대용량 코퍼스 사전학습 모델인 KoBERT를 통해 발화 전사문의 맥락 정보를 담은 은닉상태 벡터 표현을 추출하여 사용하였다. 본 논문에서는 음향적 특징과 언어적 특징을 기반으로 학습된 각 모델의 분류 성능을 확인하였다. 또한, 다운샘플링을 통해 클래스 불균형 문제를 해소한 뒤 성인과 노인 두 클래스에 대한 각 모델의 F1 점수를 확인하였다. 실험 결과로, 음향적 특징을 사용하였을 때보다 언어적 특징을 사용하였을 때 성인과 노인 분류에서 더 높은 성능을 보이는 것으로 나타났으며, 클래스 비율이 동일하더라도 노인에 대한 분류 성능보다 성인에 대한 분류 성능이 높음을 확인하였다.

Definite Descriptions and Attitude Reports in Situation Semantics

  • Cho, Young-Soon
    • 한국언어정보학회지:언어와정보
    • /
    • 제3권1호
    • /
    • pp.83-95
    • /
    • 1999
  • In this paper I will seek to show that situation theoretic analysis of the attitudes can finely describe references of definite descriptions in attitude reports: co-reference, mis-reference, and speaker's reference. Situation theoretic concepts of a proposition and a resource situation provide excellent means to account for these references: Proposition, which is the combination of a type and an assignment, can combine linguistic and non-linguistic information; Resource situation, sometimes realized as speaker's wrong knowledge situation about an individual, can serve to explain idiosyncratic aspects of attitude reports.

  • PDF

독-한 명사구 기계번역시스템의 구축 (The Construction of a German-Korean Machine Translation System for Nominal Phrases)

  • 이민행;최승권;최경은
    • 한국언어정보학회지:언어와정보
    • /
    • 제2권1호
    • /
    • pp.79-105
    • /
    • 1998
  • This paper aims to describe a German-Korean machine translation system for nominal phrases. Besides, we have two subgoals. First, we are going to revea linguistic differences between two languages and propose a language-informational method fo overcome the differences. The method is based on an integrated model of translation knowledge, efficient information structure, and concordance selection. Then, we will show the statistical results about translation experiment and its evaluation as an evidence for the adequacy of our linguistic method and translation system itself.

  • PDF

한국인으 위한 중국어 성조 평가 시스템 (Chinese Tone Evaluation System for Korean learners)

  • 김무중;김효숙;김선주;강효원;권철홍
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 춘계 학술대회 발표논문집
    • /
    • pp.41-44
    • /
    • 2005
  • This study is about Chinese tone evaluation system for Korean learners using speech technology, Chinese prounciaion system consists of initials, finals and tones. Initials/finals are in segmental level and tones are in suprasegmental level. So different method could be used assessing Korean users' Chinese. Differ from segmental level recognition method, we chose pattern matching method in evaluating Chinese tones. Firstly we defined speakers' own speech range and produced standard tonal pattern according to speakers' own range. And then we compared input patterns of users with referring patterns.

  • PDF

퍼지로직에 기반한 언어변수의 지식표현에 관한 연구 (A Study on the Knowledge Representation of Linguistic Variable Based on Fuzzy Logic)

  • 김형수;김홍기;김주진;이상부
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1996년도 추계학술대회 학술발표 논문집
    • /
    • pp.137-140
    • /
    • 1996
  • In order to solve the specific problems in system, the implementing of knowledge base suitable to the system architecture has to be expressed and leads to the resoning of the new facts. Not only the simple knowledge based on the bivalent logic but also the representation and acqusition of knowledge related to vague and imprecise linguistic variable is necessary to the knowledge in the real world,i.e the knowledge of which facts and rules are composed. In this point of view, this survey implements the inference and retrieval of the fuzzy linguistic variables so that it can process the ambiguous information which appears the imprecision of the linguistic boundary.

  • PDF

언어학적 단서를 활용한 동화 텍스트 내 발화문의 화자 파악 (Identification of Speakers in Fairytales with Linguistic Clues)

  • 민혜진;정진우;박종철
    • 한국언어정보학회지:언어와정보
    • /
    • 제17권2호
    • /
    • pp.93-121
    • /
    • 2013
  • Identifying the speakers of individual utterances mentioned in textual stories is an important step towards developing applications that involve the use of unique characteristics of speakers in stories, such as robot storytelling and story-to-scene generation. Despite the usefulness, it is a challenging task because not only human entities but also animals and even inanimate objects can become speakers especially in fairytales so that the number of candidates is much more than that in other types of text. In addition, since the action of speaking is not always mentioned explicitly, it is necessary to infer the speaker from the implicitly mentioned speaking behaviors such as appearances or emotional expressions. In this paper, we investigate a method to exploit linguistic clues to identify the speakers of utterances from textual fairytale stories in Korean, especially in order to handle such challenging issues. Compared with the previous work, the present work takes into account additional linguistic features such as vocative roles and pairs of conversation participants, and proposes the use of discourse-level turn-taking behaviors between speakers to further reduce the number of possible candidate speakers. We describe a simple rule-based method to choose a speaker from candidates based on such linguistic features and turn-taking behaviors.

  • PDF