• Title/Summary/Keyword: 언어 분석

Search Result 4,670, Processing Time 0.028 seconds

Processing of Inflectional forms for the French-Korean Collocational Database (불-한 연어 데이터베이스 구축을 위한 굴절 정보의 처리)

  • Yoon, Ae-Sun;Jeong, Hwi-Woong;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.267-272
    • /
    • 2001
  • 구(phrase) 단위 또는 문장(sentence) 단위의 연어(collocation) 정보는 자연언어 처리를 위한 단일어 또는 이중어 데이터베이스를 구축할 수 있는 중요한 기초 자료가 될 뿐 아니라, 외국어 학습에서도 어휘 단계를 넘어선 학습 자료를 제공할 수 있다. 불어는 굴절 언어(inflectional language)로서 기본형 대 굴절형의 비율이 약 1:9 정도로 비교적 굴절 비율이 높은 언어다. 또한 불어 표제어 중 95% 이상을 차지하는 불어의 동사, 명사, 형용사 중 상당한 비율이 암기해야 할 목록(list)이라는 특성을 갖기 때문에 검색과 학습에 있어 오류가 지속적으로 일어나는 부분이다. 표제어의 검색의 경우 불어 굴절 현상을 지원하는 전자 사전이 개발되어 있지만 아직까지 연어 정보에서 굴절형을 지원할 수 사전 또는 데이터베이스는 개발되어 있지 않다. 본 연구의 목적은 전자 사전과 형태소 분석기를 이용하여 굴절형 처리를 지원할 수 있는 불-한 연어 데이터베이스를 구축하는데 있다. 이를 위해 부산대학교 언어정보 연구실에서 개발한 불어 형태소 분석기 Infection와 불-한 전자 사전 Franco를 사용하였으며, 지금까지 구축된 불-한 연어 정보는 94,965 개이다. 본 고에서는 두 정보를 이용하여 불어 굴절형 정보를 분석 및 생성하는 방식 및 불-한 연어 데이터베이스 구조를 살펴 본다.

  • PDF

Korean Abstract Meaning Representation (AMR) Guidelines for Graph-structured Representations of Sentence Meaning (문장 의미의 그래프 구조 표상을 위한 한국어 Abstract Meaning Representation 가이드라인)

  • Choe, Hyonsu;Han, Jiyoon;Park, Hyejin;Oh, Taehwan;Park, Seokwon;Kim, Hansaem
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.252-257
    • /
    • 2019
  • 이 논문은 한국어 Abstract Meaning Representation (AMR; 추상 의미 표상) 가이드라인 1.0*을 소개한다. AMR은 통합적인 의미 표상 체계로, 의미 분석(semantic parsing)의 주요 Task 중 하나로 자리매김하고 있다. 한국어 AMR 가이드라인은 현행 AMR 1.2.6을 심도 있게 분석하고 이를 한국어 상황에 맞게 로컬라이징한 것이다. 해당 가이드라인은 추후 한국어 AMR 말뭉치 구축(sembanking)에 대비하여 일관된 주석 세부 지침을 제공하기 위해 작성되었다.

  • PDF

Implementation of Iconic Language for the Language Support System of the Language Disorders (언어 장애인의 언어보조 시스템을 위한 아이콘 언어의 구현)

  • Choo Kyo-Nam;Woo Yo-Seob;Min Hong-Ki
    • The KIPS Transactions:PartB
    • /
    • v.13B no.4 s.107
    • /
    • pp.479-488
    • /
    • 2006
  • The iconic language interlace is designed to provide more convenient environments for communication to the target system than the keyboard-based interface. For this work, tendencies and features of vocabulary are analyzed in conversation corpora constructed from the corresponding domains with high degree of utilization, and the meaning and vocabulary system of iconic language are constructed through application of natural language processing methodologies such as morphological, syntactic and semantic analyses. The part of speech and grammatical rules of iconic language are defined in order to make the situation corresponding the icon to the vocabulary and meaning of the Korean language and to communicate through icon sequence. For linguistic ambiguity resolution which may occur in the iconic language and for effective semantic processing, semantic data focused on situation of the iconic language are constructed from the general purpose Korean semantic dictionary and subcategorization dictionary. Based on them, the Korean language generation from the iconic interface in semantic domain is suggested.

Understanding Language Learning Strategies, Language Learning Beliefs, and English Listening Achievement of Korean Undergraduate Students (대학생들의 언어학습전략, 언어학습믿음과 영어듣기성취 이해)

  • Cho, Hyewon
    • Journal of Digital Convergence
    • /
    • v.16 no.3
    • /
    • pp.37-45
    • /
    • 2018
  • The purpose of this study was to understand language learning strategies use, language learning beliefs, and listening achievement of Korean EFL learners. The participants was sixty-nine university students who enrolled in blended learning classes for English listening. Data was collected and analyzed to see if there were any differences in strategies and beliefs between students who improved their listening test score and those who did not. The results showed that students showing improvement at the post-test used more language learning strategies and had a high level of motivation. Statistically significant correlation was found between motivation and strategies such as cognitive and meta-cognitive strategies.

Building Sentiment-Annotated Datasets for Training a FbSA model based on the SSP methodology (반자동 언어데이터 증강 방식에 기반한 FbSA 모델 학습을 위한 감성주석 데이터셋 FeSAD 구축)

  • Yoon, Jeong-Woo;Hwang, Chang-Hoe;Choi, Su-Won;Nam, Jee-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.66-71
    • /
    • 2021
  • 본 연구는 한국어 자질 기반 감성분석(Feature-based Sentiment Analysis: FbSA)을 위한 대규모의 학습데이터 구축에 있어 반자동 언어데이터 증강 기법(SSP: Semi-automatic Symbolic Propagation)에 입각한 자질-감성 주석 데이터셋 FeSAD(Feature-Sentiment-Annotated Dataset)의 개발 과정과 성능 평가를 소개하는 것을 목표로 한다. FeSAD는 언어자원을 활용한 SSP 1단계 주석 이후, 작업자의 주석이 2단계에서 이루어지는 2-STEP 주석 과정을 통해 구축된다. SSP 주석을 위한 언어자원에는 부분 문법 그래프(Local Grammar Graph: LGG) 스키마와 한국어 기계가독형 전자사전 DECO(Dictionnaire Electronique du COréen)가 활용되며, 본 연구에서는 7개의 도메인(코스메틱, IT제품, 패션/의류, 푸드/배달음식, 가구/인테리어, 핀테크앱, KPOP)에 대해, 오피니언 트리플이 주석된 FeSAD 데이터셋을 구축하는 프로세싱을 소개하였다. 코스메틱(COS)과 푸드/배달음식(FOO) 두 도메인에 대해, 언어자원을 활용한 1단계 SSP 주석 성능을 평가한 결과, 각각 F1-score 0.93과 0.90의 성능을 보였으며, 이를 통해 FbSA용 학습데이터 주석을 위한 작업자의 작업이 기존 작업의 10% 이하의 비중으로 감소함으로써, 학습데이터 구축을 위한 프로세싱의 소요시간과 품질이 획기적으로 개선될 수 있음을 확인하였다.

  • PDF

An Analysis of Learning Objective Characteristics of Educational Programs of Centers for the University Affiliated Science-Gifted Education Using Semantic Network Analysis (언어네트워크분석을 활용한 대학부설 과학영재교육원 교육프로그램의 학습목표 특성 분석)

  • Park, Kyeong-Jin;Ryu, Chun-Ryol;Choi, Jinsu
    • Journal of Gifted/Talented Education
    • /
    • v.27 no.1
    • /
    • pp.17-35
    • /
    • 2017
  • The purpose of this study is to analyze the learning objectives characteristics of educational programs of centers for the university affiliated science-gifted education using semantic network analysis, we examined the applicability of semantic network analysis in analyzing learning objectives by comparing the results of analysis with Bloom's revised taxonomy. For this purpose, 702 learning objectives presented in 169 science subjects were selected as subjects to be analyzed. After classifying and coding the learning objectives according to Bloom's revised taxonomy, we conducted a semantic network analysis to investigate the relationship between learning objectives. The results of the analysis are as follows. First, we looked at the number of learning objectives used for each subject, and about 3 elementary school levels and about 6 middle school levels were used. Second, the knowledge dimension such as 'factual and conceptual knowledge' and cognitive process dimension such as 'remember', 'understand', and 'create' was high regardless of the research method and school level. Third, the results of analysis based on the weighting through the semantic network analysis method, the elementary school level emphasize activities th be applied to the actual experimental process through learning about scientific facts, while the middle school level emphasize the understanding of scientific facts and concepts themselves. As a result, it can be seen that the semantic network analysis can analyze characteristics of various learning objectives rather than the conventional simple statistical analysis.

Multi-head Attention and Pointer Network Based Syllables Dependency Parser (멀티헤드 어텐션과 포인터 네트워크 기반의 음절 단위 의존 구문 분석)

  • Kim, Hong-jin;Oh, Shin-hyeok;Kim, Dam-rin;Kim, Bo-eun;Kim, Hark-soo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.546-548
    • /
    • 2019
  • 구문 분석은 문장을 구성하는 어절들 사이의 관계를 파악하여 문장의 구조를 이해하는 기술이다. 구문 분석은 구구조 분석과 의존 구문 분석으로 나누어진다. 한국어처럼 어순이 자유로운 언어에는 의존 구문 분석이 더 적합하다. 의존 구문 분석은 문장을 구성하고 있는 어절 간의 의존 관계를 분석하는 작업으로, 각 어절의 지배소를 찾아내어 의존 관계를 분석한다. 본 논문에서는 멀티헤드 어텐션과 포인터 네트워크를 이용한 음절 단위 의존 구문 분석기를 제안하며 UAS 92.16%, LAS 89.71%의 성능을 보였다.

  • PDF

Case Analysis of Verbal Interaction of Science-Gifted Elementary Students in Their Science Classes (초등 과학영재 수업에서의 언어적 상호작용 사례 분석)

  • Kim, Dong-Hyun;Kim, Hyo-Nam
    • Journal of The Korean Association For Science Education
    • /
    • v.31 no.8
    • /
    • pp.1145-1157
    • /
    • 2011
  • The purpose of this study was to analyze and extract the features of verbal interactions between teacher and science-gifted students in their classes. For the purpose of this study, authors observed 27 elementary science classes for the science gifted of three elementary teachers. To analyze the verbal interactions in the classes, the authors have adopted the theoretical background, which was based on Sinclair & Coulthard's Initiative-Response-Feedback pattern. Verbal interactions in the classes were analyzed by Kim's framework, which modified Jeong's framework. IRF patterns were derived from the verbal interactions of science classes for the science gifted. As a result, authors obtained some important features in IRF pattern. The most commonly used IRF pattern was the teacher's managerial question-student's short answer pattern, which was due to the regional policy for the science gifted. The teacher's delayed feedback as well as the teacher's question was meaningful for student's thinking ability. If elementary teachers consider the pattern, the strategy should be applied, which is depending on student levels and levels of contents. But three teachers did not show the characteristic verbal interaction regarded as a pattern strategy. In the future, inservice programs about verbal interaction are needed for the science gifted classes.

Derivational Morphology in a Tagged Corpus (형태소 분석 말뭉치의 파생명사 처리)

  • Cha, Joon-Kyung;Kang, Beom-Mo
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.390-394
    • /
    • 2000
  • 이 논문은 형태소 분석 말뭉치를 구축하면서 제기되었던 파생 명사 처리의 문제점을 논의하고 그 해결 방안을 모색한 것이다. 파생 명사의 분석에서 국어학적 전산 언어학적으로 유의미한 분석 범위를 정할 때 몇가지 고려해야 할 사항이 있다. 접두사는 어기가 불규칙하므로 규칙으로 자동처리가 어렵다. 형태소 분석의 대상은 생산성이 높고, 어기와 범주를 변화시키는 서술성 접두사로 그 범위를 정할 수 있을 것이다. 접미사의 분석은 생산성이 높고 규칙적인 굴절 접미사가 분석의 대상이 되며, 또한 서술성을 갖는 한자어계 접미사도 분석 대상이 된다. 파생 명사의 분석에 있어서 접사는 그 위상이 동요되므로 접두사는 관형사와 구별이 어렵고 접미사는 의존명사와 구별이 어렵다. 그러므로, 대용량의 형태소 분석 말뭉치를 효율적으로 구축하기 위해서는 접사에 대한 다각적인 검토가 필요할 것이다.

  • PDF

A Content Analysis of Public Information using Language Network Analysis: Focused on Contents of Twitters of Metropolitans (언어네트워크 분석방법을 활용한 공공정보 내용분석 - 광역도시 대표 트위터 내용을 중심으로 -)

  • Kim, Ji-Hyun
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.27 no.3
    • /
    • pp.151-171
    • /
    • 2016
  • This study investigated the contents of twitters of metropolitans by year and city using language network analysis. The possibility of twitter as a medium of information provision was also explored. This study employed KrKwic, Ucinet6, and Netdraw programs to conduct language network analysis. As the results, the network was mainly formed with information about civic administration (citizen, management, opening service, participation) and information about citizens living (cultural events, parks, way to work) in 2014. However, information about civic service and announcement (citizen, civic opinion, opening service, civic service, events) occupied a central role in the network of 2015. The results showed that different keywords were derived by year and city in network analysis by city.