• Title/Summary/Keyword: 서술어

Search Result 138, Processing Time 0.039 seconds

Korean Sematic Role Labeling Using CRFs (CRFs 기반의 한국어 의미역 결정)

  • Park, Tae-Ho;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.11-14
    • /
    • 2015
  • 의미역 결정은 서술어와 논항들 사이의 의미 관계를 결정하는 문제이다. 의미역 결정을 위해 구구조 정보와 의존 구조 정보 등의 다양한 자질에 대한 실험이 있었다. 논항은 구문 구조에서 얻을 수 있는 서술어와 논항 관계에 많은 영향을 받지만 구문 구조가 변경되어도 변하지 않는 논항의 의미로 인해 의미역 결정에 어려운 점이 있다. 본 논문에서는 한국어 의미역 결정 문제를 위해 Korean Propbank 말뭉치와 직접 구축한 의미역 말뭉치를 학습 말뭉치로 사용하였다. 본 논문에서는 이전에 연구된 구문 정보와 그 외의 자질들에 대한 성능을 검증하였다. 본 논문에서 제시하는 자질들의 성능을 검증하기 위해 CRF를 사용하였고, 제시된 새로운 자질을 사용하여 논항의 인식 및 분류에서 76.25%(F1)의 성능을 보였다.

  • PDF

Hierarchical Learning for Semantic Role Labeling with Syntax Information (계층형 문장 구조 인코더를 이용한 한국어 의미역 결정)

  • Kim, Bong-Su;Kim, Jungwook;Whang, Taesun;Lee, Saebyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.199-202
    • /
    • 2021
  • 의미역 결정은 입력된 문장 내 어절간의 의미 관계를 예측하기 위한 자연어처리 태스크이며, 핵심 서술어에 따라 상이한 의미역 집합들이 존재한다. 기존의 연구는 문장 내의 서술어의 개수만큼 입력 문장을 확장해 순차 태깅 문제로 접근한다. 본 연구에서는 확장된 입력 문장에 대해 구문 분석을 수행 후 추출된 문장 구조 정보를 의미역 결정 모델의 자질로 사용한다. 이를 위해 기존에 학습된 구문 분석 모델의 파라미터를 전이하여 논항의 위치를 예측한 후 파이프라인을 통해 의미역 결정 모델을 학습시킨다. ALBERT 사전학습 모델을 통해 입력 토큰의 표현을 얻은 후, 논항의 위치에 대응되는 표현을 따로 추상화하기 위한 계층형 트랜스포머 인코더 레이어 구조를 추가했다. 실험결과 Korean Propbank 데이터에 대해 F1 85.59의 성능을 보였다.

  • PDF

Efficient Storing and SPARQL Search Scheme for Large Scale RDF Data (대용량 RDF 데이터의 효율적인 저장방법과 SPARQL 기반 검색방안 연구)

  • Oh, Sangyoon;Park, Ji-Hoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.07a
    • /
    • pp.195-197
    • /
    • 2016
  • 시멘틱웹을 구축하는 표준언어인 RDF (Resource Description Framework)는 언어의 그래프 기반 특성으로 인해 일반적인 방식들로는 효과적인 저장과 추출이 어렵다. 더욱이 대용량 RDF 데이터의 저장과 추출에는 성능문제가 더욱 커지므로 많은 연구들이 이루어지고 있다. 본 논문에서는 SPARQL을 지원하면서 RDF 파일들을 효과적으로 저장하고 검색할 수 있는 저장방식에 대해 연구한 결과를 제시한다. RDF 데이터를 전처리를 통해 RDF의 트리플(주어:subject, 술어:property, 목적어:Object)에서 중복되는 주어(S)나 목적어(O)를 묶고, 사용자가 SPARQL 형식으로 검색했을 때 이용자가 주어부분을 변수로 두었는지 아니면 서술어 부분을 변수로 두어 찾는지에 따라 검색어와 유사한 단어 클러스터를 찾아준다. 동일 단어에 대해 여러 번 검색되던 부분을 한 번 검색으로 처리할 수 있기 때문에 효율이 높아진다.

  • PDF

Comparison of Verbs in the Contents of the National Curriculum for Elementary and Middle School Science: Focused on the 7th, 2007, and 2009 Revision (초·중학교 과학과 교육과정의 내용 진술에 사용된 서술어 비교: 제7차 교육과정 이후를 중심으로)

  • Jo, Kwang-Hee
    • Journal of Science Education
    • /
    • v.39 no.2
    • /
    • pp.239-254
    • /
    • 2015
  • The aims of this research were to analyze and compare verbs in the contents of the 7th, 2007, and 2009 revised national curriculum for elementary and middle school science. After the investigation of 1383 verbs in description of achievement standards and inquiry, we found that 'to know'(15.0 %) in elementary school and 'to understand'(24.2 %) in middle school were the most frequently used ones, totally in these three curriculums. In the 7th national curriculum, frequently used verbs in elementary school were ones related with inquiry such as observation, investigation and so on though 'to understand' had the most common verbs. Secondly, 'to explain' ranked top among verbs in the 2007 revised national curriculum. It showed some possibility of influences of the discussion-oriented situation at that time. Finally, however, in 2009 revised national curriculum, 'to know' and 'to understand' occupied the first and second portion of the verb distribution. In addition, 'to understand' and 'to observe' were used evenly through three curriculums but the portions of 'to know' increased through curriculum revisions. Some implications and discussions were also added with suggestions for further researches.

  • PDF

Semantic Role Labeling using Biaffine Average Attention Model (Biaffine Average Attention 모델을 이용한 의미역 결정)

  • Nam, Chung-Hyeon;Jang, Kyung-Sik
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.26 no.5
    • /
    • pp.662-667
    • /
    • 2022
  • Semantic role labeling task(SRL) is to extract predicate and arguments such as agent, patient, place, time. In the previously SRL task studies, a pipeline method extracting linguistic features of sentence has been proposed, but in this method, errors of each extraction work in the pipeline affect semantic role labeling performance. Therefore, methods using End-to-End neural network model have recently been proposed. In this paper, we propose a neural network model using the Biaffine Average Attention model for SRL task. The proposed model consists of a structure that can focus on the entire sentence information regardless of the distance between the predicate in the sentence and the arguments, instead of LSTM model that uses the surrounding information for prediction of a specific token proposed in the previous studies. For evaluation, we used F1 scores to compare two models based BERT model that proposed in existing studies using F1 scores, and found that 76.21% performance was higher than comparison models.

Analysis of Achievement Standards Statements of 2022 Revised Elementary School Science Curriculum (2022 개정 초등학교 과학과 교육과정 성취기준 진술 분석)

  • Park, Ki Rak
    • Journal of Korean Elementary Science Education
    • /
    • v.43 no.2
    • /
    • pp.284-300
    • /
    • 2024
  • This study elucidates the achievement standards statements of the 2022 revised elementary school science curriculum to identify specific achievement standards for the upcoming curriculum. Therefore, the researcher analyzed the statements of the overall elementary school achievement standards based on Bloom's taxonomy of new educational objectives. The results are as follows. First, the achievement standards statements are biased toward certain knowledge and cognitive process dimensions; this aspect is not consistent with the goals of the 2022 revised curriculum and the teaching and learning directions of the science department. Thus, achievement standards that enable various types of activities and inquiry learning should be developed. Second, a need emerges for the hierarchization of knowledge and cognitive levels by grade level. The proportions of low levels of knowledge and cognitive process dimensions increased in the upper grades, such that a systematic hierarchy should be considered. Third, the need to diversify the use of the descriptors of achievement standards is also identified. Although the tendency to rely on specific descriptors decreased during the previous curriculum, approx imately half of the descriptors were only used once or twice. Therefore, balancing the use of various descriptors is necessary. To ensure that the results are reflected in the achievement standards for elementary school science textbooks under the revised science curriculum for elementary schools in 2022, a discussion is required on the design of achievement standards statements. As a follow-up study, the researcher proposes a comparative analysis of the achievement standards of science curricula for middle and high schools to explore the wording of achievement standards appropriate for elementary school science education considering its nature, goals, and contents and to analyze the hierarchy and continuity of the entire science curriculum.

Prosodic Characteristics of Flaccid Dysarthria (이완성 구음마비환자의 운율적 특성 연구)

  • 김수정
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.201-208
    • /
    • 1998
  • 구음마비환자의 특징적 문제로는 조음 명료성의 저하오 kdns율의 장애등이 논의되어왔다. 지금까지 조음 명료성을 진단하고 치료하기 위한 연구는 활발히 진행되어 왔으나 운율 장애를 측정, 치료하기 위한 연구는 극히 소수이며 특히, 우리나라의 경우는 전무한 상태이다. 이에 본 연구자는 정상군과 이완성 구음마비환자군의 운율적 차이를 음폭, 음도차, 지속시간, 강도의 측면에서 기술하여 진단과 치료를 위한 기초 자료를 제시하고자 한다. 실험 대상은 이완성 구음마비환자군 6명과 정상군 6명이다. 정상군은 환자군과 성별, 나이, 학력, 방언을 맞추어 선정한다. 본 연구는 억양 대비가 분명히 나타나는 의문형 어미와 서술형 어미를 선택한다. 예문은 억양 곡선을 잘 나타내기 위해 유성 자음과 모음으로 구성된 것으로 한다. 종결형 어미가 분석 목표이나 예문의 길이가 너무 짧은 경우 경도환자의 특징이 잘 나타나지 않을 수 있으므로, 주어+목적어+서술어로 구성된 3어절로 구성된 예문을 사용한다.

  • PDF

Deep learning-based Answer Type Classifier Considering Topicality in Korean Question Answering (한국어 질의 응답에서의 화제성을 고려한 딥러닝 기반 정답 유형 분류기)

  • Cho, Seung Woo;Choi, DongHyun;Kim, EungGyun
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.103-108
    • /
    • 2019
  • 한국어 질의 응답의 입력 질문에 대한 예상 정답 유형을 단답형 또는 서술형으로 이진 분류하는 방법에 대해 서술한다. 일반적인 개체명 인식으로 확인할 수 없는 질의 주제어의 화제성을 반영하기 위하여, 검색 엔진 쿼리를 빈도수로 분석한다. 분석된 질의 주제어 정보와 함께, 정답의 범위를 제약할 수 있는 속성 표현과 육하원칙 정보를 입력 자질로 사용한다. 기존 신경망 분류 모델과 비교한 실험에서, 추가 자질을 적용한 모델이 4% 정도 향상된 분류 성능을 보이는 것을 확인할 수 있었다.

  • PDF

Joint Model for Dependency Parser and Semantic Role Labeling using Recurrent Neural Network Parallelism (순환 신경망 병렬화를 사용한 의존 구문 분석 및 의미역 결정 통합 모델)

  • Park, Seong Sik;Kim, Hark Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.276-279
    • /
    • 2019
  • 의존 구문 분석은 문장을 구성하는 성분들 간의 의존 관계를 분석하고 문장의 구조적 정보를 얻기 위한 기술이다. 의미역 결정은 문장에서 서술어에 해당하는 어절을 찾고 해당 서술어의 논항들을 찾는 자연어 처리의 한 분야이다. 두 기술은 서로 밀접한 상관관계가 존재하며 기존 연구들은 이 상관관계를 이용하기 위해 의존 구문 분석의 결과를 의미역 결정의 자질로써 사용한다. 그러나 이런 방법은 의미역 결정 모델의 오류가 의존 구문 분석에 역전파 되지 않으므로 두 기술의 상관관계를 효과적으로 사용한다고 보기 어렵다. 본 논문은 포인터 네트워크 기반의 의존 구문 분석 모델과 병렬화 순환 신경망 기반의 의미역 결정 모델을 멀티 태스크 방식으로 학습시키는 통합 모델을 제안한다. 제안 모델은 의존 구문 분석 및 의미역 결정 말뭉치인 UProbBank를 실험에 사용하여 의존 구문 분석에서 UAS 0.9327, 의미역 결정에서 PIC F1 0.9952, AIC F1 0.7312의 성능 보였다.

  • PDF

A Caseframe Structure of Concept-Based Topic Fusion for Text Summarization System (문서 요약 시스템을 위한 대표 개념어 생성의 격틀 구성)

  • 김성규;김미진;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.181-183
    • /
    • 1999
  • 대량의 정보를 빠르고 쉽게 검색하기 위한 많은 문서 자동 요약 시스템이 개발되고 있다. 현재에는 원문에서의 추출을 통한 방법 뿐 아니라 요약문의 생성에 초점을 두고 요약 시스템을 위해 대표 개념어 생성기를 위한 구성 방안을 제시한다. 격틀 구성을 위한 단계별 과정과 핵심어의 추출, 그리고 격틀 구성의 제한 요건을 서술한다.

  • PDF