• 제목/요약/키워드: Pattern of Predicate

검색결과 9건 처리시간 0.029초

동형이의어 분별에 의한 한국어 의존관계 분석 (An Analysis of Korean Dependency Relation by Homograph Disambiguation)

  • 김홍순;옥철영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권6호
    • /
    • pp.219-230
    • /
    • 2014
  • 의존관계 분석은 문장의 어절 간에 의존소-지배소를 결정하는 작업이다. 용언은 문형 및 하위범주화 정보의 선택제약에 의해 다른 어절과의 의존관계를 형성한다. 본 논문은 형태소 분석 단계에서 동형이의어 분별된 용언의 문형을 이용하여 용언의 의존관계를 분석하는 방법을 제안한다. 특히, 형태소분석 단계에서 품사 및 동형이의어 태깅을 위해 사용하는 단계별 전이모델의 학습사전을 재활용하여 {명사+격조사, 용언} 간의 의존관계를 확정하는 방안을 제안하고 그의 정확률 및 영향을 분석한다. 동형이의어가 부착되고 의존관계로 변경된 21개의 세종구문분석말뭉치를 이용하여 실험한 결과, 동형이의어 분별된 의존관계 분석 정확률이 80.38%로, 동형이의어가 분별되지 않은 의존관계분석에 비해 0.42%의 정확률 향상이 있었으며, 유의수준 1%의 검정통계량 Z는 ${\mid}Z{\mid}=4.63{\geq}z_{0.01}=2.33$으로 동형이의어 분별이 의존관계 분석에 영향이 있음을 보였다. 또한, 단계별 전이모델이 의존관계 분석 정확률에 약 7.14% 영향을 미치는 것을 알 수 있었다.

술어-논항 구조의 패턴 유사도를 결합한 혼합 커널 기반관계 추출 (Relation Extraction based on Composite Kernel combining Pattern Similarity of Predicate-Argument Structure)

  • 정창후;최성필;최윤수;송사광;전홍우
    • 인터넷정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.73-85
    • /
    • 2011
  • 문헌에 존재하는 핵심개체 간의 관계를 자동으로 추출할 때 다양한 형태의 문서 분석 결과를 활용할 수 있다. 본 논문에서 는 기존에 개발되어 비교적 높은 성능을 보여준 합성곱 구문 트리 커널의 구절 구조 유사성 정보와 두 개체 사이의 유의미한 연관관계를 표현해주는 술어-논항 구조 패턴의 유사성 정보를 동시에 활용하는 혼합 커널을 제안한다. 구문적 구조를 이용하는 기존의 합성곱 구문 트리 커널에 술어와 논항 간의 의미적 구조를 활용하는 술어-논항 구조 패턴 유사도 커널을 결합하여 상호보완적인 혼합 커널을 구성하였고, 다양한 테스트컬렉션 기반의 실험을 통하여 개발된 커널의 성능을 측정하였다. 실험결과 구절 구조 정보를 이용하는 합성곱 구문 트리 커널만을 단독으로 사용했을 때보다 술어-논항 구조의 패턴 정보를 결합한 혼합 커널을 사용했을 때에 더 좋은 성능을 보이는 것을 확인할 수 있었다. 또한 기존의 시스템보다 우수한 성능을 보이는 것도 함께 확인할 수 있었다.

엔터테인먼트 데이터를 위한 자연어 검색시스템 (A Natural Language Retrieval System for Entertainment Data)

  • 김정인
    • 한국멀티미디어학회논문지
    • /
    • 제18권1호
    • /
    • pp.52-64
    • /
    • 2015
  • Recently, as the quality of life has been improving, search items in the area of entertainment represent an increasing share of the total usage of Internet portal sites. Information retrieval in the entertainment area is mainly depending on keywords that users are inputting, and the results of information retrieval are the contents that contain those keywords. In this paper, we propose a search method that takes natural language inputs and retrieves the database pertaining to entertainment. The main components of our study are the simple Korean morphological analyzer using case particle information, predicate-oriented token generation, standardized pattern generation coherent to tokens, and automatic generation of the corresponding SQL queries. We also propose an efficient retrieval system that searches the most relevant results from the database in terms of natural language querying, especially in the restricted domain of music, and shows the effectiveness of our system.

생의학 학술 문헌의 불확실성 기반 지식 동향 분석에 관한 연구 (Knowledge Trend Analysis of Uncertainty in Biomedical Scientific Literature)

  • 허고은;송민
    • 정보관리학회지
    • /
    • 제36권2호
    • /
    • pp.175-199
    • /
    • 2019
  • 불확실성이란 정보의 합의나 현존하는 지식 부족으로 인해 명제의 지식이 불완전한 상태를 의미한다. 과학적 지식의 불확실성을 연구하는 학술문헌의 양은 시간이 흐름에 따라 기하급수적으로 증가하고 있으며, 이에 따라 새로운 지식이 발견되고 연구가 발전하고 있다. 이처럼 시간의 흐름은 지식의 불확실성의 패턴을 발견하는데 중요한 요인이 될 수 있음에도 불구하고 기존의 연구들은 불확실성 단어의 단순 출현 빈도를 기반으로 특정 학문 영역에서 불확실성의 특성을 파악해왔다. 따라서, 본 연구에서는 구축한 불확실성 단어를 생의학 영역의 불확실성 연구에 적용하여 시간의 흐름에 따른 불확실성의 변화와 패턴을 파악하고자 한다. 시간의 흐름에 따른 생의학 지식의 패턴을 분석하기 위해 대표 개체 페어, 동사 유형, 대표 개체의 패턴을 살펴보았으며 선형회귀 분석을 통해 유의성 검증을 수행했다. 개체 페어 분석에서는 17건 중 7건의 개체 페어가 유의하게 감소하는 패턴을 보였다. 10개의 대표적인 동사 유형은 모두 시간이 흐름에 따라 유의하게 감소했다. 대표 개체의 연도별 상대적 중요도 분석에서는 유의하게 상승과 하강 패턴을 보이는 개체들의 불확실성 증감을 분석했다.

강건한 한국어 상품평의 감정 분류를 위한 패턴 기반 자질 추출 방법 (A Robust Pattern-based Feature Extraction Method for Sentiment Categorization of Korean Customer Reviews)

  • 신준수;김학수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권12호
    • /
    • pp.946-950
    • /
    • 2010
  • 기계 학습 기반의 많은 감정 분류 시스템들은 문장으로부터 언어적 자질을 추출하기 위하여 형태소 분석기를 사용한다. 그러나 온라인 상품평에는 많은 띄어쓰기 오류 및 철자 오류가 포함되어 있어서 일반적으로 형태소 분석기가 좋은 성능을 내기 어려우며, 기반 시스템의 낮은 성능은 감정 분류 시스템의 성능하락을 초래한다. 이러한 문제를 해결하기 위하여 본 논문에서는 어절 패턴과 음운 패턴의 최장 일치 매칭(matching)에 기반한 자질 추출 방법을 제안한다. 두 종류의 패턴은 대용량의 품사 부착 말뭉치로부터 자동으로 구축된다. 어절 패턴은 영사, 동사와 같은 내용어를 포함하는 어절들로 구성되며, 음운 패턴은 동사나 형용사와 같은 용언의 초성과 중성의 쌍으로 구성된다. 음운 패턴에 초성과 중성만을 사용한 이유는 철자 오류에 영향을 덜 받기 때문이다. 제안 방법을 평가하기 위하여 SVM(Support Vector Machine)을 기계 학습기로 사용하는 감정 분류 시스템을 구현하였다. 한국어 상품평에 대한 실험에서 제안 방법을 자질 추출 모듈로 사용하는 감정 분류 시스템이 형태소 분석기를 사용하는 것보다 우수한 성능을 보였다.

술어-논항 구조의 패턴 유사도를 활용한 혼합 커널 기반 관계 추출 (Relation Extraction based on Composite Kernel using Pattern Similarity of Predicate-Argument Structure)

  • 정창후;전홍우;최윤수;송사광;최성필
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.276-279
    • /
    • 2011
  • 문서 내에 존재하는 개체 간의 관계를 자동으로 추출할 때 다양한 형태의 문서 분석 결과를 활용할 수 있다. 본 논문에서는 기존에 개발되어 비교적 높은 성능을 보여준 트리 커널의 구절 구조 유사성 정보와 두 개체 사이의 유의미한 연관관계를 표현하는 술어-논항 구조 패턴의 유사성 정보를 활용하는 혼합 커널을 제안한다. 구문적 구조를 이용하는 기존의 트리 커널 기법에 술어와 논항 간의 의미적 구조를 활용하는 술어-논항 구조 패턴 유사도 커널을 결합하여 상호보완적인 혼합 커널을 구성하였고, 실험을 통하여 개발된 커널의 성능을 측정하였다. 실험 결과 구절 구조 정보를 이용하는 트리 커널만을 단독으로 사용했을 때보다 술어-논항 구조의 패턴 정보를 결합한 혼합 커널을 사용했을 때에 더 좋은 성능을 보이는 것을 확인할 수 있었다. 이는 관계 인스턴스에 대한 구절 구조 정보뿐만 아니라 개체 간의 유의미한 연관관계를 표현해주는 술어-논항 구조 패턴 또한 관계 추출 작업에 매우 유용한 정보임을 입증하고 있다.

백과사전 영역에서 중심어주도패턴에 기반한 문장주제 할당 기법 (A Sentence Theme Allocation Scheme based on Head Driven Patterns in Encyclopedia Domain)

  • 강보영;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.396-405
    • /
    • 2005
  • 기존의 주제 관련 연구들은 문서에 자주 등장하는 용어를 주제로 간주하는 등 문서에서 다루는 주제에 대한 정의가 모호하다. 또한 문서를 구성하는 기본 단위인 문장의 주제가 문서 요약 및 정보 추출 등의 연구 분야에 중요하게 활용될 수 있음에도 불구하고, 이에 대한 고려 없이 문서 전체의 주제를 추출하고 할당하는 연구가 대부분이다. 따라서 본 논문에서는 문장 단위의 주제 처리에 대한 기본 연구로서, 백과사전 영역에서 효과적인 중심어주도패턴에 기반한 문장주제 할당 기법을 제안하였다. 두산동아 백과사전 인물분야 2,381문서를 대상으로 성능을 분석해본 결과, 제안된 기법이 비교기준보다 향상된 성능을 보였으며, 특히 제안된 네 가지 중심어주도 패턴 중 술어를 기반으로 구성된 중심어주도패턴 유형 4가 학습집합에 대하여 평균 $98.96\%$, 실험집합에 대하여 $88.57\%$의 성능(F-score)으로 주제할당에 가장 효과적임을 알 수 있었다.

Unified calculation model for the longitudinal fundamental frequency of continuous rigid frame bridge

  • Zhou, Yongjun;Zhao, Yu;Liu, Jiang;Jing, Yuan
    • Structural Engineering and Mechanics
    • /
    • 제77권3호
    • /
    • pp.343-354
    • /
    • 2021
  • The frequencies formulas of the bridge are of great importance in the design process since these formulas provide insight dynamic characteristics of the structure, which guides the designers to parametric analyses and the layout of the bridge in conceptual or preliminary design. Continuous rigid frame bridge is popular in the mountainous area. Mostly, this type of bridge was simplified either as a girder or cantilever when calculating the frequency, however, studies showed that the different configuration of the bridge made the problem more complex, and there is no unified fundamental calculation pattern for this kind of bridge. In this study, an empirical frequency equation is proposed as a function of pier's height, stiffness of pier and the weight of the structure. A unified fundamental frequency formula is presented based on the energy principle, then the typical continuous rigid frame bridge is investigated by finite element method (FEM) to study the dynamic characteristics of the structure, and then several key parameters are investigated on the effect of structural frequency. These parameters include the number, position and stiffness of the tie beam. Nonlinear regression analyses are conducted with a comprehensive statistical study from plenty of engineering structures. Finally, the proposed frequency equation is validated by field test results. The results show that the fundamental frequency of the continuous rigid frame bridge increases more than 15% when the tie beams are set, and it increases with the stiffness ratio of tie beam to pier. The results also show that the presented unified fundamental frequency has an error of 4.6% compared with the measured results. The investigation can predicate the approximate longitudinal fundamental frequency of continuous ridged frame bridge, which can provide reference for the seismic response and dynamic impact factor design of the pier.

소셜 미디어 상 고객피드백을 위한 감성분석 (The Sensitivity Analysis for Customer Feedback on Social Media)

  • 송은지
    • 한국정보통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.780-786
    • /
    • 2015
  • SNS 등과 같은 소셜 미디어는 실시간으로 자발적인 고객의 의견들을 대거 포함하고 있어 최근 기업들은 효율적인 경영을 위해 소셜 미디어상의 빅 데이터를 분석하는 시스템을 이용하여 고객피드백에 관한 정보를 수집하고 분석하고 있다. 그러나 온라인 사이트에서 수집한 데이터는 띄어쓰기와 철자 오류가 많아 기존의 형태소 분석기로는 정확한 분석을 할 수 없다. 또한 온라인 상의 문장은 짧다는 특징이 있어 상호 정보량, 카이제곱 통계량 등과 같은 기존의 의미 선택 방법을 이용하게 되면 문장 내 선택 할 수 있는 의미의 부재로 인해 정확한 감성 분류를 할 수 없다는 문제점이 있다. 이러한 문제점들을 해결하기 위해서 본 논문에서는 초/중성 및 어절 패턴 사전을 이용해서 보정할 수 있는 모듈과 문장 내 품사의 우선순위를 이용한 의미 선택 방법을 제안한다. 이러한 방법으로 형태소 분석기에서 추출된 품사 정보를 기반으로 용언과 체언을 분리해서 분석 해당 품사에 종속적인 속성 DB 구축 한 후 학습에 의해 누적된 속성 DB를 사용하여 보다 정확한 긍/부정 감성을 추출한다.