• 제목/요약/키워드: 상식 추론

검색결과 24건 처리시간 0.021초

워드넷 신셋에 대한 사건구조 프레임 반자동 태깅 (Semi-automatic Event Structure Frame tagging of WordNet Synset)

  • 임서현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.101-105
    • /
    • 2018
  • 이 논문은 가장 잘 알려진 어휘부중 하나인 워드넷의 활용 범위 확장을 위해 워드넷 신셋에 "사건구조 프레임(Event Structure Frame)"을 주석하는 연구에 관한 것이다. 워드넷을 비롯하여 현재 사용되고 있는 어휘부는 풍부한 어휘의미정보가 구조화되어 있지만, 사건구조에 관한 정보를 포함하고 있지는 않다. 이 연구의 가장 큰 기여는 워드넷에 사건구조 프레임을 추가함으로써 워드넷과의 연결만으로 핵심적인 어휘의미정보를 모두 추출할 수 있도록 해준다는 점이다. 예를 들어 텍스트 추론, 자연어처리, 멀티 모달 태스크 등은 어휘의미정보와 배경지식(상식)을 이용하여 태스크를 수행한다. 워드넷에 대한 사건구조 주석은 자동사건구조 주석 시스템인 GESL을 이용하여 워드넷 신셋에 있는 예문에 먼저 자동 주석을 하고, 오류에 대해 수동 수정을 하는 반자동 방식이다. 사전 정의된 23개의 사건구조 프레임에 따라 예문에 출현하는 타겟 동사를 분류하고, 해당 프레임과 매핑한다. 현재 이 연구는 시작 단계이며, 이 논문에서는 빈도 순위가 가장 높은 100개의 동사와 각 사건구조 프레임별 대표 동사를 포함하여 총 106개의 동사 레마에 대해 실험을 진행하였다. 그 동사들에 대한 전체 워드넷 신셋의 수는 1337개이다. 예문이 없어서 GESL이 적용될 수 없는 신셋을 제외하면 1112개 신셋이다. 이 신셋들에 대해 GESL을 적용한 결과 F-Measure는 73.5%이다. 향후 연구에서는 워드넷-사건구조 링크를 계속 업데이트하면서 딥러닝을 이용해 GESL 성능을 향상 할 수 있는 방법을 모색할 것이다.

  • PDF

한국어 지식 그래프-투-텍스트 생성을 위한 데이터셋 자동 구축 (A Synthetic Dataset for Korean Knowledge Graph-to-Text Generation)

  • 정다현;이승윤;이승준;서재형;어수경;박찬준;허윤아;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.219-224
    • /
    • 2022
  • 최근 딥러닝이 상식 정보를 추론하지 못하거나, 해석 불가능하다는 한계점을 보완하기 위해 지식 그래프를 기반으로 자연어 텍스트를 생성하는 연구가 중요하게 수행되고 있다. 그러나 이를 위해서 대량의 지식 그래프와 이에 대응되는 문장쌍이 요구되는데, 이를 구축하는 데는 시간과 비용이 많이 소요되는 한계점이 존재한다. 또한 하나의 그래프에 다수의 문장을 생성할 수 있기에 구축자 별로 품질 차이가 발생하게 되고, 데이터 균등성에 문제가 발생하게 된다. 이에 본 논문은 공개된 지식 그래프인 디비피디아를 활용하여 전문가의 도움 없이 자동으로 데이터를 쉽고 빠르게 구축하는 방법론을 제안한다. 이를 기반으로 KoBART와 mBART, mT5와 같은 한국어를 포함한 대용량 언어모델을 활용하여 문장 생성 실험을 진행하였다. 실험 결과 mBART를 활용하여 미세 조정 학습을 진행한 모델이 좋은 성능을 보였고, 자연스러운 문장을 생성하는데 효과적임을 확인하였다.

  • PDF

신경 텐서망을 이용한 컨셉넷 자동 확장 (Automatic Expansion of ConceptNet by Using Neural Tensor Networks)

  • 최용석;이경호;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.549-554
    • /
    • 2016
  • 컨셉넷은 일반상식을 노드(개념)와 에지(관계)로 표현해 놓은 그래프 형태의 지식 베이스이다. 완전한 지식 베이스를 구축하는 것은 매우 어려운 문제이기 때문에 지식 베이스는 미완결된 형태의 데이터를 담고 있는 경우가 많다. 불완전한 지식을 담고 있는 지식 베이스로부터의 추론 결과는 신뢰하기 어렵기 때문에 지식의 완결성을 높이기 위한 방법이 필요하다. 본 논문에서는 신경 텐서망을 이용하여 컨셉넷의 지식 미완결성 문제를 완화해 보고자 한다. 컨셉넷에서 추출한 사실주장(assertion)을 이용하여 신경 텐서망을 학습시킨다. 학습된 신경 텐서망은 두 개의 개념 정보를 입력으로 받고, 그 두 개념이 특정 관계로 연결될 수 있는지를 나타내는 점수값을 출력한다. 이와 같이 신경 텐서망은 노드들의 연결 차수(degree)를 높여, 컨셉넷의 완결성을 증대시킬 수 있다. 본 연구에서 학습시킨 신경 텐서망은 평가데이터에 대해서 약 87.7%의 정확도를 보였다. 또한 컨셉넷에 연결이 없는 노드 쌍에 대하여 85.01%의 정확도로 새로운 관계를 예측할 수 있었다.

사고실험 - 상상의 작용과 한도에 대해 (Thought Experiments: on the Working Imagination and its Limitation)

  • 황희숙
    • 철학연구
    • /
    • 제146권
    • /
    • pp.307-328
    • /
    • 2018
  • 과학을 비롯한 여러 학문분야에서 사고실험(thought experiments)의 사용은 오랜 역사가 있다. 특히 현대 분석철학의 문헌들 속에서 빈번하게 등장하는 사고실험들은 반사실적인 상황에 대한 시나리오로 구성되는데, 여기서 직관과 상상이 상식적 지식과 결합하여 작동하고 있는 것을 볼 수 있다. 사고실험은 논변 구성자에게 필요한 결론을 유도해 내기 위한 개념 분석적 장치다. 그런데 과연 철학의 사고실험들이 지식의 생산에 기여하며 불가피하고도 유익한 것인지에 대해서는 의문의 여지가 있다. 특정한 사고실험이 제시되었을 때, 이를 대면하고 있는 우리가 그 논변의 유도방향에 대해 어떤 무력감이나 속임수의 느낌을 받는다면, 이는 주목해야할 현상일 것이다. 필자는 이에, 사고실험의 적절성 문제를 유명한 사고실험 세 가지 즉, 톰슨의 '병든 바이올리니스트', 퍼트남의 '통속의 뇌', 설의 '중국어 방' 사고실험을 놓고 논의한다. 사고실험에 대해 느끼는 불편함의 원인은 무엇일까? '상상적인 사고실험'들은 실재에 대한 판단 및 정보가 틈새를 보이는 상황에서 구축되어 제시되는 바, 가상적 상황에 대한 논변이다. 그런데 사고실험에서 유관한 배경적 조건들에 대해 부적절하거나 불확실한 바가 있거나, 임의적으로 기술된 요소가 있다면 그 사고실험은 의구심을 불러일으킬 수 있다. 사고실험의 추론이 실제 철학적 문제들에 어떤 적실성과 유효성을 가질 수 있는지를 따져보아야 한다. 호프스태터가 보여주듯이 사고실험의 시뮬레이션 속에 포함된 여러 요소들의 설정을 바꿈으로써 즉 '노브 설정(knob setting)'을 달리함으로써 구성자의 결론과는 다른 결론이 나올 수도 있다. 이렇듯 사고실험의 시나리오에는 철학자의 상상과 이론적 편향이 들어있으며, 그 상상이라는 도구는 오직 제한적으로만 사용되어야 한다는 것이 이 글의 주장이다.