• 제목/요약/키워드: Distant Supervision

검색결과 19건 처리시간 0.036초

한국어 서술어와 지식베이스 프로퍼티 연결 (Linking Korean Predicates to Knowledge Base Properties)

  • 원유성;우종성;김지성;함영균;최기선
    • 정보과학회 논문지
    • /
    • 제42권12호
    • /
    • pp.1568-1574
    • /
    • 2015
  • 본 논문은 자연언어 문장을 지식베이스의 지식 골격에 맞추어 지식의 형태로 변환하기 위한 과정 중의 하나인 관계추출(Relation Extraction)을 목표로 한다. 특히, 문장 내에 있는 서술어(Predicate)에 집중하여 서술어와 관련성 높은 지식베이스 프로퍼티(Property or Relation)를 찾아내고, 이를 통해 두 개체(Entity)간의 의미를 파악하는 관계추출에 초점을 둔다. 이에 널리 활용되는 원격지도학습(Distant Supervision) 접근 방식에 따라, 지식베이스와 자연언어 텍스트로부터 원격 학습이 가능한 레이블(Labeled) 데이터를 자동으로 마련하여 지식베이스 프로퍼티에 대한 어휘화 작업을 수행한다. 즉, 두 개체 사이의 관계로 표현되는 서술어와, 온톨로지로 정의할 수 있는 프로퍼티와의 연결을 통해, 텍스트로부터 구조적 정보를 생성할 수 있는 기반을 마련하고 최종적으로 지식베이스 확장의 가능성을 열어준다.

Improving accessibility and distinction between negative results in biomedical relation extraction

  • Sousa, Diana;Lamurias, Andre;Couto, Francisco M.
    • Genomics & Informatics
    • /
    • 제18권2호
    • /
    • pp.20.1-20.4
    • /
    • 2020
  • Accessible negative results are relevant for researchers and clinicians not only to limit their search space but also to prevent the costly re-exploration of research hypotheses. However, most biomedical relation extraction datasets do not seek to distinguish between a false and a negative relation among two biomedical entities. Furthermore, datasets created using distant supervision techniques also have some false negative relations that constitute undocumented/ unknown relations (missing from a knowledge base). We propose to improve the distinction between these concepts, by revising a subset of the relations marked as false on the phenotype-gene relations corpus and give the first steps to automatically distinguish between the false (F), negative (N), and unknown (U) results. Our work resulted in a sample of 127 manually annotated FNU relations and a weighted-F1 of 0.5609 for their automatic distinction. This work was developed during the 6th Biomedical Linked Annotation Hackathon (BLAH6).

원격 지도 학습 데이터 노이즈 제거를 위해 확장된 최단 의존 경로를 이용한 CNN 기반 관계추출 (A CNN-based Relation Extraction with Extended Shortest Dependency Path for Noise Reduction of Distant Supervision)

  • 남상하;한기종;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.50-54
    • /
    • 2018
  • 관계 추출을 위한 원격 지도 학습은 사람의 개입 없이 대규모 데이터를 생성할 수 있는 효율적인 방법이다. 그러나 원격 지도 학습은 노이즈 데이터 문제가 있으며, 노이즈 데이터는 두 가지 유형으로 나눌 수 있다. 첫 번째는 관계 표현 자체가 없는 문장이 연결된 경우이고, 두 번째는 관계 표현은 있는 문장이지만 다른 관계 표현도 함께 가지는 경우이다. 주로 문장의 길이가 길고 복잡한 문장에서 두 번째 노이즈 데이터 유형이 자주 발견된다. 본 연구는 두 번째 경우의 노이즈를 줄임으로써 관계 추출 모델의 성능을 향상시키기 위해 확장된 최단 의존 경로를 사용하는 CNN 기반 관계 추출 모델을 제안한다. 본 논문에서 제안한 방법의 우수성을 입증하기 위해, 한국어 위키피디아와 DBpedia 기반의 원격 지도 학습 데이터를 수집하여 평가한 결과, 본 논문에서 제안한 방법이 위 문제를 해결하는데 효과적이라는 것을 확인하였다.

  • PDF

적합성 검증을 통한 관계 추출 성능 향상 (Improving Relation Extraction Performance using Relevance Verification)

  • 원유성;김지성;남상하;함영균;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.90-95
    • /
    • 2015
  • 기계적 학습을 위해서는 일반적으로 많은 양의 수동 주석데이터(Manually Labeled Data)가 요구된다. 원격지도(Distant Supervision)는 현실적으로 부족한 주석데이터(Labeled Data)를 대신해 자동적으로 주석데이터를 수집하여 학습하는 접근 방식으로 관계 추출(Relation Extracion) 문제에 널리 활용되고 있다. 이때 필연적으로 많은 노이즈(Noise)가 발생되는데, 적합성 검증(Relevance Verification)을 통해 수집된 학습데이터를 정제함으로써 노이즈로 인한 변동성을 줄이고 결과적으로 향상된 성능을 보여주는 관계 추출 방법을 제시한다.

  • PDF

농촌지역의 의료요구와 의료공급에 관한 연구 (Need for and Supply of Primary Care in Rural Areas)

  • 송건용
    • 한국인구학
    • /
    • 제4권1호
    • /
    • pp.23-35
    • /
    • 1981
  • Health policy is directed to equity in the provision of primary care for rural people before the year of 2, 000. This study aimed to define and identify the need for physician's care by using empirical data, and suggested an alternative of the primary care delivery system in rural areas to the government. 1. Twenty percent of the study population wanted to obtain any form of medical care services. : 9.3 percent of the population was in need for physician's care; 15 percent of the need was met by physicians, while 85 percent remained unmet at the time of survey in 1979. 2. For meeting all the need for physician's primary care, 2.9 annual physician visits per capita are demanded. An alternative, which was devised in some favourable way at reasonable cost in rural settings, was suggested. It was to deploy the physician extender such as community health practitioner in the infrastructure of the health care delivery system, whose supervision is provided by physician, based on experience of the KHDI health demonstration project. 3. One physician, two community health practitioners and two community health aides should be assigned in distant locations for meeting all the estimated need for physician's primary care for 10, 000 rural underserved residents.

  • PDF

공해조업선(公海操業船)에 대한 관할권문제(管轄權問題)와 기국(旗國)의 책임(責任) (A Study on the Jurisdictional Problems for Fishing Vessels Engaging High Sea Fishery and the Responsibility of Flag States)

  • 최종화
    • 수산해양교육연구
    • /
    • 제5권2호
    • /
    • pp.138-146
    • /
    • 1993
  • In accordance with the establishment of 200 nautical miles EEZ regime as a customary international law since the mid - 1980s, the area of global high seas became reduced relatively. On the other hand, the importance of high seas fishing ground became serious for the distant-water fishing states like Korea. But it can be expected that international dispute on the jurisdictional problem of the fishing vessels engaging high sea fishery will occur frequently owing to institutional inertia of the UNLOS Convention on this matter. "The Draft Agreement to Promote Compliance with International Conservation and Management Measures by Fishing Vessels on the High Seas" as an international code of conduct for responsible fishing which was adopted by FAO in 1993 is providing the more consolidating and definiting rules for jurisdictional responsibility of flag states to make completion the loophole of the UNLOS Convention. As a precondition for the effective control and enforcement of activities of the fishing vessels engaging high sea fishery, the Draft Agreement is providing some articles allowing the flag states to hold the rights of granting nationality, fishery permission, fishery supervision and control with punishment for the fishing vessels entitled to fly their own flag. Accordingly it can be evaluated that this Draft Agreement does not deviate on the whole from the traditional practice and the basic legal principle of the UNLOS Convention.

  • PDF

관계 추출 및 지식베이스 확장을 위한 반복 학습 시스템 설계 (Iterative learning system design for relation extraction and knowledge base population)

  • 정용빈;남상하;김지성;이민호;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.185-189
    • /
    • 2019
  • 관계추출기의 학습을 위해서는 많은 학습 데이터가 필요한데, 사람이 모으게 되면 많은 비용이 필요하여 원격 지도 학습을 이용한 데이터 수집이 많은 연구에서 사용되고 있다. 원격 지도 학습은 지식베이스를 기반으로 학습 데이터를 자동으로 만들어 내는 방식이기에 비용이 거의 들지 않지만, 지식베이스의 질과 양에 영향을 받는다. 본 연구는 원격 지도 학습을 기본으로 관계추출기의 성능을 향상 시키고, 지식베이스를 확장하는 방안으로 반복학습을 제안한다. 실험을 적은 비용으로 빠르게 진행하기 위해 반복학습을 자동화 하는 시스템을 설계하여 실험을 하였고, 이 시스템으로 관계추출기의 성능이 향상 될 수 있는 가능성을 보였으며, 반복학습을 통한 지식베이스의 확장 방안을 제시한다.

  • PDF

초등 교사의 SW교육 수업 전문성 개발 활동 형태 및 특성 (Types and Characteristics of Primary Teachers' Instructional Expertise Development Activities for Software Education)

  • 옥지현;안성진
    • 정보교육학회논문지
    • /
    • 제22권5호
    • /
    • pp.519-533
    • /
    • 2018
  • 이 연구에서는 초등학교에서 SW교육 관련 내용을 지도하는 교사들의 수업 전문성 개발을 위해 참여하는 활동들에 대해 유형별로 분류하고, 최근 3년간 전문성 개발 활동 참여 정도, 활동 후 성과 등 전문성 개발 활동 형태 및 특성들에 대해 분석하였다. 초등 교사 276명이 설문에 참여하였고, 그 결과 집합으로 이루어지는 직무연수(96%), 원격으로 이루어지는 직무연수(96%)에 가장 많이 참여하였고, 컨설팅 장학 멘토링 동료관찰(82%), 관련부처 및 시도교육청 주관 강좌 워크숍 세미나(69%), 교과연구회(66%)등이 그 뒤를 이었다. 한편 비공식적 활동 중 독서가 가장 많았고, 유튜브, 깃허브 등 웹사이트 정보 활용(80%), 교사들의 전문성 계발 네트워크(76%)순으로 많이 참여 하는 것으로 나타났다. 또한 활동에 참여하는 이유로 대다수가 수업 전문성 향상을 위해서 활동에 참여하는 것으로 나타났으며, 활동 후 수업 전문성 향상 도움도, 직무역량 향상도, 현업적용도 및 수업 효능감, 긍정적 효과 정도에 영향을 미치는 것으로 나타났다. 연구 결과가 SW교육 관련 교과 지도를 위한 초등교사의 수업 전문성 개발 활동의 교육적 가치를 증진 시킬 수 있는 지속적 전문성 개발 방안을 마련할 수 있는 토대를 제공할 것으로 기대한다.

용주사(龍珠寺) <삼세불회도(三世佛會圖)> 연구의 연대 추정과 양식 분석, 작가 비정, 문헌 해석의 검토 (A Review Examining the Dating, Analysis of the Painting Style, Identification of the Painter, and Investigation of the Documentary Records of Samsaebulhoedo at Yongjusa Temple)

  • 강관식
    • 미술자료
    • /
    • 제97권
    • /
    • pp.14-54
    • /
    • 2020
  • 용주사 <삼세불회도>에 대한 연구는 연대 추정과 양식 분석, 작가 비정, 문헌 해석의 네 가지 핵심 사항이 실증적인 근거와 일관된 논리 아래 모두 일치되도록 정합적으로 설명해야 한다. 그러나 최근의 용주사 <삼세불회도> 연구에서 제기된 19세기 후반 화승 제작설과 1790년에 제작된 원본을 1920년대에 일반화가가 서양화법으로 개채한 것이라는 소론은 실증성과 논리성이 결여되어 성립되기 어렵다. 현존 <삼세불회도>의 축원문(祝願文)은 세자(世子) 책봉을 받지 않은 원자(元子)만 있던 시기였음에도 불구하고 당시의 관습대로 의례적인 삼전(三殿) 축원문을 썼다가 이를 주사로 지우고 다시 "주상전하수만세(主上殿下壽萬歲), 자궁저하수만세(慈宮邸下壽萬歲), 왕비전하수만세(王妃殿下壽萬歲), 세자저하수만세(世子邸下壽萬歲)"라는 특별한 내용과 예외적인 순서로 개서(改書)했는데, 이는 조선후기 불화의 축원문 형식과 내용을 광범위하게 조사하고 정조대 왕실의 전례(典禮)를 면밀히 분석해 볼 때, 현존하는 <삼세불회도>가 1790년의 창건 당시에 그려졌던 원본 진작임을 말해주는 가장 확실한 객관적 근거라고 할 수 있다. 삼세불회도의 형식(形式)과 도상(圖像), 양식(樣式), 미감(美感), 화격(畫格) 등을 18~19세기 불화나 궁중화원 양식과 다각도로 비교분석해 보면 용주사 <삼세불회도>는 1790년경 전후에만 나타나는 특징이 많이 보이기 때문에 축원문(祝願文)에 대한 분석 결과와 일치한다. 특히 18세기 전반까지만 해도 종교적 위상에 따라 존상의 크기가 결정되고 화면 구성도 근하원상(近下遠上)의 고식(古式) 원근법에 따라 관념적, 평면적 조형 위주로 이루어져 왔으나 이 <삼세불회도>는 투시법적 원근법의 논리에 따라 구축된 입체적 공간 속에 존상들을 매우 체계적으로 배치한 뒤 서양화(西洋畫)의 음영식(陰影式) 명암법(明暗法)을 적극적으로 구사하며 흰색 하이라이트와 그림자까지 표현함으로써, 마치 삼세불회(三世佛會)의 장엄한 세계가 눈앞에 실제로 펼쳐져 있는 것 같은 느낌을 준다. 이 투시법적 원근법의 내적 질서와 음영식 명암법의 외적 착시는 골육합체(骨肉合體)처럼 내적으로 긴밀히 연결되어 있는 것이기 때문에 흰색 하이라이트만 떼어내서 후대에 개채된 것이라고 볼 수 있는 것이 결코 아니다. 더구나 이 <삼세불회도> 같은 고도의 서양화법과 높은 화격(畫格)의 창의적 융합은 조선후기 회화사상 김홍도와 이명기, 김득신 같은 정조대의 궁중화원만이 이룩할 수 있는 고도의 양식이자 화격이다. 용주사 주지 등운(等雲)이 창건 이래 용주사에 전해져온 기록을 토대로 『용주사사적(龍珠寺事蹟)』을 정리하며 김홍도가 <삼세불회도>를 그렸다고 기록한 것은 이것이 당시의 역사(歷史)이자 실상이었기 때문이다. 조정의 공식 기록인 『일성록(日省錄)』과 『수원부지령등록(水原府旨令謄錄)』에는 김홍도와 이명기, 김득신이 감동(監董)했다고 기록되어 있지만, 이는 의례 화승(畫僧)들이 그려왔던 불화를 관원 신분의 화원에게 그리도록 하는 것이 엄격한 관직 체제나 운영상 부당한 것이기 때문에 정치적 부담을 피하기 위해 명분상 감동으로 발령한 뒤 실제로는 불화를 직접 그리도록 했던 데서 나타난 결과였다. 영정조대의 어진(御眞) 도사 과정에서 감동으로 불러들인 문인화가 조영석(趙榮祏)과 강세황(姜世晃)에게 국왕이 직접 그릴 것을 요구했던 사례에서 볼 수 있듯이, '감동(監董)'과 '집필(執筆)'은 경우에 따라 경계를 넘나들 수 있는 개념으로서 '감동'이 '집필'을 완전히 배제하는 것은 아니며 겸할 수도 있는 것이다. 그런 점에서 『용주사사적』의 기록은 『일성록』이나 『수원부지령등록』은 물론 황덕순의 「닫집 원문」 기록과도 모순되는 것이 아니라, 행간의 의미를 찾아 복합적으로 읽으면 각각의 맥락과 필요에 따라 동일한 내용의 표리를 다르게 기록해 놓은 것임을 알 수 있다. 이렇게 해석할 때 우리는 용주사 <삼세불회도>의 연대 추정과 양식 분석, 작가 비정, 문헌 해석의 네 가지 핵심 사항을 모두 실증적인 근거와 일관된 논리 아래 정합적으로 설명할 수 있을 것이다.