• 제목/요약/키워드: 숫자 번역

검색결과 13건 처리시간 0.023초

인공신경망 은닉층 해석을 위한 토픽과의 비교 (Comparison Between Hidden Layers of Neural Networks and Topics for Hidden Layer Comprehension)

  • 정영섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.910-913
    • /
    • 2017
  • 데이터의 양이 증가하면서 인공신경망을 통한 데이터 분석 기술이 주목받고 있으며, 텍스트, 그림, 동영상 등에 이르기까지 다양한 종류의 데이터를 자동으로 분석하여, 번역기, 채팅봇, 그림 캡션 자동 생성 등에 대한 연구 및 서비스 개발에 활용되고 있다. 인공신경망 기반으로 수행된 많은 연구들이 공통적으로 가진 한계가 있는데, 그것은 은닉층에 대한 해석이 어렵다는 것이다. 가령, 입력층, 은닉층, 그리고 결과층으로 이루어진 인공신경망을 임의의 데이터로 학습시키면, 입력층과 은닝층 사이에 존재하는 행렬은 해당 데이터에 존재하는 패턴 정보를 내포하게 된다. 따라서, 행렬에 존재하는 패턴 정보를 직접 분석할 수 있다면, 인공신경망 결과물에 대한 해석이 가능할 뿐만 아니라 성능을 높이기 위해 어떤 조정이 필요한지에 대한 직관도 얻을 수 있을 것이다. 하지만, 이 행렬의 실체는 숫자로 이루어진 벡터이므로 사람이 직접 해석하는 것은 불가능하며, 지금까지 수행되어온 대부분의 인공신경망 연구들은 공통적으로 이러한 한계점을 가지고 있다. 본 연구는 데이터에 존재하는 패턴을 잡아내면서도 해석이 가능한 토픽 모델과 인공신경망의 결과물을 비교함으로써, 인공신경망 은닉층 해석에 대한 실마리를 찾기 위한 연구이다. 실험을 통해 토픽과 은닉층 패턴의 유사성을 검증하고, 향후 인공신경망 연구에서 은닉층에 대한 가능성을 논한다.

단락에 대한 이산 추론을 요구하는 한국어 기계 독해 (Reading Comprehension requiring Discrete Reasoning Over Paragraphs for Korean)

  • 김경민;서재형;이수민;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.439-443
    • /
    • 2021
  • 기계 독해는 단락과 질의가 주어졌을 때 단락 내 정답을 찾는 자연어 처리 태스크이다. 최근 벤치마킹 데이터셋에서 사전학습 언어모델을 기반으로 빠른 발전을 보이며 특정 데이터셋에서 인간의 성능을 뛰어넘는 성과를 거두고 있다. 그러나 이는 단락 내 범위(span)에서 추출된 정보에 관한 것으로, 실제 연산을 요구하는 질의에 대한 응답에는 한계가 있다. 본 논문에서는 기존 범위 내에서 응답이 가능할 뿐만이 아니라, 연산에 관한 이산 추론을 요구하는 단락 및 질의에 대해서도 응답이 가능한 기계 독해 모델의 효과성을 검증하고자 한다. 이를 위해 영어 DROP (Discrete Reasoning Over the content of Paragraphs, DROP) 데이터셋으로부터 1,794개의 질의응답 쌍을 Google Translator API v2를 사용하여 한국어로 번역 및 정제하여 KoDROP (Korean DROP, KoDROP) 데이터셋을 구축하였다. 단락 및 질의를 참조하여 연산을 수행하기 위한 의미 태그를 한국어 KoBERT 및 KoELECTRA에 접목하여, 숫자 인식이 가능한 KoNABERT, KoNAELECTRA 모델을 생성하였다. 실험 결과, KoDROP 데이터셋은 기존 기계 독해 데이터셋과 비교하여 단락에 대한 더욱 포괄적인 이해와 연산 정보를 요구하였으며, 가장 높은 성능을 기록한 KoNAELECTRA는 KoBERT과 비교하여 F1, EM에서 모두 19.20의 월등한 성능 향상을 보였다.

  • PDF

세조의 원각사13층석탑 건립과 그 의미체계 (King Sejo's Establishment of the Thirteen-story Stone Pagoda of Wongaksa Temple and Its Semantics)

  • 남동신
    • 미술자료
    • /
    • 제101권
    • /
    • pp.12-46
    • /
    • 2022
  • 1467년에 완성된 원각사13층석탑은 한국 역사상 최후의 호불군주에 의한 최후의 도성불탑이다. 필자는 세조가 즉위 10년을 맞이하여 도성(都城) 중심부에 13층석탑을 세우고 탑에 석가사리(釋迦舍利)와 함께 '신역원각경(新譯圓覺經)'을 봉안한 뜻을 세조의 관점에 입각하여 살펴보았다. 머리말에 이어 제II장에서는 13층탑의 경전적 배경을 다각도로 고찰하였다. 특히 필자는 13층탑 건립의 직접적인 소의경전으로서 『대반열반경후분(大般涅槃經後分)』을 최초로 발굴하고, 이 경전이 7세기 후반 중부 자바에서 번역되고 동아시아에 유통된 사실을 추적하였다. 아울러 13층탑의 기원으로서 이른바 카니시카양식의 탑을 주목하고 동아시아와 한국에서의 13층탑 조성 사례를 개관하였다. 그리고 불교문헌을 탐색하여 '13층'이 깨달음[Buddha]으로 나아가는 수행 단계를 상징함을 입증하였다. 확실히 '13'은 불교도에게는 매우 특별하면서도 신성한 숫자라 할 수 있다. 이어서 제III장에서는 세조의 원각사13층탑 건립의 불교적 정치적 함의를 탐색하였다. 불교적 함의와 관련해서는, 세조가 중국에서 직접 구입하여 조선에 최초로 유통시킨 『번역명의집(翻譯名義集)』과, 그가 최초의 한글 번역에 직접 개입한 『원각경(圓覺經)』에 주목하였다. 『번역명의집』은 14세기에 출현한 일종의 불교용어집인데, 세조는 원각사탑을 창건할 무렵 이 문헌을 통하여 13층탑의 소의경전인 『대반열반경후분』을 알았을 것으로 추론하였다. 한편 세조는 대장경 전체를 상징하는 단일경전으로 '신역 원각경'을 원각사탑에 봉안하였는데, 이것이 바로 그가 최초의 한글 번역에 깊이 관여한 『원각경언해』였다. 아울러 『원각경언해』의 저본은 지금까지 알려진 것과 달리 종밀(宗密)의 『원각경략소(圓覺經略疏)』임을 밝혔다. 원각사탑 건립의 정치적 함의와 관련해서는, 조선 초 왕실의 능사(陵寺)(또는 진전사원(眞殿寺院))에 세워진 석탑-경천사13층석탑(敬天寺13層石塔), 개경사석탑(開慶寺石塔), 연경사석탑(衍慶寺石塔), 신륵사다층석탑(神勒寺多層石塔)-들을 비교 검토하였다. 그 결과 세조가 자신의 왕위계승에 정당성을 부여하기 위하여 정치적 상징으로서 원각사13층석탑을 건립하였다는 결론에 도달하였다. 본고에서 필자는 13층탑으로서의 원각사탑의 의미체계를 온전히 파악하고자 하였다. 이러한 시도는 여말선초 정점에 달한 불탑 문화를 이해할 뿐 아니라, 카니시카대탑에서 기원하고 『대반열반경후분』에 근거하는 동아시아의 13층탑을 연구하는 데 한국적 연구모델로서 기여하리라 기대된다.