• 제목/요약/키워드: Geometrically similar

검색결과 53건 처리시간 0.019초

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.

전문어의 범용 공간 매핑을 위한 비선형 벡터 정렬 방법론 (Nonlinear Vector Alignment Methodology for Mapping Domain-Specific Terminology into General Space)

  • 김준우;윤병호;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.127-146
    • /
    • 2022
  • 최근 워드 임베딩이 딥러닝 기반 자연어 처리를 다루는 다양한 업무에서 우수한 성능을 나타내면서, 단어, 문장, 그리고 문서 임베딩의 고도화 및 활용에 대한 연구가 활발하게 이루어지고 있다. 예를 들어 교차 언어 전이는 서로 다른 언어 간의 의미적 교환을 가능하게 하는 분야로, 임베딩 모델의 발전과 동시에 성장하고 있다. 또한 핵심 기술인 벡터 정렬(Vector Alignment)은 임베딩 기반 다양한 분석에 적용될 수 있다는 기대에 힘입어 학계의 관심이 더욱 높아지고 있다. 특히 벡터 정렬은 최근 수요가 높아지고 있는 분야간 매핑, 즉 대용량의 범용 문서로 학습된 사전학습 언어모델의 공간에 R&D, 의료, 법률 등 전문 분야의 어휘를 매핑하거나 이들 전문 분야간의 어휘를 매핑하기 위한 실마리를 제공할 수 있을 것으로 기대된다. 하지만 학계에서 주로 연구되어 온 선형 기반 벡터 정렬은 기본적으로 통계적 선형성을 가정하기 때문에, 본질적으로 상이한 형태의 벡터 공간을 기하학적으로 유사한 것으로 간주하는 가정으로 인해 정렬 과정에서 필연적인 왜곡을 야기한다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 데이터의 비선형성을 효과적으로 학습하는 딥러닝 기반 벡터 정렬 방법론을 제안한다. 제안 방법론은 서로 다른 공간에서 벡터로 표현된 전문어 임베딩을 범용어 임베딩 공간에 정렬하는 스킵연결 오토인코더와 회귀 모델의 순차별 학습으로 구성되며, 학습된 두 모델의 추론을 통해 전문 어휘를 범용어 공간에 정렬할 수 있다. 제안 방법론의 성능을 검증하기 위해 2011년부터 2020년까지 수행된 국가 R&D 과제 중 '보건의료' 분야의 문서 총 77,578건에 대한 실험을 수행한 결과, 제안 방법론이 기존의 선형 벡터 정렬에 비해 코사인 유사도 측면에서 우수한 성능을 나타냄을 확인하였다.

1788년 김응환의 봉명사경과 《해악전도첩(海嶽全圖帖)》 (Kim Eung-hwan's Official Excursion for Drawing Scenic Spots in 1788 and his Album of Complete Views of Seas and Mountains)

  • 오다연
    • 미술자료
    • /
    • 제96권
    • /
    • pp.54-88
    • /
    • 2019
  • 《해악전도첩(海嶽全圖帖)》은 금강산과 해금강, 관동팔경을 그린 60점의 실경산수화와 51편의 기문(記文)으로 이루어진 화첩으로 규모와 화풍에 있어 보기 드문 작품이다. 그림의 특징은 화면을 가득 채운 구성과 남종화풍을 따르면서도 거칠고 파격적인 화법, 산석(山石)의 기하학적이고 입체적인 표현 등이다. 1973년의 특별전, '한국미술이천년(韓國美術二千年)'을 처음으로 화첩의 일부만 공개되었던 작품은 2019년 국립중앙박물관 특별전 '우리 강산을 그리다: 화가의 시선, 조선시대 실경산수화'에서 그 전모가 공개되었다. 《해악전도첩》이 김응환(金應煥)(1742~1789)의 작품으로 알려진 것은 화첩의 마지막 장에 쓰여진 관지(款識)와 현재 행방이 묘연한 <칠보대>에 찍힌 '복헌'이라는 도장 때문이었다. 그러나 김응환을 지시하는 관지와 도장은 모두 후대에 더해졌을 가능성이 크다. 본 연구는 화첩을 둘러싼 여러 요소를 고찰하여 제작자를 재검토하는 것을 목적으로 한다. 《해악전도첩》 제작 배경을 이해하기 위해 먼저 18세기 금강산 기행사경도의 전통과 봉명사경을 살펴보았다. 정선(鄭敾)(1676~1759)의 《신묘년풍악도첩(辛卯年楓嶽圖)帖》(1711)을 비롯하여 심사정(沈師正)(1707~1769), 김윤겸(金允謙)(1711~1775), 최북(崔北)(1712~1786 이후), 강세황(姜世晃)(1713~1791) 등은 조선 후기 최고의 여행지였던 금강산을 유람하고 기행사경도를 제작하였다. 화가들은 이전의 전통을 계승하여 내금강의 명승명소를 주로 그렸고, 자신들이 경험한 장소를 새롭게 시각화하였다. 이러한 기행사경도는 여행을 기념하며 동행자나 후원자를 위해 여러 장면을 담을 수 있는 화첩 형식으로 제작되었다. 개별적인 금강산 기행사 경도의 제작이 증가하는 가운데 1788년에 정조(正祖)(재위 1776~1800)가 도화서 화원인 김응환과 김홍도(金弘道)(1745~1806 이후)에게 영동9군과 금강산의 명승(名勝)을 그려오도록 명한 일은 공적 업무였다. 정조는 이들의 관계 및 지방관으로서의 경력, 서로 다른 화풍 등을 고려해 봉명사경의 화원으로 선발하였다. 김응환과 김홍도는 영조(英祖)(재위 1724~1776)조부터 도화서 화원으로 활동하며 선후배이자 동료로서 친밀한 관계를 유지했다. 나아가 이들은 영남 지역의 찰방(察訪)으로서 지방관의 업무를 수행한 경험이 있었다. 두 화원의 화풍은 서로 달라 김홍도는 부드럽고도 섬세하게 필선을 운용한 반면, 김응환은 굳세면서도 울창한 풍치를 잘 표현했다. 두 명의 화원은 각자의 개성으로 봉명사경 기간 동안 100여 폭의 초본을 그렸고, 이를 선별하여 60~70여 폭의 화첩 혹은 두루마리를 완성하였다. 이들의 그림은 18세기 전중반에 내금강과 관동팔경 위주로 제작된 금강산 기행사경도의 전통을 더욱 풍부하게 했고 영동과 외금강의 명승명소를 새롭게 발견하며 소재를 확장시켰다. 현재 《해악전도첩》은 원(元), 형(亨), 이(利), 정(貞) 4책으로 이루어졌는데, 원(元), 형(亨)책은 내금강의 그림 29점이며 이(利)책은 외금강의 장면 17점, 정(貞)책은 해금강과 관동팔경 14점으로 구성되었다. 비단 위에 그려진 각 그림은 기하학적으로 산석을 표현했으며, 연백으로 금강산의 암봉을 흰색 혹은 회청색으로 표현했다. 《해악전도첩》의 구도와 화법은 정선, 강세황, 심사정, 정충엽(鄭忠燁)(1725~1800 이후), 김응환, 김홍도의 화법과 비교할 수 있어 18세기 후반의 시대 양식을 갖는다. 특히 화첩의 일부 그림은 김홍도의 《해동명산도첩(海東名山圖帖)》(1788)과 구성 및 회화적 모티프가 매우 유사하여 두 화첩간의 연관성을 보여준다. 반면에 <영랑호>, <해산정>, <월송정> 등은 김홍도의 그림과는 구별된다. 이를 통해 화가가 김홍도와 영향을 주고받으면서도 자신만의 개성적인 화첩을 제작했음을 추측해 볼 수 있다. 《해악전도첩》에는 다른 화첩에는 등장하지 않는 <자운담>, <백운대>, <안문점망비로봉>, <백정봉> 등이 포함되어 있으며 각 장면마다 경물의 특징을 구체적이고 참신하게 묘사하였다. 특히, 화가는 산석을 기하학적으로 표현하고 선과 면을 도드라지게 하여 입체감을 강조하였다. 그는 남종화풍을 바탕으로 자신만의 화법을 확립했고 이를 자유자재로 운용하면서 화면에 동적인 리듬감을 부여했다. 이처럼 60점의 그림은 거칠고 파격적으로 보이지만 나름의 질서 안에서 일관성을 견지하고 있다. 본고는 화법과 봉명사경의 정황을 종합해 《해악전도첩》의 제작자를 김응환으로 추론하였다. 나아가 김하종(金夏鍾)(1793~1878 이후)의 《풍악권(楓嶽卷)》(1865년 이후)과의 친연성은 《해악전도첩》의 화가를 김응환으로 추정한 또 하나의 이유였다. 《해악전도첩》은 김홍도의 《해산첩》과는 달리 후대에 미친 영향력이 미비한데 김하종의 《풍악권》만이 《해악전도첩》의 소재와 화법을 따르고 있다. 김하종은 《풍악권》에서 50년 전, 춘천부사 이광문(李光文)(1778~1838)을 위해 제작한 《해산도첩》(1816)과는 전혀 다른 화법을 구사했다. 그는 김응환의 《해악전도첩》과 유사한 구성과 회화적 요소, 화보식 인물표현을 따르면서 사의적인 분위기를 강조하였다. 개성김씨의 일원이자 김응환의 종손인 김하종은 가문에 전해지는 《해악전도첩》류의 그림을 감상했고 이를 새롭게 번안했다고 추측된다. 화첩에 포함된 51편의 기문은 그림 다음 장에서 그려진 장소를 설명하고 있어 각 그림을 이해하고 감상하는 데 도움을 준다. 기문은 그림과 밀접한 관계를 가지며 앞의 장소로부터의 이동 정보, 이름의 유래, 지형적 특징, 관련 정보 등이 서술되었다. 이와 같은 백과사전식 혹은 지리지와 같은 기문은 19세기 전반에 나타나기 시작했으며, 금강산 화첩류에 더해졌다. 《해악전도첩》의 백화암 기문에는 1845년의 암자에 대한 중건 내용이 기록되어, 기문의 연대를 추정하는 중요한 근거가 되었다. 김하종에게 《풍악권》을 주문한 이유원(李裕元)(1814~1888)도 각 그림에 글을 붙였는데 이 글들은 김응환의 화첩에 포함된 기문 51편과 내용 및 서술방식이 흡사하다. 이유원의 기문은 《해악전도첩》의 기문이나 그 초고(원본)와 관련성이 높지만 두 화첩의 기문 필사의 선후관계를 판정하는 데에는 좀더 면밀한 검토가 필요하다. 《해악전도첩》은 김홍도의 봉명사경 초본 및 김홍도의 영향으로 제작된 19세기의 금강산 화첩과는 구별된다. 이 화첩은 화원 김응환의 회화세계를 이해할 수 있는 지평을 넓히고 18세기 후반 실경산수화의 또 다른 층위를 보여주고 있어 중요한 의미를 갖는다.