• 제목/요약/키워드: 대용화

검색결과 1,126건 처리시간 0.027초

통합된 비디오 인덱싱 방법을 이용한 내용기반 비디오 데이타베이스의 설계 및 구현 (Design and Implementation of Content-based Video Database using an Integrated Video Indexing Method)

  • 이태동;김민구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권6호
    • /
    • pp.661-683
    • /
    • 2001
  • 오늘날 멀티미디어 정보의 양이 매우 빠른 속도로 증가함에 따라 비디오 데이타베이스에 대한 효율적인 관리는 더욱 중요한 의미를 가지게 되었다. 그리고 초고속 정보통신망과 디지털 기술의 발전은 비디오 데이타를 통신 및 컴퓨터와 결합하여 새로운 멀티미디어로 발전하고 있으며, 인터넷 방송, 주문형 비디오(VOD) 등에 크게 활용하고 있다. 비디오는 대용량적인 특성과 비정형적인 특성을 가지고 있으므로 신속하고 효율적으로 비디오를 검색하기 위해 비디오의 정확한 특징정보를 추출하여 비디어 데이타베이스를 구축하여야 한다. 비디오 데이타베이스는 텍스트 기반의 전통 데이타베이스와는 다른 모델링 방법과 검색방법을 사용한다. 따라서, 비디오 데이타베이스에서의 검색속도와 정확도를 향상시키기 위해서는 새로운 비디오 데이타베이스 생성기법과 효율적인 검색기법이 필요하다. 본 논문에서는 비디오의 의미적 구조와 사전 제작지식정보를 구조적으로 축적할 수 있는 내용기반 비디오 데이타베이스의 구축 방안과 생성기법을 제시하였다. 그리고 제안된 비디오 데이타베이스의 구축 방안과 생성기법을 사용하여 새로운 인터넷 방송 프로그램 컨텐츠 제작에 활용할 수 있는 비디오 데이타베이스를 구현하였다. 이를 위해 비디오 분할과 대표키 프레임 추출 시 비디오의 의미적 구조와 사전 제작지식정보의 상호관계를 기반으로 하여 비디오 데이타의 특징정보를 추출하고, 검색할 수 있도록 주석기반 검색과 내용기반 검색을 통합한 비디오 인덱싱 방법을 제시하였다. 통합된 비디오 인덱싱 방법은 비디오의 하위 레벨에 표현된 내용기반 메타데이타 유형과 비디오의 특징정보 추출이 어려운 상위 레벨에 표현된 주석기반 메타데이타 유형을 동시에 이용하므로 컨텐츠 검색의 성능을 향상시킬 수 있다. 마지막으로 본 논문에서 제시한 비디오 데이타베이스는 비디오의 의미적 구조와 사전 제작지식정보를 구조적으로 축적하여 데이타베이스를 구축하므로 정확한 인터넷 방송 컨텐츠 정보의 축적관리와 구축작업의 효율화가 가능하며, 또한 인터넷 방송 컨텐츠 제작 시 정보공유 및 재이용이 가능하므로 새로운 컨텐츠 제작의 효율성을 높일 수 있다.

  • PDF

재활용원료의 첨가량과 입경에 따른 재생 ${Al_2}{O_3}$ 세라믹스의 소결 특성 (Sintering Properties of Renewed ${Al_2}{O_3}$Ceramics with Particle Size and Addition Amount of Recycling Powder)

  • 신대용;한상목;김경남
    • 한국세라믹학회지
    • /
    • 제38권12호
    • /
    • pp.1123-1131
    • /
    • 2001
  • 재활용 $Al_2$O$_3$분말인 구조재료용 $Al_2$O$_3$세라믹스의 분쇄분말과 폐Al$_2$O$_3$흡착제의 첨가량과 입경에 따른 재생 $Al_2$O$_3$세라믹스의 소결특성을 조사하였다. 1,$650^{\circ}C$에서 5시간 소결한 순수 $Al_2$O$_3$시편을 급랭하여 분쇄한 -40과 +40$\mu$m의 $Al_2$O$_3$분말과 폐Al$_2$O$_3$흡착제를 순수한 $Al_2$O$_3$분말에 10~50wt% 첨가한 후, 재소결하여 재생 $Al_2$O$_3$세라믹스를 제조하였다. 재활용 $Al_2$O$_3$분말의 첨가량과 입경에 관계없이 소결온도가 증가함에 따라 시편의 밀도와 3점곡강도는 증가하였으나, 동일 소결온도에서는 재활용 $Al_2$O$_3$분말의 첨가량이 증가함에 따라 밀도와 3점곡강도는 감소하였다. ~30wt%의 $Al_2$O$_3$분쇄분말(-40$\mu$m), ~20wt%의 $Al_2$O$_3$분쇄분말(+40$\mu$m) 및 10wt%의 폐Al$_2$O$_3$흡착제를 첨가한 시편의 3점곡강도는 200MPa 이상이었다. 재생 $Al_2$O$_3$시편의 치밀화를 위하여 5~20wt%의 폐유리분말을 첨가하여 1200~1$650^{\circ}C$에서 5시간 소결한 시편은 폐유리분말의 첨가량이 증가함에 따라 최대 밀도와 3점곡강도를 나타내는 온도는 감소하였으나, 140$0^{\circ}C$이상에서는 페유리분말을 첨가하지 않은 시편에 비하여 밀도와 3점곡강도가 감소하여 재생 $Al_2$O$_3$세라믹스의 소결성 향상에는 기여하지 못하였다.

  • PDF

중장년층 일자리 요구사항 분석 및 인력 고용 매칭 시스템 개발 (Job Preference Analysis and Job Matching System Development for the Middle Aged Class)

  • 김성찬;장진철;김성중;진효진;이문용
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.247-264
    • /
    • 2016
  • 저출산 및 인구 고령화가 가속화되면서, 중장년 퇴직자 등 노동 소외 계층의 취업난 해결은 우리 사회의 핵심 과제로 등장하고 있다. 온라인에는 수많은 일자리 요구 정보가 산재해 있으나, 이를 중장년 구직자에게 제대로 매칭시키지는 못하고 있다. 워크넷 취업 로그에 따르면 구직자가 선호하는 직종에 취업하는 경우는 약 24%에 불과하다. 그러므로, 이러한 문제를 극복하기 위해서는 구직자에게 일자리 정보를 매칭시킬 때 선호하는 직종과 유사한 직종들을 추천하는 소프트 매칭 기법이 필수적이다. 본 연구는 중장년층에 특화된 소프트 직업 매칭 알고리즘과 서비스를 고안하고 개발하여 제공하는 것을 목표로 한다. 이를 위하여 본 연구에서는 1) 대용량의 구직 활동 기록인 워크넷 로그로부터 중장년층의 일자리 특성 및 요구 추세를 분석하였다. 2) 중장년층의 일자리 추천을 위해 직종 유사도 기준으로 일자리 분류표(KOCM)를 재정렬하였다. 이 결과를 이용하여, 3) 중장년에 특화된 인력 고용 소프트 매칭 직업 추천 알고리즘(MOMA)을 개발하여 구인 구직 웹사이트에 적용하였다. 자체 저작한 중장년층 특화 일자리 분류표(KOCM)를 이용한 소프트 일자리 매칭 시스템의 정확도를 측정하였을 때, 실제 고용 결과 기준, 하드 매칭 대비 약 20여 배의 성능 향상을 보였다. 본 연구내용을 적용하여 개발한 중장년층 특화 구직 사이트는 중장년층의 구직 과정에서 입력 정보 부담을 최소화하고 소프트 매칭을 통해 사용자의 요구직종에 적합한 일자리를 정확하고 폭넓게 추천함으로 중장년층의 삶의 질 향상에 기여할 수 있을 것으로 기대된다.

함습공기를 이용한 고발열량 도시폐기물 소각로의 효율적 운전을 위한 수치 해석적 연구 (A Numerical Study for Effective Operation of MSW Incinerator for Waste of High Heating Value by the Addition of Moisture Air)

  • 신미수;신나라;장동순
    • 대한환경공학회지
    • /
    • 제35권2호
    • /
    • pp.115-123
    • /
    • 2013
  • 도시폐기물 소각로는 일반적으로 전처리 설비가 필요 없고 대용량에 적합한 스토커타입의 소각로를 많이 사용하고 있다. 그러나 음식물 쓰레기의 직매립 금지 등에 따라 반입폐기물의 가연분이 증가하고 수분함량이 감소되어 폐기물의 발열량이 소각로 설치 초기에 비해 매우 증가하고 있는 실정이다. 이에 소각로 열부하의 증가에 따라 소각량 감소와 가동률 저하 등 소각로 운영에 어려움을 겪고 있다. 본 연구는 D시의 소각로를 대상으로 하여 소각량과 함습공기 양등 중요 변수에 따른 NO 모델을 포함한 난류반응 유동에 대한 일련의 전산해석을 수행하여 기초 자료를 축적하고 그것을 바탕으로 최근 도시 폐기물의 고 발열량화에 따른 문제점 및 해결방안에 대한 연구를 수행하였다. 이에 따라 운전조건 등을 최적화하여 기존의 운전시설의 활용을 극대화 하고자 하였다. 폐기물의 소각량을 저감하지 않고 고발열량화의 문제를 해결할 수 있는 실질적인 방법으로 연소용 공기에 수분의 양을 10%와 20%로 증가시키며 가습공기를 주입하는 방안을 검토하였다. 그 결과 연소공기의 비열증가와 상변화 등에 의하여 최대 화염온도의 감소가 발생하여 전반적인 소각로 내부의 온도가 낮아지는 것으로 나타났으며 그에 따라 NOx 발생량이 실질적으로 감소되는 것으로 나타났다. 특히 가습공기 20%주입시 기존에 설치되어 있는 SNCR 설비의 환원제 주입구 위치가 대부분 SNCR 반응에 적합한 온도 영역으로 나타나서 현재 고발열량 문제로 전혀 가동하지 못하고 있는 SNCR 설비의 재가동을 고려해 볼 수 있을 것으로 판단된다.

조경식물 파초(Musa basjoo) 식재 양상과 그 의미 - 조선시대 옛 그림 분석을 중심으로 - (Aspects and Significance of Musa basjoo, a Landscaping Plant - Focused on Analysis of Old Paintings of Chosun Dynasty -)

  • 노재현;김영숙;고여빈
    • 한국전통조경학회지
    • /
    • 제28권2호
    • /
    • pp.23-36
    • /
    • 2010
  • 파초의 상징적 의미와 이미지 그리고 식재 의미를 개관하는 한편 총 77엽의 조선시대 옛 그림 속 파초의 식재경향과 식재위치 그리고 파초가 등장하는 도엽의 특성을 분석함으로써 파초 식재의 양상과 그 의미를 추찰(推察)할 목적으로 시도된 본 연구의 결과는 다음과 같다. 파초는 기다림과 별리(別離), 미인 등의 꽃말뿐만 아니라 부귀와 기사회생(起死回生)을 상징하는 대용물이었으며, 도교적 의미로는 선인(仙人)의 풍취를 자아내는 대상이었다. 또한 불교적 언어로는 덧없는 인간사로부터 벗어나기 위한 탈속(脫俗)의 상징물이기도 하였다. 정원풍속도 및 고사인물도 또는 계회도에 빈번히 등장하는 파초는 탈속적 정취를 높이고 선비들의 아회(雅會)를 품격화하기 위한 소도구이며 장치로 보이는 바, 학과 사슴의 등장빈도가 높음은 이러한 경향을 반증한다. 또한 평생도(平生圖), 성시도(城市圖), 경직도(耕織圖) 등 특정 도상 속 파초의 의미는 부귀와 번영을 염원한 것으로 보이며, 사찰에 심겨진 파초는 인간사의 무상함을 환기시키는 탈속적 의미와 함께 '믿음의 구법'을 염원하는 의미도 함께 담고 있는 것으로 보인다. 더불어 파초 식재를 통한 기대 효과로 '비가 내릴 때 파초 잎을 울리는 소리경관'의 체험을 추구하고자 한 것으로 보이는데, 이는 넓은 잎을 지닌 (벽)오동나무 또한 가옥 근처에 파초와 같이 빈번히 발견됨에서도 확인된다. 한편, 파초의 식재장소는 주로 사랑채를 중심으로 한 전정이나 측정에 주로 단식이나 모아 심기한 것으로 보이며, 건물 내 파초 식재 위치는 우(雨)경관의 청음(聽音)이 용이한 침실 근방이었던 것으로 보인다. 그리고 파초와 같이 등장하는 괴석 또는 암석의 표현은 일종의 의경(意景) 구축의 수단이며, 아취 있는 완상(玩賞)을 위한 소재 조합의 산물로 보인다. 또한 옛 그림 속 등장인물은 주연의 경우, 풍류 등 선비활동과 관련이 높았으며, 조연의 주요 행위는 생활활동이 압도적으로 높게 나타났다. 조선조 17 18세기 파초는 아취 있는 정원의 구성과 묘사를 위한 긴요한 상징물이었다. 파초 식재문화는 선비들의 수양론적 의미대상이기도 하였다. 우경적(雨景的) 이미지 제공 및 자강불식(自彊不息)과 기사회생의 정신을 담았던 조선조 선비문화의 퇴조와 함께 파초는 우리나라 도시공간에서도 그 궤적을 같이 하여 퇴락한 것으로 추정된다.

지상파 UHD 콘텐츠 전송 스케줄러 설계 및 구현 (Design and Implementation of Transmission Scheduler for Terrestrial UHD Contents)

  • 백종호;서민재;유경아
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.118-131
    • /
    • 2019
  • 대용량의 8K UHD(Ultra High Definition) 콘텐츠를 지상파 방송으로 제공하기 위해서는 현 지상파 방송 시스템으로는 제한된 대역폭 등 여러 문제점이 있다. 이러한 문제점을 해결하기 위해 UHD 콘텐츠 전송 기술이 연구되었고, 그 중 하나로 지상파 방송망과 통신망을 이용한 8K UHD 방송 시스템이 제안되었다. 해당 기술은 8K UHD 콘텐츠를 영역 분할한 후 계층 분리를 통해 이종망으로 전송하여 지상파 방송망의 제한된 대역폭 문제를 해결하고자 하였다. 지상파 방송망을 통해 FHD(Full High Definition)에 해당하는 기본 계층과 4K UHD를 위한 부가 향상 계층 데이터를 전송하고, 통신망으로 8K UHD를 위한 부가 향상 계층 데이터를 전송한다. 이러한 방식으로 8K 콘텐츠를 제공할 경우, 지상파로는 최대 4K UHD 방송을 수신 할 수 있고 통신망을 추가로 이용할 경우 8K UHD까지 수신가능하다. 그러나 현재 국내 지상파 UHD 방송의 할당된 비트율 내에서 4K UHD 콘텐츠를 전송하기 위해서는 압축율을 높여 전송하는 상황도 존재하여 일정 수준의 화질열화는 필연적으로 발생한다. 그럼에도 UHD 콘텐츠의 특성상, 화질은어떤 요소보다 최우선적으로 고려되어야 하므로 제한된 비트율 내에서도 화질을 최대한 보장할 수 있어야 한다. 이를 위해서는 방송 시스템 내의 콘텐츠 생성기의 패킷 스케줄링이 필요하다. 콘텐츠 생성기는 방송망과 통신망을 이용한 8K UHD 방송 시스템내에서 인코딩된 미디어 데이터들을 패킷화하고 다중화기로 송출하는 기능을 수행한다. 다중화기는 콘텐츠 생성기로부터 전달받은 패킷 순서대로 송출하기 때문에 콘텐츠 생성기에서 다중화기로 전송하는 과정의 전송 시간과 전송률을 일정하고 정확하게 하는 것이 매우 중요하다. 따라서 본 논문에서는 일정 수준의 UHD 콘텐츠의 화질을 보장할 수 있도록 콘텐츠 생성기와 다중화기 간의 데이터 전송량 가변 전송 스케줄러를 제안한다. 이를 통해 UHD 방송 콘텐츠 종류에 관계없이 일정 수준의 화질을 보장하면서도 UHD 서비스의 끊김이나 지연을 최소화하여 사용자의 QoS(Quality of Service)를 향상시키고자 한다.

궁중의 의례와 음악의 중개자, 협률랑(協律郞) (Hyupryulrang(協律郞), the Mediator of Royal Ceremonies and Music)

  • 이정희
    • 공연문화연구
    • /
    • 제33호
    • /
    • pp.329-354
    • /
    • 2016
  • 협률랑(協律郞)은 궁중에서 의례(儀禮)를 행할 때 음악의 연주와 정지시점을 알려주던 직책이다. 유교의 영향을 받아 궁중에 오례(五禮) 체제로 범주화 되고 실행되면서부터 협률랑의 존재가 드러난다. 유가에서는 예(禮)와 악(樂)을 중시했고 이와 같은 흐름이 궁중 오례(五禮)로 연계되어 주요의례에 음악이 수반되었기 때문에, 궁중 의례의 진행 상황에 따라 음악의 삽입 여부를 알려줄 매개자가 요청되는 실정이었다. 궁중의 의례와 음악의 조화로운 구현을 위해 협률랑은 필수불가결한 존재였던 것이다. 우리나라에서는 협률랑이 고려시대부터 등장하며 조선시대에도 지속적으로 존재하였다. 조선시대의 협률랑은 봉상시(奉常寺)에서 전담되다가 전악(典樂)에게 잠시 일임된 적도 있었지만 최종적으로는 장악원(掌樂院) 관원이 맡는 것으로 규정되었다. 장악원 관원 중에서도 주로 장악원 정(掌樂院 正)이 그 역할을 수행했지만, 장악원 첨정(僉正)과 장악원 주부(主簿)도 현실적인 여건에 따라 수시로 차출되곤 하였다. 장악원 정, 첨정, 주부 등 역대 협률랑 역임자들의 공통 사항은 모두 당하관(堂下官)이었다는 점이었다. 당하관은 정책 결정에 참여하지 못하는 근본적인 한계를 지닌 관료였으며, 권한이 미약했던 실무자였다. 이는 궁중 행사에 동원되었던 많은 이들이 맡았던 각각의 다양한 직책 중 협률랑이 궁중의례에서 점하던 위상을 드러낸다. 한편 의례 집행 여건이나 의례 자체의 성격에 따라 장악원 관원 대신 계라선전관(啓螺宣傳官), 무신겸선전관(武臣兼宣傳官), 여집사(女執事) 등도 협률랑으로 유연하게 활용되어 의례와 음악 집행에 흠결사항이 없도록 조치되었다. 협률랑의 활동은 악대가 수반된 대부분의 의례에서 휘를 세우거나 눕히는 행동으로 압축된다. 휘는 깃발의 하나로, 성곽 영토 지역 등을 표시하던 시각 장치의 일종인데, 사냥할 때나 군대에서는 진퇴를 알리는 신호 체계로도 사용되다가, 의례와 음악을 조율하는 용도로까지 그 쓰임이 확장되었다. 그런데 밤에는 휘가 보이지 않으므로 조촉(照燭)으로 대신하거나, 때로는 금고기(金鼓旗)를 대용품으로 쓰기도 하였다. 그리고 협률랑의 명칭은 궁중연향의 경우 의물의 명칭을 빌려와 거휘차비, 조촉차비로 기록되기도 하였다. 협률랑의 자리는 서계(西階) 위 서쪽 가까이 동향(東向)한 상태로 배치되었는데, 의례 집행 장면이 잘 보이면서 악대와 가까운 지점이었다. 그 역할의 특성을 고려하여 의례의 공간과 음악의 공간이 함께 파악되는 위치에 배치되었다. 또한 행사를 대비한 예행 연습, 습악(習樂), 악대 배치, 음악 연주 속도 조절, 악곡(樂曲) 누락 방지 등 의례와 연계된 음악적 부분까지 관여하고, 그 직무를 책임지는 역할을 감내했다. 이러한 역할 수행 과정에는 전악(典樂)과의 협업 지점이 드러나기도 하는데, 장악원의 조화로운 운영을 위해 장악원 소속 관료와 악인이 함께 노력했던 상황이 투영된 것이다. 의례 절차에 맞게 음악 연주를 챙겨야 했던 협률랑은 궁중의 의례와 음악을 연결해주는 중개자였다.

화력발전소 배출 바닥재의 불포화대와 포화대 침투과정과 물리화학적 영향에 대한 연구 (A Study on Infiltration Process and Physicochemical Influence in the Unsaturated and the Saturated Zone of the Bottom Ashes from Thermal Power Plant)

  • 박병학;전원탁;하승욱;김용철;최한나
    • 자원환경지질
    • /
    • 제55권1호
    • /
    • pp.97-109
    • /
    • 2022
  • 화력발전소 연소부산물로 형성된 바닥재와 바이오차는 건식 매립 시 강수와 혼합되어 토양 하부로 침투할 가능성이 있다. 이 연구에서는 강수와 혼합된 바닥재 성분이 토양 및 지하수 환경에 미칠 수 있는 물리화학적 영향을 예측하고자 하였다. 아이스 칼럼 및 침투실험을 통해 미립자인 바닥재는 대부분 증류수에 용해되어 토출구로 배수되나, 바이오차(숯가루)는 매질에 여과되는 것을 시각적으로 관찰하였다. 칼럼 실험 용출액의 이온 분석(Al, As, Cu, Cd, Cr, Pb, Fe, Mn, Ca, K, Si, F, NO3, SO4) 결과, 숯가루 충진 칼럼은 K가 상당히 높은 농도(0.5 cm 충진 시 19.8 mg·L-1, 1 cm 충진 시 126 mg·L-1)로 검출되었으나 시간에 따라 점차 농도가 감소하였다. Al과 Ca는 미량으로 검출되었으나 시간에 따라 농도가 상승하는 것이 관찰되었다. 바닥재 충진 칼럼은 실험 초기부터 Ca와 SO4가 고농도로 검출되었으며 24시간 동안 각각 30 mg·L-1, 67 mg·L-1가 감소하였다. 연구 결과에 근거하여, 투수성이 좋고 포화대가 지표에 가까운 토양의 경우 오랜 시간 강수가 지속된다면, 상당량의 바닥재는 강수와 혼합되어 지하수면 아래로 침투할 수 있을 것으로 예상된다. 그러나 바이오차는 불포화대에서 걸러지며, 포화대에 도달하여도 지하수에 녹지 않아 직접적인 오염을 일으킬 가능성은 낮다고 여겨진다. 바닥재와 바이오차의 침투에 의한 토양 및 지하수 환경의 교란은 자연적 완충작용에 의해 보완되나, 실제 매립지는 대용량 고농도의 매질과 반응이 이뤄지므로 일반화를 위해서는 더욱 큰 규모의 연구가 필요할 것이다.

전문어의 범용 공간 매핑을 위한 비선형 벡터 정렬 방법론 (Nonlinear Vector Alignment Methodology for Mapping Domain-Specific Terminology into General Space)

  • 김준우;윤병호;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.127-146
    • /
    • 2022
  • 최근 워드 임베딩이 딥러닝 기반 자연어 처리를 다루는 다양한 업무에서 우수한 성능을 나타내면서, 단어, 문장, 그리고 문서 임베딩의 고도화 및 활용에 대한 연구가 활발하게 이루어지고 있다. 예를 들어 교차 언어 전이는 서로 다른 언어 간의 의미적 교환을 가능하게 하는 분야로, 임베딩 모델의 발전과 동시에 성장하고 있다. 또한 핵심 기술인 벡터 정렬(Vector Alignment)은 임베딩 기반 다양한 분석에 적용될 수 있다는 기대에 힘입어 학계의 관심이 더욱 높아지고 있다. 특히 벡터 정렬은 최근 수요가 높아지고 있는 분야간 매핑, 즉 대용량의 범용 문서로 학습된 사전학습 언어모델의 공간에 R&D, 의료, 법률 등 전문 분야의 어휘를 매핑하거나 이들 전문 분야간의 어휘를 매핑하기 위한 실마리를 제공할 수 있을 것으로 기대된다. 하지만 학계에서 주로 연구되어 온 선형 기반 벡터 정렬은 기본적으로 통계적 선형성을 가정하기 때문에, 본질적으로 상이한 형태의 벡터 공간을 기하학적으로 유사한 것으로 간주하는 가정으로 인해 정렬 과정에서 필연적인 왜곡을 야기한다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 데이터의 비선형성을 효과적으로 학습하는 딥러닝 기반 벡터 정렬 방법론을 제안한다. 제안 방법론은 서로 다른 공간에서 벡터로 표현된 전문어 임베딩을 범용어 임베딩 공간에 정렬하는 스킵연결 오토인코더와 회귀 모델의 순차별 학습으로 구성되며, 학습된 두 모델의 추론을 통해 전문 어휘를 범용어 공간에 정렬할 수 있다. 제안 방법론의 성능을 검증하기 위해 2011년부터 2020년까지 수행된 국가 R&D 과제 중 '보건의료' 분야의 문서 총 77,578건에 대한 실험을 수행한 결과, 제안 방법론이 기존의 선형 벡터 정렬에 비해 코사인 유사도 측면에서 우수한 성능을 나타냄을 확인하였다.

도메인 특수성이 도메인 특화 사전학습 언어모델의 성능에 미치는 영향 (The Effect of Domain Specificity on the Performance of Domain-Specific Pre-Trained Language Models)

  • 한민아;김윤하;김남규
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.251-273
    • /
    • 2022
  • 최근 텍스트 분석을 딥러닝에 적용한 연구가 꾸준히 이어지고 있으며, 특히 대용량의 데이터 셋을 학습한 사전학습 언어모델을 통해 단어의 의미를 파악하여 요약, 감정 분류 등의 태스크를 수행하려는 연구가 활발히 이루어지고 있다. 하지만 기존 사전학습 언어모델이 특정 도메인을 잘 이해하지 못한다는 한계를 나타냄에 따라, 최근 특정 도메인에 특화된 언어모델을 만들고자 하는 방향으로 연구의 흐름이 옮겨가고 있는 추세이다. 도메인 특화 추가 사전학습 언어모델은 특정 도메인의 지식을 모델이 더 잘 이해할 수 있게 하여, 해당 분야의 다양한 태스크에서 성능 향상을 가져왔다. 하지만 도메인 특화 추가 사전학습은 해당 도메인의 말뭉치 데이터를 확보하기 위해 많은 비용이 소요될 뿐 아니라, 고성능 컴퓨팅 자원과 개발 인력 등의 측면에서도 많은 비용과 시간이 투입되어야 한다는 부담이 있다. 아울러 일부 도메인에서 추가 사전학습 후의 성능 개선이 미미하다는 사례가 보고됨에 따라, 성능 개선 여부가 확실하지 않은 상태에서 도메인 특화 추가 사전학습 모델의 개발에 막대한 비용을 투입해야 하는지 여부에 대해 판단이 어려운 상황이다. 이러한 상황에도 불구하고 최근 각 도메인의 성능 개선 자체에 초점을 둔 추가 사전학습 연구는 다양한 분야에서 수행되고 있지만, 추가 사전학습을 통한 성능 개선에 영향을 미치는 도메인의 특성을 규명하기 위한 연구는 거의 이루어지지 않고 있다. 본 논문에서는 이러한 한계를 극복하기 위해, 실제로 추가 사전학습을 수행하기 전에 추가 사전학습을 통한 해당 도메인의 성능 개선 정도를 선제적으로 확인할 수 있는 방안을 제시한다. 구체적으로 3개의 도메인을 분석 대상 도메인으로 선정한 후, 각 도메인에서의 추가 사전학습을 통한 분류 정확도 상승 폭을 측정한다. 또한 각 도메인에서 사용된 주요 단어들의 정규화된 빈도를 기반으로 해당 도메인의 특수성을 측정하는 지표를 새롭게 개발하여 제시한다. 사전학습 언어모델과 3개 도메인의 도메인 특화 사전학습 언어모델을 사용한 분류 태스크 실험을 통해, 도메인 특수성 지표가 높을수록 추가 사전학습을 통한 성능 개선 폭이 높음을 확인하였다.