• 제목/요약/키워드: information classification

검색결과 8,303건 처리시간 0.048초

다중모형조합기법을 이용한 상품추천시스템 (Product Recommender Systems using Multi-Model Ensemble Techniques)

  • 이연정;김경재
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.39-54
    • /
    • 2013
  • 전자상거래의 폭발적 증가는 소비자에게 더 유리한 많은 구매 선택의 기회를 제공한다. 이러한 상황에서 자신의 구매의사결정에 대한 확신이 부족한 소비자들은 의사결정 절차를 간소화하고 효과적인 의사결정을 위해 추천을 받아들인다. 온라인 상점의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 그러나 사용자의 기호를 제대로 반영하지 못하는 추천시스템은 사용자의 실망과 시간낭비를 발생시킨다. 본 연구에서는 정확한 사용자의 기호 반영을 통한 추천기법의 정교화를 위해 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 본 연구에서 제안하는 모형은 크게 두 개의 단계로 이루어져 있으며, 첫 번째 단계에서는 상품군 별 우량고객 선정 규칙을 도출하기 위해서 로지스틱 회귀분석 모형, 의사결정나무 모형, 인공신경망 모형을 구축한 후 다중모형조합기법인 Bagging과 Bumping의 개념을 이용하여 세 가지 모형의 결과를 조합한다. 두 번째 단계에서는 상품군 별 연관관계에 관한 규칙을 추출하기 위하여 장바구니분석을 활용한다. 상기의 두 단계를 통하여 상품군 별로 구매가능성이 높은 우량고객을 선정하여 그 고객에게 관심을 가질만한 같은 상품군 또는 다른 상품군 내의 다른 상품을 추천하게 된다. 제안하는 상품추천시스템은 실제 운영 중인 온라인 상점인 'I아트샵'의 데이터를 이용하여 프로토타입을 구축하였고 실제 소비자에 대한 적용가능성을 확인하였다. 제안하는 모형의 유용성을 검증하기 위하여 제안 상품추천시스템의 추천과 임의 추천을 통한 추천의 결과를 사용자에게 제시하고 제안된 추천에 대한 만족도를 조사한 후 대응표본 T검정을 수행하였으며, 그 결과 사용자의 만족도를 유의하게 향상시키는 것으로 나타났다.

국내 메르스(MERS) 사태가 남긴 과제와 법률에 미친 영향에 대한 소고(小考) (The Study of Effectiveness of MERS on the Law and Remaining Task)

  • 윤종태
    • 의료법학
    • /
    • 제16권2호
    • /
    • pp.263-291
    • /
    • 2015
  • 2015년 5월 중동 사우디아라비아와 아랍에미레이트를 다녀온 68세의 남자가 고열, 근육통, 기침 호흡곤란으로 자택부근 2개 병원)과 삼성서울병원(SMC) 응급실을 거치면서 시작된 메르스(MERS)라는 전염병은 거의 3개월에 걸쳐 최근까지 대한민국을 유행성 전염병의 공포로 몰아넣었다. 특히 이 전염병은 중동지역 아라비아 반도를 중심으로 2012년 9월부터 현재까지 총 26개국에서 1,392명에게 발생하여, 538명의 사망환자가 보고(유럽질병센터, 2015.7.21. 기준)되었고, 우리나라의 경우에도 총 확진자 186명, 사망자 36명(치사율 19.4%) 격리자 16,693명이라는 기록을 남기고 점차 우리의 뇌리에서 사라져가고 있다. 이 전염병의 파급으로 인하여 현 정부의 전염병 관리체계에 대한 많은 비판과 문제점을 제기하는 계기가 되었다. 특히 병원내 감염문제, 민간의료기관-지역 보건소-질병관리본부를 연결하는 감염병 관리전달체계의 미작동, 정부의 전염병과 관련된 정보 공개 거부, 냉난방 공조설비의 환기 등과 관련된 시설문제, 감염병 격리병상의 절대부족 문제, 지역보건소의 기능 및 권한의 제한문제, 격리자 및 의료기관에 대한 보상문제, 제도적으로는 감염병에 대한 건강보험 수가 개선문제, 법정감염병 재분류 문제, 질병관리본부의 역할 재정립 문제, 전염병 관련 전문인력 양성을 위한 제도적 보완문제, 병원 이용문화의 개선으로서 다인실 조정과 간병인 대체문제, 사회적 후유증을 치유하기 위한 정책적 배려문제 등이 있으며, 이에 대한 광범위한 논의와 해결방안이 필요한 때이다. 국민들은 2015년 5월 이전에는 아주 낯설었던 메르스라는 외부유입 전염병에 국가 방역체계가 흔들리는 모습을 보고 극도의 공포감을 느꼈으며, 외국에서는 중동지방을 제외하고는 전세계적으로 유례가 없는 메르스라는 전염병이 대유행하는 대한민국에 발길을 끊었다. 국민의 건강권이 심각하게 위협받았음은 물론이고 관광산업과 유통업계 등의 경제도 얼어붙었다. 정부는 메르스라는 전염병 확산의 초기대응 실패를 인정하고, 사태를 악화시킨 점에 대한 책임을 통감하여야 한다. 국민들에 대한 신뢰상실을 반성하고 향후 각종 필요한 정보를 공개함으로써, 메르스와 같은 전염병에 대한 정부정책을 투명하게 집행하고, 지방자치단체와 국민들이 지역사회 감염에 대처하고 확산방지에 나설 수 있도록 제도를 개선하며, 변경된 제도를 홍보하여 전염병 전파 예방에 노력해야 할 것이다.

  • PDF

조선시대 고악보에 나타난 『만보전서(萬寶全書)』의 금도론(琴道論) (Manbojeonseo(萬寶全書) Geumdoron(琴道論) in the old scores of Joseon(朝鮮))

  • 최선아
    • 공연문화연구
    • /
    • 제20호
    • /
    • pp.251-307
    • /
    • 2010
  • "만보전서(萬寶全書)"는 명 청 시대에 걸쳐 여러 차례 간행된 일종의 백과사전으로 사서민(士庶民)의 일상생활에 유용한 정보를 담고 있다. 1720년 청나라를 방문한 조선의 사신단을 통해 조선으로 유입된 "만보전서"는 당시 사회에 유포되어 일상의 유용한 정보지로 혹은 개인문집의 참고서적으로 유행하고 있었다. 여기에는 금도론(琴道論)의 내용도 일목요연하게 정리되어 있어, 고악보에 금도론을 수록할 때 유용한 참고서로 이용될 수 있었다. 실제로 "한금신보"(1724)에 소개된 금도론 중 오불탄, 탄금수지, 태음기법은 그 출처에 대해 "만보전서"라는 점을 분명히 밝히고 있어 주목된다. 본고에서는 4종의 "만보전서"에 수록된 금도론의 순서와 내용을 비교해 보았다. 우선 다량의 금도론을 수록하고 있는 서기룡이 편집한 "만보전서(1610)"의 금학문(琴學門)과 유자명이 편집한 "만보전서(1612)"의 금학문의 항목을 비교 대조해 보았다. "만보전서(1610)"와 "만보전서(1612)"는 모든 면(page)마다 상(上)층 하(下)층으로 영역이 나뉘어 기록되었다. 금학문의 상층과 하층은 각각 4개의 상위 분류 항목을 가지고 있다. 상층이 하층에 비해 비교적 오래된 내용을 담고 있는 것으로 추정되는데, 상층이 이론적인 덕목 중심이라면 하층은 금(琴)을 실제로 연주할 때의 손의 사용법 및 노랫말과 감자보(減字譜)로 구성된 악보류가 중심이 된다. 즉 상층은 형이상학적인 내용이라면, 하층은 형이하학적인 내용으로 구성되었다고 하겠다. "만보전서(1610)"와 대조해서 "만보전서(1612)"의 금도론의 분류는 상위 항목을 지칭하는 명칭과 순서에서 일부 차이점이 발견된다. 이러한 차이는 금도론의 분류 체계에 보다 합리성을 갖추고자 하였기 때문에 나타난다. "만보전서(1614)"의 경우는 금도론의 내용이 동일한 편자가 편집한 "만보전서(1610)"에 비해 매우 소략해 졌으며, "만보전서(1739)"의 경우는 오음정조보(五音正操譜)가 새롭게 첨가되었으나 역시 간략해 졌다. 다음으로 "만보전서"의 금도론과 우리나라 몇몇 고악보의 금도론을 비교해 보았다. 우리나라에서 상당량의 금도론이 체계적으로 필사되기 시작하는 국악원 소장 "금보"와, "한금신보"는 비교적 오래된 금도론을 수용한 것으로 보인다. 반면 "유예지"와 "방산한씨금보"는 비교적 최근의 실용적인 내용의 금도론을 수용하였는데, 금도론의 기록 순서와 내용이 "만보전서(1739)"의 것과 유사하다. "금헌악보" 역시 우리나라의 다른 고악보에 없는 금도론을 상당량 보유하고 있으며, "만보전서(1612)"의 상층뿐 아니라 하층 항목의 금도론까지 구체적이고 분명하게 기록한 점으로 보아, 옛 금도론부터 비교적 최근의 것까지 적극적으로 수용한 것으로 보인다.

조경산업 관점에서 4차 산업혁명 기술의 탐색 (Exploring the 4th Industrial Revolution Technology from the Landscape Industry Perspective)

  • 최자호;서주환
    • 한국조경학회지
    • /
    • 제47권2호
    • /
    • pp.59-75
    • /
    • 2019
  • 본 연구는 조경산업의 관점에서 4차 산업혁명 기술을 탐색하여, 선순환적 가치증대에 필요한 기초자료를 제공하고자 수행하였다. 4차 산업혁명, 조경산업과 도시재생의 특성 등을 고찰하고, 체계적 연구에 적합한 기술 분류 체계를 틀로 선정하는 등 방법론을 설정하여 연구하였다. 먼저, 조경산업의 선순환적 가치증대에 활용이 가능한 디지털 데이터 기반의 4차 산업혁명 기술을 선별하였다. '요소기술 수준'에서 '핵심기술'인 사물인터넷, 클라우드 컴퓨팅, 빅데이터, 인공지능, 로봇, '주변기술'인 가상 증강현실, 드론, 3D 4D 프린팅, 3D 스캐닝이 디지털 데이터 기반의 4차 산업혁명 기술로 조명되었다. 조경산업에 특화하여 '트렌드 수준'으로 응용하면 선순환적 가치증대에 활용이 가능한 것으로 나타났다. '시스템 수준'은 하나의 범용기술로 분석하였으며, 플랫폼을 중심으로 요소기술 수준, 컴퓨터와 스마트기기 등이 유기적으로 상호연계되어 시스템화된 디지털 데이터 기반의 4차 산업혁명 기술로 조명되었다. 조경산업에 특화하여 '트렌드 수준'으로 응용하면 선순환적 가치증대에 효과적인 기술로 나타났다. 요소기술 수준을 응용한 트렌드 수준에서 제시된 모든 활용 방안의 구현과 시너지효과 창출이 가능하다. 스마트정원, 스마트공원 등이 추구해야 하는 수준으로 분석되었다. 트렌드 수준의 인접산업 기술 중에는 스마트시티, 스마트홈, 스마트팜 및 정밀농업, 스마트관광, 스마트헬스케어가 협업에 의한 연계성이 클 것으로 판단되었다. 다음으로, 도시재생 공공공간을 포함한 조경공간의 조성 유지관리 및 서비스에서 도구이자 소재로서, 트렌드 수준으로 응용된 관련 기술의 다양한 활용 방안이 조명되었다. 즉, 유비쿼터스 컴퓨팅의 실현으로 조경공간에서 디지털 기술의 기본적 특성이 반영된 초연결화, 초실감화, 초지능화, 초융합화되는 방안들이 제시되었다. 조경산업이 도시재생 사업에 참여함에 있어서도, 기존 업무를 비롯하여 새로운 성격의 요구 수용 및 조율, 교육, 컨설팅 등에서 가치를 증대하는데 효과적인 것으로 분석되었다. 특히, 조경영역 전반이 전략적 교두보로 유지관리를 연계하여, 트렌드 수준의 관련 기술을 시스템화할 때 선순환적 가치증대에 효과적인 것으로 나타났다. 산업구조 상, 다양한 경로에서 생산된 데이터와 정보를 유통시키는데 효과적이기 때문이다. 향후 디지털 데이터 기반의 4차 산업혁명 기술을 실제 조경공간의 조성 유지관리 및 서비스에 융합하여 실증하는 등의 후속적 연구가 필요하다.

Changes in Korean Consumers' Perception on Food Preservatives by a Risk Communication Booklet

  • Kim, Suna;Kim, Ji-Sun;Kang, Hee-Jin;Lee, Gunyoung;Lim, Ho Soo;Yun, Sang Soon;Kim, Jeong-Weon
    • 한국식품위생안전성학회지
    • /
    • 제33권6호
    • /
    • pp.417-426
    • /
    • 2018
  • 본 연구는 학부모를 대상으로 식품첨가물 및 보존료에 대한 인식 수준과 정보요구도를 파악하고 이를 바탕으로 학부모의 식품첨가물 및 보존료에 대한 올바른 이해와 안전한 식생활을 위한 교육자료를 개발하고자 하였다. 2014년 서울 경기지역 초등학생을 둔 학부모 381명을 대상으로 식품첨가물 및 보존료에 대한 인식 및 정보요구도에 대한 설문조사를 수행한 결과 응답자 중 가공식품 구입 시 안전성을 가장 중요한 요소라고 응답하였으며, 41.5%가 식품 첨가물을 가장 식품안전을 위협하는 것이라고 응답하였으며, 식품 첨가물 중에서는 보존료가 가장 위험하다고 응답하였다. 그러나 응답자의 90.6%가 식품첨가물 및 보존료에 대한 교육 경험이 없다고 응답하였다. 설문결과와 학부모들의 정보요구도에 따라 교육홍보책자인 '보존료 바르게 알기'를 개발하였다. '보존료 바르게 알기'는 '보존료란 어떤 물질인가요?', '보존료는 어떤 종류가 있나요?', '보존료는 안전한가요?', '가공식품, 어떻게 섭취해야 하나요?', '식품첨가물은 식약처가 철저히 관리하고 있어요' 등의 5장으로 구성하여 소비자인 학부모들이 알고 싶어하는 내용들을 알기 쉽고 재미있게 전달할 수 있도록 구성하였다. 개발된 교육홍보책자를 초등학교 학부모에게 시범 적용한 결과, 사전 18.9%만이 보존료가 무엇인지 알고 있다고 응답한 수준에서 사후 90.9%가 그 역할을 이해하고 72.7%가 안전하다고 응답하여 개발된 책자가 보존료에 대한 이해도를 크게 높이고 보존료에 대한 오해를 바로잡을 수 있는 것을 확인할 수 있었다. 따라서 본 연구에서 개발된 교육홍보책자는 학부모를 비롯한 일반소비자들에게 보존료에 대한 이해를 높일 수 있는 효과적인 정보전달매체로 활용될 수 있을 것이다.

데이터 크기에 따른 k-NN의 예측력 연구: 삼성전자주가를 사례로 (The Effect of Data Size on the k-NN Predictability: Application to Samsung Electronics Stock Market Prediction)

  • 천세학
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.239-251
    • /
    • 2019
  • 본 논문은 학습데이터의 크기에 따른 사례기반추론기법이 주가예측력에 어떻게 영향을 미치는지 살펴본다. 삼성전자 주가를 대상을 학습데이터를 2000년부터 2017년까지 이용한 경우와 2015년부터 2017년까지 이용한 경우를 비교하였다. 테스트데이터는 두 경우 모두 2018년 1월 1일부터 2018년 8월 31일까지 이용하였다. 시계 열데이터의 경우 과거데이터가 얼마나 유용한지 살펴보는 측면과 유사사례개수의 중요성을 살펴보는 측면에서 연구를 진행하였다. 실험결과 학습데이터가 많은 경우가 그렇지 않은 경우보다 예측력이 높았다. MAPE을 기준으로 비교할 때, 학습데이터가 적은 경우, 유사사례 개수와 상관없이 k-NN이 랜덤워크모델에 비해 좋은 결과를 보여주지 못했다. 그러나 학습데이터가 많은 경우, 일반적으로 k-NN의 예측력이 랜덤워크모델에 비해 좋은 결과를 보여주었다. k-NN을 비롯한 다른 데이터마이닝 방법론들이 주가 예측력 제고를 위해 학습데이터의 크기를 증가시키는 것 이외에, 거시경제변수를 고려한 기간유사사례를 찾아 적용하는 것을 제안한다.

만화기록 관리 방안 연구 (A Study on the Management of Manhwa Contents Records and Archives)

  • 김선미;김익한
    • 기록학연구
    • /
    • 제28호
    • /
    • pp.35-81
    • /
    • 2011
  • 만화는 대중매체이며 대중예술의 한 분야이다. 만화기록은 1차 문화인프라이기 때문에 팬시, 캐릭터, 게임, 영화, 드라마, 테마파크, 광고 사업 등으로 연결되어 고부가가치 산업을 창출해낼 수 있다. 그러나 국내에서는 능동적이고 체계적인 수집 절차의 부재로 해마다 소중한 만화 원고가 소실되고, 전자기록형태의 만화기록 등 보존이 힘든 콘텐츠가 늘어나고 있어 만화기록관리에 대한 대책이 절실히 요구된다. 본 연구에서는 이러한 인식을 바탕으로 만화기록에 대한 관리의 필요성에 대해 알아보고, 만화기록의 특징 및 구성요소를 분석하였다. 이와 함께 해외의 여러 만화아카이브 사례를 분석하여 만화기록의 특징을 반영한 기록관리 프로세스의 기능을 추출하였다. 이후 이들을 검토하여 기록관리체계의 틀에서 수집 관리 서비스 영역을 각각 나누어 만화기록을 관리하는 일반적인 만화기록 아카이빙 전략을 구성하여 제시해보았다. 수집을 한 만화기록은 다중분류와 계층적 기술요소를 반영하여 기록 사이의 연계를 보장하고 기록의 보존을 담보하며 다채로운 접근점을 제공할 수 있도록 한다. 지적 정리가 끝난 만화기록은 보존설비가 갖추어진 환경에서 보존처리를 하여 보존되기도 하고, 전자기록이나 훼손의 위험이 있는 기록의 경우 디지털 포맷을 사용하여 보존하기도 한다. 만화기록은 활용이 목적이기 때문에 전시 배포 기록정보콘텐츠개발을 통해 다양한 계층의 이용자에게 정보를 제공해 줄 수 있을 것이다. 만화기록이라는 용어 자체가 생소하고, 기록관리의 관점에서 연구된 바가 거의 없기 때문에 만화기록의 수집 전략이나 관리, 서비스 전략을 소개하고 간단한 예시를 보여주는 것에 그친 것이 한계점이라 할 수 있다. 그러나 기록학적 접근을 통한 만화 기록관리 전략을 만화 매뉴스크립트 보존소에 실용적으로 도입할 수 있다면 만화기록의 체계적 보존, 수집, 정리가 가능하여 훗날 한국의 문화 콘텐츠 관리에 큰 밑거름이 될 수 있을 것이다.

"유전자원의 접근과 이익공유(ABS)" 사례연구를 통한 국내 산림·임업분야 대응과제 고찰 (Considerations of Countermeasure Tasks in the Fields of Forest and Forestry in Korea through Case Study on "The Nagoya Protocol (Access to Genetic Resources and Benefit Sharing)")

  • 이관규;김준순;정화영
    • 한국산림과학회지
    • /
    • 제100권3호
    • /
    • pp.522-534
    • /
    • 2011
  • 본 연구의 목적은 ABS 사례연구를 통해 우리나라 산림 임업 분야 대응정책과제를 도출하는 것이다. 식물종에 대한 대표적인 ABS 선례 조사를 통해 가장 최근 ABS 협정이 이루어진 후디아를 연구대상으로 선정하였다. 후디아 ABS 진행배경을 분석하였고, 2002년 CBD COP6 회의에서 선정된 '본 가이드라인'의 ABS 절차와 후디아 사례를 비교분석하였다. 분석결과 도출된 ABS 주요공통사항과 2010년 CBD COP10 회의에서 선정된 '나고야의정서'와 함께 우리나라가 현재 당면해 있는 과제 및 역할관계를 조명하고자 하였다. 연구결과를 요약하면 다음과 같다. 1. 종 서식지를 생물분류별로 나누어 그에 따른 지역공동체를 설립하고 지역 주체적 생산, 관리, 감시 등의 기반시설을 조성하여야 할 것이다. 2. 전반적인 ABS 관련 정보공유, 관련협약 이행증진 및 모니터링을 위한 ABS 국가연락기관이 지정되어야 할 것이다. 3. 입법적, 행정적, 정책적 절차에 따른 ABS 협약체계 구축, PIC 및 MAT 양식제공 및 내용평가 확인을 위한 국가책임기관의 지정이 필요할 것이다. 4. ABS 관련 산림생물자원의 연구개발 및 관련 연구사업의 통합적 관리시스템이 구축되어야 할 것이다. 5. 생물자원별 소관 부처간 책임 및 역할분배를 통한 정보개발이 이루어져야 할 것이며 상호간 호환성 있는 시스템 개발을 위한 산학연구기관의 워킹그룹개설을 지향되어야 할 것이다. 6. 부처별 담당생물자원의 ABS 지원센터를 설립하여 산업계와 국민의 효율적인 접근을 도모해야 할 것이다. 7. 지역공동체 권리확보, ABS 협약 이행의 모니터링을 위한 국가감시기관의 선정과 국내 산림생물자원 해외유출 방지를 위한 대응체계가 구축되어야 할 것이다. 이와 같은 결과를 통해 우리나라 자생산림생물주권확립을 위한 대응방안을 모색할 수 있을 것으로 판단된다.

Descriptor 조합 및 동일 병명 이미지 수량 역비율 가중치를 적용한 유사도 기반 작물 질병 검색 기술 설계 및 구현 (Design and Implementation of a Similarity based Plant Disease Image Retrieval using Combined Descriptors and Inverse Proportion of Image Volumes)

  • 임혜진;정다운;유성준;구영현;박종한
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권6호
    • /
    • pp.30-43
    • /
    • 2018
  • 영상의 특징인 색상, 모양, 질감 등을 이용해 영상을 검색하는 연구들은 많이 진행되어 왔다. 또한 작물의 질병 영상과 관련된 연구들도 진행되고 있다. 농업 현장에서 재배되는 작물에 발생한 질병을 확인하는데 도움이 되기 위해 본 논문에서는 시설원예 작물의 질병 영상을 이용한 유사도 기반 작물 질병 검색 시스템을 제안한다. 제안하는 시스템은 단일 Descriptor를 사용하지 않고, 조합 Descriptor를 통해 기존 대비 영상의 유사도 검색 성능을 높였고 유사도 검색 결과를 가독성 높게 사용자에게 제공하기 위해 가중치 기반 산출방법을 적용했다. 본 논문에서는 총 13개의 개별 Descriptor를 이용해 조합을 진행했다. 조합 Descriptor를 이용해 6개 작물의 질병에 대해 유사도 검색을 진행했고 작물별로 평균 accuracy가 높은 조합 Descriptor를 선정해 유사도 검색에 사용했다. 검색된 결과는 병명의 비율을 기반으로 한 산출방법과 가중치를 기반으로 한 산출방법을 사용해 백분율로 나타냈다. 병명의 비율을 기반으로 한 산출방법은 질의 영상과 유사도 검색에 사용되는 영상의 수가 많은 병명이 1순위로 출력되는 문제점이 있다. 이를 해결하기 위해 가중치를 기반으로 한 산출방법을 사용했다. 작물의 병명별 테스트 영상을 두 가지 산출방법에 적용해 검색 성능을 측정했다. 작물의 질병별로 두 가지 산출방법에 대해 검색 성능 값의 평균을 비교한 결과 고추, 사과 작물에서는 병명의 비율을 기반으로 한 산출방법의 성능이 가중치를 기반으로 한 산출방법의 성능보다 평균 약 11.89%의 높은 성능 결과를 보였다. 국화, 딸기, 배, 포도 작물에서는 가중치를 기반으로 한 산출방법이 병명의 비율을 기반으로 한 산출방법의 성능보다 평균 약 20.34%의 높은 성능 결과를 보였다. 또한 본 논문에서 제안하는 시스템의 UI/UX는 실제 사용자의 피드백을 통해 편리하게 구성했다. 시스템의 화면마다 상단에 제목과 설명을 출력했고 사용자가 질병의 정보를 보기 편리하게 화면을 구성했다. 검색된 질병의 정보는 위에서 제안한 산출방법을 토대로 유사한 질병의 영상과 병명을 출력한다. 시스템의 환경은 PC 환경 기반의 웹 브라우저와 모바일 디바이스 환경 기반의 웹 브라우저를 통해 사용할 수 있도록 구현했다.

KB-BERT: 금융 특화 한국어 사전학습 언어모델과 그 응용 (KB-BERT: Training and Application of Korean Pre-trained Language Model in Financial Domain)

  • 김동규;이동욱;박장원;오성우;권성준;이인용;최동원
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.191-206
    • /
    • 2022
  • 대량의 말뭉치를 비지도 방식으로 학습하여 자연어 지식을 획득할 수 있는 사전학습 언어모델(Pre-trained Language Model)은 최근 자연어 처리 모델 개발에 있어 매우 일반적인 요소이다. 하지만, 여타 기계학습 방식의 성격과 동일하게 사전학습 언어모델 또한 학습 단계에 사용된 자연어 말뭉치의 특성으로부터 영향을 받으며, 이후 사전학습 언어모델이 실제 활용되는 응용단계 태스크(Downstream task)가 적용되는 도메인에 따라 최종 모델 성능에서 큰 차이를 보인다. 이와 같은 이유로, 법률, 의료 등 다양한 분야에서 사전학습 언어모델을 최적화된 방식으로 활용하기 위해 각 도메인에 특화된 사전학습 언어모델을 학습시킬 수 있는 방법론에 관한 연구가 매우 중요한 방향으로 대두되고 있다. 본 연구에서는 금융(Finance) 도메인에서 다양한 자연어 처리 기반 서비스 개발에 활용될 수 있는 금융 특화 사전학습 언어모델의 학습 과정 및 그 응용 방식에 대해 논한다. 금융 도메인 지식을 보유한 언어모델의 사전학습을 위해 경제 뉴스, 금융 상품 설명서 등으로 구성된 금융 특화 말뭉치가 사용되었으며, 학습된 언어 모델의 금융 지식을 정량적으로 평가하기 위해 토픽 분류, 감성 분류, 질의 응답의 세 종류 자연어 처리 데이터셋에서의 모델 성능을 측정하였다. 금융 도메인 말뭉치를 기반으로 사전 학습된 KB-BERT는 KoELECTRA, KLUE-RoBERTa 등 State-of-the-art 한국어 사전학습 언어 모델과 비교하여 일반적인 언어 지식을 요구하는 범용 벤치마크 데이터셋에서 견줄 만한 성능을 보였으며, 문제 해결에 있어 금융 관련 지식을 요구하는 금융 특화 데이터셋에서는 비교대상 모델을 뛰어넘는 성능을 보였다.