• 제목/요약/키워드: limitations

검색결과 12,026건 처리시간 0.04초

카테고리 연관 규칙 마이닝을 활용한 추천 정확도 향상 기법 (A Study on the Improvement of Recommendation Accuracy by Using Category Association Rule Mining)

  • 이동원
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.27-42
    • /
    • 2020
  • 인터넷이라는 가상 공간을 활용함으로써 물리적 공간의 제약을 갖는 오프라인 쇼핑의 한계를 넘어선 온라인 쇼핑은 다양한 기호를 가진 소비자를 만족시킬 수 있는 수많은 상품을 진열할 수 있게 되었다. 그러나, 이는 역설적으로 소비자가 구매의사결정 과정에서 너무 많은 대안을 비교 평가해야 하는 어려움을 겪게 함으로써 오히려 상품 선택을 방해하는 원인이 되기도 한다. 이런 부작용을 해소하기 위한 노력으로서, 연관 상품 추천은 수많은 상품을 다루는 온라인 상거래에서 소비자의 구매의사결정 과정 중 정보탐색 및 대안평가에 소요되는 시간과 노력을 줄여주고 이탈을 방지하며 판매자의 매출 증대에 기여할 수 있다. 연관 상품 추천에 사용되는 연관 규칙 마이닝 기법은 통계적 방법을 통해 주문과 같은 거래 데이터로부터 서로 연관성 높은 상품을 효과적으로 발견할 수 있다. 하지만, 이 기법은 거래 건수를 기반으로 하므로, 잠재적으로 판매 가능성이 높을지라도 충분한 거래 건수가 확보되지 못한 상품은 추천 목록에서 누락될 수 있다. 이렇게 추천 시 제외된 상품은 소비자에게 구매될 수 있는 충분한 기회를 확보하지 못할 수 있으며, 또 다시 다른 상품에 비해 상대적으로 낮은 추천 기회를 얻는 악순환을 겪을 수도 있다. 본 연구는 구매의사결정이 결국 상품이 지닌 속성에 대한 사용자의 평가를 기반으로 한다는 점에 착안하여, 추천 시 상품의 속성을 반영하면 소비자가 특정 상품을 선택할 확률을 좀더 정확하게 예측할 수 있다는 점을 추천 시스템에 반영하기 위한 목적으로 수행되었다. 즉, 어떤 상품 페이지를 방문한 소비자는 그 상품이 지닌 속성들에 어느 정도 관심을 보인 것이며 추천 시스템은 이런 속성들을 기반으로 연관성을 지닌 상품을 더 정교하게 찾을 수 있다는 것이다. 상품의 주요 속성의 하나로서, 카테고리는 두 상품 간에 아직 드러나지 않은 잠재적인 연관성을 찾기에 적합한 대상이 될 수 있다고 판단하였다. 본 연구는 연관 상품 추천에 상품 간의 연관성뿐만 아니라 카테고리 간의 연관성을 추가로 반영함으로써 추천의 정확도를 높일 수 있는 예측모형을 개발하였고, 온라인 쇼핑몰로부터 수집된 주문 데이터를 활용하여 이루어진 실험은 기존 모형에 비해 추천 성능이 개선됨을 보였다. 실무적인 관점에서 볼 때, 본 연구는 소비자의 구매 만족도를 향상시키고 판매자의 매출을 증가시키는 데에 기여할 수 있을 것으로 기대된다.

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.

지능형 시뮬레이션 모형을 기반으로 한 정보기술 투자 성과 요인 및 전략 도출에 관한 연구 (A study on the Success Factors and Strategy of Information Technology Investment Based on Intelligent Economic Simulation Modeling)

  • 박도형
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.35-55
    • /
    • 2013
  • 최근 기업 경영에 있어 정보기술의 도입 및 전략적인 활용은 선택이 아닌 필수로 자리잡고 있다. 기업의 전략적인 목표와 정보기술 간의 상호 의존은 기업의 생존 및 성장에 중요한 역할을 하고 있으며, 이에 따라 이미 많은 기업이 지속적으로 정보기술에 투자하고 있다. 정보기술 투자 성과 관련해서는 기업 내부의 요인들과 전략들, 기업외부의 고객까지 여러 가지 복합적인 요소들이 서로 상호작용하고 있기 때문에, 각 요인들을 독립적으로 분리하여 정보기술 투자 성과에 미치는 영향력을 분석하는 것이 쉽지 않다. 이에 본 연구는 기존의 연구들을 바탕으로 정보기술 투자성과에 영향을 줄 수 있는 변수들을 도출하여, 각 변수들의 관계를 수리적인 모델링을 통해 단순화시키고, 시뮬레이션 방법론을 이용하여 각 변수들의 변화에 정보기술 투자 성과는 어떻게 달라지는지를 밝혔다. 본 연구의 결과는 정보기술 투자는 서비스의 품질을 증가시켜 경제학적인 성과들에 간접적으로 영향을 주고, 정보기술 투자와 동시에 소비자 잉여는 증가되지만, 큰 투자비용으로 회사의 이익은 감소하게 된다. 그리고 시간이 지남에 따라 품질 증가에 관한 정보가 고객들 사이에 퍼져 나가게 되므로 최종적으로 기업의 수익을 증가시켜준다. 또한, 정보기술 투자 성과 극대화를 위해서는 회사가 제공하는 서비스와 소비자들의 네트워크 효과 등이 고려되어 정보기술 투자 여부를 결정하고, 회사에 맞는 정보기술 투자 전략을 세워야 함을 시뮬레이션 모형을 통해 확인할 수 있었다. 구체적으로, 한 번에 많은 투자를 할 경우는 단기적인 성과는 클 것으로 기대되나, 장기적으로 좋은 성과가 이뤄지지 않는다. 그러나 정보의 확산 속도가 빠르거나 정보의 장벽이 될 수 있는 정보를 받지 못하는 소비자가 적을 경우 단기에 집중 투자 하는 것이 많은 수요를 얻을 수 있다. 또, 여러 번에 걸쳐 투자하는 경우는 적당한 주기를 가지게 될 경우 장기적으로 큰 성과를 낼 수 있음을 확인할 수 있었다. 본 연구는 경제학 모델링과 시뮬레이션을 결합시켜, 각각의 한계를 모두 극복할 수 있는 방법론을 활용했다는 측면과, 정보기술 투자의 성과를 제품 품질의 매개 효과 모형에 적용하여 정보기술 투자와 기업 성과간의 관계를 보여주었다는 측면, 마지막으로 정보기술 투자 전략 및 정보의 확산 효과를 반영하여 정보기술 투자의 성과를 확인할 수 있다는 측면에서 의의가 있다.

창산 김정기의 유적조사와 한국고고학 (Excavation of Kim Jeong-gi and Korean Archeology)

  • 이주헌
    • 헤리티지:역사와 과학
    • /
    • 제50권4호
    • /
    • pp.4-19
    • /
    • 2017
  • 창산 김정기(昌山 金正基, 1930.3.3~2015.8.26)는 우리나라 문화재 발굴사에 있어서 큰 획을 그으신 분이다. 1959년 국립박물관 직원으로 문화재와 인연을 맺으신 이후, 1987년 문화재연구소를 퇴직할 때까지 약 30년에 가까운 세월동안 유적과 유물을 발굴하고 자료를 정리하며 2015년 영면하기 전까지 대학과 발굴 전문기관에서 우리 문화재의 가치와 의미를 밝히려고 노력하였다. 창산은 국내의 기념비적인 고고학 발굴조사를 모두 진두지휘하고 초창기 한국 고고학을 대표하는 학자로 국내외에 알려져 있으며, 한국 고고학에 적지 않은 영향을 남겼다. 그의 활동과 역할은 고고학사적으로 의미가 있으나 나름의 한계 또한 찾아 볼 수 있다. 다양한 성격의 유적이 활발히 조사되어 한국 고고학에 있어 매우 중요한 의미를 가지는 시기로 평가되고 있는 국립박물관의 덕수궁시기(1955~1972년)에 창산은 선사시대 패총유적이나 주거지와 같은 고고학 조사에 적극 참가하여 유적측량과 유구 실측을 비롯하여 사진촬영과 유물 제도 등을 맡아서 하였다. 그는 일본에서 익힌 발굴기술을 마음껏 발휘하였고, 전국을 무대로 종횡무진 이루어진 그의 고고학조사는 학사적으로도 높게 평가되고 있다. 특히, 창산의 견해 가운데 고고학적으로 주목되는 것은 고분에 있어 수릉의 가능성을 지적한 것과 청동기시대 문화의 이해에 "해미문화"라는 지역문화론을 처음으로 언급한 것은 탁견이었다. 1969년 문화재연구실이 설치됨에 따라 그 책임을 맡은 창산은 미약한 규모인 연구실의 운영과 총체적인 책임을 맡아 찬란한 우리문화를 지켜내고자 조사와 연구에 고심하였다. 그는 불국사 복원공사와 경주 천마총, 황남대총의 발굴 등을 성공적으로 수행하였고, 이후 황룡사지, 분황사, 미륵사지 등을 조사하며 삼국시대 불교문화와 가람의 구조를 체계적으로 파악해 보고자 노력하였다. 당시 창산이 기획하여 진행한 대형 발굴조사는 한국 고고학의 기틀을 다짐과 동시에 관련분야의 연구를 활성화시키는데 크게 이바지한 것으로 평가할 수 있다. 무엇보다도 한국 고고학의 계기적인 발전과정 상에서 볼 때, 다양한 발굴조사법의 시도와 체계화, 고고학 전문 인력의 양성과 발굴조사의 대중화, 조사기록의 정형화 및 자료공개 활성화 등은 이 시기 창산의 열정으로 이루어진 성과로 손꼽을 수 있다. 한편, 유적조사에 있어서 정확한 기록과 세심한 주의를 기울이며 열정적으로 발굴에 심혈을 기울인 발굴왕 창산도 유적의 성격을 밝히고 유구를 해석하는 과정에 있어서는 시대적 한계를 벗어나지 못하였는데, 황남대총 주인공 논쟁의 불씨를 남겨둔 것은 그의 역할을 재음미해볼 때 매우 아쉬운 한부분이다.

국방 온톨로지를 통한 지능형 의사결정지원시스템 구축 및 활용 - 공군 군수상황관리체계 적용 사례 (Construction and Application of Intelligent Decision Support System through Defense Ontology - Application example of Air Force Logistics Situation Management System)

  • 조원기;김학진
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.77-97
    • /
    • 2019
  • 제 4차 산업혁명의 초연결 환경에서 발생하는 많은 양의 데이터는 제 4차 산업혁명을 기존의 생산 환경과 구분지어 주는 주요한 요소이다. 이러한 환경은 데이터를 필요로 하는 동시에 데이터를 생산하는 양면적인 특징을 가진다. 때문에 앞으로의 정보 시스템은 기존의 정보시스템보다 양적인 측면에서 더 많은 데이터를 처리해야 하며, 질적인 측면에서는 많은 데이터 중 사용자의 목적에 부합하는 목표 데이터만을 추출하는 능력이 요구된다. 작은 규모의 정보 시스템에서는 사람이 그 시스템을 정확히 이해하고 필요한 정보를 획득하는 것이 가능하지만, 시스템에 대해 정확한 이해가 어려워진 다양하고 복잡한 시스템에서는 원하는 정보를 획득하는 것이 점점 더 어려워진다. 이러한 문제는 데이터를 사람뿐 아니라 컴퓨터가 이해할 수 있는 온톨로지로 표현하여 다양한 정보처리가 가능하도록 하는 시맨틱 웹(Semantic Web) 구축이 해결책이 될 수 있다. 군에서도 현재 대부분의 업무가 정보 시스템을 통해 이루어지고 있는데, 정보의 입력이나 가공 등 단순처리 중심으로 구축된 기존 시스템이 점점 더 많은 양의 데이터를 포함하게 되면서 시스템을 쉽게 활용하기 위한 노력이 필요한 상황이다. 본 연구에서는 온톨로지를 통한 지능형 의사결정지원시스템의 예로 온톨로지 기반 군수상황관리체계를 제안하고자 한다. 온톨로지 기반 군수상황관리체계는 기존의 군수정보체계의 복잡한 정보를 직관적으로 보여주기 위해 구축된 군수상황관리체계를 온톨로지를 통해 구축하였으며, 성과기반군수지원 계약관리, 부품사전 등의 유용한 기능을 추가 식별하여 온톨로지에 포함하였다. 또한 구축된 온톨로지가 의사결정지원에 활용할 수 있는지를 확인하기 위해 시맨틱 웹 기술을 통해 기본적인 질의응답은 물론 추론 및 함수를 통한 분석기능을 구현하였다.

딥러닝 시계열 알고리즘 적용한 기업부도예측모형 유용성 검증 (Corporate Default Prediction Model Using Deep Learning Time Series Algorithm, RNN and LSTM)

  • 차성재;강정석
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.1-32
    • /
    • 2018
  • 본 연구는 경제적으로 국내에 큰 영향을 주었던 글로벌 금융위기를 기반으로 총 10년의 연간 기업데이터를 이용한다. 먼저 시대 변화 흐름에 일관성있는 부도 모형을 구축하는 것을 목표로 금융위기 이전(2000~2006년)의 데이터를 학습한다. 이후 매개 변수 튜닝을 통해 금융위기 기간이 포함(2007~2008년)된 유효성 검증 데이터가 학습데이터의 결과와 비슷한 양상을 보이고, 우수한 예측력을 가지도록 조정한다. 이후 학습 및 유효성 검증 데이터를 통합(2000~2008년)하여 유효성 검증 때와 같은 매개변수를 적용하여 모형을 재구축하고, 결과적으로 최종 학습된 모형을 기반으로 시험 데이터(2009년) 결과를 바탕으로 딥러닝 시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 Lee(2015) 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓모형, 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, '비선형적인 변수들', 변수들의 '다중 공선성 문제', 그리고 '데이터 수 부족'이란 한계점이 존재한다. 이에 로짓 모형은 '비선형성'을, Lasso 회귀분석 모형은 '다중 공선성 문제'를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 연구를 진행한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.

지식베이스 확장을 위한 멀티소스 비정형 문서에서의 정보 추출 시스템의 개발 (Development of Information Extraction System from Multi Source Unstructured Documents for Knowledge Base Expansion)

  • 최현승;김민태;김우주;신동욱;이용훈
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.111-136
    • /
    • 2018
  • 지식베이스를 구축하는 작업은 도메인 전문가가 온톨로지 스키마를 이해한 뒤, 직접 지식을 정제하는 수작업이 요구되는 만큼 비용이 많이 드는 활동이다. 이에, 도메인 전문가 없이 다양한 웹 환경으로부터 질의에 대한 답변 정보를 추출하기 위한 자동화된 시스템의 연구개발의 필요성이 제기되고 있다. 기존의 정보 추출 관련 연구들은 웹에 존재하는 다양한 형태의 문서 중 학습데이터와 상이한 형태의 문서에서는 정보를 효과적으로 추출하기 어렵다는 한계점이 존재한다. 또한, 기계 독해와 관련된 연구들은 문서에 정답이 있는 경우를 가정하고 질의에 대한 답변정보를 추출하는 경우로서, 문서의 정답포함 여부를 보장할 수 없는 실제 웹의 비정형 문서로부터의 정보추출에서는 낮은 성능을 보인다는 한계점이 존재한다. 본 연구에서는 지식베이스 확장을 위하여 웹에 존재하는 멀티소스 비정형 문서로부터 질의에 대한 정보를 추출하기 위한 시스템의 개발 방법론을 제안하고자 한다. 본 연구에서 제안한 방법론은 "주어(Subject)-서술어(Predicate)"로 구분된 질의에 대하여 위키피디아, 네이버 백과사전, 네이버 뉴스 3개 웹 소스로부터 수집된 비정형 문서로부터 관련 정보를 추출하며, 제안된 방법론을 적용한 시스템의 성능평가를 위하여, Wu and Weld(2007)의 모델을 베이스라인 모델로 선정하여 성능을 비교분석 하였다. 연구결과 제안된 모델이 베이스라인 모델에 비해, 위키피디아, 네이버 백과사전, 네이버 뉴스 등 다양한 형태의 문서에서 정보를 효과적으로 추출하는 강건한 모델임을 입증하였다. 본 연구의 결과는 현업 지식베이스 관리자에게 지식베이스 확장을 위한 웹에서 질의에 대한 답변정보를 추출하기 위한 시스템 개발의 지침서로서 실무적인 시사점을 제공함과 동시에, 추후 다양한 형태의 질의응답 시스템 및 정보추출 연구로의 확장에 기여할 수 있을 것으로 기대한다.

영화 흥행에 영향을 미치는 새로운 변수 개발과 이를 이용한 머신러닝 기반의 주간 박스오피스 예측 (Development of New Variables Affecting Movie Success and Prediction of Weekly Box Office Using Them Based on Machine Learning)

  • 송정아;최근호;김건우
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.67-83
    • /
    • 2018
  • 2013년 누적인원 2억명을 돌파한 한국의 영화 산업은 매년 괄목할만한 성장을 거듭하여 왔다. 하지만 2015년을 기점으로 한국의 영화 산업은 저성장 시대로 접어들어, 2016년에는 마이너스 성장을 기록하였다. 영화산업을 이루고 있는 각 이해당사자(제작사, 배급사, 극장주 등)들은 개봉 영화에 대한 시장의 반응을 예측하고 탄력적으로 대응하는 전략을 수립해 시장의 이익을 극대화하려고 한다. 이에 본 연구는 개봉 후 역동적으로 변화하는 관람객 수요 변화에 대한 탄력적인 대응을 할 수 있도록 주차 별 관람객 수를 예측하는데 목적을 두고 있다. 분석을 위해 선행연구에서 사용되었던 요인 뿐 아니라 개봉 후 역동적으로 변화하는 영화의 흥행순위, 매출 점유율, 흥행순위 변동 폭 등 선행연구에서 사용되지 않았던 데이터들을 새로운 요인으로 사용하고 Naive Bays, Random Forest, Support Vector Machine, Multi Layer Perception등의 기계학습 기법을 이용하여 개봉 일 후, 개봉 1주 후, 개봉 2주 후 시점에는 차주 누적 관람객 수를 예측하고 개봉 3주 후 시점에는 총 관람객 수를 예측하였다. 새롭게 제시한 변수들을 포함한 모델과 포함하지 않은 모델을 구성하여 실험하였고 비교를 위해 매 예측시점마다 동일한 예측 요인을 사용하여 총 관람객 수도 예측해보았다. 분석결과 동일한 시점에 총 관람객 수를 예측했을 경우 보다 차주 누적 관람객 수를 예측하는 것이 더 높은 정확도를 보였으며, 새롭게 제시한 변수들을 포함한 모델의 정확도가 대부분 높았으며 통계적으로 그 차이가 유의함으로써 정확도에 기여했음을 확인할 수 있었다. 기계학습 기법 중에는 Random Forest가 가장 높은 정확도를 보였다.

서울특별시 지정문화재 관리 현황 진단 및 개선방안 연구 - 정기조사(2016~2018) 결과를 중심으로 - (A Study on the Present Condition and Improvement of Cultural Heritage Management in Seoul - Based on the Results of Regular Surveys (2016~2018) -)

  • 조홍석;서현정;김예린;김동천
    • 헤리티지:역사와 과학
    • /
    • 제52권2호
    • /
    • pp.80-105
    • /
    • 2019
  • 재난 유형의 복합화 및 불규칙성이 날로 늘고 있는 가운데 다양한 자연적 인문적 요인에 의하여 문화재가 파괴되고 손상되는 사례가 빈번해짐에 따라 보다 적극적인 사전 예방적 차원에서의 문화재 보존 관리 필요성이 높아지고 있다. 이에 문화재청은 문화재의 체계적인 보존 관리를 위해 2005년 12월 정기조사를 법제화하였고, 최근에는 법령을 개정하여 조사 주기를 5년에서 3년으로 단축하는 한편, 정기조사 대상을 등록문화재까지 확대하는 등 제도적으로 문화재 보존 관리 역량을 강화하고자 노력하고 있다. 한편 시 도지정문화재의 정기조사는 조례에 따라 광역자치단체 중심으로 시행하도록 되어 있는데, 서울특별시의 경우 도심에 위치한 문화재가 많고 탐방 수요가 높아 상대적으로 예방적 차원의 관리가 더욱 중요함에 따라 2008년 조례를 개정해 정기조사의 법적 근거를 마련하고, 2016년에서 2018년까지 시지정문화재 전체를 대상으로 정기조사를 실시하였다. 이에 개별 문화재를 중심으로 진행된 조사의 결과를 취합하고 종합적인 관리 현황을 진단함으로써 보다 효과적인 관리방안을 마련하기 위한 검토가 필요한 시점이다. 따라서 본 연구는 서울특별시 지정문화재에 대하여 3개년(2016~2018) 동안 추진된 정기조사 결과를 중심으로 종합적인 관리 실태를 점검함으로써 성과 및 한계를 진단하고 개선방안을 모색하는 한편, 서울특별시가 추진 중인 통합 관리 시스템에 기초 DB 탑재를 위한 방안을 제언하였다. 구체적으로 정기조사 운영 지침상의 조사 서식을 준용하되 시지정문화재의 특성을 고려하여 조사 서식의 유형을 재분류하고 세분화하였다. 또한 조사 범위 및 방식에 있어 일관성 있고 구체적인 정보 기술을 위한 매뉴얼을 개발하였다. 이를 토대로 정기조사 결과를 분석한 바 조사 대상 문화재 총 521건 가운데 401건(77.0%)은 전반적으로 보존 관리 상태가 양호하였고, 102건(19.6%)은 주의관찰, 정밀진단, 수리 등 별도의 조치가 필요한 것으로 확인되었다. 이에 대한 조치로 관리 상태 및 시급성에 따라 중점 관리 대상을 선정하여 우선적으로 관리하는 방안을 제안하였다. 향후 본 연구를 기초로 보다 합리적이고 체계적인 문화재 보존 관리 계획의 수립 및 추진을 도모하는 한편, 중장기적으로 서울특별시가 추진하고 있는 통합 관리 시스템에 기초 DB를 효과적으로 제공함으로써 사전 예방적이고 효율적인 문화재 관리 체계의 구축을 통한 안전하고 지속가능한 문화재 보호의 토대가 마련될 수 있기를 기대한다.

평점과 리뷰 텍스트 감성분석을 결합한 추천시스템 향상 방안 연구 (How to improve the accuracy of recommendation systems: Combining ratings and review texts sentiment scores)

  • 현지연;유상이;이상용
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.219-239
    • /
    • 2019
  • 개인에게 맞춤형 서비스를 제공하는 것이 중요해지면서 개인화 추천 시스템 관련 연구들이 끊임없이 이루어지고 있다. 추천 시스템 중 협업 필터링은 학계 및 산업계에서 가장 많이 사용되고 있다. 다만 사용자들의 평점 혹은 사용 여부와 같은 정량적인 정보에 국한하여 추천이 이루어져 정확도가 떨어진다는 문제가 제기되고 있다. 이와 같은 문제를 해결하기 위해 현재까지 많은 연구에서 정량적 정보 외에 다른 정보들을 활용하여 추천 시스템의 성능을 개선하려는 시도가 활발하게 이루어지고 있다. 리뷰를 이용한 감성 분석이 대표적이지만, 기존의 연구에서는 감성 분석의 결과를 추천 시스템에 직접적으로 반영하지 못한다는 한계가 있다. 이에 본 연구는 리뷰에 나타난 감성을 수치화하여 평점에 반영하는 것을 목표로 한다. 즉, 사용자가 직접 작성한 리뷰를 감성 수치화하여 정량적인 정보로 변환해 추천 시스템에 직접 반영할 수 있는 새로운 알고리즘을 제안한다. 이를 위해서는 정성적인 정보인 사용자들의 리뷰를 정량화 시켜야 하므로, 본 연구에서는 텍스트 마이닝의 감성 분석 기법을 통해 감성 수치를 산출하였다. 데이터는 영화 리뷰를 대상으로 하여 도메인 맞춤형 감성 사전을 구축하고, 이를 기반으로 리뷰의 감성점수를 산출한다. 본 논문에서 사용자 리뷰의 감성 수치를 반영한 협업 필터링이 평점만을 고려하는 전통적인 방식의 협업 필터링과 비교하여 우수한 정확도를 나타내는 것을 확인하였다. 이후 제안된 모델이 더 개선된 방식이라고 할 근거를 확보하기 위해 paired t-test 검증을 시도했고, 제안된 모델이 더 우수하다는 결론을 도출하였다. 본 연구에서는 평점만으로 사용자의 감성을 판단한 기존의 선행연구들이 가지는 한계를 극복하고자 리뷰를 수치화하여 기존의 평점 시스템보다 사용자의 의견을 더 정교하게 추천 시스템에 반영시켜 정확도를 향상시켰다. 이를 기반으로 추가적으로 다양한 분석을 시행한다면 추천의 정확도가 더 높아질 것으로 기대된다.