• 제목/요약/키워드: NEWS

검색결과 10,847건 처리시간 0.034초

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

메타데이터 상호운용성을 위한 기록관리 메타데이터 표준 분석 5W1H와 태스크 모델의 관점에서 (Analysis of Metadata Standards of Record Management for Metadata Interoperability From the viewpoint of the Task model and 5W1H)

  • 백재은;스기모토 시게오
    • 기록학연구
    • /
    • 제32호
    • /
    • pp.127-176
    • /
    • 2012
  • 메타데이터 표준규격(이하 메타데이터 표준으로 기재)은 디지털 자원(Digital resource)의 장기보존 및 디지털 아카이브를 위해 필요한 기본 요소 중 하나로, 이는 현대 정보사회에서 중요한 요소로 잘 알려져 있다. 자원(Resource)의 기록관리와 아카이브, 장기보존을 위한 메타데이터 표준은 다양하며, AGRkMS, EAD, ISAD(G), OAIS, PREMIS5) 등이 이용되고 있다. 우리는 아카이브 시스템의 메타데이터 표준을 디자인하기 위해 목적에 따른 메타데이터 표준을 선택하고 맞춤화(Customization)하지 않으면 안 된다. 한편으로, 다른 시스템의 메타데이터 스키마와의 상호운용성(Interoperability)에 대한 고찰도 실시하지 않으면 안 된다. 이전 연구에서, 우리는 기록 생애 주기(Records lifecycle)라는 관점으로부터 메타데이터 표준의 특성에 대해 분석을 실시하였다. 이로 인해, 각 메타데이터 표준 요소가 해당하는 기록 생애 주기의 처음 단계를 확인할 수 있었고, 아카이브 혹은 보존을 위해서는 하나의 메타데이터 표준만으로 기록 생애 주기 전체를 포괄할 수 없다는 것을 보여 주었다. 우리는 이 분석을 통해서 기록 생애 주기의 단계와 메타데이터 표준간의 관계, 기록 생애 주기 전체에서의 메타데이터 특성은 볼 수 있었으나, 보다 상세한 분석을 실시하는 것은 앞으로의 과제로 남겨두었다. 지금까지의 연구에 근거하여, 본 논문은 기록 생애 주기의 관점에서 디지털 아카이브와 보존, 기록관리를 위한 메타데이터 표준의 특징 분석을 위해, 기록 생애 주기 안에서 실행되는 업무의 관점으로부터 메타데이터 스키마를 재 파악하고 분석하였다. 지금까지 메타데이터 스키마는 기술대상이 되는 자원을 중심으로 정의되었기 때문에 기록 생애 주기 전체와 생애 주기 안의 각 단계에서 이용되는 메타데이터 표준간의 매핑을 위한 적절한 방법이 없었다. 이에 본 논문에서는 각기 다른 메타데이터 표준의 기술 요소를, 기록 생애 주기에 포함시키는 업무와 연결시키는 것으로 메타데이터 표준간의 매핑 방법을 제안한다. 본 연구에서는 메타데이터 표준 분석을 위한 프레임워크(Framework)로, 기록 생애 주기를 이용하여 작성한 자원의 업무중심 모델, 즉 태스크 모델(Task Model)을 제안한다. 태스크 모델을 이용함에 있어서 업무를 실행하는 '이벤트(Event)'의 관점을 보다 명확하게 할 수 있다. 한편, 업무를 중심으로 기술 요소간의 매핑을 보다 효율적으로 실시하기 위해서는 요소를 카테고리 화하여 매핑의 대상 범위를 좁히는 것이 중요하다. 이를 위해 우리는 범용성을 가진 5W1H모델(Who, What, Why, When, Where, How)을 이용하여, 기술 요소를 카테고리 화 하는 것을 제안한다. 그리고 태스크 모델과 5W1H 모델을 이용하여 메타데이터 표준 요소에 특징을 부여하고, 요소 간의 매핑을 실시하여 표준 간 관계를 확인하였다. 태스크 모델은 기록 생애 주기 전체에 업무의 관점을 반영한 것으로, 이 모델을 이용함으로써 기록 생애 주기와 그 안의 각 업무에 대한 메타데이터 표준의 사용, 그리고 특징 분석을 위해 실시되는 기술 요소간의 매핑이 가능할 수 있었다. 또한, 5W1H 카테고리를 이용하여 업무와 자원에 관련되는 기술 요소간의 관계를 살펴보는 것으로, 관계가 명확해지는 것과 함께 조사대상을 좁히는 것이 가능하게 되었다. 이 프레임워크의 제안과 이용으로 우리는 특징 분석을 위해 실시되는 매핑 혹은 분류가 단순한 일반적인 매핑이 아닌 의미적인 분류를 할 수 있었다. 본 연구에서는 이 모델들을 이용하여, 메타데이터 표준간의 크로스워크를 정의하였다. 그리고 태스크 모델의 각 단계의 문맥 내에서 메타데이터 기술 요소의 특성을 매핑 예로 확인하고, 이를 바탕으로 하여 프레임워크에 대해 고찰하였다.

인공지능 기술에 관한 가트너 하이프사이클의 네트워크 집단구조 특성 및 확산패턴에 관한 연구 (Structural features and Diffusion Patterns of Gartner Hype Cycle for Artificial Intelligence using Social Network analysis)

  • 신선아;강주영
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.107-129
    • /
    • 2022
  • 기술경쟁이 심화되고 있는 오늘날 신기술에 대한 선도적 위치의 선점이 중요하다. 선도적 위치의 선점과 적정시점에 기술 획득·관리를 위해 이해관계자들은 지속적으로 기술에 대한 탐색활동을 수행한다. 이를 위한 참고 자료로서 가트너 하이프 사이클(Gartner Hype Cycle)은 중요한 의미가 있다. 하이프 사이클은 기술수명주기(S-curve)와 하이프 수준(Hype Level)을 결합하여 새로운 기술에 대한 대중의 기대감을 시간의 흐름에 따라 나타낸 그래프이다. 새로운 기술에 대한 기대는 기술사업화뿐만 아니라 연구개발 투자의 정당성, 투자유치를 위한 기회의 발판이 된다는 점에서 연구개발 담당자 및 기술투자자의 관심이 높다. 그러나 산업계의 높은 관심에 비해 실증분석을 시도한 선행연구는 다양하지 못하다. 선행문헌 분석결과 데이터 종류(뉴스, 논문, 주가지수, 검색 트래픽 등)나 분석방법은 한정적이었다. 이에 본 연구에서는 확산의 주요한 채널이 되어가고 있는 소셜네트워크서비스의 데이터를 활용하여 'Gartner Hype Cycle for Artificial Intelligence, 2021'의 단계별 기술들에 대한 집단구조(커뮤니티)의 특성과 커뮤니티 간 정보 확산패턴을 분석하고자 한다. 이를 위해 컴포넌트 응집규모(Component Cohesion Size)를 통해 각 단계별 구조적 특성과 연결중심화(Degree Centralization)와 밀도(Density)를 통해 확산의 방식을 확인하였다. 연구결과 기술을 수용하는 단계별 집단들의 커뮤니케이션 활동이 시간이 지날 수록 분절이 커지며 밀도 역시 감소함을 확인하였다. 또한 새로운 기술에 대한 관심을 촉발하는 혁신태동기 집단의 경우 정보확산을 촉발하는 외향연결(Out-degree) 중심화 지수가 높았으며, 이후의 단계는 정보를 수용하는 내향연결(In-degree) 중심화 지수가 높은 것으로 나타났다. 해당 연구를 통해 하이프 사이클에 관한 이론적 기초를 제공할 것이다. 또한 인공지능기술에 대한 기술관심집단들의 기대감을 반영한 정보확산의 특성과 패턴을 소셜데이터를 통해 분석함으로써 기업의 기술투자 의사결정에 새로운 시각을 제공할 것이다.

중소기업적합업종선정이 프랜차이즈산업에 미치는 영향에 관한 연구 (Study on the effect of small and medium-sized businesses being selected as suitable business types, on the franchise industry)

  • 강창동;신건철;장재남
    • 한국유통학회지:유통연구
    • /
    • 제17권5호
    • /
    • pp.1-23
    • /
    • 2012
  • 대기업과 중소기업의 갈등이 심화되고 있고 낙수효과 또한 제대로 작동하지 않고 있으며 사업조정제도의 실효성에 대한 논란이 이어지고 있는 가운데 중소기업의 사업영역을 보호하고 중소 대기업간 양극화를 해소하며 더불어 골목상권도 보호하기 위한 방안으로 도입된 것이 중소기업 적합업종 지정제도이다. 중소기업 적합업종의 추진현황은 제조업분야로 중소기업 적합업종 품목 중 234개 품목을 신청 접수 받아 실태조사 및 분석하여 조정협의체의 품목을 선정하였다. 서비스업분야에서의 적합업종 지정은 사회적 갈등이 있는 업종부터 지정할 계획인데, 중소기업 및 소상공인의 생업과 관련된 3개 대분류 서비스업종을 대상으로 우선 지정하고 추후 순차적으로 확대할 예정이다. 하지만 중소기업 적합업종 품목으로 선정될 경우에는 중소기업의 성장 동기가 저해될 우려가 있으며, 중소기업 적합업종 품목 지정은 소비자 후생 감소가 나타날 수 있다. 또한 사전적 규제로 작용할 소지가 높을 뿐만 아니라 경쟁을 제도적으로 제한함으로써 부작용이 나타날 우려가 있으며 FTA 체제의 주요 규정에 대한 위배 가능성도 있다. 뿐만아니라 대기업에 대한 역차별 요인이 충분히 반영되지 않고 있다는 점도 문제점으로 지적된다. 특히 중소기업 적합업종제도가 대기업의 주력분야와 관계없는 서비스업에 대한 진출 확대로 인해 중소기업 및 소상공인과의 갈등을 초래하고 있는 실정이므로 중소기업이나 중소상인의 보호를 위해서는 프랜차이즈시스템을 통해서 지역 중소기업을 발전시키고 마스터 프랜차이즈나 지역 프랜차이즈 시스템과 같은 선진 계약 방식을 도입하는 것이 필요하다. 하지만 이러한 방식은 기업들의 경쟁력과 운영방식을 한층 더 진일보 시켜 중소 프랜차이즈기업의 경쟁력 강화에 기여하는 효과도 있지만 부정적 측면이 더 많다고 볼 수 있다. 첫째, 지식경제부가 밝히고 있듯이, 프랜차이즈산업은 자영업자의 창업 성공률을 높여주고, 기존 자영업자를 조직화하여 규모의 경제를 통한 경쟁력 강화에 기여할 뿐만 아니라 다양한 서비스를 소비자에게 제공함으로써 내수시장을 확대하고, 일자리 창출에 기여하는 등 자영업자 경쟁력 제고와 서비스 산업 활성화를 위한 '유용한 수단'임을 강조하고 정부 서민안정 대책으로 밝힌바 있다. 이러한 관점에서 본다면, 프랜차이즈는 적합업종 제도의 취지에 부합하는 것이며 이에 반하는 것이 아님을 알 수 있다. 둘째, 적합업종으로 지정될 경우 국제적 경쟁력을 갖고 있는 국내 프랜차이즈 대기업들의 위축과 사기저하로 인하여 해외진출과 R&D, 식품안전에 대한 투자 감소와 더불어 국내 진출한 해외 기업들의 사업 확장에 부정적 영향을 끼칠 수 있다. 또한 국내 진출한 다국적 해외 프랜차이즈기업들과의 경쟁력을 확보하는 것이 무엇보다도 시급한 국내 프랜차이즈산업 현실에서 국제적 경쟁력 확보의 어려움뿐만 아니라 국내에 진출한 해외 프랜차이즈기업들과의 역차별이 발생할 수도 있다. 셋째, 중소기업 적합업종 품목 지정은 지금까지 제품을 사용해 왔던 소비자들의 선택의 기회를 제한함과 동시에 소비자의 후생을 감소시키는 부정적인 효과를 초래한다. 또한 중소기업 간의 역차별 문제를 발생시켜 소수 중소기업이 시장을 독점함으로써 소비자 선택의 폭이 줄어들 가능성이 있으므로 제품의 효용을 판단하는 역할은 국가가 아닌 소비자의 몫으로 남겨두어야 한다. 마지막으로는 프랜차이즈와 관련하여 이미 가맹사업법과 그리고 공정거래위원회의 모범거래기준 등의 시행으로 공정거래는 확보하고 있으므로 앞으로도 부족한 부분은 이들을 보완하여 진행하는 것이 바람직하다고 본다. 중소기업 적합업종 지정으로 이중삼중으로 규제하는 것은 오히려 프랜차이즈 분야에 과도한 제한이 될 것이다. 이제 국내 프랜차이즈산업에서도 한국의 문화를 전파하는 세계적 프랜차이즈기업이 성장할 수 있는 환경조성과 정부의 적극적인 지원이 필요하다. 따라서 프랜차이즈 기업의 성장 과정이나 배경을 고려하지 않고 현재 대기업이라는 이유만으로 이들에게 불이익을 주는 일은 없어야 한다. 프랜차이즈기업의 성장억제로 인하여 결국 가맹점의 매출감소는 물론이고 심지어는 폐업하는 가맹점의 숫자를 증가시키는 또 다른 문제를 발생시킬 수 있다는 것이다. 따라서 중소기업 적합업종제도가 대기업의 발목을 잡는 것이 아니라 소상공인과 중소기업의 경쟁력 제고와 동반성장을 목표로 하고 있는 만큼 대기업과 소상공인 및 중소기업이 상생과 협력을 바탕으로 거래관계를 지속하는 프랜차이즈 기업들이 포함되지 않도록 하는 것이 타당할 것이다.

  • PDF

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법 (Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation)

  • 유띳로따낙;누르지드;하인애;조근식
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.57-77
    • /
    • 2013
  • 소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.

간찰(簡札)의 안부인사(安否人事)에 대한 유형(類型) 연구(硏究) (A study on the Greeting's Types of Ganchal in Joseon Dynasty)

  • 전병용
    • 동양고전연구
    • /
    • 제57호
    • /
    • pp.467-505
    • /
    • 2014
  • 필자(筆者)는 여러 해째 간찰(簡札)를 대상으로 일련(一連)의 국어학적(國語學的) 연구(硏究)를 진행하고 있으며 이 연구(硏究)는 그 일환(一環)으로서 [안부인사(안부인사(安否人事))]의 유형화(類型化)를 위한 것이다. 이를 위하여 근대국어(近代國語) 시기(時期)(16세기(世紀)-19세기(世紀))의 한문간찰(漢文簡札)와 한글간찰(簡札)를 대상으로 [안부인사(安否人事)]를 형식적(形式的) 유형(유형(類型))와 의미적(意味的) 유형(類型)로 나누어 분석(分析)하였다. [안부인사(安否人事)]의 형식적(形式的) 유형(類型)는 정치여부(定置與否), 생략여부(省略與否), 기상여부(寄狀與否), 존비여부(尊卑與否)를 기준으로 나눌 수 있다. 정치여부(定置與否)를 제1기준으로, 생략여부(省略與否)를 제2기준으로 삼아 다섯 가지로 유형화하였다. [안부인사(安否人事)]의 전형성(典型性)이 가장 잘 드러난 정치형(定置型)이면서 완성형(完成型)을 제(第)1유형(類型)로 삼았다. 정치형(定置型)이면서 자기안부생략형(自己安否省略型)을 제(第)2유형(類型)으로, 정치형(定置型)이면서 상대안부생략형(相對安否省略型)을 제(第)3유형(類型)으로, 정치형(定置型)이면서 안부인사생략형(安否人事省略型)을 제(第)4유형(類型)로 삼았다. [안부인사(安否人事)]에서 破格이 가장 심한 도치형(倒置型)을 제(第)5유형(類型)로 삼았다. 第1유형(類型)은 [상대안부(相對安否)]가 [자기안부(自己安否)]에 선행(先行)하는 정치형(定置型)이면서 의미요소(意味要素)가 온전한 완성형(完成型)을 가리킨다. 이 유형은 [안부인사(安否人事)]의 모든 구성요소(構成要素)를 갖췄다는 점에서 가장 전형적(典型的)이며 규범적(規範的)이라 할 수 있다. 제(第)2유형(類型)은 [안부인사(安否人事)]가 [상대안부(相對安否)]로만 이루어진 것이다. 정형성(定型性)에서는 제(第)1유형(類型)보다 덜하지만 출현빈도(出現頻度)에서는 큰 차이가 없는 유형이다. [상대안부(相對安否)]를 충실히 묻되, [자기안부(自己安否)]는 생략하는 것이 예의에 크게 어긋나지 않으면서 간찰을 쉽게 쓸 수 있기 때문에 활용된다. 제(第)3유형(類型)은 [상대안부(相對安否)+자기안부(自己安否)]의 구성을 보이는 정치형(定置型)이지만 [상대안부(相對安否)]가 생략된 유형을 가리킨다. 제(第)4유형(類型)은 [상대안부(相對安否)+자기안부(自己安否)]의 구성을 보이는 정치형(定置型)이지만 [안부인사(安否人事)] 전체가 생략된 유형이다. 이 유형은 [안부인사(安否人事)]자체를 완전히 생략한 경우와 '제번(除煩)'과 같은 상투적인 표현이 [안부인사(安否人事)]를 대신하는 경우로 나뉜다. 제(第)5유형(類型)은 정치형(定置型)과 달리 [자기안부(自己安否)+상대안부(相對安否)]의 구성을 보이는 도치형(倒置型)이다. 이 유형은 정형성(定型性)에서 파격(破格)이 가장 심한 유형으로 실예(實例)도 아주 드물다. [자기안부(自己安否)]를 앞세우고 나중에 체면치레로 [상대안부(相對安否)]를 묻는 것은 예의에 어긋나기 때문이다. 이 외에 [안부인사(安否人事)] 유형을 [상대안부(相對安否)]와 [자기안부(自己安否)]가 직접 연결된 직접형(直接型)과 [事緣]으로 분리된 간접형(間接型)으로 대별(大別)하여 세분할 수도 있다. [안부인사(安否人事)]의 의미적(意味的) 유형(類型)은 기상여부(寄狀與否), 완급여부(緩急與否), 친밀여부(親密與否), 격조여부(隔阻與否)를 기준으로 나눌 수 있다. 기상(寄狀)의 경우 [안부인사(安否人事)]는 [상대안부(相對安否)(시후(時候)+문안(問安)+심경(心境))+자기안부(自己安否)(상황(狀況)+안부(安否)+심경(心境))]의 구성을 보인다. [상대안부(相對安否)]에서 [시후(時候)]는 [계절(季節)] 정보와 [기상(氣象)(날씨)] 정보로 세분(細分)할 수 있고, [심경(心境)] 또한 수신자(受信者)의 [가족안부([家族安否) 심경(心境)]과 [개인안부(個人安否) 심경(心境)]으로 나뉜다. [자기안부(自己安否)]에서 [상황(狀況)]은 수신자(受信者)의 종래 상황인 [근황(近況)]과 수신자(受信者)의 현재 상황인 [현황(現況)]으로 나뉘며 [문안(問安)] 또한 수신자(受信者)의 [가족문안(家族問安)]와 [개인문안(個人問安)]으로, [안부(安否)]는 [가족안부(家族安否)]와 [개인안부(個人安否)]로 세분(細分)할 수 있다. 이처럼 [문안(問安)]이나 [안부(安否)]가 [가족(家族)]과 [개인(個人)] 차원에서 짝을 이루어 쓰일때가 많은데 부모(父母)나 조부모(祖父母)를 모시고 사는 층층시하(層層侍下)의 대가족제도(大家族制度)에서 비롯한 현상이라 할 수 있다. 답상(答狀)의 경우 [안부인사(安否人事)]는 [상대안부(相對安否)(수신(受信)+안부(安否)+심경(心境))+자기안부(自己安否)(상황(狀況)+안부(安否)+심경(心境))]의 구성을 보며 [상대안부(相對安否)]에서만 의미구성이 기상(寄狀)과 차이가 있다. [상대안부(相對安否)]에서 [수신(受信)]은 직접 간찰을 받는 [서신(書信)]과 사람들 통해 소식을 전해 듣는 [전언(傳言)]으로 나뉘며 [안부(安否)]는 [가족안부(家族安否)]와 [개인안부(個人安否)]로, [심경(心境)] 역시 [가족안부(家族安否) 심경(心境)]과 [개인안부(個人安否) 심경(心境)]으로 나뉜다.