• 제목/요약/키워드: Service Search

검색결과 1,634건 처리시간 0.029초

해석수준과 메시지 프레이밍에 따른 자율주행택시의 사용의도에 관한 연구 (A Study on the Construal Level and Intention of Autonomous Driving Taxi According to Message Framing)

  • 윤승정;김민용
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.135-155
    • /
    • 2018
  • 본 연구는 최근 4차산업 혁명의 산물로 대두되고 있는 자율주행차가 대중교통 수단인 택시로 이용될 때 해석수준과 메시지 프레이밍에 따른 사용 의도의 차이를 분석하는 것이다. 해석수준이란 가까운 미래에 발생한 일과 먼 미래에 발생할 일을 가정하여 어떤 제품이나 서비스를 해석하는 것이 다르다는 것을 말한다. 메시지 프레이밍이란 긍정 혹은 부정의 표현 또는 혜택, 손실의 양극단의 메시지를 구성한 것을 말한다. 즉, 기존연구에서는 이 두 개념에 따라 제품이나 서비스의 가치를 다르게 해석한다고 한다. 본 연구는 자율주행차가 택시로 출시될 때 두 개념을 적용할 경우 사용 의도의 차이를 보이는지 살펴보고자 한다. 결과를 요약하면 우선, 메시지 프레이밍 구성에서 자율주행 택시를 이용할 경우 혜택(Gain)과 왜(Why) 사용해야 하는지를 설명한 메시지 형식과 자율주행 택시를 이용하지 않았을 경우 손실(Loss)와 어떻게(How)를 강조한 메시지를 구성하여 비교해 보았다. 두 메시지 프레이밍은 차이를 보였으며(t= 3.063) 혜택(Gain)과 왜(Why)를 설명한 메시지 형태가 더 높은 사용 의도를 보였다. 또한, 해석수준에 따른 결과를 요약하면 다음과 같다. 혜택(Gain) 및 손실(Loss)에 대한 먼 미래와 가까운 미래에 발생할 것을 가정한 경우 사용 의도에 차이가 있었으며, 구체적으로 혜택(Gain)을 설명한 메시지와 먼 미래에 발생할 것을 가정한 경우가 사용 의도가 높았다. 요약하면 자율주행 택시의 사용 의도를 높이기 위해서는 긍정의 메시지(Gain)와 먼 미래에 일어날 수 있는 것을 가정하여 사람들에게 메시지를 전달해야 한다는 결론이다. 또한, 본 연구를 통하여 향후 신기술의 출현에 대한 사용 의도 연구 시 연구방법을 활용할 수 있을 것이다.

소련(蘇聯)의 학교보건사업(學校保健事業) 비교(比較) (Soviet Union's School Health Program)

  • 남은우;권혁동
    • 한국학교보건학회지
    • /
    • 제4권2호
    • /
    • pp.136-145
    • /
    • 1991
  • 소련(蘇聯)의 의료(醫療)는 국가(國家)의 경제(經濟) 사회(社會) 프로그램의 하나로서 기획(企劃)되며 누구에게나 필요(必要)할 때 무료(無料)로 제공(提供)되어진다. 가족단위(家族單位)로 어린이는 소아과(小兒科) 의사(醫師), 어른은 내과(內科) 또는 전과(全科) 의사(醫師)(General practioner)가 담당(擔當)하는데 개인(個人)은 의사(醫師)를 선택(選擇)할 권리(權利)가 없고 거주(居住)하는 지역(地域)에서 국가(國家)가 임명(任命)한 의사(醫師)의 진료(診療)를 받는다. 농촌(農村)에서는 비의사(非醫師) 진료원(診療員)인 feldsher가 먼저 진료(診療)한 후 의사(醫師)가 진료(診療)하며, 지역담당(地域擔當) 의사(醫師)에게 진료(診療)한 후(後) 의뢰(依賴)에 따라 외래(外來) 전문의(專門醫), 군병원(軍病院), 도병원(都病院) 병원(病院)에서 진료(診療)를 받을 수 있다. 학교(學校) 보건사업(保健事業)은 전반적(全般的)인 보건의료(保健醫療) 전달(傳達) 체계(體系) 관리상(管理上)의 한 부분(部分)으로서 보건부(保健部)에 의해서 제정(制定)된 시행(施行) 절차(節次)들과 그에 따른 정책(政策)들에 의해 수행(遂行)되어진다. 그와는 반대(反對)로, 미국(美國)에서는 학교(學校) 관할(管轄) 구역(區域)들이 학교(學校) 보건(保健) 사업(事業)의 전달(傳達)을 위하여 그들 나름대로의 관리(管理) 구조(構造)와 정책(政策)의 시행(施行) 절차(節次)들을 설정(設定)하고 있다. 2) 보건요원(保健要員)들에 있어서, 소련(蘇聯)의 학교(學校)들은 단 한 명(名)의 의사(醫師)가 검사(檢査)의 대부분(大部分)을 제공(提供)하고 보건(保健) 기록(記錄)들을 유지(維持)하는데 반(反)해 미국(美國)에 있어서는 1인(人)의 학교(學校) 간호사(看護師) 또는 간호(看護) 보조사(補助師)가 이러한 활동(活動)들의 책임(責任)을 진다. 3) 상담(相談) 분야(分野)에 있어서의 차이(差異)로는 만약, 소련(蘇聯) Model에 있어서 어린이가 상담(相談)을 필요(必要)로 한다면 어린이는 1인(人)의 전문의(專門醫)에게서 상담(相談)을 받는다. 그러나, 미국(美國) 제도(制度)에 있어서는 학교(學校)의 상담자(相談者)가 어린이와 함께 일을 처리한 후 필요(必要)하다면 부모(父母)와 함께 상담(相談)해서 한 명(名)의 전문의(專門醫)에게 위탁(委託)을 한다. 4) 응급(應急) 치료(治療) 전달(傳達)에 있어서의 차이(差異)로는 소련(蘇聯) Model에 있어서는 어린이는 그 지역(地域)을 위하여 있는 응급(應急) 의료(醫療)팀 또는 진료소(診療所)(Polyclinic)에서 응급(應急) 치료(治療)를 받는다. 미국(美國) Model에서는 간호사(看護師), 간호보조사(看護補助師) 또는 응급(應急) 훈련(訓練)을 받은 교사(敎師)가 응급(應急) 치료(治療)를 시행(施行)한 후(後) 학부모(學父母)를 부르고, 만약 부가적(附加的)인 치료(治療)가 필요(必要)하다면 해당(該當) 학생(學生)의 가정의(家庭醫)에게 의뢰(依賴)한다. 5) 보건요원(保健要員)과 교사(敎師)들의 훈련(訓練)에 있어서 차이(差異)가 있다. 소련(蘇聯)의 보건(保健) 인력(人力) 양성(養成)을 위한 교육기관(敎育機關)으로는 보건부(保健部) 산하(傘下)의 의과대학(醫科大學)(약 28개(個) 대학(大學)에서 위생학(衛生學) 강의(講義) 실시(實施))과 간호(看護) 학교(學校)들이 있으며, 전반적(全般的)인 보건(保健) 교육(敎育) 사업(事業)은 중앙(中央) 보건국(保健局)과 전염병(傳染病) 관리국(管理局)을 통하여 중앙(中央) 보건부(保健部)에서 수행(遂行)하고 있다. 교사(敎師)들을 위한 교육(敎育) 과정(課程)은 5년제(年制) 교육대학(敎育大學) 과정(課程)에 의한 것과 문교부(文敎部)의 Institute of Postgraduate Teacher's Training의 강습(講習) 과정(課程)을 통한 것과 Health Education Houses와 학교(學校) 의사(醫師)들에 의해 제공(提供)되어지는 현장교육(現場敎育)(In-Service)프로그램 등이 있다. 미국(美國)의 경우(境遇)에는 300개(個) 이상(以上)의 대학(大學)의 학부(學部) 또는 대학원(大學院) 과정(課程)에서 보건(保健) 교육(敎育) 전공(專攻) 과정(課程)을 개설(開設)하고 있으며, 그밖의 많은 조직(組織)과 기구(機構)에 의해서 보건(保健) 요원(要員)과 교사(敎師)들의 교육(敎育) 및 훈련(訓練)이 제공(提供)되어지고 있다.

  • PDF

京釜線 鐵道建設에 따른 韓半島 空間組織의 變化 (Changes in spatial organization of Korea by the construction of Seoul-Pusan railroad)

  • 주경식
    • 대한지리학회지
    • /
    • 제29권3호
    • /
    • pp.297-317
    • /
    • 1994
  • 경부선 철도는 韓半島의 從貫鐵道로 1905년에 일본에 의하여 건설되었다. 일본은 경부선 노선을 당시에 우리 나라에 존재하였던 여러 교통로를 組合하여, 이 철도 하나로 한 반도 전체를 통제할 수 있도록 선정하였다. 따라서, 이 노선은 당시 한국의 주요 水運, 道路 交通, 市場地域 등이 횡단되도록 하였다. 또한, 鐵道驛은 기존의 취락에서 1km이상 떨어져 광범위한 부지상에 입지시켰다. 이와 같이 건설된 경부선 철도는 개통후 30년후에 한국의 空間組織을 크게 변화시켰다. 경부선 철도상의 주요 지점이 급성장하고 개통 전의 여러 상 업, 행정, 교통요지들이 쇠퇴하였다. 또한, 경부선 철도중심으로 모든 기능들이 집중되어 地 域經濟의 兩極化 現象이 나타나기 시작했고, 생태적 不均衡이 누적되어 왔다.

  • PDF

비정형 빅데이터의 실시간 복합 이벤트 탐지를 위한 기법 (The Method for Real-time Complex Event Detection of Unstructured Big data)

  • 이준희;백성하;이순조;배해영
    • Spatial Information Research
    • /
    • 제20권5호
    • /
    • pp.99-109
    • /
    • 2012
  • 최근 소셜 미디어의 발달과 스마트폰의 확산으로 SNS(Social Network Service)가 활성화가 되면서 데이터양이 폭발적으로 증가하였다. 이에 맞춰 빅데이터 개념이 새롭게 대두되었으며, 빅데이터를 활용하기 위한 많은 방안이 연구되고 있다. 여러 기업이 보유한 빅데이터의 가치창출을 극대화하기 위해 기존 데이터와의 융합이 필요하며, 물리적, 논리적 저장구조가 다른 이기종 데이터 소스를 통합하고 관리하기 위한 시스템이 필요하다. 빅데이터를 처리하기 위한 시스템인 맵리듀스는 분산처리를 활용하여 빠른게 데이터를 처리한다는 이점이 있으나 모든 키워드에 대해 시스템을 구축하여 저장 및 검색 등의 과정을 거치므로 실시간 처리에 어려움이 따른다. 또한, 이기종 데이터를 처리하는 구조가 없어 복합 이벤트를 처리하는데 추가 비용이 발생할 수 있다. 이를 해결하는 방안으로 기존에 연구된 복합 이벤트 처리 시스템을 활용하여 실시간 복합 이벤트 탐지를 위한 기법을 제안하고자 한다. 복합 이벤트 처리 시스템은 서로 다른 이기종 데이터 소스로부터 각각의 데이터들을 통합하고 이벤트들의 조합이 가능하며 스트림 데이터를 즉시 처리할 수 있어 실시간 처리에 유용하다. 그러나 SNS, 인터넷 기사 등 텍스트 기반의 비정형 데이터를 텍스트형으로 관리하고 있어 빅데이터에 대한 질의가 요청될 때마다 문자열 비교를 해야 하므로 성능저하가 발생할 여지가 있다. 따라서 복합 이벤트 처리 시스템에서 비정형 데이터를 관리하고 질의처리가 가능하도록 문자열의 논리적 스키마를 부여하고 데이터 통합 기능을 제안한다. 그리고 키워드 셋을 이용한 필터링 기능으로 문자열의 키워드를 정수형으로 변환함으로써 반복적인 비교 연산을 줄인다. 또한, 복합 이벤트 처리 시스템을 활용하면 인 메모리(In-memory)에서 실시간 스트림 데이터를 처리함으로써 디스크에 저장하고 불러들이는 시간을 줄여 성능 향상을 가져온다.

인공지능(AI) 스피커에 대한 사회구성 차원의 발달과정 연구: 제품과 시기별 공진화 과정을 중심으로 (A study of Artificial Intelligence (AI) Speaker's Development Process in Terms of Social Constructivism: Focused on the Products and Periodic Co-revolution Process)

  • 차현주;권상희
    • 인터넷정보학회논문지
    • /
    • 제22권1호
    • /
    • pp.109-135
    • /
    • 2021
  • 본 연구는 전통뉴스 보도에 나타난 인공지능(AI)스피커 뉴스 텍스트 분석을 통해 인공지능(AI) 스피커 발달과정을 분류하고 시기별 제품별 특성을 파악하였다. 또한 AI 스피커 사업자 제품별 뉴스 보도와 시기별 뉴스 보도간의 상관관계를 분석하였다. 분석에 사용된 이론적 배경은 뉴스의 프레임과 토픽프레임이다. 분석방법으로는 LDA 방식을 활용한 토픽모델링(Topic Modeling)과 의미연결망분석이 사용되었으며, 추가로 'UCINET'중 QAP분석을 적용하였다. 연구방법은 내용분석 방법으로 2014년부터 2019년까지 AI 스피커 관련 2,710건의 뉴스를 1차로 수집하였고, 2차적으로 Nodexl 알고리즘을 이용하여 토픽프레임을 분석하였다. 분석 결과 첫째, AI 스피커 사업자 유형별 토픽 프레임의 경향은 4개 사업자(통신사업자, 온라인 플랫폼, OS 사업자, IT디바이스 생산업자) 특성에 따라 다르게 나타났다. 구체적으로, 온라인 플랫폼 사업자(구글, 네이버, 아마존, 카카오)와 관련한 프레임은 AI 스피커를 '검색 또는 입력 디바이스'로 사용하는 프레임의 비중이 높았다. 반면 통신 사업자(SKT, KT)는 모회사의 주력 사업인 IPTV, 통신 사업의 '보조 디바이스' 관련한 프레임이 두드러지게 나타났다. 나아가 OS 사업자(MS, 애플)는 '제품의 의인화 및 음성 서비스' 프레임이 두드러지게 보였으며, IT 디바이스 생산업자(삼성)는 '사물인터넷(IoT) 종합지능시스템'과 관련한 프레임이 두드러지게 나타났다. 둘째, AI 스피커 시기별(연도별) 토픽 프레임의 경향은 1기(2014-2016년)에는 AI 기술 중심으로 발달하는 경향을 보였고, 2기(2017-2018년)에는 AI 기술과 이용자 간의 사회적 상호 작용과 관련되어 있었으며, 3기(2019년)에는 AI 기술 중심에서 이용자 중심으로 전환되는 경향을 나타냈다. QAP 분석 결과, AI 스피커 발달에서 사업자별과 시기별 뉴스 프레임이 미디어 담론의 결정요인에 의해 사회적으로 구성되는 것을 알 수 있었다. 본연구의 함의는 AI 스피커 진화는 사업자별, 발달시기별로 모회사 기업의 특성과 이용자 간의 상호작용으로 인한 공진화 과정이 나타냄을 발견할 수 있었다. 따라서 본 연구는 AI 스피커의 향후 전망을 예측하고 그에 따른 방향성을 제시하는 데 중요한 시사점을 제공한다.

역사를 위하여: 아키비스트와 역사가의 역할 -공공기록보존소를 중심으로- (For History : Roles of Historians and Archivists - Public Archives, Archivists, and Historians -)

  • 이상민
    • 기록학연구
    • /
    • 제6호
    • /
    • pp.225-262
    • /
    • 2002
  • Chief Consultant Archives Government Archives & Records Service -table of contents- 1. Introduction 2. Relationship of Historical Studies and Archive 3. Relationship of Archives and Archives 4. Conclusion; Historians, Archives, and Archivists, and Their Roles This essay is mainly written for historians who may have "little or limited experience" in dealing with archives and archivists in their course of historical research. It may sound very ridiculous to say that "historians have little or limited experience" in using archives but it is also true that many Korean historians have depended on various compiled editions of historical materials or personally donated and/or collected materials when they do research, rather than they would visit archives and search for the materials by themselves. This is the main reason for that the public archives in Korea have not served historians well and effectively, and vice versa, that historians have not visited archives sometime with no knowledge of archives, and have not requested opening of archives for their research. It is a simple fact that historian's study depends on the records he/she uses. Without records, there should be no history. Use of archives for historical research is a common thing and a must in modern archives. Records are selected to be preserved in archives for their preservation as well as their future use. Who select the records as archives? Archivists do mostly. Then, what are the criteria for the archivists to chose records as permanent preservable archives? Answers to this fundamental question have been provided by many historians and archivists. The closest answer may be that selecting archivists would be better trained and equipped with historical research and knowledgeable of the major trends in historical research. With his/her own experience of historical research and tracing the trends of historical studies and materials used in the historiography, they could chose better and appropriate records for future use using their prudence and discretion. It also means that historians have had influence on archivists in their selecting archives by providing the theme and context of historical studies of the time. Though not necessarily becoming a historian themselves, selecting or appraising archivists should understand the process of creating the records and should know how they become archives. This is a precondition to become a good archivist. But that's not all. They must know how the archives are used and what archives are used for what purposes. Among many other roles of modern archivists, selecting and describing the archives are the foremost tasks of an archivist. Archivists therefore developed modern methods to select future archives based on functional analysis and records series concept rather than a record file or item as a unit of selection. Historians are users or consumers of the archives held in the archives building or repository. The quality of their study depends on the "quality" of the materials they use. With the help of archivists not to mention of reference service, historians owe much to archivists in having an access to the materials they need, intellectually and physically. Too many closed archives and too long closed archives in the archives repository would benefit neither historians nor archivists. However, archivists can mostly react only to archive requests and demands made by historians for more wide accessibility. Using the FOIA, as in the U.S., or the Information Opening Act, as in case of Korea, historians can promote the use of historical materials as well as promoting accountability and transparence for the benefit to society as whole. In this context, it is vary desirable to establish a close professional relationship between historians and archivists even in the age of information society. At present, historians need more understanding of operation and importance of archives while archives administration need to realize the potential archival demands from research community and civil movement for clean government.

조선시대 유교식 감실(龕室)의 수용과 변용 (The Acceptance and Transition of Confucian Gamsil in Joseon period)

  • 박종민
    • 헤리티지:역사와 과학
    • /
    • 제44권4호
    • /
    • pp.56-69
    • /
    • 2011
  • 감실은 고조부모부터 부모까지 사대 신주를 모시는 의례용구로 사당 안에 배치하였다. 구조와 형태는 고려시대에 수용된 주자의 "가례"의 도설에 따르면 네모반듯한 네 칸으로 구성되었다. 감실은 고조부터 아버지 대까지 사대 조상의 신주를 각 칸 마다 한 대씩을 남향으로 세워서 서쪽에서 동쪽의 순서로 안치하며 후손이 없는 조상의 신주도 함께 모셨다. 감실은 신주를 봉안하는 단순한 공간에서 벗어나서 그들의 영혼이 깃든 공간이자, 가족 내 위계질서가 살아있는 공간이다. 사당 건립과 관리는 후손의 사회적 신분과 가정 경제력 등으로 일정부분 제약을 받았다. 조선시대 조정은 관직자의 품계에 따라서 조상의 봉사 대수와 건축을 제한하였기 때문이다. 관직자는 녹을 받음으로써 일정부분 경제적인 안정을 취할 수 있는 집안이어서 사당을 건립할 수 있었다. 그렇지 않은 집안은 자신의 살림살이 집 한 곳에 감실을 배치하고 신주를 안치했을 가능성이 있다. 그 과정에서 감실은 배치 장소, 크기, 구조와 형태 등이 변하는 특징을 보였다. 구조적으로 건물형상을 띤 감실은 가옥과 사당형으로 영혼불멸사상과 조상관을 엿볼 수 있다. 그리고 사당 밖에 배치된 감실은 탁자를 들여놓을 수 있는 정도의 크기에서 신주를 안치할 수 있는 크기로 변하였다. 이런 감실은 이동하기 편리하고 거주공간의 너비와 높이를 고려해서 제작하였다. 감실의 변용으로 사회변화와 제도, 가정 경제력과 아주 밀접한 관계가 있음을 보여주었다. 조선 초기에는 "가례"를 바탕으로 한 가묘 건립과 조상의 봉사 정책을 사대부가에서 결과가 나타났다. 서인들은 사회적, 제도적으로 제약을 받음으로써 실질적으로 정책에 부응할 수 없었다. 사당을 갖지 못하는 집안도 감실의 변용을 통해서 그들에게 4대를 봉사할 수 있는 기회를 스스로 가졌다. 결과적으로 조선 후기로 접어들면서 명분과 현실을 절충하여서 사대봉사가 보편화되는 기반이 되었다. 감실의 변용은 혈연의 정통성 찾기와 가문의 위신 노출, 사대봉사의 확산계기 마련, 신성공간화, 가정경제력 증대 등으로 사회적 의미를 함축하고 있다고 결론을 지을 수 있다.

WebGIS 기반 해양 연구선 상시관측 정보 체계 구축 (Establishment of A WebGIS-based Information System for Continuous Observation during Ocean Research Vessel Operation)

  • 한현경;이철용;김태훈;한재림;최현우
    • 한국지리정보학회지
    • /
    • 제24권1호
    • /
    • pp.40-53
    • /
    • 2021
  • 해양연구를 위해 사용하는 연구선은 계획된 연구해역으로 이동하여 연구목적에 맞는 해양관측을 수행한다. 한국해양과학기술원(KIOST, Korea Institute of Ocean Science & Technology)이 보유하고 있는 5척의 연구선에는 항해 중에 상시 관측할 수 있는 GPS, 수심, 기상, 표층 수온 및 염분 측정 장비가 탑재되어 있다. 이러한 상시관측 장비를 통해 생산되는 데이터를 체계적으로 관리하고 활용하기 위한 정보 플랫폼이 요구된다. 따라서 연구선 운항계획에서부터 연구선 운항 중 관측, 데이터수집, 데이터처리, 데이터저장, 표출 및 제공서비스에 이르는 일련의 업무 분석을 통해 업무절차를 정의하였다. 업무 절차의 각 단계 별 기능 설계를 거친 후, WebGIS 기반의 정보 플랫폼인 KUMOS(KIOST Underway Meteorological & Oceanographic Information System)를 구축하였다. 연구선 항해 중에 생산되는 데이터는 시·공간적 변화가 있는 특성이 있어 이러한 변동성을 고려한 데이터의 품질관리 체계를 개발하였다. 데이터의 체계적인 관리와 서비스를 위해 KUMOS 통합DB를 구축하고 연구선 항적, 데이터 표출, 검색 및 제공 등의 기능을 구현하였다. KUMOS에서 제공하는 데이터 셋은 연구선의 항해 별 운항결과리포트(cruise report), 원시데이터(raw data), 품질관리 플래그(Quality Control(QC) flagged data) 데이터, 필터 데이터(filtered data), 항적도 데이터(cruise track line), 데이터 리포트(cruise data report) 등으로 구성되어있다. 본 연구를 통해 개발한 KUMOS의 기능 별 업무처리 절차와 체계는 연구선 항해 중 상시관측이 가능한 연구선을 보유하고 있는 국내 해양관련 기관 및 대학에도 벤치마킹 역할을 할 것으로 기대된다.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

카테고리 연관 규칙 마이닝을 활용한 추천 정확도 향상 기법 (A Study on the Improvement of Recommendation Accuracy by Using Category Association Rule Mining)

  • 이동원
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.27-42
    • /
    • 2020
  • 인터넷이라는 가상 공간을 활용함으로써 물리적 공간의 제약을 갖는 오프라인 쇼핑의 한계를 넘어선 온라인 쇼핑은 다양한 기호를 가진 소비자를 만족시킬 수 있는 수많은 상품을 진열할 수 있게 되었다. 그러나, 이는 역설적으로 소비자가 구매의사결정 과정에서 너무 많은 대안을 비교 평가해야 하는 어려움을 겪게 함으로써 오히려 상품 선택을 방해하는 원인이 되기도 한다. 이런 부작용을 해소하기 위한 노력으로서, 연관 상품 추천은 수많은 상품을 다루는 온라인 상거래에서 소비자의 구매의사결정 과정 중 정보탐색 및 대안평가에 소요되는 시간과 노력을 줄여주고 이탈을 방지하며 판매자의 매출 증대에 기여할 수 있다. 연관 상품 추천에 사용되는 연관 규칙 마이닝 기법은 통계적 방법을 통해 주문과 같은 거래 데이터로부터 서로 연관성 높은 상품을 효과적으로 발견할 수 있다. 하지만, 이 기법은 거래 건수를 기반으로 하므로, 잠재적으로 판매 가능성이 높을지라도 충분한 거래 건수가 확보되지 못한 상품은 추천 목록에서 누락될 수 있다. 이렇게 추천 시 제외된 상품은 소비자에게 구매될 수 있는 충분한 기회를 확보하지 못할 수 있으며, 또 다시 다른 상품에 비해 상대적으로 낮은 추천 기회를 얻는 악순환을 겪을 수도 있다. 본 연구는 구매의사결정이 결국 상품이 지닌 속성에 대한 사용자의 평가를 기반으로 한다는 점에 착안하여, 추천 시 상품의 속성을 반영하면 소비자가 특정 상품을 선택할 확률을 좀더 정확하게 예측할 수 있다는 점을 추천 시스템에 반영하기 위한 목적으로 수행되었다. 즉, 어떤 상품 페이지를 방문한 소비자는 그 상품이 지닌 속성들에 어느 정도 관심을 보인 것이며 추천 시스템은 이런 속성들을 기반으로 연관성을 지닌 상품을 더 정교하게 찾을 수 있다는 것이다. 상품의 주요 속성의 하나로서, 카테고리는 두 상품 간에 아직 드러나지 않은 잠재적인 연관성을 찾기에 적합한 대상이 될 수 있다고 판단하였다. 본 연구는 연관 상품 추천에 상품 간의 연관성뿐만 아니라 카테고리 간의 연관성을 추가로 반영함으로써 추천의 정확도를 높일 수 있는 예측모형을 개발하였고, 온라인 쇼핑몰로부터 수집된 주문 데이터를 활용하여 이루어진 실험은 기존 모형에 비해 추천 성능이 개선됨을 보였다. 실무적인 관점에서 볼 때, 본 연구는 소비자의 구매 만족도를 향상시키고 판매자의 매출을 증가시키는 데에 기여할 수 있을 것으로 기대된다.