Abstract
Participating in exhibitions is one of the major activities for tourists. When selecting their next travel destination after participating in an event, they use map services and social network services, such as blogs, to obtain information about tourist attractions. The map services are location-based recommendations, because they can easily retrieve information regarding nearby places. Blogs contain informative content about tourist attractions, thereby providing content-based recommendations. However, few services consider both location and content. In location-based recommendations, tourist attractions that are not related to the content of the event attended might be recommended. Content-based recommendation has a disadvantage in that events located at a distance might get recommended. We propose an algorithm that considers both location and content, based on information from the Korea Tourism Organization's Linked Open Data (LOD), Wikipedia, and a Korean dictionary. By extracting nouns from the description of a tourist attraction and then comparing them with nouns about other attractions, a content-based relationship is determined. The distance to the event is calculated based on the latitude and longitude of each tourist attraction. A weight selected by the user is used for linear combination with the content-based relationship to determine the preference order of the recommendations.
관광객이 관광 도중에 각종 문화제, 전시회, 공연 등의 이벤트에 참여하는 경우가 있다. 관광객이 이벤트에 참여 후 다음 관광지를 결정하게 되는데, 관광지 정보를 얻을 수 있는 수단은 지도 서비스, 블로그와 같은 소셜네트워크서비스 등이 존재한다. 지도 서비스를 활용하면 관광객이 현재 위치한 장소 주변의 관광지를 쉽게 검색할 수 있다. 이는 위치 기반 관광지 추천으로 활용될 수 있다. 블로그 등은 관광지의 내용을 담고 있기 때문에 관광객이 이벤트의 내용과 관련된 관광지를 찾을 수 있다. 이는 내용 기반 관광지 추천으로 활용될 수 있다. 하지만, 위치 기반 추천의 경우 이벤트의 내용과 관련이 없이 단순히 가까운 관광지가 추천이 될 수 있고, 내용 기반 추천의 경우 거리가 먼 관광지가 추천이 될 수 있는 단점이 있다. 위치와 내용을 모두 고려하는 관광지 추천 서비스는 거의 없다. 본 연구에서는 두 가지 방법의 장점만을 취하기 위해 한국관광공사 LOD(Linked Open Data), 위키피디아, 국어사전 등에 기반하여 위치와 내용을 모두 고려한 관광지 추천 알고리즘을 제시한다. 관광지의 설명글로부터 명사들을 추출한 뒤 다른 관광지의 명사들과 비교를 하여 동일한 명사가 많이 있을수록 내용이 관련이 있다고 판단한다. 정확히 동일한 명사가 없어도 위키피디아에 있는 키워드를 활용하여 관련된 명사가 존재할 경우에도 관련이 있다고 판단한다. 각 관광지의 위도와 경도를 기준으로 거리를 계산한 뒤 사용자가 선택한 가중치로 상기 내용 기반 관련도와 선형결합하여 추천순위를 계산한다.