• 제목/요약/키워드: full-text search

검색결과 90건 처리시간 0.02초

종이기록 데이터화를 위한 AI-OCR 적용 사례연구 (A Case Study on the Application of AI-OCR for Data Transformation of Paper Records)

  • 안세진;황현호;임진희
    • 정보관리학회지
    • /
    • 제39권3호
    • /
    • pp.165-193
    • /
    • 2022
  • 현대 업무환경 변화의 중심은 디지털 기술이라고 할 수 있다. 특히 업무관리시스템 및 문서생산시스템에서 생산한 기록으로 업무를 증명하는 일반적인 공공기관에서 기록관리체계는 업무환경 그 자체이기도 하다. 김포시는 제4차 산업혁명기술 시대에 선제적으로 대응하고 업무환경 혁신을 이루기 위해 한국지능정보사회진흥원(NIA)의 2021년 공공부문 클라우드 선도 프로젝트 사업에 지원하였고 선도 기관으로 확정되어 3억 3천의 지원을 받아 공공 클라우드 기반의 AI-OCR을 통한 기록물 검색 및 활용기능 강화 프로젝트를 진행하였다. 이를 통해 규격화된 색인 값에 의존한 검색과 이미지 열람에 그치던 비전자기록의 한계를 넘어 데이터화 하였고 AI-OCR이라는 신기술 적용으로 98%의 인식률을 구현하였다. 공공기관에 디지털 기술을 사용하여 업무 효율화, 생산성 향상, 개발비용 절감, 내·외부 이용자들의 기록관리 서비스 수준의 제고를 이루었기에 신기술과 기록물관리의 결합 사례연구를 통해 기록관리 분야 본연의 전문성을 높이는 방향과 업무환경 혁신 구현 사례를 공유하고자 한다.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

한국에서 유통정보기술 투자가 주가에 미치는 영향에 관한 연구 : RFID 사례를 중심으로 (Distribution Information Technology Investment and the Market Value of the Firm : Focusing on RFID case)

  • 손삼호
    • 유통과학연구
    • /
    • 제16권10호
    • /
    • pp.65-76
    • /
    • 2018
  • Purpose - This paper investigates how the market value of the firms are impacted by distribution information technology investment in Korea over time and across markets, industries and project characteristics. This is the first empirical study on the market payoffs from the RFID investment in Korea. The purpose of this study is to provide a appropriate guideline for investors and practitioners with respect to the announcement representing RFID adoption in Korea. This reaction guideline will stimulate the practitioners to monitor and evaluate the benefits and costs of the innovative RFID technology. Research design, data, and methodology - This paper employs event study methodology to analyze the payoffs from distribution information technology investment announcements over a fifteen-year period from 2003 to 2017. Event study method is based on the assumptions such as market efficiency, unanticipated RFID invest announcements and no confounding effects in the data. This study collected the information on RFID investment announcements by using a full text search engine Bigkinds provided by Korea Press Foundation over a fifteen-year period from January 2003 through December 2017. This paper selected 88 announcements representing RFID adoption by 46 firms. This paper estimated the payoffs from RFID investment announcement through events windows by using the market model of Mcwilliams and Siegel (1997) and calculated the Z-values. Using this test statistics we could infer if RFID adoption make large differences in abnormal returns across various classifications of the firms. Results - There is significant positive market returns from the announcement representing distribution information technology investment in the pre-2009 time period, the significances of payoffs disappear in the post-2009 time period. For this reason investors or practitioners can understand the importance of market entry time and the fact that the greater rewards may belong to early innovators while late imitators cannot reap such a rewards. This paper also find that there is a large differences in the payoffs from the announcement across markets, industries and project characteristics. Conclusions - Analysing the selected sample of 88 announcements representing RFID Adoption over fifteen-year period from 2003 to 2017, this study find that there is not only significant abnormal excess returns from RFID investment announcements but also there is great differences in the abnormal returns over time and across firm sizes or affiliated markets, industries, and project characteristics. This means that there are considerable values for the investors across various firm classifications. The findings of this paper provide useful implications for the practitioners to make judicious decisions whether to adopt the innovative technologies in general or not considering the various concrete circumstances in Korea.

조영제 유발 신장병증 예방을 위한 수액요법에 관한 근거기반 임상실무지침 개발 (Evidence-Based Clinical Practice Guideline for Fluid Therapy to Prevent Contrast-induced Nephropathy)

  • 이경해;신경민;이현정;김소영;채정원;김미라;한민영;안미숙;박진경;정미애;추상희;황정화
    • 임상간호연구
    • /
    • 제23권1호
    • /
    • pp.83-90
    • /
    • 2017
  • Purpose: This study was to develop evidence-based clinical practice guideline in order to prevent contrastinduced nephropathy (CIN) for patients undergoing percutaneous coronary intervention (PCI). Methods: The guideline was developed based on the "Scottish Intercollegiate Guidelines Network (SIGN)". The first draft of guideline was developed through 5 stages and evaluated by 10 experts.(1) Clinical questions were ensured in PICO format.(2) Two researchers conducted a systematic search through electronic database, identifying 170 studies. We selected 27 full text articles including 16 randomized clinical trials, 7 systematic reviews, and 4 guidelines. Quality of each studies were evaluated by the Cochran's Risk of Bias, AMSTAR, K-AGREEII. Among the studies, 11 studies were excluded.(3) The strength of recommendations were classified and quality of recommendations were ranked.(4) Guideline draft was finalized.(5) Content-validation was conducted by an expert group. All contents were ranked above 0.8 in CVI. Results: Evidence-based clinical practice guideline to prevent CIN was dveloped.(1) The guideline for preventing CIN recommends using 0.9% saline.(2) Standardized rate of fluid therapy is 1 to 1.5ml/kg/hr.(3) Execute hydration for 6~12hrs before PCI and after PCI. Conclusion: This study suggests evidence-based clinical practice guideline for preventing CIN which can be more efficiently used in clinical practice.

머신러닝을 활용한 뇌졸중 환자의 기능적 결과 예측: 체계적 고찰 (Predicting Functional Outcomes of Patients With Stroke Using Machine Learning: A Systematic Review)

  • 배수영;;남상훈;홍익표
    • 재활치료과학
    • /
    • 제11권4호
    • /
    • pp.23-39
    • /
    • 2022
  • 목적 : 본 연구는 뇌졸중 환자의 기능적 결과를 예측하기 위한 인구통계학적 및 임상학적 특징과 머신러닝의 사용을 체계적으로 분석하고 요약하기 위해 수행되었다. 연구방법 : PubMed, CINAHL과 Web of Science를 사용하여 2010년부터 2021년 사이에 게재된 연구를 검색하였다. 주요 검색어는 "machine learning OR data mining AND stroke AND function OR prediction OR/AND rehabilitation"을 사용하였다. 뇌 이미지 처리 기법만을 분석한 연구, 딥러닝만 적용한 연구와 전체 본문을 열람할 수 없는 연구는 제외되었다. 결과 : 검색한 결과, 총 9편의 국내외 논문을 선정했다. 선정된 논문에서 가장 많이 사용된 머신러닝 알고리즘은 서포트 벡터 머신(support vector machine, 19.05%)과 랜덤포레스트(random forest, 19.05%)였다. 9개 중 7개의 연구에서 뇌졸중 환자의 기능을 예측하기 위해 중요하다고 추출된 변수를 결과로 제시했다. 그 결과, 5개(55.56%)의 연구에서 뇌졸중 환자의 기능을 예측하기 위해 환자의 임상적 특성이 아닌 modified ranking scale (mRS) 및 functional independence measure (FIM)과 같은 초기 또는 퇴원 평가 점수가 중요하다고 도출되었다. 결론 : 이 연구는 mRS 및 FIM과 같은 뇌졸중 환자의 초기 또는 퇴원 평가 점수가 임상적 특성보다 기능적 결과에 더 많은 영향을 미칠 수 있음을 나타냈다. 따라서, 뇌졸중 환자의 기능적 결과를 향상시키기 위한 최적의 중재를 개발하고 적용하기 위해서는 뇌졸중 환자의 초기 및 퇴원 시 기능적 결과를 평가하고 검토하는 것이 필요하다.

장애청소년의 전환프로그램 : 연구 동향 분석과 체계적 고찰 (Transition Program for Youth With Disabilities: Research Trend Analysis and Systematic Review)

  • 안수빈;박혜연
    • 재활치료과학
    • /
    • 제11권3호
    • /
    • pp.23-36
    • /
    • 2022
  • 목적 : 본 연구는 전환프로그램 연구동향과 장애청소년을 대상으로 국내외 전환프로그램의 중재 및 효과를 체계적으로 분석함으로써 학교 및 지역사회 관련 기관들과 협력하여 성인생활의 모든 측면을 포함할 수 있는 중재 전략에 대한 기초자료를 제공하는 것을 목적으로 한다. 연구방법 : 학술연구정보서비스(Research Information Sharing Service: RISS), Pubmed, Web of Science(WoS) 데이터베이스를 사용하여 2006년부터 2021년까지의 게재된 논문을 검색하였다. 주요 검색어는 'Disability' AND ('Adolescents' OR 'Young adult') AND ('Transition education' OR 'Transition program')를 사용하였다. 최종적으로 7편의 국내외 논문을 본 연구의 분석 대상으로 선정하여 전문을 검토하였다. 또한, WoS(Web of Science) 플랫폼과 VOSviewer(version 1.6.16, CWTS, Netherlands, 2020) 프로그램을 이용하여 키워드와 국가 관계를 분석하고 시각화하였다. 결과 : 7개의 논문에서 참여한 대상자를 유형별로 분석한 결과, 대상자는 ASD, ADHD, ID, DD, physical disability 총 5가지로 분류되었다. 중재에 사용된 영역은 크게 직업(학업), 자기관리(시간), 상호작용(대인관계, 의사소통) 3가지 범주로 혼합되어 실시되었다. 중재 결과 7편 중 1편을 제외하고는 사회성 및 적응, 삶의 질, 일상생활활동 세 가지 분류 중 적어도 하나 이상의 부분에서 유의미한 향상을 보였다. 결론 : 본 연구는 전환프로그램의 연구동향을 파악하면서 프로그램의 적용과 그 효과를 정리하여 다양한 전문가와의 교류하는 방향성을 제시하는 동시에 단편적인 측면이 아닌 성인생활의 모든 측면을 확대하는 기초자료로 활용될 수 있을 것이다.

비정형 빅데이터의 실시간 복합 이벤트 탐지를 위한 기법 (The Method for Real-time Complex Event Detection of Unstructured Big data)

  • 이준희;백성하;이순조;배해영
    • Spatial Information Research
    • /
    • 제20권5호
    • /
    • pp.99-109
    • /
    • 2012
  • 최근 소셜 미디어의 발달과 스마트폰의 확산으로 SNS(Social Network Service)가 활성화가 되면서 데이터양이 폭발적으로 증가하였다. 이에 맞춰 빅데이터 개념이 새롭게 대두되었으며, 빅데이터를 활용하기 위한 많은 방안이 연구되고 있다. 여러 기업이 보유한 빅데이터의 가치창출을 극대화하기 위해 기존 데이터와의 융합이 필요하며, 물리적, 논리적 저장구조가 다른 이기종 데이터 소스를 통합하고 관리하기 위한 시스템이 필요하다. 빅데이터를 처리하기 위한 시스템인 맵리듀스는 분산처리를 활용하여 빠른게 데이터를 처리한다는 이점이 있으나 모든 키워드에 대해 시스템을 구축하여 저장 및 검색 등의 과정을 거치므로 실시간 처리에 어려움이 따른다. 또한, 이기종 데이터를 처리하는 구조가 없어 복합 이벤트를 처리하는데 추가 비용이 발생할 수 있다. 이를 해결하는 방안으로 기존에 연구된 복합 이벤트 처리 시스템을 활용하여 실시간 복합 이벤트 탐지를 위한 기법을 제안하고자 한다. 복합 이벤트 처리 시스템은 서로 다른 이기종 데이터 소스로부터 각각의 데이터들을 통합하고 이벤트들의 조합이 가능하며 스트림 데이터를 즉시 처리할 수 있어 실시간 처리에 유용하다. 그러나 SNS, 인터넷 기사 등 텍스트 기반의 비정형 데이터를 텍스트형으로 관리하고 있어 빅데이터에 대한 질의가 요청될 때마다 문자열 비교를 해야 하므로 성능저하가 발생할 여지가 있다. 따라서 복합 이벤트 처리 시스템에서 비정형 데이터를 관리하고 질의처리가 가능하도록 문자열의 논리적 스키마를 부여하고 데이터 통합 기능을 제안한다. 그리고 키워드 셋을 이용한 필터링 기능으로 문자열의 키워드를 정수형으로 변환함으로써 반복적인 비교 연산을 줄인다. 또한, 복합 이벤트 처리 시스템을 활용하면 인 메모리(In-memory)에서 실시간 스트림 데이터를 처리함으로써 디스크에 저장하고 불러들이는 시간을 줄여 성능 향상을 가져온다.

디지털 아카이브즈의 문제점과 방향 - 문화원형 콘텐츠를 중심으로 - (Digital Archives of Cultural Archetype Contents: Its Problems and Direction)

  • 함한희;박순철
    • 한국비블리아학회지
    • /
    • 제17권2호
    • /
    • pp.23-42
    • /
    • 2006
  • 본고는 문화원형콘텐츠를 유통시키고 있는 문화콘텐츠닷컴의 디지털아카이브 시스템에 주목해서 문제점을 분석하고 대안을 제시하는 것이 목적이다. 문화원형콘텐츠는 전통문화와 컴퓨터기술을 접목시켜 개척한 새로운 분야이다. 정부에서는 이 산업을 육성해서 한국문화의 세계화와 국가 경쟁력을 강화시킬 의도를 가지고 있다. 우리나라의 역사와 전통 풍물 생활 전승 예술 지리지 등 다양한 분야의 문화원형을 디지털 콘텐츠화하여 문화산업에 필요한 창작소재로 제공하는 것이 그 핵심내용이다. 아울러 디지털 콘텐츠 유통체계 정립과 저작권 관리를 통해서 공공부문 문화콘텐츠의 산업적 활용도를 제고하려는 의도도 포함된다. 본고에서 다루는 대상자료는 현재 문화콘텐츠닷컴에서 유통, 관리되고 있는 문화원형콘텐츠들이다. 이 성과물들은 2002년부터 2005년까지 개발되어서 문화콘텐츠닷컴 DB에 구축되어 있다. 이 자료들을 통해서 현재의 디지털아카이브 시스템의 문제점을 분석하였고, 현재의 시스템이 안고 있는 한계점을 요약하면 다음과 같다. 첫째는 각 자료에서 사용하는 주요 용어의 선택에 따라 유사한 자료들이 서로 다른 주제로 분류되면서 다른 항목에 속하게 되는 것이다. 둘째는, 따라서 서로 다른 항목 간에 교차검색이 이루어지지 않는 한계점이 있다. 현재의 제 문제를 해결할 수 있는 방법으로 본고에서는 온톨로지 기능을 포함한 데이터마이닝시스템을 이용해서 풍부한 지식정보표현과 활용이 가능한 디지털아카이브 시스템을 제안하고 있다. 데이터마이닝은 다섯 가지의 방법으로 가능하다. 의미검색 문서요약 문서클러스터링 문서분류 그리고 주제추적이다. 최근에 빠르게 개발되고 있는 디지털 신기술도 인문학과 긴밀하게 연결되지 않으면, 그 활용도가 제한적이라는 점을 본고를 통해서 지적하였다. 창작소재로서의 문화원형콘텐츠의 활용도를 크게 향상시킬 수 있는 길은 바로 신지식관리를 위한 통학적(uni-discipline) 접근이라는 점을 일깨우고자 한다.

추천시스템관련 학술논문 분석 및 분류 (A Literature Review and Classification of Recommender Systems on Academic Journals)

  • 박득희;김혜경;최일영;김재경
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.139-152
    • /
    • 2011
  • 1990년대 중반에 협업 필터링의 출현으로 인하여 추천시스템에 관련된 연구가 늘어나게 되었다. 협업 필터링의 출현 이후 내용 기반 필터링, 협업 필터링과 내용 기반 필터링이 혼합된 하이브리드 필터링 등 새로운 기법들이 출현함으로써 2000년대에는 추천시스템의 연구가 눈에 띄게 증가하였다. 하지만 현재까지 추천시스템에 관련된 문헌들에 대한 리뷰와 분류가 체계적으로 되어있지 않다. 이와 같은 문제에 대한 해결방안으로써, 본 연구에서는 2001년부터 2010년도까지의 추천시스템에 관련된 문헌들 중 MIS Journal Ranking의 125개의 저널에서 추천시스템(Recommender system, Recommendation system), 협업 필터링(Collaborative Filtering), 내용 기반 필터링(Content based Filtering), 개인화 시스템(Personalized system) 등의 5가지 키워드로 제한하여 조사하였다. 총 37개의 저널에서 논문을 검색하였으며, 검색되어진 논문을 분석한 결과 추천시스템과 관련이 없는 논문을 제외한 총 187개의 논문을 선정하여 분석하였다. 이 연구에서는 그러나 컨퍼런스 논문, 석사, 박사학위 논문, 영어로 작성되지 않은 논문, 완성되지 않은 논문 등은 제외하였다. 본 연구에서는 187개의 논문을 분석하여 2001년부터 2010년까지의 각각의 년도 별 추천시스템의 연구에 대한 동향 분석, Journal별 추천시스템의 게재 분류, 추천시스템 어플리케이션의 사용 분야(책, 문서, 이미지, 영화, 음악, 쇼핑, TV 프로그램, 기타)별 분류 및 분석, 추천시스템에 사용된 데이터마이닝 기술(연관 규칙, 군집화, 의사 결정나무, 최근접 이웃 기법, 링크 분석 기법, 신경망, 회귀분석, 휴리스틱 기법)별 분류 및 분석을 수행하였다. 따라서 본 연구에서 제안한 각각의 분류 및 분석 결과들을 통하여 현재까지 추천시스템의 연구에 대한 연구 동향을 파악 할 수 있었으며, 분석결과를 통해 추천시스템에 관심이 있는 연구자와 전문가에게 미래의 추천시스템의 연구에 대한 가이드라인을 제시 할 수 있을 것이라고 기대한다.

모바일 랜드마크 가이드 : LOD와 문맥적 장치 기반의 실외 증강현실 (A Mobile Landmarks Guide : Outdoor Augmented Reality based on LOD and Contextual Device)

  • 조비성;누르지드;장철희;이기성;조근식
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.1-21
    • /
    • 2012
  • 최근 스마트폰의 등장으로 인해 사용자들은 시간과 공간의 제약 없이 스마트폰을 이용한 새로운 의사소통의 방법을 경험하고 있다. 이러한 스마트폰은 고화질의 컬러화면, 고해상도 카메라, 실시간 3D 가속그래픽과 다양한 센서(GPS와 Digital Compass) 등을 제공하고 있으며, 다양한 센서들은 사용자들(개발자, 일반 사용자)로 하여금 이전에 경험하지 못했던 서비스를 경험할 수 있도록 지원하고 있다. 그 중에서 모바일 증강현실은 스마트폰의 다양한 센서들을 이용하여 개발할 수 있는 대표적인 서비스 중 하나이며, 이러한 센서들을 이용한 다양한 방법의 모바일 증강현실 연구들이 활발하게 진행되고 있다. 모바일 증강현실은 크게 위치 정보 기반의 서비스와 내용 기반 서비스로 구분할 수 있다. 위치 정보 기반의 서비스는 구현이 쉬운 장점이 있으나, 증강되는 정보의 위치가 실제의 객체의 정확한 위치에 증강되는 정보가 제공되지 않는 경우가 발생하는 단점이 존재한다. 이와 반대로, 내용 기반 서비스는 정확한 위치에 증강되는 정보를 제공할 수 있으나, 구현 및 데이터베이스에 존재하는 이미지의 양에 따른 검색 속도가 증가하는 단점이 존재한다. 본 논문에서는 위치 정보 기반의 서비스와 내용기반의 서비스의 장점들을 이용한 방법으로, 스마트폰의 다양한 센서(GPS, Digital Compass)로 부터 수집된 정보를 이용하여 데이터베이스의 탐색 범위를 줄이고, 탐색 범위에 존재하는 이미지들의 특징 정보를 기반으로 실제의 랜드마크를 인식하고, 인식한 랜드마크의 정보를 링크드 오픈 데이터(LOD)에서 검색하여 해당 정보를 제공하는 랜드마크 가이드 시스템을 제안한다. 제안하는 시스템은 크게 2개의 모듈(랜드마크 탐색 모듈과 어노테이션 모듈)로 구성되어있다. 첫 번째로, 랜드마크 탐색 모듈은 스마트폰으로 인식한 랜드마크(건물, 조형물 등)에 해당하는 정보들을 (텍스트, 사진, 비디오 등) 링크드 오픈 데이터에서 검색하여 검색된 결과를 인식한 랜드마크의 정확한 위치에 정보를 제공하는 역할을 한다. 스마트폰으로부터 입력 받은 이미지에서 특징점 추출을 위한 방법으로는 SURF 알고리즘을 사용했다. 또한 실시간성을 보장하고 처리 속도를 향상 시키기 위한 방법으로는 입력 받은 이미지와 데이터베이스에 있는 이미지의 비교 연산을 수행할 때 GPS와 Digital Compass의 정보를 사용하여 그리드 기반의 클러스터링을 생성하여 탐색 범위를 줄임으로써, 이미지 검색 속도를 향상 시킬 수 있는 방법을 제시하였다. 두 번째로 어노테이션 모듈은 사용자들의 참여에 의해서 새로운 랜드마크의 정보를 링크드 오픈 데이터에 추가할 수 있는 기능을 제공한다. 사용자들은 키워드를 이용해서 링크드 오픈 데이터로에서 관련된 주제를 검색할 수 있으며, 검색된 정보를 수정하거나, 사용자가 지정한 랜드마크에 해당 정보를 표시할 수 있도록 지정할 수 있다. 또한, 사용자가 지정하려고 하는 랜드마크에 대한 정보가 존재하지 않는다면, 사용자는 랜드마크의 사진을 업로드하고, 새로운 랜드마크에 대한 정보를 생성하는 기능을 제공한다. 이러한 과정은 시스템이 카메라로부터 입력 받은 대상(랜드마크)에 대한 정확한 증강현실 컨텐츠를 제공하기 위해 필요한 URI를 찾는데 사용되며, 다양한 각도의 랜드마크 사진들을 사용자들에 의해 협업적으로 생성할 수 있는 환경을 제공한다. 본 연구에서 데이터베이스의 탐색 범위를 줄이기 위해서 랜드마크의 GPS 좌표와 Digital Compass의 정보를 이용하여 그리드 기반의 클러스터링 방법을 제안하여, 그 결과 탐색시간이 기존에는 70~80ms 걸리는 반면 제안하는 방법을 통해서는 18~20ms로 약 75% 정도 향상된 것을 확인할 수 있었다. 이러한 탐색시간의 감소는 전체적인 검색시간을 기존의 490~540ms에서 438~480ms로 약 10% 정도 향상된 것을 확인하였다.