Abstract
LOD(Linked Open Data) is composed of RDF triples which are based on ontologies. They are identified, linked, and accessed under the principles of linked data. Publications of LOD data sets lead to the extension of LOD cloud and ultimately progress to the web of data. However, if ontologically the same things in different LOD data sets are identified by different URIs, it is difficult to figure out their sameness and to provide trustworthy links among them. To solve this problem, we suggest a Trustworthiness Improving Link Evaluation, TILE for short, technique. TILE evaluates links in 4 steps. Step 1 is to consider the inference property of syntactic elements in LOD data set and then generate RDF triples which have existed implicitly. In Step 2, TILE appoints predicates, compares their objects in triples, and then evaluates links between the subjects in the triples. In Step 3, TILE evaluates the predicates' syntactic property at the standpoints of subject description and vocabulary definition and compensates the evaluation results of Step 2. The syntactic elements considered by TILE contain RDFS, OWL, OWL2 which are recommended by W3C. Finally, TILE makes the publisher of LOD data set review the evaluation results and then decide whether to re-evaluate or finalize the links. This leads the publishers' responsibility to be reflected in the trustworthiness of links among the data published.
LOD(Linked Open Data)는 온톨로지에 기반하여 구조화되고 링크드 데이터 원칙에 의거하여 식별, 연결, 접근되는 RDF 트리플들로 구성된다. 이러한 LOD 데이터집합의 공개는 LOD 클라우드의 확장으로 이어지며 궁극적으로는 데이터 중심적인 웹으로 진화한다. 그러나, 존재적으로 동일한 개체들이 여러 LOD 데이터집합들에 걸쳐 서로 다르게 식별되는 경우 이들간의 동일성을 파악하여 신뢰적인 연결을 제공하는 것은 어려운 작업이다. 이를 위하여 본 논문은 신뢰향상적 연결성 평가(Trustworthiness Improving Link Evaluation: TILE) 기법을 제시한다. 보다 신뢰적인 연결성 평가 결과를 도출하기 위하여 TILE은 4단계로 진행한다. 우선, TILE은 LOD 데이터집합의 문법요소들이 가지는 추론적 특징을 고찰하여 잠재적으로만 존재하고 있던 사실들을 RDF 트리플들로 실체화하여 이를 데이터집합에 보강한다. 두 번째 단계에서 지정한 술어의 목적어 값을 비교하여 평가를 수행하며 세 번째 단계에서 RDF 트리플의 술어부가 지니고 있는 문법적 특성을 주어서술적/어휘정의적 관점에서 평가한 후 이를 두 번째 단계의 결과에 추가 반영한다. 이 과정에서 TILE이 고찰하는 문법적 요소들은 LOD 클라우드를 구축하기 위하여 W3C가 제시한 언어인 RDFS, OWL, OWL2 모두를 망라한다. 마지막으로, LOD 데이터집합 공개자로 하여금 연결성 평가결과를 검토하여 재평가 실시 혹은 연결확정을 결정하도록 함으로써 공개하는 데이터의 연결성이 가져야 하는 신뢰성에 공개주체의 책임이 반영되도록 한다.