• 제목/요약/키워드: DBpedia

검색결과 30건 처리시간 0.021초

한글 DBpedia 온톨로지 스키마 구축 (Building a Schema of the Korean DBpedia Ontology)

  • 강민서;김재성;김선동;이재길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-142
    • /
    • 2014
  • 시맨틱웹의 구현 도구로써 온톨로지가 있다. 온톨로지는 지식개념의 의미적 연결을 하는데 사용된다. 영어 위키피디아를 토대로 한 영어 DBpedia 온톨로지는 스키마(owl파일 형태)와 인스턴스 모두 잘 구축이 되어있다. 그리고 영어 DBpedia의 각 Class에 한글은 레이블의 형태로 달려있다. 하지만 한글 레이블을 가지고 있지 않은 영어 DBpedia의 Class들이 절반이 넘기 때문에 한글 Class들만으로 된 스키마 구축은 의미가 있다. 한글 Class들로 만들어진 스키마가 있다면 두 한글 온톨로지 사이의 클래스 매칭 알고리즘을 위한 실험이나 한글 온톨로지 자동 증강 알고리즘의 연구 등에 유용하게 쓰일 수 있을 것이다. 본 논문에서 구축한 한글 DBpedia 온톨로지 스키마는 영문 DBpedia 온톨로지의 계층구조와 한글 클래스와 영문 클래스 사이의 매핑정보를 바탕으로 구축되었다. 그리고 기존에 제공되는 한글 DBpedia 온톨로지 클래스의 영어매핑 정보가 있는 한글 프로퍼티와 영어매핑 정보가 없는 한글 프로퍼티를 모두 한글 클래스의 프로퍼티로 입력해주었다.

  • PDF

위치 기반 DBpedia 모바일 브라우저 개발 (Development of Location-based DBpedia Mobile Browser)

  • 이수형;단홍주;정은미;선위시앙;이용주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.1047-1048
    • /
    • 2017
  • 본 논문은 위치 기반 DBpedia 모바일 브라우저 개발에 관한 내용으로 사용자의 현재 위치를 중심으로 Google Map과 DBpedia를 매쉬업하여 주변의 DBpedia 개체를 표시하고, 링크를 통해 추가적인 RDF 시맨틱 정보를 탐색할 수 있는 기능을 제공한다. DBpedia는 Wikipedia로부터 구조화된 데이터를 추출하여 RDF 형식으로 저장한 지식베이스로서 오늘날 엄청난 규모의 빅데이터로 발전되고 있는 링크드 오픈 데이터(Linked Open Data)에서 가장 핵심으로 부각되고 있다. DBpedia는 약 73만개의 장소 및 지역에 관한 정보를 포함하여 약 4백 58만 가지의 다양한 개체들에 관한 정보를 가지고 있으며 여러 종류의 위치기반 데이터 세트도 보유하고 있다. 본 연구에서 개발된 브라우저는 이러한 데이터 세트 내용을 스마트폰의 위치정보서비스를 활용하여 주변에 있는 장소나 건물 등을 지도에 표시하고, 해당 개체에 대한 간단한 요약 정보와 추가적인 시맨틱 정보 검색을 위한 링크를 제공한다.

데이터의 웹을 위한 상호연결된 대규모 온톨로지 네트워크 구축 (Constructing a Large Interlinked Ontology Network for the Web of Data)

  • 강신재
    • 한국산업정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.15-23
    • /
    • 2010
  • 본 논문에서는 국내외 대표적 온톨로지 지식베이스의 연결을 통하여 대규모 온톨로지망을 구축할 수 있는 방법론을 제시한다. 온톨로지는 일반에 공개되어 공유될 때 그 가치가 커지게 되므로, 국내의 대표적인 CoreOnto 온톨로지를 기존 온톨로지망에 연결하여 국내외적으로 공개하고 활용성을 높이고자 한다. YAGO 온톨로지는 Wikipedia의 카테고리 정보와 WordNet의 계층정보를 추출하여 구축되었으며, DBpedia 분류체계의 백본으로 활용되었다. 이에 기반하여 WordNet의 Synset을 매개로 하여 CoreOnto 온톨로지를 YAGO와 DBpedia 온톨로지에 연결할 수 있는 방법론을 제시하였다.

지식베이스 구축을 위한 한국어 위키피디아의 학습 기반 지식추출 방법론 및 플랫폼 연구 (Knowledge Extraction Methodology and Framework from Wikipedia Articles for Construction of Knowledge-Base)

  • 김재헌;이명진
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.43-61
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 인공지능 기술에 대한 연구가 활발히 진행되고 있으며, 이전의 그 어느 때보다도 기술의 발전이 빠르게 진행되고 있는 추세이다. 이러한 인공지능 환경에서 양질의 지식베이스는 인공지능 기술의 향상 및 사용자 경험을 높이기 위한 기반 기술로써 중요한 역할을 하고 있다. 특히 최근에는 인공지능 스피커를 통한 질의응답과 같은 서비스의 기반 지식으로 활용되고 있다. 하지만 지식베이스를 구축하는 것은 사람의 많은 노력을 요하며, 이로 인해 지식을 구축하는데 많은 시간과 비용이 소모된다. 이러한 문제를 해결하기 위해 본 연구에서는 기계학습을 이용하여 지식베이스의 구조에 따라 학습을 수행하고, 이를 통해 자연어 문서로부터 지식을 추출하여 지식화하는 방법에 대해 제안하고자 한다. 이러한 방법의 적절성을 보이기 위해 DBpedia 온톨로지의 구조를 기반으로 학습을 수행하여 지식을 구축할 것이다. 즉, DBpedia의 온톨로지 구조에 따라 위키피디아 문서에 기술되어 있는 인포박스를 이용하여 학습을 수행하고 이를 바탕으로 자연어 텍스트로부터 지식을 추출하여 온톨로지화하기 위한 방법론을 제안하고자 한다. 학습을 바탕으로 지식을 추출하기 위한 과정은 문서 분류, 적합 문장 분류, 그리고 지식 추출 및 지식베이스 변환의 과정으로 이루어진다. 이와 같은 방법론에 따라 실제 지식 추출을 위한 플랫폼을 구축하였으며, 실험을 통해 본 연구에서 제안하고자 하는 방법론이 지식을 확장하는데 있어 유용하게 활용될 수 있음을 증명하였다. 이러한 방법을 통해 구축된 지식은 향후 지식베이스를 기반으로 한 인공지능을 위해 활용될 수 있을 것으로 판단된다.

위치기반 DBpedia 검색을 위한 반응형 웹 애플리케이션 개발 (Developing Responsive Web Application for Location Based DBpedia Retrieval)

  • 이수형;이용주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.975-977
    • /
    • 2017
  • 본 논문은 링크드 오픈 데이터(Linked Open Data)의 일종인 DBpedia 개체를 위치기반으로 검색하여 지도상에 표시해주고, 표시된 개체중 하나를 선택하게 되면 개체에 관한 RDF 형태의 데이터를 파싱하여 개체에 관한 기본적인 정보와 사진과 외부로의 링크 등을 제공한다. 또한 개체가 가지는 특성을 지정하여 지도에 선택적으로 표시하는 필터링 기능을 제공한다. 이러한 웹 애플리케이션을 개발하기 위해 오픈소스 웹 프레임워크인 루비 온 레일즈(Ruby on Rails)를 사용하였고, HTML5와 Google Map API를 활용한 반응형 웹 애플리케이션으로 구현하였다.

구글 클라우드 자연어 API를 이용한 DBpedia 웹 검색 애플리케이션 (DBpedia Web Search Application using Google Cloud Natural Language API)

  • 이수형;김태영;박선재;이용주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.509-511
    • /
    • 2018
  • 본 논문은 링크드 오픈 데이터(Linked Open Data)의 일종인 DBpedia 개체를 자연어 기반으로 검색하는 애플리케이션 개발에 관한 논문이다. Google Cloud Natural Language API를 이용하여 자연어 입력을 분석하고, 이를 바탕으로 RDF(Resource Description Framework) 검색 언어인 스파클(Sparql) 질의 문장을 작성하여 결과를 웹 형식으로 반환해준다. 이를 통해 비문가도 손쉽게 링크드 오픈 데이터에 접근할 수 있는 기회를 제공하며 다양한 응용 가능성을 가진다.

SPARQL 기반의 질의응답 시스템 설계 (Design of a Question-answering System Based on SPARQL)

  • 안혁주;이성희;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.153-155
    • /
    • 2014
  • 사용자가 질의한 내용에 대한 결과를 찾기 위해 본 논문은 DBPedia에서 제공해주는 트리플 구조를 TDB에 저장하고, 사용자 질의 문장에서 트리플을 찾은 뒤 해당 문장의 규칙을 추론하여 SPARQL 쿼리를 생성한 뒤, 마지막으로 Fuseki를 이용해 결과를 출력하는 Q&A시스템을 제안한다. SPARQL 쿼리를 생성함에 있어 질의의 정답을 찾아내는 타겟이 있다는 점과 한국어의 조사와 부사부분에서 쿼리가 변형될 수 있다는 점을 통해 유동적인 쿼리를 생성한다. 그리고 DBPedia에 없는 단어가 질의에서 나타날 수 있기 때문에 이를 정제해주는 작업 또한 필요하다. 한국어는 어절순서가 고정적이지 않다는 점, 조사, 부사에 의해 문장의 의미가 변형되는 또 다른 부분을 파악하여 앞으로 시스템을 개발함에 있어 정확률을 상승시킬 예정이다.

  • PDF

링크드 오픈 데이터에서 TF-IDF를 이용한 새로운 시맨틱 거리 측정 기법 (A New Semantic Distance Measurement Method using TF-IDF in Linked Open Data)

  • 조정길
    • 한국융합학회논문지
    • /
    • 제11권10호
    • /
    • pp.89-96
    • /
    • 2020
  • 링크드 데이터는 다양한 영역의 데이터세트를 서로 연결할 수 있는 표준 방식의 구조화된 데이터를 가능하게 한다. 그리고 링크드 오픈 데이터(LOD)의 급속한 발전에 따라 연구자들은 시맨틱 유사도 평가와 같은 특정 문제를 해결하기 위해 LOD를 이용하고 있다. 이 논문에서는 LOD-기반 추천 시스템에서 사용될 수 있는 자원 간의 링크드 데이터 시맨틱 거리를 계산하기위한 방법을 제안한다. 이 논문에서 제안된 시맨틱 거리 측정 모델은 LOD-기반 시맨틱 거리와 정보 검색 분야에서 잘 알려진 TF-IDF를 이용한 새로운 링크 가중치를 결합한 유사도 측정을 기반으로 한다. 이 논문의 접근방식의 효과성을 검증하기 위하여 DBpedia와 MovieLens의 혼합 데이터를 사용하여 LOD-기반 추천 시스템의 맥락에서 성능을 평가하였다. 실험 결과는 제안된 방법이 다른 유사한 방법과 비교하여 더 높은 정확도를 나타내었다. 또한 시맨틱 거리 계산의 범위를 넓혀서 추천 시스템의 정확도 향상에 기여하였다.

테이블로부터 링크드 데이터 생성을 위한 패턴 충돌 해소 (Conflict Resolution of Patterns for Generating Linked Data From Tables)

  • 한용진;김권양;박세영
    • 한국지능시스템학회논문지
    • /
    • 제24권3호
    • /
    • pp.285-291
    • /
    • 2014
  • 최근 링크드 오픈 데이터(예, RDF, OWL)를 이용해 대량의 테이블로부터 새로운 링크드 데이터를 생성하기 위한 연구가 주목을 받고 있다. 본 논문은 이러한 링크드 데이터 생성을 위해 패턴을 이용한 방법을 제안한다. 패턴을 이용한 방법은 근본적으로 패턴들 간의 충돌 문제를 안고 있다. 예를 들어, 어떤 테이블 헤더(header)를 서로 다른 링크드 데이터 속성들로 맵핑하는 패턴들은 서로 충돌한다. 기존의 연구들은 통계적으로 우세한 패턴을 적용하여 정확도의 감소를 감수하거나 정확도를 높이기 위해 충돌하는 패턴들을 무시해 왔다. 제안하는 방법은 주어진 테이블에 적용되는 패턴들을 연계함으로써 모든 헤더들에 대한 적합한 패턴들을 찾는다. DBPedia와 위키피디아의 테이블을 이용한 실험에서 제안한 방법이 패턴 충돌을 효과적으로 해소하는 결과를 보였다.

기록정보 LOD 구축을 위한 의미 상호연결 자동화 실험 연구 (An Experimental Study on the Automatic Interlinking of Meaning for the LOD Construction of Record Information)

  • 하승록;안대진;임진희
    • 한국기록관리학회지
    • /
    • 제17권4호
    • /
    • pp.177-200
    • /
    • 2017
  • 빅데이터, 인공지능 등 신기술 환경에서 LOD는 기록정보자원을 내외부의 다양한 데이터들과 연결되도록 할 것이다. 이러한 연결의 중심에는 상호연결(Interlinking) 기술이 존재하며, 상호연결된 LOD는 기록정보 개방을 데이터 개방(Open Data)의 최상위 단계로 실현할 것이다. 지속적으로 증가하는 기록의 양을 감안하면, LOD 구축 시 상호연결 알고리즘을 통한 자동화는 필수적이다. 이에 본 연구는 기록정보가 외부 데이터와 상호연결되는 구조와 상호연결 시 고려해야 할 기록정보의 특성을 분석하였다. 또한 국가기록원 CAMS 데이터의 샘플을 수집하여 기록정보 LOD를 구축한 뒤, 기록물 메타데이터의 인물정보를 DBPedia와 자동으로 상호연결하는 테스트베드를 진행하였다. 이를 통해 상호연결 자동화 프로세스를 확인하고, 자동화 기술의 성능과 정확도를 확인하였다. 그리고 테스트베드를 통해 얻은 시사점을 통해 기록정보 LOD 상호연결 과정의 고려사항을 파악하였다.