• 제목/요약/키워드: web Graph

검색결과 218건 처리시간 0.022초

위키피디아 문서로부터 트리플 추출과 RDF 그래프 생성 (Triple Extraction for RDF Graph Construction from Wikipedia Articles)

  • 이순웅;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.106-110
    • /
    • 2009
  • 웹이 발전하면서 점점 더 많은 정보가 웹을 통해 생성되고 공유되고 있다. 하지만 정보의 급격한 증가로 인해 정작 정확한 정보를 찾는 것은 오히려 더 어려워지고 있고, 이로 인해 특히 구조화되지 않은 텍스트에 대한 정확한 정보 검색의 필요성이 증가하고 있다. 본 논문에서는 위키피디아 문장들로부터 RDF 트리플을 추출하고 이를 하나의 연결된 RDF 그래프로 구성함으로써 효과적인 정보 검색을 수행하는 방법을 제안하고자 한다. 트리플 추출 방법은 문장에 대한 파스 트리를 탐색함으로써 이루어지는데, 약 81%의 정확도를 나타내었다. 최종적으로 생성되는 RDF 그래프는 입력 문장들의 문법적인 요소만을 고려하기 때문에 방법이 단순하지만 그래프 탐색을 통해 다양한 쿼리에 대한 정보 검색이 가능하다.

  • PDF

Link Analysis on Institutional Repository web Network of Indian Institute of Technologies Registered in open DOAR-uncovering Patterns and Trends Hidden in the Network

  • Kumar, Kutty
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제8권2호
    • /
    • pp.23-36
    • /
    • 2018
  • Institutional repositories (IR) are promising to be extremely advantageous to scholars especially in developing countries. IR initiatives started in India during the late nineties and the popularity of this concept is growing rapidly in the higher educational and research institutions to disseminate newly emerging knowledge and expertise. The purpose of this paper is to critically analyze the network links of IR websites among four IITs that are registered in open DOAR (Directory of Open Access Repositories) web portal. The Institutional Repositories chosen for the study are IIT Delhi, IIT Hyderabad, IIT Bombay, and IIT Kanpur. The analysis of the study focused on standard graph and network cohesion metrics, such as density, diameter, eccentricity and distances, and clustering coefficient; for an even more detailed analysis advanced centrality measures and fast algorithms such as clique census are used.

시각적 웹 기반 그래프 알고리즘 학습 시스템 (Visible Web-Based Graph Algorithm Learning System)

  • 윤선영;한현구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.97-102
    • /
    • 2006
  • 정보 통신의 발달과 인터넷 기술의 발달로 그래픽 등의 매체를 통하여 시간과 장소에 구애받지 않는 학습자 수준에서 적절한 교육을 받을 수 있는 쌍방향 멀티미디어 환경의 원격 웹 기반교육(Web Based Instruction, WBI)이 등장하게 되었다. 인터넷을 활용한 교육을 함으로써 개별화된 교육을 할 수 있고, 학습자들이 인터넷을 통해 함께 탐구하고 대화하며 결론에 도달하는 협력 학습의 장을 제공할 수 있게 되었다. 그래프 알고리즘은 자료구조의 한 분야로 종류도 다양하고 개념도 복잡하여 학습자들이 쉽게 이해하지 못하는 부분이 많았다. 본 논문에서는 그래프 알고리즘을 하이퍼텍스트를 통한 단순한 자료의 제시에 그치지 않고 웹의 장점을 살려 플래시를 통해 각 그래프 알고리즘의 수행단계를 시각적으로 보임으로써 그래프 개념을 쉽게 이해하고 여러 종류의 그래프 알고리즘을 효율적으로 반복 학습할 수 있도록 하였다. 또한 C로 구현된 각 알고리즘의 소스를 볼 수 있게 하고 그 결과도 보여줌으로 그래프 알고리즘을 정확히 이해하도록 하였다. 학습 후 평가 문제를 통해 학습자의 이해도를 평가하고 평가 결과를 막대그래프 차트로 보임으로써 비교 평가가 쉽게 구현하였다.

  • PDF

웹2.0의 참여형 아키텍쳐 환경에서 그래픽 기반 포크소노미 태그 연관 검색의 설계 및 구현 (Design and Implementation of the Graphical Relational Searching for Folksonomy Tags in the Participational Architecture of Web 2.0)

  • 김운용;박석규
    • 인터넷정보학회논문지
    • /
    • 제8권5호
    • /
    • pp.1-10
    • /
    • 2007
  • 최근 인터넷의 급격한 확장을 통해 대두되는 웹2.0 기술은 웹의 구조적 진화인 질적 변화와 사용자 증가라는 양적인 변화로 해석할 수 있으며, 이 구조는 사용자 참여형 아키텍쳐를 근간으로 하고 있다. 블로그, UCC, SNS(Social Networking Service), 매쉬 업, 롱테일 등으로 대표되는 웹2.0기술은 웹의 구조화에 중심적인 역할을 담당하고 있으며, 이곳에 포함된 사용자 참여형 자료의 분류와 검색은 포크소노미(Folksonomy)방식을 통해 널리 이용되고 있다. 포크소노미는 웹 페이지에 공개되고 있는 정보나 관련 주제를 고전적 분류학 기술로 나누는 것이 아니라 꼬리표(태그)에 따라 구분하는 새로운 분류방식으로 사용자 참여로 구성된다. 현재 이러한 분류를 통한 검색은 단순 텍스트 태그검색이나 태그클라우드 방식 등을 통해 특정 태그에 대한 검색이 이루어지고 있으나 태그들 간의 관계를 표현하고, 이들 관계를 고려한 검색은 미비한 실정이다. 이에 본 논문에서는 등록되는 태그들 간의 관계를 고려하여 태그들 간의 연관 그래프를 동적으로 형성하고 이를 기반으로 연관 검색을 제공한다. 이를 통해 태그 검색의 신뢰성을 높이고 검색의 편이성을 제공할 수 있을 것이다.

  • PDF

웹 마이닝을 위한 웹 문서 하이퍼링크와 웹 접근로그를 통합한 방향그래프 (Directed Graph by Integrating Web Document Hyperlink and Web Access Log for Web Mining)

  • 박철현;이성대;곽용원;전성환;박휴찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.16-18
    • /
    • 2005
  • 웹은 사용자가 원하는 정보를 쉽고 정확하게 검색할 수 있도록 웹 문서를 자료구조화하여 보다 신뢰성 있는 패턴을 추출하고 사용자의 특성과 행동 패턴을 적용하여 개인화 하여야한다. 본 논문에서는 개인화하기 위한 전처리 과정으로서 웹 문서를 구조화 하는 방법을 제안한다. 제안 방법은 기본적으로 웹 문서 태그의 하이퍼링크를 깊이 우선 탐색 알고리즘을 사용하여 방향그래프를 만드는 것이다. 이때 웹 문서 태그 탐색 시 플래시, 스크립트 등의 찾기 힘든 하이퍼링크를 찾는 문제와 '뒤로' 버튼 사용 시 웹 접근로그에 기록되지 않는 문제점을 보완한다. 이를 위해 클릭 스트림을 스택에 저장하여 이미 만들어진 방향그래프와 비교하여 새롭게 찾은 정점과 간선을 추가함으로써 보다 신뢰성높은 방향그래프를 만든다.

  • PDF

nML 프로그래밍 환경에서 SOAP 클라이언트 구현 (Implementation of SOAP Client in U Programming Environment)

  • 권오경;한태숙
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.164-172
    • /
    • 2003
  • 웹 서비스에 대한 구현이 많이 늘고 있다. 웹 서비스는 각 프로그래밍 언어에서 XML를 이용해서 원격 호출을 한다. 이때 사용하는 대표적인 프로토콜이 SOAP으로써 본 논문에서는 nML 프로그래밍 환경에서 SOAP 클라이언트 구현을 제시한다. nML은 한국과학기술원 ROPAS에서 만든 SML과 OCaml의 한국형 함수형 언어이다. nML에서의 soaptype 타입으로 SOAP 값을 정의한다. SOAP은 XML Schema에 의해서 객체에 대한 인코딩이 정의된다. 즉 XML Schema가 SOAP 값의 유효성을 판단한다. 본 논문은 XML Schema의 엘리먼트와 타입에 대한 정의로써 element와 typeinfo 타입을 정의한다. 그리고 상호호환성 테스트를 통하여 안전하게 다른 언어와 대응됨을 보인다.

신체 변화량을 이용한 웹 기반 비만 예방·관리 시스템 (Web-based Obesity Prevention and Management System Using a Body Variation)

  • 하의륜;강희범;정회경
    • 한국정보통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.1189-1194
    • /
    • 2016
  • 삶의 편의성이 증대되면서 체질량 지수 (Body Mass Index)가 높은 인구가 급속도로 증가하고 있다. 또한 이에 따라 비만을 관리하고 예방하기 위한 모니터링 시스템의 개발이 요구되고 있는 시점이다. 그러나 대부분의 모니터링 시스템은 사용자가 관리를 받기에는 정보가 적고, 간단한 정보만을 가지고 계산만하여 보여주기 때문에 효율성이 낮고, 질병을 가진 사용자를 정상인과 함께 관리하여 정확도가 떨어졌다. 이에 본 논문에서는 사용자의 체질량 지수를 그래프로 표현하고, BMR(Basal metabolic rate)지수를 등급으로 나누어 사용자가 자신을 관리하는데 정확도를 높였다. 또한 사용자가 사용한 운동 기구를 사용한 회수 별로 나타내 균형 잡힌 운동 기구 선택을 할 수 있게 하였고, 소모한 칼로리를 같이 나타내 운동 계획을 설계하는데 효율성을 높였고, 그래프의 경우 최근 데이터만 나타내 시각성을 높인 웹 기반 모니터링 시스템을 개발하였다.

그래프 탐색을 이용한 웹으로부터의 온톨로지 기반 규칙습득 (Rule Acquisition Using Ontology Based on Graph Search)

  • 박상언;이재규;강주영
    • 지능정보연구
    • /
    • 제12권3호
    • /
    • pp.95-110
    • /
    • 2006
  • 지능형 에이전트와 규칙기반 시스템을 이용해 보다 지능적인 웹 환경을 구축하고자 하는 노력이 시맨틱 웹의 발전과 함께 증가하고 있다. 이러한 에이전트와 규칙기반 시스템에 필요한 규칙들을 이미 많은 지식들이 산재해 있는 웹으로부터 습득할 수 있다면 보다 효율적으로 시스템을 구축하는 것이 가능하며, 이러한 응용시스템의 확장은 시맨틱 웹의 발전을 더욱 가속화하는 계기가 될 수 있을 것이다. XRML 방법론은 웹으로부터 규칙을 습득하기 위한 단계적 방법을 제시하고 있으며, 온톨로지를 이용함으로써 규칙의 구성요소들을 자동으로 추출할 수 있도록 지원한다. 그러나 추출된 규칙구성요소들을 조합하여 완전한 규칙을 만드는 과정이 규칙관리자의 수작업에 의존하고 있다. 본 연구는 온톨로지와 그래프 탐색을 사용함으로써 이 과정을 자동화하고자 하는 연구이다. 온톨로지에 있는 규칙의 일반적 패턴을 기반으로 하여 그래프 탐색을 이용해 규칙구성요소들을 조합함으로써 웹 페이지로부터 자동으로 규칙을 추출할 수 있다.

  • PDF

협동설계시스템의 솔리드 모델러를 위한 오브젝트의 Picking과 Concurrency (Object Picking and Concurrency for Solid Modeler in Collaborative Design System)

  • 윤보열;김응곤
    • 한국정보통신학회논문지
    • /
    • 제5권4호
    • /
    • pp.723-729
    • /
    • 2001
  • 여기서 제시된 협동설계시스템은 인터넷망과 웹브라우저를 이용하여 공유된 가상 공간에서 협동작업이 이루어진다. 협동설계 참여자들은 인터넷을 통해 솔리드 모델러 서버에 접근하여 원하는 3D도형을 생성하고 조작한다. 이때 공유된 여러 오브젝트 중 임의의 오브젝트를 선택하는 picking문제와 여러 참여자들이 한 오브젝트에 어떤 조작을 가할 때 제어하는 concurrency 문제가 중요하게 대두된다. 본 논문에서는 오브젝트의 picking이 마우스 포인터에서의 투사되는 선과 오브젝트간에 겹치는 부분을 계산하는 방법 외에 Java 3D를 이용하여 scene graph의 노드에 picking 속성을 주는 방법, bounds를 설정하는 방법, picking test의 범위를 한정하는 방법을 사용하여 계산하는 부담을 줄이고 효과적인 picking이 이루어지도록 한다. 이어서 picking된 오브젝트에 대해 협동설계에 참여한 사람이 공유작업공간에서 action에 따라 shared lock과 exclusive lock을 사용하여 효과적인 동시성제어가 이루어지도록 한다.

  • PDF

맵리듀스 기반 대량 RDF 데이터셋 압축 변환 및 저장 방법 (Compression Conversion and Storing of Large RDF datasets based on MapReduce)

  • 김인아;이경하;이규철
    • 한국정보통신학회논문지
    • /
    • 제26권4호
    • /
    • pp.487-494
    • /
    • 2022
  • 최근 데이터를 활용한 분석에 대한 수요와 함께 분석 데이터인 지식 그래프의 크기는 점차 증가하여, 웹에서 수집한 데이터를 지식 그래프로 추출하였을 때 약 820억개의 엣지(Edge)를 가지는 수준까지 도달하였다. 많은 지식 그래프들은 웹 자원에 대한 메타데이터를 표현하기 위한 W3C 표준인 RDF(Resource Description Framework) 형식으로 표현되며, RDF 특성으로 인해 기존의 RDF 저장소들은 대량 RDF 데이터를 압축하고 저장할 때 처리 시간의 오버헤드가 발생하는 문제점을 가진다. 본 논문은 이러한 문제점을 개선하기 위해, 맵리듀스를 사용하여 대량 RDF 데이터를 정수 ID로 압축 변환하고, 수직 분할하여 저장하는 방법을 제안한다. 본 논문에서 제안한 방법은 RDF-3X와 비교하였을 때 최대 25.2배, H2RDF+와 비교하였을 때 최대 3.7배까지의 높은 성능 향상을 보였다.