• 제목/요약/키워드: 하이퍼그래프

검색결과 87건 처리시간 0.053초

웹 문서와 접근로그의 하이퍼링크 추출을 통한 웹 구조 마이닝 (Web Structure Mining by Extracting Hyperlinks from Web Documents and Access Logs)

  • 이성대;박휴찬
    • 한국정보통신학회논문지
    • /
    • 제11권11호
    • /
    • pp.2059-2071
    • /
    • 2007
  • 웹 사이트의 구조가 정확하게 주어진다면, 정보 제공자의 입장에서는 사용자의 행위 패턴이나 특성을 효과적으로 파악할 수 있어 보다 나은 서비스를 제공할 수 있고, 사용자의 입장에서는 더욱 쉽고 정확하게 유용한 정보를 찾을 수 있을 것이다. 하지만 웹상의 문서들은 빈발하게 수정되기 때문에 웹 사이트의 구조를 정확하게 추출하는 것은 상당한 어려움이 있다. 본 논문에서는 이러한 웹 사이트의 구조를 자동으로 추출하는 알고리즘을 제안한다. 제안하는 알고리즘은 두 단계로 구성된다. 첫 번째 단계는 웹 문서를 분석하여 그들 간의 하이퍼링크를 추출하고 이를 웹 사이트의 구조를 나타내는 방향 그래프로 표현한다. 하지만 플래시나 자바 애플릿에 포함된 하이퍼링크는 추출할 수 없는 한계가 있다. 두 번째 단계에서는 이러한 숨겨진 하이퍼링크를 추출하기 위하여 웹 사이트의 접근로그를 이용한다. 즉, 접근로그로부터 각 사용자의 클릭스트림을 추출한 후, 첫 번째 단계에서 생성한 그래프와 비교하여 숨겨진 하이퍼링크를 추출한다. 본 논문에서 제안한 알고리즘의 성능을 평가하기 위하여 다양한 실험을 수행하였고, 이러한 실험을 통하여 웹 사이트의 구조를 보다 정확하게 추출할 수 있음을 확인하였다.

하이퍼스타 연결망 HS(2n,n)의 에지 중복 없는 최적 스패닝 트리 (Optimal Edge-Disjoint Spanning Trees in HyperStar Interconnection Network HS(2n,n))

  • 김종석;김성원;이형옥
    • 정보처리학회논문지A
    • /
    • 제15A권6호
    • /
    • pp.345-350
    • /
    • 2008
  • 최근에 병렬처리를 위한 새로운 위상으로 하이퍼 스타 연결망 HS(2n,n)가 제안되었다. 하이퍼 스타 연결망은 하이퍼큐브와 스타 그래프의 성질을 가지고 있으면서, 같은 노드수를 갖는 하이퍼큐브보다 망비용이 우수한 연결망이다. 본 논문에서는 하이퍼스타 연결망 HS(2n,n)에서 에지 중복 없는 스패닝 트리를 구성하는 알고리즘을 제안한다. 그리고 제안한 알고리즘에 의해 구성된 에지 중복 없는 스패닝 트리가 에지 중복없는 최적 스패닝 트리임을 증명한다.

하이퍼큐브형 상호연결망의 비쌍형 다대다 서로소인 경로 커버 (Unpaired Many-to-Many Disjoint Path Covers in Hypercube-Like Interconnection Networks)

  • 박정흠
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권10호
    • /
    • pp.789-796
    • /
    • 2006
  • 그래프 G의 비쌍형 다대다 k-서로소인 경로 커버(k-DPC)는 k개의 서로 다른 소스 정점과 싱크 정점을 연결하며 그래프에 있는 모든 정점을 지나는 k개의 서로소인 경로 집합을 말한다 여기서 한 소스는 임의의 한 싱크와 짝지어질 수 있다. 이 논문에서는 하이퍼큐브형 상호연결망의 한 부류인 제한된 HL-그래프에서 비쌍형 다대다 DPC를 고려하여, 고장인 요소(정점이나 에지)의 수가 f 이하인 모든 m차원 제한된 HL-그래프$(m{\geq}3)$$f+k{\leq}m-2$을 만족하는 임의의 $f{\geq}0,\;k{\geq}1$에 대하여 비쌍형 다대다 k-DPC를 가짐을 보인다.

웹 마이닝을 위한 웹 문서 하이퍼링크와 웹 접근로그를 통합한 방향그래프 (Directed Graph by Integrating Web Document Hyperlink and Web Access Log for Web Mining)

  • 박철현;이성대;곽용원;전성환;박휴찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.16-18
    • /
    • 2005
  • 웹은 사용자가 원하는 정보를 쉽고 정확하게 검색할 수 있도록 웹 문서를 자료구조화하여 보다 신뢰성 있는 패턴을 추출하고 사용자의 특성과 행동 패턴을 적용하여 개인화 하여야한다. 본 논문에서는 개인화하기 위한 전처리 과정으로서 웹 문서를 구조화 하는 방법을 제안한다. 제안 방법은 기본적으로 웹 문서 태그의 하이퍼링크를 깊이 우선 탐색 알고리즘을 사용하여 방향그래프를 만드는 것이다. 이때 웹 문서 태그 탐색 시 플래시, 스크립트 등의 찾기 힘든 하이퍼링크를 찾는 문제와 '뒤로' 버튼 사용 시 웹 접근로그에 기록되지 않는 문제점을 보완한다. 이를 위해 클릭 스트림을 스택에 저장하여 이미 만들어진 방향그래프와 비교하여 새롭게 찾은 정점과 간선을 추가함으로써 보다 신뢰성높은 방향그래프를 만든다.

  • PDF

랜덤 하이퍼그래프 모델을 이용한 순차적 멀티모달 데이터에서의 문장 생성 (Sentence generation on sequential multi-modal data using random hypergraph model)

  • 윤웅창;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.376-379
    • /
    • 2010
  • 인간의 학습과 기억현상에 있어서 멀티모달 데이터를 사용하는 것은 단순 모달리티 데이터를 사용하는 것에 비해서 향상된 효과를 보인다는 여러 연구 결과가 있어왔다. 이 논문에서는 인간의 순차적인 정보처리와 생성현상을 기계에서의 시뮬레이션을 통해서 기계학습에 있어서도 동일한 현상이 나타나는지에 대해서 알아보고자 하였다. 이를 위해서 가중치를 가진 랜덤 하이퍼그래프 모델을 통해서 순차적인 멀티모달 데이터의 상호작용을 하이퍼에지들의 조합으로 나타내는 것을 제안 하였다. 이러한 제안의 타당성을 알아보기 위해서 비디오 데이터를 이용한 문장생성을 시도하여 보았다. 이전 장면의 사진과 문장을 주고 다음 문장의 생성을 시도하였으며, 단순 암기학습이나 주어진 룰을 통하지 않고 의미 있는 실험 결과를 얻을 수 있었다. 단순 텍스트와 텍스트-이미지 쌍의 단서를 통한 실험을 통해서 멀티 모달리티가 단순 모달리티에 비해서 미치는 영향을 보였으며, 한 단계 이전의 멀티모달 단서와 두 단계 및 한 단계 이전의 멀티모달 단서를 통한 실험을 통해서 순차적 데이터의 단계별 단서의 차이에 따른 영향을 알아볼 수 있었다. 이를 통하여 멀티 모달리티가 시공간적으로 미치는 기계학습에 미치는 영향과 순차적 데이터의 시간적 누적에 따른 효과가 어떻게 나타날 수 있는지에 대한 실마리를 제공할 수 있었다고 생각된다.

  • PDF

웹 접근로그를 활용한 웹 구조 마이닝 (Web Structure Mining Using Web Access Log)

  • 박철현;이성대;전성환;박휴찬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.393-396
    • /
    • 2006
  • 웹의 급속한 성장으로 정보의 양이 많아졌지만 디자인의 비중이 커지면서 웹 문서에 대한 구조를 추출하는데 어려움이 있다. 웹은 사용자가 원하는 정보를 쉽고 정확하게 검색할 수 있도록 웹 문서의 내용을 구조화하여 지속적으로 개선하면서 사용자의 특성과 행동 패턴에 따라 개인화 하여야한다. 이러한 문제를 해결하기 위해서는 웹 문서들 간의 정확한 구조를 추출하는 것이 선행되어야 한다. 본 논문에서는 보다 웹 사이트의 정확한 구조를 추출하기 위한 방법을 제안한다. 제안 방법은 기본적으로 웹문서 태그의 하이퍼링크와 플래시 파일을 2진 형태의 문서로 불러 하이퍼링크를 추출하고 이를 깊이 우선 탐색 알고리즘을 사용하여 방향그래프로 만든다. 하지만 이러한 웹 문서 태그 탐색 시 애플릿이나 스크립트 등에 숨어 있는 하이퍼링크를 찾는 문제와 '뒤로' 버튼 사용 시 웹 접근로그에 기록되지 않는 문제점이 보완되어야 한다. 이를 위해 클릭 스트림을 스택에 저장하여 이미 만들어진 방향그래프와 비교하여 새롭게 찾은 정점과 간선을 추가 삭제함으로써 보다 신뢰성 높은 방향 그래프를 만든다.

  • PDF

하이퍼텍스트의 개념과 응용에 관한 고찰 (An Overview of Hypertext and Its Applications)

  • 정영미
    • 정보관리학회지
    • /
    • 제6권2호
    • /
    • pp.3-20
    • /
    • 1989
  • 하이퍼텍스트시스템은 비직선적이며 비연속적인 형태로 문헌을 조직하고 이용할 수 있는 새로운 형태의 정보시스템이다. 하이퍼텍스트는 정보뭉치를 소장하는 노드와 상호 관련된 노드들을 연결하는 링크로 구성되며 노드에는 텍스트, 그래프, 그림, 비디오화면, 소리 등의 정보가 소장될 수 있다. 이용자는 링크를 선택함으로써 원하는 정보에 자유롭게 접근할 수 있다. 이 논문에서는 하이퍼텍스트의 개념, 구성요소, 특성 둥을 구체적으로 살펴보고 PC용 상용시스템인 Guide에 관해 간단한 응용 예를 들어 기술하였다.

  • PDF

전위그래프와 RFM그래프 사이의 일-대-일 노드 사상 방법 (One-to-One Node Mapping Analysis for the Transposition and RFM graphs)

  • 심현;이형옥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.671-674
    • /
    • 2007
  • 전위그래프는 스타 그래프와 그의 변형 그래프를 포함할 수 있는 일반화된 그래프이다. RFM 그래프는 스타 그래프가 갖는 좋은 성질을 가지면서 하이퍼큐브보다 망 비용이 적은 값을 갖는 상호연결망이다. 본 논문에서는 그래프의 에지 정의를 이용하여 전위그래프와 RFM그래프 사이의 노드를 일-대-일 사상하는 방법을 제시한다. 이러한 사상 결과를 통해 전위그래프는 RFM그래프에 연장율 4, 확장율 1에 임베딩 가능하고, RFM그래프는 전위그래프에 O(n)에 임베딩 가능하다.

  • PDF

상호연결망 폴디드 하이퍼-스타 연결망 FHS(2n,n)의 고장 지름 (Fault Diameter of Folded Hyper-Star Interconnection Networks FHS(2n,n))

  • 김종석;이형옥
    • 정보처리학회논문지A
    • /
    • 제17A권1호
    • /
    • pp.1-8
    • /
    • 2010
  • 고장 지름은 상호연결망의 통신 능률과 신뢰도를 평가하는 중요한 척도 중의 하나이다. 이형옥 외 4인[Folded 하이퍼-스타 그래프의 병렬 경로, 한국정보처리학회논문지, Vol.6, No.7, pp.1756-1769, 1999]은 폴디드 하이퍼-스타 FHS(2n,n)의 노드 중복 없는 경로를 제안하였고, FHS(2n,n)의 고장 지름이 2n-1 이하임을 증명하였다. 본 논문에서는 폴디드 하이퍼-스타 FHS(2n,n)의 개선된 노드 중복 없는 경로를 제안한다. 그리고 FHS(2n,n)의 광역 지름이 dist(U,V)+4이고, 고장 지름이 n+2 이하임을 증명한다.

HITS알고리즘을 적용한 개념그래프 기반검색시스템의 성능개선 (Improved Concept-base Search System Using HITS algorithm on Conceptual Graph)

  • 배환국;박호성;이상준;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.470-472
    • /
    • 2003
  • 본 논문에서는 개념 그래프 기반 검색 시스템의 검색의 성능을 개선시키고자 Hits 알고리즘을 적용하였다. 기존 개념 그래프 기반 검색 시스템의 anchor text분석을 통하여 개념을 추출하고 있는 시스템에서 더 나아가 하이퍼 링크의 선호도의 특성을 살려 하이퍼링크에 문서가 얼마나 연결되어 있는지, 참조하고 있는지에 따라 해당 검색된 문서들의 중요도를 찾아서 순위를 매기는 실험을 하였다. 종래에는 해당 검색어의 빈도순으로 개념의 결과를 나타내 주었는데, 본 시스템 구현 후에 랭킹알고리즘을 적용하여 해당검색에 유용한 정보를 가지고 있는 페이지들(authorities)과 유용한 정보를 보유하고 있는 페이지의 링크를 보유하고 있는 페이지들(hubs)를 각각 순위 순으로 보여주게 되었다. 그리하여 사용자는 실제 검색시에 개념상으로 분류된 문서 중에 중요도가 높은 문서를 사용자에게 우선으로 접하게 되었으며, hub어 의해서 중요도가 높은 문서를 한눈에 볼 수도 있을 뿐 아니라, anchor text 어서 나타나지 않은 중요한 정보를 가진 문서도 검색할 수 있었다.

  • PDF