• 제목/요약/키워드: Hyperlink

검색결과 92건 처리시간 0.028초

웹 마이닝을 위한 웹 문서 하이퍼링크와 웹 접근로그를 통합한 방향그래프 (Directed Graph by Integrating Web Document Hyperlink and Web Access Log for Web Mining)

  • 박철현;이성대;곽용원;전성환;박휴찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.16-18
    • /
    • 2005
  • 웹은 사용자가 원하는 정보를 쉽고 정확하게 검색할 수 있도록 웹 문서를 자료구조화하여 보다 신뢰성 있는 패턴을 추출하고 사용자의 특성과 행동 패턴을 적용하여 개인화 하여야한다. 본 논문에서는 개인화하기 위한 전처리 과정으로서 웹 문서를 구조화 하는 방법을 제안한다. 제안 방법은 기본적으로 웹 문서 태그의 하이퍼링크를 깊이 우선 탐색 알고리즘을 사용하여 방향그래프를 만드는 것이다. 이때 웹 문서 태그 탐색 시 플래시, 스크립트 등의 찾기 힘든 하이퍼링크를 찾는 문제와 '뒤로' 버튼 사용 시 웹 접근로그에 기록되지 않는 문제점을 보완한다. 이를 위해 클릭 스트림을 스택에 저장하여 이미 만들어진 방향그래프와 비교하여 새롭게 찾은 정점과 간선을 추가함으로써 보다 신뢰성높은 방향그래프를 만든다.

  • PDF

웹사이트의 효율적인 구조 관리와 평가 방법 (A Method for Efficient Structure Management and Evaluation of Website)

  • 유대승;엄정섭;이명재
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 춘계학술대회 논문집
    • /
    • pp.306-315
    • /
    • 2002
  • 웹의 급속한 성장과 함께 기존의 시스템들이 웹을 기반으로 통합되며, 다양한 시스템들이 개발되고 있다. 일반적인 어플리케이션과는 달리 웹 어플리케이션들은 다양한 기술의 접목으로 개발된다는 점과 본래의 복잡성으로 인해 개발과 관리에 있어 어려움은 더욱 증대된다. 또한 급변하는 비즈니스 환경과 사용자들의 요구사항에 순응하기 위해서는 지속적인 진화가 요구된다. 본 논문에서는 웹 어플리케이션의 구조 정보인 링크 정보를 추출하고, 웹사이트에 대한 유용한 정보를 담고 있는 로그 파일을 분석하여 웹 어플리케이션의 보다 효율적인 개발과 유지보수에 활용하는 방법을 제시한다. 본 논문에서 추출한 정보들은 웹 어플리케이션 테스팅을 위한 기초적인 정보가 될 수 있으며 추출한 정보들을 웹 테스팅에 적용하는 방법을 설명한다. 그리고 링크 정보 추출과 웹 로그 분석을 수행하기 위해 개발된 시스템에 대해 기술한다.

  • PDF

TMS320C6678기반의 고속 직렬통신용 SRIO backplane 구현 (High Speed Serial Communication SRIO Backplane Implementation for TMS320C6678)

  • 오우진;김양수;강민수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.683-684
    • /
    • 2016
  • 최신의 고성능 DSP나 FPGA에서는 고속 직렬통신으로 SRIO(Serial Rapid IO)를 채용하고 있다. SRIO는 초고속 직렬 통신의 산업체 표준으로 현재 Ver 3.1까지 제정되어 있으며 본 연구에서는 TI사의 DSP를 기반으로 15Gbps급으로 전송속도를 갖는 Backplane을 개발하였다. 이를 기반으로 고속 영상전송 등이 가능하며, 다중 DSP를 연결하여 고속 연산에 적합한 scalable한 구조로 확장도 가능할 것이다. 본 논문에서는 고속 통신에 필요한 설계 기술을 검토하고 다중 연산 구조에 대하여 논의할 것이다.

  • PDF

웹 뉴스의 기사 추출과 요약 (Text Extraction and Summarization from Web News)

  • 한광록;선복근;유형선
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-10
    • /
    • 2007
  • 뉴스 콘텐츠 등 웹을 통해 제공되는 많은 정보들은 불필요한 클러터를 많이 포함하고 있다. 이러한 클러터들은 문서의 요약, 추출, 검색과 같은 자동화된 정보처리 시스템의 구축을 어렵게 한다. 본 논문에서는 웹 뉴스 콘텐츠를 추출하고 이를 요약하는 시스템을 구축하고자 한다. 추출 시스템은 HTML로 된 뉴스 콘텐츠를 입력받아 DOM 트리와 유사한 요소 트리를 구축하며, 이 요소 트리에서 HTML 태그의 하이퍼링크 속성을 갖는 클러터를 제외하면서 본문을 추출한다. 추출 시스템을 통해 추출된 본문은 요약시스템으로 전달되어 핵심 문장이 추출된다. 요약 시스템은 공기관계 그래프를 이용하여 구성한다. 본 논문에서 구현한 시스템을 통해 추출된 요약 문장은 SMS와 같은 메시지 서비스를 통하여 PDA이나 모바일 폰 등에 전송될 수 있을 것으로 기대된다.

  • PDF

뉴스 웹 페이지에서 기사 본문 추출에 관한 연구 (A Study on Extracting News Contents from News Web Pages)

  • 이용구
    • 정보관리학회지
    • /
    • 제26권1호
    • /
    • pp.305-320
    • /
    • 2009
  • 웹을 통해 제공되는 뉴스 페이지의 경우 필요한 정보 뿐 아니라 많은 불필요한 정보를 담고 있다. 이러한 불필요한 정보는 뉴스를 처리하는 시스템의 성능 저하와 비효율성을 가져온다. 이 연구에서는 웹 페이지로부터 뉴스 콘텐츠를 추출하기 위해 문장과 블록에 기반한 뉴스 기사 추출 방법을 제시하였다. 또한 이들을 결합하여 최적의 성능을 가져올 수 있는 방안을 모색하였다. 실험 결과, 웹 페이지에 대해 하이퍼링크 텍스트를 제거한 후 문장을 이용한 추출 방법을 적용하였을 때 효과적이었으며, 여기에 블록을 이용한 추출 방법과 결합하였을 때 더 좋은 결과를 가져왔다. 문장을 이용한 추출 방법은 추출 재현율을 높여주는 효과가 있는 것으로 나타났다.

인터넷상에서 페트리 넷을 이용한 하이퍼-프리젠테이션의 명시 표현 및 불일치성을 검증하기 위한 방법 연구 (A Method for Describing a Hyper-Presentation Specification and Checking It's Inconsistency using Petri-Net in a Internet)

  • 우시연;조종근;임영환;임기욱
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.615-624
    • /
    • 2002
  • 하이퍼-프리젠테이션 개념은 하이퍼-미디어 개념을 확장한 것으로, 동적으로 연출되고 있는 상황에서 링크개념을 설정하여 특정시점이나 지점에서 원하는 다음 정보를 보기 위해서 비순차적으로 연출할 수 있도록 하는 연출이다. 이러한 비순차적인 연출방법인 하이퍼-프리젠테이션 개념을 도입함으로써, 자유로운 멀티미디어 연출이 가능하게 되었지만, 이러한 동기화 방법에 의해서 혼합된 여러 프레젠테이션들간에는 일관성 문제가 발생할 수 있다. 본 논문에서는 하이퍼-프리젠테이션 명시 프로그램의 일관성 검증을 위해서 Petri Net을 이용한 하이퍼-프리젠테이션 명시 방법을 제시하고, 그것을 이용한 명시 프로그램의 일관성을 검증하는 방법을 제안한다.

점진적으로 계산되는 분류정보와 링크정보를 이용한 하이퍼텍스트 문서 분류 방법 (A Hypertext Categorization Method using Incrementally Computable Class Link Information)

  • 오효정;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권7호
    • /
    • pp.498-509
    • /
    • 2002
  • 본 논문은 하이퍼텍스트가 갖는 중요한 특성인 링크 정보를 활용한 문서 분류 모델을 제안한다. 제안된 모델의 주안점은 대상 문서와 링크로 연결된 이웃한 문서의 내용 및 범주를 분석하여 대상 문서 벡터를 조정하고, 이를 근거로 대상 문서가 어느 범주에 해당하는지를 결정한다. 또한, 이웃 문서에 포함된 용어를 반영함으로써 대상 문서의 내용을 확장 해석하고, 이웃 문서의 가용 분류 정보가 있는 경우 이를 참조함으로써 정확도 향상을 기한다. 이러한 접근 방법은 일반 웹 환경에 적용할 수 있는데, 특히 하이퍼텍스트를 주제별로 분류하여 관리하는 검색 엔진의 경우 매일 쏟아져 나오는 새로운 문서와 기존 문서간의 링크를 활용함으로써 전체 시스템의 점진적인 분류에 매우 유용하다. 제안된 모델을 검증하기 위하여 Reuter-21578과 계몽사(ETRl-Kyemong) 자료를 대상으로 실험한 결과 최고 18.5%의 성능 향상을 얻었다.

디지털 시대 고전시가 읽기 (On the reading method of Korean old poetry in the digital age)

  • 염은열
    • 고전문학과교육
    • /
    • 제16호
    • /
    • pp.65-90
    • /
    • 2008
  • This study is on the reading method of Korean old poetry in the digital age. Now days, we are living in digital media. The method of getting, organizing, and producing information is changed a lot. So for keeping pace with this change, we should reflect our teaching method. Of course, the purpose of our reflection is not to follow digital media's method and change or alter existing reading or teaching method, but it is to identify proper own reading strategy of old poetry and adjust existing method for our student who are skilled with digital media. We propose three kinds of method for student readers in school. These are 1) starting like a newspaper reader, 2) getting context (reading, making hyperlink), and 3) figuring as an architect (reading as space or scenery creator). In addition, we think about recent tendency that Korean old poetry is de-constructed and re-constructed as digital contents in digital space. We call it digitalizing of old poetry. The experiencing old poetry as a digital contents is different from reading old poetry, so we cannot alter old poetry reading experience into experience of digital contents. In conclusion, digitalizing contents should be used restrictively to fertilize reading experience of original old poetry.

Personal Protective Equipment Availability and Utilization Among Interventionalists

  • Rose, Andre;Rae, William Ian Duncombe
    • Safety and Health at Work
    • /
    • 제10권2호
    • /
    • pp.166-171
    • /
    • 2019
  • Objective: This study explored personal protective equipment (PPE) availability and PPE utilization among interventionalists in the catheterization laboratory, which is a highly contextualized workplace. Methods: This is a cross-sectional study using mixed methods. Participants (108) completed a survey. A hyperlink was sent to the participants, or they were asked to complete a paper-based survey. Purposively selected participants (54) were selected for individual (30) or group (six) interviews. The interviews were conducted at conferences, or appointments were made to see the participants. Logistic regression analysis was performed. The qualitative data were analyzed thematically. Results: Lead glasses were consistently used 10.2% and never used 61.1% of the time. All forms of PPE were inconsistently used by 92.6% of participants. Women were 4.3 times more likely to report that PPE was not available. PPE compliance was related to fit and availability. Conclusions: PPE use was inconsistent and not always available. Improving the culture of radiation protection in catheterization laboratories is essential to improve PPE compliance with the aim of protecting patients and operators. This culture of radiation protection must include all those involved including the users of PPE and the administrators and managers who are responsible for supplying sufficient, appropriate, fitting PPE for all workers requiring such protection.

Design and Implementation of Web Crawler utilizing Unstructured data

  • Tanvir, Ahmed Md.;Chung, Mokdong
    • 한국멀티미디어학회논문지
    • /
    • 제22권3호
    • /
    • pp.374-385
    • /
    • 2019
  • A Web Crawler is a program, which is commonly used by search engines to find the new brainchild on the internet. The use of crawlers has made the web easier for users. In this paper, we have used unstructured data by structuralization to collect data from the web pages. Our system is able to choose the word near our keyword in more than one document using unstructured way. Neighbor data were collected on the keyword through word2vec. The system goal is filtered at the data acquisition level and for a large taxonomy. The main problem in text taxonomy is how to improve the classification accuracy. In order to improve the accuracy, we propose a new weighting method of TF-IDF. In this paper, we modified TF-algorithm to calculate the accuracy of unstructured data. Finally, our system proposes a competent web pages search crawling algorithm, which is derived from TF-IDF and RL Web search algorithm to enhance the searching efficiency of the relevant information. In this paper, an attempt has been made to research and examine the work nature of crawlers and crawling algorithms in search engines for efficient information retrieval.