• 제목/요약/키워드: 웹 링크

검색결과 365건 처리시간 0.03초

링크드 데이터 방식을 통한 서지 정보의 확장에 관한 연구 (Extending Bibliographic Information Using Linked Data)

  • 박지영
    • 정보관리학회지
    • /
    • 제29권1호
    • /
    • pp.231-251
    • /
    • 2012
  • 본 연구에서는 서지 정보를 확장하기 위한 방안으로 링크드 데이터를 선정하였다. 링크드 데이터는 웹 공간을 통해 공유 가능한 식별기호와 데이터 구조 및 링크 정보를 제공하기 때문이다. 특히 링크드 데이터는 서지 온톨로지와 결합하여 서지데이터를 확장시키는데 유용하다. 이에 링크드 데이터와 서지 온톨로지를 분석하고, 연계 가능한 링크드 데이터를 검토하였다. 그리고 이를 바탕으로 링크드 데이터로 구축된 기존의 전거 데이터 및 서지 데이터를 연계하였다. 이러한 실험적 연계를 통해 향후 링크드 데이터를 효과적으로 활용하기 위한 과제를 도출할 수 있었다. 즉, 1) 다양한 링크드 데이터 중에서 각 기관에서 적합한 데이터를 선정할 수 있어야 하며, 2) 선정된 링크드 데이터를 연계하기 위한 기준을 정립해야 하고, 마지막으로 3) 자관의 고유한 데이터를 개발하여 이를 다시 공유해 나가야 할 것을 제안하였다.

링크 중요도에 기반한 웹사이트의 계층 구조화 (Link ranking-based hierarchical structuring of web site)

  • 임태수;박범환;이우기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.745-747
    • /
    • 2005
  • 수많은 웹페이지들이 하이퍼링크를 통해 복잡하게 연결된 그래프 구조를 가지고 있는 웹사이트를 계층적으로 구조화하는 것은 해당 사이트를 검색하고자 할 때, 정보를 재조직화하고 고려해야 할 대안들의 개수를 감소시킨다는 점에서 매우 유용하다. 본 논문은 웹사이트의 의미론적인 계층화를 최적화하기 위하여 사용자의 순회 경로, 즉 웹아크의 중요도 합을 최대화할 수 있는 트리 구조를 생성하였다. 구체적으로 첫째 PageRank에 기반한 웹아크 중요도를 생성하였고, 둘째 Minimum-Cost Arborescence 문제를 이용하여 최적 트리 구조를 생성하였다. 사용자의 질의에 독립적으로 생성된 트리 구조는 웹사이트의 의미 있는 계층 구조로서 사용자로 하여금 해당 사이트를 보다 효과적으로 검색할 수 있도록 도와줄 것이다.

  • PDF

웹의 개념지식을 위한 Anchor Text에서의 키워드 추출 알고리즘의 구현 (A Implementation of Keyword Extraction Algorithm Using Anchor Text for Web's Conceptual Knowledge)

  • 조남덕;배환국;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.72-74
    • /
    • 2000
  • 인터넷을 효과적으로 검색하기 위하여 검색엔진을 많이 이용하고 있다. 그런데 문서의 키워드를 추출할 적에 지금까지는 Anchor Text를 염두에 두지 않았었다. Anchor Text는 사람이 직접 요약한 것이고(요약성), 하이퍼링크를 포함하는 웹 문서에 반드시 존재하므로(보편성) 그 하이퍼링크가 가리키는 곳의 문서의 키워드를 추출에 적합한 용도가 될 수 있다. 웹 그래프는 이러한 Anchor Text를 이용하여 키워드를 추출함으로써 문서와 문서간, 단어와 단어간의 관계(연관성)까지도 나타내 줄 수 있게 한 검색 엔진 시스템이다. 그러나 Anchor Text 자체가 본문의 내용이 아니고, Anchor Text를 작성한 사람에 따라 다르게 작성되며, 본문의 내용과 무관한 내용도 작성할 수 있다. 따라서 Anchor Text 자체를 어떠한 여과 없이 문서의 키워드로 받아들이긴 힘들다. 본 논문에서는 TFIDF를 통해 좀 더 정확성이 있는 키워드를 추출하였다.

  • PDF

링크드 데이터 기반 대구 맛집 차트 (Charts of Famous Restaurants in Daegu based on Linked Data)

  • 정은미;전은구;이찬준;이용주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.512-515
    • /
    • 2018
  • 웹의 발달로 많은 양의 데이터를 손쉽게 접할 수 있지만, 이러한 데이터들로 얼마나 의미 있는 정보를 잘 끌어내어 공개하고 얼마나 잘 활용시키느냐가 중요한 이슈가 되었다. 본 연구에서는 각각의 자원들이 연결된 데이터 중심의 웹을 구성하기 위해 대구시에서 제공하는 공공데이터를 이용하여 링크드 데이터를 구축한다. 수집한 데이터에서 제공하는 정보를 바탕으로 맛집에 대한 온톨로지를 구축하여 데이터를 발행하고, SPARQL을 활용한 간단한 웹 어플리케이션을 구현한다.

악성코드 은닉사이트의 분산적, 동적 탐지를 통한 감염피해 최소화 방안 연구 (A Study on Minimizing Infection of Web-based Malware through Distributed & Dynamic Detection Method of Malicious Websites)

  • 신화수;문종섭
    • 정보보호학회논문지
    • /
    • 제21권3호
    • /
    • pp.89-100
    • /
    • 2011
  • 최근 웹 사이트를 통해 유포되는 웹 기반 악성코드가 심각한 보안이슈로 대두되고 있다. 기존 웹 페이지 크롤링(Crawling) 기반의 중앙 집중식 탐지기법은, 크롤링 수준을 웹 사이트의 하위링크까지 낮출 경우 탐지에 소요되는 비용(시간, 시스템)이 기하급수적으로 증가하는 문제를 가지고 있다. 본 논문에서는 웹 브라우저 이용자가 악성코드 은닉 스크립트가 포함된 웹 페이지에 접속할 경우 이를 동적으로 탐지하여 안전하게 브라우징 해줌으로써, 감염 피해를 예방할 수 있는 웹 브라우저 기반의 탐지도구들 제시하고, 이 도구를 적용한 분산된 웹 브라우저 이용자가 모두 악성코드 은닉 웹 페이지 탐지에 참여하고, 탐지결과를 피드백 함으로써, 웹 사이트의 하부 링크까지 분산적, 동적으로 탐지하고 대응할 수 있는 모델을 제안한다.

워드넷 기반 협동적 평가와 하이퍼링크를 이용한 검색엔진의 성능 향상 (Improving Performance of Search Engine By Using WordNet-based Collaborative Evaluation and Hyperlink)

  • 김형일;김준태
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.369-380
    • /
    • 2004
  • 본 논문에서는 정색엔진의 성능 향상을 위하여 질의어의 모호성 해결과 새로운 가중치 부여 방식을 제안한다. 일반적인 검색엔진은 질의어의 형태와 같은 것들이 포함되어 있는 웹 페이지를 결과로 보여주는 내용기만 방식을 사용하고 있다. 검색 결과로 나타난 웹 페이지들의 순위를 결정하는데 있어서도 주어진 질의어와 웹 페이지 사이의 키워드 매칭에 의한 내용기반 방식을 사용한다. 이와 같이 질의어의 형태만으로 웹페이지들과 유사도를 비교한다는 것은 정확한 검색에 많은 장애를 준다. 또한 질의어의 의미에 모호성이 존재할 경우에는 사용자의 의도와 관련 없는 것들이 결과로 나타나기도 한다. 이러한 원인의 발생은 일반적인 검색엔진들이 내용기반 방법을 기반으로 웹 검색에 이용되기 때문이다. 본 논문에서는 질의어에 모호성이 있는 경우 워드넷을 이용하여 모호성을 해결하도록 하는 사용자 인터페이스를 구현했다. 그리고 사용자의 클릭 수를 각 웹 페이지의 가중치에 누적함으로써 다수 사용자의 협동적 평가에 따른 웹 페이지의 중요도가 검색 순위에 반영되도록 하였다. 클릭수의 누적에 있어서 질의어의 의미 카테고리별로 가중치를 구분하여 저장함으로써 보다 세분화된 웹 페이지 가중치 부여 방식을 사용하였다 그리고 점 페이지의 하이퍼링크를 웹 페이지의 가중치에 적용하였다. 웹 페이지의 가중치에 하이퍼링크를 적용함으로써 웹 페이지의 대표성을 가중치에 부여하여 가중치에 신뢰도를 증가시켰다. 실험용 정색엔진이 일반 검색엔진에 비해 높은 검색 정확도를 나타내는 것을 실험을 통해 확인하였다.

ICT 교사를 위한 다이나믹 웹문서 랭킹시스템 (A dynamic web document ranking system for ICT teachers)

  • 이미선;전석주
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2007년도 하계학술대회
    • /
    • pp.322-327
    • /
    • 2007
  • 2005년 12월 개정된 정보통신기술교육 지침에 따르면 컴퓨터의 과학적인 요소를 '정보처리이해' 단계에서 도입하였다. 자료구조와 알고리즘, 프로그래밍의 기초를 교육하도록 개정하였는데 현장 교사들이 그 내용을 잘 이해하지 못하고 있어 교육하기에 많은 어려움이 있다. 본 연구는 '정보처리이해' 과정을 가르치는데 도움이 되는 구체적인 웹문서를 검색 수집 정리 분류하여 ICT교사들에게 제공한다. 또한 ICT교사들이 참조한 웹문서에 대해 활용도를 평가하고 높은 점수의 웹문서를 상위에 링크시키는 다이나믹한 랭킹 시스템에 관한 설계이다.

  • PDF

JDBC를 이용한 웹기반 사용자 질의 영상 검색 (Web based User Query Image Retrieval using JDBC)

  • 차상환;이상열;황병곤
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2003년도 춘계학술대회
    • /
    • pp.57-61
    • /
    • 2003
  • 본 논문에서는 웹 에이전트를 이용하여 웹 상에서 멀티미디어 정보를 검색하는 것으로 HTML문서에 나타나는 텍스트 중 영상 이름이나 링크에 붙어 있는 텍스트를 추출하여 멀티미디어 자료를 JDBC를 이용하여 데이터베이스화하였다. 이 데이터베이스에 저장된 영상 자료는 웹 브라우저에서 질의자의 스케치에 의한 검색과 그리고 예제 영상 질의로 검색하는 방법을 제시하여 질의 효율성을 개선하였다.

  • PDF

웹 수집 로봇 엔진의 설계 및 구현 (Implementation and Design of Robot Engine for Web Collection)

  • 김대유;김정태
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.313-317
    • /
    • 2007
  • 인터넷의 이용이 활발해짐에 따라 수많은 정보들이 웹을 통하여 공개되고 있으며, 이용자는 웹 검색 서비스를 이용하여 이러한 정보들에 효과적으로 접근할 수 있다. 웹 검색 서비스의 구축을 위해서는 웹 로봇을 사용한 웹 문서 수집이 선행되어야 하며, 웹 문서들의 수가 급격히 증가하면서 양질의 웹 문서들을 효과적으로 수집할 수 있는 웹 로봇에 대한 필요성이 증가되고 있으며, 그에 따른 많은 웹 수집 로봇이 탄생되고 있다. 본 논문에서는 효과적인 웹 수집 로봇의 설계와 동적인 웹페이지에서 사용하는 자바스크립트의 링크 추출방안에 대하여 제시하고자 한다.

  • PDF

웹 정보의 관리에 있어서 의미적 접근경로의 형성에 관한 연구 (Semantic Access Path Generation in Web Information Management)

  • Lee, Wookey
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.51-56
    • /
    • 2003
  • 웹 정보가 폭발적으로 증가하는 정보의 바다 한 가운데에서 이러한 웹 정보를 구조화하는 문제는 매우시의성이 크다. 본 연구는 웹을 노드와 링크로 구성된 그래프로 인식함을 그 출발점으로 한다. 이때 노드는 각 웹 페이지를 나타내고, 링크는 각 페이지를 연결하는 하이퍼텍스트 링크 즉, URL을 나타낸다. 그러면 웹은 웹 페이지와 그들 간의 링크로 연결된 유방향 그래프의 집합이 되는 것이다. 그러나 문제는 이러한 웹 정보가 지수적으로 증가하면서 웹 그래프 역시 지나치게 복잡해짐으로 인해 사용자 즉, 사람 및 검색로봇이 웹 정보를 파악하고 검색함에 있어 복잡성으로 인한 혼란이 야기된다는 것이며, 이를 이름하여 웹 공간에서의 위치혼란(lost in cyber space)라고 부른다. 따라서 이를 적절히 및 추상화하여 방향성(orientation)을 제시하고 전체적으로 웹 공간의 정보를 일목요연하게 표현하는 노력이 필요한 것이다. 이것을 위하여 웹 페이지를 계량적 수치로 나타내야할 필요가 있으며 여기서는 tf-idf를 그 방법론으로 삼았다. tf-idf란 빈도 및 반빈도(term frequency/inverse document frequency)곱을 일컫는 것으로서, 웹 페이지를 용어(keyword)의 벡터로 인식하고, 사용자가 제시하는 용어와의 상관성을 거리공간 벡터값으로 계산하는 과정을 의미한다. 이렇게 웹 정보를 계량화하는 것을 의미적 표현(semantic representation)이라 하고, 그것을 구조화하는 것을 의미적 접근경로라고 하였다. 본 연구의 목표는 궁극적으로는 웹 정보를 의미적 접근경로를 포함하는 계층적 형식(Hierarchical Structure)으로 축약하여 사용자로 하여금 웹 정보 검색의 차원을 혁신코자 하는 것이다. 식 재하도록 하였다. 소단 내 수목식재에 있어서는 교목식재가 가능한 한 남측 사면은 20m 간격으로 교목 2열 교호식재를 하며, 소단상부는 각 구간별로 계절감을 연출할 수 있는 식물을 도입하는 방안을 제안하였다. 제작된 보정물에 대해서는 무게가 너무 가벼워 모든 피험자들이 양 쪽 가슴의 균형이 잘 맞지 않는다고 답하였으며 특히, 운동을 즐기고 활동이 많은 피험자의 경우 스펀지로 제작된 보정물에 대해 큰불만을 표시하였다. 바람직한 자녀의 인성발달 및 여러 영역에 걸친 발달을 위하여 항상 애정과 관심을 가지고 적극적으로 참여해야 할 것이다. 자녀양육은 더 이상 어머니 혼자의 역할이 아닌 부모 둘 다의 몫이며 교임이므로 부모들은 좋은 가정을 만들고 좋은 부모가 되기 위해서 끊임없이 자신을 갈고 닦으며 노력을 기울여야 할 것이다.서 이들 4개 지표로서 전체의 927%를 설명할 수 있다. 7. 자치구별 평가는 모든 음식점에서 식재료 보관시설(냉장, 냉동), 불량부정식품 사용여부, 남은 반찬의 폐기, 식당상태 등에서는 비교적 양호하였으나, 주방의 청결상태, 식재료 창고의 관리 및 주방 근무직원의 위생상태는 열악하였다. 평가 지표 14개의 총 평가결과가 가장 우수한 자치구는 동작구였으며, 다음으로 서대문구, 금천구, 성동구, 마포구의 순서이었다. 나머지 20개 자치구는 모두 보통이상으로 평가되었다. 8. 음식점 업태 별로 주방과 식당의 청결도 평가에서 가장 중요한 요인은 주방의 내부설비(바닥, 벽면, 천장, 환풍기, 기구 등) 또는 주방종업원의 근무 환경(주방의 환기설비, 설치 및 쾌적한 환경상태유지)이었다. 그러나 음식점 유형에 관계없이 주방과 식당의 청결도 평가에 가장 큰 영향을 주는 인자는 주방종업원의 근무환경이었다. 우리나라의 2002년도 섭취장소별

  • PDF