• 제목/요약/키워드: web link analysis

검색결과 92건 처리시간 0.028초

국내 웹 그래프의 링크 구조 분석 (Link Analysis of Korean Web Graph)

  • 서정주;김진일;김은상;김영호;정하웅;김성렬;박근수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.400-402
    • /
    • 2012
  • 웹을 구성하는 웹 페이지들과 페이지들 사이의 하이퍼링크들은 방향성을 지니는 그래프로써 표현될 수 있으며, 웹 그래프가 가지는 독자적인 링크 구조의 특성은 다양한 분야의 연구에서 활용되고 있다. 현재 검색 엔진들이 수집한 웹 페이지들은 그 규모가 수십억 개로 방대한 양을 이루고 있다. 본 논문에서는 약 3억 개의 국내 웹 페이지들을 수집하고, 링크 데이터를 추출하여 생성한 웹 그래프의 구조에 대해 분석한다. 국내 웹 페이지들의 링크의 진입 차수와 연결 요소들의 크기 분포는 멱법칙을 따르고, 웹 페이지의 진출 차수는 특정 차수 이상에서 멱법칙을 가짐을 확인한다. 또한 그래프 알고리즘을 이용하여 웹 그래프를 구성하는 요소들로 나눈 후 전체적인 구조를 도식화한 보우타이 다이어그램을 도출한다.

Performance Analysis of CDMA System Integrated Voice And WWW Traffic

  • Piriyawirut, Pattana;Dejhan, Kobchai;Yimman, Surapun;Rattanakoch, Wirenㅂ
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.1342-1345
    • /
    • 2004
  • An analytical of throughput and delay on reverse link in a cellular slotted CDMA system with integrated voice and World Wide Web (WWW) traffic is presented in this paper. Our results show that the Gaussian approximation it was found that the voice traffic can have a significant impact on the WWW traffic. It was also found that the different mobiles velocity and number of resolvable paths is impact each other the system performance.

  • PDF

광고성 메일을 자동으로 구별해내는 Text Mining 기법 연구 (Detecting spam mails using Text Mining Techniques)

  • 이종호
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.35-39
    • /
    • 2002
  • 광고성 메일이 개인 당 하루 평균 10통 내외로 오며, 그 제목만으로는 광고메일을 효율적으로 제거하기 어려운 현실이다. 이러한 어려움은 주로 광고 제목을 교묘히 인사말이나 답신처럼 변경하는 데에서 오는 것이며, 이처럼 제목으로 광고를 삭제할 수 없도록 은폐하는 노력은 계속될 추세이다. 그래서 제목을 통한 변화에 적응하면서, 제목뿐만 아니라 내용에 대한 의미 파악을 자동으로 수행하여 스팸 메일을 차단하는 방법이 필요하다. 본 연구에서는 정상 메일과 스팸 메일의 범주화(classification) 방식으로 접근하였다. 이러한 범주화 방식에 대한 기준을 자동으로 알기 위해서는 사람처럼 문장 해독을 통한 의미파악이 필요하지만, 기계가 문장 해독을 통해서 의미파악을 하는 비용이 막대하므로, 의미파악을 단어수준 등에서 효율적으로 대신하는 text mining과 web contents mining 기법들에 대한 적용 및 비교 연구를 수행하였다. 약 500 통에 달하는 광고메일을 표본으로 하였으며, 정상적인 편지군(500 통)에 대해서 동일한 기법을 적용시켜 false alarm도 측정하였다. 비교 연구 결과에 의하면, 메일 패턴의 가변성이 너무 커서 wrapper generation 방법으로는 해결하기 힘들었고, association rule analysis와 link analysis 기법이 보다 우수한 것으로 평가되었다.

  • PDF

웹 사이트의 페이지 연관성에 관한 시각화 연구 (A Study of Visualization by Page Connection of Web Sites)

  • 김영진;이경원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 2부
    • /
    • pp.358-363
    • /
    • 2008
  • 인터넷 웹사이트의 규모가 커지면서 그 안에 담고 있는 정보의 양과 종류가 많아지고 복잡해지고 있다. 이에 사용자는 같은 사이트 내에서도 정보를 찾는 것에 어려움을 느끼고 있다. 이에 대한 해결책으로써 웹사이트 안에 있는 각 페이지들의 하이퍼링크 정보로부터 얻어낸 연결 정보를 분석하여 그 안에서 관계성을 추출 하고 이를 관련 있는 페이지들끼리의 모임으로 분류해서 시각화 하는 방법을 제안하였다. 본 논문에서는 시각화 인터페이스로써 태양계의 행성들을 메타포로 이용하였다. 즉 웹사이트 안의 페이지는 하나의 행성의 모습으로 표현되고, 페이지들의 하이퍼링크에 의한 연결된 수는 중력으로써 다른 페이지를 끌어 당기는 힘으로 사용된다. 이때 행성의 모습으로 시각화된 모든 페이지들은 서로의 끌어당기는 힘에 악해 유기적으로 재배치되는 모습의 인터랙션을 제공한다. 서로 다른 사이트는 구성 페이지들의 연관관계에 따라서 서로 다른 태양계의 모습으로 표현될 것이다. 결국 이 연구는 사용자에게 웹사이트의 대략적인 성격을 파악하는 것에 도움을 주고 웹 사이트 안에서의 페이지 탐색 시, 관련 주제의 정보가 속해있는 비슷한 페이지 들을 알려 줌으로써 보다 효율적인 정보 검색을 돕는다.

  • PDF

우리나라 공공도서관의 디지털참고봉사에 대한 종단적 분석 (Analysis of the Digital Reference Services in Korean Public Libraries : A Longitudinal Study)

  • 장혜란
    • 정보관리학회지
    • /
    • 제24권2호
    • /
    • pp.105-122
    • /
    • 2007
  • 공공도서관에서 제공하고 있는 디지털참고봉사의 현황과 발전을 이해하기 위하여, 전국의 공공도서관 홈페이지를 직접 접속하여 관찰하고 이용 데이터를 수집하여 분석하였으며, 2003년에 수집하였던 데이터와 비교하였다. 모두 404개의 디지털참고봉사사이트에 대하여, 접근수준, 서비스방식, 링크명칭, 서비스정책, 웹폼, FAQ 등 서비스 제공 관련 특성을 분석한 후, 15일간 수행된 질문응답 데이터를 수집하여 이용도서관, 이용수준, 응답비율, 질문유형 등 서비스 성능을 분석하였다. 서비스 현황에 대한 이해와 문제점, 그리고 4년 동안에 걸친 변화가 식별되었으며, 향후 발전을 위한 제언이 이루어졌다.

웹기반 어린이 교통 질서 및 안전 교육 시스템의 설계 및 구현 (The Design and Implementation of a Traffic Order and Safety Education System for Kid on Web)

  • 안성옥
    • 공학논문집
    • /
    • 제3권1호
    • /
    • pp.7-20
    • /
    • 1998
  • 우리의 경제성장과 국민소득의 증가와 더불어 자가용승용차가 증가함으로서 자동차 대중화시대에 접어 들었지만 아직까지도 교통안전과 질서에 대한 의식이 성숙하지 못함에 따라 교통안전 사고 등의 문제를 야기시키고 있다. 따라서 웹기반 어린이 교통 질서 및 안전 교육 시스템의 개발은 교통 질서 및 안전 교육의 중요성과 필요성을 홍보하고 교육 함으로서 교통 안전 사고를 예방하는데 목적을 두고 있다. 이 시스템 개발이 이루어진 논문 내용은 다음과 같다. 교통 안전 교육에 필요한 텍스트, 이미지, 동영상 데이터 확보 및 디지타이징과 계층적 관계 확립, 정보간 관계성 분석 및 정보간 하이퍼 링크 구조설계, 시소러스 구축 및 시소러스 기반 정보검색 엔진 설계 및 구현, 교통 질서 및 안전 교육을 위한 데이터베이스 스키마 설계 및 구현과 사용자 중심의 GUI 구축등이다.

  • PDF

웹사이트의 구조를 고려한 개인정보 노출 위험도 계산 기법 (A Method for Calculating Exposure Risks of Privacy Information based on Website Structures)

  • 이수경;손진식;김관호
    • 한국전자거래학회지
    • /
    • 제21권1호
    • /
    • pp.1-14
    • /
    • 2016
  • 본 연구에서는 개인정보가 웹사이트에 노출될 시 위험 정도를 수치화할 수 있는 웹사이트 구조기반의 개인정보 노출 위험도 모델을 정의하기 위해 아래와 같은 두 가지 측면을 고려한다. 첫 번째는 개인정보가 노출되었을 경우 얼마나 민감한 정보인가에 따라 위험수준을 정의한다. 두 번째는 개인정보의 실제 노출 가능성을 측정하기 위해 웹페이지의 예상 방문 확률을 계산하여 어느 웹페이지에 노출된 개인정보가 더 위험한지 판별한다. 이를 바탕으로 대학교, 은행, 중앙 행정 기관, 시 도 교육청 4개의 분류를 선정하여 웹사이트 위험도를 측정하였다. 실험 결과, 은행은 다른 분류에 비해 상대적으로 잘 관리되고 있었으며 시 도 교육청, 중앙행정 기관, 대학교의 경우 웹사이트 위험도가 높게 측정되었다. 마지막으로, 본 연구는 개인정보 노출 문제의 완화를 위한 우선순위 기반 대처방안 수립에 도움을 줄 것으로 기대한다.

벤처기업 웹사이트의 속성이 웹사이트 이탈률에 미치는 영향에 관한 실증연구 (An Empirical Study on the Effects of Venture Company's Website Properties on Bounce Rate)

  • 황윤도;하태관
    • 벤처창업연구
    • /
    • 제18권2호
    • /
    • pp.67-79
    • /
    • 2023
  • 이탈률은 사용자가 방문한 후 별다른 요청 없이 바로 이탈한 비율이며 본 연구를 통해 웹사이트의 어떤 속성이 이탈률에 영향을 미치는지 알아보고자 하였다. 웹사이트 평가항목은 선행연구를 통하여 다양한 업종의 벤처기업에 공통으로 적용할 수 있도록 사용성과 정보, 서비스상호작용, 기술 등 총 4가지 항목과 27개 평가속성으로 정의하였다. 연구 결과 이탈률에 영향을 미치는 웹사이트 속성은 판별분석과 의사결정나무분석에 의해 6개가 유의한 것으로 검증되었다. 본 연구를 통한 벤처기업 웹사이트의 이탈률을 줄이기 위한 제안은 다음과 같다. 첫째, 웹사이트의 경로명을 필수로 표시하고 풀다운 메뉴 기능을 추가하여 다른 페이지로의 이동이 용이하도록 한다. 둘째, 사용자의 관심을 끌 만한 핵심 콘텐츠를 배너 형태로 노출하고 서브 페이지에서도 내부링크 배너를 적재적소에 배치하는 것이 좋다. 셋째, 외부링크는 현재 페이지를 바로 이탈하지 않도록 새 창으로 연동하여 재유입이 가능하도록 해야 한다. 마지막으로 담당자 연락처와 상담기능은 고객과의 소통을 위한 직접 정보로서 노출이 권장되지만 개별 응대가 어려울 경우에는 상담기능만이라도 필수로 추가해야 한다. 이러한 제안들은 웹사이트의 개발과 운영, 마케팅 등 여러 분야에서 실무적으로 도움이 될 것으로 기대된다. 다만 특수한 경우에는 높은 이탈률이 정상적일 수도 있으므로 상황에 맞게 고려되어야 한다.

  • PDF

국내 통합의학 저널의 연구 동향에 대한 계량서지학적 분석 : Integrative Medicine Research를 중심으로 (A Bibliometric Analysis of Research Trends in Domestic Integrative Medicine Journals : Focused on Integrative Medicine Research)

  • 김대진;윤태형;이종록;최병희
    • 대한통합의학회지
    • /
    • 제12권2호
    • /
    • pp.197-210
    • /
    • 2024
  • Purpose : This study aimed to analyze research trends in the field of integrative medicine through a bibliometric analysis of articles published in Integrative Medicine Research (IMR) journal from 2017 to 2022. Methods : Articles published in IMR journal between 2017 and 2022 were searched using the Web of Science database on August 22, 2023. The analysis was performed using the Bibliometrix and Biblioshiny tools in R (version 4.3.1) and VOSviewer (version 1.6.19). Results : The key findings were as follows: average citations per article (9.41), total authors (1,142), single-authored articles (12), average articles per author (0.27), average co-authors per article (5.27), and rate of international co-authorships (15.69 %). The most-cited article was on the cryopreservation of cells or tissues and their clinical applications. The top keyword analysis by author keywords showed that "acupuncture" was the most frequently used keyword (33 times). Co-occurrence network analysis showed 85 high-frequency keywords that appeared five or more times, and the top five keywords by total link strength were "acupuncture," "herbal medicine," "prevalence," "alternative medicine," and "complementary." The study found that, contrary to the trend in complementary and alternative medicine research in Korea, the IMR journal actively conducts intervention studies to provide clinical evidence. Conclusion : In the IMR journal, "acupuncture" was the most frequent of author keywords. The analysis of keyword trend topics over time showed that the keyword "systematic review" continued to appear from 2020 to 2022, and the keyword "clinical practice guideline" appeared for the first time in 2021. In particular, the co-occurrence network analysis highlighted keywords related to intervention research, in contrast to domestic research trends. While this study analyzed only one journal, future studies expanding the category of integrative medicine and increasing the number of journals analyzed may provide further insights.

블로그의 구조적 특성을 고려한 효율적인 블로그 검색 알고리즘 (The Effective Blog Search Algorithm based on the Structural Features in the Blogspace)

  • 김정훈;윤태복;이지형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권7호
    • /
    • pp.580-589
    • /
    • 2009
  • 오늘날, 대부분의 웹 페이지는 블로그영역에서 생성되고 기존의 웹 페이지 또한 블로그영역으로 전환되어가고 있다. 블로그 페이지는 트랙백연결, 블로거, 태그, 댓글과 같은 기폰 웹 페이지에는 존재 하지 않는 특징이 있다. 따라서 이러한 차이를 반영하지 않는 전통적인 웹 페이지 랭킹 알고리즘을 블로그 페이지에 단순히 적용하는 것은 효율적인 검색을 위해 적절하지 않다. 본 논문에서는 이러한 문제를 해결하기 위해 블로그 검색을 위한 "블로그-랭크" 알고리즘을 제안한다. 제안하는 알고리즘은 블로그의 구조적특징들을 활용하여 트랙백 연결성, 블로거의 명성, 사용자 반응성을 평가하고 이를 기반으로 블로그 페이지를 랭크 한다. 우리는 알고리즘의 검색효율성을 증명하기 위해 제안한 알고리즘을 적용한 블로그 검색 시스템을 구현하고 기존의 블로그 검색시스템과 검색효율성을 비교하였으며, 그 결과 블로그 랭크 알고리즘을 적용한 검색시스템이 기존의 검색시스템보다 더욱 뛰어난 검색효율성을 보임을 확인하였다.