• 제목/요약/키워드: web pages

검색결과 553건 처리시간 0.03초

웹 개인화를 위한 웹사용자 클러스터링 알고리즘에 관한 연구 (A Study on Web-User Clustering Algorithm for Web Personalization)

  • 이해각
    • 한국산학기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.2375-2382
    • /
    • 2011
  • 웹사이트 운영이 비즈니스 모델로서의 성공을 거두기 위한 가장 중요한 요소 중 하나는 웹사용자의 성향을 분석하여 이를 효율적으로 이용하는 것이다. 사용자 분석을 통하여 사용자들에게 웹사이트의 가치를 효율적으로 전달하고 이를 통하여 운영자는 충분한 수익을 거둘 수 있다. 이러한 점에서 웹 사이트를 이용하는 사용자들의 취향과 행동방식을 얻어내려는 웹 방문 패턴 발견으로써의 사용자 클러스터링은 매우 중요하다. 또한 얻어진 사용자의 클러스터링 정보는 웹 개인화나 웹 사이트를 재구성하는데 필수적이다. 본 논문에서는 사용자 웹 방문 데이터를 정제하고 분류하여 그 특성에 따라 사용자들을 몇 개의 그룹으로 클러스터링 하기 위한 알고리즘이 제안된다. 알고리즘은 2단계로 구성되는데 첫 번째 단계는 초기해를 구하는 단계로서, 패스의 사이각을 이용하여 유사도를 측정하고 이 유사도에 따라 K개의 사용자 그룹으로 분류하여 초기해를 구한다. 두번째 단계는 첫 번째 단계에서 구한 초기해를 개선하여 최적해를 찾는 과정으로서 하이퍼플레인을 이용하여 클러스터링하는 개량된 K-평균알고리즘을 제안한다. 또한 실험을 통하여 기존의 방법과 비교하여 제안된 알고리즘의 효율성과 패스 특성이 보다 정확하게 계산된 클러스터링이 구현됨을 확인할 수 있다.

온톨로지 기반의 웹 페이지 분류 시스템 (Web Page Classification System based upon Ontology)

  • 최재혁;서혜성;노상욱;최경희;정기현
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.723-734
    • /
    • 2004
  • 본 논문은 온톨로지(ontology)에 기반 한 자동화된 웹 페이지 분류 시스템을 제안한다. 웹 페이지의 분류를 위하여 첫 번째 단계에서는 각 웹 페이지가 속한 범주(category)를 대표할 수 있는 단어를 선정하며, 이를 위하여 단어빈도와 문서빈도를 곱한 값을 계산한다. 두 번째 단계에서는 첫 번째 단계에 의해 선택된 단어의 정보이득(information gain)을 계산해 분류 확률이 높은 단어를 우선적으로 선정한다. 두 단계를 통하여 선정된 단어들과 웹 페이지의 분류 정보를 가지고, 기계학습에 의하여 컴파일 된 규칙(compiled rules)을 생성한다. 생성된 규칙은 임의의 웹 페이지들을 도메인 온톨로지에 의해 정의된 범주 별로 분류할 수 있도록 한다. 본 논문의 실험에서는 주어진 웹 페이지 집합에서 각 범주 별로 평균 240개의 단어로부터 78개의 단어를 결과적으로 선정하였으며, 이를 바탕으로 웹 페이지 분류 규칙을 생성하였다. 실험 결과에서 제안한 시스템의 평균 분류 정확도는 약 83.52%로 측정되었다.

공동 브라우징을 지원하는 웹 기반의 동기적 원격 학습 시스템 (A Web-based Synchronous Distance Learning System Supporting the Collaborative Browsing)

  • 이성제;신근재;김엄준;김문석;성미영
    • 한국멀티미디어학회논문지
    • /
    • 제4권5호
    • /
    • pp.430-438
    • /
    • 2001
  • 본 논문에서는 공동 브라우징을 지원하는 웹 기반의 동기적 원격 학습 시스템의 설계와 구현 내용을 소개한다. 본 논문에서 제안하는 시스템은 학사관리 시스템, 화이트보드 시스템, 화상 회의 시스템, 공동 브라우징 시스템, 그리고 세션 관리자로 구성되어 있다. 본 시스템을 구성하는 시스템 중 공동 브라우징 시스템은 다른 원격학습 시스템에서 찾아보기 어려운 독특한 시스템이다. 우리의 공동 브라우징 시스템은 상용 웹 브라우저에서 실행되며, 교사가 교육에 필요한 웹사이트들을 이동할 때 교사의 웹 브라우저의 내용을 그대로 사용자에게 동기화 되어 보여줌으로써 마치 학습자 자신이 웹 서핑을 하는 것처럼 느끼게 해준다. 세션 관리자는 멀티유저와 멀티그룹을 지원하며 화이트보드, 화상회의, 공동 브라우징 시스템 등의 다양한 원격 학습 컴포넌트들이 같은 세션 정보를 가질 수 있게 하여 하나의 원격학습 시스템으로 통합될 수 있게 한다. 본 시스템은 공동 브라우징 등 여러 가지 동기적인 기능을 지원하여 원격 학습의 효율을 증진시키고, 마치 동일한 강의실에서 학습하고 있는 듯한 효과를 얻을 수 있게 해준다.

  • PDF

BHO 이용한 웹 컨텐츠 변조 탐지 방법 (Web contents deformation detection method by BHO)

  • 모정훈;정만현;조재익;문종섭
    • 한국항행학회논문지
    • /
    • 제15권4호
    • /
    • pp.655-663
    • /
    • 2011
  • 최근 인터넷 서비스 기술이 발달함에 따라 웹 서비스는 사용자의 컴퓨팅 환경에 많은 변화를 주었다. 시사, 경제, 게임/오락은 물론, 개인 금융까지도 웹 페이지를 통해 처리 된다. 이 때, 웹 페이지는 텍스트 형태의 코드를 전송받아 DOM 정보로 가공되어 웹 브라우저에 의해 사용자에게 보여 진다. 하지만, 이 정보들은 다양한 경로를 통해 접근이 가능하고 악의적인 목적으로 변조되어질 수 있다. 또한, 보안 매커니즘을 우회하여 사용자의 로그인 정보나 인증서를 획득할 수도 있다. 따라서, 본 논문에서는 이러한 웹페이지 변조 행위를 탐지하기 위해 웹 브라우저 중 대표적인 MicroSoft 사의 MS Internet Explorer의 Add-On 프로그램인 BHO를 이용하여 웹 컨텐츠에 대한 무결성을 검증하는 탐지 방법을 제안한다.

시맨틱 기술을 활용한 RESTful 웹서비스의 검색 기법 개발 (Development of Search Method using Semantic technologies about RESTful Web Services)

  • 차승준;최윤정;이규철
    • 한국공간정보시스템학회 논문지
    • /
    • 제12권1호
    • /
    • pp.100-104
    • /
    • 2010
  • 최근 웹 2.0의 등장과 함께 플랫폼으로의 웹이 강조되면서, SOAP 기반의 웹서비스에 비해 RESTful 웹서비스가 크게 증가하고 있다. 하지만 서비스들은 이미 많이 존재하며 빠르게 증가하기 때문에 키워드를 기반으로 사용자가 원하는 서비스를 정확하게 찾는 것은 어렵다. 본 논문에서는 이러한 문제를 해결하기 위해서 시맨틱을 활용한 RESTful 웹서비스 검색 기법을 개발하였다. 이를 위해 우선 OpenAPI 통합 검색 시스템을 바탕으로 시맨틱을 활용하기 위한 시스템 구조를 구성하고, 시맨틱 검색을 위한 기술 형식을 모델링하였다. 이를 바탕으로 의미 마크업(태깅, 시맨틱 어노테이션)을 수행하여, 추출된 결과인 RDF 문서를 서비스 저장소에 저장하여 이를 바탕으로 검색을 수행한다. 온톨로지를 활용하여 입력받은 키워드를 확장하고, 이를 바탕으로 검색을 수행하여 사용자에게 유사도 기반의 키워드 검색 기법에서의 검색 결과보다 확장 / 정제된 검색 결과를 제공한다.

인터넷 영양정보의 모니터링-메타데이터의 분석 (Monitoring of On-Line Nutrition Information-Analysis of Meta Data)

  • 강혜경;강명희;유경혜;이선영
    • Journal of Nutrition and Health
    • /
    • 제37권8호
    • /
    • pp.688-700
    • /
    • 2004
  • This study was conducted to analyze how appropriate the on-line nutrition information was externally as a web information. Four-hundred-ninety-seven web sites from 5 internet search engines (Yahoo, Empas, Nate, Hanmir, Naver) were selected on the basis of April 25th, 2004. The skillful personnels monitored them about 8 evaluating categories: clarity, purpose, authority, durability, advertisement, privacy and/or security, responsibility, and contents. Forty percent of the selected web sites were operated by the companies which had commercial purpose like internet shopping malls and 5.6% by academies, societies, research institutions, schools/colleges and public institutions. Most of web sites (76.1 %) were managed for advertisements and sales of companies' commodities, and 32.6% had the food and nutrition information as first purpose. Ninety-three percent of web sites were targeted to healthy individuals through whole life cycle. Specifically, there were lots of web sites for the obesity which were offered by diet related companies. Of the 497 web sites, 193 mentioned the name providing the nutrition information, but only 1/3 had reliability on their specialty. As a source of nutrition information, 52.7% of web sites were using 'books of the major field' and 42.0% 'newspapers' and 23.7% 'broadcasting', respectively. Most web sites mentioned 'setting-up date' but not 'renewal date'. Thirty-six percent of web sites took '2 - 3 days' for the operators to answer the questions through the bulletin. Forty-seven percent of web sites answered' 1 - 10 questions' per 1 week, but 40.1 % of them didn't answer for a week at all. There were 118 web sites (23.7%) to record the connected frequencies and 36.0% of them put the advertisements. Around 96% of web sites mentioned feedback addresses. Among the menus of web sites, 68.0% were about self-advertisement and 64.0% about nutrition information. Each web site was scored to judge its external quality according to the operators by selecting 13 items. Web sites managed by public institution had highest scores (9.5), and lowest in private vendors', food companies' and individual web pages. Among search engines, Naver got the highest score of 7.0 and Nate the lowest one of 6.1. As it was only the pilot study, there were several limits in evaluating tools, time and monitored quantity. To make monitoring of on-line nutrition informatiions actively, standardized monitoring forms might be developed under the integrated studies.

유사한 인기도 추세를 갖는 웹 객체들의 클러스터링 (Clustering of Web Objects with Similar Popularity Trends)

  • 노웅기
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.485-494
    • /
    • 2008
  • 인터넷이 광범위하게 활용됨에 따라 검색 키워드, 멀티미디어 객체, 웹 페이지, 블로그 등의 다양한 웹 객체들이 크게 증가하고 있다. 이러한 웹 객체들의 인기도는 시간에 따라 변화하며, 그러한 웹 객체 인기도의 시간적 패턴에 대한 마이닝이 여러 가지 웹 응용에 필요한 중요한 연구 과제가 되고 있다. 예를 들어, 검색 키워드에 대한 인기도 패턴의 분석은 앞으로 인기가 높아질 키워드를 미리 예측할 수 있게 하여 광고주들에게 키워드를 판매하기 위한 가격을 결정하는 데에 중요한 자료가 될 수 있다. 하지만, 웹 객체 인기도가 시간에 따라 변화하고 웹 객체의 개수가 매우 방대하다는 특성으로 인하여 웹 객체 인기도에 대한 분석은 매우 어려운 문제이다. 본 논문에서는 웹 객체 인기도의 시간적 패턴을 마이닝하기 위한 효율적인 알고리즘을 제안한다. 본 논문은 웹 객체 인기도를 시계열로 표현하고, 두 웹 객체 인기도 간의 유사성을 측정하기 위하여 gap 척도를 제안한다. gap 척도의 효율적인 계산을 위하여 FFT를 활용한 알고리즘을 제안하고, 밀도기반 클러스터링 알고리즘을 이용하여 유사한 인기도 추세를 갖는 웹 객체들의 클러스터를 생성한다. 본 논문에서는 웹 객체 인기도가 특정 분포를 따르거나 주기적이라고 가정하지 않는다. Google Trends 웹 사이트로부터 구한 검색 키워드 인기도를 이용한 실험을 통하여, 제안된 알고리즘이 실세계 응용에서 유용함을 보인다.

DOM을 이용한 PC 웹 페이지에서 모바일 웹 페이지로의 다이나믹 오브젝트 변환 및 서비스 기법 (A Scheme that Transcodes and Services from PC Web Page to Mobile Web Page of Dynamic Object with DOM)

  • 김종근;강의선;심근정;고희애;임영환
    • 정보처리학회논문지D
    • /
    • 제14D권3호
    • /
    • pp.355-362
    • /
    • 2007
  • 이동 통신 단말기의 발달과 모바일 인터넷의 확산으로 많은 사용자들은 언제 어디서나 모바일 웹 콘텐츠를 이용 할 수 있게 되었으며 나아가 더 많은 콘텐츠의 서비스를 요구하게 될 것이다. 이러한 요구로 인하여 유선 웹 콘텐츠를 모바일 웹에 사용할 수 있도록 콘텐츠를 변환하는 연구들이 많이 진행되고 있으나, 통신사 및 모바일 단말기들의 지원사양이 표준화되지 않아 모바일 웹 콘텐츠의 변환 및 생성에 많은 어려움이 따르고 있다. 특히나 유선 웹 페이지의 내용 중에 시간이나 사용자에 따라 그 내용이 동적으로 변화하는 다이나믹 오브젝트를 모바일 웹에 서비스하기 위해서는 각각의 단말기에 맞도록 스크립트를 프로그래밍 해야 할 뿐 아니라 사용되는 리소스의 선 변환이 요구되어진다. 이러한 어려움을 해결하기 위해 본 논문에서는 유선 웹 페이지의 구조적 특성을 나타내는 DOM(Document Object Model)의 계층구조를 이용한다. 즉 유선 웹페이지를 분석하여 이를 자료구조화 하고, 이 가운데에서 다이나믹 오브젝트를 추출하여 그 영역을 인덱싱 하였다가, 모바일 웹 페이지를 서비스 할 때 인덱싱 된 위치에서 정보를 추출하여 실시간으로 모바일 웹 콘텐츠를 생성하여 서비스하는 기법을 제시한다. 또한 본 논문은 이 기법을 적용하여 모바일 웹 콘텐츠를 편집하는 편집기와 이를 서비스하는 모바일 웹 서비스 서버를 개발하는 데 그 목표가 있다.

웹콘텐츠 서비스 평가 (An Evaluation Method for Web Contents Services)

  • 장희선;박종태
    • 서비스연구
    • /
    • 제3권2호
    • /
    • pp.33-44
    • /
    • 2013
  • 인터넷과 모바일 서비스의 증가로 유무선 웹 콘텐츠 서비스 이용이 증가하고 보다 다양한 콘텐츠 수요가 발생하고 있다. 경쟁력 있는 콘텐츠를 제공하는 웹사이트로 살아남기 위해 그리고 접근성, 웹표준에 대한 기술적 오류를 없애고 콘텐츠 이용률이 높은 사이트가 되기 위해서는 마케팅 및 캠페인과 같은 이벤트도 필요하지만 무엇보다도 정기적인 사이트 평가를 통하여 문제점을 진단하고 이를 해결하는 노력이 요구된다. 본 논문에서는 웹콘텐츠 서비스를 제공하는 사이트 평가 방법을 크게 정량적 방법과 정성적 방법으로 구분하여 제시하고 정량적 방법의 타당성을 검증하기 위해 국내 138개 홈페이지에 대한 평가 결과를 분석하였다. 정량평가를 위하여 접근성, 표준성 및 이용성 항목으로 구분하고 접근성은 K-WAH(Korea-Web Accessibility Helper)를 이용하여 인식 운용 이해의 용이성 및 기술적 진보성 항목에서의 오류수를 진단하고 표준성은 W3C Validator를 이용하여 웹표준의 오류 및 경고수를 분석하며, 이용성은 구글 애널리틱스를 이용하여 사용자 방문수, 평균 방문시간, 이탈률 등을 평가한다. 그리고 웹사이트에 대한 비용(구축 및 운용비)을 고려하여 정량평가와 비용 사이의 상관관계를 분석한다. 분석 결과, 100점 만점으로 환산하였을 때, 평균 55점, 표준편차 14점으로 평가되었으며 정량평가 점수와 비용 사이에는 양(+)의 상관관계가 존재하나 상관계수는 0.058로 그다지 높지 않음을 알 수 있다.

  • PDF

웹 디자인에서 배색과 레이아웃에 대한 감성효과 (The Sensibility Effects of Color Combination and Layout in the Design of Web Site)

  • 조경자;선지현;한광희
    • 디자인학연구
    • /
    • 제17권2호
    • /
    • pp.209-220
    • /
    • 2004
  • 본 연구는 웹 디자인에서 배색(color combination)과 레이아웃(layout)에 의한 감성 효과를 알아보기 위하여 수행되었다. 본 연구에서는 여덟 가지 배색 샘플(sample)과 네 가지 기본 레이아웃(layout)을 선정하여, 그 조합으로 웹 페이지를 디자인하여 배색과 레이아웃 타입에 따른 감성 효과를 알아보았다. 배색과 레이아웃에 의한 감성 효과는 '밝고 소프트하고 화려한' 배색과 레이아웃 타입에서 '밝다, 환하다, 간단하다, 따뜻하다, 간결하다, 소프트하다' 가 주 감성 효과로 나타났다. 그리고 '어둡고 딱딱하며 간단한' 배색과 레이아웃 타입에서는 '차갑다, 칙칙하다, 어둡다, 딱딱하다, 도회적이다'의 감성 효과가 나타났다. 또, 배색에 의한 감성 효과는 배색의 감성을 포함하고 있는 감성 어휘들이 우선적으로 나타난 것으로 보아 배색에서부터 오는 감성 효과가 크다고 해석되었다. 또한 레이아웃에 의한 감성 효과는 레이아웃 A와 B에서 C와 D타입으로 갈수록 즉, 레이아웃이 복잡해질수록 '화려하고 도회적인' 인상을 받는 것으로 나타났다. 배색에 의한 감성 효과가 레이아웃에 의한 감성효과보다 크게 나타났으나 배색은 레이아웃에 의해 이루어지므로 레이아웃에 의한 감성 효과도 중요한 것으로 해석되었다.

  • PDF