• 제목/요약/키워드: 데이터웹

검색결과 3,387건 처리시간 0.047초

통계 및 데이터마이닝 기법을 이용한 웹 사이트 분석 (Analysis of E-biz Site Using Statistics and Data Mining Techniques)

  • 류창수;서용무
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.369-387
    • /
    • 2001
  • 인터넷 기술의 발달과 인터넷 비즈니스의 발전으로 인해 오늘날 사람들은 더욱 많은 시간을 인터넷 상에서 보내고 있다. 사용자가 기업의 웹 사이트를 방문한 기록은 웹 로그파일이라는 형태로 기업의 서버에 남게 되는데 이러한 로그 파일을 이용해 고객의 행동을 더욱 잘 이해하는 것이 매우 중요한 경쟁력의 요소로 자리 잡게 되었다. 이제까지는 웹 로그를 분석하기 위해 웹 로그 분석 도구를 이용해 왔는데, 경영 의사 결정에 도움이 되는 지식을 발견하기보다는 단순한 기술적인 통계량을 구하는데 그쳤다. 본 연구에서는 통계와 데이터마이닝 기법을 웹 데이터에 적용하여 경영 의사 결정에 도움이 되는 의미 있는 정보를 추출한다. 이를 위해 실제 인터넷 기업의 데이터를 기반으로 하여 대량 데이터를 데이터마이닝을 위해 전처리 하는 과정과 준비된 데이터를 분석하는 과정을 소개한다. 웹 사이트의 분석은 경영 지식을 찾아내기 위한 과정으로 개별 사이트가 처한 상황에 따라 분석과정이 상이해 질 수 있기 때문에 실제 기업의 데이터를 가지고 분석해 나가는 과정을 보이는 것은 의미 있는 연구라 생각된다.

  • PDF

무선망 적응 프록시 서버를 이용한 웹 엑세스 고속화 (High Speed WWW Access Using a Wireless-Adaptive Proxy)

  • 정성신;함경선;양서민;이혁준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.540-542
    • /
    • 1999
  • 최근의 인터넷과 무선통신 기술의 발달은 이동 호스트에서 무선 데이터 서비스를 이용한 웹으로의 접근을 가능하게 하고 있으나 무선망의 높은 에러율과 높은 대역폭 등 제한적인 물리적 특성으로 인하여 데이터 전송 시 만족할 만한 수준의 응답속도를 제공하지 못하고 있다. 본 논문에서는 웹 프록시 서버를 이용하여 기존의 응용프로그램이나 인터넷 기반구조에 대한 수정 없이 무선망을 통한 웹 서비스 속도를 향상시킬 수 있는 방법을 소개한다. 웹 프록시 서버에서 사용자 단말장치, 웹 브라우저 및 사용자의 요구에 의해 각기 다른 웹 에디터 종류에 따라 무손실, 손실압축기법을 적용하여 데이터량을 감소시키고 미리불러오기 기능을 사용하여 웹 데이터에 대한 전송지연을 감소시킨다. 또한, 현재 상용화되어 있는 CDMA 셀룰라망을 사용하여 프록시 서버를 통한 웹 접근 실험을 통해 이러한 데이터 처리 방법에 의한 전송 데이터량의 감소와 이에 따른 응답시간의 향상을 확인한다.

  • PDF

메타데이터 레지스트리 기반 웹 온톨로지 생성에 관한 연구 (A Study on Creation of Web Ontology based on the Metadata Registry for the Semantic Web)

  • 정동원;김정동;손지성;김장원;백두권
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.19-24
    • /
    • 2009
  • 이 논문에서는 메타데이터 레지스트리 (MDR, Metadata Registry) 기반의 웹 온톨로지 생성모델을 제안한다. 메타데이터 레지스트리는 국제 표준(ISO/IEC 11179)으로서 데이터베이스간 상호운용성 향상을 위해 개발되었다. 그러나 데이터 표현과 상호운용성을 위한 컴퓨팅 환경의 변화는 메타데이터 레지스트리의 확장은 물론 메타데이터 레지스트리의 활용 방법의 변화를 요구한다. 이 논문에서의 웹 환경의 변화란 정적인 웹 환경에서 웹 2.0 혹은 시맨틱 웹 이라고 정의하는 차세대 웹 환경으로의 변화를 의미한다. 이러한 환경을 위해서 다양한 기술 개발과 적용 기법에 관한 연구가 필요하다. 특히 차세대 웹을 위해서는 지원에 대한 명확한 의미 정의 및 활용이 요구된다. 이는 웹 온톨로지 스키마를 구성하는 개념들에 대한 보다 일관성 있는 정의 및 사용이 필요하다. 이러한 문제가 해결되지 않을 경우, 또 다시 온톨로지를 구성하는 개념들 간 이질성 문제를 야기한다. 메타데이터 레지스트리는 다양한 표준화 된 개념들을 포함하며, 응용을 위한 데이터를 위한 의미 또한 이 개념들을 이용하여 정의한다. 따라서 이러한 표준 요소를 이용한 웹 온톨로지 스키마 정의 및 활용이 요구되며, 이 논문에서 이와 관련된 기본 개념, 요구 사항을 장의하고 전체적인 모델을 제안한다.

  • PDF

국내외 공공기관 웹 사이트의 데이터 테이블 비교 평가 (Compared evaluation on Data Table of domestic and international Public Web sites)

  • 박지용
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2006년도 춘계 국제학술대회 논문집
    • /
    • pp.89-94
    • /
    • 2006
  • 웹은 제작과 사용이 간편하다는 이점으로 인해 사용인구가 폭발적으로 증가하고 있다. 또한 웹은 지역, 성별, 연령에 관계없이 사용할 수 있는 보편적인 특성을 지니고 있다. 이러한 웹의 보편적 특징은 특히 장애인들을 위해서 웹 접근성이라는 용어로 사용되고 있다. 이러한 웹 접근성을 평가하기 위해 국내 정부기관 웹 사이트와 국제기구 웹 사이트를 비교 평가하였다. 특히, 웹 접근성평가는 평가자의 기준에 의해 평가결과가 모호하며 평가결과가 상당부분 왜곡되어 있다는 문제점이 있다. 또한 이러한 문제점은 데이터테이블에서 두드러지게 나타난다. 본 연구에서는 데이터 테이블의 왜곡된 평가에 대한 문제점을 도출하고 그러한 문제점을 수정하여 국내외 웹 사이트들을 비교 평가하였다. 평가결과, 국내외 웹 사이트의 데이터 테이블에 대한 웹 접근성은 많은 격차가 존재하였으며, 웹 접근성 준수 여부는 지침의 기술적 준수뿐만 아니라 웹 사이트 설계 시 화면 구성에 의해서도 결정되어 짐을 제시하였다.

  • PDF

웹 로그(WEB LOG) 데이터 분석 방법에 관한 연구 (Web Log Data Analysis)

  • 김석기;안정용;한경수
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.261-271
    • /
    • 2001
  • 정보 공유와 비즈니스 수행 등의 매체로서 World Wide Web의 이용이 보편화됨에 따라 다양하고 방대한 데이터를 웹을 통하여 얻을 수 있게 되었으며, 이러한 데이터로부터 유용한 정보를 추출하기 위한 데이터 분석과 활용은 많은 분야에서 중요한 사안으로 인식되고 있다. 본 연구에서는 웹 로그(web log)데이터로부터 정보를 추출하기 위한 과정 및 방안에 대해 살펴보고자 한다. 로그 데이터의 특징과 통계 데이터와의 차이점, 데이터 수집 및 사전 처리 과정, 추출할 수 있는 정보 및 분석 방법 등을 제시하고 로그 데이터 분석 예제를 제시한다.

  • PDF

구조화 된 데이터 기반의 웹 온톨로지 학습 및 확장 모델 설계 (A Design of Web Ontology Learning and Population Model based on Structured Data)

  • 정혜진;정동원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.329-332
    • /
    • 2009
  • 이 논문에서는 보다 풍부하고 정확한 정보를 제공하기 위한 구조화 된 데이터를 이용한 웹 온톨로지 확장(Population) 모델을 제안한다. 시맨틱 웹이 등장하면서 웹 온톨로지의 구축이 필수 요소가 되었으며, 더욱 정확하고 보다 풍부한 정보를 제공하기 위한 웹 온톨로지 생성 모텔에 관한 연구의 필요성이 증가하였다. 이러한 요구 사항을 충족시키기 위해서는 첫 번째로, 일관성 있고 보편적인 개념을 이용한 웹 온톨로지 스키마 생성과 이를 기반으로 한 온톨로지 간 상호운용성 향상이 요구된다. 두 번째로, 보다 풍부한 정보 제공을 위해 정의된 온톨로지를 확장할 수 있는 방법 개발이 요구된다. 이 논문에서는 메타데이터 레지스트리 (MDR, Metadata Registry)를 이용하여 생성된 구조화 된 데이터 기반의 온톨로지 학습 및 확장 모델을 제안한다. 된 데이터에 대한 개념과 이를 기반으로 한 학습 및 확장의 특징 등에 대하여 기술하고 제안 모델을 위한 시스템 구조에 대하여 기술한다.

  • PDF

XWEET : 웹 환경을 위한 통합 데이터베이스 시스템 (XWEET : The Unified Database System for Web Environment)

  • 정재목;박상원;정태선;이병준;민경섭;이강우;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권2호
    • /
    • pp.233-243
    • /
    • 2001
  • XML은 Web에서 운영되는 모든 데이터 표현에 대한 표준이다. 여러 웹 소스들로부터 이질적인 데이터를 XML 데이터로 통합할 수 있다. 많은 연구자들이 XML처리에 대한 연구를 해 왔다. 이러한 연구의 집합체로서, 우리는 XML 데이터의 효율적인 저장, 추출, 질의, 웹 환경에서의 응용을 위한 기반 시스템인 XWEET를 제안, 구현하였다. XWEET는 XML 데이터의 표현을 위해 XDM이라는 데이터 모델을 사용하였으며, XML 데이터의 저장을 위해 PDM을, 이질적인 정보 소스로부터의 데이터 통합을 위해 Wrapper와 XWS를, 서로 다른 XML 문서 형식의 통합된 표현을 위해 XSI를 제공한다. 이렇게 통합, 저장된 데이터는 XML/QL 형식의 질의를 통해 접근되며, XQP는 제공되는 질의를 처리한다. 또한, 사용자들은 웹 환경에서 수행괴는 응용을 작성할 수 있는 기반을 제공받는다. WPG와 HTML/XML Template는 웹 응용의 수행 결과를 정의된 HTML이나 XML로 생성하도록 해 주며, WebTP는 웹기반 워크플로우를 위한 기반 기능을 제공한다.

  • PDF

DCAT 기반 메타데이터의 웹 출판을 위한 변환 기법 (Transformation Method for Publishing DCAT based Metadata in Data Repository on Web)

  • 박진효;김기훈;김성희;윤주상
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.491-493
    • /
    • 2021
  • 최근 데이터 산업 발전과 함께 데이터를 저장, 공유, 거래가 가능한 다양한 데이터 저장소와 거래소가 증가하고 있다. 대부분의 데이터 저장소 및 거래소는 데이터 검색과 공유를 위해 DCAT 기반 메타데이터를 구성하고 있다. 하지만 DCAT 기반 메타데이터는 웹 검색 엔진에서 검색이 잘되지 않는 문제점을 가지고 있다. 이는 웹에서 자원을 출판하기 위한 데이터 모델 기법이 Schema.org 방법을 사용하고 있기 때문이다. 본 논문에서는 이런 문제점을 해결하기 위해 DCAT 기반 메타데이터를 Schema.org 방법으로 변환할 수 있는 새로운 기법을 제안한다. 제안하는 변환 기법은 데이터 저장소와 거래소 내 데이터셋이 웹에서 잘 검색될 수 있는 웹 출판 기능을 지원한다.

모바일 환경에서의 웹 데이터 추출을 위한 정의 언어 설계 및 라이브러리 구현 (A Design and Implementation of Definition Language and Library for Web Data Extraction for Mobile Platform)

  • 장병국;최원익
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.97-99
    • /
    • 2011
  • 논문에서는 일반 웹 브라우저를 대상으로 제작된 웹 페이지로부터 사용자가 원하는 정보를 추출하여 모바일 환경에서 활용할 수 있는 방법을 제안한다. 기존에 별도의 프록시(proxy) 서버를 통해 데이터를 저장하고 이를 제공하는 방식이 제안되었으나 이는 보안에 민감한 데이터 및 실시간 데이터 처리에 적합하지 않다. 본 논문에서는 모바일 기기상에서 웹 데이터 추출을 직접 처리하는 방법을 제안하며 이를 위해 웹 페이지로부터 데이터를 추출하는 방법 및 절차를 기술하는 정의 언어 (Web Extraction Definition Language)를 설계한다. 또한 설계된 WEDL 문서를 기반으로 동작하는 웹 클라이언트 라이브러리를 구현하여 실제 웹 페이지를 대상으로 동작하는지 실험한다.

웹 사용 마이닝에서의 데이터 수집 전략과 그 응용에 관한 연구 (Research on Data Acquisition Strategy and Its Application in Web Usage Mining)

  • 염종림;정석태
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권3호
    • /
    • pp.231-241
    • /
    • 2019
  • 웹 사용 마이닝 (WUM)은 웹 마이닝과 데이터 마이닝 기술의 응용 중의 하나다. 웹 마이닝 기술은 사용자가 웹 사이트에 액세스 할 때 웹 사용자가 생성 한 웹 서버 로그 데이터를 사용하여 사용자의 액세스 패턴을 식별하고 분석하는데 사용된다. 따라서 우선 데이터 마이닝 기술을 적용하여 웹 로그에서 사용자 액세스 패턴을 발견하기 전에 합리적인 방법으로 데이터를 수집해야 한다. 데이터 수집의 중요한 일은 사용자의 웹 사이트 방문 과정에서 사용자의 자세한 클릭 동작을 효율적으로 얻는 것이다. 이 논문은 주로 데이터 수집 전략 및 필드 추출 알고리즘과 같은 웹 사용 마이닝 데이터 프로세스의 첫 단계 이전의 데이터 수집 단계에 중점을 둔다. 필드 추출 알고리즘은 로그 파일에서 필드를 분리하는 프로세스를 수행하며 대용량의 사용자 데이터에 대한 실제 응용에도 사용된다.