• 제목/요약/키워드: 데이터웹

검색결과 3,399건 처리시간 0.034초

웹 로그에서의 Apriori 알고리즘 기반 사용자 액세스 패턴 발견 (User Access Patterns Discovery based on Apriori Algorithm under Web Logs)

  • 염종림;정석태
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권6호
    • /
    • pp.681-689
    • /
    • 2019
  • 웹 사용 패턴 발견은 웹 로그 데이터를 사용하는 고급 수단이며 웹 로그 데이터 마이닝에 데이터 마이닝 기술을 적용한 특정 응용이다. 교육 분야에서 데이터 마이닝 (DM)은 데이터 마이닝 기술을 교육 데이터 (대학의 웹 로그, e-러닝, 적응형 하이퍼미디어 및 지능형 튜터링시스템 등)에 적용한다. 따라서 교육 연구 문제를 해결하기 위해 이러한 유형의 데이터를 분석하는 것이 목표이다. 본 논문에서는 대학의 웹 로그 데이터가 데이터 마이닝의 연구 대상으로 사용되어 진다. 데이터베이스 OLAP 기술을 사용하여 웹 로그 데이터가 데이터 마이닝에 사용될 수 있는 데이터 형식으로 사전 처리되고 그 처리 결과가 MSSQL에 저장된다. 동시에 처리 된 웹 로그 레코드를 기반으로 기본 데이터 통계 및 분석이 완료된다. 또한 웹 사용 패턴 마이닝의 Apriori Algorithm 및 구현 프로세스를 소개하고 Python 개발 환경에서 Apriori Algorithm 프로그램을 개발했다. 그런 다음 Apriori Algorithm의 성능을 보이고 웹 사용자 액세스 패턴의 마이닝을 실현했다. 이 연구 결과는 교육 시스템 개발에 패턴을 적용하는데 중요한 이론적 의미를 갖는다. 다음 연구로는 분산 컴퓨팅 환경에서 Apriori Algorithm의 성능 향상을 연구하는 것이다.

Linked Data 연계를 위한 SKOS 기반 용어 온톨로지 모델링 (Term Ontology Modeling for Linked Data using SKOS)

  • 김평;이승우;서동민;정한민;성원경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2010년도 춘계 종합학술대회 논문집
    • /
    • pp.456-458
    • /
    • 2010
  • 시맨틱 웹은 인간 중심의 데이터 표현을 위한 HTML 기반의 기존 웹과는 달리, 웹에서 데이터의 의미를 표현함으로써 다양한 어플리케이션 간의 데이터 상호 교환을 통한 데이터 통합, 재사용성 증대, 기계에 의한 자동화된 처리를 가능하게 해준다. 온톨로지는 데이터의 의미를 표현하기 위한 방법으로 식별자(URI) 기반의 리소스 명명을 통해 데이터의 의미를 표현하며, Linked Data는 RDF 형식의 데이터 간 링크를 통해 웹 데이터 간의 연계 및 활용할 수 있는 환경을 제공해 준다. 본 연구에서는 용어 정보의 효과적인 공유 및 연계를 위한 방법으로, SKOS 기반 용어 온톨로지 모델링을 통해 용어 정보가 Linked Data에 연계되기 위한 방법을 제시한다.

  • PDF

전 방향 참조 경로 탐사 패턴을 이용한 웹 문서 예측 (Web document prediction using forward reference path traversal patterns)

  • 김양규;손기락
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.112-114
    • /
    • 2004
  • 오늘날 웹을 이용하는 사용자들의 웹 검색 형태를 저장한 웹 로그 데이터들은 데이터 마이닝을 위한 중요한 자료가 되고 있다. 이들 웹 로그들로부터 사용자의 현재 행동을 기반으로 사용자가 다음에 요청할 요구를 예측할 수 있는 예측 모델을 만들 수 있다. 하지만 이들 웹 로그들은 크기가 매우 크고 분석하기가 어렵다. 이런 문제를 해결하기 위해 이미 않은 방법이 제안되었다. 그 중에서 효과적으로 예측할 수 있도록 제안된 순차적 분류 기반에 연관법칙을 적용한 예측 기법이 있다. 본 논문에서는 전방향 참조 경로 탐사 패턴 알고리즘을 적용하여 연관규칙에 기반 한 웹 문서 예측 기법을 향상시키는 모델을 제안한다.

  • PDF

원격 웹 서버 로깅 시스템의 구현 (Implementation Study of a Remote Logging System for Web Servers)

  • 정기훈;노삼혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.400-402
    • /
    • 2004
  • 본 논문에서는 웹 서버에게 부하를 주지 않으면서 네트워크를 통해 원격으로 로깅 하는 시스템인 원격 웹 서버 로깅 시스템을 구현하였다. 구현된 로깅 시스템은 웹 서버의 종류와는 관계없이 로그 데이터를 수집할 수 있으며, 여러 개의 서버 군으로 이루어진 시스템에서도 각 시스템의 웹 서버나 환경과는 관계없이 독립적으로 로그 데이터를 수집할 수 있다는 장점을 갖고 있다. 뿐만 아니라 웹 서버에게 미치는 오버헤드를 측정해 본 결과, 부하를 거의 주지 않음으로써 로깅 시스템으로 인한 웹 서버의 성능 저하를 일으키지 않는다는 것을 알 수 있었다.

  • PDF

위성영상정보 제공 웹서비스 소개 (Introduction to Web Service for Satellite Imagery Information)

  • 채기주;한은영;박종현
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2004년도 GIS/RS 공동 춘계학술대회 논문집
    • /
    • pp.469-473
    • /
    • 2004
  • 본 논문에서는 현재 ETRI에서 수행 중인 (위성영상정보 통합관리사업)의 웹 서비스에 대해서 소개하고자 한다. 웹서비스를 이루는 DB설계, 데이터 등록, 데이터 관리, 웹 검색/주문 시스템을 중심으로 하여 전체적인 웹서비스의 모양을 제시한다. 각 단계에서 고려해야 할 사항들과 전체적 인 시스템에서 고려해야 할 사항들을 자세히 설명하여, 위성 영상정보 웹서비스를 구축하는 기관 및 개인에게 도움을 주어 다양한 웹서비스의 모델이 나올 것을 기대한다.

  • PDF

공개키 암호화 알고리즘을 이용한 웹 기반 메일 시스템의 개발 및 구현 (Development of Web-Based Mail-System using the Public-key Encryption Algorithm)

  • 하경재;문철곤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.402-404
    • /
    • 2000
  • 웹에 기반한 메일 서비스의 급속한 성장으로 인하여 전자 메일은 인터넷을 이용하는 많은 사용자들의 주요 정보 교환수단이 되었다. 현재의 웹에 기반한 메일 시스템에서 SMTP 프로토콜을 이용하여 메일을 전송할 경우, 전송되는 메시지는 아무런 보안 조치도 취해지지 않은 상태로 전송된다. 그러므로 네트워크에 연결된 내,외부의 침입자에 의하여 정보가 도청될 경우 쉽게 정보가 해석될 수 있는 문제점이 있다. 본 논문에서는 웹 상에서의 메일 서비스로 전자메일을 전송할 경우 데이터부분을 암호화하여 전송함으로써 외부의 침입자에 의해 전송데이터가 가로채지더라도 해독하지 못하도록 하였으며 받은 전자메일에 대하여 원래의 데이터로 복호화 할 수 있는 웹 기반 메일 시스템을 개발하였다. 이를 위하여 보안기능이 강화된 MIME 인코딩 알고리즘을 제안하고 이를 응용한 웹 기반 메일 서비스 및 클라이언트 어플리케이션을 구현하여 실제로 데이터 도청 시 메일 메시지가 보호될 수 있음을 보였다.

  • PDF

웹 서비스 기반의 웹 OLAP 큐브 브라우저 (A Web Services-based Web OLAP Cube Browser)

  • 배은주;김명미;김명
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1819-1822
    • /
    • 2002
  • OLAP(On-line Analytical Processing)은 데이터를 다차원적으로 집계하여 그 결과를 온라인으로 사용자에게 제공함으로써 고부가가치 창출에 사용되는 비즈니스 인텔리젼스 기술 중의 하나이다. 질의 처리 시간 제약 조건을 만족하기 위해 OLAP 시스템들은 다차원적 집계 결과를 미리 계산하여 저장해 둔다. 이 때 저장되는 데이터를 OLAP 큐브(cube)라고 하며, 데이터의 분석은 주로 큐브를 브라우징하면서 이루어진다. 본 연구에서는 웹 서비스를 통해 큐브를 브라우징할 수 있는 ‘웹 OLAP 큐브 브라우저(WOCB)'를 개발하였다. WOCB는 본 연구팀이 개발한 웹 서비스 기반의 OLAP API인 XMLMD를 사용하여 개발되었으며, 웹 서비스를 통해 전송되는 OLAP 큐브 데이터를 XML, HTML, 엑셀, 그래프 등의 다양한 형태로 검색할 수 있는 기능을 제공한다. 본 연구 결과는 이기종 플랫폼 환경에 분산되어 있는 OLAP 서버들을 통합할 때 하나의 컴포넌트로 사용될 수 있다는 장점을 갖는다.

  • PDF

웹 기반의 정보 관리자 (A Web-Based Information Manager)

  • 최신형;한군희;이봉섭
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2005년도 춘계학술발표논문집
    • /
    • pp.221-223
    • /
    • 2005
  • 인터넷이 발달하면서 기존의 문서들이 웹을 통해 제공된다. 시간이 흐를수록 이들 정보들은 수정 및 추가 등을 통해 데이터의 양은 증가한다. 웹이 광범위하게 사용됨에 따라 정보를 획득하기 위해 대다수의 사용자들이 웹에 의존하고 있으며, 이로 인해 웹을 통한 데이터 관리의 필요성이 증가하고 있다. 네트워크로 연결되어 있는 환경에서는 갑작스런 시스템 장애가 자주 발생하며, 이런 위험으로부터 데이터를 안전하게 관리$\cdot$보호하는 것이 중요한 업무 중 하나이다. 본 논문에서는 웹 상에서 백업과 복구를 통해 데이터 관리를 체계적이고 효율적이며 안정적으로 처리할 수 있는 시스템을 제안한다.

  • PDF

인터넷 비즈니스 기반의 고객관계관리(CRM)을 위한 웹 로그 분석에 관한 연구 (A Study on Web-log Analysis for CRM based on Internet Business)

  • 김재형;노효원;김남호;정정화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.10-15
    • /
    • 2000
  • 개별화 웹 마케팅은 본질적으로 고객지향의 패러다임이다. 즉, 개별 고객의 특수한 니즈를 개별적으로 파악해서 각각의 고객에게 차별화된 서비스를 제공하는 것이 그 핵심이다. 웹 서버의 로그파일에 데이터마이닝의 연관규칙 기술을 이용하게 되면 고객행동 패턴의 파악 및 예측을 위한 기법으로 활용할 수 있다. 본 연구에서는 웹 사용자의 교차 판매를 위한 원투원 마케팅에 필요한 접근패턴을 분석하고자 하며, 이는 웹서버 로그파일 분석을 통하여 이루어진다. 분석하고자 하는 웹서버 로그파일은 기존의 데이터웨어하우스의 원천 데이터들과는 다르게 비정형적인 데이터 구조를 가지고있다. 이들 비정형 데이터 처리와 교차판매 지원을 위한 데이터마이닝 모델링, 이를 통한 원투원 마케팅 모델 제시, 그리고 이의 활용이 고객관계관리(CRM)에 미치는 효과를 제시한다.

  • PDF

시멘틱 환경에서의 개인화 검색 (Personalized Search Service in Semantic Web)

  • 김제민;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.649-651
    • /
    • 2005
  • 웹에 분산된 모든 웹 페이지는 구조가 서로 다르다. 시멘틱 웹 환경은 이형적인 구조를 갖는 웹 페이지들의 메타데이터를 바탕으로 시멘틱 검색이 가능하다. 그러나 일반적으로 사용자의 요구에 따른 시멘틱 검색은 상황에 따라 엄청난 수의 검색 결과를 내놓는다. 따라서 검색 결과에 대해 각 사용자에 맞는 검색 결과 순위를 적용할 필요가 있다. Culture Finder는 시멘틱 웹 검색 에이전트들이 개인화된 문화 정보를 검색할 수 있도록 도움을 준다. Culture Finder는 웹에 존재하는 각 웹 페이지에 대한 메타 데이터를 작성하고, 시멘틱 검색을 이행하며, 사용자 프로파일을 기반으로 삼아 검색 결과일 대한 순위 점수를 계산한다. Culture Finder에는 개인화된 시멘틱 검색을 효율적으로 실행하기 위해 중요한 5가지 기법이 적용되었다. 사용자의 검색 행위로부터 사용자 프로파일을 생성하기위한 기계 학습기법, 시멘틱 웹 검색 에이전트를 위한 효율적인 시맨틱 검색 기법, 사용자 질의의 효과일인 파악을 위한 질의 분석 기법, 각 사용자에게 적합한 검색 결과를 제공하기 위한 순위 적용 기술, 메타데이터를 생성화기 위한 상위 온톤로지 표현 기법. 본 논문에서는 Culture Finder의 구조를 통해서 시멘틱 개인화 검색에 적용되는 여러 가지 방법을 제안한다.

  • PDF