• Title/Summary/Keyword: 데이터웹

검색결과 3,399건 처리시간 0.034초

에어비앤비(Airbnb) 웹 로그 데이터를 이용한 고객 행동 예측 (Consumer behavior prediction using Airbnb web log data)

  • 안효인;최유리;오래은;송종우
    • 응용통계연구
    • /
    • 제32권3호
    • /
    • pp.391-404
    • /
    • 2019
  • 그동안의 고객 행동에 대한 예측은 주로 고객이 가지는 고정적인 특성을 이용해왔다. 최근에는 점차 고객들의 활동이 오프라인에서 온라인으로 이동하면서 각 고객의 웹 로그를 추적하는 일이 가능해졌다. 그러나 방대한 양의 웹 로그 데이터를 수집할 수 있게 된 반면, 이에 대한 연구는 로그 데이터를 정리하거나 기술적인 특성만을 설명하는 것에 그쳤다. 본 연구에서는 웹사이트 Kaggle에서 제공하는 Airbnb 고객들의 성별, 연령 등의 기본 정보 및 웹 로그가 포함된 데이터셋을 이용하여 첫 숙소 예약까지 걸리는 개인의 의사 결정 시간을 예측하였다. Lasso, SVM, Random Forest, XGBoost 등 다양한 방법론을 활용하여 최적의 모형을 찾고, 웹 로그 데이터의 유무에 따른 예측 오차를 비교하여 웹 로그의 효용성을 확인하였다. 결과적으로 오분류율이 약 20%로 낮은 랜덤 포레스트 분류모형을 최적모형으로 선택하였다. 또한, 웹 로그 데이터를 이용하여 고객 개개인의 행동을 예측한 결과 사용하지 않은 경우와 비교해 예측의 정확도가 최대 두 배 더 높아진 것을 확인할 수 있었다.

베타데이터를 이용한 기계공학분야 웹 정보자원의 주제 게이트웨이 설계에 관한 연구 (A study on the Design of Subject Gateway of Web Information Resource Using Metadata in Mechanical Engineering)

  • 송재윤;이응봉
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.131-138
    • /
    • 2002
  • 본 고에서는 공학분야 중에서도 그 응용범위가 가장 광범위하다고 할 수 있는 기계공학분야의 이용자에게 수준 높은 웹 정보자원을 효율적으로 제공하기 위하여 검색엔진을 통하여 자동 수집된 웹 정보자원을 기계공학분야 주제전문가의 평가를 통해 핵심정보를 선정하고 이를 더블린코어 메타데이터를 응용한 베타데이터 요소에 따라 조직하여 웹 상의 검색 인터페이스에 의해 이용될 수 있도록 주제 게이트웨이 시스템을 설계하였다. 정보자원의 검색방법으로는 키워드 검색과 주제분류체계에 따른 브라우징 검색 등 두 가지 방법을 이용하였다.

  • PDF

웹기반 3D 가시화 모듈 연구

  • 박지수;오재용
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2016년도 춘계학술대회
    • /
    • pp.32-34
    • /
    • 2016
  • 웹기반 3D 가시화 모듈은 선박운항 시뮬레이터 시스템을 플랫폼 종류에 제약을 받지 않고 다양한 시스템의 요구사항을 효과적으로 반영하여 웹브라우저에서 3D 가시화 시뮬레이션을 지원하는 시스템이다. 본 연구에서는 시뮬레이션 데이터를 Socket.io 이용하여 실시간으로 업데이트를 하였으며 시각 및 기상상태, 해상 환경을 재현하였다. 또한 3D 가시화 인터페이스를 이용하여 대상 선박과 항만의 3차원 모델 데이터를 로드하고, 시뮬레이션 데이터와 연동하여 실시간으로 3차원 가시화 화면을 생성하는 연구를 진행하였다. 개발된 기술은 장비 선택에 제약이 없어 시간, 인력, 공간, 예산에 유연한 시스템 활용이 가능할 것으로 기대된다.

  • PDF

프로세스 마이닝을 이용한 웹 사이트의 이용 패턴 분석 및 그룹 간 비교 분석 (Usage Pattern Analysis and Comparative Analysis among User Groups of Web Sites Using Process Mining Techniques)

  • 김슬기;정재윤
    • 한국빅데이터학회지
    • /
    • 제2권2호
    • /
    • pp.105-114
    • /
    • 2017
  • 오늘날 많은 서비스 지원이 웹 사이트를 통해 제공되고 있다. 웹 사이트의 이용 및 효율성을 최적화하기 위하여 방문자들의 이용 패턴 분석이 매우 중요하다. 본 연구에서는 BPI Challenge 2016에서 제공하는 웹 사이트 접속 로그를 분석하여 이용 패턴 분석 및 이용자 그룹별 비교 분석 연구를 수행하였다. 이 데이터는 네덜란드 고용보험사(UWV)의 IT 시스템의 웹 사이트 접속 로그를 제공하며, 고객의 인적 정보, 해당 기관의 웹 사이트를 사용할 때의 고객 행동을 설명하는 클릭 데이터 등의 대한 정보를 포함하고 있다. 본 연구에서는 프로세스 마이닝 기법을 이용하여 사용 고객의 사용 패턴과 고객 그룹 간 특징을 분석하여, 궁극적으로 웹 서비스를 이용하는 고객들을 대상으로 서비스 품질을 향상시키고자 한다.

  • PDF

MVC 기반 웹 애플리케이션 빌더 설계 (Design of MVC-based Web Application Builder)

  • 김귀정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.187-190
    • /
    • 2006
  • 웹 애플리케이션에서 요구되고 있는 필요 기술이 증가함에 따라 이들 기술 사이에 상호작용이 많아지고 복잡도가 증가하여 웹 애플리케이션을 개발하고 효율적으로 사용하기가 점차로 더 어려워지고 있다. 이에 본 연구는 웹 애플리케이션의 기본적인 요구사항을 재검증하여 복잡도를 감소시키고, 폼 기반 웹 애플리케이션 모델을 생성할 수 있는 MVC 기반 웹 애플리케이션 빌더를 정의하고자 한다. 이 툴은 클라이언트와 서버 사이의 입 출력 데이터 변환에 필요한 코드를 자동으로 생성해 주고, 클라이언트와 서버 간의 데이터 교환을 감소시켜 복잡도를 줄일 수 있도록 해준다.

  • PDF

응용프로그램의 검색을 위한 RDF 메타데이터 시스템의 설계 (Design of a RDF Metadata System for the Searching of Application Programs)

  • 유원희;고훈준
    • 한국콘텐츠학회논문지
    • /
    • 제5권6호
    • /
    • pp.1-9
    • /
    • 2005
  • 웹의 데이터의 양이 증가함에 따라, 원하는 데이터를 정확하게 검색하는 것은 어렵다. 그래서 많은 연구자들은 웹의 자원을 효율적으로 검색하기 위해 노력하고 있다. W3C는 RDF 메타데이터를 이용하여 웹에 있는 자원의 의미를 부여하는 표준을 제정하였다. 지금까지 RDF 메타데이터는 주로 웹에 있는 문서 데이터를 표현하는데 사용되어 왔으나 웹에 있는 응용 프로그램을 위한 메타데이터를 표현하는 데는 사용되지 않았다. 본 논문에서는 웹에 있는 응용프로그램을 검색하기 위해 RDF 메타데이터를 이용하는 방법을 제안한다. 우선 응용프로그램의 정보를 저장하는 RDF 데이터 모델을 정의하고, RDF 데이터 모델을 참조하는 RDF 스키마를 정의한다 그리고 적용 가능성을 보이기 위해 응용프로그램을 검색하는 시스템 prototype을 설계한다. 이 시스템은 사용자가 필요로 하는 응용프로그램을 좀 더 쉽게 얻을 수 있는 기대 효과를 가지며, 응용프로그램에 대한 검색 기능 향상의 효율성을 기할 수 있다.

  • PDF

래퍼 기반 경제 데이터 수집 시스템 설계 및 구현 (Wrapper-based Economy Data Collection System Design And Implementation)

  • 박철호;구영현;유성준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.227-230
    • /
    • 2015
  • 경제의 흐름, 주가 등을 분석, 예측을 위해 경제 뉴스, 주가 등 데이터 수집이 필요하다. 일반적인 웹 크롤러는 자동적으로 웹서버를 방문하면서 웹페이지 내용을 분석하고 URL들을 추출하면서 웹 문서를 수집한다. 반면 특정한 주제의 문서만을 수집할 수 있는 크롤러 형태도 있다. 특정 사이트에서 경제 뉴스 정보만 수집하기 위하여 사이트의 구조를 분석하고 직접적으로 데이터를 수집해올 수 있는 래퍼 기반 웹 크롤러 설계가 필요하다. 본 논문에서는 빅데이터를 기반으로, 경제뉴스 분석 시스템을 위한 크롤러 래퍼를 설계, 구현하여 경제 전문 분야의 뉴스 데이터를 수집하였다. 2000년부터 현재까지 미국 자동차 시장의 주식 데이터를 래퍼 기반으로 가져오고, 사이트 상에서의 데이터가 업데이트되는 주기를 판단하여 주기적으로 업데이트 함으로써 중복되지 않게 하였다. 그리고 미국, 한국의 경제 기사를 래퍼 기반의 웹 크롤러를 사용하여 수집하고, 향후 분석이 쉽게 데이터를 정형화 시켜 저장한다.

  • PDF

웹로그 분석을 위한 데이터 웨어하우스 시스템 구축 (Building Data Warehouse System for Weblog Analysis)

  • 이주일;백경민;신주한;이원석
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2010년도 춘계학술대회
    • /
    • pp.291-295
    • /
    • 2010
  • 최근 급격한 하드웨어 기술과 데이터베이스 시스템의 발전은 우리 주변에서 발생하는 다양한 분야의 데이터를 자동으로 수집하는 것을 가능하게 하였다. 흔히 데이터 스트림(data stream)이라고 언급되는 끊임없이 생산되는 대용량의 데이터를 효율적으로 처리하여 유용한 정보를 얻어내는 기술은 이미 많은 응용 분야에서 광범위하게 연구되고 있다. 인터넷은 이러한 데이터 스트림을 양산해 내는 주요 원천 중의 하나이다. 인터넷 비즈니스의 활성화와 더불어 웹로그 데이터 스트림은 마케팅, 전략 수립, 고객관리 등 여러 부분에 광범위하게 활용되기 시작했으며, 보다 정확하고 효율적인 분석에 대한 요구사항도 점점 늘어나고 있다. 데이터 웨어하우스(Data Warehouse)는 수집된 데이터를 주제 기반으로 통합하여 시계열 형태로 적재하는 저장소서 유용한 분석이나 의사결정에 많이 사용되어 왔다. 데이터웨어하우스는 데이터를 요약하고 통합 및 정제하는 기능을 제공하여 대용량의 데이터 처리에 적합하고 데이터의 품질을 향상시키기 때문에 데이터 마이닝 분야에서 전처리 과정으로도 많이 이용되어 왔다. 본 논문에서는 웹로그 데이터 스트림에 대한 데이터 웨어하우스를 구축하여 보다 고품질의 유용한 정보를 효율적으로 얻어내는 시스템을 제안한다.

  • PDF

UDDI 레지스트리와 웹 기반의 컴포넌트 저장소의 통합에 관한 연구 (A Study on Integrating UDDI Registry and Web-Based Component Repository)

  • 이동근;최은만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.520-522
    • /
    • 2004
  • UDDI(Universal Description, Discovery, and Integration) 레지스트리(Registry)는 클라이언트가 각종 정보들을 생성, 저장, 검색할 수 있는 XML 기반의 자료저장 장치이다. XML 기반의 저장 장치이므로 개발언어 및 실행 플랫폼과는 상관없이 데이터 교환이 자유롭다. UDDI는 특정한 웹 서비스 시스템에 대한 정보를 체계적으로 분류하여 제공한다. 하지만, UDDI에서는 아직 컴포넌트에 대한 정보를 제공하는 부분에는 부족한 점이 있다. 컴포넌트의 재사용성이 증가됨에 따라 웹 기반의 컴포넌트 저장소를 구축하여 재사용 컴포넌트를 제공하는 사이트들이 늘어가는 추세이다. 이에 따라 UDDI 레지스트리와 웹 기반의 컴포넌트 저장소를 연계함으로써 불필요한 컴포넌트들에 대한 정보를 줄이고, 분산된 컴포넌트 저장소에서 컴포넌트에 대한 정보를 데이터 북 형태로 정보를 제공하여 웹서비스를 이용하여 빠른 기간에 응용 시스템을 개발할 수 있다. 본 논문에서는 UDDI 레지스트리의 특징을 살려 웹 기반의 컴포넌트 저장소에서 제공하는 데이터 북 형태의 컴포넌트 정보 제공 서비스를 연계함으로써 UDDI 레지스트리와 웹 기반의 컴포넌트 저장소의 단점들을 보완하는 해결책을 제시하고 실험하였다.

  • PDF

웹 서비스 사용자의 블랙 박스 테스트를 위한 요구명세에 관한 연구 (A Study on Requirement Specification for Black-Box Testing of Web Services User)

  • 이동근;최은만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.397-400
    • /
    • 2005
  • 웹 서비스는 사용자의 요청에 따라 솔루션을 제공하기 위해 임의로 찾아 결합될 수 있는 컴포넌트이다. 다시 말해 웹 서비스는 CBD(Component-Based Development)와 웹 형태의 결합이라 볼 수 있다. 웹 서비스는 UDDI(Universal Description, Discovery, and Integration), WSDL(Web Service Description Language), SOAP(Simple Object Access Protocol)과 같은 표준화된 기술들로 이루어졌다. 이미 개발된 컴포넌트를 재사용하기 위해서는 해당 컴포넌트에 대한 정확한 정보를 토대로 테스트를 하여 조합하게 된다. 하지만, 현재 웹 서비스 기술이나 표준에서는 테스트를 위한 방법이나 데이터를 제공하고 있지 않다. 물론 WSDL 에서는 데이터의 입. 출력 값에 대한 타입은 제공하고 있지만, 이것으로는 정확한 테스트는 물론 불필요한 테스트 케이스를 증가 시킨다. 따라서 본 논문에서는 현재 웹 서비스의 명세인 WSDL 에 대해 블랙 박스 테스트를 위해 필요한 데이터 측면에 대한 문제점을 알아보고, 이를 보완할 수 있는 요구명세서를 제안함과 동시에 요구명세서의 제공 방안을 제시하였다.

  • PDF