• Title/Summary/Keyword: 웹 크롤링

Search Result 115, Processing Time 0.03 seconds

A Movie Recommendation System Using Movielens Data (Movielens 데이터를 이용한 영화 추천 시스템 개발)

  • Park, Yoon-Ki;Jung, Hyun-Cheol;Hong, Ji-Won;Kim, Sang-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.1226-1228
    • /
    • 2011
  • 본 논문에서는 영화를 즐기는 이용자들에게 영화를 추천하는 추천 시스템 개발에 대해 논한다. 본 논문에서는 유저 기반 협업 필터링 기술을 적용한 영화 추천 웹 서비스를 개발하였고, 웹 크롤링 기술을 이용하여 추천된 영화의 상세한 정보를 제공할 수 있도록 하였다. 유저 스터디를 수행한 결과 이 영화 추천 시스템을 이용한 사용자들의 만족도는 대체로 높았다.

Design and Implementation for Local Newsletter Using Mobile Web crawler and GPS (모바일 웹 크롤링과 GPS를 이용한 지역 뉴스레이터 설계 및 구현)

  • Jaung, Dongyou;Kim, Yongtae;Park, Geunyong;Shin, Jaesik;Park, Eunju;Lim, Hankyu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.152-155
    • /
    • 2017
  • 본 논문은 지역에 관심이 많은 사용자들이 실시간으로 모바일 웹페이지 형태의 뉴스를 제공 받을 수 있는 시스템을 설계하고 이를 제작하였다. 사용자는 실시간으로 본인이 위치한 지역을 대상으로 종합되어지는 뉴스를 모바일 웹페이지 형태의 오브젝트로 제공받는다. 본 연구를 통해 지역 관심도 향상 및 지역 개발 촉진 및 관광시설 피드백 활성화 효과의 기대가 가능하다.

Design of a Web-based Barter System using Data Crawling (Crawling을 이용한 웹기반의 물물교환 시스템설계)

  • Yoo, Hongseok;Kim, Ji-Won;Hwang, Jong-Wook;Park, Tae-Won;Lee, Jun-Hee
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.527-528
    • /
    • 2021
  • 본 논문에서는 사용자에게 편의성을 제공하며 기존 물물거래 시스템의 단점을 보완한 웹기반의 물물교환 시스템을 제안한다. 대부분 사람들이 중고거래나 필요 없는 물품에 대해 판매를 하는 목적은 자신에게 필요 없는 물건을 처리하고 필요한 물건을 구매하기 위해서이다. 이러한 사용자들의 관점에서 보았을 때, 필요한 물건을 얻기까지의 과정이 장시간 걸린다는 단점이 있으며, 사람들이 필요 없는 물건을 버려 낭비되고 과소비되는 경우도 있다. 이러한 문제를 해결해서 필요 없는 물건을 필요로 하는 사람과 물물교환을 하여 불필요한 소비를 줄이고 필요한 제품을 서로 쉽게 찾고 교환할 수 있도록 사용자에게 편의성을 제공하는 물물교환 시스템을 제안한다.

  • PDF

Implementation of place recommendation site based on user's location (사용자 위치에 기반한 장소 추천 사이트의 구현)

  • Yong, Seunglim;Ji, Changeon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.345-346
    • /
    • 2018
  • 본 논문에서는 사용자의 위치 정보를 입력받아 근처에 위치한 식당이나 어트랙션 장소를 추천하는 사이트를 구현하고 이를 제안한다. 웹 페이지를 통해 사용자의 위치정보를 입력 받고, SNS에서 추천하는 장소를 크롤링하여 데이터베이스를 구축하고 분석하여 식당과 어트랙션 장소를 추천해 준다. 추천 장소는 사용자에게 지도를 이용하여 그 위치를 보여주며 지도 위에 추천 장소의 간략 정보를 표시한다.

  • PDF

Design of the Distributed Search Engine for Intranet Load Balancing (인트라넷 부하 평준화를 위한 분산 검색엔진 설계)

  • 고윤석;윤희병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.157-159
    • /
    • 2003
  • 본 논문은 인트라넷에서 검색엔진 운용시 발생되는 트랙픽을 감소하여 네트워크 자원을 효율적으로 이용하기 위한 분산 웹 크롤링 에이전트와 인덱싱 에이전트를 제안한다. 일반적인 검색엔진의 구성, 인트라넷의 네트워크 구성 및 인트라넷이 인터넷과 구별되는 몇가지 특징을 제시하고 이에 적합한 분산 검색엔진을 설계하며 분산 검색엔진의 각 에이전트들이 분산 환경에 동작할 수 있도록 하기 위하여 URL Sorter, URL Provider 및 분산 Indexer를 설계한다.

  • PDF

AIS 데이터 기반 울산항 상선 항로분석

  • 임재홍;이우성;이길종
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2023.11a
    • /
    • pp.48-50
    • /
    • 2023
  • 울산항 해상교통관제센터(VTS)에서 수신한 AIS 데이터를 이용하여 울산항 출입하는 선박의 MMSI 정보를 분류하였다. 분류된 MMSI 정보는 웹 크롤링을 통하여 선박의 종류, 국적, 총톤수, 길이, 폭 등을 데이터를 수집하였다. AIS 데이터와 MMSI의 선박 정보를 이용하여 출입하는 선박의 선종별 운항 경로 궤적을 분석하였다. 분석된 데이터는 선박 도선 및 항내 안전항로 유도에 활용하고자 한다.

  • PDF

Development of Restaurant Recommendation System Using K-Pop Hashtag Crawling (K-POP 연관 해시태그 크롤링을 이용한 맛집 추천 시스템 개발)

  • Kim, Hwa-Seon;Lee, Chae-Yeon;Cho, Seo-Yun;Nah, Jeong-Eun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.878-880
    • /
    • 2022
  • COVID-19 상황 속에서도 전 세계 Twitter K-POP 콘텐츠 관련 트윗 양은 78억 건 이상으로 매년 성장세를 보인다. Twitter 내 K-POP 팬들은 아티스트 관련 해시태그를 포함한 트윗을 작성하여 같은 팬덤끼리 실시간으로 정보를 전달하고 생산한다. 이러한 맛집 트윗들은 K-POP 팬들이 Twitter 내에서 신뢰도 있는 맛집 정보를 얻는 용도로 사용된다. 하지만 팬들이 정보를 얻기 위해서는 여러 맛집 해시태그로 검색하고 리트윗 수가 많은 트윗을 직접 찾아야 한다. 기존의 맛집 추천 시스템은 서비스 제공자 중심의 구조를 띤다. 서비스 제공자가 일방적으로 정보를 전달하거나, 사용자 리뷰 갱신 간격이 길다는 한계가 존재한다. 본 논문에서는 Twitter 내 K-POP 맛집 해시태그가 포함된 트윗을 Twitter API와 Tweepy를 사용하여 크롤링하였다. 수집한 데이터의 좋아요 수와 리트윗 수를 바탕으로 데이터 필터링을 진행하여 bot user와 광고 계정이 제외된 맛집 관련 트윗을 추출한다. 최종적으로는 추출한 트윗의 정보를 마커로 표시하여 웹 사이트를 제작하였다. K-POP 팬들은 맛집 해시태그를 검색하여 일일이 찾을 필요 없이 웹 사이트에 방문하여 맛집 위치를 확인할 수 있다. 웹 사이트 사용자의 위치가 지도상에 표시되어 가까운 맛집을 찾기도 편리하다. 본 논문에서는 맛집의 위치를 서대문구로 한정하여 진행했다.

Design and Implementation of a High Performance Web Crawler (고성능 웹크롤러의 설계 및 구현)

  • Kim Hie-Cheol;Chae Soo-Hoan
    • Journal of Digital Contents Society
    • /
    • v.4 no.2
    • /
    • pp.127-137
    • /
    • 2003
  • A Web crawler is an important Internet software technology used in a variety of Internet application software which includes search engines. As Internet continues to grow, implementations of high performance web crawlers are urgently demanded. In this paper, we study how to support dynamic scheduling for a multiprocess-based web crawler. For high performance, web crawlers are usually based on multiprocess in their implementations. In these systems, crawl scheduling which manages the allocation of web pages to each process for loading is one of the important issues. In this paper, we identify issues which are important and challenging in the crawl scheduling. To address the issue, we propose a dynamic crawl scheduling framework and subsequently a system architecture for a web crawler with dynamic crawl scheduling support. This paper presents the design of the Web crawler with dynamic scheduling support.

  • PDF

Comparison of Online Shopping Mall BEST 100 using Exploratory Data Analysis (탐색적 자료 분석(EDA) 기법을 활용한 국내 11개 대표 온라인 쇼핑몰 BEST 100 비교)

  • Kang, Jicheon;Kang, Juyoung
    • The Journal of Bigdata
    • /
    • v.3 no.1
    • /
    • pp.1-12
    • /
    • 2018
  • Since the beginning of the first online shopping mall, BEST 100 is being provided as the core of all shopping mall websites. BEST 100 is greatly important because consumers can identify popular products at a glance. However, there are only studies using sales outcome indicators, and prior studies using BEST 100 are insignificant. Therefore, this study selected 11 online shopping malls and compared their main characteristics. As a research method, exploratory data analysis technique (EDA) was used by crawling the BEST 100 components of each shopping mall website, such as product name, price, and free shipping check. As a result, the total average price of 11 shopping malls was 72,891.41 won. Sales texts were classified into 8 categories by text mining. The most common category was the fashion part, but it is significant that the setting of the category analyzed the marketing text, not the product attribute. This study has implications for understanding the current online market flow and suggesting future directions by using EDA.

Image Super-Resolution for Improving Object Recognition Accuracy (객체 인식 정확도 개선을 위한 이미지 초해상도 기술)

  • Lee, Sung-Jin;Kim, Tae-Jun;Lee, Chung-Heon;Yoo, Seok Bong
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.25 no.6
    • /
    • pp.774-784
    • /
    • 2021
  • The object detection and recognition process is a very important task in the field of computer vision, and related research is actively being conducted. However, in the actual object recognition process, the recognition accuracy is often degraded due to the resolution mismatch between the training image data and the test image data. To solve this problem, in this paper, we designed and developed an integrated object recognition and super-resolution framework by proposing an image super-resolution technique to improve object recognition accuracy. In detail, 11,231 license plate training images were built by ourselves through web-crawling and artificial-data-generation, and the image super-resolution artificial neural network was trained by defining an objective function to be robust to the image flip. To verify the performance of the proposed algorithm, we experimented with the trained image super-resolution and recognition on 1,999 test images, and it was confirmed that the proposed super-resolution technique has the effect of improving the accuracy of character recognition.