• 제목/요약/키워드: Crawler

문장 분석 및 온톨로지를 이용한 Focused Crawler (Focused Crawler using Ontology and Sentence Analysis)

  • 최광복;김현주;강진범;홍광희;양재영;최중민
    • 한국정보과학회:학술대회논문집
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • pp.100-102
    • 2004
  • 월드 와이드 웹의 보편화로 인하여 급속하게 증가하고 변화하는 웹 문서는 검색엔진으로 하여금 색인된 웹 문서와 현재의 웹 문서의 일관성을 유지할 수 없을 정도이다. 이러한 문제를 해결하기 위한 방법으로 연구되고 있는 것이 특정한 주제를 정하고 정해진 주제에 관련된 문서를 수집할 수 있는 focused crawler가 제시되고 있다. 지금까지 다양한 접근방법의 focused crawler가 개발되었지만, 모두 웹 링크를 이용하여 연결되어 있는 문서를 평가하는 처리과정을 거치고 있다. 그러나 이러한 과정은 다양한 내용을 포함하고 있는 문서일 경우 관련내용이 존재함에도 문서가 버려지거나 사용되더라도 문서상의 모든 링크를 사용하여 처리하는 비효율적인 문제점이 발생한다. 이 논문에서는 웰 문서 내부에 포함되어 있는 정보를 온톨로지를 이용하여 평가함으로써 다양한 내용을 가진 문서에서 사용자가 원하는 정보를 찾을 수 있을 뿐만 아니라 정보와 관련된 링크만을 사용하여 보다 효율적이고 정확한 문서를 수집하고자 한다.

호밀생육과 토양에 미치는 궤도형 분뇨살포기의 영향 (The Influence of Combine Crawler Attaching Slurry Spreader on Soil and Growth of Rye)

  • 류종원
    • 한국초지조사료학회지
    • 제25권1호
    • pp.65-70
    • 2005
  • This study was conducted to investigate the effect of combine crawler attaching slurry spreader on soil and growth of rye. The performance test at actual field was conducted to test for possibility of practical use. Field test of the slurry spreader was operated in upland and paddy field. Experiments was conducted to compare the effects of the soil damage and crop productivity incorporating Pig slurry by two different types of slurry spreader. In this experiment a slurry spreader using crawler of combine have been designed and developed to enhance the operation in small field and reduce e damage of soil structure. but it was not suitable for transference in long distance. Conventional tractor mounted vacuum is not suitable for $71.6\%$ water condition in the small areas of paddy land. But the slurry spreader using crawler could be controlled the working point and moving by crawler in paddy land of small area. The wheels depths of soil in the supplementary application in the rye field was 4.9 m in tractor mounted spreader. but the wheels depth of crawler attaching spreader was 1.6cm. The dry matter yield of rye was reduced by $12\%$ in supplementary application of slurry due to mechanical damage from passage of the tires. This is particularly noticeable at high soil moisture condition in paddy land. It was concluded that the slurry spreader developed in this study could be successfully used for basal and supplementary application of slurry in rye paddy field.

고성능 웹크롤러의 설계 및 구현 (Design and Implementation of a High Performance Web Crawler)

  • 김희철;채수환
    • 디지털콘텐츠학회 논문지
    • 제4권2호
    • pp.127-137
    • 2003
  • 웹크롤러는 인터넷 검색엔진을 포함한 다양한 웹 응용프로그램에 활용되는 중요한 인터넷 소프트웨어 기술이다. 인터넷의 급격한 성장에 따라 고성능 웹크롤러의 구현이 시급히 요구되고 있다. 이를 위해서는 웹크롤러에 대한 성능확장성에 초점을 둔 연구가 수행되어야 한다. 본 논문에서는 병렬 프로세스 기반 웹크롤러(Crawler)의 성능향상에 필수적인 동적 스케줄링의 구현 기법을 제안한다. 웹크롤러는 웹문서의 수집 성능요구를 만족시키기 위하여 일반적으로 다중 프로세스 기반으로 설계되고 있다. 이러한 다중 프로세스 기반의 설계에서 프로세스 별로 문서수집 대상을 적정하게 선택하여 할당하는 크롤 스케줄링(Crawl Scheduling)은 시스템의 성능향상에 매우 중요한 요소이라. 본 논문에서는 먼저 크롤 스케줄링에 있어 중요한 문제점들에 대한 연구 결과를 제시한 후 공유메모리 기반 동적 스케줄링 지원 기법을 고안, 이를 구현하는 웹 크롤러 시스템 구조(Architecture)를 제안한다. 본 논문에서는 동적 스케줄링 지원 기능을 갖는 웹크롤러의 설계 및 구현에 대하여 기술한다.

원격수집 방식의 웹기록물 관리를 위한 웹수집기 성능 비교 연구 (Comparison of Web Crawler Performance for Web Record Management)

  • 장진호;권혁상;이규모;최동준
    • 기록학연구
    • 제74호
    • pp.155-186
    • 2022
  • 2022년 현재 행정안전부 정부24 웹사이트에 등록된 공공부문 인터넷 웹사이트는 1만 7천여 개이다. 이처럼 많은 웹사이트를 기록으로 관리하기 위해 기록물 생산기관과 기록물관리기관이 상호 간 직접 이관하는 방식은 많은 인적·물적자원을 필요로 한다. 각 웹사이트 구동에 필요한 운영 소프트웨어와 응용소프트웨어 기술을 기록물관리기관이 보유하고 운영하는 것도 현실적으로 어렵다. 이러한 현실적 한계를 극복하기 위해 웹수집 소프트웨어를 이용하여 원격지에서 웹사이트를 자동으로 수집하는 방식이 국내외에서 사용되고 있다. 이 연구는 공공부문 인터넷 웹사이트를 원격으로 수집하여 기록으로 관리할 때 필요한 웹수집기의 성능을 비교하였다. 선행연구 및 문헌조사 등에서 검토한 다수의 웹수집 소프트웨어에 대하여 단계별 검토를 거쳐 가장 적합한 웹수집기를 선정하였다. 성능 평가 과정에는 일부 공공기관 웹사이트를 대상으로 실제 원격 수집 성능을 비교하였다. 이 연구 결과는 웹기록 관리를 위해 웹수집기 선택이 필요한 기관에 실증적이고 구체적인 성능 비교 정보를 제공한다.

Implementation of Efficient Distributed Crawler through Stepwise Crawling Node Allocation

  • Kim, Hyuntae;Byun, Junhyung;Na, Yoseph;Jung, Yuchul
    • 한국정보기술학회 영문논문지
    • 제10권2호
    • pp.15-31
    • 2020
  • Various websites have been created due to the increased use of the Internet, and the number of documents distributed through these websites has increased proportionally. However, it is not easy to collect newly updated documents rapidly. Web crawling methods have been used to continuously collect and manage new documents, whereas existing crawling systems applying a single node demonstrate limited performances. Furthermore, crawlers applying distribution methods exhibit a problem related to effective node management for crawling. This study proposes an efficient distributed crawler through stepwise crawling node allocation, which identifies websites' properties and establishes crawling policies based on the properties identified to collect a large number of documents from multiple websites. The proposed crawler can calculate the number of documents included in a website, compare data collection time and the amount of data collected based on the number of nodes allocated to a specific website by repeatedly visiting the website, and automatically allocate the optimal number of nodes to each website for crawling. An experiment is conducted where the proposed and single-node methods are applied to 12 different websites; the experimental result indicates that the proposed crawler's data collection time decreased significantly compared with that of a single node crawler. This result is obtained because the proposed crawler applied data collection policies according to websites. Besides, it is confirmed that the work rate of the proposed model increased.

반궤도식 산림작업차 개발(I) - 설계 및 제작 - (Development of the Semi-Crawler Type Mini-Forwarder - Design and Manufacture -)

  • 김재환;박상준
    • 한국산림과학회지
    • 제100권2호
    • pp.154-164
    • 2011
  • 본 연구는 우리나라 험준한 급경사 지형의 단목중심의 목재생산시스템 등에 적합하고 사방사업, 임도사업 등의 다양한 산림작업에 유용하게 활용할 수 있는 다목적의 반궤도식 산림작업차 개발을 목적으로 실시하였다. 산림작업차량의 기본 차체는 최소회전반경 설계기준과 작업도 폭을 고려하여 차체프레임부의 총길이는 5,750 mm, 차체의 폭은 1,900 mm, 적재부의 적재용량은 약 $2.5m^{3}$으로 설계 제작하였다. 동력원은 3,400 rpm의 최대 96마력 출력의 엔진을 선정하였으며, 유압펌프는 2개의 주펌프와 2개의 보조펌프로 나누어 선정하고, 주펌프는 전후좌우 4개의 주행용 유압모터에 사용하고, 보조펌프는 각종 작업기에 사용하도록 설계 제작하였다. 동력전달방식은 HST(Hydro-Static Transmission) 시스템을 적용하였고, 주행부는 조향가능한 전방 고무바퀴와 무한 궤도형으로 회전하는 후방 크롤러로 설계 제작하고, 조향방식은 애커만 조향방식을 채택하였다. 주행조작부는 일반 자동차의 운전 및 운전석 형태로 설계 제작하였으며, 보조장치로 윈치와 로그그래플 및 아웃트리거를 장착하였다. 시작기의 공차시 임도의 주행속도는 저속 5.3 km/hr, 고속 7.7 km/hr로 나타났다.

크롤러형 굴삭기의 동역학적 모델 개발 및 시뮬레이션 (Dynamic Model Development and Simulation of Crawler Type Excavator)

  • 권순기
    • 한국생산제조학회지
    • 제18권6호
    • pp.642-651
    • 2009
  • The history of excavator design is not long enough which still causes most of the design considerations to be focused on static analysis or simple functional improvement based on static analysis. However, the real forces experiencing on each component of excavator are highly transient and impulsive. Therefore, the prediction and the evaluation of the movement of the excavator by dynamic load in the early design stage through the dynamic transient analysis of the excavator and ensuring of design technique plays an importance role to reduce development-cost, shorten product-deliver, decrease vehicle-weight and optimize the system design. In this paper, Commercial software DADS and ANSYS help to develop the track model of the crawler type excavator, and to evaluate the performance and the dynamic characteristics of excavator with various simulations. For that reason, the track of crawler type excavator is modelled with DADS Track Vehicle Superelement, and the reaction forces on the track rollers were predicted through the driving simulation. Also, the upper frame and cabin vibration characteristics, at the low RPM idle state, were evaluated with engine rigid body modelling. And flexibility body effects were considered to determine the more accurate joint reaction forces and accelerations under the upper frame swing motion.

다리 수 조절이 가능한 모듈러 크롤러의 설계 및 6족 로봇의 주행 성능 평가 (Modular Crawler with Adjustable Number of Legs and Performance Evaluation of Hexapod Robot)

  • 임소정;백상민;이종은;채수환;유재관;조용진;조규진
    • 로봇학회논문지
    • /
    • /
    • /
    • 2019
  • Legged locomotion has high mobility on irregular surfaces by touching the ground at discrete points. Inspired by the creature's legged locomotion, legged robots have been developed to explore unstructured environments. In this paper, we propose a modular crawler that can easily adjust the number of legs for adapting the environment that the robot should move. One module has a pair of legs, so the number of legs can be adjusted by changing the number of modules. All legs are driven by a single driving motor for simple and compact design, so the driving axle of each module is connected by the universal joint. Universal joints between modules enable the body flexion for steering or overcoming higher obstacles. A prototype of crawler with three modules is built and the driving performance and the effect of module lifting on the ability to overcome obstacles are demonstrated by the experiments.

주변정보 분할을 이용한 주제 중심 웹 문서 수집기 (A Focused Crawler by Segmentation of Context Information)

  • 조창희;이남용;강진범;양재영;최중민
    • 정보처리학회논문지B
    • /
    • /
    • /
    • 2005
  • 주제 중심 웹 문서 수집기는 검색엔진에서 최신의 웹 문서 색인을 유지하는 대안방안으로 부상하고 있다. 그러나 주제 중심 웹 문서 수집기는 비 관심문서에서 연결된 관심문서들을 수집할 수 없는 문제점을 가지고 있다. 이러한 문제점은 문서의 구조적 특징을 고려하지 않아서 발생한다. 특히 문서분석 방법인 문서의 발생 횟수 및 역문헌 발생빈도는 이러한 문제를 야기하는 주요 원인이 된다 주제 중심 웹 문서 수집기의 성능을 향상하기 위해서 본 논문에서는 국소 정보기반의 문서 분할법을 제안한다. 본 논문에서는 문서를 하이퍼링크 주변의 문맥을 고려한 특징 정보들을 사용하여 여러 소각의 문서로 나눈다. 본 논문에서 제안하는 주제 중심 웹 문서 수집기는 나누어진 문서들을 이용하여 하이퍼링크가 관심문서를 가리키는 것인지를 판단하여 문서를 수집할 것인지를 판단한다.