Search | Korea Science

Crawling algorithm design and experiment for automatic deep web document collection (심층 웹 문서 자동 수집을 위한 크롤링 알고리즘 설계 및 실험)

Yun-Jeong, Kang;Min-Hye, Lee;Dong-Hyun, Won
- Journal of the Korea Institute of Information and Communication Engineering
- /
- v.27 no.1
- /
- pp.1-7
- /
- 2023
Deep web collection means entering a query in a search form and collecting response results. It is estimated that the information possessed by the deep web has about 450 to 550 times more information than the statically constructed surface web. The static method does not show the changed information until the web page is refreshed, but the dynamic web page method updates the necessary information in real time and provides real-time information without reloading the web page, but crawler has difficulty accessing the updated information. Therefore, there is a need for a way to automatically collect information on these deep webs using a crawler. Therefore, this paper proposes a method of utilizing scripts as general links, and for this purpose, an algorithm that can utilize client scripts like regular URLs is proposed and experimented. The proposed algorithm focused on collecting web information by menu navigation and script execution instead of the usual method of entering data into search forms.
https://doi.org/10.6109/jkiice.2023.27.1.1 인용 PDF

패스워드 매니저의 보안성 분석

Kim, Soolin;Kim, Hyoungshick
- Review of KIISC
- /
- v.28 no.1
- /
- pp.36-42
- /
- 2018
사용자는 비밀번호를 외워야하는 불편함을 줄이고 로그인 과정을 편리하게 이용하기 위해 패스워드 매니저를 사용한다. 패스워드 매니저는 크게 브라우저 기반의 패스워드 매니저와 웹 기반의 패스워드 매니저로 나눌 수 있다. 브라우저 기반의 패스워드 매니저의 경우 로컬에 사용자의 계정 정보와 암호화 키를 저장하기 때문에, 비밀번호 복구 프로그램을 사용하거나 간단한 코드를 이용하여 사용자의 계정 정보를 평문 형태로 추출할 수 있다. 로컬에 저장하는 브라우저 기반의 패스워드 매니저와 달리 웹 기반 패스워드 매니저는 웹을 기반으로 실행된다. 웹 기반 패스워드 매니저는 암호화 키를 웹 서버에 저장하기 때문에, 로컬 기반의 패스워드 매니저에 비해 키 노출 우려가 적다. 하지만 웹 기반이기 때문에 공격자가 웹 취약점을 이용하면 사용자의 정보가 누출될 위험성이 있다. 본 논문에서는 사용자의 편의성을 개선하고자 사용되는 패스워드 매니저를 브라우저에서 사용되는 브라우저 기반 패스워드 매니저와 웹에서 사용되는 웹 기반 패스워드 매니저로 분류하고 각 패스워드 매니저가 사용자의 계정 정보를 저장 및 관리하는 방법을 분석하고, 해당 패스워드 매니저들에서 발생 가능한 취약점에 대해 조사하였다.
PDF KSCI

Form Clustering Methodology for Internal System Reengineering of Web-Cased Information System (웹기반 정보시스템의 내부시스템 재구성을 위한 폼 클러스터링 방법론)

최상수;박현우;이강수
- Proceedings of the Korea Multimedia Society Conference
- /
- 2002.11b
- /
- pp.703-706
- /
- 2002
최근 대부분의 정보시스템은 웹기반 정보시스템으로 이주하고 있으며 이의 개발과 유지보수시에 "웹 위기" 현상이 발생하고 있다. 이를 해결하기 위한 웹엔지니어링 기술 중 웹기반 정보시스템의 내부시스템을 재구성하기 위한 방법이 필요하다. 따라서 본 논문에서는 웹기반 정보시스템의 내부시스템을 재구성하기 위한 폼 클러스터링 방법을 제시한다. 폼 클러스터링 방법은 기존의 소프트웨어 분할 및 태스크 클러스터링 기술의 개념을 적용하여 웹 기능구조를 실제 하드웨어에 할당하기 위한 최적의 응답시간 성능을 갖는 웹 소프트웨어 구조를 생성하는 방법이다. 본 논문에서 제시하는 폼 클러스터링 방법은 웹기반 정보시스템의 내부시스템을 신규개발 및 유지보수시에 적용할 수 있다. 적용할 수 있다.
PDF

The Design of 3D Web Map Service Components (3차원 웹 맵 서비스 컴포넌트의 설계)

Choo, Dae-Soo;Choi, Hae-Ock;Lee, Jong-Hun
- Proceedings of the Korea Information Processing Society Conference
- /
- 2001.10a
- /
- pp.7-10
- /
- 2001
웹의 특징인 조작의 간편함, 뛰어난 접근성 등으로 인해 웹을 통한 지리정보의 검색, 접근을 위한 웹 맵 서비스의 요구가 증대되고 있다. 지리정보 분야의 대표적인 컨소시움인 OGC 를 통해서 웹 맵 서비스를 위한 표준 인터페이스가 정의됨에 따라 향후 웹을 통한 지리정보의 공유가 활발히 진행될 것으로 예상된다. 그런데, 현재 정의된 웹 맵 서비스에는 3 차원 맵 서비스를 고려하고 있지 않다. 왜냐하면, 3 차원 데이터 모델에 따라 구축된 공간 데이터가 거의 없으며, 맵 출력을 위한 출력 요소 정의 언어인 SVG 또는 WebCGM 등이 3 차원 기하를 표현할 수 없기 때문이다. 이 논문에서는 OCG 의 웹 맵 서비스를 위한 표준 인터페이스를 준수하면서, 최소한의 확장을 통해 3 차원 맵 서비스를 지원하기 위한 웹 맵 서비스 컴포넌트를 제안한다. 3 차원 맵은 2 차원 공간 데이터와 속성 정보를 이용하여 생성하므로, 3 차원 공간 데이터베이스 구축을 위한 추가의 비용이 발생하지 않는다.
PDF

A Study on Subject Classification of Web-based Academic Information Resources (웹 학술정보자원의 주제분류에 관한 연구)

임윤정;박경미
- Proceedings of the Korean Society for Information Management Conference
- /
- 2002.08a
- /
- pp.37-41
- /
- 2002
최근 정보처리 기술의 발달과 인터넷의 확산으로 웹 학술 정보원의 양은 방대히 증가하였지만, 이용자들이 원하는 정보를 정확하게 찾는 것이 매우 어려워졌다. 이를 해결하기 위해서는 웹 상에서 생산되는 정보를 효과적으로 조직화하고 체계화하는 작업이 필요하다. 이에 본 논문에서는 문헌정보학 분야의 웹 학술정보자원을 선별하여 제공하는 IFL을 통해 웹 학술정보원의 주제분류체계를 제시해보았다.
PDF

The Web based Traffic Information System (웹 기반 교통정보 시스템)

Jin, Hyun-Soo
- Proceedings of the KAIS Fall Conference
- /
- 2007.05a
- /
- pp.223-225
- /
- 2007
웹 기반 교통정보제공시스템에서 전달자에게 제공하는 교통정보의 적정성은 매우 중요하다. 그러나 대부분의 웹기반 교통정보에서는 아직까지 획일적인 교통자료와 반복적인 정보들을 제공하고 있어서 수요자에게 맞는 적절한 교통정보를 제공하지 못하고 있다. 따라서 본 연구에서는 멀티미디어의 요소를 적용한 웹기반 교통정보시스템을 개발하였으며 수요자의 교통정보인식의 요인에 대하여 분석함으로서 웹기반 교통정보전달에서 멀티미디어의 활용에 대한 효과와 적용방안을 제시하는 자료가 되고자 한다.
PDF

Implementation and Design of Robot Engine for Web Collection (웹 수집 로봇 엔진의 설계 및 구현)

Kim, Dae-You;Kim, Jung-Tae
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- 2007.10a
- /
- pp.313-317
- /
- 2007
인터넷의 이용이 활발해짐에 따라 수많은 정보들이 웹을 통하여 공개되고 있으며, 이용자는 웹 검색 서비스를 이용하여 이러한 정보들에 효과적으로 접근할 수 있다. 웹 검색 서비스의 구축을 위해서는 웹 로봇을 사용한 웹 문서 수집이 선행되어야 하며, 웹 문서들의 수가 급격히 증가하면서 양질의 웹 문서들을 효과적으로 수집할 수 있는 웹 로봇에 대한 필요성이 증가되고 있으며, 그에 따른 많은 웹 수집 로봇이 탄생되고 있다. 본 논문에서는 효과적인 웹 수집 로봇의 설계와 동적인 웹페이지에서 사용하는 자바스크립트의 링크 추출방안에 대하여 제시하고자 한다.
PDF

Design and Implementation for the Effective Web (효율적인 웹 마이닝 시스템의 설계 및 구현)

김형욱;최익규;김민구
- Proceedings of the Korea Inteligent Information System Society Conference
- /
- 2002.11a
- /
- pp.303-307
- /
- 2002
효율적인 웹 마이닝을 위해서는 방대한 인터넷 공간에서 사용자가 원하는 정보를 찾아내고, 이들 중 보다 유용하다고 판단되어진 자료를 선별적으로 제시할 수 있어야 한다. 본 논문에서는 웹 컨텐츠 분석과 HTML 문서들 사이의 링크 연결의 패턴 분석을 기반으로 하는 웹 구조 분석 방법들을 검토하고, 웹 검색 시스템을 구현하여 결과를 분석하였다. 이를 위해 웹 문서의 내용을 인덱싱한 뒤 질의와의 관련성의 확률을 구하는 랭귀지 검색 모델에 링크 구조 분석을 이용한 순위 알고리즘을 사용하여 좋은 결과를 얻고자 하였다. 또한 기존의 링크 관련 알고리즘에서 알려진 문제점을 해결하기 위한 몇가지 테크닉을 사용하였다.
PDF

Introduction to Web Service for Satellite Imagery Information (위성영상정보 제공 웹서비스 소개)

채기주;한은영;박종현
- Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
- /
- 2004.03a
- /
- pp.469-473
- /
- 2004
본 논문에서는 현재 ETRI에서 수행 중인 (위성영상정보 통합관리사업)의 웹 서비스에 대해서 소개하고자 한다. 웹서비스를 이루는 DB설계, 데이터 등록, 데이터 관리, 웹 검색/주문 시스템을 중심으로 하여 전체적인 웹서비스의 모양을 제시한다. 각 단계에서 고려해야 할 사항들과 전체적 인 시스템에서 고려해야 할 사항들을 자세히 설명하여, 위성 영상정보 웹서비스를 구축하는 기관 및 개인에게 도움을 주어 다양한 웹서비스의 모델이 나올 것을 기대한다.
PDF

Link Extraction and Validation for Web-page Maintenance (웹 페이지 관리를 위한 링크 추출과 검증)

엄정섭;유대승;심민석;이명재
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.10a
- /
- pp.427-429
- /
- 2001
웹의 발전에 따라 거대해진 웹사이트들은 서로 복잡하게 얽혀진 링크들로 인해 웹 개발과 유지보수에 큰 어려움이 따른다. 효율적인 웹 개발과 유지보수를 위해서는 웹에서 가장 중요한 정보의 단위인 링크정보들을 추출할 수 있는 방법이 요구된다. 본 논문에서는 웹 브라우저 요청에 의해 반환된 HTTP 헤더분석과 HTML 문서의 태그분석을 통해 링크들을 추출하여 “끊어진 링크”를 찾고, 추출된 “링크요소”들과 서버에 저장된 파일들을 비교하여 “사용되지 않는 파일”들을 찾아주는 “링크 분석기”시스템을 개발함으로 써 웹 개발과 유지보수에 있어서 가장 기본적이면서도 중요한 링크관리에 대한 방법을 제시한다
PDF

Search Result 10,426, Processing Time 0.043 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)