• 제목/요약/키워드: HTML tag

검색결과 65건 처리시간 0.029초

인터넷 정보 추출을 이용한 웹문서 구조화 (Web Site Construction Using Internet Information Extraction)

기독교 관련 웹 사이트 내 색인에 관한 연구 (A Study on Christian Website Indexing)

HTTP Outbound Traffic에 HMM을 적용한 웹 공격의 비정상 행위 탐지 기법 (Anomaly Detection Scheme of Web-based attacks by applying HMM to HTTP Outbound Traffic)

  • 최병하;최승교;조경산
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권5호
    • /
    • pp.33-40
    • /
    • 2012
  • 본 논문은 HTTP Outbound Traffic의 감시를 통해 다양한 웹 공격의 침입 경로에 대응하고, 학습 효율성을 높여 변종 또는 새로운 기법을 이용한 비정상 행위에 대한 오탐을 낮춘 기법을 제안한다. 제안 기법은 HMM(Hidden Markov Model)을 적용하여 HTML 문서속의 태그와 자바스크립트의 학습을 통한 정상 행위 모델을 생성한 후, HTTP Outbound Traffic속의 정보를 정상 행위 모델과 비교하여 웹 공격을 탐지한다. 실제 침입된 환경에서의 검증 분석을 통해, 제안기법이 웹 공격에 대해 0.0001%의 오탐율과 96%의 우수한 탐지능력을 보임을 제시한다.

< a href > 태그 추출을 이용한 웹 문서 구조화 (Web site construction using tag extraction)

정보 추출을 위한 트리거에서 HTML이미지 태그 정보의 이용 (Application of the HTML Image Tag on Triggers for Describing Rules for Information Extraction)

  • 김연정;박제현;최중민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.721-723
    • /
    • 2005
  • 웹 문서를 대상으로 하는 정보 추출이나 웹 마이닝에 관한 연구가 활발히 진행되면서 특히, 웹에서 나타나는 구조적 패턴을 이용해 정보를 추출하는 방법에 대한 연구가 이루어지고 있다. 하지만 구조적 패턴을 이용할 수 없는 경우 텍스트에 의존한 추출기를 생성할 수 밖에 없는데 웹 문서에서 시각적 요소가 강해지면서 트리거가 단순 텍스트가 아닌 이미지로 처리되는 경우가 있다. 기존의 연구들은 트리거를 단순 텍스트로 보는 관점에서의 연구가 많았고 이러한 접근 방법은 트리거가 이미지인 경우에 정확한 정보를 추출해 낼 수 없었다. 이 논문에서는 트리거가 텍스트가 아닌 이미지인 경우에도 필요한 정보를 잘 추출해 내기 위한 방법에 관해 제안하고자 한다.

  • PDF

웹 크롤링 이용한 크레페 검색 시스템 설계 (Crepe Search System Design using Web Crawling)

  • 김효종;한군희;신승수
    • 디지털융복합연구
    • /
    • 제15권11호
    • /
    • pp.261-269
    • /
    • 2017
  • 본 연구의 목적은 광역 네트워크로 연결된 다수의 봇을 활용한 방식이 아닌 단일 네트워크에서 정보의 최신성을 보장하기 위해 데이터베이스 서버를 사용하지 않고 실시간으로 웹에 접속하여 정보를 불러오는 방식을 사용한 검색 시스템을 설계하는 것이다. 연구의 방법은 크레페 시스템에서 신속하고 정확한 인물과 키워드 검색을 할 수 있는 시스템을 설계하고 분석한다. 크레페 서버는 본문 태그 매칭 변환 과정은 사용자가 정보를 등록할 경우 글자체, 글자 크기, 색상등과 같이 사용자마다 여러 스타일이 적용되어 그 자체가 정보가 되기 때문에 모든 정보를 그대로 저장하게 된다. 크레페 서버는 본문 태그 매칭 문제점이 발생되지 않는다. 그러나 크레페 검색 시스템을 실행할 때에는 사용자들의 스타일 및 특성을 정형화할 수 없다. 이러한 문제점을 html_img_parser 함수와 Go언어의 html 파서 패키지를 사용하면 해결할 수 있다. 특정 사이트를 대상으로 하는 웹 크롤러 설계가 아닌 범용 웹 크롤러에 큐와 다중 스레드를 적용하여 다양한 웹 사이트를 빠르고 효율적으로 탐색, 수집한 빅 데이터를 다양한 응용 분야에 활용될 수 있을 것이다.

Collaborative Social Tagging for eBook using External DSL Approach

  • 유환수;김성환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.1068-1072
    • /
    • 2014
  • We propose a collaborative social tagging for eBook using external DSL approach. The goal of this paper is (1) to provide DSL by which authors can write HTML5 rich contents ebook and tag resources, (2) to make users enhance book by tagging resources easily, (3) to make readers read rich book easily regardless of their devices types, (4) to provide ebook resources of RESTful address style by which other system can identify self-descriptive resources of book. To achieve the goal, we provide Bukle DSL language by which author and users can author and enhance ebook with ease. As a domainspecific language Bukle provides a simple yet expressive language for authoring and tagging books that would otherwise be more difficult to express with a general purpose language. Further work includes visual DSL approach and tools by using that the unskilled users could tag book easily. In order that future work also includes text-to-visual DSL transform engine. UX research is also required to tag and to author book. To tackle the above questions we are looking at using visual notation focusing visual syntax.

Spatial XQuery2SQL Converter를 위한 알고리즘 (The Algorithm For Spatial XQuery2SQL Converter)

  • 최영운;서현호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.442-447
    • /
    • 2004
  • XML은 1996년 W3C(World Wide Web Consortium)에서 제안한 것으로서 웹상에서 구조화된 문서를 전송 가능하도록 설계된 표준화된 텍스트 형식이다. 이는 인터넷에서 기존에 사용하던 HTML의 한계를 극복하고 SGML의 복잡함을 해결하는 방안으로써 HTML에 사용자가 새로운 태그를 정의할 수 있는 기능이 추가되었다. 이러한 XML문서를 RDBMS에서 저장해서 사용하기 위한 많은 노력이 있으나 구조적으로 XML문서는 트리구조이어서 관계형 DB에 자료를 질의하기 위한 언어인 SQL과 완벽한 호환을 이루지 못한다 그래서 W3C의 XML 표준 질의인 XQuery가 등장하게 되었다. 이 논문에서는 공간 정보를 포함한 XML 정보들을 RDBMS에 저 장후 공간연산자, 공간함수를 통한 Sqatial XQuery2SQL이라는 변환기를 통해서 Spatial XQuery를 SQL로 변환한 후 RDBMS에 있는 정보를 추출하는 Sqatial XQuery2SQL 변환 알고리즘을 구현하고자 한다.

  • PDF

학교 웹 사이트의 디자인에 대한 시각적인요소 분석 및 가이드라인 (Visual Element Analysis and Guideline of School Web Site Design)

  • 권경란;김영봉
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 춘계 종합학술대회 논문집
    • /
    • pp.273-279
    • /
    • 2005
  • 인터넷의 보급이 확산되고 정보통신기술 및 웹 기술의 급속한 발달로 시간과 공간적 제약이 없는 가상대학(디지털대학)과 같은 학교 사이트가 활성화되고 있으며, 다양하고 질적인 교육 서비스를 제공하고 교육의 사회적 비용절감 및 전문 인력을 양성하여 국가경쟁력을 강화할 수 있으므로 학교사이트의 중요성은 매우 크다고 할 수 있다. 이에 따라, 많은 학교에서 가상학교를 시험 운용 중에 있으며, 가상 학습공간을 웹 상에 효율적으로 구축하기 위하여 학교사이트 분석과 연구가 필요하다. 본 논문에서는 성공적인 학교 사이트 디자인을 위하여 첫째 HTML Tag를 이용한 웹 디자인의 시각적인 요소를 분석하여 가장 일반적인 디자인 패턴을 제시하고, 둘째 설문조사를 통하여 기존 웹 디자인의 문제점과 사용자의 선호도를 알아봄으로써 사용자가 편리하게 이용할 수 있는 디자인의 특성과 가이드라인을 제시하여 학교 사이트 제작에 있어 시행착오를 줄이고 시간과 노력을 절약할 수 있는 학교 사이트 디자인에 도움이 되고자 한다.

  • PDF

헤어라인 교정 시술을 위한 웹기반 얼굴 3D 모델링 (Web-based 3D Face Modeling System for Hairline Modification Surgery)

  • 이상욱;장윤희;정은영
    • 한국콘텐츠학회논문지
    • /
    • 제11권11호
    • /
    • pp.91-101
    • /
    • 2011
  • 이 연구는 헤어라인 교정을 위한 웹 베이스의 3D 얼굴 모델링 구축을 목적으로 하고 있다. 미(美)에 대한 현대사회의 얼굴에 대한 관심은 광범위한 개인의 모바일 스마트 ICT 기기의 시대와 함께 의료 정보 시스템의 필요성 역시 급격하게 증가하고 있다. 이 연구는 기존의 기술의 독점과 배포 가능한 3D 모델링 라이브러리 구축을 시도하려 한다. 우리는 실험 결과를 통하여 새로운 웹 베이스 표준 개발을 위한 문제점 및 요구사항을 찾을 수 있었다. 우리는 우리의 실험과 관련 기술에 관한 문헌 검토에 따른 새로운 시스템을 제안하고자 한다. 우리가 제안하고자 하는 시스템의 주된 특징은 의과학, 미용학과 정보 기술을 기반으로 한 탈모 치료에 대한 연구이다. 이 시스템은 2D 정면 이미지를 3D mesh-data와 함께 얼굴 모델링을 진행한다. 이 mesh-data는 SVG를 포합한 웹 표준 기술과 HTML5에 의해 기본적으로 지원되는 Canvas Tag와 호환이 된다.