• 제목/요약/키워드: 페이지 분석

검색결과 839건 처리시간 0.03초

키워드 마케팅을 위한 연관 키워드 추출 기법 (A Related Keyword Group Extraction Method for Keyword Marketing)

  • 이성진;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.124-126
    • /
    • 2004
  • 인터넷 광고 시장의 급속한 성장과 함께 보다 효율적인 광고기법을 개발하기 위한 노력들이 이루어지고 있는 가운데 최근 들어 검색엔진의 특성을 이용한 키워드 광고가 주목을 받고 있다. 키워드 광고란 사용자가 입력한 검색어와 유사한 범주에 속하는 사이트의 광고를 검색 결과 페이지 상단에 보여주는 것을 말한다. 그러나, 키워드 광고는 키워드를 판매할 수 있는 위치가 한정적이기 때문에 판매 가능성이 있는 키워드에 대한 관리 및 판매 전략이 요구된다. 본 논문에서는 판매 가능성이 있는 키워드에 대한 관리 전략 수립을 위하여 연관 키워드 그룹을 자동으로 추출하는 기법을 제안한다. 연관 키워드 그룹의 생성은 사용자가 입력한 검색어에 의해 노출되는 사이트들을 묶어 그룹으로 형성하고 사이트 그룹의 중요 키워드를 추출한 다음 키워드간의 연관성을 판단하는 과정으로 이루어진다. 본 논문에서는 연관 키워드 그룹 추출의 각 단계를 구체적으로 설명하고 실험 결과를 분석한다. 마지막으로 연구의 결론과 향후 연구 과제에 대하여 기술한다.

  • PDF

단일 문서의 특징 분석을 이용한 스팸 분류 방법 (Spam Classification by Analyzing Characteristics of a Single Web Document)

  • 심상권;이수원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.845-848
    • /
    • 2014
  • 블로그는 인터넷에서 개인의 정보나 의견을 표출하고 커뮤니티를 형성하는데 사용되는 중요한 수단이나, 광고 유치, 페이지 순위 올리기, 쓰레기 데이터 생성 등 다양한 목적을 가진 스팸블로그가 생성되어 악용되기도 한다. 본 연구에서는 이러한 문제를 해결하기 위해 웹 문서에서 나타나는 특징들을 이용한 스팸 탐지 기법을 제안한다. 먼저 블로그 본문의 길이, 태그의 비율, 태그 수, 이미지 수, 랭크의 수 등 하나의 웹 문서에서 추출할 수 있는 특징을 기반으로 각 문서에 대한 특징 벡터를 생성하고 기계학습을 통해 모델을 생성하여 스팸 블로그를 판별한다. 제안 방법의 성능 평가를 위해 블로그 포스트 데이터를 사용하여 제안방법과 기존의 스팸 분류 연구를 비교 실험을 진행하였다. Bayesian 필터링 기법을 사용하는 기존연구와 비교 실험 결과, 제안방법이 더 좋은 정확도를 가지면서 특징 추출 속도 및 메모리 사용 효율성을 보였다.

FP-Tree를 기반으로 한 웹 사용 패턴에 대한 순차적 연관성 탐색 기법 . (A Sequential Association Rules Searching Methods for Web-Usage Patterns Based On Frequent-Pattern Tree)

  • 김영희;강우준;김응모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.25-27
    • /
    • 2004
  • 대용량 웹 데이터베이스로부터 필요한 관련 정보를 탐색하고, 다양한 형태의 정보로부터 지식을 창출하는 일은 매우 어려운 일이다. 본 논문은 복잡하고 다양한 형태의 패턴이 존재하고, 연속된 입력을 갖는 웹 데이터베이스에서 발생되는 빈발 패턴들을 효과적으로 저장할 수 있는 FP-Tree를 기반으로 하여 변화된 정보들을 능동적으로 유지하고 새로운 정보들에 U해 FP-Tree를 재구성하여 웹 페이지에 대한 유용한 패턴 정보와 사용자의 웹 사용 패턴 분석을 용이하게 한다. 그 결과 새로이 발견된 웹 사용 패턴들을 통해 웹 페이지의 구조적 정보와 구조적 연판 정보를 효과적으로 얻을 수 있다.

  • PDF

CPU 오버헤드 분석을 통한 MariaDB와 PostgreSQL 성능 비교 (Comparison of performance between MariaDB and PostgreSQL in terms of CPU overhead)

  • 이동호;송민창;조영태;김승원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.297-299
    • /
    • 2018
  • IT기업뿐만 아니라 다양한 기업들이 빅데이터, 인공지능, 블록체인 등 많은 양의 컴퓨터 자원 (CPU, RAM 등)을 요구하는 기술들을 서비스화 하고 있다. 따라서 한정된 차원으로 효율적인 서비스를 운영하는 것도 주요 이슈가 되고 있다. 본 논문에서는 오픈소스 RDBMS 인 MariaDB와 PostgreSQL을 프로파일링하여 CPU 자원 효율성 관점에서 비교한다. 연구 결과 인터넷 서비스 환경에서 MariaDB가 PostgreSQL보다 버퍼 풀로 인해 페이지 캐시 참조율이 낮고, page fault 수가 적어 CPU 오버헤드가 더 작다는 것을 입증하였다.

임베디드 시스템을 위한 LINUX 메인 메모리에 관한 연구 (A Study on Linux Main Memory for Embedded System)

  • 최지원;이동근;유재필;김기천
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.220-225
    • /
    • 2000
  • 리눅스는 무료로 사용 및 배포가 가능한 유닉스 계열의 운영 체제이다. 본 논문에서는 리눅스 커널의 최신 버전 소스 중 메모리에 관련된 부분만을 페이징, 컨텐트와 메모리와의 메핑, 그리고 페이지 폴트와 페이징 폴트에 따른 스와핑에 관한 부분으로 나누어 분석하고 메모리상에서만 리눅스 운영체제가 동작할 수 있는 방안을 제시한다.

  • PDF

세션과 객체 정보를 이용한 개인화된 로그 추출기법 (A Personalized Extracting Method using Session and Object Information)

  • 김민숙;박명순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.89-92
    • /
    • 2004
  • 웹 로그에는 개별 사용자를 식별할 수 있는 사용자 정보와 세션 정보가 포함되어 사용자 식별과 해당 URL은 알 수 있지만, 그 URL에 해당하는 페이지내에 어느 객체에 관심이 있어 클릭하는지 알 수 없고, 페이지내에서 외부 사이트로의 링크 부분을 클릭했을 시 로그 파일에 기록이 되지 않는다. 본 연구에서는 세션과 사용자 중심의 로그 기록 방식에 객체를 추가함으로써 복잡하고 다양해지는 객체 요소(동영상, 오디오, 플래시 등)가 포함된 웹사이트에서는 객체 중심의 로그 기록 방식이 고객의 행동 패턴을 분석하여 세분화된 개인화 서비스에 보다 효율적임을 관찰하였다.

  • PDF

NAND 스토리지 시스템의 성능 향상을 위하여 SCM을 활용한 변화량 기반 저널링 기법 (Differential Journaling for Improving Performance of NAND Storage Systems with SCM)

  • 김정훈;민창우;엄영익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.77-78
    • /
    • 2013
  • 최근 비휘발성, 바이트 단위 접근이 가능한 스토리지 클래스 메모리 관련 시스템 소프트웨어 연구가 활발히 이루어지고 있다. 이에 본 논문에서는 SCM의 성능 및 용량, 가격 측면을 고려하여, NAND 스토리지 시스템 성능 향상을 위한 변화량 기반 저널링 기법을 제안한다. 본 기법은 기존 데이터 대비 바뀐 부분이 임계치보다 작을 경우, 해당 부분을 기록하는 저널 영역으로써 SCM을 활용한다. 분석 결과에서 알 수 있듯이 본 논문에서 제안한 기법은 NAND 페이지 쓰기 횟수를 크게 감소시킴으로써, I/O 성능 및 NAND 스토리지 수명 향상을 가져온다.

효율적인 학습 모델을 지원하는 웹 페이지 학습 기억 플랫폼 구현 (The Implementation of Web Page Learning Memory Platform to support efficient Learning Model)

  • 김성준;오염덕
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.291-294
    • /
    • 2021
  • 본 논문에서는 영어 교육에 대한 사회적인 인식은 중요해지면서 다양한 방식의 영어공부와 학습모델들을 분석하고 오랫동안 가억이 가능한 학습시스템을 검토하였다. 그러나 영어의 기초가 되는 영어 단어의 공부법이 논리적인 근거 없이 강사의 인지도와 명성에 현혹되어 강사가 추천해 주는 공부 방법에 따라 잘못된 학습하는 경우가 대부분이다. 또한 사람마다 자기에게 맞는 학습법은 분명 존재할 것이다. 하지만 그 방법 외에 효과적인 다른 방법 또한 찾아 볼 수 있다. 헤르만 에빙하우스는 사람의 망각 연구한 결과 망각의 주기를 수치로 나타내었고, 라이트너는 플래시 카드를 박스에 넣어 복습을 반복하는 아날로그 장치를 만들어 복습의 효과를 연구하였다. 본 논문에서는 헤르만 에빙하우스의 망각 곡선 이론을 통해 효율적인 영어 단어 학습방법을 논리적으로 증명하고, 웹사이트를 사용한 라이트너 박스와 망각 곡선의 이론을 적용하여 망각의 주기에 따른 복습의 효과를 적용하여 결과적으로 사용자에게 접근성이 좋은 학습형 플랫폼을 제공하여 시간 대비 학습률이 좋은 시스템을 개발하고자 하였다.

  • PDF

수요예측 모니터링 애플리케이션과 웹의 사례 비교 분석 (A Comparative Analysis of Demand Forecast Monitoring Applications and the Web)

  • 이효원;임소연;이영우;박철우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.439-441
    • /
    • 2022
  • 본 연구는 수요예측 알고리즘으로 예측한 데이터와 실시간 데이터를 모니터링하기 위한 모니터링 애플리케이션과 웹 중 전력 수요관리 애플리케이션인 '해줌온', U&E 커뮤니케이션즈에서 사용하는 건설 현장 안전관리 시스템 웹 페이지를 비교하는 연구이다. 해당 연구는 위의 두 개의 대표적인 사례로 웹과 애플리케이션의 UI의 차이점, 장단점, 데이터의 보완 등을 비교하여 적절한 애플리케이션 또는 웹을 파악할 수 있다.

  • PDF

웹 포렌식을 위한 이미지 로깅 서버 구현 (Implement Image Logging Server for Web Forensics )

  • 유승희;조동섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.1138-1141
    • /
    • 2008
  • 현재 컴퓨터와 인터넷, 정보기술의 발전은 사용자에게 편리함을 가져다 주었으나, 사이버 범죄라는 새로운 역기능을 가지게 되었다. 결국 이는 특정 목적을 가진 범죄자를 낳게되고 정보화 사회의 발전을 저해하는 커다란 걸림돌로 작용하게 되었으며, 이에 대응하는 정보보호기술은 개인의 사생활 보호와 국가 경쟁력을 판단하는 척도로 자리잡게 되었고, 현대에는 정보보호 기술 자체가 국가 간 정보전 형태를 띠면서 그 중요성은 매우 커지고 있다. 이러한 정보보호 기술은 방화벽과 침입탐지 시스템의 꾸준한 개발로 이어졌으나, 아직 컴퓨터 범죄를 다루는 피해 시스템의 증거수집, 복구 및 분석을 하는 컴퓨터 포렌식 기술은 아직 활발히 연구되지는 않고 있다. 본 연구에서는 로그파일이 기록되는 시간의 웹 URL 페이지 이미지를 저장하여 이미지 로그파일을 만드는 멀티 쓰레드 TCP 서버를 구현하여 컴퓨터 사이버범죄에 대한 증거자료로서 디지털 포렌식인 이미지 로그파일을 제안하여 보았다.