• 제목/요약/키워드: 웹 페이지 간 유사도

검색결과 23건 처리시간 0.023초

XML 기반의 정보 처리 시스템 설계 및 구현 (Implementation of XML-based Information Processing system)

  • 남윤영;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.298-300
    • /
    • 2001
  • 최근 들어 기업이나 관공서, 기관 등에서 상호간에 정보를 서로 교환하거나 사용자에게 게시할 때, 대부분 웹을 통해 브라우저에서 볼 수 있도록 HTML(HyperText Markup Language)형태로 제작하게 된다. 그러나 HTML로 제작된 웹 페이지는 구조적인 정보나 다양한 정보를 표시할 수 없다는 문제점이 있으며, 빠르게 변하는 정보인 경우 상세한 정보 표현 면에서 취약하다는 단점이 있다. XML(eXtensible Markup Language)은 이러한 문제점을 해결할 수 있는 마크업(markup) 언어로써 차세대 데이터 교환의 표준으로 채택하고 있다. 한편, XML이 HTML보다 더 나은 구조와 기능을 제공하고 있으나 XML 자체만으로는 XML이 가지는 여러 가지 장점들을 충분히 활용하기 어렵기 때문에 스크립트 언어의 사용이나 애플리케이션의 제작이 필수적이다. 본 논문에서는 효율적인 정보의 교환과 공유를 위해 XForm과 XML Query를 사용하여 정보를 데이터베이스에 저장하고 XML 형태로 추출, 교환할 수 있으며, 서버(server)와 클라이언트(client) 사이에서의 정보 교류뿐만 아니라 유사한 컨텐츠를 제공하는 여러 서버들간의 정보 공유를 지원하는 정보 처리 시스템을 제안한다.

  • PDF

자동 생성된 사용자 프로파일을 이용한 하이브리드 음식 추천 시스템 (Hybrid Food Recommendation System Using Auto-generated User Profiles)

  • 정주석;강신재
    • 한국지능시스템학회논문지
    • /
    • 제21권5호
    • /
    • pp.609-617
    • /
    • 2011
  • 본 논문에서는 트위터로부터 자동 생성한 사용자 프로파일을 이용하는 개인 맞춤형 음식 추천 시스템을 제안한다. 사용자 개인의 트위터 문장에서 명사를 추출하고, 감정단어와의 공기 여부에 따라 감정점수를 계산한 후. 사용자 프로파일을 생성한다. 각 음식에 관한 정보는 웹에서 검색한 웹 페이지를 분석, 가공하여 음식별 대표 명사 목록을 만들어 사용한다. 이렇게 구축된 사용자 프로파일과 각 음식별 특징 정보 간 유사도를 계산하여 사용자에 맞는 음식을 추천 해준다. 제안하는 방법은 추천 시스템을 처음 사용하는 사용자라 할지라도 사용자 프로파일이 자동으로 구축되어 추천에 사용되기 때문에 항상 추천 결과를 얻을 수 있는 장점이 있다.

유사한 인기도 추세를 갖는 웹 객체들의 클러스터링 (Clustering of Web Objects with Similar Popularity Trends)

  • 노웅기
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.485-494
    • /
    • 2008
  • 인터넷이 광범위하게 활용됨에 따라 검색 키워드, 멀티미디어 객체, 웹 페이지, 블로그 등의 다양한 웹 객체들이 크게 증가하고 있다. 이러한 웹 객체들의 인기도는 시간에 따라 변화하며, 그러한 웹 객체 인기도의 시간적 패턴에 대한 마이닝이 여러 가지 웹 응용에 필요한 중요한 연구 과제가 되고 있다. 예를 들어, 검색 키워드에 대한 인기도 패턴의 분석은 앞으로 인기가 높아질 키워드를 미리 예측할 수 있게 하여 광고주들에게 키워드를 판매하기 위한 가격을 결정하는 데에 중요한 자료가 될 수 있다. 하지만, 웹 객체 인기도가 시간에 따라 변화하고 웹 객체의 개수가 매우 방대하다는 특성으로 인하여 웹 객체 인기도에 대한 분석은 매우 어려운 문제이다. 본 논문에서는 웹 객체 인기도의 시간적 패턴을 마이닝하기 위한 효율적인 알고리즘을 제안한다. 본 논문은 웹 객체 인기도를 시계열로 표현하고, 두 웹 객체 인기도 간의 유사성을 측정하기 위하여 gap 척도를 제안한다. gap 척도의 효율적인 계산을 위하여 FFT를 활용한 알고리즘을 제안하고, 밀도기반 클러스터링 알고리즘을 이용하여 유사한 인기도 추세를 갖는 웹 객체들의 클러스터를 생성한다. 본 논문에서는 웹 객체 인기도가 특정 분포를 따르거나 주기적이라고 가정하지 않는다. Google Trends 웹 사이트로부터 구한 검색 키워드 인기도를 이용한 실험을 통하여, 제안된 알고리즘이 실세계 응용에서 유용함을 보인다.

웹 트랜잭션 처리 시스템의 일관성 유지 지원 (Support of a Web Transaction Processing System for Preserving Consistency)

  • 이강우;김형주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권8호
    • /
    • pp.946-954
    • /
    • 1999
  • 웹의 등장으로 전자 업무 처리는 급격한 성장을 보여왔다. 많은 업계에서는 업무 처리에 있어 핵심이 되는 트랜잭션을 웹에서 처리하기 위한 시스템 개발에 많은 노력을 기울여왔다. 그러나 대부분의 웹 트랜잭션 연구는 주로 CGI 방식의 트랜잭션 처리 성능의 한계를 극복하거나, 여러 HTTP 요청간의 상태 유지 방법 또는 시스템의 확장성 등에 대해 연구가 집중된 반면, 부적합한 웹 환경으로 유발되는 시스템의 일관성 손실에 대해서는 많은 관심을 받지 못했다.본 논문에서는 웹 상에서 신뢰성 있는 트랜잭션을 처리하는 경우 발생되는 세 가지 문제점을 지적하고, 이를 막기 위해 웹 트랜잭션 처리 시스템인 WebTP에서 제공하는 해결책을 제안한다. 제안한 해결책은 쿠키 로깅, 웹 페이지 로깅, 그리고 일방적으로 철회된 트랜잭션의 상태를 유지하는 기법을 근간으로 한다. 또한 제안된 방법은 유사 구조의 타 웹 트랜잭션 처리 시스템에서도 적용 가능하다.Abstract Electronic business processing has drastically grown since the advent of the World Wide Web. As transaction processing is at heart of business processing, many companies have been interested in transaction processing on the Web. However, little attention has been paid to supporting consistent transaction processing on the Web, while most of the work has been focused on performance enhancement, processing multiple HTTP requests in a single context, and scalability.This paper identifies three problems in consistent transaction processing on the Web, and proposes corresponding solutions for each problem. The results are implemented in the Web transaction processing system WebTP. These solutions are based on cookie logging, Web page logging and keeping information for unilaterally aborted transactions. The solutions proposed in this paper also can be applied to other Web transaction processing system of similar architecture.

삼각 부등식을 이용한 온라인 VQ 코드북 생성 방법 (Online VQ Codebook Generation using a Triangle Inequality)

  • 이현진
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권3호
    • /
    • pp.373-379
    • /
    • 2015
  • 본 논문에서는 실시간으로, 문서, 웹 페이지, 블로그, tweet 등 텍스트 정보와 센서, 머신데이터등 IoT의 데이터가 생성되는 상황에서 새로 추가되는 데이터들을 기존에 만들어진 VQ 코드북에 추가시키면서, 기존 VQ 코드북 모델을 실시간으로 갱신하기 위한 온라인 VQ 코드북 생성 방법을 제안한다. 기존에 일괄 작업으로 만들어진 VQ 코드북의 성능을 저하시키지 않으면서, 새로 추가된 데이터를 활용하여 VQ 코드북을 점진적으로 수정하는 방식으로 삼각 부등식을 활용하여 높은 정확도와 속도를 보일 수 있었다. 테스트 데이터에 적용한 결과 일괄 작업과 유사한 성능을 보이면서, 다른 온라인 K-Means 보다 빠른 속도를 보였다.

공공데이터에 적합한 다양한 소셜 그래프 비주얼라이제이션 알고리즘 제안 (Social graph visualization techniques for public data)

  • 이만재;온병원
    • 한국HCI학회논문지
    • /
    • 제10권1호
    • /
    • pp.5-17
    • /
    • 2015
  • 최근 다양한 공공데이터가 개방되고 있으며, 적절한 데이터 마이닝과 시각화 알고리즘을 통해 일반 시민에게 서비스 되고 있다. 이를 통해 정부와 지방자치단체는 공공 정책의 투명성과 효율성을 널리 알릴 수 있을 뿐 아니라, 일반 사용자들이 개방된 공공데이터를 재가공하여 서비스함으로써 관련 산업의 성장을 이끌고 있다. 공공데이터의 최종 사용자는 일반 시민이기 때문에, 누구나 손쉽게 이해할 수 있도록 공공데이터를 적절히 시각화하는 것이 무엇보다 중요하다. 본 연구에서는 공공데이터 비주얼라이제이션의 중요성을 널리 알리기 위해, 일반 국민이 관심을 가질만한 공공데이터로 UN 회원국의 투표 데이터를 고려한다. 외교와 교육 목적으로 그 활용 가치가 높고 데이터를 쉽게 얻을 수 있는 장점이 있다. 또한 적절한 데이터 마이닝과 시각화 과정을 거친다면, 일반 사용자들이 유엔 회원국 간의 투표 성향에 대한 통찰력을 쉽게 얻을 수 있다. 유엔 투표 데이터를 시각화하기 위해서는, 회원국 간의 투표성향 유사도를 측정하고, 이를 바탕으로 소셜 그래프를 구현한다. 그리고 그래프 레이아웃 알고리즘을 적용하여 그래프를 화면에 렌더링 하게 된다. 기존 방법을 이용하여 소셜 그래프를 비주얼라이제이션 할 경우에 그래프의 복잡도가 증가하여 유엔 회원국 간의 투표성향을 파악하는데 큰 어려움이 있다. 이러한 문제를 개선하기 위해, 본 논문에서는 친구 매칭(Friend-Matching), 친구-라이벌 매칭(Friend-Rival Matching), 버블힙(Bubble Heap) 알고리즘들을 차례로 제안한 다. 제안된 알고리즘을 바탕으로, 기존 그래프 비주얼라이제이션을 개선하여 일반 사용자들이 손쉽게 유엔 회원국 간의 투표성향과 관련된 특정 패턴이나 통찰력을 얻는데 큰 도움을 줄 것이다. 또한 웹에서 동작하는 프로토타입을 구현하여, 누구나 방문하여 테스트를 할 수 있다. 웹 페이지 주소: http://datalab.kunsan.ac.kr/politiz/un/

Word2Vec 기반의 의미적 유사도를 고려한 웹사이트 키워드 선택 기법 (Web Site Keyword Selection Method by Considering Semantic Similarity Based on Word2Vec)

  • 이동훈;김관호
    • 한국전자거래학회지
    • /
    • 제23권2호
    • /
    • pp.83-96
    • /
    • 2018
  • 문서를 대표하는 키워드를 추출하는 것은 문서의 정보를 빠르게 전달할 수 있을 뿐만 아니라 문서의 검색, 분류, 추천시스템 등의 자동화서비스에 유용하게 사용 될 수 있어 매우 중요하다. 그러나 웹사이트 문서에서 출현하는 단어의 빈도수, 단어의 동시출현관계를 통한 그래프 알고리즘 등의 기반으로 키워드를 추출할 경우 웹페이지 구조상 잠재적으로 주제와 관련이 없는 다양한 단어를 포함하고 있는 문제점과 한국어 형태소 분석의 정확성이 떨어지는 형태소 분석기 성능의 한계점 때문에 의미적인 키워드를 추출하는데 어려움이 존재한다. 따라서 본 논문에서는 의미적 단어 위주로 구축된 후보키워드들의 집합과 의미적 유사도 기반의 후보 키워드를 선택하는 방법으로써 의미적 키워드를 추출하지 못하는 문제점과 형태소 분석의 정확성이 떨어지는 문제점을 해결하고 일관성 없는 키워드를 제거하는 필터링 과정을 통해 최종 의미적 키워드를 추출하는 기법을 제안한다. 실 중소기업 웹페이지를 통한 실험 결과, 본 연구에서 제안한 기법의 성능이 통계적 유사도 기반의 키워드 선택기법보다 34.52% 향상된 것을 확인하였다. 따라서 단어 간의 의미적 유사성을 고려하고 일관성 없는 키워드를 제거함으로써 문서에서 키워드를 추출하는 성능을 향상시켰음을 확인하였다.

맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색 시스템 (An Integrated Region-Related Information Searching System applying of Map Interface and Knowledge Processing)

  • 신진주;서경석;장용희;권용진
    • Spatial Information Research
    • /
    • 제18권4호
    • /
    • pp.129-140
    • /
    • 2010
  • Google, NAVER와 같은 대형포털에서 지도 기반의 다양한 서비스를 제공함에 따라, 지역관련 정보를 얻으려는 사용자들의 관심과 요구 또한 증가하고 있다. 하지만, 대형포털의 서비스들은 특정 지역에 대한 상세정보가 충분하지 않고 관련 정보를 획득하는 과정이 반복되는 번거로움이 존재하기 때문에, 사용자가 특정 지역의 관련 정보를 자세하고 종합적이며 손쉽게 획득할 수 있도록 지원하는 시스템이 필요하다. 본 논문에서는 사용자의 지역정보 획득에 유용한 시스템의 구축을 위해, 맵 인터페이스와 지식처리를 활용한 시스템 모델을 제안한다. 제안한 모델은 '지역정보 웹 문서 Layer', '고유지역키워드 Layer', '맵 인터페이스 Layer'의 3-Layer로 구성된다. 이 모델을 기반으로 한 지역관련정보 통합검색 시스템은 (l) 특정 지역의 대표 키워드 추출 (2) 관련 웹 페이지 수집 (3) 연관 키워드 집합 추출 및 키워드간의 연관도 계산 (4) 사용자 인터페이스 구축의 4단계 과정을 거쳐 구현한다. 구체적으로 고양시 지역을 대상으로 한 시스템의 구축을 통해 제안한 모델과 유사도 행렬을 이용한 지역정보의 지식처리 알고리즘, 사용자의 검색 편의를 돕는 UI 등의 타당성을 검증하였다. 본 시스템은 단순히 개별 '정보'로 존재하는 지역정보들을 융합하고, 새로운 '지식'을 생산 및 체계화하여 사용자들에게 제공해준다. 이를 통해 사용자는 다양하고 상세한 지역정보를 제공받을 수 있고 관련 정보도 쉽게 얻을 수 있다.

항로표지 거점을 활용한 실시간 영상기반 해양안개 관측시스템 구축 (A real-time image-based sea fog observation system based on local lighthouse)

  • 김무건;장인권;이형의
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2023년도 추계학술대회
    • /
    • pp.23-26
    • /
    • 2023
  • 과거에는 주요 항로 인근의 해양안개(sea fog)를 관측하고 이를 선박들의 안전 운항을 위한 실시간 정보를 제공하는 데 있어서, 작동 원리가 유사한 기상관측용 시정계(Visibility Sensor) 또는 항로표지용 안개감지기(fog detector) 등을 설치하여, 장비가 설치된 곳 인근의 국지적인 안개를 관측하고 있었다. 하지만 먼지, 염분 및 꽃가루 등에 의한 오염이나 거미줄 같은 생물에 의한 감지 센서의 오동작이 자주 발생되어, 실시간 관측 정보의 신뢰성이 다소 낮은 상황이었기 때문에 실시간으로 해양안개 관측정보를 선박이나 이용자에게 즉각 제공하기에는 다소 무리가 있었다. 2019년부터 2022년까지 기상청과 해양수산부 항로표지과 등이 협업을 통해, 보다 신뢰성 있는 실시간 영상기반 해양안개관측 시스템을 전국 주요 항로에 있는 항로표지시설(Lighthouse) 100개 국소에 구축하여 신뢰성 있는 해양안개관측 정보를 매 10분마다 수집하고, 이를 실시간으로 대국민 서비스(웹페이지)를 수행하게 되었다.

  • PDF

USN 기반의 그린하우스 관리 기술 (A Technology of Greenhouse Management System based on USN)

  • 이인범;전병찬;안영창;이종교;배태현;박주희;류대현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1162-1165
    • /
    • 2011
  • 본 연구는 그린하우스 내의 환경 정보를 원격 감시 및 제어함으로써, 재배의 편리성을 확보하는 한편, 수집된 정보에 대하여 데이터베이스를 구축하여 작물 재배의 최적 환경을 도출하는 데 그 목적이 있다. 이를 위해서, 2연동 그린하우스 제작하여, 그린하우스를 내에 여러 종류의 센서와 카메라를 장착하였으며, 이를 통해서 감지되는 정보를 원격에서 수집, 자료화 하였다. 사용자 편의를 위하여 웹페이지를 개설, 실시간으로 정보의 검색과 제어가 가능하게 하였으며, 모바일에서도 일부 기능 구사가 가능하도록 하였다. 정보의 수집과 전달, 사용자에 의한 그린하우스 환경제어와 관련한 모든 기능에 대한 안정성을 장시간 현장시험을 통해서 실험적으로 확인하였다. 이 시스템은 그린하우스를 설치하여 작물을 재배하는 농가에 편리를 제공하여 시간적, 공간적 제약에서 많은 융통을 부여할 것이다. 또한 공장, 사무실, 가정 등 유사한 환경 시설에 대해서 확대 적용하는 것이 가능할 것이다.