• Title/Summary/Keyword: Web Searching

검색결과 565건 처리시간 0.408초

구글 검색엔진을 활용한 키워드 검색결과 수 관리 시스템 설계 및 구현 (A design and implementation of the management system for number of keyword searching results using Google searching engine)

  • 이주연;이중화;박유현
    • 한국정보통신학회논문지
    • /
    • 제20권5호
    • /
    • pp.880-886
    • /
    • 2016
  • 인터넷 상에 많은 정보들이 발생하면서 검색 엔진은 사용자에게 필요한 흩어진 정보를 모아주는 중요한 역할을 하고 있다. 일부 검색 엔진에서는 검색어가 포함된 검색 결과 페이지뿐만 아니라 검색 결과 수도 함께 제공하고 있다. 구글 검색엔진에서 제공하는 검색 결과 수는 인터넷에서 해당 검색어에 대한 전체적인 추세를 파악하는데 활용될 수 있다. 본 논문에서는 구글 검색엔진에서 제공하는 검색결과 수를 효과적으로 관리할 수 있는 구글 검색엔진을 활용한 키워드 검색결과 수 관리 시스템을 설계하고 구현하고자 한다. 제안하는 시스템은 웹으로 작동하며 검색 에이전트, 저장 노드, 검색 노드로 구성되어 키워드 및 검색 결과 수를 관리하고 검색을 수행한다. 최종 검색 결과로는 검색 키워드, 검색 결과 수, 검색 결과 수를 활용하여 두 키워드의 거리를 계산하는 NGD(Normalized Google Distance)가 제공된다.

링크내역을 이용한 페이지점수법 알고리즘 (PageRank Algorithm Using Link Context)

  • 이우기;신광섭;강석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.708-714
    • /
    • 2006
  • 웹은 정보의 저장 및 검색에 있어서 보편적인 매체가 되고 있다. 웹에서 정보 검색은 검색엔진을 출발점으로 이용하는 것이 대부분이지만, 그 결과는 사용자의 요구와 늘 일치하는 것은 아니며 때로는 의도적으로 조작된 검색 결과가 제시되기도 한다. 검색엔진의 데이타를 의도적으로 조작하는 것을 스패밍(spamming)이라고 부르며, 다양한 스패밍과 방지기술이 있지만, 최근에 각광을 받고있는 링크기반 검색 방식에는 스패밍이 쉽지 않은 것으로 알려져 있다. 그러나 이러한 방식에서도 구글폭탄(Google Bombing)과 같이 페이지점수법(PageRank)을 조작할 수 있는 약점이 있다. 본 논문에서는 이러한 약점을 방지할 수 있는 알고리즘을 제시한다. 기본적으로 링크 기반 검색 방식을 기초로 하여 웹을 하나의 유향 레이블 그래프로 인식하여 각 웹 페이지들은 하나의 노드로, 하이퍼링크는 에지로 표현함에 있어서 본 연구에서는 링크구조를 기반으로 링크내역(link context)을 부여하고 이를 에지의 레이블로 사용한다. 링크내역과 대상 페이지 사이의 유사도를 구하고, 이것을 이용하여 페이지점수법의 인접행렬을 재구성하는 방법을 취했다. 결과로써 기존의 방법 및 특이값 추출기법(SVD)에 기반한 새로운 기준을 도입해 그 효과를 입증했다.

웹 문서상의 공간 텍스트 위치 맵핑과 질의 기법 (Techniques for Location Mapping and Querying of Geo-Texts in Web Documents)

  • 하태석;남광우
    • 한국산업정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.1-10
    • /
    • 2022
  • 웹 기술의 발전과 함께 대량의 웹 문서들이 생산되고 있다. 이 웹 문서에는 다양한 공간적 텍스트들을 포함하고 있으며, 이 텍스트들을 공간정보로 변환함으로서 공간질의로 텍스트 문서를 검색할 수 있는 기반이 된다. 이러한 공간 텍스트들에는 행정지명이나 관심 지역(POI)이름 뿐만이 아니라 우편번호나 지역 전화번호 등까지 폭넓은 영역으로 구성되어 있다. 이 논문은 웹 문서내 내에 존재하는 공간 텍스트 정보를 기반으로 위치를 맵핑 할 수 있는 알고리즘들을 제시하고 있다. 이 알고리즘들을 통해 웹 문서들을 일반 웹 단어 기반 문서 검색 뿐만 아니라, 지도상에서 공간 영역과 텍스트의 복합형태로 해당 지역을 설명하는 문서들을 검색할 수 있게 된다. 마지막으로 이 논문에서는 제안된 알고리즘들을 이용하여 웹 공간 텍스트 질의 시스템을 구현함으로써 유용함을 보였다.

Multi Parameter Design in AIML Framework for Balinese Calendar Knowledge Access

  • Sukarsa, I Made;Buana, Putu Wira;Yogantara, Urip
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권1호
    • /
    • pp.114-130
    • /
    • 2020
  • Balinese calendar is defined as a unique calendar system for combining solar-based and lunar-based system and assuming local system. It is considered as guidance of Balinese societies' activities management, starting from meeting arrangement, wedding ceremony, to religious ceremonies. Practically, it has developed in the form of printed Balinese calendar and electronic Balinese calendar, either web or mobile application. The core of the function is to find out the day with its various characteristics in the Balinese Calendar. In general, society usually asks the religious leader to find out the day in detail. The technology of NLP combined with models of pattern discoveries supports the arrangement of the interaction model in searching the good day in Balinese Calendar to equip the conventional searching system in the previous applications. This study will design a dialog model with AIML method in multi-parameter basis; therefore, the users will be dynamically able to use the searching content in various ways by chatting in similar with consulting to a religious leader. This model will be applied in a chatbot basis service in telegram machine. The addition of the context recognition section into 4 paterns has been successfully improve the ability of AIML to recognize input patterns with many criteria. Based on the testing with 50 random input patterns obtained a success rate of 92.5%.

게임 소프트웨어 재미요소의 체계적인 분류와 탐색방법 (The Method for Systematic Classification and Searching of the Game Software Fun Element)

  • 이승훈;김세규;류성열
    • 한국멀티미디어학회논문지
    • /
    • 제13권10호
    • /
    • pp.1506-1513
    • /
    • 2010
  • 게임 소프트웨어는 재미의 요소를 기반으로 한 고부가가치 산업이다. 성공적인 게임 소프트웨어 개발을 위해서는 재미에 대한 체계적인 분류와 탐색방법이 필요하다. 그러나 아직까지 '재미'에 대한 각기 다른 관점과 정의로 인하여 게임에서의 '재미'는 게임 기획자의 '경험'에 의해 단정지어지고 있으며 개발계획에서 어떤 재미요소가 고려되어야 하는지에 대한 모호함을 지니고 있다. 본 연구에서는 체계적인 분류를 위해 기존 문헌에서 발췌한 50개의 재미요소를 통계적 기법으로 분류 및 체계화하여 9개의 그룹 34개의 재미요소로 구조화하였다 이를 로제카이와의 놀이론을 적용하여 누락된 영역을 탐색하고, 탐색된 영역의 새로운 재미요소를 관련 웹 사이트에서 추출하여 1개 그룹 4개의 재미요소를 탐색하였다.

A Study on Facility Information System using GIS and Semantic Web in Underground Space

  • Cui, Yulan;Hwang, Hyun-Suk;Kim, Chang-Soo
    • 한국멀티미디어학회논문지
    • /
    • 제13권12호
    • /
    • pp.1843-1854
    • /
    • 2010
  • The utilization of underground space has recently increased with the complication of road, the rise of the land price, and the development of green technology. Underground space ranges from classical excavations to subway, underground cities, and shopping malls where there are crowds of people. At this time, government has spent a lot of money in installing various types of safety facilities for preparations of increasing potential disasters. Therefore, an effective facility management system is required. In this paper, we propose an information retrieval process to effectively extract the facilities' information based on the ontology and spatial analysis in underground space. The ontology-based searching supports hierarchical and associated results as well as knowledge sharing with hierarchy concepts. The spatial analysis based searching has "Buffer" and "Near" functions to operate on a map without understanding any property of the facility information.

문서 길이 정규화를 이용한 문서 요약 자동화 시스템 구현 (Implementation of Text Summarize Automation Using Document Length Normalization)

  • 이재훈;김영천;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 추계학술대회 학술발표 논문집
    • /
    • pp.51-55
    • /
    • 2001
  • With the rapid growth of the World Wide Web and electronic information services, information is becoming available on-Line at an incredible rate. One result is the oft-decried information overload. No one has time to read everything, yet we often have to make critical decisions based on what we are able to assimilate. The technology of automatic text summarization is becoming indispensable for dealing with this problem. Text summarization is the process of distilling the most important information from a source to produce an abridged version for a particular user or task. Information retrieval(IR) is the task of searching a set of documents for some query-relevant documents. On the other hand, text summarization is considered to be the task of searching a document, a set of sentences, for some topic-relevant sentences. In this paper, we show that document information, that is more reliable and suitable for query, using document length normalization of which is gained through information retrieval . Experimental results of this system in newspaper articles show that document length normalization method superior to other methods use query itself.

  • PDF

The Human Brain and Information Science: Lessons from Popular Neuroscience

  • Sturges, Paul
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제3권1호
    • /
    • pp.19-29
    • /
    • 2013
  • Insights from the recent wealth of popular books on neuroscience are offered to suggest a strengthening of theory in information science. Information theory has traditionally neglected the human dimension in favour of 'scientific' theory often derived from the Shannon-Weaver model. Neuroscientists argue in excitingly fresh ways from the evidence of case studies, non-intrusive experimentation and the measurements that can be obtained from technologies that include electroencephalography, positron emission tomography (PET), functional magnetic resonance imaging (fMRI), and magnetoencephalography (MEG). The way in which the findings of neuroscience intersect with ideas such as those of Kahneman on fast and slow thinking and Csikszentmihalyi on flow, is tentatively explored as lines of connection with information science. It is argued that the beginnings of a theoretical underpinning for current web-based information searching in relation to established information retrieval methods can be drawn from this.

교육학 분야 주제전문가와 탐색전문가의 인터넷 검색엔진을 사용한 정보 탐색 행태 비교연구 (A Comparative Study about Information Searching Behaviors of Educational Researchers Using Web Search Engines -Subject Specialists vs information specialists)

  • 이명희
    • 한국문헌정보학회지
    • /
    • 제32권3호
    • /
    • pp.5-22
    • /
    • 1998
  • 본 연구는 인터넷을 사용하는 교육학 분야 연구자들을 주제전문가인 최종이용자와 탐색전문가 그룹으로 나누어 이들의 검색엔진을 사용한 정보탐색 행태가 어떻게 다른지를 비교하였다. 탐색과정과 탐색결과에서 밝혀진 결과는 아래와 같다. 탐색과정에서 사용된 탐색어 수와 연산자 수는 주제전문가가 탐색전문가 보다 약간 많았으며 탐색시간도 길었다. 그러나 탐색결과 주제전문가보다 탐색전문가에 의해 검색된 문헌에서 적합문헌수가 더욱 많았으며 정확률도 더욱 높은 것으로 밝혀졌다.

  • PDF

그래프마이닝을 활용한 빈발 패턴 탐색에 관한 연구 (A Methodology for Searching Frequent Pattern Using Graph-Mining Technique)

  • 홍준석
    • Journal of Information Technology Applications and Management
    • /
    • 제26권1호
    • /
    • pp.65-75
    • /
    • 2019
  • As the use of semantic web based on XML increases in the field of data management, a lot of studies to extract useful information from the data stored in ontology have been tried based on association rule mining. Ontology data is advantageous in that data can be freely expressed because it has a flexible and scalable structure unlike a conventional database having a predefined structure. On the contrary, it is difficult to find frequent patterns in a uniformized analysis method. The goal of this study is to provide a basis for extracting useful knowledge from ontology by searching for frequently occurring subgraph patterns by applying transaction-based graph mining techniques to ontology schema graph data and instance graph data constituting ontology. In order to overcome the structural limitations of the existing ontology mining, the frequent pattern search methodology in this study uses the methodology used in graph mining to apply the frequent pattern in the graph data structure to the ontology by applying iterative node chunking method. Our suggested methodology will play an important role in knowledge extraction.