• 제목/요약/키워드: online information search

검색결과 494건 처리시간 0.027초

온라인 열람목록의 주제탐색 강화를 위한 실험적 연구 (An experiment to enhance subject access in korean online public access catalog)

  • 장혜란;홍지윤
    • 한국도서관정보학회지
    • /
    • 제25권
    • /
    • pp.83-107
    • /
    • 1996
  • The purpose of this study is to experiment online public access catalog enhancements to improve its subject access capability. Three catalog databases, enhanced with title keywords, controlled vocabulary, and content words with controlled vocabulary respectively, were implemented. 18 searchers performed 2 subject searshes against 3 different catalog databases. And the transaction logs are analyzed. The results of the study can be summarized as follows : Controlled vocabulary catalog database achieved 41.8% recall ratio in average ; the addition of table of contents words to the controlled vocabulary is an effective technique with increasing recall ration upto 55% without decreasing precision ; and the database enhanced with title keywords shows 31.7% recall ratio in average. Of the three kinds of catalog databases, only the catalog with contents words produced 2 unique relevant documents. The results indicate that both user training and system development is required to have better search performance in online public access catalog.

  • PDF

Purchase Prediction by Analyzing Users' Online Behaviors Using Machine Learning and Information Theory Approaches

  • Kim, Minsung;Im, Il;Han, Sangman
    • Asia pacific journal of information systems
    • /
    • 제26권1호
    • /
    • pp.66-79
    • /
    • 2016
  • The availability of detailed data on customers' online behaviors and advances in big data analysis techniques enable us to predict consumer behaviors. In the past, researchers have built purchase prediction models by analyzing clickstream data; however, these clickstream-based prediction models have had several limitations. In this study, we propose a new method for purchase prediction that combines information theory with machine learning techniques. Clickstreams from 5,000 panel members and data on their purchases of electronics, fashion, and cosmetics products were analyzed. Clickstreams were summarized using the 'entropy' concept from information theory, while 'random forests' method was applied to build prediction models. The results show that prediction accuracy of this new method ranges from 0.56 to 0.83, which is a significant improvement over values for clickstream-based prediction models presented in the past. The results indicate further that consumers' information search behaviors differ significantly across product categories.

구글 북서치와 도서관 자료 디지털화의 법률문제 (Some Legal Arguments on the Google Book Search and Library Information Digitization)

  • 김윤명
    • 정보관리연구
    • /
    • 제41권2호
    • /
    • pp.133-159
    • /
    • 2010
  • 도서관에 소장된 도서는 고도의 정제된 정보라고 할 수 있으며, 정보 이상의 지식의 보고이기도 하다. 구글은 북서치를 통해 도서관에 소장되어 있는 정제된 지식의 디지털화에 투자하고 있다. 다만 도서의 디지털화는 다양한 이해관계가 맞물려 있어 저작권 관련 집단소송 등 여러 가지 문제가 제기되고 있으며 다양한 비판적 논의가 진행 중에 있다. 우리나라는 디지털화가 국책사업으로 추진된 바 있어, 도서관에 소장된 많은 도서들이 디지털화 되어 있다. 물론 디지털화의 대상은 출판사에서 출간된 책자로 한정되어 있다는 점에서 구글보다 앞서있다고 할 수 있다. 이를 위해 도서관법이 정비되기도 하였으나 서비스 주체가 도서관으로 한정된다는 점에서 구글의 경우와는 다르다. 즉 도서관법은 온라인 자료의 수집을 도서관이 할 수 있도록 하고 있는 점에서 선행적인 입법이라고 하겠다. 그렇지만 온라인 자료를 인터넷을 통하여 누구나 이용할 수 있는 것은 아니기 때문에 구글과는 달리 서비스할 수 있는 수단이나 범위는 제한적이다. 본 논문은 구글의 북서치를 통해 도서관에 소장된 도서의 디지털화에 따른 저작권법적 문제에 대해 살펴보며, 이에 대한 바람직한 해결방안을 찾고자 한다. 도서관이 물리적인 도서의 보관이 주된 역할이라면, 앞으로는 도서의 이용이라는 측면에서의 도서관 정책을 고려할 필요가 있겠다. 이러한 정책적 고려를 위해 우리나라의 저작권법상 구글의 북서치는 어떠한 관련이 있는 지를 살펴보며, 가능한 방안으로써 공정이용 규정 및 디지털 납본제도의 도입에 대해 살펴본다.

개인화된 구직정보서비스 제공에 관한 사례연구 : 월드잡플러스의 스플렁크 활용을 중심으로 (A Case Study on the Personalized Online Recruitment Services : Focusing on Worldjob+'s Use of Splunk)

  • 이문기;이재덕;박성택
    • 한국융합학회논문지
    • /
    • 제9권2호
    • /
    • pp.241-250
    • /
    • 2018
  • 온라인구직서비스는 가장 인기 있는 인터넷서비스 중의 하나이다. 구직자들에게 신규채용기업에 대한 정보와 함께 필요한 자료를 찾을 수 있는 검색엔진도 제공하기 때문이다. 그러나 대부분의 온라인구직사이트는 전통적인 수요자 풀 유형의 접근방식을 채택하고 있어 많은 경우 엉뚱한 검색결과를 도출하기도 한다. 한국산업진흥공단이 운영하는 월드잡플러스는 이러 문제를 해소하기 위해 머신 데이터 분석플렛폼인 스플렁크를 활용하여 보다 능동적이고 개인화된 서비스를 제공하고자 시도하고 있다. 월드잡플러스는 개인화된 매칭 기법을 이용하여 각각의 구직공고에 최적인 구직자 프로필이나 스펙정보를 제공하며, 구직자 선호도를 반영한 최적 맞춤형 구인공고 제공서비스 등을 제공하고 있다. 이런 분석기법은 기존의 구직에 성공한 유사 구직자 정보와 구인기업 자료 간의 유사성 등을 토대로 하는 추천방식이다. 결론으로 본 연구의 시사점과 제공서비스의 정책적 효과에 대해 논의하였다.

상품 범주별 온라인 구매도 -인터넷 동기와 온라인 구매성향 기능- (Online Purchase Intentions for Product Categories -The Functions of Internet Motivations and Online Buying Tendencies-)

  • 김은영
    • 한국의류학회지
    • /
    • 제32권6호
    • /
    • pp.890-901
    • /
    • 2008
  • 본 연구는 소비자의 인터넷 사용동기, 온라인 구매성향과 제품구매의도 사이의 관계를 밝힘으로써 온라인 상품 범주화의 기초 개념을 밝히고자 하였다. 조사대상은 미국 남서부 지역에 거주하는 대학생 총 217명으로 구성되었으며, 자료분석을 위해 요인분석과 경로모델을 추정하였다. 분석결과, 소비자의 인터넷 동기는 기분전환, 경제적, 정보적, 사회적 동기의 4개 요인으로 분류되었다. 또한 온라인 제품은 구매의도에 따라 감각상품, 인지상품과 탐색상품의 3개 범주로 분류되었다. 경로모델의 추정결과, 인터넷 사용의 기분전환과 경제적 동기요인이 충동구매성향에 영향을 주는 반면, 경제적, 정보적, 사회적 동기요인은 계획구매성향에 영향을 주는 것으로 나타났다. 온라인 구매의도에 있어서, 감각상품은 충동구매성향과 더 높은 관계를 나타낸 반면, 인지상품과 탐색상품은 계획구매성향과 더 높은 관계를 나타냈다. 또한, 인지상품은 경제적 동기에 근거한 계획구매성향에 의해 더 강한 효과를 보였으며, 탐색상품은 정보적 동기에 의한 계획구매성향에 의해 더 강한 효과를 나타났다. 따라서 본 연구는 특정 상품 범주에 따른 이론적 정립과적절한I-마케팅 전략의 관리적 측면이 논의되었다.

검색 질의 확장을 위한 인기도 기반 단어 가중치 측정 (A Term Weight Mensuration based on Popularity for Search Query Expansion)

  • 이정훈;전서현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권8호
    • /
    • pp.620-628
    • /
    • 2010
  • 인터넷의 활용이 보편화 됨에 따라 사람들이 많은 정보를 웹을 통해 접할 수 있게 되었다. 정보의 양이 급격히 늘어나면서 검색 엔진은 사용자가 필요로 하지 않는 정보까지 보여주는 검색 성능의 한계를 가져왔다. 따라서 사용자는 원하는 정보를 검색하기 위해 과거보다 더 많은 시간과 노력이 필요하게 되었다. 이 연구에서는 질의 확장을 이용하여 사용자가 필요로 하는 정확한 정보를 신속하게 찾아서 제공할 수 있는 방법을 제안한다. 제안된 단어 가중치 평가방법은 검색 주제의 변동 없이 하나의 검색 주제를 검색할 경우 TF-IDF 또는 단순 인기도 측정법 보다 우수한 성능을 보인다. 또한 검색 중 주제를 변경하였을 때에도 검색 주제 변경 전과 유사한 성능으로 기존의 측정법 보다 빠르게 새로운 주제와 관련된 단어를 추출하고 정확한 가중치를 측정한다.

온라인 목록 검색 행태에 관한 연구-LINNET 시스템의 Transaction log 분석을 중심으로-

  • 윤구호;심병규
    • 한국도서관정보학회지
    • /
    • 제21권
    • /
    • pp.253-289
    • /
    • 1994
  • The purpose of this study is about the search pattern of LINNET (Library Information Network System) OPAC users by transaction log, maintained by POSTECH(Pohang University of Science and Technology) Central Library, to provide feedback information of OPAC system design. The results of this study are as follows. First, for the period of this analysis, there were totally 11, 218 log-ins, 40, 627 transaction logs and 3.62 retrievals per a log-in. Title keyword was the most frequently used, but accession number, bibliographic control number or call number was very infrequently used. Second, 47.02% of OPAC, searches resulted in zero retrievals. Bibliographic control number was the least successful search. User displayed 2.01% full information and 64.27% local information per full information. Third, special or advanced retrieval features are very infrequently used. Only 22.67% of the searches used right truncation and 0.71% used the qualifier. Only 1 boolean operator was used in every 22 retrievals. The most frequently used operator is 'and (&)' with title keywords. But 'bibliographical control number (N) and accessionnumber (R) are not used at all with any operators. The causes of search failure are as follows. 1. The item was not used in the database. (15, 764 times : 79.42%). 2. The wrong search key was used. (3, 761 times : 18.95%) 3. The senseless string (garbage) was entered. (324 times : 1.63%) On the basis of these results, some recommendations are suggested to improve the search success rate as follows. First, a n.0, ppropriate user education and online help function let users retrieve LINNET OPAC more efficiently. Second, several corrections of retrieval software will decrease the search failure rate. Third, system offers right truncation by default to every search term. This methods will increase success rate but should considered carefully. By a n.0, pplying this method, the number of hit can be overnumbered, and system overhead can be occurred. Fourth, system offers special boolean operator by default to every keyword retrieval when user enters more than two words at a time. Fifth, system assists searchers to overcome the wrong typing of selecting key by automatic korean/english mode change.

  • PDF

빅데이터 전처리 기반의 실시간 사용자 선호 데이터 추천을 위한 개선된 스카이라인 질의 기법 (An Improved Skyline Query Scheme for Recommending Real-Time User Preference Data Based on Big Data Preprocessing)

  • 김지현;김종완
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권5호
    • /
    • pp.189-196
    • /
    • 2022
  • 스카이라인 질의(Skyline Query)는 객체의 다중 속성을 기준으로 사용자 선호에 적합한 대상을 탐색하는 기법이다. 기존 스카이라인 질의는 탐색 결과를 일괄처리(batch processing)로 반환하지만, 대화형 앱이나 모바일 환경의 등장으로 실시간 탐색 결과의 필요성이 증가하였다. 스카이라인을 위한 온라인 알고리즘(online algorithm)은 객체의 반환 속도를 향상해 실시간으로 선호 객체를 제공한다. 하지만 객체 탐색 과정에서 기존에 탐색한 영역을 재방문하여 반복 비교하는 불필요한 연산 시간이 소요된다. 본 논문은 온라인 알고리즘에서 불필요한 탐색 시간을 제거하여 스카이라인 질의 결과를 실시간으로 제공하기 위한 스카이라인 온라인 전처리 알고리즘을 제안한다. 제안 기법은 기존의 온라인 알고리즘에서 전처리를 수행함으로써 반복적으로 재탐색 되는 영역을 미리 제거하여 탐색 성능을 향상하였다. 실험 결과, 기존 온라인 알고리즘과 비교 시 이산 데이터 집합의 표준 분포, 편향 분포, 양의 상관 및 음의 상관분포에서 향상된 성능을 보였다. 제안 기법은 비교 대상을 최소화하여 탐색 성능을 향상하므로 모바일 장치의 사용이 증가하는 현실에서 사용자들에게 신속한 서비스를 제공할 수 있는 새로운 기준이 될 것이다.

Analysis of Some Online Questions with High Frequency about Dental Treatment in Korea

  • Kang, A-Reum;Go, Ye-Eun;Kim, Ka-Eun;Kim, Min-Joo;Kim, Seon-Jeong;Hwang, SooJeong
    • 치위생과학회지
    • /
    • 제19권3호
    • /
    • pp.190-197
    • /
    • 2019
  • Background: The Internet has advantages in terms of accessibility and amount of information, and the search for health information over the Internet is increasing exponentially. The purpose of this study is to analyze the information generated about some dental treatment on the internet by year. Methods: Naver Knowledge (JisikIn in Korean) which is an interactive search service was selected as the first search site in Korea. Scaling, wisdom tooth extraction, and endodontic treatment that can be paid by Korean health insurance were selected. Finally, 4,729 questions about scaling, 23,963 wisdom teeth extraction questions and 17,733 endodontic treatment questions were extracted. The question contents, the information about the questioner and the answerer, and an error of answers were investigated. Frequency analysis was used and chi-square test was used if necessary. Results: The most frequently asked questions were discomfort and dissatisfaction after the treatment. The need for treatment was the second in questions of the wisdom tooth extraction and endodontic treatment, but the health insurance benefit was the second in dental scaling. Most of the questioners didn't disclose personal information. The public answered the most in 2013~2014, but the highest percentage of the respondents was experts in 2017. Responses were mostly personal experience, but showed a tendency to decrease with years, and professional knowledge showed an increasing tendency. The error of the answer has also gradually decreased. Conclusion: Questions about dental care over the Internet are increasing exponentially, experts are responding increasingly, and errors in answers are decreasing. Nevertheless, it is necessary to pay attention to the related expert group to prevent misinformation.

온라인 주식 포럼의 핫토픽 탐지를 위한 감성분석 모형의 개발 (Development of Sentiment Analysis Model for the hot topic detection of online stock forums)

  • 홍태호;이태원;리징징
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.187-204
    • /
    • 2016
  • 소셜 미디어를 이용하는 사용자들이 직접 작성한 의견 혹은 리뷰를 이용하여 상호간의 교류 및 정보를 공유하게 되었다. 이를 통해 고객리뷰를 이용하는 오피니언마이닝, 웹마이닝 및 감성분석 등 다양한 연구분야에서의 연구가 진행되기 시작하였다. 특히, 감성분석은 어떠한 토픽(주제)를 기준으로 직접적으로 글을 작성한 사람들의 태도, 입장 및 감성을 알아내는데 목적을 두고 있다. 고객의 의견을 내포하고 있는 정보 혹은 데이터는 감성분석을 위한 핵심 데이터가 되기 때문에 토픽을 통한 고객들의 의견을 분석하는데 효율적이며, 기업에서는 소비자들의 니즈에 맞는 마케팅 혹은 투자자들의 시장동향에 따른 많은 투자가 이루어지고 있다. 본 연구에서는 중국의 온라인 시나 주식 포럼에서 사용자들이 직접 작성한 포스팅(글)을 이용하여 기존에 제시된 토픽들로부터 핫토픽을 선정하고 탐지하고자 한다. 기존에 사용된 감성 사전을 활용하여 토픽들에 대한 감성값과 극성을 분류하고, 군집분석을 통해 핫토픽을 선정하였다. 핫토픽을 선정하기 위해 k-means 알고리즘을 이용하였으며, 추가로 인공지능기법인 SOM을 적용하여 핫토픽 선정하는 절차를 제시하였다. 또한, 로짓, 의사결정나무, SVM 등의 데이터마이닝 기법을 이용하여 핫토픽 사전 탐지를 하는 감성분석을 위한 모형을 개발하여 관심지수를 통해 선정된 핫토픽과 탐지된 핫토픽을 비교하였다. 본 연구를 통해 핫토픽에 대한 정보 제공함으로써 최신 동향에 대한 흐름을 알 수 있게 되고, 주식 포럼에 대한 핫토픽은 주식 시장에서의 투자자들에게 유용한 정보를 제공하게 될 뿐만 아니라 소비자들의 니즈를 충족시킬 수 있을 것이라 기대된다.