• 제목/요약/키워드: Web Log Analysis

검색결과 160건 처리시간 0.025초

웹 사용성 개선에 관한 연구 - 국가과학기술정보시스템을 중심으로 - (Usability of the National Science and Technology Information System)

  • 박민수;현미환
    • 한국비블리아학회지
    • /
    • 제22권4호
    • /
    • pp.5-19
    • /
    • 2011
  • 본 연구의 목적은 과학기술정보사이트의 이용자 사용성 평가를 통해 시스템 개선사항을 도출하고 이를 시스템 운영 및 개발 과정에 반영시킴으로써 현 사이트에 대한 사용성 개선에 있다. 총 16명의 이용자에 대한 사용성 데이터를 수집하였다. 검색로그, 인터뷰, 씽크 어라우드 등 다수의 데이터 수집 테크닉들을 적용하였으며 연구자와 이용자 1:1 방식으로 이루어진 사용성 실험은 정해진 테스트 프로토콜에 의거하여 이루어졌다. 수집한 데이터는 정량적, 정성적 방법을 통하여 분석하였다. 검색로그 데이터는 효과성, 효율성, 만족도, 오류 등의 항목을 사용성평가 측정 기준에 따라 정량적으로 수치화한 후, 기술적 통계 분석을 하였다. 씽크 어라우드와 사후 인터뷰로부터 수집한 구두 데이터는 텍스트화한 후 정성적인 분석을 통해 개선시사점을 도출하였다. 시스템 개선 전과 후에 대한 사용성 수준을 비교해 보면 효과성이 15점 증가, 효율성이 35초 단축, 만족도가 5점 상승, 오류횟수가 1.1회 감소하는 등 시스템에 대한 사용성이 전반적으로 향상하였음을 알 수 있다.

웹 정보 검색 이력을 이용한 사용자 의도 자동 추출 (Automatic Extract User Intention from Web Search Log)

  • 박기남;정순영;서태원;지혜성;이태민;임희석
    • 컴퓨터교육학회논문지
    • /
    • 제12권6호
    • /
    • pp.21-32
    • /
    • 2009
  • 본 논문은 사용자가 정보 욕구를 정확하게 질의어로 입력하고, 원하는 정보가 검색될 수 있도록 지원하기 위한 사용자 의도 자동추출과 이를 이용한 인텐션 맵 구축 방법을 제안한다. 제안하는 방법은 동일한 검색어를 입력한 사용자들의 검색 이력 데이터를 이용하여 사용자 의도 자질을 선정하고, 클러스터링 알고리즘과 사용자 의도 추출 알고리즘을 이용하여 사용자 의도를 추출하였다. 추출된 사용자 의도는 지식표상 이론에 근거한 인텐션 맵으로 표현하였다. 제안한 인텐션 맵의 효용성 분석을 위하여 현재 국내 상용 검색엔진에서 제공받은 2,600개의 사용자 검색 이력 데이터를 이용하였다. 실험결과 인텐션 맵을 이용한 정보검색이 일반 검색엔진을 이용 할 때 보다 통계적으로 유의미한 만족도를 나타내었다.

  • PDF

다기종 수상함 전투체계의 통합 진단 플랫폼 설계 (Designing Integrated Diagnosis Platform for Heterogeneous Combat System of Surface Vessels)

  • 김명훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.186-188
    • /
    • 2021
  • 본 아키텍처(IDPS)는 현 해군 수상함 전투체계의 함정별 소프트웨어 진단 도구를 통합하여 진단 방식의 일관성과 효율성, 진단 소요 시간의 감소를 달성하기 위한 웹기반의 플랫폼을 구축하는 구조적 방법이다. 함형 별 구분된 독립적인 진단 방식으로 인하여 수명주기지원(LTS) 시 인력 운용 측면의 비효율성과 진단자의 숙련도 등에 따른 진단 품질의 차이가 발생하기 때문에, 함정 SW 상태를 진단하는 방식을 함형에 구분없이 일원화하고 진단자에 따른 진단 결과의 편향과 오차가 발생하지 않도록 진단데이터를 플랫폼에 내재된 상태결정알고리즘(SDA)에 의해 판정하도록 지능화하였다. 장기적으로 수상함 전투체계 소프트웨어의 진단에 있어 진단 품질의 하락없는 사람 개입이 최소화된 지능화된 시스템 구축을 추구하며, 이를 통해 진단 소요 시간을 단축하고 진단 결과의 활용에 더 많은 자원을 투입할 수 있을 것으로 기대된다.

  • PDF

빅데이터 기반 추천시스템 구현을 위한 다중 프로파일 앙상블 기법 (A Multimodal Profile Ensemble Approach to Development of Recommender Systems Using Big Data)

  • 김민정;조윤호
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.93-110
    • /
    • 2015
  • 기존의 협업필터링 추천시스템 연구는 상품에 대한 고객의 평점(rating)이나 구매 여부 데이터로부터 하나의 프로파일을 생성하고 이를 기반으로 추천 성능을 향상시킬 수 있는 새로운 알고리즘을 개발하는 위주로 진행되어 왔다. 그러나 빅데이터 환경이 도래하면서 기업이 수집할 수 있는 고객 데이터가 풍부해지고 다양해짐에 따라, 보다 정확하게 고객의 선호도나 행태를 파악하는 것이 가능하게 되었고 이러한 데이터, 즉 퍼스널 빅데이터(personal big data)를 추천시스템에 활용하는 연구의 필요성이 대두되고 있다. 본 연구에서는 마케팅의 시장세분화 이론에 근거하여 퍼스널 빅데이터로부터 고객의 선호도나 행태를 다양한 관점에서 표현할 수 있는 5종의 다중 프로파일(multimodal profile)을 개발하고, 이를 활용하여 협업필터링 추천시스템의 성능을 개선하고자 한다. 제안하는 5종의 다중 프로파일은 프로파일 통합 유사도, 개별 프로파일 유사도 평균, 개별 프로파일 유사도 가중 평균이라는 세 가지 앙상블 기법을 통해 협업필터링의 이웃(neighborhood) 탐색과정에 적용된다. 실제 퍼스널 빅데이터에 본 연구에서 제안하는 방법론을 적용한 결과, 단일 프로파일을 사용하는 협업필터링 알고리즘보다 추천 성능이 상당히 개선되었으며 앙상블 방법 중에서는 개별 프로파일 유사도 가중 평균 기법이 가장 높은 추천 성능을 보여주었다. 본 연구는 빅데이터 환경에서 추천시스템을 개발하고자 할 때, 어떠한 성격의 데이터로부터 고객의 특성을 규명하는 프로파일을 만들고 이를 어떻게 결합하여 사용하는 것이 효과적인 지 처음으로 제안하였다는 점에서 그 의의가 있다.

사이트 포트폴리오 구성을 위한 사용자 관점의 웹사이트 클러스터링 (User Perspective Website Clustering for Site Portfolio Construction)

  • 김민규;김남규
    • 인터넷정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.59-69
    • /
    • 2015
  • 많은 사용자들이 인터넷을 통해 정보검색, 쇼핑, 커뮤니티 참여 등의 일상 생활을 영위하고 있으며, 이들 인터넷 사용자들로부터 수익을 창출하기 위한 웹사이트들의 경쟁은 점점 치열해지고 있다. 각 사이트의 운영자 및 마케팅 담당자들은 경쟁 우위를 차지하기 위해 다양한 전략을 수립하고 있으며, 이 과정에서 타 사이트와의 제휴가 이루어지는 경우도 비일비재하다. 이는 타 사이트와의 제휴를 통해 타사의 고객 정보를 부분적으로 공유할 수 있을 뿐 아니라 포인트 공유, 상호 추천 등 보다 다양한 전략의 운용이 가능하기 때문이다. 제휴를 통해 긍정적인 성과를 거두기 위해서는 현재 자사의 고객은 아니지만 미래의 자사 고객이 될 수 있는 잠재 고객을 다수 확보하고 있는 타 사이트를 제휴 대상으로 선정하는 것이 매우 중요하다. 하지만 많은 사이트 중 이와 같이 자사에 도움이 되는 제휴 대상 사이트를 식별하는 것은 쉬운 일이 아니다. 따라서 본 논문에서는 방문 고객의 유사성 관점에서 사이트 클러스터링을 수행하고, 이에 근거하여 유사 고객군을 공유하고 있는 제휴 사이트 대상을 식별할 수 있는 방안을 제시한다. 또한 제안 방법론의 실무적용 가능성을 평가하기 위해, 웹사이트 150,295개에 대한 패널 5,000명의 실제 방문 기록 약 1억 4천만 건에 대해 실험을 수행하고 그 결과를 제시한다.

기업의 SNS 노출과 주식 수익률간의 관계 분석 (The Analysis on the Relationship between Firms' Exposures to SNS and Stock Prices in Korea)

  • 김태환;정우진;이상용
    • Asia pacific journal of information systems
    • /
    • 제24권2호
    • /
    • pp.233-253
    • /
    • 2014
  • Can the stock market really be predicted? Stock market prediction has attracted much attention from many fields including business, economics, statistics, and mathematics. Early research on stock market prediction was based on random walk theory (RWT) and the efficient market hypothesis (EMH). According to the EMH, stock market are largely driven by new information rather than present and past prices. Since it is unpredictable, stock market will follow a random walk. Even though these theories, Schumaker [2010] asserted that people keep trying to predict the stock market by using artificial intelligence, statistical estimates, and mathematical models. Mathematical approaches include Percolation Methods, Log-Periodic Oscillations and Wavelet Transforms to model future prices. Examples of artificial intelligence approaches that deals with optimization and machine learning are Genetic Algorithms, Support Vector Machines (SVM) and Neural Networks. Statistical approaches typically predicts the future by using past stock market data. Recently, financial engineers have started to predict the stock prices movement pattern by using the SNS data. SNS is the place where peoples opinions and ideas are freely flow and affect others' beliefs on certain things. Through word-of-mouth in SNS, people share product usage experiences, subjective feelings, and commonly accompanying sentiment or mood with others. An increasing number of empirical analyses of sentiment and mood are based on textual collections of public user generated data on the web. The Opinion mining is one domain of the data mining fields extracting public opinions exposed in SNS by utilizing data mining. There have been many studies on the issues of opinion mining from Web sources such as product reviews, forum posts and blogs. In relation to this literatures, we are trying to understand the effects of SNS exposures of firms on stock prices in Korea. Similarly to Bollen et al. [2011], we empirically analyze the impact of SNS exposures on stock return rates. We use Social Metrics by Daum Soft, an SNS big data analysis company in Korea. Social Metrics provides trends and public opinions in Twitter and blogs by using natural language process and analysis tools. It collects the sentences circulated in the Twitter in real time, and breaks down these sentences into the word units and then extracts keywords. In this study, we classify firms' exposures in SNS into two groups: positive and negative. To test the correlation and causation relationship between SNS exposures and stock price returns, we first collect 252 firms' stock prices and KRX100 index in the Korea Stock Exchange (KRX) from May 25, 2012 to September 1, 2012. We also gather the public attitudes (positive, negative) about these firms from Social Metrics over the same period of time. We conduct regression analysis between stock prices and the number of SNS exposures. Having checked the correlation between the two variables, we perform Granger causality test to see the causation direction between the two variables. The research result is that the number of total SNS exposures is positively related with stock market returns. The number of positive mentions of has also positive relationship with stock market returns. Contrarily, the number of negative mentions has negative relationship with stock market returns, but this relationship is statistically not significant. This means that the impact of positive mentions is statistically bigger than the impact of negative mentions. We also investigate whether the impacts are moderated by industry type and firm's size. We find that the SNS exposures impacts are bigger for IT firms than for non-IT firms, and bigger for small sized firms than for large sized firms. The results of Granger causality test shows change of stock price return is caused by SNS exposures, while the causation of the other way round is not significant. Therefore the correlation relationship between SNS exposures and stock prices has uni-direction causality. The more a firm is exposed in SNS, the more is the stock price likely to increase, while stock price changes may not cause more SNS mentions.

시리즈 비디오 데이터의 접근 패턴에 기반한 프록시 캐슁 기법 (Proxy Caching Scheme Based on the User Access Pattern Analysis for Series Video Data)

  • 홍현옥;박성호;정기동
    • 한국멀티미디어학회논문지
    • /
    • 제7권8호
    • /
    • pp.1066-1077
    • /
    • 2004
  • 급격하게 증가하고 있는 인터넷 사용자들은 인터넷을 통하여 좋은 품질의 연속미디어 데이터를 제공받기를 원하고 있다. 그러나 서버의 과부하, 네트워크의 혼잡, 사용자에 대한 응답 지연 등의 문제는 이러한 요구를 충족시키지 못하고 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여 연속미디어 데이터의 특성과 사용자 접근 패턴을 고려한 네트워크 캐슁정책(PPC, PPCwP)을 제안한다. 본 논문에서 제안하는 PPC 기법은 주기적으로 각 연속미디어 객체의 구간 재생량을 측정하여 인기도 분포를 결정하고, 이 분포에 따라 결정되어진 캐슁 데이터의 양만큼 객체의 앞부분부터 네트워크 캐슁을 수행한다. 또한 새로 생성된 객체의 인기도를 예측하기 위하여 시리즈 정보를 사용하여 캐슁할 데이터의 양을 결정하고 사용자의 요구가 발생하기 전에 인기도가 급상승할 비디오를 네트워크 캐쉬에 프리패칭하는 PPCwP 기법을 제안한다. PPCwP 기법은 시리즈 그룹의 정보를 사용하여 선반입함으로써 사용자의 요구에 대한 초기지연시간과 서버의 부하를 감소시키며, 제한된 캐쉬 공간을 효율적으로 활용할 수 있도록 한다. 제안하는 기법 PPC와 PPCwP의 성능을 평가하기 위하여 실제로 운영되고 있는 인터넷 방송국 VoD(Video on Demand) 서버(iMBC 인터넷 방송국)의 로그 데이터를 이용한 트레이스 기반 모의실험을 수행하였다. 그 결과 LFU나 LRU보다 초기지연시간과 BHR 측면에서 우수한 성능을 보였다.

  • PDF

BERT 기반 감성분석을 이용한 추천시스템 (Recommender system using BERT sentiment analysis)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.1-15
    • /
    • 2021
  • 추천시스템은 사용자의 기호를 파악하여 물품 구매 결정을 도와주는 역할을 할 뿐만 아니라, 비즈니스 전략의 관점에서도 중요한 역할을 하기에 많은 기업과 기관에서 관심을 갖고 있다. 최근에는 다양한 추천시스템 연구 중에서도 NLP와 딥러닝 등을 결합한 하이브리드 추천시스템 연구가 증가하고 있다. NLP를 이용한 감성분석은 사용자 리뷰 데이터가 증가함에 따라 2000년대 중반부터 활용되기 시작하였지만, 기계학습 기반 텍스트 분류를 통해서는 텍스트의 특성을 완전히 고려하기 어렵기 때문에 리뷰의 정보를 식별하기 어려운 단점을 갖고 있다. 본 연구에서는 기계학습의 단점을 보완하기 위하여 BERT 기반 감성분석을 활용한 추천시스템을 제안하고자 한다. 비교 모형은 Naive-CF(collaborative filtering), SVD(singular value decomposition)-CF, MF(matrix factorization)-CF, BPR-MF(Bayesian personalized ranking matrix factorization)-CF, LSTM, CNN-LSTM, GRU(Gated Recurrent Units)를 기반으로 하는 추천 모형이며, 실제 데이터에 대한 분석 결과, BERT를 기반으로 하는 추천시스템의 성과가 가장 우수한 것으로 나타났다.

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.