• 제목/요약/키워드: web data mining

검색결과 411건 처리시간 0.026초

직무 리뷰 분석을 통한 산업군별 직무만족/존속 요인 및 직무불만족/이직 요인에 관한 연구 (A Study on Job Satisfaction/Retention Factors and Job Unsatisfaction/Turnover Factors by Industries using Job Reviews)

  • 이종서;김성근;강주영
    • 한국IT서비스학회지
    • /
    • 제16권1호
    • /
    • pp.1-26
    • /
    • 2017
  • Keeping good, talented people is one of the most significant factors in a company's success. HR analytics is an important area for applying big data analysis techniques to human resources. It provides organizational insight that enables effective management of employees, allowing management to reach their business goals quickly and efficiently. Job satisfaction and employee turnover analysis are the keys to HR analytics. Job review web services have been becoming popular. Because people exchange information about job satisfaction and turnover through these web services, useful information about HR Analytics is accumulated on the job review web sites. In this paper, we identified factors of employee retention by analyzing a Job Satisfaction/Retention group, and the factors of employee turnover by analyzing a Job Unsatisfaction/Turnover group. In order to do this, we first classified employees according to whether their self-reported job satisfaction or turnover was true. We collected and analyzed data from Jobplanet, a popular job review site. Through dominance analysis and LDA topic modeling, we found major factors, topics, and keywords of the classified groups by IT, service, and manufacturing domains. Our approach is a novel model to apply the analysis of reviews and text mining to the HR domain, and it will be practically helpful for setting new strategies that improve job satisfaction.

웹로그 마이닝을 이용한 개인화 광고 서비스 기법 (Personalized Advertisement Service Method Using Web Log Mining)

  • 김석훈;김은수
    • 컴퓨터교육학회논문지
    • /
    • 제8권1호
    • /
    • pp.117-127
    • /
    • 2005
  • 최근 전자상거래의 발전과 인터넷 사용자의 급증으로 온라인 상에서 수많은 광고들이 서비스되고 있다. 하지만 이러한 광고서비스는 사용자들의 성향 분석을 기초로 하기보다는 해당 광고의 일방적 서비스에 그치고 있다. 따라서 많은 웹사이트들이 해당 광고의 효율적 서비스를 위해 개인화된 광고서비스를 원하고 있고 해당 서버의 로그 분석을 통한 서비스를 연구 및 시행하고 있다. 본 논문에서는 개인화된 광고 서비스를 가능하게 하는 비교적 간단한 적응형 시스템을 설계하고, 그 성능을 실험하였다. 개인의 성향을 시스템에 가장 효율적으로 반영하기 위하여 개인 컴퓨터의 히스토리 파일을 원시 데이터로 하여 정제후 사용하여 이 파일을 이용하므로 해당 서버를 방문한 자에 한해서만 성향을 파악할수 있는 단점을 극복하여 고객이 다른 서버의 방문 기록도 활용하므로 좀더 현실성 있는 성향 파악이 가능하게 하였다.

  • PDF

온라인리뷰의 랭킹모델링을 위한 양과 질의 인과모형 분석 (Causal model analysis between quantity and quality for deriving ranking model of Online reviews)

  • 이창용;김근형
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제28권1호
    • /
    • pp.1-16
    • /
    • 2019
  • Purpose The purpose of this study is to analyze causal relationship between quantity and quality for deriving ranking model of Online reviews. Thus, we propose implications for deriving the ranking model for retrieving Online reviews more effectively. Design/methodology/approach We collected Online review from Tripadvisor web sites which might be a kind of world-famous tourism web sites. We transformed the natural text reviews to quantified data which consists of quantified positive opinions, quantified negative opinions, quantified modification opinions, reviews lengths and grade scores by using opinion mining technologies in R package. We executed corelation and regression analysis about the data. Findings According to the empirical analysis result, this study confirmed that the review length influenced positive opinion, negative opinion and modification opinion. We also confirmed that negative opinion and modification opinion influenced the grade score.

취업정보 필터링 기반 취업전략에 관한 연구 (A Study on Employment Strategy Based on Employment Information Filtering)

  • 윤선희
    • 문화기술의 융합
    • /
    • 제5권4호
    • /
    • pp.251-258
    • /
    • 2019
  • 본 본 연구는 취업을 희망하는 학생들을 대상으로 빅데이터를 분석하는 과정에서 취업과 관련이 있는 정보 등을 필터링하여 취업률 및 유지취업률을 향상할 수 있는 시스템을 제안하였다. 실험대상은 2년제 여자대학교의 취업대상자로써 기존의 취업 전략은 학교성적 외모 성격 등 단순한 정보로 구직에 참여했다. 그 결과, 취업하려는 학생들의 만족도가 감소하고 취업 후 적성에 맞지 않는다는 등의 이유로 도중 퇴사하여 유지취업률이 상대적으로 낮았다. 이러한 문제점들을 해결하기 위해 취업정보를 분석하는 과정에서 분석하는 과정에서 입력되는 데이터가 취업관련정보인지를 판별하여 활용할 수 있도록 필터링하는 시스템을 제안하여 취업률 및 유지취업률을 향상 시킬 수 있는 취업 전략을 구축하고자 한다.

CDOWatcher: Systematic, Data-driven Platform for Early Detection of Contagious Diseases Outbreaks

  • Albarrak, Abdullah M.
    • International Journal of Computer Science & Network Security
    • /
    • 제22권11호
    • /
    • pp.77-86
    • /
    • 2022
  • The destructive impact of contagious diseases outbreaks on all life facets necessitates developing effective solutions to control these diseases outbreaks. This research proposes an end-to-end, data-driven platform which consists of multiple modules that are working in harmony to achieve a concrete goal: early detection of contagious diseases outbreaks (i.e., epidemic diseases detection). Achieving that goal enables decision makers and people in power to act promptly, resulting in robust prevention management of contagious diseases. It must be clear that the goal of this proposed platform is not to predict or forecast the spread of contagious diseases, rather, its goal is to promptly detect contagious diseases outbreaks as they happen. The front end of the proposed platform is a web-based dashboard that visualizes diseases outbreaks in real-time on a real map. These outbreaks are detected via another component of the platform which utilizes data mining techniques and algorithms on gathered datasets. Those gathered datasets are managed by yet another component. Specifically, a mobile application will be the main source of data to the platform. Being a vital component of the platform, the datasets are managed by a DBMS that is specifically tailored for this platform. Preliminary results are presented to showcase the performance of a prototype of the proposed platform.

빅데이터 분석을 이용한 디지털 패션 테크에 대한 인식 연구 (Perceptions and Trends of Digital Fashion Technology - A Big Data Analysis -)

  • 송은영;임호선
    • 한국의류산업학회지
    • /
    • 제23권3호
    • /
    • pp.380-389
    • /
    • 2021
  • This study aimed to reveal the perceptions and trends of digital fashion technology through an informational approach. A big data analysis was conducted after collecting the text shown in a web environment from April 2019 to April 2021. Key words were derived through text mining analysis and network analysis, and the structure of perception of digital fashion technology was identified. Using textoms, we collected 8144 texts after data refinement, conducted a frequency of emergence and central component analysis, and visualized the results with word cloud and N-gram. The frequency of appearance also generated matrices with the top 70 words, and a structural equivalent analysis was performed. The results were presented with network visualizations and dendrograms. Fashion, digital, and technology were the most frequently mentioned topics, and the frequencies of platform, digital transformation, and start-ups were also high. Through clustering, four clusters of marketing were formed using fashion, digital technology, startups, and augmented reality/virtual reality technology. Future research on startups and smart factories with technologies based on stable platforms is needed. The results of this study contribute to increasing the fashion industry's knowledge on digital fashion technology and can be used as a foundational study for the development of research on related topics.

빅데이터를 활용한 무인카페 소비자 인식에 관한 연구: 텍스트 마이닝과 의미연결망 분석을 중심으로 (A Study on the User Experience at Unmanned Cafe Using Big Data Analsis: Focus on text mining and semantic network analysis )

  • 이승엽;박병현;남장현
    • 아태비즈니스연구
    • /
    • 제14권3호
    • /
    • pp.241-250
    • /
    • 2023
  • Purpose - The purpose of this study was to investigate the perception of 'unmanned cafes' on the network through big data analysis, and to identify the latest trends in rapidly changing consumer perception. Based on this, I would like to suggest that it can be used as basic data for the revitalization of unmanned cafes and differentiated marketing strategies. Design/methodology/approach - This study collected documents containing unmanned cafe keywords for about three years, and the data collected using text mining techniques were analyzed using methods such as keyword frequency analysis, centrality analysis, and keyword network analysis. Findings - First, the top 10 words with a high frequency of appearance were identified in the order of unmanned cafes, unmanned cafes, start-up, operation, coffee, time, coffee machine, franchise, and robot cafes. Second, visualization of the semantic network confirmed that the key keyword "unmanned cafe" was at the center of the keyword cluster. Research implications or Originality - Using big data to collect and analyze keywords with high web visibility, we tried to identify new issues or trends in unmanned cafe recognition, which consists of keywords related to start-ups, mainly deals with topics related to start-ups when unmanned cafes are mentioned on the network.

클릭스트림 분석을 위한 웹 서버 시스템의 설계 및 구현 (Design and Implementation of Web Server for Analyzing Clickstream)

  • 강미정;정옥란;조동섭
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.945-954
    • /
    • 2002
  • 인터넷을 통한 비즈니스에 수익 모델에 대한 관심이 높아지면서 방문자별로 개인화된 서비스를 제공하려는 노력이 커지고 있다. 개인화(Personalization)란 고객 한 명을 대상으로 하여 그 고객 한 사람을 위한 정보나 제품을 제공해주는 작업을 말한다. 개인화 서비스를 위해서 전 처리과정인 사용자 프로파일 생성과정이 필요하며, 적극적인 개인화 서비스를 제공하기 위해서는 충분한 고객 데이터가 필요하다. 본 논문에서는 웹사이트 상에서 사용자 행위 패턴을 파악할 수 있는 클릭스트림 정보를 모듈화 하였으며, 이를 이용하여 확장된 웹 로그 시스템을 구현하였다. 클릭스트림 정보를 웹 로그정보에 포함시켜 사용자의 행위 패턴을 파악할 수 있도록 웹 서버 시스템을 설계하고 구현하였다. 그리고 이 웹 서버는 웹사이트로부터 얻은 클릭스트림 정보를 분류하고 저장하여 관리자가 쉽게 분석할 수 있다. 이때 데이터베이스 저장 기술로 OLE DB Provider상에서 수행되는 ADO(ActiveX Data Object)기술을 사용함으로써 확장된 웹 로그 처리 시스템을 설계하였다. 확장된 웹 로그 DB를 패턴분석, 군집분석 등의 마이닝(Mining) 기법을 통하여 맞춤서비스에 대한 사용자 프로파일을 구축할 수 있다.

웹 트랜잭션 클러스터링의 정확성을 높이기 위한 흥미가중치 적용 유사도 비교방법 (Similarity Measurement with Interestingness Weight for Improving the Accuracy of Web Transaction Clustering)

  • 강태호;민영수;유재수
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.717-730
    • /
    • 2004
  • 최근 들어 원 사이트 개인화(Web Personalization)에 관한 연구가 활발히 진행되고 있다. 웹 개인화는 클러스터링과 같은 데이터 마이닝 기법을 이용하여 가 사용자에게 가장 흥미를 가질만한 URL 집합을 예측하는 것이라 할 수 있다. 기존의 클러스터링을 이용한 방식에서는 웹 트랜잭션들을 웹 사이트의 각 URL들에 방문했는지 안했는지를 나타내는 비트 벡터(bit vector)로 표현하였다. 그리고 이들 비트 벡터의 방문 패턴이 일치하는 정도에 따라 유사성을 결정하였다. 하지간 이것은 유사한 성향을 가지는 웹 트랜잭션을 클러스터링 하는데 있어 사용자의 흥미를 배제하고 단순히 방문 여부만을 반영하게 되는 문제점이 발생하게 된다. 즉 방문 목적 또는 성향이 유사하지 않은 웹 트랜잭션들을 같은 그룹으로 분류할 가능성이 존재하게 된다 이에 본 논문에서는 기존의 비트 벡터를 이용한 트랜잭션 모델을 사용자의 흥미도(Interestingness)를 반영할 수 있도록 보완하여 새로운 점 트랜잭션 모델을 제시하고 흥미가중치를 적용한 유사도 비교방법을 제안한다. 그리고 성능평가를 통하여 제안만 방법이 기졸 방법에 비해 클러스터링의 정확성을 높임을 보인다.

R프로그래밍을 활용한 공유경제의 한국인 집단지성: 텍스트 마이닝 및 시계열 분석 (Korean Collective Intelligence in Sharing Economy Using R Programming: A Text Mining and Time Series Analysis Approach)

  • 김재원;윤유동;정유진;김기연
    • 인터넷정보학회논문지
    • /
    • 제17권5호
    • /
    • pp.151-160
    • /
    • 2016
  • 본 연구의 목적은 최근 창조경제 또는 사회적 경제 관점에서 주목받고 있는 공유경제라는 키워드에 관해 현대 한국인들이 가지고 있는 대중적인 문화 및 사회적 인식, 즉 집단지성의 변화 추세를 조사하는 것이다. 이를 위해, 본 연구는 빅데이터 분석 관점의 텍스트 마이닝 기법을 적용하여 최근 5년 간 사회 문화적 집단지성의 객관적이고 가시적인 연간 변화 및 패턴들을 발견하고 이해하고자 한다. 월드 와이드 웹에서 크롤링(crawling) 기법과 구글링(googling)을 통해 분석에 필요한 2010년부터 2014년까지 축적된 상당한 양의 공유경제를 주제로 한 기존 문헌들의 시계열 웹 메타 데이터를 수집하였다. 결과적으로, 많은 양의 가공되지 않은 공유경제 키워드 관련 원 자료들은 R프로그래밍 분석을 통해 보다 의미 있는 가치 있는 '워드 클라우딩' 형태의 그래프나 그림으로 분석처리 되었다. 아직까지 시기적으로 공유경제에 관해 축적된 자료나 집단지성이 양적으로 미비함에도 불구하고, 본 연구는 지식처리 관점에서 시계열 빅데이터 분석을 수행한 선행연구라는 점에서 의미가 있다. 따라서 본 연구의 결과는 향후 산학 분야에서 공유경제 관련 시장분석과 소비자 행동학 관련 후속 연구들을 위해 1차 자료로서 학문적 시사점을 제공할 수 있다.