• 제목/요약/키워드: internet companies

검색결과 1,220건 처리시간 0.026초

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법 (Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation)

  • 유띳로따낙;누르지드;하인애;조근식
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.57-77
    • /
    • 2013
  • 소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.

사회적 네트워크 구조특성과 제품구전의 확산: 사회문화적 접근 (Structural Properties of Social Network and Diffusion of Product WOM: A Sociocultural Approach)

  • 윤성준;한희은
    • 한국유통학회지:유통연구
    • /
    • 제16권1호
    • /
    • pp.141-177
    • /
    • 2011
  • 기존의 확산관련 연구들은 대부분이 구전 커뮤니케이션의 효용성에 치중하여 개인단위의 변수를 사용하는 경향이 많았다 (Iacobucci 1996; Midgley 외 1992). 반면 구전의 선행 변수로써 네트워크의 구조적 특성을 소비자의 집단문화적 성향에 기초하여 조사한 연구는 찾아보기 어렵다. 본 연구는 이같은 연구배경 하에서 네트워크의 구조적 특성과 소비자의 구전간의 관계를 연관시켜 비교문화적으로 접근하려고 하였다. 본 연구에서 추구하는 주요 목적은 한국과 중국 소비자를 대상으로 사회적 네트워크 형태에 따른 구전효과를 규명하려는 것이며, 네트워크와 구전 효과와의 관계에 영향을 미치는 조절변수로써 문화적 가치관의 역할을 검증하려고 하였다. 구체적인 연구목적은 다음과 같다. 첫째, 사회적 네트워크 관련 이론들을 바탕으로 한국과 중국 소비자들을 대상으로 네트워크의 구조적 특성들 (예: 유대강도, 중심성, 범위)이 구전의 효과 (구전 의향 및 구전 정보의 질)에 어떠한 영향을 미치는지를 규명한다. 둘째, 사회적 네트워크 특성이 구전효과에 미치는 영향에 있어서 문화적 가치 (불확실성 회피 성향, 개인주의성향)가 조절 역할을 하는지를 규명한다. 셋째, 사회적 네트워크 특성과 구전효과의 선행변수로써 소비자 개인의 혁신 성향의 역할을 규명한다. 분석 결과, 한국과 중국 소비자들은 공통적으로 네트워크 유대강도와 중심성은 구전의향에 유의한 영향을 보였으나 네트워크 범위는 두집단 모두 유의하게 나타나지 않았다. 반면, 한, 중 소비자 공통적으로 불확실성회피 성향은 네트워크범위와 상호작용을 함으로써 구전의향에 조절역할을 하는 것으로 나타났다. 마지막으로 소비자의 혁신성향은 한중 두 소비자 집단에서 공통적으로 네트워크 특성 (중심성)과 구전효과(구전정보의 질) 에 유의하게 긍정적 영향을 미치는 것으로 나타났다. 한중 양국의 네트워크 특성을 비교한 결과 한국이 중국보다 유대강도, 중심성, 범위에서 모두 유의하게 더 높은 점수를 보였으며, 불확실성회피 성향 또한 한국 소비자가 중국보다 유의하게 높은 것으로 나타났다.

  • PDF

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.

산업간호현장의 보건업무 전산화시스템 활용현황과 산업간호사의 전산화 직무만족도 연구 (A Study of the Health Service Computerization State and the Occupational Nurses's Satisfaction Level on Computerization)

  • 정희영;박형숙
    • 한국직업건강간호학회지
    • /
    • 제13권1호
    • /
    • pp.5-18
    • /
    • 2004
  • This study aims to investigate the use state of the health service computerization system in the occupational nursing field and the occupational nursers' satisfaction level, and provide basic data to promote the development of the health service computerization system for the nursing field. For this study, a questionnaire was provided to 118 occupational nurses who belong to Busan and Gyeongnam branches of KAOHN(Korean Association of Occupational Health Nurses) for 2 months (from Dec. 1, 2002 to Jan. 31, 2003). A tool of Choi Yong-Heui(2000) was used to investigate the satisfaction level of using the health service computerization system. The collected materials were analyzed in real number and percentage, average and standard deviation, t-test and ANOVA by using the SPSS WIN 10.0 program. This study is summarized as follows: 1. The average age was $31.99{\pm}5.58$ old in this study. The married were 54.2%. Participants who graduated from a junior college was 76.9%. The average service period was $4.48{\pm}4.68$ years. In service types, 79.7% of participants served in a health care center. The average service period was $3.22{\pm}2.89$ years. The service place which had 1000 workers or more was 35.6%. 2. Only 20.3% of participants in this study had a computer use education. 3. The field who participants used mostly was communication/internet, $3.29{\pm}.85$ hours in average. 4. 97.1% of occupational fields had computers and peripheral devices: 71.4% in pentium computer, 42.8% in the hard disk capacity of 20-29GB, 60.0% in 15 inch monitors, 86.2% in printers, 18.1% in digital cameras, 12.4% in LAN, and 9.5% in scanners. 80.1% of the occupational fields which were objects of study could use communication. 5. The occupational fields which did not introduced the health service computerization system were 62.8%. The main cause was attributable to entrepreneurs' insufficient recognition 66.6%. 51.5% of the entrepreneurs did not have an introduction plan. 37.2% of participating companies had the health service computerization system. 56.4% of them introduced it since the year 2000. 81.6% of the introduction motivation aimed to the efficiency of health service. The most issue upon introduction was insufficient understanding of a person in charge - 25.6%. The in-house development of the system covered 56.4%. 61.5% of the participants accepted their demands from the first stage of development. The direct effect of computerization showed the increase of 25.9% in the quickness and continuity of service treatment, and 25.9% in the serviceability of statistical treatment. 6. 22.0% of the participants had a computerization system use education. 69.2% of them had a in-house education. An educational method by nurses who used the computerization system was 76.9%. 92.3% of the education was helpful for practical duties. 7. An analysis of the computer use by health service fields showed that the medicine management in a health management field was 15.9%. the work environment measuring management in a work environment filed was 32.9%. the employment. general and special examination management in a heal th management field was 61.1 %. the various reports management in an administrative field was 64%. the health education data preparation management in an educational field was 58.0%. and the medicine and expendables management in an equipment management field was 51.6%. An analysis of the computerization system use showed that the various statistical data manage in a health management field was 13.0%. the work environment measuring management in a health management field was 34.8%. the personal disease management in a health management field was 51.9%. the heal education data preparation management in an educational field was 54.5%. and the equipment management of health care centers in an equipment management field was 52.6%. 8. 31.6% of the participants wanted that health service computerization system would include the generals of health services. 42.4% of the participants thought that first of all. the aggressive interest and investment of employers were required to build the health service computerization system. 9. The participants' satisfaction level on the computerization system use was $3.51{\pm}.57$ points. An analysis by each factor showed $3.62{\pm}.68$ points in a service change factor. $3.15{\pm}.63$ points in a computer program use factor, and $3.45{\pm}.71$ points in a continuous computerization use factor. 10. An analysis of the computerization system use by general characteristics of participants showed that the married (p = .022) had the satisfaction level higher than the unmarried. 11. The satisfaction level of the computerization system use by participants' computer use ability tended to be higher in proportion to the increase of computer use abilities in spreadsheet (F=2.606. p=.048). presentation (F=3.62. p=.012) and communication/internet(F=2.885. p=.0321. Based on the study results mentioned above. I will suggest as follows : The nationwide enlargement and repetition study is required for occupational nurses who serve in occupational nursing fields. The computerization system in a health service field is inferior comparing with other fields. The computerization system standard by business types and characteristics should be prepared through employers's aggressive participation and national support. Therefore various statistical data which occurs in occupational fields will be managed systematically and efficiently. A regular and systematic computer education plan for occupational nurses in charge of health services in the filed is urgently required to efficiently manage and improve the health of on-site workers.

  • PDF

Relationship between Brand Personality and the Personality of Consumers, and its Application to Corporate Branding Strategy

  • Kim, Young-Ei;Lee, Jung-Wan;Lee, Yong-Ki
    • 마케팅과학연구
    • /
    • 제18권3호
    • /
    • pp.27-57
    • /
    • 2008
  • Many consumers enjoy the challenge of purchasing a brand that matches well with their own values and personalities (for example, Ko et al., 2008; Ko et al., 2006). Therefore, the personalities of consumers can impact on the final selection of a brand and its brand personality in two ways: first, the consumers may incline to purchase a brand or a product that reflects their own personalities; second, consumers tend to choose a company that has similar brand personalities to those brands that are being promoted. Therefore, the objectives of this study are following: 1. Is there any empirical relationship between a consumer's personality and the personality of a brand that he or she chooses? 2. Can a corporate brand be differentiated by the brand personality? In short, consumers are more likely to hold favorable attitudes towards those brands that match their own personality and will most probably purchase those brands matching well with their personality. For example, Matzler et al. (2006) found that extraversion and openness were positively related to hedonic product value; and that the personality traits directly (openness) and indirectly (extraversion, via hedonic value) influenced brand effects, which in turn droved attitudinal and purchase loyalty. Based on the above discussion, the following hypotheses are proposed: Hypothesis 1: the personality of a consumer is related to the brand personality of a product/corporate that he/she purchases. Kuksov (2007) and Wernerfelt (1990) argued that brands as a symbolic language allowed consumers to communicate their types to each other and postulated that consumers had a certain value of communicating their types to each other. Therefore, how brand meanings are established, and how a firm communicate with consumers about the meanings of the brand are interesting topics for research (for example, Escalas and Bettman, 2005; McCracken, 1989; Moon, 2007). Hence, the following hypothesis is proposed: Hypothesis 2: A corporate brand identity is differentiated by the brand personality. And there are significant differences among companies. A questionnaire was developed for collecting empirical measures of the Big-Five personality traits and brand personality variables. A survey was conducted to the online access panel members through the Internet during December 2007 in Korea. In total, 500 respondents completed the questionnaire, and considered as useable. Personality constructs were measured using the Five-factor Inventory (NEO-FFI) scale and a total of 30 items were actually utilized. Brand personality was measured using the five-dimension scale developed by Aaker (1997). A total of 17 items were actually utilized. The seven-point Likert-type scale was the format of responses, for example, from 1 indicating strongly disagreed to 7 for strongly agreed. The Analysis of Moment Structures (AMOS) was used for an empirical testing of the model, and the Maximum Likelihood Estimation (MLE) was applied to estimate numerical values for the components in the model. To diagnose the presence of distribution problems in the data and to gauge their effects on the parameter estimates, bootstapping method was used. The results of the hypothesis-1 test empirically show that there exit certain causality relationship between a consumer's personality and the brand personality of the consumer's choice. Thus, the consumer's personality has an impact on consumer's final selection of a brand that has a brand personality matches well with their own personalities. In other words, the consumers are inclined to purchase a brand that reflects their own personalities and tend to choose a company that has similar brand personalities to those of the brand being promoted. The results of this study further suggest that certain dimensions of the brand personality cause consumers to have preference to certain (corporate) brands. For example, the conscientiousness, neuroticism, and extraversion of the consumer personality have positively related to a selection of "ruggedness" characteristics of the brand personality. Consumers who possess that personality dimension seek for matching with certain brand personality dimensions. Results of the hypothesis-2 test show that the average "ruggedness" attributes of the brand personality differ significantly among Korean automobile manufacturers. However, the result of ANOVA also indicates that there are no significant differences in the mean values among manufacturers for the "sophistication," "excitement," "competence" and "sincerity" attributes of the corporate brand personality. The tight link between what a firm is and its corporate brand means that there is far less room for marketing communications than there is with products and brands. Consequently, successful corporate brand strategies must position the organization within the boundaries of what is acceptable, while at the same time differentiating the organization from its competitors.

  • PDF

건강기능식품 안전관리 연구방향 (Research Direction for Functional Foods Safety)

  • 정기화
    • 한국식품위생안전성학회지
    • /
    • 제25권4호
    • /
    • pp.410-417
    • /
    • 2010
  • 건강효과나 보건효과를 표방한 다양한 건강기능식품이 시장에 유통되고 있다 이들 제품은 분명한 식품형태의 것으로부터 정체, 캡슐 상 까지여서 의약품과 오인 혼동될 우려가 높으며 전문적 지식이 없는 사람이 통상의 식품으로서 판매하고 있는 일이 많고 건강기능식품용 질병의 치료 목적으로 사용하는 경우도 적지 않다. 건강기능식품제도의 창설이나 법적 규제에 의해 혼란스런 건강기능식품의 상황을 개선하기 위한 노력이 계속되어 왔지만 아직 소비자에게는 제대로 전달되지 않고 있다. 따라서 건강기능식품이 질병의 치료에 이용되는 문제나 위법으로 의약품성분을 첨가한 제품이 유통되는 문제는 끊이지 않고 있고 이러한 문제는 인터넷 등의 정보 전달수단의 발달에 따라 더욱 확대되고 있다. 건강기능식품의 문제는 제품자체의 문제와 이용방법의 문제로 크게 나눌 수 있지만 어느 쪽이나 적절한 정보를 소비자에게 전달해서 그 실태가 틀림없이 인식되어야만 어느 정도 개선 헬 수 있다고 생각된다. 건강가능식품과 관련되어 야기 될 수 있는 문제들은 위법제품, 유해물질 혼입, 알레르기 병자에 대한 투여시 고려되어야 할 사항, 의약품과의 상호작용, 성분표시가 있어도 그 순도와 함량이 극히 애매해 검출되지 않을 수도 있는 문제, 대사활성화가 일어나는 제품, Alkaloid가 함유된 경우 및 비타민 미네랄의 과잉섭취와 부족에 의한 건강피해 리스크 등 많은 경우가 있다. 건강기능식품과 관련한 부작용 사례가 해마다 증가하고 있는 이유는 불량 건강기능식품 업체가 그 효과와 효능을 과장해서 선전하는 것도 중요한 부분을 차지하며 실제로 허위 과대 광고로 인해 적발된 사례가 연평균 821건에 달한다. 식품의약품안전청은 홈페이지를 통해 건강기능식품 문제의 개선과 홍보를 위해 정보를 제공하고 있지만 건강기능 식품의 적정사용과 의약품 건강기능식품 간 상호작용을 피하기 위해서는 개선의 여지가 있다. 건강기능식품문제의 개선을 위해서는 승인된 제품에 대한 정보 부작용 수집의 제도화 및 재평가 제도의 정착, 인체적용 전 시험과 인체적용 시험조건에 대한 표준화가 시급하다. 또한 적절한 정보제공 활동을 위해서는 건강기능식품 의약품 등 이종 데이터간의 유기적 연동을 위한 통합 DB시스템 및 사용자가 데이터를 편리하게 검색할 수 있는 사용자 인터페이스도 요망된다.

비정형 빅데이터의 실시간 복합 이벤트 탐지를 위한 기법 (The Method for Real-time Complex Event Detection of Unstructured Big data)

  • 이준희;백성하;이순조;배해영
    • Spatial Information Research
    • /
    • 제20권5호
    • /
    • pp.99-109
    • /
    • 2012
  • 최근 소셜 미디어의 발달과 스마트폰의 확산으로 SNS(Social Network Service)가 활성화가 되면서 데이터양이 폭발적으로 증가하였다. 이에 맞춰 빅데이터 개념이 새롭게 대두되었으며, 빅데이터를 활용하기 위한 많은 방안이 연구되고 있다. 여러 기업이 보유한 빅데이터의 가치창출을 극대화하기 위해 기존 데이터와의 융합이 필요하며, 물리적, 논리적 저장구조가 다른 이기종 데이터 소스를 통합하고 관리하기 위한 시스템이 필요하다. 빅데이터를 처리하기 위한 시스템인 맵리듀스는 분산처리를 활용하여 빠른게 데이터를 처리한다는 이점이 있으나 모든 키워드에 대해 시스템을 구축하여 저장 및 검색 등의 과정을 거치므로 실시간 처리에 어려움이 따른다. 또한, 이기종 데이터를 처리하는 구조가 없어 복합 이벤트를 처리하는데 추가 비용이 발생할 수 있다. 이를 해결하는 방안으로 기존에 연구된 복합 이벤트 처리 시스템을 활용하여 실시간 복합 이벤트 탐지를 위한 기법을 제안하고자 한다. 복합 이벤트 처리 시스템은 서로 다른 이기종 데이터 소스로부터 각각의 데이터들을 통합하고 이벤트들의 조합이 가능하며 스트림 데이터를 즉시 처리할 수 있어 실시간 처리에 유용하다. 그러나 SNS, 인터넷 기사 등 텍스트 기반의 비정형 데이터를 텍스트형으로 관리하고 있어 빅데이터에 대한 질의가 요청될 때마다 문자열 비교를 해야 하므로 성능저하가 발생할 여지가 있다. 따라서 복합 이벤트 처리 시스템에서 비정형 데이터를 관리하고 질의처리가 가능하도록 문자열의 논리적 스키마를 부여하고 데이터 통합 기능을 제안한다. 그리고 키워드 셋을 이용한 필터링 기능으로 문자열의 키워드를 정수형으로 변환함으로써 반복적인 비교 연산을 줄인다. 또한, 복합 이벤트 처리 시스템을 활용하면 인 메모리(In-memory)에서 실시간 스트림 데이터를 처리함으로써 디스크에 저장하고 불러들이는 시간을 줄여 성능 향상을 가져온다.

한국형 전자선하증권 활성화 전략에 관한 연구 (A Study on e-B/L Korea Service and its Facilitation Strategies)

  • 정윤세
    • 통상정보연구
    • /
    • 제13권4호
    • /
    • pp.51-79
    • /
    • 2011
  • 우리나라는 2003년부터 2008년까지 전자정부 과제로 인터넷기반의 국가전자무역망(uTradeHub)을 성공적으로 구축하여 무역의 전자화를 활성화하고 있으며, 전자무역의 마지막 단계라고 불리는 선하증권(B/L)을 전자화한 '한국형 전자선하증권 서비스(e-B/L Korea)'를 정부와 민간의 협력 하에 구축하여 시범사업을 거쳐 2009년에 공식적으로 전자선하증권 서비스에 들어갔다. 국가적 차원에서 상법을 개정하고 시행령을 만들어 선하증권을 제도화한 것은 세계 최초이며 세계 각국이 이의 성공여부에 지대한 관심을 가지고 주목하고 있다. 한국형 선하증권의 성공은 2011년 말을 기점으로 우리나라가 세계에서 9번째로 무역 1조불 클럽에 가입한 '무역강국'의 위상을 높이고 실질적으로 우리 수출입기업의 무역거래비용을 절감함으로써 향후 무역 2조불시대를 앞당길 전자무역 활성화의 시금석으로 인식되고 있다. 하지만 아직은 국가 간 연계구축망이 부재하고, 서류의 보안성과 안전성올 높이기 위한 전자인중이 국제적으로 통용되고 있는 사적인증을 배제하고 국내공인인증만을 취급하는 등 e-B/L 서비스를 활성화하기 위해서 해결해야할 문제점도 산적해 있어 실질적으로 e-Nego 서비스가 크게 확산되지 못하는 실정이다. 따라서 본 연구는 e-Nego 또는 서면전환 과정에서 발생할 수 있는 한국형 전자선하증권의 변형에 따른 문제점을 비롯하여 구조적, 제도적 문제점과 사용상 장애요인을 도출하여 이에 대한 해결방안을 제시하였으며, 한국형 전자선하증권의 특성을 검토하고 통 서비스 활용을 활성화하기 위한 전략을 제시하였다.

  • PDF

음악과 플레이리스트의 메타데이터를 활용한 하이브리드 음악 추천 시스템에 관한 연구 (Research on hybrid music recommendation system using metadata of music tracks and playlists)

  • 이현태;임규건
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.145-165
    • /
    • 2023
  • 추천 시스템은 인터넷의 발달로 급격하게 증가하는 정보의 양으로 인해 생긴 정보 선택의 어려움을 소비자에게 덜어주고 각 개인의 취향에 맞는 정보를 효율적으로 보여주는 중요한 역할을 한다. 특히, E-commerce와 OTT 기업은 상품과 콘텐츠 양이 급격하게 증가하면서 추천 시스템의 도움 없이는 인기 있는 상품만 소비되는 현상을 극복하지 못한다. 이러한 현상을 극복하고 고객 개인 취향에 맞는 정보 혹은 콘텐츠를 제공해 고객의 소비를 유도하기 위해 추천 시스템의 연구가 활발히 진행되고 있다. 일반적으로 유저(user)의 과거 행동 이력을 활용한 협업 필터링이 유저가 선호한 콘텐츠의 정보를 활용하는 콘텐츠 기반 필터링에 비해 높은 성능을 보여준다. 하지만 협업 필터링은 과거 행동 데이터가 부족한 유저에 대해서는 추천의 성능이 낮아지는 콜드 스타트(Cold Start) 문제를 겪게 된다. 본 논문에서는 카카오 아레나 경진대회에서 주어진 음악 스트리밍 서비스 멜론의 플레이리스트 데이터를 기반으로 앞에서 언급한 콜드 스타트 문제를 해결할 수 있는 하이브리드 음악 추천 시스템을 제시했다. 본 연구에서는 플레이리스트에 수록된 곡 목록과 각 음악과 플레이리스트의 메타데이터를 활용해 절반 혹은 전부 가려진 플레이리스트의 다른 수록 곡을 예측하는 것을 목표로 하였다. 이를 위해 플레이리스트 안에 곡이 있는 경우와 아예 곡이 없는 경우를 나눠서 추천을 진행하였다. 플레이리스트 안에 곡이 있는 경우에는 해당 플레이리스트의 곡 목록과 각 곡의 메타데이터를 활용하기 위해 LightFM을 활용하였다. 그 다음에 Item2Vec을 활용해 플레이리스트에 있는 수록 곡과 태그 및 제목의 임베딩 벡터를 생성하고 이를 추천에 활용하였다. 최종적으로 LightFM과 Item2Vec 모델의 앙상블을 통해 최종 추천 결과를 생성하였다. 플레이리스트 안에 곡이 없고 태그 혹은 제목만이 존재할 경우에는 플레이리스트의 메타데이터인 태그와 제목을 FastText를 활용해 사전 학습을 시켜 생성된 플레이리스트 벡터를 기반으로 플레이리스트 간의 유사도를 활용하여 추천을 진행하였다. 이렇게 추천한 결과, 기존 Matrix Factorization(MF)에서 해결하지 못한 콜드 스타트 문제를 해결할 수 있었을 뿐만 아니라 곡과 플레이리스트의 메타데이터를 활용해 기존 MF 모델인 ALS와 BPR 그리고 Word2Vec 기반으로 추천해 주는 Item2Vec 기술보다 높은 추천 성능을 낼 수 있었다. 또한, LightFM을 토대로 다양한 곡의 메타데이터를 실험한 결과, 여러 메타데이터 중에서 아티스트 정보를 단독으로 활용한 LightFM 모델이 다른 메타데이터를 활용한 LightFM 모델들과 비교해 가장 높은 성능을 보여준다는 것을 확인할 수 있었다.

직원을 위한 내부마케팅이 기업의 시가 총액 변동률에 미치는 영향 분석: 잡플래닛 기업 리뷰를 중심으로 (An Analysis of the Internal Marketing Impact on the Market Capitalization Fluctuation Rate based on the Online Company Reviews from Jobplanet)

  • 최기철;이상용
    • 경영정보학연구
    • /
    • 제20권2호
    • /
    • pp.39-62
    • /
    • 2018
  • 컴퓨터 연산능력의 향상과 데이터를 수집하고 가공해 분석이 가능하도록 데이터를 정형화 시키는 기술이 발달함에 따라, 소셜미디어 및 인터넷 공간에서 생산되는 다양한 텍스트 데이터를 수집하고 그것을 분석하는 시도가 늘고 있다. 본 연구는 이와 같은 기술의 발전과 새롭게 시도되고 있는 분석법을 활용해 텍스트 데이터를 분석하여 과거에 설문조사 방법을 통해 확인했던 "내부마케팅"의 효과를 기존과는 다른 방식으로 확인해 보고자 하였다. 이와 같은 분석을 위해, 전/현직자들이 해당 기업의 구직자들에게 기업의 리뷰를 제공하는 플랫폼 잡플래닛(www.jobplanet.co.kr)의 리뷰 데이터를 웹크롤러를 생성하여 약 4만 건을 수집하였다. 또한 수집된 비정형 데이터를 정형화하기 위한 형태소 분석을 진행하여 명사만을 추출한 후, 미리 생성해 놓은 단어주머니에 들어있는 단어와 같을 경우 그 숫자를 세어 분류화를 진행하였다. 분류화된 내부마케팅 영역별 단어 수의 변화를 독립변수로, 시가총액 변동률을 종속변수로 활용하여, 내부마케팅과 시가총액간의 관계를 확인하고자 하였다. 그 결과, 대부분의 기존 연구와는 다르게 내부마케팅의 효과는 제한적인 영역에서만 기업의 성과에 긍정적인 영향을 미치며 대부분의 환경에서는 음의 영향을 미치는 것으로 나타났다. 산업군으로 나누었을 때, 제조업에서는 여성지원과 교육 훈련 부문에서 기업성과에 긍정의 영향을 미치는 것으로 나타났으나, 유통업에서는 직원 복지, 일-가정 양립 그리고 바이오/제약 업종에서는 직원 복지, 일-가정 양립, 사내 커뮤니케이션 그리고 보상 부문에서 모두 기업성과에 음의 영향을 미치는 것으로 나타났다. 또한 기업의 규모가 크고 역사가 오래된 기업에서는 직원 복지가 기업성과에 악영향을 미치는 것으로 나타났으나, 교육 훈련 부문에서는 종속변수에 긍정적 영향을 미치는 것을 확인할 수 있었으며, 기업의 규모가 작고 역사가 짧은 기업에서는 직원 복지, 사내 커뮤니케이션 그리고 일-가정 양립에서 종속변수와 음의 관계를, 여성지원 에서는 종속변수와 양의 관계를 갖는 것으로 나타났다. 본 연구는 이러한 결과들을 분석하여 이론적 의미뿐만 아니라, 실무적 함의를 제시하고자 하였다.