• 제목/요약/키워드: Use case model

검색결과 1,916건 처리시간 0.029초

중소기업의 스마트팩토리 도입의도에 영향을 미치는 요인에 관한 연구 - 정부지원기대와 과업기술적합도를 포함하여 (Factors Affecting Intention to Introduce Smart Factory in SMEs - Including Government Assistance Expectancy and Task Technology Fit -)

  • 김정래
    • 벤처혁신연구
    • /
    • 제3권2호
    • /
    • pp.41-76
    • /
    • 2020
  • 본 연구는 스마트팩토리 도입의도에 영향을 미치는 요인을 실증 분석을 통해 확인하였다. 4차산업혁명의 핵심분야인 스마트팩토리 도입에 있어서 어떤 요인이 중요하게 영향을 미치는가에 대한 연구이며, 아직까지 스마트팩토리 분야에서 기술 수용에 관한 연구가 부족한 상황에서 학술적 실무적 의의가 있다고 믿는다. 정보기술의 수용요인 연구에 설명력이 검증된 통합기술수용이론(UTAUT)을 기반으로 연구를 진행하였으며, UTAUT 이론의 4가지 독립변수인 성과기대, 노력기대, 사회적영향, 촉진조건에 추가로 스마트팩토리의 특성상 중요한 요인으로 예상되는 정부지원기대(Government Assistance Expectancy)를 독립변수에 추가하였다. 또한 스마트팩토리 기술수용의 기술적인 요인을 확인하고자 과업기술적합도(Task Technology Fit)변수 추가하여 스마트팩토리 도입의도에 미치는 영향관계를 실증 분석하였다. 또한 과업기술적합도의 선행변수인 과업특성(Task Characteristics)과 기술특성(Technology Characteristics)이 과업기술적합도에 어떠한 영향을 미치는지에 대한 분석도 진행하였다. 새로운 기술에 대한 신뢰(Trust)의 정도가 기술의 수용에 있어 매우 중요한 영향을 미칠 것으로 예상되어 신뢰를 매개변수로 추가하였다. 마지막으로 새로운 정보기술에 의한 혁신이 사용자에게 불가피하게 거부감을 야기할 수 있다는 선행연구들을 토대로 혁신저항(Innovation Resistance)을 조절역할을 하는 연구변수에 추가하여 실증적 검증을 진행하였다. 연구 결과 성과기대, 사회적 영향, 정부지원기대, 과업기술적합도는 스마트팩토리 도입의도에 정(+)의 영향을 미쳤다. 영향력의 크기는 정부지원기대(β=.487) > 과업기술적합도(β=.218) > 성과기대(β=.205) > 사회적영향(β=.204) 순으로 나타났다. 과업특성과 기술특성은 모두 과업기술적합도에 정(+)의 영향이 확인되었으며, 과업특성(β=.559)이 기술특성(β=.328)보다 과업기술적합도에 더 영향이 큰 것으로 나타났다. 신뢰에 대한 매개 효과 검정에서 6개 독립변수 각각과 스마트팩토리 도입의도 간에 신뢰의 통계적으로 유의미한 매개역할은 확인되지 않았다. 혁신저항의 조절효과 검정을 통해, 혁신저항이 정부지원기대와 스마트팩토리 도입의도 간 정(+)의 조절역할을 하는 것으로 나타났다. 즉 혁신저항이 크면 클수록 정부지원기대가 스마트팩토리 도입의도에 미치는 영향력이 혁신저항이 적은 경우보다 커지는 것으로 나타났다.

온라인 상품평의 내용적 특성이 소비자의 인지된 유용성에 미치는 영향 (Impact of Semantic Characteristics on Perceived Helpfulness of Online Reviews)

  • 박윤주;김경재
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.29-44
    • /
    • 2017
  • 인터넷 상거래에서, 소비자들은 기존에 제품을 구매한 다른 사용자들이 작성한 상품평에 많은 영향을 받는다. 그러나, 상품평이 점차 축적되어감에 따라, 소비자들이 방대한 상품평을 일일이 확인하는데 많은 시간과 노력이 소요되고, 또한 무성의하게 작성된 상품평들은 오히려 소비자들의 불편을 초래하기도 한다. 이에, 본 연구는 온라인 상품평의 유용성에 영향을 미치는 요인들을 분석하여, 소비자들에게 실제로 도움이 될 수 있는 상품평을 선별적으로 제공하는 예측모형을 도출하는 것을 목적으로 한다. 이를 위해, 텍스트마이닝 기법을 사용하여, 상품평에 포함되어있는 다양한 언어적, 심리적, 지각적 요소들을 추출하였으며, 이러한 요소들 중에서 상품평의 유용성에 영향을 미치는 결정요인이 무엇인지 파악하였다. 특히, 경험재인 의류군과 탐색재인 전자제품군에 대한 상품평의 특성 및 유용성 결정요인이 상이할 수 있음을 고려하여, 제품군별로 상품평의 특성을 비교하고, 각각의 결정요인을 도출하였다. 본 연구에는 아마존닷컴(Amazon.com)의 의류군 상품평 7,498건과 전자제품군 상품평 106,962건이 사용되었다. 또한, 언어분석 소프트웨어인 LIWC(Linguistic Inquiry and Word Count)를 활용하여 상품평에 포함된 특징들을 추출하였고, 이후, 데이터마이닝 소프트웨어인 RapidMiner를 사용하여, 회귀분석을 통한, 결정요인 분석을 수행하였다. 본 연구결과, 제품에 대한 리뷰어의 평가가 높고, 상품평에 포함된 전체 단어 수가 많으며, 상품평의 내용에 지각적 과정이 많이 포함되어 있는 반면, 부정적 감정은 적게 포함된 상품평들이 두 제품 모두에서 유용하다고 인식되는 것을 알 수 있었다. 그 외, 의류군의 경우, 비교급 표현이 많고, 전문성 지수는 낮으며, 한 문장에 포함된 단어 수가 적은 간결한 상품평이 유용하다고 인식되고 있었으며, 전자제품의 경우, 전문성 지수가 높고, 분석적이며, 진솔한 표현이 많고, 인지적 과정과 긍정적 감정(PosEmo)이 많이 포함된 상품평이 유용하게 인식되고 있었다. 이러한 연구결과는 향후, 소비자들이 효과적으로 유용한 상품평들을 확인하는데 도움이 될 것으로 기대된다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).

MMORPG에서 길드 구성원들의 사회적 지지와 심리적 요인들이 플로우 및 충성도에 미치는 영향 (The Impacts of Social Support and Psychological Factors on Guild Members' Flow and Loyalty in MMORPG)

  • 강주선;고윤정;고일상
    • Asia pacific journal of information systems
    • /
    • 제19권3호
    • /
    • pp.69-98
    • /
    • 2009
  • We investigated what factors motivate gamers to participate in a guild and why they continue to be engaged as members of the guild. We find that, based on the result of focus group interviews with MMORPG gamers, social support and self-esteem factors play important roles. Considering both prior research and the focus group interviews we have conducted, we define social support and character control as independent variables. Character identity, guild identity, and self-esteem are proposed as mediating variables while guild flow and game loyalty as dependent variables. Accordingly, we develop the research model and hypotheses, and verify them empirically. Based on our experiences of playing the WoW game, we proposed a research model and conducted focus-group interviews (FGIs). FGIs involve formulating a hypothesis and then collecting some relevant data. FGIs were conducted face-to-face with students of C University in Korea. We formulated structured interview schedules, and the questions were based on our research variables and personal experiences. The questions for the interviews encompassed the following areas: (a) the demographic characteristics of the focus group; (b) the number of years for which respondents had played online games; (c) the motive for starting a game; (d) the number of game-characters assumed by each gamer; (e) the type of game played; and (f) other issues such as the reasons for involvement in the play, the willingness to reuse the game in case new versions were released, etc. On average, it took two hours to interview each of three groups. A primary set of FGIs was conducted with three groups on the premise that there would be some differences caused by character race (Horde vs. Alliance) or by playable server (Normal vs. Combat). With respect to the manner of playing, we found that guild members shared information, felt a sense of belonging, and played computer games for quite a long time through the guild; however, they did not undergo these experiences when playing alone. Gamers who belonged to a specific guild helped other players without expecting compensation for that, freely shared information about the game, gave away items for free, and more generous with other members who made mistakes. The guild members were aware of the existence other members and experienced a sense of belonging through interactions with, and evaluations from, other players. It was clear that social support was shown within the guild and that it played an important role as a major research variable. Based on the results of the first FGIs, a second set of in-depth FGIs was carried out with a focus on the psychology of the individual within the guild and the social community of the guild. The second set of FGIs also focused on the guild's offline meetings. Gamers, over all, recognize the necessity of joining a community, not only off-line but also online world of the guild. They admit that the guild is important for them to easily and conveniently enjoy playing online computer games. The active behavior and positive attitudes of existing guild members can motivate new members of the guild to adapt themselves to the guild environment. They then adopt the same behaviors and attitudes of established guild members. In this manner, the new members of the guild strengthen the bonds with other gamers while feeling a sense of belonging, and developing social identity, thereby. It was discovered that the interaction among guild members and the social support encouraged new gamers to quickly develop a sense of social identity and increase their self-esteem. The guild seemed to play the role of socializing gamers. Sometimes, even in the real world, the guild members helped one another; therefore, the features of the guild also spilled over to the offline environment. We intend to use self-esteem, which was found through the second set of FGIs, as an important research variable. To collect data, an online survey was designed with a questionnaire to be completed by WoW gamers, who belong to a guild. The survey was registered on the best three domestic game-sites: 'WoW playforum,' 'WoW gamemeca,' and 'Wow invent.' The selected items to be measured in the questionnaire were decided based on prior research and data from FGIs. To verify the content of the questionnaire, we carried out a pilot test with the same participants to point out ambiguous questions as a way to ensure maximum accuracy of the survey result. A total of 244 responses were analyzed from the 250 completed questionnaires. The SEM analysis was used to test goodness-of-fit of the model. As a result, we found important results as follows: First, according to the statistics, social support had statistically significant impacts on character control, character identity, guild identity and self-esteem. Second, character control had significant effects on character identity, guild identity and self-esteem. Third, character identity shows its clear impact on self-esteem and game loyalty. Fourth, guild identity affected self-esteem, guild flow and game loyalty. Fifth, self-esteem had a positive influence on the guild flow. These days, the number of virtual community is rising along with its significance largely because of the nature of the online games. Accordingly, this study is designed to clarify the psychological relationship between gamers within the guild that has been generally established by gamers to play online games together. This study focuses on the relationships in which social support influences guild flow or game loyalty through character control, character identity, guild identity, and self-esteem, which are present within a guild in the MMORPG game environment. The study results are as follows. First, the effects of social support on character control, character identity, guild identity and self-esteem are proven to be statistically significant. It was found that character control improves character identity, guild identity and self-esteem. Among the seven variables, social support, which is derived from FGIs, plays an important role in this study. With the active support of other guild members, gamers can improve their ability to develop good characters and to control them. Second, character identity has a positive effect on self-esteem and game loyalty, while guild identity has a significant effect on self-esteem, guild flow and game loyalty. Self-esteem affects guild flow. It was found that the higher the character and guild identities become, the greater the self-esteem is established. Contrary to the findings of prior research, our study results indicate that the relationship between character identity and guild flow is not significant. Rather, it was found that character identity directly affects game players' loyalty. Even though the character identity had no direct effect on increasing guild flow, it has indirectly affected guild flow through self-esteem. The significant relationship between self-esteem and guild flow indicates that gamers achieve flow, i.e., a feeling of pleasure and excitement through social support. Several important implications of this study should be noted. First, both qualitative and quantitative methods were used to conduct this study. Through FGIs, it was observed that both social support and self-esteem are important variables. Second, because guilds had been rarely studied, this research is expected to play an important role in the online community. Third, according to the result, six hypotheses (H1, H5, H6, H7, H8, and H11) setup based on FGIs, were statistically significant; thus, we can suggest the corresponding relationships among the variables as a guideline for follow-up research. Our research is significant as it has following implications: first, the social support of the guild members is important when establishing character control, character identity, guildidentity and self-esteem. It is also a major variable that affects guild flow and game loyalty. Second, character control when improved by social support shows notable influence on the development of character identity, guild identity and self-esteem. Third, character identity and guild identity are major factors to help establish gamers' own self-esteem. Fourth, character identity affects guild flow through self-esteem and game loyalty. The gamers usually express themselves through characters; the higher character identity is, the more loyalty a gamer has. Fifth, guild identity, established within the guild, has clear effects on self-esteem, guild flow and game loyalty. Sixth, qualitative and quantitative methods are employed to conduct this study. Based on the results of focus group interviews and SEM analysis, we find that the social support by guild members and psychological factors are significant in strengthening the flow of guild and loyalty to the game. As such, game developers should provide some extra functions for guild community, through which gamers can play online games in collaboration with one another. Also, we suggest that positive self-esteem which is built up through social support can help gamers achieve higher level of flow and satisfaction, which will consequently contribute to minimizing the possibility for the players to develop negative attitude toward the guild they belong to.

시맨틱 웹 자원의 랭킹을 위한 알고리즘: 클래스중심 접근방법 (A Ranking Algorithm for Semantic Web Resources: A Class-oriented Approach)

  • 노상규;박현정;박진수
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.31-59
    • /
    • 2007
  • We frequently use search engines to find relevant information in the Web but still end up with too much information. In order to solve this problem of information overload, ranking algorithms have been applied to various domains. As more information will be available in the future, effectively and efficiently ranking search results will become more critical. In this paper, we propose a ranking algorithm for the Semantic Web resources, specifically RDF resources. Traditionally, the importance of a particular Web page is estimated based on the number of key words found in the page, which is subject to manipulation. In contrast, link analysis methods such as Google's PageRank capitalize on the information which is inherent in the link structure of the Web graph. PageRank considers a certain page highly important if it is referred to by many other pages. The degree of the importance also increases if the importance of the referring pages is high. Kleinberg's algorithm is another link-structure based ranking algorithm for Web pages. Unlike PageRank, Kleinberg's algorithm utilizes two kinds of scores: the authority score and the hub score. If a page has a high authority score, it is an authority on a given topic and many pages refer to it. A page with a high hub score links to many authoritative pages. As mentioned above, the link-structure based ranking method has been playing an essential role in World Wide Web(WWW), and nowadays, many people recognize the effectiveness and efficiency of it. On the other hand, as Resource Description Framework(RDF) data model forms the foundation of the Semantic Web, any information in the Semantic Web can be expressed with RDF graph, making the ranking algorithm for RDF knowledge bases greatly important. The RDF graph consists of nodes and directional links similar to the Web graph. As a result, the link-structure based ranking method seems to be highly applicable to ranking the Semantic Web resources. However, the information space of the Semantic Web is more complex than that of WWW. For instance, WWW can be considered as one huge class, i.e., a collection of Web pages, which has only a recursive property, i.e., a 'refers to' property corresponding to the hyperlinks. However, the Semantic Web encompasses various kinds of classes and properties, and consequently, ranking methods used in WWW should be modified to reflect the complexity of the information space in the Semantic Web. Previous research addressed the ranking problem of query results retrieved from RDF knowledge bases. Mukherjea and Bamba modified Kleinberg's algorithm in order to apply their algorithm to rank the Semantic Web resources. They defined the objectivity score and the subjectivity score of a resource, which correspond to the authority score and the hub score of Kleinberg's, respectively. They concentrated on the diversity of properties and introduced property weights to control the influence of a resource on another resource depending on the characteristic of the property linking the two resources. A node with a high objectivity score becomes the object of many RDF triples, and a node with a high subjectivity score becomes the subject of many RDF triples. They developed several kinds of Semantic Web systems in order to validate their technique and showed some experimental results verifying the applicability of their method to the Semantic Web. Despite their efforts, however, there remained some limitations which they reported in their paper. First, their algorithm is useful only when a Semantic Web system represents most of the knowledge pertaining to a certain domain. In other words, the ratio of links to nodes should be high, or overall resources should be described in detail, to a certain degree for their algorithm to properly work. Second, a Tightly-Knit Community(TKC) effect, the phenomenon that pages which are less important but yet densely connected have higher scores than the ones that are more important but sparsely connected, remains as problematic. Third, a resource may have a high score, not because it is actually important, but simply because it is very common and as a consequence it has many links pointing to it. In this paper, we examine such ranking problems from a novel perspective and propose a new algorithm which can solve the problems under the previous studies. Our proposed method is based on a class-oriented approach. In contrast to the predicate-oriented approach entertained by the previous research, a user, under our approach, determines the weights of a property by comparing its relative significance to the other properties when evaluating the importance of resources in a specific class. This approach stems from the idea that most queries are supposed to find resources belonging to the same class in the Semantic Web, which consists of many heterogeneous classes in RDF Schema. This approach closely reflects the way that people, in the real world, evaluate something, and will turn out to be superior to the predicate-oriented approach for the Semantic Web. Our proposed algorithm can resolve the TKC(Tightly Knit Community) effect, and further can shed lights on other limitations posed by the previous research. In addition, we propose two ways to incorporate data-type properties which have not been employed even in the case when they have some significance on the resource importance. We designed an experiment to show the effectiveness of our proposed algorithm and the validity of ranking results, which was not tried ever in previous research. We also conducted a comprehensive mathematical analysis, which was overlooked in previous research. The mathematical analysis enabled us to simplify the calculation procedure. Finally, we summarize our experimental results and discuss further research issues.

클라우드 환경에서 MongoDB 기반의 비정형 로그 처리 시스템 설계 및 구현 (Design and Implementation of MongoDB-based Unstructured Log Processing System over Cloud Computing Environment)

  • 김명진;한승호;최운;이한구
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.71-84
    • /
    • 2013
  • 컴퓨터 시스템 운용 간에 발생하는 많은 정보들이 기록되는 로그데이터는 컴퓨터 시스템 운용 점검, 프로세스의 최적화, 사용자 최적화 맞춤형 제공 등 다방면으로 활용되고 있다. 본 논문에서는 다양한 종류의 로그데이터들 중에서 은행에서 발생하는 대용량의 로그데이터를 처리하기 위한 클라우드 환경 하에서의 MongoDB 기반 비정형 로그 처리시스템을 제안한다. 은행업무간 발생하는 대부분의 로그데이터는 고객의 업무처리 프로세스 간에 발생하며, 고객 업무 프로세스 처리에 따른 로그데이터를 수집, 저장, 분류, 분석하기 위해서는 별도로 로그데이터를 처리하는 시스템을 구축해야만 한다. 하지만 기존 컴퓨팅환경 하에서는 폭발적으로 증가하는 대용량 비정형 로그데이터 처리를 위한 유연한 스토리지 확장성 기능, 저장된 비정형 로그데이터를 분류, 분석 처리할 수 있는 기능을 구현하기가 매우 어렵다. 이에 따라 본 논문에서는 클라우드 컴퓨팅 기술을 도입하여 기존 컴퓨팅 인프라 환경의 분석 도구 및 관리체계에서 처리하기 어려웠던 비정형 로그데이터를 처리하기 위한 클라우드 환경기반의 로그데이터 처리시스템을 제안하고 구현하였다. 제안한 본 시스템은 IaaS(Infrastructure as a Service) 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하며 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함한다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 게다가, HDFS(Hadoop Distributed File System)을 도입함으로써 축적된 로그데이터를 블록단위로 복제본을 생성하여 저장관리하기 때문에 본 시스템은 시스템 장애와 같은 상황에서 시스템이 멈추지 않고 작동할 수 있는 자동복구 기능을 제공한다. 마지막으로, 본 시스템은 NoSQL 기반의 MongoDB를 이용하여 분산 데이터베이스를 구축함으로써 효율적으로 비정형로그데이터를 처리하는 기능을 제공한다. MySQL과 같은 관계형 데이터베이스는 복잡한 스키마 구조를 가지고 있기 때문에 비정형 로그데이터를 처리하기에 적합하지 않은 구조를 가지고 있다. 또한, 관계형 데이터베이스의 엄격한 스키마 구조는 장기간 데이터가 축적되거나, 데이터가 급격하게 증가할 때 저장된 데이터를 분할하여 여러 노드에 분산시키는 노드 확장이 어렵다는 문제점을 가지고 있다. NoSQL은 관계형 데이터베이스에서 제공하는 복잡한 연산을 지원하지는 않지만 데이터가 빠르게 증가할 때 노드 분산을 통한 데이터베이스 확장이 매우 용이하며 비정형 데이터를 처리하는데 매우 적합한 구조를 가지고 있는 비관계형 데이터베이스이다. NoSQL의 데이터 모델은 주로 키-값(Key-Value), 컬럼지향(Column-oriented), 문서지향(Document-Oriented)형태로 구분되며, 제안한 시스템은 스키마 구조가 자유로운 문서지향(Document-Oriented) 데이터 모델의 대표 격인 MongoDB를 도입하였다. 본 시스템에 MongoDB를 도입한 이유는 유연한 스키마 구조에 따른 비정형 로그데이터 처리의 용이성뿐만 아니라, 급격한 데이터 증가에 따른 유연한 노드 확장, 스토리지 확장을 자동적으로 수행하는 오토샤딩 (AutoSharding) 기능을 제공하기 때문이다. 본 논문에서 제안하는 시스템은 크게 로그 수집기 모듈, 로그 그래프생성 모듈, MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈로 구성되어져 있다. 로그 수집기 모듈은 각 은행에서 고객의 업무 프로세스 시작부터 종료 시점까지 발생하는 로그데이터가 클라우드 서버로 전송될 때 로그데이터 종류에 따라 데이터를 수집하고 분류하여 MongoDB 모듈과 MySQL 모듈로 분배하는 기능을 수행한다. 로그 그래프생성 모듈은 수집된 로그데이터를 분석시점, 분석종류에 따라 MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈에 의해서 분석되어진 결과를 사용자에게 웹 인터페이스 형태로 제공하는 역할을 한다. 실시간적 로그데이터분석이 필요한 로그데이터는 MySQL 모듈로 저장이 되어 로그 그래프생성 모듈을 통하여 실시간 로그데이터 정보를 제공한다. 실시간 분석이 아닌 단위시간당 누적된 로그데이터의 경우 MongoDB 모듈에 저장이 되고, 다양한 분석사항에 따라 사용자에게 그래프화해서 제공된다. MongoDB 모듈에 누적된 로그데이터는 Hadoop기반 분석모듈을 통해서 병렬 분산 처리 작업이 수행된다. 성능 평가를 위하여 로그데이터 삽입, 쿼리 성능에 대해서 MySQL만을 적용한 로그데이터 처리시스템과 제안한 시스템을 비교 평가하였으며 그 성능의 우수성을 검증하였다. 또한, MongoDB의 청크 크기별 로그데이터 삽입 성능평가를 통해 최적화된 청크 크기를 확인하였다.