• 제목/요약/키워드: User

검색결과 29,116건 처리시간 0.06초

과학기술 및 학술 연구보고서 서비스 제공을 위한 국가연구개발사업 관련 법령 입법론 -저작권법상 공공저작물의 자유이용 제도와 연계를 중심으로- (A Study on Improvements on Legal Structure on Security of National Research and Development Projects)

  • 강선준;원유형;최산;김준혁;김슬기
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2015년도 춘계 학술대회 논문집
    • /
    • pp.545-570
    • /
    • 2015
  • 현대의 지식정보화 사회에서는 과학기술 및 학술적인 저작물은 문화적 경제적 부가가치를 창출할 것으로 기대된다. 국민의 세금이 투입된 공공기관 특히 출연(연)의 공공저작물은 지식재산권 상의 제약 혹은 국가의 안전 등에 영향이 없는 한 국민들에게 무상의 자유로운 접근과 이용을 보장해야 한다. 이러한 사회적 요구와 시대적 추세에 따라 학술정보의 오픈 엑세스 운동이 확산되어 가고 있다. 우리 정부는 NDSL, NTIS 등 과학기술정보서비스를 통하여 R&D과제 기획, 또는 관련 사업을 조정 평가할 때 중복투자를 사전에 방지할 수 있고 연구자가 R&D 관련 정보 활용을 극대화 하여 국가연구개발사업의 효율적인 관리 및 투자 효율성 향상이 가능하도록 하고 있다. 스마트폰, 태블릿 PC 등 뉴미디어의 확산은 새로운 형태의 전자적 정보서비스의 제공을 요구하고 있으며 공공기관인 출연(연) 등에서 국가연구개발사업 등으로 수행한 연구보고서 등을 과학기술정보서비스를 통해 제공하는 경우 창작자의 권리(author's right)뿐만 아니라 이용자의 권리(user's right)도 동시에 보장하는 것이 기본원칙이자 중요한 당면과제 이다. 공공기관인 출연(연)의 연구보고서는 지식재산권, 연구보안 등과 관련하여 특별한 경우가 아니고는 공익적 목적을 위해 민간에서 활용이 가능하도록 제도화 되어야 하지만 현행 관련 법령상 공공저작물의 권리처리 등 관리가 미흡하여 활용과 자유이용이 제한되고 있는 실정이다. 따라서, 국민의 세금에 의해 작성된 출연(연)의 연구보고서 및 과학기술정보서비스 부분은 공공저작물의 범주에서 선진적 유통체계 마련을 위한 법적 인프라 구축이 필요하다. 입법론과 제도개선으로는 다음과 같은 방안을 검토해야 한다. 첫 번째로 사적자치 등의 이념을 활용하여 저작재산권 귀속 가이드라인 및 계약서 표준(안)을 제시해야 한다. 둘째로 개별법률 혹은 단일 별도법률로 입법화 하는 방안이다. 오픈 엑세스를 저작권 내에 법제화 방안을 검토하고 독일의 입법례를 참조하여 공공재원의 지원을 받는 출연(연)의 연구보고서 등은 학술저작물을 작성한 저작자에게 2차적 이용권을 부여해야 한다. 단일 법률로 "학술 과학기술 연구 성과물에 대한 공공적 접근 및 이용 활성화에 관한 법률"을 제정하여 별도의 내용에 대하여 상세하고 자세한 입법을 해야 한다. 출연(연)이 수행하는 대부분의 연구사업은 국가연구개발사업 관리규정의 적용을 받으며 특히, 과학기술정보 서비스 및 연구보고서와 관련된 조항은 이미 상당부분 제도적으로 정착이 된 점 제반사항을 고려해볼 때, 저작권법과의 조화로운 입법이 필요하다. 장기적으로는 기존에 과학기술정보서비스 및 연구보고서 관련 조항을 개정하고 국가연구개발사업 관리규정을 법률로 승격시켜 저작권법상 공공저작물 자유이용 제도와 오프 엑세스 조항과 유기적으로 연계될 수 있도록 조항을 제정하는 입법방식이 바람직하다.

  • PDF

시맨틱 웹 자원의 랭킹을 위한 알고리즘: 클래스중심 접근방법 (A Ranking Algorithm for Semantic Web Resources: A Class-oriented Approach)

  • 노상규;박현정;박진수
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.31-59
    • /
    • 2007
  • We frequently use search engines to find relevant information in the Web but still end up with too much information. In order to solve this problem of information overload, ranking algorithms have been applied to various domains. As more information will be available in the future, effectively and efficiently ranking search results will become more critical. In this paper, we propose a ranking algorithm for the Semantic Web resources, specifically RDF resources. Traditionally, the importance of a particular Web page is estimated based on the number of key words found in the page, which is subject to manipulation. In contrast, link analysis methods such as Google's PageRank capitalize on the information which is inherent in the link structure of the Web graph. PageRank considers a certain page highly important if it is referred to by many other pages. The degree of the importance also increases if the importance of the referring pages is high. Kleinberg's algorithm is another link-structure based ranking algorithm for Web pages. Unlike PageRank, Kleinberg's algorithm utilizes two kinds of scores: the authority score and the hub score. If a page has a high authority score, it is an authority on a given topic and many pages refer to it. A page with a high hub score links to many authoritative pages. As mentioned above, the link-structure based ranking method has been playing an essential role in World Wide Web(WWW), and nowadays, many people recognize the effectiveness and efficiency of it. On the other hand, as Resource Description Framework(RDF) data model forms the foundation of the Semantic Web, any information in the Semantic Web can be expressed with RDF graph, making the ranking algorithm for RDF knowledge bases greatly important. The RDF graph consists of nodes and directional links similar to the Web graph. As a result, the link-structure based ranking method seems to be highly applicable to ranking the Semantic Web resources. However, the information space of the Semantic Web is more complex than that of WWW. For instance, WWW can be considered as one huge class, i.e., a collection of Web pages, which has only a recursive property, i.e., a 'refers to' property corresponding to the hyperlinks. However, the Semantic Web encompasses various kinds of classes and properties, and consequently, ranking methods used in WWW should be modified to reflect the complexity of the information space in the Semantic Web. Previous research addressed the ranking problem of query results retrieved from RDF knowledge bases. Mukherjea and Bamba modified Kleinberg's algorithm in order to apply their algorithm to rank the Semantic Web resources. They defined the objectivity score and the subjectivity score of a resource, which correspond to the authority score and the hub score of Kleinberg's, respectively. They concentrated on the diversity of properties and introduced property weights to control the influence of a resource on another resource depending on the characteristic of the property linking the two resources. A node with a high objectivity score becomes the object of many RDF triples, and a node with a high subjectivity score becomes the subject of many RDF triples. They developed several kinds of Semantic Web systems in order to validate their technique and showed some experimental results verifying the applicability of their method to the Semantic Web. Despite their efforts, however, there remained some limitations which they reported in their paper. First, their algorithm is useful only when a Semantic Web system represents most of the knowledge pertaining to a certain domain. In other words, the ratio of links to nodes should be high, or overall resources should be described in detail, to a certain degree for their algorithm to properly work. Second, a Tightly-Knit Community(TKC) effect, the phenomenon that pages which are less important but yet densely connected have higher scores than the ones that are more important but sparsely connected, remains as problematic. Third, a resource may have a high score, not because it is actually important, but simply because it is very common and as a consequence it has many links pointing to it. In this paper, we examine such ranking problems from a novel perspective and propose a new algorithm which can solve the problems under the previous studies. Our proposed method is based on a class-oriented approach. In contrast to the predicate-oriented approach entertained by the previous research, a user, under our approach, determines the weights of a property by comparing its relative significance to the other properties when evaluating the importance of resources in a specific class. This approach stems from the idea that most queries are supposed to find resources belonging to the same class in the Semantic Web, which consists of many heterogeneous classes in RDF Schema. This approach closely reflects the way that people, in the real world, evaluate something, and will turn out to be superior to the predicate-oriented approach for the Semantic Web. Our proposed algorithm can resolve the TKC(Tightly Knit Community) effect, and further can shed lights on other limitations posed by the previous research. In addition, we propose two ways to incorporate data-type properties which have not been employed even in the case when they have some significance on the resource importance. We designed an experiment to show the effectiveness of our proposed algorithm and the validity of ranking results, which was not tried ever in previous research. We also conducted a comprehensive mathematical analysis, which was overlooked in previous research. The mathematical analysis enabled us to simplify the calculation procedure. Finally, we summarize our experimental results and discuss further research issues.

로봇 인터페이스 활용을 위한 가속도 센서 기반 제스처 인식 (Accelerometer-based Gesture Recognition for Robot Interface)

  • 장민수;조용석;김재홍;손주찬
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.53-69
    • /
    • 2011
  • 로봇 자체 또는 로봇에 탑재된 콘텐츠와의 상호작용을 위해 일반적으로 영상 또는 음성 인식 기술이 사용된다. 그러나 영상 음성인식 기술은 아직까지 기술 및 환경 측면에서 해결해야 할 어려움이 존재하며, 실적용을 위해서는 사용자의 협조가 필요한 경우가 많다. 이로 인해 로봇과의 상호작용은 터치스크린 인터페이스를 중심으로 개발되고 있다. 향후 로봇 서비스의 확대 및 다양화를 위해서는 이들 영상 음성 중심의 기존 기술 외에 상호보완적으로 활용이 가능한 인터페이스 기술의 개발이 필요하다. 본 논문에서는 로봇 인터페이스 활용을 위한 가속도 센서 기반의 제스처 인식 기술의 개발에 대해 소개한다. 본 논문에서는 비교적 어려운 문제인 26개의 영문 알파벳 인식을 기준으로 성능을 평가하고 개발된 기술이 로봇에 적용된 사례를 제시하였다. 향후 가속도 센서가 포함된 다양한 장치들이 개발되고 이들이 로봇의 인터페이스로 사용될 때 현재 터치스크린 중심으로 된 로봇의 인터페이스 및 콘텐츠가 다양한 형태로 확장이 가능할 것으로 기대한다.

수자원 분야 공익형 기술가치평가 시스템에 대한 연구 (A Study on Public Interest-based Technology Valuation Models in Water Resources Field)

  • 류승미;성태응
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.177-198
    • /
    • 2018
  • 최근 경제재로서 수자원(Water Resources)의 속성이 공공재 성격을 동시에 띠면서 수자원기술의 측정과 성과 관리 체계를 확보하고 활용해야 할 필요성이 제기되고 있다. 그 동안 수자원기술의 평가는 대부분 순현재가치(NPV)나 비용편익효과(B/C)를 바탕으로 경제성 평가(Feasibility Study) 혹은 기술(환경)영향평가(Technology Assessment)로 수행되어 왔으며, 연구성과의 확산과 피드백을 받을 수 있는 기술 기반 사업의 경제적 가치를 객관적으로 평가하는 모델은 체계화되지 않았다. 그리하여, 본 연구에서는 K-water(한국수자원공사)가 담당하고 있는 수자원분야의 기술적 특성에 적합한 기술평가 체계를 구축할 필요성을 느끼고, 공익형 수자원기술에 대한 기술가치평가 모델을 개발하여 사례를 실증하고자 한다. 본 연구에 적용된 K-water 평가대상기술은 공공재로서, 사회전반에 기여한 가치 및 성과를 측정하고 관리할 수 있는 도구로 활용 가능하다. 예를 들면, 사회전반에 기여한 가치를 산출하여, 편익의 파급효과에 대한 성과 홍보자료, 혹은 비용 투입 당위성에 대한 근거자료로 활용할 수 있고, 공공기술의 특성상 대규모 연구개발 투입 비용에 대한 정당성을 확보할 수 있다. 따라서, 공공재를 다루는 한국의 대표적 공기업인 K-water가 사업 운영상의 전략을 수립하고 투입개발 비용에 대한 성과산출 근거 기반을 구축할 수 있을 것으로 판단된다. 본 고에서는 K-water가 담당하고 있는 수자원분야의 기술적 특성에 적합한 기술평가 체계를 기반으로, 공익형 수자원기술에 대한 기술가치평가 모델을 개발하여 사례를 실증하였다. 특히, 일본 산업기술종합연구소(AIST)의 평가방법론을 활용하여 연관 편익항목을 기준으로 비용계정에 매칭시킨 후, 기존의 비용-편익 접근법과 FCF(Free Cash Flow)법의 평가체계를 활용하는 'K-water 고유모델'을 제시하였으며 이를 통해 K-water 연구성과 관리체계 상의 파이프라인을 구축하는 동시에 "해수담수화" 관련 기술에 대한 검증을 수행하였다. 수자원 분야 기술의 특성을 반영한 웹기반 가치평가시스템의 설계 구성로직과 평가프로세스를 분석하며, 기술통합관리시스템 상의 공익형 및 수익형 기술가치를 산출하기 위한 각 모델별 참조정보 및 DB 연계로직도 살펴본다. 종래의 타 분야 기술가치평가 시스템이 지닌 재무적 데이터 기반의 사업가치 산출로직에 수자원 특성이 반영된 정성평가지표의 정량화 지수를 함께 반영한 하이브리드형 평가모듈과 실제 웹기반 평가의 UI 구성화면을 검토한다. K-water의 가치평가 모형은 공익형과 수익형 수자원 기술을 구분하여 평가하게 되는데, 먼저 수익형 기술가치평가는 "기술의 경제성"이라고 하는 특성상 외부 산업유형의 수익(Profit)특성을 반영하여 화면을 설계 가능하다. 예를 들어 K-water 기술인벤토리 수도부문 기술은 수처리 멤브레인과 같이 수익 지향 기술이 다수 분포된다. 반면에, 공익형 기술가치평가는 공공의 편익(Benefit)과 비용(Cost)특성을 반영하여 화면을 설계하게 되는데, 댐과 같이 편익을 지향하는 기술을 평가하는데 활용된다. 또한 본 고에서 제시된 비용-편익 기반의 공익형 기술가치평가 모형(K-water 고유 평가모델)에 대한 적정성 검토를 위해 사회적 수명(20년)을 지닌 수자원 기술의 편익흐름 추정으로부터 실제 사례에 적용해 보았으며, 향후에는 다양한 사업환경 특성을 반영한 비즈니스 모델별 평가모형 검증을 추가적으로 수행하고자 한다.

경북지역 장수노인의 저작능력과 건강상태 (The Relationship Between Chewing Ability and Health Status in the Long-lived Elderly of Kyungpook Area)

  • 이희경;이영권
    • Journal of Yeungnam Medical Science
    • /
    • 제16권2호
    • /
    • pp.200-207
    • /
    • 1999
  • 본 연구는 구강보건측면에서의 장수를 위한 노인생활지침을 설정하기 위한 기초자료를 제공하기 위해 85세 이상 노인들의 구강검진을 통하여 구강내 실태조사와 저작능력의 상태를 파악하고 구강상태에 따른 건강상태 및 신체계측치를 비교함으로 다음과 같은 결과를 얻었다. 1. 전체 97명 중 남자가 27.8%, 여자가 72.2%이었고, 평균연령은 $88.14{\pm}3.20$세 이었다. 조사대상자의 노인들이 53.6%가 건강하다고 하였다. 조사 대상자의 평균키는 $148.8{\pm}11.2cm$, 평균몸무게는 $46.9{\pm}10.5kg$, 평균BMI는 $21.2{\pm}3.5kg/m^2$, 평균체지방율은 $26.7{\pm}6.9%$, 평균제지방율은 $73.0{\pm}7.1%$, 평균체수분율은 $53.4{\pm}5.2%$로 나타났다. 2. 잔존치아수는 $3.50{\pm}5.71$개로 상악이 $1.08{\pm}2.88$개, 하악이 $2.41{\pm}3.76$개로 나타났고 최대 잔존치아 수는 22개이었고, 치아가 없는 노인이 전체의 76.3%나 되었다. 저작양상은 상,하 의치를 사용하는 노인이 전체의 52.6%, 자기치아만으로 저작(자연치 교합)하는 노인이 23.7%, 치아도 없으며 의치도 사용하지 않는 노인이 23.7%로 나타났다. 3. 저작양상에 따른 주관적 건강상태와 소화상태, 저작능력을 보면 의치 교합군에서 47.1%, 치아도 없이 의치도 사용 안하는 군에서는 56.5%, 자연치교합군에서는 65.2%가 건강하다고 했고, 소화상태도 의치군이 82.4%, 치아도 없이 의치도 사용 안하는 군이 65.2%, 자연치 교합군이 73.9%로 좋다고 했고, 저작능력도 의치군이 90.2%, 치아도 없이 의치도 사용 안하는 군이 60.9%, 자연치 교합군이 65.2%로 좋다고 하였다. 4. 저작영상에 따른 키, 몸무게, 체지방율, 제지방율, 총수분량을 비교하면 의치교협군에서 $150.0{\pm}10.7cm$, $49.0{\pm}10.9kg$, $26.9{\pm}6.6%$, $72.7{\pm}7.0%$, $53.2{\pm}5.1%$이며 치아도 없이 의치도 사용 안하는 군에서는 $142.7{\pm}6.0cm$, $43.2{\pm}5.5kg$, $29.5{\pm}7.2%$, $70.8{\pm}6.9%$, $51.8{\pm}5.0%$이고 자연치교합군에서는 $152.3{\pm}14.1cm$, $45.9{\pm}12.6kg$, $23.4{\pm}6.0%$, $75.9{\pm}6.9%$, $55.6{\pm}5.1%$로 나타났다. 저작양상 대한 신체계측치는 키, 체지방율, 제지방율, 총수분율에서 의치를 사용하는 군, 자연치교합군, 치아도 없이 의치도 사용 안하는 군의 순으로 유의하게 양호한 것으로 나타났다.

  • PDF

간접변환방식 DR장비에서 CsI:Tl과 Gd2O2S의 검출기 화질 평가 (Image Quality Evaluation of CsI:Tl and Gd2O2S Detectors in the Indirect-Conversion DR System)

  • 공창기;최남길;정묘영;송종남;김욱;한재복
    • 한국방사선학회논문지
    • /
    • 제11권1호
    • /
    • pp.27-35
    • /
    • 2017
  • 본 연구의 목적은 DR (digital radiography) 장비에서 팬텀을 이용하여 간접변환방식의 CsI:Tl 검출기와 $Gd_2O_2S$ 검출기를 중심으로 두께가 두꺼운 흉부 팬텀과 중간 두께의 대퇴부 팬텀, 그리고 피사체의 두께가 얇은 손 팬텀의 영상을 획득하고 SNR과 CNR을 분석하여 검출기의 특성을 알아보고자 하였다. 피사체 두께 변화에 따른 SNR과 CNR을 측정한 결과 중간 두께의 대퇴부 팬텀과 두께가 얇은 손 팬텀을 촬영 하였을 때 SNR과 CNR은 $Gd_2O_2S$ 검출기보다 CsI:Tl 검출기에서 높게 나타났음을 확인 할 수 있었다. 그러나 두께가 두꺼운 흉부 팬텀을 사용하였을 때는 $Gd_2O_2S$ 검출기의 SNR이 80~125 kVp 일 때와 CNR이 80~110 kVp 일 때 CsI:Tl 검출기 보다 값이 높게 나타났고, 저관전압에서 고관전압으로 갈수록 SNR과 CNR은 모두 증가하였다. 중간 두께의 대퇴부 팬텀에서 CsI:Tl 검출기의 SNR과 CNR은 40~50 kVp 일 때 증가하다 고관전압으로 갈수록 감소하는 것을 확인 할 수 있었고, $Gd_2O_2S$ 검출기의 SNR과 CNR은 40~60 kVp 일 때 증가하다 고관전압으로 갈수록 감소하는 것을 확인 할 수 있었다. 두께가 얇은 손 팬텀에서 CsI:Tl 검출기의 SNR과 CNR은 저관전압에서 감소하다가 고관전압으로 갈수록 증가하면서 100~110 kVp에서는 감소하였고, $Gd_2O_2S$ 검출기의 SNR과 CNR은 고관전압으로 갈수록 감소하는 것을 확인하였다. MTF는 0.5~3 lp/mm에서 CsI:Tl 검출기가 $Gd_2O_2S$ 검출기보다 6.02~90.90%로 높음 보여주고 있고, DQE는 0.5~3 lp/mm에서 CsI:Tl 검출기가 $Gd_2O_2S$ 검출기보다 66.67~233.33% 높음 보여주고 있다. 결론적으로 MTF와 DQE의 비교에서는 CsI:Tl 검출기가 $Gd_2O_2S$ 검출기보다 높게 나타났지만, 두꺼운 흉부팬텀에서 일정 관전압 구간에서는 저가의 $Gd_2O_2S$ 검출기가 고가의 CsI:Tl 검출기보다 SNR과 CNR이 높다는 것을 확인하였다. 흉부 X선 검사 시 CsI:Tl 검출기보다 $Gd_2O_2S$ 검출기를 사용하여 우수한 화질의 흉부영상을 구현함으로써 검사에 유용할 것으로 판단되어지며, 사용자 입장에서 검출기 형태를 결정 할 때 가격대비 성능을 고려 해볼 사항으로 판단된다.

스마트 전시환경에서 부스 추천시스템의 사용자 의도에 관한 조사연구 (Analyzing the User Intention of Booth Recommender System in Smart Exhibition Environment)

  • 최재호;상균영;문현실;최일영;김재경
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.153-169
    • /
    • 2012
  • 전시회는 새로운 상품이나 서비스를 현재 고객들과 미래의 잠재고객들에게 홍보하기 위해 개최하는 효과적인 마케팅 수단으로 중요하다. 기업들은 전시회에 참여를 통해 현재 고객 및 잠재고객들과 대면접촉을 함으로써 기업의 이미지 제고 및 새로운 판로를 확보할 수 있다. 이처럼 전시회의 경제적 중요성이 커짐에 따라, 전시주최자들은 참여기업 및 참관객을 유치하기 위하여 새로운 IT 기술을 전시회에 적용하고 있을 뿐만 아니라 연구자들 또한 참관객의 관람패턴을 분석하기 위하여 다양한 연구를 시도하고 있다. 최근에는 스마트 기술이 발전함으로써 전시 공간 내에서 참관객의 활동을 실시간으로 모니터링 할 수 있어 온라인 전시환경처럼 오프라인 전시회를 방문한 참관객의니즈를 실시간으로 추론하여 참관객의 선호에 적합한 서비스를 제공하기 위한 부스 추천시스템에 대한 연구가 활발히 진행되고 있다. 그러나 새로운 기술 개발 측면에서 시스템의 성능을 개선하려는 연구는 지속적으로 진행되어 왔으나 향후 시스템의 개발 방향 및 보급 활성화에 영향을 미치는 요인에 관한 연구들이 부족한 실정이다. 부스 추천시스템은 스마트 전시환경에서 새로 도입되는 기술로 부스 추천시스템에 대한 참관객의 수용 후 재사용 의도는 TAM 관점보다는 부스 추천시스템이 참관객의 선호에 적합한 추천정보를 제공하는가에 초점을 맞출 필요가 있다. 따라서, 본 연구에서는 기존 문헌 고찰을 통해 전시환경에서의 부스 추천시스템에 대한 참관객의 만족 및 재사용 의도에 영향을 주는 요인을 도출하여 연구모형을 설계하였다. 이를 통해 향후 스마트 전시환경에서 부스 추천시스템의 개발과 보급 전략에 있어 유용한 시사점을 제공하고자 하였다. 이러한 연구목적을 달성하기 위하여 2011년 11월 DMC 컬처 오픈 행사에서 부스 추천시스템을 사용한 참관객을 대상으로 설문조사를 실시하였고 회귀분석을 통해 가설을 검증하였다. 그 결과, 참관객의 만족에 영향을 미치는 요인은 부스 추천시스템의 효과성, 편의성, 추천품질, 의외성으로 나타났다. 또한, 부스 추천시스템에 대한 참관객의 만족은 재사용 의도 형성에 긍정적인 영향을 미치는 것으로 밝혀졌다. 본 연구가 가지는 의의는 다음과 같다. 먼저, 본 연구결과를 토대로 스마트 전시환경에서 부스 추천시스템에 대한 참관객의 지속적인 서비스 이용을 유도하기 위한 전략을 수립할 때 고려해야 할 주요한 요인을 실증연구를 통해 구체화시켰다는데 의의가 있다. 또한, 스마트 전시환경에서 부스 추천시스템이 성공적으로 도입 및 활용되기 위해서는 참관객의 수용 전후 차별화된 관리가 필요함을 본 연구결과를 통해 제시하였다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 (Product Community Analysis Using Opinion Mining and Network Analysis: Movie Performance Prediction Case)

  • 진위;김정수;김종우
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.49-65
    • /
    • 2014
  • 구전(WOM: Word of Mouth)는 주변 사람들에게 상품에 대한 경험을 입에서 입으로 전달하는 현상을 말하며 소셜 미디어의 발전으로 온라인 구전(eWOM: Electronic Word of Mouth) 형태로 발전하였다. 구전 효과의 중요성으로 인해서 대부분의 기업들의 자사의 상품이나 서비스에 대한 온라인 구전에 촉각을 세우고 있으며, 특히 영화와 같은 경험재의 경우에는 그 영향력이 더욱 크다. 본 연구에서는 영화 커뮤니티에 대한 사회 네트워크 분석을 통해서 영화 흥행성과 지표인 매출에 미치는 영향요인을 규명하고자 한다. 영화 흥행성과 연구들에서 주요하게 다루어진 영화에 대한 구전의 크기(volume)와 방향성(valence)과 같은 구전 요인들을 추가하여, 구전 네트워크의 중심성 척도를 영향 요인에 고려하였다. 구전의 크기, 방향성, 그리고 3가지 중심성 척도(연결 중심성, 매개 중심성, 근접 중심성)의 최종 영화 매출에 영향 관계를 가설로 설정하였다. 제시한 연구 모형을 검증하기 위하여 대표적인 온라인 영화 커뮤니티 사이트인 IMDb(Internet Movie Database)에서 영화 구전 데이터를 수집하였고, Box-Office-Mojo사이트에서 영화 매출 데이터를 수집하였다. 2012년 9월부터 1년 동안, 주간 Top-10에 포함된 적이 있는 영화들을 대상으로 하였으며, 총 103개의 영화가 선정되어 이 영화들에 대한 메타 데이터와 커뮤니티 데이터가 수집되었다. 영화 커뮤니티 네트워크는 평가자들간의 댓글 관계를 기초로 구축하였다. 본 연구에서 사용한 3가지 중심성 척도는 사회 네트워크 분석 도구인 NodeXL을 사용하여 계산되었으며, 각 영화별 커뮤니티 참여자들의 중심성 척도의 평균값을 활용하였다. 가설 검증의 사전 분석을 위한 상관관계 분석에서는 3가지 중심성 척도간에 상관 관계가 높은 것으로 파악되어서, 각각에 대하여 별도로 회귀분석을 수행하였다. 분석 결과, 기존 연구와 일관성 있게 구전의 크기와 방향성은 영화 성과지표인 최종 매출에 긍정적인 영향을 미치는 것으로 파악되었다. 또한 구전 네트워크 내의 참여자 매개중심성 평균은 영화의 최종 매출에 영향을 미치는 것으로 파악되었다. 하지만 연결중심성과 근접중심성은 최종 매출에 영향을 주지 못하는 것으로 나타났다.

마켓 인사이트를 위한 상품 리뷰의 다차원 분석 방안 (Multi-Dimensional Analysis Method of Product Reviews for Market Insight)

  • 박정현;이서호;임규진;여운영;김종우
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.57-78
    • /
    • 2020
  • 인터넷의 발달로, 소비자들은 이커머스에서 손쉽게 상품 정보를 확인한다. 이때 활용되는 상품 리뷰는 사용자 경험을 토대로 작성되어 구매의사결정의 효율성을 높일 뿐만 아니라 상품 개발에 도움을 주기도 한다. 하지만, 방대한 양의 상품 리뷰에서 관심있는 평가차원의 세부내용을 파악하는 데에는 많은 시간과 노력이 소비된다. 예를 들어, 노트북을 구매하려는 소비자들은 성능, 무게, 디자인과 같은 평가차원에 대해 각 차원별로 비교 상품의 평가를 확인하고자 한다. 따라서 본 논문에서는 상품 리뷰에서 다차원 상품평가 점수를 자동적으로 생성하는 방안을 제안하고자 한다. 본 연구에서 제시하는 방안은 크게 2단계로 구성된다. 사전준비 단계와 개별상품평가 단계로, 대분류 상품군 리뷰를 토대로 사전에 생성된 차원분류모델과 감성분석모델이 개별상품의 리뷰를 분석하게 된다. 차원분류모델은 워드임베딩과 연관분석을 결합함으로써 기존 연구에서 차원과 단어들의 관련성을 찾기 위한 워드임베딩 방식이 문장 내 단어의 위치만을 본다는 한계를 보완한다. 감성분석모델은 정확한 극성 판단을 위해 구(phrase) 단위로 긍부정이 태깅된 학습데이터를 구성하여 CNN 모델을 생성한다. 이를 통해, 개별상품평가 단계에서는 구 단위의 리뷰에 준비된 모델들을 적용하고 평가차원별로 종합함으로써 다차원 평가점수를 얻을 수 있다. 본 논문의 실험에서는 대분류 상품군 리뷰 약 260,000건으로 평가모델을 구성하고, S사와 L사의 노트북 리뷰 각 1,011건과 1,062건을 실험데이터로 활용한다. 차원분류모델은 구로 분해한 개별상품 리뷰를 6개 평가차원으로 분류했고, 기존 워드임베딩 방식보다 연관분석을 결합한 모델의 정확도가 13.7% 증가했음을 볼 수 있었다. 감성분석모델은 문장보다 구 단위로 학습한 모델이 평가차원을 면밀히 분석함으로써 29.4% 더 높은 정확도를 보임을 확인했다. 본 연구를 통해 판매자, 소비자 모두가 상품의 다차원적 비교가 가능하다는 점에서 구매 및 상품 개발에 효율적인 의사결정을 기대할 수 있다.