• 제목/요약/키워드: News articles

검색결과 581건 처리시간 0.025초

언론의 개방담론 논증구조 분석: 스크린쿼터제 관련 의견보도에 대한 Toulmin의 논증모델과 Stock Issue의 적용 (Rhetorical Analysis of News Editorials on 'Screen Quota' Arguments: An Application of Toulmin's Argumentation Model)

  • 박성희
    • 한국언론정보학보
    • /
    • 제36권
    • /
    • pp.399-422
    • /
    • 2006
  • 언론의 의견보도는 우리 사회의 주의 주장을 증폭시키는가, 아니면 대화와 토론을 유도하는가. 다양한 이해관계가 얽힌 현대 사회에서 정책과 관련된 건전한 공론의 조성은 언론의 마땅한 몫이자 사명이기도 하다. 본 논문은 한미자유무역협정과 관련된 개방담론이 언론의 의견보도 영역에서 어떻게 이루어지는지 검토하기 위해 스크린쿼터제 관련 사설 및 칼럼을 대상으로 논증학자 툴민(Toulmin)의 논증모델(Argumentation Model)과, 정책 논쟁 이슈모델(stock issues model)을 적용, 수사 분석을 시도했다. 분석결과 스크린쿼터 축소에 찬성하는 의견과 반대하는 의견이 각기 다른 논쟁공동체(argument fields)를 구성하고 있음을 나타냈다. 서로 다른 논리와 전제를 가진 논쟁공동체는 이슈의 선택과 증거의 사용에서 상호 반박이나 대화가 어려운 구조를 갖고 있다. 국내 언론의 의견보도는 찬성과 반대와 중립이 비슷한 비율로 나타난 가운데 반대쪽 의견의 비율이 다소 높았으나 논리의 밀도 구성 면에서는 찬성 측이 반대 측에 비해 현 상태(status quo)의 문제구성에서 대안의 합리성 지적에 이르는 다양한 논리를 구비하고 있었다. 이는 증거 제시의 부담을 지닌 쪽이 밀도 높은 논증을 한다는 추정(presumption)의 개념에 어긋난 것으로, 정부가 주도하는 권위적인 논증모델에 기인한 것으로 보인다. 본 연구결과는 스크린쿼터제라는 논제를 둘러싼 우리 사회의 다양한 이슈들을 발굴해 보도함으로써 논점을 이슈화하고 상호 토론을 유도하는 기제로서의 언론이 찬-반 상호 접점의 모색이나 증거의 수집, 논리의 개발이라는 측면에서 보완해야 할 점을 시사한다.을 전략적으로 활용해야 함을 암시한다.송을 신화적 공론장으로 귀결시킨다. TV선거 공론장의 역설(paradox)은 미디어 선거 시대에 유권자의 탈정치화, 정치의 픽션화 그리고 그에 따른 선거의 무관심을 고조시킴으로써 미디어와 정치의 위기를 더욱 심화시키고 있다. 따라서 정치적 인간 주체를 회복하기 위해서는 국가 중심의 제도체계를 벗어나 시민들이 TV선거 공론장의 주체적 참여자가 되도록 개방해야 할 필요가 있다.해야 함을 강조하고 있다.연구할 필요가 있다. 덧붙여 한국의 대중문화가 이러한 욕구에 잘 부합되고 있는지, 새로운 무엇을 만들어 내고 있지는 않은지 연구할 필요성을 절실히 느낀다.해 측정하였다. 실험은 4개의 집단으로 나누어져 실시하였는데 한 집단은 지각된 위험과 희소성 메시지에 동시에 노출되도록 하였고 두 번째 집단과 세 번째 집단은 각각의 두 요인 중 하나의 요인에만 노출되도록 하였다. 그리고 나머지 한 집단은 통제집단으로 지각된 위험이나 희소성 메시지를 모두 처치하지 않은 프로그램을 시청하게 하였다. 연구결과 흥미로운 사실들이 발견되었는데 이용경험에 상관없이 모든 이용자들은 지각된 위험에 부정적인 반응을 보였으며 특히 이용경험이 풍부한 홈쇼핑이용자들인 경우 이용경험이 적은 소비자에 비해 지각된 위험에 더욱 민감하게 반응함을 알 수 있었다. 또한 희소성 메시지에 대해서는 통계적으로는 유의미하지 않았지만 이용경험이 높은 소비자가 이용경험이 적은 소비자들 보다 오히려 부정적인 반응을 보임을 알 수 있었다. 또한 지각된 위험과 희소성 메시지의 상호작용효과의 경우 이용경험이 높은 집단의 소비자가 특히 제품에 대한 태도반응에서 매우 부정적인 반응을 보임을 알 수

  • PDF

지식베이스 확장을 위한 멀티소스 비정형 문서에서의 정보 추출 시스템의 개발 (Development of Information Extraction System from Multi Source Unstructured Documents for Knowledge Base Expansion)

  • 최현승;김민태;김우주;신동욱;이용훈
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.111-136
    • /
    • 2018
  • 지식베이스를 구축하는 작업은 도메인 전문가가 온톨로지 스키마를 이해한 뒤, 직접 지식을 정제하는 수작업이 요구되는 만큼 비용이 많이 드는 활동이다. 이에, 도메인 전문가 없이 다양한 웹 환경으로부터 질의에 대한 답변 정보를 추출하기 위한 자동화된 시스템의 연구개발의 필요성이 제기되고 있다. 기존의 정보 추출 관련 연구들은 웹에 존재하는 다양한 형태의 문서 중 학습데이터와 상이한 형태의 문서에서는 정보를 효과적으로 추출하기 어렵다는 한계점이 존재한다. 또한, 기계 독해와 관련된 연구들은 문서에 정답이 있는 경우를 가정하고 질의에 대한 답변정보를 추출하는 경우로서, 문서의 정답포함 여부를 보장할 수 없는 실제 웹의 비정형 문서로부터의 정보추출에서는 낮은 성능을 보인다는 한계점이 존재한다. 본 연구에서는 지식베이스 확장을 위하여 웹에 존재하는 멀티소스 비정형 문서로부터 질의에 대한 정보를 추출하기 위한 시스템의 개발 방법론을 제안하고자 한다. 본 연구에서 제안한 방법론은 "주어(Subject)-서술어(Predicate)"로 구분된 질의에 대하여 위키피디아, 네이버 백과사전, 네이버 뉴스 3개 웹 소스로부터 수집된 비정형 문서로부터 관련 정보를 추출하며, 제안된 방법론을 적용한 시스템의 성능평가를 위하여, Wu and Weld(2007)의 모델을 베이스라인 모델로 선정하여 성능을 비교분석 하였다. 연구결과 제안된 모델이 베이스라인 모델에 비해, 위키피디아, 네이버 백과사전, 네이버 뉴스 등 다양한 형태의 문서에서 정보를 효과적으로 추출하는 강건한 모델임을 입증하였다. 본 연구의 결과는 현업 지식베이스 관리자에게 지식베이스 확장을 위한 웹에서 질의에 대한 답변정보를 추출하기 위한 시스템 개발의 지침서로서 실무적인 시사점을 제공함과 동시에, 추후 다양한 형태의 질의응답 시스템 및 정보추출 연구로의 확장에 기여할 수 있을 것으로 기대한다.

텍스트마이닝 기법을 활용한 사용후핵연료 건식처리기술 관련 언론 동향 분석 (Analysis of media trends related to spent nuclear fuel treatment technology using text mining techniques)

  • 정지송;김호동
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.33-54
    • /
    • 2021
  • 최근 4차 산업혁명, 코로나로 인한 뉴노멀 시대의 도래 등을 계기로 인공지능, 빅데이터 연구와 같은 언택트 관련 기술의 중요성이 더욱 급상하고 있다. 각 종 연구 분야에서는 이러한 연구 트렌드를 따라가기 위한 융합적 연구가 본격적으로 시행되고 있으나 원자력 분야의 경우 자연어 처리, 텍스트마이닝 분석 등 인공지능 및 빅데이터 관련 기술을 적용한 연구가 많이 수행되지 않았다. 이에 원자력 연구 분야에 데이터 사이언스 분석기술의 적용 가능성을 확인해보고자 본 연구를 수행하였다. 원자로 연료로 사용된 뒤 배출되는 사용후핵연료 인식 동향 파악에 대한 연구는 원자력 산업 정책에 대한 방향을 결정하고 산업정책 변화를 사전에 대응할 수 있다는 측면에서 매우 중요하다. 사용후핵연료 처리기술은 크게 습식 재처리 방식과 건식 재처리 방식으로 나뉘는데, 이 중 환경 친화적이고 핵비확산성 및 경제성이 높은 건식재처리 기술인 '파이로프로세싱'과 그 연계 원자로 '소듐냉각고속로'의 연구개발에 대한 재평가가 현재 지속적으로 검토되고 있다. 따라서 위와 같은 이유로, 본 연구에서는 사용후핵연료 처리기술인 파이로프로세싱에 대한 언론 동향 분석을 진행하였다. 사용후핵연료 처리기술인 '파이로프로세싱' 키워드를 포함하는 네이버 웹 뉴스 기사 전문의 텍스트데이터를 수집하여 기간에 따라 인식변화를 분석하였다. 2016년 발생한 경주 지진, 2017년 새 정부의 에너지 전환정책 시행된 2010년대 중반 시기를 기준으로 전, 후의 동향 분석이 시행되었고, 빈도분석을 바탕으로 한 워드 클라우드 도출, TF-IDF(Term Frequency - Inverse Document Frequency) 도출, 연결정도 중심성 산출 등의 분석방법을 통해 텍스트데이터에 대한 세부적이고 다층적인 분석을 수행하였다. 연구 결과, 2010년대 이전에는 사용후핵연료 처리기술에 대한 사회 언론의 인식이 외교적이고 긍정적이었음을 알 수 있었다. 그러나 시간이 흐름에 따라 '안전(safety)', '재검토(reexamination)', '대책(countermeasure)', '처분(disposal)', '해체(disassemble)' 등의 키워드 출현빈도가 급증하며 사용후핵연료 처리기술 연구에 대한 지속 여부가 사회적으로 진지하게 고려되고 있음을 알 수 있었다. 정치 외교적 기술로 인식되던 사용후핵연료 처리기술이 국내 정책의 변화로 연구 지속 가능성이 모호해짐에 따라 언론 인식도 점차 변화했다는 것을 확인하였다. 이러한 연구 결과를 통해 원자력 분야에서의 사회과학 연구의 지속은 필수불가결함을 알 수 있었고 이에 대한 중요성이 부각되었다. 또한, 현 정부의 원전 감축과 같은 에너지 정책의 영향으로, 사용후핵연료 처리기술 연구개발에 대한 재평가가 시행되는 이 시점에서 해당 분야의 주요 키워드 분석은 향후 연구 방향 설정에 기여할 수 있을 것이라는 측면에서 실무적 의의를 갖는다. 더 나아가 원자력 공학 분야에 사회과학 분야를 폭넓게 적용할 필요가 있으며, 국가 정책적 변화를 고려해야 원자력 산업이 지속 가능할 것으로 사료된다.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

한중 4차산업혁명 기술교류 및 효과에 대한 실증연구: 기업 소셜 네트워크 분석 중심으로 (The Empirical Study on the Effect of Technology Exchanges in the Fourth Industrial Revolution between Korea and China: Focused on the Firm Social Network Analysis)

  • 저우전신;손권상;황윤민;권오병
    • 한국전자거래학회지
    • /
    • 제25권3호
    • /
    • pp.41-61
    • /
    • 2020
  • 중국의 4차 산업혁명 첨단기술 개발 및 사업화 속도가 빠르게 진행되며 효과적인 한중 기업 간 기술교류가 한국의 중장기 산업발전에 더욱 중요해지고 있다. 하지만 아직까지 한중 기업 간 기술교류가 어떻게 진행되는지와 그 효과에 대한 실증 연구가 부족하다. 이에 본 연구는 4차 산업혁명 관련 한중 기술교류 현황 및 효과에 대해 2018년부터 2020년 3월까지 뉴스에 소개된 한중 기업 기술교류 및 협력 기사의 텍스트 마이닝 데이터 기반으로 소셜 네트워크 분석을 진행하고 네트워크 중심성의 성과영향 회귀분석을 진행했다. 분석 결과 국내 전자 대기업들이 대부분 중심성 지표에서 높은 중심성을 보이며 중국 기업 및 기관들과 네트워킹을 활발히 진행하고 있다. 국내 통신사들이 매개 중심성과 부분그래프에서 높은 중심성을 국내 인터넷 서비스 업체와 방송 컨텐츠 업체들이 높은 고유벡터 중심성을 나타냈다. 또한 한국기업보다 중국기업이 높은 매개 중심성을 제조기업보다 서비스기업이 높은 근접 중심성을 보였다. 이러한 네트워크 중심성은 회귀분석결과 기업성과에 긍정적인 영향을 미쳤다. 본 연구는 4차 산업혁명 분야에 집중하여 한중간 협력 현황을 분석한 최초 연구라는 의미가 있으며, 학술적으로 글로벌 기업 협력에 있어 소셜 네트워크 분석 기반 실증 연구 방향을 제시하고 실무적으로 기업이나 정부의 한중 기술 협력 방향 설정에 있어 네트워크 분석 기반 가이드라인을 제시하였다.

시장공사적협동책략화소비자태도(时装公司的协同策略和消费者态度) (Collaboration Strategies of Fashion Companies and Customer Attitudes)

  • Chun, Eun-Ha;Niehm, Linda S.
    • 마케팅과학연구
    • /
    • 제20권1호
    • /
    • pp.4-14
    • /
    • 2010
  • 协同策略需要信息共享和其他各种对公司和股东都有利益的形式. 本文强调了在时装产业中运用到的特别形式的协同. 并且测试了对时装公司最成功的策略和消费者所感知到的协同的好处. 在本研究中, 我们定义了作为协作方的时装公司和品牌以及他们的合作方或股东. 我们定义协同为发生在至少两个公司, 品牌或个体之间, 在平等的基础上利用他们各自的竞争优势从而获得更大利益的合作关系. 协同策略需要信息共享和其他各种对公司和股东都有利益的形式. 本文强调了在时装产业中运用到的特别形式的协同. 通过合作, 时装公司一直都追求有形的差异例如设计和技术, 以及无形的差异例如对消费者情感和生理的好处. 结果就是, 时装产业中的合作已变成一个重要的创造价值的概念. 本文是一个定性研究, 使用案例研究和深度访谈来测试消费者对时装产业中协作的态度. 从1998年到2008年12月, 在韩国和国际市场中共有173个协同案例. 我们通过文件数据收集案例. 这些文件数据包括网站和产业数据和顶级门户搜索网站. 例如Rankey.com, Naver, Daum, 和Nate. 以及时装信息代表网站Samsungdesignnet 和Firstviewkorea. 我们搜集从2008年11月到2009年2月为止的个案. 个案用来分析有一个或多个合作方的时装产品生产(不包括纺织产品), 零售时装产品或设计服务. 其他在先前研究中的协同案例来自于新闻稿件, 期刊, 互联网门户网站和时装信息网站. 我们共选择了173个案例来进行分析. 清楚的显示了时装公司和股东的协作执行和策略所带来的产出和利益. 结果显示对所有参与协作的合作方(企业和顾客)来说, 最大的好处是通过共享资源降低了成本和风险. 例如设计能力, 形象, 成本, 技术和目标. 并且创造了协同作用. 考虑到协同产出的种类, 产品/设计是最重要的(55%), 紧跟其后的是推广促销(21%), 价格(20%)和地点(4%). 这个结果说明协同对给予产品和设计生命力有重要的作用. 尤其是在追求创造和新颖的时装产业里. 为了使协同可以成功, 本研究中深度访谈的结果确认了时装公司应该对为什么要进行这个协作有清晰的目标. 在设定目标之后, 时装公司应该选择符合产品形象和目标市场的合作方. 使得合作的产品有一定的概念和差异因素. 同时时装公司还要关注提升品牌知名度. 通过对消费者的深度访谈, 相互的利益可以分类为6个因素: 追求个人风格、追求品牌、追求稀有性、追求时尚、追求经济效率和社会性. 在访谈中顾客同时也强调了形象, 声誉和品牌信任. 然而, 在子范畴中, 本研究中的专家和顾客在成功因素认知方面有不同的结果. 因此, 从不同纬度研究目标客户和目标市场从而为成功的协作发展合适的策略.

자국위성(自國衛星)의 파괴(破壞)에 따른 우주잔해의 증가와 우주조약위반(宇宙條約違反) 여부에 관한 소고(小考) - 중국의 자국위성파괴와 관련하여 - (A Study on the increase of space debris from Chinese Anti-Satellite and breach of the Outer Space Treaty)

  • 김선이
    • 항공우주정책ㆍ법학회지
    • /
    • 제28권2호
    • /
    • pp.259-294
    • /
    • 2013
  • 중국은 2007년 자국의 위성을 폭파하는 실험을 하고, 신문이나 텔레비전 등에서 크게 보도한 바 있다. 이와 관련하여 세계 각국에서의 비판이 있었고, 이 문제에 관한 관심이 지대하였다. 그 내용을 보면, 우주에서 군비확장에 박차를 가한다는 것이나, 우주의 안전한 이용을 저해한다는 관점에서의 비판이 많았다. 대량의 우주 쓰레기를 생성하는 것이 된 이 중국의 자국위성 폭파실험행위는 국제법, 특히 우주조약에 위반했는지 여부에 관하여 논한 것은 별로 없었다. 우주잔해는 중대한 문제라고 주장되고 있는 데도 불구하고, 여전히 그 양은 증가를 계속하고 있다. 이대로 우주물체의 발사를 계속해 간다면, 우주공간의 이용 자체가 크게 저해되어 버리는 경우가 현실화 될 수 있다. 더구나 우주공간의 상업적 이용이 향후 더욱 더 행해지고 있기 때문에, 이 문제는 더욱 중요성을 더해 갈 것이다. 이러한 위험성을 충분히 이해하고 국제사회가 협력해서 우주 쓰레기의 저감에 대처하고 있다. 일찌기 미국이나 소련도 ASAT(Anti-Satelite)실험을 하고 있었다. 그러나 이에 대해서, 군사적 측면을 포함해서 우주조약에 위반한 행위라는 항의는 보이지 않았고, 중국의 이번 실험도 동일하게 위법이 아니라고 하는 것이 일반적인 견해라고 생각된다. 현재는 당시에 비해서 우주 쓰레기에 관한 연구도 비약적으로 이루어지고 있으며, 그 위험성이 충분히 인지되고 있다. 이러한 상황 하에서 대량의 우주 쓰레기를 발생시키는 것이 되어버린 중국의 자국위성 폭파실험행위를 종래의 해석으로 단순하게 위법이 아니라고 정리해 버리는 것에 대하여 약간의 저항도 있다. 본고는 지난 중국에 의한 자국위성 폭파실험이 국제우주법을 위반하고 있는지의 여부에 대한 재검토를 시도해 보고자 한다. 본고의 구성은 먼저 사건의 개요를 확인한 다음 이번 실험은 "달, 기타의 천체를 포함하는 우주공간의 탐사 및 이용에 있어서의 국가 활동을 규율하는 원칙에 관한 조약"에 위반하고 있는 것인지 여부에 대한 검토를 하고자 한다. 또한 실험 후에 개최된 유엔과학기술소위원회원회에서 우주잔해의 저감에 관한 가이드 라인이 유엔에서 처음으로 채택되었는 바 그 특징이나 향후의 과제에 대해서도 검토 하고자 한다.

  • PDF

오피니언 분류의 감성사전 활용효과에 대한 연구 (A Study on the Effect of Using Sentiment Lexicon in Opinion Classification)

  • 김승우;김남규
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.133-148
    • /
    • 2014
  • 최근 다양한 정보채널들의 등장으로 인해 빅데이터에 대한 관심이 높아지고 있다. 이와 같은 현상의 가장 큰 원인은, 스마트기기의 사용이 활성화 됨에 따라 사용자가 생성하는 텍스트, 사진, 동영상과 같은 비정형 데이터의 양이 크게 증가하고 있는 것에서 찾을 수 있다. 특히 비정형 데이터 중에서도 텍스트 데이터의 경우, 사용자들의 의견 및 다양한 정보를 명확하게 표현하고 있다는 특징이 있다. 따라서 이러한 텍스트에 대한 분석을 통해 새로운 가치를 창출하고자 하는 시도가 활발히 이루어지고 있다. 텍스트 분석을 위해 필요한 기술은 대표적으로 텍스트 마이닝과 오피니언 마이닝이 있다. 텍스트 마이닝과 오피니언 마이닝은 모두 텍스트 데이터를 입력 데이터로 사용할 뿐 아니라 파싱, 필터링 등 자연어 처리기술을 사용한다는 측면에서 많은 공통점을 갖고 있다. 특히 문서의 분류 및 예측에 있어서 목적 변수가 긍정 또는 부정의 감성을 나타내는 경우에는, 전통적 텍스트 마이닝, 또는 감성사전 기반의 오피니언 마이닝의 두 가지 방법론에 의해 오피니언 분류를 수행할 수 있다. 따라서 텍스트 마이닝과 오피니언 마이닝의 특징을 구분하는 가장 명확한 기준은 입력 데이터의 형태, 분석의 목적, 분석의 결과물이 아닌 감성사전의 사용 여부라고 할 수 있다. 따라서 본 연구에서는 오피니언 분류라는 동일한 목적에 대해 텍스트 마이닝과 오피니언 마이닝을 각각 사용하여 예측 모델을 수립하는 과정을 비교하고, 결과로 도출된 모델의 예측 정확도를 비교하였다. 오피니언 분류 실험을 위해 영화 리뷰 2,000건에 대한 실험을 수행하였으며, 실험 결과 오피니언 마이닝을 통해 수립된 모델이 텍스트 마이닝 모델에 비해 전체 구간의 예측 정확도 평균이 높게 나타나고, 예측의 확실성이 강한 문서일수록 예측 정확성이 높게 나타나는 일관적인 성향을 나타내는 등 더욱 바람직한 특성을 보였다.

항공산업 미래유망분야 선정을 위한 텍스트 마이닝 기반의 트렌드 분석 (Text Mining-Based Emerging Trend Analysis for the Aviation Industry)

  • 김현정;조남옥;신경식
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.65-82
    • /
    • 2015
  • 최근 경제적 사회적 부가가치를 창출할 수 있는 유망분야를 선정하여 국가 전략 및 정책 수립 시 반영하기 위해 미래 핵심 이슈를 발견하고 트렌드를 분석하는 것에 대한 관심이 급증하고 있다. 기존에는 미래의 핵심 기술이나 이슈를 발견하고 트렌드 분석을 통해 미래유망분야를 선정하는 연구를 위해 문헌 조사 또는 전문가 평가와 같은 정성적 연구방법이 사용되어 왔다. 그러나 이 연구방법은 대량의 정보로부터 결과를 도출하는데 많은 시간과 비용이 소요될 뿐만 아니라 전문가의 주관적인 가치가 반영될 가능성이 존재한다. 이와 같은 한계점을 보완하고자 최근 국토교통, 안전, 정보통신기술 등 다양한 분야에서 미래유망분야를 선정하기 위하여 정성적 연구방법에 텍스트 마이닝과 같은 정량적 연구방법을 상호 보완적으로 활용하는 방식으로 트렌드 분석을 수행하는 연구 방법론의 패러다임 변화가 시도되고 있다. 본 연구는 항공산업 전반적인 분야에 빅데이터 분석 방법인 텍스트 마이닝 기법을 적용하여 항공 분야의 연구동향을 파악하고 미래유망분야를 전망하였다. 텍스트 마이닝 기법 중하나인 토픽 분석을 이용하여 항공산업 전반적인 분야의 문서 집합 내 잠재된 토픽을 추출하고, 연도별로 핵심 토픽의 추이를 분석하였다. 분석 결과 항공산업의 미래유망분야로 항공안전정책, 항공운임(저가항공), 그리고 친환경 고연비 연료가 도출되었다. 본 연구결과는 분석 대상을 논문에 한정하여 수행하였다는 한계점이 존재하나, 항공산업 분야의 핵심 이슈를 도출하기 위하여 텍스트 마이닝 기반의 트렌드 분석에 대한 활용가능성을 제시하고, 미래유망분야를 선정하기 위한 정량적인 분석 방법론의 전형을 마련하였다는 점에서 의의가 있다.

데이터 분석을 통한 UX 방법론 연구 고객 세그먼트 분류를 통한 페르소나 도출을 중심으로 (UX Methodology Study by Data Analysis Focusing on deriving persona through customer segment classification)

  • 이슬이;박도형
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.151-176
    • /
    • 2021
  • 정보기술 산업이 발전됨에 따라 다양한 종류의 데이터가 생겨나고 있고 이를 가공하여 산업에 활용하는 것이 필수인 시대가 되었다. 온 오프라인 상에서 수집된 다양한 디지털 데이터를 분석하여 활용하는것은 산업 내의 고객에게 적합한 경험을 제공하기 위해서 꼭 필요한 과정이다. 새로운 비즈니스, 제품, 서비스를 창출하기 위해서는다방면에서 수집된 고객 데이터를 활용하여잠재고객의 니즈를 깊게 파악하고 행동패턴을 분석하여 숨겨진 욕망의 신호를 잡아내는것이 필수이다. 그러나 효과적인 서비스 개발을 위해서 병행해서 진행되어야 할 데이터 분석, UX 방법론을 활용한 연구는 각각 따로 진행되고 있고 산업 내의 활용 예시가 부족한 것이 사실이다. 본 연구에서는 데이터 분석 방법과 UX 방법론을 응용하여 하나의 프로세스를 제작하였다. 행복을 주제로 진행된 설문조사에서 추출된 고객 데이터를 활용하여 고객의 특성을 파악하기 위한 데이터 분석을 진행하였다. 요인, 회귀분석을 실시하여 행복 데이터 설문의 요인 간의 연관 관계를 확인하였다. 그 다음 연관 관계를 군집을 분류하고 가장 최적의 군집 수를 추출하여분류하였다. 이러한 결과를 바탕으로 교차분석을 진행하여 군집 별로 인구통계학적 특성을 확인하였다. 세그먼트를 분류하기 전 서비스 정의를 하기 위하여 뉴스 기사 및 SNS 문장들을 바탕으로 텍스트 마이닝을 통해 주요 키워드를 바탕으로 아이디어를 도출하였고 이중에 가장 타당한 서비스를 선택하였다. 이러한 결과를 바탕으로 세그먼트및 목표 고객을 선정한 후 세그먼트의 특성대로 대상자를 선정하여 인터뷰를진행하였다. 그 후 특성 및 프로파일정보를 활용하여 페르소나를 제작하여고객의 행동과 최종 목표를 서술하였다. 일반적인페르소나와 데이터를 활용한 페르소나를 비교하여 각각의 특성을 비교 분석하였다. 본 연구를 통해 도출된 프로세스는 다변화되는 서비스의 변화 상황에서 적절한 타겟 고객의 정의 및 정확한 분류 체계로 나뉘어진 고객군을파악 할 수 있는 방법을 제시 한 것에 의의가 있다.