• 제목/요약/키워드: online university

검색결과 7,209건 처리시간 0.036초

PL 리더십 성향과 프로젝트 특성요인이 프로젝트 참여 만족 및 성과에 미치는 영향 (The Effect of PL Leadership and Characteristics of Project on Project Participants' Satisfaction and Performance)

  • 양희동;김명진;강소라
    • Asia pacific journal of information systems
    • /
    • 제20권4호
    • /
    • pp.53-79
    • /
    • 2010
  • The study was originated from recognition that project participants' satisfaction should be Improved to raise project performance and to make progress of a successful project since the above dissatisfaction was operated as a danger factor of the project. The study selected one large-scale sample project and attempted measuring characteristics of the project, participants' satisfaction and project performance with the whole project participants. The study analyzed correlations between individual level (team members) and group level (development team), and examined what effect a sub project manager under complicated hierarchical organization of the large-scale project, namely PL (project leader)'s leadership style had on each individual project participant's satisfaction and what effect project uncertainty in organization/technology environment had on project participants' satisfaction and project performance. The study verified that development team (group) had an effect on team member (individual)-level project participants' satisfaction by disclosing that there was a significant dispersion among groups within project participants' satisfaction by each individual. It is analyzed that it is necessary to make improvement through approach by each pertinent team to raise individual-level project participants' satisfaction. The study also verified PL's ideal leadership under strict methodology and hierarchical control of the large-scale project. Based on the verification of the hypotheses, the results of the analysis were produced as follows. First, the development team affects the satisfaction level that an individual has when he/she participates in a project. This suggests that the satisfaction with project participation should be improved at the team level. In addition, the project management style and leadership orientation of the manager of a sub project who is mostly affected by the team proved to have a direct influence on the satisfaction with project participation and project performances. Second, both the performance-oriented leadership and the relationship-oriented leadership of the PL of the development team were verified to have a significant effect on the satisfaction of the team members associated with project participation. In other words, when the team members recognize that the PL of the development team shows both the performance-oriented leadership and the relationship-oriented leadership, their satisfaction with project participation increases accordingly. Third, it was verified that the uncertainty of the organizational environment significantly affects the satisfaction level when the PL of the development team exerts a relationship-oriented and performance-oriented leadership. The higher the uncertainty of the organizational environment is, the more the satisfaction with project participation decreases whereas the relationship-oriented leadership has a more positive effect on the satisfaction than the performance-oriented leadership style. Fourth, when the PL of the development team exerts the relationship-related and performance-related leadership, the uncertainty of the technological environment has a significant influence on the satisfaction level. The higher the uncertainty of the technological environment is, the more the satisfaction with project participation decreases whereas the performance-oriented leadership has a more positive effect on the satisfaction than the relationship-oriented leadership style. The result of the research on the uncertainty of the project environment suggests that when the development team leader exerts a relationship-oriented and performance-oriented leadership style, the uncertainty of the organizational environment has a significant effect on the satisfaction with project participation; the higher the uncertainty of the organizational environment, the more the satisfaction level decreases, and the relationship-oriented leadership style affects the satisfaction level more positively than the performance-oriented leadership style. In addition, when the development team leader displays a relationship-oriented and performance-oriented leadership style, the uncertainty of the technological environment has a significant effect on the satisfaction with project participation; the higher the uncertainty of the technological environment. the more the satisfaction level decreases. The performance-oriented leadership style as well affects the satisfaction level more positively than the relationship-oriented leadership style. Based on the above results, the research provides the following implications when handling multiple concurrent projects. First, the satisfaction with the participation in the multiple concurrent projects needs to be enhanced at the team (group) level. Second. the manager of the project team, particularly the middle managers should have both a performance-oriented and relationship (task and human)-oriented attitude and exert a consolidated leadership in order to improve the satisfaction of team members with project participation and their performances. Third, as the uncertainty factor of the technological and organizational environment among the characteristics factors of the project has room for methodological improvement depending on one's effort even though there are some complications, we need to continuously prevent and control the risks resulting from the uncertainties of the technological and organizational environment of the project in order to enhance the satisfaction of project participation and project performances. Fourth, the performance (task)-oriented leadership is required when there is uncertainty in a technological environment while the relationship (human)-oriented leadership is required when there is uncertainty in an organizational environment. This research has the following limitations. First, this research intended to select one large-sized sample project and measure the project characteristics, the satisfaction of all the participants associated with project participation, and their performances. Therefore, it is inappropriate to generalize and apply the result of this result onto other numerous projects. Second, as this case study entailed a survey to measure the characteristics factors and performance of the project, since the result value was based on the perception of project team members, the data may have insufficient objectivity. Third, though this research targeted on all the project participants, some development teams did not provide sufficient data and questionnaires were collected from some specific development teams among the 23 development teams, causing a significant deviation in the response rate among the development teams. Therefore, we need to continuously conduct the follow-up researches making comparisons among the multiple projects, and centering on the characteristics factors of the project and its satisfaction level.

텍스트 마이닝 기법을 적용한 뉴스 데이터에서의 사건 네트워크 구축 (Construction of Event Networks from Large News Data Using Text Mining Techniques)

  • 이민철;김혜진
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 전통적으로 신문 매체는 국내외에서 발생하는 사건들을 살피는 데에 가장 적합한 매체이다. 최근에는 정보통신 기술의 발달로 온라인 뉴스 매체가 다양하게 등장하면서 주변에서 일어나는 사건들에 대한 보도가 크게 증가하였고, 이것은 독자들에게 많은 양의 정보를 보다 빠르고 편리하게 접할 기회를 제공함과 동시에 감당할 수 없는 많은 양의 정보소비라는 문제점도 제공하고 있다. 본 연구에서는 방대한 양의 뉴스기사로부터 데이터를 추출하여 주요 사건을 감지하고, 사건들 간의 관련성을 판단하여 사건 네트워크를 구축함으로써 독자들에게 현시적이고 요약적인 사건정보를 제공하는 기법을 제안하는 것을 목적으로 한다. 이를 위해 2016년 3월에서 2017년 3월까지의 한국 정치 및 사회 기사를 수집하였고, 전처리과정에서 NPMI와 Word2Vec 기법을 활용하여 고유명사 및 합성명사와 이형동의어 추출의 정확성을 높였다. 그리고 LDA 토픽 모델링을 실시하여 날짜별로 주제 분포를 계산하고 주제 분포의 최고점을 찾아 사건을 탐지하는 데 사용하였다. 또한 사건 네트워크를 구축하기 위해 탐지된 사건들 간의 관련성을 측정을 위하여 두 사건이 같은 뉴스 기사에 동시에 등장할수록 서로 더 연관이 있을 것이라는 가정을 바탕으로 코사인 유사도를 확장하여 관련성 점수를 계산하는데 사용하였다. 최종적으로 각 사건은 각의 정점으로, 그리고 사건 간의 관련성 점수는 정점들을 잇는 간선으로 설정하여 사건 네트워크를 구축하였다. 본 연구에서 제시한 사건 네트워크는 1년간 한국에서 발생했던 정치 및 사회 분야의 주요 사건들이 시간 순으로 정렬되었고, 이와 동시에 특정 사건이 어떤 사건과 관련이 있는지 파악하는데 도움을 주었다. 또한 일련의 사건들의 시발점이 되는 사건이 무엇이었는가도 확인이 가능하였다. 본 연구는 텍스트 전처리 과정에서 다양한 텍스트 마이닝 기법과 새로이 주목받고 있는 Word2vec 기법을 적용하여 봄으로써 기존의 한글 텍스트 분석에서 어려움을 겪고 있었던 고유명사 및 합성명사 추출과 이형동의어의 정확도를 높였다는 것에서 학문적 의의를 찾을 수 있다. 그리고, LDA 토픽 모델링을 활용하기에 방대한 양의 데이터를 쉽게 분석 가능하다는 것과 기존의 사건 탐지에서는 파악하기 어려웠던 사건 간 관련성을 주제 동시출현을 통해 파악할 수 있다는 점에서 기존의 사건 탐지 방법과 차별화된다.

합성곱 신경망의 비지니스 응용: 런웨이 이미지를 사용한 의류 분류를 중심으로 (Business Application of Convolutional Neural Networks for Apparel Classification Using Runway Image)

  • 서이안;신경식
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.1-19
    • /
    • 2018
  • 최근 딥러닝은 오디오, 텍스트 및 이미지 데이터와 같은 비 체계적인 데이터를 대상으로 다양한 추정, 분류 및 예측 문제에 사용 및 적용되고 있다. 특히, 의류산업에 적용될 경우 딥러닝 기법을 활용한 의류 인식, 의류 검색, 자동 제품 추천 등의 심층 학습을 기반으로 한 응용이 가능하다. 이 때의 핵심모형은 합성곱 신경망을 사용한 이미지 분류이다. 합성곱 신경망은 입력이 전달되고 출력에 도달하는 과정에서 가중치와 같은 매개 변수를 학습하는 뉴런으로 구성되고, 영상 분류에 가장 적합한 방법론으로 사용된다. 기존의 의류 이미지 분류 작업에서 대부분의 분류 모형은 의류 이미지 자체 또는 전문모델 착용 의류와 같이 통제된 상황에서 촬영되는 온라인 제품 이미지를 사용하여 학습을 수행한다. 하지만 본 연구에서는 통제되지 않은 상황에서 촬영되고 사람들의 움직임과 다양한 포즈가 포함된 스트릿 패션 이미지 또는 런웨이 이미지를 분류하려는 상황을 고려하여 분류 모형을 훈련시키는 효과적인 방법을 제안한다. 이동성을 포착하는 런웨이 의류 이미지로 모형을 학습시킴으로써 분류 모형의 다양한 쿼리 이미지에 대한 적응력을 높일 수 있다. 모형 학습 시 먼저 ImageNet 데이터셋을 사용하여 pre-training 과정을 거치고 본 연구를 위해 수집된 32 개 주요 패션 브랜드의 2426개 런웨이 이미지로 구성된 데이터셋을 사용하여 fine-tuning을 수행한다. 학습 과정의 일반화를 고려해 10번의 실험을 수행하고 제안된 모형은 최종 테스트에서 67.2 %의 정확도를 기록했다. 본 연구 모형은 쿼리 이미지가 런웨이 이미지, 제품 이미지 또는 스트릿 패션 이미지가 될 수 있는 다양한 분류 환경에 적용될 수 있다. 구체적으로는 패션 위크에서 모바일 어플리케이션 서비스를 통해 브랜드 검색을 용이하게 하는 서비스를 제공하거나, 패션 잡지사의 편집 작업에 사용되어 브랜드나 스타일을 분류하고 라벨을 붙일 수 있으며, 온라인 쇼핑몰에서 아이템 정보를 제공하거나 유사한 아이템을 추천하는 등의 다양한 목적에 적용될 수 있다.

경험개치대소비자대전자내용적인지개치적중개영향(经验价值对消费者对电子内容的认知价值的中介影响): 중국살독연건시장(中国杀毒软件市场) (The Mediating Effect of Experiential Value on Customers' Perceived Value of Digital Content: China's Anti-virus Program Market)

  • Jia, Weiwei;Kim, Sae-Bum
    • 마케팅과학연구
    • /
    • 제20권2호
    • /
    • pp.219-230
    • /
    • 2010
  • 数字内容在给公司带来机遇和挑战的同时也极大的改变了我们的生活. 创意企业整合视频, 图片, 文本和数据进行数字化过的音频, 开发新产品或服务, 创作数字经验推广自己的品牌. 大多数有关数字内容的文献是关于基本概念或者营销的发展. 其实, 比起普通产品或服务的传统价值链, 数字内容产业似乎有更多的潜在价值. 因为相当多的数字内容是免费的, 价格, 作为信息的质量或价值的指标, 不是必须被感知的(Rowley 2008). 很显然, 当前数字内容的主题是 "价值" 和关于消费者对数字内容的感知价值的研究. 本文讨论了体验价值在消费者评估数字内容时的优势. 本文在对数字内容 "价值" 的理解方面有两个不同但是相关的贡献. 第一, 基于数字内容与普通产品和服务的比较, 本文提出了两个关键特点使得体验战略适合数字内容: 无形和接近于零的再造成本. 最重要的是, 基于对公司的理想化的价值和客户的感知价值之间的差异的讨论, 本文强调了数字内容的价格和定价与普通产品和服务的不同. 无形的结果是, 价格可能并不反映顾客感知价值. 另外, 数字内容的成本处在发展阶段可能非常高但再造会大幅缩水. 而且, 由于前面提到的价值鸿沟, 这个价格政策改变因不同的数字内容而不同. 例如, 平价战略通常用于电影和音乐(Magiera 2001;Netherby 2002), 而有持续的需求的数字内容如在线游戏和杀毒软件的问题牵涉到一个更复杂的效用和极具竞争力的价格水平. 数字内容企业必须探索各种各样的策略来克服这个缺口. 对于广告, 形象, 口碑等常用的市场战略和他们对顾客感知价值的影响的研究变得至关重要. 中国数字内容产业正变得越来越国际化, 并引起了具有各自竞争优势的国家和地区的关注. 2008-2009中国数字内容产业年度发展报告(CCIDConsulting 2009)表明, 在国内需求和政府政策的大力支持下, 中国数字内容产业在2008年保持了大约30%的快速增长, 表明了这个产业在明显的初期扩张阶段. 在中国, 需要更新的杀毒软件和其他软件程序使用季度定价政策. 用户可以免费下载试用版, 用6个月或一年. 如果他们更久的使用, 连续的付款方式是必要的. 他们在试用阶段检测数字内容的优良度, 决定是否要付继续使用. 对于中国的音乐和电影工业的发展战略, 体验最初没有被广泛的应用, 虽然其他国家的公司注意到体验的重要性并探索了相关的战略(如客户在下载前有好几秒可以免费听听音乐). 由于上述原因, 杀毒软件在中国可以代表数字内容产业而且在中国杀毒市场探索了体验价值在顾客的数字内容感知价值中的优势. 为了提高调查数据的可靠性, 该研究集中在那些有使用杀毒软件经验的人群. 实证结果显示, 体验价值对顾客对数字内容的感知价值有积极的影响. 换句话说, 因为数字内容是无形的, 再造成本几乎为零, 客户的评估是根据他们的体验. 另外, 形象和口碑不产生积极的影响, 只对体验价值有影响. 这就是说, 数字内容价值链不同于普通产品或服务. 体验价值有显著的优势并调节形象和口碑对感知价值的作用. 这个研究结果有助于了解为什麽在发展中国家存在免费的数字内容下载. 客户只有通过体验它才可以感知数字内容的价值. 这也是为什么政府如此扶持发展数字内容. 其他发展中国家在起步阶段的数字内容企业可以借鉴这里的建议. 另外, 基于体验战略的优势, 公司应该更努力投资于客户的体验. 由于数字内容的特点和价值鸿沟的存在, 顾客只有经历了他们真正想要的才能感知更多的无形的数字内容的价值. 而且, 因为再造成本近乎为零, 公司可以使用体验战略, 以提高客户对数字内容的理解.

소셜 네트워크 분석 기법을 활용한 협업필터링의 특이취향 사용자(Gray Sheep) 문제 해결 (Resolving the 'Gray sheep' Problem Using Social Network Analysis (SNA) in Collaborative Filtering (CF) Recommender Systems)

  • 김민성;임일
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.137-148
    • /
    • 2014
  • 상품 검색시간의 단축과 쇼핑에 투입되는 노력의 감소 등, 온라인 쇼핑이 주는 장점에 대한 긍정적인 인식이 확산되면서 전자상거래(e-commerce)의 중요성이 부각되는 추세이다. 전자상거래 기업들은 고객확보를 위해 다양한 인터넷 고객관계 관리(eCRM) 활동을 전개하고 있는데, 개인화된 추천 서비스의 제공은 그 중 하나이다. 정확한 추천 시스템의 구축은 전자상거래 기업의 성과를 좌우하는 중요한 요소이기 때문에, 추천 서비스의 정확도를 높이기 위한 다양한 알고리즘들이 연구되어 왔다. 특히 협업필터링(collaborative filtering: CF)은 가장 성공적인 추천기법으로 알려져 있다. 그러나 고객이 상품을 구매한 과거의 전자상거래 기록을 바탕으로 미래의 추천을 하기 때문에 많은 단점들이 존재한다. 신규 고객의 경우 유사한 구매 성향을 가진 고객들을 찾기 어렵고 (Cold-Start problem), 상품 수에 비해 구매기록이 부족할 경우 상관관계를 도출할 데이터가 희박하게 되어(Sparsity) 추천성능이 떨어지게 된다. 취향이 독특한 사용자를 뜻하는 'Gray Sheep'에 의한 추천성능의 저하도 그 중 하나이다. 이러한 문제인식을 토대로, 본 연구에서는 소셜 네트워크 분석기법 (Social Network Analysis: SNA)과 협업필터링을 결합하여 데이터셋의 특이 취향 사용자 (Gray Sheep) 문제를 해소하는 방법을 제시한다. 취향이 독특한 고객들의 구매데이터를 소셜 네트워크 분석지표를 활용하여 전체 데이터에서 분리해낸다. 그리고 분리한 데이터와 나머지 데이터인 두 가지 데이터셋에 대하여 각기 다른 유사도 기법과 트레이닝 셋을 적용한다. 이러한 방법을 사용한 추천성능의 향상을 검증하기 위하여 미국 미네소타 대학 GroupLens 연구팀에 의해 수집된 무비렌즈 데이터(http://movielens.org)를 활용하였다. 검증결과, 일반적인 협업필터링 추천시스템에 비하여 이 기법을 활용한 협업필터링의 추천성능이 향상됨을 확인하였다.

국내 프로축구 팬들의 유니폼 소비 분석: 손흥민의 토트넘 홋스퍼 FC 이적 전후 비교 (Analysis of Football Fans' Uniform Consumption: Before and After Son Heung-Min's Transfer to Tottenham Hotspur FC)

  • 최영현;이규혜
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.91-108
    • /
    • 2020
  • 박지성 선수의 2005년 맨체스터 유나이티드 FC 입단 이후로, 국내에서 프로축구 유니폼 시장이 본격적으로 성장하기 시작했다. 이후, 국내 선수들의 해외 리그에서 활약이 계속되면서 국내에서도 잉글랜드 프리미어리그에 대한 대중의 관심이 지속되고 있다. 이러한 시점에서 본 연구는 국내 프로축구 팬들의 유니폼 소비에 전반적인 소비자 인식을 알아보고, 선수의 영입에 따른 소비자 인식 변화를 비교하고자 했다. EPL의 토트넘에서 활동하고 있는 손흥민 선수의 영입 전후를 중심으로 소셜 미디어에 나타난 프로축구 팬들의 소비자 인식과 구매 요인을 알아보았다. 'EPL 유니폼'을 키워드로, 국내 포털사이트와 소셜 미디어의 게시글을 수집하고, 텍스트 마이닝, SNA, 회귀분석을 사용하여 분석했다. 연구 결과, 첫째, 선수의 소속 팀, 실적, 포지션과 구단의 실적, 순위, 리그의 우승 여부가 프로축구 유니폼의 구매와 탐색에 있어 주요 요인으로 확인되었다. 가격, 디자인, 사이즈, 로고 등과 같은 항목보다 유니폼의 형태, 마킹, 정품 여부, 스폰서와 더 중요하게 작용하고 있었다. 둘째, 구조적 등위성 분석과 군집분석을 통해 국내 프로축구 팬들 사이에서 유니폼과 관련되어 언급되고 있는 주요 주제를 알아본 결과, EPL에 소속된 구단과 유명 선수들이 가장 핵심적인 주제로 나타났다. 셋째, 프로축구 유니폼에 대한 시기별 주제는 월드컵과 EPL 리그에 대한 관심에서 EPL에서 활동하는 다양한 국내외 선수들에 대한 관심으로, 2015년 이후에는 유니폼 자체에 대한 것으로 주제가 변화했다. 이를 통해, 선수들의 이적에 따라 선수가 소속된 해당 구단의 유니폼이 관심을 받고 있음을 알 수 있었다. 넷째, 남녀 소비자 모두 손흥민에 대한 관심이 증가함에 따라서 토트넘이 소속된 리그인 EPL에 대한 관심도 증가하는 것으로 나타났다. 여성의 경우 손흥민에 대한 관심이 증가함에 따라 축구 유니폼에 대해서도 관심을 가지는 것으로 나타난 반면, 남성의 경우 손흥민 선수에 대한 관심과 축구 유니폼에 대한 관심 사이의 관계가 유의하게 나타나지 않았다. 각 구단은 선수와 구단의 성적과 이미지 관리, 스폰서 브랜드 관리에 집중하고, 선수의 이적이 결정되면 선수의 자국에 해당 물량의 공급을 늘리며, 인기를 끌고 있는 선수의 등번호가 부착된 유니폼의 경우에는 여성을 위한 다양한 사이즈를 제공해야 할 필요가 있다.

개인정보보호 분야의 연구자 네트워크와 성과 평가 프레임워크: 소셜 네트워크 분석을 중심으로 (The Framework of Research Network and Performance Evaluation on Personal Information Security: Social Network Analysis Perspective)

  • 김민수;최재원;김현진
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.177-193
    • /
    • 2014
  • 개인정보 분야에서의 다양한 정보 보안 이슈가 발생함에 따라 해당 분야의 전문가를 확인하기 위한 프레임워크는 매우 중요한 영역이 되었다. 전문가 탐색과정은 주로 연구 업적 등을 통한 주관적인 평가가 일반적이지만 보다 객관적인 방식을 통한 선정이 매우 중요하다. 소셜 네트워크 분석기법의 응용이 다양한 영역에서 활용됨에 따라 본 연구는 개인정보보호분야의 전문가를 확인하고 해당 전문가들의 연구실적을 판단하기 위한 분석 프레임워크를 제시하고자 하였다. 본 연구는 연구 목적에 따라 개인정보보호 연구영역의 연구성과 자료를 바탕으로 소셜 네트워크 분석을 실시하고 핵심연구자의 성과를 분석하였다. 수집된 데이터는 연구의 공저자, 발행기관, 소속기관 등의 네트워크 구성에 활용되어 핵심전문가 집단을 관리하기 위한 프레임워크를 제시하였다. 본 연구는 NDSL에서 최근 5년 동안 발표된 논문들을 중심으로 자료를 수집하였다. 연구자들이 학술 정보를 교환하는 정기 간행물인 학술지를 바탕으로 연구 네트워크를 형성하는 네트워크 자료를 수집함으로써 연구활동에 대한 정보를 분석할 수 있었다. 일반적으로 연구자들은 연구 결과를 논문으로 발표하고, 발표된 논문들이 다수의 관련 분야 전문가들에게 공유된다는 점에서 학술연구지는 연구자들의 지식관련 의사소통 공간이며 지식의 구조화에 핵심적인 역할을 수행한다. 그에 따라 본 연구의 연구 대상 분야로 설정한 개인정보보호 분야의 연구 구조를 이해하기 위해 국내에서 발표된 관련 분야의 논문들을 연구 대상으로 자료가 수집되었다. 특히 자료의 선별 기준은 국내 최대의 데이터베이스를 보유하고 있는 NDSL에서 개인정보보호 관련 키워드를 보유한 논문 데이터를 수집 및 정제하여 분석 자료로 사용하였다. 2005년부터 2013년까지 약 2,000개의 연구결과 중 주제 관련성, 공저자 추출 등을 수집하였다. 데이터 수집 이후 연구 분석을 위한 데이터 처리를 통하여 통해 총 784개의 논문을 선정하고 분석대상으로 확정하였다. 분석 결과, 개인정보보호 연구영역의 전문가 집단을 이용한 연구논문 성과에 대한 분석은 핵심 연구자들을 추출해내고 전문가 집단을 관리하는 데 도움을 제공할 수 있다. 특히 소속집단 및 연구논문 발행기관을 분석함으로써 개인정보보호 연구영역에서 확인되지 않았던 연구자들의 연구 논문 게재의 공저자 네트워크가 매우 밀접함을 확인할 수 있다. 또한 연구논문의 발행기관 및 소속집단의 특성을 추출함으로써 개인정보보호 영역의 전문가 평가지표로서 소셜 네트워크 지표들의 활용가능성을 확인하였다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

캠페인 효과 제고를 위한 자기 최적화 변수 선택 알고리즘 (Self-optimizing feature selection algorithm for enhancing campaign effectiveness)

  • 서정수;안현철
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.173-198
    • /
    • 2020
  • 최근 온라인의 비약적인 활성화로 캠페인 채널들이 다양하게 확대되면서 과거와는 비교할 수 없을 수준의 다양한 유형들의 캠페인들이 기업에서 수행되고 있다. 하지만, 고객의 입장에서는 중복 노출로 인한 캠페인에 대한 피로감이 커지면서 스팸으로 인식하는 경향이 있고, 기업입장에서도 캠페인에 투자하는 비용은 점점 더 늘어났지만 실제 캠페인 성공률은 오히려 더 낮아지고 있는 등 캠페인 자체의 효용성이 낮아지고 있다는 문제점이 있어 실무적으로 캠페인의 효과를 높이고자 하는 다양한 연구들이 지속되고 있다. 특히 최근에는 기계학습을 이용하여 캠페인의 반응과 관련된 다양한 예측을 해보려는 시도들이 진행되고 있는데, 이 때 캠페인 데이터의 다양한 특징들로 인해 적절한 특징을 선별하는 것은 매우 중요하다. 전통적인 특징 선택 기법으로 탐욕 알고리즘(Greedy Algorithm) 중 SFS(Sequential Forward Selection), SBS(Sequential Backward Selection), SFFS(Sequential Floating Forward Selection) 등이 많이 사용되었지만 최적 특징만을 학습하는 모델을 생성하기 때문에 과적합의 위험이 크고, 특징이 많은 경우 분류 예측 성능 하락 및 학습시간이 많이 소요된다는 한계점이 있다. 이에 본 연구에서는 기존의 캠페인에서의 효과성 제고를 위해 개선된 방식의 특징 선택 알고리즘을 제안한다. 본 연구의 목적은 캠페인 시스템에서 처리해야 하는 데이터의 통계학적 특성을 이용하여 기계 학습 모델 성능 향상의 기반이 되는 특징 부분 집합을 탐색하는 과정에서 기존의 SFFS의 순차방식을 개선하는 것이다. 구체적으로 특징들의 데이터 변형을 통해 성능에 영향을 많이 끼치는 특징들을 먼저 도출하고 부정적인 영향을 미치는 특징들은 제거를 한 후 순차방식을 적용하여 탐색 성능에 대한 효율을 높이고 일반화된 예측이 가능하도록 개선된 알고리즘을 적용하였다. 실제 캠페인 데이터를 이용해 성능을 검증한 결과, 전통적인 탐욕알고리즘은 물론 유전자알고리즘(GA, Genetic Algorithm), RFE(Recursive Feature Elimination) 같은 기존 모형들 보다 제안된 모형이 보다 우수한 탐색 성능과 예측 성능을 보임을 확인할 수 있었다. 또한 제안 특징 선택 알고리즘은 도출된 특징들의 중요도를 제공하여 예측 결과의 분석 및 해석에도 도움을 줄 수 있다. 이를 통해 캠페인 유형별로 중요 특징에 대한 분석과 이해가 가능할 것으로 기대된다.

머신러닝과 KSCA를 활용한 디지털 사진의 색 분석 -한국 자연 풍경 낮과 밤 사진을 중심으로- (Color Analyses on Digital Photos Using Machine Learning and KSCA - Focusing on Korean Natural Daytime/nighttime Scenery -)

  • 권희은;구자준
    • 트랜스-
    • /
    • 제12권
    • /
    • pp.51-79
    • /
    • 2022
  • 본 연구에서는 색채 계획을 통해 콘텐츠를 제작할 때 참고할 만한 색을 도출하는 방법을 모색하기 위하여 진행되었다. 대상이 된 이미지는 한국 내의 자연풍광을 다룬 사진들로 머신러닝을 활용해 낮과 밤이 어떤 색으로 표현되는지 알아보고, KSCA를 통해 색 빈도를 도출하여 두 결과를 비교, 분석하였다. 낮과 밤 사진의 색을 머신러닝으로 구분한 결과, 51~100%로 구분했을 때, 낮의 색의 영역이 밤의 색보다 2.45배가량 더 많았다. 낮 class의 색은 white를 중심으로, 밤 class의 색은 black을 중심으로 명도에 따라 분포하였다. 낮 class 70%이상의 색이 647, 밤 class 70% 이상의 색이 252, 나머지(31-69%)가 101개로서 중간 영역의 색의 수는 적고 낮과 밤으로 비교적 뚜렷하게 구분되었다. 낮과 밤 class의 색 분포 결과를 통해 명도로 구분되는 두 class의 경계 색채값이 무엇인지 확인할 수 있었다. KSCA를 활용해 디지털 사진의 빈도를 분석한 결과는 전체적으로 밝은 낮 사진에서는 황색, 어두운 밤 사진에서는 청색 위주의 색이 표현되었음을 보여주었다. 낮 사진 빈도에서는 상위 40%에 해당하는 색이 거의 무채색에 가까울 정도로 채도가 낮았다. 또 white & black에 가까운 색이 가장 높은 빈도를 보여 명도차가 크다는 것을 알 수 있었다. 밤 사진의 빈도를 보면 상위 50% 가량 되는 색이 명도 2(먼셀 기호)에 해당하는 어두운 색이다. 그에 비해 빈도 중위권(50~80%)의 명도는 상대적으로 조금 높고(명도 3-4), 하위 20%에서는 여러 색들의 명도차가 크다. 난색들은 빈도 하위 8% 이내에서 간헐적으로 볼 수 있었다. 배색띠를 보았을 때, 전체적으로 남색을 위주로 조화로운 배색을 이루고 있었다. 본 연구의 색의 분포와 빈도의 결과값은 한국 내의 자연 풍경에 관한 디지털 디자인의 색채 계획에 참고 자료로 활용될 수 있을 것이다. 또한 색 분포를 나눈 결과는 해당색이 특정 디자인의 주조색이나 배경색으로 사용될 경우에 두 class 중 어느 쪽에 더 가까운 색인지에 대해 참고사항이 될 수 있을 것이며, 분석 이미지들을 몇 가지 class로 나눈다면, 각 class의 색 분포의 특성에 따라 분석 이미지에 사용되지 않은 색도 어느 class에 얼마큼 더 가까운 이미지인지 도출할 수 있을 것이다.