• 제목/요약/키워드: Web Cluster

검색결과 240건 처리시간 0.029초

농촌지역 청소년의 건강행태 (Health Behaviors among Adolescents in the Rural Area in Korea)

  • 박순우
    • 농촌의학ㆍ지역보건
    • /
    • 제34권2호
    • /
    • pp.202-213
    • /
    • 2009
  • 본 연구는 농촌지역 청소년들의 건강행태를 도시지역 청소년들과 비교하기 위해 2005년에 실시한 전국청소년건강행태 온라인 조사 자료를 이용하여 분석하였다. 그 결과 흡연경험률, 중학교 입학전 흡연경험률, 음주빈도, 음주후 위험행동 경험률, 점심 및 저녁 결식, 과일 및 우유 섭취, 칫솔질 횟수, 구강질환 증상 경험, 구강 진료 경험, 구강 에방진료. 안전 및 위생의식 등의 행태에서 도시지역 청소년에 비해 바람직하지 못 한 결과를 보였다. 이러한 결과가 지역규모에 따른 차이인지 혹은 도농간의 사회경제적 수준의 격차와 관련이 있는지에 대하여 향후 추가적인 연구가 필요하다. 본 조사 결과를 통해 청소년 건강행태 개선을 위한 건강증진사업은 농촌 청소년을 대상으로 우선적으로 수행하여야 할 당위성을 확인하였다고 할 수 있다.

A study on Digital Agriculture Data Curation Service Plan for Digital Agriculture

  • Lee, Hyunjo;Cho, Han-Jin;Chae, Cheol-Joo
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권2호
    • /
    • pp.171-177
    • /
    • 2022
  • 본 논문에서는 다출처 농업 데이터를 통찰할 수 있는 지식체계를 마련하고, 시간 흐름을 가지는 환경인자 분석 정보를 클러스터링 할 수 있는, 농작물 환경 인자 큐레이션 서비스 방법을 제안한다. 제안하는 큐레이션 서비스는 크게 수집, 전처리, 저장, 분석의 네 단계로 구성된다. 첫째, 수집 단계에서는 OpenAPI 기반의 웹크롤러를 이용하여 다출처 농업 데이터에 대한 수집 및 정리를 수행한다. 둘째, 전처리 단계에서는 데이터 측정 오차를 감소시키기 위해 데이터 평활화를 수행한다. 이때 온실, 노지 등의 시설 특성에 따른 오차율을 고려하여 시설 유형별 평활화 방법을 적용한다. 셋째, 저장단계에서는 대용량 농업 데이터 관리를 위해, 농업 데이터 통합 스키마 및 Hadoop HDFS 기반의 저장 구조를 제안한다. 마지막으로 분석 단계에서는 농업 디지털 데이터의 시계열 특성을 고려한 DTW 기반의 시계열 분류를 수행한다. DTW 기반 시계열 분류를 통해 시계열 데이터의 특성을 손실 없이 반영하여 예측 결과 정확도를 향상시킨다. 향후 연구로는 제안한 서비스 방법을 구현하여 스마트팜 온실에 적용하고, 테스트 및 검증을 수행할 예정이다.

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.

심리학적 도구 '5요인 성격 특성'에 의한 소셜 게임 연구: <심즈 소셜> 게임의 분석사례를 중심으로 (Big Five Personality in Discriminating the Groups by the Level of Social Sims)

  • 이동엽
    • 만화애니메이션 연구
    • /
    • 통권29호
    • /
    • pp.129-149
    • /
    • 2012
  • 최근 페이스북이 오픈 플랫폼을 통해 다면시장을 형성함으로써 게임 분야에 소셜이 본격적으로 등장하기 시작하였다. 그중 가장 크게 주목을 받고 있는 분야는 소셜 네트워크를 기반으로 발전한 SNG 분야이다. SNG란 Social Network Game으로 소셜 네트워크 서비스(Social Network Service)의 인맥 관계를 기반으로 제작한 게임을 말한다. SNG의 가장 큰 특징은 게임 실력보다는 네트워크를 통해 이루어진 이웃간의 교류가 게임의 가장 큰 요소로 작용하는 것이다. 이러한 소셜 네트워크 게임의 빠른 성장과 함께 연구되어야할 분야는 인간과 인간, 인간과 게임, 게임과 게임 간의 소통이라 볼 수 있다. 본 연구는 SNG을 플레이하는 유저들의 심리가 소셜을 기반으로 하는 게임 속 캐릭터에 어떠한 영양을 미치는지에 대한 것을 알아보고자 한다. 연구방식은 성격 특성의 상관관계를 검증하는 방식으로 심리학적 성격 5요인 특성(Big Five Factor Model)과 리커트(likert) 척도를 사용하여 유저가 생성한 캐릭터와 성격 5요인 특성을 대입하는 방식을 사용 하였다. 본 논문을 통해 게임을 플레이하는 유저들의 심리상태를 파악하는 방식이 연구되어짐으로써 미래의 소셜 네트워크 게임이 어떠한 방향으로 발전해 나갈 것인지에 대한 준거점 역할을 할 수 있을 것으로 기대한다.

협업 필터링 및 하이브리드 필터링을 이용한 동종 브랜드 판매 매장간(間) 취급 SKU 추천 시스템 (SKU recommender system for retail stores that carry identical brands using collaborative filtering and hybrid filtering)

  • 조용민;남기환
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.77-110
    • /
    • 2017
  • 최근 인터넷 기반의 웹 및 모바일 기기를 통한 소비 패턴의 다양화와 개성화가 급진전됨에 따라 전통적 유통채널인 오프라인 매장의 효율적 운영이 더욱 중요해졌다. 매장의 매출과 수익 모두를 제고하기 위해 매장은 소비자에게 가장 매력적인 상품을 적시에 공급-판매 해야 하는데 많은 상품들 중에서 어떤 SKU를 취급하는 것이 판매 확률을 높이고 재고 비용을 낮출 수 있는지에 대한 연구가 부족한 실정이다. 특히, 여러 지역에 걸쳐 다수의 오프라인 매장을 통해 상품을 판매하는 기업의 경우 고객에게 매력적인 적절한 SKU를 추천 받아 취급할 수 있다면 매장의 매출 및 수익률 제고에 도움이 될 것이다. 본 연구에서는 개인화 추천에 이용되어 왔던 협업 필터링과 하이브리드 필터링 등의 추천 시스템(Recommender System)을 국가별, 지역별로 복수의 판매 매장을 통해 동종 브랜드를 취급하는 유통 기업의 매장 단위 취급 SKU 추천 방식을 제안하였다. 각 매장의 취급 품목별 구매 데이터를 활용하여 각 매장 별 유사성(Similarity)을 계산하고 각 매장의 SKU별 판매 이력에 따라 협업 필터링을 하여 최종적으로 매장에 개별 SKU를 추천하였다. 또한 매장 프로파일 데이터를 활용하여 주변수 분석 (PCA : Principal Component Analysis) 및 군집 분석(Clustering)을 통하여 매장을 4개의 군집으로 분류한 뒤 각 군집 내에서 협업 필터링을 적용한 하이브리드 필터링 방식으로 추천 시스템을 구현하고 실제 판매 데이터를 바탕으로 두 방식의 성능을 측정하였다. 현존하는 대부분의 추천 시스템은 사용자에게 영화, 음악 등의 아이템을 추천하는 방식으로 연구가 진행되어 왔고 실제로 산업계에서의 적용 또한 개인화 추천 시스템이 주류를 이루고 있다. 그 동안 개인화 서비스 영역에서 주로 다루어져 왔던 이러한 추천 시스템을 동종 브랜드를 취급하는 유통 기업의 매장 단위에 적용하여 각 매장의 취급 SKU를 추천하는 방식에 대한 연구는 거의 이루어지지 않고 있는 실정이다. 기존 추천 방법론의 추천 적용 대상이 '개인의 영역이었다면 본 연구에서는 국가별, 지역별로 복수의 판매 매장을 통해 개인의 영역을 넘어 매장의 영역으로 확대하여 동종 브랜드를 취급하는 유통 기업의 매장 단위 취급 SKU 추천 방식을 제안하고 있다. 또한 기존의 추천시스템은 온라인에 한정되었다면 이를 오프라인으로 활용 범위를 넓히고, 기존 개인을 기반으로 분석을 하는 것보다 매장영역으로 확대 적용하기에 적합한 알고리즘을 개발하기 위해 데이터마이닝 기법을 적용하여 추천 방법을 제안한다. 본 연구의 결과가 갖는 의의는 개인화 추천 알고리즘을 동일 브랜드를 취급하는 복수의 판매 매장에 적용하여 의미 있는 결과를 도출하고 실제 기업을 대상으로 시스템으로 구축하여 활용할 수 있는 구체적 방법론을 제시했다는 데에 있다. 개인화 영역을 위주로 이루어졌던 기존의 추천 시스템과 관련한 학계의 연구 영역을 동종 브랜드를 취급하는 기업의 판매 매장으로 확장시킨 첫 시도라는 데에도 의미가 있다. 2014년 03주차 ~ 05주차 전(全) 매장 판매 수량 실적 Top 100개 SKU로 추천의 대상을 한정하여 협업 필터링과 하이브리드 필터링 방식으로 52개 매장 별로 취급 SKU를 추천하고, 추천 받은 SKU에 대한 2014년 06주차 매장별 판매 실적을 집계하여 두 추천 방식의 성과를 비교하였다. 두 추천 방식을 비교한 이유는 본 연구의 추천 방법이 기존 추천 방식 보다 높은 성과를 입증하기 위해 단순히 오프라인에 협업필터링을 적용한 것을 기준 모델로 정의하였다. 이 기준 모델에 오프라인 매장 관점의 특성을 잘 반영한 본 연구 모델인 하이브리드 필터링 방법과 비교 함으로써 성과를 입증한다. 연구에서 제안한 방식은 기존 추천 방식보다 높은 성과를 나타냈으며, 이는 국내 대기업 의류업체의 실제 판매데이터를 활용하여 입증하였다. 본 연구는 개인 수준의 추천시스템을 그룹수준으로 확장하여 효율적으로 접근하는 방법을 이론적인 프레임 워크를 만들었을 뿐 아니라 실제 데이터를 기반으로 분석하여 봄으로써 실제 기업들이 적용해 볼 수 있다는 점에서 연구의 가치가 크다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.

소비자대함유한국전통시상설계원소적편복적소비행위지우생활방식적조절작용(消费者对含有韩国传统时尚设计元素的便服的消费行为之于生活方式的调节作用) (Moderating Effect of Lifestyle on Consumer Behavior of Loungewear with Korean Traditional Fashion Design Elements)

  • Ko, Eun-Ju;Lee, Jee-Hyun;Kim, Angella Ji-Young;Burns, Leslie Davis
    • 마케팅과학연구
    • /
    • 제20권1호
    • /
    • pp.15-26
    • /
    • 2010
  • 由于生产的全球化以及国家之间的文化交流, 东方元素越来越吸引世界的眼球. 在时装界, 一个时装设计师的文化背景往往可以催生新颖的设计理念, 使他卓尔不群. 人们对于东方元素的喜爱, 给传统时装市场带来了巨大的商机, 并且把基于文化的业务拓展到全球时装市场. 然而, 包含韩国传统文化的国际品牌还有待开发. 为了发展有韩国特色的国际品牌, 韩国人首先要在国内服装市场上认同本国文化, 然后才能进军国外市场. 便服非常适合采纳韩国元素, 因为这种衣服有很多用途, 很容易被广泛接受和使用. 而且, 多用途便服和时尚内衣的市场需求越来越大. 尽管便服市场在快速发展, 但是对便服的专门研究尚不多见, 目前在对发展中的现代化传统服装、时尚产品和品牌的研究中, 并不包括对便服的研究. 因此, 本论文调查了韩国的便服市场, 研究了消费者对含有韩国传统时装设计特色的便服的评价. 分析了对于韩国传统时装设计元素有购买意向的先例之间的关系, 并且比较了不同生活群体的消费目标. 产品质量, 零售服务质量, 感受价值以及对拥有韩国传统设计元素的便服的喜好被作为购买意向的先决条件. 同时, 本文设计了一个结构方程模型, 用于探讨它们之间的关系以及它们对购买意图的影响. 产品质量和市场营销中的零售服务质量结合在一起, 成为影响人们对韩国特色便服的偏好和价值感知的因素. 而且, 偏好和价值感知对购买意向的影响可以用同一模型来检验. 通过网上调查系统由女性消费者完成了一共357份的自填式问卷, 并制定了一份调查样本人群的生活方式、对于产品和销售服务的标准、对于韩国特色便服的价值感知、偏好以及购买意向的调查问卷. 此外, 问卷还将调查便服的采购和使用行为, 以便检验韩国便服的市场地位. 并且使用描述性分析, 因素分析, 聚类分析来分析数据, 以及使用AMOS 7.0.来进行方差分析和建立结构方程模型. 对于韩国便服市场地位的调查结果显示, 在我们的样本人群中大多数消费者都购买了便服. 便服在目前被认为是在家里穿的衣服, 是消费者比较而言投入较低的衣服. 在调查中显示, 大多数消费者每年仅仅购买2到3次便服, 花费在10美元以下. 购买便服的消费者们的生活方式共有四类: 传统价值导向的生活方式, 品牌影响的生活方式, 追求休闲的生活方式以及健康导向的生活方式, 这四类共计有12个项目. 基于这些生活方式要素, 便服消费者们又可以分为两类: 安乐派和保守派. 文章估量了对含有韩国传统时尚设计元素的便服的购买行为各组成部分之间的关系, 产品质量和零售服务质量都会影响到购买便服的偏好和价值感知. 这个研究结论证明, 高质量的产品和零售服务会对便服形成积极的优先效应. 价值感知和对便服的偏好会对购买意图产生积极的影响. 这个结果表明, 对便服所含有的韩国传统时尚设计因素的强烈偏好和价值感知能增强购买意图. 在两种不同生活方式的群体(即安乐派和保守派)的模型比较中, 结果显示产品质量和零售服务质量对安乐派群体的偏好和感知价值都有积极影响. 然而, 对保守派来说, 只有零售服务质量对偏好和购买意图有积极的影响. 由于安乐派对购买意图显示出更重大的影响, 包含韩国传统时尚设计因素的便服品牌应该关注安乐派的这些特征. 然而, 保守派对包含韩国传统时尚设计因素的便服在偏好和购买意图的关系中显得更强. 因此对包含韩国传统时尚设计因素的便服品牌来说, 它应该把重点放在如何激发保守群体消费者对便服的积极偏爱上. 这些结果提供了关于韩国便服消费者生活方式的信息, 也对那些计划进入韩国便服市场的时尚品牌, 尤其是那些与现行研究样本相似的, 目标为女性消费者的时尚品牌提供了有用的信息. 这一研究也为便服品牌和那些打算创造含有韩国传统时尚因素的高价值品牌提供了策略和市场洞察力. 考虑到不同生活方式群体的类型和便服或传统时尚商品之间的关系, 品牌设计者和市场策划人员可以运用这一研究成果作为市场定位, 目标设定, 以及市场销售策略的一个参考.

관우한국생태학적일개예설(关于韩国生态学的一个预设): 기우복장탑배적행위(基于服装搭配的行为) (Typology of Korean Eco-sumers: Based on Clothing Disposal Behaviors)

  • Sung, Hee-Won;Kincade, Doris H.
    • 마케팅과학연구
    • /
    • 제20권1호
    • /
    • pp.59-69
    • /
    • 2010
  • 绿色环保或者环境意识已经成为商业、政府机关, 以及消费者和世界关注的重要问题. 针对这一情况, 韩国政府宣布, 在本世纪初, "环保建设" 将被作为一种用以鼓励与环保相关的商业活动的方式. 不同层次的韩国服装业, 提出了不同的产品环保的绿色计划. 这些服装产品包括有机产品和回收的衣服. 要想使这些公司成功, 他们需要那些, 在做产品购买,使用, 处置时, 将绿色问题(如环境的可持续性发展)作为一个人判断的一个组成部分的顾客的信息. 这些消费者可以被看成是生态学的关注者. 过去的研究已经对消费者对于环保产品的购买意愿进行了检测. 此外, 还研究了影响生态保护者或绿色消费者的因素. 但是, 只是关注生态保护者在处置或者回收利用衣服上与采购绿色产品相比较是不够的. 服装处置行为有多种途径, 消费者可以用淘汰, 传承(例如: 把它送给一个年幼的弟弟), 赠与, 交换, 出售或者简单的把他扔掉等多种方式来暂时或者永久的摆脱闲置的衣服或贷款项目. 因此, 购买环保产品的行为应该结合服装处置的行为, 从而进一步了解消费者的消费行为与对环境的态度. 本项研究的目的在于提供韩国生态保护者从有利于生态学的角度出发来购买和处理衣服的生活方式的相关信息. 本研究的目标有: 1, 基于韩国对服装处置行为进行分类; 2, 调查人 们人口统计数据, 生活方式和服装消费价值观赏的差异; 3, 在环保的时尚物品的购买意愿和影响因素之间进行比较. 自填式的调查问卷是基于以往的研究设置出来的. 问卷包括10项处置衣服的条款, 22项可持续并且健康的生活方式的条款, 以及19项消费观念的条款. 根据利克特模板的五分量表设置. 此外, 购买两个时尚物品的意愿和每个物品属性的11项特征都是根据利克特模板的七分量表而来, 两种制成羊毛套衫的可以从PET识别代码的回收瓶子中创造出来的涤纶织物这两种套衫选自一个韩国和一个美国的户外运动服装的品牌. 我们对每一种产品的简介和颜色都进行了调查, 人口统计学(即性别, 年龄, 婚姻状况, 教育程度, 收入, 职业)也被包括在内. 在2009年5月份, 研究数据通过一个专业网站的调查机构进行采集, 最后有600份调查问卷可供分析, 这个调查的受访者年龄从20到49岁不等, 平均年龄为34岁. 百分之50的调查者为男性, 大约58%的受访者是已婚者, 其中62%的受访者有大学学位. 主要成分分析和因素最大方法差的方法用以识别衣服处理规模的潜在尺度. 共有三个因素生成(比如: 倒卖行为, 捐赠行为, 不回收利用行为). 基于他们处置衣服的方式对受访者进行了分类, 群类分析被使用, 最终得到了三个部分. 不同的消费者, 被分别贴上 "转售集团", "捐资团体" 以及 "不回收组织" 的标签加以分类, 其中98%是正确的分类. 从人口统计学角度来看, 这三个类别的人在性别, 婚姻状况, 职业和年龄上有显著的差异. 健康可持续的生活方式被缩减为以下5个因素: 自我满意度, 家庭定位, 健康问题, 环境问题和自愿的服务. 这是三个群体中健康可持续的生活方式的最显著的差异. 转售集团和捐赠组表现出在健康可持续的生活方式上的相同倾向, 同时, 不回收集团在生活方式方面呈现最低的平均值. 转售和捐赠团体自称享受和满意这种生活和消费方式, 并且能够利用空余的时间陪伴家人. 另外, 这两组的人关心健康和有机食品, 并试图保护能源和资源. 对服装消费的价值观产生主要影响的三个因素是: 个人价值, 社会价值和实用价值. 因素的方差测试表明转售集团和其他两组之间的因素差异最大. 转售集团相比其他价值更关注个人价值和社会价值. 相比之下, 非回收集团比捐赠集团更关注高层次的社会价值. 比较购买环保产品的意愿上, 转售集团表现出最高的购买A类产品的意愿. 另一方面, 捐赠集团则在小市场中表现出购买B类产品的最高意愿. 此外, 平均分数表明, 购买韩国的产品(B类产品)相比购买美国的产品(A类产品)更合韩国人的心意. 多元线性回归分析法确定了对环保产品的购买的意愿对制造业产品属性的影响. 产品的设计, 价格, 贡献, 对环境的保护, 价格, 兼容性是影响转售集团的显著因素, 另外, 以及对自身形象的影响是捐赠团体的重要因素. 对于非回收集团来说, 设计, 价格等因素是相同的, 自我的形象,对环保运动的贡献, 和环境保护也是很重要的. 而价格因素具有显著性的共通性. 对于B类产品来说, 设计, 合理的价格, 形象等因素是同等的重要, 但是不同的组对购买的特征和意愿有不同的倾向. 健康可持续的生活方式以及服装消费的意向对购买A类产品和B类产品的影响同样被我们所关注. 实际操作者的健康状况和个人价值都是影响购买意愿的重要因素; 然而, 在这三个群体中说服的力度都很低. 结果表明, 分类出来的每组处理服装的行为, 显示着不同服装产品的属性, 个人价值, 和实践者的特点, 这些都影响了他们的购买环保产品的意愿, 结果会使生态保护者提出并组织更合理的生态设计的战略决策.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법 (Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation)

  • 유띳로따낙;누르지드;하인애;조근식
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.57-77
    • /
    • 2013
  • 소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.