• 제목/요약/키워드: Matrix addition

검색결과 2,041건 처리시간 0.033초

음악과 플레이리스트의 메타데이터를 활용한 하이브리드 음악 추천 시스템에 관한 연구 (Research on hybrid music recommendation system using metadata of music tracks and playlists)

  • 이현태;임규건
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.145-165
    • /
    • 2023
  • 추천 시스템은 인터넷의 발달로 급격하게 증가하는 정보의 양으로 인해 생긴 정보 선택의 어려움을 소비자에게 덜어주고 각 개인의 취향에 맞는 정보를 효율적으로 보여주는 중요한 역할을 한다. 특히, E-commerce와 OTT 기업은 상품과 콘텐츠 양이 급격하게 증가하면서 추천 시스템의 도움 없이는 인기 있는 상품만 소비되는 현상을 극복하지 못한다. 이러한 현상을 극복하고 고객 개인 취향에 맞는 정보 혹은 콘텐츠를 제공해 고객의 소비를 유도하기 위해 추천 시스템의 연구가 활발히 진행되고 있다. 일반적으로 유저(user)의 과거 행동 이력을 활용한 협업 필터링이 유저가 선호한 콘텐츠의 정보를 활용하는 콘텐츠 기반 필터링에 비해 높은 성능을 보여준다. 하지만 협업 필터링은 과거 행동 데이터가 부족한 유저에 대해서는 추천의 성능이 낮아지는 콜드 스타트(Cold Start) 문제를 겪게 된다. 본 논문에서는 카카오 아레나 경진대회에서 주어진 음악 스트리밍 서비스 멜론의 플레이리스트 데이터를 기반으로 앞에서 언급한 콜드 스타트 문제를 해결할 수 있는 하이브리드 음악 추천 시스템을 제시했다. 본 연구에서는 플레이리스트에 수록된 곡 목록과 각 음악과 플레이리스트의 메타데이터를 활용해 절반 혹은 전부 가려진 플레이리스트의 다른 수록 곡을 예측하는 것을 목표로 하였다. 이를 위해 플레이리스트 안에 곡이 있는 경우와 아예 곡이 없는 경우를 나눠서 추천을 진행하였다. 플레이리스트 안에 곡이 있는 경우에는 해당 플레이리스트의 곡 목록과 각 곡의 메타데이터를 활용하기 위해 LightFM을 활용하였다. 그 다음에 Item2Vec을 활용해 플레이리스트에 있는 수록 곡과 태그 및 제목의 임베딩 벡터를 생성하고 이를 추천에 활용하였다. 최종적으로 LightFM과 Item2Vec 모델의 앙상블을 통해 최종 추천 결과를 생성하였다. 플레이리스트 안에 곡이 없고 태그 혹은 제목만이 존재할 경우에는 플레이리스트의 메타데이터인 태그와 제목을 FastText를 활용해 사전 학습을 시켜 생성된 플레이리스트 벡터를 기반으로 플레이리스트 간의 유사도를 활용하여 추천을 진행하였다. 이렇게 추천한 결과, 기존 Matrix Factorization(MF)에서 해결하지 못한 콜드 스타트 문제를 해결할 수 있었을 뿐만 아니라 곡과 플레이리스트의 메타데이터를 활용해 기존 MF 모델인 ALS와 BPR 그리고 Word2Vec 기반으로 추천해 주는 Item2Vec 기술보다 높은 추천 성능을 낼 수 있었다. 또한, LightFM을 토대로 다양한 곡의 메타데이터를 실험한 결과, 여러 메타데이터 중에서 아티스트 정보를 단독으로 활용한 LightFM 모델이 다른 메타데이터를 활용한 LightFM 모델들과 비교해 가장 높은 성능을 보여준다는 것을 확인할 수 있었다.

시엽(Persimmon Leaves) 에탄올 추출물의 항산화와 항주름 효과 (Antioxidant and Antiwrinkle Effects of Persimmon Leaves extract)

  • 김성희;김동희;위혜연;이진태;장영아
    • 한국응용과학기술학회지
    • /
    • 제40권3호
    • /
    • pp.534-546
    • /
    • 2023
  • 본 연구에서는 시엽의 기능성 화장품 소재로서의 활용 가능성을 평가하기 위해 항산화와 인간섬유아세포인 CCD-986sk 세포에서의 항주름 효과를 알아보았다. 전자공여능 측정, ABTS+ radical 소거능 측정을 통해 항산화 활성을 확인한 결과, 시엽은 1,000 ㎍/ml 농도에서 대조군인 ascorbic acid와 농도 의존적으로 유사한 항산화 활성을 보였다. Elastase 저해 활성 측정, Collagenase 저해 활성 측정을 통해 항주름 효과를 확인한 결과, 시엽은 1,000 ㎍/ml 농도에서 대조군인 epigallocatechin gallate와 농도 의존적으로 유사한 항주름 효과를 나타내었다. UVB로 유도된 CCD-986sk 세포 내 pro-collagen type I의 합성률과 MMP-1의 저해률을 측정한 결과 대조군인 EGCG는 20 ㎍/ml에서 90.2%, 시엽은 30 ㎍/ml에서 88.5%의 pro-collagen 합성률을 보였다. 또한 EGCG 20 ㎍/ml와 시엽 30 ㎍/ml에서 각각 33.0%, 40.8%의 MMP-1 저해율을 확인하였다. Western blot을 통하여 시엽의 pro-collagen type I과 MMP-1의 단백질 발현량을 측정한 결과 UVB 단독군 대비 시엽을 함께 처리했을 때 pro-collagen type I의 단백질 발현량이 증가하고 MMP-1의 단백질 발현량이 감소하는 것을 확인하였다. 위 실험결과에 따라 시엽이 UVB 자극에 의한 광노화를 예방하고 항산화, 항주름 효과가 있음을 확인하여 화장품의 천연물 소재로서의 이용이 기대된다.

분리학습 모델을 이용한 수출액 예측 및 수출 유망국가 추천 (Export Prediction Using Separated Learning Method and Recommendation of Potential Export Countries)

  • 장영진;원종관;이채록
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.69-88
    • /
    • 2022
  • 최근 코로나19 팬데믹으로 인해 전 세계 경제와 외교 상황에 급격한 변화가 일어나고 있으며, 수출 의존도가 높은 한국은 이러한 변화에 큰 영향을 받고 있다. 본 연구에서는 기업의 수출전략 수립 및 의사결정 지원을 위해 차년도 수출액 예측 모델을 구축하고, 모델의 예측 결과를 바탕으로 수출 유망국가 추천 방식을 제안한다. 본 연구에서는 모델이 다양한 정보를 학습할 수 있도록 국가별, 품목별, 거시경제 변수 등 선행 연구에서 중요하게 사용된 변수를 다방면으로 수집하였다. 수집한 데이터를 분석한 결과, 국가와 품목에 따라서 수출액의 분포가 매우 비대칭적인 것을 확인할 수 있었다. 따라서, 모델의 예측 성능을 향상시키고 설명력을 확보하기 위해서 분리학습 방식을 사용하였다. 분리학습은 전체 데이터를 동질적인 하위 그룹으로 분리하고 개별 모델을 구축하는 방식으로, 본 연구에서는 수출액을 기준으로 5개 구간으로 데이터를 분리하였다. 모델 학습 과정에서 구간별 특성을 반영하여 구간1부터 구간4까지는 LightGBM을 사용하고, 구간5는 지수이동평균을 사용하였으며 이를 통해 모델의 예측 성능을 향상시킬 수 있었다. 모델의 설명력 확보를 위해서 추가로 구간별 모델의 SHAP-value를 계산하고 중요도가 높은 변수를 제시했다. 또한, 본 연구에서는 예측 모델을 기반으로 2단계 수출 유망국가 추천 방식을 제안했다. 효율적인 수출 전략 수립을 위해서 BCG 매트릭스와 국가별 점수 산출 방식을 사용하였고, 품목별 유망 국가 순위와 수출 관련 주요 정보들을 제공하였다. 본 연구는 다양한 정보를 학습한 머신러닝 모델로 여러 국가와 품목에 대한 예측을 실시하고, 이 과정에서 분리학습 방식으로 예측 성능을 향상시켰다는 점에서 의의가 있다. 또한, 현재 무역 관련 서비스들이 과거 데이터에 기반한 정보를 제공하고 있음을 고려할 때, 본 연구에서 제안한 예측 모델과 유망국가 추천 방식은 기업들의 미래 수출 전략 수립 및 동향 파악에 유용하게 사용될 수 있을 것으로 기대된다.

YD-10B 구강암세포에서 홍영 에탄올 추출물과 시스플라틴 병용에 의한 항암 효과 (Anti-tumor Effect of a Combination of Hongyoung Ethanol Extract and Cisplatinin YD-10B Oral Cancer Cells)

  • 김은정;황성희;박상욱
    • 생명과학회지
    • /
    • 제33권6호
    • /
    • pp.498-505
    • /
    • 2023
  • 붉은색을 나타내는 홍영감자(Solanum tuberosum Linnaeus)는 국내에서 개발되었다. 이는 항산화, 항염증, 항바이러스 및 항암효과를 갖고 있는것으로 알려져 있으나, 아직까지는 YD-10B 구강암세포에서의 홍영에 의한 성장억제 및 세포사멸 효과 연구는 보고된 바가 없다. 본 연구에서는 시스플라틴과 홍영 에탄올 추출물의 병용처리에 의한 암세포 성장억제, 세포사멸 유도 및 MMP-2/-9 암전이 억제 능력을 확인하였다. 세포생존율 측정은 MTS법에 의해 조사하였고, 세포사멸 유도 능력은 FACS 분석기를 이용하여 분석하였고, MMP-2/-9의 유전자 발현과 단백질 활성은 RT-PCR과 Zymography법을 통하여 측정하였다. 결과로는, 홍영 에탄올 추출물의 농도가 증가함에 따라 구강암 세포 성장억제 효과가 증가함을 보였다. 시스플라틴 단독처리보다 200 µM의 시스플라틴과 500 ㎍/ml의 홍영 에탄올 추출물 병용처리로 YD-10B 구강암세포의 성장이 50% 이상 감소하였다. PMA 처리된 YD-10B 구강암 세포에서 500 ㎍/ml의 홍영 에탄올 추출물과 200 µM의 시스플라틴을 병용처리 하였을 때, MMP-2/-9의 mRNA 발현과 단백질 활성들이 모두 감소하였다. 또한, 시스플라틴 단독처리보다 200 µM의 시스플라틴과 500 ㎍/ml의 홍영 에탄올 추출물 병용처리로 세포사멸 능력을 나타내는 Sub-G1의 세포비율이2배 이상 증가하였다. 따라서, 본 연구결과는 시스플라틴과 홍영 에탄올 추출물의 병용처리가 구강암의 효과적인 항암제로서의 가능성을 시사하고 있다.

이너뷰티 소재로서의 생물전환된 가시오가피-진피 혼합 추출물의 생물학적 활성 (Biological Activity of Mixed Extracts of Acanthopanax senticosus and Citrus unshiu Fermented with Bovista plumbea for Inner Beauty)

  • 김은정;김소연;강수연;유영춘;윤택준;이계원;조영호
    • 생명과학회지
    • /
    • 제33권7호
    • /
    • pp.555-564
    • /
    • 2023
  • 본 연구에서는 이너뷰티용 소재로서의 활용가능성을 확인하기 위하여 생물전환 가시오가피-진피 혼합추출물(B-MEAC)의 항산화 활성, 엘라스타제 억제활성 및 피부보습 효과 등을 평가하였다. B-MEAC의 항산화 활성을 측정한 결과 DPPH radical을 농도의존적으로 소거하여 SC50이 156.1±0.82 ㎍/ml로 나타났다. 또한, 엘라스타제 억제활성을 측정한 결과 B-MEAC 처리 농도 의존적으로 엘라스타제 활성을 억제하는 것으로 확인되었다(p<0.001). 경구투여한 B-MEAC가 마우스 피부 보습에 미치는 영향을 확인하기 위하여 피부 수분량과 경피수분손실량을 측정한 결과 건조유도 된 대조군에 비하여 피부 수분량은 증가하고(p<0.001), 경피수분손실량은 감소하는 것으로 나타났다(p<0.01). 또한, 건조유도 된 마우스 피부의 교원섬유 변화에 미치는 영향을 Masson's trichrome 염색을 통해 관찰한 결과 B-MEAC를 투여한 군에서 콜라겐의 양이 대조군에 비해 상대적으로 증가하여 푸른색으로 보다 진하게 염색되었다. 또한, 건조유도 된 마우스 피부의 보습 기능에 미치는 영향을 확인하기 위하여 보습 관련 인자들의 발현을 Western blot 기법으로 확인한 결과 B-MEAC를 투여한 군에서 대조군에 비하여 MMP-1 단백질의 발현량은 감소하였고, COL1A1, HAS2, filaggrin, AQP3 단백질 발현량은 회복되는 것으로 나타났다(p<0.001). 따라서 B-MEAC의 보습효과는 엘라스타제 활성 억제, MMP-1 발현 감소, 콜라겐 생성 촉진, 피부 보습 관련 단백질인 HAS2 및 AQP3 발현 증가, 피부 장벽기능의 중요인자인 filaggrin 발현 증가를 통한 수분량 증가와 TEWL 감소에 의해 나타나는 것으로 이너뷰티 소재로서의 개발 가능성을 제시한다.

스타트업의 스케일업 창업생태계 구성요소의 IPA 분석 (IPA Analysis of the Components of the Scale-up Entrepreneurial Ecosystem of Startups)

  • 윤혜미;남정민
    • 벤처창업연구
    • /
    • 제17권6호
    • /
    • pp.25-37
    • /
    • 2022
  • 본 연구는 우리나라 국가 수준에서 스케일업 창업생태계의 구성요소에 대한 중요도와 만족도(현재 수준)를 창업 후 7년 이내의 스타트업 창업자들을 대상으로 설문을 실시하고 구성요소별 스케일업 정책 방향을 IPA(importance-performance analysis) 분석을 활용하여 분석하는 데 목적이 있다. 창업생태계의 주체자인 창업자들의 인식은 창업의 양과 질에 영향을 주기 때문에 스케일업 구성요소에 대한 인식을 분석 하고 진단해 보는 연구가 필요하다. 국가 경제와 창업생태계의 발전을 위해서는 스타트업에서 스케일업, 유니콘으로 부상하는 기업들이 배출되어야 하고 이를 위해서는 스케일업 창업생태계를 위한 요소들이 필요하다. 본 연구의 주요 연구 결과는 다음과 같다. 첫째, 창업자들이 인식하는 스케일업 창업생태계 구성요소의 중요도 순위는 '성장단계별 자금 지원', '기업 맞춤형 스케일업 지원', '규제 개선', '스케일업 전용 펀드', '투자 대형화', '기술 인재 육성'순으로 나타났다. 둘째, 중요도-만족도 매트릭스에서 향후 집중적으로 개선해야 하는 요인은 '범정부 통합 추진 계획', '스케일업 전문 조직 운영', '기업 맞춤형 스케일업 지원', '규제 개선', '한국 스케일업 모델 구축'으로 나타났다. 이에 따라, 스케일업 창업생태계를 위해 다양하고 대형화된 금융자본, 사업 분야별 스케일업 프로그램의 다양화, 스타트업과 스케일업 지원의 연계, 신기술 및 신산업 분야의 규제 완화, 기업 맞춤형의 스케일업 성장 역량 강화, 해외 네트워킹 기회 제공 등을 시사점으로 도출할 수 있다. 또한 국내 스케일업 창업생태계 구성요소를 도출하고 이에 대한 인식을 진단한 연구로 정책 실무와 학술적으로 기여할 것으로 본다.

유연 종이 식품 포장재의 개질 아크릴 에멀젼 코팅 특성 및 재활용성 평가 (The Evaluation of the Packaging Properties and Recyclability with Modified Acrylic Emulsion for Flexible Food Paper Coating)

  • 이명호;조인석;이동철;이윤석
    • 한국포장학회지
    • /
    • 제29권3호
    • /
    • pp.153-161
    • /
    • 2023
  • 최근 소비자들의 소비 형태가 온라인 쇼핑 및 간편식, 배달 음식 등 비대면 소비를 위한 서비스 시장이 크게 확대됨에 따라 플라스틱 일회용 제품의 소비가 급증하게 되면서, 사용한 플라스틱 폐기물에 의한 여러 환경오염 문제들이 발생하고 있다. 이러한 문제를 해결하기 위해 국제적으로 플라스틱 사용을 줄이고, 환경친화성 및 재활용성이 높은 지속 가능 물질로 대체하려는 움직임을 보이고 있다. 본 연구에서는 재활용성이 높은 종이에 다양한 종류의 배리어 코팅을 적용한 종이 시료의 물성과 배리어 특성 및 재활용성 등을 평가하여 실제로 식품용으로 사용되는 종이의 코팅층 종류와 이에 따른 물성 및 배리어성 개선 효과 및 재활용성에 미치는 영향을 확인하고자 하였다. 배리어 코팅종류는 PE와 PP, 개질 아크릴 코팅이 된 종이 시료를 사용하였으며, 코팅 처리하지 않은 종이를 대조군으로 하여 평가를 진행하였다. 형태학적 분석을 통해 PE의 코팅층은 약 30 ㎛, PP는 약 20 , 개질 아크릴은 10 ㎛의 코팅층 두께를 보여주었으며, 섬유조직 형태를 보여주던 대조군의 표면과 달리 배리어 코팅 종이는 코팅층으로 인하여 매끈한 표면 형태를 보여주었다. 기계적 물성 평가에서는 PE 코팅 종이와 개질 아크릴 코팅 종이에서 대조군이 비해 인장강도와 파열강도에서 개선되는 결과를 보여주었으며, PP 코팅 종이에서는 파열강도 외에 대조군과 유의적 차이를 보여주지 않았다. 공기 투기도 평가로 배리어 코팅층이 없는 대조군에서 약 2.24 ㎛/Pa·s로 가장 높은 투기도 값을 보여주었으며, 배리어 코팅 종이의 경우 모두 0.003 ㎛/Pa·s 이하의 상대적으로 낮은 투기도 값을 보여주었다. 또한 Cobb 사이즈도 대조군에서 약 43.77 g/m2로 가장 높은 흡수 특성을 보였으며, 배리어 코팅 종이 시료에서는 2.80 g/m2 이하의 흡수 특성을 보여주었다. 이는 이미 내수성 및 기체 차단 특성을 가진 고분자의 특성으로 종이의 차단 특성도 개선된 것으로 판단된다. 내유성 평가에서도 PE 코팅 종이와 PP 코팅 종이에서 최고 측정값인 12 등급으로 내유성이 높은 특징을 보여주었으며, 개질 아크릴 코팅 종이는 5 등급으로 PE, PP 코팅 종이 보다 상대적으로 낮은 내유성을 보여주긴 하였으며, 대조군은 0 등급으로 내유성이 없는 모습을 보여주었다. 코팅 처리별 종이의 재활용성 평가에서 대조군의 리젝트율은 5.25%로 모든 시료 중 미해리분이 가장 낮은 모습을 보여주었으며, PE 코팅 종이와 PP 코팅종이는 각각 19.04%, 16.57%로 리젝트율이 증가함을 나타냈다. 상대적으로 높은 리젝트율 값은 PE 코팅 종이와 PP 코팅 종이는 해리 시 코팅 층이 작은 크기로 조각나 미분화되어 슬릿에 걸러지는 것으로 확인하였으며, 이는 미해리분으로 인해 재활용에 어려움이 발생할 것으로 판단된다. 개질 아크릴 코팅 종이의 리젝트율은 6.25%로 대조군과 유사하게 미해리분 없이 스크린을 거의 통과되는 현상을 보여주었다. 이 결과는 개질 아크릴 수지의 수해리성이 높아 발생한 것으로 판단된다. PE 및 PP 코팅 종이에 비교하여 개질 아크릴 코팅 종이가 재활용성 평가에서 더 효율적인 결과를 가짐을 나타내며, 추가 해리되어 스크린 업셉트된 펄프 슬러리를 사용하여 제조한 재활용지에 대한 종이의 품질 변화는 향후 보강 연구가 필요할 것으로 판단된다.

B2B 시장에서의 서비스 편의성이 관계성과에 미치는 영향 : 관계적 요인의 매개효과 분석 (Effect of Service Convenience on the Relationship Performance in B2B Markets: Mediating Effect of Relationship Factors)

  • 한상린;이성호
    • 한국유통학회지:유통연구
    • /
    • 제16권4호
    • /
    • pp.65-93
    • /
    • 2011
  • B2B 시장에서 구매자와 판매자간의 관계는 매우 밀접하고 장기화되는 것이 특징이므로 결국 단순한 제품을 판매하는 것에 그치는 것이 아닌 지속적인 서비스에 대한 중요성이 날로 커지고 있다. 산업재 연구 전반에 걸쳐서도 서비스에 대한 중요성과 관심이 증대되면서 고객이 서비스를 사용하는데 있어서 그 서비스의 품질과 함께 최근 소비자들은 얼마나 빠르고 쉽게 서비스가 제공되어 투입되는 노력을 최소화시킬 수 있는가를 매우 중요하게 생각하기 때문에 편의성이 중요한 요인으로 고려되어지고 있다. 이에 따라, 본 연구에서는 산업재 시장에서 관계만족과 관계성과를 형성하는데 중요하게 생각할 수 있는 새로운 요인이 어떤 것인가 라는 의문점에서 출발하여, 서비스 편의성과 관계성과 사이의 구조적 관계를 조사하고자 하였다. 이 연구의 가장 큰 학문적 기여점은 산업재 연구에서 주류를 이루고 있는 관계품질과 관계성과의 새로운 선행요인을 검증한 것이다. 또한 소비재 시장에서 주로 연구되었던 서비스 편의성 척도를 산업재 시장에 적용하여 그 활용도를 실험해 보았다는 데 의의가 있다. 본 연구는 서비스 편의성의 구성요소인 서비스 편의성을 결정편의성, 접근편의성, 거래편의 성, 편익편의성, 사후편익편의성 다섯가지 차원으로 구분하고 관계적 요인인 관계만족에 미치는 영향과 이러한 관계만족이 관계몰입과 관계성과에 어떠한 영향을 미치는가를 분석하여 서비스 편의성의 관리와 투자에 대한 마케팅 측면의 중요성을 제시하고 있다. 실증분석을 위해 산업재 서비스를 이용하고 있는 기업의 직원들을 대상으로 설문을 통해 데이터를 수집하였으며 서비스 편의성 ${\rightarrow}$ 관계만족 ${\rightarrow}$ 관계몰입 $\{rightarrow}$ 관계성과에 대한 인과적 구성모텔에 대해 구조방정식 모델분석으로 검증하였다. 구성모텔에 대한 분석결과 서비스 편의성을 구성하는 요소 중 접근편의성을 제외한 나머지 결정편의성, 거래편의성, 편익편의성, 사후편익편의성은 모두 관계적 요인들에 긍정적인 영향을 미쳤으며, 그 중 편익편의성이 관계적 요인에 가장 큰 영향을 주는 것으로 나타났다. 또한 추가적으로 매개효과검증을 실시하여, 서비스 편의성과 관계성과의 관계를 살펴보는데 있어서, 서비스 편의성이 관계만족과 관계몰입을 통해서 관계성과에 긍정적인 영향을 주는 구조적 인 관계를 가지고 있음을 알 수 있었다. 이는 높은 서비스 편의성에 대한 관리와 투자가 구매자로 하여금 관계에 만족하게 만들고 이렇게 형성된 관계만족은 관계에 몰입하게 하여 결과적으로는 관계성과를 가져올 수 있음을 시사한다.

  • PDF

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.

폭소노미 사이트를 위한 랭킹 프레임워크 설계: 시맨틱 그래프기반 접근 (A Folksonomy Ranking Framework: A Semantic Graph-based Approach)

  • 박현정;노상규
    • Asia pacific journal of information systems
    • /
    • 제21권2호
    • /
    • pp.89-116
    • /
    • 2011
  • In collaborative tagging systems such as Delicious.com and Flickr.com, users assign keywords or tags to their uploaded resources, such as bookmarks and pictures, for their future use or sharing purposes. The collection of resources and tags generated by a user is called a personomy, and the collection of all personomies constitutes the folksonomy. The most significant need of the folksonomy users Is to efficiently find useful resources or experts on specific topics. An excellent ranking algorithm would assign higher ranking to more useful resources or experts. What resources are considered useful In a folksonomic system? Does a standard superior to frequency or freshness exist? The resource recommended by more users with mere expertise should be worthy of attention. This ranking paradigm can be implemented through a graph-based ranking algorithm. Two well-known representatives of such a paradigm are Page Rank by Google and HITS(Hypertext Induced Topic Selection) by Kleinberg. Both Page Rank and HITS assign a higher evaluation score to pages linked to more higher-scored pages. HITS differs from PageRank in that it utilizes two kinds of scores: authority and hub scores. The ranking objects of these pages are limited to Web pages, whereas the ranking objects of a folksonomic system are somewhat heterogeneous(i.e., users, resources, and tags). Therefore, uniform application of the voting notion of PageRank and HITS based on the links to a folksonomy would be unreasonable, In a folksonomic system, each link corresponding to a property can have an opposite direction, depending on whether the property is an active or a passive voice. The current research stems from the Idea that a graph-based ranking algorithm could be applied to the folksonomic system using the concept of mutual Interactions between entitles, rather than the voting notion of PageRank or HITS. The concept of mutual interactions, proposed for ranking the Semantic Web resources, enables the calculation of importance scores of various resources unaffected by link directions. The weights of a property representing the mutual interaction between classes are assigned depending on the relative significance of the property to the resource importance of each class. This class-oriented approach is based on the fact that, in the Semantic Web, there are many heterogeneous classes; thus, applying a different appraisal standard for each class is more reasonable. This is similar to the evaluation method of humans, where different items are assigned specific weights, which are then summed up to determine the weighted average. We can check for missing properties more easily with this approach than with other predicate-oriented approaches. A user of a tagging system usually assigns more than one tags to the same resource, and there can be more than one tags with the same subjectivity and objectivity. In the case that many users assign similar tags to the same resource, grading the users differently depending on the assignment order becomes necessary. This idea comes from the studies in psychology wherein expertise involves the ability to select the most relevant information for achieving a goal. An expert should be someone who not only has a large collection of documents annotated with a particular tag, but also tends to add documents of high quality to his/her collections. Such documents are identified by the number, as well as the expertise, of users who have the same documents in their collections. In other words, there is a relationship of mutual reinforcement between the expertise of a user and the quality of a document. In addition, there is a need to rank entities related more closely to a certain entity. Considering the property of social media that ensures the popularity of a topic is temporary, recent data should have more weight than old data. We propose a comprehensive folksonomy ranking framework in which all these considerations are dealt with and that can be easily customized to each folksonomy site for ranking purposes. To examine the validity of our ranking algorithm and show the mechanism of adjusting property, time, and expertise weights, we first use a dataset designed for analyzing the effect of each ranking factor independently. We then show the ranking results of a real folksonomy site, with the ranking factors combined. Because the ground truth of a given dataset is not known when it comes to ranking, we inject simulated data whose ranking results can be predicted into the real dataset and compare the ranking results of our algorithm with that of a previous HITS-based algorithm. Our semantic ranking algorithm based on the concept of mutual interaction seems to be preferable to the HITS-based algorithm as a flexible folksonomy ranking framework. Some concrete points of difference are as follows. First, with the time concept applied to the property weights, our algorithm shows superior performance in lowering the scores of older data and raising the scores of newer data. Second, applying the time concept to the expertise weights, as well as to the property weights, our algorithm controls the conflicting influence of expertise weights and enhances overall consistency of time-valued ranking. The expertise weights of the previous study can act as an obstacle to the time-valued ranking because the number of followers increases as time goes on. Third, many new properties and classes can be included in our framework. The previous HITS-based algorithm, based on the voting notion, loses ground in the situation where the domain consists of more than two classes, or where other important properties, such as "sent through twitter" or "registered as a friend," are added to the domain. Forth, there is a big difference in the calculation time and memory use between the two kinds of algorithms. While the matrix multiplication of two matrices, has to be executed twice for the previous HITS-based algorithm, this is unnecessary with our algorithm. In our ranking framework, various folksonomy ranking policies can be expressed with the ranking factors combined and our approach can work, even if the folksonomy site is not implemented with Semantic Web languages. Above all, the time weight proposed in this paper will be applicable to various domains, including social media, where time value is considered important.