• 제목/요약/키워드: System of systems

검색결과 59,861건 처리시간 0.093초

이진 분류문제에서의 딥러닝 알고리즘의 활용 가능성 평가 (Feasibility of Deep Learning Algorithms for Binary Classification Problems)

  • 김기태;이보미;김종우
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.95-108
    • /
    • 2017
  • 최근 알파고의 등장으로 딥러닝 기술에 대한 관심이 고조되고 있다. 딥러닝은 향후 미래의 핵심 기술이 되어 일상생활의 많은 부분을 개선할 것이라는 기대를 받고 있지만, 주요한 성과들이 이미지 인식과 자연어처리 등에 국한되어 있고 전통적인 비즈니스 애널리틱스 문제에의 활용은 미비한 실정이다. 실제로 딥러닝 기술은 Convolutional Neural Network(CNN), Recurrent Neural Network(RNN), Deep Boltzmann Machine (DBM) 등 알고리즘들의 선택, Dropout 기법의 활용여부, 활성 함수의 선정 등 다양한 네트워크 설계 이슈들을 가지고 있다. 따라서 비즈니스 문제에서의 딥러닝 알고리즘 활용은 아직 탐구가 필요한 영역으로 남아있으며, 특히 딥러닝을 현실에 적용했을 때 발생할 수 있는 여러 가지 문제들은 미지수이다. 이에 따라 본 연구에서는 다이렉트 마케팅 응답모델, 고객이탈분석, 대출 위험 분석 등의 주요한 분류 문제인 이진분류에 딥러닝을 적용할 수 있을 것인지 그 가능성을 실험을 통해 확인하였다. 실험에는 어느 포르투갈 은행의 텔레마케팅 응답여부에 대한 데이터 집합을 사용하였으며, 전통적인 인공신경망인 Multi-Layer Perceptron, 딥러닝 알고리즘인 CNN과 RNN을 변형한 Long Short-Term Memory, 딥러닝 모형에 많이 활용되는 Dropout 기법 등을 이진 분류 문제에 활용했을 때의 성능을 비교하였다. 실험을 수행한 결과 CNN 알고리즘은 비즈니스 데이터의 이진분류 문제에서도 MLP 모형에 비해 향상된 성능을 보였다. 또한 MLP와 CNN 모두 Dropout을 적용한 모형이 적용하지 않은 모형보다 더 좋은 분류 성능을 보여줌에 따라, Dropout을 적용한 CNN 알고리즘이 이진분류 문제에도 활용될 수 있는 가능성을 확인하였다.

ICT 기반 다중 가치사슬의 동적 플랫폼에서의 공존 모형: 의료서비스를 중심으로 (A Coexistence Model in a Dynamic Platform with ICT-based Multi-Value Chains: focusing on Healthcare Service)

  • 이현정;장용식
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.69-93
    • /
    • 2017
  • ICT는 제조기반 산업사회에서 가치사슬의 효율성/효과성의 지원을 목적으로 도입되었으나 정보기반 산업사회에서는 ICT가 시장 가치 창출의 주체가 되어 다중 가치사슬의 형성 가능성을 기대하게 하였다. 즉, ICT의 발전은 공급 및 수요의 다변화와 다양성의 동인이 되면서 가치를 창출하기 시작했고, 이를 중심으로 하는 신 가치 사슬의 등장은 구 가치사슬과의 충돌의 문제를 야기하였다. 즉, 다중 가치사슬이 존재 가능한 플랫폼에서는 가치사슬 간의 충돌, 중첩, 생성, 상실 등의 동적 상황 등에 따른 신/구 가치의 창출과 소멸 등이 발생하게 된다. 예를 들어, ICT에 기반을 둔 우버택시 서비스는 신 가치사슬을 형성하여 택시서비스 시장에서 신/구 가치사슬간의 충돌을 야기했다. 제조기반 산업사회에서는 단일 가치사슬의 시장 선점이 중요하였으나, ICT 기반 융합 제품/서비스/정보가 유통되는 플랫폼에서는 시장 상황 변수의 동적 변화에 따라 다중의 가치사슬이 존재하면서 서로 충돌과 공존을 야기하게 되었다. 따라서 ICT에 기반을 둔 지능형 정보사회의 발전과 함께 시장가치 최대화를 위해 다중 가치사슬 간 충돌 최소화와 공존의 최대 가능성을 높일 수 있는 모형의 제시가 중요하다. 본 연구에서는 먼저 의료서비스 시장을 중심으로 하는 다중 가치사슬의 동적 플랫폼 형성에 대해 논의한다. 즉, 의료서비스 시장에 ICT 기반 원격 및 지능형 의료서비스 등이 구 시장에 진입함으로써 발생하는 가치사슬 간의 충돌을 최소화하고 공존 가능성을 높이기 위한 공존 요인 변수에 대해 논의 한다. 이를 위해 다중의 공급과 소비 및 서비스가 존재 가능한 다중 가치사슬이 충돌 및 중첩하는 과정에서 공존 요인 변수 등에 기반하여 가치 사슬들을 동적으로 생성/변화/소멸 및 공존하기까지 의료서비스 플랫폼에 대해 논의한다. 또한 플랫폼 내의 각 가치사슬의 생산가치의 증가와 가치사슬 간의 상호 작용에 의한 부가가치의 창출 등에 의해 플랫폼의 총 가치가 증가 될 수 있음을 논의한다. 마지막으로 공존 모형을 제안하고 실험을 통해 가치사슬 간의 공존 가능성을 제시한다.

IT교육 서비스품질이 교육만족도, 현업적용의도 및 추천의도에 미치는 영향에 관한 연구: 학습자 직위 및 참여동기의 조절효과를 중심으로 (A Study on the Influence of IT Education Service Quality on Educational Satisfaction, Work Application Intention, and Recommendation Intention: Focusing on the Moderating Effects of Learner Position and Participation Motivation)

  • 강려은;양성병
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.169-196
    • /
    • 2017
  • 제4차 산업혁명의 도래로 IT(information technology)를 활용한 다양한 융합기술에 대한 관심이 높아지고 있으며, 이에 따른 고품질의 IT관련 교육서비스 제공의 필요성 및 중요성 또한 점차 증대되고 있다. 한편, 일반적인 교육서비스 품질 및 만족도에 관한 연구는 그 동안 다양한 맥락에서 활발히 진행된 바 있으나, IT교육 참가자를 대상으로 한 IT교육 서비스품질의 역할을 살펴본 연구는 상대적으로 부족한 것으로 파악된다. 이에 본 연구에서는 SERVPERF 모형 및 관련 선행연구를 바탕으로 IT교육 맥락에서 IT교육 서비스품질의 다섯 가지 차원(유형성, 신뢰성, 반응성, 확신성 및 공감성)을 도출하고, 이러한 세부 IT교육 서비스품질 요인이 학습자의 교육만족도, 나아가 현업적용의도 및 추천의도에 미치는 영향을 검증하였다. 또한, 이러한 영향이 학습자 직위(실무자 집단/관리자 집단) 및 참여동기(자발적 참여집단/비자발적 참여집단)에 따라 어떻게 달라지는지에 대한 추가분석도 실시하였다. 서울 소재 'M'교육기관 203명의 IT교육 참가자 대상 설문을 활용한 구조방정식모형 분석 결과, IT교육 서비스품질의 다섯 가지 차원 가운데 유형성, 신뢰성 및 확신성이 교육만족도에 유의한 영향을 주는 것으로 나타났으며, 이러한 교육만족도는 현업적용의도와 추천의도에도 유의한 영향을 주는 것으로 조사되었다. 또한, IT교육 서비스품질이 교육만족도에 미치는 영향 관계에서 학습자 직위 및 참여동기가 유의한 조절효과를 가진다는 사실을 확인하였다. 본 연구는 SERVPERF 모형을 활용하여 IT교육 맥락에서 IT교육 서비스품질의 영향력을 실증한 최초의 연구라는 점에서 학술적 의의가 있다. 본 연구결과가 IT교육 서비스 제공기관의 교육만족도 제고 및 효율적인 서비스 운영을 위한 실질적인 지침을 제공해 줄 수 있을 것으로 기대한다.

사용자 리뷰를 통한 소셜커머스와 오픈마켓의 이용경험 비교분석 (A Comparative Analysis of Social Commerce and Open Market Using User Reviews in Korean Mobile Commerce)

  • 채승훈;임재익;강주영
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.53-77
    • /
    • 2015
  • 국내 모바일 커머스 시장은 현재 소셜커머스가 이용자 수 측면에서 오픈마켓을 압도하고 있는 상황이다. 산업계에서는 모바일 시장에서 소셜커머스의 성장에 대해 빠른 모바일 시장진입, 큐레이션 모델 등을 주요 성공요인으로 제시하고 있지만, 이에 대한 학계의 실증적인 연구 및 분석은 아직 미미한 상황이다. 본 연구에서는 사용자 리뷰를 바탕으로 모바일 소셜커머스와 오픈마켓의 사용자 이용경험을 비교 분석하는 탐험적인 연구를 수행하였다. 먼저 본 연구는 구글 플레이에 등록된 국내 소셜커머스 주요 3개 업체와 오픈마켓 주요 3개 업체의 모바일 앱 리뷰를 수집하였다. 본 연구는 LDA 토픽모델링을 통해 1만여건에 달하는 모바일 소셜커머스와 오픈마켓 사용자 리뷰를 지각된 유용성과 지각된 편리성 토픽으로 분류한 뒤 감정분석과 동시출현단어분석을 수행하였다. 이를 통해 본 연구는 국내 모바일 커머스 상에서 오픈마켓 이용자들에 비해 소셜커머스 이용자들이 서비스와 이용편리성 측면에서 더 긍정적인 경험을 하고 있음을 증명하였다. 소셜커머스는 '배송', '쿠폰', '할인'을 중심으로 서비스 측면에서 이용자들에게 긍정적인 이용경험을 이끌어내고 있는 반면, 오픈마켓의 경우 '로그인 안됨', '상세보기 불편', '멈춤'과 같은 기술적 문제 및 불편으로 인한 이용자 불만이 높았다. 이와 같이 본 연구는 사용자 리뷰를 통해 서비스 이용경험을 효과적으로 비교 분석할 수 있는 탐험적인 실증연구법을 제시하였다. 구체적으로 본 연구는 LDA 토픽모델링과 기술수용모형을 통해 사용자 리뷰를 서비스와 기술 토픽으로 분류하여 효과적으로 분석할 수 있는 새로운 방법을 제시하였다는 점에서 의의가 있다. 또한 본 연구의 결과는 향후 소셜커머스와 오픈마켓의 경쟁 및 벤치마킹 전략에 중요하게 활용될 수 있을 것으로 기대된다.

텍스트 마이닝 기법을 적용한 뉴스 데이터에서의 사건 네트워크 구축 (Construction of Event Networks from Large News Data Using Text Mining Techniques)

  • 이민철;김혜진
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 전통적으로 신문 매체는 국내외에서 발생하는 사건들을 살피는 데에 가장 적합한 매체이다. 최근에는 정보통신 기술의 발달로 온라인 뉴스 매체가 다양하게 등장하면서 주변에서 일어나는 사건들에 대한 보도가 크게 증가하였고, 이것은 독자들에게 많은 양의 정보를 보다 빠르고 편리하게 접할 기회를 제공함과 동시에 감당할 수 없는 많은 양의 정보소비라는 문제점도 제공하고 있다. 본 연구에서는 방대한 양의 뉴스기사로부터 데이터를 추출하여 주요 사건을 감지하고, 사건들 간의 관련성을 판단하여 사건 네트워크를 구축함으로써 독자들에게 현시적이고 요약적인 사건정보를 제공하는 기법을 제안하는 것을 목적으로 한다. 이를 위해 2016년 3월에서 2017년 3월까지의 한국 정치 및 사회 기사를 수집하였고, 전처리과정에서 NPMI와 Word2Vec 기법을 활용하여 고유명사 및 합성명사와 이형동의어 추출의 정확성을 높였다. 그리고 LDA 토픽 모델링을 실시하여 날짜별로 주제 분포를 계산하고 주제 분포의 최고점을 찾아 사건을 탐지하는 데 사용하였다. 또한 사건 네트워크를 구축하기 위해 탐지된 사건들 간의 관련성을 측정을 위하여 두 사건이 같은 뉴스 기사에 동시에 등장할수록 서로 더 연관이 있을 것이라는 가정을 바탕으로 코사인 유사도를 확장하여 관련성 점수를 계산하는데 사용하였다. 최종적으로 각 사건은 각의 정점으로, 그리고 사건 간의 관련성 점수는 정점들을 잇는 간선으로 설정하여 사건 네트워크를 구축하였다. 본 연구에서 제시한 사건 네트워크는 1년간 한국에서 발생했던 정치 및 사회 분야의 주요 사건들이 시간 순으로 정렬되었고, 이와 동시에 특정 사건이 어떤 사건과 관련이 있는지 파악하는데 도움을 주었다. 또한 일련의 사건들의 시발점이 되는 사건이 무엇이었는가도 확인이 가능하였다. 본 연구는 텍스트 전처리 과정에서 다양한 텍스트 마이닝 기법과 새로이 주목받고 있는 Word2vec 기법을 적용하여 봄으로써 기존의 한글 텍스트 분석에서 어려움을 겪고 있었던 고유명사 및 합성명사 추출과 이형동의어의 정확도를 높였다는 것에서 학문적 의의를 찾을 수 있다. 그리고, LDA 토픽 모델링을 활용하기에 방대한 양의 데이터를 쉽게 분석 가능하다는 것과 기존의 사건 탐지에서는 파악하기 어려웠던 사건 간 관련성을 주제 동시출현을 통해 파악할 수 있다는 점에서 기존의 사건 탐지 방법과 차별화된다.

루이보스 추출물의 항산화 활성, 성분 분석 및 엘라스테이즈 저해 효과 (Antioxidative Activity, Component Analysis, and Anti-elastase Effect of Aspalathus linearis Extract)

  • 박수남;양희정;원보령;임영진;윤선경;지동환;최지연;한승주;이충우
    • 대한화장품학회지
    • /
    • 제33권4호
    • /
    • pp.251-262
    • /
    • 2007
  • 본 연구에서는 루이보스 추출물의 항산화, 성분 분석 및 elastase 저해 효과에 관한 조사를 수행하였다. 추출물의 free radical (1,1-diphenyl-2-picrylhydrazyl, DPPH) 소거활성($FSC_{50}$)은 50 % ethanol 추출물($11.50\;{\mu}g/mL$) < 당을 제거시킨 플라보노이드 aglycone 분획(8.47) < ethylacetate 분획(4.76) 순으로 증가하였다. Luminol-의존성 화학발광법을 이용한 $Fe^{3+}-EDTA/H_2O_2$ 계에서 생성된 활성산소종(reactive oxygen species, ROS)에 대한 루이보스 추출물의 총항산화능은 ethylacetate 분획 ($OSC_{50},\;4.58\;{\mu}g/mL$) < aglycone 분획(2.20) < 50% ethanol 추출물(1.09)순으로, 50 % ethanol 추출물에서 가장 큰 활성을 나타내었다. 루이보스 추출물에 대하여 rose-bengal로 증감된 사람 적혈구의 광용혈에 대한 억제 효과를 측정하였다. 루이보스 추출물의 경우 농도 의존적($1\;{\sim}\;100\;{\mu}g/mL$)으로 광용혈을 억제하였다. 특히 50 % ethanol 추출물은 $50\;{\mu}g/mL$ 농도에서 ${\tau}_{50}$이 273.00 min으로 매우 큰 세포보호 효과를 나타내었다. 루이보스 추출물 중 ethylacetate 분획의 당 제거 반응 후 얻어진 aglycone 분획은 TLC에서 3개의 띠로 분리되었으며, HPLC 실험(360 nm)에서 3개의 피이크로 분리되었다. 분리된 3가지 성분은 luteolin, quercetin 및 kaempferol이었으며, 그들의 성분비는 각각 18.24 %, 58.79 %, 22.97 %로 quercetin의 함량이 가장 큰 것으로 나타났다. 루이보스 추출물의 ethylacetate 분획의 TLC 크로마토그램은 7개의 띠로 분리되었고, HPLE 크로마토그램은 9개의 피이크를 보여주었다. TLC와 HPLC의 띠와 피이크를 확인한 결과, HPLC의 9개의 피이크는 용리순서로 peak 1 (조성비 14.71 %)은 isoorientin, peak 2 (28.84 %)는 orientin peak 3 (5.63 %)은 vitexin, peak 4 (12.73 %)는 rutin과 isovitexin, peak 5 (9.24 %)는 hyperoside, peak 6 (5.40%)은 isoquercitrin, peak 7 (1.48 %)은 luteolin, peak 8 (17.61 %)은 quercetin 및 peak 9 (4.59 %)는 kaempferol로 확인되었다. Aglycone 분획은 elastase 저해활성($IC_{50}$)이 $9.08\;{\mu}g/mL$로 매우 큰 활성을 나타내었다. 이상의 결과들은 루이보스 추출물이 $^1O_2$ 혹은 다른 ROS를 소광시키거나 소거함으로써 그리고 ROS에 대항하여 세포막을 보호함으로써 생체계, 특히 태양 자외선에 노출된 피부에서 항산화제로서 작용할 수 있음을 가리키며, 루이보스 성분에 대한 분석과 ethylacetate 분획의 당 제거 실험 후 얻어진 aglycone 분획의 큰 elastase 저해활성으로부터 주름개선 기능성 화장품원료로서 응용 가능성이 있음을 시사한다.

K-Means Clustering 알고리즘과 헤도닉 모형을 활용한 서울시 연립·다세대 군집분류 방법에 관한 연구 (A Study on the Clustering Method of Row and Multiplex Housing in Seoul Using K-Means Clustering Algorithm and Hedonic Model)

  • 권순재;김성현;탁온식;정현희
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.95-118
    • /
    • 2017
  • 최근 도심을 중심으로 연립 다세대의 거래가 활성화되고 직방, 다방등과 같은 플랫폼 서비스가 성장하고 있다. 연립 다세대는 수요 변화에 따른 시장 규모 확대와 함께 정보 비대칭으로 인해 사회적 문제가 발생 되는 등 부동산 정보의 사각지대이다. 또한, 서울특별시 또는 한국감정원에서 사용하는 5개 또는 25개의 권역 구분은 행정구역 내부를 중심으로 설정되었으며, 기존의 부동산 연구에서 사용되어 왔다. 이는 도시계획에 의한 권역구분이기 때문에 부동산 연구를 위한 권역 구분이 아니다. 이에 본 연구에서는 기존 연구를 토대로 향후 주택가 격추정에 있어 서울특별시의 공간구조를 재설정할 필요가 있다고 보았다. 이에 본 연구에서는 연립 다세대 실거래가 데이터를 기초로 하여 헤도닉 모형에 적용하였으며, 이를 K-Means Clustering 알고리즘을 사용해 서울특별시의 공간구조를 다시 군집하였다. 본 연구에서는 2014년 1월부터 2016년 12월까지 3년간 국토교통부의 서울시 연립 다세대 실거래가 데이터와 2016년 공시지가를 활용하였다. 실거래가 데이터에서 본 연구에서는 지하거래 제거, 면적당 가격 표준화 및 5이상 -5이하의 실거래 사례 제거와 같이 데이터 제거를 통한 데이터 전처리 작업을 수행하였다. 데이터전처리 후 고정된 초기값 설정으로 결정된 중심점이 매번 같은 결과로 나오게 K-means Clustering을 수행한 후 군집 별로 헤도닉 모형을 활용한 회귀분석을 하였으며, 코사인 유사도를 계산하여 유사성 분석을 진행하였다. 이에 본 연구의 결과는 모형 적합도가 평균 75% 이상으로, 헤도닉 모형에 사용된 변수는 유의미하였다. 즉, 기존 서울을 행정구역 25개 또는 5개의 권역으로 나뉘어 실거래가지수 등 부동산 가격 관련 통계지표를 작성하던 방식을 속성의 영향력이 유사한 영역을 묶어 16개의 구역으로 나누었다. 따라서 본 연구에서는 K-Means Clustering 알고리즘에 실거래가 데이터로 헤도닉 모형을 활용하여 연립 다세대 실거래가를 기반으로 한 군집분류방법을 도출하였다. 또한, 학문적 실무적 시사점을 제시하였고, 본 연구의 한계점과 향후 연구 방향에 대해 제시하였다.

키워드 네트워크 분석을 통해 살펴본 기술경영의 최근 연구동향 (A Study on Recent Research Trend in Management of Technology Using Keywords Network Analysis)

  • 고재창;조근태;조윤호
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.101-123
    • /
    • 2013
  • 최근 경제 패러다임의 변화로 인해 기업이 글로벌 경쟁우위 및 미래 성장동력 확보하기 위해서는 기술과 경영을 통합적으로 이해할 수 있는 학제적 지식을 바탕으로 기술연구의 동향을 파악하고 융합기술 및 유망기술 예측하여 지속적 혁신, 핵심역량 강화, 핵심기술 보유, 기술 융합 등을 통해 새로운 가치를 창출할 필요가 있다. 따라서 본 연구는 기술경영관련 연구의 거시적인 흐름을 분석하기 위해 동시단어 분석기반의 계량서지학적 방법론을 사용하였다. 즉, 최근 10년 동안 기술경영분야의 주요 해외 저널에 게재된 논문의 키워드를 수집한 다음, 빈도 분석, 초기 키워드 네트워크의 구조 분석, 시간이 지남에 따른 새로 생성된 키워드의 선호적 연결 및 성장 분석, 전체 네트워크에 대한 컴포넌트 분석 및 중심성 분석을 수행하였다. 이를 통해 기술경영분야의 논문에 대한 구체적인 연구 주제를 파악할 수 있고, 이들 간의 관계를 파악함으로써, 학제적 연구와 통섭을 위한 구체적인 연구주제들의 조합을 제시할 수 있다. 본 연구결과를 살펴보면 다음과 같다. 첫째, 논문 별 키워드는 1개~23개의 분포를 지니고 있으며, 평균적으로 논문 당 4.574개의 키워드가 있다. 또한 키워드 중 90%가 10년 동안 3번 이하로 사용되었다. 특히 1번만 사용된 키워드는 약 75%의 비중을 차지하고 있음을 확인하였다. 둘째, 키워드 네트워크는 좁은 세상 네트워크 및 척도 없는 네트워크의 특징을 따르고 있음을 확인하였다. 특히 기술경영관련 논문에 사용된 키워드 중 소수의 키워드의 독점화 경향이 높음을 확인할 수 있었다. 셋째, 선호적 연결 및 성장 분석을 통해 기술경영분야의 키워드는 시간이 지남에 따라 선호적 연결을 통한 생존과 소멸 과정에 의해 부익부 빈익빈 현상이 고착되고 있고 있음을 확인하였다. 또한 신규 키워드의 선호적 연결 정도 분석을 통해 신규 연구분야 또는 새로운 연구영역을 창출할 가능성이 있는 키워드 관련 연구 주제에 대한 관심이 시간이 지남에 따라 증가하다가 일정 시점이 지나면 감소함을 확인하였다. 넷째, 컴포넌트 분석 및 중심성 분석을 통해 기술경영관련 연구 동향을 확인하였다. 특히 중심성 분석을 통해 Innovation(혁신), R&D(연구개발), Patent(특허), Forecast(예측), Technology transfer(기술이전), Technology(기술), SME(중소기업) 등의 키워드가 연결중심성, 매개중심성, 근접중심성이 높음을 확인하였다. 본 연구의 분석결과는 기술경영의 연구 동향, 타 학문과의 통섭 및 신규 연구주제 선정 시 참고할 수 있는 유용한 정보로 활용될 수 있다.

마켓 인사이트를 위한 상품 리뷰의 다차원 분석 방안 (Multi-Dimensional Analysis Method of Product Reviews for Market Insight)

  • 박정현;이서호;임규진;여운영;김종우
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.57-78
    • /
    • 2020
  • 인터넷의 발달로, 소비자들은 이커머스에서 손쉽게 상품 정보를 확인한다. 이때 활용되는 상품 리뷰는 사용자 경험을 토대로 작성되어 구매의사결정의 효율성을 높일 뿐만 아니라 상품 개발에 도움을 주기도 한다. 하지만, 방대한 양의 상품 리뷰에서 관심있는 평가차원의 세부내용을 파악하는 데에는 많은 시간과 노력이 소비된다. 예를 들어, 노트북을 구매하려는 소비자들은 성능, 무게, 디자인과 같은 평가차원에 대해 각 차원별로 비교 상품의 평가를 확인하고자 한다. 따라서 본 논문에서는 상품 리뷰에서 다차원 상품평가 점수를 자동적으로 생성하는 방안을 제안하고자 한다. 본 연구에서 제시하는 방안은 크게 2단계로 구성된다. 사전준비 단계와 개별상품평가 단계로, 대분류 상품군 리뷰를 토대로 사전에 생성된 차원분류모델과 감성분석모델이 개별상품의 리뷰를 분석하게 된다. 차원분류모델은 워드임베딩과 연관분석을 결합함으로써 기존 연구에서 차원과 단어들의 관련성을 찾기 위한 워드임베딩 방식이 문장 내 단어의 위치만을 본다는 한계를 보완한다. 감성분석모델은 정확한 극성 판단을 위해 구(phrase) 단위로 긍부정이 태깅된 학습데이터를 구성하여 CNN 모델을 생성한다. 이를 통해, 개별상품평가 단계에서는 구 단위의 리뷰에 준비된 모델들을 적용하고 평가차원별로 종합함으로써 다차원 평가점수를 얻을 수 있다. 본 논문의 실험에서는 대분류 상품군 리뷰 약 260,000건으로 평가모델을 구성하고, S사와 L사의 노트북 리뷰 각 1,011건과 1,062건을 실험데이터로 활용한다. 차원분류모델은 구로 분해한 개별상품 리뷰를 6개 평가차원으로 분류했고, 기존 워드임베딩 방식보다 연관분석을 결합한 모델의 정확도가 13.7% 증가했음을 볼 수 있었다. 감성분석모델은 문장보다 구 단위로 학습한 모델이 평가차원을 면밀히 분석함으로써 29.4% 더 높은 정확도를 보임을 확인했다. 본 연구를 통해 판매자, 소비자 모두가 상품의 다차원적 비교가 가능하다는 점에서 구매 및 상품 개발에 효율적인 의사결정을 기대할 수 있다.

메타데이터 상호운용성을 위한 기록관리 메타데이터 표준 분석 5W1H와 태스크 모델의 관점에서 (Analysis of Metadata Standards of Record Management for Metadata Interoperability From the viewpoint of the Task model and 5W1H)

  • 백재은;스기모토 시게오
    • 기록학연구
    • /
    • 제32호
    • /
    • pp.127-176
    • /
    • 2012
  • 메타데이터 표준규격(이하 메타데이터 표준으로 기재)은 디지털 자원(Digital resource)의 장기보존 및 디지털 아카이브를 위해 필요한 기본 요소 중 하나로, 이는 현대 정보사회에서 중요한 요소로 잘 알려져 있다. 자원(Resource)의 기록관리와 아카이브, 장기보존을 위한 메타데이터 표준은 다양하며, AGRkMS, EAD, ISAD(G), OAIS, PREMIS5) 등이 이용되고 있다. 우리는 아카이브 시스템의 메타데이터 표준을 디자인하기 위해 목적에 따른 메타데이터 표준을 선택하고 맞춤화(Customization)하지 않으면 안 된다. 한편으로, 다른 시스템의 메타데이터 스키마와의 상호운용성(Interoperability)에 대한 고찰도 실시하지 않으면 안 된다. 이전 연구에서, 우리는 기록 생애 주기(Records lifecycle)라는 관점으로부터 메타데이터 표준의 특성에 대해 분석을 실시하였다. 이로 인해, 각 메타데이터 표준 요소가 해당하는 기록 생애 주기의 처음 단계를 확인할 수 있었고, 아카이브 혹은 보존을 위해서는 하나의 메타데이터 표준만으로 기록 생애 주기 전체를 포괄할 수 없다는 것을 보여 주었다. 우리는 이 분석을 통해서 기록 생애 주기의 단계와 메타데이터 표준간의 관계, 기록 생애 주기 전체에서의 메타데이터 특성은 볼 수 있었으나, 보다 상세한 분석을 실시하는 것은 앞으로의 과제로 남겨두었다. 지금까지의 연구에 근거하여, 본 논문은 기록 생애 주기의 관점에서 디지털 아카이브와 보존, 기록관리를 위한 메타데이터 표준의 특징 분석을 위해, 기록 생애 주기 안에서 실행되는 업무의 관점으로부터 메타데이터 스키마를 재 파악하고 분석하였다. 지금까지 메타데이터 스키마는 기술대상이 되는 자원을 중심으로 정의되었기 때문에 기록 생애 주기 전체와 생애 주기 안의 각 단계에서 이용되는 메타데이터 표준간의 매핑을 위한 적절한 방법이 없었다. 이에 본 논문에서는 각기 다른 메타데이터 표준의 기술 요소를, 기록 생애 주기에 포함시키는 업무와 연결시키는 것으로 메타데이터 표준간의 매핑 방법을 제안한다. 본 연구에서는 메타데이터 표준 분석을 위한 프레임워크(Framework)로, 기록 생애 주기를 이용하여 작성한 자원의 업무중심 모델, 즉 태스크 모델(Task Model)을 제안한다. 태스크 모델을 이용함에 있어서 업무를 실행하는 '이벤트(Event)'의 관점을 보다 명확하게 할 수 있다. 한편, 업무를 중심으로 기술 요소간의 매핑을 보다 효율적으로 실시하기 위해서는 요소를 카테고리 화하여 매핑의 대상 범위를 좁히는 것이 중요하다. 이를 위해 우리는 범용성을 가진 5W1H모델(Who, What, Why, When, Where, How)을 이용하여, 기술 요소를 카테고리 화 하는 것을 제안한다. 그리고 태스크 모델과 5W1H 모델을 이용하여 메타데이터 표준 요소에 특징을 부여하고, 요소 간의 매핑을 실시하여 표준 간 관계를 확인하였다. 태스크 모델은 기록 생애 주기 전체에 업무의 관점을 반영한 것으로, 이 모델을 이용함으로써 기록 생애 주기와 그 안의 각 업무에 대한 메타데이터 표준의 사용, 그리고 특징 분석을 위해 실시되는 기술 요소간의 매핑이 가능할 수 있었다. 또한, 5W1H 카테고리를 이용하여 업무와 자원에 관련되는 기술 요소간의 관계를 살펴보는 것으로, 관계가 명확해지는 것과 함께 조사대상을 좁히는 것이 가능하게 되었다. 이 프레임워크의 제안과 이용으로 우리는 특징 분석을 위해 실시되는 매핑 혹은 분류가 단순한 일반적인 매핑이 아닌 의미적인 분류를 할 수 있었다. 본 연구에서는 이 모델들을 이용하여, 메타데이터 표준간의 크로스워크를 정의하였다. 그리고 태스크 모델의 각 단계의 문맥 내에서 메타데이터 기술 요소의 특성을 매핑 예로 확인하고, 이를 바탕으로 하여 프레임워크에 대해 고찰하였다.