• 제목/요약/키워드: Big data analytics

검색결과 279건 처리시간 0.022초

사회연결망분석을 활용한 한국 남자축구대표팀 경기성과 분석: 벤투 감독 경기를 중심으로 (Analyzing the Performance of the South Korean Men's National Football Team Using Social Network Analysis: Focusing on the Manager Bento's Matches)

  • 정연식 ;강은경 ;양성병
    • 지식경영연구
    • /
    • 제24권2호
    • /
    • pp.241-262
    • /
    • 2023
  • 스포츠 경기에서 발생하는 현상이나 경기기록을 분석하는 스포츠 경기분석 분야에 첨단기술과 다양한 과학적 분석기법이 적용되고 있으며, 그 중 패스네트워크 분석에 사회연결망분석 방법이 활발히 활용되고 있다. 축구는 선수 간 패스라는 상호작용을 통해 경기가 이루어지는 대표적인 스포츠인 만큼 사회연결망분석을 이용하여 기존에는 측정할 수 없었던 경기에 대한 새로운 정보를 제공하고자 노력하고 있다. 이에, 본 연구에서는 단일 축구팀의 (1) 시간 흐름에 따른 패스네트워크의 변화를 분석하고, (2) 전술의 변화에 영향을 미치는 주요 요인 중 경기의 성격 변화(카타르월드컵 vs. A매치)와 (3) 상대팀 변화(FIFA랭킹 상위팀 vs. FIFA랭킹 하위팀)에 대한 패스네트워크까지 총 세 가지 상황을 비교∙분석하고자 하였다. 보다 구체적으로, 벤투 감독 부임 이후 한국 남자축구국가대표팀의 경기 중 10 경기를 선별하고, 이에 대한 네트워크 지표를 추출하였으며, 축구팀 경기력 평가모델의 네 가지 지표(효율성, 응집력, 취약성, 활동성/리더십)를 추출된 데이터에 적용한 후 세 가지 상황을 각각 분석하였다. 연구결과, 시간 흐름에 따른 경기력 분석에서 응집력이 유의하게 상승하고, 취약성이 유의하게 하락하는 것을 확인할 수 있었고, 경기성격 변화에 따른 비교분석에서는 카타르월드컵 경기가 A매치 경기보다 평가모델의 모든 항목에서 경기력이 우수한 것으로 나타났다. 마지막으로, 상대팀의 변화에 따른 비교분석에서는 FIFA랭킹 하위팀과의 경기가 상위팀과의 경기보다 평가모델의 모든 항목에서 경기력이 우수하게 나타났다. 본 연구의 결과가 축구팀의 감독 선임 및 경기 전략을 수립하는데 주요한 기초자료로 활용되어 축구팀의 경기력 향상에 기여할 수 있기를 기대한다.

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.

웹툰 콘텐츠 추천을 위한 소비자 감성 패턴 맵 개발 (Development of Customer Sentiment Pattern Map for Webtoon Content Recommendation)

  • 이준식;박도형
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.67-88
    • /
    • 2019
  • 웹툰은 인터넷의 특징적 요소들을 활용하여 제작되는 만화 콘텐츠를 온라인 환경에서 소비 가능한 형태로 유통하는 한국형 디지털 만화 플랫폼이다. 최근 웹툰 산업의 급격한 성장과 함께 웹툰 콘텐츠의 공급량이 기하급수적으로 증가함에 따라, 효과적인 웹툰 콘텐츠 추천 방안의 필요성이 커지고 있다. 웹툰은 회화적 요소와 문학적 요소, 디지털 요소의 복합적 산물로서, 독자로 하여금 재미를 느끼게 하고 웹툰이 연출하는 상황에 이입·공감하게 하는 등 소비자의 감성을 자극하는 디지털 콘텐츠 상품이다. 따라서 웹툰이 소비자에게 전달하는 감성이 소비자가 웹툰을 선택함에 있어 중요한 기준으로 작용할 것이라 기대할 수 있다. 본 연구는 기존에 충분히 논의되지 않았던 소비자 감성을 중심으로, 웹툰 콘텐츠의 효과적인 추천을 지원할 수 있는 소비자 감성 패턴맵의 개발을 목적으로 한다. 본 연구의 수행을 위해 '네이버 웹툰' 플랫폼에서 서비스되는 200개 작품에 대한 메타데이터와 소비자 감성어휘 정보를 수집하였다. 분석 목적에 부합하지 않는 작품을 제외한 127개 작품에 대해 488개의 감성어휘가 수집되었다. 이후 수집된 감성어휘들 간 유사감성 통합, 중복감성 배제 과정을 Bottom-up 접근으로 수행하여 총 63개 감성유형으로 축소된 웹툰 특화 감성지표를 구축하였다. 구축한 감성지표에 대한 탐색적 요인분석을 수행하여 웹툰 유형을 분류할 수 있는 3개의 중요 차원을 도출하고, 이를 기준으로 K-Means 클러스터링을 수행하여 전체 웹툰을 4개 유형으로 분류하였다. 각각의 유형에 대해 웹툰-감성 2-Mode 네트워크를 구축하여 웹툰 유형별로 나타나는 감성 패턴의 특징을 살펴보았으며, 프로파일링 분석을 통해 웹툰 유형별 인사이트와 실무적으로 의미 있는 전략적 시사점을 도출할 수 있었다. 본 연구의 결과를 통해 웹툰의 추천 및 분류의 영역에서 소비자 감성의 활용 가능성을 확인하고, 웹툰 생태계 내 구성원들이 소비자를 보다 잘 이해하고 전략을 수립할 수 있도록 돕는 가이드라인을 제시하였다는 점에서 의의가 있다.

사용자 니즈 기반의 챗봇 개발 프로세스: 디자인 사고방법론을 중심으로 (Development Process for User Needs-based Chatbot: Focusing on Design Thinking Methodology)

  • 김무성;서봉군;박도형
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.221-238
    • /
    • 2019
  • 최근, 기업 및 공공기관에서는 고객 상담과 응대 분야에 챗봇(Chatbot)서비스를 적극적으로 도입하고 있다. 챗봇 서비스의 도입은 기업이나 기관에게 있어서 인건비 절감 효과를 가져올 뿐만 아니라 고객과의 빠른 커뮤니케이션 효과를 기대할 수 있다. 데이터 분석 기술의 발전과 인공지능 기술의 고도화는 이런 챗봇 서비스의 성장을 견인하고 있다. 하지만 기술중심으로 개발된 챗봇은 사용자가 내재적으로 원하는 바와 괴리가 있을 수 있으므로, 챗봇이 단순히 기술의 영역이 아닌 사용자 경험의 영역에서 다루어질 필요가 있다. 본 연구는 사용자 경험 분야의 대표적 방법론인 디자인 사고 접근법을 챗봇 개발에 적용하여, 사용자 니즈 기반의 챗봇 개발 프로세스를 제안하고자 한다. 사용자 관찰을 통해 팩트(Fact) 수집을 시작으로, 인사이트(Insight)를 도출하고 기회영역(Opportunity)을 발굴하는 추상화의 과정을 수행한다. 이어서 사용자의 멘탈모델에 맞는 기능을 제공하고 원하는 정보를 구조화하는 구체화의 과정을 통해, 사용자의 니즈에 부합하는 챗봇을 개발할 수 있을 것으로 기대한다. 본 연구에서는 제안한 프로세스의 실효성을 확인하기 위하여 국내 화장품 시장을 대상으로 실제 구축 사례를 함께 제시한다. 본 연구는 챗봇 개발 프로세스에 사용자 경험을 접목한 점에서 이론적 시사점을 가지며, 기업이나 기관이 바로 적용 가능한 현실적인 방법을 제안한다는 면에서 실무적 시사점을 가진다.

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.

합성곱 신경망의 비지니스 응용: 런웨이 이미지를 사용한 의류 분류를 중심으로 (Business Application of Convolutional Neural Networks for Apparel Classification Using Runway Image)

  • 서이안;신경식
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.1-19
    • /
    • 2018
  • 최근 딥러닝은 오디오, 텍스트 및 이미지 데이터와 같은 비 체계적인 데이터를 대상으로 다양한 추정, 분류 및 예측 문제에 사용 및 적용되고 있다. 특히, 의류산업에 적용될 경우 딥러닝 기법을 활용한 의류 인식, 의류 검색, 자동 제품 추천 등의 심층 학습을 기반으로 한 응용이 가능하다. 이 때의 핵심모형은 합성곱 신경망을 사용한 이미지 분류이다. 합성곱 신경망은 입력이 전달되고 출력에 도달하는 과정에서 가중치와 같은 매개 변수를 학습하는 뉴런으로 구성되고, 영상 분류에 가장 적합한 방법론으로 사용된다. 기존의 의류 이미지 분류 작업에서 대부분의 분류 모형은 의류 이미지 자체 또는 전문모델 착용 의류와 같이 통제된 상황에서 촬영되는 온라인 제품 이미지를 사용하여 학습을 수행한다. 하지만 본 연구에서는 통제되지 않은 상황에서 촬영되고 사람들의 움직임과 다양한 포즈가 포함된 스트릿 패션 이미지 또는 런웨이 이미지를 분류하려는 상황을 고려하여 분류 모형을 훈련시키는 효과적인 방법을 제안한다. 이동성을 포착하는 런웨이 의류 이미지로 모형을 학습시킴으로써 분류 모형의 다양한 쿼리 이미지에 대한 적응력을 높일 수 있다. 모형 학습 시 먼저 ImageNet 데이터셋을 사용하여 pre-training 과정을 거치고 본 연구를 위해 수집된 32 개 주요 패션 브랜드의 2426개 런웨이 이미지로 구성된 데이터셋을 사용하여 fine-tuning을 수행한다. 학습 과정의 일반화를 고려해 10번의 실험을 수행하고 제안된 모형은 최종 테스트에서 67.2 %의 정확도를 기록했다. 본 연구 모형은 쿼리 이미지가 런웨이 이미지, 제품 이미지 또는 스트릿 패션 이미지가 될 수 있는 다양한 분류 환경에 적용될 수 있다. 구체적으로는 패션 위크에서 모바일 어플리케이션 서비스를 통해 브랜드 검색을 용이하게 하는 서비스를 제공하거나, 패션 잡지사의 편집 작업에 사용되어 브랜드나 스타일을 분류하고 라벨을 붙일 수 있으며, 온라인 쇼핑몰에서 아이템 정보를 제공하거나 유사한 아이템을 추천하는 등의 다양한 목적에 적용될 수 있다.

뉴스기사를 이용한 소비자의 경기심리지수 생성 (Construction of Consumer Confidence index based on Sentiment analysis using News articles)

  • 송민채;신경식
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.1-27
    • /
    • 2017
  • 경제주체들의 경기상황에 대한 판단 및 전망은 경기변동에 영향을 미치므로 경기심리지수와 거시경제지표들 간에는 밀접한 관련성을 나타내는 것으로 알려져 있다. 경기선행지표로 국내에서 많이 사용되는 경기심리지수에는 소비자동향조사, 기업경기조사, 경제심리지수가 있다. 그러나 설문조사를 통해 생성된 지수는 자료의 성격상 속보성이 떨어지는 문제가 있다. 본 연구에서는 이러한 정형데이터의 한계를 보완할 수 있도록 비정형데이터에서 정보를 추출해 경기심리지수를 생성하고, 경제분석에서의 활용 가능성을 검토하였다. 민간소비와 관련된 실물지표에는 소매판매업지수와 서비스업생산지수를 사용하였고, 고용지표에는 고용률과 실업률을, 가격지표에는 소비자물가상승률과 가계의 대출금리를 사용하여 지표들 간의 추이 분석 및 시차구조 파악을 위한 교차상관분석을 수행하였다. 마지막으로 이들 지표들에 대한 예측 가능성을 점검하였다. 분석결과, 다른 지표들의 선행지수로 많이 사용되는 소비자심리지수와 비교해 선택 지표들과 높은 상관관계를 보이며, 1~2개월 선행한 것으로 나타났다. 예측력 또한 향상되어 텍스트데이터에서 생성한 소비자 경기심리지수의 유용성이 확인되었다. 온라인에서 생성되는 뉴스기사나 소셜 SNS 등의 텍스트 데이터는 속보성이 뛰어나고, 커버리지가 넓어 특정 경제적 이슈가 발생할 경우 이것이 경제에 미치는 영향을 빠르게 파악할 수 있다는 점에서 경기판단지표로써의 잠재적 가능성이 클 것으로 보인다. 경제분석에서 비정형데이터를 활용한 국내연구는 초기 단계지만 데이터의 유용성이 확인되면 그 활용도가 크게 높아질 것으로 기대한다.

웹/모바일-어플리케이션 접속 지표와 TCS 교통량의 상관관계 연구 (Exploring the Temporal Relationship Between Traffic Information Web/Mobile Application Access and Actual Traffic Volume on Expressways)

  • 류인곤;이재영;최기주;김정화;안순욱
    • 대한교통학회지
    • /
    • 제34권1호
    • /
    • pp.1-14
    • /
    • 2016
  • 최근 스마트폰의 빠른 보급으로 누구나 언제 어디서든 자유로운 네트워크 접속이 가능해졌다. 이는 통행 전은 물론 통행 중 교통정보 검색이 매우 편리해졌음을 의미한다. 고속도로 교통정보 탐색 행태의 기반이 되는 상관성 분석을 위하여, 웹과 모바일-앱의 접속 지표에 대한 정상성 여부를 검증하고, TCS 교통량과의 상관관계를 실증적으로 분석하는 것이 본 연구의 목적이다. 그 결과 첫째, 시간대별 웹/모바일-앱의 접속 지표에 대한 ADF-검정, PP-검정 결과, 로그변환이나 차분변환 없이도 시계열의 정상성 조건을 만족하는 것으로 나타났다. 둘째, 고속도로 진출입 교통량과의 피어슨 상관계수를 검토한 결과, 웹/모바일-앱의 모든 접속 지표는 뚜렷한 양적 상관관계를 보였다. 단, 트럭의 TCS 진입 교통량은 상관관계가 거의 없는 것으로 나타났다. 셋째, 시계열 변수 사이에 존재하는 발생시간의 시차 관계(동행성, 선행성, 후행성)를 규명하기 위해 교차분석을 수행한 결과, 모바일 이용자는 모든 웹 접속 지표보다 선행하고 있었으며, 모바일 실행횟수는 모든 웹 접속 지표와 동행함을 발견하였다. 넷째, 고속도로의 진입 교통량에 선행하는 웹/모바일-앱 접속 지표는 존재하지 않았으며, 웹 페이지뷰/방문자/신규방문자/재방문자, 모바일 실행횟수는 오히려 고속도로 진입 총 교통량과 비교시 1시간의 후행 시차에서 상관관계가 가장 높게 나타났다. 향후 분석의 공간적 범위와 시간적 범위를 세분화하고 교통정보 이용자의 위치정보를 활용할 수 있다면, 경로 전환 시점/비율과 같은 개별 통행행태까지도 예측할 수 있게 될 것으로 판단된다.

양자 간 대화 상황에서의 화자인식을 위한 문장 시퀀싱 방법을 통한 자동 말투 인식 (Automatic Speech Style Recognition Through Sentence Sequencing for Speaker Recognition in Bilateral Dialogue Situations)

  • 강가람;권오병
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.17-32
    • /
    • 2021
  • 화자인식은 자동 음성시스템에서 중요한 기능을 담당하며, 최근 휴대용 기기의 발전 및 음성 기술, 오디오 콘텐츠 분야 등이 계속해서 확장됨에 따라 화자인식 기술의 중요성은 더구나 부각 되고 있다. 이전의 화자인식 연구는 음성 파일을 기반으로 화자가 누구인지 자동으로 판정 및 정확도 향상을 위한 목표를 가지고 진행되었다. 한편 말투는 중요한 사회언어학적 소재로 사용자의 사회적 환경과 밀접하게 관련되어 있다. 추가로 화자의 말투에 사용되는 종결어미는 문장의 유형을 결정하거나 화자의 의도, 심리적 태도 또는 청자에 대한 관계 등의 기능과 정보를 가지고 있다. 이처럼 종결어미의 활용형태는 화자의 특성에 따라 다양한 개연성이 있어 특정 미확인 화자의 종결어미의 종류와 분포는 해당 화자를 인식하는 것에 도움이 될 것으로 보인다. 기존 텍스트 기반의 화자인식에서 말투를 고려한 연구가 적었으며 음성 신호를 기반으로 한 화자인식 기법에 말투 정보를 추가한다면 화자인식의 정확도를 더욱 높일 수 있을 것이다. 따라서 본 연구의 목적은 한국어 화자인식의 정확도를 개선하기 위해 종결어미로 표현되는 말투(speech style) 정보를 활용한 방법을 제안하는 것이다. 이를 위해 특정인의 발화 내용에서 등장하는 종결어미의 종류와 빈도를 활용하여 벡터값을 생성하는 문장 시퀀싱이라는 방법을 제안한다. 본 연구에서 제안한 방법의 우수성을 평가하기 위해 드라마 대본으로 학습 및 성능평가를 수행하였다. 본 연구에서 제안한 방법은 향후 실존하는 한국어 음성인식 서비스의 성능 향상을 위한 수단으로 사용될 수 있으며 지능형 대화 시스템 및 각종 음성 기반 서비스에 활용될 것을 기대한다.