• 제목/요약/키워드: 데이터 활용

검색결과 18,183건 처리시간 0.052초

18F-FDOPA Brain PET/CT 검사의 영상 대조도 분석 및 섭취 시간에 따른 SUV변화 고찰 (A Study on analysis of contrasts and variation in SUV with the passage of uptake time in 18F-FDOPA Brain PET/CT)

  • 서강록;이정은;고현수;류재광;남기표
    • 핵의학기술
    • /
    • 제23권1호
    • /
    • pp.69-74
    • /
    • 2019
  • $^{18}F$-FDOPA는 뇌 종양의 아미노산 대사를 추적하는 방사성 의약품이다. 본 연구의 목적은 뇌 종양의 아미노산 대사를 영상화 하여 악성 종양을 진단하는 $^{18}F$-FDOPA와 포도당 대사를 통한 $^{18}F$-FDG의 Brain PET/CT 검사 영상의 대조도 분석을 통해 병변의 검출 능력을 비교하고, $^{18}F$-FDOPA Brain PET/CT 검사에서 섭취 시간에 따른 SUV의 변화를 분석하여 최적의 영상 획득 시간을 알아보기 위함이다. $^{18}F$-FDOPA 와 $^{18}F$-FDG 두 영상에서 종양(Tumor)과 소뇌(Cerebellum)의 중심에 각각 약 $350mm^2$의 관심 영역을 설정하여 $SUV_{max}$를 측정하였고, 종양과 소뇌의 $SUV_{max}$ 비율(T/C ratio)을 산출하였고, $^{18}F$-FDOPA 투여 직후 30분 동안 획득한 리스트 수집 방식 데이터(List mode data)를 활용해 2분씩 15프레임으로 나눈 뒤 각 프레임 별로 종양과 소뇌 중심에 $SUV_{max}$를 측정하여 위와 동일한 방법으로 T/C ratio를 산출하여 분석하였다. 종양의 평균 $SUV_{max}$를 비교해 본 결과, $^{18}F$-FDOPA Brain PET/CT 검사에서 $4.2{\pm}0.8$, $^{18}F$-FDG Brain PET/CT 검사에서는 $5.6{\pm}0.7$ 이었다. 또한, T/C ratio는 $^{18}F$-FDOPA 검사에서 $2.1{\pm}0.7$, $^{18}F$-FDG 검사에서는 $1.1{\pm}0.4$ 이었으며, $^{18}F$-FDOPA의 $SUV_{max}$$^{18}F$-FDG보다 낮지만 T/C ratio는 높게 나타나 종양 구별 능력이 더욱 뛰어난 것을 알 수 있었다(t=-5.214, p=0.000). $^{18}F$-FDOPA의 섭취 시간에 따른 $SUV_{max}$와 T/C ratio를 분석한 결과, $SUV_{max}$와 T/C ratio의 Peak는 모두 6~8분에서 나타났다. 이를 토대로 본원에서 $^{18}F$-FDOPA Brain PET/CT 검사에서 활용하는 10~30분의 영상과 Peak가 나타나기 시작한 6~26분의 영상을 비교한 결과 SUV와 T/C ratio가 각각 0.2, 0.1 증가하였다. 추후 지속적인 연구를 통해 검사 소요시간의 단축 가능성과 추가적인 스캔 정보 활용을 통한 정확한 진단에도 도움이 될 것으로 사료된다.

식품섭취량을 활용한 우리나라 식이 패턴 분석 - 김치류 및 주류 중심으로 (Analysis of Korean Dietary Patterns using Food Intake Data - Focusing on Kimchi and Alcoholic Beverages)

  • 김수환;최장덕;김신희;이준구;권유진;신춘식;신민수;천소영;강길진
    • 한국식품위생안전성학회지
    • /
    • 제34권3호
    • /
    • pp.251-262
    • /
    • 2019
  • 본 연구에서는 식품섭취량 데이터를 활용하여, 한국인의 식습관을 분석하고 관리방향을 제안하였다. 국민건강영양조사의 원시자료를 활용하고, 국내 대표적 식품 분류체계인 식품공전을 반영해서 품목수 839개(세부품목수 1,419개)를 대상으로 실시하였다. 일일 총 식품섭취량은 1,585.77 g/day이고, 그 중 원재료식품은 858.96 g/day(54.2%), 가공식품은 726.81 g/day(45.8%)로 산출되었다. 식품군별 식품섭취량은, 곡류가 가장 높은 비율을 차지했고, 식품섭취량 상위15위 식품군 중 90% 이상의 대상자가 섭취하는 목록으로는 곡류(99.06%), 근채류(95.80%)로 나타났다. 품목별 분석에 의하면 주요 다소비(일일식품섭취량 1%이상 섭취, 158.6 g/day) 및 다빈도(일일평균 국민 25% 이상 섭취, 5,168명)품목은 쌀, 배추김치, 사과, 무, 달걀, 고추, 양파, 밀, 두부, 감자, 오이, 돼지고기로 산출되었다. 섭취빈도 중심의 상위순위 목록은 주로 한식양념 재료들이 포함되었다. 김치류는 배추김치(64.89 g/day)의 섭취량 비율이 67%로 가장 높게 나타났다. 주류의 경우 섭취량 및 섭취빈도 모두 상위 5위 안에 포함되어 있으며, 세부적인 섭취량은 맥주(63.53 g/day), 소주(39.11 g/day), 막걸리(19.70 g/day) 순으로 높았고, 섭취빈도는 소주(11.3%), 맥주(7.2%), 청주(6.6%)순으로 높게 산출되었다. 2010년부터 2015년도 식품섭취량 추이에서 곡류는 꾸준하게 감소하고, 음료류는 다소 증가하는 추세였다. 주류의 섭취빈도에서는 일부 종류인 막걸리, 와인, 청주, 복분자주에서 년도별로 감소하는 경향이었고, 김치류도 감소하는 추세였다. 식품 섭취패턴은 체내노출과 직접적인 영향이 있으며, 식품섭취량이 높은 식품과 섭취빈도가 높은 식품 모두 관리가 중요하지만, 우리나라 섭취 특성을 고려하여 국내에 적합한 안전관리 방안 마련이 필요하다. 식품 섭취로 인한 유해오염물질의 노출량 관리를 위해서 다소비 식품은 섭취용량과 관련이 높으므로 식품의 오염도 관리 중심으로 다빈도 식품은 섭취기간과 관련이 높으므로 섭취시 장기노출로 인한 체내축적 중심으로 접근하는 것을 권장한다.

딥러닝 오픈소스 프레임워크의 사례연구를 통한 도입 전략 도출 (Deriving adoption strategies of deep learning open source framework through case studies)

  • 최은주;이준영;한인구
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.27-65
    • /
    • 2020
  • 많은 정보통신기술 기업들은 자체적으로 개발한 인공지능 기술을 오픈소스로 공개하였다. 예를 들어, 구글의 TensorFlow, 페이스북의 PyTorch, 마이크로소프트의 CNTK 등 여러 기업들은 자신들의 인공지능 기술들을 공개하고 있다. 이처럼 대중에게 딥러닝 오픈소스 소프트웨어를 공개함으로써 개발자 커뮤니티와의 관계와 인공지능 생태계를 강화하고, 사용자들의 실험, 적용, 개선을 얻을 수 있다. 이에 따라 머신러닝 분야는 급속히 성장하고 있고, 개발자들 또한 여러가지 학습 알고리즘을 재생산하여 각 영역에 활용하고 있다. 하지만 오픈소스 소프트웨어에 대한 다양한 분석들이 이루어진 데 반해, 실제 산업현장에서 딥러닝 오픈소스 소프트웨어를 개발하거나 활용하는데 유용한 연구 결과는 미흡한 실정이다. 따라서 본 연구에서는 딥러닝 프레임워크 사례연구를 통해 해당 프레임워크의 도입 전략을 도출하고자 한다. 기술-조직-환경 프레임워크를 기반으로 기존의 오픈 소스 소프트웨어 도입과 관련된 연구들을 리뷰하고, 이를 바탕으로 두 기업의 성공 사례와 한 기업의 실패 사례를 포함한 총 3 가지 기업의 도입 사례 분석을 통해 딥러닝 프레임워크 도입을 위한 중요한 5가지 성공 요인을 도출하였다: 팀 내 개발자의 지식과 전문성, 하드웨어(GPU) 환경, 데이터 전사 협력 체계, 딥러닝 프레임워크 플랫폼, 딥러닝 프레임워크 도구 서비스. 그리고 도출한 성공 요인을 실현하기 위한 딥러닝 프레임워크의 단계적 도입 전략을 제안하였다: 프로젝트 문제 정의, 딥러닝 방법론이 적합한 기법인지 확인, 딥러닝 프레임워크가 적합한 도구인지 확인, 기업의 딥러닝 프레임워크 사용, 기업의 딥러닝 프레임워크 확산. 본 연구를 통해 각 산업과 사업의 니즈에 따라, 딥러닝 프레임워크를 개발하거나 활용하고자 하는 기업에게 전략적인 시사점을 제공할 수 있을 것이라 기대된다.

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.

데이터마이닝 기법을 활용한 비외감기업의 부실화 유형 분석 (The Pattern Analysis of Financial Distress for Non-audited Firms using Data Mining)

  • 이수현;박정민;이형용
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.111-131
    • /
    • 2015
  • 본 연구에서는 데이터마이닝 기법의 일종인 자기조직화지도(Self-Organizing Map, SOM)를 이용하여 비외감기업의 부실화 유형을 구분하고자 한다. 자기조직화지도는 인공 신경망을 기초로 자율학습을 통해 입력된 값을 유사한 군집끼리 묶어내는 방법으로, 기존의 통계적 군집 분류 방법보다 성능이 뛰어나고, 고차원의 입력데이터를 저차원으로 시각화할 수 있다는 장점 때문에 다양한 분야에서 각광받고 있다. 본 연구에서는 기존 연구의 주요 분석대상이었던 외감기업에 비해 부실화 빈도는 높지만 데이터 수집의 어려움으로 인해 분석대상에서 다소 제외되었던 비외감기업의 부실화 유형에 대해 알아보고, 유형별 구체적인 사례도 소개하고자 한다. 재무자료수집이 가능한 100개의 비외감 부실기업에 대해 분석한 결과, 비외감기업의 부실화 유형은 다섯 가지로 구분되었다. 유형 1은 전체 집단의 약 12%를 차지하며, 수익성, 성장성 등 재무지표가 다른 유형에 비해 열등하였다. 유형 2는 전체 집단의 약 14%로, 유형 1보다는 덜 심각하지만 재무지표가 대체로 열등하였다. 유형 3은 성장성 지표가 열등한 그룹으로 기업간 경쟁이 극심한 가운데 지속적으로 성장하지 못하고 부실화된 경우로 약 30%의 기업이 포함되었다. 유형 4는 성장성은 탁월하나 부채경영 등 과감한 경영으로 인해 유동성 부족이나 현금부족 등의 이유로 부실화된 그룹으로 약 25%의 기업이 포함되었다. 유형 5는 거의 모든 재무지표가 우수한 건전기업으로, 단기적인 경영전략의 실수 또는 중소기업의 특성상 경영자의 개인적 사정으로 부실화 되었을 가능성이 큰 그룹으로 약 18%의 기업이 포함되었다. 본 연구 결과는 부실화 유형을 구분하는데 기존의 통계적 방법이 아닌 자기조직화지도를 이용하였다는 점에서 학문적 의의가 있고, 비외감기업의 재무지표만으로도 1차적인 부실화 징후를 발견할 수 있다는 점에서 실무적 의의가 있다고 할 수 있다.

신규시장 성장모형의 모수 추정을 위한 전문가 시스템 (An Expert System for the Estimation of the Growth Curve Parameters of New Markets)

  • 이동원;정여진;정재권;박도형
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.17-35
    • /
    • 2015
  • 시장 수요 예측은 일정 기간 동안 소비자에게 판매되는 동종 제품 또는 서비스의 수량 혹은 매출액의 규모를 추정하는 활동으로서, 기업경영활동에 있어 효율적인 의사결정을 내릴 수 있는 근거로 활용된다는 점에서 중요하게 인식되고 있다. 신규 시장의 수요를 예측하기 위해 다양한 시장성장모형이 개발되어 왔다. 이런 모형들은 일반적으로 시장의 크기 변화의 동인을 신기술 확산으로 보고 소비자인 개인에게 기술이 확산되는 과정을 통해 시장 크기가 변하는 과정을 확산모형으로 구현하게 된다. 그러나, 시장이 형성된 직후에는 수요 관측치의 부족으로 인해 혁신계수, 모방계수와 같은 예측모형의 모수를 정확하게 추정하는 것이 쉽지 않다. 이런 경우, 전문가의 판단 하에 예측하고자 하는 시장과 유사한 시장을 결정하고 이를 참고하여 모수를 추정하게 되는데, 어떤 시장을 유사하다고 판단하느냐에 따라 성장모형은 크게 달라지게 되므로, 정확한 예측을 위해서는 유사 시장을 찾는 것은 매우 중요하다. 그러나, 이런 방식은 직관과 경험이라는 정성적 판단에 크게 의존함으로써 일관성이 떨어질 수밖에 없으며, 결국, 만족할 만한 수준의 결과를 얻기 힘들다는 단점을 지닌다. 이런 정성적 방법은 유사도가 더 높은 시장을 누락시키고 유사도가 낮은 시장을 선택하는 오류를 일으킬 수 있다. 이런 이유로, 본 연구는 신규 시장의 모수를 추정하기 위해 필요한 유사시장을 누락 없이 효과적으로 찾아낼 수 있는 사례기반 전문가 시스템을 설계하고자 수행되었다. 제안된 모형은 데이터 마이닝의 군집분석 기법과 추천 시스템의 내용 기반 필터링 방법론을 기반으로 전문가 시스템으로 구현되었다. 본 연구에서 개발된 시스템의 유용성을 확인하고자 정보통신분야 시장의 모수를 추정하는 실험을 실시하였다. 전문가를 대상으로 실시된 실험에서, 시스템을 사용한 모수의 추정치가 시스템을 사용하지 않았을 때와 비교하여 실제 모수와 더 가까움을 보임으로써 시스템의 유용성을 증명하였다.

캐릭터 상품 제작 교육에 적합한 3D프린터 연구 (Study on 3D Printer Suitable for Character Merchandise Production Training)

  • 권동현
    • 만화애니메이션 연구
    • /
    • 통권41호
    • /
    • pp.455-486
    • /
    • 2015
  • 1986년 특허등록으로 시작된 3D프린팅 기술은 당시에는 인식 부족으로 일부 기업 외에는 주목받지 못하는 기술이었다. 그러나 20년이 지나 만료되는 특허들이 나오는 오늘날에는 가격도 개인이 구매가능한 선까지 낮아졌고 컴퓨터 성능향상 및 인터넷 정보교류의 보편화로 3D 콘텐츠에 대한 인식이 보편화 되어 산업계는 물론 일반인들에게도 주목 받고 있다. 수정 및 유통이 편리한 디지털 데이터를 기반으로 하면서 금형제작이 필요없는 3D프린터는 제작 공정에서 획기적인 변화를 가져 올 수 있으며 캐릭터 콘텐츠상품 분야에서도 동일한 효과를 얻을 수 있다. 최근 들어 관심을 받고 있는 키덜트 문화의 가장 선두에 있는 다양한 캐릭터 상품 제작에는 3D프린터를 사용하는 것이 필수적인 공정이 되고 있으며 이 같은 캐릭터 콘텐츠 관련 산업현장 수요를 예측해 볼 때, 그리고 특허 만료 및 기술의 공유로 저렴해진 가격 등을 고려해 볼 때, 앞으로 교육현장에서 3D프린터를 활용할 수 있는 인재를 양성하는 교육과정을 도입하여 보다 창의적인 작업을 할 수 있는 인재를 양성하고 취업의 영역과 기회를 확대하는 것은 꼭 진행되어야 할 것이다. 그러나 학교 교육에서 3D프린터를 도입하고자 할 때 얻을 수 있는 정보는 한계가 있다. 언론이나 정보매체에서는 3D 프린터에 대한 장밋빛 미래가치나 산업규모 성장과 같은 일반적인 정보만을 거론하고 있으며 학계에서도 연구의 수준의 프린팅 기술 소개나 산업에서의 적용, 산업 규모 데이터 분석 등 개론수준의 내용 정리에 머무르고 있다. 이러한 정보의 부족은 교육현장에서 문제를 발생시킨다. 장점과 단점 비교와 같은 실질적인 정보 비교 없이 일단 도입 하여 시행착오의 과정 이후에서야 사용을 할 수 있게 됨으로서 시간적, 기회비용이 발생할 수밖에 없는 상황이다. 특히 많은 비용을 들여 도입한 장비가 학교 교육의 특성에 맞지 않는다면 그로 인한 비용손실은 클 것이다. 본 연구의 목적은 관련 전문가들이 아닌 기술관련 기반이 없는 일반 사용자들을 대상으로 하였다. 기존의 의 3D프린터 기술소개의 정도가 아닌 대표적 기술에 따른 사용상의 주의 점과 문제점을 분석하고 장단점을 비교하여 학교 교육, 특히 애니메이션 관련 학과에서 캐릭터 상품 개발과 관련한 교육에서 필요한 3D 프린터는 어떤 특성을 가져야 하는지를 설명하고 앞으로 3D프린터 이용한 교육을 시행하고자 할 때 실질적인 도움이 될 수 있는 정보를 제공하고자 하였다. 본론에서는 지지대 방식, 재료의 종류, 이차원 프린팅 방법, 삼차원 프린팅 방법과 같이 새로운 관점으로 기술을 구분하여 설명하였다. 이렇게 다른 구분 방식을 선택 하게 된 이유는 사용상의 실질적인 문제들을 상호 비교하기 용이하도록 하기 위함이다. 결론적으로 가장 적합한 3D프리터는 출력물의 품질은 다소 부족하지만 비교적 가격대가 저렴하고 재료 및 유지보수비용이 적게 드는 FDM방식의 프린터로 선정하였으며 부가적으로 기술지원이 잘되는 업체를 선정하기를 추천한다.

감정예측모형의 성과개선을 위한 Support Vector Regression 응용 (Application of Support Vector Regression for Improving the Performance of the Emotion Prediction Model)

  • 김성진;유은정;정민규;김재경;안현철
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.185-202
    • /
    • 2012
  • 오늘날 정보사회에서는 정보에 대한 가치를 인식하고, 이를 위한 정보의 활용과 수집이 중요해지고 있다. 얼굴 표정은 그림 하나가 수천개의 단어를 표현할 수 있듯이 수천 개의 정보를 지니고 있다. 이에 주목하여 최근 얼굴 표정을 통해 사람의 감정을 판단하여 지능형 서비스를 제공하기 위한 시도가 MIT Media Lab을 필두로 활발하게 이루어지고 있다. 전통적으로 기존 연구에서는 인공신경망, 중회귀분석 등의 기법을 통해 사람의 감정을 판단하는 연구가 이루어져 왔다. 하지만 중회귀모형은 예측 정확도가 떨어지고, 인공신경망은 성능은 뛰어나지만 기법 자체가 지닌 과적합화 문제로 인해 한계를 지닌다. 본 연구는 사람들의 자극에 대한 반응으로서 나타나는 얼굴 표정을 통해 감정을 추론해내는 지능형 모형을 개발하는 것을 목표로 한다. 기존 얼굴 표정을 통한 지능형 감정판단모형을 개선하기 위하여, Support Vector Regression(이하 SVR) 기법을 적용하는 새로운 모형을 제시한다. SVR은 기존 Support Vector Machine이 가진 뛰어난 예측 능력을 바탕으로, 회귀문제 영역을 해결하기 위해 확장된 것이다. 본 연구의 제안 모형의 목적은 사람의 얼굴 표정으로부터 쾌/불쾌 수준 그리고 몰입도를 판단할 수 있도록 설계되는 것이다. 모형 구축을 위해 사람들에게 적절한 자극영상을 제공했을 때 나타나는 얼굴 반응들을 수집했고, 이를 기반으로 얼굴 특징점을 도출 및 보정하였다. 이후 전처리 과정을 통해 통계적 유의변수를 추출 후 학습용과 검증용 데이터로 구분하여 SVR 모형을 통해 학습시키고, 평가되도록 하였다. 다수의 일반인들을 대상으로 수집된 실제 데이터셋을 기반으로 제안모형을 적용해 본 결과, 매우 우수한 예측 정확도를 보임을 확인할 수 있었다. 아울러, 중회귀분석이나 인공신경망 기법과 비교했을 때에도 본 연구에서 제안한 SVR 모형이 쾌/불쾌 수준 및 몰입도 모두에서 더 우수한 예측성과를 보임을 확인할 수 있었다. 이는 얼굴 표정에 기반한 감정판단모형으로서 SVR이 상당히 효과적인 수단이 될 수 있다는 점을 알 수 있었다.

Ensemble of Nested Dichotomies 기법을 이용한 스마트폰 가속도 센서 데이터 기반의 동작 인지 (Ensemble of Nested Dichotomies for Activity Recognition Using Accelerometer Data on Smartphone)

  • 하으뜸;김정민;류광렬
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.123-132
    • /
    • 2013
  • 최근 스마트 폰에 다양한 센서를 내장할 수 있게 되었고 스마트폰에 내장된 센서를 이용항 동작 인지에 관한 연구가 활발히 진행되고 있다. 스마트폰을 이용한 동작 인지는 노인 복지 지원이나 운동량 측정. 생활 패턴 분석, 운동 패턴 분석 등 다양한 분야에 활용될 수 있다. 하지만 스마트 폰에 내장된 센서를 이용하여 동작 인지를 하는 방법은 사용되는 센서의 수에 따라 단일 센서를 이용한 동작인지와 다중 센서를 이용한 동작인지로 나눌 수 있다. 단일 센서를 이용하는 경우 대부분 가속도 센서를 이용하기 때문에 배터리 부담은 줄지만 다양한 동작을 인지할 때에 특징(feature) 추출의 어려움과 동작 인지 정확도가 낮다는 문제점이 있다. 그리고 다중 센서를 이용하는 경우 대부분 가속도 센서와 중력센서를 사용하고 필요에 따라 다른 센서를 추가하여 동작인지를 수행하며 다양한 동작을 보다 높은 정확도로 인지할 수 있지만 다수의 센서를 사용하기 때문에 배터리 부담이 증가한다는 문제점이 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 스마트 폰에 내장된 가속도 센서를 이용하여 다양한 동작을 높은 정확도로 인지하는 방법을 제안한다. 서로 다른 10가지의 동작을 높을 정확도로 인지하기 위해 원시 데이터로부터 17가지 특징을 추출하고 각 동작을 분류하기 위해 Ensemble of Nested Dichotomies 분류기를 사용하였다. Ensemble of Nested Dichotomies 분류기는 다중 클래스 문제를 다수의 이진 분류 문제로 변형하여 다중 클래스 문제를 해결하는 방법으로 서로 다른 Nested Dichotomy 분류기의 분류 결과를 통해 다중 클래스 문제를 해결하는 기법이다. Nested Dichotomy 분류기 학습에는 Random Forest 분류기를 사용하였다. 성능 평가를 위해 Decision Tree, k-Nearest Neighbors, Support Vector Machine과 비교 실험을 한 결과 Ensemble of Nested Dichotomies 분류기를 사용하여 동작 인지를 수행하는 것이 가장 높은 정확도를 보였다.

TV 시청률과 마이크로블로그 내용어와의 시간대별 관계 분석 (Analysis of the Time-dependent Relation between TV Ratings and the Content of Microblogs)

  • 최준연;백혜득;최진호
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.163-176
    • /
    • 2014
  • 소셜미디어 확산으로 많은 사용자들이 SNS를 통해 자신의 생각과 의견을 표출하며 다른 사용자들과 상호작용하고 있다. 특히 트위터와 같은 마이크로블로그는 짧은 문장을 통해 영화, TV, 사회 현상 등과 같은 공통의 주제에 대해 많은 사람이 즉각적으로 의견을 표출하고 교환하는 플랫폼의 역할을 수행하고 있다. TV방송 프로그램에 대해서도 의견과 감정을 마이크로블로그를 통해 표출하고 있는데, 본 연구에서는 마이크로블로그의 내용과 시청률과의 관계를 살펴보기 위해, 지난 공중파 방송 프로그램에 대한 트윗을 수집하고 부적절한 트윗들을 제거한 후 형태소 분석을 수행하였다. 추출된 형태소뿐 아니라 이모티콘, 신조어 등 사용자가 입력한 모든 단어들을 후보 자질로 삼아 시청률과의 상관관계를 분석하였다. 실험을 위해 2013년 1월부터 10개월간의 예능프로그램 트윗의 데이터를 수집하여 전국 시청률 데이터와 비교 분석을 수행하였다. 트윗의 발생량은 일주일 중 방송된 요일에 가장 많았으며, 특히 방송시간 부근에서 급격히 증가하는 모습을 보였다. 이것은 전국에 동시간에 방송되는 공중파 프로그램의 특성상 공통된 관심 주제를 제공하기 때문에 나타나는 현상으로 여겨진다. 횟수 기반 자질로 방송 일의 총 트윗 수와 리트윗 수, 방송시간 중의 트윗 수와 리트윗 수와 시청률과의 상관 관계를 분석하였으나 모두 낮은 상관 계수를 나타냈다. 이것은 단순한 트윗 발생 빈도는 방송 프로그램의 만족도 또는 시청률을 제대로 반영하고 있지 못함을 의미한다. 내용 기반 자질로 추출한 단어들 중에는 높은 상관관계를 보여주는 단어들이 발견되었으며, 표준어가 아닌 이모티콘과 신조어 중에도 높은 상관관계를 보여주는 자질이 나타났다. 또한 방송시작 전과 후에 따라 상관계수가 높은 단어가 상이함을 발견하였다. 매주 같은 시간에 방송되는 TV 프로그램의 특성상, 방송을 기다리고 기대하는 내용의 트윗과 방송 후 소감을 표현하는 트윗의 내용에 차이가 존재하였다. 이러한 분석결과는 단어에 따라 시청률과 연관성이 높은 시간대가 달라짐을 의미하며, 시청률을 측정하고자 할 때 각 단어들의 시간대를 고려해서 사용해야 함을 의미한다. 본 연구에서 제안한 방법은 기존의 표본 추출을 통해 이루어지는 TV 시청률 측정을 보완할 수 있는 방법에 활용할 수 있으리라 기대된다.