• 제목/요약/키워드: 연구 분석

검색결과 175,223건 처리시간 0.108초

앙상블 기법을 활용한 온라인 음식 상품 리뷰 감성 분석 (Sentiment analysis of online food product review using ensemble technique)

  • 김한민;박경보
    • 디지털융복합연구
    • /
    • 제17권4호
    • /
    • pp.115-122
    • /
    • 2019
  • 온라인 마켓에서 소비자는 다양한 상품을 접하고 이에 대한 의견을 자유롭게 기술한다. 소비자의 상품 리뷰가 다른 소비자와 온라인 마켓의 성공에 큰 영향을 주는 만큼 온라인 마켓은 판매 상품에 대한 소비자의 감성을 정확하게 분석할 필요가 있다. 데이터 분석 기법 중 하나인 텍스트 마이닝은 상품에 대한 소비자 리뷰를 분석하여 상품을 효율적으로 관리할 수 있게 해준다. 선행 연구들은 데이터 도메인과 사이즈에 따라 분석 결과의 정확도가 다르게 나타남에도 불구하고 특정 도메인과 2만개 미만의 데이터를 분석해왔다. 또한, 분석의 정확도를 향상 시킬 수 있는 추가 요인에 대한 연구는 거의 수행하지 않았다. 본 연구는 앙상블 기법을 활용하여 기존 연구에서 주로 다루지 않은 음식 상품 도메인의 72,530개 리뷰 데이터를 분석하였다. 또한, 분석 정확도 향상과 관련하여 요약 리뷰의 영향력을 살펴보았다. 연구 결과, 본 연구는 기존 연구와 다르게 부스팅 앙상블 기법이 가장 높은 분석 정확도를 보인다는 사실을 발견하였다. 또한, 요약 리뷰는 분석의 정확도 향상에 기여하는 것으로 나타났다.

한국어 의존 구문 분석의 분석 단위에 관한 실험적 연구 (Empirical Research on Segmentation Method for Korean Dependency Parsing)

  • 이진우;조혜미;박수연;신효필
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.427-432
    • /
    • 2021
  • 현재 한국어 의존 구문 분석의 표준은 어절 단위로 구문 분석을 수행하는 것이다. 그러나 의존 구문 분석의 분석 단위(어절, 형태소)에 대해서는 현재까지 심도 있는 비교 연구가 진행된 바 없다. 본 연구에서는 의존 구문 분석의 분석 단위가 자연어 처리 분야의 성능에 유의미한 영향을 끼침을 실험적으로 규명한다. STEP 2000과 모두의 말뭉치를 기반으로 구축한 형태소 단위 의존 구문 분석 말뭉치를 사용하여, 의존 구문 분석기 모델 및 의존 트리를 입력으로 활용하는 문장 의미 유사도 분석(STS) 및 관계 추출(RE) 모델을 학습하였다. 그 결과, KMDP가 기존 어절 단위 구문 분석과 비교하여 의존 구문 분석기의 성능과 응용 분야(STS, RE)의 성능이 모두 유의미하게 향상됨을 확인하였다. 이로써 형태소 단위 의존 구문 분석이 한국어 문법을 표현하는 능력이 우수하며, 문법과 의미를 연결하는 인터페이스로써 높은 활용 가치가 있음을 입증한다.

  • PDF

네트워크 분석을 이용한 소방서 입지 분석 연구 - 서울시 소방서 신설 사업대상지 대상으로 -

  • 이슬지;이지영
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2010년도 추계학술대회
    • /
    • pp.77-78
    • /
    • 2010
  • 본 연구는 공공기반시설인 소방서 위치의 중요성을 인식하여 서울시의 소방서의 위치를 분석하고 최적의 위치에 있는지 평가하고자 한다. 소방서의 입지분석을 위하여 소방관서의 입지조건이 되는 연구의 밀집도, 건물의 수 자료와 소방방재청에서 분석한 통계자료의 정량적인 분석을 통해서 소방서의 공급량을 결정한다. 결정된 공급량, 즉 소방서 설치 개수에 따라 소방 서비스의 취약지점의 발생을 최소화하기 위하여 네트워크 분석과 입지조건 요소를 이용하여 서비스 수준을 평가한다.

  • PDF

프로파일 분석에서의 다변량 검정법 비교 연구 (A Study on Multivariate Tests in the Profile Analysis)

  • 박진경;박태성
    • 응용통계연구
    • /
    • 제12권1호
    • /
    • pp.97-107
    • /
    • 1999
  • 프로파일 분석은 반복측정 자료를 분석하는데 있어서 널리 사용되는 다변량 분석모형이다. 프로파일 분석에서는 처리 그룹간의 비교와 반응 프로파일의 평행성 검정을 위해서 4가지 검정통계량이 널리 사용되고 있다. 이들 검정통계량은 Wilks의 통계량($\Lambda$), Pillai's Trace 통계량(V), Hotelling-Lawley Trace 통계량(U), Roy's Maximum Root 통계량($\Theta$ )이다. 그 동안 이들 통계량들을 비교하기 위한 여러 연구가 있었지만 주로 일반적인 다변량 분산분석 모형에 근거한 비교였다. 본 논문에서는 자료가 반복측정 자료이고 우리의 관심이 프로파일 분석에 있을 때에 이 4가지 통계량의 비교에 초점을 맞추었다.

  • PDF

사용자 편의성 증진을 위한 유전체 분석 파이프라인 설계 및 구현 (Implementation of Genome analysis pipeline for user friendly)

  • 정민석;김동욱;최한석
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.321-322
    • /
    • 2018
  • 본 연구는 유전체 분석 연구 중에 중요한 어셈블리 및 분석 시스템을 활용하는 데 있어 많은 연구자들이 컴퓨터 지식의 부족으로 인하여 신속한 분석을 수행하지 못하여 연구에 많은 어려움을 겪고 있어 이를 극복하기 위하여 일반 연구자도 쉽게 유전체를 분석할 수 있도록 다양한 분석방법을 자동으로 제공해주는 사용자 관점의 분석 파이프라인을 설계하고 구현하였다.

  • PDF

국내 기록조직 연구의 성과와 과제 (Research Outcomes and Limitations of Records and Archives Organization in Korea)

  • 이은주;노지현
    • 한국기록관리학회지
    • /
    • 제20권4호
    • /
    • pp.129-146
    • /
    • 2020
  • 본 연구의 목적은 기록조직의 의미와 지식 범주에 대해 고찰하고, 기록조직과 관련된 그간의 연구성과를 분석하여 학문적 공과(功過)를 검토하는데 있다. 이를 위해 본 연구에서는 기록조직의 범주로 간주되는 150편의 국내 학술논문을 수집하여 이들로부터 정제된 키워드를 추출한 다음, 이를 대상으로 기록조직에 사용된 용어 분석과 내용 분석을 실시하였다. 빈도분석과 네트워크 분석을 실시한 용어 분석에서는 기록조직 연구에서 자주 사용된 키워드와 그 관계를 통해 통시적인 흐름을 파악하고자 하였으며, 내용 분석에서는 용어 분석에서 드러나지 않았던 맥락과 의미 등 연구의 실제적인 내용에 대한 접근을 시도하였다. 이러한 분석 결과를 토대로 하여, 본 연구에서는 기존의 기록조직 연구가 갖는 의의와 함께 방법론이나 연구대상, 연구주제가 갖는 한계 등을 논의하였다.

TPM 활동요인이 기업성과에 미치는 영향에 대한 메타분석 (Meta-analysis of the effects of TPM activity factors on Corporate performance)

  • 연경화
    • 디지털융복합연구
    • /
    • 제16권2호
    • /
    • pp.151-156
    • /
    • 2018
  • 이 연구의 목적은 TPM을 대한 주제로 작성된 논문 중 검증이 가능한 18편의 논문을 대상으로 메타분석을 실시하는 것이다. 분석을 위해 5개의 가설을 설정하고 각 연구논문에서 제시한 t값을 투입하여 CMA로 메타분석을 실시하였다. 분석 결과 4개 가설에 있어서 I-square 값이 모두 75%이상인 것으로 나타나 이질성이 매우 큰 것으로 분석되었다. 따라서 모든 연구의 모집단 효과크기는 같다는 귀무가설은 기각되었다. 이질성의 원인은 분석에 사용된 개별연구의 응답자분포, 연구조건, 연구시기, 연구지역 등의 연구특성이 다르기 때문이다. 이러한 경우 효과크기의 차이를 분석하기 위해서는 연구특성별로 구분할 수 있는 개별연구들의 요약 통계량이 필요하다. 그러나 개별연구들에서는 효과차이를 분류할 수 있도록 하는 요약통계량이 제시되지 않아서 이질성의 원인에 대한 분석을 실시할 수 없는 것이 아쉬운 점이라 하겠다.

'빅데이터' 분석 기반 한국사 연구의 현황과 가능성: 디지털 역사학의 시작 (Conditions and potentials of Korean history research based on 'big data' analysis: the beginning of 'digital history')

  • 이상국
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1007-1023
    • /
    • 2016
  • 본 글은 역사학, 그 중에서 한국사 연구에서 활용 가능한 빅데이터 분석 방법론을 모색하고, 이를 활용한 '디지털 역사학'의 가능성을 검토하는 것을 목적으로 한다. 방대한 '한국사 빅데이터'를 활용한 한국사 연구를 위해서는 기존의 질적분석 방법론뿐만 아니라 양적분석 방법론이 모색되어야 한다. 이를 위해서는 다양한 학문 분야와의 학제 간 융합연구가 요청된다. 본 글에서는 '한국사 빅데이터'를 활용한 다양한 융합연구의 출현을 고대하면서, 학제 간 융합연구의 연구방법론을 제안하고, 이를 적용한 연구의 한 사례를 소개하였다. 즉, 문장의 의미를 분석하는 텍스트 분석방법으로 '한국사 빅데이터'에서 원하는 정보를 추출한다면, 양적분석 방법론의 단점으로 지적되는 '행간의 의미읽기의 부재'를 점차 보완해 갈 수 있을 것이다. 그리고 이러한 방법론으로 구축한 데이터베이스를 바탕으로 준지도 학습(Semi-Supervised Learning) 방법론을 적용할 경우, 사료가 충분하지 않은 전근대 한국사의 역사적 인물과 사건들을 분석하는데 유용하게 활용될 것으로 기대된다. 분석 결과를 직관적으로 보여주는 시각화를 통해서도 평면적 연구에서 찾아내지 못한 역사적 사실들을 밝혀낼 수 있을 것이다. 이제 '디지털 역사학'의 서막이 오른 것이다.

문화기술(CT) 연구 동향 분석: 국가연구과제를 중심으로 (Analyzing the Trends of Culture Technology using National Research Projects)

  • 이범훈;전우진;금영정
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.64-76
    • /
    • 2021
  • 디지털기술융합사회에서 문화기술의 중요도가 커지고 있지만, 이에 비해 문화기술의 동향을 정확하게 파악하고 분석하고자 하는 시도가 부족한 실정이다. 특히 문화기술의 경우 국가 차원에서 주도하여 발전해 왔으며, 이에 문화기술을 분석함에 있어 국가적 관점을 견지하는 것이 매우 중요하다. 따라서 본 연구는 국가연구과제를 바탕으로 문화기술 동향을 분석하고 향후 문화기술 발전에 대한 시사점을 제공하는 데 초점을 맞추었다. 본 연구는 국가과학기술정보서비스(NTIS)에서 문화기술 연구과제 데이터를 수집하여 연구내용에 대한 키워드 네트워크를 분석하고, 군집분석을 통해 문화기술 과제를 유형화하고 그 특성을 분석하였다. 분석 결과 문화기술은 정보지식에서 디지털콘텐츠, 문화미디어로 발전하고 최근 머신러닝 기술에 접목하여 활발하게 활용되고 있는 것으로 나타났다. 최근에는 코로나19의 사회적 환경의 변화로 비대면 온라인 콘텐츠에 대한 수요로 AR, VR 등 다양한 문화산업에 대한 연구로 발전하고 있는 것을 확인하였다. 이를 통해 본 연구는 문화기술을 이해하고 그 동향을 분석하여, 문화기술의 혁신 가능성을 확인하기 위한 중요한 단서를 제공하였다.

2010년부터 2015년까지 국내 과학영재교육의 연구동향 분석 : 문헌분석 대 사회네트워크분석 (Research Trends in Science Gifted Education from 2011 to 2015: Literature Analysis vs Social Network Analysis)

  • 윤진아;서혜애
    • 과학교육연구지
    • /
    • 제40권3호
    • /
    • pp.267-286
    • /
    • 2016
  • 본 연구는 2010년부터 2015년까지 6년간 과학영재교육의 연구동향을 분석하는데 목적을 두었다. 이를 위해 과학교육 및 영재교육 전문학술지 8종에 게재된 과학영재교육 관련 연구논문 총275편에 대해 문헌분석과 사회네트워크분석(Social Network Analysis: SNA)의 연구방법을 동시에 활용하여 연구동향을 분석하였다. 문헌분석에서는 분석틀로 연구주제, 연구대상, 연구방법의 분류범주를 설정하였으며, SNA방법에서는 논문별 제시된 영문 저자 키워드를 활용하여 연구동향을 분석하였다. 첫째, 문헌분석으로 분석한 결과, 연구주제는 인지적 특성(25.8%), 교육과정/프로그램(22.6%), 사회․정서적 특성(20.2%)의 연구가 많이 이루어지는 것으로 나타났으며, 연구방법에서는 조사연구(46.5%), 실험연구(18.8%), 프로그램 개발(10.6%), 상관연구(10.3%), 질적연구(6.4%)의 순으로 나타났다. 연구대상에서는 중학생 대상연구(33.7%)가 가장 많았고, 초등학생(30.6%), 고등학생(12.7%) 순으로 조사되었다. 둘째, SNA방법으로 분석한 결과, 과학영재교육 연구에서는 science gifted, gifted education, creativity의 3개 키워드를 중심으로 하는 네트워크가 형성되어 있었으며, 가장 빈번히 활용된 키워드는 science gifted, gifted education, gifted, creativity, science inquiry, perception, (creative) problem solving, science high school, scientific attitude, STEAM 으로 조사되었다. 셋째, 주제-키워드 이원모드(2-mode) 네트워크를 분석한 결과, 인지적 특성에 대한 연구는 인식, 사고양식, 과학적 논쟁, 과학탐구 등에 대한 연구가 많이 나타났다. 사회.정서적 특성에 대한 연구는 상관연구, 동기, 창의인성, 자기 효능감 등에 대한 연구가 주로 이루어지고 있는 것으로 나타났다. SNA방법은 연구내용을 구체적으로 분석, 제시함으로써 연구동향을 심층적으로 이해하고 해석할 수 있는 것으로 고찰되었다.