• 제목/요약/키워드: Review data mining

검색결과 273건 처리시간 0.038초

딥러닝 기반 온라인 리뷰를 활용한 추천 모델 개발: 레스토랑 산업을 중심으로 (Developing a deep learning-based recommendation model using online reviews for predicting consumer preferences: Evidence from the restaurant industry)

  • 김동언;장동수;엄금철;이가은
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.31-49
    • /
    • 2023
  • 레스토랑 산업의 성장과 함께 레스토랑 오프라인 매장 수는 점차 증가하지만, 소비자는 자신의 선호도에 적합한 레스토랑을 선택하는 데 어려움을 경험하고 있다. 따라서 소비자의 선호도에 맞는 레스토랑을 추천하는 개인화된 추천 서비스의 필요성이 대두하고 있다. 기존 연구에서는 설문조사 및 평점 정보를 활용하여 소비자 선호도를 조사했으나, 이는 소비자의 구체적인 선호도를 효과적으로 반영하는데 어려움이 존재한다. 이러한 배경하에 온라인 리뷰는 방문 동기, 음식 평가 등 레스토랑에 대한 소비자 구체적인 선호도를 효과적으로 반영하기 때문에 필수적인 정보이다. 한편, 일부 연구에서는 리뷰 텍스트에 전통적인 기계학습 기법을 적용하여 소비자의 선호도를 측정하였다. 그러나 이러한 접근 방식은 주변 단어나 맥락을 고려하지 못하는 한계점이 존재한다. 따라서 본 연구는 딥러닝을 효과적으로 활용하여 온라인 리뷰에서 소비자의 선호도를 정교하게 추출하는 리뷰 텍스트 기반 레스토랑 추천 모델을 제안한다. 본 연구에서 제안된 모델은 추출된 높은 수준의 의미론적 표현과 소비자-레스토랑 상호작용을 연결하여 소비자의 선호도를 정확하고 효과적으로 예측한다. 실험 결과에 따르면 본 연구에서 제안된 추천 모델은 기존 연구에서 제안된 여러 모델에 비해 우수한 추천 성능을 보이는 것으로 나타났다.

문헌정보학 분야 핵심 학술지들의 가중 주제-방법 네트워크 분석 (Weighted Subject - Method Network Analysis of Library and Information Science Studies)

  • 이기헌;정효정;송민
    • 한국문헌정보학회지
    • /
    • 제49권3호
    • /
    • pp.457-488
    • /
    • 2015
  • 본 연구는 1990년부터 2014년까지 25년 간 국외 유수 문헌정보학 학술지들에 게재된 논문들을 대상으로 연구 주제와 연구 방법을 구분하여 현 선도 학술지의 연구 누적 현황을 분석하였다. 연구 주제와 연구 방법을 구분하고 그들 간의 관계를 살펴보기 위해 가중 주제-방법 네트워크를 개발하였다. 이는 주제와 방법으로 구성된 네트워크이며, 해당 토픽 소속 단어의 동시 출현 빈도를 기초로 주제와 방법에 가중치를 준다. 본 연구 결과에 따르면, 지난 25년간 경영정보시스템, 정보요구분석, 계량서지연구, 정보정책 등이 상위 연구 주제들이었다. 또한, 모델링, 개념/문헌연구, 연구협업분석, 웹데이터 분석 등이 상위 연구 방법들이었으며, 최근 텍스트 마이닝의 비상이 괄목할 만하다. 빈번히 짝을 이루는 연구 주제들과 연구 방법들의 지난 25년간의 군집들과 최근 5년간의 군집들을 살펴보면, 계량서지연구가 네트워크분석 방법들을 다수 적용하면서 그 저변을 넓히며 자리를 확고하게 하고 있으며, 텍스트 마이닝이 의료정보시스템, 이용자인터페이스에 특화되고 있음을 확인할 수 있다. 이러한 연구 결과는 문헌정보학의 선도 연구자들의 관심 연구 영역과 관점을 확인시켜주고, 향후 문헌정보학 발전을 위한 연구 설계의 기초자료로 활용될 수 있다.

텍스트 마이닝을 이용한 인공지능 활용 신약 개발 연구 동향 분석 (Analysis of Research Trends in New Drug Development with Artificial Intelligence Using Text Mining)

  • 남재우;김영준
    • 생명과학회지
    • /
    • 제33권8호
    • /
    • pp.663-679
    • /
    • 2023
  • 본 리뷰 논문은 2010년부터 2022년까지의 인공지능을 활용한 신약개발 관련 연구동향을 분석하여 정리하였다. 이러한 분석을 통해 2,421개 연구의 초록을 코퍼스로 구성하고, 전처리를 거쳐 빈도가 높고 연결 중심성이 높은 단어를 추출하였다. 분석 결과 2010-201년과 2020-2022년 단어빈도 추이는 비슷한 것으로 구분되어 나타났다. 연구 방법으로는 2010년부터 2020년까지 머신 러닝을 활용한 연구가 많이 진행되었고, 2021년부터는 딥러닝을 활용한 연구가 증가하고 있다. 이러한 연구를 통해 이루어지고 있는 인공지능 활용연구 동향에 대해 분야별로 살펴보고 관련 연구의 장점, 문제점, 도전과제 등을 살펴보았다. 파악되어진 연구 동향은 2021년 이후로 약물의 재배치를 인공지능 활용 연구, 항암제 개발을 위한 컴퓨터 활용 연구, 임상시험에 인공지능 적용 연구 등과 같이 인공지능 적용 분야가 확대되고 있다는 점이다. 이러한 과정을 통해 향후 이루어질 것으로 예상되는 인공지능 활용 신약개발 연구의 전망에 대해 간략히 제시하였다. 위의 인공지능 기술 발전과 함께 바이오와 의료데이터의 신뢰성과 안전성이 확보되어진다면 인공지능 활용 신약개발의 방향이 개인 맞춤형 의료와 정밀의료 분야로 진행되어질 것으로 판단하기에 이에 대한 지속적인 노력이 필요하리라 본다.

NATM 터널 공정리스크 데이터베이스 구축 및 리스크 분류체계 개발 (Establishment of Risk Database and Development of Risk Classification System for NATM Tunnel)

  • 김현비;바타갈래 위누리 키만디가 가루나라내;김병수
    • 한국건설관리학회논문집
    • /
    • 제25권1호
    • /
    • pp.32-41
    • /
    • 2024
  • 건설산업은 안전사고뿐 아니라 공기지연, 원가상승, 환경오염 등의 여러 복합적인 리스크가 발생하며 이를 해결하기 위한 관리기술이 필요하다. 그 중에서 프로젝트에 직접적인 영향을 미치는 공정리스크의 관리는 그 중요성에 비해 관련정보가 부족한 실정이다. 본 연구는 각 프로젝트마다 상이한 분류체계 사용으로 인한 리스크 정보검색의 어려움을 해소하기 위하여 MATM 터널 공정리스크분류체계를 개발하고자 하였다. 리스크수집은 기존 문헌검토와 Experience Mining 기법을 사용하였고 DB구축은 자연어처리 개념을 활용하였다. 분류체계의 구조는 자료의 호환성을 고려하여 기존 WBS 구조를 채택하였고, WBS의 공종과 연결된 RBS를 구축하였다. 연구결과 공종별 리스크를 쉽게 파악하고 리스크에 연결된 리스크특성과 리스크요인이 직관적으로 드러나는 리스크분류체계가 완성되었다. 구축된 분류체계의 활용성 검증결과 사용자의 키워드 입력으로 공종별 리스크와 리스크요인이 쉽게 식별되어 분류체계는 유효한 것으로 나타났다. 본 연구를 통해 NATM터널 계획 및 설계 시 작업공종에 따르는 리스크를 미리 식별하고 그 요인에 맞는 대응방안을 수립하여 비용과 공사기간의 증가를 방지하는데 기여할 수 있을 것으로 기대된다.

텍스트 마이닝을 활용한 Youtube 광고에 대한 소비자 인식 분석 (A Study on Analysis of consumer perception of YouTube advertising using text mining)

  • 엄성원
    • 경영과정보연구
    • /
    • 제39권2호
    • /
    • pp.181-193
    • /
    • 2020
  • 본 연구는 최근에 이슈가 되고 있는 텍스트마이닝을 활용하여 소비자 인식을 분석한 연구이다. 이를 위해 삼성갤럭시 Youtube 광고에 대한 소비자 리뷰 분석을 통해 소비자들이 가지고 있는 삼성 갤럭시에 대한 인식을 분석하였다. 분석을 위해 Youtube 광고의 소비자 리뷰 1,819개를 추출하였다. 이를 데이터 전처리 과정을 거쳐 광고와 관련된 키워드를 명사, 형용사, 부사로 분류하여 추출하였다. 이후 빈도 분석 및 감성 분석을 실시하였으며 마지막으로 구조적 등위성 분석을 통한 군집화를 실시하였다. 본 연구 결과를 간략히 요약하면 다음과 같다. 첫 번째 가장 많이 언급된 단어는 갤럭시 노트(n=217), 좋음(n=135), 펜(n=40), 기능(n=29) 등으로 나타났다. 이는 소비자들이 광고를 통해 "갤럭시 노트", "좋음", "펜", "기능"은 삼성 핸드폰 제품에 대해 기능적인 면이 좋고, 노트 펜에 대해서 긍정적으로 높게 인식한다고 판단할 수 있다. 추가적으로 "삼성페이", "혁신", "디자인", "아이폰" 등에 대한 인식은 삼성 핸드폰에 대해 혁신적인 디자인과 삼성페이의 기능적인 면에서 상당히 좋은 평가를 하는 것을 알 수 있다. 두 번째, Youtube 광고에 대한 감성분석 결과이다. 감성 분석 결과 감성강도 비율이 긍정(75.95%)로 부정(24.05%)보다 높게 나타났다. 이는 소비자들이 삼성 갤럭시 모바일폰에 대해 긍정적으로 인식하고 있음을 의미한다. 감성 키워드 분석 결과 긍정키워드의 경우는 "좋다", "후하다", "혁신적", "최고다", "빠르다", "예쁘다" 등으로 나타났으며, 부정키워드의 경우는 "겁난다", "울고싶다", "불편", "아쉽다", "싫다" 등이 추출되었다. 본 연구이 시사점은 기존 광고에 대한 소비자 인식 연구를 살펴보면 대부분 정량적 분석 방법에 의한 연구가 대부분이었다. 본 연구에서는 광고에 대한 정량적 연구 방법에서 탈피하여 정성적 연구를 통해 소비자 인식분석을 시도하였다. 이는 향후 연구에도 많은 영향을 미칠 것으로 판단되며, 정성적 연구를 통해 소비자 인식 연구의 출발점이 될 것으로 확신한다.

해양사고 온톨로지 구축 및 데이터 관리방안 연구: 서해남부해역 선박사고 상황보고서 분석을 중심으로 (A Study on Marine Accident Ontology Development and Data Management: Based on a Situation Report Analysis of Southwest Coast Marine Accidents in Korea)

  • 이영재;강성경;구자영
    • 해양환경안전학회지
    • /
    • 제25권4호
    • /
    • pp.423-432
    • /
    • 2019
  • 매년 해양활동이 증가하며 해양사고 발생빈도가 높아지고 있다. 이에 따라 해양안전을 위한 각종 연구 활동과 정책이 실행되고 있다. 하지만 이러한 노력에도 불구하고 매년 해양사고가 증가하고 있어 이들의 실효성에 대한 문제가 제기되고 있다. 문헌연구 결과에 따르면, 통계연보를 활용한 선행연구는 통계제공항목 간 비교를 통해 두드러지는 항목에 대한 예방책을 제시하고 있다. 2000년대 이후에는 대형 해양사고가 반복적으로 발생하면서 '사고대응'에 대한 사례연구(case study)가 진행되고 있다. 국내 해양안전을 위한 정책수립 연구과정에서 통계연보나 사고사례를 주 자료로 활용하고 있으나 현재 자료는 사후결과 요약정도의 수준이다. 따라서 본 연구에서는 해양사고 사례분석 및 개선방안 관련 문헌연구를 통해 현행 해양관련 연구와 정책의 한계를 탐색하였다. 또한 자료 활용 한계를 개선하기 위한 방안의 일환으로 선박사고 상황보고서 속성분석, 텍스트 마이닝을 통해 해양사고 정보 분류체계인 온톨로지(ontology)를 수정 보완하였다. 해당 항목은 '신고자, 신고수단, 구조세력, 대응 조치사항, 대응취약성, 적재물, 유류유출경위, 피해유형, 사고처리결과'이며, 이 항목들은 분류체계 표준용어를 활용해 향후 지속적으로 수집 활용할 수 있다. 마지막으로 온톨로지를 실질적으로 활용하기 위한 데이터 수집 및 품질확보 방안을 제시했다. 결과적으로 현재 해양안전이 직면한 문제를 명확히 파악하고 '품질이 확보된 충분한 정보'를 활용한다면 보다 다양한 연구와 실효성 있는 정책 실현이 가능할 것이다.

암반구간의 슬러리 쉴드 TBM의 버력운송 파이프 마모에 관한 연구 (A study on the discharge pipes wear of slurry shield TBM in rock strata)

  • 박영택;김택곤;고태영
    • 한국터널지하공간학회 논문집
    • /
    • 제19권1호
    • /
    • pp.57-70
    • /
    • 2017
  • 본 연구에서는 광산이나 오일샌드 등의 분야에서 적용되고 있는 슬러리 파이프 마모량 측정 방법과 슬러리 파이프의 마모량 예측에 관련된 이론식들을 문헌연구를 통해 살펴보고, 실제 싱가포르 슬러리 쉴드 TBM 현장에서 주기적으로 측정한 직선부 슬러리 파이프의 두께 측정 자료로부터 평균 일일 마모율과 굴착거리당 마모율을 산정하였다. Bukit Timah Granite의 풍화등급에 따른 마모율을 구하였는데, 풍화토에 가까운 G (V) 등급 지반 및 G (III)/G (V)의 복합지반에서의 마모율이 G(I)~G (IV)의 암반 등급지반에 비해서 1.5배 높게 나타났다. 슬러리 파이프 마모율은 슬러리 운송속도에 비례하여 증가하는 경향을 보였다. 향후 지반특성 별 파이프 마모율과 합리적인 관리두께 선정을 통하여 보다 최적화된 슬러리 파이프의 교체 및 회전 주기를 산정할 수 있을 것으로 판단된다.

소프트웨어 시험성적서에 대한 텍스트 분석 (Text Analysis of Software Test Report)

  • 정혜정;한군희
    • 한국융합학회논문지
    • /
    • 제11권11호
    • /
    • pp.25-31
    • /
    • 2020
  • 본 연구는 소프트웨어의 시험 평가에 있어 품질 특성에 대한 가중치를 적용하는 방법을 연구한 것이다. 가중치 적용방안은 시험성적서의 텍스트를 분석해서 텍스트의 빈도에 따른 비율을 소프트웨어 시험 성적의 품질 특성에 대한 가중치로 활용한다. 본 연구의 결과에 대한 타당성 검토는 개발자와 사용자를 중심으로 소프트웨어의 중요도를 평가하게 한 설문조사의 결과와 텍스트 분석의 빈도분석 결과를 비교해서 검토했다. ISO/IEC 25023에서 제시한 8가지 품질 특성을 기반으로 품질을 측정할 경우 동일한 가중치를 적용해서 소프트웨어 품질을 평가하는 것에 비하여 본 연구의 결과는 소프트웨어 특성을 고려한 소프트웨어 품질 측정 결과이므로 소프트웨어 시험 평가에 대한 품질 측정의 타당성이 높아진다고 할 수 있다.

딥러닝을 활용한 개인정보 처리방침 분석 기법 연구 (Privacy Policy Analysis Techniques Using Deep Learning)

  • 조용현;차영균
    • 정보보호학회논문지
    • /
    • 제30권2호
    • /
    • pp.305-312
    • /
    • 2020
  • 개인정보보호법에서는 정보 주체의 권리보장을 위해 개인정보보호 정책문서인 개인정보 처리방침을 공개하도록 규정하고 있고 공정거래위원회에서는 개인정보 처리방침을 약관으로 보고 약관규제법에 따라 불공정약관심사를 하고 있다. 그러나, 정보 주체는 개인정보 처리방침이 복잡하고 이해하기 어려워 읽지 않는 경향이 있다. 개인정보 처리방침의 내용을 간단하고 읽기 쉽게 한다면 온라인 거래에 참여할 확률이 증가하여 기업의 매출 증가에 기여하고, 사업자와 정보주체간의 정보 비대칭성 문제 해결에 기여할 것이다. 본 연구에서는 복잡한 개인정보 처리방침을 딥러닝을 이용하여 분석하여 정보주체로 하여금 가독성 높은 단순화된 개인정보처리 방침을 구현하기 위한 모델을 제시한다. 모델을 제시하기 위해 국내 258개 기업의 개인정보 처리방침을 데이터셋으로 구축하고 딥러닝 기술을 활용하여 분석하는 방안을 제안하였다.

내생성을 고려한 환경규제 강화가 우리나라 제조업 부문 생산성에 미친 영향 분석 (The Effect of Environmental Regulation Considering the Endogeneity on the Productivity of Korean Manufacturing Sectors)

  • 김태영;김홍균
    • 자원ㆍ환경경제연구
    • /
    • 제26권4호
    • /
    • pp.473-498
    • /
    • 2017
  • 본 연구는 Porter 가설을 기반으로 내생성을 고려한 환경규제가 한국 제조업의 생산성에 미치는 영향을 2003년부터 2013년까지의 "광업 제조업조사", "과학기술통계" 및 "환경통계 포털" 자료를 이용하고 패널고정효과 모형을 사용하여 분석했다. 기존 연구들에서 발생할 수 있는 내생성 중 누락변수편의를 없애기 위해 시장경쟁정도, 산업별 R&D 투자금액, 시장개방도 및 진입 퇴출율과 같이 생산성에 영향을 미치는 요인들을 설명변수로 포함하여 분석했으며, 측정오차 및 역인과성을 제거하기 위해서 도구변수 추정법을 이용했다. 주요 분석결과는 다음과 같다. 첫째, 환경규제는 장기적으로 한국 제조업의 생산성을 개선시켜 Porter 가설을 지지하는 것으로 나타났다. 둘째, 누락변수에 의한 내생성은 분석결과에 큰 영향을 미치지 않았으나 측정 오차 및 역인과성에 의한 내생성은 환경규제의 효과를 과소평가 시키는 것으로 분석되었다. 마지막으로 환경기술 R&D은 단기적으로 생산성을 감소시켰다.