• 제목/요약/키워드: 키워드-기반 시스템

검색결과 519건 처리시간 0.022초

트위터 사용자의 위치정보와 성향을 고려한 트윗 수집 시스템 (Tweet Acquisition System by Considering Location Information and Tendency of Twitter User)

  • 최우성;임준엽;황병연
    • Spatial Information Research
    • /
    • 제22권3호
    • /
    • pp.1-8
    • /
    • 2014
  • 최근 소셜 네트워크 서비스가 급격히 성장하면서, 소셜 네트워크 분석에 관련된 연구들도 많은 관심을 받고 있다. 특히 트위터는 사회적 이슈나 사건들에 대해 실시간으로 반응하기 때문에, 사회과학 분야나 정보검색 분야의 연구자들이 유용한 실험 데이터를 수집하는 데에 활용되고 있다. 그러나 정작 데이터를 수집하는 방법론에 관한 연구는 아직 미흡하다. 이에 본 논문에서는 위치 기반의 이벤트와 정치 사회적 이벤트 위주의 사용자의 성향을 고려한 트윗 수집 시스템을 제안한다. 우선 위치정보와 이벤트 관련 키워드를 포함하고 있는 트윗과 정치 사회적인 이벤트 검출에 필요한 ID들을 수집한 후, 사용자들의 성향을 분류할 ID 분석기를 설계했다. 또한 ID 분석기의 신뢰도 측정을 위해 상위 등급에 분류된 ID를 이용하여 트윗을 분석했다. 분석결과 1등급으로 분류된 ID는 88.8%의 신뢰도를 보였으며, 2등급으로 분류된 ID는 76.05%의 신뢰도를 보였다. 또한 ID 분석기는 77.5%의 신뢰도를 보였으며 소수의 ID를 사용함으로써 데이터의 수집시간을 줄였다.

LDA 기반 사용자 감정분석을 위한 문서 토픽 추출 시스템에 대한 연구 (A Study on the Document Topic Extraction System for LDA-based User Sentiment Analysis)

  • 안윤빈;김학영;문용현;황승연;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.195-203
    • /
    • 2021
  • 최근 IT 분야의 주요 기술인 빅데이터는 다양한 산업 분야로 확장되고 있으며 활용 방안에 대한 연구가 활발하게 진행 중이다. 대부분의 인터넷 산업 분야에서 사용자 리뷰는 이용자가 상품 구매를 결정하는 데 많은 도움을 준다. 그러나 방대한 제품 리뷰에서 긍정, 부정적 의미와 도움이 되는 리뷰를 선별하는 과정은 제품 구매 결정에 있어 많은 시간을 요구한다. 따라서 본 논문에서는 빅데이터 분석 기술인 LDA를 이용해 키워드를 분석 및 종합하여 사용자에게 의미 있는 정보를 제공하는 시스템을 설계하고 구현한다. 문서 토픽 추출을 위해 본 연구에서는 국내 도서 산업을 도메인으로 데이터를 크롤링하고, 빅데이터 분석을 실시한다. 이를 통해 사용자 리뷰의 토픽 및 감정단어를 바탕으로 상품에 대한 종합적인 정보를 제공함으로써 구매자에게 도움을 주고 나아가 리뷰 현황 분석을 통해 상품의 전망 또한 파악할 수 있다.

자연어 처리 기반 맞춤형 트윗 추천 시스템 (Natural Language Processing-based Personalized Twitter Recommendation System)

  • 이현창;유동필;정가빈;남용욱;김용혁
    • 한국융합학회논문지
    • /
    • 제9권12호
    • /
    • pp.39-45
    • /
    • 2018
  • 트위터 사용자는 팔로우, 리트윗 등을 사용하여 자신이 관심 있어 하는 트윗을 찾는다. 하지만 사용자가 3억여 명에 달하는 트위터에서 사용자가 관심 있는 트윗을 찾기는 힘든 일이다. 이를 해결하기 위해 본 논문에서는 사용자 맞춤형 트윗 추천 시스템을 개발하였다. 우선, 사용자에게 추천할 수 있을 만한 가치가 있는 트윗을 수집하기 위해 현재 트랜드를 수집하고, 트랜드에 대해 이야기하는 인기 있는 트윗들을 수집한다. 이후 사용자를 분석하고 맞춤형 트윗을 추천하기 위해 사용자의 트윗과 수집한 트윗을 범주화한다. 최종적으로 웹서비스를 이용하여 사용자에게 본인과 카테고리가 일치하는 트윗과 관심사가 일치하는 사용자를 추천해준다. 결과적으로 67.2%로 적절한 트윗을 추천하였다.

XML 기반 교수-학생 학습지도 시스템의 설계 및 구현 (Design and Implementation of Lesson Plan System for teacher-student based on XML)

  • 최문경;김행곤
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1055-1062
    • /
    • 2002
  • 현재 교육현장에서 사용되고 있는 학습지도안 문서는 교육 정보의 체계적인 제공이 미흡하고 교수 개인이 모든 교수 활동에 필요한 지도안을 작성하는데는 어려움이 있으므로 많은 추가적인 시간과 노력이 필요하다. 네트워크가 확산되어 사용되고 있는 현 시점에서는 웹을 기반으로 한 학습지도안 작성이 더욱 요구되어 진다. 따라서, 웹에서 표준화된 XML을 이용하여 문서의 생성과 검색, 그리고 재사용이 가능하도록 제공함으로써, 교수자의 다양한 요구사항을 융통성 있게 수용할 수 있다. 본 논문에서는 학습지도안을 분석하여 공통 DTD(Document Type Definition)를 생성하고 공통 DTD를 통해 표준화된 XML(eXtensible markup Language) 문서를 제공한다. 시스템에서는 학습지도안을 쉽게 작성할 수 있는 에디터를 제공하고. 이미 작성된 학습지도안의 재사용성을 높이기 위해 검색 기능을 제공하고 있다. 검색으로는 구조기반, 패싯, 키워드 검색 방법을 제시하고 있으며, 작성된 학습지도안은 데이타베이스와 연동되어 구현되어진다. 따라서, XML을 이용하여 학습지도안을 작성함으로써 웹 상에서의 정보를 공유할 수 있고, 웹에서 학습지도안을 바로 작성함으로써 시간과 비용이 절약될 수 있으며. 또한 보다 향상된 학습 환경을 제공할 수 있다

업무 정보전달관계를 이용한 대형복합건설사업의 정보흐름 색시스템 개발 (Development of the Retrieval System of Information Flow for a Large-scale and Complex Construction Project using Information Transfer Relationship on Business Process)

  • 신진호;이현수;박문서;유정호
    • 한국건설관리학회논문집
    • /
    • 제13권6호
    • /
    • pp.84-93
    • /
    • 2012
  • 대형복합건설사업에서 생성되는 정보들은 장기간의 사업주기를 걸치며 다양한 사업주체간에 이동하며 변환 및 발전된다. 그래서 지연 등 사업수행에 문제가 발생하였을 때, 문제의 원인은 해당 업무가 아니라 그 업무와 관련된 이전 업무일 경우 정보흐름을 거슬러 올라가며 문제의 원인을 분석해야 한다. 그러나 복잡한 사업주체 및 업무들의 관계 때문에 사업에서 생성되는 정보들이 어떻게 흘러가는지에 대해 기존의 키워드검색방법으로는 이러한 정보흐름을 도출하기에는 적합하지 않다. 이에 본 연구에서는 대형복합건설사업의 정보흐름을 분석하기 위한 관계기반 정보검색기능을 구축하고 이를 사례 정보시스템에 적용하였다. 우선 기존 정보검색시스템의 활용동향과 대형복합건설사업의 특성을 분석하여 정보전달관계 검색시스템의 필요성을 도출하였고, 이에 적합한 시스템 구축 방법론 및 업무 간 관계 추론 알고리즘을 정립하였다. 그리고 구축한 시스템을 사례시스템인 도시재생사업의 업무정보시스템에 적용하여 그 활용방안을 제시하였다. 본 연구에서 제시한 정보흐름검색은 업무를 담당하는 주체 및 총괄 관리자가 사업 전체를 원활히 진행시키기 위한 주요 업무 도출 등에 이용할 수 있으며, 추가연구의 도구로서도 활용될 것으로 기대된다.

토픽모델링을 활용한 4차 산업혁명 분야의 국내 연구 동향 분석 (A Study on the Research Trends in the Fourth Industrial Revolution in Korea Using Topic Modeling)

  • 김지영;노동조
    • 한국비블리아학회지
    • /
    • 제34권4호
    • /
    • pp.207-234
    • /
    • 2023
  • 4차 산업혁명이 등장한 이래로 산업 분야를 비롯한 다양한 분야에서 관련 연구들이 수행되었다. 본 연구에서는 4차 산업혁명에 대한 국내의 연구 동향을 분석하기 위하여 2016년 1월부터 2023년 8월까지 KCI에 수록된 2,115건의 논문을 대상으로 핵심어 분석 및 LDA 알고리즘에 기반한 토픽모델링 분석을 실시하였다. 본 연구의 결과 첫째, 4차 산업혁명 관련 학술 논문이 많이 게재된 학술지는 디지털융복합연구, 인문사회 21, e-비즈니스연구, 학습자중심교과교육연구 등의 순이었다. 둘째, 토픽모델링 분석 결과, '인간과 인공지능', '데이터와 개인정보 관리', '교육과정의 변화', '기업의 변화와 혁신', '교육의 변화와 일자리', '문화예술과 콘텐츠', '정보와 기업의 정책과 대응'의 7개 토픽이 선정되었다. 셋째, 4차 산업혁명과 관련한 공통 연구주제는 '교육과정의 변화', '인간과 인공지능', '문화예술과 콘텐츠'이며, 공통 키워드는 '기업', '정보', '보호', '스마트', '시스템' 등이 있다. 넷째, 연구 전반기(2016-2019)에는 교육 분야의 주제가 상위에 등장했으나 후반기(2020-2023)에는 기업과 스마트, 디지털, 서비스 혁신에 관한 주제들이 상위로 나타났다. 다섯째, 연구 후반기로 가면서 연구 주제들이 보다 구체화되거나 세분화되는 경향을 보였다. 이러한 동향은 코로나 팬데믹 이후 4차 산업혁명 분야의 핵심 기술들이 다양한 산업 분야에 활용됨에 따라 발생하는 사회경제적 변화에 따른 것으로 해석된다. 본 연구의 결과는 4차 산업혁명 분야의 연구 동향 파악과 전략 수립 및 후속 연구에 유용한 정보를 제공할 수 있을 것으로 기대한다.

텍스트마이닝과 ChatGPT 분석을 활용한 기업과 대중의 ESG 인식 비교: 지속가능경영보고서와 소셜미디어를 기반으로 (Comparing Corporate and Public ESG Perceptions Using Text Mining and ChatGPT Analysis: Based on Sustainability Reports and Social Media)

  • 최재훈;양성병;윤상혁
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.347-373
    • /
    • 2023
  • 최근 기업의 지속가능한 성장을 이끄는 ESG(Environmental, Social, and Governance) 관리의 중요성이 강조되고 있다. 이에, 본 연구는 기업과 일반 대중 간의 ESG에 대한 인식 차이를 실증적으로 밝히고, ESG 정책의 시행을 방해하는 부정적인 여론과 그 배경을 규명하는 것을 목표로 한다. 이를 위해, LDA(Latent Dirichlet Allocation) 토픽모델링, JST(Joint Sentiment Topic Modeling) 및 의미연결망분석 기법을 사용하여 지속가능경영보고서와 소셜미디어에서의 주요 키워드와 토픽, 그리고 그 연결관계를 분석하였다. 또한, ChatGPT를 활용하여, 텍스트마이닝 분석의 결과를 보완하였다. 분석 결과, 기업과 일반 대중 간 ESG에 대한 인식과 중요도에 상당한 차이가 있음을 확인하였다. 구체적으로, 기업들은 위기 관리, 투명한 지배구조, 윤리적 경영 등에 집중하여 신뢰를 구축하려 했으나, '그린워싱', '중대재해', '불매운동' 등과 같은 부정적 키워드가 자주 소셜네트워크에서 등장하여, 많은 대중들이 기업의 ESG 이슈 처리에 대해 의심하고 있음을 확인하였다. 본 연구는 기업, 정부 기관, 고객 및 투자자를 위한 ESG 전략수립에 도움이 될 수 있는 가이드라인을 제공한다는 점에서 의의가 있다.

B2B 전자상거래 정보를 활용한 시장 융합 기회 발굴 방법론 (Discovery of Market Convergence Opportunity Combining Text Mining and Social Network Analysis: Evidence from Large-Scale Product Databases)

  • 김지은;현윤진;최윤정
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.87-107
    • /
    • 2016
  • 융합을 통한 기술과 제품의 혁신을 이해하는 것은 중소기업의 생존을 위한 필수가 되었다. 특히, 이종 산업간 융합을 통한 제품 혁신과 성공을 위해서는 융합 가능한 아이템 즉, 제품과 기술, 아이디어를 탐색하고 대안을 찾는 것이 중요하다. 기존의 융합연구는 크게 두 가지의 한계를 갖는다. 첫째, 특허와 논문 등 기술정보를 기반으로 하는 기술융합 발굴은 시장의 수요를 인식하는데 한계가 있다. 본 논문은 중소 창업기업에 적용할 수 있는 시장융합(Market convergence)의 관점에서 새로운 융합 기회를 식별하려고 시도하였다. 이를 위해 세계 중소 수출입 기업이 이용하는 글로벌 B2B e-마켓플레이스의 제품 데이터베이스를 활용하였다. 둘째, 기존의 융합기회 발굴 연구는 이미 융합되어 존재하는 제품 또는 기술 기반의 연관성 및 관계를 파악하는데 집중하였다. 본 연구에서는 융합 가능한 새로운 사업기회의 발굴을 목적으로 구조적공백(Structural Hole) 이론을 적용하여, 상이한 산업군에서 서로 직접적인 연결 관계가 없는 키워드 간의 네트워크를 분석하여 융합의 가능성이 있는 새로운 융합 사업 테마를 도출하고자 한다. 이를 위해 제품명과 제품 기술서를 기반으로 제품 및 기술 용어 사전과 텍스트마이닝 을 활용하여 제품과 서비스의 특성을 추출하고, 이들 특성간 연관관계분석을 수행한 후, 네트워크 분석을 진행 하였다. 실험 데이터는 시장의 최신 동향을 파악하기 위해 2013년 1월 부터 2016년 7월까지 등록된 24만건의 e-카탈로그를 대상으로 하였으며, 분석의 효율성을 높이기 위해 기술 범위를 IT로 제한하고, IT 기술을 매개로 한 "Health & Medical"과 "Security & Protection" 카테고리 간의 융합 기회를 도출 하였다. 실험을 통하여 융합연관규칙 1,729을 추출하였으며, 지지도를 기반으로 100개의 규칙을 샘플링 하여, 구조적 공백을 분석하였다.

다양한 기기로부터의 데이터 단일 표현을 통한 개인 미멕스 시스템 (A Personal Memex System Using Uniform Representation of the Data from Various Devices)

  • 민영근;이복주
    • 정보처리학회논문지B
    • /
    • 제16B권4호
    • /
    • pp.309-318
    • /
    • 2009
  • 한 개인이 일상 생활을 하면서 겪는 사건을 자동으로 기록하고 탐색하는 시스템은 비교적 최근에 활발히 연구되고 있는 분야이다. 개인 미멕스(personal memex) 또는 라이프로그(life log)라 불리는 이러한 시스템은 MyLifeBits 프로젝트의 센스캠(SenseCam)처럼 보통 이를 위한 전용 디지털 기기를 수반한다. 본 연구에서는 개인의 일상 생활을 담는 매체로서 이러한 현대인이 일상적으로 사용하는 휴대폰, 신용카드, 디지털 카메라 등의 매체를 주목하였다. 이러한 매체에 직접 기록되는 일상 생활 또는 이러한 매체를 통해 상용 서비스를 제공하는 업체의 사이트 (예를 들면 휴대폰 회사 통화 기록)에 기록되는 일상 생활을 전송받아 체계적으로 저장하고 추후 빠르게 참조할 수 있도록 하였다. MyMemex라 불리는 본 시스템의 데이터 수집 에이전트는 이러한 싸이트에서 제공하는 웹 서비스를 이용하여 개인의 라이프로그 '웹 데이터'를 수집하여 서버에 저장한다. 또한 디지털 기기에 저장되는 '파일 데이터'를 로드하여 서버에 저장한다. 본 연구에서는 이러한 웹 데이터 또는 파일 데이터를 4W1H로 기술되는 하나의 미멕스 사건으로 보아 각 서비스마다 다른 형태를 가지는 데이터를 4 W1H 미멕스 사건 데이터로 변환한다. 이러한 변환에는 미멕스 사건 온톨로지를 사용한다. 웹 기반으로 제공되는 본 시스템에서 사용자는 자신의 일상 기록을 시간 순으로 볼 수 있고 특정 키워드를 이용하여 검색할 수 있다. 또한 미멕스 사건들이 문장으로 변환되어 일기 또는 이야기 형식으로 전개될 수 있다. 관련된 일련의 미멕스 사건들은 '에피소드'로 자동으로 군집화되어 보여진다. 저자 중 한명의 실제 라이프로그 데이터를 사용하여 에피소드 군집화를 실험한 결과 높은 정확도를 보였다.

IT 컨설팅 회사의 지적 자산 관리를 위한 지식관리시스템 (KMSCR: A system for managing knowledge assets of an IT consulting firm)

  • 김수연;황현석;서의호
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 춘계정기학술대회
    • /
    • pp.233-239
    • /
    • 2001
  • 최근 대부분의 회사들은 업무를 수행하는데 필요한 지식과 노하우를 공유하고 재사용하기 위하여 지적 자산 관리의 중요성을 인식하고 있다. 특히 고도로 지식 집약적인 업종이라 할 수 있는 IT컨설팅 회사에서는 지적 자산의 관리가 다른 어떤 회사에서보다 큰 중요성을 가지게 된다. 컨설팅 회사에 있어서 검증이 완료된 지적 자산의 공유 및 지능적이면서도 신속한 검색은 컨설팅 서비스의 품질과 고객 만족에 직결되는 중요한 요소이다. 따라서 대부분의 컨설팅 회사들은 자사의 지식 자산을 관리하기 위하여 많은 노력을 기울이고 있다. 본 논문의 목적은 IT 컨설팅 회사예서 관리되는 다양한 형태의 지적 자산들을 중앙 관리하여 설친 고객 사이트에 흩어져 프로젝트를 수행하는 컨설턴트들이 공유할 수 있도록 함으로써 컨설팅 서비스의 생산성과 품질들 높이고자 하는데 있다 이를 위하여 건설팅 회사에서 관리되는 모든 지적 자산의 재고를 조사하여 모델링하고 이를 쉽게 저장하고 검색할 수 있는 시스템 아키텍처를 제안한다. 제안된 아키텍처를 NT 기반에서 Index server를 이용하여 시스템으로 구현하였다 (KMSCR: A Knowledge Management System for managing Consulting Resources). KMSCR에서는 컨설턴트가 찾고자 하는 검색어를 입력하면 다양한 포맷의 (.doc, .ppt, xls, .rtf, .txt, .html 등과 같은) 결과물을 관련성이 높은 순서대로 출력해 줌으로써 컨설팅 리소스를 효과적으로 재사용할 수 있도록 도와 준다. 또한 검색 시에는 미리 등록된 키워드 뿐 아니라 본문 내의 텍스트 검색까지 가능하게 함으로써 컨설팅 리소스에 대한 보다 효과적이고 효율적인 검색을 가능하게 한다.간을 성능 평가 인자로 하여 수행하였다. 논문에서 제한된 방법을 적용한 개선된 RICH-DP을 모의 실험을 통하여 분석한 결과 기존의 제한된 RICH-DP는 실시간 서비스에 대한 처리율이 낮아지며 서비스 시간이 보장되지 못했다. 따라서 실시간 서비스에 대한 새로운 제안된 기법을 제안하고 성능 평가한 결과 기존의 RICH-DP보다 성능이 향상됨을 확인 할 수 있었다.(actual world)에서 가상 관성 세계(possible inertia would)로 변화시켜서, 완수동사의 종결점(ending point)을 현실세계에서 가상의 미래 세계로 움직이는 역할을 한다. 결과적으로, IMP는 완수동사의 닫힌 완료 관점을 현실세계에서는 열린 미완료 관점으로 변환시키되, 가상 관성 세계에서는 그대로 닫힌 관점으로 유지 시키는 효과를 가진다. 한국어와 영어의 관점 변환 구문의 차이는 각 언어의 지속부사구의 어휘 목록의 전제(presupposition)의 차이로 설명된다. 본 논문은 영어의 지속부사구는 논항의 하위간격This paper will describe the application based on this approach developed by the authors in the FLEX EXPRIT IV n$^{\circ}$EP29158 in the Work-package "Knowledge Extraction & Data mining"where the information captured from digital newspapers is extracted and reused in tourist information context.terpolation performance of CNN was relatively

  • PDF