• 제목/요약/키워드: 정보검색(情報檢索) 서비스

검색결과 2,380건 처리시간 0.028초

속성 그래프 및 GraphQL을 활용한 지식기반 공간 쿼리 시스템 설계 (Design of Knowledge-based Spatial Querying System Using Labeled Property Graph and GraphQL)

  • 장한메;김동현;유기윤
    • 한국측량학회지
    • /
    • 제40권5호
    • /
    • pp.429-437
    • /
    • 2022
  • 최근 사람과 기계의 소통을 위해 QA (Question Answering) 시스템에 대한 요구가 증가하였다. QA 시스템 중 공간에 관련된 질문을 처리할 수 있는 폐쇄 도메인 QA 시스템을 GeoQA라 하는데 본 연구는 GeoQA 분야에서 주로 사용되던 RDF (Resource Description Framework)기반의 데이터베이스가 데이터 입출력 및 변형에 한계를 보인다는 점을 극복하기 위해 최근 주목받고 있는 새로운 형태의 그래프 데이터베이스인 LPG (Labeled Property Graph)를 사용하였다. 또한, LPG 쿼리(query)언어가 표준화되지 않아 GeoQA 시스템이 특정 제품에 의존할 수 있다는 점 때문에 API 형태의 쿼리 언어인 GraphQL (Graph Query Language)을 도입하여 다양한 LPG를 사용할 방안을 제시하였다. 본 연구에서는 공간 관련 질문이 입력되었을 때 답변을 검색할 수 있도록 대한민국 중심의 별도 데이터베이스를 구축하였는데 각 데이터는 국가공간정보포털 및 지방행정 인허가데이터개방 서비스에서 취득하였으며 각 공간 객체 간 공간적 관계는 미리 계산되어 그래프의 엣지(edge) 형태로 입력되었다. 사용자의 질문은 먼저 FOL (First Order Logic)형태를 거쳐 최종적으로 GraphQL로 변환되며 GraphQL 서버를 통해 데이터베이스에 전달되었다. 실험에 사용한 LPG로는 현재 가장 높은 점유율을 보이는 그래프 데이터베이스인 Neo4j를 선택하였고 내장 함수와 QGIS 일부가 공간 연산에 사용되었다. 시스템 구축 결과 사용자의 질문을 변환, Apollo GraphQL 서버를 통해 처리하고 데이터베이스로부터 적합한 답변을 얻을 수 있음을 확인하였다.

장애아동의 학교준비도 프로그램(School Readiness Program)에 대한 체계적 문헌 고찰 (A Systematic Literature Review of School Readiness Programs for Children With Disabilities)

  • 김은지;곽보경;박혜연
    • 재활치료과학
    • /
    • 제12권3호
    • /
    • pp.7-18
    • /
    • 2023
  • 목적 : 본 연구는 장애아동의 학교준비도 프로그램을 다룬 문헌을 분석함으로써 연구의 대상자, 프로그램의 제공자, 기간, 요소 및 결과 등을 알아보고자 한다. 연구방법 : PubMed, Embase, Web of Science, 학술연구정보서비스(Research Information Sharing Service)를 사용하여 문헌을 수집하였다. 주요 검색어는 "School readiness" AND ("Occupational Therapy" OR "Rehabilitation"), "학교준비도" AND ("작업치료" OR "재활")을 사용하였다. 선정기준과 배제기준을 통하여 최종 8편의 연구가 선정되었다. 결과 : 학교준비도 프로그램 유형에는 복합적 기능 훈련, 운동 기술 훈련, 부모교육 프로그램, 애플리케이션을 이용한 프로그램들이 있었고 가장 높은 비중을 차지한 유형은 복합적 기능 훈련이었다. 프로그램의 제공자는 작업치료사, 심리학자, 물리치료사, 언어치료사, 사회복지사, 교육자가 있었고 심리학자가 가장 많은 연구를 진행하였다. 중재 프로그램의 구성요소는 학업 기능, 운동 기능, 사회적 기능, 부모교육, 기타로 분류할 수 있었으며 학업 기능과 사회적 기능이 큰 비중을 차지하였다. 프로그램 적용 결과 다기능적 기술, 문해력, 양육 기술, 대동작·소동작 기능의 향상을 나타냈다. 결론 : 본 연구는 장애아동의 학교준비도 프로그램 유형, 제공자, 중재 요소, 결과 등을 분석하여 학교 기반 작업치료의 기초 자료를 마련하고자 하였다. 최근 학교준비도 프로그램에 관한 관심과 연구는 증가하고 있으며 작업치료사들도 학교 관련 재활 분야에서 역할을 정립하여 다양한 학교 기반 작업치료가 이루어져야 할 것이다.

유아 교사 관련 창의성 연구 동향 분석 : 국내 학위 논문 중심으로 (Analysis of Creativity Research Trends Related to Early Childhood Teachers : Focusing on Domestic Thesis)

  • 김민정
    • 기독교교육논총
    • /
    • 제73권
    • /
    • pp.73-91
    • /
    • 2023
  • 연구 목적 : 본 연구는 유아 교사 관련 창의성 연구를 분석하여 유아 교사 관련 창의성 연구의 활성화를 위한 기초 자료를 제공하고자 한다. 연구 내용 및 방법 : 본 연구를 위해 '유아 교사', '창의성', '창의성 연구동향'을 주제어로 국회도서관과 학술연구정보서비스(RISS)를 통해 검색된 국내 석·박사학위논문 103편을 선정하였다. 유아 교사 관련 창의성 연구를 연구시기, 연구내용, 연구방법, 연구대상, 창의성요인의 5가지 준거로 분석하여 빈도와 백분율을 산출하였다. 결론 및 제언 : 연구결과, 첫째, 유아 교사 관련 창의성 연구의 시기별 동향은 1991년부터 2022년까지 석사논문 91편(88.3%), 박사논문 12편(11.7%)으로 석사논문중심으로 연구가 이루어지고 있었다. 둘째, 연구내용별 동향은 기초연구 20편(19.4%), 실천연구 83편(80.6%)으로 나타났다. 유아 교사 관련 창의성 연구는 실천연구 중심으로 활발히 이루어지고 있다. 셋째, 연구방법별 동향은 양적연구 96편(93.2%), 질적연구 7편(6.8%), 문헌연구 0편(0%) 순으로 나타났다. 유아 교사 관련 창의성 연구는 양적연구 중심으로 이루어지고 있었다. 넷째, 연구대상별 동향은 유아교사 관련 연구 100편(97.1%)과 예비유아교사 관련 연구 3편(2.9%)으로 이루어졌다. 다섯째, 창의성요인별 동향은 교사변인관련 연구 56편(54.4%)과 창의성 교육방법 관련 연구 47편(45.6%)으로 나타났다. 교사변인관련 연구가 창의성교육방법보다 상대적으로 높게 나타났다. 본 연구결과, 유아 교사 관련 창의성 연구에서 기독교교육 연구가 부족하여, 향후 이루어지길 기대한다.

소비자 감성 분석 기반의 음악 추천 알고리즘 개발 (Development of Music Recommendation System based on Customer Sentiment Analysis)

  • 이승준;서봉군;박도형
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.197-217
    • /
    • 2018
  • 음악은 인간의 감성을 소리로 표현하는 창조적 예술 행위이다. 음악은 사람들의 기분을 우울하게 혹은 기쁘게 변화시킬 수 있다. 따라서 음악을 감상하는 데 있어 감성은 소비자에게 적합한 음악을 찾고 들려주는 데 매우 중요한 요소인데, 다양한 음원 서비스에서 제공하는 추천 알고리즘은 사용자의 기본적인 정보(성별, 나이, 감상 횟수 등)와 사용자의 플레이 기록에 기반한 음악 추천 방식을 주로 사용하고 있다. 본 연구에서는 음악을 감상하는 개인의 감성을 고려하여 각 음원이 가지는 고유의 감성을 기본으로 한 음악 추천 알고리즘을 제안해 보고자 한다. 구체적으로, 사용자들이 자주 듣는 음악과 그렇지 않은 음악을 기준으로 '감정 패턴'을 추출 후 상관관계를 확인하고자 하며, 앞선 결과를 기반으로 사용자들이 원하는 노래에 대한 검색과 사용자 감성 기반 추천 방법을 도출해내보고자 한다. 이를 위해 본 연구에서는 사례기반추론 기법을 이용하여 사람들이 주로 듣는 음악과 비슷한 '감성 패턴'을 갖는 특정한 곡을 추천해주는 알고리즘을 개발하였다. 먼저, 분석에 필요한 감정 형용사를 정리하여 변수화 시키고, 의미 있는 것끼리 묶어 음악 감성지수를 개발하였고, 분석의 대상이 될 음원에 대해 고유의 감성지수 점수를 측정하였다. 마지막으로 도출된 점수의 결과를 통해 유사한 감정 패턴이 나오는 곡들을 유사 곡 리스트로 분류하고 사용자들에게 추천하는 과정을 거친다. 앞선 일련의 과정을 거처 도출된 결과는 음원 추천 시스템뿐만 아니라, 인기 있는 곡과 아닌 곡에 영향을 미치는 변수 도출 및 음원 출시 전, 해당 곡의 스트리밍 수 예측 모형 구축 등 다양한 용도로 사용될 수 있을 것으로 기대한다.

시장 대 비시장규범 댓글: 왜 비시장규범 댓글이 더 영향력 있는가? (Market versus non-market normative replies: Why are non-market normative replies more influential?)

  • 이국희
    • 한국HCI학회논문지
    • /
    • 제13권3호
    • /
    • pp.55-63
    • /
    • 2018
  • 현대인들은 인터넷을 통해 구매하고 싶은 재화와 서비스에 대한 정보를 검색한 후, 그 재화와 서비스를 경험해 본 사람들이 기술한 댓글을 확인한다. 이 댓글은 현대인들의 구매의사결정에 영향을 미칠 수 있는 중요한 참조점으로 작용한다. 댓글은 크게 두 가지 유형으로 구분할 수 있는데, 하나는 댓글이 재화나 서비스에 지불한 가격에 부합하는 (혹은 그 이상의) 만족감을 경험했는지(긍정), 아닌지(부정)와 같은 시장규범적 관점의 댓글이고, 다른 하나는 재화와 서비스 공급자가 그것을 공급하여 수익을 얻을 도덕적 자격이 있는지(긍정), 아닌지(부정)와 같은 비시장규범적 댓글이다. 그러나 댓글에 대한 기존 연구는 시장 규범적 관점의 댓글(음식이 맛있는지)에만 관심을 가졌고, 비시장규범적 댓글(경영자가 도덕적으로 훌륭한지)의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구는 선행 연구들이 확인한 시장규범적 댓글의 효과를 맛집 방문의도 평가 상황에서 재검증(실험-1)한 후, 기존에 연구가 이루어지지 않았던 비시장 규범적 댓글의 효과를 검증(실험-2)하며, 시장규범적 댓글과 비시장규범적 댓글의 효과를 비교(메타분석)하려는 목적으로 이루어졌다. 결과적으로 시장규범적 댓글이 긍정적일 때(맛있다)가 부정적일 때(맛없다)보다 맛집 방문의도가 강해졌다(실험-1). 또한 비시장규범적 댓글이 긍정적일 때(운영자가 도덕적임)가 부정적 일 때(운영자가 부도덕함)보다 맛집 방문의도가 강해졌다(실험-2). 한편 시장규범적 댓글이 긍정적일 때보다 비시장규범적 댓글이 긍정적일 때 맛집 방문의도가 더 강해졌고, 시장규범적 댓글이 부정적일 때보다 비시장규범적 댓글이 부정적일 때 맛집 방문의도가 더 약해지는 상호작용을 확인하였다. 이는 사람들이 시장규범적 댓글보다 비시장규범적 댓글에 더 큰 영향을 받을 가능성을 시사한다. 아울러 본 연구는 시장규범 댓글을 확인하기 전과 후의 기분변화보다 비시장규범적 댓글을 확인하기 전과 후의 기분변화가 더 크며, 이 차이로 인해 사람들이 시장규범적 댓글보다 비시장규범적 댓글에 더 큰 영향을 받을 수 있다고 제안하였다.

  • PDF

여성 카지노 시큐리티 종사원에 관한 연구 (A Study on Women's Casino Security Employees)

  • 김형석
    • 시큐리티연구
    • /
    • 제62호
    • /
    • pp.135-158
    • /
    • 2020
  • 카지노에서는 고객과 종사원의 안전을 관리하는 시큐리티 종사원들이 매우 중요한 역할을 수행하고 있다. 특히 카지노에는 여성 종사원들의 비율이 높으며, 고객들 또한 여성과 남성의 비율이 비슷하기 때문에 여성 고객 혹은 여성 종사원이 사건 사고를 경험할 확률이 남성과 비슷하거나 높을 수도 있는 상황이다. 여성의 사건사고를 처리하는 여성 시큐리티 종사원은 여성 고객과 일반 여성 종사원들에게는 여성만이 할 수 있는 시큐리티 서비스를 제공할 수 있다. 하지만 카지노에서 시큐리티 업무를 수행하는 종사원들은 대부분 남성이며, 여성의 비율은 매우 낮다. 따라서 본 연구는 현재 카지노에서 여성으로서 시큐리티 업무를 수행하고 있는 종사원들에 관한 연구로서 이들이 카지노에서 시큐리티 업무를 수행하며 경험한 다양한 내용에 대해서 알아보기 위해 질적연구를 진행하였다. 총 5명의 연구 참여자들에게 총 3회에 걸쳐 인터뷰를 실시하여 수집된 자료를 분석하고 범주화 하였다. 첫 번째 질문인 카지노 시큐리티 업무의 시작 동기에 대한 요인은 교수님의 추천, 개인의 정보검색, 지인의 추천이다. 두 번째 질문인 업무 시 필요 능력에 대한 요인은 다양한 운동 능력, 좋은 신체조건, 외국어 능력이다. 세 번째 질문에서 업무의 만족요인은 업무의 희소성, 급여의 만족, 개인의 적성과 일치, 미래에 대한 기대감이며, 업무의 불만족 요인은 업무의 위험성, 고객에 대한 스트레스, 성별에 대한 차별, 주변의 시선, 교대 근무의 피곤함이다. 네 번째 질문에서 여성 카지노 시큐리티 종사원들의 필요성에 대한 요인은 여성 고객에게 차별화된 서비스 제공, 여성 종사원의 보호, 관련 전공 여성에게 기회 제공이다. 이렇게 나온 연구결과에 대해 카지노 시큐리티업무 20년 이상의 전문가와 인터뷰를 실시하였고, 여성 카지노 시큐리티 종사원은 필요요건이기 때문에 제도적, 인식적인 개선을 통해 발전 방향을 모색해야 한다고 하였다.

지역 기록화를 위한 도큐멘테이션 전략의 적용 (Directions of Implementing Documentation Strategies for Local Regions)

  • 설문원
    • 기록학연구
    • /
    • 제26호
    • /
    • pp.103-149
    • /
    • 2010
  • 자치시대에 지방의 기록관리는 지역의 고유한 특성을 반영하여 독립적으로 추진할 필요가 있다. 그러나 아직 제대로 된 지방영구기록물관리기관이 한 곳도 설립되어 있지 않은 상황에서 다각적이고 적극적인 해결책을 모색할 필요가 있는데 지방기록관리의 방향을 '시설' 중심에서 '기록'과 '전문적 관리(사람)' 중심으로 바꾸는 것이 하나의 대안이다. 특히 중앙의 기록관리 프로세스라는 보편성에 매몰되었던 개별 지역의 다양성과 역동성을 찾기 위해서는 새로운 지역 기록화 전략을 적극 탐구할 필요가 있다. 도큐멘테이션 전략은 특정 지역, 주제, 사건 등에 관한 적절한 정보를 기록 생산자, 보존 기록관, 기록 이용자의 상호 협력을 통해 선별하여 수집하는 방법론으로서 80년대에 미국을 중심으로 제안되고 다양한 분야에서 다양한 방식으로 실험되어온바 있다. 이 연구에서는 도큐멘테이션 전략이 지역 기록화를 위한 방법론으로 어떤 의미를 갖는지 살펴보고 우리의 지역 환경에 적용하기 위해서 고려해야할 점과 추진 방향을 모색해보고자 하였다. 서구에서 개발된 도큐멘테이션 전략이 현 상황에서 우리에게 주는 시사점은 다음과 같다. 첫째, 아카이브즈 및 아키비스트의 능동적 역할을 추구하며 특히 지역사회에서 기록전문직의 가치를 인식시키는 데에 기여할 수 있다. 이 전략은 지방기록관리기관들은 행정사를 넘어서 지역사를 포괄적으로 기록화 하는 주체가 될 것을 촉구한다. 이에 따라 지방의 기록전문직들은 공공기록을 수동적으로 이관 받는 데에서 그치는 것이 아니라 능동적으로 지역의 기록을 수집하고 이를 서비스하기 위해 노력해야 한다. 둘째, 지역 내 기록 수집기관들의 협력을 통해 단일 조직의 기능 재현에서 폭넓은 사회적 재현을 성취할 수 있다는 점이다. 서구에서 이러한 협력 모델은 과도한 업무 부담으로 실패한 경우가 많았지만 디지털 환경은 새로운 가능성을 보여주고 있다. 지역 내에 존재하는 다양한 기록 생산 및 소장기관들과 협력을 통해 지역의 지식역량은 물론 지역정보서비스의 수준을 높일 수 있을 것이다. 셋째, 도큐멘테이션 전략은 다양한 집단들과의 연대를 추구한다. 이 전략은 도큐멘테이션 주제와 관련된 집단이나 공동체로부터 열정과 에너지, 전문지식을 가져올 수 있는 장점을 가지며, 도큐멘테이션 전략은 기억을 남기고자 하는 주체들이 실천적 기록문화운동을 추진하는 하나의 방법론을 제공할 수 있을 것이다. 이 연구에서는 우리의 지역 현실에 적합한 기록화 방향을 다음과 같이 제안하였다. 첫째, 선택적이고 집중적인 기록화를 지향한다. 지역에 관한 모든 영역에 관한 포괄적 기록화를 추진하기 보다는 지역의 로컬리티를 가장 잘 반영하는 영역과 대상을 선정하여 기록화를 추진한다. 지역을 구성하는 다양한 요소들인 사람, 사회 문화, 조직과 제도, 건조(建造) 환경, 공간 등이 상호작용하면서 만들어지고 변화하는 실체인 로컬리티를 규명하기 위해서는 전문가 집단과 지역민의 의견을 반영하는 구조가 필요하다. 둘째, 분산 보존과 통합적 재현을 지향한다. 기록화 주관기관은 다양한 기록 소장기관들과 소장자들을 연결하는 협력체계를 구축하여 분산 소장된 기록들을 통합적으로 검색할 수 있도록 한다. 즉, 한 지역의 역사 기록을 집중 보존할 기관을 정하기보다는 연계를 통한 기록화를 추진하는 것이 현실적일 것이다. 이를 위한 도구로서 지역 게이트웨이 구축을 제안하였다. 셋째, 열린 구조의 디지털 기록화를 지향한다. 지역 기록화는 맥락 재구성을 바탕으로 기록을 수집하는 방법론을 적용하게 되므로 선별된 기록에는 이미 수집자나 맥락 해석자의 의도가 반영되어 있다. 특히 맥락 분석에 의거하여 스토리를 구성하고 이에 따라 기록을 수집하거나 연계할 경우, 자의적이고 주관적인 선별이라는 비판을 받기 쉽다. 이러한 문제를 보완하기 위해 기록 맥락의 해석과 기록화 영역의 선정 등의 과정에 지역 내 다양한 집단의 의견이 반영될 수 있도록 해야 할 것이며, 디지털 네트워크를 통해 여러 집단 및 개인의 참여가 쉽게 이루어질 수 있도록 보장해야 한다. 넷째, 지역 내 협력기관들의 영역별 기록화 수준을 정한다. 기록화에 참여하는 기관들이 디지털 기록화에 맞는 역할을 분담 받아야 하고, 각 기관은 협력적 기록화에 참여함으로써 자관 이용자들에게는 더 나은 포괄적인 기록 서비스를 제공할 수 있을 것이다. 이를 위해 도서관의 디지털 장서개발에 활용하는 컨스펙터스 모형을 응용하여 디지털 기록화 방법론을 새롭게 설계할 것을 제안하였다.

인공지능 기술에 관한 가트너 하이프사이클의 네트워크 집단구조 특성 및 확산패턴에 관한 연구 (Structural features and Diffusion Patterns of Gartner Hype Cycle for Artificial Intelligence using Social Network analysis)

  • 신선아;강주영
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.107-129
    • /
    • 2022
  • 기술경쟁이 심화되고 있는 오늘날 신기술에 대한 선도적 위치의 선점이 중요하다. 선도적 위치의 선점과 적정시점에 기술 획득·관리를 위해 이해관계자들은 지속적으로 기술에 대한 탐색활동을 수행한다. 이를 위한 참고 자료로서 가트너 하이프 사이클(Gartner Hype Cycle)은 중요한 의미가 있다. 하이프 사이클은 기술수명주기(S-curve)와 하이프 수준(Hype Level)을 결합하여 새로운 기술에 대한 대중의 기대감을 시간의 흐름에 따라 나타낸 그래프이다. 새로운 기술에 대한 기대는 기술사업화뿐만 아니라 연구개발 투자의 정당성, 투자유치를 위한 기회의 발판이 된다는 점에서 연구개발 담당자 및 기술투자자의 관심이 높다. 그러나 산업계의 높은 관심에 비해 실증분석을 시도한 선행연구는 다양하지 못하다. 선행문헌 분석결과 데이터 종류(뉴스, 논문, 주가지수, 검색 트래픽 등)나 분석방법은 한정적이었다. 이에 본 연구에서는 확산의 주요한 채널이 되어가고 있는 소셜네트워크서비스의 데이터를 활용하여 'Gartner Hype Cycle for Artificial Intelligence, 2021'의 단계별 기술들에 대한 집단구조(커뮤니티)의 특성과 커뮤니티 간 정보 확산패턴을 분석하고자 한다. 이를 위해 컴포넌트 응집규모(Component Cohesion Size)를 통해 각 단계별 구조적 특성과 연결중심화(Degree Centralization)와 밀도(Density)를 통해 확산의 방식을 확인하였다. 연구결과 기술을 수용하는 단계별 집단들의 커뮤니케이션 활동이 시간이 지날 수록 분절이 커지며 밀도 역시 감소함을 확인하였다. 또한 새로운 기술에 대한 관심을 촉발하는 혁신태동기 집단의 경우 정보확산을 촉발하는 외향연결(Out-degree) 중심화 지수가 높았으며, 이후의 단계는 정보를 수용하는 내향연결(In-degree) 중심화 지수가 높은 것으로 나타났다. 해당 연구를 통해 하이프 사이클에 관한 이론적 기초를 제공할 것이다. 또한 인공지능기술에 대한 기술관심집단들의 기대감을 반영한 정보확산의 특성과 패턴을 소셜데이터를 통해 분석함으로써 기업의 기술투자 의사결정에 새로운 시각을 제공할 것이다.

온라인 언급이 기업 성과에 미치는 영향 분석 : 뉴스 감성분석을 통한 기업별 주가 예측 (Influence analysis of Internet buzz to corporate performance : Individual stock price prediction using sentiment analysis of online news)

  • 정지선;김동성;김종우
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.37-51
    • /
    • 2015
  • 인터넷 기술의 발전과 인터넷 상 데이터의 급속한 증가로 인해 데이터의 활용 목적에 적합한 분석방안 연구들이 활발히 진행되고 있다. 최근에는 텍스트 마이닝 기법의 활용에 대한 연구들이 이루어지고 있으며, 특히 문서 내 텍스트를 기반으로 문장이나 어휘의 긍정, 부정과 같은 극성 분포에 따라 의견을 스코어링(scoring)하는 감성분석과 관련된 연구들도 다수 이루어지고 있다. 이러한 연구의 연장선상에서, 본 연구는 인터넷 상의 특정 기업에 대한 뉴스 데이터를 수집하여 이들의 감성분석을 실시함으로써 주가의 등락에 대한 예측을 시도하였다. 개별 기업의 뉴스 정보는 해당 기업의 주가에 영향을 미치는 요인으로, 적절한 데이터 분석을 통해 주가 변동 예측에 유용하게 활용될 수 있을 것으로 기대된다. 따라서 본 연구에서는 개별 기업의 온라인 뉴스 데이터에 대한 감성분석을 바탕으로 개별 기업의 주가 변화 예측을 꾀하였다. 이를 위해, KOSPI200의 상위 종목들을 분석 대상으로 선정하여 국내 대표적 검색 포털 서비스인 네이버에서 약 2년간 발생된 개별 기업의 뉴스 데이터를 수집 분석하였다. 기업별 경영 활동 영역에 따라 기업 온라인 뉴스에 나타나는 어휘의 상이함을 고려하여 각 개별 기업의 어휘사전을 구축하여 분석에 활용함으로써 감성분석의 성능 향상을 도모하였다. 분석결과, 기업별 일간 주가 등락여부에 대한 예측 정확도는 상이했으며 평균적으로 약 56%의 예측률을 보였다. 산업 구분에 따른 주가 예측 정확도를 통하여 '에너지/화학', '생활소비재', '경기소비재'의 산업군이 상대적으로 높은 주가 예측 정확도를 보임을 확인하였으며, '정보기술'과 '조선/운송' 산업군은 주가 예측 정확도가 낮은 것으로 확인되었다. 본 논문은 온라인 뉴스 정보를 활용한 기업의 어휘사전 구축을 통해 개별 기업의 주가 등락 예측에 대한 분석을 수행하였으며, 향후 감성사전 구축 시 불필요한 어휘가 추가되는 문제점을 보완한 연구 수행을 통하여 주가 예측 정확도를 높이는 방안을 모색할 수 있을 것이다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.