• 제목/요약/키워드: BLOGs

검색결과 315건 처리시간 0.034초

온라인 주식게시판 정보와 주식시장 활동에 관한 상관관계 연구 (A Study about the Correlation between Information on Stock Message Boards and Stock Market Activity)

  • 김현모;윤호영;소리;박재홍
    • Asia pacific journal of information systems
    • /
    • 제24권4호
    • /
    • pp.559-575
    • /
    • 2014
  • Individual investors are increasingly flocking to message boards to seek, clarify, and exchange information. Businesses like Seekingalpha.com and business magazines like Fortune are evaluating, synthesizing, and reporting the comments made on message boards or blogs. In March of 2012, Yahoo! Finance Message Boards recorded 45 million unique visitors per month followed by AOL Money and Finance (19.8 million), and Google Finance (1.6 million) [McIntyre, 2012]. Previous studies in the finance literature suggest that online communities often provide more accurate information than analyst forecasts [Bagnoli et al., 1999; Clarkson et al., 2006]. Some studies empirically show that the volume of posts in online communities have a positive relationship with market activities (e.g., trading volumes) [Antweiler and Frank, 2004; Bagnoli et al., 1999; Das and Chen, 2007; Tumarkin and Whitelaw, 2001]. The findings indicate that information in online communities does impact investors' investment decisions and trading behaviors. However, research explicating the correlation between information on online communities and stock market activities (e.g., trading volume) is still evolving. Thus, it is important to ask whether a volume of posts on online communities influences trading volumes and whether trading volumes also influence these communities. Online stock message boards offer two different types of information, which can be explained using an economic and a psychological perspective. From a purely economic perspective, one would expect that stock message boards would have a beneficial effect, since they provide timely information at a much lower cost [Bagnoli et al., 1999; Clarkson et al., 2006; Birchler and Butler, 2007]. This indicates that information in stock message boards may provide valuable information investors can use to predict stock market activities and thus may use to make better investment decisions. On the other hand, psychological studies have shown that stock message boards may not necessarily make investors more informed. The related literature argues that confirmation bias causes investors to seek other investors with the same opinions on these stock message boards [Chen and Gu, 2009; Park et al., 2013]. For example, investors may want to share their painful investment experiences with others on stock message boards and are relieved to find they are not alone. In this case, the information on these stock message boards mainly reflects past experience or past information and not valuable and predictable information for market activities. This study thus investigates the two roles of stock message boards-providing valuable information to make future investment decisions or sharing past experiences that reflect mainly investors' painful or boastful stories. If stock message boards do provide valuable information for stock investment decisions, then investors will use this information and thereby influence stock market activities (e.g., trading volume). On the contrary, if investors made investment decisions and visit stock message boards later, they will mainly share their past experiences with others. In this case, past activities in the stock market will influence the stock message boards. These arguments indicate that there is a correlation between information posted on stock message boards and stock market activities. The previous literature has examined the impact of stock sentiments or the number of posts on stock market activities (e.g., trading volume, volatility, stock prices). However, the studies related to stock sentiments found it difficult to obtain significant results. It is not easy to identify useful information among the millions of posts, many of which can be just noise. As a result, the overall sentiments of stock message boards often carry little information for future stock movements [Das and Chen, 2001; Antweiler and Frank, 2004]. This study notes that as a dependent variable, trading volume is more reliable for capturing the effect of stock message board activities. The finance literature argues that trading volume is an indicator of stock price movements [Das et al., 2005; Das and Chen, 2007]. In this regard, this study investigates the correlation between a number of posts (information on stock message boards) and trading volume (stock market activity). We collected about 100,000 messages of 40 companies at KOSPI (Korea Composite Stock Price Index) from Paxnet, the most popular Korean online stock message board. The messages we collected were divided into in-trading and after-trading hours to examine the correlation between the numbers of posts and trading volumes in detail. Also we collected the volume of the stock of the 40 companies. The vector regression analysis and the granger causality test, 3SLS analysis were performed on our panel data sets. We found that the number of posts on online stock message boards is positively related to prior stock trade volume. Also, we found that the impact of the number of posts on stock trading volumes is not statistically significant. Also, we empirically showed the correlation between stock trading volumes and the number of posts on stock message boards. The results of this study contribute to the IS and finance literature in that we identified online stock message board's two roles. Also, this study suggests that stock trading managers should carefully monitor information on stock message boards to understand stock market activities in advance.

뉴스 빅데이터를 활용한 산림에 대한 사회적 인식 변화 분석 (An Analysis of Social Perception on Forest Using News Big Data)

  • 장윤선;이주은;나소연;이정희;서정원
    • 한국산림과학회지
    • /
    • 제110권3호
    • /
    • pp.462-477
    • /
    • 2021
  • 본 연구는 뉴스 기사와 사설의 빅데이터 분석을 통해 거시적 관점에서 국내 산림 정책의 변화와 산림에 대한 사회적 인식 변화를 고찰하는 것을 목적으로 하였다. 이를 위해 광복 이후인 1946년부터 2017년까지 7시기로 구분하여 중앙지와 경제지에 보도된 총 13,570건의 '산림' 관련 데이터를 수집하였고 키워드 및 구조등위성 분석(CONCOR: CONvergence of iterated CORrelations)을 실시하였다. 분석 결과, 첫째, '산림' 키워드의 기사 및 사설의 연도별 보도 건수 비율은 전반적으로 증가하였다. 둘째, 보도 분야에 있어서 '산림' 관련 뉴스 데이터는 1기(1946~1966년)에는 사회면에 집중되었다가 2기(1967~1972년)부터 5기(1988~1997년)에는 사회면과 경제면으로, 6기(1998~2007년)에는 문화면까지, 7기(2008~2017년) 이후에는 정치면까지 보도 비율이 높아지는 등 산림 관련 이슈가 다양한 분야로 확장되고 있는 것으로 나타났다. 셋째, 시기별로 정책적 패러다임의 변화가 사회적 인식 또한 크게 변화시키고 있음을 확인하였다. 1~2기에 사회적으로는 산림녹화, 보호에 관한 정책보다 생계에 직접적으로 체감되는 문제를 우선적으로 인식하였고 3~6기에 걸쳐서 경제성장을 이룩하면서 산림정책에 대한 계획적·과학적 조림의 필요성 인식(3기), 환경보호에 대한 인식(4기), 국토 보전에 대한 인식(5기), 환경·생태적 관점에서의 인식(6~7기)으로 확장되는 양상을 보였다. 본 연구는 산림에 관한 정책과 이에 대한 대중의 사회적 인식이 의미화되어 반영된 뉴스 빅데이터 자료를 활용하여 구명하였다는 데 의의가 있다. 향후 사회적 이슈를 도출하는 수단으로서 사설뿐 아니라 블로그, 유튜브 등 다양한 사회관계망 서비스(SNS;Social Network Service)의 텍스트 빅데이터와 GDP와 같은 시대별 경제지표를 더불어 활용한다면 대중의 담론, 인식 등을 좀 더 깊이있게 분석할 수 있으리라 판단된다.

철도차량유산의 보존현황과 활성화 방안 (The Conservation Status and Vitalization Plan for Railroad Car Heritage)

  • 석민재
    • 헤리티지:역사와 과학
    • /
    • 제51권2호
    • /
    • pp.38-57
    • /
    • 2018
  • 철도문화유산에 대한 발굴과 보존 연구는 문화재청을 중심으로 근대 문화유산등록제도와 근대 철도교통문화유산 발굴 작업 등에 국한되어 왔다. 한편 철도관련 단체 등의 노력은 미비하였고 철도공사에서 철도문화유산 보존을 위한 내부지침을 만들어 시행하고 있는 정도에 머무르고 있다. 이러한 문제점에 주목하여 본 연구는 철도문화유산 중 철도차량유산을 중심으로 보존 및 활성화의 당위성을 주장하고 그 방안을 제시하고자 하였다. 이러한 목적을 달성하기 위해 철도차량유산의 현장답사를 통해 보존현황을 파악하였고, 해외의 보존사례를 조사하였으며, 이를 바탕으로 철도차량유산의 역사적 가치를 인식하고, 널리 알리는 활성화 방안을 제시하고자 하였다. 연구 결과 첫째, 등록문화재로 등록된 철도차량유산들은 한 장소에서 보존 전시만 할 것이 아니라 보존 차량의 개방 및 관람대를 제공하여 관람을 가능하게 해야 한다. 둘째, 천연기념물이나 무형문화재와 같이 철도를 하나의 문화재 범주로 인식하고 문화재보호법 개정을 통해 문화재 항목을 신설해야 한다. 셋째, sns 및 블로그와 카페를 활용한 전략적 홍보를 통해 전체 국민을 대상으로 한 철도문화유산에 대한 관심도를 증가시키고, 철도문화유산에 대한 인식을 제고해야 한다. 넷째, 법령 및 제도적 지원과 더불어 철도차량유산을 관리하고 이를 운영할 예산, 전담부서, 전담인원의 충원은 문화재 관리역량 강화를 위해 우선적으로 해결되어야 한다. 이상의 연구결과에서와 같이 철도문화유산의 합리적인 보존과 활성화를 위해서는 행정적, 재정적 지원 및 법적 조항을 만들어 철도산업발전기본법에 보존의 근거를 만들어야 할 필요성이 있다. 철도차량유산은 그 보존 가치가 높고, 지역의 상징이자 역사의 흔적이며, 삶의 기록으로서 사회적 가치를 가진다. 이러한 상황에서 정책 및 보호법 개정에 대한 기준의 정립이 시급할 것으로 판단된다.

개인 일기의 연구 자료로서의 가치와 전망 "5월12일 일기컬렉션"을 중심으로 (Value and Prosect of individual diary as research materials : Based on the "The 12th May Diaries Collection")

  • 최효진;임진희
    • 기록학연구
    • /
    • 제46호
    • /
    • pp.95-152
    • /
    • 2015
  • 일상아카이브란 '보통사람들'의 삶과 문화를 구체화, 범주화하여 이에 따라 개인이나 공동체, 더 나아가 한 사회의 기억과 이를 담은 기록물을 수집, 평가, 선별, 보존하는 조직이나 시설, 장소를 말한다. 일기를 비롯해 자서전, 회고록, 편지, 메모 등 실물자료와 온라인 공간에서 주고받는 블로그나 카페 게시물, SNS에 업로드되는 일상의 사진도 여기에 속한다. 이렇게 매 순간 생산되는 일상기록의 수집과 보존에 관한 필요성이 기록학계를 비롯해 다양한 분야에서 제기되고 있다. 특히 일기는 시대를 불문하고 한 개인이 매일같이 경험한 사실과 자아성찰 등을 정리한 글로서 기록의 원천성과 개별성, 유일성 등의 가치가 크게 중요시 되고 있다. 최근 여러 편의 일기들이 발굴, 소개되면서 역사학을 비롯해 다양한 인문사회과학 분야에서도 일기와 기록주체, 생산된 시대 연구가 이루어져왔다. 또한 언어학, 교육학, 심리학 등의 분야에서는 일기에서 관찰되는 언어습관, 문화수용양상, 저자의 감정이나 심리변화 등을 분석한다. 이 글에서는 국내외에서 이루어지는 일기 관련 연구 동향을 정리하고 이 맥락에서 일상기록으로서 "5월12일 일기컬렉션"이 갖는 의미를 찾는다. "5월12일 일기컬렉션"은 매년 5월12일 시민들이 직접 생산, 기증한 일기로 구성되어 있다. 명지대 디지털아카이빙연구소가 2013년 첫 '5월12일 일기수집 이벤트'를 개최한지 3년이 되는 현재 유치원생부터 80대 참가자들이 육필 (그림)일기, 전자문서, 디지털사진/영상, 음성녹음 등 다양한 유형으로 생산된 일기가 2천여 건 수집되었다. 이 글에서는 이렇게 수집된 일기를 정량적으로 분석하고 개별 기록물들이 어떤 내용을 담고 있는지를 살펴본다. 가족, 친구, 학교생활, 진로고민 등 연령별 지역별 직업별로 시민들의 생활상과 진솔한 고민을 읽을 수 있다. 개별 기록물에서 추출되는 키워드와 주제어에 따라 이 일기들이 담고 있는 주제를 더욱 포괄적으로 살펴보고자 한다. 또한 수집된 일기들을 형식과 내용에 따라 연구자료로 언어학, 교육학을 비롯해 역사학, 인류학 등 다양한 학문 분야에서 어떻게 활용될 수 있을지 그 연구 가능성을 제언해본다. 그리고 "5월12일 일기컬렉션"이 일상아카이브로서 수집, 보존되기 위해 필요한 과제가 무엇인지 살펴본다.

SNS 사진과 사진측량을 이용한 정원유산의 3차원 형상 재현 가능성 연구 - 명승 제40호 담양 소쇄원(潭陽 瀟灑園)을 대상으로 - (A Study on the Reproducibility of 3D Shape Model of Garden Cultural Heritage using Photogrammetry with SNS Photographs - Focused on Soswaewon Garden, Damyang(Scenic Site No.40) -)

  • 김충식;이상하
    • 한국전통조경학회지
    • /
    • 제36권4호
    • /
    • pp.94-104
    • /
    • 2018
  • 본 연구는 사진측량 기술을 과거의 촬영된 사진들에 활용하여 정원유산의 원형 재현 가능성을 검토하였다. 인공물과 자연물이 혼재되어 입체 형상 재현 가능성 검토에 적합한 담양 소쇄원(명승 제40호)을 연구 대상으로 하였다. 소쇄원에서 근거리와 원거리의 $360^{\circ}$ 전방향에서 장애물이 없어 촬영이 가능한 조경시설물인 매대(梅臺), 애양단(愛陽壇), 오곡문(五曲門) 담장, 약작(略?)과 자연경물인 광석(廣石) 5개 조경요소를 선정하였다. 인터넷 포털에서 5개 조경요소에 대해 촬영날짜, 초점길이, 노출 등의 정보가 포함된 151장의 사진을 수집하여 촬영구도를 분석하였다. 수집된 사진들은 요소별로 특정한 구도에서 집중적으로 촬영되는 경향을 발견하였다. 또한 조경요소별로 이용자들이 선호하는 2~3개의 촬영구도가 있음을 발견하였다. 조경요소별로 빈도가 높은 촬영구도 1개를 선정하고 그 구도에서 촬영된 사진들을 이용하여 포토스캔(Photoscan) 프로그램으로 3D 메쉬 모델을 제작하여 입체 형상의 재현 가능성을 분석하였다. 제작결과 오곡문 담장, 매대, 애양단과 같은 인공물은 비교적 입체 형상의 재현이 가능하였으나, 질감이 동일하거나 자연 경물인 약작과 광석은 입체 형상의 재현이 불가능했다. 선정된 촬영구도와 유사하게 현장에서 촬영한 사진으로 입체 형상의 재현을 실험한 결과 수집사진에서 불가능했던 약작과 광석에서 3D 메쉬 모델이 제작되었다. 또한 과거와 현재의 형상 비교를 통해 정확한 크기를 측정할 수 있고 변화를 발견할 수 있었다. 문화재의 관람객이나 조경가 등에 의해 촬영된 과거의 사진들을 확보하게 된다면 그 당시에 입체 형상을 재현할 수 있을 것으로 보인다. 이러한 기술이 확산된다면 정원유산의 과거 형상을 추정하고 변화를 고찰하는데 정확성과 신뢰성을 높일 것이다.

블로그 데이터 감성분석을 통한 북한산둘레길 구간별 선호도 평가 (Evaluation of Preference by Bukhansan Dulegil Course Using Sentiment Analysis of Blog Data)

  • 이성희;손용훈
    • 한국조경학회지
    • /
    • 제49권3호
    • /
    • pp.1-10
    • /
    • 2021
  • 본 연구는 탐방객이 자유롭게 서술한 블로그 텍스트 데이터를 자연어 처리 기술 중 하나인 감성분석을 활용하여 북한산둘레길의 선호도를 평가하고, 선호 요인과 비선호 요인을 도출하는 것을 목적으로 하였다. 이에 2019년 1년 동안 작성된 블로그를 수집하고 21개 둘레길 구간별 텍스트에 나타난 긍정 및 부정 감성 단어 도출을 통해 감성점수를 산출하였다. 이후 내용분석을 통해 탐방객이 어떤 요소로 인해 구간을 선호하거나 선호하지 않는지 파악하였다. 북한산둘레길에 대해 작성된 블로그에서는 긍정적인 단어가 평균적으로 약 73% 출현하고 있었고, 각 구간별 게시물의 감성 극성 비율에서도 긍정적인 문서의 비율이 부정적인 문서의 비율보다 높았다. 이를 통해 탐방객은 북한산둘레길에 대하여 대체로 긍정적으로 인식하고 있는 것으로 나타났다. 그럼에도 감성점수를 도출한 결과, 21개 둘레길 구간에서는 선호하는 구간과 선호하지 않는 구간이 존재하고 있었다. 선호 구간과 비선호 구간에 대해 탐방객은 난이도가 낮고 부담 없이 걸을 수 있는 구간을 선호하고 있었고, 경관에 대한 여러 요소(시각, 청각, 후각 등)가 조화롭고 계절감이 뚜렷해 다양한 경관이 연출되는 곳, 경관 시퀀스의 변화가 존재하는 구간을 선호하는 것으로 나타났다. 또한 탐방객은 전망대, 조망점 등의 뷰포인트 유무를 둘레길에서의 주요 요소로 인식하고 있었고, 접근성이 우수하고 안내판 등 정보 제공이 원활하게 이뤄지는 구간에 대해 선호도가 더 높은 것을 알 수 있다. 반면, 도로와 인접함에 따라 발생되는 주변 소음과 과도한 시가지 비율, 구간별 난이도 불균형 등으로 인한 둘레길 동선 불만족이 비선호 요인으로 크게 작용하고 있었으며, 경관 단절 및 구간에 대한 정보 부족 등이 선호도를 떨어트리는 원인으로 나타났다. 본 연구의 결과는 국립공원뿐만 아니라 근교 산림 녹지 관리에 있어서 둘레길 정비 및 개선방안 마련에 활용될 수 있으며, 연구에 활용된 감성분석은 자연지역에 대한 실제 이용자들의 반응을 지속적으로 모니터링 할 수 있다는 점에 의의가 있다. 다만 사전에 정의된 감성사전을 기반으로 평가하였기에 지속적인 사전 업데이트가 필요하다. 또한 소셜미디어 특성상 부정적인 견해보다는 긍정적인 내용을 공유하는 경향이 존재하기 때문에, 현장 설문조사 등의 분석 결과와 비교, 검토하는 작업이 필요하다.

소셜 네트워크 빅데이터 분석을 통한 마라톤 대중화 : JTBC 마라톤대회를 중심으로 (Popularization of Marathon through Social Network Big Data Analysis : Focusing on JTBC Marathon)

  • 이지수;김지영
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권3호
    • /
    • pp.27-40
    • /
    • 2020
  • 마라톤은 남녀노소 누구나 즐길 수 있는 대표적인 생활체육으로 자리 잡은 지 오래이다. 최근 삶의 균형을 뜻하는 워라밸(Work and Life Balance) 트렌드가 전 사회로 확대되면서 진입 장벽이 비교적 낮은 마라톤은 20-30대 젊은 층에게 인기를 끌고 있다. 마라톤 대회의 이슈와 연관단어를 분석하여 2030 젊은 층들에게 인기 있는 마라톤 대회의 스포테인먼트적인 요소를 키워드를 통해 분석하여 차별화된 대회를 위한 발전방안을 제시하고자 한다. 키워드 및 연관단어 분석을 위해 네이버(Naver)와 다음(Daum)에서 제공하는 블로그, 카페, 뉴스가 분석채널로 선정되었고, 빅데이터 자료 검색을 위한 키워드는 'JTBC마라톤'과 '문화'를 주제어로 추출하였다. 자료 분석 기간은 2019년 JTBC 마라톤대회 참가 신청이 시작된 2019년 8월 13일부터 2019년 11월 13일까지 3개월간의 기간으로 한정하였다. 자료수집 및 분석을 위하여 소셜 매트릭스 프로그램인 텍스톰(Textom)을 통해 빈도 및 매트릭스 데이터를 추출하였다. 또한 텍스톰을 활용하여 단어들 간의 연결 구조와 연결정도 중심성을 분석하여 관계의 정도를 계량화 하였다. 분석결과를 살펴보면 첫째, 마라톤은 개인 운동임에도 불구하고 젊은 층들은 '러닝'이라는 공통분모를 공유하며 다른 젊은 층들과 '러닝크루'라는 새로운 문화 집단을 형성하였다. 이를 통해 홀로 외로이 뛰며 자신과의 싸움을 벌이는 마라톤의 이미지에서 벗어나 같이 훈련하고 같이 참가하며 같이 즐기는 축제의 장으로써의 마라톤 대회문화가 형성된 것을 확인할 수 있었다. 둘째, '훈련'의 과정을 중시하고 이를 다른 이들과 SNS를 통해 공유하는 문화가 확산되었음을 알 수 있었다. 세 번째, 유명인과 관련된 단어가 다양하게 도출되었다. 이는 마라톤대회에 참가하여 함께 레이스를 펼친 유명인은 물론 대회가 끝난 후 '애프터공연'에 출연하는 연예인에 대한 참가자들의 높은 관심을 반영한 결과라 하겠다. 네 번째, '후기'와 관련된 단어가 빈번히 도출되었다. 이는 젊은 마라토너들이 마라톤 준비과정은 물론 대회 당일의 경험을 타인들과 공유하는 문화가 반영된 것이라 분석된다. 다섯 번째, 공연과 관련된 단어가 상위 순위에서 도출되었다. 여섯 번째, '도전', '멋진', '성공', '즐겁' 등 긍정적이고 진취적인 감정을 표현하는 단어가 다수 도출되었다. 이 연구의 결과를 통해 젊은 아마추어 마라토너들의 마라톤대회 참가 동기와 목적은 건강과 체력증진처럼 단일하거나 단편적이지 않으며 다양하고 복합적인 종합 문화체험 행사로 마라톤 대회에 참가하고 있음을 확인할 수 있었다. 결국, 젊은 마라토너들의 마라톤 참여는 참가자체에 목적을 두는 '체력증진'의 목적보다는 대회를 선정하고 대회를 크루멤버들과 함께 준비하고 대회를 끝맺음하기까지의 일련의 과정을 하나의 '축제'로 여기는 것을 엿볼 수 있었다.

사용자 리뷰의 평가기준 별 이슈 식별 방법론: 호텔 리뷰 사이트를 중심으로 (Methodology for Identifying Issues of User Reviews from the Perspective of Evaluation Criteria: Focus on a Hotel Information Site)

  • 변성호;이동훈;김남규
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.23-43
    • /
    • 2016
  • 최근 IT기술의 발전에 따라 많은 사람들이 자신들의 여가활동에 대한 경험을 공유하고 있으며, 역으로 다른 사람들의 여가활동에 대한 경험을 참고하여 더 나은 여가활동을 누릴 수 있는 기회를 얻게 되었다. 이러한 현상은 영화, 숙박, 음식, 여행 등 여가활동 전반에 걸쳐 나타나고 있으며, 그 중심에는 여가활동에 대한 정보를 요약하여 제공하는 수많은 사이트가 있다. 대부분의 여가활동 정보 사이트는 각 상품에 대한 평균 평점뿐만 아니라 상세 리뷰를 제공함으로써, 해당 상품을 구매하고자 하는 잠재고객의 의사결정을 지원하고 있다. 하지만 기존 대부분의 사이트는 한 단계의 평가기준에 따라 평점과 리뷰를 제공하기 때문에, 각 평가기준을 구성하는 세부요소에 대한 특징과 평가기준 별 주요 이슈를 파악하기 위해서는 상당히 많은 수의 리뷰를 직접 읽어야 한다는 불편이 따른다. 즉 사용자는 자신이 중요한 것으로 생각하는 평가기준에 대한 조건을 파악하기 위해, 많은 수의 리뷰를 하나하나 읽어보는 과정에서 많은 시간과 노력을 소비하게 된다. 예를 들어 호텔의 접근성, 객실, 서비스, 음식 등 한 단계의 평가기준만을 사용하여 평점과 리뷰를 제공하는 사이트의 경우, 접근성 중 특히 지하철역과의 거리, 객실 중 특히 욕실의 상태를 살펴보고자 하는 사용자에게 필요한 정보를 충분히 제공하지 못하게 된다. 따라서 본 연구에서는 기존 여가활동 정보 사이트의 한계, 즉 평가기준별로 입력된 리뷰를 신뢰하기 어렵다는 점과 평가기준을 구성하고 있는 세부 내용을 파악하기 어렵다는 점을 극복하기 위한 방안을 제시하고자 한다. 본 연구에서 제안하는 방법론은 사용자가 별도의 구분 없이 입력한 리뷰를 그 내용에 따라 평가기준별로 자동 분류하고, 각 평가 기준 별 주요 이슈를 요약하여 제공한다. 제안 방법론은 최근 텍스트 분석에 활발하게 사용되고 있는 토픽 모델링(Topic Modeling)에 기반을 두고 있으며, 각 리뷰를 하나의 문서 단위로 사용하는 것이 아니라 리뷰를 문장 단위로 끊어 개별 리뷰 유닛(Review Unit)으로 분해한 뒤, 평가기준별로 리뷰 유닛을 재구성하여 분석한다는 측면에서 기존의 토픽 모델링 기반 연구와 큰 차이가 있다고 할 수 있다. 본 논문에서는 제안 방법론을 실제 호텔 정보 사이트에서 수집한 423건의 리뷰 문서에 적용하여 6가지 평가기준에 대해 총 4,860건의 리뷰 유닛을 재구성하고, 이에 대한 분석 결과를 소개함으로써 제안 방법론의 유용성을 간접적으로 보인다.

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론 (Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System)

  • 김지현;이종서;이명진;김우주;홍준석
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.137-152
    • /
    • 2012
  • 인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.

뉴스기사를 이용한 소비자의 경기심리지수 생성 (Construction of Consumer Confidence index based on Sentiment analysis using News articles)

  • 송민채;신경식
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.1-27
    • /
    • 2017
  • 경제주체들의 경기상황에 대한 판단 및 전망은 경기변동에 영향을 미치므로 경기심리지수와 거시경제지표들 간에는 밀접한 관련성을 나타내는 것으로 알려져 있다. 경기선행지표로 국내에서 많이 사용되는 경기심리지수에는 소비자동향조사, 기업경기조사, 경제심리지수가 있다. 그러나 설문조사를 통해 생성된 지수는 자료의 성격상 속보성이 떨어지는 문제가 있다. 본 연구에서는 이러한 정형데이터의 한계를 보완할 수 있도록 비정형데이터에서 정보를 추출해 경기심리지수를 생성하고, 경제분석에서의 활용 가능성을 검토하였다. 민간소비와 관련된 실물지표에는 소매판매업지수와 서비스업생산지수를 사용하였고, 고용지표에는 고용률과 실업률을, 가격지표에는 소비자물가상승률과 가계의 대출금리를 사용하여 지표들 간의 추이 분석 및 시차구조 파악을 위한 교차상관분석을 수행하였다. 마지막으로 이들 지표들에 대한 예측 가능성을 점검하였다. 분석결과, 다른 지표들의 선행지수로 많이 사용되는 소비자심리지수와 비교해 선택 지표들과 높은 상관관계를 보이며, 1~2개월 선행한 것으로 나타났다. 예측력 또한 향상되어 텍스트데이터에서 생성한 소비자 경기심리지수의 유용성이 확인되었다. 온라인에서 생성되는 뉴스기사나 소셜 SNS 등의 텍스트 데이터는 속보성이 뛰어나고, 커버리지가 넓어 특정 경제적 이슈가 발생할 경우 이것이 경제에 미치는 영향을 빠르게 파악할 수 있다는 점에서 경기판단지표로써의 잠재적 가능성이 클 것으로 보인다. 경제분석에서 비정형데이터를 활용한 국내연구는 초기 단계지만 데이터의 유용성이 확인되면 그 활용도가 크게 높아질 것으로 기대한다.