• 제목/요약/키워드: Text series study

검색결과 103건 처리시간 0.034초

비정형 텍스트 기반의 토픽 모델링을 이용한 건설 안전사고 동향 분석 (A Study on the Trends of Construction Safety Accident in Unstructured Text Using Topic Modeling)

  • 이상규
    • 한국산학기술학회논문지
    • /
    • 제19권10호
    • /
    • pp.176-182
    • /
    • 2018
  • 본 연구는 건설 안전사고에 대한 트랜드 분석을 위해 LDA(Latent Dirichlet Allocation) 기반의 토픽모델링(Topic Modeling)을 제시하여 분석하고자 한다. 특히, 건설산업의 안전사고를 예방하기 위해 제시되고 있는 기존의 다양한 정형데이터 분석에서 벗어난 비정형 데이터 분석 기반의 토픽 모델링을 통해 건설 안전사고 주요 핵심 키워드의 흐름에 대해 파악이 가능하다. 본 방법론을 적용하기 위해 540개의 건설 안전사고 관련 뉴스데이터를 수집하였다. 이를 기반으로, 10가지 토픽과 각 토픽 내의 10가지 키워드를 통해 주요 이슈를 도출하였고 각 토픽에 대한 2017년 1월부터 2018년 2월까지의 뉴스 데이터를 월별 시계열 분석을 통해 향후 토픽에 관한 이슈를 예측한다. 본 연구를 바탕으로 향후 건설 안전사고의 다양한 이슈를 선제적으로 예측하고 이를 기반으로 건설 안전사고 정책과 연구에 좋은 방향을 제시할 것으로 판단한다.

쉬샤오빈(徐小斌)의 「천상의 소리(天籁)」 읽기 - 이청준의 「서편제」와 상호텍스트성을 중심으로 (A Study on Xu Xiao Bin's Sounds of Nature(天籁) - Focusing on Intertextuality of Lee Cheong-jun's Seopyeonje)

  • 최은정
    • 비교문화연구
    • /
    • 제39권
    • /
    • pp.309-328
    • /
    • 2015
  • This study is a consideration of Xu Xiao-Bin(徐小斌)'s Sounds of nature(天?) in the mutual text point of view of Lee Cheong-jun's Sopyonje series. Xu Xiao-Bin's Sounds of nature shows similar motive to Lee Cheong-jun's Sopyonje series that is a story of a mother who damages her daughter's eyes and the daughter. however, it is accepted in totally different ways that the action of father/mother who damage their daughter's eyes. the mother in Sounds of nature is a composer as well as singer and the father in Sopyonje is a singer. The mother's behavior is not able to have duty in Sounds of nature due to it is focused in 'mother's action' rather than a singer but the father's behavior is focused in 'singer's action' in Sopyonje. therefore the action of the father, who is a singer, is considered not merely personal desire of father but also desire to preserve 'singing' as a national culture in public status. the length between two novels are clear in the two daughter's point of views. the daughter in "Sounds of nature" refuses her destiny made from her mother. The daughter's behavior of recovering her own volition, becomes frankly showing the falsehood of 'mother's love. In comparison, the daughter's voice is under the shade in Sopyonje. she surrenders herself to the fate made by her father, and she does not show her desire. This is the point that the difference is created by gender of writers.

토픽모델링을 활용한 해운물류 뉴스 분석 (Analysis of Shipping and Logistics News Articles using Topic Modeling)

  • 윤희영;곽일엽
    • 무역학회지
    • /
    • 제46권4호
    • /
    • pp.61-76
    • /
    • 2021
  • This study focuses on three logistics-related news (Logistics Newspaper, Korea Shipping Gadget, and Korea Shipping Newspaper) in order to present changes in logistics issues, centering on Corona 19, which has recently had the greatest impact in the world. For data collection, two-year news articles in 2019 and 2020 (title, article, content, date, article classification, article URL) were collected through web crawling (using Python's BeautifulSoup, requests module) on the homepages of three representative logistics-related media companies. As for the data analysis methods, fundamental statistical analysis, Latent Dirichlet Allocation (LDA) for topic modeling, and Scattertext were performed. The analysis results were as follows. First, among the three news media related to logistics, the Korea Shipping Newspaper was carrying out the most active media activities. Second, through topic modeling with LDA, eight logistics-related topics were identified, and keywords and significant issues of each topic were presented. Third, the keywords were visually expressed through Scattertext. This is the first study to present changes in the logistics field, focusing on articles from representative logistics-related media in 2019 and 2020. In particular, 2019 and 2020 can be divided into before and after the outbreak of Corona 19, which has had a great impact not only on the logistics field but also on our lives as a whole. For future work, a multi-faceted approach is required, such as comparative studies of logistics issues between countries or presenting implications based on long-term time-series articles.

위치기반 소셜 미디어 데이터의 텍스트 마이닝 기반 공간적 클러스터링 분석 연구 (Spatial Clustering Analysis based on Text Mining of Location-Based Social Media Data)

  • 박우진;유기윤
    • 대한공간정보학회지
    • /
    • 제23권2호
    • /
    • pp.89-96
    • /
    • 2015
  • 위치기반 소셜 미디어 데이터는 빅데이터, 위치기반서비스 등 다양한 분야에서 활용가능성이 매우 큰 데이터이다. 본 연구에서는 위치기반 소셜 미디어 데이터의 텍스트 정보를 분석하여 주요한 키워드들이 공간적으로 어떻게 분포하고 있는지를 파악할 수 있는 일련의 분석방법론을 적용해보았다. 이를 위해, 위치태그를 지닌 트윗 데이터를 서울시 강남지역과 그 주변지역에 대하여 2013년 8월 한달 간 수집하였으며, 이 데이터를 대상으로 하여 텍스트 마이닝을 통해 주요 키워드들을 도출하였다. 이러한 키워드들 중 음식, 엔터테인먼트, 업무 및 공부의 세 카테고리에 해당하는 키워드들만 추출, 분류하였으며 각 카테고리에 해당하는 트윗 데이터들에 대해서 공간적 클러스터링을 실시하였다. 도출된 각 카테고리별 클러스터들을 실제 그 지역의 건물 또는 벤치마크 POI들과 비교한 결과, 음식 카테고리 클러스터는 대규모 상업지역들과 일치도가 높았고 엔터테인먼트 카테고리의 클러스터는 공연장, 극장, 잠실운동장 등과 일치하였다. 업무 및 공부 카테고리 클러스터들은 학원 밀집지역 및 사무용 빌딩 밀집지역과 높은 일치도를 나타내었다.

수학교육에서의 질적연구법 활용에 대한 분석: 연구결과의 타당성 증진 방안을 중심으로 (An Analysis on Qualitative Research in Mathematics Education in Korea: Focusing on increasing validity in qualitative research)

  • 나장함
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제35권2호
    • /
    • pp.137-152
    • /
    • 2021
  • 본 연구는 수학교육 관련 연구에서 질적 접근을 적용한 논문들의 질적 접근 활용양상을 탐색하고, 질적 접근의 타당도와 신실성 향상 방안을 논의하고, 수학교육 분야에서 질적 접근 활용에 대한 시사점과 제언을 제시하고자 하였다. 이를 위해, 2019년부터 2020년까지 한국수학교육학회지 시리즈E <수학교육논문집>에 게재된 13편의 논문에 대한 기초분석을 실시하여 전반적인 경향성을 진단하였다. 질적연구 적용 양상에 대한 경향성은, 적극적 질적연구 6편, 반(semi) 질적연구 3편, 혼합연구 3편, 문헌연구와 질적연구의 혼입 1편 등으로 나타났다. 기초분석 결과를 토대로, 13편의 논문 중 질적 접근을 적극 활용하여 풍부한 논의를 가능하게 할 수 있는 6편의 논문에 대한 질적 분석을 실행하였다. 6편의 논문의 방법론에 대한 세밀한 질적 분석 결과는 질적연구의 타당도와 신실성(trustworthiness)과 관련된 이슈들을 해당 연구의 맥락에서 상세하게 논의하고 있다. 아울러, 이러한 질적 분석의 결과에 기초하여, 향후 수학교육 분야에서 질적연구를 활용할 때 유념해야 할 사항들을 제시하고 있다.

영화 흥행과 관련된 영화별 특성에 대한 군집분석 : 웹 크롤링 활용 (Clustering Analysis of Films on Box Office Performance : Based on Web Crawling)

  • 이재일;전영호;하정훈
    • 산업경영시스템학회지
    • /
    • 제39권3호
    • /
    • pp.90-99
    • /
    • 2016
  • Forecasting of box office performance after a film release is very important, from the viewpoint of increase profitability by reducing the production cost and the marketing cost. Analysis of psychological factors such as word-of-mouth and expert assessment is essential, but hard to perform due to the difficulties of data collection. Information technology such as web crawling and text mining can help to overcome this situation. For effective text mining, categorization of objects is required. In this perspective, the objective of this study is to provide a framework for classifying films according to their characteristics. Data including psychological factors are collected from Web sites using the web crawling. A clustering analysis is conducted to classify films and a series of one-way ANOVA analysis are conducted to statistically verify the differences of characteristics among groups. The result of the cluster analysis based on the review and revenues shows that the films can be categorized into four distinct groups and the differences of characteristics are statistically significant. The first group is high sales of the box office and the number of clicks on reviews is higher than other groups. The characteristic of the second group is similar with the 1st group, while the length of review is longer and the box office sales are not good. The third group's audiences prefer to documentaries and animations and the number of comments and interests are significantly lower than other groups. The last group prefer to criminal, thriller and suspense genre. Correspondence analysis is also conducted to match the groups and intrinsic characteristics of films such as genre, movie rating and nation.

LSTM과 증시 뉴스를 활용한 텍스트 마이닝 기법 기반 주가 예측시스템 연구 (A study on stock price prediction system based on text mining method using LSTM and stock market news)

  • 홍성혁
    • 디지털융복합연구
    • /
    • 제18권7호
    • /
    • pp.223-228
    • /
    • 2020
  • 주가는 사람들의 심리를 반영하고 있으며, 주식시장 전체에 영향을 미치는 요인으로는 경제성장률, 경제지료, 이자율, 무역수지, 환율, 통화량 등이 있다. 국내 주식시장은 전날 미국 및 주변 국가들의 주가지수에 영향을 많이 받고 있으며 대표적인 주가지수가 다우지수, 나스닥, S&P500이다. 최근 주가뉴스를 이용한 주가분석 연구가 활발히 진행되고 있으며, 인공지능 기반한 분석을 통하여 과거 시계열 데이터를 기반으로 미래를 예측하는 연구가 진행 중에 있다. 하지만, 주식시장은 예측시스템에 의해서 단기간 적중이 되더라도, 시장은 더 이상의 단기 전략대로 움직여지지 않고, 새롭게 변할 수밖에 없다. 따라서, 본 모델을 삼성전자 주식데이터와 뉴스 정보를 텍스트 마이닝으로 모니터링하여 분석한 결과를 나타내어 예측이 가능한 모델을 제시하였으며, 향후 종목별 예측을 통하여 실제 예측이 정확한지 확인하여 발전시켜 나갈 예정임.

한역본(漢譯本) 연행록 『상봉록(桑蓬錄)』의 특징과 한역(漢譯) 양상 연구 (A Study on the Chinese Translated of Korean version Yeonhaengnok(燕行錄) of 『Sang-bong-lok』 in Korean)

  • 정내원
    • 동양고전연구
    • /
    • 제55호
    • /
    • pp.147-172
    • /
    • 2014
  • 한역본(漢譯本) "상봉록(桑蓬錄)"는 강재응(姜在應)가 자신의 선조인 四養齋 강호부(姜浩溥)의 한글본 "상봉록(桑蓬錄)"을 한문으로 편술한 것이다. 500여 종이 넘는 연행록 중 한글본과 한문본이 모두 현전하는 연행록이 매우 적으며 그 중에서도 한글본을 가지고 한문으로 번역한 한역본(漢譯本)는 극히 드물다는 점에서 "상봉록(桑蓬錄)"의 자료적 가치는 귀중하며, 연구할 필요성이 있는 자료이다. "상봉록(桑蓬錄)"는 원래 3종이었는데, 현재 전하는 것은 2종이다. 강호부(姜浩溥)가 저술한 원본인 한문본 "상봉록(桑蓬錄)"와 그것을 가지고 강호부(姜浩溥) 자신이 한글로 번역한 "상봉록(桑蓬錄)", 그리고 후손인 강재응(姜在應)가 한글본을 가지고 한문으로 번역하여 편술한 한역본(漢譯本) "상봉록(桑蓬錄)"이 그것이다. 이 중 원본인 한문본 "상봉록(桑蓬錄)"는 현전하지 않는다. 한역본(漢譯本) "상봉록(桑蓬錄)"는 형식면과 내용면에서 여타 한역본(漢譯本) 연행록 및 한역본(漢譯本) 고전소설과 변별되는 특징이 있다. 먼저 형식적 측면에서 살펴보면 한역본(漢譯本) "상봉록(桑蓬錄)"은 서두에 범례가 기술되어 있다. 이 범례는 강재응(姜在應)가 한역본(漢譯本) "상봉록(桑蓬錄)"를 편술한 기준과 방식을 서술한 것이다. 범례를 살펴보면 강재응(姜在應)가 강호부(姜浩溥)의 문장을 가감하는 일 없이 그대로 수록하고 강재응(姜在應) 자신의 문장과 분명히 구별될 수 있도록 하였다. 원작자와 편술자를 구분하여 편술한 이러한 편집체제는 여타 연행록에서 찾아보기 힘든 형식이다. 한편 내용적 측면에서 살펴보면 강재응(姜在應)는 한글본 "상봉록(桑蓬錄)"의 내용을 刪削하지 않고 거의 그대로 옮기는 한편, 강호부(姜浩溥)의 논리를 강화하기 위해 별도의 정보를 추가하였다. 이러한 서술의 다음에는 새로 추가된 정보들을 총망라하여 검토한 후 내린 강재응(姜在應)의 의견이 덧붙여져 있다. 강재응(姜在應)의 결론은 강호부(姜浩溥)의 의견과 같은 경우도 있었고 다른 경우도 있었지만 주목해야 할 점은 강재응(姜在應)가 강호부(姜浩溥)의 글 다음에 의론을 기술하였다는 점에 있다. 이는 후손인 강재응(姜在應)가 선조 강호부(姜浩溥)의 유고인 "상봉록(桑蓬錄)"를 후대에 온전한 형태로 전함과 동시에 강호부(姜浩溥)의 논의의 완전성을 높이기 위해 취택한 방법이라고 볼 수 있다.

기업광고를 통해 본 가족신화와 젠더의 기호학적 의미: SK기업광고를 중심으로 (The Semiotic Meaning of Myth of Family and Gender Through the Corporate Advertisement: Focusing on the SK Advertisement)

  • 조희선;백선기;양다진
    • 대한가정학회지
    • /
    • 제48권9호
    • /
    • pp.27-40
    • /
    • 2010
  • This study attempts to identify the process in which how the Myth of family and gender image are reproduced and taken in by the recipients through semiotics analysis of three versions consisting of children, husband and housewife series of SK corporate's TV advertisements from the last half of year 2009 to the first half of year 2010. The analysis of the corporate advertisements shows that each advertisement binds and stereotypes concept of family and gender to Myth of family, especially case of female, and consequently, the result through text analysis is that corporate advertisements reproduce and restructure traditional Myth of family and role of gender. Going forward, Family study requires to realize importance of effect of mass media, especially of TV advertisement, to research diverse case studies and searching about it.

Opinion-Mining Methodology for Social Media Analytics

  • Kim, Yoosin;Jeong, Seung Ryul
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권1호
    • /
    • pp.391-406
    • /
    • 2015
  • Social media have emerged as new communication channels between consumers and companies that generate a large volume of unstructured text data. This social media content, which contains consumers' opinions and interests, is recognized as valuable material from which businesses can mine useful information; consequently, many researchers have reported on opinion-mining frameworks, methods, techniques, and tools for business intelligence over various industries. These studies sometimes focused on how to use opinion mining in business fields or emphasized methods of analyzing content to achieve results that are more accurate. They also considered how to visualize the results to ensure easier understanding. However, we found that such approaches are often technically complex and insufficiently user-friendly to help with business decisions and planning. Therefore, in this study we attempt to formulate a more comprehensive and practical methodology to conduct social media opinion mining and apply our methodology to a case study of the oldest instant noodle product in Korea. We also present graphical tools and visualized outputs that include volume and sentiment graphs, time-series graphs, a topic word cloud, a heat map, and a valence tree map with a classification. Our resources are from public-domain social media content such as blogs, forum messages, and news articles that we analyze with natural language processing, statistics, and graphics packages in the freeware R project environment. We believe our methodology and visualization outputs can provide a practical and reliable guide for immediate use, not just in the food industry but other industries as well.