• Title/Summary/Keyword: 텍스트 자료

Search Result 637, Processing Time 0.029 seconds

SNS Analysis Related to Presidential Election Using Text Mining (텍스트 마이닝을 활용한 대선 관련 SNS 분석)

  • Kwon, Young-Woo;Jung, Deok-Gil
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.05a
    • /
    • pp.361-363
    • /
    • 2017
  • 최근 소셜 미디어의 이용률이 폭발적으로 증가함에 따라, 방대한 데이터가 네트워크로 쏟아져 나오고 있다. 이들 데이터는 기존의 정형 데이터뿐만 아니라 이미지, 동영상 등의 비정형 데이터가 있으며, 이들을 포괄하여 빅데이터라고 불린다. 이러한 빅데이터는 오피니언 마이닝, 테스트 마이닝 등의 기술적인 분석 기법과 빅데이터 요약 및 효과적인 표현방법에 대한 시각화 기법에 대하여 활발한 연구가 이루어지고 있다. 이 논문은 인기 있는 사회연결망 서비스인 Twitter의 트윗을 수집하고, 빅데이터 분석 기법인 텍스트 마이닝을 활용하여 2017년 대선에 대하여 분석하였다. 또한 분석된 자료의 효과적인 전달을 위해 워드 클라우드 진행하였다. 이 논문을 위하여 인기 있는 SNS인 Twitter의 최근 7일간 트윗(tweet)을 수집하고 분석하였다.

  • PDF

Learning-based Automatic Keyphrase Indexing from Korean Scientific LIS Articles (자동색인을 위한 학습기반 주요 단어(핵심어) 추출에 관한 연구)

  • Kim, Hea-Jin;Jeoung, Yoo-Kyung
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2017.08a
    • /
    • pp.15-18
    • /
    • 2017
  • 학술 데이터베이스를 통해 방대한 양의 텍스트 데이터에 대한 접근이 가능해지면서, 많은 데이터로부터 중요한 정보를 자동으로 추출하는 것에 대한 필요성 또한 증가하였다. 특히, 텍스트 데이터로부터 중요한 단어나 단어구를 선별하여 자동으로 추출하는 기법은 자료의 효과적인 관리와 정보검색 등 다양한 응용분야에 적용될 수 있는 핵심적인 기술임에도, 한글 텍스트를 대상으로 한 연구는 많이 이루어지지 않고 있다. 기존의 한글 텍스트를 대상으로 한 핵심어 또는 핵심어구 추출 연구들은 단어의 빈도나 동시출현 빈도, 이를 변형한 단어 가중치 등에 근거하여 핵심어(구)를 식별하는 수준에 그쳐있다. 이에 본 연구는 한글 학술논문의 초록으로부터 추출한 다양한 자질 요소들을 학습하여 핵심어(구)를 추출하는 모델을 제안하였고 그 성능을 평가하였다.

  • PDF

Development of Matching Algorism for System Recognizing Text in the Construction Field (건설분야 텍스트 인식시스템의 매칭알고리즘 개발)

  • Song, Jong-Kwan;Jeong, Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1525-1527
    • /
    • 2011
  • 현재 모든 분야에 IT산업이 융합되어 있지만 건설분야에서는 IT산업과의 융합이 많이 시도되고 있음에도 불구하고 타 산업에 비해 미비한 실정이다. 특히, 설계단계 공사비정보는 설계자의 의사결정을 지원하는 중요한 자료원임에도 불구하고 작성자에 따라 내역서에 쓰이는 작업항목 및 규격의 표현방식이 다르고 외래어 표음 및 오타, 그리고 부가정보 표기로 인해 단가축적의 시스템 및 DB화 가 이루어지지 않고 있다. 따라서 본 연구는 시공단계에서 발생된 실적단가를 설계단계에서 효과적으로 활용하기 위해 동일한 작업항목의 상이한 표현을 동일하게 인식할 수 있는 텍스트 인식시스템의 알고리즘을 제시한다. 텍스트 인식알고리즘에는 "유사어 및 단어테이블", "기준작업항목 테이블", "인식된 작업항목 테이블" 등으로 구성된 DB, 최소의미단위 단어를 비교 분절하기 위한 문자열 매칭 알고리즘, 그리고 동일하지 않은 텍스트를 인식하고 사용자의 의사결정을 지원하기 위한 유사도 계산으로 구성하였다.

An Empirical Study on the Clustering Measurement and Trend Analysis among the Asian Ports Using the Context-dependent and Measure-specific Models (컨텍스트의존 모형 및 측정특유 모형을 이용한 아시아항만들의 클러스터링 측정 및 추세분석에 관한 실증적 연구)

  • Park, Ro-Kyung
    • Journal of Korea Port Economic Association
    • /
    • v.28 no.1
    • /
    • pp.53-82
    • /
    • 2012
  • The purpose of this paper is to show the clustering trend by using the context-dependent and measure-specific models for 38 Asian ports during 10 years(2001-2009) with 4 inputs and 1 output. The main empirical results of this paper are as follows. First, clustering results by using context-dependent and measure-specific models are same. Second, the most efficient clustering was shown among the Hong Kong, Singapore, Ningbo, Guangzhou, and Kaosiung ports. Third, Port Sultan Qaboos, Jeddah, and Aden ports showed the lowest level clustering. Fourth, ranking order of attractiveness is Guangzhou, Dubai, HongKong, Ningbo, and Shanghai, and the results of progressive scores confirmed that low level ports can increase their efficiency by benchmarking the upper level ports. Fifth, benchmark share showed that Dubai(birth length), and HongKong(port depth, total area, and no. of cranes) have affected the efficiency of the inefficient ports.

정보표시를 이용한 화일처리와 정보 검색 시스템

  • Park, Jae-Wan;Choe, Yun-Cheol;Song, Man-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 1990.11a
    • /
    • pp.24-31
    • /
    • 1990
  • 표본자료에 있는 정보표시는 그 표본에 있는 모든 자료의 내용을 상실하지 않도록 하기 위해서 필요하다. 그러한 정보표시는 또한 자료들의 구분을 명확히 하여 자료의 저장과 정보검색 목적으로 사용된다. 본 연구에서는 이러한 텍스트 정보표시의 잘못 쓰여진 오류의 검출과 수정 그리고 이러한 분류표시를 이용하여 방대한 표본자료를 정보표시별로의 화일처리와 필요한 정보에 관한 검색 시스템에 관하여 기술한다.

  • PDF

과학교육정보 DB 구축-Science Education Inventory System

  • Kim, Do-Han
    • Journal of Scientific & Technological Knowledge Infrastructure
    • /
    • s.5
    • /
    • pp.62-66
    • /
    • 2001
  • 대중을 대상으로 한 과학정보의 연계체계를 구축하면서 과학분야별, 기관단체별 보유 과학대중화 자료(문헌, 영상, 음성자료)를 조사 및 목록화하고 한국과학문화재단 보유 자료를 포함한 각 기관-단체 발간 문헌자료를 디지털화 시키면서, 기존의 TEXT 위주의 DB에서 사용자가 보다 쉽고 친숙하게 정보를 이용할 수 있도록 DB를 멀티미디어화하여 구축 하므로써 기존의 TEXT 위주의RDB를 택하지 않고, ORDB를 지원하는DBMS중 개발과 운영 및 타DB와 호환이 용이한 DBMS를 도입함으로써 과학분야별로 일반인이 이해하기 쉬운 형태의 자료(텍스트 및 디지털 영상, 음성, 애니메이션, 가상실험등)를 활용한 분야 소개 정보를 구축했다.

  • PDF

Analysis of Term Ambiguity based on Genetic Algorithm (유전자 알고리즘 기반 용어 중의성 분석)

  • Kim, Jeong-Joon;Chung, Sung-Taek;Park, Jeong-Min
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.17 no.5
    • /
    • pp.131-136
    • /
    • 2017
  • Recently, with the development of Internet media, many document materials have become exponentially increasing on the web. These materials are described, and the information on what is the most by this text are classified according. However, the text has meant that many have room for ambiguous interpretation must look at it from various angles in order to interpret them correctly. In conventional classification methods it was simply a classification only have the appearance of the text. In this paper, we analyze it in terms genetic algorithm and local preserving based techniques and implemented a clustering system fragmentation them. Finally, the performance of this paper was evaluated based on the implementation results compared to traditional methods.

Web Document's Efficient Browsing Using Fluid Link (Fluid Link를 이용한 웹 문서의 효율적인 브라우징)

  • 송승헌;윤보열;전형민;정선인;곽상호;김응곤
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 1999.11a
    • /
    • pp.384-389
    • /
    • 1999
  • Most document consists of primary content and supporting material, such as footnotes, detailed explanations, and illustrations, and the related supporting materials are linked as hypertext on web document. However the content of hypertext links Is appeared in the new windows on present web browser. Then the user will leave the primary material, may lose the entire context, and must have some difficulties to return to the primary context when the interest disappears. Using the technique for fluid links, we can solve these problems easily. If the mouse is putted on the link, the related material is presented in between lines or at margin maintaining the context of primary material. In this paper, we introduce the various browsing techniques using fluid links, analyze the forms and the features, and then we propose the best way to implement inJava.

  • PDF

Topic Analysis of Papers of JKIICE Using Text Mining (텍스트 마이닝을 이용한 한국정보통신학회 논문지의 주제 분석)

  • Woo, Young Woon;Cho, Kyoung Won;Lee, KwangEui
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.10a
    • /
    • pp.74-75
    • /
    • 2017
  • In this paper, we analyzed 3,668 papers of JKIICE from 2007 to 2016 using text mining methods for understanding research fields. We used web scraping programs of Python language for data collection, and utilized topic modeling methods based on LDA algorithm implemented by R language. In the results, we verified that representative research areas of JKIICE could be downsized to 9 areas only by the analysis though the submission areas were 19 areas by 2016.

  • PDF

An Exploratory Study on the Importance and Performance Analysis of Health Message Design Principles (건강증진 메시지 디자인 원리의 중요도와 실행도에 관한 탐색적 연구)

  • Choi, Hyoseon;Cho, Young Hoan;You, Myoung Soon
    • The Journal of the Korea Contents Association
    • /
    • v.14 no.6
    • /
    • pp.307-318
    • /
    • 2014
  • This study investigated how people perceived the importance of health message design principles including gist presentation, usefulness of content, format, and intuitive design and how well a webzine article published by Korean Ministry of Food and Drug Safety was designed in terms of the four design principles. This study also explored what individual characteristics influenced the perceptions of health message design principles. A total of 294 adults participated in the survey, and their responses were analyzed with the Importance-Performance Analysis method. Participants perceived that usefulness of content was most important in the text design; gist presentation was most important in the visual design; and format was well designed in both text and visual messages. This study showed that it is crucial to improve the quality of visual health messages particularly in terms of gist presentation and intuitive design. We also found that individuals' interest in health played a significant role in the perceptions of health messages. These results were discussed in regards to principles and strategies for the effective design of health messages.