• Title/Summary/Keyword: 공공빅데이터

Search Result 302, Processing Time 0.035 seconds

Case Study on Public Document Classification System That Utilizes Text-Mining Technique in BigData Environment (빅데이터 환경에서 텍스트마이닝 기법을 활용한 공공문서 분류체계의 적용사례 연구)

  • Shim, Jang-sup;Lee, Kang-wook
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2015.10a
    • /
    • pp.1085-1089
    • /
    • 2015
  • Text-mining technique in the past had difficulty in realizing the analysis algorithm due to text complexity and degree of freedom that variables in the text have. Although the algorithm demanded lots of effort to get meaningful result, mechanical text analysis took more time than human text analysis. However, along with the development of hardware and analysis algorithm, big data technology has appeared. Thanks to big data technology, all the previously mentioned problems have been solved while analysis through text-mining is recognized to be valuable as well. However, applying text-mining to Korean text is still at the initial stage due to the linguistic domain characteristics that the Korean language has. If not only the data searching but also the analysis through text-mining is possible, saving the cost of human and material resources required for text analysis will lead efficient resource utilization in numerous public work fields. Thus, in this paper, we compare and evaluate the public document classification by handwork to public document classification where word frequency(TF-IDF) in a text-mining-based text and Cosine similarity between each document have been utilized in big data environment.

  • PDF

새로운 금융기술을 활용한 중소기업 금융접근성 제고 사례

  • Im, Hyo-Jin;Yun, Tae-Ho
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2019.11a
    • /
    • pp.153-155
    • /
    • 2019
  • 최근 국내 외를 불문하고 IT기술의 비약적인 발전에 따라 금융분야에서도 금융과 기술이 결합된 새로운 형태의 금융서비스가 다양하게 개발되고 있다. 그러나, 개인금융시장의 비약적 발전에도 불구하고, 기업금융시장에서의 핀테크 활용은 아직까지 미미한 실정이다. 기업 신용평가는 재무제표 위주의 정태적(static) 과거 정보 위주로 이루어지고 있어 업력이 짧고 규모가 영세한 중소기업의 금융접근에 제약이 존재한다. 또한, 중소기업의 인력이 부족한 상황에서 모든 거래를 일일이 금융기관을 방문하여 처리해야 하는 불편함도 애로사항으로 파악되었다. 이러한 한계를 해소하기 위해 신용보증기금은 빅데이터 활용과 비대면 채널에 주목하였다. 본 보고서는 신용보증기금이 빅데이터와 비대면 채널을 활용하여 중소기업의 금융접근성을 향상시킨 사례에 대하여 소개하고자 한다. 첫 번째로, 신보는 기존에 활용되지 못한 동태적(dynamic) 빅데이터를 활용하여 기업의 현재 새로운 신용평가모형을 개발하였다. 두 번째로, 신보는 중소기업의 금융거래 편의성 향상을 위해 비대면 금융업무 플랫폼을 도입하였다. 신보는 이를, 데이터 수집이 체계적이고 정교해야 하며, 중소기업 관련 데이터가 공유되어야 한다는 정책적 시사점을 발견하였다. 이러한 정책적 시사점을 바탕으로 신보는 이제 기업 데이터 뱅크(Data Bank)로서의 역할을 도모하고 있으며, 더 나은 기업정보 생태계를 구현하고자 한다. 이를 통해 신보의 신기술을 활용한 중소기업 금융접근성 제고 사례가 핀테크를 활용한 공공기관의 금융정책 수립에 유용한 사례가 될 수 있을 것으로 기대한다.

  • PDF

Suggestions on how to convert official documents to Machine Readable (공문서의 기계가독형(Machine Readable) 전환 방법 제언)

  • Yim, Jin Hee
    • The Korean Journal of Archival Studies
    • /
    • no.67
    • /
    • pp.99-138
    • /
    • 2021
  • In the era of big data, analyzing not only structured data but also unstructured data is emerging as an important task. Official documents produced by government agencies are also subject to big data analysis as large text-based unstructured data. From the perspective of internal work efficiency, knowledge management, records management, etc, it is necessary to analyze big data of public documents to derive useful implications. However, since many of the public documents currently held by public institutions are not in open format, a pre-processing process of extracting text from a bitstream is required for big data analysis. In addition, since contextual metadata is not sufficiently stored in the document file, separate efforts to secure metadata are required for high-quality analysis. In conclusion, the current official documents have a low level of machine readability, so big data analysis becomes expensive.

Domestic Market and Economic Impact of the Re-use of PSI(Public Sector Information) (공공정보 민간활용 시장 및 파급효과)

  • Heo, P.S.;Park, G.M.;Park, W.J.;Cho, G.S.;Ryu, W.
    • Electronics and Telecommunications Trends
    • /
    • v.28 no.4
    • /
    • pp.118-131
    • /
    • 2013
  • 최근 과학 및 IT 패러다임은 HW(과거) 및 SW(현재) 중심에서 '데이터 빅뱅'을 활용하여 정치 사회 경제 등 제반 이슈와 연계된 분석 예측으로 진화 중이다. 국가안전 및 위험관리, 의료, 교육, 복지, 환경 등 사회 전반에 걸쳐 공공부문에서의 빅데이터 활용 가능성이 높아지고 있다. 공공정보 자체뿐만 아니라 민간정보와의 통합 분석을 통해 효과적인 맞춤형 정책과 새로운 지식정보 서비스 제공이 가능하기 때문에 주요 선진국은 공공정보의 적극 활용을 위해 다양한 정책을 경쟁적으로 추진해 오고 있다. 공공정보의 민간활용 촉진은 정보 제공자인 공공기관뿐만 아니라, 이를 활용하는 민간 사업자, 관련 서비스 사용자 모두에게 경제적 비경제적 가치를 제공할 수 있다. 따라서, 본 연구를 통해 국내 공공정보 민간활용 산업의 경제적 파급효과를 추정하고, 중요한 전 후방 연결 산업들을 파악하고자 한다.

  • PDF

A Case Study of Basic Data Science Education using Public Big Data Collection and Spreadsheets for Teacher Education (교사교육을 위한 공공 빅데이터 수집 및 스프레드시트 활용 기초 데이터과학 교육 사례 연구)

  • Hur, Kyeong
    • Journal of The Korean Association of Information Education
    • /
    • v.25 no.3
    • /
    • pp.459-469
    • /
    • 2021
  • In this paper, a case study of basic data science practice education for field teachers and pre-service teachers was studied. In this paper, for basic data science education, spreadsheet software was used as a data collection and analysis tool. After that, we trained on statistics for data processing, predictive hypothesis, and predictive model verification. In addition, an educational case for collecting and processing thousands of public big data and verifying the population prediction hypothesis and prediction model was proposed. A 34-hour, 17-week curriculum using a spreadsheet tool was presented with the contents of such basic education in data science. As a tool for data collection, processing, and analysis, unlike Python, spreadsheets do not have the burden of learning program- ming languages and data structures, and have the advantage of visually learning theories of processing and anal- ysis of qualitative and quantitative data. As a result of this educational case study, three predictive hypothesis test cases were presented and analyzed. First, quantitative public data were collected to verify the hypothesis of predicting the difference in the mean value for each group of the population. Second, by collecting qualitative public data, the hypothesis of predicting the association within the qualitative data of the population was verified. Third, by collecting quantitative public data, the regression prediction model was verified according to the hypothesis of correlation prediction within the quantitative data of the population. And through the satisfaction analysis of pre-service and field teachers, the effectiveness of this education case in data science education was analyzed.

A management information system for beauty business based on social influencer marketing using hot topic (핫토픽을 이용한 소셜 인플루언서 마케팅 기반의 뷰티 경영정보시스템)

  • Song, Je-o;Cho, Jung-Hyun;Choi, Do-Jin;Yoo, Jae-Soo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.01a
    • /
    • pp.207-210
    • /
    • 2018
  • 인플루언서(Influencer)란 소셜 미디어에서 유난히 많은 영향력과 파급효과를 가지고 오는 사람들을 말하며, 이들이 만들어내는 콘텐츠는 이제는 자신들의 브랜딩을 넘어선 커머스(Commerce) 효과를 발휘하고 있다. 본 논문에서는 소셜 웹 그리고 공공데이터를 중심으로 뷰티 빅데이터와 방송 콘텐츠 빅데이터를 수집하고 분석하여 상호 상관성에 기반하여 화장품 관련 기업에서 CRM(Customer Relation Management), PLM(Product Lifecycle Management, SCM(Supply Chain Management System) 등의 경영정보시스템과 연계한 뷰티 분야에 최적화된 통합 경영정보시스템을 제안한다.

  • PDF

Private information protection method and countermeasures in Big-data environment: Survey (빅데이터 환경에서 개인민감정보 보호 방안 및 대응책: 서베이)

  • Hong, Sunghyuck
    • Journal of the Korea Convergence Society
    • /
    • v.9 no.10
    • /
    • pp.55-59
    • /
    • 2018
  • Big-data, a revolutionary technology in the era of the 4th Industrial Revolution, provides services in various fields such as health, public sector, distribution, marketing, manufacturing, etc. It is very useful technology for marketing analysis and future design through accurate and quick data analysis. It is very likely to develop further. However, the biggest problem when using Big-data is privacy and privacy. When various data are analyzed using Big-data, the tendency of each user can be analyzed, and this information may be sensitive information of an individual and may invade privacy of an individual. Therefore, in this paper, we investigate the necessary measures for Personal private information infringement that may occur when using Personal private information in Big-data environment, and propose necessary Personal private information protection technologies to contribute to protection of Personal private information and privacy.

Service-oriented Public Organizations and Human Resources Based on Enterprise-wide Big Data (전사적 빅데이터를 활용한 서비스 중심적 공공 조직 및 인사 관리 방안)

  • Jeonghee Choi;Seunguk Park
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.361-362
    • /
    • 2023
  • 본 연구는 공공 조직 및 인사 관리의 새로운 패러다임으로서 서비스 중심적 접근법을 제시하였다. 특히 코로나19 팬데믹 이후의 불확실하고 경쟁적인 환경에서는 파편화된 데이터를 마이크로 서비스화하고 동적으로 재조합하는 것이 중요하며, 이를 실현하기 위한 모델로 KISTI의 ScienceON API Gateway와 시나리오 활용 서비스를 참고하였다. 이러한 접근법은 조직 및 인사 관리의 투명성과 효율성을 높이며, 서비스-이용자 간 상호작용을 강화하고, 조직의 변화를 촉진하는 데 기여할 것으로 기대된다.

빅데이터 기반 대용량 시맨틱 웹 검색 기술 동향

  • Yun, Seok-Chan;Nam, Gung-Hyeon;Yang, Seong-Gwon;Kim, Hong-Gi
    • Information and Communications Magazine
    • /
    • v.29 no.11
    • /
    • pp.24-29
    • /
    • 2012
  • 시맨틱 웹 기술은 웹의 초창기부터 다양한 연구와 표준이 개발되었지만 이를 활용한 데이터 서비스 분야는 그 역사에 비해 성공 사례가 부족한 것이 현실이다. 최근 웹 2.0을 시초로 링크드 데이터의 성장, 정부의 개방형 데이터 서비스, 소셜 웹 서비스의 등장으로 인해 웹의 구조적 데이터는 폭발적으로 성장해 왔으며, 대용량 시맨틱 웹 기반 서비스에 대한 요구와 연구가 진행되고 있다. 본 고에서는 킬러 애플리케이션으로서 기존 시맨틱 웹 기반 검색 기술의 문제점들을 알아보고 이를 해결하기 위해 최근 화두로 떠오르는 빅데이터(Big Data) 기술 요소인 하둡(Hadoop) 및 NoSQL을 활용하여 대용량 시맨틱 웹 데이터를 활용한 Daum의 영화/음악/인물 기반 의미 검색 및 의학 LOD를 기반한 검색 서비스 개발 사례를 제시한다. 이를 토대로 이종 모델 데이터간 연결 및 실시간 데이터 리비전 관리 등 한계점들을 살펴보고 향후 대용량 공공 데이터 활용을 위한 방향을 모색해 본다.