• 제목/요약/키워드: Big-data Software

검색결과 441건 처리시간 0.03초

Semantic-based Mashup Platform for Contents Convergence

  • Yongju Lee;Hongzhou Duan;Yuxiang Sun
    • International journal of advanced smart convergence
    • /
    • 제12권2호
    • /
    • pp.34-46
    • /
    • 2023
  • A growing number of large scale knowledge graphs raises several issues how knowledge graph data can be organized, discovered, and integrated efficiently. We present a novel semantic-based mashup platform for contents convergence which consists of acquisition, RDF storage, ontology learning, and mashup subsystems. This platform servers a basis for developing other more sophisticated applications required in the area of knowledge big data. Moreover, this paper proposes an entity matching method using graph convolutional network techniques as a preliminary work for automatic classification and discovery on knowledge big data. Using real DBP15K and SRPRS datasets, the performance of our method is compared with some existing entity matching methods. The experimental results show that the proposed method outperforms existing methods due to its ability to increase accuracy and reduce training time.

IT Jobs in the Era of Digital Transformation: Big Data Analytics

  • Ho Lee;Jaewon Choi
    • Asia pacific journal of information systems
    • /
    • 제29권4호
    • /
    • pp.717-730
    • /
    • 2019
  • The era of digital transformation (or the fourth industrial revolution) has been triggered by the rapid development of software (SW) technologies. In this era, several studies suspected rapid changes in job structures occurring around the world. Thus, there is a growing need for acquiring the skill sets required for the future. However, there are no specific studies on how existing jobs are changing. To cope with this ambiguity of job changes, this paper aims to investigate how the current job structure is changing in response to digital transformation. To identify the dynamic nature of job change over time, we conducted an analysis based on job posting data. As a result, nine job occupations and fifteen jobs were found.

Web of Science 빅데이터를 활용한 텍스트 마이닝 기반의 정보윤리 이슈 탐색 (Exploring Information Ethics Issues based on Text Mining using Big Data from Web of Science)

  • 김한성
    • 컴퓨터교육학회논문지
    • /
    • 제22권3호
    • /
    • pp.67-78
    • /
    • 2019
  • 본 연구의 목적은 Web of Science(WoS)에서 제공하는 학술 빅데이터를 활용하여 정보윤리 이슈를 탐색하고 향후 정보과 정보윤리 교육을 위한 시사점을 제공하는 것에 있다. 이를 위해 WoS에서 제공하는 학술논문 중 정보윤리와 관련해 출판된 318편의 논문을 텍스트 마이닝 하였다. 구체적으로는 R을 활용해 주요키워드에 대한 빈도 분석(TF, DF, TF-IDF), 토픽 모델링 기반의 정보윤리 이슈 분석, 그리고 각 이슈에 대한 연도별 출연 빈도를 분석하여 정보윤리 연구의 경향성을 탐색하였다. 주요 결과를 살펴보면 다음과 같다. 첫째, TF-IDF를 통해 'digital', 'student', 'software', 'privacy' 등의 단어가 주요 키워드임을 확인하였다. 둘째, 토픽 모델링 분석 결과, 'Professional value', 'Cyber-bullying', 'AI and Social Impact' 등을 포함한 총 8개 이슈로 분석되었고, 그 중, 'Professional value'와 'Cyber-bullying' 이슈가 상대적으로 높은 비율을 차지하고 있었다. 본 연구는 이러한 분석 결과를 기초로 우리나라 정보윤리 교육을 시사점을 논의하였다.

대량 처리 엔진(ElasticSearch)을 이용한 시스템 및 어플리케이션 성능 모니터링 시스템에 관한 연구 (A Study on System and Application Performance Monitoring System Using Mass Processing Engine(ElasticSearch))

  • 김승천;장희돈
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.147-152
    • /
    • 2019
  • 사물인터넷(IoT), 빅데이터(BigData) 및 인공지능(AI)과 같은 최신 IT 기술로 인터넷 비즈니스가 성장함에 따라 인프라가 빠르게 성장하고 있습니다. 그러나 대부분의 회사에서는 제한된 수의 사람들이 많은 하드웨어와 소프트웨어를 관리해야합니다. 따라서 시스템 운영 상태, IT 서비스 및 주요 핵심성과지표(KPI, Key Performance Indicator)를 모니터링하기 위한 PEMS (Polestar Enterprise Management System)을 적용합니다. 실시간 모니터 스크리닝은 시스템 오작동 및 빠른 응답을 방지합니다. PEMS를 사용하면 IT 하드웨어 및 소프트웨어와 관련된 구성 정보를 한눈에 볼 수 있으며 전체 종단 간 성능을 모니터링하여 문제가 실시간으로 발생하는 시기를 확인할 수 있습니다.

SNS를 이용한 잠재적 광고 키워드 추출 시스템 설계 및 구현 (Design and Implementation of Potential Advertisement Keyword Extraction System Using SNS)

  • 서현곤;박희완
    • 한국융합학회논문지
    • /
    • 제9권7호
    • /
    • pp.17-24
    • /
    • 2018
  • 빅데이터 처리 분야에서 중요한 이슈 중 하나는 인터넷의 주요 키워드를 추출하고 이것을 이용하여 필요한 정보를 가공하는 것이다. 현재까지 제안된 대부분의 키워드 추출 방법들은 대형 포털 사이트의 검색기능을 기반으로 이미 게시된 글이나 작성된 문서 또는 고정된 내용에 기반하고 있다. 본 논문에서는 SNS에 게시되는 다양한 이슈, 대화, 관심 분야, 의견 등 동적인 메시지를 기반으로 이슈 키워드 및 연관 키워드를 추출하여 잠재적 쇼핑 연관 키워드 광고 마케팅에 도움을 주는 시스템(KAES: Keyword Advertisement Extraction System based on SNS)을 개발한다. KAES 시스템은 특정 계정 리스트를 작성하여 SNS에서 빈도수가 가장 많은 핵심 키워드 및 연관 키워드를 추출한다.

최근접 이웃 탐색 기반의 향상된 스카이라인 질의를 위한 전처리 기법 (Nearest Neighbor-based Pre-processing Scheme for Advanced Skyline Query)

  • 김지현;이상민;전형준;진창균;김지윤;권진영;김종완;오덕신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.420-423
    • /
    • 2020
  • 스카이라인 질의는 객체의 속성을 기준으로 사용자의 선호에 적합한 대상을 탐색하는 기법이다. 기존 스카이라인 질의는 일괄처리 방식으로 탐색 결과를 반환하지만 대화형 앱이나 모바일 환경과 같이 잦은 위치이동 발생 시 일괄처리 방식으로 스카이라인 질의 결과를 신속하게 받기 어렵다. 최근접 이웃(Nearest Neighbor) 알고리즘은 사용자와 상호 작용이 필요한 대화형 앱에서 실시간으로 선호 객체를 탐색하여 사용자에게 전달함으로써 객체의 반환 속도를 향상시켰다. 그러나 최근접 이웃 알고리즘은 객체 탐색 과정에서 반복적인 비교 연산을 수행하여 불필요한 탐색 시간이 소요된다. 본 논문은 대화형 앱에서 신속한 스카이라인 결과를 산출하고자 연산 대상 객체의 범위를 축소함으로써 최근접 이웃 스카이라인 질의 알고리즘의 성능을 향상시킨 전처리 기법을 제안한다. 데이터 객체는 최대 40,000 개의 실험에서 제안 기법은 최근접 이웃 알고리즘보다 50% 빠른 성능을 나타내어 본 연구의 가용성이 증명되었다.

메타데이터의 통합을 위한 스키마 매핑 및 데이터 변환 시스템 (Schema Mapping and Data Conversion System for Integrating Article Metadata)

  • 이민호;이원구;최윤수;윤화묵;송사광;정한민
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권10호
    • /
    • pp.129-136
    • /
    • 2012
  • 본 논문에서는 논문 메타 데이터 특성 분석 연구를 토대로 데이터 변환 방법들을 고안하고 스키마 매핑 및 변환시스템을 구현한다. 빅 데이터 분석을 위해서는 다양한 시스템의 데이터베이스에 축적된 데이터를 공통의 형식으로 변환하는데, 현재의 데이터 변환 시스템들은 구문 의존적 문제와 사용의 불편함을 가지고 있다. 본 논문에서 구현된 시스템은 논문 메타데이터 분야에 특화된 시스템으로, 사용하기 쉬운 스키마 매핑 인터페이스를 가지고 있으며 다양한 논문 데이터 구문을 변환할 수 있다. 또한 시스템에 등록되지 않은 새로운 스키마를 가진 데이터가 입력되더라도 시스템의 재 컴파일이 필요 없다. 본 시스템은 사용성 평가를 통하여 시스템 사용성 평균 점수로 89.25점을 받았다.

Data Dictionary 기반의 R Programming을 통한 비정형 Text Mining Algorithm 연구 (A study on unstructured text mining algorithm through R programming based on data dictionary)

  • 이종화;이현규
    • 한국산업정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.113-124
    • /
    • 2015
  • 미리 선언된 구조를 이용하여 수집 저장된 정형적 데이터와는 달리 웹 2.0의 시대에서 일반 사용자들이 평상시에 사용하는 자연어 형태로 작성된 비정형 데이터 분석은 과거보다 훨씬 더 넓은 응용범위를 가지고 있다. 데이터 양이 폭발적으로 증가하고 있다는 특성뿐 만 아니라 인간의 감성이 그대로 표현된 특성을 가진 텍스트에서 의미 있는 정보를 추출하는 빅데이터 분석 기법을 텍스트마이닝(Text Mining)이라 하며 본 연구는 이를 주제로 하고 있다. 본 연구를 위해 오픈 소스인 통계분석용 소프트웨어 R 프로그램을 이용하였으며, 비정형 텍스트 문서를 웹 환경에서 수집, 저장, 전처리, 분석 작업과 시각화(Frequency Analysis, Cluster Analysis, Word Cloud, Social Network Analysis)작업 등의 과정에 관한 알고리즘 구현을 연구하였다. 특히, 연구자의 연구 영역 분석에 초점을 더욱 높이기 위해 Data Dictionary를 참조한 키워드 추출 기법을 사용하였다. 실제 사례에 적용한 R은 다양한 OS 구동, 일반적 언어와의 인터페이스 지원 등 통계 분석용 소프트웨어로써 매우 유용하다는 점을 발견할 수 있었다.

CMMI와 TMMi를 이용한 소프트웨어 Safety 성숙도 모델에 대한 연구 (The Study on the Software Safety Maturity Model using CMMI and TMMi)

  • 이승목;김영곤;안경수
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제16권2호
    • /
    • pp.87-98
    • /
    • 2020
  • 최근 IoT, 인공지능, 클라우드, 빅데이터, 모바일 분야가 융합되어 4차 산업혁명이라는 새로운 산업시대가 도래하였고 전 사업군으로 확대 되었다. 이 중심에는 소프트웨어가 중요한 역할을 담당하고 있지만 다양한 사업군으로 적용, 보편화됨에 따라 소프트웨어 안전에 대한 이슈가 부각되고 있다. 하지만 현재 소프트웨어 Safety는 개발 관점에서만 활동이 집중적으로 맞춰져 있고, 조직적인 개선 활동과 평가 체계 수준에 대해서는 다소 미진하다. 본 연구에서는 이러한 미진사항을 보완하고자 소프트웨어 Safety 성숙도 모델을 정의하고, 각 성숙도 레벨의 Process Area를 명시하였다. 본 연구에서 고안된 Safety 성숙도 모델을 기반으로 조직관점의 Safety 확립과 함께 체계적인 소프트웨어 Safety 개선 활동에 기여할 것으로 기대한다.

빅데이터를 활용한 시니어 행동분석 돌봄 시스템 연구 (A Study on Senior Behavioral Analysis and Care System Using Big Data)

  • 장재열;최진일;어재선;최철재
    • 한국전자통신학회논문지
    • /
    • 제15권5호
    • /
    • pp.973-980
    • /
    • 2020
  • 4차 산업혁명의 기술을 활용한 다양한 응용 솔루션들이 보건 복지 분야에 적용되어지고 있다. 제안한 논문에서는 빅데이터 기반의 시니어 돌봄 시스템 솔루션을 설계한다. 제안 시스템의 작동원리는 시니어의 행동분석을 스마트기기의 API정보를 통하여 수집한 후, 기존의 기준치와 다른 반응을 보일 경우에 시니어 당사자에게 1차적으로 알림을 보낸다. 만일 응답이 없을 경우에는 2차적으로 동료시니어와 가족구성원 및 응급상황센터에 정보를 제공함으로써 위험상황을 미연에 방지할 수 있는 시스템을 제안한다.