• 제목/요약/키워드: Data dictionary

검색결과 346건 처리시간 0.027초

분산객체 환경에서의 워크플로우 관리를 위한 정보저장소 (A Repository for Workflow Management on Distributed Object Environment)

  • 염태진;박재형;리자;김기봉;진성일
    • 한국전자거래학회지
    • /
    • 제4권1호
    • /
    • pp.1-19
    • /
    • 1999
  • Workflow management system provides automation of job processes by maintaining shareability on information about various job process schedules and persons related to those schedules. Existing workflow management systems use file or database to store the information generated in those systems. However, file or database system could manage only non-complicated information for the workflow but not the information resources of an enterprise which is complicated and of various formats. Therefore, we need a data management system that could control those information resources. This system should manage the data which are distributed at several places geographically. Information Repository could meet those requirements. Information Repository may integrate, store and manage information resources requested by application systems. We have an international standard for the information repository, Information Resources Dictionary System(IRDS). The IRDS, however, does not support distributed environment. In this paper, we design and implement an information repository based on IRDS that may be operated in distributed environment. We verify that this information repository is more effective and is more effective than any other file or database system.

  • PDF

효율적인 한글 탐색을 위한 CB 트라이의 재구성 (Reconstitution of CB Trie for the Efficient Hangul Retrieval)

  • 정규철
    • 융합보안논문지
    • /
    • 제7권4호
    • /
    • pp.29-34
    • /
    • 2007
  • 본 논문에서는 CB 트라이의 단점을 보완한 RCB 트라이를 제안한다. 먼저 CB 트라이의 경우 처음으로 축약된 구조를 시도하였으나 데이터의 양이 증가함에 따라 트리의 균형을 맞추기 위해 사용되는 더미노드들로 인해 삽입에 상당한 어려움을 가지고 있다. 반면 계층적으로 표현한 HCB 트라이는 map이 오른쪽으로 증가하는 것을 막기 위해 일정 깊이를 주어 깊이에 다다르면 새로운 트리를 만들어 연결시키는 방법을 이용하였다. 결과적으로 입력과 검색 속도를 상당히 빠르게 진전시킬 수 있었으나 CB 트라이와 마찬가지로 더미노드를 사용하고 여러 트리의 링크를 사용하기 때문에 저장공간이 커지는 단점을 안고 있다. 본 논문에서 제안한 RCB 트라이는 더미노드를 완전히 없애 성능이 60% 향상되었다.

  • PDF

4차 산업혁명 시대의 에듀테크 (Edutech in the Era of the 4th Industrial Revolution)

  • 박지수;길준민
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권11호
    • /
    • pp.329-331
    • /
    • 2020
  • 에듀테크는 교육(Education)과 기술(Technology)의 합성된 단어로서, 4차 산업혁명 시대의 교육 패러다임이다. 이는 4차 산업혁명의 빅데이터(Bigdata), 인공지능(AI), 로봇, 가상현실(Virtual reality; VR) 등 정보통신기술(ICT)을 활용한 차세대 교육을 의미한다. ICT에서의 교육은 온라인 강의로 이러닝(e-Learning)이 사용되고 있으나, 코로나-19로 인해 비대면 교육에 대한 수유가 급증함에 따라 이러닝과 함께 에듀테크가 주목받고 있다. 따라서 본 논문에서는 블록체인 기반의 배지서비스 플랫폼, 시뮬레이션 기반 협동형 이러닝 시스템, 동영상 영어사전, 그리고 블록체인 기반의 접근제어 감사시스템에 대한 심사 완료된 논문들을 분석한다.

Operational Experience in DB "TERMIN"

  • Shaburova, Natalya N.
    • Journal of Information Science Theory and Practice
    • /
    • 제7권3호
    • /
    • pp.21-30
    • /
    • 2019
  • Information about the formation and filling (in 2014 to 2016) of a terminological dictionary on electronics and radioengineering and collective work (in 2017 to 2018) with a data bank "TERMIN" is presented in this article. In purpose of creating an instrument of navigating the modern scientific-technical space a net of terms with set semantic links is described. This set is based on the analysis of terms' definitions (each term is checked for inclusion in the definitions of all other terms; the definitions were borrowed from reputable reference editions: encyclopedias, dictionaries, reference books). The created model of a system that consists of different information sources, in which it (information) is indexed by the terminology of Russian State Rubricator of Scientific and Technical Information rubrics and/or keywords, is described. There is an access for the search in all these sources in the system. Searching inquiries are referred to in the language of these rubrics or formulated by arbitrary terms. The system is to refer to information sources and give out relevant information. In accordance with this model, semantic links of various types, which allow expanding a search at different modalities of query, should be set among data bank terms. Obtained links will have to increase semantic matching, i.e., they can provide actual understanding of the meaning of the information that is being sought.

정치 도메인에서 신조어휘의 효과적인 추출 및 의미 분석에 대한 연구 (Study on Effective Extraction of New Coined Vocabulary from Political Domain Article and News Comment)

  • 이지현;김재홍;조예성;이민구;최혜봉
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.149-156
    • /
    • 2021
  • 정치적 사안에 대한 대중의 의견과 인식을 객관적으로 이해하기 위한 방법으로 텍스트 마이닝을 통한 빅데이터 분석을 수행할 수 있다. 기존 어휘 사전에 기반한 텍스트 마이닝 알고리즘은 신조어와 같이 사전에 수록되지 않은 어휘를 분석하는데 한계가 나타난다. SNS를 통해 나타나는 사용자들의 의견은 많은 경우 신조어와 비속어를 포함하는데, 이러한 어휘들을 효과적으로 분석하지 못한다면 정확한 대중의 인식과 의견을 파악하기 어렵게 된다. 본 논문은 정치 섹션의 뉴스 댓글로부터 정치적 의미성을 지니는 신조어와 비속어를 효과적으로 추출하는 방법을 제안하고, 추출한 신조어휘들의 의미와 맥락을 이해하기 위한 다양한 방법을 제시하였음.

맵리듀스를 이용한 통계적 접근의 감성 분류 (Statistical Approach to Sentiment Classification using MapReduce)

  • 강문수;백승희;최영식
    • 감성과학
    • /
    • 제15권4호
    • /
    • pp.425-440
    • /
    • 2012
  • 인터넷의 규모가 커지면서 주관적인 데이터가 증가하였다. 이에 주관적인 데이터를 자동으로 분류할 필요가 생겼다. 감성 분류는 데이터를 여러 감성 종류에 따라 나누는 것을 말한다. 감성 분류 연구는 크게 자연어 처리와 감성어 사전 구축을 중심으로 이루어져 왔다. 이전의 감성 분류 연구는 자연어 처리 과정에서 형태소 분석이 제대로 이루어지지 않는 문제와 감성어 사전구축 시 등록할 단어를 선별하고 단어의 감성 정도를 정하는 데에 명확한 기준을 정하기 힘든 문제가 있다. 이러한 어려움을 해결하기 위하여 감성 분류에 대용량 데이터와 통계적 접근의 조합을 제안한다. 본 논문에서 제안하는 방법은 단어의 의미를 찾는 대신 수많은 데이터에서 등장하는 표현들의 통계치를 이용하여 감성 판단을 하는 것이다. 이러한 접근은 자연어 처리 알고리즘에 의존하던 이전 연구와 달리 데이터에 집중한다. 대용량 데이터 처리를 위해 하둡과 맵리듀스를 이용한다.

  • PDF

웰니스를 위한 빅데이터 분석과 의료 질 관리 (The Big Data Analysis and Medical Quality Management for Wellness)

  • 조영복;우성희;이상호
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권12호
    • /
    • pp.101-109
    • /
    • 2014
  • 의학기술의 발전과 소득수준의 증가로 "건강하게 오래살기"에 관심이 높아지면서 적극적으로 건강을 증진하고 유지하는 웰니스가 확대되고 있다. 또한 맞춤형 의료서비스에 대한 수요가 증가하고 방대한 의료 빅 데이터를 이용한 질병 예방의 움직임도 나타나고 있다. 이 논문에서는, 의료 시장에서 주요 관심분야로 부각되고 있는 웰니스를 지원하기위해 빅 데이터 기반의 의료 질 향상을 통한 환자중심의 의료서비스를 목적으로 한다. 환자를 약물에 의존적으로 치료만 하는 것이 아니라 식생활 개선을 기반으로 질병예방과 치료를 위해 빅데이터를 분석한다. 개인 트윗터를 분석해서 일상생활정보를 획득하고 웰니스 사전을 기반으로 질병예방과 치료를 목적으로 한다. 효율적인 빅데이터 분석을 위해 하둡노드를 증가하면서 데이터 처리시간을 실험하였다. 실험결과 저장시간의 경우 63%, 데이터 통합의 경우 18%, 전체 테스트 시간을 기준으로 26%로 하나의 노드로 처리하는 경우보다 세 개의 노드로 처리하는 것이 효율적임을 실험을 통해 확인하였다.

Topological Data Analysis 기법을 활용한 호텔 리뷰데이터의 감성 키워드 기반 호텔 관계망 구축 (Identification of sentiment keywords association-based hotel network of hotel review using mapper method in topological data analysis)

  • 전예슬;김정재
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.75-86
    • /
    • 2020
  • 호텔 리뷰 데이터에는 소비를 이끈 구매 요인, 호텔에 대한 장점 및 단점 등 다양한 정보를 추출할 수 있다. 특히, 리뷰 데이터의 감성 키워드는 소비자들이 호텔에 관해 이야기하고 있는 평가 및 반응 등의 주요 내용을 파악하는 데 도움을 준다. 하지만 많은 양의 리뷰 데이터를 소비자가 직접 살펴보기에는 효율성이 떨어진다. 이를 위해 리뷰 데이터를 요약하는 기술이 요구된다. 본 연구에서는 기존의 감성 키워드 관계망을 구축하는 연구에 더 나아가, 이와 관련된 호텔에 대한 정보까지 동시에 제공하고자 한다. 이를 위해 호텔 도메인에 적합한 감성 키워드 사전을 구축하고, 이를 바탕으로 위상학적 데이터 분석 기반의 맵퍼(topological data analysis based mapper)를 통해서 감성 키워드 기반의 호텔 관계망을 구축한다. 구축된 관계망을 통해 유사한 감성을 기반으로 연결된 호텔들을 살펴볼 수 있으며 동시에, 호텔에 대한 감성 정보도 파악할 수 있다. 이러한 리뷰 요약 정보는 사용자들에게 호텔들에 대한 요약된 감성 평가를 제공하며, 호텔 마케팅 및 전략 기획팀에 분석 대상에 대한 소비자들의 인식을 파악할 수 있도록 돕는다.

XMDR을 이용한 데이터웨어하우스 실시간 데이터 정제 시스템 설계 (Design of DatawareHouse Real-Time Cleansing System using XMDR)

  • 송홍율;정계동;최영근
    • 한국정보통신학회논문지
    • /
    • 제14권8호
    • /
    • pp.1861-1867
    • /
    • 2010
  • 데이터웨어하우스는 기업에서 의사결정이나 기업의 정책을 결정하는데 사용하고 있다. 그러나 분산 환경에서 새로운 시스템이 추가되면 데이터 통합 측면에서 시스템간의 여러 가지 이질적인 특성으로 인해 많은 비용과 시간이 필요로 하게 된다. 따라서 이러한 이질적인 특성을 해결하기 위해 첫째, 데이터 구조의 이질성은 표준기관에서 제정한 표준스키마와 XMDR(eXtended Master Data Registry)를 이용하여 추상화된 쿼리를 생성하고, XMDR에 맞게 쿼리를 분리함으로써 구조적인 이질성을 해결한다. 둘째, 데이터 정의 및 표현의 이질성은 메타데이터에 대한 유사어와 데이터 값의 표현 방식을 정의한 메타데이터 사전을 이용함으로써 해결한다. 특히 본 논문에서는 XMDR을 이용하여 분산 시스템 통합시 로컬시스템의 영향을 최소화하고, 데이터웨어하우스의 정보를 실시간으로 생성하기 위해 분산된 환경에서 데이터 통합을 위한 표준화된 정보를 제공한다.

엔티티 간의 관계명을 생성하는 알고리즘: 반자동화된 스키마 통합 (An Algorithm for Finding a Relationship Between Entities: Semi-Automated Schema Integration Approach)

  • 김용찬;박진수;서지혜
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.243-262
    • /
    • 2018
  • 데이터 베이스 스키마 통합은 정보 시스템에서 매우 중요한 이슈이다. 스키마 통합은 시간과 노력이 상당히 많이 필요하기 때문에 그동안 많은 연구들은 자동화된 스키마 통합 시스템을 구축하기 위해 노력했다. 하지만 지금까지의 연구에서는 XML을 소스 스키마로 사용하고 여전히 많은 부분을 데이터 베이스 관리자의 개입이 필요하도록 남겨두었다. 예를 들면, 스키마 통합 시 발생하는 관계명 명칭 충돌과 같은 문제는 데이터 베이스 관리자가 직접 개입하여야 해결할 수 있었다. 이 논문에서는 스키마 통합 시 발생하는 관계명 명칭 충돌을 해결하기 위해 관계명을 자동으로 생성해주는 알고리즘을 소개한다. 이 알고리즘은 인터넷 연어(Collocation) 사전과 영어 예문을 기반으로 한다. 사전 데이터를 기반으로 하여 추출한 예문들을 자연어처리 과정을 통해 분석한 후 두 엔티티 사이의 관계명을 생성한다. 반자동화된 스키마 통합 시스템을 구축하여 이 알고리즘을 테스트해보았으며 그 결과 약 90%의 정확도를 나타냈다. 이 알고리즘을 적용하면 스키마 통합 시에 데이터 베이스 관리자의 개입을 최소화할 수 있으며 이는 자동화된 스키마 통합 시스템을 구축하는 데에 큰 도움이 될 것이다.