• 제목/요약/키워드: Text-to-SQL

검색결과 25건 처리시간 0.023초

A Study on the DB-IR Integration: Per-Document Basis Online Index Maintenance

  • Jin, Du-Seok;Jung, Hoe-Kyung
    • Journal of information and communication convergence engineering
    • /
    • 제7권3호
    • /
    • pp.275-280
    • /
    • 2009
  • While database(DB) and information retrieval(IR) have been developed independently, there have been emerging requirements that both data management and efficient text retrieval should be supported simultaneously in an information system such as health care, customer support, XML data management, and digital libraries. The great divide between DB and IR has caused different manners in index maintenance for newly arriving documents. While DB has extended its SQL layer to cope with text fields due to lack of intact mechanism to build IR-like index, IR usually treats a block of new documents as a logical unit of index maintenance since it has no concept of integrity constraint. However, In the DB-IR integrations, a transaction on adding or updating a document should include maintenance of the posting lists accompanied by the document. Although DB-IR integration has been budded in the research filed, the issue will remain difficult and rewarding areas for a while. One of the primary reasons is lack of efficient online transactional index maintenance. In this paper, performance of a few strategies for per-document basis transactional index maintenance - direct index update, pulsing auxiliary index and posting segmentation index - will be evaluated. The result shows that the pulsing auxiliary strategy and posting segmentation indexing scheme, can be a challenging candidates for text field indexing in DB-IR integration.

확장성을 고려한 Asterisk 기반 인터넷 전화 관리 방법 (A Scalable Management Method for Asterisk-based Internet Telephony System)

  • 하은용
    • 디지털융복합연구
    • /
    • 제12권8호
    • /
    • pp.235-242
    • /
    • 2014
  • 인터넷 전화망은 VoIP기술을 이용해서 음성 전화를 지원하는 인터넷 서비스다. 인터넷 전화는 영상통화, 메시징과 같은 인터넷 멀티미디어 서비스를 융합한 서비스를 지원할 수 있는 장점을 갖고 있다. 본 논문은 Asterisk를 기반으로 구축한 인터넷 전화망의 확장성을 고려한 효율적인 관리 방법을 제안한다. 기존 시스템은 SIP 사용자, 다이얼플랜, CDR, IVR 및 서버 연동 등의 기능을 관리하기 위해 텍스트 파일 형식의 설정 파일을 사용하였다. 본 논문은 관리의 효율성과 확장성을 위해서 DB 기반으로 여러 기능을 수행할 수 있는 관리시스템을 설계 구현하였고, 전반적인 관리를 웹을 통해서 할 수 있도록 Apache, MySQL, jQuery와 PHP 등의 오픈 소스 소프트웨어를 사용하여 구현하였다.

A Technical Approach for Suggesting Research Directions in Telecommunications Policy

  • Oh, Junseok;Lee, Bong Gyou
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권12호
    • /
    • pp.4467-4488
    • /
    • 2014
  • The bibliometric analysis is widely used for understanding research domains, trends, and knowledge structures in a particular field. The analysis has majorly been used in the field of information science, and it is currently applied to other academic fields. This paper describes the analysis of academic literatures for classifying research domains and for suggesting empty research areas in the telecommunications policy. The application software is developed for retrieving Thomson Reuters' Web of Knowledge (WoK) data via web services. It also used for conducting text mining analysis from contents and citations of publications. We used three text mining techniques: the Keyword Extraction Algorithm (KEA) analysis, the co-occurrence analysis, and the citation analysis. Also, R software is used for visualizing the term frequencies and the co-occurrence network among publications. We found that policies related to social communication services, the distribution of telecommunications infrastructures, and more practical and data-driven analysis researches are conducted in a recent decade. The citation analysis results presented that the publications are generally received citations, but most of them did not receive high citations in the telecommunications policy. However, although recent publications did not receive high citations, the productivity of papers in terms of citations was increased in recent ten years compared to the researches before 2004. Also, the distribution methods of infrastructures, and the inequity and gap appeared as topics in important references. We proposed the necessity of new research domains since the analysis results implies that the decrease of political approaches for technical problems is an issue in past researches. Also, insufficient researches on policies for new technologies exist in the field of telecommunications. This research is significant in regard to the first bibliometric analysis with abstracts and citation data in telecommunications as well as the development of software which has functions of web services and text mining techniques. Further research will be conducted with Big Data techniques and more text mining techniques.

웹기반에서 애니메이션 기법을 이용한 학습평가 시스템 설계 및 구현 (Design and Implementation of Learning And Testing System using Animation Technique based on Web)

  • 원미해;김창수;정신일
    • 한국정보통신학회논문지
    • /
    • 제5권2호
    • /
    • pp.269-278
    • /
    • 2001
  • 대부분의 전자계산실무 교과 학습 관련 사이트들이 Text 위주의 나열식 학습평가가 대부분이나 본 논문에서는 빠른 속도로 출현하는 새로운 응용 프로그램의 활용을 필요로 하는 상업학교의 전자계산실무 교과목에 적용되는 학습평가를 웹을 기반으로 하여 이론과 실습을 교실에서 교사와 학생이 같이 수업을 하는 것처럼 WWW에서 애니메이션 기법을 이용하여 텍스트와 시각적, 청각적 기능을 포함한 자기주도적인 학습과 이전의 선발이나 배치의 목적으로 사용하기 위해 학습 결과를 양적으로만 측정해 온 것을 개개인의 특성을 고려한 평가 방법인 수준별, 개별화된 질적 평가가 가능하도록 설계 및 구현하였다.

  • PDF

페이로드 임베딩 사전학습 기반의 웹 공격 분류 모델 (Web Attack Classification Model Based on Payload Embedding Pre-Training)

  • 김연수;고영훈;엄익채;김경백
    • 정보보호학회논문지
    • /
    • 제30권4호
    • /
    • pp.669-677
    • /
    • 2020
  • 인터넷 사용자가 폭발적으로 늘어나면서 웹을 이용한 공격이 증가했다. 뿐만 아니라 기존의 방어 기법들을 우회하기 위해 공격 패턴이 다양해졌다. 전통적인 웹 방화벽은 알져지지 않은 패턴의 공격을 탐지하기 어렵다. 따라서 인공지능으로 비정상을 탐지하는 방식이 대안으로 연구되고 있다. 특히 공격에 악용되는 스크립트나 쿼리가 텍스트로 이루어져 있다는 이유로 자연어 처리 기법을 적용하는 시도가 일어나고 있다. 하지만 스크립트나 쿼리는 미등록 단어(Unknown word)가 다량 발생하기 때문에 자연어 처리와는 다른 방식의 접근이 필요하다. 본 논문에서는 BPE(Byte Pair Encoding)기법으로 웹 공격 페이로드에 자주 사용되는 토큰 집합을 추출하여 임베딩 벡터를 학습시키고, 주의 메커니즘 기반의 Bi-GRU 신경망으로 토큰의 순서와 중요도를 학습하여 웹 공격을 분류하는 모델을 제안한다. 주요 웹 공격인 SQL 삽입 공격, 크로스 사이트 스크립팅, 명령 삽입 공격에 대하여 분류 평가 결과 약 0.9990의 정확도를 얻었으며, 기존 연구에서 제안한 모델의 성능을 상회하는 결과를 도출하였다.

리눅스 기반의 인터넷 원격 교육 시스템 개발-교재 설계 모듈을 중심으로 (A the internet distance education system development of the LINUXBASED subtitle - A the center of textbook design module)

  • 성평식
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권2호
    • /
    • pp.141-150
    • /
    • 2001
  • 본 논문은 인터넷을 통해 개발이 이루어진 운영체제로서 네트워크 지원에 관련된 기능이 매우 우수한 리눅스 TUI (Text user interface)/GUI(Graphic user Interface) 환경에서 개발된 원격 교육을 위한 교재 설계 및 저작 모듈의 전반전인 개발 원리와 세부 시스템의 알고리듬을 소개하고자 한다. 리눅스는 지원하는 네트워크 프로토콜(Protocol) 이 다양하여 TCP/IP는 물론 다른 프로토콜 지원으로 많은 이 기종들과 네트워크 상에서 원활한 네트워크 자원을 공유할 수 있으므로 기존의 Windows NT와의 용이한 integration은 물론이고 Windows NT나 Windows 2000 에 비해서 낮은 사양의 하드웨어 환경으로도 높은 수준의 서비스를 제공할 수 있으므로 예산에 많은 제약을 받고 있는 학교 교육 환경에 가장 적합한 네트워크 운영 시스템이라고 할 수 있다. 원격 교육시스템의 개발 환경은 웹서버는 아파치 서버를, 교재 설계와 저작 모듈을 위한 응용프로그램은 component 기반의 Java bean을, 웹개발 즉 HTML 문서는 PHP를, DBMS 는 MySQL 서버를 사용하고 있다.

  • PDF

DBMS의 웹서비스를 이용한 학습객체 메타데이터 추출 및 통합에 관한 연구 (A Study on the Extraction and Integration of Learning Object Meta-data using Web Service of Databases)

  • 최현종
    • 정보교육학회논문지
    • /
    • 제7권2호
    • /
    • pp.199-206
    • /
    • 2003
  • XML은 데이터 관리와 표현의 유연성으로 인해 웹의 새로운 개발 도구로 자리를 잡아가고 있으며, 컴퓨터 교육에서는 학습객체라는 많은 웹 컨텐츠들을 통합하는 도구로도 사용되고 있다. 하지만 학습객체를 통합하고 관리하는 온라인 학습 시스템을 구현하기에 앞서, 구현 시스템에서 학습객체를 처리하기 위한 메타데이터를 어떻게 저장하고 추출 및 통합하느냐의 연구가 선행되어져야 한다. 따라서 본 연구에서는 3-tier 방식의 온라인 학습 시스템과 메타데이터가 저장된 데이터베이스 서버를 구현할 때 필요한 메타데이터 추출방법의 하나로 DBMS의 웹서비스를 이용하는 방법을 제안하고자 한다. 제안된 방법의 효율성 측정을 위해 MS SQL Server 2000과 Oracle 9i를 대상으로 30여개의 샘플 메타데이터를 저장하고, 이를 추출하는 응답시간을 측정해 보았다. 이 방법을 사용하기 위해서는 추출된 메타데이터를 DOM/SAX 와 같은 XML 처리 파서가 필요하지만, 측정된 결과 비교적 빠른 응답시간을 보여 데이터베이스에 저장된 메타데이터를 추출하고 통합하는 한 방법으로 충분히 사용할 수 있다는 결과를 얻었다.

  • PDF

리눅스 기반의 인터넷 원격 교육 시스템 개발 -교재 설계 모듈을 중심으로-

  • 성평식;박춘원
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2000년도 추계공동학술대회논문집
    • /
    • pp.635-645
    • /
    • 2000
  • 본 논문은 인터넷을 통해 개발이 이루어진 운영체제로서 네트워크 지원에 관련된 기능이 매우 우수한 리눅스 TUI (Text User Interface)/GUI(Graphic User Interface) 환경에서 개발된 원격 교육을 위한 교재 설계 및 저작 모들의 전반전인 개발 원리와 세부 시스템의 알고리듬을 소개하고자 한다. 리눅스는 지원하는 네트워크 프로토콜(Protocol)이 다양하여 TCP/IP 는 물론 다른 프로토콜 지원으로 많은 이 기종들과 네트워크 상에서 원활한 네트워크 자원을 공유할 수 있으므로 기존의 Windows NT와의 용이한 integration은 물론이고 Windows NT 나 Windows 2000 에 비해서 낮은 사양의 하드웨어 환경으로도 높은 수준의 서비스를 제공할 수 있으므로 예산에 많은 제약을 받고 있는 학교 교육환경에 가장 적합한 네트워크 운영 시스템이라고 할 수 있다. 원격 교육시스템의 개발 환경은 웹서버는 아파치 서버를, 교재 설계와 저작 모듈을 위한 응용프로그램은 component 기반의 Java bean을, 웹 개발 즉 HTML 문서는 PHP를, OBMS 는 MySQL 서버를 사용하고 있다.

  • PDF

바다-$IV/I^2R$: 고차원 이미지 색인 구조를 이용한 효율적인 내용 기반 이미지 검색 시스템의 설계와 구현 (BADA-$IV/I^2R$: Design & Implementation of an Efficient Content-based Image Retrieval System using a High-Dimensional Image Index Structure)

  • 김영균;이장선;이훈순;김완석;김명준
    • 한국정보처리학회논문지
    • /
    • 제7권2S호
    • /
    • pp.678-691
    • /
    • 2000
  • A variety of multimedia applications require multimedia database management systems to manage multimedia data, such as text, image, and video, as well as t support content-based image or video retrieval. In this paper we design and implement a content-based image retrieval system, BADA-IV/I$^2$R(Image Information Retrieval), which is developed based on BADA-IV multimedia database management system. In this system image databases can be efficiently constructed and retrieved with the visual features, such as color, shape, and texture, of image. we extend SQL statements to define image query based on both annotations and visual features of image together. A high-dimensional index structure, called CIR-tree, is also employed in the system to provide an efficient access method to image databases. We show that BADA-IV/I$^2$R provides a flexible way to define query for image retrieval and retrieves image data fast and effectively: the effectiveness and performance of image retrieval are shown by BEP(Bull's Eye Performance) that is used to measure the retrieval effectiveness in MPEG-7 and comparing the performance of CIR-tree with those of X-tree and TV-tree, respectively.

  • PDF

자연어 기반 온톨로지 질의 모듈 연구 (A Study on the Ontology Query Module based on Natural Language)

  • 김원필;공현장
    • 전자공학회논문지CI
    • /
    • 제47권1호
    • /
    • pp.146-151
    • /
    • 2010
  • 온톨로지 내의 효율적 정보 탐색을 위한 질의 처리 부분은 온톨로지 응용의 측면에서 반드시 해결되어야 할 부분이다. 기존의 온톨로지에 대한 질의 처리 시스템은 온톨로지에 표현된 사실만을 분석하여, 단순 구조적 사실 정보만을 사용자에게 제공 함으로써 데이터베이스 시스템 및 텍스트 기반 정보처리 시스템과 크게 다른 점이 없었다. 사실상, 기존의 온톨로지 질의 시스템들에서 사용하고 있는 질의 언어의 구조나 형식이 데이터베이스 시스템의 질의 언어(SQL)에 모태를 두고 있으므로, 온톨로지와 데이터베이스의 질의 처리 및 그 결과는 거의 동일하다. 이에 본 연구에서는 온톨로지 사용의 효율성을 극대화하기 위해 온톨로지에 대한 단순 질의 처리가 아닌, 추론 규칙에 기반한 추론된 사실들을 모두 처리할 수 있는 온톨로지 추론 및 질의에 대한 통합 시스템 개발의 필요성을 인식하고, 온톨로지에 대한 효율적 질의 처리 방법을 연구하였다.