• 제목/요약/키워드: query tool

검색결과 98건 처리시간 0.029초

Protein Sequence Search based on N-gram Indexing

  • Hwang, Mi-Nyeong;Kim, Jin-Suk
    • Bioinformatics and Biosystems
    • /
    • 제1권1호
    • /
    • pp.46-50
    • /
    • 2006
  • According to the advancement of experimental techniques in molecular biology, genomic and protein sequence databases are increasing in size exponentially, and mean sequence lengths are also increasing. Because the sizes of these databases become larger, it is difficult to search similar sequences in biological databases with significant homologies to a query sequence. In this paper, we present the N-gram indexing method to retrieve similar sequences fast, precisely and comparably. This method regards a protein sequence as a text written in language of 20 amino acid codes, adapts N-gram tokens of fixed-length as its indexing scheme for sequence strings. After such tokens are indexed for all the sequences in the database, sequences can be searched with information retrieval algorithms. Using this new method, we have developed a protein sequence search system named as ProSeS (PROtein Sequence Search). ProSeS is a protein sequence analysis system which provides overall analysis results such as similar sequences with significant homologies, predicted subcellular locations of the query sequence, and major keywords extracted from annotations of similar sequences. We show experimentally that the N-gram indexing approach saves the retrieval time significantly, and that it is as accurate as current popular search tool BLAST.

  • PDF

질의 응답 학습 도구 개발을 위한 프로세스 (Process for Development of Query-Answer Learning Tool)

  • 김정수;신호준;한은주;김행곤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.391-393
    • /
    • 2002
  • 최근 가상교육에서 학습 기술의 상호 운용성을 기반으로 한 표준화의 필요성을 인식하고 여러 국제표준기관을 통해서 기반 환경과 컨텐트 명세 및 활용에 대한 표준화 작업이 이루어지고 있다. 이로 인해 e-learning 분야에서는 국제표준을 소개하고 체제적으로 AICC(Aviation Industry CBT Committee), IMS(Instructional Management Systems) Global Learning Consortium, ADL(Advanced Distributed Learning)을 중심으로 진행되어 오고 있다. 특히, 미래의 진보적인 e-learning 환경 개발로, 기능별 5계층으로 구성된 LTSA(Learning Technology Standard Architecture)를 제정하고 이를 통한 개발을 지원하고 있다. 하지만, 이는 시스템 구성요소를 정의한 계층 3의 경우 데이터 흐름 모델로 작성되어 현재 개발 수준과 일치하지 않는 문제점을 가지는 모델로 인정한다. 본 논문에서는 표준 모델링 언어인 UML(Unified Modeling Language)을 통해 모델을 재정의하고, 각 프로세스별 단계를 메타모델로 제시하여 개발과 아키텍처의 이해에 대한 문제점을 해결하고자 한다. 또한, 재정의된 모델을 기반으로 e-learning 지원을 위한 분석, 설계 프로세스를 정의하여 이에 대한 사례를 제시한다. 이는 아키텍처를 기반으로 한 메타모델과 프로세스를 통한 교육영역의 질의 응답 학습 도구인 QALT(Query-Answer Learning Tool)에 적용한다. 모델의 재정의로 아키텍처의 이해성 및 이를 기반으로 하는 교육용 애플리케이션 개발의 용이성의 증대를 기대할 수 있으며, 모델의 재사용성을 보장할 수 있다.

  • PDF

복합 이벤트 스트림 질의 처리 성능 개선을 위한 질의 전처리 도구 (A Query Preprocessing Tool for Performance Improvement in Complex Event Stream Query Processing)

  • 최중현;조은선;이강우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권8호
    • /
    • pp.513-523
    • /
    • 2015
  • 복합 이벤트 스트림 처리 시스템(Complex Event Processing System)은 연속적으로 발생하는 이벤트의 스트림을 효율적으로 처리하기 위한 시스템으로써, IoT 시스템에서 처리되는 센서 데이터 등 최근 생활 속에서 그 필요성이 많이 나타나고 있다. 그러나 아직은 질의 처리의 성능에 대해 개발자의 책임으로 돌리고 있는 부분이 있어 이용에 세심한 주의가 요구되고 있다. 그 중 한 예로, 향상된 성능을 가지는 동일한 의미의 질의를 선정하기 위한 충분할 만큼의 안내는 제공되고 있지 않은 상태이다. 본 논문에서는 이벤트 스트림 처리 시스템의 성능 개선을 위한 질의 전처리 도구를 제안한다. 이 도구는 입력된 질의를 분석하여 성능에 나쁜 영향을 미치는 패턴의 질의로 판정 되면, 성능을 향상시킬 수 있는 대안을 제시해줌으로써 개발자들의 스트림 질의 성능에 대한 부담을 덜어주게 된다. 결과적으로 디버깅, 테스팅, 성능 조정의 어려움을 해소하는 데에 도움을 줄 것으로 기대한다.

공작기계 고장 진단 전문가 시스템 개발 (Development of an Expert System for Diagnosing Machine Tool Failures)

  • 서동규;강무진
    • 한국정밀공학회지
    • /
    • 제16권10호
    • /
    • pp.217-224
    • /
    • 1999
  • Trouble shooting of modern machine tools equipped with sophisticated electronic as well as mechanical parts is so difficult that it is usually depends upon the experience and accumulated knowledge of the diagnosing persons. On the other hand, tool users are scattered in wide area, which makes it expensive for a machine tool maker to run a vast service network. An unmanned diagnosis system to which users can have access at all times could be an efficient alternative. For this purpose, a rule-based expert system for diagnosing machine tools is developed. This paper describes the structure of diagnostic knowledge, the rule firing mechanism, the diagnosis flow, and user query process. An example shows the feasibility of problem solving on site without help of a service expert from machine tool maker.

  • PDF

멀티미디어 상연그래프 질의언어와 대수를 이용한 질의처리방법 (A Query Language for Multimedia Presentation Graphs and Query Processing Techniques with Algebra)

  • 이태경
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.185-198
    • /
    • 2000
  • 최근 폭발적인 증가를 보이고 있는 멀티미디어 자료의 양과 그 자료들을 이용할 수 있는 하드웨어의 발전은 멀티미디어 상연물을 이용하는 여러 응용 분야에 대한 관심을 촉발시키고 있다. 이에 멀티미디어 상연물의 효과적인 이용을 위해서는 멀티미디어 상연물과 DBMS와의 통합이 필요하다. 이 논문에서는 내용(content)에 근거한 상연물 검색과 검색 처리 기술의 문제를 다룬다. 현재 멀티미디어 상연물 제작 도구(authoring tool)들은 멀티미디어 상연물을 상연 그래프(presentation graph)를 이용하여 표현하고 있으며 상연 그래프는 DAG(directed acyclic graph)이다. 각 노드는 같은 타입의 미디어 스트림을 나타내며 에지는 스트림간의 상연 순서와 동기화 (synchronization) 방법을 나타낸다. 각각의 스트럼에 포함된 정보, 이 정보들간의 순서, 그리고 스트럼간의 상연 순서는 상연의 내용을 구성한다. GCalculus/S(GCalculus with Set Operators)는 calculus에 바탕을 둔 검색언어이며 멀티미디어 자료들의 물리적 특정과 내용을 다룰 수 있다. 개개의 노드 안에서의 정보의 변화와 노드 사이의 순서는 시간 연산자(temporal operator) Next, Connected, Until을 이용하여 표현한다. 검색의 처리를 위하여 객체 대수(object algebra)인 O-Algebra를 확장한다.

  • PDF

MLPPI Wizard: An Automated Multi-level Partitioning Tool on Analytical Workloads

  • Suh, Young-Kyoon;Crolotte, Alain;Kostamaa, Pekka
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권4호
    • /
    • pp.1693-1713
    • /
    • 2018
  • An important technique used by database administrators (DBAs) is to improve performance in decision-support workloads associated with a Star schema is multi-level partitioning. Queries will then benefit from performance improvements via partition elimination, due to constraints on queries expressed on the dimension tables. As the task of multi-level partitioning can be overwhelming for a DBA we are proposing a wizard that facilitates the task by calculating a partitioning scheme for a particular workload. The system resides completely on a client and interacts with the costing estimation subsystem of the query optimizer via an API over the network, thereby eliminating any need to make changes to the optimizer. In addition, since only cost estimates are needed the wizard overhead is very low. By using a greedy algorithm for search space enumeration over the query predicates in the workload the wizard is efficient with worst-case polynomial complexity. The technology proposed can be applied to any clustering or partitioning scheme in any database management system that provides an interface to the query optimizer. Applied to the Teradata database the technology provides recommendations that outperform a human expert's solution as measured by the total execution time of the workload. We also demonstrate the scalability of our approach when the fact table (and workload) size increases.

Development of an integrated Web-based system with a pile load test database and pre-analyzed data

  • Chen, Yit-Jin;Liao, Ming-Ru;Lin, Shiu-Shin;Huang, Jen-Kai;Marcos, Maria Cecilia M.
    • Geomechanics and Engineering
    • /
    • 제7권1호
    • /
    • pp.37-53
    • /
    • 2014
  • A Web-based pile load test (WBPLT) system was developed and implemented in this study. Object-oriented and concept-based software design techniques were adopted to integrate the pile load test database into the system. A total of 673 case histories of pile load test were included in the database. The data consisted of drilled shaft and driven precast concrete pile axial load tests in drained, undrained, and gravel loading conditions as well as pre-analyzed data and back-calculated design parameters. Unified modeling language, a standard software design tool, was utilized to design the WBPLT system architecture with five major concept-based components. These components provide the static structure and dynamic behavior of system message flows in a visualized manner. The open-source Apache Web server is the building block of the WBPLT system, and PHP Web programming language implements the operation of the WBPLT components, particularly the automatic translation of user query into structured query language. A simple search and inexpensive query can be implemented through the Internet browser. The pile load test database is helpful, and data can be easily retrieved and utilized worldwide for research and advanced applications.

하이브리드 데이터베이스 기반의 4단계 레이어 계층구조에서 메타규칙을 적용한 질의어 수행 모델에 관한 연구 (A Study of Query Processing Model to applied Meta Rule in 4-Level Layer based on Hybrid Databases)

  • 오염덕
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.125-134
    • /
    • 2009
  • 웹을 통한 생물 데이터 접근 방식은 많은 과학자들에게 대화식으로 서로 다른 형식의 생물 데이터베이스 내용을 검색할 뿐만 아니라, 한 데이터베이스에서 다른 분자생물 데이터베이스로의 연결을 위한 강력한 도구를 제공한다. 본 논문에서의 생물 개념 모델은 생물 데이터 제어를 위한 4가지 통합 레이어를 기반으로 각 생물 데이터 소스 간의 연관성에 따른 규칙 속성을 적용하고 데이터 소스 중에 관심 대상이 되는 개체를 표현하여 하이브리드 생물 데이터 모델을 구성하였다. 특정 사용자의 응용 서비스 요구가 발생하면 해당 생물 데이터베이스와 웹 서비스를 통한 데이터 소스로부터 정보를 획득한다. 본 논문에서는 통합 레이어를 기반으로 웹 데이터 소스 상에서 정보를 탐색하기 위해 메타 규칙을 적용한 질의어 처리 모형과 수행구조를 정형화하였다.

A Reusable SQL Injection Detection Method for Java Web Applications

  • He, Chengwan;He, Yue
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권6호
    • /
    • pp.2576-2590
    • /
    • 2020
  • The fundamental reason why most SQL injection detection methods are difficult to use in practice is the low reusability of the implementation code. This paper presents a reusable SQL injection detection method for Java Web applications based on AOP (Aspect-Oriented Programming) and dynamic taint analysis, which encapsulates the dynamic taint analysis processes into different aspects and establishes aspect library to realize the large-grained reuse of the code for detecting SQL injection attacks. A metamodel of aspect library is proposed, and a management tool for the aspect library is implemented. Experiments show that this method can effectively detect 7 known types of SQL injection attack such as tautologies, logically incorrect queries, union query, piggy-backed queries, stored procedures, inference query, alternate encodings and so on, and support the large-grained reuse of the code for detecting SQL injection attacks.

GOMS: Large-scale ontology management system using graph databases

  • Lee, Chun-Hee;Kang, Dong-oh
    • ETRI Journal
    • /
    • 제44권5호
    • /
    • pp.780-793
    • /
    • 2022
  • Large-scale ontology management is one of the main issues when using ontology data practically. Although many approaches have been proposed in relational database management systems (RDBMSs) or object-oriented DBMSs (OODBMSs) to develop large-scale ontology management systems, they have several limitations because ontology data structures are intrinsically different from traditional data structures in RDBMSs or OODBMSs. In addition, users have difficulty using ontology data because many terminologies (ontology nodes) in large-scale ontology data match with a given string keyword. Therefore, in this study, we propose a (graph database-based ontology management system (GOMS) to efficiently manage large-scale ontology data. GOMS uses a graph DBMS and provides new query templates to help users find key concepts or instances. Furthermore, to run queries with multiple joins and path conditions efficiently, we propose GOMS encoding as a filtering tool and develop hash-based join processing algorithms in the graph DBMS. Finally, we experimentally show that GOMS can process various types of queries efficiently.