• Title/Summary/Keyword: 정렬문제

Search Result 294, Processing Time 0.026 seconds

A Study on the Construction of Stable Clustering by Minimizing the Order Bias (순서 바이어스 최소화에 의한 안정적 클러스터링 구축에 관한 연구)

  • Lee, Gye-Seong
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.6
    • /
    • pp.1571-1580
    • /
    • 1999
  • When a hierarchical structure is derived from data set for data mining and machine learning, using a conceptual clustering algorithm, one of the unsupervised learning paradigms, it is not unusual to have a different set of outcomes with respect to the order of processing data objects. To overcome this problem, the first classification process is proceeded to construct an initial partition. The partition is expected to imply the possible range in the number of final classes. We apply center sorting to the data objects in the classes of the partition for new data ordering and build a new partition using ITERATE clustering procedure. We developed an algorithm, REIT that leads to the final partition with stable and best partition score. A number of experiments were performed to show the minimization of order bias effects using the algorithm.

  • PDF

Development of Contig Assembly Program for Nucleotide Sequencing (염기서열 해독작업을 위한 핵산 단편 조립 프로그램의 개발)

  • 이동훈
    • Korean Journal of Microbiology
    • /
    • v.35 no.2
    • /
    • pp.121-127
    • /
    • 1999
  • An effective computer program for assembling fragments in DNA sequencing has been developed. The program, called SeqEditor (Sequence Editor), is usable on the pcrsonal computer systems of MS-Widows which is the mosl popular operating system in Korea. It c'm recd several sequence file formats such as GenBak, FASTA, and ASCII. In the SeqEditor program, a dynamic programming algorihm is applied to compute the maximalscoring overlapping alignment between each pjlr of fragments. A novel feature of the program is that SeqEdilor implemnents interaclive operation with a graphical user interface. The performance lests of the prograln 011 fragmen1 data from 16s and 18s rDNA sequencing pi-ojects produced saiisIactory results. This program may be useful to a person who has work of time with large-scale DNA sequencing projects.

  • PDF

Transparent Schema Evolution using Object-Oriented View Technology (객체지향 뷰 기술을 이용한 투명한 스키마 진화)

  • Na, Yeong-Guk
    • Journal of KIISE:Databases
    • /
    • v.28 no.1
    • /
    • pp.1-14
    • /
    • 2001
  • 중대한 산업용 소프트웨어가 동작하는 공유된 객체지향 데이터베이스를 안전하게 변경하기 위해서는, 그 공유 데이터베이스를 변경할 동안 데이터베이스 위에서 작동하는 기존의 응용 프로그램이 지속적으로 작동되어야 한다. 데이터베이스 변경을 필요로 하는 새로운 요구사항은 새 응용 프로그램의 추가, 기존 응용 프로그램의 기능 확장, 초기 디자인 에러 수정 등으로 인하여 발생할 수 있다. 우리는 한 사람의 사용자가 다른 사용자에게 악영향을 주지 않고 데이터베이스 스키마를 변경할 수 있게 하여 이 문제를 해결하는 투명한 스키마 진화(TSE: Transparent Schema Evolution) 방법론을 소개한다. 이 방법론은 기존의 스키마를 직접 변경하는 대신 스키마 변경 연산의 의미를 반영하는 데이터베이스 큐를 공유 객체지향 데이터베이스 상에 생성하여 투명한 진화를 달성한다. 데이터베이스의 용량을 증가시키지 못하는 뷰 메카니즘의 한계를 극복하기 위하여 이 방법론은 데이터베이스 용량 증가 연산에 대하여 다음의 새 단계로 정렬된다. (1) 기저의 베이스 스키마는 데이터베이스 용량 증가를 위해 물리적으로 변호한다. (2) 데이터베이스 변경의 의미를 달성하는 목표 뷰가 위의 변화된 베이스 스키마로부터 생성된다. (3) 변화 이전의 베이스 스키마는 데이터베이스 뷰로서 재 구축된다. 이로써 기존의 다른 사용자가 정의한 데이터 인터페이스가 보존된다. 우리는 객체-지향 뷰 기술을 이용하여 스키마 변화 연산을 구현함으로써 TSE 방법론의 구현가능성(feasibility)을 확인하였다. 표준적인 객체-지향 뷰 모델이 정의되고 상용 객체-지향 데이터베이스인 잼스톤(Gemstone) 위에 구현되었다. 그 뷰 모델은 갱신 의미(semantic) 정의를 그 뷰가 베이스 스키마의 갱신 의미를 보존하도록 정의하였다. 그러한 뷰는 사용자가 그들이 실제로는 베이스 스키마가 아니라 뷰에서 작업하고 있다는 사실을 모르게 하기 위하여 TSE에서 필요하다.

  • PDF

Use of dynamic absorber for reduction of shaft vibration in diesel engines of ship (축계진동 저감을 위한 동흡진기의 제안)

  • Park, Sok-Chu;Park, Kyung-Il;Kim, Jeong-Ryul
    • Journal of Advanced Marine Engineering and Technology
    • /
    • v.40 no.9
    • /
    • pp.743-748
    • /
    • 2016
  • Ship's diesel engines have intrinsic problem to make vibrations caused by cylinder explosion and unbalanced rotating mass. These vibrations might induce noises, are transferred to hull and neighboring structures and cause secondary vibrations. This paper suggests the use of an additional dynamic absorber with a sub-vibration system to reduce the aforementioned vibrations. This dynamic absorber is designed based on an analysis of the free vibration of the engine shafting system and the forced vibrations.

A New Concept to Transport a Droplet on Horizontal Hydrophilic/Hydrophobic Surfaces (친수성/소수성 수평 표면상에서의 액적이송에 관한 새로운 개념)

  • Myong, Hyon Kook
    • Transactions of the Korean Society of Mechanical Engineers B
    • /
    • v.38 no.3
    • /
    • pp.263-270
    • /
    • 2014
  • A fluid transport technique is a key issue for the development of microfluidic systems. In this paper, a new concept for transporting a droplet without external power sources is proposed and verified numerically. The proposed device is a heterogeneous surface which has both hydrophilic and hydrophobic horizontal surfaces. The numerical simulation to demonstrate the new concept is conducted by an in-house solution code (PowerCFD) which employs an unstructured cell-centered method based on a conservative pressure-based finite-volume method with interface capturing method (CICSAM) in a volume of fluid (VOF) scheme for phase interface capturing. It is found that the proposed concept for droplet transport shows superior performance for droplet transport in microfluidic systems.

Insertion/Deletion algorithms on M-heap with an array representation (배열 표현을 이용한 M-힙에서 삽입/삭제 알고리즘)

  • Jung Hae-Jae
    • The KIPS Transactions:PartA
    • /
    • v.13A no.3 s.100
    • /
    • pp.261-266
    • /
    • 2006
  • Priority queues can be used in applications such as scheduling, sorting, and shortest path network problem. Fibonacci heap, pairing heap, and M-heap are priority queues based on pointers. This paper proposes a modified M-heap with an way representation, called MA-heap, that resolves the problem mentioned in [1]. The MA-heap takes O(1) amortized time and O(logn) time to insert an element and delete the max/min element, respectively. These time complexities are the same as those of the M-heap. In addition, it is much easier to implement an MA-heap than a heap proposed in [5] since it is based on the simple traditional heap.

A Fragmentation and Search Method of Query Document for Partially Plagiarized Section Detection (부분표절구간 검출을 위한 질의문서의 분할 및 탐색 기법)

  • Ock, Chang-Seok;Seo, Jong-Kyu;Cho, Hwan-Gue
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.586-589
    • /
    • 2012
  • 표절과 관련된 이슈가 주목받고 있는 상황에서 표절을 검출하는 방법에 대한 연구가 활발히 진행되고 있다. 일반적으로 표절구간 검출을 위해 복잡한 자연어처리와 같은 의미론적 접근방법이 아닌 비교적 단순한 어휘기반의 문자열 처리 방법을 사용한다. 대표적인 방법으로는 지문법 (Fingerprinting)과 서열정렬 (Sequence alignment) 등이 있다. 하지만 이 방법들을 이용하여 대용량 문서에 대한 표절검사를 수행하기에는 시공간적 복잡도의 문제가 발생한다. 본 논문에서는 이러한 단점을 극복하기 위해 NGS (Next Generation Sequencing)에서 사용하는 BWT (Burrows-Wheeler Transform)[1]를 이용한 탐색방법을 응용한다. 또한 부분표절구간을 검출하고 정확도를 향상시키기 위해 질의문서를 분할하여 작은 조각으로 만든 뒤, 조각들에 대한 질의탐색을 수행한다. 본 논문에서는 질의문서를 분할하는 두 가지 방법을 소개한다. 두 가지 방법은 k-mer analysis를 이용한 방법과 random-split analysis를 이용한 방법으로, 각 방법의 장단점을 실험을 통해 분석하고 실제 부분표절구간의 검출 정확도를 측정하였다.

A Generation System of English Pronunciation for the medical domain (의료분야를 위한 영어 발음열 생성 시스템)

  • Kim, A-Lum;Jeong, Kyung Seok;Park, Hyuk Ro
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.793-796
    • /
    • 2004
  • 본 논문은 의료분야의 음성 인식 시스템의 발음모델의 성능 향상에 필요한 올바른 영어 단어 발음열을 얻고자 한다. 본 시스템의 텍스트는 의료 전문 용어인 영어와 한글의 조합으로 되어있어, 한국어 G2P 성능뿐만 아니라 영어 G2P의 성능도 중요한 문제가 되고 있다. 또한 본 시스템의 의료 음성 데이터가 한국 화자로써, 표기열이 영어식 발음 폰셋으로 변환되면 효율적이지 못하다. 이를 위해, 영어 G2P의 결과를 한국 화자에 적합하게 변환해주는 방법론이 필요하게 된다. 따라서 본 논문에서 제안하는 방법은 음성 텍스트에서 영어만 추출한 후, 영어 G2P 프로그램(addttp, NIST)을 이용해 발음열을 구한다. 그리고 한국 화자의 실제 음성을 통해 얻은 정답 발음열을 구하여 서로 비교한다. 비교를 위해 각 발음열의 한 폰씩 정렬을 수행한 후, 삽입, 삭제, 대치 에러가 이러나는 쌍과 좌우 바이그램 정보를 추출한다. 마지막으로, 좌우 바이그램 정보에서 best1의 에러 패턴을 통해 모든 단어에 적용한다. 이 때, 최종적으로 실보다 득이 되는 에러패턴만을 추출, 적용한다. 실험에서는 26여개의 에러 패턴을 찾을 수 있어, 8%의 올바른 발음열을 추가적으로 얻는데 성공하였다.

  • PDF

θz Stage Design and Control Evaluation for Wafer Hybrid Bonding Precision Alignment (Wafer Hybrid Bonding 정밀 정렬을 위한 θz 스테이지 설계 및 제어평가)

  • Mun, Jea Wook;Kim, Tae Ho;Jeong, Yeong Jin;Lee, Hak Jun
    • Journal of the Semiconductor & Display Technology
    • /
    • v.20 no.4
    • /
    • pp.119-124
    • /
    • 2021
  • In a situation where Moore's law, which states that the performance of semiconductor integrated circuits doubles every two years, is showing a limit from a certain point, and it is difficult to increase the performance due to the limitations of exposure technology.In this study, a wafer hybrid method that can increase the degree of integration Various research on bonding technology is currently in progress. In this study, in order to achieve rotational precision between wafers in wafer hybrid bonding technology, modeling of θz alignment stage and VCM actuator modeling used for rotational alignment, magnetic field analysis and desgin, control, and evaluation are performed. The system of this study was controlled by VCM actuator, capactive sensor, and dspace, and the working range was ±7200 arcsec, and the in-position and resoultion were ±0.01 arcsec. The results of this study confirmed that safety and precise control are possible, and it is expected to be applied to the process to increase the integration.

Construction of a Parallel Corpus for Instant Messenger Spelling Correction and Related Issues (메신저 맞춤법 교정 병렬 말뭉치의 구축과 쟁점)

  • HUANG YINXIA;Jin-san An;Kil-im Nam
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.545-550
    • /
    • 2022
  • 본 연구의 목적은 2021년 메신저 언어 200만 어절을 대상으로 수행된 맞춤법 교정 병렬 말뭉치의 설계와 구축의 쟁점을 소개하고, 교정 말뭉치의 주요 교정 및 주석 내용을 기술함으로써 맞춤법 교정 병렬 말뭉치의 특성을 분석하는 것이다. 2021년 맞춤법 교정 병렬 말뭉치의 주요 목표는 메신저 언어의 특수성을 살림과 동시에 형태소 분석이나 기계 번역 등 한국어 처리 도구가 분석할 수 있는 수준으로 교정하는 다소 상충되는 목적을 구현하는 것이었는데, 이는 교정의 수준과 병렬의 단위 설정 등 상당한 쟁점을 내포한다. 본 연구에서는 말뭉치 구축 시점에서 미처 논의하지 못한 교정 수준의 쟁점과 교정 전후의 통계적 특성을 함께 논의하고자 하며, 다음과 같은 몇 가지 하위 내용을 중심으로 논의하고자 한다.첫째, 맞춤법 교정 병렬 말뭉치의 구조 설계와 구축 절차에 대한 논의로, 2022년 초 국내 최초로 공개된 한국어 맞춤법 교정 병렬 말뭉치('모두의 말뭉치'의 일부)의 구축 과정에서 논의되어 온 말뭉치 구조 설계와 구축 절차를 논의한다. 둘째, 문장 단위로 정렬된 맞춤법 교정 말뭉치에서 관찰 가능한 띄어쓰기, 미등재어, 부호형 이모티콘 등의 메신저 언어의 몇 가지 특성을 살펴본다. 마지막으로, 2021년 메신저 맞춤법 교정 말뭉치의 구축 단계에서 미처 논의되지 못한 남은 문제들을 각각 데이터 구조 설계와 구축 차원의 주요 쟁점을 중심으로 논의한다. 특히 메신저 맞춤법 병렬 말뭉치의 주요 목표인 사전학습 언어모델의 학습데이터로서의 가치와 메신저 언어 연구의 기반 자료 구축의 관점에서 맞춤법 교정 병렬 말뭉치 구축의 의의와 향후 과제를 논의하고자 한다.

  • PDF