• 제목/요약/키워드: 사전배열 순서

검색결과 11건 처리시간 0.037초

전문용어사전 표제어 기술형식에 대한 연구 (A Study on the Entry Description Format of Glossaries)

  • 강정미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1999년도 제6회 학술대회 논문집
    • /
    • pp.39-42
    • /
    • 1999
  • 우리나라에서 학문분야별로 출판된 전문용어사전의 표제어 기술형식은 매우 상이하다. 이러한 특징은 여러 분야의 전문용어사전을 참조해야 하는 이용자에게 많은 불편을 초래할 뿐만 아니라 표준화된 전자사전에 대한 요구를 충족시키지도 어렵다. 본 연구에서는 전자사전 표준화의 일환인 전문용어사전의 표제어 기술형식 표준화를 위한 기초작업의 일부로서 현재까지 우리나라기서 출판된 전문 용어사전을 대상으로 표제어의 기술형식에 대하여 기술요소, 기술요소의 순서, 띄어쓰기, 다의성을 갖는 용어의 구분, 배열 등에 대하여 조사 분석하였다.

  • PDF

압축된 써픽스 배열 구축 알고리즘의 성능 분석 (Performance Analysis of Construction Algorithms for Compressed Suffix Arrays)

  • 박치성;조준하;심정섭;김동규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.409-411
    • /
    • 2006
  • 써픽스 배열은 사전적 순서로 정렬된 써픽스들의 인덱스를 저장한 인덱스 자료구조로서, 긴 텍스트에서 반복되는 패턴 검색 시 효율적으로 사용 될 수 있다. 하지만 O($n\;log{\Sigma}$) 비트의 텍스트보다 큰 O(n log n) 비트 공간을 차지하기 때문에 대용량의 텍스트에 대해서는 큰 공간을 필요로 하는 문제점이 있다. 이를 해결하기 위해 압축된 써픽스 배열이 제안되었지만, 구축 시 이미 만들어진 써픽스 배열을 이용하기 때문에 실제 사용 공간을 줄이지는 못했다. 최근 써픽스 배열 없이 텍스트에서 직접 압축된 써픽스 배열을 구축할 수 있는 두 가지 알고리즘이 개발되었다. 본 논문에서는 이 두 가지 알고리즘을 구현한 후, 구축 시간과 사용 공간 등의 실험을 통해 기존의 써픽스 배열들과의 성능을 비교하고 분석한다.

  • PDF

DNA스트링에 효율적인 써픽스 배열 구축 알고리즘 (An Efficient Algorithm for Constructing Suffix Arrays for DNA String)

  • 조준하;박회진;김동규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.961-963
    • /
    • 2004
  • 써픽스 배열은 텍스트의 써픽스들을 사전적 순서대로 저장하여 검색을 효율적으로 할 수 있는 자료구조이다. 생물학에서의 DNA 스트링과 같이 긴 텍스트에 대해 써픽스 배열을 이용하면 빠르게 검색할 수 있다. 써픽스 배열은 유사한 자료구조인 써픽스 트리에 비해 적은 공간을 차지하기 때문에 생물학에서 사용하는 긴 텍스트의 처리에 유리하다. 최근, 텍스트에서 바로 써픽스 배열을 선형시간에 구축하는 알고리즘들이 발표되었다. 그러나 이들 알고리즘은 정수 문자집합을 위한 알고리즘들이었다. 본 논문에서는 고정길이 문자집합에 대해 써픽스 배열을 빠르게 구축하는 알고리즘을 소개한다. 그리고 실험을 통해서 DNA 스트링과 같은 고정길이 문자집합에 대해서 다른 알고리즘들과 구축시간을 비교하여 속도 향상이 있음을 보인다.

  • PDF

선형 시간 접미사 배열 생성 알고리즘들의 비교 (Comparison of Linear Time Suffix Array Construction Algorithms)

  • 이성림;박근수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.496-498
    • /
    • 2003
  • 접미사 배열은 긴 문자열에 대해 효율적인 문자열 검색을 가능하게 하는 자료구조이다. 접미사 배열은 문자열의 접미사들의 사전식 정렬순서를 배열로 저장한다. 비슷한 효과를 가진 접미사 트리에 비해서 접미사 배열은 저장 공간을 적게 차지하기 때문에 생명정보과학의 염기 서열 등 큰 크기의 문자열의 처리에 더욱 유리하다. 본 논문에서는 2003년에 발표된 Ko-Aluru, K$\square$rkk$\square$inen-Sanders 및 기존의 Manber-Myers 등 세 개의 접미사 배열 생성 알고리즘들의 염기 서열 입력 자료에 대한 실행 시간 및 기억 장치 사용량을 실험을 통해 비교한다. 특히 Ko-Aluru와 K$\square$rkk$\square$inen-Sanders 알고리즘은 실행 시간 및 저장 공간의 이론적인 복잡도가 O(n)으로 동일하기 때문에 실험을 통해서 계산 복잡도에 숨어있는 상수를 비교한다. 실험 결과 K$\square$rkk$\square$inen-Sanders 알고리즘이 가장 효율적임을 보인다.

  • PDF

정약용의 구고원류 (Gugo Wonlyu of Jeong Yag-yong)

  • 김영욱
    • 한국수학사학회지
    • /
    • 제32권3호
    • /
    • pp.97-108
    • /
    • 2019
  • This paper is an outgrowth of a study on recent papers and presentations of Hong Sung Sa, Hong Young Hee and/or Lee Seung On on Gugo Wonlyu which is believed to be written by the famous Joseon scholar Jeong Yag-yong. Most of what is discussed here is already explained in these papers and presentations but due to brevity of the papers it is not understood by most of us. Here we present them in more explicit and mathematical ways which, we hope, will make them more accessible to those who have little background in history of classical Joseon mathematics. We also explain them using elementary projective geometry which allow us to visualize Pythagorean polynomials geometrically.

실용적인 접미사 정렬 알고리즘의 개선 (Improvement of Practical Suffix Sorting Algorithm)

  • 정태영;이태형;박근수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권2호
    • /
    • pp.68-72
    • /
    • 2009
  • 접미사 배열은 주어진 문자열 내의 모든 접미사를 사전식 순서로 저장하는 자료 구조로, 많은 저장 공간을 사용하는 접미사 트리를 대체하면서 여러 가지 문자열 관련 문제에 사용되고 있다. 이를 O(n) 시간 내에 생성하는 것과 더불어, 실세계 입력에 대하여 작은 시간과 공간을 사용하여 구성하는 알고리즘들 역시 제안되어 왔다. 본 논문은 Maniscalco와 Puglisi[1]가 제안한 접미사 정렬 알고리즘을 분석하고, 프로그램의 수행 시간을 개선한 새로운 알고리즘을 제안한다.

블록 스트라이프 패턴의 디자인 요소가 감성에 미치는 영향 (Effect of design elements of Block Stripe Pattern on Sensibility)

  • 이영진;정혜진;박희주;이주현;조길수
    • 감성과학
    • /
    • 제5권3호
    • /
    • pp.21-28
    • /
    • 2002
  • 텍스타일 패턴 디자인에 대한 소비자의 감성을 반영하는 한 방법을 제시하기 위하여 블록 스트라이프 패턴 (block stripe pattern)에 대한 디자인 요소를 조사하였다. 자극물은 명도차(3가지), 배열(2가지), 폭(2가지), 간격(3가지)의 4가지 요소를 조작하여 구성되었다. 36가지 조합 중에서 사전 조사에서 독립적인 감성을 보이는 27개를 최종 자극물이 선정되었으며, 남녀 대학생 30명을 대상으로 감성평가를 실시하였다. 4가지 디자인 요소가 요인분석을 통해 도출된 12개의 감성차원에 미치는 영향을 측정하고, 물리량에 근거한 정량적 분석을 통해 각 자극물과 감성과의 관계를 파악하였다. 각 디자인 요소가 감성에 미치는 영향을 ANOVA 분석한 결과, 명도차, 간격, 폭, 배열의 순서로 의미있는 감성차이를 유발하였으며 명도차는 거의 모든 감성에서 감성차에 영향을 미치는 가장 설명력 높은 디자인 요소로 분석되었다. 디자인 요소 레벨에 따른 감성의 차이를 살펴보면, 폭이 좁을수록 '수수한', '깨끗한', '모던한', '심플한', '편한' 감성을, 간격이 좁을수록 '강렬한', '보수적인' 감성을, 명도차가 작을수록 '고급스러운', '모던한', '수수한', '심플한', '점잖은', 보수적인', '소프트한', '깨끗한', '편한' 감성을 나타내었다. 감성을 요소별 물리량으로 예측한 회귀모형을 도출한 결과, 12개의 감성 중 '보수적인', '캐주얼한', '모던한' 감성을 제외한 모든 감성에 대해 R²가 0.6 이상의 높은 적합도를 보였다. 이 결과를 토대로 소비자 감성이 반영된 2가지 디자인 프로토타입을 제시하였다.

  • PDF

미세균열의 간격 분포를 이용한 결의 평가(I) (Evaluation for Rock Cleavage Using Distribution of Microcrack Spacings (I))

  • 박덕원
    • 암석학회지
    • /
    • 제25권1호
    • /
    • pp.13-27
    • /
    • 2016
  • 거창지역의 쥬라기 화강암에 내재하는 결의 특성을 분석하였다. 미세균열의 간격에 대한 분포상은 박편의 확대사진(${\times}6.7$)에서 도출하였다. 여섯 방향의 결에 대한 평가는 (1) 미세균열의 간격의 빈도수(N), (2) 총 간격의 빈도수(N:191) 대비 빈도율(${\leq}1mm$ 및 4 mm >), (3) 총 간격(118.49 mm) 대비 간격율(${\leq}1mm$), (4) 평균 간격($S_{mean}$), (5) 평균 간격과 중앙 간격($S_{median}$) 사이의 차이값($S_{mean}-S_{median}$), (6) 간격의 밀도, (7) 중앙 간격, (8) 길이의 빈도수 대비 간격의 빈도수의 감소비율 및 (9) 도표의 분포형과 관련된 지수(${\lambda}$ and b)의 크기와 같은 9개의 파라미터를 이용하여 수행하였다. 특히 상기 간격의 파라미터 그리고 간격-누적빈도 도표에서 도출한 파라미터 사이의 밀접한 상관성을 도출하였다. 3개 결 그리고 3개 면에 대한 파라미터의 값 사이의 상관성 분석의 결과는 다음과 같다. (I) 파라미터(1, 2 및 3), (II) 파라미터(4, 5 및 6), (III) 파라미터(7), (IV) 파라미터(8) 및 (V) 파라미터(9)의 값은 H(3번 결, H1+H2) < G(2번 결, G1+G2) < R(1번 결, R1+R2), R < G < H, R < H < G, G < H < R 및 H < G < R의 다양한 순서를 각각 보여준다. 반면에 3개 면에 대한 상기 4개 그룹(I~IV)의 파라미터의 값은 역순을 보여준다. 이러한 유형의 상관성 분석은 3개 채석면의 판별에 유용하다. 여섯 간격-누적빈도 도표를 주요 파라미터($S_{mean}-S_{median}$)의 값이 증가하는 순으로 배열하였다. 이들 도표들은 관계도에서 R2 < R1 < G2 < G1 < H2 < H1의 순을 보여준다. 즉, 상기 여섯 도표는 1번 결(R1+R2) < 2번 결(G1+G2) < 3번 결(H1+H2)의 순으로 요약될 수 있다. 이러한 결과는 미세균열의 간격과 관련된 결의 상대적인 강도를 지시한다. 특히 상기 주요 파라미터는 도표 사이의 배열 순서의 예측에 대한 사전 정보를 제공할 수 있다.

상수관로 최적설계 문제에 있어 빌딩블록가설을 고려한 유전 알고리즘의 효율성 평가 (Efficiency Evaluation of Genetic Algorithm Considering Building Block Hypothesis for Water Pipe Optimal Design Problems)

  • 임승현;이찬욱;홍성진;유도근
    • 한국산학기술학회논문지
    • /
    • 제21권5호
    • /
    • pp.294-302
    • /
    • 2020
  • 대표적인 메타 휴리스틱 알고리즘 중 하나인 유전알고리즘은 생명체의 자연 진화 과정을 컴퓨터 시뮬레이션하며 이 과정에서 선택, 교차, 그리고 돌연변이가 수행된다. 이 과정에서 유전알고리즘은 정의길이가 짧고, 차수가 낮은 반면, 높은 적응도를 갖는 스키마타의 병렬배열에 의해 최적해에 근접해 간다. 본 연구에서는 유전알고리즘의 핵심 작동원리 중 하나인 빌딩블록가설과 상수관망 시스템이 가지고 있는 공학적, 수리학적 특성을 동시에 고려한 최적해 효율성 제고의 가능성을 살펴보고자 하였다. 즉, 공학적 문제 해결에 있어 유전알고리즘 수행을 위한 유전자의 배치순서에 따른 최적화 결과의 효율성을 평가하였다. 공학적 문제로 상수관로 최적설계 문제를 선택하여 적용하였으며, 유전자 배치순서는 기존배치, 네트워크 위상 기반 배치, 그리고 유량크기 기반 배치로 구분하여 공학적 특이성을 반영하였다. 적용결과 유량 크기 기반 배치를 적용한 최적화 결과가 기존배치에 비하여 평균적으로 약 2-3% 우수한 것으로 나타났다. 이것은, 실제 공학 최적화 문제의 적용성과 효율성을 증대시키기 위해서는 명확한 사전지식(수리학적 특성 등)을 활용하여 가능한 이와 같은 우수한해의 특성이 소멸되지 않도록 하는 장치가 반드시 필요하다는 것을 의미한다. 제안된 방법론은, 향후 대규모 상수관망 최적설계에 있어 효율성 제고를 위한 방안으로 활용이 가능할 것으로 판단된다.

지식 생산 방식에 따른 집단지성 구조 분석 -네이버 지식IN과 위키피디아를 중심으로- ('Collective intelligence Structure' Analysis)

  • 한창진
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.1363-1373
    • /
    • 2009
  • 본 연구는 두 집단지성의 가장 대표적인 서비스인 네이버 지식iN과 위키피디아의 구조적, 경험적 차이를 바탕으로 생산의 차원에서 생산 주기, 생산 참여자, 생산물의 모델을 설정하고, 새롭게 탄생하는 지식을 중심으로 검증함으로써 최종 지식 소비 행위를 반영한 각각의 종합모델을 도출하였다. 우리는 웹에서 집단지성의 일상화를 확인할 수 있다. 지식 획득 매체가 매스미디어에서 인터넷으로 변화하는 과정에서 등장한 포털 및 검색사이트는 지식의 생산이 전문가패러다임에서 소비자 중심으로 재편될 수 있는 가능성을 열어주었다. 그리고 이러한 생산 방식의 변화는 '지식'의 개념 역시 변화시키고 있다. 즉, 집단지성이라는 새로운 웹2.0의 현상이 지식생산방식을 변화시키고 변화된 지식생산방식은 '지식'자체를 변화시킨다는 이론적 가설을 도출할 수 있는 것이다. 본 연구는 이러한 새로운 현상들을 분석하기 위해서는 먼저 보다 엄밀하게 집단지성의 개념을 규정할 필요성에 출발하였다. 현재 집단지성이라는 이름으로 불리면서 급격히 성장하고 있는 위키 방식의 인터넷 서비스와 지식검색 방식의 인터넷 서비스를 비교함으로써 보다 정교한 집단지성의 모델을 구축하고자 하였다. 위키형 집단지성과 지식검색형 집단지성의 차이점은 경험적으로도 뚜렷하게 확인할 수 있다. 본 연구는 이러한 경험적 차이와 기존의 문헌에서 밝혀진 사실들을 바탕으로 두 서비스의 지식생산 방식을 생산플로우, 생산참여자 성향, 생산물(지식)의 성향과 같이 세 영역으로 나누어 각각의 가설 모델을 설정하고 이 모델을 선정된 질의어를 바탕으로 검증한 뒤에 최종적인 모델을 도출하는 방식으로 진행되었다. 지식검색형 집단지성은 '질문-답변-채택'의 구조이고, 그 구조 속에서 '질문기-답변기-순서화기'를 거쳐 하나의 지식 덩어리인 'K-let'을 생산한다. 생산된 'K-let'들은 지식검색서비스의 데이터베이스에 축적되고, 이는 공통된 질의어를 기준으로 소비자들에 의해서 검색되어 소비된다. 하나의 질문에 대해 여러 개의 답변들이 존재하고, 답변자의 성향은 크게 전문성과 체계성을 바탕으로 한 전문가형 답변자와 경험적이고 의견지향적인 대화형 답변자로 나눠진다. 다수의 네티즌들의 참여에 의해서 지식의 생산이 진행되므로 질문의 성향 역시 사실, 의견, 경험 등 다양한 스펙트럼을 가지는 모델로 설정하였다. 반면에 위키형 집단지성은 개방형 플랫폼을 바탕으로 한 백과사전의 형식이며, 이러한 형식 속에서 최초의 개념어 등록과 다수의 편집활동을 거치면서 완성되지 않는 하나의 아티클인 'W-let'을 생산한다. 이러한 'W-let'은 생성 초기에 소수에 의한 활발한 내용 입력 활동으로 어느 정도의 안정화를 거친 후에는 꾸준한 다수의 수정활동을 통해서 'W-let'의 생명력을 유지함으로써 지식의 실제적인 변화를 반영한다. 생산된 'W-let'들은 위키형 집단지성 서비스의 데이터베이스에 축적되고, 이것들은 내부링크를 통해서 모두 연결되어 있다. 백과사전 형식으로 하나의 개념어를 설명하는 하나의 아티클은 오로지 사실적인 지식들로만 구성되나 내부링크와 외부링크를 통해서 다양한 스펙트럼을 가지는 모델로 설정하였다. 위와 같이 설정된 모델을 바탕으로 공통된 질의어 및 개념어를 선정하여 각각의 서비스에 노출시켰다. 이를 통해서 얻어진 각 서비스의 데이터베이스에 축적된 모든 데이터들 중에서 일정한 기간을 기준으로 각각의 모델 검증에 필요한 데이터를 추출하여 분석하는 방식으로 진행되었다. 그 결과 지식검색형 집단지성에서는 '질문-답변-채택'의 생산 구조 속에 다수가 참여하여 질문-채택답변-기타답변으로 배열되어 있는 완성된 형태의 K-let들을 지속적으로 생산하며 비슷한 성향을 가진 K-let들이 반복적으로 생산되어 지식검색 데이터베이스에 누적된다. 지식 소비자들은 질의어 검색을 통해서 다양한 K-let들을 선택하여 비교, 검토한 후에 선택된 K-let들의 배열은 해체되어 소비자들에 의해서 재배열됨을 발견할 수 있었다. 이에 지식검색형 집단지성이란 다수의 의해서 생산되고 누적된 지식들이 소비자의 검색과 선택에 의해 해체되어 재배열되는 지식의 맞춤화 과정이라고 정의내릴 수 있었다. 반면에 위키형 집단지성에서는 '내용입력-미세수정' 구조 속에서 생명력 있는 W-let을 생성한다. W-let은 백과사전처럼 정리되어 내부링크를 통해서 서로 연결되고, 외부링크를 통해 확장되고, 지식소비자들은 검색을 통해 최초의 W-let에 도달한 후에 링크를 선택함으로써 지식을 확장시킴을 검증할 수 있었다. 따라서 위키형 집단지성이란 다수의 의해서 생산되고 정리된 지식들이 소비자의 검색과 링크에 의해 무한히 확장되는 지식의 확대 재생산되는 과정이라고 정의 내릴 수 있다. 결국, 현재의 집단지성이란 지식이 다수의 참여로 생산됨으로써 개인에게 맞춤화되고, 끊임없이 확대 재생산되는 과정을 의미한다. 그리고 이러한 집단지성의 방식은 지식이라는 현재의 차원을 넘어서 정치, 경제를 비롯한 사회의 전 영역으로 점차적으로 확대되어갈 것이다. 앞으로 연구들은 두 가지 모델이 혼재되어 있는 현재의 집단지성이 어떠한 새로운 모델을 만들면서 다른 영역으로 확장되어갈 것인지에 대해서 초점을 맞춰 나가야할 것이다.

  • PDF