• 제목/요약/키워드: 색인기법

검색결과 654건 처리시간 0.028초

AS B-트리: SSD를 사용한 B-트리에서 삽입 성능 향상에 관한 연구 (AS B-tree: A study on the enhancement of the insertion performance of B-tree on SSD)

  • 김성호;노홍찬;이대욱;박상현
    • 정보처리학회논문지D
    • /
    • 제18D권3호
    • /
    • pp.157-168
    • /
    • 2011
  • 최근 플래시 메모리 및 SSD가 노트북이나 PC의 저장장치로 사용되는 것뿐 아니라, 기업용 서버의 차세대 저장장치로 주목 받고 있다. 대용량의 데이터를 처리하는 데이터베이스에서는 삽입, 삭제, 검색을 빠르게 하기 위해 다양한 색인 기법을 사용하는데 그 중B-트리 구조가 대표적인 기법이다. 하지만 플래시 메모리 상에서는 하드디스크와 달리 덮어쓰기(overwrite) 연산을 수행하기 위해서는 먼저 해당 블록(block)에 대하여 플래시 메모리의 연산 중 가장 비용이 많이 요구되는 삭제(erase) 연산을 수행 해야만 한다. 이러한 문제점을 극복하기 위해 플래시 메모리 사이에 위치하는 플래시 변환 계층(Flash memory Translation Layer)을 사용한다. 이 플래시 변환 계층은 수정한 데이터를 동일한 논리 주소에 덮어쓰기를 하더라도 실제로 임의의 다른 물리 주소에 저장하도록 하여 이 문제를 해결할 수 있다. NAND 플래시 메모리를 배열 형태로 포함하고 있는 SSD는 한 개 이상의 플래시 메모리 패키지를 병렬로 접근할 수 있다. 이러한 병렬 접근 방식을 사용하여 쓰기 연산 성능을 향상하기 위해서는 연속한 논리 주소에 쓰기 연산을 요청하는 것이 유리하다. 하지만 B-트리는 구성 노드에 대한 삽입 삭제 연산 시에 대부분 연속되지 않은 논리 주소 공간에 대한 갱신 연산이 일어나게 된다. 따라서 SSD의 병렬 접근 방식을 최대한 활용할 수 없게 된다. 본 논문에서는 수정한 노드를 연속한 논리 주소에 쓰도록 하는 AS B-트리 구조를 제안하여 SSD의 병렬 접근 방식을 최대한 활용할 수 있도록 하였다. 구현 및 실험한 결과 AS B-트리에서의 삽입 시간이 B-트리보다 21% 개선된 것을 확인하였다.

텍스트 마이닝을 이용한 이익조정 연구동향 토픽모델링 (Topic Modeling of Profit Adjustment Research Trend in Korean Accounting)

  • 김지연;나홍석;박경환
    • 디지털융복합연구
    • /
    • 제19권1호
    • /
    • pp.125-139
    • /
    • 2021
  • 본 연구는 이익조정을 연구주제로 국내 회계학 관련 논문들의 세부 연구 동향 파악을 목적으로 한국학술지인용색인(KCI)의 회계학 또는 경영학에 속하는 학술지에 게재된 논문 초록을 텍스트 마이닝 기법을 이용하여 분석하였다. 분석 결과, 이익조정 관련 회계학 논문들이 감사 및 감사보고서, 법인세 및 부채비율, 기업의 전반적인 경영전략, 재무제표와 회계기준의 4가지 연구 영역으로 나누어지는 것을 확인하였으며, 재무제표와 회계기준이 주된 토픽일 것이라는 예측과는 달리 감사가 가장 많이 연구된 토픽으로 분석되었다. 이어 토픽별 논문 수를 기준으로 토픽 트렌드를 확인하고 특이사항에 대한 원인을 분석하였으며, K-IFRS의 도입이 이익조정 연구에 미친 영향을 확인하였다. 본 연구는 이익조정에 대한 자세한 연구 동향에 대한 정보를 제공하고 회계학 문헌분석 연구방법으로 텍스트 마이닝 기법을 제시하였다. 또한 정책결정자 및 기업 실무 담당자가 이익조정 관련하여 회계기준 외에 감사 등 4개 토픽별로 추가적으로 고려하여야 할 사항과 그 추세를 파악할 수 있도록 하였다.

Voxel 머리팬텀 제작 및 붕소중성자포획요법 선량계산에의 응용 (Construction of voxel head phantom and application to BNCT dose calculation)

  • 이춘식;이춘익;이재기
    • Journal of Radiation Protection and Research
    • /
    • 제26권2호
    • /
    • pp.93-99
    • /
    • 2001
  • 해부학적으로 단순한 수학적인형팬텀의 한계를 극복하기 위한 voxel 머리팬텀을 제작하고 BNCT(Boron Neutron Capture Therapy) 시행 시 선량분포를 계산하였다. 일반목적 몬테칼로 코드인 MCNP4B의 반복구조 알고리즘을 이용하여 voxel 몬테칼로 계산체계를 수립하였고 두 가지 물질로 구성된 예시적 voxel 팬텀과 기하체조합팬텀의 계산값 비교를 통해 계산체계를 검증하였다. 미국 NLM(National Library of Medicine)에서 제공하는 VHP man 인체단층사진에 대한 분할 및 색인작업을 통해 voxel 머리팬텀을 제작하여 AP 및 PA 방향에서 입사하는 넓고 평행한 광자 및 중성자빔에 대한 선량값을 MIRD 팬텀의 계산값과 비교한 결과 중성자빔 AP 방향조사 시 MIRD 팬텀에서는 볼 수 없는 안구로 인한 중성자 감쇠현상을 확인할 수 있었다. 3차원 정밀계산이 필요한 BNCT 시술시 선량분포계산을 위해 뇌 중앙에 직경 5cm의 구형 뇌종양 체적을 정의하고 뇌와 종양의 붕소 함량을 조정하여 10keV 및 40keV 상부입사 중성자에 의한 장기별 흡수선량을 계산한 결과 종양에 $30{\mu}g/g$, 정상세포에 $3{\mu}g/g$의 붕소를 주입한 경우 붕소함량이 없을 때에 비해 2배 가량 큰 선량을 보였다. 본 연구를 통해 voxel몬테칼로기법을 이용한 선량평가체계를 수립하였고 정밀한 선량계산을 필요로 하는 치료방사선분야 선량계산에 실제 인체에 가까운 voxel팬텀의 응용가능성을 제시하였다.

  • PDF

고정 그리드를 이용한 병렬 공간 조인의 태스크 할당에 관한 연구 (A Study on Task Allocation of Parallel Spatial Joins using Fixed Grids)

  • 김진덕;서영덕;홍봉희
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.347-360
    • /
    • 2001
  • 공간 조인은 두 개의 데이터 집합으로부터 공간적인 조건을 만족하는 두 객체 쌍의 집합을 구하는 것으로 비용이 매우 큰 연산자이다. 지난 수년동안 공간 조인의 순차 수행 시간은 많이 향상되었지만, 그 응답시간은 사용자의 요구를 만족시키지 못하고 있다. 따라서 최근 병렬 시스템을 이용하여 이러한 문제를 해결하려는 연구가 진행되고 있다. 그렇지만 프로세서의 수가 증가할수록 병렬 처리에 의한 프로세서의 효율성은 급격히 떨어진다. 이것은 병렬 공간 조인을 수행할 경우 순차 공간 조인 보 다 디스크 병목 현상과 메시지 전송 오버헤드가 심하게 발생하기 때문이다. 이 논문에서는 공유 디스크 구조에서 다중 프로세서의 디스크 동시 접근으로 인한 병목 현상을 완화하고, 메시지 전송을 최소화하기 위한 태스크 할당 방법을 제안한다. 제안한 태스크 할당 방법을 두 가지 공간 조인 기법에 각각 적용하여 디스크 접근 횟수와 메시지 전송 횟수의 감소 효과를 실험으로 평가한다. MIMD 구조 및 공유디스크 방식의 병렬 시스템에서의 다양한 실험에서 이 논문에서 제안한 준동적 태스크 할당 방법이 정적 할당과 동적 할당 방법에 비해 우수함을 보였다.

  • PDF

효율적 XML키워드 검색을 인덱스 분할 및 합병 (Partitioning and Merging an Index for Efficient XML Keyword Search)

  • 김성진;이형동;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.754-765
    • /
    • 2006
  • 일반적으로 XML 키워드 검색에서 검색 결과는 질의 키워드들을 모두 포함하는 가장 작은 원소(최소 공통 선조)로 정의되며 색인의 기본 단위는 XML 원소가 된다. 기존의 인덱스 구조 하에서는 질의 키워드를 포함한 각 원소의 조합으로 생성된 모든 최소 공통 선조가 검색 결과로 고려된다. 본 논문에서는-불필요한 최소 공통 선조 산출 연산을 피하고 검색 시간을 단축시키기 위한 목적으로-인덱스를 파티션이라고 불리는 물리적 단위로 분할하고 질의 처리 시 필요에 따라 파티션을 동적으로 합병하여 검색 결과를 산출하는 기법을 기술한다. 주어진 깊이 이상의 최소 공통 선조가 검색 결과로 반환되어야할 경우, 검색 시스템은 제안된 인덱스 구조 하에서 동일 파티션에 속한 원소들 간의 조합만으로 검색 결과를 반환함으로써 검색 시간을 단축시킬 수 있다. 검색 결과에 대한 깊이 제한이 주어지지 않을 경우에도 검색 시스템은 분할된 인덱스를 사용하여 검색 결과를 얻을 수 있으며, 이때 분할되지 않은 기존의 인덱스를 사용하는 검색과 동일한 시간이 소요된다. 실험은 DBLP 사이트와 INEX2003에서 제공되는 XML 문서들로 진행되었으며, 제안된 인덱스는 검색 결과의 최소 깊이가 주어질 경우 질의 처리 시간을 상당히 감소시켰다.

문헌동시인용 분석을 통한 한국 문헌정보학의 연구 전선 파악 (Identifying the Research Fronts in Korean Library and Information Science by Document Co-citation Analysis)

  • 이재윤
    • 정보관리학회지
    • /
    • 제32권4호
    • /
    • pp.77-106
    • /
    • 2015
  • 한국학술지인용색인 KCI의 데이터를 사용한 문헌동시인용 분석을 통해 2004년부터 2013년까지 10년 동안의 한국 문헌정보학의 연구 전선을 구체적으로 파악해보았다. KCI 웹사이트로부터 문헌정보학 분야 핵심 논문 159개와 이를 인용한 논문 정보를 수작업으로 수집하였다. 군집 분석 및 네트워크 분석 결과 27개의 복수 논문 군집과 8개의 단일 논문 군집이 도출되었다. 27개의 복수 논문 군집 중에서 논문 수가 가장 많은 것은 '문헌정보학 교육' 주제 군집이었고, 인용 영향력이 가장 큰 것은 '인용분석 & 지적구조 분석' 주제 군집이었다. 핵심 문헌 집합에 대한 인용 중에서 67.5%는 문헌정보학 내부에서 이루어졌고, 나머지 32.5%는 타 학문 분야로부터 발생한 것이었다. 전반적으로 문헌정보학 분야 내 인용 비율과 인용 영향력 성장 지수를 모두 고려하였을 때, 문헌정보학 분야 내부에서 최근 연구가 가장 활발해지고 있는 연구 전선 주제로는 '지역 기록', '인용분석 & 지적구조 분석', '연구동향 분석'의 세 주제가 꼽혔다. 이 연구에서 사용된 분석 기법은 국내 학제적 연구 분야의 연구 전선 분석에 효과적일 것으로 기대된다.

LED 파장에 따른 강도다리 Platichthys Stellatus 성장특성 (A Study of the Growth Characteristics of Starry Flounder Platichthys Stellatus in Accordance with the LED Wavelength)

  • 장준철;허인성;이세일;유영문
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제39권4호
    • /
    • pp.495-500
    • /
    • 2015
  • 우리나라 주요 양식어종은 넙치, 조피볼락, 참돔이 전체 양식어종의 80% 이상을 차지하고 있다. 본 연구에서는 양식 어종의 다양화와 그에 따른 새로운 양식기법 도입을 위하여 LED파장을 이용하여 강도다리의 성장률을 계측하여 성장에 최적한 LED 파장을 규명하였다. 본 연구에 사용된 LED 파장의 조건은 Red 645nm, Green 525nm, Blue 465nm, 3차 혼합색인 White LED를 사용하였고, 전압의 차이에 따라 각 파장별 Package 배열에 차이를 두었다. 또한 연구에 사용된 조명은 적분구 측정을 통해 동일한 양의 방사속을 조사하도록 조절하여 진행하였으며 실험에 사용된 자어의 평균 체중은 $17.1{\pm}3.3g$, 체장은 $101.5{\pm}12.6mm$이였다. 자어는 사각형($60{\times}45{\times}45cm$) 순환 여과식 수조에 각각 10미씩 수용하여 12주간 사육하였고 매 1주에 체중 및 체장을 계측하여 성장률을 조사하였다. 연구 결과 Green 실험구에서 가장 높은 체중 증가율이 54.03%로 가장 높았으며 다음으로 White 실험구에서 38.47%, Red 실험구에서 36.98% Blue 실험구에서 34.72%로 나타났으며, 체장의 증가도 또한 Green 실험구에서 14.36% 가장 높았으며, White, Red, Blue 순서로 체장의 증가율이 나타났다. 본 연구결과로 강도다리는 사육환경에서 조명에 대한 영향을 크게 받는 것을 알 수 있으며, 나아가서 양식현장에의 적용 가능한 양식용 특수조명 개발과 공학을 기반으로 한 새로운 수산-LED 융합기술의 발전방향을 선도하는 중요한 기초연구가 될 것으로 판단된다.

시계열 네트워크분석을 통한 데이터품질 연구경향 및 산업연관 분석 (Trend of Research and Industry-Related Analysis in Data Quality Using Time Series Network Analysis)

  • 장경애;이광석;김우제
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권6호
    • /
    • pp.295-306
    • /
    • 2016
  • 본 연구는 데이터품질과 관련된 선행연구의 메타정보를 활용하여 연구경향을 분석하고 이를 통해서 산업계의 흐름을 예측하기 위한 목적의 연구이다. 다양한 분야에서 연구경향을 분석하려는 시도는 이어져 왔으나, 데이터품질 영역은 그 범위가 방대하여 선행 연구자료에 대한 분석을 수행하기 어려웠다. 본 연구는 Web of Science 색인DB에 수록된 최근 10년간의 연구 메타데이터를 수집하여 텍스트 마이닝, 사회연결망 분석기법을 활용한 시계열 네트워크 분석을 수행하였다. 연구주제 분석 결과, 수학 및 전산 생물학, 화학, 건강관리 과학 및 서비스, 생화학 및 분자 생물학, 운영 연구 및 경영 과학, 의료정보학은 연구비율이 감소하고 있었고, 환경, 수자원, 지질학, 계측기 및 계측의 연구비율은 증가하고 있었다. 또한 사회연결망 분석 결과 데이터품질 연구에서는 분석, 알고리즘, 네트워크의 주제가 중앙성이 높은 중요한 주제로 나타났으며, 이미지와 모델, 센서, 최적화가 데이터품질에서 중요한 주제로 등장하는 추세를 보였다. 데이터품질의 산업과 연관관계 분석 결과는 기술, 산업, 건강, 유틸리티, 고객서비스가 연관성이 높은 산업으로 나타났다. 본 연구의 결과는 데이터품질 연구의 패턴을 분석하고 산업과 연관관계를 찾는 데이터품질 관련 연구자 뿐아니라 산업계에도 유용한 자료로 활용되리라 판단된다.

비정형 텍스트 데이터 분석을 활용한 기록관리 분야 연구동향 (Research Trends in Record Management Using Unstructured Text Data Analysis)

  • 홍덕용;허준석
    • 한국기록관리학회지
    • /
    • 제23권4호
    • /
    • pp.73-89
    • /
    • 2023
  • 본 연구에서는 텍스트 마이닝 기법을 활용하여 국내 기록관리 연구 분야의 비정형 텍스트 데이터인 국문 초록에서 사용된 키워드 빈도를 분석하여 키워드 간 거리 분석을 통해 국내기록관리 연구 동향을 파악하는 것이 목적이다. 이를 위해 한국학술지인용색인(Korea Citation Index, KCI)의 학술지 기관통계(등재지, 등재후보지)에서 대분류(복합학), 중분류 (문헌정보학)으로 검색된 학술지(28종) 중 등재지 7종 1,157편을 추출하여 77,578개의 키워드를 시각화하였다. Word2vec를 활용한 t-SNE, Scattertext 등의 분석을 수행하였다. 분석 결과, 첫째로 1,157편의 논문에서 얻은 77,578개의 키워드를 빈도 분석한 결과, "기록관리" (889회), "분석"(888회), "아카이브"(742회), "기록물"(562회), "활용"(449회) 등의 키워드가 연구자들에 의해 주요 주제로 다뤄지고 있음을 확인하였다. 둘째로, Word2vec 분석을 통해 키워드 간의 벡터 표현을 생성하고 유사도 거리를 조사한 뒤, t-SNE와 Scattertext를 활용하여 시각화하였다. 시각화 결과에서 기록관리 연구 분야는 두 그룹으로 나누어졌는데 첫 번째 그룹(과거)에는 "아카이빙", "국가기록관리", "표준화", "공문서", "기록관리제도" 등의 키워드가 빈도가 높게 나타났으며, 두 번째 그룹(현재)에는 "공동체", "데이터", "기록정보서비스", "온라인", "디지털 아카이브" 등의 키워드가 주요한 관심을 받고 있는 것으로 나타났다.

주요 학문분야 비교를 통한 국내 정보공개 연구동향 분석 (Analyzing Domestic Research Trends on Disclosure of Information By Comparing Major Academic Disciplines)

  • 배나윤;오효정
    • 정보관리학회지
    • /
    • 제41권2호
    • /
    • pp.295-316
    • /
    • 2024
  • 연구동향 분석은 학문의 지속가능한 발전과 미래를 위해 반드시 필요한 작업으로, 선행연구의 가치를 이해하고 후속 연구의 기반을 마련하는데 중요한 수단이 된다. 본 연구는 국내 정보공개 관련 연구동향을 비교 분석함으로써 다양한 학문에서 바라본 정보공개의 미래 융합연구 방향성에 대한 시사점을 도출하고자 한다. 이를 위해 한국학술인용색인(KCI)에 정보공개 관련 논문이 처음 등장한 2002년부터 2023년까지의 출판빈도와 세부 학문별 논문 게재 추이를 시계열에 따라 분석하였다. 또한, 정보공개 관련 주요 학문 분야인 법학, 행정학, 문헌정보학의 논문명과 저자 키워드를 대상으로 네트워크 분석과 LDA 토픽모델링 기법을 활용하여 각 학문별 주요 키워드 관계와 특화된 연구주제를 시각화하고 비교하였다. 분석 결과, 법학은 주로 법적 규제와 정책 개선을 중심으로, 행정학은 사회적 요구 변화와 행정기관에서의 구체적인 운영 방안을, 문헌정보학은 기록과 정보의 관리에 대한 실무적 접근을 중심으로 연구가 이루어졌다. 이에 기반한 미래 연구 방향으로는 법학 분야의 정책 연구에 행정학 분야의 사회적 변화 연구를 결합하고, 문헌정보학의 실무적 관점에서 접근하여 현실적인 정책과 실행가능한 운영 지침 개발 등을 들 수 있다. 이러한 융합연구는 정보공개제도의 체계적이고 효율적인 수행을 가능하게 하여 국민의 알권리 보장과 국정 투명성 제고에 기여할 수 있을 것이다.