• 제목/요약/키워드: 용어 분류

검색결과 477건 처리시간 0.026초

공공기록에 대한 접근성 제고 방안에 관한 연구 - 대통령기록관 주제시소러스 개발 사례를 중심으로 - (A Study on the Improvement of Accessibility to Public Records: Based on the Construction of Subject Thesaurus for Presidential Archives)

  • 이해영;권용찬;성효주;유병후
    • 한국기록관리학회지
    • /
    • 제14권4호
    • /
    • pp.127-151
    • /
    • 2014
  • 기능별 분류체계나 출처 중심의 탐색은 이용자들에게 쉽지 않으며 키워드검색도 이용자가 입력한 검색어와 기록물명의 단순 매칭 결과만 제시하여, 이용자의 기대에 부응하지 못하고 있다. 대통령기록관에서는 주제 분류체계를 개발하여 기록검색의 효율성을 높이고자 하였으며, 이와 연계하여 이용자들의 검색 과정을 돕고 기록관리 업무에도 용어통제 등 도움을 줄 주제 시소러스를 개발하고자 하였다. 본 연구에서는 대통령기록물 건명을 형태소 분석하고, 관련 시소러스와 이용자가 웹사이트에 입력한 검색 용어 및 정보공개 청구용어 등의 현황을 면밀히 분석한 후, 주제 분류체계와의 매핑을 통해 주제시소러스를 개발한 과정을 제시한다. 또한 주제 시소러스의 업무 및 온라인 서비스에의 활용 방안을 제시하며, 앞으로의 발전방향을 제시한다.

위에서 전암병변의 분류와 임상적 의의 (Classification and Clinical Implications of Precancerous Lesions in the Stomach)

  • 김경미
    • Journal of Gastric Cancer
    • /
    • 제9권2호
    • /
    • pp.46-50
    • /
    • 2009
  • 암종화 과정 중 침윤성 암종의 발생에 선행하는, 형태학적으로 인지되는 병변이 전암병변이다. 그러나 전암병변의 임상적인 중요성에도 불구하고 전암병변에 대한 목록이나 분류에 대한 노력은 거의 전무한 실정이었다. 2001년 미국암연구소 주최 전암병변의 분류에 대한 모임에서는 전암 병변이나 비침윤성 병변에 대한 통일된 전문용어가 없음을 결론짓고 모든 주요 장기에서 전암병변의 용어와 진단 기준에 대한 협약을 할 것을 권고하였다. 이 모임에서 결정된 바에 의하면 모든 전암병변이 종양으로 진행되는 것은 아니라는 것이다. 그리고 한편으로는 종양으로서의 특성이 명확히 밝혀지지는 않았으나 암과 밀접하게 연관이 있는 것으로 밝혀진 미만성의 증식성 병변도 전암병변으로 분류하였다. 본 종설은 이러한 전암병변의 정의 및 분류 체계에 맞추어 인체의 주요 장기인 위에서의 전암병변을 분류하고 그 임상적 의의를 알아보고자 한다.

  • PDF

한글 형태소 및 키워드 분석에 기반한 웹 문서 분류 (Web Document Classification Based on Hangeul Morpheme and Keyword Analyses)

  • 박단호;최원식;김홍조;이석룡
    • 정보처리학회논문지D
    • /
    • 제19D권4호
    • /
    • pp.263-270
    • /
    • 2012
  • 최근 초고속 인터넷과 대용량 데이터베이스 기술의 발전으로 웹 문서의 양이 크게 증가하였으며, 이를 효과적으로 관리하기 위하여 문서의 주제별 자동 분류가 중요한 문제로 대두되고 있다. 본 연구에서는 한글 형태소 및 키워드 분석에 기초한 문서 특성 추출 방법을 제안하고, 이를 이용하여 웹 문서와 같은 비구조적 문서의 주제를 예측하여 문서를 자동으로 분류하는 방법을 제시한다. 먼저, 문서 특성 추출을 위하여 한글 형태소 분석기를 사용하여 용어를 선별하고, 각 용어의 빈도와 주제 분별력을 기초로 주제 분별 용어인 키워드 집합을 생성한 후, 각 키워드에 대하여 주제 분별력에 따라 점수화한다. 다음으로, 추출된 문서 특성을 기초로 상용 소프트웨어를 사용하여 의사 결정 트리, 신경망 및 SVM의 세 가지 분류 모델을 생성하였다. 실험 결과, 제안한 특성 추출 방법을 이용한 문서 분류는 의사 결정 트리 모델의 경우 평균 Precision 0.90 및 Recall 0.84 로 상당한 정도의 분류 성능을 보여 주었다.

도협소식

  • 한국도서관협회
    • 도서관문화
    • /
    • 제13권1호
    • /
    • pp.30-32
    • /
    • 1972
  • PDF

도협소식

  • 한국도서관협회
    • 도서관문화
    • /
    • 제11권12호
    • /
    • pp.37-40
    • /
    • 1970
  • PDF

효율적인 문서 자동 분류를 위한 대표 색인어 추출 기법 (A Feature Selection Technique for an Efficient Document Automatic Classification)

  • 김지숙;문현정;김영지;우용태
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.295-302
    • /
    • 2001
  • 최근 대량의 텍스트 문서로부터 의미 있는 패턴이나 연관 규칙을 발견하기 위한 텍스트마이닝 기법에 대한 연구가 활발히 전개되고 있다. 하지만 비정형 텍스트 문서로부터 추출된 용어의 수는 불규칙적이고 일반적인 용어가 많이 추출되는 관계로 기존의 연관 규칙 탐사 방법을 사용하게 되면 무의미한 연관 규칙이 대량으로 생성되어 지식 정보를 효과적으로 검색하기 어렵다. 본 논문에서는 연관 규칙 탐사 기법을 이용하여 비감독학습 기법에 의해 대량의 문서를 효율적으로 분류하기 위한 대표 색인어 추출 기법을 제안하였다. 컴퓨터 분야의 논문을 대상으로 각 분야별 대표 색인어를 추출하여 유사한 문서끼리 분류하는 실험을 통해 제안된 방법의 효율성을 보였다.

  • PDF

단백질 상호작용 네트워크의 개념 분류 레이아웃 (Conceptual Classification Layout of Protein-Protein Interaction Networks)

  • 방선이;최재훈;박종민;박수준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.61-63
    • /
    • 2006
  • 본 논문은 온톨로지를 이용하여 단백질 상호작용 네트워크를 개념적으로 분류하여 레이아웃하는 방법을 제안한다. 상호작용 네트워크를 이루는 단백질은 온톨로지의 표준 통제 용어에 대한 주석 정보를 가지고 있으므로 동일 분류에 해당하는 통제 용어를 가지고 있는 단백질들은 근접한 곳에 위치하도록 레이아웃한다. 이는 기존 물리적 레이아웃에 기능별 그룹화를 해줌으로써 복잡한 네트워크를 개념적으로 분석할 수 있도록 한다. 또한, 동일 분류에 속하는 단백질들을 한 노드로 대응하여 레이아웃 알고리즘을 수행함으로써 기존의 그래프표현 알고리즘 보다 빠르게 시각화할 수 있다.

  • PDF

전문가의 형태소 분류를 활용한 과학 논증 자동 채점 (Automated Scoring of Scientific Argumentation Using Expert Morpheme Classification Approaches)

  • 이만형;유선아
    • 한국과학교육학회지
    • /
    • 제40권3호
    • /
    • pp.321-336
    • /
    • 2020
  • 본 연구는 실제 교실에서 이루어진 학생의 과학 논증과정을 기계학습을 활용한 자동 채점에 적용함으로써, 논증 자동 채점의 가능성 및 개선 방향을 탐색한다. 분자 구조에 대한 고등학생의 과학 논증수업 중 발생한 2,605개의 모든 발화를 대상으로 연구를 진행하였다. 지도 학습을 위해 5가지의 논증 요소로 발화를 분류하였고, 분류된 발화를 대상으로 텍스트 전처리를 수행하였다. 전처리된 학생 발화를 활용하여 서포트 벡터 머신, 의사결정나무, 랜덤 포레스트, 인공신경망의 기계 학습 방법으로 자동 채점 모델을 구성하였다. 불용어 처리가 되지 않은 학생 발화를 활용한 자동 채점의 결과 랜덤 포레스트의 정확도는 65.96%, kappa는 0.5298의 유미한 결과를 얻었다. 불용어 처리를 수행한 학생 발화를 활용한 새로운 채점 모델의 결과 채점의 정확도가 크게 변화하지 않음에도 논증 발화 중 과학 용어 및 논증 요소의 담화표지가 채점 모델의 분류 기준이 되는 결과를 얻었다. 또한 인간 전문가의 논증 채점 과정을 분석하여 얻어진 전문가 형태소를 자동 채점 모델에 생성 규칙 알고리즘으로 적용하였다. 그 결과 의사결정나무에서 반박에 대한 재현율(recall)이 21.74% 증가하였다. 이에 본 연구 결과는 과학 교육 연구에서 기계 학습 및 논증에 대한 자동 채점의 활용 가능성과 연구 방향성을 제안하였다.

효율적인 문서검색을 위한 레벨별 불용어 제거에 기반한 문서 클러스터링 (Document Clustering based on Level-wise Stop-word Removing for an Efficient Document Searching)

  • 주길홍;이원석
    • 컴퓨터교육학회논문지
    • /
    • 제11권3호
    • /
    • pp.67-80
    • /
    • 2008
  • 오늘날 여러 문서 범주화 방법들은 문서 클러스터링 알고리즘을 통하여 의미적으로 비슷한 내용의 문서들을 클러스터로 표현한 후 클러스터링 과정에서의 결합관계를 통해 범주화하는 자동화된 방법과 미리 정의된 분류 기준에 의해 수작업으로 문서를 분류하는 방법으로 구분되어 진다. 자동화된 방법은 속도는 빠르나 의미적으로 낮은 정확성을 가지며, 수작업에 의한 분류 방법은 처리 시간과 비용이 크게 증가하는 단점이 있다. 이러한 단점들을 극복하기 위하여 본 논문에서는 각 문서가 속하는 도메인의 불용어 제거를 기반으로 하여 문서 클러스터링을 수행하여 의미적으로 명확한 클러스터를 빠르게 생성한다. 클러스터의 정확성을 높이기 위하여 생성된 클러스터에 대해 레벨 순서에 따른 불용어 제거와 문서 클러스터링 과정을 반복적으로 적용하여 카테고리 트리를 생성하고, 이를 통해 문서집합간의 상하위 관계를 표현하는 자동화된 문서 범주화 방법을 제안한다.

  • PDF

국가R&D 과제 키워드를 활용한 과학기술용어사전 구축 방안 (A Method of Building a Science Technology Glossary using National R&D Project Keyword)

  • 김태현;조우승;유은지;강남규;최광남
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.181-182
    • /
    • 2019
  • 국가과학기술지식정보서비스(NTIS)는 국가R&D 과제정보를 중심으로 참여인력, 성과(물), 참여기관 등의 정보를 연계하여 제공하고 있다. 각 과제정보는 한글 및 영문 키워드와 과학기술표준분류를 포함하고 있어, 과제정보를 중심으로 한 국가R&D정보 검색 및 분류에 활용하기 적합하다. 이러한 국가R&D정보를 서비스함에 있어 단순 검색을 벗어나 다양한 형태로 가공된 정보를 제공하기 위해서는 국가R&D 정보에 적합한 과학기술용어사전 구축이 필수적이다. 본 논문에서는 국가R&D 과제 키워드를 활용해 국가R&D정보에 적합한 과학기술용어사전을 구축하는 방안을 제안하고자 한다.

  • PDF