• 제목/요약/키워드: semantic retrieval

검색결과 398건 처리시간 0.024초

하이퍼미디어.멀티미디어.하이퍼텍스트: 정의(定義)와 개관(槪觀) (Hypermedia, Multimedia and Hypertext: Definitions and Overview)

  • 김지희
    • 정보관리연구
    • /
    • 제25권1호
    • /
    • pp.24-46
    • /
    • 1994
  • 본 논문은 하이퍼미디어, 멀티미디어, 하이퍼텍스트의 정의(定義)와 개관(槪觀)에 관한 것이다. 하이퍼텍스트에서는 관련 정보가 노드의 형태로 분류되며, 각 노드는 링크로 서로 연결된다. 하이퍼텍스트의 경우, 노드는 텍스트 혹은 그래픽 정보를 소장하고 있다. 멀티미디어에서는 여러 유형의 미디어(음성, 애니메이션, 텍스트, 그래픽, 비디오)가 결합된다. 하이퍼미디어는 하이퍼텍스트와 멀티미디어의 확장으로 볼 수 있다. 하이퍼미디어에서는 시스템에서 정보를 조직(組織)함에 있어서 노드와 링크를 사용하는 하이퍼텍스트의 개념(槪念)에 기초하고 있으며, 이런 경우 노드는 위의 멀티미디어 정의에서 언급된 여러 데이터 유형(類型)으로 구성된다. '노드와 링크' 개념은 하이퍼미디어 시스템에서 정보(情報)를 조직(組織)하는데 사용된다. 하이퍼미디어 시스템 계발의 새로운 접근방법은 지식기반(知識基盤) 접근(接近)이다. Joel Peing-Ling Loo는 지식기반 접근이 이러한 종류의 기술을 다루는 데 가장 효과적(效果的)이라고 제안하였다. 의미기반(意味基盤) 하이퍼미디어 모형(模型)이 정보책임, 유지와 검색을 표현하는데 있어서의 제한점(制限點)에 대한 해결책으로서 개발되었다. 정보의 지식기반(知識基盤) 표현은 전통적인 데이터 구조의 사용을 포함한다. 이러한 데이터 구조는 전문가(專門家) 시스템에서 사용되는 프레임(객체(客體)), 슬롯, 계승이론을 사용한다. 이러한 객체들이 데이터베이스에 포함되기 때문에 관계가 여러 객체 사이에서 개발되었으며, 또한 관계는 프레임이 속하는 어트리뷰트에 의하여 프레임 사이에서 존재(存在)할 수 있다.

  • PDF

신경심리학적 이론에 근거한 수학학습장애의 유형분류 및 심층진단검사의 개발을 위한 기초연구 (Neuropsychological Approaches to Mathematical Learning Disabilities and Research on the Development of Diagnostic Test)

  • 김연미
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제14권3호
    • /
    • pp.237-259
    • /
    • 2011
  • 수학 학습장애는 정상적인 수학적 역량 획득을 저해하는 학습 장애의 한 유형으로, 아동, 청소년의 5- 10% 정도가 겪는 학습 장애의 한 분야이다. 현재 수학학습장애를 진단하기 위하여 기초학력평가나 표준화된 검사가 사용되고 있다. 검사 결과를 토대로 아동의 사전지식을 파악하고, 취약한 영역을 찾는 것 역시 중요하다. 본 연구는 수학학습장애의 유형을 파악하고, 중재의 출발점을 알려줄 수 있는 포괄적인 진단 검사가 포함해야 하는 구성요소를 찾는 것을 목표로 하고 있다. 이를 위하여 신경심리학적 이론에 근거하여 수학학습에 영향을 주는 기본적인 인지적 요인들을 찾고, 관련되어 활성화 되는 두뇌 영역과 그들의 세부적 기능을 살펴본다. 또 수학학습장애 아동의 신경심리학적 특징을 살펴 본 다음 수학학습장애의 유형을 분류한다. 그 결과를 바탕으로 교육현장에서 사용될 수 있는 심층 진단 검사의 개발을 위한 기초연구를 수행하고자 한다.

지질용어 시소러스 시스템의 설계 및 구축 (Design and Implementation of Thesaurus System for Geological Terms)

  • 황재홍;지광훈;한종규;연영광;류근호
    • 한국지리정보학회지
    • /
    • 제10권2호
    • /
    • pp.23-35
    • /
    • 2007
  • 최근 정보 검색 분야에서 시맨틱 웹 기술에 따른 인터넷 용어사전과 더불어 시소러스의 필요성이 더욱 중요시되고 있다. 시소러스는 분류와 사전의 결합으로 상위 및 하위개념 사이의 전후관계를 명확히 하기 위해서 공식적으로 조직, 통제된 색인어의 어휘로 인간의 학습, 탐구활동 등 제반 지식활동의 대상이 되는 개념(용어)간의 관계를 표현한 지식구조의 토픽 맵이다. 하지만 시소러스가 용어의 통제 및 표준화와 더불어 정보를 능률적으로 처리하고 검색하는데 필수적인 수단으로 평가되고 있음에도 불구하고 아직까지 지질분야에서 우리말 시소러스가 없는 실정이다. 시소러스를 구축하기 위해서는 표준화되고 잘 정의된 지침이 필요하다. 이러한 표준화된 지침은 보다 효율적인 정보 관리를 가능하게 할 것이며, 정보 이용자 또한 보다 정확한 정보를 쉽고 편리하게 이용할 수 있게 될 것이다. 본 연구는 지질정보 중 가장 기본이 되는 용어 시소러스 시스템 구축 연구이다. 이를 위해서 첫째, 국내외 지질용어 표준화 동향을 살펴보았다. 둘째, 15개 분야에 대한 지질학적 주제를 정하고 각 주제에 대한 분류체계(안)를 마련하였다. 셋째, 지질용어 시소러스 분류체계를 바탕으로 지질용어 시소러스 명세서를 작성하였다. 마지막으로 이 명세서를 이용하여 인터넷기반 지질용어 시소러스 시스템을 설계하고 구축하였다.

  • PDF

멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 (A News Video Mining based on Multi-modal Approach and Text Mining)

  • 이한성;임영희;유재학;오승근;박대희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권3호
    • /
    • pp.127-136
    • /
    • 2010
  • 정보 통신기술이 발전함에 따라 멀티미디어 데이터를 포함하는 디지털 기록물의 양은 기하급수적으로 증가하고 있다. 특히 뉴스 비디오는 시대상을 반영하는 풍부한 정보를 내포하고 있으므로, 이를 효과적으로 관리하고 분석하기 위한 뉴스 비디오 데이터베이스 및 뉴스 비디오 마이닝은 광범위하게 연구되어왔다. 그러나 현재까지의 뉴스 비디오 관련 연구들은 뉴스 기사에 대한 브라우징, 검색, 요약에 치중되어 있으며, 뉴스 비디오에 내재되어 있는 풍부한 잠재적 지식을 탐사하는 고수준의 의미 분석 단계에는 이르지 못하고 있다. 본 논문에서는 뉴스 비디오 클립과 스크립트를 동시에 이용하는, 멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 시스템을 제안한다. 제안된 시스템은 텍스트 마이닝의 군집분석을 통해 뉴스 기사들을 자동 분류하고, 분류 결과에 대해 기간별 군집 추이그래프, 군집성장도 분석 및 네트워크 분석을 수행함으로써, 뉴스 비디오의 기사별 주제와 관련한 다각적 분석을 수행한다. 제안된 시스템의 타당성 검증을 위하여 "2007년 제2차 남북 정상회담" 관련 뉴스 비디오를 대상으로 뉴스 비디오 분석을 수행하였다.

XGBoost와 교차검증을 이용한 품사부착말뭉치에서의 오류 탐지 (Detecting Errors in POS-Tagged Corpus on XGBoost and Cross Validation)

  • 최민석;김창현;박호민;천민아;윤호;남궁영;김재균;김재훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권7호
    • /
    • pp.221-228
    • /
    • 2020
  • 품사부착말뭉치는 품사정보를 부착한 말뭉치를 말하며 자연언어처리 분야에서 다양한 학습말뭉치로 사용된다. 학습말뭉치는 일반적으로 오류가 없다고 가정하지만, 실상은 다양한 오류를 포함하고 있으며, 이러한 오류들은 학습된 시스템의 성능을 저하시키는 요인이 된다. 이러한 문제를 다소 완화시키기 위해서 본 논문에서는 XGBoost와 교차 검증을 이용하여 이미 구축된 품사부착말뭉치로부터 오류를 탐지하는 방법을 제안한다. 제안된 방법은 먼저 오류가 포함된 품사부착말뭉치와 XGBoost를 사용해서 품사부착기를 학습하고, 교차검증을 이용해서 품사오류를 검출한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로 일반적인 분류기로서 오류를 검출할 수 없다. 따라서 본 논문에서는 매개변수를 조절하면서 학습된 품사부착기의 출력을 비교함으로써 오류를 검출한다. 매개변수를 조절하기 위해서 본 논문에서는 작은 규모의 오류부착말뭉치를 이용한다. 이 말뭉치는 오류 검출 대상의 전체 말뭉치로부터 임의로 추출된 것을 전문가에 의해서 오류가 부착된 것이다. 본 논문에서는 성능 평가의 척도로 정보검색에서 널리 사용되는 정밀도와 재현율을 사용하였다. 또한 모집단의 모든 오류 후보를 수작업으로 확인할 수 없으므로 표본 집단과 모집단의 오류 분포를 비교하여 본 논문의 타당성을 보였다. 앞으로 의존구조부착 말뭉치와 의미역 부착말뭉치에서 적용할 계획이다.

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.

Structural SVM을 이용한 백과사전 문서 내 생략 문장성분 복원 (Restoring Omitted Sentence Constituents in Encyclopedia Documents Using Structural SVM)

  • 황민국;김영태;나동열;임수종;김현기
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.131-150
    • /
    • 2015
  • 영어와 달리 한국어나 일본어 문장의 경우 용언의 필수격을 채우는 명사구가 생략되는 무형대용어 현상이 빈번하다. 특히 백과사전이나 위키피디아의 문서에서 표제어로 채울 수 있는 격의 경우 그 격이 문장에서 더 쉽게 생략된다. 정보검색, 질의응답 시스템 등 주요 지능형 응용시스템들은 백과사전류의 문서에서 주요한 정보를 추출하여 수집하여야 한다. 그러나 이러한 명사구 생략 현상으로 인해 양질의 정보추출이 어렵다. 본 논문에서는 백과사전 종류 문서에서 생략된 명사구 즉 무형대용어를 복원하는 시스템의 개발을 다루었다. 우리 시스템이 다루는 문제는 자연어처리의 무형대용어 해결 문제와 거의 유사하나, 우리 문제의 경우 문서의 일부가 아닌 표제어도 복원에 이용할 수 있다는 점이 다르다. 무형대용어 복원을 위해서는 먼저 무형대용어의 탐지 즉 문서 내에서 명사구 생략이 일어난 곳을 찾는 작업을 수행한다. 그 다음 무형대용어의 선행어 탐색 즉 무형대용어의 복원에 사용될 명사구를 문서 내에서 찾는 작업을 수행한다. 문서 내에서 선행어를 발견하지 못하면 표제어를 이용한 복원을 시도해 본다. 우리 방법의 특징은 복원에 사용된 문장성분을 찾기 위해 Structural SVM을 사용하는 것이다. 문서 내에서 생략이 일어난 위치보다 앞에 나온 명사구들에 대해 Structural SVM에 의한 시퀀스 레이블링(sequence labeling) 작업을 시행하여 복원에 이용 가능한 명사구인 선행어를 찾아내어 이를 이용하여 복원 작업을 수행한다. 우리 시스템의 성능은 F1 = 68.58로 측정되었으며 이는 의미정보의 이용 없이 달성한 점을 감안하면 높은 수준으로 평가된다.

영양분석 API를 이용한 메뉴 라벨링 시스템 (MLS) 개발 (Development of Menu Labeling System (MLS) Using Nutri-API (Nutrition Analysis Application Programming Interface))

  • 홍순명;조지예;박유정;김민찬;박혜경;이은주;김종욱;권광일;김지영
    • Journal of Nutrition and Health
    • /
    • 제43권2호
    • /
    • pp.197-206
    • /
    • 2010
  • 본 논문에서는 영양분석 소프트웨어 인터페이스인 Nutri-API (Application Programming Interface)를 활용하여 영양표시를 위한 메뉴 라벨링 시스템을 개발하였다. 영양표시에 표시되는 각 항목들은 영양성분이 추가 또는 변경이 될 수 있도록 유연한 설계를 하였으며 본 메뉴 라벨링 시스템은 다양한 변경사항들을 사용자가 직접 수정 할 수 있도록 설계되었다. 또한, 식품단위의 정보제공뿐만 아니라, 음식 또는 식단의 영양표시 정보도 제공한다. 주요 내용을 요약 하면 다음과 같다. 식품 및 메뉴 검색 메뉴 라벨링 시스템의 식품 및 메뉴의 검색은 유의어 검색 기능과 의미 정보 및 분류 정보를 통한 검색 기능을 가지고 있으며 영양소를 검색할 수 있으며 영양소 함량 정보가 없는 경우에는 missing 표시 (-)을 하였다. 메뉴작성 및 식품관리 메뉴 라벨링 시스템은 기존 데이터베이스화된 기본 식품만을 사용하여 영양 표시에 사용하는 것뿐만 아니라, 식품의 조합인 메뉴를 포함하여 정보를 제공하였으며 Nutri-API의 NutriMenu 기능을 확장하여 메뉴 작성 기능과 추가 및 관리기능을 추가하였다. 메뉴 라벨링 시스템에서 제공되는 정보로는 메뉴설명, 메뉴이미지, 재료중량, 열량 등의 영양소, 3대 영양소비율과 원그래프 제공뿐만 아니라, 메뉴의 구성분류에 따른 영양소 정보도 제시하고 있다. 메뉴 라벨링을 위한 영양소 정보로는 농촌진흥청 모든 영양소를 포함하여 당류, 포화지방, 트랜스지방, 콜레스테롤 등이 있다. 그리고 메뉴의 영양섭취기준과 영양소기준치에 대한 비율 (%) 정보도 제공하며, 동시에 메뉴의 그리고 메뉴의 구성분류의 식품이나 중량 등을 입력/수정/변경 할 수 있다. 식품 추가 기능 본 시스템에서는 기본으로 제공되는 식품 정보 외에 시스템에서 제공하고 있지 않은 식품 또는 식품의 정보를 수정을 위해 식품 추가 기능을 제공하고 있으므로 새로운 식품을 추가하여 식품설명, 사진과 영양소 정보를 입력하여 저장할 수 있다. 기본 제공되는 식품과 구별하기 위해서 사용자 식품으로 별도 저장 및 관리한다. 메뉴 라벨링 정보 메뉴 라벨링 정보에서는 메뉴의 식품재료 중량뿐만 아니라 메뉴의 조리 후 중량, 1회 제공량 (portion size), 총 제공량 (total serving size) 등의 정보를 제공하도록 하였다. 메뉴 라벨링을 위해 추가된 식품 및 메뉴는 라벨링 항목에서 추가 및 수정이 가능하다. 메뉴 라벨링에서 추가 및 수정된 정보는 기본 메뉴 정보와는 별도로 저장 및 관리한다. 메뉴 라벨링 형식으로는 사용자는 표준형, 가로형, 선형, 쌍방형, 영양성분 전면표시형으로 출력할 수 있으며 식당의 메뉴판 영양표시형태도 출력할 수 있다. 메뉴 및 라벨링 관리 사용자가 작성한 메뉴 및 라벨링 정보의 지속적인 관리를 위해 별도의 관리기능을 제공하고 있어서 메뉴의 히스토리뿐만 아니라 이미 작성된 메뉴를 복사하여 새로운 메뉴를 작성하거나, 새로운 메뉴를 구성하는 기본 메뉴로 사용할 수 있다.