• Title/Summary/Keyword: 학술적 텍스트

Search Result 1,089, Processing Time 0.027 seconds

An Effective Method using Sketch Interface for Image Retrieval (스케치 인터페이스를 이용한 효과적인 영상 검색)

  • Jeong, Se-Yoon;Kim, Kyu-Heon;Lee, Jae-Yeon;Bae, Young-Lae J.
    • Annual Conference of KIPS
    • /
    • 2000.10b
    • /
    • pp.875-878
    • /
    • 2000
  • 내용 기반 영상 검색은 일반적으로 질의 영상을 사용해서 검색한다. 대부분의 사용자는 검색 당시에 자신이 생각하는 질의와 일치하는 영상을 실제로 갖고 있지 않다. 사용자는 검색기가 제공하는 샘플이나 자신이 갖고 있는 영상 중에서 검색하고자 하는 개념과 비슷한 영상을 질의 영상으로 사용한다. 그러나, 이 질의 영상은 사용자가 생각하는 개념을 충분히 반영하지 못하는 경우가 대부분이다. 따라서 사용자는 자신이 원하는 결과를 얻기 위해서 검색을 여러 번 하게 된다. 이는 최초 검색에서 적절한 질의 영상을 사용하지 못하고 있기 때문이다. 검색 시스템의 검색엔진도 중요하지만, 적절한 질의의 사용 여부에 의해 검색 결과가 크게 좌우된다. 적절한 질의 사용의 중요성은 기존의 텍스트 기반 검색에서 이미 알려진 사실이다. 영상 검색에서도 효과 적인 검색을 위해서는 사용자가 생각하는 질의 영상을 구체화하여 질의로 사용하는 기술이 필요하다. 이러한 관점에서, 사용자가 검색하고자 하는 추상적인 개념을 구체화하여 질의 영상으로 사용한다면 검색 성능을 높일 수 있다. 본 논문에서는 사용자가 생각하고 있는 추상적인 질의를 구체화하기 위해 스케치 인터페이스를 개발하였다. 스케치 인터페이스를 통해서 사용자가 생각한 질의를 구체화하여 이를 검색에 활용함으로서 전체 검색 회수를 줄임으로서 보다 빠른 시간에 효과적으로 검색을 수행할 수 있었다.

  • PDF

Variable Length Passage Retrieval for Q&A System (질의 응답 시스템을 위한 가변 길이 단락 검색)

  • Lee, Young-Shin;Hwang, Young-Sook;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.259-266
    • /
    • 2002
  • 질의 응답 시스템에서 보다 정확하게 정답을 판별하기 위해서는 구문분석 혹은 의미분석 등과 같은 복잡도가 높은 분석작업이 요구되며, 이러한 질의 응답 시스템 성능의 상한을 결정하는 검색 시스템은 가급적 적은 양의 검색 결과를 내주어서 질의 응답 시스템이 처리해야 할 작업량에 대한 부담을 덜어주어야 한다. 본 논문에서는 이러한 요구를 만족시키는 검색 시스템으로 가변 길이 단락 검색 시스템(variable length passage retrieval system)을 제안한다. 제안하는 검색 시스템은 질의에 대한 정답을 포함하고 있을 가능성이 있는 텍스트 영역은 질의에 따라 그 크기가 다를 것이라는 가정으로부터 출발한다. 그러므로 문서 전체를 검색하거나 고정 길이 단락으로 나누어져 색인되어 있는 부분 문서들을 검색하는 기존의 검색 방법과 달리, 제안된 시스템은 문서에서 임의의 길이로 이루어진 단락을 대상으로 동적인 단락 검객을 수행한다. TREC QA track의 질의집합 중 1번부터 100번까지의 질의에 대해 실험을 수행한 견과, 문서 검색 시스템이나 고정 길이 단락 검색 시스템은 상위 1000개의 문장까지 검색을 하였을 때 각각 96%, 98%의 재현율을 보인 반면, 가변 길이 단락 검색 시스템은 800개의 문장만으로도 98%의 재현율을 보이고, 900개의 문장을 검색하였을 경우 100%의 재현율을 보였다.

  • PDF

Korea-English Noun Phrase Machine Translation (한국어와 영어의 명사구 기계 번역)

  • Cho, Hee-Young;Seo, Hyung-Won;Kim, Jae-Hoon;Yang, Sung-Il
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.273-278
    • /
    • 2006
  • 이 논문에서 통계기반의 정렬기법을 이용한 한영/영한 양방향 명사구 기계번역 시스템을 설계하고 구현한다. 정렬기법을 이용한 기계번역 시스템을 구축하기 위해서는 않은 양의 병렬말뭉치(Corpus)가 필요하다. 이 논문에서는 병렬 말뭉치를 구축하기 위해서 웹으로부터 한영 대역쌍을 수집하였으며 수집된 병렬 말뭉치와 단어 정렬 도구인 GIZA++ 그리고 번역기(decoder)인 PARAOH(Koehn, 2004), RAMSES(Patry et al., 2002), MARIE(Crego et at., 2005)를 사용하여 한영/영한 양방향 명사구 번역 시스템을 구현하였다. 약 4만 개의 명사구 병렬 말뭉치를 학습 말뭉치와 평가 말뭉치로 분리하여 구현된 시스템을 평가하였다. 그 결과 한영/영한 모두 약 37% BLEU를 보였으나, 영한 번역의 성공도가 좀더 높았다. 앞으로 좀더 많은 양의 병렬 말뭉치를 구축하여 시스템의 성능을 향상시켜야 할 것이며, 지속적으로 병렬 말뭉치를 구축할 수 있는 텍스트 마이닝 기법이 개발되어야 할 것이다. 무엇보다도 한국어 특성에 적합한 단어 정렬 모델이 연구되어야 할 것이다. 또한 개발된 시스템을 다국어 정보검색 시스템에 직접 적용해서 그 효용성을 평가해보아야 할 것이다.

  • PDF

Adaptive English Context-Sensitive Spelling Error Correction Techniques for Language Environments (언어 사용환경에 적응적인 영어 문맥의존 철자오류 교정 기법)

  • Kim, Minho;Jin, Jingzhi;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.133-136
    • /
    • 2015
  • 문서 교정기에서 문맥의존 철자오류를 교정하는 방법은 크게 규칙을 이용한 방법과 통계 정보를 이용한 방법으로 나뉜다. 한국어와 달리 영어는 오래전부터 통계 모형에 기반을 둔 문맥의존 철자오류 교정 연구가 활발히 이루어졌다. 그러나 대부분 연구가 문맥의존 철자오류 교정 문제를 특정 어휘 쌍을 이용한 분류 문제로 간주하기 때문에 실제 응용에는 한계가 있다. 또한, 대규모 말뭉치에서 추출한 통계 정보를 이용하지만, 통계 정보 자체에 오류가 있을 경우를 고려하지 않았다. 본 논문에서는 텍스트에 포함된 모든 단어에 대하여 문맥의존 철자오류 여부를 판단하고, 해당 단어가 오류일 경우 대치어를 제시하는 영어 문맥의존 철자오류 교정 기법을 제안한다. 또한, 통계 정보의 오류가 문맥의존 철자오류 교정에 미치는 영향과 오류 발생률의 변화가 철자오류 검색과 교정의 정확도와 재현율에 미치는 영향을 분석한다. 구글 웹데이터에서 추출한 통계 정보를 바탕으로 통계 모형을 구성하고 평가를 위해 브라운 말뭉치에서 무작위로 2,000문장을 추출하여 무작위로 문맥의존 철자오류를 생성하였다. 실험결과, 문맥의존 철자오류 검색의 정확도와 재현율은 각각 98.72%, 95.79%였으며, 문맥의존 철자오류 교정의 정확도와 재현률은 각각 71.94%, 69.81%였다.

  • PDF

Accuracy Improvement of Self-knowledge Learning by Filtering Triple (트리플 필터링을 통한 한국어 자가 지식 학습 정확률 향상)

  • Lee, Jisu;Kim, Kyounghun;Choi, Su Jeong;Park, Seong-Bae;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.174-177
    • /
    • 2015
  • 자가 지식 학습 프레임워크는 자연어 텍스트에서 지식 트리플을 생성하기 위한 방법 중 하나로, 문장의 의존 관계 트리 상에서 주어 개체와 목적어 개체 사이의 관계를 패턴으로 학습해 이 패턴을 바탕으로 새로운 지식 트리플을 생성한다. 그러나 이 방법은 의존 관계 트리를 생성하는 도구의 성능에 영향을 받을 뿐만 아니라 생성된 지식 트리플을 반복적으로 사용하는 자가 지식 학습의 특성상 오류가 누적될 가능성이 있다. 이러한 문제점을 해결하기 위해서 본 논문에서는 자가 지식 학습 프레임워크에서 생성된 지식 트리플을 TransR 신뢰도 함수를 사용해 신뢰도 값을 측정하여 그 값에 따라 지식 트리플을 필터링하는 방법을 제안한다. 실험 결과에 따르면 필터링 된 지식 트리플들이 그렇지 않은 지식 트리플들에 비하여 더 높은 정확률을 보여주어, 제안한 방법이 자가 지식 학습 프레임워크의 정확률 향상에 효과적임을 증명하였다.

  • PDF

Health Diagnosis System of Oriental Medicine Using fuzzy ART Algorithm (퍼지 ART 알고리즘을 이용한 한방 진단 시스템)

  • Son, Jeong-Yeol;Jo, Sung-Joo;Kim, Mang-Nam;Kim, Kwang-Baek;No, Hyun-Chan
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2008.08a
    • /
    • pp.187-192
    • /
    • 2008
  • 최근 자신의 건강에 대한 관심이 고조되고 있는 반면, 현재 대부분 On-line에서 제공되는 진단 서비스 시스템은 질병 명을 이용하여 질병에 대한 처방이나 민간요법 등을 제시하고 있다. 이에 질병에 대해 전문지식이 부족한 일반인들이 이용하기에는 어려움이 있다. 따라서 본 논문에서는 On-line에서 퍼지 ART 알고리즘을 이용하여 사용자가 제시한 증상을 바탕으로 이미 학습되어진 질병의 증상과 비교하여 신경망을 통해 유사도가 높은 상위 3개의 질병을 도출한다. 도출된 질병에 대해 질병의 전체적인 증상과 동의보감에서 제시한 민간요법을 결과로 출력한다. 질병 데이터베이스는 서울대학교에서 교육용으로 출판한 가정의학(家庭醫學)을 기초로 동의보감과 한방의학백과서적을 통해 한의학 전문의의 검증을 거쳐 생성하였다. 그리고 본 시스템은 전문의의 상담시스템을 지원한다. 전문의의 상담시스템을 이용하여 자택 및 직장에서 편리하게 전문의의 진료와 소견을 받을 수 있도록 하였다. 전문의 상담 시스템은 전문의가 서버에 접속한 상태에서 사용자의 진로 신청으로 연결되며, 텍스트 데이터 및 기존의 진료기록이 있다면 이를 기반으로 전문의의 진단을 유도하도록 한다. 제안된 한방 자가 진단 시스템을 한의학 전문의가 분석한 결과 기존의 질병 진단 시스템 보다 일반성이 개선된 것을 확인하였다.

  • PDF

A Comparison Test on the Potential Utility between Author Profiling Analysis(APA) and Author Co-Citation Analysis(ACA) (저자프로파일링분석과 저자동시인용분석의 유용성 비교 검증)

  • Ryoo, Jong-Duk;Choi, Eun-Ju
    • Journal of the Korean Society for information Management
    • /
    • v.28 no.1
    • /
    • pp.123-144
    • /
    • 2011
  • This study compared Author Profiling Analysis(APA) to Author Co-Citation Analysis (ACA). The former is a new analytic technique on the intellectual structure of a science whereas the latter is a traditional analytic technique. The purpose of this study was to propose appropriate methods to analyze intellectual structure of a science in the Korean research environment. In order to achieve the goal, this study adopted APA using Text Mining for analysis on the intellectual structure of a science rather than relying on citation index in order to determine a potential utility of the new analytic technique that can identify the intellectual structure.

Online Reputation Analysis of Dietary Supplements based on Sentiment Analysis (감성 분석을 이용한 다이어트 보조 식품에 대한 온라인 평판분석)

  • Lee, So-Hee;Lee, Jin-Yeong;Kim, Hyon Hee
    • Annual Conference of KIPS
    • /
    • 2018.05a
    • /
    • pp.306-308
    • /
    • 2018
  • 본 연구에서는 체중 감량을 위해 무분별한 다이어트 식품의 남용을 막고, 다이어트 보조 식품에 대한 정보를 제공하기 위해서 감성 분석을 활용하여 다이어트 보조 식품에 대한 온라인 후기를 분석하였다. 먼저, 다이어트 보조 식품을 그 특성에 따라 네 가지 종류로 분류하고 각 카테고리 별로 긍정 및 부정 점수를 계산하였다. 이를 위해 체중 감량에 대한 감성 사전을 다이어트 식품에 대한 후기를 텍스트 마이닝하여 구축하였다. 특히 부작용이 있는 식품에 대한 부정 점수에 가중치를 두기 위해서 WHO-ART 에서 정의한 부작용 용어에는 가중치를 두어 처리하였다. 분석 결과 단백질 보충 식품군이 긍정 점수가 가장 높게 나타났고, 이는 다이어트를 위한 목적 이외에도 운동을 전문적으로 하는 사람들에게 오랜기간 사용되어 왔기 때문인 것으로 해석된다. 또한 식욕 억제제 식품군이 긍정점수는 가장 낮고 부정 점수는 가장 높게 나타났는데, 이는 식욕억제제의 주성분인 펜타민에 의한 가능성이 클 것이라고 예측된다.

Automate authentication processes with user information (사용자 정보를 이용한 인증 절차 자동화)

  • Hwang, Woo Seob;Park, JiSu;Shon, Jin Gon
    • Annual Conference of KIPS
    • /
    • 2019.10a
    • /
    • pp.1125-1128
    • /
    • 2019
  • 사용자가 인터넷을 사용할 때 화면에 표시되는 텍스트나 그래픽 등을 웹 문서라고 하며 HTML5는 웹 문서를 제작하는 표준 언어의 일종이다. HTML5 중에서 web storage는 사용자가 인터넷을 통한 서비스를 받을 때 데이터를 저장하기 위한 기능으로 키와 값의 형태로 저장한다. web storage는 서버 측에서 사용되는 session storage와 클라이언트에서 사용되는 local storage가 있다. local storage 사용 시 데이터를 클라이언트에 평문 형태로 저장하며 만료 기간 없이 영구적인 특징을 갖고 있다. 이러한 특징은 공격자로부터 XSS 등의 공격에서 저장된 데이터의 접근 및 수정 그리고 탈취할 수 있어 공격자의 의도에 따라 데이터 가공 및 재사용이 가능하다는 문제가 있다. 보안 취약점 문제를 해결하기 위한 최근 연구들은 local storage에 저장된 데이터들을 암호화하여 기밀성을 높였다. 그러나 데이터 암호화를 사용하려면 잦은 암호 입력이나 온라인에서만 사용할 수 있다는 또 다른 문제점을 가지고 있다. 기존 보안 취약점 문제와 기존 연구의 문제점을 동시에 해결하기 위해 운영체제 사용자 정보와 기기의 정보를 활용하여 암호화에 필요한 사용자 인증을 자동화하였으며 검증을 위해 코드를 구현하고 테스트 하였다.

Effect of Project Communication caused by Visual Language under Project Environments (Visual Language를 통한 의사소통이 프로젝트에 미치는 영향에 관한 연구)

  • Kim, MinSeon;Lee, SeoukJoo;Oh, TaeWon
    • Annual Conference of KIPS
    • /
    • 2012.04a
    • /
    • pp.1151-1154
    • /
    • 2012
  • Visual Language란 텍스트로 이루어진 문장이나 스프레드시트와 같은 도표형식의 정보전달과는 달리 전달하고자하는 사항을 가시화하여 그래프나 이미지 등으로 한 눈에 알아볼 수 있도록 하는 시각언어를 말한다. 본 논문에서는 전달방법에 따른 의사소통의 효과를 측정하는 연구모형을 제시하여 Visual Language와 Non-Visual Language를 통한 의사소통의 차이점을 비교 분석하였다. 연구결과 Visual Language를 통한 의사소통은 Non-Visual Language를 사용하는 것 보다 신속성 과 정확성 면에서 의사전달에 효과적이라는 사실을 알아낼 수 있었으며 Visual Language를 통한 의사소통은 프로젝트에 긍정적인 영향을 미친다는 사실을 밝혀내었다. 본 연구의 성과로는 프로젝트 관리 시 발생하는 각종 상황을 이해관계자에게 전달하는 수단으로 가시화된 언어를 사용하여 전달하고자 하는 바를 빠르고 정확하게 숙지시켜 원활한 소통을 지양하고 이로 인하여 프로젝트 성공률을 높이는 방안에 기여하는데 있다.