• 제목/요약/키워드: 정보의 질

검색결과 5,535건 처리시간 0.04초

정보검색에서 사용자 검색 패턴을 이용한 질의 확장 (Query Expansion Using User Search Pattern in Information Retrieval)

  • 천우관;김영도;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.771-774
    • /
    • 2001
  • 정보검색에서 가장 많이 사용되는 불리언(Boolean)검색에서는 키워드 일치에 의해서만 검색하는 단점을 가지고 있다. 이를 보완하기 위해 다양한 정보원에서 추출한 관련 용어들을 원질의어에 첨가하여 검색의 효율을 높이기 위한 질의 확장 방법들이 모색되어 왔다. 본 논문에서는 질의 확장을 위하여 사용자가 검색에 사용하였던 질의어들의 연속성을 찾아내어 첨가할 용어를 선택하고 질의 확장을 하는 방법을 제시한다. 사용자가 입력한 질의어의 연속성을 찾아내는 방법으로는 데이터 마이닝 기법중 연관 규칙 탐사 방법을 이용한다. 실험은 현재 구축된 정보통신 기술기준 정도시스템에서 사용자들이 검색한 키워드 정보를 이용하였으며 사용자 검색 패턴(USP) 정보를 이용함으로써 사용자가 검색하고자 하는 질의어와 좀더 연관성 있는 용어로 확장하여 사용자 중심적 결과를 얻을 수 있다.

  • PDF

관광 정보 검색을 위한 자연언어 질의 해석 시스템 구현 (A design and implementation of query processor for travel information retrieval system)

  • 김명철;서광준;전경헌;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.449-458
    • /
    • 1992
  • 본 논문은 관광정보검색용 한국어 자연언어 질의 해석 시스템의 모델 정립 및 구현에 대한 것이다. 본 자연언어 질의 해석 시스템은 질의로 부터 정보 검색 시스템의 검색어들을 추출한다. 이를 위하여 1만 단어 수준의 중형사전을 구축하였으며, 불용어 사전, 전거어 사전, 유사어 사전, 복합명사 사전을 구축하였다. 사전의 어휘를 추출하기 위해서 한국어 대화체 문장에 대한 자료수집과 분석을 하였으며, 관광 정보 검색 시스템의 텍스트를 분석하였다. 200여 자연언어 질의 문장으로 실험한 결과는 비교적 좋았다.

  • PDF

사회적 익명성이 커뮤니티 품질에 미치는 영향 : 표현욕구, 자기통제, 유대감의 매개효과를 중심으로 (The Effect of Social Anonymity on Community Quality : Mediated by Self Expression, Self Control, and Community Ties)

  • 신지명;김경규;박주연
    • 한국전자거래학회지
    • /
    • 제16권4호
    • /
    • pp.257-281
    • /
    • 2011
  • 본 연구에서는 구성원 간의 상호 교류가 중심인 온라인 커뮤니티를 대상으로 사회적 익명성이 커뮤니티의 품질에 미치는 영향에 대해 알아보고, 이 관계에 유의한 영향을 미치는 요인들을 규명해 보고자 한다. 구체적으로 자기표현욕구, 자기통제, 유대성의 개념을 알아보고 커뮤니티의 품질을 정보의 질, 토론의 질로 구분하여 이들이 사회적 익명성과 관계에 어떠한 역할을 하는지 분석하였다. 설문을 통한 실증적 분석 결과, 사회적 익명성은 토론의 질에 직접적 영향을 미치는 반면 정보의 질에는 직접적인 영향을 미치지 않는 것으로 나타났다. 또한 자기 표현 욕구, 유대성, 자기통제는 사회적 익명성과 토론의 질 관계에서 긍정적인 매개 역할을 하고 있음을 알 수 있고, 사회적 익명성과 정보의 질간의 관계에서도 자기표현욕구와 유대성이 긍정적인 영향을 미치는 것으로 나타났다. 본 연구 결과는 커뮤니티 품질을 개선할 수 있는 요인들을 확인함으로써 온라인 커뮤니티의 방향성과 지침에 대한 참고자료로 활용될 수 있을 것이다.

그리드 데이터베이스에서 질의 전달 최적화를 위한 캐쉬 관리 기법 (Cache Management Method for Query Forwarding Optimization in the Grid Database)

  • 신숭선;장용일;이순조;배해영
    • 한국멀티미디어학회논문지
    • /
    • 제10권1호
    • /
    • pp.13-25
    • /
    • 2007
  • 그리드 데이터베이스에서는 질의 전달 최적화를 위해 캐쉬를 사용한다. 캐쉬에 빈번히 사용되는 데이터의 메타 정보를 메타 데이터베이스에서 가져와 캐싱하며, 캐싱된 정보를 통하여 질의 전달의 비용을 감소시킨다. 기존의 캐쉬 관리 기법은 질의 전달 시 복제본의 사용빈도를 고려하지 않은 데이터의 임의의 메타 정보를 캐싱하기 때문에 사용이 불균형적인 문제가 있다. 그리고, 원본 데이터가 변경되었을 경우에 기존의 메타정보를 가진 캐쉬를 통하여 질의가 타 노드로 잘못 전달되며 이러한 과정은 여러 노드에서 반복 수행되어 네트워크 비용을 증가시킨다. 따라서 기존의 캐쉬 관리 기법은 복제본의 사용비율 불균형과 타 노드로의 잘못된 질의 전달로 인한 네트워크 비용 증가 문제의 해결이 필요하다. 본 논문에서는 질의 전달 최적화를 위한 캐쉬 관리 기법을 제안한다. 제안 기법은 캐쉬 매니저라는 관리 프로세서를 사용하여 캐쉬를 관리한다. 캐쉬 매니저는 자주 사용되는 복제본이 저장된 노드의 사용빈도를 비교하여 적게 사용된 노드의 복제본 메타 정보를 캐싱함으로써 질의 전달을 최적화한다. 또한 캐쉬 매니저를 통해 타 노드로 잘못 전달되는 질의를 줄여 질의 처리 시간을 단축하고 네트워크 비용을 줄인다. 제안 기법은 성능평가를 통해 네트워크 비용과 처리시간이 감소되어 기존의 방식에 비하여 향상된 성능을 보인다.

  • PDF

캐쉬메카니즘을 이용한 시맨틱 스키마 데이터 처리 (Semantic schema data processing using cache mechanism)

  • 김병곤;오성균
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.89-97
    • /
    • 2011
  • 네크워크상의 분산되어 있는 정보를 접근하는 온톨로지와 같은 시맨틱 웹 정보 시스템에서는 효율적인 질의 처리를 위하여 질의 응답 시간을 줄여주는 향상된 캐쉬 메카니즘을 필요로 한다. 특히, P2P 네트워크 시스템은 웹 환경의 기본적인 하부 구조를 이루고 있으며, 질의가 발생하면, 소스 피어(Peer)로의 데이터 전송량을 줄이는 문제가 효율적인 질의 처리의 중요한 부분이다. 전통적인 데이터베이스 캐쉬 메카니즘으로부터 현재의 웹 환경에 적합한 질의 메카니즘들이 연구되어 왔으며, 질의 처리 결과를 캐쉬하는 것은 입력 질의 요구를 빠른 시간에 바로 사용자에게 전달할 수 있다. 웹 환경에서는 시맨틱 캐싱 방법이 연구되어 왔으며, 이는 캐쉬를 의미적인 영역들로 이루어진 공간으로 관리하는 개념이며, 논리적인 캐싱 단위가 질의와 질의 결과이므로 웹 환경에서 적합한 개념이다. 본 연구에서는 온톨로지와 같은 시맨틱 웹 정보가 클러스터 단위로 여러 피어에 분산되어 있는 경우에 캐쉬 메카니즘을 이용하여 효율적인 질의 처리가 이루어지도록 하는 방법을 제시한다. 특히, 캐쉬를 유지하고 처리하는 방법으로 스키마를 이용한 캐쉬 데이터 필터링 방법과 온톨로지와 질의 결과의 유사도를 측정하여 캐쉬 대체 영역 선택에 사용하는 방법을 제시한다.

자연언어 질의 문장의 용어 가중치 부여 기법 (Term Weighting Method for Natural Language Query Sentence)

  • 강승식;이하규;손소현;문병주;홍기채
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.223-227
    • /
    • 2002
  • 자연언어 질의 문장으로부터 검색어로 사용될 질의어의 추출 및 질의어 가중치를 계산하기 위하여 질의 문장들의 유형을 분석하였으며, 질의어 구문의 특성에 따라 용어들의 가중치를 계산하는 방법을 제안하였다. 용어의 가중치를 부여할 때 띄어쓴 복합명사와 접속 관계 등에 의해 연결된 명사구는 질의어 가중치를 동등하게 적용할 필요가 있다. 질의 문장에서 가중치가 동등하게 적용되는 명사구를 인식하기 위한 목적으로 구현된 명사구 chunking을 수행한 후에 각 용어들에 대한 질의어 가중치를 계산한다. 질의어 가중치를 계산하기 위하여 용어의 유형, 질의 구문의 특성, 문서 유형을 지칭하는 용어, 조사 유형, 용어의 길이 등에 따라 가중치를 조절하는 방법을 사용한다. 용어유형에 의한 가중치 계산은 추출된 용어의 품사 정보와 전문 용어 사전, 부사성 명사 사전을 이용하였다.

  • PDF

OWL 인식 관계형 모델에서 SQL 기반의 시맨틱 질의 처리 (SQL-based Semantic Query Processing in the OWL-aware Relational Model)

  • 김학수;손진현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권1호
    • /
    • pp.44-53
    • /
    • 2008
  • 온톨로지 기반의 애플리케이션에 대한 사용이 증가함에 따라 시맨틱 정보를 효율적으로 저장 및 처리하는 것이 중요하게 다루어지고 있다. 비록 몇몇의 관련된 시스템들이 개발되어왔지만, 이들은 시맨틱 데이타의 크기, 시맨틱 질의 처리의 성능 시맨틱 데이타 유지관리의 관점에서 몇몇 제한을 가지고 있다. 본 논문에서는 온톨로지 관리 시스템을 위한 OWL 인지 관계형 모델을 제안하고 이를 이용하는 SQL 기반의 시맨틱 질의 처리 메커니즘을 제안한다. 또한 질의 처리 성능에 대한 검증을 위해 Sesame와 비교를 통해서 좀 더 효율적임을 보여준다.

유사한 질의쌍의 어휘 번역확률을 이용한 질의 분류 (Query Classification Based on Translation Probabilities of Similar Query Pair)

  • 김설영;장계훈;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.443-446
    • /
    • 2010
  • 질의 분류에서 어휘의 다양한 표현으로 인한 어휘 불일치문제는 성능저하의 주요 원인이다. 본 논문에서는 야후!앤써 질의응답 아카이브를 이용해서 같은 카테고리의 질의-질의쌍들에 대해 어휘-어휘 번역확률을 계산하는 방법을 제안한다. 정보검색에서 우수한 성능을 보인 어휘 사이의 번역확률을 반영하는 번역기반 언어모델이 질의 분류에서 유효함을 확인하였고 언어모델과의 비교실험을 통해 성능향상을 보였다. 어휘관계를 측정하는 방법에서 번역확률 계산방법에 따른 성능측정에서 전체 질의-대답쌍들에 대해 번역확률을 계산하는 것보다 같은 카테고리에 속하는 질의-질의쌍들에 대해 번역확률을 계산하는 것이 분류를 위해 더 좋은 번역확률임을 확인하였다.

RDF/S 및 OWL 문서에 대한 키워드 검색 알고리즘 (A New Keyword Search Algorithm for RDF/S and OWL Documents)

  • 김학수;손진현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.321-324
    • /
    • 2009
  • XML 또는 RDBMS 에서의 키워드 검색은 기존의 정보 검색처럼 데이터의 구조 또는 질의 언어에 대한 사전 지식 없이 질의 처리를 수행하는 연구 분야 중의 하나이다. 오늘날 키워드 검색을 효율적으로 처리하기 위해 제안된 연구들은 그래프 기반의 질의 처리에 기반한 기법들에 초점을 두고 있다. 이러한 접근들은 XML 또는 RDBMS 안에 존재하는 데이터를 그래프 구조에 기반한 데이터로 변환한 다음에 그래프 탐색을 통해서 모든 질의 키워드를 포함하는 결과들을 찾는다. 그러나 기존의 기법들을 RDF/S 또는 OWL 문서와 같은 복잡한 그래프 구조에 적용하기에는 질의 성능 측면에서 많은 문제점을 가지고 있다. 또한, 온톨로지 언어의 의미적 단위로서의 RDF 트리플을 고려하지 않기 때문에 질의 결과에 대한 신뢰성을 보장할 수 없다. 이러한 관점에서 본 논문은 RDF/S 또는 OWL 저장소에서 효율적이고 의미적인 키워드 검색을 위한 인덱싱 기법 및 알고리즘을 설계한다.

웹 탐색과정에서 이용자들의 정보의 판단과 선택 -정보의 질 및 권위를 중심으로 - (Judgment Decision, and Choice in Web Searching Behavior - Information Quality and Cognitive Authority -)

  • 이수영
    • 한국문헌정보학회지
    • /
    • 제36권2호
    • /
    • pp.119-138
    • /
    • 2002
  • 본 연구는 웹 환경에서 이용자들의 정보의 질과 권위에 대한 판단이 웹 탐색과정에서 정보의 선택과 이용에 어떻게 영향을 미치는가를 다루고 있다. 실험실환경에서 교수와 박사과정학생 총 16명을 대상으로 탐색실험을 실시하여, 로그 데이터, 생각 소리내어 말하기 (think-aloud), 인터뷰를 통하여 데이터를 수집하였다. 연구결과, 본 연구의 대상자들은 정보에 대한 판단을 탐색과정의 두 가지 단계에서 내리고 있음이 밝혀졌으며, 이는 예측적 판단과 평가적 판단으로 각각 분석되었다. 웹 정보의 질과 권위에 대한 판단성향과 판단에 영향을 미친 요소를 탐색과제의 유형, 이용자의 신분, 학문영역에 따라 비교하였다.