• 제목/요약/키워드: 정영미

검색결과 386건 처리시간 0.024초

SGML을 이용한 문헌의 구조화 및 텍스트 검색에 관한 연구 (Document Structuring and Text Retrieval Using SGML,)

  • 오민경;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1995년도 제2회 학술대회 논문집
    • /
    • pp.29-32
    • /
    • 1995
  • 본 논문에서는 SGML(Standard Generalized Markup Language)을 사용하여 텍스트 검색시스템을 구축하였다. SGML은 개괄적 마크업언어로서 문헌을 문헌요소라는 객체 단위로 이루어진 것으로 보고 이러한 문헌요소간의 관계를 표현하므로, 텍스트 검색시스템에서 SGML을 이용하면 문헌을 구조화할 수 있고 전문(full text)을 효율적으로 조직하고 검색하는 것이 가능하다.

  • PDF

편견과 차별을 넘어서 -간병인 구하기 힘들어-

  • 김영미
    • 레드리본
    • /
    • 통권55호
    • /
    • pp.12-13
    • /
    • 2003
  • 에이즈환자라고 하면 간병인을 구하기도 어려웠다. 감염인이라는 사실을 알리지 않고 간병인을 구했다가도 감염인인 것을 알고는 그만 두는 것도 문제였다. 비감염인이면서 감염인을 간병하겠다고 나서는 사람이 간혹 있을라치면 그 때는 간병비가 비감염인 간병보다 $50\%$정도 더 요구되었다.

  • PDF

이중 추출 방법을 이용한 단위 무응답의 가중치 조정방법에 관한 연구

  • 염준근;손창균;정영미
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.13-18
    • /
    • 2002
  • 이중추출(two-phase)접근방법 이용의 주목적은 관심변수와 보조변수사이의 관계를 이용해서 더 좋은 추정을 하고자 하는 것이다. 특히 이 방법은 층화, 무응답 문제에 적용하는 경우 상당히 효과적이다. 본 논문에서는 무시할 수 있는 무응답이 발생했을 때 이중추출기법을 이용해서 g-가중치와 응답확률을 각 단계별로 조정해줌으로써 무응답 보정추정량과 분산추정량을 구했다.

  • PDF

인용문헌을 이용한 검색 성능 향상에 관한 실험적 연구

  • 국민상;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.235-240
    • /
    • 2002
  • 정보검색시 전문(full-text)의 사용이 늘어남에 따라 다의어나 철자오류와 같은 문제점으로 인해 내부적인 정보원의 사용에 한계를 보이면서 외부적인 정보원, 즉 문헌간의 관계와 같은 링크 또는 인용정보에 대한 관심이 높아지게 되었다. 본 논문에서는 인용링크나 피인용링크, 서지결합링크, 동시인용링크 둥과 같은 인용정보와 적합성 피드백 검색을 이용하여 검색 성능을 향상시키는 방안에 대하여 연구하였다.

  • PDF

질의확장 검색에서의 추가용어 가중치 최적화 (Optimizing the Weight of Added Terms in Query Expansion)

  • 정영미;이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.241-246
    • /
    • 2002
  • 전역적 질의확장 검색에서 단어간 공기기반 유사도를 사용할 경우에는 질의에 추가되는 용어에 부여하는 탐색가중치로 질의와의 유사도를 사용하는 것이 일반적이다. 그러나 과연 유사도가 탐색가중치로 최적인가는 의문의 여지가 있다. 추가용어와 질의 사이의 유사도가 가지는 특성을 살펴보고 고정가중치를 부여한 경우와 비교해보았다. 또한 실험집단이나 확장범위의 영향을 덜 받는 최적화된 추가용어 가중치를 찾기 위해 여러 가지 탐색가중치 공식을 실험하였다.

  • PDF

WWW 탐색도구의 검색성능에 관한 실험적 연구 (An Experimental Study on Retrieval Performance of WWW Search Tools)

  • 이은주;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1997년도 제4회 학술대회 논문집
    • /
    • pp.59-62
    • /
    • 1997
  • 본 연구는 WWW 탐색도구의 검색성능을 평가하고, 또 검색성능에 영향을 미치는 요인들을 밝혀내기 위하여 수행되었다. 탐색도구의 데이터베이스 구축방식과 색인기법, 탐색기법, 이용자 인터페이스에 관련된 현황분석을 토대로 탐식도구의 검색성능에 영향을 미치는 요인들을 알아보기 위하여 검색실험을 수행하였다. 실험결과의 분석은 각 탐색도구의 검색효율과 검색결과의 중복도 및 유사도, 검색결과의 순위 및 적합성 순위부여 알고리즘. 웹 문서의 수집기법, 탐색도구의 최신성을 기준으로 이루어졌다.

  • PDF

한국어 텍스트 처리를 위한 줄 경계 띄어쓰기 복원 (Automatic Word-Segmentation at Line-Breaks for Korean Text Processing)

  • 정영미;이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1999년도 제6회 학술대회 논문집
    • /
    • pp.21-24
    • /
    • 1999
  • 한국어 텍스트의 줄 경계에서의 띄어쓰기 복원을 위해 음절쌍 통계를 이용한 복원 기법을 설계하고 신문기사를 대상으로 통계 정보원과 음절쌍 위치에 따른 가중치를 달리하는 실험을 수행하였다. 실험 결과 처리 대상 기사를 포함하는 1개월 분 기사를 통계 정보원으로 하고 가중치는 균등하게 할 때 가장 높은 성공률을 얻었다. 이 결과는 디지털 원문을 텍스트 방식으로 소급하여 구축하는 경우에 적용될 수 있을 것이다.

  • PDF

2-포아송 모형의 한국어 문헌 적용성 (Applicability of Two-Poisson Model to Korean Literature)

  • 최대식;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1999년도 제6회 학술대회 논문집
    • /
    • pp.9-12
    • /
    • 1999
  • 통계적 확률이론에 근거한 포아송 모형을 색인어 선정 기반으로 활용하고자 하는 2-포아송 함수와 3-포아송 함수 및 다중 포아송 함수에 대한 단계적 발전 과정을 살펴보았다. 아울러, 2-포아송이 한국어 문헌의 색인어 선정에 유용한지 알아보기 위해 한국어 말뭉치 데이터베이스 내 문헌 50개를 실험 대상으로 단어의 장서빈도와 문헌빈도를 이용하여 z값을 산출해 보았다.

  • PDF

정보자원으로서의 웹사이트 평가에 관한 연구 (Evaluation of Web Sites as Information Resources of Liraries)

  • 황혜경;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1999년도 제6회 학술대회 논문집
    • /
    • pp.95-98
    • /
    • 1999
  • 본 연구의 목적은 양질의 웹사이트를 선별하기 위한 평가 기준을 수립하고 평가 항목에 계량적인 평가 척도를 적용한 평가 모형을 제시하는 데 있다. 문헌연구 및 예비실험을 통해 보편적이고 객관적으로 적용될 수 있다고 판단된 평가 항목을 선정하여 내용, 디자인, 접근의 용이성 범주로 구분, 국내 웹사이트 평가실험에 사용하였다. 평가실험은 객관적 평가와 주관적 평가를 사용하였으며, 이를 토대로 산출된 각 품질 평가 지수에 근거하여 유용한 웹사이트를 선정하는 단계를 제시하였다.

  • PDF