• Title/Summary/Keyword: 재현율

Search Result 1,208, Processing Time 0.034 seconds

Study on Named Entity Recognition in Korean Text (한국어 문서에서 개체명 인식에 관한 연구)

  • 이경희;이주호;최명석;김길창
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.292-299
    • /
    • 2000
  • 본 논문에서는 개체명 사전과 결합 단어 사전, 그리고 용언의 하위범주화 사전을 이용하는 규칙기반의 한국어 개체명 인식 방법을 제안한다. 각 규칙은 네 단계로 나누어 적용하는데, 첫번째 단계에서는 어절 내의 단어 정보를, 두번째 단계에서는 제한된 주변 문맥 정보를, 그리고 세번째 단계에서는 용언의 하위범주화 정보와 개체명과의 관계를 이용하고, 마지막으로 네번째 단계에서는 개체명 간의 관계 정보를 고려한다. 본 논문에서 제안한 규칙 기반 개체명 인식기의 성능을 평가하기 위해 실험한 결과 90.4%의 정확률과 83.4%의 재현율을 얻었다.

  • PDF

Korean Noun Extraction Using Exclusive Segmentation Information and Post-noun morpheme sequences (분석 배제 정보와 후절어를 이용한 한국어 명사추출)

  • 이도길;류원호;임해창
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.19-25
    • /
    • 2000
  • 명사 추출기는 정보검색, 문서분류, 문서요약, 정보추출 등의 분야에서 사용되고 있으며, 정확한 명사 추출과 빠른 색인 속도는 이들 시스템 성능과 밀접한 관계가 있다. 한국어에서 명사를 추출하기 위해서는 형태소 분석이 필요한데, 본 논문에서는 대량의 품사부착된 말뭉치로부터 추출한 분석배제 정보와 후절어를 이용함으로써 형태소 분석을 생략하거나 보다 단순한 처리에 의해 명사를 추출하는 방법을 제안한다. 실험결과에 의하면, 제안된 방법에 의한 명사추출기는 비교적 높은 정확률과 재현율을 나타내며, 빠른 속도를 보였다.

  • PDF

Design and Implementation of Keyword Search Advertising System (키워드 광고 시스템의 설계 및 구현)

  • Jee, Hye-Sung;Lyu, Ki-Gon;Lim, Heui-Seok
    • Proceedings of the KAIS Fall Conference
    • /
    • 2008.11a
    • /
    • pp.32-35
    • /
    • 2008
  • 본 논문은 포털 사이트의 효율적인 광고 제공을 위한 자연어처리 기반의 키워드 광고 시스템을 제안한다. 사용자의 질의에 대한 형태소 분석 결과를 사용하여, 기존의 키워드 정합에 의한 광고 시스템보다 재현율을 향상시킬 수 있었다. 또한, 웹 기반 키워드 광고 뿐 아니라 메신저를 통한 대화 내용 기반 키워드 광고도 제안한다.

  • PDF

Extraction and Classification of Proper Nouns by Rule-based Machine Learning (규칙 기반의 기계학습을 통한 고유명사의 추출과 분류)

  • 노태길;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.170-172
    • /
    • 2000
  • 고유명사를 추출하고 그 범주를 파악할 수 있다면, 이는 정보 추출이나 정보 검색, 문서 요약과 같은 분야에 도움을 줄 수 있다. 본 논문에서는 고유명사를 추출하고 그 범주를 찾는 방법을 제시한다. 고유명사가 태깅된 코퍼스로부터, 고유명사의 내부와 주변에 반복적으로 나타나는 실마리들을 규칙 기반으로 학습한다. 이를 통하여 고유명사를 찾고 그 범주를 정한다. 구현한 시스템은 경제기사 코퍼스에서 4가지 범주로 고유명사를 추출하고 분류함에 있어 79.8%의 재현율과 92.9%의 정확률, 그리고 F 평가치에서 85.8의 성능을 보인다.

  • PDF

Retrieval of Software Component based on XML Specification (XML 명세에 기반한 소프트웨어 컴포넌트 검색)

  • 권태삼;이윤수;윤경섭;왕창중
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.501-503
    • /
    • 1999
  • 소프트웨어 컴포넌트의 재사용은 새로운 소프트웨어를 개발하기 위해 이미 개발되어진 컴포넌트나 적절하게 수정된 컴포넌트를 사용하는 것이다. 따라서 컴포넌트 저장소에 저장되어 있는 컴포넌트를 효율적으로 검색할 수 있어야 하며, 검색된 컴포넌트를 적용하여 새로운 소프트웨어를 개발할 수 있어야 한다. 이 논문에서는 컴포넌트 저장소에 XML 기반으로 명세된 컴포넌트들의 검색 방법과 소프트웨어 아키텍쳐 재구성을 위한 구조 검색 방법을 제안한다. 제안한 검색 방법에서 시그니쳐 일치 방법은 컴포넌트 검색의 재현율을 향상시키며, 행위 일치 검색은 컴포넌트 검색의 정확성을 향상시킬 수 있다. 또한, 구조 검색 방법은 소프트웨어 아키택쳐의 재구성을 위해 컴포넌트의 구조적인 관점에서 컴포넌트를 검색할 수 있다.

  • PDF

Dynamic Classification of Web Search Categories (웹 검색 분류어의 동적인 분류)

  • Choi, Bum-Ghi;Park, Sun;Lee, Ju-Hong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04d
    • /
    • pp.521-523
    • /
    • 2003
  • 본 논문은 웹 탐색 중 디렉토리 검색엔진의 분류검색에 대한 문제점을 해결하기 위해서 분류와 검색어간의 관계를 퍼지논리를 이용하여 계산하고 분류간의 함의관계를 유도함으로써 동적인 분류체계를 구성하는 새로운 방법을 제시한다. 이 방법의 장점은 분류간의 함의관계를 유사한 하위분류로서 간주함으로써 분류검색 결과의 재현율을 높일 수 있다는 것이다.

  • PDF

Automatic Building Ontology Techniques for RESTful Web Services (RESTful 웹 서비스를 위한 온톨로지 자동 구축 기법)

  • Lee, Yong-Ju
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1415-1418
    • /
    • 2011
  • 최근 웹상에 이용 가능한 RESTful 웹 서비스들의 수가 급격하게 증가됨에 따라 사용자들이 적합한 웹 서비스를 찾는 것은 매우 중요한 이슈로 대두되었다. 그러나 기존의 키워드 기반 검색 방법은 나쁜 재현율과 나쁜 정확률 때문에 문제가 많다. 본 논문에서는 매개변수 클러스터링 기법에 패턴 분석 기법을 추가한 하나의 새로운 시맨틱 온톨로지 구축 방법을 제안한다. 이를 통해 온톨로지를 자동 구축하여 시맨틱 정보의 주석처리 부담을 줄일 수 있고, 보다 효율적인 웹 서비스 검색을 지원한다.

Reproducibility of Hypothesis Testing and Confidence Interval (가설검정과 신뢰구간의 재현성)

  • Huh, Myung-Hoe
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.4
    • /
    • pp.645-653
    • /
    • 2014
  • P-value is the probability of observing a current sample and possibly other samples departing equally or more extremely from the null hypothesis toward postulated alternative hypothesis. When p-value is less than a certain level called ${\alpha}$(= 0:05), researchers claim that the alternative hypothesis is supported empirically. Unfortunately, some findings discovered in that way are not reproducible, partly because the p-value itself is a statistic vulnerable to random variation. Boos and Stefanski (2011) suggests calculating the upper limit of p-value in hypothesis testing, using a bootstrap predictive distribution. To determine the sample size of a replication study, this study proposes thought experiments by simulating boosted bootstrap samples of different sizes from given observations. The method is illustrated for the cases of two-group comparison and multiple linear regression. This study also addresses the reproducibility of the points in the given 95% confidence interval. Numerical examples show that the center point is covered by 95% confidence intervals generated from bootstrap resamples. However, end points are covered with a 50% chance. Hence this study draws the graph of the reproducibility rate for each parameter in the confidence interval.

Design of a Large Real-Time Personalized Recommendation System (대용량 개인화 실시간 상품 추천 시스템 설계)

  • Kim Jong-Hee;Shim Jang-Sup;Lee Dong-Ha;Jung Soon-Key
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.109-112
    • /
    • 2006
  • 최근 대용량 추천시스템에 대한 필요성이 증가하고 있고, 특히 대규모 인터넷 쇼핑몰을 위한 개인화 추천 시스템 구조에 대한 관심이 높아지고 있다. 본 논문에서는 k-means 클러스터링과 순차 패턴 기법을 이용한 인터넷 쇼핑몰 상품 추천 시스템을 설계 및 구현한다. 사용자 정보의 일괄처리와 카테고리의 계층적 특성을 반영하면서 데이터 마이닝 기법을 활용하여 개인화된 추천 엔진을 대형 시스템에서 동작하도록 설계 하였다. 설계 구현한 시스템의 평가를 위해, 대형 쇼핑몰의 데이터를 이용하여 추천 예측 정확율(PRP: Predictive Recommend Precision), 추천 예측 재현율(PRR: Predictive Recommend Recall), 정확도 인수(PF1 : Predictive Factor One-measure)를 구하였다.

  • PDF

Conflict Detection and Resolution Method for Merging of Ontologies based on Decision Support Tree (온톨로지 병합을 위한 의사지원트리 기반 충돌 탐지 및 해결 기법)

  • Jeong, Hyeon-Suk;Kim, Jeong-Min;Lee, Seong-Ju
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.04a
    • /
    • pp.147-150
    • /
    • 2007
  • 본 논문에서는 토픽맵 기반의 온톨로지 병합 과정에서 발생할 수 있는 충돌의 유형을 트리 구조로 정의하고 충돌 탐지 및 해결을 통하여 두 온톨로지를 하나로 병합하는 기법을 제안한다. 병합충돌은 의미적 대응 요소들의 유사값에 기반하여 엘리먼트기반, 구조기반 임시기반의 트리 구조로 분류되고 이 충돌 트리를 이용하여 두 매핑 요소사이의 병합충돌을 탐지하고 해결한다. 실험을 위해 토픽맵 질의언어 tolog를 사용하여 동서양 철학온톨로지 및 독일 문학온톨로지들의 병합 전과 후의 질의 결과를 비교하고 이를 정확율과 재현율로 병합 성능을 평가하였으며 그 결과 손실없는 병합이 가능함을 보였다.

  • PDF