• 제목/요약/키워드: Similar Patent Document

검색결과 9건 처리시간 0.026초

LDA 토픽 모델링과 Word2vec을 활용한 유사 특허문서 추천연구 (LDA Topic Modeling and Recommendation of Similar Patent Document Using Word2vec)

  • 이앞길;최근호;김건우
    • 경영정보학연구
    • /
    • 제22권1호
    • /
    • pp.17-31
    • /
    • 2020
  • 4차 산업혁명 시대의 시작과 함께 다양한 분야의 기술들이 서로 융합하며 새로운 형태의 기술과 제품들이 개발되고 있으며, 이와 더불어 그것들에 대한 시장 지배력을 갖기 위한 지식 재산권의 행사나 특허등록의 중요성이 높아지고 있어 국내는 물론 해외에서의 특허출원이 증가하고 있다. 이에 따라, 심사관 1인당 처리해야 할 특허 처리 건수가 해마다 많아지고 있어 선행기술조사에 소비되는 시간과 비용이 점점 증가하고 있는 실정이다. 본 연구는 다수의 해외특허 우선권 주장 시 동일 우선권 주장 특허문서 간 유사도를 계산하여 심사관 및 특허 출원인이 유사문서를 우선 검토 할 수 있도록 함으로써 심사 시간과 비용을 줄이고자 하였다. 이를 위해, 본 연구에서는 비정형 특허 문서의 데이터를 전처리 후 LDA 토픽 모델링과 Word2vec을 활용하여 특허 문서 간 유사도를 구하고, 이 유사도 점수가 높은 순으로 검토 문서를 우선 추천하는 유사 특허 추천 모델을 제안하였다. 3단계의 모델 생성과정을 통해 만들어진 모델을 사용하여 재현율 95%로 높은 결과를 보였다. 본 연구에서 제안한 모델을 통해, 심사관은 효율적으로 선행기술에 대한 조사가 가능해지며, 심사 수행 중 유사하다고 판단된 특허문서에 대한 심사 이력을 신속하게 참고할 수 있어 업무 부담감을 줄이고 심사풀질을 향상시킬 수 있을 것으로 기대된다.

특허 등록 예측을 위한 특허 문서 분석 방법 (Analysis method of patent document to Forecast Patent Registration)

  • 구정민;박상성;신영근;정원교;장동식
    • 한국산학기술학회논문지
    • /
    • 제11권4호
    • /
    • pp.1458-1467
    • /
    • 2010
  • 최근 지식재산권의 모방과 권리 침해는 국가 산업발전의 저해요소로 인식되고 있다. 많은 연구자들은 이러한 저해요소로 인하여 발생하는 막대한 손실을 막기 위해 지식재산권의 보호와 효율적 관리에 관한 연구를 다양하게 진행 중이다. 특히, 특허 등록 예측은 지식재산권 보호와 권리 주장을 위해 매우 중요한 연구이다. 본 연구는 텍스트 마이닝 기법을 이용한 특허문서 분석을 통하여 특허 등록 및 거절 여부를 예측하는 방법을 제안한다. 먼저 거절된 특허문서들의 단어 빈도수를 이용하여 데이터베이스를 생성한다. 그리고 생성한 데이터베이스와 다른 특허문서들을 비교하여 각 문서와 데이터베이스와의 유사한 정도를 판단하는 유사치를 도출한다. 본 논문에서는 특허 거절 기준 값을 선정하기 위하여 분할 군집화 알고리즘인 k-means 사용하였다. 그 결과로 거절된 특허 문서와 유사한 특허 문서는 거절될 가능성이 높다는 결론을 얻을 수 있었다. 실험을 위한 데이터는 현재 미국에 출원되어 있는 블루투스 기술, 태양전지 기술 그리고 디스플레이에 관한 특허 문서를 이용하였다.

잠재 의미 분석을 적용한 유사 특허 검색 서비스 시스템 (Similar Patent Search Service System using Latent Dirichlet Allocation)

  • 임현근;김재윤;정회경
    • 한국정보통신학회논문지
    • /
    • 제22권8호
    • /
    • pp.1049-1054
    • /
    • 2018
  • 유사 특허를 검색하는 방법으로 기존에는 키워드 검색 방법을 사용하고 최근에는 머신러닝을 활용한 자동분류 방법을 사용하고 있다. 키워드 검색은 데이터 정제를 통해 정형화된 데이터 분석 방법으로 단문일 경우 검색에서는 정확도는 높지만 문서와 같이 여러 단어로 이루어진 장문일 경우 문장에 내포된 의미 분석을 할 수 없었다. 의미 분석 단계에서의 자동 분류 방법은 비정형 데이터 분석 방법으로 여러 단어로 이루어진 문장을 분류하는데 사용되고 있다. 그 동안 두 가지 방법을 결합하여 유사 문서 검색을 하려는 시도가 있었지만 비정형 데이터와 정형 데이터의 동시 사용에는 분석하는 방법이 다르기 때문에 동시 적용에는 알고리즘 상의 문제가 있었다. 이에 본 논문에서는 문서에서 함축된 키워드를 검출하고 잠재 의미 분석(LDA) 방식을 사용하여 사람이 개입하지 않고 문서를 효율적으로 자동분류하고 유사 특허를 검색할 수 있는 방법을 연구하였다.

특허 정보 검색을 위한 대체어 후보 추출 방법 (Extracting Alternative Word Candidates for Patent Information Search)

  • 백종범;김성민;이수원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권4호
    • /
    • pp.299-303
    • /
    • 2009
  • 특허 정보 검색은 연구 및 기술 개발에 앞서 선행연구의 존재 여부를 확인하기 위한 사전 조사 목적으로 주로 사용된다. 이러한 특히 정보 검색에서 원하는 정보를 얻지 못하는 원인은 다양하다. 그 중에서 본 연구는 키워드 불일치에 의한 정보 누락을 최소화하기 위한 대체어 후보 추출 방법을 제안한다. 본 연구에서 제안하는 대체어 후보 추출 방법은 문장 내에서 함께 쓰이는 단어들이 비슷한 두 단어는 서로 비슷한 의미를 지닐 것이다라는 직관적 가설을 전제로 한다. 이와 같은 가설을 만족하는 대체어를 추출하기 위해서 본 연구에서는 분류별 집중도, 신뢰도를 이용한 연관단어뭉치, 연관단어 뭉치간 코사인 유사도 및 순위 보정 기법을 제안한다. 본 연구에서 제안한 대체어 후보 추출 방법의 성능은 대체어 유형별로 작성된 평가지표를 이용하여 재현율을 측정함으로써 평가하였으며, 제안 방법이 문서 벡터공간 모델의 성능보다 더 우수한 것으로 나타났다.

계량서지학적 분석을 통한 약물연구분야 특허출원인 간 영향력 비교 (A Comparative Study of the Impacts among Patent Assignees in Pharmaceutical Research based on Bibliometric Analyses)

  • 김희영;박지홍
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.1-15
    • /
    • 2022
  • 본 연구는 약물 연구 분야에 속하는 특허 사이에 나타나는 지식의 흐름을 살펴보고 이들 간의 영향력을 파악해보기 위해 특허데이터에서 나타나는 인용 관계를 분석하였다. 특허데이터의 수집은 Google Patents에서 진행하였다. 약물 연구와 관련된 특허 문서를 검색하여 상위 25개의 출원인을 선정하였고, 이를 바탕으로 출원인 사이에서의 인용 관계를 알아보고 각 출원인의 각 문서에 대한 피인용빈도와 순위를 활용하여 h-지수와 h-지수의 파생지표들의 값을 계산하여 비교하였다. 분석 결과를 종합하면, 'Pfizer, MIT, Abbott' 등의 출원인이 약물 연구 분야에서 영향력이 높은 출원인으로 드러났다. 5개의 계량서지학적 지표 중에서 g-지수와 hS-지수가 서로 유사한 결과를 보여주었고, 총인용빈도, 최대인용빈도, CPP의 순위를 가장 잘 반영하는 지표로 나타났다. 또한, 총인용빈도, CPP, 최대인용빈도 순으로 5개의 계량서지학적 지표와의 상관관계가 높았다. 한편, 기존의 특허 출원인의 기술적 영향력을 나타내는 것으로 알려진 지표인 CPP만으로는 정확한 비교가 어려운 경우도 나타났다.

역인덱스 기반 상향식 군집화 기법을 이용한 대규모 학술 핵심어 분석 (Analysis of Massive Scholarly Keywords using Inverted-Index based Bottom-up Clustering)

  • 오흥선;정유철
    • 한국산학기술학회논문지
    • /
    • 제19권11호
    • /
    • pp.758-764
    • /
    • 2018
  • 특허(patent), 학술 논문(scholarly paper)과 연구 보고서(research report)와 같은 디지털 문서(digital document)에는 주제(topic)를 요약하는 저자 키워드(author keyword)가 있다. 서로 다른 문서가 동일한 키워드를 공유하고 있다면 두 문서가 동일한 주제의 내용을 기술하고 있을 가능성이 매우 높다. 문서 군집화(document clustering)는 비슷한 주제를 가지는 문서들을 비지도 학습 방법(unsupervised learning)을 이용하여 같은 군집으로 그룹(group)화 하는 것이다. 문서 군집화는 다양한 분석에 이용되지만 대용량의 문서 데이터에 적용하기 위해서는 많은 계산량이 필요함으로 쉽지 않다. 이러한 경우, 문서의 내용을 이용하는 것보다 문서의 키워드를 이용하여 군집화하면 더욱 효율적으로 대용량의 데이터를 연결할 수 있다. 기존의 상향식 군집화 방법(bottom-up hierarchical clustering)은 대용량의 키워드 군집화(keyword clustering)를 수행하는데 있어서 많은 시간이 필요하다는 문제점이 있다. 본 논문에서는 정보검색(information retrieval)에서 널리 사용되는 역인덱스(inverted-index) 구조를 상향식 군집화에 적용한 효율적인 군집화 방법을 제안하고, 제안 방법을 대용량의 키워드 데이터에 적용하였으며, 그 결과를 분석하였다.

문장구조 유사도와 단어 유사도를 이용한 클러스터링 기반의 통계기계번역 (Clustering-based Statistical Machine Translation Using Syntactic Structure and Word Similarity)

  • 김한경;나휘동;이금희;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권4호
    • /
    • pp.297-304
    • /
    • 2010
  • 통계기계번역에서 번역성능의 향상을 위해서 문장의 유형이나 장르에 따라 클러스터링을 수행하여 도메인에 특화된 번역을 시도하는 방법이 있다. 그러나 기존의 연구 중 문장의 유형 정보와 장르에 따른 정보를 동시에 사용한 경우는 없었다. 본 논문에서는 각 문장의 문법적 구조 유사도에 따른 유형별분류 기법과, 단어 유사도 정보를 사용한 장르 구분법을 적용하여 기존의 두 기법을 통합하였다. 이렇게 분류된 말뭉치에서 추출한 도메인 특화 모델과 전체 말뭉치에서 추출된 모델에서 보간법(interpolation)을 사용하여 통계기계번역의 성능을 향상하였다. 문장구조 유사도와 단어 유사도의 계산 방법으로는 각각 커널과 코사인 유사도를 적용하였으며, 두 유사도를 적용하여 말뭉치를 분류하는 과정에서는 K-Means 알고리즘과 유사한 기계학습 기법을 사용하였다. 이를 일본어-영어의 특허문서에서 실험한 결과 최선의 경우 약 2.5%의 상대적인 성능 향상을 얻었다.

특허의 기술이전 활성화를 위한 소셜 태깅기반 지적재산권 추천플랫폼 (Social Tagging-based Recommendation Platform for Patented Technology Transfer)

  • 박윤주
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.53-77
    • /
    • 2015
  • 국내에서 출원되는 특허건수는 매년 증가하고 있으나, 이러한 특허들 중 상당수는 활용되지 못하고 사장되고 있다. 2012년 국정감사 자료에 따르면, 우리나라 대학 및 공공연구기관이 보유한 특허의 약 73%가 사회적 가치창출로 연결되지 못하는 휴면특허라고 한다. 즉, 대학/연구소 또는 사업화가 어려운 개인이 소유하고 있는 특허가, 이를 필요로 하는 수요기업에 성공적으로 기술 이전되지 못하는 것을 휴면특허 증가의 주요 문제점으로 생각할 수 있다. 본 연구는 급격히 축적되는 방대한 특허 자원들 속에서, 기업의 관심분야에 적합한 지식재산을, 보다 쉽고, 효과적으로 선별할 수 있도록 하는 소셜태깅 기반의 특허 추천플랫폼을 제안한다. 제안된 시스템은 기존 특허들로부터 핵심적인 내용 및 기술 분야를 추출하여 초기 추천을 수행하고, 이후 사용자들의 태그정보가 축적되면, 사회적 지식 (social knowledge)을 추천에 함께 반영하게 된다. 이러한 연구에는 특허청에서 운영하고 있는 KIPRIS(Korea Industrial Property Rights Information Service) 시스템에서 실제 특허자료 총 1638건을 수집한 후, 현재 특허 데이터에는 존재하지 않는 가상의 태그 정보를 추가한 반가상(semi-virtual) 데이터를 구성하여 활용하였다. 제안된 시스템은 프로그래밍 언어 JAVA를 활용하여 핵심 알고리즘을 구현하였으며, 그래픽사용자 인터페이스(Graphic User Interface)에 대한 프로토타입의 설계를 수행하였다. 또한, 시나리오테스트 방식으로 시스템의 운영타당성 및 추천 효과성을 확인하였다.

거래라는 관점에서 바라 본 기술거래사와 공인중개사 자격제도 비교에 관한 연구 (A Study on the qualification system comparison between technology traders and licensed real-estate agents from a viewpoint of transaction)

  • 김혜선;이재일
    • 벤처창업연구
    • /
    • 제8권1호
    • /
    • pp.61-68
    • /
    • 2013
  • 현대사회가 지식기반사회로 변화하면서 특허와 상표 그리고 영업비밀 등의 지식재산권과 저작권에 대한 관심과 중요성이 증가하고 있어 특허 정책과 전문 인력에 대한 새로운 변화가 요구되고 있다. 민간부문에서 개발된 기술이 원활히 거래되고 사업화되는 것을 촉진하기 위해 기술의 이전 및 사업화 촉진에 관한 법률을 마련하고, 동 법률 제14조에서는 기술거래사의 등록 육성 및 지원에 관한 사항으로 기술이전 및 사업화에 관한 전문지식이 있는 사람은 지식경제부장관에게 기술거래사로 등록할 수 있도록 하고 있다. 본 연구에서는 현재의 기술거래사 등록제도를 면밀히 검토해 보고 거래라는 관점에서 유사한 동질성을 가지고 있는 공인중개사 자격제도와 비교 검토하여 개선안을 도출해 보고자 하였다. 그 결과 기술거래사를 취득한 자만이 해야 만하는 업무 영역을 명시하여 전문가로서의 입지를 다질 수 있는 기반을 마련 해야하고, 등록증 관리 전담기관 위탁 운영을 통해 사후 관리 업무에 대한 매뉴얼 기준 마련해야 한다는 개선점을 도출하였다. 또한 공고 안을 작성할 때 공고의 필요성과 기술거래 사업을 위한 개설 등록기준을 마련할 필요성이 있다. 이러한 개선안을 통해 기술거래 시장 활성화에 동기를 부여하고 기술 마케팅과 기술이전 사업화의 저변 확대에 큰 영향을 미칠 것으로 기대한다.

  • PDF