• 제목/요약/키워드: 유사 키워드

검색결과 312건 처리시간 0.028초

매쉬업을 위한 Open API 유사성 탐색 방법 (Open API Similarity Searcing Method for Mashups)

  • 이용주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1279-1282
    • /
    • 2012
  • 매쉬업은 공개된 Open API들을 이용하여 두 가지 이상의 서로 다른 자원을 섞어서 완전히 새로운 가치의 서비스를 만드는 것이다. 그렇지만, Open API 포털 사이트들은 매쉬업에서 사용 가능한 수많은 API들을 제공하고 있는데 이들에 대한 조합 가능한 API 들을 탐색하고 발견하는 것은 매우 힘들고 많은 시간이 소비되는 작업이다. 본 논문에서는 다양한 Open API 타입들에 대한 API 유사성 탐색 방법을 지원하기 위해 계층적 결합 클러스터링 알고리즘과 계층관계 형태소 분석 기법을 제안한다. 본 논문에서 제안된 방법은 programmableWeb과 xmethods.net 사이트로부터 168개의 REST API와 50개의 SOAP API를 다운로드 받아 실험 분석을 수행하였으며 우리의 접근방법이 기존의 키워드 검색 방법과 Woogle 방법 보다 성능이 우수함을 보인다.

제한된 프로그램 소스 집합에서 표절 탐색을 위한 적응적 알고리즘 (An Adaptive Algorithm for Plagiarism Detection in a Controlled Program Source Set)

  • 지정훈;우균;조환규
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권12호
    • /
    • pp.1090-1102
    • /
    • 2006
  • 본 논문에서는 대학생들의 프로그래밍 과제물이나 프로그래밍 경진대회에 제출된 프로그램과 같이 동일한 기능을 요구받는 프로그램 소스 집합들에서 표절행위가 있었는지를 탐색하는 새로운 알고리즘을 제시하고 있다. 지금까지 보편적으로 사용되어 온 대표적인 알고리즘은 부분 스트링간의 완전 일치를 통한 Greedy-String-Tiling이나 두 스트링간의 지역정렬(local alignment)을 이용한 유사도 분석이 주된 방법론이었다. 본 논문에서는 해당 프로그램 소스의 집합에서 추출된 키워드들의 빈도수에 기반한 로그 확률값을 가중치로 하는 적응적(adaptive) 유사도 행렬을 만들어 이를 기반으로 주어진 프로그램의 유사구간을 탐색하는 새로운 방법을 소개한다. 우리는 10여개 이상의 프로그래밍 대회에서 제출된 실제 프로그램으로 본 방법론을 실험해 보았다. 실험결과 이 방법은 이전의 고정적 유사도 행렬(match이면 +1, mismatch이면 -1, gap이면 -2)에 의한 유사구간 탐색에 비하여 여러 장점이 있음을 알 수 있었으며, 제시한 적응적 유사도 행렬을 보다 다양한 표절탐색 목적으로 사용할 수 있음을 알 수 있었다.

A Research Analysis of QR code based on big data in Korea

  • Lee, Eun-ji;Kim, Soo Kyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권9호
    • /
    • pp.189-200
    • /
    • 2021
  • 최근에 정보기술과 스마트폰 기술이 빠르게 발달되고 있다. 데이터가 증가함에 따라 빅데이터 시대에 도달하였다. 최근 언택트 시대가 도래함에 따라 QR코드는 우리 생활에서 밀접하게 운영되고 있다. 본 연구의 목적은 첫째, "QR Code"에 대한 선행연구를 살펴보고 분야별 키워드에 대한 분석을 실시한다. 둘째, 빅데이터 관점에서 데이터시각화를 위해 "QR Code"의 빈출키워드를 대상으로 워드클라우드 분석과 네트워크 분석을 실시한다. 셋째, "QR Code" 관련하여 향후 연구자들에게 연구방향을 제시하고자 한다. 분석결과 첫째, 연구동향을 살펴본 결과 연구가 증가추세에 있으며, 분야가 다양하게 활용되고 있음을 알 수 있었다. 둘째, 빈출 키워드 분석결과 전반적으로 유사한 결과가 도출되었으며, 분야별, 연도별에 따라 일부 차이가 있는 것으로 분석되었다. 셋째, 빈출 키워드에 따른 시각화 결과 역시 빈출 키워드 분석결과와 동일하게 분석되었다는 것을 알 수 있었다. 이론적 연구결과에 따른 실무적 시사점은 다음과 같다. 첫째, 'QR Code'를 기술적인 측면이 아닌 정보전달의 수단으로 연구될 필요가 있다. 둘째, "QR Code"는 사회 경향이나 이슈들을 반영하여 발전하고 있다는 것을 알 수 있다. 이론적 시사점과 실무적 시사점을 통해 우리는 QR 코드에 대한 방향성을 전략적으로 제공해주고자 한다.

개인화 검색시스템에 관한 연구 - 과학기술학회마을을 중심으로 - (A Study of Personalized Retrieval System through Society of Korean Journal Articles of Science and Technology)

  • 김광영;곽승진
    • 한국도서관정보학회지
    • /
    • 제41권1호
    • /
    • pp.149-165
    • /
    • 2010
  • 이 연구에서는 기존의 과학기술학회마을에서 제공하고 있는 일반 검색서비스에 대해서 분석하고 이를 기반으로 과학기술학회마을 논문 서비스에 적합한 개인화 검색서비스들을 개발하였다. 즉, 질의어 기반의 개인화 검색시스템, 논문의 공동 저자 기반의 내비게이션 시스템, 논문의 저자 키워드 기반 주제어 자동 추천 시스템과 유사한 사용자 자동 추천 시스템들이 있다. 이 연구에서는 설문 조사를 통해서 KISTI 과학기술학회마을 논문 서비스에 적합한 개인화 서비스를 모색하였다.

  • PDF

효과적인 웹 경보 제공 서비스를 위한 질의응답 에이전트의 구현과 응용 (A Question Answering Agent for Effective Web Information Providing Service: Implementation and Application)

  • 김경민;조성배
    • 인지과학
    • /
    • 제15권3호
    • /
    • pp.35-44
    • /
    • 2004
  • 인터넷의 사용이 보편화됨에 따라 많은 양의 정보가 다양한 채널을 통해 제공되고 있다. 이와 더불어 사용자들은 효과적인 정보 제공 서비스를 원하고 있으며, 정보 교환에 도움을 주는 가상 대리자 역할의 대화형 에이전트의 연구가 활발히 진행되고 있다. 본 논문에서는 패턴매칭 기법과 베이지 안 네트워크 등의 인공지능 기법을 이용하여 사용자 질의 의도를 분석한 후 적절한 답변을 제공할 수 있는 질의응답 에이전트를 개발한다. 이때 유의어 사전을 이용한 키워드 데이터베이스를 구축함으로써 동의어 관계를 가진 유사 키워드 등의 사용자에 따른 다양한 지식표현 문제를 해결한다. 실제 의류 사이트를 소개하는 점 사이트에 적용해 봄으로써 그 가능성을 평가해 본다.

  • PDF

효과적인 소프트웨어 컴포넌트 분류 및 검색에 관한 연구 (A Study for the Effective Classification and Retrieval of Software Component)

  • 조병호
    • 인터넷정보학회논문지
    • /
    • 제7권6호
    • /
    • pp.1-10
    • /
    • 2006
  • 컴포넌트 재사용을 통한 소프트웨어의 개발은 소프트웨어 생산비용을 절감할 수 있는 유용한 방법이다. 그러나 컴포넌트 재사용에 있어 키워드나 카테고리 분류에 의한 검색 방법은 컴포넌트 개체의 복잡성으로 인하여 정확한 컴포넌트 검색이 어렵다. 따라서 기존의 다른 연구 방법을 조사/분석하여 XML 명세를 이용한 컴포넌트 분류 및 검색에 효과적인 방법 및 이를 기반으로 한 컴포넌트 통합관리 시스템 구조를 제시하고자 한다. 컴포넌트 검색에 있어 많은 일치하지 않은 컴포넌트 메타 표현인 DTD 항목이 존재한다. 이를 보완하기 위하여 정확도 및 간결도 측정을 사용한 검색 방법은 우선적으로 고려해야할 컴포넌트를 찾는데 효과적인 하나의 방법이다. 이 방법은 기존의 키워드 검색으로 어려운 유사하게 일치하는 항목의 컴포넌트를 찾음으로써 보다 나은 우선순위를 갖는 적합한 컴포넌트 검색이 가능하게 한다.

  • PDF

Predicate Logic Form을 이용한 자연어 텍스트로부터의 감정인식 (Emotion Recognition from Natural Language Text Using Predicate Logic Form)

  • 설용수;김동주;김한우;박정기
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.411-412
    • /
    • 2010
  • 전통적으로 자연어 텍스트로부터의 감정인식 연구는 감정 키워드에 기반한다. 그러나 감정 키워드만을 이용하면 자연어 문장이 원래 갖고 있는 통사정보나 의미정보는 잃어버리게 된다. 이를 극복하기 위해 본 논문에서는 자연어 텍스트를 Predicate Logic 형태로 변환하여 감정 정보처리의 기반데이터로 사용한다. Predicate Logic형태로 변환하기 위해서 의존 문법 구문분석기를 사용하였다. 이렇게 생성된 Predicate 데이터 중 감정 정보를 갖고 있는 Predicate만을 찾아내는데 이를 위해 Emotional Predicate Dictionary를 구축하였고 이 사전에는 하나의 Predicate마다 미리 정의된 개념 클래스로 사상 시킬 수 있는 정보를 갖고 있다. 개념 클래스는 감정정보를 갖고 있는지, 어떤 감정인지, 어떤 상황에서 발생하는 감정인지에 대한 정보를 나타낸다. 자연어 텍스트가 Predicate으로 변환되고 다시 개념 클래스로 사상되고 나면 KBANN으로 구현된 Lazarus의 감정 생성 규칙에 적용시켜 최종적으로 인식된 감정을 판단한다. 실험을 통해 구현된 시스템이 인간이 인식한 감정과 약 70%이상 유사한 인식 결과를 나타냄을 보인다.

  • PDF

클라우드 환경에서 전사적 정보 연계를 위한 개념 망 기반의 검색 프레임워크 (Retrieval Framework for Enterprise Information Integration based on Concept Net in Cloud Environment)

  • 정계동;문석재
    • 한국정보통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.453-460
    • /
    • 2013
  • 본 연구에서는 클라우드 환경에서 기하급수적으로 증가하는 전사적 정보 연계를 위한 시맨틱 기반 개념 망을 이용하여 전사적 데이터들의 효율적 연계와 활용이 가능하도록 프레임워크를 제안한다. 개념 망은 기존 온톨로지에 접근하는 방식은 유사하지만, 사용자가 보다 효율적으로 정보 연계 검색을 하고자 객체와 개념 사이의 연관성을 구축 한다. 본 논문에서는 개념 망을 3가지로 구분하여 제안 프레임워크에 적용한다. 본 연구의 개념 망은 마스터 정보 개념 망, 키워드 개념 망, 그리고 비즈니스 프로세스 개념 망을 기반으로 온톨로지 형태로 구축된다. 이 개념 망은 사용자 요구사항에 따라 데이터들 간의 연관성을 기준으로 하여 검색 및 활용을 가능하게 한다. 그리고 마스터 정보 개념과 키워드 개념이 결합되어 검색 키워드의 빈도 및 카테고리의 빈도 추적을 제공함으로써, 사용자의 검색의 편의성과 신속성을 향상시킬 수 있도록 하였다.

시맨틱 기술을 활용한 RESTful 웹서비스의 검색 기법 개발 (Development of Search Method using Semantic technologies about RESTful Web Services)

  • 차승준;최윤정;이규철
    • 한국공간정보시스템학회 논문지
    • /
    • 제12권1호
    • /
    • pp.100-104
    • /
    • 2010
  • 최근 웹 2.0의 등장과 함께 플랫폼으로의 웹이 강조되면서, SOAP 기반의 웹서비스에 비해 RESTful 웹서비스가 크게 증가하고 있다. 하지만 서비스들은 이미 많이 존재하며 빠르게 증가하기 때문에 키워드를 기반으로 사용자가 원하는 서비스를 정확하게 찾는 것은 어렵다. 본 논문에서는 이러한 문제를 해결하기 위해서 시맨틱을 활용한 RESTful 웹서비스 검색 기법을 개발하였다. 이를 위해 우선 OpenAPI 통합 검색 시스템을 바탕으로 시맨틱을 활용하기 위한 시스템 구조를 구성하고, 시맨틱 검색을 위한 기술 형식을 모델링하였다. 이를 바탕으로 의미 마크업(태깅, 시맨틱 어노테이션)을 수행하여, 추출된 결과인 RDF 문서를 서비스 저장소에 저장하여 이를 바탕으로 검색을 수행한다. 온톨로지를 활용하여 입력받은 키워드를 확장하고, 이를 바탕으로 검색을 수행하여 사용자에게 유사도 기반의 키워드 검색 기법에서의 검색 결과보다 확장 / 정제된 검색 결과를 제공한다.

빅데이터 분석을 이용한 문단 내의 감정 예측 (Emotion Prediction of Paragraph using Big Data Analysis)

  • 김진수
    • 디지털융복합연구
    • /
    • 제14권11호
    • /
    • pp.267-273
    • /
    • 2016
  • 모바일의 확산과 더불어 정형화된 자료뿐만 아니라 다양한 형태의 비정형화된 자료로부터 정보가 생성되고 정보 전달 및 공유가 활발히 이루어지고 있다. 최근에는 다양한 SNS 매체들로부터 생산 및 배포되는 많은 자료들 중에서 유의미한 정보를 추출하는 기술로 빅데이터 기술을 많이 사용하며, 빅데이터 분석 기법 중 하나인 데이터 마이닝 기법을 사용한다. 특히, SNS로부터 수집된 방대하고 다양한 자료들을 이용하여 대중의 집단지성에 표출된 일반적인 감정을 분석하여 다양한 분야에 활용한다. 본 논문에서는 SNS를 통해 작성된 짧은 문단 내 함축된 키워드와 키워드들 간의 연관성을 이용하여 문단에 나타난 감정을 예측하고 사용자별 감정에 따른 적절한 답변이나 예측된 감정과 유사한 상품이나 영화 등 다양한 추천시스템에 사용될 수 있도록 형태소 분석과 변형된 n-gram방법을 혼합하여 효율적인 감정 예측 시스템을 제안한다. 제안된 시스템은 평균 82.25%의 재현율을 보여 기존의 시스템에 비해 더욱 향상된 성능을 보여 주었고, 형태소분석을 통해 의미 있는 키워드 추출에 도움이 될 것으로 기대한다.