• 제목/요약/키워드: 저자 그래프

검색결과 22건 처리시간 0.025초

저자 식별에 기반한 저자 그래프 생성 (Author Graph Generation based on Author Disambiguation)

  • 강인수
    • 정보관리연구
    • /
    • 제42권1호
    • /
    • pp.47-62
    • /
    • 2011
  • 이상적 저자-망은 그 노드가 저자를 표현하도록 정의된다. 그러나 실제 자동 생성되는 대부분 저자망의 노드는 저자명을 저자 식별자로 사상시키는 어려움으로 인해 단순히 저자명으로 표현된다. 실 세계 저자를 표현하기 위해 이처럼 저자명을 사용하여 저자망을 구성하는 것은 서로 다른 동명 저자들이 하나의 저자명 노드로 병합됨으로 인해 저자망의 특성을 왜곡하는 문제가 발생한다. 이 연구는 공저 관계에 의존하여 저자명이 갖는 중의성을 해소하고 저자 노드로 구성된 저자망을 자동 생성하는 알고리즘을 제시한다. 공저자 자질의 특성상 이 알고리즘은 과소군집오류를 희생하면서 과다군집오류를 최소화하는 군집 결과를 만든다. 실험에서는 한글 동명 저자명이 출현한 실제 서지레코드 집합을 대상으로 알고리즘의 적용 결과를 제시한다.

간선 유형 및 가중치를 고려한 연속 서브 그래프 매칭 기법 (Continuous Subgraph Matching Scheme Considering Edge Types and Weights)

  • 최도진;복경수;이병엽;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.451-452
    • /
    • 2019
  • 논문 검색 서비스 응용에서는 공저자, 출판 정보 등을 표현하기 위해서 다양한 정점 레이블 (논문,저자) 및 간선 정보(주저자, 공저자)를 이용하여 그래프로 표현한다. 이와 함께 다양한 간선 특징 정보를 질의로 입력하는 연속 서브 그래프 매칭에 대한 요구가 존재한다. 본 논문에서는 간선의 다양한 특성을 지원하고 색인의 부하를 감소시킨 연속 서브 그래프 매칭 기법을 제안한다. 제안하는 기법은 거리 값과 질의 연관 정보만을 관리하여 간선의 다양한 특성을 지원하는 효율적인 서브 그래프 매칭을 수행한다.

  • PDF

그래프 구조를 갖는 서지 빅데이터의 효율적인 온라인 탐색 및 분석을 지원하는 그래픽 인터페이스 개발 (Developing Graphic Interface for Efficient Online Searching and Analysis of Graph-Structured Bibliographic Big Data)

  • 유영석;박범준;조선화;이수안;김진호
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.77-88
    • /
    • 2020
  • 최근 다양한 실세계의 복잡한 관계를 그래프의 형태로 구성하고 분석하는 다양한 연구들이 진행되고 있다. 특히 DBLP와 같은 컴퓨터 분야 문헌 데이터 시스템은 논문의 저자, 그리고 논문과 논문들이 서로 인용 관계로 표현되는 대표적인 그래프 데이터이다. 그래프 데이터는 저장 구조 및 표현이 매우 복잡하므로, 문헌 빅데이터의 검색과 분석, 그리고 시각화는 매우 어려운 작업이다. 본 논문에서는 문헌 빅데이터를 그래프의 형태로 시각화한 그래픽 사용자 인터페이스 도구, 즉 EEUM을 개발하였다. EEUM은 그래프 데이터를 시각적으로 표시하여 연결된 그래프 구조에 따라 문헌 데이터를 브라우징 하는 기능을 제공하며, 문헌 빅데이터에 대한 검색 및 관리, 분석이 가능하도록 구현하였다. 또한 EEUM을 DBLP가 제공하는 문헌 그래프 빅데이터에 적용하여 편리하게 검색, 탐색 및 분석하는 할 수 있음을 시연한다. EEUM을 이용하여 모든 연구 분야에서 영향력 있는 저자나 논문을 쉽게 찾을 수 있으며, 여러 저자와 논문 사이의 모든 관계를 한 눈에 볼 수 있는 등 복잡한 문헌 그래프 빅데이터의 검색 및 분석 도구로 편리하게 사용할 수 있다.

한국 통계학 문헌의 계량서지학적 분석 (A Bibliometric Analysis of Korea Statistic Literaure)

  • 박성미
    • 정보관리학회지
    • /
    • 제5권1호
    • /
    • pp.104-130
    • /
    • 1988
  • 본 논문은 계량서지 학적 연구 방법론을 국내 통계학분야에 적용해 봄으로써 국내 통계학자들의 연구 활동 및 통계학분야의 학문적 속성을 수량학적으로 파악하는데 목적을 두고 저자의 생산성 및 인용 문헌을 분석하였다. 분석 대상 문헌으로는 [정기간행문 기사색 인] 1945-1986년호에 수록되어 있는 통계학관련 학술 논문 총 648편의 출판 문헌과 [통계학 연구] 1975-1986년호에 수록된 논문 137편에 인용된 1,171편의 인용 문헌을 선정하였다. 본 논문의 분석 결과 다음과 같은 주요한 사실을 발견하였다. 10 Lotka 법칙을 통한 통계학 저 자의 생산성 분석에서 Lotka의 상수 $\alpha$=2의 수정없이도 Lotka 법칙이 적용됨을 입증하 였다. 2) Bradford 법칙의 Brookes의 그래프적 분석법을 통계학 저자의 생산성에 적용하여 통계학분야의 국내 핵심 저자 17명을 선정하였다. 3) 통계학 인용 문헌의 형태별 분석 결과 잡지가 62.43%, 단행본이 27.07%, 기타 자료가 10.50%로 나타났으며, 언어별 분석 결과 영 어 자료가 96.07%, 한국어 자료가 2.65%, 기타어 자료가 1.28%로 나타났다. 4) Bradford 법 칙의 Brookes의 그래프적 분석법을 통계학 인용 저자의 생산성에 적용하여 통계학분야의 핵심 인용 저자 20명을 선정하였다. 5) Brookes의 이용율 감소 법칙을 적용하여 통계학분야 의 인용 문헌의 이용율 감소 현상을 측정한 결과 이용율 감소 인자는 0.917이며 반감기는 7.987년으로 나타났다. 6) Bradford 법칙의 Brookes의 그래프적 분석 방법을 적용하여 통계 학 인용 문헌의 잡지내 분포를 분석한 결과 S값이 0.566인 Zipf 분포를 이루었다. 7) 통계학 분야에 인용된 잡지를 발행국별로 분석한 결과 미국 자료가 74.28%, 영국 자료가 17.24%, 한국 자료가 4.10%, 기타국 자료가 4.38%로 나타났으며, 주제별로 분석한 결과 주제 자기 인용도는 43.77%, 타 주제에의 의존도는 56.23%로 나타났다.

  • PDF

송전선로의 전압, 전류에 대한 esclangon 선도 (The esclangon diagram for voltage and current along a transmission line : michel poloujadoff)

  • 심궁섭
    • 전기의세계
    • /
    • 제20권2호
    • /
    • pp.32-34
    • /
    • 1971
  • 전파방정식과 그 증명을 이해한 후, 이것의 응용법을 알기 전에 전기공학도는 송전선에 따른 전압, 전류의 변동현상에 친숙해야 하는데, 이를 위해서는 그래프법이 있으면 매우 좋다. 왜냐하면 그래프법에의해 송전선의 동작을 통일적, 시각적으로 통찰할 수 있기 때문이다. 이러한 방법의 하나가 1943년에 출판된 고 F.Esclangon교수의 한 논문에 제시되었다. 불행하게도 이 논문은 주목을 받지 못했는데, 여기에는 두가지 이유가 있을 수 있다. 첫째, 이 논문이 2차대전중에 발행되어서 여러 사람의 손에 들어가지 않았고, 둘째 저자가 자기의 방법의 중요한 이점을 분명히 나타내지 못했다. 본 고는 그래프법을 알려줌으로서 송전선에 대한 흥미를 일깨워주고자 한다.

  • PDF

주제어 문장거리를 이용한 뉴스 편향성 분석 그래프 학습 (Graph Learning System for Analyzing Bias among News Using Keyword Distance Model)

  • 조찬우;조찬형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.533-538
    • /
    • 2023
  • 문서에서 저자의 의도와 주제, 그 안에 포함된 감성을 분석하는 것은 자연어 연구의 핵심적인 주제이다. 이와 유사하게 특정 글에 포함된 정치적 문화적 편향을 분석하는 것 역시 매우 의미 있는 연구주제이다. 우리는 최근 발생한 한 사건에 대하여 여러 신문사와 해당 신문사에서 생산한 기사를 중심으로 해당 글의 정치적 편향을 정량화 하는 방법을 제시한다. 그 방법은 선택된 주제어들의 문장 공간에서의 거리를 중심으로 그래프를 생성하고, 생성된 그래프의 기계학습을 통하여 편향과 특징을 분석하였다. 그리고 그 그래프들의 시간적 변화를 추적하여 특정 신문사에서 특정 사건에 대한 입장이 시간적으로 어떻게 변화하였는지를 동적으로 보여주는 그래프 애니메이션 시스템을 개발하였다. 실험을 위하여 최근 이슈에 대하여 12개의 신문사에서 약 2000여 개의 기사를 수집하였다. 그 결과, 약 82%의 정확도로 일반적으로 알려진 정치적 편향을 예측할 수 있었다. 또한, 학습 데이터에 쓰이지 않은 신문기사를 활용하여도 같은 정도의 정확도를 보임을 알 수 있었다. 우리는 이를 통하여 신문기사에서의 정치적 편향은 작성자나 신문사의 특성이 아니라 주제어들의 문장 공간에서의 거리 관계로 특성화할 수 있음을 보였다. 할 수 있다.

  • PDF

색인어 선정을 위한 어휘결집력에 관한 연구 (Study on the Vocabulary Synthesis for Index Term Selection)

  • 김철;정준민
    • 정보관리학회지
    • /
    • 제13권1호
    • /
    • pp.205-226
    • /
    • 1996
  • 본 연구는 정보결집력을 응용한 자동 색인어 선정 기법에 관한 연구로 한 문장내에 나타난 임의의 어휘가 그 문장을 표현하기 위한 의미있는 집합이라는 가설 하에 어휘쌍 그래프를 통하여 색인어를 추출하였다. 특히, 그래프에 나타난 어휘 관계에서 각 어휘의 전체 어휘쌍 그래프에 대한 결집력을 분석하여 그 결집력을 색인어 선정의 우선 순위로 제안하였다. 가설을 검증하기 위하여 먼저 논문의 제목 및 초록에서 두 문장 이상에 동시 출현한 어휘쌍을 추출하였다. 다음으로 추출한 어휘쌍과 저자가 제시한 색인어 또는 주제명과 비교하였으며 그 결과 어휘쌍 그래프에 나타난 어휘가 대부분 색인어 또는 주제명에 사용되고 있음을 분석하였다. 그 중에서도 특히, 어휘쌍 그래프에서 어휘결집력이 높은 어휘일수록 그 논문의 내용을 전달하는 의미있는 색인어로 채택될 가능성이 높음을 보여 주었다.

  • PDF

간장.된장 분야 연구동향

  • 이경개;김중관;김수미
    • 식품기술
    • /
    • 제19권4호
    • /
    • pp.24-48
    • /
    • 2006
  • 본문에서는 간장 및 된장 관련 논문을 조사하여 기본적으로 저자, 국가, 연구기관별 분석을 통하여 연구분야 현황 및 기술 분류별 분석, 기술의 주요 분포도 등을 파악하였으며, 분석결과를 도식화된 그래프 및 맵핑(mapping)을 통해 체계적이며 다각적으로 나타내어 관련 분야 연구 및 기술동향을 정리하였다.

  • PDF

서바이벌 네트워크 개념을 이용한 저자 식별 프레임워크: 의미론적 특징과 특징 허용 범위 (Authorship Attribution Framework Using Survival Network Concept : Semantic Features and Tolerances)

  • 황철훈;신건윤;김동욱;한명묵
    • 정보보호학회논문지
    • /
    • 제30권6호
    • /
    • pp.1013-1021
    • /
    • 2020
  • 악성코드 저자 식별은 알려진 악성코드 저자의 특징을 이용하여 알려지지 않은 악성코드의 저자 특징과 비교를 통해 악성코드를 식별하기 위한 연구 분야이다. 바이너리를 이용한 저자 식별 방법은 실질적으로 배포된 악성코드를 대상으로 수집 및 분석이 용이하다는 장점을 갖으나, 소스코드를 이용한 방법보다 특징 활용 범위가 제한된다. 이러한 한계점으로 인해 다수의 저자를 대상으로 정확도가 저하된다는 단점을 갖는다. 본 연구는 바이너리 저자 식별에 한계점을 보완하기 위하여 '바이너리로부터 의미론적 특징 정의'와 '서바이벌 네트워크 개념을 이용한 중복 특징에 대한 허용 범위 정의' 방법을 제안한다. 제안한 방법은 바이너리 정보로부터 Opcode 기반의 그래프 특징을 정의하며, 서바이벌 네트워크 개념을 이용하여 저자별 고유 특징을 선택할 수 있는 허용범위를 정의하는 것이다. 이를 통해 저자별 특징 정의 및 특징 선택 방법을 하나의 기술로 정의할 수 있으며, 실험을 통해 선행연구보다 5.0%의 정확도 향상과 함께 소스코드 기반 분석과 동일한 수준의 정확도 도출이 가능함을 확인할 수 있었다.

2015 개정 수학 교과서에 반영된 창의·융합 역량 요소 탐색 - 중학교 1학년 그래프 단원을 중심으로 - (A Study on the Creativity and Convergence Competency Represented in the New Seventh Grade Mathematics Textbook)

  • 황혜정
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제32권4호
    • /
    • pp.477-493
    • /
    • 2018
  • 교과서 저자들은 여러 나라의 교과서 및 교수 학습 자료들을 참고하여 2015 개정 교육과정에서 강조하고 있는 역량들을 담아내고자 하였다. 문제해결, 추론, 의사소통 역량은 2009 개정 교육과정에서 수학적 과정 요소로 이미 강조되어 왔으며, 정보 처리 역량의 경우에는 이전 교육과정부터 계산기와 컴퓨터 사용이 교수 학습 방법 부문에 명시되어 있다(교육부, 2009). 또, 태도 및 실천은 다른 역량과 달리 정의적 영역의 특성을 갖는바, 문제 해결 과정에서 이 역량을 판단하는 것은 쉽지 않다. 그렇다면, 2015 개정 교육과정에 좀 더 관심을 기울이고 새롭게 반영해야 할 역량으로 창의 융합을 들 수 있다. 한편, 2015 개정 수학과 교육과정의 중학교 1학년에 '다양한 상황을 그래프로 나타내고, 주어진 그래프를 해석할 수 있다'는 성취기준이 도입되었다. 교과서마다 주어지는 문제 상황도 다양할 것이고 주어지는 그래프의 유형도 다를 것이다. 본 연구에서는 총 10종의 중학교 1학년 수학 교과서의 그래프 단원을 대상으로 수학 교과서에서의 창의 융합 역량 요소의 반영 현황을 살펴보고자 하였으며, 이를 위하여 선행 연구를 토대로 창의 융합 역량의 하위 요소로 생산적 사고, 독창적 사고, 여러 가지 방법으로 해결, 수학 내적 연결, 수학 외적 연결의 5가지 요소를 선정하여 적용하였다.