• 제목/요약/키워드: 복합어

검색결과 336건 처리시간 0.025초

국내 학술지 논문의 주제어를 통한 학술연구분야 관계분석 (Relation Analysis Among Academic Research Areas Using Subject Terms of Domestic Journal Papers)

  • 이혜영;곽승진
    • 한국비블리아학회지
    • /
    • 제22권3호
    • /
    • pp.353-371
    • /
    • 2011
  • 본 연구의 목적은 국내 연구자들의 연구 성과물인 학술지 논문에 나타난 학문분야의 상호관계성과 연관성에 대한 연구로 연구동향에 대한 시사점을 제시하는 것이다. 학술논문을 이용한 계량적 연구는 주로 논문의 초록, 자동추출 키워드, 논문의 풀텍스트를 활용하는 것이 일반적이나 본 연구는 실험대상 학술논문의 저자가 제시한 주제어에 초점을 두었다. 실험대상 자료는 2009년도 한국연구재단 등재학술지 80종으로 학술논문 7,616건, 주제어 58,143건이다. 자료 분석결과 공학, 농수해양, 복합학, 사회, 예술체육, 의약학, 인문, 자연과학 등의 8개 각 연구분야는 주제어 사용에서 차이점을 보였다. 특히 공학분야의 주제어가 다른 연구 분야에서도 주제어로 많이 사용되고 있었다. 또한 주제어 네트워크를 통해 연구분야를 클러스터링 한 결과, 3개 클러스터를 얻을 수 있었다. 클러스터A는 '공학', '자연과학', '사회', '복합학', '인문', 클러스터B는 '의약학', '예술체육', 클러스터C는 '농수해양'이었다.

자연언어 질의 문장의 용어 가중치 부여 기법 (Term Weighting Method for Natural Language Query Sentence)

  • 강승식;이하규;손소현;문병주;홍기채
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.223-227
    • /
    • 2002
  • 자연언어 질의 문장으로부터 검색어로 사용될 질의어의 추출 및 질의어 가중치를 계산하기 위하여 질의 문장들의 유형을 분석하였으며, 질의어 구문의 특성에 따라 용어들의 가중치를 계산하는 방법을 제안하였다. 용어의 가중치를 부여할 때 띄어쓴 복합명사와 접속 관계 등에 의해 연결된 명사구는 질의어 가중치를 동등하게 적용할 필요가 있다. 질의 문장에서 가중치가 동등하게 적용되는 명사구를 인식하기 위한 목적으로 구현된 명사구 chunking을 수행한 후에 각 용어들에 대한 질의어 가중치를 계산한다. 질의어 가중치를 계산하기 위하여 용어의 유형, 질의 구문의 특성, 문서 유형을 지칭하는 용어, 조사 유형, 용어의 길이 등에 따라 가중치를 조절하는 방법을 사용한다. 용어유형에 의한 가중치 계산은 추출된 용어의 품사 정보와 전문 용어 사전, 부사성 명사 사전을 이용하였다.

  • PDF

PDA를 이용한 한국어 자동 색인 시스템 (Korean Automatic Indexing System Using the PDA)

  • 박평구;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.375-378
    • /
    • 2000
  • 인터넷의 급속한 발달로 사용자는 자신의 질의에 적합한 검색결과를 빠르고 정확하게 보장하는 검색도구를 요구하게 되었다. 이러한 사용자의 요구는 검색도구의 성능향상에 필수적인 문서의 내용을 대표하는 색인어를 추출하는 색인 시스템에 대한 관심을 가지게 되었다. 기존의 한국어에서의 자동 색인 방법에는 어절 중심 색인법, 형태소 중심 색인법과 최근에 n-gram 중심 색인법 등이 주류를 이루어 왔다. 그러나 한국어에서 색인어를 추출하는 기존의 방법은 복합명사의 색인과 복잡한 문법적 지식이 필요하고 잘못된 색인어를 추출하는 등의 검색효율에 문제점을 가지고 있다. 본 논문에서는 PDA를 이용한 정형화된 한국어와 영어문장의 자동 색인 방법을 제안한다. 제안하는 방법은 별도의 사전지식이 필요하지 않고 단일 명사와 복합명사의 색인이 가능하며 인터넷으로의 확장과 다양한 언어로 확장성이 좋은 장점 등을 갖는다. 성능 평가로써 한국통신의 KTSET으로 MS사의 IIS를 웹 서버로 ASP를 이용하여 인터넷 환경에서 테스트를 통하여 한국어 뿐 아니라 영어문장의 정형화되고 이용이 간편한 자동색인 결과를 보여준다.

  • PDF

트위터를 이용한 질의어 관련 이슈 탐지를 위한 인접도 행렬 기반 연관 어휘 추출 (Related Term Extraction with Proximity Matrix for Query Related Issue Detection using Twitter)

  • 김제상;조효근;김동성;김병만;이현아
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권1호
    • /
    • pp.31-36
    • /
    • 2014
  • 트위터와 페이스북 등의 SNS(Social Network Service)는 일반 대중의 관심사나 트렌드 등의 이슈를 탐지하기 좋은 지식원이다. 본 논문에서는 검색 질의어에 관련된 이슈나 화제를 질의어에 대한 연관 어휘로 보고, 이를 트위터에서 추출하기 위한 방법을 제안한다. 제안하는 방법에서는 질의어와 연관성이 높은 단어는 질의어와 가까운 위치에서 자주 발생한다고 가정하고, 단어 간 거리에 반비례하고 공기 빈도에 비례하는 단어 간 인접도의 합으로 단어간 연관도를 구한다. 구해진 연관도 값이 임계치를 넘는 어휘를 연관 어휘로 보고 네트워크의 형태로 관련 이슈를 제시한다. 제안한 방법에서는 네트워크의 특성을 분석하여 복합어를 손쉽게 탐지할 수 있다.

한일 기계번역을 위한 보문의 수식 Scope 해석 (The Modification Scope Analysis of the Embedded Sentences in Korean and Japanese Machine Translation)

  • 이수현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.346-350
    • /
    • 1996
  • 한일 양언어의 복합문은 여러가지의 통어 현상을 가지며, 주어, 목적어 등의 생략 현상으로 문장의 표층상에 나타나지 않는 것이 있기 때문에 수식구조의 처리가 복잡해지고, 구문해석에 있어서 애매성의 요인이 된다. 따라서, 본 논문에서는 DPN에 의하여 한국어와 일본어의 수식 scope를 해석하는 방법에 대하여 설명한다. 먼저, 한일 양언어의 공통점과 차이점을 찾아내어, 한국어와 일본어의 보문을 표현형식으로 나타내고, 동사의 격정보로부터 DPN을 구성하여 DPN상에서 보문의 수식 Scope를 해석하는 방법에 대해서 설명한다.

  • PDF

고빈도어를 이용한 복합명사 색인어 추출 방안 (The Generation Methods of Composition Noun For Efficient Index Term Extraction)

  • 김미진;박미성;장혁창;최재혁;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.121-129
    • /
    • 1998
  • 정보검색이나 자동색인 시스템에서는 정확한 색인어의 추출이 시스템의 성능을 좌우하게 된다. 따라서 정확한 색인어의 추출이 매우 중요하다. 본 논문에서는 정보 검색시에 보다 정확한 문서를 찾아줄 수 있도록, 출현 고빈도어를 이용하여 효율적인 색인어 추출을 위한 합성 명사 생성방안을 제시한다. 이를 위하여 문서 내에서 출현 빈도가 높은 명사, 즉 상위 $30%{\sim}40%$의 고빈도 명사에 합성 및 분해 규칙을 적용하여 합성명사 색인어를 추출한다. 또한 본 논문에서 제시한 상위 $30%{\sim}40%$ 고빈도 명사합성에 대한 타당성을 검증하기 위하여 적절한 명사합성 빈도를 구한다. 제안한 방법을 적용한 결과 300어절 이하의 짧은 문서는 출현빈도 상위 30%까지의 명사를 합성했을 경우 저빈도 누락이 작았고 300어절 이상의 문서는 출현빈도 40%까지 합성하면 저빈도 누락이 상당히 줄어듦을 알 수 있었다. 그리하여 전체 색인어의 개수를 줄였고 색인어의 정확률을 높였다.

  • PDF

영어 중첩복합어 분석 (An Analysis of English Reduplicative compounds)

  • 김형엽
    • 인문언어
    • /
    • 제2권1호
    • /
    • pp.303-314
    • /
    • 2002
  • The main purpose of this paper is to show how Jespersen analyzed the date of English compound related with reduplication. Especially dealing with the compound words he classified the examples related with reduplication as a separate part and attempted to account for the patters based on the structure of the first syllable constituting the initial part of the second element in a compound word. 1 tried to explain the peculiar shape of the reduplicational pattern in English based on the Optimality Theory, especially the method of 'melodic overwriting' of McCarthy(1997). According to the analysis the initial part of the second element of a compound has to be stipulated before reduplication occurs. When the reduplicant has to be decided at the first syllable of the second element, the form which is stipulated to take the position comes to appear at the post instead of repeating the morphemic shape of the first syllable at the first element of the word.

  • PDF

한국어 복합명사 분해 오류 교정 기법 (Error Correction Method for Korean Compound Noun Decomposition)

  • 강민규;강승식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.254-259
    • /
    • 2010
  • 복합명사의 구성요소로 미등록어, 1음절어, 접사 등이 포함된 경우에 복합명사 분해기의 분해 결과가 분해중의성을 보이게 된다. 특정 복합명사에 대한 분해 결과가 잘못된 것일 경우, 이를 분해 오류로 판단하고, 재처리과정을 통해 교정해야 한다. 본 논문에서는 복합명사의 분해 결과에서 분해 오류에 대하여 각 구성명사의 빈도 정보를 통해서 오류 여부를 판단하고, 적절한 재분해 결과를 제공하여 분해 오류를 교정하는 방법을 제안한다.

  • PDF

경도지적장애 학생의 신조어 능력이 또래인기도에 미치는 영향 (The Effect Of Neologism Ability Of Students With Mild Intellectual Disabilities On Peer Popularity)

  • 김화수;진수미;이지우
    • 디지털융복합연구
    • /
    • 제20권1호
    • /
    • pp.213-220
    • /
    • 2022
  • 본 연구는 경도지적장애 학생과 생활연령 일치집단 일반학생을 대상으로 신조어 사용의 특성과 신조어 사용능력과 또래인기도 간의 관계를 알아보는 것이 목적이다. 생활연령이 14~16세 되는 경도지적장애 학생 4명과 생활연령 일치집단 일반학생 4명, 총 8명으로 하여 대상을 비모수 검정으로 집단 간 비교를 하였다. 신조어의 경우 301개의 신조어 중에서 전문가 내용타당도를 통하여 60개의 신조어를 선택한 후, 60개 신조어 어휘에 대한 인식도와 배경정보를 수집하였다. 연구결과 첫째, 경도지적장애 학생 집단과 생활연령 일치 일반학생 집단 간에 신조어 이해도에서 유의한 차이를 나타냈다. 둘째, 경도지적장애 학생 집단과 생활연령 일치 일반학생 집단 각각에 대하여 신조어 사용과 또래인기도의 상관관계를 비교하였는데 두 집단 모두 신조어 사용과 또래인기도가 높은 정적상관관계를 나타냈다. 그러므로 경도지적장애 학생을 대상으로 어휘 지도를 할 때, 또래와의 관계 및 인기도를 높이기 위해서는 신조어 어휘를 지도할 필요가 있음을 시사한다.