• 제목/요약/키워드: 단문분석

검색결과 56건 처리시간 0.018초

2-포아송 모형을 이용한 한글 주제어 선정에 관한 연구 (A Study on the Applicability of 2-Poisson Model for Selecting Korean Subject Words)

  • 정영미;최대식
    • 정보관리학회지
    • /
    • 제17권1호
    • /
    • pp.129-148
    • /
    • 2000
  • 최근 구축된 한글 실험문헌 집단을 대상으로 2-포아송 모형의 Z값의 주제어 식별력을 측정하였으며, 역문헌빈도와 2 포아송 모형간의 상관관계를 분석하였다. 이를 위해 Z와 수정 $\beta$값 및 IDF와 수정 TF.IDF 가중치를 하위 실험집단별로 각기 산출, 비교하였다. 실험 결과 Z값의 주제어 선정능력은 3개의 하위 실험집단 가운데 과학기술분야에서만 확인되었다. 2-포아송 모형의 Z값과 역문헌빈도 가중치간의 상관관계 분석에서는 전문(full text)인 여성학분야 실험집단에 비해 초록 및 신문기사와 같이 단문(short text)으로 구성된 과학기술분야 및 일반사회 분야 실험집단에서 상관관계가 더 크게 나타 났다.

  • PDF

새마을운동 기록물의 개체기반 온톨로지 검색시스템 설계 및 평가 (Design and Evaluation of an Individual Instance-based Ontology Retrieval System for Archival Records of the "Saemaul Movement")

  • 이병길;김희섭
    • 한국기록관리학회지
    • /
    • 제13권3호
    • /
    • pp.67-97
    • /
    • 2013
  • 본 연구의 목적은 새마을운동 기록물을 위한 개체기반 온톨로지 검색시스템의 설계와 그 성능평가이다. 개체기반 온톨로지 설계를 위하여 Protege editor4.1을 사용하였고, 새롭게 구현된 검색시스템의 성능은 단문5개, 장문10개의 질의유형으로 기존 나라기록의 키워드 기반 검색시스템과 정확률과 재현율을 비교하여 분석하였다. 분석결과 개체기반 온톨로지 검색시스템이 정확률과 재현율 모두 키워드 기반 시스템보다 우수한 성능을 보였다.

잠재 의미 분석을 적용한 유사 특허 검색 서비스 시스템 (Similar Patent Search Service System using Latent Dirichlet Allocation)

  • 임현근;김재윤;정회경
    • 한국정보통신학회논문지
    • /
    • 제22권8호
    • /
    • pp.1049-1054
    • /
    • 2018
  • 유사 특허를 검색하는 방법으로 기존에는 키워드 검색 방법을 사용하고 최근에는 머신러닝을 활용한 자동분류 방법을 사용하고 있다. 키워드 검색은 데이터 정제를 통해 정형화된 데이터 분석 방법으로 단문일 경우 검색에서는 정확도는 높지만 문서와 같이 여러 단어로 이루어진 장문일 경우 문장에 내포된 의미 분석을 할 수 없었다. 의미 분석 단계에서의 자동 분류 방법은 비정형 데이터 분석 방법으로 여러 단어로 이루어진 문장을 분류하는데 사용되고 있다. 그 동안 두 가지 방법을 결합하여 유사 문서 검색을 하려는 시도가 있었지만 비정형 데이터와 정형 데이터의 동시 사용에는 분석하는 방법이 다르기 때문에 동시 적용에는 알고리즘 상의 문제가 있었다. 이에 본 논문에서는 문서에서 함축된 키워드를 검출하고 잠재 의미 분석(LDA) 방식을 사용하여 사람이 개입하지 않고 문서를 효율적으로 자동분류하고 유사 특허를 검색할 수 있는 방법을 연구하였다.

서술형 문항 채점을 위한 복합문 구문의미분석 시스템에 대한 연구 (Research on the Syntactic-Semantic Analysis System on Compound Sentence for Descriptive-type Grading)

  • 강원석
    • 컴퓨터교육학회논문지
    • /
    • 제21권6호
    • /
    • pp.105-115
    • /
    • 2018
  • 서술형 문항은 수준 높은 사고능력 평가에 적합하나 채점이 쉽지 않다. 동일한 채점기준을 적용하더라도 채점자마다 서로 다른 채점을 할 수 있으므로 객관적인 채점 시스템이 필요하다. 그렇지만 채점 시스템을 구축하기 위해서는 표현 언어인 한국어 분석이 전제되어야 한다. 특히 서술형 문항의 답변은 단문형태가 아닌 복문이 내포된 복합 문장으로 표현되기 때문에 복합문의 한국어 분석이 이루어져야 한다. 본 연구는 이와 같은 서술형 문항의 자동 채점을 위해 한국어의 복합문을 구문의미 분석하는 시스템을 개발하고 시스템의 성능을 분석하였다. 이 시스템은 의미속성 사전을 활용하여 대상 구문의 의미적 제한조건을 검사하고 적합한 피수식 대상을 선별하여 구문의미분석을 실행한다. 실험 데이터에 대해 93%의 정확률을 얻어 제안한 시스템이 효과있음을 알 수 있었다. 본 연구의 시스템은 서술형 문항 채점에 활용할 수 있고 한국어 처리의 응용영역에 활용할 수 있을 것으로 기대된다.

교육정보화를 통한 학부모 학교교육 참여 촉진방안 연구 (A Study on the Activation Method for Parents' Participation in School Education through Educational Information)

  • 유정수;백현기
    • 정보교육학회논문지
    • /
    • 제13권4호
    • /
    • pp.433-441
    • /
    • 2009
  • 본 연구에서는 학생의 교육적 성장에 영향을 미치는 요인인 학부모들을 교육정보화를 통해서 학교교육에 참여 시킬 수 있는 바람직한 방안을 모색하고자 한다. 본 연구에 대한 질적 연구가 전무한 상태라 연구방법은 근저이론을 토대로 하였다. 현재 학교현장에서 시행되고 있는 사이버가정학습 서비스와 교육행정시스템인 나이스 통해 사례분석, 심층면담 및 내용(문서) 분석을 하여 학부모의 학교교육 참여사례를 보다 체계적인 분석과 해석 과정을 반복하여 분석하였다. 사례 분석 대상은 2007년 교육정보화 우수학교 1개교, 사이버가정학습 우수운영사례학교 10개교, 연구학교 2개교와 나이스연구학교 7개교를 대상으로 이들 학교에서 나타나는 내부적 실제들과 학교 현장을 총체적이고 심층적으로 분석하여 교육정보화를 통해 학부모의 학교교육 참여 방안을 살펴보았다. 현재 학부모들은 사이버가정학습 서비스나 나이스를 통해서 학생들의 학습 상황점검 및 의사소통이 이루어지고 있었으며, 사이버 대화 창구를 통해 전인교육프로그램으로 정착하는데 안정적 기여를 하고 있었다. 또한 SMS서비스는 교사와 학부모간의 의사소통을 용이하게 하여 시공간을 초월한 의사소통 경로 확보와 함께 교사와 학부모간의 신뢰를 구축시키는데 기여도가 큼을 알 수 있었다.

  • PDF

e-Navigation 대응 해상 데이터통신 시스템 개선 (The improvement of maritime data communication systems for e-Navigation)

  • 정성훈;양규식;정기룡;박동국;김정창
    • 한국항행학회논문지
    • /
    • 제15권6호
    • /
    • pp.939-945
    • /
    • 2011
  • GMDSS 적용 선박들에 의무적으로 탑재되는 통신장비들의 기능적 한계를 개선하기 위하여 통신 매체별 통신비용, 처리율, 통신 속도, 처리 가능한 서비스, 통신 가능 범위 등에 대한 성능 분석 및 평가를 통하여 e-Navigation 수행에 적합한 데이터통신 시스템의 설계와 구현을 하였다. 제안한 시스템의 실험 결과를 통해, 해상에서 사용할 수 있는 MF/HF 대역은 3600bps 정도의 단문 메시지 송 수신이 유용하고, VHF 대역에서는 9600bps 정도의 이메일 정도의 서비스가 가능하며, 해사위성통신의 Fleet Broadband 서비스의 경우는 수Mbps의 멀티미디어 서비스가 가능함을 확인하였다.

한국어 문장이해를 위한 가변패턴네트의 구성과 응용 (Construction of Variable Pattern Net for Korean Sentence Understanding and Its Application)

  • 한광록
    • 한국정보처리학회논문지
    • /
    • 제2권2호
    • /
    • pp.229-236
    • /
    • 1995
  • 문장의 개념세계는 체언과 용언으로서 이루어 진다. 문장의 의미적 중심은 용언 이고, 체언은 용언의 구속을 받으며, 이들은 다양하게 결합한다. 본 논문은 한국어의 문에서 체언과 용어의 결합관계를 분석하고, 형태소 해석의 결과로부터 도출한 구 단 위문을 가변패턴네트를 구성함으로써 구문 및 의미해석을 하여 절형식의 개념단위를 추출한다. 또한 종래의 제한된 혼절 이론을 일반문에 확장하고, 장문을 단문으로 자동 분리하여 논리적인 개념단위의 절 형식으로서 지식베이스를 구축하고 질문응답시스템 으로의 응용을 시도하였다.

  • PDF

주자지(周紫芝), 『죽파시화(竹坡詩話)』에 관한 시론(試論)

  • 김규선
    • 동양고전연구
    • /
    • 제59호
    • /
    • pp.213-231
    • /
    • 2015
  • 양송(兩宋) 교체기의 중요한 시인이자 비평가인 주자지(周紫芝)의 "죽파시화(竹坡詩話)"는 당시의 여느 시화와 마찬가지로 각 조 사이의 관계가 전혀 유기적이지 않으며 주제도 천차만별이다. 하지만 그 안에 도연명(陶淵明), 두보(杜甫), 이백(李白), 한유(韓愈), 류종원(柳宗元) 등의 당대(唐代) 시인부터 소식(蘇軾), 황정견(黃庭堅), 매요신(梅堯臣), 장뢰(張?) 같은 송대(宋代) 시인에 이르기까지 직, 간접적으로 언급된 시인이 40여 명이나 되고 그들의 작품에 대한 평가와 격률(格律), 자구(字句), 용사(用事)에 대한 분석 및 고증, 그리고 주자지 개인의 시론이 단문 형태로 흩어져 있다. 하지만 그것들을 종합, 개괄하면 주자지의 심오하고 독창적인, 시의 격식과 내용을 함께 존중하는 시학(詩學)을 확인할 수 있다. 그러나 "죽파시화"는, 본래 주자지가 이른바 '남도시단(南渡詩壇)'의 주요 시인이었기 때문에 상대적으로 시 이외의 기타 저작이 홀시되었고 그의 스승이 장뢰(張?), 이지의(李之儀)였던 사실로부터 그의 시학 역시 강서시파(江西詩派)를 답습했을 것이라는 판단이 미리 내려진 탓에 지금까지 시문학사에서 온당한 평가를 받지 못했다. 하지만 주자지는 "죽파시화"에서 당시 형식과 기교에 편중했던 강서시파 말류의 병폐를 명확히 인식하여 독자적으로 자연스러움과 조탁을 고도로 통일시킨 시학을 제시하였다. 요컨대 기계적인 모방 이론에 반대하고 평담(平淡), 자연(自然), 청원(淸遠)의 풍격을 추구하는 한편, 연구(煉句), 연자(煉字)에 힘씀으로써 오히려 평담함의 시풍에 이르게 된다고 하였다. 주자지의 이런 시학은 중국 시문학사에서 그 지위를 재평가 받아야 하며, 아울러 송대뿐만 아니라 오늘날에도 시인과 평론가들이 참고할 만한 보편적 가치를 가졌다.

슬라이딩 상관기를 적용한 디지털 직접대역확산 송수신기의 설계 및 성능분석 (Design and Performance Analysis of sliding correlator digital DS-SS Transceiver)

  • 김성철;진고환
    • 한국정보통신학회논문지
    • /
    • 제16권9호
    • /
    • pp.1884-1891
    • /
    • 2012
  • 본 논문에서는 sliding상관기를 적용한 단문 메세지 서비스를 위한 대역확산 송수신기를 설계하고 대역확산 수신기에서 필수적인 PN코드 동기회로에 대한 성능을 분석하였다. 대역확산 시스템에 대한 이론적인 분석과 대역확산 수신기에 있어서 중요한 PN 코드 동기 회로에 대한 분석을 토대로 PN 코드 발생기, 클럭 발생을 위한 분주회로, 수신기에서의 PN 코드의 상관을 위한 슬라이딩 상관기 등을 Altera사의 칩 EPM7064 SLC44-10을 사용하여 FPGA화하였으며 디지털 설계가 용이하지 않은 주변회로인 슬라이딩 상관기에 필요한 PN코드 지연 클럭 발생회로, 동기 스위치제어회로, 데이터복조회로를 설계하여 전체적인 송수신기회로를 설계하였다. 설계된 회로를 실험을 통하여 송수신기의 성능을 평가 관찰하였다. 특히, 수신기에 있어서 역 확산을 위한 PN 신호의 동기과정의 성능 즉, 동기가 이루어 졌을 때의 동기 탐색/유지신호와 동기가 이루어지지 않았을 때의 게이트 지연시간으로 인한 동기 탐색/유지신호등의 결과를 통해 성능을 평가하였다. 슬라이딩 상관기의 경우 코드 동기를 위한 시간이 송수신 PN 코드의 불확정성이 클 경우 상당히 큼을 알 수 있었다.

텍스트마이닝을 활용한 정보보호 키워드 기반 소셜미디어 빅데이터 분석 (Social Media Bigdata Analysis Based on Information Security Keyword Using Text Mining)

  • 정진명;박영호
    • 한국산업정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.37-48
    • /
    • 2022
  • 디지털 기술의 발전으로 사회적 이슈들이 SNS와 같은 디지털 기반 플랫폼을 통해서 소통되고 여론을 형성하기도 한다. 본 연구에서는 소셜미디어를 통해서 공유되고 있는 정보보호 이슈관련 여론을 살펴보기 위하여 대표적인 단문 소셜네트워크서비스인 트위터 빅데이터 분석을 진행하였다. 2021년 1년간 14개 정보보호 관련 키워드를 중심으로 데이터를 수집한 후, 데이터마이닝 기술을 활용하여 용어 빈도(TF)분석과 피어슨 계수를 활용한 상관분석을 통해 키워드간의 상관관계를 밝혔다. 또한 잠재적 확률기반 LDA 토픽모델링을 실시하여 정보보호분야에 많은 관심을 받았던 6개의 주요 토픽을 도출하였다. 이러한 결과는 관련 산업의 전략수립이나, 정부 정책수립 시 주요 키워드를 도출하는 기초데이터로 활용될 수 있을 것으로 기대된다.