• 제목/요약/키워드: 핵심어

검색결과 371건 처리시간 0.03초

복합 자질 정보를 이용한 통계적 한국어 채팅 문장 생성 (Statistical Generation of Korean Chatting Sentences Using Multiple Feature Information)

  • 김종환;장두성;김학수
    • 인지과학
    • /
    • 제20권4호
    • /
    • pp.421-437
    • /
    • 2009
  • 채팅 시스템은 인간이 사용하는 언어를 이용하여 인간과 컴퓨터 간의 대화를 시뮬레이션하는 프로그램이다. 본 논문에서는 핵심어와 화행을 입력으로 받아 자연스러운 채팅 문장을 생성하는 통계 모델을 제안한다. 제안 모델은 먼저 핵심어를 포함한 어절을 말뭉치에서 선택하고, 해당 어절의 주위에 있는 어절의 출현 정보와 구문 정보를 이용하여 후보 문장들을 생성한다. 그리고 화행에 기초한 언어 모델, 어절간 공기 정보, 각 어절의 구문 정보를 이용하여 생성된 후보 문장 중 하나를 선택한다. 실험 결과에 따르면 제안 모델은 단순한 언어 모델에 기반한 기존의 모델보다 좋은 86.2%의 적합 문장 생성률을 보였다.

  • PDF

한국어 발화음성에서 중점단어 탐색을 위한 기본주파수에 대한 연구 (A Study of Fundamental Frequency for Focused Word Spotting in Spoken Korean)

  • 권순일;박지형;박능수
    • 정보처리학회논문지B
    • /
    • 제15B권6호
    • /
    • pp.595-602
    • /
    • 2008
  • 각 문장 별 중점단어는 발화음성을 인식하고 그 의미를 이해하는데 도움을 준다. 발화된 음성신호로부터 중점단어를 탐색할 수 있는 방법을 찾기 위한 노력의 일환으로 실험을 통하여 문장 내에서 중점단어와 그 외의 단어들의 기본주파수의 평균과 분산, 그리고 평균 에너지를 분석해 보았다. 한국어로 된 100개의 발화문장의 음성데이터를 가지고 실험을 한 결과 중점단어는 그 외의 단어들에 비해 대부분 상대적으로 높은 기본주파수의 평균값을 나타내거나 상대적으로 높은 기본주파수의 분산 값을 나타냈다. 이 연구 결과를 이용하면 한국어의 구어문장에서 운율적 특성을 알 수 있을 뿐만 아니라, 자연어 처리를 이용한 핵심어를 추출하는 데에도 도움이 될 것이다.

기록평가의 지식구조와 용어 분석 : 『Encyclopedia of Archival Science』 표제어를 중심으로 (Knowledge Structure and Terminology of Archival Appraisal: Focusing on the Entries of "Encyclopedia of Archival Science")

  • 설문원
    • 한국기록관리학회지
    • /
    • 제23권1호
    • /
    • pp.81-99
    • /
    • 2023
  • '평가(appraisal)'는 기록관리의 핵심 영역이다. 이 연구는 기록학 분야의 대표적인 백과사전인 『Encyclopedia of Archival Science』을 중심으로 기록평가의 지식구조를 파악하고, 관련 대역어들의 적절성을 분석하기 위한 것이다. 이를 위하여 먼저 이 사전에 146개 표제어 중 평가 관련 표제어 34개를 추출하고, 내용분석에 기초하여 용어를 범주화하였다. 둘째, 각 범주별 표제어들을 중심으로 주요 개념과 논의의 흐름을 살펴보았다. 셋째. 각 표제어들에 대한 대역어를 제시하였으며 대역어 선정 시 고려할 점을 제안하였다. 특히 '기록평가'(records appraisal)와 '보존기록평가(archival appraisal)'를 구분하여 사용하고, 등가의 원칙에 따라 대역어를 선정할 것을 제안하였다.

관계형 DB에서 Local Order 방식을 이용한 XQuery 변환기 설계 및 구현 (XQuery transformer Using Local Order in Relational DB)

  • 이명숙;홍동권;손유익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.137-140
    • /
    • 2005
  • 관계형 데이터베이스(RDBMS)의 내용을 XML로 표현하게 되면 지금까지 축적되어온 방대한 비즈니스 데이터들을 지속적으로 이용할 수 있게 된다. 다양한 형태로 저장된 XML 문서에서 원하는 데이터를 추출하고 변환하는 작업을 위해 W3C에서는 XPath를 핵심으로 하는 XQuery를 새로운 질의어 표준으로 발표하였다. RDBMS에 XQuery 질의어로는 구조가 다르기 때문에 질의어를 사용할 수가 없다. 따라서 본 논문에서는 XQuery 질의어로 RDBMS에서 검색이 가능하도록 XQuery 질의어를 SQL문장으로 변환시켜 검색할 수 있는 변환기를 설계하였다. 이 변환기는 복잡한 Numbering 기법을 사용하지 않고 child-parent relationship만 사용하므로 효율적인 데이터의 업데이트를 처리할 수 있다.

  • PDF

구름(KULLM): 한국어 지시어에 특화된 거대 언어 모델 (KULLM: Learning to Construct Korean Instruction-following Large Language Models)

  • 이승준;이태민;이정우;장윤나;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.196-202
    • /
    • 2023
  • Large Language Models (LLM)의 출현은 자연어 처리 분야의 연구 패러다임을 전환시켰다. LLM의 핵심적인 성능향상은 지시어 튜닝(instruction-tuning) 기법의 결과로 알려져 있다. 그러나, 현재 대부분의 연구가 영어 중심으로 진행되고 있어, 다양한 언어에 대한 접근이 필요하다. 본 연구는 한국어 지시어(instruction-following) 모델의 개발 및 최적화 방법을 제시한다. 본 연구에서는 한국어 지시어 데이터셋을 활용하여 LLM 모델을 튜닝하며, 다양한 데이터셋 조합의 효과에 대한 성능 분석을 수행한다. 최종 결과로 개발된 한국어 지시어 모델을 오픈소스로 제공하여 한국어 LLM 연구의 발전에 기여하고자 한다.

  • PDF

미국 국가 기준 가정과교육과정에 포함된 세계시민교육 관련 목표와 내용 탐색: '세계'관점과 핵심어를 중심으로 (Exploring the Objectives and Contents of Global Citizenship Education in the NSFCS 3.0: Focusing on the View of the 'World' and the Keywords)

  • 허영선;김남은;채정현
    • 한국가정과교육학회지
    • /
    • 제33권3호
    • /
    • pp.107-127
    • /
    • 2021
  • 이 연구의 목적은 미국 국가 기준 가정과교육과정(NSFCS 3.0)의 내용 영역 및 역량과 유네스코 세계시민교육(Global Citizenship Education[GCED])의 관련성을 살펴보는 것이다. 이를 위해 NSFCS 3.0 내 '세계' 관점과 내용 영역 및 역량 요소들과 유네스코 세계시민교육의 3가지 영역의 9가지 내용 요소의 핵심어를 분석하였다. 구체적으로, NSFCS 3.0의 문서에 기술된 '세계' 관점과 관련된 단어들을 추출하고 그와 연관된 부분의 내용 기준과 역량 요소들과 세계시민교육의 주제와 비교한 후, 이 영역의 핵심어와 관련성을 분석하였다. NSFCS 3.0과 유네스코 세계시민교육과의 관련성을 살펴본 결과는 다음과 같다. 첫째, NSFCS 3.0에서는 내용 기준과 역량에서 '세계'라는 핵심어를 명시하여 '대인관계', '부모됨' 2개 영역을 제외한 14개 영역에서 개인을 세계시민으로 인식하여 개인과 세계와의 직접적인 상관관계를 기술하였다. 둘째, NSFCS 3.0의 내용 기준 및 역량에서 세계시민교육 영역별 학습 주제와 관련된 핵심어는 가정학의 식생활, 가족생활, 인간발달에서는 세 영역 모두 고르게 제시되어 있었으며, 의생활, 주생활, 소비생활에서는 사회·정서적 영역이 제시되지 않았다. 반면, 세계시민교육에서 가장 강조하는 행동적 영역은 모든 가정학 영역에 제시되어 세계시민교육을 위한 학습의 장은 가정과교육이 추구하는 삶의 영역으로 볼 수 있다. 이상의 연구결과를 통해 NSFCS 3.0과 세계시민교육을 관련지어 이해하고, 우리나라 차기 가정과교육과정의 개정에 세계시민 교육의 내용요소를 어떻게 포함할 수 있는가에 대한 방향을 제시하는 기초자료로 활용할 수 있을 것이다.

교육개발협력에 관한 국제 학술지 연구 동향 고찰 : 텍스트 네트워크 분석을 중심으로(2002~2017) (A Study on the International Research Trend in Education Development focused on Text Network Analysis(2002~2017))

  • 김상미;김영환;조원겸
    • 비교교육연구
    • /
    • 제28권1호
    • /
    • pp.1-24
    • /
    • 2018
  • 본 연구는 교육개발협력에 관한 글로벌 연구 동향을 살펴보고, 이를 통해 국내 관련 연구에서의 향후 방향과 시사점을 탐색하는 것을 목적으로 한다. 이를 위해 교육개발협력 분야의 국제 학술지인 "International Journal of Educational Development"를 선정하고, 2002년부터 2017년까지 약 15년간 게재된 연구 논문 966편을 대상으로 연구 초록에 제시된 (저자) 키워드를 텍스트 네트워크 분석하여 시기별, 교육영역별로 연구 주제가 어떻게 변화하고 이에 나타나는 특징이 무엇인지를 알아보았다. 이에 대한 주요 연구 결과는 다음과 같다. 첫째, 분석 대상 전체 논문에 나타난 연구 주제어의 출현 빈도를 살펴본 결과, 교육프로그램관리, 학교수업, 지역공공행정, 교육지원서비스, 초등교육 순으로 높았으며, 빈도 순 상위 20개의 핵심주제어에 대한 네트워크 중앙성 분석 결과는 빈도수 결과와 유사한 상관관계를 나타내었다. 그러나 중등교육, 학습, 교육연구, 교육변화, 교육의질 등의 주제어는 출현 빈도에 비해 높은 중앙성 지수를 나타내고 있어 다른 키워드들과 높은 관계성을 가지고 있었다. 둘째, 시기별 핵심 주제어 분석 결과 MDGs 전기 대비 후기와 SDGs 초기에는 새로운 키워드(초등교육, 초중등학교, 학교수업, 교육의 질, 중등교육, 교육계획)가 다양하게 나타났고, 중앙성 지수에서도 높은 수치를 나타내고 있어 새로운 핵심 연구 주제가 되고 있음을 알 수 있다. 셋째, 교육일반, 기초교육, 중등교육, 고등교육으로 분류한 교육영역별 분석 결과에서는 빈도수와 중앙성이 높은 핵심 주제어가 각각 다소 상이하게 나타나고 있어 영역에 따른 연구 키워드가 구분되고 있다는 특징이 부각되었다. 본 연구는 국제 아젠다로서의 교육개발협력 특성을 고려하여 국제적 수준에서 약 15년간 누적된 연구 논문들을 대상으로 객관적 데이터 분석 프로그램을 활용해 연구 주제의 변화 동향을 조망하였다는데 의의가 있으며, 현재 국내에서 실천적 노력과 더불어 교육개발협력에의 학문적 연구 개발이 지속적으로 강화되어야 할 시점임을 고려할 때, 향후 보다 다양한 분야에서의 연구 개발에서 참고할 만한 시사점을 제공할 수 있을 것이다.

한의학 연구동향에 대한 사회연결망분석 (A Social Network Analysis on the Research Trend of Korean Medicine)

  • 권기석;이준혁;이주연;채성욱;한동성
    • 기술혁신학회지
    • /
    • 제17권2호
    • /
    • pp.334-354
    • /
    • 2014
  • 본 논문에서는 KCI(한국학술지인용색인) 데이터를 기반으로 네트워크 분석 기법을 활용하여 한의학 분야 연구동향 분석을 실시하였다. 먼저 기술통계분석 결과에 의하면, 한의학분야 논문은 증가하다가 2008년을 정점으로 감소 추세이며 논문 저자수도 이와 같은 추세를 보여 주었다. 동의생리병리학회지가 가장 많은 논문을 생산하고 있고, 핵심어의 경우 acupunture가 월등한 빈도수 차이로 1위를 차지하였다. 다음으로 네트워크 분석을 통해 네트워크의 형태와 중심성 수치를 통해 네트워크의 중심과 핵심 그룹을 파악하였고, 연도별 비교를 통해서 네트워크의 모습과 중심이 어떻게 변화했는지 알 수 있었다. 학술지 네트워크의 경우 동의생리병리학회지, 대한한의학회지 등이 핵심적인 그룹을 형성하였고, 그 중 한의학연구원논문집이 최근에 중심적 위치를 차지한 것으로 나타났다. 연구기관 네트워크에서는 경희대학교가 가장 중심에 있으며, 최근 한의학연구원의 중심성이 커졌다. 핵심어 네트워크를 통해 한의학 연구가 질환의 기전과 치료로 양분되어 수행되는 것을 확인할 수 있었다. 이러한 사회연결망분석의 결과를 통해 심층적인 연구동향을 파악할 수 있어서 연구동향 분석에서 전문가 식견에 의한 동향분석 방법과 서로 연계되는 유용한 방법임을 확인 할 수 있었다.

연속분포 HMM에 의한 실시간 Word Spotting 에 관한 연구 (A Study on the Real-time Word Spotting by Continuous density HMM)

  • 서상원
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.92-95
    • /
    • 1995
  • 연속분포 HMM을 사용한 실시간 로봇 암 제어 시스템에 대해 기술하고 있다. 본 시스템은 자연스러운 문장의 로봇 암 제어 명령 발성을 받아 핵심단어 인식의 framework을 통한 명령 인식 및 로봇 제어를 구현하고 있다. 로봇 몸체의 부분, 방향, 각도, 동작명령들에 대해 각기 우향 HMM, 이외의 비 핵심어들에 대해서는 이들을 한데 모아 ergodic형 상태천이를 모델링하는 garbage HMM을 형성했는데, 조사, 감탄사 등을 따로 모은 garbage 모델과, silence 및 배경 잡음에 대한 garbage 모델을 형성, 학습 및 인식에 포함시켜 연결단어 인식을 수행함으로써 핵심단어 인식의 효과를 얻었다. 이때 핵심단어들의 사용에 있어 간단한 문법적 제약을 가정하였다. 남성화자 35명을 대상으로 30개 문형에 대해 데이터 수집용 개념적 문장을 구성하여 음성 데이터를 수집하였다. 학습 화자에 대한 제어 명령 인식률은 95% 이상을 나타내고 있으며, 비 학습화자에 대한 인식율은 90% 이상이다. 또한 학습된 단어외의 비 핵심단어들의 사용에 대해서도 긍정적인 인식 성능을 보였다.

  • PDF

대학 핵심역량 관련 연구들의 주요 키워드와 네트워크 분석 (Keyword and Network Analysis of University Core Competency Studies)

  • 권충훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.133-134
    • /
    • 2021
  • 본 연구는 최근 고등학교기관(대학)의 평가에서 가장 중심 단어가 되고 있는 있는 '핵심역량' 관련 최근 연구들의 주요 키워드들과 그들간의 네트워크를 분석하고자 한다. 본 연구에서는 2011년부터 2020년까지(최근 10년간)의 '대학 핵심역량' 관련 등재지(등재 후보지 포함)에 발표된 총 176건의 관련 연구물들을 언어 네트워크 분석 방법론을 활용하여, 주요 키워드 추출 및 워드클라우드 제시, 주요 핵심어들 간의 관계성(의미망 네트워크) 분석 등을 진행하고자 한다. 이와 같은 연구 결과는 관련 학자들이 연구를 진행할 때, 대학 관계자가 학교단위 교육활동 계획 기획 및 평가활동을 할 때 매우 중요한 기초 자료로 활용될 것으로 기대된다.

  • PDF