• 제목/요약/키워드: R language

검색결과 499건 처리시간 0.028초

국가R&D과제정보 요약을 위한 한국어 정보요약 시스템 (Korean Information Summary System for National R&D Projcet Information Summary)

  • 이종원;김태현;신동구;조우승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.72-74
    • /
    • 2022
  • 국가과학기술지식정보서비스(이하 NTIS)에서는 국가R&D과제정보를 제공하고 있다. 과제정보는 '과제명', '과제수행기관', '연구책임자명' 등의 메타정보와 '연구목표', '연구내용', '기대효과'와 같은 과제를 설명하는 텍스트들로 구성되어있다. 과제정보 100만건을 대상으로 검색한 결과목록에서 '연구목표' 나 '연구내용' 등을 모두 확인하여 원하는 과제정보를 찾기 위해서는 많은 시간이 필요하다는 문제가 있다. 이러한 문제점을 해소하기 위해, 본 논문에서는 국가R&D 과제정보 내에서 장문의 텍스트로 구성된 부분을 요약하는 과제정보 요약 시스템을 제안하고자 한다. 한국어의 언어학적 특징을 분석하여 전처리기를 구축하고 전처리된 텍스트 정보를 처리하기 위한 자연어 처리 기술 기반 과제정보 요약 모델을 개발하였다. 이를 통해 장문으로 구성된 과제정보를 압축 및 요약된 형태로 제공하여, 이용자들이 요약정보만으로도 전반적인 내용을 쉽고 빠르게 유추하는 데 도움이 될 것이다.

  • PDF

위키피디아로부터의 자동 병렬 문장 추출 기법을 이용한 영어-한국어 교차언어 정보검색의 번역 성능 개선 (Improving Query Translation by Extracting Parallel Sentences from Wikipedia for Cross-Language Information Retrieval)

  • 천주룡;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.35-40
    • /
    • 2015
  • 본 논문은 영어-한국어 교차언어 정보검색의 질의어 번역에 대한 중요한 자원으로 활용되는 병렬 말뭉치의 품질 향상을 위해서, 위키피디아의 비교 말뭉치로부터 자동으로 병렬 문장을 추출하여 활용하는 기법을 제안한다. 기존 연구에서 질의어 번역을 위해 위키피디아의 이중 어휘 사전 및 동의어, 다의어 정보를 구축하고, 기 기축된 병렬 말뭉치와 함께 활용하여 여러 의미를 가진 번역 후보 단어들 중, 최적의 단어를 선택하는 방법을 이용하고 있다. 여기서 활용되는 병렬 말뭉치는 질의어 번역에서 가장 중요한 자원이다. 하지만, 기 구축된 병렬 말뭉치는 양이 적거나, 특정 영역을 중심으로 구성되어 있는 문제가 있다. 이러한 문제를 해결하기 위해, 본 논문은 위키피디아로부터 자동 병렬 문장 추출 기법을 이용, 대량의 영어-한국어 간 병렬 말뭉치를 구축하고, 이를 교차언어 정보검색을 위한 질의어 번역에 적용하여 개선을 보인다. 실험의 성능 비교를 위해서 NTCIR-5 데이터를 이용하였으며 기 구축된 세종 병렬 말뭉치를 활용한 질의어 번역의 성능이 MAP 31.5%, R-P 33.0%에서, 새롭게 구축한 위키피디아 병렬 말뭉치를 활용한 질의어 번역의 성능이 MAP 34.6%, R-P 34.6%로, 각각 MAP 3.1%와 R-P 1.6%의 성능 향상을 보였다.

  • PDF

보드 게임을 활용한 반 구조화된 DIRFloortime® 치료가 고기능 자폐스펙트럼 장애 아동의 언어 이해 및 정보처리 지표 기능향상에 미치는 효과 (Effects of Semi-structured DIRFloortime® Therapy Using Board Games on Verbal Comprehension and Processing Speed Index in Children With High Functioning Autism Spectrum Disorders)

  • 정희승
    • 한국신경인지재활치료학회지
    • /
    • 제10권2호
    • /
    • pp.35-44
    • /
    • 2018
  • 목적: 본 연구는 반 구조화된 $DIRFloortime^{(R)}$ 치료가 고기능 자폐스펙트럼장애 아동의 언어이해 지표 및 정보처리 지표 기능향상에 미치는 효과를 알아보고자 하였다. 방법: 연구대상자의 일반적인 특성인 자폐정도, 전체지능, 언어이해지표 와 정보처리 지표를 측정하였다. 중재 방법으로 사용한 것은 전문가 내용타당도를 확보한 후, 수정 보완하여 보드게임을 활용한 반 구조화된 $DIRFloortime^{(R)}$ 치료 중재 프로그램을 사용하였다. 유사 실험 설계로 한 집단 사전 사후 검사 실험 설계를 하였으며 유의수준 .05에서 t 검증을 통해서 사전 및 사후 검사를 하였다. 결과: 프로그램 실시 후, 언어이해 지표는 사후검사 시, 통계적으로 유의한 수준 (p<.001) 유의미한 차이가 잇는 것으로 나타났으며, 정보처리 지표에서도 통계적으로 유의미한 효과가 있는 것으로 나타났다(p<.001). 결론: 보드게임을 활용한 반 구조화된 $DIRFloortime^{(R)}$ 치료 고기능 자폐스펙트럼 장애 아동들의 언어이해 및 정보처리 지표 기능 향상에 효과가 있었다.

국가연구개발사업 평가에서 사회연결망 분석 활용 방안

  • 기지훈
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2017년도 추계학술대회 논문집
    • /
    • pp.129-129
    • /
    • 2017
  • In planning and evaluating government R&D programs, one of the first steps is to understand the government's current R&D investment portfolio - which fields or topics the government is now investing in in R&D. Analysis methods of an investment portfolio of government R&D tend traditionally to rely on keyword searches or ad-hoc two-dimensional classifications. The main drawback of these approaches is their limited ability to account for the characteristics of the whole government investment in R&D and the role of individual R&D program in it, which tends to depend on the relationship with other programs. This paper suggests a new method for mapping and analyzing government investment in R&D using a combination of methods from natural language processing (NLP) and network analysis. The NLP enables us to build a network of government R&D programs whose links are defined as similarity in R&D topics. Then methods from network analysis show the characteristics of government investment in R&D, including major investment fields, unexplored topics, and key R&D programs which play a role like a hub or a bridge in the network of R&D programs, which are difficult to be identified by conventional methods. These insights can be utilized in planning a new R&D program, in reviewing its proposal, or in evaluating the performance of R&D programs. The utilized (filtered) Korean text corpus consists of hundreds of R&D program descriptions in the budget requests for fiscal year 2017 submitted by government departments to the Korean Ministry of Strategy and Finance.

  • PDF

"미리내" 정보검색 시스템에서 Relevance Feedback 구현 (Implement of Relevance Feedback in "MIRINE" Information Retrieval System)

  • 박수현;박세진;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.65-71
    • /
    • 1997
  • 이 논문은 부산대학교 전자계산학과 인공지능 연구실에서 개발한 정보검색 시스템 "미리내"의 적합성 피드백 방법을 분석하고, 그 방법들의 검색 효율을 비교 분석하였다. "미리내"에서 질의문은 자연언어 질의문을 사용하고 재검색을 위한 적합성 피드백은 원질의문에서 검색된 문서 중 이용자가 직접 선택한 적합 문서에서 추출한다. 적합성 피드백은 크게 단어 확장(Term Expansion)을 위한 단어 선택 방법과 추가될 단어에 가중치를 부여하는 단어 가중치 부여(Term Weighting)의 2가지 요소로 이루어진다. 단어 선택을 위해서는 적합 문서에 나타난 단어 빈도합(tf), 역문헌빈도(idf), 적합 문서 중에서 해당 단어가 있는 적합 문서의 비율(r/R) 등의 정보를 이용한다. 단어 가중치 부여 방법으로는 정규화 또는 코사인 함수를 이용하여 부여하였다. 단어확장에는 tfidf가 tfidf(r/R)보다 정확도 면에서 나은 향상율을 보였으나, 30위 내 검색된 적합문서의 수를 비교해 보았을 때 tfidf(r/R)의 정확도가 높았다. 단어 선택 방법에서 계산된 값을 정규화하여 가중치를 부여하였을 때 보다 코사인 함수를 이용하여 가중치를 부여하였을 때 정확도가 높았다. 실험은 KT-Set 2.0 (4391 건), 동아일보 96 년 신문기사(70459 건)를 대상으로 수행하였다.

  • PDF

A Methodology of Optimal Design for Solar Heating and Cooling System Using Simulation Tool

  • Lee, Dongkyu;Nam, Hyunmin;Lee, Byoungdoo
    • 국제학술발표논문집
    • /
    • The 6th International Conference on Construction Engineering and Project Management
    • /
    • pp.540-543
    • /
    • 2015
  • Solar energy is one of the most important alternative energy sources which have been shown to meet high levels of heating and cooling demands in buildings. However, the efficiencies to satisfy these demands using solar energy significantly vary based on the characteristics of individual building. Therefore, this paper is focused on developing the methodology which can help to design optimal solar system for heating and cooling to be in cooperated within the existing buildings according to their load profiles. This research has established the Solar Heating and Cooling (SHC) system which is composed of collectors, absorption chiller, boiler and heat storage tank. Each component of SHC system is analyzed and made by means of Modelica Language and Pistache tool is verified the results. Sequential approximate optimization (SAO) and meta-models determined to 15 design parameters to optimize SHC system. Finally, total coefficient of performance (COP) of the entire SHC system is improved approximately 7.3% points compared to total COP of the base model of the SHC system.

  • PDF

Intermediate Language Translator for Execution of Java Programs in .NET Platform

  • Lee, Yang-Sun;Na, Seung-Won;Hwang, Dae-Hoon
    • 한국멀티미디어학회논문지
    • /
    • 제7권6호
    • /
    • pp.824-831
    • /
    • 2004
  • This paper presents the java bytecode-to-.NET MSIL intermediate language translator which enables the execution of the java program in .NET environments without JVM(java Virtual Machine), translating bytecodes produced by compiling java programs into MSIL codes. Java, one of the most widely used programming languages recently, is the language invented by James Gosling at Sun Microsystems, which is the next generation language independent of operating systems and hardware platforms. Java source code is compiled into bytecode as intermediate code independent of each platform by compiler, and also executed by JVM. .NET language such as C# and .NET platform in Microsoft Corp. has been developed to meet the needs of programmers, and cope with Java and JVM platform of Sun Microsystems. After compiling, a program written in .NET language is converted to MSIL code, and also executed by .NET platform but not in JVM platform. For this reason, we designed and implemented the java bytecode-to-.NET MSIL translator system for programs written in java language to be executed in the. NET platform without JVM. This work improves the execution speed of programs, enhances the productivity, and provides a environment for programmers to develop application programs without limitations of programming languages.

  • PDF

학습자 상황인지 기반 외국어 학습 모바일 어플리케이션 시스템 설계 및 구현 (A Design and Implementation of Mobile Application System for Learner Context-Aware based Foreign Languages Learning)

  • 송애린;이신은;임선영;박영호
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권4호
    • /
    • pp.671-679
    • /
    • 2017
  • 영어 교육 전문가 R. Ellis를 비롯한 다수의 외국어학습연구자의 연구에 따르면, 외국어를 학습자의 실제상황에서 반복적으로 학습함으로써 영어의 실제성을 높이는 학습 방법이 효과적이며 중요한 방법이다. 본 논문에서는 상황인식 서비스가 접목된 외국어 학습 서비스를 제안함으로써 영어 학습의 실제성을 높이는 외국어 학습 콘텐츠의 개발을 모색한다. 이와 같은 접근은 실제 환경에서 무의식인 외국어 습득을 돕는 디지털 교육 콘텐츠에 대한 연구와 실시간 다중 센서 데이터를 기반으로 학습자의 경험적 특성을 분석하는 연구에 기반 한다.

Input- Truncatum Faithfulness in English Hypocoristic Names

  • Hwangbo, Young-Shik
    • 한국영어학회지:영어학
    • /
    • 제2권2호
    • /
    • pp.287-304
    • /
    • 2002
  • Truncated forms (truncata) in English hypocoristic words have been argued to be faithful to their bases. This means that “ ... the base of truncation is an output form"”(Benua 1995:6,12). For example, in some non-rhotic dialects where syllable-final [r]s are deleted, the [r]s of truncated names such as Gar [gær] (truncated form of Garry [gæri]) are not deleted although they are syllable-final. This is an example of base-truncatum identity. That is, the syllable-final [r] is retained to make the truncatum more faithful to its base. However, there are many English hypocoristic names which are not faithful to their base forms. For example, Letty [equation omitted] (hypocoristic form of Latitia [equation omitted]) is not faithful to its base; the first vowel and the second consonant of the truncatum are not identical to the corresponding segments of the base. It will be argued, therefore, that some truncated forms are more faithful to the inputs than the bases. It will also be argued that McCarthy and Prince's (1995) Full Model is needed to deal successfully with all the phenomena related to truncation.

  • PDF

An American Indigenous perspective in what we label the study of language in culture: Is it 'Anthropology' or 'Linguistics' and does it matter\ulcorner

  • Tamburro, Paul R.
    • 인문언어
    • /
    • 제6권
    • /
    • pp.109-145
    • /
    • 2004
  • Social scientists in North America, especially anthropologists, folklorists and linguists, who focus on the study language use and its connection to society, use a variety of labels to describe what they do. Among the best known are 'anthropological linguistics' , 'linguistic anthropology', and 'sociolinguistics'. All of these labels imply that their focus is on the study of language usage in society and culture for their teaching, research and publications. In this paper I am examining the intellectual issues and history that underlie the differences in the labels. The differences and similarities that characterize them are discussed. The author proposes 'linguistic anthropology' as the most useful disciplinary terminology if the study of language combined with culture is to be 'community-centric' and not only 'profession-centric' . He encourages a renewed focus on working with communities. Also, a need to find ways to engage Indigenous members of minority language communities more actively should be a primary goal in the process of 'academic' language work. This is important due to the loss rapid extinction of the many of the world's languages. The author points out that it does matter what we call the work we do, as a label may carry a message of meaning, intent and focus.

  • PDF