• 제목/요약/키워드: Information processing knowledge

검색결과 1,093건 처리시간 0.026초

정확도 높은 검색 엔진을 위한 문서 수집 방법 (A Document Collection Method for More Accurate Search Engine)

  • 하은용;권희용;황호영
    • 정보처리학회논문지A
    • /
    • 제10A권5호
    • /
    • pp.469-478
    • /
    • 2003
  • 인터넷상의 정보 검색 엔진들은 웹 로봇을 이용해서 인터넷에 연결되어 있는 수 많은 웹 서버들을 주기적 또는 비주기적으로 방무나여 자체적인 인텍싱 방법에 따라 자료를 추출하고 분류해서 검색 엔진의 기초가 되는 데이터 베이스를 구축하고 변겨아는 작업을 계속하고 있다. 이런 일련의 작업은 인터넷 상에 분산되어 있는 막대한 정보를 쉽고 정확하게 찾을 수 있는 게이트 사이트로서의 역할을 담당하기 위한 전략적인 목적으로 진행되고 있다. 수천만 이상의 웹 사이트들을 상대로 하는 정보 수집은 검색 엔진 사이트 중심으로 기존 데이터의 수정과 삭제 등과 같은 데이터 베이스 유지 관리와 신규 사이트들에 대한 자료 수집 작업이 이루어지고 있다. 이러한 작업은 웹 서버에 대한 사전 지식 없이 정보 추출을 위해 웹 로봇을 실행하므로 인터넷 상에 수많은 요구가 전송되고 이는 인터넷 트래픽을 증가 시키는 원인이 되고 있다. 따라서 웹 서버가 사전에 자신이 공개할 문서에 대한 변경 정보를 웹 로봇에게 통보하고 웹 로봇은 이 정보를 이용해서 웹 서버의 해당 문서에 대한 정보 수집 작업을 한다면 불필요한 인터넷 트래픽을 감소시킬 수 있을 뿐만 아니라 검색 엔진의 정보의 신뢰도도 높아지고 웹 서버의 해당 문서에 대한 정보수집 작업을 한다면 불필요한 인터넷 트래픽을 감소 시킬 수 있을 뿐만 아니라 검색 엔진의 정보의 신뢰도도 높아지고 웹 서버의 시스템 부하와 검색 엔진의 시스템 부하를 줄일 수 있는 효과를 가질 수 있을 것이다. 본 논문에서는 웹 서버상의 웹 문서 파일의 변동 사항을 자동으로 검사하고 변동 사항들을 종합 정리해서 변경 문서에 대한 정보를 통보 받기 원하는 등록된 각 웹 로봇에게 전송하는 검사 통보 시스템을 설계 구현하였다. 웹 로봇을 운영하는 검색 엔진에서는 통보된 요약 정보를 이용해서 웹 서버로부터 해당 문서를 전송 받아 필요로 하는 인덱스 정보를 추출해서 데이터베이스를 구축하는 효율적인 웹 로봇을 설계 구현하였다.

머신러닝 플랫폼을 활용한 소프트웨어 교수-학습 모형 개발 (The Development of Software Teaching-Learning Model based on Machine Learning Platform)

  • 박대륜;안중민;장준혁;유원진;김우열;배영권;유인환
    • 정보교육학회논문지
    • /
    • 제24권1호
    • /
    • pp.49-57
    • /
    • 2020
  • 현대사회는 21세기 초반 지식정보사회를 지나 지능정보사회로 바뀌어 가고 있다. 본 연구에서는 지능정보사회에서 요구되는 학습자의 핵심역량을 신장시키기 위하여 인공지능의 한 분야인 머신러닝을 기반으로 소프트웨어 교육 교수-학습 모형을 개발하였다. 본 모형은 인공지능 자체에 대한 학습의 부담감을 줄이고, 머신러닝을 활용하여 문제를 해결하는 과정에서 핵심역량을 신장시키는 것에 중점을 두었다. 개발된 모형의 구체적인 단계는 문제인식 및 분석, 데이터 수집, 데이터 가공 및 선별, ML모델 훈련 및 평가, ML프로그래밍, 적용 및 해결, 공유 및 환류의 7단계로 구성되어 있다. 본 연구에서 개발한 모형을 학생과 학부모를 대상으로 적용한 결과 긍정적인 반응을 얻을 수 있었으며, 이를 통해 머신러닝 기반의 소프트웨어 교육 프로그램의 개발 및 운영에 작은 밑거름을 제시할 수 있을 것으로 기대한다.

디지털 인문학 연구 동향 분석 - Digital Humanities 학술대회 논문을 중심으로 - (An Investigation on Digital Humanities Research Trend by Analyzing the Papers of Digital Humanities Conferences)

  • 정은경
    • 한국문헌정보학회지
    • /
    • 제55권1호
    • /
    • pp.393-413
    • /
    • 2021
  • 디지털 정보기술과 인문학적 연구 문제의 결합을 통해 새롭고 혁신적인 지식을 창출하는 디지털인문학은 대표적인 다학제적 융합 학문 분야라고 볼 수 있다. 이러한 디지털인문학 분야의 지적구조를 규명하기 Digital Humanities 학술대회 최근 2년간(2019, 2020)의 논문 441건을 대상으로 저자사항과 키워드 동시출현 네트워크 분석을 수행하였다. 저자와 키워드 분석 결과를 살펴보면, 유럽, 북미 지역, 동아시권의 일본 중국의 저자의 활발한 활동을 찾아볼 수 있다. 공저자 네트워크를 통해서는 11개의 분절된 네트워크를 확인할 수 있으며, 이는 폐쇄적인 공저활동의 결과로 볼 수 있다. 키워드 분석을 통해서는 16개의 세부 주제 영역을 규명할 수 있으며, 이는 기계학습, 교육학, 메타데이터, 토픽모델링, 문체, 문화유산, 네트워크, 디지털아카이브, 자연언어처리, 디지털도서관, 트위터, 드라마, 빅데이터, 신경망 네트워크, 가상현실, 윤리으로 구성된다. 이러한 군집 구성은 디지털 정보기술이 주된 세부 주제 영역으로 자리매김하고 있음을 알 수 있다. 또한 출현빈도가 높은 키워드들은 인문학 기반 키워드, 디지털 정보기술 기반 키워드, 융합 키워드으로 구분될 수 있으며, 디지털인문학의 성장과 발전 과정의 역동성을 찾아볼 수 있다.

KOMPSAT-3 위성영상 기반 양식시설물 자동 검출 프로토타입 시스템 개발 (Development of a Prototype System for Aquaculture Facility Auto Detection Using KOMPSAT-3 Satellite Imagery)

  • 김도령;김형훈;김우현;류동하;강수명;정윤재
    • 한국지리정보학회지
    • /
    • 제19권4호
    • /
    • pp.63-75
    • /
    • 2016
  • 우리나라에서는 삼면이 바다와 접해있는 반도형태의 국가로 과거부터 해양수산물에 대한 양식이 이루어져 왔다. 최근에는 양식시설물들을 체계적으로 관리하기 위해 생산량에 대한 조사하고 있으며, 조사된 자료를 기반으로 생산물에 대한 가격책정을 수행하여 내수 어족자원을 안정화하고 어민생활권을 보장하고 있다. 이러한 양식시설물의 조사는 매년 항공사진 기반의 수동 디지타이징을 기반으로 하고 있다. 고해상도의 항공사진을 활용한 수동 디지타이징은 양식시설물 별 종류에 따른 특징과 시설물 운용 여부 등을 알고 있는 전문가의 지식을 기반으로 하여 정확한 구획이 수행된다. 그러나 항공사진의 활용은 생육주기가 다른 양식자원들을 모니터링하기에는 경제적, 시간적 한계가 있으며, 전문가의 지식기반 구획 역시 다수의 전문 인력 등이 투입되어야 한다. 그러므로 본 연구에서는 관측 대상지에 대한 대단위 모니터링이 가능한 위성영상을 바탕으로 양식장에 대한 외곽정보 자동으로 검출하는 프로토타입 시스템 개발에 대해 연구하였다. 연구에 사용되는 위성영상은 국내 고해상 위성인 KOMPSAT-3 위성영상 13 Scene을 양식시설이 주로 이용되는 10월에서 4월 사이에 신규 촬영하여 사용하였다. 양식시설의 검출은 가두리식, 연승식, 부류식 양식시설을 검출하였으며 검출 방법은 영상 처리를 통한 ANN 분류기법 및 Polygon 생성기법을 사용하였다. 개발된 프로토타입 시스템의 양식시설 검출율은 약 93% 정도로 나타났다. 위성영상 기반의 양식시설물 외곽정보 검출은 기존 항공사진이 가지는 모니터링의 한계를 개선할 수 있을 뿐만 아니라, 전문가가 양식시설을 탐지하고 판독하는 데 있어 유용하게 지원될 수 있을 것이다. 향후 양식장 시설물별 분류 및 영상 처리 기법의 적용을 통해 양식장 시설물 검출 시스템이 개발되어야 할 것이며, 해당 시스템을 통해 양식시설물 모니터링을 수행하여 관련 의사결정 지원에 도움이 될 수 있을 것으로 판단된다.

광합성 실험에서 나타난 초등 예비교사들의 반성적 사고와 실험 수행 능력 분석 (The Analysis of Elementary Pre-service Teachers' Reflective Thinking and Experiment Performance Ability on Photosynthesis Experiment)

  • 김동렬
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제34권4호
    • /
    • pp.502-518
    • /
    • 2015
  • 본 연구는 초등학교 과학교과서에 수록된 광합성 실험을 초등 예비교사들이 직접 수행하고 그 실험결과와 자신의 반성을 담은 탐구과정상의 어려움과 해결책을 탐구보고서에 작성하도록 하였다. 10개조의 탐구보고서와 발표자료를 바탕으로 초등 예비교사들의 반성적 사고와 실험 수행 능력을 분석하였다. 반성적 사고에 대해서는 10편의 탐구보고서에서 '지식', '과정', '지향', '태도' 4가지 유형과 관련된 총 108개의 진술 문장을 추출하였다. 분석 결과 광합성 실험을 통해 획득한 '지식'에 대한 반성적인 사고에 대한 내용이 가장 많았다. 지식유형에서도 실험을 통해 새롭게 알게 된 것이나 기존의 개념이해가 변화한 내용에 대한 반성이 가장 높은 빈도를 보였다. 실험 수행 능력은 10개조 중 반성적 사고 4가지 유형을 합산하여 가장 높은 빈도를 보인 한 개 조와 가장 낮은 빈도를 보인 한 개 조의 탐구보고서를 '실험준비 및 안전사고 예방', '실험 수행', '실험결과 정리 및 일반화', '실험결과 보완 및 피드백' 4단계에 따라 분석하여 56개의 문장을 추출하였다. 분석 결과 '실험결과 보완 및 피드백' 단계에서 두 조 간에 가장 큰 차이를 보였다. 최하위 조의 경우 '실험결과 정리 및 일반화' 단계의 '컴퓨터를 이용한 정보 처리', '대체 시약 및 재료 탐색', '대체 실험법 고안' 능력과 관련된 내용은 탐구보고서에서 찾을 수가 없었다.

청음 음성학적 지식에 기반한 음가분류에 의한 핵심어 검출 시스템 구현 (The Design of Keyword Spotting System based on Auditory Phonetical Knowledge-Based Phonetic Value Classification)

  • 김학진;김순협
    • 정보처리학회논문지B
    • /
    • 제10B권2호
    • /
    • pp.169-178
    • /
    • 2003
  • This study outlines two viewpoints the classification of phone likely unit (PLU) which is the foundation of korean large vocabulary speech recognition, and the effectiveness of Chiljongseong (7 Final Consonants) and Paljogseong (8 Final Consonants) of the korean language. The phone likely classifies the phoneme phonetically according to the location of and method of articulation, and about 50 phone-likely units are utilized in korean speech recognition. In this study auditory phonetical knowledge was applied to the classification of phone likely unit to present 45 phone likely unit. The vowels 'ㅔ, ㅐ'were classified as phone-likely of (ee) ; 'ㅒ, ㅖ' as [ye] ; and 'ㅚ, ㅙ, ㅞ' as [we]. Secondly, the Chiljongseong System of the draft for unified spelling system which is currently in use and the Paljongseonggajokyong of Korean script haerye were illustrated. The question on whether the phonetic value on 'ㄷ' and 'ㅅ' among the phonemes used in the final consonant of the korean fan guage is the same has been argued in the academic world for a long time. In this study, the transition stages of Korean consonants were investigated, and Ciljonseeng and Paljongseonggajokyong were utilized in speech recognition, and its effectiveness was verified. The experiment was divided into isolated word recognition and speech recognition, and in order to conduct the experiment PBW452 was used to test the isolated word recognition. The experiment was conducted on about 50 men and women - divided into 5 groups - and they vocalized 50 words each. As for the continuous speech recognition experiment to be utilized in the materialized stock exchange system, the sentence corpus of 71 stock exchange sentences and speech corpus vocalizing the sentences were collected and used 5 men and women each vocalized a sentence twice. As the result of the experiment, when the Paljongseonggajokyong was used as the consonant, the recognition performance elevated by an average of about 1.45% : and when phone likely unit with Paljongseonggajokyong and auditory phonetic applied simultaneously, was applied, the rate of recognition increased by an average of 1.5% to 2.02%. In the continuous speech recognition experiment, the recognition performance elevated by an average of about 1% to 2% than when the existing 49 or 56 phone likely units were utilized.

러프 하한 근사를 갖는 로컬 커버링 기반 규칙 획득 기법을 이용한 섬망 환자의 분류 방법 (A Classification Method of Delirium Patients Using Local Covering-Based Rule Acquisition Approach with Rough Lower Approximation)

  • 손창식;강원석;이종하;문경자
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권4호
    • /
    • pp.137-144
    • /
    • 2020
  • 섬망은 의식 장애, 주의력 장애 및 언어력 장애와 같은 일시적인 인지 장애가 있는 환자, 특히 노인에서 나타나는 가장 흔한 정신 장애 중 하나이다. 섬망은 환자와 가족에게 고통을 주고, 통증과 같은 증상의 관리를 방해할 수 있으며 노인 사망률 증가와 관련이 있다. 본 논문의 목적은 장기 요양 시설에서 섬망 환자를 구별하는데 사용될 수 있는 유용한 임상적 지식을 생성하는데 있다. 이러한 목적을 위해, 러프 하한 근사 영역을 갖는 로컬 커버링 규칙 기법을 활용하여 섬망과 관련된 임상적 분류 지식을 추출하였다. 제안된 방법의 임상적 적용 가능성은 전향적 코호트 연구로부터 수집된 데이터를 활용하여 확인하였다. 연구 결과, 섬망 기간이 12일 이상 지속될 수 있는 6가지 유용한 임상적 증거를 발견하였고, 체질량 지수, 동반질환 지수, 입원경로, 영양결핍, 감염, 수면박탈, 욕창, 기저귀 사용과 같은 8가지 인자들이 섬망 결과를 구별하는 데 중요한 요인이라는 것을 확인하였다. 제안된 방법의 분류 성능은 통계적 5-겹 교차검정 방법을 사용하여 3가지 벤치마킹 모델, 즉 ANN, RBF 커널 함수를 활용한 SVM, 랜덤 포레스트와 비교하여 검증하였다. 제안된 방법은 3가지 모델 중 가장 높은 성능을 제공한 SVM 모델과 비교했을 때 정확도와 AUC 기준에서 평균 0.6%와 2.7% 개선된 성능을 보였다.

발생 간격 기반 가중치 부여 기법을 활용한 데이터 스트림에서 가중치 순차패턴 탐색 (Finding Weighted Sequential Patterns over Data Streams via a Gap-based Weighting Approach)

  • 장중혁
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.55-75
    • /
    • 2010
  • 일반적인 순차패턴 마이닝에서는 분석 대상 데이터 집합에 포함되는 구성요소의 발생 순서만을 고려하며, 따라서 단순 순차패턴은 쉽게 찾을 수 있는 반면 실제 응용 분야에서 널리 활용될 수 있는 관심도가 큰 순차패턴을 탐색하는데 한계가 있다. 이러한 단점을 보완하기 위한 대표적인 연구 주제들 중의 하나가 가중치 순차패턴 탐색이다. 가중치 순차패턴 탐색에서는 관심도가 큰 순차패턴을 얻기 위해서 구성요소의 단순 발생 순서 뿐만 아니라 구성요소의 가중치를 추가로 고려한다. 본 논문에서는 발생 간격에 기반 한 순차패턴 가중치 부여 기법 및 이를 활용한 순차 데이터 스트림에 대한 가중치 순차패턴 탐색 방법을 제안한다. 발생 간격 기반 가중치는 사전에 정의된 별도의 가중치 정보를 필요로 하지 않으며 순차정보를 구성하는 구성요소들의 발생 간격으로부터 구해진다. 즉, 순차패턴의 가중치를 구하는데 있어서 구성요소의 발생순서와 더불어 이들의 발생 간격을 고려하며, 따라서 보다 관심도가 크고 유용한 순차패턴을 얻는데 도움이 된다. 한편, 근래 대부분의 컴퓨터 응용 분야에서는 한정적인 데이터 집합 형태가 아닌 데이터 스트림 형태로 정보를 발생시키고 있다. 이와 같은 데이터 생성 환경의 변화를 고려하여 본 논문에서는 순차 데이터 스트림을 마이닝 대상으로 고려하였다.

기록관리학의 발전을 위한 교육과정연구 -준하태(駿河台)(스루가다이)대학(大學)의 경우를 중심(中心)으로- (A Study on the Curriculum for Record Management Science Education - with focus on the Faculty of Cultural Information Resources, Surugadai University; Evolving Program, New Connections)

  • 김용원
    • 한국기록관리학회지
    • /
    • 제1권1호
    • /
    • pp.69-94
    • /
    • 2001
  • 본 논문의 목적은 일본에서의 기록관리학 교육의 현황을 개관하고, 몇 가지 중요한 이슈와 문제점을 언급하면서 이 분야의 급속한 성장의 영향을 살펴보는 것이다. 기록관리학 교육의 목적은 정보서비스의 질을 향상시키고 정보전문가의 적절한 공급을 보장하는 것이다. 기록관리학프로그램은 학생들에게 전문직업 교육을 하는 것이므로 교육과정에는 교육과 실무 훈련이 모두 포함되어야 한다. 이점은 흔히 이론과 실제의 대비로 표현된다. 학습이 이루어지는 환경의 사회적, 경제적 및 기술적 현실의 합류점이 양자에게 모두 영향을 준다. 본 논문은 일본에서의 기록관리학 교육의 역사적 배경과 현황을 검토한다. 또한 교육기관들의 다양한 형태의 교과과정과 교수진을 분석하되 일본 최초의 종합적인 대학 수준 프로그램인 스루가다이대학교의 학부프로그램에 초점을 둔다. 스루가다이대학교 문화정보학부는 정보학 분야를 통합한 새로운 학부로서 다양한 문화정보자원관리의 이론과 실제를 연구하기 위해 1994년도에 설립되었다. 그 목적은 archival science, records management, 박물관 학예직 및 사서직 분야에서 전문적 훈련을 제공함으로써 정보학 분야의 연구를 촉진하고 장려하는 것이다. 학부에는 두 개의 학과가 있고 각각에는 두 개의 코스가 있다; 문화정보학과. - 영상정보코스, - 관광정보코스 지식정보학과: 지식커뮤니케이션코스, 레코드 아카이브스코스 전체 교과과정의 구조는 역시 기본과목 교육부터 단계적으로 조직된다. 학생이 대학교에 입학하면 바로 수강하는 오리엔테이션과목들은 전문교육의 입문이 되며, 대학에서의 기본적인 학습 연구방법을 배운다. 1학년과 2학년 동안 학생들은 전문화를 위한 필수단계로서 기초과목과 기간과목들을 수강한다. 이를 위해 광범위한 주제의 과목들이 개설된다. 개설코스수는 약 150개에 이른다.3학년부터는 자신의 주전공이 해당하는 특정 코스를 시작하며 세미나와 실습을 통해 습득한 지식을 실제에 적용하게 된다. 각 학과에 속한 코스들은 2학년을 시작하는 학생들에게 개설된다. 그러나 두 학과 간에 넘을 수 없는 장벽은 없으며 졸업필요요건에 약간의 차이만 있을 뿐이다. 학생들은 자신이 속한 학과에 관계없이 3 4학년 세미나를 선택할 수 있다. 문헌정보학 학사학위를 받으려면 기초과목군(예: 문헌정보사회사, 문화인류학, 과학사, 행동과학, 커뮤니케이션 등)에서 34학점, 외국어에서 16학점(영어 10학점 포함), 정보처리에서 14학점(이론과 실습 포함), 그리고 자신의 전공코스에서 60학점을 취득해야 한다. 마지막으로 일본 기록관리학교육이 당면하고 있는 몇 가지 과제와 문제점을 아래와 같이 간단히 요약한다. - 관련 분야 및 유사 프로그램과의 결합 및 조화, - 교과과정 개선, - 교과서 부족, - 유능한 교수의 부족, - 졸업생의 취업문제 정보서비스가 점점 더 복합, 통합, 멀티미디어어화 되어감에 따라 정보전문직들은 다른 분야의 전문가들과 더욱 긴밀하게 협력할 필요가 있을 것이다. 아키비스트, 레코드메니저 및 박물관 큐레이터와 함께 일하는 것이 정보전문직으로서의 사서직의 생존에 필수적이 될 것이다. 더욱 정보화되는 사회에서 변화를 견뎌내려면 문화기관 내 모든 사람들의 강력한 연대가 요구된다. 미래의 동료들이 경쟁력을 갖게 하기 위해서는 정보전문직 간에 그리고 국경을 넘어서 파트너쉽을 구축하고 강화할 필요가 있을 것이다.

뉴로퍼지시스템에 의한 반류분포 추정에 관한 연구 (A Study on Prediction of Wake Distribution by Neuro-Fuzzy System)

  • 신성철
    • 한국지능시스템학회논문지
    • /
    • 제17권2호
    • /
    • pp.154-159
    • /
    • 2007
  • 프로펠러 회전면에서의 반류분포는 주로 모형시험에 의해서 규명되어 왔다. 이렇게 축적된 데이터베이스를 통해 선박의 기하학적 형상정보와 반류분포 사이의 입출력관계를 모델링할 수 있다면 선박 초기설계시 유사선종의 설계에 도움이 된다. 뉴로퍼지시스템은 예측, 분류, 진단 등의 매우 복잡한 문제를 해결하는 기법으로 다양한 공학분야에서 응용되고 있다. 본 연구에서는 이들 입출력 사이의 관계를 뉴로퍼지시스템으로 모델링하고 학습한 후 새로운 입력에 대한 출력값의 검토를 통해 그 유용성을 확인한다. 3차원 선미형상을 입력으로 하고 선체 모형시험으로 얻어진 프로펠러 회전면에서의 반류분포 값을 출력으로 사용하여 학습 및 추론을 해 보았다. 이를 통해 뉴로퍼지시스템을 초기 선박설계 단계에서 특히 선미형상을 결정할 때 유용한 것을 확인하였다.