• Title/Summary/Keyword: Learning Processing

검색결과 3,607건 처리시간 0.031초

디지털 인문학 연구 동향 분석 - Digital Humanities 학술대회 논문을 중심으로 - (An Investigation on Digital Humanities Research Trend by Analyzing the Papers of Digital Humanities Conferences)

  • 정은경
    • 한국문헌정보학회지
    • /
    • 제55권1호
    • /
    • pp.393-413
    • /
    • 2021
  • 디지털 정보기술과 인문학적 연구 문제의 결합을 통해 새롭고 혁신적인 지식을 창출하는 디지털인문학은 대표적인 다학제적 융합 학문 분야라고 볼 수 있다. 이러한 디지털인문학 분야의 지적구조를 규명하기 Digital Humanities 학술대회 최근 2년간(2019, 2020)의 논문 441건을 대상으로 저자사항과 키워드 동시출현 네트워크 분석을 수행하였다. 저자와 키워드 분석 결과를 살펴보면, 유럽, 북미 지역, 동아시권의 일본 중국의 저자의 활발한 활동을 찾아볼 수 있다. 공저자 네트워크를 통해서는 11개의 분절된 네트워크를 확인할 수 있으며, 이는 폐쇄적인 공저활동의 결과로 볼 수 있다. 키워드 분석을 통해서는 16개의 세부 주제 영역을 규명할 수 있으며, 이는 기계학습, 교육학, 메타데이터, 토픽모델링, 문체, 문화유산, 네트워크, 디지털아카이브, 자연언어처리, 디지털도서관, 트위터, 드라마, 빅데이터, 신경망 네트워크, 가상현실, 윤리으로 구성된다. 이러한 군집 구성은 디지털 정보기술이 주된 세부 주제 영역으로 자리매김하고 있음을 알 수 있다. 또한 출현빈도가 높은 키워드들은 인문학 기반 키워드, 디지털 정보기술 기반 키워드, 융합 키워드으로 구분될 수 있으며, 디지털인문학의 성장과 발전 과정의 역동성을 찾아볼 수 있다.

워드임베딩을 활용한 복압성 요실금 관련 연구 동향에 관한 융합 연구 (A Convergence Study of the Research Trends on Stress Urinary Incontinence using Word Embedding)

  • 김준희;안선희;곽경태;원영수;유화익
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.1-11
    • /
    • 2021
  • 본 연구의 목적은 '복압성 요실금'을 키워드로 검색된 연구들의 경향과 특성을 단어 빈도를 통해 분석하고, 워드 임베딩을 사용하여 그 관계를 모델링 하고자 하였다. 의학 서지 데이터베이스인 MEDLINE에 등록되어 있는 복압성 요실금 연구 9,868개 논문들의 초록 문자 데이터를 Python 프로그램을 이용하여 추출하였다. 그런 다음 빈도 분석을 통해 10개의 키워드를 선택하였다. 키워드 관련 단어들의 유사도는 Word2Vec 머신러닝 알고리즘으로 분석하였다. 그리고, t-SNE 기법을 사용하여 단어의 위치와 거리가 시각화하였고, 이에 따라 그룹을 분류하여 이를 분석하였다. 복압성 요실금과 관련된 연구는 1980년대 이후 빠르게 증가했다. 키워드 분석을 통해 논문 초록에서 가장 많이 사용된 키워드는 '여성', '요도', '수술'로 나타났다. Word2Vec 모델링을 통해 복압성 요실금 관련 연구에서 주요 키워드들과 가장 높은 연관성을 나타내는 단어들에는 '여성', '절박', '증상' 등이 있었다. 그리고, t-SNE 기법을 통해 키워드와 관련 단어들은 복압성 요실금의 증상, 신체 기관의 해부학적 특성, 그리고 수술적 중재를 중심으로 하는 3개의 그룹으로 분류될 수 있었다. 본 연구는 초록을 구성하는 단어들의 키워드 빈도 분석 및 워드임베딩 방식을 이용하여 복압성 요실금 관련 연구들의 동향을 살펴본 최초의 연구이다. 본 연구의 결과는 향후 연구자들이 복압성 요실금 관련 연구 분야의 주제와 방향성을 선택하는 데 있어 기초자료로 활용될 수 있을 것이다.

필기체 숫자 데이터 차원 감소를 위한 선분 특징 분석 알고리즘 (Line-Segment Feature Analysis Algorithm for Handwritten-Digits Data Reduction)

  • 김창민;이우범
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권4호
    • /
    • pp.125-132
    • /
    • 2021
  • 인공신경망의 계층의 깊이가 깊어지고 입력으로 사용되는 데이터 차원이 증가됨에 신경망의 학습 및 인식에 있어서 많은 연산을 고속으로 요구하는 고연산의 문제가 발생한다. 따라서 본 논문에서는 신경망 입력 데이터의 차원을 감소시키기 위한 데이터 차원 감소 방법을 제안한다. 제안하는 선분 특징 분석(Line-segment Feature Analysis; LFA) 알고리즘은 한 영상 내에 존재하는 객체의 선분(Line-segment) 특징을 분석하기 위하여 메디안 필터(median filter)를 사용한 기울기 기반의 윤곽선 검출 알고리즘을 적용한다. 추출된 윤곽 영상은 [0, 1, 2, 4, 8, 16, 32, 64, 128]의 계수 값으로 구성된 3×3 또는 5×5 크기의 검출 필터를 이용하여 8가지 선분의 종류에 상응하는 고유값을 계산한다. 각각의 검출필터로 계산된 고유값으로부터 동일한 반응값을 누적하여 두 개의 1차원의 256 크기의 데이터를 생성하고 두 가지 데이터 요소를 합산하여 LFA256 데이터를, 두 데이터를 합병하여 512 크기의 LAF512 데이터를 생성한다. 제안한 LFA 알고리즘의 성능평가는 필기체 숫자 인식을 위한 데이터 차원 감소를 목적으로 PCA 기법과 AlexNet 모델을 이용하여 비교 실험한 결과 LFA256과 LFA512가 각각 98.7%와 99%의 인식 성능을 보였다.

Information Technologies as an Incentive to Develop the Creative Potential of the Educational Process

  • Natalia, Vdovychenko;Volodymyr, Kukorenchuk;Alina, Ponomarenko;Mykola, Honcharenko;Eduard, Stranadko
    • International Journal of Computer Science & Network Security
    • /
    • 제22권4호
    • /
    • pp.408-416
    • /
    • 2022
  • The new millennium is characterized by an unprecedented breakthrough in knowledge and information and communication technologies, and the challenges of the XXI century require modernized paradigms of interaction in all spheres of life. Education continues to play a key role in national and global growth. The key role of education and its leadership in developing creative potential, as the main paradigm of the countries' stability, have significantly influenced educational centers. The developers of educational programs use information technologies as an incentive to develop creative potential of educational process. Professional training of the educational candidate is enhanced by the use of information technologies, so the educational applicants should develop technological skills to be productive members of society. Using the latest achievements in the field of information technologies for the organization of the educational process helps to form the operational style of education applicants' thinking, which provides the ability to acquire skills of processing information, that is presented in the text, graphic, tabular form, and increase the level of general and informational culture necessary for better orientation in the modern information space. The purpose of the research is to determine the effectiveness of information technologies as an incentive to develop creative potential of educational process on the basis of the survey, to establish advantages and ability to provide high-quality education in the context of using information technologies. Methods of research: comparative analysis; systematization; generalization, survey. Results. Based on the survey conducted among students and teachers, it has been found out that the teachers use the following information technologies for the development of creative potential of the educational process: to provide video and audio communication process (100%), Moodle (95,6%), Duolingo (89,7%), LinguaLeo (89%), Google Forms (88%) and Adobe Captivate Prime (80,6%). It is determined that modular digital learning environments (97,9%), interactive exercises tools (96,3%), ICT for video and audio communication (96%) and interactive exercises tools (95,1%) are most conducive to the development of creative potential of the educational process. As a result of the research, it was revealed that implementation of information technologies for the development of creative potential of educational process in educational institutions is a complex process due to a large number of variables, which should be taken into account both on the educational course and on the individual level. It has been determined that the using the model of implementation information technologies for the development of creative potential in educational process, which is stimulated due to this model, benefits both students and teachers by establishing a reliable bilateral connection between teacher and education applicant.

머신러닝 기반 시설재배 딸기 생산량 예측 연구 (A Study on the Prediction of Strawberry Production in Machine Learning Infrastructure)

  • 오한별;임종현;양승원;조용윤;신창선
    • 스마트미디어저널
    • /
    • 제11권5호
    • /
    • pp.9-16
    • /
    • 2022
  • 최근 농업 현장에서는 빅데이터와 IoT(Internet of Things) 등 기술을 적용하여 디지털농업 스마트팜으로 자동화를 하고 있다. 이러한 스마트팜은 작물의 환경을 측정하고 데이터를 조사하고 가공하여 생산량의 증대와 작물의 품질을 향상하고자 한다. 생산량 예측은 첨단 농업인 스마트팜 디지털 농업에서 중요한 연구로 빅데이터를 활용하여 환경데이터를 분석하고 나아가 생육정보 데이터 품질 관리를 위한 표준화 연구가 필요하다. 본 논문에서는 스마트팜 딸기 농장에서 수집된 환경 및 생산량 데이터를 분석하여 연구하였다. 회귀분석을 기반으로 릿지회귀(Ridge Regression), LightGBM, XGBoost를 사용하여 작물 생산량 예측 모델을 분석하였다. 3가지 모델 중 최적의 모델은 XGBoost로 R2는 82.5%의 설명력을 보였다. 연구 결과 양액흡수량과 환경데이터간의 상관관계를 확인할 수 있었고, 생산량 예측 연구에 대한 유의미한 결과를 얻을 수 있었다. 향후 작물의 생육환경 정보 및 양액의 성분 등 양액흡수량을 연구하여 양액관리를 통해 환경오염 예방 및 양액 절감에 기여할 것으로 기대된다.

타워크레인 자율화를 위한 가상환경 플랫폼 개발에 관한 연구 (A Study on Virtual Environment Platform for Autonomous Tower Crane)

  • 김명준;윤인석;김남균;박문서;안창범;정민혁
    • 한국건설관리학회논문집
    • /
    • 제23권4호
    • /
    • pp.3-14
    • /
    • 2022
  • 건설현장 생산성 및 안전성 향상을 위해 건설장비 자율화를 위해 산학에서 많은 노력을 기울이고 있다. 장비 자율화를 위해서는 다양한 환경과 많은 양의 데이터 수집이 필요하다. 하지만 실제 환경에서 데이터 수집을 위한 테스트베드 확보에 많은 시간과 비용이 소모되며 불확실성 역시 크기 때문에 효과적인 데이터 수집과 처리에 어려움이 존재한다. 이에 본 연구에서는 타워크레인을 대상으로 자율화기술 개발을 위한 데이터 수집 및 테스트가 가능한 가상환경을 개발하는 것을 목표로 한다. 본 연구에서 달성한 연구성과는 다음과 같다. 1. 타워크레인 자율운행에 필요한 기술과 기술이 적용될 수 있는 환경을 운영설계 도메인, 물체 및 이벤트 감지 및 반응, 최소기능조건이라는 세 가지 성능기준을 활용하여 정의함. 2. 정의된 환경 내에서 자율화 장비의 인지, 판단, 제어를 위한 각 기술을 학습하고 테스트하기 위한 가상 환경을 Unity를 활용하여 구축함. 3. 가상환경의 목적 달성 여부를 위한 평가지표로 Visual, Motion, Functional Fidelity를 사용해 가상환경이 현실 공사현장을 충실하게 표현하고 있음을 검증함. 본 연구에서 구축한 가상환경 플랫폼을 통해 등 타워크레인 자율화에 있어 요구되는 가상 데이터를 수집하고, 각 기능들을 테스트하는 데 소모되는 비용 및 시간을 절감할 수 있을 것이며, 또한 타워크레인 뿐 아니라 타 건설장비의 자율화기술 개발에 있어서도 기여할 수 있을 것으로 기대된다.

Design and Implementation of Memory-Centric Computing System for Big Data Analysis

  • Jung, Byung-Kwon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권7호
    • /
    • pp.1-7
    • /
    • 2022
  • 최근 대용량 데이터를 프로그램 자체에서 생성시키면서 구동되는 빅데이터 프로그램, 머신 러닝 프로그램 같은 응용 프로그램의 사용이 일상화됨에 따라 기존의 메인 메모리만으로는 메모리가 부족하여 프로그램의 빠른 실행이 어려운 경우가 발생하고 있다. 특히, 코로나 변이 바이러스 발생으로 염기서열 전체의 유전 변이 여부를 분석해야 하는 상황에는 더욱 빠르게 결과를 도출해야 하는 필요성이 대두되었다. 대용량 데이터를 병렬실행으로 빠른 결과를 필요로 하는 전장유전체(WGS; Whole Genome Sequencing) 분석 방법에 기존 SSD에서 대용량 데이터를 처리하는 것이 아닌 자체 개발한 메모리풀 MOCA host adapter가 장착된 컴퓨팅 시스템에 적용하여 성능을 측정한 결과 기존 SSD 시스템에 비해 16%의 성능 향상이 있었다. 그리고, 그 외의 다양한 벤치마크 시험에서도 워크플로우의 task별 SortSampleBam, ApplyBQSR, GatherBamFiles등 메모리풀 MOCA host adapter가 장착된 컴퓨팅 시스템에서도 SSD를 사용한 경우보다 IO 성능이 각각 92.8%, 80.6%, 32.8% 실행시간 단축을 보였다. 전장유전체파이프라인 분석같이 대용량 데이터 분석시 본 연구에서 개발한 메모리풀 MOCA host adapter가 장착된 컴퓨팅 시스템에서 분석할 경우 런타임(run time)시 발생하는 측정 지연을 줄일 수 있을 것으로 판단된다.

데이터 확장을 통한 토지피복분류 U-Net 모델의 성능 개선 (The Performance Improvement of U-Net Model for Landcover Semantic Segmentation through Data Augmentation)

  • 백원경;이명진;정형섭
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1663-1676
    • /
    • 2022
  • 최근 딥러닝을 활용한 토지피복분류 기법 연구가 다수 수행되고 있다. 그런데 양질의 토지피복 학습데이터를 충분하게 구축되지 못하여 성능이 저하되는 양상이 확인되었다. 이에 따라 본 연구에서는 데이터 확장 기법의 적용을 통한 토지피복분류 성능의 향상을 확인하였다. 분류 모델로는 U-Net이 활용되었으며 AI Hub에서 제공하는 토지피복 위성 이미지 자료를 연구자료로 활용하였다. 원본 데이터로 학습한 모델과 데이터 확장 기법이 적용된 데이터로 학습한 모델의 픽셀 정확도는 각각 0.905와 0.923이었으며 평균 F1 스코어는 각각 0.720과 0.775로 데이터 확장 기법을 적용하였을 때가 보다 우수한 성능을 나타내는 사실을 확인할 수 있었다. 또한 원본 학습데이터를 활용하여 학습한 모델의 경우 건물, 도로, 논, 밭, 산림, 비대상 지역 클래스에 대한 F1 스코어가 0.770, 0.568, 0.733, 0.455, 0.964 그리고 0.830이었으며, 데이터 확장을 적용하였을 때에 각 클래스에 대한 F1 스코어는 각각 0.838, 0.660, 0.791, 0.530, 0.969 그리고 0.860으로 모든 클래스에 대해 데이터 확장이 성능향상에 유효하다는 사실을 확인하였다. 또한, 클래스 균형에 대한 고려없이 데이터 확장을 적용했음에도 불구하고 데이터 불균형에 의한 클래스별 성능 왜곡을 완화할 수 있다는 사실을 확인할 수 있었다. 이는 절대적인 학습데이터의 양이 증가했기 때문이라 판단된다. 본 연구 결과는 다양한 영상 처리 분야에서 데이터 확장 기법의 중요성과 효과를 증명하는 기반 자료의 역할을 수행할 것으로 기대한다.

결합된 파라메트릭 활성함수를 이용한 완전연결신경망의 성능 향상 (Performance Improvement Method of Fully Connected Neural Network Using Combined Parametric Activation Functions)

  • 고영민;이붕항;고선우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권1호
    • /
    • pp.1-10
    • /
    • 2022
  • 완전연결신경망은 다양한 문제를 해결하는데 널리 사용되고 있다. 완전연결신경망에서 비선형활성함수는 선형변환 값을 비선형 변환하여 출력하는 함수로써 비선형 문제를 해결하는데 중요한 역할을 하며 다양한 비선형활성함수들이 연구되었다. 본 연구에서는 완전연결신경망의 성능을 향상시킬 수 있는 결합된 파라메트릭 활성함수를 제안한다. 결합된 파라메트릭 활성함수는 간단히 파라메트릭 활성함수들을 더함으로써 만들어낼 수 있다. 파라메트릭 활성함수는 입력데이터에 따라 활성함수의 크기와 위치를 변환시키는 파라미터를 도입하여 손실함수를 최소화하는 방향으로 최적화할 수 있는 함수이다. 파라메트릭 활성함수들을 결합함으로써 더욱 다양한 비선형간격을 만들어낼 수 있으며 손실함수를 최소화하는 방향으로 파라메트릭 활성함수들의 파라미터를 최적화할 수 있다. MNIST 분류문제와 Fashion MNIST 분류문제를 통하여 결합된 파라메트릭 활성함수의 성능을 실험하였고 그 결과 기존에 사용되는 비선형활성함수, 파라메트릭 활성함수보다 우수한 성능을 가짐을 확인하였다.

AI를 활용한 시추주상도 자동 디지털 DB화 방안에 관한 연구 (A Study on the Automatic Digital DB of Boring Log Using AI)

  • 박가현;한진태;윤영노
    • 한국지반공학회논문집
    • /
    • 제37권11호
    • /
    • pp.119-129
    • /
    • 2021
  • 국토지반정보 포털시스템에서 관리되는 지반정보는 사람이 직접 PDF 파일을 보고 일일이 타이핑을 해서 구축하고 있기 때문에 인적·시간적 자원 소모가 크며, 정확도 문제가 빈번하게 발생한다. 본 연구에서는 다양한 지반정보 중에서 국내에서 가장 일반적이고 널리 활용되고 있는 시추주상도를 대상으로 인공지능(Artificial Intelligence, AI)을 활용하여 자동 디지털 데이터베이스 구축하는 방안에 대해 제안하였다 우선, 다양한 시추주상도 양식에 대해서도 예외없이 데이터를 자동으로 데이터베이스화 하기 위해서 딥러닝모델 ResNet 34를 이용하여 시추주상도 양식분류를 하였으며, 총 6가지 시추주상도 양식에 대해 이미지 분류를 진행하여 전체 정확도(accuracy)는 99.7, ROC_AUC score는 1.0의 매우 높은 정확도로 시추주상도 양식을 분리할 수 있었다. 이 후, 각각의 양식에 대하여 미세조정(fine-tuning)된 로보틱 처리 자동화 기법을 이용하여 PDF 내 텍스트를 자동으로 읽어 들인 후 시추주상도 내 일반정보, SPT 시험정보 및 지층정보에 대해 데이터를 추출, 분리하여 이 값들을 기존 국토지반정보 포털시스템에서 제공하는 형태와 동일한 형태의 DB로 구축하도록 구현하였다. 최종적으로 기존 국토지반정보 포털시스템에서 제공하는 형태와 동일한 형태로 시추주상도내 정보를 초당 140페이지의 속도로 자동으로 DB화 할 수 있었다.